We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.04.10 | DDT提升图像生成质量;GenDoP优化相机轨迹生成。
10:49
Share
2025/4/10
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
🎨 DDT: Decoupled Diffusion Transformer(解耦扩散Transformer)
🎬 GenDoP: 自回归相机轨迹生成如何模拟电影摄影师?
🔍 OLMoTrace: 如何追溯语言模型的输出到数万亿的训练文本?
🖼 评估条件图像生成的统一代理框架是什么?
🤔 缺失前提如何加剧推理模型的过度思考?
🗣 FantasyTalking: 通过连贯运动合成生成逼真会说话的人像?
🧐 冷静看待语言模型推理的进展:有哪些陷阱和可复现性之路?
🖼 OmniCaptioner: 万能字幕器如何一统天下?
🧩 以对象为中心的学习是否已经结束?
🤖 自导向语言模型:未来的方向是什么?
🇷 RuOpinionNE-2024: 如何从俄语新闻文本中提取观点元组?
🤖 掩码场景建模:如何缩小3D场景理解中的学习差距?
👂 DiTaiListener: 基于扩散模型的可控高保真听者视频生成是如何实现的?
🤖 VideoChat-R1: 通过强化微调增强时空感知能力?
🤖 WildGS-SLAM: 动态环境下单目高斯溅射SLAM的应用?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.