We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.03.18 | 视频生成新方法,人形机器人新框架
10:54
Share
2025/3/18
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
DropletVideo:探索整体时空一致性视频生成的数据集与方法?
Being-0:一个具有视觉-语言模型和模块化技能的人形机器人代理?
DreamRenderer:驯服大规模文本到图像模型中的多实例属性控制?
编辑迁移:通过视觉上下文关系学习图像编辑?
使用扩散Transformer免费实现任何物体的个性化?
WideRange4D:通过宽范围运动和场景实现高质量4D重建?
BlobCtrl: 用于元素级图像生成与编辑的统一且灵活的框架?
reWordBench:通过转换输入来评估和提升奖励模型的鲁棒性?
MicroVQA:一个用于基于显微镜的科学研究的多模态推理基准?
多模态思维链推理:一项综合综述?
基于自由形式语言的机器人推理与抓取?
R1-VL:通过逐步分组相对策略优化学习多模态大型语言模型的推理?
V-STaR:视频时空推理能力评测基准?
VideoMind:用于长视频推理的链式LoRA Agent?
奖励足以实现快速逼真的文本到图像生成?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.