We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2024.12.09 每日AI论文 | 提升多模态模型性能,优化文本到视频生成质量。
08:23
Share
2024/12/9
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
扩展开源多模态模型性能边界:模型、数据与测试时扩展?
利用人类反馈进行文本到视频模型对齐?
MAmmoTH-VL:大规模指令调优激发多模态推理?
EXAONE 3.5:面向实际应用的大型语言模型系列?
Moto:作为机器人操作桥梁语言的潜在运动标记?
APOLLO:类似SGD的内存,AdamW级别的性能?
SwiftEdit:通过一步扩散实现闪电般快速的文本引导图像编辑?
GenMAC:基于多智能体协作的组合式文本到视频生成?
注意时间:时间控制的多事件视频生成?
2DGS-Room:基于种子引导的2D高斯喷射与几何约束的高保真室内场景重建?
DEMO:通过细粒度元素建模重构对话交互?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.