We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.03.13 | 降低视频扩散模型计算需求,提升多视角视频生成质量。
10:50
Share
2025/3/13
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
TPDiff:时间金字塔视频扩散模型
Reangle-A-Video:将4D视频生成作为视频到视频的转换
块扩散:在自回归与扩散语言模型之间插值
RewardSDS:通过奖励加权采样对齐分数蒸馏
GTR:引导思维强化防止基于RL的VLM代理训练中的思维崩溃
更多文档,相同长度:隔离RAG中多文档的挑战
运动万象:任意到运动生成
野外交互评估:复杂条件下的指令遵循
VLog:通过生成性检索叙事词汇的视频-语言模型
量化大型语言模型用于代码生成:差异化复现
长上下文大语言模型的成本最优分组查询注意力
高精度单细胞转录组分析与生成中的多模态语言建模
无别名潜在扩散模型:提升扩散潜在空间的分数位移等变性
小语言模型的自教自纠
MoC:检索增强生成系统中的文本分块学习混合模型
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.