We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.04.02 | 视频生成精度提升,强化学习增强视频理解。
11:28
Share
2025/4/2
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
Any2Caption:将任意条件解析为描述以实现可控视频生成?
探索强化学习对视频理解的影响:来自SEED-Bench-R1的见解?
JudgeLRM:将大型推理模型作为评判者?
CodeARC:用于归纳程序合成的LLM智能体推理能力基准测试?
Open-Qwen2VL:在学术资源上进行计算高效的完全开源多模态LLM预训练?
GeometryCrafter:基于扩散先验的开放世界视频一致几何体估计?
Z1:基于代码的高效测试时扩展?
Agent S2:计算机使用代理的组合式通用-专家框架?
MixerMDM:人类运动扩散模型的可学习组合?
Command A:一款面向企业就绪的大型语言模型?
驾驭推理经济:大型语言模型高效推理的综述?
OmniMMI:流视频场景下综合性多模态交互基准?
背诵胜于推理:顶尖语言模型如何在小学水平的推理问题上失败?
扩展无语言视觉表征学习?
何时求解,何时验证:LLM推理的计算最优问题求解与生成式验证?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.