We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.05.13 | 视觉-语言模型提升多模态能力;优化训练策略增强推理潜力。
11:40
Share
2025/5/13
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
Seed1.5-VL 技术报告
MiMo:如何从预训练到后训练释放语言模型的推理潜力?
Step1X-3D:高质量和可控的纹理3D资产生成如何实现?
推理模型中的同伴学习有何作用?
统一连续生成模型的奥秘是什么?
REFINE-AF:通过自生成指令和强化学习对齐语言模型
DanceGRPO:如何在视觉生成中释放GRPO的潜力?
AttentionInfluence:如何通过注意力头影响进行预训练数据选择?
WebGen-Bench:大型语言模型如何从零生成交互式和功能性网站?
大型语言模型持续预训练中的学习动态有哪些?
Skywork-VL Reward:多模态理解和推理的有效奖励模型
如何通过增强型内外知识协同推理提高搜索代理效率?
H$^{\mathbf{3}}$DP:三重分层扩散策略在视觉运动学习中的应用
基于得分最大化的连续视觉自回归生成有何优势?
Overflow Prevention:如何增强长文本循环LLM的性能?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.