We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.05.23 | 智能体加速科研;推理模型指令遵循不佳。
11:28
Share
2025/5/23
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
智能体如何加速科研?
大型推理模型为何指令遵循不佳?
Tool-Star:通过强化学习赋能多工具推理器
KRIS-Bench:智能图像编辑模型的新基准
像素推理器:好奇心驱动的强化学习如何激励像素空间推理?
QuickVideo:实时长视频理解的新方法
GoT-R1:利用强化学习提升多模态大语言模型的视觉生成能力
LLaDA-V:基于视觉指令调整的大型语言扩散模型
如何通过Itakura-Saito损失实现风险规避强化学习?
μP:高效扩展扩散Transformer的新方法
生成式AI在日常图像编辑任务中的表现如何?
如何让大型语言模型摆脱过度思考?
弥合思维跳跃:改进思维链微调的新方法
VideoGameQA-Bench:评估视觉-语言模型在视频游戏质量保证中的应用
Dimple:具有并行解码的离散扩散多模态大型语言模型
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.