We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.06.02 | 延长RL提升推理;快慢思考优化推理。
11:13
Share
2025/6/2
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
ProRL:延长的强化学习如何拓展大型语言模型的推理边界?
AlphaOne:测试时如何让大模型进行快慢思考的推理?
时间盲区:为何视频-语言模型无法像人类一样观察?
不要只看一次:如何通过选择性视觉重访实现多模态交互推理?
用于数据合成的大型语言模型
ViStoryBench:故事可视化综合基准测试套件
HardTests:如何为大型语言模型代码生成合成高质量测试用例?
开放验证码世界:一个用于测试和评估多模态大型语言模型代理的综合性Web平台
视觉语言模型存在哪些偏见?
CoDA:如何通过协同扩散噪声优化实现铰接物体的全身操控?
CLaSp:上下文层跳跃如何用于自推测解码?
UniGeo:如何驾驭视频扩散模型以实现统一的、一致的几何估计?
MetaFaith:大型语言模型如何忠实表达自然语言的不确定性?
EasyText:如何使用可控扩散Transformer进行多语言文本渲染?
Fork-Merge解码:如何增强视听大型语言模型中的多模态理解?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.