We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.06.04 | 强化学习提升LLM性能;UniWorld统一视觉理解与生成。
11:20
Share
2025/6/5
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
反思、重试、奖励:通过强化学习实现LLM的自我提升?
UniWorld:用于统一视觉理解与生成的高分辨率语义编码器
CSVQA:一个用于评估视觉语言模型STEM推理能力的中文多模态基准
VS-Bench:评估视觉语言模型在多智能体环境中进行战略推理和决策的能力?
SynthRL:利用可验证数据合成扩展视觉推理?
OmniSpatial:面向视觉语言模型的综合空间推理基准?
视觉具身大脑:让多模态大型语言模型在空间中观察、思考和控制?
MotionSight:提升多模态大型语言模型中的细粒度运动理解能力?
GUI-Actor:面向GUI代理的无坐标视觉定位?
Sparse-vDiT:释放稀疏注意力以加速视频扩散Transformer?
DINGO:扩散LLM的约束推理?
AnimeShooter:一个用于参考引导视频生成的多镜头动画数据集
Robot-R1:用于增强机器人具身推理的强化学习?
Co-Evolving LLM Coder和Unit Tester:基于强化学习的协同进化?
原生分辨率图像合成:如何实现高质量图像生成?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.