We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.01.22 | Agent-R提升语言模型实时纠错能力,MMVU评估多学科视频理解专家级表现。
11:17
Share
2025/1/22
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
Agent-R能否提升语言模型实时纹错能力?
MMVU评估多学科视频理解专家级表现的秘密是什么?
细节中的魔鬼:实现负载均衡损失的挑战
UI-TARS和Mobile-Agent-E:自动化GUI交互和自我进化移动助手的未来
TokenVerse和InternLM-XComposer2.5-Reward:多概念个性化和多模态奖励模型的创新
视频深度估计和Learn-by-interact:超长视频的一致性深度估计和自适应代理的数据中心框架
推理语言模型和Hunyuan3D 2.0:蓝图和高分辨率纹理3D资产生成
Condor和EMO2:增强大语言模型的对齐能力和音频驱动虚拟形象视频生成
Go-with-the-Flow和GPS:运动可控的视频扩散模型和图像生成的控制信号
MSTS:面向视觉-语言模型的多模态安全测试套件
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.