We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.01.23 | DeepSeek-R1强化学习提升推理能力,多智能体框架实现虚拟电影自动化
06:37
Share
2025/1/23
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
DeepSeek-R1:通过强化学习激励大语言模型的推理能力?
FilmAgent:虚拟3D空间中的端到端电影自动化多智能体框架?
测试时偏好优化:通过迭代文本反馈实现即时对齐?
VideoLLaMA 3:面向图像与视频理解的前沿多模态基础模型?
Kimi k1.5:利用大语言模型扩展强化学习?
专家自主模型?
成对奖励模型:通过淘汰赛进行最佳N采样?
O1-Pruner:基于长度协调的微调用于O1类推理剪枝?
IntellAgent:用于评估对话AI系统的多智能体框架?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.