We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力,进化搜索优化复杂任务解决。

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力,进化搜索优化复杂任务解决。

2025/1/25
logo of podcast HuggingFace 每日AI论文速递

HuggingFace 每日AI论文速递

AI Chapters
Chapters

Shownotes Transcript

本期的 5 篇论文如下:

[00:37] TOP1(🔥167) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(DeepSeek-R1:通过强化学习激励大语言模型的推理能力)

[02:59] TOP2(🔥95) | 🧠 Evolving Deeper LLM Thinking(演化更深层次的LLM思维)

[05:07] TOP3(🔥73) | 🤔 Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training(Agent-R:通过迭代自训练使语言模型代理具备反思能力)

[07:15] TOP4(🔥73) | 🎥 MMVU: Measuring Expert-Level Multi-Discipline Video Understanding(MMVU:专家级多学科视频理解的测量)

[09:29] TOP5(🔥64) | 👁 VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding(VideoLLaMA 3:面向图像与视频理解的前沿多模态基础模型) 【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递