We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

E378. 英伟达ProRL突破 | 国内游戏AI新布局

2025/6/4

创新灯塔

AI Deep Dive AI Chapters Transcript

People

西

西娅

Topics

@西娅 : 今天的节目主要探讨了小模型如何通过长期强化学习挑战大模型的推理边界，以及AI如何推动游戏行业向智能化和个性化加速迈进。我将深入分析英伟达提出的Pro-L框架，该框架通过大幅提升强化学习训练步数，使小模型在推理能力上实现了质变。此外，我还会介绍国内游戏大厂在AI领域的布局，以及AI在游戏玩法上的创新应用。通过这些案例，希望能展现AI技术在不同领域的巨大潜力。

Deep Dive

Chapters

英伟达提出的Pro-RL长期强化学习框架，通过延长训练步数、引入多领域可验证奖励任务以及优化算法，使小模型在推理能力上取得显著提升，甚至在某些任务上超越更大模型。这为低成本、强推理的小模型开发提供了新思路。

Pro-RL框架将强化学习训练步数提升至2000步以上
小模型Numotron在数学、代码生成和逻辑推理任务上均有显著提升
长期稳定的RL训练能够扩展模型的推理能力边界

Shownotes Transcript

今天的节目将探讨小模型如何通过长期强化学习挑战大模型的推理边界？AI如何推动游戏行业向智能化、个性化加速迈进？中美大模型差距缩短至三个月内，将如何影响全球AI竞争格局？AI产品竞争，是拼模型能力还是体验生态？接下来让我们来解锁这些商业科技动态吧

00:01:06

英伟达ProRL与游戏大厂AI新进展

00:05:25

全球AI进展与Windsurf断供风波

00:10:29

年轻人AI依赖与Agent平台现状

00:13:43

6月5日：四十年间的科技里程碑

本期主播：西娅

后期：西娅

收听平台：小宇宙、喜马拉雅、Apple Podcast 等。

如果喜欢我们的节目，欢迎点赞评论转发。

E378. 英伟达ProRL突破 | 国内游戏AI新布局 11:40 Share

创新灯塔

Deep Dive

Shownotes Transcript

We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

E378. 英伟达ProRL突破 | 国内游戏AI新布局