We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

DeepSeek 之后，黄仁勋的「AI 平台」故事能讲得通么？|英伟达 GTC 2025 S9E08

2025/3/27

What's Next｜科技早知道

AI Deep Dive Transcript

People

丁

丁教 Diane

联合创始人和主播，专注于科技新闻和行业分析。

雅

雅娴

推动科技教育和行业分析的播客监制和媒体从业者。

Topics

丁教 Diane: 我认为英伟达GTC2025大会上黄仁勋并非讲述了一个全新的故事，而是展现了AI行业发展的现实与未来基础设施。他展现的不是‘新故事’，而是AI行业未来发展的‘新现实’，所有行业都将以AI方式重塑。英伟达已经成为AI时代超级基础设施提供商，其发展方向并非单纯的GPU，而是构建技术飞轮和基础设施平台。英伟达并未被DeepSeek等开源模型动摇，其GTC2025大会释放的信号清晰表明，未来AI的主战场是推理。英伟达致力于打造AI超级工厂，即构建AI基础设施平台。英伟达股价下跌并非拐点，而是市场情绪与公司实际发展方向的错配。英伟达GTC2025大会强化了对AI行业未来发展的信心，推理将成为主战场，GPU Cloud成为新的基础设施，数据成为新的货币。英伟达通过模型、部署系统和调度系统，从芯片公司转型为AI推理时代的基础设施提供商。Dynamo有潜力成为推理时代的核心操作系统，类似于CUDA在训练时代的地位。英伟达通过开源生态绑定开发者，扩展其推理操作系统。英伟达的开源战略并非参与大模型竞争，而是构建更大的AI操作系统。英伟达正在从硬件供应商转型为全栈式AI解决方案提供商，构建企业级软件平台。英伟达软件收入增长迅速，已达到中型SaaS企业规模。英伟达通过开发者生态、推理部署平台和企业版软件，构建AI时代的综合平台。在软件领域仍存在一些挑战，例如文档和知识体系的完善度。英伟达正在努力完善其软件产品，提供更完善的文档和客户服务。推理成为AI主战场，决定用户体验和商业化效率。大模型公司关注点从模型训练转向推理效率和成本。英伟达通过Dynamo等技术，在推理战场上构建完整技术栈。Dynamo是英伟达推理战场上的调度层，与NIM微服务结合，构成完整技术栈。推理服务将变得更贵，但更智能、更值得花钱。英伟达的AI推理平台战略，旨在获得持续的推理服务收入。企业开始使用英伟达平台开发AI智能体，角色和推理方式发生变化。推理成为一种服务能力，需要实时、稳定、高效。AI行业正在进入一个推理服务的时代，模型和推理场景并存。英伟达的战略是将推理服务平台化，而非单纯的模型或芯片竞争。物理AI将AI从云端扩展到物理世界。物理AI尚处于早期阶段，自动驾驶技术仍需发展。英伟达的AI战略是一个系统性的飞轮，将开发者和行业绑定到其平台。英伟达的护城河在于其AI飞轮，将开发者和行业绑定到其平台。雅娴: 英伟达GTC2025大会上，黄仁勋展现的并非“新故事”，而是AI行业未来发展的“新现实”，所有行业都将以AI方式重塑。英伟达已成为AI时代超级基础设施提供商，其发展方向并非单纯的GPU，而是构建技术飞轮和基础设施平台。英伟达并未被DeepSeek等开源模型动摇，其GTC2025大会释放的信号清晰表明，未来AI的主战场是推理。英伟达致力于打造AI超级工厂，即构建AI基础设施平台。英伟达股价下跌并非拐点，而是市场情绪与公司实际发展方向的错配。英伟达GTC2025大会强化了对AI行业未来发展的信心，推理将成为主战场，GPU Cloud成为新的基础设施，数据成为新的货币。Llama Nemotron开源大模型并非为了模型性能竞争，而是为了构建英伟达的推理生态。Llama Nemotron开源大模型系列的核心意义在于服务于推理和企业级部署，构建英伟达的推理基础生态。NVIDIA Inference Microservice (NIM)并非模型，而是将模型产品化的平台，降低模型部署门槛。NIM可比作AI中央厨房和外卖平台，自动化模型部署，降低开发者门槛。Llama、Nemotron等模型如同AI餐厅菜单上的菜品，可供选择。Dynamo是AI厨房的大脑，负责资源调度，提高GPU使用效率和推理速度。Dynamo软件通过优化调度，显著提升推理吞吐量。英伟达通过模型、部署系统和调度系统，从芯片公司转型为AI推理时代的基础设施提供商。Dynamo有潜力成为推理时代的核心操作系统，类似于CUDA在训练时代的地位。英伟达通过开源生态绑定开发者，扩展其推理操作系统。英伟达的开源战略并非参与大模型竞争，而是构建更大的AI操作系统。英伟达正在从硬件供应商转型为全栈式AI解决方案提供商，构建企业级软件平台。英伟达在软件领域仍存在一些挑战，例如文档和知识体系的完善度。英伟达正在努力完善其软件产品，提供更完善的文档和客户服务。GPU Cloud正在重塑AI基础设施市场，传统云厂商面临挑战。AI企业开始转向原生GPU Cloud服务商，传统云厂商的架构难以满足AI的计算需求。原生GPU Cloud服务商，如Coreweave，专注于AI计算，具有先发优势。Coreweave等原生GPU Cloud服务商快速发展，获得大量融资，并获得英伟达的支持。Lambda Labs和Sentient Element等原生GPU Cloud服务商也快速扩张市场。AI时代的云计算格局发生变化，原生GPU Cloud服务商具有先发优势。推理成为AI主战场，决定用户体验和商业化效率。大模型公司关注点从模型训练转向推理效率和成本。英伟达通过Dynamo等技术，在推理战场上构建完整技术栈。Dynamo是英伟达推理战场上的调度层，与NIM微服务结合，构成完整技术栈。推理服务将变得更贵，但更智能、更值得花钱。英伟达的AI推理平台战略，旨在获得持续的推理服务收入。企业开始使用英伟达平台开发AI智能体，角色和推理方式发生变化。推理成为一种服务能力，需要实时、稳定、高效。AI行业正在进入一个推理服务的时代，模型和推理场景并存。英伟达的战略是将推理服务平台化，而非单纯的模型或芯片竞争。Agentic AI（代理式AI）全面爆发，应用场景广泛。Physical AI（物理AI）开始发展，机器人和自动驾驶是重要方向。英伟达发布Isaac GR00T N1开源人形机器人功能模型。Isaac GR00T N1模型模仿人类双系统，实现多种机器人任务。Isaac GR00T N1模型已在多个机器人公司得到应用。英伟达Cosmos平台和ISAC Group Blueprint用于生成合成数据，加速机器人训练。合成数据加速机器人训练，缩短开发周期。Cosmos和Blueprint生成大量合成数据，加速机器人训练。机器人领域进入数据飞轮时代。圆融启行将自动驾驶战略转向Road AGI，采用端到端算法，减少对高清地图的依赖。圆融启行使用英伟达平台和自主研发的VLA模型，开发自动驾驶技术。VLA模型融合视觉、语言和动作，适应复杂交通状况。物理AI将AI从云端扩展到物理世界。物理AI尚处于早期阶段，自动驾驶技术仍需发展。英伟达在量子计算领域也积极布局，设立了加速量子研究中心。

Deep Dive

Shownotes Transcript

3月17日，全球科技界迎来 AI 领域的「超级碗」-- 英伟达 GTC 大会。英伟达 CEO 黄仁勋在 Keynotes 的演讲中揭晓了英伟达所布局的 AI 发展路线图：从生成式 AI 到代理式 AI（Agentic AI），最终迈向物理 AI（Physical AI）。一方面，英伟达发布了比如 Blackwell Ultra 等更快更强的硬件设备，另一方面，英伟达则致力于打造 AI 时代的「操作系统」，将开发者绑定在英伟达的「AI 工厂」生态当中。老黄的演讲结束之后，英伟达股票先是下跌 3.4%，第二天又有所反弹，反应出资本市场情绪的改变。「科技早知道」主播丁教 Diane 也是去了 GTC 大会现场，为大家带回了第一手的报道。我们今天的节目聚焦英伟达以「推理主战场」为核心的软件生态，为大家详细解析英伟达技术飞轮的各个环节 -- 从开源推理框架、到 GPU cloud，再到机器人模型。可以肯定的事，英伟达的野心已经不再是一家「卖卡」的硬件公司，而是将 AI 时代的软件平台牢牢掌握在自己手中。

本期人物 丁教 Diane，「声动活泼」联合创始人、「科技早知道」主播 Yaxian，「科技早知道」节目监制

主要话题 [01:01] 英伟达股价先跌后涨，黄仁勋讲的不是「新故事」，但却是「新现实」 [03:55] 英伟达三大推理基础设施：Llama Nemotron 开源大模型，Dynamo 推理系统、AI 数据模型 [07:22] Dynamo 软件：AI 厨房的中央调度系统，让推理更快更高效 [11:40] 原生 GPU cloud 服务商崛起：AI 时代云计算格局大洗牌 [15:16] 拼大模型训练的时代已经过去，为什么推理才是未来 AI 的主战场？ [20:46] Agentic AI 全面爆发，Physical AI 即将到来 [23:04] 机器人赛道突飞猛进：Cosmos 生成模拟数据，Issac GR00T N1 提供基础模型 [26:45] 自动驾驶技术的未来：Road AGI 指日可待

延伸信息 NIM NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分，为自托管 GPU 加速推理微服务提供容器，基于优化推理引擎构建，能自动优化模型和 GPU 组合的性能，还提供标准数据源和自动扩展支持。

Llama Nemotron Llama Nemotron 是 NVIDIA 推出的开放式大语言模型系列，基于商用开源 Llama 基础模型构建。该系列为 AI 智能体开发提供优化基础模组，可通过 NVIDIA NIM 微服务等形式提供，能在多种计算平台上运行，为企业代理式 AI 奠定基础。

Dynamo Dynamo 是 GTC 大会发布的开源推理软件，通过协调数千个 GPU 间的推理通信，降低成本、提高效率，集成了 GPU 规划器等四大创新组件，兼容多种主流推理后端。

Isaac GR00T N1 Isaac GR00T N1 是 NVIDIA 推出的全球首款开源人形机器人功能模型。它采用双系统架构，系统 1 基于扩散变换器，能实时生成精准连续动作轨迹，执行高频率操作；系统 2 基于视觉 - 语言模型，负责环境感知、任务推理与规划。

Cosmos 是英伟达的世界基础模型平台，包括 Cosmos Transfer 和 Cosmos Predict 等模型，可将 3D 仿真数据转换为逼真视频，用于生成合成数据，能加速机器人和自动驾驶领域的物理 AI 开发。

VLA 技术 是视觉 - 语言 - 动作模型（Vision - Language - Action Model）。它是一种融合了视觉、语言和动作的多模态大模型范式。它可以从传感器数据中提取丰富的环境信息，借助语言模型理解人类指令并生成可解释的决策过程，最后转化为驾驶操作指令。

内容研究志愿者招募 Hi 你好呀，这里是《科技早知道》内容研究志愿者招募。如果你是前沿科技行业的从业者（包括但不限于半导体、先进制造、计算机、AI、生物医药、航空航天等等），欢迎加入我们分享你在行业内的一手观察和见解。你将有机会参与到节目的制作当中，你的知识和见解也可能成为未来节目的一部分！志愿者招募入口)

加入声动活泼 声动活泼目前开放全职设计师、商业发展经理、商业内容策划、内容编辑实习生、早咖啡内容研究实习生、社群运营实习生等6个职位，详情点击招聘入口)

声动活泼年度新节目上线！

Untitled 这次，我们倾全团队之力为 AI 时代的青少年做了一件微小但重要的事。

每期 10 分钟，从一个青少年感兴趣的现象谈起，涉及商业科技、社会人文等话题，解读表象背后的深层逻辑，启发青少年提出自己的好奇。每周一、三、五早晨 6 点在各大音频平台准时更新。

🧧前 3 期内容可以免费试听。现在购买，即可享受早鸟价 292 元，2025 年 4 月 30 日之后，将恢复原价 365 元。现在就去节目主页试听吧 ↓ 小宇宙听友请点这里) Apple Podcast 听友请点这里)

幕后制作 监制：Yaxian 后期：Jack 运营：George 设计：饭团

商务合作 声动活泼商务合作咨询) Untitled

关于声动活泼 「用声音碰撞世界」，声动活泼致力于为人们提供源源不断的思考养料。我们还有这些播客：声动早咖啡)、声东击西)、吃喝玩乐了不起)、反潮流俱乐部)、泡腾 VC)、商业WHY酱)、跳进兔子洞) 、不止金钱) 欢迎在即刻)、微博等社交媒体上与我们互动，搜索 声动活泼 即可找到我们。期待你给我们写邮件，邮箱地址是：[email protected]) 欢迎扫码添加声小音，在节目之外和我们保持联系。

Special Guest: 雅娴.

DeepSeek 之后，黄仁勋的「AI 平台」故事能讲得通么？|英伟达 GTC 2025 S9E08 32:26 Share

What's Next｜科技早知道

Deep Dive

Shownotes Transcript

DeepSeek 之后，黄仁勋的「AI 平台」故事能讲得通么？|英伟达 GTC 2025 S9E08