We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode DeepSeek 之后,黄仁勋的「AI 平台」故事能讲得通么?|英伟达 GTC 2025  S9E08

DeepSeek 之后,黄仁勋的「AI 平台」故事能讲得通么?|英伟达 GTC 2025 S9E08

2025/3/27
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive Transcript
People
丁教 Diane
联合创始人和主播,专注于科技新闻和行业分析。
雅娴
推动科技教育和行业分析的播客监制和媒体从业者。
Topics
丁教 Diane: 我认为英伟达GTC2025大会上黄仁勋并非讲述了一个全新的故事,而是展现了AI行业发展的现实与未来基础设施。他展现的不是‘新故事’,而是AI行业未来发展的‘新现实’,所有行业都将以AI方式重塑。英伟达已经成为AI时代超级基础设施提供商,其发展方向并非单纯的GPU,而是构建技术飞轮和基础设施平台。英伟达并未被DeepSeek等开源模型动摇,其GTC2025大会释放的信号清晰表明,未来AI的主战场是推理。英伟达致力于打造AI超级工厂,即构建AI基础设施平台。英伟达股价下跌并非拐点,而是市场情绪与公司实际发展方向的错配。英伟达GTC2025大会强化了对AI行业未来发展的信心,推理将成为主战场,GPU Cloud成为新的基础设施,数据成为新的货币。英伟达通过模型、部署系统和调度系统,从芯片公司转型为AI推理时代的基础设施提供商。Dynamo有潜力成为推理时代的核心操作系统,类似于CUDA在训练时代的地位。英伟达通过开源生态绑定开发者,扩展其推理操作系统。英伟达的开源战略并非参与大模型竞争,而是构建更大的AI操作系统。英伟达正在从硬件供应商转型为全栈式AI解决方案提供商,构建企业级软件平台。英伟达软件收入增长迅速,已达到中型SaaS企业规模。英伟达通过开发者生态、推理部署平台和企业版软件,构建AI时代的综合平台。在软件领域仍存在一些挑战,例如文档和知识体系的完善度。英伟达正在努力完善其软件产品,提供更完善的文档和客户服务。推理成为AI主战场,决定用户体验和商业化效率。大模型公司关注点从模型训练转向推理效率和成本。英伟达通过Dynamo等技术,在推理战场上构建完整技术栈。Dynamo是英伟达推理战场上的调度层,与NIM微服务结合,构成完整技术栈。推理服务将变得更贵,但更智能、更值得花钱。英伟达的AI推理平台战略,旨在获得持续的推理服务收入。企业开始使用英伟达平台开发AI智能体,角色和推理方式发生变化。推理成为一种服务能力,需要实时、稳定、高效。AI行业正在进入一个推理服务的时代,模型和推理场景并存。英伟达的战略是将推理服务平台化,而非单纯的模型或芯片竞争。物理AI将AI从云端扩展到物理世界。物理AI尚处于早期阶段,自动驾驶技术仍需发展。英伟达的AI战略是一个系统性的飞轮,将开发者和行业绑定到其平台。英伟达的护城河在于其AI飞轮,将开发者和行业绑定到其平台。 雅娴: 英伟达GTC2025大会上,黄仁勋展现的并非“新故事”,而是AI行业未来发展的“新现实”,所有行业都将以AI方式重塑。英伟达已成为AI时代超级基础设施提供商,其发展方向并非单纯的GPU,而是构建技术飞轮和基础设施平台。英伟达并未被DeepSeek等开源模型动摇,其GTC2025大会释放的信号清晰表明,未来AI的主战场是推理。英伟达致力于打造AI超级工厂,即构建AI基础设施平台。英伟达股价下跌并非拐点,而是市场情绪与公司实际发展方向的错配。英伟达GTC2025大会强化了对AI行业未来发展的信心,推理将成为主战场,GPU Cloud成为新的基础设施,数据成为新的货币。Llama Nemotron开源大模型并非为了模型性能竞争,而是为了构建英伟达的推理生态。Llama Nemotron开源大模型系列的核心意义在于服务于推理和企业级部署,构建英伟达的推理基础生态。NVIDIA Inference Microservice (NIM)并非模型,而是将模型产品化的平台,降低模型部署门槛。NIM可比作AI中央厨房和外卖平台,自动化模型部署,降低开发者门槛。Llama、Nemotron等模型如同AI餐厅菜单上的菜品,可供选择。Dynamo是AI厨房的大脑,负责资源调度,提高GPU使用效率和推理速度。Dynamo软件通过优化调度,显著提升推理吞吐量。英伟达通过模型、部署系统和调度系统,从芯片公司转型为AI推理时代的基础设施提供商。Dynamo有潜力成为推理时代的核心操作系统,类似于CUDA在训练时代的地位。英伟达通过开源生态绑定开发者,扩展其推理操作系统。英伟达的开源战略并非参与大模型竞争,而是构建更大的AI操作系统。英伟达正在从硬件供应商转型为全栈式AI解决方案提供商,构建企业级软件平台。英伟达在软件领域仍存在一些挑战,例如文档和知识体系的完善度。英伟达正在努力完善其软件产品,提供更完善的文档和客户服务。GPU Cloud正在重塑AI基础设施市场,传统云厂商面临挑战。AI企业开始转向原生GPU Cloud服务商,传统云厂商的架构难以满足AI的计算需求。原生GPU Cloud服务商,如Coreweave,专注于AI计算,具有先发优势。Coreweave等原生GPU Cloud服务商快速发展,获得大量融资,并获得英伟达的支持。Lambda Labs和Sentient Element等原生GPU Cloud服务商也快速扩张市场。AI时代的云计算格局发生变化,原生GPU Cloud服务商具有先发优势。推理成为AI主战场,决定用户体验和商业化效率。大模型公司关注点从模型训练转向推理效率和成本。英伟达通过Dynamo等技术,在推理战场上构建完整技术栈。Dynamo是英伟达推理战场上的调度层,与NIM微服务结合,构成完整技术栈。推理服务将变得更贵,但更智能、更值得花钱。英伟达的AI推理平台战略,旨在获得持续的推理服务收入。企业开始使用英伟达平台开发AI智能体,角色和推理方式发生变化。推理成为一种服务能力,需要实时、稳定、高效。AI行业正在进入一个推理服务的时代,模型和推理场景并存。英伟达的战略是将推理服务平台化,而非单纯的模型或芯片竞争。Agentic AI(代理式AI)全面爆发,应用场景广泛。Physical AI(物理AI)开始发展,机器人和自动驾驶是重要方向。英伟达发布Isaac GR00T N1开源人形机器人功能模型。Isaac GR00T N1模型模仿人类双系统,实现多种机器人任务。Isaac GR00T N1模型已在多个机器人公司得到应用。英伟达Cosmos平台和ISAC Group Blueprint用于生成合成数据,加速机器人训练。合成数据加速机器人训练,缩短开发周期。Cosmos和Blueprint生成大量合成数据,加速机器人训练。机器人领域进入数据飞轮时代。圆融启行将自动驾驶战略转向Road AGI,采用端到端算法,减少对高清地图的依赖。圆融启行使用英伟达平台和自主研发的VLA模型,开发自动驾驶技术。VLA模型融合视觉、语言和动作,适应复杂交通状况。物理AI将AI从云端扩展到物理世界。物理AI尚处于早期阶段,自动驾驶技术仍需发展。英伟达在量子计算领域也积极布局,设立了加速量子研究中心。

Deep Dive

Shownotes Transcript

3月17日,全球科技界迎来 AI 领域的「超级碗」-- 英伟达 GTC 大会。英伟达 CEO 黄仁勋在 Keynotes 的演讲中揭晓了英伟达所布局的 AI 发展路线图:从生成式 AI 到代理式 AI(Agentic AI),最终迈向物理 AI(Physical AI)。一方面,英伟达发布了比如 Blackwell Ultra 等更快更强的硬件设备,另一方面,英伟达则致力于打造 AI 时代的「操作系统」,将开发者绑定在英伟达的 「AI 工厂」生态当中。老黄的演讲结束之后,英伟达股票先是下跌 3.4%,第二天又有所反弹,反应出资本市场情绪的改变。 「科技早知道」主播丁教 Diane 也是去了 GTC 大会现场,为大家带回了第一手的报道。我们今天的节目聚焦英伟达以「推理主战场」为核心的软件生态,为大家详细解析英伟达技术飞轮的各个环节 -- 从开源推理框架、到 GPU cloud,再到机器人模型。可以肯定的事,英伟达的野心已经不再是一家「卖卡」的硬件公司,而是将 AI 时代的软件平台牢牢掌握在自己手中。

本期人物 丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播 Yaxian,「科技早知道」节目监制

主要话题 [01:01] 英伟达股价先跌后涨,黄仁勋讲的不是「新故事」,但却是「新现实」 [03:55] 英伟达三大推理基础设施:Llama Nemotron 开源大模型,Dynamo 推理系统、AI 数据模型 [07:22] Dynamo 软件 :AI 厨房的中央调度系统,让推理更快更高效 [11:40] 原生 GPU cloud 服务商崛起:AI 时代云计算格局大洗牌 [15:16] 拼大模型训练的时代已经过去,为什么推理才是未来 AI 的主战场? [20:46] Agentic AI 全面爆发,Physical AI 即将到来 [23:04] 机器人赛道突飞猛进:Cosmos 生成模拟数据,Issac GR00T N1 提供基础模型 [26:45] 自动驾驶技术的未来:Road AGI 指日可待

延伸信息 NIM NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,为自托管 GPU 加速推理微服务提供容器,基于优化推理引擎构建,能自动优化模型和 GPU 组合的性能,还提供标准数据源和自动扩展支持。

Llama Nemotron Llama Nemotron 是 NVIDIA 推出的开放式大语言模型系列,基于商用开源 Llama 基础模型构建。该系列为 AI 智能体开发提供优化基础模组,可通过 NVIDIA NIM 微服务等形式提供,能在多种计算平台上运行,为企业代理式 AI 奠定基础。

Dynamo Dynamo 是 GTC 大会发布的开源推理软件,通过协调数千个 GPU 间的推理通信,降低成本、提高效率,集成了 GPU 规划器等四大创新组件,兼容多种主流推理后端。

Isaac GR00T N1 Isaac GR00T N1 是 NVIDIA 推出的全球首款开源人形机器人功能模型。它采用双系统架构,系统 1 基于扩散变换器,能实时生成精准连续动作轨迹,执行高频率操作;系统 2 基于视觉 - 语言模型,负责环境感知、任务推理与规划。

Cosmos 是英伟达的世界基础模型平台,包括 Cosmos Transfer 和 Cosmos Predict 等模型,可将 3D 仿真数据转换为逼真视频,用于生成合成数据,能加速机器人和自动驾驶领域的物理 AI 开发。

VLA 技术 是视觉 - 语言 - 动作模型(Vision - Language - Action Model)。它是一种融合了视觉、语言和动作的多模态大模型范式。它可以从传感器数据中提取丰富的环境信息,借助语言模型理解人类指令并生成可解释的决策过程,最后转化为驾驶操作指令。

内容研究志愿者招募 Hi 你好呀,这里是《科技早知道》内容研究志愿者招募。如果你是前沿科技行业的从业者(包括但不限于半导体、先进制造、计算机、AI、生物医药、航空航天等等),欢迎加入我们分享你在行业内的一手观察和见解。 你将有机会参与到节目的制作当中,你的知识和见解也可能成为未来节目的一部分! 志愿者招募入口)

加入声动活泼 声动活泼目前开放全职设计师、商业发展经理、商业内容策划、内容编辑实习生、早咖啡内容研究实习生、社群运营实习生等6个职位,详情点击招聘入口)

声动活泼年度新节目上线!

Untitled 这次,我们倾全团队之力为 AI 时代的青少年做了一件微小但重要的事。

每期 10 分钟,从一个青少年感兴趣的现象谈起,涉及商业科技、社会人文等话题,解读表象背后的深层逻辑,启发青少年提出自己的好奇。每周一、三、五早晨 6 点在各大音频平台准时更新。

🧧前 3 期内容可以免费试听。现在购买,即可享受早鸟价 292 元,2025 年 4 月 30 日之后,将恢复原价 365 元。现在就去节目主页试听吧 ↓ 小宇宙听友请点这里) Apple Podcast 听友请点这里)

幕后制作 监制:Yaxian 后期:Jack 运营:George 设计:饭团

商务合作 声动活泼商务合作咨询) Untitled

关于声动活泼 「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。 我们还有这些播客:声动早咖啡)、声东击西)、吃喝玩乐了不起)、反潮流俱乐部)、泡腾 VC)、商业WHY酱)、跳进兔子洞) 、不止金钱) 欢迎在即刻)、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。 期待你给我们写邮件,邮箱地址是:[email protected]) 声小音 欢迎扫码添加声小音,在节目之外和我们保持联系。

Special Guest: 雅娴.