大家好 我是丁教欢迎大家来到第九季的 What's Next 科技早知道和全球创新第一时间同步欢迎来到舞台上 NVIDIA 的创新人和总经理 Jensen WangGTC 活动最新的一场 GTC 活动完整的欢迎来到 GTC
Hello 大家好 欢迎来到我们今天的科技早知道 我是丁教 Diane 那这期节目我和雅仙我们要聊一聊刚刚结束的 2025 年 NVIDIA GTC 大会那这一次我们还是想聊一点不太一样的一些观察我们不太想重复的再去聊这个各大科技媒体已经报道过的新的 Blackwell 的一些什么参数啊然后性能提升啊包括规光网络交换器它的能耗啊成本降低这些我们今天都不聊了我们想聊聊背后的一些观察
对 其实我还对这期节目还蛮期待的在上期节目结尾的时候我们其实跟 Aaron 聊的特别热闹因为他说现在资本市场都在等老黄抛出一个新的故事一个完全不一样的故事那老黄呢现在也确实需要一个不同寻常的叙事来支撑英伟达的股价了那你这次 GTC 参加下来好像这个新故事也不是那么回事儿
我觉得应该是有蛮多人是带着有新故事的预期来参加 GTC 的结果发现老黄讲的不是新故事整体的二级市场它的股价是下降了 3.4%有意思的是第二天基本上就反弹回来了那我觉得这个其实也是说明了一个现象大家一开始觉得是没有新故事但是第二天好像又意识到了可能这个才是真正的现实因为它还是未来的一个底座的一个基层的 infrastructure
所以你说其实他们不是讲了一个新故事而是讲了一个新的现实我觉得它这个新的现实是这个所有的行业都在以 AI 的方式重新再被做了一遍其实这一次 GTC 它是一个横跨了芯片云计算软件机器人然后包括可能医疗自动驾驶甚至是可能还会触及到了什么能源电网量子计算
英伟达已经成了这些的超级基础设施的提供者所以它没有在换故事线它只是在拉长了整个产业带的叙事英伟达这次其实并没有被 DeepSeek 这样的开源模型所动摇至少是我自己的感受这次 GTC 释放出来的信号其实是比较清晰的
未来是以推理为主那这个推理其实就意味着并不是减少算力而是它代表了更大规模更高频次的这种算力的计算的需求更持续的基础设施的这样子的一个投资而且我觉得它用了一整套的这个策略来回应所以你可以说它的未来的统治力或者它的未来这个发展方向并不是原来的 GPU 而是它在建构技术飞轮和基础设施的平台
对其实我也看了老黄的这个 Keynote 演讲我发现他在演讲中就不断的强调说他们要建造一个叫所谓的 AI 的超级工厂
那其实就是指英伟达正在打造这些基础设施平台吧所以你觉得英伟达的股价下跌 3.4%其实也不是一个拐点信号反而是一种跟资本方一个情绪的错配
我个人的感受是这一次 GTC 反而是强化了我们对 AI 行业接下来的发展的一些信心比如说这次 GTC 一个信号是非常明确的推理肯定是下一个主战场我另外还发现 GPU Cloud 肯定是新的基础设施了物理世界的 AI 然后刚刚开始启动然后老黄一再反复的强调数据才是新的货币其实英伟达的布局已经到了每一个环节吧
等一下你说的特别对推理其实它现在已经不再是模型训练之后的一个附属品了它将会成为 AI 产品体验的核心组成我们看到 NVIDIA 在 GTC 上花了很大的篇幅去谈他们的 Lama Nemotron 的推理模型包括 Dynamo 的推理系统还有 AI 的数据模型而且这次英伟达他们是把开源这个主题提得非常的高等一下你觉得你是怎么理解他们这一次的这三大开源项目的呢
当时其实看到 Nemo 创的这个新的模型的时候应该很多技术上的朋友第一时间会想说这个模型其实并不是很强啊这个推理能力也比 DeepSig R1 差然后模型参数也更小那它的意义到底是什么因为它为什么发布这样的一个大模型如果我们再往系里面看的话其实 Nemo 创完全不是为了这个打榜而来的这样子一个模型它的核心意义我觉得它是一个服务于推理服务于企业级部署的这样子一个开源模型的这个系列吧
它不是为了做最强大的模型而是为了让英伟达慢慢的能够把它自己的这个推理的基础生态勾结起来所以我们不断强调这个 AI 基础设施它这个 Lama-Nimotron 开源大模型其实就是基础设施的一环如果
如果打个比的话更加主打是推理友好然后以及与它自己的微服务就是 NIM 它的这个兼容我们知道去年 GTC 英伟达推出了 NIM 就是 NVIDIA Inference Microservice 英伟达推理微服务那今年它已经成为推理平台的这个核心的一个接口它的定位它不是一个模型它是一个把模型变成产品化它是一个产品
如果表述还是特别的抽象的话我们可以用一个 AI 餐馆的方式来打个比喻吧你可以把 NIM 理解成为中央厨房加上一个外卖的平台它的目的就是帮你把任何的一个模型你想要的打包成一个 API 然后自动送达给你然后快速的部署门槛也很低开发者就像点了一个外卖一样你只要选好一个模型下了一个单 NIM 就把整个过程全都搞定了你不用自己再去调代码呀配资源啊写调度逻辑这些都不用了
这个比方实在是太生动了所以那像 Lama 呀 Gamma 还有英伟达自己的 Nemo 创其实就是菜单上的菜对对对是的就像是可能菜单上比较标准的像汉堡啊什么的那英伟达的像 Nemo 创的系列模型它就是自己家的这种招牌菜你可以选用他们家的你也可以选用其他的一些开源的我们再可以聊聊 Dynamo 那 Dynamo 的角色就是你要把这个菜做的
很快然后做的稳做的省然后就是背后的这个调度的系统也就是 Dynamo 的角色你可以把它想象成是这个厨房里的大脑它负责比如说是分配厨师然后调度哪个炉灶煮哪个东西然后安排菜品的流程让这个 GPU 的使用效率更高然后推力更快甚至还能按需的这样的来扩展
所以这次在 Keynote 上面他们也说用 GB200 集群跑 DeepSync R1 的时候用了 Dynamo 吞吐量直接就提升了 30 倍这个不是硬件堆出来的是软件调度的能力
所以听起来其实就是一个标准的供应链平台的逻辑了没错没错就是我们如果这么看其实就是模型它就是一个菜单不管是开源还是自己家的然后 NAME 就是下单配送系统让部署自动化然后 Dynamo 就是厨房的这个总控系统提升资源的利用率和这个服务的性能那这样的一个组合我就觉得让英伟达从一个芯片公司慢慢的就变成了一个 AI 推理时代的基础设施提供者
其实我看到这种说法就是大家对 Dynamo 这个评价都特别高说是 Dynamo 有可能是另外一个 CUDA 对我其实自己也蛮同意的因为 CUDA 过去是这个训练时代的一个基础的软件但
Dynamo 有可能会成为这个推理时代的核心操作系统它也是开源的大家在 Kino 上面也听到了然后它支持这个 PyTorch 啊 Tensor RTLM 啊然后 VLM 等等等等各种主流的框架也可以部署在所有主流的 GPU 的 Cloud 和本地的平台上面其实对英伟达来说它并不仅仅想是我绑定更多的开发者来我的平台上而且是在扩展自己的推理操作系统它的这样的一个费轮
所以我们总结一下刚才提到这个产品布局因为大家这次的开源逻辑其实不在于参与大模型之争而是想要有一个更大的战略
是的 是的 大家已经清晰地意识到它不仅只是靠卖 GPU 来做增长了你看它现在的微服务 Dynamo 的推理操作系统还有 Groot 可能晚一点再仔细地聊一聊和这个 Newton 的这些物理的 AI 模型甚至还有 Qopt 这种优化的引擎都开放了都变成开源的了这是一整套可以附用的然后可以拓展的 AI 操作系统其实就是 SaaS 平台的打法是不是说他们其实现在也在做企业级的软件了
对你说的非常对其实他们在最新一季的财报数据里面显示他们在软件相关的这个收入已经超过了 20 亿美元这是年化收入然后比再上一个季度的 15 亿的美元其实是有了明显的这个增长然后用这个 NIM 的微服务企业也超过了 1000 多家因为这个是去年才推出的然后这个数字其实还是在快速的增长了
那这个已经是一个中型 SaaS 企业的体量了对没错没错其实可能有一些人还没有意识到因为大家正在悄悄的在从一个完全纯硬件的公司在转向企业软件服务的这个平台你看这个逻辑对于他们自己的发展的路径来说也是非常的通嘛 Nimkuda 最早就是开发者的生态然后 Nim 现在是 AI 推理的部署平台再加上一些 Enterprise 的这种版本就是企业版本
就开源生态的这个绑定其实已经变成了整个这个 AI 时代的 Red Hat 加上 VMware 然后再加上 AWS 的综合体了就它的胃口其实是挺大的这个战略听起来挺 fancy 的那这个英伟达正在从硬件的供应商转为一个全站式的解决方案提供上了但是在软件领域是不是他们其实也还存在着一些挑战呀
是的 是的 我其实这周末就刚好跟朋友在聚餐的时候然后他自己其实是在做一个创业公司然后刚好用了这个英伟达一个叫做 DeepStream 它是一个资料库吧他发现在用这个的过程当中这个文档啊 各种知识都不是特别的完善所以他就告诉我整个过程来说这个上手和这个开发过程都还挺困难的
所以我觉得可能这个也表明了因为大家在从这个硬件转向软件的过程当中其实还是有一些细节需要打磨和完善对当然了这次 GTC 大会上面如果参加了这个小伙伴们肯定会知道其实它在整个的一楼全部都是各种各样的 workshop 然后教你怎么样用他们的产品用他们的这个硬件然后二楼还有一个部分分出来的就像那个苹果那个维修中心那个 Genius Bar 一样的这种客户服务他们叫做问一问专家 Expert
可以预约然后你就可以跟他们服务人员来对接你的问题然后帮你回答你的问题对 还是挺好玩的大家好呀这里想要发布两则招聘信息科技早知道正在招聘内容研究志愿者如果你是我们的忠实听众也是半导体先进制造人工智能等前沿科技行业的从业者或科研工作者欢迎与我们联系
你将有机会参与到我们的节目制作当中贡献你在行业内的观察与见解报名方式可以在本期节目的 show notes 中找到期待你的参与另外我们生动活泼也开始春季招聘了我们这次有六个全职与实习岗位开放招聘详情也请在单击简介中查看
那我们刚才是大概聊了一下这个开源的部分我觉得好像今年 GTC 另外一个特别火的话题是关于 GPU Cloud 好像在这方面在行业里也有一个重新的洗牌大家你要不要讲一讲你是怎么样看这件事呢
对 今年确实 GPU Cloud 是特别值得关注我在现场也看有好几家 GPU Cloud 的转商那我们过去一年看到了一个明显的趋势就是很多的 AI 企业开始放弃传统的三大云厂商那就是 AWS Google Cloud Azure 那开始转向原生的 GPU Cloud 服务商比如说是几个很火热的创业公司叫 Coreweave Lambda Labs 还有 Voltron Data 还有 Sentient Element 这样的新玩家
我这个 AWS 他们自己不是也在搞 AI 吗而且他们这个卡也多钱也多的为什么还不能满足大家的 GPU 需求是你说的没错其实 AWS 去年也推出了很多针对 AI 的服务包括像是 Bedrock 还有它 Tranium 的这种芯片但是问题在于传统的云厂商的架构设计资源调度系统它本质上还是为之前的一代的通用计算场景服务的
不是为这种 AI 现在这种大规模密集实时性比较强的 GPU 工作负载优化过的所以比如说是我听到的你在 AWS 申请一个大规模的 A100 的机器人可能需要排队个好几天甚至有的时候可能就申请不到
那这么一讲的话你刚才提到那些 GPU 的 Cloud 厂商他是怎么样弥补这个市场缺口的呢 CoreWeb 其实是一个很典型的例子它一开始有很多的 Ameda 的 GPU 开始是挖矿的它是这么起家的然后后来他们快速就开始转型做了 GPU 云服务那他们的这个思路非常明确只为 AI
也确实听说 CoreWave 最近这个股价涨得是很快
对他们在 23 年的时候还只有 20 亿美元的估值然后现在已经涨到了 230 亿就十倍多去年他们还融了十多亿准备在美国的中部啊还有欧洲很多地方继续的建厂然后他的投资人里面你猜猜还有谁那肯定得有 NVIDIA 呀
对对对很多人确实是说它是 NVIDIA 的亲儿子或者是白手套对它本质上其实是帮助这个 NVIDIA 把 GPU 的资源给它匀化了或者是服务化了所以在很多的情况下面我听说这个 NVIDIA 其实是优先给 CoreView 来供芯片的还提到另外两家这个 Lambda Labs 还有这个 Sentient 这两家它们有什么特点
Lambda Labs 应该大家之前其实听过它其实是一个更早期的一个 GPU 的云服务商之前有很多的科研机构中型的 AI 公司都是他们的客户然后他们最近刚刚也融资了一轮 Sentient Element 其实是比较新的公司然后它的背后是有 OpenAI 的投资其实他们也在快速的部署不同的这种基础设施在建厂什么的特别是在欧洲和亚太的市场
那其实从你刚才比较这几家小公司和以前传统的云服务厂商我感觉现在就是整个云计算的格局在 AI 时代其实就是变得特别不一样了对其实大家一直在说 AI 原生的应用 AI 原生的各种东西其实就是 AI 的 cloud 的原生化 AI 云的原生化的这个过程那以前的云就是计算存储网络 AI 工具的这种标准的服务站
那现在的算力变成了第一要素那谁能够提供最便宜最高效最灵活的这种 GPU 的资源嘛那谁就能赢下这些 AI 公司的订单那就像这个 CoreWeave 这样只做 AI 资源高度绑定 NVIDIA 的公司肯定是有一定的先发优势的那 AWS Google Cloud 虽然也会追赶但肯定还是会有一些这种大公司难以掉头的这些历史架构的包袱他们的享用速度肯定还是稍微慢了一些
刚才 Diane 你讲到 GPU Cloud 正在重塑这个 AI 基础设施的市场嘛那你刚才也提到就这次 GTC 上特别强调一点是推理是未来 AI 的主战场你能不能再给我们展开讲一讲为什么这个主战场不再是训练了或者说推理这背后的商业逻辑是什么呀
对其实这个我觉得是老黄这个 Jensen 这次在 Keno 里面反复强调但是没有特别明说的一点因为过去我们其实一直是在讲训练嘛特别是去年的 GTC 上面然后这种可能底座大模型它的 scaling law 是什么什么然后讲这个模型的参数百亿千亿比较的都是这些东西
但是呢现在今年我们感觉大部分的模型已经都能跑起来了而且能力都差不多都还是挺易用的那现在可能真正决定用户的体验啊决定这个准确率啊决定这商业化效率的肯定还是推理这一块训练当然很重要那可能之前的训练是一次性的你花两个月啊上千个 GPU 去训练一个模型但是现在推理是每天每秒都会发生的事情就每一个用户问一句话那背后就是一次推理的请求嘛
而且可能会产生几千个 token 那老黄其实也在现场做了一个对比嘛然后就是说我记得是一个婚礼怎么样排座位的一个问题大家可以去看还挺搞笑的那像是这个 OpenAir Anthropic 这些公司现在他们的核心的商业指标肯定不是训练的时间了它是吞吞
就推理的吞吐量 throughput 和 token 的利润这个叫做 token revenue margin 那所以现在大家的关注点肯定从过去的我能不能训练出一个好的模型转到了我能不能更高效更低成本更低延迟的服务这个模型这个就是我觉得这个推理主战场的这样的一个由来那你觉得老黄准备怎么打推理这场仗呢对我们刚刚其实不是讲了那个英伟达今年推出的 Dynamo 吗
然后我觉得这个其实就是他们的推理主战场的底层的操作系统让你能在数千张 GPU 上面同时跑推理又有比较合理的调度然后减少重复的计算特别它是支持 agent 的分阶段执行的一整套的一个
系统那比如说那把这个 LOM 的这个推理分成两个阶段一个是理解问题另外一个就是生成答案那这两个阶段的计算的需求和内存的布局肯定是不一样的那 Dynamo 就是能把这两个阶段分别调度在不同的 GPU 上面做
最优的这种配置这种叫做这个分离服务 separate service 这样的一个架构的思路那其实现在很多大模型公司内部的这个做法都是差不多的但是 Dynamo 把它这个产品化了然后开源了就变成了一个平台了
所以我们刚刚聊的其实就是它和 NIM 的微服务是相互结合起来的所以你可以就理解这个 Dynamo 是这种调度层然后 NIM 其实就是模型的封装和服务的这个中间件然后再加上底层的一些 Tensor RTLM 这几层叠加起来就是现在英伟达在推理战场上提出的完整的一个 stack
其实我有看尼韦达的官网他们就有一张特别酷炫的图就是把你刚才提到的这几层都给它叠加起来感觉整个推理系统他们已经各个环节已经全覆盖了都想的很对的很覆盖了对对对其实这背后也意味着一个判断就是那推理呢不会变得越来越便宜甚至是会越来越贵只不过呢是会贵的更智能还更值得花钱
我觉得是的训练可以变得更快甚至未来大家会用这个更小的数据或更轻的模型就能训练出来不错的这样的结果但是推理是刚需对英伟达来说是这种负力性的刚需一旦有了用户它就会这种重复的发生所以从商业的角度的话来说的话谁能把
推理体验更加优化谁就有最稳的这种 token 的收入嘛那这样的一个收入来源并不是一次性的模型的 license 而是持续的这样一个服务费这就是为什么我们看到很多人都在开始说重新定义 AI 的基础设施从专用的这个 GPU Cloud 到专门为推理优化的这样的一个架构再到这个 Name Dynamo 这样的软件层的这样的支持
所以你刚才说到这个推理作为服务我想到这次 GTC 上其实有很多的合作伙伴也是往这个方向在走比如说你像这个 SAP 还有这个 ServiceNow 微软 Atlancia 这种老牌的软件公司也都开始通过 NIM 还有 LambdaNimotron 这套组合来开发自己的 agent 也就是智能体了对吧没错你会发现他们现在都不是自己去训练自己的 LM 他们都在训练自己的 LM
他们选择路径就是用一个英伟达已经优化过了然后推理也很快然后部署也很容易的这样子的一个模型然后再通过 NIM 的微服务部署再加上 AIQ Blueprint 来建构自己的知识库和推理逻辑那这个背后其实是有两个层面的变化一个就是角色的变化那过去他们是这个软件公司那现在要变成一个 AI 智能体的平台那这个就需要像英伟达这样的公司做底层的支持的系统
第二个就是推理已经变成了就像数据库查询一样它是一种这种服务能力需要实时啊稳定啊高效所以我们就才说推理才是现在真正需要运营能力的一个战场咱们刚才把推理这几个环节都大概 cover 了一下那我其实还有最后一个问题啊
那你觉得现在这个趋势会把 AI 行业带到一个什么样的方向呢是不是我们很快就看不到一个所谓一家独大的 LM 的格局而是一个有很多模型很多推理场景并存的这么一个新生态呢
我觉得其实已经在发生了你说像是 DeepSeekMistralMetalama 甚至中国这边的 MiniCPM 这些模型虽然不一定是最强的但它只要能够跑得快推理成本低体验好就能够找到自己的细分市场比如像是医疗法律这些领域肯定不能是追求万能然后它反而是追求稳定可解释推理链条短然后作为他们的这样子一个卖点所以我觉得 AI 行业正在进入一个推理服务的时代
而英伟达在这个时代扮演的角色他并不是想买 GPU 并不是建模型而是把整个推理的服务变成了一个平台然后让别人在他的平台上面跑这就是我理解他们想要达到的一个未来的平台的一个统治力吧
对然后我们刚才其实聊了挺多关于智能体就是这个 Agentic AI 的落地场景像 Perplexity、SAP 还有微软这些都已经在平台上部署了智能体了那接下来是不是要进入我们今天最后一个大趋势了
其实刚刚聊了蛮多的 Agentic AI 就是这个智能或者是代理人 AI 今年已经全面开始爆发了从国内前段时间这个 Mannus 开始然后像这次整个在 GTC 大会上面它有一个创业公司的一个展厅基本上我感觉 Agentic AI 占了一大半对
像各种这个写作助手啊客服机器人啊然后自动化工作流程啊就很多这个场景其实大家都已经看到了有一些创业公司的存在接下来我们要聊的肯定就是今年的老黄也在他的 Keynote 上面聊的就是让 AI 怎么样真正的走出屏幕进入真实的这个现实世界就是这个 physical AI 就物理 AI 也是可能我们现在看到这个机器人 AI 当然不仅仅是机器人了也包括像自动驾驶这些部分
虽然说现在这些还比较早期但是也看到越来越多的这个技术的尝试我不知道大家记不记得 Jensen 在他的 Kindle 里面那张图就一开始那张图就从感知 AI Perception AI 然后到生成式 AI 到了今年的 Agent AI 然后再到后面就是 Physical AI 就物理世界的 AI 了今年这个发布会的一个亮点其实就是老黄跟迪士尼的那个小机器人 Wally 在台上的对话对对对
那你觉得现在的英伟达的关键词在这个方面是机器人吗机器人这块它可以分为几个方面来讲吧那可能在过去来说它其实已经有了 Groot 这样的一个基础的模型那今年把它给开源了而且它还是可以定制的一个通用的人形机器人的基础模型然后它其实是模仿了人类的这个双系统我知道大家可能都看过思考快与慢嘛
它就是两个模型一个 System 1 就是快速反应就比如说是你拿手去接掉下来的这个物体那 System 2 就是慢思考是整个任务的一些这个规划呀和路径执行所以它把整个的这个 ISAC GRU 的 N1 这个模型就完全做成了这样的一个形式这个 N1 它不仅是能够实现像这种单手啊双手的这个抓取啊搬运啊手臂交接这样的任务
然后它还能够通过这个模型的不断的这个微调呀后训练适配不同的机器人的这个硬件这次在 GTC 上面我也看到了很多落地的例子像这个机器人公司 1X 已经用在了他们 Neo Gamma 的身上然后实现了室内清洁作业的这个全流程然后包括像是波士顿动力呀 Manti RoboticsAgility Robotics 也都开始用 Groot 进行这个部署了
另外的一个 GTC 很大的一个发布就是它的数据合成平台就是 Cosmo 然后还有这个 iSight Group 的这个 Blueprint 在 GTC 上其实你还采访了语术科技的负责人是吧他们好像也对这块有一些应用他们是怎么看的对我在 GTC 上跟那个语术的一个销售总监大概随便聊了两句强化学习迭代速度相比于以前会越来越快那我们发现就是在做强化学习然后
开发的周期比以前缩短了很多因为一方面是它的算力更快了另外一方面就是整个 AI 的技术发展也越来越成熟然后他们今年明显感觉到了一个变化他说的这个 local motion 就是这个机器人身体运动的这个灵活性有非常大的进步也就是过去的这一年以前可能机器人的站立行走
它可以站立行走但是迈不开特别大的步子然后变换姿态可能会稍微缓慢一点但是现在呢因为强化学习的速度非常快了然后算力也提升了还有更精准的这些动作的磨心所以整个机器人它的动作的平滑度啊稳定性啊都有所提升他们说的挺有意思今年最大的不同就不是很多的是炫技它就是带来的是可部属性就是说机器人不仅仅是能够可能走起来它还真正的能够帮人类做一点事儿
就不是在春晚的舞台上在那隔着扭秧歌那这个合成数据啊也就是你说这个 Cosmos 跟 ISAC Group Blueprint 它们的作用是什么呀
它解决的就是数据匮乏的这个根本问题这个在机器人的行业其实一直是一个很大的问题你想训练一个机器人的模型过去得靠真人一天一天的演示或者让这个机器人他要看这个不同的在实验嘛看录像啊什么的就非常的慢然后采集这些运动的数据这些东西都非常非常的缓慢但是这个 Cosmo 啊 Blueprint 让你可以通过一小段的人工演示然后它能
能够帮你生成很多的合成数据来再去训练你的机器人那这次 GTC 上公布的数据就是 11 个小时就可以生成 78 万条的这个他们叫做合成轨迹那这个数据就相当于是 6500 个小时的真人眼神那就是机器人需要训练 9 个月才能达到的这样子一些数据
那这样听起来有合成数据的话机器人领域现在其实也是进入了这个数据飞轮了就是未来肯定我们是往这个方向再走的那我们可以再说一下这个 physical 就是物理 AI 的另外一个面就是大家现在讨论的另外一个很大的话题就是自动驾驶了然后这次我也碰到了圆融起行 deep root AI
然后他们今年其实也是这个被邀请来然后他们的创始人有一个 panel 做了一个演讲他们自己今年的一个战略方向就是从这个 L4 的自动驾驶转向一个叫做 Road AGI 道路上的通用人工智能然后今年的话其实主要就是讲新一代的这个 VLA 技术我们叫 Road AGI 这些移动物体都可以比如说一些这种像是
一个小的类似于像一个 scooter 它又能做一些 delivery 就是送货然后而且它跟普通的那些又不一样不仅仅蔚来的车是光会自己开然后还得运用到各种路况还可以迁移到其他的平台上就比如说是
机器人啊机器狗呀然后配送机器人啊然后电动滑板车呀等等这种所以他们的一个核心的技术路线就是一个端到端的这样个算法就不太需要依赖高清地图你知道原来的所有都是依赖高清地图的嘛它
他们准备把这个部署在多种的平台上面他们跟我讲预计今年会部署在 20 万台车上面可能在明年会达到 50 万台就是圆融启行他们用的也是 NVIDIA 的硬件平台吗他们是在用 NVIDIA 的 Orient 平台同时也在开发自己的 VLA 模型这个模型我也看了一下他们给我的一些资料也挺有意思的
他们就是把视觉呀语言和动作这些结合在了一起让自动驾驶能够更好的理解和应对不同的一些道路和交通状况因为中国的交通状况跟美国的肯定是完全不一样而且复杂的多那所以那随着可能他们使用的英伟达的一些芯片的一些提升啊或者他们的这个英伟达服务的一些提升他们也希望能够跑更复杂的一些模型最终走到通用道路的智能
所以其实总结一下从 Isaac GrootNewton 还有袁荣启行这一波是真正把 AI 从云端大脑要变成一个物理身体让它长出手脚了
对我觉得其实也仅仅是一个开始吧你说现在不管是在哪个国家自动驾驶其实都还是没有办法完全的实现吧肯定还是因为他这个训练的不够然后还不够智能那我觉得我们其实正在迈进 physical AI 的时代当然了我觉得其实今年的更主要的更大的话题还是这个 agent 我觉得老黄话这个饼真的有点太大了有点吃不下气哈哈哈哈
我觉得他其实把路径给我们描绘的非常的清楚我觉得这个是对的确实是上次 Aaron 不是说吗说马斯克是一个喜欢给你画大饼真大饼的人但是老黄说的事情他还真是一步步都能实现
这次我觉得它更加像是我给你了一套特别完整的未来的运行系统它在不同的角度然后不同的节点上面关键的节点上面都先把点先站住了所以你是说不管是开源还有 GPU Cloud 还有机器人推理平台这些东西其实都不是孤立的对你说它每一个发布然后每一个它的这个动作的背后都是为了形成我觉得它是一个系统性的一个飞轮嘛
然后模型的开源加上 NIM 的微服务就是为了把这个部署更加的标准化这才是产品然后更多的人才能使用它 Dynamo 的推理操作系统其实就是为了提升大规模的 AI 服务的效率和稳定性 IcetGroove Newton 就是在重塑物理世界的感知执行 GPU 的 Cloud 生态就是能够把整个系统跑起来的可以把它叫做燃料或者是供应链
我们老说护城河英伟达最大的护城河它可能不是它现在的发布的模型最强也不是说它的这个芯片最多而是把整个开发者和行业全部都绑定到它这张网里那这张网呢其实就是用它这个 AI 飞轮来编织的节目的中间想跟大家同步一个消息我们生动活泼为 AI 时代的青少年打造了一档全新的晨间播客 Knock Knock 世界
这档节目每期十分钟从青少年感兴趣的现象出发解读背后的深层逻辑启发提出自己的好奇欢迎九岁以上的青少年和家长们免费试听可以在本期节目的单集简介中查看详情那我们这期时间也差不多到尾声了要不要给大家预告一下我们接下来再会聊点什么
对我不知道大家有没有发现我们其实完全没聊今年特别重磅的一个东西也是我们科早其实关注的就是量子计算今年老黄他亲自牵头组织了一个 Quantum Day 来了非常多的整个行业里的人吧
我们也就不做更多的剧透了我觉得唯一能说的就是英伟达其实在请所有的这些量子计算行业领域里面的头部玩家 CEO 科学家上台之前他自己宣布了在波士顿设立了加速量子研究中心所以我们也会在接下来的节目里面和大家分析一下现在量子计算发展到了什么样的一个阶段包括老黄跟所有的
量子计算领域的头部玩家他们的对话然后我们从这个对话当中发现了一些什么样的信息点和趋势吧好的那我期待接下来的节目吧好嘞好那我们今天节目就到这儿了好的就这样拜拜拜拜
那我们下期再见