你可能还会遇到这种情况,即使对于“七巨头”来说,Capo X 部署的规模也会让他们的首席财务官们开始高估或低估。是的,当然。完全正确。
Sonny、Bill,很高兴见到你们。很高兴见到你。很高兴回来。谢谢,伙计。很高兴有你。我们刚刚结束了为期两天的 Altimeter 年度会议。我的意思是,我们有数百名投资者、首席执行官、创始人,主题是将智能扩展到 AGI。
我们请 Nikesh 谈论企业 AI。我们请 Rene Haas 谈论边缘 AI。我们请 Noam Brown 谈论,你知道的,Strawberry 和 O1 模型以及推理时间推理。我们请 Sonny 谈论,你知道的,加速推理。当然,我们以 Jensen 谈论当今计算的未来开始。
你知道,我和我的合作伙伴 Clark Tang(负责公共领域的计算层)一起做了 Dentson 的演讲。我们在周五录制的。我们将把它作为本播客的一部分发布。我的天,内容真密集。我的意思是,他,你知道的,他状态火热。我一开始就问他,你想做什么?他说,全力以赴。我们也确实这样做了。90 分钟,我们深入探讨。我把它分享给了你们。我们都听过了。我回放时学到了很多东西,并且
我认为我们有必要对它进行分解,对吧?真正地分析它,看看我们同意什么,我们可能不同意什么,以及我们想要进一步探索的东西。Sonny,你对此有什么高级别的反应?
是的。你知道,这是我第一次真正看到他在一种能够在一个环境中获得所有信息的格式中出现,因为你有点得到你得到的片段。真正让我印象深刻的是他说英伟达不是一家 GPU 公司。他们是一家加速计算公司。我认为下一个,你知道的,你将要谈到的,是他真正说过数据中心是计算单元,对吧?
我认为这意义重大。而且,你知道的,在他谈到英伟达已经在内部使用并利用了如此多的 AI,以及这如何成为他们超越所有竞争对手的超级力量时,他总结道。我认为这些都是非常棒的观点,而且他,你知道的,在“吃自己的狗粮”,正如人们所说。这太不可思议了。你知道,我们稍后会谈到这件事,但他表示他认为他们可以将
你知道的,业务的顶线增长 3 倍,而只需要增加 25% 的员工,因为他们可以有一万个自主代理来做一些事情,比如构建软件,做安全工作,而且他将成为一个提示工程师,不仅是对他的人类直接下属,也是对这些代理,这,你知道的,真是令人难以置信。Bill,你有什么特别之处吗?
好吧,首先,我的意思是,你应该为能够获得他的时间而感到高兴。你知道,这是……
有时是世界上市值最大的公司,如果不是其中之一的话,所以我觉得他愿意和你坐下来这么久,而且在播客期间他一直说我可以待多久都可以,我说他不需要做别的事情吗?这真是太慷慨了,太棒了,但我的另一个大收获,我的
我有两个重要的收获。首先,很明显,这家伙正在全力以赴。你拥有一家市值 3.3 万亿美元的公司,其年增长率仍在 100% 以上。而且
利润率惊人。我的意思是,65% 的营业利润率。在标准普尔 500 指数中,只有大约五家公司达到这个水平。而且他们肯定不会以这种速度增长。当你提到用更少的员工完成更多工作时,这将走向何方?比如 80% 的营业利润率?我的意思是,这将是史无前例的。这里已经有很多史无前例的事情了。但很明显,华尔街正在增长。
充分意识到这家公司的惊人表现。而且,你知道的,市盈率和市值都反映了这一点,但这执行力非常强大。而且你可以在他给出的每一个答案中看到信心。我们在播客中大约三分之一的时间
都在讨论英伟达的竞争优势,试图真正地分解它,真正地理解这种系统级优势的概念,以及他在业务中拥有的组合优势。因为我认为当我与投资界的人交谈时,尽管它得到了很好的报道,Bill,对吧?仍然存在这样一种观念,即它只是一个 GPU,有人会制造出更好的芯片。他们会来取代这项业务。
所以当他说,再次,这听起来像是营销术语,Sonny,当有人说它不是一家 GPU 公司,而是一家加速计算公司时。你知道,我们展示了这张图表,你可以看到英伟达的全栈。他谈到他是如何在过去
十几年里一层一层地构建了这个栈。但是当他说到这一点时,Sonny,我知道你对此有反应,对吧?即使你知道它不仅仅是一家 GPU 公司,当他真正地分解它时,似乎,你知道的,他确实开辟了新的领域。
是的,就像从他那里听到的,而且真的,你知道的,对那些思考英伟达目前在栈中所处位置的人来说,这是一个积极的信号,他深入到了细节,然后是 CUDA 下面的子细节。他真的开始深入探讨他们在
特别是在数学运算方面为合作伙伴所做的事情,以及他们如何与合作伙伴(所有云服务提供商)紧密合作,基本上构建这些功能,以便他们可以进一步加速工作负载。我注意到另一个细微之处,他没有仅仅关注大型语言模型。
他在那个特定领域谈到他们是如何为许多传统模型,甚至是为 AI 部署的较新模型做到这一点的。我认为这真正地展示了他们如何在软件层面的合作比在硬件层面的合作要紧密得多。对。事实上,你知道的,他谈到,你知道的,CUDA 库现在拥有超过 300 种行业特定的加速算法,对吧?他们深入了解行业,对吧?
所以无论是合成生物学、图像生成还是自动驾驶,他们都会学习该行业的需要,然后加速特定的工作负载。对我来说,这也是关键因素之一,这种观念认为每个工作负载
都从这种确定性的、你知道的、手工制作的工作负载转变为真正由机器学习驱动并真正融入 AI 的东西,因此即使是像数据处理这样普遍存在的东西也能从中受益。
是的,我在准备这个播客时与 Bill 分享了这个代码示例。我知道 Bill 马上就处理了它,然后运行了它,它确实展示了现在所有与……相关的代码片段——不是所有片段,许多片段都有这种“如果设备等于 CUDA,则执行 X,如果不是,则执行 Y”的结构。
这就是他们在整个生态系统中正在构建的与 AI 相关的服务和应用程序中产生的影响程度。Bill,当你看到那部分内容时,你有什么想法?是的,我认为长期来看,CUDA 存在一个问题。我想回到你稍后提到的系统点,Brad,但当我们谈到 CUDA 时,有多少百分比的开发人员……
会接触 CUDA,这个数字是上升还是下降?我可以看到两方面的论点。你可以说,八个模型将变得越来越专业化,性能非常重要,因此最重要的模型、最重要的部署将尽可能接近底层,然后 CUDA 将很重要。另一方面,你可以说
这些优化将存在于 PyTorch 中。它们将存在于其他类似的工具中。而边缘开发人员不需要知道这一点。而且我,我可以提出这两种论点,但我认为这是一个未来有趣的问题。我的意思是,我只是问 ChatGPT 今天有多少 CUDA 开发人员,只是为了了解情况。300 万 CUDA 开发人员。
对吧?还有更多接触 CUDA 但并非专门从事 CUDA 开发的人。所以它成为了一种相当普遍的东西。他的观点是,当然不仅仅是 CUDA。它真的是全栈,从数据摄取一直到训练后。我认为我赞同你的后一点,Bill。我认为接触它的人会越来越少。而且我认为这是一个优势
不像你说的那样,长期来看那么强大。想想看,你知道的,我将要使用的类比是,想想看苹果有多少 iPhone iOS 开发人员在工作,与应用程序开发人员的数量相比,对吧?我认为你将会有一个 10 比 1 或 100 比 1 的比例,在上面几层构建的人与在更接近底层构建的人相比。——这将是值得关注的事情。我们可以随着时间的推移询问更多的人。显然,今天它是一个很大的锁。
你知道,我认为,Bill,根据你的观点,你知道的,我在做采访之前联系了 Gavin。实际上,在我做采访之前,我联系了 Gavin Baker,他是一位好朋友,显然非常了解这个领域,并且比我更长时间更深入地关注这个领域。而且,你知道的,当我问他关于
他真的谈到了很多关于这种算法多样性和创新方面的竞争优势,以及为什么 CUDA 很重要。他说,如果世界标准化了 Transformer 和 PyTorch,那么它对 GPU 的相关性就会降低。嗯,
你知道的,在这种环境下,如果你有很多标准化,对吧,那么优势就归于定制 ASIC。但是我要告诉你这一点,你知道的,我和很多人谈过这个话题。当我问 Jensen 时,我向他施压,你知道的,定制 ASIC。我说,嘿,你知道的,你有了,你知道的,来自 Meta 的 MTIA 芯片的加速推理。你知道的,你有了 Inferentia 和 Trainium,你知道的,即将到来。他说,是的,Brad,就像那里一样,
你知道的,他们是最大的合作伙伴。我实际上会与他们分享我的三到五年路线图。是的,他们将拥有这些点解决方案,这些解决方案将执行这些非常具体的任务。但最终,世界上绝大多数机器学习和 AI 融合的工作负载都将在英伟达上运行。我与的人越多,我就越相信这是事实,尽管会有很多赢家,包括 Groq 和 Cerebrus 等,
而且他们正在收购公司,他们正在向上移动栈,他们试图在更高层次上进行更多优化。所以他们显然想要扩展 CUDA 的功能。先不要谈推理,这是一个完全不同的故事。——不,不,不,我们会谈到的。——我实际上是在谈论深度集成,对吧?因为,你知道的,这真的是我认为微软长期以来在企业软件中做得很好的一种策略。而且你从未在硬件中见过这种深度集成。
你知道的,如果你回顾一下,比如说,思科或 PC 时代,或者,你知道的,云时代,你没有看到这种深度集成。现在,微软通过 Azure 做到了这一点。当我听到他说话时,我想到的只是,我的天,这真是太聪明了。他所做的是,他走到一起,真正了解用例是什么,并建立了一个能够深入集成到客户中并做得如此之好的组织,一直到他的路线图,以至于他比任何人都更深入地嵌入其中。我同意。
当我听到那部分内容时,我对他表示了敬意。但是你,你知道的,Brad,你对此有什么看法?我们第一次听完之后,你和我讨论过这个话题。而且,你知道的,如果你真的放眼长远,你知道的,他作为一个系统级工程师在说话,对吧?即使你听到像人们,你知道的,人们去了哈佛商学院,说,这个人怎么可能有 60 个直接下属,对吧?但是埃隆有多少个直接下属?
这些系统级,他说,我有态势感知能力。我是世界上最优秀的人才的提示工程师,他们从事这些具体的任务。我认为当我看到这一点时,我在一年半前对这家公司严重低估的一点是,他花了数年时间思考如何嵌入这种竞争优势的系统级思维。
以及它如何真正地,它从电力一直延伸到应用程序。而且他们每天都在推出这些新事物,以进一步将自己嵌入到生态系统中。但我确实在过去两天从某人那里听到了一些消息,你知道的,ARM 的首席执行官 Rene Haas,
Rene 也参加了我们的活动,他是 Jensen 的超级粉丝。在 2013 年成为 ARM 首席执行官之前,他在英伟达工作了八年。他说,听着,没有人会正面攻击英伟达的城堡。AI 的大型机已经根深蒂固,而且至少在可预见的未来,它还会变得更大。他说,然而……
如果你考虑一下我们今天与 AI 交互的地方,对吧?在这些设备上,在边缘设备上。他说,我们在 ARM 的安装基础是 3000 亿台设备。而且越来越多的计算可以在更靠近边缘的地方运行。如果你考虑一个正交竞争对手,对吧?
对。再次,如果他在云端拥有深厚的竞争优势,那么正交竞争对手是什么?正交竞争对手剥离了边缘上的很多 AI。我认为 ARM 在这方面拥有非常好的地位。显然,英伟达现在已经在许多产品中嵌入了 ARM,你知道的,在许多 Grace Hopper 等产品中,
但对我来说,这将是一个领域,如果你向外看,并说,他们的竞争优势在哪里可以受到一些挑战?我认为他们在边缘并不像在云端那样拥有同样的优势水平。你一开始就说,投资界的人都听过这个说法。它不是一家 GPU 公司,而是一家系统公司。而且在我看来,我认为我曾想过,哦,好吧,他们有四个在一个盒子而不是只有一个 GPU,或者八个在一个盒子。
在我听你与 Jensen 做的播客时,我正在阅读 Dylan Patel 的 NeoCloud playbook 和 anatomy 文章。是的,那篇很好。他详细介绍了一些大型系统的架构,你知道的,比如我们即将讨论的 X.AI 刚刚部署的那个系统,我认为它有 10 万个节点或类似的东西。而且
它彻底改变了我对世界上正在发生的事情的看法,并且实际上回答了我的一些问题。但在我看来,英伟达的竞争优势最强的是
系统规模最大的地方,这也就是 Rene 所说的另一种说法,它颠覆了这一点,并不是说它在边缘很弱,而是当你把很多东西放在一起时,它非常强大,这就是网络部分蓬勃发展的地方,这就是 NVLink 蓬勃发展的地方,这就是 CUDA 真正活跃的地方
在现有的最大系统中。它为我解答的一些问题是,首先,为什么高端需求如此之高?为什么互联网上可用的节点,你知道的,互联网上可用的单个节点价格低于或等于成本?
这开始涉及到这一点,因为你可以用大型系统做一些你无法用单个节点做的事情。因此,这两件事可以同时成立。为什么英伟达如此关注 CoreWeave 的存在?我现在明白了。如果最大的系统是最大的竞争优势所在,那么你需要尽可能多的这些大型系统公司。而且可能会有,如果这种轨迹证明
仍然成立。随着时间的推移,英伟达的客户集中度可能会增加,而不是相反,这取决于,你知道的,如果 Sam 说的对,他们将在单个模型上花费 1000 亿美元
或者其他什么东西,那么他们只能负担得起这么多的东西。但是,很多事情在我之前并不理解,现在开始变得有意义了。而且我显然低估了成为一家非 GPU 公司、一家系统公司的意义。这,这会上升很多,很多。
是的,再次,Bill,你触及到我认为在这里非常重要的一点。这就是他们的竞争优势在训练中是否也像在推理中那样强大的问题。因为我认为有很多疑问。
至于他们的竞争优势在推理中是否像在训练中那样强大。但是,你知道的,让我们……你想切换到那个话题吗?不,但是我问他是否一样强大。不,我知道你问了。他实际上说它更强大。
对我来说,当你想到这一点时,首先,我认为它没有多大意义。但是当你真正开始思考它时,他说在已经存在的基础设施背后有一条 CUDA 兼容的、可以为所有这些推理摊销的基础设施轨迹。例如,他提到 OpenAI 刚刚退役了 Volta。所以它就像一个巨大的安装基础。对。
当他们改进算法、改进框架、改进 CUDA 库时,它都是向后兼容的。因此 Hopper 变得更好,Ampere 变得更好,Volta 也变得更好。再加上他所说的今天世界上的一切都变得高度机器学习化,对吧?他说我们做的几乎所有事情,几乎每一个应用程序,Word、Excel、PowerPoint、Photoshop、AutoCAD,都将在这些现代系统上运行。所以
Sonny,你相信吗?你相信当人们更换计算时,他们会用这些现代系统来更换吗?所以当我听的时候,我信了。但是后来他说了一件事,一直在我脑海中回响,他说,推理将比训练大十亿倍。如果你仔细研究一下,这些旧系统将不足以满足需求。
如果你要拥有如此多的需求,如此多的工作负载,我认为我们都同意这一点,那么这些正在从训练中退役的旧系统怎么可能足够呢?所以我认为这就是为什么这个论点对我来说不够有说服力。如果它的增长速度像他说的那样快,像你们在他们的数字中看到的那样快,那么它将会有更多的与推理相关的净新增工作。
你知道的,部署。而且在那里,我认为这个论点在从旧硬件转移到新硬件方面站不住脚。好吧,你说的,你很随意地说了一些话,对吧?让我们强调一下这一点。
我们正在谈论 Strawberry 和 O1 预览,他说有一种全新的扩展智能向量,推理时间推理,它不会是单次拍摄,而是将会有大量的代理到代理交互,思考时间,正如 Noam Brown 喜欢说的那样。他说,因此,推理将达到 100 倍、1000 倍、100 万倍,甚至可能是 10 亿倍。而这本身……
对,对我来说是一个哇的时刻。他们 40% 的收入已经来自推理。我说,随着时间的推移,你的推理是否会成为你收入组合中更高的百分比?他说,当然。
但是再次,我认为传统观点都围绕着集群规模和训练规模。如果模型不再变得更大,那么它们的相关性就会消失。但他基本上说,每个工作负载都将从加速中受益。它将成为一个推理工作负载。推理交互的数量将爆炸式增长。是的,一个技术细节,如果你训练更大的模型,你需要更大的集群,对吧?
但是如果你运行更大的模型,你不需要更大的集群。它可以分布式,对吧?所以我认为我们将在这里看到的是,更大的集群将继续部署。正如 Bill 所说,它们将被部署给那些可能需要为 1000 亿美元的运行甚至更大的运行部署它的人。但是你会看到推理集群很大,但不像训练集群那么大,而且会更分散,因为你不需要它都在同一个地方。
我认为这将非常有趣。这很有趣。他比你更简化了这一点,Brad。他说,想想一个人。你花多少时间学习,多少时间做事?他用这个比喻来说明为什么这会如此伟大。但是我,与 Brad 有点不同,
Sonny,我认为我们将在推理方面表现出色,因为我们有很多旧的东西闲置着,这个论点并不十分可靠。换句话说,如果……
其他一些公司,Sunny 的公司或其他一些公司,决定优化推理。这不是一个关于优化的论点。这是一个关于成本优势的论点,因为它可能是完全分布式的或其他什么。当然,如果你可能就此反驳他,他可能会有另一个答案来解释为什么需要优化。但是显然会有人,无论是其他芯片,
公司,还是这些加速器公司中的一些,他们将致力于推理优化,这可能包括边缘技术。我认为一些加速器可能看起来像 AICDN,如果你愿意的话,他们将更靠近客户购买东西。所以,所有这些都有待观察,但仅仅因为你还有剩余的东西,这个论点在我看来并不十分可靠。目前推理速度最快的三家公司都不是英伟达。是的。
对。那么它们是谁呢,Sonny?我们将发布排行榜。是的。它结合了 Groq、Cerebras 和 SambaNova,对吧?这三家公司不是英伟达,它们都在他们运行的所有模型的排行榜上。你谈论的是性能。你谈论的是性能。性能。是的。是的。我认为这是安装基础的结合。我认为这是因为推理市场增长得如此之快。我认为,即使在 18 个月前做出这个决定,也很难购买这三家公司中的任何一家,因为你的主要工作负载是训练。在本播客的第一部分,我们谈到了他们与正确完成训练的联系如此紧密。
我认为当涉及到推理时,你可以看到所有非英伟达的人都可以立即启动并运行模型。不需要与 CUDA 绑定才能更快,不需要与 CUDA 绑定才能运行模型,对吧?显然,这三家公司都没有运行 CUDA。因此,这种优势在推理方面并不存在。是的,CUDA 在推理中不太相关。这是另一个值得一提的点。
值得一提的点。但我想补充 Sonny 刚才说的一件事。如果你回到早期的互联网时代,这只是一个优化需要时间的论点,
所有的初创公司都在使用 Oracle 和 Sun。他们每一个都在使用 Oracle 和 Sun。五年后,他们都在使用 Linux 和 MySQL,就像五年一样。所以,而且实际上,它从 100% 降到了 3%。我并不是说这将会发生。
但是你确实经历了行业的大规模转变,他们从第一次开发和构建转向优化,这实际上是两个不同的动作。
在我看来,我调出了这张图表,对吧,我们在今年早些时候为这个播客制作的图表,它显示了未来四到五年预计将有 1 万亿美元的新 AI 工作负载,以及 1 万亿美元的数据中心更换。我只是想了解一下他最新的,你知道的,反应或预测,因为他已经有,你知道的,六个月的时间来考虑他是否认为这是可以实现的。
我听到他说的是,是的,数据中心更换将完全像那样。当然,他只是在做出他最明智的猜测。但他似乎暗示 AI 工作负载可能会更大,对吧?就像一旦他看到 Strawberry 和 O1,他就认为将需要大量的计算能力来支持这一点。我与的人越多,我就越有这种感觉。
存在这种无法满足的需求。所以也许我们只是触及一下这个话题。他上了 CNBC,他说需求非常疯狂。
对。我一直试图对此施压。我说,是的,但是 MTIA 呢?定制推理呢?所有其他因素呢?如果模型不再变得那么大呢?我说,任何这些都会改变等式吗?他始终坚持说,你仍然不了解世界上的需求量,因为所有计算都在发生变化。对。
好的。我认为他的回答有一个细微差别,那就是当你问到这个问题时,他说,听着,如果你必须替换一定数量的基础设施,无论那个数字是多少,都非常大。而你就是其中一部分。你是在某个地方担任CIO,负责这项工作。
你会怎么做?你会用什么来替换它?是加速计算。然后一旦你做出这个选择,因为你不会选择传统的计算,那么英伟达就是你的首选。所以我认为他把这一点联系起来了,就像,你真的会因为在那里使用其他东西而让自己陷入困境吗?或者你只会选择英伟达?当他说这话的时候,我不想那样说,比尔,但这感觉像是老式的IBM论调。
听着,布拉德,有一点是,这家公司是上市公司。当一家私营公司说,哦,需求非常疯狂时,我立刻会感到怀疑。这家公司每季度营收300亿美元,增长122%。需求非常疯狂。我们可以看到这一点。毫无疑问。而部分需求是
关于埃隆和X.AI以及他们所做的事情的谈话。我认为这也非常引人入胜,对吧?我认为这很有趣。我问了他一个关于他和埃隆以及拉里·埃里森显然共进晚餐的问题。他说,你知道,仅仅因为那顿晚餐发生了,他们最终得到了10万个H100,并不一定能说明问题。但是听着,他证实了
他的想法被埃隆震撼了。他说他有一个N=1的超人,可能能够做到这一点,能够激活一个数据中心,能够液冷一个数据中心。他说,其他人需要数年时间才能获得许可、通电、液冷和启动,而X.AI在19天内就做到了。你可以看出他对
埃隆的极大尊重。很明显,你知道,他说这是当今世界上最大的单一连贯超级计算机,它还会变得更大。如果你相信人工智能的未来与硬件方面的系统工程密切相关,那么那一刻打动我的就是,这对埃隆来说是一个巨大的、巨大的优势。是的。
是的,我认为他,我不记得确切的数字,但他谈到了有多少千米长的电缆只是作为任务的一部分。听着,从一点来看,你知道,我们现在也在做很多这样的事情,建造数据中心,启动它们,机架和堆叠。
你知道,我们的节点,这令人印象深刻。在19天内做到这种规模的事情令人印象深刻。你知道,这甚至不包括他们建造数据中心的速度有多快。我认为这一切都发生在2024年内。
所以这是优势的一部分。有趣的是,他并没有像谈论它时那样多地谈论与云服务提供商的集成。我想深入探讨的是,因为你知道,埃隆处于一个独特的位置,他显然购买了这个集群。他非常尊重英伟达,但他知道,正在建造自己的芯片,用特斯拉建造自己的集群。所以我很好奇有多少,你知道,
他们能够做到这种规模的交叉关联或信息。你们看看这个,你们在他们的集群上看到了什么?
我对他们拥有的非英伟达集群没有太多数据。我相信我的团队中的弗里达有。我只是没有现成的。如果我们有,我会提取图表并展示出来。桑尼,你说你现在认为XAI集群是当今最大的英伟达集群?好吧,我说的是因为我相信詹森在播客中说过,他说这是世界上最大的超级计算机。是的。
是的,我的意思是,我只想花30秒钟来说说你刚才说的,布拉德,关于埃隆的话。我正看着窗外奥斯汀的超级工厂,它也是在创纪录的时间内建成的。星链令人难以置信。当我们在迪亚波罗散步时,我一直想着,我想让谁重新构想这个地方?埃隆,对吧?而且我不,世界应该研究埃隆。
他如何能够快速完成基础设施建设,因为如果这能够被克隆,那将是如此有价值。与本播客无关,但值得一提。关于埃隆的另一件事,我也想到了这一点……
这些片段在我的脑海中关于这些大型集群以及它们对英伟达的重要性结合在一起。他获得了分配,对吧?这应该像最热门的公司,最热门的产品,多年来需求量很大。他走进来,拿走了相当于,听起来,看起来大约占本季度可用量的10%。而且
在我看来,我认为这是因为,嘿,如果还有另一家公司要开发这些大型集群,我会让他们排在前面。这说明了马来西亚和中东正在发生的事情。任何一个对此感到兴奋的人,他都会花时间与他们在一起,让他们排在前面。你知道,我会告诉你,你知道,我在这件事上向他施压。我说,
你知道,埃隆会,你知道,谣传他会再获得10万个H200,添加到这个集群中。我说,我们是否已经进入了两到30万集群规模的阶段?他说,是的。然后我说,我们会达到50万甚至100万吗?他说,是的。现在,我认为比尔,这些事情已经在规划和建设中了。而他所说的超越了这一点,
超越这一点,他说,你开始碰到基础电力供应的限制。例如,你能找到什么东西可以通电来为单个集群供电吗?他说,我们将不得不开发分布式训练。嗯哼。
他说,但就像我们开发的Megatron一样,它允许今天正在发生的事情发生,我们正在研究分布式的东西,因为我们知道我们最终将不得不分解这些集群才能继续扩展它们。你可能还会遇到Mag7,Capo X部署的大小,他们的CFO开始以更高的水平进行讨论。是的,当然。完全正确。完全正确。
现在《信息》杂志上有一篇非常有趣的文章,它今天刚刚发表,萨姆·奥特曼正在质疑微软是否愿意投入资金并构建集群。这可能是由埃隆的评论和埃隆在X.A.A.的意愿引发的。
关于模型规模,我要说的是,我们将进入一个非常有趣的领域,显然我们可以拥有越来越大的训练集群。这自然会使模型越来越大。但是你不能做的是,你不能使用单个模型。你可以在分布式站点上训练模型,这可能只需要多花一个月的时间,因为你必须移动流量。因此,它不是需要三个月,而是需要四个月。
但是你不能真正地在分布式站点上运行模型,因为推理就像实时的事情。所以我们确实,你知道,我们没有在那里推动它。但是当你开始获得在单个位置运行起来太大的模型时,这可能是一个我们需要注意的问题,我们也应该记住。
关于通过扩展来实现智能的问题,今天我在与诺姆·布朗的炉边谈话中问了他一个问题,他非常清楚地表达了他的观点,尽管他正在研究推理时间推理,这是一个完全不同的向量和OpenAI的一个突破性向量,我们应该花一些时间来讨论。他说,现在有两个向量,
对。再次,就通往AGI的路径而言,它们是乘法的。他说,不要对此有任何疑问。就像,我们仍然看到扩展更大模型的巨大优势。对。我们有数据。我们有合成数据。你知道,我们将构建这些更大的模型,并且我们有一个经济引擎。
可以资助它,对吧?不要忘记这家公司,你知道,营收超过40亿美元,可能大多数人认为在未来一年内营收将增长到100亿美元以上,他们刚刚筹集了65亿美元。他们从花旗集团获得了40亿美元的信贷额度。所以对于独立参与者比尔来说,
对。就像微软可以选择是否要资助它。但我认为这并不是他们是否会获得资金的问题。在这一点上,他们已经达到了逃逸速度。我认为对于许多其他独立参与者来说,一个真正的问题是他们是否有经济模式来继续资助这项活动。因此他们必须找到一个替代方案,因为我认为很多风险投资家不会再开出数十亿美元的支票了。
对于那些尚未抓住闪电瓶的参与者。这将是我的猜测。我的意思是,你知道,我只是认为这很难。你知道,听着,归根结底,我们是经济动物。我以前说过,
如果你看看远期市盈率,我们大多数人都对OpenAI的估值是15倍的远期收益。如果ChatGPT没有做它正在做的事情,如果收入没有做它正在做的事情,这将对公司造成巨大的稀释。筹集资金将非常困难。我认为如果Mistral或所有这些其他公司想要筹集资金,我认为这将非常困难。但是仍然有很多钱,所以这是可能的。你说的是15倍的收益。我认为你的意思是收入。
或者15倍的收入,当然。我说,你知道,当谷歌上市时,大约是13或14倍的收入,Meta也是13或14倍的收入。所以我确实认为我们正处于新进入者大量整合的边缘。我认为关于X如此有趣的是
当我向他施压关于这种模型整合时,向詹森施压时,他说,听着,有了埃隆,你就有了一个有抱负、有能力、有专长、有钱的人,对吧?有品牌,有业务,对吧?
所以,我认为很多时候,当我们今天谈论人工智能时,我们经常谈论OpenAI,但是很多人很快就会谈到所有其他模型公司。我认为X经常被排除在谈话之外。而我从与詹森的这次谈话中得到的一点是,再次,如果
如果扩展这些数据中心是赢得人工智能的关键竞争优势,对吧?就像你绝对不能在这个战斗中排除X.AI。他们当然必须弄清楚一些与消费者相关的东西,这将拥有像ChatGPT这样的飞轮,或者与企业相关的东西。但在启动、构建模型、拥有计算能力方面,我认为他们将成为游戏中三到四个参与者之一。
你提到了可能想要结束草莓状模型。我们没有接触到的一件事,但我们可以猜测,那就是成本。
当他们发布Strawberry时,他们展示的图表,x轴是对数的。因此,使用新的预览模型进行搜索的成本可能是他们进行普通ChatGPT搜索成本的20倍或30倍。我认为这是几分钱。对。
但是要弄清楚哪一个,而且它也需要更长的时间。因此,弄清楚哪些问题是可以接受的。詹森举了一些例子,说明花费更多时间和成本以及获得这种结果的成本效益是我们将不得不弄清楚的事情。例如,哪些问题倾向于此。
地方。对。而且,你知道,我在这里感觉良好的一点是,再次,我是在推测,我没有OpenAI在这方面的信息,但我们知道的是,去年推理成本下降了90%。我们,你知道,桑尼告诉我们和其他领域的人告诉我们,在接下来的几个月里,推理成本将再下降90%。如果你正在进行对数需求的竞赛,你需要发生这种情况。
对。而且我认为还会发生这种情况,比尔,在这个推理链中,你将把智能融入推理链中,对吧?这样你就可以优化发送这些推理交互的位置。你将批量处理它们。你将花费更多时间,因为这只是一个时间与金钱的权衡。
对。归根结底,我还认为,我们正处于如何考虑对这些模型定价的最早阶段。对。所以如果我们从系统的角度来考虑这个问题,系统一级的思考。对。系统一是指,你知道,法国的首都是什么。对。你将能够以几分钱的价格使用ChatGPT上相当简单的模型来做到这一点。
当你想要做更复杂的事情时,如果你是科学家,并且想使用O1作为你的研究伙伴,你最终可能会按小时付费。相对于实际研究伙伴的成本,它可能非常便宜。所以我认为会有这种消费模式。我认为我们甚至还没有触及如何定价的表面。但我完全同意你的观点,它的定价将大相径庭。再次,我认为OpenAI……
建议今年甚至可能会发布完整的O1模型。我正在等待看到的一件事是,我认为,听着,认识诺姆·布朗已经有一段时间了,他是一个N=1。
对。而且他肯定不是OpenAI唯一一个从事这项工作的人。但是,你知道,听着,无论是Pluribus还是赢得外交游戏,他已经思考这个问题十年了。对。这是他在如何赢得六人扑克游戏方面的重大突破。
所以他把这个带到了OpenAI。我认为他们在这里确实领先,这让我回到了这个问题,比尔,你和我一直在谈论的问题,那就是记忆和行动,对吧?所以我必须告诉你我们在投资者日发生的一件有趣的事情。
所以我让尼克什上台,你知道,尼克什显然在谷歌工作了十年。所以我想要和他谈谈消费者人工智能和企业人工智能。我问他,我说,我想和你打个赌。我当然知道他会接受赌注。我说,我想和你打个赌,我将赌注设定为两年。
直到我们拥有一个具有记忆并能够采取行动的代理。当然,我使用的典型用例是我可以告诉我的代理,在纽约的默瑟酒店为我预订下周二的房间,价格最低。我说,超过还是低于两年才能完成,我说,我从5000美元开始,我押低于两年。他立刻接受了我的赌注。他说,但我只接受如果你把赌注提高10倍。
当然,我们是为了一个好事业而做这件事。所以我不得不打电话给他,因为我不能不为一个好事业挺身而出。所以我们对这笔交易持相反的立场。现在,有趣的是,在接下来的几天里,我问了一些其他上台的朋友,他们会在同样的赌注上做出什么选择。我们的朋友斯坦利·唐押低于两年。
一位来自苹果的朋友,名字暂且不提,有点押高于两年。然后是诺姆·布朗,他也在那里,行使了沉默权。他说,我知道答案,所以我不能说。
所以,是的,这有点具有挑衅性。我给尼克什发短信说,我认为你最好准备好你的支票簿。所以回到这一点,比尔,Strawberry01是一个令人难以置信的突破,它想到了这个全新的智能向量。但这让我们忘记了你和我非常关注的事情,那就是记忆和行动。我认为我们正处于真正的边缘
不仅这些模型可以思考,你知道,可以花更多时间思考,不仅它们可以减少幻觉,你知道,以及扩展计算,而且我认为……
我的意思是,你今天已经看到了这一点的雏形。我的意思是,今天使用这些东西。他们已经记住了很多东西。所以我认为他们正在将其融入体验中。但我认为我们将能够采取简单的行动。我认为人们头脑中存在的这种隐喻是,他们将不得不为每个人构建深层API和深度集成,这是
我认为不会这样发展的。让我再说一下……你认为会如何发展?好吧,我的意思是,我认为上周被泄露的彩蛋是他们在其语音API上举办了这个活动,对吧?它实际上是你的GPT在电话上给人类打电话并下订单。那么,为什么我的GPT不能打电话给默瑟酒店说,布拉德·格斯特纳想预订一个房间。这是他的信用卡号码,并传递信息。对。
这是有原因的。我的意思是,听着,抓取工具和表单填充工具存在了多久,桑尼?15年?15年前你就可以编写一个代理来填写并在默瑟酒店预订房间。这没有什么不可能的。这是极端情况和幻觉,当你的信用卡被收取1万美元时。你不能有失败。
以及你如何设计它,以避免失败并建立信任。我相信你明天可以演示这个。我毫不怀疑你明天可以演示它。你能以一种可信赖的方式大规模提供它,让人们将信用卡分配给它吗?这可能需要更长的时间。- 好的,比尔,两年内超过还是低于两年。
我的意思是,无论如何我都会让你采取行动。但是测试是什么?演示?我认为你今天就可以做到。不,不是你刚才说的那种俗套的演示。我说的是一个允许我大规模预订酒店的版本。它会使用你的信用卡吗?不仅仅是你,而是每个人完整版本?是的,我们称之为完整版本,因为我知道这是我唯一能够诱使你接受赌注的方式。今天是2024年10月8日。是的。
桑尼,你已经知道他会说什么了。你会押高于两年,对吧,比尔?是的,是的。好的,所以比尔押高于两年。桑尼,你认为怎么样?两年内超过还是低于两年?不,别开始回避,比尔。别开始回避。继续,桑尼。我已经说过了。今天演示。15年前就是这样。让我评论一下你担心的问题,比尔,我认为人们仍在努力解决这个问题。你现在不需要一个单一的代理来预订默瑟酒店并处理你正在谈论的所有抓取内容。
你可以有一千个代理一起工作。你可以有一个确保信用卡收费不过高的代理。你可以让另一个确保地址正确的代理。你可以让另一个检查你的日历的代理。所以所有这些都是免费的。所以我押低于两年,布拉德,我甚至押低于一年。
哇。哇。哇。所以我和你,桑尼,有一点额外的赌注。我不会押低于一年,但我认为我们可以在一年内发布有限的版本。但是桑尼,我和你与比尔现在有了赌注。你想要什么,比尔?一千美元?
为了一个好事业?好的,每人1000美元捐给一个好事业。而且我会假设,桑尼,我们也会从尼克什那里得到行动。而且你知道我们的朋友斯坦利·唐肯定会在场支持一些。所以我们将把一些钱捐给一个好事业。听着,我认为这是万亿美元的问题。我知道我们都专注于扩展模型,我知道我们都专注于计算层,但真正改变人们生活的是什么——
什么真正地扰乱了10个蓝色链接,对吧?什么真正地扰乱了整个应用程序生态系统的架构,对吧?那就是当我们拥有一个我们可以与之交互的智能助手时,它会随着时间的推移变得更聪明,它具有记忆并且可以采取行动。当我看到先进的语音模式的组合时,
语音到语音API,Strawberry 01,思考与扩展智能相结合。我只是认为这将比我们大多数人想象的要快得多。现在,听着,他们可能会拉住缰绳,对吧?他们可能会为了很多商业原因而放慢发布进度。这更难以预测。但我认为这项技术,我的意思是,即使诺姆也说,我认为我们需要更长的时间才能看到我们已经看到的结果。
我能再谈一件事吗?这是,你知道,我们开始播客时稍微谈到了这一点。比尔,我只想听听你的印象。
詹森可以通过将员工人数增加20%或25%来将业务规模扩大两到三倍的想法,对吧?我们知道Meta在过去两年中已经做到了这一点。你和我谈过,我们是否正处于前所未有的巨大生产力繁荣和巨大利润率扩张的边缘,对吧?尼克什说,我们应该能够从每个业务人员那里获得20%或30%的生产力提升。
首先,我认为英伟达是一家非常特殊的公司。即使它是一家系统公司,它也是一家知识产权公司。需求增长如此之快,他们不需要更多设计师或更多开发工程师来创建系统。
自行发生的增量收入。因此,他们的营业利润率处于创纪录水平。对于大多数公司来说,我一直都坚信这一点,那就是你随着你的工具而发展,而真正的
真正的答案是,不部署这些东西的公司将倒闭。是的。所以我认为利润率在很多情况下都会被竞争吞噬。我认为想象一下,哦,每家公司的营业利润率都达到60%,这太荒谬了。不,不,不,不。我的意思是,听着,达美航空公司将利用人工智能做所有这些事情,而且会立即这样做,因为它处于商品市场,它会被西南航空和联合航空公司竞争掉。糟糕的行业仍然是糟糕的行业。
是的。是的。是的。所以,所以,但是,但是可能有一些,你知道,那些,那些弄清楚了。而且,我还有另一个理论,呃,
我一直牢记在心,那就是超高速增长往往会延迟你在微观经济学课上学到的东西。我记得当我还是一名PC分析师时,有五家上市的PC公司都在以100%的速度增长。所以在超高速增长的时刻,你将拥有可能或不可能持续的利润率。在超高速增长时期,你将拥有可能或不可能持续的市场参与者。
我脑子里还有两件事,桑尼。你对那有什么反应吗?我的意思是,我必须谈谈其中几个话题。不,就像你已经成为Lex Freeman链接播客一样。不,我看看。
我确实,你知道,一直在思考詹森在播客中关于他们内部使用多少人工智能进行设计、设计验证以及所有这些部分的观点,对吧?我认为,你知道,这并非30%。实际上我认为这是一种低估。我认为你谈论的是生产力提升的数百个百分点。唯一的问题是,并非每家公司都能如此迅速地掌握这一点,对吧?
所以,你知道,我认为当他发表那番评论时,他隐瞒了一些信息。这真的让我开始思考,他们在那里做了多少我们不知道的事情?
你现在可以在模型开发中看到这一点,因为他们,你知道,如果你注意到过去几周,他们已经发布了一些模型,这些模型是用他们自己的模型训练的,而且它们不像Meta和其他参与者的模型那样产生那么多噪音。但他们做的远比我们想象的要多,我认为他们已经掌握了许多非常非常困难的问题。布拉德,他们为什么要发布自己的模型?
好吧,这与开放与封闭这个话题有关。所以比尔,我希望你为我感到骄傲。我回过头来说,我必须问这个问题。我用谷歌搜索了。对。我认为詹森,我认为他给出了一个很好的答案,那就是,听着,我们将有一些公司出于经济原因,对吧,推动AGI或他们正在做的任何事情的界限。拥有一个可以成为最好的并且可以获利的封闭模型是有意义的。对。
但世界的发展不会仅仅依靠封闭模型。我们会,你知道,他就像,它是开放的和封闭的。
而且,你知道,他说,因为开放,他就像,这是绝对必要的条件。它将成为业界绝大多数的模型。他现在说,如果我们没有开源,你怎么能让科学领域的所有这些不同领域都能在人工智能上被激活呢?他谈到了Llama模型爆炸式增长。然后关于他自己的开源模型,我认为这非常有趣,他说,我们专注于人工智能。
一些特定的能力,而我们专注的能力是如何代理地使用这个模型来使你的模型更智能、更快。对。所以它几乎就像是他构建的一个训练指导模型。所以我认为对他们来说,这完全说得通,为什么他们可能会。
你知道,把它放到世界上。但是我也,你知道,很多时候开放与封闭的争论,你知道,会被劫持到关于安全性的对话中。而且,你知道,我认为他说,你知道,听着,这两件事是相关的,但它们不是一回事。
他评论的一件事是,他说,在安全级别上有很多协调工作正在进行。我们有这么多的参与者和这么多的活动正在进行,以确保,看看Meta在这方面做了什么。他就像,我认为这是被低估的一件事,即使没有任何柏拉图式的监护人式的监管,
没有任何自上而下的监管,你已经有了所有这些公司投入到人工智能安全中的大量努力,我认为这是一个非常重要的评论。感谢你们的参与,一起讨论这个话题。这是一个特别的……恭喜你们有机会。这非常独特。
现在我们打了个小赌。所以,我的意思是,听着,我非常期待在Mercer的播客上进行现场预订。对。然后,Sonny,我们可以从天上掉钱。我们可以收集。我们可以收集。没错。没错。很高兴见到你们。我们很快会再聊。好的。再见。提醒大家一下,这只是我们的观点,不是投资建议。