We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

The End of DeepSeek Week: Moneyball for AI, The Future of Compute Demand, Geopolitical Reality Checks, and More

2025/1/30

Sharp Tech with Ben Thompson

AI Deep Dive Transcript

People

Andrew Sharp

Ben Thompson

创立并运营订阅式新闻稿《Stratechery》，专注于技术行业的商业和策略分析。

Michael

帮助医生和高收入专业人士管理财务的金融教育者和播客主持人。

William

一位在UCSF从事生物化学和分子生物学研究的科学家。

Topics

Andrew Sharp: 我认为 DeepSeek 的策略类似于棒球中的“钱球”策略,通过高效的策略取得成功,而大型科技公司则拥有更多资源。这引发了人们对未来大型科技公司利用 DeepSeek 的高效策略以及更多资源后会发生什么的疑问。我们还需要思考,资源更丰富的公司是否能够添加更多 AI 支持的强化学习层,这虽然需要更多资源,但最终可能会产生更好的模型。 DeepSeek 的成功并非意味着计算能力不再重要,而是说明了高效利用计算资源的重要性。模型蒸馏是不可避免的,就像过去的盗版行为一样难以阻止。关于 DeepSeek 的讨论中,多种观点可以同时成立。DeepSeek 的成功并非世界末日,而是推动了竞争。DeepSeek 的成功可能会增强中国 AI 生态系统。我认为 DeepSeek 的高效性与 90 年代末到 2010 年代初电子游戏行业的类似,都实现了在低端硬件上取得高性能输出。DeepSeek 的高效性与游戏主机开发的策略类似,都是通过对硬件的极致优化来实现高性能输出。长期以来忽视软件优化是合理的,但现在需要重新重视优化。谷歌通过优化基础设施降低了成本,并获得了成功。工程师需要培养优化能力。谷歌在基础设施和优化方面仍然处于领先地位。 Ben Thompson: 我认为 DeepSeek 的策略类似于棒球中的“钱球”策略,通过高效的策略取得成功,而大型科技公司则拥有更多资源。这引发了人们对未来大型科技公司利用 DeepSeek 的高效策略以及更多资源后会发生什么的疑问。 DeepSeek 的成果并非阴谋,其公开分享反而证明了其真实性。DeepSeek 成本的报道被夸大了,人们更愿意相信一个更吸引人的故事。模型蒸馏是现实,它既不是好事也不是坏事,而是为了经济上的可行性。关于 DeepSeek 的讨论中,多种观点可以同时成立。DeepSeek 的成功并非世界末日,而是推动了竞争。DeepSeek 的成功可能会增强中国 AI 生态系统。我认为 DeepSeek 的高效性与 90 年代末到 2010 年代初电子游戏行业的类似,都实现了在低端硬件上取得高性能输出。DeepSeek 的高效性与游戏主机开发的策略类似,都是通过对硬件的极致优化来实现高性能输出。长期以来忽视软件优化是合理的,但现在需要重新重视优化。谷歌通过优化基础设施降低了成本,并获得了成功。工程师需要培养优化能力。谷歌在基础设施和优化方面仍然处于领先地位。硅谷的创新管道正在放缓,原因可能是多方面的。大型创新需要时间才能转化为产品,这与互联网和个人电脑的发展历程类似。大型创新需要时间才能转化为产品,这与互联网和个人电脑的发展历程类似。人们正在等待更易于使用的 LLM 产品。OpenAI 的“开放”定义随着时间的推移而改变。人们应该更多地关注谷歌在 AI 领域的进展,而不是仅仅关注 OpenAI 和 Anthropic。OpenAI 推迟发布 GPT-2 是为了评估其潜在风险。DeepSeek 公开模型权重是合理的商业策略。DeepSeek 公开模型权重对中国 AI 行业有益。对 AI 安全性的讨论存在误导性。对 OpenAI 的组织结构表示担忧。更多 AI 而不是更少 AI 是应对 AI 风险的最佳方法。微软和 OpenAI 之间的合作关系有所缓和。对 OpenAI 的投资是一种高风险高回报的赌博。

Deep Dive

Shownotes Transcript

您好,欢迎收听另一期《Sharp Tech》播客。我是Andrew Sharp,另一位是Ben Thompson。Ben,你好吗?我很好,Andrew。你呢?我很好。蛇年快乐。那边是新年。你是蛇年出生吗?

我不是很喜欢蛇。不太喜欢。我很高兴我出生在猴年。很棒的动物。你知道,你总能在各种小事中找到你的福气。愿上帝保佑1980年。就是这样。你知道,那是一个考验,你通过了。我不是蛇年出生的人。所以我们可以继续这个播客再200集。

期待着。我也是猴年出生。我小时候有个毛绒猴子。一直对猴子情有独钟。无论如何,关于节目......

我们本周星期天晚上在美国录制了第一集,大约在华尔街真正疯狂的星期一早上11个小时之前。在接下来的几天里,你多次写到了DeepSeek。我们收到了大量关于DeepSeek的精彩邮件。所以本集的计划是四处跳跃,尽可能多地涵盖一些内容。你觉得怎么样?

是的,我会尽量简短扼要地发表评论,以便我们能看完所有邮件。这始终是一个挑战。设定目标是好的。Billy问,DeepSeek就像奥克兰运动家队一样,创造了新的高效战术,而业界其他公司现在将这些战术视为标准,这种说法有道理吗?

如果是这样的话,当美国科技公司利用这些战术,拥有无限多的资源,就像红袜队在那个Moneyball运动家队之后的十年里所做的那样,会发生什么?我们是否知道,资金更雄厚的公司能否添加基于AI的强化学习层,这需要更多资源,但最终会产生更好的模型?你怎么看,Ben?评价一下Billy的类比。

我喜欢这个类比。很好。是的,反应中肯定有些言过其实的部分是,DeepSeek是否希望拥有更多计算能力?是的。他们在某些方面拥有更多计算能力吗?是的。比如,这种认为计算能力不再有价值的想法是荒谬的。我认为,你知道,我认为有一些合理的问题。你提到了华尔街的角度,但是,

每个说,为什么这些股票下跌?人工智能将接管一切。计算能力将填满所有可用空间的人都是正确的。股票的挑战在于可能存在时间问题。那么,所有这些计算能力会在什么时候被吸收?这是否会延长时间线?这是否会改变推理的重要性?诸如此类的问题。华尔街发生的事情总是很难说。有合理的理由相信

同时相信这个类比是好的,更多的计算能力是有用的。然而,也有一些价格可能下跌的原因,以及为什么有些价格上涨,特别是那些为所有这些买单的公司。对。所以,是的,这种想法,是的,然后波士顿红袜队采用了运动家的理念,并将其与巨额薪水相结合。这是一个,

这是一个很好的类比。就像,这就是为什么最终我反复强调,这是一个巨大的礼物,给美国和整个行业,揭示了这些优化方法和更高效的方法,因为最终它将使每个人受益。坦率地说,

我仍然对这种说法持相当怀疑的态度,这都是,这是,你知道,这是一个谎言。这完全是为了打压大型科技公司,所谓的“聪明”做法。如果你的首要关注点是地缘政治问题,那么最好的做法是根本不披露这一点。只是,你知道,让这种知识保密。而事实上它被分享了,我认为实际上支持了细节大致正确的观点。再说一次,

当我们谈论所涉及的资金时,那是针对一次训练运行,而不是所有实验,也不是所有数据收集,也不是所有研发,这再次说明,这篇论文非常清楚地说明了资金的用途。它经过了这个过滤器,这个在线的电话游戏,你知道,它,它变得非常有趣。而且,而且,

我认为这是因为人们想相信这个故事。这是一个引人注目的论点,反驳了,你知道,一周前,Sam Altman宣布我们需要5000亿美元用于Stargate。所以,某些人只是拿了600万美元的数字就跑掉了,这并不让我感到惊讶。它失控了,变成了它原本不是的样子。

对。当然。而且,你知道,Anthropic的首席执行官Dario Amodei,我知道我们会谈到这一点,但他确实提到了,你看,这与我们过去一年看到的成本降低大体一致。它的能力与我们一年前所做的类似。当然,他说这话是为了自己的利益,并以此为论据,但是......

我也认为这是合理的。关于,你知道,他们窃取了我们的数据,指的是蒸馏,我们在过去的几期播客中讨论过。那是,是的,确实发生了。我可以问一下,有没有办法防止未来的蒸馏?这些公司中是否有任何公司对此行为有任何防御措施?没有。我的意思是,这就像,我的意思是,他们努力阻止。

大规模的API访问。你可以对它设置速率限制,但是,你知道,最终,你试图阻止。这就像当年试图阻止盗版一样。就像你处理的是数字位,输入和输出。那是,那是,你知道,我听说过关于中国或其他地方的人为了尝试蒸馏这些模型而做的一些疯狂的事情的传闻,即使他们受到速率限制或他们的API访问被阻止等等,包括,你知道,就像我在我的,在我的文章中提到的那样,比如,你知道,

非常奇特的事情,只是用聊天客户端和编写脚本,试图,你知道,得到,得到所有答案。而且它有效。就像我说的那样,它对内部有益。就像,

就像OpenAI不会向用户提供原始的第一次运行模型来访问。这在经济上是不可行的。ChatGPT发布后的一件大事是,他们被需求淹没了,他们被成本压垮了,因为他们只是提供整个模型。这实际上是大量蒸馏突破发生的地方,因为

正是出于绝望和需要,我们如何才能以经济的方式为数亿人提供服务。所以蒸馏,这只是生活中的一个事实。它不是一件好事也不是一件坏事。但是我的观点是,人们会说,哦,他们声称是蒸馏。这是推脱责任。不,这是真的。我认为我一直很一致。美国实验室

对。

是真的,但它们是效率上的突破,而不是能力上的突破。所以这里有一点,各方都在,你知道,为自己的利益辩护,但这并不意味着他们错了。

是的,很多事情可以同时为真。我的意思是,就元对话而言,我认为DeepSeek是一家中国公司的事实让很多人头脑发热,并将反应推向了疯狂的境地。我和Bill Bishop之前开玩笑过,因为我们本周推迟了一天录制《Sharp China》。

就像每当中国在技术方面取得重大突破时,就会出现这种情况,你有一批人基本上,他们会花几天时间解释为什么这项进展无关紧要。这是补贴。这是知识产权盗窃。或者在这种情况下,这是蒸馏。这一切都不重要。然后在光谱的另一端,你有一些人将这一突破视为,例如,

美国即将衰落和世界秩序变化的证据。所以真相通常介于两者之间。我认为在这件事上,真相也在中间。现实情况是,DeepSeek资金非常雄厚,而不是某个600万美元的次要任务。他们使用了大量的美国硬件,包括英伟达芯片。他们蒸馏了OpenAI的模型来开发V3和R1。

他们引入了一些非常酷的创新,这将迫使竞争对手变得更好更聪明。这不是世界末日的情况。我想知道如果Mistral做了这件事,这是否会被视为一个非常有趣的故事转折,而不是本周头几天全球最大的新闻之一?

我认为你是对的。因为,你知道,在,我不想过多地谈论中国方面的事情。我不是中国人。我,就像我那样,我认为这可能会让中国生态系统非常强大,这是我的猜测。但从美国方面来看,我认为确实存在一种真实的,

触及了一种真实存在的焦虑,即中国在所有这些领域都在压制我们,我们唯一拥有的就是技术,哦,我的上帝,我们也在失去它,这......作为一个美国人,我对此还可以接受,一点紧迫感可能是有益的。没错,没错,确实如此。好吧,还有一个类比,Mike说

DeepSeek展现出的令人难以置信的效率让我想起了另一个时代,在劣质硬件上取得令人印象深刻的成果,即90年代末到2010年代初的游戏场景。

像Xbox、PS2、PS3等游戏机通常采用与中端游戏PC大致相同的硬件推出,但它们会在市场上停留5到6年,这意味着在其生命周期中期到后期,相对于新的游戏PC而言,硬件将非常过时。

也就是说,像《神秘海域》、《战争机器》和《GT赛车》这样的游戏将独家发布到游戏机上,其图形效果优于当时在功能强大的PC上推出的任何游戏。这是因为游戏机开发人员在“精益求精”,从硬件中榨取每一丝性能,包括通常的英伟达GPU,最大限度地利用其静态约束,就像DeepSeek团队一样。

另一方面,PC开发人员必须针对各种不同的PC配置进行编码,不同的CPU、RAM容量、不同的GPU,具体取决于PC。这意味着他们无法接近游戏机开发人员的优化水平。正如他们所说,历史不会重演,但它会押韵。再次感谢您所做的一切。指挥官们加油。未来是光明的。坚持下去,Andrew。是的。

谢谢你,Mike。我不是游戏玩家也不是游戏史学家。我将把这个问题留给你。评价一下类比的第二部分。我认为这是一个可靠的类比。我的意思是,它并不完美,有很多原因可以挑剔。但事实是,你可以在旧硬件上获得这种令人难以置信的输出,使用游戏机。PC玩家可能会对此感到恼火。这是可能的,是的。是的,多年来发生变化的一件事是......

游戏机变得越来越像PC,并且使用游戏引擎的方法更加标准化,而不是针对特定游戏机进行精益求精。部分原因只是一个经济问题。当资产创建成本开始超过引擎开发成本时,过去你把所有时间都花在构建引擎上。当你构建引擎时,这就像精益求精一样。是的。

然后意识到,实际上,不,如果我们要在这个游戏中赚钱,它必须在任何地方都能运行,这样我们才能将其卖给最多的人。所有的一切都被抽象掉了。我认为这种情况大体上一直如此。对于基本上每款游戏,你都将在PC上获得最佳图形体验。这种情况已经持续了一段时间了。但那是PS4、Xbox 3或任何Xbox One的部分。那是真正发生转变的一代。我们过去也讨论过。

索尼领先于此。他们部分看到了这一点,因为开发人员越来越不愿意为PS3进行精益求精,而PS3实际上很难开发。他们开始只为Xbox编写代码,然后移植到PS3。他们说,糟糕,我们,多年来,

人们会专门为PS2编写代码,或者在之前的PlayStation上编写代码。现在他们正在采用这种新方法。如果我们想要差异化,我们需要收购所有这些工作室,获得独家授权,然后人们购买我们的整个产品。所以它实际上与我们之前讨论过的话题有关。同样,它不是一个完美的类比,原因有很多,但是约束驱动巨大创新的想法,就效率而言,

以及诸如此类的事情绝对是事实。顺便说一句,他们说,我没有完全展开这一点,但是如果你计算他们拥有的计算量,他们的模型效率非常高,这要归功于他们的混合专家方法,尤其是在训练方面。一个重要的创新是,人们认为混合专家使得训练更加复杂和困难,效率也更低,但是你在训练中获得了效率。推理方面,他们提出了一种新的方法,特别是确保每个专家都得到充分的训练,并将这种计数包含在专家的偏差因子中,而不是试图在高端计算所有这些,这实际上使他们在训练中获得了更高的效率。他们仍然有额外的计算能力,对吧?

相对于他们需要的计算能力而言。这包括他们手工编程一些计算单元以更有效地管理通信。这太疯狂了。削弱,就像削弱一样有效。它真的做到了。是的,

这是一个证明。这部分是整个讨论的一部分,对吧?我们可以谈论蒸馏。我们可以谈论这样一个事实,即他们仍然,如果不是落后几年,而是落后几个月,这绝对不应该贬低。这是一项令人难以置信的工程工作。就像,它,它,它真的令人惊叹,他们,他们做了什么。而且,呃,而且,

这对每个人来说都是一种恩赐,他们发布了它并使其广泛可用。确实。好的。那么,关于工程工作,Adam说,我非常喜欢本周关于DeepSeek的讨论。当我和一位IT领域的伙伴讨论这个问题时,我被提醒,发生的事情完全符合大型科技公司已有的实践和理念。Ben多次提到,由于计算能力的不断进步,优化工作几乎从未值得

去做,为什么花宝贵的时间让某些东西运行得更好,而明年的芯片就能让它运行得足够好,而优化的机会成本是更多的功能,我的伙伴将此与我们现在拥有的臃肿的操作系统和我们拥有的低效应用程序进行了比较,拥有完全一流的硬件,但主观的用户体验通常并不比早期的PC更具响应性

我开始怀疑效率的恶果是否正在显现。几十年的计算能力飙升是否导致了一种软件开发文化,在这种文化中,优化没有得到足够的重视?是的,这是一个非常好的观点。我看到其他一些人也提到了这一点,并且

让我注意到我提出了这个优化点。我认为它在我与微软的Kevin Scott进行的一次采访中最具体地得到了体现。他提出了这个观点,但我大体上同意他的观点。是的,我认为有两点。第一,我认为有一点是比较优势问题。你应该始终选择你的比较优势,但问题是,这其中有一个时间因素,还有一个学习曲线被放弃了,

只有,你知道,我们正在美国和中国看到这一点,就像美国无法在当时做出的理性决策的下游构建东西一样,这些决策会累积起来,导致巨大的差异,最终成为一个问题。具体来说,在这种情况下,我认为正在显现的是,它不是。

我们,它不是说花1亿美元或任何金额来构建未来的模型是不合逻辑的。如果你真的相信人工智能将产生这种天文数字的经济影响,那么问题是,在哪个美元数字上,呃,

它让你觉得我们错过了机会,对吧?我认为我在本周的更新中提到了这一点,谷歌同时构建了他们的基础设施来开发他们的产品,并彻底改变了整个服务器领域,该领域曾经由Sun主导的定制机器所主导。他们所做的是,他们基本上说,不,我们将使用x86消费级硬件运行。现在,随着时间的推移,

英特尔对这一机遇做出了回应,并制造了服务器级X86,但仍然比之前的产品便宜得多。我们将假设它会崩溃。我们将构建具有弹性的系统,并处理一直发生故障的情况。它实际上会更便宜,更具可扩展性。这是他们成功的基础,对吧?

所以我认为这里可能有一点,我们可能在“不要担心优化”方面走得太远了。可能应该有更多的双轨制,一个团队不担心优化,另一个团队只考虑优化。是的。这可能是一个错误,但我完全拥有,

我本周之前从未说过这种批评。如果有什么不同的话,我说的是相反的。这是一个非常好的观点。那么,关于未来的挑战,你是说这是一个需要随着时间的推移在今天的工程师中培养的肌肉群吗?你能只翻动开关吗?这就是为什么我喜欢......

再说一次,我对谷歌的态度总是摇摆不定。我总是无法决定。我通常会走错方向。所以总是要带着怀疑的眼光看待我对谷歌的分析。但是这个......我去年写了一篇关于Gemini 1.5和谷歌本质的文章。我当时谈论的是百万个token的上下文窗口。而且......

几乎可以肯定的是,其工作方式的一个方面是谷歌基础设施及其优化和组织方式的下游结果。他们从头开始设计他们的系统以适应他们的软件。他们以可扩展的方式做到这一点。谷歌在这方面仍然是最好的。他们拥有最好的......

数据中心。他们拥有最好的基础设施。他们有自己的芯片。如果有什么不同的话,这是谷歌仍然表现最好的部分。它仍在运行。是的。所以,如果你想成为谷歌的乐观主义者,我会把这一点列在名单上,那就是,最终,当涉及到服务世界时,

谷歌仍然是最好的。他们可以以最经济的方式做到这一点。他们可以压低任何人的价格,特别是如果模型是商品的话。再说一次,我对谷歌的担忧是,如果他们真的擅长这一点,那么受损的主要实体是谷歌搜索。但是,撇开这一点不谈,经典的颠覆性问题是。

从基础设施的角度来看,他们仍然是最好的。在某种程度上,这很重要,这对他们来说是件好事。好的。那么,关于所有这些,从文化的角度来看,Dan问道,Andrew和Ben,在星期一的播客中,Ben讨论了DeepSeek可能对LLM产品积压意味着什么。换句话说,如果LLM的进展今天停止,我们最终应该看到的所有产品。好的。

这让我想起了他2024年6月与Nat Friedman和Daniel Gross进行的一次讨论,特别是Daniel的这段话:“显然,希望会有更好的突破,模型将变得更容易使用。但你也可以利用今天的模型创造出很棒的东西。顺便说一句,为什么这还没有发生,尽管这个播客尽了最大努力,我认为这是一个非常深刻而有趣的问题。”

硅谷总体上发生了什么?从研究突破到iPhone的创新渠道是否正在减弱?我不知道。所以我想我的问题是,Dan的问题与Daniel的问题相同,硅谷的创新渠道发生了什么?为什么我们看不到很棒的东西?这仅仅是因为LLM是一项如此巨大的创新,正如Ben之前所推测的那样,需要时间才能实现产品化吗?还是还有更多原因?文化、技术、

大型科技公司的主导地位、潜在客户的惰性。似乎这个主题现在已经出现过好几次了。在某些时候,我们需要问一下,到底是技术出了问题,还是那些应该利用它来创造东西的人出了问题。

Ben,你有什么想法吗?我的意思是,我认为这有点像以上所有情况的综合,但以上所有情况都归结于这样一个事实,即历史上这些事情需要时间,对吧?互联网,万维网是在90年代初期,你经历了互联网繁荣时期。其中大多数公司都没有成功。然后突然之间,它成功了。PC也是如此。这需要的时间比你想象的要长。我,我,

再说一次,为什么是因为文化?是因为客户的惰性?是因为所有这些点点滴滴?是的。是因为所有这些原因。而且,而且,但也要明确一点,时间还不长。它只是,它只是,它只是,Transformer是在2017年。所以已经有一段时间了,但这也能说明问题。Transformer是在2017年发明的,它们,

人们花了一段时间才开始使用它们。所以你有了GPT-2,你有了GPT-3,当我们开始与Nat和Daniels一起录制那个播客系列时,当GPT-3发布时,那是在ChatGPT之前。

我们说,没有人围绕它构建产品。这实际上太棒了。然后ChatGPT出现了。就像,哦,我的天哪,这是给每个人的一个警钟。但正如你所说,那只是两年多以前的事了,2022年11月。是的,

技术的历史就是,你可以拥有巨大的突破,它们就摆在那里,而且它们实际上不仅可以摆在那里,就像Transformer一样。它们可以,像ChatGPT一样,让每个人都清醒过来,开始争先恐后,但它仍然需要时间。如果有什么不同的话,变化越大,转型越大,它实际上需要的时间就越长。这是一个——如果你想这样称呼它的话,这是一个有点令人不满意的说法。但是关于人性和人类的许多事情都是令人不满意的借口。我们可以做的是,看看历史上,这需要时间来弄清楚。很多最初的事情是你只是采用旧的范式,加上人工智能,看看是否有效。实际上,再说一次,我最喜欢的类比是,你可以在互联网上的文本旁边放置广告,就像报纸一样,但是

那并没有赚钱。你必须想出一个信息流。那是真正赚钱的东西。Facebook在2006年发明了信息流,也就是在万维网发明后的13年后。所以这些事情,它只是需要时间。现在,关于硅谷的创新能力以及所有这些点点滴滴的问题吗?当然。总是有的。但是,但是我认为,

这实际上是更广泛批评的一部分。是的,我的意思是,这令人不满意,因为对硅谷混乱的文化和所有这些公司中普遍存在的自满情绪有一个看法会更令人满意。

我认为这与我们之前讨论的一些内容相吻合,例如,当你拥有无限的资源来解决问题时,你可能会缺乏迫使你进行优化和提高效率以及真正以有用的方式进行创新的驱动力。

但与此同时,尽管这个故事很诱人,但这实际上才两年时间。所以我必须先停一下,然后再追究任何人的责任。事实是,聊天客户端很棒。它们正处于青春期。这是另一个关于人性的观点。

这些聊天客户端的可用性基本上取决于你愿意并且能够想到为它们做的事情。是的。就像我写DeepSeek的常见问题解答文章一样。我最初开始将每个问题作为Markdown中的H4标题,也就是四个井号。我想,不,这行不通。好吧,我应该把它们加粗。

我是否会去检查,我是否能找到一种方法来做到这一点?不,我使用ChatGPT,说把所有这些H4标题改为粗体。它为我做了所有事情。这不是一件大事,但这为你节省了什么?可能大约20分钟,25分钟左右?是的,只是普遍的烦躁或让别人为我做这件事。我想有人刚刚失业了,我的文本格式化程序。所以我的意思是,即使在我们内部,

我们所有人都有大量未开发的效率提升,这是由于我们缺乏想象力,无法想象如何使用这些东西。所以这适用于微观层面,也适用于宏观层面。我认为这是真的。我也会说,我认识的技术人员......

喜欢每天使用这些东西。也就是LLM。事实上,我在主流社会中越来越多的朋友也经常使用它们。但我正在等待有人以一种更傻瓜式的方式将其产品化。

我的意思是,坦率地说,我认为苹果本来打算用苹果智能来做到这一点,那就是让它变得如此简单,以至于它成为每个人的速记。然后苹果智能就成了一个绝对的灾难。所以,在某些时候,我认为我们将看到比目前更多的采用。对。可能会有某些情况,你知道,

也许最终我们会得到更多类似经典创始人系列的东西,有人为自己解决问题,然后他们从中创造出一个产品,最终成为一家大公司。还有更多神话可以创造。是的。现在,这取决于你的意志。很快,对我们所有人来说,这将成为一种第二天性。对。但计算机也是如此,坦率地说,网络也是如此。这取决于你的意志。

对。就像使用个人电脑的第一批人渴望弄清楚如何使用它们一样。而互联网上的第一批人则在寻找鲜为人知的社区。我们是在谈论过去那些BBS吗,比如卡罗来纳篮球留言板?绝对是。没错,没错。所以我们会到达那里的。

所以这是一个冗长的回应,是对你在周一剧集里发表的评论的回应。好的,我要给自己倒些咖啡。没错。让你那边也舒服些。威廉说,在最新一集的结尾,本在正确解释和讨论R1之后,发表了一些非常糟糕的观点。

我在推特上看到的最好的评论实质上是,每个人都看到了R1,然后加倍坚持他们先前存在的观点。本也不例外。在讨论为什么他们被称为OpenAI时,你必须记住他们成立时的背景。

那时每周都不会成立一个新的AI实验室。主要的参与者是谷歌的DeepMind。你读过DeepMind的论文吗?几乎没有足够的技术内容可以做任何事情。直到AlphaFold,他们甚至不允许外部研究人员大规模使用这些模型。OpenAI相对于谷歌来说是开放的。现在,“开放”的含义已经改变了。如果你想说......只想插一句。好的。只想插一句。

好点子。说得非常好。我继续。好的,给威廉加一分。我们看看下半场会怎么样。如果你想说F-anthropic或OpenAI在减缓进步,那算什么?谷歌的愤怒在哪里?我们拥有这一切的全部原因是因为OpenAI成立了。他们是这些东西存在的原因。

此外,关于阻止GPT-2的观点也很糟糕。他们这样做是为了弄清楚我们应该做些什么才能确保不会滥用它。他们现在有一个流程,他们和Anthropic在推出新模型时都会遵循这个流程。他们制作评估CBRN风险的模型卡。

谢谢。

这就是为什么谷歌没有像Facebook那样开源其基础设施的部分原因。这是Facebook的战略优势。今天也是如此。Facebook发布他们的Llama模型也是一个战略优势。DeepSeek似乎对开源感兴趣,但并非出于商业战略角度。所以这很有趣。梁文锋掌控的情况下,他们可能会发布他们大多数模型(括号内)的权重。

所以,本,你不需要框架它。首先,威廉。很棒的邮件。这场咆哮值得一场咆哮,你做到了。非常好。

我已经提前赞扬了你关于OpenAI与谷歌的观点。很好的观点,跳到最后,商业分析师的视角。是的,正确。是的。从蒸馏的角度来看,避免蒸馏最简单的方法是什么?直接获取权重。我还想补充一点,从DeepSeek的角度来看,出于与Facebook开源基础设施相同的理由,开源权重和开源模型是完全符合商业逻辑的,对吧?

即使从反驳论点出发,他们应该保守秘密,以便美国能够了解效率提升。好处是他们只是将这些知识传播给了所有面临严重芯片限制的中国公司。所以所有这些都说得通。所以我实际上同意这封邮件中的几乎所有内容。我只会解释我咆哮的根源。那不是商业分析师的咆哮。

那是,它证实了我的一些观点吗?是的。我的观点是,这深深地,在使用这种语言之间存在这种张力。正在发生几件事,使用这种关于安全性和AI世界末日可能性的语言。我的挫败感在于,在某种程度上,

这对你来说是一个真正的担忧。需要明确的是,我并没有对此翻脸。我完全承认这些担忧。这部分驱动了我的恼怒。对我来说,这对你的事业是有害的。

将安全的定义解释为许多我们可能觉得令人反感但并非以安全为导向的事情。所以当它谈到,这就是为什么我转向GPT-2的笔记,谈论精神

错误信息或偏见等等,同样,这些都是需要讨论的合理的事情。但它在实际讨论中的表现方式是,你反对它,你就会被指责为不关心世界末日。这就是这种论证的莫特和贝利方面,这是一个谬误的论证

你走到贝利那里,提出一个观点。有人反对这一点。你退回到莫特那里说,什么?你在谈论世界末日。你不在乎这个。你不在乎安全。是的。这可能是由我自己的立场驱动的,我向你保证,每次我写到这个话题时,我都会收到很多反对,说我不关心世界末日。

所以,我对这种发生的混淆绝对感到沮丧。第二点是OpenAI的整体结构。和

我已经寻找这个很久了。这可能是一些对话。我不记得了。但确实存在一个元素,即使是这种董事会结构和这种想法,如果你真的相信AI将控制世界,那么这种结构中隐含的是我们

我们将控制世界。对。对。因为董事会将做出决定,我们将决定谁投票给他们。是的,对。正是如此。所以,如果你认真对待这些论点,你就会

然后我就会有真正的担忧,对吧?现在,就威廉提出的第一点而言,加倍坚持他们现有的观点。是的,绝对发生了。我一直以来的一个现有观点是,如果这确实变得占主导地位,我非常担心萨姆·阿尔特曼决定世界的走向。这不是针对萨姆的攻击。这是针对任何一个人拥有这种程度的权力。我觉得这是一个合理的立场。

是的。第二,我认为不会发生这种情况。我认为会有多种模型,而对抗这种方式的最佳方法——我承认这很老套,但我相信它——对抗这种方式的最佳方法是拥有更多AI,而不是更少AI。如果我们可以回到过去,把这一切都放回潘多拉魔盒里——

当然,没关系。我的信念是,我们很久以前就跨越了鲁比孔河。它会存在。它将是开放的。R1强调了这一点。这是整个芯片讨论的基础,对吧?就像中国会得到这个。他们会,而且他们会得到足够的芯片。

他们会随着时间的推移找到如何建造东西的方法。你正在进行一场注定失败的战斗,顺便说一句,这完全是错误的心态,是采取防守而不是寻求创新。对。同样,完全可以不同意。我喜欢我们上次的讨论,部分原因是我觉得我可以反过来同样有力地论证你的观点。这是一场需要进行的讨论。但是,是的,这是我的一个先验信念,即AI实际上将在数字上广泛可用。

嗯。

现在,就他的观点而言,从商业分析师的角度来看,他们当然不应该开源它。但这意味着他们是伪君子。如果他们是伪君子,我会斥责他们。所以,再说一次,我认为当它提出所有合理的论点时,这一部分,同样,这是一个播客。我们在播客上的言辞比我在Stratechery上更辛辣一些。但是......

对我的看法是,在这个立场中,如果你采取非常尖锐的分析角度,它看起来像是试图为非常小的

集团?集团?集团。我能读出这个词。我也不能发音。邮件里有人让我们知道。但我的问题是,开源OpenAI的模型和开放权重,也就是说,这会有帮助,因为它会分散创新并允许其他美国人对其进行创新?对吗?这就像核武器和相互保证毁灭,为什么?

在一个没有核武器的世界里我们会更好吗?好吧,实际上,这是一个有趣的问题。一方面,我对《奥本海默》的结尾非常恼火,因为他们让它听起来像是我们给世界带来了一个可怕的时代,而事实上,原子弹被发明了,而且相对和平的时期比人类历史上任何时候都多。正是如此。这就像关于美中经济如此紧密联系的整个事情。就像,是的,这是一件非常糟糕的事情。他们说,好吧,

也许这是唯一真正可行的原因。对。就像,不,美中关系是相互保证的经济毁灭。就像那样。就像在任何情况下,在常规武器和某种程度上非一体化经济体的情况下,我们现在的情况就是这样。我,

我认为几乎毫无疑问,早就应该就台湾问题开战了。对。就像,就像,所以现在的问题和非常合理的反驳是,好的。如果你想接受我的论点,把它还给我,你短期到中期可能是对的。但如果你考虑长期,我们所做的只是在为一个真正世界末日般的毁灭性场景做准备。而我的回应是,

你可能是对的。AI也是如此。这里都在祈祷。我们可能是对的。但问题是AI就在那里。这是一件真实的事情。在我看来,它将被传播。鉴于此,答案不是试图把它放回盒子里。答案是朝完全相反的方向奔跑。再说一次......

从商业分析师的角度来看,威廉完全正确。OpenAI应该关闭,而不是开放。省去所有神圣的姿态吧。是的,我们正在这样做。这就是我回应的内容。这正是我的回应。为了清楚起见。好的。还有一点关于萨姆的消息。阿里说,你们看到庆祝萨姆和萨蒂亚和解的推文了吗?

我想他们现在对软着陆持开放态度。我们收到了很多关于这条特定推文的邮件。你对这条推文有什么——这是他们一起自拍的那条吗?自拍,是的。你对旧金山自拍有什么官方评论吗?有很多有趣的评论。我认为我最喜欢的一条评论是,

当你的父母在另一个房间争吵了六个小时后过来告诉你该吃晚饭了的时候。感觉很对。很棒的内容。不,看,微软现在在许多方面都表现出色。他们仍然可以完全访问所有OpenAI的API。他们拥有优先购买计算能力的权利。

他们也在某种程度上让自己摆脱了追求这些领先模型的资金的责任,这些模型在几个月内就会商品化。所以,就像,这似乎是一个合理的位置。同样,OpenAI的赌注,对OpenAI来说是合理的,而软银的赌注,孙正义是不合理的。所以对他和最终资助他的人来说,这有意义,不,实际上我们会先到达那里,它将主导世界,而且经济回报,呃,

一个模型实际上将成为一件事情。现在,同样,我认为证据表明他们的B模型正在成为商品,但仍然可以合理地押注另一个方向。是吗?

如果你——因为我们刚刚在节目的开头谈到,是否有任何防御蒸馏?没有,如果你有承受这种风险的胃口,这是合理的,对吧?就像,也许只有5%的几率,但那5%的优势是天文数字。这是一场风险投资类型的赌注,它可能不会发生,但是——

但如果发生了,回报是如此之大,以至于值得为此投入资金。同样,这就是为什么债务部分对我来说没有意义的原因。这感觉像是一种股权融资的情况。但如果你是OpenAI,我明白你为什么这么做。如果你是微软,我明白你为什么不这么做。同样,这并不是说他们与OpenAI的模型脱节了。他们仍然在那里拥有影响力。

他们可以行使确保他们仍然可以访问的权利。所以,好吧,他们本周正在为世界树立一个良好的形象。我喜欢这张自拍,我期待着未来关于这种关系的更新。很高兴父母不再吵架了。哦,伙计。我会告诉你,

我比过去更开放地接受OpenAI,部分原因是我现在每天都在使用ChatGPT。我会说,如果科技界有一位最有可能成为未来五到十年内被卖给竞争对手流媒体的八部不同纪录片的主题的人,

萨姆·阿尔特曼就像成为所有这些关于公司滥用和公司混乱的纪录片主题的不二人选。这将是伟大的。我的意思是,是的,可以合理地假设,并且可以说在过去的剧集中已经发生过,

萨姆·阿尔特曼有一种伊卡洛斯式的迷恋。他总是飞得太靠近太阳。所以我们将看看在这种情况下是否会发生。冒险将继续。彼得说,DeepSeek表示,他们的V3最终训练运行是用一个包含2048个GPU的集群完成的,这与XAI的

明显的20万个集群相去甚远,假设计算需求不变,但使用比以前假设的更小的集群来利用,那么对网络、配电、液冷和其他一直是创建大型集群的制约因素的领域会有什么影响?本,你对此有什么想法吗?我认为这可能是一场45分钟的对话,但你会想到什么?

好吧,我会说对于DeepSeek,有这份报告。我认为迪伦·帕特尔最初在11月份说过,他们有5万个Hopper GPU。所以首先,这被误解为H100。H800也是Hopper GPU。区别在于约束内存带宽。所以首先,2048几乎可以肯定,这是他们所能达到的最大值。给,

考虑到内存带宽限制,因为你必须与所有这些CPU通信并保持同步,所以他们是否更愿意做更大的事情?是的,他们做不到,因为内存带宽受到了限制,所以更大是否会更好?几乎可以肯定,为什么像GPT-4一样,大约在24000左右,它是在......我记不清确切的数字了,也许这甚至很高,限制不是他们没有更多GPU,而是

通信开销变得非常大,整个事情都崩溃了,规模越大。所以,这种扩展的一个很大一部分是提高这种能力。这是英伟达护城河的一大组成部分,他们是最擅长构建这些东西的。不仅仅是核心AMD芯片比核心英伟达芯片快。英伟达在为它们编程方面要好上数百万倍,首先是因为CUDA,其次,他们在将所有这些芯片连接在一起方面要好得多。连接它们,是的。

没错。所以DeepSeek在更多硬件上会更好。第二,同样,这只是最终的模型运行。你进行最终的模型运行,它非常便宜并且运行良好,因为你已经进行了无数其他的实验和运行。所以他们的研究人员一直在使用大量的GPU来进行最终运行。第三,

他们一直在以令人震惊的低价格提供推理服务,这可以说是最大的指标。就像他们一样,他们完全摧毁了一年前在中国推理的定价模式。所以,他们的GPU可能大部分都用在了这里。人们访问它并需要使用它。许多大型数据中心都是为了让人们实际运行推理,而不仅仅是训练。关于这一点的另一件事,我应该早点对此多加说明,

我认为在我的常见问题解答中,蒸馏的一个重要意义,第一,第二,这些推理模型及其生成有用思维链的能力是AI训练AI的能力,最大的障碍是围绕GPT-4,我们已经浏览了整个互联网,对吧?我们如何获得更多数据?

合成数据问题一直是机遇,也是一个问题,它会起作用吗?看起来它会起作用。所以你考虑一下,如果你想获得,你知道,提出这个问题,我们在今年的第一期播客中谈到了这个问题,聚合理论死了吗?像使用AI一样,是否有边际成本,这意味着我们对互联网经济的思考方式将会改变?好吧,反驳一直是常规LLM

变得越来越便宜,而且它们在很多事情上都做得很好。你不会在所有事情上都使用推理LLM。但是你使用推理LLM的另一件事是,你可以生成更多对更多问题的答案,基本上是无限的,特别是当强化学习参与其中时。你可以,所以你只是,

你正在生成越来越多的合成数据,它不是直接的蒸馏物。你用它来训练常规LLM,它们只会给出答案。他们不会考虑它。突然之间,它们的能力更强了。所以你从这个角度考虑一下。世界上潜在知识是无限的。我们正在谈论痛苦的教训,蛮力地创造和获取世界上所有可能的答案。

在世界上,对吧?就像他们一样,这基本上是随着我们前进而产生的无限推理需求。好吧,这是训练还是推理?这是为了训练目的的推理。所以,推理的内在需求,这就是OpenAI的1亿美元计划有意义的地方。如果他们认为这是路径,我们有一个推理模型可以生成思维链,然后可以用来训练常规的普通LLM。他们的潜力,

对计算的需求实际上比以往任何时候都更大,因为他们想要训练推理模型。然后他们想使用该推理模型生成所有这些合成数据来训练基础模型。顺便说一句,一旦基础模型更好,你就会得到一个更好的推理模型,这样你就可以生成更多合成数据来改进基础模型。我们已经进入了这个良性循环,这要归功于那些担心

真正的资本S安全,比如AI接管一切的人,这就是他们预测的。AI正在让AI变得更好。我们正处于那个时代。那个时代将需要基本上无限量的计算。所以,所以这种反应是过度的。同样,我认为关于时间问题存在一个合理的问题,对吧?是,是有一点,你知道,所有这些需求,特别是对于推理,如果我们变得更高效,更多,

可能不会被消耗,但对于训练和推理以及用于训练的推理所需的更多计算的潜力是一个巨大的事情。所以,你知道,对配电、液冷的需求将会非常巨大。是的。对。而且所有这些东西都会进入,是的。对。

是的。顺便说一句,特朗普政府已经发布了如此多的东西,很难跟踪。但有一件事被忽视了,那就是将有一项关于创造离网电力的行政命令。这基本上直接与这些数据中心联系在一起,并且大幅放松了。

这基本上是我们几个月前在这个播客上呼吁的。需要有能力在专用区域内消除所有繁文缛节,并且可以创造电力。电力可以一对一地与数据中心相连。数据中心对它需要多少电力非常有预测性。它是完全离网的。你可以在任何地方建造它们。如果你想的话,你可以在沙漠中间建造它,旁边有一个巨大的太阳能农场。我认为这不是——

太阳能的问题在于它是间歇性的,晚上它就会消失。所以你需要很多电池,因为你需要持续的电力。这就是为什么核能是这些数据中心的自然选择。但你可以建造它,然后只需要一条光纤线路将数据发送到其他地方,你甚至不需要——

所有电网的东西你都可以完全绕过。所以这里的需求比以往任何时候都更大。太好了。实际上有一种需求的解锁。好的。这就是为什么,对不起,还有一点。我知道我有点长篇大论了,但这就是为什么我对R1的最初撰写是关于强化学习、合成数据和

以及蒸馏方面的原因,因为这是解锁。这是R1的真正收获。所有其他东西都是一种干扰。不,完全正确。我在阅读了你的文章之后才接触到R1,然后看到了过去一周左右的歇斯底里。对我来说,这一切都让我有点困惑。我认为你用华为7纳米芯片的比较抓住了重点。

就像很多没有密切关注AI的人都在消化这个消息,并为此感到恐慌一样。但合成数据及其对未来的暗示是一个巨大的交易。系好安全带。随着我们继续学习痛苦的教训,这里将会变得非常奇怪。

说到特朗普政府,关于出口管制对话的一些后续内容。托马斯提出的两个问题。第一个是,对中国的无芯片控制将如何影响美国公司的GPU供应?人们总是说,计算的限制是台积电和英伟达可以生产多少GPU。如果中国也进入市场,这将如何改变可以交付的GPU数量?

我不知道。我只是很好奇你对此有什么看法。好吧,问题是,它是否已经发生了?中国似乎已经开始拥有大量的GPU。首先,你有H800。很多GPU都流向了新加坡。新加坡购买的GPU数量超过了其电力供应能力,对吧?就像我们知道它们去哪里了一样。我认为这是一个非常公平的问题。我认为你可以利用英伟达更强大的批评之一是

英伟达的运营方式不像一家美国公司,同样,这在科技行业是一种标准。你只是全球性的,你卖给任何你想卖的人,但是你知道,

英伟达是否曾经能够基本上决定谁得到他们的芯片?是的。他们是否利用这一点,也许没有给大型科技超大规模公司他们想要的那样多,因为英伟达意识到从长远来看,这对他们来说是一种危险,他们不想给予过多的权力......

最终陷入某种寡头垄断的局面?是的。很多这样的东西都流向了像CoreWeave这样的初创公司,而英伟达也投资了这些公司?是的。这是否意味着当亚马逊或微软乐意购买这些芯片时,他们也向中国出售了很多芯片?不,

同样,是的。英伟达在这件事中并非清白。是的。我不一定担心英伟达,但很有趣的是,英伟达是过去几年一直在努力争取能够将其产品销售到中国的一家公司。在过去的两个月里,他们成为中国反垄断调查的对象,然后DeepSeek使用削弱的英伟达芯片制作了一个模型,该模型以某种方式抹去了20%的股票价值。

所以这可能是一种“恶有恶报”的情况。但同样,我认为英伟达会没事的。与这家公司冒险的所有部分。托马斯的第二部分。

我记得听说过中芯国际如何窃取台积电的知识产权和人员,并最终因此在2009年不得不向台积电支付和解金。所以中国人民和政府长期以来一直关注半导体制造能力。相关的是,

相关的是,正如周一剧集中提到的那样,一个巨大的领先优势障碍是缺乏EUV机器。所以我想知道,本是否也认为这是一个坏主意,并且所有现有的机器和化学品都应该卖给中国?你怎么看?我也很好奇这是否符合你的观点。好吧,说实话,我不知道我的观点是什么。像......

我一直喜欢你回到中兴和特朗普从芯片中购买它们。我当时非常不安,而且我对这些问题感到不安,那就是你正在建立一个长期的,你只有一次机会打出的牌,你正在为美国在这个领域的长期领导地位制造一个长期的问题。

这场博弈论的结果对台湾的台积电来说非常棘手。我不是说这会导致战争,但它增加了战争的可能性。如果中国依赖台积电,那将是一个非常好的理由,不去侵略台湾。对。如果他们与台积电断绝关系,他们的成本效益分析将从根本上不同。所以......

再说一次,回去读读我八年前写的东西。我一直对这一点感到非常不安。所以同时,EUV 的赌注,我为什么戴这么多帽子,包括一个非常自私的帽子。所以我想对此诚实一点,那就是一个......

通过这些法律的一部分是,你实际上能否执行它们?这是一条非常清晰且可执行的界限,你可以阻止 EUV 机器进入中国。那是一种根本不同的技术。它的开发极其困难。EUV 的想法可以追溯到 2000 年代中期。

对。对。

我对......感到更加不安,我们会喜欢,哦,他们让我们,他们,他们使用 DUV,我们让他们买了多年。你想在这里真正实现什么?除了从长远来看削弱我们公司,增加竞争的前景,并从非常非常长远来看失去你的王牌之外。这是非常宝贵的杠杆。这是正确的地方吗?从中国的角度来看,

我说华为 7nm 对中国不利,因为他们越长时间停留在我们拥有的领先地位上,当他们能做的最好的事情是回到基础并从......

从零开始建设。就像,对。所有这些都是你必须从落后边缘开始,逐个节点地构建才能发展。反驳是中国正在这样做。我之前才说过公司应该双轨运行。呃,就像,我,我完全承认,我......

我在很多事情上都在自相矛盾。我仍然不知道芯片禁令是否是个好主意。本周让我重新想起的一件事是,我当时并没有全心全意地和你争论,因为我仍然不太确定......

我从文化的角度来看,担心美国发出的信号。是的。我们会通过阻止我们过去的创新来对抗,而不是激发我们必须更快前进的动力和动机。而且,而且......

我最终在哪里?我陷入了泥潭。我坦白承认,我认为这是最终的收获。你读过 Anthropic 首席执行官 Dario Amodei 的文章吗?因为他写了一篇关于出口管制并主张加强出口管制执法的文章。你对他的论点有什么看法?

我的意思是,这是一个非常有效的论点。我认为你一直在提出这个论点,而且你把它说得很好。我......

如果人们同意你的观点并同意他的观点,我理解,因为我也可能同意你的观点。我在这里陷入了泥潭。是的,可怜可怜我吧。是的,油腻的猪。我知道。我很感激。嗯,我觉得很有趣,因为在政治背景下,我不知道特朗普政府会如何处理这个问题,因为这显然对中国人来说是一个极其敏感的问题。我们稍后再谈特朗普的角度。好的,

我对 Dario 阐述这一点的担忧是,他是写 GPT-2 文章的人,对吧?就像,而且有一个......

我只是本能地有点怀疑这些人,他们同时说人工智能是最大的危险,它对人类构成威胁,同时也致力于构建它。我本来想说,如果你想,如果你想,如果你想像我们之前的电子邮件一样,把它扔回我的脸上,说你只是在论证你预先存在的偏见。是的。

是的,我是。但这是我预先存在的偏见。这让我感到担忧和怀疑。这深深地符合他们的利益,并符合开放眼界的利益,以阻止这种事情。但是的,这就是我的处境。好的。

好的。是的。嗯,关于特朗普我想说的是,他正在管理与习近平以及中国之间更大的关系。因此,我认为他的安全团队中有一些派系希望加强和扩大对芯片和芯片制造设备的出口管制,特别是让一些盟友参与进来,无论是 ASML、韩国还是日本。

我不知道特朗普先生,执行官,我们谈到了权力扩大。我不知道他是否愿意在未来一两年内激怒习近平。也许他不应该,你知道,因为我认为这是防止持续紧张局势加剧的屏障。所以让我们拭目以待。

嗯,值得记住的是,这将我们完全带回到为什么 DeepSeek 是中国的,以及它实际上是中国因素的原因。我认为你对 Mistral 的类比是一个很好的类比。就像如果 Mistral 这样做,每个人都会欣喜若狂,这太棒了。哇,这太酷了。是的,这是一个极好、极好的观点。有一点......

我提到这可能是一个很好的警钟。我不确定美国人民是否已经完全意识到我们在相对中国的处境有多么危险,尤其是在战争情况下。所以,总的来说,他们的工业能力,他们可以建造的船只数量,我们无法建造东西的方式。我们无法建造船只。我们不能做 X、Y、Z。就像,我们可以恢复生产吗?

最终,我们没有很好地增加炮弹产量。我们目前的产量仍然远低于俄罗斯。我不确定人们是否完全意识到这有多糟糕。而且......

在由无人机和机器人等定义的新型战争中,情况会变得更糟,所有这些部件都完全在中国生产。就像所有的小型执行器、电机、电池和所有这些东西都由中国主导。中国。如果我们最终生活在一个由这些东西定义战争的世界里,我们会有一个大问题。而且,而且......

可能需要注入谦逊。如果它来自可能夸大了 DeepSeek 的作用,但刺破了在进行战争时自以为是的技术优势的态度,那么进行战争不仅仅是聚集用户和获取需求。战争实际上是在消耗实物和实际人员,他们......

在那种消耗战中,我的聚合理论在这种情况下并没有什么价值,让我们在美国非常清楚,美国的技术和我们的整体经济都是关于消费的,就像我们通过利用我们购买大量垃圾的意愿来统治世界一样,就像在非常根本的层面上,在这种情况下......

我不想给特朗普太多赞誉,因为谁知道是什么样的,他喜欢关税。他喜欢抛出 X、Y、Z。但我认识到的是,

我们在处理这类事情的方式中存在真正的傲慢。并且假设 30 年前世界的样子就是今天的样子。这根本不是真的。如果我们越来越没有能力支持我们的言论,那么继续以傲慢的态度行事,我们可以决定世界是什么或不是什么,这实际上明智吗?所以当你想到像台湾这样的事情时,

就像人们对可能对台湾芯片征收关税感到震惊一样。我已经写了,我在 Stratechery 上写过这篇文章。我的意思是,我会再次谈到它,但我已经表明我的观点是......

特朗普对芯片法案的批评,即仅仅补贴供应是根本错误的。你需要补贴需求。关税是一种方法,但我认为它不如直接为英特尔购买芯片和购买芯片的保证有效。但当你想到在推动需求方面需要什么时,这并不是疯狂的。还有一个更广泛的观点,即我们完全依赖台湾是一个大问题。

就像,就像,如果台湾政府,你知道,他们完全理性地不想让领先的台积电能力离开岛屿,因为这是他们的王牌,双关语,以确保美国来保卫他们。但我,

但如果我们是否有能力打仗存在非常现实的问题,那么这能持续多久呢?是的,完全正确。再次,对特朗普的类比一直是一头闯入瓷器店的公牛,关于他能否把东西重新组合起来,存在真正的问题。但有时,东西被破坏是有价值的。其中一个可能值得打破的禁忌是,大多数美国人完全确信我们可以赢得战争。对。而且——

在这个世界里,这是在搞砸台湾吗?也许吧。

台积电是否受益于操纵的货币或似乎无法达到其正确水平的货币,这给了他们在台湾制造芯片的基本成本优势?也许吧。这里各方的手都不干净。有一种倾向是——就像台湾是盟友一样。他们与美国的利益并不完全一致。我只是认为——再次,我并没有说我同意或不同意。我仍然真的——

在思考这个问题,但我确实认为我们现在所处的形势缺乏谦逊和意识,顺便说一句,我们可能需要依赖它,我们应该与中国达成某种协议,将他们锁定为他们将制造东西,我们将购买东西,这对台湾意味着什么?如果我们......

我们最好有自己的芯片制造能力。因为我们会像,对台湾成为中国一部分的担忧是,中国现在切断了我们的芯片。对。那么我们应该弄清楚如何在国内制造自己的芯片,因为这与战争情况的担忧完全相同,那就是中国炸毁了台积电。然后我们仍然需要在国内制造芯片。就像......

再说一次,我爱台湾。我已经在这里住了 21 年了。台湾的民主制度令人惊叹。我很想留在这个灰色地带,它实际上是一个独立的国家。我在这里确实感到非常自由。嗯,新冠疫情有点不稳定。考验了你的耐心。

就像,如果你担心国家安全,如果你担心这些长期的事情,你必须考虑这些问题。是的,这就是为什么几年前我写了关于地缘政治芯片的文章。就像,就像这是一个真正的问题。

对。嗯,当我提到特朗普的行政权时,我并不是轻描淡写地说。大约五分钟前,我把它说成一个笑话,但我的意思是,如果我们不走我认为他政府很大一部分人希望走的扩大出口管制的方向。

可能有一个原因,这实际上可能是一个理性的决定,因为它肯定会激怒中国方面。关系将进一步恶化。我并没有忘记,中国一直在进行制造业建设,这在过去一百年中是前所未有的,除了像二战前的德国和 20 世纪初的美国之外。就像,

他们比美国更有能力打仗,至少从制造业、造船业等等方面来看。对,从美国的角度来看,乐观的想法是,嗯,我们的 AI 将变得如此强大,以至于我们可以技术上获胜。这就是对芯片管制的论点,即我们将通过拥有优越的技术和 AI 来克服制造业的不足。这就是为什么,是的,我们正在抛弃,我们现在正在打出我们的单次游戏王牌,

再次,没有双关语,但现在是时候打出这张牌了。现在保持优势将在未来几年得到巩固。没错,因为 AI 会让 AI 变得更好。所以这个观点,有趣的是,如果你深入研究支撑它的基本假设,芯片禁令实际上与......

Sam Altman 的观点或 Dario Amodei 的观点相同,即我们不会拥有商品化模型。我们实际上将实现起飞,我们将拥有可持续的、优越的优势,这将随着时间的推移而保持。这就是 DeepSeek 如此重要的原因。如果不是这样,有多少决定是在这种假设下做出的,而这种假设可能并不正确?是的。嗯,如果没有被削弱的英伟达芯片被卖到中国作为开放......

嗯,我的意思是,需要明确的是,字节跳动和阿里巴巴都有相当不错的模型。所以,你可以......但他们是用英伟达芯片还是用华为开发的芯片?多年来,华为一直在购买芯片制造设备,这令安全界那些认为你应该对华为采取更强硬态度的人感到沮丧。我不知道。嗯,我......

我认为大部分训练可能发生在视频芯片中。我认为坦率地说,很多走私都会发生在那里。也有云选项。我认为华为......是的,我认为对于推理......

推理更合理。你不需要那么大的带宽。无论如何,你的内存更受限制,但我不知道。很难肯定地说。但另一件事是,你确实有电力和数据中心的限制,这需要建造东西的能力。中国在这方面比我们强。所以有一点你可以通过蛮力来扩展规模。

相对而言,它的运行效率低下。没关系,因为当你最终想到它时,军队将获得所有最好的芯片。就像他们,他们,他们,所以即使你限制私营企业,也不像,你知道,所以他们会再次想出办法。是的,我也可以为芯片禁令辩护。我可以再读一封关于芯片禁令的电子邮件吗?你还有时间吗?是的。好的。迈克尔说,呃,

迈克尔电子邮件的第一部分是,首先,安德鲁对他的评论再错误不过了。哦,终于有人站在我这边了。不知何故,芯片出口管制。我们必须对你选择这些电子邮件提出质疑。我想知道。哦,我的上帝。听着,我只是想给你一个机会来回应激烈的咆哮。迈克尔说,安德鲁。不,那是一次很棒的咆哮。这实际上是我们收到的最好的电子邮件之一。

时间。我会在应该给予赞扬的地方给予赞扬,但你知道,迈克尔·斯特恩。巨大的能量。安德鲁对他的评论再错误不过了,不知何故,芯片出口管制条例被行业淡化了,这就是它们不起作用的原因。你在上一集中花了大量时间谈论应对,这是一些非常强硬的应对。

条例。我只是想——应对是一个多么好的词。它对论述来说是一个非常好的补充。我很高兴我们能有所帮助。哦,我的上帝。我唯一的请求——老实说,我阅读这封电子邮件的唯一原因是我想向我们所有的听众、科技推特、你提出正式请求。我们大家能否都休息两周,不要说“应对”这个词?一切都是。不,我们不能。我读到的每条推文都在谈论应对。我喜欢它。

它不必是永久性的休息。给我两周时间。大家深呼吸一下。好的。迈克尔说,这是一些非常强硬的应对。这些条例完全被强加给行业,没有任何参与或反馈机会。这对于最近的 AI 扩散和代工厂规则尤其如此。我不知道如果行业更多地参与其中,情况会更好、更糟还是其他什么,但行业绝对没有以任何有意义的方式参与其中。

这封电子邮件让我笑了,因为它让我想起了我们捆绑包中各种播客的受众有多么不同。Sharp China 的受众,他们中的许多人都在华盛顿特区和政府部门工作,对芯片管制事件会有截然不同的看法。但我相信 Sharp Tech 的许多听众会觉得政府把所有这些都强加给他们,而不知道他们试图监管什么。

我只想说我记得的是,曾有人努力让格雷格·艾伦从他在 CSIS 的职位上离开,因为他太擅长解释芯片禁令未能实现其预期目的的领域。而且。

总的来说,幕后的游说已经被很好地记录下来。Semi Analysis 在 10 月份实际上做得很好,指出了芯片管制失败的所有不同方式以及为什么它们具有战略意义。

但正如迈克尔所说,我认为由此产生的无能最终是拜登政府的责任。我还认为他指的是 AI 扩散和代工厂规则。我对这个过程了解较少。这可能是强加给行业的,没有任何有意义的参与和互动。

我认为这些规则并不是处理任何这些问题的正确方法。所以在这一点上,我同意迈克尔的观点。你有什么想法吗?是的,我的意思是,我认为......

你甚至可以回到拜登关于 AI 的行政命令。我只是想重申我之前说过的那一点,他们变成了这种 AI 起飞情景的真正信徒。就像,我们必须尽一切努力阻止这种情况。这就是为什么这是一个重要点。模型扩散的问题是一个非常重要的问题,需要讨论。它很重要。从商业分析师的角度来看,它显然非常重要,对吧?价值在价值链中积累在哪里?但它,它......

实际上支撑着这些非常深刻的基本问题,例如,我们是否会在很长一段时间内牺牲我们的半导体产业,因为这是我们必须正确处理的唯一一次?是的。对吧?所以这是一点。另一件事是,你、格雷格·艾伦和 Semi Analysis 对这些芯片管制并没有错。是的。值得考虑的是,芯片管制泄漏的程度是——

压力阀,对吧?这阻止我们实际上将这些场景贯彻到最后。我们确实需要认真思考,如果我们有完美的芯片管制会发生什么,对吧?如果中国实际上没有得到任何芯片,中国对......

在这种情况下做出什么理性回应。是的。我的意思是,这并不是一个令人愉快的回应。是的。这就是我的意思。我认为我想知道特朗普在权衡所有这些问题时是否考虑到了这一点,随着事情的发展,谁知道,我不会试图进入他的思想。呃,但是,

迈克尔,第二部分。本对内燃机是正确的。在我职业生涯的早期,我曾经有机会在戴姆勒和宝马受到红毯待遇。如果你去梅赛德斯-奔驰博物馆,你会乘坐一部长长的电梯到达顶层,当门打开时,你会在一个黑暗的房间里,聚光灯照射着该公司生产的第一台内燃机。

他们拥有的关键技术是发动机。宝马也是如此。发动机是关键技术。其他一切都是由此产生的。根据我对该公司历史的了解,本田也是如此。我还认为福特也是如此。他首先开发了一种发动机,他们都没有特别好地适应电动汽车环境。这并不奇怪,因为他们的关键差异化技术受到了根本性的破坏。

本,我之所以包含这部分内容,只是想说我很想参观戴姆勒和宝马。我知道。我觉得我们需要一次 Sarptech 实地考察。我很嫉妒。让我们在未来一两年内去法兰克福吧。但感谢你的笔记,迈克尔。感谢所有来信的人。我们确实......

我们收到了大量的电子邮件。所以这是一集比较长的节目,但我们尽可能多地完成了。你效率很高,你知道,从这集的 DeepSeek 中获取你的线索。我们就在这里,我们下周会回来,下周不会一直都是 DeepSeek。但本不要承诺你无法保证的事情。祝周末愉快。我会尽快和你联系。回头见。

The End of DeepSeek Week: Moneyball for AI, The Future of Compute Demand, Geopolitical Reality Checks, and More 01:15:59 Share

Sharp Tech with Ben Thompson

Deep Dive

Shownotes Transcript

The End of DeepSeek Week: Moneyball for AI, The Future of Compute Demand, Geopolitical Reality Checks, and More