昨日市场因对DeepSeek的担忧而暴跌,但它应该如此吗?今天,我们将对这款让所有人都在谈论的中国AI模型进行炒作与夸大之词的区分。AI每日简报是一个关于AI最重要新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的Discord链接。
好了,朋友们。我们又到了DeepSeek报道的第二天。我想我们可能开始饱和了。但今天当我浏览新闻时,很明显,我们需要至少进行一次后续报道,来真正处理DeepSeek的第二天分析,特别是
特别是由于市场影响,以及美国总统现在也在谈论它。所以今天我们要做的,就像我说的那样,是尝试区分炒作和夸大其词,提供一些更新,并尝试在另一边留下对我们应该如何看待DeepSeek、它对AI行业意味着什么的理解,这样我们就可以回到讨论其他事情上来,当然,我的意思是代理。
不过,首先,就像我说的那样,华尔街市场一开盘就陷入彻底的恐慌。最终,纳斯达克指数下跌了3%,其中英伟达暴跌了17%。
英伟达的市值蒸发了近6000亿美元,这是股市历史上最大单日跌幅。总体而言,纳斯达克指数市值损失了1万亿美元。《经济学人》的华尔街编辑迈克·伯德写道:就总市值而言,今天英伟达的抛售规模略大于整个墨西哥上市市场归零。
而在这件事成为主流的头一两天,很多报道都比较表面化地看待事情。联合私人银行的董事总经理瓦瑟和凌表示,DeepSeek表明,开发成本更低的强大AI模型是可能的。它可能会破坏整个AI供应链的投资案例,而该供应链是由少数几家超级计算巨头的高额支出推动的。
其他人认为,这预示着未来会有更大的事情发生。永世愤世嫉俗者和存在主义吹牛者,也是一个把我屏蔽在ex-Nassim Taleb上的人,他说他认为英伟达的暴跌只是即将到来的事情的一个暗示。彭博社写道,塔勒布表示,许多投资者一直在哄抬与AI相关的公司股价,而没有正确了解其运作方式或成功能力的细节。他将科技公司描述为“灰犀牛”,因为投资者低估了其股价在一天内可能出现的偏差。末日预言家得到了末日预言,对吧?
这篇彭博社的文章反映了更为冷静但仍然担忧的分析:《Meta和微软表明,AI支出可能是一把双刃剑》。这篇文章对AI领域“七巨头”的大量支出带来的利弊进行了全面考虑、理性且相对平静的讨论。
说到“七巨头”,也有很多人实际上提出了与我昨天提出的类似论点,那就是市场似乎正在寻找一个重新定价的理由,特别是英伟达,以及“七巨头”和大型科技股总体而言。我对过去几年的市场看法是,ChatGPT的推出恰逢零利率时代的结束和加息的开始。
基本上在整个加息周期中,对AI的热情是抵御更广泛股市低迷的堡垒。当加息周期结束,降息周期开始时,华尔街有了其他期待的事情,但英伟达的表现一直如此出色,以至于它没有机会重新定价,并将所有希望和梦想从这只股票以及其他几只代表类似事物的股票中剔除。
每当我们有任何可能成为英伟达可能不是股市第二春的理由的催化剂时,我们都会得到类似这样的反应。富兰克林坦普顿高级副总裁马克斯·戈赫曼说得更简单明了,他说今天的走势表明,这个市场格局是多么的不稳定。当估值飙升至天际时,轻微的震动就更容易让整个市场震动。
但除了我认为股市只是股市营销之外,我们为什么不想像昨天的市场投资者那样害怕呢?首先,仍然有很多声音根本不相信我们在DeepSeek实际做了什么方面得到了全部信息。
前英伟达领导人博扬·通古说:“所以你是说,一家中国对冲基金发布了一个LLM,其中包含对其训练设置和效率未经验证的说法,最终导致美国股市损失数万亿美元,而我们应该相信没有任何可疑的事情发生吗?”尼拉杰·阿格拉瓦尔写道:一切都在抛售是因为一家中国公司自行报告的东西吗?投资者杰夫·刘易斯对此进行了更猛烈的调侃:新冠病毒来自蝙蝠=DeepSeek训练成本为557万美元。
话虽如此,AngelList创始人纳瓦尔·拉维坎特回应杰夫说,聪明的技术团队已经开始证实这些技术和由此产生的成本节约是真实的。因此,比基于中国的阴谋论更好的论点可能是,人们似乎对这可能如何影响对计算的需求存在根本性的误解。
约翰·斯托克斯写道:R1所做的是一种新型的扩展。它也是GPU密集型的。事实上,今天AI领域最大的谜团是,为什么英伟达股价下跌,尽管R1证明了GPU比我们想象的更有价值。这没有任何逻辑。英伟达也表达了这一点。一位发言人称DeepSeek的R1模型为“优秀的AI进步”。他们表示,DeepSeek的作品说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算能力。
发言人补充说,推理需要大量的英伟达GPU和高性能网络。我们现在有了三个缩放定律:预训练和后训练,它们还在继续,以及新的时间测试缩放。
更粗鲁一点的是,LaCoyaCap写道:
Yishan实际上认为,很多夸大其词是他所谓的由于中国而导致的过度轮动。
他写道:
科技界,显然还有华尔街,对此过度轮动,因为它来自中国。我明白了。在每个人都对H1BLM的喧嚣变得敏感之后,我们习惯于认为OMG移民中国是一种某种外星异类。好像外星异类中国研究人员正在做一些我们无法企及的特殊事情。现在,中国帝国不知何故独家拥有超级高效的AI能力,而美国公司无法竞争。不,这些人基本上正在研究我们在美国研究的相同问题。不仅如此,他们还写了一篇论文并开源了他们的模型。
这实际上并不是某种地质构造的地缘政治转变。只是一些那边的书呆子说,嘿,我们发现了一些很酷的东西。这就是我们如何做到的。也许您想查看一下。因此,他的总体论点是,这更像是一个谷歌时刻,而不是一个斯普特尼克时刻。他写道,斯普特尼克号表明苏联可以做到美国做不到的事情。顺便说一句,并没有公布所有技术细节和一半的蓝图。相反,他认为更好的类比是2004年的谷歌时刻。他写道:DeepSeek更像谷歌时刻,因为谷歌基本上描述了它做了什么,并告诉其他人他们也可以做到。
因此,虽然股市可能反应过度,事实上,汤姆·李称这是自2020年疫情爆发以来最严重的过度反应,但这无疑激发了竞争精神。AI沙皇大卫·萨克斯写道:DeepSeek R1表明,AI竞赛将非常激烈,特朗普总统撤销拜登的行政命令是正确的,该命令在未询问中国是否会采取同样行动的情况下,阻碍了美国AI公司。我对美国充满信心,但我们不能自满。
OpenAI的Sam Altman写道:
今天的节目由Vanta赞助播出。信任不仅仅是赢得的,更是被要求的。无论您是正在应对第一次审计的初创公司创始人,还是经验丰富的安全专业人员正在扩展您的GRC计划,证明您对安全的承诺从未像现在这样重要或复杂。这就是Vanta的用武之地。企业使用Vanta通过自动化超过35个框架(如SOC 2和ISO 27001)的合规需求来建立信任。
谢谢。
在有限的时间内,本节目的观众可以享受Vanta的1000美元折扣,网址为vanta.com/nlw。网址为v-a-n-t-a.com/nlw,可享受1000美元的折扣。如果2025年AI有一件事是明确的,那就是代理即将到来。垂直代理购买行业水平代理平台。
每个功能的代理。如果您正在运营一家大型企业,那么明年您将尝试使用代理。鉴于这有多新,我们所有人都会回到试点模式。
这就是为什么超级智能公司在今年年初提供了一款新产品。这是一项代理准备和机会审核。在短短几周内,我们将与您的团队深入探讨哪些类型的代理适合您进行测试,您需要哪些类型的基础设施支持才能做好准备,并最终获得一套可操作的建议,让您准备好弄清楚代理如何改变您的业务。
如果您对代理准备和机会审核感兴趣,请直接与我联系,[email protected]。在主题行中输入“代理”一词,以便我知道您在谈论什么。让我们让您成为AI市场最具活力部分的领导者。您好,AI每日简报的听众。快速休息一下,分享一些来自KPMG最新AI季度脉搏调查的非常有趣的发现。
您知道吗?67%的商业领袖预计AI将在未来两年内从根本上改变他们的业务?然而,并非一帆风顺。他们面临的最大挑战包括数据质量、风险管理和员工采用等问题。KPMG处于帮助组织克服这些障碍的最前沿。他们不仅仅是在谈论AI,他们正在通过切实可行的解决方案和实际应用来引领潮流。
例如,超过一半的受访组织正在探索使用AI代理来处理行政事务和呼叫中心运营等任务。因此,如果您希望在AI领域保持领先地位,请关注KPMG。他们不仅仅是对话的一部分,他们正在帮助塑造对话。了解KPMG如何在kpmg.com/US推动AI创新。
坚定地认为这总体上是一件好事,降低AI成本是一件好事的人是特朗普总统本人,他昨天在一次露面中明确谈到了DeepSeek。我们稍后会回到这个想法,即所有这一切的真正赢家是我们消费者。然而,在我们讨论中国主题时,重要的是要稍微绕一下弯,因为许多额外的反应提醒了实际使用这些模型的意义。
卢克·德普尔福德写道:仅供参考,DeepSeek会收集您的IP、击键模式、设备信息等等,并将其存储在中国,在那里数据容易受到国家任意征用的影响。然后他指出了他们自己的隐私政策,其中写明了这一点。OpenAI的斯蒂芬·海德尔写道:美国人确实喜欢为了免费的东西而将他们的数据交给中国共产党。
投资者约书亚·库什纳写道:
我们还在这里讨论了这一切对出口管制意味着什么。《金融时报》发表了一篇非常具有代表性的评论文章,标题为:《美国的出口管制迫使中国科技公司变得更有创新力》。迈尔斯·布伦达奇写道:不幸的是,这种说法不会消失,我非常担心特朗普政府可能会相信它,并受到英伟达的压力而相信它。需要明确的是,美国取消出口管制对DeepSeek来说是最好的结果。
迈尔斯在12月份曾发推文说:DeepSeek高效地使用计算能力。这意味着出口管制适得其反。明白了。让我们取消美国AI。让公司计算以提高效率。等等,什么?
另一方面,即使担心中国可以访问更多用户的数据,许多人指出,因为他们同时发布了API,人们不必只使用DeepSeek应用程序。Perplexity的Aravind Srinivas写道:世界上最强大的推理模型DeepSeek R1及其推理轨迹现已在Perplexity上可用,以支持您的日常深度网络研究。尽情享受吧。
塞缪尔·哈蒙德也表达了类似的观点。在评论我刚才提到的那篇具体评论文章时,他写道:这篇文章在几个层面上都是错误的。DeepSeek在H100上进行训练。他们的成功揭示了需要投资于出口管制执法能力。接下来,思维链和推理时间技术使得获得大量计算能力变得更加重要,而不是更少,因为生成了数万亿个用于后训练的标记。此外,我们才刚刚进入出口管制的新一代芯片,因此中国“赶上”并不令人惊讶。
这些管制只有在今年和明年才会真正开始发挥约束作用,并在中美边界上产生差异。DeepSeek的首席执行官本人也表示,芯片管制是他们最大的障碍。出口管制也适用于半导体制造设备,而不仅仅是芯片。DeepSeek不是斯普特尼克时刻。他们的模型令人印象深刻,但在知情观察者应该预期的范围内。想象一下,如果美国政策制定者对实际的斯普特尼克时刻的回应是举手投降,说,啊,好吧,不妨取消对我们卫星技术的出口管制。这将是一个完全不相关的结论。
现在,科技行业喜欢DeepSeq公告的一件事是,它是一个真正的开源版本,包括API。更重要的是,这允许集成到不仅仅会将数据交给中国共产党的其他服务中。Perplexity首席执行官Aravind Srinivas写道:您在Perplexity Pro搜索中获得的DeepSeq本质上是美国的,无论是在价值观(没有审查制度)方面,还是在您的数据托管和存储方面。当有人问到,但是您仍然受DeepSeq AI模型中训练的内部审查制度的约束,对吧?
Arvon写道:不,他指出了对“台湾总统是谁”的专业搜索,该搜索实际上给出了答案。节目的朋友Venice AI也集成了DeepSeek。首席执行官埃里克·沃里斯写道:如果您想使用DeepSeek,但不想让所有对话都发送给中国共产党,请使用Venice.ai。所有对话都是私密的,仅存储在您的本地浏览器中。
现在,这并没有完全解决这个问题。在录制时,DeepSeek仍然是苹果应用商店中排名第一的免费应用程序,领先于ChatGPT、Threads、Gemini等等。当Aravind Srinivas再次试图向投资者比尔·阿克曼解释,他们可以将DeepSeek模型放入Perplexity这样的美国外壳中,这使其成为一个安全隐患较小的事实时,阿克曼说:大多数用户不会只是下载应用程序,而不会费心去做您上面描述的变通方法吗?根据这些应用商店的结果,这是一个合理的担忧。
DeepSeek方面利用了他们的病毒式传播时刻,决定发布一组新的图像模型。名为Janus Pro的模型既可以作为独立的图像生成器,也可以作为多模态AI的图像分析工具。DeepSeeker声称,这些模型在领先基准测试中优于OpenAI的DALI 3和Stability AI的Stable Diffusion XL。
这些模型似乎没有与XAI的Aurora或Black Forest Labs Flux模型进行比较。与R1一样,该模型采用独特的架构,DeepSeek将其描述为“一种新颖的自回归框架,既可以分析图像,也可以创建图像”。DeepSeek还声称其效率优于竞争对手模型,并表示他们“旨在平衡性能和计算成本”。
DeepSeek还不得不暂时限制新用户的注册,显然是因为大规模恶意攻击,尽管有些人想知道这是否是他们的基础设施难以应对峰值需求。那么,在这一切之后,我们还剩下什么?就市场而言,正如我所说,我认为这是过度反应。我坚定地认为,降低AI成本将增加对AI的需求,而满足这种需求将需要更多的计算能力。
然而,更进一步说,一些人指出,华尔街不仅不一定从长远来看以正确的方式考虑这个问题,而且即使他们考虑了,也无法否认降低智能成本对消费者来说是一件好事。投资者哈西布·库雷希写道:智能现在比我们想象的要便宜得多。这对所有AI消费者(也就是你和我)来说都是一件好事。记住,纳斯达克指数是一个生产者指数,而不是消费者指数。油价暴跌对石油公司来说是坏消息,但对我们这些开车的人来说是好消息。
投资者维贾伊·雷迪扩展了我们昨天讨论过的贾文悖论的思想,并明确表示它可能比我们想象的还要好。他写道:
我们已经看到这种情况在存储、虚拟化、云计算和现在的AI中上演。例如,以AI代理为例,让我们将贾文悖论扩展到代理悖论。随着AI的成本和延迟降低,我们开始开发行为更自主的代理式系统。AI变得更便宜更快,我们将同时推动更复杂的推理和自主性,这两个趋势可能存在冲突。这在复杂的多个代理系统中尤其如此,在这些系统中,我们需要更好的推理,因此需要更多的计算来减少蝴蝶效应并减少复合误差。
最终,他写道,对计算的需求几乎是无限的,而我们只是触及了多模态模型、代理、具身AI等的表面。然而,他的观点最终是,当涉及到代理时,AI成本和延迟的降低不仅会增加代理的使用,还会提高它们的推理能力。我认为,当一切尘埃落定后,DeepSeek过去一周带来的最大影响是摆脱了我们甚至没有意识到自己在AI行业中做出的先验假设的灰尘和蛛网。
它正在增强竞争动态,使AI初创公司更容易尝试新产品,并且通常可能会加速AI所能实现的下一波浪潮。并非没有风险,并非没有成本,并非没有挑战。但总的来说,至少从消费者的角度来看,很难不认为这是一个相当令人兴奋的时刻。
我希望并且相信,伙计们,这将是我在相当长一段时间内最后一次如此深入地讨论这个问题。本周晚些时候,我有一些很酷的事情要分享,包括对Notebook LM的创始工程师的采访。不过,现在,这将结束Deep Seek报道的第二天。一如既往地感谢您的收听或观看。直到下次,再见。