We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

DeepSeek deepdive

2025/1/30

Today, Explained

AI Deep Dive AI Chapters Transcript

People

美

美国总统

Topics

Satya Nadella: 我认为DeepSeek有一些真正的创新,这代表着AI领域令人瞩目的进展。 Mark Zuckerberg: DeepSeek在技术上取得了一些突破,其创新之处值得我们深入研究和学习,这对Meta未来的AI发展具有借鉴意义。美国总统: 中国公司发布DeepSeek AI应该成为我们行业的警钟,我们需要专注于竞争以赢得胜利,这关系到美国的国家安全和技术领先地位。 Eleanor Olcott: DeepSeek以低成本实现了与西方领先模型相当的性能,这源于其创始人梁文峰的远见卓识和对技术的专注,以及其在早期就布局AI技术和GPU集群的战略选择。DeepSeek V3是第一个性能优于闭源模型的开源模型,这在业界引起了巨大的反响,也引发了人们对中美AI竞争的关注。DeepSeek的成功并非简单的“AI 斯普特尼克时刻”,而是中美科技战的体现,真正的竞争焦点在于AI芯片的研发。DeepSeek的创始人并非以盈利为主要目标,而是致力于推动AI技术发展和提升中国在该领域的国际地位,并愿意开源其技术成果。 Reid Albergati: 股市对DeepSeek的反应过度,市场尚未完全理解AI行业。DeepSeek的低成本优势并非完全否定西方公司巨额投资的必要性,因为模型推理的成本仍然很高,而且模型的效率提升空间仍然很大。DeepSeek可能利用OpenAI模型的数据进行了知识蒸馏,这在AI行业是一个灰色地带,需要进一步规范。DeepSeek的出现对英伟达的影响有限,英伟达的竞争优势在于其强大的GPU和CUDA软件。中美两国在AI领域的竞争关系紧张,AI技术可能被用于军事用途,美国对AI芯片出口的限制也反映了这种担忧。DeepSeek的出现激发了AI行业的竞争活力,同时也促进了AI研究成果的共享。如果美国输掉AI竞赛,可能会导致严重的国际冲突。 Sam Altman: DeepSeek的出现是令人振奋的,这将激励OpenAI和其他公司开发更优秀的AI模型,良性竞争将推动AI技术更快发展。

Deep Dive

Chapters

DeepSeek, a Chinese AI model, has sparked significant interest and concern globally due to its performance and low development cost. It's an open-source model surpassing closed-source competitors, creating a stir in the tech industry and raising questions about AI competitiveness.

DeepSeek's performance is comparable to leading Western AI models.
It was developed at a significantly lower cost.
DeepSeek V3 is the first open-source model to outperform closed-source models.
Its release caused market chaos and widespread discussion.

Shownotes Transcript

每个人都在谈论DeepSeek。DeepSeek。微软的萨蒂亚·纳德拉。我认为DeepSeek确实有一些真正的创新。Meta的马克·扎克伯格。你知道,我认为他们做了一些新颖的事情,我认为我们仍在消化......

他们有一些进步,我们希望在我们系统中实施。美国总统?中国公司发布DeepSeek AI应该成为我们行业的警钟,我们需要专注于竞争以赢得胜利。它是一个聊天机器人。它是一篇白皮书。它可以帮助编写俄罗斯方块游戏的代码。俄罗斯方块。

它可以解决数学定理。是芯片,伙计们。在《今日详解》中,世界因DeepSeek而疯狂的一周。还有,什么是DeepSeek?即将到来。

《今日详解》的支持来自Attentive。你注意到了吗?如何在拥挤的短信和电子邮件营销世界中帮助您的业务脱颖而出?Attentive想要提供帮助。Attentive是一个短信和电子邮件营销平台,旨在帮助营销人员将每一次互动转化为个性化体验。Attentive的先进人工智能会调整每条消息的内容、语气和

和时间,以帮助营销人员建立并与合适的受众联系。如果您想让您的客户踏上专为他们设计的旅程,请访问attentive.com/today-explained了解更多信息。本集由Shopify赞助。

当您将业务切换到Shopify时,忘记选择商业平台的烦恼,Shopify是全球商业平台,可在您销售的任何地方增强您的销售能力。使用Shopify,您将利用世界领先品牌使用的相同直观功能、值得信赖的应用程序和强大的分析工具。立即注册,享受每月1美元的试用期,网址为shopify.com/tech(全部小写)。网址为shopify.com/tech。

您正在收听《今日详解》。Eleanor Olcott是《金融时报》的中国科技记者。我们在北京联系到她,在那里她从一开始就一直在关注DeepSeek。我第一次听说这家神秘的AI公司是在2023年初,因为我的一个联系人说,这家对冲基金悄悄在中国建立了最大的NVIDIA GPU集群之一。

所以NVIDIA GPU是图形处理单元。这些基本上是运行AI模型训练和推理所需的AI芯片。对于这场AI竞赛来说,它们非常非常重要。而且它们在中国非常短缺。所以不知何故,这家量化基金,也就是一家对冲基金,

在中国悄悄地建立了全国最大的集群之一。我们注意到了,他们在过去一年中开始发布越来越多的高级模型。

当我们在2024年底的圣诞节假期时,他们的作品终于突破了西方的意识,推出了这款新的模型V3。这是一个让整个硅谷都兴奋的新模型,它并非来自OpenAI、Meta、谷歌或任何其他知名公司。

DeepSeek v3是AI历史上第一个优于闭源模型的开源模型。DeepSeek 3.0版本是免费的,而且绝对令人难以置信。后来在1月份,它又发布了另一个模型,再次以其复杂性震惊了世界。

这里关键的一点是,它们引发了某种程度的存在危机,尤其是在美国参与者中,原因是他们声称是以如此低的预算完成的。♪

好的。当我了解DeepSeek时,是因为这家中国公司制造了这个东西的消息导致股市彻底崩盘。本周早些时候到底发生了什么?我的意思是,股市是一个非常神秘的野兽,对吧?我的意思是,我们在《金融时报》上一直在写DeepSeek和其他中国公司如何构建真正具有竞争力的模型

几个月了。但我认为过去一周发生的事情是,我们在Twitter上看到了所有这些疯狂的活动。

人们并不是想让DeepSeek获胜。他们是想让OpenAI输。DeepSeek R1是我见过的最令人惊叹和印象深刻的突破之一。DeepSeek这个,DeepSeek那个。给世界一份深刻的礼物。你为什么不寻求与女性建立深厚联系呢?就我个人而言,我会远离DeepSeek。我不想让中国人监视我,看看我在TikTok上观看的是什么类型的视频。等等,等等,等等。

星期一发布的是一个时刻,对吧?这非常非常重要,因为它......

DeepSeek,这个鲜为人知的中国实验室,首次发布了一篇论文,对构建推理模型进行了非常非常详细的解释,一种技术配方。现在,推理模型很重要。这是AI领域一个相当新的领域,但它基本上意味着可以自学和自我改进而无需人工监督的模型。

这非常重要,因为如果我们可以将其用于实际应用,这意味着AI将能够进行批判性思维,并将用于比我们目前市场上更复杂的任务。

梦想是,例如,让AI在您的计算机后台运行,并预测您的需求,例如预订旅行,做您甚至可能没有想到的事情。它就像您的实际个人助理一样。他们不仅仅响应需求。他们会抢先行动。

你好,Noelle。今天我能为你做什么?他们自己做决定。例如,他们可能会发现你的冰箱里没有足够的杂货,然后想,好吧,我们会主动订购,这样你甚至不必自己动手,对吧?我本周多订购了奇多。你值得拥有。我们是否会实现这一目标,这仍然是一个悬而未决的问题。同样重要的是要注意,这就像

许多AI公司也采取的一种大型营销策略,以证明继续筹集数十亿美元的合理性。但我认为DeepSeek过去一周证明的是,中国在这个领域是一个可行且具有竞争力的参与者。所以让我们谈谈DeepSeek的起源。谁是幕后推手?

与其他AI公司、中国的AI初创公司不同,它没有获得任何外部融资。所以你会想,好吧,一家公司是如何设法建立我们所知道的购买所有这些GPU以及雇用最优秀人才的非常昂贵的努力的呢?他们以支付中国顶级AI研究人员最高薪水而闻名。

这基本上是关于创始人梁文峰的故事,他拥有量化对冲基金经理的背景。所以他基本上通过交易股票赚了很多钱,并决定将其中一些资源投入到这个新的宠物项目中。他从2021年开始建立这个大型NVIDIA集群,因为他认识到这项技术的潜力。

这个时间点很重要,原因有两个。首先,这确实是在世界意识到生成式AI的潜力之前。这在ChatGPT发布之前。我们,你知道,其他中国参与者已经忽略了生成式AI作为研究领域。他们更关注监控技术、监控AI,因为很明显你可以通过这种形式的AI赚钱。

另一个重要原因是,这确实是在第一批针对中国的全面出口管制措施生效之前。这些限制将限制中国公司获得先进计算机芯片的机会,并减缓他们在人工智能方面的进展。

在美国加强其芯片出口规则后,美国芯片制造商英伟达和AMD暴跌。华盛顿表示,其目标是防止北京将最先进的半导体用于其军事现代化。所以实际上,当2023年初中国开始复制这场竞赛时,

或试图复制OpenAI的成功,梁和DeepSeq实际上处于领先地位。好的,所以一位杰出的男士赚了很多钱,现在大概会赚更多钱?这是目标吗?

这不是目标。实际上,这就是DeepSeek如此独特的原因,对吧?他们没有采取任何认真措施来商业化他们的技术。他们有一个AI聊天机器人。它是免费使用的。

我认为他在这里所做的事情,以及从认识他的人那里了解到的情况是,他想为大型语言模型研究的伟大典范做出贡献。他想推动这项技术向前发展。实际上,这里也有一些民族自豪感,对吧?在接受国内媒体采访时,他说中国也参与这项技术的发展并成为领导者很重要

在发展这项技术并成为领导者方面发挥作用。所以我认为这里有各种各样的野心,但他是一位纯粹的技术专家。实际上,因为DeepSeek对商业化其技术不感兴趣,对吧?它就像一个纯粹的研究实验室。人们向我描述它就像DeepMind的早期阶段,你只有一群工程师,一个

在他们认为是最佳技术途径的任何事情上。但由于他们不关心商业化,这意味着他们愿意与世界其他地区分享他们如何做到这一点的秘密,并让其他人也能从他们的经验中学习。对于像OpenAI这样的参与者来说,他们也在进行同样的研究,但没有告诉世界他们是如何做到的,这确实是一个挑战。

本周早些时候,当股市震荡时,我们听到人们在问这是否是AI的斯普特尼克时刻。所以他们指的是苏联在50年代之前将卫星送入太空,这开启了太空竞赛,这是一件大事。你很少听到这些术语,因为斯普特尼克时刻是一个重要的时刻。你认为这一发展是否开启了AI竞赛?

作为一名记者,我非常喜欢奇特的隐喻和比较。我认为在这种情况下,这种比较并不完全正确,对吧?就像DeepSeek是一家一直在进行AI研究的私营公司。它不是在建造火箭送入太空。

但话虽如此,美国和中国不可否认地处于科技战争之中。我们从2019年就知道这一点。中国非常非常担心美国在AI方面领先。它一直在为他们认为将有助于保持竞争力并获得优势的特定参与者提供大量支持。

但实际上,斯普特尼克元素实际上是关于硬件本身,即AI芯片。我认为这里真正的竞争在于中国公司和整个中国生态系统试图将华为或其他中国竞争对手之一打造成英伟达的真正长期成功竞争对手。

《金融时报》驻北京记者Eleanor Olcott。接下来,DeepSeek的竞争对手(看看你,OpenAI)能否竞争?今天的节目支持来自Vanta。Vanta说,信任不仅仅是赢得的,而是被要求的。

你最近要求过别人的信任吗?无论您是应对首次审计的初创公司创始人,还是经验丰富的安全专业人员正在扩展您的治理、风险和合规计划,证明您对安全的承诺至关重要且复杂。这就是Vanta发挥作用的地方。你知道交易。Vanta说他们可以帮助企业建立信任

通过自动化35个框架(如SOC 2和ISO 27001)的合规需求。他们说他们还可以集中安全工作流程,将问卷调查完成速度提高多达五倍,并主动管理供应商风险。您可以加入超过9000家全球公司,例如Atlassian、Quora和Factory,他们使用Vanta,

以实时管理风险并证明安全性。在有限的时间内,我们的观众可以在vanta.com/explained获得1000美元的Vanta折扣。网址为V-A-N-T-A.com/explained,可享受1000美元的折扣。

本集由LifeLock赞助。新年带来新的健康目标和财富目标。保护您的身份是一个重要的步骤。LifeLock每秒监控数百万个数据点。如果您的身份被盗,LifeLock的恢复专家将保证修复它,否则将退还您的钱。通过LifeLock,决心将身份、健康和财富作为您新年目标的一部分。第一年可节省高达40%。访问LifeLock.com/podcast。适用条款。

您正在收听《今日详解》。我是Noelle King,与Semaphore的技术编辑Reid Albergati在一起。Reid,星期一人们对DeepSeek的反应非常强烈。市场正在波动。人们都在喊着斯普特尼克。它在每个人的主页上。你对这一切怎么看?好吧,我当时真的在拍我的额头,因为我认为这是一个完全的过度反应。人们知道这家公司存在。事实上,这个想法的全部内容是

你知道,将这些更大的模型提炼成更小、更强大的、更高效的模型。自从ChachiPT问世以来,这种情况一直在发生。对我来说,最大的收获是市场真的还不了解AI行业。DeepSeq的所有西方竞争对手都在做什么?他们一直在做什么?

他们都在大力投资这些巨大的数据中心。我很荣幸欢迎三位世界领先的技术公司首席执行官。拥有数十万个图形处理器,数百亿美元。事实上,您可能上周听说过一项价值5000亿美元的交易。星门。所以把这个名字记在你的书里。与OpenAI、Oracle、MGX和软银合作。我的意思是......

巨额资金。我认为这将是这个时代最重要的项目,用于构建AGI,创造数十万个就业岗位,在这里创建一个新的产业中心。这项投资是为了运行这些模型,因为需求量很大。这些公司现在真的无法满足需求。我们还发现,推理,这只是一个消失的

运行这些模型的奇特术语实际上现在可以大大提高模型的能力。在Chat GPT首次问世之前,情况并非如此,嗯,你只是提示Chat GPT。它会返回一个答案。现在,您提示这些模型中最先进的模型。嗯,他们在后台做了一大堆事情。他们一遍又一遍地运行。他们试图找到最好的答案。那是

呈指数级增长。这种情况只会持续下去。DeepSeat推出的这款新的R1模型是一个进步,但它还不足以否定这些市场动态。

你能解释一下为什么吗?因为,是的,我也看到了。DeepSeek以低成本做到了这一点。所有这些金钱、精力和投资都是徒劳的,因为他们想出了一个小型AI,而且成本甚至不高。是的,我的意思是,他们表明你可以以更低的成本进行一些此类查询,但这还不够低。你可能已经看到微软首席执行官萨蒂亚·纳德拉谈到了贾文悖论。

贾文悖论再次出现。你知道,基本上是这样的,随着技术的效率提高和成本下降,你知道,悖论是,你会认为,好吧,这仅仅意味着它变得更便宜了,而这些公司将不会从中赚到那么多钱。但实际上发生的事情是,你知道,它变得更有用,人们也更想使用它。

然后在我们发言前几个小时的星期三出现了一个新的问题。有人建议DeepSeek可能已经

来自OpenAI或从OpenAI窃取?指控是什么?人们看到了什么,说了什么?你知道,这是偷窃。我的意思是,这是一个非常强烈的词。我们看到了即将上任的AI沙皇大卫·萨克斯,他指责DeepSeek从OpenAI窃取。有充分的证据表明,DeepSeek在这里所做的是,他们从OpenAI的模型中提取了知识。我认为OpenAI对此并不高兴。所以,

所以,你知道,你需要数据来训练这些AI模型,但你实际上可以做的是,你可以使用模型本身来创建一种非常非常特殊的类型的数据。这确实是合成数据,因为它是由AI模型生成的。但是你可以创建,你知道,你想要的那种数据,你可以用其他AI模型检查它。而且

你最终得到的是,这就是你使这些模型更高效的方式。这也不足为奇,因为所有这些模型都是这样工作的。我的意思是,我们已经看到很多公司这样做。所以,再说一次,蒸馏过程完全有道理。它是否属于盗窃,我认为这是一个问题,这是AI行业中我们尚未解决的一个灰色地带

尚未解决。我认为这是一件如此新鲜的事情,我们必须制定规范、规则和法规,甚至可能是围绕此的版权法。我想问你一下英伟达,这家公司生产AI所需的芯片。英伟达现在基本上已经家喻户晓。它占据了股市很大一部分。所以当英伟达的股票上涨时,我的401k也在上涨。当它下跌时,我的天哪,我将在桥下退休。星期一,

这座桥看起来像是一个真正的可能性。星期一英伟达到底发生了什么,为什么它似乎受到这个消息的严重打击?是的,英伟达生产这些图形处理单元,它们是世界上最强大、最先进的。

而且它们非常昂贵。我的意思是,旧型号H100是当时最先进的,每个售价约为40,000美元。这些数据中心大约有10万个这样的设备。所以,你知道,你算一下。英伟达正在销售大量的这些芯片。实际上,他们卖得不够多。需求量远远超过他们的生产能力。

这是因为这些模型需要大量的能量来运行。因此,如果您拥有一个更高效的模型,不需要这些强大的GPU,那么您现在可能不需要在OpenAI上花费40,000美元购买GPU。但是,再次......

你知道,这里并没有真正发生这种情况。这里发生的事情是,这些模型的效率提高了一点,但是为了充分利用它们,你需要对它们进行大量的推理。你仍然需要非常强大的GPU。而且,

随着模型预训练部分的更多进步,它们将变得更大、更强大。所以英伟达不会消失。我的意思是,他们当然有竞争对手。有一些芯片制造商想要制造更高效的推理芯片

有些人想要摆脱英伟达的优势,那就是它的CUDA软件,整个AI行业基本上现在都在运行它。这为他们创造了一个巨大的护城河。我认为这些才是英伟达的风险,而不是......

你知道,一个公司建立了一个更高效的开源AI模型。我认为许多观察者、分析师和记者将此描述为中国赶上美国是有原因的。这是因为中国和美国正处于一场悄无声息的战争、冷战、生存斗争中。我们与中国人竞争。它确实提出了一些问题,不是吗?关于中国有多么担心

美国应该担心中国在人工智能竞争中击败我们。是的,这就是我认为确实存在关于中国和人工智能的国家安全担忧的地方。而且,你知道,如果中国赢得了AI战争,AI竞赛,让我们这么说吧,它可能会给他们带来军事优势。我的意思是,这一切——这都是遥远的未来。

对此有很多争论,对吧?但我的意思是,我认为传统观点是,如果你赢得了AI竞赛,并且你首先获得了AGI或超级智能,或者你想称之为任何东西,它都会很快成为一种军事工具。我认为美国,这就是美国投入如此多精力来弄清楚如何限制向中国出口最强大的AI芯片的原因。他们不想看到

你知道,能够在人工智能方面掌控自己的命运。里德,在本周的事件之后,是否有重新焕发竞争力的感觉?就像每个人现在都需要以更低的成本更努力、更快、更聪明地工作?是的,好吧,你看,我认为萨姆·阿尔特曼在X上说这令人振奋。

我们显然会提供更好的模型。此外,拥有一个新的竞争对手是合法的振奋人心的事情。这就是研究的运作方式。有人提出一个新想法,它会在创造性和竞争性方面激励其他人。

这是我们在过去几年甚至更长时间里在AI中看到的动态。这就是为什么这么多科技公司长期以来一直在发表他们的研究成果,而不是将其作为商业秘密保守的原因,因为......

撰写这些论文的天才研究人员,他们想展示它们。他们想要在NeurIPS会议上炫耀。这是每年一度的AI大型模型会议。他们想得到同事的赞扬。我认为OpenAI、Anthropic和DeepSeek的研究人员之间可能存在很多相互尊重。

我认为在这个世界里,我认为有可能把所有的地缘政治放在一边,然后说,嘿,干得好。你创建了一个非常有趣的模型,我们将从中学习并努力做得更好。我认为另一种看待它的方式是,看,

看,如果美国没有赢得AGI竞赛,那么你可能会看到中国的军事优势,这会导致台湾被入侵,甚至可能导致这两个超级大国之间爆发热战。那将非常非常糟糕。

我认为那些最狂热的反华人士,他们真正想要的是美国军事优势如此之大,以至于不会发生战争。我认为如果你从这个角度来看,那么是的,我的意思是,这场AI竞赛在地缘政治上非常非常重要,如果达不到正确的结果,后果将非常严重。

Semaphore的Reid Albergati,感谢他。Miles Bryan和Victoria Chamberlain制作了今天的节目,并得到了Amanda Llewellyn的协助。Amina El-Sadi是我们的编辑。Andrea Christen的女儿和Rob Byers负责工程。Laura Bullard检查事实。我是Noelle King。这是《今日详解》。

DeepSeek deepdive 27:52 Share

Today, Explained

Deep Dive

Shownotes Transcript

DeepSeek deepdive