We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

The DeepSeek Panic

2025/2/2

What Next: TBD | Tech, power, and the future

AI Deep Dive AI Chapters Transcript

People

Zeyi Yang

主

主持人

专注于电动车和能源领域的播客主持人和内容创作者。

Topics

Zeyi Yang: 我认为市场对DeepSeek的反应有些过度。作为一年来关注中国AI模型发展的人,DeepSeek的出现虽然令人惊讶,但不足以引发整个市场的恐慌。美国和中国的AI竞赛存在差距,中国公司目前处于追赶地位,DeepSeek的出现并非改变游戏规则的事件,而是中国在AI领域持续努力的结果。DeepSeek创始人杨文芳的目标是推动人类向通用人工智能(AGI)发展。关于DeepSeek开源的意义,我认为这不仅在AI领域,在许多技术领域,封闭源和开源的竞争都非常激烈。开源意味着更多的人可以使用和改进产品,从而加快发展速度。DeepSeek的低成本和低能耗也为AI发展提供了另一种路径,这值得我们重新思考AI发展的方向。美国对中国的芯片出口管制促使中国寻找AI发展的替代方案,DeepSeek正是这种努力的体现。关于中美AI竞争的未来,我认为人们应该更多地关注中国在AI领域的进展,避免轻视中国公司的实力。DeepSeek的出现提醒我们,中国在AI领域并非没有竞争力,我们应该密切关注其发展,并从中吸取经验教训。主持人: DeepSeek的优势在于成本低、能耗低且为开源产品,这使其在与美国AI巨头的竞争中脱颖而出。DeepSeek的数据可能流向中国,这可能会引发美国立法者的担忧,但其开源特性降低了数据安全风险。 Zhuoi Wang & Leslie Keng: DeepSeek的用户体验与其他聊天机器人相似,易于上手,这有助于其在全球范围内的推广。 Zeyi Yang: OpenAI指责DeepSeek窃取数据,这与OpenAI自身被指控使用互联网数据训练模型的情况存在相似之处,这体现了AI时代版权的复杂性。公众对AI产品的需求可能比预想的要高,但人们是否愿意为AI产品付费仍是一个疑问。DeepSeek的成功并非对AGI叙事的挑战,而是对AI发展路径的重新思考。Stargate项目体现了美国政府和私营部门合作对抗中国AI竞争的决心。

Deep Dive

Chapters

The Chinese AI company DeepSeek released a new AI model, causing market fluctuations. The model, DeepSeek R1, is a chatbot similar to existing models but is significantly cheaper and more energy-efficient. This raises questions about the US's approach to AI development and its response, potentially signifying a shift in the AI landscape.

DeepSeek R1, a new AI chatbot, was released by a Chinese startup.
The model is significantly cheaper and more energy-efficient than US counterparts.
The market reacted strongly, with some viewing it as an overreaction.

Shownotes Transcript

当中国初创公司 DeepSeek 推出一款更节能、生产成本更低且开源的产品时,人工智能行业一片哗然。DeepSeek 来自何处?硅谷和华盛顿是否应该为此恐慌?嘉宾:Zeyi Yang,《连线》杂志高级撰稿人。想要收听更多 What Next TBD?订阅 Slate Plus,即可收听 What Next 系列节目和您最喜爱的 Slate 播客的无广告版本。点击我们节目页面顶部的“免费试用”,即可在 Apple Podcasts 上订阅。立即访问 slate.com/whatnextplus 注册,即可在您收听的任何地方访问。播客制作:Evan Campbell、Patrick Fort 和 Cheyna Roth。了解您的广告选择。访问 megaphone.fm/adchoices</context> <raw_text>0 本期节目由 Shopify 提供赞助。当您将业务切换到 Shopify(全球商业平台,可增强您在任何地方的销售能力)时,无需再为选择商业平台而烦恼。使用 Shopify,您将利用世界领先品牌使用的相同直观功能、值得信赖的应用程序和强大的分析工具。立即注册,享受每月 1 美元的试用期,网址为 shopify.com/tech(全部小写)。网址为 shopify.com/tech。

个人电脑让我们在家就能拥有计算能力,互联网将我们连接起来,移动设备让我们几乎可以在任何地方都能使用它。现在,生成式 AI 让我们能够使用自己的语言和感官与技术进行交流。但是,当你身处其中时,弄清楚这一切却完全是另一回事。欢迎收听《引领变革》。

这是微软 Azure 的一个新播客。我是主持人 Susan Etlinger。在每一期节目中,领导者们都会分享他们的学习成果,帮助您充满信心地应对所有这些变化。请加入我们。您可以在任何收听播客的地方收听和订阅。好的,市场正在对 DeepSeek 的说法进行深入思考,DeepSeek 声称它只用几个月的时间,不到 600 万美元就构建了一个 AI 模型。不是十亿,是百万美元。这只是美国公司在......方面支出的极小一部分。

本周早些时候,股市经历了一次令人心惊胆战的过山车式行情。以芯片制造商英伟达为首的纳斯达克指数在稍微平静下来之前,损失了万亿美元的市值。这一切都源于一家名为 DeepSeek 的中国人工智能公司及其于 1 月 20 日推出的新应用程序。

Zeyi Yang 对市场的混乱持些许怀疑态度。我的意思是,对我来说,我认为这有点反应过度。作为认识这家公司一年,并且一直在追踪中国 AI 模型发展的人,这对我来说有点惊讶,但不足以引起整个市场的巨大恐慌,对吧?就像整个市场一样。

Ziyi 为《连线》杂志报道中国科技新闻。关于 DeepSeek R1(这是这款新模型的名称)的一点是,它是一款 AI 聊天机器人。如果您尝试过 ChatGPT、Clod 或 Gemini,您会发现它并没有什么不同。

但它确实向您展示了模型在努力寻找您问题的答案时的“思考”过程。它反馈的信息表达方式可能会非常有魅力。当我要求它澄清某些事情时,它说:“你让我保持警惕。谢谢。”但真正让 DeepSeek 与众不同的是,它的制造成本非常低廉,比美国的 AI 聊天机器人消耗更少的电力,而且它是中国制造的。

是的,一段时间以来,美国和中国之间一直存在着某种悄无声息的 AI 军备竞赛。我想知道 DeepSeek 的发布是否真的加剧了这场竞赛。我认为是的。我认为它之所以一直很安静是有原因的。这是因为这场竞赛并非那种......

水平。像 ChatGPT 和美国芯片这样的美国 AI 模型一直更好、更快。而中国公司则一直落后于此。他们在 ChatGPT 发布六个月后发布了类似的聊天机器人,其性能达到了类似的水平。所以这场比赛正在进行中,但由于美国和中国之间存在明显的差距,人们只是......

今天的节目中,DeepSeek 可能不是 AI 版本的 Sputnik。

它揭示了美国 AI 方法中一个潜在的巨大缺陷。我是 Lizzie O'Leary,您正在收听 What Next TBD,这是一个关于技术、权力以及未来如何决定的节目。请继续收听。想象一下,当学习不会妨碍生活时,一切皆有可能。在 Capella 大学,我们具有突破性的 FlexPath 学习模式让您可以设定自己的截止日期,以便您可以按照适合自己的时间和节奏进行学习。

这是我的账单吗?

现在,Business Taxes 是一名 TurboTax 小型企业专家,他可以为您处理税务,并在无需额外付费的情况下提供全年咨询服务,以便您可以将更多资金留在您的企业中。现在这是税务。Intuit TurboTax。立即在 TurboTax.com/business 上获得专家帮助。仅适用于 TurboTax Live 全方位服务。我想知道我们能否回顾一下,您可以告诉我一下这个 DeepSeek 模型背后的故事。该公司由一位工程师创立,

杨文芳,他在投资界赚了很多钱。他开发这款应用程序的目标是什么?

他有点隐居。他不太与媒体交流。所以很难从他自己那里得到故事。但根据他的简历或他仅有的两次接受中国媒体采访的情况来看,他相信人类最终能够实现 AGI,即通用人工智能。他想成为推动人类朝着这个目标前进的人。

周一,DeepSeek 成为美国下载量最高的免费应用程序。我想知道您能否描述一下它的独特之处。有什么不同?

与美国用户可能熟悉的聊天机器人有何不同?ZHUOI WANG:好吧,如果您使用过该应用程序,我会觉得体验与聊天非常相似——LESLIE KENG:是的,确实如此。ZHUOI WANG:——对吧?我认为我还看到本周我的同事的报道,甚至只是应用程序的设计,比如应用程序的后台代码,都非常类似于 Open AI 产品。我认为这对美国人来说是一个尝试 DeepSeek 的好机会,因为没有学习曲线。

如果您是使用聊天机器人应用程序一年的人,您会发现 DeepSix 应用程序非常易于使用。我认为这有助于该产品在中国境外变得更受欢迎,更具病毒式传播性。但有一些事情让它与众不同。

即成本和计算量。你能为我描述一下吗?是的,我认为去年关于 v3 的模型,这是他们最新一代的模型,但没有针对推理任务进行微调,表明训练这个模型只使用了大约 580 万美元。哇。

与我认为美国人工智能公司所说的相比,这是一个非常小的数字。好吧,我需要提醒一下,这里有一些细微之处。他们基本上只是说,从他们上一代模型到这一代模型,只花费了 580 万美元。好吧,你还必须花钱来训练上一代模型。

而且我认为这并不包括他们支付给科学家进行这项研究的薪水。因此,实际数字必须比这大得多。但即便如此,这个数字本身也让业内许多人感到惊讶,因为他们会认为要完成这种任务,可能需要数千万甚至数亿美元。据我了解,DeepSeq 是开源的。这为什么很重要?是吗?

我认为是的。我的意思是,这不仅仅是在人工智能领域,在许多技术领域,封闭源开发和开源开发之间都存在这种竞争。

如果您是封闭源代码,您正在谈论我们现在所知的绝大多数科技产品,例如微软、谷歌。如果您想使用他们的产品,您必须向他们付费。您只能按照他们提供的方式使用该产品。您不能进入代码并查看如何调整这一点和那一点,因为这就是他们希望您使用它的方式。

开源是完全不同的领域。您正在谈论的是您只是将产品发布到互联网上,随附发布所有代码,任何想要将其用于自身商业用途的人都可以随意调整它。这就是 DeepSeek 所做的。例如,如果您是一家想要为您的特定用途(例如您的业务目的)调整 AI 模型的美国公司,那么这基本上是一个您可以免费使用的模型,而如果您使用 Chachapiti,则必须为提出的每个问题付费。

因此,他们将其作为开源发布的事实保证会有更多人愿意尝试 DeepSix 产品。当用户群体更大时,就会有更大的研究合作来进行我们的产品,然后我们将获得反馈。我们将获得关于如何更快改进它的建议。这有助于他们赶上封闭源代码公司。

我还对能源足迹感到好奇,因为我们目前看到的美国大型模型需要大量的计算能力,这在后端意味着更多的服务器、更多的电力,甚至可能需要重启核电站。那么能源使用情况如何比较呢?我认为 DeepSeek 无意中所取得的成就,是为人工智能产业的发展提出了一条替代途径。

到目前为止,由于 OpenAI 一直是成功的闪亮明星,所以每个人都只是继续遵循他们的途径,那就是获取更多 GPU,将它们用于更长的训练时间,并相信规模效应将使我们能够获得有史以来最强大的 AI 模型。我认为硅谷和政府部门的大多数人都已经接受了这一点。

但是有了 DeepSeq,这是一个重新考虑所有这些计算的机会。就像以前我们认为,哦,我们正在牺牲很多环境影响,因为也许我们实现更好 AI 的唯一途径就是牺牲环境。

但现在人们认为,实际上,如果有一种方法可以将我们的资源投入到使我们的模型更高效、更便宜、更容易训练,那么这比继续购买更多芯片具有更大的边际回报。所以我认为......

我真的很想看到更多受 DeepSeq 成功启发的对话。也许我们不必专注于获取更多芯片和数据中心来提高我们的 AI 能力。有很多想法可能在这个时候甚至都没有被探索过,因为人们只是认为只有一种方法。我想把这个放在一点地缘政治背景下。你一直在报道中国的科技新闻。

有没有办法来描述一下中国政府和中国公司对人工智能发展的方法?我认为这非常有趣,而且也在不断变化。现在,我认为我们正处于一个时期,

中国政府和中国公司都想赶上,尤其是在 ChiaGPT 发布之后。我认为中国的许多人,无论是在政府还是在私营公司,都对人工智能的进步程度感到震惊。

所以从那时起,我相信从 2022 年到现在,一直都有这样的模式:“哦,我们必须赶上 CHIPE 和 GBT。我们该如何做到这一点?”你可以说,没关系。我们该如何做到这一点?政府一直觉得他们对科技行业很严厉。但也许我们需要放松一点,以确保我们的公司保持竞争力。

他们说,好吧,你想做什么就做什么。只是尽量不要搞砸。但在这种范围内,你想做什么就做什么。2022 年,美国实施了出口管制措施,旨在限制中国获得人工智能半导体、制造设备,真的试图囤积它。

如果我可以这么说的话,最好的东西。中国是如何回应的?所以他们没有意识到芯片在人工智能产品制造中如此重要。而且美国对全球芯片供应链有如此大的控制权。

过去两年发生的事情是,美国政府一直在建立和加强这种芯片出口管制制度,以确保中国公司很难在中国购买最先进的芯片。这对中国基本上每一个 AI 公司来说都是一个挑战,因为他们想要最好的芯片。他们想利用它们来遵循 OpenAI 走过的道路。

但这现在是不可能的。这就是 DeepSeq 冒险寻找训练模型最有效方法的部分原因,因为他们已经知道,在可预见的未来,他们获得先进 GPU 并不容易。所以你最好专注于其他事情。出口管制的另一个后果,我想说的是,中国正在推动发展自己的 GPU。

对。但这需要很长时间和大量的资源,因为你知道芯片是如此复杂的硬件。他们正在取得一些进展,但人们仍然认为他们可能需要十年才能赶上。而人工智能将在十年内取得很大的进步。所以我认为许多中国公司或政府仍然担心他们是否真的能够在芯片方面赶上。休息过后,如果中国赶上,美国计划做什么。

本期节目由 Indeed 提供赞助。当您的电脑出现故障时,您不会等待它奇迹般地再次启动。你会解决问题。那么,为什么还要等待招聘公司迫切需要的员工呢?使用 Indeed 的赞助职位快速招聘顶尖人才。更好的是,您只需为结果付费。无需等待。使用 indeed.com/podcast 上的 75 美元赞助职位积分加快招聘速度。适用条款和条件。

本期节目由亚马逊提供赞助。有时,生病最痛苦的部分是康复的部分。等待预约电话、坐在拥挤的候诊室、在药房排队,这些都很痛苦。亚马逊 One Medical 和亚马逊药房通过 24/7 全天候虚拟就诊和将处方药送货上门等方式消除了康复过程中的痛苦部分。感谢亚马逊药房和亚马逊 One Medical,医疗保健变得不那么痛苦了。

当我查看美国政府本周的回应时,发生了很多事情。在新任商务部长霍华德·卢特尼克的确认听证会上,他表示,我在这里引用一下,“对中国持非常偏见的看法”。然后,当您使用 DeepSeek 时,您的查询数据可能会发送到中国。您认为立法者会像对待 TikTok 和字节跳动那样做出反应吗?

我认为这是非常有可能的,因为我们在过去几年中看到,数据安全是美中科技紧张关系中最大的担忧之一。它确实以这种方式表现出来,即美国政府担心美国公民使用中国应用程序并无意中将其数据发送到中国。

这是禁止 TikTok 在美国上市的主要理由之一。禁止 TikTok 的具体法律的制定方式确保它也可以涵盖其他中国公司。

所以我想说,如果政府真的想这么做,将它应用于 DeepSeq 并确保大多数美国人无法轻松访问 DeepSeq 将非常容易。但同样,回到 DeepSeq 是一个开源模型的事实,这实际上也意味着,如果您想使用它的模型,您可以通过不向 DeepSeek 的中国服务器发送任何数据来做到这一点,但仍然可以享受该模型的功能。

所以在这种意义上,它不太是一个安全问题,因为您不必像 TikTok 一样通过中国公司。在这一切的中间,我们得到了 OpenAI、甲骨文和软银将联手组建 Stargate 的公告。特朗普总统宣布了此事。我看着它。

我想知道,好吧,如果我们试图将这一公告置于这种冷酷的 AI 战争的背景下,它适合在哪里?

我认为这确实是一个例子,说明美国政府和私营部门正在走到一起,并认识到与中国或其他地缘政治力量竞争的重要性。因为以前你最多看到的是,也许美国政府担心安全或国家利益

一些企业会说,好吧,我们不想要那么多法规。我们只想做我们想做的。但当我看到这个 Stargate 项目的公告时,我在想,哦,他们真的在结合他们的力量。他们说,我们现在的首要任务是确保美国保持领先地位,而中国则落后。正因为如此,我们愿意忘记我们之间的一些分歧,而只是专注于这个非常昂贵的项目。

还发生了一件我认为在所有这些事情中都具有讽刺意味的事情,OpenAI 出来说 DeepSeq 滥用了其模型的数据。但当然,这与许多作家、记者以及只是制作内容并将其发布到互联网上的人对 OpenAI 提出的指控几乎相同,即它正在使用我们的数据来训练其大型语言模型。

我看到这里有点讽刺意味,我错了吗?我和你一样。我认为......

问题是,人工智能时代的版权非常混乱,对吧?由于这些公司中的大多数都没有真正公开它们如何收集和使用数据,因此您只是在这里进行猜测。他们之所以会引发人们对 DeepSeek 是否抄袭 OpenAI 或使用了其数据的调查,是因为有时当您询问 DeepSeek 的机器人,比如,你是谁?他们会回答说,哦,我是 Chad GPT 或我是 GPT 3.5 或

其他什么。人们认为这是证据,哦,你一定是从 GPT 抄袭的。这只是原因之一。我认为这并不是唯一的原因。这是一种解释。另一种解释是,人们现在已经将从 ChatGPT 获得的如此多的答案发布到互联网上。也许 Deepsea 只是裁剪了

所有这些并从所有这些标签中学习。最终,它被训练成相信,哦,我是 ChatGPT。当我回答问题时,我会以 ChatGPT 的语气回答。他们只是在抓取模型的输出,还是只是从那里复制模型结构和所有内容?我认为 OpenAI 现在可能正在试图弄清楚这一点。

所以它实际上可能是一个问题,模型中的一些输入是先前模型的输出。没错。这太混乱了。它还说明了这样一个问题,即人们已经用尽了网络上的所有训练数据,只是试图抓住他们拥有的任何东西。他们不在乎它是否是高质量的,是否来自另一个模型。如果您是一段连贯的文本段落,我想要您,我希望您被训练到我的模型中。

本周早些时候,我有一次有趣的经历,我把新的 DeepSeek 模型放在我的手机上,并将我从中获得的答案与 ChatGPT 进行比较。所以我决定看看它能告诉我关于我自己的什么信息。

这两个模型都错误地坚持认为我去过不同的大学。他们都没有说出我上的大学。但他们不断地回来告诉我这是错误的。所以这确实让我怀疑,虽然正在发生这些惊人的技术进步。

LLM 输出的内容不一定仍然正确。我会说,有些人认为 DeepScape 是 OpenAI 的一个更好的替代品,就性能或输出而言。我不一定会这么认为。我认为他们提供的产品相当或非常相似。ChatGPT 犯的错误,DeepScape 也可能犯同样的错误。

而且我们还处于测试产品的早期阶段,以真正了解它的能力。我不会将 DeepSeq 的成功视为对 AGI 叙事或这种主要叙事(我们真的应该关注 AI)的强烈抵制,因为它仍然存在这种叙事所具有的许多问题。这就是我在这里要去的地方。

因为在过去一周中,所有这些热度和关注,我仍然对消费者需求有疑问。是的,个人消费者,还有企业消费者。显然,硅谷和许多中国科技公司认为人工智能是未来的发展方向。你看到了吗......

相应的需求表明那里的消费者真的想要在所有事物中都使用人工智能。

如果我们谈论的是个人,像我们这样的普通人,我实际上觉得胃口比我以前认识到的要大,因为我一直和我的朋友们聊天,比如和他们一起旅行。我意识到他们中的许多人已经开始养成使用 ChatGPT 作为搜索引擎的习惯。他们根本不使用谷歌。所以我真的认为这些经历让我重新思考人们的工作方式

想要采用这样的 AI 产品。我注意到的另一件事是,DeepSeq 的最新模型 R1,它被发布为一个非常擅长数学和推理的模型。我想大多数人都在为此测试它。但在中国,也有很多人要求该模型写诗。他们对......

它的输出感到非常惊讶。我认为人们在那里有一些真正的快乐,只是加入了,哦,这个家伙刚刚为我写了这首美丽的诗,我真的很喜欢它。所以我认为人们可以通过某种方式利用这些 AI 模型

但他们愿意为此付费吗?也许不会。DeepSeek 目前是完全免费的。我认为商业方面有很多假设是建立在人们愿意为从模型中获得的这种享受或知识付费的基础上的。我不太相信这种假设。你认为 DeepSeek 是否从根本上改变了我们对这个行业的想法?

中国和美国之间悄无声息的人工智能竞争?我认为我希望人们更多地关注中国在人工智能方面发生的事情。很多时候,人们很容易贬低他们。哦,他们仍然实力较弱。他们仍然受到审查。所以我们根本没有理由谈论他们。我认为这种无知确实造成了这种,我想,缺乏关注、研究以及

试图更多地了解中国正在发生的事情。我的意思是,我是一个一直关注他们的人,但我同时也觉得我希望更多的人,至少是在这里的人工智能行业,至少承认有时当他们将其发布供公众免费使用时,我们可以利用它,我们可以利用它

也用在我们的模型中。有时当他们确实取得了非常快速的突破,我们需要对此有所警觉时,我只是希望有更多的对话,以及更多的人随意地更多地关注地球另一边发生的事情。非常感谢您来参加节目并与我交谈。当然,这是一次非常有趣的谈话。Zui Yang 是《连线》杂志的高级科技撰稿人。

这就是我们今天节目的全部内容。What Next TBD 由 Evan Campbell、Patrick Fort、Shaina Roth 和 Paige Osborne 制作。我们的节目由 Elena Schwartz 编辑。TBD 是更大的 What Next 系列的一部分。如果您喜欢您听到的内容,您可以做的最重要的事情就是加入 Slate Plus。您可以收听所有 Slate 播客(如本节目)的无广告版本,并且您永远不会在 Slate 网站上遇到付费墙。好了,我们下周将推出更多节目。我是 Lizzie O'Leary。感谢收听。

The DeepSeek Panic 28:57 Share

What Next: TBD | Tech, power, and the future

Deep Dive

Shownotes Transcript

The DeepSeek Panic