We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
M
Marc Andreessen
联合创始人和风险投资家,专注于人工智能和技术领域的投资。
N
NLW
知名播客主持人和分析师,专注于加密货币和宏观经济分析。
Topics
NLW: DeepSeek的AI模型对美国在人工智能领域的领先地位提出了挑战,尤其是在开源与闭源的辩论中。我观察到,DeepSeek的应用程序因其高质量的推理模型而受欢迎。虽然OpenAI最初是开源的,但后来出于安全考虑改变了政策,停止完全分享研究成果。然而,许多人质疑OpenAI的闭源策略,认为这更多是出于竞争而非安全考虑。DeepSeek的出现改变了关于开源与闭源AI的讨论,促使我们重新思考美国的AI发展策略。 Eric Schmidt: (通过AI生成) DeepSeek的R1推理模型在逻辑任务上与OpenAI的GPT-4相当,且成本更低,其整个模型集合都是开源的,允许任何人复制和构建。中国公司正在成为事实上的开源领导者,而大多数美国公司则保持封闭,这是一个奇怪的转变。为了保持竞争力,美国必须支持开源生态系统的发展。DeepSeek的成功质疑了预训练的重要性,并展示了如何通过强化学习以更低的成本进行推理训练。我认为DeepSeek的发布标志着一个转折点,美国创新的前进道路不仅包括加强开源开发,还包括鼓励分享培训方法和增加对人工智能研发的投资。 Marc Andreessen: (通过NLW引用) 我认为对开源AI的恐惧是为了监管和扼杀开源AI。关于AI的秘密已经泄露,开源实现将大量涌现。每个人都知道如何编写transformer,如何进行RLHF,如何使用强化学习进行推理。除了DeepSeek和LLAMA之外,还将有成千上万的开源实现。这无法被放回盒子里。 Sam Altman: (通过NLW引用) 我认为OpenAI可能在开源问题上站错了队,需要新的开源策略。

Deep Dive

Chapters
The emergence of DeepSeek, a Chinese AI company, has challenged the US's dominance in AI. DeepSeek's open-source models are surprisingly competitive, raising questions about the US's closed-source approach and its implications for future AI development. The discussion covers the cost-effectiveness and performance of DeepSeek's models compared to those of OpenAI.
  • DeepSeek's AI models challenge US AI dominance.
  • DeepSeek's open-source approach contrasts with the closed-source models of US companies.
  • Cost-effectiveness and performance of DeepSeek's models are key discussion points.

Shownotes Transcript

谢谢。

大家好。自从DeepSeek发布以来,已经过去了几个星期了。DeepSeek是一家中国公司,脱胎于对冲基金,其人工智能模型最近彻底挑战了人们对美国领先地位的预期和想法。

我们有很多机会讨论DeepSeek故事的不同方面。他们的应用程序之所以如此受欢迎,部分原因在于,OpenAI在其免费的ChatGPT应用程序中向用户提供的是次等模型,而DeepSeek实际上提供的是一个推理模型。

它还在其推理过程中展示思维方式方面进行了一些UI创新。当然,争论的焦点在于蒸馏技术,以及他们如何用这么少的钱获得这么高的性能,或者反过来说,人们不相信这真的发生了。但我想要回顾的谈话部分,我认为这在改变行业方面可能最为重要,那就是美国如何看待开源与闭源人工智能的问题。

这是一个有趣且持续存在的争论。OpenAI当然被称为OpenAI,但多年来开始改变其政策。它停止了完整地分享其研究成果,而且很明显,大型模型已经有一段时间没有开源了。对此的许多理由是关于安全性的,以及将模型权重与更广泛的世界分享是危险的,因为那里有许多可能会将它们用于邪恶目的的不良分子。

当然,也有大量的反驳意见,以及对尝试保持闭源的实用性的许多评估,以及对安全问题实际上是原因而不是竞争问题相当多的怀疑。我认为,让这一事实变得复杂的是,对OpenAI战略最强烈反对的人之一是埃隆·马斯克,他显然在那里有很大的私怨,而且正如Sam Altman所指出的那样,也没有开源主要的Grok模型。

无论如何,DeepSeek似乎已经改变了对话的性质。我们将阅读一篇简短的文章,或者更确切地说,将其交给人工智能来阅读一篇由前谷歌首席执行官埃里克·施密特撰写的简短文章,题为《中国的开源人工智能会终结美国在该领域的霸权吗?》。随着DeepSeek的出现,两国之间的力量平衡似乎正在发生变化。所以我将把它交给11 Labs版本的我自己,然后我们将回来继续讨论。说人工智能领域变化迅速已经成为老生常谈。

但最近几天,即使是那些处于人工智能研究前沿的人也对一家中国公司感到惊讶。上周,人工智能公司DeepSeek发布了其R1推理模型,该模型与OpenAI的O1不相上下,并且在各种逻辑任务(包括数学和编码)中都比ChatGPT模型好得多。

运行它的成本也低得多,只有OpenAI收费的大约2%。周一,DeepSeek发布了Janus Pro,这是一个足够小可以在你的笔记本电脑上运行的模型,可以生成合成图像,它声称其性能优于OpenAI的DALI 3。DeepSeek的AI创新速度正在席卷全球。更引人注目的是,DeepSeek的整个模型集合都是开源的,在这种情况下,这意味着它们具有开放的权重,任何人都可以复制和在其之上构建。

这是一个奇怪的时刻,一家中国公司成为事实上的开源领导者,而除Meta之外的大多数主要美国公司仍在严格保密其方法。事实上,对于从Minimax等初创公司到阿里巴巴等科技巨头的中国人工智能公司来说,这是一个越来越明显的趋势,它们正在向全球开发者免费提供其人工智能模型。

到目前为止,OpenAI的O3和Anthropic的Claude 3 Opus等闭源模型被认为是具有最先进功能的行业标准。它们是在美国制造的。人们认为开源和中国模型落后几个月。但DeepSeek的R1和Janus Pro表明,技术霸权的潮流可以转变得多快。这些模型的推出扰乱了股市,导致美国科技股暴跌。

权力平衡现在似乎正在沿着两条关键轴线发生变化,一条是美国和中国之间,另一条是闭源和开源模型之间。闭源模型的捍卫者押注他们可以通过保护其模型权重和训练方法来保持其能力差距。另一方面,开源倡导者认为,透明度,允许其他人在其工作基础上进行构建,可以使这些系统能够迅速赶上更大的闭源模型。

如果开源论点是正确的,这将颠覆人工智能生态系统。开源模型通常使用成本更低,因此,当两个能力相同的模型可用时,一个开源,一个闭源,开源模型可能会获得更广泛的采用,从而使其具有战略优势。美国已经拥有世界上最好的闭源模型。为了保持竞争力,我们还必须支持充满活力的开源生态系统的开发。

开源和闭源人工智能之间的竞争,以及美国和中国之间的竞争,还没有明确的赢家。但如果DeepSeat能够利用更少的资源与它们竞争,显然美国大型科技公司正面临越来越大的压力。

出口管制旨在扼杀中国获得最先进计算机芯片的机会,阻碍其保持同步的能力。但事实上,中国相对缺乏高性能芯片可能促使该国的公司和研究人员提高效率,并促使他们发现了显著降低培训成本的新方法。例如,DeepSeq证明,可以通过绕过传统的监督微调阶段来提高大型模型训练的效率。

他们甚至创建了R10模型,该模型省略了人工智能训练中的这一步骤,以挑战研究界对微调不可或缺性的假设。DeepSeek的成功也让人对预训练的重要性产生了质疑,预训练涉及训练越来越大的模型,这些模型根据大量文本预测下一个单词。这个过程需要对图形处理单元(GPU)和数据进行巨大的前期投资。如此多的数据,以至于OpenAI联合创始人Ilya Sutskever最近指出,我们很快可能会用尽互联网上所有可用的数据。

但还有一种新兴的方法可以提高模型的性能。这种方法于12月随OpenAI的O1模型推出,它使模型能够通过自我反思进行推理,类似于人类如何推理,使用中间步骤和自我校正来得出最终答案。这种方法的训练方法以前一直受到OpenAI的严格保护。DeepSeek通过发表一篇详细介绍其工作原理的论文,让其他人能够实施这一过程,从而揭开了这个秘密。

DeepSeq甚至证明,可以通过采用公开可用的基础模型(例如Meta的LLAMA3)并通过强化学习(一个具有人为设计的反馈和奖励的反复试验过程)来教它进行推理,从而更经济有效地做到这一点。

随着时间的推移,这些模型似乎会自发地学习如何推理,在遇到死胡同时回溯,并探索新的方法。这种方法消除了昂贵地预训练新基础模型的需要,其对人工智能创新的意义深远。传统上,即使是资金最雄厚的大学实验室也由于计算和数据限制而难以参与人工智能研究。随着DeepSeq的突破,围绕大型、资金雄厚公司的护城河可能正在缩小。

美国前沿模型公司不太可能很快改变其商业模式,也不清楚它们是否应该这样做。开放和封闭的竞争很可能会找到自然的平衡点,为不同的用户提供一系列不同的产品和价格点。但DeepSeek的发布标志着一个转折点。

美国创新的前进道路不仅包括加强开源开发,还包括鼓励分享培训方法以及增加对人工智能研究和开发的投资。白宫最近宣布的Stargate项目就是一个例子,该项目旨在未来四年内在人工智能基础设施上投资5000亿美元,美国的竞争优势长期以来依赖于开放科学以及行业、学术界和政府之间的合作。

我们应该接受开放科学可能会再次推动美国在人工智能时代充满活力的可能性。今天的节目由Vanta赞助。信任不仅仅是赢得的,更是被要求的。无论你是正在进行第一次审计的初创公司创始人,还是经验丰富的安全专业人员正在扩展你的GRC计划,证明你对安全的承诺从未像现在这样重要或复杂。这就是Vanta的用武之地。

企业使用Vanta通过自动化超过35个框架(如SOC 2和ISO 27001)的合规需求来建立信任。集中的安全工作流程可以将问卷调查完成速度提高5倍,并主动管理供应商风险。Vanta可以通过将你与审计师和专家联系起来以进行审计并快速建立你的安全计划来帮助你启动或扩展你的安全计划。此外,由于平台中使用了自动化和人工智能,Vanta可以为你节省时间,以便你可以专注于发展你的公司。

加入超过9000家全球公司,例如Atlassian、Quora和Factory,它们使用Vantage实时管理风险并证明安全性。

如果2025年人工智能有一件事是明确的,那就是代理即将到来。按行业划分的垂直代理、水平代理平台、基于代理的平台。

每个功能的代理。如果你正在运营一家大型企业,你明年将尝试使用代理。鉴于这是多么新颖的事情,我们所有人都会回到试点模式。

这就是为什么Superintelligent在今年年初提供了一项新产品。这是一项代理准备和机会审计。在短短几周内,我们将与你的团队一起深入了解哪些类型的代理适合你进行测试,你需要哪些类型的基础设施支持才能做好准备,并最终获得一套可操作的建议,帮助你做好准备,弄清楚代理如何改变你的业务。

如果你对代理准备和机会审计感兴趣,请直接联系我,[email protected]。在主题行中输入“agent”一词,以便我知道你在谈论什么。让我们让你成为人工智能市场最具活力部分的领导者。你好,AI Daily Brief听众。快速休息一下,分享一些来自KPMG最新AI季度脉搏调查的非常有趣的发现。

你知道67%的商业领袖预计人工智能将在未来两年内从根本上改变他们的业务吗?然而,并非一切顺利。他们面临的最大挑战包括数据质量、风险管理和员工采用等问题。KPMG处于帮助组织克服这些障碍的最前沿。他们不仅仅是在谈论人工智能,他们正在通过切实可行的解决方案和实际应用来带头。

例如,超过一半的受访组织正在探索使用人工智能代理来处理行政事务和呼叫中心运营等任务。因此,如果你希望在人工智能领域保持领先地位,请关注KPMG。他们不仅仅是对话的一部分,他们正在帮助塑造对话。了解更多关于KPMG如何推动人工智能创新,请访问kpmg.com/US。好的,回到真正的NLW。施密特几乎不经意地说的一句话,我认为,抓住了许多人对整个故事的关注。

这句话是,“这是一个奇怪的时刻,一家中国公司成为事实上的开源领导者,而除Meta之外的大多数主要美国公司仍在严格保密其方法。”

这是一个奇怪的转变。这似乎不应该发生。当然,DeepSeek并非不受你所期望的中国影响。它不会处理某些政治敏感问题,这就是为什么许多选择与DeepSeek互动的人使用的是可以绕过一些限制的API版本。

对于大型实验室来说,一些实验室加倍强调他们反对开源的论点。Czarnik分享了与Anthropic首席执行官Dario Amadei的采访,后者表示,对DeepSeek进行的人工智能安全评估表明,它是他们测试过的在生成潜在危险信息方面表现最差的模型。他们说它根本没有任何阻止生成这些信息的机制。现在,Amadei指出,他并不认为这些模型实际上有任何危险,但我们正处于这些指数曲线之上,所以这是一个安全考虑因素。

再说一次,一些人完全拒绝了这一立场,Marc Andreessen写道:“为了监管控制和削弱开源人工智能而进行的危言耸听。开源人工智能的生存威胁是大型人工智能垄断集团。”他实际上甚至还引用了自己的推文,说:“现实情况是秘密已经泄露。每个人都知道如何编写转换器,如何使用RLHF,如何使用强化学习进行推理。除了DeepSeek和LLAMA之外,还将有数千个开源实现。这已经无法再收回了。”

无论是对不可避免的现实的接受、对安全的观点改变还是竞争压力,不仅仅是Andreessen这么说。Sam Altman在Reddit AMA中表示,他认为OpenAI在这方面可能站在了历史的错误一边,需要一个新的开源战略。就在昨天,有消息称百度宣布将开源其未来的Ernie模型。正如Interconnected Capital的Kevin Hsu所说,百度此前一直是最坚定的闭源模型制造商之一。

所以对我来说,这里肯定有变化的迹象。我认为下一个大问题将是看看它如何在政策领域发挥作用,因为这也会真正塑造这场讨论。不过,就目前而言,这就是今天的AI Daily Brief,长篇阅读版。下次再见,和平。