We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode How DeepSeek Showed That Silicon Valley Is Washed

How DeepSeek Showed That Silicon Valley Is Washed

2025/2/3
logo of podcast Better Offline

Better Offline

AI Deep Dive AI Chapters Transcript
People
E
Ed Zitron
一位专注于技术行业影响和操纵的播客主持人和创作者。
Topics
Ed Zitron: 我长期以来一直指出,像OpenAI、Anthropic、谷歌和Meta这样的公司运行的大型语言模型是无利可图且不可持续的。它们基于转换器的架构已经达到顶峰,正在耗尽训练数据,这些模型的实际能力早在2024年3月就达到了顶峰。OpenAI去年亏损50亿美元,而Anthropic在2024年亏损近30亿美元,这突显了这些模型的巨大运营成本。我之前错误地认为,这些公司无法提高效率,但实际上,他们可能只是不愿意这样做。 一家不知名的中国公司DeepSeek发布了一种与OpenAI最新推理模型大致相当的产品,但训练和运行成本却低得多,这彻底颠覆了生成式AI的传统认知。训练大型语言模型的成本非常高昂,GPT-40在2024年中期花费了1亿美元,未来的模型可能花费高达10亿美元甚至更多。业界普遍认为,大型语言模型必须规模庞大且运行成本高昂,因为只有这样才能解锁新的功能,并且随着芯片价格下降,这些强大的模型最终会变得更便宜。然而,为了构建更大、更强大的模型,需要不断购买更强大的GPU,这导致了大量的资金浪费。 美国科技行业对大型语言模型的投入是一个“资本主义死亡邪教”,它建立在剽窃、傲慢和对未来回报的假设之上。大型语言模型公司(包括OpenAI和Anthropic)的模型效率极低,而我之前错误地认为他们已经尽力去提高效率了。DeepSeek的出现揭示了美国科技行业的傲慢和缺乏创新精神。美国科技公司缺乏创新,都在做相同的事情,收取相似的价格,创新方向也相同。谷歌、微软、OpenAI、Meta、亚马逊和Oracle等公司都没有想到或没有能力创造出像DeepSeek这样的产品。DeepSeek的成功并非因为它有什么特别新颖的技术,而是因为它尝试了不同的方法,例如减少内存使用和使用合成数据。 美国科技公司由于模型开发和推理成本过高,从未想过有人会试图取代他们的地位,而中国对人工智能的战略重视并非秘密。美国最强大的科技公司盲目地投入巨资建设大型数据中心和购买GPU,而没有考虑是否存在替代方案。我相信这些美国公司本可以做到DeepSeek所做的事情,但他们要么选择不这样做,要么过于短视。美国科技行业的困境并非仅仅是来自中国的竞争,而是其自身的懒惰、自满和不负责任。OpenAI和Anthropic等公司是硅谷的代表,它们更关注市场营销而不是解决实际问题。DeepSeek的技术并非多么高深,硅谷公司应该首先想到并做到这一点。硅谷和其他美国科技公司只关心以任何代价增长,而忽略了成本节约和效率提升。 硅谷公司没有考虑DeepSeek的技术,这表明他们缺乏创新精神,并且公司之间缺乏真正的竞争。如果生成式AI对这些公司真的重要,他们本应该积极尝试DeepSeek所做的事情。DeepSeek采用了一些非常规的方法来提高效率,包括利用CPU和GPU的不同部分来创建数字处理单元。OpenAI和Anthropic拥有足够的资金和人力资源来创造一个高效的模型,但他们更关心的是增长和建设更大的数据中心。OpenAI的Operator代理是一个功能性很差的产品,这体现了该公司缺乏创新能力。Casey Newton对DeepSeek的评价过于乐观,他忽视了DeepSeek的实际意义。OpenAI和Anthropic正在试图通过推出代理等新产品来筹集更多资金,但这掩盖了他们产品缺乏实际应用的事实。 OpenAI无法简单地将DeepSeek的技术添加到其模型中,因为这在技术上不可行,而且这样做也会损害其形象。DeepSeek的成功让投资者对OpenAI的未来发展产生了怀疑。即使OpenAI复制DeepSeek的技术,也不确定其盈利能力。即使OpenAI创建了一个更小、更高效的模型,它也很难在市场上与DeepSeek竞争,因为DeepSeek已经抢先占领了市场。OpenAI已经失去了其在大型语言模型领域的优势,微软已经开始通过其云服务提供DeepSeek的模型。DeepSeek已经将大型语言模型商品化,任何人都可以构建自己的模型,这将对Nvidia等公司产生影响。对于云服务提供商来说,很难再为GPU市场辩护,因为现在已经证明可以使用旧的硬件构建类似的模型。 中国公司DeepSeek的成功表明,中国不仅可以与美国的人工智能公司竞争,而且还可以以高效的方式做到这一点。将DeepSeek的成功归咎于中国是错误的,DeepSeek的开源性质意味着任何人都可以使用它。虽然DeepSeek的模型更便宜,但其盈利能力仍不明确。大型语言模型公司并不关心生成式AI的普及,他们更关心的是自身的垄断地位。DeepSeek的出现打破了大型语言模型公司对市场的垄断。在DeepSeek出现之前,创建具有竞争力的大型语言模型需要大量的资金,并且需要与微软、谷歌或亚马逊合作。OpenAI和Anthropic等公司并不关心产品的价格和效率,他们更关心的是维持其垄断地位。大型语言模型公司创造了一个“腐败经济”,他们通过不断增长来维持其垄断地位。 大型语言模型公司通过构建大型数据中心和大型语言模型来维持其垄断地位。OpenAI和Anthropic并没有真正关注产品的开发和商业化,他们更关注的是炒作和融资。微软试图将Copilot强加到Microsoft 365中,但用户并不买账。OpenAI的大部分收入来自ChatGPT订阅,而不是销售其模型。OpenAI和Anthropic的产品缺乏实用性和可靠性,其新产品成本过高。OpenAI和Anthropic需要更大的模型来维持其故事,即只有他们才能构建未来。DeepSeek证明,构建与OpenAI领先模型竞争的模型是可能的,而且成本更低。DeepSeek将迫使OpenAI和Anthropic降低其模型和订阅的价格。DeepSeek v3对OpenAI和Anthropic的真正威胁在于它与GPT-4O的竞争。阿里巴巴创建了一个比DeepSeek性能更好的模型,这将进一步加剧价格竞争。 DeepSeek的出现使得大型语言模型的垄断地位被打破,Sam Altman和Dario Amadei的声誉也受到影响。人们以前认为大型语言模型必须昂贵,但DeepSeek证明了这种观点是错误的。DeepSeek使用合成数据进行训练,这挑战了大型语言模型公司对训练数据的依赖。人工智能行业是一个骗局,其成果微不足道。OpenAI缺乏创新能力,其未来的发展前景堪忧。人工智能行业的资金、能源和人才都被浪费了,这要归咎于市场和媒体的失职。OpenAI的未来发展令人担忧,其融资能力令人质疑。人工智能泡沫正在破裂,OpenAI等公司已经失去了竞争力。如果这些资金被用于其他领域,将会产生更大的效益。硅谷需要改变其发展模式,否则将会面临严重的危机。

Deep Dive

Shownotes Transcript

In this episode, Ed Zitron explains how the emergence of a much-more-efficient generative AI model has become an existential threat to the future of OpenAI and Anthropic - and tells a dark story about the death of innovation in Silicon Valley.


LINKS: https://www.tinyurl.com/betterofflinelinks)

Newsletter: https://www.wheresyoured.at/)

Reddit: https://www.reddit.com/r/BetterOffline/

Discord: chat.wheresyoured.at)

Ed's Socials:

https://twitter.com/edzitron)

https://www.instagram.com/edzitron)

https://bsky.app/profile/edzitron.com)

https://www.threads.net/@edzitron)

See omnystudio.com/listener) for privacy information.