We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
B
Ben Thompson
创立并运营订阅式新闻稿《Stratechery》,专注于技术行业的商业和策略分析。
C
Chamath Palihapitiya
以深刻的投资见解和社会资本主义理念而闻名的风险投资家和企业家。
D
Didi Das
E
Ethan Malek
F
Frank DeGods
G
Gary Tan
H
Henry
活跃在房地产投资和分析领域的专业人士,参与多个房地产市场预测和分析讨论。
J
Jared Freeman
J
Jeffrey Emanuel
J
Jim Phan
M
Mark Andreessen
N
Neil Kosla
N
Nick Carter
S
Satya Nadella
在任近十年,通过创新和合作,成功转型并推动公司价值大幅增长。
S
Signal
T
The Superhuman Newsletter
Y
Yann LeCun
一位在机器学习和计算机视觉领域具有重大影响力的法国-美国计算机科学家,现任Meta首席AI科学家和纽约大学教授。
匿名Meta工程师
Topics
Frank DeGods:我认为DeepSeek是自ChatGPT以来AI领域最好的东西。它在短短20分钟内就给我留下了深刻的印象。 Signal:我本地运行DeepSeek已经有几天了,它的性能绝对可以与O1或Sonnet相媲美。我一直在用它进行编码和其他任务,以前通过API要花一大笔钱才能完成的事情,现在完全免费了。这感觉就像一个彻底的范式转变。 Nick Carter:DeepSeek将AGI的时间线提前了五年。所以,关注健身吧,知识工作已经过时了,肌肉才是剩下的全部。 The Superhuman Newsletter:DeepSeek的R1模型震惊了硅谷,许多关于中国创新和人工智能的长期假设在一夜之间消失了。一些人称之为骗局,另一些人则称之为对人类的馈赠。 匿名Meta工程师:Meta的Gen AI团队正处于恐慌模式,工程师们正疯狂地解剖DeepSeek,并尽力复制其中的任何东西。管理层担心如何证明Gen AI团队的巨额成本是合理的。当Gen AI团队的每个领导者的薪水都超过DeepSeek v3的训练成本时,他们将如何面对领导层?我们有几十个这样的领导者。DeepSeek R1让事情变得更加可怕。 NLW:DeepSeek的训练成本远低于其他公司,这是AI行业恐慌的原因。DeepSeek声称他们的V3 LLM在三个月内以560万美元的成本进行了训练。美国实验室的前沿模型训练成本对于O1级别的模型来说接近5亿美元,而对于下一代训练运行则可能高达数十亿美元。我们没有关于创建R1模型的后期训练成本的可靠估计,但可以合理地认为预算同样紧张。 Alexander Wang:据我了解,DeepSeek拥有一个由5万个顶级英伟达H100芯片组成的集群,这违反了出口管制规定。V3论文声称该模型是在一个只有2000个英伟达H800(允许出口的芯片的降级版本)的集群上进行训练的。 Jeffrey Emanuel:DeepSeek使用了创新的训练方法,例如使用8位浮点数和多标记预测,从而降低了训练成本。 Jared Freeman:DeepSeek使用了8位浮点数、压缩键值索引和多标记预测等技术来降低成本并提高性能。 Henry:DeepSeek的API访问成本极低,即使进行大量请求。在过去的几个小时里,我已经向DeepSeek API发出了超过20万个请求。没有速率限制,整个过程只花了大约50美分。 Mark Andreessen:DeepSeek R1是我见过的最令人惊叹和印象深刻的突破之一,并且它是开源的,对世界来说是一份巨大的礼物。DeepSeek的R1是AI的‘斯普特尼克时刻’。 Gary Tan:DeepSeek的搜索感觉更具粘性,即使只是进行几次查询,因为看到推理过程,即使它对自身所知和可能不知道的东西是多么认真,也极大地增加了用户信任。 Neil Kosla:DeepSeek是中国共产党进行经济战的国家宣传活动。他们伪造了低成本的说法,以证明低价是合理的,并希望每个人都转向它,以损害美国在人工智能方面的竞争力。不要上当。 Satya Nadella:贾文悖论再次出现。随着人工智能变得更高效和更容易获得,我们将看到它的使用量激增,将其变成一种我们永远无法获得足够的商品。 Chamath Palihapitiya:我们需要转向推理,并积极地向盟友出口芯片;风险投资公司需要提高资本纪律。 Jordi Hayes:现在你能做的最爱国的事情就是开发软件,使用如此多的DeepSeek推理,以至于你让中国共产党破产。 Yann LeCun:对于那些看到DeepSeek的性能并认为中国在人工智能方面超越美国的人来说,你们的解读是错误的。正确的解读是,开源模型正在超越专有模型。DeepSeek受益于开放式研究和开源。他们提出了新的想法,并将其建立在其他人的工作之上。因为他们的工作以开源的形式发布,所以每个人都可以从中获益。这就是开放式研究和开源的力量。 Didi Das:DeepSeek R1的性能可能优于OpenAI的O3模型。 Ethan Malek:我认为市场将很快适应DeepSeek带来的成本下降。 Jim Phan:DeepSeek的开源性质将加速AI的发展。 NLW:DeepSeek的影响可能比市场反应更大。

Deep Dive

Chapters
The release of DeepSeek's R1 model has sent shockwaves through Silicon Valley. Early reactions suggest it rivals OpenAI's O1 and Google's Gemini 2.0 in performance, but at a drastically lower cost, raising questions about future AI development and market dynamics. The model's accessibility and open-source nature add to its disruptive potential.
  • DeepSeek R1's performance is comparable to OpenAI's O1 and Google's Gemini 2.0.
  • DeepSeek claims significantly lower training costs compared to US labs.
  • R1 is accessible via API at a fraction of the cost of competitors.
  • The model's open-source nature and efficient design allow it to run on various consumer devices.

Shownotes Transcript

DeekSeek has released R1, their answer to OpenAI's O1, and it has Silicon Valley chattering and markets crashing. But just how big a deal is it? Big, argues NLW, even if the likely impact might be different than what Wall Street seems to think.

Brought to you by:

KPMG – Go to ⁠⁠⁠⁠⁠⁠www.kpmg.us/ai⁠⁠⁠⁠⁠⁠) to learn more about how KPMG can help you drive value with our AI solutions.

Vanta - Simplify compliance - ⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw

The Agent Readiness Audit from Superintelligent - Go to https://besuper.ai/ to request your company's agent readiness score.

The AI Daily Brief helps you understand the most important news and discussions in AI. Subscribe to the podcast version of The AI Daily Brief wherever you listen: https://pod.link/1680633614 Subscribe to the newsletter: https://aidailybrief.beehiiv.com/ Join our Discord: https://bit.ly/aibreakdown