您好,欢迎收听Sharp Tech的免费预览。说到DeepSeek,我在撰写相关内容时顺便提到了一个想法,那就是DeepSeek将会带来……现在很难知道它会带来什么影响,但它可能会产生重大影响。
中国,更确切地说,是从心理/信念的角度来看,你会回到这些非常棘手的问题需要解决。光有钱是不够的。激励也不够。你需要相信我们能够做到这一点。而且
这是一篇不错的文章吗?DeepSeek(这是一个非常好的模型,虽然不是领先的模型,但属于领先模型的范畴,包括V3和R1及以后的版本)中是否有这样一部分内容,或者您是否预期会有这样的感觉:看,即使西方认为自己最擅长的事情,我们也一样擅长?
哦,DeepSeek确实创造了这种观点。我的意思是,还有其他模型。阿里巴巴有一个模型。苹果显然打算将其用于在中国的情报工作。百度也有一个模型。但DeepSeek却横空出世,而且他们将其开源了。当然,之后DeepSeek的故事在传播几天后,导致美国股市暴跌,英伟达股价暴跌。
并导致一些在香港交易的人工智能和科技相关股票出现真正的暴涨。我认为,从心理角度来看,这是一个转折点,也就是说,是的,我们能做到。即使我们在芯片封锁下苦苦挣扎,DeepSeek也证明他们能够找到方法
你知道,非常有创意的方法来最大限度地利用他们拥有的硬件并构建
一个在国际上具有竞争力的模型。然后他们将其开源了。所以现在每个人都在使用它。百度已经整合了它。我认为腾讯也已经整合了它。你已经在你的本地机器上运行它了吗?哦,是的。我下载了它。或者是一个较小的版本。我的硬件不够强大,无法运行完整的模型。但是,是的。为什么它是开源的?是否有任何意义……
中央政府。我的意思是,人们高估了中央政府了解或关心程度的范围。我认为DeepSeek一直以来都在做出自己的决定。是否有这样的感觉,哦,这实际上非常有价值?我们应该将其开源吗?我认为你所说的,我认为他们做出了自己的决定。你知道,他们最初是一家对冲基金。他们实际上因此遇到了一些麻烦,因为当时对量化交易进行了打击。他们是一家量化基金。但他们购买了所有这些硬件,所有这些……而习近平现在说,这是我的量化基金。
是的,没错。他崛起的速度之快令人惊叹。梁文锋,首席执行官,实际上在周一与习近平会面了。大约一周、两周或三周前,他与总理会面了。但是,不,我认为我认为他们只是这么做了。他们将其开源了。但是,现在,我认为人们意识到,这实际上对中国来说是一件极其强大的事情,因为它是一个,你知道,
这是一个非常好的模型。它是开源的。因此,任何国家,世界上的任何人,都可以下载它,并运行这个中国模型,而不必为Claude或OpenAI付费。这是一种非常引人注目的方式,中国,至少是中国的一个AI模型,可以迅速走向全球。
是的,我对它的反应非常感兴趣,因为,我的意思是,大多数人接触它的方式并不是将其下载到他们的本地机器上并运行它。它是使用DeepSeek应用程序,但这说明,我的意思是,仅仅从商业角度来看。我认为OpenAI,首先,我从一开始就说过,ChatGPT在很多方面只是一个意外,但是他们——
他们在科技领域取得了最宝贵、最困难的事情,那就是拥有具有意义的市场份额的消费者品牌。其中一部分是你的最终状态必然是广告,他们需要快速到达那里,以便能够为免费用户提供最好的模型。人们对DeepSeek的评价是,哇,这太棒了。它好多了。是的,因为他们没有为更好的OpenAI模型付费。它不是最好的,但对很多人来说,感觉它就是最好的。对。
仅仅是,我不知道,比如DeepSeek的宣传有效吗?它在中国的影响更大,还是在美国和西方的影响更大?这是一个很好的问题。我认为在中国,有趣的是它如何如此迅速地改变了市场,因为现在所有其他试图为其模型收费的公司现在也必须免费。所以现在还不清楚在中国这些模型的商业模式是什么。哦,在美国也是一个问题。别担心。
好吧,至少在美国,OpenAI有收入,对吧?Anthropic通过订阅获得收入。不足以支付,不足以支付成本。但我确实认为这很有趣。我是一个相当怀疑的人。我很好奇。DeepSeek在社交媒体上,比如在X和App Store上的突然激增,
我确实想知道有多少是真正真实的,有多少是非自然的。是的,我知道你提到了这一点。我觉得这是相当真实的。我认为关于元宇宙的讨论,因为现实情况是V3是在圣诞节推出的,这实际上是很多。他们记录了很多。所以他们多年来一直在发表论文和模型。
所以这绝不是凭空出现的。然后我认为V3有一些成本估算,这些估算又被每个人为了自己的目的而扭曲和歪曲了。他们在论文中非常清楚。他们公布的成本是针对具体的训练运行。它不是针对所有实验、所有研发以及所有这些事情。他们从未说过其他话,就像人们试图描绘的那样。他们试图欺骗人们。就像,你读过论文吗?他们喜欢,
论文非常清楚地列出了该成本未包含的所有内容。因此,V3问世了。这就是实际上有那个美元数字的模型,600万美元左右。大约600万美元,是的。这是一个非常非常好的模型,而且非常非常便宜。然后R1问世了,我认为这是两者结合的结果
人们还没有使用推理模型,因为它们是被付费墙保护的。所以首先,这是人们第一次接触这种推理模型。其次,DeepSeek的用户界面更好,或者我应该说用户体验更好,因为它实际上阐述了它的思路。如果这是你第一次使用推理模型,并且你看到模型像自言自语一样试图找出答案。
这有点迷人。就像,哦,看,我的小AI朋友正试图帮助我找出答案,而OpenAI出于竞争原因并没有公开这一点。他们说,我们不会列出我们正在做什么。所以你遇到了双重打击,它被付费墙保护着,也被竞争墙保护着,或者你可能想称之为其他什么。然后你叠加了普遍的
对中国的焦虑,即中国,至少我们有人工智能。这是我们的伟大希望。然后是
我们正在花费数十亿美元。股市正依赖于这数十亿美元的投资。这一切都完了吗?我认为所有这些都造成了完美的风暴。它只是在周末成为了一件热门的事情。我们以前见过这种情况。我认为,我认为有这么多因素使这件事爆发是有道理的,所以我倾向于认为它是自然发生的,而不是人为的。
好的,我认为这是一种混合,但我将在这方面听从你的意见。我认为你提出了一个相当有说服力的论点。我要说的是,有趣的是,DeepSeek,他们显然扰乱了这里的股价。需要明确的是,它几乎恢复到了之前的水平。所以,我的意思是,它非常像一件热门的事情,但是……
但是这种扰乱是……他们也扰乱了中国的人工智能市场,这真的很令人感兴趣,对吧?所以这就是他们所做的。他们在全球范围内造成了扰乱。坦率地说,我认为……对他们来说很好。我认为美国的人工智能公司需要被扰乱。他们真的过得很舒服。哦,是的。不,我的意思是……
人们将它与OpenAI的定价进行比较。这是因为他们的利润率非常高。就像,定价已经下降了。我认为他们已经在发布产品方面变得更加积极了。周末的4.0更新似乎在某种程度上减少了人力资源方面的发言,比如责备你……它只是……它更开放了。我认为……
我们实际上看到了一个相当有说服力的竞争性回应。顺便说一句,谷歌已经推出了更便宜,而且可以说是同样好或更好的模型。所以,再说一次,这只是一个完美的。每个人的看法都得到了,这是一个被刺破的泡沫,但如果你注意到了,它并不是完全令人震惊的。现在,
我犹豫了,我几乎感到不好说这个,因为DeepSeek应该得到如此多的赞誉。他们所做的工程非常出色。如果你回到两年前阅读他们的论文,我没有阅读所有论文,但我阅读了三到四篇论文。这真的是好东西,以及一些已经被全球采用的真正突破。但这几乎说明了这一点。人工智能的神话是,
一直以来都与现实有点不同,但现实也相当壮观,而且也没有得到充分的认识。所以这只是一个疯狂的大杂烩。不,这很有趣。我的意思是,再说一次,我认为,硅谷公司应该感谢DeepSeek所做的一切,对吧?因为最终,即使是OpenAI、Anthropic、xAI,他们可以购买英伟达能生产的尽可能多的芯片,对吧?
如果他们向DeepSeek学习,他们难道不能使他们的模型运行得更高效、更好吗?好吧,这是GROK的有趣之处。GROK 3本周刚刚发布。它似乎是最先进的模型,至少是唯一一个……
O3可能更好,但O3是一种非常独特的思维模型,我认为OpenAI永远不会直接发布。它处于深度研究中,这令人难以置信,并且有非常明显的缺陷,需要明确的是,但是一个——这是一个——至少对我来说,这是一个——我知道编程人员已经这样感觉了一段时间,因为人工智能——
在那里带来了如此大的变化,但一种非常直观的感受,是的,有很多工作在未来真的会完蛋,你知道吗?所以,所以这是一个最先进的或接近最先进的模型。xAI令人难以置信的是,它是在19个月前成立的。
现在他们有了最先进的模型。这几乎是相反的。它是DeepSeek故事的反面,那就是DeepSeek所做的这些优化令人难以置信。他们彻底重新思考了如何进行专家混合架构,这绝对——
有利于推理,但它有所有这些训练开销,他们只是改变了训练方式,以便能够更优雅地扩展,因为他们的带宽有限,他们无法处理过多的开销,而且,而且我认为,顺便说一句,他们使用的是H800,而不是H100,因为他们在模型设计方面做了很多事情,
这说明,这是一家带宽受限的公司,这正是……他们也这么说。我的意思是,他们说过,首席执行官说过,其他员工也说过,他们最大的制约因素是芯片。对。我认为这完全……这完全符合模型的设计方式。所以我实际上认为DeepSeek一直……
再说一次,对于中国,对于所有人来说,你都应该持怀疑态度。但这是另一个我实际上相信的案例。围绕这个故事的一切都与之相符。但xAI进来了,他们在19个月内交付了最先进的模型
而且很大一部分原因是他们拥有,他们已经筹集了160亿美元或120亿美元,他们购买了一大堆英伟达芯片,并将它们全部连接在一起。他们怎么能做到呢?因为他们可以获得芯片,而且英伟达的一个主要区别在于他们所做的所有网络工作,他们使将大量芯片连接在一起以获得这种性能变得容易和可行。所以你可以看看美国的人工智能公司,说,好吧,
哇,你为什么不做这种优化呢?另一方面,如果你从比较优势的角度来看,就像,
我一直嘲笑大型公司试图模仿初创公司,比如初创公司发明了一些东西,他们说,哦,我们也能做到。然后你会看到Facebook发布像Poke这样的应用程序。就像,你为什么要,你为什么要发明?有些事情真的很困难。当你规模很小、是一家初创公司时,你几乎是在捕捉瓶中闪电,你这样做是因为这是唯一的方法。顺便说一句,大多数初创公司都会失败。
如果你是大公司,你有很多现金。你可以通过购买初创公司来降低风险。去购买发明它的人。将其内部化。或者在Facebook的情况下,Poke是对Snapchat的回应,他们实际上所做的是,好吧,我们将窃取故事并将其放在Instagram上,基本上阻止Snapchat的发展。这并不光彩,但它实际上是认识到你的优势,并且
我认为这就是我们在xAI中看到的。他们是否像DeepSeek那样做了大量工作来围绕数量有限、带宽低的芯片进行大力优化?不,他们只是购买了一堆芯片,因为他们有很多钱,但这也能让他们达到目标。对。所以xAI和DeepSeek,
采取了完全不同的方法,但这两种方法在其各自的情况下都是合理的。我认为这本身就是一个有趣的收获。然后其中一个问题是,展望未来,你推迟一年或两年。如果DeepSeek继续无法获得最好的英伟达芯片,并且实际上只能购买华为的昇腾芯片,而xAI或OpenAI可以继续购买更好的英伟达芯片,你会开始看到真正的差距吗?
我的意思是,这是个大问题。我对这一点有一些担忧。我认为我们已经在网上讨论过这个问题了。所以让我们系好安全带,开始讨论吧。
好了,这就是免费预览的结尾。如果您想听到更多我和Ben的讨论,节目说明中包含订阅链接,您也可以访问sharptech.fm。这两种方法都可以让您访问个性化订阅源,其中包含我们每周制作的所有节目,以及来自Stratechery和Stratechery Plus套装的更多精彩内容。查看一下,如果您有反馈,请发送电子邮件至[email protected]。