成为Stratechery Plus会员,每月15美元或每年150美元,收听所有Sharp China、Sharp Tech、Stratechery Updates and Interviews、Greatest of All Talk、Asianometry和Dithering Podcast剧集。
比尔·毕晓普是《中西主义》的作者
在今天的特别交叉Sharp Tech/Sharp China节目中,本·汤普森和比尔·毕晓普讨论了民营企业研讨会和习近平与中国科技公司的和解,以及xAI和DeepSeek之间的联系。然后,对芯片禁令进行了长时间的辩论,包括其潜在的长期后果,以及是否有可能进行路线修正。最后,为什么台湾周围的局势令人担忧,以及特朗普是否打算达成协议。
<raw_text>0 您好,欢迎收听《Sharp China》。我是安德鲁·夏普,您正在收听的是本期节目的免费预览。说到DeepSeek,我在撰写关于它的文章时顺便提到了我的一个想法,那就是DeepSeek将会提供……将会有一些影响,现在很难知道是什么,但可能会有重大影响。
中国,几乎更多的是在心理/信念层面,你会回到这些非常难以解决的问题。光有钱是不够的。激励也不够。你需要相信我们能够做到这一点。而且
这是一个好的解读吗?DeepSeek(这是一个非常好的模型)有一点,它不是领先的模型,但它属于领先模型的类别,包括V3和超越它的R1。是否有一种积极的预期,或者您是否预期会有这样的感觉,即:看,即使西方被认为最擅长的事情,我们也一样擅长?
哦,DeepSeek确实创造了这种观点。我的意思是,还有其他模型。阿里巴巴有一个模型。苹果显然打算在中国将其用于苹果智能。百度也有一个模型。但DeepSeek却突然出现,他们将其开源了。当然,他们,你知道,DeepSeek的故事在传播几天后,导致美国股市暴跌,英伟达股价暴跌。
并导致在香港交易的一些人工智能和科技相关股票出现相当真实的暴涨。我认为,从心理角度来看,这是一个转折点,因为,是的,我们能够做到这一点。即使我们在芯片封锁下苦苦挣扎,DeepSeek也表明他们可以找到方法来
你知道,非常有创意的方法来最大限度地利用他们拥有的硬件并构建
一个在国际上具有竞争力的模型。然后他们将其开源。所以现在每个人都在使用它。百度已经集成它了。我认为腾讯也已经集成它了。你已经在你的本地机器上运行它了吗?哦,是的。我下载了它。或者是一个较小的版本。我的硬件不够强大,无法运行完整的模型。但是,是的。为什么它是开源的?是否有任何意义……
中央政府。我的意思是,人们总是高估中央政府了解或关心程度。我认为DeepSeek一直以来都在做出自己的决定。是否有一种感觉,哦,这实际上非常有价值?我们应该将其开源吗?我认为你所说的,我认为他们做出了自己的决定。你知道,他们最初是一家对冲基金。他们实际上遇到了一些麻烦,因为对量化交易进行了打击。他们是一家量化基金。但他们购买了所有这些硬件,所有这些视频芯片。而习近平现在说,这是我的量化基金。
是的,没错。令人惊讶的是他崛起的速度如此之快。梁文锋,首席执行官,实际上在星期一与习近平会面了。他大约在一周、两周或三周前与总理会面了。但是,不,我认为我认为他们他们只是这么做了。他们将其开源了。但是,现在,我认为人们意识到,这实际上对中国来说是一件极其强大的事情,因为它是一个,你知道。
这是一个非常好的模型。它是开源的。因此,任何国家,世界上的任何人,都可以下载它,并运行这个中国模型,而不必为Claude或OpenAI付费。这是一种非常引人入胜的方式,中国,至少是中国的一个AI模型,可以迅速走向全球。
是的,我对它的反应非常感兴趣,因为,我的意思是,大多数人与它的接触并不是将其下载到他们的本地机器上并运行它。它是使用DeepSeek应用程序,但这说明,我的意思是,仅仅从商业角度来看。我,你知道,我认为OpenAI,首先,我从一开始就说,ChatGPT在许多方面只是一个意外,但是他们,
他们在科技领域取得了最有价值和最困难的事情,那就是一个拥有有意义的市场份额的消费者品牌。其中一部分是你的最终状态必然是广告,他们需要快速到达那里,以便他们能够为免费用户提供最好的模型,并且
人们得到了DeepSeek。他们想,哇,这太棒了。它好多了。是的,因为他们没有为更好的OpenAI模型付费。它不是最好的,但对很多人来说,感觉它像是最好的。而且,我不知道,比如DeepSeek的宣传有效吗?它在中国的影响更大,还是在美国和西方的影响更大?是的。
这是一个很好的问题。我认为在中国,有趣的是它如何如此迅速地改变了市场,因为现在所有其他试图为其模型收费的公司现在也必须免费。因此,现在还不清楚中国这些模型的商业模式是什么。哦,在美国也是一个问题。别担心。
好吧,至少在美国,OpenAI有收入,对吧?Anthropic通过订阅获得收入。不足以支付费用,不足以支付成本。但我确实认为这很有趣。我是一个相当怀疑的人。我很好奇。DeepSeek在社交媒体上,比如在X和App Store上的突然激增,
我确实想知道有多少是真正真实的,有多少是非自然的。是的,我知道你提到了这一点。我觉得这是相当真实的。我认为关于元位元——因为现实情况是V3是在圣诞节发布的,这实际上是很多——他们记录了很多。所以他们多年来一直在发表论文和模型。
所以这绝不是突然出现的。然后我认为V3有一些成本估算,这些估算又被每个人为了自己的目的而扭曲和歪曲了。他们在论文中非常清楚。他们公布的成本是针对具体的训练运行。它不是针对所有实验、所有研发和所有这些事情。他们从未说过其他话,就像人们试图描绘的那样。他们试图欺骗人们。他们说,你读过论文吗?他们说,
论文非常清楚,列出了该成本未包含的所有内容。因此,V3发布了。这就是实际上有那个美元数字的版本,600万美元左右。600万美元左右,是的。这是一个非常非常好的模型,非常非常便宜。然后R1发布了,我认为这是一个组合
人们还没有使用推理模型,因为它们是被付费墙挡住的。所以首先,这是人们第一次接触这种推理模型。其次,DeepSeek的用户界面更好,或者我应该说用户体验更好,因为它实际上阐述了它的思维过程。如果这是你第一次使用推理模型,并且你看到模型像自言自语一样试图找出答案,
这有点迷人。它就像,哦,看看我的小AI朋友正在试图帮助我找出答案,而OpenAI出于竞争原因没有公开这一点。他们说,我们不会列出我们正在做什么。所以你有一个双重打击,它被付费墙挡住了,它也被竞争墙挡住了,或者你可能想怎么说。然后你叠加了关于中国的普遍焦虑,即中国,至少我们有AI。这是我们的伟大希望。然后是
我们正在花费数十亿美元。股市正依赖于这数十亿美元的投资。这一切都完了吗?我认为所有这些都造成了完美的风暴。它只是在周末成为了一件时髦的事情。我们以前见过这种情况。我认为,我认为有这么多因素使这件事爆发是有道理的,所以我倾向于认为它是自然发生的,而不是人为的。
好的。好吧,我,我,我认为这是一些混合,但我将,我将在这方面听从你的意见。我认为这是一个,你提出了一个相当有说服力的论点。我要说的是什么有趣的是,你知道,DeepSeek,他们,他们显然扰乱了,你知道,这里的股价。需要明确的是,它几乎恢复到了之前的水平。所以,我的意思是,这非常时髦。它是,但是,但是,
但是这种扰乱是他们也扰乱了中国的人工智能市场,这真的很令人感兴趣,对吧?所以这就是他们所做的。他们在全球范围内造成了扰乱。坦率地说,我认为这对他们来说很好。我认为美国的人工智能公司需要被扰乱。他们真的过得很舒服。哦,是的。我的意思是,人们将它与OpenAI的定价进行比较。那是因为他们的利润率非常高。定价已经下降了。我认为他们已经在发布产品方面变得更加积极了。周末的4.0更新似乎在某种程度上减少了,比如,责备你的那种HR式语气,它只是,它更开放了。我认为我们实际上看到了一种相当有说服力的竞争性回应。顺便说一句,谷歌已经推出了更便宜,而且可以说是同样好或更好的模型。所以它不是,再说一次,这只是每个人感知到的,
这是一个被刺破的泡沫,但如果你注意到了,它并不是,如果你一直在关注,它并不是完全令人震惊的。现在我犹豫了。我几乎觉得不好说这个,因为DeepSeek应该得到如此多的赞誉,他们所做的工程是惊人的。而且,而且他们所有的工作,如果你回到两年前阅读他们的论文,我没有阅读所有论文,但我阅读了三到四篇论文。这真的是好东西。以及一些已经被全球采用的真正突破,呃,
但这几乎说明了这一点。它就像人工智能的神话总是与现实有点不同,但现实也相当壮观,而且也没有得到充分的认识。所以这只是一个疯狂的大杂烩。不,这很有趣。我的意思是,再说一次,我认为,你知道,美国,硅谷公司应该感谢DeepSeek做了很多事情,对吧?因为最终,即使是,你知道,
OpenAI、Anthropic、xAI,他们可以购买英伟达能生产的尽可能多的视频芯片。如果他们向DeepSeek学习,他们难道不能使他们的模型运行得更高效、更好吗?好吧,这是有趣的事情。Grok 3本周刚刚发布。它似乎是最先进的模型。至少O3可能更好,但O3是一种非常独特的思维模型,我认为OpenAI永远不会直接发布。它处于深度研究模式。
这令人难以置信,而且,你知道,很明显它有缺陷,但这对像我这样的人来说是一个非常直观的感受,是的,有很多工作在未来真的会完蛋,你知道,所以所以这是一个。
最先进的或接近最先进的模型。xAI令人难以置信的是,它是在19个月前成立的。对。现在他们有了最先进的模型。这几乎是相反的。它是DeepSeek故事的反面,那就是这些DeepSeek所做的优化令人难以置信。他们彻底重新思考了如何进行专家混合架构,这绝对是——
对推理更好,但它有所有这些训练开销,他们只是改变了你的训练方式,以便能够更优雅地扩展,因为他们的带宽限制,他们无法处理太多的开销,而且,而且我认为顺便说一句,他们使用的是H800,他们没有使用H100,因为他们做了很多事情来设计模型,
这说明这是一家受带宽限制困扰的公司,这正是。他们说过。我的意思是,他们的首席执行官说过,其他员工也说过,他们最大的制约因素是芯片。对。我认为这完全符合模型的设计方式。所以我实际上认为DeepSeek一直是。
再说一次,对于中国,对于所有人来说,你都应该持怀疑态度。但这是另一个例子,我实际上,我相信他们。围绕这个故事的一切都与之相符。但是xAI进来了,他们在19个月内交付了最先进的模型,并且