We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode (Preview) Happy Lunar New Year and A Few Thoughts on DeepSeek

(Preview) Happy Lunar New Year and A Few Thoughts on DeepSeek

2025/1/30
logo of podcast Sharp China with Bill Bishop

Sharp China with Bill Bishop

AI Deep Dive AI Chapters Transcript
People
B
Bill Bishop
Topics
Andrew Sharp: 我认为DeepSeek的出现以及它引发的市场反应,突显了当前中美之间在人工智能领域的竞争态势。DeepSeek的成功,一部分源于其在计算资源受限的情况下,被迫提高效率和创造力,也反映出中国工程师在适应限制条件并构建更好产品方面的能力。同时,市场反应和舆论导向也存在操纵的痕迹,例如,有人试图利用DeepSeek来证明美国的技术控制措施失败,并以此打压美国科技股。 关于DeepSeek模型的起源和技术细节,目前仍存在许多未解之谜。我们需要更多信息来判断其模型的实际能力以及它对未来技术发展的影响。DeepSeek开源其模型,对全球其他国家来说是一个“礼物”,特别是对那些受美国技术转移限制的国家。这使得DeepSeek成为一个潜在的软实力工具。 总的来说,DeepSeek的出现以及它引发的各种反应,表明中美之间在人工智能领域的竞争将持续激烈,并且这种竞争将对全球科技格局产生深远的影响。 Bill Bishop: DeepSeek的崛起确实令人惊讶,但它也反映出中国工程师在适应限制条件并构建更好产品方面的能力。DeepSeek的成功故事存在一些被夸大的成分,其发展与中国股市监管改革以及对量化基金的打击有关。目前我们对DeepSeek新模型的意义缺乏足够的了解,需要更多信息来进行判断。DeepSeek开源其模型,对其他公司是有益的,它可能帮助其他公司提高效率。 DeepSeek的出现并不意味着美国对中国的出口管制完全无效,DeepSeek的模型也受益于美国的领先AI模型。关于DeepSeek的信息披露还将持续,目前许多说法都过于武断。我们需要区分可接受的数据提取和不可接受的数据窃取。DeepSeek的成功,部分源于其在计算资源受限的情况下,被迫提高效率和创造力。 总而言之,关于DeepSeek的多种说法都可能是正确的,目前信息不足以得出最终结论。我们需要保持客观,避免过度解读和情绪化反应。

Deep Dive

Chapters
The podcast discusses the unexpected rise of DeepSeek, a Chinese AI firm, and its impact on the US AI market. The initial reactions, including stock market fluctuations and online discussions, are analyzed. The discussion questions the narrative surrounding DeepSeek's success and the role of information flow in shaping public perception.
  • DeepSeek's unexpected rise and impact on US AI stocks.
  • Varying reactions and narratives surrounding DeepSeek's success.
  • The role of information flow and its impact on market perception.

Shownotes Transcript

您好,欢迎收听《Sharp China》。我是Andrew Sharp,您正在收听本期节目的免费预览。您好,欢迎回到《Sharp China》的另一期节目。我是Andrew Sharp,另一位嘉宾是Bill Bishop。Bill,蛇年快乐。你好吗?

我很好,谢谢。Andrew,新年快乐,也祝我们所有的听众新年快乐。今天是农历大年初一。确实。这两天你在旅行中遇到过蛇吗?没有,到目前为止,还没有看到。我希望,你知道,我认为看到蛇是吉利的。几年前,我们家有一条小蛇从公园里爬进来,不是大年初一,但公园里有很多蛇。所以也许我们会幸运地看到一条。

上一期节目结尾的故事仍然让我心有余悸。你在酒店房间里发现蛇。那是巴厘岛,对吧?是的,那是巴厘岛,是的。我最喜欢的部分是你不得不在你女儿面前摆出一副勇敢的样子,说,哦,这是真的吉利,并且一直保持冷静。好吧,公平地说,我认为这是吉利的。然而,它仍然有点……

你可以说,你更希望有一个更受控的环境。

但如果我们不快速谈谈DeepSeek,那就太疏忽了,DeepSeek本周已成为全球热门话题。你在周一通讯中的那句话基本上总结了这一切。谁的名单上有中国人工智能公司可能会刺破美国人工智能股票泡沫的黑天鹅/灰犀牛事件?所以过了相当几天。你对整件事感觉如何?

我觉得我们还有很多不知道的事情。一方面,中国有真正有才华的工程师专注于适应他们面临的限制并构建更好的产品,这并不应该令人惊讶。另一方面,股市的反应相当令人震惊。而且感觉确实有一些相当协调的努力来贬低中国。

来刺破这个泡沫,特别是贬低英伟达和其他一些芯片股票。推特上充斥着各种……人们谈论“思考男孩”,也有一群“推销男孩”谈论这表明美国的科技控制已经失败。一切都充满了胜利主义,这再次我认为是相当为时过早的。但观察信息是如何传播的,以及是如何创造出这种叙事,然后导致周一某些行业的股市恐慌,这真的很有趣。是的。我的意思是,作为一个在中国创业并且非常熟悉当地科技界的人,DeepSeek的背景故事中有哪些特别让你感兴趣的方面?因为有……

基本上是伴随着V3技术和R1模型的创世神话。然后在过去的一周左右,人们一直在戳破这个神话。好吧,有趣的是,这是一个量化基金。对。

嗯哼。

他们引进了这个新人,出台了一系列规则,包括对股市的监管、改革,包括打击量化基金。所以我认为在他之前的量化基金,高飞量化基金,我认为他们有点处于困境。但他购买了大量的英伟达芯片。

在任何出口管制之前,用于构建他的量化模型。我们不知道他到底有多少。有人谈论的是大数字。他肯定有一些。但是当量化基金面临压力时,他显然看到了多元化发展的机会或需求,去做更多

专门针对人工智能大型语言模型的工作。如果你看看中国人工智能公司的格局,

他的DeepSeek以拥有有才华的工程师而闻名,但他们并不是那些吸纳巨额资本的人。他们并没有利用炒作机器的领先优势,既是为了获得政府的支持,也是为了吸引更多的投资,因为他们没有任何外部风险投资公司。所以,我的意思是,对他们来说很好。当然,我们今天或昨晚获悉,

OpenAI和微软正在调查他们是否违反OpenAI的使用条款,窃取了比他们应该获得的更多的数据,以提炼他们的模型。所以我认为我们仍然,你知道,很多人都在对DeepSeek的新模型意味着什么得出各种结论。实际上,我认为我们还没有真正拥有足够的信息

来理解这一点,我认为这太棒了。坦率地说,我认为这是个好消息,因为它将帮助硅谷的公司。报道的信息显示,Meta设立了四个作战室来弄清楚他们是如何做到这一切的,因为他们列出了。他们实际上通过开源以及关于他们所做工作的详细论文来帮助公司。所以实际上,我认为这将帮助任何真正想要深入研究的公司。它可能会学习如何使他们的系统更高效。

是的。

将对美国科技公司有用。与此同时,很多人说,好吧,这证明美国在出口管制方面所做的一切都没有效力,中国的人工智能很棒,和美国公司一样好。

我认为可以公平地假设,如果没有美国的一些领先人工智能模型,DeepSeek模型就不会存在,也不会像现在这样有效,因为据称发生了蒸馏。我不确定。好吧,有蒸馏,然后有数据泄露。我的意思是,同样,存在一个……

可接受的蒸馏和不可接受的蒸馏。至少彭博社,现在多家媒体报道称,OpenAI和微软认为它更偏向于不可接受的一面。确实。而且可能是,我可能会被要求报道更多将被揭示的内容。的确。我的意思是,这是另一件事,每次有人说,嗯,

然后还有另一群人说,哦,这只是应对机制,等等。是的,没错。我的一个请求是互联网上的每个人都停止使用“应对机制”这个词,因为在过去的几天里它非常令人沮丧。我觉得我们正在把这个特定术语用烂了。DeepSeek开源这一举动非常引人注目,因为它再次我认为帮助了世界其他地区的竞争对手

通过向他们展示如何从他们所做的巨额投资中获得更多收益。它还,再次,它现在是一个非美国驱动、美国控制的模型,可以在世界各地使用。有趣的是,对吧,你回到拜登政府最后几天出台的人工智能芯片出口扩散规则,其中……

将世界划分为三个等级。第一层,美国的亲密盟友,他们可以得到他们想要的一切。第二层,必须申请,也许有配额。第三层,没有。

基本上是,你知道,如果你像DeepSeek一样,那么二层国家、三层国家,他们都是你的客户。完全正确。是的,它就像一个,它就像一个客户,但潜在客户名单。如果你在销售,我的意思是,这再次是免费的,但我的意思是更多的是,对于世界各地的许多地方来说,DeepSeek模型是一份礼物。确实。确实。

对于中国来说,像DeepSeek这样的模型是一种真正有价值的软实力工具,尤其是在美国将通过保持封闭源代码并试图对全球的技术转让进行分层来播种这些市场的情况下。我认为最终的结论是,多件事可以同时为真。DeepSeek模型

我们可能都没有足够的信息来得出结论。没错。而且很多人都在用陈述句说话,在这些方面将会有更多内容被揭示。所以一些事情,比如关于……你知道的,母亲或是什么,母亲发明的必要性,事实上DeepSeek,你知道,有一些

媒体芯片池,但可能没有他们想要的那么多。这迫使他们找到更具创造性和效率的方法来设计使模型工作的方法。我认为该公司、首席执行官和其他员工公开表示,他们最大的制约是计算能力。

好的。这就是免费预览的结尾。如果您想听到今天对话的其余部分,并每周获得《Sharp China》完整节目的访问权限,您可以访问您的节目说明,并订阅Bill的通讯《Sinocism》或Stratechery捆绑包,其中包括我的一些其他播客以及我的朋友Ben Thompson的每日文章。我是一个非常有偏见的新闻消费者,所以我认为两者都是不可或缺的资源

但无论哪种方式,Bill和我都会每周在这里谈论所有关于中国的事情,我们很乐意让您加入。因此,请查看您的节目说明,订阅,我们很快就会与您交谈。