We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Who Is the Mysterious Founder of China’s DeepSeek?

Who Is the Mysterious Founder of China’s DeepSeek?

2025/5/20
logo of podcast Big Take Asia

Big Take Asia

AI Deep Dive AI Chapters Transcript
People
K
K. Oanh Ha
S
Saritha Rai
Topics
Saritha Rai: 我认为梁文峰是一位非常神秘且低调的科技企业家,他致力于将中国打造成人工智能领域的强国。他早年创立量化对冲基金并获得了巨大的成功,但他对人工智能的热情促使他创立了DeepSeek。DeepSeek的早期宣言就展现了他避免平庸、挑战AI领域难题的决心,以及将中国推向AI领导地位的雄心。DeepSeek通过技术创新和开源策略,在全球AI领域迅速崛起,并对美国构成了挑战。尽管DeepSeek取得了显著的成就,但它也面临着来自中国国内其他科技巨头的竞争,以及如何将技术商业化的挑战。此外,DeepSeek的开源策略也引发了一些争议,一些人认为这可能存在安全风险。 K. Oanh Ha: 我对梁文峰和DeepSeek的崛起感到非常好奇。DeepSeek的稀疏性技术是否可以理解为,AI模型只使用大脑的特定部分进行计算,而不是动用所有资源?DeepSeek选择开源模型的原因是什么?这在战略上有什么意义?

Deep Dive

Chapters
This chapter introduces Liang Wenfeng, the mysterious founder of DeepSeek, a Chinese AI startup that has taken the tech world by storm. It explores his background, education, and previous ventures, highlighting his transition from quantitative finance to AI.
  • Liang Wenfeng, founder of DeepSeek, is a relatively unknown figure despite his company's global impact.
  • He hails from a small village in Guangdong province and studied at Zhejiang University.
  • Prior to DeepSeek, he founded a successful quantitative hedge fund, High Flyer Management.
  • DeepSeek's early culture was described as geeky and unorthodox, attracting top talent from companies like Google and Facebook.

Shownotes Transcript

尽管中国深势科技在全球引起轰动,但人们对其背后的创始人梁文锋知之甚少。在今天的《大事件亚洲》播客中,主持人K. Oanh Ha与彭博社的Saritha Rai讨论了这位将深势科技引领至人工智能前沿的科技创始人,以及这家公司的崛起告诉我们关于人工智能主导权争夺战的什么信息。进一步收听:《深势科技为何导致英伟达等科技股暴跌》观看,来自原创:《中国深势科技是如何挑战大型人工智能的》请访问omnystudio.com/listener了解隐私信息。</context> <raw_text>0 这是一个iHeart播客。

每个企业都始于一个想法。你如何从梦想家变成行业领导者?亚马逊企业加速您的旅程。通过智能商业采购,在一个熟悉的地方获得您成长所需的一切,从办公用品到IT必需品和维护工具。亚马逊企业采用您从亚马逊熟知并喜爱的购买体验,以及帮助您节省成本并做出基于洞察力的决策的工具。准备好将您的愿景变为现实了吗?请访问amazonbusiness.com了解更多信息。

人工智能正在重新定义您的业务的可能性,面临着更多独特的挑战,以及比以往更高的风险。微软帮助您保持领先地位。

我们值得信赖的人工智能工具和指导可以使像您这样的领导者能够产生更大的影响。借助Azure简化的平台管理,我们正在帮助企业更快地取得更大进步,将输出提高高达150%。无论下一个挑战是什么,都让微软帮助您继续前进。更多详情,请访问microsoft.com/challengers。彭博音频工作室。播客。广播。新闻。

今年早些时候,中国人工智能初创公司深势科技的一款新产品震惊了世界,并让华尔街感到不安。

中国的深势科技目前正在让AI世界感到震惊。由于其应用程序飙升至下载榜首,科技股暴跌。但尽管受到了全球关注,人们对深势科技背后的创始人——中国企业家梁文锋知之甚少。梁文锋无疑是一个神秘人物。彭博社的Sarita Rai负责报道亚洲的人工智能。

他肯定是我遇到的最难接触、最低调的科技企业家之一。为了说明他有多么私密,当我们仔细搜索他的网站时,我们无法在互联网上找到他的任何照片,但最终他出现在与习近平主席的一次非常高调的会面中,这张照片传到了全世界,他无处不在。

这个神秘的人长什么样?他身材苗条,戴着眼镜,但话不多。娃娃脸?是的,我认为我们可以这样形容他。

深势科技很少回答有关梁文锋的问题,理由是保护他的隐私。但Sarita和她的同事们对这个颠覆科技世界的人工智能系统背后的男人很好奇。因此,他们与数十位熟悉他工作的人进行了交谈,从前雇员和研究人员到投资者和业内人士。我们发现,是的,他非常低调,非常害羞,

但非常有动力、有天赋和热情。我认为他多少把深势科技视为一项使命,即在人工智能领域确立中国的地位,确保中国成为人工智能领域一股不可忽视的力量。

欢迎收听彭博新闻的《大事件亚洲》。我是万哈。每周,我们都会带您深入了解世界上一些最大、最强大的经济体以及推动这一不断变化的地区的市场、大亨和企业。

今天节目中,梁文锋是谁?我们将了解这位将深势科技引领至人工智能前沿的神秘科技创始人。此外,这家公司的快速崛起告诉我们关于美国与中国人工智能竞争的什么信息?Sarita,感谢您的加入。我对人工智能很着迷。你们对这个故事做了如此有趣的工作。我想知道我们能否从梁文锋是谁开始?我们对他出身了解多少?

梁文锋大约40岁,出生在广东省一个名为米灵的小村庄。他的父母是学校老师,主要教小学生。

他非常聪明,后来就读于浙江大学,并在那里获得了硕士学位。在浙江大学,梁文锋和他的朋友们沉浸在所有科技事物中:机器学习、信号处理、电子工程。他们甚至开发了在金融危机期间交易股票的程序。

毕业后,梁文锋与两位同学联手成立了一家名为“高飞管理”的量化对冲基金。因此,量化基金基本上使用数学模型和统计分析来进行股票交易。人类不参与决策。在其巅峰时期,

高飞管理公司管理着约140亿美元的资产。所以这是一个相当大的基金。在其最成功的时期,它为投资者提供的年化回报率平均为35%。所以我会说它做得非常好。

据前雇员说,高飞管理公司拥有极客创业文化。其早期的招聘广告吹嘘吸引了来自谷歌和Facebook的顶尖人才,并表示他们正在寻找具有古怪才华的数学和编码极客。

早期的招聘广告还提到了谢尔顿,他是美国著名情景喜剧《生活大爆炸》中这个非常尴尬的主要角色。例如,我哭是因为其他人很愚蠢,这让我很难过。谢尔顿拥有众多粉丝,并且非常有趣,但却并非有意为之。

所以,你知道,深势科技早期的整个文化都围绕着重现一些这种极客、书呆子文化。有免费零食、扑克之夜。每个人都穿着T恤和拖鞋。听起来像是一个很棒的工作场所。是的,这确实是一种非常非正统的创业文化。

这与您在中国大型科技公司(如阿里巴巴和腾讯)中可能看到的有所不同。梁文锋是如何从量化金融转向人工智能并创建深势科技的呢?

梁文锋一直对机器学习和人工智能非常感兴趣。然后,在OpenAI推出ChatGPT(这款聊天机器人一夜之间成为全球成功产品)几个月后。那是2023年春天,ChatGPT推出后已经过去了几个月。然后梁文锋……

宣布成立深势科技。在其早期宣言中,深势科技谈到了摒弃平庸,应对人工智能领域的重大挑战,当然,最终破解通用人工智能。这份宣言还阐述了深势科技将中国定位为尖端技术领导者的雄心壮志。

梁文锋接受过两次采访,尽管这很少见。在这两次采访中,他都谈到了将中国的人工智能生态系统带到世界前沿。中国经常被指责为模仿者。他希望中国在人工智能领域走出一条不同的道路。

深势科技行动迅速。自2023年以来,它已经发布了超过六种人工智能模型,并帮助开创了一种称为稀疏性的技术,这使得这些模型能够更有效地进行训练和运行。开发人员开始注意到

然后,今年早些时候……回到那个头条新闻,深势科技正在撼动全球科技界。当他们发布其推理模型R1时,这在业界引起了轩然大波,并导致了万亿美元的股市暴跌。那时,世界才真正开始关注这位来自中国的秘密人工智能企业家。

Sarita,深势科技的R1模型有什么突破性的特点?

直到最近,人工智能行业一直都是关于花费数十亿美元来构建基础设施、数据中心以及用于训练这些模型的数据中心中的图形处理单元。但深势科技所做的是表明,其模型在某些基准测试中可以匹配甚至超越最新的OpenAI或Anthropic模型。

而且计算能力更低,资源更少,正如深势科技所声称的那样,资本也更少。那么,梁文锋和他的团队是如何以其所说的成本的一小部分来实现真正创新的呢?深势科技的成功对中美之间的人工智能竞争意味着什么?休息后我们将讨论这个问题。

你如何将你的业务从想法发展到行业领导者?利用亚马逊企业提供的智能商业采购工具和技术,将您的愿景变为现实。从快速免费送货到深入的购买见解和自动化的采购审批,他们提供您实现目标所需的一切。脱颖而出并非易事。简化您的库存管理方式,从而领先一步。访问AmazonBusiness.com获取支持。

在商业中,时间表会发生变化,机会会迅速出现,您的品牌必须展现出强大的实力。这就是为什么精明的团队信任4imprint的原因。无论您是提前计划还是应对最后一刻的需求,4imprint都能让您轻松快速获得合适的促销产品,做得对,而且没有压力。拥有数千种选择,包括服装、饮具、科技产品和贸易展览必需品,您将找到适合您的品牌和时间表的产品。许多产品可在24小时内交货。

不确定从哪里开始?4imprint提供免费产品样品、专家指导和免费徽标协助,以便您的订单完全按照计划进行。每个订单都由4imprint的360度保证支持,因此它将按时、按预算和完美印刷到达。这就是4imprint确定的含义。

在4imprint.com上探索解决方案,让您的品牌快速、自信地到达所需位置,并且不会妥协。在过去的十年中,美国一直在试图限制中国获得半导体的途径。2022年及次年,当华盛顿对北京实施两轮芯片出口管制时,紧张局势达到了高潮。

拜登政府表示将收紧对向中国出口人工智能芯片的限制后,英伟达和半导体公司的股票今日下跌。这限制了美国公司(如英伟达)的销售,这些公司的尖端芯片被科技公司用来帮助训练其人工智能模型。此举对中国的开发人员提出了重大挑战。但正如彭博社的Sarita Rai所说,这也迫使他们开发变通方法。

需求总是创新的母亲。中国的人工智能开发人员已经证明了这一点。别管出口限制,他们仍然继续构建良好的模型,这些模型的基准测试结果与世界各地最好的模型不相上下。深势科技最具创新性的方法之一就是我们前面提到的稀疏性技术。

现在,稀疏性与在没有高端计算能力的情况下构建模型有关。当大型语言模型不必完全被利用来回答查询时,就会出现这种情况。相反,梁文锋和他的开发人员

试图将模型的专业知识分配给更小的专家组,然后只利用需要使用的那些组。因此,他们使其计算效率更高,成本效率也更高。

它基本上是不是不用你的整个大脑,而是只使用大脑的某些部分来进行计算?没错,Oan。你知道,与其完全使用大脑中的每一个灰质细胞,不如只激活大脑中包含该特定专业领域的神经元或大脑的小部分,然后将其用于

响应查询或回答特定问题,无论是命令还是编码问题。

稀疏性突破给深势科技的竞争对手留下了深刻印象,但其价格点最终成为头条新闻。深势科技表示,训练其V3模型的成本仅为560万美元。这远低于OpenAI在其最先进版本的ChatGPT上花费的估计1亿美元。

现在,围绕这个数字肯定存在很多怀疑,因为仅仅是基础设施、模型的训练、人才和所需的时间,所有这些加起来都是相当可观的金额。因此,这种怀疑是有道理的。人们估计,深势科技不可能在没有至少10亿美元或更多资金的情况下做到这一点。

对深势科技有利的是,像这样的AI初创公司在中国政府和习近平主席那里拥有坚定的盟友。Sarita说,习近平将生成式人工智能、机器人技术和其他高科技目标视为对国家议程有利,是更大规模推动关键技术自给自足的一部分。深势科技的成功促使阿里巴巴、腾讯和字节跳动等更大的竞争对手发布他们自己的人工智能模型。

Sarita,深势科技的模型目前完全是开源的。这意味着任何个人或公司都可以将其算法整合到他们自己的程序中。该公司为何选择这种方法,这又为什么如此重要?

开源,从一个层面上来说,你可以说它正在使人工智能民主化,并将其带到世界各地。但是,让我们不要忘记,如果中国的人工智能模型是专有模型,并且在成本方面与OpenAI等西方公司不相上下,那么它们在世界其他地方的采用率将会更低。

通过降低成本并使其开源,中国允许世界各地的人们快速查看这些模型并开始使用它们,从而使其在商业和人工智能生态系统中更快地被采用,从而超越OpenAI等公司。

现在,这意义重大。这不仅仅是关于使模型民主化。从战略上讲,这是为了确保通过降低成本使世界快速采用它,然后使其成为主流,从而淘汰你的竞争对手。因此,微软和亚马逊都在其云服务中提供深势科技。深势科技的模型已被整合到Perplexity中,这是一个人工智能驱动的搜索引擎,它还提供来自OpenAI和Anthropic的模型。

关于人工智能发展速度的问题肯定存在。世界各地都担心所有控制权都掌握在一两家公司手中。我认为这就是深势科技和其他公司试图向世界传达的信息,

所有控制权都不能留在一两家公司和他们正在构建的专有模型手中。它应该更加民主。因此,我认为开源理念是关于降低集中风险,并允许更多人使用更容易获得的技术进行构建。

在构建人工智能方面,西方的方法和中国的方法之间是否存在某种文化冲突或价值观冲突?非常明显,因为如果你看看深势科技的早期模型,甚至,你知道,不是深势科技的。

经过调整或微调的模型,它们非常符合中国的审查制度。例如,你不能问关于台湾或习近平的问题,否则它只会给出非常平淡的官方答案。而如果你采用相同的模型,并用其他数据对其进行训练,使其在文化上适合不同的国家,

这是深势科技早期学到的一件事,通过开源模型,并让开发人员和用户有机会根据自己的文化背景进行定制,深势科技可以找到更多机会。

在世界各地更快地被采用,而不是控制很多东西,并以一种只能向世界提供对中国友好的答案的方式进行控制。

虽然一些人赞扬中国在人工智能方面的创新,但美国许多人怀疑其成功的背后有更黑暗的原因。美国众议院委员会4月份的一份报告称,深势科技与中国政府之间存在重大联系。报告得出结论,该公司非法窃取了OpenAI的数据。中国大使馆驳斥这些说法毫无根据。与此同时,深势科技和梁文锋尚未就众议院的报告发表评论。

Sarita,目前看来,在人工智能方面,尤其是在美国和中国之间,存在着某种程度的军备竞赛。这确实是一场竞赛,我认为现在就宣布获胜者还为时过早。我只能说,一年前,我不会认为这是一场势均力敌的比赛。

这是一场马拉松,但你必须以冲刺的速度前进。我们才刚刚开始。对于任何赢得这场比赛的国家来说,都将获得大量的经济利益。因此,每个国家,特别是美国和中国,都不想在人工智能方面放松。

你认为深势科技目前面临的挑战是什么?我认为主要挑战之一是下一步做什么?他们还能做什么来超越他们已经取得的成就?但我也认为,对深势科技来说,国内竞争也是一个问题。许多中国公司,如阿里巴巴、字节跳动和腾讯,都在构建超越深势科技最新旗舰模型的模型。

因此,深势科技面临着做得更好的压力。但我也认为,还存在商业化这些模型的问题。像深势科技这样的公司将如何赚钱?深势科技是否想赚钱,以及如果想赚钱,它将如何赚钱,目前尚无明确答案。这是来自彭博新闻的《大事件亚洲》。我是万哈。本集由杨阳和吴苗制作。

它由帕蒂·赫什和约书亚·布鲁斯坦编辑。它由彭博社的编辑团队事实核查,并由高桥康泽混合和声音设计。我们的高级制作人是Naomi Chavon。我们的高级编辑是伊丽莎白·庞佐。我们的副执行制作人是朱莉娅·韦弗。我们的执行制作人是妮可·比姆斯特鲍尔。Sage Baumann是彭博社的播客主管。

如果您喜欢本集,请务必订阅并评价您收听播客的《大科技亚洲》。这真的有助于人们找到节目。感谢收听。下次再见。我认识很多警察。他们经常被问到,你有没有开过枪?有时答案是肯定的。但有一家公司致力于一个未来,在这个未来中,答案将永远是否定的。这是绝对第一季。泰瑟公司。我马上就回到那里,情况很糟糕。

在iHeartRadio应用程序、Apple Podcasts或您收听播客的任何地方收听绝对第一季,泰瑟公司。有时生活需要更好的床垫,有时生活会给你一个更好的地方去寻找。

宣布床垫仓库盛大开业,拥有最广泛的顶级品牌选择,价格最低。这就是仓库优势。此外,您还可以获得一年的低价保证和0%利率融资。那么,您会在哪里寻找完美的床垫呢?在一家小床垫店还是在床垫仓库?立即选购我们的盛大开业特卖。访问mattresswarehouse.com。这是一个iHeart播客。