最近,我的同事埃莉诺·奥尔科特前往中国南部的广东省。她前往一个偏僻的农村村庄,探访人工智能初创公司DeepSeek创始人梁文峰的童年故居。
埃莉诺谈到的成功与上个月发生的一件大事有关。
你可能还记得这家初创公司DeepSeek震惊了世界,它证明了中国在人工智能领域具有竞争力。他们展示了他们有可能与OpenAI或Meta等美国公司竞争。我们刚刚走过梁文峰的家。
你可以听到背景中爆竹声,因为这是中国新年,人们也在唱歌。梁和他的父母昨天离开了,显然是由一群保安护送的,因为他们被来自广东各地前来拜访的人们淹没。梁文峰几乎在一夜之间成为名人。
以至于埃莉诺访问梁的家乡时,她发现有人专程前往那里,只为看看这位中国新英雄是在哪里长大的。所以我采访了这位从广州到米岭(这个村庄)旅行的年轻少年,
我问他对梁文峰的看法。他的回答非常具有启发性,我认为它反映了中国人对梁更广泛的态度。他说梁文峰是一位务实的技术专家,实际上,多亏了他,中国才能够做到以前从未做到的事情,那就是
不仅能够竞争,而且能够超越OpenAI等公司。他成为了一种在中国民族自豪感、对技术信心的号召。他说梁文峰为国家做出了巨大贡献,为中国做出了巨大贡献。现在,围绕DeepSeek的这一切兴奋说明了中国科技行业的发展状况。
多年来,它一直处于困境之中。总的来说,情况非常困难,尤其是在那种传统的互联网领域。我们已经看到经济结构变化、地缘政治以及习近平的改革。所有这些都抑制了中国的创业精神。那么,在逆境中,梁文峰是如何做到的呢?我是金融时报的米凯拉·滕德拉。
这是《金钱背后》。如果你关注科技行业一段时间,你可能会记得中国一个不同的时代。当阿里巴巴和腾讯等互联网巨头似乎不可战胜时,当它们的市值超过Facebook和亚马逊等科技巨头时,外国投资者蜂拥而至,试图分一杯羹。但当埃莉诺于2021年加入金融时报担任我们的中国科技记者时,她
她告诉我,回想起来,她在自己岗位上的起始日期感觉有点晚了。我认为起点实际上是2020年底。我们已经看到许多改革,这些改革基本上降低了一些科技公司的盈利能力。
对此,我们看到外国投资者撤出中国,因为很明显,中国的监管权力非常强大,你无法保证你的投资不会受到监管方面突然变化的影响。北京打击那些被认为控制了太多市场份额或与共产党价值观不符的科技公司。
这导致了一系列反垄断调查和对某些业务(如游戏和教育科技)的限制。不出所料,所有这些都阻碍了业务发展。所有这些干预只是中国科技行业问题的一部分。我们显然经历了疫情,疫情导致中国大部分地区连续数月关闭。
而从创业环境的角度来看,这一点在许多方面是最重要的,那就是随着外国投资者的撤出,我们确实看到了国家投资者(即中国的地方政府和国有企业)介入并扮演着更大的角色,为创新提供资金。事情是这样的。来自国家的资金一直存在于中国的初创企业。
但正如埃莉诺所说,随着外国投资者撤出,它扮演了更大的角色。而这伴随着一些附加条件。如果你的公司没有成功,国有实体实际上会让你偿还他们给你的钱。这显然会使创业感觉风险更大,吸引力更小。
这对整体创业环境非常不利,因为你突然要求一位正在创办一家风险公司的人,如果他们无法退出投资,他们将个人承担
责任。这是一种债务形式。因此,我们看到这种创始人在债务人黑名单上的浪潮,以及许多非常悲惨的创始人的故事,他们,你知道,失去了所有东西,并且基本上被迫将他们的房子抵押出去等等,因为这种趋势。这让我们回到这个问题,梁文峰是如何做到的?他是如何创建DeepSeek的呢?
你能简单地用一两句话告诉我DeepSeek是什么吗?DeepSeek是一家位于杭州的小型人工智能初创公司。它是由这位神秘的亿万富翁梁文峰从量化对冲基金中创建的。自2023年末以来,他们一直在默默地努力,发布越来越令人印象深刻的模型。但实际上,世界直到今年年初才真正注意到他们。
为什么世界今年才注意到他们?所以他们发布了一系列与美国竞争对手的领先模型不相上下的模型。首先,这对于一家中国公司来说是令人惊讶的。但它更是令人惊讶,这一点非常关键,因为它们似乎是在数量少得多的芯片上训练的。
那么,多告诉我一些关于DeepSeek创始人的信息。我们知道他来自这个偏僻的村庄,但他的职业生涯呢?梁文峰的背景是量化交易员。他是一位真正的工程师,一个真正痴迷于技术的人。他真的相信机器的力量,并相信人类是易犯错误的,我们应该尝试用人类来代替人类。
你知道,用机器来代替人类的错误。因此,在对冲基金中,这意味着使用算法而不是人类决策。在DeepSeek,这意味着试图实现AGI,即通用人工智能,即机器能够进行人类水平批判性思维的时刻。
所以梁文峰是一个数学天才。他经营着一家名为“高飞”的对冲基金,在中国已经经营了大约十年。但大约在2021年,他痴迷于人工智能的潜力,想要创造比他的交易公司更大的东西。为此,他开始大量购买英伟达芯片。这些芯片是训练先进人工智能模型所必需的。所有这些都证明时机非常好。
这是因为到2023年梁文峰推出DeepSeek时,美国已经对向中国出售英伟达芯片施加了非常严格的限制。
当时人们只是认为他是一个古怪的、偏执的亿万富翁,把钱投入到一个虚荣心项目中。但事实证明,这实际上是一个非常有先见之明的赌注,因为一旦在中国开始竞相复制OpenAI,DeepSeek和梁文峰相对于一些竞争对手来说处于非常有利的地位。
现在,梁文峰做了一些事情来让DeepSeek起步。首先,他远离了我之前提到的那种由国家支持、附加条件的融资。这是一个极其昂贵的努力。并非每个人都有钱购买这些昂贵的人工智能芯片来构建模型。梁文峰拥有独特的地位能够做到这一点。他凭借其量化背景非常富有。
交易日。所以他一直在将这些资源投入到最初有点像一个副项目,但现在已经成为他全部关注的事情。因此,由于他自筹资金,梁文峰可以奢侈地以类似于OpenAI和DeepMind等一些人工智能巨头早期的方式来建模DeepSeek。
这基本上就像一个纯粹的人工智能研究实验室。这意味着他们并不真正担心立即产生收入。只是在实验。
因此,我之前所说的关于创业环境由于资金限制而困难的一切,并不适用于这家公司。实际上,他们成功的部分原因,他们能够推出如此创新的模型并能够开源这些模型的部分原因是,他们没有受到商业化的压力。梁文峰还有其他独特之处。他可以利用量化基金的人力资源来进行人工智能研究。
高飞拥有一群极其有才华的所谓系统工程师。这些人基本上建立了执行这些交易的计算基础设施。事实证明,这种人才,构建计算基础设施来执行这些交易的能力,在试图从这些芯片中挤出尽可能多的计算能力以训练大型语言模型时,实际上非常非常有用。
那么,埃莉诺,我们还知道梁文峰什么?他真正深入了解了技术的发展方式。据所有说法,他是一个真正痴迷于细节并积极参与DeepSeek技术开发过程的人。结果?一个被誉为中国对硅谷人工智能实力的回应的模型。
如果你喜欢看雪胜过在雪地里行走,你可能想考虑在这个冬天通过Instacart购物,
庆祝汤季,或者拥有几双毛茸茸的袜子。因为待在家里意味着保持温暖,有些日子只是尖叫着送货上门。所以在这个季节,从舒适的浴袍中获得您需要的一切。下载Instacart应用程序,并在短短30分钟内获得送货服务。此外,您的前三笔订单可享受0美元的送货费。适用服务费、排除项和条款。
埃莉诺在去年6月写了她关于DeepSeek的第一篇文章,远在西方所有关注之前出现之前。我问她,在中国观看故事的展开以及她认为这一切意味着什么是什么感觉。埃莉诺,那么,在这一切进入大多数人意识的前沿之前,他这么多个月前是如何进入你的雷达的呢?
我几年前第一次听说DeepSeek。我的一个联系人说,一个非常神秘的量化基金已经收集了中国最大的英伟达GPU集群之一
直到这家公司开始发布他们的模型,我才对此重视。所以他们在2023年底发布了他们的第一个模型,但它们变得越来越有竞争力。是的。我想写关于像这样的科技初创公司在2024年中期有多么令人惊讶?是的。
这并不令人惊讶,因为实际上生成式人工智能一直是一个融资相当多的领域,规模远不及美国参与者,但已经获得了大量资金和明确的政府支持。所以在更大的背景下,这并不令人惊讶,对吧?就像这是一幅复杂的图画。在这些领域的每一个领域都不一样,对吧?
但实际上,除此之外,你也可以争辩说,DeepSeek是一种例外,它证明了规则是正确的,对吧?它没有获得任何外部融资。他们没有受到国家投资者或风险投资公司关于他们能够赚钱的压力的影响。那么,你在去年进行报道时有机会采访梁文峰吗?我的意思是,你见过他吗?
不,我当时没有采访他。自从这件事出现以来,我已经看到很多西方媒体要求采访。我觉得这很有趣,因为在中国事情并非如此,对吧?如果
你是一位承受如此强烈审查的科技高管,鉴于地缘政治环境的加剧,他们不会四处向西方媒体进行采访。大约一年前,他接受了中国媒体的几次采访。从那以后基本上发生的事情是,人们一直在试图从关于这个人的非常非常有限的公开信息中提取尽可能多的信息。是的。
为什么会这样?你所说的压力是内部的还是外部的?他们都担心。他们担心华盛顿的反应,因为华盛顿已经对他们认为在中国某些高端技术领域取得太多进展的中国公司施加了很多限制。他们也担心中国的反应,因为华盛顿
我们正从一个大型科技公司赚取大量资金但在中国受到严格审查的时代中走出来。所以如果你公开谈论你的成功,这是一种两败俱伤的局面。埃莉诺,他们引起了轰动。DeepSeek引起了轰动。显然,梁文峰在中国受到了所有这些关注。但这家公司接下来会做什么?DeepSeek和梁文峰的近期目标是什么?
所以DeepSeek现在正处于增长模式,他们将继续努力,发布越来越有竞争力的模型。目前还不清楚,他们的商业计划是什么,如果有的话,我听说他们正在进行大规模的
扩张。实际上,这对DeepSeek来说是一个非常好的时机,因为,你知道,以前他们可能很难吸引最优秀的人工智能人才,因为他们有点默默无闻。但现在,他们是最热门的公司。他们是2022年末的OpenAI。每个人都想成为这个组织的一员。
他们从这里走向何方,他们是否会将他们的技术商业化,目前还不完全清楚。但已经很清楚的是,他们在中国引发了一种连锁反应,所有其他生成式人工智能参与者都在试图吸收和复制他们的一些经验教训,并真正关注DeepSeek一直在开创的一些技术,以降低训练和运行这些模型的成本。
那么你认为梁文峰会不会变得过于自大?我的意思是,如果你是他,你会担心吗?这是一个非常好的问题,对吧?一件有趣的事情将是值得关注的,我认为这可能是DeepSeek等公司的一个问题,那就是北京迄今为止一直支持生成式人工智能公司,并且
但是,你知道,他希望构建AGI。他希望构建能够进行人类水平批判性思维的机器。一旦他们开始看到这项技术变得越来越强大,这对北京意味着什么?我确实预见到在技术发展方式和对这种技术的政治回应之间会存在一些紧张关系。未来需要关注的事情。
《金钱背后》由我米凯拉·滕德拉主持。由我和萨菲娅·艾哈迈德以及卡佳·卡姆科娃制作。声音设计和混音由萨姆·吉奥文科和约瑟夫·萨尔塞多完成。原创音乐由汉内斯·布朗创作。托弗·福吉斯是我们的执行制片人。谢丽尔·布鲁姆利是全球音频主管。感谢收听。下周见。
嗨,我是来自《地下城与爸爸们》的弗雷迪·王,本集由Rocket Money赞助。休斯顿,我们节省了开支。没错。Rocket Money是一款个人理财应用程序,它使您能够节省更多,减少支出,并掌控您的财务生活。基本上,您可以在一个方便的地方查看所有支票、储蓄、信用卡和投资。您可以了解您的支出趋势,最重要的是,您可以分别对这些支出进行分类。
并通过识别主要的支出类别来设置自定义预算。听着,你想跟踪银行对账单吗?这非常困难。使用Rocket Money来帮助跟踪您的所有财务状况。Rocket Money拥有超过500万名快乐会员,它通过应用程序的所有高级功能为其用户节省了超过10亿美元。让Rocket Money帮助您更快地实现财务目标。立即访问rocketmoney.com/allinone获取Rocket Money。网址是rocketmoney.com/allinone。
从法国巴黎到德克萨斯州巴黎,使用您的美国运通绿卡,将日常购物转化为难忘的体验。使用Green for Memex在旅行和交通方面赚取三倍会员奖励积分。了解更多信息,请访问americanexpress.com/explore-green。适用条款。