We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Vol.118 英伟达如何变得“不可替代”?

Vol.118 英伟达如何变得“不可替代”?

2023/7/5
logo of podcast 商业就是这样

商业就是这样

AI Deep Dive AI Chapters Transcript
People
王杰夫
肖文杰
无具体一句话概述
Topics
肖文杰和约小亚介绍了英伟达的市值突破万亿美元,以及其AI芯片在市场上的巨大需求。他们概述了节目将探讨英伟达成功的三个阶段:生存、转型和乘风口。王杰夫作为嘉宾,详细解释了英伟达的成功历程。他首先回顾了英伟达早期在游戏显卡市场的艰难起步,以及与世嘉的合作经历。然后,他重点介绍了CUDA架构的研发和推广,以及其对GPU通用化和AI应用的重大意义。最后,他分析了英伟达在不同领域的探索,包括移动端、自动驾驶和虚拟货币挖矿,并总结了英伟达的成功在于其强大的研发能力、执行能力和对市场趋势的把握。 王杰夫详细解释了GPU和CPU的区别,以及CUDA架构如何简化GPU编程,提高开发效率。他分析了深度学习的兴起以及ImageNet竞赛对英伟达的重要性,并指出英伟达的成功并非偶然,而是长期坚持研发和战略布局的结果。他还比较了英伟达与AMD和英特尔在GPU市场上的竞争态势,并分析了ROCM架构未能成功挑战CUDA的原因。 肖文杰分析了英伟达最新一季度财报,指出其营收下降,但下一季度业绩指引强劲。他分析了英伟达面临的长期挑战,包括保持GPU性能优势、应对来自产业链的挑战以及地缘政治风险。他强调了中国市场对英伟达的重要性,以及美国对中国芯片出口限制带来的不确定性。

Deep Dive

Chapters

Shownotes Transcript

大家好,我是肖文杰,我是小丫。

这期呢,我们来聊一聊目前最炙手可热的一家公司,就是英伟达。

今年 6 月 啊,英伟达是成为了芯片行业有史以来第一家市值破万亿美元的公司啊,这是连英特尔都没有做到的事情。

而且截止目前,比英伟达市值高的也只有苹果、微软、亚马逊、 Alphabet 还有沙特阿美这五家公司。

此前呢,特斯拉和 Meta 都曾经达到过万亿美元的门槛,但现在都股价回落了。

大家仔细看一下这个名单里的公司啊,除了沙特阿美,其他好像都是英伟达的大客户嘛,他们每年要花数亿甚至数十亿美元来买英伟达的芯片。

是的,这也是英伟达近期在二级市场受追捧的重要原因,就是因为随着这个 CHAT 1PT 的爆发,人们发现现在想在人工智能,尤其是大模型方面有所建树的公司,都必须大量采购英伟达的这个 AI 芯片,所以人们称其为 AI 时代的一个军火商啊,或者英伟达自己的说法是 AI 时代的一个基础设施的提供商。

那从这个角度看,是不是说英伟达和沙特美也没有什么差别了?

是有点这个感觉。

而且今年呢,正好是英伟达成立 30 周年, 30 年 前英伟达只不过是数十家想要为游戏做 3D 显卡的小公司当中的一家啊,甚至他没有自己的办公室,都要在乒乓桌上面来办公,但现在的话,它成为了一个新时代不可替代的一个基础设施的提供者。

那这期节目呢,我们就来讲一讲这样一个转变的过程是怎样发生的。

嗯,这期节目除了我们两位之外呢,还特别请了一位嘉宾,就是我们同事王杰夫。

大家好,我是王杰夫,也可以叫我 Jeff。

Jeff 呢,是第一财经杂志旗下新皮层团队的成员。

新皮层啊,就是大脑皮层的那个皮层,是一个我们专门报道人工智能相关内容的一个品牌。

在微信里面搜索这三个字的话,就可以找到他们的公众号。

Jeff 呢,他长期关注科技领域的大公司,可能有的听友会有印象,就上次我们微软的那期节目,里边其实就引用过新皮曾发布的一篇关于微软和 Google 在 AI 上面竞争的一个文章,就是 Jeff 写的。

这次呢, Jeff 又写了一篇关于英伟达的研报。

其实我们今天的节目呢,也是在他这篇文章的基础之上衍生的,而且这篇文章在本周三也在新皮层的这个公众号上发布了,里边有更多关于图表和专业技术的一些分析,大家也可以结合节目一起来复用。

那这期节目我们会分三个阶段来回顾英伟达的发展。

第一个阶段是生存,就是它如何在游戏显卡时代就活下来。

第二个阶段是转型,它是通过软件研发,把 GPU 从单纯的显卡转变成了一个通用计算的工具,这是怎么做到的?

第三个阶段就是承上风口,也就是在 AI 大潮来临的时候,英伟达是如何快速抢占最佳位置的。

最后呢,我们也会基于财报的数据来看一下英伟达当下的一个实际的经营状况,并且也分析一下他接下来将会遇到的一些挑战。

可想而知啊,这期节目会涉及到一些技术名词,虽然我们会尽可能通俗而且准确地解释,但是毕竟不是专业人士,如果有问题的话,也希望大家指正。

还有那句老话就是本节目不构成任何投资建议。

OK, 那我们就开始吧,这里是商业,就是这样。

那首先要么肖老师还是给大家介绍一下英伟达这家公司成立时候的情况吧。

英伟达是 1993 年 成立的,然后创始人的话就是现在的 CEO 黄仁勋,还有他的两位工程师的朋友,那一年啊,黄仁勋刚刚 30 岁,在此之前呢,他其实已经在芯片行业工作了十年了。

他在 AMD 做过芯片的设计师,然后在另一家芯片公司叫 LSI Logic 做过工程师和销售,然后一路做到了部门的负责人,然后他就决定创业了。

那这个好像在当时硅谷算是常规操作吧,有一点抱负的工程师其实都想开自己的公司。

是的。

而且黄仁勋所处的芯片行业啊,在当时还不像现在这样由大公司完全把持着,可以说一切格局都还未定啊,连英特尔在那时都不算是很大的一个公司。

黄仁兴和伙伴创业的时候呢,也是先决定我们要开公司,然后再一开始研究芯片行业里面到底有什么机会,最后他们才选择了做这个高性能的 3D 图片处理的这样一个芯片。

嗯,那为什么选择这么一个细分的市场?

Jeff 能不能帮大家解释一下?

首先是因为他们擅长这个,呃,有这个能力。

黄仁勋之前供职的公司这个 LSI, 其实本身就是做图形处理相关芯片的。

其次是市场,当时游戏业界正在处于一个快速发展的前夕,尤其是 PC 游戏,那是一个非常前沿的方向,就是 3D 游戏。

黄云勋他能够看到这是一个有潜力的市场,他自己本身也是个游戏玩家。

第三就是黄元勋本身的倾向,他就喜欢做性能上最极致的东西, 3D 显卡我觉得是符合他的审美的。

可以理解。

但是这个创业啊,其实一开始并不算非常成功啊,因为英伟达的第一个产品叫 NV one, 它虽然性能非常好,就是符合它这个对性能的追求,而且还集合了什么声卡啊,包括游戏操作感的这些处理能力。

但是这个产品太贵了,和这个市面上的同类的产品要贵一倍,而且和当时主流的这个微软的 direct 3D 的这个标准啊并不兼容。

所以呢,这些游戏开发者不太会在你这个硬件的基础上面去开发这些 3D 的游戏了。

整个 MV one 的这个销量实际上是非常惨淡的啊。

第一个产品就出师不利,可以想进这个公司应该不会好了。

呃,看到当时黄仁勋的一个说法,那个时候因为达梨破产只有 30 天啦。

还好这个时候呢,当时的游戏巨头世家成为了英伟达的一个救命稻草啊,因为世家发现 me one 这个产品虽然不太适合 PC 上面开发那个游戏啊,但还挺适合游戏主机的,因为它集合了各种各样的功能嘛,然后就采购了不少用于它当时一款非常流行叫土星的游戏机。

后来它还给了英伟达一个新的研发订单,让它研发下一代游戏机的一个显卡。

结果呢,黄仁勋这个时候对于这个性能的极致追求啊,又出现了问题,英伟达呢,为了追求他们理想当中的一个,这个显卡的高性能,在这个新的研发项目里边还是没有采用主流的这个技术,或者主流的这样一个标准,最终就导致他跟这个世嘉的合作啊,持续不下去了,在这个时候呢,黄瑞欣就打电话给世佳的高管说,我们这个合同啊,履行不下去了,但是你之前预付我们的那个 700 万美元的研发费,能不能别拿回去,英伟达非常需要这笔钱,不然我们就要破产了。

真是一个非常过分的要求啊。

那黄瑞欣自己也觉得这个非常非愤,他去年在台大的毕业典礼上面,回忆这段故事的时候啊,就说自己打这个电话的时候就非常难为情,但是没有想到世家的高管同意了这个要求,而且甚至都没有去要求一些什么股权的置换啊这样的一些利益,就单纯地帮了一下这个小公司一把啊。

这个也是传说中的用真心换真心吗?

用真心就可以吗?

是不是顺便说一下啊,就是世家的这位高管,他叫入交招一郎,他此前呢是本田汽车的社长,和我们过去讲过那个本田小郎的那个开发者是本田宗一郎共事过,这个人也是一个彻底的就是本田那种风格的工程师,曾经负责过本田的赛车项目,包括这个高性能摩托车的研发。

感觉这是技术宅和技术宅的惺惺相惜,嗯。

有点这种感觉。

总之呢,这个 700 万美元就让英伟达能够多活了据说三个月,而在这三个月里边呢,英伟达就开发了一个适配微软标准的,或者说是符合当时主流技术方案的一个叫 river 128 的一个 3D 显卡。

和前面两个产品相比的这个产品,它一改之前那种不考虑市场实际需求纯粹追求性能的什么毛病?

它不仅性能做得很好,而且呢价格也比较便宜,而且又适配主流,所以仅仅 4 个月就大卖了 100 万张。

那英伟达呢,也就就此站稳了脚跟。

王元兴自己在讲这个故事的时候呢,重点在于接受失败,改正错误。

但这里其实还是有一个隐形的点值得强调的,就是英伟达强悍的研发能力和执行能力。

在技术方向改变之后,整个公司能够快速重新启动,迅速拿出成型的新产品,这个能力其实是英伟达在芯片行业的立身之本。

嗯,有个俗话叫不撞南墙不回头吗?

我觉得黄仁勋和英伟达就属于一种,马上就要撞到南墙,那一刻我还能反应过来,然后马上就回头,而且 4 个月就把这个局势扭转过来,一个类型。

对对对,是这样的,英伟达从此就保持了这种研发能力,在激烈的竞争中成为显卡的领先者。

当时英伟达采取的是 3 团队两季度的模式,就是有三个团队独立研发三种不同阶段的产品,一个的 DEADLINE 在今年秋季,第二个呢就在明年春季,第三个呢,就在明年秋季,如此轮转循环,这样就能保证它每 6 个月就能研发出新一代的产品啊。

其实在 CPU 行业有一个很著名叫摩尔定律嘛,就是说每 18 个月 CPU 的性能就可以翻一倍。

那黄仁勋就给相当于提出了 GPU 的皇室定律了,这个每 6 个月就要让 GPU 的性能翻一倍。

对,这个过程中,英伟达还找到了适合自己的商业模式,也就是把制造交给制造厂,自己只负责芯片设计,这能让他在资金量有限的情况下,尽可能的去释放自己的研发强效。

而台积电不断进步和扩大产能,也让英伟达有能力在激烈的竞争者中打败和吞并竞争者,成为独立显卡的冠军。

双方紧密的合作关系一直是延续到今天。

嗯!

没错,而且这个英伟达和台积电的这个合作关系,我们之后还会提到啊,这个紧密是有好处,但是也有一些小小的隐患。

到了 21 世纪初呢,其实英伟达已经把这个高性能的 GPU 啊,也就是图形处理器,变成了一个独立的主流的一个芯片产品,而不是在最早期的时候是以仅仅一个 CPU 的一个附庸,那英伟达自己呢,也成为了其实当时游戏行业当中一个响当当的名字啊。

我们玩游戏的话都会说所谓 a 卡 n 卡, n 卡就是英伟达的卡, a 卡就是指 AMD 的这个显卡,是一个大家都会去非常关注的一个重要的配置。

但是呢,在这个时候,英伟达和黄仁勋就并没有满足于自己在游戏行业里边这个站稳脚跟的地位,他始终觉得 GPU 应该有更加广阔的天地。

OK, 那我们就进入第二个阶段,就是转型期。

如我们开头介绍的就是在这个阶段啊,英伟达是把 GPU 从一个单纯的图形处理器变成了一个通用计算的基础设施,而他自己呢,也从一个单纯的芯片的设计公司,变成了一个庞大的这个研发生态的一个构建者。

感觉刚刚这一段黑化浓度是不是有点太高了,哈哈哈。

什么叫 GPU 变成通用计算的基础设施?

呃,这个讲起来我们是不是还没有给大家解释 GPU 到底是什么东西,它跟 CPU 到底是有什么区别?

那 Jeff 来解释一下吧,要不?

嗯?

好的好的,那我简单科普一下哈,就是首先我们需要理解 GPU 和 CPU 的区别。

CPU 它其实就是我们常说的中央处理器,它的强项在于串行计算,适合专注做某一件事情。

而 GPU 就是图形处理器,它的强项在于并行计算,就是许多核心同时做一件事情。

呃,我们打个比方哈,想象 CPU 像是一家高级定制服装的工作室,他从一件衣服的构思、草图绘制、物料准备、打板调整、样衣制作,这是一整套流程,你必须完成了这一步,才能完成下一步。

每个环节都牵一发而动全身,这就需要串行计算,就需要手艺好的裁缝,也就是 CPU 来做。

而 GPU 做的呢,擅长的是流水线去生产 t 恤。

比如说在 100 件 t 恤上印一个 logo, 你只要有 10 台机器,各自印 10 件就可以了,又很简单,又不相互打扰,所以说只需要 10 个简单训练的工人即可,这就是并行计算。

嗯, Jeff 这么一说的话,我其实想到一个跟我们日常工作更相关的一个类比啊。

CPU 呢,就像一个记者去做一个深入的人物访谈,比如说要问一个人为什么结婚了,你要先问他的家庭背景,他的经济收入,还要问这个配偶的情况啊等等的,最后能够得出一个大概的结论。

那这个采访呢,就属于是一个技术活,有可能需要一个专业的一个记者来完成,但是 GPU 呢,就像是给 100 个人做问卷调查,只问他们一个问题,就是你结婚了还是没结婚。

那这个就不需要什么专业的采访技巧了,简单培训一下就可以做。

没错,理解了这个区别,也就能理解为什么 GPU 适合处理图形显示,因为显示一个图片就要算出每个像素上该是什么颜色,这个事情呢,本身不难,但是像素非常非常多, CPU 算起来虽然快,但是得一个一个像素来,而 GPU 就可以一堆像素同时算。

这也是为什么我们需要一个强大的显卡来打 3D 游戏,来做专业的视觉设计。

虽然我不打游戏,但是我觉得我大概理解了,嗯。

对,因为这个 3D 游戏嘛,它要需要这个就是识别或者计算,那些像素是非常非常多的。

对对对,解释了这个问题呢,我们就能进入下一个问题,什么叫让 GPU 变得通用?

所谓通用呢,就是英伟达认为 GPU 的这种运算特性不仅适合图形显示,它还适合做很多很多的运算场景。

通俗点说哈,反正就是雇佣 100 个人做同一样一件简单的事情。

那么做啥不是做呢?

裁衣服,拧螺丝,只要是简单的工作都行,这就所谓的通用计算。

重点来了,要实现这种通用性,并不是把 GPU 直接拿来用就行,因为让 GPU 执行不同的任务需要软件编程,但 GPU 的编程原本是很复杂的,这就需要专门学习,不是随便一个程序员就可以了。

而英伟达在 2006 年 推出了一个软件系统,或者叫一叫软件架构也行,它就是叫窟大。

打个比方哈,你把 GPU 想象成一个工厂,每个基站核心都是一个工人,窟大相当于一个指挥系统,你提一个简单的需求,指挥系统就能够帮你安排每个工人的工作。

更关键的是,只要是英伟达出产的工厂,所有的指挥中心的沟通方式都一样。

在现实中,研发人员就可以用他们熟悉的 C++ 呀这一类的编程语言直接去编写自己要 GPU 干的事情,这就比原本直接对芯片编程容易太多了啊。

相当于有了这个 CUDA 以后,开发者可以很轻松地自己去调整就是 GPU 到底是做什么功能的,那这个 GPU 的潜能就完全被打开了。

对的,他们能很轻松地用 C++ 等语言来编程,让 GPU 为自己所用,大幅地提升了研发的效率啊。

那么问题就来了,现在我们都知道这个潜能好像对所谓的 AI 大模型很有帮助,但是酷大这个东西出现是很早吧,好像是 2006 年 那英伟达研发库大的时候就知道这个东西未来要是往什么方向走嘛,嗯?

我觉得应该是不知道的,当时黄仁勋应该只知道一个大致的方向,就是这个东西对于科研人员肯定有用,所以他的主要营销目标就是在高校推广 CUDA。

2008 年, 英伟达在伊利诺伊大学香槟分校设立了全球第一家 CUDA 卓越中心。

英伟达不仅为这个中心捐了 50 万美元哈,还捐了 80 万美元的 GPU 集群。

很快,几乎所有的理工科名校都在申请酷大的卓越中心,比如 2009 年 的清华大学。

2010 年 10 月 的时候,英伟达又启动了酷大研究中心和教学中心计划,提供培训课程,教大家怎么用酷大,当你购买 GPU 的时候,英伟达还会提供折扣。

提供了这么多好处,英伟达收获的就是一个基于酷达的一个研发生态。

大学里开始教酷达课程,多个实验室在研究中采用酷大的技术,而且各地的开发者也开始分享各种代码和经验,很多研究的进度确实得到大幅度的刷新,比如建立气象模型啊,分析蛋白质结构等等。

我们在 2010 年 英伟达的财报里面找到这么一句话啊,我们正在与全世界各地的开发者合作,他们已经采用并编写了针对酷大架构的应用程序,研究人员也可以使用 CUDA 来加速他们的研发啊。

听起来确实很厉害啊,但是我们都知道这个科研机构就算很喜欢 GPU, 但是这个科研机构这个总量还是比较小的吧,那在商业上这个账算得过来吗?

营业老师其实问的就是一个,他在高校里边不停地这个营销投入能不能产生回报的一个问题。

我的理解的话,其实当时因为大家做这个酷大的研发就是一个非常冒险的事情,因为它其实是在赌,就是这些科研领域里边会出现一两个技术,它能够大规模地商用来开拓 GPU 的市场版图。

如果没有这样一个商用的这样一个技术的话,那它只在课业里边确实是肯定赚不回来这个钱的。

但这个赌的筹码呢,确实非常非常大啊。

呃,我们来看一下具体的数字吧,这个黄仁勋在 2017 年 的一次这个财报的这个分析师电话会议里面就提到说,为了把英伟达旗下所有的芯片都纳入酷大的架构,英伟达大概累计花了超过 100 亿美元的这样一个成本。

当然这个只是一个估算啊,因为你实际上很难划分清楚研发当中有多少是因为枯大而增加的成本。

但是我们从财报里边其实可以看到一些比较明确的佐证,就是从 2009 年 开始,也就是这个酷大推出两三年之后吧,对呃,英伟达每年的这个研发费用率就从 15% 左右的水平陡增到 25%, 就最高的年份是超过 30%。

也就是说一年这个英伟达的这个整个收入的 1/4 以上都用来投入到新产品的研发当中。

注意这个是收入的 1/4 啊,不是利润的 1/4。

而且这几年基本上就是英伟达把所有产品来纳入酷大架构的,这个最辛苦的研发阶段就是我出了这个软件架构,接下来我的新产品要去适应它,这个过程其实是花了最多的钱的。

嗯。

刚刚肖老师提到这个 25% 以上的研发费用率真的非常高啊,就给大家简单做个对比。

像苹果这个,它常年的研发费用率是不足 10% 的,微软算投入比较多的,大概是 15% 到 20%, 即使是同在芯片行业里面,像英特尔也就是 20% 左右了,所以 25% 真的是个很高水平。

对,而且你要知道,研发费用率其实未必是越高越好的。

呃,因为研发费用并不等于你这个研发实力嘛。

过度的投入在研发里边,其实也会增加企业的运行负担。

像英伟达这个研发费用率,我看到在近几年里边,其实比较多的都是用在了这个研发人员的股权激励上面,其实就是说你要做这么一个困难的事情的话,你就需要用比较大的这个代价来留下那些非常高质量的人才,那些能让他跑了对吧?

对对对,但是其实在那几年啊,英伟达围绕这个 CUDA 的这个后续的研发,并没有给他带来这个实际的 GPU 销量的增长,就他把那些 GPU 都适配了 CUDA, 但是并没有说直接涨了,因为他都投在这个科研里面嘛,其实并没有马上的出现一个大的功能的效果,所以那几年英伟达的整个股价也一直不好。

呃,包括华尔街啊一些大的投资者,他都非常不满意伟达这种原本你这个显卡生意做得好好的,偏偏要把所有的钱都拿去赌一个可能性的这样一种做法。

你好好卖东西不好吗?

那后来我们看到英伟达其实是赌成功了嘛,或者说等到了这个时机,就是在我们前面提到那么多用酷带的科研方向里面,确实有一个领域跑出来,那就是人工智能。

其实严格来说哈, GPU 其实并不适合所有的 AI 计算, AI 计算其实分很多种, GPU 仅适合其中的一种,也就是深度学习。

呃,要稍微回顾一下这个 AI 的发展史,从上个世纪 50 年代出现以来, AI 有两大流派,一个叫做符号主义,另一个叫做连接主义。

这个名字听上去都有点哲学意味哈,但是其实简单来说,它就是对人类思考模式的两种理解,前者主张的是逻辑,就是搞清楚人到底是怎么做决策的?

我们拿走迷宫来举例哈。

符号主义就是走到每一个岔路口,都会认真分析到底该往哪里转。

而连接主义呢,就是模仿人类的神经元网络,他走起迷宫来啊,更类似找 1000 个人来。

每遇到一个岔路口,就分成两拨人,主要人数足够多,最后至少能有一个人找到出口。

深度学习呢,就属于后者。

很长一段时间,从 60 年代到 90 年代,符号主义都占据绝对的优势。

原因很简单,当时计算机哪有那么强大的性能,让你找 1000 个人来走迷宫呢?

连 10 个都不行。

所以深度学习那时候解决实地课题的效果并不理想,甚至于走这个路线的科学家都拿不到经费。

今天,我们深度学习的开箱鼻祖 Hinton 甚至远走加拿大了,因为美国没有大学愿意资助他的研究啊!

那这个行业听上去不是很行啊,那最后是怎么又变成了现在一个主流呢?

有这么一个转折点,它就是 2012 年 的一个叫 Imagenet 的一个竞赛。

这是斯坦福的人工智能教授李飞飞创办的一个比赛,参赛者呢,要比拼自己人工智能算法识别图片的准确性。

当年 Hinton 和他的两位学生用神经网络搭建的 AI 系统在这个比赛中一骑绝成,错误率降到了 16.4%, 比第二名提高了 10 个百分点。

要知道,在当时提升 1% 都被认为是一个学术的突破。

这次比赛让成绩已久的深度学习重新受到重视,而 Hinton 团队采用的就是两块英伟达 GTX 580 显卡,从此整个人工智能行业都认识到了英伟达的重要性,微软,谷歌,亚马逊都开始大量的采购英伟达的芯片,酷大的生态圈也越来越稳固,这时候已经没有人会把 GPU 看作一个单纯的图形处理器了。

顺便提一下,就是 Hinton 那个团队,呃,当中的一位学生,后来就是 open AI 的这个联合创始人。

那 open AI 做的这个 chat PPT, 现在就是又进一步这个扩大了英伟达的在这个整个科技核心配好的一个地位。

所以说是一个传承有序的概念了。

嗯呃,我看黄世兴还是在台大那个演讲里面说的,他说英伟达是为 AI 发明了酷达,我觉得他这个属于事后诸葛亮的对。

就是刚刚听了 Jeff 这一段科普的话,你就会发觉这个属于是他现在来总结的时候好像都是为了 AI, 但其实当时的话, AI 只是所有路当中的一条而已。

对的对的。

黄元勋虽然不可能提前预测 AI 的爆发,但它的确坚信 GPU 会有一个像 AI 这样的用武之地的。

转型期的这个重要节点就是 CUDA 的部分,我们也介绍得差不多了,那在 AI 和深度学习崭露头角以后,英伟达肯定是把这一部分作为重点的发展方向,但是即使如此,营业就很难说这个 2012 年 以后这个英伟达就 all in AI 了。

对就虽然我们这个第三阶段叫做乘风,好像就是你觉得有了这个转机之后,英伟达就应该一直在做 AI 了,但其实这个尘封期并不是这么自然而然的。

事实上英伟达在 21 世纪的第二个十年,也就是刚刚过去这个十年,他还在持续地这个摸索 GPU 在别的一些领域的一些潜力。

这里边呢,就有一些成功的,也有一些失败的案例。

我们举三个例子啊,第一个就是一个失败的案例,就是在移动端,就是在智能手机崛起之后,英伟达其实也想要入局,觉得 GPU 能搞点什么事情。

结果他在 2013 年 发布的一个专门针对移动端的一个叫 Targa for 的一个芯片,本来是准备就是主打智能手机的,结果卖得非常差,没有拿到太多的订单,原因呢,就是因为它的价格又偏高,性能上虽然有一定的优势,但它这个功耗啊,包括它这个这个发热啊,都其实挺厉害的,并不太适合手机。

最后这个芯片主要的这个用处就是在任天堂的这个 switch 上面使用。

switch 现在也卖得挺好的,你也不能说它太失败对吧?

对,但是感觉它这个过程就跟早期这个最早失败那个 NVI 那个显卡有点相似了。

是的,而且这 switch 虽然这一个机器卖得挺好,但你跟整个手机是每年这个大几千万甚至上亿的这个销量来比就少很多了嘛。

而且在这个之后呢,英伟达其实就在智能手机的行业就没有太大存在感了。

这个时候黄瑞群又发挥了这个在南桥这个要撞到之前迅速回头的这个本事,他就放弃了手机行业,然后把 Targa 芯片的这一套呢,转向了汽车自动驾驶的领域。

现在这个反倒变成了英伟达的一个潜力市场啊,就是中国。

你看这个所有的这个电动车的新品牌,呃,只要上个新车都会说我现在搭载了这个英伟达的什么 Orin 的芯片啊等等的,已经把它当做一个高端配置的一个招牌了。

第三个例子呢,其实就是一个飞来横惨,你可以说它是成功或者失败都可以吧。

可能是异常的成功吧。

啊,对,就是虚拟货币和挖矿的这个需求。

这个比特币的所谓挖矿吧,其实就是大量的这个简单的运算,本质上就是这个事情,这个呢,一听就是非常适合 GPU, 所以当时啊,这个英伟达为游戏开发的这个芯片销量是大增的,而且供不应求。

但实际上都不是用来玩游戏的,都是用来挖矿的。

这个其实是 2021 年 之前啊,英伟达已经有一波股价大涨的那个时候的重要的推手。

嗯。

但是大家都知道啊,这个恒才基本上不会在你手上待太久的啊, 2021 年 以后不是虚拟货币各种爆雷嘛,而且挖矿需求其实也大幅下降了,当年英伟达的股价就在大幅冲高以后大幅回落了。

对,这 2022 年 能够拿得住英伟达股票的人不太不太多了应该。

嗯,那这段在别的领域摸索的这个过程,我们自己来总结的话,我觉得,呃最需要记住一个点还是前面提到的,就是英伟达一个强悍的执行能力,先不论成功还是失败,我们看到的就是在 2013 年 它这个移动端的芯片卖不出去之后,它在 2015 年 就转型推出了针对自动驾驶的这个芯片产品,然后在 2016 年 马上就推出了这个平台的第二代的芯片。

第二个例子就是在 2017 年 比特币大涨的情况下,英伟达就马上了改造了它这个游戏的显卡,就是变成了一个专门用来挖矿的挖矿卡,然后在当年是大卖的,然后到了 2020 年 虚拟货币的这个价格又大涨了一波的时候,他又在当年推出了一个专业的挖矿款,都是一年里边就或者几个月里边就马上做到的事情。

嗯。

就是某种程度上说你他是一个广撒网的公司,但是他这个一直在撒网的过程中,还一直在织新的网,这个事情还是很厉害的,对。

这个解网的速度是真的快哈,嗯,当然啊,就是我们讲到的这些摸索,或者说这些小的这个呃,浪头的话,肯定都没有人工智能这个大的浪潮来得大,而英伟达在这个市场的地位呢,恰恰是最稳固的,就是我们刚才已经讲了很多了,就凭借 GPU 的它在 GPU 上面的一个超绝的一个性能,再加上它一个酷大的这样一个生态,那英伟达的这个专门服务于人工智能的这些 AI 的芯片啊,呃,就成为了这个大模型训练的一个基础的设施,或者说整个这个这个这个是所谓的算力,其实就是指它这些英英伟达这些芯片,那它在全球服务器行业里边, GPU 的这个市场份额呢,就已经超过了 90%, 几乎就是垄断了。

嗯。

而且好像现在已经把产品也做得很丰富了是吧?

对,它不单单是 GPU 了,它其实会有 CPU 啊,或包括 DPU 啊,就一整套的这个服务器的这样一个产品的组合。

而这些专门为 AI 来布局这些产品呢,其实也是在很短的时间里边,我们看到主要都是在 20 年 之后英伟达开始推出的,就具体 Jeff 可以介绍一下。

英伟达其实它一直以来会按照 GPU 的性能号分为低中高三条产品线,消费级的叫 Geforce, 一般来说什么 4090 啊,都有这条产品线的。

嗯,工作站叫 Quadra, 服务器叫 Tesla, 这是一个横轴哈,在纵轴上呢?

英伟答疑会根据芯片的架构做一个代记的划分,比如说 20200 5 月 推出的呃 apriy 架构, 2022 年 3 月 推出的 Hopper 架构,就我们常听到的那个 A100 H 100,这个 a 和 h 就指的这两个架构,都是英伟达 AI 服务器条线的一些产品。

然后呢,英伟达是保持每两年更新一次架构的频率,所以说很清楚哈,它下一代的 GPU 的架构会在 2024 年 发布。

聊到这里,我又有一个疑问了啊,就是既然软件和开发者生态这么重要,就别的 GPU 厂商没有想到吗?

没有去模仿吗?

我一直就有一个疑问,这个世界上只有英伟达一家做 GPU 吗?

哈哈哈。

对别人别家都会有任何存在感吗?

好像当然有了。

AMD 在 2016 年 也推出了一个类似 CUDA 的架构,叫做 ROCM, 但是它没有做起来,最主要原因就是它太晚了,比 CUDA 整整晚了十年。

十年是什么概念呢?

举个例子哈,就是你一个大学人工智能专业的学生,你读的教材是基于酷大编写的,你的老师也只懂得酷大的操作方法,你觉得 AMD 的 GPU 同价位更便宜,于是你买了块 AMD 的 GPU 做实验,绝大部分情况下它都跑得很顺畅。

而 OCM 界面虽然没有酷大友好,但你愿意花时间折腾,好不容易编好成了,但在模拟训练某个程序时,效果总是不如论文里的要求。

这时候你可能是觉得这个 ROCM 的参某个参数没有优化好?

你去社区找人请教,结果没有一个人遇到类似的问题,你的老师和同学也不用他,你只能自己一点点摸索这个呢,还是只是在学校的问题哈?

如果说他的 ROCM 顶多让你的论文写得慢一点,但当你工作之后, AMD 的 GPU 的某个小问题就可能导致你的模型训练速度不如竞争对手,但你已经没有那么多精力去折腾软件了,在 GitHub 上贡献酷大软件包仓库的开发者超过 32000 位,而 OCM 只有不到 600 个。

如果有一天你当了研发总监,哈,老板觉得 AMD 的 GPU 更便宜,想要征求你的意见,看是不是换一下。

对你来说,省下的钱都是老板的,但模型开发的慢都是你的责任啊,况且大学生只会用哭的 AMD 的 ROCM 用都没用过,培训还得花不少时间,作为你该如何选择呢?

所以总体听下来就是一个巨大的先发优势的问题,找了 10 年还是有点好处。

对对对,然后 Jeff 其实是非常清晰地给我们描述了什么叫做一个研发的生态。

嗯,那我还是有一个疑问啊,那是为什么这个 AMD 这个竞争对手要花这么长时间才意识到我也该做这些事情呢?

那英特尔这个巨头又为什么就说没有去参与这场竞争呢,就放任这个市场被英伟德拿下了呢?

嗯?

其实过去哈, CPU 才是电脑的核心,电脑呢,可以没有 GPU, 但是不能没有 CPU。

2000 年 的时候,英特尔年收入是 337 亿美元,而当时英伟达年收入大概只有六七亿美元的样子。

英特尔和 MD 在 CPU 市场上打架,双方都忽视了英伟达当时 GPU 上业务排名第二的 API, 后来在 2006 年 的时候被 MD 收购。

MD 收购 API 的目的呢,也不是为了做一个独立的 CPU, 而是想把 GPU 集成到 CPU 里边去,更好的卖 CPU。

直到最近十年, GPU 通过深度学习大放光彩之后,英特尔和 MD 才回过神来。

但是这个时候英伟达已经建立了一个非常牢固的酷带生态了。

嗯,理解了。

呃,另外我觉得还有一个要说明的就是英伟达这个扩大的生态,之所以我们刚才一直说它牢固稳固,其实还有一个底层的一个基础,就是它的 GPU 的性能确实够优越,如果哪一天他的芯片实在是比 AMD 比如说差得太多了,那即便是酷大很好用,但是客户有可能还是会转投别家对吧?

因为在芯片行业里边,这个性能的优势永远是最核心的, OK, 呃,到这里的话,我们其实把就是英伟达如何从一个小小的游戏芯片的公司变成一个 AI 时代的基础设施这样一个转变的过程的三个大致的阶段我们都介绍了一下,现在我们就回归到这个当下的这个现实当中来看看一些财务的数据啊啊!

就是回到我们节目开头讲的,英伟达最近不是有一波股价大涨嘛,最直接引爆点就是他发的最新一季度的财报,但是其实我们看这个财报也是 2023 年 2 月 1 日 到 4 月 30 日 的业绩,其实跟之前相比也不算很亮眼嘛。

嗯,首先看一下营收这层面啊,就是目前英伟达营收可以按照它的应用领域分成四个部分,最大的一块就是数据中心,也是我们今天前面讲的重点了,第二部分是游戏,是英伟达的老本行,第三部分是专业可视化,第四部分是汽车啊,还有一个叫其他的部分啊,那这个里面最大头的数据中心虽然是营收增长了 14%, 但是游戏和专业可视化加在一起也占了 1/3, 而这个加在一起的这个 1/3 呢,相比去年同期其实跌了 1/3, 就反正是比去年是有下降的,所以实际上这个季度的英伟达,它的营收是下降的。

当然需要说明的就是这个游戏部分的下滑,呃,主要就是因为我们前面讲到的,这个游戏显卡的一大需求,就是这个虚拟货币的挖矿大幅地下降了。

当然,游戏行业本身也不太景气啊,所以这两个叠加在一起,这游戏业务其实是下滑了蛮多的。

嗯,是的。

那利润方面,和去年同期相比,英伟达的毛利率是基本持平的,利率有一点下降,是在 64% 左右啊,我觉得还是一个挺高数字的。

当然,由于去年同期英伟达是宣布准备收购一家上游的芯片涉及架构公司,叫 arm, 所以说在财报里面有 13.5 亿美元的收购费用是被列出来的。

呃,现在呢,这个收购已经取消了,所以它的总体的净利润是提升了。

仅仅从经营层面方面来看,我觉得这份财报算不上很亮眼。

而且另一个需要关注的点就是,这份财报也没有体现出我们前面讲了那么大堆,这个英伟达在 AI 时代,这个基础设施的这种强势的地位啊。

因为英伟达之所以现在这么受追捧,最核心的一点就是我们刚才讲的,它不可被替代,不管是软件还是硬件嘛,那么它就应该在上下游有比较强大的溢价的能力,就是这个 GPU, 这个产品本身啊,体现在财务数据上面呢,一些比较简单的指针,呃,就是它的应收账款的周转天数,应付账款的这个周转天数,还有存货的周转天数,用白话说啊,就是说他付给上游的这个制造商的钱应该可以拖得久一些,对不对?

然后他这个下游客户付给他的这个付款应该更快一些,而他自己手里的这个存货呢,应该更抢手一点,周转得更快一些,这样才能体现出我这个东西很抢手,很不可替代,很重要吧,对不对?

嗯,但是根据 Jeff 还有我们的同事拉的这一个表格,我们就发现,首先从长期来看,最近十年啊,英伟达的这几个指标总体是在恶化的。

就比如它的应收账款的这个周转天数,从 2014 年 的 38 天已经增长到了 2022 年 的 48 天,最近的这一个季度甚至是达到了 57 天。

听上去我们好像前面都变成了尬吹英伟达啊,虽然一个季度数字说明不了什么,但是这个整个趋势已经不是那么好了。

所以英伟达到底发生了什么?

一方面,这个首先要说明的就是过去一年芯片行业整体的需求都不太景气嘛,这个芯片本身就是一个周期性的一个行业,经常会有就是这个需求很旺盛,然后又下来这样一个过程,再叠加上我们前面讲的游戏啊,挖矿这些的,所以它这个整个经营的健康度在上一个季度于就是恶化得比较明显,也是比较正常的。

此外,还有一些长期的结构性的挑战啊,我们先放一下,后面还会再说的。

我们先解决最初的那个疑问,就是为什么这个财报不是那么漂亮,但是因为聊的股价还是大涨,对不对?

就是其实也很好理解,或者很简单,就是他在发布的财报同时啊,还发布了下一季度的业绩指引,然后这份指引里边下个季度的营收将超过 110 亿美元,比这个季度要多了近 40 亿美元。

合着不是因为这个季度财报涨,是因为下个季度肯定会涨,所以才涨的是吗?

对,而且这个涨幅你想想看是超过 50% 的,非常厉害。

而且需要说明的就是啊,这个指引的可信度呢,因为非常的高,因为此前大家已经听到了,就是各个这个财经背景都呃,已经发了很多消息了,就是在 chat PPT 火了之后,各个大公司,比如说哪家花了这么 10 亿的订单给英伟达去买那个什么呃 A100 的 H100 的芯片,哪家又问他采购了一个大的这个服务中心啊等等的。

然后这一些新闻和英伟达的这个业绩指引啊,它互相是对得上的,所以说华尔街觉得肯定是真的,然后我马上大喜过望,对吧,就都去买英伟达的股票了。

嗯,那相当于有这么一个利好消息的话,是不是它的什么应收账款或者存货周期也会有改善?

Jeff, 你有没有什么想法?

没错,就是据我们估计哈,接下来的一两个季度,英伟达的应收账款和存货周期应该都会得到一个缩短的改善。

营收占款方面呢,因为服务器级别的 GPU 卖的实在是太好了,现在大科技公司都是提前去付款,去锁单的,包括中国的字节跳动啊,包括美国的微软啊,都是这样的。

存货方面呢,之前消费级 GPU 积压的库存也被消耗差不多了。

那我们可以到时候看看这个就是 GIF 的判断怎么样啊?

就如果提前锁到的话,它其实就是应收账款的周转天数就是 0 对吧,在这个产品上面对不对?

对的。

当然还是再说一遍,这个不构成任何投资建议啊。

那解释完了这一次的这个财报,以及与其相关的这个股价大涨之后呢,我们还是来看一些就是今后的比较长期的一些问题,尤其是英伟达,接下来还是会面临一些挑战。

嗯,就是我们前面讲了那么多,它这个稳固的这样一个不可撼动的这个中心地位,其实也并不是那么一定永续的。

嗯。

首先一个就是所谓性能上优势能不能继续保持嘛,我们之前也提过,不管是它的生态也好, AI 的风口也好,因为呢,现在的这个护城河,它的基础还是它的自己的这个产品性能是始终是领先的,但是领先呢,不是说所谓一成不变的领先,那在芯片领域永远是不进则退,英特尔其实是一个最好的例子, GPU 虽然还有很多的潜力可以挖掘啊,但是相比于早期黄仁勋定下来那个 6 个月性能翻一倍这个事情,那他现在这个皇室定律已经又修正过了,变成了一年翻一倍。

呃,英伟达要做的呢,首先就是要保证这个领域始终只有自己能够跑在前面,所以他今后对于研发投入应该还不是会少的。

嗯,第二个呢,就是来自产业链的这个挑战,这个其实就是我们刚才埋了一个伏笔的,就是这个溢价能力的这个长期的结构性的问题啊。

英伟达之所以在目前还没有在这个溢价能力上体现出与之地位匹配的这个能力,一个原因就是因为它的上下游啊,也很强势。

嗯,它的这个芯片的制造商的同盟,就是我们前面提到台积电,同样也是一个无可取代的一个呃,基础设施一般的这家公司。

虽然三星其实也能够代工英伟达的部分产品啊,但是随着近几年来台积电在这个生产工艺上面的这个领先英伟达的高端的产品线,目前只能够交付给台积电来生产。

而在下游呢,其实我们节目开头提到过一个点,就是那些市值万亿以上的硅谷巨头,都是因为达到大客户,这点当然很厉害啊,但是反过来看的话也是有风险的,因为如果说有谁既有实力又有意愿去打破英伟达在 AI 芯片方面的垄断的话,那就是他这些大客户,这些硅谷的巨头了。

而且事实上啊,像 Google 啊,亚马逊都已经或者正在设计自己的这个专用的 AI 芯片,虽然他们的技术路线和通用的这个 GPU 不太一样,会更定制的这样一个路线,但是在可预见的未来,对于这些公司自己本身来说,因为我家的芯片肯定不会是他们唯一的一个选项,那这个其实也是比较符合市场的规律的嘛。

嗯,那其实第三个挑战就是地缘政治,因为美国正在不断限制对于中国的芯片出口,其中就包括目前英伟达的拳头产品 A100 和 H100 的这两个 AI 芯片。

虽然英伟达用一个降低了部分性能的版本绕开了这个出口限制,可以短时间内继续向中国客户供货,但是我们可以看到,现在趋势下,这个风险还是越来越大的。

对的,我们最近也看到这个,华尔街日报又爆料了哈,说美国正在考虑进一步加强对 AI 芯片出口的限制,之前就是降低性能的版本,就是供给中国公司的 A800 和 H800 芯片也有可能会被限制。

但是我们判断哈这个新闻本身可能更像是中美双方谈判时一些 barking 的方法,是否真的实施哈,并不一定。

当然,英伟达 CFO 最近也警告了说,如果再继续限制下去,将令美国芯片行业永久失去竞争力和领导世界最大市场的机会,并影响我们未来的商机和业绩。

就我们为什么一直在强调,就是说中国市场在这个里面的重要性,因为根据中国信息通信研究院是我们自己的一个机构的统计,截至 2021 年, 中国的计算设备算力是占全球的 1/3, 人工智能算力是占全球的 45%。

英伟达这个 CFO 还说,目前中国市场占据英伟达数据中心业务有 20% 到 25% 的一个份额,这其实是很大的一个比例的。

当然啊,随着 AI 的爆发,这个比例可能还会有一些变化,但是中国客户对英伟达肯定是很重要的,这点不用怀疑,不明朗的情况呢,始终是一个风险。

没错,如果各国真的都把 AI 的算力当作是新时代的石油的话,那这个行业就不是英伟达自己能够完全把握的了,毕竟能源和政治紧密相关,芯片也是。

商业就是这样。

感谢收听,这一期的商业就是这样,你可以在各大播客平台收听我们的节目,如果喜欢我们可以在苹果播客内点击关注,也可以在小宇宙平台给我们打赏,就会对我们很有帮助,期待你在各个平台与我们交流,下期见!