Hello 大家好,欢迎收听硅谷 101,我是洪君 Hello everyone, good morning, welcome to Google I/O 每年 5 月份谷歌都会在山景城的总部举办 Google I/O 这是一个面向开发者的活动每年谷歌都会在这个活动上集中发布一批的新产品疫情之后基本上每年我都会去 Google I/O 我们来回顾一下前两年的情况
2023 年谷歌正式向 ChatGPT 发起挑战当时谷歌它也是发布了一款聊天机器人叫做 Bird 它问詹姆斯韦伯太空望远镜的新发现结果 AI 在回答中出现错误导致谷歌的市值一夜蒸发超过千亿美元
2024 年就在谷歌开会的前一天 OpenAI 上线的 4O 模型效果震惊世界甚至很多外媒犀利点评说这是 OpenAI 故意在狙击谷歌我们说度过了失忆的两年回到今年谷歌可以说破釜沉舟打了一场漂亮的翻身之战在这次开会的时候模型端 Gemini 2.5 模型全面霸榜
这一集我们就来深度揭秘一下谷歌大模型 Gemini 背后的灵魂人物以及谷歌推出的 AI Mode 到底能否应对大模型对搜索的冲击华尔街又会如何看待谷歌在美股七巨头中的位置
最后这期节目不可避免地出现了一些中英混杂因为嘉宾呢都是长期在英文的语境中工作如果大家有听不懂的部分我们会在 B 站和 YouTube 的视频平台上配上字幕来尽可能地帮助大家理解下面就请收听今天的节目
那今天跟我在一起的嘉宾是 Cambio ML 的联合创始人 Kimi KongHello Kimi 你好你好你之前也是在 DeepMind 然后要不要跟听众简单介绍一下你自己 OK
首先非常感谢今天的邀请让我可以来到硅谷 101 这个播客然后我也是硅谷 101 的一个重视的听众我现在是 Cambio ML 的联合创始人兼 CTOCambio ML 是一家 YCS23 的创业公司主要的产品是 AI Agent, Energent 到 AI 我们的 AI Agent 是一个 AI Agent 的 Boss 可以帮你思考和行动
在创立 Cambio ML 之前我是在 Google DeepMind 待了将近两年的时间主要负责几个不同的模块一方面是通过强化学习帮 Google 来增加它的广告收入我主要立的两个项目一个是整个大圆模型的评测
我们帮 Google 做了刚开始的第一个用 AI Agent 来帮 Googleoptimize 它的 targeting ads 的 search result 的一个项目在我完成这两个项目之后我就离开了 Google 来做这家公司去到 Google 之前我在 Amazon Web Service 待了四年主要 Lead 了几个不同的 Amazon 的 Micro Service 那在去到 Amazon 之前我是 Stanford 的 Double Master 我有 Bose 机械和这个计算机两个学位嗯好
大家好,跟我们在一起的嘉宾还有一位是 Sean Wei,他是 HeyReview 的创始人,之前在谷歌语音助手。Hello Sean!Hello 大家好,我是 Sean Wei,我们主要是一家 AI Contact Center 的公司,主要深耕在美国的医疗行业的这些 call center,主要是针对比如说我的患者和医生之间的这些沟通,可以完全地用语音自动化。嗯,谢谢!
今年你有没有看 Google I.O.的直播在这样的一场发布中让你印象最深刻的一点是什么我觉得 Google I.O.对我印象最深刻的是 Google 对于整个模型和它整个产品的横向广度和纵向深度的一个整合
那对于广度而言它 cover 了现在多模态模型所需要的所有的不同的 modality 从它的 Gemini 2.5 Pro 多模态的模型到它的 ImageN 图片生成模型到它的 View 的视频生成模型这个相当于说它给你提供了一个模型学家桶可以让你完成各种不同的 task 那对于纵向而言它不是只是一个云端的一个搜索服务
它同时也可以相当于在可传代的安卓的这个 XR 上面给我们展示了未来 Google 在不同纵向的深度里面的它的野心所以对我而言这是让我觉得 Google 对于它未来的一个全面布局的一个状态是 是那 Shang 呢对我印象最深刻的其实是它的 Text-to-Video 这个事情
因为大家在这个方向上面尝试了很多就无论你之前的那个 open ad store 啊还是之前 text to image 啊 text to audio 啊各种各样的尝试其实大家都想达到目标就是我能不能用一个把我大脑里面想象的东西变成一个电影的画面出来我觉得终于是在 Google 这个发布会上面我看到了真正意义上的可以从一个 idea 变成一个视频的发布
然后另一个的话因为我之前做了很久的 Google Assistant 大家一直都很想有一个真正意义上的 AI 陪伴着你就是你有任何的问题无论你是视频的文字多模态的各种方式这个 AI 都能够帮助你以前没有实现 Google Assistant 的时候没有实现但是现在 Gemini 终于实现了它十年前的这个愿景这个是让我印象非常深刻
对你正好提到了这个 Text to Video 你是指的它的 View 3 的模型的发布对不对是的是它的 View 3 对我看它这次发布它不仅仅有视频的画面它还有声音从整个多模态的角度来讲加入声音它会是一个门槛比较高的事情吗就是你觉得它的这个发布跟当时 Sora 的那几次文圣视频的模型的发布有什么区别呢
我能感觉到它就是从文字变成了一个 movie 它真是一整个变成了一个 movieSora 当时他们发布的其实也只是一个视频的画面你看它当时 Sora 变成一个视频的时候还有跟比如说 11 Labs 或者一些合作对吧去在后期加入这些声音但是它在这个多么它理解的时候比如说看到它很多视频里边它的语音背景音效还有嘴型都能对得上
我觉得这个难度其实就非常难了它对于你的整个模型对于上下文的理解对于可能整个物理世界的这个模式大家还记得张诚那个威尔史密斯吃面条对吧这才其实两年的时间就从威尔史密斯吃面条变成一个可以做出 action movie 的这么一个状态了对对对所以其实加入音效还是挺关键的一个点
没错 是的对 我自己也对今年的 Google I.O.印象很深因为我觉得今年他们有一个特别大的优势是他们今年特别骄傲的就是 Gemini 2.5 的这个模型 2.5 Pro 在他们发布的这个时间点你追我赶中这一轮终于是 Google 最领先了去年这个点的时候其实是 Google 在发布以前被 OpenAI 给狙击了他们把应该是 4.0 的模型给推出来
所以当时可以说去年发布会就被 OpenAI 抢了风头今年模型最强应用推广又很开多模态也有新的进展包括今年我觉得还有一个特别大的让我印象深刻的就是 Google 把整个的搜索就是他们整个商业模式的基石搜索的入口给改了改成了 AI mode
大家有关注 Google 新推出的 AI Mode 吗简单理解我觉得它可能是把这个搜索的入口跟大模型相结合了相当于在传统的搜索框里面你进去以后它左边的有一个 Tag 栏它是加入了一个 AI Mode 的标签然后你在问它一个问题的时候大模型可以给你很精准地回答
甚至你还可以追问他们其实后面还有一个 demo 可能也是跟 agent 相关的就是你想买一个衣服它可以给你完成闭环到一键下单当然这个 demo 我们可以之后详细地讨论首先我们来聊一聊整个 Google 搜索上的一个变化大家会如何看谷歌在搜索框加入 AI mode 你们觉得它会怎么样去影响谷歌的生态跟商业模式
我先说一下这个 AMO 的我之前特别巧合的是它在发布会之前其实我就尝试了一下这个 AMO 的我当时还拿这个 AMO 的和 Poplexity 还有 OpenAI 的 Search 都稍微对比了一下我觉得从效果来讲的话这个 AMO 的和之前那种搜索就已经其实是很大幅度的提升了这个 Context Understanding 的能力基本上能对于你的上下文的理解和搜索相关的信息
它已经可以做得非常强大了但是我觉得站在 Google 的搜索效果的角度来说其实那一次我的测试的里面是 OpenAI 的 search 其实是比 Google AI mode 的当时的效果是要好的我不知道这一次发布的时候是有没有更好一点当然你刚刚说到的是 Google 的 AI mode 其实它是在革自己的命我觉得这个是真的因为 Google search 的话它的广告收入是一个最稳定的收入它其实从 AI mode 的角度来说就把传统的广告模式它的营收模式完全就改变了
当然 P 查也说了它是这 10 年里边对于搜索最大规模的一个变化我相信它从它的 UI 的前端就是用户进入搜索的这个界面上面到最后提供结果的这个方案它都应该是在户口的内部里面做了一个非常大的提升
你提到你之前灰度测试了一下它的 AI mode 你可以讲一下你当时测试了什么样的场景然后为什么你会觉得 OpenAI 的那个 search 功能会比谷歌要更好吗我当时想搜索一架正在天空中飞的飞机它当时的具体的落地信息因为它晚点了那它就不是一个传统的就是我可以查一个正常的飞行时间表因为我不太确定那个航班的航班号我只知道它大概的方向从 A 点到 B 点
我只是搜了这么一个信息我让 OpenAI Google AI Mode 和 Populexi 同时搜索的信息它的 problem 当时就是我大概知道有一架飞机从 A 点飞到 B 点然后它大概是几点钟出发的你能告诉我一下它这个航班的详尽的信息它大概在哪在空中的哪个地方有没有准点出发它会不会晚点这样的一个信息到最后其实 AI Mode 和 Populexi 都输给了 OpenAI 我非常好奇我追问一下是因为搜不出来这个结果还是搜的结果不准
他都没有搜索出来这个结果其实他就是要告诉我当下在天空中飞的一个航班号能不能给我结果只有 OpenAI 给了我正确的结果有意思 Kimi 怎么看 AI 搜索
我觉得首先搜索有可能真的是全世界最赚钱的一个 business 而且是所有人都垂涎若滴的一个 business 我觉得很久以前 Satya Nadella 说她最后悔的是当年 Microsoft 没有把 search 一件事情做成因为 search is so profitableit is so profitable 说回谁有能力做成这个事情本身吧我觉得有可能 Google 是所有这些 tech 公司里面最可以把 AI 搜索做得最好的
但是就像上个刚说是他有多愿意去革自己的命那我觉得对于 Innovation 的 Dilemma 我只能说 Google 半革了自己的命因为讲完了现在 Google 的 AI 还是有两个产品我永远不相信 Google 的 Innovation 的能力我也不担心 Google 没有它的 Talent 我觉得 Google 有可能真的是所有公司里面的 Talent Mass 是最大的一家公司
为什么说半革命的这个状态那讲白了 Fundamentally 还是有两个产品一个叫 AIMode in Google.com 还有一个是它的 Gemini.google.com 对吧那是 Fundamentally Gemini DeepMind 或者 AI Lab and Searchare two different business unit in Google 但是相当于说怎么能把这个公司的流量入口给你整合到让用户更加 native 的是一个 AI 的 Search 而不是说一家公司推出两个产品
我觉得这是相当于不是一个能力的问题这是个 Google 的意愿的问题是它有多愿意深度革自己的命那革了之后怎么相当于说用 AI search 来产生新的 business revenue 就原来有可能这些 targeting ads 只是给你在 search 上显示最 top three 是 ads recommendation 的这种模式怎么可以更加的有效的嵌入这种 AI 模型的结构里面我觉得这是 Google 得去思考的一个问题但我觉得 Google 反弹版头是有能力做这个事更多是个意愿的问题那我们说到第二点它为什么有能力做这个事
如果一个大模型想把一个 task 做好那这个模型是一方面它的能力然后除了模型以外 user 的 instruction 是另一方面能力那我完全不担心谷歌模型对于用户的 instruction 理解的能力那除了这个以外更重要的一个东西是这个工具的调用那毫无疑问 Google 它每年有超过 90%的 search 的入口的流量导致它的 search 一定是在 target search 里面做的是最好的一个
那基于这个模型和它有世界上最好的工具 Search Engine 这件事情本身我觉得我完全不担心 Google 可以把 AI Search 做到一个天花板的能力但有可能像上述的因为这个 AI Search is so newGoogle actually run a lot of dog food problems internallyThere are a lot of even you knowinternal searchGoogle havewhich one is the best search they actually should use for the model 我觉得这是一个 Google 整合的能力那就说看 Google 一方面它有多少意愿来整合第二它整合的时候不要像在之前整合的时候出现这种翻车的情况就可以哈哈哈
你提到的这个工具的调用是指哪些工具就是你应该 browse 哪些网站然后你应该 search 什么样的网站 fundamentally 原来 search 是直接把结果给你了对吧然后现在相当于说大圆模型得通过 Google search 这个工具把东西整合成了一个更好的你想要的结果给你那我觉得我短期可以非常理解为什么 OpenAI 可以把这件事情做到更好有可能 OpenAI 相当于做 search 就是 AI search 会比 Google 领先了一段时间 Busy 产品 wise
之前 GPT 的模型对于 function call 对于工具的调用有可能在 2.5 之前也有可能 may be ahead of GoogleSo far now Google has the best modelGoogle has the best toolwhich is a search engine 我觉得是一个 Google 可以开始打它的翻盘局了对它而言应该是个顺风局了只是看 Google 愿不愿意把它的产品做一个更深度的整合我希望看到的是一个 unified 的产品就是 check GPT searchit's just check GPTit's a unified entry point 就是他们的入口的流量对吧 Google 现在流量是分散的
那对于一个用户而言其实还是让人非常 confusing 的一个事情本身我觉得是 Google 要做的一个 strategic decision for their product 嗯
对 我觉得接下来我们可以把 Google 的 AI mode 跟它搜索的具体的展开放在一个场景里面就比如说我现在脑子里面第一个出现的场景就是当时 Google 在 IO 上的一段演示比如说一个女性要买一件衣服她对这个衣服有一个大概的描述描述完之后呢谷歌就开始搜索然后搜到了一堆这样的衣服的网站接下来她可以去比价看哪个网站在打折然后给你一个最低价格
中间还有一个环节就是他会把自己的照片也传上去说我虚拟试一下这个衣服看一下这个衣服是一个什么样的效果我当时印象很深刻的是她是一个微胖的女生而模特是一个非常瘦的模特最后她现场出来的效果那个衣服穿在她身上依然是一个微胖的女生穿起来的效果所以当时现场是有一阵欢呼的之后呢她决定 OK 那这个衣服我看到了我穿的效果还不错下单
Google 是一键闭环直接把这个单给下了我看它的支付系统用的是一个 Google Pay 的一个页面也是一个 Google 钱包整体上来说看起来以前我要搜索一件衣服然后要去各个网站上比价最终每一个网站注册输入用户名密码然后再选持码再下单是一个非常漫长的流程而现在我通过 Google 搜索的这个 iMode 我一键就可以下单了
你们觉得这样一个场景对谷歌来说 work 吗?我知道很多人,就比如说做 agent 的人,大家考虑的第一个问题是,那我是不是要把我所有这些电商网站的密码都输入给谷歌,它都得有,我才能完成这样一个下单。
我当时觉得那个也是很惊喜的一个场景我相信大家都会去搜索很多衣服或者购物其实对于男生的话衣服可能倒还好但有可能会比如说买一些硬件 GPU 或者买个显卡就是买其他东西对吧也是会去跟踪一个东西的价格我觉得它这一次的改变有几个东西可能会让我印象很深刻第一个是因为你传统的广告比如说有可能你看到有 impression ads
对吧你看到一次我算你收银的费有可能一种 click through ad 对吧就是你进去了之后才会收你的费所以对于新的这种模式说我要去买一个东西对吧那它上面的 impression ads 可能还是有的 click through ads 可能也还是有的那它再往里边这个 conversion 的时候 Google 怎么去从里面收这个钱
我觉得这个会很有意思我相信他在 run 这些 AI mode 和搜索的时候他是非常耗钱的因为他的搜索是免费的对吧可能大家没有意识到就是你每次搜索的时候谷歌都是要付钱的因为他有积极的 cost 对吧但你现在 AI mode 要跑起来给所有人都开放起来的话那也就是说他的成本会非常高因为他的这个 computer 就不是你搜索一个 curry 就结束了他是要过 GPU 的他要过 understanding 的
这个成本我觉得对于 Google 来说非常的高那它会不会一样冒出在羊身上到最后一定的方式把这个钱从你身上出不知道第二个就是你在搜索这些问题的时候它的模式也就改变了传统来说基本上都是文字描述
加一些 image 搜索差不多了但它这个的话其实还会带一些更 personal 的 image 搜索你的 preference 搜索也会在这里边我觉得 search quality 也会往上提升再往下面第三个的话就是你的所谓的 result density 以前的这些 result 是给你显示一个完整的网页那么多的链接你慢慢一个点吧
或者说有可能我给上面一个 panel 但现在你整个的 result density 就是我就告诉你一个结果你就在我这里同一个页面里面你不会离开到其他页面了那对于你这个 SEO 怎么做这也是会非常大影响因为 SEO 也是非常大一个 business 比如说卖衣服的我怎么能保证我在 Google 的这个 search result 里面这是个非常大的问题最后的话就是你刚才说的我一旦感兴趣一个东西的时候我怎么去 keep track 我怎么保证它的 price 是稳定的到我一个理想价值能够做这个 price
我觉得这一点 Google 其实当时一直做 shopping 做的不是很成功一直落后于 Amazon 我相信他这个是他的一个更新的方案我如何把这个 shopping 的闭款就直接在 Google search 里面做完了嗯对 Kimmy 怎么想 I see I see
我觉得 Google 在实现它一个最大的野心是想做成一个 AI system 那对于这个 AI system 而言 shopping 其实是一个非常 challenged 的一件事情本身吧我觉得很久以前 Anthropic 有一个非常意思的 topic 就是说如果这个事情对于人而言就非常 challenged 的话那对于模型而言其实也是会非常 challenged 这件事情 think about the model as a human 对吧对我而言有什么非常高价值但又非常 challenged 的事情本身比如说 I book a travel to a placeI have to book a hotelI have to book an airplane ticket
那对于这个 shopping,you know,I have to go to a lot of websites,I have to compare the price,那有可能就是说我去不同的网站比价的时候,可能我不是说我 login 我自己的这个密码,有可能更多时候是,oh,what are the websites I can use,right?Oh,I can go to Amazon,I can go to,you know,maybe H&M,I can go to all different places to actually compare the price,他就说怎么能 go through a lot of different channels,aggregating all the results,comparing,give you the final results,
它对于这种长逻辑链就是需要一个多步骤的一个过程我觉得已经可以完成得非常好了我觉得在不久的将来 Google 其实可以在除了购物以外非常长逻辑链条的一些 task 上也可以做到同样的效果所以我觉得我们有可能只看到了冰山一角它只是完成了一个长逻辑链的事情就是 shopping 一次长逻辑链有可能会有更多更多长逻辑链的事情非常快的将来 AI mode 都可以帮你做
我整体上理解其实谷歌做这件事情就是买衣服到下单到完成它其实是一个 agent 对吧是的刚刚大家其实对我说到一些核心的点就比如说以前一个搜索号的服务器成本它可能相比于现在整个你要完成这样一个购物的闭环它消耗的 token 跟服务器成本是小很多的小很多
现在这个成本就突然一下高了很多然后我们知道谷歌的商业模式其实是依赖于就是你搜索一个东西它有竞价排名然后商家要去做 SEO 它是通过这个赚钱的那它改成这样一个模式以后它的商业模式会怎么样改变呢它靠什么赚钱呢
我觉得商业模式的话 Google 已经给了一个方案对吧你如果看到它的 Google I/O 的时候你会发现各种订阅服务对吧有便宜的版本有 Ultra 服务就是它有各个 Tier 都会从你都使用 AI 的方式比如更多的智能更 Personalize 对吧那我都需要你去订阅和付费
就像我说的羊毛出到羊身上另外一个的方法的话就是我相信它的广告也会跟着新一代的这些 AI 进行改变如果你用过 OpenAI Search 的时候或者说你如果做过一些开源项目的时候就会发现其实 OpenAI 本身它是会给你导很多流量进去的就有专门从大圆模型导出去的流量
所以我相信服务内部也在思考因为我现在更定制化到你个人 response 了那我从这个周接推出去的这些流量的话我是不是也要收更多的服务费用是对商家收费吗对对商家收费依然可以收费对啊用户是订阅服务对吧对商家也是一样会收费 OK 你不做广告但是你如果在我的 AI 里面你要排名的话那我还是会要求你有一定的收费
但我觉得 AI 很难啊,因为以前搜索可以提供给大家 10 页、100 页、1000 页的结果,你只要保证在第一页或者人在第一页的前三个都可以。AI 它其实是要推给用户一个固定的结果,它的优势就是不让用户选择。
对啊如果说你知道一些传统广告的话就比如说保险类的广告 travel 类的广告它的每一个 click through 或者 booking conversion 的 charge 是非常高的有可能每一单都是大概几十美元的这种价格
我相信如果是到最后只会推一到两个的话那它会收商家可能收的费用也会更高因为它基本上你完成这个购买服务的可能性就非常高了嗯 理解而且以后它的排名可能直接是在大模型里对 是的嗯
Kimi 认同吗我完全认同我觉得这个成本永远就是 cash in cash out 对吧那相当于说开源间有两个不同的方式先从开源的方式来说 Google 怎么都更加增长它的收入的方式有可能我们不太像传统意义只是相当于一种竞价给你做一个 ranking 一个 list 的方式来给你展示广告不同的价格因为它现在是个多模态而且它知道你所有的记录的上下文它可以给你做的广告的其实 targeting ads 的质量可以比原来变得更好那
那他有可能原来不用给你推十个他还是会给你推比如说三个因为作为人的乐趣是你将来是做一个选择对吧现在 AI 产品给人体觉得情绪价值在于让你做一个 human loop 的过程如果真的把人完全抹去了其实你也不希望 totally go autopilot 去做一件事情本身那有可能他原来是说给你 100 个 list 的这个 ad 现在就给你三个然后在语言模型里面说只有三个 optionyou go and selected 那可以差点每个三个的单价做得更高
我觉得这是相当于说一部分从广告商的角度来说这个问题其实 Google 现在本身就算 Search 而言也是壮士了一个巨大的一个 Search 集群但是有可能是个 CPU 的 Search 集群对吧那有可能在 Google 刚开始的时候这也是特别大的一个成本但是传统意义上的这个 Search 比如说 CPU 的成本在过去的 20 年里面有可能已经降了 1000 倍 1 万倍 1 亿倍有可能都下降这个 Don't call me on the numberI don't know exactly what it is
就算这个拆 GBT 产生两年到现在整个的 GPU 的 inference 的成本已经降掉了 95%了那我觉得在不远的将来这个一定会再按一个指数级别往下降下去那我觉得未来的话如果你可以提供每一个广告的一个成本不但只是广告商来付钱这个用户也要付自己的订阅费同时你也可以把 GPU 的成本或者这个 TPU 的成本尽量再继续往下降下去我觉得有可能 Google 如果做得好的话可以发展出一套更好的商业模式 Worth it
OK,所以你们觉得如果假设 OpenAI 或者 Anthropic 他们也来做这件事情,因为最终我觉得这件事情对搜索的冲击还是很大的,搜索的入口也是大家都想抢占的一个点,你觉得谷歌的优势是什么呢?
我觉得谷歌的最大优势还是它是有海量的数据它其实无论你是在 index 的这些网页到它的 YouTube 视频它的 rich 一定是它的有足够的 content 而且它大部分人都会有什么邮箱其他的信息在谷歌里面所以它对你个人的定制化它是非常的强大的尤其上我自己在用 OpenAI 的时候它现在的主要的提供的粘性是因为它有很多工作上面的 context
其实 Google 有你 personal context 这个信息是其他的生态不具有的
嗯这个很好我想到我现在用 Chrome 的浏览器很多很多我的数据也存在这个浏览器上在这个浏览器上完成一个入口可能在一些购买行为上也是会更便捷的我觉得起点吧一方面是 Search 这个产品本身 Google26 年这家公司它的使命是 Open as a word information 对吧它基本对于这个世界的信息有可能世界上最好的一个 knowledge graph
我们每一个人浏览 Google 的时候留下来我们自己在浏览它比如说五到十年使用 Google 的浏览的记录那它相当于说它把它的世界信息和我们的个人信息整合在一起的话它有着世界上最好的模型它也有世界上最好的 Search Engine 我觉得它的起点其实就已经非常高了
它一定是有这个能力来做出一个最棒的产品只是说看它这个产品怎么样一个形式来 deploy 给用户而已对 我觉得还可以补充一点就是 Google 还有很大的 distribution 它还有它的分发它有它的安卓它有它的 Chrome 它拥有的这个分发系统估计也就只有苹果跟它抗衡所以它占的这个 distribution 是比所有人都强大的
对我最近也是跟很多人聊大家觉得这一轮其实还是巨头的机会就是在大模型竞争的这一轮创业公司可能还真是小而美的机会我们刚刚聊了很久的搜索那接下来我觉得我们可以来聊一下 Gemini 2.5 模型的更新在谷歌这次的公布中就是 Gemini 2.5 Pro 它现在在整个数据评分中是所有大模型中最好的 Kimi 可不可以跟大家分析一下它是如何做到的
OK 我已经离开 DeepMind 有接近快一年的时间了我已经不知道我的同事们在这一年里面又做了什么新的 innovation 但是就是几点吧我的 Fundamental 大元模型训练有这么三个步骤 Pre-training 就是预训练 SFTSupervised Fine Tuning 和到最后的 Alignment RLHF 大概已经是去年的 New York Ips 的时候我们都说 Internet Data 已经被我们 crawl 完了
It's fossil fuel, it's all gone 我觉得大家其实在这一年的时候花了更多的精力在 alignment 上面就是在 RL,especially reinforcement learning with human feedbackreinforcement learning with AI feedback 就比如说数学和代码 task 上因为这些的 task 是有一个 specific 的目标你是可以完全知道这件事是做成还是没有做成的 Google 基于它在前面的 Gemini1 到 1.5 到 2 的一些基点
对于尤其是这种机座模型的训练再加上他开始更多的强调这种强化学习不只是说 human feedback 的强化学习而是 launch trajectory 让 AI 自己来 critic AI 师法这件事情做成比如说像当年做 AlphaGo 的时候 especially 为什么 AlphaGo 可以做成 especially the move 37 rightit's actually beyond it 就是说超过了我们所有人的认知这一步棋能这样下那我觉得未来的 AI especially 当你 reinforcement 的时候你让模型自己去 figure outwhat's the right thing to do 的时候
在这个 2.5 的时候我觉得他们应该是引入了更多这种强化学习的概念和强化学习的使用导致 Gemini 2.5 可以让我们到今天在所有的可以非常 deterministic task 比如说 coding 和 math 中出现了这么惊艳的结果嗯对我记得之前就是去年有一个大模型训练比较集中的趋势就是最开始大家都是预训练
后来在预训链中加入后训练比如说 OpenAI O1 系列他们都加入了推理模型包括像 DeepSeek 的 R1 都是推理模型做得比较好 Anthropic 它其实是有很长一段时间它没有去出自己的推理模型的但是比如说 Sonic 3.5 跟 3.7
它在代码能力上会有一个质的提升这也是带动了一批像编程类的 agent 比如说像 Cursor, Windsurf 它们迅速崛起我好奇的是为什么 Answeropic 它生成的代码质量能比其他家生成的代码质量更好我看这一次 Google 其实也在强调自己生成的代码质量是比较好的代码质量能力的提升主要靠的是什么
我可以就是 quickly 来 just throw 我的几个 opinion 让 Sean free free to chime in 对吧我觉得模型训练永远就是那么几个步骤 pre-training 后面的 SFT 和 alignment especially RHF 那我们先从 pre-training 而言就是 pre-training 的时候你永远都是有个数据配比的对吧就是你要配多少的代码进去你要配多少自然语言进去你要配多少中文进去配多少英文进去
It's just a myth, nobody knows exactly what's the right ratio, nobody knows about it 那我觉得有可能对于 Anthropic 这家公司而言 Coding is their first priority 他们在于预训了的时候就配入了更多的高质量的代码信息进去那这个模型相当于说它的基础能力首先就变得更强但是基础能力强之后它的别的能力肯定会有一定相对应的下降我到后面可以讲一个我的 Find Any Total With Everybody 在它做了基础模型之后它要做很多的 alignment 对吧
那 alignment 的时候更多在大公司里面大家做的也就是一个我们开玩笑叫 yolo run 就比如说今天上在 Google 的一个题目我在 Google 的另一个题目比如说您在 Google 的另一个题目大家每个人都会有自己这个礼拜很多的 innovation 我们会把大家所有人的东西 put together 然后会 run 一个 yolo run 然后 you know two weeks later we see when we actuallycombine everybody's things togetherhow the things looks like 对吧
那讲白了这个相当于说在 align 的时候那每个 team 其实有不同的 priority 有可能这个 team 非常 care about coding 那个 team 非常 care aboutquery writingit's also like a racial problem 那我觉得对于 anthropic 而言 again you know maybecoding is the first priority for them 对吧就大家觉得 ok maybecoding is actually the key to solve reasoning problem 那他们在 boss 这个预训练和到最后的后训练的过程中然后 especially 这个 reinforcement language human feedback 都加入了更多的 coding 的这个训练进去
coding 也是非常容易被量化的一件事情本身那件事情做成了没做成导致了 anthropic 他在 coding 能力表现得非常好但是就因为他的 coding 能力强其实他会在别的能力方面有可能有些缺陷我可以说一个非常 interesting 的 storyI learned recently 就是作为 startup founder 我现在不单单每天会去写代码我也会做很多的 marketing 很多的 sales 我要写类似很多这种的文案对吧那我
我一般就会说我把比如说 Gemini, ChaiGPT, Anthropic, Perpaxi 我都打开我让所有人把一个同一个 plot 都输进去然后让他做一个这个事情本身有可能 OpenAI 的 CreativeWriting 做的就非常好让他写出来的东西让我觉得非常的 vipe 我觉得非常我愿意去发这样一个 marketing 文案出去
主要也是看团队把哪一块放成是重点你觉得 DeepMind 之前的重点在哪里呢
嗯,That's a good question 我觉得其实是非常综合的一个能力之前我们就说 OK,We want code,We want math,We want reasoning,We want creative writing 我们会相当于说有个非常 general evaluation metric 来 go through all different criteria 但是我知道我们之前有一些非常不擅长的东西比如说写代码那因为这个不擅长所以大家 put 了更多的 effort 进这个事情本身所以这一波相当于说可以 catch up 了 anthropic coding 的能力嗯嗯
推理能力呢也是重视程度吗还是说它其实是你在整个后训练的过程中你需要有一些特别的技巧的
我觉得我还在 Google 的时候其实 Google 还没有开始 launch 它的 reasoning 模型就是我离开 Google 的时候其实是 O1 刚开始出来的时候当时的话有可能还是 O1 就 reasoning 有可能还是没有在他们的这个 priority 上面我觉得他们更多时候是 try to catchopen-ended creative writing 比如说是 problem solving 的一些能力 so far 的话我觉得更多时候就是一次数据配比的问题他们会配入了更多的 alignment 不只是说 align 这个 human preference 因为
FundamentallyOpenAI 刚开始出的时候是人 prefer 这个结果所以 Google 干的第一件事我想追上 OpenAI 做出是人 prefer 的这个结果但是人很多时候是非常 limited 的那如果人 prefer 这件事情非常难做什么好做 Coding 有可能好做那 Anthropy 做成这个事情那 Google 说 OK 我现在不单只想 cache human prefer 这件事情本身我也想写出非常牛逼的代码出来对吧那当有非常牛逼的代码出来之后 OpenAI
又做了 reasoning 这个事情说 OK 我想做的模型不只是做出人想要的东西不只是写出牛逼的代码而是它应该有个非常缜密的逻辑让大家知道怎么来解决这个问题当他把这件事情做成之后我觉得 so farGoogle 开始引领这个潮流了对吧就是说我现在有最牛逼的这个东西之后我怎么再去引领潮流让别人承诺的最完整
数学问题是 Grok 做的比较好嘛这是马斯克成立的一家模型公司因为我看他们创始团队的成员是有非常顶尖的数学家的他们也一直在解决世界上很难的数学问题
我觉得我的数学能力有可能没有办法达到这个顶尖数学家的就这个其实是一个 chicken egg problem 非常有意思你需要有人这个能力你才能评测这个模型好或者不好对吧那如果作为一个这个 software engineer 出生我觉得我可以对于这个模型在 coding 能力也有非常直观的评价但是有两方面是这个模型只是能写出可以进 production 的 code 还是说这个模型只是擅长 code 我觉得是两个不一样的事情本身我觉得 Daryl 原来有个非常 interesting 的 talk 是说我希望我的 coding 模型不是说只是去解决 lead code 的 question
因为 lead code question 其实是没有直接的商业价值的他希望的是我的 coding 模型可以写出 high code 的 code 作为上或者我们的 startup 可以直接把这个 code 进入生产我觉得这是 anthropic 非常去 focus on 的一个事情本身说回这个数学 coding 的问题本身我觉得也是分两方面是有多少人需要去解决这种高深的奥数的问题那我可能这个是可以用来 show off 你的模型的 muscle 的一个能力
那除了解决这种高深的奥数的问题之后怎么样可以把数学问题接入 startup 或者接入不同的这种公司里面让它们可以产生直接的一个商业价值我觉得这是有可能更多的商业公司得去思考的一个问题 OK 理解你觉得你在的时候谁是 deep mind 的灵魂人物呢比如说是 Demis 还是我看布林最近也回来了吗他应该准确来说是 2023 年就回来了只是最近才开始高调亮相你觉得谷歌的模型是谁的价值观更多一点
谷歌是谁我觉得 Jemini 之前是 Jeff Dean 和 Aurel 他们俩在 co-lead 的这个模型我觉得之前是这两位谷歌的灵魂人物因为 Jeff Dean 有可能真的是一个 CS 的活化石了大家经常开玩笑说 Jeff Dean 如果你写他的 resume 上不干什么事有可能会给他写他 resume 上干什么事会短很多所以因为 Jeff Dean 干的事情太多所以我们只写 Jeff Dean 没有干什么事情
这样可以在一页上 cover 着 Jeff Dean 的整个的人生的成就那 Jeff Dean 这个就可能是非常擅长完全是 pre-training 因为 pre-training 就是一个对于书籍对于集群大量的调度 Aurel 的话 Aurel 原来是做 AlphaGoAlphaStar 和 AlphaZero 到 MuZero 的灵魂人物就原来 Demand 的一群人物
那他们其实对 reinforcement 有更深的深入所以基于原来 Google 最擅长的 pre-training 的部分加上 Dmine 最擅长的 reinforcement 还有 Lyman 的事情所以让 Google 可以快速地追赶上竞争对手的步伐那同时在对于 character.ai, c.ai 的这个收购又重新迎回了这个 none-sha-zeer 对吧我觉得这有可能对我而言是我最 respect 的一个人因为他对于 NLP 的深耕是非常久了的
从 attention is all you need 到最后面的什么 group query attention 再加上 Nomsh zero 回归我觉得他们三足鼎力把这个事情不是一个 pretraining 和一个 alignment 而是说把它整合成一个有机的一个 iteration 的 process 来做模型能力不断地提升我觉得这样子的话 put Google in a much better shape 我觉得
我觉得这三个人可能都是我非常 respect 的觉得是让 Google 可以这一波非常快速赶上它的竞争对手的能力就是 Jeff Dean 对于整个 Google 的 infra 的能力 Aurel 对于 alignment 的能力还有 Nobster Zer 对于整个 NLP 的非常深入的认识听上来非常有意思
但你觉得 Demise 在中间的作用是怎么样的就 DeepMind 跟 Google 本身训练模型的它这个 team 之间的关系是什么呢我觉得当原来 Google Brain 和 DeepMind 还没有 merge 的时候我觉得他们是完全走的更多是两种不一样的思路吧我觉得 DeepMind 的强化学习也非常强大那这是为什么 Google 收购它的原因那 Google 本身是对于它瞬间调度大量的资源来 scale 它的 training 的这个 pre-training 或者 SFT 的能力 pre-training 的能力我觉得 Google 还是非常强大
那我觉得最后其实是一个强强联手的过程把 Google 擅长的事情和 DeepMind 擅长的事情做了一个非常强强的整合再后来我觉得 Demands Play 的能力更多是一个 Leadership 和一个 Management 的能力吧就是有可能原来我作为一个 IC 的时候我有可能只要写代码就可以把我的每天的工作完成了但是当你自己 run 一家公司的时候 you will realize it's more than just getting your work done
is how can you actually motivate 就是你怎么就可以去激励这些最极顶聪明的一群人有一个共同的方向把一件事情完成我觉得这是非常难的一件事情因为极顶聪明的人每个人都自己有自己极度的想法大家相当于是非常不愿意去 listen to each other 的
那我觉得 Demis 相当于 play 了一个这样非常好的肉吧相当于两个刚整合起来的公司 unify 成了一个有机的整体有一个 common goal 我们想实现 AGI 这个目标然后大家所有人都朝着这个目标把你最擅长的能力都拿出来把这件事情做成有意思所以 Jeff Dean 跟 Demis 他们的关系是怎么样的
Jafting 现在应该是 Chief ScientistDemis 应该是 CEOSanda 他向 Demis 汇报好像 Jafting 是不向 Demis 汇报的至少我走的时候我不知道现在内部是什么样至少我走的时候 Bose Demis 和 Jafting 都直接向 Sanda 汇报的哦 OK 那你觉得西尔盖布林谷歌的创始人之一回来你们会有什么样的变化吗
首先我已经不在里面了这已经跟我这个应该算他们不是我们对您在的时候应该是他刚好着手抓的时间点对是是我觉得这个 Circuit Brain 给 Google 的应该是更多的是一个 Founder Mode 吧
创始人的一个状态就跟 AI mode 一样它 bring back 了一个 founder mode 让大家知道应该是以什么样的一个投入和什么样的一个方式来完成这项工作吧就如果这个创始人都回来做这件事了创始人都在那一周待 60 个小时你作为一个 Google 的员工你难道好意思的干 40 个小时就回家吗对吧所以真的是一周 60 个小时
有些团队是这样子的我知道我一些朋友原来是在比如说 Image Generation 的团队他们就是说 Sergey Brin 回来说这个 Meta 又出了一个新的模型对吧我们的模型什么时候可以出来大家就说得了吧就周末加班去吧
OK 我觉得更多时候是个 Founder Mode 对于大家非常鼓舞士气的一件事情本身我觉得我说的有点多了我觉得我们可以让上来查明一下这件事情对对对对对上你怎么看 Gemini 2.5 Pro 啊对我觉得听完已经讲的很好了这已经把该讲的都给你讲了不能讲的我觉得也讲的差不多了
所以我就从一个外面的角度来说因为我也在 Google 干过其实大家都知道整个 Google 的 talent density 是非常非常高的其实大部分人之前都处在一个非常 layback 的状态因为广告太赚钱了大部分 team 都不用特别的拼命去做一些事情但是这一波 AI 其实起来了之后尤其是从去年 OpenAI 抢了 Google 很多的风头之后
再加上 Sergei 回来了对吧整个 Founder Board 之后我知道整个的 Gemini 团队的士气都非常的高涨大家其实是拼了一口气就觉得说 AGI 如果说要有人做出来的话那是不是就应该是 Google 能做得出来因为 Google 有最大的 computer 有最优秀的人才在里边基本上还有无限的资源
再加上 Circuit 也冲回来了所以其实正在从外面的角度来说看到这一波整个 Gemini 的崛起其实也就可能花了一年的时间大家从去年的 IO 被抢了风头到今年的 Gemini 2.5 就直接霸榜了对吧所有都在第一名了你看连 OpenAI 可能今年也没有办法去抢这个风头了嗯对那接下来还有一个问题啊
其实大家现在看到的是 Gemini 它的模型做得很好但是我知道在很久之前 OpenAI 跟 Aetheropic 它们接入 API 价格很高的时候其实 Gemini 它的整个大模型它已经是把它的 token 价格降到了当时对比了一下可能就是 OpenAI 价格的五分之一到十分之一当然最新的数据它有没有反向去促使其他两家又在降价我没有去看啊
但整体来说基本上在开发者的社区里面大家都知道 Gemini 它的 API 接入成本跟 token 成本是很低的就我很好奇它这个价格是怎么样降下来的我自己看的话可能是主要是三方面吧第一个是 Google 应该是从 10 年前就开始大量地投入 GPU 了当然它是叫 TPU 啊
我觉得他们当时就想得很清楚如果说整个的 Google Cloud 如果发展起来的话他没有办法不停地去向 NVIDIA 或者是向 AMD 去买这些 GPU 所以他自己从 10 年前就开始慢慢地深耕整个的这个 TPU 的生态他本身的 TPU 的迭代速度尤其是这两年明显也变快了因为他的需求非常大所以他自己用这个 TPU 他就避免了很多这种 NVIDIA 的 Tags 你不用单独去等 NVIDIA 的这些新的 GPU 出来你要跟别人去抢
第二的话就是 Google 它本身有很强的 infra 大家其实都知道 Google 的 infra 非常非常的强所以它已经有基本上无限的资源了所以它其实就是要想清楚怎么去动态的调度这些它的动态的调度这些机器的能力是远强于像 OpenAI 像 Anthropic 因为 OpenAI 和 Anthropic 它自己还是没有自己的地下中心
Grok 现在很强做了一个世界上最大的 GPU 的集群但是大部分的这些公司其实是没有能力去调度这么大的集群的它其实依赖的是第三方比如说像 Amazon 或者像那个 Microsoft 他们的 Cloud provider 来做这个事情所以它其实还是用别人的这套 infra 来做这个事情
然后第三个的话就是因为它能够去定制自己的硬件能够去调用更大的集群那么它自己在优化自己的模型的时候也会相当于你的软件和硬件就一体化了所以它能在你的硬件上面发挥的能力也会更强一点然后它自己还有整个的开发者生态 Kimi 有补充的吗就是首先我非常同意上述的 Google 整个内部的 infra 的能力其实真是非常强的
很久以前 Simon and Alasdair 出了一个非常有意思的 report 来 rank 不同的 GPU Cloud 的这个 rating 嘛比如说他们 rank 最上面是这种 Code Wave 因为我知道 OpenAI 用的其实是 Code Wave 来做他们整个 GPU 的调度的然后我就是当时跟我 Code Founder 开了一个玩笑我就其实就说在网上还有一个在网上最牛逼的应该叫 Google Internal 2
就是它的内部的 infra 能力真的是非常非常的强我觉得我再 cover 一点其实我们虽然觉得已经 API 非常的便宜了但是我们没有任何人知道其实 API 的成本价到底是多少这个唯一我们能看到的一个 ICETAPE 是当年 DeepSeek 在发它的
那个 paper 叫啥我都有点不记得了就 DeepSeek 那篇 paper 里面说了其实 DeepSeek 大概是有 80%的溢价空间的就它的成本价只有它现在 charge user 的 20%左右那你看 DeepSeek 的模型是那个体量它用的是 GPU 你可以反过来估 OpenAI 的有可能它的利润是非常非常非常高的
对于 Google 而言它不需要通过 API 赚钱了它相当于说它的 search 已经足够养活它了它可以相当于说只是 charge 你一个白菜价保证它 break out even 它就可以做这个事但是 don't quote me 我不是说它一定就是一个 break out even 白菜价这就是它的成本它有足够的资本可以把它的价格降到有可能就是成本价的一个状态来做这个事情
理解理解对这个信息量超级大了那大家现在其实也都在做 AI Agent 相关的创业嘛你们在自己做创业的时候因为你们底层肯定要选一个模型来在上面去搭建你们会怎么样去选模型呢就站在我的角度来说没有最好的模型只有最适合你的模型
其实很多做 agent 到最后其实你会拆分的是它的很多是不同的任务类型无论你是分析文字分析文件分析图片那你其实当下你觉得哪个模型最适合你当前的这个任务那个模型是最适合你的当然我们自己在观测当然因为我们现在我们自己做很多打电话相关的东西对吧那其实对于我们最敏感的就是它的 latency 和它的是不是 stable 因为你基本上有一定的 latency 的 jump
对面一听这个电话可能就有个一到两秒延迟这个体验就非常非常糟糕了所以我们自己在选择模型的时候也会去 balance 这个比如说有一些特别 sensitive 的东西或者说特别需要实时的东西我是不是应该自己 host 就是连外面的这些避孕模型都不用如果说有一些对于时间不是特别 critical 的但是对于成本比较 critical 的因为它可能有将近要 512K 的 contact window 的时候这个时候我可能就选一个比如说 Gemini 这种 Flash 或者 Gemini Pro 对吧我如果它智能要求高的话
那我就会用它因为它比较便宜那我如果说是需要一些更强大的模型或者说使用习惯对吧 OpenAI 整体的对你的 prompt 的理解对于 Instruct Following 我觉得可能跟我之前的调配的方式还比较有用还有我的很多的这些 dataset 也都是基于这个的那我可能还是会有一些 OpenAI 的东西
然后再加上现在 Cloud 的这些模型它对于 Agentic 的能力非常的强你如果是一些纯 Agentic 的 workflow 的时候就会选择这一些所以站在我的角度来说的话其实并没有最好的一个模型而是说你当下你的这个场景里面选择的那个模型比较合适嗯
哪个模型延迟低因为延迟这个东西是根据你的模型大小有关系其实你的模型越小它的 latency 越低对吧还有决定的 concurrency 就是你当下有多少个同时在处理的 request 这也会是影响你当前的 latency 但如果说是只是正常的这种 cloud provider 如果是 close source 的话就是币源这些模型的话
Gemini 2.5 flush 它现在还不是特别低的 latency 但是 2.0 的 flush 是非常快的然后现在的 OpenAI 的话因为它要解决这个 latency 的问题它除了 4.1 mini 那个 4.1 mini 和 4.1 nano 其实也都很快但是智能就不是很强所以它会有个 balance 就是你当中现在任务来说它这个 latency 是合适的
哦 理解 理解 对 所以看起来也是在一个你追我赶的情况中那你们会根据模型的发布随时去切换底层的模型还是说其实你们是一个机尾叫架构他们都在会的 会的 ok 会的不是会的 会的 真的因为对于做 agent 的公司来说给我一个体验就是你其实没有对于任何的一个模型有任何的忠诚度谁的模型又快又好又便宜我们就用谁的模型嗯 好 Kimmy
我补充两点第一点就是我完全同意上来我觉得这是一个 it depends 这取决于你做什么事情本身我加一点你需要的是一个怎么来帮你选择最好的模型的不是人为而是一个非常可以被量化的一个选择的方式那比如说我们做 agentic 的 workflow 的时候我们就会把我们现在所有的模型都跑一遍看哪一个模型在我们想做的 task 上完成的效果最好我们就选那个模型
第二点就是说正因为有这样的一个百家齐放的状态这才有 startup 的机会第一点这个 leaderboard 排名我们看一看就可以了他在这些 general 上面的排名好确实是有他的原因的但是也有可能是有些水分的 nobody knows 对吧我不是说 google 有水分就之前 lama4 在 LMS leaderboard 上排名非常好 LMS 是个 human preference 的 leaderboard 就人想要的 leaderboard
他 Summit 的一个特别的模型就是让这个模型干的事就是 Human Preferred 的事情而不是说把它的基座模型或者把它的 General 栏的模型 Summit 上去了所以说这个 Leaderboard 你看一下就可以了会有一定水分但不是说我说 Google 这个模型 2.5Pro 2.5 有水分在里面
那正因为这个 leaderboard 更多时候只是一个 proxy 你相当于自己的一个评测来做这件事情正因为你评测之后你知道不同模型可以擅长干不同的事情所以说这才有了 startup 可以把不同的模型整合在一起做一个非常 complex task 来 capture 这个非常 vertical 但是非常 deep 的一个 market
对所以你们也是 dependent 看你们的需求对我们有我们内部的非常完善的一套评测的机制就跟我当年在 Google 的时候 D-Mind 一样我当年是将来评测 D-Mind 是一个模型那我们现在是评测的有可能都可能不是一个模型是一个系统这个系统里面有可能有很多个模型
了解,这次其实谷歌发布的就是有一个让我印象非常深刻的点,就是它可以去做实时的语言翻译,比如说 Google Meet,它会上线英语实时翻译成西班牙语,Flash 2.5 可以根据你的 Text 文本去生成 20 多种语言的声音,因为我自己做播客,我其实是这些产品的一个非常深度的使用者,
我在考虑的问题是比如说我的中文播客它如果能实时生成成英文了只要我们内容做得好是不是也可以在英文市场里面大家也可以来听但是我在用这些模型的时候我就发现它核心还不是说只是生成声音因为生成声音很简单但是你要让那个语音非常的自然流畅让用户听不出来 AI 感
这个还是有门槛的就比如说 11 Labs 他们的英文模型做得很好但是他们的中文模型生成两个字还行但生成一句话他那个语音就非常外国人的强调了所以大家觉得这一类的产品它考验的核心到底是模型能力还是工程能力
我觉得我们现在用的更多的产品其实是 especially 这种 directed to C 的产品其实更多时候还是个纯的模型的能力未来 Samultimate 说 GPT-5 is not a model, it's a system 对吧我觉得未来大家会引入更多的 system 的概念但是 at this moment 我们更多时候作为 C 端的终端用户直接相当于是最直接的接触的模型的能力这个事情
那为什么有可能 Gemini 在这些上面的体验不会像 11.11 这么好那 Fundamentals 就像我之前说的你有很多个 teamThis model have to do a lot of things 有可能有 20 个 team 就是说这个 team 说我要增强它的 coding 能力这个 team 说我要增强它的 creative writing 能力然后另一个 team 说我要增强它的比如说 real-time API 能力然后另一个 team 说我要在 real-time 里面增加不但是这个能力中文能力还有英文能力还有西班牙语的能力那
作为一个大公司你不可避免的就得去做一个整合在这个整合的情况下自然会有一些取舍导致了有可能比如说它的 latency 非常低的同时就会不可避免在一些 performance 上有一些 drop 那作为 11Lab 它要干好的就是一件事它不用想任何数据配别的事情它就要配进去最好的音频的数据把这件事情做成你想做的是一个更加的 horizontal shallow 还是一个 vertical 更加 deep 的事情本身这些方面是 differentiate 的是一个 startup 的机会还是一个大公司的机会的事情
嗯所以核心其实是看团队内部重视什么我觉得是看 priority 看 priority 我觉得都很重要没有什么是不重要在 Google 内部更多是 priority 那有可能对于 startup 而言我 priority 的一个事情有可能是 Google 的第三十个重要的事情那当然不在 Google 的 road map 上我把时间是做成了 VK capture 一个非常大的 market 那这不是我说的话这是那个萨尔郭在他的某一些 podcast 里面说的一件事情嗯
那你觉得考验的核心是工程能力还是模型能力呢我觉得 both 我觉得没有直接的模型也没有直接的工程如果只给人一个模型的话其实他的体验还是会非常差的我只能说模型决定下险工程决定上险上你是做这个语音产品的你正好可以聊一下
语音产品其实很有意思啊比如说文字输出你到最后看的好坏其实到最后只是每个人的偏好对吧喜好但是语音类的这些东西的话你是所有人都能听出这个东西到底是好还是坏的就像你说的如果你这个模型生成一个中文不好的时候不用听两句话听两三个词我其实就知道说你这个生成的效果不好这个是所有人都会有同样的感觉我
我最早接触过比如说 OpenAI 的也是叫做 Rotam API 就是它能够实时做这个语音 end-to-end 这个 speech-to-speech 然后我看了 Google Meet 的这个 demo 里边我觉得几个东西给我印象非常的深刻第一个是因为它是个实时的翻译那你要保证它的信息是准确的就是因为同声传译嘛
而且跟他的语速语调也要保持一致的而不是说所有听上来就是机器音第二个就是他要保证他的速度是足够快的可能最糟糕的体验就是这个人说完了一句话之后你五秒之后你才翻译完对吧这个体验其实非常差为了要解决可能两三百毫秒的 latency 这个问题的话那他在 engineering 这个角度来说也要解决很多的问题
最后的话就是其实它这个很多翻译的东西是跟上下文艺术有关系的那你这个上下文在同一个里面它是怎么做的它是不是应该把整个内容全都放到这个模型里边然后同时保证速度很快这个其实我也不是很清楚但是这几个都是它要解决这个实施同声传译的非常难点的东西对它后来也在 AI 眼镜上展示了这个功能然后我当时的想法是哇这个得多耗电呢哈哈
其实还好因为从技术的角度来说的话无非你是怎么到最后去 implement 这个东西你传统的做法就是我可以开一个简单的我不论是 websocket 或者说一个 server-setstream 你可以证明就是高阶版的不停发 request 而已它只是发的频率稍微高一点
但它其实并不会特别耗电而且它如果是控制那个硬件的 device 的时候你的这个音频的码率也不用特别高所以它的这个数据量其实也没有你想象中那么大 OK 了解我记得谷歌它还展示了一个 demo 就是 Project Astra 它会帮一个用户去修自行车包括中间我记得是有零件有什么问题的时候还可以让大模型去打电话对
你会觉得比如说以后啊越来越多的 agent 加入模型或者像大公司它可以直接给用户去打电话提供一些服务的话会对你们的商业模式有冲击吗我们自己是主要作为医疗方面的 B2B 的这个模式更多了现在并不会直接 2C 你说的这个场景的话其实对于很多 2C 的公司确实是影响会非常大因为
模型随着大公司这个模型能力很大然后大部分大公司的第一要做的就是我能不能面向 C 端我的用户能够扩大这个能力所以针对这个 C 端的公司确实会有很强的冲击然后你刚才说的那个打电话这个场景里面的话其实这种很多打电话 AI agent 可能就调一个工具就能做的这些事情的话
它本身的门槛是越来越低的你如果解决的这个 vertical 里边它的工具的量特别的少或者它对于整个 business 整个 flow 的这个逻辑特别的少的话那你确实是有可能会被大公司直接被取代掉的对所以有一种说法是 Google IEO 的发布会一开感觉创业公司又要倒一批呵
你还记得去年的时候还是 OpenAI 开发布会就专用 CP 确实是你看从你刚才说的试衣服你应该知道像有很多公司其实去年这一年可能就是根据试衣服 Virtual 的 Try on 的这些事情有很多公司在做这些事情
那 Google 一出来之后可能这些公司就没有了 Google 做了那 Amazon 可能也会做对吧那你其实最大的几个 Shopping 的网页上面都做了那小公司就没什么机会了所以 2C 是一个非常难的事情对很有意思就是关于试衣服的这个场景其实正好昨天我在谷歌的现场有跟阿里的人聊到他们其实一直在尝试这个场景
他们对这个功能的评价是其实让用户试衣服这个点不重要就是谷歌如果能把尺码搞对就很不错了就是可能尺码是一个比你虚拟看一下自己穿着好不好看更痛点的问题对对所以我觉得他的现在展示是直接发一张照片嘛我不知道你有没有看过用像苹果手机或者说会有就是有 LiDAR sensor 就是用传感器的 3D 吗对他可以对你身体稍微扫描一下
其实你就拿这个手机离着自己转一圈它其实可以把你自己的 3D 模型大概你的高胖矮瘦之类的就一次性就输入进去了它现在只给你一个照片但我觉得 Google 要去做这个事情也是非常容易的 OK 我们来说综合来看就是你会怎么看谷歌在大模型这一轮竞争中的优劣势和它的生态位我觉得 Google 的优势就是第一个是它有自己的硬件的生态它其实就不会依赖 NVIDIA 提供这些硬件给它
那它在这个底层的时候就已经比大部分公司有这个优势了就基本上其实没有什么公司能做这个事情第二个的话就是它有非常大的服务器的集群因为它有整个的 Google Cloud 它其实有无穷的算力它因为它自己有自己的 Data Center 那你能够做独立 Data Center 的公司也是非常少的再往下面的话就是它有它的模型层的有大量的数据去训练它的模型
我觉得大家离这个 AGI 越来越近的时候其实训练的方法差距就已经不大了那你谁能够获得最高质量的这些数据的公司其实它的优势就非常大那 Google 其实有非常非常大量的这个数据这个是在模型层最后的话就是在算法层了 Google 又有它非常强的算法的团队所以 Google 通过这一年的努力变到现在整个的模型层第一我觉得一点都不奇怪
对你刚刚提到的硬件生态服务器集群模型层跟算法层总结来说就是 Google 它还是一家技术公司它的技术是非常厉害的这一点我认同非常认同但我觉得同时大家对 Google 的质疑是 Google 它是一个产品基因不够强的公司
就是我们来看 Google 的明星产品就感觉很多产品其实也做得很好了但是它其实没有维持运转下去就你会怎么去看如果要把这些技术变成一个非常强的有穿透力的产品 Google 在产品上的布局是怎么样的哦
我觉得 Google 的产品一直是它的弱项就是它自己也很难做出特别好的产品所以我觉得 Google 这一波要做的其实就是围绕着 Gemini 这个非常强的模型在打造自己的生态你看它从自己的尝试从 Gemini 的手机的应用到它的 XR 的眼镜其实它不是 launch 了一个产品它是一次性发布了可能 10 到 20 个产品
因为我觉得站在 Google 的角度来说其实它也不确定哪个产品会跑出来你如果 follow 过 Google 的那个 Notebook LLM 那个其实大家都很知道对吧其实它也是一个非常小的项目突然火了之后 Google 就开始倾注资源所以我觉得 Google 现在的趋势就是它不确定哪个产品会赢但是它先把所有的产品都摆好自己的身位一旦发现哪个产品真正的可能起飞了之后它就开始往里面不同的砸资源这个是我觉得 Google 现在在做的事情
你现在还会用 Notebook LM 吗因为 Notebook LM 它最开始其实是一个就是你把所有的研究资料输入进去它会给你特别好的整个输出的总结按照几种模板来总结同时你还可以根据这个总结去看它是引用的哪一块但是它天才的产品经理在上面加了一个一键生成音频的功能
相当于它一下在整个播客圈就火了就是我们可以把一个几十页的长文本甚至是一本书快速地通过一个十分钟的播客的语音的产品来有一个 summary 我觉得这个产品在它刚刚发布的时候还是非常火的但是现在我觉得它的声量小了很多我不知道你还有没有持续地在用跟在关注
我觉得很多的信息之后获取的途径大部分都是播客对吧这也是我相信你们在做的主要原因对所以我觉得播客会变成一个非常常见的信息获取的渠道所以我觉得他的这个非常聪明的一点就是我把一个只要是任何的信息放到这个里面之后它就会变成一个我能够接受的一个模式变成我的个人的这样一个播客我用过几次之后我之后听的话会选择比如说因为现在确实是常播客非常的多
我会稍微挑几个自己听你会直接听长播客还是把长播客总结一下然后让它变成一个短播客来听其实我也试过把自己的节目放进去让它总结成一个短播客我觉得它总结的效果还不错但只能是英文版啊
对我自己会听一些比如说两三个小时那种长播客因为我觉得那些播客的话能让我不会漏合任何的细节任何只要我想知道的知识点的话我可以再听一个播客就可以从头到尾都能够覆盖到了而不会去调整中间的细节那以上就是我们对 Google I/O 本次发布的技术层面的解析
我们已经经历了 OpenAI 领先 DeepSeek 冲击美股股价到 Gemini 全面领先的好几轮 AI 竞争我们可以看到模型层面上的竞争其实现在已经是在一个你追我赶个领风骚 100 天的阶段如果说谁都可以在大模型的这种竞争中保持暂时性领先那我们应该如何去综合性地评估当今这些 AI 巨头的竞争力
接下来我们来听一听华尔街的分析以下是硅谷 101 特约研究员易文与美国金融投资首席执行官与首席投资官刘庆东 Bruce 的分析他是这样看待为何在 Google I.O.之后谷歌的股价先跌后涨的
Google I/O 来了之后市场反应我觉得一开始市场没有理解 Google 整个的新的打法因为推出来的又很多很繁杂市场没有很快地抓住它的点所以当天的反应其实是不好的那个谁上来一讲就不好不过 Google 出现这种问题我觉得也不奇怪一直都是一个技术强产品弱大家不是很容易立刻去找到它的核心矛盾是什么昨天经过一天的消化不管是 Southside 也好还是你们也都看到了大家终于理解我觉得这个很核心的东西就是它这个 Full Stack
全战士服务真的是把 Google 所有 AI 的能力真正的去 leverage 去利用它现有的庞大的一个用户群它这么强大的 distribution 让现在我把 AI 的能力完全的嵌套进来就变得特别的清晰了当然了最后能实现什么效果我觉得这还有很长的路在讲这也是一直 Google 欠缺的地方起个大早赶个晚急你不要说所有的技术都是你的之后你其实在产品化上很差没有办法去真正实现它最大的潜能
但 somehow 市场至少现在觉得 Google 把这个 I/O 所有的这些 announcements 当成一个 positive 的事情所以昨天因为整个市场在大跌但 Google 自己又把跌的涨回来了这一切其实我没有觉得解决了 Google 的核心的问题
自从 AI 出来了之后,Google 尤其对华尔街最大的困扰就是随着 AI,随着 GDP 这些新的工具,新的流量入口的出现 Google 是还能不能保持它在 search 上面的优势地位丢市场份额是一定的,但是丢到什么程度,中间要付出什么代价作为一个生意来讲,这个 Terminal Stage 是什么这个是最不清楚的,也是市场最大的 debate
你乐观的人认为 Google 有自己的技术优势就像他昨天讲的我有全站式的服务我有这么大的社会群体我不会付出代价我还能保持我的优势当然最不乐观的一个想法就是说在新的 AI 这个模型下其实 Google 大部分挣的钱说的简单俗气一点都是由 search 来的
我们说一个最 doomed 的 scenario 这是被彻底的打垮了完全都跑到了其他的新的这些技术或者流量入口上面去那 Google 整体的估值就是没有底的那 even 现在已经 17 倍的估值看上去比其他的都便宜很多就是因为市场没有被完全的说服
这两个之间我觉得这个 debate 在最终 Google 在接下来的两年或者三年找到在新一轮 AI 竞争的终局里面在这个之前这个 debate 会一直有的当然了随着技术的变化那也许 Gemini 真的后面又发力 Google 又找了更好的 monetization 的方式
可能市场的担心会小一点但是同样的如果 OpenAI 在下面意识模型有了更大一步的进展 GDP5 出来随着 OpenAI 或者是 XAI Anthropic 他们又找到了一个新更好的方式去做这个 search 特别是在 search 上面能够把广告的业务更好的嵌入进去这个我觉得是在接下来几天会一直有的这么一个 debate 这是我觉得是困扰华尔街困扰 Google 股票最核心的问题
我有一个问题就是你刚才也提到其实谷歌在 AI Search 上并不是没有发力因为去年发布了 AI Overview 这次 IO 也讲到说有一定的使用量然后有一种观点就是认为谷歌之所以没有办法做像 Perplexity 和 OpenAI 那么大幅度的动作主要是因为流量太大了可能要采取一个比较稳妥比较保险的套路所以说现在可以说是证明了这个道路是不太可行的不能一味地想要去规避风险这样子嗯
Google 其实是从一个绝对的领导者的角度它受到了新的技术的挑战那无论最后终局是它还是保持了它领导者的地位因为以前这个真的就是躺着赚钱当你从一个躺着赚钱的一个时候变起来你要起来运动一下你要做些事情才去能赚到钱或者甚至你根本就再也赚不到钱不管怎么样这个边际变化对 Google 来讲都是变差的
我觉得这一点其实是市场最在意的但这个变差变差到什么程度是你退回了 80%还是退回到 20%现在是市场看不清楚的我们就讲一个情况就是 Google 通过各种各样的努力就像 AI Overview
甚至是今天新出来这个 OAM 的最后他在设置这边因为有 AI 的加持让他保持了他一定的市场份额但这个时候他投入了很多的技术能力这都是成本所以可能 Google 的 margin 就不会那么高了同样的由于 AI 带来了我们设置的这个大的市场其实是在变大的
但是可能 Google 再也不能回到以前它都是 90%甚至是 100%的这么一个领导得力的地位它可能能有 60% 70%也很不错呀但是还是有其他 30% 40%是被其他的新的玩家新的公司去占据了那这种边际变化对 Google 还是不利的其实华尔街一直都在等我们要知道大概的证据会是什么样子你才能给它一个更清晰的定价当然最差的情况就是它完全被颠覆了这也不是说完全没有可能
就在有可能的几种情形下对 Google 来讲都是 negative 就是你 negative 多一点还是少一点在你没有找到这个终结之前我觉得这个 debate 一直都有那它一直都是我们认为是悬在 Google 股价上的一个利润吧你需要等这个靴子要落地 hopefully 在接下来两年三年或者更快一点就会落地了那我还想问一下就是在盈利和商业化上的一个问题其实因为你刚才提到广告嘛
其实谷歌之所以搜索可以赚钱的很大程度上是广告居然 SEO 的利润那在 AI 搜索这个事情上面有一个很大的问题就是广告怎么样才能嵌入这个系统里面不光是谷歌面临的问题那这个现在得到解决了吗大家现在是怎么讨论广告这件事情的
这也没有解决如果解决了的话可能竞争的终局大家就都知道了就拿 Perplexity 举个例子就拿我同事我们因为平常经常讨论这个东西他在去买什么东西或者想买什么东西的时候已经不在 Google 里面去 search 了他就在 Perplexity 里面
我相信 Perplexity 包括 OpenAI 大家都在想做这些东西都是 try to figure out 我怎么在这样一个 AI checkbox 这么一个形式下能把这些广告嵌入进去确实大家还都没有 figure out 怎么做这个事情我昨天试了一下你在 Google 的 AMO 的下面去问一个问题他给你出来结果我昨天就问 Lululemon 新出的这个 New Dress 你给我讲一讲怎么回事你看不到任何能够放广告的地方他也没有 figure out
这就是业界争论的点我觉得什么时候大家找到了在 AI chat 里面怎么合理的去放广告收广告这个新的机制被搭建起来之后我觉得这个问题就解决了这就是 ongoing 的问题需要耐心但是我觉得因为你靠收比如说 perplexity 去收每个月的订阅费
因为广告这个市场才是真正大的这会儿想有大的发展一定是需要有广告进来但是又因为整个业态太新了因为广告发行也是一个技术嘛它也需要一个生态支持呢我们还没有解决这个问题但我觉得接下来很快就会解决了那我们再把时间线拉长一点就是我想看在 IO 之前其实谷歌的股价从大概两个月开始就一直处在一个相对比较低迷的状态就是也没有那么差但是
但是也没有大幅度的提升那像你刚才说的 AI 的竞争可能是其中一个因素我想问一下资本市场对谷歌还有觉得哪些因素是比较重要和影响它的股价这个大概讲啥因为毕竟是个股票而且是科技股其实受宏观的大盘的影响很大
其实在这之前没有什么当然除了 5 月 7 号我们说 5 月 7 号之前苹果的这个大家可能还有印象吧再说 Google20 多年第一次在 Safari 里面的色指示有下滑当天对 Google 影响还挺大的达到了 140 多但在这个之前 2 月份创新高这是随着市场创新高一起去做的 2 月份之后其实整个市场有一个担心我们叫 Growth Scare
大盘基本上都从二月份的开始一直是有这么一个健康回调或者你可以认为从去年联储降息川普上台市场涨得太快太疯了你 press in 了太多的好的 growth 到一月份二月份市场逐渐意识到我们往前走的太多了我们需要去回调一下
因为再加上整个宏观经济也出现一个减速的状态这个可能和 Google 真的本身没有太多的关系这是一个宏观的一个 play 我认为从 2 月份到 3 月底 4 月初关税这个东西出来之前我们是 position for 这个回调的而且我觉得这个回调是健康的就是你走过了你 priced in 了太好的 growth 可能和现实状况不相符这是那一波回调下来的这个和其他的 tech 都是一样的这是一个大的 beta 那
Carrif 这个事情出来以后这个也是对整体经济的一个影响因为太多的不确定性尤其是对 Google Meta 的影响可能更深远一点毕竟你是个广告生意广告生意还是有 cyclical 而且你的很多广告主投广告的人比如说中国的一些电商这些都是会积极地在 Google 在 Meta 这些 property 上面去投广告的
随着关税赚来整个经济要下滑对他们的业务可能影响相对会更大一点比起 Netflix 对这个的影响可能就没有基本上所以其实在 5 月 7 号之前苹果的 ADQ 在把 Google 拎出来打之前我觉得并不是 Google 自己本身的问题是整个市场的一个问题
那 ABQ 讲这个东西当然一方面确实这是事实市场也担心 Google 在丢份额只不过就没有大家担心的那么快但是他把这个拿出来打一方面不排除因为又到重新签合同的时候了往往会有这种情况大家都会使这种招 Google 去打 Broadcom 的时候也会用这种招
动不动就说我们要自己做芯片了其实一直也没有实现过我说做手机的芯片包括苹果说 Broadcom 也是一样的基本上是这么一个 dynamic 吧刚才说到 ADQ 其实这个涉及到美国政府对于谷歌的一个反垄断诉讼那这个诉讼本身对谷歌的股价难道没有很大的影响吗
这其实是个好问题而且我觉得可能你不能恪周求见因为谷歌在过去十年面临这种反垄断的诉讼太多次了他身上背的官司特别特别的多但是我觉得 step back 一点其实从拜登政府开始他的 FTC 当时是 Lina 对吧
就开始对反垄断 anti-monopolyanti-trust 开始越来越重视力度越来越大这有一个大的历史背景宏观背景我觉得我们逐渐进入到了一个 labor 劳动力和 capital 之间的大的一个竞争那
有可能这是我们自己的一个想法其实这些大的企业有垄断性质的企业是最容易被开刀的就政治家拿 Google 去开刀拿 Meta 去开刀甚至拿 Apple 去开刀是最容易讨好的事情你让竞争更充分其他的小企业更有机会其实是一种打破不平衡打破不平等的一个很有利的一个方式所以不要忘记这个大背景所以在这个大背景下面从拜登政府开始
就加大了对这些有垄断性质的企业的挑战 Lena Han 她是非常非常 aggressive 的你要看她过去在任期间她所有的 policy intention 就是我要把你们打破了我要去挑战你们我争取让竞争变得更公平大家其实对川普上来他新任命的 Andrew Ferguson 是有一点点与其暗示你是不是可以怀柔一点但到目前为止其实他也并没有怀柔因为
川普现在自己也是打着一个为民请战的旗号去来做所有的事情只要我看上去我不能和你们大企业站在一起我要让更多的人能够享受到经济增长的红利那我反垄断就是一个很重要的工具所以在这个大背景下你看他 Google 最近两个 law suits
一个是对他的 search 的挑战像 ADQ 其实他不就是在这个听证会上吗现在就是我诉你了但是我还没有给你一个解决方案对于他的一个 search 然后所以你看这些都有听证会大家都去讲一讲我可能会给你的解决方案是什么但他的 AdTech 这一块就是你广告科技这一块我觉得这个已经出来了我让你 break up 了我就是来你拆分了当然了这个并不代表是立刻就会有效果
Google 在这方面它也是老手了花了这么多钱拼起 Lawform 上面我觉得这是一个非常 L lengthy process 可能真的就五年十年我也不奇怪但是你可以很清晰的看到控方也越来越理解你到底 Google 在 Advertising Tech 这个 Market 上面你的垄断是怎么实现的我觉得随着这么多年打我觉得控方其实是越来越清晰的所以这样对 Google 造成的风险也确实是越来越大的
但是市场我认为还没有 price in 这个东西如果这个东西变得越来越清晰 Google 真的是有风险被 break it up 那我觉得会有新一轮的一个 pricing 不过这个我也挺惊讶的所以说即使现在有比较高的 Google 可能被拆分的风险这个市场还是没有做出一个非常强烈的反应
我个人认为还没有真的去完全 press out 就觉得是你我知道你从它的 press action 来讲从你的估值水平现在确实 17 倍它 17 倍估值但是 Google 还是没有 220%多的增长同样的 Meta23 倍的估值也无非就是 23%的增长但我觉得这里面的区别就是 MetaMeta
Meta 是很清晰的一个它是要授意 AI 的随着 AI 的发展 Meta 对它永远都是这个 Till wins 都是帮它的但 Google 不是 Google 其实它面临的就是我们刚才讨论的那个问题它如何保住它的 search 的入口而要花多大的代价 even 你有很多的科技东西都是你的但是就是因为你从一个领导者变成一个到你新的位置新的领导者这是市场不知道的所以我觉得那个估值差反映的是这个问题
还没有去反映 Google 被彻底的拆分会带来什么样的一个影响既然大家也算过这个数就比如说举个例子可能很多人都觉得 Google 如果真的拆分你 sum of the parts 你的 valuation 一个模式可能 Google 大概值 140 块钱现在你看又回到 170 多我个人认为市场还没有充分的去 press 那边的 risk 了解那我们来聊一下 comparison 其实我还蛮好奇因为刚才你把 Google 和 Meta 做一个对比
那比如说 Google 在现在我们说的七巨头 Mixin7 里面 Google 大概是处在一个什么样的位置就是市场大概对它相比较而言是怎么样看待就是
就像我刚才讲的千万别起个大早赶个晚集因为它是最有这个风险的举个例子就是大家也能看到整个科技产业界尤其 Mac7 大家都知道后面就是 ride on AI 的大的浪潮那 AI 起来的话我不说所有公司了但是你像 Meta 其实当我们真的从 AI 从 infrastructure 从基建转到这个 AI 应用模型现在逐渐聪明了 Meta 其实是个名牌
刨去宏观的这些因素来讲对于 Meta 来讲它这个名牌对它都是有利的它可以更有效地去利用大模型的技术然后更去推让它的 advertising 或 social network 变得更有效更有意思对英伟达再举个例子如果我们有 influencing 起来了我们大模型有进展
对它也是有利的它是处于一个特别好的一个位置同样的我觉得 AmazonMicrosoft 都是 more or lesssame thing 我们都能受益于整个 AI 继续去发展去创造新的价值这么一个大的浪潮的 Google 就很纠结一方面比如说 Google Cloud 它确实可以受益于这一系列的东西然后它自己又花很多钱 build up 这些
它自己的模型也 hopefully 能够还是一直在第一梯队里面但是它比别人就多一个雷就是它的这个 search 是怎么去被 disrupt 掉所以 Google 其实我觉得比起其他家它就是一个相对来说就是 narrative 不是那么清晰的一公司我现在 Google 我是 underweight 的我就希望等这个东西能落地落地了之后你再去重新 re-engage Google 我觉得可能是一个相对来说更好的一个点不然它永远都是这个东西在这悬在上面
你可以去讲就像昨天讲的全战士服务大家讲一个特别漂亮的一个 big picture 这么一个 story 我又有用户又有数据我又有这么多应用我的 model 现在也不比别人差然后我所有东西都自己做了看上去是多么美好的一个事情对吧但是怎么去商业化你怎么去把它真的是从一个优秀的技术变成优秀的产品还保持领导立位这块对顾客来说是不清晰的他需要有更多的工作去做是的
另外一个市场在过去一年里面经常被提到的华尔街越来越关注这些公司在 AI 研发上面的投入比如说像看像 Amazon、Meta 这样的公司每个季度在 AI 上花的钱其实越来越高那其实华尔街有段时间是保持一个怀疑态度的
这个现在还是一个顾虑吗这是一个特别好的问题因为其实大家选到什么程度大家真的要花好多时间去台湾的产业链里面去问你这个 TSMC 你的 COOLS 有多少量 Google 有没有砍单 Microsoft 有没有砍单因为只要你拿着英伟达这支股票这些都是你要担心的事情
说白了因为最终买单的人你可以看到现在很清晰就是这几个大的 CSP 就是 Hyperscalers 你所有半导体服务都是为了这个 AI 去讲那到目前为止尤其新一轮的财报出来我觉得打消了大家一部分担心 Meta 甚至把自己的 Key Packs 往上调了 Google 保持每年 75 个 BillionMeta65、68Microsoft85Amazon100 个 Billion 这个量 2025 年是有的
那市场现在争执的点或者是不清晰的点这个可能对英伟达的影响更大一点就是大家都不知道 26 年是不会会有一个 Air Pocket 所谓的 Air Pocket 就是这个会不会减速也许减速是一定的但减速到什么程度这是大家最不清晰的所以这个 debate 还是有的但到目前为止可以清晰地看到从 23 年开始所有的这些 Hyperscalers 进入到我们管的叫 AI Arm Racing 这个并没有停下来
其实这个是一个很有意思的点其实整个这一轮就 Google 这样的矛盾可能更尖锐一点他不是说我投资 AI 是为了有新的业务增长点投资 AI 是让你确保你的现有的业务不要被 disrupted 就不要被摧毁掉所以对他来讲这也是生与死的选择不到万不得已你是没有任何道理去停下来
包括大模型所有这几个在一线的 AI LabOpenAIGeminiAnthropic 然后 XAIMeta 有点掉队了但 anyway 大家没有人在至少我们的调研时间没有人在继续去追求大模型的突破上面是在放缓的我觉得还是在继续投入就是美国的 AI 团队一直在试图打开天花板可能中国的 AI 团队一直在降本增效上去
当然是由于你在算力上的限制我觉得大家的思路不是特别一样的对 其实你刚才提到谷歌的这个选择
他可能要去 defend 他的这样一个护城河比较有意思因为我们说 AI 的竞争很多程度上是一个巨头和初创公司的竞争就你觉得现在最前沿的 AI lab 是 OpenAI Anthropic 这样的一些 lab 它对于谷歌这样的巨头就从资本的角度来看对于他们到底是完全打压这样一个巨头吗还是说就是优劣那倒没有我觉得各有优势而且 OpenAI 也不能说是一个初创公司了这个资金实力团队什么
但是区别在于哪儿,我觉得更大和已有的这些所谓的巨头,其实就它有数据,有应用场景,尤其是你资本市场的重心从单纯的去追求大模型能力的提升,慢慢开始往 AI 应用的方向去转的时候,我觉得巨头的优势会越来越大。就像 Google 这样,它讲全站的服务,这种模型可能就是一个服务,我怎么来去服务更好的场景,verticals。
我又有现有的这些数据就足够我用就 YouTube 对于 Google 来讲是个多么幸运的一件事情对吧我上面有的这些东西帮我去 train 我的那些 flow 也好昨天的 video 的相关的东西都是巨大的帮助的所以我觉得这是巨头的优势相比较可能 OpenAI 在这一块就相对薄弱一点
早期的时候两年前大家说到 AI 这块巨头的优势在于它有足够的资金体量但我觉得整个业界已经 move on 了首先能在一线卷的大家都不太缺钱都不是钱的问题了我觉得更多是你有没有场景你有没有入口你有没有数据相反来讲像 Google 这样子的巨头其实是有优势的好的好的
对我补充几个问题就是我看见 P 柴他在这两天的财报分析师会议上说去年上线的 AI overview 他已经实现了跟传统搜索相当的广告收益水平你觉得这个是他股价回调的一个原因吗因为怎么去定义这个东西其实在我这边是不清楚的哈哈哈哈
举个例子你可以说 AI overview 这个是不是有帮助它昨天确实受了一个数据对吧它拿着印度和美国你用 AI overview 比起来它有 10%的增长比起你没有 AI overview 的这些用户来讲我觉得那个是 query 的一个增长对我刚刚想说的就是这个数据那是它头一次给一个定量的影响其实也想给市场一些信心这个东西是有帮助的但是还是回到它没有解决的我们之前讨论的核心问题对那 AI mode 呢
肯定是有帮助我相信包括 AI mode 起来之后大家更多在 AI mode 里面去弄对于 query 的数量肯定是有增长 engagement 可能是有增长但是呢它也影响了你去 monetize 这些的方式我昨天就在问大家一个问题他到底 Google 自己在 AI mode 里面怎么去 monetize 你们可以去试一试我现在知道他肯定还没有做这个事情的如果你就单纯的用 AI mode 去 search 的话他没有办法收广告钱了
市场嘛,诗和远方,这永远都是一个 debate,对于当下你有影响我当季或者是当年的收入,那怎么去平衡这个,你是不是要为未来的梦想去买单,如果你太短视的话,你说你现在这个公司没前途,但可能你就错过了 Google 下一个黄金增长十年,但是你太有诗和远方,结果你会发现 Google 最后没成功,所以我觉得作为市场参与人,投资经理们永远都是在这样子这个 debate 中挣扎的。
嗯你刚刚还提到了当时因为关税战大家可能都不看好 Google 跟 Meta 嘛
是因为如果有了关税战这些企业出海的投放就会变少所以就会影响到这两家广告公司的广告对 如果由关税战带来的不确定性和对增长的影响其实整体宏观经济都是要往下走的因为现在可能这也是大家的担心那广告这个生意本身其实就是和宏观经济的相关性会更强一点比起 Netflix 大家反正我就付钱去看就好了它对宏观经济走势的影响的敏感度会小很多
甚至英伟达他可能更在乎的是大家会不会继续投入他对宏观经济的走势的敏感度也会小很多但是 Google 和 Meta 如果你的收入大部分来自于广告的话这是第一层面的一个影响第二个层面就更具体一点特别是像中国的这些出海电商啊
包括美国本土的这些电商他们本来是最大的广告投入商但是随着关税站了起来他们本身就开始收缩了他的投入量变少了那对这些平台都肯定是有影响所以相对来讲其实由贸易战带来的创伤对他们的影响更大一些 OK 理解你刚刚提到在 Google I.O 的第一天大家没有反应过来然后第二天大家可能感受到了比如说这个 AI mode 也看到了他在搜索上投入的一个决心他的股价有所反弹
你觉得在这个反弹的过程中大家是对这个 AI mode 比较看好吗它是受哪一部分情绪的影响会比较大呢我觉得是对整体 Google AI 策略的提升带来的一个至少给你一点点信心第一天跌得有点没有道理那你其实也不需要那么悲观我觉得就是一上来很多都是很技术性的东西大家看不到一个很真实的产品形态
我觉得这是市场当时悲观的一个点但回头看到了 OK 我更理解了你的打法了之后我还是对你有一点信心的觉得你也没有那么差所以其实就是昨天是把这两天跌的涨回来了所以 overall 我认为就是一个 non-eventOK 理解特别好希望有帮助因为我们技术细节肯定是比不过这些做实业做工程的同事们的希望就在市场方面给大家一些帮助吧好谢谢 Bruce 好嘞好谢谢谢谢
那我们的节目已经接近尾声了大家有没有发现我们并没有提到带有视觉显示功能的 XR 智能眼镜这部分呢我其实是单独录了一期我们希望在下一期能跟大家一起去分享 XR 智能眼镜的一些新的进展如果大家对谷歌有什么新的想法或者听完我们的节目产生了什么新的灵感欢迎给我们写留言写评论来跟我们一起去分享你的思考
好了这就是我们今天的节目欢迎在小宇宙苹果播客 Spotify 还有喜马拉雅清听 FM 励志 FM 网易云音乐 QQ 音乐上订阅收听我们如果你是习惯通过视频平台来收听播客也可以在 YouTube 和 B 站上搜索硅谷 101 播客来关注到我们
另外我们音频的部分文字稿会发表在我们的公众号硅谷 101 上如果大家感兴趣欢迎大家持续地关注我们我是红军感谢大家的收听