亲爱的听众朋友们大家好,这里是左兜进右兜,我是你们的好朋友左兜今天是 25 年的 7 月 4 日星期五,欢迎收听本期节目这一期刚好是我们左兜进右兜开播满一周年从最初的交易员复盘的音频到现在越来越多的朋友的订阅和收听我们感谢每一位听友在这一年里用耳朵陪我们一起观察美股市场的变化
在接下来的日子里我们希望能够与您继续一起聊聊那些看似复杂但是真实会影响到我们判断的事情我们也将继续专注于美股市场的研究模型的交易以及研报的解读最后还是感谢各位听众的收听谢谢大家今天我们来拆解一份非常有价值的关于 Gemini 项目的一份调研纪要发布的日期是 25 年的 6 月
这个不是一份讲模型参数的报告,而是一份深度的访谈式的调研重点是在讲解谷歌现在是如何构建它的 AI 产品的矩阵的那么一句话的总结就是谷歌现在正在用 TPU 加上自研产品的一个组合替代传统的 GPU 的路线把 AI 做成一个可控的、可落地的并且可商业化的基础设施
首先我们从 Viu3 讲起,Viu3 是谷歌为 YouTube 创作者推出的一个 AI 视频生成工具它的定位是让每个 YouTuber 都能拥有一个 AI 的剪辑师这个听上去很酷,但是其实算力成本是非常的高的每生成一秒的视频就要几美分的成本那么一整段视频的生成的成本就可能会高达 5 到 6 美元
如果想要全面的推开谷歌至少会配 100 万张的高端的 tpu 也就是他们自己的 AI 的加速卡所以问题来了谷歌为什么会愿意为这个项目烧这么多的钱答案就是因为 will3 能够实实在在的提升平台上的内容量还有多样性最终会带来广告收入的增长
所以调研报告里说了 Viu3 是当前 ROI 最高的 Gemini 项目之一第二个项目是 Mariner Lite 它的目标是让每个 Cream 的用户都拥有一个可以点开网页然后自动帮你操作的一个 AI 助手这不是一个搜索引擎而是一个类似于 AutoGPT 的浏览器的操作系统比如说您打开一个网站它就可以自动帮您找信息然后下单填写表格确认付款等等等等
但是代价就是算力的爆炸每一步都要做屏幕的解析上下文的理解还有网页的模拟背后还得用虚拟机还原用户的环境每次操作都会带来 token 的激增更重要的是谷歌计划要免费开放给所有的用户所以推理的压力是可想而知的
所以这么看,Mainline Lite 虽然潜力巨大,但是当前还是处于测试与探索阶段。然后我们再来说说 AI Mode,也就是 Gemini 目前最具变现能力的模块。它是嵌入在搜索和广告里的,结合图文、视频、问答等功能,用来提升广告的点击率和用户的停留时间的。
相比做模型做框架谷歌现在最在意的其实还是 AI 能不能变现能不能快速的落机所以这也就决定了 Gemini 内部的算力的优先级的排序第一就是 AI Mode 第二是谷歌的 Assistant 第三就是 Gemini 的主模型第四是 Ville 3 第五是 Mariner Lite 最后来讲一个硬核的信号就是谷歌现在正在全面的去英文达化
报告里写的很明确,Wheel3 AI Mode,Mariner Lite,Gemini 模型全部都跑在自研的 TPU 上了 OpenAI 的部分推理任务也已经转移到了 Google Cloud 的 TPU 上谷歌明年预计会采购超过 300 万张的 TPU,其中 85%是为了推理,而不是为了训练
现在除了谷歌的 Cloud 的 HPC 业务还在用部分的英伟达 GPU 其他的主力项目几乎都已经改用了 TPU 这背后说明了一件事情就是 GPU 是强但是 TPU 是更便宜更稳定更可控的选择所以大家可以这样的去理解谷歌的这套 AI 的策略 Viu3 是内容生态的 AI 引擎
Mariner Lite 是浏览器里面的操作系统副本 AI Mode 是广告收入的加速器 TPU 是成本的护城河 GPU 只在特定的 2B 的场景去保留
那么这个就是谷歌的 AI 策略的主轴自研芯片加产品闭环加推理优先加平台整合那么它的底层逻辑已经不是做一个更强的模型了而是让每一张 TPU 卡都能用在刀刃上我们不是看谁建的快而是看谁能把算力真正的变现附用和控制住
好了 这个是左兜进入兜我们下期播客再见拜拜