智能提升是唯一的主线智能本身就是最大的应用所以我们还是要围绕智能本身去投入和思考我觉得今天还是要喊一下大家还是要重视 Print Training 我觉得这个才最本质所以进入 2025 你首先重新又坚信了 Print Training 了 Mirror 可能代表另外一个意识形态
Mirror 其实是比较欣赏梁文峰的他觉得 AnthropicOpenAI 可能是代表一个叫美国的精英思路必然这帮 leadership 有道德约束所以 AGL 不至于
做坏事但 Mira 可能更信奉一个开放的 AGI 他觉得这个 power 应该交给社区我听说他们可能在 DeepSeek 和 V3 的基础上做 post-train 因为他们 post-train 已经特别强未来再做什么 mid-train 还有 pro-train
大家好,欢迎收听张小军商业访谈录,我是小军。这是一档提供一手高密度信息的商业访谈节目,很多人都在催更全球大模型季报,那 2025 年的第一集,在 Q1 的最后一天,终于和大家见面了。这一集,我们来看看,
这一集广密依然带来了信息满满的有关于全球大模型最新的前沿认知经历了最近几个月全球 AI 格局的巨变它最大的变化是重新坚信了 Pretraining 预训练认为只有 Pretraining 才能决定模型内在的上限 涌现新能力而 Posttraining 和 RL 也就是后训练和强化学习只能是加强
在这一集季报中,我们对于 Q1 的全球明星 DeepSick,作为模型到火者的 Mainas,OpenID 延误弹,硅谷的认知分歧与价值观,未来的范式及新路线都进行了一一的讨论。更重要的是,它更新了在一位 AGI 原教旨主义者的眼中,AGI 的主线珠峰与路途。
希望我们的全球大模型季报能持续地陪伴你如果你对全球大模型季报的购网单机感兴趣欢迎前往商业访谈录的第 54 64 69 73 和 86 集收听那 2025 期待我们和 AI 共同进步哈喽广秘先给听众朋友们打个招呼哈喽我是广秘
今天这集是我们全球大模型季报的 25 年的 Q1 季报那这个系列呢我们希望通过一手的 AI 信息帮助大家了解全球大模型在这个季度当季最前沿最重要的技术进展与行业动态如果一个季度只听一集有关于全球大模型的播客我们希望是这个系列那不管你是对 AI 有深度思考的从业者还是科技企业的重要 BGC maker 我们都相信这个系列能够持续的帮助到你
广秘你对我们这个系列节目有什么想说的吗持续为 AGI 步道吧我觉得这个很有意义然后希望输出更多的对 AGI 的思考
和非共識認知多討論一些矽谷的創新洞察然後啟發大家有一些全球全球化的視野進入到 2025 年好像比去年更倦了我感覺時間明顯穿梭的更快了 AI 競爭的格局是飛速的在轉化格局沒有一天穩定過今年 Q1 剛剛開始不管是 DeepSeek、Minas 還是 Croc、GBT4、O、Cloud3.7 似乎都不斷的在改寫全球的 AI 的格局
今天这期节目有什么是我们可以期待的我觉得最重要的还是希望给听众理清楚 AGI 的主线和主风吧哪些是真正重要的我觉得值得重视的传递一个从 AGI 的原教旨主义思考的一个路径吧
你是 AGI 原教职主义对吧我觉得是相信吧开始我想先问你一个问题因为今年大家都在喊 AGI 的应用觉得是应用爆发 AGM 爆发的元年那你花了很多时间在研究 model training 的本身你觉得机座模型的竞争结束了吗我们还应该花多少精力关注在机座模型的进展上其实我也听到过另外一种观点就是说现阶段放这么大精力关注模型其实没有必要还是应该把时间投入到真正能用的应用上你怎么看啊
今天最大的共识就是 Pertune 结束了其实今天最大的非共识也是 Pertune 空间还非常大甚至说刚开始还会迎来新的能力涌现我是有很强的信心说 Pertune Base Model 这个 scale 远远没有结束就是下一代的 Sulta 模型还是能显著 Beat 今天的 Sulta 然后不管说今天的 4.5 也好 Gorax 3 也好 Sonic 3.7 也好或者 GemNet
我觉得之前说 Protrain 结束的共识我觉得很大原因可能是 OPI 的 Protrain 进程慢了其实 Anthropia 也好,Axia 也好我觉得他们还挺快的因为 OPI 之前是领先者对吧那领先者表现的就容易被认为是正确的共识但
当领先者不再领先我觉得这个也是非共识了我觉得要重要强调的一点就是只有 Protrent 才能涌现出新的能力其实 Post-Trend 和 R 呢其实是不涌现新的能力的它只是激发出来或者加强能力我觉得基本上 Protrent
决定了模型内在的上限后面再怎么做 post training 相关的 RL 相关的我觉得也只能做到 Perturne 内在的上限所以只有 Perturne 阶段把 base model 的能力往上提提上去我觉得才是最本质的不然你在一个很差的 base model 上
做强化学习其实就像小学生刷题嘛其实很容易饱和坚定的我觉得只有 Pertrand 才能把小学生本质上变成初中生我觉得 O 系列其实就是刷题其实我们在半年前那个博客就喊 Hour 的范式嘛当时说
有 50%的概率结束了我觉得就当今天所有人都在聚焦去弄 R Resonate Model 的时候我觉得今天还是要喊一下大家还是要重视 Pre-training 我觉得这个才最本质所以进入 2025 你首先重新又坚信了 Pre-training 了对那从外界看 L1 好像没有那么重视 Pre-training 了你觉得是这样吗原因是什么样我觉得也可能不是不重视吧其实从外部观察我觉得
一个可能是战略选择另外一个可能是组织问题我觉得从战略上来看呢你看一个是欧系列它在 benchmark 上走得非常快的其实欧系列可能两个月刷分的收益就比 Pretrain 一两年的收益
要来的快的我觉得另外一个就是 TRADEGP 的增速也是非常非常快的我觉得这个是很恐怖的而且在加速我觉得 TRADEGP 肯定也占了管理层很大的精力吧我觉得这是战略上我觉得第二你从外部的组织上来看我觉得从外部观察也是
OPI 的核心团队是一直挺动荡的那个最早 Anthropic 的 Dyrell 带走一批对吧 EDIR 力开对吧那个 CTOMirror 又带走核心 Post-train 的人包括那个最早比较核心的 Infer 的核心的核心吧那原来的 Post-train 的人呢就得不断地调到 Post-train 我觉得团队动荡还是比较大的我觉得组织也是一个很大原因
所以他们可能不是 top-down 的不重视 pre-training 了而是因为组织调整的原因显得不那么重视 pre-training 了我觉得 OPI 是一个自下而上的公司吧就是做 pre-training 的好的人都走了我觉得是的我觉得 Anthropic 和 XI 的 pre-training 团队是要比今天 OPI 的要强所以 O 系列其实虽然做得很快但是它不一定能打开智能的天花板我觉得是加强嘛
现在能不能打开我觉得没有标准答案既然 O 系列做的很快为什么 Perturining 还要继续呢之前不是说数据不是很够用了对你看 23 年我们就在提合成数据对吧但其实今天很少有人提合成数据了其实但今天恰好又是 RO 产生更多合成数据尤其是高价值的 COT 的数据对吧而且可以加到 Perturining 的环节里头或者说可以从 Perturining 阶段
就做 R 我觉得这个就解决了 Data bottleneck 的问题因为这个其实挺难的因为这里要涉及到训练框架的 infra 有问题其实 training 和 R 的 inference 我觉得要融合这是一个挺难的其实要求 GPU 里同时跑
R-O 的 inference 的 sampling 和 training 其实之前 training 是一套框架 inference 是一套框架那其实今天要融合其实这个对 inference 难度挺高的我觉得大家突破这个问题还是花了挺长时间的外界认为 print training 收益是放缓的投入产出的 ROI 也不能够明显继续投入 print training 还能带来你觉得巨大的突破或者新的能力涌现吗
我是很期待新的能力影片我们就举个例子比如说今天的 Toyos 工具调用对吧其实今天模型的 Toyos 用电脑的用电脑上工具的水平其实还是我们帮忙用电脑的水平我觉得后面很快可能就到了熟练程序员用电脑的水平其实 Agent 就可以在电脑和手机这种数字环境下完成人类操作电脑的绝大部分的行为了甚至说你都不知道
不知道怎么操作的其实你看绝大多数人用 Excel 公式这种能力其实是不如 agent 包括整个 Windows Office 里面可能有上百万的功能点其实 agent 都可以调用的飞起的你比如说 minus 是很依赖 2Use 这个能力的我觉得可以说 minus 就是 Anthropic 2Use 能力的叫 ChatGP moments
Anthropic Cloud 他们模型是非常重视 tools 的就是他们专门做了可能得有几百个 tools 专门的训练因为他们又是只 focus 到模型能力的提升也不太着急做产品我觉得 Mindless 其实对
Cloud 模型的理解是非常非常棒的执行力也非常强其实这样呢就让外界第一次感受了 To use 这个能力的叫 Magic Moment 我觉得就好像 OpenAI 当年做 XGB 一样的我觉得其实很多这种叫 Magic Moment 可能还是要要靠模型内化的能力才能推动的我觉得 Pertran 阶段是最关键的
我觉得大家还要有个 sense 就是智能无上限我觉得一定会持续变得更聪明的其实我们每一年回看过去一年其实智能技术变化是很大的我觉得 Anthropic 的 to use 能力的 charge peak moment 为什么不是 Anthropic 做的而是 Mainas 做的就是为什么是不是模型公司做的而是一个外部的产品公司做的当然小红说他们先做好那个产品的壳在外面等着模型能力变强
我觉得 OPI ENTROPER 都没有预期到今天的 Agent 来的那么快其实他们还没有完全做好准备模型公司没有做好准备我觉得模型公司和云厂商都还没做好准备你觉得站在今天看实现 AGI 是变得更清晰了还是变得模糊了我对两年内实现 AGI 是前所未有的信心我觉得在我看来是百分百的概率为什么这么快在两年之内这好像比之前的预期更快而且为什么是前所未有的信心信心的来源是什么呢
我觉得离 AGA 越近其实 AGA 就没那么神秘了我觉得最重要的是想明白一件事就是 coding 可能是实现 AGA 最好的环境其实 coding 的意义不在于编程本身而是在于这个环境嘛就
现实世界绝大部分的任务可能都可以通过 code 来表达我觉得 coding 可能就是叫数字经济 GDP 活动最重要的一个环境其实构建这个环境是非常重要的其实 AlphaGo 当年的棋盘就是它的环境百度是通用搜索
这个 index 整个网页其实淘宝就构建了一个商品搜索的环境对吧携程构建了一个旅游产品搜索的环境 Boss 之聘可能就构建了一个工作搜索的环境其实 coding 这个环境是非常通用的一个环境就是我比较好奇一个问题就是大家会觉得数字经济 GDP 和实体经济 GDP 未来的占比会怎么样
就是在没有互联网之前百分百可能都是实体经济我觉得未来是很极端的如果我们只看增量的部分增量的绝大部分可能都是数字经济 GDP 就是会是实体经济 GDP 的我觉得成千上万倍的那未来人类的经济活动大部分都是数字化的表达其实最后都可以用 code 来表达而且
agent 是可以调做物理世界的人和实体去完成很多事情的其实我觉得 coding 可能就是模型的一个手你看 minus 也给 agent 搭了个虚拟的电脑环境 agent 来操作电脑的工具我觉得两年以内 agent 能操作电脑和手机这种数字环境
他的能力是绝对超过 99%的人的能操作人类正常操作 99%的行为的而且操作比人好啊
我觉得这个是不是就是 AGI 了我觉得两年的一定会实现的我觉得几乎没有什么障碍你这个表达很有意思啊就是 coding 是环境 coding 是模型的一个手可以怎么更好地理解这两句话特别是这一点比如说在 anthropic 上是怎么体现的呢我觉得 coding 是环境好的环境我觉得有两个比较重要的特点一个是动态的另一个是可操作吧需要环境不仅包含数据包括一些硬规则还能让模型
能执行他的想法而且要得到一些实时反馈我觉得能符合这种环境要求的主要还是 codinggamingscience 相关的吧我觉得 coding 是最通用的赛博世界的环境吧 coding 是最通用的赛博世界的环境模型的一个手呢其实就像人类通过手去操作物体改变环境
其实模型通过生成执行代码来实现对外部环境的采集处理反馈我觉得这是比较像手的原因我觉得 Anthropic 他们的模型还是设计了很多 2U 的脚手架放到这个环境里头就帮模型更好地理解环境并且操作比如 OS World 包括 Computer Use 包括把在环境中的
R 的 synthetic data 未回给 Pertran 我觉得都是比较重要的现在这么多大模型的厂商哪家模型的 coding 做得是最好的我觉得现在每个模型公司都越来越重视 coding 了但我对 Anthropic 的信心也是前所未有的强吧我觉得 Anthropic 还能在 Pertran base model 上取得显著进步吧
下一代模型的 Solta 然后继续保持或者加强在 Coding 里头的领先优势我觉得 Coding 也是 Solta 吧其实你看 Cursor 现在是最火的那个独立的编程工具 IDE 了他们的 AR 已经超过 150 个密令了我觉得年底可能 4 到 500 个密令 Sonic 已经编成 Coding 的默认模型了我觉得这样的话其实你看 Cursor
一个月可能要给 CloudSonic 要付个一千多万美金的 token 费用其实这个可能得是第二名 OpenR 的四到五倍的我觉得这个是开发者投票了你觉得 OpenR 为什么没有做好 coding 这反而给 Anthropic 留了机会我觉得这个可能不是技术问题我觉得以 OpenR 的能力和认知其实肯定也会很重视 coding 但其实过去了一年左右了
还没做好我倾向于是战略选择和组织问题其实做好 coding 要么就是在 protrain 阶段 code 数据集上花大量的时间和精力你把一些实战型的数据做得更细比如说各种的标注对吧其实可能有人两年前就做了几百个门类的细分了但今天可能有的人也只才做到几十个门类的细分要么就是有全新的方法你比如说
R 的方向对吧但我感觉这个还是需要 leadershiptop-down 的一些战略决定和组织能力吧我觉得当然也有可能就是 OpenCoding 能力今天还没体现出来可能未来也许什么时候发个大招也是有可能的其实我觉得 Coding 是一个 Trillion dollar 级别的机会我觉得只要 AnswerPay 能在 Coding 持续领先我觉得 AnswerPay 是有机会到一个
三五千亿美金我觉得 Cursor 这种都有机会到千亿美金的我觉得 coding 是一定会出来叫抖音拼多多微信级别的机会的
所以你觉得他们怎么变成这个 one trillion 或者 ten trillion 的这么大的规模如果到 one trillion 或者 ten trillion 的话我觉得要在 AFO science 实现突破了吧其实你看一个减肥药每年都能卖千亿美金的营收对吧那未来攻克癌症治疗所有疾病我觉得就是十个题了其实全人类在健康上的消费要比今天在手机上的消费
我觉得要大概十到一百位听起来 coding 更像是一种技术手段但最终 coding 会成为最好的产品表达吗它的产品形态会是一个 coding 的形态吗还是它只是一个路径
对 我觉得之前咱们播客其实提到 coding 是比搜索引擎和推荐引擎我觉得更重要的一个东西其实你看推荐引擎它的表达就是信息流产品 对吧那因为 coding 编程这个事其实本身是高门槛高动机的用户才能用好的一个产品形式
其实如果做消费级产品的话其实要淡化 coding 这种编程的元素的吧就用户门槛太高了嘛我觉得产品表达是一种内容或者交互形式吧因为抖音也不说自己是推荐引擎产品嘛因为他说自己是短视频产品嘛我觉得把 coding 当一个技术引擎比较好最后的表达可能
就是它的信息流產品我覺得今天還沒有定義好因為最近 Notion 的首席設計師加入了 Cursor 我其實挺期待 Cursor 在新的交互表達上能做出來新東西的包括 Cloud Code 所以 Coding 其實是可以對標成搜索引擎或者推進引擎但產品可能是百度或者抖音就是今天的百度和抖音沒有找到我覺得是的
现在看这些领先的模型公司大家在实现 AGI 的路线上有差异吗你看 OPEN 和 ANSORRY 是叫同宗同源最开始的路线都是一样的但走着走着呢其实核心战略的 BAT 或者路线已经发生很大变化你看 OPEN 现在核心的 BAT 我觉得是两个一个是 OPEN 希望通过 O 系列或者 Resolute Model 就实现 AGI 第二个 BAT 可能是希望
ChatGP 做成一个十多亿活跃用户的一个 K-Lab 去掀翻 Google 那 AnswerPay 核心的 bytes 呢我觉得第一个是他们很专注做 Prior Training 继续 byte on prior training 有一个很强的 base model 我觉得继续 byte on coding, byte on agent tech 我觉得大家 leadership care 的还是不一样的 OpenAI 更 care
R,Resident Model,O 系列对吧 Anthropic 跟 Care Based Model 和 Coding 我觉得大家都有自己的 focus 和路线了然后包括你看 OpenAI 更重视 C 端市场 Anthropic 更重视 B 端市场那 OpenAI 我觉得还是一个自下而上创新的组织文化 Anthropic 是一个自上而下创新的组织文化 OpenAI 和 Anthropic 为什么会出现这样的分化从同宗同源慢慢地走向两条路径
我觉得也可能是 Anthropic,Dirial 他们就是做 Pertuning 出身的所以对 Pertuning 非常有信心我觉得大家可能都有自己的路径依赖那你看 OpenAI 这边呢是他们最早的 Frontier Team 做出了 O 系列 GT 那 O 系列非常亮眼对吧那 Frontier 的老大呢
我觉得战略选择我觉得
我觉得战略选择本质上是不同组织能力的表达吧它也是不同的人的表达就是可能就是公司内部有 Pretraining 和 O 系列两股力量然后 Pretraining 的人被削弱了 O 系列的人就放大了所以它也是组织能力也是人的表达是的你觉得 O 系列能走到哪呢像比如说从 O1 开始然后到 O3 O4 O5 继续走下去它的天花板能有多高
其实 O 系列刷 Benchmark 刷的特别快但我不确定这是不是够本质说实话我其实也不知道 Risley Model 的落地场景到底是啥因为它的主要表现还是 Math Code 对吧其实 Math 数学这种好像没啥落地场景没啥市场然后我感觉主要还是 Coding 就是但这个 Coding
但 Risning Model 提升的 coding 我感觉好像也不是那种叫实战性的 coding 他们有点偏竞赛性的 coding 我觉得 Sorry 做的还是实战性的 coding 更多一些这个要回到数据上你平时在硅谷你觉得硅谷对于现在这些不同的技术路线认知有什么分歧没有我觉得分歧很大分歧这个问题背后的本质是流量重要还是智能重要是的
就是 OPI 有非常大的流量 Anthropic Cloud 几乎没有多少 C 端流量我觉得这一点硅谷的分歧很大我觉得也是有表现的就是硅谷很多的 VC 呢像 Square US 的 Rulef 包括 CostlaVenture 的 VNode
这一派都觉得 OPEN 应该今天变成一个大型的消费互联网平台公司他们觉得模型训练的资本效率很低对 他们最近发了篇文章也专门聊这个 是的其实我觉得他们是错的然后我觉得这帮老牌的投资人他的 taste 都喜欢经典的商业模式其实今天 AA 的商业模式都很差的 讨论不清楚我觉得今天还不是讨论商业模式的时候我觉得还太早期了
我其实有点担心 OpenAI 过早的走向一家消费互联网公司我觉得今天产品和流量其实没那么重要我觉得即便重要也应该在模型训练的优先级之后吧我觉得大家认知分歧真的是挺大的其实每个人都有自己的信仰吧然后也有自己的 bias 其实我更相信 AGI 的原教制主义吧就智能最重要我觉得在构建一个 Google 除了赚钱好像意义也没有那么大
其实今天是人类少有的一个窗口去 push 智能我觉得杠杆效应是非常强的我觉得可能资本家在 AGI 的范式下
这是一个研究驱动的方式我觉得很多判断产品和商业模式的惯性都是错的我看到你说你觉得有点失望就是 SAM 竟然把 11 用户作为首要目标而不是 AGI first, research first 和 model trailing first 去 push 智能的边界为什么呀
我觉得今天智能其实是很早期的阶段不能停下来因为今天 OPENHIDE 的杠杆效应是很大的你看几千个人改变了几十亿人我觉得不应该把构建一个新的互联网平台当首要目标的我觉得 push 智能才最高的目标今天还有太多问题没有解决了对吧攻克癌症让世界上没有疾病我觉得 OPENHIDE 是有机会
对人类帮助非常非常大的其实不应该降低对科学的这个 vision 我觉得过早追求商业可能会错过一个叫 AGI 科学的文艺复兴吧你觉得 Anthropic 和 OpenAI 这样不同的 Bat 最后谁会是 Winner 呢我觉得谁是最终的 Winner
可能取决于智能的水平走到哪就各家模型能不能拉开显著的差异我觉得核心的就是你的 base model 能不能显著的领先其他人如果智能往前走的很强
就显著领先了,我觉得就会有流量迁移的其实那个时候我觉得流量是没有忠诚度的我觉得这是很关键的一个问题就是 base model 能不能显著领先其实你看 Google 在模型上是无法显著的反超 OpenAda 每次 Gemini 发点东西,SAM 都狙击了其实你看 Gemini 后面模型做的很好,但流量其实一直上不去的
就过去一两年整个 Chad Bull 的流量几乎大部分都还是去到了 ChadGP 其实这个本质还是 ChadGP 它的 base model 过去是有相对的领先优势的它是把技术的领先优势转化成了流量的其实我也觉得
Anthropic 的 road map 是很好的我觉得长期有可能 Anthropic 是比欧盘更有价值的公司我是有一定的 bias 的就是我比较相信 AGI 的原教旨主义我其实更关心谁重视 pre-train 谁能更先大幅的 beat 对方的 base model 我觉得 pre-train 一旦放松了或者降低优先级了后面其实挺难追的我觉得
RO 也好,Resolute Model 其实是容易追的我觉得一旦 Sorprey Percent 做出来更强的 Base ModelOPAN 再从 RO,O 系列切回来我觉得是难切的吧我觉得外部视角来看
OpenAI 可能对 Pretrain 我觉得重视度是不够的我觉得过多精力在 Resolute Model 拆机器的 C 端各种 features 我觉得我看来是不够本质的但我也觉得大家的路线差异其实是无关对错的其实这两家都能实现 AGI 大家都是去盘珠穆朗玛峰对吧
我觉得今天 AGI 的科学探索每天都是在突破边界的我觉得每个团队都要敢于 Bite 其实把你 Bite 的东西 Push 到极致我觉得就是其实回头看 OpenAI 我觉得对行业贡献也是非常大的虽然没有开源但我觉得路线也是 Open 给大家指明了路线对吧其实我觉得我们还是一定要非常的尊重和 ValueOpenAI 对整个行业的贡献的因为这个领域我觉得竞争太激烈了其实
他们差异化的表面是战略选择我觉得本质还是组织能力的表达差一举啊你像国内那有 DeepSea 这样在 push boundary 的公司了它又是开源的你就其他公司还有必要继续 train 自己的避孕模型吗还需要那么多人一起去 push 的 boundary 吗我觉得是需要有很强的 training 的能力的如果你没有很强的 training 能力你看不到很多的风景很多东西
自己做才知道的但还有一条路线就是你可以先从 post training 做起甚至做 mid train 最后再 press train 我觉得最后还是要有比较强的 training team 因为你不然你没法向下改模型应用公司需要做这些事情吗我觉得想做大的应用公司是几乎一定要做的
长期来看像你刚才说智能还在很早期的阶段但是另外一些人就觉得现在已经很聪明了现在已经够用了并且他觉得模型的上限可能也就到这了吧但是你已经足够应用了你觉得这两种认知的本质差异是什么我觉得是想象力的局限然后其实你看人类在没有汽车之前最多的想象力就是一个更舒服或者更快的马车
人类一直在围绕马车做了很多的工作但是今天就是福特 T 型生产线已经滚滚而来我觉得今天可能就是福特 T 型生产线大规模生产智能的前夜了那你后面人类又发现竟然还可以坐飞机还可以更快我觉得就是想象力你有没有观察到现在就是在这一波 AGI 的浪潮下越是年轻人越愿意相信就是智能的边界无限
我觉得想象力可能跟年龄有关所以说年龄越大想象力反而会递减你有这种感觉吧我也有的刚才你一直在提 AGI 的路线图 AGI 的路线图是怎么样的特别是在一个 AGI 原教旨主义的眼中的 AGI 路线图是怎么样的能不能展开说一下我觉得 AGI 的 road map 这个是我最想表达的
AGI 探索我觉得就像爬一座科学的高山最后谁能到珠穆朗玛峰我觉得大家是要思考 AGI 登山的这个主线是什么哪里是珠穆朗玛峰对吧我最近脑子里反复想的就是一句话就是叫智能提升是唯一的主线智能本身
就是最大的应用所以我们还是要围绕智能本身去投入和思考其实你看 ChatGPT 走到 3.5 它有了通用翻话性就解锁了 Chatbot 这个对话的能力 Cloud 走到 3.5Sonic 就解锁了 coding 能力跑出了 Cursor 对吧
今天大家都在解锁 agent agentech 这些东西未来可能还有 science robotics 对吧我觉得大家脑子里可以有一张图 AGI 探索就是攀登科学界最高端的山今天回头看 XGPT 只是这座高山山脚的第一站后面还有很多个山头 coding agentgeneral agentafor sciencerobotics
我觉得这几个关键词都在这个登山的主线上有可能多摩泰对吧 online learningmultiagent 我觉得大概也是在主线上的就这样你能画出来一条登山的路线图每个 milestone 都有一些代表性的名字对吧那些名字可能是 gpt3.5gpt4chagpt 对吧 cloudsonic3.5openhoad o 系列 deep research 对吧 cursor 也好 divin 也好今天的 minus
我觉得今天回头看 Chad P 也好 Chad Bolt 他是个必然也是个偶然但我觉得 Chad P 只是个前菜接下来的 Agent 才是正菜就是我觉得 AFO Science 科学探索我觉得才是那个珠穆朗玛风吧真的攻克癌症或者治疗人类几乎所有的疾病他会创造一个叫
全新的经济增长消费增长的最大驱动力吧你看我们爸妈未来会为什么付钱手机上已经付不了多少钱了我觉得爸妈和长辈未来都是愿意为健康和身体去买单的我觉得这会是消费的最大的来源吧
其实你看这个路线图里面我们没有把 Sora 放进来我觉得视频生成我觉得生成可能还不是今天的主线我觉得文生图可能也不是主线有可能这是欧派的烟雾弹那个我觉得多么太理解是主线但研究上还是需要突破的这个突破的时间点不确定是在
哪个点上但感觉不用太久你觉得多摩他的理解是主线但是纹身图不是主线因为他不产生智能其实他也代表智能但我觉得他不是实现我觉得原教旨主义那些智能对还是基于语言本身能产生智能对另外一个我们站在用户的视角看其实智能涌现或者登山就是一个个的
Magic Moment 你每爬升几百米用户就看到了不同的风景用户这种可感知的差异其实就会带来巨大的流量迁移和应用爆发的机会其实 ChangeP 就是这一波技术革命最开始的那个 Magic Moment 对吧 Color 3.5Sonic 也是 Minus 也是 Sour 其实也是有那个 Magic MomentAlphaGo 最早也是对吧我觉得随着 Model Scale
带来更多的智能涌现我觉得用户会有持续的这种感知的差异其实一旦那个感知差异非常非常大其实就会迁移的所以我就在想 OPPA 的 ChangeP 真的有壁垒吗就是之前我们提到 ChangeP 新制和品牌是很强的护身盒但本质上这个护身盒
我觉得有可能是很低的因为今天做 AGI 的模型公司也好产品公司也好其实都没有绝对壁垒的因为技术进步太快了我觉得是这个壁垒护身盒还在沙滩上是没法构建的就是如果技术上突然好十倍了比如说出来一个多模态版本的拆 GP 或者 Agen 的范式下的
TrashGPT 对吧或者说 Manus 这种可以大规模的开放使用我觉得有很多地方都是能大幅的 beatTrashGPT 的用户体验的我其实对未来两年出现好十倍的技术是有前所未有的信心的所以我觉得今天还是围绕智能的主线今天最重要的事情我觉得还是 push 智能能力本身往上走吧我觉得做应用的是要构建一个环境或者容器承接住
研究一出的这个智能的红利研究一出的智能红利今天是最运用我觉得最大的红利以前是 mobile 手机渗透的最大的红利其实 DeepSeek 就看出来这个去年下半年我们以为国内的这个一二名已经差不多定下来了但 DeepSeek 一出还智能水平在那个时间点是最好的然后就带来了产品的爆发但这个是终局吗这也不是终局这也是动态的其实你看 DeepSeek 的 chatbot 那段时间流量增长了
非常恐怖如果他接下来有可能今天都上一 DAU 了有可能是可以跟 ChadgeP 把手腕的但是 DeepSick 选择了放弃为什么我觉得一方面 DeepSick 今天的组织文化决定了战略的表达其实组织能力如果他接下来就需要一个产品可能更适合字节更适合 Meta 这种对吧第二呢
今天 Chad Bolt 它的商业模式变现效率产品形态有可能都不是最本质的其实智能本身还是最本质的那智能今天的收益还是更可观的那其实应该选择继续铺施智能我觉得今天看放弃我觉得是可能是对的那除了说哪天 Chad Bolt 这个产品发生了一些质变我觉得放弃是对的看起来你在之前的这个路线图上把 Robotics 放在了 Science 后面这个是为什么呀
因为现在机器人非常的火啊为什么你把它放那么后我对 Robotics 态度也有些变化我觉得从第一性原理看今天做 Robotics 的 Foundation Model 或者 Research Lab 我觉得做法上也不够本质第一你看数据上那个 OPPA 或者 GPT 语言模型能有这个 Skilling Law 其实它有一个 Common Core on 这个数据集
就持续的抓互联网上的数据对吧但今天机器人的数据采集太低效了就是人操作几十台设备对吧每个小时成本可能都几十上百块比如说你要采集一个小时有效的数据这个可能要几亿美金的成本其实这个 skilling load 验证成本是很高的我觉得其实先期待一个就是 robotics 领域有没有一个通用的或者垂直的
common core 的一个数据集出来第二个你看算法结构上今天大家还没有达成一致底层算法到底是哪一个其实我觉得今天是没有共识的今天其实还没找到有通用泛化性的架构出来我觉得从第一性原理出发其实我觉得未来可能今天的语言模型这个 Foundation Model
它的动物态能力强了现在数字世界实现 AGIAgent 可以看电脑的屏幕执行各种 2D 的操作未来从一个 2D 世界走向 3D 世界我觉得是比较自然的一个过程那个时候对各种硬件的依赖度其实也降低了其实电脑也是一个硬件载体对吧我觉得应该让 AI 去适配各种硬件对我对
因为 AFOscience 的预期是更高一些的其实说实话我觉得上一波 AFOscienceBioTech 我觉得是真的没找出来什么好药我觉得现在是有一个可能性大幅的 push 这件事的就你比如说最简单的你在试实验之前今天是可以搭出来一个干实验的环境的用 agent 构建一个叫虚拟的实验室就是变成一个 platform based
也更容易 skillable 对吧那个我觉得 AI for science 现在还是有一些那个明显的趋势的就是三藩现在还有挺多创业公司我觉得聊了一些有一些感受就是说比如说像 self-driving 的这种 lab 其实是在出现的就是叫自动化的实验室我觉得这个趋势还挺明显的然后各个垂直领域的这个 foundation model for bio 相关的我觉得也在出现的就包括
蛋白质级别的各种的结构模型我觉得也到了一个叫 GPD-3 moment 对吧就是甚至说基因组级别的虚拟细胞的这些放射性毛病可能也开始表现出了一些这个智能吧然后我觉得比较有意思的就是说如果构建一个
一个虚拟的实验室我觉得这个实验室自己是可以驱动非常多的工作的你比如说第一个可能是工作流对吧各个地方都可以提效因为每个生物化学的 PhD 它都有特别多的重复性的工作其实 Agent 是可以 cover 很多他们这些重复性的工作各种工作流的其实是让这些 PhD 的带宽
这个 capacity 大幅的我觉得放大的其实相当于把你的 lab 的这个 batch size 就加大了嘛那试试验今天我觉得还是比较难替代的但我觉得能做到试试验之前的这个 sampling 的 size 和探索空间变大我觉得这个也蛮有意义的吧我觉得第二个还有一个小的趋势就是叫非垂直领域的 Fantasy Model 也出来了不管说蛋白质
RNA 对吧就是因为过去这些场景都要靠很多的专家的 trial and error 这种感知对吧对这个各种什么序列理解更强我觉得这个领域是容易出现叫 superhuman 就是这个我觉得在 science 领域是挺值得想想的就是我现在是花了挺多精力开始学 science 的我觉得 2027 年有可能是
afs 爆发的实验点吧嗯我我这两天看到那个艾伦朱朱小虎他的嗯的有个新闻标题叫做他们正在全面推出人型机器人公司你对他这个判断怎么看啊因为我觉得观点这个分歧还挺大的有一部分人就投了很多机器人公司有一部分就彻底不投不看其实咱们播客之前两期播客我感觉都提过机器人
我觉得跟自动驾驶有可能还是这个技术成熟周期是比较像的你看 15 16 年就在提自动驾驶现在 10 年了还没有大规模落地我觉得 robotics 肯定还是有技术的拨空拨骨需要一个成熟的过程我觉得第二个就是刚才提到的从第一性原理的角度来讲
确实是不成熟的我觉得它的成熟还是需要很多的研究工作去看到所谓的 magic moment 我觉得这个是需要的你比如说泛化性今天是没有看到的语言是有泛化性的最终真的需要物理的机器人吗如果虚拟的 agent 可以做非常非常多的事情真的还需要物理的机器人吗你怎么看现在这些软硬体的应用包括眼镜其实我更看好手机持续变得更强
你不看好只能眼镜的替换手机对吧我觉得绝对不可能替换手机最多可能是一个加强我觉得眼镜今天更像一个 gopro 一个摄像头可以记录一些东西我比较难受的点在于就是如果又有眼镜然后又有智能手表然后又有现在有指环然后有手机一条垃圾短信它会在各个渠道推送给我我觉得很烦是我觉得 AGS 但是手机只会更强是不会被削弱的为什么呀苹果很稳
对啊我们的 context 输入输出还是更稳的因为最后语音和端还是结合的肯定还是需要一个端我觉得手机已经变成人的器官了说了这么多智能本身是最大的应用智能及应用那智能的本质是什么对我觉得智能的本质这是一个极好的问题我觉得每个人都可以想一想我觉得大家也可以问一下 XGPCCloud 或者豆包智能的本质是什么我觉得每个人理解肯定不一样我觉得
大家有想法是我就可以打到评论区我其实挺好奇每个人对智能的理解是怎么样的就是从狭义的来讲你看可能就是归纳总结推理对吧这些细节那从抽象和宏大一点可能智能就是人类的进化你看人类进化可能我觉得就是三个关键词生存探索自动化
生存就是所有事情的基础嘛人类持续的探索就形成了经验形成了知识形成了群体组织甚至形成了国家公司制度我觉得自动化就是软件或者机械因为你自动化其实就是对探索之后的最佳实践的传递和标准化就持续的帮助人类把生产力持续提高嘛其实人类这个社会还有一个
reward model 就是金钱嘛就激励一些好的探索其实人类在有了金钱以后经济总量增加的非常快其实说明一个生态系统里是需要有这个 reward 奖励系统的就是为什么 AI 的
智能那么重要呢我觉得 AI 是能增加人类的探索空间的你比如说我自己是 ChaiGP Deep Research 的日活用户我每天至少问三五个问题就是它经常给我很多思路的启发我觉得是完全我自己是没有想到的就是之前我可能一上午调研一个 topic 我要 search 可能几百个网页我自己要读几百个网页今天我就交给它
现在一上午它可以平行三五个问题甚至更多的问题其实让我自己投资探索研究的 capacity 提升了非常非常多我觉得这是我做投研的一个生产力的我觉得人类是能探索更多的东西的未来无数的 agent 是可以虚拟出来一个地球的虚拟出来虚拟的实验室的我觉得数据和算力
是可以帮人类做非常多探索的我是比较认同 Anthropic Darrell 说的那句话的就是未来一个世纪的探索是可以压缩到五到十年的因为为什么刚才提 coding 呢我觉得 coding 就是未来 AI 的自动化探索的结果人类绝大多数的任务都是可以通过 code 来表达的我觉得每个人理解的智能不一样这里没有标准的我其实挺期待大家都说一说各自理解的
智能的本质到底是什么呢我觉得大家可以打到评论区或者有认识的朋友可以微信发给我我们一起来讨论一下智能的本质是什么那你觉得智能进步的衡量标志是什么我觉得有非常多就是一个可能就是解锁 AGI 应用的速度出来一个个的 magic moments 我觉得这个进程是在明显加速的我觉得未来 AGI 应用会爆发越来越多吧如果你说一个量化的
token 消耗量可能是一个你看一个 chatbot 可能对话可能比如说几千个 token 一个 asos 的像 populacity 他们可能一次大概几万个 token 但你看今天的 minus 他平均一个任务可能要消耗七八十万个 token 这个 token 消耗量
我觉得也是对乍干智能的一个表现我觉得还会有很多的标志就是说我觉得 AI 可能会做出来很多超过人类认知的行为你比如说模型开始写出来人看不懂的代码但这个代码就是非常的 work 我们也不用管它为什么 work 我觉得这个会越来越多为什么 minus 要消耗那么多 tokenminus 做的工作可能都是几十步几百步甚至上千步的那
他要帮我读几十几百个网页他还要调用很多次的工具而且调用的工具你每做下一步的时候上一步也非常重要可能还要再放到 context window 里头这个 token 消耗量是反复增加很多的这里的 long context 其实要求是更高的对他真的很快
在速度上是比人操作快很多的为什么到今天为止给我们的直观感觉还是 AGI 的应用爆发的数量比较少就是 agent 喊了这么久但是还没有出现当然已经出现 minus 但是还没有出现真正大规模使用的通用使用的 agent 我觉得很大程度还是 agent 的产品处于叫供给受限的状态
因为 agent 今天还是过度依赖模型能力的 agent 我觉得是一个新物种就是模型和云场上其实还没有做好 infer 的这些准备今天我就能说的算 agent 可能就几种你比如说 deep research 对吧它处理这种文本类的任务未来可能跟 operator 这些也集成
第二類可能是 coding 類的任務,devin 我覺得未來像 cursor 也好,openAI,anthropic 也都會做 codingagent 還有偏通用的,比如說 minus,anthropic 的 computer use,chargep 的 operator 我上次跟另外一個叫原教旨主義的朋友聊我畫的 AGI 的登山路線圖我覺得他有一個很好的描述
他说智能水平离 AGA 越近可能就越像宇宙大爆发今天你还能画出来单点一条线后面可能就没有这个单点了宇宙大爆发之后可能就是百花齐放全面展开了我觉得我是很同意的就是 AGA 的渗透今天是很慢但一旦到了某个临界点我觉得爆发性会非常强我非常相信
这个描述所以应用的多少和密集程度取决于智能水平是的黄瑞勋这次在 GPC 上重点也提了 Agentic 的新范式那关于 Agent 和 Agentic 的关键能力你有什么想说的吗我觉得有三个
agentic 的能力是非常重要的其实你看 agent 落地最关键的三个能力我觉得第一个是叫 long context reasoning 因为它要操作很多第二个我感觉是 tool use 工具调用的能力第三个是 instruction following 的能力就是指令遵循因为你做的任务很长你要把整个指令要理解而且要 follow 的非常好
其实这三个能力我觉得都是对应三种不同的 infra 能力的你比如说要给一个 agent 的一个环境其实这个环境其实可能就是给 agent 一个电脑一个虚拟机一个操作系统或者一个浏览器就是这个环境是非常重要的包括你要给 agent 的工具对吧包括 context memory
我觉得还有一个就是外界也经常提到像 planning 这个能力非常重要 resonating 能力也非常重要包括 action 其实模型内在的 planning 能力非常重要的因为为什么呢就是
模型要做多步骤的人物的时候其实模型自己要知道我哪一步能实现哪一步实现不了 reasoning 也非常重要的那个 coding 其实本质上我感觉是每一步的 action 执行的那执行也会用到 tools 我觉得指令遵循是非常重要的一个能力其实这个能力
Anthropic 的 Cloud 是我觉得断档式的领先的我觉得这个跟 coding 强我觉得是有很强的相关性的然后其实我们上一期播客应该提了 context 非常重要我觉得 context 现在是前所未有的重要我觉得未来因为最后要完成任务自动化你需要调各种背景数据对吧其实这些的数据都存在我们的
每个软件里面,你的个人社交软件,个人旅游软件,个人电商软件其实现在的数据就像你的钱存在的银行但这个银行还没有网银,这个要有一个标准的接口,把网银的数据要打通我觉得 context 里头其实存在支付宝级别的机会那这个 long context 非常重要,我们应该怎么更好的去理解它的重要性呢?
因为 agent 未来都是 long horizon 的 risking 对吧非常多的步骤假如说你要做 1000 步才能解决一个复杂问题其实后面的每一步都是要看前面的很多步的完成的结果的你也需要用 2yos 最后返回的东西就非常大是非常容易到一个 million 的 token 的
这个就需要 context window 非常非常长你能放进去 self-inflection 这种叫自我反思的一个进程我觉得真的 long context 有效的做法大家今天可能还没有实现的我觉得大家怎么解决还没有共识包括 Google 那个 1 million token 我觉得今天本质上也是大海捞针的也不是真正意义上的解决因为这里难点还是比较多的一个是数据上就是历史上
是很难找到一个 meeting 的同时推理的数据的因为要做 long context 前提还是有很多的 long horizon 的数据集的这个数据集其实不是现成的我觉得第二个是成本因为这个成本是平方级的往上增加的我觉得第三还是有架构今天的 attention 架构我觉得可能还是要改变的就是
我觉得再接下来可能 AGI 的 milestone 可能就是 long term 的 memory 就这个可能会取代 long context 就是因为你在场的 context 你开心的一个任务可能就没了 long term 的 memory 可能这个解决我觉得也是比较有意思的这个也是一个研究性的话题其实可能还是比较
不知道什么时候能实现的我觉得 Long Context 你可以理解最简单的理解就是你有了电有了智能以后这个电线需要铺得很长而且需要能耗很低要把这个电送到很远的地方那 MCP 就是一个插座那个标准的插座对吧那每个应用可能就会加电我觉得这样比较对我觉得 Long Context 在中局的时候是非常重要的就是
因为所有的 long context 技术本质上都是把一个很长的序列信息做了压缩那 linear tension 就之前我看博客也提到其实它主要的问题是
压缩是不够动态的它是压缩成一个固定大小再尝试从这个固定的尺寸里找到有用的信息因为今天压缩方式还是挺多种的有比较 sparse 的压缩你可以找到统计上的一些点包括 cluster 压缩也找到一些相似的
就 linear tension 其实有点像弗利叶的展开的这种方式吧就是一个名义上的表达的内容我觉得从根本上讲可能最理想的压缩可能就是把信息直接存到模型的位置当中我觉得也有尝试过 linear tension 的然后但这种压缩比可能也不够因为它本质上还是一个线性压缩然后位置是什么意思就参数
全住包括这个 Inference 的 Inference Time 的 Scanning 也是一个成本问题吧就是平方底线性因为更贵嘛对 Long Context 我觉得今天还不是一个有标准答案的问题大家都还在探索吧这个今年能解决吗还是一个更长期的问题希望嘛
你说两年内实现 AGI 这个确定性比较高是沿着就现有的路径再往下走吗对就能到对不需要新的路径我觉得是 26 年底 27 年初你觉得到今天为止 AGI 的定义有没有发生过变化之前我们第一期播客
可能就提过叫 EGI 的定义叫三个 90%在 90%的行业达到 90%专家的水平能做 90%有经济价值的工作我觉得这个定义是没有变的我觉得今天可以再加一个环境我觉得环境变了是在电脑和数字环境在计算的环境下有了这个环境我觉得就更清晰了如果现有路径不足以实现 EGI 还有可能有哪些新的路径吗
如果说未来还有范式级的路线我觉得 online learning 可能算一个吧就 online learning 的核心不是 online real time 可能核心还是让模型自主的在线探索和学习我觉得这个很像人类的生存方式就是在生存和激励的基础上有充分的好奇心一处的探索然后把好的一些 workflow 抽象做自动化形成自己的 workflow
我觉得目前的范式下能想象到的 online learning 就是让模型通过和用户的交互实施更新更小的一些参数但什么情况下去更新记忆更新 waste 我觉得今天也没有一个 reward 就是模型要达到什么样的目标也没有一个很好的定义我觉得这个是对未来的 agent 是有一定挑战的吧然后
我觉得这个 online learning 可能也可以用模型的微调去实现吧包括一些个性化的 laural 甚至说有可能是 multiagent 这种系统甚至说你可以定义好一个 memory 的 agent 来做出一个模型的记忆的能力当然我觉得刚才提的这些有可能都不能解决我觉得可能还有很多完全没想到的新的方法
我觉得来解决其实人也是挺难的因为每个人听到同一个内容他的总结体链记忆其实是不一样的这个很靠智力啊经验啊包括品位我觉得
智力是模型我觉得需要提高包括这个经验和品味我觉得也是挺重要的我觉得包括那个 Chatbot 的这种对话的产品其实它那个信号非常的稀疏其实在 Chatbot 的这种产品下做 online learning 的难度其实挺大的我觉得说的那个更好理解一点就是说你说人类本身的
reward model 到底是什么呢用来衡量一个人的如果真的找一个量化的那可能是金钱但金钱又不客观就是有钱人不一定是好人对吧穷人也不一定是坏人其实人类也缺好的 reward model 的其实历史上很多有钱人是没有被铭记住的反而做出了探索和突破的科学家
创新者是被铭记了对吧嗯然后我觉得 online learning 是一个特别值得研究的 topic 吧现在有没有谁研究比较好啊伊丽啊我觉得 memory 和 multi agent 最可能还都不算范式级的变化嗯然后如果
回到我们播客开头讲的把 Pertran 的 scaling 和 RO 的 scaling 做融合在 Pertran 阶段就做 RO 我觉得这个算半个范式级的创新因为大家领先的模型可能都在做了我觉得还有一个刚才你提到全模态的统一的架构多模态的输入多模态的输出我觉得这个统一架构的想象力还是比较大的
我觉得研究上需要做的工作还挺多的这次 GBT-4o 他能通过文本生成图片他有创新吗我觉得还是有的他这个就是全模态的可能是第一步或者前几步吧我就算吧很好看非常好看怎么理解这个每个路线的差异性我觉得你可以画一个坐标轴就是横轴呢是资源和精力的投入纵轴可能是智能产出的 performance
再画几条曲线对吧 Perspective 是一条曲线 R 是一条曲线你做的数据是一条曲线最后你就看这个坐标轴里头每条曲线的收益的走向以及每条线的天下板到底是怎么样我觉得你画出来之后有可能数据那条曲线收益是非常高的所以我觉得大家是要很重视数据的据刚才说的这些对于 GPU 或者英伟达的叙事有影响吗我觉得未来
可能会有两个叙事对英伟达的算力刺激是比较大的一个是 Pertunian 的叙事重新回来第二是 agentic 的 inference 我觉得它的对算力的消耗是一个比 Chad Bolt 是 1000 倍数量级的提升因为后面做复杂任务都是 multi-agents 或者持续的 inference 其实我对算力需求一直非常乐观
你怎么看最近甲阳青的公司要被英伟达收购英伟达在下一盘什么大棋啊我觉得最大的棋可能就是英伟达应该变成一个云厂商变成 AWS 和 Azure 但老黄要照顾跟云厂商的关系对吧放不开收价去干所以之前你看支持了很多 GPU Cloud 对吧 Core Rift 这两天上市了但这些 GPU Cloud 软件技术都非常拉爬其实比
AWS 和 IGER 差远了如果你让国内的火山引擎火山云去帮老黄做可能都有的一拼的我觉得其实贾云青老师的 Lapton 他那个全站的思路我觉得还是比较符合 NVD 要自己做云的战略的我觉得只能说贾老师 Lapton 卖的是非常聪明的读到了英伟达的需求
说到这里能不能总结一下上面我们所说的全部我觉得第一是对实现 AGA 有了前所未有的信心对 Protraining Base Model 持续提升有前所未有的信心第三是理清楚了 AGA 的主线和主峰我觉得第四就是对 Anthropic 也非常有信心我觉得有可能会是比欧凡更有价值的公司因为后面是 The Coding The Agentic 才能得天下版
对我刚才说的有一部分人他的选择就在当下这个环境下没有那么再去关注模型能力提升而去转向去关注应用看这个市场上是不是有更多的应用机会你觉得这个判断是对的吗你觉得这个选择是对的吗我觉得应该去做研究驱动的应用而不是用产品去拉动的应用 AI 市场目前有没有泡沫我觉得泡沫肯定是有的
但 agent 的泡沫还没开始你看 Protraining 有一波 hype 对吧过去半年一年 Aero 有一波 hype 我觉得第三波的 agent 的 hype 刚开始我觉得我们后面应该是有机会看到很多 talk 的公司 IPO 的我觉得是很正常的现在看起来 AGI 技术在快速的进步但是 AI 的产品和商业模式好像没有进步普遍的定价大概是 20 美元每个月
我也比较好奇为什么今天定价都是 20 刀对吧我觉得这个原因是啥是 copy 了 sas 的定价吗但 sas 它背后不会消耗大量 token 吗今天的 AI 产品都是消耗大量 token 你就相当于每家每户每个月电费都是 20 刀大家都是狠着用的对我觉得长期定价是偏低很多的你比如说我们照一个
投资研究员年薪 100 万对吧那 deep research 如果做得很好了我们是不是每年可以花 30 万给他 deep research 对吧我觉得是比较 make sense 的你可以让一个研究员的 capacity 变成三五个研究员的 capacity 会有绝对的通用的 agent 出现吗我觉得能不能通用取决于 Pertrin 和 R 这两个范式能走多远吧另外就看我们刚才提到那些关键的能力对吧
planningresonancecodingactionto useinstruct following 对吧 context 我觉得这些能力也都是通用能力了如果这些通用能力很强那我觉得有可能是不是也接近通用的 agent 但今天怎么做 agent 我觉得也是很大的一个非共识其实大家都是在不同的路径去探索的
reward model 泛化了没有我觉得泛化性是非常关键的但是今天的泛化性都非常的微弱接下来我们聊一聊模型的壁垒和商业模式以及模型和产品的关系那你觉得模型的壁垒和商业模式会怎么样我觉得模型公司的 secret 其实是没有保险期的因为公安区的人员流动还是比较快的大家带着不同的信息在不同的公司流动我觉得裸模型发布的时代可能会结束了
我觉得未来模型可能如果要构建壁垒的话可能是两个方向第一是成为云厂商 CloudOpenAI 自己要变成微软的 Edge Cloud 第二是形成 OS 操作系统养出来一个生态我觉得后面大家都开始打造 Operating System 了我觉得这个是
OS 需要软硬一体吗今天的硬件都是在云端的就是 GPU 它今天想做端我觉得除了手机今天是没有看到好的端其实我也在想 OpenAI 的商业模式到底是好是差其实也有可能是好的因为只要你定价能持续往上提升我觉得 2C 的坦白说比 2B 卖 API 的生意可能是要好因为毛利更高其实 OpenAI 还是占了比 IonSource 也今天更好的位置的
然后因为 Atology 它是真的在 batton 模型 pull train 的这个能力几乎不重视或者放弃了 C 端的流量我也不知道这我也不知道这件事长期看对不对吧那投资人现在应该怎么投 AI 的应用啊就是这些应用公司怎么构建它的壁垒和护城河我觉得投资人之间的分歧也是比较大的如果是投应用的话我倾向于
如果是研究推动的 research 溢出的这种产品和应用我觉得是值得投的如果是产品推动研究的我觉得是不值得投的我觉得今天应该花很多的时间去理解基础模型 research 这个研究的大的突破去承接智能研究的溢出的红利就应用创业者应该是叫倒活着倒出智能溢出的红利就是今天最大的红利其实
就是承接着模型研究结果的功力我觉得大家是没有护城河的今天想也想不清楚你比如说用户的这些积累的数据能不能用起来 Cursor,Property,他们积累了那么多数据怎么用起来第二我觉得是怎么构建一个独立的环境我觉得长期来看想做大的 agent 的公司
我觉得都是要具备向下去调整模型或者做 research 的这个能力的其实不然我觉得是容易被模型公司或者能向下调模型的公司会干掉的今天对于用户数据能用起来有结论吗非常微弱应该是没有大的用处它不能形成闭环数据飞轮今天 chatbot 收集的很多是叫偏好数据偏好数据更多去帮你 push 一些
MAU 对吧但是不提升你的模型能力提升模型能力的叫能力数据那能力数据是不在因为模型今天比绝大多数人已经聪明了闲聊不产生智能是常见来看模型公司会把这个产品吃掉就可能我们先做一个应用做一个产品在前面等着吃掉模型公司的能力那模型公司长期来看会反过来吃掉这个产品吗我觉得这个问题的本质是
一个 feature system 和一个 learning system 哪个更快其实模型本质是一个进步速度非常快的 learning 的 system 越来越多的能力和 feature 都会内化到模型上其实模型上面的脚手架
是每一次都要几乎持续的重制的其实套壳的价值我觉得是越来越小的但是我觉得会持续产生新的套壳的价值套壳的这种阶段性的价值都是存在的所以我觉得做应用做套壳应该执行力特别快退出也要快退了之后赶快去做下一个事情其实你看过去两年 Record 来看我觉得 Focus 产品驱动的公司绝大多数都失败了
Focus 模型本身的公司都成功了我觉得 Focus 模型本身不代表是一定要自己去 Purchase 模型其实你做模型的到货者也可以我觉得 Properlacity 也好 Cursor 也好 Minus 也好都是模型的到货者为什么 Properlacity 作为模型到货者没有被模型公司现在吃掉起码现在看没有我觉得就是我们刚才聊到的 OpenAI 的战略选择和组织能力就是
AnswerBit 的战略选择是我要做企业级企业级它不需要联网搜索它直到最近才加了联网搜索我们提到应用其实今天最大的应用还是 ChadGPTChadGPT 过去两年的增长是非常快的你看它已经快 7 个亿的月活了 4 个多亿的周回 ChadGPT 的市场占有率在 ChadBot 里面是
持续收敛加强呢其实我觉得这个代表着核心的价值其实还是被基础模型公司拿走了如果今天我是 Cursor 的 CEOProperty CEO 我觉得我的危机感是很强的我还是会担心模型公司明天这个升级那个升级其实你看 Property City 的 Deep Research 它是不如 Opac 自己的和 Gorak 自己原生的效果好的包括你看 Cursor
他是因为 Solnet 3.7 出来他基本上修了三四周时间了因为之前 Cursor 有一套自己的外部的脚手架那 Solnet 3.7 呢他在 model training 的时候已经又内置了一套脚手架所以这两个就冲突了所以你看 Cursor 也把 Mid Journey 那个做 training 的人也弄过去了我感觉也要端到端训练 R 包括自己的
定向的模型了吧我感觉就是想每一款想做好做大的超级应用长期都还是需要端到端训练 post trainingRL 相关的我觉得但存在另外一个问题就是比如说 property 这个就取决于模型公司能不能自己做好产品这个考量战略选择和组织能力的
我觉得 Azure 的优先提就不是做产品他们继续搞模型搞得风生水起他们认为可能模型是重要的事情 DeepSeek 也不着急做产品对吧我觉得今天智能 research 的收益可能还是更重要的但是你看 Cursor 跟 Cloud,Sonnit 我觉得未来模型和产品的边界会变得越来越模糊
应用的公司他也会做一些自己的模型模型公司也会往上做一些产品 Agent 对于 SaaS 公司会有什么影响吗如果一个 Agent 到了一个真的本科生的水平我在想还需要 SaaS 吗就假如 Agent 有了无限的 memoryonline learningAgent 自己还会做 research 就相当于你的 iPhone 你的微信全部的权限给了我我花一万个小时研究你的微信我在想是不是我
比你还懂你自己所以你觉得有了 agent 之后的 SaaS 公司就没有必要了我不知道存在的价值是啥现在是不是很多之前做 2B 的人去做一个 agent 是一个很好的选择我觉得是 GPU Compact 的投入很大然后 Capital efficiency 也不够高模型训练的经济性怎么理解呢其实你看 OpenAI 这几百亿美金的投入其实是给全人类提供了一个巨大的技术杠杆他们
几千个人杠杆了几亿人的生产力我觉得这个是很伟大的其实是给今天通胀的世界提供了巨大的通缩的力量刚才提到 SaaS 跟 Agen 的区别你看传统的软件开发之前是要把一个个的功能点都要开发出来
现在的应用开发是你百分之七八十的东西都不用开发了今天都包在模型里头了你直接调用模型能力就好了相当于 model training 这个事就把人类未来十年的 R&D 的 cost 都提前投入了我觉得这是人类面向未来的大体现实投入我觉得其实还好吧很多人都在讨论模型和应用的关系以及这两者未来的价值链的划分你怎么看
我觉得今天的价值链的划分利润池的划分是很不合理的你看从 NVIDIA 到 AWS 到比如说 Anthropic 到 Cursor 这四个 NVIDIA 几乎拿走了利润的 80%以上 AWS 拿走了 30%Anthropic 是亏的 Cursor 也是负毛利的我觉得长期会往后移的 AWS 的利润起来然后模型和应用的利润也会起来
我是对模型公司的长期价值信息是越来越强的你预计 2025 年在 AI 领域会出现哪些黑天鹅已经出现 deep seek 了我觉得后面持续出现的概率会越来越大而且黑天鹅有可能会把很多模型公司的下限达到非常非常低什么叫下限达到很低就价值毁灭了其实我们第一期播客就提到模型训练是一个价值毁灭的事情但对长期价值又很重要的事情
你比如说 DeepSeek R2 追到 O3 的水平那其实对生态是好事但我觉得还算不上叫黑天鹅量级的我觉得能算得上黑天鹅的你比如说伊利亚再出一个全新的架构学习效率非常高需要很少的数据一定的算力就可以变得很聪明我觉得全新的架构算一个
你比如说 openA 的 CTOMira 出来的新公司他们如果出了一个多模态的 chad bt 能不能 beat 今天的 chad bot 形态或者新的 agent 产品形态谁能定义出来我觉得还是会有很多黑天鹅的但不确定
具体从哪里爆发出来接下来我们来更新一下就是全球大模型公司的竞争格局这是我们这个季报的传统 OpenAI Anthropic 刚才已经聊了不少的入境分化了能不能说一下你理解的现在基础模型公司就是其他这些公司的竞争格局包括 OpenAI 和 Anthropic 对刚才我们提到其实 OpenAI 现在核心 byte 是两个对吧 OpenAI 希望通过 O 系列
R/Resolving Model 实现 AGM 第二是把 HIP 做成 10 多亿活跃用户的 KLabAnswerpy 的核心 byte 就是一个是专注 byte on pre-training 一个很强的 base model 对吧 byte on coding byte on agentic 生态对吧我觉得 OpenAI 是更重视 C 端 Answerpy 更重视 B 端我觉得这是这两家外部的一个感受
就刚才我们提到路径分化的时候有一些吐槽 OpenAI 的但从实际格局来看我觉得 OpenAI 的领先优势过去两年看其实是在加强的其实你看 OpenAI 让整个模型训练整个格局收敛的非常快其实没有小模型和垂直模型公司了可能长期就是不存在
独立的小模型和垂直模型公司我感觉我们从第一期播客也聊到有可能就是基础大模型公司 take 一切对吧然后其实你看 Chad GPT 的流量的集中度是在大幅的提升的增加的还挺吓人的其他的 C 端产品几乎没出来 Populace 的量今天也没有那么大其实没有给到其他真正长大的机会最后的流量都回到了
ChangeP 这里你在从 AI Native revenue 的角度我觉得好像 OpenAI andSupply 几乎拿走了整个市场 revenue 的 80%营收的 80%其他人好像也没有拿走什么其实 Cursor 我觉得其实也在给 AnswerPay 打工的我们拿 Google 跟 OpenAI 对比
其实 Google 这过去一两年几乎没有从 OPI 这边抢走什么东西 OPI 它的增量用户是非常强的 持续变强最近 OPI 又发了文生图的东西其实你看 ChatchBee 过去两年这个产品是越来越丰富的就 ChatchBee 是显著进步但 Google Search 是没有显著进步甚至说份额开始下降我觉得一旦 Google Search 的份额在显著下降
是挺可怕的我觉得 Opa 就是盯着 Google 在打可能就是成为下一个 Google 但说一句难听的我觉得 Opa 其实是把很多创业公司的机会给 kill 掉了其实 Opa 生态我觉得是没有长出来什么大公司就是都是跟 Anthropic 合作 Crisis 跟 Anthropic 合作我觉得 Opa 想做苹果 Anthropic 想做安卓对吧但理论上 Opa 既可以做
苹果也可以做安卓但我觉得有可能是拆 GP 过于成功有点拖累了就之所以 Anthropy 还能活着 XA 还能活着背后还是 Amazon 跟马斯克撑着如果不是这两个大腿撑着我觉得不然也就早掉队了但 Anthropy 这个团队我觉得还是
很强超预期的吧 Answerfee 的生态我觉得看起来是越来越好的出现了 Cursor 对吧出现了 Minus 我觉得 DeepSick 是完全意料之外的但 OpenAnswerfee 觉得好像 DeepSick 对他们几乎零影响这个我觉得也是比较生气的我觉得 DeepSick 包括 Mask 的 XCI Grok
我倾向于它还是在 follow open 安现有的路线先把 open 安今天实现的东西去追评去逼近其实是没有实现反超的我觉得只有在追评的基础上再有一些新的 batch 其实你看 google 的特点就是多拍能力很强最近的新模型我觉得也是非常好的其实 google 的 batch 我感觉不算
非常清楚我觉得 Google 也是 follow 为主就之前开玩笑说 Google 是被 OpenAI 领导的公司就经常在 OpenAI 发出来新的东西两三个月之后就经常能在 OpenAI 发出来的东西之后花两三个月的时间追评甚至反超但其实每次都又得到 SAM 的狙击对吧其实 Gemini 今天的流量还是非常小的
GPT 4.5 算领先吗我觉得把模型 size scale 到很大这个意义还是比较重要的因为你不 scale 上去就相当于你这个登山没有登到很高的位置你看到的那个 view 就没有看到嘛我相信 4.5 可能还是会比较强的只是说很多能力今天没有被激活和挖掘出来我觉得 4.5 的意义有可能比 O3 的意义
可能还要大就看谁能把 model size scale 到一个比较大的程度 GPT-5 还会一直继续跳票下去吗我们可以换一个角度想如果 OpenAI 跟 AWS 合作而不是微软是不是 GPT-5 可能更早就出来了是不是有可能微软的 infra 能力非常的拉垮真的是这样吧比如说假如有一半的时间都在 debug
那其实相当于 GPT-5 也好 AGI 也好就延长了一倍嘛你觉得 GPT-5 会长什么样啊 Sam 在推特上说 GPT-5 也会是一个 Hybrid Model 我猜肯定也会是 GPT 系列作为一个 Base Model 之后再融合 O 系列嘛嗯但今天的 4.5 这个模型那么大我觉得做
R2 其实是跑不动的成本太高我估计可能还得有一个比 4.5 要小的模型但能力要非常强因为之前可能都是基于 4O 的 base model 我觉得 4O 可能马上就退出历史舞台了可能就得有一个新的旗舰模型来在支撑吧我觉得还比较乐观啥时候能看到啊我估计夏天今年夏天我估计今年夏天
应该还是会有 GP3.5 到 4 量级的提升因为今天 Benchmark 上是看不出来了因为人的这些 Benchmark 其实不太能发现模型背后的暗物质到底是什么我最近看到 OpenAI 支持的 Anthropic 的 MCP 协议你怎么看这个事他们两家公司之间现在是什么关系我觉得基本确定这就是 AI Agent 的 TCPIP 协议我觉得第二个点
好像 OpenAI 还挺尊重 Anthropic 这个团队一帮老大哥专注做 research 也没有 hype 比较踏实我觉得好像 SAM 还挺大方挺大气的虽然有竞争但好像大家路径在分化一个做 2C 一个做 2B 好像也还行 OpenAI 和微软为什么会有裂痕你觉得这个裂痕会破裂吗我们
好好想一下 7 trillion 和 500 币本质上是什么如果 SAM 有了 5000 亿美金的现金 OpenAI 是不是就变成一个新的 Azure 云服务商了那会不会跟 Azure 就发生根本性的冲突 500 币可能就是它能圈到的市场上几乎能圈到的所有的钱那就不需要微软了对啊那这个分家对微软影响更大还是对 OpenAI 影响更大肯定是微软影响多大微软的 Azure
起了个大早我觉得有可能是一个 AGI 的 loser 但我觉得也不至于到 loser 这种那么显著因为 opend 很多的 inference 还跑在上面我觉得微软是手上一堆好牌但没有打好其实开发者产品都让 cursor 或者其他的都跑出去了今天的 Foundation Model 就是下一个 windows 操作系统我觉得微软如果没有这些操作系统和开发者生态其实是比较
比较困难所以我现在是更看好 AWSOpenAI 当然今天还是一面旗帜一直都是当然我们也看到它的各种问题 OpenAI 有没有失败的风险呢失败的风险有多大我觉得整体还好因为刚融了 400 亿美金我觉得未来两三年起码是比较安全的
其实它的 C 端的领先还是叫一技绝尘对吧也还比较稳我觉得今天投 OpenAI 有可能就是投一个消费互联网公司的逻辑了就看看能不能成为下一个 Google 因为 OpenAI 很快可能马上快 3000 人了我觉得确实有点走向 Google 了因为组织一旦变大我觉得就比较难专注了是不是还足够的专注在 AGI
research 的聚焦是不是足够的清晰我觉得他们可能要做的事情太多了其实我更关注 OpenAI 接下来会砍掉什么业务比如说干脆 API 就放弃了专注做好 C 端的 ChatGPT 做好更多的产品做好 coding agent 去掀翻 Google 我觉得也是一个大的 bite
我觉得历史上同时把 C 端和 B 端做好的公司是比较少的好像没什么把 C 端和 B 端同时做好的微软也是做好的 B 端其实 C 端没有做很好我觉得我看最大的风险是 base model 不足够领先别的外线公司先做出来一个更强的 base model 又有很多开发者在 base model 上做出 super app 会抢走 XGP 的流量
我觉得现在还是一个快速的技术进步周期下其实是不能停下来的
XAI,Druck 今天的突出能力是什么呢 Writing,写作我觉得是比较突出的吧但 Writing 这个市场其实很小的但就看到 XAI 跟 Twitter 不是合并了吗我觉得倒也是情理之中吧 Growark 其实是没有一个基本盘的因为 Open 有了 ChatHPT 而且在持续的加强 Answer 也占了 Coding 开发者,Agent 有这些对吧 Growark 只能先拿一个 Twitter 再说嘛
因为反正也是同一个老板对吧但我觉得 XA 我对 XA 的印象就是执行力超强可能没有哪个公司比 XA 执行力强 Infra 能力也非常强 Priority Training 团队也非常强很多朋友其实工作常态是工作到凌晨三四点四五点我觉得这个强度是非常非常大的其实 Gorg3 我觉得是很不错的你说它是 base model 里面的 Salta 我觉得起码是绝对的第一梯队吧
他们也会持续 trade 更大的 model 你觉得他们为什么合并啊 XCI 和 X 都叫 X 我觉得 Grok 缺一个产品形态但推特也不一定是真的对的产品原因毕竟它还是老的产品
他在老的产品里面加一个 truck 然后又有一个新的入口我觉得主要是为了流量因为你看 ChadgeP 可能六七亿的 MAU 了 Twitter 现在是五个多亿的 MAU 算是一个量级的但 ChadgeP 其实还是更大一些伊利亚想做的 ASI 和 HI 你觉得它的本质差异有什么要实现 ASI 还需要什么我觉得 AGI 就是普通本科毕业生操作电脑 ASI 的话更像是爱因斯坦实现大学毕业生和实现爱因斯坦
区别还是非常大的我觉得刚才聊到实现 AGI 我觉得确定性非常清楚了但实现 ASI 我觉得可能还是需要一些突破的很有可能伊利亚是赢在两年以后是不跟今天的 OpenAnswer 竞争的 AGI 强调的是通用的人类水平 ASI 强调的是领域的超级专家的水平就是在一个领域内你比如说能发现新的知识批量的实现最强的专家
包括能自动化一些 SOP 但我觉得有可能伊利亚想做的是通用的超级专家但超级专家能不能通用是不是真的有叫一千万名通用的诺奖级别的爱因斯坦我觉得是有待验证的人类历史上其实很久很久已经没有真正的通才了我觉得 ASA 是
有可能带来叫专业知识领域的很多垄断的一个领域内的顶尖专家他能交流的对象是很少的 Deeper Search 这样的 AI 产品已经成为我觉得很多领域顶尖专家的一个 thinking 的 partner 你说定价 200 刀很多科学家都是愿意付的因为我很少能找到人给我 brainstorm 的东西但今天的 Deeper Search 还是信息收集的能力我觉得 ASI 呢我觉得有可能基于这些信息
有可能产生新的知识产生新的定律总结对吧我觉得对一个学科一个领域这个价值是比较大的甚至有可能点亮一些科技术对我觉得今天最接近 ASI 领域的可能就是 AI coding 我觉得这里进步速度是非常快的你怎么看 Mirror 的新公司我觉得团队非常好
甚至说远远强于 OPI 早期的团队班底 OPI 最核心的 post training 的 team 包括 Lead、Barrett 包括另外几个核心包括最老的 Infer team 的核心其实都被 Mirror 给拉过去了其实他们的 Infer 包括 post training 其实挺强的我觉得能吸引到这么牛逼的一个班底人才我觉得还是很强的而且 Mirror 很大方听说很多人都拿到了很多股票
我觉得有一个有意思的就是说模型复现的时间越来越短其实 Anthropic 的 Cloud 追到 GP4 大概花了两年时间 Mirror 这个团队可能一年甚至更短但追 base model 肯定不是他们的目标他们肯定还是做产品的一个思路他们想做什么我觉得可能是要做一个能 beatChaiGP 的产品好像 Mirror 之前在 OpenAI 就是对于发布 ChaiGPT 有很大的影响对吧
你可以理解这个团队是做 TradeGP 的几乎恒星团队 OpenShare 团队是 push AGI 做智能的一些团队但又分裂成一个做 O 系列的团队我觉得 Mira 不一定今天说产品形态 idea 都想得很清楚了但我觉得肯定还是奔着做产品的方向不管说多模态的 TradeGP Agent 的范式下的 TradeGP 我觉得还有一个就是
Mira 可能代表另外一个意识形态就 Mira 其实是比较欣赏梁文峰的他觉得 Anthropic OpenAI 可能是代表一个叫美国的精英思路 币源这帮 leadership 有道德约束所以 AGI 不至于做坏事但 Mira 可能更信奉一个开放的 AGI 他觉得这个 power 应该交给社区
我听说他们可能在 DeepSeq V3 的基础上做 post train 因为他们 post train 特别强未来在做什么 mid train 还有 pr train 我觉得应该还是走应用为先的策略吧可能也会开源一些研究但我感觉这个也是一个组织能力下的一个 batch 或者战略选择所以他第一步不是自己先去做 pr train 因为也没他必要其实 DeepSeq V3 还挺好的
这个挺有意思的不同的战略选择其实背后也是不同的价值观对不同的组织能力上面我们说的都是模型公司下面我们来聊聊产品公司之前我们有一期播客专门聊了 Populacity 那能不能对比一下今年获得 Manas 和 Populacity 我觉得他们都是叫执行力非常强的人都被叫做
各个地区的 talk 之王对吧对然后我觉得他们都是叫打开潘多拉魔盒的人我觉得 minus 更明显其实你看 minus 它是一个 token 容器能比较极致的榨干模型的智能就模型越好其实对 minus 是越好的
Manas 是非常吃模型的能力的就更强的模型它不嫌强其实我觉得 Manas 都能吃得下的但模型越好呢对 Property 其实今天到并没有那么突出的体验的增加但 Property 呢我觉得是抓住了两年快速成长的窗口期就刚才聊到 TrashGP 战略和组织其实那两年我觉得 TrashGP 也好 Cloud 也好 Google 也好其实自己都没做好
其实给到了 Propriety City 这个窗口成长到一个规模其实 Mindless 今天面对的竞争环境肯定是更激烈的其实没有那两年叫为所发育的时间了所以对小红对张涛 Pick 怎么打好这张牌我觉得要求是比较高的因为 Mindless 在主线上我觉得是在智能的主线上
我觉得这也是比较兴奋的吧就是登上了一个全球最高水平的赛场去打 NBA 了很多人说他们可能发布产品的时候也没有准备好你怎么看?你对他们有建议吗?我觉得这个火爆肯定是超预期的我觉得建议的话就是重视 research 未来肯定要做 post-training 二而相关的吧你觉得 deep research 会做 minus 吗?deep research 的未来是什么样?
我觉得 deep research 就是 open agent 的雏形了他们肯定会后续集成特别多对吧集成 operator 集成各种东西集成 coding 我觉得未来 deep research 就是一个 general agent 但不确定有两个方向你说 deep research 它一个是走向 Google 变成更高级的 deep search
还是走向专业还是走向专业化变成 co-scientist 或者 co-analystco-worker 这种方向我觉得这个是还不知道的你对 Devon 和 Kersery 这两个产品的状况有没有一些更新的认知我觉得 Devon 是抓到了一个时间窗口也是一个叫提前等模型比较激进的一个想法但它解决的问题我觉得是容易被模型公司 cover 的因为它
target 的这些任务类型要么就是模型能力不 work 的时候它也不 work 模型能力变强了 work 了好像 divine 也没价值我觉得 cursor 今天 interface 它交互的价值是比较大的但如果智能很强了我不知道未来还要不要交互有可能 cursor 今天的形态我觉得是一个阶段性的形态模型能力提升以后有可能几句 parameter 就解决了很多问题了
所以 Cursor 他们自己你比如说 Notion 的人做交互的手机设计师加入了 MidJourney 做 training 的人加入了所以他们肯定会探索新的交互形态和自己的 model trainingDeepSig 虽然它也是一个模型公司但它也是一个很成功的产品我觉得 DeepSig 的创新是建立在换方量化的 infra 积累很强的基础上的 infrastack 是非常 solid 的
坦白说 DeepSick 今天真正的科学探索上的范式级的创新今天还是相对少一些的我其实比较期待 DeepSick 有范式级别的创新出现会有吗有可能吧全球范围内我很好奇你觉得对于 AGI 推动贡献最高的人是谁啊有没有一些就是你心中的排名不管是水平更高还是贡献更高我觉得贡献和水平可能是要分开就是说
Iliya 和 Nom 这两个人贡献是最大的我觉得 Iliya 是一个神就是几乎指明了今天整个行业在走的最核心的路线就是今天可能还会继续沿着 Iliya 指的路继续走很长时间可能在 2020 年的时候就是所有人都还在关注 Birt 的时候其实还没有出现 LM 这些方式 Iliya 当时就提 Pre-training
R 的路线了其实这样看伊利亚还是非常 visionary 的一个人的就是 Norm 的贡献我觉得主要是在架构 Norm 是一个架构的神吧我觉得他两个是贡献和水平肯定是非常高的我觉得其次可能是 Darrell 和 ElecElec 也刚离开了我盘 Elec 的成就就是 GPT-1 对吧那 Darrell 的成就呢我觉得是他知道今天整个
行业和技术走到哪一步他的 taste 非常好如果不是 Daryl 继续坚持 skating by town GPT-3 有可能 opai 就停在了 GPT-1 了我觉得之后可能是中央输卖 Mirror 对吧所以 Mirror 的新团队我觉得是很牛的你都没有提 SAM 那他呢
我觉得 Sam 对业界贡献是很大的主要体现我觉得是把 hype 弄起来了然后 Sam 其实是一个想象力非常大的人帮很多人打开了想象空间对吧裹挟了大量的资源给到整个 AGI 的行业里头所以你看从业者 researcher
有了更多的 GPU 的资源个人待遇也非常非常好了很多我觉得这是 SAM 非常非常大的一个贡献我觉得其实 SAM 综合能力还是非常强的但我感觉它有些的外部的行为是有迷惑性的可能有各种烟雾弹之类的比如说我觉得它有时候发的东西可能不一定是主线的东西比如最近这个有可能就是可能是烟雾弹的东西那我们说很多都是关于 AI 的认知那说回你的
这样问吧就是如果给你 1 亿美金或者 11 美金让你今天构建一个 AGI 的 portfolio 全球范围去投资那按照最新的估值假设全部都能投得进去就是没有任何的就是强不强到 deal 的问题你会投哪些公司站在财务回报的角度我会投 25%给到 Anthropic25%给到 Bad Dance 自己 10%投给 OpenEye
10%投给 Mirror5%投给伊利亚我觉得 5%投给 Manas 吧这是 85%剩下 15%还没想好如果 DeepSeek 融资我也愿意放基金的 25%我觉得这个团队还是挺强的但有个有意思的我认识的 researcher 的朋友几乎 99%的人都觉得自己好甚至自己的 upside 股票的 upside 要比 OpenAI 要好
甚至说这些 researcher 个人都想去买字节的股票我觉得这个也是蛮神奇的这是为什么字节比较低调吧也是被低估的而且 revenue 也非常大利润非常好可能比如说 2030 年欧盘的营收利润肯定还远远不如字节今天的营收利润因为它两个估值今天一样都是 3000 亿同样的 3000 亿你去投字节还是投欧盘啊
字节今天 AI 的产品它不一定能增进它原有的老产品今天它的 AI 探索它不一定能够让它的旧产品扩大 10 倍看 AGI 的未来今天的
revenue 和利润都是走向未来的养料 OpenIL 外部融资字节可以自己可以内生赚钱赚个 1000 亿美金去投 AGI 那 OpenIL 我不知道未来还能不能融到 1000 亿美金你觉得为什么不是字节做出了第四个我觉得就是大组织和小组织吧可能字节未来也是更灵活的一个组织
所以还是组织很关键我觉得组织能力是非常关键的为什么小组织更容易成功因为今天的 AGI 是一个科学界的叫探险小组织更灵活敢于 batch 我觉得做 AGI 有赌性的是特别重要的你为什么放在 Anthropic 的前辈 OpenID 在这个 portfolio 里面我觉得是对这个团队更有信心对 Protrain base model 更有信心对 Batton codingagent 更有信心
我是比较 enjoy 他们的 roadmap 和战略重点和组织能力 Onthrope 目前的估值是多少最近 615 亿美金 OpenAI 的最新估值是 3000 亿 Mirror 的最新估值是多少 100 亿,伊利亚 300 亿为什么放在 Mirror 公司比伊利亚公司多我觉得伊利亚的公司的失败风险是非常高的 Mirror 公司的成功概率
是比较高的依赖更科学探索对我觉得 Mira 是大个类要被收购的你说 Mira 我觉得不管 Apple 也好 Meta 也好大厂其实都需要一个 Mira team 一个非常强的团队一个非常好的文化和组织所以你觉得 Mira 的确定性是更高的对然后 Minecraft 和 Christopher 的钱是一样多为什么我觉得一样多主要是这是两个模型能力的表达
一个是 coding agent 一个是 toyos 这个能力两个能力的表达吧代表两个应用的方向但整体你还是会在做基础模型公司上放的钱更多相对应用公司来说我觉得今天还是仅有的一点点时间窗口可以让你投一个 AGI 基础模型的窗口如果 DeepSea 开放融资的话你放的钱是跟字节和 Anthropic 是一样多的是的为什么不是更多呢
因为基金上限是 25%作为一个投资人你未来三五年你在投资上会做的最大的 BAT 是什么我觉得最大的 BAT 就是 AGI 带来科学的文艺复兴这个比较抽象我觉得从具象来讲我觉得一个是 2030 年之前会有多家超过 10 个 TUSD 的市值的公司第二个就是说从具体表现上可能就是有下一个 Google 下一个 Windows
下一个 office 下一个 meta 是下一个辉瑞里来对吧我觉得 next google 已经有雏形了可能就是 openai 吧我觉得 next windows 可能是 cloud 我觉得 cloud 可能就是一个新的 windows 或者安卓我觉得 next office 可能就是接下来要争夺的 coding agent 或者 general agent 我觉得 next meta 今天还看不到嗯
我觉得 AFOscience 里头会有下一个辉瑞里来当然有可能辉瑞和里来这种也未来会非常强自己变成好几个 T 的公司刚才我们讲了很多其实都已经关联到了组织文化你觉得在 AGI 时代组织文化作为关键竞争力被低估了吗我觉得组织和文化的竞争力是仅次于算力的核心竞争力 DeepSync 其实给了蛮多启发的灵活小团队敢于 batt 其实搞 AGI 是
要有赌性的就有限资源就得蒙搞一个大的 bet 其实欧盘早期的赌性也是很强的但组织变大其实赌的阻力也变大了其实你没办法就要快速下注我感觉欧盘的赌性是在逐渐变弱的就想要的比较多我觉得很硬是看一个组织敢于放弃什么
其实 AGI 的 roadmap 战略选择是可以变的都是在组织能力之下的其实人才的密度比人才数量我觉得要重要非常多的就是就刚才说的 AGI 就很像探险每一刻都在 push 边界所以每个位置上的人都非常关键怎么判断一个组织到底是不是 AGI native 什么是好的组织好的文化我觉得有几个特点能不能做到 AGI first
research firstresearcher first 有没有 AI 的一号位是不是领军人物优秀的 researcher 愿不愿意加入这个组织有没有自己的 bet 以及人才 promotion 的机制到底什么样的人能被 value 奖励对吧到底什么样的人能被 value 奖励我觉得团队成员的话年轻聪明
有想象力有知情力我觉得经验是完全不重要的资历也不重要我觉得想象力年轻和知情力是特别重要的其实我觉得 AGI 和模型训练没有那么神秘就是做研究就是一个实验工程但是组织又特别的有关键我觉得大概率 25 26 年就仅仅说这两年我觉得会看到好多个
GPT3 到 GPT4 的智能跨越的其实很多科技公司的管理层我觉得是跟不上技术突破的节奏的面对 research 的巨大的突破我觉得怎么投入怎么判断决策怎么选出 AI 的一号位你想好赌有时候都不知道怎么赌对吧
我觉得上次跟老王聊天蛮有意思他提到一个他说不应该再持有不 all in AGL 的科技公司了我觉得这个是非常对的就是我觉得如果想在 AGS 时代 build 一个有想象力的事情我觉得就不要恋战今天的产品形态商业模式老的组织我觉得这个时代的秩序变化是非常剧烈的我觉得就是我们这个播客说的要把智能技术提升当作唯一的主线
把智能本身当做最大的应用也把 90 后甚至 95 后的研究员放到核心的管理层里面选好 AI 的一号位我们纵观全球这么多公司你觉得哪些公司现在看起来可能最先实现 AGI 我觉得大概率还是 OpenAI、AzurePick 这两个最先其次是 Google 和 XAI 我觉得中国至少也有三四家也能实现 AGI
字节和 DeepSeek 可能是最确定的我觉得额外肯定还会有一两家吧其中开源和避源的比例会怎么占我觉得 DeepSeek 就等于开源有可能字节也会开源中国走开源未尝不是一个挺好的路径字节也可能开源我觉得应该开源一些吧硅谷对中国 AI 进展的态度有发生巨大的变化吗特别是在 DeepSeek 以后你怎么看待中美的 AI 走势
我觉得只要是现有的路径下美国实现了 AGI 中国复现我觉得是必然的就过去两年中美差距我觉得毫无疑问是在快速的在缩小的其实很多地方每三到六个月就在追评就中国的人才是非常强的美国可能头上的那些世界级的顶尖科学家很多但中国再往下一线的可能几百个几千个猪孽的一线呢
这是来自于庞大的教育体系我觉得积累了非常多好的人才吧我觉得除了比如说 DeepSick 预期以外我其实是最看好字节的就是因为后面
skill base model 是需要非常强的 infra 能力的我觉得自己也花了很多大的力气做 infra 我就会随着时间价值会慢慢出来如果 infra 比较差其实不仅是成本的问题我觉得可能就是没办法爬到某个高度了跑大的实验可能都比较困难你比如说 large scale RL 这个事对吧之前比如说 Pleas training 的训练框架和
R 的 Inference 框架两个框架是分开的今天要融合到一起而且 GPU 边推理边训练对吧一边 sampling 一边 training 这里面 bug 挺多的其实这个挑战是很大的我觉得之所以 DeepSig 之前做的好也是幻荒之前在 Infer 的积累是比较强的我觉得只有把 Infer 做好
才能实现或者高效率的做事吧我觉得不然的话你整个 Foundation 包括组织就会很差我觉得英法不够好其实很多事情我觉得是做不好的我觉得很多 reserve 的时间都浪费在 debug 上了这样就导致 AGI 的时间拖长了为什么你觉得开源可能更适合中国开源无国界可以突破地缘的封锁吧中国公司里面你最喜欢谁我对自己的预期是最高的吧
我觉得预期不是说字节能追到全球模型的第一梯队而是说大公司应该做大公司应该做的事情我觉得中国很缺一个像 Google DeepMind 或 Google Brain 一样的具备长期 vision 我觉得比较纯粹的 AI lab 就是培养一些人才我其实比较期待字节有这种文化有这种 vision 或者破例能拿出很大的
营收利润去支持基础的科研对吧搞好 full stack 的基建 infra 去探索真的智能的上限我觉得这个是比较大的期待其实我感觉对自己或者一些大公司再做一个抖音我觉得可能已经不够兴奋了我觉得探索智能的边界和上限这个 vision 是更有意义的我觉得之前大公司确实都有大公司的组织问题大家也都看到这个问题
我觉得组织只要理顺了我觉得后进还是比较强的我觉得字节的人才密度还是非常高的我觉得之前可能因为地缘可能就比较低调我其实比较期待后面能有一些突破智能上限的东西我在想创新的基础是什么创新的基础是你要有充裕的资本要有冒险精神还要有比较好的 info 还有比较好的文化我觉得这些是创新的基础嗯
那今年是不是对中国能够复现或者实现 AGI 更有信心了我觉得取决于两个条件第一就是现有的 Priority Training 和 RO 这两条路线不需要其他的路线不需要其他的 fundamental 的突破就实现 AGI 我觉得这是第一个先决条件第二个是不需要几十万张的 GPU 或者百万张的 GPU 有可能几万张的 GPU 三五万张或者五到十万张就够了
我觉得实现 AGI 基本上是确定性非常高的美国的模型公司之所以那么烧钱我觉得很多的 GPU 是用在探索上了其实探索是非常好卡的加上欧盘要做大量的 serving 相关的如果不做 serving 其实也不需要那么多如果是纯的复现我觉得可能 maybe 三五万张五到十万张有可能就够了因为探索花费的时间和资源有可能是复现的五到十倍吧
我觉得还有另外一个感受就是中国团队的加速度是比美国团队要强的因为国内的猪捏的这种年轻的优秀人才我觉得是比美国更好的其实你看 Devon 团队的执行力就没有 Manas 团队的执行力强你觉得硅谷和中国的创新特点有什么不一样我觉得硅谷是很多 0-1 的创新我不屑于去 follow 和 copy 一个这个原因背后是硅谷的资本特别充裕
可能 500 到上千家的 VC 投资机构大家都很有钱我觉得资本充裕是一个非常重要的创新的土壤另外一个就是冒险精神我觉得冒险精神都集中在了硅谷湾区其实中国是非常多的 1 到 100 的创新我们把硅谷的 0 到 1 发扬光大
你觉得在 AGI 的时代中国还会都是 1 到 100 的创新吗你觉得会有更多的 0 到 1 的创新吗就这个创新模式和创新技术会不会发生一点变化我觉得会啊就是之所以对自己有预期我觉得是要大公司要做大公司有的就是资本充裕文化比较好音氛比较好还要有冒险精神我觉得说句不好听的 Deep Seek
是一个富人做出来的如果没有充裕的资本是不行的所以我觉得资本的充裕是创新的前提还有就是要有冒险精神这次 DeepSync 是梁文峰做出来的对于自己的冲击大吗我觉得冲击还是有的我觉得这是好事把大家拉回到智能的主线上而不过多聚焦在豆包这个产品上
之前有一些偏离对吧因为大家都去投流做增长其实今天增长你说意义大吗我觉得长期可能是有意义的但是有可能占用了组织太多的精力没有花在模型上我觉得智能的模型去 push 边界就是智能是主线以及智能是最大应用如果你量很大了未来有一个巨大的 10 倍好的技术
你这些壁垒是守不住的所以我觉得今天产品增长是不本质的你觉得头流今天都应该停止吗应该花多少精力在这事上
我觉得不应该停止吧这也是人类的一个探索行为吧豆包停了没应该都还在增长吧今天大家都在说全球化但是中国公司或者中国投资出去其实还是会遇到很多问题我看到你前几天发朋友圈写假设 iPhone 是中国团队做出来的且能够控制然后美国用户极其喜欢美国本土又造不出来这个时候地缘问题会怎么解决你觉得这个问题的本质是什么
我今天最大的期待或者最大兴趣就是说在 AGI 叠加这种复杂的乱纪元地缘下就怎么做一个 AGI Native 且全球化的跨国公司我觉得这个是特别有意思的我觉得我们自己也在探索身边好多消费班也在探索我们就假设 Apple 是一个中国公司能不能跨越地缘问题销售到全球化的市场我觉得答案是可以的
但今天的中国公司还没有一家能超越 Apple 的产品和技术的极致的所以我觉得我们在技术和产品上还是有很大距离的我觉得最后其实核心就一个只要你把产品和技术 push 到极致取得断层的领先我觉得你要把精锐对手打服其实你看 DeepSeek 这一波很大程度上是挑战到了
美国科技霸主的地位的其实我是期待更多的 deep seek moment 能出来的就是所以我觉得作为年轻创业者脑子里不用太顾虑地缘问题我觉得就 push 产品技术到极致我觉得地缘问题最终都是能解决的 Red 上次说一定要全球化要更激进的全球化
我要非常激进的全球化好的技术好的产品是没有国界的第二这是真的领先的表现其实之前上一代互联网公司做好全球化的是不多的我觉得你看美国过去强大其实有几个表现一个是美元第二是美国的跨国公司第三是美式的那些意识形态对吧嗯
其实美国人觉得自己制定了近百年的全球秩序他们是有一层优越感的我是比较期待有可能越来越多的中国创业者能做出来中国原生的全球跨国公司吧这是新一代创业者的使命对你觉得华人在硅谷做投资天花板在哪有多高我觉得科技投资不是混
能混出来的很多 VC investor 其实喜欢混圈子我觉得其实混圈子没有意义我觉得天花板是很低的我觉得还是得靠创造真的深入的扎到一个行业 push 到极致其实到处混有很多 connection 其实这个是不难的但是跨越种族或者跨越文化建立信任是很难的其实很多人比如说去混硅谷的
科技圈子其实很难混到恒星圈的你很难跟 SAM 也好 Diriv 也好 Avon 也好建立信任
其实还是得自身足够牛逼有牛逼的东西我觉得硅谷才会 value 你的价值吧所以我觉得要多去想创造而不是去想混我觉得不然天花板是很低的其实我觉得做投资的天花板相对都是低的其实创业做企业家的天花板是更高的你像 1G 的 Zoom、Erik 也好其实还有个飞塔信息的谢青飞塔我记得有
七八百億美金是值包括今天的半導體行業的 CEO 都是我覺得其實應該更多的想去創造因為我們很快就面臨或者今天我們已經進入到了 AGI 的科學的文藝復興的時代了其實我覺得後面機會是宇宙大爆發式的你把你自己叫做原教旨主義 AGI 的原教旨主義你覺得它的對立面是誰是什麼樣的主義我覺得是相信科學本身
上一代投资人不相信科学本身呢相信产品和商业模式对很多是算账的你为啥会相信科学本身呢今天你算账算不过来看产品算账也没有任何意义我觉得今天的驱动或者核心变化只有科学在进步只有这一个所以你觉得在新的 AGI 的框架下所有的叙事都会发生变化我觉得今天过早讨论太多的用户需求甚至意义都不大因为这是一个供给驱动性的市场
因为手机上的需求已经被穷举过很多次了其实今天变化不在需求端需求是可以被刺激出来非常非常多的核心变量是在供给端你比如说癌症你比如说糖尿病肥胖症核心是供给不在于需求推荐未来一年你觉得还会有哪些大的变量我觉得会非常多不知道从哪里出来我觉得今天线性外推的
只是一个参考你比如说我比较预期 Cloud4 比较显著的 Bit 今天的 GP4.5Base Model 还能持续的提升大家回来再卷 Pre-training Base Model 对吧你比如说 Google Search 它的份额和营收会不会发生根本性的动摇 Agent 这个东西对 Search 广告的影响还是比较大的我觉得还有一个可见的就是说
Chad HP 的流量可能还是持续加强的在下一个强大的 base model 拉开差距之前吧我觉得甚至每个月一千刀两千刀甚至更贵的定价是会被更多人接受的因为它的 value 在被体现 Ryde 说他听你播客你听过他的没有我听了两遍你有对他的观点有什么赞同的和不赞同的吗我觉得 Ryde 是智能的盗活者我觉得 Sense 非常好
在微信那一波红利来之前就抓得非常好在 AI 这一波起势的时候又抓得非常好我觉得这就是创业者的本质什么是创业者我觉得创业者精神内核就三个字就抓机遇这三个字我觉得 Ride 是能持续抓机遇你们这也认识吗就是播客里有增量吗增量还是很多的
好了这期节目就是这样如果你喜欢我的节目欢迎前往小宇宙苹果 podcast 腾讯新闻喜马拉雅 QQ 音乐订阅张小俊商业访谈录如果你有其他想邀请的嘉宾想听的内容或者你有任何想探讨的话题都欢迎各位听众朋友们在评论区里留言那我们下集再见拜拜