We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 106: 与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need

106: 与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need

2025/3/9
logo of podcast 晚点聊 LateTalk

晚点聊 LateTalk

Transcript

Shownotes Transcript

欢迎收听本期晚点聊今天的主播是曼琪本期的出场人物还有真格管理合伙人戴宇森和晚点的创始人小婉这期节目也会发布在真格基金的播客《此话当真》中这次聊是在 2 月下旬当时宇森就提到了真格投资的 Molica 即将会发布一款 Agent 产品那时候我们还很难想象上周开始内测的 Manus 将会席卷社交媒体

当我们开始测试 Balance,把一个任务交给它,过了十几分钟就收到完整的结果时,似乎真的感受到了一点,Attention is not all you need。这里的 Attention 不再是我们前几期讨论的烧脑的大模型概念了,而是指人类的注意力。Agent 将解放更多人类的注意力,让你不再用盯着一些工作。这些变化的起点是去年至今的两个重要节点,OE 和 RE。

这期节目中我们从 OE 和 RE 开始聊 OE、RE 带来的推理能力的提升成本的下降和同期模型编程能力与工具使用能力的提升一起开启了 Agent 在 2025 年的应用前景宇森详细分享了他对 Agent 机会的当前观察以及在 DeepSeek 带来的开源生态的变化中大小 AI 公司的新动作和调整下面我们就正式进入本期节目吧

今天我还有晚点的创始人小婉我们都来戴宇森工作室再拜访他之前我和宇森商量就是我们来聊什么的时候当时我们定了一个主题就是从 O1 到 R1 看 AI 这四个多月将近小半年的时间一个大的变化我们可以从这两个最重要的事开始聊那你可以先讲讲就是你怎么看 O1 和 R1 的分别的意义

我觉得 O1 首先是让大家看到了 reinforcement learning 在 post-training 这个领域进行应用之后带来了智能提升因为当时大家在想在 GBT-4O 之后下一个是什么那么 O1 出来确实在 reasoning 在很多智能的表现上得到了很大的提高然后 O3 的发布呢又证明在 O 这条线上其实是可以持续地把能力提高它的边际还很远它的空间还很大

所以听说欧四迷你也训练完成了

那么我们在这里面既看到了在 post-training 上用 reinforcement learning 实现的 post-training 的 scaling law 同时又看到了当模型推理时间越来越长它想的时间越来越长形成的回答质量越来越好的叫做 test time compute scaling law 或者叫推理时间的 scaling law 所以这两条新的 scaling law 其实在之前 pre-training 的基础上让 AI 的模型能够进一步的提升并且大家全世界同行虽然之前或多或少

头部的这家公司都已经了解到 reinforcement learning 是很有用的能够提高很多的表现但是欧外的出现也让大家看到这条路是可以走得通的

并且呢 O 系列这样的模型带来的推理能力提升我觉得是解锁 agent 这样一个产品形态的关键因为模型的思考能力不够强的话他就没办法自主的去使用工具制定计划检查自己的工作有没有完成这些都是 agent 这样产品它必备的点所以先得有 O 系列带来的思考能力提升才能够解锁新的产品形态你知道 O4 和 O3 大概它的区别或者它主要优化迭代的是什么

有一些八卦吧但据说比如说欧四迷你可能说他推理的时间能够到几个小时的级别其实我们一直在想比如说优秀的人类跟一般的人类的区别是什么比如说为什么博士论文要写五年因为一个博士他可以通过五年的时间得到一个更好的更高价值的工作对吧但可能给一个普通人十年也写不出来一篇博士论文所以首先这个人基础数字要好第二你要给他更多的时间

所以之前我们说训练模型就有点像是说培养一个更聪明的人,但是聪明的人需要更多时间来传递更好的工作,这个就是推理时间的 scaling law。那么现在一个模型能够思考更长的时间得到更好的结果,这一点其实是似乎在 O 系列上包括 O3,O4 可能越来越能够达到的一个目标。

对那刚刚讲的是 O1 嘛那总结下就是它证明了这个强化学习在后训练在测试时间计算的 skilling law 的一个潜力这个事还可以走很远这是 O 系列的 O 系列的价值然后那接下来可以说说 R1 这个肯定也是影响力非常广甚至我觉得某种程度它是超过 O 系列的因为它是一个全民都在讨论的一个事情我觉得

R 系列确实是一个世界级的工作,并且这里面给了我们其实非常多的启发,我觉得第一个就是开源 VSB 源,对吧,当他选择开源的时候,第一他能够让大家知道这里面是怎么训练的,其实在 R1 的训练论文,包括 V3 的训练论文里面,我们看到了大量,可能其实 OpenAI 已经知道,但是对公众还不知道的结果,

这里面有几个我觉得非常精彩的例子比如说 IE0 它证明了在不用 SFT 的情况下仅在基础模型 V3 的基础上做 reinforcement learning 就可以持续的获得模型输出更长的长度获得更好的智能这样一个推理的 scaling law

所以不用 SFD 这是一个很重要的创新然后 GRPO 对吧这也是听说 OpenAI 之前已经知道但不管怎么样是 DeepSeek 的这篇文章先让大家意识到 GRPO 这条路可以工作然后之前有很多人在探讨 O1 的时候会去想是不是通过 MCATS 这种

搜索的方式去实现的对以及包括说是不是用了像 PRM 这种按照步骤去进行标注进行 reinforcement 的办法但是 DeepSeek 非常慷慨地说我们试过了这条路不通其实很多时候知道一条路不通就很重要对吧其实最近我学了一个词我觉得挺有意思的叫做一比特信息就是有的信息很关键一个比特就够了比如说 R1 这条路或者 O1 这条路能不能往前走

一个比特就够了那么我觉得 DeepSeek 这篇论文呢确实很厉害的一点就是告诉大家一些 eBit 信息比如说 MCTS 此路不通或者至少我试出来此路不通那你这条路可以先不用走了对吧这种 eBit 信息一方面是 DeepSeek 它做了很慷慨的分享

另外一方面有的可能也是比如说硅谷和现在我们中国的差距就是硅谷可能还有一些一笔特性其实我们还不知道的比如说对于前沿的研究员其实包括我们去年做的一些了解来看在 24 年年中在硅谷 RL 这条路线走得通的这个信息就已经成为一线 lab 的共识但是这个事情要逐步的比如传达到中国传达到再来可能在 O1 出来 R1 出来之后大家说确定了这个事情是可以走通的

所以前沿的探索很多时候它还是隐藏在这个这些伊比特信息里边的所以开源的这种飞扬精神一方面是让模型的这些同行训练者们他们学到了很多同时第二方面大家也看到最近微信也介入了 DeepSeek 然后百度也介入了 DeepSeek 这些本来自己有模型的公司他们其实也是因为 DeepSeek 的这种开源特点所以他们才有可能去使用

同时这样让更多的人能够用上一个好的模型比如说我们投的 Monica 他们最近也上了一个国内版也用了 R1 因为在之前很多时候国内的应用开发者他们首先在海外去做应用也是因为海外有 GBT-4O 有 Cloud 3.5 这样的好的模型所以他们能做出好的产品但现在国内有了 R1 这样好的模型之后我觉得确实它会让国内应用开发者他们手中的武器变多了

并且我觉得开源其实也是让行业变得更快对吧它会让大家都能够互相学习互相进步所以我觉得开源 VSB 源在这个事情上其实是非常重要的一点第二就是 OpenAI 并没有公布 O1 训练的这些细节但 R1 的公布呢所以让大家看到 reinforcement learning 强化学习这条路确实能够走很远那么指出了一条大家值得一直往下走的路这一点我觉得是 RL 的胜利刚才说第一点是开源的胜利第二点我觉得是 RL 的胜利

第三点我觉得 R1 包括 V3 包括整个 DeepSeek 证明了说团队的专注很重要在资源的限制情况下反而大家能够想到更加有创造性解决问题的办法

其实比如说用 MOE 这本来就是一个省资源的过程因为如果你用一个 dense model 其实你需要的推理成本和训练成本都大很多用 MOE 并且在比如说芯片这些遇到卡脖子的问题上怎么样在一个合法合规的基础上通过像 MLA 这样的技术创新然后让不管是训练还是推理能够跑起来能够获得更好的效果我觉得这个其实就是资源限制很多时候反而是创新的源泉

同时 DeepSeek 也是一家在研究方向上做了很多选择的公司比如说他们没有去做多模态的生成他们没有去做类似于情感那个方向因为 23 年很多人都在做 AI 虚拟女友他们也没有去做 2C 的产品直到在 R1 发布之后才上线了他们的 APP

我觉得所有的这些都是让他们其实他们已经有很多卡很多钱很优秀的人但是仍然需要专注在提高智能提高模型的基础能力这个条件下然后把力量集中在一个专注的方向上获得这样的结果我觉得这个其实也是体现了对技术的 vision 对做什么方向的坚定选择然后再坚决的投入带来的好的结果然后我觉得这里面其实也反映了就是说

在现在对于年轻的很 AI Native 的团队是能够去跟规模更大有更多资源甚至有更多用户的大厂去 PK 的因为之前大家一直会觉得大厂有钱有人有卡还有很多用户那小公司怎么跟他们竞争当然 DeepSeek 不是一般意义上的小公司但仍然它是一个相对比较小比较年轻的团队这里面很多的成员其实都不是海归对吧是

中国本土培养的这个研究生博士生之前有很多人觉得可能最优秀的人才都在硅谷我们就要去从硅谷找来杨和尚才会念经现在大家发现中国其实已经有最优秀的 AI 的人才甚至有人说现在 AI 就是中国的中国人和美国的中国人之间的竞争那么在这个过程中我觉得让大家对中国的人才体系其实有了很强的这个信心其实这个也很关键

而且我觉得还有一个对我来说很重要的启示是 DeepSync 证明了在技术革命的早期如果你能够通过技术进步给用户带来一个全新的像魔法一般的体验但我相信很多人看到 DeepSync 它 R1 模型是他们第一次用到一个

就是 reasoning model 或者叫做推理模型看到它输出的这个结果用户会觉得很棒所以这样会引发自发的传播它又带来很多自然水几千万 DAU 这个没有花一分钱广告费然后同时它的 API 也供不应求很多人都想去付钱使用它的 API 甚至有人说能不能给我一个 DPC 一个付费版我能够稳定地用完完我愿意付钱

这样也意味着说技术进步带来产品体验的变革产品体验的重大变革带来用户的自发传播自然流量同时也会涌现出商业模式

所以我觉得这里面可能我们还是在技术革命的早期要坚持技术的突破在智能上的领先而不是说在已有的智能上去进行很多产品运营的雕花你觉得这个已经是共识了吗我觉得其实这一点在之前有很多人去提其实之前 23024 年其实也有不少 researcher 尤其是他们会说智能很重要不要在已有的技术上雕花但是我觉得大家需要一个鲜活的例子

因为我觉得在 24 年 DeepSeek R1 横空数字之前其实大家或多或少还是陷入了一种对于你有多少 DAU 你有多少流存你有多少时长这种互联网时代指标的关注所以在这种关注下举个例子比如说为什么那么多人喜欢当时做 AI 虚拟女友为什么

为什么有很多人要做 AI 打电话这样的功能是因为他看到好像确实这样的产品流程会比较高用户聊的时间很长因为你跟他打电话当然时间长了但是这个是不是智能我至少自己认为它并不是来自于智能的提升而是在于说满足用户的情感需求对吧那如果你把时长 DAU 作为优化指标你可能就会去做那样的事情你可能就不会去做 DeepSeek 这样的这个提高智能的产品

但是之前其实我觉得在中国互联网其实大家也有很多争议就是说既然大家企业服务的这个图量比较少大家好像都愿意为杀时间付费不为省时间付费那提高智能是省时间的对吧那 AI 女友可能是杀时间的所以大家还是在习惯性的寻找下一个字节跳动

所以我在 24 年给我们 LP 的一个汇报上就是 10 月份我其实就讲了一点就是未来的字节跳动可能不会延续字节跳动的这个公式因为字节跳动是通过占用用户时间去赚钱的但是用户时间只有这么多抖音王者荣耀大量的已经占了这么多了那接下来的这个杀手应用也好或者大的创新可能就是在于说帮用户省时间或者说在用户这 8 小时 16 个小时以外去给用户创造价值

而不是说我一定要把它刷抖音的时间抢过来因为那是很难抢的对吧抖音很厉害啊

所以我觉得这个需要一个例子证明这一点我觉得 Deep Seek 其实给大家看到了一个很好的一个榜样吧所以总结下你刚刚说了开源的胜利 RL 就是强化学习的胜利专注的胜利还有本土年轻团队 AI Native 团队的胜利以及所有这些最后加起来可能是你带来一个魔法般的体验它会帮你去产生一个很大的影响力就是要技术往前推进推进技术的前沿对

我们刚才是讲的就是 O 系列还有 DeepSync 的 R 系列以及 DeepSync 整个的全球大出圈这么一个变化那接下来我觉得可以延展就是说这些变化带来的后续的连锁反应有一个其实你刚才已经提到了就是说这个推力能力的提升它可能大家觉得它会指向 agent 就智能体的这个应用这也是从去年底开始到现在我觉得频繁在讨论的一个点对我们可以先讲讲就是 O1 带来的这个推力能力的提升可能会导致一些什么新的变化

是首先按照我们刚才讲的这个框架就是技术进步解锁新的产品形态那我们可以看到 GBT 然后 GBT 的 scale up 到 GBT 3.0 然后到对齐成对话模式的 instructor GBT 然后出来 GBT 3.5 的模型解锁了 chatbot 这样一种产品形态然后 sownet

微代表的 coding 能力很强的这些模型其实解锁了像 cursor 这种帮助你编程的编程助手的产品形态其实它是一个互相成就的没有 Sonnet 的 cursor 就不可能火然后我觉得从 Sonnet 3.5 开始模型具备了一定的推理能力然后 O1 以及 O1 之后的 O 系列的进展让模型的推理能力变得很强这个其实解锁对应的产品形态我认为可能就是 agent 首先什么叫 agent

那么在英文里面 agency 这个词有个意思叫主观能动性,就是以前地球上具备主观能动性的可能只有人,就人能够去知道自己要干什么,人能做计划,人能使用工具,人能评估自己工作的结果,所以我们统治世界嘛。但是现在逐渐的 AI 的能力到达了一个突破点,使得 AI 能够扮演 agent,也就是具备了 agency,主观能动性。

这个在我看来是由三个技术的进步导致的或者解锁的

第一个就是 reasoning 就是推理能力因为它如果推理能力或者说基础的智能不够强的时候第一你不知道要做什么第二你无法列出一个切实可行的计划去完成对应的步骤同时你也无法去检查自己是不是完成了这个任务对吧所以这是个基础的智能第二个就是 coding 的能力因为在数字世界理解 code 写 code 去完成任务是一个最基础的能力这是整个赛博世界的语言

对吧所以在这个过程中能看得懂代码能够写代码其实这是一个最基础的能力第三就是工具使用能力因为在数字世界人已经为自己造了这么多的工具这么多的软件那 AI 首先得适应人类用的这些工具

比如说 AI 也要通过使用人的浏览器使用人的网站去获取信息所以工具使用能力也很重要那我们看到这三个能力就是 reasoningcoding 和 tool use 就是工具使用能力在过去的 12 个月里面都发生了翻天覆地的变化

进入到了一种指数增长的阶段那这里面其实有一些不同的 benchmark 可以去衡量对吧比如说推理能力假设我们用所谓的这个 GPQA 也就是它其实是一个人类博士生入学资格的这么一个级别的问题基本上普通人类能够得 20 多分人类的博士生能得 60 分

然后 AI 最好的前沿模型在这个 20 年年初大概是一个几分或者是十来分十几分左右对但现在前沿的模型比如说 O3 应该是 70 多分如果我没记错的话 20 年底到了 70 多分到了 70 多分所以这个涨得非常快然后编程能力大家一般用 SuiteBench 这个用途比较多它是抽取了一系列 GitHub 上真实存在的人类编程任务可以认为人类也要干这些事情

那 4 欧在 20 年年初得个位数好像是五分还是多少分反正就属于基本不可用的状态但是在现在欧三迷你或者说欧三应该已经到了七八十分的程度也就是认为百分之七八十的人类编程任务都可以被解答

然后比如说像这个工具使用,TalBench 也是一个定级票啊,电商啊这些的这个 Benchmark,之前在 24 年年初,一年以前,基本上前沿模型也就是个位数的得分,现在大概能做到比如说三四十,四五十,或者甚至六十,所以我们看到现在其实有个问题是,我们已经不知道考 AI 什么题目了,因为前一阵子比如说陶泽轩做了一个叫 Frontier Math,就是说这是非常难的数学问题,证明最简单的题都是 IMO 的难题,

他就说这个能够挡住 AI 几年的时间结果现在 frontier 也变 25 分了就是在 O3 的那个里面那 O4 可能就更好对吧我想问奥赛的金牌如果做这个 frontier 这个 math 能得多少分啊应该是比较难的因为这里面它起步就是 MO 的难题

相当于数学前沿科研的水平对当时说可以挡住 AI 一段时间但是你会发现当 reinforcement learning 在一个领域能够得到使用的时候这个成长的水平往往就是指数的其实我们在之前 AlphaGo 看到了后来那个 DeepMind 做了一个 AlphaStar 就让 AI 去玩心机争霸很快就超过了人类的顶级玩家然后自动驾驶其实已经比人要安全很多倍了只是因为很多监管人员没上对吧所以

reinforcement learning 进来的地方往往就会导致 AI 迅速超过人的能力所以我把这个叫做李士时时刻因为李士时当时跟 AI 下五盘输了四盘对吧那个很多人当时都看了反正我不会下围棋但是我们都知道围棋很难以前都觉得 AI 解决不了围棋但是那时候发现 AI 原来比最强的人都能轻松打败所以那一刻其实很多人第一是这个信仰破灭的时候对人类智力信仰破灭但第二呢同时也是很多人投入 AI 研究的时候说哇 AI 这么牛不要去做 AI

但是它是在围棋对吧那我们其实会越来越多的在各自的领域看到理事实时刻再举个例子就是 CodeForce 其实是一个 competitive coding 对吧这个是在 O3 的 benchmark 里面它是拿了 2703 分应该是它其实已经超过了人类 9.9%的水平可能已经到了全人类前 200 名的水平那这个就意味着说它就是形成了超人的智能

这些其实很多时候都是 RL 这个范式解锁之后带来的结果当然我觉得 AI 里面有一个特别有意思的地方就是往往一个东西实现之后大家就说这个不算我们再来一个因为如果按照以前图令测试的标准现在 AI 早就已经达到了现在都没人提图令测试了对吧人类是不是很快就没有能够评价 AI 能力的能力了我觉得现在已经很缺乏了现在阿里斯汀大王搞了一个 Humanity Last Stand 对吧就人类最后的堡垒的问题现在好像也到 20 分了就是

那个一出来也是满分是 100 分吗它满分是 100 分现在也已经 20 分了但现在问题是说从 20 分到 80 分可能很快的而且关键是你想人类呢要想出难题来那对人类是个很大的挑战对吧但是如果 AI 它是靠划算力靠 IL 靠更强的 influence 就能实现的话那这个其实你是可能感到的

对就你刚才说这个离世时时刻嘛其实离世时刻最开始的开端肯定是他超过了人类这是一个很直观的当然我跟一些下围棋的人聊比如说像罗天成他自己就下围棋他会怎么来理解这个事情就是说当这个 alpha go zero 出来之后他不仅是说他超越了人类而是说人类的智能其实不能理解他

他说他下围棋和做自动驾驶都是这种感觉自动驾驶坐到后面他说我自己去车上去试乘是试不出来什么东西的然后下围棋也是现在人类可能积累了比如说上千年的一些定时 AI 就给他打翻了对 当然然后你也理解不了但是他就比你高我觉得可理解性和可解释性其实并不一定会存在的对吧

对因为按照第一性原理就人类现在是根本没有办法掌握世界上所有的真理和规律的大量的规律也不要说别人比如说我们可能也无法理解爱因斯坦怎么想出来的但并不妨碍我们去跟他合作但如果你进一步来想比如说猫猫狗狗他也不理解人类为什么做这个事情对吧所以可能很快就会变成一个小学生如何考核一个博士生可能我们现在就在逐渐会面临这样的情况小学生想出自己认为很难的题考考博士生会怎么样其实

可能就变得越来越难所以这是一个我觉得对于 AI 安全现在很至关重要的问题对吧就是你现在可能都无法评价了因为现在很多人类已有的测试都被刷到了 95 分以上像我们在清华读书经常有人讲说你好 100 分是因为你能得 100 分他好 100 分是因为只有一百分

就只有一千分他也可以得一千分现在已经到了这个阶段吗就我们已经无法评价 AI 的能力我觉得还不是无法评价但是我觉得已经可以在很可以预见的未来可能就是小几年的时间内你就很难去评价

那个时候会带来什么呢其实我觉得现在大家已经看到了很多苗头比如说春节期间有一篇文章据说梁文峰发在知乎上的回应非常火对吧后来大家发现那就是 Deep Seek 那很 Deep Seek 风因为我们经常看 Deep Seek 所以我们能 get 到但是我想 90%的人 get 到因为我朋友圈很多人转我朋友圈就还是很多人是水平还不错的我最近一直在用 Open-Ed Deep Research 其实给我很大的帮助很多的震撼因为我们刚才聊 agent

其实 agent 的第一个应用场就是帮我做研究然后我问他一个问题他得去想我怎么去解答这个问题列出研究计划寻找资料进行总结进行对比对吧然后我们去看比如说从原来的 4 欧他没有 reasoning 的能力然后到 01 后来 01 出了 01pro 就是想更长的时间对吧然后 01pro 然后又进入到下一个叫 03mini 的 high 就是用 03mini 想更长的时间然后又到了 deep research

那么整个这个过程也就是发生在三到六个月的时间但我已经明确感觉到他的水平提升是指数级的我昨天其实就在想假设我们从大街上随便找十个人这里面我认为至少有九个人他的能力就是已经不如这个 deep researcher

因为 deep research 可以对任何你需要的话题在几分钟内给出一个我目前看来认为是一个工作一两年而且还是在一个比较好的公司工作一两年的白领的水平的研究报告那我可以想象很多人类其实你给他再多的时间他还没法具备一样的思考推理能力信息获取能力总结能力

所以我觉得 AGI 已经不是一个说科幻概念因为如果两年前大家谈 AGI 大家还觉得是很遥远的事情而是在一些这样的任务比如说收集信息整理信息的任务上已经超过了大多数像我们这样的人比特进比特出的信息工作者所以这里面比如我们今天这样的聊天对话 AI 做不到因为这是我们的专有信息在我们今天聊之前这个信息不存在但是如果这个信息已经存在在机构上某个地方

它没有一个专有的信息的话那么 AI 一定是比绝大部分人绝对要做得更好的我觉得这个是很确定的事情所以我确实觉得增长速度很快我们看到了这个指数增长同时也会看到很多刚才说的这个理事实时刻的到来但这些我觉得回到开始的话题就是我觉得会解锁 agent

带来一个重要意义是什么呢我觉得过去我们互联网看到了所有产品模式我可以把它总结成为一句著名的话叫 attention is all you need 因为我们去想比如说不管是说当时这个腾讯还是说字节对吧其实核心都是你有多少用户用户在你身上花多少时间它其实可以理解成为一个公式就是时长乘以用户数然后乘以变现率

对吧那么所以大家想的都是我要有更多用户用户花更多的时间然后我的 upvote 更高但是这件事一定是有个尽头的对不对总共就这么多人每个人睡觉 8 小时醒来的时间最多 16 个小时我们现在看手机的 screen time 已经是八几个小时了你还得吃饭工作你还得干些不能看手机的事情对吧所以这个你很难提高 eBay 所以大家就要提高变现率对吧同样的一个小时我怎么样从里只要获取更多的价值可能就变成了抖音的视频广告直播对吧那么这条路它肯定是有尽头的

但是人类历史上所有的事情目前都需要人的 attention 无一例外只有一种不需要就是所谓的自动化就以前所谓机械自动化机床人把这个事情给自动化建设起来之后他可以自行运转但那个事情它是没有 agency 它是没有主观动性的

所以人类以前要不然是要人类的注意力要不然就是简单重复目前 AI 的技术进步带来了说第一不需要人类的注意力第二又能自主执行任务的可能我觉得这个是不夸张的说是人类这个物种它从诞生以来最大的进步因为如果我们认为人类跟其他动物的区别是人可以使用工具其他动物不行

那以前人类用的所有工具都需要 attention 直到现在 agent 出来了一个不需要 attention 的工具比如说当我把一个问题丢给 deeps

他会自己研究五分钟这个过程中不需要我的 attention 当我去年用到 Devin 的时候我发现我给他一个任务他就自己去干了这个过程中我可以去打断他我可以说我有个新需求或者我可以看看他做的怎么样了但如果我不去打扰他他就会自己去做所以我想提出一个新的一句话叫 attention is not all you need 在 agent 的时代那么这个会导致什么这个会解锁人类无限的潜能因为刚才说到人类 attention 就这么多

但人类如果你的 attention 不需要再被使用的话那他的理论倍数是无限的但这个就有点像什么比如说从一个老板的角度你让员工去干一件事就不需要你的 attention 了对吧那但是这是老板的好处所以我们以前大部分的人其实都在执行别人 attention 的结果对

那只有少数人是老板但现在 AI 越来越强大的时候每个人会做 AI 的老板那你让 AI 做什么这个其实是一个很重要的问题因为很多时候大家发现这个助手很聪明但我让他干嘛呢那除了大家经常讲的订机票订外卖这种简单事情之外你有什么事情可以让 AI 做的我觉得这个对社会对大家教育会有重大的影响但是我相信如果大家适应了这种范式之后其实你会发现你有更多的事情是可以让 AI 去做的

所以这个我进一步的延展就我觉得我们可能会看到一个叫做工作的 scaling law 其实现在工作或者生产力是不太能被简单的 scaled 比如说一家大厂它有一百个亿一千亿它不能简单的把一千亿变成生产力它也得招人也得培训然后人多了之后还会有内部的政治它还会内斗所以有钱并不一定有生产力

但是如果 AI 的模型越来越强并且模型的推理能力越来越强那你就发现你有钱钱等于算力算力越多你就能够让 AI 产生更多的生产力这其实就是一个钱变成生产力的 scrolling law 这个里面的几个维度就是钱算力和生产力钱可以等于为算力吗

或者可以近视等于还有模型的性能对吧模型的能力然后算力然后更大的生产力对就第一个是模型性能要越来越强第二是它要有 Inference Scalability 就是它想一天就比想一个小时好想一年就比想一天好当然这个对模型有持续的要求因为现在可能比如说模型想五分钟比想一秒钟好当然想一个小时可能也不比想五分钟好对吧所以我们能让模型有增量的

performance 的想多久这个会很重要就跟我开始说的康德在那想了几十年想出来几大批判说明他能够持续地提高他的 influence 的能力对吧但普通人你想太久可能也想不出来一个有意义的结果这个就是区别嘛这是你的基础模型能力的差异对吧但是世界上需要这么多的生产力吗

这个就跟当汽车飞机发明之前大家说我们要动得那么快那我去隔壁村我走路就行了为什么我要坐飞机呢你觉得它会冲到新的去我至少觉得历史上大量的技术已经重复地验证了这一点我们为什么要跑得那么快我们为什么要有那么多的电力我们为什么要那么多的算力其实这个拍等是一直在出现的

但其实人类的技术爆炸的时间很短也就四五百年就你相比人类物种和长期的古代历史的话它其实很短的时间这个其实是一个更有意思的点就是说原来人类的技术爆炸是以 generation 为单位的是以一代人为单位的然后逐渐的就变成了说一代人他生命周期中可以发生几次

技术爆炸比如说我爷奶奶都 90 多岁了那他们这辈子经历的技术爆炸太多了对吧但现在变成了说 10 年之内就能够经历技术爆炸 AlexNet 到现在才多久才 13 年时间对 12 年的时候 12 年时间所以如果当 10 年 Chad GPT 到现在才多久对吧你还记得 Chad GPT 刚出来的时候他的能力吗那个时候我们觉得很牛但是现在想就很差对不对如果当这么快的变化的时候人可能就很难真的去适应了所以这个里面我觉得会产生很多的社会上的影响但这个刨开之外的话

指数增长本来是世界的常态但是指数增长在最后陡峭的曲线之前它看上去很像线性增长对它是突然对有一句话叫 graduate then suddenly 就是当它进入到那个快速上扬的时候它之前其实还原没啥所以这个其实也是为什么

我觉得像一些关注 AI 安全的人他们会很关注因为大家觉得已经进入到一个指数增长的阶段了那这个时候你就得不叫未雨绸缪了已经开始打雷了快下雨了但这个可能有点说远但是我觉得生产力的大幅提高这个是一个很重要的变量因为如果你认为生产力最后带来的是基金价值的话对吧当然这里面就变成说生产力是什么

怎么样为大家去产生这样的价值但可以想象这里边我觉得一方面比如说 Samuels 他们说一个人的公司会变得很强大因为如果一个人他能够很有效地指挥 AI 然后他甚至通过 AI 指挥 agent 他可能能创造很大的价值这是一方面

但另外一方面现在我们说我们投创业者创业者为什么有的时候能打败大厂也是因为创业者他具备更高效的把同样的资金变成更多生产力的可能因为他有更好的 vision 他更加努力怎么怎么样对吧他没有什么组织的主力但假设大厂也能够花一大笔钱去雇佣很厉害的创业 agent

那也许普通的创业者是打不过大厂能雇佣的 agent 那可能只有顶级创业者能够打败大厂那一般的创业者就被大厂花钱请人家给干掉了这也是说不好的事情所以也有人认为这个会导致富人更牛因为富人能买来更多生产力了原来你固然有钱那你也比不过一个很聪明的年轻人对吧也许以后不一样所以我觉得会发生很多这个

两方面对这是两个方向一个是其实是超级个人一个是像那种很多科幻乌托邦里的我汇聚到一个更厉害的公司上所以我觉得它带来的变化不管是生产力的角度社会结构的角度都是很大的但这些我觉得解锁的前提条件都是在于说模型能力要提高

所以这里面我其实觉得有的时候在技术革命的早期找到第一个 PMF 有的时候是一种甜蜜的陷阱或者是一个诅咒比如说咱们说移动互联网第一个找到 PMF 的可以说是黑莓因为他用当时的技术他说我这个处理器很弱网络很慢所以我只能发邮件发黑莓 message 收 push

所以他为了做好这个 PMF 他就做了黑莓手机上面有键盘毕竟他一直以键盘为傲但是呢当这个技术进一步进步处理器更强网络更快屏幕更大的时候苹果说不要键盘苹果就做了一个全键盘手机那个时候黑莓其实说他没有键盘他打字发邮件肯定不好用

但是这就是你找到第一个 PMF 的诅咒因为当后面的技术升级的时候你会被你自己的 PMF 给困住其实互联网也出现过这样的情况雅虎是互联网第一个 PMF 的公司可以算是吧那就是盟户类他就是盟户他就说我信息列在那给你看对吧所以当后来收费引擎 Google 出现的时候其实对雅虎来说也是个巨大的冲击因为原来雅虎是很复杂的上面有大量的这个内容你要去点击去看 Google 就是一个矿直接进去输就行

当时雅虎其实曾经尝试买过 Google 但它出的价不够高对吧而后来 Google 就把雅虎街又颠覆掉了对吧对所以我想说的是比如说 Chatbot 可能也是一个甜蜜的陷阱比如说当你有这么多 Chatbot 的时候你可能就想说怎么在这个基础上去进行这样的优化但是我其实一直觉得 Chatbot 可能会限制前沿 AI 模型的能力为什么这么说呢比如说你现在跟 ChatGBT 或者 Kimi 或者豆包聊天你会不会有一个习惯是说

你跟他进行的是很多类似于在微信上的短对话就是比如说经常有人说我有个问题然后 AI 说你说吧我想做什么什么然后 AI 再反问你就是我们的对话是很碎片化的但是如果当你需要给一个 agent 一个指令的时候很多时候你其实更需要写一个更重要的 proposal 比如说就好像你去申请一个国家自然基金计划的时候你要写一个申请我要做什么事情我的目标是什么我的条件是什么你是要做一个完整的沟通对吧对吧

但是呢这个你就发现在 chatbot 那个有点像微信的语境里面其实你可能做了一个碎片化沟通这个时候模型的智能其实不一定能体现出来我之前其实就跟 OPPY 同学聊他们就说他们其实发现先进的模型在用户聊天的时候其实并没有让用户的满意度提高太多

这个其实就有点像如果你是个人聊微信那可能一个普通大学生和一个科学家聊微信的感觉没那么大不一样但是你如果说让他写个博士论文那可能就是完全零和一的区别区别

所以 chatbot 这样一个比较早期比较容易让人接受的产品形态其实并不一定是能走的最后的产品形态而如果你现在在这个上面去进行短期指标的优化比如说我怎么让大家在 chatbot 上停留的时间更长呢也许就说那我要做个打电话功能

但打电话这件事情跟智能的提升是不是一致的甚至也许不一致因为要把电话打好其实可能跟智能没关系可能跟说话的语气情商这些有关系但它对于你成人生产力可能没关系所以我在想历史上其实往往有这样的情况就先找到第一个 PMF 的人他如果不去进一步的去探索可能会被那个 PMF 给困住这其实历史上也是发生过很多次的

因为我们刚才做了很多关于 agent 的展望可能已经到比较远的也许几年后的事吧那比如说如果在 25 年的话你看到了这种 agent 的形态就在你说的这个工作 scaling law 的这个逻辑下它可能会是什么第一批我觉得第一批像现在为什么现在最火的叫 deep research 对吧你看 open AI 出了 deep research 当然这个最早是 Google 出的 Google 出了 deep researchopen AI 出了 deep research 然后 Perplexity 出了 deep researchGrok 刚发布的也有这个 deep search

然后我也知道好几家创业公司什么的都要发这个方向因为大家都发现让 AI 更深度的去研究一个信息获取更多的资源然后根据获取的内容进一步的决定获取什么样的信息形成这样一个循环的过程之后给你个研究报告这个其实也是我们经常让我们分析师啊接着去干的事情对吧

比如说研究一下晚点这个企业是怎么回事给我个研究报告但是大家就发现这个事情我同样的推理时间或者我稍微花点时间我能够得到更好的结果这个我们把它叫做 read only agent 就是他做的事情是 read only 他只读他没有做写的操作他是做读取的操作对吧这个我觉得是目前看 PMF 已经很明确了就我发现我的这个 deep research 确实比我的实习生干的好了

好了所以这个我认为是一个付费意愿很明确场景很明确的就针对我们这些叫知识工作者需要做这种在电脑前面研究一个话题看一堆网站最后得到一个报道

报告这样的人那么第二步呢就是从读到写那么 OpenAI 出来这个 operator 对吧然后 Anthropic 出了 MCP 其实都是关于说 AI 怎么使用我们的这个工具这个其实它会带来很多的安全隐患因为大家都不希望它乱搞但是呢显然在一个可控的情况下给 AI 一个能够去做写操作能够对外发布信息的这个其实是一个非常重要的能力

我们投的这个 Monica 其实他们在做一个类似的这样的产品他们昨天跟我分享他们在这个开发产品的过程中遇到了很多很有意思的事情比如说其中有一个他们测试的问题是要获得美国某个城市可能凤凰城或者哪他们的一个地铁时刻表然后呢这个模型首先就去官网上去看然后发现

那个地写时间表已经打不开了那个链接已经打不开了这个时候模型干了一个什么事情呢直接吊起了一个邮件客户端开始给那个凤凰城的市政府写邮件问他然后最后到了是否发送就说他完全可以做这样的事情对吧这是台湾的产品吗

对因为他们的产品其实是一个可以去调动工具调动浏览器的这么一个产品它有点像 Debian 但它是一个就是说可能更加便宜然后加入了一些专有数据和专有模型的版本其实 Debian 为什么我觉得很激动虽然我觉得 Debian 本身可能它不是一个最后的形态它可能是一个先驱吧但是这里面提到了很多很有意思的特点比如 AI 主动的使用工具然后 AI 有一台自己的电脑

这个也很有意思因为很多人之前觉得比如说包括可能像一些国内的像 AutoGLM 这样的工作他是用 AI 来控制我的手机就 AI 在我的手机上点外卖但是仔细想一想你的助理是用你的手机还是用他的手机应该是用他的手机对不对所以应该是说我的 AI 助理生活在云端有一台他的手机或者一台他的电脑他去用他的电脑给我点外卖而不是说他用我的手机点外卖因为我还得刷抖音我还得聊微信对吧其实这个就是叫虚拟化技术

这个在 Dev 里面其实得到很好的体现那在权限上他的这套云端的电脑用的还是你的账户体系对吧不一定啊也可能他有他的电脑比如说假设你现在订了一个很贵的什么 Bloomberg 也许你的助理说老板把你的账号借我用一下然后你在上面输入你的账户他去用那另外一个情况可能是你给你的助理也买了一个 LinkedIn 的一个 Premium 对吧他去用都有可能

其实你会发现当 AI 能够使用工具的时候它可以做很多事情因为其实大部分的软件工具无非就是第一调 API 第二去使用那个界面本身所以为什么其实 Kimi K1.5 这个工作它里面是一个多模态推理这多模态推理如果你要在使用软件界面的时候其实很重要因为你要看网页你要看懂这个网页像现在大家说世界模型去理解世界理解世界其实还是有蛮多难的

比如说简单的例子现在 AI 就看这个深度信息其实不太能够看出来比如我们看一个东西我们是知道它是有深度的有前后的现在 AI 对这个深度区分一般但是如果你只是看电脑和手机的界面这个其实是可以做很多很多的事情所以这是第二种就是也帮你去做一些操作去写的就是既读又可以写你想它可以写的话其实这边有很多很有意思的例子我随便再举一个

当他遇到一个问题的时候他理论上可以发帖去求助的他甚至可以说我悬赏因为我已经跟我的什么支付商绑定了哪个人类帮我把这事干了我给他一百美金这个事就并不是科幻是完全可以做到的对吧那在这个里边 AI 做件事情的效率和它的解法而且现在我们发现强大的 AI 模型它能想出很多人类想不到的解决问题的思路

比如说人类说这个问题解不出来他可能说我能不能换个问题我能不能需求我原来没有的权限所以这里面是 AI 研究非常多研究安全所需要做的事情他可能为了解题他真的去做了一些有伤害性的事情我自己遇到一个很典型的例子是我用 Windowserve 也是一个能够在我本地进行操作的当时我让他做了一个我的个人网站的示例然后他为了部署这个网站他说你这里面有两个进程占用了我的端口我要把它杀掉

我当时就说 OK 杀掉吧回来我想那万一杀了这个系统进程把我搞崩溃了怎么办就是他只是为了部署那个 demo 网站但是他没要这个东西可能对我产生影响当然这个东西是可能去对齐的对吧就在这里面有非常多的可能的风险所以这种能够写的 agent

能做好了之后他的能力很大但同时他肯定会部署更慢因为他可能带来的后果也很大他需要很多的监控对他的训练对他对齐还防止他被滥用所以我觉得读会比较快写 operator 其实是个例子但如果你用 operator 的话你会发现他还不如你自己订机票订的快他现在好像很慢

很慢因为他每一步都要你确认但是 AI 里面慢这个事其实总可以变快的就是从慢变快从贵变便宜这是一直 AI 都在发生的事情所以可以想象如果现在你需要你的助理干三十分钟的事情 AI 一秒钟就干了你可以每天多干多少事情

你控出来的事情你可以想干别的更多的事情对吧所以这个对大家产生的冲击也是会很大对这个进阶的路程是不是就是 OpenAI 之前定义的五个技术级别 agent 下面就是创新者再下面就是组织者

对其实这里面又会衍生出来几个问题比如说最简单的问题就是现在是人指挥 agent 那能不能 agent 指挥 agent 假设你每个任务都一秒钟完成那人提问题就来不及了对吧你那个头脑提到以后就是你的 agent 然后对接宇森的 agent 他们就写好了已经对我觉得是完全有可能的

但是要实现这一点有个重要的就是 memory 因为你现在用的下载 GPT 和我用的下载 GPT 你回答同一个问题差不多对吧但实际上肯定应该除了公有的那部分之外那我的假设跟我在一起待了几年的助手肯定会回答不同的问题对吧这样才能导致说咱俩的 agent 能聊因为我们都有我们自己的 memory 现在这个 memory 其实还非常初级对

今天早上在讨论 attention 的时候也是讲到这个记忆对所以我的记忆是一个非常重要的一个就是说大家也都在做但是还没有做得特别好因为现在如果你看 ChallengeBT 他的记忆其实是他给你形成了一个系统的 prompt 说这个人有一条狗这个人是一个大学生什么的那都很简单对吧深圳的记忆其实非常长

而且这个记忆又牵涉到有的是你跟他对话主动灌给他的但有的可能是比如我看到了这些东西对吧所以有人说是不是在眼镜啊或者在什么地方但是记忆肯定是一个非常重要的点然后

然后还有就是 online learning 这个其实也是一个非常重要的点因为想一想人有一个很独特的本事现在 AI 还不具备比如说 AI 的模型现在还得发版就是你得发一个新的模型来改变这个模型的权重但人其实在日常生活中不断地通过自己的学习不管是读书还是社会人可以主动改变自己大脑的权重

这一点其实是生物的一个特点生物可以改变自己大脑的权重使得它去输出原来它不会输出的内容但是 AI 现在还得训一次就还得有一个训练过程这个 online learning 其实也是一个非常重要的点而且上面还有很多很有意思的前沿探索的话题比如说现在 Agent 是在使用这个人的工具但是显然他如果比人聪明十倍快十倍他为什么要用一个人类的工具

就跟我们不会用小孩子的餐具吃饭一样对不对我们用大人的餐具所以可能会有一系列的工具是为 AI 专门设计的就是你为一个超人设计的工具肯定跟咱们普通人的工具不一样啊

它可以一幕一百行我们一幕只能一行对吧所以在这个里边 AI 专用的工具以及 AI 怎么去迭代自己的工具可能它的工具我们就不会用了就跟我们也不会用 EDA 一样对吧而且有可能这个工具它自己能设计 AI 可能会设计一些自己的工具它觉得你的太不好用了我来改一改所以这个里面的迭代速度其实照着下想就到科幻领域了但是我们现在发现很多这些已经不是说一个纯科幻概念了已经是一个你可以想象这事可以做到只要模型再往前走一走就可以做到的事情

所以为什么我觉得这里边带来的是智能的进步会解锁新的产品形态而且新的这个产品形态可能就会非常的厉害就比原来的 Chadbot 这些在这个原来的基础上去做雕花也好或者做这些细节也好可能你回头就被颠覆了其实我们两三个月前聊 agent 的时候当时你还会提 coding 就刚才其实你没有提到 coding 你是说像就是用来 coding 的 agent 是吧

我觉得 agent 和 coding 的关系第一步就是去做 coding 的 agent 对吧比如说像 Cursor 或者 Windows Server 这样这个其实是 agent 的一个目前比较容易落地的场景但我觉得进一步来讲是 agent that can code 就是可以写代码的 agent

就比如如果你的助理或者你的助理也许是个文科生对吧但如果你的助理你给我自己学习学会了写代码比如他可以做什么他可以写个爬虫帮你去爬更多的信息这样你采访的时候你就知道要采访谁对不对就是你的 agent 学了本新技能叫 code 我觉得这个是接下来更大的一个范式原来第一步是说你的 agent 他主要用来写代码但是毕竟需要写代码的人没那么多嘛

并且确实像 CurseWindows ServerDevon 其实都是在针对程序员对吧但是地球上程序员毕竟只有那么多对吧那更多的非程序员这种 knowledge worker 就普通白领知识工作者他用 agent 干什么那么他的 agent 我觉得写代码是必备能力因为他只有靠写代码才能够在这个赛博世界去行动自如嘛

说到这个想到这个我也是感叹我觉得行业发展很快因为可能几个月前大家来聊这个 agent 还是会想到就是 coding 是一个方向而且也有很多人在这个方向创业很多人在做今天来聊这个就是对我觉得你刚刚那个总言挺好的就是一个能写代码的 agent 对然后他去干更多事原来 agent 是个专门写代码的 agent 现在是一个 agent 他可以写代码但是我顺便问一下是不是明超平的心眼一码

他可能会是这个方向就是一个能写代码的 A-gen 他还在就是他主要 PMF 的阶段我们投他也是因为他过去在 Kimi 啊检验的经历嘛所以我觉得现在 AI 确实 PMF 变得很快啊就是很多时候大家都需要探索所以我们一般不会说啊他是做什么什么什么的我觉得那样的话其实容易大家都陷入到一个把自己给束缚住了嗯你觉得做好 A-gen 还需要哪些能力啊刚才我们其实已经聊到推理肯定是很重要的还有更长期的可能是记忆的东西你怎么解决

还需要你先对我梳理一下就是我刚刚说到现在三大能力推理代码工具使用对吧然后再接下来记忆然后 online learning 就是怎么样能够持续的学习学到新东西对吧然后这里面其实这几个我觉得都是非常

重要还没有解决的问题记忆和那个 online learning 是还没有解决的对吧目前没有看到什么至少没有看到一个指数机增长的 benchmark 的提高对吧就是在 2025 年大家来做 agent 这件事情你觉得它更多是一个应用公司来做还是本身我模型能力特别强的公司像 OpenAI 做 operator 还有 AnswerPig 推出这个 computer use 是这种方式来做我觉得目前来看模型公司确实它自己能够去用 Io 去提升模型的能力并且

他能够用自己更强大的模型去对自己的模型做 fine tuning 的话可能确实是有一定的优势但是应用公司呢我觉得也有几个好处第一个就是他可以用多种模型聚合对吧用各个模型不同的长处第二个我觉得还是一个用户心智啊

比如说你看 BlackSiri 其实它一开始做 AI 搜索其实它是占主的用户的心智它其实用的模型在不断的升级对吧你不断的推出新的模型它就越来越好都是用户认为它就是 AI 搜索代名词其实它反而可能比 CHATGBT 的搜索功能有更多的拥顿然后 Cursor 我觉得也是个很好的例子

就是因为 Cursor 一开始大家也觉得你就是套壳嘛你就是用这个模型嘛但是它跟模型其实是个互相成就的过程就是没有 Sonnet 3.5 的出现 Cursor 就不会那么火它也没有实现它的能实现它预测下一步写什么代码的功能但是如果没有 Cursor 的话 Sonnet 3.5 可能也没有一个好的载体变得那么火因为

你模型公司对于具体程序员怎么用这个模型他不一定有足够多的时间精力去做这个具体场景的研究所以我觉得确实现在出现了模型公司到应用公司的这个风格但是你会发现可能跟这个类比不一定恰当但是比如说 Windows 是微软开发的他同时也开发了 Windows 上最重要的应用之一 Office

但是 Adobe 就是另外一家公司对 它还有很多别的应用对 所以你可能比如说 OpenAI 有模型然后同时有这个 ChatGPT 但是还有别人叫他们去开发这可能也是一个 Office 部门和 Adobe 部门的这个关系你刚才提到像 Molica 也是你们投的公司他们做一些 agent 的探索他们就是基于别的模型或者开源的来做的是吗因为他们不做自己模型训练但是他们下周应该如果不 delay 的话会发一个很有意思的 agent 的产品

我们就觉得看到在这个里边当你能够去使用模型用模型去使用工具然后通过一系列很巧妙的产品设计的时候其实能够带来一些很不一样的体验你刚才提到就 chatbot 这种形式其实对第一个发现这个 PMF 的人是一种甜蜜的陷阱

那在 agent 这种形态的应用上它可能会有陷阱的部分我就是指它会分心你或者拖慢你去极致逼近 AGI 的那部分可能是什么好问题 agent 我还没有想得太清楚 Chelibot 我觉得也可能是我觉得不一定是 agent 因为目前还处在探索的阶段我觉得目前可能还不好说但我有一个感觉就是如果你现在有个 AI 产品的用户量很大那么如果你为了把这么大量的用户服务好

可能在模型的尺寸在模型的能力上就会有一些妥协简单来讲比如说如果你现在用户特别多那你模型比如说就不能很大对吧或者至少说在中国因为大家觉得收费也比较难嘛如果你免费给大量用户提供一个比如说花很多推理成本的模型那你可能就不划算那这个时候可能你就会觉得模型我要做的更轻便一点那更轻便的模型是不是和 AGI 这个就是有冲突的或者说是有阻碍的

所以其实我觉得当 DeepSeek 有这么多用户的时候其实很多人也讨论是不是应该把这个用户给留住我其实自己认为那个也是个甜蜜的陷阱那几千万 DAU 全世界各地各有各的场景你要把它服务好我觉得那个会花大量的时间精力不管从算力上从产品设计上从运营上其实我觉得也会影响探索 AGI 的资源因为毕竟资源不是无限的对吧

现在看起来他们好像并没有有意的去留住我认为这是正确的而且这样才能跟微信合作如果他也想借助这个机会也做成个超级 APP 那微信估计很难跟他合作其实我刚才自己想到有一个点可能是多摩泰但是我相信可能做 agent 的更相关的还是多摩泰的理解而不是深层的那一部分

我觉得多摩泰其实肯定是很重要的但是确实多摩泰现在对智能的提升没有那么快就是因为语言是一个非常浓缩的智能你把语言放在一起肯定它先是一个智能提高最快的路径如果语言被弄得差不多了那一个图像图像其实信息量很大

比如拍张照片对吧就有很多信息但这边带来的智能其实很少你得看好多视频才能形成智能但如果你理解了这个牛顿定律对吧你可能就几句话你就知道了这个地步但是你看多少视频才能总结牛顿定律出来对吧所以视频的话我觉得它很多时候会在具体使用上面但是对于智能的产生这个就是说现在可能它的压缩率还不够高那

那一段时间为什么大家都在训多莫泰的游戏也分两种吧第一种是像 Sora 那个路线就是比较多莫泰深沉我觉得这个它是有很明确的 PMF 的因为全世界有这么多比如说视频广告现在我们看到很多游戏的广告什么的现在就很火的什么做饭大菊猫一个菊猫在那做饭真搞笑

你会发现很多这些视频做到还 OK 就可以去变现了那所以你有这样的一个商业模式包括当时 Media Journey 也是 Media Journey 都没有融钱对吧它其实就实现了一个初步的 PMF 所以这个东西它既然有 PMF 并且也有一些很 impressive 的效果就会有人去做现在 Media Journey 和 Sora 的 DAU 怎么样掉了吗 Media Journey 就是说可能应该还是挺不错的但是应该肯定不是说第一批用户已经用上了嘛

命中约定本来就没有了他们本来就是自带干量然后 Sora 我觉得其实把可林海罗这些大家都按照他的技术方案都做得很不错现在反而看 Sora 就有点好像写个大招但是出来之后没有觉得很惊艳但是昨天 Google 发的 VU2 我看还是挺惊艳的应该是目前至少在单镜头的情况下是最好的视频生成模型但是我觉得现在大家普遍也认为就是视频生成好像在智能上并不是那么

最重要的一个方向可能目前还是在这个 reasoning 这个方向先去卷但我觉得可能也是也是一个就是你目前看到有条路可以往前走的时候可能很多人就会选择先走这条路对吧所以我觉得在 AI 里面我们反复会经历一个探索和奔跑交替的过程就是当你遇到瓶颈的时候你会发现之前可能一些分支的探索看似没有目标的探索可能会带来新的突破

但是如果现在一个很明确的方向比如说两年前可能是 pre-training 大家越来越多的语料去 pre-train 然后现在可能是 IL 就是更多的去做 reinforcement learning 那你肯定是你要先提高这方面的智能所以我觉得在一个公司的角度来讲一方面要有这种在直到狂奔就是你这个大家都在这里赛跑你要赛跑同时呢可能也要有这种 frontier 的探索就短时间不知道会发生什么所以还是适合大公司搞美国就是 Google 中国就是子捷

对或者美国有 PMI 就他们有些所以创业公司根本没有资源就是这样这件事情我觉得也不能这么讲就是说我觉得得看我们现在在哪个阶段以这个阶段会持续多久就比如说如果现在这个阶段就是一个需要创新的阶段那也许创业公司是有可能通过想一个不同的 vision 去避害大厂去停工但如果现在又是直到狂奔

那谁有钱谁有卡对吧那可能就会他就会更容易就往前冲所以我觉得其实一直创业公司的长项都在于说做大公司没看到的事情但如果都已经名牌了那肯定大公司就就更有优势我们刚才在讨论 agent 在 25 年可能会普及的时候其实没有特别讲到成本这个维度就成本降低是不是也是去推动 agent 一个很重要的点

当然而且我相信成本降低一定会发生所以我有个基础假设就是我们先让他能做再把他变得便宜对吧因为变便宜这样一事我认为肯定会发生然后能力变强当然有人包括我也觉得肯定会持续变强但是中间遇到瓶颈遇到卡点也是完全可能的事情

所以我觉得还是得先有然后再变便宜或者说先能用再变得好用然后再变得便宜对吧那如果你能用都还没做到那可能便宜就还谈不上并且呢我觉得在中美确实这个落地的难度也不一样

因为美国现在确实人工成本很贵大家天天看到他的就业就很紧大家都是很多职位招不到人所以对他们来讲比如说 Devin 当时的定价是一个小时的工作大概是几美金咱们可能觉得贵我用他就要花钱但是对于一个美国公司来讲美国加州的平均最低工资是 16 美金就是你找个人去麦当劳工作都得 16 美金 10 星 16 美金对吧那我一个 AI agent

一个小时才 6 美金 8 美金第一很便宜第二它一年之后会变得更强大同样的价格会变得更便宜对吧所以这个事在美国这种习惯的为企业服务付费的环境下是合理的我觉得包括我现在我也是 GBT Pro200 美金一个月的订户我觉得太划算了因为它可以让你做 100 次 Deep Research 每次 2 美金 2 美金我让我的实习生做

我不能半夜两点让他五分钟之内给我一个报告他给的报告质量基本就没他好所以我天天跟我们实际上讲我说你们如果只是收集信息搞一个是是非的报告出来可能真的不如人家 200 斤一次对吧这个比你干得好很多了已经这个 William Gibson 说过一句话就是未来以来对吧他只是没有均匀分布我觉得现在用到前沿 AI 或者是用好的人

他对于这个未来的想象和可能很多人还是第一次用到 Cellabot 甚至还没用过 Cellabot 我觉得这个分布是非常的不均匀的所以可能我确实就觉得在这种文书工作或者我们大量的同学做的就是这种在电脑前面咔嚓咔嚓去查个什么东西的这样的工作确实 AI 替代人不是一个想象了已经在发生了那你觉得在 RL 之后就是带来这个解锁 agent 的这个强化学习之后的下一个的技术范式可能会是什么再往下的话

我觉得首先我觉得 Io 可以走很远第二呢我觉得接下来可能有一个很重要的是发现新知识就是其实在 Abdopic 他的创始人 Darrell 写了一篇文章叫 Grace Machine 好

全称是不是就是他提到说接下来进一步就是 AI 怎么样能够发现新的科学发现或者新的知识这个好像也是在那个 OpenAI 的五级分类里边最高级的一级吧还是哪一级来的第四级吧它第四级是 Innovator 就是创新者创新者对因为大量的科学发现其实都是先去想然后去做实验去验证现在想这个方向那其实 AI 可能已经做得很好

好了在验证端有的时候需要去观察有的时候需要去做一个物理实验化学实验或者是医疗实验所以这个上面可能会有一些限制但是如果我们能找到一个方法大规模的去并行进行实验去验证一个 AI 提出的假想是不是正确对吧包括说这里面可能也有一些像数学定理什么的是可以通过纯思考去产生新知识的那么在这一步上来的话那其实可能 AI 就进入到了一个

我们俗称左脚踩右脚对吧他产生了新知识他用新知识去改变又学到更多的知识可能就形成一个迭代自我进化的过程

但我觉得那个时候可能它诞生的产品形态可能又不一样比如可能真的很多大佬就问我什么时候能发明长生不老药我说这可能都是大家赚很多钱之后的共同目标可能都不是说要 easy 地干更多活就是说给我来一个长生不老药但是这里边肯定会解决人类很多大的问题比如说你癌症的 cure 是什么类似于这样的问题还可以帮 AI 自己解决能源问题是不是

对能源可能也是一个重要的 bondary 对吧比如现在大家就看碳水核能其实原来大家对能源没有这么高的需求因为算力是有指数增长的电力其实没有但算力跟电力挂钩之后然后你就发现它也要指数增长所以大家就开始找各种的液冷的供电的核能啊这些东西

对我就在想 AI 它变得更聪明之后它自己可能也能发现一些更高效的利用能源甚至去解决了 50 年还没解决的可控核聚变的这种问题它必缓了它对就是完成人类能完成的任务但很快就到了人类解决不了任务的时候其实就跟李士实当时不是有一个叫做 Move 37 第 37 首神之一首人类不知道怎么下出来的

对吧但是你只要人类能去 verify 这个结果就是我不知道怎么来的但是我发现 it works 这东西可用那可能就会带来很多新的进步那你觉得就是你刚才说的下一个阶段就是怎么去发现新知识这个现在业界或者学术界有一些苗头吗就是 alpha fold 肯定是一个这样的工作就有一些已经有的成果它是这个方向上的 AI for science 比如我们之前投的金泰也上市了

就是 AI 找新药这肯定是一个大家都在用的蛋白质怎么折叠这个把点但是这个其实也后来在你找到了一个新的潜在的把点你还得把它做成药去做临床实验对吧就这个过程目前看怎么加速但可能还是需要有一系列的合规这个实验的刚才我们主要讲的就是这个推理能力的提升包括使用工具能力提升这些带来的 agent 这个变化然后

我觉得还有一个肯定对现在的格局影响很大的就是 DeepSeek 的大出圈这件事本身也带来一个很大的影响还有它就是非常彻底和一贯的这么一种开源的方式吧对这个我觉得我们可以分几个层面来讲一个就是大的科技公司首先有那些本来就必然的大的科技公司现在也是有很多动作比如像腾讯像百度它是接了 DeepSeek 而且腾讯是接了很多产品

他 AI 主力产品元宝也接了然后最大的国民级的产品微信也接了他大概有十几个产品都接了然后百度可能是文心接了然后阿里像字节是没有接所以你觉得豆包什么时候会接 DipSeq

我觉得首先我跟之也没有任何关系但我会觉得很意外如果多巴选择接 DeepSeq 因为我的理解是字节它是非常想要去探索智能前沿的它会非常注重自己基础模型的研发所以如果接入 DeepSeq 的话可能不管是从对外形象和对内实体上可能都是一个挺大的变化

但我觉得从另外一个角度来讲,如果豆包的用户觉得 DeepSick 更好用,对吧,那也许从豆包用户的价值来看可能这也是合理的,但我想这肯定不是字节做 AI 这件事情他的初衷吧,据我所知他们还是要做一件想要实现 AI 的全面领先,并且他们的人资源这些确实还是非常非常丰富的。

那腾讯呢我们这都是小道消息毕竟我们作为一个天使投资人也没有办法获得他们决策成的这些想法但因为之前有人说腾讯做视频也是后发先至对吧让你先跑三年我这个微信的用户这么多我始终能把它调动出来

那么之前就听说腾讯好像在模型上确实也是一种后发之人的想法因为我有用户的关系我有用户的数据我的微信你始终要用那么当模型这里面出现一些技术的收敛或者说技术成熟之后我再接入并且它确实是一个用户的基础设施产品所以它也

不能够做特别大的调整对吧这肯定也会带运红杂烂很多影响所以我倒是觉得腾讯接 DeepSig 这件事让我觉得是要给腾讯点赞因为我听说是 AI 搜索这个事其实已经是在去年就开始推了但是接 DeepSig 这个决定肯定是来自于最高层甚至 pony 自己的决定对吧

但我觉得这个对于它的用户来讲是好事因为听说接了 DeepSeek 之后它的很多产品的那个数据都长得很好可能是两位数我觉得从 DAU 的角度 again 因为它现在很多人点微信的搜索下面就出来一个下载使用了 DeepSeek R1 的元宝那这个

导量肯定是无与伦比的对吧所以元宝现在是 APP Store 第二名我觉得明天可能就第一名这个非常正常所以我觉得腾讯真的特别聪明它节奏感真的太好了而且元宝用 DeepSeek 是比较稳定的它不会你问几次它就服务器发忙了因为他们之前买了很多卡之前还真的不知道卡用来干嘛现在突然发现这些 Inference 都可以做了当然听说最近也都在加单哈

所以腾讯具备这样的基础设施能力对吧所以你觉得这是腾讯的选择吗他选择在自研大模型上不那么激进他略慢一筹但是他知道有人会做出更好的模型那时候我只要激进的去接因为我有微信这样的大杀器你觉得这是一个他当年就设定好的主动战争路线吗我听说是一个主动选择的战略吧但我同时也听说反腾混元也在大幅着逼买马去扩展自己的团队

所以从过去中国互联网的经验来看很少出现这种大厂完全依靠第三方来提供自己关键基础设施而不是自己做的所以一方面我觉得腾讯现在这个决定非常的厉害也许是一个新时代的开启

因为在美国有很多这样的例子对吧比如说 Netflix 一直用 AWS 虽然亚马逊有 Prime Video 是它的直接竞品但是 Netflix 仍然是觉得 AWS 是它商业上技术上最好选择但中国以前其实都是你有支付宝我就要有微信支付嘛所以一直是我要有一个我自己的东西

现在 DeepSeek 我觉得肯定是一个很中立的选择因为他们团队也不是要发展一个超级 APP 也没有想要说我觉得这是马化总他知道梁文峰他对于做一个大 DAU 的产品没那么有兴趣是的所以我觉得他们至少现在目标是很确定的所以大家合作也是有这个基础的但腾讯会不会一直不想要一个自己的大模型我觉得这个都很难说因为技术的变化很快就像之前大家说微软就靠 OpenAI

后面好像说欧然也得想自己训一下甚至欧然也去投资所以这其实我觉得都有可能发生变化但我觉得这边最核心的还是说谁能够持续地保持在 frontier

我觉得其实我们在过去这两年多时间内看到已经有很多说要做基础模型要挑战智能的已经逐渐在掉队这也合理因为这件事情就是需要人才钱然后很多的这个创新所以你刚刚说有资格做这件事的大公司只有自己有资格做这件事的创业公司现在只有月值案面

如果说从拿 VC 前的创业公司我觉得原来说的 AI6 小虎对吧这里面我们看下来确实目前只有 Kimi 在人才在团队资金和用户上具备持续冲击 Sorta 的能力其实包括最近 OpenAI 随行发表了一篇 paper 里面也是同时 refer 了这个 R1 和 K1.5 的工作码

我今天中午你们来的路上 Kimi 又发了 Move & Light 一个最新的开源小模型就是我觉得这里边能够持续地对这个技术社区做出贡献其实这是一个对团队本身的能力以及团队的方向都要求挺高的事情就说到 OpenAI 的论文同时 refer 了 K1.5 和 R1

其实这两个成果发的时间也非常接近同一天对就是在同一天 1 月 20 号左右吧你怎么看就是实际上我当时刚发之后我去找一些技术社区的人聊我觉得那会儿大家给我的反馈 K1.5 和 R1 之间它的认可度没有差别那么大但是最后它实际上的整个影响力的差别是非常大的对我觉得这面开源还是一个关键差异对吧确实 DeepSeek 的 R1 它有些工作包括

包括像 Zero 确实它的合并意义很大并且当它开源同时大家都可以使用之后呢确实尤其在西方引起了很多的这个反响本来我觉得硅谷在过去的几年持续大家在质疑说 Pre-training 花了这么多钱是不是值当然后在去年年底如果大家记得的话伊利亚其实也提出来说 Pre-training 撞墙了

所以大家其实照从二级市场投资人这边陆续就有的担心是不是我们花的钱太多了结果突然横空出世说咱五个 money500 万美金就能训一个欧万级别的模型当然这是个误读对吧因为那是他最后一次训练的结果论文里写的很明确对吧但是就是有人要搞个大新闻所以在美国首先引爆了大家的担心导致 1 月 27 号英伟达暴跌 16 个点什么的所以当这个事情变成了一个全球新闻的时候

那这个影响力肯定就不是提米松单纯的一篇 paper 或者是一个技术创新能比的对吧其实有反正跟 DeepSick 很熟的同学就跟我说他们其实认为美国 OpenAI 或者 Anthropic 他们去迅一个 V3 这样级别的模型他们甚至都不需要画五版本

因为人家有更大的集群更多的训练经验但是呢确实这个叙事当时很多不是那么懂行的人就变成了说 500 万跟别人融了 11 美金去比当然现在大家陆续都知道了这个事好像不是那么比的所以你看英伟达股价又快修复了对吧

也最后引发特朗普来评论的这件事情那确实就出圈了嘛但是呢第一方面就是说在训练这个成本上真的行内人并没有觉得 500 万那个数有多么的吓人对吧大家可能更多关注的是比如说像当时 MLA 这种降低推理成本的创新第二

模型的智能提升和模型训练与推理的成本下降这个是始终在发生的事情其实我们看到比如说 GBT4 的 API 出来之后已经下降了 90%多的成本这件事情在今年肯定又会降 90%多

这件事情是肯定会发生的新面会变得更强大大家会找出来更多可用的降低成本的优化方式所以我觉得现在大家首先关注的还是说你智能能不能往前走只要你智能能往前走成本一定会下降而且是一个非常快的速度下降可能每年降到原来的二十分之一甚至是几十分之一的速度所以我觉得对降成本大家并不是那么担心至少在美国大家相信这个曲线一定会发生的

所以降成本其实在一个轨迹里的其实后来 Anthopeak 的创始人 Darryl 他不是写了一篇非常长的文章吗

它虽然后面最后的它的弱点是说我们要进 GPU 什么的但它前面的分析还是挺充分的就是说它其实这个降本是在一个大的行业的曲线上对的包括说智能提升当然那篇文章后来就有点气急败坏了但是我觉得它对前面技术的分析是挺对的因为他们对于 Solnet 的对齐从他的说法来讲是经历了很长时间的因为他们很强调安全强调这些对吧那么确实

Sonnett 甚至都不是个 reasoning model 所以他们确实还是挺厉害的听说他们马上也要发 Cloud 4 但我觉得这也是 DeepSeek 带来的好处就是面与效应对吧来了一个又很厉害然后又要这个开源的选手所以大家就不得不动得更快了我觉得这确实是一个好处

而且我觉得 DeepSeq 其实回过头来想还是有一个很好的点就是它是一个全新的应用所以它一上来其实就是一个 R1 加搜索的结合所以确实 DeepSeq 它是从一个白纸去做一个新的产品这其实也是很大的一个特点然后还有一个特点我后来也才意识到就是

大家在训推理模型的时候 reasoning model 的时候其实对标的都是数学和编程能力包括我们看大家发的 paper 不管是 deep seekopen AI 还是 himi 都是拿的 aime 啊 mass 啊 live code bench 之间去对标但是 deep seek 出来之后出圈的反而是它的文笔是的它的这个文笔听说也是 deep seek 做了一些专门的对习工作甚至有说找了一些北大中文系的人去做这些标注什么

因为当时我们看到之后第一反应就是说他说的话好像有点特别天马行空的想象大家现在可能也知道了就是动辄量子力学然后上升到非常天马行空的角度其实这个对于 OpenAI 对于提米包括豆包来讲我觉得他们反而可能在之前是要避免的

因为大家去模型就是怕模型胡说八道对吧就是怕 hallucination 但是我觉得 DeepSeek 一方面他可能有意的去做了文本上的对齐另外一方面他毕竟他之前的定位是一个 research lab 所以他其实并没有可能对于所谓的中立性这些 choosefulness 进行很多的微调所以他发出来但是大家就直接去用了所以这个特性反而变成了一个好

我们看到很多传播其实都是来源于大家发现他的那个回答特别有创意或者他的思考过程特别有创意所以我不知道这是不是阴差阳错但是这个在事实上也会导致他传播力更强你跟圈内人聊他们觉得这是阴差阳错吗就他们是有异讯的解读能力吗我听一些人说他们可能确实在上面是有加强但也有人认为可能这是一种对其不够充分的结果是无心差流导致的

对所以我觉得这两种都有可能确实我这个没有确切的答案但是我就从结果来看这个其实是让出圈有很重要的原因因为真拿它做数学题的人其实也没那么多对吧大部分人其实还是我看有人拿它算命可能就发现它说出来的结果让大家觉得好有道理还有就是 MBTI 测试 MBTI 对其实这些都不是大家觉得一个什么冲击 AGI 的这么一个前沿模型需要做的事情对吧你跟字节或者 QMI 的人聊过吗他们怎么理解这个问题的

对我刚才说的就是有一些人认为这是一个刻意追求的结果也有些人认为这是一种对就是因为大家也都是从观察的角度去推嘛包括有一些各种各样的信息但可能也不是一手的或者说不是确切的相当于它的一个可能由于没有充分对其导致的你可以叫不足吧它变成了一种 feature

就大家反而觉得那个东西非常好用非常喜欢当然这个也不是为 Kimi 打广告但是确实我跟直琳最近在聊她就说其实 Kimi 的用户也一直在涨现在也一直是新高因为有人就发现好像在工作中尤其你需要有一些准确性的时候好像 Kimi 它还是更加准确一点因为做了更多的这个防止胡说八道的措施对吧所以他们就说好像干活用 Kimi 然后如果要聊 MBTI 或者双命这种需要创造力的那可能 DeepSeek 它的确实天马行空

我自己也这么觉得所以我今年写新年祝福都用 Deep Seek 写的就感觉 Kimi 的写的新年祝福就是一个理工男 Deep Seek 那个可能就有点脑洞大开的感觉我觉得再往下大家关于 Deep Seek 比较好奇的也是他到底怎么赚钱的这个事情包括刚才我们也聊到像腾讯还有百度还有很多大小公司都接了 Deep Seek 不过我理解他实际上是不会直接从这个动作里赚钱的对吧

如果你只是用它的模型它已经开源了但是 DeepSync 显然现在直接能赚钱的就是卖 API 它的 API 我听说是有毛利的因为本身他们的自己在推理上做了很多 infra 的创新所以他们去 serve 自己的模型可能就比另外一家公司去 serve 自己的模型它要成本更低现在很多人都想用它的 API 它现在其实面临的是它的率力不够的问题因为它还要去做训练

所以他目前好像我不知道现在会不会恢复前一阵子他其实关掉了他的 API 充值入口就是说你都不要跟我给钱了我服务不过来对吧那这个那不就是商业模式的体现吗不少人就说能不能我付钱给我个稳定的版本这个有点像 GBT plus 对吧这种所谓订阅制所以其实我一直认为技术革命的早期不要太快的去用成熟期的标准去要求商业模式

而是首先用技术给用户和客户创造价值然后从这个价值中提取一部分作为你的收入这个事情我认为迟早会发生但是要有一些耐心

这个事情你是在 2024 年就有一个很清楚的认知还是 DPC 和这个叫冲击波也好叫这个启示也好之后有了一个更清楚的或者更坚定的这样一个想法我觉得也是不断的去学习吧因为我们 80 后其实我入行的时候已经是移动互联网逐渐在开始或者互联网的已经开始下半场了

所以在最早期比如说 90 年代那个时候我的时候也是互联网的用户但那个时候没有思考那些商业模式的问题对但我觉得就要经常以史为鉴去想想看当时为什么很多互联网的早期公司它其实都是技术很强在当时的角度看技术很强做出来了

其实复盘一下当时 Google 遇到的第一个问题也是它用 PageRank 这个新技术打造了体验好十倍的搜索引擎所以用户非常的自发传播用户很喜欢但是那个时候它其实不知道怎么赚钱因为一开始 Google 就是说我没有广告我很清爽嘛

所以当他 98 年上线 02 年纽约时报有篇文章就说 Google 最难搜索的是他自己的商业模式就是批评他没有商业模式但是后面大家也知道了他在 02 年开始逐渐地发现了 AD World 和 AD Sense 这两个商业模式就和他 04 年上市成为了现在最好的印钞机所以这是一个很好的例子就是你一样上来问他商业模式是什么他其实也不知道的

但是它首先是来源于一个技术突破有这个技术突破打造了好的产品然后好的产品之后把这个价值给变现所有的技术突破都会有这样一个水到渠成的过程吗还是我们是幸存者偏差我们只是看到了那些后来取得了很大声的成就的技术突破那当然不可能所有的技术突破都能最后导致赚钱对吧但是我是觉得我们要看技术突破在哪个周期我还是那个观点就是现在是一个技术变化邪律很陡峭的时候那这个时候如果你要拿现有的技术

逼他去变现就是我经常打的比方让一个天资非常聪明的高中生去赚钱他可能就是赚不了什么钱他也只有去搬砖但是你多培养他当他成为一个博士生的时候他就可以赚大钱对吧所以我觉得如果技术已经到了平缓期比如说可能移动互联网五年前的技术跟现在没有特别大的区别的时候那这个时候就是商业模式百化其风的时候了

我再举个例子不只是 GoogleFacebook 在出来的时候其实也是他提出了一个非常前沿的产品所以引发病毒传播但是那个时候大家也不知道 Facebook 怎么赚钱他尝试过放一些 Banner 广告尝试过一些本地的广告后来他又做了一个他们的游戏中的广告其实这些都

没赚什么钱直到 2012 年他把这个 newsfeed 从时间排序就是微信那样的排序改成了按照推荐排序形成了所谓的信息流推荐你只有做推荐的信息流排序你才能抄广告对不对所以他 2012 年上了 newsfeed ads 就是信息流广告同年上市

当然信息流广告现在也是超级性超级字节的核心商业模式但 Facebook 是在 05 年上线的它信息流是在 07 年上线的然后它的推荐信息流是 12 年上线同时找到它的真正商业模式这也花了 6 到 8 年的时间那个时候它一直是一个用户很喜欢但是商业模式不清晰的公司所以伟大公司往往都经历过这个阶段你觉得字节会开展吗

首先我觉得开源是不是每个人都要做的我觉得首先你要领先你开源可能才有价值对吧你开源一个不咋地的东西那只是为了开源而开源那没啥用对吧所以我觉得首先要领先或者至少要搜他要有对世界有真量的开源才有意义第二我觉得可能开源的一个弱一点的形式就是免费对吧就免费加领先我觉得其实就很厉害

是不是一定要开源我觉得这次其实可能 Deep Seek 有一个很重要的甜头就是开源导致西方很关注美国很关注美国很关注在美国引起大新闻之后那回国大家就更加觉得好对吧因为让美国人破防了

但是这个是不是大家都想需要这样的效果对吧当然开源比如说也很好跟微信合作这肯定也是一个开源但是我想这个事情还不只是开源是你的公司得坚持做这件事情比如说假设多宝现在开源微信会接吗我估计也不会接

对因为 DeepSeek 最开始的 LLM 那个版本就是开源的所以这个不只是开不开源的问题假设豆包现在跟 DeepSeek 一样厉害然后开源了微信也不会接千万我不接也不会不是说他们能力不行是说你在阿里和字节里边对所以我觉得梁文峰他们 DeepSeek 不只是因为开源而是他们坚持开源他们这个市场定位是一个对大家没有感到威胁的定位

对坚持开源而且它中立的没有拿过某个大厂的特别多的投资或者说它其实就没有什么万能投资没有投资然后最近有一个变化就是 OpenAI 它也在考虑开源 San Martín 他发了一个推特他

就是给了大家两个选项一个是说可以开源 O3 mini 还有一个是可以开源一个 phone size 的 model 就是一个在手机端侧上可以用的模型你比较期待它开源哪个当然我觉得开源哪个都很好但是我肯定是对 O3 mini 更加感兴趣因为我觉得目前在端侧的模型可能它的用途还不是那么大

目前大家更需要的是在智能的前沿进行突破那么 O3 Mini 是一个很强大的模型 O3 Mini 在经过比较长的推理时间也就是现在 ChadGBT 里面的 O3 Mini Pro

O3 Mini High 模式下其实它的表现是很好的那么如果一个这种级别的模型能够开源大家能够知道它是怎么做出来的以及它的一些特点我觉得对大家会有非常好的一个价值并且听说这个模型也不大所以这可能对大家在模型训练和应用中也会有很多接见意义你会说它是多大听说它是 3.7B 的大小这个确实让我觉得有点

因为好像确实有点太小了我的意思是它每次激活是 3.7 币这个还是几个也是比较靠谱的来源但是这个尺寸的话意味着说他们确实能把一个很大的欧三欧三应该是挺大的但把很大的欧三变成一个很小的欧三 mini 然后在欧三 mini 经过更多的思考时间然后得到很好的结果这个其实是蛮厉害的一个工作

它激活是 3.7B 所以 O3 mini 本身也是个 MOE 应该是的他们之前其实分享过自己不开源的顾虑他们认为开源会削弱竞争优势比如说给 Google 可振之机所以我觉得梁文峰很伟大他确实把很多秘密告诉大家大家都可以变得更好但这个确实可能从一个纯商业公司的角度就会有很多担心毕竟他们之前还有一个担心就是 50OpenAI 的担心是担心强大的 AI 被坏人利用这可能也是一个很合理的担心

对所以其实我觉得并不是开源就一定是正确的顺利的我觉得 Deep Seek 开源的这个热度如果字节你问他他会希望这样吗我觉得可能也不一定吧太热了因为比如说你会变成美国加上中国广东的结果对于字节来说他顾虑的东西要远远多于 Deep Seek 是的所以我觉得 Deep Seek 一方面他确实定位就是开源第二确实我就问他之前肯定也没有想到自己会这么火嘛

就是他现在肯定处在一个非常敏感且重要的位置对吧不管是中国美国还是行业你觉得 DeepSeek 对那种本来就在开源生态里面想去主导的像 Meta 像阿里这样的公司因为他们一直也都是开源的他会有什么影响我觉得肯定是一个激励吧就是大家发现来了一个更卷的人嗯

原来其实开源社区我觉得还是一个他看上去像赛博佛祖嘛对吧就是你真的是对大家去做一个有点像做慈善哈其实原来不管是阿里还是 Meta 其实都是大公司把算力拿出来给大家迅速模拟给大家用对吧带动整个行业的发展但是现在来这个进步更快更开放的那肯定对他都是一个压力和激励吧

但确实我觉得 DeepSeek 的这个中立性是一个比较独特的位置所以 Property 也可以用那腾讯也可以用那其实签问 Property 也没用对吧这还不只是因为他们能力问题是他的这个屁股坐在哪的问题我差一个问题就苹果在大模型里做了啥吗他们的团队人也挺优秀并且也做了挺多的模型的训练这些但我听说就是他们想做端云混合的 agent

但确实他们有点像微信他也是我反正用户都在我这我的这个入口都在我这所以我可以卖一点但我这用户量这么大品牌价值这么高所以我不能去喜欢用没有任何新闻报道他在做大模型吗他们有在训大模型做机器人吗据我所知他有做一个桌面的对啊据说有做一个桌面但人形的据我所知应该没有

当然 Vision Pro 打破了这个我认为苹果之前很擅长的是它做一个技术周期已经相对验证完善就它不做那种技术验证型的产品因为它做的产品都是那种这个技术本身已经逐渐完善但是我通过极致的设计极致的体验把它的那个成熟期的全占了

包括耳机也是 iPad 也是对吧这个 iPhone 也是但微信 Pro 确实不是微信 Pro 确实是有一种很探索性的产品包括 Apple Watch 也是之前有一些各种 Watch 因为我觉得苹果它确实是一个后发之人的公司在过去所以跟腾讯有点像嘛我说

并且确实它的用户对它有非常强的稳定性的需求和品牌的信任就我买一个苹果的东西我希望它是用户体验非常成熟完善的不会很 backy 一会儿这样一会儿那样所以我觉得每个公司有自己的定位他们显然是从 Google 应该是还是有很多其他的人才反正去了苹果然后他们显然也有很多算力能够去模型但是对他们来讲发布一个我的模型目的是什么

他们肯定端册上是有一些自己的这个小模型的这个事对苹果最近不是也和当然最后选了阿里就和 DPC 也是有沟通合作他聊了很多 Kimi 也聊过我觉得从苹果的角度选阿里也很好理解吧他肯定要选择一个服务能稳定能够很好的应对大规模用户量能够有不管是 infra 还是服务还是技术界经验的对其实阿里在这一轮中还是比较开放的千万确实做得非常好呀

其实签问因为它跟 NAMA 也挺兼容的并且它的产品模型也很好更新也很频繁所以其实很多开发者还是用签问的

DeepSeek 其实 R1 在用的时候因为有很多幻觉所以用它做应用的话其实很多时候并不一定是最好的选择就是在 DeepSeek 这么这么全民爆火之前其实在海外的技术圈我觉得 Queen 就是千问和 DeepSeek 它的这个影响力是比较相当的因为它们两个也都是开源的系列确实我们一个复盘就是当你 Kimi 你不管你 Benchmark 再好如果你对别人

不开放你不能开源使用然后你也不提供海外的这个应用服务的时候那确实海外确实没认知度这个你们之前怎么讨论的为什么肯定不开源我觉得哪怕在现在我也不认为开源是一个必须要做的事情像我刚才说的一样就是我觉得开源是某些情况下公司的一种选择比如说这可能是说你没有保密竞争压力你没有融资压力的情况下嗯

并且现在你是看到了一个事后的结果因为开源再加上一系列因缘机会它有些偶然性完全有另外 100 个平行世界是 DBC 开源了也很多人喜欢但没爆对其实我觉得这里面有几个偶然性事件包括年底的时候一堆人在那开达沃斯会议对吧然后那些人聚在那被采访了然后后面又是春节春节又是一个本来就比较容易在中国就是会爆的一个东西

然后国外也是同步差不多关注到这个东西还有英伟达的那个大地所以我觉得开源其实不是这里面必备项当然我觉得开源人很厉害我觉得非常值得尊敬但是一家商业公司其实核心点还是说你能不能创造用户价值

最后把用户价值变成商业价值对吧所以我觉得开源不是这里面必经路径这是一条很有意思一条很创新的路径但今天所有探索 AGI 的公司都不会以用户价值作为核心的我觉得不会都是技术价值我只是说在技术增长期的时候技术价值的提升才能带来用户价值所以我觉得这里面搞技术的前沿的探索是非常关键的这个可能在过去我觉得因为

大模型出来之后大家可能就涌现了一批所谓比较务实的投资人或者是创业者他们说我就拿现在的技术去赚钱

但是我觉得 Kimi 肯定是在另外一波里面就是说我要将技术的 frontier 去提升然后通过这个还是回到我们开始那句话打造出来魔法般的让人惊叹的产品体验同时最后来获得商业价值其实 Kimi 是 23 年火的它为什么那个时候火很重要的原因是因为它是第一个把 chat 和搜索和长文本结合起来的大家如果去想当时其实 chat 的 GBT 是不能搜索的

然后 ChatGPT 对于长文本多文本的多文件的处理其实也不够好所以 Kimi 其实当年不叫当年就是两年前二三年其实就是因为技术上他们通过长文本的技术 vision 通过把搜索和 chat 结合起来的 vision 带来了一个用户的体验不一样从而出圈的一个例子只是 DVC 这是当然会火的多的多的多我查个小白问题就是当年选的长文本是一个非共识吗

那是个很难的决策吗当时其实长文本肯定是大家在技术选择中的一个选项但是你是不是把它放到最重要的那个角度去做我觉得这个不是公式当时有个段子不知道是不是真的就说百度后来在 Kimi 火了之后就说为什么他们做了长文本我们没做他们好像说那个优先级没有排在第一批要做的优先级里

因为当时你可以想有很多其他的优点你是可能去做的比如说有很多人做 Creator AI 做那种情商方向的对齐对吧也有可能你去做别的就是这个时候长文本坚定选择然后去把它做得很及时因为长文本能解锁两个关键场景一个是看多个文件第二个就是搜索看一百个网页然后总结对吧这两个里面有长文本是做不出来的而且尤其是在当时 Kimi 也是刚刚成立的公司没有容纳那么多钱

他也是年轻人小团队资源很受限必须 focus 在一件事情上选择一个正确的方向所以其实 DeepSig 现在获得很多因素你放到 23 年的 KeyMix 是一样成立的当我资源有限的时候我就要在一个关键的突破

达到一个用户体验非常 wow 的感觉所以我出圈了对吧所以其实我去总结我会感到很多有相似的地方这不叫我往字里上贴金但是我确实觉得是有一些相似之处的对而且它当时其实也是占据了长文本的这个心智

比如说同样的去做 retrieval 那 KeyMid 很多在 choosefulness 在准确度上其实还是更好的当然普通用户不会那么去对比说实话现在很多用户用 deep seek 他对于产生的幻觉他是没感觉的但是说不定你交一个报告回头你就被坑了呢我真的遇到这样的情况昨天我在一个群里面那时候群里面都还是比较有水平的一些人有人发了一篇文章里面就反正引用了一些数据我一看这个 deep seek 味道怎么这么浓啊

再回到 23 年你觉得 Kimi 她们应该就也不走长文本的路线吗我觉得长文本是当时选择正确的路线我觉得不是一个弯路其实今天早上就是在聊那个注意力机制的时候也是聊到说为什么大家都很看重注意力机制其实其中一个原因还是后面的长文本对啊对啊然后长文本其实在那个强化学习里面其实长思维链也是很需要长文本的呢

而且记忆也需要对记忆也需要而且你长的推理过程也需要就长的思维链因为如果你的模型想五分之后必须要停止那你肯定怎么 scale up 对吧所以长的 context

window lens 对吧这个整个是一个很底层的技术而且当你在资源有限的时候你选择走哪条路可能很关键比如说如果有人选择我从 Sora 再走世界模型 maybe 那条路走得通但也许不是你现在能走通的那可能你就挂了对吧

对刚才说的是一些大公司现在可能因为 DeepSeek 的中立以及它现在有很大的流量引流的作用在跟它合作有些介入你觉得 DeepSeek 大出圈之后对之前这段时间经常被拿来和它比照的大模型六小虎的直接冲击会是什么

我觉得确实起到了一个清场的作用实话实说就是因为这里面有几家在 R1 出圈之前也就已经不做自己的基础模型训练也不做冲击 SOTA 的准备对吧然后我觉得 R1 出来之后确实也让大家意识到如果你不能够有做到 SOTA 的可能的话那确实还不如做一个垂直领域的或者做应用他们放弃是因为什么

有资金原因也有团队原因也有自己的定位原因吧因为显然我们作为 Kimi 的天使投资人肯定也满掏屁股决定脑袋的指责但是我觉得说实际来讲就是包括说 K1.5 这个模型的表现以及他们接下来还要发的模型其实在我们刚才说 Math coding 后面也会有进一步的表现然后说从这个学术上起到的这个贡献对吧至少那

从 reasoning 其实 K1.5 开始也说到这个里面提到的 LaunchShot 的这些评价也是很好的并且今年发的 MoveOnLight 然后前两天发的 Moba 这些还是能保持 Kimi 团队具备持续向技术同行进行交流输出的能力同时 Kimi 现在的用户其实也是到了千万 DAU 的级别其实它是持续上涨的并且说实话还是有不少人在用了 DeepSeek 和 Kimi 之后在很多场景还是更喜欢 Kimi 比如说它的

幻觉更少,在一些工作场景中其实表现是更好的,包括在一些多模态推理上,对吧,像提米这些拍照收集呀,这些场景其实目前 DeepSick 也是没有做的吧,所以我是觉得从团队资金技术能力用户产品的角度,

可能有私心的一种表达但是我确实认为 Kimi 是现在六小户里边或者几小户里边可能唯一一个能够去持续在 SOTA 模型这个竞争上去进行当然这个路很难需要钱需要人需要各种但是我觉得至少值得一试那 Kimi 接下来会更专注吗会砍掉一些东西吗他们已经砍掉很多东西为什么小明去创业了因为他们把海外砍了我想说的就是其实他们现在是要继续冲击 SOTA 的

他们视频生成正式不做了吗还是

至少你看反正照样有些内测也没有去发布我觉得有所不为很重要比如说他们重启 Solidar 是不是意味着比如说更聚焦的话是不是更聚焦只做代别模型那倒不一定我觉得就是智能就是什么东西对提高智能最有价值当然因为这具体路线你可能会发现这一面比如说也许有一天你发现多摩泰对提高智能其实多摩泰对于工具使用很重要工具使用智能很重要一环所以你看 K1.5 也是一个多摩泰推理模型

就是美加肯定不是说专注就要做跟他一样的事情反而肯定有美系所以肯定还是美加有要自己的一个选择就六小龙多数在 DeepSick 出来之前就已经放弃了在你的预期中吗我们其实在去年年中感觉到就是这样的结果

24 年年中因为那个时候有几家就很明显就是不管从意愿和资源的角度已经很难继续这样做下去然后我觉得 Kimi 还有一点我觉得挺好的就是她团队非常稳定因为这与他们团队的构成也有关系就是几位联合创始人都是有长期合作甚至就是室友关系对吧所以大家可以看到现在哥亚模型公司的人员变化什么都挺大的

其实很多时候创业就意味着说它像个平衡木走着走着你同行的人越来越少你就掉到平衡木下面去了就很多时候你是能够持续留在牌桌上往往就很厉害了刚才我们主要讲的是对模型公司的一些影响包括大的公司不管开源的闭源的然后一些创业公司

然后接下来我觉得它又有一些其他的这个生态里的很多别的公司就比如说在 DeepSeek 带来的这种更开源的风潮里面可能会有什么影响比如有一类我想到的就是 AI 云平台因为马上 DeepSeek 它接下来的这一周的开源周按它的预告来说我觉得它是要开源 infra 层的一些推理优化的一些东西那比如说它对这一类公司像规矩流动啊什么的无问星球啊这些可能会有什么影响创业上

对我们是无问星球的天使投资人所以他们量涨得很大其实他们收到很多的需求包括尤其是各地国资政府都在拼命想部署 DeepSeek 我觉得这个需求确实暴涨那他们能够持续得住金辉老师他们现在应该也是做了很多的创新对吧包括在华为的卡上做推理好像他们现在也很火因为有很多人也要用他们

我觉得开源模型的火呢确实让 AI infra 公司出现了一个很好的机会因为原来这些公司你要 service 什么模型呢如果都是币源的私有的模型如果都是豆包 皮米这样的那确实他们就起不了什么作用了因为自己会自己做 service 对但是呢我觉得长期可能要看就是他能不能持续的服务好客户

因为雇佣云确实腾讯云也好阿里云也好火山也好确实具备更多钱更多的 infra 的能力资源 knowhow 所以包括客户服务能力对吧所以对于客户来讲他肯定也不是做慈善他肯定是说谁能服务好价廉物美谁才使用所以我觉得对创业公司来讲这还是有很多挑战的到底是不是因为你技术很厉害所以你就能做到哪怕腾讯云阿里云你也做不好的事情导致说我用户还是要用你

我觉得这个都是需要去挺努力的,因为中国公有云云公司还是挺卷的,所以在这个事情上可能面对挑战,这些创业公司还是不小,并且好像 DeepSeek 因为他要开源这些黑科技嘛,也意味着说他原来在 service 上其实也还是有很多的自己的弄好,这个可能也是导致他同样服务成本就比别人低,这可能也是导致他有官方下场的服务提供商对吧,

因为短期内它的算力需求激增这肯定谁也没想到所以短期内它扛不住所以别人来承担这也很正常但是如果你进入到一个稳态那是不是这些创业公司面对大的公有云面对 DeepSeek 第一方它仍然有优势这个就还得去看看但整体来讲我觉得肯定是创造了很多机会的空间对 其实亚运金台是夹在这两个中间

对吧它是在云和模型中间的这个部分就它有可能会受两边挤压但也有可能因为这个生态的变化它会有一些机会对如果开源的中间这一层的选择变多了对吧比如说不同的框架不同的模型可选的多了那中间这一块就变得越来越好但如果这个收敛到我就是用一个比如说收敛到我就是 iOS 或者安卓那可能最后就还是系统提供商去提供你觉得对广大只做应用的公司它的影响会是

我觉得肯定还是正面的就是你多了更好的且开源的你可以去做自己微调的模型去用在这个过程中我觉得你如果去做 office 的事情是比较难的就是在模型的主航道上但是如果你做的事情是给模型的生态丰富对吧所以我一直打比方在技术革命的早期其实我们叫黑莓时代黑莓时代因为它的技术能力有限所以你有的 PMF 是很少的

黑媒时代就是发邮件发信息在黑媒时代哪怕张一鸣在世当然他那时候就在世哪怕张一鸣回到那个时代说要做抖音他也做不出来因为黑媒就不具备那个条件但是为什么会让移动互联网这么蓬勃发展首先是因为有了 iPhoneiPhone 的实力足够强它解锁了很多场景它有好的摄像头好的屏幕好的网络好的芯片所以它才能解锁像短视频像移动电商像社交网络这样的场景

然后 iPhone 之后就是安卓安卓又把它变成更加开放所以进来了小米 OPPO Vivo 等更多的手机厂商进一步的把智能手机给铺开比如说 Solnet 和 Sol01 它有点像是 iPhone 时刻就是币源的技术进步导致很多人能够在它上面构造应用然后 DeepSeek 可能是安卓时刻就是它从币源变成了开源同时也具备出国强的实力使得大家去做应用就有更多的选择

所以技术进步一方面能带来更加好的产品体验导致出现杀手应用另外一方面也会让这个生态变得更加旺盛因为原来你只能做那几件事现在你有了 iPhone 有了安卓你才能做抖音然后我还想聊的是 OE 和 RE 对一个大家都很关注的领域就是基础设施算力的需求的影响

其实 DeepSeek 和 R1 有一段时间它特别和我就是跟刚才我们说的英伟达大跌有关系就有一种观点是会觉得它是不是因为训练成本很低所以会减少对算力的需求包括我看你也发一些朋友圈后面很多人也都是一个不一样的观点这个可以讲讲我认为首先算力需求它有不同的结构原来就是说训练和推理在过去 23 年 24 年军备竞赛的时候大家把它简单总结成了一句话叫大力出奇迹

好像觉得我只要买足够多的卡我就能出更好的结果当然那时候在预训链没有撞墙或者大家没有意识到撞墙的时候其实这样的桌眼能成立所以那个时候大量去是一种 formal 的为了竞争去买卡所以现在我们却发现 pre-training 确实你短期的大量投入编辑效率是有限的比如 Glock3 它是 20 万张卡讯的但是这里面的

进展是第一也是有进展的但第二边界效应在递减所以你也不能说大力出击是错的只是说它的奇迹的边界效应在递减那么在这种情况下确实 pre-training 的算力学会下降但是我们现在看到的我认为会发生的事情是由于模型的能力已经达到了做 agent 的产品的临界点并且还在往前突破

所以当 agent 这个产品的形态能够落地之后他使用的 token 使用的 influence 的刷利会大幅增加因为如果只是 chatbot 的话你想你跟 chatgbt 也好 keep 你豆包也好你没有那么多聊的

你甚至都没有那么多 intention 对所以你跟他如果只是要 share the bot 那花不了多少 token 只有当他帮你做事情做更多的事情做更复杂的事情的时候他会用更多工具有更多思考这个时候他来的这个 influence 算你的需求可能他不是十倍的提高是一百倍一千倍的提高

那这个事情之前可能无法发生因为技术没有到了那个程度但是现在技术可能我认为到了这个转折点的话那可能就会发生对推理需求大幅提高所以 pre-training 还在那可能提高的速度变慢了然后推理当然也包括 post-trainingpost-training RL 的算力现在消耗量也是在快速变大了

因为现在这是模型能力提升去重要的地方然后推理的长度会大幅增长所以我是觉得我们对算力的需求整体来讲还是大幅提高的这个大幅提高是 25 年就会发生吗百倍千倍的推理算力的需求的增长首先我认为如果你从一个技术发展史的角度来讲 25 年发生还是 26 年发生还是 27 年发生一点都不重要

那可能对炒股有点疑吧对炒股有点疑可能二五年大跌然后二六年涨上去了对吧因为你现在看自动价值最后发生的最重要对吧到底是哪一年发生其实不是那么重要但我认为现在 Azure 的产品至少我是感觉到已经到了这个出圈的呼之欲出的地步比如说 Deep Research 其实它需要的 token 肯定要多很多所以为什么 Summer 他们说那个 GBT Pro 虽然付了 200 美金一个月但是它是亏钱的

因为那个时候可能就是 influence 多了很多但是我觉得这里面第一个是 pre-trainingpost-traininginfluence 它花的那个占比会发生变化第二个就是说确实对英伟达他很多时候他是一个格局的变化因为现在 25 年的 2 月英伟达在推理在训练上肯定还是性能最强且效率最高的选择

但是确实我们也看到当 R1 具体火了之后那国产芯片就针对 R1 做优化那种定点优化其实它还是一个其实它已经在用了已经在用升腾对就他们已经看到升腾的 910B 而且就是用英伟达也不用 T4 这种是的我觉得这是始终出现一个就是说当你的技术没有收敛的时候 GPU 具备很强的通用性或者我们说为什么有英伟达因为最早都是 CPUCPU 是最通用的

然后后来发现咱要玩游戏游戏这个事情是一个非常具体的需求所以他们做了 GPUGPU 专门去加速游戏当然后来 GPU 可以作业

但是现在也是 GPU 对于 AI 的通用训练和推理是最通用的但是如果你具体就 serve 一个具体的模型那第一种是比如说像这个升腾我可以专门做优化第二种做 ASIC 对像 Marvel 或者博通的去做或者像谷歌做 TPU 它就是针对自己的是的做它 TensorFlow 其实它也是种专有化就是一旦你的架构稳定下来那在芯片里面往往就是可以通过做专有化

来去实现更好的效率所以那这个里面就牵涉到到底这个架构它会不会固化下来我认为现在也是处在一个大约在 debate 的点目前来看 O1O 系列这个能走很远对吧这条路能走很远那可能 ASIC 就能逐渐的 work 但另外一个角度假设明年后年发生了什么架构的基础变化 Transformer 都不 work 了就得换一个

那可能你 AC 就白做了可能就还得 GPU 所以我觉得这里面有很多不确定性但是呢英伟达确实有个问题就是说他现在就

市场份额太高了它已经很难 go up 对它好像已经到了一个顶点对它已经 90%多市占率了那所以它有可能往下走这种往下走的可能其实就让很多人很担心因为现在一方面是对未来的算力需求的预期比较高一方面是对它格局而且格局带来的是它的毛利率它的预期比较高一旦格局出问题可能它的毛利率会出问题所以这个是大家比较担心的

但如果你说现在时时时刻大家干的事情包括 DeepSig 现在最想获得的是什么肯定还是英伟达你肯定还是能买多少买多少可以买的想办法能买到的全都得买对其实这一波最稳的还是国通国通或者 Mavile 其实这两个都出现了很多但是你要说 ASIC 第一它基本上还是得 27 年才能用得上第二这里面道理比如说会不会出现一些价格变化导致 ASIC 这条路就不 work 并且 ASIC 其实你要做出来这样用上也有很多

产能上的良率上的效率上的问题也不是那么一帆风顺的这不是说我想要设计就能做所以这里面还是有很多的当然英伟达也出现了比如说这个夜冷的问题整个这个良率的问题其实也有很多问题所以反正对于算力肯定是整体比好大家现在也都学到了对吧就是这个杰文斯悖论但是呢英伟达是不是格局变化只能说这里面确实产生了一些新的可能性

所以当然对于烧股票的人来讲肯定第一反应出现那个新闻先卖了再说现在发现好像问题不大又加回来对吧 AI 主题成了整个阿里基金讨论的最火的一个主题吗

现在我觉得就是说人家问老外什么时候回来对吧已经回来了港股交易量是去年同期的五倍我觉得老外也分不同的老外对我之前采了一个人他的总结就是说先回来的老外是在上一波赚中国钱里赚到钱的比如说当年中台阿里腾讯的人他们是最先回来的就当年他已经买中国股票赚到钱的那群人我觉得这边确实分不同类型的人

挺有意思的就是我们反正聊了有两拨人的观点不一样有一拨人是他们原来对中国 AI 他们看不上他们觉得中国 AI 不行因为中国 AI 缺卡缺人缺钱现在他们突然发现哇中国有 AI 而且是很厉害的 AI 然后又发现哇原来阿里的阿里云都没给估值的都只算了电商那这太好了对吧赶紧买另外一部分人是他们对中国比较了解他们知道中国有

腾讯 字节有这些很厉害的公司他们对中国有 AI 这件事他们必不怀疑他们担心的是比如说经济刺激是这些政策所以他们在想政策怎么样所以这个民营经济周团会确实非常振奋人心所以不同的人看的东西不一样其实有的时候我们 LP 他们是觉得中国创业公司很厉害创新很厉害我们早就知道了否则我们也不会投你们但他们就关注的是营商环境这些的变化

所以每个人看的点不一样但是我形象上认为真正的长线外资还是需要一些时间的因为他们做决策不是像咱们一样今天点击买明天点击卖你想他们肯定也是按季度开投资策略会然后刚刚去年讨论完中国的这个投资策略现在要改为什么要改有些什么数据对吧对其实有一个宏观背景就是美国指数连长 32%年就是拉高了这个 benchmark 对于一些大资金它必须成果布置

那中国没有这种危险之后中国是一个必选项当然对其实跟 DeepSick 它没有别的关系但 DeepSick 刚好也促成了整个大家对 AI 的乐观我认为二级市场很多时候是跟弹簧一样就你弹簧被压得很紧了这个时候你稍微有一个释放立刻它就弹很高那我问个问题就是那个中国资产重估这种教育体的你觉得我觉得实现了吗恐惧都是跌出来的信心都是长出来的

越长得多信心就越多现在想 21 年的时候中国 PE 比美国还高那个时候难道又合理吗对吧所以其实很 high 的时候不合理很悲观的时候也不合理去年字节五倍 PE 合理吗肯定也不合理从此的字节多少据说已经被 re-read 了 400 个 billion 对吧对我也听到这个这个师傅有思考对

对所以我觉得就是很多东西是边际变化但是 re-rate 这个事情尤其在不同的人心中也不一样我觉得这个过程肯定还是很早期因为一个事情都需要时间对吧我看大家已经在狂欢了那刚刚出的那个新的政策就是那个美国优先投资的一个政策我们还在研判这个我们还没有什么 comment

但我觉得肯定这几年也是宏观大年吧也有很多人说今年开年两个月那各种政策的变化转到海外了这个应届不暇根本就感觉无法理解对吧因为我们无法 timing 宏观所以我们肯定还是关注技术创新本身吧

因为我们刚才讲了很多一些展望有些可能是今年就会发生有些可能是比较久以后就总结而言你觉得二五年我们大概率会看到什么我觉得我们会看到更多的理事实时刻就是在一些任务上 AI 超过 99%的人类我觉得其实已经在陆续发生比如说携带码可能就是这样的

AI 现在写大码应该比 99%的人类好 99%程序员还是 99%人类我现在说的是人类但是我觉得 99%的程序员可能也很快了因为 CodeForce 上它在这个竞赛级别的编程已经超过 99%的程序员了

但是竞赛级编程和日常产出不一样它可能需要更多的 context 去读更多代码库去做但是我觉得这个过程发生很多所以我们会看到更多惊叹的这种 AI 在这个能力上打败人类或者是打败精英人类的新闻然后我觉得我们会看到进一步的有这种 agent 的产品以一种大家用起来更加方便然后更加实用的形式成为一个现象级产品

可能不会说几亿人用吧但是我觉得可能能够进一步的破圈像 Cursor 这种这个级别的破圈 Cursor 现在是多少日活日活我不知道但它的 AR 大概一亿美金左右吧程序员的日活很难很难所以不要用日活去衡量 AI 产品我觉得 AR 就是一个就是你给用户提供多少价值我因为 Term 我愿意给你多少钱吧这可能是一个然后我觉得可能模型的进展会变快大家会开源或者分享会变多我觉得这个确实是一个挺有意思的

然后我其实觉得在中国其实我们刚刚经历了可能在美国 CHAT GPT 时刻那种感觉对吧因为确实现在武汉各地政府都要用 DeepSeek 了然后大家都在接入 DeepSeek 我觉得这个对 AI 的感知度会是很重要的一点因为大家都意识到原来 AI 这么厉害之前 Kimi 豆包这些加起来几千万 DAU 可能比如说一两亿月活可能都没有两亿吧我觉得这也是让大概十分之一的人用到了 AI

但是就是说比较先进的模型对吧但如果说能够百分之几十的人都试用过了一个比较先进的模型感受到 AI 确实很强大那这里边不管是从创业者的角度从用户的角度还有新产品的角度还是从投入这里面资源前涮泥的角度我觉得都会是一个对行业很大的一个航空机爆发的生态对这是 25 年吗

包括你也说 25 年可能在有些领域的离世时时刻就是超过 99%的人类甚至是精英人类然后我觉得 DPC 这个事也是让整个行业我觉得就加速度变得更快的这样一个感觉那你觉得如果我们更快地达到 HCI 或者说更多领域解锁离世时时刻然后呢我现在有点想象不出那个变化包括人去干什么结构怎么变我其实觉得我们在一个人类历史上非常有意思的时间是指数增长其实是世界的常态

因为其实我们每年都是在前一年技术上增长对吧但是

亲眼见证并体验指数增长是一个很罕见的事情你指什么的指数增长是长期经济总量还是指什么对啊 GDP 如果你每年涨两个点三个点这不就是一个指数增长吗对吧但一般来说这种指数增长都得是我们用一生去体验的比如说你可能今年和明年比不会太大变化对吧但是我们现在在 AI 上我其实在比如说具体的讲 O1 O1 Pro 再到 Deep Research 这个上面我感受到的是几个月的时间内你就明显感觉到指数增长

这种体验就很特别并且我觉得这个就让我们对未来的预计会发生很大的变化

所以现在很多人都在问 AGI 是什么以及 AGI 实现之后会怎么样我自己的看法是说 AGI 确实对于生产力的社会甚至对于政治对于文化都会产生很大的影响但是具体它来了之后的影响我觉得可能我们需要有对冲击的应对因为包括安全包括新技术来了之后怎么解决社会福利这些我认为都是发生了之后大家会真的去重视的嗯

而且这个能力掌握在谁手里其实是影响世界格局的所以加速主义就认为 AI 肯定会发展坏人会用 AI 去做坏事所以好人应该更快地发展 AI 所以以子之矛攻子之盾对吧谁是坏人各种坏人你认为对面的人就是坏人也许有什么搞金融诈骗的包括像韩国之前那种 Deepfake AI 色情什么的所以那你就得有更强的去侦探 Deepfake 因为人是已经没有精力去看了对吧所以我觉得这个肯定是一个巨大的疑惑

那么我其实觉得这里面一方面大家谈了很多的什么很多人会失业我觉得应该会发生因为现在大家对 AGI 的定义就是它能够替代多少人的工作如果你的定义 AGI 就是替代人的工作那 AGI 实现那不就等价于很多人会失业吗当然这是一个可能说从社会角度因为有人说那个时候物质极大丰富先发 UBI 每个人都发钱了那这个我不知道会发生什么事情但我觉得会有很多的冲击但另外一个角度我觉得就是我们人眼中的真实会发生巨大的变化

因为不管是用视频生成图片生成还是内容生成其实我是 86 年的我出生的时候一个人能读到的信息全部是经过权威认证的因为要不然你就出版不了要么是书要么是报纸回来互联网的巨大意义是让任何一个普通人写的东西都没看到

然后现在 AI 变成了说你想要啥跟你申请啥那这个其实我发现包括我自己一样的就是很多时候你就没有判断力了你就没有对他的这个甄别能力这个时候怎么在这样的环境中去进一步的适应建立起自己的认知体系我觉得这个其实非常重要的问题

有一个网络流行语它现在越来越有生意了就大概意思就是视频是批不了的所以它是真的那现在视频对现在就可以生成了对啊所以我觉得这个其实对我们整个人的社交意义或者认知世界的方式都会发生很大的变化当然我觉得每次科技发展有一个这样的规律就是第一波呢往往都是最厉害的人创造最强大的技术然后第二波就是强大的技术为最厉害的人打造最强的工具

比如说计算机一开始就是为了解决核爆炸的问题或者是破译密码的问题然后这样的给超人设计的超级工具它会逐渐的民主化普及普通人然后小型化进入到家庭移动化可能造成多存在所以我们现在还处在说最厉害的一群人然后为精英人群打造超级工具的这个阶段但是我想这个东西一定是会普惠所以当时我们投王辉文光年之外的这个口号就是加速 AGI 普惠人类嘛

就普惠我觉得肯定还是最后结果但是中间肯定开始说到了像威廉·吉普森说的未来已来但不平均分布现在确实挺不平均分布的所以我觉得不管是 DeepSeek 这种开源也好还是像 Kimi 豆包这种大用户的产品也好其实都是加速未来的均匀分布

我觉得这都是非常有重要的意义因为新技术我觉得最后是普惠大众的是普惠全人类的这个是它最后真有价值而不是掌握在少数有钱人或者是少数公司的手里边我觉得这整体来说还是一个我希望看到的节目你觉得工业革命的成果普惠全人类了吗

那当然我们现在坐了车说了这些机械包括电气革命对吧我们一样看去可能有一百个要用电的那为什么没有普惠到非洲那非洲显然也比之前要强大了很多呀就是公平和平等不是这回事就是你完全可以坐到下线大家都提高了比如说二十一世纪日本论和西方很多新的这个经济学里面研究的问题嘛比如说当以前的皇帝也没有出水马桶他也没有这个智能手机对不对也没有空调对啊对啊但是那确实绝对的差异在边打对吧

但是所以社会到底要的是什么比如说或者以什么样的机制让这些富人比如说可能在美国这边又讨论出来那通过什么税的制度啊还是通过慈善的制度去回馈但是你不可否认的是说那肯定这个基础的水平是提高的所以你觉得 AI 大概率还是提升所有人的这个绝对的下险呢但是它到底是造成比如说更平均

或者是要更平均也行还是造成更大差距这个其实现在不太好看出来我觉得如果利用不当的话或者是很有可能会导致贫富差距进步拉大因为刚才说到的如果当你的钱能够有效地变成算力算力变成生产力的时候因为原来富人也只有 24 小时

现在富人可以通过这个 attention is not all you need 去同时 hire 一万个 AI agent 去做事情对吧这理论上是可以发生的那假设这种事情发生了那岂不就变成了说有资源的人更有资源那也可能身为社长您待生会待生很多就业机会也许我觉得每次技术都是这样的比如说原来大家都用马车后来汽车那马车夫的工作是没了但是多来了大量的运输型的工作呀

所以这个也是就是加速主义说我就想加速因为生产力提高就会有更多工作但是确实对于每个身在其中的人因为马车富和汽车司机可能不是一个人但是如果你进入发展带来的是生产力提高带来 GDP 提升那提升了 GDP 你其实可以反过头来为这些人去提供福利或者去寻找他的这个出路嘛但是你不能因为马车富会失业所以你说咱们就不要发展汽车了

主要是它也阻挡不了就你没有办法现在让大家来减速这个技术的竞争但比如说你说像欧洲的一些 GDPR 这种政策或者对 AIE 向来过分管制可能就会导致这样的这个诞生对吧那当时工业革命的时候也是有这个卢德主义就砸那些机器

其实人类我觉得最后进步的原因还是因为当时的这些政府什么其实就还是选择了说允许新技术存在一些瑕疵让技术发展的逻辑如果当时说那汽车刚发明的时候其实有很多交通事故因为那个时候城市也不是为了汽车设计的并且也没有红绿灯都没有交通规则所以那个时候其实死亡率平常高很多但如果那时候第一反应是说因为这个会撞死人所以咱就别搞了或者说限制汽车只能跑 25 英里每小时那可能你就现在就都没有现在这些进步对吧

包括电也会电死人嘛所以我一直觉得就是新技术出现的时候其实应该不要让它具备太多的自我审核责任应该是说先用有问题再改而不是你先证明你没问题然后再用但在 AI 这个里面其实是有很多国家去执行的是说你先证明你没问题因为听说你很厉害听说你会毁灭人类所以你先证明你没问题你才能用那这个时候可能就会出现很多这样的阻碍进步的情况发生啊

但每个人视角不一样我自己还是觉得要鼓励创新就是事后审核比事前自证清白要更适合我觉得我比较好奇你个人在为可能更快到来的 AGI 做些什么准备锻炼身体

我觉得投资这里面优秀的创业团队其实就很重要因为我觉得你有了更多的技术创意之后创业者其实当然梁文峰他其实一开始也是创业者只是他太厉害了他能够自己炒股自己量化赚钱赚到钱但是还有很多可能成为梁文峰的人他也就缺乏系统资金所以我觉得这个时候 VC 其实很重要尤其早期投资很重要因为早期投资理论上承担最多的风险嘛

如果很多事情都很确定了那也不需要我们了但我觉得现在又重新回到了一个很不确定的时候不是每个人都能像梁文峰这样自带一百亿干粮的你觉得下一代怎么教育你该让他们学习什么了我觉得这是现在很多人很困惑的问题我觉得重要的是提出问题的能力比如说我现在经常面临这个情况面对一个很强大的 deep research 我要问他啥

我要指挥他干啥对吧我作为 AI 的老板你今天干嘛当然这个小万也管公司啊你说有的时候就是我得告诉大家今年干嘛这个月干嘛其实是很需要我动脑子的对吧因为

因为教学不会自己跑出来我需要去想干什么但很多时候我觉得我们现有的教育体系还是在告诉一个学生你会干什么让他学技能但是如果很多时候技能已经是可以被 AI 去做或者你可以指挥 AI 去做那你要做什么你有很强大的可能性你要做什么这个就变得非常重要你

第二个就是说大量我们现在做的工作其实还是一种叫做缝合怪的工作就是把这些从这里考过来那里考过来这里考过来然后把它缝在一起给个报告那这样的工作 AI 已经干得比人好得多了那很多时候就是你的这个内容能不能够为人类或者为人类的总体知识增加一些独有的特点比如咱们在这里聊天可能也都是缝合粘贴反正但至少可能诞生一些 unique data 对吧那我们的什么工作能诞生一些独特的数据是 AI 模型里没有的

还是说我们其实只是在把 AI 模型的东西把它吐出来我觉得这里边其实对于教育也好对于工作的本质也好都会产生很大的影响我觉得那句话都不好就马斯克说的三一成中文就是我想在火星上死去但是别在登陆的时候就是别撞死别撞死对不要在登陆撞击的时候

我也有个个人很好奇的问题就是关于你今天自己也做投资念自己要学习 AGI 然后你还在整个第二季市场都要研究你这个经济怎么通透你这次怎么保证你的学习效率能这么保证你就是学习的速度比别人更快呢也没有更快否则应该更快学习到哈哈

没有看了一下其实我们在 V3 发布的第二天就是 12 月 27 号我就在我家这儿主持了一个讨论会就是当时我也拉了十几个朋友有字节的有各个 AI researcher 朋友当时我就发了这个邀请里面说今晚来我家讨论几个 AI 最近既有 Devian 这个新产品的突破又有昨天发布的 DeepSeek V3 非常振奋人心很多新东西啊

说明咱们学习能力还是可以的包括当时 MLA 发布的第二天我当时就说 MLA 这个看上去非常的厉害那时候我正好也在美国所以跟我朋友同学也在聊这个事我觉得其实第一就是说就是感兴趣很重要你确实要真感兴趣这件事情然后我自己感觉是要多试我自己是在 CHATGBD 出来当天晚上我用到凌晨四点我就觉得这个东西非常的不一样

我的这个习惯呢其实可能源自于我最早上网是 98 年开始上网还很记得我第一次用到 Google 的时候 99 年左右吧那个时候觉得这个社会已经也跟原来的一切东西都不一样

因为它之前的收入引擎是非常弱智的你搜东西都搜不出来什么东西 Google 一上来结果完全不一样但后来又有很多比如说校内网我也是他们上线第二天昨天正好吃饭遇到王兴关怀就是我说这个 20 年前就是校内网第一天我就去使用后来我就等于也是对于内部互联网创业的大潮就有很深刻的印象

包括夏威夷 VT 我是出来第一天用上我觉得很革命所以我就立刻开始组织这个去研究然后比如说 Devin 其实我也是出来的第一天然后我就觉得这个特别好所以我也组织讨论会我其实觉得因为你看互联网第一波的从业者很多时候是第一波上网的人

然后移动互联网的第一波重用者很多时候是因为他们最早买了 iPhone 包括很多时候买特斯拉赚钱的人其实也是因为他们最早买了特斯拉所以我觉得现在花一点小钱或者甚至不花钱现在有大量免费的东西对吧你去体验未来很重要所以我当时发到朋友圈我说虽然 Devin500 美金一个月充值其实他是最小充值金我看他很贵但对于朋友圈的各位大佬来讲就是和平茅台的价格

那你一瓶茅台的价格可以看看未来的产品长啥样这也挺好的对吧确实所以就是自己多动手去试一试自己多去看一看 paper 看一看这些最厉害的人因为其实不管是比如说 Android Capacity 对吧还是 OpenAI 的这些研究员还是当然 DeepSeq 的这些 paper 有大量的高质量的信息是免费的你可以去学习去获得

去年年初的时候因为当时很多二级市场的飞机师就觉得因为大家需求会遇到瓶颈觉得五年就要下跌那我在行业看到的是我认为绝对不可能我认为大家全部还是在以军备竞赛的 formal 去做这个训练去买卡所以那个时候我其实就是一个还是比较 non-consensual 的一个人那你买国东

我从我去年下半年开始买了就是讲 ASIC 这个故事的时候但我觉得这个目前兑现度其实没那么高的因为 ASIC 的道理因为现在还是说未来可能很牛因为每次对英伟达其实当年也说 AMD 可能很牛对吧现在说 ASIC 可能很牛因为大家都喜欢这种老大被挑战老二崛起的故事而且 ASIC 已经冲击他好几次了

就当年韩武进那批公司就是 ASIC 就每次其实冲击最后好像还是有限但是没关系这个故事二级市场很多时候先炒了再说你做兑现的时候也不一定但是我想说的是说二级市场其实是个很有意思的你有一些认知你能够去 bet 其实我们很早就知道 DeepSick

但是确实人家也不要我们的钱对吧那就是说你有一个想法你没法去 validate 但是二级市场是一个就跟你去模型一样你需要有一个 result reward 你需要有能够 verify 你的 thinking 的过程所以我觉得二级市场其实赚钱不是重要的重要的是说虽然不一定它是对的但是呢它总会给你一个信号去 verify 你的 thinking 我觉得这个是一个挺有意思的事情

那你现在用这些工具能指导你在二级市场上投资吗 Deep Research 给我一个很实际的例子就是前阵子特朗普不是每周五都要发一个加 tariff 的一个 PR 吗当时我正好在看美国国债的这个交易所以我就问了 Deep Research 这个问题就是说请帮我看一看 2018 年的时候特朗普打贸易战他宣布做这些

加关税的决定的时候美国国债的长期国债利率是怎么反映的因为第一种思路是那如果加了关税会导致我的通胀上涨我的通胀上涨那我的长期通胀会抬头那么这个国债利率会上涨所以国债会跌对吧第二种思考是说局势变紧张所以大家会卖出股票去买入国债避险同样一个事情可能有两种解读

所以呢我就当时去问了 deep research 然后他就给我做了一堆分析就说 2018 年每次特朗普宣布新的关税政策的时候美国国债其实都是涨的也就是国债利率会跌大家会买入国债避险所以我根据那个当然也不只是根据这个我还是看了很多历史的数据所以我做了当时买入美国国债的整个操作所以我证明是对的所以我是真的感觉到这么个问题我问他五分钟给我一个答案那我问我任何助理也不可能五分钟给我一个答案对吧

因为当时我也问了我一些二级市场很厉害的朋友当然有人第二天告诉我说会找你当天晚上就买了没有 开玩笑就是说随时响应这点就很重要呀刚才也说到学习其实我很喜欢读书吧为什么我天天吹这个 agent 当然吹的是 open-edit agent 但我确实觉得这个给我的生活代表还没有很多

读书的时候我经常遇到的情况就是这个东西我觉得挺有意思但我如果去研究一下的话那第一花很多时间可能你看各种各样的时间就过去了第二来说你书就读不下去了嘛这次我有一个很明确的例子是那个瑞林豪夫曼的新书叫 Super Agency 它里面就写了一个例子就是美国当年 GPS 刚出现的时候美国担心 GPS 的这个精度太精确了影响国家安全所以开始先对 GPS 给了一个 100 倍的误差就导致这玩意儿只能够做很粗放的

然后后来就发现这样把 GPS 这个技术就限制住了它就没有带来什么商业价值所以美国后来克林顿政府就宣布之后还是把这个限制打开就是说所有的人包括咱们的手机都会获得最精确的 GPS 定位这样才会有美团外卖啊滴滴打车啊所有的这些应用对不对

那我就看了书上有这个例子我说这个例子很好啊因为这个也可以反映一种就是道理对 AI 这个技术你到底是抱有一种国家安全所以不能搞还是说开放供应做生态所以我就给 deep research 我就说好你帮我去研究一下 2018 年这个 GPS 政策这个事情前因后果重点研究我当时为什么从不开放到开放的然后你给我做一个和现在 LM 的政策的一个对比分析什么的

就这种东西如果我读到这儿我想去做个研究一个小时可能过去了但我就说那你先帮我做着对吧我继续读书读了读了好他做完了原来这里面有一些很具体的比如说当时美国是发明了或者说搞出来这种定向屏蔽 GPS 信号的技术之后他有些地方应该是可以给你屏蔽对因为他就说这里打仗了对吧虽然对我不利的情况我跟你暂时屏蔽了我具备这种收放制度的开关之后他才发现那我平时我也打开

所以算结果是说它开放了这个但是它具体怎么解决这个安全担心的因为它肯定有这样担心嘛所以这种是一个典型的说我读了一本书我要继续去研究原来我得花一个小时自己去得了这个结论现在反正第一部 research 报告啊所以我自己为什么就觉得这个事情我是真的愿意为它付费的因为这个时间价值对我来说肯定是划算的嗯你觉得 200 美元是完全值得 200 美金这么一次研究 2 美金那肯定是值得的呀对你有什么最近觉得很有意思的你想想看我挺有推荐的书

我给人工智能的从业者或者比较稍微愿意去思考更深刻一些的读者的话推荐这本书还没有中文版叫 A Brief History of Intelligence 可能就翻译成智能简史它其实是一个创业者写的它是一个科技创业者这是我去年的年度推荐书 2024 年

他从地球生命的开始到 GBT-4 他把整个智能在地球的演进这 21 年的时间总结成 5 次智能的大突破并且把每次突破的驱动的原因发生的变化以及这个变化带来的结果解释得非常好包括我也推荐给 OpenAI 的研究员他们读了之后都觉得非常的好所以我觉得是一个让我们对智能这件事情怎么来的

其实会多很多的启发同时读完之后也觉得我们现在就在第六次大爆发的前夜或者已经开始了所以你很激动这个是我觉得对于比较专业性读者的一个推荐是叫 Max Benet 那个吗对 Max 应该是 Max 后面是一个大脑

然后另外一本书也是有点专业的是我最近读了一本觉得很有意思叫第一只眼它是讲韩武纪生物大爆炸的就是在韩武纪之前地球上已经出现了 20 亿年生命但是 20 亿年生命一直是鼻涕虫的形状就是一个软体动物在海里飘着

但是含 5G 内短短的几百万年的时间生命突然爆炸成十几种不同的门类然后产生了很多的进化为什么当然有很多理论有的说因为地球上的空气含量发生了变化有人说因为海水这成分发生变化之类的但是他提出的叫做光变假说当然后来李飞飞在他的新书里面也引用了这个

这个光面假说我觉得还挺有道理的就是在某一个时点一个原始的山叶虫的身上出现了一个感光的斑点它对光线的感受能力出来了一开始所有的生命都是瞎子所以它们就自己在那飘着然后

然后偶然撞到另一个把对方吃掉了当第一个感光点出现之后就发现它就获得很多优势因为它能去到亮的地方它能去回避暗的地方然后所以它就开始越来越多的感光细胞形成越来越大的感光面积它就越来越能看到这个世界直到有一天其实这一天就过了一百万年在进化史上是非常快的时间第一个眼睛出现了第一个眼睛出现使得大家都是瞎子的

世界出现了一个有眼睛的生活所以他立刻获得了巨大的生存优势他开始捕食然后被捕食的人开始进化出甲壳然后也开始进化出眼睛所以地球开始了这个生命进化的竞赛那这个其实让我想到现在 AI 其实也是有点这个感觉包括 DeepSick 的发布或者这些就是当我们开始竞争的时候那在那个爱丽丝漫游仙境里面有一句很著名的话

叫红皇后假说就是你必须全力奔跑才能留在原地或者不被消灭所以那生物圈的进化就是大家都拼命的奔跑所以进化出了这么多的生物

那么 AI 这个里面其实也是不管是说模型要不停的奔跑还是一些公司要不停的奔跑还是以后可能发现的 AI 的公寓房这些不断的奔跑那这种奔跑让我们获得了更好的技术让世界变得发展但同时这都是生存竞争也好或者要进化也罢其实这是生命的特点这是智能的特点这也是进化的原因进步的原因所以我觉得这本书也给我很多的启发

对你刚说第一只眼这个我觉得还挺有意思的就是如果你想智能这件事情其实语言是比较后才出现就它是比较高级的一种智能形态所以语言模型一开始用语言去压缩肯定是对的因为这是智能含量最高的东西终于想到了点就是显然有很多智能是没有用语言表达出来的

那么用语言去训智能是否就会受到语言本身的限制以及说如果 AI 非常非常的聪明它要重新发明一个语言它可能不跟我们现在做的这个样子对 之前刘思新有一本科幻小说不就是外星人在想象就认为人类靠语言交流是一种非常低效率的方式所以我就说我们从语言模型开始但最后也许我们会超越语言模型

如果让 AI 去用语言去沟通它的思维速度比我们快一万倍它的智能比我们高很多它的语言就不会跟我们一样所以我觉得为什么现在回过头去看智能怎么产生的很重要是因为我们现在看到的是智能经过几十亿年之后的那个结果叫语言但是再走一遍未必是这样的对不对

所以回到源头去探索它的那个原动力和它的每一次变化的原因其实那本书很有意思就是它里面也提到了比如 reinforcement learning 怎么来的它里面其实有很多进化学上的例子所以我是觉得读了给我很多情那今天非常感谢余森做客晚点聊和我们从 OE 还有 RE 的这两个进展也是改变了整个 AI 格局的事情聊起然后聊到它后面带来的一系列的免疫和变化

那今年 2025 年我们可能又会期待看到很多新的东西包括 agent 的这个 PMF 的出现和出圈以及再往下一个更强的更多的理事实时刻的总结那今天的节目就到这里谢谢各位的收听好的非常荣幸能够和万电畅聊 AI 我也相信 2025 年我们会看到更多的惊喜理事实时刻会有更多的出现现在我们还在 AI 智能革命大爆发的第一天吧嗯 Day one 好

本期的零点呈现环节这期信息量很大雨森讲到的很多事和洞察都与我们之前的其他 AI 访谈有呼应或者是对同一个问题的不同视角的思考第一个是我们中间花最多时间讨论的 agent

99 期 MiniMax 严峻节的访谈中当时我们聊的就是 MiniMax01 这个新模型为何会被定义为面向 agent 的模型做好 agent 需要什么能力两期节目其实有总结一些共性这包括更强的推理和规划能力处理更长文本的能力和更长的记忆能力这也是我们在最近两期注意力机制改进的节目中提及的大背景还有多 agent 的协同能力 agent 带着 agent 干活以及从读到写的 agent 编程和调用工具的能力

第二个想分享的是这次我们提到 DeepSeek 会新开源一批 AI Infra 的成果这可能会怎么冲击 AI 创业生态那在这期节目录制后的一周也确实发生了一些关于 AI Infra 和 MaaS 服务及 Model as a Service 的商业模式是否成立的讨论详情可见我们第 105 期节目路程科技的尤阳聊了为何他不再做 MaaS 第三个是我每次都很好奇不同人会怎么看 AGI 更快到来后会发生什么

第二期节目中 00 后的王子涵说人的价值是人的存在本身而宇森有一个从社会结构角度的洞察警惕 AI 的不当使用会带来更大的贫富差距比如这期中我们设想的一种情形如果富人可以有很多很多的 agents 帮他提升效率我们从算力资本到结果的转化可以以更自动化能处理更复杂任务的 agent 为桥梁那资源可能会向本身有资源的人和组织集中

下期再见