We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 114: 秘塔闵可锐2:“我不是演员”

114: 秘塔闵可锐2:“我不是演员”

2025/5/5
logo of podcast 晚点聊 LateTalk

晚点聊 LateTalk

AI Deep Dive Transcript
People
闵可锐
Topics
闵可锐:我融不了很多钱,也当不了演员,不懂为什么一些拙劣的故事投资人会买账。秘塔的产品决策大多是我拍脑袋决定的,80% 以上的产品策略决策都是我拍脑袋决定的。秘塔的产品决策流程与大厂不同,我更倾向于快速决策。我认为现在做agent方向的产品时机还不成熟,通用agent的挑战仍然很大。我认为在中国做辅助律师的AI产品没有机会,投入产出不成比例。产品决策的重要指标是收入,因为公司需要生存。过去七年,很多AI公司要么死了,要么大幅收缩,所以收入是重要的生存指标。我做不到融很多钱那种创业路线,也不想这么做。2023年AI热潮后,融资变得困难,因为市场判断变化太快。秘塔更倾向于做有长期价值的产品,而不是追求短期爆款。秘塔的重心是应用驱动,而不是模型驱动,因为模型永远比头部公司差一点。我认为DeepSeek不需要考虑商业价值,可以把它当成消费。字节、阿里、腾讯都有钱,但他们没有把大模型当成消费。Llama 2再次证明一流资源二流团队打不过二流资源一流团队。中国的专业市场规模太小,付费意愿也不大,所以秘塔转向更通用的产品。如果在国外,做专业领域的2B产品可能会有机会,但在中国机会有限。秘塔的产品选择标准:要有收入、用户认可、长期价值。我预料到2025年,腾讯、阿里、字节会在AI领域投入巨资,所以秘塔需要调整策略。你得相信最坏的事情一定会发生。秘塔2023年后只融了一亿人民币,因为不需要那么多钱,也融不到那么多钱。秘塔的融资策略是保守的,因为我更看重实际的收入和用户,而不是讲故事。我拒绝了去年的收购机会,因为我觉得时机太早了。我是一个谨慎但并非保守的人,我的双面性源于对市场的判断和对风险的把控。大模型能力的提升会冲击现有产品,但也会带来新的机会。模型能力的提升会改变模型和应用的边界,需要动态调整策略。所有有潜力达到1000万DAU的应用,大模型公司都会自己做。我做模型的思路是服务自己的用户,并及时跟进下一代模型解锁的能力。过去两年模型能力的提升是线性的,但外界的感知是阶梯性的。O1和R1是否真的在做推理,取决于对“推理”的定义。判断模型是否有智能,更重要的是看它的表现和结果,而不是定义。Scaling Laws不是线性外推,可能到了新的卡点,会有新的突破。很多人低估了预训练模型对于强化学习提升推理能力的重要性。Grok3证明了好的团队+好的资源可以在短期内追赶一线模型的能力。模型的持续提升可能不会是线性外推,而是会有新的突破。大型技术判断对创业本身没那么重要,重要的是找到适合自己产品的技术。我曾经低估了GPT-3的成本,但这在当时是合理的判断。秘塔在成本控制上比大厂更激进,但用户并不关心成本。创业公司很难避开大厂的阴影,但可以通过快速迭代来保持竞争力。创业公司要摸着石头过河,大厂可以摸着我们过河,所以要更快地找到下一个石头。过去两年,秘塔在产品和研发上投入的时间很多,但在投融资上投入的时间不够。过去两年,我最大的成长是变得更“会了”。AI可以放大个人能力,秘塔的运作模式是核心人员输出驱动。 曼琪: 王与桐:

Deep Dive

Shownotes Transcript

欢迎收听晚点聊我是曼琪今天我们一次发了两期节目嘉宾都是蜜塔创始人明可瑞 113 期是我和可瑞在 2023 年年初的一次访谈有意思的是那次大模型热潮初期的漫谈中有不少印证的预言本

本期是 2025 年 4 月底,密塔发布新产品《今天学点啥》之后,我和玩点科技组的作者宇童一起对明可瑞的访谈。我们从《今天学点啥》这个新产品切入,聊了密塔探索新产品的思路、组织方式和明可瑞对 AI 应用发展的思考。

密塔持续推出了一些有口碑和用户的 AI 产品包括密塔搜索等等不过与这形成反差的是在 2023 年大模型热潮之后密塔并没有加速扩张和融资仅在 2024 年兴融了 1 亿多人民币整个公司的估值也是低的保守可瑞是一个直言坦诚甚至有些我行我素的创始人

我问他为什么不融更多钱他说他当不了一个演员他也不知道为什么一些在他看来很拙劣的故事不少投资人会 buy in 这超出了他的能力范围就是我们干不了这活他说最初看到 DeepSeek 的人才组织方式就觉得这非常对我问他为什么 Meta 不是这么组织的他说因为我们没钱

一方面,Carrie 的一些观点似乎有些悲观,她会说我们摸着石头过河,大厂摸着我们过河任何有潜力主要依靠大模型能力达到 1000 万 DAU 的软件应用,大模型厂商和大公司一定会自己做另一方面,她依然在持续经营 Meta 这家已经成立了 7 年的小 AI 公司,拒绝了去年的一些收购机会下面我们正式进入本期节目,听一听这家小公司的生存之道吧

今天很高兴邀请 Meta 的创始人林可瑞来做客玩点聊可瑞是一位 AI 老人 Meta 也是在这一轮 AI 热潮之前就已经存在的公司是成立于 2018 年上半年那一路 Meta 也做过很多 AI 产品每个产品都扎实地获得了用户包括付费用户上周 Meta 刚发布了他们的一个 AI 新产品《今天学点啥》

4 月 24 号也上线了 Apple 版那简单来说这是一个帮大家去学习的产品我们之后会展开我之前和可瑞在沟通这期播客的时候因为按习惯我会发一个提纲然后当时你就问我说怎么还是开卷考试对吧所以我这次就没发所以这次是一个

一专考试然后今天是与同就是我们科技组的作者和我一起所以今天我觉得很多问题肯定都是可瑞的第一反应可瑞你可以先和我们听有简单打个招呼好的我是一个 AI 的老人在过去十多年其实都在做创业也都是跟这个 AI 相关的

然后最近其实 Meta 的话到目前成立第七年的时间可能有些朋友已经用过 Meta 的其中的部分产品从早期的这个 Meta 写作猫到我们后来做的这个 Meta AI 搜索到最近我们发布的今天学点啥这个产品其实都是希望通过这个 AI 赋能来帮助大家从清晰的获取到能帮助大家更好的去进行学习的一类的这样的一个效率工具产品

对我们可以先从你们上周发布的这个新产品今天学 DL 啥开始因为发布之后有各种反馈然后也有些自来水对我包括我也说我周围有些自来水还挺多的对对对我也跟你交流然后我看到有一个比较大的自来水就是黑神话的冯记他发了一个挺长的微博也是我们预期以外的一个自来水

你跟他是不直接认识的我完全不认识所以其实他发了以后甚至是也没啥朋友转给我我想这两个圈子其实差异还挺大的那我是第一个转给你的吗那天晚上可能你转给我之前不久我们有个运营的同事转给我好像是一个什么粉丝群里面发过来的我们才看到就还挺意外的

然后他是评价说这是他迄今为止用过的用户界面最好的 AI 工具而且让他第一次清晰看到了 AI 改变教育的可行性实际上你自己比如说会给目前的今天学点啥这个版本打多少分以及你觉得哪些地方实现了你们的想法哪些地方是还有改进

对我觉得这个一定程度还是有点过于了就是我觉得对我们而言觉得这可能目前推出这版本可能最多是一个 70 分的产品尤其从界面上来讲我们觉得其实有大量可以去优化和打磨的空间但是可能整体我们把这个作为一个完整产品呈现出来的这个概念以及它最后呈现出来比如说去跟人讲课的这么一个内容和这个感觉可能就是我们觉得做到了一个让我们自己觉得是能听还不错的这么一个效果所以可能有

就是这是第一个可能能做到把这样一个端到端串出来这么一个效果的一个产品所以可能会超出一般的很多大家对这个产品的感觉和这个预期我觉得界面是有巨大的提升和打磨的空间嗯

那这 30 分除了界面有提升空间还扣在哪儿有非常多的细节其实都可以提升就包括我们生成的文稿的质量可以提升我们生成的比如说这些 slides 的美观程度可以提升我们的相对于整个产品应该说从功能的丰富度来讲其实都有提升的空间就是刚刚 Release 出去收到的一个反馈是有很多想给孩子辅导作业的妈妈想用我们来辅导结果发现还不太行

怎么都不行它其实逻辑是这样的我们现在的那个产品更像是说当你找得到一个相对跟你关心的这个内容比较相关的素材以后我们会把它转化成一个够友好的一个形式去给你把这个内容 present 讲出来然后用你喜欢的这个风格但是讲题的这个逻辑

很不一样比如说我给你一张试卷我真的是希望你作为一个老师一样首先告诉我这些题目它的答案是怎么样然后用一个友好的形式把这些重点难点知识点给它勾勒出来然后把这个孩子真的让他能掌握这些知识点这其实是超出我们最早在定义这个产品的预设的这么一个范围但是我们发现它非常的

有用因为我们收到不止一个家长的这个反馈想用来干这个事所以你们本来最开始设计给我觉得更多还是成年人吧没错就是持续学习终身学习的那个感觉是的但很多是想给小孩子用我发觉这个其实也是很直接的痛点因为很多父母其实现在没有能力和没有时间去辅导孩子那么其实是需要一些能不能有一些软件也好 AI 也好辅助层面能够对这个事有所帮助

对挺有意思而且当我们看到了这个事以后我们这几天正在准备这个升级这么快就能做到是的所以当播出的时候对不起以为这是一个商业机会的这个听众可能已经晚了我们已经在路上了所以这个事的卡点它是在产品设计上它不是在模型能力上吗其实很大程度上是我们当时没有太意识到这个需求就当我们放出去以后我们意识到有很直接的这个需求

我刚刚那个意思其实是说因为如果它是在模型能力上可能你不能这么快去优化所以它更多是一个产品设计思路上优化就可以解决这个问题是吗我们理解尤其是对于 K12 的这个级别而言很大程度上现在模型的能力本质上是能覆盖的它其实不是说已经超出了现有模型能力的上限而是你需要一个很好体验把整个流程给传动

那你们这个什么时候会上我估计快的话下周吧那实际上像原辅导这些教育大厂他们可能也会做这个场景是吗我理解他们很多已经在做了但是怎么收钱呢我看到现在一个典型的一个收钱方式是说我得做一个硬件就是什么叫学习机学练机然后有一个几千块钱硬件的这个形式我可能把其中一部分功能呈现在这个里面那我不单独相当于是做成一个纯软件好像可以提供这么一个服务

来靠卖硬件的方式去收钱但这个一定程度上我觉得会限制能够去 access 到这个东西使用的这个人以及恰恰这种学链机我觉得其实你要从这个机器的硬件角度来讲它其实很难匹配你现在的比如说最好的手机最好的 PC 的这个运算能力所以其实我觉得它能够提供的比如说你说动效啊这种画面的这种质感啊这个恰恰是要差一些所以这个一定程度上也是我们说把它做得更平权化了更免费化了这么一个方式

我觉得我们是有机会做出一个很好的体验以至于说你随便这儿我想要了解我想要学习一个试卷比如说我不太清楚这里面的知识点我拍一个照或者我直接上传然后我给你生成一个一小时课程从头讲到尾而这个老师水准是基本在线的就是他可能超过绝大多数我们不说超过 99%的老师他超过 80%的老师很有可能是打瑞丽时间所以是我们觉得很实用的这么一个场景

你们觉得会比如说今天学点啥再往下发展会是一个怎样的形态会变成一个比如说是教育方向的还是说是一个内容平台因为咱们课件可以分享是我觉得其实站在现在这个时间节点说它未来比如说甚至三个月到六个月以后是什么形态可能都稍微有点早就像我们说的我们可以从这个 release 的可能第一天第二天看到一些反馈来去做一些产品测的调整就是我觉得我们也在看整个市场

对于它的接受程度以及它的应用的一些场景方向来不断地去调整这个事儿的下一步优化的一个方向接下来可以讲讲你们是怎么具体聚焦到这个方向的包括你们一些做产品调整的策略我前段时间和有一个投资人就是你们的投资人聊他有一个总结挺有意思的就是说现在市场上最缺的是好的创业方向其次是好的 AI 产品经理最不缺的可能是技术人员嗯

你们是怎么想到就是去做今天学点啥这个方向的包括中间有讨论些什么别的方向吗他怎么收拾到这个点上我觉得很多人对于我做产品有一些误解比如说我觉得很多人对于我们的一个预期是说我们是一个产品向的公司所以我们有一个强大的产品团队

实际上这里面的可能 80%以上的产品策略决策就是我拍脑袋进行的对包括你刚才说就是你们要去做一个家长用户的这种优化是其实这个也很快因为你如果下周就上线的话说明你更早就做了这个决策但是你之前的比如说市场调研我不知道你们做不做这个东西包括你们怎么做就你怎么判断这是一个很大的需求由于两个人的反馈可能它不说明什么

它实际情况就是我觉得它是个大需求一两个人的反馈其实不说明什么但是我会听到很多哪怕是一些重复性的反馈在我的逻辑链路里面我觉得这是一个不重要的事或者一个不太 make sense 的事我也不会去做但是会对另外一些可能哪怕零星的我们拿到一些需求比如说刚才那个需求就是我觉得我能够非常自洽地推导出来它的一个重要性的这么一个情况的时候我就会去很快做一个决策但有的时候

它甚至未必形成那么严格的数据也好形成那么严格的体系也好或者一个怎么样的流程像在你在大厂里面你可能产品经理想要发现一些东西然后你去 justify 整个这个事然后你提供调研的这个数据然后你可能去开什么评审会然后你再拉上技术去说这个技术实现的这个可行性然后技术评审完了以后再去讨论这个事的排期到什么时间然后再去做这个开发再去做 release 你还挺懂大厂的

多多少少还是知道整个这个流程但是我觉得有的时候我会试图把这个事压缩在我的一个十分钟的考虑的周期里面就决定这个事他就应该得上然后他的优先级就应该得高

你可以把之前的这种过程讲讲吗就包括最近你们这个新的产品还有像之前做密塔搜索还有更早之前写作猫都是这么快的决策吗以及你的这个过程中间就是你的这些直觉的东西是来自于什么我觉得因为这几个产品大概率都还是一些用户向的产品如果它是一个专业属性或者 B 端属性非常强的这个产品你是需要很好比如说这个特定的这个群体要有

很深入的了解而且很多时候对于这种群体的了解往往也不能通过简单的采访来进行就是很多时候当你去问一个 B 端用户某一些东西需不需要的时候往往你得到的都是一些假的回复都是需要对吧这个时候大家沟通其实是一个非常无效的一个沟通所以其实包括我们自己做这个产品我觉得当然这也许不是一个好的习惯就是我觉得我在最近这两年的真正向外求的这种沟通其实会越来越少

但是我会看到很多反馈但是我可能正式的去浪费一些说我要进行一个采访我要进行一个调研的这种时间其实是非常少的剩下的就是自己脑补那你可以以今天学点啥包括搜索为例子讲讲吧就是你大概是一个怎么样的思考和向内求的过程对

对我觉得学点啥典型的是什么呢第一是说我们在过去的一年多的这个时间里面在做搜索的这个事然后呢确实是我们会发现搜索包括现在新一代这个 AI 对于大家去做到信息的获取这件事是变得更容易了就是你通过一个简单的提问通过几个关键词的组合它可能给你形成一个相对比较完整的一个信息一个内容但实际上这种信息大家现在看到的情况是说就是 AI 搜索提供的回复往往是一个在

比如说 300 到 800 字之间的这么一个小作文式的一个回复内容如果你的提问是一些比较精确的就是一些比如说 fact check 类的这个问题呢实际上就是这个级别的内容长度实际上是充裕的是可以够你得到你想要的这个信息的但其实大家在很多这个信息的寻找当中其实他往往不是希望去获得这么精确的这个信息那其实就是对于那种偏模糊甚至是偏一个大的一个 topic 类的这个问题

就是我们在做 AI 搜索的时候其实已经意识到说我可能要把这个原文把这个比如说 PDF 有一些跟你提问相关的一些很好的相关材料以原文形式推荐给你然后方便你去学习里面的这个内容甚至它的上下文内容可能有 100 页那这 100 页很有可能是你未来很好的一个学习材料

所以一方面我们是认为 AI 搜索一定程度上做了一定的信息的抽取和压缩它对于一类问题特别适用但不是对于所有问题适用就包括是过去两年大家很常见的一类叫做比如说 AI 总结类的这个产品就是我们会觉得它应用的场景其实比较有限

你说 AI 总结类的产品指的是有大量产品我感觉在 ChatGPT 推出来的大概一年左右的时间市面上有可能超过 100 个利用 ChatGPT 进行总结类的产品什么音频总结视频总结对吧 Podcast 总结微信公众号阅读总结或者说这是个 feature 很多产品你会加这个 feature 包括小宇宙最近也加了播客的要点总结

对但其实我们就觉得这个信息损失可能是非常之大的就是不同的人对于同样的这个内容的关注是不一样的而真正很多有价值的这个深度信息可能不是总结得来的所以我们恰恰觉得就这个事可能得倒过来做第一我能帮你找到有价值的这些比如说原始的这个材料但消化原始材料对于绝大多数人来讲是困难的

我丢给你一本说这个是一本名著这是一本好书八百页对吧你自己去看这样很多人看这个百年故读说里面这名字实在太多了每次看到第五十页的时候已经搞不清楚这里面出现的各种人物的名字

就是它其实大多数的这种材料包括是像比如论文它对你首先有个初始的假设是说你可能已经掌握了某知识然后它的这个行文可能符合比如说学术规范那恰恰对于很多读者来讲这个事是不太友好的一件心事所以有没有办法让这个事更容易不光帮你找到了东西而且使得你真正能够更好地去吸收这个内容你几月份开始上这个视频

应该差不多从去年年底吧去年年底就观察到有这个需求而且觉得应该就是倒过来做不是做总结而是帮他链接到更多知识以及一个比较好的形式去让更多人都能去了解这些比较深的知识

是而且一定程度上我觉得这个可能也不是说从某一天灵光一现因为在做这个之前我们之所以去做比如说密塔的这些文库也好学术也好其实也是认为原始的这些内容素材本身其实有很高的价值对我觉得你们现在的交互确实挺好的因为宇童在来之前他其实用就是我们 23 年聊的那一次也是个非常长的上下文作为材料就是放到今天学者沙里面是

来学了那个材料你可以讲讲就是它里面有些比较惊奇的体验对 一个就是我觉得确实比如说因为你上次跟曼琪聊的时候讲了很多 Transformer 架构然后你就说到了一些比如说什么 DecoderEncoder 这些区别比如说聊到 Transformer 的时候它会自动弹出来一个

是然后比如说 RNN 的什么结构他也会讲然后 Encoder 和 Decoder 是什么他也会介绍一下并且这个并不是我们聊的内容而是应该是你们这个是你们自己已经做好的还是说它即刻生成的即刻生成的因为你基本上很难是去预定好说哪些内容如果是能生成对

对它是一个非常好的形式因为我们当时有聊到 Transformer 和 Bert 的一些区别但因为我们口语里其实并没有一个很完整的解释也不是一个结构化的展示但是在你们这个产品里它是会有一个 Transformer 和 Bert 的这种架构的它是一个图式的区别

是的他有的时候会更多的把一些辅助性的这个材料给你对就看图挺清楚的没错一个是图片我们认为是一个很好的就是有的时候辅助理解的一个形式另外就是说有的时候有一些所谓的比如说专家也好这个行业最牛的这个人他恰恰不适合讲课因为他有的时候离一般的人太远

以至于他可能觉得这些知识我预设大家都理解都懂的但实际上恰恰是说绝大多数人可能对于他习以为常的有一些这个信息感到陌生所以我们包括在调学点啥的一些比如说讲稿的这个时候就是会更多的比如说用到一些类似于比喻类比等等

就是它不光是说给你提到比如说这个 LSTM 和 Transformer 它有的时候会帮你去添加对它的一些注解比如说 Transformer 比 LSTM 的一个很大的优势可能是 LSTM 需要一步一步来做后一步的这个信息依赖于前一步所以它执行的很慢但 Transformer 可以更好的并行就是有些这样的背景知识信息会让读者或者这个听众在听到了以后会显著的降低他的理解的门槛所以其实有这样的细节的一些处理

其实之前就是我们聊到你们快发新的产品的时候我当时第一反应就是问是不是一个 agent 对然后你说不算你们为什么没有先去做其实从去年到今年都讨论了很多这个 agent 方向的产品我觉得这个是一个非常奇怪的事就是你难道不应该去做这个市场上有价值但是大家没做的事吗为什么要去做一个大家都去做的事呢

那搜索之前也有很多人做呀就是你怎么判断价值我觉得我们的理解 AI 搜索这件事在我们做的时候真的在国内没啥人做就是我们差不多立项去年 12 月底嗯

前年 12 月底对 23 年的 12 月底那个时候其实没啥不会认为搜索这个是一个主赛道所以那个时候其实也不算是一个主流赛道的应用的一件事我换你问啥我不是说你们现在为什么没有做 agent 因为你现在推的产品肯定是你之前做的包括这个其实你也说到是去年就有这个想法了

就是你们在去年的时候为什么没有想去做 A 型的这个方向因为其实从去年年中开始我觉得就有很多人在讨论这个方向是就包括什么 YC 什么投了很多 A 型就是我们判断就像刚才我说的那个我们在判断有些方向值不值得做就是当我想到 A 型的时候我没有一个直觉觉得哪个方向会特别好我觉得是这样一个所谓偏通用性质的 A 型的这件事我仍然认为在哪怕是二五年上半年的这个时间节点

的大模型挑战仍然是非常大的你怎么定义 agent 还是一个 common sense 大家理解的 agent 就是他自行比如说调用工具去拆解步骤处理任务并且然后交付的这么一个逻辑就是他是可以做到刚才说的那些事然后他可以自己完成一个任务而且这个任务有可能是一个写入类的任务也有可能是对外就是去做一些事的任务对 是比如说做一个网页其实你们也有功能是能做这个的

密塔厕所里有能做网页的供应是的其实类似的这个概念出现的非常早就是二三年的上半年差不多两年以前

我觉得基本上可以看到大家对 agent 这个事的想象就是这类的这个产品的这个需求肯定是很理想当中的存在的这么一个东西因为帮你干任何事就类似于这么一个逻辑所以就是有这样一个想法其实并不稀奇但是其实一定程度上它到什么阶段能够让绝大多数人认为它 work 了我觉得这个事是它的实际的这个难度

因为 23 年的那个产品 AutoGPT 我自己去试用了 15 分钟我当时的一个结论就是这个现在不会 work 的虽然那个时候已经很火了我觉得也是什么一周时间在 Github 上有几万个 star 几万个点赞的数量但是就是我自己体感来讲的话我使用 10 分钟我就会觉得这事不 workMiles 你用过吗没有直接用过就是你看过 demo 看过测试对 我看过一些 demo 其实比起比如说两年以前肯定是显著更 work 的

你没有非常迫切地说我要找到一个邀请然后去自己试用一下吗没有太迫切是因为我多多少少会对他的这条线其实我觉得是有一个预测就是他大概哪些事能做到对哪些事擅长我其实多多少少有一个预测

本质上其实你看之所以为什么类似于比如说像生成一个好的 PVT 生成一个好的网页这件事在最近的半年时间开始流行起来因为是在最近的半年时间 Cloud 的大模型能力能够把这件事做得比较好所以有的时候我在看很多 agent 的宣传的时候他们拿出一些精美的很好的一些说你看我能 deliver 很好的一个结果的时候

我就会在想这件事到底是谁的功劳呢就是你的谈是很可能是 Cloud 的功劳它不是很可能我确切地知道这是谁的 contribution 导致了它现在这个让人看上去能够比较不错的一个结果那现在就是今天学什么的功劳是谁的

今天学什么我们又有一个新名字今天学的是啥不好意思对这里面的有相当部分其实是说我们也是借用了现在最好的模型的比如说代码能力 HTML 的这个生成能力

但是就是整个其实核心这个模型我们是拿回来自己做了训练的就是这个可能和一部分人理解不太一致因为基本上现在很多 A 型的其实是在直接调第三方的一些尤其是一些海外的一些大模型但我们这个其实是合规合法的在国内进行调用的后面有一段是关于这个的

我们之后会展开对然后回到就你刚才说你觉得在二五年上半年这个时间点目前的模型能力对做出好的能 work 的 agent 的产品还是有很多挑战的那展开来说具体你觉得是哪些挑战我认为跟二三年情况其实是一样的其实就是二三年的比如说很多这里面的工具调用也好规划能力可能是二十分三十分你可能从一百个任务里面找到了三个能够 work 的任务然后拿出来给大家做了个 demo 进行了一个展示

可能到 25 年的这个时候呢这 100 个任务里面可能会显著的提升了这变成有 30 个任务能够 work 的还不错的这个程度但其实一定程度上就看大家对这个事的预期究竟是有多高如果你的预期是说我现在给你 100 个任务你就是应该有 95 个以上的人物就能够成功执行并且达到或者超出我的预期那可能现在就是还没有跨过这么一条线的这个时候

所以你觉得通用 agent 是没有跨过这条线因为通用可能才会涉及到你说就是我有很多很多发散的任务然后我预期它会完成的比较好是就一定程度上我觉得这个它很难被很好的定义的一个问题是你的预期是它有多通用这其实是个巨大的问号

就像有人之前试图拿比如说类似于这样的产品举的一个例子比如说你告诉他我现在有台电脑我想挣一亿美金你给我一个方案你预期他真的能够 work 吗明白那就是当阿拉丁神灯没错 是的所以什么是一个合理他应该能够执行的任务和什么是一个纯粹许愿类型的任务我觉得这之间其实就是这个问题

那在你这个逻辑里面比如说一些比较垂直的或者图专门人群他可能就是完成我 100 个任务里面我能做得比较好的那 30 个 20 个任务的方向是不是还是很有机会

这个其实我觉得一定程度上涉及到两个方面的 PK 一个方向是说如果你做的单点的那个比如说我在这 20 个任务里面有两个任务是跟比如说什么法律类比如说我帮你省合同这些任务相关的这个任务真的它是有单点价值的这个时候我觉得你会面临的就是说那就有公司专门出来优化这个方向说那我在通用上面我放弃掉所有通用的这些任务我就在单点上面我把它优化好这也是有它的相应的价值的

那另外一个方向就变成说通用这件事其实本质上是现在 AGI 的这些 Foundation Model 的公司在追求的事对就你模型和应用之间的你的边界在哪会非常模糊是的因为其实 Meta 最开始的第一款产品做法律翻译那个还是 to be to 专业人群的是的就是在法律这个业务上或者说针对律师这个人群你们有去计划一些更智能的比如说这种 Agen 的工具可以帮他做更多事的尝试吗

我们考虑过什么时候考虑的在整个过去的几年我们不断地其实会考虑不到这个问题我现在得出来一个悲观的结论叫做如果你在中国是辅助律师去做就是辅助类产品没有任何的机会就是它的投入和产出是不对等的

因为明视是你们天使的投资人对不对他们最近投了一个公司我知道你知道爱玉我听到了但我也没实际了解因为他们在做那个逻辑跟我说的第二个逻辑就有点像这个就变成说我就应该 deliver results 其实就是我们看到它在尤其是中国的 B 端场景里面唯一成立的方式叫做纯粹意义上的替代就别整一些说我辅助你提升效率的事嗯

就是我帮你拿到一个业务结果是有价值的是的但是这件事可能对你们来说就太重了是吗就走得太远了我们在去年年底的时候严肃地想过这件事在有一些偏中高频的这种法律场景上面我们能不能做到

端到端把这个事给完全干完这个程度并且我们当时其实找了业内一两家律所去聊这个事就不知道你听过那个词叫做比如说网约所就是在互联网上接待为核心的这些律所

相当于这件事就变成了一个非常像是一个流量的声音我这边比如说通过不管是抖音的投放这一块是我的各种的这个投放我能拿到大量的案源然后我们看到他很多这个案子我们其实相信的一点是说这些案子能够被自动化就是说我们觉得投入合理的研发的这个资源应该是能把它做到自动化

然后最后就是 deliver 这个结果很有可能它你要说比传统的就律师那效率可能高一百倍我们觉得这个事理论上是存在了一个机会的那你们严肃考虑但是最终至少到目前吧你们还没有这样去做的原因是什么因为我们聊的律所我觉得它有一个非常大的特长叫做它擅长干前端或客的活因为这本身是一个非常销售导向的一个事这件事我们目前还没有信心说我们自己能

然后一旦这个事找第三方合作我们的理解很大程度上会舍在这个合作的这个配合上面就很容易就是商户其实不理解对方到底想要啥对就是看上去就这件事它成立可能真的得你自己干个律所

明白其实明士投的爱玉我理解他就是个律所而且那个创始人因为他们接的就是银行的要账的那种诉讼那个创始人就是金融背景所以他其实某种意义上解决了你刚才说的他前端的那个问题而且因为他把这个方向聚焦到这么特定的一个范围所以我甚至会认为也不必要最好的技术也有机会去能把这事做得比较好

然后我们当时在想可能技术层面会更通用一些因为它借案子的复杂性或者多样性可能会更多一些那你们现在就是选择做什么引动方向不做什么引动方向的完整的思考逻辑是什么我是觉得这个问题其实有点复杂就是我们会觉得尤其是在最近的两年时间整个 AI 的这个领域大家比如说去讨论能不能挣钱收入啊这些事儿

和我在最早在做比如说 AI 的产品也好做 AI 项目有一个巨大的差异叫做你其实面临了一个显著的高度不确定性的环境就是再直接一点是说但凡你做出来一个东西你就等着三个月以内可能市场上各种的同款其实你刚才已经换算了一遍了因为我问的你是什么

产品方向你们做或者不做你刚才其实提到一个点是收入所以首先你有一个条件就是你觉得这个东西是要能获得收入的你才做对尤其在国内这个市场无非可能是你要追求要么是两个点一个就是用户要么就是收入你两个你总得奔着一个去两个都能拿到当然最好

你是觉得 Meta 要追求收入优先级高于用户数和增长我觉得一定程度的收入一个基本逻辑是说你首先得有能力存活下来独立成为一家能够存活下来的公司你可以看到过去七年时间有很多名造一时的公司可能要么已经不存在了要么已经可能收缩到一个非常小的这么一个状态

你七年前创业是就是这么想的吗还是中间你发生了什么事遇到你才这么想的啊你们发现我们一直还挺保守的吗对你们一直很保守因为我们也聊过比较多次嘛其实我知道你一直以来是这种想法是你当时 18 年创业其实是在上一个 AI 热潮的尾巴上吧就那会儿还没有完全到那么低谷就其实那个时候我觉得也有一种创业方式就是我融很多钱然后我讲一个表大的故事我把规模做的表达啊

但是你们一直都不是这条路线你一直都是很看重我有收入有真实的用户然后有现金流是什么原因让你有这样的想法我觉得这个原因是因为我哪怕讲真话人家都不相信还不要说我编一个我自己都不相信的故事对吧实际情况也是这样就是说你开始创业的时候你就已经认清了你做不到融很多钱的

那种创业的路线你也不想做这件事对一定程度上我觉得首先我可能属于超出我能力边界这个事就是很难做到然后另外有的时候我也不太理解有些看似很拙劣的故事为什么很多人会白印我也把握不住这个边界就是什么故事使得很多人能相信但是它又有问题但是呢大家还广泛能接受这件事

我在想我如果作为一个投资人我可能会 challenge 他那几点那反过来就是当我讲这个故事的时候如果有人问我这几点我可能也回答不上来我就会觉得这是一个很大的问题就是我讲的时候我是会有心理障碍说这事可能不能这么天马行空的去编那 23 年是是英伦的热潮吗 23 年的这个热潮来了之后你们的节奏好像也没改变你们在那之后披露的融资也就只有

一次啊对我们来讲已经很快了你看我们前比如说六年的时间不也就两轮融资吗而且有一轮还是刚刚开始出来的时候嗯这是你不认为这是一个需要改变的事情我会觉得尤其是在最近两年这个行业发展其实非常之快嗯可能从媒体到投资人对很多事情的判断每每在两到三个月的时候都会进行反转对会进行 180 度的这个调转然后这件事我觉得让融资其实变得很困难

就是哪怕你愿意成为一个非常好的一个演员你在两个月以前你在讲一个所有人都认可的这个故事然后这个时候你尽量还没做完大家对这个心态已经发生了 180 度转换了所以我觉得事实上即便你愿意这么做操作难度也是非常高的就是干不了这活那回到你们的产品做什么不做什么的一些选择上就有收入有现金流回来这是其中一个原则其他的呢我觉得还是想做用户认可

喜欢然后相对来讲是有长期价值的这个事因为我们看到有非常多的产品很容易它火两周时间就是有一些你创意做的比较好玩然后有爆款的这个传播属性的一些这种 AI 产品往往在过去的七八年的这个时间里面每隔一个可能一年时间啥的会有这么样一个产品出来但是这里面的很多产品我自己的问题就是你如果花了三到六个月的时间去做投入研发就为了火那两周时间吗

哪怕是全球范围内爆款的一个传播你怎么能把它接得住所以我们在做很多产品的时候更倾向于说这个事它可以不必就是那种意义上 go viral 的那种特别火但是它最好是提供了一个比较持续价值的事就类似于我们说搜索你把搜索做得更好这件事是一个相对比较长期价值的事你把类似于今天学点啥这样的能够把内容讲好

能够把教学这个门槛降低的这么样一类产品我们认为它是有个长期价值存在的这个可能性在里面其实 goveral 和有长期价值也不矛盾我觉得有些是确定性的没有长期价值我举个简单的例子比如说你在抖音上做一个滤镜你知道它在一周时间内可能会火遍全球但是你不可能说同一个滤镜大家玩一年还天天在同样的这个滤镜下面互相喘这个被丢那我不停地去产生新的滤镜了

挺难其实你会发现哪怕你不停地产生滤镜你也很难做到那样持续的一个热度就像原来那个我记得什么小咖秀啊啥之类的对吧就是它有一种形式比如说我去扮演一个什么电视剧或者对口型啊等等我觉得那是一个流行就是有一部分的 AI 产品可以契合的是说它有点像是一个流行但是流行你就得接受它不可能一直流行它一定是有一个风马上快速到达这个波峰然后马上掉下来

对我以为你可能会觉得我如果要真的形成病毒性的传播我需要花一些精力去做这件事情我以为你是不想花这个精力我觉得是说首先那个产品就是你要达到那个其实你从产品的研发开发的这个角度你也是需要有很多投入对我的意思就是说你其实会有一些分心嘛

就相当于长期价值和这个病毒受传播之间对 是的而且很多时候那种级别的传播有的时候是你无法预测的对 它有很多综合因素没错 其实是你掌控不了的就是 DeepSick 是一个很好的模型这件事是你可以控制的但是它变成了一个以目前这个级别的这个知名度这件事是你很难提前去判断的所以其实你们每次发一些什么新功能新产品的策略你们也基本上不找什么人来造势对吧

一个是账上的钱也比起投布的这个人家也相对有限我们有的时候说我们可能已经很努力了我们会投一些因为我们大概也知道比如说前一段时间像元宝这样的大玩家一天能砸多少钱那可能把你一年的这个预算全部砸进去所以你是没法跟他去比的所以他们一天能砸多少钱一天几千万吧而且我还不清楚比如内部渠道我给你微信里面给个什么九公格这种

算不算钱如果那个算钱那个都很难算你其他公司愿意花多少钱我来在那给你占一个格子这个可能都没法用钱算是就这种资源你肯定本来也是不具备你刚才也说到其实外界对你们有一个误解就是认为你们是一个产品项目公司所以可能你们有一个强大的产品团队来不停地想这个产品该怎么做对吧

然后你说其实很多产品是你自己来想的就是在 2023 年 3 月的时候就我们这一轮爱热潮刚开始的时候我们聊了一次当时我也是问你就是密塔的重心到底是模型还是应用因为其实你们自己会自演一些模型你当时确实是很明确地说会以应用来驱动的你当时跟我讲是因为你觉得如果没有应用侧重就会变成我好像什么都懂但什么都做到一个不太可用的状态

就是现在某几家国内的大模型公司遇到的典型问题对吧你说我不断地发模型然后你会发现这个模型你永远比最头部的那几家其实显著差一点就是你面临的是个非常平的世界比如说我说我发布一个写代码的模型你就是在跟 Cloud 3.7 在比较没有人会说我只关心国内代码生成能力排行榜

对你要用你就是用的最好的这个模型我这几天在看我们当时聊的东西的时候我觉得你当时这个描述确实还挺前瞻的预言了很多事我觉得有很多比这个更前瞻的事就像我们用 Transformer 模型 18 年的时候我们刚成立的时候是在用当时没有人认可这件事或者是没有人对这个事有理解我们对很多事都比同时期和比那个时期可能再往后一年也都有一个更好的理解但恰恰就是因为这件事所以我觉得有的时候大家更难沟通

那谁更难录透你是指投资人吗我觉得整体大家的判断都是比如说我举个例子我会认为 DeepSeek 的人才策略它不就应该这样吗但这件事是我觉得包括现在大厂很多时候在模仿在学习是因为他看到了一个成功案例他看到了他的最后的这个结果倒过去复盘然后去找这个原因然后去做这个学习所以这就是我会认为很尴尬的这个地方因为

因为当我看到他的这个策略的时候我就知道这不本应该这样吗但实际密谈也不是这么组织的你们不是一个研发密度这么高的公司吗那我就会告诉你这是为啥因为我没钱我有钱我也会这么干这是一个非常实际的问题对非常实际的问题他可能一个人研发成本但我们十个人还不止

就是我可以看看我可以 comment 但我很难说我挑点去做这个事对因为其实就是你们是比较明确的应用驱动的嘛我本来也是想问就是你怎么看 DeepSeek 这种它其实非常侧重于研发它虽然也做了产品但产品实际上它没有太多的优化它甚至没有去照顾说我一定要让你能用上就你还是用一用它会当机就你怎么看这种策略

我觉得是个人品位我觉得那品位挺好的你觉得梁国锋的品位很好对 我的品位很好的我觉得恰恰是说如果你是一个聪明人然后你也知道跟你在这个事情上竞争的也是绝顶聪明的人你没有太多可以 leverage 说我可以一心三用

我可以同时兼顾八个产品然后两条研发线然后把每一条都做到碾压其他竞争对手的这个存在我觉得恰恰是说看到这里有一个大机会然后旁支也有一些这个机会但是从自己的兴趣也好品味也好这个出发可能压住其中一个然后把所有的资源给放在上面

把这个事给做到最好而且牺牲产品这件事我觉得要做这个策略的话其实对于绝大多数公司来讲是非常有难度的就是这些人我不要这些用户我不 care 那你觉得像 DeepSick 这种公司它长期来说它怎么产生商业价值了还是这件事不在它的考虑范围里面它为什么要产生商业价值

如果你是一个足够有钱的人当然你有两个选择就是你希望这件事上你赚到更多的钱我觉得另外一类的人的选择就是说这是我的我不需要让他来赚钱我能不能把它当成消费呢对吧那我为什么要买一个豪车呢对吧我在那边赚了钱我不可以在这边做消费你觉得 DeepSick 或者说换方的整个的钱够他一直这么消费吗够他为了 AGI 一直买单吗我觉得他在现在这个时间节点整个局势又发生了很大的变化

因为这变成了中美博弈其中的一个重要的一个角色所以我觉得首先他现在要拿钱他有别的渠道拿钱而且他不需要承诺任何的收益性质的钱他也一定能拿得到而且一定能拿得到比其他人家多很多的这个钱但我觉得实际上他在做这个事的时候我觉得他很难先去算收益就先别算了你就当买了个大玩具

其实字节阿里腾讯也都足够有钱是但是他们好像没有任何人以消费来看到这件事情这就是问题那所以为啥你的总的人才数你可能不比人家差你的总的投入的钱数一定是远超人家你的总的卡数是超人家最后不是你把相应的这个事给打通给做出来的

你觉得我们现在能非常客观的评价比如说阿里字节的模型和 DeepSync 的模型熟悉有熟练吗或者说他们整体的模型研发能力因为像阿里和字节他们也还有很多别的模型因为阿里的通译系列它是挺庞大的是

是我觉得阿里在这件事上其实从这种全民机的传播来讲其实是有点吃亏的就是你说相比于他的实力没错我觉得严格意义来讲你说他比起比如说像 DeepSick 这个级别有一个巨大的宏优的差异我认为其实也没有而且我相信他们在包括

在 R1 出来之前前文内部也肯定已经有团队在通过一些这种 reinforcement learning 的方式去生产好的数据去做推理相关的一部分研究我觉得肯定都是已经发生的事不是纯粹是我看到了它我去 follow 这么一个方向但有的时候就是我说你可能缺乏了契机那个点我把这个事给引爆

我觉得就是如果说一个是 A level 一个是 A minus level 对不会是一个特别大的差距然后字节是不在这个范围里是吗我觉得字节以他花的钱来讲这个事儿我觉得肯定他不是一个 A level 那我如果先不考虑他花的钱因为其实你们的结构也是大模型小模型的结合你们其实会用到一些别人家的大模型就比如说豆包模型它的能力你觉得怎么样一个是首先这个事儿

其实也都是在非常动态的一个比如说我在六个月以前我就测它我觉得这个东西不太行你也很难说它在比如说三个月以内是不是能够有一个显著的一个提升一个是这个另外是说我觉得这几家确实遇到一个很大的一个挑战是在于你一方面在卖自己 API 模型一方面你有想吃掉所有的应用然后你有想所有的应用来接你的模型这件事逻辑上本来就是不对的为什么

这个难道是对的吗我觉得但凡是对于一个在比如说哪怕就是在应用侧的一个大玩家他一定会对这个事是有顾虑的就是我把我建立的很多这个能力依赖于你然后保不齐过两天你推出一个同样的一个产品来就这个事是个巨大的挑战对所以元宝是不可能接阿里的模型或者字节的模型我觉得是不可能接字节的

阿里的一个显著的好处是在于他很多是开源的你还是可以 claim 这个是自主可控的因为我把他的开源拿来我进行学习我拿来进一步的去做调用其实在拉玛斯发布之后我看你发了一个朋友圈你说拉玛斯再次证明了一流的资源二流的团队干不过二流资源一流团队你觉得在比如说国内这些公司里面我觉得字节肯定是有一流的资源的你觉得他现在团队算是一流的吗

这个问题你还能不剪掉他人倒是挺强的我觉得他会出一些比较强的人我觉得这是另外一个问题就怎么发挥这个人的价值对我当时觉得字节的一个很大的问题是说很多的强人能不能被很好地发挥出来其实我觉得非常取决于一号位就这件事一号位是会有一个非常强的

带领作用因为可能最核心资源上的一些调配等等是跟这个事相关我觉得字节显然是说他的团队的整体的人才密度是 OK 是没问题的但确实就我觉得对字节那个组织的另外一个问题是说你不拿这样的一个背景或者履历的人你也压不住这个场子

你很难说这个是近来字节三年的一个 PhD 然后我觉得它就是最好的然后以它来作为核心的这个资源分配我来去说下一步字节的大模型应该怎么走你觉得张一鸣不能变成梁文峰那种角色是为什么样

当然梁文峰是学计算机出身的但是他可能也不是说很系统地搞过 AI 研究他其实作为公司一号位他直接下场去再立的这个团队我不知道你对于比如说搞量化那帮人是有一个什么理解我的理解可能比较浅我主要是看了我们晚点

自己写的那篇文章因为我们去采了很多做量化的人我知道量化有很多是信息要塞出身的有很多就是计算机备走我就是这样出身所以我对这个群体其实是了解的我大概知道他们擅长什么然后他们对哪些技术非常看重其实做量化的一帮工程师是对于比如说硬件等等压榨最极致的一帮人因为那个东西对他来讲可能 0.1 毫秒就意味着 1000 万美金所以这对他来讲是一个直接可以换上人钱的一个事儿

绝大多数你在互联网公司的这些工程师对于很多这个事是不敏感的就甚至你可以做一个面试题说我现在这里有一个磁盘文件我去读这个磁盘文件需要多少毫秒让哪怕是很好学校的这些学生去回答这个问题大多数对这个概念其实是缺乏的

你其实不知道要读多留时间然后这个计算机在你写简单的一个复兴款一秒钟大概能执行多少次数量级你能回答对吗绝大多数的哪怕是计算机的毕业生他回答不正确的但量化的这帮人对这些事一清二楚非常清晰所以你可以看到包括 DeepSeek 的很多论文的很多工程化的这个创新做得非常细也是跟他们本身原有的这些人的能力素质属性其实是相关的

其实梁文峰虽然可能不是大家理解的典型意义上的有比较长时间的 AI 研究的经历但实际上他在这些工程实操优化实操上他还是很有经验有可能是最极致的一帮人就是这并不是你待在互联网公司干十年你就会接触到或者你就会试图去优化的一些方向那他们团队应该后面又补充了一些算法上很强的人这样可能有一个组合算法上包括像数学上很强的

对我们回到你们做应用这件事情就因为最开始你们肯定是比较明确就是我是应用来驱动的然后具体到应用做什么我觉得密塔这七年其实是有一个从更专用然后到更通用的这样一个转变但我不知道我的观察对不对因为最开始你们做法律翻译那个其实是直接卖给律所这是一个纯一纸的 2B 的然后到写作猫

它是面向写作的人群但是它已经变得更泛了然后到后来搜索就可能更泛了然后今天学者啥我觉得也是一个比较泛 C 的产品为什么会有这样一个转变它是哪些原因导致的我觉得坦白来讲一个非常大的问题是中国的专业市场很多时候还是偏 2B 或者 2Professional 向规模还是太小了

而且付费意愿可能也不大是所以这个我觉得其实可能不是我们遇到的问题放眼望去全中国过去七年投 SARS 的公司有哪个算活得很好的就是这个是整个行业可能都遇到的一个挑战而且你们受到了一点外部冲击就是我之前跟一位师兄聊的时候他有聊到你们之前其实服务了很多欧美的还挺顶尖的律所做法律翻译嘛然后他们很多需求都是跟就是

就商业相关和投资相关的这种然后后来因为中美的一些关系总之就是律所的自己的业务也需要调整对因为过去几年其实律所的业务本身面临很大的这个挑战就是下滑其实很多的对所以你们后来就开始做一些更饭 C 的产品就是有跟最开始的这个垂直的产品其他遇到了一定瓶颈有关系是吗

我就坦白来讲是换句话说如果这是一个平行世界我们如果是在美国干很多这种 too professional 的事情也许我就在那个路径上就往下走了因为你会发现比如说在美国的一些 2B 的比如说服务律师律所的这些产品是有机会做到一亿美金的年收入的

对就包括最近出来融资的有几家这个这个海外的什么哈维啊这几家公司可能都是能够融到几亿美金然后本身自己的 ERR 能做到一亿美金级别的一些这个公司对所以其实我觉得对于我来讲是个很大的问题是说我的灵活性是

我可能既能服务很专业的 2B 的这些人群去非常深入的去看他们的一些需求我也能做这个 2C 的然后一定程度上我其实会觉得我也可以去做 foundation model 只不过没有人相信罢了对你自己最想做什么事情不考虑钱条件我觉得就是做长期有价值的我觉得产品也算然后 foundation model 也算

你这是一个妥协的回答吗不一定我觉得对于有些人的选择来讲叫做我会奋不顾身地去选择其中某一个我觉得就是在这些事上面很多人做这个事其实是你得有正反馈嗯

所以就这几件事本来对你来说它并没有那么强的偏好说我一定非做哪个不可就是这些都是你觉得有价值是你可以做对就是把这些做深入了我觉得都是有价值的你在 23 年初的那个时间点你去说自己能做 Foundation Model 这件事情一定会没有人相信吗那可能另外一个问题我们当时其实也没文明说这件事因为我发现我不说这件事我们说我们现在比如说有几十张卡把这个模型训练出来大家已经不相信了对吧

就是还没有开始吹牛的时候大家对 fact 已经不相信了还不要说你对未来的一个 projection 我们当时说我们用 20 张卡去训练 100 亿规模参数的这个模型很多人说这个不对这个数字跟我其他听到的那对不上你会羡慕像杨振宁那样可以融到很多钱

然后可以自己去选 Foundation Model 我觉得你会发现首先就这个事它有点尴尬的是比如说去年这个时候和今年这个时候整个市场已经又是一个掉了 180 度的一个事所以哪怕就是没有包括 Deep Seek 这个事我觉得对我对这个事的观察而言的话我也会觉得说

本身你拿到了一些超出一个比较正常范围内的资源的时候这本身也是一个很有压力的事我觉得我没有这么心大到说越多越好你们随便投投进来多少我都照单收着

这可能是不同人的不同特性或者能力就有的人有一种能力就比如说孙正义这种人吧他就是摸到很多钱然后讲很大的故事他其实也扛了很大的压力但是他又能顶住这事对 而且我觉得对他来讲这个压力可能相对是小的我记得非常清楚我们原来团队有一个清华的博士就是你股票跌十个点真的是睡不着所以真的是要把股票一定要卖掉清仓才能睡得着觉就是不同的人对这个压力其实跟你什么学识教育这些东西都没啥关系

我就是扛不住对吧同样的它如果跌 10%都扛不住那你想你拿 110 在手上人家对你还有各种的未来的这个期许你这个事你能不能扛得住我觉得不是所有人都能够有这么一个心态

你刚才提到是因为最开始在中国做了一段时间 2B 的类似 SaaS 的这种服务之后你们发现其实我能获得比较可观的收入是很难的你们没有想过出海吗我们现在正在考虑因为我们其实会觉得雪点啥这个产品是一个很好的可以出海的形态搜索不是是为什么了

是因为 Proplexity 在美国很强吗是因为 Proplexity 即便在美国这个付费比较良好的地方也没有收到太多的钱当然这是反正但是我的逻辑是说其实搜索还是对于绝大多数人来讲会认为这应该是一个免费性质的一个服务通用类的搜索

因为去年也有人在问我们出海这个事但是我觉得我对这个事的基础判断是说这事很难可能成为一个一出海然后你马上有一个非常大收入的这么一个产品形态那这个回到我们前面讨论就是你们做产品的一些标准和原则的时候

你觉得很重要的就是我要有收入有用户啊就有的时候这两个指标可能全中是不一样的比如说如果你希望它成为一个比如说有一百万 MRR 收入的一个产品你可能不需要有那么多的用户嗯如果你粘性包括整个产品的 deliver 的这个能力做的还不错对吧像欧美的付费的这个习惯你可能有小几万的这个订阅用户你其实就能拿到这么一个水平嗯

这两件事收入和用户哪个对你们有限性更高我觉得对我们今年来讲的话我们其实希望说会可能把权重更调向收入一些所以去年不是这样去年受各方影响呢我觉得我们的这个权重会更往用户侧偏各方指的是什么影响

你想包括前面很多投资人之所以对这个事要愿意下注其实一定程度上是希望你跑出来一个 C 端的有较高基数的这么一个产品那你们算做到了吗 Meta 搜索以我们的投入来讲我觉得我们做的还算是一个合格的

印太苏索在去年三四五月的时候它的增速非常快到 500% 600%那是刚开始所以快是其实是基数小其实我们现在差不多快到 100 万日活 100 万日活那挺好的其实很多大厂推的产品也差不多就是 100 万日活

你今年想把重点调到收入这块吗那它会对应一些什么样的产品应用策略上的一些变化了比如说也许得去做海外这是一个刚才已经提到了而且这可能是很重要的一个就是有的时候可能产品不用变环境变了这个不等是从不成立它就变成成立了做海外的话你们会人也 base 到海外吗这个倒再没有这方面的打算为什么你们当时做法律业务的时候没有想过出海做翻译吗

繁衣也可以出海我觉得这个还是我们当时的局限性就是我们当时也没有观察到说比如海外法律市场应该切入什么样的一个方向其实有机会去把这个事给快速做起来今年你们的调整是希望更多重点放到收入上这个和什么变化有关系吗

我觉得是这样我们到去年年底的时候我们大概清楚今年的市场会产生的一个变化叫做我们的对手可能不是那些一百亿到几百亿市值的公司是一千亿的公司是一万亿以上的公司 OK 对就是基本上到去年年底的时候我就看得到比如说腾讯元宝在 25 年大概是会在牌桌上堆 50 亿对吧你当时从什么迹象看出来的

会有看到的听到的各种因为从公开层面的信息的话可能这个在春节之后会更明显是但是我觉得这也不是在春节一拍脑袋的一个策略然后你大概也知道阿里也会在牌桌上对于可能不低于 50 个亿对阿里其实在去年下半年就是把通益调整到智能信息事业群这个调整之后我觉得它是比较明显要在 AI2C 上去发力的

字节显然也是要会对不低于 50 个亿的所以我觉得这个问题就变成说如果前三家先锁定比如说千万以上的这个日活我们到底是要去解决比如说一百万到两百万的这个事还是要去先解决点别的事的问题

嗯因为我觉得市场看你就是这么简单粗暴嘛对吧如果你能跑到前两名前三名那我可能对你是这么一个判断但就是以这样的一个资源进来的这个玩家的时候你基本上已经知道前三名是谁现在的意外反而是说居然还有一个 deep sake 冲进了这个榜单里面而且他也是第一了是他到目前为止还是第一嗯所以我觉得这是一个变量所有这三家都没有考虑到的这个变量嗯

所以我不会假装说也许巨头们或者这些大厂们可能不会这么做呢以我们对这个事的悲观理解就是你得相信最坏的事情一定会发生的你真的是一个很谨慎的人你会有时候觉得自己太保守了吗而错失一些机会有这种情况吗

我觉得我错失的可能就是我没有能力去拿到的机会所以他也没有错失对你真的很自洽对吧就是我能力有限就像我说我可能不是一个好的演员所以我即便想我可能也没有办法去讲一个故事拿 50 亿人民币在账上那说明这事不是你擅长干的呀

你也不能这么干其实 Meta 持续都是一个有口碑有讨论的公司但是你们在 23 年之后居然就只融了一亿人民币比上不足比下有余这是因为你不能融到更多钱还是因为你有意去控制了这个融资的节奏

就当时就没有投资人想投更多钱吗我觉得比如说在那节点我们拿到多一些的钱应该是没问题的但是这个事对我们的判断来讲你多一些的钱难道就要去比如说和头部的这公司去 PK 房的一些模统吗这件事是不可能的如果你是要以一个偏应用的形式去跑这个市场恰恰在那个阶段你也不需要那么多的钱

偏应用也可以融很多钱啊比如说 Miles 今天宣布融了 7500 万美元嗯是估值已经到 5 亿美元了对做应用有更多钱不好吗而且去年我记得你们特别火那会就有一个又不知道是谣言还是真的就说 BAT 都来堵你们家的门就是要非要给你们钱最后你们拿了蚂蚁蚂蚁的钱

其实是有人家来聊不管是聊投资还是聊拍笔钱收掉都有这个反正是人家有兴趣我觉得坦白来讲这个事叫这样的拍笔钱把你收掉也花不了那么多钱可能还不如投几架大模型的钱说你需要多少钱不需要多少钱对那回到刚才那个问题就是你做应用的话有更多钱不好吗我觉得这是我的局限性

我会觉得比如说它是一个相对偏正向的一种 C 端产品你是有机会去 booststrap 你的用户和包括收入这一系列的指标的它恰恰可能不是一定要初始化需要一个挺大于以前投入作为一个杠杆你才能敲动的一个事就因为你可能有些不确定性你也说到其实现在这个环境是很不确定的是就你多些储备也许能帮你去抵挡一些不确定性

就是这可能不是我操作这个事的逻辑就是比如说我账上有五个亿比如说我本来应该花一个亿因为我账上有五个亿所以我就前四个亿我就可以放心大胆的花然后花到最后一个亿了说抵挡这个不确定性了我们得往回收

战略收缩可能这个不是我们在操作这个事希望的一个方式你也可以储备这样你也可以还是按你花钱的节奏但是你是觉得代价是比如说可能公司要吸取更多股份或者说有更多投资人进来他们可能对公司的发展方向有更多要求你不喜欢这样如果你拼了一个比如说各家各出这个我觉得是有这个问题就是大家对你的预期可能很不一样

就哪怕我们现在投资人还不太多的这个情况下可能也会产生有些偏好可能有的投资人觉得你就应该把 C 端做得更激进有些投资人可能觉得你应该把 B 端做得更好一些 C 端那个你可以往回收一收我觉得如果你有一个庞大的投资人的这个团队一定大家很难说完全对这个事有一个统一的一个想法你刚才也提到就是去年有人也提出想收购你们吗嗯

你拒绝收购的原因是什么没有我觉得太早了你们已经成立七八年了是啊都已经就是合访对吧我觉得这个逻辑是说恰恰是由于我们在比较长的时间包括在去年那个时间节点包括哪怕是在现在可能不是以一个特别高的估值存在的这么一家公司所以但凡我们做的还不错它总归是个收购标的

你不用太着急你还没到人家买不起你的时候我觉得这个 worst case 变成啥呢你认不认可 Meta 现在做的从用户还是基础的包括我们搜索的一些基础的数据储备架构储备工程储备它存在一定的价值它现在这个价值我们认为我们把它当废铁卖

就是这个车你别说这个车多少钱你就把车暴费当废铁卖我们还完所有投资人的钱还有点盈余这件事应该是能做到的这是一个非常悲观的算法吧但是当你拿了 7000 万美金以后这件事可能就未必这么好解决了真是一个悲观的答案是吗

我在想你的思考方式这算给自己留了后路吗一方面我觉得是给自己算是留了一些基本的后路另外一个呢我是觉得我对于比如说未来的一些市场的判断这件事呢我没有非常直观就像刚才说的那种 sense 的那种感觉说这个事一定非常乐观

而且事实证明这事你可能也不能太乐观如果去年就相当于这些吉小龙们有一个非常对吧就是这事可能就终局已经差不多反正就是我们这几家里面决一个胜负了但这件事你会发现可能也不是这样就是我找不到那个让我非常笃定和乐观的理由这件事那就推回来变成那我需要

保证团队也好公司也好我的这个基础价值我们是能够去加持反应能够砍得到的以及我的这个收入确实是能做到这么一个规模你哪怕按 10 倍 PS 算它也就值这么一个钱那么这个钱是一个相对基本上是你一个价值底线的可以守得住的这么一个估值那你对密卡的上线的期待是什么

你觉得密塔最好的情况下能抽一个人好难回答什么样的公司我觉得这个恰恰也是一个问题就是我觉得这个答案叫做不知道就换句话说小红他们知道 Mindless 出来他们能够把这个估值做成这样能够快速拿一笔这个钱吗我觉得他在出来的那个时间节点他也不知道我说的上限倒不是估值了我指的可能是说就是你心中希望这个公司以后它会变成一个什么样的公司对你来说这可能是一阵很有成就感或者说这可以叫做创业成功啊

就你觉得它应该是个什么样的公司我觉得它应该是一个就像我们说的要么它应该走是有非常好的有非常广泛基础产品和用户的这么一个公司要么呢它确实是在市面上能够被证明说某一类的这个技术具有极强的壁垒能力的一个公司比如说大家判断说大疆这个技术其实你要简单说我投个几亿美金你要抄

你会发现这事是很难达成的我觉得大家有一个 common sense 说这并不是你一个土豪冲进来说我给你三七二十亿这个钱怼购你就能拿得出来的一个东西我觉得有点像是这个逻辑密塔的愿景是什么就你们会去把它总结成一个愿景去我觉得坦白来讲其实不会我觉得你也是很典型的一类创业者有另一类很典型的创业者是他会把这些事会想得比较多啊

就比如说这个公司的使命愿景价值观就包括我想成为谁然后我可能怎么达到它然后这应该是一个什么样的组织我觉得我们其实更想的是说在每个阶段我们能在下一个阶段能不能做的比现在更好一些但是你说它的那个终点到底在哪我觉得这个事并不好

简单概括你从什么时候开始是这样的一个人就是比较谨慎一定程度上另外一个方面来看我不一定是一个很保守的人对 因为你会读博的时候退学这听起来好像也不是一个最保守的人干出来的事对 包括其实你第一次创业你们是被蚂蚁收购了嘛被收购之后其实你待了很短的时间我估计你没有等到那个 vesting 结束的时候你就自己出来了对

推掉了大部分对就是你本来创业这个选择我觉得就不应该是最保守的人干得出来的事而且还干了这么久这是一个更奇葩的一个事你身上这种两边性挺好玩的而且你说对于一个最保守的人他在做产品的方向判断的时候他是不是应该更多的去找一些人去调研

找一堆让自己能够安下心来的这个数据对吧但是我们对该快速判断的时候呢我们也不会把这事给拖着嗯所以你怎么总结自己这种看似有些双面性的特质的共同的根源是什么

共同的根源我其实没有太仔细想过这件事我会觉得对于比如说创业公司中国有巨大数量基数的创业公司其实真正我觉得被关注到的可能是少数一个最大基数的这个群体其实还是以一个比我更务实的比我更踏实的一家一家奶茶店算清楚每一毛钱的成本来进行扩张进行扩电进行未来的布局的

我觉得能够被媒体所容易关注到容易引起传播引起话题的这个群体其实本身就是极小的一撮人对他们本身就有些特性没错而且他们可能是在这些 projection 上面最激进最愿意最有能力去讲大故事的是愿意被人听到的我觉得是这样就是你讲大故事你能实现而且你

你屡次讲屡次被认为是大故事且屡次实现这是你牛马斯克就是这样对但如果你讲一次大故事你阶段性获得这个超我的收益然后你发现这个事你不能兑现我觉得我并不想成为这样的一个存在你刚才这个话让我想到了我前段时间跟硬气聊他说 AI 1.0 给他带来的一个感受就是所有不能闭环的辉煌都是阶段性可能他更有感触一些

那回到你们现在做模型包括做应用的具体的过程因为现在讨论很多的一个点是大模型本身和应用的关系和边界其实我们刚才也稍微 cue 到了一点就大模型变得更普及之后它有冲击你们以前的一些产品吗其实像 CHHBT 它的上下文变得更长之后它也可以做像写字猫的一些检查然后这个试试核查校对的这种工作

然后国内还有很多免费的产品可以用所以对你们会有什么冲击吗你说它要完全没有受到任何这个影响肯定也是不现实的就包括写东方之前其实 offer 两个比较大的功能一个是 AI 写作其实一个是偏辅助包括检查一系列的其实相对比较长期现在包括很多订阅这个用户其实用到辅助检查这个会更多一些

而 AI 写作显然它现在已经成为了可能所有这些大模型免费标评存在的这么一个 feature 所以我应该是在好像前两年的时候其实或者说这个时间窗口对我们来讲呢不太友好的时候它太短了因为我们在做写作猫的 AI 写作的这个 feature 的 release 是在

22 年的大概 10 月份左右其实我们上次有聊到过这个对 它在两周以后拆 GBT 发布 11 月底就发布是就是如果我们有一个更长的时间周期很有可能会对包括我们的各种方面资源储备可能会更多一些你们写作猫的付费率有下降吗这我得回去查数据相对比较平稳而且它周期性其实会有点强因为我们每年峰值的这个月它其实会更多它其实呈现一个很不均匀的一个状态

像写作猫这种产品的峰值的月份是什么时候啊学生用的时候考试写毕业论文对就差异会比较大就大家疯狂写字的时候对因为其实像刚才我们说的写作猫这种例子它就是一个模型和应用的

边界在变动的这么一种现象你自己会怎么给模型能力的眼睛还有应用优化发现就是哪些东西它可能是随着模型本身能力提升之后你单纯在模型上再去做一些应用的优化这个空间和机会就比较少了我觉得这是一个非常难以一两句话概括的事我觉得大家会有一些 principle 类似于新模型发布对你来讲你到底是能够争取到更多的用户还是更少的用户我觉得简单的答案类似于是这样

但我觉得就实际它对每一个不同的类型的产品到底是比如说它短期受什么样的影响长期受什么样的影响我觉得这是一个可能得 by case 去看的一个事我想问的倒不是它对具体产品的影响我想问的是说就比如说你觉得哪些能力它可能是在那些

去交做模型的头部公司他在主航道上就是他肯定是要去做这些能力的我觉得是说但凡是看上去较为通用的能力都是主航道的能力就是他会吃掉所有的我们简单滑下来看一下比如说他有机会成为一个 1000 万 DAU 的一个事儿我觉得但凡是进入到这个边界的事儿可能房东一些 model 公司都会有兴趣但是这也跟大圆模型能力本身的边界有关吧嗯

也不是所有这样的事他都能做到我是说他相当于是比如说有一家 AI 公司利用他的这个模型能力能够做到 1000 万 DAU 那么这个事很有可能就会成为他的狩猎的范围里面对吧明白那你这么说的话岂不是所有企图不自己做模型然后只做应用做 1000 万 DAU 的公司都很难存在吗

你除非 build 的一个就是比如说我可能不是以用户基数建厂但是我后面有一个比如说长的销售或者服务的一个链条就你的壁垒得在别的地方对 我的核心价值可能是在别的地方

而不是以获取最多的比如说用户或者是一个轻量级交付服务就是它都是一个比如说线上交付那如果你确实符合又大技术又是线上交付严重依赖于防灾性模特那你为什么会认为人家不做呢对吧那你这个预测还挺悲观的对广大 AI 应用创业公司我觉得是一个客观的预测而不是一个悲观的预测我觉得它会发生你觉得像 Malice 这种产品它在这个主航道上吗我觉得他们团队是一个非常擅长调整的团队

我觉得他们其实身段非常灵活没有啥包袱不是偶像派出身的谁是比较有包袱偶像派的你想去年头部的那几家其实都是以一篇明星光环们出现的这个创业者对所以那个时候你要做一个大调整或者一个大改变人家可能谁都可以来 comments 你几句你怎么样了你是不是又不行了就是又放弃信仰了对我觉得这个你想作为他们团队就没有这个包袱

我们 23 年的时候聊到过 Jasper 你也提到就是 Jasper 对你们写作猫其实是有一些启发然后当时你觉得 Jasper 的一个很重要的贡献是找到了机器柜带人更贵的切入点他们也是很快就做到了一亿美元级别的订阅然后我觉得这可能是另一个例子就是他的业务会被大模型本身的能力影响在 24 年下半年的时候其实他们是有估值下调包括也裁员我觉得这是非常有意思 Jasper 在 2025 年的今天没有大家想象的那么差

如果我记得不错的话应该也是一个亿美金级别的 AR 的年收入的这么一家公司作为一个不是特别大规模的公司

这是一个 99.99%的创业公司都从来无法企及的这么一家公司但是我们是非常清楚地看到 Jasper 在可能一年的周期里面是如何从一个被追捧的公司到一个被所有人都会来踩上两脚不是他都不是遗忘他是觉得你看所有人对他的评价就是说你看他是不是就被干掉了吧事实上是人家还没有被干掉

从数据来讲一家成立比如三年的公司做到一亿美金 AR 它是不是一家好公司对吧这是一个很有意思的现象这就是我说的很多时候三个月周期市场从一个极端走到另外一个极端然后最后所有的这个极端的判断可能都是错的所以我们为啥有的时候没法出来讲东西就是太高调容易被反噬吗你是觉得而且就是即便你说正确的事也没啥意义

就是我无法纠正绝大多数人对绝大多数事情的这个理解你觉得现在在 AI 领域有些什么比较常见的误解前一段时间一个非常常见的误解就是 DeepSick 很便宜好像大家听到的信息都是 500 万美金嘛

对他最后一次训练的 GPU hours 的成本是 557 万美元是所以这不代表人家没有研发投入就像之前有人问我说这个是不是证明了没有人没有钱也能干好大模型我说 DeepSeek 就是在整个中国范围内可能算是不说唯一但是最有钱的一类和最有人才储备的一类公司了

这没有超出这个事的基本规律它不是真的只花了 500 万美金把这个事做成这样的它可能还要加两个零有多少人真正投过 500 万美金后面加两个零的钱在大模型的这个训练上面呢你全国范围内也找不出几家了关于你们自己的误解有什么吗关于 Meta 的很多人觉得我们是你们是不是接了这个模型你们是不是接了那个模型我觉得在很长一段时间大家的预期都是就是

就是我们是一个纯粹接了某一个模型的一家公司实际上是我们其实除了这次在接这个 DeepSeek 之前其实我们所有这个模型都是自己在训练的对因为你们之前其实发布过百亿参数的模型你们自己也训练了百亿参数的模型对我们其实都是自己训练但是我们没有把它作为一个类比如说什么 API 这样的形式开放出来这也是我们当时的另外一个判断

就是这生意它就不 work 当时是指 23 年的几月份有这个判断我们一直有这个判断就是卖 API 这件事它不太 work 哪怕它对于第一名可能 work 它对于后面的人可能也极其不友好本来我们后面也是想跟你讨论一下就是实际上你们的技术上的架构你们模型到底是怎么用的你们的模型

你们最近其实有描述你们模型的结构是大模型加小模型这真的是非常描述性质的描述对就是大模型的部分你们是说可能是比如调用 DBCR1 来负责深度推理对吧然后一些复杂问题的思考然后自演的模型就是你们的 Meta LLM 去专注于信息搜索资料整合还有快速响应对这个组合的实质是什么它应该不是我们一般理解的就是说我在一个模型上然后我给它在作人工程优化不是这样一种组合

我觉得一旦涉及到一些工程细节这个事就比较不是那么容易说清楚因为我觉得包括这段描述是我们一个刻意简化让大家可以快速形成一个概念的这么一个描述方式但实际上可能它背后不是两个模型也不是三个模型可能也不止四个模型它可能是个系统工程系的这么一个架构而且这个架构到底会不会发生变化呢嗯

它也会根据不同时候的不同状态以及比如说有没有新的模型有更好的能力有新的开源有更好的能力在不断地发生变化调整的这么一个状态所以我们其实觉得这件事本质上它不是一个说我信仰这个模型应该是啥样

然后我一条道走到可以把所有的资源说就按照这个方向去做而是根据所有现在的你拿到的最新的一手的这些资源信息去不断的去调整的这么一个状态那可以讲讲你的整体思路吧就是你觉得在做应用的同时做模型的话你这个做模型的思路是什么因为我理解肯定是跟那些就是说我直接要做模型比如说跟六小龙这些思路肯定是不一样

其实更多的就是我们要服务自己的用户所以当我服务自己用户的时候就像我们说我们可以接受它是一个更偏科的模型我可能没必要追求它是一个六变形战士它在什么语文数学所有的这个方向上都刷到接近最好的这个排名所以当你可以愿意牺牲掉一些东西的时候也许你就能换来比如说更快的速度更低的这个成本然后这个事如果你能换来一个十倍的比如说速度成本的这个差异的话

可能在一类的这些应用的大家的这个竞争当中可能就是一个很实质的一个变化你说也许那下一代新的大模型它自己升级了优化了会不会抹平这个差异呢我觉得这个问题叫做那你应该也是在最一线最快速的找到在下一代模型的那个周期里面最值得去干的这个事你把它干到最好你觉得下一代模型周期里最值得干的事是什么你现在觉得是什么

这得看到下一代的模型的哪方面能力有显著的提升你说的下一代你指的是什么是指比如说 GBT-5 算是下一代吗我觉得没有那么严格的定义了公认的比如说在当前这代模型上面有一个几乎比较实质的提升的一个版本你觉得 O1 相比于 GBT 系列我觉得算你觉得是我觉得是

它虽然是一个偏科的但我觉得那是一个实质性的提升和突破如果看一下就是从 23 年到现在的话你觉得模型层有哪些真的比较重要的进展啊

我觉得前一段时间好像是 DeepMind 有相关一线的模型的负责人其实在讲过这个事他说从他们内部来看觉得比如过去的两年整个这条线的模型能力的提升相对来讲是一个偏线性的提升只是外界对它的感知是一个阶梯性的因为它可能到一个节点我 release 一个新的版本出来然后外界看到原来做不好的有些事在新的版本上能做好了

其实就对他们而言可能不是说有某一个特定的技术或者特定的这个细节带来了一个巨大的提升但可能同时再做一百件事的提升和优化就比如说欧带来的提升它也是在这条线上什么它也不是说让邪律突然变抖了一下

我觉得它让特定的一类的这个问题的斜率变得比原来更陡了然后这部分比如说像生成出来这个数据又可以反补到它的比如说 pre-train 的这个数据里面来进一步提升你 base model 的快思考的推理的这个能力你说特定者就是数学逻辑变成啊就是这类就是相对比较好验证的这样一类的这个问题

Cloud 3.5 其实它不是一个推理模型就知道我觉得很多人不认为它是个推理模型吧我觉得它没有显著地表现出传统或者是说大家认为像 O1 像这个 R1 的显示给出思维链方式的一个推理

但是我觉得像就是 DeepSick V3 的这个新版生技他们其实自己提到在数学在这些推理能力上的一个很大提升是因为他们把推理的就是生成的这些数据又放回了群里里面所以你说他

吸纳了推理的结果作为他的知识储备的一个数据做预训练严格来讲它也不叫推理模型但它其实具备了一部分推理模型的能力对我就想知道就是从技术上怎么去看这件事情就可能你不是用比如说 O 或者 R 这种我先有一个预训练模型我在这个技术上然后用强化学习的方法我再来做训练去提升他的数学逻辑推理的能力我也可以提升推理的能力我也可以提升编程能力对其实

AnswerPick 有讲过他认为这两个东西不应该分开看是然后 Cloud 3.5 的效果也不错这个在技术上应该怎么去理解

这个就是我说的那个大家何必在技术上划分一个这么明确的信仰呢有一个这么严格意义上路线之争呢最后你会发现很有可能是说最好的这个模型最好的这个效果就是及各家之所长最后得到的一个结果你觉得 O1 和 R1 是真的在做推理吗

因为这个问题其实我前段时间问过你的博士生时期的导师马毅问之前我就想到马毅老师可能会说他认为这不是他确实也认为这不是真的推理我觉得这个问题就难以直接回答是说我们对推理的定义又是什么呢就是这个可能得回到那个定义本身然后严格来验证说它是不是符合常规大家公认的对推理的一个定义对我想知道你自己的想法是什么

就像说你说 R1 是有智能吗 R1 有智能吗你会怎么来想这个问题呢我觉得它有智能的形式这是我比较能确定的就是它表现的有智能是然后其他的就取决于你怎么去定义智能的本质了这个事我觉得就不太好说是那我会觉得这个问题是说我看到很多人也没有智能了

对吧就是你告诉他三步做这件事你可以把三步都写下来他也会做错呀那你说这个人没智能吗他学习能力可能很差所以你是比较倾向于用他最后的结果和表现来去判断或者说那个事可能更重要或者那个事是相对还比较验证的然后如果你不靠那个事验证呢那是不是就非常违心了说虽然他啥也不会但是我认为他你有智能对有智能

比如说马毅老师就会说他觉得现在至少没有证据证明他有智能然后他觉得可能会有些反证比如说让推理模型去做奥数的题因为他可能训过奥数的题然后他能做得很好然后你给他一些很简单的数学题小学初中的他同一个模型他也能做不好如果说你类比到就是一个人如果他真的理解了这个数学的逻辑或者原理的话你不太可能说你小学的题你不会做

然后你会做 outside 的题我觉得这个怎么说呢其实存在有一些当然这个可能是当年的段子就是类似于说当年哪个数学家华罗根还是谁就考了一道小学题然后他就算出来一个结果就是有人就问你也知道就是他其实是一个很有技巧的一个类似于小学的一种奥数类的这个数学题说你也知道这个技巧怎么把它换一下然后把它消掉你就能快速得出答案他说我不知道他是心算

对我是直接求了个积分然后把那个事给算出来的就是两种不同的路径的体现而有的时候也许画楼根真的不会那个很有技巧就是让人看着很好玩的那个解法就是鸡兔童龙它可能就是列这个二元一次方程来把它算出来它可能不会像当年大家说什么把什么鸡有一只脚给收起来然后怎么样我小时候有学过已经忘了所以你看这就是这个问题

你现在问数学家 G2 同龙不列 XY 这个方程他不一定会解对对有可能忘了是他不一定会解所以我觉得就是怎么去加 CY 这个智能这个事本来是很复杂的一个就是我觉得本身可能都不是一个现在太无定的一个问题

我们沿着现在这个方向往前走你觉得持续提升的这个状态还能持续多久因为其实去年秋天的时候有一段时间整个行业是都在讨论说 skating load 撞墙的这个事情然后后来因为 OE 出来之后我觉得是缓解了大家的这种焦虑吧然后最近大家又不怎么讨论这个事了

我甚至会更好奇的一件事是说最绝大多数的可能非从业人员的这些用户和公众是怎么感知所谓的这个模型的智能提升的

我觉得其实大量的人是比较难感知的对对对是的我就有点感知不到其实你从什么时候开始感知不到从哪一年几月份开始感知不到我觉得是四之后我其实就有点 get 不到了 GPT-4 之后但是多摩泰的一些对 多摩泰是一个很视觉或者听觉上那个是很直接的

对 4 欧最近我觉得是让很多人有觉得莫琼好像有变厉害但是我觉得文字上确实包括像 DeepSick 它加了思维的能力之后我觉得它确实挺花活的但我自己确实没有特别觉得它的智能提升就比如说它的文字生成的很好思想很丰富我觉得这个其实比如说就像你说的在某一个方面你就专门去给它训练也是可以得出来的

所以其实叫我主通人的感知就是大概对所以我觉得有的时候就是这个是一个非常就是大家好像也是 accept as a fact 但是你回想起来你到底是怎么来判断这个事其实有的时候这个判断本身并不容易你可能是听说它有提升我觉得用的时候你有一些渐进性的感受吧就比如说

你刚才在讲最开始你们设计今天学点啥的时候你希望把一个复杂的文本然后让它是更结构化的显示有图片或者有表格什么的所以你下去和 ChatGPT 聊它也会给你这种反馈就有时候你会提一个很模糊的问题或者说这个问题前面是有一个语境的因为我们已经交流了几个回合比如说我最近在问它一些 GPU 的进展的问题然后可能我前面问了一下 Google TPU 的那个应该是叫 Pod V4 吧

然后后面又问那个 NVL 的一些事就它会主动 guide 到你的意图然后它也会给你列表格列图式是的就是你回想它确实比几个月前稍强一些是而且就是这个是一个还是偏直觉感知测的一些东西而且确实有一些模型它的那个提升就是会最后回归到尤其是你不是在严格测材质上和比如说这种静态题数学题就是有些数学题这个测相对你

你能比较直接感知到它的两代之间的这个代差可能差了 30 分差了 40 分有显著的一个区别但对于我觉得绝大多数人的绝大多数任务而言我是会觉得大家 claim 它好和不好都很武断所以所有模型新版本一发布你就看网上大家测的 9.8 和 9.11 哪个我不知道大家测这个是想证明什么是我还比它强吗

我看到很多人测试的反馈是 9.8 和 9.1 你比较不出来大小哈哈你真笨然后转身就走就是它更像是基于说我能不能找到你的破绽对一个问题上存在破绽来证明你不行而不是倒过来说我把你当成一个

我也许能够很好使用很好配合的这么一个工具而找到你擅长的那些领域擅长的方向来更好地用你的这么一个心态回到刚才那个问题就是说比较快的提升能持续多久你觉得可能有一个难点是在于说我们怎么去衡量提升以及提升对用户来说到底意味着什么

而且一定程度上我觉得这件事就是对于一个比如说有监督的学习但凡你能比较好的去衡量某一些任务能不能提升你其实就能设计出来一些方法不管是从数据测还是从这个算法测去把这个提升进一步做得更好

就是它可能不是一个面向真实用户场景的而是我就是我想把那个 benchmark 刷高我总是有方法的对我觉得有的时候如果它定义的这个 benchmark 恰好符合很多人对使用的这些需求那么它可能就能做在下一个版本上有一个比较显著的提升但也有可能这个 benchmark 和一般人的使用之间是脱节的

其实最近姚顺宇写了篇文章就大概是说什么模型的下半场现在更重要的可能是你要给这个模型找到合适的评判它的标准然后让它真的去提升真实世界里做任务的能力对 我觉得这个也是他们可能现在核心要解决的对 OpenAI 可能也是在想这个事情那回到一些就是更技术上的一些问题我有些我自己比较好奇的我想听一下你的想法

因为现在大家来做强化学习去提升模型的能力做推理模型它这个前提还是我有一个比较好的预训练的模型作为基础是而且我觉得一定程度上可能很多人低估了预训练对于这个社的重要性对于做好一个推理模型的重要性是你会发现比如说 R1 的这个论文里面他们不是用到那个什么 GRPO 算法吗

那个算法意味着什么那个算法其实有一个很简单的一个逻辑推导它其实是在它的基础模型上面比如说通过随机 64 次 128 次找到可能在这 128 次里面有一次能够成功把这个题给做对然后它希望通过这个方式优选出来这 128 个可能性里面好的那个路径它其实更像是在优化这件事

对于一个非常难的问题不要说 128 次在 1 万次里面你的当前的这个 base 模型是找不到任何的可用解的时候这个方法是不二的对就这个方法要基于说你给他的 128 个选项里有好的选项他得不能错得太离谱以至于他蒙很多次的时候还能蒙得出来正确答案这个强化学习是能够帮你蒙得更快

是原来你要蒙 100 次你可能现在两次以内甚至第一次你就能把这个最好的答案给拿出来了对但这不代表说他可以凭空的去创造后面的所有的这个东西对那正是因为预训练这么重要对吧那我们看最近 Growth3 他用 20 万张卡来做训练他带来的提升其实没有那么多然后包括 Lama4 他是 Meta 的新一代的基模

那它这个问题可能就更大了对所以我会认为 Gorax 3 和 Lama 4 是两件截然不同的事我觉得 Gorax 3 算是一个成功的模型它其实成功地证明了有一群不错的顶尖的工程师再加上最好的硬件在一个比较短的时间内追上了一线模型的差不多的这个能力你考虑到它在这个事上实际花的这个时间你会发现它实际上

我觉得它恰恰证明了一件事叫做这个大力还是出了奇迹就是

就是在这个之前你说能不能就给你半年时间给你一年时间你快速搭一个团队能干到这个至少是比如说 GBT4O 甚至 4O 以上的这么样一个推理能力的一个水准我觉得在 Growth 3 出来之前是不确定的嗯然后他证明了这件事是可以做到的嗯

好的人配最顶尖的资源这个视角挺好的就你的这个视角不是说把 Groove3 和同一个时期之前发的那些模型去比它比那些模型提升了多少人家家里比你早期的比如说五年的时间然后你还是能在相对比较短的时间内能做到最一线那从目前的这些新模型更新的情况我指的都是机座模型啊

我们能说七座模型的就是我给它训练更大的规模我用更多的算力然后带来的收益在递减吗我觉得首先我可能不是最有这件事直接发言权的人但是逻辑上来讲包括你看很多在讨论的如果以原来的这个路径去往

往上走其实现在棒得住大家的其实都不是算力而是你没有数据就是也许我还有十倍一百倍的人类的这个高质量的数据我仍然还可以让这条线就是相当于是以我们现在能够有的这个资源去线性外推这条线的这个 loss function 的降低和它的能力的这个提升

这件事其实并没有遇到障碍障碍是说我现在其实我需要的比如说算力数据甚至都先可以不考虑算法就是我数据这一侧我现在可能是要遇到一个瓶颈了就是我不能在十倍外推一百倍这个数据这件事了

就是在现在 GBT 的这个结构里面就是我加更多多模态数据能缓解这个事情吗因为多模态数据很多可能还是没有被用到或者没有被采集到是所以这个就首先已经是不符合原有的 scaling law 的数据的定义了就是原来其实更多还是以文本这个数据为 token 去建立的所谓的这个 scaling law 它不是 prove 了这件事情是它观察到这件事情这只是一个根据数据的拟合的结果

他不是说他证明地球是圆的他是说从比如说宇宙上看我采集了 800 张照片我怎么看它都是个圆的一个东西所以我猜测说它大概是个圆的一个东西它其实是这么一个东西所以现在说它被撞墙也好它不能持续这件事是因为它原来那个初始条件你都不满足了你可能找不出再扩展 10 倍高质量数据去解决它的持续去外推的这么一个逻辑那所以听起来这个问题也还是没有被解决啊

就去年秋天大家在讨论的 skin load 涨成这个问题但我觉得这本身是一个非常简化的一个思路就是相当于我算法啥的就是我其他 contributing 完全不变静态的这个情况下我纯堆算力我纯堆这个数据就是这是一个最无脑外推得到的一个这个结果所以你可以看在这个过程当中比如说在算法测的改进数据测可能有更聪明的用法包括把后续的这个 RL 的这些数据反过去对加回来

这其实都是在不断地调整这个公式它不是一个简单外推就换句话说如果它是一个简单外推那么 LamaFold 就应该做成因为代码有了你数据有了 GPU 给你配齐你就好好跑呗你跑下一个版本再跑半年那出来不就是一个显著更好的一个东西吗所以恰恰就是大家没有严格意义上在外推这件事那你觉得在别的地方做改进它能延续这个趋势多久啊

就比如在高质量数据比较少的情况下我在算法或者说包括什么训练效率吧就别的方向我来做改进我觉得这件事也是一个非常难回答的事就换句话说如果倒回比如说 20 年前 25 年前我们再看芯片这件事的发展它其实六几年七几年开始发展到比如说 2000 年这个时候其实已经有非常

多的这个迭代然后比如说像光刻机的这个改进导致它芯片的几纳米的这个在不断的减小我觉得在两千年的这个时候你很难 predict 说你到底能把光刻技术做到多好你到底能把这个芯片做到几纳米

这件事总是在一个好像要卡住的时候又有点突破对又有一个新的技术突破说我把这个什么光刻就泡在水里有一个什么氢润式的一个光刻然后我通过这个光学我怎么反射然后又得到了一个两倍可能比原来精度能够乘以二

的这么一个效果然后每一个提升都是比较艰难都是可能是花了比如说几年时间从实验室里面试错然后逐步找到去解锁到下一个状态没有一个是简单的线性外推去做到这个结果所以

2000 年的时候我没有严格查证过但是我相信肯定也有人会说光刻这条路 CPU 的制程这条路要撞墙了可能 1990 年可能也有人会说 CPU 制程之前就大家说摩尔定律要撞墙了对所以我觉得这个事非常取决于一帮在这个上花了最多精力的顶尖聪明人能不能找到进一步的迂回的路径你觉得这些大的技术判断现在对你创业本身重要吗

其实没那么重要没那么重要所以我只是顺带判断判断实际上技术上的到底哪些变化是跟你做密塔这件事情特别直接相关的我觉得相对比较直接相关的就像说上一代的这个模型下一代的模型它有一些显示解锁了哪些就是哪些能力从原来基本不 work

到其实能够很好的 work 了并且这些可能很适合比如说用户的一些这个需求是直接产生连接的你觉得最近六个月被新解锁的是一些什么东西就比如说这个代码能力的潜入提升编程对编程尤其是在比如说生成类似于 HTML

对吧大家其实一个很 surprise 的一个点尤其到 3.5 到 3.7 就是用 cloud 生成的比如说网站你可以首先一句话做一个网站其次是它竟然还有不错的审美嗯就是我没有描述它是什么美学特征啊等等我就是说你给我一个这样的一个网站它竟然生成出来的这个结果还不错嗯

你们三月上线的可以在 Meta 搜索里生成互动网页的这个功能就是基于模型的新解锁的能力来做的是除了这个还有吗编程之外还有吗解锁的我觉得包括大家新的在讨论这个所谓 AI Agent 也是就像刚才说的可能从上一代你只有百分之几的这个成功率可能现在能够提升到有百分之几十的在模型在这些更长的规划能力包括它可能自己的这个纠错的这个能力上有显著的提升

你过去有些什么比较重要的技术误判吗其实你之前给我分享过一个但这也许不是个误判就是说你最开始创业大概到 2020 年夏天 GPT-3 出来的时候其实你有看到这个成果但是因为你那会儿已经在做公司就是你比较关注的其实是它的成本以及关注怎么把当时已经有的也是当时比较主流的就是 BERT 的模型用到一些可以用的地方

因为 GBT-3 它一出来就是个 1750 亿参数的模型然后你当时觉得这个太大了它可能也没有什么地方可以直接用确实你们 1780 年就在做 Transformer 但是你们最开始其实是做 Bert 的 Transformer 对吧后来可能才是 GBT 但是我不知道这个在你看来算不算一个误判我觉得这个确实一个很有意思的一个例子

在 2020 年 OpenAI 做了一个 1750 亿的 Dense 的模型在大家讨论比如说现在 2025 年就五年以后的今天包括 DeepSeq 这个大家已经认为是很庞大的一个推理模型它实际的激活大概是 300 亿参数如果优化到极致它的实际算力的开销应该是 2020 年的 OpenAI 的 GPT-3 的五分之一的这么一个成本

所以你可以想象它在当年的算力的这个消耗确实是一个非常实验室看起来没法应用的类型的一个产物但是可能 Sam Altman 他有能力通过这样一个事拿到了足够多的资源以至于推进到后面把这个事给逐渐去

我觉得这个是超过正常创业者的能力因为我觉得你直接能力可能是拿着它能不能来做一些比如商业的一些变现逻辑但我觉得那个确实是很难的

所以他的逻辑是我在这个技术上我可能获得了新的资源我可能不给你讲当下的这个事我给你讲三年以后五年以后我给你讲 Scalenow 我给你讲未来 AGI 会被解决就是我觉得大家扮演了这么一个事但是但凡他拿着这个来讲说我的成本怎么样我产出怎么样

我能拿这个模型来挣多少钱哪怕我现在在那个时间阶段我把它削减一个零你能够做到的应用我觉得相对人家是非常有限的那你回头看你觉得当时你的那个想法它算是一个误判吗还是说在当时那个条件下它可能就是一个比较合理的判断

我觉得那是一个极其合理的判断就甚至是说在 25 年的今天已经迭代了几版的 GPU 的基础之上像我们现在做的应用仍然不可能以这个规模的算力去对外提供服务

这对于我们的成本来讲可能都是一个难以接受的一个事就可能你没有估计到的是你刚说的 OpenAI 持续的动作就是我觉得它是设计了一个完整的故事确实就像我们说的它讲了一个终局的故事叫做那是 A 级 I 你们这点钱难道不值得投吗我未来是这么一个存在嗯

那如果这个不算的话,有些什么别的因为可能技术判断上的不准确的地方,就导致你们在结构上做什么不做什么的一些选择上可能会有些偏差的吗?我觉得我们长期面临的一个问题是,就包括我们在做搜索等等业务的时候,就是我们在优化比如说 procurry 的这个成本结构的时候,是比大量的比如说大厂在这件事上可能要激进很多的。

但这个激进很多好处是在于我们可能能把这个成本控制在一个相对比较可控的一个程度坏处是说从用户侧来讲他不会 care 你这个事说虽然你是 90 分人家是比如说 95 分但是你用到了资源是人家的比如说十分之一和百分之一我觉得这件事从外部视角来讲是没那么关键的对

对所以相对来讲就会在应用侧的一些模型技术这个应用上会更保守一些就是我们觉得好像不太能算得过来这样的这个事呢我们可能选择先不用了我看前段时间张涛去硅谷做活动一段时间他们的同学穿了一个 T 恤然后上面说 Malice 上线的 14 天内就花掉了 144 万美元的 Cloud 的 token 对这只是一个典型的他还是要承受一个这个方面的压力的嗯

你们现在实际上的就比如说你们的付费的用户能 cover 到你们推理的这块的成本吗就使用的成本能 cover 掉吗

现在比较难因为我们在 AI 搜索上基本上就没做付费对因为你们没有广告没法收费所以是有一些 B 端的合作但这部分其实离直接 cover 住我们这部分成本我们觉得还是有距离你同意你的高中师兄王小川的一句话吗就是他说 AI 大模型应用创业应该远离大厂的阴影在国内就是巨头的业务已经如此之广泛的情况下你真的避得开吗

对啊比如说 Meta 搜索对吧其实你刚才也讲到了你可能在 24 年底你就预料到 25 年也许前三就会是阿里腾讯字节确实他们的产品也都在推搜索的功能对所以我觉得这个问题是说能避开且找到一个足够大的一个利基市场当然是好的但这个问题是如何避开那比如说 Meta 搜索虽然你们是更早做的但是它也已经和大厂在一个方向上你们应该怎么调整你们怎么和他们竞争

包括我们现在新推出的这个产品就是这个事的延伸我们得摸着石头过河大厂可以摸着我们过河你说新推一个产品我就在想可能就像你说的大家其实去模仿产品很快了但是我觉得如果你作为一个对这个事有预期的小的创业团队你可能更应该想的是说当他们开始模仿你上一个的时候你的下一个到底在哪儿

有这么多下一个吗就像刚才说的光刻记忆一样也许你很难想到十年以后你能怎么做但是下一个也许就是你应该考虑的事儿

对那我觉得怎么做快可能就变得很关键了你们现在是一个什么样的组织一个比较简单的组织比如说多少人差不多 60 号人 60 号人其实跟去年相比接近 23 年初的时候你们差不多就是 40 多人所以其实没有扩张特别多是然后在这个 AI 热潮来之后你们从市场薪资到人才竞争包括有些大厂

有可能来挖你们的人你们受到了些什么样的冲击实际的体感是说由于 AI 这件事能变成一个更热门的一个领域其实使得招聘这件事变得更困难了因为我们想要的其实是好的人也会是所有最顶尖的厂商想要的人

所以其实我觉得移民成长是变得更困难了那你们这两年招到的研发相关的人才都是怎么招到的就是他们为什么愿意来因为他们有一点 AGI 信仰但不多是吗

是招聘信息里写的对换句话说我们招的可能不是直接和比如说 DeepSeek 不是直接和自己 PK 的那类人我觉得就是你想要那类人实际上是非常困难而且我理解不光是我们认为非常困难对于所有人可能都是非常困难因为那个 pool 其实是大家现在越来越小越来越精准的更小的一个 pool 那你们这个 60 多人的组织

就是在你们能找到的人的这个阵容之下你们是怎么配合怎么去做得很快乐怎么足够灵活的这个其实是问题就它现在相对灵活是因为我比较灵活对就是你说的有很多产品的决策其实你自己就做了对我可能不需要太有一个形式上需要去说服很多人去推进这个事所以它才显得比较灵活嗯

那比如说如果产品团队的同学有一个很好的 idea 他跟你说他需要说服你吗我的意思就是说这个是一个困难的事情还是他们都不敢跟你说我觉得我一定是希望听到好的 idea 但这件事很难发生你觉得他们的 idea 不够好

在这个市面上绝大多数人绝大多数 idea 都不够好就换句话说如果好的 idea 出现的频率如此之密集那么就没有道理这些大厂们也不需要看我们做啥内部讨论就这个事有资源有人有机器大家分别去把这个事各个方向去干了就好了

比如说以今天学点啥为例就你们这个新的产品如果说这个最开始大的想法可能是你感觉到这是一个需求的方向那把它完善到现在这个程度团队能和你协作做什么就他们能做什么部分然后你做什么部分就是我可能会把它拆成 100 个小份告诉大家你领这两份你领这三份所以你就是 agent 里那个做规划的模型然后其他人做执行

目前更多的是这样的一种状态那其实这种状态我觉得你会有累的一面因为相当于都是你在 push 别人而没有什么事情是有人来 push 你的它现在确实是很难做到一个理想当中一群在各方面尤其是比如说都很聪明且它的擅长领域不同的人的相互碰撞所产生的结果这是一个相对理想的情况因为你现在所描述的这个状态是你输出比较多疯狂输出

其实一直输出这件事是比较累的对但其实我会觉得理想方向从未出现过而且有的时候我对这个事的观察在于你的下一个好的想法是藏在上一个执行的细节里面就是当你只有一个大的规划的时候你是不知道下一个事在哪了你必须得去很 Hands on 你看到所有的细节你可能才意识得到说

下一个应该去解决的事是什么所以把一个大的想法拆成一百份任务这件事你觉得对你来说还是必要的这其实是让你去看到下一个东西的方法之一另外一个理想的情况是说我可能把它拆成十份然后有十个人会把它拆成两百份然后这两百份里面大家讨论出来它其中一部分的 idea 和中间结果会比我想象的要更好

那你有想过怎么改善这个状态更靠近你理想中的状态吗我们也非常欢迎有好的有想法有能力并且 ego 不是太大的不管是工程师还是这个产品也好业务侧的同事的加入但坦白来讲就像我刚才说的我觉得这事挺难 ego 是不是和能力匹配就可以了

也不需要他 ego 一定不大吧其实就是说这个匹配就是很多时候恰恰你遇到的人是不匹配的对如果这两个不太匹配的状态你就宁可说他干脆 ego 低一点他想法少一点执行力还不错

所以你说的最理想的一种人其实你在市场上很难找到可遇不可求吧也许是而且这个时候我后来思考过我倒过来想过这个事就像包括我们去年在市场上有一定知名度然后也有不止一两个团队对吧愿意拍一笔足够高的钱说不管是以大比例换股或者是合并或者怎么样的这个形式

来推进下面的这个业务我觉得这个事其实意味着谁都不好做就是你可以有意愿拿出三亿人民币五亿人民币

但是你也不一定能找得到合适的人去操盘这件事那你有花很多时间真正的去聊一些候选人吗就比如说你在招人上花多少时间实际我们遇到的问题是啥很有可能我们看中一个人还不错然后小龙问就再加一点加然后你还跟他加吗你加得过他吗

我们甚至遇到过有一个从某小虎出来的实习生以他的学历背景应该是进不去那家的然后我们发了一个运营的 offer 然后回去加了一笔钱找回去了就是他出来了他又回去了本来他是进不去的就是以他的背景就拿着我们的 offer 对吧就再加一点钱那可以找回去所以我觉得他必然是没那么容易的所以就是你觉得这个事情也不是说你花很多时间去见候选人去聊人

能本质上去解决的而且我一定程度上其实你从整个业内持操的这个经验来看有一类相对是好的你投一个比如说老师教授相对是好的因为他其实在比如说纯粹从市场上捞人之前他有一个长期和比如说对他有学生对共处然后发现并且相互有一个基本的这个信任嗯

而且可能这些人才的素质也是有一个基础素质对或者是你你跟他相处两年你多多少少对他能力这个边界有一个比较清晰的一个认识然后在市面上呢你想人家对你也不了解你跟他聊两下事他跟别人也聊两下事然后

说那为啥你画的这个饼是比别人那个饼是得好吃很多吗最后就是那大家 PK 钱吧对吧你现在自己的精力怎么分配啊你在什么事情上花最多时间我觉得我们还是在产品和研发花最多时间产品和研发那这两个如果再拆一下的话产品和研发你花哪个时间多了嗯

我觉得跟阶段有关就是我们现在看到这个事比如说重点得解决这个产品问题可能我就会倾向于产品一些重点得解决就是研发这个事研发的同事搞不定了那我可能会更多的去帮忙去解决实际上产品和研发两个同学都是你自己在带那是啊那还有别的选择吗你有想过去找一个产品的负责人吗甚至是可能到产品的合伙人级别的这种人欢迎大家推荐是吗

自见推见是你曾经去找过吗动过这个心思吗就对这件事我觉得一个巨大的挑战是说

我其实很难以我的画像去找产品就这个事其实很有意思我觉得我是不得不成为一个产品而这件事的优势在于我们现在尤其是在面临 AI 产品的时候这里面存在大量的技术判断对所以说好的 AI 产品经理很稀缺吗因为他其实是要懂技术的然后需要懂技术这件事也分层次

就是你能招到一个非常懂技术吗就是他本来应该是去做 foundation model 的他现在来给你干产品就这件事太难了我觉得我是这样一个人我觉得这就是区别就换句话说哪怕你在市面上说这个大模型最好的大模型在这件事上可能不 work 我也会去想想为什么不 work 能不能把它搞 work

而不是简单的把调研这个结果作为一个事实接受说那既然 Gemini 不 work 对吧 Cloud 不 workOpenAI 不 work 那就说明这个事现在做不了你们现在自己是模型的话你还是会在一线上手参与很多什么我会参与模型训练过程会的所以你持续的都是有实际的手感是不知道是好还是不好你觉得它可能的不好的点是什么

就是要求你你得真会但是你不是本来真会吗还是说这个对于来说也是要持续学习的我觉得这一定持续学习所以如果这个事持续学习对你来讲是个负担那这件事你千万不要用这个方式去做团队的管理但这个事你本来还有些兴趣 maybe 这个可以 work 就从你个人的兴趣或者说你做什么事你是

最沉浸最有心流的话是你现在的主要工作你的哪块工作呀我觉得现在本身角色其实就是比较综合的所以我觉得从心态上来讲我可能不能沉浸于这 N 个事的其中一个事来花所有的时间精力

而这个成就感也许来自于说怎么把这个拼图按照就也许我三个月以前对现在发的这个产品就是我已经花了半个小时在我的脑子里面构建出来一个大概它应该有的这个样子然后在未来的这三个月把它逐步真的给实现出来你这半个小时是比喻还是世界上就是半个小时

可能是部分实际就是可能不记得那么具体的时间就是中间可能比如说在做的这个工作额外再有几个拼图把它进一步给丰富就像我们现在看到了一个新的结果以后我们会有新的比如说在帮妈妈讲题这件事上把额外这个拼图给加进来你在想这个过程的时候你是习惯就是在脑子里想什么你也不做笔记什么的不做笔记那你管细节会管到什么程度

就比如说我们现在看今天学点啥这个产品里面比如说你们课后会设计一个互动问题就互动问题设计几个这种颗粒度的也是你会管的这个可能就是我花一分钟直接拍完了可能不成就也管然后我们左边翻书右边那个生成那个大纲的这个就是我把草图直接画出来界面草图直接画嗯

所以其实你管的其实还挺细的对因为产品我觉得确实是这样就如果你比较憨脏的去做产品那确实这些细节可能你在慢慢实现的过程中间你都是要去考虑的是那我觉得一个相对理想的状态是说比如说跟你配合的同事在整个共产当中大家基本水准在线熟悉程度更高那其实有一部分再往下细拆的他能够去更多的去承担对但这个其实往往也是需要时间

需要大家的经验的逐步的积累和配合就往往你很难预期说我们快速拍一笔钱招一个人上来一个月以内这些事他能够给我 take 掉 50%我觉得这个比较难你这种在团队里疯狂输出的状态持续了多久我觉得基本上就是这样

不太一样的是说就是我们说前两三年那个时候我们定义产品更多的是我们来定义一个产品然后我们来选择一个我们觉得打磨的比较 ready 的时间然后向市场去发布那就是 18 年到 21 年左右前两三年是 21 年

那会儿 AI 其实挺冷的比较冷没错所以这个其实是给我们的一个你不太可能会说我这个产品打磨到一半突然市场上杀出来一个人家把类似的这样的一个东西给做了就是它不太会这么一种状态所以更多的是以我们自己为主认为到了一个差不多可以 release 的一个状态去发布

就那会儿在一个可能更正常或者更舒服的节奏里对就是现在节奏我觉得肯定是加快了是有直接体感比如说你的工作时间会比刚开始那三年延长了多深我觉得心态不太一样而且一定程度上我觉得比如说在前三年加入 META 的同时可能会看到我讲解的耐心是和现在是不太一样的对

耐心逐渐消失的老板对就是我可以跟你讲更细可以给你铺垫更多来达到最后的那个结论现在可能就是姐姐讲结果这样差不多就是细化一下咱们就快速去做一个这个推进因为面对一个你更动态的市场你觉得这种情况会持续多久我就指这个市场竞争这么激烈这么动态还会有几年我觉得可能没有大家想象那么长时间

比如说以什么一个月发 20 个模型的这种周期去就全球范围内这些大模型的 release 它也不像是能够持续再输出两三年的这么一个状态你觉得出现什么信号的时候可能是某一个产品进入一个比较稳定的站住了的节奏比如说对蜜塔来说然后你可能能进入到一个自己的更稳的或者说更以你为主的这个节奏里我觉得相对比如说

到一个领域它有一个相对比较不错且哪怕这个增幅不是特别陡峭但是持续上升的比如说用户量和收入并且这个收入和我们的这个支出相对是节奏能匹配的这么一个这个时候而且就是这块其实你又在不断地积累新的就是你是把这个产品不断地在累高的这么一个程度可能相对就比较好一点如果拆开来看的话

法律翻译和密塔写作猫就只看这单个产品它的投入支出和收益它达到你刚刚说的这个状态了我觉得这两个产品你可以认为它们是能够打平的一个状态但它的增长性不够就它增长可能比较稳了就比较停滞它增长性不够对

所以那一个相对理想的情况你肯定是希望是说它至少是一个比如说前两年还能继续翻倍对吧到第三年好歹有个百分之大几十的增长这么一个方向那其实相对可能大家会比较康复的我一点

公司整体上合适盈利会是你的一个目标吗我们其实在 23 年在投入这些对吧就是前恰 GPT 时代其实是能做到 break even 的整个公司对是因为恰 GPT 来了之后其实它是搅动了整个行业那现在在这个新的条件之下就是什么时候盈利会是你的一个目标吗

如果我们希望是把它立即做到往引力的这个方向去做我觉得是可以快速达到的但是随之而来的就是说无非是你牺牲掉了一些东西它确实是一个你可以控制的东西对

对我觉得就是对于 Meta 来讲或者对我的心态来讲它比较好的一个地方在于它还相对可控可能对于有些团队来讲这事儿没办法控对对有些团队来说可能这是个暂时还无法回答的问题对就差了一个零以上支出和收入然后没法解释那你现在自己对这个事儿的节奏你是怎么想的就是做东西我觉得还是得快该快速拿出来的东西就得快速拿出来然后至于收入或者是盈利的话这个可能要动态地去判断

动态判断但是对不同的产品我们会有一些预判也许它符合我们的预判如果它不符合的话我们就去看在我们之前对这个事的这一系列判断的地方哪个不成立那去优化哪个方向你觉得过去这两年的时间就从 CHPT 出现到现在这个时间里面哪些事是你做的太多哪些事是你做的太少的

就从绝对时间来讲我觉得我们在产品和研发投入的时间肯定是多的就也许我在细节上投入的时间有点过多那什么事做的太少做的不够了就是有一些事是客观上我觉得时间花的没有那么多但我也不确定哪怕我现在倒过来反思这个事我也没有信心我花更多的时间它会变得更好比如

比如投融资的事对吧去年你应该是拒绝了一些投资人的见面的邀请是很多对因为当时很多人想要加他的联系方式然后找我要然后我就给了微信说不通过我应该没有不通过我只是没有通过

他说的不通过就是这个意思就是有人来家里提了申请然后没有通过我觉得这个事是一个非常尴尬的我觉得这是一个现在作为一级市场的公司也好包括这个投资方也好这个我觉得效率是有严重问题的因为我是不可能见一百个人其实你可以开发一个 agent 对

帮你去跟他们聊天但是这个问题是说我觉得他们都不纯粹在于说你把纯粹意义上的信息告诉他们对对对这是一个非常需要见面非常需要建立一个比如说就是文文气味没错一个体感等等的一系列的这个事这还是 AI 真不好替代的一个东西嗯

对所以我觉得这是一个不太好确实事实上我把那几个月的时间全部花出来干这个事呢也许我们的融资不管是融资额还是估值啊这个我能谈得再好一些但是这件事真的值得吗所以我不确定

现在回望两年以前哪个策略会让我或者让公司能显著地变得比现在好很多从 23 年初到现在你觉得你自己最大的一个成长是什么我的成长也许我变得更会了我觉得在过去的这几年就包括整个 Meta 过去这几年时间

不管是工程技术层面的还是产品层面的我比较确定的是我变得在所有方面更会了更会了是这个意思哦是就是我不得不收拾的这个东西以及收拾的精准程度判断程度以及所有的对细节的这些把握会变得比原来更会了其实这可能也是一种新的创业思路是因为 AI 来了之后其实 AI 本身是可以让一个个人能力很强的人的能力放大一点对 更大的放大的嗯

其实就相当于公司里有一个比较核心的输出的圈

驱动力或者叫 engine 什么发动机之类的也好然后你本来就可以用很多 AI 工具也能放大你的能力然后团队也可以帮你做一些事情你自己会用很多这种 AI 工具 Cursor 编程什么应该会用吧我们现在就是我自己写要 commit 的这个代码我现在很少但是会做一些实验所以得兼职什么设计师兼职运营兼职从前端到后端的这个技术 Meta 的 UI 你也参与设计我们包括学点啥的很多 UI 就是我

你自己画的我画的一个出版或者我设计的一个基本款我甚至在想如果比如说我是一个个人我不带一个公司我很有可能是有机会去比如说对外 offer 一个课程这个课程就是让一个只有基本的比如说编程经验的一些小白

不是纯小白就是好歹得有点编程经验在两个月到三个月时间出师能够面进一线大厂的大模型团队我觉得是有机会的其实你可以做这不就是个产品吗对如果我没有现在手上这摊事你觉得时间不够那肯定而且这是完全是两个方向的事

但是这个事就是它不能成为你们的一个新产品所以它的受众可能太窄了对 它受众太窄了对 就是你大概知道它应该具有谁样的技能而且现在在这些技能的拥有的人在市面上竟然如此之稀缺以至于也许就是这两个月的培养成果能把你送进一个年薪百万的岗位现在我有点心动人家说了要

会议是编程的算是不错就从基础开始就把所有的这个细节抛开了给你讲也许没有那么难但是你会发现很多大厂出来干过三年干过五年号称是干这个的人你去问这些细节一无所知其实 AK 现在不就在做这件事情吗

卡帕尔西特在做这个没错我觉得是一个非常奇葩的市场因为往往为了要拿到一个好的待遇一个薪酬理论上你是要多年的积累你是要付出很大的持续投入的代价你才能勉强够到的门槛但是我觉得现在有一个巨大的信息差

而且市面上确实很不错的人没有那么多那你可以做成赋会课程放在那个今天学点啥里面对这可以是今天学点啥的一个内容转成李一周这个蜜塔版对但这个事其实很难大规模的做我觉得一旦大规模的做它其实是个对抗效应就像我们其实很难接受说有个人培训来的所以你觉得他虽然能面进去但并不代表他真的他可能真的是比很多出来三年的人会

我觉得这是完全能做到的你今年的比较大的目标是什么就是跟公司有关的和跟公司没关的都可以说那是把现在手上的事做好做好做快一点然后尽量让不光是我自己更会了让团队里面的小朋友们也更会一些然后 hopefully 也有不错的人愿意一起来加入能把这个事做得更好一些那融资呢不在今年的费斯特里顺其自然好

那谢谢可瑞今天做客玩电聊就是他整个分享都是非常务实和坦诚的那中间有一些问题可能他会非常坦诚地说这个暂时还没有答案密塔也是一个非常务实和扎实的公司我觉得对所有用户来说大家最期待的一件事情就是你们继续有好的产品然后大家可以用起来我们努力好那各位今天拜拜拜拜

本期的连点呈现分享两个与之前节目的呼应一是关于 agent 的机会 1067 与真格戴宇森的访谈 1107 与明示夏令的访谈还有 1117 与 agent 早期创业团队 poke.ai 朱哲青的访谈我们都在讨论 AI agent 的趋势与实践

在 Agent 的火热中 Meta 的新产品并不是一个 Agent 方向的探索密克瑞说他觉得在 2025 年上半年模型能力要支持相对通用的 Agent 依然会有些瓶颈

而在之前的节目里戴宇森和夏令都强调了推理编码工具使用能力的提升会解锁 agent 的机会其中夏令对通用 agent 的创业机会有一些疑虑因为这可能也是大模型公司和大公司的避重之地这和明可瑞的一些想法相似

可瑞的表达是任何主要依靠大模型能力有潜力达到 1000 万 DAU 的偏纯软的应用可能都是 OpenAI Google 字节阿里等大公司和头部模型公司会自己做的方向

二是关于创业公司和大公司之间的竞争在 93 期节目《大模型生存战》中我们讨论了 2024 年日益明显的大模型创业公司所面临的大厂的压力而米可瑞其实在 2023 年初就有一个判断当时热火朝天参与大模型竞赛的一批中国公司可能速生速死具体可以见 113 期节目本期节目的主题是

本期中他也更明确地表达了一个研发大模型的跳出竞争本身的视角那就是对 DeepSeek 这样有资源有品位的组织来说其实也可以把追求 EGI 当作一个有高价值的消费而不是投资行为它的目的或者说短期目的并不是算一个投资汇报

一个不以商业回报为目的但也不是研究院和科研机构的新型组织会持续存在吗还是它未来可能像 OpenAI 那样发生商业化的转向 AI 行业仍在快速变化隔一段时间后我们可以再来回顾今天的思考

下期再见