We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 99: MiniMax 创始人闫俊杰:做大模型,千万别套用移动互联网的逻辑

99: MiniMax 创始人闫俊杰:做大模型,千万别套用移动互联网的逻辑

2025/1/20
logo of podcast 晚点聊 LateTalk

晚点聊 LateTalk

AI Deep Dive Transcript
People
闫俊杰
Topics
闫俊杰:我认为千万不要套用移动互联网的逻辑来做AI。移动互联网的逻辑是用户越多,反馈越多,推荐算法越聪明。但AI大模型和产品的真实关系是:更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。基于此认知,MiniMax最重要的目标是加速技术迭代,而非增长或收入。我们开源MiniMax-01模型系列,也是为了加速技术迭代和加强技术品牌,因为技术进步速度很快,开源可以更快地获得反馈,提升研发效率。中国AI产业存在误区,认为用户越多模型智能水平越高,导致大量资金投入买流量,这是错误的。AGI的真正进步动力是清晰地定义模型能力,并通过技术手段逐步提升,而非依赖用户迭代。我们MiniMax是一家技术驱动的公司,当技术和产品发生冲突时,技术优先。我们追求技术领先,不是在当前能力上小幅提升,而是要一代一代地提升能力上限,支持更多模态,处理更长的上下文。我们认为Agent是AI的重要方向,因为它能处理更复杂的任务,并带来更有效的交互方式。MiniMax-01在架构层面支持Agent,能够处理更长的上下文,提升单Agent交互质量和多Agent通讯效率。我们更关注模型本身的能力提升,而非通过数据蒸馏快速复现OpenAI的成果。我们认为,Coding和信息获取是Agent最先落地的场景。中国公司与美国公司相比,缺乏内部benchmark,导致模型缺乏自身特色。我们MiniMax的目标是持续提升技术水平,推动AI行业发展,而非追求短期商业利益。我们不认同‘跟随热点’的说法,我们一直有清晰的技术路线,只是在模型能力提升后,会带来新的产品形态。 程曼祺:作为主持人,我引导访谈话题,并对嘉宾观点进行总结和提问,例如关于开源的意义、技术品牌的重要性、Agent的定义和发展方向、MiniMax的市场策略、团队管理和人才吸引等方面。

Deep Dive

Shownotes Transcript

欢迎收听晚点聊经过一切在加速的 2024 年围绕中国大模型创业的讨论从谁又融资了变成谁会第一个倒下行业分化时刻我们访谈了中国大模型六小龙之一估值已超 30 亿美元的 MiniMax 创始人兼 CEO 严俊杰聊了 MiniMax 的新技术目标他们刚刚发布的首个开源新模型 MiniMax01 系列去年 MiniMax 的变化和人员调整

以及严俊杰作为一个练习时长三年的新人 CEO 的自我复盘十个月前我们就访谈过一次严俊杰那次他提了很多字节这次再聊明显感到他主动提字节少了提 answer pick 多了这与行业风向形成了微妙的反差

在他更在意自己的 2024 年 3 月大模型创业最是烈火烹油而现在越来越多人开始讨论大厂对创业的压力 MiniMax 本来是看起来相对安全的一个因为他的 AI 社区产品 Talki 的最新热火数已经超过了 Craig.ai 成为全球同类产品中的第一

而他在中国的 AI 社区产品新野的用户数使用时长和留存率也都是中国第一高于字节旗下的同类产品颜俊杰却自己推翻了这些优势在他现在的认知里用户数等指标并非 AI 竞争的核心他说千万别套用移动互联网的逻辑来做 AI 移动互联网的逻辑是用户越多反馈越多推荐算法越聪明

而严俊杰认为 AI 大模型和产品的真实关系是更好的模型可以导向更好的应用但更好的应用和更多用户并不会导向更好的模型在这个认知更加明确后严俊杰说他做出了取舍现在 MiniMax 的最重要的目标不是收入也不是增长是加速技术迭代

不到一年的两次访谈我们从聊移动互联网到聊跳出来从讲 2024 年的目标到严峻节复盘当时定目标的逻辑可能就不太对 AI 行业和其中的人都在快速变化与迭代今天的主播是曼琪下面我们就正式进入节目吧

你们今天发了新模型之后你收到的反馈里面有哪些是让你觉得还比较有意思印象比较深的就是这样的就是说我发现在海外跟国内好像不太一样我们昨天晚上先是更新到了推特上推特上我发现有很多海外的网友给我们发邮件包括推特上面也留言海外的网友

第一个问题就是催我们其他的母台的模型稍稍更新这个事我理解是反映了一个现象就是说可能对很多海外的用户然后我们更出名的是我们的其他母台的这些模型声音 视频 然后音乐这些东西这个东西我觉得对我们来说是个好事我们会继续来提升那些模型但是也反映了一个问题是说比如说我们的文文模型在海外用户里面其实并没有很知名

相对来说我们的文文模型其实之前并没有建立起来在海外的技术品牌这个的话我觉得是我们需要来提升的地方当然还有海外很多用户会来讲比如说架构上做了很多创新支持的长度很长然后我猜可能后面会有更多的开发者给上面来做一些更激进的尝试国内的话我感觉好像是两类一类的话就是做技术的同学技术的同学的话确实是很多人是第一次开始真正面对一件事

比如说做一个很大的模型被定义说只用 Transformer 就是架构层面也可以来做很多创新之前虽然说学术界有些这种小的创新但是其实很少有人把它能够真正做到一个比较大的规模我们这个确实是第一次能够做到这样一个规模这个的话我猜对很多学术界的同学或者是做策划的同学还是挺有启发的还有第二块是来自一些非算法的人可能是我们的一些合作伙伴啊

一些朋友很多人告诉我们说觉得我们这次好像是有点上道了是因为我们开始意识到是说要来做技术品牌了这个应该是我们第一次真正来做这件事因为我们之前的时候很多时候其实相当于是闷头做技术产品其实我们之前比如说对技术品牌这件事其实是没有一个很深的认知我觉得今天这个算是第一次吧

你们这一次有很大的变化就是你们是第一次开源的一个模型这个跟你说的做技术品牌这个事是相关的吗还是说开源它是有更大的一个意义为什么要开源其实我们想这件事的话本质上就只有两个原因第一个原因是因为我们认为可以看到比如说过去两年技术的发展速度看来说还是非常快的对吧

然后我们相信至少接下来两年的技术进步的速度可能也是这么快的既然是这样的话在这个里面的话其实真正有价值的事不是说你当前做得怎么样真正有价值的事是说接下来的进步速度是怎么样的这个我觉得是最核心的一件事我觉得开源这件事其实是一定程度上当然它有可能对外面的人会有一些贡献但是我觉得可能对我们来说我做这件事可能最大的一个驱动力是说希望让我们自己的进步速度也能变得更快因为你把你做的事都开放出来

做到好的地方可能会受到鼓励做到不好的事也会受到很多批评对吧所有的事都是公开的这样的话反馈链路甚至是说比把一个思维化的模型放在一个产品里面让一些用户来反馈其实比链路的效率其实更高

我们觉得就是说通过把它开源我觉得一定程度上是能够提升我们的研发效率的因为问题暴露得更快这个我觉得是一个比较重要的原因当然还有第二个原因就是因为我觉得我们在过去两三年吧做得特别不好的一件事可能是因为第一次创业就是说我们其实对技术品牌没有一个很深的认知我们直到最近才意识到这件事其实是一个很重要的事本质原因也是因为我们意识到是说我觉得这个行业最大的驱动力还是技术的进步

那技术的进步的话那它的核心就是说你能不能有一个比较快的技术进步速度那这个事儿当然它有一些这种硬件的条件你有多少算力你有多少数据包括你有多少钱但是还有一个软性的东西就是说做过好的人我觉得这件事算是一个开始吧所以最近让你意识到技术品牌更重要的事情和 DeepSeek 特别火有关吗你们开源是在追这个方向吗其实我们意识到这件事的时候 DeepSeek 他们还没有开源他们那个

然后我跟梁峰很早就认识很早是什么时候应该就是去年他们还没有成立 DeepSeek 的时候那是前年吧他们不是 23 年的时候应该就有 DeepSeek 这个品牌了那

可能应该是去年的年初反正大概就是那个时间点我觉得它有两件事对我还是挺有启发的但是这个东西跟我们现在做的事不完全相关其实我觉得最有启发的事是说因为它之前也把换风也做得很成功所以我觉得它里面一个让我非常有启发的事是说它对品牌的理解其实我觉得非常的强我觉得他们的品牌做得非常好的他们可能是口碑最好的

那一兩家聯合公司之一我覺得他們應該是很早就意識到是說品牌這個事的價值這個我覺得是一個比較有啟發的一件事當然還有其他的因為一開始沒有產品其實可以把這個經歷變得更聚焦但這個事不同的人有不同的選擇了這兩件事我覺得他們做的是比較不錯的

你们这次 01 的系列开源之后它是会更多的支持外部的开发者还是你们自己的产品下面就会换成这个开源的版本我自己内部也用了很多了也用了很多但是你们也会有些别的版本在用什么更强的你们自己留着的没有没有

你们就会换成开源的当然开源的话继续开源的话肯定需要改一些东西但是我们并不太希望是说一定要藏一个什么东西更好的因为这个东西没意义因为所有的模型一演之后都是落后的对吧对 现在模型的保险期是很短所以说其实藏了一个东西其实没什么意义

你为什么没有更早开源所以我觉得这个东西是第一次创业然后其实需要的区别的进展还是挺多的如果可以重新选业的话应该是更早的开源是比较合理的更早是早到什么时候我觉得第一天吧其实开源反而可以做很多事包括变得更小比如说你跟一个客户来合作的时候如果你是避远的你要花很多精力来考虑怎么样保证模型安全对吧需要花很多时间来考虑这些事如果你是开源的就不需要考虑这些东西然后

然后比如说从对客户的价值来说肯定是开源最容易满足客户的价值对吧

坦白说我觉得如果我是 OpenAI 我都应该开源你说 OpenAI 真的核心的能力是因为 GP4O 比 Cloud3M 好吗我觉得其实不是你觉得是什么我觉得是因为恰吉比的品牌跟性质至少目前可能在两年前确实是它的模型好但现在我觉得其实不是了对它会是一个大家都觉得它全球的 No.1 对而且可能同样发差不多的模型然后 OpenAI 发它就会是一个潮流别人发可能就不会那么大的关注对 是啊

因为你们之前一直讲的就是模型和应用一起做而 DeepSeek 的梁文峰他是说我们现阶段是不做应用和产品的我们就只做模型你觉得这个事情它是可以复制的吗首先我觉得不是这样的因为 DeepSeek 也有一些产品群最近也有 APP 了所以我觉得其实的情况其实不是这样的但是反过来说我觉得有件事大多数中国公司的认知我觉得都是错的

就是说如果你的目标是要做出来更好的智能水平实际上你是没有那么依赖于需要有很多用户的就这个事儿其实可以想一下就行了比如说 ChatGPT 的 DAU 可能是 Cloud 的我猜应该是 50 倍到 100 倍应该是这个量级的但是你说 ChatGPT 的模型有比 Cloud 的模型好 50 倍吗显然没有对吧

因为两个模型是一样的这个东西其实只反映了一件事如果你追求的东西是 AI 的智能水平其实跟你有多少用户没有任何关联的但是你在看中国其实也是一样的对吧就比如说你看比如说那个同义和豆包

对 对吧其实是一样的中国的人工智能的产业在过去一两年一直有一个巨大的误区就是说用户越多模型的智能水平就提升得越快那为了能够有更多的用户所以就要把公司的大部分钱都花来买流量这个逻辑其实是一个非常错误的一件事其实你去年就说过这个观点就是你说过你当时就觉得不是说用户越多模型的能力就提升越快对 但是去年说的时候可能还没有那么多人信吧

我觉得现在这个事应该就是一个可能没有人明确这么说但是我想这么说我觉得要把这个事分两个上来看第一个事的话就整个行业比如说能够有什么样的产品对吧举例子比如今年有很多这种 AI coding 的产品对吧有很多视频的这种产品这是今年才有的这样就是有这样的产品肯定是也碍于模型的进步对吧像去年就没有为什么今年有了是因为今年的模型变得比去年更强了所以说模型能力的提升是一个驱动力第二点的话是说为什么会有这些模型

比如说为什么 Cloud 3.5Sonic 的 VR 代码能做得很好或者是为什么现在的这些视频生成的模型可以很强其实不是因为之前就已经有一个视频生成的产品了然后用户认为不好所以才改进模型就用核数据来迭代所以才变好了

而是说一开始定了一个目标我要做出来一个比如说写在马雷进去然后有了 Bunchmark 比如说 SwanBunch 然后我要生成一个什么样的视频定了这样一个目标然后从一开始做到这样的事其实并不是跟用户一起来迭代出来的对吧我觉得这个东西其实才是 AGI 真正进步的动力然后它的底层原理是什么呢底层原理是说其实模型已经比大部分的用户在日常使用中更加聪明了

所以说大部分用户的 query 其实是没有模型自己来模拟的更好的所以说过去一年多吧中国大部分的不管是创业公司还是大厂都还是在延续那种用推荐的方法再来做大模型的产品用推荐的方法用传统的做事

推荐系统然后它的方法论来做大模型的产品这个事我觉得根本上就是错误的一件事你怎么总结用推荐系统的方法论来做大模型产品区别的话是说用传统方法来做的意思就是说因为比如说对一个内容性的产品你没有办法非常明确地知道什么叫对什么叫错就举例子比如说你在小伙伴上发了一个内容你没办法知道这个内容会不会有火对吧

所以说只能发很多然后 test 出来对 AB test 我去试的它其实包括模型该怎么来改进很多时候其实也不知道为什么这个改进会 work 不同的研究员尝试不同的算法 design 不同的 feature 做了大量的实验然后最终找出来好的 AB 指标好它就好了然后不停往上来累加为什么会这样因为在做推荐的时候其实你不知道对错所以觉得这么来做这是最高效的然后这个事反映到大部型里面基本上就是说分析各种各样的 case

比如说把持用达标分成了 100 类然后每类怎么来补数据怎么来迭代然后怎么来做 AVTest 基本上变成这样一种方式但是这种方式我觉得它不是作为 AGI 的方式作为 AGI 的方式是说应该非常清晰地定义模型的能力怎么来分级然后每一代的模型能力对应一代新的能力它需要什么样的这些底层的训练数据需要怎么样的推理过程

需要能够设计多法 Legend 我觉得它应该是定义出来然后通过很多技术的手段来逼近这样一个指标的方式所以这个东西其实你可以看到基本上所有的公司都会遇到一个挑战就是说在一开始那个瞬间突然间会推出来一个很好的模型然后那个模型它有了一些用户然后开始考到这些用户的需求之后那个模型的叠加就会变得更慢

然后可能以后有新的模型出来然后打败前面的模型你可以看到在过去一年多基本上都是这样了它其实并不是用越多模型水平就越好的这样一个过程你是什么时候特别想清楚这个逻辑的我在今年三四月份就想清楚了你说的是去年三四月份对 24 年三四月份对那你这个逻辑跟你们现在这一次 minimax

01 系列的更新之间的它的关系是什么其实想清楚之后我们就干了几件事其实想了这个事之后大概的理解就变成这样第一就是说技术还是这个行业最核心的驱动力但是你不应该把技术跟产品混为一谈做技术干的事就是不停地提高能力的上限

这边做的假设是说第一这个能力确实可以提升的第二话是说当你提升那些产品之后有可能会让原来的产品有一个根本性的变化或者是能够出来新的产品这个的话是做基础的假设或者是做基础的逻辑然后做产品的逻辑是说你不要认为是说有了产品之后模型就能变好所以说其实产品的目的不是为了让模型变好产品它就是产品那商业化的公司它就是一个商业化的产品

这个事算是对模型和应用一起做或者大家去年会说的模型及应用或者模型一体它是一个反思或者说我觉得就是说一个模型可能会导致一个产品出现但它并不一定会导致这个产品持续的变好对产品持续的增长是跟这个产品本身相关的事或者产品的可持续性所以说其实当一手这件事之后我们就做了几件事第一的话我们认为比如说怎么样来追求这种技术的领先那技术的领先其实不是说在当前的这一代的能力发挥之内

來提升幾個點做技術的話應該思考的問題是說怎麼樣能夠有一代一代往上來提升這個東西其實是核心這個東西包括智能水平能夠提升能夠支持更多的模態這個的話就是我們做技術的邏輯比如說我們為什麼要出來視頻模型這個就是一個增加模態的邏輯比如說為什麼我們這次一定要用一個全新的架構來做本質上因為我們認為 Context 很重要

然后怎么样能够支持非常长的一个 contest 怎么样能够有效地训练跟推理那变成了这样一个东西包括我们家呢基本上也是这么一个思路这个其实就是做技术的逻辑产品的逻辑其实也很简单那产品的逻辑非常明确对吧其实你提升这些模型的能力其实不需要依赖产品技术

技术自己就可以提升或者是说自己的研究团队跟整个业界在一起就可以来提升那产品的话其实真正需要思考的事情是它对用户来说是满足一些需求对公司来说它是一个商业化的行为那怎样把这个事能够很好地结合在一起那基本上我们过去十个月的决策基本上都是基于这两个东西推出来的那对你们来说到底是技术更重要还是产品更重要你会把自己定义成一个技术驱动的公司还是产品驱动的公司

首先呢我们自己非常准确自己是一家技术区的公司这个东西它不是一个口号它的实质是说当遇到冲突的时候谁说了算因为总会遇到冲突的对吧你可以举个例子吗遇到冲突然后技术说了算的例子我觉得这个例子其实非常多比如一旦你有一个东西上到线上那一定会有些人觉得它好也有一些人觉得它不好不管那个人是用户还是客户这种事是一定发生的对吧

但是精力跟时间都是有限的那这个时候有两种选择一种情况就是说把这些简单的 case 都修了但是这个东西导致你没法做一个更大的事了或者是没法让你的能力有个本质的变化就不能跨过那个台阶那还有一种方式是说你要跨过那个台阶跨到那个台阶的代价是说小的事情就没法修了那这个时候应该怎么选呢按你的逻辑就是选要跨大的台阶对

实际上就是我们最底层的一个逻辑就是这样的那你们去年有实际发生过这样的事情吗我们发生过很多次这样的事我举例子比如说海洛视频那个产品如果按照它的访问量来说它应该已经是现在全球最大的视频生产者产品了但是它的整个页面其实非常地粗糙

甚至刚上线的时候我们都没有英文的页面只有一个中文的页面但那个时候有非常多的海外的用户那个时候一下来原来有这么多用户那怎么办呢那就发现有很多事需要做对吧一定会有用户提出来各种各样的问题比如说为什么 Rowway 支持一个功能你没有为什么 Clean 出来一个 AP 你没有就有很多很多这样的问题但是一旦你去解决这些问题之后模型进步速度一定会变慢因为精力一定会分散那这个时候该怎么办呢嗯

你们的选择是当时我们的选择就是其实我们的选择很简单就是听算法听

听算法的所以算法的人后来是怎么说的它的实质就是说那我们意识到一旦我们的技术不领先了这产品可能就没有了那我们唯一应该干的事就是把我们的精力花在不管是算法的人产品的人还是运营的人最重要的精力是花在帮助算法的能力能够到下一个台阶上甚至比如说像鲜血套柜这样的产品其实也是类似的虽然它看起来是一个非常娱乐化的产品它里面做的那个算法其实一点也不必做一个通用的行为简单

当你为了让产品能够刚刚上线你需要做一个比较大的算法的变化但是算法的变化会影响很多用户数据的时候你怎么来选坦白说你在 2023 年的时候有时候还是会纠结的但在 2024 年基本上就不太纠结了我再给你举个例子比如说我们的海洛文本我觉得这是我们算是过去一年没有做起来的一个产品那个时候有两个选择一个选择就是大家都在疯狂投票加冒头并且那个时候大家都认为是说那个产品是最能够代表智能水平的一个产品是

现在也有人是这么认为对我们当时的决定是我们意识到这件事第一就是其实提升技术跟用户数其实没有什么特别强的关联性第二的话是说产品就应该思考产品最终它是一个业务我们的决定就是不投放本质上就是这样的其实在你的描述里你们的逻辑是非常一贯之的

然后这一次我来采访你之前我也收集了一些问题嘛就比如说有一个 AI 投资人他对你们的观察就是觉得 minimax 最开始融资是很早那是 2021 年底的时候你们讲过做虚拟人然后到后面 glow 新业这种产品它是一个摸索了类 corrector AI 这种产品方向然后到 Kimi 火了之后你们好像又重启了生产力的工具海螺 Soro 之后你们又放了更多资源来做视频生成然后现在又是在做开源

他会觉得你们是一个技术能力很强但是好像一直在跟随热点而动的公司我猜那个人可能对我们有很多误解你讲讲原话是因为我们一开始想做的事上次技术发布都已经写了对吧

他從來就不是一個出資人只是在我們做開始創意的時候三年前的時候那個時候根本就沒有大明的概念然後很多真正不懂這個行業的人就會把他當成他是一個出資人但是你可以看一下我們第一天的那個上面我是怎麼來寫的然後這是第一個第二個是說像 Glow 還有 CNNTOKY 這種產品其實並不是來追隨 CEI 我們做的時候還沒有 CEI 的

你们其实是差不多时间上次就差了一个月吧 隔了一个月对 但是比如在移动端我们是更早的这是一个实际情况对吧然后比如说像海螺一开始的时候其实我们也是在两年前就推出了只是因为那个时候它前一年多它其实并没有做起来当大家真正知道这个行业有这样一个赛道的时候在那个时间点 KIMI 的表现比我们好

所以就以为是说我们是在重启但是它其实横到它就有了它其实就是我们一开始写的我们认为腾讯人工智能或者姚大木琴出来之后两代英雄一个的话是先来做这种偏修显影楼类的然后再来做更高效率的我们第一天就这么写的然后再说一下这个视频那视频这个事其实它的实质是说当我们在最开始来做新演个 TOKI 的时候我们其实一直有个想法是让那角色可以动起来

因为那个事情我们其实就立项了这件事只是说 Solid 出现之后我们意识到这个事它比我想的要更大一点所以把它给做得更加通用了那为什么要开源开源的本质是说我们开始意识到说需要来加强我们的技术品牌我们认为技术会快速进步像过去一年就出来了好多新的技术对吧那一些新的技术它有可能会让产品发生一个变化有可能会带来新的产品

这个其实就是我们的逻辑其实还好奇的问题是他想知道你的 AI 信仰到底是什么因为看起来你们做过什么事情我觉得信仰的话本质上我觉得现在没有人有能力来定义什么叫 AGI 现在没有人有能力定义什么叫 AGI 我觉得真正能够定义的东西是说智能水平会不停地进步所以说其实我们自己是没有定义什么是 AGI 的

然后我们指定了墙上写的 Intelligence with everyone 这是第一个我们需要 Intelligence 的水平能够不停地提升但这个事它显然不是一蹴而就的它需要分阶段一步一步来做

然后我唯一一贯之的逻辑就是说每个阶段应该做什么样的事然后在这个阶段积累的能力积累的技术积累的产品积累的各种各样的数据能不能让我们到下一个阶段这个事我觉得它有点像长征可能你不知道你的最终目的地在哪但是你知道的事情是有更好的智能水平这件事它大概率是一个有意义的事

对就是强征是你不知道具体的目的地是一个具体的什么地方但你大概知道它是一个什么方向对其实创业是一个很艰难的一件事它其实不是说有个机会可能所有人都看到了这个机会就是给你的你就是一个天选之子然后这个机会就属于你了你就再大注视人就来拿到这个机会它的实质是说这个事很难但是它价值也很大很容易看到了但是不同人有不同的理解不同人有不同的路径

作为一家创业公司第一因为创业它的一个前提是说你自己有独特的理解第二的话是说你的资源肯定不是最多的甚至可能是非常少的我指的是跟海外的公司比或者跟中国最好的大厂比你的资源是非常少的

比如说李开复上周就告诉我们可能整个行业从信仰 Scanning Law 到怀疑 Scanning Law 就只用了一年的时间他觉得整个 AI2.0 相比之前商汤坊那个时候是在加速的你怎么看这个变化会这么快坦白说我不太认同这么一种看法因为就跟接一家公司你把公司能够变好十倍或者做一个技术把技术做好十倍这个事本来就很难了它肯定不是说这样就发生了它其实就是需要来做很多创新的并且这个东西对创业公司来说其实更是这样的

如果比如说你是街套动你可以所有的方向都做最终反正就赛马出来一个好的它就好了跟川普来说其实第一你翻促的机会非常少第二的话是说各方面的东西其实你都没那么好当然很想变好但是其实各方面来说都是有欠缺的在这个情况下但我觉得这个东西是好事这种方式其实可以逼着你一定要去来做一些真正创新的事

你指资源有限这件事是个好事对吧 毕竟就是你创新对 我觉得是这样的假设我们资源也非常多我们其实也不需要来做创新但是如果一个创新公司不去来做这些创新了不管是技术上的产品上的 业务上的为什么这个世界上还需要创新公司呢

那你刚才说你坦白说你不认同的那个观点你是指的是什么我是说作为一个真正的创业者这个时候想的事情不应该是说 Signal 撞墙了我就放弃了应该想的事情是说我要做什么样的事能够让 Signal 可以延续那这个里面的话我需要做哪些创新不管是算法层面的组织层面的业务层面的还是方向层面的怎么来做取舍我觉得这个东西才是一个真正的创业企业应该来追求的事

或者说更直接就是你要想做一个创业公司你得想办法怎么让这个技术可以继续提升你把这个东西这个方法叫做 skin law 也好或者它是个什么别的东西其实都可以对但我们应该做的事情不是说抱怨它很难而是说我们要找方法但是有可能找不到方法找不到方法那我确实应该关闭但是至少在我们还有机会的时候我们应该干的是去努力找到那些方法

因为 AI 行业其实挺有特点的一点就是大家总是会讨论技术信仰这个事你觉得信仰是一个合适的词吗有更合适的词吗一年前最喜欢说信仰的那些人现在说那些信仰都兑现了吗你指的谁啊我觉得行业里面最喜欢说信仰的那些人不管是中国的还是海外的但是信仰是一年就能兑现的事情吗信仰不应该是个很长期的事情吗

那你要看在做啥呀它可以是很长的事啊但它至少得是一个往那一方来做的事啊那信仰是直线到达的吗我们中间不能走弯路吗但是相反的呀你觉得什么事是和信仰相反的比如说投放

我觉得就是说如果你信仰技术重要那我们就客观来看待一个情况比如说美国公司跟中国公司美国的 AI 公司其实没有钱不会把自己公司的钱美国的比较好的公司比如说包括乌拍包括 Srnopec 你可以看他们的钱是怎么来花的他们的钱可能最主要的是算力其次的话是人才

然后市场营销朋友占比是非常低的我觉得真正应该信仰的事情是说首先第一有信仰的东西不是说 AI 的终点在什么地方信仰的东西是说技术可以不停地提升我觉得这是一个我们比较底层的一个信仰第二的话是说我们需要做的事不管你有多少资源不管你在什么样的一个环境里面都是有限的在一个有限的环境里面你怎么样做能够对这样一个技术的提升起到自己的贡献在这个浪潮中能够推动这个浪潮的发展

这个东西就知道是我个人对这个什么叫信仰的一个理解那如果可以换一个词的话你觉得其实用什么词会更合适我觉得叫信念吧然后你们这次 MiniMax01 系列的更新还有一个关键词就是新架构开启 Agent 的时代我觉得这个我们可以详细展开聊一下一个是新架构一个是 Agent 的时代对吧

可以先讲一下为什么你们会觉得 agent 是一个重要的目标和方向其实核心是这样的这个东西它来自两个层面一个层面是来自于比如说 AI 的该怎么来提升然后这么一个层面就是 AI 的能力变得更强之后它应该往哪方能变得更强然后这是第一个思考路径第二个思考路径是说假设 AI 变得更强之后对人生会能产生哪些有益的变化首先第一点那比如说什么叫更好的智能水平呢其实非常显然的一件事就是说它应该能处理更复杂的任务对吧

所以更复杂的一个标志就是说它能够做很多步不管是说这个多步就是像 OE 这样的就是说单次直接输出的还是说通过一个单个的 agent 然后把它拆成的多步但这个东西按照 Asop 的定义叫 World Flow 就是定义好的一个 World Flow 来分成的多步还是可能是更复杂的它需要多个 agent 来协同

但是它的实质就是说我们应该做的一个假设是说当前的 AI 的模型的能力水平再加上一些算法的发展和算力的发展 AI 在接下来一段时间里面能够处理非常复杂的任务这个时候我觉得是可以正白假定的第二个的话比如说当 AI 能够处理一些更复杂的任务之后它能够给社会大学什么变化我觉得很显然的一件事是说它的交互形态会发生一些变化就不完全是现在这种恰里波特对吧

就是你跟他聊天立马会给你一个 feedback 他有可能就是一个执行了更长时间这么一个过程什么叫更长时间就是执行了更长时间执行了更长时间就是简单点理解的话就是说之前他也还做了啥事呢就比如说你妈交给了你一个任务你可能聊天的时候就立马回复他

还有一种形式就是说可能你想了两天准备了很多东西之后要告诉他其实就这么一件事显然后面一件事的价值其实是非常大的这个时候我觉得下代的就是说 agent 的时代应该来几位的场景简单来说你对 agent 的定义就是他能处理一个比较复杂的人物

对那处理复杂任务的话定一个标准什么叫复杂任务我自己的理解就是在专业领域能够到专业领事的水平你们应该还是主要专注于是虚拟世界的对吧就是比特世界的就它和是不是在物理世界有联动它有关系吗目前还没有但是不意味着这件事它不应该跟物理世界联动只是我们目前还没有能力能够到这个领域里面来

其实去年我们聊的时候你当时就说过 agent 这个方向在 2023 年的时候就很火但那个时候没有任何一个公司把它做成功过那它的本质原因是因为那个时候的模型能力不够强对你当时就说是因为模型能力不够强所以现在你们认为这个 minimax01 它可以说是开启了 agent 时代那它到底是哪边强了吗其实我觉得这个东西分成两个层面一个层面的话就是说它的这个架构层面能不能支持这件事第二个方面是说它的这个能力本身能不能支持这件事

在架构层面其实做到这件事了因为它可以处理的长度非常的长因为我们想过比如说不管是在单个的这种 A 系统里面它其实需要很长的记忆需要很长的这个杀亡的输入然后在多 A 系统的系统里面它其实需要不同的 A 系统之间能够交互很多信息这些的前提都是说能够做非常长的康乃赛的计算然后在架构层面其实我觉得我们现在已经实现这一点了应该也是现在全球可能是唯一一个能够这么来做的一个架构然后第二个的话是在能力层面

然后在能力层面的话我觉得我们其实还是有很多可以提升的地方比如说举例子比如说 ATEM 需要了很多能力比如说使用工具的很多能力比如说做这种规划就是排行的能力两个类似这样的能力我觉得我们这个模型其实还没有优化得很好但是好处是说这些能力其实都有很多标准的 benchmark

其实是说只要把这些 manifold 能够刷好并且让它能够把他的这些事可以翻画这个事我觉得就可以慢慢来实现而且你刚才提了一下说你们这个架构是在 transformer 的一个创新对吧对那它不是 transformer 的架构吗这样的就是说标准的 transformer 它其实里面会有几个模块我们这个是把 transformer 其中一个模块叫 attention 从 solid-model 的 attention 变成了一种 linear attention 你可以认为我们把 transformer 里面最重要的一个模块给做了一个变化

所以它是 Transformer 一个比较大的变体可以这么说吗你可以这么来理解吧对这个也是你去年的时候讲过的你当时就说从这个非线性的注意力机制到线性的注意力机制你觉得是一个非常值得去做的方向是而且你当时有说过你说谷歌的 Gemlet 其实它是有实现这个线性的注意力机制的

是这样的 Google 比较强的一点坦白说我认为 Google 在接下来一年可能会比现在变得更强因为他们其实可以做这种他们的硬件跟他们的算法其实可以非常好地行动在一起因为 TPU 也是训练框架也是他们的算法也是他们的都是一体的所以他们做这件事相对来说更简单一点但是对我来说的挑战在于是说我们并没有可以自己来定制 TPU 我们只能用标准的这些硬件在一个标准硬件上来实现这件事其实就会变得更复杂我们其实做了很多工作都是说

不好意思在目前这个阶段硬件也是不能变的那能改的只有算盘跟软件那应该怎么来做这是我们现在做的事这个也是跟 Google 的区别那除了实现这件事难度更高之外你们的线性注意力机制和他们的区别是什么首先我们是开源对吧 Google 它是避源的所以我并不精细地知道它是怎么做的但是我猜的话他们应该是用了 SlideWindow 的腾讯然后我们用的是一种我认为上线更高的一种方式

你可以解释一下就是 GOO 的做法其实就是说散烟温度的就是滑动窗口就一开始记忆可能没那么长但没关系就分成很多段对吧一个滑窗这样滑过去就行了然后我们的这种其实还不是滑窗的它其实还是都算的只是我们找了一些近似的算法让它可以算得更快的你刚才说这个架构是解决了长文本的高效快速和便宜的处理其实我觉得不是长我觉得比长文本更好的定义应该是长上下文

比如说在单个智能体当你跟一个 A-System 对话的时候你发现一个非常本质的事情你得想让那个模型它跟人有很大的区别我的感受是说人是可以感受到时间的流逝的时间的变化的但是 AI 其实感受不到这个里面其实它的实质是说怎么样处理越来越长的记忆这个事其实很难

比如说你可以看一下即使是一个人也很难所以说对单个 A 进程来说其实你可以认为人长是一个坐标轴是时间你可以认为人就是在一个实际的坐标轴上这样滑动的这么一个过程它又不停地有越来越多的输入然后也有一些新的输出其实就是这么一个过程这个里面的话其实我们认为能够提升单正能体交互质量的一个核心就是说演播器的东西越来越长不管是在一个虚拟世界还是在现实世界其实是一样的

就是你不要把它想成是一个单次的对话你要把它想成是一个无限的对话然后在多智能体里面其实也是一样的但是现在其实可能还没有很好多智能体的产品但是其实你可以很直接感受到是说大家其实也可以开始思考是说为了一个多智能体的系统

学校的基础能力但是这里面有些比如说模型本身的能力还有的话是说多智能体之间怎么来通讯你可以看 Mathropics 他们定了一个多智能体之间通讯的协议叫 MCP 然后 MCP 里面通讯的东西那个量其实非常长的假设是说一个多智能体系统它的一个核心就是说不同的 Athens 之间首先单个 Athens 的组合强其次不同的 Athens 之间能够协同协同的前提是说它的通讯能够比较有效率这个东西其实就是意味着对一个更长的上下位的处理

对就也是需要它的记忆能力对所以解决这个问题就分两步第一的话是说你的底层的建筑架构什么的支持这件事支持我们已经做了第二的话是说在建筑架构上支持的潜力下每个地方的能力能不能做到足够好这个是我们第二步要做的事就第二步是你们计划中的接下来要做的第一步是你们现在这个更新就是已经实现的对吧就是第二步你刚刚举了一些例子如果完整的总结的话就是智能体所需要的更多的能力还有哪些

我觉得其实有很多为什么我说目前这个情况做出来一个很好的知识水平其实跟你有多少用户关联度并不那么高呢一个比较核心的原因是因为就是驱动这个领域里面有些比较大的跨越的这样的一些东西其实是一些 benchmark 这些 benchmark 大部分时候是由求助界定义出来的决定的比如说代码比如驱动代码进步的一个很重要的 benchmark 就叫随文半起

Bench 的话就是模拟的软件公司的工作这个 Benchmark 在一年前的时候它的分数我记得应该只有 10 分左右现在的话其实已经有 70 几分了为什么你们这次没有测这个 Bench 这是我们下一个版本要来增加了一个东西就是代码的能力其实比如说像 Domotai 里面也有一些类似的这样的 Benchmark 比如说 Domotai 那些 Agen 它其实也有非常复杂的一些 Benchmark 其实这边需要做的事它的实质就是说把你认为下一代的 AI 需要具备的能力把它定义成一些 Benchmark

然后刷这个 benchmark 并且让这个刷的过程是可以泛化的就这个东西值得这个 AI 典型的路径在技术上我去刷这些 benchmark 和我的计算架构是分开的两件事吗其实是一体的相当于是说计算你可以认为是说那个架构指的是你的计算的 pattern 是长什么样的

然后那个能力呢是按这个判断计算那些参数具体是哪些参数那你怎么去判断我选的这个架构它去得到这些能力的上限会很高啊就是靠你的认知吗还是靠什么这个的话其实一方面靠认知但是也要靠很多实验实验对因为决定了很多不同公司的研发效率一个很重要的东西就是说首先你的这个认识要对

当然可能不同工作会不一样但是它有可能两个认知都是对的但是就只是说不同认知会导致你做的方法会没有那么一样但是可能毕竟分对错有可能每个认知死了最后它都是对的其次就是说这是一个认知但是这里面的话其实有大量的细节这个细的话它其实没法靠人拍它需要靠设计很多实验然后一步一步来验证并且这边很多步骤之间是相互是偶合的应该先验证啥再验证啥

这点的话其实是有很多的讲究的那我们平常认为是说现在我们的研发能力比几个月之前变得更强了比去年变得更强了然后我自己的一个最直观感受的方式就是说我们这些很大规模来探索的实验的设计然后是不是比之前的实际的水平更高这是一个非常核心的一个能力被这个能力其实很依赖于团队的合作的这样一个能力为什么 MiniMath 这次的更新没有提到 OE 放商的一些进展啊

它的实质是因为我们自己觉得还是需要把某一步做得很扎实的其实做一个看上去像 OV 的东西是比较简单的因为只要把 OV 的数据来蒸馏几千条数据就可以了你们是做过这种实验了吗我们内部做过这样的实验最近有不少这样的学术论文

这个事其实是一个业内的共识我们自己其实并不太需要执行专业说自己有个 OE 然后来发个片发个什么新闻告我们其实还是需要我们自己因为第一那我们的业务不依赖于我们有没有 OE 在目前对吧那第二个方面呢其实相对来说是说更详细来说那我们其实就需要把每步走得比较扎实就只好在目前吧我们并不太需要说号称我们做出来一个 OE 对因为 OE 也被认为和 agent 是非常相关的

它也可能会打开 agent 的应用的很多可能性对因为它可能会提升就是你每一步任务的准确率对就这样的东西是解读的就是架构和它的能力所以你觉得 OE 它是一个能力的对就推理能力是一个 benchmark 的那一部分我觉得是吧但这个 benchmark 其实推出来是说训练方法也要发生很多变化你刚才说你们下一版本就会是去强调 coding 的这个能力其实不管是 coding 还有 planning

还有规划对吧对那个算是欧一方向的一个进展是吗下一版本你为什么不叫欧三方向的进展或者叫欧系列吧对我想说就是这种方法对是我觉得你可以这么来看吧但是具体它是哪个我们还是得需要做一些实验才能做出确定下来好

那你刚才小小透露了一下所以你是认为你们下一版就能做到 O3 的效果没有没有没有我觉得这个事其实它主要取决于它实际上它取决于我们认为核量这个能力的班奇曼和市场举个例子吧比如说像 O3 就基础 O3 其实在那种多摩泰的班奇曼和上就那些多摩泰的 A 型的班奇曼和上其实分数也是非常低的嗯

这是为什么我其实不太知道为什么因为我们并没有走到欧三的水平我其实不是百分之百知道为什么我们需要得更多的实验但是我想说的事情是说即使欧三展出的能力距离一个这种东台雷厅的其实也是不太够的因为你刚才说你们的想法是要一步一步的扎实的去做确实 MiniMax 不是第一批跟进 OE 的公司因为像阿里通易 TMD DeepSeek 智普他们都已经有一些发布了在你的规划里面它一步一步的优先级它是怎么判断的我觉得这个东西取决于这么两个事儿

首先是说我觉得一家公司不应该指望的所有的事都一定要是第一个它的实质原因是因为第一就是说一个公司的能力是有限的这个事反正你是要承认的一个可玩现状第二个方法是在过去两年最终在那个领域里面做到最好的公司大家其实也都不是第一个做那个方向的而是把那个方向做得最扎实能把自己的长途能够重新发展出来的那样一个公司不管在中国还是在海外其实都是这样的

所以我自己觉得就是说早一个月晚一个月其实还好吧因为 AI 是个很长期的事核心还是说自己的能力能不能真的把那个事给做到最好吧然后这个东西来思考那所以说它确实早一个月晚一个月好像不是很重要那你的优先级是把记忆还有动波态能力放在前面是吗因为你们这次也还有一个视频的因为我们需要一步一步做嘛

相当于这个东西其实又等价于是说你是不是只可以做后面的事对吧因为后面的事出成绩最快前面的事你是不是可以忽略到这样的话它显然如果不做前面的事确实可以出成绩更快但是我们认为它没办法做到最好但是你又可以非常明显地发现一个行业里面不管是在那个三小里面好像确实只有做到最好的那一两家其实最终才有价值

可以说这种比较常上下文的记忆能力是现在挺多公司比较忽略的一个对 我觉得实质上是这样的就是说其实思考我们每个产品或者大家说的每个赛道应该都是这样的

比如说目前你可能会领先点或者落后一点不管是什么工具产品什么预约类的产品各种各样的东西那怎么样决定你到底要不要做呢或者怎么样决定是不是应该把这个东西关掉呢或者应该是有更大的投入它的实质一方面取决于现在的实际的情况它更重要的东西是取决于是说你认为这个领域足够收敛了它的市场到底是有多大的然后以及在这个里面的话你到底能够创造多大的独特的价值我觉得

我觉得本账是取于这件事 A-DIN 的话其实也是一样的如果只是这种 OEUR53 这种东西它其实是有一定的价值的但是它其实并不会带来那么大的变化它最终可能还是得需要比如说 A-DIN 的这种产品形态能够比较清楚真的能够带来很大的效率的提升这个事我觉得还是需要一个时间的虽然说已经快了其实我们真正需要做的事还是说假设这天到了我们的技术是不是足够 solid 了

对吧但是好像他并不太取我们是第一个做出来的或者是第二个做出来的或者是说我们比人早了一个月我看 OpenAI 去年 7 月他们提了一个 AGI 的五阶段路线图其实这个思路跟你刚说的类似就是我可能要知道我大概一个阶段一个阶段怎么往前走他们这个五个阶段是聊天机器人到推理者到智能体到创新者再到组织者对然后我看 Midimax 这一次的更新也是就除了你们文本的更新之外你们有一个

视频的模型就是 VL01 你们也是比较看重多模态能力的你觉得多模态在它这个路线图里是什么位置和作用这个事我觉得其实是非常重要的比如说 A 技能对吧 A 技能的核心就是能够完成复杂任务比如说可以完成一个医生的任务

如果它不会看它其实没法完成一生的任务比如说我要做数学体如果我不会看我也没法做几个体我觉得有两种方式来看动物态一种方式的话你可以把它看成这个模型远生的它就是这个模型的一部分还有一种方式的话它不是远生的就是先有一个远模型后面又加了一个动物态

但不管怎么样这个事其实都是避免不掉的就是多摩泰是一定在这个路线图里一个很重要的位置对因为他如果不在的话不管是刚才说的 A 或者 B 他很多事就是完成不了他就到不了智能体的这一步你怎么看有一种观点认为视频深沉的能力对智能的提升没有继续去迭代机座的大圆模型对智能的提升要大我不知道这是一个判断还是一个解释但是我自己的感觉是说可能不同人对智能的理解不一样吧

我觉得智能理解是生成一个内容这件事本来就是智能的一部分我觉得现在大家比较关注 OE 这个方向包括它和 agent 还有一个就很强相关的原因是因为它显著提升了编程的能力而很多人会认为就是 coding 是 agent 第一个落地的场景也是之后 AI 在数字世界去自由行动的一个基础那你说 Cursor 是 agent 吗你觉得它是 agent 吗我觉得算是吧对啊我觉得它其实是符合你刚才说的复杂任务的定义的对

但是你要想一下比如说 Costal 一开始成功转是基于的 Cloud 的 Sonic 3.5 但 Sonic 3.5 并不是一个 OE 系列的模型相对于是说现在的 coding 人物或者是大家广泛使用的基于 AI coding 的产品其实并不是基于 O 系列模型产生的并且是说比如说在两个月前 GateHub 就开始集成 OE 好像它也并没有变得比 Costal 的体验更好对 你说到这个其实有一个有意思的现象就是 OE 之后反而是中国公司跟进的比较快

就相比美國其他的像 Google 和 Anthropy 我覺得最終大家應該是一樣的就只是因為中國公司看起來更快因為中國公司大家可能認為徵流是一個可以做的事因為中國公司多所以大家可能都這麼來做也沒什麼問題美國的話我猜像 Cloud 或者 Google 應該不會說去徵流一個 OE 對吧

如果让他们去征流一下那应该也是很快的但是坦白说就是从这个正确线上来说我并没有办法说征流是一个错的事不同人有不同的看法那所以 Google 和 AnswerPeak 不做这个事是因为什么是因为技术的傲气吗我猜应该是为了做出来这件事他们应该有自己的思路吧

针流是一种捷径可以这么说吗我不知道能不能说它是捷径它肯定是一种路径但是路径是不是说它就是捷径这个见仁见智吧我说捷径的意思是它更快达到一个效果但可能你会有一些不知道的代价比如说你中间有些步骤没有做得很实对 这个的话其实在文物里面也发生过一次就对齐税对齐税的意思就是说比如说如果把模型对齐 GPS 的结果那就会让这个模型的能力受到一些限制

在 OE 出来之后其实也有一个很多的讨论就是说它开启了 Inference Scaling 这样一个趋势你怎么看这个趋势包括你们接下来会怎么去响应这个趋势我觉得这个趋势它其实很早就有了它其实不是 OE 才有的原来的话是因为很早大家就开始意识到是最简单的事比如说 Best of N 意思就是说你采样十次然后选一个最好的

它其实准确度就可以提升很多还有更爆裂的方式比如说你可以 byte style1000 那又能继续提升这个东西基本上它收敛的其实很慢的其实很早大家就开始意识到是说你采用越多只要能旋转到最好的效率它一定也会变好那怎么来采样比如说你必定要重复 1000 次对吧有些更高效的方法比如说就是这些吹死玩气什么类的其实很早就有这样的东西

然后还有的话是说怎么样来找入 word 怎么样来分布就 step by step 这些东西其实都很早就有了 OE 的话它主要是说把这个东西变成一个端端端的模型了这个我觉得是它主要的进步因为端端端可以做这种整体的优化之前的一个方法都是这种模型已经固定了然后我怎么样找一些规则或者是分不同的模型来实现 OE 的话就是单个模型就可以来实现这件事就至少看起来是这样的因为这样的话就可以逼近一些权益最优所以其实效果可以提升很多

但是这件事我觉得它基本上就是这样所以你们肯定本来也有这种尝试对因为它基本上是共识你自己觉得 agent 可能最先一批落地的场景是什么刚才你说了 coding 不都已经是了吗 coding 是对还有了所以 coding 这个你是同意的对吧你觉得这确实是其中一个因为这确实是非常显著的提升了工作效率除了 coding 之外我觉得很快应该会有一类运用就是信息的获取

你可以讲一讲信息获取和 agent 的结合是什么大致的形态或者思路我觉得它的核心就是说比如现在的信息获取其实是基于推荐的对吧其实推荐的好处是说这个内容大概率是你想看到的但它并不能保证是说你想看到的信息都能推给你

我举例子吧我自己非常关心的信息是比如说我希望每天这个领域内最好的实验论文我都能看到但是有时候可能出去玩了或者怎么样了没有打开电脑那可能就看不到对吧现有的这些内容平台上也并不能满足我这个需求对吧那打开电脑是我看那套内容的唯一的办法当然我说的是一个偏工作的其实有很多更加兽化的这样一些信息对吧比如说我想听周恩伦的演唱会他突然间在中国开演唱会我可能也不知道啊

如果想知道关于周杰伦的所有的信息那我应该怎么办呢这个我觉得至少会发生一定的变化吧

据你所知除了你们在看合适这个方向之外有其他公司有类似的尝试吗我觉得海外应该有国内我猜应该也有因为我觉得这是一件很大的事这个听起来有一点像是用一个新的技术方法的金融头条我不知道它是啥但是做 AI 产品的教训是说千万不要用上一代做移动互联网产品的方法论来思考现在产品

你可以展开说一下就是它可能听起来好像满足的是你类似的需求但是你说它不能用一个方法去思考的一些具体的点吗其实还是有挺多区别的就是之前的移动互联网产品委员会思考的东西是说比如说有哪些供给然后有哪些消费怎么样用这个确定性的方法来做 AI 产品里面的一个不一样的东西是说其实它前期是不需要供给的因为 AI 它既承担了分发又承担了供给的功能

其次的话是说 AI 的能力它又在不停地发生变化的比如说在互联网产品里面这个产品的体验变好它其实大概率主要是依赖于是说它的供给发生了变化但是在 AI 产品里面它主要依赖于模型能力发生了变化或者得到这个供给的方法发生了很大的变化这两个东西它的周期不确定性都是不一样的再比如说增长方式上其实也是不一样的比如说在移动互联网时代大部分的产品其实它就比如说移动互联网产品的增长你看一下 AI 产品的增长其实也不太一样对

所以说我觉得就这个里面的话我自己感觉还是挺不一样的这种 agent 产品你觉得到什么信号什么指标的时候可能你会有更多的推广很神奇就是发现其实在海外就不需要做推广但国内就需要来做推广比如说其实我们海陆视频在海外其实也没有花过一分钱的推广费用但是在中国它就需要我那中国也没有推广真实的理解是我觉得如果一个产品特别依赖推广大概率就是还不太对

所以回到刚才说的那个问题这个问题可能不是说出现什么信号它要开始推广而是它应该自己有一个自己增长的动力和趋势我觉得 Glow 当年它是这样自己就自来水它就活下来其实 Glow 跟海洛视频都是这样的是一眼你们还是做了一定的推广 TOK 的话也有很多这种自然增长的成分我觉得这个也是跟移动后量我时代不一样的东西

但是这个我觉得可能也是不同公司之间的区别吧如果对一个自己的产品来说其实很简单就是看流存就好了流存好然后比如说算 LT 的逻辑基本上就决定怎么样但是这种逻辑我觉得不太适合创业公司如果是这样的话说明创业公司的创新是不够的

就是从 Gno 当时没有推广到星野和 Toki 其实你们有一些推广到后来海罗因为它是更晚一点的产品你们又没有再推广这个变化是因为中间发生什么事吗是因为字节的我觉得不是的我觉得主要原因是因为我们自己的认知的升级几个阶段吧从一个没有做过产品到学习大厂的做产品的方法论到又开始意识到大厂的方法论有时候有局限的然后找到一些我们自己认为更加适合我们的方法我觉得是这么一个过程

就相当于格露的时候是没有做过产品所以也不知道怎么去推广也没有做完然后是中间那个阶段我就去学可能我能看到的最强的人是怎么做的然后是你意识到我们不能那样去做意识那样做有好处但是它也是有局限的它有可能东西是对的但是有可能对的时候比如说它对 A 公司对但它对 B 公司不一定对

就是比如说你做一个创业公司你应该想的事其实就是说如果它只是一个及格那它就不应该是你做说你的创新不够上个月我们跟小马智行的 CTO 楼天成聊他有一个挺有意思的观察的就他有主动提到你们因为我们在聊 L2 和 L4 的一些事然后他说他觉得大模型里面 MiniMax 做的新业这种产品比较像自动驾驶力的 L4 因为完全他不是一个人

就他是一个 AI 在和用户在互动然后他觉得像拆 GBT 包括他自己用的非常多的 Copilot 他觉得更像 L2 加他觉得后者的核心价值可能是未来在商业化的时候会比较难 justify 然后他有一个想问你的问题就是因为 L2 和 L4 它优化的目标不同所以它的技术路线是有一些分歧的只要在现在它还没有统一到一条路线上

就是在大模型领域的话你觉得就是做这种比较侧重于辅助人来完成工作的 co-pilot 类的产品或者说能力吧和做这种更偏向替代人或者我造出一个 AI 行动体来产生价值的 agent 你觉得这两个事它的路线会有什么异同我觉得这个还是挺有意思的我觉得这个方法确实还是非常不一样的其实在做新业的时候我们用了一套非常不一样的方法你说在做新业非常不一样是指和谁比非常不一样或者

和 ChatGP 这一类聊天机型对对对它的方法其实是挺不一样的我先不说我们的产品我就说大家知道的产品说所有人都用过的比如说 ChatGPT 跟 Cloud 你可以发现这两个模型其实表现是不太一样的对吧你可以发现 ChatGPT 它就是一个助手它就是帮你完成任务然后 Cloud 你就会感觉到它很像一个朋友有时候情商还挺高的

有個有趣的例子這個還挺有趣的比如說有個測試的用例你跟模型說 1 到 100 之間隨便說個數字比如說 50 然後你回答他就是說那我就將來 50 天不跟你說話了如果是 Cloud 的話他就說能不能再給我一次機會然後他會說個非常小的數如果你有問 XGBT 的話他就不會意識到這樣的問題

就是它不会有后面那个人性化的反馈对对对不会请求能够再有一次机会然后说一个更小的数字我觉得这面的核心的实质是说就是怎么来看待对齐这件事

对我觉得其实就是类似这样的我觉得上限比较高的事情还是说当然我觉得我们现在其实也需要提升能够非常清晰地定义出来是说你做的那个东西到底是个啥能够清晰地定义出来你做的东西到底是个什么东西对你说这个做出来的东西是指模型对

做出来模型这个事我觉得是非常关键的坦白说我觉得中国跟美国的模型有一个很大的区别比如说 Kaode 它是非常明确地指导自己的模型需要具备什么样的特点然后 OPPA 也非常清楚它的模型就是要优化于半径半角的一些效果

单拍拍也有很他们自己内部定义的然后中国的大部分模型的目标都是说对起油拍的输出当然比如说可能像豆包的话现在开始有一些自己的特点了但是它本质上其实也是这样的你观察到的豆包的自己的特点是什么比如说你让恰吉比提给你写首诗他可能就给你写首诗

比如说你要多包你让他写首诗他又给你写三首让你选一个相当于就对用户的场景优化得更深用户的观感会更好一点坦白说我觉得国内至少目前搭的模型还是比较缺乏自己的特点的因为都是在对齐欧派的输出主要是在对齐欧派的输出其实还是比较缺乏从底层开始的这样一些思考跟设计的 MiniMax 也算在内吗还是你们有自己的想法和特点我们在很努力地变成

刚才说的那种这个听起来好像不纯是一个技术上的区别这跟你的判断有关就你想做一个什么东西有关对这其实是一个非常底层的事这其实是非常反的门头的一件事那你可以描述一下 minimax 想要的特点是什么吗大概是什么方向

我们的不同产品里面的这个目标是不太一样的还是那个判断追求一加的过程虽然我们没法定义是啥就追求智能水平更高的路上我觉得还是需要通过多个产品的就是不同阶段我觉得应该是不一样的那这会导致你们是在同一个模型上要做不同的对齐让它去适应不同产品所要优化的方向是吗

本质上是这样的那就需要更多资源可以这么说吗原来上是需要更多资源但实际上不太需要真实的原因是因为做对齐的时候方法上试错需要的资源远远比最终训练那个模型要更多这个核心是掌握一套方法而不是说真的训练一个模型

你们接下来是会更偏重 agent 这个方向是吗我是指像比辅助人的 co-pilot 没有其实我们现在的产品都不是 agent 我自己觉得你说的现在的产品指的是新业新业 talking 包括像工具型的这种海螺其实我觉得现在这些东西都还没有到一个 agent 的程度那你们那个新产品算是 agent 吗我觉得算是算是是在往那个方向做对

我知道这次你接受采访想和我们聊你的初衷也是想讲更多的技术进展当然也可以讲其他都想但是它的实质就是回到一个最开始的一个问题就是一家一家公司到底应该是技术驱动的还是应该是产品驱动的对你其实刚才很明确说了你觉得就应该是技术驱动对至少是一阶段对吧就至少在原来它的但是这个东西的一方面不想说信仰我觉得信仰是这样的还有另外一方面的话它是一个事实因为驱动这些产品出来的一个驱动力就是因为技术的变化还会在快速发生更多的变化

到什么时候这个周期会结束就技术驱动的周期会去放缓或者结束我觉得它一定会有结束的那一天这个事是并不知道但是我觉得我们应该做的事或者作为从业者应该做的事是说让那个进步的周期变得足够长通过自己的努力而且进步的周期足够长是更有利于新的公司的

可以这么理解吗我觉得可以吧对就是回到你刚才说就是你认为 Megamax 肯定是非常坚定的一个技术驱动公司然后你也提到你你们之前做的不好的一点是你们的技术品牌做的不好比如说我在这个 Hacker News 上去搜 DeepSeek 我搜到了 470 多个帖子然后搜 Queen 就是阿里的通行签文有 530 多个帖子对因为我们之前就是第一的话我们也没有去做这些开源社区对吧对搜你们很少对这是就是我们应该提升的地方

就是你是接受这个落差然后接下来你们要去把技术的品牌做得更好对吧影响力和你们的技术实力有个更好的匹配你觉得就是去年到今天你们实际上做得挺不错的但是其实外面可能没有那么强认知的一些技术成果和进展是什么是这个先行注意力机制吗我觉得不是怎么说呢我觉得有些东西是我们人在意的有些东西是不在意的

在意的東西是說我覺得我們真正在意的包括我們為什麼要想來做很多這樣的收入原因是因為我們確實還是非常在意技術的品牌跟技術的影響力的然後這其實是我們真的非常希望能做好的然後我們不在意的東西是說比如說投資人怎麼看這種東西其實就不重要因為我剛問的是說你實際上你覺得你們做得不錯但是外面可能沒有那麼關注的東西是什麼你是說你不在乎外界的關注什麼你是想表達這個對

它真正的原因还是这个最底层的东西就是这个行业的变化确实是技术的变化带来的这些变化那这个事对招人都不重要吗重要啊所以我们就非常在意我们的技术品牌所以我们就想把这件事给能够变得更好你们在意的是 AI 研究者这些人才对你们的技术的看法而不是说投资人对你们的技术的看法对那你正好可以在这个机会讲一讲就是你觉得你们做得不错的成果是些什么嗯

你刚说不是线性注意力机制我觉得我们做的最好的是我们的基础设施和算力相关的东西因为我们每天生成的对话量我们每天生成的比如说图片的数量跟视频的数量还有音频的数量其实都还是一个非常精准的数字那怎么样真的能够产生出来这么多的计算怎么样把它优化得很好怎么把它调度得很好怎么把它本性做好有一个非常合理的成本这个我觉得我们应该是业内做的最好的

这个是靠模型和 infra 还有工程对吧一起来做到的我觉得这样是实际上说我们最强的地方算法上的话呢我觉得我们动物态从结果上来说算是比较领先的就动物态相关的然后我们的通用的文本呢我觉得暂时还没那么领先但是开始有比较强烈的我们自己的特色了我觉得这是我们现在的现状吧

你们这次也是说就是你们这个新的架构是一个非常大胆的创新是首次大规模的实现了信心主义力机制对这个创新有多大胆啊其他人都没这么做过嘛因为你看有这么多的模型了对吧但是我们确实是第一个这么来做的其他人不这么做是因为大家不认为这是一个好的方向还是因为这件事很难我觉得可能都有吧

具体来说你们做的时候遇到些什么难点然后你们怎么解决的我觉得有可能两条路都是对的其实就是选一条路然后选一条你认为的路但是选一条路的时候会有一些演绎内容会结合自己的特点结合自己对一些未来的判断会选一条路我最觉得其实就是只要把那条路选好了然后就走下去其实就可以了

你说这两条路是个抽象的两条路还是说在你们现在是什么架构具体的两条路和不用这个架构和不用这个架构之间的具体两条路就线性注意力机制这事不是一个行业共识吗它不是一个特别强的共识之前其实 DeepSeek 在发 DeepSeek V2 的时候他们当时也提过一个改进

他们提的是那个 Transformer 里面那个矩阵程的时候他们比如说用了一些低质的矩阵那个程的算力的效率变得更高他们叫 MLA 他们其实也是做了架构上面的一些创新像这种就是 MLA 的这种架构的创新也不算一个特别大的行业的公式是吗那肯定不是对

所以其实现在中国公司也是大家都会有一些自己摸索的就技术上的一些特点但是有些避免的我不知道但是至少开源出来的我觉得我们都还是有些自己的独到之处的吧你们其实海螺你刚才也提到是现在全球可能是视频生成的产品里用的人最多的之一然后我了解到你们做视频生成模型过程中间也是有些波折的这个可以展开讲一下吗其实做啥事都有波折了

好处是说我们已经做过一遍文本了其实有一些积累然后当然团队上之前其实我们也把本生图的东西也完全地做过一遍但是缺点的话是说发现这些 infra 完全没法服用因为视频的 infra 跟做玩意儿的 infra 其实不太一样算法上其实也有很多的变化然后怎么来做实验的也有很多的变化怎么来做评价那就更不一样了你可以认为它就相当于是说又新长出来一家公司

你觉得 2024 年过去之后视频生成模型到了一个很实用的状态吗我觉得确实这个里面还是有很多用户在用并有很多用户愿意为它来付费说明它还是有实际的价值的并且是说这些产品你发现它周一到周五的使用量其实要远大于周末的使用量说明它还是强生产力的一件事但是问题其实也有很多比如说各种各样的画质物理的这种一致性然后生成的速度反正还有很多这样的问题我觉得它又出来这么一个状态吧

因为 24 年 3 月的时候你当时有一个预测你觉得 24 年视频生成模型会变得很实用你觉得整体上来说它是达到了还是落后我也达到了就刚才我们聊了你们做文本模型包括你们新的架构更新还有视频模型这些过程就总结来说 MiniMax 的研究和开发实践里面你们的技术团队的优势特点还有方法论是什么

可能表达的不一样是说我们这儿相对来说还是比较客观的我指的客观的意思是说有可能我们的目标定的不太对但是一旦我们能够找到一个正确的目标我们做的这套效率跟深度都还是能做到比较好的

这个为什么叫客观非客观的意思就是评价它的时候有很多取舍有很多 trade off 就是会考虑很多有的没的比如呢要考虑很多比如说各种各样的一些平衡啊外界的影响啊团队稳定性啊会考虑很多这样的因素所以你说的客观是指你们对一个技术成果的评价是很客观的对就是看它是否达到了我们当时设定的这个目标对

那咱当初这个行业里很多公司它不客观吗我觉得不客观怎么讲因为很多时候大家会考虑很多东西别人怎么看然后这个东西让大家的士气会不会受到影响会考虑很多这样的东西那你能通过什么方式比如说我本来这个模型可能没有达到我的目标但是我能有一个什么方式给它包装成能达到吗还是有办法的那除了这个还有什么特点我觉得本质的不一样是说我们这边沟通方式还是比较简单直接

对因为我这边也没有啥层级什么之类的这种东西所以就是客观的然后比较扁平和灵活的沟通比较直接的对比较扁平灵活我觉得也是一个优势灵活指的事情是说我们可以所有不同的方向之间经常相互来支援这种你好像没有怎么去强调比如说人才密度比如说我什么有多少竞赛的奖项的这种对这是一个好的问题我觉得自己的人才密度实际上是最高的其实不是其他公司

这件事是在 23 年就是如此还是 24 年他们非常积极地去到处招人挖人之后才变成这样你这么想吧比如说有些自己的人去了欧盘工作对吧但是没有其他公司的人大批量地去欧盘工作对吧说明那他职场里面有些人的标准还是足够好的对吧

所以你觉得你不去强调这件事情也是一个客观的表现对是因为我们不想要就是一定要把这些包装成怎么样对接下来可能我想聊一些那个模型应用一起做这件事的一些变化因为这个是你们一开始的战略但是在 2024 年这个行业有很多变化包括开源和闭源的差距其实在缩小还有就大家讨论很多这个 scan 落遇到瓶颈是

其实你刚才讲了一部分就是你觉得模型和应用它其实是分开的一件事但如果是这样的话为什么一个公司不能我觉得不是分开的应用是模型驱动出来是契合变化驱动出来的但是那个产品做的多大其实不会导致那个模型能变得更好 OK 就是它不是分开的但它不是一个简单的正向成怀的那种协同效应不是一个飞轮就是说有了更好的模型可以导致更好的应用但是更好的应用不会导致更好的模型

或者跟大公共应用不会导致更好的模型如果说我这个判断的话可以比如说只做模型或者只做应用会是更好的选择吗我觉得实际的情况是说这是一种非常理想化的考虑方式你讲一讲现实的反问现实的情况是

首先不会存在只做模型不做应用的公司 Cloud 那种都不是对吧它也有一些对显然不是其实没有这样的公司说假定存在一种公司只做模型不做应用这是没有的因为组织形式公司又决定了就不会有这样的事情存在那会不会比如说只做应用不做模型那显然是有很多这样的公司比如像 Publicity 有这样的公司像 Cursor 也是这样的公司那所以这样的公司肯定会存在并且也能够做得很好到底是说只做应用不做模型还是说既做模型又做应用呢

那机动文件运营也有很多这样的公司对吧反正这两个公司其实都是存在的那就看每家公司的目标是怎么样了那我们特点是说当我们做出来一个新的产品的时候它确实都是因为我们先做出来的那个模型才变成这样那我们的一步一步往下来发展的这个方法它就是这么来发展起来的那听起来这是一个历史原因导致的我觉得它不是历史原因导致的就不同的形态是说像 Popular City 这种公司

它相当于是说模型也发展到这个阶段了它一定会有这样的产品只是恰好它变成了做这样产品里面比较成功的公司然后这是一种心态然后我们的心态是说因为我们做出来技术上提升了一些所以出来了一个那样的产品就是 minimax 的发展的路径是这样并且我们认为加来的如果有些更新的产品大量也都是这么来长出来的

我刚才说是历史导致的我的意思是因为你们在 21 年底就成立了当时其实整个大模型并没有什么很好的基础所以你肯定是得先有一个技术的进展你才有一个产品的进展对这个东西又变成我们做多个产品的一个思路然后 minimax 没有变成只做应用的公司可能有一个原因我想说的那个历史原因是因为你们成立的更早就有可能比如说你跟晚创业也许你会做一个只做应用的公司吗不会吧

我觉得一定会存在这两种类型的产品就是基于现代的技术做出来的产品和基于未来的技术做出来的产品的公司我觉得我们大家就只能是后面一种你觉得你想做基于未来的技术做出产品的公司是因为你想做一个更大的公司吗我觉得不是就这样的东西都是有意义的对吧那既然都有意义的话我猜可能思考的角度可能不是这样的大小它既然都有意义那就做自己最能够发挥出来的那件事就好了

就是你觉得技术是你更能去发挥你的专长的一个方向或者是这家公司吧所以说其实我觉得并没必要纠结两个东西哪个对其实两个东西都对你上上啥就做啥就好去年其实你说过就是现阶段模型性能和产品体验是直接正相关的但另一方面就是你有了一个模型驱动一个产品和应用出现之后这个产品后面的表现其实就不完全

跟模型相关了对比如说你们去年做海螺你也说其实没有做出来表现是不如预期的如果复盘一下这个事你们是哪些地方可能不如对手了我觉得就没有坚持技术驱动在海螺上没有坚持技术驱动可以讲一下吗在海螺文本上本质上就是说你发现有很多问题的时候比如说有些用户用的不满意的时候其实解决思路不应该是去来补这些 concrete case 的

应该是找到一些真正的提升方式那你真的觉得海螺的体验是不如其他产品的吗我觉得在三月份的时候是但是在五月份的时候其实就不是了但是那个时候你已经没有这个产品的这个门类的心智了对吧比如说那会儿可能 Kimi 是最火的不是的那个时候其实我就知道豆包会赢因为其实在那个时候豆包的体验就比其他的体验要显得到好了所以你五月就知道豆包会赢对

一个是知道它会赢一个是那个时候就开始意识到是说就是我最开始说的那件事就是说其实有了更多的用户并不会导致模型的能力提升然后在那个时间点来说我觉得就是我们找到一种办法让我们就是能够复旦更强让模型能力提升可能是更重要的事当时我记得海罗有段时间推送也特别多比如说我已经是海罗的用户之后他老给我推那个信息所以说这个东西其实就是因为没有那么技术驱动的时候导致的一些结果嘛

我感觉二三年的时候你就有这个认知这个东西我觉得一直创业过程中的成长吧其实这些认知它是很简单的只是有的时候呢就是没那么坚定就是你执行的时候可能没有那么坚定我觉得至少在那个时间点的时候是这样的回头看你是被什么东西干扰了你是被周围的比如说同事或者说投资人的一些想法压力吗还有竞争对手我觉得是人吧有的时候会考虑人的感受吧

你主要指的是团队里的人对你什么时候开始变得更无情了其实现在也没有了核心的变化就是说你认为那些对的东西其实是要非常明确地讲给大家的就是有些事是没法妥协的

然后另一方面你们的社交陪伴类的聊天产品是中国表现最好的就是新野其实它比字节包括美团这些大厂做的同类的产品表现都好那你怎么总结就是新野成功的因素我觉得还没有成功吧或者说它暂时领先的因素吧就甚至比可能做了这一类产品的大公司也做得好的原因是什么可能就是因为我们更懂吧

首先是说技术路线一定要选对这是最关键的其次的话就是做角色的时候更懂用户但这边如果说一件事的话我自己觉得还是就路线要选对

技术路线选对是前提然后是做决策的时候更懂用户对你后面说的那个决策是指产品决策还是指什么决策业务决策吧因为像现有的这种产品可能大部分人我才可能不太会特别懂它的用户到底在想啥你怎么懂的呀你通过什么方式懂呢其实我觉得就它的用户跟你不是一种画像跟你自己我觉得这件事它的实质是这个东西还是需要挺多同理心的所以你是一个同理心很强的人我觉得是它的实质是说

就是大部分做技术的人都会觉得自己很牛都会觉得自己是天才但是我不是这么来认识这个世界下面我想聊一下就是现在越来越激烈的大模型的竞争最近我看到一个帖子挺有意思的就小龙书上的一个帖子这个博主叫秘母知识他排了一个六小龙加 DeepSeek 的生存指数你猜你们排第几你猜 MiniWise 排第几我不知道排第几是越小越好越高越好就生存指数从高到低的排名我觉得我们应该还行吧

对他给你们排的是第一核心是产品力不错我觉得首先感谢认可但是我自己感觉是说分成什么 AI 技巧龙这种东西单独是一个 track 我觉得这件事其实是不太对的因为在小说上很多这样的帖子但是我觉得核心的是说不应该把 AI 的创业公司单独看成一个 track

应该把 AI 公司看成一个类别就是把大厂都算进来对对对就比如说你看美国对吧它也不会说 OpenCard 是一个 track 对吧然后 Google 是一个 track 对吧其实也是放在一起来看对吧这么来看我觉得才是更客观的但是如果这么来看的话我觉得其实对创业公司的要求肯定要变得更高了因为关在创业公司里面是好的或者不好的其实意义不大的应该是整个 AI 在一起看才更有意义对

他本来看的也是存活率可能他的假设是大公司不会那么容易要对吧然后我也去问了一些你们的投资人就有一个投资人的想法是觉得你们非常纯粹以及他也提到产品最早开始产品化模型工程化和产品化团队都具备的国内的创业公司他觉得只有你们反正其他有工作也都还不错我觉得质朴也挺好的

你觉得智普也挺好是这样的我说一下我觉得有两家公司还是不错首先我觉得 DeepSeek 确实还挺不错的因为我觉得他们也是很纯粹的我觉得智普也还不错我说一下为什么我觉得智普不错就比如说刚才你提到的 OPI 有路线图对吧 R1 到 R5 其实智普也是有自己的路线图的并且别的东西他们确实是很坚持在做的对不对不同人有不同的观点但他们至少是有自己真正的一个路线图当中先做的虽然说我不直接认识唐老师但我觉得他们至少是有自己的坚持跟思路的

他们应该是最早有这个路线图的这点我还是挺佩服的对我想补充问一下你关于 AI 的路线图是什么就是 OpenAI 有它自己的一个路线图那你的设想是什么

坦白说我觉得这一点是我们自己在慢慢加强的一件事你看我们这个墙上写的就是 intelligence with everyone 对吧我们一开始只是明确了 intelligence 是有意义的然后我们做的方式要跟用户在一起然后我们需要一步一步来提升这是我们一开始的定义但一开始我们其实并没有非常精确的定义每一步到底是啥这个的话是一个客观的现实然后做的时候其实我们一开始基本上就是

其实它的实际的情况是说有点是一个这种叫逃出生天的这种逻辑比如说认为最开始的时候比如说我们做这种聊天类的然后做这种能力更强的能力更强的然后又分几步我们大概是这么来思考这个问题的坦白说其实我们自己是没有一个举例子比如说欧盘的话它有 R1 到 R5 对吧但是其实我觉得这个 R3 是有意义的因为比如说 R4 是长什么样其实并不会影响到他们任何的技术路线

L4 它是创新中对那个事其实并不会影响到我们还现在在做啥只有 R3 是啥影响到他们现在在做啥对因为这种体是下一步对首先我觉得还是应该是这个假设吧就第一的话是说我们认为 AI 的智能程度很重要这个东西是能进步的其次的话是说真正影响的其实只是下一个东西是啥才真正影响现在做的东西你觉得从我们 2024 年初那一次聊到现在中国大模型行业的竞争格局最大的变化是什么

我觉得最大的变化是说在 2024 年的时候那个时候可能很多人认为 AI 就是一个移动互联网只是把这个事给复制了一遍我觉得现在的话至少是有些人开始意识到其实 AI 不是就是把移动互联网给复制了一遍这里面还是有很多自己独特的东西的就是这是完全两件事这个怎么影响到竞争格局了这个你说的其实是一个对这个事的认知有一个变化嗯

它一样的格局是说就是不是只有说按照移动互联网那套思路来思考自己公司的组织形态然后产品业务那你怎么看就是移动互联网时期积累的一些优势大公司当时积累的一些优势我认为还是有意义的但是它可能不是唯一的一条路原因实在于是说那些东西是有意义它可以让你有跟它一同规模但它其实不会导致是说你的升等程度变得更好不

不会导致你的智能的程度变得更好就是因为它那是产品上的优势对而像你所说的不是说你的产品用户越多你的模型就会自然变好的就不是一个事对吧不是一个事一个的话是说更好的智能程度可能会导致新的东西出来然后新的东西也会有新的东西的商业模式

然后在全球的话我们也可以观察到比如说像产品形态跟你们有一些相似的这个 Cloud AI 它是选择回到大公司就是 Google 是花了 25 亿美元收购了它的部分团队这可能是 minimax 的选项吗我觉得它其实非常明确不是因为我觉得我自己还是比较坚定的

就至少我们在决定做什么东西不做什么东西的时候包括做些角色的时候好像其实确实是没有考虑是说怎么样把自己能够卖一个价钱这种东西其实确实还是比较单纯的是说希望把公司认得做好然后技术上做好产品上有更大的价值然后公司能够长期发展这个基本上

其实说我们大部分的决策确实都是这么做的我去年看到这个新闻的时候我当时不是给你发了这个信息吗然后你说感觉是一个 happy ending 我觉得对他们来说确实是一个 happy ending 那个 Nom 他本来就不喜欢自己的产品他确实他就想回到 Google 他回到 Google 之后做的也还挺好据说那个 Gem2.0 应该里面就有很多他的贡献

你说是指那个 Founder 创始人对吧对有一个传闻向你求证一下就说字节 24 年初的时候和你们谈过 40 亿美元的估值来收购你们没有没有对好好证明一些谣言就完全没有这个事对吧对没有那这确实也是一种市场现象就是大家老是会传比如说这个公司可能要被谁收购那个公司可能要被谁收购最终你发现这个事还是比较简单的还是就是你做了啥东西你和张一鸣聊过吧我是只交流过对聊过几次

是 23 年的时候还是 24 年 23 年和 24 年都交流过你愿意和他交流的原因是什么首先你要做的假设是说他们的信息密度肯定是比我们强的这个东西我觉得是一个假设就不应该假设是说我们知道什么东西他自己不知道的对吧那如果知道这样的话那其实也没啥好害怕的你跟他聊的话你有什么收获吗

我觉得就是你知道在你面前一个非常顶级的企业家他是什么样子吗所以你观察到了他是什么样子我觉得还是很希望能够给这个社会带来很多正向价值的

然后说回到融资的这个事了就是 24 年可以看到的一个现象是 24 年到下半年很多投资方已经是走到了国资轮还有中东轮感觉后面就是能接力的人没有那么多了你们后续要怎么持续获得比较充足的单要反正我们还没有到这个地步吧就是这个事我觉得实际上还是取决于这样就是作为一家公司应该思考的问题是说这个公司怎么样做出来自己好的东西然后怎么样变成一家真正的公司

公司也好特别依赖自己的这个研发能力这是现在的现状不应该考虑的问题是说就绑个大腿然后啥都不用干了我觉得不应该这么来考虑这件事嗯

对其实你去年就说过你不相信中国的大模型与创业公司能重考融资你觉得真正的拐点它会来自于技术产品或者商业化的效率的领先对然后我了解到你们 24 年的产品和收入其实都没有实现年初定的目标你会怎么复盘这个事它也是最快的对你们比别的公司要快要好所以是你目标定态高我觉得不是我觉得核心是在一年前的时候当时我们还认为是说

就那个时候其实我们回把右看成还是一个移动互联网还是那样一个认知但是现在的话我们那个东西之后我们开始意识到其实这是两回事所以当时定的 DAU 的这些目标是根据移动互联网成功的产品在它早期的增长来定的是吧对我觉得它的实质其实这是两个行业所以你对这个事复繁是 24 年初当时定目标的逻辑是不太对的你按照移动互联网去定逻辑是不太对的对你现在会怎么来去设立目标了

实际上我觉得在这个阶段真实的情况是不应该定一个收入的目标其实应该定的是说这个技术研发的目标是因为做出来一些东西导致有了那些业务跟用户的产品的变化不是因为是说我们认为需要做到一个什么样的产品变化来倒推出来我们需要来做什么样的技术这东西我觉得是一个本末倒置的一件事你们 2015 年就是这样定目标了是吗你们已经定了吗对

但是邏輯不是說公司的增長曲線需要長什麼樣所以你定格這樣的目標而是說我們認為我們的研發能做到什麼樣的程度這個程度會能帶來什麼樣的變化然後基於這個東西來思考我們的業務應該推出來一個我們的預算然後應該是怎麼樣的

然后我们其实就是看到去年下半年大家都看到大公司比如像字节还有阿里的强悍尤其是豆包的产品表现是很亮眼的你刚才也说其实你五月的时候你就觉得豆包会赢我觉得之前就我聊的这些创始人里面你也是非常早非常直接的就会去表达其实创业公司跑出来是一个很难的事就即使你很早的时候有这个人职你觉得去年一年有什么事仍然是超出你的预料的 50

我是指大公司的动作方面和这个竞争激烈程度方面我觉得基本上都预料到了对你呢连程度你都预料到了吗我预料的比例还会更精简就是我觉得真的是不要套一段幻想思维来看这个车如果是要以幻想思维来看那确实很有

但是如果你观上这个资本来看你能够去说假定是说技术会长期发展或是把你解决回答案不一样的问题长期发展来看就真的不一定是件好事你说什么不一定会是件好事就是以比如说豆包的 DAU 作为一个衡量标准来说真的不一定是一个好事你是指对豆包不是好事还是指以豆包的 DAU 作为一个评判标准对观察者来说会造成干扰我觉得都是吧你觉得这事对豆包都不是好事为什么对豆包不是好事

有好的一面,好的一面是用戶多但也會有不好的一面不好的一面是說比如舉例子就比如說對歐巴安來說雖然說它的用戶規模是考慮到的好多倍但是它的估值、資金能力、人才可能應該都沒有考慮到的三倍多

但是它还要负担很多的东西这个东西有可能是说为了要照顾这么多的用户它很显然让他们的研发的节奏变慢了比如说假设 OpenPy 现在没有这么多 DL 它 DL 只有一半但是它在技术上比如说把 Cloud 给碾压了好多倍所以用户越多这件事不一定直接让模型能力提升它多到一定程度反而有可能会限制模型发展的速度迭代的速度和灵活性是至少你看 OpenPy 跟 Cloud 是这样的对吧

确实你用户更多你的责任也更多但是技术是在快速变化的它都不是说提升几个点的事它其实可能是天翻地覆的变化还会再持续发生如果说去年的这个情况你们都预料到了

你们当时做了哪些事来应对这个竞争其实就是技术的就应该看技术技术的话就是看进步曲线然后产品就应该看产品本身只是说这个产品本身不应该用移动互联网的产品逻辑去套对那应该看什么产品指标你看现在的这些比如说 AI 里面有合理商业化的产品主要都是依赖订阅的对吧都不是依赖广告的对吧但是中国的移动互联网过去的历史上所有的商业模式都是依赖广告来计算的对吧

所以这显然就不一样但是付费用户这件事又只能在海外才能跑通对吧所以在海外产品付费用户确实是个指标包括订阅的转化对 但是在国内其实不是对吧那国内有什么你现在看到的指标吗我猜是有的但是我想跑得更好一点在那个你现在不想透露是吗对比如说你用一个广告的计算逻辑来计算这个事至少在国内肯定是不过可能的

但其实那个 TOK 也蛮早就开始做广告的反正就这样的话我觉得还是有些局限性的所以这是你们之前的尝试对你很早就是看到说创业公司跑出来是个小概率事件挑战很大但你还是选择了创业你算到了这个翻盘的概率是什么

可能性是什么这个东西它都没法算就只能是说首先第一我觉得它一定会存在本质原因就是因为这边还是有能看到不同的路径对吧大概率我觉得是没法一家同吃的不和巨头正面竞争就豆包类的这种产品你们不是重点投入去做的产品这是你们的一个原则和策略吗这个东西本身上是我们认为是说做 AGI 跟做一个恰 GPT 其实是两件事

就是相关但它其实不是说有了差极批才能做一节也不是说你要做一节一定得有一个差极批让你产品因为我刚才说的很多原因对吧所以说当开始意识到是说用户规模不一定就是提升技术水平不一定意味着是说你一定需要最多的用户这件事之后所以这个事其实就没什么负担了对吧也不需要有心理压力的

你觉得除了大公司它是比较明显地给这些头部的大模型公司带来一些外部压力之外还有什么不明显的威胁和压力首先我觉得压力不是坏事我觉得对传言公司其实是个好事让传言公司清晰地意识到是说必须得创造出来独特的价值否则的话就不应该存在从这点上来说我觉得这是一个好事可以非常清晰地意识到是说有哪些东西我们一定要做好有哪些东西我们就根本不应该去想了

其实变成来看反正我是这么来看待这件事的那回到刚才那个问题就是说还有什么不明显的可能大家比较忽视的竞争或者说压力我觉得主要还是自身吧其实还是怎么把自身做得更好吧

还有认知水平的提升组织的认知肯定不光是指你的吧就你们所有人对 就比如说比如说如果我们一年前就开始意识到技术品牌很重要那我们肯定会比现在做得更好你觉得那些就是他不自己做模型他进入一些开源的模型做一些精调在 2025 年就这种公司和像 minimax 这样的公司它会是一种什么样的竞争情况我不知道首先我只能说这样的公司肯定是很有意义的他还做了

还挺不错的对吧但是话说回来好像是说这个市场好像也不是说就是有 A 不能有 B 的事对吧

反正至少我们不需要考虑但是你们可能需要考虑这件事我们需要考虑这件事因为你要观察这个行业对我之前就是有大模型的投资人对比过 minimax 和越战面的市场策略就他会认为越战面是认准一个方向他们主要就是做生产力场景加中国的市场当然这个也是所有的大公司投入最多的方向然后 minimax 看起来是一个不断在适应环境就是找到巨头正面战场之外自己的根据地的一个策略

你自己会怎么总结你们的市场的策略定位的策略实质还是那句话我们希望我们自己能够一直在这个浪潮里面但是一直在这个浪潮里面有两个意思一个话是说我们自己做的一些东西对这个浪潮的产生能够起到正面的作用第二个话是说在这个浪潮里面我们做的一些事能够让我们有一些收益值的这家公司可以持续发展下去这个其实是我们的最底层的一个做跟不做的一个考虑的逻辑

就是关于竞争和怎么赢有的人的选择是把长板做到足够长有的人选择是没有短板你觉得你们会更倾向于哪一种我觉得这个东西好像我们并没有什么偏好

还是取悦于怎么样做能够更好地在技术不停经的浪潮里面那是一个核心的目标然后你其他东西是根据去看去对齐去调整对接下来我想聊一下你们团队与组织刚才也提到点可以再展开一些你怎么看去年有一些人离开本质上还是刚才说的我们还是相信这个事它应该就是技术驱动的就是不是所有的人都合适就至少对我们来说所以你劝推的吗

你做这种事会心理负担表达吗会那你怎么克服这必须得克服你做这些事拖延了吗拖延所以感觉不应该拖延我觉得这也是属于认知不够强我觉得就不应该假定说一个公司不会有人员流失对吧因为一个公司确实应该有人员流失才是合理的实际上你们现在砍堆架构相比于 24 年出了什么变化

其实有个非常核心的变化就是自己来提方案跟自己来做决策提方案跟做决策其实是两个完全不同的状态提方案是说自己来提方案要怎么来做然后做决策指的是说有同学提出来一些方案你来做一个选择至少在我们这个组织里面其实我们会倾向于不管自己还是一个方向的 leader

大家其實一個基本的標準是說大家都要是提方案的人而不是說等著別人給你來彙報然後你來做過選擇的人

所以是要 hand on 的要一手要去了解细节干活的人对这是一个比较核心的一个点还有第二个点就是说我们发现一个比较有效的方法就是什么样的人适合这个组织什么样的人不适合能够比如说客观地来分析这个现状然后能够找到一套理性的方案和把实际的

上一家公司的经验直接 copy 过来这其实是一个非常大的区别所以说其实我觉得核心一态也就两条第一条就是就是每个人都得是能够提方案的人就都得 hand on 第二个话呢是说那个方案它应该是基于客观的现状分析出来的不应该是说只是把一个别人家的经验给搬过来我觉得这两点其实就是我们的非常明确的两个原则吧

所以这个核心的变化并不是组织形式架构上的变化而是对人的要求的变化对这大概是 2024 年什么时候有这样一个转变和调整它其实是慢慢演化出来的具体发生了什么事让你会有更清晰的这两个总结一个的话是基于某些事没做好还有第二个就是有些事做好了

之前梁文峰他分享过一个 DeepSeek 分工的方式大概是说他们不前置分工他们自然分工对然后他让有想法的人自由组队这个想法是如果你其他人对这个感兴趣你就来参加这个项目然后每个项目可能他能调动的卡和人是不设上限的这在公司里能实行吗公司应该至少有些项目是这样的有些项目是这样说明这个事它是能执行的

比如说在一些实验室里面其实也有类似这样的组织形式只是有的实验室是说可能每个人都要做的部分不一样有的实验室是说那个项目大就可以有更多的人其实也是这么一种组织形式吧实际上我觉得它都对就是说不应该孤立地看说一个组织形式是不是对应该把这个组织形式跟它已有的人就放在一起来看其实是一个这种双向筛选的这么一个过程

因为你刚才也说 2025 年你们最重要的目标肯定是跟技术迭代相关的就技术迭代这块你们现在的组织的协作和分工的形式是怎样的包括资源怎么分配其实就是客观来看的话我们感觉这些资源其实都还是挺充足的就是做出来一个好的技术需要的这些东西但是创业公司的话就得做取舍其实核心就是怎么来做取舍

这个取手是自然跑出来的还是比如说你得来判断取手但是应该要判断了对吧但客观的情况来说其实是你不应该假设所有的判断都是对的你应该假定是有一个判断就是错的当你意识到判断错的时候怎么样能够及时来补其实是这么一件事什么机制可以让你意识到你的判断是错的我觉得最好的机制就是不依构吧

不依靠就不自我对这个怎么具体落到每天的工作上和决策上区别就是说如果你依靠的话你比如说有些东西就明明意识到是错了然后还会找一些理由我说的是我自己那可能就会让它变成一个对的东西然后不依靠的方式就是说那么发生的客观你意识到错了它就是错了那就也不要怕打脸你就第一时间改

MiniMath 现在哪些重要的决策是你来定夺哪些是放权给其他人来做的我觉得是这样的就一开始我也觉得这个事很重要就是在生日创业的第一年就是说你来决定什么东西什么东西不决定但后面的话我发现这个事其实不重要可能更高级的形态是说不是说大家分好说你来负责啥你来负责啥更重要的东西是说就大家把怎么来思考这个问题的方式能够

定下来就是说我们会基于什么东西来思考出来是说要这么做或者不这么来做这个事是比较核心的我说一下这个东西的区别这个东西的区别就是公司里面的人可能会来自不同的地方对吧比如有人来自自己的厂里有人来自拼多多不同的人做的方式肯定是完全不一样对吧

如果管理方式是说谁来负责啥谁来不负责啥一定会导致比如说 A 来负责一块事 B 来负责一块事但是他们在之前的公司里面会有套思考方式它导致大家的决策逻辑是完全不一样的这个东西放到一个组里面就会导致组织其实很混乱因为不同模块的决策逻辑是完全不一样所以这个事其实就没法让一个公司非常好的来运行虽然说每个人的素质都很高

背前每个人在他的谁要来都是对的然后正确的方式应该是说这个公司他最底层认为什么东西是对的什么东西是不对的然后这个时候大家能够慢慢的有团的认知这样的话导致的结果是说谁来做决策结果都差不多的逻辑也都差不多这样的话这个东西才会组织它会变得比较顺就怎么让大家能统一了就是通过不停的沟通吗

我觉得一个是沟通一个是观察观察指的是总会有些正反馈跟负反馈我觉得这可能是一种比较高级的管理形式但是也不能说我们做到这样一个视频了但是至少我们在网上还在努力那对我自己来说就是讲明白就是当一定要做一个决定的时候给大家讲明白或者大家能够讨论清楚这个决定到底是怎么做出来的而不是说你来拍了一个板

所以你觉得更理想的状态就是可能在这个组织里的人他做的决定会是类似的对比如说字节它其实就会有这样的一些特点但这是一件好事吗就不会让你的决策的多样化变少了吗我觉得这是好事不同阶段可能不一样吧

那如果每个人都想的很一样的话那不是会凑到一起去多样性也是一个很重要的指标了但是我感觉就是说就是真正把一个公司能够拟据起来的其实还是这些东西对或者你可能说的是一些原则性的一些比较大的认知多样性可能是在一些更具体的事情上对总的来说你觉得你是一个容易被说服的人吗我

我觉得不是不是这个和不要 Ego 是什么关系就是矛盾的吗就很多事都是矛盾的就跟 MiniMax 也是矛盾的对吧对 MiniMax 这个名字就是矛盾的对因为我觉得世界可能就是这样它就是两个东西变成了来看那实际在工作中在一些状的决策的时候你怎么去平衡一方面你有自己的想法你可能很难被说服另一方面你不要 Ego 你不要太自我反正还是有一些办法的

我觉得这个实质还是说就是能够静下心来思考吧不要被一些表面暂时的东西迷惑住你们现在的这种决策方式会不会让员工觉得公司的一些管理决策会很乱啊我觉得首先呢一个比较重要的事是说对意识到是说让大家觉得管理很好或者让大家觉得这些东西其实它不是一个不是个目标对不是一个目标

就跟你不能假定一个团队它就不会有人家流失是一样的有 minimax 的员工说 24 年的时候他有段时间感到公司的管理决策非常摇摆就可能这个月的核心目标是收入下个月的核心目标是增长下个月又换成收入所以我们就同意了思想现在同意的思想就是其实这两个事可能都不是最重要的目标最重要的目标是技术迭代对

你觉得就是管理一个不能用以前的逻辑来套的这种新的 AI 公司在组织上你遇到的最大难题是什么我觉得主要挑战其实还是就是持续吸引到好的人吧这个实际上是目前最大的挑战你会怎么评估就是你们在人才吸引力上和其他的同类公司包括大公司都算在一起我觉得其实现在最有人才吸引力的就我观察

我觉得其实是自己跳动对我听一些公司说校招的时候现在很多人都是选择自己对其实我觉得这个东西这是一个客观事实但是呢其实去了自己跳动很多人可能是并没有发挥出来的

真的发出来人的比例其实是很低的比创业公司低是吗要低非常多是因为自己的效果人太多了对所以它其实就是这么一件事动了说其实核心真的还是如何吸引到更多更好的人就最后想聊聊你个人的变化和成长我觉得其实还是有很多变化的就是半年多以前或者是一年前

好像好多人会觉得我很焦虑有些人然后最近半年就完全不焦虑了真实的情况就是这样的然后我觉得核心就开始意识到其实就是要做取舍你半年前焦虑是因为什么半年前的话我觉得本质上是因为不太知道该怎么来做取舍或者是不敢来做取舍或者有的时候就不想来做取舍你过去一年最大的痛苦就是取舍这个点吗最大的痛苦是不知道要做取舍当知道要做取舍的时候就不痛苦了

那个时候痛苦已经解决了很大一部分对之前 YC 的创始人格雷姆说过一句话他说创业公司摊开看都是抽货现场你觉得去年你们经历的最大的混乱是什么我觉得就我刚才说的这件事就是意识到是需要来做取舍的然后在那之前可能会有一个焦虑和混乱的状况对并且意识到就公司的驱动力到底是啥那你去年反思最多的问题是什么

反思的问题是说为什么这个认知能力不能提升得更快呢你后来找到啥方法了吗找到了一些比如了就是要放下 ego 然后思考得更深入你之前说过你很重要的一个学习方式是和比自己强的人去交流对去年你有见过什么比自己强的人给了你很大的启发吗

还是有的但是坦白说我觉得光这样是不够的本质上还是自己得能够放下一个我能够思考的非常的深入大部分的时候其实是能想清楚的自己想清楚这是一个自我反思的过程可以这么认为吧你去年当外部压力很大的时候你怎么排挤压力其实就是当想明白这些事的时候就还好了就是有一个投资人他分享了去年和你一起找算力的一个故事就是说你会非常急切地去追求便宜的价格更短的租期

然后可能有一些供应商会提出说我可以给你一些当地的 2B 的 AI 订单然后让你接受一个更贵的 GPU 你说你不需要订单

首先我非常感謝我們那些供應商其實核心還是說我們開始意識到很多東西我們自己做不了相當於是我答應人家要去交付那些東西第一我們沒這個經歷第二有可能也會把別人給坑了我們知道我們在那個時點沒辦法來做這樣的交付所以其實這東西我覺得可能不是不近人情還是很感激的我覺得核心是因為我們不太想去耽誤別人

就你有的时候看起来是非常适应性的甚至可能有的员工会觉得是摇摆的有的时候你会非常坚决你觉得哪个更接近真实的你

这个的话也是一个个人的进步的过程我觉得至少比之前变得更强烈之后我觉得其实是越来越坚决的就是你想清楚取舍这个事情以及不要太自我要放下自我对所以你创业的时候你既不是那种业界大脑可能也不被很多人认为是技术小天才你会认为自己是什么类型的创始人我觉得是比较简单的简单是指简单的话就是知道有件事这件事反而还挺难的然后但是如果做好价值也挺大的然后

然后就坚持做就是这样在创业或者说当一个 CEO 这件事上你有什么 role model 吗那如果没有一个的话有几个吗就可能他们不同的特质也没有你觉得当一个 CEO 你的天赋和你的缺点各是什么我觉得就不要觉得自己是 CEO 觉得自己 CEO 的表现是什么就是你要考虑 CEO 应该干啥不应该干啥

就是我刚才问的比如说我哪些事我管那些事别人管其实你觉得不应该这样去考虑事情对有一个我比较好奇的问题就是你在公司里一直被大家叫做 IO 这是 Dota2 里的一个角色我去问了 Midimax 的海罗 AI 他的回答是这是一个辅助型的英雄主要是为队友提供增益和保护在团队中扮演四号位或五号位对你为什么玩 Dota2 的时候选了这个角色而且你一直叫这个名字它对你有什么意义吗确实是这样的你觉得

你就说这个角色确实是这样的一个角色对对对其实这个东西很偶然是因为那个时候其实他不是一直都是四五号位的 TI8 的时候我记得反正就不是 TI8 就 TI9 当时安娜就是那个叫上帝的小精灵其实是把他那个 IO 变成了一号位然后非常的强那个是导致他们后面得了就是 TI 的冠军当时就觉得这名字挺酷的你是有一个战队就是把 IO 作为一号位来使用这样一个创新的打法然后帮他们得了冠军是吧

所以本身这个角色的属性跟你自己的特点倒并没有非常直接的相关对就是创业这个事它还是有很多随机的行为的就可能你很难归类说我是个辅助型的英雄还是个输出型的英雄对

你觉得你比较像什么型的英雄我觉得不应该把这个传言单独看如果一定要单独看的话我觉得我肯定是那个最相信团队的最相信团队 2025 年你觉得可预见的变化是什么比较确定的变化整个行业我觉得接下来我自己觉得 AI 一个核心的目标就是那样就是刚才说的就是我觉得专业领域到达专业人士的水平这应该是一个比较实质的一个 milestone 但我不知道这个事会不会在 2025 年完全实现但是我觉得至少能实现一部分

那你觉得还是悬念的可能的关键变量会是什么我觉得变量的话其实还是是这样的就这个事它其实会比做个恰迫的其实会更复杂一点因为恰迫的话其实它的产品形态比较简单比如说假设是 A-GEN 的定义是专业领域的专业人士的水平其实这个事它不光是一个技术的事了其实是一个技术家整个产业的事它甚至可能还会导致一些社会的变化

对我觉得它其实是一个很综合性的一件事你是指的社会分工包括就业这些的变化是吗有可能吧但这个事可能不是顺便发生的它可能是一个逐渐对 2025 年你自己最期待的事情是什么可以讲三个层面的行业的公司的还有你自己的我先说我自己的我自己的话我肯定是希望自己的技术水平变得更高我其实发现的是这样的就是说最开始在创业的时候可能还会考虑一下什么管理的这些事什么之类的后面的话我自己发现其实是没那么重要的

我觉得真正重要的东西其实就是自己的技术认知是不是能够在不停地提升这个时候其实是我最希望自己能够进步的一个地方然后公司的话我觉得我们还有很多地方做得不太好我不是指的是说这个地方可以提升 5%提升 10%我指的是说我们有很多地方可以提升 10 倍还有挺多这样的地方我希望这些事我们能够变好了

行业的话我自己肯定是觉得是说 AI 这个行业的价值是说比如说假设 AI 技术不会进步了就假设 AI 技术停滞了我觉得其实肯定是对不起大家对这个行业的付出跟投入的所以这行业里面我觉得最重要的事就是说智能视频在不停地提升然后并且带来了职业的社会价值 OK 感谢艾欧今天的时间好

本期节目就到这里如果你对今天聊的话题有观察好奇或疑问欢迎在评论区分享想法这也会成为我们节目的一部分让整个讨论更完整你也可以把我们的节目分享给对这个话题感兴趣的朋友欢迎推荐更多你想听的主题和嘉宾你可以从小宇宙苹果 podcast 等渠道关注晚点聊 Late Talk 也欢迎关注我们的公众号晚点 Late Post 下期再见