We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专

110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专

2025/4/14
logo of podcast 晚点聊 LateTalk

晚点聊 LateTalk

AI Deep Dive Transcript
People
夏令
曼琪
Topics
夏令:我认为 Agent 是一个横跨软硬件领域的机会,涵盖云端 Agent、手机 Agent、自动驾驶和具身智能等多种形态。今年下半年开始,围绕通用入口级 Agent 的竞争将日益白热化,主要战场是以手机为终端的通用 Agent 产品。OpenAI、Google、Meta、字节、阿里、腾讯等巨头以及美团、小红书、理想等公司都将参与竞争。然而,对于大多数创业公司而言,机会可能在于垂直和专业的 Agent,因为更通用的 Agent 很容易面临来自模型公司主航道的挑战。Google 的白皮书清晰地阐述了模型公司主航道的边界。在中国市场,一些新公司不再采用工具型 Agent 的商业模式,而是直接提供服务并获取收入分成,因为中国客户更愿意为结果付费,而非效率付费。至于具身智能,其最大的风险并非商业化模式的缺失,而是技术本身尚未成熟,机器人大脑尚未达到 GPT-3 的水平。 曼琪:我总结一下夏令的观点:Agent 的竞争将从技术趋势演变为商业竞争,下半年将围绕通用入口展开激烈竞争,主要战场在手机端。创业公司应专注于垂直和专业领域,避免与大厂直接竞争。中国市场 Agent 的商业模式与美国不同,更注重结果而非效率。具身智能技术仍不成熟,商业化面临挑战。

Deep Dive

Shownotes Transcript

欢迎收听晚点聊 我是曼琪今天的嘉宾是明视创投合伙人夏令在 2022 年初夏令在 AI 热潮之前投资了大模型创业公司 Minimax 的天使轮明视创始合伙人黄明明后来有一次和 Minimax 的创始人严俊杰一起回忆了最初的投资故事在米哈有联创刘伟的介绍下明视第一次见了严俊杰那会儿其实大家都没太 get 到严俊杰要做什么好在夏令听懂了

回来后说这个项目一定要投夏琳同时也是文生图应用 LibriBudir AI 和巨声智能明星公司主气动力的早期投资人这期我和夏琳聊了 agent 行业的竞争形式推演在她的认知里 agent 是一个横跨软硬件的新机会

除了 Deep Research Devin 这些主要在云端的 agent 以及接下来可能会进入白热化竞争的与手机结合的 agent 和车结合的自动驾驶和机械人结合的巨声智能都是 agent 他们各自处于不同的成熟阶段和竞争形式中夏令的一个判断是到今年下半年开始围绕通用入口级 agent 的大战就会拉开最为焦灼的战场会是以手机为终端的通用 agent 的产品主要玩家是掌握超级 APP

或流量的大厂和自己掌握模型迭代能力的头部大模型公司 OpenAI Google Meta 字节阿里腾讯都不会放过这个机会美团小红书乃至汽车智能领域的理想也都跃跃欲试而在早期投资的事业里大多数创业公司的机会可能在垂直和专业的 agent

更通用的 agent 很可能会因为处在模型公司的主航道上而备受挑战模型公司主航道的边界在哪儿今年二月 Google 的一份白皮书有一个比较清晰的框架我们在节目中有展开相关图示我也贴到了 show notes 里夏令已经投资和观察到了一些不同的垂直 agent 的商业模式这也是中美差异所在在中国一些新公司不再用做工具的思路做 agent

来赚订阅的钱而是用 agent 直接做服务获取收入分成因为中国的客户更愿意为效果本身付费而不是为效率付费至于近期被朱少虎的言论推到风口浪尖的巨神智能夏令汽投资了这个行业也从他的角度讲了风险

他认为巨声最大的危险并不是朱孝虎提到的目前没有商业化的 PMF 机器人不能去工厂和商店打工而是巨声模型的技术还没有收敛机器人大脑还没有来到它的 GPT-30 克下面我们就正式进入本期节目吧

今天晚点聊非常开心又邀请到了一位从来没有录过播客的嘉宾明视的合伙人夏令来做客我们的节目夏令他一直是在关注科技和 AI 的投资他是 minimax 和 Liblib 的早期投资人明视同时也是理想的早期投资人所以整个明视其实是有跨软件和硬件的 AI 的综合视角的

夏令你可以和我们的听友打个招呼也可以介绍一下自己谢谢曼琪大家好我是民视合伙人夏令很高兴今天参加晚点的播客我也可以快速先把民视和我这边的情况给大家快速做个介绍民视我们是 14 年成立到现在 10 年的一家早期 VC

过去十年里面我们还是比较有幸一直专注在科技赛道的早期投资所以因为这种专注就像前面曼琪所说我觉得过去十年里面一些比较大的这些技术创新的机会包括智能电动汽车包括 AI 我们都还是抓到了一批有代表性的头部公司包括理想 Millimax 巨神里面的逐技文生图里的 LibLib 还有包括像虚拟决策平台的造梦以及今天也会提到的 Agent 的

爱与智能以及包括硬件里面的像智能眼镜的 Vitcher 包括 AIDC 里面的迅退一体的芯片然后光芯片还有光 IO 等一系列的项目就在过去的十几年的风险投资的生涯里面来讲的话呢我自己比较擅长的一点还是能够在不同的技术领域里面通过交叉融合然后发现一些早期的一些机会就这次 AI 的这波浪潮而言的话呢我觉得我们可以把

不同的受 AI 影响或 AI 驱动的行业打通来去看这里面包括把自动驾驶大元模型巨声 AFO science 打通来看然后从大元模型的视角从模型公司的视角去理解自动驾驶去理解巨声其实都是有一些非常不一样的这些认知第二个点来讲的话我比较喜欢把产业链打穿来看就产业链上下游一起去看

这样来讲的话从模型的视角你去看 AI 的应用去看底层的 AIDC 包括芯片通信等等这些你也会有一些新的认知因为我们今天的主题其实是重点去聊 agent 对于 agent 这一点的认知跟理解来说的话其实模型公司它的

认知的理解或者说它格局的高度是远高于应用型公司也远高于计生公司因为在我看来不管是自动驾驶公司还是计生公司其实它本质也是一家 agent 的公司其实那个就是你刚才讲了一部分你对 agent 的理解就是你认为是可以跨领域来看的

就偏软件的这种有一些 agent 对吧然后像自动驾驶像机器人其实它也是一个 agent 如果更完整的来说你会怎么来定 agent 因为这个词非常热大家都一直在讨论但我想可能目前这个阶段每个人对它的理解都会有一些不一样的地方对我觉得 agent 其实现在来说其实是一个确实是一个名牌我觉得很多人关注 agent 是因为 minus 火了是三月份的事情但其实对我来说的话我觉得一个是来讲我们投资 agent 其实是从去年的下半年开始的

第二点来讲的话我觉得 agent 从一个大家关注的技术趋势变成了一个我们所有备投企业不管是应用公司还是聚成公司都必须高度重视而且是列为一个明确日程上演化方向的一个事情其实是从 deep seek 之后

为什么这么去说呢因为其实 agent 这个概念并不是说这几个月刚有的概念对吧其实最开始提这个概念其实比较早的我觉得就是影响比较大的应该是 openAI 它其实把整个 AI 的能力它从 L1 到 L5 其实列了五级对吧这里面来讲的话就是

L1 级其实是一个 chatbot 对吧就是最开始的这种 chatgp 的形态豆包的形态 Keyme 的形态第二级来讲的话其实说白了就是一个有推理能力的 AI 的一个这个来讲的话就是最典型的代表其实就是 DeepSync 其实为什么我说 DeepSync 之后让我对这个事情有比较大的一个触动呢是在于就是当一个 L2 的一个产品

它推出来的时候我们发现它其实对于 L1 的产品是一个降位的就是你在 L1 产品里面积累的众多的 DAU 然后众多的用户当一个 L2 的产品出现的时候来讲它是一个降位的这个事情引起来的下一步就是说在这个五级分类里面 L3 是 agentL2 它只是说我能够解决问题有很强的推理能力去解决问题但是 L3 agent 指的是说

它是一个系统了它能够去解决一个任务这个任务可能是通过完成一系列复杂的问题最后构成了一个任务的解决当一个 L2 的产品出来对一个 L1 产品是一个降维打击的时候自然而然我们可能想到就是说 L3 的产品如果一旦出来那是不是又是一次降维打击

那这个就变成一个很有意思的问题 L3 的产品就 L3 就是 agent 就 OpenAI 描述的 agent 的这个 timing 是什么时间所以你刚才逻辑是说因为 DeepSeek 的出现让大家看到了 L2 对 L1 的降维打击所以在 L2 这个阶段大家已经提前在想我下一个降维打击的东西是什么然后一个大的共识就是它是智能体类的东西对它应该是一个 agent 它应该是一个能够解决一个完整任务的一个系统

对所以其实今天来讲就是说什么叫 agents 其实坦率来讲的话一个完整精确的定义是没有的但是我觉得大概它有一个雏形雏形就是说它应该能够去调用很多外部的工具与外部世界产生交互然后执行一系列的动作然后中间可能跟人也会有交互但最后完成一个人指定的任务

对那这个其实是跟之前的 L1 或 L2 来讲的话就是它其实它是囊括了之前的能力的但是它从维度上来讲又是超越之前的能力的对所以它是统一了其实自动驾驶机器人和一些软件应用的因为如果你交互的环境是物理世界的其实就我前面说的那些

如果你是只在一个虚拟世界在网上或者在电脑上活动就是大家现在可能狭义的比较讨论多的这种 agent 是的所以在我们的视角里面来讲的话一个对 agent 的理解其实它不仅仅是对于 AI 应用或者说是 AI 模型它有帮助其实它同样其实对于自动驾驶对于巨神智能这些公司其实也一样是有帮助的对它可以让这些公司提前看到一些下一个阶段它必然会发生的事情因为

你所交互的环境不一样你所需要的软件技术不一样但是你的内核其实是本质上是一样的所以为什么我们说其实跨领域去看其实是会有很大的一些收获其实也是这个但反过来说其实就是因为 timing 就是大家很关心 L3 什么时候到就是 Manners 其实这次他在评测自己能力的时候他也讲了一个 GAIA 的评测体系

其实如果大家细看的话这个 JA 的评测体系里面是分成三级的第一级来讲的话就是我基本上可能只调用一个工具甚至不用工具然后我只做可能有限的可能五步以内的这样的一个推理最后解决一个任务 L2 级来说的话我可能调用若干工具了但是是小于十步的这样的一个步骤去解决一个任务但 L3 来讲就是调用非常多的工具然后很复杂的一套任务体系最后完成这个任务

在 L3 这个层级上其实 minus 的评测指标它的完成率大概是只有 50%多从这个指标体系上来说或我包括我也跟一些做模型大模型公司的同事去碰过我们觉得比如说可以设一个初步的一个直觉的一个时间节点 agent 可能可以达到的一个效果那就是有可能在一年之内甚至有可能更激进的人可能会说是在今年年内对吧那就是无非就是今天就是 12 月份还是明年的这个时间点 AI agent

或者说是大模型公司推出来的这套 AI agent 这套技术框架这套技术体系和一个初步的一个产品它应该是有可能是可以做到把 GIA 至少可以做到 80%分以上这个样式你就说 GIA 最难的那一档 L3 的那一档做到 80%

或者说有些可能说的更加简单粗暴就是说可能 80%人类的工作他都可以去做了或者我把这个事情拆解下来就是说这个 80%有可能是 80%人的岗位然后也有可能是这个岗位里面的 80%的工作任务可能靠大模型公司他推出来的这套基于 agent 的这套能力其实就已经可以完成了而这个时间点以多家公司的预估来看的话其实就是在一年之内

其实这个事情会对于所有相关的不管是模型公司还是应用型公司甚至是对于将来的巨型公司来说我觉得都是有启发的说的再残酷些如果今天不站在 L3 Agent 实现的基础上去思考自己的业务的话

或者如果不能尽早的去思考和储备自己 agent 的形态的产品的话我觉得很有可能一年内就会被别人的 L3 agent 类的产品降维打击那接下来我们可以沿着你观察到的这个现象就是大家已经开始思考的 L3 也就是 agent 智能体的技术和产品形态来聊聊已经在萌芽的或者说我们很快会看到的一些变化

我觉得还是可以先从技术的角度开始聊因为模型能力我理解它是产品和应用能进阶到帮你完成复杂任务的智能体的一个基础首先最积极的方面是整个技术进步的这个协律还是非常陡峭的

它还是在持续拉动着整个 AI 和包括 AI Agent 的能力的提升我觉得如果我们具体去探讨这里面的技术趋势的话我觉得其实我们不妨回到一个更有框架性的体系里面去探讨我其实比较喜欢还是 Google 在今年年初其实发布了一个 Agent 的一个白皮书它在那个里面来讲的话我觉得它其实对 Agent 的尤其是 AI Agent 的能力其实提出了一个非常清晰的框架

具体的来说的话我觉得这个框架它其实分成三层如果一个 AI Agent 来讲它肯定内核它的内核是一个 model 也就是我们熟悉的这些大模型公司他们原来的最核心的这些模型的能力但是如果想完成一个任务其实是你需要有一个编排层的这个编排层首先需要告诉 Agent

你要干什么给他一些明确的一些指示目标以及这个 agent 他需要 memory 需要记忆包括长短时的这个不同的这个这个记忆和数据以及还有很重要一点来讲他要干成一件事情他要完成一系列的复杂的推理的这个任务所以其实他是需要有一定的这个规划和推理能力的然后

还有一个很重要一点既然是一个 agent 它需要跟外界环境做交互那就它一定需要使用大量的工具所以在 Google 的白皮书里面一个 AI agent 它其实包括模型一个编排层和一个工具这三大部分构成

如果我们去细看这块的话首先 model 这一层我们可以能够看到持续的预训练 post-training 其实持续的在做快速的提升以及包括他们有很强的融合的趋势还有一点值得关注的就是整个多模态的这块的进展其实非常快的尤其是比如说声音可能大家对于多模态的理解关注比较多但其实声音

其实提升的也非常明显尤其在这近半年我已经听到了很多在生产场景不是 Demo 场景里面非常接近于人的带有人的情绪口音然后甚至是方言这种非常好的这种交互的这种语音的这种模型延迟也非常的低那所以整个模型层其实是没有放缓任何技术迭代的脚步的那我们重心我们可以看一下这个编排层相关的

这里面一个是其实它就是它的记忆记忆这块来讲其实坦率来讲今天模型提供的原生的 long context 的这个能力是不够的因为不管是 OpenAI 提供的大概 128K、64K 的这个 context 长度还是这个 DeepSig 提供的 OpenAI 一样的这个 long context 的长度其实对于很多想去解决不管是通用还是垂直的这个场景里面的 agent 来说的话其实都是不够用的所以我们也看到其实 OpenAI

最近也是在发力这个 memory 他们刚上了这个功能 4 月 11 号的时候全局记忆功能对包括 Sam Altman 在推特里面也是说有可能记忆功能会是一个下一个新的一个 Skinning Law 所以整个 memory 包括我们自己的这个 minimax 它其实也是在这个 non-context 这块来讲

他想提出来基于 linear attention 的方式做 400 万 token 的海质海底捞针可以命中率特别高的一个新的这个模型其实一定程度上也是想解决这块的面向 agent 这块 memory 的相关的一些问题不过 OpenAI 最近发的这个全局记忆功能它是不是并不是基于一个新的模型就理论上它那个模型的上下文大小应该没有变化对所以大家其实都还是在猜测它到底是怎么实现的因为如果是传统的 RAG 它肯定命中率是不够的

对而且我们也能够看到 RAG 在从静态的这种 RAG 变相就是 Agentek 的 RAG 那其实一定传来说的话它到底是一个什么样的机制是一个 Context 机制还是一个 RAG 的机制还是一个什么样的机制我们也很好奇我们也很想了解

就是他并没有对外去讲他怎么做到的我感觉到了就是众多的行业里面的人其实都还是在猜然后在用自己的方式再去做尝试你被挥度到这个功能了吗我没有你还没有是吧但是我有一个创业者被挥度了而且他应该是被感动到被感动到对他被记忆功能的什么东西感动到

他为这个记忆功能对他的职业和性格的描述然后我觉得还是应该触及到他的内心就是他直接问他就基于你以前我们俩的对话你对我的一些理解然后他觉得对方说的很在他的心窝子上是吗对是他识别到他是一个 CEO 也识别到了他的管理风格和人性上面一些闪光的地方可能是我自己作为一个他的投资人也是很认可他的一些地方

我觉得可能从一个工具提出来了一个对他过往使用的记忆最后做出一个对这个人的总结我觉得这一点其实是应该是一个 wow 的时刻那除了记忆之外的话在整个编排层里面前面也提到其实有非常重要的一块其实就是这个的规划和推理能力只有他具备规划跟推理能力他才能真正的去自主的去完成一个任务嘛那在这块来讲的话我们可以看到现状是如果一个任务它是非常明确的那其实对于

agent 来说的话他甚至可能不需要具备那么强的推理能力的模型他就可以基于 workflow 的方式然后去做他的规划和推理那就是工作流的方式这个也可以给大家解释一下因为 workflow 最近也是一个被频繁提到的高频词是我可以快速的说一下就是 workflow 肯定是跟大家日常去完成一个一个人日常去完成一个任务的工作流是不完全一样的

因为 workflow 它本质上来讲其实是基于对于人的任务完成一个任务的工作流的理解把它拆解成为更细的更多步的推理的串并连如果一个人在他的工作手册上去完成一个任务是有若干步的话那其实每一个人因为他具有这样人是具有智能的所以很多隐藏信息隐藏的这个知识包括隐藏的任务其实人可以自主的去完成

但是因为毕竟现在 agent 的能力尤其是模型能力推理的能力规划能力还不够所以对于一个明确任务的情况下的话我们可以把它扩展成非常细科力度的然后这样的一个连续的推理的串并连

从而的话去规避掉现在模型不具备的这些隐藏的这种认知能力和隐藏的这种推理能力从而大大的提升整个任务实现的这种可能性以及把目标人群服务的更好所以简单来说就是它是基于模型现在的边界和能力做的一套比对人更细的 SOP 对可以这么理解然后甚至是可能不止一个

在这一个环节里面所以大家有时候会遇到一个 multi agent 的机制就是说可能因为还是因为现在这个 model 的能力不够所以可能一个 agent 他是负责把握整体的这个进度一个 agent 可能负责情感输出一个 agent 可能负责后面的一些数值的计算都是有可能的最后大家综合在一起然后去通过一个串并联的方式最后实现了这样一个任务的规划和推理

就是它也有可能是不同的模型来支持的这个是目前来看的话就确实是这样比如说可能推理能力大家可能会用 DeepSync 或者是用 Answeropic Cloud 然后可能在这个情感输出上大家可能会去用豆包的模型或者说用 OpenAI 的模型等等

其实是一个多模型 multiagents 然后串闭连混用的一个 workflow 那理论上来说如果模型能力变得越来越强也很有可能就是不需要这么多步骤了或者说不需要这么多 agent 一起来写作就有可能一个模型他就能搞定对理论上来讲的话就是说 agent 能力越来越强那你至于 workflow 的应该就由单一的这个来去做嘛嗯嗯对

但是你越往垂直领域去走的话那你肯定咱们前面说过的这个壁垒其实还是存在的这是第一点就是垂直领域想做好其实还是不容易的对第二点来讲就是前面说的你这个壁垒到底应该在什么地方你今天来讲你先发然后摸索出来一套 workflow 可以做其实一定程度来讲这是一个产品定义的壁垒或者说是一个工程壁垒

这个东西来讲随着 agent 的门槛持续下降这个壁垒肯定是会被削减的所以它的这个壁垒一定会又会建立在别的地方这个别的地方可能是平台效应可能是一个新的组织或新的这种业务流而不是仅仅就是说这个现有的这个工程本身那刚才是说了推理还有编排的能力还有一个是记忆的能力

最后可以讲讲 Agent 这个框架里面工具使用能力的大概一个提升趋势是怎样的你们有看到什么变化工具的变化其实在最近这几个月应该还是非常显著而且也是得到很多人的关注但是工具其实并不仅仅是工具本身还有包括它整个工具的一个生态其实大家能够看到就是说各家其实也都在做自己的工具然后最典型的其实就是 MCPMCP 其实就是一定程度来讲的话在去极大的扩展了整个这样的一个工具的生态

让 agent 可以触达的边界显著的去扩大但其实如果你回过头来你去说就 MCP 它 Anthropic 推的初心它并不是说是为了其他的 agent 发展的更好它推的初心是它为了让它的自己的 agent 能够用的更好然后因为 MCP 确实是具有行业意义的然后逐步又被 openend 也能够接受所以慢慢生态形成了但问题是一个 MCP 生态形成之后最大的收益者是谁

那其实还是这些 Anthropic OpenAI 就你觉得还是做模型的公司还是这些公司为什么他们是最大的受益者其实做 agent 应用的公司不也是受益吗也是受益者但是其实最大的受益者是他因为本身来讲的话就是最需要各行各业的 API 接口的其实就是做通用的人嘛嗯嗯

对吧举个例子比如说对于 Mainless 来说的话他其实是把 29 个工具据说是 29 个工具他自己做的集成在里面了因为 MCP 是一种协议就相当于比如说我是一个工具 A 对吧然后我支持了 MCP 之后 Mainless 作为一个 agent 的应用他就可以比较方便的来调我对我还是这么理

但这个事情就比如从 29 个到 290 个对吧那这个之前是有大量的开发的工程量 Miles 是 29 个里面你知道有多少他们是本来就支持了 MCP 其实 Miles 可以比较简单的调的吗还是他都是 Miles 自己写了一遍他自己在那个推特里面说他其实当时做的时候其实没有 MCP 应该还是用 function call 等等这些方式去工程化开发的那现在其实 MCP 这个生态变得更

对于 Malice 这种公司来说它就可以更方便的调更多工具对 但是问题是这个事情对于 Athropic 对于 OpenAI 来讲也是一样的我最近跟一些做 agent 的人聊他们也讲到现在有一个瓶颈就是其实你一个 agent 调很多工具比如超过 50 个或者更多之后其实你这个完成一个任务的质量也是会大打打折的就现在它的问题可能是在于说就算有很多工具支持了 MCP 但现在的这个模型的能力不支持它去用那么多工具

因为 MCP 其实它还是 function call 的机制嘛对那其实当 MCP 多了之后就 MCP server 多了之后因为还是模型要去做选择那模型该选择谁它选择对不对其实反过来说其实就是你说的这个模型能力的一个考验嘛就今天这个问题肯定是没有解决的但我觉得这个模型能力的提升它会一步步解决的

但这个就是 MCP 这个事情就是你能够看到整个我们前面讲整个框架里面各个环节能力都在快速的提升然后同时呢 MCP 又把整个 Tools 的这个生态又搭建了那这个时候来讲的话又会变成那个问题就是谁去做这个通用入口就是今天来讲的话就是尤其是在中国对吧所有的这些互联网大厂都想成为通用入口那这个观察其实已经从一个技术趋势到了商业竞争的变化

我们可以展开讲一讲就是 agent 作为一个通用入口可能带来的变化或者说你已经看到哪些公司已经有什么动作了吗对就是比如说从海外来看的话 AnthropicOpenAIGoogle 都想成为那个通用入口对吧都想借助这个 MCP 这个生态去做在国内阿里字节理想腾讯美团当然不排除将来可能包括小红书

滴滴之类的都想做通用入口我说通用入口意思不是说他们只做一个自己原来核心业务的一个 agent 而是这个 agent 是通用 agent 就是也可以回答问题也可以写个邮件也可以做个画也可以识别一些这个图片都是往通用的 agent 的方向去定位的

理想美团和小红书也有这样的野心吗小红书我这个不确定但是至少从理想和美团我觉得这个是已经是公司在公开场合明确说了的那我觉得对于阿里字节腾讯来说的话是不可能放弃的但是我们需要这么多入口因为你的注意力是有限的就你会用的东西是人会用的东西首先对其实腾讯的微信现在它其实是类似于你刚刚说这个入口

其实如果我觉得可以做个比较简单的类比就比较形象的大家可能比较好理解的就有点类似于就是腾讯的微信是这样一个如果你把它看作一个 agent 的话上面又不是很多小程序吗这些小程序其实就是你可以去用的那些工具它的小程序可能将来就是它的各 MCP 的 server 对就是你在微信上点到那些小程序

他就是一个图形界面的方式自己去调了这些工具但问题是就是说美团拼多多滴滴这些就是从以前腾讯的微信的生态里面微信的九宫格里面逃离的终于有了自己独立的流量的他应该从内心里是极度的不愿意他去回归到其他家的所谓的通用 agent 之下的九宫格里面

别人成为流量入口它成为一个被分配调动的资源对所以有的人可能是因为比如像腾讯或者字节这样的阿里这样的公司它本来就是在这个 top 的这个生态位对吧然后有的可能是既是野心博上线它其实也是一种防守因为如果你不做这个事的话你可能在新的比如说 AI 的 agent 的这个

生态里面你可能就被就被盖掉了对就是被 over the top 的下面的那种是的因为我在想滴滴他应该不太愿意自己的积累的司机美团积累的商家和外卖棋手是可以被其他家这些公司可以随意的被去调度的对吧不过对他们来说其实他们

不是也很好防守吗就是我其实比如滴滴他可能也不用自己成为这个入口啊如果别人想调就别的 agent 别的 AI agent 比如想实现说我通过这个 agent 我人跟他自然语言交互我就能打滴滴的车这件事情那滴滴不支持不就完了吗我觉得一段时间他肯定是不太会去愿意支持的对那问题是也可能会有别家会来去支持嘛嗯

我想想那我觉得换个例子可能比较典型比如说美团喝饿了比如说可能你的意思是说比如说美团如果不支持的话然后行业第二饿了他如果去支持然后让他的比如说单量变多这可能会逼迫美团去介入这个 agent 的生态对但对于美团来说他肯定自己希望还是掌控这个流量掌控这个入口对因为大家都知道入口的价值

他在上个时代他是从别人的入口获得流量成长起来他已经变成了一个几百亿米甚至千亿美金的公司他不太会希望自己又很快变成一个依附于别人的供应链整合的这样的公司你觉得我们什么时候会看到 agent 入口之争的非常显现化的表现从时间角度上来讲的话可能大家比较激进的可能是今年下半年一定程度上来讲你看又跟前面说的 agent 那个时间点是在匹配上

因为我们前面讲的模型能力一直讲的是模型会直接首先它先会助推自己的就是通用的 agent 的这个应用嘛那你现在从公开信息上就我前面讲的这个年的部分互联网巨头讲了自己的要去推出 agent 的时间点也是跟这个时间点是匹配的你大概知道比如说某些公司会是什么形态的 agent 通用 agent 就是通用 agent 的一个产品可能是放在就是放在手机上这个一个 app 但是是一个通用 agent 就你觉得大厂的这个竞争是会放在手机上而不是在电脑端是吧

因为像 Miles 这种我感觉它好像是更包括 Deep Research 还有那个 Computer Use 都是更偏云端那还是因为人群嘛对因为你使用美团的服务的或者使用滴滴服务的那你这些人群绝大多数还是在手机端它在去使用所以它这个人群更广或者说它适用的场景它就是在手机就是在移动的场景对因为今天咱们还看不到一个下一个智能硬件终端嘛对因为移动场景的网名我觉得还是比云端的更广的对因为它是

深入到你的生活的它不光是在一个办公和生产的场景对所以这里面还有另外一个问题就是说如果将来下一代硬件出来了如果说下一代的智能硬件假设是以眼镜的形态出来了这个硬件一定是一个以 AI 为核心的硬件对吧这个以 AI 为核心的硬件它的操作系统应该是一个 AI Agent 这样一个硬件可穿在设备上因为它的空间续航

性能都是有限的对吧所以大家大概率会觉得我在这上面可能大概就放一个 3B 或者说是 7B 这样一个模型而且你只能放一个模型长度内存那请问这是不是一个入口因为如果这是一个入口那其实这个入口的可选择性其实是更小的但是这个未来是不是比较远就眼镜离真的能变成下一个终端这时间很不确定吧我觉得很有可能大概也是两三年要发生的事情

那你这算可能还比较乐观的估计对不过另一方面确实我们看到大厂都在布局眼镜这种新的终端因为阿里像天猫精灵现在也在做眼镜而且他是放到就是信息智能事业群就阿里 2C 那边吴嘉整个在一起管然后字节其实也是在做眼镜

还有另外一个我觉得有意思的问题就是如果这个 agent 这个东西出来了其实它会对整个现在的这个商业模式挖过各个大厂就又会有一个很大的挑战我觉得首先比如说最突出的其实就是广告对吧因为广告是过去相当长一段时间内我觉得这个非常成功的一个商业模式就是互联网整个广告变现的这一套对

那问题现在是就是我现在都是让 agent 去工作了对吧至少是对于 save time 的效率工具型的我让 agent 去工作我人其实是不会去浏览那些信息了我的广告是不是触及的就少了你看 perplexity 你看那个豆包来说它的那个结果排序肯定不是 google 或百度给它的 API 的结果排序搜索这个比较典型对因为比如他用了谷歌的 API 或者他用了百度的 API 之后但他展示的并不是净驾排序的那个原始的排序

所以他这部分的广告收入可能就会少了我觉得对于那种搜索推荐本身这一套是面向人的其实是跟面向 agent 肯定是不一样的对于原来的你的商业模式其实是有挑战的我刚刚还想到一个问题就是说对抖音这种我本来就是需要人看我看本身我是从

那是 Qtime 我们前面讲的比如说他去搜索或者说我不管是找的是我的工作上要去看的信息还是我要找我买东西的信息这东西其实一定程度上来讲的话提高你匹配效率一定程度上还是带有 save time 的属性的对然后抖音这种它一定程度上它是 Qtime 的东西我觉得广告模式有可能会被放大的

因为它一定程度上来讲的话它的植入到上下文里面至少我已经看到有一些公司他们把广告植入到 AI 生成式内容我指的是偏文女的生成对对对它的 RY 的转化效率是比传统转化效率是要大数倍的那跟它聊天的时候这个人类能感觉到这是个广告吗那你就要看你在里面贴合的有多自然其实一定程度上广告这种商业东西包括你在 Google 里面这个东西其实不都是在体验和商业价值之间的一个 trade off 吗

你在 Qtime 这种偏文娱的比如说虚拟角色等等这个里面来讲去做一些广告的这些植入至少目前来看看到的效果是其实 ROI 还是显著高的那模型公司自己做这个东西获得收益的方式就是订阅什么主要就是

对今天模型公司就是在 save time 这一侧今天它的收入方式其实就是通过订阅在国内其实连订阅都没有几乎约等于现在约等于就是免费对吧面向通用的就是 save time 通用的在国内现在约等于免费在海外是订阅但订阅是一个好的商业模式吗或者订阅是一个下个时代 AI 时代的真正的就是高效变现的商业模式吗

这个我觉得这个是打个问号的我想说就是它的商业化变现的效率其实是肯定是没有之前广告的方式变现效率高的因为广告里其实你可以调的维度更多但当然也不是说我们今天当前就是一定在一个行业的初期就一定就会能够找到那么快的找到就是下个时代的商业化变现方式但我是说这肯定是一个潜在的遗留的一个问题因为至少在中国来讲的话通用的 save time 的大概率约等于是

那他一定会用通过别的商业化变现的方式去变现在咱们前面有讨论了说广告可能是并不是一个那么好变现的一个至少在这个领域不是那么好变现的方式其实你刚刚提到很多大公司中型的互联网公司都是想做这个方向

你觉得谁的机会大了其实上次我们聊过一个你的推演对吧你当时是有些具体的就是你觉得谁更有希望的这个可以讲讲就分云端移动端然后新的硬件对我觉得这里面来讲首先就是现有的其实比如说字节阿里腾讯包括甚至是包括小红书我觉得他们其实是今天很重要的流量入口所以一定程度上来讲的话

不会去放弃这样的机会大概率的还会努力的去争取在这个牌桌上如果放在全球的话我觉得就是在于还是谁能够在模型层面上能够拿到一线的模型然后同时又有比较好的现在的声位的公司如果这两者结合就一线的模型加上一线的声位那肯定是有比较好的机会的在海外公司里可以说是谷歌微软 Meta 这些吗我觉得谷歌首先他会自己去争我觉得微软他本身他之前想去搞 AIPC

其实一定从人家来讲也是想争这个入口 Meta 也是想争这个入口的对 Meta 因为它自己有现有的这个生态我觉得 Meta 其实手里面一直是有一系列好牌的当然这 Meta 这一直是一个很神奇的公司就是这些牌它到底能不能打好一直是一个谜

我觉得 Meta 来说它有些很多先天的优势包括过往的投入积累下来的一个势能本身来讲的话它有最好的社交的这个平台 Facebook 包括这个 Instagram 然后本身来讲在模型层来讲其实它一直以来之前一直以来是一个开源的领导者

而且虽然说最近这个 Lama4 对对对受到诟病但是从他之前的投入来看的话一直能够感觉到这个公司其实对于小模型大概就是对于 7B 的模型一直投入是非常巨大的其实比如说之前在 Lama3 的时候他训练他自己的 7B 的模型大概我记得应该是用了可能 15T

左右的这样的一个训练的数据量但是他去训练自己的 70B 的时候反而用到的更小的一个训练的一个数据量其实我一直是在想就是说 Meta 是不是他对于就是小的模型来讲他会不会有一些格外的偏好如果我自己大胆的去揣测就是我觉得可能这个是跟他在眼镜端的一些布局可能是有关的为什么呢就是因为 Meta Ribbon 是火了

但虽然说 MetaRibbon 的火跟 AM 没有直接的关系但是连野人都已经很清楚 MetaRibbon 会变成一个非常重要的有可能的潜在的一个端新的硬件中断对咱们也聊过就是说在新的这个端上因为资源是很有限的所以也很有可能会形成一个新的入口那这个端上大概率从苹果那边看到的信息包括 Meta 看到的信息大概率可能就还是一个 3B 或 7B 这样的一个模型

对所以那如果说把结合 Meta 本身自己在模型层面上的投入尤其是偏重在 7B 这块的投入串在一起的话它似乎还是在偏向于自己可能最有势能的这样的一个端测的这样的一个场景而且端测就是你刚才也提到嘛端测上它的通用的 agent 可能就是一个 OS 就是个操作系统啊

它是要长住内存的而且 Meta 其实为了让这个眼镜能够更好的去真正能够变成一个下一代的终端它希望能够脱离手机对手机的依赖因为我们今天看到几乎所有的这个眼镜其实都是依附于手机的这就变成肯定手机的主导地位或者说占据手机这个端侧的通用 agent 的这块的公司就会更有优势但是 Meta 其实是有很大的野心它其实是想会单独

绕开手机它会单独再去做一个盒子然后会绕开手机然后去成为一个独立于手机的一个新的一个终端第二点来讲的话呢就是 Meta 在硬件本身上来讲我们看到很多信号比如说它做了很多可能包括 CIS 包括就是摄像头摄像头感知芯片然后甚至包括它可能是

眼镜里面的主控芯片都是定制的对所以这个让我们感觉到就是说其实 Meta 它在瞄准着怎么把眼镜推成下一代 AI 的终端从软硬件层面上来讲都做了大量投入而且这个投入是

超前的然后像比如说模型很强的公司安斯朵比克 openai 包括国内的这些模型公司其实一定程度来讲还是希望能够包括 deepseek 就是一定程度还是希望借助是模型能力对模型能力尽快能够推出下一代的模型引领模型的发展然后用这个然后推出时代的产品然后去抢这个声位对然后反而对于腾讯对于字节跟阿里来说的话因为他本身他的声位就在这个地方是不是比如说他稍晚几个月推出

对他来说有没有那么实质的影响我觉得这个可能要打个问号我觉得整个云端的云端或者说现有的手机端这个竞争我觉得是会最激烈的对 我觉得如果说他真的这个趋势显现出来之后应该会非常激烈应该会非常有意思其实在中国我觉得有一个问题就是如果阿里也想做这件事腾讯也想做这件事自己也想做这件事那他们相互之间的生态很封闭那岂不是我作为一个字节的 agent 我能去阿里上买东西吗我能做到吗

其实现在来讲国家不是在反垄断法在鼓励大家放开吗但我觉得一定程度上来讲就像我们也讨论过的就是美团愿不愿意把他的骑手跟外卖给别人用给阿里用给字节用滴滴愿不愿意把他的车的调度资源给到比如说阿里用

我觉得这可能在一段时间内可能都是打问号的一个事情刚才其实我们讨论了一定的可能性就是说有可能他最开始不愿意但如果说这个市场里有一个别的玩家他愿意开放然后开放给他带来好的效果可能会逼迫第一名有一些调整对不排除上次我和戴宇森聊他有一个想法有点意思就是他认为在某一个技术革命的早期出现的第一个 PMF 的产品有可能是甜蜜的诅咒是一个陷阱比如说 Chadbot 就有可能是一个但是没有定轮

你觉得如果说谁能真的把 Agent 的入口这件事做成他还会是一个甜蜜的陷阱吗还是说他就基本上就可以说我觉得有点中局就已经比较中局了我觉得有点偏中局了那所以今年下半年我们就会看到中局的序幕的拉开这么快我觉得是很有可能会这么快那他的最大的变量还是取决于模型的能力是不是进化到这么

对可以这么说以及谁掌握了这个模型的能力甚至很有可能会比我们前面说的更激进一些 2C 通用 agent 的诱惑我觉得对于大厂跟模型公司来说还是太大了在模型能力甚至还没有完全突破的时候可能咱们说到的这个竞争的序幕大厂跟模型公司之间就可能已经打开了

接下来想聊一下创业公司和创投领域的 agent 的变化因为你如果判断通用 agent 的入口的竞争会很快到来那这个会怎么影响一批新的和更小的创业公司的生存空间了其实最近大家讨论比较多的一个问题就是做模型的大公司和头部的大模型创业公司包括刚才我们提到的 Google MetaOpenAI 字节阿里还有那些不做模型只做 agent 应用的公司之间的关系和边界问题

我觉得最近一起这个讨论的一个具体的事就是 GPT-4O 释放了纹身图的功能然后也确实特别惊艳包括它文字处理的一致性等等那大家就开始讨论像之前的 MidJuly 还有 StableDiffusion 大家可能已经基于这些东西做了一些工作流的 agent 包括你们投资的 LibLib 它也是一个应用那这种东西是不是就会因为 GPT 模型能力本身的提升而价值会小了很多

看这个问题我觉得肯定是就先看就是说今天 agent 的这个能力是在什么地方以及就是模型公司咱们前面说了模型公司它其实是至少它的直觉是说它在一年之内它要把这个 agent 的能力提出来就是模型公司能力的边界到底在什么地方

对吧其实是不管是说 deep research 出来之后的话你怎么去看 perplexity 和 4o 出来之后怎么去看 mid journey 怎么去看 liblib 其实是相似的这些问题那个时候的模型其实是一个打引号的比如说我们还是回到比如说 google 的这样的一个技术框架里面

Google 他那个白皮书提出了一个很好的一个 agent 的一个技术框架这个技术框架其实有助于我们去理解模型公司会干什么以及今天的 agent 的产品能力边界是在哪我觉得这个框架其实是非常清晰的 OK 就是我们前面讨论的模型本身的能力包括推理

记忆还有目标理解的编排层的能力再就是一些工具使用的能力这些可能大模型公司都会自己做了其实 Anthropic 也发过类似的一个白皮书包括 Anthropic 去年的时候它不管是推 Computer Use 也好还是推这个 MCP 也好其实你可以看到就是说在这个框架里面模型公司其实已经不仅仅只是做这个 agent model 本身了那它其实在做的事情是包括模型肯定在持续的去改善提升对吧然后推理

我这个推理模型在今年年初的时候去年年底今年年初巨大的突破本身对这块是有帮助的以及如果是一个垂直领域的公司我可能我用 workflow 的方式去实现但是现在 workflow 里面可能很多环节我可以直接用 AI 来去实现记忆本身你能够看到就是说 minimax 也好还有包括其他一些公司也好其实都是努力的在去把记忆的能力的做提升

对吧你也访谈过 minimax 它其实本身通过 linear attention 的方式对吧它可以支持 400 万的 token 然后同时可以支持非常精准的命中然后在 tools 这个层面来讲模型公司也没有闲着就是 mct

是一个典型的对吧 Computer Use MCP 然后包括 Google 自己也在做一些这个 Extension 对吧包括最才开始的 OpenAI 做 Function Call 其实它也都在 Tools 这个层面来讲的话就是工具层面来讲做很多工作所以对于模型公司来说的话它的 L3 阶段的模型打引号的模型其实是包括整个框架的其实是一个模型加一些别的东西

它的边界本来就扩展了对所以我觉得它推出来的其实可能就是一个博士毕业的一个硬件生他其实已经有丰富的知识储备然后他有处理常识任务的能力比如说让他去查一些信息做一些日常的一些任务只要是基于通用的这些工具的他都可以去做

但是一个音乐生和一个专业人士是有差别的专业人士在这套框架里面你想一个专业人士一个音乐生核心差别是在于专业人士可能这个智商可能这个 model 这层他不一定有这个博士这么高

但是他有这个行业里面的专属的一些思维方式思维方法和工作流这是一个音乐生不具备的第二个来讲的话他有这个行业里面的很多的数据跟知识包括过往的经验就类似于长短时的记忆还有个来讲他会用这个领域专属的一些工具就这些是专业人士和一个音乐生的一个区别

所以我觉得对于模型公司来说的话如果我们去看 AI 通常来讲我们会有两个 XY 轴来去表述一个是泛化性一个是精确性泛化性对应就是通用精确性对应的就是专业对吧其实一定程度来讲的话今天模型公司它推出来的是一个越来越强的具有知识推理和常识任务的这样的一个泛化能力的一个应届生

但是这个硬件生他是这就是前面说的就是模型公司有可能希望就是说把一个岗位里面 80%任务都去做了但是那 20%其实就是偏专业领域了一定程度上来讲的话就是模型公司今天再往通用去走他留下来的机会其实都是用你往专业去走的如果我们再去看比如说 4 欧这个事情来讲

也是一样的就是似乎他也一定要是去做通用的他不是去往专业去走的因为我觉得其实有一点很明确就是通用的人或者说业余人士比如像你我这种我们对于图片生成的要求恨不得是一步到位只有专业人士才知道就是成果是需要一步步来的对吧我们是其实是对于很多细节我们是不在意的我们对质量其实没有那么高的要求但其实是专业领域的人士其实对于这些细节对于质量其实是有非常高的要求的

那我可不可以这么认为就是在你这个逻辑里面其实搜出来之后它可能对吉梦的冲击会比对 LibLib 这种冲击更大因为 LibLib 我理解它是给一些比如说做广告设计的就是你说的专业人士对偏更专业的人士来用的吉梦可能就是一个 2C 的一个纹身图的应用就如果你的比如说做纹身图你的目标是其实是希望是偏向于大众吗大众的

那你今天一样就是会受到模型厂因为模型厂商的公司会从 L1 升级到 L2 升级到 L3 那一定程度来讲的话那他其实一定是在引领着这个事情那他又是面向通用的去做你受到的冲击肯定是最大的而且就具体的 OpenAI 这个例子里他自己是有产品的

它本来就是我 2C 的产品而且 4O 放了这个纹身图的功能之后 OpenAI 这一次其实没有放 API 就相当于你想去套我的壳我都不给你这个机会但我觉得它后面是会放 API 它后面可能会放吧但它这个阶段它肯定是要让这个功能是市场上的独一份来帮它增长它的 C 端客户我觉得这是它的策略对对对

但是这个事情这个产品其实对于专业认识来说就对质量要求高的人士来说的话它还是不足以满足要求的所以我觉得这个其实是从产品本身上来讲的话就是你要不然去服务专业人士去提供工具或者说你服务于垂直场景

去做 agent 一定程度上来讲它都是规避了与模型大厂自己从 L1 到 L2 到 L3 发展不管是语言还是图片还是视频就发展了主航道的所以就在我看来来讲的话就是说你距离大厂的主航道太近肯定是不利于创业公司的你怎么看 4 欧发布之后

Adobe 的股价大跌你觉得这是市场恐慌吗还是什么其实这反映了其实大家对于我觉得资本市场其实对于 Adobe 未来前景的一个看法首先 Adobe 自己在 AI 这一波表现的它要积极的去追赶 AI 加 AI 但实际上从它的实际的产品上来说我觉得其实加 AI 的效果是很差的

资本市场对这个事情的反应我觉得可能背后有两层一层来说是长期来看大家还是认为文生图这个新的 workflow 应该会对 Adobe 之前的那套 workflow 和基于这套 workflow 的所有的软件应该会有比较大的一个影响甚至是颠覆第二层来讲的话实际上 4 欧其实并不是真正直接影响 Adobe

因为我们如果看一下整个图像编辑市场其实图像编辑市场最开始的鼻祖肯定就是离不开 Adobe 的 Photoshop 它其实最开始是从专业人群起家然后逐步逐步的泛滑的然后大家比较熟悉的另外两家公司或两类公司一类就是比如说以 Canva 为代表的

那它是因为当年随着社媒起来之后那更多的市场人员他需要用到图像编辑工具他又不会用 flushop 所以他需要降门槛所以来讲的话呢就有了 Karma 这个产品的机会那还有另外就是说随着整个手机整个这个消费电子起来之后那普通的 C 的用户需要对于图像有编辑的需求最典型就是美颜所以像美图秀秀这些公司也起来了

可以看到这个产品是一个从专业人士足够泛化的过程以及还有一点就是只要你在某一个具体的需求层面上来讲做的足够深你是有机会能够拓出一片市场的还有一个很有意思的点就是这三块市场或者说这三家公司的我们看一下这个月活的情况 Fluetop 大概或者说它整个创意的套件的月活大概就是全球可能一亿多人

Canva 大概是两亿多人我记如果没记错的话美图秀秀它全线的产品线应该是两亿多人但是它的价格这三者之间是差很多的就是 Adobe 最贵 Adobe 大概可能一个月是五十多美金正版的情况下对正版的情况下是五十多美金

对一个月然后看法大概可能是 10 到 15 美金然后美图秀秀就很便宜了大概可能两三美金还有一点就是说付费率对吧专业人士付费率是最高然后看法其次美图秀秀付费率是最低的因为越是 Fancy 用户大家越想还是用免费的这个产品吧

其实 AI 热潮来了之后当然是在 4 欧之前的事美图社说还是因为 AI 这个事情它的付费是增加了很多的对所以我们回过头来看就是说 4 欧其实真正冲击的是谁呢我不认为它当前冲击的是福洛肖普

我认为他其实当前冲击可能最多的还是对于图像质量要求没那么高的可能用美图秀秀或手机上的一些图像编辑的以及包括用 Canva 里面一些对图像质量要求没那么高的这些人群一定程度上来讲的话还是偏 Fancy 用户多一些

对于 Fancy 用户来说的话大家还是希望从体验上是一步到位但是对于专业用户来说的话我们也知道一个能够满足高质量要求的产品的呈现一定是一步一步来的对那说回到 Adobe 这个事情就是我前面的观点就是在于 Adobe 的这个 workflow 是很有可能会被文生图颠覆掉的这个大家对它的信心

基于 4 欧之后大家的信心是越来越强的原因是因为 Adobe 它起来是因为尤其是 FlowShop 它起来一定程度来讲它是开创了整个图层这样的一个编辑模式基于图层加上很多滤镜等等工具的使用确定了就是说你的图像编辑的一个标准的一个范本一个标准的一个 workflow

但是咱们都知道文生图里面来讲已经没有图层了我对 LibLib 这个公司怎么看呢或者我其实觉得 4 欧这个基模它的提升之后我觉得其实是利好 LibLib 这类主要瞄准服务专业用户的这种文生图的公司去进一步蚕食格道币市场的

因为 LibLib 的用户里面超过一半用户都是专业人士的用户那这类用户来讲首先他需要基于 Laura 的生态去选择一个审美或一个风格那这块来讲是 LibLib 很强的一个平台的一个壁垒就是风格跟审美其实是很难被 4 欧这种 AS 所取代的就 4 欧不能去取代 Laura 的生态吗是的你觉得不能是不能因为审美是由人自己来决定的

他只能去学习和借鉴一个审美和风格比如说吉普利那个很火对对对但他是不能自己原创出一个所谓的审美或者说 AI 可能可以原创一个审美跟风格但是有可能人也不一定能够理解 AI 的所谓的审美所以一定程度上来讲审美跟风格还是要从现有的里面去学习借鉴和引导

所以其实整个 Laura 的生态高质量的参考图的这样的一个生态其实是非常重要的这个生态其实对于专业人士来讲的话是不可或缺的并不是 4 欧所他所能提供的但是基于 4 欧的能力以及基于 4 欧之上很大量的产品层的创新这里面包括很多交互的 prompt 等等很多还有包括 contra net 等等很多交互层上的一些创新

是可以帮助专业人士然后更好的去利用纹身图的工具去能够从而能够更好更快的达到 FluShop 的这样的效果的它可能可以帮助一个专业的设计师更快的拿出他的一个产品也可能可以帮助一个以前用 FluShop 他也就是做到五分六分但是可能基于纹身图可以更快更好的做到一个

8 分 9 分这样的一个效果所以在我眼中我觉得 4O 出来之后我眼中的 LibLib 的话我觉得它可能会更快的变成一家 agent 的公司就是 FlowShop 可能是它 Tools 里面的一环它还是基于文生图重构了整个 workflow 前面需要老软生态然后需要 agent 与人之间的交互跟反馈当然是基于更强的这样的一个积木

然后这里面来讲可能会调用各种各样的工具可能也包括 FluShelf 所以在我看来讲的话其实就是 LibLib 大概率会发展成一个 agent 的形态那这个形态的逐步的完善它一定会逐步的去蚕食今天 FluShelf 最核心的专业人群所以你刚才就是关于我们回到就这部分的最开始的问题就是 agent 的能力边界它到底是模型公司和只做 agent 的应用的这个公司它这个线划在哪儿

你觉得有一条线它就是在于人群的区分就是模型公司可能它就会针对的是更通用的人群我觉得那根线是在于模型公司它其实都是有一个做服务 Fancy 用户的野心的它会把 agent 的能力做到就是说可能 80%的任务我都可以去做如果是一个通用的任务对于模型公司来说它肯定它会去干了但是对于如果是对于专业的垂直的

他会把相当于你应用 agent 的门槛降低因为可能 80%任务或 80%的这些业务流程我直接 agent 的模型直接包掉了但是他不会下手去做自己又去做律师自己又去做一个专业的设计师他不会做

这样的事情因为就是前面说从那个框架里面来讲你越烦想去做越专业的事情对吧你所需要的 workflow 推理能力工具数据就会变得越垂直越长尾对于模型公司来说它就是越长尾那这样来讲对于它的成本来说就是会变得越来越高对它来说它其实说白了是基于一个能力然后它的泛化让它的整个编辑成本是很小的这个是它的整个产品的核心特点嘛

如果用以前比较流行的话说就是解决最后一公里的问题是吧就各行各业最后一公里最后一公里的问题模型公司不会去因为那不是他的优先级对他是想去服务的是 Fancy 用户所以我是觉得就是专业人群的工具以及垂直行业的 agent 我其实觉得其实都是这些模型公司他不会碰但是会去赋能的那在你这个逻辑里面像 Malice 这种他主打通用 agent 的产品未来的机会是多少了他是不是可能

很可能就是在模型公司的主航道上 Proplexity 和 Manus 一定程度来讲我觉得其实都是距离模型公司的主航道非常近的所以我挺关心 Proplexity 包括我类似于其他的像比如说 K-Me 等等这些公司数据的增长你关心它是因为你想去验证你的这个想法对

我想去验证的就是说一个来讲的话我很关心距离主航道的公司会活得怎么样第二个来讲的话他们本身来讲的话会有什么样的一些调整就不管 Property City 和 Kimi 至少在二月份来看二月份应该还是 DeepSick 冲击最大的一个月就是 Kimi 也好和 Property City 都还是增长的那当然不排除这里面其实是有营销投放的一些因素在但是呢市场盘子肯定是变得更大了

当然来讲就是说这个市场最大的受益者肯定还是 DeepSeq 肯定还是吸收 DeepSeq 流量的元宝和纳米然后因为海外来讲其实没有像国内这么的去卷所以至少从目前来看的话就是说这些公司首先还是增长的那我们的核心观点肯定还是说距离模型公司主航道太近的

这些企业肯定还是有比较大的风险的肯定还是要去找到他自己差异化的地方甚至是说是不是要往专业人群去走因为还是前面那个观点就是产品层面上往专业人群的产品层面上来走还是有挺大的机会跟空间的这个包括 Project City 的自己的创始人其实在很多次访谈里面来讲他其实也是挺在意这个的就是他讲的所谓的产品其实一定程度上来讲也都还是说怎么去让他所更细分的人群或他更瞄准的目标人群专业人群能够更好地去用这个产品

产品型公司你指望在技术本身建立壁垒其实确实是不太现实的坦率来讲今天所有这些公司最开始建立的是基于产品定位然后前期的工程投入是有一个时间差的包括像 Mainless 也好 Cursor 也好

其实都是在模型 ready 之前就在做这个事情一定程度上来讲还是靠的是它的产品有创意产品定位还是有一定的精准性我觉得产品公司一直以来还是就是深度是比广度重要的其实我是其实希望的是所有这些做 AI 应用产品公司不管是我们说距离似乎今天距离主行到比较近的 PropertyX City 还是说本身就是专注在专业人群领域的这些公司我觉得希望他们都还是在深度上去下功夫

而不是就是今天在广度上去下功夫服务的目标人群更精准那接下来我们可以再比较详细的来聊一下垂直 agent 你们已经看到甚至已经投资了一些机会因为我理解在你的逻辑里面其实你认为通用 agent 它还是更适合大公司或者自己掌握模型能力的公司来做

而对大多数单纯做应用的 agent 的创业公司还是垂直领域的成功概率可能会更高一点回过头来我们说就是我们可能比较关注的机会我觉得其实就核心是两个就一个是来讲还是 save time 但是你是要往专业人士或垂直场景去走的

然后另外一块来讲其实就是 Q-TimeQ-Time 其实就是偏文语类偏新的内容类体验项就是这两块是我们比较看好的其实我们前面不管是探讨比如说 Property City 还是探讨 LibLib 等等我们这个其实是专业工具其实我们聊了很多对这些都是偏帮你节省时间帮你提升效率的对但是它是面向专业人群专业场景的

今天 Trader.in.agent 其实今天现在大家也开始比较关注嘛嗯尤其是 DeepSick 火了之后有部分的原因是因为老板的技术焦虑所以老板的技术焦虑会导致的是其实最大的受益者我觉得其实是 RPA 因为老板他其实他也分不清这个到底是 AI 还是 RPA 嗯

大家只是觉得这个东西就自动化了 啼笑了对吧就有帮助了缓解了一些老板的技术焦虑对这是比较直接的因为我们看到很多 SaaS 公司开始在里面加一些 RPA 就可以比较能够去更好的获客第二块单位就是说现有的一些 SaaS 公司和一些做企业信息化的公司他们基于模型的能力在打补丁就是他以前他其实就是有软件已经在服务这些企业了

他把 AI 作为一个打补丁的工具叠加上去但是其实这都不是创业公司的机会这些其实是成长级公司你刚取的这种其实是成长级公司我觉得比如我们自己投的 SaaS 公司代表性的不管是库加勒还是神策还是一块爆等这些公司其实今天都有 AI 团队都在把 AI 的能力

和他现有的产品去做结合但其实就是打补零但他本质上讲打补零因为他没有改变原来的他这个产品的业务逻辑或工作流所以我觉得这些都不是创业公司的机会还有一点就是说我们看到美国有非常多的 agent 创业的公司瞄准垂直行业的但是我觉得中美之间其实也还是有蛮大不同的对所以如果回归到我们眼中看觉得垂直领域的 agent 的创业公司到底是在哪

其实是有一些关键的一些原则我们可以先明确的这些关键的原则其实是跟之前上一波整个产业互联网垂直 SaaS 其实是过往的这些经验和教训其实是相关的在中国大家都知道中国 SaaS 不好做垂直领域的 SaaS 更难做

一个是中国真正愿意能够为 SaaS 付费的企业非常少付费数量少付费能力有限第二点来讲的话就是说其实中国企业他通常来讲他愿意为效果付费而不是为效率付费这中国企业他能够接受的效果其实就是两个第一个你把

信息给到他不管是例子的信息销售例子的信息销售线索信息还是什么招聘的信息还是什么货物的这些信息你把信息给到他他自己去做后续的完成第二种来讲就是你把整段全部给我拿走你直接交付一个结果所以这个就导致了就是说一

你做的这个创业你大概率应该是去交付结果的而不是像美国一样或者走 SaaS 逻辑是卖一个工具的那你怎么样去交付一个结果还是要有创业公司机会的基本上来讲的话就这么几条一条来讲的话就是说你肯定要重塑之前的业务流程

因为不重塑流程的大概率都是现有的公司直接加 AI 就能干了就是 SaaS 公司加 AI 而不是一个新的 AI 原生的公司对你肯定要重塑原来流程第二种来讲的话就是比较讨巧的一些地方比如说你这个领域是比较小散的

你的对手很弱你要反过来你要想的话就是说这个领域为什么之前一直小散小散的原因其实核心源其实就是因为它非标很难结构化导致它很难规模化你要想的是你 AI 是不是这波 AI 能够把以前的一些不能标准化不能结构化的东西你用 AI 可以这次可以把它结构化标准化然后从而能够规模化这样的话你的竞争对手其实都是以前很传统的小散的对吧他们肯定也没有工程能力研发能力产品能力说去做你这个事情

第三点来讲的话我觉得还是要去做那些尽可能低垂的国事对 不要对于 AI Agent 的能力太高的期待比如说上一波互联网移动互联网时期一个例子我觉得其实就是垂直领域我觉得其实一个是满帮你说满帮其实做了一个什么事情它其实就是把信息部的小黑板

变成了一个撮合平台他就做了这一件事这是最低垂的果实上个时代最低垂的果实然后他后面也想折腾很多别的事情但其实都有非常大的挑战就是失败了很多但就是这个打底的这个事情就是我觉得特别典型的低垂果实的事情然后交付的就是一个信息的例子他就是那个货运信息的例子

对,就是车货匹配的信息,这个车你想临时去找个货,或货想临时找个车那在这种情况来讲的话,这个信息就是你要的结果,因为它也不触及整个货物的运输这些事情然后我觉得第二个例子来讲,就是举个例子比如说服装行一直是一个很大的行业其实我记得我们当时很多投资人都看过非常多的做服装信息化服装产业互联网的公司怎么样把工厂去做数字化改造,然后怎么样去让它信息化能够去提升的公司

但其实你会发现就是说让工厂去接受数字化接受信息化这个事情是个特别苦的生意特别差的生意这个行业里面谁真的把这个行业的数字化信息化做好呢不是任何一个做服装行业信息化数字化或 SaaS 的公司而是吸引这个公司

吸引就是用他的货撬动了他的上游供应商一步一步的接受他的信息化改造而且他合作的很多工厂都是通常从信息化的角度从 SaaS 角度来讲最难卖的工厂都是百人工厂工厂老板初中学历高中学历

但是吸引这个公司我想说它的核心的逻辑是在于它其实本质上来讲它重塑了这个流程你任何一个服装工厂你去上信息化上 SaaS 你干不了吸引这个事情你之前任何一个大麦抓住那一波红利你也干不成吸引那个事情是因为只有吸引把

供应链跟前端营销用数字化的方式整合起来就一定程度来讲的话它改变了原来整个服装产业的业务流程它是一个新的组织然后它的出发点其实并不是要做服装新进化本身它其实不是为了做这个对它是为了更好的卖它的货对

对吧他为了卖衣服的时候他希望小男快返不希望有库存那他这样来讲他希望他的供应链能够支撑他发现他的供应链如果不信息化的话他没法支撑他需要把他的前端的促销信息和供应链上的现在加工的进度信息匹配起来所以他自己在推动了这个事情的信息化所以我想讲例子就是说

我们其实觉得真正其实有机会的公司或者说是真正壁垒的公司其实它还是在于你能不能真的重塑整个业务流甚至是重塑这个组织这其实是一个最有价值最高壁垒的然后如果说你切的这个时候这个行业的周边玩家是小散的然后是个低垂的果实你可能更容易去起牌或者说这个切入口可能会更有利于创业公司去做你看到这些方向你现在能看到一些具体的例子吗我觉得比如我举两个例子我觉得一个例子比如说是律师

一个例子比如说是销售我觉得中美这两边其实差距都非常大就是服务律师和服务销售的 agent 对我去把它做一个对比比如说在美国不管是哈维还是做 SDR 就是销售 agent 的公司他的都是按照席位去收费一个席位大概是 2000 多美金一个月他其实提供的客户用户价值其实就是说完了我帮你节省时间他服务的对象其实都是

主流市场比如说法律这个业务行业里面的合同审查或者说销售这个业务里面的 SaaS 软件销售它做的是主流市场主流业务然后它是辅助人的它就把这个当做一个席位费比如说你可能要布置一个一个 AISDR 对那这个 AISDR 的话它是按调用量去收的

超过一定的调用量之后再额外加钱但是一个 SDR 大概一个月 2500 美金或者说一个 Harvey 帮你去做合同审查或者说包括合同的一些一些问题的确认啊或者什么之类的所以他跟这个律所我做这个合同审查的 team 有多少人没关系是吧他还是跟你的量有关系你在一个量内就比如说 2000 美元超过就在另外一家但你可能比如说聘请他之后你可能会降低你在这个岗位上的人员招聘的数量对吧因为你体校嘛所以他本质来讲他就是一个

体校你看可以看到美国那边是个很典型的还是一个延续 SaaS 工具的体校辅助人我不是为结果负责我是为效率负责对吧中国不一样中国是他是把整个业务环节拿走他是交付的是完整的结果

收的是 ticker rate 的这样的一个抽成这个 ticker rate 的抽成可能大概是从 10%可能到 30%anyway 看不同的公司或不同的业务但是我想说我们看到的类比的比如说都是法律行业都是销售行业这些在中国发生这些事情都是找的是利基市场

都是挑选的是一个很有意思的品位然后干的都是整个环节完整外包然后收 tick rate 还有一点不是辅助人他就是替代他就是替代人或者说是指导人他不是帮助一个专业人士干的更高效他是让一个小白可以干专业人士的事这是在中美之间非常大的差别我不知道这个利基市场是否涉及你们背头的机遇就这个他能讲的更具体吗比如说什么事是现在 AI 能干然后又可以完全代替人赚到钱的

对,比如说咱们前面讲哈维,他其实是核心做的事情是帮助律师去审合同哈维是说我有 700 家律所的客户我们去年年底投的爱宇智能这家公司,它自己又是个律所它这家 AAA 的公司,它自己就是一家律所它不是服务律所,它自己就是一家律所它找了一个利基市场,它有服务金融机构它把金融机构里面对私和对公的批量诉讼的案子拿出来去做

因为这里面有大量的案子是以前是一堆传统律所堆人去做的但是因为人是有成本的所以有大量的比如说小额的案子或者说是已经是很陈旧的案子是没有人去做的就银行就也懒得去找律所帮他们去打这些官司对因为律所也不会接因为律所是有成本的就主要是追账类的官司是吗各种追账违约对对这种对然后那结果是艾宇他三月份

他一个月他立案了 1.5 万起中国最大的律所可能一个月也就是可能是一个小几百起就是诉讼因为他都是诉讼对批量诉讼这是不是对法院造成了冲击啊

国家在鼓励通过法律的形式去解决这些问题那我感觉法院应该搞个 agent 要不这案子什么过来了对那是将来下一步你可以看到就是说它是一个独立的律所对然后它的律所相比于传统的律所来说可能是一个 100 倍甚至更高的这样一个提升然后它是为结果负责就是最后不管是对司还是对公它还了款然后这个里面还款里面的 30%它去作为它自己的 tick rate 对它其实就是一个律所的商业模式

其实就是律所找银行最后收的那个钱以前的这些小律所的话可能就是一个十来号人然后他只能服务一个客户然后他只能服务比如说客单价 20 万 30 万以上这种案子可能一年可能就做一个几百起甚至小千起可能是一年可能是到头了因为他的人力成本跟人效又摆在这个地方

这个公司是本来是一个律所然后它孵化出来的科技业务还是它成立的时候它就想好了这个思路这思路还挺神奇的它这里面很重要的点就是第一它是交付结果它是个律所第二个来讲它交付结果第三个来讲的话不是让那些资深的诉讼律师来去做这个业务

而是 AN 去指导那些小白甚至是有可能都没有去都不是法本的人来去做这块业务所以这个创始团队里有职业律师对吧因为只有职业律师才能出庭因为你还是有出庭那个环节然后我觉得像 SDR 这个也是 SDR 其实是一个在海外的销售流程里面是更常见的概念因为它更多的其实是判断商机然后把客户引导到后续的销售流程里面但这个事情来讲其实它并不直接产生销售结果对吧它并没有直接把那个货卖出去

所以海外的那些 SDR 的公司他只是做了这一个环节的 agent 然后最后的结果是他也只能收作息费他没有办法说我从这个商品最后卖出的销售额里面抽成因为他只是前面的一段但是我们看到的公司比如说不管是服务酒店在抖音上全 agent 去做代言人的公司还是说是做一些线上课这种线上产品的直接就是线上销售的这种 AI agent 的公司他们其实说白了就是

切掉整个销售环节的对它相当于某一种渠道代理了你可以认为它就是个代运营然后它收的钱其实就是整个销售额的 take rate 一个正常这类公司可能销售成本大概比如说在 20%那它现在只是说需要把 10%的钱给到这样的一个

类似于一个 AI agent 的代语营的公司就去做了我觉得你刚刚说的这两个例子都是比较典型的你刚才讲的在国内你去看垂直 agent 里的前面两个原则对吧就是它要么是重塑了这个流程要么是这个行业里做这些流程的本身是一些小型的不能大规模扩展的服务型的公司他们现在的模式是我相当于成立了我也是一个服务型公司但是我是用 agent 的服务型公司然后我的效率非常高我可以规模化的做很多这种

渠道的代理或者说做很多这种案件的代理对其实咱们如果说抽象一下就是咱们想技术对于这些行业的本质是什么其实技术它只是一种手段就是帮你把之前非标的非结构化的事情可以标准化结构化从而可以规模化就是这个事情我们可以再沿着这个往下设想我本来就是个比较大的律所我如果把 agent 用的很好我能达到相似的效果吗就我不自己开发 agent 我就把 agent 用的很好我能达到相似的效果

因为国内的律所绝大多数从事这类业务的这些律所就理论上确实是可以但实际上他们的技术能力工程能力让他从一个靠专业知识和销售关系驱动型的公司变成一家技术驱动型的公司这个转型是挺难的就是还是因为我前面说这个他的同行是小散对因为你想你做的是一个利基市场因为你刚说的那个例子也是诉讼里的一个细分的市场对但是其实这些行业本身来讲其实单个行业其实体量都挺大的

咱们也不能忽视说其实当年满帮就是把信息布置小黑板数字化其实背后也都是挺大的胜利比如说到电商这个领域电商代孕的公司可能有些推测的我不是特别了解这个行业也许它的数字化程度比较高比如说因为淘宝这个生态里其实有很多电商代孕的是的而且很多人以前其实是阿里的人然后出来做的

这种领域是不是可能还是本来就存在于这个领域的专业服务型的公司然后加 agent 它可能就能达到一个比较好的效果倒不一定说会有一个新的公司来做这件事我觉得还是会出来一批新的公司也不排除说之前的公司它也会转型然后继续加这个能力对但我觉得这个里面来讲就是一个咱们前面说了壁垒最高的壁垒其实还是你能不能重塑整个业务流程甚至重塑组织

对吧你是一个完全新型的律所还是说我只是原来的环节单一个环节我只是做了一个升级其实这个差别是挺大的就是比如说对于代孕营公司来说那它比较大的一个挑战是在于货和流量其实都是别人的对所以一定程度来讲的话它长期发展它会面临这个挑战就是它到底能做多大就是因为货和流量都是别人的

你做太大之后别人就会来卡你另外两点来讲的话就是说这些公司他也想做的事情就是因为大家现在都开始比较关注 Postal Train 这些公司大家在想是这个 AI Agent 的能力能不能做到自由化可能我用一个 Agent 它是可以很容易比如说做到 10%的转化率的

但是因为我有自由化这个能力我能不能在模型提供的 agent 做到 10%转化率的时候就很低门槛就可以做到 10%转化率的时候我那个时候已经做到 13%15%的转化率对吧我能不能持续迭代以及这个事情的上限有多高这是他们在思考的事情但是我觉得那个挑战还是依然还是存在的

我觉得现在看下来还有另外一点还比较有意思的点是在于有一些人间法则比较重的地方 agent 不一定适合做我前面其实前面讲了就是说 agent 最好干什么对吧其实还有一些就是 agent 最好他不要去碰或者不一定能做成的比如说海外在美国比如说财务领域来讲有很多 AI agent 帮助你做代际账自动关账那这请问这个事情来讲的话就是在国内财务的这个里面的要不要用 agent 去做

你 agent 在某些环节去打补丁是可以的但是在中国有一个很重要的一个人间法则就是说很多企业它需要两套账对那你 AI 要不要去做另外一套账所以人间法则是潜规则的意思吗我觉得人间法则是那种潜规则也好然后主观也好就是这些它不是一个单纯的技术驱动或者说是靠技术就可以解决了一个问题我觉得技术还是尽可能还是放在那些可以标准化可以结构化的问题上

如果说就财务这个里面来讲财务这个环节就有一个默认的一个人间法则其实就是它会有可能会有两套账要不要让 AI 去对账关账然后做账这个事情在美国是 OK 的美国有挺多创业公司在做但是在中国来讲的话中国还是有很多企业需要两套账的那你如果是一个 agent 的话你难道要帮助这个企业去做

两套章那这个事情背后的比如说法律风险或者说是业务风险我觉得并不一定适合真正的中国公司去做尝试那这岂不是那个段子成真吗最开始 AI 特别火的时候大家就有说什么 AI 不能替代律师 AI 不能替代会计因为 AI 不能替代人去坐牢

所以我觉得还是要挑一些逆极场景然后这些场景里面现在来看的话就是说最好来讲他能够重塑业务流程甚至重塑组织其次来讲的话你的进队是比较弱的是一些小散的对吧你能用技术解决问题你刚才讲到的就是像比如说你们投过的在法律里的这种案例还有销售里的一些案例就是他直接其实就是自己做一个服务公司然后自己用 agent 来服务这个行业

像这种公司的创始团队的创始人他是什么样的画像他们是不是比如说在法律行业或者销售领域还有挺深的积累的对其实一定程度上来讲还是懂这个行业的有这个行业经验的懂 AI 的人这种人是算很稀缺吗你们怎么找到的我觉得还是在这个垂直行业里面还是会有一些人对 AI 对技术这个变化比较敏感然后同时又对这个行业的很多生意是比较懂的那比如说像你们投的爱宇这个公司

假如说这个创始团队里有一个人可能他是法律行业出身的然后他又了解一些技术那他另外的比如说就真正能做开发的这些人他是怎么吸引到的了我们看到这个创始人首先他自己学习能力还挺强的他自己读 paper 自己在学同时他也有一个这样的一个核心的技术团队然后同时跟包括千问这种模型公司有非常紧密的一些合作就是一个汇编程的律师他本来就是个

懂计算机的律师他其实是金融行业金融行业就是他的那个律所所服务的那个客户场景他是比较了解对他非常了解的对他是懂需求懂业务的但是他是一个 AI 武装的新的律所像这种垂直 agent 的机会你觉得你们能成批量的找到还是可以怎么找到就你怎么 source 到这种

我觉得还是有机会能够成批的出一些机会的就是能够看到还是对于各个垂直行业还是有生产力的很大的提高跟带动的但是只是对于创业公司来说他需要找到这样的一个适合他的 niche 的场景对他要挑

就是这个我觉得是会有偏向的一批但是我觉得就是前面说的每一波其实这种公司最后跑出来大成的公司其实不多最后做了会大家会发现其实都是做的是低垂的过失所以我觉得还是有时间的紧迫性的先做还是重要的对吧你觉得这种公司能长多大就在一个利基市场里他通过自己其实我就掌握 agent 的方式我最后是通过结果来获得抽成的收入在中国能长多大我觉得还是有机会百亿美金的

因为之前上一波的还是有很多代表性的公司不管是满帮这种公司还是新银这种公司其实我觉得都是其实你从另外一个世界上来看其实都是上一个时代的产业互联网的公司对那我其实觉得这都是百亿美金级的公司所以我觉得其实这个时代依然还是有机会能够产生百亿美金级公司你现在是更靠这种直接收成的公司 agent 这个概念本身其实不就是代理完成任务吗这个词的本源不就是这个意思所以

加上又看到我们有一批代表性的企业其实虽然是初创企业但其实是跑得还不错然后也初步能够验证会说让我对就是能够以交付结果垂直领域的 agent 的公司其实是抱有挺大期待的对你刚刚讲那个就是垂直 agent 其实都还是帮你提升效率的那部分就你刚刚说的到现在可能还是行之有效的分类的方式的里面的 save time 的部分那 kill time 的 agent 是什么其实我觉得大家好像比较少讨论一些帮你消遣或者说消费的时间的这种 agent

你现在看到的它的形态或者说趋势是什么在 Qtime 这个领域来讲的话我们是觉得就是说 AI 还是有挺大机会的因为我们能够看到就是说比如说以心野造梦这个为代表的它其实是一个虚拟决策的互动平台其实一定程度来讲的话其实每个虚拟决策其实都是一个 agent

但是可能他 agent 的内涵跟咱们前面讲的建立在就是 openAI 提出来的建立在 save time 这个基础之上讲的这个 agent 的内涵其实是有一些差别他更多的他是不是像人一样有没有可能能够去陪伴你给你提供一些情绪价值他其实更多是以一个人的这个视角而不是以一个任务的视角再去看这些 agent 就类似于比如说可能以前没有那么多 AI 含量的时候陪伴你的东西也许是个不偶他其实不会动的

它也没有什么自己的反应那可能现在是个猫咪是个宠物那未来可能是个就是真的像人一样能真的和你让你有这种情感交流的感觉的对但是在我们的视角下就是说我们其实觉得它不是陪伴它其实是只是一个新形态的内容因为在比如说在现有的这些 Qtime 的这些产品里面是会有很多 agent 的

每一个角色就是用户也会觉得这是一个 agent 我们想说的是今天这个里面的 Qtime 里面的这些 agent 他今天他能做的事情更多是提供情绪价值而不是能够真的能够提供情感关系我觉得他今天的技术的边界在这个地方

因为你要想陪伴以这种人来讲他是要能够提供情感关系的但我觉得这个东西其实对于人的本身的情绪的把握对于你的了解其实这个东西要求包括记忆等等要求非常非常高所以今天更多的是就是用户来到这个平台找一个像人的 agent 然后即时的获得一些情感的诉求就是情绪价值是跟片段性的

可以这么说吗是的一个是情绪价值第二个来讲的话这个情绪价值可能很多是通过角色扮演的方式来去获得的对你刚说这种新型的内容对所以我为什么觉得它是一个新型的内容呢是因为这一类的内容形态或这一类 agent 它其实有一个很大的特点是在于它有非常高的参与性就一定程度来讲的话就是这可能也是少有的创作者也是消费者

消费者也是内容的创作者之前比如说不管是抖音小说音乐其实说白了都是创作者创作完之后你去消费的这一次来讲的话你是参与到创作的过程中你的每一次交互其实都是创作的一部分之前看到有一些雏形就比如说像类似于什么完蛋我为美女包围了什么底特律辨人等等就是说你可以通过选择其引导故事的主线有一定的参与度但是

那个里面来讲的话核心其实它的自由度还是受限的以及它是还是有一条非常非常明确的故事主线和编辑范围的但是其实今天这些 agent 高参与度高自由度其实是非常强的我觉得这是这一类的内容因为有了这样一个非常显著的特征所以它有机会可以成为一个新的内容形态

但是这个内容它今天的问题是在什么地方呢就因为大家都知道觉得它的渗透率它的留存度是不高的原因是因为就是今天看一个消费的内容大家喜欢的是一是高沉浸度的不管是多模态的方式还是说是剧情化的方式是高沉浸度的

就是你用文字的方式和用视频的方式肯定视频比文字更吸引人然后你用有非常好的剧本和弱剧本肯定大家更喜欢剧情化的内容所以大家喜欢的内容一定是高沉浸感的第二点来讲大家喜欢的内容其实是低参与门槛的因为毕竟你要现在要输一堆字进去其实坦率来讲你要去想象你输入这个字其实是高消耗能量的

其实大家已经习惯了就是说我是来去直接去消费的大家习惯了休息的时候打开抖音一下也不用干你就看对所以其实今天来讲的话就是说因为它的高参与度所以它是一个非常显著的新的内容形态但它的问题是在于它的沉浸感不够以及它的参与门槛是高的导致它只会在一些核心人群比较逆气的人群里面有比较好的留存对于绝大多数人来说对于你我这些绝大多数人来说其实都不是它的今天的核心人群但是

这个模型的技术是在往前发展的自然而然的它会变成一个多模态的形象它会变成一个多模态的交互剧情化也一定会逐步逐步加进来这个是和推力能力相关还是一定相关呀所以本身来讲它的沉浸感就是它一定会去提升的这是一个模型能力进步一定会必然发生的事情

第二点来讲的话就是大家能看到一定会去降低用户的输入门槛大家不会再去输入了有可能是通过选择有可能是通过说话但是选择的问题是怎么样能够让你更好的去做选择你又不想被固定的线路给框住又想发挥一定的高参与度所以这里面来讲其实对于推理能力

其实要求是非常高的所以等这个模型整体的能力提升之后就是它短板的沉浸度不够和参与门槛比较高这个问题是一定是能够看到再持续解决的随着这个问题的解决它的渗透率是必然它是会逐步提升的我觉得就是说模型能力提升它还是会让 Qtime 的这些 agent 它的体验还是会显著提升从而会持续的会把那个渗透率拉升的

这样的一个新形态的一个内容它是有机会变成一个新的内容平台的如果你用 AI 生成的是现有的内容形态比如说生成的是个短视频生成的是个小说那你大概率其实你还是逃不过现有的分发平台你还是会去抖音上会去番茄上会去起点中文网上但是你只有是一个新的内容形态你才有可能会去诞生一个新的内容平台那它会是个平台吗我听你刚才的描述似乎

其实就是我和这个 agent 之间的关系因为今天来讲大家其实是在做的就是不同公司对事情有不同的理解以一种公司来说的话就是因为他意识到今天的技术的边界所以我更多其实是做一个新的内容所以我为了满足供给方不同的需求所以我就是有不同的 agent

我可以选其实星野就是这样星野 造梦其实都有非常非常多的这些 agent 对吧那这些 agent 多了之后这些 agent 的创建者也有消费者那其实就是它现在其实都是内容平台然后有另外一种来讲它其实是它就只有一个 agent

他希望这一个 agent 能够去千人千面的去服务不同的人对因为我觉得你刚才描述那种比较远期的形态其实我想象中他好像是只有一个但这一个可能他的外形不一定要是固定的他的性格可能也不一定是固定的

其实你最终生成的那个结果就是你和他之间的交往和记忆就是你要把它做成千人千面对 其实就是这个关系本身对就如果对一个用户来说其实我是在这个上面投注了我自己的时间和心情和情感我生成的内容是这段关系本身对 但是其实这个事情今天的技术挑战是更大对 但现在技术可能达不到对 就是我前面说的就是让他就说快速的去给你带来一些情绪价值是可以的但是你让他给你带来情感关系是难的

对我说的那个其实有点接近 her 的那种状态对那个是难的那个是今天其实很难达到如果你想远一点的话那其实这两种 agent 我觉得会合并就如果说我有一个类似于 her 这种其实我对她还挺信任的然后我跟她关系也很深的一个

好像理论上生活上的很多节省时间的时候我可能也会让他和我一起干比如说逛街买东西因为如果你要招一个秘书的话一定需要这个秘书你对他有极其的信任那这岂不是也是个入口吗也是个巨头必争之地吗

还是巨头也许最开始会不认为这是他主航道上的东西我觉得这个的技术挑战就是可能会比从 save time 这边切过来的技术挑战可能会更大一些就因为其实要技术到一个比较晚辈的状态才能到我们刚才对如果你变成就是说你要需要他跟你先建立情感关系建立极其深厚的信任关系这个事情的难度和我现在就可以明确告诉你我可以做哪些通用的任务这相比来说我觉得前者难度还是挑战还是更大的

那我现在帮你做通用任务的 agent 是不是至少我觉得移动端上啊就手机上这种能帮我做通用任务的 agent 其实未来也有潜力可能发展成跟你有深度关系的 agent 就随着模型能力提升但前提是你可能要先和一些用户先建立连接就也许最开始你跟这个用户的关系就是一个无情打工人的关系啊对你就帮这个用户干活的关系但虽然模型能力提升可能你跟他是一个更深度的关系对对对我们其实那个想的其实是一个偏中级的情况吧

然后平台的就是要渗透率提升就是你刚才说的就模型能力的就往下一代迭代包括它的推理记忆然后使用工具都提升这个事情的用户体验其实是一个强技术驱动的这是第一点第二点来讲的话就是说基于模型能力的提升带来的体验的提升这个事情的优先级其实是比你在内容平台上持续去提高低智能水平的供给更重要的其实这又回归为了前面那个逻辑嗯

对就是在一个 AM 模型能力今天在持续快速的往前发展的阶段情况下的话首先要先要确保的是你的产品能力是建立在最新的模型能力基础之上以及不要在下一代模型能力出来之后你的模型能力代表的产品体验是存在着降维差异的接下来我们可以讨论一下巨声的 agent 其实在很多人的语境里没有把巨声算成是狭义的 agent

不过民视是比较有跨软硬件的视角的关于巨深近期也有挺多热门的讨论比如最近朱孝胡有一篇访谈是在讨论 i 投资的那里面很重要的一点也是说他们之前投的一些巨深的公司他们现在已经在退出了因为他们特别不看好巨深智能这个方向觉得它离商业化还非常远

因为你们其实也投了一些巨声的公司比如主记那你是怎么去看巨声这一类 agent 的成熟度的如果内比我们就开始讨论大圆模型的能力也就是从聊天机器人 L1 到推理者 L2 再到 agentL3 那巨声里所谓的 agent

L3 到来的时刻大概还有多远会是一个什么样的节奏表我觉得因为朱老板一直是一个就是投资业绩秉然同时这个又一直以来颇有争议的一个人物对也是我们投资行业的大佬我觉得我看过他的这个采访之后我觉得其实他对于整个巨神智能里面现在一些商业化现实的描述是符合一定现实的但是他对于巨神智能或者说人形智能机器人这个

不看好这个结论那我肯定是跟他持一些相反的这个意见的那我们可以先看现状就对于巨神智能来说在过去几年肯定受益于 AI 在快速的发展但是今天巨神智能它的智能化的水平坦率来讲它其实都没有到

类比大圆模型的 GPT-3 那个 moment 为什么呢就是大家为什么会把 GPT-3 moment 作为一个当时大圆模型发展一个标志性的一个 milestone 一个里程碑那原因是在于那一刻让大家能够看到了智能的泛化性可以通过 skinning law 的方式去实现但是你今天对于最新智能来说预选链部分其实今天来讲是没有收敛的

就是怎么做预训链能让你比如说有更多数据就让它效果更好这件事情是没有被验证的没有找到那个方法预训链没有收敛的意思就是说我该从哪些地方获得海量的数据然后用什么样的方法去做加工然后会用什么样的算法体系然后能够让它实现泛化性而且可以死给你老所以巨生你认为巨生的真正问题并不是说它现在表象上的这个阶段看起来它没法商业化

这不是他最本质的问题最本质的问题是他还没有找到一个可以去 scale 可以去泛化的东西因为今天的巨声过去几年的发展一比如说在硬件层面来讲肯定是往前迈进了一大步尤其是工程化的成熟度迈进了一大步对吧不管是四足双足包括可能今年的话林乔手也会迈进一大步

然后从算法角度来讲的话它不管是从模仿学习还是强化学习的结合其实也是让它相比于之前的工业机器人也好服务机器人也好其实都有一些智能化水平的提升但是泛化性这个尤其是大规模场景的泛化性上其实还是没有本质得到解决的

这才是这个行业最大的危险对就是我们不希望我们做出来那个下一代的机器人跟上一代的机器人一样就变成一个一个垂直行业的继承商至少在中国这个市场环境下做继承商是一个挺苦的一个生意或者说它本身从商业角度来讲的话就会遇到比较大的挑战

对那所以其实今天不是说市场上没有需求而是说今天的技术成熟度它可以去实现的商业价值我觉得其实是跟大家的预期其实可能是还是有一定的差距的那你觉得最先这种 agent 解决这个问题的出路你们看到了吗包括你们也投了这类公司如果解决不了的话那怎么办

我觉得现在其实是个信心的问题今天来讲的话就在整个巨声而言我不排除基于现在的硬件基于现在的模仿学习跟强化学习是可以找到一些利基市场的 PMF 点的但是这个肯定是因为今天的技术水平咱们前面分析到整个的智能化水平摆在这个地方肯定跟大家的预期是有差的

所以在朱老板的眼中他今天确实没有到 PMF 或绝大多数的场景下都没有 PMF 所以我觉得更适合的是在我们自己的口径中我们觉得他今天是一个如果从一个技术从最开始的科学发现技术突破工程化的复制最后到一个产品的一个落地是有四个阶段的话我觉得对朱老板来讲他可能喜欢找的是从工程转产品的阶段或者是产品已经是 ready 的阶段但今天来讲的话对于整个巨神来说的话他是一个技术转工程的阶段

或者对于大家期待的来看且不论说是不是进家庭就是即使是去工厂还是说去服务业是一个技术转工程的阶段它其实是一个 technology 跟 problem fit 的阶段而不是一个 product 跟 market fit 的阶段所以这就导致来说的话你想找 PMF 的公司市场上绝大多数讲的故事可能是主要版不白印的我觉得这个也正常所以我觉得这个事情相当于是今天是一个半杯水的状态对吧你如果说是对于

你今天是希望就是以 PMF 为导向找那确实找不到但是如果是你是对这个事情长期有一个预期你觉得我今天投的投资其实是一个 TPF 的一个状态我投资就是一个早期科技项目我对于它将来的技术能够实现突破我有信心我同时有那个耐心愿意去陪它在它的商业化真正的商业化可能需要三年五年甚至更长的时间那我觉得今天也是有很多企业是值得去做投资的

那回到我那个问题就是从这个你刚刚说的技术到工程的阶段实际上它能否转化是有一定未知数的然后你们愿意投是因为你们相信它有可能能转化但是如果它不能转化了

或者说它在一个时间段能不能转化比如说三年到五年它都没有走完从 T 到 P 这个行业会怎么样了居身这种 agent 会怎么样因为我投逐技的时候其实也是 2022 年的 8 月份其实那个时候也是因为看到了 minimax 的第二代的就是端到端数据驱动的模型在文本领域来讲的话效果是非常不错的所以你就在自动驾驶领域看过在大元模型领域看过你自然而然的话就会类推说下一个领域是什么于是我就从 AI 驱动的角度

找到了主记忆这是我当时最朴素的方法和逻辑所以一定程度来讲的话我们肯定是 believe 说这个事情它是可以在未来两三年之内走到类似于 Chad GPT-3 那个 moment 的这个事情的依据坦率来讲是跟前面咱们说对于大语言模型公司来说他今天看到了 L2

大家都在追 L2 大家会预计一年之内实现 L3 一样其实都是业内的这些人的直觉我坦率讲是直觉就是你跟这些从业者跟这些真的在技术一线的人的交流之后他们的直觉传达给你的信息他们的直觉和他们的信仰认为到 GPT-3 Moment 找到了预训练的可以 skilling law 的方法这个时间点他们觉得在两到三年之内是可以找到的

那问题是就是如果找不到那确实巨神就是就会变成真的会变成一个巨大的一个泡沫那确实是有一个泡沫破裂了一个巨大风险的我前面讲就是说这是个半杯水在这对吧那确实有可能倒不了满水那你要不要去赌一个所以这个就是也包括另外一个层来讲就是你的投资风格跟投资喜好的问题那比如说

我们投这个项目一定程度来讲还觉得这是一个特别巨大的一个机会我们在特别早期的时候出手想去博一个这样大的一个机会一定程度来讲的话从我们的投资的思路跟理念上来讲的话其实是符合的是可以承受这个风险然后最后的话就是想你可以分享一下你最近看到比较有意思的东西包括比如说项目啊

书或者作品都可以赢我觉得看 AI 应用其实确实是看的重心比较多然后我觉得软硬件的应用其实是都在看软的层面就像前面说的确实是偏 2C 的是非常 open 的心态在去看在 2B 领域来讲的话我觉得就是更偏重那种专业人群和垂直领域我觉得其实一直是有很多

新的项目能够去涌现出来我还是对于高潜力的创业者我还是抱有非常大的期待和耐心的过去这一年多时间里面还是看到挺多回溯互联网跟移动互联网的这些书包括什么沸腾 15 年然后也包括可能讲美团的类似于什么九败一胜等等这些

其实我觉得都是非常有启发其实这个点是在于还是要对于年轻人是要有信心的尤其是高成长性的年轻人就会有抱有更大的期待和信心所以会在他们的身上花更多的时间年轻是以什么来识别的我觉得还是成长速度就是 AI 这么快的发展速度情况下这个创业者一定是比 AI 本身行业的成长速度还是要更快的

所以如果三个月之后你跟他聊这个人没有什么显著的变化其实一定意味着就是说这个人其实生长速度是不快的我觉得另外还有一个就是因为我们其实今天这个市场上发生的很多事情其实历史就是有一些重复的比如说

开源的事情很热的时候我觉得比较受启发的还是去回顾一下之前安卓的开源和上一波数据库的开源所以我觉得看类似于这些类似于安卓传奇和包括 Pincap 也是我们备头企业自己写的 Pincap 写的与开源同行这些书其实是你看过之前的一些开源的那波开源的企业和开源背后成功的原因以开源真正的价值你才就会看到今天比如 DeepSeek 干的开源的事情其实都是有启发的

具体的启发是什么就开源这块你得到的具体启发是什么不是开源就一定会赢赢的原因其实都是在开源的水下以及开源的意义到底是什么目的是什么对于那些数据库公司来说它开源的目的是因为它是一个整个公司业务系统非常核心的一个环节

它的上游跟下游其实都是非常复杂的所以它需要用开源这个方式去把上下游所相关的这些环节的生态全部融合在一起降低客户部署成本它背后成功和推动的原因其实是整个这个事情的在匀化然后屏蔽的很多硬件底层

对安卓来说的话它也不是说它开源即使是它是在 Google 出购之后开源的也不是开源就成因为它最开始 Google 讲开源这个事情的时候没有手机厂商响应的它最后它能够成其实也是后面是因为 Google 是一家互联网企业第二个来讲 Google 有那个时代互联网企业里面非常核心的一些关键的应用以及最重要的事情是 Google 有这套基于广告的商业化变现方式在扶持着这个生态当时有很多人也想去做操作系统

但是你怎么样吸引开发者苹果靠的是先发靠的是硬件的领先但是只有 Google 有方法就是用它更好的商业化激励的手段就是广告这套变现的手段才吸引了整个这个平台的生态苹果是到直到 2013 年它才跟进了这套广告的这套

所以其实对于开源来说其实它一定程度上来讲还是为了能够我基于开源的产品能够形成自己的一个飞轮效应对于数域部开源来说它的飞轮效应是在于我的开源软件然后我丰富的应用场景让我自己这个产品的实际的可靠性更强适配成本更低产品体验更好形成了这样一个飞轮

然后对于安卓来说开源之后建立了应用者开发生态和应用及客户体验之间这样一个飞轮但它在飞轮之间离不开背后 Google 的整个商业化的依托所以对于我们今天去评估任何一个开源包括 DeepSafe 开源其实核心在于它的价值是在于它能不能形成这样的一个生态的飞轮单纯模型开源来说其实是

有挑战的,因为模型和实际的使用来说的话,其实是中间差了一层产品。中国还有另外一层复杂,是在于中国的机构设施是异构的。模型的开源其实是有助于异构的这些机构设施,生态对于模型的兼容,这块其实是有比较大的作用的。也就是说,你怎么去看待 DeepSync 开源的意义,以及是不是它开源之后,

就是什么样的地方可能对于现有模型公司是有影响的但其实那些地方其实是并没有实质影响就有一个我觉得比较明显的影响可能是开源本身带来的一些影响力技术影响力是实质的影响对招人有助于人才的吸引对其实没有实质影响的意思就是说他并不会说因为这个模型他开源了而给新鲜领先更多的

人去用开源模型就一定会意味着这个开模型就会得到更好的飞轮的反馈从而自然推导出说它会有下一代更好的模型对因为这个其实在大模型的开源本来就不太成立因为社区的反馈不太可能帮你把这个模型迅得更好那今天非常感谢夏令做客晚点聊跟我们分享了他关于 agent 的一些观察和洞察

总结来说的话我觉得夏令是比较看好垂直的 agent 因为你认为就是在做通用大模型公司的主航道上也就是我把模型的通用能力推得更高这个方向上去做新的创业公司其实是比较危险的那可能在垂直的领域

你做最后一公里你把结合这个行业里的专业数据和一些 know how 去做产品是更有壁垒和护城河的那我们也推演了一个可能下半年会发生的让人觉得有意思和兴奋的场景就是各个大公司都会来争夺 agent 的入口

那这件事情的一个表达的变量就取决于模型的能力能提升到什么程度是不是像大家说的可能在今年底或者到明年初的时间就能真的达到 agent 所需要的模型能力的状态今天谢谢大家的收听各位拜拜再见好再见本期连点呈现继续讨论一下和之前一些节目相呼应的点

一是 agent 的核心能力在 1077 与戴宇森聊 agent 的那期节目中他总结了三个核心的能力推理编程还有工具使用这期我们从 Google 提出的 agents 框架对 agents 所需的能力做了更多的补充除了推理之外 Google agents 白皮书里还提到了很重要的一个能力是记忆最近 OpenAI 也刚刚发布了全局记忆功能这可能是 AI 助手从工具到与人建立更深的关系的重要一步

而更深的关系本身有可能成为一种壁垒理论上你用一个 AI 越多它关于你的记忆越多它越了解你你用它也就会越顺手越离不开它

在工具使用的部分,除了模型本身的能力提升之外,这期我们也比较多的讨论了 MCP 等工具调用协议的生态变化。Answer Peak 最初提出 MCP 是为了让它自己的模型能够更好地去使用更多的工具,而目前 MCP 已经是一种相对主流的工具调用方式,OpenAI 也在近期宣布了未来会支持 MCP 生态。

二是关于下一代硬件终端在 109 期和卡斯克聊他是用 AI 的体验时我们最后聊到的一个话题就是现在还看不到新的硬件终端如果还是以手机为终端 AI 应用创业可能很难逃出大厂的阴影

而这次夏令讲了他对 Meta 的一些观察 Meta Ribbon 的产品更新定制芯片的一系列动作以及在 7B 等小模型上的格外着力似乎都寄托着 Meta 对眼镜成为下一代终端的更大野心其实在中国的大公司里阿里 字杰也都在模型和眼镜一起做尤其是阿里的开源模型系列里也有很多小尺寸的模型

眼镜是否有望成为独立于手机之外的终端是个分歧很大的问题从目前的体验看它似乎很难接班手机但另一方面这个领域的创业公司也层出不穷大厂也都在发力在黑妹时代可能很难想象 iPhone 而在 iPhone 之前苹果也有不成功的涨商电脑产品刘顿如果真的有新终端属于新公司的 AI 机会会被大幅扩展但它到底是什么答案还在迷雾之中

下期再见