欢迎来到 Indigo 数字金箱的新栏目 Indigo Talk 我会不定期的邀请朋友们来和大家分享科技趋势的新思考
歡迎回到 Indigo Talk 這是我的第 18 期也是在中國農曆新年前的一期這一期我要請了兩位新朋友他們是來自硅谷的 Virtual Capital 他們做風險投資的一位是 Jay 一位是 Jenny 一會兒我讓他們待會兒自己來介紹一下然後今天還是有我的
这个我的播客的搭档 播客搭子一会儿来参与我们今天的交流然后我们今天可能主要的话题在因为 2025 年刚进入嘛这一月份已经非常非常精彩了对我们才过一个月 2025 年这个开篇我觉得我们需要注意然后呢在今年大家有一个最主要的嗯
話題說是 2025 年是 Agent 的正面代理或者叫智能體所以我們今天的話題會涉及到這個然後 Lialis 的 Capital 的他們的投資的方向可能也很多的是在 Agent 方面所以我今天特意邀請到了他們很榮幸的邀請到了他們來參加我今天的這一次對談
好吧 那我们先邀请 Jay 来介绍一下自己 好吧 OK 谢谢 感谢 Indigo 谢谢 Homing 来 host 我们我们是 Lionis Capital 在 July 3 做早期的科技投资
第一基金是在 2021 年的时候创立的主要的一些 LP 更多的是 Engineer 在 AI 的大厂在英伟达在 OpenAI 在 Meta 还有 Google 但是我们其实想的一个 thesis 就是说在那个时候 TradeGVT 在正式 launch 之前的时候其实是有一个比较
不然讲明显但是比较早期的一些这个 trendsoftware 变得更加的智能化然后其实对于投资来说的话其实有蛮大的一些 implication 有一些潜在的意义的
那我们作为我的背景更多的是风险投资主要在硅谷的话就有了 12 年的稍微多的基本上我们觉得如果说我们用另外一种方法去找新一代的创业者或者新一代的 AI first company 的话其实是会有比较大的差异化的从而可以给创业者带来价值可以给投资人带来回报
那在之前的话比较幸运的话就是我的经验主要是在美国的 Enterprise SaaS 投了像 Enaflan 还有 Marketa 也在同时会服务过几年但是我们在第一个浪潮的时候其实也投了一些 Consumer Company 像 Airbnb 这可能大家都知道的比较多一些但是一个我觉得在硅谷可能过去 10 年的好处在于说我其实经历过两个 cycle
等會我們看到 HT 聊到就是這個 cycle 還是比較明顯的然後它的 evolution 還是比較顯著的然後我們在想 Leonis 其實定位其實就是一個非常怎麼講 就是以研究為主導的一個這樣子的一個早期的投資區 我覺得我們必須
不能要跟不能要跟风那必须要有 commission 那这 commission 从哪里来那等会我们会聊到为什么会对 tech stack 这个领域我们会怎么 access 我们为什么对 researcher 的这个研究对 topic 这么感兴趣那另外一个合伙人 Jenny
好没问题对特别感谢 Indigo 和 Hong Ming 的邀请然后我和 Jay 都是 Leonis Capital 的投资人然后我们是一家研究导向型的基金在硅谷做早期投资我自己的背景呢比较奇葩
我是小的时候在美国德州长大然后后来又回国上学因为小时候不会不怎么会说中文然后也不识字所以就被爸妈硬是送回了国内读初中和高中然后之后去香港大学读了本科本科之后呢我又回到了美国在哥伦比亚大学读
嗯读博士然后在读博士的期间呢我就已经开始跟 OpenAI 合作了然后呃我是 2017 年的时候在 OpenAI 还是一个非营地组织的时候就跟 OpenAI 有很多的合作包括当时一些模型的发布 GPDR GPT-3 呃我在呃博士的第一年结束的时候 OpenAI 正好从 Microsoft 那里呃融了一个 billion 的资码然后当时我就呃
就相当于说 take a leap of absence 离开了疙瘩去加入了 OpenAI 成为了 OpenAI 的一个早期员工但是我在 OpenAI 待的时间也不算特别长了当时的 OpenAI 主要是负责模型的评测差不多一年之后呢 OpenAI 发布了 XGPT 整个 AI 界大火
我又在 TrendGPD 发布之后一周就离开了 OpenAI 跟 JHK 做 Leonis Capital 我在 OpenAI 最深刻的一个感受就是风险投资界和
科研界有一个非常大的鸿沟很多时候投资人能看到的整个世界是落后于研究者差不多三到五年的我对于这个感受非常非常对 是的我感受非常之深我在 OpenAI 的 Chad GVT 发布
在 2022
22 年的 7 月份我跟一个 VC 朋友吃饭然后他们对于 AI 的认知还是说就是这种之前老一代的 Machine Learning 的 AI 模型而对 LLM 是完全没有认知的包括现在大家 VC 去聊啊
AI agents 或者 AI 应用的时候对于 AI 的科技的认知还是落后于研究差不多至少两到三年的而我们基金就是想要弥补中间的一个空缺从技术层面去了解市场的发展方向然后以此去进行早期投资
那我理解这个就是 research 背景的就是我们把之前在 AI 这个行业里面 research 的往前看的看得更远的这样一个经验带到我们的商业世界带到现实世界出来然后就发现有可能下一代的这些产品或者这些创始团队是什么样子非常棒
我稍微补充一下我觉得其实 Jay 和 Jenny 的介绍还是比较谦虚的首先是 Jay 和 Jenny 是硅谷 Emergent GP 里面非常 promising 而且我跟 Indigo 之所以特别特别想邀请他们俩来做分享除了因为他们的投资业绩很好包括他们这些新的基金和过去的业绩都很好之外
还包括他们前段时间做了一个这个分享,然后所有我们听过的人都觉得非常的好,然后呢正好刚刚 Jenny 也说到嘛,就说你感觉到的是说这个投资人可能对这个行业的理解可能要滞后于研究界三到五年,然后我的感觉是什么呢?因为我过去年跑贵乌跑得比较多嘛,所以我其实更好的能够感觉到,
国内的人的这个关注点和硅谷的关注点呢不一样我觉得有的时候这个关注点的不一样呢不一定是说这个新闻我们看不到然后我的感受是在硅谷你会更知道给什么样的更新打上多大的权重
对就比如说我们看到一样的新闻但是我到硅谷时候我才知道哦原来这些新闻对研究界的朋友对吧对美国 VC 的朋友是更重要的所以我觉得这个对我来说很有意义啊我这边已经是一个凌晨两点多了但我是强烈坚持我一定要来听这个就是因为我也很想再听这一课这里再分享一点
對 謝謝另外的話我覺得其實因為去年我們旅行還比較多我們 Buffalo 公司的話有一部分是在灣區但是也有一部分是在紐約然後也有的是其實在歐洲但是一個比較大的體感就是說即使是在美國國內的話
对 AI 的讨论还真的是湾区会最集中因为很大部分原因在于 Research Institute 还有 AI 公司主要都是在湾区甚至到纽约的话或者是到别的 LA ecosystem 很明显的话就是都不要说就是要跨洋的这种
而且我们之前还谈到 AI 的速度是非常非常快的其实我们前几天刚刚做了 report 但是做完 report 之后马上就真的真的就是说在这个
在这个播客开始前我们在讨论就是说他们一个月不到一个月前做的分享然后这两周有很大的 update 的工作我先说一个我对你们分享中印象很深刻的事情就是我想咱们先从你们对 24 年的你们 24 年年初也作为一个展望就能不能简单跟我们讲讲你们 24 年初的这个展望以及这个展望你觉得到你们这个时间点来看哪些对了哪些错了嗯
对 我觉得 24 年的时候我们做了一些展望我觉得对于在 23 年年底 24 年年初的一些展望其实在 24 年这 12 个月当中得到了很好的实现然后其中一个就是我们认为 AI Agents 这个发展方向会发展得非常的好这个方向的应用会逐渐涌现出来现在大家可能会觉得所有的应用都是 AI Agents
大家都会有 agent 的影子嘛但是在二三年年底的时候那个时候大家还在聊就是看差 GPT 啊差 Bot 的时候我们就已经在看到了 AI agents 是下一个发展点然后已经预测这个领域会发展得非常快然后另外就是我们在二二
23 年年底的时候预测 24 年会出现就是垂直领域的应用在 23 年的时候也是完全没有在 24 年就看到了很多包括医疗金融等一些垂直领域的应用然后最后一点也是我们比较骄傲的一件事就是我们在 23 年年底的时候预测 23
嗯
还有就是因为我们比较喜欢 share 我们的一些 research 报告其实很多 foundertranslator 他们在想考虑某些领域创业的时候他们会做 research 那很多时候他们的 research 是一部分是 technical research 还有一部分就是 vc opinion
VC Viewpoint 是這樣的所以說我們會把我們之前做的報告放在我們的網關網上面大家可以回去看一下這是這裡 Ginny 講的我們當時做的 State of AI 在 2024 年做的這些預測或者
趋势判断的时候其实里面有一些 nuance 的东西就在于说比如说 AI agentAI agent 这个概念或者这个 topic 我们记得很早是在 2023 年的时候就做了一个 specialized 的一个 deep dive 但是我们没有投
AI agent 的公司很大的一个原因就在于说但是其实我们看到有潜力的但是其实有很大的一些 limitation 到 2024 年的时候特别在下半年
很明显的一个感觉甚至从第二季度开始很多 VC 很多 Founder 都是 over excited about your agent 就一旦这个 Buzzword 起来之后的话就我们觉得有很多的公司就会变成一个 fake AI agentfake agent 公司来去融钱我觉得其实在早期投资的话特别是就没有任何好的信号的情况下总值期总值前
做这样的 research 能够能够让我更好的去跟 founder 做更好的技术上的交流还有一点的话我可能先补充一下就是这个 time gap 我们一直说我们为什么做这个 research driven 的一个投资理念呢就在于说它并不是一个相当于直线性的一个 translation 它更多的是说像 research community 他们讨论的东西
比如说后面你刚才说,比如说中国到美国或者说是中国到欧洲或者美国到欧洲这样子的一些 difference 其实 research community to Jenny's point 跟 VC 跟 computer 也是有一定的 timelapse 那对于我们来说的话,我们希望 utilize time machine advantage
比如像 AutoGen 最早刚出来的时候其实在 research community 或者 early adopter community 才能获得
在 VC 其实没有太多的 discussion 但是对于我们来说的话我们觉得是很有意思的一个 topic 是有很大的 potential 那么在那个之后的六到九个月的时间我们会去做 market mapping 我们去尝试了解这个 tech stack 更多的一些
还有未来的潜力这个点之所以很重要的话就是在于说每一代新的创始人出来的时候他之所以能够建造一个 10X better50X better 的 product 一定是在于说至少以技术投资来说一定是在于说他有一个 tech stack 一个新的一个 tech stack 他可以利用到最终的用户带来一个非常强大的非常 appealing 的一个 ROI 的 profit
我有一个问题因为刚才你提到了 2024 年有个转变就是说你们可以看到 agent 在 2024 年下半年开始非常热的然后这里面也提到了有很多公司就称了这个 buzzword 然后这个热点然后如何区分这个公司做的产品是真的 agent 还是他就是为了称热点
然后呢你刚提到这个 TaxDag 在 agent 和 TaxDag 这个什么样子因为我以前也做 TaxDag 我对 TaxDag 是比较敏感的这个概念什么样的 TaxDag 可以称为这个公司是真正的 agent 公司
我觉得其实真正的 agent 的公司和 LM 的公司之间的界限是非常小的但是最大的一个区别就是 agents 的公司他要考虑到这个模型他要在现实的网络上面去 take action 他不仅仅说是我梳理信息而是我最后要做出决策然后这个决策可能是直接影响到业务的比如说一个 KYC 的 AI agent 对吧
他可能就是直接去网上搜集了用户的信息然后就要给这个银行或者是金融服务平台说这个人我们到底能不能给他提供服务还是说这个客户我们要拒绝他因为他没有过我们的审核就这样的一个决策是之前的 AI 模型所不需要的
不需要去做的然后因为要做这样的决策然后因为这样的一些决策涉及到法律涉及到各种合规的问题所以说这个 AI 它不能有 hallucination 它不能有幻觉然后它的精准度要比之前的 AI 要高非常多然后因为有这样的需求所以整个 agents 的还有那个 Texa 跟以前的是不一样的以前的可能就是说我这个模型加上一个
back to database 对吧你直接捡走信息就可以了现在的 Tech Stack 是不一样的大部分都是需要很多个小模型一起合作一个模型搜集信息一个模型处理信息然后最后还有一个模型进行这个评判然后最后还要有一个模型是专门去做决策和专门去做就是把 implementation 就是把这个事情给落地落实下去的所以说它对于这一个 Tech Stack
就是跟上一代的就是 LOM 的 AI 公司是不一样的
嗯了解那正好现在比如说我们在 2024 年下半年第 3 第 4 季度的时候 OpenAI 其实 launch 了 O1 推理模型因为这个概念已经出现了然后呢现在又出现了 O1 正式 O1 Pro 然后 DeepSeek 也出了 Google Gemini 也出了我们看到了非常多的这个公司都出了推理模型那么推理模型推理的这个能力它在整个 Agen 的这个这个这个 Tech Stack 里面的这个
它的作用以及它是不是能够把 A 型的这个业务方向往前推进一大步那肯定是的推理能力其实就是现在的 O1 这个 O 系列的模型的核心 O 系列其实是基于之前的 GPT-4O 这样的一个模型之上的有很多人以为 OpenAI 在训练 O1 的时候是重新进行训练了
然后这是一个完全新的一个模型但实际上不是的 OpenAI 的 O 模型就是基于以前的 4O 这个模型基础之上进行推理然后加了一个 chain of thoughts 这样的一个推理的步骤那么推理它让这个模型能够去处理更加的
更加复杂的问题然后也增加了这一个模型的可解释性我觉得这里一个很大的区别就是 O1 和以前的像 4O2 这样的模型有什么区别以前就是我直接问你说一加一等于几一加二等于几你就直接给答案了
现在就是说我要问你一个科学的问题如何去解决一个非常复杂的科学问题你要想十步甚至要想二十步一步一步的推理这样子的话 AI 的模型它可以突破以前训练数据的这个限制以前因为训练数据就这么大一点儿
那么以前的模型如果没有推理层的话它能给出的答案就是受制于训练的数据而现在因为有了推理能力你可以突破这个训练的数据就像我们人学的知识也差不多也就是这么一些小的知识但是我们如何能够实现创新呢就是我们要突破我们学到的内容
OK 就是说推理可能会让模型能够理合书新的数据出来 6 的就是 Fresh 的数据因为现在 OK 你说其实在这里刚刚 Jenny 提到这个点就是说你觉得这个模型能够推理出来新的内容其实上次你在分享的时候你们也提到说观察到的 24 年比较重要的一件事情就是 Pretrain 的数据用完了吗
然后你们也提到了就是说可能数据的下一个发展方向就是 synthetic data 但是呢就是我也在想这个问题啊就是说这个东西是不是有一点点像这种生物界的这个近亲繁殖就它其实多多少少会会影响这个这个 performance 的上限嘛对吧所以我不知道就是在在在在在这个事情上是你们怎么来看
对就是数据这个问题我当时引用的一个数据是来自于 EPOC AI 是 AI 的研究所然后这个研究所也是我一个朋友他是一个就是做的非常有意思他们的一个预测就是在 2026 年和 2032 年这么几年之间我们会用完高质量的人类数据然后有很多很多的 AI 界的大佬也
提出了相类似的观点比如说马斯克比如说 OpenAI 的 Ilias Hotskipper 他们也都提出来说我们的数据即将耗尽那么就有什么样的解决方法呢一个方法就是我们去用这个合成的数据 Synthetic DataSynthetic Data 就是有很明显的进行繁殖的风险就比如说你这个数据原本是
是全部都是红色的那么它生成的数据肯定也是红色的它并不能够增加你这个数据的多样性然后这个数据生成的质量也不一定很高那如果你说我要专门去生成一些小概率的数据的话它有可能会污染你整个数据源比如说我本来这个人的口红是红色的
然后你生成了一大堆蓝色的口红你这个就污染了整个世界数据的数据源对吧你就会面临这个模型崩溃的一个风险因为这个数据质量不行所以模型是越训练越傻啊
越训练越差是会有这样的一个风险的那么除了合成数据之外呢还有几种不同的发展的一个思路一个是我们如何提升数据的利用效率如何去让这个 AI 通过主动学习的方式去获得更多的信息那么主动学习就相当于说我不过
把所有的东西都告诉你就像我教一个小孩一样我并不是说我把从一年级到十二年级的书全部告诉你而是说你学完了一年级你自己主动去问二年级要学什么然后这样子的话反而能够提升这个数据的利用效率
然后另外一个思路呢就是我如何利用更多的数据那这包括了如何利用音频和视频的数据那大家也可以想象得到我们现在人类的文字数据是非常有限的文字数据只有视频和音频数据的百分之一千分之一不到
那么还有很大量的数据是我们还没有应用到的,包括 IoT 这种设备的数据我们也是没有应用到的。那么另外还要一个非常敏感的一点就是如何利用用户的数据进行模型的训练。这个方面就涉及到了很多如何在保护用户隐私的情况之下去高效利用用户数据,通过自监督的学习方式,然后减少,
对于这个模型标注的依赖然后在这个基础之上去用用户的数据去进行模型的训练我有一个问题因为刚才讲到特别心虚的话这个回答了我很多疑问就是刚才说让模型主动去学习这个有点像人类的好奇心
这个好奇心我记得是我看了那个智能简史这个 The Brief History of Intelligence 那本书里面讲到的好奇心是在脊椎动物就进化出来的能力鱼都有就是说这个是促进我们大脑发展的一个很重要的能力就是我们现在的就是像在 AI 界里面让模型实现好奇心这个是用一种你可以通俗的方式来讲应该是一种什么机制去实现好奇心让它主动去学习
对我觉得这个其实是主要是基于这种自监督的学习方式然后还有一种就是 reinforcement learning 就比如说你让他在一个就是当然我不知道知不知道以前 opening eye 在做大模型之前是做这个 dota 就是打游戏的模型的然后那时候就有很多这种激励机制对吧如果你比如说踩了一个金蛋就是加一百
对吧然后这种其实可以用这样相类似的机制去激励这个模型去探索这个世界包括现在有很多的实验室 OpenAI DeepMind 还有英伟达他们在做的研究也是如何我让这个模型在一个自然的或者是一个游戏的环境里面
去进行自己的探索而不是说像大语言模型很多时候就像是填鸭式教学我把人类五千年的文明全部都送给你然后让你填鸭式的有点中国家长的教育方法你给我洗个衣服
把它全部都给我记住然后你能够生成出更多的文案对吧那有另外一个模型训练的思路就是说我不把这么多数据给你我就直接让你看到你眼前的这么一点数据然后你就探索这个数据和这个世界这样子是不是能够更加高效的利用数据然后让这个模型更加智能化
他也可以用少量的数据样本来学习这个是好像整个 research 界都很强调的一种方式包括写那个 Sutton 教授他也在讲要持续学习嘛就是一直学习然后后面就会有这样的一些机制 OK 这个非常棒我这次理解了那么我还有一个问题正好顺着这个来问我刚才我们说到推理模型推导的学习
然后呢这个你说的那个 O1 是在这个 GPT-4O 的基础上面来训练出来的但是我刚好前天的时候那个 Anthropic 的 CEODario 他接受 WSGA 采访的时候他说下一代的 Cloud 不会像他们这样来思考什么推理他不会专门分出一个版本叫做推理模型他说他们就会让这个东西
在下一个新版里面出现可能在未来三到六个月就会推新版然后这个里面他们对推理模型的理解他们认为推理是一个涌现现象它就可以在现在的在 reinforced learning 或者说强化学习里面来涌现出这个能力出来就用他们现在的模型不会做一个新的版本出来这个是一种另外一种解题思路吗或者说我比较好奇请教一下
如果從大的方向來講我覺得其實在 LM 這個領域每一代都會有很多的 surprise 包括 LM 架構的出現還有它的 feasibility 最後的能用性的成功
Jenny 在 State of AI 的 report 裡面我們講到這個 Scaling Law 至少我們的一個觀點是 Scaling Law is coming to the end 那會有一部分的就是 Paradigm 就是底層東西肯定是要變化的那現在的
從 Layer 1 Thinking 就是 Pattern Recognition ThinkingLayer 2 以 Reasoning 為主導的 Genetic Thinking 是我們現在 2025 年可能明年還會看到一個不同的趨勢那個 Interview 其實我也看了比較有意思的我覺得兩個公司他們是用不同的 approach
应该这样讲就是我的理解是对于 Anthropic 来说的话他们的理解其实有点像去健身房健身房的话如果说你一直做深蹲的话其实你的整体能力是非常 OK 的就是你要去举一个重度的话这个手臂的肌肉是很 OK 的或者是你的腿的肌肉是很 OK 的那
OpenAI 它的 logic 更多的是你不要去做深度你就直接去练腿就好了直接去练这一个肌肉就好了就更加 focus 在一个 particular 的一个 function 那更多的是推力 function 那推力 function 对于商业的应用的话是很怎么讲就是很 targeted 就是很针对
Anthropic 它之所以覺得這是一個湧現的一個現象的話我的猜想就是覺得如果說只要這個模型它的整體的能力是上去的話那麼就好像你深蹲我做得很好的話那麼你的你跑步的話也是應該是 OK 的打白紙這樣子的我的理解了解那我理解一下可能就是 OpenAI 為了後面的一些能力超了一個捷徑然後先把這個能力提升了
然后可能等这个能力提升之后我再用它产生新的数据然后再让模型综合能力得到提升然后对于 Anthropic 的策略就是我可能很均衡的让你成长慢慢的你就有这个能力了方式不一样但是最终的这个
他们的殊途同归应该是这样的一种思路这也是我猜测的我觉得是这样的我觉得 Avravi 的这个创始人 Dario 他在 Wall Street Journal 的采访当中为什么说他们跟 OpenAI 不一样他其实意思就是说我并没有抄 OpenAI 的作业
但是这个意思但是他真的没有超过 OpenAI 的作业吗你们如果仔细去用一下 Cloud 3.5Cloud 3.5 你如果问他一个非常复杂的问题他会有一个 thinking 点点点对吧正在思考中他其实跟 OpenAI 是同样的一个机制这就是一样的推理机制他只不过是说 OpenAI 是说我在 4 欧的基础之上
把这个单独拎出来做了一个模型而 Android 说我就直接在 3.5 的上面加一层就是 Chain of Thought 就可以了它其实就是超了 OpenAI 作业是非常的立竿见影 OpenAI 的那个 O1 出来之后没有一个月 Android 就已经出现了这一个 Chain of Thought 的这一个推理了所以说 OpenAI 和 Android 在这一点上做的事情是一模一样的但是呢这两家公司的发展哲学上是不一样的
就像 J 刚才说的一样 Atmophic 是想要做一个相当于说把所有东西合成在一个产品里面的一个产品比如说 Atmophic Cloud 3.5 而不是说我把 Cloud 就是 3.5 做成一个
做一个什么 3.5 欧对吧在做一个专门的推理模型他就说我们直接就是一个模型最好用的一个模型就可以了而 OpenAI 是说我把不同的这一个模型的能力放就拉出来然后独立的进行这样的训练进行加强我其实有一个朋友他是 OpenAI 的 O1 的一个负责人然后他当时跟我们讲的一个思路就是说我把这个就是 O1 拎出来
单独的来做把这一个单向强化了之后我可以带动其他的方向进行就是更好的提升那么另外一点就是说 Oakland 的一个理念就是觉得我并不是所有的这样的这个任务都需要用最好最能力最强的模型去做而是说很多模型很多任务我就只用小模型做就行了而
我不知道大家有没有观察到 Entropy 它就是说我就是要做 Enterprise 的模型这个最大的模型也就是最好的模型我根本不想去做一些小模型啊或者什么多元化的这个产业链我就是要 Target 这个 Enterprise 给它最好最佳最靠谱的一个模型那 OpenAI 就是说我这个模型可以服务各种各样不同的行业嗯
那我了解可能 OpenAI 更加聚焦在 consumer 一点就是消费者这一端因为它可能大量的日常的这种东西小模型就可以了但是 anthropic 它就是 enterpriseenterprise 需要很好的推理需要很好的 reasoning 需要很可靠的这种 reasoning 所以说两个公司确实它跟的方向不一样所以导致它的模型分层
都不一样我现在理解的非常好那我正好我说我自己在八卦再说一句啊我就是为什么我会觉得我会分成各种各样不同的模型其实也不完全是战略考虑了其实因为内部有很多这种 politics 对吧就
就是相当于诸侯割据有这样的一个局面在哪所以说有的时候也不一定是说这个公司就是战略上面说我一定要做出这么多模型而是说这有一个诸侯他要做这个事那有一个诸侯他要做那个事所以说就有很多这种情况对现在的问题就是说好多人在 CHIPSHIP 界面上面有一堆模型可以选现在五六个七个了这个用户体验太不友好对就是这个问题对
其实这个话题呢正好跟我们想讨论的另一公司也很有关系对吧就是你讨论到这个大公司山头领利其实在中国呢其实有一家很神奇的公司叫 DeepSeek 然后我不知道你们最近有没有看到这个中文互联网上流传的一篇文章
就说这个小扎因为 DeepSick 出现很不高兴说我们投入了那么多钱那么多资源对吧其实最后还不如一个就是在中国他们公司很有钱但是 definitely 他们没有所谓的顶级科学家
就是他们绝对是顶级人才但是这些顶级人才是被发现的而不是说他们已经取得了非常高的学术成绩当然那个团队大多也是金牌级以上其实也没有花大家想象的那么多的钱
其实在我听到对但是我理解最后其实肯定不止这些钱因为你想他用的一些卡的资源可能是很快就一起核算了但肯定我觉得至少在这个 24 年比如说我们 review 的时候我们把这个当个热闹再看我相信在中国有非常多的大公司在 review 的时候每一个负责人业务负责人都压力很大
他花了数倍的钱数倍的人力但事实上呢 DeepSick 肯定是今天中国非常领先的模型我觉得甚至在世界范围内也是排名很靠前对我想你出来了一个问题是你说你先说我还好奇 DeepSick 它原来背景是 Hedge Fund 里面的一个团队做的吗
对对我稍微介绍一下就是他们的这个创始人叫梁文峰我应该没有记错叫梁文峰然后他也是一个比较 geek 的一个人然后他做了很多年的这个量化然后他量化的业绩呢是非常好的据我听说因为我恰好认识一个换方早期一直跟他一起工作的一个人据我听说他们内部的策略 even 比他们在外面的策略跑得更好
然后其实做了有十几年了这个公司一直很低调然后从很多年前开始呢去年还是前年吧我们就突然发现在持有一万张卡的中国公司里面居然有一个是换方换方是中国非常早的万卡俱乐部的成员
对然后他就开始这个招人然后做了这个 DPC 第一版出来的时候呢我的第一反应就是去问我那个朋友我说你们招了哪个科学家他说我负责任的跟你讲真的是一群聪明的年轻人做出来的
所以这件事情让我对我很颠覆的一点就是说也是我想跟你们讨论的就是说这个我们之前说嘛就是 OpenAISOP 或者很多很多这种公司它有巨巨大的这个这个这个人才壁垒对吧有巨大的这个这个这个这个钱的壁垒但是 DeepSick somehow 呢我感觉就是在
至少他在复现这件事情的创新上好像不需要那么贵也很贵就不需要那么那么稀缺的人也不需要那么那么多钱那会不会说明就是说其实这个
大模型这件事情本身对吧其实可能大家现在用的算法也差不多方法论也差不多对吧包括欧万出来了以后可能每个人都在推理上花更多的时间就会不会这个事情其实将来在这个大模型的大厂上拉不开差距就比如说明年 openAI 然后 cloud 继续打大钱把这个边界拓宽一下然后有像 deep seek 这种后面的 follow 用这个十分之一他们的这个这个这个这个
花销把它复现出来然后呢这个用户对吧就是或者是开发者 development 就是他就能用很便宜的价格对吧就是享受到各种各样的这个服务就是会不会出现这样的一种情况
对我们在 2022 年的时候我和 J 就给出了一个非常 controversial 非常有争议性的一个观点就是我们觉得做大模型是赚不了钱的为什么赚不了钱因为总有人愿意免费的提供这一个服务任何的行业只要有人愿意免费的做它
你就赚不到钱任何的只要你这个事别人可以当爱好来做你就赚不到钱大模型也是一样的就是如果有人愿意开源让你免费用它你的 profit margin 你的盈利率就会非常低之前就有人在投那个 profit 投 openin 安的时候就非常惊讶的话
发现这个盈利率真的是比做软件要低非常非常多以前的 SaaS 公司盈利率可能达到百分之八九十那 OpenAI 股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票股票�
Deep Seek 这个团队他们是如何高效的利用资源我这里有两个观点第一点就是他们的模型其实是踩在了巨人的肩膀之上的如果让 Deep Seek 他们就单纯的说你们就从零开始
而不是从一到十的一个过程从零到一他们花五百五十万美金去送出来他们现在的这个模型的因为他们当时是用一个叫做 GRPO 的一个方式他们是做的 post training 上面的这一个创新而不是 pre training 他们的创新他们是用了 open AI 模型的产出的数据然后进行这样的一个 reinforcement learning 的一个强化
然后实现了他们现在的这个模型的 performance 如果让他们单纯从头开始做他们是达不到这个效果的而是说 open AI and graphic 这样的一些就这样的一些大厂是先打好了基础然后才能有 DeepSeek 这样的公司出来说我们在 post-training 上做出一定的这个创新这是我第一个观点第二个观点就是你用乔布斯的一句话
就只有在资源紧缺的情况之下人才会创新资源越充分人就越不会创新越是资源多的公司还越创新不了比如说我感受很清楚 2022 年的时候大家都很惊讶为什么第一个做出 LM 的公司不是谷歌
不是 Define 不是这些大厂而是 OpenAIOpenAI 当时没钱没资源没人然后能够做出 Charge PD 但是谷歌为什么做不出来因为谷歌资源太多了就是这些研究员周末都去滑雪去了对吧那 OpenAI 当时我们是属于晚上 2 点钟还在干这个事但是现在 OpenAI 其实已经成为了当年的那个谷歌了像大家那个 Botans 这么多钱这么多很多人就是属于提前退休了
对就跟环境不一样对说到这里我还要补充一下 DeepSick 这个团队确实最近我比较感兴趣所以我 dive 的比较深我问到的里面的人就是首先在中国大家都觉得中国的公司应该很卷对不对比如说如果你在自洁你可能要工作到很晚才能下班但 DeepSick 是一个七点下班的公司对所以就是嗯
但是我的问题属于就是说 7 点下班它也比美国这边要好很多它是正常的一个工作时间它不是说很多员工上班就是摸鱼有很多之前很火就 TikTok 上面有很多什么谷歌工程师说 A day in the life of a Google engineer 然后可能早上 10 点钟去然后吃个饭然后下午工作两个小时然后晚上就回就是晚上 4 点钟就回去了下午 4 点钟就回去了
然后晚上也不会干活就是这种一个工作环境其实是非常不利于创新的
還有一點的話就是我可能從 VC 的角度來說上次還跟 Jenny 聊這個事情我覺得像從技術上來說 Jenny 我覺得這樣完全是對的但是從一個投資人的角度來說我覺得這個 space 特別有意思的地方在於說不管是 OpenAI 也好還是 DeepSeq 也好我覺得未來的話還會有這樣子的 New paradigm 或者 New technique 不斷的變出來 Nobody expect it
但是我们要 get ready for it 你说它有没有一些 random factor 在里面我觉得肯定是有包括 LOM 它的这个最早出现的时候是 nobody expected 就是 how well it could work 这个是没有办法去遇到的遇见的但是 general direction
會不會未來是有不同的方式出來會不會未來是有不同的 modelspecializing certain vertical 或者 certain 的一些 parameter 的話我覺得這個肯定是有這也是為什麼這個領域就是非常
这个也是我比较喜欢现在我们所处的这个历史进程阶段的这个原因就是一个大的创新涌现出来之后呢它每一个未来都是可期的它有很多种可能性就是说 AI 的进化会非常快因为我们才刚刚走第一步我们才用大圆模型这种机制来做智能后面还有很多模型还有视觉还有空间还有各种机制学习方法所以说
大家都未来有希望就表示未来可能性多这个也是投资也是最好的机会可能性多那我就有各种各样的有可能加倍的可能性有可能各种可能性如果说我们看到未来都是一步一步的线性的增长或者说是未来就已经在那了那我们投资也没有什么意义在这个上面我们好好做事情就好对所以我觉得市场对吧
我觉得就是 OpenAI 很 Drop it 他们就像是这个电商界的亚马逊对吧这是第一个出来做电商的公司然后打下了这个电商的商业模式的基础我觉得 DeepSync 这样的公司就像电商界的听多多就你这个商业模式已经非常清晰了我就是怎么把这个价格给你压低下去然后我压低了之后我自己的利润非常薄但是我也绝对不让你赚钱
是的是的是的 OK 我们来我正好话题我们回到 agent 上来好吧因为我们今天的主题是 agent 那正好我给我们前面聊了很多我觉得非常棒我总结一下我们聊了大家的投资的理念 research 的方式我觉得这个很不错的然后我们聊了一下前半截的关于 O1 推理模型然后已经比较技术一点的为什么推理模型 Atropic 和 OpenAI 不一样
然后由这个话题引到了 DeepThink 搞价格战或者说他用一个后续练的方式在前人的
就在巨人的肩膀上踩了一脚然后用一个比你便宜二十分之一的价格只有你二十分之一的价格来做竞争我觉得这是市场带来的各种可能性在 AI 智能的赛道上面我觉得这个机会很多任何的角度任何的思维方式或任何的变化都会让这个市场产生很多的变化大家我觉得好处就是这样子如果他开源而且他还把价格做低了那么他一下子会把很多大公司打醒
然後我們是不是回頭回來我們應該重視這個東西然後這個我們是不是我覺得 2025 年會非常的精彩那我們回到 A-Center 上面來我個人因為我以前做移動互聯網我個人對 A-Center 我自己有一個定義我不知道正不正確我覺得移動互聯網是一個做信息聚合分發的
Internet 都是干这个的不管是打车还是点外卖或者看新闻你把信息传上去然后发下来然后一个 APP 就是一个应用然后我来做信息审讯和信息调度的然后对于 Agent 的这个时代我们可以把 Agent 叫做智能时代的 APP 它可能是做完成任务的
你给他一个 task 他就去把这个事情做了然后做完了之后呢而且但是移动时代的 APP 都是固定的我有一个应用打车有一个应用就点餐有一个应用叫叫什么什么但是现在在 A 型的时代呢
可能我就跟前 GPT 昨天说的那种 operator 里面你可以帮我完成所有的事情我跟你说就好了你是一个 assistant 或者是一个 super agent 对于个人来说然后对于企业来说呢里面是不是有很多企业的 workflow 啊这种内部的 low-how 的知识或者 low-how 的这些要做的好的复杂操作他也可以通过若干个 vertical 的这种 agent 进去然后把这些事情完成了所以说我觉得这个在 agent 的时代
应用代码不是人写的可能是由原模型写的然后他们会来自己调度自己完成 task 去完成任务我觉得这是最大的一个区别在这个时代智能时代的应用 apps 就是 agent 然后移动时代应用就是应用就是我可能做了这样的一个我在做一个这样的 match 和过去的时代所以我们可以把话题引到后面一个来就是我们怎么来看
现在的这些在这些初创公司或者说因为有很多大模型公司很多巨头的在这样一个生态里面有很多很不错的很棒的 SaaS 公司 Salesforce 或者说这样的公司也有很多像 Adobe 这样的公司然后还有模型公司和 Google 那么这些小公司初创公司他们如果做 agent 从你们角度来看他的这个切入点正常的切入点是什么以及他的机会应该在哪里
首先我觉得我们对 agent 应该是跟你的这个 framework 应该是非常接近的 agent 也需要能够完成一个 concrete action 这个 action 不管是 task 也好还是就是 digital world 或者是在我们的物理世界也好要做一个 physical task 这个 action
那之前的上一代的軟件的話其實更多的是 passive 就是要麼進來的資訊要麼你要做很大的一個 onboarding training 才去瞭解怎麼樣去用這個 software 然後還有的話就是
我們看 agent 在出創的機會的話我剛才回到我們剛才講的不同的 model 不同的 model 的產生不管是 proprietary 也好還是 open source 也好其實給創業者很大的一個機會就是你有很多的一個 building block 可以選擇這一點的話
在过去的一年两年可能还没有达到现在的一个 readyness 现在基本上的话我觉得是一个如果你创业者的话真的是个黄金时代但是必须要非常的 thoughtful 非常的小心去进入哪一个赛道在美国来说的话
我们经常看的是企业服务类其实现在我们 Jenny 在 report 里面讲的我们不去看 software as a service 但是更多的看 service as software 那么这个是一个比较怎么讲比较 broad 的一个概念那 Jenny 等会可能可以去 unpack 一下但是这种感觉就是说
以後的 software 還是 proactive 還有非常 concrete 的 ROI 它能夠讓 buyer 就是 enterprise 的購買者的話他不去想 agent 是一個 software purchase 更多的是一個 payroll supplement 作為 payroll 的一個補充很多人其實
這個我們可以講很久很多人會想到是不是一個 Payroll Human 的一個 replacement 這可能大部分的企業在現階段的時候想的是 Payroll replacement 可能也是比較容易 calculate 的 RI 但是我們預測的話在今年跟明年的時候你可以看得到
这些 enterprise customer 他们是有自己的 evolution 就是他们可能并不是想说我完全把我的 junior staff
可能我會 100% replace 的但是可能會說我原來要去招這麼多 junior staff 那我還不如給我的已有的 10%的 junior staff 給他 amplify with AI agents 這樣子的話更多的是一個至少在未來的一到兩年的時間裡面的話是一個生產力的一個很大的一個提高而且對於企業來說的話這個暫時算很清楚的
還有一點的話就是 Agen 它之所以現在是在 timing 上比較 exciting 就在於說它的 accuracy rate 會比較 stable 就像 OpenAI 今年這一週的時候發布了一個 operator 就包括 Indigo 你自己也試了 NTA 的產品
就是它有一個 wow factor 就是從來在歷史上可以幫你去換商不需要你去批准它可以去做這個東西的話我們其實
有投一家公司他们内部的这个 software 其实做的跟 operator 很像有一个很有意思的一点的话就是其实你看那个 operator 他的 demo video 里面他有跟 state of art 的 benchmark 相比那个 state of artI think openAI 它的那个 operator accuracy 是 58%
另外一个 State of Art 是 Honda 57.6 那个公司是我们现在投的然后 Founder 还给我们发信息说他们之前是 Older Model 就是做这个 Computer Use Older Model 那就是未来 Agent 的一个走向
我剛有一點 Ramble 但是比較創業者的這個他可以 start 的一個領域來說必須要垂直領域 Go vertical 在美國的話比如說 Healthcare 是一個很大的一個產業 Finance 是一個很大的一個產業 High value professional service 一旦有好 agent 能夠 produce 我們講 80%到 90%
start with 70%到 80%这样子的一个准确率的话 then it's usable 那这个时候可以再慢慢地去 accumulateinstitutional knowledge 然后让这个 agent 不断地建立自己的 mode 这点我觉得是非常有意思的一个可动观察的一个现象
我刚刚其实有一个词我觉得你说完对我启发很大就是 proactive 我觉得这个可能是一个新的时代的一个开启当然如果你当 proactive 以后对吧大家就会对你提出来更高的要求比如说你刚刚提到的这个正确率就是你的这个可靠性就是可靠性在 70%到 80%这个你是怎么推演出来的是一个你的 gap feeling 还是说是
有有些什么公司或者数字已经验证了这个 70 到 80 这个数字就是就是 acceptable 的嗯我觉得啊
大家還記得當 GDPT 剛出來的時候不管投資人也好 整體市場也好 surprise LOM 不能去 calculate simple math 簡單的數學問題大家對於 software 當時的期待就是說 ok 為什麼不是 100% correct 我給你個數學問題 你應該跟計算機一樣
百混的正确答案但是因为这是不同架构的一个 software 那 Asian 的话它是建立在 LOM 这样子不同的架构的一个 different technology
所以我之所以我们讲其实 Enterprise SaaS 很重要的是是 Buyers 驱动的一个问题就是对于 Enterprise Purchaser 他对于这个 Software 是怎么样去理解或者他的 Expectation 是怎么样的这个对于投资人来说对于我们来说其实是相当重要的就是他的 Market Time 其实很重要现在我们其实看到一点就是说大家其实比较知道
LM 會 Hallucinate 會產生幻覺對 也就是說對於初創者來說的話我們之所以強調這個初創者要有一定的研究 research 的背景並且 stay close to the research community 就在於說對於 MVP 的要求更高你怎麼樣去建立這個 Native Tech Step 從而去 reduce 你的 Hallucination 我覺得
我們不能去期望也不能去要求如果有個創業者說他的這個 AI Native 公司或者 Agent 公司百分之百不會產生幻覺不 HoloSnake 這肯定是 Bullshit 這肯定是難看他可以 Reduce 但是不能夠完全的 Eliminate 這個就是 By Nature 這個新的一個 Technology 的一個 Feature 我覺得不能這樣把
你知道為什麼嗎?這可能之後我們會聊一聊為什麽 intelligent driven software 跟之前的 SaaS software 很不一樣就在於說它必須要有一定的 Holicitation 才能 compound intelligence 這點其實我覺得跟王先生聊的話可以慢慢聊 OK 再聊一期
但是回到 Hongmin 的问题,就是在于说到底百分之 70、百分之 80 是我们怎么样定义出来的?其实你可以想我们如果去找一个 associate 或者 analyst,你不会去希望说这个 analyst 一上来就给你提供百分之百完全正确的东西,你会有一定的 margin there。
但是那 March Error is actually ok 如果说这 March Error 是 50%的话他每次给你一个报告都是 50/50 有可能争取有可能不争取或者你要花太多的时间去 train 这个新的孩子的话那是 not usable 但是如果说他比如说是 fresh graduate 非常 proactive 非常 willing to learn 能够给你基本上 70% 80%的一个 quality report
这是 OK 的 因为这其实是大家对于 junior entry point 的一个 basic expectation 了解这点对于 agent buyer 的角度来说 跟之前的 enterprise 是 framework 上不一样的
与之同时的话他的 ACV 其实更高这点的话可能是另外一个我们之后可以会讲解 OK 那我正好在顺着刚才说了现在 agent 创业领域 enterprise 肯定是 vertical 是很好的一个方向 to consumer 上面 agent 除了像这些模型公司 google 和 openai 他们提供这种 super assistant 之外我个人觉得可能是不是会在 entertainment 内容生产上面 agent 会起到很大作用因为现在
很多消费嘛就是短视频啊文章啊或者说是互动的 interactive game 这种 agent 他如果说真的能够来生产他会大量的超过超过人类的效率在这个上面你们有没有看到类似的有趣的公司在硅谷或者说在全球范围里面或者你们怎么考虑这个 consumer-oriented agent 的这个方向
对我这里引用一个 Sam Altman 的一句话他说他当时没有直接说他不看好 AI2C 的应用但是他就是间接地表明了这个观点为什么呢他说人会对 AI 感兴趣 30 秒但是之后人感兴趣的还是人
所以人为什么 entertain 还是说他就是会更感兴趣看人你看抖音什么视频都是人生成的现在生成视频它还没有达到一个以假万真的一个程度这是第一点第二点就是说你达到了以假万真之后呢他还要有一个说他有娱乐就是有娱乐的治疗能够提供娱乐的情绪价值这个又是更难达到的一件事儿
然后另外如果大家去看这个到底什么样的视频会走红到底什么样的内容会得到很多点赞其实一般的视频是得不到任何的点赞的也没有什么人关注它基本上就不是一个这种非常的就平均分布的这个局限它是说很少数的人百分之 0.01 的人
它是获得了 99%的这种党生鲜花和这个关注的对吧所以说你 AI 要能够在娱乐上取代人它并不是说我比一个普通人更具有娱乐性而是说我如何能够击败这 0.01%的人那这个其实非常非常难实现的一件事因为它可以达到一个平均的水平它可以达到一个 10%的水平但是这还不足以提供这个娱乐价值
你像明星嘛 10%的人就是一个笑花笑草的一个水平但是还是不能够成为一个明星明星对但是我觉得 AI 可以在 C 端能够过来算是 pro 用户的需求了增强这些 KLL 这些 influence 的能力这是肯定可以提升的因为看到了为什么呢我看到了
Google 出的那个 VO2 那个效果它现在好多这种一些早期测试用户在 X 上放出来的视频我觉得基本上我肉眼可能看不出来它和 YouTube 视频的区别很多博主放出来的视频我觉得这个进步会很可怕但是它会被用来增强这些博主而不是起到一些我独立去做一个产品我可以说一个我
我可以说个我个人的虚极话就是说我特别赞同 Jenny 说的就是 agent 知道不出来比人类优秀的人类创作者更好的内容但是呢我现在有一个痛点就是已经文章太多信息都读不完我的理想状态就是我有个 agent 在我起床的时候帮我把所有的新闻都读完帮我按优先级分好甚至我还在跟大家开玩笑
如果他发现了川普发币这样的新闻对吧他就应该给我打电话给我打十个 emergency call 对吧帮我打醒告诉我发生了一些很重要的事情就我觉得 somehow 就也是通过刚刚那个 Jade 那个 proactive 想到的就我觉得 Agent 是不是可以帮我们去做一些更 proactive 的一些我们想做的事情
我觉得这里我的一个好处就是在未来的话其实我们的 content consumption 它的形式会发生很大的改变至少从文字上来说现在太多的 AI generated content 你没有时间我们根本没有时间去做这个对对对
其實這裡很有意思的就是未來的 Enerprise 跟 Consumer 在中間段有個 Prosumer 這樣子的 Expander 這點的話我們是非常感興趣的從投資領域來說我們非常感興趣比如說我們有一家公司他是做 Executive AssistantLiving InboxEmail Inbox 你可以講他是
現在還是 Email agent 或者這樣也好但是你可以想你有一個 EA 就是你的一個助理那這個 Virtual 助理的話他只是生活在你的 Inbox 裡面意思就是他可以理解我的 Email writing 然後理解我的 Tone 然後他可以幫我做 Research 然後他可以給我做 Proactive 的一個 Suggestion 甚至在未來的話他是可以揭露這個
voice audio 的 API 可以给我打电话所以 Homing 跟你讲的就是一样的概念现在我们在那里包括我们其实每天收到非常多的邮件但是我们必须要保证一定的要专业型对吧我们不能回复太短太短的话大家会觉得
You are not paying attention 对对对然后每个邮件都写的特别长嗯就是说我们现在其实至少我的自己的 workflow 就是我会用 agent 他会每天会帮我们 draft 就是起草
每个邮件的回复而且他会知道我过去的时候我的 preference 是什么样的如果说我过去我可能 pass 了这个 founder 然后我已经在邮件里面写了原因了然后 founder 他给了我新的一个 deck 那这个 deck 里面已经讲了他们的 update 那如果说这个 agent 很有意思就是他会去做 research 特别有意思是 agent 他会自己去做 open web research 然后去看
然後跟公司的 PDF 做 compare 然後從我給我一個 draft 說 ok 這些 milestone 還沒有達到然後這就是你可能會想要的 draft 然後我只要點就 ok 了這個就是 proactive 新一代的我們叫 agent intelligence 他必須要做到這種 high contextual 非常 relevant 的 output
对其实就是对人类的这种我们叫 pro 的一些工作上面的一些能力的增强但是必须要高质素
Superhuman 或者是别的一些 HPT 来的一个 email 但是 sound to robotic doesn't sound like me 根本跟你的语气不像的话你就不会用所以必须要 high relevanthigh quality 的这种 output 对我记得你们投了一家做 3D 的叫 Splines 吧
我用过这个产品当时找了好多产品只有他们家最快出 3D 然后我们当时在东京的时候放在那个 VCN Pro 里面放在那个涉谷街头的这个模型就是他做的现在他在现在他们自己也在做这个 3D 的 generation 对吧他们这种用途应该是可以用来增强 game 或者很多很多这种商业的或者这种视频里面的内容的这种需求我觉得这一算是一个
这和我们前面讲的就是对这种 pro user 这种能力的这种增强吧应该是这个方向吧是的 是的我这里再补充一个就是对于 Jay 之前的一个观点就是对于 AI agent 价值的一个观点就是我们其实觉得 AI agent 最大的一个价值并不是自动化并不是说我帮你写邮件我帮你做这做那而是说我对于你的 institutional knowledge 我对于这一个 content
我对于你这个背景的一个理解就是你为什么要这么做然后你这个公司需要什么他对于这个的理解是非常非常重要的我不知道大家有没有在使用 AI 的时候有一个习惯就是说
我会有一个非常长的一个就是一系列的这个 chat 就跟这个 chatgpt 或者是跟 atrofic 的 club 然后我会给他提供很多很多的这个背景信息比如说我这个公司是做什么呢我的 debts 长什么样网站长什么样这样子的话我给他交付的时候他给我答案就是非常能够针对我的痛点而不是反而
这个非常非常的重要这也是 AI Agents 为什么能够比上一代的这个 SaaS 产品要更加有用的一点就在于它能理解你公司真正的痛点在哪里理解你个人真正的痛点在哪里然后这里的话我觉得还有一个就稍微扯远一点我觉得这个能力它其实会对于传统的公司和传统公司招聘形成一个冲击因为传统的公司它的知识
公司内部的知识会在人员流动中流失就是你人走了知识就流失掉了但是 AI 时代这一个知识是永远流失不掉的只要我用 AI 把我这个公司所有的内部的信息内部的这个知识保留下来那么老员工的价值就越来越低
这是一个非常惭愧的事实因为很多公司包括我们聊的一些传统企业的公司它很多时候不去开掉老员工很多摸鱼的干了二三十年的员工不开他为什么
因为他脑海当中有很多公司的信息因为他知道这个这里一个产业链然后这个跟谁熟然后这个软件就背后有一个 bug 然后我们是用什么什么样的方式来解决这个 bug 还有很多很多这样的 contact 信息在 AI 时代的话效率之上 AI 知道这些事那就是说这个相当于说
源源有动会更密集或者就不用人了对吧因为我可能有 agent 在里面把我过去的东西学会之后然后我就少量人就好了就能控制到 agent 我觉得这是非常好玩的一个话题我们正好可以在后面还有两个话题因为我们已经聊了一个小时了有多少时然后其实我们今年我们成为 2025 agent 之年那么你们预测一下在 2015 年里面这些头部的公司他们 agent 会
Frontier 会推到哪个层面上去比如说 Google 啊或者 OpenAI 暗 Shopping 这是一个我们想交流的然后再往后面再往远一点预测比如说未来三年左右到 2027 年大家都说到 2027 年比如说 Darrel 说的 2027 年基本上 AI 能够做大部分可能 95%以上的人类的工作那个时候的 agent 是什么样当然前面讲到的 agent 会 low 好他会知道你企业里面所有的 context
在这个情况下,从你们的 research 视角往前看,对,这个应该是什么样的一个画面,可以给我们描述一下。
对我和 J 都认为就是 2025 年是一个 agent 网络开始出现的一年以前的 agent 就是单兵就是单打独斗嘛那有时候我就一个 agent 包括 OI 也是一个 agent 但是未来会有很多 agent 一起合作我们已经在 2025 年
2024 年就已经开始读这个方面的论文了之前有很多斯坦福啊博科医的一些研究者他们也在研究这个 multi-agent interaction 如何让 agent 之间的交流更加的顺畅如何让他们一起合同协作然后做出一些项目
然后大家得出的结论都是 multi agent 就是比单个的 agent 工作效率更高因为你可以就是三个人一起做事嘛然后如果交流更加的通畅的话然后每一个人他有自己的细分细分的领域去负责这样的事情能够得到更好的更高质量的一个完成这是一个很大的方向然后具体的话我们认为 open air 包括 google deep mind 都会在这个方面去布局
我预测是说分联安会在 2025 年开始推出这个 agent network system 然后不是说一个 agent 而是说一个有组织的可以自动化的 agent 的网络然后这个优势呢就是在 GPT 系列的 reasoning 能力的基础之上然后呢进行这个模型的细分然后让不同的模型去做不同的事情
我觉得这是 OpenAI 可能会做的一件事而 Atlantic 它很明显他们想要就攻克的一个方向就是如何能够让自己的 agent 成为 enterprise ready 如何能够服务于大型的企业那么服务大型的企业的最重要的一个痛点就是理解企业的 institutional knowledge 就是你的 context 是什么我为什么要做这样的一个事情我觉得 Atlantic 它可能会
推出一系列的 AI agent 的网络然后让这些成为 institutional agent 理解企业的这个 context 能够积累机构的知识和经验我觉得这是一个方向然后另外就是 Google DeepMind 他们其实现在很注重的就是科学方面的这些 AI agent 包括去读他们的一些文章包括对于这种 You knowAI
Artificial Super Intelligence 的论文都可以看出来他们非常注重 AI Agents 在科学和研究方面的这种应用所以我觉得 2025 年他们可能会在这个点上继续发力然后去推出可以进行科研独立去进行科研研究的 AI Agents 或者 AI Agents 的网络这是我对 2025 年的一些看法然后我觉得这也可以在就是说一说 2027 年以及更长远的一个 AI Agents 发展方向对
我覺得 Janie 講得特別好我們覺得這幾個不同的大廠的話他們會把整體 AI agent 或整體 LM 的推理能力會往上提升一個台階之前我們講 single agent 之後其實很明顯的趨勢就是
其實現在還沒有很好的定義可能是 agent net software 或者 multi agent software 但是這裡有個很大的一個 怎麼講呢就是 Ball market signal 就是在於說不管是 OpenAI target consumer use caseAnthropic target enterprise use case 還是 Deep mind target 就是 research science use case 都是 huge huge market 超級大的市場那麼這次
我们之前可能讲到就是对于创业者来说他的机会在什么地方如果说大厂他都推出这些东西的话那创业者还有机会吗答案是有的为什么呢因为这些大厂他们其实是在提供 infrastructure 给创业者更好的 building blocks 去勾递即使是 consumerconsumer 有很多不同的需求那么具体什么样的需求的话只需要创业者来 come up with ideas
Enterprise SaaS, same thing, 你如果用 Anthropic 的 model 的话,其实现在大部分都是用 Multi-model,Multi-API 但是你如果主要是用 Anthropic model 的话, Enterprise 更加的要求你要聚焦于 Deep Vertical 的领域我觉得这里有两点,我是特别感兴趣的观察,就是之后的话会是怎么样去 unfold 一个的话就是这个 Mode
如果说 software 它变成一个 multi-agent 或者是 agent net 一个形式的话那么它的这个互成合跟我们传统上理解的这个 SaaS 的互成合甚至就 marketplace 互成合是完全不一样的 marketplace 互成合其实很容易理解包括 social media 对
对,是的。
institutional knowledge 的 context 相当重要一旦有 agent net 它能够形成的话其实有两个 modepotentially 一个 mode 就是不同的 agent 在 interact with each other 的时候它会有不断的 trial and error 或不断的一个 reflection 不断的一个 learning experience
只是之前我們講到它這個 faultless nation 是不是一個 bug 它現在不是一個 bug 它是一個 feature 因為只有這樣子的話它才能夠 accumulate 它的 intelligence 會讓它 intelligence compound 變成物理化的疊加那麼這個時候的話 這個可能是未來 Asian net software 它能夠形成的一個護城河
還有第二個很有意思的一個可能值得觀察的一個現象就是說一旦 Asian 進入到 Enterprise 的 workflow 甚至 Consumer 的 workflow 包括 Homing 之前我們講的就是我們其實更希望一個 Asian 幫我們做 summon 未來的 Asian 跟 Asian 之間是需要有一個 protocol 需要有一個方式來 interact each other 對不對那他這個 computing 的方式可能跟我們不一樣
API 简单的方式也不一样那么还有一个问题 Google 的 agent 跟 openAI agent 他们要不要 talk 要不要 communicate 我们不知道但这个应该是比较动态化的一个过程
发了一个协议嘛就 MPC 嘛可能想出代吧就是想做一个这种 agent 的工具 call 的这样一个协议但是可能吧再看别的其他的公司要不要 follow 这个协议了那正好我们聊到我觉得挺好的这个我们聊 agent network 和 agent future 这个 agent 的怎么去通讯而且他怎么增强然后在这个里面呢我感觉 2017 年 2018 年之后呢如果 99%的工作都被这种 AI
就是他都能做了,那我们意义在哪?人的意义我们做什么?然后这次每次我们的节目最后我们都会讨论一点关于这个人性啊关于未来这样的一些话题我们不说我们现在不说 AGI 的嘛,因为 AGI 已经快到了对,然后就是说如果说 99%的工作我们都不需要做了那可能按照因为我觉得大力文那个采访视频提到挺好的就是说总是有那么一点点工作是需要人来做的
而且他会把这一点点工作的时间因为你大部分的时间都被杠杆掉了然后你其实会有更多的时间能够把这个 1%或者 5%或者 10%的事情做得更好了那么在这个里面觉得哪些事情是我们人能够发挥最大的在这个里面就是如果说我们真的就是那种体力工作自动化工作都不用做了剩下我们应该做什么
我觉得首先 2027 年的时候 AI 肯定是取代不了 99%的人类的工作的如果你看美国的劳动力市场的话 70%的工作其实都是需要有这个物理世界的交互的只有 30%的工作是完全线上的这个在疫情期间表现得很明显对吧
大部分的人还是需要线下上班的只有 30%的人他是属于完全就可以直接线上就行了那么这 30%的人就是最危险最有可能被 AI 取代掉的人了那其他的 70%的就是需要跟物理世界交互的人呢
工作还是很稳定的原因是这一部分现在从机器人的角度上来看还是没有办法被机器或者是 AI 取代掉那未来这个经济模式或者是人的这个生存的意义如何被 AI 所冲击呢我觉得这里的一个很重要的一件事就是经济模式正在从一个劳动力驱动的经济变成一个创意经济或者是创造的一个经济以前的人的工作形态主要是一个执行者
比如说我要写代码比如说我要写文案比如说我要去做具体的事那么未来人所就是承担的一个角色更多的时候是一个设计者和一个引导者就是每一个人都成为一个小老板了
以前是属于对吧就是工人做事包工头指挥现在每一个人都是一个小包工头了那人他想要做的事并不是说具体的任务而是说我要定义目标如何去评判然后如何去设定就是我到底想要做什么事我觉得这个是非常非常重要的一件事情那么人的一个
价值呢也从一个生产价值就做这些事变成一个创造意义就我做这个事到底有什么样的意义我觉得这是我们观察到的一个很大的一个发展的趋势
我觉得从人性的角度来说大家都不想失去自己的工作因为我们从小到大就要有工作但是你刚才讲的就是如果说每次技术的变革都能够让我们有更多充足的时间去做我们自己想做的事情的话对于 AI 来说它的增长力的解换其实更大
如果说我可以不要去做原来做的重复性的 90%的工作只要 focus 在 10%的上面的话那这个不就是我们经常说的 CEO 的 job 吗 CEO 他的工作不就这样子吗所以说这都未来其实对于大家来说的话可能要求会更高兴就是像 Jenny 说的你要有自己的想法要有自己的 design 然后要有自己的 leader
这个其实是好的一个趋势但是你说你要不要去维护 email 你要不要自己去写 email,you can do that 你还是有这个 option 但是没有人会觉得我天天写 email 或者天天写这个 marketing material 是我的 like purpose 所以说 AI 整体的方向的话实际上是会对人的往上一层的思考 What do you really want to do?
这个才是一个很大的一个解放所以说从好的方面讲我觉得这是非常非常 exciting 的一个一个一个环境我补充一下正好话题引到这来了我觉得我们听到的好的方向我觉得是一个
我感覺是一個比較也比較悲觀吧也就是一個可能比較確定的現實如果說只能在這樣發展那麼人可能會分化掉就是只有 1%的人他才能夠做好這個角色抽象思維更加的廣度的學習更加的像 CEO 一樣因為 CEO 不會那麼多嘛然後這些人帶著 AI agent 來生產內容然後來製造這個服務請大家使用那 99%的人你就 entertainment 就好了
你也不用想太多然后未来 AI 给你创造了什么不管是视频娱乐或者虚拟现实娱乐或者各种东西你消费就好了
Anyway 他也不用劳动可能那些很赚钱的公司他们会拿大部分的钱来 UBI 或者其他的方式然后让你们生活的 base 9 还不错你还能够有钱消费这样子的社会我觉得可能是我感觉是一个比较大的现实就看大家想往哪边走了因为我们现在的教育还是把人教育成工具人
包括从小学高中大学,大学可能会好一点,但是其他的教育都是工具人嘛,让你去完成工作,I need a job,我必须有 job,然后我去遵守你的指令去把工作完成了,然后你能拿到你的薪水,但是未来大部分人 90%的工作可能现在还没那么快,可能再过五六年左右,机器人再发达,真的就是这样的世界了,那么大部分人可能真的只需要 entertainment 才好,
所以我觉得 Elon Musk 在去年年初的时候在那个 Neuralink 的一个采访上面他说了这个 AI 针对个人的这个终极目标函数就是 Entertainment 让你快乐
个人无法喊诉就乱得快乐我感觉可能是这样子的在这个基础之上我补充一个观点我觉得这不是说 AI 是一件事情导致的你从人类的历史来看你看 200 年来的历史难道不就是一个
就是 1%和 9%的人不断分化的一个历史从工业革命开始就是 1%和 99%之间不断的分化你看任何一个工业化的国家它如果不是有非常强的政策的 intervention 的话你这个不平等是会不断的加剧的是不断的加剧的因为
就是能够去用 AI 的人第一是少数嘛我当时记得我在 OpenAI 的时候我当时自己写了一个播客一个文章写的是说未来会出现这么一种情况这个是五年前五年之前的事我当时就觉得未来会出现 AI 之上的人和 AI 之下的人就是有 AI 之上有 AI 而有 AI 之下 99%的人在 AI 之下
然后是 AI 然后是 AI 之上其实现代的社会已经往这个方向发展了 1%的人在控制 AI 从用 AI 创造财富然后用 AI 去操纵底下 99%的人大部分的人每天痴迷于刷抖音然后娱乐这些 对吧其实就是这样的大部分的人其实创造不了很多基价值因为我自己的背景其实是 AI 和经济学交叉学科所以我觉得
我对于这个其实想了很多包括我之前做的很多经济学方面的研究对于这个问题想了很多就 AI 肯定会加剧这个社会的不平等这是百分之百会出现的一件事然后另外就是如果你想你是不是 200 年前的时候去看现代社会那么现代社会就是通过税收的政策让百分之一的人养了百分之九十九的人百分之九十中国嘛大部分的人是不纳税的美国
大部分的人纳税非常非常的少就是有一部分纳税的人他去养活了底下全部不纳税的人欧洲是更加明显的这一个体现所以我觉得这是一个必然的发展的趋势
是的对这个我刚刚听你说你说对我刚刚听健力讲的时候我有一个感受就是以前我们用图灵测试测试机器有没有超过这个人类智能现在我们用 AI 来测试看你是不是一个 lapse
这个 superman in the future 对吧嗯对是的我觉得这个这个既然你说你继续说我有个提议啊就是我们这个这个这个播客的结束因为我确实很喜欢他们做的那个这个这个这个年度的展望哈然后我想
如果可以的话就是我们四个人都简单说一说觉得二五年可能会发生什么在 AI 里我们觉得重要的值得关注的事情做一点点小小的近一点的到年底就可以被证明或者证伪的预测 OKJay
Jenny 先开始吧 OK 我又讲一个观点吧其他的我觉得我们都可以就之前都讨论了很多我觉得 2025 年 AI 基础设施的价格会倒逼所有公司进行定价和商业模式的创新因为在 2024 年和 2023 年的时候都是大厂在补贴 AI
你像 OpenAI 和 Microsoft 现在关系不是特别好了 OpenAI 出来说要投 500 个 billion 去那个 Stargate 那个项目对吧 Microsoft 的人压根就不在那压根就没有站出来支持这件事 OpenAI 说我要不断地投资把我这个产品做大做强 Microsoft 说这个东西到底花了多少钱我们到底赚了多少钱这个
ROI 到底在不在哪所以说我觉得 2025 年的一个很大的趋势就是因为底层模型训练和推理的价格越来越高它要倒逼像乌特尼亚这个公司要想如何降低功效然后如何能够提高它的定价
来就至少能够收回本不能每一年都亏就大几十个亿美金吧这肯定是不行的不可持续所以说他如果随着 OpenAI 这样的公司去改变他的定价增加这个定价的话那么他这一个相当于寒气是要向下就是让每个人都感受到的所有的创业公司
都会被逼着去提高自己的定价就是改变自己的创业模式这也就回到了我们之前 Jade 提到的一个观点就是如何从 SaaS 的模式变成 Service as a Software 用服务去替代软件这样子你就可以去收更多的费我觉得这是一个很大的一个趋势听明白了 涨价
我觉得 2015 年的话我们就从投资角度来说的话我觉得肯定是会有 major acquisition 现在收购 pressure 太大了特别是大伙伴来说的话他们不想要 fear of missing out 然后再加上就像 Jenny 刚才说的其实从 pricing 的角度来说已经达到一个临界点从过去几年的补贴你需要有一个很明显的一个
RI case on application side 另外對於巨頭來說的話我這幾個巨頭並不僅僅只是 AI 巨頭包括像 Salesforce 那些老一代的上一代的這種 SaaS 巨頭有錢的巨頭已經到一個臨界點了 They have to do something
在過去的話我們看到的並購案其實更多的是 merger acquisitionsorry, apple hire 就是主要招人才但是今年的話可能會看到比較大的 10 billion 20 billion 甚至更大的 acquisition 以 ROI 為基礎的一個非常明顯的一個 strategy value 加上 business value 為基礎的 AI acquisition 我覺得今年應該是會發生的浩鳴呢 你自己呢
我自己啊我先听他们讲我有个感觉就是说我觉得好像就是二五年是个转折点这个转折点就是以前你只需要讲梦想然后好像这个二五年你需要告诉我们 OK 这个梦想你讲了很长时间了对吧正好赶上这个 print train 这个撞墙所以我感觉就是说二五年都是大家要在
进一步的深化这个 adoption 然后我其实的一个有一个感觉是我觉得一定会发生有一个是我的大胆预测我觉得一定会发生的就是我会有很多围绕着 agent 的创业就是你不是服务于人的就是我服务于怎么让这个 agent 工作的更好
就像刚刚 Jay 说的对吧你的 agent 的 protocol 会不会有一些 news 就是给 agent 来阅读的因为 agent 的阅读速度跟我们人类是不一样的对吧所以就有可能将来就是说你会做很多服务于 agent 的东西然后他只是 simulate 出来很多东西给我们人类看让我们来理解过程就像你在那个视频里说的其实他没有必要把这个操作过程给我们看的
他只是为了给我们看让我们理解所以我觉得这个是我觉得 25 年增加信心吧不然你怕你不相信他对的所以第一个呢我觉得是会有很多围绕着服务于 agent 的一些 infra 或者是一些创业机会第二个呢是我觉得这个 agent 以后的一个工作是帮助人类理解他在做什么
这个是一部分然后还有一部分呢我自己的一个感受就是我不确定 AI 这个 2C 狭义的 2C 就是狭义的什么 social media 什么的我觉得我看不到就暂时我觉得没有什么 trigger 在但是呢我觉得在有一个方向我还是比较看好就是在视频因为我觉得今天的这个 AI 发展的能力它到了它能够很好地去理解视频了
所以包括这个字节啊等等一系列这公司的投入从我来看我还蛮看好在二五年不管是这个视频理解视频剪辑以及在视频生成上都会有突破 SORA 的模式不一定它技术比 SORA 更厉害啊就它会更像我觉得我自己预测就是二五年的视频会有点像二十年的代码
就是变成了一些人可用的东西对但这个假设呢我觉得可能错误的概率高一点但第一个假设呢我觉得可能这个正确我信心更足一点这是我自己的一个感觉对我觉得大家都说完了我感觉我自己的理解就是在这个范围里面呢我觉得可能是像像 Atopic 的这个模型能够把
新的模型它不会在今年年中它能够把我们整体的最好的头部的几个模型公司的模型推进一步我们能够有更好的推理和有更好的 reasoning 能力这个肯定是 2022、2025 年能看到的但是能不能到就像机动驾驶一样能不能够到 L4 是吧现在我们 L3 这个还差一点距离但是 2027 年可能能到
L4 级别这是第一个 然后第二个就是我比较扮演刚才浩铭说的我自己因为我玩这个比较多玩这个图像视频生成比较多 比较有趣而且我感觉从现在来看它能够在 2025 年会有一个更大的跃进在视频的空间理解生成上面或者空间智能 空间智能可能算是另外一种分支这个上面很会对视频生成或者说是
互动的视频生成或者游戏的生成 3D 的生成会有一个大的推进在 2025 年这个里面它如果再往前推进再配合语言模型的这个逻辑 Razor 的能力变得更好了那么我们能够让语言模型这样的 Agent 来驱动这种更好的这种的
多媒体的内容的生成会是一个我们能够在 2025 年底或者下半年看到的一个跃进然后第三个我觉得就是关于大家对投入的思考其实刚刚说 Token 就是资源你这种把价格打得最便宜了之后价格打下去我们一定要想新的这种盈利方式就是刚才 Jenny 前面提到的这个问题我们所有大厂头部的公司都会来重新考虑这个问题
包括创业公司也会考虑重新思考但是 token 肯定会越来越便宜所以说我们的商业模式会构建在传统的 SaaS 模式的这种订阅智能或者说是完成任务智能我觉得这个是可能 2025 年会有更多的通过完成任务来收费的公司就是 Agen 代理公司出现对 这个我感觉的是一个因为 SaaS 钱赚不回来这个会赔本的对 赔钱这是我感觉的 OK 那么我觉得很好我们今天聊了这最长的一次了还有 90 分钟谢谢
那么这个我们就在节目最后嘛我们这个欢迎大家今天这个这个 J 和 Jenny 能够参加在我们农历新年之前的一期节目我们就祝大家这个春节快乐新年快乐拜拜