大家好,这里是海外独角兽开源 AI 研究平台海外独角兽的同名声音栏目我们主张用开源的研究和讨论精神链接全球 AI 从业者行业瞬息万变我们在这里拉起认知,火平鸿沟
时间太快了又到我们做全球大模型季报的跨年特辑的时候那我们再口播一下如果大家一个季度只听一集大模型播客希望听的是我们的大模型季报我觉得去年 OpenAI 还像黑暗中的一束烟火突然之间就点燃了全球对于新一代人工智能的热情到了今年呢我们能够明显地感觉到很多科技公司的战略切实地发生了转变
所以去年更像是一个启蒙的阶段那今年进入了实践阶段那今天的跨年特辑我们就从 AI 界明星中的明星 OpenAI 开始聊起关于 OpenAI 我听到过两种说法一种是说觉得他们是一个期货公司随着预训练 Skinning Law 的金矿挖完了他们的领先技术也到头了那另一种说法是说千万不要低估 OpenAI 的实力它是一个非常了不起的公司还藏了非常多的牌你怎么看这家公司过去六个月认知有发生过变化没有
首先你看 ChatchP 官方公布的那个 WU 那个周货已经过三个亿了那就得对应五到六个亿的月货明年这时候可能十个多亿月货其实这个增速是全球所有科技产品中应该历史最快的还超过了 TikTok 之前的增速 TT 大概是用了四到五年时间做到五个多亿的月货我觉得确实 ChatchP 营销或者 Hype 因素存在但我们还是得思考一下背后意味着什么
我觉得最本质的一个问题就是说认知变化最大的就是叫下一个 Google 就是 TrashP 就是奔着下一个 Google 这个方向去了不管 Anthropity 也好 XCI 也好 Populacity 也好甚至国内的豆包 K-me 做 coding 最近比较火的 Cursor 也好或者 Divon 也好我的一个认知就是说虽然大家形态有差异
从不同的路径发散最后都还是殊途同归最终会收敛在叫下一个 Google 这个叙事下都是奔着这个最大的目标就是你的对手和目标并不只是 Chad GP 而是如何 beat Google 我觉得这是最大的牌我也不觉得 OPI 会刻意藏什么牌下一个 Google 就是一张名牌比喻一个综合的能力资金 GPU 人才产品品牌我觉得是很充分的一个名牌的竞争嘛
这个很有意思因为其实他回答了一个非常重要的问题就是基础大模型和基础大模型的这一波产品他们到底在争夺着什么我觉得就争夺一个东西就是下一个 Google 下一个 Google 我们怎么理解呢就如果大家来硅谷的话我觉得一定要去逛一下那个计算机历史博物馆就你转完一圈就很能理解叫计算架构和信息分发这个主线是怎么演变的
你看最早是雅虎那个门户模式人工编辑 listing 最小单元就已经是网页了门户模式呢因为它只能 listing 这个头部的网页就非常有限那后来出现了 Googleindex 的整个网页用关键词搜索的模式又重新组织了信息分发红杉美国最早投了雅虎对吧就为什么投 Google 呢 Michael Morris 当时有一次分享提到最早是希望 Google 能帮雅虎
更好的覆盖常委网页的内容因为常委的内容是只能通过关键词模式才能被启动触发的这就需要对整个互联网做 index 我觉得这里很有意思的是做门户的人当时都觉得 Google 这种关键词搜索是做不大的但 Google 也是从雅虎的边缘市场撑大了做起来的我是感觉一定要重视边缘市场起来的往往伟大公司都还是从边缘市场做大了做起来的
顺着信息分发往下讲信息分发中间有一个演变叫推荐引擎根据用户的行为做投票其实人是变得更被动了一些 AI 更主动的给你推荐其实最小单元从网页变成了内容其实字节也一直在超越姑姑的路上紧接着这两年我觉得又开始了叫
搜索和推荐融合的一体化其实你从小红书这个产品是能看到一些影子的我觉得小红书非常有意思其实你看它包含了社区信息流推荐短视频图文多么太对吧现在又是最高质量的搜索引擎其实这个形态就融合了
搜索推荐问答包括未来做任务的一体化我觉得未来会更有意思你看今天的大模型这个技术呢其实最小单元比网页更小了因为最小化的原子其实相当于 tokentoken 背后其实就是叫人类几千年抽象的智能嘛
其实大模型是重新组织了智能未来会以 agent 或者说一个做任务的形态输出我觉得最后就是一个任务引擎就完成 task automation 这个事我觉得未来 HGP 肯定是要融合了搜索推荐问答做任务等等等等很多的东西肯定也不只是今天的形态吧
我觉得过去几十年互联网是把零售和线下的东西搬到线上化了对吧我觉得未来可能就是把人类更多的工作流和任务最佳实践给自动化的一个过程我觉得只能说今天 CHP 形态还是太初级了我觉得未来一定是一个融合性的产品窝型也会更主动就像一个助理
模型也可以在后台一直长时间的思考比如说几个小时几天甚至更长比如说人今天学了东西我们就实时更新了自己大脑了对吧模型后面学到人类的新的知识也可以实时的更新到自己的神经网络里面而且模型的学习效率有可能比人还要更高的而且它可以花非常长的时间进行思考
你刚才说未来会以 agent 或者做任务的形态输出我今天还在想要是有一个会做饭的机器人就好了他可以通过育训练学会各种各样的菜谱然后做一个做饭的任务他能做到吗我觉得是能做到的因为今天厨师的最佳实践是没法被传承的如果 AI 的学习效率变得很高他能把顶级大厨的手艺学回来那我觉得这个最佳实践就被抽象成算法了大厨的 task automation 这个事就完成了
但前提是要有反馈什么样的菜做出来比较好吃这是一个奖励模型这个奖励模型相对还是一个封闭系统我觉得是相对好给出的我觉得这个应该比较简单但是它难在机器上难做对这里你除了提到 OpenAI 还提到另外两家公司一个是 Anthropic 一个是 Populacity 他们今天长得和 OpenAI 和 GPT 是很不一样的但他们也都在争夺这个所谓的下一个 Google 的这样排对
我感觉大家都在计算架构和信息分发这条主线下都是同一个技术杆杆所以大家都是殊途同归的虽然大家形态和商业策略肯定有差异但我感觉 OpenAI 正在把自己变成一个 K-Lab 当然也是今天唯一的 K-Lab 在 C 端一技绝尘但我感觉 SR 正在走向一个 AI 时代的叫 OS 操作系统一样的路径就占住了 coding 占住了协议
尤其是最近发布那个 MCP 那个 context 我觉得 PropertyLessy 最大的创新还是重新定义了 AI 搜索这个形态吧其实是 AI 在帮你使用搜索引擎它其实也是一个 agent 就是用户可以围绕一个主题一直追问和互动对吧我觉得互动是很关键的就是你可以跟整个互联网整个网页在互动了而不只是一个静态的网页和内容的输出吧产品产品的最终最终
我觉得大家都会变成一个叫任务引擎或者一个任务容器我觉得这个任务引擎是我逻辑中的下一个 Google 的幻想吧你说任务容器它跟任务引擎这是一个概念吗我觉得一个概念只是说今天还不好怎么定义它因为以前大家会叫内容容器对吧今天是用任务来替换你的内容其实你看头条就是一个任务容器微信也是一个任务容器它们也都是一个浏览器
那未来这一波 AI 最大的是做任务
未来完成 task 尤其是有经济价值的 task 以前生成的最大的是内容我觉得未来 AI 生成最大的是任务 agent workflow 你比如说我今天研究二级公司的股票我怎么去寻找信息的我怎么去处理信息的然后我怎么去沟通的我怎么去拆解的就是我的一个投眼的 workflow 它就可以帮我 automate 出来而不是说
几十个人在帮我开发这个 workflow 我觉得这就是我的一个投研的 workflowagent 也好争夺下一个 Google 一定是需要自己自研机座大模型吗你觉得有可能在别人的模型上盖房子吗我其实更相信端到端 full stack 策略的胜算更大吧当然这样要求投的资源也很大即便看 Proplastic 现在发展很好对吧它其实很难向下大幅改动模型或者搜索的 index 的
但 Google 的端到端优化能力是很强的它可以向下改 TPU 改 Transformer 其实端到端优化我觉得是一个非常重要的其实你看 Apple Tesla 都是端到端 Fullstack 的公司我觉得微软也是从 OS 往上做了 Office 这些 Keylab 但也不代表说 OS 这个公司一定能做好 Keylab 我觉得微软也没有做好浏览器或者搜索这两个 Keylab
我觉得这个问题其实不绝对存在即合理吧你刚才也提到说 XGBT 的数据增长很好它的 C 端为什么增长这么快我觉得从第三方数据也能看到就是它第二季度开始是明显加速的尤其是在 GPT-4O 发布之后吧单一个季度能涨 1.4 到 1.5 亿的 MAU 吧我自己的感觉最大的一个非设变化是
它放开了不用注册就可以使用我觉得这个背后其实是它模型的 inference cost 可以降到很低了我觉得不然的话一般模型公司是吃不消的包括它又推出了语音模式推出了 O1 对吧但我觉得背后其实还有一个叫模型能力的提升因为 ChadgetPT 用户数据量比较大的
你大量的用户在用呢有些用户偏好数据用户投票会让整个用户体验变好吧他的用户增长不错那他的商业模式问题呢 XGBT 应该做广告吗如果我是 XBTC 我一定会做广告吧但不一定适合做广告
我觉得这个问题本质是一个商业效率的问题我们可以简单算个账就是 TrashP 因为它还是一个典型的工具类产品其实工具类产品付费率能做到 5%就已经是非常优秀的了你看 TrashP 它付费用户是 20 美元一个月你算它 5%的付费率那一个 MU 就是一美金那剩下 95%的人其实是不付费不贡献商业收入的
但我感觉拆机付费率是肯定到不了 5%的我猜可能就 2%到 3%大概就是 0.5 到 0.6 美金每个 MAU 横向的对比互联网产品抖音淘宝微信他们大概都是接近大几百亿美金甚至千亿美金的营收的产品大概也是 10 个亿的月活每个 MAU 每年就是 100 美金每个月就是
8 到 10 美金所以传统互联网产品其实是比 TradeP 的变性效率是高出个 10 到 20 倍的你说 TradeP 现在由 200 美金的定价来甚至 2000 美金的定价对吧但如果他定这个价格我觉得付费率肯定也是会下降的吧一个是能付 200 美金或者 2000 美金的人很少我觉得二是有竞争问题因为 Clover
Cloud 也好 XCA 也好 Google 我觉得都在后面因为有一个竞争问题存在我觉得很难定到过高的一家其实我觉得刚才问的 AI 的商业变现效率我觉得这个问题是很关键的不然你后端成本每年 5 倍 10 倍的往上涨但你前端炸不出来营收我觉得是不能持续的我觉得历史上任何的伟大公司好像背后都有一个极强的商业模式驱动的你说
后端成本每年 5 到 10 倍的猛增但是这两年每百万 token 的成本是在下降的是的这个是符合咱们之前预测的就是一到两年应该降了十几倍吧那为什么后端成本是在猛增的后端成本猛增主要还是买 GPU 吧其实去年大家手上的卡是不多的
今年全球第一 T3 公司才到了十万张卡但十万张卡肯定也是不够的有可能它到一个量级之后不再猛增但现在还在一个高速猛增的阶段为什么恰到不适合做广告我觉得这是一个有意思的问题就是你看
Google Search Query 里面其实大概有百分之四五十都是导航类的 query 一个关键词来了 Google 就直接给你导航到某个网页比如说电商 娱乐 旅游 订票其实广告主是通过网页提供服务的 Google 导航过去就能赚到钱这个商业模式我觉得是非常好的其实
抖音淘宝它商业模式跟 Google 也是一样的都是搜索和广告系统其实这个商业效率是很高的因为它有巨大的规模效应但我们看 Chatbot 今天的 query 其实它导航类的 query 是非常少的 Chatbot 今天很多的问答其实都是问答类的 query 其实这个对应传统搜索引擎里面我感觉就 4%到 5%的叫知识问答 Google 过去也一直没能把这 4%到 5%的
知识问答 query 给商业化吧今天看到我觉得 so farChad GPT 还没有本质上影响 Google 的基本盘呢因为广告主还是不会来 Chad GPT 投广告获取流量对吧做生意的那 Chad GPT 未来怎么挣钱我觉得一方面最大规模付费的来源可能还是来源于商户
作为广告主吧最能 skillable 吧因为广告主还是要对消费者提供服务嘛我觉得另一方面可能还是要探索新的商业模式比如说按照任务付费最后按照任务完成率对吧其实电商是按交易付费的对吧就是你看过去互联网的电商它最核心的一个指标叫 GMV 那个时候就看订单转化率我在想 AI 时代最关键的北极星指标会不会是叫任务完成率那个 task 对
你本质上你要完成有经济价值的任务对吧只要你的价值足够厚了我觉得肯定还会有全新的商业模式出现的按照 value based 的一个 pricing 对吧其实你看抖音就催生了新的商户对吧我觉得内容创作者创造内容本身就服务了我觉得未来新的服务可能就是大量的应用软件或者 agent 提供解决各类任务吧你觉得 Chatbot 现在这个产品形态会是一个过渡性的产品形态吗还是它是一个最终的形态
如果是过渡它未来会怎么演变未来会有什么新的形态 Chad Bolt 我觉得这个对话形态大概率还不是提取智能最有效的交互方式吧但这个是今天唯一 work 的形态因为 Chad Bolt 它的适用范围广然后兼容性强我觉得未来肯定还是需要更不一样的形态的今天大模型的智能水平已经挺高了比如说我幻想
我的面前就是一个 AI 的浏览器或者一个巨大的白板或者一个任务看板很多的任务都跑在上面 To do list 各种图表只需要我来确认和指导下一步怎么做围绕某个 topic 可以无限的展开对吧我觉得还需要一个好的产品形态来降低用户的门槛呢
其实今天 Chatbot 的对话门槛是比较高的有时候我面对 Chatbp 也好 Cloud 也好我都不知道怎么提问的如果模型更主动的给我说其实我可能会更容易的下手其实你看今天我们下载了抖音下载了小红书就能用起来因为系统会主动的给你推荐我的感觉是单一的 Chatbot 大概率不是 AI 的最终形态的模型是可以更懂用户的需求的不需要跟用户对话我觉得就可以踩到用户的意图
比如让模型阅读我过去几个月 Chrome 里面的浏览记录它就有了更多的上下文的 context 我觉得这样就会更懂用户了我觉得今天 Chat 的这个形态其实是限制了上下文的长度的其实是一定程度上降低了模型的智能的数值的其实我感觉长期有可能就是越聪明的模型其实越不需要
跟人对话我觉得 AI 未来需要自动的采集用户的行为信息上下文变得更加主动比如说抖音和淘宝其实是主动可以给我推荐商品的对吧我觉得你这里说的很有意思一个点是说就是对话它不仅仅是对话这个产品本身而是它也是提取智能的一种方式它要有 contextcontext 是一个特别重要的东西欧巴马技术有五个分级第一级就是现在这个 chapel 聊天机器人
用自然语言进行对话的人工智能第二级是推理者就大概是我们见到的 O1 这种可以解决人类级别的这种智力性的问题那第三级是 agent 智能主体它能够有代表用户采取行动第四级是创新者第五级是组织者那你怎么看这个分级它会是产品型
我觉得这个分级标准非常好应该把它作为一个主线的线索去想产品形态演变我觉得今天可能处在二到三之间我觉得所以明年最期待的是 Agent 落地我觉得还有两个思考角度就是第一个角度你可以画一个企业的组织架构图 AI 的能力就是从下往上一直干到 CEO 那一层
还有另外一个角度就是说你可以再把企业内部的能力做拆分比如说 coding 编程能力设计能力沟通能力 search 对吧寻找和处理信息的能力数据分析的能力对吧 AI 也会横向的一个个把这个给干掉一个是从下往上
一个是横向的工种也对应你说的那个五个分级吧我觉得短期你说干到一个企业的 CEO 这个层面还是比较难的但我觉得两年左右的时间干到一个 manager 这个水平是有机会的 manager 大概能等同于 agent 吗我觉得长距离多部推理任务如果能落地了其实会超过 90%的 manager 我觉得 25 26 年是看得到的
那这些 AI 如果进入组织的话它是跟人配合工作还是它能够独立完成的工作我觉得肯定是还是需要人配合的但是它能完成的任务的数量会大幅的提升你刚才说要模型更主动这样能增加人的互动也能够帮助 AI 提取智能那怎么让模型更主动呢我觉得一方面是要产品形态怎么设计的更好
可能的一个形态我觉得就是个人助理或者超级助理这个形态吧助理是更主动的我觉得另外一个更重要的还是技术架构尤其是刚才提到 context 我觉得 99%的人从业者今天都只盯着模型的生成能力或者 coding 能力我觉得更加核心的一个可能是 context 的采集能力如果没有 context 的同步
其实绝大多数的任务成功率都非常低的我觉得 context 是非常重要的我觉得绝大多数人可能还没意识到就是最简单的一个再牛的主任一师如果没有你的体检报告或者健康数据或者检查报告也很难跟你聊几句就下诊断了我觉得 context 就是
其实你的各种背景上下文信息我觉得这是一个关键的暗线之前咱们的暗线说可能是 R 也好是 cost 也好我觉得今天这个暗线可能是 context 越来越清晰所以谁能获得更多的 context 谁的智能水平的提升会更快是的 context 可以展开讲一讲吗然后以及 context 可以通过什么形式获得有一个简单的比喻 context 可能就是新时代的支付
就是之前红杉中国投电商的时候有一个非常精辟的认知就是电商的两意是物流和支付就为什么呢这是两个最基础的商业基础设施对吧如果没有这两个要素其实你的网购体验都非常差没有支付没有物流对吧其实买东西的成功率是非常非常低的那我们今天回到 AI 的模型来帮你做任务你任务成功率的高低其实不完全取决于模型的生成或者 coding 能力
它更取决于你的 context 是否充分的同步了我觉得更具象一点说比如说我要做一个我个人的 agent 也好我个人的网页也好我很难说我给这个模型说各种 prompt 一句话几句话我可能描述个半篇它也没办法把我的个人 agent 或者网页给做好但是我把我的个人知识库
把我的各种个人的软件的一些信息同步给他他还可以用搜索引擎去搜网上我相关的信息其实这样做一个个人的 agent 或者官网是更为成功的因为他有更多的数据 context 不然你纯语言 prompt 其实是非常费劲的
而且我感觉 context 获取数据同步我觉得应该是自动化的而不完全是在人工的去 prompt 比如说我们有一个 Cloud boat 在 slack 里面他一直默默的跟踪我们怎么做投研怎么讨论各种话题的对吧他看我们怎么找信息怎么跟人沟通其实某一天我再交给他一个任务
它各种的上下文都有的这样的话沟通成本就非常低了时间长了之后你让他帮我做一个我怎么做投演的 workflow
我觉得他就可以自己总结出来一个 workflow 出来的这就是慢慢沉淀一些投研的最佳时间的工作流了那这种情况下用户个人隐私问题怎么办今天我们所有的数据都在互联网上我们会真的关注隐私吗 1%的用户会关注隐私但是 99%的用户会被效率和能力吸引滚滚大势阻挡不了吧
那如果 AI 是中心化的 AI 比如说它也知道你的信息也知道我的信息它会把我的信息告诉你吗那我觉得新时代的安全机会很大如果 AI 的生成能力增强了未来会生成的是什么呢我觉得这是一个非常值钱的问题我的答案是叫新时代的软件移动互联网增加最大体量的数据是内容智能手机随时的创作和消费内容我感觉 AI 时代最大的增量数据其实是软件就我们今天可能要想一个问题
就是软件的本质是什么其实软件的本质是叫人类行为的自动化就是企业软件是叫那些最佳的工作流的自动化对吧那我们再思考一个问题就是说未来的软件应该是怎么样的未来的软件的开发部署未来的软件的开发范式又会是怎么样那 SAP 这些公司价值在哪里
SAP 是从过去几十年整个生产制造业的最佳时间的工作流自动化下来了分发给了低效率的很多的地方那这个最佳时间的自动化是 SP 更重要的但是整个人类还有特别特别多的行为最佳时间是没有被自动化的我觉得这个是未来增加的巨大量的一个东西你觉得这是增量的机会
对未来软件长什么样我觉得过去软件都是人为主动去定义的定义出来一个通用的需求之后一个大的外包团队去开发对吧就像传统导演去拍这个电影对吧那你看未来的软件我觉得不一定是人为主动去定义创造了而是你日常的 context
自动同步给模型它会更加自动化的生成软件比如 AI 知道我日常怎么做投研信息的对吧它就帮我 automate 整个的过程我还可以 share 给我的同事这个 workflow 今天不可能有一个几十个人的开发团队专门帮我去开发这个投研的 workflow 对吧因为只有我自己用嘛这个
投入产出比就不够高之前不可以聊到就是未来的软件生成会不会就像今天的短视频内容创作一样门槛非常低我觉得还有很大概率就是说
我们自己也不知道这个任务怎么完成就像平时我交给同事做这个任务这个同事和 AI 都是自己做了很多探索有自己的规划我觉得他们都能更有效地探索出来一个更好的工作流所以我觉得很值得思考的一个问题就是说如果 2025 年 AI coding 能力变强 5 倍 10 倍 30 倍
软件开发效率提升个十倍软件生产成本大幅的降低会有哪些的机会那我觉得当一个软件面向给普通的消费者的时候他可能不教软件
对这里是需要好的产品形态定义的就是 agent 来了 coding 能力变强了是需要一个非常重要的产品形态接着的你比如说 2011 年的时候我们去投推荐引擎投推荐引擎本身是没法赚钱的但是我们要投信息流产品投了信息流产品最早的进入头条还有后面的抖音就是上次聊到过去没有做机器学习和推荐的都没有成为大公司对吧移动会员往事态
但是你不能专门为了投 coding 去投 coding 而是你要投 coding 这个能力象限下未来有什么产品形态能出来推荐引擎造就了信息流这个产品 coding 未来会造就什么一方面是服务传统的软件开发另外一个就是像我们刚才提的更民主化的我觉得会有更新的形态的今天是需要一个天才之前字节定义出来信息流这个产品是绝对天才的
《流浪地球 2》里面刘德华饰演那个角色他用 AI 重写了底层操作系统就这种科幻电影场景里面是不是也会实现我觉得他就发展到你说的那个第五集了那个架构逻辑复杂度是非常非常高的刚才说到
那你说 coding 和下一个 Google 它是一件事吗我觉得都是同一件事大家殊途同归吧因为背后的技术底层都是一样的因为最后都是一个任务引擎就是最后完成各类任务的自动化为什么大家就是在一个新的时代要做一件事情要想就是下一个 GoogleGoogle 对于互联网时代意味着什么呀
我觉得下一个 Google 不是 Google 本身也不是搜索引擎本身它是重新组织信息本身过去是门户组织了信息搜索引擎又重新组织了网页推荐引擎又重新组织了信息只不过未来重新组织这个信息和 token 变成了另外一个引擎变成了大盲星而且重新组织这些 token 背后本质是智能或者代表的任务叫生产力对吧我觉得背后都是要你看淘宝是重新组织了商品
下一个 Google 我觉得不是做 Google 本身而是做一个更高效率的东西而且能解决更厚更深的问题提供更大的价值那你怎么看 OpenAI 人才流失这个问题我感觉应该还是组织能力出了一些问题吧 XGP 今天的成功很大程度还是依赖他们最早的 research 能力的非常强非常领先对吧早期技术遥遥领先带来的这个心智和品牌的红利吧
但其实我感觉好像过去一到两年并没有很好的接住这个技术的红利我觉得最典型的两个地方就是搜索和 coding 其实搜索和 coding 他们今天都不是明显的第一名其实搜索是肯定很重要的因为是一个高频或者高粘性的一个 fisher 对吧这
Chadgp 这个自己竟然没有做很好其实我觉得非常不应该的给 Proplastic 留了完整两年的窗口我觉得不然 Proplastic 也不会做这么大另外 Coding 这个能力还是被 Anthropic 那 CloudSonic 反超了我觉得最开始以为 OpenAI 不太重视
但过去半年了我觉得还没完全追上其实 coding 里面已经大量的开发者迁移到 Cloudsonic 生态了吧肯定还是组织或者哪里出了一些问题的包括也不可能那么多的老人也都离开了吧我觉得不是一个很好的事其实大家都说 Google 的组织问题很大
其实这样看 OPEN 的组织问题其实也不小你觉得像搜索和 coding 这种它们有独立存在的机会和必要吗因为如果按你刚才说的话它应该是一个统一的这种任务引擎它是一个巨大的一个任务信息重组的这么一个产品那搜索和 coding 还有独立成为一个入口的必要性吗我觉得这个问题不绝对还是那个存在即合理所以按理说微软做了 windows
Windows 上面的 Killer App 都应该做好对吧 Office 浏览器但是浏览器搜索都被 Google 做得更好硬硬的杀出去了我觉得不完全绝对只是说你掌握 OS 的公司它有更强的竞争力它可以端到端优化微软有企业级的关系它又做了 Edge 这个云它是更有优势的我觉得今天 Proplex 也好其他的 coding 公司也好它还没有本质上的
跟底层拉开差距而且过于依赖底层我觉得还不好说现在还
挺难下绝对判断甚至有可能 Cloud 我觉得未来就是一个 coding model 之前波克也提到过我就不排除它未来就是一个 coding model 它往上做 coding agent 做 Divon 今天的 Divon 是非常好的如果今天的 GPT Cloud 不做 Divon 肯定又是巨大的战略的 miss 我很好奇你对 OpenAI 的认知有没有发生过变化你现在是就现在的一些认知刚才我们聊的都是最近发生的还是说从第一天就这么认为
我觉得我更多还是投资或者商业视角吧我觉得第一个角度肯定是一直在想这个公司的投资回报率会怎么样
之前我觉得 OpenAI 就是一个 AI Lab 但是今年下半年看到 TrashPay 用户增长这么大我觉得开始能算账了对吧但你看今天它就是 1570 亿美金的估值了但又有点看不清楚它的 upside 又有多大了当然我们会拍脑袋说它可能是一个 T 万亿美金的公司但今天还是很难有 fax 或者尤其是那个商业模式的这个计算财务模型去算账吧
但另外你从那个技术革命演变的角度我觉得认知也是在变化的我之前咱们每期播客我都觉得智能和模型最重要其他都不重要其他地方其实我也没花太多时间但我觉得今天看未来两年 AI 应用端的落地 agent 的落地我
我觉得是非常重要的因为我发现最领先的三四加模型可能在模型层面拉不开绝对的差异了那靠什么赢呢对吧你比如说 OpenAI 的模型 Anthropia 的模型 Google Gemini 的模型都不错的包括 LamaXAI 还在奋力的追赶对吧但我感觉追上来问题感觉也不大
所以等大家追上来然后呢应用会差异化还是得做出来对吧其实你看 Anzorfit 他那个 Cloud Sonic 他那个模型夏天出来之后其实很多能力和口碑已经超过了 GBT4O 对吧 Cloud C 端和 B 端都涨得非常多但依然还很难翻盘拆 GBT 因为
ChadgeP 的 C 端的心智和品牌这个效应这个比例太强了因为我们身边 90%的人其实已经分不清楚哪个模型好了因为模型今天可能比 90%的人寻找信息和处理信息的能力已经强了那你认为就是行业里掌握最前沿认知的那一批人他们对于不管是模型能力的构想还是产品线的构想是跑着跑着刚认知到的还是从第一天他们就看到了趋势
我觉得绝大多数人也都是跑着跑着刚认知到的吧当然极少数人有自己一直的坚持吧极少数人刚想到对然后你比如说 Anthropic CEODaryl 对吧其实他很早很早之前就提 coding 非常重要不排除 cloud 就是一个 coding model 对吧他一直很重视的就是 agent 落地而不是 C 端产品就是
他之前可能觉得 C 端产品 TrashP 对 Push AGI 可能是没啥帮助的对吧那你比如说今天来看 Daryl 他今天的认知肯定也会发生变化他可能也觉得 C 端也挺重要的但他自己是个科学家对吧然后做 C 端消费级产品的 Sense 也没那么好而且 TrashP 有那么大的品牌效应其实也
挺难翻盘返超的我觉得其实很难预测未来但我们可以有自己的信仰或者 BET 其实每个人和每个公司我觉得都有不同的信仰或者不同阶段最重要的一个 BET 我觉得我们今天有一个特别重要的关键词叫做 agent 落地但是我对这个词我觉得我是没有什么画面感的它和今天我们看到的这种 C 端产品是不一样的它肯定不是一个 APP 对吧
我觉得 agent 需要形态的就是现在大家都没有画面感是这样吗我觉得 Property 就是一个帮你使用搜索引擎的 agent 我觉得 Devon 就是一个更好的帮你用好模型做任务的 agent 我觉得这两个是今天相对有一定 agent 的雏形的两个产品上一次播客我觉得还没有任何能称得上 agent 的雏形的我觉得 Devon 的出现属于一个 agent 的雏形的我觉得大家可以多看看 Devon 的 demo
我们重新再复盘一下 OpenAI 的领先优势是放大还是缩小的我觉得是局部放大局部缩小你比如说 ChadgeP C 端产品我觉得最大的壁垒已经不再是模型或者技术层面了今天看可能最大的壁垒是品牌或者新制这个是比技术或者模型壁垒是更高的其实你看 Cloud 模型虽然某些能力比 ChadgeP 要好但是很难反超我觉得品牌其实是更强大的壁垒因为你看 ChadgeP 今天领先第二名可能要十倍甚至更多的
这个数量级对吧这个领先优势还是放大的因为明年可能十几个亿的 IMAO 了预训练模型的领先优势是缩小的因为这里天然的那个收益空间在变小其实最主要还是因为公开互联网的数据快用光了嘛
20 个 T 30 个 T 可能就是一个 Tex 文本的极限了但还有一个就是背后的创新体系领先优势是放大的你就像好莱坞一样的这种工业化的拍电影的体系运训练环节可能就是 OpenAPI 的一个电影 O1 又是一个电影我觉得他们能持续地在智能这条线下做出新东西吧
我觉得这个可能是其他大公司都不太具备的即便给我们说这个电影具体怎么拍的我们也不一定能完全浮现这个结果对吧我觉得这个创新的工业体系其实最难了我觉得这是欧盘的内功吧就像我们每天看足球看篮球比赛我们研究了 C 楼怎么踢球的对吧视频回放看很多次但我们自己有可能也踢不进那个球对吧
OpenAI 到底会是下一个 Google 还是下一个网警失乐我觉得都有概率吧后面我觉得 OpenAI 要变成一个真正伟大的公司肯定还是要有一些必要条件的吧你首先它的架构重组要弄好如果马斯克诉讼 OpenAI 你只能保持非盈利那我就废了那人才肯定要流失嘛我觉得第二 OpenAI 肯定还是要找到更高效率的商业模式
不然这种每年 5 到 10 倍的 Kapex 持续上涨我就肯定不持续的我觉得这俩问题是最本质的其实组织问题会随着公司快速奔跑或者其他我觉得都可以解决的我觉得今天 OpenAI 的组织问题可能不比 Google 小虽然它组织小 OpenAI 过去有哪些被 overhelp 哪些是 underhelp 哪些期待不高哪些期待不足我们脑子里能想到很多关键词比如说 Sam 说的 7 个 TGBT5
合成数据突破了包括 AGI 这个口号 AGI 这个背后到底是什么有可能到底是什么也不重要了因为重要的是在往那个方向走我觉得这些关键词可能都是有点 overhype 对吧但其实整体来看我觉得 SAM 这样 hype 呢其实对整个行业是好事因为给大家争取了更多的资源
包括从业者的薪酬都翻了非常多对吧投入的资金也增加了很多倍哈罗手冲转跟马斯克是一类是的好像牛逼的人最早都是有争议的乔布斯也有争议对吧马斯克更有争议只要哪天欧盘牛逼了三部这些争议
其实都是天啸云散对那 Underhelp 呢我觉得还是智能这个技术的长期价值吧高估短期低估长期就是我们怎么理解智能对吧智能到底是什么就是你看今天如果没有电我们晚上就没法工作对吧智能我觉得起码能 automate 非常多的最佳实践
叫大幅的提升人类的生产效率吧你觉得从投资人的视角来看 XGBT 这个产品优秀吗我觉得从一些投资人经常看的指标上我觉得还是挺优秀的吧首先留存很好品牌心智很强对吧就是
C 端这种产品你比如看长期留存就是你从第三方数据看到它的长期留存是非常好的 12 个月之后还可能有 50%呢这个 Database 的年龄很高它跟 Notion 应该差不多的只是今天可能没有什么数据飞轮规模效应网络效应但说不定哪天后面是会有的比如说你看还有一个投资人会经常关注的指标就是 DAU 比 MAU 的比例
其实这个比例我感觉是不是太高的有可能典型的工具类产品可能就是 15%到 20%这个会决定你一个月有几天打开 DAU 比 MAU 是 20%那意味着你一个月 30 天你使用 6 天是使用的 30 天乘以 20%6 天那意味着一个月只有 6 天打开 XHP 这个是不高的其实优秀的产品都是比较高的你看微信的 DAU 比 MAU 差不多 1 比 1 抖音我估计应该一个月也会用 20 几天吧
小红书可能也用 20 几天 Google 搜索我觉得一个月都会用个 15 20 天甚至更多我觉得怎么把 DAU 比 MAU 的比例提上去这是很关键的我觉得还有一个关键的就是说 search 类产品你每天打开了之后用几次是很关键的如果你就用个一两次这是非常差的因为要么你没解决好我感觉可能 4~5 次是比较及格比较优秀的所以我觉得未来
你不管说怎么把使用的评词和粘性提上去更需点就是说还会不会有新的产品能 beat ChatGP 今天的心智我觉得只是 Chat 这个形态其实很难翻盘了我觉得需要一个通过一个全新的形态再占住用户的心智但如果商业模式或产品形态问题不解决我觉得今天的 AI 其实有点偏向
SP 移动梦网的时代还没有看到 iPhone 之前对吧基础设施没有那么成熟没有支付没有物流没有 RBS 没有摄像头其实就是高中刚用手机的时候只有图文但是还有一个特别有意思的就是所谓 SP 时代移动梦网的那些公司
在走向移动互联网的时候没有一家转型成为大公司的结果全是全新的公司不管头条美团拼多多移动互联网公司没有从上一波留下来的为什么 LM 产品的数据费用一直比较差因为用户带来的数据平均质量比模型内在分布的数据质量就是差因为你预训练的数据质量很高的但
但你大部分用户是没有模型聪明的那你带来的造型更多就相当于自动驾驶做到一定水平了然后你还在给他灌大量普通司机的数据他只能变差对
因为用户的数据可能更多的代表用户的偏好数据而不是能力数据一个是提升能力的数据一个是用户的偏好的数据偏好的数据其实不怎么提能力搜索也好推荐也好其实是整个人类在大规模投票那个是更准的这个是更好看的它这个是偏好级能力但今天是偏好不是能力
能力是另外一个数据既然这些 LLM 产品都想成为 Google 已经变身了一张名牌那你觉得 Google 在这个过程中有能力阻止这件事情发生吗我觉得好问题就是我对 Google 的判断也一直是比较 mixed 的一方面 Google 手上的好牌其实非常多 TPU 代表无线的算力对吧安卓 Chrome 其实代表最强的分发能力
只是之前受限于两个问题吧一个问题是 Google 大家都觉得他有组织问题对吧这个 CEO 比较面另外还有就是商业模式的问题因为今天 Chatbot 里面的用户的 query 其实变现价值就比较低嘛 Google 这种大体上的公司大幅的转向 Chatbot 这个产品形态其实很难了但我们更本质的想搜索和推荐其实都是信息分发对吧那下一个 Google 有可能是个超级助理结果我最近也在想
信息分发和超级助理这个的一统点到底是什么我觉得这是很重要的问题信息分发也是主线助理也是主线他俩机会融合也会竞争
其实你看助理是更主动的跟人更 close 有你更多的 context 对吧助理能占据用户的信任能有你更多的数据的 access 但信息分发其实也是一个方向助理也可以做信息分发掌握你的信息获取的来源但是做信息分发的公司比如说字节 GoogleMeta 其实也可以从信息分发走向助理其实 Apple 的 theory 有可能也是一个助理对吧
他们都在打同一场仗我觉得都是同一场仗就是所谓的下一个 Google 有可能下一个 Google 咱们刚才说是一个任务引擎也有可能是个助理的形态其实它本质都是一样的主要是今天我们还比较难定义出来助理这个产品背后到底是什么需求
还是比较难定义的但信息分发是代表什么人类最基础的需求就是要获取信息和娱乐对吧所以信息分发是一个基础的但助理这个到底是哪些需求会被激发出来我觉得这个是未来两三年能看到的它会长在手机上长在电脑上吗我觉得大概率还是在手机和电脑上
今天还看不到全新的大众级的设备出现那还是一个 APP 吗它是 APP 就有 APP 有很多的劣势就是我要找到它我要点开它它可以帮你使用工具帮你使用 APP 那还是要在这些 APP 之上的一个东西肯定是要离用户更近的所以 Siri 的位置是特别好的当然只有 Siri 这个 context 窗口输入效率输入效率还不够高有可能还有
屏幕对吧这个效率肯定还更高一些你比如说今天咱俩面对面在这对话效率高如果再有一个白板有 PPT 展示着效率更高你在硅谷逛完那个计算机历史博物馆就会感到特别的一个 moment 就是什么样的交互效率是更高的我有一个特别特别的一个 moment 就是从命令行到时代突然转到 GUI 我觉得真是天才
竟然能有天才定义出来 GUI 这个用户交互的界面图形界面对吧
我觉得今天可能我们把大模型看成一个新的计算机它其实需要一个更好的交互我觉得 Chadbot 肯定不是完全的 GUI 但 Chadbot 有它的好处就是广泛兼容但我觉得今天就是去年这个时候大家聊的时候还说大模型公司我们一定需要一个技术型的创始人到今天好像这个事情不再被那么强调了我们更需要的是一个超级产品经理
我觉得这个超级产品经理不懂技术可能也不行今天的 AI 的产品都是 Post-train 这个环节决定了有可能未来的超级产品经理是从做 Post-train 的人里面为什么呀因为 Post-train 决定了模型的各方面的性格各方面的偏好训练出来的都是一个差不多的东西所以 Post-train 决定模型性格
我觉得 Poststream 更大的决定模型性格当然在这个基础之上需要对交互理解更深的什么交互效率会更高比如说今天我有一个白板有一个 to do list 是不是这个产品图形化的界面会更好交互效率更高不只是我跟他对话对吧有时候意图胜千言那这个所谓的下一个 Google 产品当然它不是 Google 所谓的下一个 Google 你觉得它会是一个垄断的公司吗一个市场会有一家这样的公司还是多家
我目前倾向多加吧因为今天的 AI 产品还没有规模效应没有网络效应只有品牌效应除非哪天跑出来很强的规模效应其实 Google 当时的技术也是遥遥领先的加上后来出现了很强的规模效应和网络效应
我觉得它整个市场份额变得非常非常的高今天在你看来这场争夺战就刚刚说的这种所有的人都在争的下一个 Google 这场仗它到达了哪个阶段场上的选手们分别继人哪些优势互成何
红杉美国最近的篇文章其实总结蛮好的 Google 是端到端 Full stack 的垂直整合对吧 OpenAI 最大的壁垒是品牌但其实 OpenAI 的综合能力我觉得客观来讲也是第一的 Anthropy 就强在人才有可能是全球范围最牛的一个 AI lab 占住了 coding 或者协议跟亚马逊深度绑定也比较安全它有可能未来是一个 OS 你看 XR 数据中心建设很快
对吧但有个问题超大的进行有没有用我觉得今天还没法回答我觉得这也是 XCI 最大的 BET 就万一赌错了就下牌桌了那 META 呢其实就占稳了开源这个生态
其实 Meta 可能是 AI 应用端充分受益的一个公司 Amazon 这个公司我其实挺看好的它还是全球最好的一个云厂商而且跟 Azopri 的合作很好我觉得关系是更健康的比微软和欧凯的关系肯定更一致 Amazon 肯定要做自己的 TPU 的这个确定性也比较高其实你就看到微软在向上做应用 Copilot
做的非常拉垮那 AWS 向下做计算架构也是不同的 batch 我觉得相比微软我更喜欢 Amazon 一些吧
就你看微软我就今天看到的结果过去两年做产品能力是非常拉垮的最早跟着 OpenAI 去 HIP 对吧但其实自己的产品没做太好我觉得还是大公司太慢了吧就是其实你看 Cursor 和 Devon 这种开发者产品都不应该从微软的手底下溜走的但是呢反过头来说微软
肯定还是最后的赢家的因为它的销售和绑定能力太强了即便它今天错过去它肯定不是零到一的但是它最后收购或者抄袭你看那个 Teams
跟 Zoom 安全做 Octa 其实最终都还是能追回来的比如说我们看 Apple 它是握着最好的牌的但还不知道怎么打我觉得从固执角度 Apple 的股票一直是不便宜的说明大家对它预期是很高的我觉得你看小公司里面 Proplacity 它明显是强跑了占住了一定的品牌或者新制效应也有一定的规模其实他们今天每天搜索的 query 的量级
大概已经是拆除一半了这里只是搜索的 query 不包含其他的但这个量也是不小的我觉得 Property City 明年被收购的概率是比较大的因为任何一个平台公司都不能 miss 搜索其实搜索非常关键一方面你可以在前端收集用户的意图因为这个意图数据对平台极其重要另外一方面其实搜索又会重塑后端的技术能力
其实你看 Cursor 和 Divon 这个开发者群体的产品也是强跑型选手产品都做得非常好但我觉得后面跟微软和底层模型的关系是比较重要的竞争威胁我觉得主要是来自微软或者两个模型厂商吧
所以看起来除了 ChashBT 和 OpenAI 其他的这种大模型的产品现在比较明星的项目都是强跑型选手他们可能就是护不住他们的这个领地我觉得小公司的创业者一定要强跑一定要跑得快我觉得还是要形成规模相应或者数据会员网络相应这才能杀出来吧形成壁垒吧他们需要后期和大厂绑兵吗或者卖了我觉得这个问题也不绝对有的需要绑兵有的不需要绑兵你怎么看 OpenAI 和微软长期的关系
我觉得叫同床异梦吧两边都有不同的想法我觉得不像亚马逊跟 Anthos 那么简单健康吧我觉得微软跟 OPI 分家概率是不小的如果分家了微软自身的 AI 能力其实很拉垮的我觉得挺麻烦的
如果我是微软我一定会去投 Anthropic 这样其实反而更互补但他投了 Anthropic 的话他会加速他跟 OpenAI 的破裂我觉得未来有可能所有的云上有所有的模型所有的模型会布置到所有的云上我觉得 Anthropic 会像一个 OS 操作系统的厂商
其实微软的主线一直是 OS 我觉得微软是可以在搜索在并上输掉的但是 OS 是不能输的我觉得是 OS OS 相吸的其实你看 Windows 两朵云 Azure AWS 安卓 OS 其实都是 OS 我觉得模型就是新的 OSOpenAI 跟 Azure 是有分歧的 OpenAI 要做最大的 KLab
Anthropia 要做一个 OS 我觉得 OpenAI 有可能是端到端都做对吧 KeyLab 也做 OS 也做但有可能会不够专注做好 OS 本身那 Deep Sea 相对来说是想走 Authropic 那条路吗因为大家都没能在 C 端像 XGP 这样品牌核心值那么强所以大家只能去讲类似的 Anthropia 的故事它又不像 XAI 资源这么强对吧那我只能在
第一是某个能力比如 coding 极其领先或者未来还有其他能力对吧或者说在另外一个新的产品形态下变得更加的好对吧
所以总结一下就是整体来说 AI 大模型没有迎来 iPhone40 克今天来看其实依然非常的早这么多的 LLM 产品其实都在争夺新一个时代的皇冠上的明珠一样的产品只是今年产品定义还不清晰可能是下一个任务引擎任务容器下一个 Google 助理超级助理
那接下来我们来聊聊除了 OpenAI 以外的这几家公司的产品一个是 Anthropic 你过去半年对 Anthropic 认知变化是怎么样的我觉得 Cloud Sonnet 基本上是专业开发者群体认为最好的模型从 6 月 20 号发布 Sonnet 以后我觉得我身边非常多的人从 GPT 转到了 Sonnet 因为他们 coding 能力非常强其实 coding 对拉动 API 的消耗营收增长是特别明显的
反而我觉得最客观的评估一个模型能力的最核心的指标就是看 coding 因为开发者不会撒谎的真金白银的在投票
因为 coding 也是影响 resonate 这个能力的核心吧我的一个总结是叫得 coding 得开发者得 API 消耗有机会得生态做 OS 吧 Anthropic 另外一个好处就是管理层非常稳定吧就不像 OpenAI 这样抓嘛其实你看他们还持续在从 OpenAI 挖人我觉得未来一段时间还是能看到叫更多高水平的人还是会从其他模型公司转向 Anthropic 吧我觉得人才流动还是比较关键的一个信号吧
Dropin 发布的 Computer Use 这个功能你觉得对于市场后续的影响是什么我觉得这个今天可能还是有点 demo 或者噱头为主吧我就先发出来站住一个先发的心智第一个发的嘛其实今天准确率还是不高的但提升比较快我觉得 Computer Use 你可以理解这就是模型的一个 action 一个手执行的环节嘛也可以说它是一个
新的浏览器或者任务的执行器我觉得 Action 是每家模型公司必做的只是 Anthropic 第一个发了而且 Computer Use 还是多模态技术落地最重要的 case 之一因为你要理解后台的截屏要理解屏幕里面这些信息其实我还挺喜欢 Anthropic Artifacts 这个
我觉得可能也像是一个新的 browser 其实 browser 也就是一个任务的容器你看到的任何东西都可以编辑拖拽对吧我觉得今天还是非常出级的但未来的空间非常非常大吧
我觉得其实大家应该重视一下 Sorbet 最近开源的那个 Context 协议标准 MCP 吧我觉得这个长期影响会是比较大的是一个协议层 Authropic 大概的理解跟 OpenAI 有一个最大差别是它对 C 端投入不是那么重视你觉得他们接下来会加段对于 C 端产品的投入吗对 我觉得 C 端确实比较弱但其实 C 端也不小
收入体量也挺大我觉得主要是管理层都太科学家了吧因为你看他们他们 CEODaryl 我觉得之前是不太重视 C 端对吧觉得 C 端对实现 AGA 没啥帮助今天看我觉得确实可能也没啥帮助但对分发模型有帮助我觉得未来肯定要重视你看他们也开始投广告了对吧但管理层都科学家背景我觉得可能对
怎么做 C 端产品 Sense 差一些我觉得主要是加上 XGP 太强了我觉得挺难翻盘的他们现在产品负责人那个 CPU 那个 Mac 其实是之前 Instagram 的联合创始人兼 CTO 其实这个 Mac 呢还是现在 OpenA 的产品负责人 CPU 那个 Kevin Will 的老板
就是我觉得有可能它的产品能力是不是比 OpenAI 要强一些但是也挨不住 XGB 这个心智和品牌效应太强了他们有很大的先发优势你今天怎么认识大模型和极端产品的关系我觉得这几个 AI Lab 不一定能做出最强的 Killer App 但 Killer App 长期有竞争力呢我觉得还是需要端到端垂直整合能力吧要向下优化优化成本优化模型优化模型架构对吧
模型变小你要优化模型的数据的分布对吧甚至未来向下优化硬件到芯片我觉得端到端垂直整合可能是 Keylab 长期要走的吧但我感觉 Anthropic 可能会更专注在 agent 吧就是怎么让 agent 落地可能是 Anthropic 的一个 bet 那有可能 agent 也会落地到 TragP
那 ChashPay 最大的 byte 今天可能就像是一个是把 ChashPayC 端继续做大 10 个亿 20 个亿有可能未来它的生态长在 ChashPay 也有可能我觉得 OpenAI 有可能成为全球最牛的 K-Live 对吧那 DeepMind Anthropic 呢
可能会成为全球最牛的两个 AI lab 但 SRP 也有可能成为一个 AI 的 OS 对吧这个 OS 之上会长出来新的软件 agent 对吧我觉得更重要的是这两个 CEO 是站在人类的角度去想问题比如说 AFO science 可能就是他们的 K lab 消灭疾病对吧 push 人类的平均寿命到 150 然后我觉得更欣赏这个愿景吧
那 XAI 呢其实你看 XAI 的整个团队也刚过 100 多人对吧但 OPEN 还 2000 人 ANTHROPIA1000 人其实你相比之下 XAI 的团队是非常精简的那你也可以说人手不够用其实估值过高了是不好招人的因为很多人会考虑手上股票弹性空间你看 XAI 应该是全球范围内最快部署上线 10 万卡集群的对吧 OPEN ANTHROPIA 今天都没搞这么大的单一集群
马斯克现在还要搞更大的机群其实 GPU 资源是非常充裕的我觉得是应该够的但不确定 GPU 超大机群会不会带来质变这是一个本质问题客观来说就是 XI 的模型 Growk 今天可能还没有完全追上
Sonic 最新的 3.5 或者 GT4O 对吧但进步速度非常快这个公司成立非常短的时间训练了几次模型都非常成功几乎没有失败对吧我觉得下一代 Gorax 3 可能能追平或者说反超一些
甚至说在某些能力上做得很好我觉得 XI 可能有两个大的 BAT 一个是咱们都能看到的几十万卡集群对吧有可能带来新的能力涌现但这几十万卡集群到底有没有用我觉得今天没有人知道你没有试对吧但这个试的成本非常高第二个最大的 BAT 有可能是多摩泰因为
FSD 已经验证了对吧我觉得有可能他们是相信多摩泰的但坦白来说多摩泰这个是没有任何 evidence 能提升智能的今天训练多摩泰的与训练数据是不提摩星的智商的我觉得今天科学界的共识也是
多摩泰不提智商呢因为它信息密度比较低你说这个像素那个像素到底带来什么不知道对吧而且训练多摩泰的整个 infra 的挑战也非常大或者说大家投入在语言的太多其实在多摩泰资源的投入非常小的但有可能马克思觉得你们没怼够我可以怼够对吧那我觉得这也是他的一个 bet 但我感觉 XI 想要胜出可能还是要有差异化的吧比如像 SRP 一样从 coding
这类某个能力的象限杀出来要么就定义一个新的产品对吧或者一个新的形态我觉得还是得有差异化才能胜出或者说 XA 你直接把 Populacity 买了对吧你好好的做搜索其实他们的目标可能也不是 OpenAI 对吧最后也是秒着下一个 Google 不知道什么形态对吧
可能做信息分发跟推特一起做更主动的推荐我觉得 XCI 注定还是能成功的但 upside 有多少我觉得不知道你什么时候能看到 XCI 这两个赌注的结果明年肯定能看到你怎么看马斯克的公司我觉得马斯克公司今天有点 BTC 化不要算账也算不清楚
那个算账就输了那个马斯克的公司我觉得都是他的粉丝或者散户买单吧或者说更好听的话叫为梦想买单吧因为传统机构其实很难做财务模型过 IC 的
其实马斯克这个人我感觉因为中美关系他可能 may be 都很好我觉得有可能他更好的帮处理 TikTok 的复杂问题是更好的中美关系的桥梁对吧如果 TikTok 安全着陆跟 XI 深入合作未尝对 XI 不是一个好事吧那 Proplacity 呢其实 Proplacity 不是自己做搜索引擎它没有自己的模型没有自己的 index 其实它是帮用户更好的用号搜索引擎这个工具我觉得
我觉得 Property State 其实更像一个信息处理的 agent 我觉得复盘看 Property State 其实是两个点做得比较好的它是第一个把 AI Search 这个真的做得比较 work 了赢到了用户的心智第二就是说重新定义了 AI 搜索这个交互形态可以追问和互动
其实 Google 只是静态的导航其实 AI 这一代产品的互动性是非常重要的所以我有时候也会复盘说所以 AI 投资只要是正确的大方向大赛道口碑做的比较 work 的产品是个新物种
我觉得就是得激进的干今天的后悔都是之前不够更激进那除了 Populacity 另外一个很火的 AI 应用产品 Cursor 呢我觉得 Cursor 是成长非常快的你看 Sonic6 月份出来之后它 7 月份就接了其实你看从 7 月份到现在它的 AR 几乎从 0 涨到 7000 万美金甚至更多我觉得明年做到 2 到 3 亿美金
就是它新一轮不是也公布了吗 25 亿美金我觉得其实挺合理的我觉得 coding 的产品形态是要快速迭代的其实之前 GitHub Copilot 是补全下一个代码对吧现在是补全下一个 action 我觉得明年可能就要端到端的生成软件了
其实我觉得这一波技术浪潮下最喜欢的 AN Native 产品我觉得就是 Proplastic 和 Cursor 这两个吧可能还有 Devon 其实他们都是预判对了模型进步的方向所以预判接下来智能进步的方向是非常重要的那你刚才也说了好几次 Devon 呢我觉得 Devon 是
第一个真正意义上做长距离复杂任务的 agent 我觉得具备了几个重要的 agent 出行的要素了第一他可以在后台工作第二他可以做那种多步骤长距离的任务第三他可以在过程当中自己根据反馈做出自己的决策第四他可以使用工具用浏览器用各种东西用搜索我觉得明年可能最有价值的就是长距离的 long horizon 这种 task 吧
长距离规划的智能体对 MistralMistral 可能就不用再关注太多了可能他们做预训链可能也做不动了对吧我估计可能就在 Lama 的基础上做 Post-training 可能是更适合的其实请求从我们今天聊天也可以看出 25 年的跨年相比 24 年跨年我们聊的时候聊应用的篇幅比模型多出了很多增加了很多聊 OpenAI 聊 Transpity 其实很多也开始从产品的视角来看而不是单纯的从模型本身
是的你之前对 AI 大模型的很多预言事后都验证了那我们复盘完了刚才这些的公司的产品我们延续着之前我们这个大模型季报特色来聊聊对未来 25 年 26 年的一些关键的判断那刚才聊到智能进步方向非常的重要接下来我首先想问的是就是智能还会进步吗然后以及你觉得 25 年 26 年哪些东西是比较重要的
智能肯定会进步的我觉得百分百只是说他那个智商不一定是从 80 到 120 提升这么快但有可能从 120 到 125130 这个智商提升但他更重要的是他能干活了我觉得对 2526 年最大的期待可能就是 agent 落地尤其是长距离多步骤的任务 long horizon task
我觉得这可能是重点吧我觉得硅谷比较核心圈子的几个大佬级的人都在做吧 OpenAI 的 CTOMirror 出去也是做 Long Horizon 的 agent 我觉得也可以类比 Property StateAvon 当年离开创业想做 reg based search 嘛 Long Horizon 的 task 落地可能是 agent 的创业最核心的吧然后包括最领先的模型公司也好 OpenAI 也好 Anthology 也好我觉得都花了很大精力做 Long Horizon 的 task 吧
其实是一个做更复杂任务的 agent 吧你可以理解做这个长期规划是能替代的难点是什么要求的准确性非常高对工程能力要求是非常高的我觉得大家可以研究一下 Divon 我觉得 Divon 可能是一个比较好的 case 能把这种长距离 agent
就是一个样板吧明年 AI 运用会遍地开花吗我还是比较乐观的吧明年 Agent 落地或者局部落地吧可能 26 年更大范围的遍地开花 Anthropic 出了 MCP 对吧包括 Sonic 模型其实他们都是为了更好的让 Agent 落地我觉得比较专注吧包括 OpenAI 的 Post Training 整个 team 也有很大精力去支持 Agent 的落地包括 CTO Mirror 也出来新的公司对吧嗯
包括最近 Balance 产品的 demo 我觉得包括自己用看朋友体验我觉得还是非常惊艳的因为 Cursor 最近也发了一个 agent 模式的产品我觉得 agent 肯定是各个重要 AI 公司明年发力的重点那明年除了 agent 很重要你觉得还有哪些重要的产品形态的探索
会不会有全新的一个交互界面比如说今天 Chad Bolt 这个形态肯定是不能释放 O1 模型的能力的也不太适应摄像头多摸泰的能力其实我在想一个问题就是 AI 最关键的基础设施到底是啥因为当年搞电商最重要的是物流和支付 AI 时代的新的商业基础设施到底是什么是不是 Context
我觉得这个可能是重要的你说重要的明年我觉得商业模式的探索也非常重要今天商业模式还是一个 SP 移动梦的时代还是扣费模式我觉得还是需要更强的商业模式因为你得覆盖后端的成本其实你看 Cursor 虽然今天涨得快但它的 token cost 也很高每个月要付个几百美金给到 Sonic 这个模型而且还要给 GPT 的模型其实我觉得更强的商业模式
是结果但本质还是你能提供更大更本质的价值然后我感觉各个垂直领域也比较重要吧就是怎么能有高质量能 scalable 的数据你有没有几千条甚至上万条
比如说高质量的任务这些任务还都对应 reward 对吧有可能是需要一些高水平的专家标注的这个理论我觉得自动驾驶是不是一个相对完整的非常好的 reward model 的一个领域是我觉得自动驾驶是非常典型的端到端比较好的一个模型但是自动驾驶它的 action 的 space 是特别小的前后左右对吧盘头安全但
语言也好机器人它那个 action space 特别大所以这个 reward 就特别难定义只要在限定领域的 reward 其实是比较好定义还有像自动驾驶一样的这种限定领域的比较好定义的场景吗量化吗
coding 数学我觉得下一代模型也比较关键不管说传说中的 GPT-5Auron 对吧包括 Anthropic 的 Cloud 3.5 Opus 包括 Gemini 是不是也有更大的模型它们的能力提升到底有多大并不悲观但也不要过于乐观肯定还是会有提升的只是智商不会像以前从 80 到 120 这么陡峭了
抖翘的时候可能提升是快的 O1 这条路到底天花板能走到哪对吧 O1 搞完了可能有 O2O3 对吧
大规模 skill 这个 O1 O2 到底会怎么样其实有时候模型训练它那个收益来得快但瓶颈有时候来得也快这 O1 可能是叫走向 AGA 的叫必经之路但是天花板会不会很快遇到我觉得这个不知道但如果 O1 这条路失败了我觉得 AGA 可能还要再耽误几年你觉得怎么可以更好地理解 O1 的天花板我觉得可以举个例子比如说今天全球有 70 亿人对吧
咱们每天都在做任务你觉得这 70 亿人每天产生的新的知识增量信息多不多还是过去几千年老祖先产生的知识更多如果你把咱们这 70 亿人持续探索 Inference 一年的知识和信息加起来如果比老祖先的多那就本质上就代表一个事你可以用算力来换数据
我觉得这个会很伟大那就说明核能数据是成立的但如果七十亿人忙忙碌碌一年没有产生新知识没有任何的增量信息不如老祖先积累的多
那我觉得欧安可能很快就到天下吧我觉得没有老祖先激烈的多不一定我是相信 70 亿人忙忙碌碌产生的知识还是多的增量知识多吗你说的是 marginal 肯定是没那么陡峭吧除了刚才讲的已经五点了还有什么重要的问题啊我觉得重要问题嗯
我觉得还有两个吧一个是我们假设 coding 能力明年能提升个 10 倍 30 倍软件开发的范式会怎么改变新的软件生态会怎么样未来的软件会怎么样还有一个刚才也提了就是 context 非常重要我觉得大家还不够重视
我觉得其他还有很多科研问题值得探索吧没有解决的问题依然还很多你比如说模型架构上怎么变就是能让模型在后台像人一样一直在思考比如说你今天给我了一个问题我会思考一周对吧再给一个答案比如说今天我学到一个东西我自己就更新了大脑的记忆了那模型今天还不行还没法实时更新嗯
那这个东西可能也要做好你觉得 C 端产品重要吗在明后年我觉得 C 端产品肯定也是重要的比如说谁还能追到 ChadB 这个规模的大概率可能不再是 ChadBot 这个形态了我觉得可能得有差异化的价值你比如说核心指标你就看周火这种产品可能看周火下一个周火谁能到
大几千万甚至一到两个亿我感觉就能拿到下个船票了所以总结下来未来两年关键因素有非常多方面用户规模可能很重要可能比产品形态重要多了我觉得基础模型有可能还有突破其实 Poststream 有可能还能有半代到一代的提升但大家在基础模型突破的重点现在都放到了 PoststreamData 也非常重要我觉得其实挺期待比如说形成数据飞轮谁还能挖到大量的高
高价值的数据或者合成数据有没有突破对吧包括 AI 公司的所谓的组织能力怎么快速迭代你模型也要重要产品也重要对吧包括未来这种产品的粘性我觉得还是要提升的吧因为今天 Chad B 的所谓的市场也好粘性也好评次也好都还不如 Google 和抖音呢就是说明它承载的需求和挖掘的空间是非常大的
其实 GPU 和人才也非常重要其实真正懂 AI 真的在一天干活的其实是少的然后我觉得人是非常非常关键的真的懂而且真的干活的人其实是非常少的其实很多 Live 里面都说人手不够我觉得真正懂的那几十个人其实都是比较分散的还没有特别集中我突然想到之前就是一年前你说大模型的秘密就在三家公司在 OpenAI、Authropic 和 Google 如果没有记错的话现在呢
我觉得今天大的格局依然是这样只是说人才确实有流动之前我们说做到 GP4 很难但是今天很多模型公司都做到了初代 GP4 但是还没有做到 GP4OO 和 Sonnet 但是你看过去两年模型能力进步速度是非常陡峭的过去两年模型进步的陡峭程度比人类可能进化个 500 年了
或者上百一百年吧智商的提升是要高的我觉得端到端 Full stack 还是比较重要的但创业公司其实没办法做那么多对吧我觉得创业公司就得找到非常 sharp 那种锋利的点一根针捅破天的那种东西吧未来两年你觉得在巨头之间会有什么大的变化吗我觉得不排除微软这种公司会在投 Sourcework
很多人说 Skinning Law 的魔法就要适领了你现在对 Skinning Law 持有什么样的观点能不能解读一下最近 Elia 发表的观点她的 Printing Data Wall 我觉得现在有几条 Skinning LawElia 认为的 Data Wall 其实是预训练的数据平均因为互联网的数据是线性增长的比如每个月增加一个 T 或者多少的有效 Token 但模型的预训练它需要的数据是指数级增长的
其实咱们上一期播客已经比较隐晦的题了但伊利亚今天都出来说了我觉得今天预训练我觉得今天看应该是百分百遇到困难了不管说 GPT-5Cloud Opus Gemini Ultra 我觉得预期不一定非常高但也不差但就不确定这个是一个永久性的问题还是短期性的问题我觉得有的人很悲观有的人很乐观
因为今天的瓶颈肯定不是计算或者架构问题我觉得还是数据问题吧因为互联网上能用来提升智商的大规模训练的数据可能就二三十个 T 每个月可能就增加不到一个 T 可能到极限了吧但有的人乐观还是觉得现有的数据挖掘的炼化的空间还很大得怎么把叫
Data efficiency 提上去吧你比如说人类学一个知识可能 5 到 10 条样本就可以了咱们学会了对吧但模型你现在需要学个几千条上万条才能学会你怎么让模型学习效率提上去我觉得这个可能是一个看 25 26 年能没有突破的吧但是还有一个就是整个互联网上的数据占人类智慧的到底多少
有可能有 5% 10%那更多的人类智慧怎么灌到模型里面可能需要一个天才设计一个交互的因为你看推荐算法推荐引擎已经把人类的偏好数据都陈列在模型里面了
但人类在治理智能怎么更好地承担人类模型我觉得这也是一个需要一个脑机接口那最好了我们回到那个预训练就是欧派遇到这个问题可能比较早吧但今天可能也没有完全放弃 peritrain 吧只是说把 peritrain 和 posttrain 可能 reorg 了现在是叫 fundamental research 吧
其实你看这样它的 GPU 分布也会发生变化因为之前大家搞预训练对吧整个 Pertran 和做实验可能会占到整个 GPU 分布的 80% 90%我觉得未来 Pertran 也好 Postran 所谓的 O1 跟 1 比 1 比 1 这种关系了我觉得 T1 的公司都不能放弃 Pertran
因为这还是会有提升的因为这还是一个底座其实第二条 skilling level 我觉得是 O1 系列其实我感觉还是有分歧的就 O1 的天花板到底能走到哪尤其是能不能通用和泛化其实今天语言模型到底是不是真泛化我觉得也不知道其实因为很多问题都在训练数据分布里面了如果 O1 不能泛化只能在数学和代码里面很强
我觉得还是会影响这轮 AGI 的天花板的吧我感觉 OPPA 基本上 all in 到 O1 O2 这条大的 battle 如果这条路失败我觉得 OPPA 的挑战会比较大赌赢了我觉得天花板还能打开很多我们之前聊 O1 那期播客就上一期你聊到说后续链有一个最关键的问题是奖励模型 reward model 那整个地球上也没有一个 reward model 能衡量所有人所以你相信未来会有吗我觉得其实挺难的很难有一个绝对通用的
reward model 能衡量所有的事吧因为每个人每个领域都很不一样甚至昨天今天明天都不一样我感觉最 top 的 researcher 呢可能也还没有想到怎么泛化 reward model 的方法吧我不知道伊利亚未来会不会又几了但是能确定的是
今天数据非常重要吧因为大家可能都花了很多精力去标数据需要真的质量很高的数据那现在每个人都会负责收集不同领域的数据嘛标数据
请专家来做评估对吧我觉得还是依赖这个领域学一些那个领域学一些大家有点像这个拼凑各个领域数据拼到一起看模型能不能提升的问题我觉得 reward model 通用泛化还是需要科学突破的 O1 的天花板会卡在哪里如果说真正的天花板我觉得可能会卡在数据吧或者泛化我觉得泛化可能是唯一关键的问题
就是回到你刚才那个问题是不是相信这个世界上会有一个统一的能评价所有人所有职业的大一统的 reward model 还是各个行业垂直构建的 reward model 如果它是各个行业垂直的那你得雇很多的人设计任务设计
reward 对吧就很像老师出题一样那这个 Skillable 速度就比较慢了我觉得这是一个本质问题吧但你从 O1 这个产品的角度来讲呢我觉得我观察我身边的人使用率不算太高吧
可能今天 O1 这个产品形态也不太对它比较慢对吧延迟比较高其实门槛也比较高其实 99%的用户他的 query 其实也用不上 O1 他是擅长解难题的解难题也解不上他们数理的准确度更高数学和代码都很高你感觉 O1 这条路线是共识吗它一定会走向 AGI 吗我觉得这个还是一个计算科学实验科学一个待发现的问题吧
我觉得只是说今天还没看到天下版肯定值得重点投入去试嘛但至于走到哪里我觉得现在还真不知道我觉得还是有分歧的有的人觉得 O1 的天下版非常高只要你把 task reward 设计好就能激发出来 Purchase model 的激发不出来的能力但也有一部分人觉得 O1 可能很快遇到天下版比如说到 O3 O4 对吧
因为它收益提的快但遇到瓶颈也比较快我觉得也不能完全靠模型 skill 其实 O1 还是能让人参与进来做 reward 这个过程过去两年比如说合作一些专家去做标注怎么设计 reward 我觉得这可能是
数据上比较重要的但我感觉即便 O1 走不下去或者到不了 AGI 我感觉最后沿途下蛋有可能也会做出来牛逼的东西毕竟资源很多牛过人也很多所以 Skinning Law 听起来可能算法不是问题算力不是问题遇到问题的是 data 是数据问题是的我觉得大部分公司还是怎么能
更加 scalable 的采集高价值数据吧包括形成未来的有价值的数据推轮比如说哪天有个天才的产品经理将人类这个讨论过程的数据记录下来反馈给模型我觉得这个是比较重要的比如咱们讨论这些过程
他有 COT 数据对吧这个是模型记录不了的这是有价值的能力的数据的我觉得包括怎么用数据激发模型更大的能力对吧尤其是刚才提到那个 data efficiency 这个怎么提上去一个能力弱的人他需要学很多才能学会一个能力强的人他可能学两条他就学会了对吧这就是效率的问题我开个脑洞啊飞叔这样的产品形态有可能是个雏形吗
跟他有很多大量的工作讨论我觉得数据价值很高那你说 Notion 的数据价值也很高对吧个人笔记软件我觉得是数据资产的价值很高但产品形态不好说
XGBT 数据飞轮比较小对吧对我觉得 XGBT 主要是偏好数据吧它不是能力数据它可以把你的偏好筛选的比较好能提升 MAU 对吧比如说用户时长但对 AGA 可能没有啥帮助其实你看搜索和推荐也都是人类大规模投票的标注对吧
其实如果 ChadgeP 把用户偏好数据用太多吧我觉得答案会趋向一致丧失多样性本来你生成的答案可能有一万种但你投票投多了可能就两百种我觉得 2C 用户的数据肯定还是有价值的但未来怎么用好我觉得还是要做很多 research 吧因为大多数的用户没有逻辑但提升逻辑的方法有很多不一定非得用用户数据嘛
对我觉得有一个有意义的就是说其实用户关心什么需求是重要的这会让你的产品体验更好你可以定向的去优化模型优化数据对吧我觉得这个会更有意义 Google 也好它有用户的意图数据它可以做后端的优化这个会更有意义未来 XHPT 会有数据飞轮吗我觉得存在一个理想的状态就是有个天才的产品经理设计了某个形态
把人类的思考的过程思考的这种高价值数据都传递一个模型最有意思的就是你刚才提到的 FSD 对吧就推荐系统都是比较好的一个模型吧就是甚至笔记软件 notion 什么知识库里面我觉得可能也是获取数据形成数据推荐的一个好的过程吧我觉得未来可能就是说未来一个形态一段这边是模型
那边是个人软件你怎么把个人软件的数据给 hack 出来作为 context 自动的放到模型里面帮你完成任务我觉得这个过程会特别有意思我觉得今天让人标注的方式都不够本质不够 skillable 如果有一个 Airbot 每天看你的微信给你同步做其他的很多东西这是一个更自动化的过程这种会好
不考虑隐私的情况所以这个产品它不是只要人用就可以了它还要看怎么在和人交互的过程中吸收人类的智力是既然数据这么重要你觉得哪些产品里面有高价值数据你比如说搜索对吧搜索首先你有用户的意图的数据很重要但是未来的 AI 搜索就是说你有持续性的一个研究的话题而且持续在追问对吧可能有高价值的数据有这种 COT 数据
我觉得 notion 里面有高价值数据但是你反复想出来的这个知识对吧结论的知识比较多我觉得未来比如说 AR 公司的那个 artifacts 也好国盘的 canvas 也好可能也有因为你做任务的过程中会有一些拖拽对吧你思考的过程它会记录你怎么思考的过程你甚至你的浏览器上那些点击的数据也很有价值
这个点这个点那个其实也有一些用户行为和逻辑的但是 Google 可能不敢用这个 Chrome 的数据因为有可能有合格问题其实操作系统的数据也非常重要因为你怎么操作软件呢未来 AX 可以模仿你操作软件呢我觉得这个是一个有意思的吧 Dropi Coding 它能力做得比较好是他们在数据上做了什么特殊处理吗对我觉得还是预训链的 code data 做得比较好吧做得比较认真其实
我觉得最后还是数据我觉得好的 AI 公司都是花了大量的时间在数据上 Open 也好 Enthropy 也好但怎么做好数据我觉得大家是没有公式的 Tier2 的公司其实都是没做好数据的嗯
按照我们之前的跨年特辑的传统我们来回顾一下你心目中能定义 2024 年群球大模型产业的关键的时刻如果只说以一个我会给今年夏天 6 月 20 号 Anthropia Sonnet 模型发布吧因为这个模型是真的让大家开始进入生产力提升的阶段了带来 coding 编程能力的巨大进步紧接着后面才让 Cursor 火爆了
才让 Devon 今天火爆了我觉得今天他们大部分的用量都是基于 Sonic 因为 CursusDevon 以后他们都要给 Sonic 付挺高的几百美金 Token 的消耗的费用这是全球大模型狂卷的第二年你觉得经过了这一年卷出了什么我觉得还是 Coding 开始进入了大模型
大规模生产力提升的阶段我觉得二五年对 coding 更乐观确定性更高代表下一代软件生态的形成当然也卷出来 ChatchP 这个 KillerAppC 端一枝独秀
我觉得今年做基建可能还有一个就是我觉得 agent 落地的基础设施吧可能慢慢临近了吧今天想要进入决赛圈你觉得条件是什么我觉得 C 端用户和开发者投票就谁家的产品有没有被真正的用起来有没有拿到用户的和开发者投票这是一个条件吧如果有东西没人用你说自己在牛也没用吧如果说模型这层呢我觉得十万张有效
已经使用的卡我觉得是全球第一梯子的决赛的标准我觉得没有这个肯定是不行的你说谁家产品被军人用起来就跟你去年说谁进入了 GP4 谁做到 GP4 它们这关系是什么呀
做到 GPT-4 是代表一个智能水平你只有到了这个标准用户才会用才会买单对吧但是大家今天好像都超过或者做到初代 GPT-4 了但是前面还有更好的其实这个也没意义了所以还是要有差异化的能力和智能的体现吧这种智能是能力对
但我觉得在决赛圈没有大腿好像是不行的 Open 有大腿 Anthropic 有大腿 XA 有大腿 Lama 有大腿你去年这个时候说 2024 年是决定长期格局最关键的一年格局形成后以后很难改变今天你看你这么说的对吗
我感觉其实过去一年挺清楚的就是跟咱们上一次跨年预测的还挺一致的吧我觉得模型第一梯队可能就三家或者三加二 Open, Anthropic, Google 属于绝对的第一梯队 XAI 和 Lama 紧随其后
其他就没有了我觉得模型格局其实挺难改变你说谁今天还会再出来进到第一梯队我觉得微软自己 Amazon 自己都不容易字节有可能哪些去年的判断你今天更坚信了哪些去年的判断你今天认知有所变化
我觉得有变化的是开源模型和闭源模型是有些改变的我觉得主要是因为 Meta 的存在他们投入比我们想象的要强大非常多我觉得这个跟之前的判断发生了挺大变化包括也看看 Lama4 到底会怎么样
我觉得去年跨年我们判断字节很有优势对吧我觉得今天可能更清晰了对吧兜包的 DAU 也非常非常大我觉得明年整个用户增长做很强可能模型和产品一起迭代可能会比较好吧因为去年我们提了一个叫新的摩尔定律对吧我觉得预测还算准确这个误差非常非常小我觉得对成本降低这个更加坚信嘛
有可能未来做 Inference 推理的主力模型可能不一定是特别大的不一定是 100B 以上的模型可能是 3 个 B 5 个 B 8 个 B 这是一档或者 3 50B 一档我觉得这两档可能是做 Inference 的主力有可能不需要 100B 以上做主力的推理模型我觉得可能还有变化就是说之前对底座模型和预训练的预期更高吧
因为之前咱们播客预测说二五年可能才碰到数据问题没想到那么早碰到了数据问题之前觉得还能一代代再走个好几代对吧那没想到撞墙来的快我觉得还有一个就是巨头和大公司还是非常有优势的不管说 AppleAmazon
Google 字节我觉得这些大公司还是会很强美股市值最大的七巨头里面你最看好的是哪个我觉得先说短期比如说股票角度我是今天我比较喜欢 Amazon 一方面它跟 SRP 的合作关系比微软和 OpenAI 更健康
包括 Anthorpe 的模型也某些地方比 GPT 要好了对吧对拉动 AWS 我觉得挺明显的其实你认真看 AWS 的财报它的 AA 的业务增速是百分百每年在 double 的
这样的话它那个编辑增量的利润非常高能有将近 80 我觉得大家都低估了 AWS 的盈利能力我觉得未来还会很强我觉得还有一个很关键的就是它的自研芯片我觉得是比微软领先的比欧盘领先的我觉得相当于 AWS 这个大的云厂有了自己的 TPU 我觉得这个战略落地后对 AWS 的意义是比较大的为什么不是微软我觉得微软做产品一直很拉垮你像 Cursor Daven 这种产品
做开发者群体的从微软手上溜走我觉得是比较好的包括 Copilot 也好是没有达到大家预期的哪些公司有可能成为下一个万亿美金市值的公司当然这里不做投资建议了好问题我觉得 SpaceX 和字节的确定性是非常高的 OpenAI 有潜质吧我也只想到了这三个如果大家有更好的 option 我就可以打在评论区你觉得能否短期做到通用放话
我觉得比较难今天语言是不是真泛话我觉得也不好说有可能语言今天都是假泛话能不能真泛话我觉得是要突破的我比较期待伊利亚怎么解决这个问题伊利亚是 AI 之光哪些行业会被改变得很快我觉得涉及到知识工作者的自动化的我觉得都有机会被 agent 给改变 automate 很多 workflow 你对明年投资乐观的地方在哪里
我觉得各个领域都会出来一些背景比较好的 agent 和公司吧类似 Devon 这种架构一批一批的 Devon 出来明年如果只投一个方向你会投什么围绕 coding 相关的和 agent 的落地结合起来的吧就解决刚才提到的长距离推理任务的 long horizon 的 taskAI 市场的泡沫大吗对
我觉得大产业总是预期走在营收前面我觉得有泡沫对产业是好事但长期变成伟大公司的前提是都要跑出好的商业模式把泡沫给填上硅果人才正在流向哪些公司
AnthropicOpenCTOMirror 跟他的 PostTrain 的 Lead Barrett 新公司还有 Cursor 还有 Dylan 这几个是比较好的吧你有什么喜欢的产品公司吗你觉得它能在 AI 时代发挥更大的价值我觉得 Notion 挺好的因为占住了个人的知识数据这个数据资产的价值很大其实微信的数据资产的价值也很大但微信可能不好用
这个是隐私的问题是吧对隐私的问题你能总结一下这一轮你觉得最大的机会在哪里我觉得这一轮最大的机会我总结可能就三个第一个就是咱们一直聊的叫下一个 Google 融合了搜索推荐问答 coding 做任务可以更加的主动和被动不管说信息分发还有超级助理我觉得这是最大的一个机会确定性最高名牌大家都去奔着弄
我觉得还有叫下一个 meta 我觉得核心是互动性大家会赌的是形成一个新的内容消费的平台对吧有可能它是从视频生成或者从其他的但是我们今天还高估了生成环节的重要性因为其他环节也很重要我觉得第三个是 AFOsense 就是整个科学发现因为
因为你看全球最强的两个 lab 的 CEO 都特别看好一个是 Anthropic CEODaryl 一个是 DeepMind CEODemisDemis 他个人会专注在一个制药的公司你看他 Twitter 那个签名他其实在一个制药的公司的我觉得硅谷这边已经有不少 AF or Science 的
新的苗头了吧就是做 AI 的材料设计更多更多一些新的下一个 Google 它指的是一个新的信息分发的工具任务分发的工具
下一个 Meta 指的是社交呢互动我觉得是一个新的内容消费和娱乐平台吧也像 TikTok 对像 TikTok 当然如果有新的社交也可以但我觉得新的社交不知道这个要素是啥对我感觉现在的很多创业者中国的创业者他们其实都是在围绕着信息内容在想 idea
是的能不能总结一下 2024 年的几个关键词 Coding 预测一下 25 年的关键词 Agent 因为我们聊这个播客全球大公司季报已经聊了一年 AI 正式的改变了你的工作流没有我觉得还是改变了很多我觉得还是寻找信息和处理信息的效率提高了我自己经常用 CloudChadgetP, Proprietized 这三个换着用吧