We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode E4 为什么 AGI 应用还没有大爆发?

E4 为什么 AGI 应用还没有大爆发?

2024/6/24
logo of podcast 海外独角兽

海外独角兽

Transcript

Shownotes Transcript

大家好这里是海外独角兽开源 AI 研究平台海外独角兽的同名声音栏目我们主张用开源的研究和讨论精神链接全球 AI 从业者行业瞬息万变我们在这里拉起认知抹平鸿沟本期内容是我们和张晓骏商业访谈录的串台也是全球大模型季报的第三集本期讨论回顾了 AI 应用过去一年的发展对 Perplexity 这家 AI 搜索公司进行了深度解析

也围绕 GPT-5 做出了一些判断和预测

广秘我们顺眼着前两期节目我们争取在每个季度的节点都来做一个全球大模型的复盘和展望希望帮助科技的从业者研究者或者 AI 的爱好者如果他每半年每个季度只收听一期播客节目来了解全球大模型的动态进程希望他们听的是我们这一期这里 cue 一下我和广秘这个全球大模型的系列前两期节目分别是商业访谈录的第 54 和 64 集如果大家还没有听过也非常推荐给大家

那现在来到了 2024 年的 6 月广秘你今年依然在美国花的时间非常的多整个上半年你自己最大的感受是什么对 GP4 出来一年多了 AI 应用还没有大爆发从结果上看是比较无聊的咱们抛开大模型公司自身的应用像拆 GP 其实硅谷主流 VC 头的跑出来的上一定估值的其实我就想到比如说 Popularity 一家 2000 多万的月活

2000 多万美金的 AR 年底有可能比如说一个亿的月活一个亿美金的 AR 其他的我感觉很多还在一个 PMF 的之前的阶段 Populacity 是一个相对成熟的公司关于这家公司 CEO 创业团队和创业过程你能不能展开给我们讲讲他们应该是 20 年 8 月份成立的 CEO 是印度裔 Burkley 的 CS PhD 最早在 Open Air Dimman 都实习毕业后就加入 Open Air 一年

然后一年后就出来创业了他那个 CTO 是最早是微软必应的搜索工程师之后是美国的知乎 Core 之后在 Meta AI 现在的话应该有 50 个人我记得印象比较深的是他们刚出来创业的时候我感觉硅谷最核心的 AI 圈的人好像都投了他们反正就是过去一年产品跌得很快一直稳定增长月度环比增长都在 20 以上他是在 CHATsPD 发布之前就成立了对

他当时为什么出来啊从 OpenAI 对 AI 搜索信息分发这个事感兴趣吧所以他其实是知道 OpenAI 内部进展的一个人因为之前在 OpenAI 工作嘛硅谷核心圈的人都投了他们是因为这个原因吗就从 OpenAI 出来的人从这个去 source 到他们

大家有一个感觉就是 ChaiGP 是一定会做搜索的这种能做好搜索产品的团队是值得被 OpenAI 再收购回去的可以再换一些 OpenAI 的股票这家公司的融资历程是什么样的哪些人参与了 Populacity 的这场资本游戏刚才提到比如说很多 AI 核心圈的人 Google 的 SVPJeff DeanMeta 的 Yan LeCunOpenAI 老的 Peter Bill 包括 Andrej Kapesic 包括

知名的 SoloGPIlaGil 包括比如说 Gitarr 之前的 CEONight FredmanDatabricks 的 Co-founderRonald HsinHagginface 的 CEO 我感觉还挺多人的亚马逊的创始人 Bezos 个人也投了 Bezos 还是 Google 的天使投资人对搜索还是比较懂的吧最新一轮我记得是 Betham 领头吧 30 亿美金估值 OK 他一共现在完成了三个轮子加上小轮应该有四轮

第一轮是什么时候 A 轮的话我记得应该是二三年初吧 IVP 我记得有五亿美金一轮今年初有一个十亿美金一轮最近是三十亿美金一轮就一共四轮大概也是差不多每半年容易轮的这个节奏差不多跟国内这些大模型公司差不多差不多所以也是 club deal 在美国

其实后面还比较机构化但他们的个人投资人还是比较多的其实你看这一轮之前还是很多个人在投的你看上一轮是 Daniel GrossAir Grant 那个 Founder 他自己投了很多钱为什么他们这种个人投资非常的多这跟中国还挺不一样的

中国还是以 VC 为主你比如说像 AI grant 我感觉他在 AI 领域的影响力是比 YC 还要更成功的因为这两个人是更懂而且在合音圈子而且可以参与多更多他们自己记得之前还买了很多 H100 去给到他的 portfolio 用而且我感觉主要是他们钱也多喜欢参与这种早期投资

和 Plastic 和其他的公司你觉得有什么差别吗我觉得第一是数据增长一直是比较好的第二从今天复盘过去一年来看信息检索还是匹配模型能力最重要的 Use Case 我觉得其次可能是教育可能就这两个真的是匹配今天模型能力如果大家理解了今天的模型能力我觉得去理解这种产品是比较 Match 的一个

你觉得过去一年为什么是 Populacity 跑出来了因为去年这个时候觉得 ChangeBee 应该做搜索挑一个软柿子所以 Populacity 过去大家觉得是有收获价值的但你看今天 OpenAI 也决定做搜索了其实说明一个事信息检索这个事是匹配模型能力最重要的一个 use case 我觉得这是一个体会我觉得更重要的一个体会是理解大模型能力到底能匹配什么 use case 这个是更重要的

因为之前我们聊到模型能力是一个渐进式解锁的你看我们作为一个知识工作者一般有几类的创造性任务就第一个比如说叫组合性的创造第二个比如说像探索性的创造第三可能比如说像变革性的创造其实你看信息检索这种就是一个组合性的工作是最能匹配今天模型的能力的那你比如说像长距离推理工作像比如说今天我们写一篇 Tesla 的投研报告这种是一个探索性的创造

你还要规划还有各种推理那你比如说像科学发现万有引力定律这种包括发现摩擦力什么这种是一个叫变革性的创造今天大模型还比较难做到比如说局一反三它其实还比较难处理这种没见过的人物我感觉 Property State 这个团队对现在的模型能力的边界理解是很深的模型今天还没有一个叫自由探索的一个能力更多的还是一个信息组合的

今天这模型的能力也就刚好切合 Populacity 做的这种复杂信息问答的一个 case 在现有模型下它是一个相对 fit 的一个 PML 对 Populacity 它是对模型及产品模型及应用这种说法的反击因为它的创始人说它是先思考产品再思考模型而不是像我们国内很多大模型公司他们提出的是我先提高模型能力然后同步去想产品他们的思考逻辑其实是反的

其实他们也 fantune 了一个 mystral7b 的模型也能覆盖很大的坑了一方面是成本考虑还有一方面是他要向下改模型其实如果说一个能力不行我就不能向下改模型我不能要求 gpt 改 cloud 改那所以他们自己也 fantune 了一个小模型其实最后还是要端到端 full stack 来优化的我们到底应该先思考模型再思考产品还是先思考产品再思考模型是没有一个标准答案的

其实你看 opai 也做搜索了但 opai 做搜索能不能做好我们不知道的 spacex 有发射能力了他自己能做 starlink 别人借助他的发射能力能不能做好如果他这个能力是开放的今天这个 API 都是开放的所以最后还是双轮驱动如果 Proplacity 能向下改模型 Anthropic 收购了 Proplacity 我觉得他去跟 opai 竞争这是很好的一个组合

所以 Andropic 会收购 Property 吗这个不知道 Property 的往下走肯定是要跟模型更深的结合的改模型资源投入太大了这个其实很难做到我感觉这个问题很难回答我看你们就是那个公众号上翻译了他的就是 CEO 的采访的文章他的模型他是一开始先坚决的用 web 模型

因为你的目标是打造以产品为核心的公司所以不要在训练模型上花费时间专注产品做用户增长做好留存这是先解决的问题最重要的一步它是接下来再去决定训练一个自己的小模型对吧

我觉得这个是 make sense 的如果是今天我自己做一个应用我肯定也是基于最好的模型的能力先做 pmf 之后我想的是要降成本再之后我要端到端的做优化甚至说我蒸馏 distill 一个小的模型 tower 这些特定的热门的 query

我觉得这是一个 work 的路径如果今天我做一个特定领域的助理应用我肯定是先用 GP4 最强的模型先做了 PMF 之后就想办法降成本然后想办法去 Own 自己的模型还能去改一些东西其实今天来讲我 DSTO 一个模型你比如说我 DSTO 一个 T 的数据今天好像也花不了太多钱其实比从头 trade 一个模型成本是低很多

那我可以欧文一个自己的模型不管说我急于开源做一个 fantum 我觉得这是一个做产品的路径有可能未来很多的应用公司也会欧文自己的小模型如果按照我们之前说的现进式解锁模型能力在提高解锁出不同的应用的这个逻辑那未来比如说 GBT4 到了 GBT5 的水平现在这个现有产品的产品形态它的护城河是什么呢拥有更大模型的公司会不会超一个它的产品形态就把它碾压了呢

其实是有可能的只能说过去一年 XGP 做即时性的信息检索效果太差了所以是留有这个窗口的那 OPAN 他如果很轻松的把即时性的信息检索做得很好所以他必须要提高自己的模型能力

对 甚至跟一个模型公司深度合作甚至说跟一个巨头深度合作最近它的估值到了 30 亿美元它估值为什么这么高搜索还是互联网上最肥和最大的市场了其实你看微软 Bing 只有全球搜索 3.4%的份额但产生了 120 亿美金的年营收所以 AI 搜索只要抢到 Google1%到 2%的份额这个生意就很大所以 AI 搜索我感觉应该是大模型初期最大的 KLAP 吧

而且我们能看到 PropertyCity 单个活跃用户每天搜索的跨月量其实是 Google 的三倍还要多其实去年讨论我问的第一个问题就是说 PropertyCity 这种形态跟小红书长期是一个什么关系一个是 AIGC 一个是纯的 UGC 其实本质都是在做好信息分发帮用户解决问题其实都是在抢传统搜索的声音其实小红书抢了很多百度的搜索流量这公司 A 轮的时候当时我们就跟头条早期做对比

我觉得蛮有意思的 2013 年的时候头条 APP 的次流应该有 46%吧其实后面规模大了其实好像流存还更好了 Properties 的流存其实跟这个基本上是一样的长期流存很高我记得减注是比其他的 AI 产品是要高的其实今天我们评价 PMF 我感觉最重要的还是两个要素第一个是流存好不好第二个是商业化模型好不好

流存我觉得这个肯定过关的对吧就是商业化上确实是没有广告平台这种效率高的我觉得这也是 AI 产品今天面临的一个普遍问题因为广告这个模式其实在 PC 时代就非常成熟了移动的时候搬过来很容易

Property City 留存好我觉得有一个很重要的原因叫产品心智就之前我们播客聊的其实 AI 产品今天还没有很强的叫网络效应规模效应和数据飞轮对吧就是一个用户心智我感觉是 Property City 占住了 AI 搜索这个心智 ChatGPT 占住了 Chat 这个心智 Character 也占住了陪伴这个心智其实就像 Google 早年占住了搜索这个心智吧

AI 搜索未来还有一个想象空间就是 agent 落地以后其实搜索还是最适合 agent 落地的一个场景对用户的个性化的支持对复杂问题因为后面还有 action 执行落地这个对用户的决策帮助是比较大的 populous

他今年冒出来的他的一些关键决策你觉得有没有一些我觉得有一个关键就是 NVIDIA 投了他所以老黄帮他带了很多量有一次公开说老黄用的最多的一个产品就是 Property City 老黄给代言了而且 CEO 也经常出来讲其实在支持工作者这个群体我觉得一开始站的是比较好的我觉得两个事比较重要吧第一个就是说 CEO 持续不到就是站住 ASO 所这个心智

在增长的动作上也做了很多这个产品的核心我感觉就是增长它是优度大我感觉应该是 94 问一个 VC 经常问的问题 Populacity 怎么和 Google 竞争呢或者怎么和 OpenAI 竞争对 我感觉竞争这个问题其实他们创业第一天也回答不了 A 轮也很难回答三个 B 了我感觉也很难回答

后面走到百亿美金甚至几百亿美金可能也很难回答其实我感觉头条在一开始也很难回答怎么跟三大门户的竞争就竞争这个问题我也没啥好的答案我自己感觉可能是错位竞争其实不是完全一样的产品和技术 Publicity 我感觉找到的是 RM 最匹配的一个能力的领域知识工作者就是 Use case 就是信息问答尤其是复杂的信息问答就是围绕商业本地生活其实你看 Google 擅长的是网页的导航

包括交易信息的搜索 Properties 里其实是做的对应传统搜索中差不多 5%左右的复杂问题的问答其实这个是传统搜索没有做好的其实也是搜索中皇冠上的明珠我觉得跟 OPI 的竞争其实还是主要看 OPI 自身

因为 OPI 还是一个科研文化其实后面产品文化能不能 balance 好我觉得是比较重要的如果 OPI 这种技术交到头条手上我感觉今天产品和商业的收益可能是 OPI 的三到四倍的做好产品和商业这种文化可能还是自己和 Meta 这种组织文化吧

最简单一个例子你比如说搜索产品团队觉得某个能力不行你想向下改模型的数据你问一问模型团队同意不同意我觉得 OpenAI 可能是不同意的它是不想改动模型的基础的数据另外你看 OpenAI 可能比如说 10 个人做搜索 Property City 是 50 个人专注在这一个事上

我觉得也不见得比他们差的我觉得错位竞争是比较重要的创业公司可能要好好理解一下错位竞争其实很难跟巨头硬碰硬的还有一个点就未来还有很多产品形态本身的变化因为大家天然会觉得搜索和 chat 就应该给及时性的答案

但其实我们很多工作中任务都不是即时性的比如说我们跟我们的同事协作要做多步规划甚至一周以后再给一个结果一个复杂问题拆成多步多次的搜索得到一个更好的答案这也是一个潜在的状态未来我的很多的任务就在一个看板上然后我持续的 promise 它我的 workflow 都跑在这样一个产品上了我觉得这也是一个未来

更有意思的形态尤其是在 A 站的落地以后所以总结一下 Perplastic 它的优势是它的 PMF 现在匹配了现在的模型能力且占住了用户心智但是在使用评次商业化和如何和巨头错位竞争上还有很大的探索空间

是的你看到对于 Perclass 的出现像国外啊 Google 啊国内百度啊这类传统搜索公司有什么样的应对策略吗 Google 其实出了一个自己的 SGE 这个产品吧包括 Overview 这些但好像口碑不是很好百度好像还没有动作国内好像有个密塔吧

我觉得国内有一个问题就是说内容是割裂的因为中国过早的进入了移动互联网时代小红书的内容你是很难检索的微信的内容很难检索甚至知乎的都比你那么开放高纸上内容的有效性我觉得是比较少的你看百度搜索出来的首页里面百度自己的内容我觉得有很大比例所以中国的内容的割裂性跟海外的这种 PC 形态主导的我觉得是区别比较大的你刚才也提到了密谈你怎么看这家公司

它是中国版的 Property Asset 吗有点像但是国内内容的割裂性我觉得这是一个最大差异你觉得在中国的 Property Asset 上这个可能是巨头的菜还是创业者的菜我觉得肯定是巨头的菜

其实你看字节一年前就应该做一个这种产品去打百度对吧其实信息流就是对百度广告的一个很大的抢份额了对吧只是说我感觉很多人还没意识到这是不是一个 PMF 有的人觉得它还没有完全 PMF 以及长期面临大模型公司本身的竞争所以对于中国的 populacity 这件事上你还没有看到特别好的

产品或者公司在做好像昆仑也做了一个天宫对吧好像我听说也有上百万的 DU 了我觉得大家对这个产品的天花板有不同的理解这就像当年大家对短视频的天花板有不同理解一样有人觉得可能 3000 万 DU 到头来有人觉得 3 个亿 DU 还不止

我觉得大家对这个产品的理解还是有很强的非公式的你觉得它今天构建的护城河是什么我觉得就是先发效应带来的用户心智你觉得它未来是会独立长大还是被并购它的终局会是什么样的我觉得八成的可能性是被并购的其实创业公司今天好像都在巨头的辐射之下不知道怎么照出来最近我们团队都买了 Meta 那个眼镜如果 Meta 那个眼镜上接入一个语音版的 PropertyState 其实挺好的

你说 Siri 过去搜索没做好借一个也蛮好的包括微软 Bing 好像搞了半天口碑也没那么好 Propress 比它口碑反而很好其实我感觉都在巨头的服侍之下的而且这是一个核心战争 Totals 今天的估值和国内的月占面是一样都是 30 亿美金这意味着两家公司是除了 CHRGBT 以外全球并驾齐驱的明星 AI 公司他们两个不管在模型或产品形态上你觉得本质区别有哪些

越之安眠还是基础大模型公司不过他们的产品做得特别好 KimiChad 其实也抓了很多知识工作者用户画像还是蛮接近的还是有 overlap 但是 Kimi 是一个从大模型到应用的公司而克拉斯蒂是一个从应用到模型的公司先后顺序做的其实是不一样的对美国的应用公司是很难往下做模型的只是做基础的模型的一些条由我感觉中国的模型公司是必须得往上做应用的

所以美国出来哪些好的 use case 我觉得大家都会借鉴今天又回到 copy from US 的时代了对吧在科技创新上我觉得那边走的比我们快个一段时间其实大家参考肯定是对的如果给我们画一个脑图在海外 Populacity 之类 30 亿美元估值的 AI native 的公司在第一梯队第二梯队第三梯队你脑子里的 AI 创业公司有哪些今天第一位的肯定还是 OpenAI 对吧

你看拆 GP 已经上亿的低优了这个还是很了不起的 Information 爆出来它的 AR 已经 34 亿美金了我们盘了一下整个硅谷其他所有 AR 公司的 AR 加起来应该还不到 15 亿美金所以可能还不到 OpenAI 的一半就再往下你比如说 Answer 它是

完全突企业端它突 C 很小它可能是欧巴的今天的 1/103 亿多美金 Character 可能有六七百万的 DU 这个估值可能是三五十亿美金还有一个最近比较火的 AI 程序员这个也是 20 亿美金还有很多想做 agent 的一些公司

新出来的 reflection 这种出来就几亿美金卖到独角兽级别的我感觉应该十家公司但是都还是在 PMS 之前你说有规模化的 AR 超过 10 个 million 其实还是非常少的你这里面说大模型公司要比 AI native 应用的公司估值得高

大模型公司肯定是显著高的千亿美金量级后面 Anthropic 和马斯克的 XCI 都是 200 亿美金再往下就是 Mystral 五六十亿美金 Character 三五十亿美金

Cohair 可能也有四五十亿美金然后很多的 AI Native 应用如果跑数一定量级估值比较好的可能有几个独角兽其他的很多还是在小几亿美金所以 Perplasty 是在这个 AI Native 应用里面的估值第一纯应用的可能是估值比较高的吧就不做模型的公司里面应该是估值最高的吧所以

所以它跟 Kimi 还是有一个差距的 Kimi 还是一个大模型公司对不算大厂我前段时间写了一个报道叫大模型的扑克牌讲的是中国资本在大模型领域的投资故事能不能讲讲海外的资本故事海外大模型的扑克牌是什么样的

和中国资本参与的显著不同是什么我感觉海外就更清晰一些没有那么混沌 AWS 跟 Anthropic 深度绑定微软跟 OpenAI 深度绑定马斯克是自称一派靠自己的影响力融了 60 亿美金未来可能还能融更多钱 Character 想再融几个 billion 的钱好像比较难了 Mistro 我看刚融了五六亿美金我觉得前面独立的公司只有三家了就是 OpenAI Anthropic XA

今年年内他们已经有了 3.2 万卡的集群明年可能都是奔着 10 万卡的集群如果没有一个机强的大腿再给几个币我觉得其实挺难在大模型这块去卷的我比较期待未来 6 到 12 个月 Apple 和 Meta 这两个怎么选你看巴菲特是 pushApple 有 1100 亿美金的回购其实如果是我的话我觉得应该去收购一家公司

Meta Lama 团队的人才密度我感觉还是不够的可能还是有传票的因为马斯克拿到了最后一张传票自己做的最后一张传票对这个是取决于人才 Meta 是有很多卡的而且集训能力也是很强的其实人才上还是明显弱于前几家的嗯

马斯克的 XCN 其实像红杉美国 Andreessen 这些基金都参与了挺多钱的应该好像每家都放了五亿美金其实这还是对 VC 基金还是挺大的一笔钱红杉中国在国内投大模型公司投的挺多的红杉美国他们投的多也是广撒网嘛

我们知道美国好像之前只投了 OpenAI 现在投了 Exit 相对集中但是每一个地方都放了不少钱五亿美金 OpenAI 放的很少因为当时最担心的是 OpenAI 这种架构本身能不能给投资者很好的退出我们刚才

刚才讲完了整个的大模型和 AI Native 应用到底有哪些公司以及他们的估值据你观察 AI 原生应用大爆发了吗我觉得还是没有大爆发的就是你看 GP4 出来一年了大家也试了一年了其实没有系统性的大爆发的

我觉得 90%的原因是倾向于只基于 GP4 的能力水平是不够的只能做信息组合这种创新没办法做长距离的推理包括一些创造性工作所以还是得卷下一代模型然后尤其是推理能力和多么态能力我觉得还有 10%的因素可能就是时间问题就是未来只基于 GP4 的这种能力水平还是有概率能做出来大

你看过去 NLP20 年也不算绝对成熟但是也诞生了搜索这种 K-Life 其实你看电发明以后也只有电能 power 这一个 K-Life 随着时间各种消费电子都起来了各种家用电器都起来了我觉得大家打磨了一年多了我感觉也快有一些 PMF 的意思了我觉得这里是需要年轻的产品天才的那么举个模型能力和产品能力不够的例子你比如说我就选要一个幽默版的

拆掉 GPT 会讲段子讨人开心其实这个不是一个传统的产品经理能解决的就产品形态再怎么设计都很难还是需要基础模型能力变强我是一直比较相信高情商是建立在高智商的基础上的首先模型要理解用户理解用户的环境背景 context 就我们这个圈子在发生啥还能举一反三其实想实现幽默这一个点就不太容易只有产品形态上

是不够的你得向下改模型改模型的性格改数据这是你前面说的从组合性创造到探索性创造那个跨越你觉得应用大包方的关键条件有哪些因为我们之前在元旦跨年的那期节目里面也提了希摩尔定律你当时总结说有两条线一条线是能力上涨一条线是成本下降今天你还维持这个判断吗还是两条线吗我觉得这还是最重要的两条线

我们从用户开发者和企业客户来看我们做了访谈之后他们就关注两到三个要素第一个是模型能力第二个是调用的成本第三个是速度 latency 我们就假设模型能力不变就是 GPT-4O 这个水平如果未来一年速度再提个三五倍其实 GPT-4O 比 4Turbo 应该提了有三四倍的速度如果成本还能再降个比如说 100 倍就是今天 GPT-4O 定价的百分之百

我觉得仅仅是速度提个三倍成本如果能再降个 100 倍我觉得还是能催生很多东西的你比如说 OpenAI 推出了 ChagePay 桌面客户端对吧我觉得大家是可以试试的非常方便快捷键直接调出来我的信息检索基本上不用再打开

开 Chrome 和 Google 了你看 ChashPay 今天已经一个多亿的 DU 我觉得如果这个客户端手机端做的足够好未来做到三到五个亿的 DU 是很有希望的那个时候我觉得 OpenAI 是绝对可以掀翻 Google 一个墙角的我觉得这里可以提一下成本下降是高度确定的

但不一定是最重要的最后还是取决于模型最后的经济价值因为不是所有的 token 都有同样的价值其实 token 的质量决定了模型的商业模式的比如说我今天问 XGPT 我要买什么股票他跟我说是 AWS 还是 META 或者 Tesla 该买还是卖其实远远给我一大堆的搜索结果各种报告是有意义的其实单位 token 的价值我觉得是更重要的这还是模型能力本身的

本身决定的这个就是一个模型的工资高低 XGBT 告诉你买什么股票你敢买决策肯定会还是我做的对吧但有些基础分析我觉得慢慢可行度实在上来了所以模型它为了要分不同的工种不同的工种它的定价是不一样的

你看我经常会问我们的分析师你帮我研究一下这几家公司的对比那几家公司对比后面交互更好了之后我也可以问 AI 他肯定会出错的但是我觉得准确度和可行度都是持续提升的一个过程这个是需要他在垂直领域有更深的见解他有更多的数据获取他的能力更强他才能够这么定价所以我觉得 OpenAI 是一定要把搜索做好才能满足更多人的检索的准确度的

需求你比如说 opi 未来在金融领域的数据上在做很多的工作做很多的 funtuning 其实能满足金融投研从业者的需求了你刚才提到说罗希能力不确定看未来 6~12 个月有哪些是你觉得高确定性要发生的问题哪些是高赔率问题

我觉得高确定性的关键词可能就三个一个是成本下降一个是多模态改变交互然后还有一个端测成本下降其实就是一个时间和工程问题而且下降的速度可能会大幅超越大家的预期我觉得创业者其实就应该按照免费的心态去想怎么构建你的应用呢其实不惜用量你就应该用最好的

模型的 API 去做 PMF 其实未来一段时间我也想沿着成本下降这条路去看看新的机会的就是之前哪些场景因为成本快速下降就突然 work 了我觉得还是会出来很多的你有看到什么样的方向吗我觉得企业级里面会比较多你比如说企业有知识库各种

Database 你可以无限检索那你这个准确度就会上来了第二个多模态我觉得是下一代交互吧 Voice Agent 这可能是今年最值得关注的一个方向吧就是新一代的交互界面因为打字这个还是太消耗了声音大辅助降低了交互的能耗其实就像触屏手机比键盘手机能耗更低吧因为 GP4O 是第一个端到端

声音进声音出的大模型吗这个技术路线下我觉得驾驭带交互的一个开始就是低延迟而且高智能我觉得 4 欧的出现其实能让端到端的新的交互变得更快核心的一个变量就是 4 欧的声音的 API 什么时候开放可能短期还不会开放因为你看手机触屏这个交互是催生了短视频的那

声音的 agent 是不是能孕育一个新的交互的抖音应用的机会我觉得是比较乐观的谁会是 voice 声音领域的一个新的抖音的应用另外就是多摩泰这个它改变交互是确定性很高的决定了 AI 原生应用的下限

但其实我更期待的是多摩泰未来能提升模型的逻辑推理能力这个还是不确定的其实是一个高赔率的问题因为主要是今天多摩泰的数据知识密度太低包括现存的多摩泰数据到底适不适合 AI 学习其实网上很多的视频都是人工剪辑后的比如说我们看到一个房子的大门后面就直接到客厅了其实人是知道怎么过来的但是 AI 是后面怎么能一步一步的理解两段视频之间的逻辑关系我觉得这个是比较重要的

包括今天多莫泰的泛化能力也不够比如说让他读特定领域的一个 PDF 可能很多地方也没对齐他其实也读不出来的而且还有一个你比如说假如未来 GP4O 就在我们眼睛上在手表上手机上装着他是实时的听着我们的以后我们也不用黑 Siri 黑 Meta 唤醒他了他可以实时的插话

我觉得这也是一个更好的交互了我觉得第三个就是端测 skilling out 是让模型变得更大探索一个智能的边界和涌现但大家其实是远远低估了模型变小的速度我觉得未来 6-12 个月可能就会有一个 3B 的模型达到一个极好的效果你就想象一下比如说 GP4O 明年能跑在你的手机上一个 3B 的小模型我觉得这个对于

PC 和手机端侧带来的机会还是比较大的因为你看过去一年我们卷的是云端数据中心的基建我觉得未来一两年是更长时间是卷的一个端侧的基建因为今天 iPhone 的内存就是 8GB 未来可能就是 12GB24GB 往上提我觉得端侧的机会肯定是很大的就是模型变小的速度也是很快的我觉得之前不 work 的那些 IoT 互联网有可能也是会变的 work 了

麦他的眼睛其实还挺好玩的模型变小的挑战是什么模型变小难吗今天最主要的一个是蒸馏你可以简单理解就是说我做了一个应用有 90%的 query 可能就是围绕比如说 1000 个问题这 1000 个问题我同时不同的方法去问拆 GP 他的回答就构成了一个

趁小模型一个语料了有一个不足的点是相当于你用一个小学生和中学生的能力死机应被变得能说会道了但是是不是真的智能不知道但是一个人总是能说会道但是不能做任务这长期还是不行的还有一个点就是蒸馏会增加 hallucination 因为他有时候不知道自己在说啥就是不知道自己不懂的问题但还是会那个什么我觉得这是一个模型变小对 opera 他们推的小模型效果可能比别人的大模型效果还要好

但是端侧的这种小模型肯定是会必然发生的我觉得是会发生的假如你有一个 GPC4O 在你的手机上时时地跟着你那你的隐私永远存在手机上你是更放心的但是如果存在云端你是不放心的我觉得隐私是一个很重要的问题如果我有一个很强的 AI 的助理就在我的手机上我全天 24 小时打开它我也乐意的但是在云端我可能就不一定

不一定乐意但是大模型公司越强的公司它通过真流做的小模型可能也会越强也应该会的 Apple 跟 Answer 也谈了一个非选 Apple 跟 Open 合作那个是分分钟热插拔随时可以换的就是一个 API 的问题

然后那个合作我觉得也是不稳的他们其实也在聊其他的模型公司只是说自己的模型肯定今天还不太行所以这种交叉的合作一回来可能还是会很多我感觉 AI 消费硬件还是很多中国创业者的机会我也看到很多创业者在考虑卖他眼镜这种方向了我觉得这个形态蛮有意思的

主要是今天的 AI 能力还不太行我觉得未来有可能能做的事还是更多的另外你说高赔率的我觉得可能就几个最重要的可能还是 reasoning 逻辑推理能力这个还是不确定性的一个科学问题有两三个路径在尝试而且有非常多的 tricks 大的方向就是说下一代模型比如说更大的参数更多高指标的数据和更大的模型

那确定性是比较高的另外你比如说解题持续的 inference 这可能也是一些提高逻辑能力的一个重要吧还有一个就是叫可解释性我觉得这个还是被大家低估的因为可解释性打开了模型的可控性也就解决了就像广告系统定向的给你的回答加一些某些倾向性吧我觉得还有一个高赔率的问题就是模型的组织能力我感觉全球所有的 AI 公司里面只有 open AI 的组织是相对工业化来的

我觉得其他的 AI 公司还都有点实验室的感觉其实你看就像好莱坞它是持续的产出好电影的某个演员某个导演换完好像也可以的欧盘他持续做科研的成功率还是比较高的他今天推了 GP4O 之前推了 Sour 我觉得未来还会持续的推出很多东西的你给他单位的 GPU 他的产出肯定还是最高的我觉得还有一个高频率的问题就是说如果明天 AGI 就实现了我们应该是用一个什么产品来承接

我觉得是可以思考这个产品的载体的到底是手机上的 APP 还是各种其他的东西其实还有一个叫高赔率和高确定性的问题就是说我觉得 GP5 和 Cloud4 他们的能力提升我觉得还是大家应该乐观吧

你说只有 OpenAI 组织能力工业化它的工业化体现在哪里持续产出新东西做科研的效率最高举个例子一个很年轻的 PhD 没有太多的工作经验到这里一年就能产出 Sorrel 我觉得还是蛮厉害的它整个的 infra 怎么做事情怎么做实验怎么定目标我觉得未来还会有更多这种例子

它里面有没有什么 know-how 我觉得一方面是基建做得好第二就是目标定的好然后怎么做事我觉得也不太一样的如果只保留一两个能力接下来你觉得能力跃升最重要的是什么我觉得逻辑推理 Resonance 这一个能力加上一个多目态吧如果 OpenAI GPT-4 给开发者的 API 成本大幅下降成本可以忽略哪些应用能爆发

对我也想顺带做个调研就是说大家可以在播客的评论区留言我自己会首先看企业级应用如果成本可以忽略企业内的知识库内部的数据库都可以丢进去无限的点数这样准确率是很高的能让企业的很多 use case 是落地的比如说企业的客服场景大家觉得大模型出来之后客服是理所当然的但其实过去年并没有大规模的

改造客服因为我们前段时间做了一些客服访谈目前反馈最大的问题就是第一大模型不够可靠还不如规则 Ruby 的那些客服系统更可控因为它容易乱回答因为它是一个概率模型对吧第二就是 reg 信息检索

是很难做好的其实是今天是没有一个端到端自动化傻瓜式的 RAG 产品能让这些检索做得很好的如果要精准地检索企业内的数据我觉得那如果成本降低那我可以大规模地无限试这个可能是对企业内的 use case 落地是有很大帮助的吧能不能总结一下 GBT 在过去一年定价的下降的幅度

我们按照每 100 万 token 的定价来看不同的三个版本它输入上是最早的 GB4 120%K 的它那个是每 100 万应该是 60 刀

4 Turbo 降到了 10 刀 4O 降到了 5 刀再看输出端最早的 GB4 是 120 刀 4 Turbo 降到了 30 刀 4O 已经是 15 刀了其实过去一年定价已经降了 10 倍了这个跟我们之前西摩尔征令预测还是一样的所以这个是符合你预期的我觉得是符合预期的我比较好奇的是为什么 OpenAI 不更激进的降价如果它更激进的降价我觉得对很多冒险公司是一个毁灭性的打击

你观察下来 AI 应用型的人才画像会是什么样的年轻 90 后吧其实我跟一些老的人聊我觉得包袱挺大的都想把这个产品确定的一些需求给规划出来我觉得包袱挺多的我觉得尤其是 90 后 95 后传统的产品是一个自动贩卖机是有固定的按钮

固定的 SKU 但今天它就不是一个固定的东西它就是一个随机性的它是一个概率模型你要接受这种不确定性的结果吗给 AI 新物种大爆发一个时间的预测 GPT-5 出来后的半年为什么是半年给大家一些实验时间你对于硅谷的 AI 应用有一个评价是无聊吗

你过去在美国你觉得有多无聊其实你看硅谷投的就是三个大方向 agent coding 还有通用机器人最主要是我觉得这三个大方向

都是在 OpenAI 未来模型的覆盖范围之内出来了这些你就感觉在沙滩上健康它是不牢靠的我觉得这是一个最大的担心确实是接下来我们聊聊大家都非常关注的 GPT-5GPT-5 是应用能不能大爆发的关键决定要素据你了解 OpenAI 模型能力的跃升是停滞了吗为什么 GPT-5 比我们想象来得这么慢因为去年我们很多的预期都是可能这个时候就已经出来了我觉得还是受限于 GPU 还是算力大基建还是不够

因为你看 GP4 相比 GP3 应该是几十倍的算力提升然后 GP5 相比 GP4 今天也就十几倍的算力提升你看 H100 芯片大批量到货已经是 2023 年的 Q4 了集群搭起来还是需要很多时间然后大的 GPU 集群还是不稳定今年初才能做大规模的训练因为你从拿到 GPU 到你真的能大功的训练可能还是需要个半年时间的所以我觉得不是一个 AI 的问题也不是大家提的

数据不够用的问题我觉得更不是 skilling out 遇到瓶颈的问题我觉得就是实实在在的 GPU 物理世界的建设问题其实就是简简单单的需要更大的算力随着模型变大其实系统的复杂度也是指数提升的因为模型变大以后出的问题大家可能之前都是想象不到的这也扣白了我们的上期节目 AGI 大基建对

受限于物理条件的问题 GPD-5 预计什么时候来是年底吗我觉得预期年底 GPD-5 会长什么样我觉得首先 SkinLock 应该是没有减速的我觉得外面噪音还是比较多的还是要相信这帮全球范围最顶尖的最聪明的科学家而且你看硅谷几个大的科技公司都是巨量投入下一代模型我觉得他们是不傻的

你从具体来看我觉得相比 GP4 我觉得参数上可能还要大个三五倍然后比如说 5~10 个 T 的参数数据量上我觉得也要比 GP4 大个七八倍十倍当然不拍出楼盘可能会发多个版本我觉得未来可能是会走向一个非常大的 MOE 参数量巨大但是激活可能不一定大激活可能四五百 D 另外 GP5 应该是能做到多么太输入多么太输出了但很难做视频生成视频生成成本还是比较高的

我一直不觉得 Sora AGI 的主线下另外你看模型变这么大之后我觉得 GPT-5 的逻辑推理能力应该还是能有大幅提升的这个可能是对解锁应用最重要的一个关键能力所以 GPT-5 可能视频还是用不进来视频生成成本太高了所以还是就是 Sora 是另外一个分支了就

对 但视频理解我估计可能做得非常好这总会带来什么根本性的改变吗 GPT-5 涨成这样的话听上去就是参数越大能力越强我觉得最重要的还是逻辑推理能力要上去更大的参数更多高指南数据上去之后逻辑推理能力这是可预期的有一个大幅的提升另外一个就是多么太的交互能力变强其实会把应用的打得

比较高为什么 GPT4 和 GPT5 之间要插一个 GPT4O 我觉得就是为了降成本这样又能省出来很多卡去给到 research 我觉得这就是一个最简单的原因成本下降的速度还是超出我们预期的硅谷大模型公司格局在牌桌上发生了什么变化没有

在过去半年我觉得硅谷挺简单的一句话说就是 GPU 决定生死线今年和明年我觉得分别是两条生死线今年年内如果还没有 3.2 万卡的集群我觉得肯定就不在第一梯队了然后明年第一梯队的门票应该是 10 万卡这里是 H100 因为 B 系列可能要明年这个时候才能大规模到货这个就是一个名牌就是凭资源凭决心大不大当然这个点也会加速二三线模型公司的

出局吧或者被收购比如说像 Character, Mist, Coherent 我觉得马斯克是拿到了最后一张门票吧如果 Meta 想入局我觉得还是得再收购对比来说你觉得中国公司的梯队有变化吗在过去半年以及他们的生死线是什么我觉得七八家还挺模糊的从今天的模型能力上来看其实很难分辨谁一定是最好的就从今天的模型能力上来看谁断崖是领先是很难拉开的

我觉得是交替都有一些亮点第一个分水岭就是谁真正开始 GP4 水平的水区链就是 8000 张 H100 这种量级的集群今天好像还没开始马斯克的 XAI 是最后一张自己做大模型门票他有什么差异的话吗我觉得可能存在一种叫暴力美学因为马克思公开也说了 XAI 就是 Bitcoin10 万张卡集群而且是全球第一个可能比如说今年 8 9 月份上线充分互联的而且是全夜冷的

10 万卡意味着就是说一个月可以趁 10 个 GP4 迭代速度变快了而且还可以更早的训练下一代模型我是很期待说这个超大机群未来能出来买些新东西的 XA 如果比其他模型公司更早

六个月搞出来 10 万卡机群我觉得是有弯道超车机会的马斯克好像就觉得 GPU 是最重要的定生死吧另外 XA 这个团队还是很强的吧我觉得看看他们未来能不能很快的发出来接近 GB4 Cloud3 水平的模型吧我还是比较乐观据你了解大模型公司

工作节奏怎么样他们卷不卷我觉得是非常卷的我听到一个很形象的比喻就是说大基建就很像西部拓荒欧盘内部的状态就像一个从东向西的火车开拓美洲大陆科学家让火车在高速奔跑 infra 的工程师在前面修铁路这个铁路铺设和火车是齐头并逆的所以你就能感受到这种状态因为很多人说归五四五点就下班我觉得这个印象不全对的做大模型的人

都是很卷的我觉得基本的休息时间运动时间应该说几乎全没了每天都还是在一个很卷的战斗状态因为没解决的问题比解决的问题多而且新问题也非常多据你了解哪家公司是最卷的 OpenAI 而且人才密度也确实是最高的有没有什么比较夸张的加班的事有一个朋友说连续五天平均每天只睡三个小时睡前和醒来就是吹猫的整体来看过去一年你觉得在大模型上中美差距是放大还是缩小的

我说一个非共识的观点我觉得真实差距可能是在拉大的而不是表面上看着真的追上了我觉得更准确的说应该是可以局部追上比如说热门问题的问答对吧但是你看国内模型处理常委的问题其实都还不太行其实这个就说明模型的犯法能力我觉得还是不够的

其实最核心的是说今天我们不知道 OpenAI 内部又走到多远了因为 GP4O 你说到底代表 OpenAI 的几成功力呢我觉得有可能就是比如说三成功力其实你看 OpenAI 的人才密度很高都是非常聪明的而且它有最领先的模型而且他们更早拿到了更大量的 GPU 做更多的探索只是说这个不公开了对吧我觉得想用一个 5%的资源就想真正超过 OpenAI100%的投入我觉得这个还是比较难的

除非说第一名成为先驱对吧你就说人才密度波拍我觉得一个人还是能顶十个人的吧你看骚扰团队可能也就不到十个人吧其他公司可能几十个人也不一定能搞得出来外界是希望更早更快的看到一些新的进展的但模型变大了之后我觉得细节还是很多的过去 GP4 它是一个技术发展史的一个叫跳跃时刻其实你不可能每年都跳跃的因为大家的预期变高了不跳跃你可能就觉得无聊了对吧其实很多细节各种产品的打磨

我觉得需要的工作量还是比较大的其实这里面是一个优化打补丁的点你比如说大家居然都还是基于 Python 来做的只能每次处理一个事情执行起来其实是不够 efficient 其实最近也有人提出来基于 C 语言手搓一个大模型只是说大家还没有大规模的去试起来大家对模型结构的优化我觉得做的还是比较多的只是外界可能没有看到在 GPU 上中美差距不大大了

我感觉国内应该还是小几千张卡 GPU 做训练吧硅谷的一线模型应该都是 2 到 3 万卡的机群做训练了下一阶段奔着 10 万卡机群马斯克还说有 30 万的 B100 这就对应 60 万的 H 我觉得国内可能首先要突破万张卡

和万亿参数的 M1 这个临机点我也不知道未来怎么去追 10 万卡集群而且你看微软和欧盘那个星际之门不是有一个 1000 亿美金的投入吗做一个新的超级计算机你说这个如果真的在发生我不知道怎么追 Benchmark 其实看是追上来了的

首先模型评估还是很难的就像评估一个人一样那些 benchmark 的题目全都是公开了的题目也都可以做提前的充分训练你可以理解这个榜单已经被 hack 掉了我觉得另一方面就是征流国内模型做征流做的还是比较多比较凶的很多人在 distill 头目模型公司的数据我觉得最终模型经济价值还是要能做任务才行包括我感觉国内模型这么多其实也挺难说哪家真的好今天可能还是有点一个模糊状态的

而且短期模型能力是不决定胜负的还是真正看谁先做出 GP4 水平但是做出了 GP4 水平又 so what 有可能下一个是比如说谁先有个 3000 万 DU 的产品 5000 万 DU 的产品粘得住把留存好商业模式跑通我觉得这个可能是一个重要的

接下来我们来聊聊下一个部分来探讨一下大模型的商业模式和壁垒你觉得大模型这个是个好的商业模式吗我觉得目前肯定没有广告平台商业模式好订阅还是一个比较传统的商业模式吧你看 ChashPT 现在一个多亿的 DAU 你就假设 10%的付费用户那就 1000 万的付费用户 200 美金一年其实这就 20 亿美金假设说未来也能翻几倍

但你看相比 Google 广告平台一年 2000 多亿美金的营收还是也就 1%到 2%对吧还是比较小的因为广告平台是一个非常成熟的商业模式吧因为你新增一个用户在未来 6 到 12 月肯定是能赚回来的这个 ROI 是能算账能算得很清楚的但是大模型投入你买了 GPU 这个 ROI 是没法计算的而且很难分析吧因为这里面兼具着很多科研属性而且失败率就是比较高的

因为这个失败的成本其实就是 GPU 的时间一张 GPU 一个小时定价可能比如说三美金对吧那一张卡一个月可能就要 200 多万美金其实你用不好 GPU 就是在浪费嘛但你从另外一个角度想 GP4 当年的训练成本你比如说两亿美金但

但 OpenAI 已经通过拆 GPT 其实早就赚回来这个钱了而且单看拆 GPT 这个产品好像是盈利性很好的他们的亏损主要还是在探索新的模型技术上这个就很像药企的这种新药研发你看也许 GPT-5

还能发现下一个新腰也能帮欧凡赚更多的钱不过你从全球范围看可能也只有两三家模型公司通过卖模型把这个训练成本能赚回来的其实很多模型公司连训练成本还是赚不回来的吧

新事物商业模式总是还要慢一些比如说 AI 的 agent 落地以后他会不会颠覆广告平台我让一个 travel agent 帮我规划一个意大利的旅行计划用户的精力和注意力是有限的其实我是被迫看很多广告我有一个 travel agent 我其实就不用看太多广告了这个 agent 帮我去比价和谈价其实这个对传统的广告平台是有一个很大的颠覆效应的因为传统的广告平台是建立在人的注意力和

和精力是有限的情况下未来 agent 他是 7-24 小时工作我觉得这是一个蛮有意思的你包括之前咱们播客提到未来能不能有一个叫 value base 的定价就像我在电商平台卖出去 1 万块钱要给电商平台付可能 5 个点左右的抽点我未来用拆 GP 各种 agent 给我增加了 1 万块钱一个月的产出你说我给 OpenAI 付 500 块钱

500 块钱 5%好像也 make sense 你看模型的 API 今天的切换成本还是不高的是很容易换的而且容易产生价格战整体来看我感觉还不是一个最好的商业模式本身对感觉大模型不是一个好的商业模式最后的好的商业模式还是建立在产品运用上而且 AI 助手的产品都是帮助用户节约时间它就让广告投放天然就变得比较差是的

我觉得任何一个伟大的公司都是建立在极好的商业模式之上的广告像 Apple 这种科技消费品包括公有云平台有规模效应包括电商平台 AI 公司想成为伟大公司我觉得还是要有极好的商业模式的回来回来今天这个商业模式的 0 到 1 这个 1 我觉得还是没有跑通的

对 我感觉产品也没有抛通 AI 助手我感觉不是一个好的产品形态不知道就是看是不是足够聪明如果足够聪明就相当于等于 AGA 来了很多商业模式都发生 Fundamental 变化了广告平台也发生变化了你觉得更聪明了 AI 助手的日活也会提高对吗大家种品次会因为他变聪明而提高我觉得全球可能有 50 亿人每天都要跟人打交道的

你只要要跟一个对象打交道那 AI 其实是可以提高效率我的 AI 助理跟你的 AI 助理聊天是的大模型的壁垒在哪我觉得是名牌我觉得第一阶段可能就是 GPU

DT 队的话如果没有 3.2 万卡今年可能就很难在硅谷做 DT 队但其实背后更核心的比如说得有三五十个比较核心的人才团队其实今天我觉得很难再重新 build 一个像 XA 一样团队了因为人才还是收敛比较快的我觉得还是一个综合的壁垒的你在比如说就像好莱坞一样有没有这样一个叫工业体系和成熟的组织方式这个是决定了你的效率的如果说给了你卡

你投了很多钱最后你的科研的效率很低那我觉得也是很容易掉队的现在很多人就开始说 Skinning Law 不一定是唯一的路径或者是错误的路径你觉得会有不一样的路径能走向 AGI 吗我觉得 Skinning Law 好像是最简单的路径了因为简单粗暴的对 GPU 就能通往 AGI 对吧成了就造福人类对吧败了都是科技巨头买单其实是应该继续加大投入的

很多人也在关心这种另类的架构其实肯定 OpenAI 是更关心的我感觉新的架构他们应该全都试过的至今是没有发现其他什么新的真的 work 的路径的如果有的话我觉得大家肯定就扑上去了而且很多人质疑 Transformer 本身其实我感觉是不是 Transformer 可能也不重要了最重要的还是什么架构能满足

持续的 scope 包括通用的泛滑能力这两个能力可能是 Transformer 最大的优势但 Transformer 今天最大的缺点就是 Data-hungry 包括 Computer-hungry 要消耗很多的数据消耗很多的卡其实这个 Data 和 Computer 效率其实是同模型公司在解决的我觉得有可能未来的一个架构还是说就说 Transformer 作为一个底座然后它有它优秀的特性那上面怎么加一些 Data-computer 更 efficient 的一些架构

我觉得这里有一个高培率的问题就是研究怎么提高 data 和 compute 效率的一个课题你在小样本数据也能取得很好的效果比如说你教一个小学生解方程你可能教个几十次慢慢能教会了但是你今天要教给模型可能要教几万个但随着模型能力变强你可能几百个就够了甚至说模型能力更强的时候

你可能教他两三个也够了这就是一个数据的效率吧其实模型架构本身我感觉像 OpenAI 像 Zopic 他们其实对 Transformer 动刀动的已经很大了你像马车早已经没有了马已经变得七不像了吧另外还有一个就是大家对 AGI 的一个关心其实 AI 并不完全需要向人吧其实人机互补

我感觉更重要你比如说 AI 很擅长数据吞吐量特别大的工作它可以并行读取加工很多的数据对吧而且 AI 比人更擅长学习能从大量的数据中找到一个最大公约数今天 AI 是数据量小的时候是不如人的

那 AI 也有更擅长的例子说它是可以 7×24 小时工作对吧提供经济价值那如果逻辑推理能力上去之后还可以 7×24 小时各种帮你去执行推理的工作只要能创造经济价值就好了其实不一定完全是 follow 人的这种工作

工作的你像马车也没有马就是轮子效率比较高 AGI 即便无法实现其实下限也是非常高的 AIGC 在这种数据量很大套路很多的领域 UGC 其实是能打破常规的一些领域就 AI 提供了一个智能的劳动力

人可能就是一个智能的创造力就还有一个就是说 Skinning Law 模型变大我感觉就是探索智能的边界在哪它不是说模型一定要保持那么大的状态其实大家把模型变小大规模的商用我觉得这个速度也是很快的这其实是一个实践和工程问题

大模型的应用客除了这些 AI 的软件其实还有通用机器人和无人驾驶你怎么看待这两条腿的落地先说通用机器人通用机器人的大脑未来就是一个多模态大模型的

底座最后再加一些机器人数据的 fantuning 我觉得是不存在独立的机器人的大脑的这种模型的其实这里面有一个难的就是怎么从大脑的智能的规划能力转化成控制信号这个是未来需要大部分的设备铺了之后做持续的 RO 才能

看到的吧,硅谷的通用机器人公司除了 Tesla 以外好像都不具备硬件本体的能力的我觉得这个可能大概率还是中国公司的机会控制部分还是比较难的中国的供应链优势我觉得还是非常强的然后还有一个有意思的就是说今天来讲想做通用机器人的是没有听到谁能定义出来一个真的好的场景的所以大家就只能先把通用机器人开发出来就像当时个人电脑开发出来的时候大家也不知道怎么用最后你发现第一个场景是报税

企业内报税也用起来了所以你看大家说通用机器人明年可以大规模的弄出来让大家去试有可能餐厅老板说这个我能用起来那个酒店老板说这个我能用起来我觉得可能就是大家去试的一个过程什么时候通用机器人才能做家务我觉得还得五年吧那无人驾驶呢我感觉泰斯拉团队是比较自信的可能

两年内解决的战斗其实这里面 Skinlaw 包括成长速度还是比较快的也比较期待 8 月 8 号 Tesla Robotaxi 这个的发布我觉得可以看看到时候还有没有方向盘如果没有方向盘那是真的比较自信的看买 FastD 这一年有什么进展你从 Piloto 开车开到三番是不用看方向盘了甚至不用碰方向盘了我觉得这已经是一个挺大的进步了其实它的安全性已经比人

要高很多了它两年内结束战斗能结束到什么程度呢大街上都没有人开车了不太可能我觉得 Tesla 一部分车型可以没有方向盘了这样的话它就可以重新定义车这个产品了但一个有人在开的环境下它也能被行是吧

就是无人的车和有人的车是可以并驾的 OK 通用机器人和无人驾驶哪个会落地的更快我觉得还是自动驾驶自动驾驶更快这是一个限定领域就那几个 action 要么往前走要么刹车左转右转对通用机器人他要处理的事情就太多了通用机器人的目标还没有定义清楚比如说我就想要一个做家务的餐厅老板就想要一个当服务员的对我们接下来聊聊巨头的话题就在过去半年巨头发生了点啥你看 Open

我觉得有两派观点一派是觉得伊利亚过去几年贡献好像不是很突出另外一派觉得伊利亚的 research 的 taste 非常好想的都是未来三五年决定性的一些事情我自己的观点是觉得

倾向于没有什么影响对 OPPAi 本身或者说可能影响一些 OPPAi 在人才这块的一些口碑最近接连其实有一些 OPPAi 的离职潮有一些人从 OPPAi 离开不仅是伊利亚这种离职风波对这家公司影响大吗我感觉好像是几乎没有任何影响它最核心的一两百个人我觉得是没有动的你包括其他的公司像 XCI 像 Anthropia 或者其他的模型公司想挖人好像是几乎是挖不动 OPPAi 最核心的人的

而且加入的人我感觉主要还是围绕产品商业安全这些方面最核心的那个底子是非常非常稳的而且是非常非常强的其他的一些硅谷巨头你有没有在观察到过去半年的一些变化最近 Apple 举办了发布会大家关注度比较高你怎么看 Apple 这次的发布

我觉得 Apple 这个公司还是很稳的未来三年手机可能还是我们最方便最可信的设备今天可能看不到哪个设备真的能替代手机的其实你看之前出现了很多 AI 消费设备更多还是一个补充其实对苹果最重要的一个点是 AI 的 feature 能不能带来手机的换机场这个是对它商业上最重要一个点最后加上一个什么样的 feature 比如说内存很大了端侧模型很强了

能刺激用户我去愿意买一个新的手机了甚至说 Siri 真的变得极其的聪明了或者有其他的一些飞行出来了促使我去买一个新的手机我觉得这才是一个更大的变化其实你看硅谷的科技巨头都已经涨了那么多了真的要挑一个比如说让妈妈的养老的钱买的公司我可能还是愿意买 Apple 虽然估值也不便宜

他为什么这次发了以后股价大涨涨了 7 个点大家发现欧盘没有颠覆巨头最后都要求着巨头这是 Apple Google 呢我觉得 Google 的模型上好像是不是很乐观的从真正的 1.5 之后大幅的提升好像是没有的我觉得 Google 的流量优势还是很强的但好像模型总还是差一点意思我不知道具体的原因是什么英伟达呢我觉得三个 T 股价已经提前 press in 可能未来一年半两年的预期了吧

大家对他的股价的争议我觉得还是比较大的这里面存在非常多的 debit 英伟达今天从股价角度来看是已经超出了可分析性的除了说有特别多人对他极其有信仰其实越来越多人今天讨论英伟达

跟 21 年给我讨论比特币一样大家都在去讲这个信仰了但你从实际角度来讲它确实没有竞争对手它在 train 模型全球范围除了 Google 用自己的 TPU train model 以外几乎所有人都是用 GPU 来 trainLM 大模型我觉得未来两三年的竞争格局也是极其稳的不太会有说新的完全颠覆了但是 AI 的变化是很快

我觉得叙事上变化是很快的这个可能会影响大家对它的预期的但我觉得长期英文达肯定还是极其重要的公司这个是整个 AGI 基建里面最关键的一个要素就像马斯克说的 GPU 定生死我觉得它还是一个最重要的一个角色我们之前有一个感觉就是模型 2 企业最大的客户其实是云平台因为云其实跟企业建立了最深的信任之前也有一个说法说

我在大模型上花一块钱就会在语音上带来五块钱的营收其实我们一直想把这个假设调研清楚但其实是一直没有太多的 facts 因为企业

除了测试以外好像在 Cloud spending 上好像没有大规模的东西我觉得可能还是需要花一些时间但是云肯定还是很稳的很多的企业客户不是说我直接调 GPT 调 Cloud API 而是说调云场上的 API 因为那个更稳定可信度更高 Adger 是之前声音很大但 AWS 的技术积累客户积累我觉得还是好

很 solidmeta 呢 lama3 400B 那个模型好像一直还没发出来好像据说内部还没搞懂 M1 怎么弄你看他们好像一直在 trimtrim 到好的一个结果再发出来不一定会开源了这么大的模型如果再开源的话

可能很多人可能是用不起来的而且成本是比较高的一个 400 币的 Dense Model 微软的首先 Copilot 好像是离之前的预期还是要差一些的让我印象最深的还是他跟 Opai 提出了星际之门投 1000 亿美金造一个最大的超级计算机会怎么弄以及到底能带来什么样的

我觉得这是最有意思的最后一个特斯拉呢其实你看 EV 车的销售的竞争是很激烈的所以车本身这个它其实是很被动 FSD 的进步呢好像每隔几个月就有一个大幅提升 XCI 可能是一浪未来一段时间可能有很多间接的技术助力吧 FSD 我是感觉可能比 AGL 要更快的今天对 Tesla 一个比较大的争议是到底是一个车的公司还是一个 AI 的公司

但 AI 的 revenue 还是没有的如果就是车的话可能就是一个比较低的估值 AI 的地方怎么体现出来我觉得是比较重要的而且 100 美金每个月的 FSD 定价还是比较高的如果说免费了或者说通过车险来间接付费有可能还是一个更好的做法了因为这个对车险我觉得未来的冲击还是比较大最后一个台积电其实你看全球 100%的 H100 都是

台积电而且是在台湾生产的这个公司的重要性我觉得是极强的因为过去卷了云端的数据中心接下来又要卷手机上的芯片 Apple 还是它的最大客户所以我觉得你看这么大体量了每年还有 50 的增速我觉得这是极其厉害的我觉得这个公司未来几年也是

不可替代的其实你看我们聊了这几个大的公司好像这几个大的公司潜在都还是受益的而且你就拿着这几个大的公司好像就做一个 passive 的指数好像是能跑远很多其他地方的反而真的是这一波强者横强

AI 公司并没有真的颠覆大的而且是一富于大的今天的 AI 公司都活在巨头的影下你觉得这是为什么对你看创业公司和大公司好像不是一个颠覆关系而是一个依赖关系一个是 AI 公司还是太花钱了第二是巨头的卡位太好

你一个最简单的例子就是说今天的 OpenAI 是没法撒开腿跑的因为它逃离不了这几个科技巨头的覆盖的因为你看 GPU 它受限于英伟达如果英伟达不提前给 OpenAI 卡或者说他给第二名第三名卡那 OpenAI 也会卡的不足的你看 GPU 的集群搭建是受限于微软的而且微软还是 49%的大股东

对吧那微软的 Azure 是 GPT 处打企业客户最重要的一个渠道的你看 C 端还是逃离不了苹果的最后还要跪着苹果弄进去然后苹果其实还是可以分分钟换掉拆 GPT 的所以你看 OpenAI 如果真的说颠覆好像只能挑战一下 GoogleGoogle 好惨听起来只有 Google 被受到了影响

那 AGI 时代 VC 投资变难了吗我觉得是变难因为现阶段面对的很多是科学问题它不是一个可分析的数学问题或数字问题如果今天投大模型我觉得依然是两条第一是不是一个做 AGI 的团队是不是真的奔着 AGI 有这个 vision 而且有这个团队基础的我觉得第二个关键条件就是有没有大腿做 AGI 每年可能要比如说买 10 到 20 万张卡要几个币的投入我觉得背后是

有一个巨大的而且长期的资源支持吧我觉得这个是一个非常重要的我是感觉 AJ 的竞赛的正赛还没有正式开始呢就是大事还没有发生

你比如说很多人提 RAG 对吧几十家公司在做 RAG 这个方向其实你今天还是很难分析哪一家公司一定能跑出来的因为应用还没有大爆发那今天的 RAG 产品还没有经历过大的考验我觉得经历过大的考验可能杀出来还是比较重要的为什么突然开始提 RAG 提的比较多有人说这是阶段性的需求因为企业内有很多的各种信息要检索 RM

RM 只用通用的东西是回答不了的所以需要有一个检索增强要把企业内的各种知识能检索的排序理解比较好因为没落地你就要一个 RAG 的产品来帮他你发现加了 RAG 首先是今天还

还没有太多人能做好 reg 然后第二呢做好了之后呢好像依然还没有弄好 reg 做的最好的还是 populacity 它是检索网页检索的最好的它这个核心难点是什么 populacity 为什么做的好 reg 是它就是一个工程问题它有十几个环节都要优化一个公司你优化好一个环节挺好的但是你要优化好十个环节其实很难的

对比下来你看美国也多你看国内也多这两边的创新生态有没有什么差异在 AI 这件事情上我觉得硅谷 0 到 1 还是比较多的中国的创业者 1 到 100 非常多这是一个非常明显的体感差异我觉得这个背后是叫资本的充裕这可能是硅谷长期能 0 到 1

创新挺重要的一个其实背后是容忍了非常多的失败其实有人失败了之后依然还能被收购还能退出收购环境也比较好我感觉硅谷还是一个叫创新的温室很多人可以异想天开因为有比较充足的 VC 资本支持 0-1 的创新其实我们

国内的话 1 到 100 更多其实这里面会导致一个问题叫技术辨识度还是比较低而且创业的玩家比较多其实内卷的一个很大的原因就是技术辨识度比较低其实你看今天没有人跟 spacex 竞争甚至说你今天要买一个无人机你不知道大疆的第二名是谁我觉得大疆是有技术辨识度的我是期待更多的 0 到 1 创新的吧就是创业者能提出一些更不一样的

我觉得也需要更多长期的风险资本的支持这也是非常非常重要的最后我们来做一个展望吧 2024 年下半年你会更愿意把时间花在哪里你会重点关注哪些问题我觉得第一个就是说围绕成本下降这是一个高度确定的事情

那我希望说围绕成本下降速度提升哪些应用不 work 最后 work 了我觉得这是一个期待的第二个我比较期待端侧吧不管说手机上能加哪些东西尤其是国产手机包括新的小 K 设备它可能是对手机一个很好的补充你比如说像 Meta 眼镜它可能就是一个多么太的入口它给手机有一个更好的辅助那我觉得端侧可能会出来很多东西

第三就是通用机器人我觉得这个需要的时间很长但是会很有意思因为多模态模型在进步中国创业者的机会还是很多的