We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路

86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路

2024/12/22
logo of podcast 张小珺Jùn|商业访谈录

张小珺Jùn|商业访谈录

AI Deep Dive AI Insights AI Chapters Transcript
People
广
广密
张小珺
活跃在人工intelligence和大模型领域的播客主持人和专家,通过《全球大模型季报》和《商业访谈录》分享行业深入分析和预测。
Topics
广密:过去半年认知变化最大的是,各种大模型产品,尽管形态各异,发展路径不同,最终都会殊途同归,目标都是成为"下一个Google"。它们最终会收敛到同一个叙事之下,争夺同一片领地。ChatGPT的目标是成为"下一个Google",其竞争对手不仅仅是其他大模型产品,更是Google。这场竞争是综合能力的较量,包括资金、GPU、人才、产品和品牌等多个方面。信息分发模式经历了门户、搜索、推荐引擎的演变,未来可能融合搜索和推荐,最终成为任务引擎或任务容器,以完成任务自动化。ChatGPT目前的对话形态并非AI最有效的交互方式,未来需要更主动、更融合的产品形态,例如个人助理或超级助理。上下文(Context)对于AI模型至关重要,但大多数人尚未意识到。自动化的上下文数据同步,比人工prompt更有效率。通过同步个人知识库和软件信息,可以更有效地创建个人Agent或网站。AI生成能力增强后,最大增量将是新型软件。软件的本质是人类行为的自动化,未来AI将自动化更多的人类行为。未来软件的开发方式将改变,可能不再需要人为主动定义。如果AI coding能力大幅提升,软件开发效率将提升十倍,并催生新的软件形态。端到端全栈策略更有可能胜出,但需要大量的资源投入。ChatGPT的用户增长加速,与其模型推理成本降低和能力提升有关。ChatGPT的商业模式需要探索,付费率可能难以达到5%。AI产品的商业变现效率至关重要,需要寻找强大的商业模式驱动。虽然每百万token的成本下降,但后端成本因GPU采购而大幅增加。ChatGPT不适合做广告,因为其query的导航类占比低。ChatGPT未来的盈利来源可能包括商户和新的商业模式。AI时代,电商的核心指标可能从GMV转化为任务完成率。ChatGPT目前的形态可能是过渡性的,未来会演变为更主动、更融合的产品。Chatbot的对话形态并非AI最有效的交互方式。未来AI模型可以自动采集用户行为信息,并主动满足用户需求。上下文(Context)是AI任务成功率的关键因素。上下文(Context)如同新时代的支付,是AI任务的基础设施。上下文(Context)的充分同步,决定了AI任务的成功率。OpenAI提出的五个AI分级标准,可以作为理解产品形态演变的线索。AI能力可以从下往上贯穿整个企业组织架构,也可以横向替代各个工种。短期内AI难以达到CEO级别,但两年内达到管理者水平是有可能的。AI与人配合工作,可以大幅提升任务完成数量。让模型更主动,需要改进产品形态和技术架构,尤其要重视上下文(Context)。 张小珺:2025年AI的最大趋势是AI产品落地及产品形态的演变。

Deep Dive

Key Insights

为什么大模型产品最终会收敛到同一个叙事之下?

尽管各个大模型产品形态不同,从不同路径发散,但它们最终都会殊途同归,争夺同一个目标——成为下一个Google。这是因为它们都在计算架构和信息分发的主线下运作,最终目标是任务自动化和任务引擎。

为什么ChatGPT的目标是成为下一个Google?

ChatGPT的目标是成为下一个Google,因为它不仅仅是一个聊天机器人,而是试图重新组织信息和智能,成为一个任务引擎,能够自动化完成各种任务,这与Google的信息分发和搜索功能有相似之处。

为什么Google难以阻止大模型产品超越它?

Google难以阻止大模型产品超越它,因为这些产品不仅仅是搜索引擎,而是任务引擎,能够更主动地完成任务,提供更深层次的价值。Google的传统商业模式和组织问题也限制了其快速转向新形态的能力。

为什么微软和OpenAI的关系可能会破裂?

微软和OpenAI的关系可能会破裂,因为微软可能会投资Anthropic,而Anthropic的目标是成为一个AI操作系统(OS),这与OpenAI的端到端策略有冲突。微软和OpenAI在长期战略上存在分歧。

为什么Anthropic的Coding能力被认为是其核心优势?

Anthropic的Coding能力被认为是其核心优势,因为开发者群体对其模型的Coding能力评价很高,这直接影响了API的消耗和生态系统的构建。Coding能力是衡量模型实际应用能力的关键指标。

为什么2025年AI的最大趋势之一是产品?

2025年AI的最大趋势之一是产品,因为AI技术的进步使得产品能够更好地落地,产品形态也会不断演变。AI产品将如何落地以及产品形态如何演变是未来两年的关键问题。

为什么Context在AI产品中非常重要?

Context在AI产品中非常重要,因为它决定了任务的成功率。没有充分的Context,AI模型无法有效完成任务。Context可以理解为新时代的支付,是AI完成任务的基础设施。

为什么ChatGPT的对话形态可能不是最终形态?

ChatGPT的对话形态可能不是最终形态,因为它不是提取智能最有效的交互方式。未来可能会有更主动的交互形态,如个人助理或超级助理,能够更好地理解用户需求并完成任务。

为什么2025年Long Horizon Task会成为重点?

2025年Long Horizon Task会成为重点,因为这是Agent落地的关键。长距离多步骤的任务对模型的准确性和工程能力要求很高,是未来AI应用的核心。

为什么AI产品的商业模式仍然处于移动梦网时代?

AI产品的商业模式仍然处于移动梦网时代,因为目前的商业模式主要是扣费模式,缺乏规模效应和网络效应。未来的商业模式需要更强的商业效率和价值驱动。

Chapters
本节探讨了 ChatGPT 的目标是成为下一个 Google,并分析了 Google 从 Yahoo 边缘市场崛起,以及未来 AI 产品形态可能演变为任务引擎或超级助理的可能性。
  • ChatGPT 的目标是成为"下一个 Google",与 Google 争夺信息分发领域。
  • AI 产品形态将从对话形态演变为任务引擎或任务容器。
  • Context 是 AI 产品的关键因素,大多数人尚未意识到其重要性。
  • LLM 的最大增量是新型软件。

Shownotes Transcript

今天这集是我和广密【全球大模型季报】第5集,是2024年Q4季报,也是我们录制的第二次跨年特辑。

提前和大家见面啦:)

这次你会发现,**我们的聊天篇幅开始从大模型技术转向对大模型产品的探讨。**很大概率来说,产品会是2025年AI的最大趋势之一。AI产品会如何落地?产品形态又会如何演变?

广密带来了最新猜想。他提出,**过去半年他最强烈的认知变化是,不管国外的ChatGPT、Anthropic、xAI、Perplexity,还是国内的豆包、Kimi,甚至是做Coding相关的Cursor、Devin……虽然各个产品的产品形态不一,从不同路径发散,但最后会殊途同归。**他们最终很可能收敛到同一个叙事之下,争夺同一片领地。

很开心转眼之间,【全球大模型季报】已经陪伴大家1年,明年仍然希望这个系列能持续地帮大家了解最前沿的AGI动态并带来认知进化。 本集是《张小珺Jùn|商业访谈录》和《海外独角兽》)的串台节目。我们的播客节目在腾讯新闻首发),大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯。02:33 Part 1: OpenAI

  • ChatGPT本质是奔着“下一个Google”方向去了,如何beat Google是最大的牌
  • 一定要逛计算机历史博物馆,理解**“计算架构+信息分发”**演变的主线逻辑
  • Google也是从Yahoo边缘市场撑大做起来,伟大公司是从边缘市场起来
  • 小红书非常有意思,融合了搜索+推荐+问答+做任务一体化
  • 这些产品最终的最终会变成任务引擎、任务容器,是下一个Google
  • 电商过去最核心的是GMV,订单转化率,AI时代我感觉是任务完成率
  • Chatbot对话形态大概率不是提取智能最有效的交互方式,模型如何更主动?
  • 可能的一个产品形态是个人助理或者超级助理
  • Context非常核心,绝大多数人都还没意识到,是一条关键的暗线
  • 如果AI的生成能力增强了,未来会生成的是什么?Mobile最大增量是内容,LLM最大增量新型软件
  • 既然这些LLM产品想成为Google已经变成了一张明牌,你觉得Google有能力阻止这件事发生吗?
  • “下一个Google”的产品,会是一家垄断吗?
  • 微软和OpenAI同床异梦,微软可能会投资Anthropic

51:04 Part 2: 硅谷其他AI公司和产品

  • **Anthropic:**得Coding,得开发者,得API消耗,有机会得生态,做OS
  • Anthropic比较专注Agent,怎么让Agent更快落地是更高优先级
  • Killer App长期要有竞争力,要端到端垂直整合能力,向下优化,优化成本、模型架构、模型大小、调整模型数据分布、甚至向下优化推理芯片
  • **xAI:**还是注定要成功,但是upside还有多少不太确定
  • **Perplexity:**更像是一个信息处理的Agent
  • **Cursor:**Coding产品形态要快速迭代,之前补全下一个代码,Cursor补全下一个Action,明年可能端到端生成软件
  • **Devin:**第一个真正意义上做长距离复杂任务的Agent,明年最具有商业价值的是long horizon Agent(长期规划智能体)
  • **Mistral:**已经不用再关注了,他们内部也正式放弃预训练了

01:02:24 Part 3: 对2025/2026关键预言性判断

  • 1/ Long horizon task 是下个重点,重要核心圈子几个大佬级人物都在重点做
  • 2/ 产品形态的探索,全新的交互界面
  • 3/ AI商业模式的探索,今天商业模式还是移动梦网时代
  • 4/ 高质量+scalable的数据,尤其是各个垂直行业里面,有没有几千条甚至上万条,任务+Reward数据,要高水平专家标注
  • 5/ GPT-5/4.5 Orion:提升能有多大
  • 6/ O1后面天花板走到哪:大规模scale RL/o1之后会怎么样,会不会很快遇到瓶颈
  • 7/ 假设Coding能力明年提升10倍,软件开发范式怎么改变
  • 8/ Context很重要,大家都还不够重视
  • 创业公司没法同时做好这么多,得找锋利的切入点,一根针捅破天

01:11:11 Part 4: 再谈Scaling Law

  • Ilya最近提的pretrain data wall(预训练数据壁垒)是什么?
  • 后训练中有一个关键问题是奖励模型(reward model),整个地球上没有一个reward model衡量所有人,你相信会未来有吗?
  • O1系列天花板会卡在哪?这条路通往AGI吗?
  • Scaling Law关键阻碍不是算力,不是算法,是data问题
  • ChatGPT有数据飞轮吗?未来会出现吗?哪些产品里有高价值数据?

01:22:19 Part 5: 复盘2024

  • 回顾一下,能定义2024年全球大模型产业的关键时刻?
  • 全球大模型又狂卷一年,卷出了什么?
  • 今天想要进入决赛圈,条件是什么?
  • 哪些去年的判断你今天更坚信了,哪些去年的判断你今天认知有改变?
  • Mega7巨头里面最看好哪个?
  • 硅谷人才在流向哪几家公司?
  • 明年如果只投一个方向,投什么?
  • 这一轮大的机会,我总结是这3个……
  • 2024关键词?2025关键词?

【全球大模型季报】系列

2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观)

2024年Q1:和广密聊AGI大基建时代:电+芯片=产出智能)

2024年Q2:口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态)

2024年Q3:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL)

【更多信息】

联络我们:微博@张小珺-Benita),小红书@张小珺jùn)

更多信息欢迎关注公众号:张小珺