大 基建 就 很 像 西部 拓荒, 欧 盘 内部 的 状态 就像 一个 从东向西 的 火车 开拓美洲大陆 科学家 让 火车 在 高速 奔跑, 英 菲尔 的 工程师 在 前面 修铁路, 这个 铁路 铺设 和 火车 是 齐头并进。 有 一次 公开 说, 老黄 用 的 最多 的 一个 产品 就是 probability, 老黄 给 代言 了。 2013年 的 时候, 头条 A P P 的 次 留 应该 有 46%。
后面 规模 大 了, 其实 好像 留存 还 更好 了。 后来 的 留存 其实 跟 这个 基本上 是 一样的, 长期 留存 很高, 我记得 减 是 比 其他 的 A I 产品 是要 高 的。 其实 创业 公司 今天 好像 都在 巨头 的 辐射 之下。 有一个 朋友 说, 连续 五天, 平均 每天 只 睡 3个小时, 睡 前和 醒来 就是 吹毛 的。 Got to give.
Hello, 大家好, 欢迎 收听 张小 珺 商业 访谈录, 我是 腾讯 新闻 的 小俊, 这是 一档 提供 一手 高密度 信息 的 商业 访谈 节目。 今天 这 集 是 全球 大 模型 季报 第三集, 我 与 广 密 从 A I 应用 端 出发, 复盘 全球 大 模型 这 半年 的 进展。 A I 搜索 是 大 模型 在 应用 端 达成 的 第一个 共识。 这次 我们 详细 聊 一 聊 A I 搜索 企业 popular, 关于 它的 创业 数据 竞争 与 护城河。 这家 公司 最新 一轮 估值 已经 达 30亿美元。 此外 我们 聊 了 一些 业界 非常 关心 的 重要 话题, A I 应用 为什么 还没有 大 爆发? GPT5 为什么 那么 慢? 大 模型 的 商业模式 和 壁垒 究竟 是什么? 我们 也 对 美国 科技 巨头 过去 半年 的 状况 一一 做了 点评。 还有 是 我们在 这 期 节目 里 新增 了 一个 互动 环节。 大家 可以 就 播客 里 提出 的 问题 在 评论 区里 留言, 也许 嘉宾 会 现身 回复。
广 密 我们 顺延 着 前 两期 节目, 我们 争取 在 每个 季度 的 节点 都 来做 一个 全球 大 模型 的 复盘 和 展望。 希望 帮助 科技 的 从业者、 研究者 或者 A I 的 爱好者, 如果 他 每半年 每个 季度 只 收听 一期 播客 节目, 来 了解 全球 大 模型 的 动态 进程, 希望 他们 拼 的 是 我们 这 一期。 这里 Q 一下 我 和 广利 这个 全球 大 模型 的 系列。 前 两期 节目 分别 是 商业 访谈录 的 第 54和64集, 如果 大家 还没有 听 过, 也 非常 推荐 给 大家。 现在 来到 了 2024年 的 六月, 巩俐 你 今年 依然 在 美国 花 的 时间 非常 的 多, 整个 上半年 你 自己 最大 的 感受 是什么?
对, G P4 出来 一年 多了, A I 应用 还没有 大 爆发, 从 结果 上 看 是 比较 无聊。 好的, 咱们 抛开 大 模型 公司 自身 的 应用, 像 x GPT, 其实 硅谷 主流 V C 头 的 跑 出来 的 上 一定 估值 的。 其实我 就 想到 比如说 popular 一家, 两千多万 的 月活, 两千多 万美金 的 A R 年底 有可能 比如说 说 一个亿 的 月活, 一个 亿美金 的 A R 其他 的 我 感觉 很多 还在 一个 P M F 的 之前 的 阶段。
Pop S T 是一个 相对 成熟 的 公司。 关于 这家 公司 的 C E O 创业 团队 和 创业 过程, 你 能不能 展开 给 我们 讲讲?
他们 应该 是 22年 8月份 成立 的。 C E O 是 印度 伯克利 的 C S P H D, 最早 在 open 丁 曼都 实习, 毕业后 就 加入 文化 一年, 然后 一年 后 就 出来 创业 了。 他 那个 C T O 是 最早 是 微软 必应 的 搜索 工程师, 之后 是 美国 的 知乎 coral, 之后 再买 卡宴。 现在 的话 应该 有 50个人我 记得 印象 比较 深 的 是 他们 刚 出来 创业 的 时候, 我 感觉 硅谷 最 核心 的 A I 圈 的 人 好像 都 投 了 他们。 反正 就是 过去 一年 产品 迭代 很快, 一直 稳定增长, 月度 环比增长 都在 20以上。
他是 在 chat P T 发布 之前 就 成立 了。 对他 当时 为什么 出来? 从 OpenAI.
对 A I 搜索 信息 分发 这个 事儿 感兴趣。
OK 所以 他 其实 是 知道 open I 内部 进展 的 一个人。
因为 之前 在 欧华 工作。
硅谷 核心 圈 的 人都 投 了 他们。 是因为 这个 原因, 就 是从 OPPO I 出来 的 人从 这个。
去 source 到 他们。 大家 有一个 感觉 就是 X G T 是 一定 会 做 搜索 的, 这种 能 做好 搜索 产品 的 团队 是 值得 被 来 再 收购 回去 的。 可以 再 换 一条 open a 的 股票 了。
这家 公司 的 融资 历程 是 什么样 的? 哪些 人 参与 了 pop asi 的 这场 资本 游戏?
刚才 提到 比如说 很多 A I 核心 圈 的 人, google 的 S V P jeff d, meta 的 严 坤 欧 的 皮塔 bill, 包括 Andrew aci 包括 知名 的 solo G P 伊拉 gil, 包括 比如说 给他 之前 的 C E O net fridman data burks 的 投放 的 软 心 hugin face 的 C E O, 我 感觉 还 挺 多 人的。 亚马逊 的 创始人 BIOS 个人 也 投 了。 Bassos 还是 是 google 的 天使投资 人, 对 搜索 还是 比较 懂 的。 最新 一轮 我记得 是 byers 领 投, 30亿美金 估值。
OK 他 一共 现在 完成 了 三轮 融资。
加上 小轮 应该 有 四轮 了。
第一轮 是 什么时候?
A 轮 的话 我记得 应该 是 二三年 初。 I V P 我记得 有 5亿美金 一轮, 今年初 有 一个 10亿美金 一轮, 最近 是 30亿美金 了。
就 一共 四轮, 大概 也是 差不多 每半年 融 一轮 的 这个 节奏, 差不多 跟 国内 这些 大 模型。
公司 差不多。
所以 也是 club deal。
在 美国 其实 后面 还 比较 结构化, 但 他们的 个人 投资人 还是 比较 多 的。 其实 你看 这 一轮 之前 还是 很多 个人 在 投 的。 你看 上 一轮 是 Daniel gross air grand, 他 自己 投 了 很多 钱。
为什么 他们 这种 个人 投资 非常 的 多? 这 跟 中国 还 挺 不一样的。
中国 还是 以 V C 为主。 你 比如说 像 A I 我 感觉 他在 A I 领域 的 影响力 是 比 Y C 还要 更 成功 的。 因为 这 两个人 是 更 懂, 而且 在 核心 圈子, 而且 可以 参与 的 更多。 他们 自己 记得 之前 还 买 了 很多 H 100去给 到 他的 prof 6用。 而且 我 感觉 主要是 他们 钱 也 多, 喜欢 参与 这种 早期 投资。
Plastic 和 其他 的 公司 你 觉得 有什么 差别 吗?
我 觉得 第一 是 数据 增长 一直 是 比较 好的。 第二 从 今天 复盘 过去 一年 来看, 信息检索 还是 匹配 模型 能力 最 重要 的。 Use case 我 觉得 其次 可能 是 教育, 可能 就 这 两个 真的 是 匹配 今天 模型 能力。 如果 大家 理解 了 今天 的 模型 能力, 我 觉得 去 理解 这种 产品 是 比较 match 的 一个点。
你 觉得 过去 一年 为什么 是 per plastic 跑 出来 了?
因为 去年 这个 时候 觉得 chat B T 应该做 搜索, 挑 一个 软柿子 捏。 所以 proper 过去 大家 觉得 是 有 收购 价值 的, 但 你看 今天 欧也 决定 做 搜索 了。 那 其实 说明 一个 事儿, 信息检索 这个 事儿 是 匹配 模型 能力 最 重要 的 一个 use case。 我 觉得 这 是一个 体会。 我 觉得 更 重要 的 一个 体会 是 理解 大 模型 能力 到底 能 匹配 什么。 U S 这个 是 更 重要 的。 因为 之前 我们 聊到 模型 能力 是一个 渐进式 解锁 的。 你看 我们 作为 一个 知识 工作者, 一般 有 几类 的 创造性 任务。 第一个 比如说 叫 组合 性 的 创造。 第二个 比如说 像 探索性 的 创造, 第三 可能 比如说 像 变革性 的 创造。
其实 你看 信息检索 这种 就是 一个 组合 性 的 工作, 是 最能 匹配 今天 模型 的 能力 的那 你 比如说 像 长距离 推理 工作, 像 比如说 今天 我们 写 一篇 tesla 的 投 研 报告, 这种 是一个 探索性 的 创造。 你 还要 规划, 还有 各种 推理。 那你 比如说 像 科学发现 万有引力 定律 这种 包括 发现 摩擦力, 这种 是一个 叫 变革性 的 创造。
今天 大 模型 还 比较 难 做到。 比如说 举一反三, 它 其实 还 比较 难 处理 这种 没 见过 的 任务。 我 感觉 property 这个 团队 对 现在 的 模型 能力 的 边界 理解 是 很深的。 模型 今天 还没有 一个 叫 自由 探索 的 一个 能力, 更多 的 还是 一个 信息 组合 的 能力。 今天 这 模型 的 能力 也就 刚好 契合 propria ity 做 的 这种 复杂 信息 问答 的 一个 case。
在 现有 模型 下, 它是 一个 相对 fit 的 一个 P M, 对, 它是 对模型 及 产品 模型 及 应用 这种 说法 的 反击。 因为 它的 创始人 说 他是 先 思考 产品 再 思考 模型, 而 不是 像 我们 国内 很多 大 模型 公司, 他们 提出 的 是我 先 提高 模型 能力, 然后 同步 去 想 产品。 他们的 思考 逻辑 其实 是 反 的。
其实 他们 也 翻车 了, 一个 mr 7B的 模型 也能 覆盖 很大 的 坑 了。 一方面 是 成本 考虑, 还有 一方面 是 它 要 向下 改 模型。 其实 如果说 一个 能力 不行, 我 就 不能 向下 改 模型, 我不能 要求 gp 改 cloud 改。 所以 他们 自己 也 翻车 了 一个 小 模型, 其实 最后 还是 要端 到 端 full stack 来 优化 的。
我们 到底 应该 先 思考 模型 再 思考 产品, 还是 先 思考 产品 再 思考 模型。
是 没有 一个 标准答案。 其实 你看 欧派 也 做 搜索 了, 但 欧派 做 搜索 能不能 做好 我们 不知道 的。 S P A C X 有 发射能力 了, 他 自己 能 做 starlink, 别人 借助 它的 发射能力 能不能 做好? 如果 他 这个 能力 是 开放 的, 今天 这个 A P I 都是 开放 的。
最后 还是 双轮 驱动。
如果 props 能 向下 改 模型, pic 收购 了 proxy, 那 我 觉得 他 去 跟 欧派 竞争, 这是 很 好的 一个 组合。
所以 pic 会 收购 policy 吗?
这个 不知道 plc 的 往下走, 肯定 是要 跟 模型 更深 的 结合 的。 改 模型 资源 投入 太大 了, 这个 其实 很难 做到。 我 感觉 这个 问题。
很难 回答我 看 你们 那个 公众 号 上 翻译 了 他的 C E O 的 采访 的 文章。 他的 这个 模型 还是 一开始 先 坚决 的 用 外部 模型。 因为 你的 目标 是 打造 以 产品 为 核心 的 公司, 所以 不要 在 训练 模型 上 花费 时间 专注 产品, 做 用户 增长, 做好 留存, 这是 先 解决 的 问题。 最 重要 的 一步, 它是 接下来 再去 决定 定 了 一个 自己的 小 模型。
对 吧? 我 觉得 这个 是 make sense 的。 如果 是 今天我 自己 做 一个 应用, 我 肯定 也是 基于 最好的 模型 的 能力 先 做 P M F 之后 我想 的 是要 降 成本, 再 之后 我要 端 到 端的 做 优化。 甚至 说 我 蒸馏 的 一个 小的 模型, cover 这些 特定 的 热门 的 问答, 我 觉得 这 是一个 work 的 路径。 如果 今天我 做 一个 特定 领域 的 助理 应用, 我 肯定 是 先 用 G P4 最强 的 模型。 先 做了 P M F 之后 就 想办法 降 成本, 然后 想办法 去 O N 自己的 模型, 还能 去 改 一些 东西。 其实 今天 来讲, 我们 有一个 模型, 你 比如说 我 一个 T 的 数据, 今天 好像 也 花 不了 太多 钱, 其实 比 从头 衬 一个 模型 成本 是 低 很多 的那 我可以 问 一个 自己 模型, 不管 说 我 基于 开源 做 一个 翻 圈, 我 觉得 这 是一个 做 产品 的 路径。 有可能 未来 很多 的 应用 公司 也会 问问 自己的 小 模型 的。
如果 按照 我们 之前 说 的 渐进式 解锁 模型 能力 在 提高, 解锁 出 不同 的 应用 的 这个 逻辑。 那 未来 比如说 GPT4 到了 GPT5 的 水平, 现在 这个 现有 产品 的 产品 形态, 它的 护城河 是什么 呢? 拥有 更大 模型 的 公司 会不会 超 一个 它的 产品 形态 就 把 它 碾压 了 呢?
其实 是 有可能 的。 只能 说 过去 一年 X G P 做 即时性 的 信息检索 效果 太差 了, 所以 是 留有 这个 窗口 的那 欧派 它 如果 很 轻松 的 把 即时性 的 信息检索 做 的 很好。
所以 它 必须 要 提高 自己的 模型 能力。
对 甚至 跟 一个 模型 公司 深度 合作, 甚至 说 跟 一个 巨头 深度 合作。
资金 它的 估值 到了 30亿美元, 它的 估值 为什么 这么 高?
搜索 还是 互联网 上 最 肥 和 最大 的 市场 了。 其实 你看 微软 必应 只有。 有 全球 搜索 3.4% 的 份额, 但 产生 了 120亿美金 的 年 营收。 所以 A I 搜索 只要 抢 到 google 1%到2% 的 份额, 这个 生意 就 很大。 所以 A I 搜索 我 感觉 应该 是 大 模型 初期 最大 的 K Y APP。 而且 我们 看到 protracted 单个 活跃 用户 每天 搜索 的 query 量 其实 是 google 的 三倍 还要 多。
其实 去年 讨论 我问 的 第一个 问题 就是说 proxy 这种 形态 跟 小红 书 长期 是一个 什么 关系? 一个 是 AIGC, 一个 是 纯 的 G C, 其实 本质 都 是在 做好 信息 分发, 帮 用户 解决问题, 对 吧? 其实 都 是在 抢 传统 搜索 的 生意。 其实 小红 书 抢 了 很多 百度 的 搜索 流量。 这 公司 A 轮 的 时候, 当时 我们 就 跟 头条 早期 做 对比, 我 觉得 蛮有意思 的。 2013年 的 时候, 头条 A P P 的 次 流 应该 有 46%。
后面 规模 大 了, 其实 好像 留存 还 更好 了。 Protect 的 留存 其实 跟 这个 基本上 是 一样的, 长期 留存 很高, 我记得 显著 是 比 其他 的 A I 产品 是要 高 的。 其实 今天 我们 评价 P M F, 我 感觉 最 重要 的 还是 两个 要素。 第一个 是 留存 好不好? 第二个 是 商业化 模型 好不好。 留存 我 觉得 这个 肯定 过关 的对 吧? 商业化 上 确实 是 没有 广告 平台 这种 效率高 的, 我 觉得 这也是 A I 产品 今天 面临 的 一个 普遍 问题。 因为 广告 这个 模式 其实 在 P C 时代 就 非常 成熟 了。 移动 的 时候 搬 过来 很 容易 property 留存。
好, 我 觉得 有一个 很 重要 的 原因 叫 产品 心智。 就 之前 我们 博客 聊 的, 其实 A I 产品 今天 还没有 很强 的 叫 网络 效应、 规模 效应 和 数据 飞轮, 对 吧? 就是 一个 用户 心智, 我 感觉 是 properly 占 住了 A I 搜索 这个 心智, ChatGPT 占 住了 chat 这个 心智, character 也 占 住了 陪伴 这个 心智。 其实 就像 google 早年 占 住了 搜索 这个 心智。 A I 搜索 未来 还有一个 想象 空间, 就是 agent 落地 以后, 其实 搜索 还是 最 适合 agent 落地 的 一个 场景。 对 用户 的 个性化, 他的 知识, 对 复杂 问题, 因为 后面 还有 action 执行 落地, 这个 对 用户 的 决策 帮助 是 比较 大 的。
Plastic 他 今年 冒出来 的 他的 一些 关键 决策, 你 觉得 有没有 一些?
我 觉得 有一个 关键 就是 NVIDIA 投 了 他, 所以 老黄 帮 他 带 了 很多 量。 有 一次 公开 说 老黄 用 的 最多 的 一个 产品 就是 popularity, 老黄 给 代言 了, 而且 C E O 也 经常 出来 讲, 其实 在 支持 工作 或者 这个 群体, 我 觉得 一开始 站 的 是 比较 好的。 我 觉得 两个 事儿 比较 重要。 第一个 就是说 C E O 持续 不到 占 住 A I 搜索 这个 心智, 在 增长 的 动作 上 也 做了 很多 这个 产品 的 核心 我 感觉 就是。
增长 它是 有 多大。
我 感觉 应该 是 94。
问 一个 V C 经常 问 的 问题, top asi 怎么 和 google 竞争 呢? 或者 怎么 和 open I 竞争?
对我 感觉 竞争 这个 问题, 其实 他们 创业 第一天 也 回答 不了, A 轮 也很 难 回答。 三个 B 了 我 感觉 也很 难 回答 了。 后面 走到 百 亿美金 甚至 几百 亿美金 可能 也很 难 回答。 其实我 感觉 头条 在 一开始 也很 难 回答 怎么 跟 三大 门户 的 竞争。 就 竞争 这个 问题 我也 好的 答案, 我自己 感觉 可能 是 错位 竞争。
其实 不是 完全 一样的 产品 和 技术 project, 我 感觉 找到 的 是 I M 最 匹配 的 一个 能力 的 领域。 知识 工作者 就是 use case, 就是 信息 问答, 尤其是 复杂 的 信息 问答, 就是 围绕 商业, 本地 生活。 其实 你看 google 擅长 的 是 网页 的 导航, 包括 交易 信息 的 搜索。 protested. 其实 是 做 的 对应 传统 搜索 中 差不多 5% 左右 的 复杂 问题 的 问答。 其实 这个 是 传统 搜索 没有 做好 的, 其实 也是 搜索 中 皇冠 上 的 明珠。
我 觉得 跟 欧派 的 竞争, 其实 还是 主要 看 欧派 自身。 因为 欧派 还是 一个 科研 文化, 其实 后面 产品 文化 能不能 baLance 好, 我 觉得 是 比较 重要 的。 如果 这种 技术 交到 头条 手上, 我 感觉 今天 产品 和 商业 的 收益 可能 是 欧派 的 3到4倍 的。 做好 产品 和 商业 这种 文化, 可能 还是 字节 和 meta 这种 组织文化。
最简单 一个 例子, 你 比如说 说 搜索 产品 团队 觉得 某个 能力 不行, 你 想 向下 改改 模型 的 数据, 你 问一问 模型 团队 同意 不 同意。 我 觉得 open I 可能 是 不 同意 的, 他是 不想 改动 模型 的 基础 的 数据 的。 另外 你看 open I 可能 比如说 十个 人 做 搜索 popularity 是 50个人 专注 在 这 一个 事儿 上, 我 觉得 也 不见得 比 他们 差 了。 我 觉得 错位 竞争 比较 重要 的, 创业 公司 可能 要 好好 理解 一下, 错位 竞争 其实 是 很难 跟 巨头 硬碰硬 的。
还有 一个点, 就 未来 还有 很多 产品 形态 本身 的 变化。 因为 大家 天然 会 觉得 搜索 和 chat 就 应该 给 及时性 的 答案。 但 其实 我们 很多 工作 中 任务 都 不是 及时性 的。 比如说 我们 跟 我们的 同事 协作 都要 做 多步 规划, 甚至 一周 以后 再 给 一个 结果, 一个 复杂 问题 拆成 多步 多次 的 搜索 得到 一个 更好 的 答案, 这也是 一个 潜在 的 状态。 未来 我的 很多 的 任务 就在 一个 看板 上, 然后 我 持续的 prompt 它, 我的 workflow 都 跑 在 这样 一个 A I 产品 上了。 我 觉得 这也是 一个 未来 更 有意思 的 形态, 尤其是 在 agent 落地 以后 得。
总结 一 papli 它的 优势 是 它的 P M F 现在 匹配 的 模型 能力, 且 占 住了 用户 心智。 但是 在 使用 频次 商业化 和 如何 和 巨头 错位 竞争 上, 还有 很大 的 探索 空间。 是的, 你 看到 对于 破 plus 的 出现, 像 国外 google, 国内 百度 这类 传统 搜索 公 是 有 什么样 的 应对 策略 吗?
Google 其实 出了 一个 自己的 S G E 这个 产品, 包括 overview 这些, 但 好像 口碑 不是 很好。 百度 好像 还没有 动作, 国内 好像 有一个 密 塔。 我 觉得 国内 有一个 问题, 就是说 内容 是 割裂 的。 因为 中国 过早 的 进入 了 移动 互联网 时代, 小红 书 的 内容 你是 很难 检索 的, 微信 的 内容 很难 检索, 甚至 知乎 的 都 不一定 那么 开放。 高质量 内容 的 有效性 我 觉得 是 比较 少 的。 你看 百度 搜索 出来 的 首页 里面, 百度 自己的 内容 我 觉 有 很大 比例。 所以 中国 的 内容 的 割裂 性 跟 海外 的 这种 P C 形态 主导 的, 我 觉得 是 区别 比较 大 的。
你 刚才 也 提到 了 密谈, 你怎么看 这家 公司? 它是 中国 版 的 p sting 吗?
有点像。 但是 国内 内容 的 割裂 性, 我 觉得 这 是一个 最大 差异。
你 觉得 在 中国 的 polity 上, 这个 可能 是 巨头 的 菜 还是 创业 公司 的 菜?
我 觉得 肯定 是 巨头 的 菜。 其实 你看 自己 一年前 就 应该做 一个 这种 产品 去 打 百度 对 吧? 其实 信息流 就是 对 百度 广告 的 一个 很大 的 抢 份额 了, 对 吧? 只是 说 我 感觉 很多人 还没 意识到 是不是 一个 P M F。 有的人 觉得 它 还没有 完全 P M F 以及 长期 面临 大 模型 公司 本身 的 竞争。
所以 对于 中国 的 popularity 这件 事上, 你 还没有 看到 特别 好的 产品 或者 公司 在 做。
好像 昆仑 也 做了 一个 天宫, 对 吧? 好像 我 听说 也有 上百万 的 D U 了。 我 觉得 大家 对 这个 产品 的 天花板 有 不同 的 理解。 这 就像 当年 大家 对 短 视频 的 天花板 有 不同 理解 一样。 有的人 就 觉得 可能 3000万DU 到头 了, 有人 觉得 3个亿DAU 还 不止。 我 觉得 大家 对 这个 产品 的 理解 还是 有有 很强 的 非 共识 的。
你 觉得 他 今天 构建 的 护城河 是什么?
我 觉得 就是 先发 效应 带来 的 用户 心智。
你 觉得 它 未来 是 会 独立 长大 还是 被 并购? 它的 终局 会 是 什么样 呢?
我 觉得 八成 的 可能性 是 被 并购 的。 其实 创业 公司 今天 好像 都在 巨头 的 辐射 之下, 不知道 怎么 炸 出来。 最近 我们 团队 都 买 了 meta 那个 眼镜。 如果 meta 那个 眼镜 上 接入 一个 语音版 的 property, 其实 挺好的。 那 你说 siri 过去 搜索 没 做好, 借 一个 也 蛮 好的。 包括 微软 being 好像 搞了半天 口碑 也 没 那么好, process 比 他 口碑 反而 很好。 其实我 感觉 都在 巨头 的 辐射 之下, 而且 这 是一个 核心 战场。
Top s 今天 估值 和 国内 的 月 账面 是 一样, 都是 30亿美金。 这 意味着 两家 公司 是 除了 h gbt 以外, 全球 并驾齐驱 的 明星 A I 公司。 他们 两个 不管 在 模型 和 产品 形态 上, 你 觉得 本质区别 有 哪些?
岳山 面 还是 基础 大 模型 公司, 不过 他们的 产品 做 的 特别 好。 Kimi chat 其实 也 抓 了 很多 知识 工作者, 用 画像 还是 蛮 接近 的, 还是 有 over life。
但是 mini 是一个 从 大 模型 到 应用 的 公司, 而 克拉斯 蒂 是一个 从 应用 到 模型 的 公司, 前后 顺序 做 的 其实 是 不一样的。
对 美国 的 应用 公司 是 很难 往 下 做 模型 的, 只是 做 基础 的 模型 的 一些 调 优。 我 感觉 中国 的 模型 公司 是 必须 得 往 上 做 应用 的。 所以 美国 出来 哪些 好的 use case, 我 觉得 大家 都会 借鉴 的。
又 回到 copy from U S 的 这个 时代 了, 对 吧? 在 科技创新 上。
我 觉得 那边 走 的 比 我们 快 个 一段时间。 其实 大家 参考 肯定 是 对的。
如果 给 我们 画 一个 脑 图, 在 海外 popley 这类 30亿美元 估值 的 a native 公司 在 第一 梯队。 那 第二 梯队、 第三梯队 你 脑子里 的 A I 创业 公司 有 哪些?
今天 第一位 的 肯定 还是 open I 对 吧? 你看 X G P 已经 上亿 的 D U 了, 这个 还是 很 了不起 的。 Information 曝 出来 它的 A R 已经 34亿美金 了。 就是 我们 盘 了 一下 整个 硅谷 其他 所有 A I 公司 的 A R 加起来 应该 还 不到 15亿美金, 所以 可能 还 不到 open 的 一半。 就 再往下 你 比如说 and service 它是 完全 凸, 企业 端 它 to c 很小, 它 可能 是 拍 的 今天 的 10分之1, 三 亿多 美金 character 可能 有 六七百 万 的 D U 这个 估值 可能 是 三五十 亿美金。 还有一个 最近 比较 火 的 A I 程序员, 这个 也是 20亿美金。
还有 很多 想做 agent 一些。 公司 新 出来 的 reflection 这种 出来 就 几 亿美金, 卖到 独角兽 级别 的, 我 感觉 应该 十家 公司, 但是 都 还是 在 P M S 之前。 你说 有 规模化 的 A R 超过 十个 million, 其实 还是 非常少 的。
你 这 里面 说 大 模型 公司 要 比 A I native 应用 的 公司 估值 都要 高。
大 模型 公司 肯定 是 显著 高 的, 千 亿美金 这个 量级。 后面 anodic 和 马斯克 的 X C I 都是 200亿美金。 再往下 就是 M5 60 亿美金, character 三五十 亿美金, copier 可能 也有 四五十 亿美金。 然后 很多 的 A I native 应用, 如果 跑出 一定量 级 故事, 比较 好的 可能 有 几个 独角兽, 其他 的 很多 还是 在 小 几 亿美金。
所以 per plastic 是在 这个 A I nativ 应用 里面 的 估值。
第一 纯 应用 的 可能 是 估值 比较高 的, 就 不做 模型 的 公司 里面 应该 是 估值 最高 的。
所以 他 跟 kimi 还是 有一个 差距 的, kimi 还是 一个 大 模型 公司。
对, 不算 大厂。
我 前段时间 写 了 一个 报道 叫 大 模型 的 扑克牌, 讲 的 是 中国 资本 在 大 模型 领域 的 投资 故事。 能不能 讲讲 这个 海外 的 资本 故事? 海外 大 模型 的 扑克牌 是 什么样 的? 和 中国 资本 参与 的 显著 不同 是什么?
我 感觉 海外 就 更 清晰 一些, 没有 那么 混沌。 A W S 跟 ano pic 深度 绑定, 微软 跟 open I 深度 绑定, 马斯克 是 自成 一派, 靠 自己的 影响力 融 了 60亿美金, 未来 可能 还能 融 更多 钱。 Character, 想 再 融 几个 billion 的 钱 好像 比较 难 了。
Mr, 我看 刚 融 了 五六 亿美金, 我 觉得 前面 独立 的 公司 只有 三家 了, 就是 open ano pic X C I。 就 今年 年内 他们 已经 有了 3点12万 卡 的 集群, 明年 可能 都是 奔 着 10万卡 的 集群, 如果 没有 一个 极强 的 大腿, 再 给 几个 币, 我 觉得 其实 挺 难 在 大 模型 这块 去 选 的。 我 比较 期待 未来 6到12个月, apple 和 meta 这 两个 怎么 选。 你看 巴菲特 是 push apple 有 1100亿美金 的 回购。 其实 如果 是我 的话, 我 觉得 应该 去 收购 一家 公司。
Meta lama 团队 的 人才 密度 我 感觉 还是 不够 的, 可能 还是 有 船票 的, 因为 马斯克 拿到 了 最后 一张 船票, 自己 做 的 最后 一张 船。 对, 这个 是 取决于 人才 买。 它是 有 很多 卡 的, 而且 能力 也是 很强 的。 其实 人才 上 还是 明显 弱 于 前 几家 的。 马斯克 的 X C I 其实 像 红杉 美国 Anderson 这些 基金 都 参与 了 挺 多 钱 的, 应该 好像 每家 都 放了 5亿美金。 其实 这 还是 对 V C 基金 还是 挺 大 的 一笔 钱。
红杉 中国 在 国内 投 大 模型 公司 投 的 挺 多 的, 红杉 美国 他们 投 的 多 吗? 也是 广 撒网。
红杉 美国 好像 之前 只 投 了 open I 现在 投 了。
X A 相对 集中。 对, 但是 每 一个地方 都 放了 不少 钱。
5亿美金 放 的 很少。 因为 当时 最 担心 的 是 欧派 这种 架构 本身 能不能 给 投资者 很 好的 推出。
我们 刚才 讲完 了 整个 的 大 模型 和 A I native 应用 到底 有 哪些 公司 以及 他们的 估值。 那 据 你 观察 ai 原生 应用 大 爆发 了 吗?
我 觉得 还是 没有 大 爆发 的。 你看 G P4 出来 一年 了, 大家 也 试 了 一年 了, 其实 是 没有 系统性 的 大 爆发 的。 我 觉得 90% 的 原因 是 倾向 于 只 基于 G P4 的 能力 水平 是 不够 的, 只能 做 信息 组合 这种 创新, 没办法 做 长距离 的 推理, 包括 一些 创 性 工作。 所以 还是 得 卷 下一代 模型, 尤其是 推理 能力 和 多 模态 能力。 我 觉得 还有 10% 的 因素 可能 就是 时间 问题。 就是 未来 只 基于 GP4O 的 这种 能力 水平, 还是 有 概率 能 做出来 大 的 应用 的。
你看 过去 NLP20年 也 不算 绝对 成熟, 但是 也 诞生 了 搜索 这种 k life。 其实 你看 电 发明 以后, 也 只有 电灯泡 这 一个 K Y 随着 时间 各种 消费 电子 都 起来 了, 各种 家用电器 都 起来 了。 我 觉得 大家 打磨 了 一年 多了, 我 感觉 也 快 有 一些 P M F 的 意思 了。 我 觉得 这里是 需要 年轻 的 产品 天才 的。
举 个 模型 能力 和 产品 能力 不够 的 例子。
你 比如说 我 就 想要 一个 幽默 版 的 ChatGPT, 会 讲 段子 讨人 开心。 其实 这个 不是 一个 传统 的 产品 经理 能 解决 的, 就是 产品 形态 再 怎么 设计 都 很难, 还是 需要 基础 模型 能力 变强。 我是 一直 比较 相信 高情商 是 建立 在 高智商 的 基础 之上。 首先 模型 要 理解 用户, 理解 用户 的 环境 背景 context, 就 我们 这个 圈 在 发生 啥, 还能 举一反三。 其实 是 想 实现 幽默 这 一个点 就 不太 容易, 只有 产品 形态 上 是 不够 的, 你 得 向下 改 模型, 改 模型 的 性格, 改 数据。
这 是你 前面 说 的 那个 从 组合 性 创造 到 探索性 创造 那个 跨 你 觉得 应用 大 爆发 的 关键 条件 有 哪些? 因为 我们 之前 在 元旦 跨年 的那 期 节目 里面 也 提 了 西 摩尔定律。 你 当时 总结 说有 两条线, 一条线 是 能力 上涨, 一条线 是 成本 下降。 今天 你 还 维持 这个 判断。
还是 这 两条线 了, 我 觉得 这 还是 最 重要 的 两条线。 我们 从 用户 开发者 和 企业 客户 来看, 我们 做了 访谈 之后, 他们 就 关注 2到3个 要素。 第一个 是 模型 能力, 第二个 是 调用 的 成本, 第三个 是 速度 latency。 就 假设 模型 能力 不变, 就是 GPT4O 这个 水平。 如果 未来 一年 速度 再 提 个 三 五倍, 其实 GP4O 比 4 turbo 应该 提 了 有 三四倍 的 速度。 如果 成本 还能 再降 个, 比如说 100对就是 今天 GP4O 定价 的 1%。
我 觉得 仅仅 是 速度 提 个 三倍, 成本 如果 能 再降 个 100倍, 我 觉得 还是 能 催生 很多 东西 的。 你 比如说 open 推出 了 X G P 这个 桌面 客户端, 对 吧? 我 觉得 大家 是 可以 试试 的, 非常 方便。 快捷键 直接 调 出来。 我的 信息检索 基本上 不用 再 打开 chrome 和 google 了。 你看 x GPT 今天 已经 一个多亿 的 D A U, 我 觉得 如果 这个 客户端 手机 端 做 的 足够 好, 未来 做到 3到5个 亿 的 D A U 是 很 有 希望 的。 那个 时候 我 觉得 open I 是 绝对 可以 掀翻 google 一个 墙角 的。
我 觉得 这里 可以 提 一下, 成本 下降 是 高度 确定 的, 但 不一定 是 最 重要 的。 最后 还是 取决于 模型 最后的 经济 价值。 因为 不是 所有的 token 都有 同样 的 价值, 其实 token 的 质量 决定 了 模型 的 商业模式 的。 就 比如说 我 今天 问 GPT 我要 买 什么 股票, 他 跟 我说 是 A W S 还是 meta, 或者 tesla 该 买 还是 卖。 其实 远远 给我 一大堆 的 搜索 结果, 各种 报告 是 有意义 的。 其实 单位 token 的 价值, 我 觉得 更 重要 的这 还是 模型 能力 本身 决定 的。 这个 就是 一个 模型 的 工资 高低。
像 GPT 高 诉 你 买 什么 股票 你敢 买。
决策 肯定 还是 我 做 的对 吧? 但 有些 基础 分析, 我 觉得 慢慢 可信度 时代 上来 了。
所以 模型 它 未来 要 分 不同 的 工种, 不同 的 工种 它的 定价 是 不一样的。
你看 我 经常 会 问 我们的 分析师, 你 帮 我 研究 说 一下 这 几家 公司 的 对比, 那 几家 公司 的 对比。 后面 交互 更好 了 之后, 我 也可以 问 A I, 他 肯定 会 出错 的。 但是 我 觉得 准确度 和 可信度 都是 持续 提升 的 一个 过程 的。
这个 是 需要 他在 垂直 领域 有 更深 的 见解, 他 有 更多 的 数据获取, 就是 他的 能力 更强, 他 才能够 这么 定价。
所以 我 觉得 open I 是 一定要 把 搜索 做好, 才能 满足 更多 人的 检索 的 准确度 的 需求。 你 比如说 open I 未来 在 金融 领域 的 数据 上, 在 做 很多 的 工作, 做 很多 的 饭 圈 面, 那 其实 能 满足 金融 投 研 从业者 的 需求 了。
你 刚才 提到 说 模型 能力 不确定, 看 未来 6到12个月。 那 有 哪些 是你 觉得 高 确定性 要 发生 的 问题, 哪些 是 高 赔率 问题?
我 觉得 高 确定性 的 关键词 可能 就 三个, 一个 是 成本 下降, 一个 是 多 模态 改变 交互, 然后 还有一个 端 侧 成本 下降。 其实 就是 一个 时间 和 工程 问题, 而且 下降 的 速度 可能 会 大幅 超越 大家 的 预期。 我 觉得 创业者 其实 就 应该 按照 免费 的 心态 去 想 怎么 构建 你的 应用。 其实 不惜 用量, 你 就 应该 用 最好的 模型 的 A P I 去做 P M F。 其实 未来 一段时间, 我也想 沿着 成本 下降 这条路 去看看 新的 机会 的。 就是 之前 哪些 场景 因为 成本 快速 下降 就 突然 work 了, 我 觉得 还是会 出来 很多 的。
你 有 看到 什么样 的 方向 吗?
我 觉得 企业级 里面 会 比较 多。 你 比如说 企业 有 知识库, 各种 database, 你可以 无限 检索, 那你 这个 准确度 就会 上来 了。 第二个 多 模态, 我 觉得 是 下一代 交互, voice agent, 这 可能 是 今年 最 值得关注 的 一个 新一代 的 交互 界面。 因为 打字 这个 还是 太 消耗 了 声音, 大幅度降低 了 交互 的 能耗。 其实 就像 触屏 手机 比 键盘 手机 能耗 更 低。 因为 GP4O 是 第一个 端 到 端 声音 进 声音 出的 大 模型。 这个 技术路线 下, 我 觉得 下一代 交互 的 一个 开始 而且 高智能。 我 觉得 40的出现 其实 能 让 端 到 端的 新的 交互 变得 更快。
核心 的 一个 变量 就是 4O的 声音 的 A P I 什么时候 开放, 可能 短期 还 不会 开放。 因为 你看 手机 触屏 这个 交互 是 催生 了 短 视频 的那 声音 的 agent 是不是 能 孕育 一个 新的 交互 的 抖 音 应用 的 机会, 我 觉得 是 比较 乐观 的。 谁 会 是 voice 声音 领域 的 一个 新的 抖 音 的 应用?
另外 就是 多 模态, 它 改变 交互 是 确定性 很高 的, 决定 了 原生 应用 的 下限 在哪。 但 其实我 更 期待 的 是 多 模态 未来 能 提升 模型 的 逻辑推理 能力, 这个 还是 不确定 的, 其实 是一个 高频率 的 问题。 因为 主要是 今天 多 模态 的 数据 支持 密度 太低, 包括 现存 的 多 模态 数据 到底 适 不 适合。 学习。
其实 网上 很多 的 视频 都是 人工 剪辑 后 的。 比如说 我们 看到 一个 房子 的 大门, 后面 就 直接 到 客厅 了。 其实 人是 知道 怎么 过来 的, 但是 A I 是 后面 怎么能 一步一步 的 理解 两段 视频 之间 的 逻辑关系, 我 觉得 这个 是 比较 重要 的。 包括 今天 多 模态 的 泛化 能力 也 不够, 比如说 让 他 特定 领域 的 一个 P D F 可能 很多 地方 也 没 对齐, 它 其实 也 读 不 出来 了。 而且 还有一个, 你 比如说 假如 未来 GP4O 就在 我们 眼睛 上, 在 手表 上、 手机 上装 着, 它是 实时 的。 听着 我们的 以后 我们 也 不用 siri 和 meta 唤醒 它 了, 它 可以 实时 的 插画。 我 觉得 这也是 一个 更好 的 交互 了。
我 觉得 第三个 就是 端 测, skin law 是 让 模型 变得 更大, 探索 一个 智能 的 边界 和 涌现。 但 大家 其实 是 远远 低估 了 模型 变小 的 速度。 我 觉得 未来 6到12个月 可能 就会 有一个 3D的 模型, 达到 一个 极好 的 效果。 你 就 想象 一下, 比如说 GP4O 明年 就能 跑 在 你的 手机 上 一个 3D的 小 模型。 我 觉得 这个 对 P C 和 手机 端 侧 带来 的 机会 还是 比较 大 的。 因为 你看 过去 一年 我们 卷 的 是 云端 数据中心 的 基建, 我 觉得 未来 一两年 甚至 更 长时间 是 卷 的 了 一个 端 侧 的 基建。 因为 今天 iphone 的 内存 就是 8GB, 未来 可能 就是 12GB24GB 往上提。
我 觉 端 测 的 机会 肯定 是 很大 的, 就是 模型 变小 的 速度 也是 很快 的。 因为 之前 不 work 的 那些 I O T 互联网 吧? 有可能 也是 会 变得 work 了。 Meta 的 眼睛 其实 还 挺好玩 的。
模型 变小 的 挑战 是什么?
模型 变小 难 吗? 今天 最 主要 的 一个 是 蒸馏。 你可以 简单 理解 就是说 我 做了 一个 应用 有 90% 的 query, 可能 就是 围绕 比如说 1000个问题。 这 1000个问题 我 同时 不同 的 方法 去 问 X G P, 它的 回答 就 构成 了 一个 纯 小 模型 一个 语料 了。
有一个 不足 的 点 是 相当于 你 用 一 小学生 和 中学生 的 能力 死记硬背, 变得 能说会道 了。 但是 是不是真的 智能 不知道, 但是 一个人 总是 能说会道, 但是 不能 做 任务, 这 长期 还是 不行 的。 还有 一个点 就是 蒸馏 会 增加 了 senate。 因为他 有时候 不知道 自己 在 说, 就是 不知道 自己 不懂 的 问题, 但 还是会 什么。 我 觉得 这 是一个 模型 变小, 对 欧 他们 推 的 小 模型 效果 可能 比 别人 的 大 模型 效果 还要 好。
但是 端 侧 的 这种 小 模型 肯定 是 会 必然 发生 的。
我 觉得 是 会 发生 的。 假如 你 有一个 GP4O 在 你的 手机 上 实时 的 跟着 你那 你的 隐私 永远存在 手机 上 你是 更 放心 的。 但是 如果 存在 云端 你是 不 放心 的。 我 觉得 隐私 是一个 很 重要 的 问题。 如果我 有一个 很强 的 A I 的 助理 就在 我的 手机 上, 我 全天 24小时 打开 它 我也 乐意 的。 但是 在云端 我 可能 就 不一定 可以 了。
但是 大 模型 公司 越 强 的 公司, 它 通过 蒸馏 做 的 小。
模型 可能 也会 越 强, 也 应该 会 的。 另外一个 private 消息 就是 apple 跟 an thora 也 谈 了 一个 蒸馏 的 一个 CloudOps 做 一个 备选。 Apple 跟 open 合作, 那个 是 分 分钟 热插拔, 随时 可以 换 的, 就是 一个 A P I 的 问题。 然后 那个 合作 我 觉得 也是 不稳, 他们 其实 也 在 聊 其他 的 模型 公司, 只是 说 自己的 模型 肯定 今天 还不 太行。
所以 这种 交叉 的 合作 未来 可能 还是会 很多。
我 感觉 A I 消费 硬件 还是 很多 中国 创业者 的 机会。 我也 看到 很多 创业者 在 考虑 卖 他 眼镜 这种 方向 了, 我 觉得 这个 形态 还 蛮有意思 的。 主要是 今天 的 A I 能力 还不 太行, 我 觉得 未来 有可能 能 做 的 事儿 还是 更多 的。 另外 你说 高 赔率 的, 我 觉得 可能 就 几个。 最 重要 的 可能 还是 是 reasoning 逻辑推理 能力, 这个 还是 不确定性 的 一个 科学 问题。 有 两三个 路径 在 尝试, 而且 有 非常 多 的 chicks 大 的 方向 就是说 下一代 模型, 比如说 更大 的 参数, 更多 高质量 的 数据 和 更大 的 模型, 那 确定性 是 比较高 的。 另外 你 比如说 解题 持续的 inference, 这 可能 也是 一些 提高 逻辑 能力 的 一个 重要。
还有一个 就是 叫 可 解释性, 我 觉得 这个 还是 被 大家 低估 的。 因为 可 解释性 打开 了, 模型 的 可控性 也就 解决 了。 就像 广告 系统 定向 的 给你的 回答 加 一些 某些 倾向性。
我 觉得 还有一个 高 赔率 的 问题, 就是 模型 的 组织 能力。 我 感觉 全球 所有的 A I 公司 里面, 只有 open I 的 组织 是 相对 工业化 了的。 我 觉得 其他 的 一些 公司 还都 有点 实验室 的 感觉。 其实 你看 就像 好莱坞, 它是 持续的 产出 好 电影 的, 某个 演员, 某个 导演 换 了 好像 也可以 的。 欧 攀 他 持续 做 科研 的 成功率 还是 比较高 的。 他 今天 推 了 这 走 之前 推 了 sorry, 我 觉得 未来 还会 持续的 推出 很多 东西 的。 你 给 它 单位 的 G P U, 它的 产出 肯定 还是 最高 的。
我 觉得 还有一个 高频率 的 问题, 就是说 如果明天 A G I 就 实现 了, 我们 应该 是用 一个 什么 产品 来 承接。 我 觉得 是 可以 思考 这个 产品 的 载体 的 到底 是 手机 上 的 APP, 还是 各种 其他 的 东西。 其实 还有一个 叫 高 赔率 和 高 确定性 的 问题, 就是说 我 觉得 G P5和 老四 他们的 能力 提升, 我 觉得 还是 大家 应该 乐观。
你说 只有 open I 的 组织 能力, 工业化 它的 工业化 体现 在哪里?
持续 产出 新 东西, 做 科研 的 效率 最高。 举 个 例子, 一个 很 年轻 的 P H D, 没有 太多 的 工作 经验, 到 这里 一年 就能 产出 骚扰, 我 觉得 还是 蛮 厉害 的。 它 整个 的 info 怎么做 事情, 怎么做 实验, 怎么 定 目标, 我 觉得 未来 还 会有 更多 的 这种 例子。
它 里面 有没有 什么 能耗?
我 觉得 一方面 是 基建 做得好, 第二 就是 目标 定 的 好, 然后 怎么 做事, 我 觉得 也 不太 一样的。
如果 只 保留 一两个 能力, 接下来 你 觉得 能力 越深, 最 重要 的 是什么?
我 觉得 逻辑推理 reasoning 这 一个 能力 加上 一个多 模态。
如果 open I G B T four o 给 开发者 的 A P I 成本 大幅 下降, 成本 可以 忽略, 哪些 应用 能 爆发?
对, 我也想 顺带 做 个 调研, 就是说 大家 可以在 博客 的 评论 区 留言, 我自己 会 首先 看 企业应用。 如果 成本 可以 忽略, 那 企业 内 的 知识库, 内部 的 数据库 都 可以 丢 进去 无限 的 检索。 那 这样 准确率 是 很高 的, 能 让 企业 的 很多 use case 是 落地 的。
比如说 企业 的 客服 场景, 大家 觉得 大 模型 出来 之 客服 是 理所当然 的。 但 其实 过去 一年 并没有 大规模 的 改造 客服。 因为 我们 前段时间 做了 一些 客户 访谈, 目前 反馈 最大 的 问题 就是 第一大 模型 不够 可靠, 还 不如 规则 如 base 的 那些 客服 系统 更 可控。 因为 它 容易 乱 回答, 因为 它是 一个 概率模型, 对 吧? 第二 就是 reg 信息检索 是 很难 做好 的。 其实 是 今天 是 没有 一个 端 到 端 自动化 傻瓜 的 产品 能 让 这些 检索 做得 很 好的。 如果 要 精准 的 检索 企业 内 的 数据, 我 觉得 如果 成本 降低, 那 我可以 大规模 的 天 是 这个 可能 是对 企业 内 的 use case 落地 是。
有 很大 帮助 的。 你 能不能 总结 一下 GPT 在 过去 一年 定价 的 下降 的 幅度。
我们 按照 每 100万token 的 定价 来看 不同 的 三个 版本。 它 输入 是 最早 的 GP4 128K 的, 它 是 每 100万应该 是 六十 刀 4 turbo 降到 了 十刀, 40降到 了 五刀。 再看 输出 端, 最早 的 G P4是 120刀 4 turbo 降到 了 三十 刀 四 欧, 已经 是 十五 刀 了。 其实 过去 一年 这个 定价 已经 降 了 十倍 了, 这个 跟 我们 之前 新 摩尔定律 预测 还是 一样的。
所以 这个 是 符合 你的 预期 的。
我 觉得 是 符合 预期 的。 我 比较 好奇 的 是 为什么 open 还 不更 激进 的 降价? 如果 它 更 激进 的 降价, 我 觉得 对 很多 模型 公司 是一个 毁灭性 的 打击。
你 观察 下来 A I 应用型 的 人才 画像 会 是 什么样 的?
年轻 90后。 其实我 跟 一些 老的 人 聊, 我 觉得 包袱 挺 大 的, 都想 把 这个 产品 确定 的 一些 需求 给 规划 出来, 我 觉得 包袱 挺 多 的。 我 觉得 尤其是 90后、 95后, 传统 的 产品 是一个 自动贩卖机, 是 有 固定 的 按钮, 固定 的 sku 但 今天 它 就 不是 一个 固定 的 东西, 它 就是 一个 随机性 的, 它是 一个 概率模型。 你 要 接受 这种 不确定性 的 结果 吗?
给 A I 新物种 大 爆发 一个 时间 的 预测。
PPT5 出来 后 的 半年。
为什么 是 半年?
给 大家 一些 实验 时间吧。
你 对于 硅谷 的 A I 应用 有一个 评价 是无 无聊 吗? 你 过去 在 美国 你 觉得 有 多 无聊?
其实 你看 硅谷 投 的 就是 三个 大方向, agent coding 还有 通用 机器人。 最 主要是 我 觉得 这 三个 大方向 都 是在 open I 未来 模型 的 覆盖范围 之内 出来 的。 这些 你 就 感觉 在 沙滩上 建房 它是 不 牢靠 的。 我 觉得 这 是一个 最大 的 担心 的。
确实 是 接下来 我们 聊聊 大家 都 非常 关注 的 GPT5, GPT5 是 应用 能不能 大 爆发 的 关键 决定 要素, 这 也 了解 open I 模型 能力 的 跃升 是 停滞 了 吗? 为什么 G P5 比 我们 想象 来得 这么 慢? 因为 去年 我们 很多 的 预期 都是 可能 这个 时候 就 已经 出来 了。
我 觉得 还是 受限于 G P U, 还是 算 力 大, 基建 还是 不够。 因为 你看 G P4 相比 G P3 应该 是 几十倍 的 算 力 提升, 然后 GPT5 相比 G P4 今天 也就 十几倍 的 算 力 提升。 你看 H 100芯片 大批量 到货 已经 是 2023年 的 Q 4了, 集群 搭 起来 还是 需要 很多 时间。 然后 大 的 G P U 集群 还是 不稳定, 今年初 才能 做 大规模 的。 训练 因为你 从 拿到 G P U 到 你 真的 能 大规模 的 训练, 可能 还是 需要 个 半年 时间 的。
所以 我 觉得 不是 一个 A I 的 问题, 也 不是 大家 提 的 数据 不够 用 的 问题, 我 觉得 更 不是 skin 了 遇到 瓶颈 的 问题。 我 觉得 就是 实实在在 的 G P U 物理 世界 的 建设 问题。 其实 就是 简简单单 的 需要 更大 的 算 力。 随着 模型 变大, 其实 系统 的 复杂度 也是 指数 提升 的。 因为 模型 变大 以后 出的 问题, 大家 可能 之前 都是 想象 不到 的。
你 这 也 扣 back 我们的 上期 节 AI 大 基建。 对, 受限于 物理 条件 的 问题。 那 GPT 我 预计 什么时候 来 呢? 是 年底。
我 觉得 预期 年底。
那 GPT5 会长 什么样 呢?
我 觉得 首先 skin law 应该 是 没有 减速 的, 我 觉得 外面 噪音 还是 比较 多 的。 还是 要 相信 这帮 全球 范围 最 顶尖 的 最 聪明 的 科学家。 而且 你看 硅谷 几个 大 的 科技 公司, 都是 巨量 投入 下一代 模型, 我 觉得 他们是 不 傻 的。 你 从 具体 来看, 我 觉得 相比 G P4, 我 觉得 参数 上 可能 还要 大个 三 五倍。 然后 比如说 5到10个 T 的 参数 数据量 上, 我 觉得 也要 比 G P4大 个 七八倍 10倍。 当然 不 排除 欧 盘 可能 会 发 多个 版本, 我 觉得 未来 可能 是 会 走向 一个 非常 大 的 M O E 参 数量 巨大, 但是 激活 可能 不一定 大, 激活 可能 是 500亿。 另外 GPT5 应该 是 能 做到 多 模态 输入, 多 模态 输出 了, 但 很难 做 视频 生成, 就是 视频 生成 这个 成本 还是 比较高 的, 我 一直 不 觉得 sora A G I 的 主线 下吧。 另外 你看 模型 变 这么 大 之后, 我 觉得 GPT5 的 逻辑推理 能力 应该 还是 能有 大幅 提升 的。 这个 可能 是对 解锁 应用 最 重要 的 一个 关键 能力。
所以 G P5 可能 视频 还是 融 不 进来。
视频 生成 成本 太高了。
所以 还是 sorry 是 另外一个 分支 了。
但 视频 理解 我 估计 可能 做 的 非常 好。
这个 会 带来 什么 根本性 的 改变 吗? GPT5 长成 这样的话, 听 上去 就是 参数 越大 能力 越 强我。
觉得 最 重要 的 还是 逻辑推理 能力, 要 上去 更大 的 参数, 更多 高质量 的 数据 上去 之后, 逻辑推理 能力 这是 可 预期 的, 有一个 大幅 的 提升 的。 另外一个 就是 多 模态 的 交互 能力 变 其实 会 把 应用 的 打的 比较高。
为什么 GPT4和 GPT5 之间 要 差 一个 GPT F O? 我 觉得。
就是 为了 降 成本, 这样 又能 省 出来 很多 卡 去 给 到 research, 我 觉得 这就是 一个 最简单 的 原 成本 下降 的 速度 还是 超出 我们 预期 的。
硅谷 大 模型 公司 格局 在 牌 桌上 发生了什么 变化? 没有, 在 过去 半年。
我 觉得 硅谷 挺 简单 的 一句话 说 就是 G P U 决定 生死线。 今年 和 明年 我 觉得 分别 是 两条 生死线。 今年 年内 如果 还没有 3.2万 卡 的 集群, 我 觉得 肯定 就 不在 第一 梯队 了。 然后 明年 第一 梯队 的 门票 应该 是 10万卡, 这里是 H 100, 因为 B 系列 可能 要 明年 这个 时候 才能 大规模 到货。 这个 就是 一个 名牌, 就是 拼 资源, 拼 决心 大不大。 当然 这个 点 也会 加速 二 三线 模型 公司 的 出局, 或者 被 收购。 比如说 像 mr coca, 我 觉得 马斯克 是 拿到 了 最后 一张 门票。 如果 meta 想 入局, 我 觉得 还是 得 再 收购。
对比 来说, 你 觉得 中国公司 的 梯队 有 变化 吗? 在 过去 半年 以及 他们的 生死线 是什么?
我 觉得 七八家 还 挺 模糊 的。 从 今天 的 模型 能力 上 来看, 其实 很难 分辨 谁 一定 是 最好的。 就 从 今天 的 模型 能力 上 来看, 谁 断崖 式 领先 是 很难 拉开 的。 我 觉得 是 交替 都有 一些 亮点。 第一个 分水岭 就是 谁 真正 开始 G P4 水平 的 数据 训练, 就是 8000张 H 100这种 量级 的 集群, 今天 好像 还没 开始。
马斯克 的 X A I 是 最后 一张 自己 做大 模型 门票, 它 有什么 差异化 吗?
我 觉得 可能 存在 一种 叫 暴力美学。 因为 马斯克 公开 也 说 了, X I 就是 白糖 10万张卡 集群, 而且 是 全球 第一个 可能。 比如说 今年 8 9月份 上线 充分 互联 的, 而且 是 全 液冷 的 10万卡, 意味着 一个月 可以 趁 10个GP4 迭代 速度 变快 了, 而且 还 可以 更 早 的 训练 下一代 模型。 我是 很 期待 说 这个 超大 集群 未来 能 出来 哪些 新 东西 的。 X I 如果 比 其他 模型 公司 更 早 六个月 搞 出来 10万卡 集群, 我 觉得 是 有 弯道 超车 机会 的。 马斯克 好像 就 觉得 G P U 是 最 重要 的, 定 生死。 另外 C I 这个 团队 还是 很强 的, 我 觉得 看看 他们 未来 能不能 很快 的 发出 来 接近 G B 4 clo 3水平 的 模型, 我 还是 比较 乐观。
据 你 了解 大 模型 公司 工作 节奏 怎么样?
他们 卷 不 卷? 我 觉得 是 非常 卷 的。 我 听到 一个 很 形象 的 比, 也就是说 大 基建 就 很 像 西部 拓荒。 欧 盘 内部 的 状态 就像 一个 从东向西 的 火车 开拓美洲大陆 科学家 让 火车 在 高速 奔跑, 英 菲尔 的 工程师 在 前面 修铁路, 这个 铁路 铺设 和 火车 是 齐头并进, 所以 你 就能 感受到 这种 状态。 因为 很多人 说 硅谷 四五点 就 下班, 觉得 这个 印象 不全。 对的, 做大 模型 的 人都 是 很 卷 的。 我 觉得 基本 的 休息时间, 运动 时间 应该说 几乎 全 没了, 每天 都 还是 在 一个 很 卷 的 战斗 状态。 因为 没 解决 的 问题 比 解决 的 问题 多, 而且 新 问题 也 非常 多。
了解 哪家 公司 是 最全 的 open.
而且 人才 密度 也 确实 是 最高 的。
有没有 什么 比较 夸张 的 加班 的 事儿?
有一个 朋友 说 连续 五天 平均 每天 只 睡 3个小时, 睡 前和 醒来 就是 纯 model。
整体 来看, 过去 一年 觉得 在 大 模型 上中 美 差距 是 放大 还是 缩小 了。
我说 一个 非 共识 的 观点, 我 觉得 真实 差距 可能 是在 拉大 的, 而 不是 表面上看 着 真的 追 上了。 我 觉得 更 准确 的 说 应该 是 可以 局部 追上。 比如说 热门 问题 的 问答, 对 吧? 但是 你看 国内 模型 处理 长尾 的 问题 其实 都还不 太行。 其实 这个 就 说明 模型 的 泛化 能力, 我 觉得 还是 不够 的。
其实 最 核心 的 说 今天 我们 不知道 open 内部 又 走到 多远 了。 因为 GP4O 你 说到底 带有 open 的 集 成功率, 我 觉得 有可能 就是 比如说 三 成功率。 其实 你看 欧派 I 的 人才 密度 很高, 都是 非常 聪明 的, 而且 它 有 最 领先 的 模型, 而且 他们 更 早 拿到 了 更 大量 的 G P U 做 更多 的 探索。 只是 说 这个 不 公开 了, 对 吧? 我 觉得 想 用 一个 5% 的 资源, 就 想 真正 超过 open 百分百 的 投入, 我 觉得 这个 还是 比较 难 的。 除非 说 第一名 成为 先驱 对 吧? 你 就说 人才 密度, 郭 攀 我 觉得 一个人 还是 能 顶 十个 人的。 你看 sorry 团队 可能 也就 不到 10个人, 其他 公司 可能 几十个 人 也 不一定 能 搞得 出来。
外界 是 希望 更 早 更快 的 看到 一些 新的 进展 的。 但 模型 变大 了 之后, 我 觉得 细节 还是 很多 的。 过去 G P4 它是 一个 技术 发展史 的 一个 叫 跳跃 时刻。 其实 你 不可能 每年 都 跳跃 的, 因为 大家 的 预期 变 高 了不 跳跃 你 可能 就 觉得 无聊 了, 对 吧? 其实 很多 细节, 各种 产品 打磨, 我 觉得 需要 的 工作量 还是 比较 大 的。 其实 这 里面 是一个 优化 打补丁 的 点。
你 比如说 大家 居然 都 还是 基于 python 来做 的, 只能 每次 处理 一个 事情, 执行 起来 其实 是 不够 efficient 的。 其实 最近 也 有人 提出来 基于 C 语言 手 搓 一个 大 模型, 只是 说 大家 还没有 大规模 的 去 试起来。 大家 对模型 结构 的 优化, 我 觉得 做 的 还是 比较 多 的。 只是 外界 可能 没有 看到。
在 G P U 上中 美 差距 拉大 了?
我 感觉 国内 应该 还是 小 几千 张卡 G P U 做 训练。 硅谷 的 一线 模型 应该 都是 2到3万 卡 的 集群 做 训练 了。 下一阶段 奔 着 10万卡 集群, 你 马斯克 还 说有 30万的 B 100, 这就 对应 60万的 H 我 觉得 国内 可能 首先 要 突破 万张 卡 和 万亿 参数 的 M O E 这个 临界点。 我也不知道 未来 怎么 去 追 10万卡 集群, 而且 你看 微软 和 欧派 的 那个 星际之门, 不是 有一个 1000亿美金 的 投入, 做 一个 新的 超级计算机。 那 你说 这个 如果 真的 在 发生, 我不知道 怎么追。
一般 去 bug 其实 看 是 追上来 了, 榜单 是不是 不可 技能。
首先 模型 评估 还是 很难 的, 就像 评估 一个人 一样, 那些 benchmark 的 题目 全都 是 公开 了的 题目, 也都 可以 做 提前 的 充分 训练。 你可以 理解 这个 榜单 已经 被 hack 掉了。 我 觉得 另一方面 就是 蒸馏 吧, 国内 模型 做 蒸馏 做 的 还是 比较 多 比较 凶 的。 很多人 在 dto 头部 模型 公司 的 数据, 我 觉得 最终 模型 经济 价值 还是 要 能 做 任务 才行。 包括 我 感觉 国内 模型 这么 多, 其实 也 挺 难说 哪家 真的 好。 今天 可能 还是 有点 一个 模糊 状态 的, 而且 短期 模型 能力 是 不 决定 胜负 的, 还是 真正 看 谁 先 做出 G P4 水平。 但是 做出 了 G P4 水平 又 so what 有可能 下一阶段 是 比如说 谁 先 有 个 3000万DU 的 产品, 5000万DU 的 产品 站得住 对 吧? 留存 好, 商业模式 跑 通, 我 觉得 这个 可能 是一个 重要 的。
接下来 我们 来 聊聊, 下一个 部分, 来 探讨 一下 大 模型 的 商业模式 和 壁垒。 你 觉得 大 模型 这个 是个 好的 商业模式 吗?
我 觉得 目前 肯定 没有 广告 平台 商业模式 好, 订阅 还是 一个 比较 传统 的 商业模式。 你看 t GPT 现在 一个多亿 的 D A U, 你 就 假设 10% 的 付费 用户, 那就 1000万的 付费 用户, 两百 美金 一年, 其实 这就 20亿美金。 假如 说 未来 也能 翻 几倍, 那 你看 相比 google 广告 平台 一年 两千多 亿美金 的 营收, 还是 也就 1%到2%, 对 吧? 还是 比较 小的。 因为 广告 平台 是一个 非常。 成熟 的 商业模式。 因为你 新增 一个 用户, 在 未来 16到12个月 肯定 是 能 赚 回来的。
这个 R O I 是 能 算账, 能 算 的 很 清楚 的。 但是 大 模型 投入 你 买 了 G P U, 这个 R O I 是 没法 计算 的, 而且 很难 分析。 因为 这 里面 兼具 着 很多 科研 属性, 而且 失败率 就是 比较高。 因为 这个 失败 的 成本 其实 就是 G P U 的 时间。 一张 GPU1个 小时 定价 的 可能 比如说 三 美金 对 吧? 那 一张 卡 一个月 可能 就要 两百多万 美金, 其实 你 用 不好 G P U 就是 在 浪费。
但 你 从 另外一个 角度 想, G P4 当年 的 训练 成本, 你 比如说 两 亿美金, 但 欧派 已经 通过 拆 GPT, 其实 早就 赚 回来 这个 钱 了。 而且 单 看 拆 G P 这个 产品 好像 是 盈利性 很 好的。 他们的 亏损 主要 还是 在 探索 新的 模型 技术 上, 知道 吧? 这个 就 很 像 药 企 的 这种 新药 研发。 你看 也许 GPT5 还能 发现 下一个 新药, 也能 帮 欧 盘 赚 更多 的 钱。 不过 你 从 全球 范围 看, 可能 也 只有 两三家 模型 公司 通过 卖 模型 把 这个 训练 成本 能 赚 回来的。 其实 很多 模型 公司 连 训练 成本 还是 赚 不 回来的。
新事物 商业模式 总是 还要 慢 一些。 比如说 A I 的 agent 落地 以后, 它 会不会 颠覆 广告 平台。 我 让 一个 trouble agent 帮 我 规划 一个 意大利 的 旅行 计划, 用户 的 精力 和 注意力 是 有限 的。 其实我 是 被迫 看 很多 广告。 那 我 有一个 trouble agent 我 其实 就 不用 看 太多 广告 了。 这个 agent 帮 我 去 比价 和 谈价。 其实 这个 对 传统 广告 平台 是 有一个 很大 的 颠覆 效应 的。 因为 传统 的 广告 平台 是 建立 在 人的 注意力 和 精力 是 有限 的 情况下。
未来 agent 它是 7乘24小时 工作, 我 觉得 这 是一个 蛮有意思 的。 你 包括 之前 咱们 提到 未来 能不能 有一个 叫 value base 的 定价。 就像 我在 电商 平台 卖出去 1万块钱, 要 给 电商 平台 付 可能 五个 点 左右 的 抽点。 那 我 未来 用 T G P 各种 agent 给我 增加 了 1万块钱 一个月 的 产出。 那 你说 我 给 欧 盘 付 500块钱 5% 好像 也 make sense。 你看 模型 的 A P I 今天 的 切换 成本 还是 不高 的, 是 很 容易 换 的, 而且 容易 产生 价格战。 整体 来看 我 感觉 还 不是 一个 最好的 商业模式 本身。
对, 感觉 大 模型 不是 一个 好的 商业模式, 最后的 好的 商业模式 还是 建立 在产品 和 应用 上。 而且 A I 助手 的 产品 都是 帮助 用户 节约 时间, 那 他 就让 广告投放 天然 就 变得 比较 差。
是的, 我 觉得 任何 一个 伟大的 公司 都是 建立 在 极好 的 商业模式 之上 的。 广告 像 apple 这种 科技 消费品, 包括 公有 云 平台 有 规模 效应, 包括 电商 平台 A I 公司, 想成为 伟大 公司, 我 觉得 还是 要有 极好 的 商业模式 的。 未来 今天 这个 商业模式 的 0到1, 这个 一 我 觉得 还是 没有 跑 通 的。
对我 感觉 产品 也没有 跑 通, 对 A I 助手 我 感觉 不是 一个 好的 产品 形态。
不知道 就是 看 是不是 足够 聪明。 如果 足够 聪明 就 相当于 等于 A J 来了。 那 很多 商业模式 都 发生 方 的 温度 变化 了, 广告 平台 也 发生 了 变化 了。
你 觉得 更 聪明 了, A I 助手 的 日 活 也会 提高, 对 吗? 就 大家 使用 频次 会 因为他 变 聪明 而 提高。
我 觉得 全球 可能 有 50亿人, 每天 都 是要 跟人 打交道 的。 你 只要 要 跟 一个 对象 打交道 的那 AI 其实 是 可以 提高效率 的。
我的 A I 助理 跟 你的 A I 助理 聊天。
是的。
大 模型 的 壁垒 在哪 呢?
我 觉得 是 名牌, 我 觉得 第一阶段 可能 就是 G P U。 第一 梯队 的话, 如果 没有 3.2万 卡, 今年 可能 就 很难 在 硅谷 做 第一 梯队。 但 其实 背后 更 核心 的, 比如说 得 有 三五十个 比较 核心 的 人才 团队。 其实 今天我 觉得 很难 再 重新 build 的 一个 像 X I 一样 团队 了, 因为 人才 还是 收敛 比较 快 的, 我 觉得 还是 一个 综合 的 壁垒 的。 你 再 比如说 就像 好莱坞 一样, 有没有 这样 一个 叫 工业体系 和 成熟 的 组织 方式, 这个 是 决定 了 你的 效率 的。 如果说 给 了 你 卡, 你 投 了 很多 钱, 最后 你的 科研 的 效率 很低, 那 我 觉得 也是 很 容易 掉队 的。
现在 很多人 就 开 是 说 skin law 不一定 是 唯一 的 路径, 或者 是 错误 的 路径, 你 觉得 会有 不一样的 路径 能 走向 A G I 吗?
我 觉得 skin law 好像 是 最简单 的 路径 了, 因为 简单粗暴 的 怼 G P U 就能 通往 A G I? 你 成了 就 造福人类, 败 了 都是 科技 巨头 买单, 其实 是 应该 继续 加大 投入 的。 很多人 也 在 关心 这种 另类 的 架构, 其实 肯定 open I 是 更 关心 的。 我 感觉 新的 架构 他们 应该 全都 试 过 的, 至今 是 没有 发现 其他 什么 新的 真的 work 的 路径 的。 如果 有有 的话, 我 觉得 大家 肯定 就 扑上去 了。 而且 很多人 质疑 transformer 本身, 其实我 我 感觉 是不是 transformer 可能 也 不重要 了。 最 重要 的 还是 什么 架构 能 满足 持续的 scope, 包括 通用 的 泛化 能力, 这 两个 能力 可能 是 former 最大 的 优势。
但 transformer 今天 最大 的 缺点 就是 data hungry, 包括 computer hungry, 要 消耗 很多 的 数据, 消耗 很多 的卡。 其实 这个 data 和 computer 效率 其实 是 头部 模型 公司 在 解决 的。 我 觉得 有可能 未来 的 这个 架构, 还是 说 就是说 transworld 作为 一个 底座, 然后 它 有 它 优秀 的 特性, 那 上面 怎么 加 一些 data computer 跟 efficient 的 一些 架构。 我 觉得 这里 有一个 高频率 的 问题, 就是 研究 怎么 提高 data 和 computer 效率 的 一个 课题。 你 在 小 样本 数据 也能 取得 很 好的 效果。 比如说 你 教 一个 小学生 解方程, 你 可能 教 个 几十次, 慢慢 能 教会 了。 但是 你 今天 要 教给 模型 可能 要 交 几万个。 但 随着 模型 能力 变强, 你 可能 几百个 就 够了。
甚至 说 模型 能力 更强, 你 可能 教 他 两三个 也 够了, 这就是 一个 数据 的 效率。 其实 模型 架构 本身 我 感觉 像 open, 像 sofia 他们 其实 对 传 former 动刀 动 的 已经 很大 了。 你 像 马车 早 已经 没有了, 马 已经 变得 七 不像 了。
另外 还有一个 就是 大家 对 A G I 的 一个 关心, 其实 A I 并 不完全 需要 像 人, 其实 人机 互补 我 感觉 更 重要。 你 比如说 A I 很 擅长 数据 吞吐量 特别 大 的 工作, 它 可以 并行 读取 加工 很多 的 数据, 对 吧? 而且 ai 比 人 更 擅长 学习, 能 从 大量 的 数据 中 找到 一个 最大公约数。 今天 A I 是 数据量 小的 时候 是 不如 人的, 那那 A I 也有 更 擅长。 你 比如说 它是 可以 7乘24小时 工作, 提供 经济 价值。 那 如果 逻辑推理 能力 上去 之后, 还 可以 72 24小时 各种 帮你 去 执行 推理 的 工作, 只要 能 创造 经济 价值 就 好了。 其实 不一定 完全 是 follow 人的 这种 工作 的。 你 像 马车 也没有, 马 就是 轮子 效率 比较高, 即便 无法 实现, 其实 下限 也是 非常 高 的。
AIGC 在 这种 数据量 很大, 套路 很多 的 领域 吧? Ugc 其实 是 能 打破常规 的 一些 领域, A I 提供了 一个 智能 的 劳动力, 人 可能 就是 一个 智能 的 创造力。 还有一个 就是说 skin law 模型 变大, 我 感觉 就是 探索 智能 的 边界 在哪。 它 不是说 模型 一定要 保持 那么 大 的 状态, 其实 大家 把 模型 变小, 大规模 商用, 我 觉得 这个 速度 也是 很快 的这 其实 是一个 时间 和 工程 问题。
在 大 模型 的 应用 上, 除了 这些 A I 的 软件, 其实 还有 通用 机器人 和 无人机 驾驶。 你 怎么 看待 这 两条腿 的 落地?
先 说 通用 机器人, 通用 机器人 的 大脑 未来 就是 一个多 模态 大 模型 的 底座, 最后 再加 一些 机器人 数据 的 fine tuning on, 我 觉得 是 不存在 独立 的 机器人 的 大脑 的 这种 模型 的。 其实 这 里面 有一个 难 的, 就是 怎么 从 大脑 的 智能 的 规划 能力 转化成 控制 信号。 这个 是 未来 需要 大规模 的 设备 给 铺 了 之后 做 持续的 R O 才能 看到 的。 硅谷 的 通用 机器人公司 除了 tesla 以外, 好像 都不 具备 硬件 本体 的 能力 的。 我 觉得 这个 可能 大 概率 还是 中国公司 的 机会 控制 部分 还是 比较 难 的。 中国 的 供应链 优势 我 觉得 还 是非 非常 非常 强 的。
然后 还有一个 有意思, 就是说 今天 来讲 想做 通用 机器人, 是 没有 听到 谁能 定义 出来 一个 真的 好的 场景 的。 所以 大家 就 只能 先 把 通用 机器人 开发 出来。 就像 当时 个人电脑 开发 出来 的 时候, 大家 也 不知道 怎么用。 最后 你 发现 第一个 场景 是 报税, 企业 内 报税 用 起来 了。 所以 你看 大家 说 通用 机器人 明年 可以 大规模 的 弄出来 让 大家 去 试。 有可能 餐厅 老板 说, 这个 我 能 用 起来, 那个 酒店老板 说 这个 我 能 用 起来, 我 觉得 可能 就是 大家 去 试 的 一个 过程。
什么时候 通用 机器人 才能 做 家务? 我 觉得 还得 五年。 无人驾驶?
我 感觉 拍摄 的 团队 是 比较 自信 的, 可能 两年 内 解决。 其实 这 里面 skin law 包括 成长 速度 还是 比较 快 的, 也 比较 期待 8月8 号 tesla a robot taxi 这个 的 发布, 我 觉得 可以 看看 到时候 还有 没有 方向盘, 如果 没有 方向盘, 那 是真的 比较 自信 的。
他们 F S D 这一年 有什么 进展?
你 从 跑 老头 开车 开 到 3番是 不用 看 方向盘 了, 甚至 不用 碰 方向盘 了, 我 觉得 这 已经 是一个 挺 大 的 进步 了。 其实 它的 安全性 已经 比 人 高要 高 很多 了。
他 两年 内 结束战斗 能 结束 到 什么 程度 呢? 大街 上都 没有人 开车 了, 不太可能。
我 觉得 特斯拉 一部分 车型 可以 没有 方向盘 了, 这样的话 它 就可以 重新 定义 车, 说 这个 产品。
在 一个 有人 在 开 的 环境 下 它 也能 行 是 吧? 就是 无人 的 车 和 有人 的 车 是 可以 并驾 的。
O K K 对 通用。
机器人 和 无人驾驶 哪个 会 落地 的 更快?
我 觉得 还是 自动驾驶 更快, 这 是一个 限定 领域。 就 那 几个 action, 要么 往前走, 要么 刹车 左转 右转。
对 通用 机器人 他 要 处理 的 事情 就 太多 了。
通用 机器人 的 目标 还没有 定义 清楚。
比如说 我 就 想要 一个 做 家务 的 餐厅 老板 就 想要 一个 当 服务员 的对 我们 接下来 聊聊 巨头 的 话题, 就在 过去 半年 巨头 都 发生 了 点 啥? 你看 open I 变化 也 很大, 一列 离开了, 然后 又有 几个 新的 重要 的 人员 的 加入。 你 先 讲讲 怎么看 伊利 的 离开 对于 open one 的 影响 大不大?
我 觉得 有 两派 观点, 一派 是 觉得 伊利亚 过去 几年 贡献 好像 不是 很 突出, 另外 一派 觉得 伊利亚 的 research 的 taste 非常 好想 的 都是 未来 三五年 决定性 的 一些 事情。 我自己 的 观点 是 觉得 倾向 于 没有 什么 影响 对 欧 盘 本身, 或者说 可能 影响 一些 欧派 在 人才 这块 的 一些 口碑。
最近 接连 其实 也有 一些 open I 的 离职 潮, 有 一些 人从 open I 离开, 不仅 是 一脸 这种 离职 风波 对 这家 公司 影响 大我 感觉。
好像 是 几乎 没有 任何 影响。 他 最 核心 的 一两百个 人我 觉得 是 没有 动 的。 你 包括 其他 的 公司, 像 X C I, 像 N C R B 或者 其他 的 模型 公司 想 挖 人, 好像 是 几乎 是 挖 不动 欧派 最 核心 的 人的。 而且 加入 的 人我 感觉 主要 还是 围绕 产品 商业 安全 这些 方面 核心 的。 那个 底子 是 非常 稳 的, 而且 是 非常 强 的。
其他 的 一些 硅谷 巨头, 你 有没有 在 观察 到 过去 半年 的 一些 变化? 最近 apple 举办 了 发布会, 大家 关注度 比较高, 你怎么看 apple 这次 的 发布?
我 觉得 apple 这个 公司 还是 很 稳 的。 未来 三年 手机 可能 还是 我们 最 方便 最 可信 的 设备。 今天 好像 看不到 哪个 设备 真的 能 替代 手机 的。 其实 你看 之前 出现了 很多 A I 消费 设备, 更多 还是 一个 补充。 其实 对 苹果 最 重要 的 一个点 是 A I 的 feature 能不能 带来 手机 的 换机 潮, 这个 是 对它 商业 上 最 重要 一个点。 最后 加上 一个 什么样 的 feature, 比如说 内存 很大 的 端 测 模型 很强 了, 能 刺激 用户 我 去 愿意 买 一个 新的 手机 了, 甚至 说 siri 真的 变得 极其 的 聪明 了, 或者 有 其他 它的 一些 飞驰 出来 了, 促使 我 去 买 一个 新的 手机, 我 觉得 这 才是 一个 更大 的 变化。 其实 你看 硅谷 的 科技 巨头 都 已经 涨 了 那么 多了, 真的 要 挑 一个 比如说 让 妈妈 的 养老 的 钱 买的 公司, 我 可能 还是 愿你 买 apple, 虽然 估值 也不 便宜。
它 为什么 这次 发 了 以后 股价 大 涨。
涨 了 七个 点。 大家 发现 欧派 没有 颠覆 巨头, 最后 都 要求 着 巨头。
就是 apple。
Google 我 觉得 google 的 模型 上 好像 是不是 很 乐观 的, 从 真的 1.5 之后 大幅 的 提升 好像 是 没有 的。 我 觉得 google 的 流量 优势 还是 很强 的, 但 好像 模型 总 还是 差一点 意思。 我不知道 这个 具体 的 原因 是什么。
英伟 达 我 觉得。
三个 T 这个 股价 已经 提前 press in, 可能 未来 一年半 两年 的 预期 了。 大家 对 它的 股价 的 争议 我 觉得 还是 比较 大 的这 里面 存在 非常 多 的 debate。 英伟 达 今天 从 股价 角度 来看 是 已经 超出 了 可 分析 性 的, 所以说 有 特别 多人 对它 极其 有 信仰。 其实 越来越 多人 今天 讨论 英伟 达, 跟 21年 跟 我 讨论 比特币 一样, 大家 都在 去 讲 这个 信仰 了。 但 你 从 实际 角度 来讲, 它 确实 没有 竞争对手。 大家 吹 模型 除了 全球 范围, 除了 google 用 自己的 T P U 吹 model 以外, 几乎 所有人 都 是用 GPU 来 称 I M 大 模型。
我 觉得 未来 两三年 的 竞争 格局 也是 即兴 稳 的, 不太会 有 说 新的 完全 颠覆 了。 但是 A I 的 变化 是 很快 的, 我 觉得 叙事 上 变化 是 很快 的, 这个 可能 会 影响 大家 对他 预期 的。 但 我 觉得 长期 英伟 达 肯定 还是 极其重要 的 公司。 这个 是 整个 A G I 基建 里面 最 关键 的 一个 要素。 就像 马斯克 说 的 G P U 定 生死, 我 觉得 它 还是 一个 最 重要 的 一个 角色。
我们 之前 有一个 感觉 就是 模型 凸。 企业 最大 的 客户 其实 是 云 平台, 因为 云 其实 跟 企业 建立了 最深 的 信任。 之前 也有 一个 说法 说 我在 大 模型 上 花 一块钱, 就会 在云上 带来 五块钱 的 营收。 其实 我们 一直 想 把 这个 假设 调研 清楚, 但 其实 是 一直 没有 有 太多 的 facts。 因为 企业 除了 测试 以外, 好像 在 cloud spending 上 好像 没有 大规模 的 东西。 我 觉得 可能 还是 需要 花 一些 时间, 但是 语音 肯定 还是 很 稳 的。 很多 的 企业 客户 不是说 我 直接 调 GPT 调 cloud A P I, 而是 说调 云 厂商 的 A P I, 因为 那个 更 稳定, 可信度 更高。
还有 是 之前 声音 很大, 但 A W S 的 技术 积累, 我 客户 积累 我 觉得 还是 很 骚 累 的那 拉马 3 400B 那个 模型 好像 一直 还没 发出 来, 好像 据说 内部 还没 搞懂 M E 怎么弄。 那 你看 他们 好像 一直 在 串串 到 好的 一个 结果 再 发出 来。 不一定 会 开源 了 吗? 这么 大 的 模型 如果 在 开源 的话, 可能 很多人 可能 是用 不 起来 的, 而且 成本 是 比较高 的。 一个 400B的 dance model。
微软 首先。
copilot 好像 是 离 之前 的 预期 还是 要 差 一些 的。 让 我 印象 最深 的 还是 他 跟 欧派 提出了 星际之门。 投 1000亿美金 造 一个 最大 的 超级计算机 会 怎么弄, 以及 到底 能 带来 什么样 的 突破, 我 觉得 这是 最 有意思 的。
最后一个 特斯拉。
其实 你看 E V 车 的 销售 的 竞争 是 很 激烈 的, 所以 车 本身 它 其实 是 很 被动。 F S D 的 进步 好像 每隔 几个 月 就有 一个 大幅 提升。 X C I 可能 是 依赖 未来 一段时间 可能 有 很多 间接 的 技术 助力。 F S D 我是 感觉 可能 比 A G I 要 更快 的。
今天 对 tesla 一个 比较 大 的 争议 是 到底 是一个 车 的 公司 还是 一个 A I 的 公司, 但 A I 的 revenue 还是 没有 的。 如果 就是 车 的话, 可能 就是 一个 比较 低 的 估值。 A I 的 地方 怎么 体现 出来, 我 觉得 是 比较 重要 的。 而且 一百 美金 每个 月 的 F S D 定价 还是 比较高 的。 如果说 这个 免费 了, 或者说 通过 车险 来 间接 付费, 有可能 还是 一个 更好 的 做法 了。 因为 这个 对 车险 我 觉得 未来 的 冲击 还是 比较 大 的。
最后一个 台积电。 其实 你看 全球 百分之百 的 H 100都是 台积电, 而且 是 在台湾 生产 的。 这个 公司 的 重要性 我 觉得 是 极强 的, 因为 过去 卷 了 云端 的 数据中心, 接下来 又要 卷 手机 上 的 芯片, apple 还是 它的 最大 客户。 所以 我 觉得 你看 这么 大体 量 了, 每年 还有 50的增速, 我 觉得 这是 极其 厉害 的。 我 觉得 这个 公司 未来 几年 也是 不可替代 的。 其实 你看 我们 聊 了 这 几个 大 的 公司, 好像 这 几个 大 的 公司 潜在 都 还是 受益 的。 而且 你 就 拿着 这 几个 大 的 公司, 好像 就 做 一个 passive 的 指数, 好像 是 能 跑 赢 很多 其他 地方 的。 反而 真的 是 这 一波 强者 恒强, A I 公司 并没有 真的 颠覆 大 的, 而且 是 依附于 大 的。
今天 的 A I 公司 都 活 在 巨头 的 阴影 下, 你 觉得 这是为什么?
对, 你看 创业 公司 和 大公司 好像 不是 一个 颠覆 关系, 而是 一个 依赖 关系。 一个 是 A I 公司 还是 太 花钱 了, 第二 是 巨头 的 卡位 太好。 你 一个 最简单 的 例子 就是说 今天 open I 是 没法 撒开 腿 跑 的, 因为 它 逃离 不了 这 几个 科技 巨头 的 覆盖 的。 因为 你看 G P U 它 受限于 英伟 达。 如果 英伟 达 不 提前 给 open I 卡, 或者说 他 给 第二名、 第三名 卡那 欧 盘 也会 卡 的 不足 的那 你看 集群 是 搭建 是 受限于 微软 的, 而且 微软 还是 49% 的 大股东 金主, 对 吧? 那 微软 的 挨着 是 GPT 触 达 企业 客户 最 重要 的 一个 渠道 的, 你看 C 端 还是 逃离 不了 苹果 的, 最后 我 还要 跪 着 苹果 弄 进去。 然后 苹果 其实 还是 可以 分 分钟 换掉 chat P T 的。 所以 你看 欧派 如果 真的 说 颠覆, 好像 只能 挑战 一下 google。
Google 好惨 一起来, 只有 google 被受 受到 了 影响。 那 A 加 时代 V C 投资 变难 了 吗?
我 觉得 是 变难, 因为 现阶段 面对 的 很多 是 科学 问题, 它 不是 一个 可 分析 的 数学 问题 或 数字 问题。 如果 今天 投 大 模型, 我 觉得 依然 是 两条。 第一 是不是 一个 做 A G I 的 团队, 是不是真的 奔 着 A G I 有 这个 vision, 而且 有 这个 团队 基础 的。 我 觉得 第二个 关键 条件 就是 有没有 大腿 做 A G I 每年 可能 要 比如说 买 10到20万 张卡, 要 几个 币 的 投入。 我 觉得 背后 是 有一个 巨大 的 而且 长期 的 资源 支持, 我 觉得 这个 是一个 非常 重。
我是 感觉 A J 的 竞赛 的正 赛 还没有 正式 开始, 就是 大事 还没有 发生。 你 比如说 很多人 提 rag 对 吧? 几十家 公司 在 做 rag 这个 方向, 其实 你 今天 还是 很难 分析 哪 一家 公司 一定 能 跑 出来 的。 因为 应用 还没有 大 爆发。 那 今天 的 rac 产品 还没有 经历 过大 的 考验。 我 觉得 经历 过大 的 考验, 可能 杀 出来 还是 比较 重要 的。
为什么 突然 开始 directed 的 比较 多?
有人说 这是 阶段性 的 需求, 因为 企业 内 有 很多 的 各种 信息 要 检索。 R M 只用 通用 的 东西 是 回答 不了 的, 所以 需要 有一个 检索 增强。 那 要把 企业 内 的 各种 知识 能 检索 的 排序 理解 比较 好。 因为 没 落地, 那你 就要 一个 reg 的 产品 来 帮 他。 但 你 发现 加 了 red 首先 是 今天 还没有 太多 人 能 做好 reg 然后 第二 做好 了 之后, 好像 依然 还没有 弄 好 reg 做 的 最好的 还是 property, 它是 检索 网页 检索 的 最好的。
它 这个 核心 难点 是什么? 你为什么 做 的 好是。
是 它 就是 一个 工程 问题, 他 有 十几个 环节 都要 优化。 一个 公司 你 优化 好一个 环节 挺好的, 但是 你 要 优化 好 十个 环节 其实 是 很难 的。
对比 下来, 你看 美国 也 多, 你看 国内 也 多, 这 两边 的 创新 生态 有没有 什么 差异? 在 A I 这件 事情 上。
我 觉得 硅谷 0到1 还是 比较 多 的。 中国 的 创业者 1到100 非常 多, 这 是一个 非常明显 的 体感 差异。 我 觉得 这个 背后 是 叫 资本 的 充裕, 这 可能 是 硅谷 长期 能 0到1 创新 挺 重要 的 一个。 其实 背后 是 容忍 了 非常 多 的 失败。 其实 有人 失败 了 之后 依然 还 能被 收购, 还能 退出, 收购 环境 也 比较 好。 我 感觉 硅谷 还是 一个 叫 创新 的 温室, 很多人 可以 异想天开, 因为 有 比较 充足 的 V C 资本 支持 0到1 的 创新。
其实 我们 国内 的话 1到100 更多。 其实 这 里面 会 导致 一个 问题, 就是 技术 辨识度 还是 比较 低, 而且 创业 的 玩家 比较 多。 其实 那一个 有 很大 的 原因 就是 技术 辨识度 比较 低。 其实 你看 今天 没有人 跟 S P C X 竞争, 甚至 说 你 今天 要 买 一个 无人机, 你不知道 大 疆 的 第二名 是谁。 我 觉得 大 疆 是 有 技术 辨识度 的。 我是 期待 更多 的 0到1 创新 的, 就是 创业者 能 提出 一些 更 不一样的我 觉得 也 需要 更多 长期 的 风险资本 的 支持。
这也是 非常重要 的。 最后 我们 来做 一个 展望, 2024年 下半年 你 会 更 愿意 把 时间 花 在哪里? 你 会 重点 关注 哪些 问题?
我 觉得 第一个 就是说 围绕 成本 下降, 这 是一个 高度 确定 的 事情。 我希望 说 围绕 成本 下降 速度 提升, 哪些 应用 不 work, 最后 work 了, 我 觉得 这 是一个 期待 的。 第二个我 比较 期待 端 测。 不管 说 手机 上能 加 哪些 东西, 尤其是 国产手机, 包括 新的 消费 设备, 它 可能 是对 手机 一个 很 好的 补充。 你 比如说 像 meta 眼镜, 它 可能 就是 一个多 模态 的 入口, 它 跟 手机 有一个 更好 的 辅助, 那 我 觉得 可能 会 出来 很多 东西。 第三 就是 通用 机器人, 我 觉得 这个 需要 的 时间 很长, 但是 会 很 有意思。 因为 多 模态 模型 在 进步, 中国 创业者 的 机会 还是 很多 的。
Rain or .
the ice school when whenever, no matter any wether we together.
好, 这 期 节目 就是这样。 如果 你喜欢 我的 节目, 欢迎 前往 苹果 podcast、 腾讯 新闻、 小宇宙、 喜马拉雅、 QQ 音乐 订阅 张小 珺 商业 访谈录。 如果你 有 其他 想 邀请 的 嘉宾, 想听 的 内容, 或者 你 有 任何 想 探讨 的 话题, 都 欢迎 各位 听众 朋友们 在 评论 区里 留言。 我们 下期 再见, 拜拜。