We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 64. 和广密聊AGI大基建时代:电+芯片=产出智能

64. 和广密聊AGI大基建时代:电+芯片=产出智能

2024/4/17
logo of podcast 张小珺Jùn|商业访谈录

张小珺Jùn|商业访谈录

AI Deep Dive AI Chapters Transcript
People
李广密
Topics
李广密:AGI发展已进入马拉松阶段,物理硬件(GPU、数据中心、能源)成为最大瓶颈。开源模型对闭源模型商业价值造成冲击,但闭源模型在复杂推理方面仍占优势。多模态技术提升用户体验,但对推理能力的提升和AGI主线地位尚不明确。英伟达在AGI浪潮中扮演关键角色,其重要性甚至超过OpenAI。大模型投资难以成功,只有巨头公司才能参与竞争,人才密度是关键因素。AGI发展是一个渐进式解锁的过程,将首先改变软件生产方式和信息检索方式。未来AGI将使全球GDP翻倍,但目前其对GDP的贡献还不到0.1%。 张小珺:就访谈内容进行提问,引导李广密阐述观点。

Deep Dive

Chapters
讨论AGI大基建时期的关键瓶颈,包括物理硬件、算力和数据中心建设,以及人类社会新增的算力税和模型智能税。
  • 物理硬件成为阻碍AGI时间表的最大因素
  • 人类社会新增了芯片算力税和模型智能税
  • 微软在欧洲投资并收购Inflection,显示其复杂的战略布局

Shownotes Transcript

今年 最大 的 一个 感受 就是 物理 硬件 成为 阻碍 A G I 的 一个 时间表 的 最大 因素 了。 人类 又 多了 两个 收税 的 人类 基石 公司, 一个 是 芯片 算 力 税, 一个 是 模型 智能 税。 你看 微软 也 比较 有意思, 就是 又 去 投 了 欧洲 的 mr 然后 又 收购 了 inflection 自己 还在 train 大 模型。 所以 它 跟 欧派 的 关系 我 感觉 挺 复杂 的。

Hello, 大家好, 欢迎 收听 张小军 商业 访谈录, 我是 腾讯 新闻 的 小俊。 这是 一档 描摹 我们 时代 的 商业 文化 核心 知 的 访谈 节目。 三月份 我们 连续 从 多个 角度 关注 了 中国 A G I 进展, 这 集让 我们 把 目光 投向 海外, 对于 刚刚 过去 的 2024Q1 全球 大 模型 的 赛 局 做 一个 场上 的 复盘 和 点评。

本期 嘉宾 是 商业 访谈录 的 老朋友, 石像 科技 C E O 李广 密。 他 提出 我们 正处于 一场 浩瀚 的 A G I 大 基建 时期, 正如 上世纪 90年代 克林顿 推出 美国 信息高速公路 建设, 这 才有 了 后面 的 互联网 泡沫 破裂 和 互联网 黄金 20年。 如果 没有 基建, 就 不可能 有 应用 的 大 爆发。

Hello, 广 密, 先 跟 听众 朋友们 打个招呼。

Hello.

距离 上次 我们 聊 刚好 过了 一个 Q, 之前 聊 的 一些 预测 也都 验证 了。 我 觉得 我们 可以 定期 来做 一些 总结, 整理 一下 全球 的 A I 的 最新 动态, 以及 你的 一手 的 信息 和 观察。 我们 可以 先来 盘点 一下 美国 A I 的 极其 大 的 事件。 从 过年 到 现在, OpenAI 先是 发布 了 sora, google 和 马斯克 都 加入 了 开源 大战, anthropic 发布 了 cloud three, 以及 最近 的 英伟 达 G T C, 被 冠以 了 新的 科技界 春晚 的 头衔。 这 一系列 大事 有没有 让 你 觉得 shark 的 他们 分别 对于 今年 大 模型 战局 和 更 长时间 维度 的 A G I 眼镜 影响 分别 有 多大?

我 觉得 第一个 是 GPT4.5和 5比预期 的 来 的 慢。 之前 以为 class 3发布 之后, 欧派 就要 发 新 模型 了。 你看 骚扰 模型 已经 易主 都 一个月 了, 我 觉得 这个 可能 就是说 A G I 的 战线 有可能 会 被 拉 宽。 第二个我 感觉 就是 骚扰 比比 预期 来 的 要 早, 这个 意味着 今年 的 多 模态 的 理解 和 生成 的 进步 幅度 都会 很大, 就会 解锁 很多 新的 东西。 但 多 模态 能不能 带来 智能 和 A G I, 其实 还是 一个 很强 的 非 共识。 另外 就是 马斯克 加入 了 开源, 对 吧? 开源 模型 能力 的 水位线 会 被 提升 很多。 你看 X I 的 人才 密度 很强, G P U 也 足, 其实 决定 了 很多 后面 模型 公司 的 生死线 的。

当然 我 觉得 还有 另外一个 就说 就 英伟 达 的 股价 就是 去年 这个 时候 觉得 能 涨, 但 没想到 能 涨 三倍 这么 多。 大家 都 觉得 A G I 很大, 但是 还是 低估 了 这个 浪 的 大小。 更 明显 的 一个 感觉 就是 英伟 达 还是 这 轮 A G I 的 最 关键 的。 我 觉得 短期 老黄 可能 是 比赛 M 要 重要 的。

刚才 提到 了 马斯克 加入 开源, 同时 加入 开源 的 有 google。 你 对 google 开源 的 看法 是什么?

Google 现在 发 的 还是 小的 模型, 我 感觉 他 不会 把 最强 的 模型 发出 来。 开源 的 主力 可能 还是 X C I 和 拉玛。 我 比较 担心 的 其实 是 开源 模型 后面 会 打掉 很多 闭源 模型 的 商业价值。 但是 另外 一面 就是说 最强 的 闭源 模型, 他们的 优化 能力 是 很强 的, 还是 之前 说 的 最强 的 模型 能力 最强, 而且 成本 最低, 我 还是 相信 这个 状态 的。 但是 开源 模型 也有 开源 模型 的 好处, 就是 很多人 拿 它 来 自己 用 更好 用。 我 觉得 还是会 覆盖 很多 国 企业 内 需求 场景 的。

你说 开源 模型 会 打掉 闭源 模型 的 商业价值。

怎么 理解? 就是你 有了 更强 的 开源 模型 以后, 比如说 你 把 GPT3.5 水平 的 模型 开源 了, 那 大家 就 不 已经 在 调 open I 的 3.5 的 A P I 了, 对 吧? 那 欧洲 I 作为 最强 闭源 模型, 它的 商业价值 我 觉得 还是会 被 打掉 一些 的。 你 没有 开源 模型, 那么 大家 就 只能 去 选 最强 模型 公司 的 A P I 了。

这个 好像 是 距离 你 上次 聊 一个 很大 的 变化, 在 认知 上 对 吗? 你 上次 还是 非常 坚定 认为 闭源 比 开源 好, 而且 好 很多。

我 觉得 闭源 还是会 比 开源 最强 的 强 很多, 因为 后面 还 会有 较 复杂 推理, 要 完成 有 经济 价值 的 任务。 如果 多步 推理 最后 准确性 很差 的话, 还是 完不成 任务 的。 但是 现在 我 发现 很多 简单任务, 开源 模型 还是 可以 完成 的那 我 感觉 其实 开源 的 价值 还是 存在 的。 对, 而且 我 不确定 马斯克 的 X 会不会 持续 开源。 如果 它 持续 开源, 我 觉得 开源 模型 的 水位 还是会 比较高 的。

所以 马斯克 今年 的 开源 战局 为 A G I 的 争夺 赛 带来 了 很大 的 变量。

我 觉得 X C I 是 有 两个 层面, 第一个 层面 是 它是 全球 范围 内争 新的 第一 梯队 的 唯一 的 黑马。 第二个 如果 它 持续 开源, 那 我 觉得 对 整个 模型 的 格局 生态 和 商业价值 其实 是 影响 比较 大 的对。

你 还 提到 一点 就是 多 模态 能否 带来 更高 的 智能, 以及 能不能 通向 A G I 是非 共识。 对于 这一点 你是 怎么看 的?

今天 多 模态 有 几层 作用, 第一层 作用 就是 文本 数据 不够 用了, 可以 补充 文本 数据。 然后 第二 会对 用户体验 有 很大 的 影响, 就是 理解能力 变强。 第三 生成 你看 生成 的 效果, 生成 视频 的 效果, 今年 也会 大幅 的 提升。 但是 多 模态 的 数据 对模型 的 推理 能力 有没有 大幅 提升, 今天 还没有 验证。 以及 这 是不是 A G I 的 主线, 我 觉得 也是 不知道 的。 Sora 到底 是不是 A G I 的 主线, 我 觉得 见仁见智 的, 其实 很难 定义 清楚。

对 相比 去年底 我们 聊 的 时候, 今年 翻过 年来 的这 一个 Q 有没有 什么 让 你 感觉 明显 不同 的?

去年初 觉得 A G I 是一个 百米冲刺, 就是 大家 都 没 做好 准备。 今年 就 觉得 A G I 应该 是 马拉松, 大家 都有 充足 的 时间 做 准备。 去年 觉得 可以 无限 的 加 G P U, 加 数据 就能 到 A G I 对 吧? 但 突然 发现 G P U 的 数据中心 和 物理 硬件 是一个 很大 的 瓶颈。 比如 单体 的 数据中心 现在 加 到 3.2万 卡, 可能 再 往 上 就要 突破 很多。 另外 还有一个 就是说 美国 的 能源 基建 其实 都是 四五十年 前 规划 的 了, 能源 结构 也 很大 不同, 突然 新增 了 很多 用电量, 确实 是 跟不上 了。 今年 最大 的 一个 感受 就是 物理 硬件 成为 阻碍 A G I 的 一个 时间表 的 最大 因素 了。

2024年 你 觉得 在在 全球 来看, 大 模型 公司 的 这些 梯队 有没有 发生 一些 变化?

Open anodic google 还是 明确 的。 第一 梯队 马斯克 的 X I 欧洲 的 mr 迈特 lama, 我 觉得 是 比较 确定 的。 第二 梯队, 但是 X C I 我 觉得 是 最大 而且 可能 唯一 的 黑马 就是 有 机会 冲击 第一 梯队。 但是 比较 值得 期待 的 就是 今年 比如说 夏天 或者 今年年底 前, 他们 能不能 真的 做出来 G P4 水平 的 模型, 我 觉得 这个 是 最 关键 的那 你 再 往后 看, 其实 inflection 今天 已经 掉队 出局, 对 吧? 那 我 觉得 character cohere 其实 今年 的 挑战 也 很大, 我 觉得 有可能 今年 年内 就得 找 买家 了, 还是 之前 聊到 的 衬 一个 G T4 水平 的 也是 很难 的。 其实 很多人 还没有 真正 的 开始 规划 G D S, 没 开始 train .

inflection 提供了 一个 什么样 的 案例。

没想到 模型 收敛 如此 之 快, 计算 竞争 是 很 残酷 的对。

有人说 他是 第一个 失败 的 V C 重组 的 大 模型 公司。

我 觉得 还是 之前 那个 感受, 就是 其实 大 模型 V C 是 投 不动 的, 还是 一个 巨头 的 游戏 inflection 是 没有 绑定 一个 更深 的 巨头 的这 是一个 我 最大 的 感受。 另外一个 感受 就是 还是 要 看 人才 密度。 人才 密度 我 觉得 前 三家 公司 加上 马斯克 的 X A I 还是 明显 要 高一 截 的。 其他 公司 确实 你 就 从 人才 密度 上, 我 觉得 是一个 明显 的 差异。

我 看到 你 也 去了 英伟 达, 能不能 聊聊 你 对 这次 G T C 的 观察, 以及 对于 黄仁勋 的 演讲 的 感受, 你怎么看 他 这个人。

觉得 股 最 靓 的 仔 就 从 马斯克 切换 到老 黄 了。 很多 马斯克 的 粉丝 变成 了 老黄 的 粉丝, 投资者 的 股票 资金 也 从 特斯拉 转 到了 英伟 达, 对 吧? 老黄 应该 是 直接 驱动 了 这 波 A G I 浪潮 的, 我 觉得 贡献 是 不输 欧派 I 的。 之前 听到 一个 说法 就是说 算法 等 了 算 力 30年, 我 觉得 是 非常 形象 的。 我是 希望 说 这 波 A G I 不要 因为 算 力 物理 的 瓶颈 而 停下。 我 觉得 其实 你看 回头看 过去 几十年, 半导体 应该 就是 人类 最伟大的 发明。 我 觉得 计算 还会 驱动 未来 的 几十年。 未来 就有 一个 状态, 就是 可能 所有人 商业 社会 都要 给 老黄 去 交 算 力 税。 这个 就像 过去 十年 去 给 苹果 交 入口税 一样。

你 要说 老黄 一个 很强 的 特点, 我 觉得 就是 销售 能力 超强。 以前 GPU 卖给 美国 的 科技 公司, 对 吧? 现在 他在 提 一个 叫 主权 A I 现在 要把 GPU 卖给 政府 吃 国防 预算 了, 所以 它的 市场 规模 又 大 了 一步, 我 觉得 这是 很 厉害 的。

主权 AI 会 涉及到 地缘 政 这个 问题 吗?

我 就会 涉 会 涉及到。

但是 它 还是 有 很大 的 市场。

你看 美国 军费 每年 8800亿美金, 如果你 拿 3% 2% 买 G P U, 这 是一个 很大 的 量。 那 你说 G P U 是不是 一个 很 重要 的 战略 储备物资, 我 觉得 是 极其重要 的。

关于 老黄 硅谷 有没有 什么 流传 比较 广 的 故事? 因为 马斯克 有 很多 关于 他的 性格、 管理。

他 有一个 很 好的 习惯 就 叫 T5 T 就 那 部 每 双周 每个 大 组 内 应该 会 发出 来 最 重要 的 五件 事, 这 是一个 非常 好的 习惯。 老黄 好像 是 不 鼓励 996的英伟 达 的 员工, 是 鼓励 在 办公室 吃 早饭 和 午饭。 但是 老黄 是 鼓励 大家 晚饭 回家 陪 家人 的, 我 觉得 这 是一个 蛮 有趣 的。

接下来 聊 一 聊 A G I, 首先 定义 一下 什么 是 A G I, 对于 A I 的 定义 业界 是 共识 的 吗?

我 觉得 对 A G I 的 理解 还没有 共识, 我 觉得 就 很 像 共产主义 或者 财务自由。 因人而异, 我 觉得 可以 有 几个 角。 第一 就是 最 激进 的 情况, A G I 能 在 90% 的 行业, 超过 90% 的 专家, 完成 90% 有 经济 价值 的 工作。 我 觉得 这 三个 90% 还是 很 激进 的。 然后 之前 sam 行业 提 过, 不应该 从 替代 人的 角度 去 思考, 而是 说 在 所有的 工作任务 当中, 有 多少 需要 5秒内 就能 完成 的, 这些 肯定 是 模型 第一波 就能 做 掉 的。

第二个 角度 我 感觉 就说 也得 想 A G I 什么 最 重要, 其实 还是 智能 能力 本身 最 重要。 今天 很多人 讨论 什么 形态 什么 载体, 我 觉得 可能 还 不一定 那么 重要, 最 重要 的 还是 智能 本身。 但是 我 觉得 肯定 会 从 数字世界 走向 物理 世界。 物理 的 机器人 和 设备, 怎么 把 这个 智能 的 能力 产品化, 我 觉得 是 创业者 很大 的 机会。 另外一个 我 很强 的 感受 就是 A G I 不是 一蹴而就 的, 不太 像是 说 你 憋 几年 大招, 某年 实现 A J 就 把 所有 东西 秒杀 了。 我的 一个 关键词 叫 渐进式 解锁, 就是 我们 画 一条 登山 的 路线图 模型 能力 每 涨 一些 就会 解锁 一些 场景, 诞生 一些 应用, 对 吧? 那 这个 应用 能 创造出 相应 的 经济 价值。 我 听到 最强 的 一个 叙事 就是说 A G 能 在 未来 10至15年 让 全球 G D P 翻倍, 从 今天 的 100T涨 到 200T但 你看 今天 100T的 G D P 和 这 波 A G I 直接 相关 的 可能 还 不到 0.1%, 离解 锁 90% 还很。

目前 我 觉得 就 体现 在, 比如说 coding 一些 代码 效率 比较高, 信息检索 效率 在 提高。 我 觉得 往后 10到20年, 可能 就是 个 从 今天 只 解锁 0.1%到 解锁 90% 的 一个 过程。 我 觉得 一定要 理解 渐进式 解锁 这个 关键词。 我 内部 也 一直 在 画 一个 叫 路线图, 就是 未来 A G I 登顶 的 过程 中有 哪些 东西? 我 觉得 眼前 最 期待 的 还是 改变 软件 生产方式 和 信息检索 这 两个。

先 从 你们 这个 登山 路线图 的 近处 看, 改变 软件 生产方式 和 信息检索 的 变革。 你为什么 最 期待 的 是 这 两个 方向? 也就是说 它 会 颠覆 SaaS 行业 和 google 吗? 是 这么 理解 吗?

对我 觉得 三年 内 是 有 机会 看到 coding 领域 的 A G I 的, 也就是说 做 各种 任务 都 不错 的 一个 程序员。 因为 大部分 的 任务 其实 没有 像 软件开发 这么 明确 和 有 逻辑。 软件 供给 的 方式 我 觉得 会 发生 很大 改变。 举 一个 最 形象 的 例子, 就是说 过去 的 软件 其实 很 像 一个 自动贩卖机, 有限 的 sku 供给? 那 其实 是 有 大量 非 标的 需求 是 没有 被 满足 的。 我 觉得 未来 的 软件 供 給 可能 就是 一个 酒吧 的 调酒师。 你 想要 任何 口味 可能 都 可以 给你 调 出来。 其实 这个 长尾 需求 是 很大 的。

我 觉得 未来 一个 软件开发 的 状态, 有可能 就是说 精准 的 自然语言 描述, 甚至 说 简单 的 自然语言 描述。 就是 如果 模型 能 现在 用 工具 调用, 能 解决 就 解决 了。 如果 没有 满足 的 工具, 那 模型 coding? 甚至 生成 很 复杂 的 一坨 代码, 自己 run code debug 会 多 出来 很多 软件程序。

我 觉得 开发者 或者 产品 经理 可能 就 不是 今天 的 几千万, 可能 就是 人人 都是 产品 经理, 我 觉得 这个 是真的 会 实现 的。 最简单 一个 例子 就是说 每个人 有 手机 了, 现在 今天 可以 拍 短 视频, 拍电影, 以前 是 不行 的, 我 觉得 就是 power 在 变强, 但 这里 有一个 最 担心 的 点, 就是 微软 和 open a 我 觉得 是 很 激进 的。 它 有可能 把 很多 的 工具 型 的 或者 feature 型 的 SaaS 可能 都会 干掉 的。 只有 积累 了 像 很深的 workflow 和 数据 的 软件公司 可能 发展 还 可以。 比如说 像 sales service 也好, service snow 也好。

说到 google 的话, 你看 过去 20年 无数 对手 挑战 google, 但 都 失败 了。 其实 很大 的 原因 是 没有 fundamental 的 技术 变革。 我 觉得 这一次 大 模型 是 给 了 大 机会 的。 另外 一个点 就是说 你看 google 里面 好多 都是 事实性 的 一些 搜索、 电商、 旅游, 去 youtube 的 网站。 但 其实 有 一类 问题是 没有 回答 好的, 就是 问答。 我 觉得 问答 可能 是 皇冠 上 的 明珠。 如果你 能 解决 的 非常 好, 其实 用户 信任 和 长期 留存 会 是 更好 的那 这样 我 觉得 用户 价值 也会 做出来 的。

现在 问答 难 解决 的 主要 是因为 幻觉 吗?

还是 模型 的 智能 水平 不够? 就有 一个 例子, 我 经常 问 模型 一个 问题, 说 过去 五年 美国 股票 里面 涨幅 最好的 体量, 公司 营收 利润 巴拉巴拉 的 情况, 你 帮 我 拉 一个 表, 其实 很少 有 模型 能 帮 我 弄 好的。 这 是一个 简单 的 分析师 的 工作, 我 觉得 是要 把 这些 数字 都拉 准, 而且 帮 我 分析 好。 比如说 我想看 英伟 达 今天 的 P E 属 不属于 比较高 的 状态, 或者 未来 一年 高 不高 的 状态, 他 要把 历史 情况 都 给我 拉 清楚, 做 一个 表。 我 今天 很多 模型 还 做不到 的那 未来 是 需要 的这 就是 任务。 我 觉得 任务 的 价值 会 比 搜 出来 网页 链接 的 价值 要 大。

你 现在 用 类似的 问答 产品, 能够 非常 好的 满足 你的 需求 的 方向 是什么?

有 吗? 我自己 用 的 最多 的 还是 cloud 3。 我自己 用 的 最多 的 场景 是 读 券商 的 报告 和 各种 报告会 帮 我 summary 的 比较 好, 让 我 看看 这个 报告 后面 值不值得 再读。 第二, 我 觉得 我 今天 突然 有了 一个 可以 头脑风暴 的 对象 了, 我 有 一些 idea 我会 抛 给他, 让 他 先 帮 我 想一想。 只不过 他 现在 想 的 还 不是 那种 长 周期 的 问题, 一直 帮 我 想着。 我期待 说 他 能 有一个 能 跟 我 共鸣 的 in storm 的 那种 蛮有意思 的。

你 刚才 讲 的 有 两点, 一个 是 sas 公司, 一个 是 挑战 google。 那 在 这种 情况下, 你 建议 SARS 公司 如何 转型 呢? 他们 需要 做 些 什?

我 觉得 只能 积极 拥抱 吧, 组织上 多用 好 年轻人。 以前 软件开发 的 方式 跟 现在 软件开发 的 方式 有了 fundamental 的 不同。 因为 以前 是 把 固定 的 需求 抽象 出来, 然后 一个 开发 团队 去 开发。 今天 他 就是 不确定 的 需求, 你 未来 要 用 好 模型 的 能力。 我 觉得 这个 还是 有 防盗门 的。

很大 的 不同 的 这个 是 近处。 更 长远 一点 来看, agi 对于 人类 社会 可 预见 的 变化 在 多长 的 时间 维度 中能 有 多大? 这 波 浪潮 中 诞生 的 巨头 会 比 互联网 时代 更 庞大 吗? 为什么?

我 觉得 首先 A G I 可能 是一个 科学 问题, 还 不完全 是一个 商业 问题。 背后 是一个 叫 永无止境 的 research 精神, 发现 精神, 探索 一些 新的 能力 对 吧? 抽象 总总 接着就是 用 能源 加 芯片 产出 智能。 那 未来 就 看 这个 智能 的 产出 效率 和 能力 到底 有 多 高。 你说 智能 这个 东西 怎么 定价?

我 另外一个 比较 相信 的 就是 科技进步 还是 创造 增量 价值 最大 的 一个 要素。 你看 历史上 好像 每 一波 技术 变革 的 头部 公司 都 比 上 一波 要 加 一个零 的对 吧? 然后 之前 觉得 做 V C 投到 一个 独角兽 就 很 牛, 然后 今天 好像 融资 单位 就 以 B 点 为 单位 了, 钱 也 毛 了, 对 吧? 我 有一个 比较 切 体会, 就是 10年 的 时候 你看 苹果 两千多 亿美金, 对 吧, 就 不会 想象 全球 还有 万 亿美金 的 公司。 16年 当时 我们 看 英伟 达 从 200亿美金 涨 到了 千 亿美金, 我 觉得 更 不会 想到 今天 还能 那么 大。 这就 回到 一个 今天 A I 领域 最大 的 一个 非 共识, 就是 不知道 A G I 有 多大。 我 觉得 有可能 就是说 英伟 达 这 一两年 内 登顶 全球 最大 公司, 这个 概率 是 很大 的, 而且 它 长期 的 体量 也是 可能 超出 我们 预期 大 的, 就是 G P U 这个 东西 太太 重要 了。

然后 另外一个, 你说 这个 比 互联网 时代 的 巨头 要不要 大? 因为 这个 东西 我 感觉 它是 跟 G D P 直接 挂钩 了, 对 吧? 未来 你 能 渗透到 全球, G D P 的 占 比 直接 take, 那那 我 觉得 这是 比较高 的。

另外一个 算法 就是说 如果你 能 造出来 全球 3亿白领, 每个 白领 年薪 三万多 美金, 对 吧? 这也是 一个十个 T 的 revenue, 还 不是 market, market 还要 乘 10, 对 吧? 本身 的 计量单位 是 发生 了 一个 大 的 变化 的。

很 有意思, 今天 的 融资 单位 变成 了 B 链 级别, 这 在 中国 和 美国 的 商业 历史上 出现 过 类 的 情况 吗?

就是 为什么 把 A G I 比作 一个 大 基建? 其实 中国 做了 很多, 你 比如说 公路 建设, 电信 5G的 建设。 其实 有了 这些 短 视频、 直播、 外卖, 包括 城市化 建设, 这是 远超 B 0甚至 trading 级别 的 基建 的 投入 的。 甚至 说 电商 物流 建设 也都 是 巨大 的 投入, 对 吧? 今天 的 A I 投 算 力 投 新兴 的 数据中心, 我 觉得 就是 处在 一个 基础 大 基建 的 一个 状态, 其实 是 一直 在 发生 的。

你 再看 美国 比较 早 的 时候 有 曼哈顿计划, 造出 原子弹。 但 更 重要 的 是 整个 计算机 体系 是 在那 诞生 的。 在 后来 来 美国 的 登月, 我 觉得 美国 登 月1个 很大 的 意义 在于 电子产品 微型化 了, 才有 了 个人电脑。 90年代 就 93年, 克林顿 推 了 一个 美国 的 信息高速公路 建设, 其实 投 了 G D P 的 5%。 我 觉得 才有 了 后面 的 互联网 的 bubble 也好, 美国 互联网 黄金 的 20年 也好, 我 觉得 都是 跟 基建 有关的。 如果 没有 基建, 我 觉得 没法 谈 应用 大 爆发 的那。

你 眼中 这个 A G I 关键 路线 登山 图 是 怎么 画的? 给 我们 构建。

一下 两面, 一个 叫 南坡 可能 是 模型, 一个 叫 北坡 可能 是 产品。 我 觉得 模型 最底层 的 还是 skin law, 更多 数据, 更多 G P U, 更多 能源, 就 看 产出 智能 的 效率 是不是 能 持续 提高。 模型 最 重要 的 能力 还是 reasoning 推理 能力。 后面 我 觉得 要有 复杂 推理 能力 才能 完成 有 经济 价值 的 工作任务, 吧? 我 比较 看重 coding 代码 能力, 这 可能 是 A G I 最早 落地 的 一个 信号。 它 既是 一个 走向 A G I 的 能力, 也是 一个 产品 改变 软件 生产方式? 然后 多 模态 能力 也 非常 关键, 就是 刚才 聊到 不仅 补充 更多 的 数据 交互 效率, 我 觉得 更 期待 的 是 多 模态 能力 变强, 对 自动驾驶 和 机器人 有 提速 作用。

我 觉得 agent 也是 关键词。 但 今天 agent have time ork, 最 主要是 模型 的 reasoning 能力 不够 强, 也 不够 准确。 你看 多部 或者 几十步 推理 下来, 其实 很多 任务 都是 失败 的。

另外一个 观点, 我 感觉 就是说 模型 公司 可能 就是 agent 公司, 很多 的 agent 大 模型 本身 可能 就会 自己 做。 就是 能不能 做好 的 问题。 我 觉得 接下来 模型 公司 的 一个 大 的 附加值 可能 是 会 体现 在 agent 上面 的。 因为 第一波 叙事 大家 都讲 了 skin law, 后面 我 觉得 大家 可能 就会。 讲 agent 这是 南坡 模型 能力 相关 的。 我 觉得 你说 北坡 产品 上 的, 就 看 接下来 谁能 做出来。

上亿 活跃 用户 的 K Y APP, 今天 可能 只有 一个 ChatGPT 对 吧? 然后 我是 比较 期待 信息检索 有 大 的 变化 的, 因为 搜索 之前 搜 出来 是 链接 和 网页, 现在 搜 出来 是 答案, 对 吧? 我 觉得 未来 还有 多 搜索, 甚至 说 还有 更多 主动式 的 交互, 可能 模型 直接 给你 推 你 潜在 想要的。

从 chat G P 的 用户 增长 角度 来讲, 因为 它 过去 就 大概 5000万, D U 也 横盘 几个 月 了。 如果 他 积极 的 做 用户 增长, 他 一定要 做 搜索 才能 突破 到 几个 亿 的 活跃 用户。 我 觉得 这是 挑战 google 过去 20年 可能 唯一 的 一个 窗 技术 窗口。 今年 也 比较 期待, 看 ChatGPT 能不能 做好 这个 东西。 另外一个 我 最 期待 的 就是说, 如果你 让 模型 看 1万次 苹果 掉下来, 它 能不能 发现 万有引力 定律。 如果 更 充足 的 更广 的 范围 的 数据 灌进去, 他们 能不能 发现 人类 没有 发现 的 问题, 没有 发现 的 规律。 我 觉得 这个 有可能 又是 一个 新的 文艺复兴。

这是 很 有趣 的。 说到 一个 模型 和 产品, 一个 南坡 一个 北坡, 他们 两个 都要 一家 公司 来做 吗? 有可能 一家 公司 爬爬 南坡, 一家 公司 爬 北坡 吗?

就 你看 sam 最新 的 访谈 说, 欧帕 在 做 地球 上 最难 的 两个 事儿, 一个 是 做 AGI1个 是 做 k lab。 那 你看 anthropic 是 专注 只 做 A G I, 他 就 没有 在 挑战。 另外一个 不一定 非得 在 一个 公司。 在 一个 公司 其实 对于 组织 能力, 对于 文化、 对于 人才 和 资源, 其实 挑战 是 很大 的这 是 需要 极强 的 领导力 和 资源 和 组织 能力。

对我 看到 你 也 问 了 那个 问题, 就是 模型 和 产品 他们 叫 的 人 非常 的 不一样, 怎么 把 它 组织 在一起 呢?

我 觉得 方向 还是 很 不一样。 从 另外一个 角度 想, 就是说 如果 一个 产品 它 在 解决 某项 任务 的 时候 能力 不行, 没办法 向 下去 改 模型。 如果 一个 模型 公司 他 发现 某个 任务 某一类 任务 解决 不好, 那 他 其实 可以 定向 的 改 数据, 调 模型。 我 觉得 这 是一个 简单 题和 一个 难题 的 问题。 所以 我 还是 相信 模型 公司 做 产品 更容易, 这是 顺手 的那 产品 公司 你 想 去 改 模型, 没有 这方面 人 你 也 改不了 模型, 这个 是 比较 难 的。 所以 我 有一个 判断, 有可能 模型 公司 就是 价值 沉淀 最后的 一个地方。 它 就像 移动 互联网 价值 沉淀 沉淀 在 了 设备 厂商 或者 广告 平台。

我 觉得 模型 的 附加 价值 后面 肯定 是 比较高 的。 一个 是 老黄 的 G P U 收税 对 吧? 一个 是 模型 收 一个 智能 税, 突然 给 经济社会 又 加 了 两道 税。

他们 所谓 的 就是我 的 模型 能力 最强, 我 就可以 顺理成章 的 解锁 最伟大的 应用。 这个 逻辑 通 吗? 他们 现在 有 两种 做法, 一种 做法 是 就是我 就要 我的 模型 是 最牛 的, 我 就要 通 A G I, 我在 这个 路上 去 解锁 应用, 这 是一种 说法。 然后 另一种 是我 也 做 A G I, 但 同时 我 好像 是 孵化 了 特别 多 的 应用, 就是 感觉 自己 是个 A P P 工厂。 这 两种 方法 你 更 看好 哪 一种? 我想 举 另外一个 例子。

你 就 看 SpaceX, 它的 火箭发射 能力 是一个 基础 的 能力, 但 这个 能力 并 不是说 太 赚钱, 可能 每年 几十 亿美金 的 收入 也是 赚钱 的。 但是 他的 一个 k lap 就是 starlink 星 链, 他 现在 可能 几百万 的 部署 的 终端 了, 对 吧, 每个 终端 还 收 挺 多 钱, 如果 没有 火箭发射 这个 关键 能力, 那 其实 starling 是 发布 上去, 它 可能 没法 去 组网, 那 这就是 它的 一个 K 了。 那 有可能 它 还有 第二个 k lab 就是 叫 starship, 像 颠覆 波音、 空客, 就是 未来 上海 到 纽约 2个小时, 未来 它 可能 还有 更多 的 K I 我 觉得 它是 一个 关键 能力。

但 也有 另外一个 说法, 就是说 如果 大 模型 是 电, 那 灯泡 可能 不一定 是 电厂 做出来 的。 所以 我 觉得 还在 一个 变化 的 过程 当中, 但 我 更 倾向 于 大 模型 公司 是一个 基础 发现 的 一个 research lab。 有的 lab 可能 有 商业 能力, 他 会 做出 了 一些 头部 的 应用, 但 这就 比较 考验 组织 能力, 有可能 中国 的 创业者 可能 也 未必 更强 的。

你 刚才 也 提到 物理 硬件 成为 了 阻碍 A G I 的 关键因素。 我们 现在 把 当下 这个 环境 比作 A G I 的 大 基建 时期, 那 H I 大 基建 现在 的 关键 瓶颈 在哪里? 这些 瓶颈 是 只要 有 时间 就可以 解决 的 吗?

我 觉得 目前 bot like 算 力 和 数据中心 建设, 今天 给你 几万 张 H 100, 我 觉得 三个月 内 不一定 能 用 起来。 万张 卡 集群 的 万卡 集 的 互联 通信 难度很大, 稳定性 要求 很高。 G P U 数据中心 的 能耗 也很 高, 然后 降温 要求 高, 对 吧?

很多人都 在 提议 了, 比特 驱动 的 数字世界 迭代 是 很快 的, 氮 原子 驱动 的 这个 物理 世界 迭代 是 跟不上 的这 就 提到 到 一个 为啥 叫 大 基建。 可能 未来 很多年, 物理 的 机器 是要 很长 周期 的 基建 迭代 去 跟进 的。 因为 历史 上都 是 软件 和 硬件 交替 发展 的。 就 硅谷 的 头 30年 年 就是 计算 的 时代, 后面 20年 是 互联网 的 时代, 今天 好像 又 进入 了 一个 计算 的 时代。 但 我 觉得 好在 是 这些 物理 问题 都 不是 research 问题, 都是 工程 和 基建 问题。 其实 随着 时间 都是 可以 解决 的。 我 觉得 短期 可能 还是 G P U 的 产能, 包括 台积电 产能, 包括 上游 的 covers, 包括 H B M 这些 拆开 来说。

一般 训练 出 我们 惯常 说 的 GPT3.5 水平 和 GPT4 水平, 需要 多大 的 算 力 和 多少 能源。

你看 三峡 单日 的 最大 发电量 和 日均 用电量 是 差不多 的, 都是 5亿度。 美国 整个 texas 德州 它 用电量 应该 是 十 亿度 多一些。 你 就 假设 GP3.5 可能 是, 比如说 500兆H 100训练 了 15天, 大概 用 25万度 电。 其实 就是 三峡 电量 和 上海 用电量 的 0.05%, 也就是 整个 美国 德州 的 0.02%。

假设 G T4 用 8000张H 100训练 100天, 大概是 2600万度 电, 那就 需要 三峡 和 上海 一天 的 5%, 德州 的 2%。 如果你 假设 GPT5 用 3.2万 张 H 100训练 100天, 那 其实 就要 1.1度 电, 大概是 三峡 或 上海 一天 用电量 的 20%, 德州 的 8%到10%。 你 要 算 这个 成本 的话, 就是 每张 H 100租用 的话, 最低 应该 是 3到4 美元 1个小时, 大 客户 还能 更便宜 一些。

比如说 如果 要 训练 G P4 需要 多少钱? 对于 一家 巨头 或者 一家 创业 公司 来说。

我 觉得 一个 G P4 现在 最低 可能 也要 8000张H 100的有效 算 力。 那 接近 一个 万卡 集群。 你 要是 买 卡 的话, 每张 H 100售价 3万美金。 你看 每张 H 100大概是 3万美金, 再加上 周边设备, 3亿美金 是 少不了 的对。

3亿美金 是 GPT4 的 入场券。 对, 做 这 一个 模型, 现在 有些 公司 是 可以 付得 起 的对, 中国公司。

对, 当然 你 也可以 租。 如果 是 租 H110年, 如果 折扣 比较 好 的话, 一万多 美金 一张 卡。 所以 就是 差不多 1到2 亿美元 也是 OK 的 中国公司。

很多 也是 可以 负担得起 的对 吧?

但是 今天 的 万卡 集群 中国 还是 比较 少 的。

它的 瓶颈 不在 钱 上。 万卡 集群 这个 是个。

标配。

标配 它是 有钱 是 不够 的。

很难 的, 每个 卡都 要 连 起来, 这种 互联 的 难度 其实 是 很难 的, 它 那个 网络拓扑 结构 是 很 复杂 的, 就 不是说 一层 网络, 其实 三层 网络。

这里 算 力 从 千卡 集群 到 万卡 集群, 再到 现在 3万卡 集群 中心, 造价 成本 是 多少?

难度 有 多大? 预算 每张 H 100售价 3万美金 对 吧? 再加上 周边设备 互联网络 这些 其他 可能 差不多 四万多 美金。 8000卡 就 意味着 三 亿多 美金, 3.2万 卡 集群 的话 就 意味着 12到13 亿美金。 我 觉得 明年 可能 标配 就得 10万张卡, 差不多 四五十 亿美金。 我 觉得 最难 的 还是 资源 越来越 集中 收敛, 能 建大 集群 的 客户 是 很少 的, 我 就会 收敛 到 只有 四五家 大 客户。

影响 难度 的 因素 可能 就是说 你 首先 得 找到 适合 G P U 数据中心 的 土地, 对 吧? 然后 稳定 而且 比较 便宜 的 电, 之后 是 数据中心 的 互联 通信 降温 运维 的 可靠。 然后 还是 回到 那个 问题, 就是 物理 世界 的 东西 比 数字世界 的 东西 改造 的 是要 慢 的。

会 收敛 到 极少 的。 45家客户, 他 指的 是谁?

微软 meta A W S, 微软 包含 open a 了, google 有 自己的 T P U, 它 可以 恒大 集群 我 觉得 就 比较 少了。 X C I 可能 也是 一个 大 基建。

现在 有 哪些 公司 在 投资, 进展 到 什么 程度 了?

你 就 看 英伟 达 G P U 出货量 和 T P U 的 出货量, 或者 计算 台积电 的 产能。 微软 和 meta 可能 得 买 走了 3分之1 的 G P U 的 数量。 我 觉得 你 也可以 看, 就是 硅谷 最大 的 几个 生意。 第一波 最 受益 的 还是 芯片, 芯片 里面 最 重要 的 还是 英伟 达 和 台积电 对 吧? 那 第二 波 其实 是 广告 平台, 就 meta 广告 变现 效率 还在 提高, google 广告 变现 效率 可能 还在 提。 那 第三波 我 觉得 是 云 厂商, 因为 芯片 和 模型 都要 跑 在 云 厂商 的 整个 企业 客户 的 继续 上, 云 的 需求 还是 很强。 我 觉得 云 厂商 未来 每年 很 长时间 保持 年 化 15的复合 增长, 我 觉得 都是 有可能 的。 我 觉得 最后 可能 是 说 两个 终端, 一个 是 苹果, 一个 是 tesla, 我 觉得 这 都是 大 基建 最 重要 的 几个 关键 玩家。

欧朋 I 在 旗舰 上 截至 目前 它的 投入 有 多大? 现在 每年 的 投入 是 多大?

你 就 看 微软 给 欧 盘 投 了 100。 30亿美金 对 吧? 然后 这个 大概 能 买 三四十万 张卡。 另外一个 角度, 你 再 算 英伟 达 R G P 的 出货量, 今年 可能 400万片。

如果 5% 的 比例 给 到 瓯 潘, 那 可能 他 每年 就要 新增 20万张卡, 每张 卡 3万美金, 再加上 其他 设备, 其实 可能 每个 要 5万美金 了。 其实 一年 就要 新增 100亿美元 的 硬件 投入, 其实 这样 算, 好像 欧洲 的 钱 也 不够。 我 估计 他 比如说 还得 做 更 大规模 的 融资。 那 另外 还有一个 有可能 他的 卡 就 是从 微软 租 的。 他 现在 每年 H 100可能 就 一万多 美金。 那 说明 头部 的 A G I 公司 其实 每年 至少 都要 几个 币 的 投入 的, 而且 可能 要 投 很多年。

这些 大 基建 的 成本 有可能 分摊 出去, 必须 要是 模型 公司 自己 承担。

谁 给 什么? 比如说 政府, 我 觉得 有可能。

你说 中国 有可能 还是 美国 有可能。

我 觉得 都 有可能。

但是 现在没有 看到 对 吧? 现在 还是 模型 公司 自己 在 投入。

我 觉得 未来 有可能 随着 主权 A I 这个 概念 更 深入, 政府 去 投资 一家 模型 公司, 我 觉得 是 有可能 的。 而且 大 比例。

投资 只能 投 一家。

可以 投 多家。 而且 你看 欧洲 也有 myr, 对 吧? 那 我不知道 欧洲 是不是 一个 独立 或者 半 独立 的 市场。 那 如果 欧洲 的 资源 队 到 miss tre, 那 有可能 他他 就得 拿 政府 的 钱 了。

你 预期 A G I 基建 的 时间表 是 怎么样 的? 达到 什么 程度, 意味着 这个 基建 是 完成 了。

我 最近 的 感受 是 A G I 的 时间表 肯定 拉长 了。 最 主要是 去年 太 兴奋 了, 觉得 两三年 A G I coming 对 吧? 我 觉得 现在 预期 更长 了, 就是说 为什么 叫 马拉松? 至少 拉长 到 3到5年, 甚至 5到10年。 当然 也得 动态 的 看, 每个人 对 A G I 定义 不一样。

比如说 你 去年 就会 预期 能 看到 GPT5? 能力 而且 很强, 可以 超过 一半 的 同事。 我 觉得 那会儿 预期 太高了, 原因 是 啥 呢? 就是说 去年 这时候 open 还 先后 发 了 XGTGP3.5GP4大家 觉得 节奏 很快。 但 其实 你看 这些 模型 背后 都是 他们 提前 吹 好 很久 了, 只是 去年 这个 时间点 同时 发出 来了, 但 其实 你看 过去 一年 当中, 其实 是 没有 叫 大幅 超越 G P4 的 模型 出来 的这 里面 其实 说明 其实 是 大 的 模型 其实 很难 的。

它 不仅 是一个 A I M L 数字化 的 问题, 我 觉得 还是 很多 物理 硬件 问题。 比如说 实际 的 H 100规模化 的 到货, 其实 都是 去年 年底 了。 Q 4, 然后 你 数据中心 建设 都要 几个 月, 然后 还要 把 利用率 提上去。 就是 人的 预期 可以 飞 得 很快, 但是 物理 世界 我 觉得 是 跟不上 的。

比如说 你 跑步, 你 有 意志力 和 体力 跑 马拉松, 但 膝盖 一个 小 环节 跑 不 下去, 我 就 跑 不 下去。 那 膝盖 的 问题 可能 不是 膝盖 的 问题, 而是 肌肉 的 问题。 但 肌肉 的 问题 有可能 是 训练 方式 的 问题。 所以 我 最近 一个 强烈 感受 就是说 A G I 的 时间表 跟 物理 硬件 机器 的 迭代 是 高度 相关 的, 才能 支撑 数字世界 持续 迭代。 我 觉得 大 基建 是 看不到 结束 的 那天 的。 过去 几十年 我 觉得 半导体 是 很 伟大的 一个 发明, 而且 这个 还会 继续。

大 基建 周期 预计 全球 投入 花 多少钱, 泡沫 有 多大?

你看 24年 G P U 产能 差不多 400万片, 对 吧? 然后 25年 可能 六百多 万片, 然后 未来 每年 复合 增长 可能 都不 低于 30。 再 过 三四年 后, A I G P U 应该 是一个 三四千 亿美元 的 产业 规模, 这里 还不 包含 google 的 T P U 和 I C X 芯片, 对 吧?

我 觉得 更 值得 提 一下 的 是 像 美国 的, 比如说 曼哈顿计划, 现代 电子技术 的 一个 起点。 然后 美国 的 登月 太空 竞赛, 包括 克林顿 曲线, 高速 信息网络 也 划 了 5%到6% 的 G D P。 更 有意思 就是说 你看 中国 过去 基建 搞 公路、 搞 城市化、 搞 5G我 觉得 这是 催生 短 视频 外卖、 直播 电商 很 重要 的。 我 觉得 基建 来了 应用 才能 大 爆发, 我 觉得 这 是一个 一个点。 A G I 还是 一个 刚 开始, 其实 长期 看 不算 泡沫。 我 觉得 你 把 钱 交给 最 厉害 的 科学家, 有时候 你 一个 新的 发现 是 带来 很大 的 一个 经济 价值 的 突破 的, 甚至 社会 价值。

大 基建 的 这个 时期 其实 会 贯穿 着 整个 通往 A G I 这条 道路, 它 不是说 到 一个 某个 时期 就 结束了。

首先 我 觉得 计算 这个 事儿 的 迭代 可能 停不下来。 你 比如说 单 颗 芯片, 现在 的 摩尔定律 还在 提, 依然 没 停下来, 但 进步 速度 变慢 了。 但 现在 老黄 也 在 提 整个 数据中心 的 摩尔定律, 它 通过 互联? 这些 东西 把 整个 数据中心 变成 一个 大 芯片, 再 用 这种 方式 继续。 还有 另外 一种 就是说 未来 还 可以 跨 数据中心, 能不能 效率 更高? 我 觉得 这个 是 停不下来 的。 如果你 要非 要说 一个 时间, 我 觉得 可能 10到20年 就是 一个 大 基建 的 周期。

你 觉得 中国 的 A J 大 基建 和 美国 的 A G I 大 基建 两边 的 趋势 差异 是什么?

我 觉得 美国 历史上 还是 有 大航海 发现 精神, 包括 美国 东岸 登陆 了, 开垦 整个 美国 美洲 大路 对 吧? 然后 包括 曼哈顿, 包括 克林顿, 我 觉得 这个 是一个 面对 不确定性 的 乐观 的 冒险 精神。 其实 最 主要 的 原因 还是 资本 和 退出 比较 充足, 付 的 早, 然后 有 足够 多 的 钱 来 支持 0到1 的 试错 和 发现。 历史上 你看 很多 0到1 的 东西 确实 是 美国 搞 出来 的, 不管 说 芯片、 计算机、 互联网 对 吧? 甚至 还有 东岸 的 那些 制药, 他们的 文化 里面 好像 有 这种 叫 重 投入 的 一个 传统, 而且 相信 科学。

但是 另外一个 就是 有时候 你 也 感觉 硅谷 的 V C 有时候 不争气, 他们 几乎 全线 miss 掉了 大 模型 的 投资。 好像 这些 人 对 大 模型 的 理解, 我 觉得 也 不一定 很 深入, 全都 是 巨头 在。 是的, 中国 的 V C 好像 更 争气 一些, 就是 还 投 了 国内 的 几家 大 模型 公司, 从 零 到 一起来, 对 吧? 有可能 是 硅谷 V C 以前 在 重 资产 的 吃 过 亏, 对 吧? 当然 他 也 miss 掉了 特斯拉 和 space x 这些 公司? 其实 在 这 波 A G I 的 浪潮 之前, 机器人 在 他们 那边 都 属于 一个 边缘 赛道。 但 现在 是 硅谷 最 火 的 赛道, 硅谷 维 C 喜欢 叫 小钱 办 大事。 我 但 我 觉得 这次 不一样 了, 有可能 整个 硅谷 维 C 最 擅长 的 小钱 办 的 大事, 包括 投 sas 最后 价值链 是 发生 了 一个 大 的 变化 的, 就是 价值 会 沉淀 在 模型, 这 里面 可能 大家 都 是要 交学费 的。

如果你 回头看 中国, 我 感觉 是 我们 解决问题 的 能力 很强, 但 提出 新 问题 的 很少, 0到1 很少, 但 1到100 很强, 你说 中国 能不能 做 的 大 基建? 但 现在 就是 一个 卡 的 问题, 你 就 只能 未来 期待 国产 芯片, 期待 华为 的卡 未来 更好, 另外一个 不一样 就是说 美国 真的 在 做 A G I, 今天 中国 还在 真正 的 追 G T4 以及 追 神 师 第一名? 还是 说 那个 辨识度 的 问题, 差异 怎么 拉开? 大家 可能 过了 3.5 的 水平, 但 3.5到4 这个 跨度 其实 还是 不小 的。

你说 美国 V C 喜欢 花钱 小钱 办 大事儿, 但 这 不就是 V C 的 本质, 以小博大。

你看 电商 的 投入 也 很大, 快递 物流 的 投入 也 很大。 其实我 觉得 好多 产业 可能 有 很多 的 投资 方法 不同, 其实 门派 可能 还是 比较 多 的。 就是 V C 最 应该 是 小钱 班大师, 但是 也有 需要 大钱 的 时候。

你怎么看 这次 中国 的 V C 看起来 更 争气, 更有 出息 这件 事情, 他们 为什么 会 支持 这么 大 投入 的 大 基建?

因为 美国 有 对 标。 其实 你看 很多 类似 都 还是 喜欢 投 有 对 标的 东西 的, 是 就 我们 擅长 解题。

Musk 不是 也 提到 了 能源 问题 吗? 10万的 H 100意味着 什么? 它是 需要 多少度 电? 美国 的 能源 结构 和 中国 能源 结构 有什么 不同 吗?

中美 能源 结构 还是 有 很多 不同 的。 就是说 10万H100 用电量 一年 大概是 12.4亿度, 大概是 整个 上海 用电量 的 一年 的 0.8%, 大概 对应 美国 的 整个 德州 的 0.3%。 你 再 拉 常 看一下, 就说 美国 一年 的 总的 用电量 在 过去 20年 里 都是 一直 比较稳定 的, 大概 都是 4万亿度。 其中 数据中心 可能 用 2000亿度, 大概 就是 5% 对 吧? 但 你看 媒体 现在 都 预测 说到 28年 数据中心 用电 可能 到 6700亿度 电, 就是 五年 涨 三倍, 就 从 5% 增长 到 16%。 这个 其实 对 制造 和 基建 能力 明显 退化 的 美国 来讲。

我 觉得 挑战 是 很大 的。 能源 转换 效率 可 量化 吗?

那就 回到 A G I 的 一个 本质, 就是说 电 加 芯片 产出 智能。 今天 主要是 给 智能 怎么 定价 的 问题, 你 开车 就是 一脚 油门 从 A 到 B? 可以 计算 单位 里程 的 能耗。 但 今天 最 主要问题 是 没办法 给 智能 定价。 我也 挺 好奇 未来 怎么 定价 的。 你 现在 所有的 A I 产品 定价 都是 20美元 一个月, 对 吧? 这 还是 sis base 的。 我 觉得 未来 能不能 有一个 叫 value base 的, 按照 智能 的 value 来 pressing。

基建 上 罗 询 公司 如果 想 跨越 生死线, 它 有一个 基本 的 标准 吗? 在 基建 投入 上 的。

你 就 看 未来 12个月 能不能 有 10万张 H 100的集群, 这个 大概是 三五十 亿美元, 这 才是 明年 第一 梯队 模型 的 一个 标配。 计算 可能 就是 很 残酷 的, 未来 可能 更 残酷。 每个 时间 阶段 可能 都 会有 模型 公司 持续的 出局。

我们 聊聊 skilling law, 今年 对 scaling law 有什么 新的 认知 吗? 它是 加速 增长, 线性 增长, 还是 它的 增长 放 平缓 了。

你 从 细节 来看, 就是 GPT4公开 的 是 1.8T 的 参数 M E 架构 对 吧? 大概 欠 了 13个T 的 数据, 大概是 2.5万张 A 100。 训练 了 100天, 外界 都在 猜 GPT 下一代 模型 能 give up 多少倍 吗? 我们 就 假设 如果 他 三倍 参数, 三倍 数据, 那 就是 九倍 的 compute 对 吧? 那 你看 老黄 公布 的 3.2万张 H 100的集群, 你 再加上 一些 优化 效率 的 提升 是 刚好 match 的。 你 要说 想 十倍 参数 和 10倍数据 的 提升, 那 就是 100倍的 computer 提升。 很 明显 现在 G P U 算 力 集群 是 不够 用 的。

又 回到 那个 大 基建 问题, 就是 物理 机器 的 瓶颈 今天 是 没法 stay up 的。 我 觉得 今天 可能 增加 数据 可能 比 增加 参数 R O I 明显 要 高 的。 好像 高质量 的 数据 永远是 不够 用 的。 因为 之前 很多人 提 文本 数据 不够 用了。 那你 通过 今天 不管 说 合成, 改写 很多 可能 能 扩大 个 小 几倍。 今天 让 你 拿出来 g p 40倍 的 数据, 可能 一百多 T 的 高质量 数据 其实 很难 的。 我 觉得 可能 没有人 能 拿出来 的。

然后 另外 还有一个 难题, 就是说 你 怎么 把 多 模态 的 数据 跟 文本 数据 一起 拿来 训练, 这是 很难 的。 还有 很多 research 问题, 因为 它 很 容易 伤害 到 原来的 模型。 我 觉得 今天 对 skin law 一个 观察, 就是说 GPT5 的 数据 可能 是 够用 的, 但是 G P6 肯定 还是 要有 一些 突破 的。 所以 未来 一两年 我 觉得 skin N O W 没问题, 但 后面 肯定 还是 要 突破 的。

如果 非 要说 一个 结论, 我 觉得 我是 没有 减速 的。 如果说 变慢 了, 我 觉得 就是 算 力 和 数据 没对 够。 你看 GP3.5 走到 G P4, 可能 大概 用了 二三十倍 的 算 力 提升。 那 G P4 走向 下一代, 我 觉得 今天 还没 怼 够 二三十倍 有效 算 力 的。 但 我 觉得 只要 有了 有效 的 算 力 和 更多 的 数据, 肯定 还是 会有 新 东西 出现 的。 我 觉得 这 会影响到 整个 格局 和 大家 的 关注度。

围绕 芯片, 围绕 互联, 我 觉得 接下来 两年 除了 research 问题, 可能 最 头部 的 模型 公司 和 大厂, 可能 我 觉得 至少 花 50% 的 精力 解决 算 力 和 互联 的 问题。 所以 这 不光是 一场 research lab。 关于 research 的 惊人, 我 觉得 更更 像是 一个 巨头 的 博弈。 对 人才、 对 用户、 对 算 力, 甚至 对 舆论 股价 这些 你看 微软 也 比较 有意思, 就是 又 去 投 了 欧洲 的 mr 然后 又 收购 了 inflection, 自己 还在 train 大 模型。 所以 它 跟 欧派 的 关系 我 感觉 挺 复杂 的。

你 评价 一下 微软 这 一系列。

动作 在 最 稳 的 位置。

站住 最 稳 的 位置。

对, 站住 最 稳 的 位置。 云 还是 最大 的 声音。

get law. 接下来 走下去 会有 瓶颈 吗? 能 走 多远?

我 觉得 就 看 两个 关键 要素。 第一个 还是 数据, 第二个 是 G P U。 电力 不是 一个 research 问题, 这个 是 通过 投入 还是 能 解决 的。 我 觉得 反正 现在 skin law 这个 问题 的 结论 就 还是 首先 物理 计算 的 瓶颈。 所以 你看 sam t 7个T 什么 巴拉巴拉 造 芯片, 我 觉得 还是 很 有 道理 的。

另外一个 就是 效率 很 重要, 一个 是 computer 的 效率, 一个 是 data 的 效率。 有 个 有趣 的 衡量 大家 效率 的 就是说 同样 训练 一个 GPT3.5 水平 的 模型, 你到底 需要 多少 张 G P U, 要 多少 数据? 结果 有可能 是 差别 很大 的。 有可能 有的人 需要 几千 张有 可能 有的人 需要 300张, 这个 认知 很大。 其实 最后 A G I 的 本质 就是 能源 加 芯片 产出 智能 的 效率。 那 这个 效率 最后 能有 多 高 吗?

另外 最近 我 觉得 还有 一个点, 就是说 我 觉得 从 架构 上 agent 这个 东西 到底 能不能 完成 有 经济 价值 的 任务, 复杂 任务。 Next token 这个 架构 到底 能不能 解决 长期 规划 的 问题, 这个 是 接下来 我 觉得 最 值得关注 的。 不然 如果 不能 解决 任务, 最后 这个 skin 下去 意义 是 大 的。

模型 会 无限 变大 吗?

我 觉得 会 无限 变大, 参数 再 大 十倍、 100倍, 数据 十倍、 100倍甚至 1000倍。 醇 大 的 模型, 我 觉得 是 为了 探索 能力 边界, 我 觉得 这 还是 一个 科学发现 的 问题。 但 大家 都会 趁 更 小的 模型 满足 商用 成本 很低。 你 比如说 google 也是, 欧派 也是, 对 吧? 欧 盘 出了 3.5, 我 觉得 也 验证 这种 事情。 就是我 可以 用 data 模型, 比如说 1% 到 10% 的 资源 存 一个 更 小的。 但 从 能力 上 其实 是 能 覆盖 大多数 的 cory 的 场景 的。 其实 不见得 比 sota 模型 差 很多, 但 成本低 了 1到2个 数量级。

其实 今天 从头 衬 一个 GP3.5, 需要 的卡 是 比较 少 的。 这里 有一个 科普 的 基本 公式, 就是说 训练量 其实 等于 参 数量 乘 训练 的 token 数量 再 乘 6。 举 个 例子, 你 比如说 GPT4是 1.8万亿 的 参数, 它 有 13万亿 的 token, 再 乘 6其实 就 等于 25000张 G P U。 当时 是 A 100对, 它 大概是 19.5 t flops, 就是 19.5万亿次 的 计算。 然后 在 60秒60分钟 再 乘 24个小时, 再 乘 100天, 还要 再 乘 一个 利用率, 就是 一般 的 利用率 能 到 50, 就是 属于 比较 好的, 可能 最强 的 可能 到 六七十。 对。

School law 能 通往 A G I 吗?

应该说 目前 这是 最大 概率 的 一条 路线, 我们 没有 找到 除了 这条 路线 以外 的 其他 路径。 所以 在 没有 证伪 之前, 可能 要 兑 更多 的 资源 去 验证 这个 事儿。

你的 一个 观点 是 2024年 是 大 模型 公司 的 收敛 之 年。 2024年 创业 公司 或者 巨头 要 投入 多少 资金 能够 越过 这个 生死线 呢?

我 觉得 未来 12个月 就 看 能不能 有 10万卡 的 H 100集群, 可能 三五十 亿美金 的 投入, 对 计算 这个 是 比较 残酷 的, 未来 可能 更 残酷, 每个 时间段 可能 都 会有 出局 的。

技术 上 的 生死线, 基础设施 上 的 生死线 分别 是什么?

我 觉得 技术 上 今年 内 必须 得 超过 G T4 了, 背后 可能 是 需要 一个 很强 的 团队。 你 比如说 马斯克 的 X I 这个 团队 很强 对 吧? 二 三线 模型 公司, 包括 国内 的 模型 公司, 你 就得 超过 最好的 开源 模型, 不然 你的 商业价值 也 比较 小。 算 力 上 你 今年 必须 得用 上万 卡 集群 了, 其实 能 做好 万卡 集群 的 公司 还是 比较 少 的。

全球 来看, 最后 能 留下 几家 A G I 公司, 包括 巨头 和 创业 公司, 也 包括 中国 和 美国。

我 觉得 美国 可能 是 四家 open anthropic google 马斯克 的 X E I。 欧洲 的话 我 觉得 miss 说是 不错 的, 但 不确定 欧洲 是不是 一个 独立 市场, 以及 他们 能不能 拿到 更多 的 资源, 比如说 万卡 集群 以及 未来 更多 看 中国 的话, 字节 这个 公司 是 决心很大 的, 而且 他们 业务 现金流 很好。 刚才 聊到 每年 可能 有 几个 亿 的 投入, 有 利润 支持 大 基建 和 马拉松 投入 的。

现在 2024年 刚刚 过完 一个 季度, 对于 H I 的 眼镜, 接下来 三个 季度 你 有没有。

一些 预测 更多 的 期待。 你 比如说 欧派 的 下一代 模型, 它的 scalp 幅度 到底 有 多大? 我 觉得 这是 观测 skin law work 的 一个 最 重要 的 指标, 以及 这个 模型 会 涌现出 哪些 新的 能力。 今年 也 比较 期待 看到 open I 这个 公司 做 产品 能力 怎么样, 做 的 产品 好不好。 如果 他们 做 搜索, 做 信息检索, 到底 会不会 对 google 产生 fundamental 的 影响。

我 觉得 多 模态 也 特别 重要, 多 模态 对 机器人 和 自动驾驶 的 影响 是 最大, 机器人 可能 还是 得 依赖 多 模态 的 突破 才能 有 提速 和 爆发 吧。 另外 就是 提到 的 收敛, 我 觉得 年底 可能 就会 收敛 到 几家 了。 还有一个 就是 开源, 会不会有 GPT4 水平 的 开源 模型 出来? 对, 另外一个 比较 期待 的 就是说 你看 eleven lives, 包括 suno 最近 也 挺 火 的。 就是我 好奇, 比如说 单一 模态 的 创业 公司, 如果 他 只 做 模型 可能 是 比较 危险 的。 但是 如果 他 把 整个 产品链 做 的 很好, 其实 好像 也是 有 壁垒 的。

ChatGPT 和 sora 属于 A J 路上 的 什么样 的 路标?

我 觉得 叉 GPT 成功 还是 有 很大 的 偶然 和 运气 成分 的。 让 A G I 这个 概念 进入 千家万户, 科普 和 募集 更多 资源 的 帮助 更大, 我 觉得 确实 是一个 里程碑。 骚扰 的话 其实 好像 和 A P I 和 走向 智能 好像 没 啥 直接关系。 我 觉得 这也是 一个 很大 的 非 共识, 刚才 也 聊到, 但 我 觉得 骚扰 更多 的 说明 是 说 多派 能力 进展 会 很快, 欧克 的 战线 铺 得 更广 了。 我 觉得 好像 不是 那么 高度 的 聚焦 在 A G I 这个 事儿, 复 难 吗?

模型 规模 有 多大? 大概 需要 多少 算 力 数据, 以及 数据 来源 是什么?

Open 没有 公开 sora 的 数据 情况, 但 你看 他 那个 技术 报告 里面, 我 觉得 是 能 估算 出来 一些 东西 的。 就是说 他 提到 训练 环节 是 L M 的 好几倍, 我 估计 可能 比如说 大概 四千多 到 1万多 卡 H 100做1个多月 的 最后 训练。 这个 还 不算 前期 的 实验 探索, 推理 的 算 力 消耗 也是 很大 的。 如果 生成 tiktok 一天 上传 的 量, 大概是 1500多 万分钟。 推理 的 成本 跟 训练 的 成本 差不多, 所以 这 两个 成本 都是 很高 的。

还有一个 可能 就是说 他们 肯定 也要 采集 收集 可能 几千万 上 亿个 小时 的 视频 数据, 而且 要 给 这些 视频 数据 打 标签。 比如说 他们 有 GPT for v 去 给 视频 打 标签, 对 吧? 这个 一般 团队 弄 不了 的, 你 打 标签 这个 成本 就 很高。

到底 什么 数据 我 觉得 是 不知道 的这 还是 挺 核心 的。 就是说 那 肯定 是 youtube r 也会 用, 对 吧? 然后 他 自己 甚至 会 录 很多 游戏 的。 因为 你看 sorry, 它 生成 的 东西 就 跟 微软 x box 打游戏 的 感觉 挺 像 的。 我 觉得 可能 也会 用 一些 maybe 游戏 数据, 我 觉得 数据 是 很 关键 的。 你看 皮卡 生成 的 动画 效果 是 很 好的, 你 比如说 很多 皮克斯 的 相关 的对 吧? 最近 他们 那个 C T O mirror 好像 说 他们 有 机会 把 推理 成本 降到 跟 图片 生成 的 推理 成本 差不多。 那个 时候 他 会 公开 release.

他 到 现在 都 还没有 让 我 用。 对 那 你怎么看 他们 这种 传播 策略 呢? 早早 的 就 给 我们 看 他们 demo.

我 觉得 是 不断 的 release 一些 新的 进展, 给 大家 和 外界 更多 的 信息。

但 他 并没有 把 它 产品化。

骚扰 的 产品 形态 今天 怎么 定义 出来 都 不清楚, 以及 成本 也是 一个 很大 问题。 我 觉得 一个 是 产品 形态。

一个 是 成本 问题。 创业 公司 应该 跟进 骚扰 吗?

我 觉得 很 凶险。 如果你 谁 有 信心 融资 能力 很强, 比如说 融 到 几 亿美金, 三四 亿美金, 其实 它 需要 的 数据 难度 是 介于 L M 跟 器人 之间 的, 而且 获取数据 的 难度很大, 卡 和 数据 的 成本 都 很高。 但是 最后 sara 产出 的 结果, 我 觉得 还是 有 争议 的。 就是 视频 等 不等于 智能, 是不是 一定要 做到 效果 最好 才 有人 买单, 更 看不清。 我 觉得 创业 公司 还 不如 想想 下一步 怎么 定义 骚扰 的 产品 形态 和 未来 A I 内容 的 消费 形态。

你 今天 对于 GPT5 的 预测 是什么? 它 会 什么时候 到来。

夏天 或者 下半年, 但 这个 都是 瞎 猜测。 我 觉得 这是 今年 了, 如果 再不 出来。

他 是不是 有可能 出 PPT4.54.5 肯定 会 更快。

但 4.5 相比 四 能有 多大 的 提升, 我 觉得 这 还是 不确定 的, 我 觉得 可能 不会 有 fomenter 大 的 提升。 如果 是 4到5才 是 代际 上 的 提升, 才能 有 更多 值得 期待 的对 G P5 期待 的。 我 觉得 是看 有没有 新 能力, 能不能 解决 复杂 任务, agent 能不能 落地。 只有 A 真的 真正 落地 能 做 长期 的 复杂 任务 了, 才 比较 重要。

不同 模型 之间 的 迁移 成本高 吗?

一方面 你 随着 模型 能力 变强, 其实 prom 的 相互理解 能力 是在 加强 的。 其实 模型 迁移 成本 是 很低 的。 但 你 随着 模型 周边 的 模块 附加 的 东西 越来越多, 比如说 整套 的 reg, 基于 模型 设计 的 不同 的 任务 和 agent 也 越来越 复杂。 其实我 觉得 未来 迁移 也会 变得 越来越 麻烦, 因为 这 里面 细节 工作 也会 越来越多。

但是 有 一个点 就是说 好像 大家 对 开源 模型 没 啥 忠诚度。 之前 觉得 lama 最好, 现在 觉得 mr 最好。 可能 未来 如果 X I 更强 的 glock 开源 了, 有可能 也是 更好。 我 感觉 好像 忠诚度 也没有 那么 高, 哪个 好用 就 用 谁啊, 以及 成本 非常重要, 你 像 clo 3的成本 比 G T4 还是 要 便宜 很多。

影响 不同 模型 最大 的 因素 是什么?

如果 只 说 一个, 我 觉得 用 数据。 因为 大部分 的 模型 的 架构 是 比较 统一 的, 就是 training, 包括 各种 recipe 其实 也 比较 统一。 其实我 觉得 影响 模型 效果 最大 的 还是 数据, 就是 数据 决定 了 这个 模型 作为 产品 的 特点。 其实 也就 说 数据 决定 了 这个 模型 的 性格。 但 数据 其实 是一个 很 系统 的 工作。 然后 欧派 我 觉得 同时 具备 数据 的 经验, 然后 数据 的 基建, 也 愿意 花 精力 去 搞 数据。

对 很多 researcher 来讲, 数据 是 很多 脏活 累活 的, 很多 人是 不愿意 干 的。 其实 有 很多 公司 人才 密度 很高, 但 其实 数据 并没有 做好。 比如 google, 一方面 google 是你 用 有 版权 的 数据, 大公司 的 包袱 跟踪, 那个 要 更 关注。 另外 一方面, 每个人 想做 的 东西 都 很多。 你 加上 去 这个 lexi 就 比较 重, 最后 方向 没有 拉 按 到 一起。

不同 模态 的 模型, 他们的 上限 和 优势 是 一样的 吗?

我 觉得 上限 最高 的 还是 大 语言 模型 和 coding 视频 上限 也很 高。 我 觉得 上限 低 的 可能 是 声音 图片 上限 高 的, 智能 能力强 的 公司 是 有 更强 优势 的。 我 觉得 上限 低 的, 你 就 必须 得 做好 产品, 保证 自己的 优势。

为什么 前面 几个 比 后面 的 图片 和 声音 更高, 它的 上限 你。

就 看 数据量 也 更大, 数据 的 丰富 度 也 更多。

你 认可 朱 啸虎 的 观点 吗? 他说 A G I 至少 5到10年 是 看不见 的。 智力 级别 的 提升 首先 需要 能量 级别 的 提升。 可控 核聚变 实现 前, 他 不相信 地球 有 足够 的 算 力 能够 实现 真正 的 A G I。 帮 人类 降低 90% 的 工作 可能 未来 3到5年 可以 实现, 但 最后的 10% 可能 需要 天量 的 算 力 和 能耗, 这也是 为什么 sam 想 融 天量 的 资金 的 原因。

对我 听 这样 一个 博客, 我 觉得 大部分 的 观点 是 认可 的。 胡歌 喜欢 小钱 办 大事, 我 觉得 这是 V C 非常 经典 的 一个点。 但 你 回头看, 比如说 微软 第 台 计算机 出来 的 时候, 盖茨 其实 也 不相信 说 内存 从 那个 时候 的 多少 个 K 到 今天 多少 个 G B 对 吧? 然后 我 觉得 我们 还是 相信 摩尔定律 的, 以及 模型 的 计算 效率 会 大幅 的 提升, 推理 的 效率 也会 大幅 提升。 然后 硬件 的 memory, 模型 本身 的 context window 也都 能 提 很多。 我 觉得 如果 这些 比较复杂 的 东西 都 提上去 之后, 一个人 真的 可以 把 自己 所有的 历史 的 context 都 去 运行 了。 我 觉得 那个 时候 可能 还是会 解锁 很多 的 新的 技能 的。

你 比如说 虎哥 提到 降低 90% 的 工作, 如果 真的 做到 90% 了, 3到5年 实现, 我 觉得 这个 就 已经 很 乐观 了。 剩下 10% 那 才是 人类 的 价值, 我 比较 同意 能量 级 需要 升级 这个 观点, 就是说 你看 很多 数据中心 现在 都 建 在 核电站 旁边, 对 吧? A W S 最近 收购 了 一个 美国 最大 的 核电站 旁边 的 数据中心, 六七 亿美金。

我 其实 对 A G I 的 理解, 我 觉得 关键词 就是说 那个 渐进式 解锁。 它 其实 不是 一蹴而就 的, 也 不是说 非要 到 某个 A G I 的 临界点。 其实 你看 今天 tesla F S D 的 安全性 已经超过 平均 司机 的 水平 了。 那 C V 识别 包括 推荐 的 效率 也 比 人 高了 很多 了, 对 吧? 我 觉得 对 5到10年 内 看到 一些 是 充满信心 的。 我 觉得 相信 科学 会有 突破, 相信 这帮 科学家 可能 还是 跟 曼哈顿 登月, 跟 克林顿 的 信息高速公路 建设, 我 觉得 是一个。

是 他 还有一个 观点 是 GPT5 以后, 他 觉得 技术 曲线 基本 就会 放缓, 现在 看 语言 模型 进步 差不多, 见底 突破 在 多 模态 sora 在 发布 三四个 版本 也能 见 顶, 你怎么看 他的 这个 观点? 就是 技术 迭代 曲线 会不会 放缓 的 问题。

我 觉得 技术 有可能 遇到 短暂 的 瓶颈, 但 我 觉得 后面 还是 会有 跳跃 吧。 过去 一年 可能 就是 第一波 小升 浪, 我 觉得 后面 还是 会有 一波 更大 的 主升浪。 我 觉得 中间 也有 卡 点, 也是 技术 发展 的 正常 好的, 因为 技术 发展 好像 都 不是 线性 的, 很 可能 遇到 平台期, 停滞 两年 在 跳变 跃升, 有一个 更大 的 主升浪。 我 觉得 这个 可能 就是 一个 科学发现 的 过程。 几十万 张卡 训练 A P I, 我 觉得 可能 比 登月 对 人类 的 意义 更大。 我 觉得 会有 更多 的 新发现, 包括 未来 下一代 模型, 你的 体感 的 刺激 上 是 会 降低 的, 但 经济 价值 我 觉得 是 刚 开始 落地 的, 我 觉得 后面 比较 期待 模型 公司 都会 做好 agent 附加值 就会 提上来 了。 其实我 觉得 模型 今天 作为 一个 新的 平台, 确定性 已经 非常 高了。

欧文 I 凭什么 估值 1000亿美金?

你 把 open I 看成 微软 的 A I 部门, 微软 因此 涨 了 有一个 T 到 1.5个 T 那 你看 tesla 的 A I 都 可能 值 两三千 亿美金。

如果你 对 open I 有了 更多 的 新的 认知, 这个 能不能 展开 讲讲? 今年 以后 首先。

是 A G I 的 时间表 可能 拉长 了, 以前 觉得 就 两年。 第二 我 觉得 A G I 公司 一开始 不应该 太 激进 的 做 产品 的, 好像 欧派 现在 也很 激进 的 做 产品。 第三 我 开始 理解 了 渐进式 解锁 A G I 它 不是 一个 一蹴而就 的。 你 非得 把 这个 火箭 发到 月球 上。

对 吧? 非得 实现 了 A G I 才能 解锁。

其实 过程中 会 不断 的 解锁。

你 上次 也 提到 这个 观点, 你 觉得 今天 的 理解 有什么 不一样?

好像 他的 节奏 变慢 了 一点, 我以为 clo 3发出来 之后, 他 就得 发 下一代 模型 了。 因为 你看 sota 已经 易主 了 一段时间 了, 很多人 以为 他们 可能 串 好了, 憋着 没有发, 对 吧? 那 我 觉得 不一定。

像 更 渐进 那个 更慢 了 一点。

我 觉得 慢 的 原因 是 物理 的 瓶颈。 为什么 你 突然 想到 了 大 基建 这个 关键词? 所以 物理 的 迭代 没有 数字 的 迭代 快 吗? 我 觉得 这是我 最大 的 一个 感受。 其实 很多 还 不是 A I M L 的 问题, 我 觉得 是 物理 的 数据中心 的 问题。 这是 这帮 科学家 有时候 碰到 我 就 更 头疼 的 问题。

OpenAI 开始 更 激进 的 做 应用 了。

意味着 什么 呢? 那你 一边 做 科学发现, 一边 做 商业化, 要把 这些 科学发现 的 价值 给 接住, 我 觉得 这个 也很 make sense。 这个 也 意味着 说 欧派 也会 给 一部分 创业 公司 去 抢 一些 市场, 肯定 还有 很多 垂直 行业 他 也 做不了, 对 吧? 我 觉得 这 可能 是一个 然后 我猜 如果我 是 sam 的话, A G I 如果 有 十年, 每年 都 需要 几个 币 甚至 10个币 的 投入。 我是 需要 商业化 的, 我是 需要 有 不断 的 持续 健康 的 现金流 来 支持 A G I 这个 事儿 的。 纯 靠 融资 是 很难 融 到 那么 多 钱 的, 你 也 不能 只 依赖 微软。 所以 我 觉得 健康 的 走向 A G I, 我 觉得 这 是一个 比较 关键 的。

你 觉得 有什么 是 open I 这家 公司 做 的, 有什么 项目 一定 不会 做 的。

就 你看 sam 最新 的 访谈, 他说 欧派 在 做 地球 上 最难 的 两件 事儿, 一个 是 做 A G I, 一个 是 做 超级 应用。 我 感觉 欧派 在 to b 企业 侧 其实 可能 更难 一些。 因为 企业 客户 还是 一个 讲 信任 的 生意, 因为 大家 觉得 欧 盘 容易 瞎搞。 你 把 所有的 企业 业务流程 放到 GPT 上, 大家 有点 不 放心, 对 吧? 那 我 觉得 微软 在 企业 的 客户 信任 太 深 了。 我 觉得 欧 盘 的 to b 的 价值 有可能 会 被 微软 拿掉 很大 的 一部分。

欧派 必须 要 做好 的 是一个 是 模型 最 领先, 一个 是 to c 这块 儿 我 估计 他 可能 是 想 做成 一个 流量 入口。 垂直 领域 不一定 会 做, 因为 战线 拉 太 宽 了。 但是 垂直 领域 的 数据 我 觉得 他 可能 都会 持续的 加上 去, 要把 一些 use case 给 做 的 更好, 你 比如说 让 他 去做 法律, 做 金融、 做 教育, 我 估计 可能 不一定。

当然 我 比较 关注 欧派 会不会 做 机器人, 他们 以前 做 过 机器人 觉得 太慢, 但 最近 一年 好像 又 投 了 三家 机器人公司, 现在 还是 一个 扶持 的 状态。 我 觉得 如果 机会 到了, 他 有可能 会 做 机器人 的。 因为 机器人 从 数字世界 走向 物理 世界, 这 还是 A G I 比较 关键 的。

我 觉得 如果 是我 的话, 我会 先 把 ChatGPT 从 5000万的 D A U 做到 三个 亿 的 D U 有可能 这个 就 会对 google 产生 funding tal 影响 了, 或者说 这就 多 出来 一个 很大 的 增量 价值 了。 因为 你看 chat G T 现在 可能 还 不到 1000万的 付费 用户。 如果我 做到 3000万的 付费 用户, 我 这样 一个 就是 每年 60亿美金 的 订阅 收入, 那 就可以 比较 健康 支撑 我 A G I 每年 的 投入 了。 你 拿 mac seven 来 对比 的话, 其实 你看 open 很难 跟 微软 去 抢 to b 的 市场, 也 更难 跟 英伟 达 去 抢 芯片 的 市场, 也 更难 跟 apple 去 抢 终端 了。 我 觉得 大 概率 google 是个 软柿子, 那就 去 抢 信息检索 的 市场, 这 比较 make sense。 以及 谁的 模型 更 领先 吗?

嗯, 所以 这也是 你 对 open I 下一步 的 预测, 你 能不能 预测 一下 open I 接下来 的 会 做什么? 上一次 博客 发 了 以后, 很多 有人说 去年底 说 了 很多, 今年初 就 应验 了。

我 觉得 还是 更强 的 模型, 以及 chah t 活跃 用户 的 规模 怎么 再 翻个 三 五倍 甚至 更多。 飘 软柿子 捏, 就 打 google, google 那个 太 肥 了。

怎么看 他 sam 说 的 这个 7T美金 的 融资, 中东 会 在 全球 大 模型 战局 中 扮演 什么 角色 吗?

我 觉得 微软 跟 欧派 是 应该做 S X 芯片, 我 觉得 起码 要 具备 这个 能力。 因为 如果 A G I 是一个 长跑 十年, 对 吧? 我 觉得 今天 肯定 要 做 准备。 我 觉得 有意思 的 是不是 会有 一个 新的 芯片 联盟 出现 芯片 联盟, 因为 主要是 今天 英伟 达 卖 太贵 了, 三万多 一个 卡。 如果 让 中国公司 产 有可能 打 到 几百美元 一个 卡, 就是 卖 太贵 了, 就 七个 T 这个 显然 就 太多 了。 我 觉得 肯定 不会 有 这么 多 钱, 但 肯定 也 需要 很多 钱。 只能 说 中东 可能 是一个 潜在 的 最大 的 出资方。

芯片 联盟 可以 怎么做?

其实 你看 google 的 T P U 就是 自成一体。 如果 sam 融 到了 几千 亿美金, 你 想他 要 收购 什么 呢? 我 觉得 可能 要 收购 一个 芯片 团队, 拉 着 微软 和 几个 大 的, 甚至 说 方锐 他 有可能 做不了。 但是 做 一个 自己的 asic 芯片, 我 觉得 是 make sense 的。 就像 google 有 TPU1样。 因为 欧派 可以 把 A I M L 的 问题 都 优化 的 很好, 但是 还 改不了 G P U。 这个 没办法, google 是 full stack 全都 可以 改, 这是 google 优化 能力 很强 的 一个点。

你看 google 是一个 整体, 全都 是 自己 欧文 的 公司, 从 上面 到 下面 有 自己的 T P O。 但 瓯 潘 跟 google 最大 的 一个 差异 是 没有 自己的 芯片。 歐 潘 想 去 改 芯片, 想 去 降 成本, 想 去 school up 芯片, 他是 没办法 的那 你 从 英伟 达 的 角度 来讲, 我 宁愿 给 多家 大 模型 公司 芯片, 我也 不能 只 给 一家 大 模型 公司 芯片。 所以 如果 是我 的话, 我 觉得 还是 一定要 做自己 的 S X 芯片 的。

你 也 提出 现在 大 模型 是 集团军 作战, 上次 我们 聊过 硅谷 的 公司 的 结 的 问题, 你 觉得 接下来 会有 更多 的 节目 吗?

我 觉得 马斯克 的 X C I 长期 不 排除 会 并入 twitter 特斯拉, 然后 你看 微软 open 目前 还是 很 稳定 的, A W S S topic 是 互相 被迫 深入 绑定。 我看 A W S 的 销售 已经 开始 全线 卖 克劳 三 了, 然后 google 还是 自成一体, 因为 欧洲 的 ms 必须 得 抱 个 大腿 了, 他们 之前 效率 是 比较高 的, 就是 可能 2000张H 卡, 未来 一年 就是 得 想办法 融 到 一到 3个B万卡 集群。 如果 没有 这个, 我 觉得 后面 可能 有可能 掉队。 比较 期待 的 是 apple、 英伟 达、 meta 怎么 入局 吧?

Apple 你 有 关注 到 他 什么 新的 动作 没有?

他 发 了 一些 小的 模型, 但 我 觉得 apple 短期 追上 G P4 水平 还是 比较 难 的。 但是 手机 还是 最 重要 的 一个 入口 和 习惯, 我 觉得 apple 的 位置 长期 是 比较 稳 的。 我 觉得 apple train 很大 的 模型, 今天 看 好像 还是 追不上 open I 的。 但是 他们 肯定 是 云和 端 结合 的, 有可能 我 觉得 会 调用 多个 模型 也 不是 没 可能。

你怎么看 他们 放弃 了 造 车?

我 觉得 还是 美国 的 制造业 不 太行, 然后 也 没 等到 自动驾驶 来, 他们 设计 太超前 了。 还有一个 apple 的, 就是 因为 很多人都 在 提 A I P C A I 手机。 但 其实 真的 把 一个 大 的 模型 变成 小的 模型 装 到 端 上, 这个 是 很难 的。 因为 现在 一 B 的 模型 做不了 太多, 但 手机 跑 一 B 的 模型 能耗 要求 都是 比较高 的。 我 觉得 这个 又 回到 那个 物理 问题, 物理 迭代 比较慢。 如果你 手机 放 一个 比较 大 的 模型, 那你 内存 也要 很大, 你 电池 也要 很大, 那 这个 手机 迭代 是 比较慢 的。 你 包括 tesla 的 F S D 在 端 上, 因为 它 要 内 ency 要求 很高, 也 不能 太大。

你 觉得 英伟 达 会 绑定 模型 公司 吗?

我 觉得 有 很大 可能。

会 绑定 谁 呢?

谁 最 相信 skin law?

他 场上 可以 选 的 也 不多。

对, 没 必要 选 后面 的 了。 如果我 是 英伟 达, 我不 希望 open a 一家独大, 我 肯定 会 多 扶持 三五 家 更多 卖 卡。 如果 open I 一家独大, 那 英伟 达 P E 又 得 下来 一截。

你怎么看 最 近几个月 中国 大 模型 公司 和 巨头 之间 的 结盟 动态? 阿里 有 很大 的 动作, 投 了 所有的 中国 的 模型 公司。

好像 主要是 阿里。 我 觉得 云 还是 一个 比 芯片 和 模型 大个 三 五倍 的 声音。 未来 我 觉得 更多 的 企业 的 生产流程, 各种 数字化 流程 还是会 跑 在云上。 云 未来 十年 可能 符合 增长 都是 15以上 的, 但 这 里面 价值链 分配比例 我 就会 发生变化。 所以 我 觉得 阿里 也得 必须 要 投入。 就 期待 阿里 新的 C E O 吴 妈 是不是 像 微软 的 C E O 撒特 一样, 能 让 阿里 这种 大象 起舞 的 一个人。

那 他 为什么 就是 同时 分散 投到 多家, 而 不是 种猪 一家 呢?

辨识度 不够 高, 因为我 的 投资 也可以 绑定 算 力 消耗, 最后 钱 都 还是 要 回来的。 如果我 投出去 一块钱, 训练 又 花 一块钱, 我的 revenue 又 多了 一块钱, 那 我的 市值 也 可能 就是 十块钱。

它是 一个 还是 能 算 过来 账 的 事情。

我 觉得 这个 账 很 稳, 云云 还是 很 稳 的。

A I 时代 的 key Y P 现在 能 看到 模糊 的 方向 了 没有?

我 觉得 不一定 在 以 APP 的 形态 出现, 因为 APP 是一个 互联网 的 产物, 然后 也有 可能 就是 更 随时随地 的 一个 agent 或者 muli model agent 更 不一样的 交互。 你 比如说 信息检索, 我 觉得 就是 一个 潜在 k life 方向。 比如说 现在 我 用 clo 3跟他 灵感 的 激发 brainstorm, 我 觉得 是 蛮 好玩的。 然后 另外 就是说 软件 的 生产方式 可能 会 发生 很大 变化。 自然语言 编程 应该 是一个 确定性 比较高 的。 人人 都是 产品 经理, 有 需求 就可以 生成 一个 软件。 我 比较 期待 就是 agent 今年 能有 一两个 比较 好的 use case 出来。 今天 你说 agent 好像 你 说不出来 啥 use case。

A I 时代 硅谷 的 V C 现在 都在 投 一些 什么? 他们 去年 在 A I 上 投入 大 吗? 今年 是 更 激进 了 还是 更 保守 了?

我 觉得 硅谷 V C 的 投资 主题 好像 是 叫 三 大件, coding agent 和 机器人。 不过 这 三 大件 我 觉得 还是 有 很大 怀疑 的。 就是说 coding 一定 是在 大 模型 公司 和 微软 的 核心 射程 以内 的。 因为 核心能力 都是 来自 模型 公司, 这些 coding 的 创业 公司 他 不会 趁 自己的 大 模型, 我 不确定 上面 优化 层 的 价值 有 多大。 另外 我也 感觉 模型 公司 可能 会 很 激进 的 做 A 因为 这个 附加值 还是 比较高 的。

模型机 能力 模型 及 应用? 模型 及 agent 我 觉得 整个 价值 沉淀 我 倾向 于 短期 还是 模型 本身。 看 那个 cognition, 包括 magic 其实 还没有 啥 收入, 甚至 没有 客户, 就 两个 币 的 估值 了。 所以 你看 硅谷 的对 coding 的 hip, 我 觉得 还是 比较高 的。 机器人 我 感觉 现在 是 很多 是 创业 的 首选, 因为 比较 容易 讲故事, 觉得 未来 会有 一个 anybody 的 open I 反正 open I 最近 也 投 了 几个, 我 觉得 也许 是一个 好的 timing 就得 battle。 对 一个 好的 比较 强 的 团队, 我 觉得 核心 是 未来 能不能 融 更多 的 钱, 以及 让 核心 的 researcher 都 更 收敛。 对我 觉得 投资 结构 上 整体 属于 正常, 肯定 是 有 一定 的 害怕, 就是 估值 比较 贵。

这 一代 大 模型 技术 对于 自动驾驶 技术 的 影响 是什么? 对于 之前 那些 自己 不造 车, 但是 做 自动驾驶 的 公司 影响 有 多大? 你怎么看? 他 死 了。

特斯拉 股价 现在 是 不 乐观 的, 因为 车 的 销量 甚至 说 都在 负增长, 对 吧? 欧美 比较 疲软, 然后 中国 的 竞争 压力 很大。 因为 造 车 这个 基本 盘 业务 其实 是 比较 悲观 的。 因为 你看 他 汽车 销售业务 可能 就 150亿美元 利润, 可能 给 个 20倍的 PE3000亿美金。 那 tesla 的 A I 业务 可能 就 值 另外 的 两三千 亿美金。 但 好像 华尔街 又 今天 还 不是 很 认 F S D, 因为 最 主要是 F S D 今天 好像 没有 对 新车 销售 带来 fundamental 的 影响, 以及 带来 新的 商业模式。 所以 你看 马斯克 最近 也 提 了 taxi 这个 业务, 对 吧?

我自己 对 特斯拉 一个 感觉, 就是 如果 它 股价 还会 继续 跌, 比如说 跌 到 甚至 100出投, 我自己 还是会 愿意 去 买 一点 他的 股票 的。 我 觉得 特斯拉 的 机器人 团队 还是 全球 最好的 机器人 硬件 团队。 我 觉得 后面 也 比较 期待, 就是 F S D 对 汽车 销售 到底 有 多大 的 拉动, 以及 能不能 彻底 解放 注意力。 如果你 今天 不能 彻底 解放 注意力, 哪怕 你 要 接管 一两次、 两三次, 你 那个 心思 还是 要 盯 着 方向盘 的。 我 觉得 tesla 还有一个 更大 的 可能性, 就是 对 汽车行业 的 变革。 未来 能不能 真的 没有 方向盘 了, 或者 卖 车 免费, 真的 说 把 车 的 里程 价值 做得 更高, 真的 把 得 做好。 但 还是 回到 那个 物理 挑战, 就是 美国 的 制造业 不如 中国强, 所以 我 觉得 这个 变革 可能 不会 那么 啥。

如果你说 大 模型 对 自动驾驶 的 帮助, 我 觉得 你 比如说 它的 多 模态 能力 变强 了, 把 采集 到 的 这么 多 的 corner case 全都 能 更好 的 筛 出来 了, 更好 的 解决 corner case 的 问题, 我 觉得 这个 效率 上 还要 更高。 你 比如说 大家 如果 在 三藩 的话, 都能 去 试一下 vivo, 其实 vivo 在三 跑 的 是 非常 好的。 他 以前 有一个 非常 大 的 Operation cost, 就是 最 开始 的 时候 是 每 一辆车 都 有一个人 在 后台 做 监控 的, 现在 是 一个人 可以 监控 四辆 车。 如果 多 模态 能力 比较 强 的 之后, A I 是不是 可以 帮忙 监控 400辆车 或者 4000辆车? 这个 Operation cost 我 觉得 是 能 降 的 很低 的这 也 有利于 vivo 的 大规模 普及。

自动驾驶 落地 和 机器人 落地 哪个 更难?

我 觉得 还是 机器人 会 更难, 就是 自动驾驶 有可能 比 A G I 来 的 要 更 早 的。 今天 还不 觉得 机器人 到了 一个 产业 大 爆发 的 时候, 因为 还有 很多 research 问题 要 解决。 你 比如说 最 重要 的 还是 数据 问题。 因为 很多人都 想做 机器人 的 foundation model 这个 大脑, 但是 没有 大量 的 足够 量 的 训练 数据。 因为 语言 模型 起来 是 过去 几十年, 互联网 积累 了 很多 的 文本 数据, 对 吧? 因为 语言 又是 对 现实 世界 的 一个 很 好的 抽象。 那 你看 现在 很多 的 机器人公司, 也就 不 超过 100台的 机器 像 阿罗哈 那样 去 采 数据, 对 吧? 所以 这个 数据 量级 还是 太小 了, 就 不像 tesla 几百万 辆车, 全球 每天 都 采 数据 回传 数据 能 用作 训练 机器人, 最 核心 的 还是 谁能 解决 数据 问题。 我 觉得 最 期待 的 还是 多 模态 能 带来 funding tal 的 突破, 解决 机器人 的 数据 问题。

我 觉得 就是 未来 大 模型 能力 很强, 它 具备 了 多 模态 理解 视觉 的 能力 之后, 可以 直接 对 物理 世界 做 建模。 有可能 语言 模型 和 机器人 模型 可能 就是 一个 模型。 如果 A I 的 能力 很强, 可能 是 也是 降低 对 物理 硬件 的 依赖度 的。

另外 很多人 也都 在 提 人形, 我们 现在 也 挺 难 判断 要不要 做成 人形, 反正 马斯克 是 这么 做 的, 也能 最好的 去 适配 人类 的 现有 环境。 我 觉得 更好 的 一个 定义 应该 是 叫 通用 机器人, 而 不完全 只限于 人形。 我 觉得 机器人 还有 另外一个 大 的 场景, 就 通用 机器人 它 不像 自动驾驶 或者 智能手机 一样, 一开始 都 有一个 机器 刚 需。 你 每天 能 用 的 需求。 就是 一般 硬件 的 升级 都是 有一个 刚 需, 也是 渐进式 迭代。

其实 你看 工厂 好像 不需要 这些 通用 人形 机器人, 家里 好像 也 不知道 他 干嘛。 你 让 他 去 开 可乐、 开 瓶子、 开门, 好像 这个 泛化 都 没有。 目前 机器人 好像 只 想到 了 说 军事 这个 人的 生命 珍贵, 那 以后 人 不要 真人 上 战场 了, 那那 让 机器人 部队 去 打仗, 找 个 沙漠 对 吧? 我 觉得 这个 好像 是一个。

然后 另外 我 觉得 还有一个 就是 中国 的 优势, 就是说 能把 成本 降下来。 现在 好像 一台 人形 机器人 还 挺 贵 的, 可能 都 得 十多万 美金。 然后 如果 未来 你说 家用 什么的, 我 觉得 这个 肯定 要 很低。 十多万 美金 离 大规模 商用 我 觉得 还 比较 远。 我 觉得 能 解决 成本 问题 可能 只有 tesla 或者 中国 的 供应链。 杭州 有 个 公司 叫 语数 科技, 以前 把 机器狗 成本 做到 了 极 低, 做到 了 极致。 那 现在 很多 他的 客户 要 人形, 我 觉得 他用 同样 的 方法 也 是不是 也可以 把 人 形成 本 降 得极 低。

如果 是 投资 的话, 我 觉得 去看看 上游 的 组件, 你 比如说 陵霄 手, 一只手 其实 有 几十个 小型 的 电机 其实 也 挺 多 的。 但 未来 还要 不要 电子 皮肤 对 吧? 传感器 机器人 今天 还 不能 像 人 一样 实时 的 感知 外部环境, 这 是一个 没有 反馈 的。 我 觉得 你 像 各种 sensor, 我 觉得 也是 一个 比较 重要 的。 我 觉得 长期 对 通用 机器人 还是 比较 看好 的, 甚至 说 如果 有 机会 深入 下场 创业, 我 觉得 应该 加入 机器人 团队 的。

你是 自己 想 加入。

我 觉得 应该 深入 的 投入 精力 在 一个 我 觉得 这 是在 大 模型 之后 的 能 看到 的 最大 的 一个 事儿。

同时 有 大 模型 公司 和 机器人公司, 你 会 去 哪个?

先 去 大 模型 再去 机器人, 我 觉得 机器人 是 需要 更 久 一些。 今天 加入 机器人公司, 不知道 加入 哪个, 因为 现有 的 好像 都不 像是 那种 能 scalable 一直走下去, 走 很远 的。

你是 中国 的。

还是 美国 的? 全球 的 OK, 我 觉得 会 比较 担心, 今天 会不会 像 16年 去做 自动驾驶 太早 了。 我 觉得 还有一个 就是说 看 谁能 一下子 融 1到2个 币。

因为 机器人 今天 还 不是 商业 和 工业 落地 问题, 我 觉得 还是 research 问题, 很多 research 问题 还没 解决。 你 比如说 你 训练 的 数据 哪里 来, 你的 场景 是什么? Cost 能 降下去。 我 觉得 research 问题 最 重要 的 可能 就是 多 模态 和 大 模型 本身 的 突破, 可能 对 机器人 提速 更 重要。

话说 为什么 我们 作为 碳基 智能 一直 在 追求 硅基 智能 上 这么 热衷?

我 觉得 这 是一个 有意思 的 问题。 就是说 因为你 最终 期待 的 A G I 的 一个 结果, 不管 说是 agent 还是 其他 形态, 你 能把 整个 能 用 的 能源 和 compute 资源 能 用 的 最有 意义。 去 思考 一些 人类 没有 思考 过 的 问题, 甚至 说 以前 人类 解决不了 甚至 没有 想 过 的 问题, 这是 更有意义 的。

我 觉得 带来 新 东西, 炭 基 肉身 还是 有 很多 局限 的。 你 比如说 相比 大 模型 来讲, 人的 吞吐量 是 有限 的, 记忆 也是 比较 短 的, 也 没办法 长时间 工作, 精力 也有 问题, 而且 人 读 不了 很多 的 数据, 你 比如说 D N A、 R N A 这些 数据 人 也是 读 不了 的, 而且 人 不能 规模化 的 复制, 对 吧? 然后 运算 能力 也 不够 强我 觉得 碳基 和 硅基 还是 一个 挺好的 互补 的。 其实 你看 人 跑步 跑 再 快 也没有 轮子 快。 硅基 智能 有可能 是 未来 地缘 博弈 最大 的 一个 关注点。 我 觉得 未来 十年 主题 可能 就是 硅基 的 A G I 和 地缘 博弈, 而且 这 两个 还是 交叉 的。

你 最近 有没有 看 厦门 上 播客 的 采访? 你 对他 有什么 新的 看法? 没有?

其实 sam 是 很 有 争议 的。 你 其实 你看 在 open I 成名 之前, 他 已经 坚持 做 这个 公司 做了 六七年。 其实 很多人 以前 还是 不相信 A G I 这些 东西 的, 我 觉得 这一点 sam 是 非常 值得尊敬 的。 其实 你看 相比之下, 马斯克 中途 是 下车 了的。 现在 回头 过来 可能 是 觉得 A G I 很好 的对 吧? 但 我 觉得 是 有 很大 的 勇气 去 探索 一些 完全 没有 探索 的 东西 的。 你 比如说 更 复杂 的 一个 公司 架构, 这也是 带来 更多 风险 的, 包括 敢 提出来 典型 硅谷 V C 是 不愿意 投 时间 和 资源 的 这种 巨 烧钱 的 项目 上。 其实 在 这 里面 我 觉得 他 也 吃 了 很多 亏, 对 吧? 然后 也有 很强 的 争议, 感觉 他 不够 真实。 但 他 好像 一直 在 努力 的 维持 一个 比较 有爱 的 形象。

我 觉得 另外 他 也 提 了, 比如说 A G I 叫 slow tic 对 吧? 我 觉得 也 比较 有意思。 一是 说明 skin law 可能 不像 大家 想象 那么 急速 发展, 另外 欧派 可能 也 需要 不断 的 去 发 新产品, 去 调整 模型 发布 的 节奏, 来 掌握 节奏感。 我 觉得 sam 可能 也是 一个 叫 节奏大师, 战略 能力 也很 强, 好像 他 对 安全性 问题 也 蛮 重视 的。 他 那个 博客 里面 我 觉得 有一个 印象 比较 深 的, 就是说 G P4 可能 再 过 一两年 就会 是 很小 的 模型, 以及 可能 感觉 很 笨, 说明 他 对 后面 模型 能力 进步 还是 比较 乐观。 但是 我 对 sam 一直 有一个 比较 好奇 的 问题, 就是 他 怎么能 有 那么 多 钱?

好像 他 投 了 很多 公司, 但 以前 历史上 好像 他 也没有 什么 大 的 退出。 难道 是在 Y C 赚的钱, 还是 家里 本身 就 有钱? 因为他 投 一个 公司 好像 都 几千 万美金, 上 亿美金 这种 投。

他 为什么 老 是用 用 个人身份 投资。

那 说明 他 比较 有钱。 我 一直 没 告诉我 说 他 为什么 能 赚 那么 多 钱。

Y C 如果 是 薪水 很高 是 不可能 负担得起 的对 吧? 对我 只是 薪水 很。

除非 说 他在 Y C 以前 个人 投 了 一些 项目, 比如说 那个 redit, 但 好像 还没有 退出, 我不知道 L B B 他 投 了 没, 或者 其他 的 比较 有意思。 对, 但是 我 觉得 sam 对 open I 获取 更多 的 资源 资金 募集 能力, 我 觉得 他是 非常 强 的。 当然 也有 的 人 说 他是 心机 boy 什么的。

那 为啥?

你 就 看 他 好像 是不是 那么 直接, 那 可能 确实 是 有些 东西 不能说。

比较 political 也 有点。 怎么看 mask 和 open I 现在 的 官司? 马斯克 和 open I 之间。

官司 有可能 X I 短期 打 不过 open I 因为 另外 open I 变成 了 硅谷 最 靓 的 仔, 就是 散户 的 钱 也都 在 派 萨拉 流出。 然后 不管 留 到 英伟 达 或者 哪里, 我 觉得 马斯克 还是 要 维护 他是 硅谷 最 靓 的 仔, 硅谷 的 神 这个 形象。 Tesla 还有 高 的 P E 估值, 我 觉得 作为 马斯克 他 肯定 也很 不爽, 毕竟 open 这个 idea 还是 他 发起 的, 但 今天 和 自己 无关, 好像 也 没 捞 到 什么 好处。 不过 欧派 后来 变成 一个 商业化 的 组织, 确实 是 跟 之前 的 非盈利 的 初心, 我 觉得 是 有 冲突 的。 但 我 觉得 另外 一 层面 看, 纯 靠 一个 非盈利 的 组织 走向 A J I 又是 比较 难 的。 我 觉得 sam 走到 一个 跟 微软 合作 好像 也 没 毛病, 只有 大 的 战略 方才能 给 更多 的 钱 和 基础 建设 支持。

Sam 和 老黄 在 硅谷 的 地位 谁 更高?

我 觉得 短期 还是 老黄 地位 高。 我 觉得 英伟 达 是 属于 叫 人类 的 基石 公司, 就是 A P I 没有 sam 可以, 那 没有 老黄 不行。 但 我 觉得 长期 来讲, open I 的 价值 可能 是 更大 的, 就是 sam 也有 可能成为 叫 所谓 智能 时代 的 教主。 但 前提 是 芯片 不能 受限于 英伟 达, 未来 的 结构 可能 就 比较清楚。 人类 又 多了 两个 收税 的 人类 基石 公司, 一个 是 芯片 算 力水, 一个 是 模型 智能 水。 谁 也 不能 可能 在 其他。 Take in the.

好了, 这 期 节目 就是这样。 如果 你喜欢 我的 节目, 欢迎 前往 苹果 podcast、 腾讯 新闻、 小宇宙、 喜马拉雅、 QQ 音乐 订阅 张小泉 商业 访谈录。 如果你 有 其他 想 邀请 的 嘉宾, 想听 的 内容, 或者 你 有 任何 想 探讨 的 话题, 都 欢迎 各位 听众 朋友们 在 评论 区里 留言。 我们 下期 再见, 拜拜。

You want to survive.