人工智能 正在 以 前所未有 的 速度 席卷 全球。 去年 我们 还 处在 百 模 大战 的 这么 一个 讨论 当中, 聚焦 于 A I 的 iphone 时刻。 但是 今年 我们 看到 A I 的 应用 已经 内卷 的 不得了, 大规模 的 落地 的 应用 已经成为 一个 新的 这么 一个 竞技场, 价格战 也是 硝烟 4起。 所以 一系列 的 变化 预示 着 大 模型 的 商业化 的 进展 正在 提速。
百度 作为 国内 最早 进入 大 模型 的 科技 巨头, 有着 非常丰富 的 经验 和 实践 的 这么 一个 深度 和 洞察力。 围绕 大 模型 的 下一步, 业界 展开 了 非常 多 的 热烈 的 讨论。 开源 还是 闭源? C 端 和 B 端 谁 能够 先 迎来 A I 应用 的 这么 一个 爆发? 大 模型 的 落地 还 面临 哪些 挑战? 包括 我们 百度 踩 过 什么 坑。 今天 我们 邀请 到了 百度 创始人 董事长 兼 首席执行官 李彦宏 先生, 硅谷 101的联合 创始人 陈茜, 一同 来 探讨 大 模型 的 未来之路。
姚明 你好, 我们 知道 一年 多了 有 ChatGPT 掀起 的 这么 一个 热潮。 对你 也 曾经 表达 过 说, 接下来 我们 最 关注 的 是 超级 应用 什么时候 出现。 我们 看到 其实 国内 面向 C 端的 这么 一种 大 模型 的 这么 一个 产品 形态, 看起来 还都 是 差不多 都是 这种 搜索框 问答 这个 模式, 有没有可能 产生 一种 差异化 的 竞争? 什么样 的 好的 产品 会 出现?
对, 准确 的 讲 我 倒 不是说 一定 在等待 一个 超级英雄 的 出现, 我 更是 觉得 就是 在 基础 模型 之上, 在 这个 大 模型 之上, 应该 能够 诞生 数以百万计 的 各种各样 的 应用。 这些 应用 有些 可能 就是 很小 的 这个 领域, 一个 大家 可能 不太 容易 想到 的 这种 应用。 但是 他 对于 那个 领域 的 问题 解决 就 比 以前 要好 很多。 当然 也有 可能 是一个 用户量 极其 庞大, 对 吧, 用户 时长 也 非常 长 的, 类似 于 移动 互联网 那样的 超级 应用。 确切 讲 我 觉得 现在 还没有 看到 能够 比肩 移动 互联网 时期 超级 应用 的 那样的 A I 时代 的 原生 应用。 但是 已经 看到 的 确实 是 越来越多 的 在 各种各样 的 场景, 尤其是 to b 场景。 利用 大 模型 提升 效果, 提升 效率, 产生 更多 的 收入, 或者说 能够 节省 更多 的 成本 的 这样的 情况 出现。 所以 应该说 尤其是 今年以来, 我们 看到 在 各个领域, 各行各业 都有 A I 的 应用 的 场景 出现了, 它的 这个 出现 就是 使得 我们 比如说 人力 大规模 的 节省, 或者 是 效率 大规模 的 提升。
也许 比如说 对于 投资者, 对于 比如说 创业者 什么, 他们 没有 觉得 这个 东西 很 令人兴奋。 因为 大家 都在 想, 我 能不能 有一天 从 零 到 这个 你 做出 一个 人们 想 也没有 想到 过 的 这样的 东西, 变成 一个 D 有 10亿的 这样的 超级 应用, 这个 当然 很 重要, 我 觉得 假以时日 也 一定 会 出现。 但是 目前 已经 看到 的, 甚至 我 觉得 是 更 重要 的 是 大 模型 在 各个领域, 各个 场景 的 应用。 这方面, 比如说 从 百度 的 这个 文心 言 日 调用 量 来看 的话, 已经 是 非常明显 了。 我们在 四月份 的 时候 曾经 公布 过 一个 数据, 就是 文心 言 的 这个 调用 量 每天 大概是 要有 2亿次。 到 最近 一次 就是 前几天, 我们在 公布 的 时候, 这个 微信 年 调用 量 已经 到了 5亿次, 也就是说 两个月 的 时间 调用 量 是 more than double, 就是 对 调用 背后 意味着 什么? 意味着 它 在 给 应用 产生 价值。 因为 没有 价值 的话, 人家 也 不会 花钱 去做 这种 调用。 所以 这种 增长速度 我 觉得 还是 非常 令人兴奋 的。 就是说 大 模型 对于 实体 产业, 对于 各行各业 的 这种 提 效 降本 什么 这些 作用 其实 现在已经 是 非常明显。
你 更多 的 是 谈到 了 可能 在 一些 垂直 的 行业, 但 我们 其实 想 百度 还是 一个 很强 的 C 端的 这么 一个 基因 的 这么 一个 公司, 作为 一个 普通 的 消费者 和 使用者, 我们 也 想 请 您 聊 一 聊 在 这个 C 端的 应用 会有 一些 什么样 的 很 好的 场景。 包括 我们 现在 这 是一个 新的 词, 经常 说 了 端 侧 新的。 甚至 大家 说 最后 可能 我们 手机 上 的 APP 可能 都 已经 可以 被 手机 的 硬件 去来 调用, 而 不是 进入 一个 APP 的, 这个 你怎么看 呢?
这个 我 觉得 是 分 两类。 一类 就是 大家 比较 关注 的, 就是 过去 从来 没有 的 这些个 应用, 现在 比较 流行 的 就 类似 于 chat G P 这样的, 我们 把 它 叫做 chatbot, 就是 聊天机器人 这样的 一个 形式。 国内 其实 每一个 大 模型 公司 肯定 都会 推出 一个 相应 的 A P P 或者 是 网站 来做 这种 chaff out。 它的 作用 其实 也 比较 明显。 很多 时候 如果你 有一个 很 具体 的 问题, 那 丢 给他 的话, 他 就 会给 你 一个 还 不错 的 答案。 而且 这个 准确率 也 越来越高 了, 很多人 逐步 的对 这种 chatbot 产生 了 依赖, 但是 对于 现有 的 这些个 to c 的 应用, 其实 它的 这个 信息 增益 作用 也是 非常 大 的。 我们在 四月份 的 时候 公布 过 一个 数据, 就是 百度 搜索, 今天 有 11% 的 搜索 结果 会 是 由 A I 来 生成 的那 这个 比例 还在 不断 的 提升, 也就是说 现有 的 这些个 大家 比较 常见 的 应用, 其实 也 越来越多 的 在 被 大 模型 在 被 生成 是 A I 所 改造。
另外一个 例子 是 比如说 百度 文库。 过去 百度 文库 是一个 大家 在 上面 找 一些 现成 的 文档, 比如说 一个 中学老师 他 要 备课 了, 初中 的 物理课, 那么 他 要 找一找。 比如说 人大附中 的 这个 老师, 最 优秀 的 老师, 他的 这个 教案 是什么 样子, 去 找 这种 现成 的 文档。
今天 百度 文库 经过 这个 大 模型 的 这种 改造 之后, 已经 更多 的 变成 了 一个 生成式 A I 的 这种 应用。 也就是说 你 不管 想要 产生 什么样 的 文档, 是 power point, 是 P P T, 是 论文 的 格式, 还是 什么 各种各样 的 甚至 是一个 漫画 什么 这样的, 它 都 可以 根据 你的要求 来 生成。 而且 不仅 它的 用户量 比较 广, 这个 产品 它是 个 收费 的 产品, 就是 今年以来 已经 有 大约 2600万个 付费 用户。 所以 这个 就是你 如果说 用 超级 应用 的 这个 标准 来看 的话, 它 也没有 到 这个 超级 应用 的 这个 水准。 但是 你 要是 看 它 实际 产生 价值 的话, 有 那么 多人 愿意 为 这个 产品 来 付费, 那 还是 很 厉害 的对 吧? 就是 这些 产品 都是 过去 已经 存在 的, 只是 说 你 经过 了 大 模型 的 改造 之后, 它它 的 能力 跟 以前 完全 不一样 了。 人们 对 他的 认知 也 在 不断 的 迭代。
不断 的 在 加深。 因为他 能力 提升 之后, 大家 更 愿意 付费 了。 是的。
或者 超级 的 这个 定义 在 互联网 时代 跟 在 A I 时代 是 不一样。
了 是 不一样的。 对, 在 这个 互联网 时代 可能 是 某 一个 单一 的 从 0到1 或者 到 100的这样的 应用, 对 吧? 就是 今天 的 这种 所谓 的 超级 应用, 它是 对 现有 场景 的 一种 加持。 这种 加持 有时候 是 其实 它 还在 一个 早期, 我 必须 要 承认 就是 它 逐步 的 会 改变 现有 的 这个 产品 的 形态。
比如 我 再举 一个 例子, 就是 小说 创作, 网文 对 吧? 就是 这个 这个 在 国内 是 特别 火 的 一个 行业。 过去 大家 就是 人 肉, 就是 靠 自己的 能力, 靠 自己的 想象 不断 的 去 更新 一篇 文章 或者 一个 小说, 这个 效率 是 很低 的。 现在 有了 大 模型 的 加持, 你 基本上 有一个 什么 构思, 它 就可以 给你 一个 相应 的 这种 文档。 你说 再 丰富 一点, 它 就 再 丰富。 你说 这个 文风 可能 太太 温柔 了, 那么 要不要 强悍 一点? 什么 你 根据 你的 想法, 他 可以 不断 的 去 调整。
这样的 东西 就是 在 外界, 在 用户 看来, 我 仍然 在读 一篇 网文, 读 一篇 小说。 但是 这个 小说 的 生产成本、 生产 效率, 它的 内容 的 丰富 度、 可读性、 优良率 等等, 都是 跟 以前 是 不一样的。 所以 这样的 这个 例子, 其实 在 我们在 几乎 任何 行业 都 能够 看到。
对 我们 想 我们 前面 聊 的 一个 词, 我们 总结 可能 是 也是 你 以前 说 对 我们 叫 总结 一下, 比如说 叫 卷 应用, 那 接下来 我们 想 还有 关键词 叫 智能 体。 因为 我们 也 知道 你 都 说过 好 多次, 你 认为是 A I 时代 最 看好 的 是 智能 体, 但是 目前 来看 好像 也没有 一个 特别 强大 的 一个 爆发。 你为什么 认为 智能 体 是 A I 时代 未来 的 一个 趋势 呢?
我 觉得 智能 体 正在 爆发, 只是 说 它 现在 基数 还 比较 小的 时候, 大家 的 这种 体感 没有 那么 强烈。 但是 你 要 看 业界 这些, 比如说 大 模型 公司 都在 做 智能 体, 就是 业界 的 这些 意见领袖 这个 基本上 也 算是 共识。 就是你 问 他说 你 看不看 好 大能 这个 智能 体 一般 大家 都 会说 我 看好 智能 体。
智能 体 为什么? 就是我 觉得 是 代表 未来 基础 模型, 它 本身 是 需要 靠 应用 才能 显现出来 的 价值, 智能 体 就是 一个 几乎 可以 是 放之四海而皆准 的 基于 大 模型 的 这种 应用, 什么 意思 呢? 就是我 根据 我自己 的 场景, 我 设定 一个 这种 角色 的 这种 人设, 我 连 编程 都 不用, 我 只要 把 我想要 这个 做 的 事情 跟他讲 清楚, 有时候 当然 要把 自己的 一些 比如说 私有 知识库 什么 对接 进来, 或者说 把 自己 做 事情 的 套路 给 他说 清楚。 这个 专业术语 叫做 工作流, 把 工作流 套进去, 它 就是 一个 非常 有用的, 跟 基础 模型 不一样的 东西。
对, 今天, 几乎 不能说 所有, 但是 大多数 的 这个 A I 的 原生 应用, 其实 你 用 智能 体 的 方式 都 可以 做出来。 做出来 之后 效果 也 不错。 由于 它的 门槛 足够 低 了。 我 刚才 讲 可能 你 连 编程 都 不用 编, 可以 做出来 一个 效果 不错 的 这个 智能 体。 门槛 足够 低 的话, 就 意味着 越来越多 的 人 可以 做出 他 想要的 这个 智能 体。 这 有点像 什么 呢? 有点像 90年代 这个 中期 的 时候, 互联网 的 网站。
这个 网站 就是说 你可以 把 它 做 的 非常复杂, 对 吧? 当时 比如说 雅虎 也是 一个 很 厉害 的 那种 网站。 但是 一个 比如说 仍然 在 学校 里头 读书 的 大学生, 他 也可以 做 一个。
自己的 home page.
对 吧? 就是 他 把 他 比如说 常用 的 几个 网站链接 列 在 那儿。 比如说 java 什么 这个 学习 攻略 什么 这些 东西 做 几个 链接 就是 一个 他 自己的 这种 网站。
其实很简单, 做 起来 很 简单, 由于 做 网站 很 简单, 所以 在 90年代 的 时候, 从 中期 比如说 到 末期, 就是 诞生 了 数以百万计 的 网站。 这种 大浪淘沙, 最终 会 出来 一些 非常 优秀 的 网站。 Google、 facebook, 这是 当然 就是 若干年 后 才 出现, 但是 你 早期 看 的话, 你 可能 看到 的 都是, 这些 网站 怎么 都 乱糟糟 的。 就是 一个 大学生 就能 做 一个 网站 出来, 这 有 啥 这个 就 价值。 但是 你 必须 得 门槛 足够 低 的 时候, 让 更多 的 人 进来。 更 多人 进来, 他们 发挥 他们的 聪明才智, 就 定 哪一条 路 跑 通 了, 它 就是 一个 super t 这是为什么? 就是我 觉得 智能 体 是 代表 未来, 是我 特别 看好 的 一个 新型 的 业态。
但是 我 还是 特别关注 你 刚才 讲 的 问题, 就是 因为 最近 我 跑 那个 制造业 比较 多, 你 前面 说 的 可能 有 一些 像 车 企, 他 直接 调用 了 对 吧? 直接 把 这个 微型 或者 大 模型 在。 但 在 制造业 里面, 其实 他们 很多 企业家 都都 就在 问我, 说 我们 觉得 未来 A I 对于 我们 这个 高端 制造业, 智能 制造 显然 是一个 重要 的 加持, 甚至 是一种 革命性 的 突破。 但是 他们 一直 就 搞 不明白, 比如说 通用 的 大 模型 和 我 这个 行业 垂直 领域 的 垂直 大 模型 之间, 它 将来 到底 是一个 什么样 的 关系。 你说的 O E M 他们 也是 希望 到底 什么 供应商 和 你们 这样的 一些 平台 型 的 大 厂商 之间, 它 最后 形成 什么样 的 一个 业务 链条。 对 这个 问题 其实 是 制造业, 尤其是 先进 制造业 特别关注。 我们 也 采访 了 像 工业 互联, 包括 做 的 很 好的 海尔, 其实 他们 都在 深入 的 探讨 这些 问题, 我 觉得 是 很大 的 一个 场景。
对, 这个 问题 确实 很 重要。 实际上 涉及到 是 大 模型 在 各个 垂直 的 场景 里头 是 怎么用 这件 事情? 我们 也 经过 了 一个 探索 的 过程。 最初 我们的 想法 就是说 我 把 这个 基础 模型 做 的 越来越 强大。 它 大家 叫 通用 人工智能, 就是说 在 什么 场景 我 都 能够 做 的 很好。
后来 发现 这件 事情 其实 没有 那么 容易, 每个 场景 都有 他 自己的 道, 而且 他的 要求 也 不太 一样。 有些 地方 就是你 大 模型 你 思考 个 两分钟 再 给我 结果 也 OK。 你 只要 给 出来 结果 是 准确 的, 事实 是 全面 的 就可以 了。 但是 有些 场景 就是说 如果你 一秒钟 不出 结果, 用户 就 放弃 了。 所以 这 两个 场景 可能 就 对 大 模型 要求 是 不一样的。
今天 的 大 模型 还 不能 做到 它 既是 最最 强大 的 模型, 又是 反应 最快 的 模型。 所以 有时候 就是 当 这个 应用 场景 需要 反应 快 的 时候, 我们 可能 需要 一个 更 小的 模型。 这种 小的 模型 它 由于 没有 大 模型 的 那种 通用 的 能力, 所以 在 垂直 场景 当中, 你 还要 对它 他 做 金条, 就是 做 S I T。 那么 把 你 行业 的 数据 怎么 去 灌进去, 再 经过 各种各样 的 调教, 他 才能够 在 这个 场景 里头 这个 效果 能够 跟 大 模型 相比 能够 差不多。
就 类似 这种 场景 我们 也 见 了 很多, 所以 就是 去年 10月份 我们 发 了 文馨 的 这个 4.0 之后, 主要 精力 在 做什么 呢? 就是说 根据 这个 最 强大 的 模型 去 裁剪 各种 体量 的 小 模型 啊啊啊 比如说 这个 10亿量级 的 模型 百亿 量级 的 模型, 千亿 量级 的 这个 模型。 这个 模型 也许 是 比如说 擅长 角色扮演, 那个 模型 也许 是 擅长 逻辑推理 等等。 根据 客户 的 不同, 使用 场景 的 不同, 要求 出来 各种各样 的 模型。 这些 模型 大多数 速度 都 比 1比4要快, 成本 就是 推理 成本 又比 还要 低。 所以 这种 应用 就是 大家 更 爱 用 的。
即使 到 今天我 刚才 讲 的 就是 这个 武艺 的 调 量, 调用 量 最大 的 一定 不是 最 强大 的 模型。 因为 大家 都 觉得 说 还是 反应 太慢 了, 成本 太高了。 但是 随着 时间推移, 这个 成本 会 下降, 反应速度 也会 提升。 我们 比如说 前几天 刚 发布 这个 E B 4的turbo, turbo 就是 在 E B 4的基础上 效果 有 提升。 但是 更 重要 的 是 响应速度 变得 比 以前 快了 很多, 然后 成本 下降 了 很多。
因为 什么 呢? 就是 我们 发现 真正 的 市场需求, 可能 现在 更多 的 是 要求 你 响应速度 一定要 快, 足够 的 快, 对 吧? 成本 一定要 足够 的 低, 这样 我 才能 用 起来。 至于 说 下一代 的 这种 大 模型 到底 有 多 强大, 在 哪些 一些 场景 能够 用到, 那 是一个 我们会 继续 去 探索 的 这个 过程。 但是 今天 你 要 看 市场需求 的话, 其实 这个 就是 规模 更 小 一点 的 模型, 市场 需求量 是 更大 的。
但 其实 另外 还有 个 有趣 的 问题, 因为 我们 其实 这 两年 主要是 生成式 A I 我们 说 的 大型 渠道。 我们 也很 刚才 聊到 了, 其实 有些 领域 我们 已经 说 到了, 我们 认为 比如说 金融、 医疗, 法律 这些 领域 可能 是 把 C 端 跟 B 端 直接 有一个 交互 的 非常 好的 这么 一个 场景, 会有 一个 巨大 的 一个 爆发式 的 增长。 但是 还有一个 问题 就是说 大家 开始 担心 了。 因为 我们是 财经 媒体, 我们 也很 关注, 包括 这个 金融 领域, 就是 生成式 A 它 也会 有一个 叫 幻觉 问题是, 所以 这方面 我 跟 一些 业界 的 朋友 交流, 他们 也 说 尤其 在 我们 做 金融 的, 我们 真的 是 不大 敢 最后 让 这个 A I 的 最后 帮助 客户 做 决策。 对, 像 这种 表面 看 好像 是 C 端的 一些 日常 的 应用, 但 其实 一旦 碰到 严谨性 的 问题 时候, 怎么 去 破解 这么 一个。
矛盾 的 难题 呢? 其实 我们 只要 回顾 一下 过去 这 一年半 的 时间 大 模型 发展 的 历程, 我相信你 的 信心 会 大增。 就是 一年前 如果你 跟 大 模型 进行 交互, 去 问 他 一些 问题 的话, 你 会 经常 发现 幻觉 问题, 对 吧? 今天 你 在 用 的话, 其实 应该说 是你 会 很少 发现 幻觉 问题。 尤其是 用 最 大规模 最 强大 的 模型 的 时候, 已经 很少 出现 幻觉 问题 了。
为什么呢? 就是说 随着 技术 的 这种 不断 的 提升, 一开始 大家 就说 纯粹 用 原教旨 的 这种 transformer 去去 做出来 的 这个 大 模型, 他 确实 是 非常 难 避免 幻觉 的, 因为 它是 个 概率模型。 你 跟 他说 今天星期几, 对 吧? 他 回答 星期一 到 星期天 的 概率 是 一样的, 因为 确实 现实 是 当中 这 七天 的 概率 是 完全 一样。 但是 要 解 这个 问题, 你 就要 在 原来 这个 transformer 这个 架构 上 要 增加 一些 东西。 就是 这个 专业 词语 叫 red, 就是 retrial augmented generation 对 吧? 我 只要 稍微 借助 一点 工具, 我 就可以 消除 这样的 幻觉。 是啊 随着 你 使用 这种 工具 的 能力 越来越 强, 你 就会 发现 说 在 各种 场景 下 幻觉 是 越来越少 的。
当然了, 就是我 刚才 也 讲 今天 的 这种 深圳 式 人工智能 更 像 一个 扣 拍 了。 在 特别 严肃, 对 准确度 要求 特别 高 的 场景 下, 我们 还 不能 让 它 全部 自动 去 实现, 还要 靠 人 去 把 这个 最后 一道 关。 这样的话 就是 一方面 效率 提升, 另外 一方面 在 准确度 上, 在 消除 幻觉 上 也 能够 起到 比较 重要 的 作用。 其实 我们 也 必须 承认, 就是 人 也有 错的 时候, 甚至 有时候 这个 错误率 更高, 对 吧? 所以 这就是 我们 也不 能够 完全避免。 然后。
还有一个 比较 好奇 的 问题, 互联网 时期 SARS 在 中国 没有 to b 没有 做 起来, 为什么 你 会 觉得 在 A I 时期 这个 A I S O service 可以在 中国 做 起来 呢?
To b 方面 的话, 对, 就是我 觉得 在在 这个 SARS 时期 之所以 没有 做 起来, 更多 的 是因为 比如说 像 互联网 大 的 这些 平台, 它 既 做了 to c 的 事儿, 也 做了 to b 的 事儿。 换句话说, 比如说 将在 美国 的话, 可能 就是 每一个 商家 都 有一个 自己的 这种 电商 网站, 就是 用户 也可以 到 他的 网站 上去 购物。 今天, 就是 在 比如说 中国 的话, 大家 都 到 电商 平台 去 购物, 这些 电商 平台 上 就是 商家 所 需要 的 这些个 to b 的 这种 能力, 电商 平台 都 替 他 做了, 所以 他 不需要 这种 东西 了。 但是 在 美国 的话, 你 自己 比如说 你是 duty, 你 要 建立 一个 自己的 网站, 上面 要 能够 卖东西, 要 有 各种各样 的 这种 功能, 要 对 自己的 用户 进行 了解, 那是 需要 做 很多 投入 的。 所以 在 某种意义上 讲, 其实 中国 并不是 没有 这样的 需求, 而是 说 这些 需求 被 更大 的 平台 所 满足 掉了。
但是 在 A I 时代, 我 觉得 情况 又 发生 了 变化。 刚才 也 讲 它 不是 先 诞生 的, 不是 一个 从 0到1 的, 大家 过去 从来 没有 见过 的 这个 业态。 他 先 诞生 的 恰恰 是 对于 现有 业态 的 一个 enhancement, 一个 增强。 所以 就是 当 现有 业态 被 增强, 效率 越来越高 的 时候, 他 可能 就 更 能够 抵御 类似 于 像 互联网 平台 这样的 公司 对 他的 这种 业务 的 这种 侵蚀。 所以 这方面 我是我 我 倒是 觉得 A I 的 这种 to b 的 需求, 在 中国 会 比 互联网 to b 的 需求 要 大 很多。
好的, 如果我们 还 感兴趣 一个 问题, 就是 其实 现在 行业 里面 争议 很大, 也 非常 有趣, 大家 也很 关注 就是 开源 闭源。 这个 是你 也是 亲历 其中, 就是说 你的 观点 当然 一直 是 认为 这个 闭 园 当然 好了, 对 吧? 它的 质量。 它的 速度 等等等等。 但是 现在 我们 看到 其实 你 一方面 在 这么说, 但是 我们 现在 看到 开源 的 大 模型 越来越 多了, 而且 甚至 有些 能力 都 不亚于 我们 说 的 GPT4 了。 就 这个 问题 你怎么看? 你们 还 是不是 还是会 坚定 的 走 这个 闭源 这么 一个 路线。
我 觉得 开源 其实 是一种 智商 税。 就是你 你 仔细 想一想, 就是说 当我们 为什么 要 去做 这个 大 模型? 我 刚才 也 讲 的 是 它 能够 有 应用, 这些 应用 在 各种 场景 下 能够 为 客户, 为 用户 提升 效率, 降低成本, 对 吧? 就是 产生 他 过去 产生 不了 的 这个 作用。 所以 当你 理性 的 去 想, 就是说 这个 大 模型 能够 给我 带来 什么 价值, 以 什么样 的 成本 给我 带来 这个 价值 的 时候, 你 就会 发现 你 永远 应该 选择 闭源 的 模型。
就是 今天 在 闭源 阵营, 无论是 叉 G P 也好, 文心 一言 也好, 以及 各种各样 的 这个 模型。 你看 一下 它的 平均水平, 它 一定 是 比 这些 开源 模型 要 更 强大 的对 你看 它的 推理 成本, 它 一定 是 比 这个 开源 模型 要 更 低 的。 反过来, 就是你 用 一个 闭源 的 模型, 就是 算 力 可以 跟 大家 共享。 那么 就是 这些个 能力 的话, 它 有 同等 参数 下, 闭源 模型 一定 是 比 开源 模型 能力 要 更强。 那 同等 能力 下, 它的 就是 由于 B I 模型 可能 参数 会 更 规模 会 更 小 一点, 它的 推理 成本 就会 更 低。 所以 长久 来看, 就是我 觉得 这个 闭源 模型, 它的 使用 一定 是 supermajority, 一定 是 非常 大 比例 的 这种 会 超过 开源 模型。
当然了, 我也 不能说 就是 开源 模型 没有 存在 的 价值。 其实 比如说 从 学术研究 的 角度, 假如 说 你是 一个 scientist, 你 想 研究 这个 大 模型 到底 它 原理 是 啥? 对, 因为 业界 其实 也 一直 在在 抱怨, 就说 O K 大 模型 虽然 厉害, 但是 它 不可 解释。 对对对 吧? 你 怎么 解释 大 模型 到底为什么 会 具有 这种 能力, 或者说 你是 一个 高校学生, 你 想 学 这些 东西, 你 想 拿来 练练手, 那你 想 看一看 就是 开 这个 大 模型 到底 是 怎么 做出来 的。 在 这些 场景 下 我 觉得 有 它的 价值。 但 如果你 是一个 企业, 你 要 的 就是说 大 模型 能够 给我 带来 价值 上 的 增益。 你 只要 一 算账 就会 发现 开源 模型 是 没有 机会 的。
对, 但是 我看 百度 也是 用 的 公有 云 的 一个 方式, 对 吧? 所以 就是 百度 本身 大 模型 闭源 加 公有 云, 对 这样的 一个 一套 的 打法, 对 to b 的 客户 来说 你 有什么 考量 吗?
我 觉得 again 就是说 to b 的 客户 还是 说 他 要 选择 一个 模型 对他 来说 性价比 最好的。 一方面 这个 模型 要 对 它的 这个 应用 能够 产生 价值, 另外 一方面 就是说 成本 要 足够 的 低。 很多 时候 就是你 看着 有用 对 吧? 一算 这个 成本 不划算, 那么 客户 就 去 放弃 了。 这也是 为什么 我 刚才 讲 的 就是 开源 模型 打 不过 这个 闭源 模型。 就是你 只要 理性 的 去 看待 你的 收益 是 啥, 你的 成本 是 啥, 你 就会 发现 说 你 最好 还是 去 选择 这个 闭源 的 模型。
当然 闭源 模型 不是 一个 模型, 它是 一系列 的 模型, 根据 你的 使用 场景, 你 去 baLance 一下, 到底 要 多好 的 效果, 要 多 快 的 推理 速度, 要不 低 的 成本。 所以 那 门 新 模型 也 非常 多 的 这种 变种, 可以 根据 用户 的 需求 让让 他 来 选择。 而 这些 相对来说 规模 更 小的 模型, 都 是从 最大 最 powerful 的 模型 才 剪 出来。 这也是 我 觉得 开源 模型 不 具备 的 一个 优势。 当你 最 先进 的 模型 是 闭源 的 时候, 我 根据 这个 闭源 往 下去 裁剪, 裁剪 出来 一些 更 小规模 的 模型, 仍然 比 那些 同样 规模 的 开源 模型 效果 要 更好。
我们 也 看到 一些 参数 规模 比较 大 的 这种 开源 模型, 其实 这个 就 更 没有 道理 了, 对 吧? 当 规模 越大 的 时候, 你 会 发现 说 它的 这个 推理 速度 变得 更慢 了。 所以 如果你 要是 不在乎 这个 推理 速度 的话, 你 就 用 最 强大 的 地 源 模型, 那 它 效果 一定 是 更好 的。 而且 参数 规模 越大 意味着 什么?
意味着 对 算 力 的 消耗 也 越 大对, 也就是说 你 得 准备 更多 的 服务器 来 伺候 这个 大 模型。 其实 这 东西 是 根本 不划算 的, 越 往上走 越 应该 去 共享 这个 算 力, 这样 才能 算 过来 账。 所以 这就 这 我 觉得 大家 只要 是不是 在 那儿 坐而论道, 而是 真的 说 我 对 这个 模型 有 需求 的 时候, 你 就会 发现 这里 头 就 几乎 是一个 no brain, 你 不可能 去 选择 一个 开源。
所以 我们 开始 从 技术 问题 逐步 聊到 我们 财经 里面, 开始 谈钱 了。 我会 主动 说 他的 这个 用户 成本 问题。 确实 我想 用户 一开始 是 好奇, 但 最终 他 还是会 看 一个 我们 说 性价比。 但是 我们 现在 看到 就是 价格战 已经 开始 打 起来, 其实 还是 蛮 出乎 我们 意料。
这么 快 一年 多是 我们 看到 很多 闭源 大 模型 的 A P I 的 调用 的 费用 越来越低 了。 而且 很多 又有 开源 大 模型 可以 选。 所以 在 这么 一个 市场 的 这么 一个 商业 环境 之下, 我们 很 关注 百度 肯定 是 身在其中。 那大 模型 靠 推理 这样 收费 的 这种 商业模式, 他 未来 成立 不成立, 以后 我们 市场 再去 比拼 大 模型 的话, 会 比拼 哪些 点? 就是你 刚才 提到 了 可能 是 速度, 成本 等等等等。
你怎么看? 对, 这个 是 很 好的 问题。 说实话 我们 也 在 内部 不断 的 在 思考, 在 讨论 这个 问题。 价格战 是我 觉得 几乎 是 不可避免 的, 在 中国 互联网 干了 这么 长时间, 其实 已经 对 价格战 非常 熟悉 了。 但 就 像你 讲 的, 确实 他 来 的 比 我 想象 的 还要 更 早 一点, 就是 这么 早就 开始 把 这个 价格 打 到了 几乎 不可思议 的 这种 低 的 地步但。 我 觉得 某种意义上 讲 也 不是 坏事。 当你 足够 低 甚至 免费 的 时候, 就 会有 更多 的 人 来 有 积极性 来 尝试 在 大 模型 基础 上去 开发 各种各样 的 应用。 也就是说 大 模型 对于 各行各业 的 渗透 速度 会 更快。
刚才 你 问 的 实际上 就是说 是 那你 都 免费 了, 或者说 价格 足够 低 的话, 你 大 模型 公司 靠 什么 赚钱, 对 吧? 我是 这样 想 的, 就是 大 模型 这个 天花板 还是 很高 的 技术 的 天花板, 就是 今天 我们 还是 对于 大 模型 的 能力 有 很多 不 满意 的 地方。 我们 仍然 需要 很多 非常 优秀 的 技术人员, 需要 很多 的 算 力, 需要 很多很多 的 数据 才能够 训练 出来 下一代 的 这个 大 模型。 我们 还 可能 需要 下一代 的 大 模型, 下一代 的 这种 大 模型, 所以 最终 我 觉得 大家 是要 去 拼 谁的 技术 更好。 你的 技术 好, 你 为 客户 产生 了 更好 的 价值, 将来 你 还是 能够 收到 费 的。
今天 之所以 把 这个 模型 达到 足够 低, 是因为 现在 这个 模型 的 能力 其实 还没有 到 最好, 没有 到 最好的 时候, 大家 都 差不多 的 时候, 那行, 就 拼 价格 呗, 谁的 价格低 就 用 谁的。 时间长 了 之后, 市场 本身 会 回归 理性? 那 同样 的 效果, 就是 当我 的 成本 比 你 低 的 时候, 那你 打 价格战 你 肯定 打 不过 我。 对, 时间 久 了 之后 你你你 就 退出 了。 这个 最终 还是 说 谁的 技术 好, 谁的 效率高, 谁 会 胜出。
对对对, 刚才 Robin 说 这个 价格战 来 的 时间 比 你 想象 中要 早 很多, 也 比 我 想象 中要 早 很多。 对, 这个 才 一年半 的 时间 已经 开始 打 价格战 了。 对, 但 你 觉得 这个 价格战 会 持续 多久 的 一个 时间 呢? 然 我 可能 大家 有 一些 人 就 觉得 说 技术 不行, 我没有 水, 我要 退出 了, 可能 就 最后的 winner 会 浮现 出来。
这个 很难 讲, 现在 就是 有些 创业 公司 是 玩家, 但是 也有 很多 非常 大型 的 这种 互联网 平台 公司 是 玩家。 烧钱 的话, 其实 理论上 讲 是 可以 烧 很 长时间 的。 但 我 觉得 烧钱 不是 这个 事情 的 本质, 这个 事情 的本 本质 仍然 是谁 的 技术 更好, 谁的 效率 更高。 当 你的 技术 好 效率高 的 时候, 你 就 不怕 去 打 这个 价格战。 所以 多长时间 都 OK, 最终 它 会 是一个 优胜劣汰 的 这样的 过程。
即便 不是 技术 为 本质, 即便 当年 那个 共享 经济 烧钱 烧 到 最后 还是 要 走 经济规律, 走 市场规律, 是 一样的。 对, 尤其是 咱们 直接去 通过 我们的 质量 和 技术 提供 给 客户 做 服务 的 时候, 我们 觉得 也 确确实实 是 这么 一个 大 的 一个 规律。 对, 但 还有一个 很 前面 其实 你 已经 提到 一个 问题 我们 也很 关注。 就是 关于我们 说 这个 规模 和 能力, 对 大 模型 的 规模? 它的 能力 以前 大家 都 觉得 没问题, sky in 了 就 这个。 但是 最近 开始 不同 的 声音 出来 了, 确实 是 我看 很多 行业 也是 他 做 一些 小的 模型, 或者 是 做 一些 他 速度 更快, 效率 更高。 这个 第一性 原理 会不会 这么 快 又被 颠覆 掉?
你说 scaling law 这个 事儿? 我 觉得 是 这样的, 就是 scaling low 本身 可能 还 会有 若干年 的 生命周期, 但 与此同时 的话, 就是 在此 之上 会 叠加 出来 各种各样 的 创新。 刚才 讲 的 这个 智能 体, 它的 反思 的 能力, 它的 进化 的 能力 等等。 其实 跟 skin 已经 有点 低 couple 了, 它是 两个 路线 在 发展, 但是 它 仍然 是 基于 这个 transformer 这 类型 大 模型 在 再 往 上 再做。 那 未来 再 过 一两年 还会 出现 什么 新的 这种 技术创新, 在 此基础 上 再去 叠加。 我们 也 不知道, 就是 大家 都在 探索。 换句话说 我 觉得 skin in law 短期 之内 倒 不会 被 颠覆, 但是 在 skin law 之上 会 叠加 出来 很多很多 我们 现在 可能 还 无法 想象 的 创新。
对, 还有 就是 关于 这个 A G I 也是 众说纷纭 了。 我们 也 想听听 你的 观点, 就是说 人类 关于 这个 A G I 的 标准 问题, 各有 各 的 说法 对 吧? 有时候 图灵, 有时候 啥 的, 你说过 好像 距离 这个 A G 还有 10年 的 美国 在 未来 tex 这个 会议 上面 还有 十年的 时间。 到底 你 个人 认为 这个 A G I 实现 的 标准 是什么? 还有 哪些 路径 可以 让 我们 更快 的 去 通向 A G I?
对, 这个 确实 业界 我 觉得 没有 一个 标准答案。 就是 在 我 心目 当中, 以前 大家 觉得 说 通过 图灵测试 就 实现 一件, 实际上 现在 大 模型 已经 通过 了 图灵测试。 但是 人们 所说 的 这个 A G I 其实 大多数 时候 已经 不是 指的 通过 图灵测试。 那么 什么 叫 A G I? 就是 在 我的 这个 心目 当中, A G I 就是说 是 机器, 或者说 A I 他 能够 具备 人 在 任何 场景 下, 任何 场 所 具备 的 能力, 就是 journal in 钛 的 人 是 通用 的对, 我不管 在 什么 场景, 我的 能力 都是 跟 人是 一样的, 这 是一个 很高 的 要求。 其实 今天 你看 像 我们 做 这个 无人驾驶, 做了 有 11年 的 时间 了, 仍然 不能说 这个 技术 成熟。 这是 还是 一个 专用 场景 对 吧? A I 都 做不到, 对。
非常 的 成熟。
小概率事件 对你 你 不能 容错 的话, 那 这个 就 不行了, 所以 就是说 真正 要 实现 A G, 我 认为 确实 是 还需要 很多很多年。 但是 业界 有人说, 以前 可能 再 过 两年 就 实现 了, 或者 再 过 五年 什么的 都 有啊。 但是 我自己 的 判断 是 十年 以上。 对, 也许 十年, 也许 20年, 也许 更长 的 时间。
但 我们 听到 很多人 在 讲 这个 A G I 是一种 信仰, 当你 把 它 当做 一种 信仰 的 时候, 谁的 信仰 会 明年 就 实现 了? 这是 自相矛盾 的对 吧? 如果 是一个 信仰, 它 就是你 值得 为之 长期 奋斗 的 这么 一个 目标。 对, 啥 叫 长期 呢? 那你 如果 连 十年 都 没有 的话。
容易 了 就 不 叫 信仰。
那你 不能 把 它 叫做 信仰。 所以 我 觉得 还是 一个 很 有意思 的 问题, 就是 值得 大家 不断 去 探讨。
也 让人 兴奋, 每天 都 可以 去 关注 他的 一个 飞速 的 发展。 没错。
是是是 将 一生 都 奉献 在 这个 上 面对 我 再加 一个 刚才 那个 加 的 问题, 就是 再 回到 A G I 的 事情 上面, 你 觉得 在 中国市场 会 是一个 winner takes all 的 这样的 一个 局面 吗? 还是 说 等 价格战 之后 会 剩下 几个 主要 的 player, 可能 还有 一些 更 小 一点 的 player, 这样的 一个 landscape。
我是 这样 想 的, 其实 就是 这次 声称 是 A I, 它是 对于 整个 I T 技术 站 的 一个 大 的 变革。 我们 一般 觉得 认为 就是 过去 的 I T 技术 栈, 就是说 芯片 层、 操作系统 层、 应用层 或者 软件 层, 就 这 三层 对 吧? 那么 到 这个 生成 的 A I 之后, 我们 认为 这个 I T 的 技术 栈 变成 了 四层。 芯片 层、 框架 层、 深度 学习 框架, 然后 是 模型 层, 然后 是 应用层。
我 认为 就是 在 每 一层 可能 都会 诞生 至少 2到3个 大 的 这种 玩家。 那 到 这个 应用层 的话, 就会 刚才 讲 的 可能 数以百万计 甚至 数以千万计 的 各种各样 的 应用 都会 出来, 也会 逐步 的 出现 超级 应用。 应用 当然 就是 by definition 超级 应用 它 就是 不会 很多, 就 可能 是 三五个 之类 的。 模型 层 我 觉得 也许 两三个 就 足够 了。 因为 最后 还是 大家 比拼 的 是 效率。 你的 效率 如果 不够 高 的话, 慢慢 就 觉得 说 还 不如 用 别人 的 去 在 这 之上 再去 开发 更多 的 应用 是 更 划算 的。 所以 它 在 每 一层 其实 都有 机会, 但是 就是 不同 的 层面, 它的 这种 发展 规律, 需要 的 这种 expertise 什么 都 不太 一样。
然后 再 回到 一个 scaling law 的 一个 问题, 现在 大家 其实 都在 等 GPT five, 但是 就 一直 在 延后, 所以 我在 周围 听到 的 担忧 的 声音 也是 越来越高, 就 怕 说 比如说 就是 5到10万 亿 这样的 参数 加上 去, 但是 最后 大家 发现 说 它的 效果 并没有 这个 月 升 这么 多。 那 是不是 会 打击 一些 人们 对 scaling law 跟 A G I 的 信仰。 就是说 可能 我们的 A G I 没有 办法 用 scaling law 的 这个 方式 去 带 我们 去 实现 了。 你 对 这个 有 担忧 吗?
我不是 很 担心 这件 事情, 我 觉得 大家 应该 更 关注 应用, 而 不是 关注 基础 模型。 某种意义上 讲 就是 基础 模型 迭代 速度 稍微 放缓 一点 不是 坏事。 就是说 今天 的 这些 应用 的 开发者, 他 有一个 相对 稳定 的 base 来来 开发 这个 应用 的话 其实 是 效率 更高 一些 的。 如果 模型 天天 在 那儿 变, 它 不 每天 都要 重写 一遍, 就是 过去 的这 这个 代码, 那是 很 累 的。 但是 是在 现有 基础 模型 的 这个 基础 上去 不断 的 去做 微调, 去做 一些 渐进式 的 这种 迭代 和和 创新。 其实 你 看到 它是 一直 在 发生 的, 无论是 open 尼亚 不断 在 推 4V4O 什么 这些 东西, 还是 百度 我们的 这个 turbo 模型, 我们的 小 量级 的 模型, 可能 都 是在 根据 市场 的 需求 在 做 这种 迭代。 但是 长远 来讲, 我 确实 认为 下一代 的 这个 大 模型 一定 会 比 现在 这 一代 最强 的 大 模型 要 强大 的 多。 那么 什么时候 推出 来, 我不是 很着急, 就是 觉得 说 我们 应该 更多 的 sit back 去 看一下 真实的 市场需求 是 啥, 我们 下一代 模型 在 迭代 的 时候, 要 根据 这个 市场需求 来 迭代 这个 模型。
如果我们 认为 AGI10年 都 达不到, 也就是说 下一代 模型 离 A G I 其实 还有 很远 的 距离。 也就是说 他 有 他 擅长 的, 还有 他 不 擅长 的 地方。 如果 他 擅长 的 恰好 不是 市场需求 的那 这个 意义 是 不大 的对 吧? 如果 他 就 不 擅长 的 恰好 是 市场需求 的那 我们 去 浪费 了 很多 资源 去做 一些 不该 做 的 事情。
这也是 为什么 我 更 关注 应用。 我 想知道 就是 市场上 因为 市场上 要求 的 是 说 O K 我是一个 销售, 我是 比如说 一个 卖 车 的 销售, 我 用 什么样 的话 术 能够 丰富 经典 的 这个人 解决问题, 买 我的 车。 而 不是说 我怎么能够 考 过 高中数学 的 这个 高考? 你 考 过 高中数学 又 怎么样?
你 还是 要 成为 一个 销售, 去 说服 客服 客户 买车。
就是 这种 市场需求 当 不是 很 清楚 的 时候, 拼命 往前 跑, 去做 一个 名义上 的 更更 强大 的 模型, 其实 很有可能 是 会 走弯路, 是 浪费资源 的。
对我 也 非常 同意。 那你 觉得 接下来 大家 在 卷 应用 之余, 会不会 开始 卷 一些 中小 模型? 比如说 在 国际 上, 比如说 miss tro 这样的 中小 模型 也是 受 很多 开发者 欢迎 的那 接下来 你 觉得 比如说 百度 在 对于 中小 模型 上, 还有 一些 模型 蒸馏 上 有 什么样 的 策划 吗?
一些 计划 吗? 会 我 觉得 就是 我们 看到 的 真实 需 确实 在 绝大多数 情况 下都 不是 最大 的 模型, 它 都 要求 这个 模型 变小, 变小 意味着 什么? 速度快, 成本低 对 吧? 就是 当 他 比如说 我 干 这个 事儿, 总共 能够 给我 带来 每年 100万的 增益, 我 一算 说 最大 的 模型 要 120万 的 成本, 那 我 肯定 不干 了, 对 吧? 那 我 提 我给你 这个 大 模型 公司 提 的 要求, 就是说 你 能把 成本 给我 降到 80万, 甚至 降到 8万对 吧? 那 我们 就得 想说 我 怎么 把 我 最 强大 的 模型 蒸馏 到 这个 足够 小, 也就是说 足够 成本低 的 时候, 仍然 能够 满足 你 这个 场景 的 需求。
我 觉得 这方面 闭源 模型 仍然 有 优势, 因为 必然 有 最 强大 的 基础 模型。 它 根据 这个 模型 蒸馏 或者 裁剪 出来 的 这种 小 模型, 比 那些 开源 模型, 不管 是用 更大 的 开源 模型 来 蒸馏 还是 怎么样。 他 毕竟 就是说 你 那个 基础 没有 人家 那个 基础 好的 时候, 你 做出来 的 东西 他 还是 在 竞争力 上 会有 这个 劣势。 所以 这方面 我们 看到 真实的 需求 确实 是 非常 多 的, 我们 也 觉得 这方面 的 机会 仍然 在边缘 不再 开。
非常感谢 若冰, 我们 这个 演播室 对面 就是 徐汇 滨江, 非常 漂亮。 告诉 大家 一个 很 让人 开心 的 消息, 马上会 建成 一条 缆车 的 这个 索道 横跨 长江 两岸, 所以 我们 也 期待 以 百度 为 代表 的 这样 优秀 公司, 早日 为 我们 建成 人类 通向 未来 的 A I 桥梁。 谢谢。
好啊, 我们 努力, 谢谢。