We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S3E93|ChatGPT替代谷歌搜索?不,是降维打击|AIGC特辑

S3E93|ChatGPT替代谷歌搜索?不,是降维打击|AIGC特辑

2022/12/16
logo of podcast 硅谷101

硅谷101

AI Deep Dive AI Chapters Transcript
People
余家辉
泓君
陶芳波
Topics
余家辉认为ChatGPT在Linux模拟、角色扮演、创造性和实用性方面表现出色,并对长对话和上下文理解能力的提升进行了分析。他详细解释了人工标注和强化学习在提升模型性能方面的作用,并指出了ChatGPT中庸的回答是模型刻意为之的结果。 陶芳波则从AI从业者的角度对ChatGPT的惊艳表现给予高度评价,认为其通用性强,能够解决广泛的问题,并以规范的方式生成和迭代代码,具有成为未来数字世界基础设施的潜力。他深入分析了人工标注在强化学习中的作用,以及如何通过奖励模型引导模型输出符合预期的答案。 泓君作为主持人,引导嘉宾就ChatGPT与GPT-3、Siri等其他模型的差异,以及ChatGPT对程序员、谷歌搜索引擎等的影响进行了深入探讨,并对ChatGPT的未来发展趋势进行了展望。

Deep Dive

Chapters
Initial reactions from AI researchers to ChatGPT, highlighting its surprising capabilities and advancements over GPT-3. Discussion includes its ability to generate and improve code, and the implications for programmers.
  • ChatGPT's performance surprised even seasoned AI experts.
  • Key improvements over GPT-3 include a refined feedback function and human labeling.
  • ChatGPT demonstrates enhanced abilities in complex conversations, creative tasks, and code generation.

Shownotes Transcript

欢迎 收听 硅谷 101, 这是 一档 分享 当下 最 新鲜 的 技术 知识 与 思想 的 科技 博客。 我是 红军, 这 期 我们 继续 来 AIGC 特辑 的 第四期。 前 三集 的 话题 其实 我们 主要 还是 集中 在 A I 生成 图片。 最近 关注 这个 领域 的 小伙伴 应该 都 注意 到了, OpenAI 放出 了 一个 新的 聊天机器人, 叫做 ChatGPT。

网上 也 流传 着 各种各样 GPT 的 对话。 比如说 可以 让 他 去 帮你 写 小说, 或者 算 加减乘除, 又 或者 是 写 代码, 写 智能 合约。 那 我看 还有 人 去 用 ChatGPT 来 纠正 英文 语法。 比如说 最近 我自己 在 做 播客 的 时候, ChatGPT 已经 开始 帮 我 去 写 修 notes 了。 比如说 之前 我 做 的 一期 节目 需要 解释一下 一个 比特币 的 信托 产品 gbt c ChatGPT 很 好的 帮 我 回答 了 这个 问。 所以 我 当时 是 觉得, 他的 回答 会 比 谷歌 更 快速, 更 完整。 网上 其实 现在 也有 这样 一种 观点, 就是说 ChatGPT 它 会不会 替代 谷歌 搜索, 我们 也会 详细 的 讨论一下。 那 这 期 我们 也请 到了 两位 可以 说是 行业 顶级 的 研究员 来 跟 我们 分享, 欢迎 A I 研究员 余家辉。 Hello 家 辉 你好。

hello 主持人 好, 听众 朋友们 好。

家 辉 算是 硅谷 在 这个 领域 非常 核心 的 研究者, 他 今天 的 观点 仅 代表 个人, 不 代表 公司。 还有 一位 是 星矢 宇宙 mad words 的 创始人 陶 芳 波。 方波 在 创业 之前 是 facebook research 的 高级 研究 科学家。

Hello 方波 你好, hello 主持人 好, 大家好。

两位 家 辉 跟 方波 你们 有 一直 在 做 A I 方向 的 前沿 研究, 看到 ChatGPT 你们的 第一感觉 是 怎么样 的? 你 觉得 是 经验 还是 没有想象 中 好?

我 第一次 看到 ChatGPT 是 某天 早上 收到 一个 email O N I 推送 过来 说 release 了 这个 ChatGPT。 一开始 没有 特别 惊讶, 因为 O N I 在 语言 生成 模型 上 已经 耕耘 了 很多年。 往 dialog 的 方案 上 做, 我 觉得 也是 一个 非常 matured 的 这种 步骤。 因为 这个 之后, 后面 逐渐 的 才 看到 说 一些 数学 media 上 他们的 一些 结果, 一些 对话。 才 开始 意识到 整个 ChatGPT 的 给 人的 感觉 还是 非常 不一样。

我 印象 比较 深刻 的 一些 例子 是 说, 一个 是 还能 做 一些 linux 的 simulation, 可以 告诉他 你 现在 是一个 linux system。 我 现在 告诉你 一条 指令, 你可以 给我 秀 一些 linux 应该 有的 结果, 然后 他 也能 做 这种 事情。 另外 的 一些 方面 包括 长 的 对话, 包括 characteristic ChatGPT 这个 模型 本身 它 有 一些 有点像 角色扮演, 就是 你可以 通过 这种 去 告诉他 应该 扮演 什么样 的 角色, 他的 回答 也是 比较 respect 你的 输入。 另外 还有 一些 比如说 他 更加 的 creative 一些, 在 我们 看到 的 一些 例子 上来, 最后 还有 更 useful 一些。

方波 的 印象 是 怎么样 的?

我的 印象 对 chat P T 的 感受 和 很多 可能 对于 A I 没有 那么 了解 的 人 其实 是 一样的。 我 觉得 ChatGPT 这次 的 表现 对于 哪怕 是在 A I 做了 超过 十年的 人 而言, 也是 非常 惊艳 的。 大 模型 的 能力, 它的 通用性 大家 都很 了解, 尤其是 两年 前 GPT three 出来 之后。 他 今天 把 它 调制 到 一个 真正 可以 解决 非常 广泛 的 问题, 而且 是以 一种 非常 规范 的 方式 来解决。 同时 除了 解决 自然语言 的 问题, 还 可以 生成 代码, 并且 是 迭代 式 的 去 改造 自我 的 代码。 这样的 方式 将来 ChatGPT 可能成为 数字世界 的 一个 通用 的 接口。 让人 可以 通过 它 来 改造 数字世界, 来 使用 数字世界。 这个 是我 看到 的 一个 巨大 的 成为 未来 的 基础设施 的 一个 潜力。 所以 我 觉得 它的 出现 进一步 的 拓宽 了 大家 对于 大 模型 能 做到 的 一个 能力 的 边界 和 对它 在 商业 上 的 一个 想象力。 这个 我 比较 兴奋 的 一个点。

我 觉得 刚刚 你 提到 的 它 能够 生成 代码, 还有 改善 代码 这块 儿, 待会儿 后面 我们 还会 详细 的 聊。 其实我 也 挺 关心, 比如说 像 ChatGPT, 它 到底 会不会 让 程序员 失业 的。 而且 它的 GPT 不仅仅是 它, 包括 谷歌 的 阿尔法 code, 它 也是 表现 的 很 惊艳。 待会儿 我们 可以 详细 聊。

在此之前 其实我 有一个 问题, 大概 在 两年 多 以前, GPT3 刚刚 出来 的 时候, 我们的 播客 专门 聊 了 一期 关于 GPT3。 当时 他的 表现 其实 是 续写 的 能力。 就 比如说 给他 一个 新闻 的 前面 一段话, 让 他 把 一篇 新闻 续写 完, 他 会 去 写 的 非常 像 人类 写 的 一篇 小作文。 我们 很难 去 判断 这个 是 机器 写 的 还是 人 写 的那 这次 ChatGPT 它 跟 GPT3 它的 技术 上 的 一些 提高 跟 区别 在哪里? 我 有 问 他 一些 稍微 刁钻 一点 的 问题, 他 给 我的 回答我 感觉 都 非常 的 中庸。 这种 中庸 指的 是 正面 一点点, 反面 一点点, 非常 像 一个 八股文。 或者说 他的 很多 文章, 如果 从 我们 写文章 的 人 来看, 就 非常 像 一种 官 宣 的 文章, 或者 有一点 马屁 文章 这样的 感觉。 所以 还是 想 从技术上 知道 它 跟 GPT3 的 区别 到底 在哪里。

我 觉得 官 宣 的 文章 它 也是 一种 能力, 对 吧? 其实 他们 做了 一些 这种 人工 标注, 我 才可能 在 做 的 过程中 也会 筛选 出 那些 不要 过于 极端化 的, 然后 不要 过于 aggressive 的 这种 味道。 等 那些 消失掉 之后, 所以 给你的 一个 主观 的 感觉 是 说, 好像 很 中庸, 然后 好像 没有 什么 鲜明 的 观点 在 他的 response 里面。 我 觉得 可能 他 也是 一种 相当于 人 想 让 他 成为 这样 一个 方式。

就是 人 有 对他 调教 过。

对, 刚才 都 问 到 的 问题是 说 技术 上 有 哪些 提高 和 区别, 对 吧? 对, 就 chat G P 它 本身 还是 基于 GPT3, 或者 是 更 是不是 有一个 GPT3.5 这样的 一个 模型。 3.5 的话 我的 理解 是 说 跟 原来的 GPT3 的 那个 相当于 那个 配 是用 了 一些 新的 数据, 这个 应该 是从 O N I 的 blog 上 有 说是 2022年 年初 的 时候 finish training, 在 GPT3点5分 的这 基础上 再去 做了 一些 主人公 的 标注 调教 和 这种 所谓 的 叫做 I O H F, 就是 reinforce learning。 当 这种 human feedback k 的 方式 使得 这个 模型 能 更加 的 输出, 就是说 人 想要的, 就是 人 想 看到 的 这种 答案。 而 不是说 简单 的 去 follow 一些 pattern, 或者说 简单 的 像 这种 互联网 上 没有 筛选 过 的 这种 文字 一样。

所以 我 觉得 他 中庸 的那 一部分, 其实 是 模型 故意 这样 调 的。 然后 他 想 让 我 看到 这样的 一个 答案。

我 觉得 跟 你 问 的 问题 也有 关系。 你 特别 想知道 他的 某些 观点, 他 反而 就 不 想告诉你 了。 我所 看到 的 绝大多数 问题, 他的 回答 的 结果 都 还是 不错, 比较 surprising。 比如说 像是 当你 问 的 对话 的 motto m 当 它 变 长 的 时候, 他 还是 能 去 比较 好的 理解 到 前面 说 了 什么, 前面 有 什么样 的 context。 这些 我 觉得 在 一定程度 上 是 比较 新的 能 看到 的 一些 能力。

什么 叫 人工 标注? 能 跟 大家 解释一下 吗?

我 简单 补充 一下 家 辉 的 观点, 家 辉 刚才 提到 一个 概念 叫 reinforcement learning with human feedback。 我 觉得 你说的 那 一点 是 对的。 我 觉得 他的 中庸, 包括 他 不愿意 去 表达 观点 是 刻意 为之。 因为 ChatGPT 跟 GPT3 包括 GPT3.5有 一个 很大 的 不同, 就是 他 尝试 把 强化 学习 引入 其中。 强化 学习 本质 上 是要 有一个 反馈 函数 的, 在 这个 反馈 函数 的 制定 当中, 它 加入 了 很多 OpenAI。 对于 一个 聊天 任务型 机器人, 它 应该 具有 的 一些 特点。 比方说 它 应该 很 安全, 他的 表达 应该 比较 标准, 不要 太 跳脱, 不要 去 随意 的 评论 别的 观点。

我 认为 他在 设计 这个 reward model 的 时候, 就 已经 把 这样的 一些 buyers, 一些 偏执 能够 嵌入 到 其中 了。 所以 这个 就是你 刚才 提 的 人工 标注。 因为 我们 以前 在 说 大 模型 的 训练 的 时候, 往往 说的是 用 微调 的 方法, fine tune 方法, 用 新的 大 模型 的 文本 数据 去 让 这个 大 模型 学会 新的 说法。 而 他 是 相当于 构造 了 一个 类似 于 判定 的 老师, 这个 老师 他的 判定 是 有 一些 标准 的。 然后 他 不断 的 去 告诉 那个 老师, 不断 的 跟 他 去来 调整 自己的 行为 模式, 说话的 方式, 使得 他 最终 能够 符合 这个 老师 的 标准。 这 我 觉得 是一个 比较 有意思 的 创新。 然后 使得 他 目前 的 表现, 无论 从 内容 的 扎实 度, 回答 的 有效性, 还有 整个 像 你说的 说话的 方式 比较 中庸, 都会 受到 reward model 的 影响。 这就是 人工 标注 的 一种 全新 的 使用 方式。 这是 给 很多 做大 模型 训练 的 人 打开 了 一个 新的 空间 和 一个 新的 可能性。

这个 人工 标注 是不是 指 比如说 我 来 问 他 一些 问题, 然后 当 大家 回答 的 时候, 你来 告诉他 哪 一种 回答 是 最好的。

它 有 两种 标注 方法。 第一种 标注 方法 是 直接 让 真人 去 写 答案, 然后 直接 喂给 他, 让 他 去 学会 说 当 这样的 问题 的 时候, 真人 应该 怎么 来 回答。 这个 有点 像是 中国 的 那种 填鸭式 教育, 就是 让 你 去 背, 背 的 过程 当中 让 你 学会 怎么 去 回答问题。 另外 一种 就是你 刚才 提到 的, 我 去 训练 一个 判断 的 模型。 判断 的 模型 会说 你 给我 这 三个 答案 里面, 哪一个 答案 是我 最想要的。 然后 把 这个 模型 训练 好了 之后, ChatGPT 就可以 不断 地 产生 新的 答案。 针对 不同 的 问题, 然后 这个 判断 的 模型 会 不断 的 给他 反馈, 说 我 到底 想要 哪个 答案。 他 最后 不断 的 调整 自己, 使得 他 适合 最终 他 想要 展现 的 那种 判断 的 方法。

我 觉得 训练 A I 的 方法 还 挺 有意思 的, 跟 训练 小朋友 也是 有 一点点 像 的。 方波 我们 之前 有 聊到, 他 之前 在 大概 三月份 的 时候 发 了 一个 GPT3 之后 发 了 一个 InstructGPT 的 一个 论文。

ChatGPT 就像 家 辉 刚才 讲 的, 因为 它 背后 还是 基于 GPT 来 训练 的, 尤其是 基于 GPT3.5 来 训练 的。 GPT3.5 你可以 理解 为是 比 GPT3。 又 加入 了 代码 的 能力。 所以 他 会 用 所有的 互联网 上 的 文本 数据, 加上 他 找到 的 所有的 代码 的 数据, 一块 来 训练 它。 所以 它 本身 的 这个 模型 里面 已经 拥有 了 几乎 全部 的 常识。 就是 所有的 大 模型, 首先 它 训练 好 之后 就 已经 拥有 常识 了。 而 ChatGPT 包括 InstructGPT 我的 是 说 我 到底 怎样 构造 一种 理解 的 方式, 让 chatbot 可以 更好 的 去 使用 这些 常识, 理解 这些 常识, 然后 真的 能 变成 服务 到 用户。 但 它的 这个 训练, 哪怕 它的 微调 的 部分 数据量 很少, 也不 影响 它 背后 的 知识。

这是 无穷大 的。 你可以 理解 为 InstructGPT 相当于 提供 一种 方法, 比较 确定 是 这种 方法 是 被 用到 了。 刚才 方波 也 提到 相当于 三步走, 就 第一步 是 生成 性 的 去做 一些 标注, 比如说 给你 一些 问题, 然后 人工 去 给 一些 答案。 第二步, 就是 这种 判别式 的 给 一些 标注。 就是说 现在 我 机器 或者说 这个 大 模型 给你 一些 答案, 然后 人 来 判断 哪个 好 哪个 差, 整个 方法 应该 是 不变。 但是 这 具体 上 对于 每一个 步骤, 比如说 做 生成 性 的 这种 标注, 大概 有了 多少 人工 人力, 多少 的 数据量, 这个 其实 都还不 知道。

相比之下, 最后 用来 做 人工 标注 的 部分, 比起 他 一开始 的 训练 数据 肯定 是 少 得多 的。 因为 一开始 的 数据 是非 标注 的, 它 可以 拿 互联网 上 所有的 数据, 你可以 理解 为 几十亿 的 人类 在 过去 几十年 积累 的 文本 数据 来 训练 它。 而 他 自己 在 ChatGPT 公开的 一个 介绍 里面 会说, 他 大概 用了 一个 40人左右 的 标注 团队 来完成 对 他的 数据 的 达标 和 微调。 所以 40个人的 数据 相比 于 整个 人类 社会 的 互联网 数据 再 多, 也 只是 九牛一毛 而已。 这个 是 比较 有意思 的 一个点, 就是 在 不成比例 的 数据 情况下, 还是 可以 给他 带来 很大 的 性能 上 的 变化。 我 觉得 这个 是 ChatGPT 这次 给 我们 展示 的 一个 很 有意思 的 地方。

我 接下来 问 一个 特别 小白 的 问题。 我 觉得 可能 不是 很 了解 聊天机器人 的 人 会 关心 ChatGPT 跟 苹果 的 siri 有什么 不一样。

从 我的 角度 来讲, ChatGPT 的 优势 是 在于 它 有一个 无线 的 开放 域, 它 可以在 一种 通用 的 描述 下去 完成 通用 的 任务。 这个 是 它 相比 于 传统 的 聊天机器人, 比方说 C I 比方说 我们 知道 的 alexa 甚至 包括 天猫 精灵 这样的 工作 的 一个 特点。 原因 是因为 它 背后 的 这个 大 模型 在 做 的 足够 大 之后, 它 就 具有 了 某种 叫 in context learning, 就是 一种 通用性 的 解决问题 的 能力 了。 并且 可以 使用 底下 的 整个 通用 的 互联网 的 常识 来解决。

传统 的 聊天机器人 因为 已经 存在 很久 了, 它 并不是 一个 新的 概念。 它们 往往 有 几个 特点, 就是 它 首先 是 垂直 的, 它 可能 只能 解决 一个 行业 的 问题。 第二, 他 可能 需要 为 一个 行业 特定 的 问题 去做 专门 的 训练。 比方说 我需要 去 先 训练 一个 分类 模型 来 理解 一个 用户 这 句 话 的 意图, 然后 再 把 它 导 到 一个 合适 的 处理 模块 里面。 所以 它的 整个 部署 的 成本 和 它的 使用 的 通用性 会 比 ChatGPT 这种 要 少 很多。

但是 它 也有 它的 优势, 就是 今天 ChatGPT 你 虽然 你 看到 了, 比如说 你 刚才 提到 了 一个 他 比较 中庸 目前 的 一个 小 缺点, 但 其实 他 还有 一些 更大 的 缺点。 我们 也 发现 由于 它 依赖 的 是 背后 的 常识, 而 没有 办法 使用 真正 的 公开的 数据 去 验证 它的 正确性。 所以 有的 时候 会 经常 说 一些 错误 的 事实。 比方说 如果你 问 他 为什么 C P U 会 比 G P U 更快, 更 有利于 去做 A I 的 推理? 他 会说 是的, 我 认为 C P U 会 比 G P U 更快。 因为 什么什么? 就是 它 会 顺着 你 的话 说, 然后 编造 一个 他 觉得 合理 的 逻辑, 但 事实上 这个 事实 本身 就是 错误 的, 所以 他 会 出现 一些 这样的 问题, 他 没有 办法 把 外部 的 信息 融合 进来。 同时 他 今天 可能 也没有 办法 把 外部 的 技能 给 融合 起来。

因为 聊天机器人 本质 并 不完全 只是 为了 对话, 而是 希望 通过 对话 来完成 某种 服务。 这个 过程 当中 他 可能 需要 可以 更好 的 去 融入 外部 的 信息 来做, 这个 是 聊天机器人 做 的 比较 好的。 所以 我 其实 看到 的 一个 趋势 是 可以 把 这 两个 东西 未来 结合 的 更好 一些。 既 能够 有 这种 开放 域 的 通用 问题 的 处理 能力 的 同时, 又 可以 对 这种 事实性 的 或者 专业 技能型 的 东西 有 更好 的 融入。

我 觉得 方波 的 总结 是 非常 到位 的。 Summary 一下, 第一 是 ChatGPT, 它是 基于 大 语言 模型 的。 然后 苹果 S I R I 或者 其他 聊天机器人, 可能 绝大多数 上 还是 基于 这种 search based 这种 rule based。 这里 也 不好 说 谁 好 谁 坏, 因为 有 很大 的 effort 是在 说, 是不是 用 这种 大 的 语言 模型 来 替代 这种 聊天机器人, 或者说 作为 里面 的 一个 相当于 backbone 的 这种 角色。 在这里 要 解决 的 问题 也是 像 方波 所 提到 的, 是不是 足够 的 准确, 是不是 尊重。

其实 是 有 能够 看到 这些 例子。 ChatGPT release 之后 可能 就 不到 1到2天, 就 一个 叫 plexi A I 的 这么 一个。 其实 ChatGPT 加上 微软 的 beam search, 它 能 做 的 一个 事情 就是 它 能 provide 一些 seat, 就 相当于 你 所 得到 的 结论 有迹可循。 这 样子 其实 是 作为 聊天机器人, 或者说 真正 的 去 商业化 这些 chatbot 的 时候 必不可少 的 一些 能力。

官方 博 你 还 提到 了 一个 觉得 就是 像 GPT3.5 跟 ChatGPT 他们 都有 生成 代码, 包括 改善 代码 的 能力。 我看见 最近 就 不仅仅是 ChatGPT, 其实 还有 谷歌 的 阿尔法。 它是 连续 登上 了 最好的 两本 科学杂志。 一本 是 科学杂志, 一本 是 自然 杂志。

像 阿尔法 扣 的, 它 已经 在 一个 国际 的 编程 大赛 中 大概是 达到 了 1238分。 这个 意味着 什么 呢? 就是说 他在 人类 的 参与者 中 排名 有 占 到 54.3%就 相当于 他是 一个 人类 中等偏上 的 一个 程序员 的 水平 了。 自然 杂志 就 更 直接 了, 用 的 标题 就是说 未来 像 ChatGPT 跟 阿尔法 code, 他们 会不会 取代 程序员。 你们 怎么看 这个 问题? 你 觉得 他 会 取代 程序员 吗?

首先 可能 一个 quickly 的 answer, 我 觉得 取代 程序员 现在 来看 还是 有点 早。 这个 原因 是什么 呢? 就是我 能 想象 的 这种 不管 是 ChatGPT 或者说 像是 阿尔法 code, 很多 时候 它 能 帮 已有 的 程序员 去 优化 一些 现有 的 步骤。 比如说 我们 平时 写 code 也是 说 有人 写, 也 有人 看看 他 写 的 到底 是不是 对。 那 有可能 在 这个 过程, 比如说 像 阿尔法 code 或者说 GPT3.5, 它 能 写 一部分 的 code, 然后 人 可以 来做 review, 这种 是 可以, 但 这个 并不 意味着 说 它 能 取代 程序员。 如果 是 说 完全 取代 程序员, 他 自己 在那边 跑, 自己 在那边 看我 觉得 这个 可能 会 带来 在 一些 比如说 整个 system 是不是 足够 鲁棒, 是不是 会 出现 一些 bug.

是不是 会 把 整个 system 斜挎, 是吗?

对, 斜挎 那些 瘫痪 的 时候, 其实 你 也 不知道 怎么 处理 bug。 因为 目前 还没有 看到 说 还能 很 专业 的 去 找 一个 问题 去 debug。 最后 他 如果 还是 人 来 debug 的话, 你 可能 一下子 也 找不到 他 写 的 code 里面 哪里 有问题。

你 觉得 比如说 它 取代 一个 初级 一点 的 程序员, 他 把 代码 都 写 好, 然后 你 大概 review 一遍 就可以 放上去 了。 假设 一天, 比如说 以前 解决 一个 问题, 现在 一天 因为 有了 ChatGPT 跟 阿尔法 code 的 帮助, 一天 可以 解决 十个 问题。

我 觉得 这个 也 比较 难, 原因 是在 整个 engineering 里面, 其实 它 写 code 并不是 简简单单 写 一些 代码 片段, 更多 的 是 整个 system 怎么 去 design。 目前 来看, 其实 是 还没有 看到 这种 大规模 程序 去 的 这种 能力。 对于 你 刚才 说 的 能不能 取代 这种 初级程序员, 我的 看法 也是 这 样子。 就是说 任何 一个 程序员 他 都是 通过 初级 慢慢 开始 去去 那个, 所以 他 一定 会有 这样 一个 过程。 就是说 初级程序员 还是 需要 自己 去 写 一些 code, 自己 去 理解, 然后 同时 也 去做 一些 review。 可以 是 说 review 一些 机器 写 的 code, 也可以 review 一些 人 写 的 code, 相当于 还是 一个 学习 的 一个 过程。

对我说 一个 比较 有意思 的 事情, 就是 ChatGPT 出来 大概 十天 的 时间, 我是 对他 还是 比较 乐观 的。 但是 我 同意 家 辉 讲 的, 就是 对于 真正 的 复杂 的 系统 架构 的 设计, 包括 整个 代码 结构 的 一些些 设计。 可能 这个 在 真人, 无论是 初级程序员 还是 高级 程序员, 对于 他的 理解能力 都 还是会 比 ChatGPT 更强 的。 但 其实我 已经 可以 看到 ChatGPT 可以 提升 效率 的 一点 了。 所以 从 12月 开始, 我们 公司 已经 在 推行 一个 engineering 去 探索 一下 ChatGPT 到底 怎么样 能够 引入 到 我们的 整个 开发 流程 当中。 然后 来 看看 它 到底 在 哪些 功能 的 模块, 哪些 pipeline 的 环节 可以 来 提升 我们 对于 开发 的 效率。

我 觉得 因为 ChatGPT 它的 代码 训练 有 很大 的 一个 原因 是 来自于 跟 比方说 stack overflow 这样的 一些 代码 问答 的 网站 的 数据 来进行 训练 的。 所以 我们会 发现 他 做 简单 的 任务 其实 做 的 还 蛮 好。 包括 一种 新的 语言 里面 某个 库 应该 怎么 去 使用。 那 以前 我们 可能 要 查 很多 post 才 可以 总结 出来, 它 可以 直接 根据 你的 大概 的 需求 直接 帮你 写 好。 这个 方面 我 觉得 肯定 是 可以 提 效 的。 但是 如果 最后 所有的 程序员 都 依赖于 现在 这个 版本 的 ChatGPT 去做, 他 对于 系统 的 稳定性 和 鲁棒性 还是。

有 很大 的 挑战。 我 看到 之前 像 ChatGPT 的 母公司 OpenAI, 因为 微软 有 给 他们 投资, 所以 他们 跟 微软 有 合作 一个 编程 的 项目 copilot。 我是 看见 有人 他 去 起诉 OpenAI, 大概 他的 程序 可能 是 超 了 github 上 的 一些, 就 比如说 开源 的 程序库 或者 什么, 我不知道 会不会有 这种 代码 版权 不明 的 问题。 因为 我们 前 几期 其实 去 聊 这个 生成式 AI 在 图片 方面 的 表现 的 时候, 有 很多 的 艺术家 他们 其实 是 不太 敢 用 生成式 A I 生成 的 图片 的, 主要是 担心 有一个 版权 风险。 那 我不知道 比如说 像 ChatGPT 跟 包括。 像 阿尔法 code 的, 他们 来 商用 的 时候, 跟 一些 开源社区, 包括 一些 有 license 的 版权 是不是 会有 冲突 或者 有 抄袭 嫌疑?

这个 蛮有意思 的。 因为 最近 还有一个 新闻, 就是 ChatGPT 出来 了 之后, 首先 stack overflow 直接 就 把 它 给 禁 掉了, 防止 让 T 来 污染 它的 整个 代码 库。 我 觉得 可能 未来 也会 涉及到 类似的 情况。 就是 是否 希望 它的 整个 上面 积累 下来 的 这些 代码 的 资产, 可以 让 这样的 大 模型 去 理解 和 使用。 因为 确实 有可能 会 存在 一些 版权 和 知识产权 的 问题。 但 回过头来 讲, 我 觉得 程序员 的 知识产权 的 保护 一直 都 没有 艺术家 或者 其他 的 那些 专家 会 更加 严谨 或者 更加 的 规范。

其实 我们在 日常 当中 去 在 over floor 上 抄 别人 的 代码, 也 不能 叫 抄 了。 借鉴 别人 的 使用 的 方法, 然后 使用 到 我们的 系统 里面, 这种 现象 还是 比较 常见 的。 所以 如果 他 做 的 都是 到 这个 程度, 我 个人 觉得 还好。 除非 他 真的 是 对于 给 hub 上 的 整个 项目 进行 大段 的 抄袭, 这样的话 可能 会有 一些 风险。

你 刚刚 说 step over flow 把 它 禁 掉了。 什么 叫 禁 掉?

Stack overflow 是 这样, 因为他 发现 ChatGPT 对于 代码 的 回答 很大程度 上 是 来自于 stack overflow 的 数据。 它是 全世界 最大 的 一个 代码 问答 的 网站。 然后 他 发现 会 有人 在 stack overflow 上 再去 做 一个 ChatGPT 的 插件。

相当于 当 有一个人 来 问 了 一个 代码 的 问题, 他 直接 让 ChatGPT 来 回答。 但是 这个 回答 因为 不是 由 人 来 回答 的, 所以 平台 并没有 办法 确保 他 这个 系统 一定 是 正确 的, 它 对 它的 正确性 无法 验证。 同时 他 又会 觉得 你 只是 拿了 我 原来的 一些 解答 的 思路 来 做了 一定 的 整理。 本质 上 你 并没有 为 这个 平台 带来 新的 信息。 所以 你 就在 用 A I 生成 的 代码 来 污染 我的 这个 社区, 有可能 会 造成 整个 社区 内容 质量 的 下降。 所以 他 就 把 这些 插件, 用 s ChatGPT 来 完成 代码 回答 的 插件 给 禁 掉了。

是 禁 掉 插件。

对对对, 这 其实 是 有 两块 了, 一块 是 说 是不是 可以 post 的 内容 到 这个 stack of flow。 另外 一块 就是说 open a 还能不能 用 stack of flow 的 一些 数据 去 听 他的 这个 模型。 现在 来看 是 前面 那 一则 应该 是 被禁 掉, 后面 这个 还 不知道。 其实 后面 是不是 能 用 它的 数据 才是 更加 的 关系 与 产权。 但 这个 东西 跟 整个 term of use 这些 都 有关系。

我 觉得 整个 大 模型, 包括 像 这种 斜 扣 的, 到 现在 其实 会有 一些 这种 产权 的 问题, 也是 一个 一边 发展, 一边 就是 模型 发展, 他 确实 能 做好 这些 事情 了, 才 会有 这个 问题。 如果你 做 不好, 反正 nobody cares, 对 吧? 等 他 开始 做好 的 时候, 这些 相关 的 知识产权 的 拥有者 会 去 重新 思考。 可以 是不是 有可能 存在 这种 双方都 能 获利 的 一种 情况。 或者说 是不是 有 这种 产权 侵犯, 导致 某 一些 领域 或者 某 一些 商业 的 场景 会 被 覆盖 掉, 或者说 会 被 占用 掉。 从 我自己 的 角度 上 来看, 还是 谨慎 乐观 再看 这个 整个 会 怎么样 发展。 Hopefully 就是说 大家 能 figure out 一个 最终 的 出路。

现在 是不是 相当于 OpenAI 并没有 公布 他们的 训练 数据 是从 哪里 来 的? 他 有没有 用 stack overflow 的 数据 大家 是 不知道 的。

Open I 的 有些 文章 里面 会有 提到 它 整体 上 这个 数据 是 怎么 爬 过来 的。 因为 这个 东西 如果 要 展开 讲, 本身 自己 就可以 成为 一个 非常重要 的 一个 技术细节 了。 所以 基本上 我们 看到 的 情况 还是 缺少 很多 细节, 不确定 有 一些 数据 到底 有没有 用。 这里 可能 比较 明确 的 是 这种 跟 personal identification 相关 的 这些 数据 是 被 remove, 就是说 他 能 review。 比如说 今天, 比如说 我是 家 辉, 然后 我 做了 什么 事情, 那 这种 数据 是 会 被 这个 open I 给 filter 掉。 其他 的话 没有 一个 特别的 细节 的 这种 阐述 具体 是 怎么做。

所以 大家 并不知道 他的 数据 是 哪里 来 的。

你可以 广义 的 理解 为 它是 互联网 上 你 能 看到 的, 没有 被 显示的 变 掉 的 这种 数据。 他 其实 看到 的 是 互联网 的 这个 数据。 因为 比较 有意思 的 是, 他们 还有一个 叫做 web GPT, 那个 东西 是 他 可以 去 在线 的 去 浏览 一些 互联网。 大概 做法 就是 生成 一些 语言, 生成 一些 语言 导致 的 全景 商 硬伤, 搜索 到 一些 网页, 还 可以 选择性 的 点进去, 把 这个 文字 再 弹下来, 再 放到 这个 语言 模型 里面, 再去 做 一个 response。 就 相当于 也是 另外一个 GPT, 可能 3或者 3.5 的 一个 violent。

这个 web GPT 它 有 开放 吗? 它是 一个 发布 的 产品, 还是 一个 什么 内部 使用 的?

它是 有一个 blog post, 然后 有一个 技术细节 的 application 是 有 处分。

我的 预测 是 他 应该 很快 就会 把 web GPT 和 ChatGPT 的 两个 技术 融合 到 一起。 如果 他 ChatGPT 的 目标 是 为了 更好 的 解决 人们 的 任务 需求 的话, 他用 外部 的 信息 来 validate 来做 强化, 其实 是 非常 合理 的 路线。 所以 到 那个 时候 可能 你 就会 发现 ChatGPT 在 事实性 的 任务 的 回答 上, 或者 是 对于 更 实时 的 任务 的 回答 上都 会 表现 的 比 现在 要好 很多。

我们 刚刚 其实 有 聊到 ChatGPT 最近 非常 的 火爆。 其实 不仅仅 只是 ChatGPT, 包括 我们 之前 聊到 的 AIGC, 包括 OpenAI 的 大2。 我 很 好奇 这 一轮 整个 A I 大 模型 它的 浪潮 是 怎么样 发展 起来 的。 因为 家 辉 我知道你 也 在 做 这方面 的 研究, 比如说 最 开始 是 你是 怎么 注意到 这个 浪潮 的, 它 为什么 现在 生成式 A I 突然 火 起来 了。

这个 是一个 很 好的 问题 了当 你 讲 是 浪潮 的话, 好像 是 一下子 起来 的 感觉。 那 其实 前面 有 不少 的 这种 铺垫, 整个 互联网 它 首先 就是 一个 很 好的 铺垫。 你 互联网 上 有 这样 大量 的 数据, 因为 也有 越来越多 的 这种 user generate 的 数据。 比如说 像 这种 social media, 像 这种 reddit 这种 论坛 之类 的, 大家 都 开始 post 自己的 一些 观点。 在 大 语言 模型 下面, 它 其实 都是 他 所 相当于 养料, 就是说 他 能 拿 这些 数据 做 训练, 所以 数据 我 觉得 是一个 几十年 来 一直 在 积累 的 一个 东西。 第二 就是 计算, 计算 是 G P U, 包括 这边 T P U, 这些 计算 其实 也是 必不可少 的 部分。

比较 有意思 的 是 大家 有 一些 研究 就是说 对 这些 模型 训练, 让 他 去 把 模型 变大, 它的 各方面 的 能力 会 怎么样? 这里 有一个 有意思 的 behavior 就是 emerging capabilities。 很多 时候 我们 看到 的 机器学习 的 任务, 都说 这 模型 在 小规模 上 就 已经 能 处理, 比如说 80% 的 task, 然后 把 这个 模型 变大 一点, 计算资源 更 多一点, 发现 能 比如说 处理 到 85% 的 准确率。 Emerging capability 意思 是 说 这个 模型 它 开始 不能 处理, 这个 task 就 很差 很差。 比如说 2% success visual。 然后 当 这个 模型 大 到 一定程度 的 时候, 突然 它 具备 了 这种 能力。 Success ratio 是 指数 级 的 上升 的。

在 某个 特定 的 模型 大小 下面 有了 这个 之后, 大家 就 开始 尝试 去 scale。 刚好 计算资源 也 在那里, 计算资源 在 这个 时间点 上 已经 足 过去 support 这种 几百 billion size 的 大 语言 模型 的 这种 训练 和 serving。 这个 是我 觉得 第二点 也是 必不可少 的。

第三个 是 说 neo architecture, 比较 火 的 是 说 transformer 的这 一类 architecture。 那就 transformer 之前 也有 不少 的 这种 积累, 比如说 像 residual network, 像 每 一些 capture 上 的 积累, 也 使 得到 目前为止 这样的 transformer 这种 architecture 非常 方便, 非常容易 去 skill。 它 没有 特别 严重 的 优化 的 问题, 它 没有 特别 严重 的 skilling 的 问题。 有了 这种 a new architecture 之后, 我们 才能 看到 它的 模型 具备 这样。

其实我 觉得 家 辉 讲 的 很 好了, 包括 transformer 的 架构 的 价值 和 整个 模型 做大 到 一定程度 的 涌现 出来 的 一些 可以 解决 通用 问题 的 能力。 基本上 就是 大 模型 本身 它 发展 的 背后 的 几个 技术 基础。 我 稍微 再加 两点 蛮有意思 的。 第一个 是因为 我们 自己是 做 脑 启发 A I 的 一家 公司, 我们会 经常 去 结合 脑科学 来看 A I 的 一些 技术。 然后 你 就会 发现 transformer 它的 结构 和 人脑 里面 的 整个 就 near cortex 叫 新 皮层 的 这些 六层 的 神经元 之间 的 结构 是 有 一定 的 相似度 的。 而且 这种 结构 本质 上 具有 一个 通用性, 就像 今天 传 former 既 可以 用来 处理 视觉 的 数据, 也可以 用来 处理 文本 的 或者 其他 模态 的 数据。 我们 人脑 里面 的 新 皮层 的 部分 也是 不同 的。 脑 区 的 新 皮层 本质 上 它的 结构 是 没有 区别 的, 只是 在 任务 上 做了 分块 而已。 所以 这个 是一个 很 有意思 的, 就是 我们 找到了 一个 类似 于 人脑 心 皮层 那样的 一个 通用 的 neural architecture 来 处理, 以 承载 不同 的 任务 类型。

第二个 是我 觉得 这里 也要 非常 肯定, OpenAI 这个 组织 在 生成 是 大 模型 这件 事情 上 的 一个 贡献。 因为我 觉得 没有 OpenAI 就 不会 有 现在 的 generative A I。 他 通过 高毅 也好, 通过 GPT three 也好, 本质 上 它 背后 有 它 非常 强 的 把 技术 能够 通过 一套 很 好的 工程 的 体系 去 实施 出来, 或者说 是 能够 交付 出来 的 能力 在 背后。 所以 OpenAI 我 觉得 他 和 其他 的 公司, 和 其他 的 学术 的 组织 最大 的 区别 就是 它 非常 注重 engineering。 包括 ChatGPT 这件 事情, 他 也 知道 怎么样 去 控制数据 的 质量, 怎么样 去 把 每一个 环节 做到 非常 好。 再 用 一种 大家 发现 了 科学 上 的 方法, 通过 工程师 的 放大 的 效应, 放大 的 杠杆, 把 它的 效果 做到 极致。 所以 这个 我 觉得 是 它 独特 的 一个 价值。 所以 ChatGPT 今天 出来 了 之后, 我 其实 是 会 怀疑 就是 另外 一家 公司 有没有可能 像 他 那样 可以 更快 的 把 这件 事情 给 做出来。 因为他 背后 并 完全 是一个 科学 和 技术 上 的 路线 而已, 而是 有 很多 背后 的 工程 的 excEllence 在 背后 来 支撑 他。

你 指的 另一家 公司 是谁? 是 deep mind 吗?

有 很多, 包括 facebook, 包括 google, 包括 deep mind, 包括。 国内 的 阿里、 腾讯, 因为 大 模型 本身 目前 来看 还是 大玩家 的 一个 角力 场。 这些 大玩家 肯定 每 一家 都 希望 有 自己的 一整套 世界领先 的 大 模型 的 架构。 它 背后 如果 没有 一套 很强 的 工程 能力 在, 只是 靠 大力出奇迹, 我 觉得 也是 不一定 能 达到 这样的 效果。

因为 之前 在 分享 GPT3 的 时候 就说 了, 最 开始 GPT3 证明 了 堆 足够 多 的 数据 与 算 力 的话, 我们 就可以 大力出奇迹。 那 现在 你是 觉得 并不是 比如说 像 谷歌 或者 meta 或者 阿里 或者 腾讯 去 做了 就可以 大力出奇迹, 而是 还有 一些 技巧 在 里面 的。 我在 想 它的 核心 竞争力 是什么 呢?

对我 是 认同 这一点 的。 我一直在 看 一个 事情, 就是 谷歌 他 推 自己的 lambda。 Lambda 本 也不 只是 今年 才 出来 的, 它 之前 已经 有 好几年 一直 在 做 这个 事情。 他的 目标 我 觉得 和 ChatGPT 是 类似的。 就是 谷歌 可能 也 从 某种程度 上 希望 自我 迭代, 把 它的 搜索 能力 借 由 这样的 大 模型 来 提升。 但是 从 公开出来 的 信息 和 他的 使用 的 样 例 来看, 其实 ChatGPT 的 在 对 大 模型 的 使用 上 比 lambda 是 要强 的。 它 背后 大家 的 路线 其实 还是 比较 类似的, 所以 还是 有一个 整个 engineering excEllence 在 里面。

Lambda 现在 应该 是 没有 开源 的对 吧?

对, 没有 开放。

对, 准确 的 说 应该 是 没有 开放。 我记得 之前 谷歌 在 google I O 上 它是 有 展示, 就是 用 lambda 去 订餐。 然后 对面 其实 是一个 人工智能 的 助手 接 起来 的。 但是 他的 模拟 场景 就 非常 像 一个 真实的 人, 你可以 点 餐, 可以 说 你 要 什么, 他 可以 给你 share。 这 只是 一个 demo 的 场景, 它 并没有 真实的 发生。

对我 理解 是 这样的。 但是 lambda 做了 其他 的 事情, 是真的 把 外部 的 信息 接入 的。 所以 lambda 的 使用 的 过程 当中, 根据 他的 文章 里面 的 描述, 他是 可以在 互联网 上 拿 实时 的 信息 来 帮助 他 提升 他的 回答 质量。 这点 可能 ChatGPT 没 做好。

对, 因为 谷歌 它 毕竟 还是 有一个 搜索 的 入口 的。 如果说 谷歌 来做 这件 事情 的话, 你 会 觉得 它 比 OpenAI 更有 优势 吗?

我的 观点 是 这样的, OpenAI 今天 想要 完全 去 替代 掉 谷歌, 作为 世界上 最大 的 搜索引擎, 它的 成熟度 还有 很大 的 差距。 因为 搜索 这件 事情 对 产品 的 成熟度 要求 很高。 但是 比方说 它 更多 模态 的 搜索 的 内容, 这些 事情 只有 谷歌 能 做。

ChatGPT 还是 一个 对话 引擎, 它 做不了。 但是 我 认为 他在 通过 对于 大 模型 的 使用 和 他的 回答 的 整个 调 优 上面, 目前 来看 我 觉得 ChatGPT 是 有 优势 的。 而且 这种 优势 并不是 简单 的 follow 他的 方法 就可以 做到 的。 因为 佳慧 也 说 了, 他 并没有 公开 他的 细节。 我是 严重 怀疑 他 背后 有 很多很多 的 engineering 的 一些 trick 在 里面, 才 使得 他的 效果 可以 使用 的 那么好。 那 这件 事情 如果 他的 优势 是 可以 保持 的 时间 足够 长, 也许 他 再加上 web GPT 的 能力, 他 再 把 一些 多 模态 的 信息 整合 进 到 他的 回答 里面, 可能 他 会 在 更 大程度 上去 代替 谷歌 能 做到 的 事情。 直到 有一天 我们 觉得 也许 他们 真的 是 可以 对比, 甚至 是真的 在 使用 的 时候 会 值得 选择 的 一个 东西。

对, 这里 补充 一点, 我 讲 到了 除了 数据 和 算 力 之外, 其他 还有一个 engineering 的 excise 在 里面。 这个 东西 我 觉得 可以 展开 来 讲一讲。 就是说 对于 OpenAI 来讲, 首先 它 有 一定 时间 的 积累。 最早 open I 其实 是 做 learning 做了 很多 的, 他们 有 robot sting, 但 后面 就 解散 了。 现在 您 又能 看到 在 大 语言 模型 里面, 他们 又 重新 把 这个 reinforce learning 用 起来。 这些 时间 和 这些 经验 的 积累, 我 觉得 是 一些 其他 的 公司 都 还 比较 缺少 的这 是 一块。 然后 第二 需要 一个 人才 积累, 他 这个人 不是说 完全 是 financial support 到了 人 就会 来, 他 还是 有一个 是不是 有 足够 好的 leadership, 是不是 这些 人 以前 就能 做 一些, 有没有 一个 check record success, 这个 我 觉得 也是 必不可少 的。 如果你说 现在 我们 有了 这个 数据, 有了 这个 算 力, 刚成立 起来 做 一个 team, 其实 很难 去 吸引 到 这样的 人才 的。

还有 一块 就是 有点 像是 组织 逻辑 的 积累。 我 注意到 一个 有意思 的 事情 是, 他们 这个 ChatGPT 或者 之前 的 InstructGPT open add book 上 specific 提到 了 他们的 一个 team, 叫做 lime team。 怎么样 能把 大 语言 的 模型 更好 align 到 user 想要的 输出 上。 这个 我 觉得 是一种 open 背后 在 思考 这些 team 之间 应该 怎么 去 组织, 使得 整个 公司 的 这样 一个 mission 更加 的 高效能, 把 这个 东西 做出来。 这个 并 不是说 拍脑袋 一 想 今天我 要 成立 三个 team, 可能 也是 一定 时间 的 摸索 出来。 包括 他 之前 不是 还 解散 了 那个 robotics team, 我 觉得 这个 也是 需要 一定 的 积累。

最后 还有 一块 就是 在我看来 就是 这种 自信 的 积累。 OpenAI 在 整个 往 A I 往前 去 推动 的 过程中, 是 有一个 很 好的 record of success。 我们 最 早期 GPT3 它 已经 是 第三个 版本 了, 有 G P T、 GPT2, 然后 GPT3, 然后 3.5。 三点 完了 之后, 有 一些 往上面 做 这种 application ation 往 application 上 走 的 这种 工作。 像 我们 刚才 所 提到 的 ChatGPT, web GPT, 还有 传说中的 rumor 里面 GPT four。 我 觉得 这些 其实 也是 一定程度 上 一边 作为, 一边 积累 一种 自信。 包括 整个 team 的这 一种 自信, 可以 更好 的 延续 这种 momentum, 更好 的 往前 去 push 整个 resize。

所以 对于 这个 问题 就是说 是不是 有 足够 多 的 数据 和 算 力 就能 训练 这样的 模式, 我 觉得 是 远远不够 的。 可能 一定程度 上 你 想 上去 好像 这个 就是 一个 答案。 就是说 我 只要 对 数据, 对 算 力 就可以。 但 其实 真正 做 起来 的 时候, 发现 全部都是 问题, 这 是我的 观点。

我 总结 一下 特别 好, 时间 跟 经验 的 积累, 人才 积累、 组织 积累, 还有 自信 的 积累。 我们 说 即使 一个 公司 有 数据 跟 算 力, 最后 它的 效果 能不能 达到 OpenAI 这个 效果, 或者说 花 几年 的 时间 他 能不能 追赶 得 上, 可能 都 是一个 问题。

我 稍微 echo 一下, 我 觉得 家 辉 讲 的 特别 好。 除了 刚才 你 提到 还有一个 就是 认知 的 积累。 就是 OpenAI 在 推动 大 模型, 尤其是 自 回归 的 大 语言 模型 的 使用 上面, 它 不断 的 在 尝试 定义 它 自己的 问题。 比方说 他 刚才 讲 的 这个 aligning research, 这 其实 是 他们 花 大 精力 投入 的, 而 很多 其他 的 机构 没有 再 投入, 我不相信 会有 像 他们 那样的 投入。 比方说 他们 为什么 会 引入 强化 学习? 是因为 他们 认识 到了 大 模型 虽然 知识面 很 广, 能力 很 强很 通用, 但 并不知道 怎么 去 更好 的 把 新的 标注 信息, 把 人的 监督 的 信号 更好 的 融入 进去, 所以 他们 才会 再 重新 捡起来, 强化 学习 来做 这件 事情。 所以 这些 创新性 的 方法 代表 了 他 背后 其实 不断 的 在 认知 上去 探索 大 模型 的 使用 边界。 这个 不是说 一家 能够 follow 他们的 公司, 可以 很 短期内 跟得上 的。 也许 我们 可以 抄 到 他们的 做法, 但是 抄 不到 他 背后 的 整个 思考。

那你 觉得 像 google 或者 meta 这样的 公司, 其实 他们 一直 都有 在 研究。 像 meta 他 前 一段时间 也 放 出来 了, 它 可以 自动 生成 视频。 然后 谷歌 里面 它 有 自己的 组织, 非常 类似 于 OpenAI 的 机构, 像 deep mind。 同时 它 也有 各种 图片 生成式 的 研发, 包括 lambda 这种 聊天机器人 的 这样的 研发, 它 其实 方方面面 面 都有 触及 到。 那你 觉得 他 跟 OpenAI 它 能 follow 的 上 吗?

这个 我 不太好 评论, 我们 毕竟 只是 一家 小 创业 公司, 家 辉 在 谷歌 内部 他 应该 可以 评价 一下 这个 问题。

我 觉得 从 两个 阶级 来看, 一个 是 像 大公司 的 比较 成熟 的 这种 research lab。 我 觉得 对 他们 来说, 其实 真正 重要 的 并 不是说 能 去 follow 到 整个 research。 真正 重要 的 是 怎么 继续 去 push 前沿, 或者说 下一个 这种 milestone。 下一个 milestone 在 什么 地方, 应该 要 去 看 这种 问题。

对于 这个 来说, 我 觉得 O N I 是 有 一定 的 优势。 在 目前 上 他们 其实 是在 一定程度 上 不断 地 在 创建 下一个 my stone 大公司。 其实 follow 并不是 一件 难 事情, 在我看来 这是 第一个 大公司 的 叫 其他 的。 因为我 注意到 国内 也有 一些 这种 map, 有 一些 可能 也是 政府 牵头 做 起来 的 一些 lap。 对 他们 来说 如果 要 去做 这件 事情, 我 觉得 需要 用到 之前 我所 提到 的那 几个 积累。 不管 是 人才 也好, 还是 整个 架构 怎么 去 设置 也好, 包括 方波 提到 的 整个 认知 这些 东西, 就是 大概是 怎么 在 理解 这个 事情, 或者说 下面 要 怎么做。 这些 上 可能 需要 更长 的 时间。

对 大公司 来说 的话, 人才 也 已经 有 至少 有 一些 人才 储备 组织, 其实 也是 比较完善 的, 自信 其实 也是 有的。 Open idol 的 这些 技术 里面, 也 并不是 所有的 技术 都是 来自于 U N I 的。 像 transformer 或者说 像 一些 最早 的 reinforcement learning 的 一些 他们的 P P O 或者 一些 别的 算法。 比如说 best nets 这些 其实 并 不是说 完全 是 O N I 积累 出来 的。

刚刚 方波 你 在 回答问题 的 时候, 你 有 提到 OpenAI 它 能不能 替代 谷歌? 你 觉得 在现阶段 可能 它 还是 挺 难 的。 我说 一下 我自己 的 几个 小 体验, 就是我 之前 有 在 谷歌 上 搜索, 比如说 一个 2岁的 儿童 他 应该 每天 摄入 多少 脂肪? 谷歌 搜索 的 他 给 我的 一些 答案 都是 一些 非常 泛泛而谈 的 一些 新闻稿。 就 比如说 0.5岁 以下 应该 摄入 多少, 1到2岁 他是 一个 非常 泛 的 东西, 我 并 不能 从 他的 文章 中 得到, 我需要 给 一个 2岁的 儿童 每天 摄入 多少 的 脂肪。

但是 我在 ChatGPT 上 问 了 一下 这个 问题, 他 给 我的 回答 非常 好, 就是 大概 分了 几个 层次, 说 你 应该 根据 小朋友 的 体重, 他 有一个 数据 公式 你 去 计算。 最后。 得到 的 是 它的 脂肪 量。 然后 通用 的 标准 是什么? 我 当时 看 了 以后, 就像 你说的, 他 有的 时候 他的 回答 是 错误 的, 我不能 确定 他的 回答 是 正确 还是 不 正确。

所以 我 又 问 了 Chat GPT1个 问题, 我 就说 一个 女性 每天 应该 该 摄入 多少 糖? 它 同样 也是 除了 告诉我 一个 通用 的 数据 以外, 还有 一套 方法, 怎么样 去 计算 女性 的 摄入 的 糖 数。 因为我 是 知道 女生 应该 摄入 多少 糖 的, 所以 我知道 这个 问题 的 答案, 我 觉得 他的 那个 回答 是 正确 的那 反推 到 上 一个 问题, 我 觉得 我 好像 可以 相信 他 从 这个 点 上 我会 觉得 好像 ChatGPT 会 比 谷歌 它 要在 使用 上 更容易。

但是 同时 它 可能 也会 有 不 精准, 或者 有 很多 实时 信息 就 没有 办法 去 更新 的 问题。 所以 我 也很 想 知 教 一下, 比如说 像 家 辉 跟 方波, 你们 觉得 站在 现在 的 角度看, 他 可能 还 不能 替代 谷歌。 但是 站在 未来 的 角度看, 当 他 有了 更多 的 数据, 更 精准 的 调配, 包括 大家 提到 的 刚刚 他 把 这个 web GPT 也 切入 进来 了。 我们 从 更 长远 的 一个 角度看, 你们 觉得 他 会 是 谷歌 的 一个 竞争对手 吗?

我 简单 说 一下, 刚才 我也 提到 过了, 如果我们 把 一个人 对于 信息 的 需求, 尤其是 主动式 的 信息 需求 分为 几个 步骤, 第一个 就是 意图 的 理解。 第二步 去寻找 合适 的 信息。 第三步 可能 就是 寻找 完 合适 的 信息 之后 做 理解 和 整合。 第四步 可能 就是 回答 谷歌 以前 做 的 很 好的 几个 点, 包括 意图 的 理解, 包括 信息 的 匹配 和 寻找, 包括 它的 呈现。 其实 这 几步 他 做 的 都 很好, 但 他 其实 一直 在 对 信息 的 理解 和 整合 上面 尝试 去做 的 更多。

你 有的 时候 可以 看到 谷歌 可以 直接 回答 一些 你 简单 的 问题, 会 放在 所有的 页面 之前, 或者说 它 右边 有一个 叫 N T T pen, 可以 直接 把 它 你 相关 的 知识 用 结构化 的 方式 呈现 出来。 其实 谷歌 在 做 这件 事情 上面 花 的 时间 会 更长。 只不过 今天 技术 的 发展 让 大家 觉得 说, 其实 对于 知识 的 理解 和 整合 这件 事情, 其实 是用 大 模型 来做 会更好的。 而且 它的 效率 会 远远 高于 你 其他 以前 的。 比如说 先 对 问题 分类, 如果 是个 天气 问题 我 就 去 查 天气, 就 这种 传统 的 对话机器人 的 方法 相比 会好 很多。 这就是 ChatGPT 今天 的 优势。 所以 他们 可以 理解 为是 在 整个 人 对于 信息 需求 的 几个 环节 里面, 各自 占有 一些 优势。

至于 说 未来 要 做 的话, 谷歌 肯定 也会 更多 的 往 这个 理解 的 层面 去 走。 ChatGPT 可能 也会 更多 的 往 信息 的 匹配 这个 角度 去 走。 比方说 把 web GPT 的 东西 融合 进来, 那 谁能 更快, 谁 能把 串 在一起 的 整个 pipeline 的 体验 做到 更 极致。 我相信 他 就是 未来 有 机会 成为 下一代 的 信息检索 引擎 的 一个, 或者说 都 不应该 叫 信息检索 了, 叫做 个人 助理 的 一个 机会。

张波 提到 的 最后 一句 也 非常 好, 就是说 它 到底 是不是 还能 叫做 信息检索 的 引擎? 有可能 我们 换 一个 角度 来 思考 这个 问题, 并 不是说 ChatGPT 是不是 颠覆 这种 搜索引擎 的 问题, 而是 说 check boat 和 这种 搜索引擎 之间 的 关系 会 是 怎么 样子。 一定程度 上 我在 想 chat 或 dialogue 这个 东西 本身 它是 一个 比较 完备 的 一个 载体。 就是说 你 能 从 一定程度 上 做你想做的 几乎 所有 事情, 包括 那个 搜索引擎 上面。 但 它 其实 也不 限于 搜索引擎 上。 就是 因为 刚才 你 所 提到 的 case 还是 一个 一问一答 的 这么 一个 情况, 其实 他 能 做 的 更多 这种 一问一答, 然后 你可以 继续 有问题, 然后 他 可以 继续 给你 去 either。 他 可以 elaborate 一下 他 为什么 这么 回答, 或者说 他 什么 follow up 的 这种 answer。 这种 程度 或者 这种 体验, 其实 现在 的 搜索引擎 不 具备。 所以 我们在 比较 这个 东西 的 时候, 其实 有 一定程度 上 是 有点 在 小看 dialogue。

或者说 这种 chatbot 所 能 带来 的 这种 颠覆, 或者说 所 能 enable 的 这种 应用 场景。 我自己 对 这个 chatbot 的 整个 未来 的 应用 场景 是 非常 看好 的, 但是 它 现在 状态 还是 需要 提高, 包括 这种 是不是 足够 基于 现实, 包括 能不能 提供 set, 甚至 比如说 你看 今天 这个 时间 是 什么样 的 天气, 你 如果 只用 一个 大 语言, 模型 都 已经 去 完了, 其实 很难 做 这件 事情。 在技术上 还是 需要 提高。 但是 check bot 这个 东西 或者 这个 载体, 它是 非常 有 应用 场景 的。 一定程度 上 是要 远大于 一问一答 式 的, 或者说 搜索 式 的, 或者说 这种 web answer。 刚才 冯波 也 提到, 你 如果说 一个 问题, 其实 像 google 社区 能 给你 一个 然后 是 on top of 其他 的 一些 链接 的 chatbot, 我 觉得 其实 是 能 做 的 比 这个 远 多 的。 所以 我们在 讨论 的 并 不是说 是不是 能 颠覆 google, 而是 说 它 到底 能 带来 什么样 的 一个 用户体验, 或者说 能 解决 用户 剩下 的 那些 还没 被 解决 的 一些 痛点。

你们 觉 不 觉得 有一点 像 高维 打 低。

维我 很 同意 对。

降 维 打击 chatbot 来说 是 有 这种。

对我 稍微 补充 一个 观点, 我看 jenie 也 问 了 一个 很 有意思 的 问题, 跟 创业 机会 有关的 就是 今天 我们 看到 的 更多 的 人是 在 说 它 到底 能不能 替代 谷歌。 但是 从 整个 互联网 的 角度 来讲, 你 会 发现 谷歌 也 只是 其中 一个 很 重要 的 信息服务, 但 不 代表 互联网 全体, 对 吧? 移动 互联网 里面 每一个 特殊 的 场景, 我们 都有 各自 的 A P P。 我们 有 各种各样 的 网站 来解决 人的 各种各样 的 信息 需求、 服务 需求, 甚至 陪伴 需求。 我 看到 的 其实 更多 的 是在 后者。

如果我们 说 A I 可以 是一个 比 互联网 更大 的 机会 的话, 那 我相信 被 他 重 做 的 东西 绝对 不 只是 谷歌 而已。 而是 说 我 今天 所有的 软件 的 服务, 无论 它是 用 A P P 的 形式, 还是 用 一个 网页 的 形式, 他 可能 都 可以 被 这种 交互式 的 角色 式 的 能力 给 包 起来。 然后 让 他的 那些 服务 通过 这种 更 自然 的 方式 来 提供。 这种 能力 的 出现, 它 其实 是 有可能 把 整个 互联网 行业 给 重 掉 的。

所以 这 两天 我在 听到 有一个 投资人 在 说, 因为 ChatGPT 的 出现, 让 他 觉得 他 做 T M T 的 投资 可以 再做 15年。 原因 也 在这里, 就是 可能 以前 我们 对于 人的 需求 的 满足 都是 说 我 拿 一个 A P P 或者 拿 一个 软件 来 更好 的 用 信息化 的 方式 来 满足 它。 但 今天 也许 我们 到了 一个 新的 拐点, 可以 把 信息化 再 提升 到 一种 基于 dialog 来 为 中心 的 一种 交互式 的 智能化 的 服务 上面。 所以 这 里面 机会 是 巨大 的。

谷歌 只是 其中 很小 的 一部分 而已。 然后 那个 机会 我 觉得 是 大家 可以 再 多 关心 一下。 因为 这些 也 不仅仅是 一些 应用 级 的 机会 了。 就 比如说 每个 应用 应该 怎么样 去 改造, 而是 它 底下 会有 很多 平台 级 的 机会 来 产生, 可以 产生 它 自己的 android, 我 觉得 这个 是 非常 exciting。

所以 类似 于 像 ChatGPT, 尤其是 像 OpenAI 大 模型 这样的 公司, 它 会 成为 未来 的 一个 平台 跟 一个 基础 建设。

对我 认为 他 更 像是 下一代 互联网 底下 的 基础设施, 而且 他 做 这件 事情 非常 擅长, 确实 想要 超过 他 也很 难。 就要 把 他的 这个 能力 真正 像 毛细血管 一样的, 使用 到 我们 社会 的 方方面面 里面 去做 升级。 其实 它 中间 有 大量 的 机会, 就像 我们 其实 星矢 宇宙 这家 公司, 也就是 我们 创立 的 这家 公司 在 做 的 这个 事情 就 有点累。 类似 就是 我们会 在 底下 使用 大 模型 的 能力。 但是 在于 说 我 怎么样 把 大 模型 的 能力 更好 的 放到 一个 具体 的 场景 里面, 它 其实 是 需要 有一个 平台 来解决 的。

因为我 单独 的 使用 大 模 新的 名义, 就 像你 看到 了 ChatGPT, 他 虽然 很 厉害, 但 他 并不是 真正 的 了解 对方 的 用户。 他 没有 跟 用户 有关的 记忆, 对 吧? 他 也没有 一个 真正 的 可以 validate 的 信息源, 让 他 保证 他说 的 所有 话 都是 靠谱 的。 然后 他 也没有 办法 像 刚才 提到 的, 跟 真正 场景 里面 的 一些 能力 和 背后 的 一些 执行 的 操作 去 结合。 让 他 直接 通过 这 一个 接口 来 帮你 完成 场景 里面 的 任务 的 闭环。 他 也 不会 像 人 提供 服务 一样, 还会 主动 来 提供 服务, 有 一种 主动性, 有一个 主体性 在 背后。 所以 我 觉得 像 这些 问题是 通过 单独 的 大 模型 比较 难 解决 的。 那么 怎么样 把 这些 问题 解决 好, 让 每一个 场景 都 可以 变成 用 这种 很 有个性 的, 很 有意思 的 dialog 的 方式 去 提供 更好 的 体验, 更高 的 效率, 然后 更 沉浸式 的 一种 感受。 我 觉得 这 里面 有 很多 的 创业 公司 的 机会 在 里面。 所以 我 认为 OpenAI 做 ChatGPT 它的 目的 是 说 这个, 而 不是说 我 直接 跟 谷歌 头 对头 的 去 打。

我看见 已经 有 公司 会 用 OpenAI 底层 的 能力 去做 A I 制药 了。 之前 我们在 AIGC 的 某 一期 里面 也 提到 过, 像 OpenAI 它的 大 模型。 如果你 把 它 用来 做 科学, 它 就会 生成 科学。 你 把 它 用来 做 策略 就可以 生成 策略, 做 艺术 就可以 生成 艺术。 就是 它是 可以 生成 万物 的, 但 具体 就是说 人 有什么 想法, 我们 去 怎么玩 它。

因为 其实 现在 大家 看到 的 ChatGPT, 我们 刚刚 反复 提到 了, 它是 GPT3.5 的 版本。 现在 GPT 它 还有一个 是 GPT4 的 版本, 然后 还有 谷歌 的 这个 阿尔法 code deep mind 也 在 做 一个 这样的 模型。 你 觉得 有 哪些 是 我们 现在 还没有 看到, 但是 比如说 GPT four 或者 阿尔法 code 有 放 出来 以后 会 更有 潜力, 更有 想象力 的 部分。 我们 只 单 谈 这 两件 事情。

对, 首先 这个 G P T four 我 听到 的 也 基本上 是 romance 一些 传言。 可能 就 是从 我自己 的 观点 了, 就是说 这个 模型 自然资源 是一个 比较 大 的 规模, 跟 前面 的 一个 版本 来。 就 不是 同一个 量级 的 这种 规模 的 资源。 它的 能力 我 听说 是 有 一些 除了 语言 之外 的, 因为 人 毕竟 还是 一个 视觉动物。 那 就是 人 在 看 一些 东西, 比如说 看 一些 video, 通过 这些 video 里面 你 能 了解 一些 新的 概念, 了解 一些 视觉 和 这种 语言 的 定。 可能 听说 是 GPT four 是 有 大家 叫做 multi model 的 这种 能力。

当然 也有 一些 谣言 说 GPT four 它 有可能 不是 一个 dance model, 它是 一个 bus model, 或者说 dance spas 结合 的 一个 model。 这个 意思 是 说, 并 不是说 neon 在 每一个 输入 里面 都会 被 激活, 它 可能 会 像 人脑 一样 选择性 的 激活 大脑 的 某 一块。 类似 于 这种 谣言 还是 比较 多。 对我 自己 觉得 这 里面 就是说 给 了 我们 现在已经 看到 的 这些 结果, 可能 不久 的 将来 我们 能 看到 一些 新的, 但是 现在 还没有 的 结果。 比如说 语言, 语言 的 交互 和 这种 图像 生成 结合 在一起。 那 现在 比如说 图像 生成 还是 一个 一问一答 的 一个 方式, 对 吧? 我说 一个 文字, 你 给我 生成 一个 图片, 如果我 需要 上面 进行 修改 的话, 可以 稍微 画一 画, 涂 一涂, 然后 通过 语言 的 一些 调整。 这个 其实 本质 上 并没有 这么 的 自然。

其实 更加 自然 的 方式 是 说, 你就是 通过 一个 dialog 来进行 一些 图像 的 修改。 比如说 我想 修改 图像 的 上面 这 一块, 或者说 我想 修改 图像 的 整个 色调。 然后 以 这种 多轮 方式 的 问题, 或者说 多轮 的 问题 答案 这种 方 是 去 进行 图像 的 编辑。 这个 我 觉得 是 可能 可行, 但是 目前 还没有 看到 有 哪个 模型 能 具备 这个 能力。

当然 另外 还有 一些 对 着 图像 做 一些 问答 的 这种 模型 其实 也有, 但 没有 说到 一个。 比如说 我看 一个 奥巴马 的 一个 图, 或者说 看 一个 trump 的 图, 它 能 理解 后面 的 一些 逻辑, 还是 在 哪个 场景 下面 在 做 一些 什么样 事情, 就 被 后面 什么 story。 其实 人是 具备 这个 能力 的, 尤其是 比如说 历史 书上 对 吧? 他 其实 给你 修 了 很多 这种 图。 那 这个 上面 其实 目前 还没有 看到 有 这样的 能力。 但是 我 觉得 现在 的 技术 可能 已经 成熟, 来做 这些 事情。 我 觉得 后面 可能 会 逐渐 看到 这样的 一些 demo, 或者说 这样的 一些 capability 被 表现出来。

其实 阿尔法 code 这 一块 其实 是 另外一个 角度, 就是说 对于 这个 coding 或者 对 这个 程序员 能有 什么样 的 一种 提高。 这里 其实 比较 好 量化 的。 就是 他们 有 那个 school, 包括 应该 其实 也有 一些 发表 的 文章, 就 怎么 来 measure 这种 coder 或者 a robot code 来做 这种 coding 的 能力。 那 我相信 这个 score 会 逐渐 的 提升。

但是 可能 如果说 我们 还没有 看到 什么 能力, 就是 今天 聊天 最早 提到 的 是不是 有 这种 组织 整个 code 架构 的 这种 能力, 或者说 design 的 这种 能力。 就 software design 并 不是说 像 这种 小的 little code 的 cold peace 的 这种 completion, 就 这个 我 觉得 目前 还没有 看到, 但 有可能 可以 看到, 其实 本质 上 很多 基础设施 都 已经 在那 了。 数据 在那, 包括 开源 软件 在那, 计算资源 在那, 然后 神经网络, 刚才 讲到 的 这些 东西 其实 都在。 但是 就 需要 有人 去 把 这些 细节 执行 好, 把 它 做出来。 这个 我 觉得 是啊, 但 我没有 任何 内部消息 或者 怎么样。 就是说 从 我自己 的 做 一个 研究员 观察 来看, 我 觉得 这些。

可能 会 出现 方波。 因为 我们 刚刚 其实 讨论 的 一直 是 大 模型, 它 其实 只是 A I 的 一 的 方向。 可不可以 跟 大家 介绍 一下 你 之前 跟 我 提 过 的 全脑 模型。

大 模型 肯定 是 对于 原来的 我们 叫 判别式 的 或者 分析 性 的 A I 的 一次 范式 的 升级。 他 可以 很 好的 把 知识 融合 在 底下, 然后 基于 它的 模型 扩大, 可以 涌现出 一些 解决 通用 问题 的 能力。 但是 我们的 理念 更多 的 是 在于 说, 能不能 让 这样的 A I 不是 一个 简单 的 解决问题 的 东西, 而是 说 它 真的 可以 变成 各种各样 的 数字生命, 变成 各种各样 的 角色, 能够 进入 到 我们 生活 当中 的 各种各样 的 场景。 做你的 健身教练, 做你的 营养师, 甚至 成为 你的 个人 的 陪 半 或者 数字 分身。

在 研究 这个 问题 的 时候, 你 就会 发现 大 模型 本身 它 提供 的 这种 信息 和 任务 能力 并不 足够 完全 解决 这样的 生命感 的 问题, 或者 叫 人性 的 问题。 在 这时候 我们 就会 想要 去 用 一种 更 宏观 的 架构 来解决 它。 但 比较 巧 的 也是 我们 自己 做 这种 宏观 的 架构, 做了 大概 有 三年。 然后 这 两年 无论是 养老 坤 或者 有 小斑鸠, 他们 都是 图灵奖 的, 也是 深度 学习 的 创始人 了。 尤其是 老 困 在 今年 6月的 时候, 他 也 是从 facebook 离开, 写 了 一篇 文章 说 他 未来 的 很多年 都 想要 去 把 这个 全脑 框架 能够 做出来。 它 当然 叫做 一个 宏观 的 架构 了。

在 这个 宏观 的 架构 里面, 大 模型 更 像是 一个 人脑 里面 的 常识 底座。 他 要 为 这个 人脑 去 配置 他的 感知 系统、 他的 记忆系统、 他的 行动 的 系统。 但 最 重要 的 是 这些 不同 的 系统 或者 不同 的 脑 区 的 加入, 丰富 了 他 作为 人的 别的 维度。 但 中间 需要 有一个 很 核心 的 思维 的 系统 来 串联 它的 这些 脑 区, 使得 这个 A I 的 思维 可以 符合 它 自己 独特 的 特点。 比方说 说 他是 乐观 的, 他是 悲观 的, 然后 他的 角色 是什么? 他 主动 想要 给 人类 带来 的 东西 是什么? 都 由 这套 思维 去 串联 起 他 不同 的 信息 和 能力 来 呈现 出来。

这是我 看到 的 一个 未来 的 A I 的 发展方向, 就是 以 大 模型 的 能力 作为 底座, 同时 设计 一套 宏观 的 脑 启发 的 框架。 然后 借此 把 各种各样 不同 的 A I 的 角色 的 能力, 能够 匹配 到 这样的 一整套 数字 大脑 的 框架 里面 去。 如果 这件 事情 可以 完成, 我 觉得 刚才 提到 了 很多 就 今天 ChatGPT 还 做不到 的 东西, 也许 是 可以 做到 的。 比方说 我们 可以 为 每一个 A P P 都 去 配备 一个 他 独特 的 A I 的 角色。 然后 他 有 自己 很 独特 的 个性, 然后 他在 服务 你 或者 陪伴 你的 时候, 他是 真正 懂 你的, 然后 他 也会 每天 监督 你的 行为, 甚至 你 跟 他的 交流 可以 直接 让 他在 背后 帮你 完成 很多 的 任务。 乃至 也许 你 不给 他 下 任何 的 指令, 他 针对 对 你的 了解 和 对于 这个 任务 的 了解, 可以 主动 拥抱你 在 数字世界 里面 做 一些 工作。 就像 我们 看到 有一个 科幻电影 叫 her 一样。

这 听起来 有点 可怕。

但 他 一定 是 善意 的。 比方说 他 做 的 事情 是 有限 的。 比如说 一个 健身教练, 他 可以 帮你 完成 的 就是 跟 健身 有关 关 的 内容, 帮你 去 主动 去 安排 课程, 然后 给你 一些 饮食 的 指导, 而 不是说 当做 一个 人形 的 知识库, 只是 回答 一些 知识 的 问题。

当然 它 背后 肯定 会有 一些 安全 的, 像你 提到 的 这些 道德 各种 方面 的 一些 风险。 我 觉得 今天 这个 时代 还没有 完全 准备 好 迎接 他们的 到来, 所以 我们 也 只能 一步一步 的 去 走。 但 如果说 我们 对于 A I 的 推动, 不仅 把 它 当做 一个 信息 和 任务 的 工具 来看, 而是 真的 想 把 它们 当做 一个 未来 数字世界 的 一个 完整 的 载体, 跟 人类 非常 接近 的 一种 独特 的 数字 存在。 我 觉得 全脑 模型 可能 会 是我 比较 看好 的 一个 未来 的 方向。 当然 它的 成熟 其实 很大 大程度 上 依赖于 大 模型 的 成熟, 这个 是 我们在 做 这件 事情 的 一个 思路。 我 觉得 这个 赛道 其实 也可以 关注 一下, 我 觉得 也 非常 exciting。

你说 到 的 全脑 模型, 它 就是 除了 大 模型, 它 还 包括 哪些 其他 的 板块 可以 介绍 一下 吗?

首先 我们是 像 刚才 提到 的, 比方说 我们 可以 为 大 模型 配备 它 自己 专门 的 记忆 的 系统。 那么 他在 跟 任何人 一个人 交流 和 服务 的 过程 当中, 他 可能 真的 可以 理解 到 这个人 过去现在未来 他的 需求, 而 不用 你 每次 都 打 字儿 打 给他。

个性化 的。 就 类似 于 比如说 我 跟 ChatGPT 聊过 什么 他 都 记得, 他 可以 把 我 以前 的 跟 他的 对话 聊天记录 调 出来。

对, 而且 可以 更加 个性化, 它 可以 总结 这些 聊天记录, 了解到 你是 一个 做 播客 的 人。 然后 可能 你 每天 最近 烦恼 的 事情 到底 是 怎么样 提高 你的 做 播客 的 制作 的 效率。 它 可以 主动 的 来 给你 提供 这样的 功能。

第二 比方说 我们 以后 可能 会 希望 他 拥有 一些 更加 多 模态 的 感知, 而 不是 完全 通过 这种 方式 去 把 文本 吸纳 进来。 也许 你 希望 他 和你一样 可以 看到 你 周围 的 环境。 也许 你 希望 他 再 给你 提供 服务 的 时候, 可以 把 互联网 上 各种各样 多 模态 的 服务, 他的 身体 的 动作。 比如说 一个 健身教练, 当你 问 到 他 一个 动作 该 怎么做 的 时候, 他 不是 给你 一段 描述, 而是 真的 有一个 他的 身体 给你 做 一个 示范。

马斯克 的 人形 机器人 吗?

数字 版 的 人形 机器人 或者 叫 虚拟人 结合 这个 大脑。

还是 在 手机 上 的, 只是 说 它 可以 是一个 图片 或者 动画 的 展示。

或者说 它 可以 作为 一个 中心, 跟 很多 不同 的 其他 的 功能 结合 到 一块儿。 比方说 你 现在 告诉他 我 什么 事情 该 怎么做, 他 现在 只是 回答 他的 步骤, 但 也许 这些 步骤 可以 直接 完成 互联网 上 的 一些 操作。 相当于 就 不 只是 给你 信息 的 服务 了, 而是 帮你 做了 执行。 这些 其实 是 全脑 框架 下 要 去 解决 的 问题。

还有一个 很 重要 的 点 就是 全脑 框架 上面 还 会有 一个 叫做 全局 工作 空间 这样的 一种 全新 的 理论, 就是 认 科学 认为 的 大脑 里面 去 整合 这些 大脑 内部 的 不同 的 信息 和 他 想要 完成 的 任务 的 目标。 会有 一个 很 中心 的 注意力 的 机制, 让 他 去 选择 在 不同 的 情况下, 我 到底 是 应该 去 用 我 记忆 里面 的 你来 回答, 还是 说 我 直接 帮你 来完成 服务, 还是 说 像 ChatGPT 那样, 我只是 给你 一个 任务 上 的 指导。 那 这个 过程 可能 需要 有一套 更 宏观 的 思维 框架 来 调控 一套 注意力。 机制 来做。

你 觉得 这个 时间 要 多少?

年老 坤 说 需要 十年, 我 觉得 不需要 那么 久, 我 比较 乐观。

十年 就可以 实现。 我 觉得 很 可怕, 这个 实现 了, 他 太 懂我 了。

但 他 懂 也是 有 限度 的, 懂, 他 毕竟 不是 每天 跟 你 生活 在一起, 他 还是 在 你 跟 他的 这个 交互 的 场景 下 发生 的 数据, 他 会更好的 来 理解 来 了解 你。

所以 你是 相信 通用 人工智能 是 很有可能 很快 会 实现 的对。

其实 这 里面 我 稍微 插 一句, 通用 人工智能 是一个 过去 的 概念, 它的 这个 定义 比较 模糊。 我可以 认为 ChatGPT 已经 是 属于 通用 人工智能 的, 因为 它 确实 回答问题 的 能力 相当 通用。 从 我的 角度 来讲, 更 合适 的 一个 词 叫做 human level A I, 就是 人类 级别 的 人工智能。 当我们 提 人类 级别 的 人工智能 的 时候, 我们 可能 就会 要求 他 有 自己的 情感, 有 自己的 记忆, 有 自己的 完整 的 感知, 然后 又 能够 干预 这个世界 的 能力, 或者说 有一个 自己 真正 的 自我意识, 然后 可以 思考, 然后 会 成长。 这些 维度 我 觉得 可能 是 未来 A I 的 一个 重点。 但 如果 只是 看 它的 通用性 的话, 其实 大 模型 本身 已经 做得 非常 好了。

这次 OpenAI 发布 ChatGPT, 很多人都 非常 关心 跟 嘲讽 的 一个 问题, 就是说 OpenAI 不 open。 简单 来说 就是指 OpenAI 没有 开源, 因为你 自己 也会 去 做大 模型 的 这件 事情。 然后 也是 A I 方向 的 研究者, 你 觉得 OpenAI 应该 开源 吗?

对, opi 不 open 是一个 一直以来 大家 在 嘲讽 的 一个 问题。 其实 O N I 最早 是一个 非盈利 的 组织, 就是 整个 架构 也好, 整个 购 也好。 那个 时候 其实 开源 出来 的 code, 包括 开源 出来 的 模型 是 比较 多, 但是 实在 也 不太 一样。 那个 时候 并不是 现在 这种 大 语言 模型, 这种 level 的 模型。

然后 我 觉得 整体 上 开源 这个 问题 非常 是 一把, 因为我 看到 还有 像 state A I stable division 这些 开源。 其实 open I 我自己 觉得 在 尽 他 所 能 去 开源 一些 东西, 包括 你可以 看到 他们 很多 这种 interface 出来。 其实 如果 具体 的 讲, 你 看到 它的 这些 模型, 每个 版本 出来, 它 并不是 指 开源 最好的, 或者说 只 开源 对 这种 商业化 最 有利 的 模型。 它 其实 是在 开放 一系列 的 模型 的 A P I 出来, 包括 这个 模型, 比如说 是 surprise 的 这种 human label surprise 的 翻译 过 的 这个 模型。 另外一个 比如说 R L reinforcement learning 去 tune 的 模型, 还是 开源 这些 interface 出来 的 一个 原因 是 希望 相关 的 一些 研究员 也能 去做 一些 研究。 但是 为什么 他 不 把 整个 模型 全部 开源 出来, 对 吧? 然后 甚至 有可能 比如说 数据 也 开源 出来, 我 觉得 这个 本身 也是 非常 难 的。

这里 整体 上 要 从 几个 角度 思考 这个 问题。 第一个 我 觉得 从 学术 的 角度 上, 比如说 我们 就 作为 为 这种 研究员, 从 学术 角度 上, 我 认为 开源 肯定 是 促进 发展, 就是 学术 要 往前 发展。 他 肯定 是 benefit from 这种 非常 开源 的, 然后 你 有 更多 accessible, 不管 是 code 也好, 或者 模型 也好, 甚至 资源 也好。

那 这种 上面 我 觉得 可能 更加 的 促进 学术 的 开源。 原因 很 简单 了, 其实 这些 模型, 这些 技术, 包括 这些 计算资源, 现在 整体 上 还是 掌握 在 一些 少数 研究员 的 手上。 比如说 像 OpenAI 的 一些 研究员, 或者说 像 大公司 的 一些 研究员。 虽然 整体 上 他们 做 一个 问题 可以 理解 为 它是 一个 概率 问, 也就是说 它的 成功 的 概率 高 一些, 但是 毕竟 你 也 没法 挡。 就是说 其实 整个 research 整个 A I research commit 是 非常 庞大 的 一个。 前几天 还去 参加 那个 会议, 其实 人是 非常 多 的。 因为 那么 多人, 大家 都 集思广益, 其实 是 能 更好 的 推动 这个 学术 的 发展。 从 这个 角度 上 在我看来 是 应该 开源, 但是 OpenAI 是 还没有 做。

其实 有些 别的 考虑 涉及到 可能 后面 要 讲到 的 是 说 这种 responsible A I 的 角度。 因为 这个 模型 其实 一定程度 上 大家 还没有 完全 理解, 他 所 能 做 的 和 所 不能 做 的, 也是 一个 不断 的 在 发展 的 事情。 比如说 OpenAI 今天 把 这个 模型 开源 出来, 那你 总是 没法 挡住。 有些人 可能 拿 这个 模型 做 一些 奇怪 的 事情, 对 吧? 或者说 生成 一些 奇怪 的 内容 去 post 到 不同 的 这种 互联网 上。 这个 很多 程度 上 有可能 你 release, 这 是一个 action, 这个 action 导致 的 这个 结果 是 没法 估量 的。

但 另外一个 角度 就是说 我们 要 研究 这个 responsible A I, 或者说 我们是 希望 这个 模型 能 更加 的 为 人类 带来 意。 其实 也是 需要 这方面 的 研究员 去 access 他们的 模型, access 他们的 一些 结果 来 提高。 所以 从 这个 response V I 的 角度, 我 觉得 开 不 开源 有点像 双刃剑 的 感觉。 我也 不确定 说 带 开源 好 还是 不 开源 好。 I 你可以 明显 看到 他们的 action 就是 非常 谨慎 的, 就是说 没有 去做 完全 开源 这 一件 事情。

最后一个 角度 就是说 其实 O B A I 在 重新 组织 架构 之后, 它 并不是 一个 完全 的 非盈利组织。 如果我们 纯 从 商业 的 角度 上来, 其实 每个 开源 背后 我 觉得 它 都是 需要 有一个 逻辑 的。 包括 前一阵子 你可以 看到 stability A I 非常 火 对 吧? Stable division 这些 东西 就 开源 对 他们 来说 其实 有一个 好处 是, 第一 就 他们 非常 自信? 具备 这个 能力 的, 做出 这个 东西, 把 这个 开源 到 大家 的 手上。 但 同时 也是 赚得 了 一波 的 hip 或者 是 怎么样, 这个 估值 也 上升 了 不少。

这个 开源 的 背后 从 商业 的 角度 上 要 去 计划 好 一些 事情。 比如说 这个 I P 的 问题 怎么 解决? 比如说 今天 开源 了 这个 模型, 开源 了 这个 code。 比如说 另外一个 公司 拿 过去 做 一些 商业化 或者 什么, 这个 I P 的 问题 怎么 解决? 包括 整个 回到 这个 组织 架构 怎么 解决? 比如说 公司 里面 V I 里面 谁 来 后续 跟进, 不管 是从 user 这边 拿 一些 feedback k 也好, 或者说 从 开源社区 一起 去 整合, 做 更好 的 下一个 版本 也好。

这里 还有一个 问题 就是说 其实 我们 有些 时候 也能 看到 一些 例子。 就是说 一些 公司 比如说 做一套 东西 开源 出去, 然后 就 人 也 走了, cold 也 开源 了, 人 也 走了, 又 重新 去 做一套。 对 原有 的 公司 其实 从 商业 逻辑 的 角度 并不是 最好的 一个 case, 对 吧? 因为 他们 毕竟 有 很多 前期 的 投入, 好不容易 做到 今天 这个 地步, 然后 最后 一 开源, 然后 整个 也 散了, 对 原来的 公司 来讲 也就 很 discouraged。 就是说 再去 做 下一个 更好 的 版本, 再去 有 这样 持续的 投入。 我 觉得 这些 其实 都是 背后 所 需要 考虑 的 一些 因素。

就 相当于 谁 都 可以 拿来 用。 然后 我 再 基于 你的 在 调试 一个 更好 的 方法, 然后 任何人 都 可以 成立 一家 公司, 对 吧?

对, 任何人 可以 成立 一家 公司, 其他 的 公司 可以 拿着 你的 继续 做。 对于 你 一个 公司 来讲, 比如 尤其是 这种 大公司, 那你 这个 公司 里面 的 这个 小 team 也有 可能 自己 出去 做, 这也是 有可能 这些 问题 其实 都要 考虑 好。

我 觉得 上 一轮 生成式 A 就是 文字 生成 图片 的 这个 领域 的 火爆, 跟 整个 stability 它的 开源 是 有 很大 的 关系 的。 就是 因为 它 开源 了, 所以 比如说 像 mid journey 这些 基于 stable diffusion 来做 的 模 就 火 了。 但是 同时 我也 看到 有 一些 非常 不 好的事情。 就 比如说 还是 会有 公司 去 基于 他们的 开源 模型, 专门 去做 一些 类似 于小 黄图 之类 的。 因为 人 会有 利益 驱使, 那 也会 在 那个 网络 上 传播 特别 不好 的 东西。

对, 是的, 这里 刚好 就 看到 两个 逻辑, 就是说 一个 是从 商业 的 角度, 另外一个 从 responsible A I 的 角度。 其实 stable diffusion 开源 出来 来 之后, 对 他们 自己 我 觉得 也是 一个 双刃剑。 力 出 的话 其实 也 显而易见。 他们 毕竟 是 第一个 公司 去 开源 这样 一个 事情, 并且 这个 东西 是 属于 有 足够 quality 的。 并 不是我 随随便便 的 草根 的 做 一个 软件, 做 一个 模型 就 开源 出去。 他 那个 模型 其实 是 结果 还 算是 不错 的。 开源 出去 之后 昨天 赚 了 一波 民生, 对 吧?

但 创投圈 可能 也 更加 认可 公司 的 这个 能力, 就 大家 都 检验 过, 并 不是说 我们 自己 说 自己 好不好 的 地方, 就是说 有些 公司 可能 就 直接 拿 过去。 其实 我们 能 看到 一些 这样的 公司, 或者说 你 也可以 注意到, 就是 在 这个 开源 之后, 突然 就 冒 起来 一波 公司 说 自己 也能 做 这个。 我 觉得 这个 可能 是 跟 这个 开源 也 不可 分 的。 可能 就 拿了 一些 相关 的, 不管 是 knowledge 也好, 或者说 直接 拿了 模型 find 也好, 来做 一些 其他 的 商业化 的 一些 东西。 这个 其实 一定程度 上 稀释 了 stable division 它 本身 能 做 的 为 这个 市场 带来 的 一些 概率。

我不知道 你知不知道 一家 公司 叫 jasper 他 之前 是 基于 GPT3 的 A P I 接口 来做 的 一个 通过 文字 或者 规划 的 方式 来 给你 生成 一段 类似 于 广告 营销 语, 或者 帮你 写 一篇 论文, 或者 帮你 写 一个 商业 计划书, 它是 基于 G P3 的 接口 来做 的。 然后 在上 一轮 的 融资 中 还 估值 有 15亿, 融 了 1.05亿美元。 我 其实 是在 想像 这种 放在 GPT3 的 架构 或者 A P I 接口 上来 做 的 这种 应用层 的 公司。 那 我们 说 现在 有 GPT3.5 了, 它 是不是 可以 直接 也 把 jasper 这家 公司 给 干 趴下? 这些 公司 它的 优势 是什么 呢? 你 觉得 做 应用层 有戏 吗?

做 应用层 我 觉得 是 完全 有戏 的。 我自己 觉得 jasper A I 这个 公司 做 的 还是 非常 不错 的。 在这里 我 觉得 大家 在 做 的 东西 其实 不在 一个 各层次 上。 比如说 像 GPT3, 或者说 这种 GPT3.5, 甚至 像 我们 刚才 提到 的 这个 reinforcement, 这个 human feedback k 类似 于 这种, 其实我 觉得 还是 在 属于 说 做 有些人 可能 叫做 这个 A I infrared 面的 一些 技术 上 的 一些 创新。 其实 这个 方法 并不一定 说 只能 应用 在 这些 dialog 上。 或者说 这种 更 useful 的 这个 chase。

然后 jasper 我 觉得 是 做 非常 好的 一件 事情, 就是 他 把 整个 垂直 领域 的 这个 生态 想 的 比较清楚, 然后 应用 在 什么 地方, 大概 做 哪些 场景。 在 每个 场景 下面, 其实 并 不是说 你 直接 拿 一个 interface 来 就可以 做 的。 他是 需要 做 一些 有点 像是 这种 雕花 工艺 的。 在 这 上面 对于 某个 应用 场景 做 一些 适配, 做 一些 匹配。 你 如果 看 它的 这个 demo 的话, 它 会有 一些 template, 这些 template 其实 一定程度 上 也是 他们的 一些 经验 积累。 比如说 我 听说 有一个 比较 大 的 一些 客户, 就是说 这种 像 出海 的 广告主, 本身 英文 可能 也没有 那么好, 然后 可以 用 它 来 生成 一些 广告语。 其实 找 这种 场景, 然后 积累 这些 客户, 甚至 去 积累 这些 客户 的 这种 feedback k 我们 刚才 讲到 整个 ChatGPT 其实 也是 learn from 这种 human feedback k。

他们 有 这种 feedback k 那 有可能 是 just for A I 能 做 的 更好。 因为 他们 有了 这样 一个 生态, 有了 这样 一个 反馈 的 机制, 知道 自己是 服务 于 什么, 用户 自己的 定位 非常 清楚。 对我 觉得 应用层 是 完全 有 机会, 做 commercial 我 觉得 是 有 机会。

你 刚刚 提到 了, 就 比如说 说 以前 有 一些 出海 的 公司, 他们 英文 也没有 那么好。 然后 他们 可以 用 jasper 点 AI 来 写 一些 广告 的 营销 语。 就 我 最 开始 理解 jasper 的 应用 场景, 它 除了 可以 帮 这种 市场营销 人员 去 写 比较 好的 这种 英文 广告语 文案 之外。 其实 还有 一部分 用户 跟 grammy 的 用户 有一点 像, 就是 英文 没有 那么好。 然后 我要 写 很多 的 这种 英文 文章 的 用户, 这 确实 是一个 非常 好的 应用 场景。 但 同时 我是 在 想, 现在 有了 ChatGPT 了, 那 这部分 市场营销 人员 跟 出海 的 公司 是不是 可以 让 ChatGPT 来 帮 他们 写 呢?

一定程度 上 他们是 完全 可以 试一下, 然后 有可能 会 稀释 掉。 比如说 已有 的 either grammy 或者说 just for I 其实 你 能 看到 这 GPT 我 其实 是 试 过, 他 有 这种 纠正 语法 的 能力, 你可以 让 他 帮你 改一改 这 段 文字, 然后 确实 会给 你 一个 非常 有意思 的 结果。 后台 可能 包括 一些 生成 文案, 编程 上 也能 做, 但是 因为我 自己 也 不是 这种 专业 的 去 切 广告 的 或者 怎么样。 就是我 自己 觉得 可能 还是 有 一些 用户 的 积累。 像 jesper A I 如果 他们 自己 能 再去 翻 一套 这样的 一个 模型, 或者说 grandly 能 用 这些 技术, 能 用 大 语言 模型 的 技术, 再去 给 他们 现有 的, 比如说 语言, 或者说 看到 的 这种 用户 经常出现 的 一些 错误, 我相信 这个 它 其实 能 做 的 比 generic 的 ChatGPT 要 做 的 更好 的。

你是 说 他 可以 自己 微调, 那 他 如果 没有 开源 的 情况下。

它是 可以 微调 的 吗? 他 如果 没有 开源 的 情况下, 他 就 不能 微调。 这就 又 涉及到 另外一个 问题, 有 一些 公司 是 自己 去 拥有 整个 n ten 的 这么 一套 模型, 还是 说 只能 依赖于 这个 interface。 我相信 其实 很多 公司 如果 只 依赖于 open and interface, 其实 是 非常 危险 的。 所以 我自己 觉得 这些 公 肯定 是在 做 一些 planning, 就是说 能有 一些 自己的 数据, 然后 能 做 一些 自己的 训练。 我 举 一个 非常简单 的 例子, 就是说 我 今天 GPT3 或者 3.5 的 接口 还 在这里, 我 明天 突然 把 这个 接口 封掉 了。 因为 其实 没有 任何, 就是说 我 不一定 得 这个 interface。 那 我 一封 掉, 那 岂不是 下一个 的 公司 都 没法 搞 了, 对。

一下 就 没了 对 吧? 所以 jasper 它 到底 是不是 有 GPT3 的 开源 的 底层 的 代码, 这个 是 不知道 的, 还是 没有 相信 open a.

应该 是 没有 release 给 他们。 但是 这个 GPT3 技术 上 还是 大 比较 掌握 的, 还 比较 成熟 的。 然后 有 一些 open 的, 包括 比如说 你 放到 那个 之前 meta, meta 有 一些 比如说 O P T 就是 open 的 开源 出来 的 这种 模型 外面 其实 是 有 一些 类似的 模型 的。 前几天 还在 linkin N K 上 看到, 对于 每 类 OpenAI 对应 的 模型, 外面 有什么 已经 可以 用 的 这个 模型。 比如说 有可能 对 图像 生成, 因为 jasper A I 其实 最近 也能 做 这个 图像 生成, 那 可能 可以 对应 比如说 stable division reality 出来 的这 套 模型。 那 可以 基于 这个, 比如说 有一个 好的 warm start, 自己的 公司 里面 再去 做 一些 creation, 再去 成立 一些 小 lab, 再做 一些 研发。

对, 所以 他 还是 必须 有 自己的 模型, 他 如果 没有 的话, 他是 没有 办法 做 微调 的。 如果 他 整个 建立 在 只是 GPT3 的 一个 接口 上, 他 就 没有 办法 去做 微调。 除非 比如说 你 刚刚 提到 的 从 meta 弄 一些 O P T 的 模型 来, 然后 他 再 基于 这个 才 可以。

对我 自己 觉得 是 如果 只 基于 open 的 interface, 尤其是 OpenAI。 因为 其实 OpenAI 它 不是 一个 它 开源 这个 interface, 不是说 完全 是 为了 这种 commercialize 或者说 cloud serving 这种。 它 不是 一个 cloud 的 company, 它 可能 更多 的 还是 一个 research 的 这种 company。 就是说 把 这个 interface 开源 出去, 然后 让 大家 去 玩 一 玩, 然后 自己 收集 一些 t bank。 其他 的 那个 human feedback k 里面 是 有 一些 use 上传 回来的 一些 feedback k 然后 能 帮 自己 做 更好 的。

从 他的 这个 逻辑 上, 比如说 他 觉得 这个 模型 已经 不够 好了, 已经 没有 必要 再 maintain 这个 serving。 因为他 整个 serving 也是 需要 有一个 cost 在那边。 他 觉得 比如说 我 今天 开始 想要 把 某 一个 版本 的 GPT 的 interface 停掉, 基于 interface 来说 是 非常 危险。 所以 我相信 不管 是 公司 的 创始人 也好, 或者说 投资人 也好, 如果 完全 是 依赖于 这个, 肯定 是 首先 会有 一些 计划, 就是说 假设 这个 东西 被 会 怎样。

我看 之前 像 OpenAI 的 创始人 sam altman, 他说 大 模型 会 成为 平台 与 基建, 真正 的 机会 在于 中间层, 这个 中间层 应该 怎么 理解?

对, 这个 其实我 也不 记 起来。 说实话 我 觉得 这里 还有一个 事情 是 这 样子。 当我们 讲 这个 机会 的 时候, 我们 具体 到底 在 讨论 什么 呢? 首先 如果我们 看 这个 市场 估值 的话, 其实我 觉得 很大 一部分 的 市场 估值 就是 在 OpenAI 自己 本身, 就 整个 市场 对于 他的 在 做 的 这么 一套 东西 是 非常 看好 的。 所以 他 肯定 是 占 一个 头部 的 一个 相当于 市场 估值。 他 也有 一定 的 技术 瓶颈 在 这边, 但是 他们 也 做 相对来说 是 open, 虽然 说 没有 完全 open 给你们。

所以 从 这个 company value 的 角度, 我 觉得, 不 公安 其实 是 处于 一个 非常 好的 position。 它 其实 相当于 在 做 刚才 你 所 提到 的 大 模型 的 这个 nfa 层面, 或者 是 偏 基建 层。 然后 不同 的 公司 其实 中间层 和 应用层 我 觉得 都是 有 机会。 如果 从 这个 商业价值 的 角度 上, 当然 如果我们 还要 继续 往前 去 push D I 的 front。 那 这个 上面 我 觉得 可能 只有 说 往 基础设施 上去 做, 你 才能 有 足够 的 空间 去做 这样的 提高。

比如说 做 中间层, 或者说 做 应用层 的 这些 公司, 其实我 觉得 这边 的 机会 会 少 一些。 因为 有可能 今天 是一个 大边 模型, 是 通过 这种 generated pretrail 的 方式 来做 预 训练 的。 可能 明天 这个 模型 里面 又要 ebed 某些 components。 比如说 我们 刚才 也 提到 是不是 这种 retrieval 的 components, 或者说 能把 web search 的 这种 东西 引用 过来。 这个 components 我自己 反而 会 觉得 真正 的 机会, 更 长远 的 机会 是在 这些 做 基建 上 的。 因为 就是 有了 这些 基建, 有了 这些 平台, 后面 才会 去 催生 一些 中间层 和 应用层。

你可以 看到 T T P T 它 本身 它 没有 想 去 特别 赚钱 的 方式 去 release 这个。 但 他 如果 哪一天 想做, 他 其实 是 可以 做 的。 他 其实 是在 摸索 一套 更加 scalable 的 方式 去做 这种 应用。 在我看来, 比如说 这种 ChatGPT 也好, 或者说 这种 web GPT 也好, 本质 上 它 其实 能 帮助 用户 解决 很多 问题。 虽然 他 现在 也是 收费 的, 但是 他 其实 并没有 往 挣钱 的 角度 上去 收费。 我相信 他的 收费 仅仅 是 为了 希望 能 稍微 maintain 一下 他 serving 的 一些 开销。

比如说 像 大理, 大理 我是 听说 rumor 都是 public 的 一些 传言, 就是说 是 为了 cover 他的 那个 搭理 模型 在 cloud 上 run 的 开销。 因为 这 样子 他 可能 把 这个 interface tenable 的 run 下去, 才能 去 让 用户 也 参与 进来 理解 这些 模型, 然后 能 做什么, 不能 做什么, 怎么 提高, 对 吧? 但是 哪一天 如果说 他们 有 一些 很 好的 idea 来做 这种 应用层, 其实 是 可以 做 的。 我不 觉得 说 我 不应该 不能 做 这件 事情。

你 觉得 OpenAI 它 有可能 或者 它 未来 最大 的 收入 会 是 怎么 赚钱 的?

我 觉得 还是 从 应用层 上面 会有 更 可观 的 商业价值。 基建 的话 是 相当于 cover 一部分 现在 已有 的 开销 还没有 做 的。 我 觉得 一个 原因 是因为 我们 需要 找到 一个 非常 scalable 的 方式 去做 应用。 然后 需要 等 这个 基建 足够 完善, 从 一定程度 上, 虽然 现在 结果 很好, 但是 我 认为 还是 有 可以 提高 的 空间。 包括 我们 刚才 其实 也 讨论 到 不准确 对 吧? 然 是不是 足够 safe, 然后 是不是 足够 有用。 因为你 刚才 也 提到 有些 话 还 比较 中庸, 那 我 是不是 可以 稍微 加 一两个 字, 我说 表达 你的 观点? 如果 这些 都能 做 的话, 我 觉得 其实 它是 有 这个 价值 在 里面。

所以 其实 现在 大家 并不知道 底层 的 大 模型 要 怎么 赚钱。 但是 当 它 足够 完善 的 时候, 它 可能 是 很多 方向。 因为你 刚刚 也 提到 了, 就是现在 可能 是 这样, 就是 它的 A P I 接口 的 收费, 它 仅仅 是 覆盖 它 现在 云上 跑 模型 的 一些 成本 而已。 那 未来 如果说 它的 模型 足够 强大 了, 加入 了 用户 交互, 它 会不会 把 价格 涨 上去? 仅仅 通过 A P I 接口 赚钱, 这个 也是 有可能 的对 吧?

这是 有可能 的。 但 我 觉得 这个 不是 最好的 商业化 的 一条 途径。 作为 A P I 我 觉得 可能 带来 的 这个 收入 还是 比较。 或者说 我们 如果 看 前面 十年的 很多 公司, 其实 真正 做 A P I 的 公司, 你 也很 难能 找到 几个。 比如说 像 做 人脸识别, 或者说 像 什么, 以前 虽然 是 有了, 就是说 我 release 一个。 S D K 然后 通过 这个 S D K 收取 费用 什么, 我自己 觉得 这个 收入 上 还是 比较 难 有一个 质 的 改变。 我 觉得 真正 的 可能 有 商业化 价值 的 是 一些 应用 层面。 但是 基于 这个 已经 非常 完善 的 这个 基建, 然后 这个 基建 层 能 enable 这个 应用, 已经 到 可以 改变 行业 现状 的 一种 状态。

我 突然 想到 了, 比如说 整个 应用 起来 了, 他 可能 是 比如说 我 向 所有的 这些 创业 公司 收费。 当 应用层 都 挣到 了 钱, 我 向 所有的 创业 公司 收费, 然后 我的 底层 平台 再来 赚钱。

其实 可以 举 一个 另外一个 例子, 就 听 上去 有点像 cloud 或者 cloud A I 我自己 觉得 不是 最 配 得 挣钱 的 一个 方式, 就 把 这些 A I 的 技术 都 给 输出 出去。 可能 我们 也能 想象 一些 很多 垂直 的 领域, 比如说 图像编辑。 现在 已有 的 公司 下楼 比, 他 可以 去做 这种 软件 的 年 化 的 这种 定制, 这种 我 觉得 是 真正 的 所谓 的 商业 模型, 就是说 他 每年 向 用户 收取 一个 subscribe 的 这个 费用, 然后 你可以 去 用 他的 整套 软件。 它 上面 不管 是 你是 一个 professional 的 用户, 还是 一个 比如说 平时 就 拍 一下 vlog 的 这种 用户。 那 其实 都是 相当于 这些 软件 的 这些 客户。 那 他 又 可以 作为 年 收取 的 费用, 相当于 并不是 一次性 买 这个 软件。 我 觉得 这些 逻辑 是 需要 在 应用 层面 思考 好的。 然后 如果 仅仅 是 开源 一个 interface, 比如说 你 按 每个 字 收 多少钱, 对我 觉得 这个 不是 最好的 一个 生态。

好, 谢谢 家 辉, 今天 很 精彩, 谢谢。 好, 谢谢。 这就是 我们 今天 的 节目, 如果 大家 喜欢 我们的 节目, 记得 在 你 所 收听 的 音频 渠道 来 订阅。 我们 中国 的 听众 可以在 苹果 播客、 小宇宙、 喜马拉雅、 荔枝 F M、 蜻蜓 F M 上来 收听。 我们。 海外 的 听众 可以 通过 苹果 播客、 亚马逊 播客、 谷歌 播客, 还有 spotify 来 收听 我们。 感谢 大家 的 收听, 谢谢。