We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S7特快 | GPT4来啦,欢迎加速进入通用人工智能时代!| 硅谷徐老师

S7特快 | GPT4来啦,欢迎加速进入通用人工智能时代!| 硅谷徐老师

2023/3/19
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
B
Bill Xing
硅谷徐老师
郑玉典
Topics
硅谷徐老师:GPT-4 的发布并非仓促,而是 OpenAI 在权衡能力与风险后做出的决定。它在多模态能力、上下文窗口和推理能力上都有显著提升,但也需要考虑其可能带来的负面影响,例如技术滥用等。OpenAI 目前主要基于 2021 年之前的文本数据进行训练,这限制了其对 2021 年之后事件的理解能力。 郑玉典:OpenAI 的模型迭代计划涉及算法改进、算力提升和数据更新三个方面,这三个方面都在持续改进,没有天花板。大模型的数据来源不仅仅是公开可获取的网络数据,高质量的、特定领域的标注数据也是非常重要的。未来大模型的终极形态可能是输入和输出都包含多种模态(文字、图片、语音、视频等)。OpenAI 的成功与其专注于解决与人类在线交互的问题、强大的系统工程能力以及人才密度有关。在 GPT-4 的技术细节上保持了高度的保密性,这可能是出于商业竞争和安全风险的考虑。 Bill Xing:GPT-4 在文本理解和逻辑推理方面都有显著提升,但仍未达到完美,未来的迭代方向比较清晰,但多模态能力的发展方向仍不明确。OpenAI 目前可能处于接近盈亏平衡的状态,其定价策略可能主要基于成本考虑,未来可能会有降价空间。开源模型虽然在某些方面不如 OpenAI 的模型,但在特定场景下可能足够好用,类似于芯片行业的多样化发展。大模型的应用发展需要考虑网络效应,包括效率连接和情感连接,才能建立更强的竞争壁垒。大模型的护城河不如芯片行业深,未来竞争将更多地体现在应用生态的构建上。

Deep Dive

Chapters
本期节目讨论了 GPT-4 的发布,它比 ChatGPT 更强大,因为它支持多模态输入(文字和图像)、更长的提示词以及更强的推理能力。节目嘉宾还讨论了 GPT-4 的迭代计划以及 OpenAI 为什么选择在此时发布该模型。
  • GPT-4 支持多模态输入(文字和图像)
  • GPT-4 支持更长的提示词(最多 32000 个字符)
  • GPT-4 的推理能力显著增强
  • GPT-4 的训练数据主要基于 2021 年之前的文本

Shownotes Transcript

用 声音。

碰撞。

世界 生动活泼。 Hello 大家好, 我是 丁丁, 欢迎 收听 全 新一集 what next 科技 早知道, 大家好, 我是 刘灿。 在 ChatGPT 面世 仅仅 四个 月 之后, open I 就在 美国 当地 时间 3月14日 周二 宣布 史上最强 模型 GPT4 正式 上线。 谨慎 如 谷歌, 竟然 也 在 同一天 宣布 了 自家 产品 的 A I 工具 升级。 而 随后 3月16日 微软 马上 创造 了 另一个 刷屏 热点, 放出 了 由 GPT4支持 的 copilot office 全家 桶, 正式 引入 GPT4 推特, 甚至 出现了 GPT5、 GPT6 这样的 热 搜 关键词。 在 AI 行业 重磅 消息 不断 出现 的这 一周, 硅谷 徐 老师 与 代言 第一时间 就 连线 了 硅谷 的 A I 创业者 郑 钰 点 以及 一级市场 投资人 bill, 共同 讨论 所有 GPT4, 可能 你 会 好奇 的 问题 就 比如 硅谷 C E O 到底 是 怎么看 GPT4, 未来 还有 哪些 新 机会 值得 我们 好好 抓住 呢? 这 一期 加急 完成 的 科技 早知道 第七 季 特快专递, 希望 你 会 喜欢, 欢迎 收听。

其实 上周 真的。

是 可以 载入 历史 史册 的 一周 了。 那一边 是 硅谷 银行 的 倒闭, 然后 卖 它 大幅度 裁员。 那一边 又是 像是 OpenAI GPT4 的 发布会, 然后 包括 微软 的 copilot 歌 宣布 他们的 A I 工具 整合 进了 workspace, 还有 像 斯坦福 的 alpaca, 就是 这个 羊驼 开源 语言 的 这个 模型 的 发布。 当然了 也有 还有 我们 国内 的 这个 百度 文言 一心。 就 感觉 我们 走 在 了 一个 历史 的 十字路口。 所以 我们 今天 就 来 和 大家 一起 on pack 一下 过去 的这 一周 的 各种 发布会, 然后 他们 对 我们的未来 代表 了 什么? 我们 今天 是 四个人 一起来 聊 这个 话题, 首先 是 我们的 host 徐 老师, 今天 和 我 一起来 主持。

Hello 徐 老师, 你好, 丁 家 谢谢 bill 跟 玉 典 一起来 讨论一下 这个 话题。 Bill 跟 玉 典 你们 来 介绍 一下 自己。

Bill 已经 来过 我们 一次 节目 了。 对, 这是 第二次 来了。

对的, hello 大家好。 对我 我是 bill。 我 现在 在 做 科技 投资 之前, 主要 的 关注点 是在 开源社区, 在 SARS。 然后 过去 一年 也 看 了 非常 多 的 底层 的 A I 模型 的 进展。 随着 GPT 的 不断 的 演进, 其实 我们 现在 的 视角 也 被 科技 的 变革 打开。 我 今年 的话 除了 一些 底层 的 info 的话, 其实 也会 关注 整个 A I 对 全 行业 各个 类型 产品 的 颠覆式 创新 的 机会 了。

谢谢 bill。 然后 我们 一位 新的 朋友 是 御 典 郑 裕 典, 她是 香港大学 的 P H D, 然后 博士 研究 的 是 数据库 和 机器学习。 后来 他 加入 了 twitter 和 news break, 负责 广告 以及 信息流 的 推荐 系统。 现在 他 正在 硅谷 进行 的 AI 的 一个 落地 创业 的 项目。 他在 这个 大 模型 在 业绩 的 使用 和 训练 上面 都有 蛮 多 的 经验 的。 Hello, 欢迎来到 我们 今天 的 节目。

Hello, 大家好。 然后 也是 像 主持人 刚才 说 的 一样, 这 波 open I 各种 的 大 模型, 包括 GPT, 包括 check GPT 以及 GPT four。 最近 的 这个 产生 确实 对 整个 行业 的 颠覆性 的 效果。 就像 大家 说 的 一样, 很多 行业 可能 都能 用 这个 新的 一种 模型, 新的 一种 范式 重新 做 一遍。 所以 这 也 比较 motate 我自己 就是说 离开 之前 的 公司 来进行 新的 一波 模型 的 创业。 我也 准备 all in.

进去 整个 这一次 的 GPT4。 然后 我们 刚好 那天 看完 发布会 之后, 然后 浩宇 就在 群 里面 说 哇呀 这个 是 比 这个 ChatGPT 还要 十倍 的, 的 这个 让人 惊讶。 其实 GPT3.5 也就是 拆 GPT, 它是 去年 11月30 号 发布 的, 然后 其实 不到 四个 月 GPT4 就是 出来 了。 我 就 觉得 这个 是不是 也 太快 了 一点。 那 GPT4 到底 和 GPT3.5 拆 GPT 这个 不同 在哪里? 我不知道 这个 是 要不然 一点 先 帮 我们 说 一下。

好的, 我 现在 简单 介绍 一下。 GPT4 这个 东西 官方 出现 可能 是在 一两周 之前, 但 其实 包括 之前 的 一些 消息, 包括 很多人 在 比方说 在 各种 技术 博客 或者 linking 上 发表 的 消息。 GPT4 真正 出现 时间 其实 是在 去年 的 8 9月份。 然后 一些 比较 准确 的 消息, 比方说 一个 很很 著名 的 硅谷 创业者 和 投资人 叫 read hofman, 他 其实 在。

林垦 上 分享 这个。

创始人 没错。 他说 去年 8 9月份 其实 已经 拿到 了 G P4 的 一个 技术 的 版本, 然后 在 G D 4上做了 一些 专门 的 一些 尝试, 还是 很强大 的。 但 GPD4 最近 这 段时间 在 干什么? 为什么 现在 才 发布 呢? 主要是 他 能力 的 强大 是 一方面。 再 一个 他他 需要 发布 被 这么 多人 使用, 但是 他 需要 会 考虑 带来 的 一些 风险性 的 效果。 比方说 用 GPT4, 他 能力 这么 强大, 我们 不能 去 作恶。 比方说 你 告 他 我想 制造 一个 炸弹, 他 肯定 不能 告诉你 去 怎么 居然 知道, 对 吧? 所以 他他 这 段时间 其实 在 处理 一些 更多 的 这样 一种 更 对 整个 这个 社会 有 影响, 有 积极意义 的 一个 场景 或者 一个 效果。

回到 刚才 问题, 它 比 3.5 厉害 在哪里 呢? 或者说 比 ChatGPT 厉害 在哪里 呢? 总结 来说 有 三个 方面。 第一个 方面 其实 是 它 之前 的 这个 包括 GBD3和 3.5 主要 基于 输入, 只是 文字, 它是 基于 一个 对话 的 形式。

G P4 第一个 就是 打开 了 多 模态 的 优势, 相当于 它 输入 不仅仅是 文字, 还 可以 接收 图像。 作为 输入。 就是说 你可以 理解 图像 里 的 一些 信息。 比方说 给你个 图, 给你 一段 文字, 你 可能 很 好的 帮助 我 去 分 分析图 里边 的 内容, 或者 给你 一个 曲线, 你 甚至 能 告诉我 这个 曲线 代表 的 是 什么样 的 样, 进行 一些 数据分析 等等。 目前 它的 输入 是啊 图片 和 文字, 它的 输出 还是 一个 文字。 第二个 就是说 它是 一个 输入 的 token 的 限制, 它 英文 叫 a prompt, 就 相当于。

你 跟 他 提示 词? 是 提词。 对。

没错。 之前 来讲 就是 由于 我们 模型 的 一些 各种各样 的 能力, 包括 训练 的 一些 能力, 推理 的 那些 能力, 包括 训练 的 一些 成本。 之前 的 可能 主要 限制 在 4096 这样 一个 词。 当然 它 定义 的 词 跟 你可以 理解 成 跟 英文 的 词 差不多。 在 OpenAI 官方 的 文档 中, 1000个 他 自己 定义 的 词, 它 就 token 可能 对应 大概 750个 英文 字符, 这样 其实 差不多 一对一 的 一个 关系。 其实 4000个词 这个 限制 其实 还是 比较 大 的。 比方说 你的 对话, 你 想 自然 的 一个 对话, 那 需要你 要 记住 之前 的 一个 对话 内容, 对 吧? 那 现在 它 升级 到了 能 支持 最 多是 32000个 这个 字符。 所以 GBD4 它 公布 了 2个API, 一个 是 能 支持 8000个字符, 一个 是 能 支持 32000个 字符。 所以 这个 解锁 的 它 能 生成 这个 提示 词 的 一个 量 的 一个 数量, 还是 挺 致命 的对 第三个 也是 它的 一个 准确率 能 做 的 一些 任务 的 难度 的 提升。

简单 来讲, 之前 那些 版本 它 可能 能 做 一些 简单 的 一些 对话, 但是 不能 做 一些 比较复杂 的 一些 认知 类 的 东西。 比方说 高中 考试, 比方 I C T 考试, 或者说 大学 的 一些 可能 是 G R E 考试。 比方说 你 可能 进行 一些 奥林匹克 竞赛, 主要 奥林匹克 竞赛 可能 在 每个 维度 物理化学 等等。 包括 如果你 是一个 程序员 的话, 可能 你 平时 会 刷 一些 题, 刷 一些 比较 难 的 一些 题, 比如 lead code 一些 题 等等。 现在 也就是说 GPT4 它 能 在 很多 的 这种 指标 上 就 做 的 题目, 他 自己的 能力 有 大规模 的 提升。 在 很多很多 非常 难 的 一些 项目 上 他 都能 做到。 就是说 跟 人类 相比, 相当于 比较 顶尖 的 10%左右 的 那些人, 能 达到 那样的 一个 成绩。 那 之前 的 版本 可能 都 只能 在 末尾 的 10%, 所以 主要 它 解锁 的 是 这 三个。 一个 是 多 模态, 第二个 是 输入 的 提示 词 的 一个 提升, 第三个 是在 特定 的 一些 环境 下, 就是说 它的 推理 能力 有 大规模 的 增强。

对我 今天 其实 是在 GPT4 上面 问 了 他 自己, 你 GPT4 比 这个 拆 GPT 区别 或者 是 它 优势 在哪里? 他 没有 能 回答 这个 问题, 到时候 我自己 的 这个 数据 还是 基于 21年 的对, 所以 回答 不了。

这也是 这个 GPT4 目前 一个 比较 大 的 限制, 就是说 open a 它 大家 开玩笑 说 open a 它 叫 OpenAI, 但是 有点 是 close A I 的 性质。 简单 来说, 他 目前 训练 的 这个 文本 大部分 是 基于 2021年 之前 的 文本。 2021年 之后 有 一定 的 文本, 但是 数量 非常少。 所以 大家 如果 去 使用 这个 东西 的话, 那 可能 会 想 我 怎么能 更好 的 把 之后 的 这个 文本 给 进去。 现在 OpenAI 开放 的 接口, 一种 可能 是你 把 之后 的 文字 堆成 这个 提示 词 给, 所以 这就 需要 他 把 这个 提示 词 的 这个 量给 打开。

第二 部分 通过 一种 叫 可能 叫 find tune, 可能 叫 微调 的 一种 方式 对 微调 这个 模型。 但是 微调 这个 模型 目前 只在 G P3 的 一个 版本 上 提供了 一个 微调 的 一个 场景, 而且 微调 的 费用 也是 异常 的 贵, 所以 这个 其实 不是说 很 方便 了 大家 在 上面 进行 更多 的 一个 使用。 所以 这个 其实 也是 open I 后面 大家 也是 比较 希望 他 把 这个 生态。

更好 的 去 打开。 其实 我们 当时 GPT4 出来 之后, 我们在 群 里面 也 在 说 徐 老师 其实 当时 就说, 我知道 其实 GPT5和 GPT6 也 在路上 了, 他们 也 正在 开发 了。 然后 包括 刚刚 一点 也 在 说, 其实 去年 GP48月份 就 已经 模型 差不多 了。 我不知道 大家 有没有 这个 猜测, 他们 内部 是 怎么样 的 一个 开发 的 迭代 的 这样的 一个 规划, 他们是 平行 在 进行 吗? 还是 怎么样? 然后 不同 的 模型 之间, 他们的 除了 大小 的 训练 的 区别 之外, 还有什么 是 不太 一样的 地方。

这 里面 我 觉得 肯定 有 好几个 维度。 一个 是 算法 会不会有 一些 新的 进展 或者 提高, 肯定 有啊, 只是 他 没 告诉 我们我们 不知道 而已。 然后 另外一个 算 力 可以 用 更大 的 网 更大 的 集群 来 训练 这个 模型, 我 觉得 也是, 然后 数据 也是 在 不断 的 更新。

过去 几个 月 很多人 会说, 他 不就是 把 网上 的 数据 都 已经 发 走了, 那那 数据 也 不会 更多。 我 觉得 这 是一个 蛮 大 的 一个 误解。 数据 不 只是 说 把 网上 你 能够 什么 wikipedia? 这种 数据 给 扒 下来, 那 当然 是 八 的 差不多 了。 但 更多 的 是 很多 时候 一些 某些 行业, 某些 领域 的 标注 数据, 而且 是要 高质量 的 数据, 我 觉得 这个 还是 有 无限 的 空间 可以 走。

就 比如说 最近 刚才 一点 说 的 GPT four 这个 模型, 它 做 一些 专业 考试成绩。 从 本来 上 一代 的 差生 现在 变成 好生。 那 为什么? 大 概率 就是 因为 它 在 这方面 的 标注 数据 给 加上 去了。 然后 每个 行业 每个 领域 有 大量 的 标注 数据。 即使 是 某 一个 行业, 你 看上去, 我 不就 加 一些 某些 工业 数据 什么。 但是 这些 企业 它 会 做 很多很多 数据, 人 也 人的 那个 行为 也会 不一样的。 所以说 你 把 这些 都都 算上去。

其实我 觉得 我们 现在 还是 在 很早 从 一个 模型 的 角度 上 来讲, 不外乎 就是 算 力 算法 跟 数据, 我 觉得 这 三 方面 都 会有 蛮 大 的 提高。 我 觉得 最 可怕 的 ChatGPT 出来 以后, 然后 这一次 GPT for 出来 以后, 让 我 感觉到 的 就是 是 看不到 天花板。 这一次 关于 GPT4 就 这么 惊人, 那 以后 产生 图像 怎么样, 是不是 也会 有 大 突破? 好像 有人说 会有 大 突破, 我也是 拭目以待。

怎么 那么 顺利。 就是说 这个 大 突破, 咱们 其实 是 想 的 是 往 哪个 方面 再 考虑。 因为 这次 好像 感觉 拆 GPT 上面, 它的 大家 用 完 之后, 感觉 还是 很多 的 这个 限制 和 它的 这个 并不是 那么 的 聪明。

但是 好像 GPT4 出来 之后, 因为 它是 多 模态, 就 感觉 它 能 帮助 我们 提高 的 生产 效率 的 这个 方面 就 高 多了 很多。 然后 可以 帮助 大家 很快 的 能 生成 一个 代码。 然后 可能 平时 虽然 说是 做 一个 disco 的 这样的 一个 机器人, 需要 一个 工程师 他 可能 几个 小时 的 时间。 一天 虽然 不是 很长, 但是 也是 几个 小时 时间。 但是 整个 在 这个 greg broke man 他的 这个 demo 里面, 感觉 像是 可能 我 十分钟 就 搞定 了。 对 这个 其实 是 提升 了 非常 多 的 这样的 一个 工作效率。 我不知道 刚刚 这个 毫无意义 讲 的 可能 在 图片 方面 或者 在 其他 的 这个 多 模态 方面, 还有 哪 一些 的 空间, 我们是 觉得 他 可以 去往 那个 方向 走 的。

我们 让 bill 说 说吧。 对。

好的。

对, 刚好 我自己 也 感觉 在 文本 这块 的话, 其实 后面 的 路线 就 相对 比较 清晰 了。 如果我们 看 这个 GPT4, 它 其实 在 文科生 的 问题 上, 他的 回答 其实 是 更 优美 的, 然后 是 更 充分 广泛 的。 在 理科 的 回答 上 逻辑推理 确实 我问 了 他 很多, 比如说 脑筋急转弯、 数学 问题, 是 比 这个 3.5 要好 不少 了, 但 目前 都 没有 达到 完美。 而且 open I 内部 现在 通过 他 发 了 新的 论文, 其实 也 看到 他 有 非常 多 的 考试 的 这个 分数 作为 奔驰 棒。 所以 后面 怎么 去做 模型 的 评估, 怎么 去做 迭代, 其实 这个 路线 是 比较 清晰 的。

但是 比较 神秘 的 一点, 其实 我自己 也 还 不是 特别 清楚 的。 就是说 在 多 模态 的 这个 方向 上, 他 应该 往 哪个 方向 走, 就是 我们 目前 能 看到 的 事情 就是, 其实 他在 视觉 的 能力 还是 非常 初步 的。 而且 因为 还没有 正式 给 公众 公开 他的 这个 能力。 所以 目前 我们 看到 的 只是 说 文本 的 之前 的 能力 是 不断 的 在 帮助 视觉 的 功能 来去 推向 应用 场景。 比如说 文字 生成 图片, 包括 发 一个 图片 让 他 来做 文本 的 解释, 但是 视觉 的 内容 现在 还没有 反哺 到 他 对于 文本 以 对 整个 世界 的 理解。 因为我 我们 如果 对 标 人 的话, 其实 人 其实 是 不断 的 去 看 外界 的。 这个 其实 是 图片 连续性 的 图片 和 视频, 然后 结合 大家 的 这个 语言 的 话语 来 去做 综合 的 迭代 学习 的。

我 其实 是 非常 期待 未来 随着 它 开放 更多 的 视觉 能力, 有没有 什么 能力 的 涌现, 是 说 有了 这个 视觉 能力 之后, 结合 文本 的 理解 能够 做 更 高维 的 抽象 理解, 更 高维 的 推理。 同时 的话 我也 跟 很多 research 交流, 其实 这个 实现 方式 我 觉得 现在 大家 都 还有 争议, 或者 open 还 保持 了 一个 非常 内部 的 一个 神秘 因素 在 里面。 就是 怎么 去 把 这个 图像, 尤其是 连续 的 视频 和 文本 综合 的 去做 训练 理解。 我是 感觉到 外界 的 很多 的 researcher 都 没有 特别 明确 清晰 和 统一 的 这个 路线 的。 所以 我们 现在 也很 好奇, 就是 这个 事情 到底 好不好 做。 然后 能不能 未来 这 一两年 就 能够 达到 一个 比较 好的 可用 给 公众 开放 的 这个 效果。

一点 这块 有没有 什么 需要 加 的?

对我 挺 同意 两位 说 的, 我 再 补充 一点, 其实 你 如果 从 一个 数学 问题 来看 的话, 之前 可能 GPT3GPT3.5 它的 输入 是 文字, 它的 输出 也是 文字。 那 现在 GPT4 的 输入 是什么 呢? 输入 是 文字, 加 图片 它的 输出 是 文字。

如果你 只看 输入 和 输出 的话, 那 其实 他们 缺少 了 什么? 如果 你看 你 之前 你 刷 文字, 可能 就是 读 一个 小说, 对 吧? 有一天 这个 小说 突然 出了 一些 图片, 那你 觉得 读 起来 更 有意思 了。 后来 可能 这个 小说 又能 读出来 声音 了, 再 后来 这个 小说 又 变成 了 一个 可能 短 视频 一个 视频 的 形式, 那你 会 觉得 更 生动。 所以 我 感觉 最后的 一个 终极 形态 一定 是 可能 输入 和 输出 都是 这种。 比方 文字 加 图片、 加 语音, 甚至 加 图像, 或者说 加 这个 视频 的 一种 形式, 对 吧? 所以 就是 把 这个 整个 的 大家 的 一个 观感 给 打开, 我 觉得 这个 是 很 重要 的。

另外 一块 就是说 从 刚才 来讲, 就是 OpenAI 为什么 在 这个 时间点 发布, 以及 它 为什么 能够 发布 这个 事情。 我 觉得 还是 说 他 内部 整体 来讲, 如果 你看 他的 组织 架构 的话, 就是 一个 他 当初 其实 也是 个 小 公司。 但是 他 小 公司 非常 专注, 他 就是 要 专注 解决 跟人 去 online 的 一个 问题。 就是说 他 需要解决 他他 把 这个 模型 给 训练 到 跟 人的 一些 可能 表现 比较 趋近 的 一个 程度。

它 内部 其实 你 如果 看 那个 GPT4 最近 发表 的 技术 稿 的话, 它 其实 把 它 内部 的 架构 都 给 大家 公布出来 了。 包括 可能 有什么 预 训练组, 有 这种 强化 学习组, 有 数据 标注 组, 数据 心理 组 等等。 所以 他 其实 给 大家 的 一个 就是 一方面 他 给 大家 说 OK 我 有 这么 多 的 人才 密度。 然后 这个 东西 其实 不是说 模型 训练 那么 几十 行 代码 的 事情, 它是 一个 很 庞大 的 一个 系统工程。 就是说 每个 模块 都 得 需要 堆积 人才 的 密度, 然后 才能 去 完成。 然后 另一方面 如果你 看到 的话, 其实 经常 一个人 会 兼 多个 职位。

我 给 大家 举 一个 很 有意思 的 例子。 如果 大家 知道 ChatGPT 的话, ChatGPT 是 基于 一个 论文 叫 InstructGPT 那 篇 paper 的, 就是说 共同 一 作 叫 欧阳龙。 然后 他 的话 如果你在 他的 内部 架构 看 的话, 他是 一个人 建 了 七八个 模块, 他在 七八个 模块 中都 有 他的 名字。 所以 其实 他 虽然 内部 架构 可能 看着 就是 有 不同 的 组, 但 其实 组 跟 组 之间 的 分工合作 可能 不是说 那么 明确。 也就是说 一个人 其实 能有 很强 的 这种 感觉, 去 知道 其他 组 做 的 一个 事情。 而且 一个人 可能 能 身兼 各种各样 的 职位, 能 去 发挥 一个人 更大 的 能力。 这个 其实 也是 给 我们 很多 的 创业 公司 很多 的 一些 灵感。

其实 OpenAI 其实 一直 是 保持 的 比较 神秘, 因为 刚刚 咱们 这个 线下 刚刚 也 聊 了 两 嘴。 他们 在 最早 的 可能 其实 还是 公布 蛮 多 他们 自己的 一些 算法, 然后 一些 他们 自己的 这个 paper 的 东西 的。 当然 现在 可能 到了 这个 应该 是 GPT3, 再 往后, 他们 好像 就 变成 这个 for profit, 就是 这个 盈利 公司 之后, 从 非盈利 转到 盈利 之后, 他们 其实 就 变得 非常 的 神秘。 大家 外界 其实 都在 猜 他们是 怎么 做到 的对, 我不知道 大家 有没有 什么 common 在 这 一块儿, 觉得 为什么 他们 要 这么 做, 然后 对 他们 未来 的 业务 上面 是 怎么样 考虑 的。

之前 其实 open a 基础 的 架构 其实 是 基于 google 的 一个 架构 叫 transformer。 就是 他们 发布 了 一个 paper 叫 attention is all you need, 那 篇 其实 是 奠基 了 后面 的 一个 发展史, 可能 是 也 奠基 了 一个 A G I 给 大家 希望, 叫 artificial general intelligence。 就是说 希望 把 这个 人工智能 能 用 在 方方面面。 然后 你 会 发现 那 篇 picture 其实 是一个 大一统 的 效果, 它 有一个 叫 encoder 和 decoder。 其实 在那 篇 配置 之后, 其实 你 会 发现 OpenAI 和 google 本身 可能 采取 了 两种 架构, google 就 着 这个 encoder 层 其实 发表 了 bert, 这个 encoder 是什么 呢? 就是 类似 于 完形填空, 就是说 可能 给你 一句话, 你 中间 抽出来 一个 词, 然后 你 预测 中间 这个 词。

其实 这个 问题 其实 是 比较简单 的。 就 像你 股票, 你知道 过去 一个月 的 季度 突然 抽出来 一天, 你 预测 这一天 到底 在 什么 点 上, 那 其实 还是 比较 好 预测 的那 OpenAI 采取 的 一个 架构, 包括 后面 的 gbt 123, 其实 采取 了 后面 一个 纯 decoder 的 架构。 就是说 你知道 前面, 我 去 预测 后面, 对 吧? 就是说 你知道 过去 一个月 的 股票 这个 记录, 我 去 预测 下 一天 的这 股票 的 发展。

这个 问题 其实 是 蛮 难 的, 就是说 首先 在 技术 架构 上 选择 了 一个 蛮 难 的 一个 问题, 这 是一个 很 重要 的 一个 技术 选型。 再 一个 就是说 他 其实 刚 开始 的 时候 还 比较 open。 比方 GPT123, 它 其实 文章 都 发表 了, 但是 很多 其实 细节 也没有 发表。 比方说 GBD3, 他 发表 了 文章 以后, 很多 机构 想 去 把 这个 论文 重现 一下 在 自己的 系统 架构 上, 但是 重现 的 可能 效果 都 不是 特别 好。 当然 就是说 facebook 也是 现在 的 meta 了也 开源 了 一个 叫 O P T 的 模型。 整体 来讲, 开源 这个 做法 还是 大家 比较 推崇 的。 比方说 他 把 所有 好的 参数 都 给 大家 开源 了。 但是 整整 体 大家 估 下来, 其实 比 GPT3 的 这个 模型, 可能 整体 上 各种 效果 还是 稍微 差一点。

对, 但是 GPT3 以后 它 其实 变得 越来越 封闭。 就 ChatGPT 这 一波, 其实 目前 开放 的 基本 只有 一个 paper 叫 instruct 的 这些 B T 就是说 它 能 去 根据 人的 意愿。 去做 一种 很很 好的 一种 对话 形式。 当时 微软 投资 OpenAI 的 时候, 就说 OpenAI 内部 其实 出来 一帮人 创建 了 一个 公司 叫 anthropic author bic 在 InstructGPT 前后 一个月 其实 也 发布 了 一篇 paper, 大 概率 是 讲 ChatGPT 怎么 去做 的。

简单 来讲 可能 用 一种 就 三步走 了。 比方说 先 训练 一个 supervise 的 这个 fine tuning, 基于 这个 pre training 的 模型, 再 训练 一个 reward model。 最后 再 用 大家 耳熟能详 的 R L H F reinforcement learning with human feedback, 去 把 整个 的 pipeline 给 走 起来。 这 是一个 大家 觉得 这 一套 至少 是 架构 上 大家 是 明白 的, 但是 具体 做出 什么样 的 效果, 这个 可能 需要 很多 的 时间。 但是 GPT4 这 波, 他 发布 了 一个 98页9 十多页 的 技术 文档。 但 其实 你 发现 技术 文档 中, 你 读一读 就 知道, 中间 有 一段 说 由于 各种各样 的 顾虑, 我们 其实 没有 开放 任何 的 技术 细。

也 包括 数据, 包括 这个 模型 怎么 训练 呢? 包括 模型 的 大小, 甚至 模型 的 大小, 大家 都在 去 猜 GPT3 大概 多大, 这个 ChatGPT 这个 接口 大概 多大, GPT4 这个 模型 大概 多大。 因为 GPT4 慢 很多, 大家 都 猜测 可能 G P4 的 模型 要 大 很多, 对 吧? 所以 G P4 这块 它是 非常 必然 的, 而且 让 大家 更 感兴趣 的 是 就是 刚才 bill 和 徐 老师说 的 这个 如何 把 这个 文字 和 这个 图片 两种 不一样的 东西 能 结合起来。 就是现在 有 很多 猜测 的 方式 了。 因为你 如果 只 做 文字, 比方说 说 你 如果 只 做 文字 或者 只 做 图片 的话, 其实 不是说 那么 难。 比方说 文字 有 个 transformer 架构, 你 图片 可能 OpenAI 自己 之前 也有 一些 clip 的 架构。 然后 包括 可能 有 一些 stay, stable diffusion, 包括 可能 一些 o open a 自己 也 发布 了 一些 什么 大力 兔 这些 东西。

其实 如果 只 做 图片 或者 只 做 图片 生成 文字, 或者 是 文字 生成 图片, 其实 这个 东西 可能 不是说 那么 难。 但是 怎么 把 文字 跟 图片 这样 结合, 作为 一个 更好 的 一个 更 自然 的 一个 训练, 这个 其实 大家 有 很多很多 的 猜测。 我 个人 的 猜测 可能 是因为 open I 自己的 架构 一直 追求 美。 什么 叫 美 呢? 就是说 简单 可 预测, 就是说 不用 人为 的 去 干扰。 所以 我自己 觉得 他 可能 真的 是 把 文字 和 图片, encode 的 成 一种 可能 比较 自然 的 一种 形式。 然后 通过 这种 形式 可能 用 一种 之前 的 这种 decoder 架构 直接 给 训练 出来。 我 觉得 他 整体 的 训练 架构 不会 特别 复杂。 因为他 自己的 一个 整体 的 一个 设计 思路 也是 比较 支持 这个, 比较 认为是 第一性 原理。 当然 这是我 自己的 一些 猜测 了, 就是 大家 可能 其他人 有 不同 的 猜测。

我 看到 更多 的 一些 观点 可能 就是 基于 在 商业 上 的 考量。 因为 他们 其实 现在已经 是 跑 在 最 前面, 输 的 最多 的 关注。 但是 其他 的 竞争对手 都在 往前 在 冲, 往前 在 赶。 他们 可能 想说 我们 不要 发布 那么 多 的 细节, 然后 让 别人 去 尽量 去 试错。 其实 这样的 一种 论断 其实 在 市场上 还是 蛮 多 的。 我不知道 徐 老师 或者 是 bill 这块 儿 是 怎么看 的, 有没有 其他 可以 想 想 聊 一下 的。

我 觉得 这 里面 有 两层 可能 有 两层 原因, 一层 原因 可能 跟 你说的 有关。 这是 必然 的, 因为 毕竟 这 是一个 竞争环境 还是 蛮强 的, 虽然 说 他 现在 是 跑 第一。 另外 一方面 我 觉得 也是 跟 他的 一个 背后 的 一个 从 成立 OpenAI 这一天 开始, 他们 就 预见到 以后 会 做到 A G I, 然后 预见到 A I 人工智能 能够 超越 人。 在 这种 情况 下面, 如果 这些 能量 被被 坏人, 不管 是 哪个 领域 的 坏人 拿去, 总归 不是 一件 好 事情。

那个 GPT2 的 时候, 他 还 告诉 大家 我 有 多少 个 参数, 15亿的 参数。 然后 到了 GPT3 的 时候, 他 告诉 大家 1750亿 的 参数。 这个 是 整个 业界 都 惊呆 了, 能够 做 这么 大。 然后 之后 他 就 那个 ChatGPT 出来, 去年 11月30 号, 包括 这一次 GPT for 出来, 他 就 索性 不 告诉 你是 多少 参数 了, 大家 去 猜。 说老实话, ChatGPT 有可能 是啊 甚至于 一个 两个 数量级 比 1750亿 都 少 都 有可能。 因为他 后来 做了 很多 优化, 高 也有 可能, 刚才 一点 提到 了 这一次 的 那个 GPT4 的 那个 model 模型 会 慢一点, 这个 你 有 感觉到 吗?

那个 雨点, 对, 是的, 它的 A P M 慢 了 3到4倍。 因为他 他 最近 开放 申请 的 A P I, 我是 大概 第一时间 申请 进去 的。 我 大概 昨天 前天 的 时候 已经达到 了 A P I 的 权限, 包括 他 自己的 一个 他 有一个 对话式 的 窗口, 包括 A P I 他 自己是 比 ChatGPT 那个 版本 慢 很多 的。 我 觉得 直观 上 感觉 都是 3到4倍, 而且 对话 产生 的 也 很慢。

我 稍有 感觉, 但 我 却 不准 是因为 我的 问 的 问题 难 还是 怎么样。 但是 你 刚才 这么 一说, 我 觉得 我也 确实 是 有 这种 感觉。 刚才 丁 佳, 你 在 群 里面 好像 还说 GPT4有 一个 限制, 对 吧? 3个小时 只能 用 25个GG5 25条。 对, 跟 可能 跟 这个 也有 关系。

对, 他说 还是 下周 可能 还是 根据 大家 的 这个 需求 的 情况, 他们 还在 不断 的 在 调整, 肯定 现在 是 这个 需求量 高, 然后 他们 自己 你的 这个 供应 能力 供应 不 上了。 我不知道 可能 在 它的 成本 和 它的 现在 的 收入 上面, 我不知道 大家 有没有 这个 计算。 因为我 看到 了 一些 数据, 我不知道 就是 单一 的 这个 源头, 不知道 这个 是不是 对的。 就 很多人 说 他 一个 这种 提示 词, 你 去 问 他 的话, 大概 他的 成本 是在 1到3个 美元 这 样子。 我不知道 这个 数字 是不是 对的, 我不知道 大家 有没有 研究 过 这个。

没有 没有, 他 那个 没有 是 吧? 没有 不, 没有 那么 贵。 刚 出来 的 第 11月30 号 出来 以后, 然后 伊朗 mask 问 过 sam, 就是 OpenAI 的 这个 C E O 说 你 这个 都 多少 贵? 他 当时 我的 回答 是 说 大约 是 low single digit sense, 也就是说 大概是 可能 两分 钱 一分钱 或者 四分 钱 对 吧? 大约 是 这 样子。 但是 后来 我 觉得 他 应该 是 有 ChatGPT, 应该 有 大大的 优化, 可能 低于 这个。 然后 GPT four 第四版 出来, 有可能 第四版 的 那个 开销 会 高 一点。 但 这个 我 觉得 只是 时间 问题, 有一个 一个 数量级 的 往下走, 我 觉得 基本上 是 铁板钉钉 的, 而且 是在 不久 的 将来, 这个 也可以 看看 那个 bill 御姐, 你们是 怎么看 这个 cost 的。

就 最早 的 时候, GPT3.5 的 时候, 他 发布 了 一个 模型 叫 达芬奇 003模型。 它的 输入 大概是 4000个这个 字符 左右, 它 怎么 收钱 呢? 它是 按 你的 输入 加 输出 的 这个 词 的 一些 数量 一起 收费。 它是 每 1000个词 收 0.02, 每 两分 钱 1000个词 输入 加 输出 一起。

刚才 你说的 那个 词 就是 token 对 吧? 对, 换成 中文 的话 大概是 1比2, 大约 就 一个。

中 文字 是 两个。

字符 是 大约 是 这样, 大约 是 这样。 英文 大概是 4分之3, 大约 是 这样。 没错。

然后 他 后来 发布 了 一个 ChatGPT 的 一个 版本, 这个 版本 只能 去做 这个 推理 限制, 也是 4000个词。 但是 它的 价格 降 了 十倍, 就是说 每 一千个 词 是 算是 0.2 美分。 对, 这个 是一个 非常 大 的 价格 的 下降。 所以 这也是 刚才 讲 了 徐 老师 讲 的 大家 很大 的 一个 猜测 是 说 这个 模型 可能 比 之前 的 G B 3要小 很多。 因为 之前 在 InstructGPT 那 篇 paper 中 他 也 讲到, 就是说 他 其实 在 如果 是 只在 这个 对话 的 场景, 可能 只是 instruct 大家 去做 一些 事情 的话。 它 能 在 十倍 更 小的 模型 上用 为 一些 比较 少 的 一些 训练 数据, 能够 达到 比 他 十倍 更大 模型 更好 的 效果。 在 跟 人类 对话 史 上, 所以 这也是 大家 去 想 去 猜测, 就是说 它 会 小 很多。 但是 具体 确实 是 不知道 它的 这个 具体 的 模型 参数 是 多少, 但 确实 实际上 效果 是 它 比 之前 便宜 了 十倍。

GPT4 就是说 最近 发布 的 这个 模型, 它的 这个 提示 词 有 两种。 第一种 是 8000个提示 词, 第二种 是 32000个 提示 词。 目前 开放 的 A P I 只 开放 了 一波 8000个提示 词, 我 拿到 的 尝试 的 那个 A P I 也是 8000个提示 词。 他 这个 收费 很 有意思, 之前 的 收费 是 输入 加 输出 是 一起 算, 现在 它 输入 和 输出 是 分开 算 的。 它的 输入 是 每 1000个词 是 比方 8000个提示 词 的, 那个 版本 是 每 1000个词 是 三 美分, 也就是 比 ChatGPT 要贵 了 15倍。 可以 想象 说 对 3美分, 但 输出 更 贵, 输出 是 每 1000个词 6美分。 所以 其实 比 输入 又 贵 了 两倍, 比 之前 那个 ChatGPT 的 版本 要贵 了 30倍。 32000个 提示 词, 这个 又 更 贵 了, 它的 输入 是 每 1000个词 6美分, 输出 是 每 1000次12美分。 G P4 这个 版本 还是 蛮 贵 的, 就 整整 体 比 之前 那个 ChatGPT 那波 版本 可能 贵 了 大概 15到30倍 左右。

那 我 刚才 说 的 应该 可能 是 他 这个 32000个 token 的 那个 价格, 就是 大概是 在 1到3刀 之间。

所以 对于 它 内部 的 成本 是 多少, 这个 其实 也是 有 很多 的 猜测。 因为他 毕竟 现在 他 背靠 微软 和 NVIDIA 的 这个 资源, 所以 很多 的 优化 其实 属于 这种 硬件 上 的 优化, 而且 他们 能 一个 是 集群 大, 再 一个 是 他们 能有 更 高质量 的 工程师 帮助 他们 优化。 比方说 训练, 包括 推理 的 一些 成本, 这个 其实 是一个 对他 整个 成本控制 一个 很大 的 一个 推动力。 抱歉, 不, 我 刚才 打断 你 了。 Bill 你可以 讲讲。

没有我 刚好 也是 接着 这个 预 点 刚才 提到 的 成本 问题。 因为我 也是 通过 各种渠道 了解到 他们 open I 去年 的 这个 财务状况, 我是 看到 其实 它 去年 整体 的 毛利 基本上 就是 贴着 0% 来来 走 的, 有 一段时间 是 负 毛利, 有 一段时间 是 非常低 的 毛利 水平。 所以 我自己 的 猜测 就是说, 因为 站在 他 这个 公司 的 商业 公司 的 角度, 其实 对于 盈利, 对于 赚钱, 其实 现在 是 完全 不用 考虑 了。 所以 我们 可以 看到 就是 他 都 是在 T A 的 成本 线 来去 打 这个 定价 的 这个 策略 的。 可以 看到 他们 内部 肯定 是对 底层 的 info 做了 非常 多 的 优化。 但 一旦 有了 进展, 他们 很快 就 会有 降价 的 这个 策略。 虽然 说 不知道 他们 今年 这个 GPT4 出来 之后 的 成本 和 它 定价 的 一个 关系。 但 我自己 是 觉得 说 应该 还是 尽可能 通过 低价 的 形式 来 做自己 的 这个 生态 优势 的。

同时 的话, 我自己 也 比较 期待, 就是 因为 刚才 玉田 总 也 讲 了 很多 现在 价格 贵 的 问题, 我 可能 也是 比较 期待 他 后面 会 比如 针对 一些 特定 的 场景, 能不能 把 模型 拆 的 更 小, 然后 用 更 低 的 价格 来去 解决 一些 抖 音 的 问题。 包括 对于 比如说 翻 训练, 能 不能用 更 小的 这个 数据量 就能 达到 用户 的 需求。 甚至 把 部分 的 这个 架构 接口 开放 出来。 这样的话 其实 对于 他 做 商业 生态 都是 很 有 价值。

的对 我们 反正 就 着 这个 模型 来说, 其实 上周 同时 也 发布 了 斯坦福 的 l pa, 它 这个 叫做 羊驼, 它是 基于 这个 open I 的 text 达芬奇 003, 然后 在 上面 又 加 了 这个 meta 的 L L A M A 英文字, 就 跟 另外一个 羊驼 的 读音 是 一样的。 我不知道 是不是 因为 这样, 他 把 这个 自由 中的 这个 产品 叫 成 alpaca。 Alpaca 这个 产品 它 完全 是 开源 的, 它 作为 一个 可能 简单 版, 然后 特别 轻量 版 的 这样的 一个 产品, 可以 免费 给 到 大家 来 用 的。 然后 我看 其实 有 一些 人 已经 试验 过了, 感觉 还 不错。 我不知道 大家 用过 这个 模型 没有然后 对 他的 感觉 是 怎么样 的。 然后 它 整个 这样的 一个 开源 的 这样的 模式, 会对 整个 生态 会 带来 什么样 的 影响。

我 儿子 今天 早上 已经 把 他 air packer 的 模型 放到 他的 那个 电脑 上去 了。 我 觉得 开源 的 模型 就是 OpenAI 的 差距 肯定 是 极大 的这 是 毫无疑问 的。 但是 有些 场景 下面, 也许 这 是一个 good enough, 就是说 已经 是 足够 好了, 可以 做 一些 事情。 从 这个 角度 上 来讲, 我 觉得 也是 有用的。 你 就 看 硬件, 过去 几十年 大家 把 open I 看成 说 新的 那个 intel 然后 可能 不需要 很多 家, 可能 intel A M D 就 几家。 但 其实 不是 这 样子 的, 其实 芯片 厂家 过去 几十年 有 成千上百 家, 总归 是 有些 芯片 是 需要 在 某 一个 场景 下面, 我 就 需要 这样的 功耗, 这样的 功能, 我不需要 其他 的 更好 的 功能, 这个 肯定 是 需要 的。 所以说 我 觉得 这么 一个 新 开源 的 模型, 虽然 说 从 一个 对话 的 角度, 那 肯定 是 或者 智能 的 角度, 或者 考 G R E, 考考 那个 律师, 那那 肯定 是 成绩 会 差 很多。 但 我 觉得 这 只是 一方面, 另外 一方面 它 有可能 在 某些 场合 还是 蛮 管用 的对 对。

是的, 我 正好 其实 也 跟 斯坦福 您 说 的 发表 那 篇 paper 那些 有些 author 比较 认识。 我 其实 也 请教 了 一下 他们。 第一, 其实 他们 内部 也 做了 很多 的 尝试。 因为 学术界 跟 OpenAI 不太 一样的 一个点, 确实 是 学术界 很多 时候 也是 希望 把 这个 东西 公开, 包括 现在 meta 主打 的 一个 东西, 我 可能 质量 上 确实 大一统 的 方式 干 不过 你那 我 用 我 采取 一种 开源 的 方式, 我 让 不管 是 research 界 还是 公开, 还是 大家 都能 接受 到 我们的 参数, 都能 做 更多 的 研究。 第一期 是 meta 之前 也 发布 了 一个 O P T, 然后 这 段时间 发布 了 一个 lama 模型, 在 他们 内部 的 评测 中, lama 其实 是 比 O P T 要好 很多 的, 这是 第一点。 第二点, 其实 当时 这个 meta 其实 是 当时 公开 这个 lama 的 时候, 也是 想 给 research 界 用 的。 所以 他 其实 好像 有 一些 专门 的 policy 说 这个 东西, 我 记着 是 可能 不能 商业化, 就是说 只能 局限于 大家 做 一些 research 的 研究。

对 它的 模型 的 位置 怎么 翻译。 它的 权重 其实 就像 可口可乐 的 那个 recipe, 对 吧? 就是 其实 不 公开的, 它的 配方 没有 想 公开, 但是 是 被 泄露 出来 了。 没错, 已经 放在 github 上面 了。 所以说 为什么 很多人 都 已经 把 它 下载 了, 已经 在在 用了。

是的, 然后 他们 内部 其实 就像 主持人 说 的 那样, 他们是 把 这个 retrain 的 模型 给 拿到 自己的 用 他们的 架构 搭 起来, 然后 只用 喂 一些 比较 少量 的 训练 数据, 都能 达到 很很 好 效果。 少量 的 睡眠 数据, 他们 一部分 可能 是 让人 去 标注 的 一些 比较 好的 提示 词 和 一些 答案。 然后 很 我 答案 其实 还是 ChatGPT 帮 他们 生成 的。 所以 你可以 想象 这个 ChatGPT 效果 还是 蛮 不错 的。 所以 现在 的 很多 研究 都 拿 ChatGPT 给出 的 答案 当成 自己的 训练 数据 去 训练 了。

对, 是。 当然 它的 评测 确实 是在 某些 指标 上 可能 比 ChatGPT 可能 能 达到 一个 比较 好的 效果。 当然 确实 大家 也 知道 现在 整个 P 学术 领域, 整个 评测 指标 还 比较 局限。 而且 也 很难说 有时候 你 评测 指标 是不是 拿 进去 当成 你的 训练 数据 了, 这些 东西 有的 时候 也 不太好 说。 所以 其实 open I 内部 另外一个 我想说 的 是 他们 也有 一种 比较 好的 系统 的 一些 评价 他们 模型 的 一些 质量 框架。 包括 他们 最近 也 开放 了 一个 开源 的 一个 质量 框架, 让 大家一起来 评测 他们 自己的 模型, 就是 发现 他们 模型 中的 问题。 然后 如果说 贡献 多 的 人 还有 机会 及早 的 获得 他们 G P4 的 一个 A P I。

对, 包括 内部 其实 他们 也是 跟 美国 的 一些 可能 人力资源部 门, 比方 up work 以及 scale A I 就是 做 一些 众包 或者 英文 叫 cloud saucing 的 一些 公司, 就是说 集齐 更多 的 人的 一些 公司, 让 他们 来 帮助 一些 评估, 或者 进行 更多 的 一些 标注, instance 那 篇 paper 讲 的。 他们 当时 请 了 大概 四十多个 标注 公 大部分 也是 我说 的这 两家 公司 其实 人种 还是 以 亚洲 这边 的 为主, 主要是 以 菲律宾人 和 孟加拉国 人 为主。 就是 在 这帮 人中 选取 一些 可能 认知 学历 都 比较高 的, 能够 做 一些 可能 比较 高质量 的 评测 等等。 当然 他们 GBD4 后面 这些 在 一些 很难 的 一些 考试 中 达到 很 好的 效果。 我 觉得 一方面 确实 他们 用了 更多 的 一些 训练 数据, 就 比方说 一些 research 的 文章, 或者说 一些 特别 好的 教材。 另外 一方面 我 觉得 也是 招 了 一些 特别 高质量 的 人 去 帮 他们 去做。 比方说 我在 之前 OpenAI 的 技术 讲解 中, 他们 也是 宣传。 如果说 你是 有一个 可能 是 比较 美国 比较 好的 一些 本科生 或者 硕士生, 那 非常 希望 你 参与 他们的 一些 数据 标注 或者说 一些 贡献 工作。 所以 其实 你 也 看到 他们 对于 什么样 的 人 去 标注 什么样 的 数据, 以及 标注 数据 的 质量 是 非常重视 的。

对我 我我我 最近 的话 我也是 试用 了 一下 stanford 发 的 这个 模型, 包括 也 测 了 一些 国内 的 创业 团队。 然后 他们 做 的 这个 中文 语言 模型 可能 未来 也有 可能 会 去 开源。 我的 感觉 就是 对于 比如说 回答 一些 文科 的 简单 的 事实 问题 和 开放 问题。 现在 很多 开源 模型 的 水平 已经 OK 了, 就 能够 达到 P P T 的 六七十 分 的 这个 水平。

所以 接着 号位 这个 老师 讲 的 这个 案例, 我 觉得 未来 对于 很多 商业 产品 来说, 很有可能 就 有点像 现在 比如说 我要 实现 A I 的 这个 芯片 能力, 那 我 自动驾驶 汽车 可能 要 用 orin 或者 za vier 英伟 达 的 这个 芯片。 但是 我 如果 只是 一个 简单 的 硬件, 那 我 可能 就是 用 很多 的 国产 或者 海外 的 这个 A I 的 处理器 就可以。 比如说 未来 很多 的 应用软件 也好, 智能 硬件 也好。 我在 回答 很多 简单 的 问题 的 时候, 我 就 可以在 本地 去 部署 这些 六七十 分 的 这些 中型 的 模型。 然后 如果 用户 问 到 一些 复杂 的 问题 的 时候, 我 再去 调 要 用 GPT 比较 贵 一点, 然后 比较 费 延迟 的。 这个 模型 的 能力 其实 对于 产品 来说 都是 非常 直接 的 选择。 我也 了解到 很多 现在 的 创业 团队 也是 在 用 这样的 架构, 然后 来去 他们的 这个 底层 模型 的 交互 界面。

还有 另外一个 问题, 我不知道 大家 有没有 关注 到, 就是 OpenAI 以及 微软 他们的 背后 的 隐私 问题。 其实 大家 还是 诟病 蛮 多 的。 我看 海外 蛮 多 博客 或者 是 一些 文章 之类 的, 他们 这个 领域 还是 蛮 蛮 灰色地带 的。 像是 open I 他们 爬 的 这些 数据, 他 从来 没有 告诉 大家 他们 是从 哪里 获得 的 这些 数据, 来 训练 他的 模型。

然后 微软 这次 发表 的 他们的 这个 copilot, 其实 大家 也 还是 蛮 担心 的。 他们 在 各种 跨平台 的 这些 应用 里面 集成 的 各种 数据, 它 不仅仅是 跨平台 的, 它 还是 跨 用户 的。 最后 给 大家 带来 的 这些 算法, 给 大家 带来 的 这个 工具 上面 的 这些 便捷 和 优势。 其实 是不是 牺牲 了 这个 隐私 给 大家 带来 的。 我不知道 这个 问题 大家 有没有 思考 过, 然后 是 观点 是什么?

对 这个 隐私 的 问题 肯定 不是 AI, 或者说 是 那个 OpenAI, 或者 我们 这个 大 模型 的 一个 专有 的 话题。 我不 觉得 有 任何 大 模型 或者说 大 模型 本身 没有 把 这个 问题。 有一个 质 的 变化。 大 模型 相对 来讲, 大家 需要 注意到 的 就是 如果你 尤其是 你是 在 网站 上面 去 跟 那个 A I 的 那个 去 跟 他 对话, 你 跟 他的 对话 有可能 变成 他的 标注 数据。 但是 如果你 是用 他的 那个 写 程序 跟 他 交互 的话, 那 他是 说 清楚 了, 我是 默认 不会 把 你的 东西 放到 我的 标注 数据 里面 去, 除非 可能 是 你是 想要, 这个 他说 的 很 清楚, 这 里面 其实 就 跟 以前 一样, 就是 没有 大 模型。

在 这个 时候 这个 数据 用 起来 有的 时候 可能 是 一件 好 事情。 我可以 给你 举 个 例子, 最近 在 跟 一个 教授 在 聊 他的 一个 他在 做 一个 开源 的 一件 什么 事情。 我 就说 那 说不定 那个 OpenAI, 就是 ChatGPT 可以 帮 到 你, 对 吧? 可以 写 些 东西 什么的。 后来 发现, 我 如果说 是要 把 他的 那些 文档 让 那个 ChatGPT 去 学 不容易。 因为 有 这个 字数 的 限制 对 吧? 有 token 的 限制, 那 怎么 去 让 他 学 呢? 然后 后来 发现 因为他 这个 是一个 开 产品, 人家 早就 爬 到了 加 GPT 已经 有了, 所以说 不需要 去 教 他他 已经 能够 去 开始 写写 程序 了。

这个 是一个 很很 好玩的 一件 事情, 对他 来说 这 是一个 利好, 你 都 不需要 教 他, 基本 模型 都 已经 会 了。 我说 的 是一个 一个 比较 特殊 的 编程 的 语言 环境, 他 居然 已经 学会 了, 就是 因为 能够 爬 到, 所以 从 这个 角度 上 来讲, 对 这个 教授 所做 的 项目 其实 是 一件 好 事情。 但 在 某些 时候 我相信 也有 大家 不 希望 的对 吧? 我不 觉得 这个 是一个 大 模型 带来 的 新 问题, 大 模型 只是 把 这个 问题 可能 继续 的 往前 推进 了 一下。

对 这个 问题 我 还 挺 好奇 的。 就是我 我自己 会有 一个 设想, 就是 因为 未来 整个 不管 是 模型 也好, 还是 类似 智能 体 智能助手 的 产品 也好, 都会 非常 的 个性化 话。 然后 他 会 获取 或者 了解 这个人 非常 多 的 多维度 的 数据。 那 未来 还 会不会 需要 一个 每个人都会 有一个 隐私 数据 的 中间层, 其实 它 存储 了 这个人 跟 这个 智能 体 的 交互 的 非常 多 的 历史记录。 包括 很多 信息 可能 是以 数据库索引 的 形式 存储, 然后 有的 可能 是以 这个 embedding 的 形式 变成 向量, 但是 模型 要 访问 的 时候 是 需要 一些 加密 手段 的。 而且 很多 的 知识 其实 模型 并不是 并不需要 通过 find 训练 在 模型 里面。 而是 直接 通过 读取 的 形式 也 能够 完成 很多 个性化 的 交互 手段。 最后 这 一层 可能 就会 存储 在 这个 用户 个人 的 空间 里面, 或者 是 有一个 合规 的 机构 来去 管理 这些 数据。 我不知道 这个 方法 架构 是不是 可行, 然后 也 挺挺 好奇 各位 的 这个 看法。

对, 刚 我 其实 也 挺 同意 刚才 徐 老师 讲 的。 因为 其实 OpenAI 发布 的 其实 也是 机器学习 模型, 也是 用 一些 训练 数据, 包括 fund 数据, 包括 可能 强化 学习 等等。 所以 它 本质 其实 也是 个 机器学习 模型, 就有 训练 数据。

其实 这个 问题 其实 在 业界 其实 说白了 比较 普遍。 因为 其实 你可以 看到 现在 大部分 的 像 这个 互联网 时代, 包括 这个 手机 时代 来临。 大家 其实 都会 收集 一些 用户 的 数据, 用户 的 行为 数据 等等。 包括 抖 音、 tiktok 包括 meta 等等。 微软 都会 收集 用户 的 训练 数据, 然后 训练 自己的 大 模型。

其实 在 不同 的 国家 和 地域, 其实 对于 隐私 它 也有 不同 的 定义。 比方说 在 欧洲 可能 有一个 gdpr, 而在 美国 有 他 自己的 一些 定义。 可能 比方说 在 其他 国家 地区 有 一些 专门 的 定义。 那 中国 肯定 也有 自己 隐私 的 定义, 对 吧?

包括 其实 现在 在 机器学习 领域, 很多 东西 在 训练 的 时候 也有 一些。 比方 基于 这个 隐私 计算, 包括 这个 联邦 学习, 包括 这个 边缘 学习 的 一些 专门 的 一些 著作 对 吧? 专门 的 一些 研究 领域。 当然 其实 说 实在 还是 在 比较 早期 落地 在 业界 这个 可能 也 需要 时间, 包括 最近 的 一些 外部 三 领域 对 吧? 对 用户 隐私 的 一个 保护 等等, 也有 一些 专门 的 一些 探讨。 对, 这是 一块 就是说 的 对于 收集 用户 数据 以及 哪些 东西, 哪些 数据 可以 用, 然后 以及 怎么用, 包括 用户 数据 怎么 存 到 你 数据库 里 等等。

我 这边 插 一句, 一个 是 隐私 的 问题, 另外一个 其实 是 合规。 也就是 隐私 是你的 数据 是不是 给 OpenAI 对 吧? 然后 他 怎么用。 还有一个 是 合规 的 问题, 这个 合 不就是 在于 比如说 你 让 那个 ChatGPT 或者说 GPT4 的 模型 给你 写 程序, 那你 这个 写 的 程序 到底 是 合规 不合?

合规 其实 在 业界 其实 这 是一个 灰色地带。 因为 为什么呢? 因为 它的 训练 数据 理论上 来讲, 也是 别人 有有 版权 的 东西 至少 有 一部分 对 吧? 人家 的 版权 你是不是 遵守 对 吧? 你 出来 的 东西 你 根本 就 不知道 是什么, 哪 一部分 是不是 有。

所以说 这个 业界 其实 是 有 一定 的 争议 的那 越是 保守 的 公司, 越是 那些 对 这方面 隐私 也好, 对 合规 也好, 有 很很 重视 的, 那 他 就有 可能 甚至于 我知道, 甚至于 在 硅谷 就有, 他 就 把 那个 拆 GPT 给 封住 了, 就 大家 不能用, 也有 很多 公司 说 你 那个 可以 用, 但是 不能用 他 给你的 程序, 这 都有。 包括 这个 星期 我 还 跟 好几个 财富 五百 的 管 数据 的 那些 V P 去 讨论 这 一个 话题。 有一个 公司 它是 相当于 是 应该 是 美国 最大 的 金融 科技 公司 之一, 基本上 所有的 银行 都是 他的 客户。

然后 那一个 公司 的 数据 老大, 他 就说 了 一句话, 其实我 有点 惊讶。 他说 我们 不但 自己 内部 不 允许 任何 的 程序员 用 那个 ChatGPT 的 程序, 这个 我 觉得 是 能够 理解 的。 我 觉得 这 很多 公司 也会 有可能 会有 这方面 的 这个 规矩。 而且 我不能 我不 我不能 让 我的 我自己 这个 公司 的 软件 提供商 来 用 ChatGPT 来 产生 程序。 这是 美国 基本上 是 最大 的 金融 科技 公司。 那 他的 那个 软件 提供商 是 很多很多 的对 吧? 那 他 不 允许 他们 给 他的 产品 里面, 或者说 至少 是 给他 提供 的 任何 的 软件 里面 有 任何 是 ChatGPT 产生 的。 这个 其实 是 很难 去 追踪 的。

后来 我 跟 他说 了 一句, 我说 你 这件 事情 可能 不能 成功 的。 他 问我 为什么? 我说 你 即使 不知道 是 几十个、 几百个 你的 软件 提供商, 你 能够 保证 你 怎么 我们 能够 保证 他们的 提供商 不用 ChatGPT 来 写 程序, 那你 这个 是 无 止 无尽的, 然后 他 想想 是啊, 但是 他 就 管不着 了。 所以说 这个 不 只是 一个 隐私 的 问题, 还有一个 合规 的 问题, 这也是 一个 很大 的 一个 问题。

Microsoft 这次 发布 他们的 这个 copilot, 是不是 中间 有 一层 layer 是 叫做 这个 microsoft graph, 就在 这 一层 里面 它 一个 词 叫做 grounding。 我不知道 能不能 帮 我们 解释一下 一点。

对, 因为 open a 现在 其实 是 跟 微软 在一起 合作 这个 项目。 如果 你看 OpenAI 它 那个 技术 博客 分享 的 他 内部 的 团队 的话, 他 也是 刚刚 才 跟 徐 老师说 的 一样, 其实 是 细分化。 比方说 他 有一个 团队 叫 trust and safety, 应该 叫 信任 和 安全 团队。 还有一个 团队 当然 叫 legal, 就是说 可能 法律 相关 的 团队。 还有 个 团队 叫 security and privacy, 就是 安全 和 隐私 等等 的 一些 团队。 具体 团队 下面 每个人 还有 不同 的 一些 职责。 比方说 有些 是 搞 这个 监控 的 反馈 的, 有些 是 可能 搞 一些 policy 的 政策 的。 而且 在 这个 文章 最后, 其实 open a 特别感谢 了 微软, 尤其是 微软 的 安全 团队 给 他们的 一些 建议 以及 整体 帮助 做 一些 协作。

坦白 来讲 就是 open a 当 结合 微软 这 座 大山 了 以后, 微软 对于 各种 包括 反垄断、 安全 隐私 这些 东西 有 非常 非 非常 深入 的 理解。 就是 open 自己 可能 没有 太多 经验, 但是 结合 微软 了 以后, 他 一定 会 把 这些 东西 处理 很好。 当然 处理 很好 可能 也 代表 了 它 不会 开放 太多 的 东西, 对 吧? 就是 我们 可能 看到 它 越来越 封闭 等等。 回到 刚才 的 问题, 就是说 微软 其实 发 了 一个 架构图。 我 个人 觉得 当然 是我 个人 理解 还 不一定 是 特别的 跟 隐私 相关 的, 可能 是一种 外界 的 一种 知识库。

叫 图 数据库。

对, 没错, 一种 知识库 更多 的 可能 是对 一些 问题 回答, 包括 一些 特别的 一些 验证, 当然 这是我 自己的 理解 了。 对, 当然 微软 那个 架构图 确实 特别 抽象, 因为 它 就是 一个 很很 简单 的 一个 video 来 解释, 所以 其实 不同 人 有 不同 的 解读 了。

对, 好意, 我看 你 其实 在 我们的 群 里面 发 了 一个 图片, 是 非常 老的 一张 图片。 它 上面 是 画 着 一些 数学老师 正在 抗议, 应该 是 计算器 的 使用 对 吧? Calculator 我不知道 那个 是 什么时候 的 一张 图片。

上个世纪 上半叶 的 一张照片。 我 对我 觉得 任何 一个 新的 技术 出来, 肯定 是 有 很多人, 就像 我们 这 几个 人是 觉得 非常 的 激动。 但是 也有 可能 有 一波 人 是 有 各种各样 的, 不管 是 批评 也好 或者 反感 也好, 我 觉得 都很 正常。 但 有些 公司, 但 有些人, 比如说 就像 我 刚才 说 的, 最大 的 一个 金融 科技 公司, 负责 数据 的, 对他 来说 最 重要 的 是 数据 是不是 安全, 是不是 合规 的。 这是 他 对他 来说 是 最重 就像 刚才 那 张 照片 是谁 反对 的? 是 那些 是 是 需要 学生 去手 手动 去 算 的 那些人, 他 会 反对, 对 吧? 这 肯定 不 代表 好事 坏事, 反正 就是 屁股 决定 脑袋, 我 觉得 很 正常。

在 你 刚刚 讲到 跟 好多 硅谷 的 C E O 聊过 之后, 我不知道 大家 的 现在 这个 感受 是 怎么样。 你 觉得 是 大家 更多 的 是在 AI 的 时代 来临 了, 我们 需要 可能 完全 是 拥抱 AI, 然后 在 AI 上面 去做 各种 行业 的 这种 可能 结合。 还是 大家 觉得, 我的 这个 可能 我的 这个 dome, 我的 这个 末日 到了。 因为 看到 OpenAI 就 GPT4 最后的 那个 demo, 就是 怎么样 帮助 叫 什么 交税 的 这样的 一个 简单 的 一个 问题, 好像 也 不是 很 特别 简单。 然后 就 感觉 好像 比如 像是 interview, 像是 total tax, 或者 什么 H R M block 这样的。 美国 我 帮 大家 报税 的 公司, 我 觉得 他们 可能 未来 不太 能够 跟 GPT4 来 竞争 了, 他们的 服务 可能 就 没有 那么 的。

被 需要 了。 导演, 我 来 问 你 一个 问题, AI 大概是 把 哪一个 职业 先 给 取代 掉? 然后 有 11000个人 回答, 第一个 选择 是 工程师, 第二个 是 设计师, 第三个 是 C E O, 第四个 是 产品 经理。 你 先 说说 你 觉得 是 哪一个 会 被 第一个 被 取代 掉。

我 觉得 是 工程师。

我 觉得 是 设计师。

我 觉得 那个 工程师、 设计师、 产品 经理 的 初级 岗位 可能 都是 类似的。

好的, 然后 我的选择 是 C E O。 然后 向 大家 汇报 一下, 这 11148个 人 里面, 31% 的 人 最多 的 一个 是 认为 C E O 会 被 取代 掉。 设计师 跟 C E O 差不多 了, 都是 30% 上下。 然后 工程师 跟 那个 产品 经理 是 20%, 各 是 20%。 然后 伊朗 musk 也 投票 了, 你们 猜 他是 投 哪一个?

他 投 的 是 C E O 吗?

对他 投 的 是 C E O 对, 然后 现在 还有一个 问题, 我 现在 实时 的 去 看一下。 顺便 但是 我 先 把 问题 告诉你, 哪一个 工作 是 A I 是 最最 晚 被 取代 掉 水管 工人、 销售员、 C E O, 政客。

我 觉得 肯定 是 修水管 的, 因为 这个 太 physical, 就是 要 蓝领 的 这样的 工作 肯定 最后 才能 被 替代 掉。

我 觉得 是 政治家 哪里 都 不能 没有 证据。

我 一开始 选的是 那个 水管 工人, 但 后来 想想 不对, 那个 有有 机器人, 对 吧? 对, 就是说 短期 来讲 肯定 是 水管 工人, 但是 长期 来讲 很难说。 但是 就像 一点 说 的, 到哪里 你 都 需要 政治家, 对 吧?

为什么 是 C E O 的 第一个 问题? 为什么 他 第一个 被 替代 掉?

你 可能 有 一部分 的 原因 是因为 伊朗 马斯克 说 vote 的 C E O, 很多人 就 也 觉得 有 道理。 这是我 自己 瞎猜, 我 不清楚。 但 另外 一部分 我 觉得 也有 一定 的 道理, 就 从 那个 ChatGPT 出来 到 现在, 到 三个月 都 没有。

说老实话, 最近 三个月 我 跟 很多人 聊, 你看 有没有 一个 技术 的 突破, 怎么样? 其实 很很 有趣 的 一个 现象 是 做 那个 A I 的 人 里面 做做 技术 的, 并不是 所有的 人都 觉得 这 是非 非常 更有 突破性 的 一件 事情, 包括 我们 图灵奖 的 那个 获得者, 了 空 这个 大神 也是 觉得 不 这就是 一个 小的 突破, 没什么 大 突破。 但是 反而 我是 在 跟 一些 C E O 在 聊 的 时候, 我 觉得 他们 普遍 的 会 认为 ChatGPT 是 特别的 神。 我 跟 他们 聊 的 一个 话题 就是 你看 ChatGPT 给 很多 的 答案 都是 比较。 你可以 说 他的 答案 并 不完美, 但是 他的 他 非常 客观, 至少 是用 他的 数据 说话, 对 吧? 他 看到 什么 数据, 然后 学到 什么东西, 他 没有 太多 的 emotion, 没有 太多 的 情感, 没有 太多 的 偏见。

我 前面 也 提到, 很多 时候 我们 做 事情 都是 不可避免 的, 都 会有 一个 屁股 决定 脑袋。 我 坐在 什么 位置 上面 我 就说 什么 话, 对 吧? 这是 很 正常 的 一件 事情。 包括 C E O 自己 他 也会 做 一些 决定, 有可能 是 非常 短期 的对 吧? 因为 股民 股东 的 压力, 投资人 的 压力, 客户 的 压力, 他 会 做 一些 事情, 这是 很 也是 很 难免 的。

所以说 他们 都 一致 的 同意, 我 至少 我我我 自己 交流 的这 几个 C E O 他们 都 同意。 其实我 做 的 很多 决定, 其实 是 回过 头 去 看 是 很 愚蠢 的对 吧? 然后 这些 决定 很 愚蠢 的 决定, 如果 是当 时候 是用 ChatGPT 来来来 做 这些 推荐, 要 走 哪条 路, 完全 可能 做 的 比 我 更好, 这是 他们 一致 的 认为, 所以说 我 就 跟 大家 分享 一下, 这是我 个人 跟 不同 的 人 聊 下来 得到 的 一些 反馈。

我 觉得 另外 一点, 可能 我 看到 这个 徐 老师在 公众 号 上面 写 的 一点 心得。 就 如果 是 硅谷 银行 问 了 这个 GPT four 或者 ChatGPT 怎么样 对冲 他们的 风险 的话, 可能 这样的 一个 危机 不会 出现。 我 觉得 这个 思考 还是 蛮有意思 的。

对我 我 写 了 这个 以后, 也有 很多人 说, 难道 硅谷 银行 就 没人 懂 这个 东西 吗? 这个 不是说 硅谷 银行 有没有 人 肯定 有人 懂, 只是 他 能够 把 这个 风险 作为 一个 主要 的 一个 有 一个点 把 它 给 提出来, 我 觉得 就 已 就是 一个 很 不错 的 一件 事情。

对我 觉得 公司 也 分 不同 阶段, 尤其 在 很小 初创 公司, 我 觉得 C E O 还是 蛮 重要 的。 比方 他 把握住 公司 的 价值观 mission, vision 就是 公司 往 哪儿 走。 尤其 在 早期 可能 成员 不是 很多 的 时候, 他 能 跟 每个人 有 交流 的 一些 机会, 能 把握住 大家 的 这个 心态, 包括 能 更 快速 迭代。

但 到 后面 来说, 你 如果 公司 走向 更大 的 一个 层面, product mak fit 走 出来 了。 那 有时候 你 C E O 毕竟 每个人 一天 都 只有 24小时, 他 能 接触 聊 的 人 也 很多, 而且 人 之间 的 关系 是 极其 复杂 的, 所以 难免 他 做 一些 决定 的 时候, 不 掺杂 一些 个人 情感 或者说 偏见 在 里面, 所以 容易 导致 这个 决策 失败, 失败 的 代价 是 很大 的那 chat G B 的 好的 地方 在于, 它 可能 能 在 短时间 内 接收 到 很多 的 信息。 比方说 整个 公司 甚至 到 底层 每个 人的 一些 想法, 或者说 整个 公司 各种各样 的 报表。 那 他 能 做 一些 更 智慧 的 一些 决定, 就 考虑到 整个 公司 的 一个 层面 的 一个 发展, 对 吧? 从 这个 层面 我 觉得 一些 关键问题 的 决定, 我 觉得 ChatGPT 能 帮忙。 但 从 另外一个 方面, 你 如果 一个 大公司, 大家 其实 毕竟 情感 方面 还是 需要 一个 有血有肉 的 人 去 帮助 领导 大家 这个 层面 上 chat G B 不一定 那么 能 帮忙, 因为他 永远 是一个 老好人, 对 吧?

对 刚才 那个 华为 老师 和 一点 说 的, 我也 特别 有 启发。 就是我 自己 觉得 说 C E O 这个 角色 可能 不会 完全 被 替代。 如果 有 被 替代 的 可能, 我们 投资 这个 行业 很多人 也会 消失了。 因为 我们 投资 其实 很大程度 上 在 早期 就是 投 人 如玉 点 说 的, 可能 现在 A I 不能 做 的 事情 是 说 如何 去 设立 一个 长期 的 vision 和 规划。 现在 在 A I 上 还是 有 很多 技术性 的 问题 没有 解决。 另外 的话 就是 遇到 对 整个 世界 的 价值 判断, 包括 很多 C E O 他 有 很强 的 产品 天赋 的 直觉, 这些 能力 可能 目前 A I 还没有 达到。

但是 如果说 是 针对 一个 大公司 的日常 管理, 我 还是 非常 受 启发 了。 就是 因为 很多 公司 目前 面临 的 很多 管理问题, 是因为 不同 的 员工 他的 角色 不同, 他的 能力 项 不同。 其实 他在 每个 位置 上都 会有 自己的 认知 的 缺陷 和 BIOS。 现在 大 的 多 模态 模型 的 好处, 其实 就是 它 能 综合 大家 很 全面 的 能力 来 综合 做 一些 基础性 的 判断。 未来 一个 公司 的日常 的 运营管理, 如果 有一个 这样的 cos u 的 角色 来 去做, 就像 硅谷 银行 的 风 控 来 去做 日常 大家 跨部门 的 理解 沟通, 我 觉得 还是 挺 有 机会 的。

对我 觉得 从 职能 上 来讲 不可能 取消 掉, 对 吧? 一个 公司 不可能 没有 C E O, 但是 就像 我们 程序员 做 技术 的 人, 微软 前几年 给 了 一个 copilot, 就是 相当于 一个 副驾驶员 对 吧? 一起来 驾驶。 不管 是 飞机 也好, 汽车 也好。 到 这一次 这个 礼拜, 微软 他说 我可以 给 一个 公司 里面 基本上 所有的 员工 都 提供 一个 copilot, 都 提供 一个 副驾驶员 跟 你 一起 做。 不管 你是 做 市场 的, 做 营销 的, 做 任何 一个 职位 的。

我 觉得 bill 你 刚才 讲 的 一个 我 觉得 很 好啊, 就是 C E O 也 应该 需要 有一个 copilot。 Right 取代 copy 应该 是一个 搞笑。 因为 legally 就是 法律上 你 怎么 都 需要 有一个 C E O 对 吧? 但是 从 职能 上 来讲, 就 好像 现在 很多 程序员, 当然 每个 公司 都 不一样, 每个 人都 不一样。 但是 有 很多人 跟 我说, 我 现在 50% 的 code, 或者 甚至 有的人 说 80% 的 程序 是用 copilot 给 写 出来 的那 西欧 做 的 决定 也可以 有可能 20%、 8%、 50、 80%, 但 这也是 有可能 的。 我是 在 一个 公众 号 里面 对我 自己的 公众 号 里面 写 的, 然后 我 也有 一个 英文 的 news letter 也 写 了。

这 一件 事情 我 一开始 是 觉得 有 很多人 估计 会 喷 一下, 但 后来 我 发现 多数 的 人 还是 至少 给 我的 反馈 意见 还是 蛮 正面 的。 因为 我们 刚才 提到 C E O, 你看 microsoft 的 微软 历史 上上 一个 C E O Steve 褒曼 对 吧? 法尔 默 对他 买 了 一个 诺基亚 这个 公司。 我 就在 想 如果 他 去 问 那个 ChatGPT, ChatGPT 怎么 都 跟 他说, 这 是一个 beta idea, 这 是一个 很 愚蠢 的 事情。 就是 他 当年 如果说 有 这么 一个 copilot C E O 有 这么 一个 AI 的话, 估计 能够 保住 他的 C E O 的 职位, 再 保 个 十年。

对我 开始 看到 这个 问题 的 时候, 我在 想 是不是 因为 AI 来了, 大家 的 relativity, 大家 的 效率 就会 提高 很多, 然后 没有 必要 再 打工 了, 大家 自己 就 都 变成。 Solo entrepreneur 的 就是 自己 当老板, 然后 就能 把 一个 产品 或者 一个 服务 做出来, 所以 不需要 C E O 了。 我 是从 这个 角度 来 想 的。 最后 我 觉得 其实 想要 大家 再 分享 一下, 可能 是从 创业者 以及 投资人 或者 是 像 郝 宇 只能 看到 很多 不同 的 观点 了让 大家 觉得 未来 的 一个 机会, 或者 是 大家 看到 的 市面上 的 普通 的 这样的 一些 看法, 然后 自己 有没有 什么 一些 不同 的 观点。 这 三个月 从 ChatGPT 然后 到 GPT4, 然后 大家 的 观点 没有 一些 什么样 的 变化。

我 先 讲讲 我的 看法。 我也是 趁着 这 波 AI 浪潮 起来, 然后 决定 来 创业。 我 觉得 这 波 A I 浪潮 起来, 人工智能 浪潮 起来, 我 觉得 能有 几个 方面 对 整个 世界 去 进行 创新。

当然 确实 现在 很多人 也 说, 这 波 浪潮 起来 怎么看? 现在 出现 的 这个 A I 应用 好像 也没有 那么 多, 对 吧? 可能 也就 jasper 或者 midi journey, 包括 notion A I 行业 也没有 听说 其他 的, 我 感觉 很多 其他 的 确实 在路上, 因为 毕竟 GPT 这 一波 起来, 就 ChatGPT 和 GPT4 这 波 起来 也是 去年 12月 刚刚 起来 的。 然后 现在 在 一个 很大 的 热度 上, 人家 公司 也 不可能 把 这个 直接 拿来 3到5天 就 做出来 一个 很 厉害 的 原型 被 大家 用。 那 这样 护城河 其实 也 不是 很高。 所以 从 我的 角度 感觉 就是说 这 波 浪潮 有 几个 就 很多 产品 确实 可以 重新 做 一遍。

比方 现有 的 很多 产品, 我 觉得 有 几个 方面 大家 可以 思考 一下, 也是 我自己 在 思考。 第一个 是 产品 层面, 我 觉得 这 一波 chat G T 解锁 的 更多 的 是 与人 交流 的 这个 能力。 之前 可能 跟 大家 接触 的 这个 界面 主要是 表单 的 形式, 高频, 但是 需要 大家 输入 比较 多, 但是 是一个 比较 繁琐 的 工作。 如果 有了 自然语言 的 这个 聊天 形式, 它 可能 是一个 稍微 低频 一点, 但是 非常 长远 一点, 但是 能 让 你 深陷 其中 的 一个 更好 的 一个 交互 体验 的 一个 提升。

所以 从 产品 方面, 我 觉得 很多 产品 都 可以 考虑 怎么样 结合 跟 用户 聊天, 拿到 他 更 多个 人的 意愿, 或者说 个人 的 一些 想法 等等。 这个 是一个 很 重要 提升。 因为 用户 用 的 产品, 简单 来讲, 你 希望 更多 的 拿到 用户 的 想法 或者 用户 的 期望。 之 我 觉得 抖 音, 包括 快手, 包括 美国 的 tiktok, 包括 twitter, 更多 的 是 采取 用户 的 点击, 点 广告 或者说 点 别人 喜欢 的 内容, 或者 是 上 滑 下滑, 决定 你 是否 喜欢 某个 短 视频 来 更多 的 学习。 但是 如果 通过 这种 自然语言 交流 的 方式, 是一种 交流 上 升级, 我 感觉 更 直观 的 能 拿到 更多 的 一些 信息。 这 是我的 一个 感觉, 就是 产品 上 的 一个 交互 体验 的 一个 升级。

第二个我 觉得 是 技术 的 升级。 因为 大 模型 这 波 我 觉得 比较 厉害 的 是 它 结合 了 世界 的 知识, 能够 对 这些 知识 做 一些 简单 的 推理 和 联想, 这个 能力 还是 很 厉害 的。 之前 我们 不论 做 什么东西 都 讲究 数据 飞轮, 就 数据 越 滚 越多, 我们 能 知道 这个 数据 里面 的 一些 东西。 现在 好了, 这个 大 模型 其实 把 世界上 很多 的 知识 都 给你 拿来 了。 初创 公司 设计 自己的 技术 站 方面, 能 不能用 一种 大 模型 first 或者说 LLM 拉伸 lande 猫 first 的 思路 去 设计 自己的 技术, 这个 还是 挺 重要 的。 就是 对 现有 的 技术 栈, 包括 可能 搜索 系统、 推荐 系统, 包括 其他 各种各样 的 系统 的 一种 创新, 这个 是 很 重要。

第三个 我 感觉 就是说 公司 整体 的 一个 效率 和 组织 架构。 因为 不管 是 创业 公司 还是 大公司, 我 感觉 很 重要 的 一个点。 还是 说 大家 的 交流 一个 是 迭代 的 一个 速度, 这个 是 极其 其 重要 的那 翻译 过来 就是 效率, 效率 是 极其重要 的那 这个 工具 如果说 能够 去 让 大家 的 交流 成本 大规模 的 降低, 因为 chat G P 当时 他 做 的 比较 好的 一些 任务, 或者 大家 希望 他 做 的 任务。 就 比方说 我给你 一段 文字, 让 你 帮 我 生成 更多 的 文字, 或者说 我 让 你 帮忙 去 脑 爆 一些 东西, 或者说 你 给我 一些 比较 开放性 的 问答。 就 相当于 这种 开放 大家 的 思想, 然后 让 大家 的 效率 有 大规模 的 提升。

比方说 我 当时 创业 的 时候, 我需要 调研 我 这个 领域。 比方 美国公司, 包括 它的 估值 什么, 我 很多 东西 都 是用 ChatGPT 结合 搜索 的 方式 去 达到 的。 我 觉得 效率 有 非常 多 的 一些 提升, 包括 可以 落实 到 我 每天 的 工作 中。 我 现在 也是 一个 chat G B 非常 狂热 的 用户, 对 吧?

我 觉得 对我 整个 的 效率 提升 的 非常 多, 也 涉及到 每个 公司 的 架构。 那 有些 职位 是不是 可以 适当 的 去 优化, 提升 整个 公司 执行 的 效率, 或者 降低 一些 交流 成本 等等。 这个 我 觉得 是 每个 公司 都 该 去 想 的 一个 事情。 我 感觉 这 波 起来 是对 整个 创业环境, 包括 公司 的 治理 等等, 不管 是 大中小 公司 都有 很强 的 一个 升级。 如果 不 提早 拥抱 他的 公司, 我 感觉 后面 可能 会 很快 被 竞争对手 去 淘汰。

这个 说 的 很 好啊, 对我 也 觉得 很好。 对, 尤其 最后 两点 对 吧? 一个 是 技术 站, 一个 是 个人 的 效率 的 提高, 公司 效率 提高。 其实 一个 是 颠覆 云计算 对 吧? 就是 整个 技术 站 会 被 颠覆 掉。 另外一个 是 可能 是 颠覆 掉 google。 因为 本来 你是 用 设置, 然后 现在 可能 用 ChatGPT 加上 设置。

你说的 第一点, 我是 觉得 conversation U I 长期 来讲 会 取代 故意 今天 的 图形界面。 因为你 也 跟 不管 是 创业者 还是 投资人 聊 不少, 你 觉得 有什么? 你的 观点 是 跟 大家 的 观点 是 不一样的, 但是 你是 比较 坚持 的。

我 其实 自己的 观点 也 在 不停 的 迭代。 因为我 之前 是 训练 机器学习 模型, 包括 大规模 机器学习 模型。 其实 大家 都 知道 这个 训练 机器 模型 无非 就是 刚才 您 说 的 这个 算法 算 力 和 数据。 然后 其实 核心 还是 算法, 因为 数据 也都 是 公开的。

我 之前 有一个 简单 的 观点, 我 觉得 open a 好像 没有 什么 特别 强 的 技术壁垒。 因为 其实 往往 机器学习 的 算法 都是 蛮 简单 的, 都是 那 几十 行 的 代码。 但是 越来越 有 感觉, 这 是一个 大 的 系统工程 的 一个 事情。 包括 这个 参数 怎么 去 训练, 包括 数据 怎么 去 准备, 它 确实 是一个 大 的 一个 系统工程, 而 不是说 很 简单 的 就是说 那 几十 行 代码 都能 搞定 的 一个 事情。 我 觉得 这是我 自己的 观点 的 一个 改变。

很多人 觉得 好像 这 波 没有 什么 太大 的 用处。 第一 他们 觉得 什么 jasper 好像 没有 什么 技术壁垒, 因为 可能 就是 用 的 OpenAI 的 prom 的 设计 一些 比较 好的 提示 词, 然后 你 出来 一些 结果 等等。 另外 一波 人 可能 说, 这 波 你说 这个 大 模型 起来, 好像 没有 特别 多 的 创业 公司 兴起 来, 还是 原有 的 这些 就是我 刚才 讲 的 jax pro notion a 可能 Midjourney 那 没有 其他 的 公司 出来 了。 所以 我 有一个 比较 强 的 我自己 的 观点。

第一, 我 觉得, 这些 公司 其实 相信 AI 比 大家 认知 的 可能 更 早, 也 不是说 是 很早 创建, 但是 毕竟 也 创建 有 一段时间 了, 所以 他们 对于 他们 要 做 的 事情 的 垂直 领域 以及 这个 认知, 包括 对 这个 OpenAI 内部 技术 栈, 它 能 达到 一个 能力, 包括 能耗, 以及 怎么 把 这个 东西 用到 产品 上, 我 觉得 这个 是 有 很强 认知。 包括 他们是 可能 很多 也都 是一个 to b 的 公司, 包括 他们 跟 客户 的 交流, 就是 客户 的 粘性 以及 对 某些 专门 的 垂直 他们 服务 领域 一些 非常 专门 的 认知, 这个 是 极其重要 的。 不一定 说 是你 非 要在 这个 技术 上 弄 的 怎么样, 我 感觉 认知, 尤其是 跟 客户 的 粘性 这个 东西 也 极其重要。 因为 其实 很多 to b 的 软件, 你 发现 它 没有 什么 特别 多 的 技术壁垒。 比方说 什么 报税 软件, 或者说 这种 H R 的 软件, 或者说 这种 招聘 系统, 尤其是 这种 招聘 成员 的 一些 系统。

比如 面试 一面、 二面、 三面、 四面 写 feedback 等等。 但是 你 真正 垂直 到 一个 专门 的 领域, 对 这个 领域 有 强烈 的 know how, 然后 又 结合 大 模型 能 在 这个 领域 助力, 我 觉得 这个 是 极 重要 的。 就是说 你 怎么做, 那是 另外一个 事儿, 不是说 你 非 要说 是 我自己 是不是 需要 重新 出 一个 大 模型, 然后 我 还要 需要 知道 怎么 去 翻 to, 我 还 知道 怎么 去做 增强 学习 习, 然后 我 就有 很强 的 壁垒 了。 我 觉得 并不是 这么 回事儿, 因为我 觉得 大 模型 它 其实 还是 说 需要 对 我们 真正 要 解决 的 问题, 它 有一个 很强 的 助力, 这个 是我 觉得 很 重要 的 一个 事儿。

现在 这些 先 他的 公司 反而 有 很强 的 壁垒。 比方说 jasper meet journey, 就是 大家 说, OpenAI 能力强, 是不是 把 你 颠覆 了? 我 觉得 倒 不一定 的, 因为 open I 能力强, 它是 一个 普 世 的 能力强。 如果你 只 做 一个 专门 垂直 领域, 你 绝对 会 比 open a 厉害 了。 而且 open a 也 不会 打 你。 就 之前 有人说 的 大象 很难 踩死 蚂蚁 一样。 就是说 你说 OpenAI 在 很多 的 测试 上 效果 很 好在 G R E 上 在 这种 别的 一些 测试 的 code 上 测试。 如果说 你 只 做 一个 公司, 我 就 搞定 后 的 面试题, 我相信你 绝对 能 打过 open a 而且 能把 这个 little code 做 的 非常 好。

我 觉得 这就是 专注 和 这个 认知 的 一个 可怕 之处。 我 觉得 这个 是 更多 的 一个 技术 站。 后面 我 觉得 不是说 大家 自己 去 搭 这个 大 模型, 而是 说 更多 的 怎么 面向 欧派 的 一个 接口 去 编程。 然后 更多 理解 怎么样 把 这个 欧派 的 模型 去 用 好啊, 然后 可能 是 欧派 的 模型 结合 自己的 一些 小 模型, 把 这个 东西 用到 产业。

对我 总结 一下 你的 非 共识, 就是 jasper 还是 有戏 对 吧? 对, 虽然 说听 上去 它的 模型 会 比 OpenAI 的 模型 差 很多, 但是 毕竟 它是 深耕 某 一个 领域, 这个 领域 也不 只是 说是 模型 好坏。 是 他 跟 他的 销售 能力, 他的 市场 能力, 他 对 企业 的 理解能力 都是 有关系。 对 这点 我是 同意 的。

我 有一个 美国 朋友, 他 投资 的 jasper 翻 了 好几倍。 上个月 来 问我 是不是 要 退出, 我 跟 他说 的 基本上 跟 你说 是 同样 的。 但是 我也 加 了 一句, 我说 jasper 还是 有 binary risk 的 一个 公司。 今天 所以说 你 如果 能够 卖掉 少部分, 卖掉 一倍 2倍, 那 可以, 那 反正 你 已经 赚 了 好几倍 了, 对 吧? 但是 总体 来讲, 我没有 觉得 他 应该 把 jasper 都 卖掉, 因为我 觉得 他在 这个 行业 深耕, 多多少少 还是 值 很多 钱 的。 然后 我们 来 听听 bill 的 想法, 就是说 这 三个月 有些 什么 动态 的 东西, 能不能 跟 我们 分享 一下。

我 这 三个月 时间 也是 主要 花 在 跟 这些 国内 早期 的 这些 创业者 交流。 从 fact 的 角度 的话 是 能 感觉到 国内 有 非常 多 的 优秀 的 产品 人、 技术人员。 他们 之前 对 大 模型 可能 不是 很 了解。 其实 过去 的 三个月 是 他们 快速 学习 的 时候, 也 在 酝酿 自己的 一些 idea。 就 之所以 现在 可能 大家 还没有 看到 很多 创新型 的 产品 出来 或者 是 出名。 很多 原因 是因为 国内 也好, 全球 也好, 很多 早期 的 创业者, 他们 还 刚刚 把 模型 能 做什么, 怎么做 产品 创新, 刚刚 做了 自己 思想上 的 消化, 还 正在 去做 产品 的 研发 和 设计。

从 我自己 个人 的 认知 上 来说 的话, 我的 感觉 是 跟上 一次 参加 咱们 节目 的 一个 很大 的 变化。 就是 open I 它的 规模 效应 其实 比 我 想象 中 要强 的 就是 这个 公司 本身 的 壁垒, 就是 数据 的 规模 效应 和 算 力 的 规模 效应, 以及 通过 规模 的 增大 不断 的 涌现 新的 能力。 如果我们 要在 基于 open I 或者 基于 大 模型 做 应用 产品 的 角度, 仅仅 做 数据 规模 效应 就 很 不够 了, 因为我 在 抖 命 领域 收集 到 的 知识 know how 很有可能 也会 跟 open I 涌现出 的 能力 做 offset, 做 对冲。 那 这个 时候 我自己 从 跟 创业者 交流 的 角度 和 自己 之后 去做 投资 工作 的 角度, 也是 会 重点 去 关注 网络 效应 的 连接。 我会 觉得 说 对于 应用 产品, 只有 从 规模 效应 跃迁 到 网络 效应, 才有可能 真正 的 去 建立 比较 好的 护城河。

不会 被 其他 的 玩家 快速 利用 底层 的 模型 能力 来 去做 超越。 包括 对于 jasper a 也 一样, 他 现在 也 开始 去做 企业 内部 的 协作。 那 对于 网络 的 连接, 我会 把 它 分成 两类, 一类 是 效率 连接, 大家 觉得 因为 大 模型 的 能力, 很多 的 岗位 都会 发生变化, 很多 的 岗位 会 消失。 其实 企业 内部 或者 是 人与人之间 的 效率 型 的 工作方式, 沟通 方式 可能 都会 发生变化。 他们 也 在 思考 怎么 去 基于 模型 和 他们的 能力, 开发 出 真的 是 有 网络连接 的 效率 工作 协作 平台。 这个 我 觉得 是 作为 start up 有 一定 的 机会 的。

另外 一类 的 网络 效应 叫 感情 的 连接。 我们 最近 也 跟 很多 做 to c 属性 的 娱乐 属性 的 这些 产品 经理 创业者 去 聊。 因为 大 模型 只是 给 了 开发者 用户 一个 更好 的 生产力 工具。 但是 对于 to c 娱乐 属性 的 产品 来说, 大家 要 的 还是 我 对 某 一个 埃 批, 我 对 某 一个 感兴趣 的 话题 的 一个 情感性 的 连接。 如果说 我 能够 基于 模型 的 能力 去 创作 更好 的 这个 社区 的 产品, 或者 是 埃 批 类 的 产品, 其实 的话 也是 一个 比较 好的 建立 自己 护城河 的 方式。 这 两个 可能 是我 最近 一个 迭代 和 体会。 觉得 说 如果 要把 护城河 建立 起来 的话, 可能 先 把 产品 做好, 先 把 数据 利用 好, 把 模型 能力 利用 好, 还需要 把 一定 的 用户 圈层 的 网络 搭建 起来。

谢谢你 分享。 我问 你 同样 一个 问题, 就是 今天 的 一个 非 共识。 跟 业界 多数 的 不管 是 投资人 也好, 或者说 是 其他 一些 朋友 聊, 你 觉得 你的 观点 跟 他们 不一样的。

不一样的 观点 就是说 我 觉得 大 模型 的 护城河 其实 并没有 像 芯片 那么 深。 我会 觉得 现在 整个 的 模型 的 演进 处在 快速 的 scaling up 的 这个 时期。 然后 参数 不断 的 增大, 算 力 不断 增大, 但是 我 觉得 并 不会 延续 太久。 我 个人 觉得 一方面 就是 可能 几年 之后 一定 还是会 遇到 一些 瓶颈。 然后 模型 能力 慢下来 之后, 其实 留给 后发 者 一些 追赶 的 空间。 最终 比拼 的 还是 谁 能把 应用 的 生态 建立 起来。

第二 的话 就是我 也 看到 国内 的 很多 创业 的 团队。 其实 他们的 里面 的 人, 就是 国内 这些 头部 大学毕业 的 年轻人, 也没有 在 海外 大厂 做 过 模型 的 这个 训练 的 经验。 他们 也可以 花 一年 的 时间 得到 六七十 分 的 产品。 所以说 对于 中国 能够 逐步 的 去 开发 出 能够 真的 被 大规模 商用 的 底层 的 模型, 以及 做 后面 的 追赶, 我 觉得 我的 信心 还是。

更强 的对, 虽然 说 OpenAI 做 的 很好 很 酷炫, 对 吧? 但是 别人 不管 是 哪里, 硅谷 也有 很多 公司, 美国 之外 有 很多 公司 还是 能 赶得上 的。 不一定 是 三个 月6个月 赶得上, 但是 给 个 若干年 或者 是 若干 时间 还是 能够 赶得上 的这 是一个。

另外一个 观点 就是 你看 OpenAI 那个 速度 这么 快, 不到 三个月 又 来 这么 一个 做大 模型。 如果你 是要 比拼 谁 做 的 更好, 这 一件 事情 上 就 没 必要 比 了。 基本上 已经 有 这 几个 初创 公司, 包括 OpenAI 作为 一个 领头羊 之内。 如果现在 再去 想, 那 已经 太晚 了。 其实我 也 在 这 两种 意见 当中, 这 三个月 里面 至少 摇摆 过 一两次, 我相信 今后 的 三个月、 六个月, 我 有可能 再会 摇摆 个 一两次。 所以说 你们 两位 说 的 这个 观点 确实 是 蛮 有趣 的。 我们 可以 说不定 过 一段时间 再来 review 一下, 再来 回顾 一下。

我们 今天 时间 差不多 了, 我 最后 再 分享 一下 我自己 的 一个 我 觉得 是非 共识 的。 是不是 我们 已经 到了 一个 通用 人工智能 的 时代, 我 个人 觉得 是的, 我 并不 觉得 模型 有 这么 厉害。 我 反而 是 觉得 人类 包括 我自己 在内, 包括 我身边的 所有人 在内, 根据 我的 观察, 人类 没有 那么 强大。 人类 有可能 有 一些 技能 很强大。 但是 我们在 真的 实际 运用 当中, 其实 是 还是 有 很多 弱点 的。 回过头来 我 觉得 人类 会 觉得, 其实 他 早就 超过 了, 只是 我们 没有 承认 而已。

好的, 我 觉得 我们 今天 也 聊 的 蛮 多了, 我们 还是 感觉 很多 没有 聊到, 下次 再 请 大家 回来。

是的, 好的, 谢谢 大家。

谢谢 大家, 拜拜。

好, 拜拜。

这 期 what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G at 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。

如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是在 公众 号 文章 中 扫 码 添加, 或者 是 公众 号 后台 回复 科技 早知道, 即可 获取 邀请码。 期待 你的 加入, 我们 下期 见。