用 声音 碰撞 世界 生动活泼。 Hello 大家好, 我是 丁丁, 欢迎 收听 全 新一集 what next 科技 早知道。
大家好, 我是 刘灿。 就在今天 我 跟 另外 一位 小伙伴 新宇 在 阿里云 的 峰会 现场, 是 见证 了 阿里 官 宣 旗下 所有 产品 未来 都将 接入 通义 千 问 大 模型 的 时刻。 在 这个 官 宣 发生 之前, 阿里 的 C E O 张勇 有 好 长 一段 是 关于 阿里云 如何 为 这个 智能化 的 时代 做好 准备 的那 那 部分 演讲 里 有 一张 P P T 刚好 展示 的 就是 本期 节目 嘉宾, 也是 刚刚 从 阿里 毕业 的 A I 大神 贾 扬 青。 他的 团队 在 阿里巴巴 所做 的 platform as service 平台, 即 服务 所有的 产品。 作为 曾经 深度 参与 过 cafe 牌 土耳其 tanzer fo 等等 产品开发 的 杨青, 他在 A I 领域 的 影响力 应该 是 无需 我 多 言。 而 很多人 也 好奇 他 这个 时候 离开 阿里 的 原因 是什么?
硅谷 徐 老师 是在 北京时间 的 昨天, 与 杨青 交流 了 大 模型 热潮 下 的 一些 创业 思考。 就 包括 为什么 她是 没有 选择 大 模型 这个 赛道 去做 创业。 这也是 杨青 离开 阿里 之后 第一次 接受采访, 所以 我们 第一时间 分享 给 大家, 欢迎 收听。
非常 欢迎 贾 扬清 到 我的 科技 早知道 硅谷 徐 老师 这个 栏目 来 做客。 今年 我 做 的 硅谷 徐 老师 的 节目 有 几个 了, 但是 一对一 的 访谈 这是 第一个。 而且 我也 刚刚 从 欧洲 回来 几个 小时, 马上 就 录 这 一个 节目, 可见 我是 对 你的 这个 访谈 的 重视 性。
两三个 礼拜 前, 网 上面 有 好几篇 文章 是 说 你 从 阿里 出来 创业 了。 那 我想 这 其实 是一个 很 好的 机会。 星期五 是你的 最后一天。 所以说 理论上 来讲, 是 刚刚 出来 的, 不管 是 阿里 还是 之前 的 职业 选择 也好, 或者说 是 我们 今天 大家 都 很大 模型, 包括 一些 技术, 包括 一些 科技 方面 的 话题, 想 今天 跟 你 好好 聊 一 聊。
好, 谢谢 徐 老师。 之前 的 时候 也 经常 听 徐 老师 的 podcast, 如果我 理解 对 的话, 生动活泼 和 声东击西 等等。 大家 也是 好几 档 联合 起来 一起 做 的 非常 优秀 的 节目, 所以 也是 神交 已久。 感谢 这次 邀请, 能够 有 机会 来 大家 随便 百货 闲聊 一下 之前 关于 职业、 关于 技术、 关于 商业 等等 这 一块 的 一些 想法。
最近 几年 你 先是 从 facebook, 也就 现在 的 meta 离开 进入 阿里, 然后 在 阿里 工作 了 将近 四年 又 离开。 能不能 跟 我们 分享 一下 为什么 会 离开 facebook 加入 阿里? 然后 为什么 会 现在 这个 时机 离开 阿里 自己 创业?
这个 我 觉得 讲 起来 还是 一段 非常 感到 非常 荣幸 的 一段 经历。 最 开始 在 facebook 的 时候, 大家 可能 还 能够 记得, 就是 之前 的 时候 我们在 facebook 做 开源 的 A I infrastructure, 当然 也 支撑 facebook 内部 的 大量 的 A I 应用 等等。 我们 在 facebook 的 几年 当中, 和 团队 一块儿, 我们 做了 coffee two 在 手机 上 的 cafe to go, 一个 开源 的 神经网络 的 标准 叫做 hony x 以及 后面 现在 大家 都 比较 熟悉 的 P I D touch, 以及 进一步 的 一系列 的 上层 的 一些 工作。 从 facebook 出来, 对我来说 最大 的 一个 机会 点 其实 是 在于 说 facebook 是一个 对内 支撑 做 的 比较 好的 一个 公司。 但是 因为 它 本身 自己 业务 的 缘故, 所以 它 并没有 在 提供 云 服务 等 这 一系列 的 对外 和 to b 的 服务。
对我来说, 其实 当时 的 时候, 在 18年 的 时候 就 跟 阿里 一块儿 聊。 更 早 的 时候 其实 跟 阿里 的 非常 多 的 技术 leader 也有 接触。 对我来说 最 吸引 我的 一点 是 说, 在 云 的 那么 一个 平台 上面。 其实 今天 我们 看见 A I 用 的 越来越多, 也会 有 越来越多 的 to b 的 客户 需要 来 用到 更加 scalable 的, 更加 可 扩展 的、 更加 高效 的 A I 的 平台。 因此 的话, 从 facebook 调到 阿里 是 也 相当于 是 给 我自己 的 一个 挑战。 就 是从 纯 技术 跳 到 一个 作为 技术 商业 都要 管 的, 产品 都要 管 的 那么 一个 leader, 能够 有 更大 的 挑战, 也 能够 给 整个 社会 做出 更大 的 贡献。 这是 当年 的 时候 从 facebook 跳 到 阿里 的 一个 想法。
对 所以说 从 这个 角度 上 来讲, 在 之前 你 在 包括 谷歌 在 facebook 之前 在 学校 做 的 工作 主要 还是 纯 技术 的。 虽然 说 技术 上面 你 其实 基本上 那些 包括 咖啡 TensorFlow pyto ch 你 要么 是 单独 的 来 领导, 或者说 是 共同 领导 的这 几个 项目, 其实 都 是在 我们 人工智能 界 是 非常 有 影响力 的 一些 框架。 但是 主要 还是 做 技术。 加入 阿里 是 给 了 你 一个 机会, 正式 的 领导 一个 部门 的 领导 一个 商业, 这 是你的 一个 主要 的 出发点。
对我 就 把 它 总结 成为 四个 词语。 就 是从 最 开始 在 学校 和 在 研究院 做 的 研究, 到 后来 在 谷歌 大脑、 在 facebook 所做 的 工程, 到 后面 在 阿里 所做 的 产品 和 更加 进一步 的 接触 到 商业。 我 觉得 这个 是一个 不断 扩展 的 一个 过程, 也是 一个 新的 技术 从 最 开始 实验室 孵化 出来 到 最后 落地 的 那么 一个 过程。 所以 我 也很 开心 能够 前面 几年 一直走 了 那么 一条路。
这 里面 我 稍微 再再 多 问 一个 问题, 因为 其实 很多 包括 很 优秀 的 华人 工程师 也好, 或者 博士 或者说 做 技术 的 人 也好, 其实 都是 这样 对 吧? 就 是从 一个 做 技术, 然后 领导 一个 团队 或者说 是 怎么样。 但是 你 去 阿里 其实 是 不 只是 领导 一个 团队 而已, 是 商业 的 项目。 那你 觉得 这么 一个 转折点 你是 怎么 去 适应 的? 不管 是 困难 也好, 或者说 自己 跌 过 的 坑 也好, 能不能 跟 大家 分享 一下?
我 觉得 可能 有 两点 是 最 有意思 值得 讲 的。 第一点 是 说 怎么样 从 一个 做 研究 的 时候, 一人 吃饱 全家 不 饿 这种 状态。 到 后面 就说 是 怎么样 跟 团队, 尤其是 有 非常 多 聪明人 的 团队 一块儿 合作, 这是 第一点。 第二点 就是说 是 怎么样 来解决 技术 跟 商业 之间 的 一些 很 自然 的 挑战, 或者说 冲突 的 一个 问题。
第一点, 我 觉得 咱们 其实 非常 多 的, 尤其是 在 硅谷 非常 优秀 的 华人 工程师, 我们 都 对于 自己的 技术 能力 有 非常 强 的 把握。 所以 很多 时候 在 工作 的 时候, 我们 处于 一个 我们 自己 写 代码, 我们 自己是 上帝 这样 一种 感觉。 经常 会 觉得 说, 你看 很多 时候 我 最 熟 的 领域, 我自己 写 代码 比 谁 都 快。 因此 的话 后面 就说 是 说 我 觉得 从 这样的 一个 心态 到 一个 和 一个 团队, 尤其是 相对 比较 大, 而且 又 涉及到 很多 的 不同 的 专业 方向。 比如 像 大 数据, 像 运维 S R E, 像 A I 计算, 像 硬件 等等 不同 团队合作 的 时候, 就会 有一个 要 来 识别 自己的 边界, 以及 来 和 其他 的 人 更好 的 定义 合作 的 一种 交互 的 模式。 那么 一个 坎儿, 我 觉得 举 一个 例子, 就是我 自己 在 带 团队 的 时候, 因为 大家 也 知道 我 更多 的 是在 A I 的 这个 领域。 这种 大 数据 的话, 虽然 我 带领 大 数据 团队, 但是 我 显然 不如 我在 团队 里面? 我们 团队 的 这个 大 数据 的 专家 来 的 那么 的 专业。
这时候 就会 有一个 问题 说, 我是 去 学 大 数据, 然后 我 比 他们 更 牛, 干掉 他们, 还是 说是 我和他们 来 找到 一个 能够 相互 互补 的 方式 来做 更加 紧密 的 一个 协同。 前面 几年 的话, 我们 发现 非常 有意思 的 一个 方式 是 说 我的团队。 我们的 团队 有 非常 强 的 系统 的 工程师 跟 系统 的 架构师, 他们 对于 大 数据系统 的 理解 是 非常 深刻 的。 他们 其实 所 需要 的 一个 从 我 这边 的 一个 互补 和 帮助, 是 说 从 用户 的 视角 更好 的 来看。 说 今天 我们 说 大 数据 结合 了。 那么 用户 对于 用户体验, 对于 这个 产品 的 成熟度, 对于 这种 新的 一些 以 传统 的 B I 和 A I 的 结合 这块 有 怎么样 的 一些 新的 变化 跟 需求。 因此 我可以 站在 一个 用户 的 角度 和 他们的 专业性 形成 互补。 这个 时候 就会 需要 有一点 就说 是 说 作为 一个 基础 力量 往后 站 一站, 然后 完了 之后 让 团队 来做 更多 的 决策。 那么 一个 模式。
我 觉得 你的 一个 词 用 的 很好。 就是你 找到 一个 很 好的 边界, 这个 边界 不一定 是你 很 自然 的, 也 或者说 你是 愿意 的。 但 有的 时候 你 就要 找到 这么 一个 边界, 去 尊重 这么 一个 边界, 然后 能够 得到 更好 的 共赢。 这 一段 我是 蛮 有 共鸣 的。 因为我 其实 也是 跟 一些 其他 的 朋友啊 同学, 也会 经常 交流 到 这个 一个 边界 的 这么 一个 问题。 因为 自然而然 的 我们 做 技术 的 人都 会 觉得, 我 好像 这方面 可能 懂得 不少, 或者说 有些 地方 可以 做得 更多。 但 如果说 你是 尊重 一个 边界 的话, 你 就会 很多 时候 把 这件 事情 就 能够 处理 的 更好。
对, 是的, 我 觉得 我们 做 技术 的 有的 时候 会 陷入 到 一个 摆 剖 的 两极分化 的 一个 状态。 有些 时候 在 自己 熟悉 的 领域, 我们会 极度 自信, 说 我是 这个 领域 的 专家。 在 自己 不 熟悉 的 领域 又会 陷入 一定 的 自卑, 说 我不懂, 好像 也 没法 贡献 什么东西。 但是 最后 我 发现 其实 很 有意思 的 一点 是在 自己 熟悉 的 领域 反而 更加 需要 来 听 一 听说 外行, 尤其是 用户 需要 什么。 这个 对 我们 来 怎么样 来 调整 自己的 一些 已经 固化 的 观点 事情。 我 帮助 的 在 自己 不 熟悉 的 领域, 因为 早晚 还是 需要 有 这种 各种各样 的 技术 的 融合 跟 技术 的 协同 的。 所以 反而 应该 相对 比较 自信 一点儿 的 去 想说, 那 从 我的 角度 有没有 什么 可以 帮助 那些 领域 的 专家 来 相互 印证, 来 相互 迭代 的 一些 想法。 所以 这个 地方 还是 对 自己的 心态 是一个 挺好的 锻炼。
前面 几 这个 说 的 很好, 而且 在 这 那些 领域 当中, 即使 你 不一定 很 熟悉, 但 有可能 你 还是 能 问 出 很 好的 问题。 然后 你 在 阿里 具体 的 负责 的 商业 方面 的 一个 条件 挑战。 讲 这 之前 能不能 讲一讲 你 在 阿里 具体 负责 的 商业 项目 是什么?
好, 这个 我 就 讲 一些 公开的 可以 讲 的 信息。 我在 19年 到 阿里 的 时候, 其实我记得 当时 的 时候 也有 一些 报道。 然后 讲讲 的 是 说 我在 阿里 的 硅谷 研究院 来 负责 研究 这块 的 东西。 那 其实 不是 这样, 其实 的话, 我是 有 很长 的 时间 在 国内, 然后 在 杭州, 然后 我们是 在 阿里云 当中 的, 我们 叫 计算 平台 事业部 一个 部门, 这个 部门 在 做什么 事情 呢? 他 负责 了 阿里 几乎 90% 以上 的 数据 的 平台, 就是 数据 上面 的 各种 数据 的 分析、 聚合 开发 等等, 都 是在 它 上面 的。 从 数据 开始, 我们 又 牵扯 起来 了 叫 派 platform, 一个 A I 计算 的 一个 平台, 它 基本上 和 国际 的 大厂 相对 对 标 的话, 就 有点 类似 于 像 谷歌 的 big query。 Wear tax A I, 像 亚马逊 的 red shift 和 亚马逊 的 这个 sage maker 等等 这 一系列 的 平台。
我们 负责 的 业务 的话, 第一个 是 支撑 阿里 集团 内部, 比如说 像 淘宝 天猫, 比如说 像 菜鸟 等等 的 大 数据 计算 跟 A I 计算 的 需求, 以及 达摩院 这边 的 A I 的 科研 的 需求。 另外 的话, 我们 从云 也 在 服务 云上 的 各种 客户。 大家 可能 听说过 的, 比如说 像 我们 和 小鹏 汽车 一起 构建 的, 他们 非常 大 的 1万张 卡 以上 的 一个 叫做 扶摇 的 超 算 集群。 我们会 和 像 小鹏 这样的 一些 非常 聪明 的 客户 在 一块儿 来 共同 建设 云上 的 这种 A I 的 和 大 数据 的 方案。 这是我 在 阿里 做 的这 一块 的 事情。
有了 这个 背景 影响, 能不能 回到 刚才 我们 聊到 的 从 一个 职业 转型 或者说 职业 成长的 角度 上 来讲 走过 的 坑。 从 一个 主要是 做 技术 的, 现在 是一个 或者说 过去 四年 是一个 带 商业 这 一块 的 一些 坑, 或者 一些 学习。
我 觉得 这个 地方 有 两个 可以 挺 值得 讲 的 一个故事 的, 我自己 也是 非常 有 深刻 的 感受。 第一个 是 我们在 做 技术 的 时候, 其实 都有 这样的 一个 追求 技术 先进性 的 那么 一个 新。 但是 有的 时候 技术 先进性 会 带来 一个 缺点, 就是 它的 普适性 一定程度 会 降低。 于是 会 出现 说 我们 搞 了 一个 非常 牛 的 东西, 但是 用户 用 不 起来 那么 一个 状态。
我 举 个 很 典型 的 例子, 前面 几年 的 时候, A I 编译器 这个 领域 非常 的 热, 我们 团队 自己 内部 也有 一个 A I 编译器 的 一个 团队。 之前 的 时候 我们 也 经历 了 一个 相对 比较 痛苦 的 一个 转型期, 这个 转型期 是 怎么样 的 呢? 我们 自己 内部 比如说 实现 了 一系列 的 编译 的 算法, 优化 的 一些 软件库 等等。 我会 发现 说 用户 很难 和 他 现有 的, 比如说 像 tensor floor py touch 等等 这样的 已经 熟悉 的 软件 栈 给 很 好的 连接起来。 它 需要 用 我们 定义 的 S D K D K 学习 很多 的 我们 自己 这边 的 语法 开发 习惯 等等 的。 它的 模型 转变 成为 我们 要求 的 格式 才能 用 得 起来。 用户 一看 说, 太 麻烦 了, 这个 懒得 搞。
在 前面 几年 当中, 我们 就 逐渐 的 开始 是 把 我们的 整个 的 priority, 从 说 我们 要 搞 到 这个 设 技 最 精巧, 性能 最好的 一个 A I 的 编译器。 从 这样的 一个 目标 变成 一个 说 我们 要 让 用户 能够 无感 的 用 起来。 即使 他在 这个 用 起来 当中 和 我们 能够 达到 的 最高 的 水平 差 了, 比如说 10%、 20%, 那 还是 OK 的。 就是 我们 首先 让 用户 能够 用 起来 比较 顺畅 的。 在 他的 习惯 的 环境 里头, 我们 能够 增量 的, 哪怕 是 5% 10% 的 给他 来 提供 价值。 然后 在 逐渐 的 把 我们的 一些 更 牛 的 技术 一步一步 的 交给 用户 去 用, 这个 是 更加 有意思 的 一个 或者说 更加 有 价值 的 一个 事情。
简单 的 讲 的话, 就是 技术 不需要 最牛, 但是 要 让 用户 用 得 起来 的 才是 最牛 的 技术。 第二个, 我 觉得 是 我们 自己 感到 有 很强 的 对于 商业 需求 和 对于 用户需求 的 敬畏 心。 举 个 例子, 我们 团队 有 一位 非常 牛 的 一个 全站 的 一位 leader, 非常 年轻 的 90后的 一位 工程师, 男性 工程师。 他 有一天 给我发 了 一张照片, 一个 烈焰红唇 的 照片儿, 左边 是一个 红嘴唇, 右边 是一个 紫色的 嘴唇。 我说 怎么了? 你 今天 要 开始 对 吧? 你家 夫人 过生日 要 买 礼物 了, 他说 不他 说 我在 做 超 分辨率 super resolution。
超 分辨率 是 做 一个 什么样 的 一个 东西 呢? 比如说 我 有一个 540P 的 地 青 的 图片 进来, 那 完了 视频 进来, 那 我要 比如说 在 手机 上面 实时 的 给他 做到 1080P 或者 4K对 吧? 我们 现在 用 深度 学习 等等 这样 一些 方式 去做, 大家 可能 很多 时候 在 很多 的 demo 里面 也 见到 过。 然后 他说 我 发现 这个 深度 学习 的 算法 分辨率 做 的 是 挺好, 但是 他 会 把 这个 口红 的 色 号 给 改 了。 他说 我 去 跟 客户 一 聊, 客户 觉得 说 这 不行, 我 本来 就是 卖 口红, 我是 色 号 一定要 准, 对 吧? 分辨率 好不好 不重要, 色 号 一定要 准。
所以 我们会 发现 说 我们 以前 很多 时候 在 做 科研 等等 的 时候, 超 分辨率 我们 也会 有 各种各样 的。 比如说 像 叫做 S S N R 等等 这样的 一些 标准 的 一些 指标 去 测试 他们。 但是 实际 到了 真正 应用 的 时候, 其实 用户 的 真正 的 需求 和 我们 定义 的 那个 指标 也许 有 偏差。 但是 最终 的话 其实 是 用户 的 这个 指标 是 最 重要 的 一个 指标。 所以 这块 就是 在 自己 家 里面 做 产品, 做 技术 等等, 是 一方面 挺 重要 的 一方面。
然后 另外 equally 重要, 一样的 重要, 甚至 有可能 更加 重要 一点 的 是 说得去 跟 用户 聊 说, 现在 最 困扰 你的 是 什么样 的 一个 东西, 什么 能够 让 你 变得 更加 的 高效, 我 觉得 这个 口红 的 这个 例子, 我们 开玩笑 说说? 两位 大 男生 到了 深夜 的 时候 在 讨论 说, 这个 口红 的 色 号 对不对? 是 我自己 在 了解 用户需求 里面, 想起 前面 几年 的 经历 来 最 逗 的 一个 经历。
从 分辨率 和 色彩 这 一个 角度, 从 某种 角度 上 来讲, 这 都是 照片 的 好 跟 坏, 对 吧? 但是 客户 说 的 好 跟 你 心中 想 的 好 不一定 是 一样的, 或者说 很多 时候 就是 不一样。 这个 我也是 非常 有 共鸣 的。 因为 我们 不管 是 做 初创 公司 还是 做大 公司, 跑出去 说 这个 是不是 客户 的 需求, 跑 回来 都说 这个 是 客户 需求 的。 但 其实 不一定, 他的 指标 的 细节 跟 你说的 不一定 一样。 像你 刚才 举 的 这个 例子, 就是 其实 在 这 之前 大家 也是 在 为 客户 着想, 只是 具体 的 细节 就会 很 不一样 一点。 所以说 你 从 这个 角度 上 来讲, 你 觉得 如果说 有什么 就是 回过 头 去 看啊, 你 觉得 如果 是 从头开始 做, 你 会 把 这件 事情 做得 更好 或者 更加 完美 一点 的。
如果说 觉得 什么 地方 可以 做得 更加 好 一点? 我 可能 会 从 第一天 开始 就 更加 强调 产品 经理 和 解决方案 的 团队 的 重要性。 就 因为 我们 本身 自己 都是 技术 出身, 我们 天生 的 一个 就是 自己 脑子 里面 已经形成 了 一个 固定 的 一个 思维。
说 首先 我们会 非常重视 说, 我们 要把 这个 事情 研发 开发 出来。 对于 产品 解决方案, 我们 潜意识 里面 会 觉得 说 这个 是 我们 研发, 我们 把 代码 等等 这些 东西 写 完 之后 的 下一步 的 事儿。 几年 跑下来, 我 觉得 其实 真的 是一个 有 一点儿 反向 的 来做 开发 的 一种 状态。 就是 用户 到底 需要 一个 什么样 的 一个 应用, 或者 怎么样 的 一个 场景。 然后 我们 再 反 过头 来 再来 想说, 我们 这个 产品 应该 怎么样 一个 设计 解决方案, 该 怎么样 的 一个 设计。 我们在 和 研发 一块儿 来 想 出来, 应该 以 什么样 的 一种 系统 的 架构 也好, 产品 的 架构 也好, 把 这些 东西 实现 了。
所以 很多 时候 我们会 发现 说 在 大厂 也有 这样的 一个 情况, 就是 研发 永远 会 天生 的 会有 一定 的 优势, 因为 他们的 专业性 更 强对 吧? 因此 在 组织结构 上面, 有的 时候 往往 会 忽略 了 产品 解决方案 这个 团队 的 重要性。 可能 如果 是 重新再来 一遍 的话, 我会 把 这个 产品 解决方案 的 这个 团队 重要性 拉 得 更高。 这样的话 就 使得 我们在 go to market, 我们在 产品 跟 市场 的 适配 的 时候, 会 做 的 更加 有效 一些。
对 你说的 这个 例子, 其实我 觉得 几乎 所有的 大厂 多多少少 都 很难 避免 在 这方面 可以 做 的 好 不少。 就 比如说 我 就 马上 就 想到, 为什么 ChatGPT 是从 OpenAI 这么 一个 初创 公式 出来, 而 不是 从 google 出来, 其实 没有 道理 对 吧? 从 某种 角度 上 来讲, google 是 发明 了 transformer 这个 技术 的 公司。 然后 有 这么 多 优秀 的 工程师 也好, 或者说 数据 科学家 也好, 最终 没有 去 发明 那个 ChatGPT。 很多 时候 就是 工程师 就 在那边 非常 用功 的 做 某 一件 事情, 但 这件 事情 并不一定 是 客户 最最 需要 的 一件 事情。 对, 好的, 我们 已经 讲 了 很多 关于 你 加入 阿里, 然后 在 阿里 学到 的, 能不能 讲一讲 为什么 现在 四年 以后 又 出来 创业?
我 觉得 对我来说, 我自己 最 感觉到 兴奋 的 一点 还是 处于 就 像是 当年 的 时候, 在 研究生 的 年代, 包括 后来 在 facebook 从 零 开 到 一开始 来 做 A I 的 infrastructure 的 那个年代 的 时候, 那种 创造 的 热情, 倒也不是 说说 大厂 的话, 但是 我们 知道 小厂 和 大厂 有 自己的 不同 的 风格, 对 吧? 小厂 的话 我们 开玩笑 说 死 的 快, 但是 决策 和 各种各样 的 迭代 也 快 一些。 大厂 因为 它 本身 自己的 业务 的 复杂性, 客户 的 复杂性, 因此 很多 时候 的 动作 也会 稍微 慢 一些。 然后 同时 的话 内部 的 各种 组织关系 什么的, 也会 需要 花 比较 多 的 精力 来 协调。 因此 的话 我自己 感觉到 是 说 想来想去, 我 还是 更加 怀念 当年 的 时候, 能够 半 开玩笑 的 说 熬夜 写 代码 的 那个年代。
在 A I 这个 领域, 今天 我们 也会 发现 说 新的 东西 变得 越来越 就 出现 的 越来越快, 新的 东西 越来越多。 然后 我们 也会 发现 说, 其实 从 用户 的 角度 来讲, 我们 自己 科技 公司 尚且 如此。 我们会 想见 说 非 科技 公司, 非 互联网公司 的 这些 企业, 他们 会 更加 强烈 的 需要 A I 的 技术。 同时 他们 和 这些 新的。 A I 技术 之间 的 鸿沟 也会 变得 越来越大, 这个 中间 是 需要 人 去 填 的。 我自己 一直以来 在 A I 这个 领域 从 研究 开始 往回 走走 到 技术, 走到 产品, 走到 商业。 对 这块 也 挺 感兴趣我 觉得 这 是一个 比较 说 的 稍微 烂 俗 一点 的话, 这 是一个 千载难逢 的 机会。 所以 也就是 出来 来做 的 好的。
所以说 并 不是说 ChatGPT 出来 以后 觉得 我 一定要 做 一件 跟 ChatGPT 有关的 事情, 更多 的 是 基于 对于 这么 一个 大方向 的 考虑, 就是 怎么样 让 这个 A I 的 技术 能够 在 各行各业 能够 更好更快 的 生根 落地, 能够 被 应用 到。 能不能 这么 理解? 对。
是的, 就是 创业 的 这个 想法, 15年 左右 的 时候, 当时 还在 谷歌 的 时候 其实 也 想 过, 当时 的 时候 没有 出来 创业 的 一个 理由, 可能 我 比较 保守。 当时 没有 出来 创业 的 一个 理由, 是因为 觉得 在 谷歌 那个年代 刚 还 比较 年轻, 也没有 带 过 团队, 也没有 带 过 业务。 因此 的话 采取 一个 比较 稳妥 的 一个 方式, 说 在 facebook 继续 进一步 的 看 更多 的 业务, 包括 在 阿里云 等等。 所以 今天我 觉得 说 也 到了 一个 水到渠成 的 时间 了。
也是 当时 的 时候 的, 不管 是 说是 梦想 也好, 当时 的 执念 也好, 我 觉得 是 值得 做 一 做 的。 所以 倒 也 并不是 真的 是因为 ChatGPT 所以 出来 的。 因为 最近 大家 可能 也都 更加 关注 在 h GPT 上面。 不过 我 觉得 创业 本身 是一个 很 常见 的 一个 事儿, 就是 很难说 因为 突然 出现 的 一个 东西, 然后 就 决定 出来 创业。 认认真真 的 做 的话, 想想 也得 想 好几年。 当然 这个 是我 相对 比较 保守 的 这样 一个 观点 的, 就是 想想 也得 想 好几年。 然后 他 要 做 的话, 那 也是 一个 5年到10年的 那么 一个 事业, 毕竟 自己的 时间 最 宝贵, 所以 还是 想 清楚 了, 然后 再再 出来 做。
这里 也 插播 一则 消息, 本周五 生动活泼 旗下 的 另 一档 节目 生动 早 咖啡, 将 为 大家 带来 保时捷 经典 车型 911的商业 故事。 在 去年 其实 有 很多 知名 的 公司 是 终止 了 自己的 上市 计划。 比如 在 美国 终止 上市企业 的 数量 就 达到 了 2000年 互联网 泡沫 以来 的 最高水平。 而在 这样的 背景 下, 欧洲 却 出现了 近 20年 以来 最大 的 一次 I P O 就是 去年 9月底 的 保时捷。 保时捷 当时 上市 的 股票交易 代码 是 P911, 而 发行 的 股票 数量 也是 9.11亿股, 而 这些 都是 为了 去 致敬 这家 公司 历史上 最 著名 的 车型 保时捷 911。
在 本周五 的 早 咖啡 节目 中, 大家 可以 了解到, 作为 一款 跨越 半个 多 世纪 的 车型, 911为什么 能够 吸引 大家, 而 这个 超级 产品 又是 如何 让 保时捷 成为 超级 品牌 的? 欢迎 大家 在 本周五 早上 准时 收听。 接下来 就让 我们 回到 科技 早知道 的 节目 中。
对 你的 老同学 reno 的 新 去年 一年前 在 我的 节目 里面 来过, 他 是从 学校 直接 就 去 创业。
对我 还 听 了 那 一期。
对, 然后 我 个人 是 觉得, 因为 这么多年 自己 也好, 自己 接触 的 创业者 也好 那么 多。 我是 觉得 创业 并不 在于 一定 早 一定 晚, 尤其是 做 B2B就是做 那些 t o b的软 件 公 司, 不存在 一定要 早 赶 个 早 集。 你 如果 是 做 一个 下一代 的 交友 软件, 说不定 刚刚 毕业 出来 是 做 最好。 但是 做 一些 公司 服务 的 软件, 我 觉得 其实 像你 这样 就 觉得 还 能够 水到渠成, 我 觉得 是 非常 好的 一个 状态。
那 关于 具体 做什么 方面, 我不知道 你 今天 愿意 或者说 能够 投入 多少。 但是 我在 跟你聊 之前 也 读 了 一下, 你 最近 写 了 一篇 自己 写 的 一篇 公众 号 的 文章, 也是 关于 一些 在 这个 大 模型 下面 的 几个 基础 假设。 我们 能不能 从 这 里面 开始 聊起? 因为我 觉得很有 可能 你 创业 的 一些 灵感 或者说 什么 已经 在 浓缩 在 这些 方面 了。 即使 没有, 我相信 也是 相关 的。
我 觉得 咱们 可能 从 就是现在 也都 比较 热 的 A I LLM 等等 这个 角度 来讲 起。 今天 肯定 大家 会有 一个 这样的 一个 疑问。 就是说 我们在 做 创业 的 时候, 就 至少 我自己 的 一个 疑问 是 说 创业 的 时候 我是 做 模型 还是 做 info? 做 infrared 的 意思 就是说 是 我们 来做 平台 这块 儿, 我自己 的 逻辑 是在 A I 这个 领域 模型 基本上 它的 保鲜期, 我们 英文 叫 shelf life, 保鲜期 基本上 也就是 一年 左右 的 样子。 从 2012年 alex net 开始, 基本上 就 一直 是 这样的 一个 过程。
最 开始 大家 可能 会 觉得 说, 这个 模型 出来 横空出世 之后, 别人 都 无人 能 及。 但是 我会 发现 说 六个月 到 一年 之后, 差不多 的 效果 的 模型 就 出来 了。 因此 我自己 得 出来 的 一个 结论 是 说, 今天 模型 越来越多 的 会 是一个 开源 主导 的 一个 模式。 而 大家 所 更加 需要 的 是 怎么样 把 这个 模型 更好地 部署 起来, 尤其是 部署 到 应用 当中 去, 有 一种 弹性 的、 稳定 的 和 低成本 的 这样 一种 方式 部署 到 应用 当中 去 的 这样的 一个 平台, 这 是一个 更加 明确 的 一个 需求。
所以说 大家 现在 都在 讲 open a 的 GPT four 这些 模型, 你 觉得 像 这些 大 模型, 虽然 说 非常 优秀, 非常 的 令人 惊艳。 但是 你 觉得 开源 的 版本 能够 达到 类似 差不多 效果 的 模型, 这样的 开源 模型 也会 在 6到12个月 以后 会 出现。
我 觉得 会 的, 尤其是 在 to b 的 这个 领域。 就是 因为 在 企业 服务 领域 的话, 我们 并不一定 需要 一个 通用 的 最好的 模型。 其实 很多 时候, 我们 说 这个 是 一定程度 是 通才 和 专才 的 那么 一个 平衡。 就是 我们 不可能 是一个 所有的 一切 把 整个 维基百科 都 知道 的 那么 一个 通才 工作 当中 的话, 我们 需要 有 一定 的 通用性, 那 就是 所谓 的 基础 大 模型, 再加上 专业知识。 所以 这个 地方 的话, 我 觉得 就是 在 企业, 尤其是 在 企业 服务 这个 领域, 会 出现 非常 多 的 垂直 领域 的 由 这些 企业 所 自己 拥有 的 一些 从 基础 大 模型 出来 的 模型。
所以说 你 这边 说 的 模型 是 指 那些 和 OpenAI 最新 的 模型, 不一定 有 它 效果 那么好, 但是 是 good enough, 就是说 有 足够 好, 再加上 有 一些 砖 材。 我 能不能 理解 这 是你的 你 现在 所说 的 那些 能够。
对, 是的, 对。 那 我 写 这个 公众 号 大概是 在 一个月 之前, 我会 发现 了 一点 说 当时 我们的 判断 是 说 在 六个月 到 一年 当中 会 出现 很多 的 开源 类似的 模型。 然后 最近 这 一个月 的 发展 的话, 我 觉得 发展 比 我所 预测 的 更快。 比如说 大家 最近 可能 在 新闻 当中 所 听到 的 facebook 开源 的 lama 伯克利 和 斯坦福, 开源 的 维 库纳 和 奥帕 卡。 以及 刚才 reno 的 在 tate bricks reno 的 和 data bricks data ooks 所 这个 开源 的 di 他们 都在 向 我们 展示 一个 可能性, 就是 基于 开源 的 方式 以及 公开的 数据集, 我们 就可以 训练 出来 一个 非常 高质量 的 模型 了。 这个 模型 没有 像 GPT3 以及 现在 各家 大厂 在 做 的 这个 通财 的 能力, 对 吧? 但是 他们 质量 上面 其实 就是说 对于 文字 的 这个 多 模态 的 信息 的 理解 的 程度, 其实 都 已经 非常 不错 了。 所以 这个 我 觉得 是一个 非常 好的 一个 起点, 就是 开源 这块 儿 在 后面 我也 相信 会 走 的 越来越快。
对, 这 是你的 基础 假设 之一。 对, 这是 第一个 假设。 对, 大 模型 基本上 就是 开源 的, 不一定 是 完全 赶上, 但是 会 基本 赶上 大厂 也好, OpenAI 所做 的 模型。 然后 这一点 是你 觉得 根据 过去 十年的 历史, 我们 能够 看到 今后 几年 也是 这么 发展 的。
是的。 然后 我 觉得 我的 第二个 假设 是 说 今天 我们 大 模型 上面 能够 所 催生 的 应用, 或者说 对 我们 现有 的 应用 的 提升 这 一块儿 还有 非常 多 的 可能性 去 挖掘。 这就 有点像 我们 刚 我 刚才 所 提到 的 口 红色 号 的 这个 例子 一样, 对 吧? 就 一旦 到 应用 当中 去 的话, 它的 形态 不会 光光 只是 一个 说 我说 一句话, 然后 大 模型 给我 回答 一句话 那么 一种 纯 问答 的 模式。 他 有可能 是 比如说 作为 一种 更加 智能 的 个人 助理, 会议 助理 等等 这样 一种 模式。 还有 可能 是 比如说 辅助, 无论是 作家 还是 画家 来做 创作 的 这种 模式。 因此 这个 应用 的 交互 形态 其实 是 很 重要 的。
今天 在 前面 的 几个 月 当中, 我 觉得 大家 都 非常 强烈 的 关注 于 一种 形态, 也就是 聊天机器人。 因为 ChatGPT 出来 了, 但是 连 机器人 并不是 应用 的 形态 的 一个 全部。 我 觉得 后面 其实 有 非常 多 的 需要 来 让 这个 做 应用 的 人 能够 更加 容易 的 用 起 这些 模型。
来来 尝试 说 在 现在 的 这种 各种 应用 模式、 交互 模式 下面, 怎么样 来 使用 大 模型。 那 这个 需求 应该 怎么样 来 拉 呢? 就会 需要 有一个 比较 好的 平台 来 支撑 这个 事情。 大厂 内部 可能 会有 自己的 平台 等等我 比较 强烈 的 相信 一点 是 说, 在 企业 服务 的 这个 领域 的话, 我们 需要 来 有 针对 于 不同 的 企业 的 使用 形态。 尤其是 他 对于 比如说 数据安全 等等 这 一块 的 需求。 针对 他们的 这种 使用 形态 来 设计 的 针对性 的 平台。
就 有点像 数据 这 一块, 我们 催生 了 像 snowflake data a works, 在 传统 的 应用 的这 一块 对 吧? 传统 的 应用 上 云 这块 催生 了 像 这个 vers l 像 还是 cop 等等 这样的 一些 企业 一样。 就是 A I 这个 领域 也会 出现 类似的 这样 一个 平台 型 的 企业, 而 这个 企业 并不一定 是 云 服务商。
对对对, 比如说 hash cop 之所以 能够 走 出来, 他 做了 一个 多云 的 一个 概念 对 吧? 对它 不 只是 给 一个 云。 如果 只是 给 一个 云, 或许 它的 优势 就 不 那么 明显。 但是 你 觉得 对于 以后 今后 大 模型 的 时代, 会有 各种各样 的 模型, 各种各样 的 需求。 所以 从 这个 角度 上 来讲, 你的 一个 基础 假设 就是 尽管 大 模型 可能 模型 本身 已经 足够 好了, 但是 真正 要把 它 给 落地 运用, 你 觉得 还是 有啊 很长 的 一段 落叶, 使得 客户 能够 用 好用 的 极致。 那 从 这个 角度 上 来讲, 你 个人 的 判断 是 说 一个 是 good enough 的 那些 模型 会 涌现 出来。 而且 就像 你说的, 已经 很快 的 速度 涌现 了 不少 开源 的 项目 出来, 而且 都都 看上去 是 蛮 不错 的对, 这 是一个 你 对 未来 的 判断, 是 并 不是说 是 有 三个 五个 大 模型 的 大厂, 像 OpenAI 或者 google 这 几个 大厂。 然后 你 会 觉得 那么 多 的 公司, 他们 多多少少 都 会有 有 自己 模型 的 需求, 这 是你的 一个 判断 吗?
对, 是的, 这个 是 基于 两点。 就 第一点 来说, 如果说 模型 的 门槛 非常 的 高, 那 可能 大家 虽然 有 这个 需求 也就 不做 了, 对 吧? 因为 做不了。 但是 就像 咱们 刚才 提到 讲, 模型 的 门槛 应该 会 降低, 而且 会 越 降 越 低。 这就 像是 比如说 在 2012年 的 时候, 计算机视觉? 我们 能够 识别 猫 狗, 这个 模型 就 已经 是 核心 竞争力 了。 到 今天 我们 觉得 说 这些 模型 遍地 可得, 那么 大 模型 今天 我们 我 觉得 它 处在 一个 就像 当年 alex net 在 计算机视觉 领域 出来 的 时候 那样, 就 大家 都 非常 惊艳 和 都 非常 英文 叫 他 就说 是 说 担心 自己 掉 在 这个 趋势 之外 的。
但是 我 觉得 过 半年 到 一年 之后, 这个 门槛 会 降低。 尤其是 基于 一些 开源 的 大 模型, 在 自己的 数据 上面 翻卷 来 微调 的, 这个 难度 会越来越 降低。 那 这个 时候 的话, 企业 就会 需要 或者说 也 希望 来 自己 管理 这些 模型。
OK 还有 你 第三点 基础 假设? 对 第三点。
我 觉得 就是说 今天 我们会 需要 有 新的 一个 平台 的 服务。 其实 刚才 咱们 在 讲 的 时候 也 讲 差不多 讲 到了 这一点。 今天 如果说 站在 云 服务商 的 角度 来讲 的话, 我 觉得 云 今天 的 一个 基本 的 业务 模式 并没有 太大 的 变化。 就是说 他 将 以前 客户 自己 需要 在 A D C 上 部署 的 那么 一种 模式 变成 了 在云上, 可以 弹性 的 来 利用 云 的 供应链。 但是 今天我 觉得 尤其是 在 国内, 欧美 的话, 其实 A W S 也会 遇到 类似的 这样的 一个 情况, 就是 云 相对 比较 难。 再 往 上 一步 走到 一个 完全 的 以 应用 为 中心, 或者说 以 平台 为 中心 的 一个 商业模式 上去。 我 觉得 这个 可能 也是 和 每一个 公司 自己的 一个 做好 一件 事儿 一种 风格 有关系 的。
云 今天 在 供应链 这块 儿 做 的 非常 的 好, 但是 它 在 上面 平台 构建 平台, 尤其是 站在 用户 这 一侧, 来 帮 用户 更加 有效 的 应用 平台 这块 儿 全球 似乎 都 没有 做 的 特别 好的。 因为 云 服务商 的 一个 基础 假设 是 说 用户 用 的 越多, 我的 这个 营收 和 我的 利润 就 更好。 他 天生 其实 很难 跟 用户 站在 一块儿 来做 帮 用户 降本增效 等等 这样 一些 事情。 当然 也许 小厂 到 大厂 之后 也会 遇到 一样的 挑战。 但是 对于 独立 的 小厂 来说 的话, 它 更加 能够 和 用户 站 得 更 近, 迭代 的 更快。 这是 今天 A I 在 迅速 迭代 的 时候, 我们 大家 所 需要 的 一个 平台。
所以说 你的 这个 三点 基础 假设 是, 第一个 开源 模型 会 大大降低 这个 大 模型 的 门槛。 第二个 是 大 模型 以后 不一定 会 是 大家 最最 关注 的, 大家 最 应该 关注 的 是 哪些 应用, 对 吧? 然后 第三点 是在 这个 情况 下面, 说穿 了 就是 需要 新一代 的 A I 这个 年代 的 hash top, 或者说 A I 这个 年代 的 新的 平台, 或者 新的 平台 公司, 新的 平台 服务。 这 是你的 三点 基础 假设。
对, 就是 要 实现 这么 一个 平台, 其实 也 并 不容易。 因为 这个 地方 恰恰 是一个 又要 结合 对于 算法 的 理解, 又要 结合 对于 应用 的 理解, 又要 结合 对于 底层 的 infrastructure, 比如说 像 云 原生 的 技术 架构 等等 这 一块 的 理解, 它是 一个 非常 多 学科 总和 的 一个 领域。 所以 我 觉得 的话, 这个 地方 机遇 在, 同时 门槛 也 在。 这是 我们 做 过 技术, 然后 同时 又 做 过 业务 的 这些 从云 出来 的 专家 们 可能 最有 竞争力 的 一点。
对我 完全 可以 想象, 你 接下去 自己 做 的 初创 公司, 多多少少 会 跟 这个 方面 有关。 能不能 跟 大家 分享 一下?
好, 我 觉得 我们 可能 也都 处于 一个 相对 比较 早期, 所以 也没有 太多 可以 跟 大家 分享 的, 可以 分享 一下 简单 的 一些 思路。 第一个 思路 就是 我们会 关注 在 帮助 用户 更好 的 来 搭建 A I 的 应用 上面。 因为 今天 其实 如果说 大家 说 想做 一些 实验 的话, 其实 也 不需要 太多 的 平台, 对 吧? 我 去 买 几个 G P U, 我在 github 上面 我 来 下载 一些 代码, 跑 一 跑 看看 效果 就可以 了。 但是 从 那么 一个 实验室 到 应用 中间 有 很 麻烦 的 地方。
我们在 支撑 达摩院 的 各种各样 的 A I 应用 的 时候, 就会 看到 这样的 一个 问题。 最简单 模式 是 我们 科学家 说 我 买 两台 G P U, 我在 这个 G P U 上面 自己 拉 几个 flask 的 python 的 外部 服务 对 吧? 网络服务 我 就 来 服务 这些 模型 了。 但是 这个 时候 就会 出现 说 要不 这个 用户 的 需求 比较 低, 我的 这个 A P I 放出去 之后 调用 量 很少, 所以 资源 浪费 了。 腰部 说 这个 A P I 调用 量 很高, 但是 同时 我 就 只有 两台 G P U, 所以 我 这个 支撑 不 起来, 用户 那边 又 不爽。
怎么样 有 一种 多快好省 的 一个 方式, 让 研究者 们 像 达摩院 的 科学家们 一样, 不需要 担心 说 我要 部署 这个 模型 的 时候, 背后 的 这些 像 弹性 等等 这个 问题。 同时 让 用户 不需要 去 担心 说, 这个 服务 到底 稳 不稳定, 有 那么 一个 平台 会 解决 非常 多 的 痛点, 而且 这个 最 重要 的 是在 应用 上面。 所以 第一个 我们会 关注 在 A I 应用 上面。
第二个 就是 我们会 关注 在 哪些 指标 呢? 第一个 就是 这个 开发者 的 效率。 开发者 怎么样 从 自己的 这个 代码 库, 能够 非常 迅速 的 在 比如说 理想化 的 情况 下面, 也 在 一分钟 就 能够 拉 起 一个 服务, 然后 他 就 不需要 担心 这个 服务 的 弹性 了。 第二个 我们会 看 就是 这个 核心 的 一些 系统 性能 的 指标。 就 比如说 像 这个 我们 能够 在 有限 的 资源 里面 能够 帮助 用户 拉 起来 多少 个 服务, 以及 多少 体量 的 服务 等等。
就是 今天 我们 看到 的 最大 的 问题是 应用 和 就 供给 和 需求 之间 的 矛盾。 所以 我们 主要 会 做出 把 这个 供给 跟 需求 之间 的 这个 距离 拉近 这样的 一个点。 基础 大 模型 我们 就 现实 的 来说 我们 就 不做 了。 因为 这块 第一个 现实 来说 比较 烧钱, 第二个 我们 也 初创 公司, 总要 赌 一把。 就是 我们 相信 说 开源 的 这个 领域 会有 非常 多 的 基础 模型 出来。 然后 这个 并不是 企业 将来 需求 上 的 一个 核心 的 问题。
所以说 有 新闻 说 你 出来 来 离开 阿里, 大家 说 你就是 来 做做 大 模型 的, 其实 并不是 做大 模型, 但是 不管 是 给你的 客户 想 做大 模型, 还是 客户 想 做小 模型, 你是 想 给 他们 提供 一些 这些 平台 的 服务, 使得 他们 能够 在 做 模型。 对, 是的。
我们 也 比较 早期, 所以说 这个 也 希望 非常 迅速 的 在 比如说 在 三个月 半年 之后, 能够 给 大家 展示 更多 的 更 有意思 的 实际 能能 用 的 东西。
对, 非常 期待, 有 机会 返场 再来, 我们 科技 早知道 聊 一 聊。 说起 这个, 我 还 跟 reno 的, 前两天 跟 reno 的 说 要 返场 来 我们的 节目 聊 一 聊, 他 也 答应 了。 那 我 提 一个 问题, 因为你 在 这方面 肯定 思考 的 很多, 关于 这方面 平台 的 服务, 对 吧? 就是 就像 你说的, 要 考虑 作为 一个 数据 工程师, 我是 有 很多 事情 要 去, 很 麻烦 的 事情, 然后 你 能够 把 它 解决。 这些 话 其实 大家 都 已经 知道 了 很多年 了, 包括 谷歌 大概 2014年 15年 的 时候 发表 了 一篇 paper, 大概 就是 讲 的 是 那个 technical death。
技术 负债 是 在在 A I 这个 领域 当中 是 有 多大, 对 吧? 基本上 好像 是 恨不得 90% 以上 的, 其实 都是 在在 模型 之外 的 事情 对 吧? 对, 要 去做 这些, 不管 pipeline 也好, service 也好, 一堆 的 事情 要 去做, 然后 这个 问题 其实 大家 已经 了解 了 很多年 了, 对 吧? 我也 能够 真真实实 的 看到。 其实我 是 想 问 就是 为什么 这个 问题 大家 一直 在 说 不断 的 也有 初创 公司 在 做, 但 为什么 这个 问题 好像 没有 什么 得到 很大 的 好转?
对我 觉得 这个 可能 一定程度 上 要 叫 归功于 也好, 或者 叫 归罪于 也好。 就是 它 应该 归功于 A I 这 一块 的 迅速 的 一个 发展。 就是 它 发展 很快, 就 导致 的 是 他的 各种各样 的 计算 需求 跟 计算 的 模态 都在 发生变化。 所以 就 包括 我我我 经常 就说 是 几个 经常 半 开玩笑 的 时候 说 再也 不想 聊 框架 了, 对 吧? 但是 如果 大家 看 说 A I 框架 这 一块 也是 前面 变迁 的 非常 的 快, 这块 儿 我自己 对于 这个 问题 经历 了 三个 阶段。 最 开始 一个 阶段 是 梦想 的 阶段, 第二个 阶段 是 彷徨 的 阶段, 然后 今天 是一个 接受 的 阶段。
怎么说呢? 梦想 的 阶段 是 这样的, 我 非常 羡慕 数据库 和 大 数据 这个 领域 有一个 标准 叫做 C Q。 大家 发现 说, 我 觉得 这个 数据 都 可以 把 它 作为 一个二维 的 表格。 做 的 东西 好像 都是 说 select join filter 这些 标准 的 激活 操作。 激活 我 觉得 从 一九七几年, 如果 记得 对 的话, 一九七几年 出现 的 时候, 这 是一个 非常 划时代 的 一个 发明。 一定程度 上 它的 设计者 非常 的 牛。 同时 当然 就是说 数据 的 领域 的 它的 使用 模式 也 相对 比较 清晰。 A I 这个 领域 没有 那么 的 幸运, 但 一定程度 也 说 也 是因为 A I 比较 光 百花齐放 一些, 所以 我们 梦想 着 有 这样的 一个 标准。
2017年 的 时候, 我们在 facebook 我们 就 做了 一个 开放 的 神经网络 的 一个 标准, 叫做 onex 其实 一定程度 上 是 希望 说, 假如 大家 最后 所有的 模型 都 产生 到 都 生产 出来 一个 onex 的 一个 标准 模型。 然后 后 端 各种 硬件 厂商, 平台 厂商, 拿着 这个 alex 模型 就可以 去 部署 了, 那 将是 一个 多么 美妙 的 事情。 Alex 有可能 会 成为 A I 领域 的 SQL, 对 吧? 我们 就 我们 也 看到 了 很多 大家 彷徨 不 前 的 事情, 在 一定程度 上 帮助 了 非常 好的 帮助 了 软硬件 协同 设计 这块 儿。 因为 大家 以前 的 时候, 要 对接 各种各样 乱七八糟 的 框架。 现在 发现 说, 如果 一个 硬件 厂商 出来, 我想 让 计算机视觉 的 这块 的 领域 的 应用 和 我 能 更好 的 对接。
那 我 就 去 看 说 这个 领域 的 onex 模型, 它 就学 的 东西 学 的 这个 面 就 变窄 了。 这个 使得 是 软件 协同 设计 会 变得 更好。 今天 的话 微软 也 还在 非常 努力 的 在 推 alex 和 alex runtime 上 的 标准。 但是 彷徨 的 一点 是 说, alex 也有 它 自己的 局限性。 就是 今天 A I 还没有 到 一个 完全 标准 的 阶段, 它 不 光光 是一个 A I 的 模型。 咱们 举 个 例子, 比如说 最近 比较 流行 的 LangChain, 这个 开源 的 框架。 他在 做 问答 的 时候, 他说 你看 首先 一个 问题 过来 了。
就 ChatGPT 出来 以后, 郎 倩 就 很多人 在 用 浪琴。 对, 很 有意思 的 一个 应用 对 吧?
他说 你看 ChatGPT 它 只 能够 说 模型 里面 学 了 什么东西 他。 就 只 能够 靠 这个 模型 这个 一招鲜 了。 劝说 你看 我 可以 首先 我 去做 一个 传统 搜索, 搜索 完了 之后, 我 把 搜索 过来 的 结果 再 放到 prompt 里面。 然后 有点像 来 增强 我的 这个 问题 里面 的 更加 新鲜 的 内容 或者 更加 相关 的 内容。 然后 让 这个 模型 能够 获取 更多 的 输入, 对 吧?
那 这样的话, 这个 已经 远远 超出 了 我们 传统 的 说 一个 A I 模型 的 那么 一个 概念 了。 因为 它 至少 他 得 拉 个 向量 数据库, 所以 A I 发展 的 很快, 我们 就 没法 像 数据, 像 C 活 那么 的 做 标准化。 这是 我们 前面 几年 就 我自己 的 一个 观察。 于是 今天我 觉得 我 接受 了 那么 一个 现状, 就是说 A I 今天 它 更 像 应用, 而 更 不像 数据库。 更 像 应用 的 一个 原因 是 说, 比如说 咱们 经常 会 听见, 比如说 像 微 服务 等等 这种。 咱们 写 应用 的 知道 说 基本上 没有 一个 标准 的, 像 C 一样 一个 标准, 说 你看 打车 和 购物 都是 一样的 这样的 一个 标准, 很少 有 AI 和 这个 差不多, A I 离 应用 离 得很 近。 那么 这个 时候 的话, 我们 就会 发现 说, 比如说 像 原生 K 8S对 吧? 像 这个 容器 等等 这些 技术 变得 更加 合适, 更加 适用 了。
所以 这个 时候 的话, 怎么样 把 A I 里面 的 一些 它 很 特殊 的 地方, 比如 像 异构计算 的 一个 模型 要 切分 了 之后 做 分布式 推理, 这些 能力 和 我们在 这个 应用 的 云 原生 的 框架 的这 一块儿, 包括 像 K 8S包括 像 容器 等 这些 技术 结合起来, 能够 给 用户 提供 一个 他 也可以 各种 定制 化, 但是 我 能 一步一步 的 帮 他 解 掉 弹性、 稳定性、 免 运维 等等 这些 问题, 对 吧? 大家 来 寻找 一个 增量 价值。 我 觉得 这个 是我 今天 在 前面 有 梦想 彷徨 过, 然后 接受 这个 现状 之后 得 出来 的 一个 结论。 就是说 我们的 价值 在哪里?
对, 这个 我 觉得 就像 你说的, 没有 一个 很 好的 standard 的 标准 使得 这 一方面 突破 有有 困难 一点 就 完全 能 理解。 但是 我 稍微 push back 一下, 因为 包括 你 刚才 说 的 容器 copy 这些 技术 都 不是 新的, 都 不是 最近 两年 三年 的 东西, 都 已经 很多年 了。 然后 A I 没有 这么 一个 很 舒服 的 就 能够 去 把把 它 给 deploy 起来 的 系统 的 这个 痛点 已经 蛮 长了。 有什么 新的 东西 让 你 觉得 我要 现在 做 这件 事情, 或者说 为什么 以前 大家 一直 没 做 起来? 你的 观察 是什么 呢?
我 觉得 以前 的话 大家 都 还是 在 点状 的 做 事情。 比如说 像 A I 这 一块 的话, 我们会 看见 说, 比如说 有啊 今天 A I 的 整个 软件站 也 分层 分 的 比较 多了。 有 上层 的 分布式 训练 的 框架, 有 下层 的 比如 像 A I 编译器 以及 软件 协同 设计 的 这样 一些 框架。 它 就是 举 个 例子, 比如说 像 我们 最近 看到 比较 多 的, 比如说 像 T P M 这样的 一个 I 编译器, 像 这个 柯 尔斯 的 出来 做 的 盲区 了 A I 等等。 但是 大家 基本上都 还在 解 点状 的 问题。 但是 我 觉得 今天 A I 最 需要 的 其实 是一个 能够 把 各种 组件, 各种 component 结合 在一起 的。 无论是 数据库 还是 容器 对 吧? 还是 在 我们的 这个 异构 的 G P U 机器, 包括 可能 出来 的 新的 一些 其他 的 异构 的 硬件 上面 能够 来 运行 的 软件 栈, 把 这些 东西 真的 有机 的 结合起来。
这 事儿 听起来 没有 那么 的 高大 上, 不是 一个 是 造 一支 火箭 的 一个 事儿。 但是 这个 里面 还是 有 非常 多 的 人力 成本 投 在 里头。 我们 希望 把 像 达摩院 等等 这样的 一些 科学家们 和 像 淘宝 等等 这样的 一个 应用 的 团队 们, 不需要 去 担心 这种 把 各种各样 的 系统 组件 结合 在一起, 然后 才能 开始 做 他 想做 的 事儿 的 那么 一种 纠结。
其实 你 也 以前 跟 我 聊聊 到 过, 关于 对于 pyto ch 的 一些 感悟, 或者 怎么样 一样。 就说 你 这么多年 下来, 如果说 有一点 或者 两点 的 感悟, 能不能 跟 我们 分享 一下?
对, 就说 一点 感悟。 我 觉得 拍 touch 的 这件 事情 非常 强烈 的 体现 出来 一个 结论, 就是 用 沪 为王。 而且 怀 满怀 尊敬 的 说 一句话, 用户 永远都是 又 懒 又 笨 的。 但是 这是 恰恰 我们 是 给 用户 提供 价值 的 点。
之前 的 时候 大家 经常 会 争论 两个 事情, 就是 tensor floor 跟 py touch 这 两个 的 优劣 是 怎么样 的对 吧? 客观 的 评价 的话, T N sor F O W 在 系统 上 做 的 是 非常 的 漂亮 的, 原生 的 分布式 的 计算 吧? 这个 分布式 的 抽象 等等, 非常 高效 的 系统 的 实现 等等。 Py touch 尤其是 在 py touch 1.0 之前, 大家 如果 去 看 的话, py touch 的 这个 后 端 代码 是 写 的 非常 的 糟糕 的对 吧? 就 不客气 地 说 一句话 的话, 比如说 它 底层 依赖于 一个 叫做 a ten 的 那么 一个 库。 那么 在 重构 之前 的话, A 碳 完全 是 以纯 C 来 写, 然后 有 各种各样 的 C 语言 的 宏 等等, 都 是以 一种 非常 hack 的 方式, 非常 下 写 的 方式 来做 的。 就是 比较 难 maintain, 比较 难 维护。
所以说 我 插 一句, 你 对你 自己 领导 过 的 一个 项目 也是 有 一定 的 批判性 的。
对 这个 事情 在 facebook 里面 的话, 我们的 纽约 的 研究院 sm 群, 他 拉 所 带 的 研究院, 他们 负责 前端 的 东西 对 吧。 我们 负责 后 端 以及 是 说 尤其是 产品 知识 等等。 所以 当时 的话 客观 的 来说, 我 还是 稍微 有 一点儿 站在 TensorFlow 拍 的。 我 就 觉得 说 这个 系统 做 那么 烂 可以吗? 有 这样的 一个 想法 对 吧? 所以 在 谷歌 的话, 我 觉得 T E N O F L O W 更加 强烈 的 带有 这样的 一个 观点, 就是说 系统 做 的 牛 才是 真的 牛。
在 前面 这几年 当中, 我们 就会 发现 说 从 用户 的 角度 看吧, 用户 说, TensorFlow 我要 学 它, 我 还得 专门 再 学 一套 语言, 叫做 TensorFlow, 这个 太 麻烦 了。 拍拖 时 一看 说, 用 起来 还 挺舒服 的, 像 蓝牌 一样 对 吧? 这个 我 都 用 的 挺舒服。 于是 用户 觉得 说, 跑 的 慢点 就 慢点。 我 跟 苏 米斯 一直 是 好朋友, 我 上 今年 早些时候 跟 苏 梅斯 在 在 北美 遇到 的 时候, 我们 还 聊起来 这个 事儿。
然后 斯密斯 说, 对, 现在 为止 开拓 是 都 不是 最快 的 框架。 因为 他说 我 这个 为了 保证 用户 的 灵活性, 肯定 得 损失 一点, 所以 比 其他人 慢。 但是 他说 慢 没关系 的, 用户 希望 他 舒服, 他 舒服 了 之后 我 都 花 个 10% 的 机器 成本。 从 我和我自己 就是说 是 浪费 一堆 时间 来看, 他说 我 宁可 多 花点 经济 成本 算了。 然后 用户 的 效率 的 提升, 体感 的 提升 这 一块儿 会 带来 更大 的 价值。 这是为什么? 就是我 最 开始 开玩笑 说 用户 又 懒 又 笨, 对 吧?
我 懒 我不想 学 一个 新的 一个 东西。 但是 这个 时候 的话, 我 就 希望 说 底层 的 系统 能够 帮 我 把 这些 问题 给 解 了, 尤其是 让 我 用 的 更加 的 舒服。 所以 这块 的话 我们 看见 说 他是 在 前面 几年, 不管 幸运 也好, 不信 也好, 就 的确 成为 了 一个 大家 不是 那么 喜欢 的 一个 框架。 就是 大家 会 瞻仰 它, 但是 大家 不用 它 拍 touch, 的确 用了 很 多半 开玩笑 的 说 一句话 的话, 今天 我们 讲 碳 中和 排出去 的 系统 可能 浪费 了 大量 的 碳 排放, 但是 it's OK, 这 至少 它 能够 帮助 我们 更 加快 的 迭代。 所以 用 互联网 我 觉得 是在 技术 的 领域, 在产品 的 领域, 在 商业 领域 都 还是 让 我 挺 感觉 很 深刻 的 一句话。
其实 这 已经 是你 今天 第二次 提到 了, 关于 一个 用户 的 usability, 或者说 用户 的 使用 的 方便 程度, 其实 比 后面 技术 的 优劣 性 其实 在 很多 时候 是 更 重要 的。 其实 在 我们 技术 发展 的, 软件 发展 的 这么 几十年 来, 这样的 例子 是 比比皆是。 包括 我们 最近 几十年 基本上 是 统治 了 个人电脑 的 那个 windows 对 吧? 其实 90年代 初 的 时候, 视窗 的 系统 显然 并不是 从技术上 来讲 是 最好的我 我 稍微 有点 倚老卖老。 当年 90年代 初 的 时候, 那个 O S two 其实 大家 公认为 是 比 windows 要好。 从技术上 来讲, 但是 我 估计 现在 人都 听 都 没听到过 O S 2。
O S two 是 I B M 的对 吧? 这个 的确 有点 属于 这个 上古 的 操作系统 的 这种 感觉 了。
其实 对 多数 人都 是 上古。 我 用 的 这个 一个 例子 就是说 像你 观察 到 的 那个, 为什么 pyto C H 最后 能够 在 跟 TensorFlow 对比 下面 能够 占 上 一些 上风, 其实 这个 原因 也是 一样的, 最终 就是 大家 易用性 其实 是 非常重要 的。 我们 做 技术 的 人 经常 会 忽略 掉 这一点, 这 是一个 本性。 可能 是。 但是 回过 头 去 看, 其实 每一次 每一次 不管 是 大 的 革命 也好, 或者说 像你 刚才 提到 的 这些 框架 之争 也好, 对 吧? TensorFlow 跟 python 就算 是 最近 五六年, 一个 蛮 大 的 一个 框架 之争, 最终 hype ch 能够 胜出, 确实 是啊 跟 他的 usbm 有 很大 的 关系。
我们 今天 讲 了 已经 不少 的 框架, 没 去 讲 技术, 但是 讲 了 你的 一个 感悟 或者 的 感叹。 然后 我们 今天 没有 聊 太多 的 OpenAI 本身 的 或者说 大 模型 本身 的 技术。 因为我 觉得 最近 很多人都 已经 聊 了。 但是 上 个 礼拜 你的 老东家 facebook made a 发表 了 一个 sam segment anything module。 我不知道 你 能不能 透露 一些 你的 一些 想法, 因为我 觉得 他 好像 就 是从 你 当年 的那 一个 实验室 出来 的。
对的, 是 sam 的话 就是 ross garage 他们 团队 一块儿 做 的。 Ross 是 基本上 在 前面 几年, 一直 统治 了 计算机视觉 圈。 就 是从 最 开始 的 图像识别 到 图像 分割 等等 各种各样 的 模型 深度 学习 出来 之前, ross 做 的 各种各样 的 object detection? 这个 物体 检测 等等, 都 已经 是 属于 整个 领域 大家 都 比较 熟 的 了。 Rose 跟 凯明 一起 在 facebook air research 也 做 的 一直 都很 紧密。
我 觉得 sam 出来 之后, 大家 在 感叹 说 computer vision is dead, 计算机视觉 走 到头 了。 倒也不 一定。 我 现在 更多 的 从 一个 用户 的 角度 在 觉得 说 像 赛马, 包括 现在 的 各种 拉屎 丹 或者 model 等等, 在 做 什么样 的 一件 事情? 它 使得 我们 以前 需要 花 大 功夫 去 解决 的 一些 基础 问题。 比如说 计算机视觉 里面, 我说 我 得 首先 分割 出来 这个 物体 是什么, 然后 完了 之后 才能 做 一些 什么 事儿。 他 把 以前 我们 需要 干 的 这些 事儿 标准化 了。
举 一个 例子, 我 前 两段 时间 正好 给 我们家 小孩儿 在 更新 护照。 大家 知道 说 护照 照片 不是你 得 做 一个 白 背景 等等 吗? 那 我 就 直接 拿, 不是 sam, 但是 是 另外一个 分割 的 一个 模型, 直接 我 拍 一张照片 随便 扔 到 分割 模型 里面, 然后 就让 他 给 直接 搞 了。 对我来说 写 了 大概 一分钟 的 python 代码 就 搞定 了。
我 觉得 sam, 拉屎 当官 什么 的话, 都 让 我们在 上面 做 应用 变得 更加 简单 了。 所以 我 不太 同意 最近 媒体 上 说 计算机视觉 死 了 这样的 一个 观点。 我 觉得 倒是 说 基于 计算机视觉 的 应用 会 变得 更加 的 多样。 Sam 可能 最 有用的 一个 应用 就是 在 各种各样 的 内容 生成 上了。 我 觉得 是的。
我 看到 至少 在 推特 上面 NVIDIA 的 jim fan 他 写 了 一句话, 我 读 一下。 他说 因为 这个 sam 他说 i believe today is one of the GPT three moments in computer vision。 也就是说 他 觉得 计算机视觉 的 GPT 的 一个 时刻 到来 了。 你 对 他的 评价 你是 怎么看 的?
我 觉得 也是 这样的, sam 使得 很多 我们 要 花 很多 功夫 来做 图像识别 分割 等等 的 标准化 的。 标准化 了 之后 的话, 就 像是 ChatGPT 使得 我们 今天 的 对话 能够 到了 非常 智能 的 程度 一样。 就 对于 图像 的 理解, 它 也是 一个 巨大 的 一个 进步。
一个 是 理解 文字, 对 吧? 理解 你的 文字, 能够 去做 一些 推理。 一个 是 理解 一个 图, 使得 你 能够 做 切割 也好, 要 做 任何 更多 的 value add 的 事情, 就 相对 来讲 就 容易 的 多, 对 吧?
对, 咱们 拿着 比如说 一些 内容 生成, 就 比如 像 电影 等等 举例子。 以前 的 时候 我们 说 我们 要 做 一个 虚拟 背景, 我们 就 需要 搞 一个 绿幕 等等 的。 现在 大家 一般而言 觉得 说 用户 已经 比较 不太 需要 了, 但是 我 还需要 一个 纯色 的 背景, 比如说 像 这个 zoom。 所以 我们 大家 会 知道 说, 如果说 要 一个 比较 好的 一个 背景 分割 的话, 你可以 在 后面 放 一个 纯色 背景 的。
但是 sam 出来 了, 我 觉得 说 非常 有可能 的 是 将来 这些 我们 需要 来 搞得 很 麻烦 的 事儿, 这 都 不需要 了。 任何 一个 照片 过来 我 都 可以 给他 很 简单 的 把 各种各样 的 物体 都 给 切分 好。 这样的话 比如说 我们 做 C G, 我们 做 混合 现实 等等, 变得 越来越 容易 了。 当然 不知道 meta 做 不做 元 宇宙, 对 吧? 但是 我 觉得 这些 核心技术 让 我们 离 元 宇宙 更 近 了 一步。
从 facebook 的 角度 来讲, 他 希望 是 能够 跟 元 宇宙 多少 有些 契合度。 你 刚才 举 的 room 的 例子 我没有 完全 懂。 像 room 就像 我们 背后 可以 调 背对 吧? 可以 放 金门大桥 也好, 放 一个 别人 的 卧室 的 照片 也好。 然后 你说 现在 有了 sam 以后, 我们 能够 怎么样?
就是 像 树木, 像 各种各样 的 视频 软件。 今天 其实 他 做 背景 分割 的 时候 都 还 是不是 特别的 好的, 对 吧? 第一个 是 比如说 这个 分割 一直 在 飘, 我 戴 个 眼镜, 或者 我的 背后 有一个 桌子, 或者 背后 走过 一个人 等等。 大家 就会 发现 说 他的 风格 效果 是不是 最 理想 的那 有了 sam 之后 的话, 因为他 对于 这种 分割 更加 接近 于 我们 人 所 思考 的, 所谓 叫 semantics, 就 更加 有 这种 物体 的 语义 在。 我们 可以 想见 说 在 将来 这种 物体 的 分割, 比如说 一个 我们的 前景, 开会 的 人的 屏幕 的 分割 等等, 会 变得 更加 的 高 效果 和 低成本。 这些 事情 我 觉得 可能 没有 像 C T P C 那么 的 惊艳, 就是 没有 那么 大 的 一个 撬 变。 但是 从 一个 computer vision 老兵 的 这个 角度 来看 的话, 我 觉得 他 还是 是 非常。
有 价值 的对, 所以说 我也是 蛮 期待 的。 不管 是在 文本 还是 图像, 还是 视频, 都 希望 这个 大 模型 能够 让 不做 大 模型 的 人, 但是 做 应用 的 人 能够 往前 跨 一大步。 我 觉得 这个 还是 让人 蛮 期待 的。 其实我 还有一个 问题 稍微 跟 技术 有关, 但 不是 一个 纯 技术 的 问题。 也就是 现在 这个 A I 的 发展, 尤其是 过去 几个 月, 我相信你 也有 同感, 就是 发展 的 很快, 至少 是 每个 礼拜 都是 恨不得 有 好几个 比较 大 的 新闻, 比较 大 的 一些 技术 的 突破 也好, 或者 产品 的 突破 也好, 我 觉得 都是 有 不少。 你 觉得 这个 是 一件 好事 吗?
我 觉得 是一个 好事儿, 我 可能 稍微 有一点 偏 达尔文主义 者 一点儿。 咱们 问 这个 问题 的 背景, 可能 就是说 大家 会 担心 说 技术 的 迅速 的 发展 是不是 会 带来 一些 社会 和 伦理 的 角度, 我们 还没有 想 清楚 的 事情。 我 觉得 基本上 那么 多年 的 历史 过来, 我们会 发现 的 是 说 技术进步 到 最后 都 还是 一个 好事儿。 一定程度 上 我们 可以 相信 说 我们的 人性 和 社会制度 是 能够 让 我们在 发展 当中 不断 的 来 思考 怎么 兜底 的 问题 的。
之前 的 时候 举 个 例子, 比如说 计算器 刚 出来 的 时候, 我们会 觉得 说, 完了 这个 将来 小孩 都 不会 算 加减乘除 了。 然后 我 发现 说 其实 并没有。 我自己 的 一个 强烈 的 一个 感觉 是 说, 技术 的 进步 会 使得 我们 整个 社会 的 生产力 提高。 生产力 提高 之后, 蛋糕 就会 做 的 更大。 蛋糕 做 的 更大 是 我们 每一个人 能够 分 到 更多 蛋糕 的 一个 基础。 蛋糕 做小 了 谁 都不 开心, 蛋糕 做大 了, 我们 总 能够 找到 一个 更加 合理 的 分配方式, 让 大家 都 开心起来。 以前 改革开放 的 时候 说 发展 是 硬道理 还是 很 相关 的。 所以 技术 也是 一样, 发展 是 硬道理。
从 这个 角度 上 来讲, 你是 觉得 蛋糕 会 变大。 当然 这个 蛋糕 不会 平均分, 但是 从 平均 的 角度 上 来讲, 每个人 分 到 的 蛋糕 是 会 比 以前 更多。 这 里面 有一个 很 实际 的 问题, 就是 蛋糕 有可能 变了。 不管 是 一倍 的 两倍、 三倍 确实 大 很多 了。 但是 分 到 给我 个人 的, 以前 我 分 到 一大块 以后 可能 分 到 1小块 甚至 没有了。 从 这个 角度 上 来讲, 你 对 那些 有 这方面 顾虑 的 人, 你 会 有些 什么 建议 或者说 是 想法。
我 最近 在 看 各种 关于 ChatGPT 文章 的 时候, 我 觉得 看到 的 一个 比较 有意思 的 一个 逻辑, 我 觉得 挺 对的。 就是 他 提到 说 今天 我们 都 担心 A I 会 替代 人, 但是 其实 不是 是 说 会 A I 的 人 会 替代 掉 不会 A I 的 人, 其实 还是 人 替代 掉 人。 这个 事情 就 像是 咱们 以前 的 时候 的 中国 刚刚 改革开放 的 时候, 大家 刚 开始 学 计算机 的 时候, 我们 说 全民 大家 都要 去 学 计算机。 因为 懂 计算机 的 人 会 替代 掉 不懂 计算机 的 人。 今天 A I 可能 也是 一样, 就是说 大家 到 最后 都是 能够 有 更 加强 的 学习。 新来 学习 新技术, 再 把 这些 新技术 用到 自己的 工作, 包括 生活 上去 的, 就 能够 获得 更大 的 红利。
这个 事情 还是 一个 硬道理。 咱们 传统文化 上面 说 学习, 那就是说 学习 永远 都 没错, 所以 这个 建议 可能 也 相对 比较 的 老气横秋 一点。 是 说 看见 有 新 东西 我们 就 学学 了 之后 来 学以致用, 然后 最后 那就 肯定 不会 被 淘汰。 如果说 真的 说 被 淘汰 了, 那只 能够 依赖 社会制度 了。
对扬 青 你的 这些 想法 也好, 或者说 观点 也好, 跟 我 个人 的 也是 非常 非常 接近, 上 个 礼拜 我在 欧洲 的 时候, 在 一个 大学 里面 也 做了 一个 演讲, 也是 其实 关于 这个 话题 的 大学 里面, 也有 那个 学校 的 教授、 副校长 也 来 听 他们 提 的 一个 问题, 就是 对 教育 应该 有些 什么样 的 改变。 我 其实 也 想听听 你 对 这个 问题 的 想法。
因为我 父母 他们 都是 退休 的 教师, 所以说 提到 教育, 我 觉得 我自己 还是 挺 有 感受 的。
我 父母 也是 老师。
教师 世家。 大家 现在 都在 担心 一点, 就是说 像 ChatGPT 等等, 会 造成 更多 的 作弊 等等我 觉得 这个 事情 其实 一定程度 上 来说 不是 什么 坏事 儿, 就像 打字 打 得 快 的 人 总是 比 打字 打的 慢 的 人 要 更有 优势 一些。 包括 写字 写 的 快 的 都会 比 写字 写 的 慢 的 要 有意思 一些。 所以 如果说 我们 把 H H P T 当成 是一个 更加 有效 的 工具 的话, 那么 我 觉得 教育 这 一块儿, 我们 也会 更加 进一步 的 去 改变 教育 的 方式。 把 这些 能力 都 逐渐 的 揉 到 我们的 教育 的 内容, 教育 的 体系 里头 去。
往回 数 40年, 基本上 咱们 国内 是 没有 计算机 这 门 课程 的那 计算机 出来 了, 它是 一个 很 好的 工具, 甚至 在 高中 都有 一些 计算机 学习 的 课程 出来 了。 人工智能 有可能 将来 的 时候 并不一定 只是 在 GPT, 对 吧? 人工智能 可能 也会 越来越多 的 更好 的 融入 到 我们 自己的 教育 里头 去, 这 是一个 很 自然 发展 的 一个 过程。
我们 人 基本上 就 想 咱们 寿命 最多 平均寿命 全球 的 可能 七十多岁。 我们 学习 的 年纪 也就是 比如说 前 大概 25年 或者 前 30年。 如果你 读 P H D 的话, 对 吧? 在 这个 30年 当中, 怎么样 来 揉 进 足够 多 的 内容, 是一个 教育领域 越来越 挑战 的 一个 事儿。 因为 古代 的 时候 你 就读 四书五经 就 够了。 今天 你 什么 物理化学、 计算机 什么 新 东西 都有, 对 吧?
那 因此 的话, 我们 肯定 会 需要 有 一种 更 高效 的 方式, 把 更新 的 内容 都 融 到 教育 体系 里面 去。 这个 我 觉得 是 不由 我们 自己的 意愿 所 改变 的 一个 事儿。 我们 与其 去 担心 说 会不会 在 GPT 未来 形成 作弊, 不如 来 思考 说 我们 怎么样 来 更加 高效 的 让 这些 更新 的 技术 更好 的 融 到 我们的 整个 教育 体系 里头 去。 我 觉得 这个 可能 是一个 更加 值得 问 的 问题。
最后 关于 这个 话题, 最后 再说 一个点, 其实 很多 我们的 听众 本身 就是 计算机 工程师, 俗称 马工。 硅谷 很多 硅谷 之外 也 很多, 国内 也 很多。 从 一个 需求量 来讲, 你 觉得 一年 以后、 三年 以后、 五年 以后, 我们 对 工程师 的 需求量 会 减少 吗?
我 觉得 会 增多。 最近 大家 都会 比较 担心 说, chat V T 都会 写 代码 的, 是不是 我们 马上 就 失业 了, 对 吧? 我 今天下午 的 时候, 我自己 在 那儿 写 一个 slack 的 一个 bot 就是我 希望 让 写 一个 slack bot 他 能够 我 直接 艾特 他他 能够 在 同事 去 到 zoom 里头 帮 我 建 一个 zoom 的 会议, 把 这个 zoom 的 会议 切 回到 slack 里头, 让 大家 现场 就可以 开会, 我 就 不需要 自己 跳 到 zoom 里头 去了。 以前 写 一个, 我猜 可能 也得 几天, 今天我 一 下午 就 写 完了, 为啥 呢? 我 让 ChatGPT 说来 帮 我 把 这个 slack box 的 框架 写 一下, 这个 zoom 的 怎么 建, 你 给我 再 写 一遍, 非常 快 就 写 完了。 我 觉得 这个 时候 不是说 他 代替 了 我, 而是 它 极大 的 提升 了 我的 生产力。
生产力 起来 之后, 需求 肯定 会 起来 的。 因为 以前 的 时候 大家 发现 说, 中小型 的 企业, 大家 发现 说, 我要 雇 一个 工程师 好 贵。 但 现在 发现 说, 这个 工程师 他 只需要 比如说 一两个 小时 在 我 这儿 工作, 他 就能 帮 我 搞定 一个 应用 了。 那 他 就 更加 愿意 来 想说, 那 我可以 做 一些 什么 事情, 还是 单 后 更大 的 一个 逻辑。 以前 我们 写 个 冒泡排序 都能 赚钱, 现在 赚 不到 钱 了。 但是 只要 我们 有 能耐, 那 这个 市场需求 更大 了, 绝对 能够 更加 有 市场, 这个 我是 充满信心 的。
在 微软 的 C E O 萨 提, 他的 理论 就是 programmer 或者说 马工 的 数量 也好, 能量 也好, 其实 是一个 企业 的 数字 货币 的 多少。 就说 如果我 有 十个 程序员, 有 100个程序员、 1000个程序员, 其实 是 代表 我 这个 公司, 它 叫 digital currency, 其实 是 我们的 公司 的 一个 相当于 数字 货币 一样的。 当然了, 我希望 我的 公司 的 钱, 数字 货币 是 越多越好, 这是 显然 的。
今天我 可能 有 100个人, 但 我 其实 是 希望 有 1000个人的。 为什么? 因为 1000个人我 能够 做 更多 的 事情。 但是 我 今天 只有 100个人是 为什么? 因为我 养不起 1000个人。 所以说 我 觉得 他的 要求 其实 1000个还是 在那边 的, 只是 我们 今天 只能 养 100个人。
从这一点 上 来讲, 我不知道 对于 大厂, 就是 五六个 超大 厂 是 怎么 样子。 但 至少 对于 千 千百 百 或者 千千万万 的 绝大多数 的 企业, 他们 今天 digital currency 其实 是 匮乏 的。 可能 他 有 100个1000个 程序员, 他 其实 应该 有 1万个 在那边。 所以说 像 杨青 你 刚才 说 的, 工程师 的 效率 能够 提高, 其实 对 这些 公司 是 肯定 是 有 极大 的 帮助。
对我 也是 这样的 一个 观点。
你的 老东家 阿里 本周 就会 马上 要 发表 一个 他的 大 模型 的 大 发布会, 其实 我们在 录 这个 节目 是在 这个 发布会 之前, 但是 这个 节目 大家 听到 的 时候, 这个 发布会 已经 开 了。 那 能不能 讲 一些 你的 一些 想法 感想, 或者说 是 大家 应该 是 去 怎么 理解, 怎么 去 看待 这件 事情。
因为我 自己 在 阿里 的 时候, 我们 团队 也是 支持 达摩院 在 上面 做了 模型 的 训练 跟 部署。 所以 对 达摩 这边 也是 挺 有 感情 的这 块儿 我 觉得 国内 大厂, 我们 大家 从 一个 观众 的 角度, 今天我 失业 了, 对 吧? 就可以 说 的 没有 那么 有 压力 了。 从 一个 观众 的 角度, 其实我 觉得 大家 是 会有 一点 审美疲劳 的。 就是 百度 来 一个, 腾讯 来 一个, 阿里 来 一个, 华为 来 一个, 对 吧? 还有 大家 各种各样 的 创业 公司 来 一个。 一方面 比较 兴奋, 就是 大家 有 非常 多 的 人 在 努力 的 把 这个 技术 往前走。
另外 一方面, 我 觉得 大厂 也会 逐渐 的 会 开始 思考 这样的 一个 问题, 就是 怎么样 从 这 一系列 的 竞争 当中 脱颖而出。 所以 就 回到 我自己 最 开始 一个 观点 的话, 我 觉得 一个 基础 模型 是 不够 的, 在 上面 怎么样 来 拉 起 百花齐放 的 各种 应用, 其实 是一个 更加 有意思 的 一个 事儿。 举 一个 小 例子, 前几天 的 时候, 阿里 天猫 精灵 发布 了 一个 很 有意思 的 一个 小 应用。 就是 它 构建 了 一个 脱口秀 演员 鸟鸟 的 一个 数字 分身, 它 叫 鸟鸟 分 鸟, 不管 它的 技术 有多深, 但是 我 觉得 这 是一个 非常 有意思 的 应用 的 尝试。 所以 我 个人 的 一个 希望 是 说, 在 这 一段时间 大家 所有的 都 扎堆 发布 大 模型 之后。 我 个人 更 希望 看到 的 是 说 后面 有 更多 基于 大 模型 的 应用, 能够 像 雨后春笋 的 一样 再 迸发 出来。 这块 的话 就 其实 更加 靠 产品化 的 能力, 靠 用户需求 的 能力, 考 对于 应用 的 一个 更加 深入 的 理解。 我 觉得 最后 才是 大 模型 这 一块 产业 能够 蓬勃发展 的 一个 核心 因素。
所以说 虽然 也是 你的 老东家 发表 的, 你 觉得 也 已经 稍微 有点 审美疲劳 了。 是的, 对, 觉得 更 应该 把 应用 放在 大家 主要 看 的。 我 就说 一个 问题, 因为 尤其是 OpenAI 的 ChatGPT, G P T four 出来 以后, 大概是 两三个 星期 前, 他 公布 了 一个 plugging 的 一个 概念。 以后 不管 你是 订 飞机票、 订 船票, 做 任何 事情, 去 餐馆 买东西 也好, 都 只要 做 一个 大 模型 的 插件。 所以说 你 以后 只要 跟 ChatGPT 或者说 GPT five、 GPT six 去 交流, 就 能够 买到 机票。 从 这个 角度 上 来讲, 它 其实 是 把 应用 这个 概念 已经 大大的 改变 了, 应用 就 被 吸收 到 这个 大 模型 里面 去了。 你是 怎么 看待 这件 事情?
我 觉得 这 是一个 非常 有 道理 的 一个 变化。 这个 相关 的 最近 还是 靠谱 的 创始人 Michael hash model 写 了 一篇 文章, 我 觉得 挺 值得 读 的。 他说 一个 颠覆性 的 技术 真正 要 落地 的 时候, 都会 需要 有一个 相对 应 的 渐进式 的 变化 的 一个 道路。 因此 的话 就 比如说 像 ChatGPT, 如果说 只是 纯 一个 chatbot 的话, 它 和 今天 的 应用 就 怎么样 顺畅 的 迁移 跟 结合 是 不太 清楚 的。 但是 plugin 我 觉得 exactly 的, 就和 哈希 model 讲 的 比较 像。 它 其实 是在 寻找 一个 现有 的 应用 和 人工智能 的 算法 之间 的 一个 顺畅 迁移 的 一个点。
首先 拿 H T GPT 用 自然语言 的 方式 来 识别 用户 的 意图。 这个 意图 识别 完了 之后, 我 通过 plug in 的 一个 方式, 再来 用 传统 的 编程 结构化 的 方式 来 实现 最后的 无论是 机票 的 交易 还是 商品 的 采购 等 这 一系列 的 事儿。 它 和 以前 不一样的 一点 是 说, 交互 变得 更加 自然 了。 虽然 背后 的 是 操作, 最后的 各种各样 的 决策 过程 依然 都 还是 需要 来 编程 实现 的。 它 就有 一个 比较 顺畅 的 迁移 过程。 我 觉得 与其说是 各种 应用 被 吸收 到了 ChatGPT 里头, 反 过头 来 可以 说 大 模型 的 A I 的 算法 开始 变成 了 应用 里面 的 一个 不可或缺 的 一部分。
这个 事情 前几年 也有 过。 大家 可能 还记得 facebook 出过 一个 叫 facebook m 就是 在 facebook messenger 里面 能够 来做 一些 类似的 操作。 订 餐馆 的, 订 酒店 的, 谷歌 几年 前 应该 也 发布 过 一个, 我忘了 是 哪 年 的 谷歌 I O 里面 讲到 这个 了。 但 当时 的 时候 技术 上 没有 像 大 模型 来 的 那么 的 深入, 来 的 那么 的 鲁棒。 同时 的话 这个 应用 也没有 走 的 太远。 今天 的话 这个 系统 模型 这 一侧 变得 更加 的 鲁棒 了, 希望 这次 应用 上面 能够 爆发 一把, 这是我 自己 一个 个人 的 愿望。
但是 从 这个 角度 上 来讲, 当年 移动 出来 的 时候, 或者说 苹果 手机 出来 以后, 突然之间 有了 成千上万 个 应用。 那 现在 会不会 产生 一个 情况, 就是说 有了 ChatGPT 或者说 GPT 的 后代 的 接下去 几代 的 大 模型 出来 以后, 没有 那么 多 的 新的 开发者。 因为他 把 过去 的 东西 接上去 太 容易 了。 我的 意思 就是说 这个 应用 虽然 说是 应用 仍然 在那边, 但是 应用 其实 被 大 模型 就 已经 吸收 掉了。 对于 不管 是 编程 者 或者说 怎么样, 其实 没有 那么 多 事情 可以 去 做了。 这个 我不知道 你是 怎么 去 想 的。
我 觉得 倒是 还是 有 不少 事情 可以 去做 的。 就举 个 例子, 拿 我 刚才 说 的 slack 里头 的 zoom 的 聊天机器人 来说 的话, 我 还是 需要 来 把 各种各样 的 实际 的 逻辑 给 搞清楚 的。 我会 用 一个 x GPT 的 A P I 来 识别 说 我 发给 这个 聊天机器人 的 一句话, 是不是 让 我 再 打开 一个 zoom 的 一个 链接, 或者 开 一个 zoom 的 一个 会议。 我 觉得 整体 上面 的 应用 的 逻辑 还是 要 靠 人 来 想 的这 就 像是 比如说 我们 今天 如果说 这个 公司 雇 一个 C O O 完了 之后, C O O 能够 解决 很多 的 各种各样 的 所谓 叫 Operational 这 一块 的 问题。 但是 最后 公司 要 做什么 这个 事情 还是 得靠 C E O 来 想 事儿。 只不过 有了 C O O 之后, C E O 就 如虎添翼 的, 可以 想 更多 的 事儿 了。 所以 我 觉得 倒是 不太会 出现 说 所有的 应用 都 一下子 被 吸收 到了 一个 工具 里头 去。 这种 情况 永远是 工具 为 应用服务, 而 不是 应用 为 工具 服务 的。
它 能够 起到 的 作用 不是说 所有的 应用 都在 大 模型 里面 了, 而是 说 它是 一个 dispatch 的, 或者说 是一个。 就 像你 刚才 说 的 C E O 的 这么 一个 角色。 但是 还 会有 不同 的 functional department, 不同 的 部门 去做 不同 的 事情。 但是 C E O 会 去做 这么 一个 协调, 或者说 是 去 分发 的 这么 一个 作用。 对, 是的, 好的, 谢谢 杨青 今天 分享 了 这么 多希望你在 创业之路 上面 好运, 也 希望 以后 返 厂 来 讲讲 一路走来 有些 什么 新的 收获, 新的 学习。
好, 多 谢谢 徐 老师 的 邀请, 也 希望能够 做出 一些 东西 来 对 大家 有用, 然后 也 希望 将来 再有 机会 再来 做 分享。 这 期 what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G 艾特 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。
如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是在 公众 号 文章 中 扫 码 添加, 或者 是 公众 号 后台 回复 科技 早知道, 即可 获取 取 邀请码。 期待 你的 加入, 我们 下期 见。