We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 超级独角兽 Databricks 联合创始人:从对决 Snowflake,到人类如何与 AI 共存 | S7E21 硅谷徐老师

超级独角兽 Databricks 联合创始人:从对决 Snowflake,到人类如何与 AI 共存 | S7E21 硅谷徐老师

2023/7/25
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
R
Reynold Xin
硅谷徐老师
Topics
硅谷徐老师:就生成式AI的冲击和发展趋势,以及企业如何适应新的技术变革进行了深入探讨,并对AI时代人才需求的变化和未来发展方向提出了独到的见解。 Reynold Xin:就生成式AI对企业的影响,特别是对数据平台和人机交互方式的改变进行了深入分析,并对开源模型和闭源模型的优劣势进行了比较。同时,他还分享了Databricks在AI领域的战略布局,包括收购MosaicML以及对未来AI发展趋势的预测。 Reynold Xin:详细阐述了生成式AI对企业数据栈的冲击,以及企业如何应对这一挑战,并强调了线上线下数据平台集成的重要性。他还分析了数据平台与数据价值之间的鸿沟,以及如何利用云计算和AI技术来缩小这一鸿沟。 Reynold Xin:就大型语言模型在企业级场景中的应用,以及开源模型和闭源模型的优劣势进行了深入探讨,并对GPU短缺问题以及多云部署策略进行了分析。他还分享了Databricks收购MosaicML的原因,以及对未来AGI发展趋势的预测。

Deep Dive

Chapters
本节探讨生成式AI对软件业的冲击,特别是人机交互方式的改变。传统的人机交互方式存在门槛,而自然语言交互更加简单有效,但目前业界尚未找到完美的自然语言交互模式。AI的应用也需要线上线下平台的良好集成,这将推动数据平台的线上线下融合。
  • 生成式AI最大冲击在于改变人机交互方式,自然语言交互更简单有效
  • 未来数据平台需线上线下良好集成
  • AI应用需兼顾线上线下平台

Shownotes Transcript

在 节目 开始 前, 想 给 大家 推荐 一下 我们 声音 特稿 节目 跳进 兔子洞 的 最新 专题。 这本 是一个 没人 关注 的 失踪案。

就 这种 失踪 的 事情 特别 多。

这些 情况 我们 每 一个月 都有。

但 却在 一夜之间 变成 了 流量 的 宠物。

其实 流量 特别 大, 尤其是 抖 音 还有 微博。

去年 的 十月份, 一个 叫做 胡 鑫宇 的 高一 男生 在 校内 失踪, 这件 事情 很快 在 互联网 上 获得 了 关注, 铺天盖地 的 谣言 和 阴谋论 也 随之而来。 绿的 看到 了 校长 和 他的 女朋友 在一起, 校长 担心 事情 败露, 会 影响 自己的 前途 和 名声。 经过 三个 多月 的 搜寻, 胡 鑫宇 的 尸体 最终 在 距离 学校 200米的 一个 粮仓 中 被 发现, 官方 的 调查结果 认定 胡 鑫宇 是 上吊自杀。 不过 经过 历时 一个半月 的 调查 和 采访, 跳进 兔子洞。 节目组 发现, 在 这个 被 认定 的 真相 背后, 隐藏 着 诸多 推手, 凭借着 一股 怪力, 他们 在 暗中 改变 了 故事 的 走向, 甚至 直到 今天, 他们 仍在 看不见 的 角落里 编织 着 另外 一种 真相。

您 是 胡 鑫宇 的 表哥。 对对对, 那 您 发 这个 视频 是 为了什么? 您 真的 认识 胡 鑫宇 吗? 这 期 节目 正在 连 更 中, 从 本周二 到 周五 每天 更新 一集。 你可以 在 show note 里 找到 节目 的 链接, 期待 你的 收听。

用 声音。

碰撞 世界。

生动活泼。 Hello 大家好, 我是 丁 叫, 欢迎 收听 全 新一集 科技 早知道。

科技 早知道 的 朋友们 大家好。

最 近几个月 是 AI 人工智能 如火如荼 的 几个 月。 我 这边 又 请 到了 我们 一年 多 前来 我们 科 早知道 做 节目 的 rino 的 data bricks 的 联合 创始人。 他在 一年 多 前 跟 我们 讲 了 一些 关于 data bricks 的 发展 一路走来 的 历程。 你好, 欢迎 你 返场 到 我们的 科技 早知道 节目。

你好你好, 阿姨, 大家好。

最近 六个月, 人工智能 是 几乎 每天 都有 很多 的 新的 消息, 包括 data bricks 两三个 礼拜 之前 开 了 一次 用户 大会, snowfall 在 同一个 时刻 开 了 一个 用户 大会。 当然了, 最终 大家 提供 的 技术 不一定 是 一样, 但是 说 了 很多 类似的 话题, 我 观察 到 有一点, 不管 是 你们的 C E O 还是 snowflake 的 C E O Frank 都说 了 几乎 同样 的话。 This is the best time to be alive.

现在 是 作为 人类 的 最好的 时刻。 能不能 讲一讲 你的 想法? 你是 对 这 句 话 是 怎么 想 的, 怎么 理解 的这。

一点 我是 很 相信 的。 因为我 觉得 从 个人 角度 出发, 无非 你 希望 自己 做 的 这个 贡献 可以 有 一定 的 影响力, 对 吧? 对于 我们 这些 做 技术 的 人 来说, 我 觉得 可能 没有 任何 一个 之前 的 时代 有 现在 这么 的 exciting。

只要 是在 这个 行业 里头, 不管 你 做 的 是 前端 后 端, 只要 跟 它 相关 的, 你可以 看到 其实 你 做 的 一点一滴 正在 改变 这个世界。 而且 这个 改变世界 的 速度 越来越快。 比如说 几十年 前 的 时候, 做 硬件 是一个 巨大 的 机会, 也是 一个 改变世界 的 事情。 但 作为 硬件 可能 需要 一个 好几年 的 时间 才 可以 看到 成果。 而 到 今天, 因为 cloud, 因为 A I 你 去做 某某 一个 改变, 很 可能 在 几天 之内 你 就可以 看到 一个 成果。 然后 可以 看到 它 影响 了 很多很多 直接 和 间接 的 影响 了 非常 多 的 人。 而且 你可以 看到 经过 长期 的 积累 之后, 这个 改变 会越来越 大。

最近 六个月 比较 大 的 一件 事情 就是 ChatGPT 出来 横空出世。 然后 大家 觉得 生成式 的 人工智能 到了 一个 新的 阶段。 一年 多 前 你 已经 强调 了, 我们 data bricks 就是 embrace 拥抱 A I 的 一个 公司。 那 这一次 的 生成式 的 人工智能, 为什么 跟 一年 多 前 你 谈到 的 A I 是 很 不一样? 从技术上 来讲。

我 有 几点 就 具体 技术 上 可能 有 一些 本质 的 区别。 包括 了 比如说 现在 大 模型 的 这个 size 非常 的 大对 吧? 跟 刚刚 可能 训练 成本 非常 的 高。 但是 我 觉得 可能 更 重要 的 并不是 技术 上 的 这个 区别, 而是 在 12月份 GPT 发布 之后, 突然间 大家 都 看到 了 这个 我 指的 大家 不光是 技术人员、 从业人员, 而是 所有的 包括 了 不懂 技术 的 人, 各个 C E O 大家 的 爸爸妈妈 他们 都 发现, 人工智能 好像 真的 正在 颠覆 我 对 世界 的 认知, 正在 颠覆 我 对 计算机 的 认知。 然后 这就 导致 了 从 董事会 broom 到 C E O 都 突然间 对 这 一方面 有 非常 大 的 推动。

我 觉得 里头 有 就是你 要 一个 技术 成熟 跟 这个 推广 有 两点 很 重要。 第一点 是你 需要 有 足够 多 的 人 相信 他, 另外 一点 是你 要有 足够 的 人 相信 他们 能够 做到 这个 事情。 我 觉得 12月份 之后, 可能 全世界 百分之 没有 100%, 可能 有 99% 的 人都 相信, 现在 人工智能 跟 以前 不太 一样 了。 然后 另外 一点 是 他们 突然间 觉得 人工智能 离 自己 很 近, 不一定 说 他是 自己 去 开发 模型, 但 他 感受 到了, 我可以 利用 这个 A I 我可以 利用 人工智能 来 够 改变 或者 提升 我的 这个 business。 这两点 加起来 之后, 我 觉得 就是 一个 市场 成熟 的 一个 或者 市场 爆发 的 一个 最 重要 的 两个 基础。 对对对。

5月31 号 我们 聚会 的 时候, 你 提到 的 一个 观点 就是 结论。 对。 AI 出来 以后, data stack 这个 数据 站 都会 被 冲击 到 公司 也会 大大 冲击 到 每个 公司。 如果说 不 重新 去 思考 这个 data stack 的话, 不管 你 以前 做 的 怎么 好, 就 become irrelevant, 变成 恐龙 了。 这个 对我 触动 蛮 大 的 原因 是因为 也就 仅仅 在 六个月 之前, snowflake 也好, data break 也好, 都是 属于 当红 的 榨汁机, 就是 非常 热门 的。 但 即使 是 这么 热门 的 公司, 你 都 觉得 如果我们 不去 用 报 一个 新的 这么 一个 潮流, 我们 也会 变成 irrelevant, 我们会 变成 恐龙。 能不能 给 我们的 听众 朋友们 细细的 来 讲一讲, 你 当 时候 为什么 这么 想?

对我 先 解释一下, 澄清 一下。 就是说 变成 恐龙 这个 变成 大人 的 手, 并不 代表 说 这个 公司 会 比如说 一昼夜 之间 消亡。 我记得 我 当时 说 的话, 可能 是 开始 一个 十年、 20年 或者 甚至 30年 的 这个 衰减 期。 而 这个 衰减 期 可能 你 会 看到 这个 公司 其实 越做越 好, 利润 或者说 营业额 越 增长 越快。 但是 其实 已经 是一个 衰减 的 开始了。 这 原因 是因为 所有 只要 跟 企业 软件, 就是 dad bricks, 包括 你 刚刚 提到 其他 公司 都是 这个 enterprise 企业 软件 市场。 企业 软件 这 是一个 非常 慢 的 周期, 你是 不可能 会 因为 这 某 一种 技术 瞬间, 不管 是一个 特别 好 或者 特别 不好 的 影响, 造成 有 昼夜 之间 巨大 的 改变 的。

我 之所以 这么 觉得, 其实 可能 两点。 第一点 是我 觉得 从 geni 或者说 large language model 的 角度 出发, 它 跟 软件 相关 最大 的 冲击 可能 是 人机交互 的 方式。 因为 传统 其实 有 很多 不同 的 U I? User interface 有 不同 人机交互 的 方式。 这 有可能 是你 有 这个 graphic user interface, 然后 有可能 是一个 命令行 的 模式, 有可能 是 比如说 你 用 A P I 编程 的 模式。 这些 模式 其实 都是 需要 有 一定 的 门槛 的。

其实 最简单 的 这个 交互 模式 是 自然语言。 大家 用了 这个 chat B D 还是 说 cloud 这些 会 发现 自然语言 是一个 非常简单 非常 有效 的 一个 人机交互 的 模式。 不懂 任何 应用 技术 的 人 可以 用 自然语言 来 和 这个 计算机 沟通。 这个 其实 对 这个 界面 本身 是一个 巨大 的 改变。 从 这个 角度 讲, 整个 业界 其实 现在 并没有 很 好的 清楚 知道 未来 这个 人机交互 应该 是 怎么样 的, 我应该 怎么样 来 具体 做。 这个 就是 由 L N base 的 nature, 这 是的 U I 大家 都 觉得 这 有可能 是 未来, 但 其实 这个 未来 还没有 被 真正 的 创造 出来。

比如说 我 觉得 大家 可能 都在 做 的, 基本上 每个 公司 都在 这。 那 我 能不能 自动 生成 S Q L? 因为 SQL 本来 就是 一个 数据 查询 的 最 通用 的 语言。 我 作为 一场 从 英语 或者说 各种 自然语言, 包括 中文 到 这个 S Q L 的 翻译。 我们 就可以 很 好的 让 我的 这个 产品 可以 给 所有的 用户 用, 甚至 包括 非技术性 的 用户。

但 其实 如果 你看 各种各样 的 benchmark, 各种各样 的 真实案例 里头, 现在 到 直到现在 也没有 一个 很 好的 english to single。 所以 我 提到 的 可能 他 对 这个 界面 的 巨大 的 改变, 并不一定 是 大家 想象 中的。 我可以 直接 把 这个 自然语言 翻译成 某 一个 现代计算机 制造 的 东西, 它 很 可能 会 需要 有 更 深层次 的 技术 的 改变。 具体 是什么 呢? 其实我也不知道, 因为 目前 这个 世界上 并没有 解决 这个 问题, 但 我 非常 相信 这个 问题是 会 被 解决 的。 而且 被 解决 了 之后, 会对 现有 的 所有的 数据分析 和 编程 相关 的 工具 都 会有 很大 的 改变, 这 是一个。

另外一个 是从 你 怎么 运用 一个 数据 平台 的 角度 出发。 就现在 很 明显 就是 未来 所有的 公司 都会 希望 能把 这个 A I 应用 到 他们的 这个 生产线 上, 提高 他们的 business 各种各样 的 K P I。 这些 很多 应用, 其实 数据 平台 在 过去 对 很多 类似的 应用 可能 并没有 特别 我 觉得 完美的 支持。 而且 在 传统意义 上, 数据 平台 其实 更多 的 是个 线下 的 平台。 但是 当你 需要 大量 的 应用 A I 在 你的 生产线 上 的 时候, 这个 时候 需要 你的 线 上线 下 平台 有 非常 好的 集成。 因为你 首先 你 需要 线下 平台 来 train 你的 这个 model。

传统意义 上 的 数据 平台, 如果你 想象 的话, 基本上 就是 完全 是一个 离线 的 状态。 我 觉得 因为 A I 的 关系, 会有 一个 加速 把 这个 offline 跟 line 的 两个 stack integrate 起来 的 最终 的 结果。 如果 一个 公司 只能 很 好的 提供 一个 offline 的 平台, 或者 只能 很 好的 提供 一个 online 的 平台 的话, 这 公司 最后 必然 会 是 处于 这个 劣势。 因为 最终 胜出 的 那个 一定 是 同时 可以 兼顾 两个。

你 刚才 讲 的 是 往前 看, 那 能不能 我们 往后 看? 因为 数据 产生 价值 这件 事情 已经 讲 了 很多年 了。 我 这边 有一个 问题是 是 我在 朋友圈 里面 贴 了, 我说 要 跟 reno 的 重新 讨论 一次。 然后 有一个 朋友 就 提 了 一个 问题, 他的 问题 就是 数据 的 infrastructure 跟 数据 价值 之间 一直 在 讲 这么 一个故事, 也 一直 有一个 鸿沟。 你 想听听 你 觉得 这个 鸿沟 为什么 会 存在? 然后 有什么 通用 的 方法 去 发挥 数据 的 决策 价值。

提高 鸿沟 之前 先 讲 一点, 就是 关于 这个 A I 其实 数据 都是 最 重要 的 一步。 那么 对 各种 企业 内部 来说, 其实 有 好的 数据 平台, 有 这个 好的 数据 能够 把 数据 整合 到 具体 需要 的 这个 格式 需要 的 平台 里头, 本身 就是 一个 竞争 的 优势。 就 比如说 我们 刚刚 说过 的这 摩斯 爱 公司, 他们 觉得 他们 发展 的 两大 瓶颈。 第一个 是。

1.3个, 别人 点33亿美元。 只有 你们 这样的 财大气粗 的 公司 能够 买得起。

他们 这个 很 不错 的 公司。 但是 他们 内部 觉得 自己 发展 了 两个 最大 的 瓶颈。 第一个 是 这个世界 没有 足够 多 的 GPU, 第二个 是 客户 需要 有 数据。 可是 课 的 data 需要 ready, 他 才能够 能 train 他的 这个 L I model。 如果 data 不 ready, 就 A I 的 instruction 再 好 也 白搭。

那么 回到 刚刚 这个 数据, 你 刚刚 说 的 可能 数据 平台 和 这个 价值 之间 的 鸿沟。 各个 公司 其实 都 投入 了 很多, 不管 是 钱 还是 人力 在 数据 平台 上, 我 觉得 他们 其实 也 不是 傻 的。 这些 公司 大多数 数据 平台 你是 可以 看到 有 真正 的 结果。 但是 你 可能 也可以 看到 很多 失败 的 这个 案例。 就 可能 每个 公司 都是 上 亿美金 的 这么 投, 每个 大公司 都 是一个 上 亿美金 级别 的 投入。 就 没有 足够 多 成功 案例, 他们是 不会 这么 做 的。

但 其实 有 很多 失败 的 案例, 我 觉得 失败 案例 有 很多 原因, 但是 其中 一个 可能 最大 的 原因, 一方面 是 可能 跟 技术 相关 的。 就 比如说 这个 的确 我 觉得 数据 平台 在 起码 10年 前 或者 十年 以前, 其实 是一个 非常 门槛 非常 高, 非常 难 用 的 这个 设计。 而且 这个 我 觉得 跟 各种 技术 层面 的 东西 有关。 我 觉得 还有一个 就是 跟人 有关, 起码 在 以前 并没有 足够 多 的 人才, 需要 能够 真正 很 好的 应用 好一个 数据 平台。 能 带来 这个 商业 上 的 价值 的话, 你 需要 第一 你 需要 有 足够 有 技术 的 人。 第二 你 需要 有人 能够 把 技术 和 business 之间 不同 的 语言 能够 互相 的 转换, 互相 的 翻译。 如果 缺乏 这一点 的话, 你 就会 造成 这个 platform for platform seek。

因为 可能 招 了 一大堆 工程师, 招 了 一大堆 研究人, 他们 觉得 我们 应该做 这个。 但 这个 很 可能 在 比如说 他 之前 的 公司 或者 之前 的 这个 场景 里头 是 适用 的。 但 到了 他 新的 这个 场景 里头, 他们 需要 优化 的 东西 完全 不一样, 或者说 他的 行业 完全 不一样。 有可能 它的 数据 的 这个 挑战 完全 不一样。 所以 会 碰到 这样的 问题。

然后 还有一个, 是我 觉得 说实话, 我 觉得 语言 就 cloud computing 对 这个 是一个 比较 重要 的 事情。 因为 其实 大家 人的 精力 都 有限, 大家 这个 时间 的 tension span 也 有限, 就 不 甚至 包括 了 一个 excel。 你 有可能 在 一个 公司, 在 一个 大公司, 比如说 一个 C I O 或者 什么, 它 有可能 就是 几年 的 时间 平均 下来。

在 cloud 之前, 比如说 做 一个 数据 平台, 做 任何 的 数据 infrastructure, 你 首先 碰到 第一件 事情 就是我 需要 购买 这个 真正 的 机器。 然后 等到 机器 上线, 选择 好了 这个 竞标, 竞 好了, 弄完 了 各种各样 的 review, 搞完 之后 可能 已经 是 两年 之后 的 事情 了。 这个 时候 你 甚至 C I O 或者 他 下面 的 V D 有可能 已经 不在 这个 公司 里头 了。 所以 我 觉得 现在 的 速度 越来越快。 因为 cloud 的 原因, 就是 很 可能 你可以 在 一个 礼拜 之内 上线, 一个 礼拜 之内 做 完 P O C。 我 可能 还是 需要 经过 慢慢的 这个 security review, 这个 procurement, 但 这些 其实 就 相对 以前 来说 已经 是 这个 光束 了, 我 觉得 这一点 其实 也有 很大 的 帮助, 让 这个 数据 平台 们 可以 发挥 的 空间 越来越大。 因为 你可以 有 一定 的 这个 vision, 然后 你可以 在 有限 的 时间 之内 看到 他 可以 上线。

对, 很 不错。 有 好 几点 我是 同意 的, 有 一小 点 我 并不 完全同意。 第一个 你 提到 就是 数据 不一定 ready, 这点 我是 非常 同意 的。 因为 很多 时候 你 有 数据 不 代表 有用的 数据, 或者说 有 干净 的 数据。 另外 第二个 你 提到 的 是 人才, 我 先 放 一 放, 我 稍微 有点 不一样的 看法。 第三点 我 觉得 你 讲 的 也 不错, 就是 这个 架构 很 不一样, 对 吧? 今天 的 新的 云计算 的 架构 使得 大家 做 事情 更 加快。 你 提到 那个人 这一点, 就是 确实 是对 人才, 对 做 project, 对 做 这个 项目 是 非常重要 的。 但是 我 觉得 解决 的 方法 并不一定 说是 我要 去 期望 所有的 人都 像 reno 的 这样 一样, 去 读 伯克利, 去 读 那个 P H D 或者 怎么样。 我 觉得 应该 反过来 就是 这个 平台 能够 让 没有 太多 教育 的, 没有 太多 那些 P H D 博士 的 人 能够 去 用。

对, 这个 我是 同意 的。 但是 我 刚刚 说到 人才 里头 很多 的 其实 并 不是说 技术 人才, 而 说到 的 是在 能够 把 技术 和 这个 商业 就是 技术 你可以 不用 想象 成 一个, 比如说 我会 编程, 它 有可能 是你 对数 数据 的 洞察力, 你 了解 数据 有 什么样 的 用途。 包括 你 可能 需要 有 一定 基本 的 统计 知识, 就 我可以 直接 给你 生成 你 所 需要 的 所有的 统计数据。 但 如果 没有 办法 去 诠释 这 一些 事情 的话, 这 本身 也是 一个 门槛。

但是 我 觉得 解决 这件 事情 并 不是说 那个 data literacy? 教育 程度 就像 你说的, 这 不一定 是 编程 的 教育, 但 有可能 是 懂 统计 有 一些 洞见, 或者说 对 数据 有些 洞见。 但 我 觉得 今后 还是 需要 让 这些 没有 太 洞见 的 人 也 能够 产生 洞见。

给你们 公司 做 个 广告。 因为我 就 听 了 你们的 keynote? 你们 有一个 新的 产品 的 like as I Q 对 吧? 这个 就是 让 我 感觉到 它是 能够 帮助 那些 对 数据, 对 统计 不 那么 敏感 的 人 能够 产生 洞见。 你 刚才 提到 的 是 为什么 过去 十年 或者 若干年 有 这么 一个 鸿沟? 是因为 过去 的 平台 对 这个 人才 的 要求 蛮高 的。 但是 今后 不管 是 一年、 五年、 十年, 我相信 这个 要求 会 大大的 降低。

对你 就算 看今天 dead bricks 的 产品, 就 比如说 我们 用户 可以 非常简单 的 set up。 然后 你 如果 需要 分析, 甚至 比如说 几 一个 x by 的 数据, 你可以 是一个 很 普通 的 engineer 就可以 做到 dead break, 基本上 会 帮你 解决 底层 所有的 问题。 这个 在 十年 前 是一个 不可想象 的 事情。 我 觉得 接下来 会 做到 的 一定 是 让 这个 产品 越来越 易用。 所以 不管 是从 自然语言 的 角度 出发, 还是 其他 的 角度, 都 可以 让 到 受众 就 越来越 广。 对对对。

很多 朋友 跟我聊 说 data break 跟 snowflake 的 区别。 然后 很多人 觉得 我看 很很 容易 就 看 懂, 就是 一个 数据库 说 出来 了, 其实 非常 能够 理解。 但是 对 data bricks 做 的 东西, 很多 时候 很多 朋友 觉得 不能 完全 理解。 我 觉得 你 刚才 解释 的 就 非常 的 清楚, 其实 就是 提高 大家 使用 数据 的 能力, 使得 大家 处理 这些 数据, 不管 是 那个 volumes 还有 speed 的 还是 怎么样 的 各种各样 的 功能, 就 不需要 有 那么 多 的 sophistication 对 吧?

对, 这 但 这 只是 其中 一半, 另外 一半 是 A I 是的, 降低 数据 和 A I 的 这个 使用 门槛。

我们 暂时 从 节目 中 走开 一下, 我是 感言 听 酱。 最近 我 回到 了 硅谷, 正巧 我们的 监制 刘灿 也 在 硅谷 探望 家人, 再加上 我们 科 早 的 另外 两个 常驻 硅谷 的 主播, 硅谷 徐 老师, 还有 我们的 出海 专栏 的 主持人 Richard。 我们 科 早 的 几个 主播 终于 在 远程 录制 了 非常 久 之后 能 齐聚一堂 了。 所以 我们 准备 在 硅谷 开 一次 线下 的 见面会, 时间 会 定在 8月6日 的 下午。 为了 保证 大家 能够 充分 的 交流, 所以 我们 这次 的 活动 也 只 针对 我们 生动 胡同 的 会员 开放 了。 具体 的 报名 的 信息 请 参见 我们的 说 no。 好了, 我 就说 到 这里, 我们 再 回到 精彩 的 节目。

我 注意到 不管 是 data bricks 的 C E O 阿里, 还是 snowflake 的 C E O Frank, 都说 了 同样 一句话, this is the best time to live。 另外 一句话 他们 也是 说 同样 的话, 他们 觉得 今后 每个 公司 都会 成为 A I plus data 的的 公司。 就是 任何 一家 公司 以后 都 会要 有 A I 都会 用 data。 那 我想 问问, 就 是从 这个 角度 上 来讲, data bricks 是 想 提供 全站 式 的 服务 吗? 就是 不管 一个 公司, 我是 home deep 是 做 零售 的 是 怎么样, 反正 你 要 处理 A I 或者 处理 数据 都 到 我 这边 来, 这是 你们的 vision 吗?

对, 这个 vision 其实 在 几年 前 就 已经 这么 确立 了, 就是 我们 说 database data and I company。 但 这个 vision 不 代表 我们 不会 跟 比如说 生态系统 里头 的 其他 公司 合作。 但 这个 vision 的 意思 是 我们 希望 成为 你 会 第一个 选择 的 平台。 我 觉得 一个 比较 好的 例子 就是 一个 iphone。 IOS 是一个 非常 好的 集成 的 平台, 基本上 可以 满足 你 绝大多数 的 需求。 在 里头 也有 各种各样 的 apps, 这些 apps 能够 来 弥补 比如说 平台 本身 的 不足, 让 平台 更加 的 有效。

那 我们 插 一段 可能 对 听众 来讲 比较 有趣, 但是 破解 完 的 sport 的 一个 问题 就是 data bricks 的 友商 snowflake 对 吧? 你们 最近 竞争 的 也是 蛮 激烈 的, 大家 去 snowflake 大会, 在 拉斯维加斯 的 机场 就 能够 看到 一个 data bricks 的 广告。 就是 我 比 他的 速度快 九倍。

我们 说的是 我们会 比 他 省省 九倍 的 钱。 然后 你 打开 那个 网站 的 时候, 其实 是 显示 了 九个 不同 的 客户 的 案例, 分布 在 各个 不同 的 行业。 从 sophie change 到 their bricks 很很 重要 的, 其中 原因 就是 sophie 太贵 了。

所以说 这个 酒杯 并不是 一个 marketing 的 number, 是一个 实际 的 背后 有 数据 去 支持 的 一个 number 对 吧?

对, 它它 其实 9G是一个 benchmark 的 这个 结果 的 数据, 也是 一个 这 是一个 一语双关, 也是 一个 九个 不同 的 故事 在 那个 网页 上。 Dev stock on flash .

0X对我 最近 可能 一年 多, 在 观察 snowflake 和 data bricks。 至少 在 messaging 上面 的 一些 你来我往 的 这些, 我 就 想起 了 二十多年 前 oracle 跟 当 时候 的 数据库 的 另外 的 sybase 和 informix 基本上 差不多。 你看 当 时候 大概 二十多年 前, 硅谷 的 1101 的 公路 两旁 不 都是 有 很大 的 广告牌, 就是 oracle 跟 informix 就 互相 的 有 一些 你来我往, 对 吧? 然后 最近 一年 多 我 看到 的 data bricks 和 snowflake 也 差不多。 然后 你是 怎么看 这么 一个 跟 你们 友商 的 这么 一个 盛会, 或者说 他们的 这些 举动 的? 包括 他们 跟 NVIDIA 也有 合作, 对 吧? 这 也 算是 他们的 一个 大 亮点 之一。 你们 买 了 music ml, 然后 snowflake 宣布 跟 NVIDIA 合作。 对, 能不能 跟 我们 bring up to speed what's going on?

对我 觉得 句 实在话, 其实 sophie 在 他们的 大会 上, 虽然 是 同 就是 比较 我 觉得 比较 搞笑, 就是 两个 大会 在 同一个 时间。 我 这里 先 澄清 一下, 这个 事情 不是 daily bris 干 的。 因为 我们在 莫斯卡 利 莫斯 里, 我相信 浩 毅 你 也 知道 要在 莫斯科 就是 三番 的 这个 大会 现场。 就 几年 前 就是 要 定 这个 时间 的这 时间 肯定 是 sophie 后 定 的。 因为 在 vega 其实 是 基本上 提早 半年 就可以 定 vegas 的 这个 时间。 但是 说句实话, 他们 在 大会 上 并没有 宣布 任 和 实质性 的 人工智能 或者 l large language model 的 发布。

他们 没有 宣布 用 13亿美元 买 一个 公司。

确实 不是我 指的 是 包括 产品, 就是 他们 没有 宣布 任何 一个 产品 跟 这方面 相关。 他们 有 2个CEO 互相 在 台上 拥抱 了 一下, 这是我 上次 跟 你说的, 对 吧? C E O 拥抱 并不是 一个 产品。

你 如果 看 sophie 这个 会议, 最 开始 的 时候 没有 Jason 的, 后来 我 觉得 就 我 个人 猜测 就 无法 证实。 他们 发现 dead brick 请来 了 sai andella 微软 的 C E O, 请来 了 eric s 是 google 的 前 C E O 请来 free man get out 的 前 C E O 之后, 他们 可能 觉得 这 需要 一点 实质性 的 high profile C E O, 所以 请来 Johnson。 其实 合作 当然 也很 好, 我 觉得 任何 能够 促进 业界 发展 都 是一个 好的 合作。 但是 没有 宣布 任何 实质性 的 东西, 就 fabric 宣 发布 了 很多 东西, 你 都 看到 了, 包括 这 基本上都 是 要么 已经 在 private preview 上面 的, 要么 已经 这个 public preview soft 没有 任何 一个 date。 我 个人感觉 可能 是 太过 注重 于 数据仓库 了, 所以 在 这方面 没有 很多 的 积累。 然后 突然间 发现 可能 这个 行业 发展 的 太快 了, 而且 太 重要 了。 所以 想 了 一些, 我 觉得 从 marketing 的 角度 上 弥补 一下 缺乏 实质 的 我 觉得 产品, 这是我 对 我们 友商 的 看法。

然后 我们 来 聊 一 聊 那个 算法 对 吧? 现在 最近 六个月 每天 都是 关于 large language model, 大 语言 模型 的 一个 些 说法。 然后 data breaks 是在 最 近几个月, 其实 也有 很多 动作。 自己 做了 开源 的 模型, 也 收购 了 开源 模型 的 公司。 能不能 先 讲一讲 就是你 对 这个 开源 模型 跟 闭源 模型 这件 事情 是 怎么看 的。

对我 觉得 开 模型 其实 很 重要。 因为 有一点 就是你 希望 最后 这 是一个 百花齐放, 而 不是 有 极个别 厂家 垄断 所有 模型 的 未来。 然后 开源 模型 有 很多 好处, 第一个 是 它 很 透明, 对 吧? 这 更 重要 的 不是 个 模型 本身 开源, 而是 这 整个 能够 创造 这个 模型 的 过程 开源。 这 其实 就 相当于 给 大家 带来 了 一个 我可以 自我 训练 模型 从头到尾 从 零 到, 或者说 基于 现有 模型 重新 fine tune 一个 过程。

这里 头 你可以 你可以 更好 的 确保, 我 可能 比如说 作为 某 方面 的 这个 公司, 我 特别 不 希望 某 一些 数据 参与 到 我的 这个 模型 训练 里头。 所以 我 希望能够 把 跟 这 一方面 相关 的 数据 去 除掉。 因为 没有人 知道 这些 大 模型 究竟 是 怎么 工作 的, 所以 你 并 无法 保证 究竟 有 什么东西 会 最终 某一天 突然间 被 别人 从 这个 大 模型 里头 发现。 所以 我 觉得 科研 模型 不管 是从 这个 生态 的 角度, 就是 百花齐放, 还是 从 这个 具体 企业应用 的 角度, 都是 非常重要 的。

但 我 有一个 问题, 尤其是 最近 OpenAI 也好, 或者说 它的 竞争对手, 就是 B U 模型 的 竞争对手, 都 是用 大量 的卡 在 训练, 对 吧? 然后 绝大多数 的 开源 模型, facebook 我们 还 不清楚 made 的 到底 怎么样, 我们 不清楚。 除此之外 绝大多数 的 开源 模型 其实 背后 没有 那么 多 的卡 训练, 至少 从头开始 训练 起来, 从 这个 角度 上 来讲 居于 劣势。 怎么 可能 去 跟 Frank 的 闭源 模型 去去 比 呢? 能不能 讲一讲 你的 对于 模型 的 能力 的 想法?

讨论 这个 话题 很 重要 的 一点 就是你 要 区分 开 不同 的 应用 场景。 因为 绝大多数, 甚至 我可以 说 可能 99% 的 企业 场景 里头, 他们 需要解决 的 问题, 它 不是 一个 GPT 的。 这个 什么东西 都 可以 聊 的。 Travel 包括 帮 从 帮你 写邮件 到 跟 你 聊 探讨 人生的意义, 对 吧? 绝大多数 企业, 他 有可能 比如说 他 能够 更好 的 做 一些 客户 的 支持。

从 某种意义上 说, 太过 大量 大型 的 模型, 有 很多 的 knowledge, 其实 对于 很多 具体 场景 其实 不好 的。 所以 我 觉得 你 刚刚 说 的 没错 的 一点 是你 如果 要 做 一个 全知全能 什么都可以 干 的 bot 的话。 现有 的 开源 模型 甚至 可能 在 接下来 的 一年 里头, 都 远远 无法 和 这个 GPT4和 cloud 去 比。 但是 对于 绝大多数 的 企业应用, 我 觉得 很多 小大 模型 其实 会 更好。

为什么 我 这么说 呢? 我 首先 在 date bricks 内部 我们 做了 几个 大 模型。 其中 一个 是 基于 我们 碰到 一个 常见 的 问题, 就是 客户 有 很多 的 表格, 然后 他们 并没有 很 好的 annotation 他们 所以 就 导致 了 这个 data discovery 这个 过程 不是 很好。 于是 我们 就 找 训练 了 一个 大 模型。 小大 模型 大概 在 low two digit billions 的 这个 parameter model。 他 专门 训练 在 基于 客户 现有 的 这个 worker, 包括 他们的 nobo, 他们的 engineering job 各种各样。 然后 自动 生成 对于 每一个 表格 的 描述, 还有 每每 一个 表格 里头 的 每个 column, 就 每 一列 的 描述 给 它 原 讯息。

这个 期间 我们 其实 测试 了 GPT, 然后 还 测试 了 我们 自己的 fine。 然后 我们 就 发现 因为 GPT 你 没有 办法 自己 find to be, 你 只能 给他 一些 prom engineering。 但是 我们 发现 之后, find tune 出来 的 这个 模型, 其实 效果 是要 比 GPT4是 要 好的。 因为 GPT 只是 一个 是一个 全知全能 非常 general 的 东西。 而 我们 可以 相当于 训练 的 一个 specialist, 专门 针对 这个 痘 妹, 这 是一个 例子。

然后 我们 其实 内部 还有 很多很多 不同 的 例子, 然后 一般来说 我们 总体 会 发现 GPT 最 容易 上手, 因为 它 毕竟 只是 一个 A P I。 你 直接 扣 就 好了, 不需要 做 任何 事情。 但是 当你 有一个 我 觉得 定义 好的, 需要 上 到 生产线 上 的 这个 模型 的 时候, 这个 时候 一般 你 会有 一个 比较 narrow 或 nish 的 一个 domain 的 application。 你知道 怎么 去。 它 然后 你 做成 一个 闭环 开始 训练, 然后 去 怎么 提高。 按照 生产线 上 新的 数据 来 提高 它 之后, 翻译成 后 的 结果 一般 会好 过 这个 就是 没有 专门 针对 这个 训练 过 的 模型。

而 我 觉得 这 其实 也有 道理, 对 吧? 就是说 你 需要 做 的 场景 越 专一, 你 就 越 容易 定 好 你的 evaluation metric。 其实 M L 本身 就是 一个 optimization problem。 所以 我 觉得 很多 企业 内部 的 场景, 你 在 未来 来说, 首先 肯定 会有 很多 的 GPT 或者 GPT 类似的 这种 A P I base model。 但是 也会 有 很多很多 大量 的 小大 模型 应用 在 具体 的 场景 里头。

所以说 那个 小大 模型 是对 至少 是对 B2B bus iness企业内 部的 软件, 你 觉得 其实 是 更 适合。

也 不一定 更 适合。 我 觉得 不同 场景, 但 我 觉得 会有 很多很多 的 场景, 这种 会 更 适合。 其实 大家 都 知道, 我 就算 今天 用 OpenAI 的 A P I 开始, 很 可能 明天 我会 转换 到 另外一个 公司 的 A P I。 比如 google 的 bar 的 APP 或者 其他 的 这个 anthropic A P I。 我 可能 后天 会 自己 fine tune 用 一个 模型, 所以 我希望 有 更好 的 model 的 abstraction。

我 当时 在 内部 开玩笑 就是说 我 接着 接下来 一年 可能 这个 世界上 大概 会有 100万个 model given。 就 很 简单, 其实 就是 把 这个 model 的 A P I 抽象 起来 的 实现, 会有 100万个 这样的 实现。 尤其 让 大家 每个 人都 做 一个 自己的 in house 的 实现。 我们 还 不如 直接 做 一个 开源 的 版本, 然后 直接 host 在 D A T A R O K 上, 这也是 我们 发布会 的 其中 一点。

对 我 觉得 基本上 我 不清楚 是不是 一年 两年。 但是 三年、 五年、 七年 之内, 绝大多数 的 公司 都 会有 自己的 以 基于 大 模型 的 软件。 这个 时候 需要 有一个 gateway, 我 觉得 是 非常 正常 的, 所以说 这也是 你们的 一部分。

对我 觉得 现在 的 这个 步伐 已经 很快 了。 我们在 大会 上 也 宣布 了, 在 过去 30天有 超过 1000家企业 在 D A T A brick 上 transformer。 而且 transformer 其实 进入 到 大家 的 就 真正 进入 到 大家 的 这个 眼里 头, 可能 也就是 六个月 的 时间。 从 GPT93.5 出来 之后。

这 里面 有 两个 问题, 一个 不能说 两个 问题, 就是 两个 点 你 commit 一下。 第一个 就是 如果 你是 去 问 OpenAI 的, CEO sam altman 他 会说 以后 主要 就是 大 模型 超大 模型 的 能力 提升。 然后 你 就 尽量 用 那个 超大 模型 的, 而 不是 自己 去 建 自己的 小 模型, 或者说 是 小大 模型, 这是 他的 一个 观点。 另外一个 就是说 我是 非常 同意 你 在 企业 里面 其实 那些 use case, 那些 应用 场景, 其实 用不了 那么 复杂 的 大 模型。 那 确实 是。 但 有 一个点 就是 它的 大 模型 的 编程 的 能力, 编程 一个 A P I 也好, 或者说 编程 c java 语言, 或者 python, 还是 编程 C Q L, 这个 编程 能力 我 觉得 还是 蛮 重要 的。 就是 因 应该说 是 模型 的 能力 越 强, 它的 编程 能力 越 强, 然后 越越 不容易 出错, 也能 越越 能 做 复杂 的 事情, 这 是我的 看法。

对, 第一点, 其实我 觉得 泰纳 的 模型 在 很多 上面 其实 是 有 有 弊端 的, 就是 两个 明显 的 弊端 我可以 讲 一下。 第一个 是 它 成本 很高, 尤其 你 在 做 P O C 的 时候, 我 觉得 一般 这些 没有所谓。 但是 等到 你 真正 的 有 大规模 应用 的 时候, 这 其实 会 是 变成 一个 很大 的 问题。 然后 我 觉得 就算 超大 模型 本身, 其实 他们 也会 做 各种各样 的 在 这方面 的 optimization。 就 比如说 其实 现在 基本上 已经 证实 了 吧? GPT4 其实 不是 一个 模型, 而是 其实 是 很多 个 小 一点 的 模型 的 组合。 另外一个 其实 速度, 就是 大 模型 速度 会 很慢, 这 慢 的 原因 其实 跟 成本 一样, 就是 因为 它 实在 有 太多 的 计算 需要 完成。 很多 这些 计算 其实 跟 你 真正 需要 的 应用 场景 并没有 关系。

这 我 同意 你, 因为 前 一段时间 有 那个 应该 的 架构 就 泄露 出来, 有些人 觉得 被 泄露 出来 至少 然后 其中 提到 M O E 对 吧? 然后 大家 觉得 这是 非常 有 负面 的 去 看。 我记得 好像 二级 市场 都 会对 这个 对 这个 large language model 都 会有 一些 很很 负面 的 影响, 觉得 是不是 走 到头 了 才 去 用 M O E? 我 觉得 并 不是我。

但 我 觉得 这个 make sense 对 吧? 因为 你我 如果 是一个 编程 的 board, 为什么 需要 去 聊 莎士比亚 呢? 所以 我 觉得 从 很多 企业 具体 应用 里头, 最简单 的 就是 我 甚至 都 不需要 M O E。 因为我 这个 本来 它 就是 一个 很 简单 专注 的 dish 的 case, 这是 一点。 所以 这会 带来 更 低 的 成本, 更高 的 性能。 然后 你 刚刚 的 第二个 是。

编程 能力。 对。

我 觉得 编程 能力 是一个 很 质 的 改变, 我 觉 就是现在 只是 看到 了 这个 开端, 接下来 会有 更大 的 改变, 会 让 大家 的 效率 大大的 提高。

你 同 不 同意? 就是 那些 超大 模型 front 的 吗? 它的 编程 能力 会 比 这些 开源 模型 好 很多, 会 在 今后 很长 的 一段时间。

我 觉得 应该 不会。 因为 其实 你我 想一想 他们 基本上 也就是 用 get up the code 这个 open source 穿 一圈。 我 觉得 与其 讨论 模型 的 大小, 在 这种 专业 应用 里头, 我 觉得 更 重要 的 其实 是 训练 的 数据。 就 比如说 这个 mos 的 它 有 个 data research team。 这个 research 的 规模 几乎 跟 他的 做 模型 的 训练 人的 规模 差不多 大。 因为 其实 这 很 就 模型 训练 里头 很 重要 的 一点 就是你 能不能 找到 合适 的 数据 来 训练。 并 不是说 越多 数据 越 好不好 的 数据 反而 会有 这 带来 这个 模型 效果 的 降低。

说起 因为 我们 刚才 不断 在 讨论 数据, 然后 现在 又 讨论 算法, 然后 又 回到 数据, 我是 非常 同意 你的。 但是 也 有些 数据 需要 自己 去 采集, 因为 据 我知道 那个 OpenAI 不 只是 是在 用 get up 的 数据, 而且 是 到 某些 国家? 找 了 一些 program 去做, 我也不知道 为什么, 哪些 东西 他 觉得 get up 上面 是 不够 的。

包括 做 microsoft 做 github copilot 的 以前 的 chief actor, 他 现在 出来 自己 创业 了。 前两天 碰到 我的朋友 Sarah 过来, 他说 giu b 的 那个 chef 的 现在 跑 出来 了, 跑 出来 再做 一个 started。 他 觉得 我要 做 这个 step, 不就 去 采集 这些 数据 吗? 后来 发现 采集 数据 的 难度 比 他 想象 的 远远 的。 他 本来 以为 跑到 什么样 的 公司 就 能够 采集 到 什么样 的 数据。 后来 发现 跑到 那个 公司, 人家 以前 要么 对 这个 数据 不 care 或者 不 重视, 或者说 怎么样, 实际上 都 不能用, 他 还是 要 从头开始 去 采集 这些 数据。 所以 从 这个 角度 上 来讲, 其实 这个 高质量 的 数据 其实 还是 比较 缺 的。 然后 如果说 一些 企业 如果 能够 真正 拿到 那些 高质量 的 数据, 也许 大 模型 小 模型 是 次要 的。

个 数据 的 提高 其实 在 跟 这个 模型 本身 的 规模 降低 上面 是 可以 互相 弥补 的。 有可能 你 有 更好 的 数据 之后, 更好 的 算法 其实 有可能 模型 可以 更便宜, 因为 你可以 用 更 小的 模型。

然后 再 讲 最后 一点? 做做 A I 永远 就是 算法 算 力 数据 这个 算 力 这个 角度 来讲, 几个 大 的 做大 模型 的 公司, 包括 OpenAI, 包括 google 或者说 还有 几家 公司, 它 可能 有 大量 的 算 力。 但是 现在 去 买 那个 G P U 卡 是 一 卡 难求。 你是 怎么看 算 力 发展 这件 事情 的?

对我 觉得 其实 这个 是 已经 发生 的 事情。 的确 现在 很难 有 足够 多 的 G P U。 NVIDIA 并 不是不想 生产 更多 的 G P U, 他们是 被 T S M C 限制住, 他 能 生产 多少 的 G P U, T S M C 也 不是不想 自己 生产 更多 的 G P U, 而是 从 物理 上 它 并没有 办法 很快 的 生产 更多 的 C P U。 所以 这一点 我 觉得 的确 是个 问题。

我 觉得 这 有 很多, 一方面 是 软件 上 的 发展 可以 更好 的 优化 这些, 就 相当于 可以 把 现有 的 算 力 让 他们 可以 放大, 有 更大 的 作用。 然后 另外 一方面 是 世界上 其实 也有 G P U, 但 它 有可能 不是 在 你想要的 环境 里头。 比如说 oracle cloud 里头 有 特别 多 的 G P U, 就 是从 传统 意义上说, 我们 说 了 很多年 叫 muli cloud 对 吧? Muli cloud 其实 每个 公司 都 觉得 挺 重要 的。 但 实际上, 他们 可能 并没有 真正 做到 完全 multi cloud 的 这个 deployment。 他 有可能 只是 说 我在 不同 cloud 上 做 不同 的 应用。

但是 我 觉得 因为 G P U 这个 其实 是 起码 在 接下来 几年 会 带来 multi cloud 的 一个 实质性 上 的 应用。 就有 可能 在 同一个 应用 场景 上, 某个 企业 会 把 一部分 数据 平台 serving 全部 放在 打个比方 A A A A A 上面。 但是 它的 training 的 worker, 会 放在 oracle cloud 上面, 或者说 放在 R 上面。 因为 在 R 和 oracle oud 它 可以 更容易 的 拿到 G P U。 所以 这个 我 觉得 会 变成 一个 起码 在 中短期 的 一个 发展趋势。

如果 五年 之后 具体 会 怎么样 呢? 我 觉得 五年 已经 太 长时间 了, 现在 科技 变化 太快 了, 预测 五年 已经 没有 意义 了。 但 我 觉得 在 接下来 几年 都 会有 这样的 问题。

对 算 力 永远是 制衡 A I 能力 发展 的 一个 大 的 因素。

对我 可以 说 一点 的 就是 mosaic 的 那个 就 我们 收购 了 这个 公司 的 C E O navin, 他 可能 我 觉得 有 百分之二三十 的 时间 都 花 在 了 你 勾选 G P U 上。 不管 跟 不同 的 cloud, 还是 跟 a media, 还是 跟 各种 友商, 因为 这 是一个 很 重要 的 一个 部分。

这是 蛮 有趣 的 一个 数据。 当然了 你们 也 刚刚 买 了 那个 music, 朋友圈 里面 有人 问 他说 你们 和。 那个 music 的 创始人 都是 属于 学者 出身, P H D 或者 怎么样, 是不是 这个 特质 是 促成 合并 的 因素?

我 觉得 不一定 是 P S D, 有没有 P S D 这个 并不是 很 重要。 但是 我 觉得 从 我们我们 到 目前 其实 收购 了 或多或少 可能 十几家 公司 了。 大多数 的 创始人 在 那个 公司 里头 都 没有 P S D。 但是 我们 收购 的 时候 很 重要 的 一点 就是, 一方面 是 创始 团队 的 技术 能力 跟 产品 能力, 另外 一方面 是 创始 团队 跟 我们的 这个 就是 公司 的 文化 之间 能不能够 合适 或 互补。

我 前两天 也是 在 开玩笑, 就说 至少 在 我们 to b 领域 这个 你来我往 或者说 并购 都是 惺惺相惜 的 一点, 都是 自己的 特质, 是不是 能够 符合? 或者说 是 有人 开玩笑 说 两个 都是 光头, 你们的 C E O 跟 那个 music email 的 navin 也是。

光 他们 两个 其实 在 性格 上 可能 也是 有点 相像。 对对对。

然后 不像 做 to c 的 公司, 像 你看 那个 meta facebook 的 C E O 跟 那个 twitter tesla 的 CEO1言不合 就要 去 决斗, 显然 做 to b 的 要 文明 很多, to b 公司。

毕竟 这个 形象 比较 重要。 对。

因为 最近 六个月 大家 都在 谈 A G I, 通用 人工智能。 能不能 从 你 从 data bricks 的 角度 怎么 去 理解 A G I 这件 事情?

说实话 我 觉得 其实 没有人 懂 他们 究竟 是 怎么 工作 的。 所以 我 觉得 并没有 人 能够 真正 的 很 准确 的 告诉你, 我们 是不是 离 A G I 越来越近 了, 还是 我们 离 其实 我们 还是 有 一 巨大 的 墙, 我们 并没有 办法 跨过。 从 起码 企业 和 data abuse 的 角度 来说, 究竟 A G I 是不是 能 达到 跟人 一样的 这个 结果? 从 各个方面 都 考虑 的话, 我 觉得 这 并不是 一个 很 重要 或者说 很很 有意义 的 问题。 我 觉得 更有意义 的 问题是 很 明显 的, 就是 我们 可以 看到 在 接下来, 或者 甚至 已经 发生 了 就是 在 很 有 很多 的 领域, 人工智能 已经 可以 达到 被 我 觉得 合理 应用 的 角度。 然后 它 甚至 可以 模拟 在 某些 特定 的 领域 模拟 人类。 这个 带来 的 其实 就是你 如果可以 想象, 你可以 有 大量 的 人力资源。 他 不是 机器人, 而是 他 有 真正 的 人力资源, 可以 帮你 想, 可以 帮你 写, 帮你 生成 东西。

当 这个 的 边际 就是 价格 marginal cost 降到 几乎 为 零 的 时候, 这个 社会 会有 什么样 的 改变? 然后 每个 企业 之间 会有 什么样 的 改变? 就是 过去 你 可能 你 要 有一个 knowledge worker, 它的 这个 成本 是 多少。 但 现在 在 起码 比较简单 边缘化 的这 一些 里头, 你 会 发现 他们的 成本 趋 近于0。 就 打个比方, 广告公司 可能 需要 有 很多 写 文案 写 copy 的 这个人, 对 吧? 那么 现在 你 突然 发现, 不管 GPT 还是 不同 的 其他 的 大 模型, 它 生成 的 效果 可能 没有我 最好的 这个 写 文案 的 专家 好。 但是 它 已经 基本 不错 了, 而且 它的 价格低 到了 人类 的 10分之1、 1%、 千1‱。

这个 对我 企业 会 带来 什么样 的 影响? 我们 有一个 客户, 他 之前 有 我 刚刚 提到 这个 文案, 他 之前 有 200个写手, 他 现在 只有 剩 十个 人 了。 因为他 把 其中 的 190个 人都 用 这个 I O M 来 取代。 而且 他 发现 现在 十个 人, 这 十个 学习 比较 好的 十个 人, 他们 主要 给 这个 L M 带来 训练 和 这个 validate L M 生成 的 东西。 然后 他 发现 他 现在 的 效率高 了 很多, 比 以前 而且 他 可以 做 很多 他 以前 甚至 无法 想象 到 的 无法 cover 的 东西, 因为 人力 成本 太高。

这 是一个 什么 类型 的 公司, 这 是一个 广告公司。 所以说 你 在 提 这个 例子 的 时候, 你是 想说 对 我们 人类 产生 的 impact, 就是 能够 看得见 摸得着 的 impact, 可能 比 讨论 或者 争论 A G I 的 定义 是什么 可能 更加 有意义 一点。 是 这个 意思 吗?

对, 因为我 觉得 这 已经 是一个 很大 的 改变, 不管 是从 正面 还是 负面 的 角度 说, 都 会有 很大 的 改变。 而 这个 A G I 是一个 目前 其实 没有人 真正 知道 什么时候 会 到来, 会不会 到来 的 一个 过程。

对, 这 里面 我 有一个 comment, 两个 问题。 一个 comment 就是你 提到 的 A G I 我是 非常 同意 的, 至少 A G I 这个 定义 是 比较 模糊 的对 吧? 你 去 问 OpenAI 的 Simon altima, 它 会 告诉你 一个 average man 的 一个 ability。 但是 上 个 礼拜五 当 伊朗 马斯克 把 他的 X A I 这家 公司 放在 公众 面前 的 时候, 他 就 有人 问 他 那个 对 A G I 的 想法。 他 对 A G I 的 想法 那 是要 在 某些 大 的 是 物理 还是 哪里 有 大 的 突破, 有 这样 能力 他 才 觉得 是 A G I, 否则 的话 他 不 觉得 是。 所以说 当然 你 如果 问我 的话, 我的 观点 一直 是 A G I 已经 到了。 当然了, 我们 每个 人的 A G I 的 定义 都 不一样, 所以说 不存在 是 谁对谁错。

这 是一个 comment, 两个 问题。 第一个 问题 就是 就 像你 提到 的 一个 广告公司 本来 200个人, 现在 只剩下 十个 人。 那 我 这边 想 问 一个 问题 就是 尤其是 我在 各种 微信 群 里面, 我 看到 很多人都 在 说, 这个 大 模型 出来 了 六个月, 但是 感觉 好像 没有 那么 多 的 具体 的 应用 的 落地 场景, 或者说 是 完全 改变世界 的 那个 新的 application 出来。 感觉 是不是 有 一些 泡沫, 或者说 怎么样, 你是 怎么看 这么 一个 sentiment 的?

我 觉得 其实 他 已经 彻底改变 了 很多 东西, 但 可能 大家 还没有。 我 觉得 第一个 信息 的 传播, 虽然 现在 比 以前 快了 很多, 但是 还是 一个 比较 缓慢 的 过程。 其实我 我们 公司 几个 founder 就是 每天 都在 用 这个 GPT, 所以 我 觉得 在 这个 方面 其实 已经 有 很大 改变 了。

然后 我 觉得 接下来 会有 很多 在 创造 和 创作 领域 上 的 改变。 这 一些 其实 需要 我 觉得 需要 软件 上 的 更新。 就 因为 这个 技术 可能 刚 出来, 对 吧? 可以 把 它 想象 成 他 只是 说 我 一个 model 出来。 具体 要把 这个 model 应用 到 我的 这个 产品 里头, 其实 是 需要 时间 的。 但 我 已经 可以 看到 很多 的 东西 会给 整个 业界 带来, 尤其 在 创作 方面 比较 大 的 改变。

包括 了 比如说 photoshop, 过去 有 很多 专门 作图 的 人, 对 吧? 这种 作图 的 人 他们 其实 photoshop 的 专家, 我 觉得 这些 人 不会 完全 消失。 但是 基本上 如果你 只是 学 了 几年, 我 猜测 一下 做 个 预测。 一年 之后, 一个 高中生 从来 没有用 过 photoshop。 他 打开 photoshop 之后, 或者说 类似 photoshop 的 工具, 他用 这个 简单 的 英语 或者 自然语言 生成 的 prompt 处理 出来 的 相片, 会 比 这种 绝大多数 专业人士 处理 出来 的 好。 然后 同样 的 包括 做 slides, 包括 了 建筑师 怎么样 设计 这个, 比如说 室内装修 的 这个 rendering, 我 觉得 这些 都 会有 非常 巨大 的 改变。 但 这些 改变 的 前提条件 是 这些 软件 本身 需要 能够 更新, 然后 能够 引入 这些 model。

Data bricks 在 买 music M L 之前 自己 就有 过 一个 开源 模型 叫 dolly 对 吧? 然后 你们 买的 music M L 自己 也有 一个 开源 的 模型 叫 M P T。 从 长期 来讲, 你是 希望 他们 用 你的 这个 开源 的, 还是 说 其实 你 觉得 都 无所谓。

反正 我们 并 无所谓。 我们 发布 多 了的 原因 并不是 为了 发布 一个 更新 的 model, 让 大家 来 用 这个 model。 因为 大家 用 我们 发布 的 开源 model 还是 用 别人 发布 的 开源 model, 对于 我们 来说 没有 任何 商业 上 的 影响。

但是 现在 你们 买 了 music M L, 他的 M P T 至少 还 不错 的。 有没有 一种 期待 就是说 M P T 成为 一个 开源 模型 的 一个 领军人物。

我 觉得 看 就是 不同 的 团队 的 理解, 从 我的 角度 来说, 其实 我们 并不需要 他 成为 最好的 model, 但是 我们会 一直 投入, 能够 提高 开源 的 生态 的 model 的 效率 跟 效果。 从 model t 本身, 他们 当然 是 希望 这个 model 可以 成为 最好的 model 了。 而且 目前 来看 的话, 他们 已经 是 了。 所以 如果。

成为 开源 大 模型 里面 的 领袖, 这 是一个 bonus, 而 不是 一个 你们 买 这家 公司 的 一个 基础。

对, 我们 买 这个 公司 的 原因 不是 因为 他们 有 M P T C B, 但是 我 觉得 是因为 MT3B 证明 了 他们。 第一 有 他们 有 能力 去 训练 特别 好的 model。 第二 他们 有 训练 这么好 model 的 infrastructure, 所以 他们 可以 设计 出来 这个 infrastructure 给 他们 自己 用, 然后 给 他们的 客户 用。

对, 然后 稍微 八卦 一下, 轻松 一点。 然后 我在 朋友 圈里 贴 了 那个 要 跟 你 对话。 然后 有一个 朋友 他说 你们 买的 这个 music M L 这个 创始 公司 之前 把 一家 之前 的 一家 公司 卖给 intel, 结果 搞砸 了, 然后 英特尔 的 钱 打水漂 了。 不得不 佩服 这个 创始人 很 会 卖 故事。 你们 也 看到 他 上一次 卖给 E N I A 以后, 至少 那一个 产品 并不是 在 intel 里面 很 成功。 有没有 对 你们 买 这家 公司 产生 一点 hesitation?

我们在 收购 过程中 当然 会 做 很多 diligence, 包括 了 之前 创始人 过去 其实 他在 intel 内部 是 直接 汇报 给 C E O。 然后 他 主管 的 这个 portfolio 包括 了 intel 所有 跟 A I 相关 的 东西, 其实 已经 在 billion doll revenue 之上 了。 他 以前 收购 公司 具体 的 那个 产品, 最后 并没有 成功 在 intel 内部, 但 他的 这个, 其实 在 intel 的 影响力 是 非常 之 大 的。

可能 大家 觉得 一个 几十个 人的 公司, 13亿美金 是一个 非常 高 的 价格。 但是 如果 你看 它 具体 的 这个 发展速度 的话, 你 就会 发现, 我 觉得 可能 是 历史上 增长速度 最快 的 一家 企业 软件公司。 所以 从 那个 角度 来看, 13亿美金 其实 并不是 一个。

很高 的 价格, 是吗? OK 所以说 并 不是说 卖给 了 data bricks 一个故事, 也 卖 了 我 营收 的 这么 一个 pipeline 在 里面。

对, 具体 数字 我 不好 公开, 但是 当我们 看到 他们的 内部 的 数字 的 时候。 我们 其实 是 非常 impress。 然后 我们 看到 它的 不管 是从 数字 的 角度 去 具体 的 revenue 的 增长, 它的 它 有 多大。 然后 包括 了 客户 对 产品 的 反馈, 就是你 也 知道 企业 软件 其实 是不是 那么 容易 用 的。 但是 客户 的 普遍 的 反馈 是 IT really works, 非常 难得 的 时间 在 企业 软件 上。

我们 今天 已经 聊 了 很多 了, 技术 各方面 聊 了 很多 了。 最后一个 问题 其实 是一个 大家 都在 讨论 的, A I 的 时代 到来 了, general AI 时代 到来 了, 我们的 工作 会不会 被 AI 取代? 然后 我们 应该 怎么 个 去 面对 这么 一个 新的 时代。

怎么说呢? 我 觉得 专业性 特别 强 的 人, 可能 会 受到 的 打击 越少, 而且 可能 他们 会 变得 越 重要。 而 专业性 越 低 的 人, 他们 可能 会 受到 最大 的 影响。 因为 有可能 他们的 产出 的 成果 反而 还 不如 一个 L M, 而且 它 会 远 比 L M 贵。

但是 什么东西 比较 难 取代 呢? 第一个 是 特别 有 全局观念 的, 比如说 架构师。 还有一个 比较 重要, 就是 怎么样 把 这个 好的 business requirement translate 到 技术 的 这个 requirement 上。 所以 刚刚 说到 的 这种 连接 business 和 技术 的 这个 过程, 我 觉得 这 一些 其实 可能 会 变得 反而 更 吃香。 因为 他们 以前 可能 是 一个人, 对, 比如说 十个 人。 那么 现在 有可能 十个 junior 的 人, 你 只需要 一个 或 两个。 然后 他们的 产出 在 有 L N 的 帮助 之下, 可以 到 当年 100个人的 这种 产出。

这个 慢慢 循序渐进 的 过程 不可能 会 是 overnight 的 事情, 但 会 造成 可能 大量 的 失业。 这 其实 不是 一个第一次 发生, 对 吧? 每一次 的 工业革命 都会 发生 带来 大量 的 实验, 每一次 的 技术革新 都会 带来 很多 人的 失业。 在 几年 前 我 看到 M I T tech review 有 一篇 文章 讲到, 有可能 科技 的 进 在在 过去 其实 都是 提高 人的 生产力, 然后 带来 更多 的 就业。 但 有可能 某 一段时间 开始, 科技 的 进展 带来 的 只会 是 更多 的 失业, 它 并 会 带来 更多 就业 的 机会。

我 谈 两个 点, 第一个 就是 对 大学 毕业生 或者 正在 读大学 的, 你 会对 他们 有些 什么样 的 建议?

我的 意见 一直 都是 一样的, 就是说 你 需要 有 学习 的 能力, 学习 的 能力 可能 比 其他 东西 更 重要。 包括 你 可不可以 很快 的 适用 一个 新的 这个 环境, 你 可不可以 很快 的 适应 新的 这个 工具, 包括 GPT 本身。 对对对。

另外一个 就是 更加 具体 一点, 因为 包括 你 跟 我 都 是在 一个 高科技 的 行业, 我们 所 接触 的 都是 做 前端 工程师、 后 端 工程师, 数据 工程师 或者说 是 产品 经理 这 整个 链 这条 链? 要 做 一个 产品, 我 刚才 罗列 的 都 需要 就是 在 这么 一个 进化 的 上面, 整个 这条 链路 从业者 会不会 越来越少。 第二个, 谁 是 最后 留下 的 那个 人我。

之前 看到 你 这个 问题 的 时候, 我 发到 了 我的 一个 群 里头, 然后 那 win 正好 还 回复 了。 我 其实 比较 认同 他的 看法。 他的 看法 是 其实 这些 人 不会 越来越少, 他 反而 会越来越 多。 这 好像 跟 我 刚刚 说 的 有点 矛盾, 就是 冲突 说 这个 可能 就是 会 少。 但 原因 是因为 随着 工具 越来越 易用, 其实 会有 越来越多 的 人 变成 这方面 的 人。

未来 data scientist 不一定 是 今天 的 data scientist。 今天 data scientist 如果 你不懂 pya 的话, 你 基本上都 不好意思 叫 自己是 data scientists, 对 吧? 那么 未来 data scientists, 你 可能 完全 不需要 懂 任何 编程, 但是 你 需要 有 对 数据 理解 的 能力, 你 需要 能够 把 这个 数据 跟 business 之间 做 translate 的 能力。 这个 东西 并不是 一个 我 觉得 GPT 可以 非常简单 的 给你 代替 的。

所以说 做 的 事情 会 非常 不一样。 但是 整个 链路 上 的 人 并不一定 是 越来越少。

而且 可能 甚至 这个 大 的 map 上 也 不会 有 特别 大 的 变化。 虽然 有可能 他 用到 的 工具 跟 技术 不一样。 比如 data engineer, 你 需要 把 这个 data 能够 从 一个地方 转换 到 另外 一个地方, 然后 把 它们 整合 起来。 我 觉得 这个 职业 并 不会 消失, 就是 可能 90% 的 扣 都是 由 L O M 版 生成 的, 而 不再 是你 自己 写 的对。

即使 没有 这个 A I 的 发展, 肯定 是 有些 工作 越来越 吃香, 有些 工作 越来越 不 吃香, 你 总归 要 adapt。 现在 我 觉得 A I 是 就 像你 刚才 说 的 速度, 对 吧? 就是 变革 的 速度 加快 了。 但是 并 不是说 本来 你 不需要 考虑 这些 问题, 今天 其实 我们 聊 了 各种各样 的, 不就 像 我们 说 的 A I 算法 算 力。 我 估计 在 今后 的 大概 几天 之内 会有 一个 新闻。 Meta 的 lama 据说 要 不就是 可以 商业 用, 如果可以 商用 的话, 其实 对 这个 业界, 对 尤其是 data bricks 这个 一个 eco system, 我相信 是一个 很 正面 的 一个 推动。 让 大家 能够 更快 的 能够 从 数据 到 inside 的, 我是 非常 期待 的。 所以说 谢谢你 今天 聊。

了 这么久 OK, 谢谢 陶 意 这 期。

what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G 艾特 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现。 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。

如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是在 公众 号 文章 中 扫 码 添加, 或者 是 公众 号 后台 回复 科技 早知道, 即可 获取 邀请码。 期待 你的 加入, 我们 下期 见。