It's something there.
然后 我们 今天 很高兴 请 到了 这个 空间 之外 的 产品 负责人 张涛。 然后 你的 网 名叫 high cloud。 对, high cloud 这个 名儿 比较 出名 一点, 可能 很多 人是 熟悉 这个 名字。 你来 简单 介绍 一下 自己。
O K O K, 我 之前 过去 十几年 的 从业 经历, 基本上 就 是从 C 端的 互联网 产品设计 转型 到 后面 做了 接近 五年 的 SaaS 行业。 所以 基本上 是一个 从 to c 到 to b 都 搞 过, to b 的 时候 就 没有 在 做 产品设计 了。 那个 时候 我在 神 测数据 那边, 我 主要是 负责 整个 公司 的 客户 成功 售前 和 偏 咨询 业务 这 一块, 就是 偏 业务 对对对, 偏 业务 导向 的这 样子 的 一个 角色。 对, 去年 因为我 觉得 AI 是我 从业 之后, 因为我 我 入行 的 时候 是 做 那个 塞班 手机 上 的 应用, OK 所以 是 mobile 比较 早 的 一代。 然后 我 觉得 基本上 是我 看到 的 从 mobile 之后 最大 的 一个 行业 变化 的 机会 在 A I 这 一波。 所以 去年 毅然决然 的 就 all in A I 了。 对, 到 现在 差不多 七个 月。
这 七个 月 感受 怎么样? 还是 那个 结论 吗? 仍然 觉得 是 塞班 之后 最大 的 机会, 我 仍然 觉得 是对, 所以 门 外部 很多人都 在 关注, 关键 之外 可能 最近 一段时间 稍微 少一点 了, 就是 关键 之外 最近 到底 在 做些什么?
最近 我们 发布 了 一个 面向 儿童 的 绘画 产品 叫 嘟嘟 波。 你的 小朋友 他 可以 上来 很 方便 的 涂鸦, 然后 我们会 把 你的 涂鸦 给 自动 优化 成 一张 相对来说 比较 精美 的 画面, 这 样子 的话 比较 能 激发 小孩子 的 创造力 和 他的 自信心? 他 随便 画点 什么 都能 变得 特别 好是 然后 在 这个 事情 上 我们 做了 一些 小的 一些 创新。 比如说 如果你 去 体验 市面上 已有 的 一些 那种 涂鸦 增强 产品, 大部分 都是 需要你 先 写 一个 prompt, 然后 再去 绘画。 但 你 也 知道 对于 我们的 目标 的 市场, 比如说 5岁到10岁 左右 小朋友, 你 让 他在 画 之前 就 先 去 写 一个 prompt, 这个 事 其实 非常 不 现实。 我们 那个 产品 如果你 去 使用 的 时候, 你 会 发现 你 就 直接 动 笔画 就行了, 你 不需要 先 去 想你 要 画 什么。 所以 目前 在 这种 面向 小孩子 的 绘画 这 张 产品 里面, 我 觉得 做 的 还是 不错 的。 对。
就是 你们是 不断 的 试 了 很多 产品 对 吧?
调研 了 很多 方向, 然后 也 试 了 一些 不同 的 一些 产品 方向, 最后 就是 决定 先 把 这个 产品 先 deliver 出来。 对 对我。
我记得 我 当时 认识 你的 时候, 是 看到 在 玄策 写 了 一个 招聘。
对对对, 咱俩 认识 应该 是 那个 时候。 对对对。
最近 写 的 特别 好啊, 我 就 觉得 靠 这个人 厉害, 然后 我 就 来 加 你。 所以 在 我的 印象 当中, 你 就 比较 擅长 思考, 然后 把 很多 东西 解构, 而且 是 比较 能够 融合 技术 跟 产品 之间 的 关系 的 一个。 对, 所以 我也 挺 好奇 说 你 这 半年来 你 在 A I 这 里面, 因为你 这 半年 算是 o in A I 了。 对, 吃 了 很多 东西。 我们 可以 聊 一 聊, 说有 对于 这个 技术 产品 有 思考。 而且 很多人 现在 在 谈论 说 这个 时代 的 产品 经理 到底 应该 长 什么 样子? 可以, 没问题。 你 先 从 你 这个 A I 的 理解 开始, 就是 实际 做了 半年, 你 觉得 跟 你 当时 想象 的 区别 都有 哪些?
我自己 有一个 非常 大 的 一个 感受 就是 在于, 我们 一开始 可能 觉得 是 只有 最 顶尖 的 公司 才能 做 模型, 才能 拥有 最 顶尖 的 模型 能力。 行业 里面 一直 有 一种 说法, 就 会说 闭源 模型 永远 会 领先 开源 模型, 但是 从 我们 自己的 实践 里面 我们会 看到, 其实 开源社区 的 整个 的 进展, 最近 半年 是 异常 的 夸张, 我不知道 大家 反正 有没有 关注, 因为我 自己是 天天看 paper, 天天 去 测 demo, 这个 过程 我是 非常 震惊 的。 就是你 基本上 每个 星期 都 像 过节 一样, 就像 过 春节 一样。 就是 整整 个 的 那种 学术界 和 产业界, 大家 贡献 出来 的 新的 内容, 贡献 到 开源社区 的。 而且 绝大部分 的 能力, 我 觉得 已经超过 了 我在 半年 之前 对于 我 能够 利用 的 能力 的 想象。 对, 当然 你 永 可以 说 这 不算什么, 闭源 的 某某某 公司 它 具备 更 强大 的 能力。 但 我 觉得 so what, 我 为什么 一定要 追求 最 强大 的 模型 能力 呢? 如果说 在 现有 的 开源社区, 多 模态 的 领域, 已经 有 足够 好用 的 能力 的 之后, 我 为什么 一定要 追求 最高级 的 模型 能力?
是我 感觉 你 讲 现在 反正 各种 开源 模型, 各种 算法 先进 的 东西, 其实 是 产品 经理 的 一个 弹药库 的 感觉。
对对对。
你可以 这么 理解。 对, 你可以 把 各种 东西 拿出来 来 用。 有的人 他 有 原子弹, 但 也 无所谓 对 吧? 对对对, 平时 反正 也 用不上, 只要 够用 就 好了。 对, 是 吧? 所以 现在 你的 代 库里 大概 都有 哪些 东西?
对你 比如说 我们 先 从 大家 可能 最熟悉 的 语言 模型 开始, 大 语言 模型 L O O M 来说 起。 这个 里面 现在 整个 从 开源 设计 角度 上 来看, 比较 主流 的 几个 方向, 一个 是 no 2对吧? 一个 是 M2。 这 两个 基本上 现在 你 会 发现 市场上 大部分 的 翻译 图文 版本 都是 基于 他们 两个 做 的。 你 在 它 上面 去做 fn 2也好, 去做 lora 也好, 其实 它 已经 在 满足 很多 的 一些 目标 任务 上 是 完全 够用 的。 如果 你的 使用 场景 相对 明确, 你的 整个 prompt engineering 你 也 做 的 相对来说 比较 好 的话。 其实 你 有 很多 的 任务 场景, 你 甚至 都 不用 用 最大 的 或者 秘书 版本。 比如说 像 我自己 经常 在 我的 本地, 我的 macbook 上面, 我 就 跑 个 7B的 laa 2, 我 有 很多 的 本地 任务 是 完全 可以 解决 的, 这 是一个 方面。
比如说 像 那种 视觉 语言 模型 方面 也有 非常 多好 用 的。 比如说 我 刚才 提到 的 那个 lava, 它是 基于 lava 的 一个 视觉 语言 模型, 你 用 它 去做 一些 那种 图片 描述。 我 觉得 这个 在 半年 之前, 我 觉 我们 做 P M 的 可能 都 很难 想象。 我们 随便 现在 给他 一张 图, 现在 的 视觉 语言 模型 能够 把 它 描述 的 detail 到。 有时候 我看 他 描述 的 那些 细节, 我说 我说 这个 图 上 还有 这个 细节, 然后 倒 过去 看, 发现 图 上 真的有 这个 细节, 他 已经 能 描述 的 非常 详细 了。
你说 在 那个 图像 方面, 去年 我 觉得 比较 重要 的 两个 工作 就在 step defection 那个 生态 里面。 一个 是 controller, 一个 是 年底 的 时候 lcm 那个 技术 latent consistently model, 它 核心 解决 的 是 效率 的 问题。 以前 就 你 哪怕 你 你 就 你 就算 你 有 个 4090 的卡, 你 跑 一张 图 的话 基本上 也都 是以 秒 计 的。 比如说 至少 跑 个 什么 十秒钟。 但是 你 用了 lcm 之后, 直接 就可以 把 这个 时间 压缩 到 毫秒 级别, 是 他出 图 的 时间 变得 异常 的 快了, 对 吧? 那 这个 东西 在 我们 去年 中旬 的 时候, 比如说 我们 就 想说, 我们 有 一些 场景 可能 是 跟 这个 图像 的 生成 有关系。
但是 你 不得不 面临 一个 很 尴尬 的 一个 事情, 就是 在于 你 大部分 需要 十几二十 秒 的 延迟, 这个 其实 对于 交互 上 有 比较 大 的 阻碍。 但 谁能 想到 半年 的 时间 就 已经 完全 可以 到 毫秒 级 出 图 了。 那 这个 时候 的话, 其实 你 在产品 里面 的 想象 空间 就 变大 了 很多。
是 就是 延迟 低 了 很多。
对对对, 很多人 觉得 他 好像 只是 一个 速度 上 的 提升, 但 我 觉得 不是我 觉得 当 你的 时间 从 十秒 这个 级别 变成 毫秒 级别 之后, 它 就是 量变 产生 了 质变。 有 典型 的 像 我们的 那种 绘图 的 场景。 假如 说 你的 每一次 的 生 图 延迟 都 是以 几十秒 计 的 时候, 你 很难 想象 你 会 去做 一个 绘图 增强 产品。 因为你 画 一笔 你 要 等 几 你 才能 看到 反馈。 也 包括 像 纹身 视频 是 吧 像 大家 知道 就是 过年 的 时候 最 火 的 就是 皮卡, 对 吧? 但 实际上 皮卡 它 所用 到 的 大部分 的 这个 模型 能力, 最新 的 开源 能力 就 都是 具备 的。 当然 你 可能 需要 有 一些 界面 上 的 包装, 模型 之间 的 一些 微调。 所以 你看 就是 最 顶尖 的 这种 商业 产品, 其实 你 在 开源社区 里面 依然 能 找到 对应 的 技术。 那 声音 就 跟 我们 说 了? 最 火 的 maps 它的 大部分 的 功能, 不管 是 语音 生成、 那种 情感 情绪、 语气 表达、 声音 克隆, 那那 现在 开源社区 全部 都有 这个 对应 的 方案。
对我 觉得 这 集 里面 声音 其实 现在 反而 可能 是 最 成熟 的, 但 大家 关注 很少。 我们 如果 比较 一 下来 说明 这个 问题, 就是 如果 你们 今天 再做 一个 妙言 会有 什么样 的 变化?
那 变化 太大 了, 你 比如说 当时 还要 大家 排队 几个 小时 生成 个 L O ora, 现在 的话 你 用 像 小红 书 的 那种 instant I D 或者 腾讯 新的 那个 photo maker。 我 肯定 不需要 输入 多张 图, 你 一张 图, 而且 实时 的 就可以 出 图。 首先 在 交上 就有 非常 大 的 不同, 而且 因为你 你 成本 下降 了, 对 吧? 所以 你 整个 的 这个 定价, 各个方面 我 觉得 区别 都会 比较 大。
对, 但 这个 就是我 下一个 问题是 既然 已经 有 这么 多 武器 了, 像 妙 鸭 这样 事儿 已经 能 更 低成本 的 更 高质量 的 完成 了。 那 为什么 过去 半年 里面 我们 仍然 也没有 看到 什么 类似 妙 牙 这样的 很快 的 火 起来 的 东西?
对对对, 这个 也是 非常 有意思。 我自己 的 一个 感觉 是 这个 样子。 首先 上 个 周末 的 时候。 我 做了 一个 A I 行业 的 一个 分享吧, 是 吧? 其实 你看 我们 那个 分享, 其实 分享 的 对象 已经 是 行业 里面 比较 顶尖 的 一帮 产品 人。 我们 大家 都 彼此 认识 了 78年到10年 的 时间。 但是 大家 会 觉得 我的 这个 分享 很 有 价值。
是啊, 但 说实话, 我的 这个 分享 其实 只是 A I 的 一些 很 基础 的 一些 理念。 我 通过 我的 实践, 通过 我 读 大量 的 paper, 我 对于 那个 图像 领域 的 一些 认知。 但 即使 是 那样的 东西, 对于 我们 行业 里面 现在 比较 顶尖 的 同学 来说, 大家 真的 会 觉得 是一个 很 崭新 的 认知。 对 那 这个 可以 推 一下 你的 工号。
对对对。
大家 如果 想 去 看 上周末 的 我的 分享 的话, 可以 去 关注 我的 那个 公众 号, 叫 浅 云 思绪。 潜水 的 潜 的 云朵 的 云, 思考 的 思绪, 就是 那个 思绪 那个 绪 遣 云 思绪。
对, 我记得你 大概 一共 讲 了 2个小时 左右。 对对对, 前面 一个多 小时 其实 都 是在 科普 技术 相关 的对 对。
在 科普 这个 A 的 整体 的 技术 原理 和 它的 整个 的 生态。 然后 后面 那个 就是 讲说 就 A I 产品 经理 到底 该 怎么 样子, 怎么 学 A I 应该 是 这么说。 对。
但是 就是我 延续 刚刚 的 话题, 我 觉得 有一个 非常 大 的 一个点 就在于 我 发现 绝大部分 的 我们 行内 的 同学, 我 觉得 大家 是 保持 了 一种 兴奋 震惊。 但是 真的 去 理解 整个 的 工业界 或者 学术界 的 进展 的 从业者 是 少数, 非常 少数。 就是说 这个 东西 非常 火火 了 一年 了, 但是 你看 多少 人 真的 入行 来 搞 AI 了, 这个 人是 很少 的。 其次 就是说 在 没有 入行 的 或者 已经 入行 搞 癌 的 人 里面, 有 多少 人 去 真的 理解 了 每 一个月 的 技术 进展。 新的 那些 模型 的 能力 边界 是什么, 它的 原理 是什么, 这个人 就 更 少了。 我 觉得 这 一波 他 可能 说 不是说 就是 为了 站在 用户需求 和 商业 的 视角 上, 我 就能 把 产品 做出来 的 情况。 他是 首先 你 要 去 理解 新 出来 的 模型 能力 边界 是什么。
我记得 有 一次 我们 跟 百川 的 王小川 我们 交流 的 时候, 老 任 总 提 过 一个 概念。 就是说 他说 我们 上 一代 的 产品 经理, 我们在 解决 的 问题是 P M F the product market fit 对 吧? 然后 当时 他说 其实 现在 就 还要 先 解决 一个 技术 跟 产品 的 fit, 我 觉得 蛮 白银 这个 理论。 所以 这也是 导致 你 刚刚 问 的 那个 问题, 为什么 过去 半年 间 没有 出现 那么 多? 是因为 很多人都 不知道 进展 是什么。
对, 这 里面 我想 延展 几个 问题。 第一个 问题 就是 是 他们是 没有 去 理解 底层 的 这些 技术, 还是 他们 没有 及时 的 读 paper 去 理解 最新 的 技术?
我 觉得 都有 是我。
这里 还有一个 问题, 就是 为什么 是在 现在 产品 经理 是 一定 需要 读 这些 东西? 因为 以前 其实 也 有些 技术 进展, 但 可能 这些 东西 就 交给 C T O 什么的 去 解决 就 好了。
对我 觉得 主要是 这个 样子。 首先 是 现在 的 产品 大部分 还 比较 薄, 我自己 说 就现在 产品 就是 model as product, 也就是说 这个 model 本身 的 输入 和 输出 基本 决定 了 你 整个 产品 的 交互。 是 我们 不 排除 未来 a native 的 产品 会 做 的 越做越 深, 可能 模型 在 里面 的 比例 会 越来越低。 比如 现在 可能 我说 的 这种 model as product, 它 可能 是 模型 的 90%, 你 自己 产品 的 system 是 10%, 但 未来 比重 可能 会 降到 65%, 十三 十。
那个 时候 的话, 也许 团队 里面 可能 会有 一个 偏 中台 的 角色, 就是说 大家 把 需求 提 给 他他 永远 都能 用 我 去 解决问题。 但是 至少 在 当下 来说, 就是 很多 的 模型 能力 本质 上 说 就 跟 变戏法 一样。 就是 他 那个 模型 能力 本身 对于 用户 来说 就 已经 很 新鲜 很 有 价值 的 时候。 如果 这个 时候 你 作为 产品, 你 不能 去 理解 这个 模型 的 能力 边界 的 时候, 你 就 很难 去 把 它 跟 用户 的 需求 连接起来。 我 因为我 见过 这样的 团队, 尤其是 在 那个 大厂 里面, 这种 团队 比较 常见。
就是 产品 跟 技术 甚至 跟 模型 分成 三家 了。 产品 是 一家, 模型 是 一家, 工程 又是 另外 一家。 然后 你 就 发现 他们 三个人 就像 在 隔 空 对话, 产品 也 不知道 模型 能 干什么, 只能 大概 提出 一个 需求 想象。 技术 的 同学 有时候 他 可能 也 不是 很 清楚 产品 这边 到底 想 满足 什么 用户需求, 因为 也没有 提炼 特别 好。
这个 是不是 反过来 讲, 也可以 解释说 为什么 现在 很多 很 好的 产品 是 小 团队 做出来 的。
你说的 非 就是 他的 整个 的 开发 的 产 研 之间 的 配合 范式 是要 非常 紧密 的。 对对对, 是。
但 同时 就 我 理解 从 一个 比例 来讲, 肯定 有 很多 人是 发 在 你 刚才 说到 的 这个 问题。 不管 是从 组织结构 上 也好, 还是 从 他 日常 的 学习习惯 也好。 对, 但 一定 是 还是 有 一小撮 人是 很 优秀 的对 吧? 但 最终 他 好像 也没有 deliver 出来 的 一个 特别 好的 结果。 然后 从实 操 上 来讲, 你 没有 看到 其他 的 一些 阻碍 是什么?
我 觉得 还有一个 阻碍 的 点 就是 在于 说, 毕竟 现在 的 互联网 已 不是 20年 前 的 互联网 了。 这样 一个人 不管 是在 效率 方面 的 需求, 还是 说 娱乐 方面 的 需求, 其实 都 更加 的 深度 了。 不是说 单一 刺激 就可以 的那 也就是说 你 要 去 竞争 的 并不 只是 另外一个 模型, 你 要 去 竞争 的 可能 是 抖 音 是 吧? 可能 是 office, 就是 有 非常 庞大 的 一个 体系。
我 觉得 说 现在 那种 model s product 它 本身 太浅 了。 它 可能 在 解决 用户 的 整个 的 需求 上面 解决 的 没有 那么 深。 但是 我们 现在已经 看到 一些 好的 一些 苗头。 对你 比如说 像 那个 都 还 算是 我 两个 老的 前 同事 做 的 产品。 一个 是 那个 answer 的 A I 他们 在 美国 那边 做 那种, 你知道 教育 类 方面 是 他是 有 非常 高 的 年薪 的那 包括 像 我 以前 在 神社 的 另外一个 老同事, 他们 现在 做 那个 A I P P T。 但 你 会 发现 那些 产品 的 联系 的 比较 好。 但 如果你 你 去 细究 它的 产品, 所以 你 会 发现 说 它 就 不是 单纯 的 model as product, 对 吧? 它 上面 有 很多 其他 的 设计 了。
对我 觉得 现在 情况 就 比较 极端。 一种 的 产品 是 说 90% 的 model, 10% 的 一些 产品 的 功能, 对 吧? 这种 大家 就 觉得 很薄, 那 它 更多 的 可能 很多 时候 是个 玩法, 然后 他们 可能 突然 火 一下, 然后 就 没有 什么 消息 了。 另外 你 刚才 举 的 那些 例子, 尤其 A P P T 我们 也很 熟是 吧? 他 我 觉得 他 典型 是 反过来 的, 他 90% 其实 是 互联网产品 的 那些 东西。 对他 可能 只有 10% 是用 的 A I, 对, 就是 都 比较 两极化。 但 大家 现在 期待 的 可能 是 比较 偏 中间 的 那种 对 吧? 就是 一半 的 模型 一般 的 产品, 然后 这样 又有 一些 神奇 的 能力, 又 不会 觉得 太薄。
但是 我 个人 的话 我 可能 不是 特别 喜欢 在 这种 事情 上去 下 定金。 因为我 觉得 从 历史上 来看, 就是 一个 开发 形态 或者 是 说 产品 的 工作方式, 它 其实 是 由 行业 演进 出来 的。 它 不是 有 规划 出来 的, 就 不是说 我们 说 最好 是 一半一半。 对对对, 他他 可能 就是 被 市场 教育, 被 用户 牵引 着, 最后 变成 一个 情况。 但是 很难说 我们 现在 说什么 都是 最好的。
对 但 这里 涉及到 的 问题 是什么 呢? 就是 首先 我想 先 问 你 一下, 你 对 未来 大 模型 的 产品 到底 是不是 端 到 端 分离 的? 短短的 分解式 就是 这 公司 需不需要 一定 有 自己的 模型, 然后 一定 自己 要 训 模型。
明白。 我 我在 我 最近 已经 有 一些 相对 成型 的 一些 个 想法 了。 我自己 会 觉得 说 我 并不认为 现在 所有 做 应用 的 团队, 他 一定要 从零开始 去 retrain 一个 模型。 但是 我 认为 未来 的 做 这块 的 团队, 一定要 具备 操纵 模型 的 能力。 什么 叫 操纵 模型? 就是说 你 能 根据 业务 的 需求, 去 用 不同 的 数据 去 重新 引导 这个 模型。 不管 是 通过 翻译 通用 的 模式, loa 这种 训练 模式, 还是 说 做 模型 的 裁剪 蒸馏 各个方面, 就 你 要 具备 这个 能力。 但是 你 不需要 具备 从零开始 去做 模型 的 能力。
对 是对。 然后 回到 刚才 那个 问题, 我在 想 就是 如果 模型 是 占 比高 的话, 对, 那 就是 是 模型 能力强 的 人 可能 就 会有 更好 的 一个 产品 的 表现。 所以 现在 那 几个 大 模型 拿了 这么 多 钱? 他 如果 真的 是 模型 重要 的话, 他 随便 招 几个人? 然后 做 个 什么 产品 矩阵, 很多 现在 也是 在 这么 在 做 的对 对 吧? 那 这种 就能 行。
然后 如果 是 另外 一种 情况, 模型 其实 是 占 比 小 的话, 那 就是 传统 的 大企业 加 A I 是 更 有效 的对 吧? 所以 现在 目前 我们 实际 看到 就 这些 情况, 对 吧? 一条线 是 传统 的 大公司 加 A I 另外 一条线 就是 大家 在 赌 模型, 然后 模型 里面 再去 做 一些 应用。 其实 这 两条线 现在 是 大家 看起来 是 比较 白 硬 的对 吧? 在在 中间 创业 公司 做 产品 到底 能 做成 什么 样子, 以及 说 他 最后 是不是 能 像 移动 互联网 一样, 所有的 东西 都 被 重 做 一遍。 这 可能 就是 当下 大家 不 那么 确定 的, 或者 还没有 看到 的 一个 事情。 对你 觉得 你 相信未来 这些 东西 能 重 做 一遍 吗?
我 真 觉得 这样的, 就是 你看 移动 互联网 那个 时候, 大家 一开始 非常容易 想到 的 就是我 去做 一个 移动 的 google, 我 去做 一个 移动 的 淘宝, 是不是? 是在 最后 你 会 发现。 真正 的 移动 的 google, 移动 的 淘宝 都是 他们 自己 做出来 的, 并没有 被 另外一个 替代。 但 真的 起来 的 东西 都是 像 抖 音? 像 小红 书, 这 都 是在 现在 P C 时代 没有 的 东西, 对不对? 所以说 我 觉得 A I 这个 东西 就是说 不一定 什么东西 都要 重新 做 一遍。 可能 它 有 很多 的 使用 场景 是 随着 A I 模型 本身 的 渗透率 增加 了 之后。 因为 渗透率 增加, 然后 大家 涌现 出来 的 新的 需求 是 完全 以前 都 没有 出现 过 的 需求。
是啊, 你们 在 试 的 过程 当中 有 发现 一次次 苗头 吗? 类似 我。
觉得 很难说, 如果你 要 让 我自己 去 bat 的话, 我 长线 来看 长线 我 指的 是 说 可能 两三年 这样的 时间, 我 还是会 很 看好 C A I 类似的 这种 情感 陪伴, 这种 角色 陪伴 这 样子 的 场景, 我 还是 非常 看好 这个 场。 原因 是什么? 原因 是因为 我自己 在 做 一些 相关 的 实验 的 时候, 我 意识 到了 一件 事情。 就是我 以前 从 理论上 我知道, 但是 这个 400万面前 还是 非常 震惊 我的 事情, 就是 人类 的 情感 太 容易 被 hack 了, 你知道吗? 就 太 容易 被 hack 了。 以前 我们 看 一些 这种 经典 的 心理学 的 一些 实验 什么东西 的 时候, 你看 的 时候 你 觉得 不可思议, 觉得 人 怎么 那么 容易 就 被 控制 了, 是不是 会 那么 容易 就 被 一些 东西 调动 情绪。 是 我们 当时 做了 一些 简单 的 事情。 比如 PPT4V1 那个 模型, 就 它的 视觉 语言 模型 刚 出来 的 时候, 他 不是 就可以 去 识别 图像 了, 对不对?
当时 我 做了 一个 很 简单 的 一个 demo, 他 就是说 会 读 离 手机 上 最近 的 几张 照片。 因为他 可以 理解 照片 里面 的 内容, 他 就 把 它 那个 理解 的 照片 内容 输出 出来, 作为 一个 图片 描述。 把 那个 文字 就 输给 我 另外 的 一些 GPT 做 的 那种 agent agent agent 就是 一些 各种 人设。 一开始 的 时候 我 设定 的 人设 都是 我的朋友 或者说 我的 粉丝。 然后 他们 就 看到 这个 图片 之后, 就会 像 就像 朋友 在 朋友圈 里面 评价 我的, 给 我的 图片 留言, 你知道 吧?
然后 后来 我 觉得 光是 夸 我也 没意思。 我 又 写 了 两个 那种 黑 我的 故意 来 讽刺 嘲讽 你。 然后 又 写 了 两个 会 根据 这个 黑子 黑 的 内容 来 帮 我 辩驳 的 那种 人。 你 想 整个 这个 过程, 这个 想法 是我的 想法。 所有的 那些 agent 的 人设 是我 写 的, 是 整个 这个 pipeline 是我 搭 的, 是 我是一个 全知全能 的 上帝视角。 理论上 来说 我 对于 他 输出 的 内容 应该 是 心里 有 预期 的, 是对 吧? 我 不应该 被 他 打动。
但是 我 跟你讲, 在 我 第一次 运行 那个 我 flow 的 时候, 我 看到 那些人 在 我的 内容 下面 讨论 黑 我, 有人 维护 的 时候, 我的 内心 是是是 被 是 被 真的 就是 被被 扯动 了, 你知道吗? 我 当时 那 一下 我 就 突然 觉得 我 觉得 人类 情感 太 容易 被 hack 了。 我 作为 一个 全知全能 的 上帝视角, 我 都 无法 避免 会 被 这样的 文字 所 影响 我的 情绪。
你可以 想象, 如果 是一个 普通 的 用户 他 没法 知道 这 背后 的 原理 是不是? 他 可能 觉得 这 是真的, 甚至 他 知道 这 不是 真的。 但是 人 非常容易 对 一个 东西 产生 情感 的 依赖。 所以说 我 觉得 从 一些 很 fundamental 很 基础 的 这些 东西 里面, 我 非常 相信未来 的 基于 A I 的 这种 对 人的 陪伴, 它 一定 是一个 非常 大 的 机会。 因为 它 能 解决 的 是 人的 这个 情感 方面 的 问题, 这 是一个 非常 底层 的 一个 共通 的 需求。
对, 我也 在 想像 你 刚才 举 那个 例子, 你 做 的 那个 其实 你 还 涉及到 一些 workflow 的 东西, 对 吧? 对他 还得 把 图片 识别 该 怎么 对话 之类 的那 现在 我们 能 看到 产品 很多, 其实 还 不如 这个。
对对对。
就是 像 那个 你 可能 你 几天 就 把 它 搞 出来 了, 那个 就是 一天 的 时间 就 搞。 但 我 就在 想, 你看 现在 市面上 所 类似 C I 的 东西, 它 其实 就 很 简单, 就是 直 对话。 对, 偶尔 最后 它 里面 可能 加 一个 图片 生成 的 东西, 对, 但 那个 复杂度 其实 很低。 那你 理解 我的 在 讲 什么? 就是 它 其实 是 哪怕 你 现在 的 技术 和 能力 也能 帮你 加 很多 东西。
进去 的对 对对对, 其实 是 有 一些 这种 产品 的, 这 可能 就是 体量 比较 大 的 产品 可能 没 这么 去做。 他 可能 是 出于 我 猜想, 比如说 成本, 或者 各个方面 的 考虑。 但是 你说的 那种 加 复杂 请求, 比如 我见 过 那种 加 数字 系统 的, 是 加 视频 的, 加 语音 多 模态 的 我 也都 见过。
是 对, 可能 很大 的 一个 原因 就是 成本 问题。 对, 也没有 特别 跑 起来。 是是是 对, 所以 你们 在 做 的 过程 当中, 这 几个 月 里面 你 核心 你 遇到 的 几个 问题, 我 踩 过 的 几个 坑 是 啥?
一个 就是说 刚刚 提到 的, 其实 成本 还是 一个 蛮 大 的 问题。 我们 以前 做 互联网 创业 的 时候, 就 做到 最近 几年 工程 上面 的 开销 几乎 在 整个 成本 当中 可以 忽略不计 了, 对不对? 但是 A I 产品 不一样。
这 是不是 最大 的 一个 区别? 因为 我们 也 有些 团队, 我 觉得 大家 总 在 好奇 说 为什么 看不到 产品? 我 觉得 可能 这个 就是 一个 原因, 就是 他们 也 做出来 demo 了, 他们 不敢 放放 出来。
可能 马上 就 烧光 了。 对对对, 所以说 我 做 A I 产品 就 day one 就得 做 收费。
今天 的 成本 跟 半年前 或者 年前 比, 大概 整体 下降 多少?
下降 还是 非常 多。 一方面 是 本身 各家 模型 它 出现了 各种 新的 加速 推理 的 方法, 重新 flow 上 有 加速, 从 模型 本身 也有 加速, 从 工程 上 也有 新的 那种 降低成本 的 方式 出现。 所以 这三项 叠加 其实 是 加 量 了 很多, 再加上 市面上 卡 的 供应, 云 的 hosting 也 多 起来, 所以 还是 有 下降 的。 而且 它 现在 是个 什么样? 我 觉得 如果 是 图像 领域 的话, 相比 半年前 降 十倍 是 有的。
但 仍然 不够 我 觉得。
仍然 不够。 因为 虽然 说 你 那个 成本 在 降, 但是 需求 是在 增加 的。 比如说 可能 半年前 聊 十句 出 一张 图 你 就 满足 了。 但 我 现在 希望 做 的 体验 是 说, 你 一边 聊天, 你 旁边 有 个 动态 的 图像 一直 在 动 那种, 那 你的 生存 要求 也 变 高了。
是啊 对, 所以 可能 就 还是 基础设施 还 不够 完善。 我 觉得 你 刚才 很 有 道理, 就是 大家 在 比 的 其实 不 只是 A I 的 进展。 大家 在 比 的 是 拿 抖 音 什么, 拿 上 一代 移动 互联网 的 一些 东西 来 比对。 对, 包括 艾伯特 之前 他 提 过 一个点, 对 吧? 就 他 觉得 他 做了 半天 那个游戏 我也 在 做。 最后 他 觉得 就说 大家 为什么 不去 玩 王者 荣耀?
对对对, 可能 我 下午 刚 跟 2波聊 完 O K 对我 刚 跟 他 聊 完 过来。
对对对, 是 这 确实 是 会有 这个 问题, 因为 用户 不会 管你 那些 东西 的, 他 不会 说 我 支持 A I 怎么样 的。
对你 简单 说 就是说 比如说 抖 音 如果 是 100分, 那 我们 现在 10个AI 产品 在 竞争 是 最低 分 30分, 最高分 50分, 竞争 过了 所有人, 但 你 也 竞争 不过 抖 音。
对, 但 这 里面 你的 三五 十分, 你们 有没有 哪个 点 是 虽然 整体 的 体验 可能 是 30分, 但是 我就是 为了 这个 点 可能 某 一个 维度 上 他 达到 了 100分, 我 就 为了 他 而来。 有没有可能 是 这么 一个 东西, 比如说 它 就是 一个 A I 对话 的 一个 这种 体验, 一个 a moment 这样的 东西。
对 这个 对于 某些 人群 来说 是 成立 的。 对你 比如 像 我一直在 去 check 那个 C A I 的 付费 率, 是 那你 会 发现 它 有一个 非常 稳定 的 一个 人群。 我 目前 check 了 半年 的 数据, 他们 那个 人群 的 续 费率 有 94%, 很 恐怖 的。 因为他 是月 按月 订阅。 你知道 对, 那 半年 下来 他 整个 人群 94%, 他的 就是 非常 稳定 的。 但是 核心 的 问题 就在于 那个 人群 的 规模 可能 有限, 它 很难 破 圈儿。 所以说 你 要说 找 一个 更 通用 的 点, 那 我 不得不 说 行业 现在 还没有 找到。 但是 对于 某些 具体 的 人群 来说, 我 觉得 AI 产品 已经。
有了 不可替代 的 价值。 所以 我们 讲完, 所以 刚才 提 的 成本 是一个 主要 的 问题。
其他 的 还有 问 其他 的 我 觉得 就是 实际 的 模型 能力 进展, 我 觉得 在 给 半年 的 时间 应该 差不多 了。 就是 我们 提到 的 那个 像 语言 模型, 我自己 觉得 如果 是 基于 现在 的 这些 需求 来看, 语言 模型 现在 就 已经 完全 O K 了。 只不过 就是 在 用 语言 模型 的 方式 方法 上, 大家 可能 需要 开阔 一下 思路。 比如说 不一定 是 单 语言 模型, 可能 是 不同 的 任务 可以 拆 到 一些 不同 等级 的 模型 上面。 有 一些 你 要 用 一些 更 高级 的, 有些 你 可能 用 一些 非常 小的 一些 模型 就可以 解决。 而且 有时候 同一个 query 过来, 可能 是 多 模型 的 一个 配合 参与。
语言 模型 我 觉得 基本上 不是 障碍 了, 视觉 语言 模型 也 不是 障碍, 可能 更多 还在 动态 那边 那 一块。 而 那些 东西 因为 它是 最 刺激 人的 感官 的, 对 吧? 那些 东西 可能 还需要 3到6个月 的 时间 成熟, 然后 到时候 的话 可能 也能 再 涌现出 一些 产品 出来。
所以 按 你的 这个 预期 的话, 今年 我们是 能 看到 一些 产品。
我 觉得 就 应该 能 跑 这些 产品 的。
你 现在 因为你 跟 很多 同行 也 交流, 对你 觉得 你是 偏 乐观 的 还是。
我是 短期 偏 谨慎, 中长期 乐观 的 人。 对对对。
那你 谨慎 的 这个 已经 挺 乐观 的 了。 那那 我们 今年 可以 好好 预期 一下 这个 结果。
我自己 还是 比较 有 信心。 我 觉得 今年 不管 是 to b 还是 to c 领域 里面, 应该 会有 一些 现象级 的 产品 应该 会 出来 了。 对。
那 挺好的。 所以 你 现在 在 做 的 这个 东西 大概 做了 多久? 从 开始 到 上线 也就。
两三个 星期。 O K 对, 很快。
所以 其实 是 挺好。 就是 像 我们 刚才 讲, 如果你 特别 理解 模型 技术 的 边界 的话, 你 要 做 个 产品 其实 是 挺快 的, 很快。 这 里面 你 类似 于 这样的 产品, 它 给 用户 的 那个 点 到底是什么 点?
这个 我 觉得 是一个 比较 有意思 的 可以 聊 一下 的 点。 就是 我们 早期 的 时候, 因为 做 涂鸦 增强 我们 肯定 就 觉得 说 涂鸦 本身 是啊 我问 的对 吧? 但是 我们 当时 其实 这是 工程师 的 idea, 他 想 了 一个 点子, 他说 除了 画画, 然后 那边 出 一个 图 之外, 他 是不是 也 应该 支持 把 它 生成 的 那个 图 直接 拖 过来, 然后 我 基于 那个 生成 图 继续 进行 创作。 OK, 当时 他是 想 的 是 基于 生成 图 做 二次 创作, 他是 这 样子 的 一个 思路, 他 自己 就 把 这 功能 给 做了。 但 这个 功能 实际 做了 之后, 我们 发现 了 一些 新的 嗨 点。 我们 发现 就是你 把 生成 的 图 一拖 过来, 它 基于 生成 的 图 又 生成 一张 新的。 然后 你 把 那个 生成 的 图 又 拖 过来, 又 生成 了 新的。 就说 全程 我没有 画, 我只是 在 不断 的。
把 它的 生成 图 自 迭代 了。
然后 你 会 发现 那个 画 越 变 越 美越 变 越美。 比如 比如说 细节 越 变 越多, 然后 那个 纹理 越 变 越好, 那个 过程 特别 嗨, 以至于 有时候 你 玩 十几下, 你知道 吧? 然后 那个 时候 我 突然 就 意识到 一个 事情, 就是 在于 说 我们 怎么 去 理解 prompt 这件 事情。 我们 可能 以前 大家 觉得 对于 那种 大 模型 应用, 想 的 都是 说 人 给他 一个 prompt。 这个 朋友 可以 是 文字 也可以 是 图像 的 输入, 对 吧? 但是 这个 输入 是不是 一定要 来自于 用户 自己? 我 觉得 是 不一定 的对 像 我自己 去年 7 8月份 的 时候, 看到 身边 很多 产品 之后, 我自己 当时 有 个 判断。
我说 我 很难 想象 两三年 之后 有 一款 大规模 流行 的 A I 的 C 端 产品。 它的 主流 的 使用 场景 是 用户 拿着 手机, 然后 一直 在那 打字。 对对对, 你 很难 想, 因为 打字 是一个 非常 消耗 人的 精力 的 一个 事情, 对, 成本 太高了。 所以 我 当时 就在 想说, 我说 我 一定要 做 那种 低 prompt 或者 是 0 prompt 的 那种 类型 的 产品。
其实 你看 一下 我 刚刚 给你 描述 那个 场景 里面, 就是你 把 一个 图 拖 过去 生成 下一个 图。 这个 其实 就是 一个 几乎 是 零 prompt 的 过程。 但是 它 给你 带来 的 那个 娱乐 体验 其实 是 非常 有意思。
对我 觉得 你 刚才 讲 的 场景 是 特别 产品 经理 的 一个点。 因为你 其实 理论上 你可以 从技术上 做到, 他 不用 拖, 他 自己 就 不断 的 去 上手。
对, 这个 技术 上 真的 太 简单 了, 自动 迭代 十轮。 对, 但是 你 去 看 那个 过程, 我 好像 太 有意思 了。 因为 我们 那个 产品 是 这样的, 就是 它 每一个 step 我们是 把 它 保存 下来 的, 它是 个 stack。 你可以 不断 的 撤销 门禁。 然后 你我 刚才 跟你讲, 就是 比如说 你 一直 拖 生成 了 十几次 之后, 你 就 去 点 那个 撤销, 一直 看上 一步 上 一步 再再 前进, 看一下 那个 过程。 我们 自己 都能 玩 的 很 嗨, 你知道吗?
对, 那 这个 感觉 你们 可以。 因为 如果 团队 里面 已经 玩 的 很 嗨 了。
可能 对对对, 我们 当时 觉得 我们 说 这个 点 太 嗨 了。
我是 对, 后面 有可能 就是 大家 会 发现 各种各样 的 这种 类型 的 东西, 然后 它 就 变成 一个 一些 产品 的 范式。
这个 里面 有 两个, 一个 就是说 在 交互 这个 事情 上, 其实 有时候 有 一些 那种 人机 互动 的 那种 交互 机会 是 藏 在 那个 代码 里面 的。 我 觉得 就是 像 徐凯, 刚刚 你 总结 一个点 都 特别 好, 也就 说 在 工程 上 其实 非常 好。 实现 自动 迭代 十轮 就行了, 对不对?
但是 我们 发现 当 人 参与 进来 过程中, 并且 你 看到 那个 过程, 那个 过程 本身 具备 消费 价值, 而 不是 最终 那 张 图, 那个 过程 有 消费 价值。 但 这个 东西 其实 就 需要 工程 跟 产品 有 非常 紧密 的 结合。 你 理解 整个 的 运作 原理, 运作 过程, 你 才知道 哪一个 部分 其实 是 中间 过程 是 可以 抽离 出来 的。 是 人是 可以 有 个 适当 的 方式 可以 参与 进去 的。 我 觉得 这是 首先 是 一个点。
还有 另外 一个点 就是 在于 说 AIGC 你 只 去 看 它 那个 G 的 一部分, 就 generate 那 一部分 生成 的 一个 部分。 你 现在 大部分 的 产品 所有的 魅力 都 来自于 深层 这个 动作 本身。 你 像 我 刚才 描述 的 那个 场景, 就是我 说 我 拖 拖拖, 然后 我看 整个 那个 过程 怎么 从 一个 草稿 变成 一个 非常 精美 的 画的 过程, 我 觉得 有意思。 我身边的 同事 们 都 觉得 有意思, 对于 我 来说 是 深沉, 但 对于 我身边的 同事 来说, 他 欣赏 的 其实 是 那个 内容 本身, 对不对? 是 所以 当时 我 就 很 敏感 的 意识到, 其实 AIGC 除了 G 部分 有 价值, 它 generate 出来 的 这个 content 内容 本身 其实 也是 具备 消费 价值 的。
只不过 就是说 我们 怎么 样子 用 一个 合适 的 形式 让 用户 能够 去 消费 这个 东西。 不管 是 消费 它 最终 的 产物, 还是 消费 这个 过程。 所以说 当时 有 一些 灵感 就在于 说, 可能 AIGC 的 那种 消费 场景 不一定 非要 围绕 着 每个 人都 要 来 记, 有可能 是 少部分 人的 G 而 绝大部分 人是 在 消费 它的 C 不是 都要 来 生成 的。 对对对, 就 大部分 人 应该 是 来 消费 的。 对我 觉得 这个 是 当时 对我 启发 比较 大 的 一个点。
对你 刚才 讲 两个 合 起来, 一个 是 说 大多数人 可能 是 来 消费, 另外一个 就是 他 消费 的 不一定 是 结果, 消费 可能 是 就是 过程 本身。 经常 跟 你 提 一个 例子, 就是我 在 抖 音 里 会 刷 到 说 就有 一句话 prompt, 然后 生成 一张 图, 然后 再 接 一句 prompt.
就是 那个 很很 火 的 那个 范式。
对对对, 比如 一个 火车站 里面 充满 了 人 harder。 对对对, 什么? 对, 这个 东西 其实 大家 消费 的 是 这个 过程, 或者说 这个 东西 本身 跟 如果你 把 那些 prom 提出来 去, 把 那些 图 留在 那儿, 其实 没有 什么 意思。 对对对, 大家 消费 的 就是说 这个 过程, 你是 怎么样 去做 这些 事儿 的。 是的, 这 里面 的 巧思 是什么? 吧? 就是 这个 意思。 对, 比如说 沿着 你 刚才 讲 的, 我 临时 想到 的, 比如 我 把 一张 图 分成 九块, 然后 你说 你 写 一个 prom, 然后 出 一张 图, 然后 你 把 这 张 图 摆在 其中 的 9块1个 位置 上, 最后 你 写 9句话 拼成 一张 图。 类似 这样的, 它 有点像 解谜 拼图 的 一个 过程, 反而 是 好玩的。
对对对, 就是 它 里面 这个 生成 过程 我 觉得 还是 有 很多 值得 挖掘 的 点。
是是是 这个 挺 有的。 还有什么 类似的 例子 吗? 有没有 什么 大概 总结 点? 就是 一般 实 操 当中 遇到 的 问题。
是我 觉得 首先 就是 A I 产品 现在 它 本身 相对来说 其实 没有 破 圈, 它 还是 一个 即使 是在 普通用户 里面, 也是 一个 先锋 用户 才会 去 用 的 东西。 所以说 你 需要 非常重视 运营 和 渠道。 我 为什么 会 专门 说 这个 点? 其实 主要 是因为 我 觉得 去年 行业 里面 有 个 特征, 你 会 发现 有 很多 的 A I 创业 团 对 研究员 创业, 就 可能 那个 C E O 是一个 做 研究 的, 融 了 笔 钱。 很多 时候 就是 对于 产品 的 认知 可能 还 停留 在 说, 我就是 把 我的 这个 模型 能力 包装 成 一个 界面 当中 用 就行了。 但是 他 可能 不 习惯 的 是 说, 任何 产品 其实 都 还是 需要 推广 和 运营 的。
所以 他 一上 来说, 反而 从 运营 推广 上, 从 商业化 设计 上 来讲 是 难 的, 是 要求 是 更高。
的对 对 对对对, 就 并不 因为 你是 A I 产品, 你 就 天生 高人, 好像 别人 就要 追 着 你来 用。
从 这个 角度 来讲, 说 新的 时代 的 A I 至少 现在 的 这个 组织结构 是不是 应该 是 有 很多 商业化 的 运营 的 人。 底下 的 产品 就 分成 小组, 然后 类似 于 那种 海克斯 的 感觉, 几个 一组, 然后 就 不断 的 出 产品, 这种 形式 会 是一个 比较 好。
我 之前 没有 特别 去 想 过, 但是 你 刚才 这么说 了 之后, 我 觉得 好像 就是 这种 组织形式 应该 去 试一试。 对对对, 结合 我们 前面 聊 的 来说, 如果说 单个 产品 的 生产成本 这么 低 的话, 是我 很快 能 搭 一个 出来。 然后 如果我 有一个 很 好的 市场 渠道 运营 团队, 能够 快速 的 把 它 deliver 出去。 那 这 样子 整个 试错 的 过程 就是 账号 比较 好是 吧? 是 倒 确实 是啊。
对, 但 这 里面 其实我 之前 跟 ever 聊过 这个 问题。 他 就 提说 他 觉得 核心 问题是 没有 这么 多好 的 A I 产品 经理 可以 支持, 说 你 搞好 几个 小组, 有可能 一个 都 不错 的。
在 这个 是我 不得不 说 整个 还算 行业 已经 火热 了 一年 了。 但是 真的 就是 躬身 入局 的 人, 或者 是 说 愿意 拿 自己 业余时间 去 学习 的 人。 还是 很 少数, 也 包括 我们在 招聘 上 也会 遇到 这样的 问题。
你们 现在 招 大概 喜欢 招 什么样 的 人? 就 包括 很多 其他 公司 也 遇到 这个 问题, 对 吧? 到底 A I 产品 经理 该 怎么 招?
我 现在 也 没法 说 我喜欢 招 什么, 因为 样本 太少 了, 所以 就 聊到 一个 聊到 合适 的, 我 觉得 就 还 OK。 对对对, 肯定 我 觉得 现阶段 首先 你 要 对 这个 事情 有 热情, 就是 首先 跟你聊 到 一些 常见 的 A I 产品, 你 要 用过, 你 有 一些 他 怎么 去 改变 你的 这个 工作 学习 生活 的 一些 点, 你 自己的 一些 感知?
这 一部分 其实 跟上 一代 产品 经理 是 有点像 的对。
但是 这点 要求 电视 过程中 我们 发 都 很难 达到。 真的。
对你 之前 面试 很 问 说 你 觉得 你 微信 哪几个 点 做 的 不好, 现在 可能 你 大家 也可以 问 说 你 觉得 ChatGPT 哪几个 点 产品 上 做 的 不好。
对 对你 你 体验 产品, 然后 你 如果你 真的 是 深度 的 用 这个 产品, 你 一定 会有 很多 的 小技巧, 对不对? 你 像 我们 用 ChatGPT, 不管 是在 prompt engineering 还是 说 在 提问 的 形式上 各个方面, 其实 我们是 有 很多 日常 技巧 的。 但 你 现在 其实 面试 的 时候, 你 会 发现 大家 其实 整个 体验 深度 还是 非常 浅 的。 我们 平时 可能 自己 这 几个人 聊得 很 火热, 但 我 觉得 整个 行业 的 跟进 速度 远远低于 预期。
对我 觉得 大家 可能 停留 在 理论 和 一些。
我 觉得 都 不是 理论, 我 觉得 停留 在 那个 想象。 对对对, 就是 大家 对 这个 变得 更多 的 想象 OK。 如果 大家 能 开始 去 关注 理论, 我 都 已经 很 开心 了。
我说 的 理论 不是 那个 paper 的 理论。 对, 但是 停留 在 商业 讨论 的 那个 理论上。
对对对, 所以 我 有时候 我不是 很喜欢 参与, 包括 有些 群 我 一般 我 都不 喜欢 参与 一些 特别 形而上 的 一些 讨论, 没有 这 没有 意义 是对。
那你 现在 自己 用 的 最多 的 产品 是什么?
我自己 的话 语言 模型 这边 的话, 国内 用 的 最多 应该 是 T M I chat。 因为 它 藏 的 context window 非常 有 价值。 国外 的话 可能 就 Chat GPT4, 这个 就 不说 了, 对 吧? 然后 语言 模型 我自己 就 确实 是以 ChatGPT 为 主力, 但是 我 老婆 她 非常 喜欢 用 cloud, 她 跟 我不一样。
所以 你们 晚上 在家 一个 打开 GPT, 一个 打开 cloud。
对对对。
让 你们是 个 A I 原生家庭。
是是是, 然后 那个 纹身 图 的话, 上次 我也 刚 做了 分享。 你 也 看出来, 我 日常 纹身 图纹 身 视频 基本上都 是 基于 stability fusion 这个 生态 的。
对 新时代 的 A I 产品 经理, 他 跟 技术 到底 该 怎么 合作?
我 觉得 这 是一个 非常 有趣 的 话题。 我们在 做 这种 纹身 图 领域 的 时候, 其实 在 摸索 那个 配合 模式 当中, 我们 就 发现 了 一个 非常 有趣 的 新的 一个 范式, 就 产业 配合 的 一个 新 范式。 我不知道 你知不知道, 在 sport 的 那个 生态 里面, 有 两个 非常 出名 的 web U I, 有一个 叫 o automatic。 一一 就是 大部分 的 外面 的 一些 培训 课 上面, 他们 会 卖给 你 那种 东西。 还有一个 就是 康复 U I, 因为 我们的 自定义 需求 比较高, 所以说 我 主要 在 用 康复 U I 的 工作。
Coffee U I 你可以 简单 把 它 理解 成就 是 它是 一个 由 大量 的 节点 node 组成 的 一个 workflow。 所以说 你 只要 根据 你的 需求 把 这个 workflow 搭建 出来, 那么 它 有 固定 的 input。 这个 input 可以 是 一段 文字, 也可以 是 一张 图。 然后 它 会 输出 一个 output, 这个 output 通常 是 一张 图。 那 这个 时候 就是你 通过 这个 conf U I 做好 的 这个 work flow, 其实 你是 可以 把 它 直接 变成 一个 A P I 给 导出 出去 的那 你 看看 这个 就 跟 以前 的 开发方式 有 非常 大 的 不同。 以前 的 方式 是 产品 经理 先 大致 梳理 出 自己的 业务流程 和 想要的 一个 效果。 你想要的 是 效果, 然后 这个 时候 你 可能 需要 跟 模型 算法, 跟 工程师 去 沟通, 对不对? 大家 研究 出来 说, 你 要 的 这个 效果 在 工程 上 应该 先 这样 在 样 在 那样, 最后 输出 一个 图 给 你那 P M 其实 只管 到 这个 地方 为止, 对 吧?
但是 这个 时候 在 现在 来说 就会 非常 困难, 因为 首先 技术 本身 更新 太快 太 新 了。 其次 就是说 那个 模型 在 整个 的 生产过程 当中, 它 有 很多 的 参数 细节 要 调整, 才 可以 得到 最终 你想要的 一个 效果。 如果说 还是 以前 那种 沟通模式, 那就 可能 就 出现 说 产品 表达 自己的 东西。 研发 那边 可能 想 方法 设法 可以 实现 出来, 然后 你 一看 不对, 然后 大家 又 去 改 这个 时间 back and force 的 这个 沟通 就 拉 距离 太 长了。 但 你看 我们 现在 就 我自己 改 康复, 我 天天 在那, 这个 效果 不好, 改 个 参数 再 跑 个。
这个 反馈 基本上 是 实时 的 反馈。 是 可能 有 很多 我们 以前 产品 经理 在 做 一些 那种 偏 后 端的 业务 逻辑 功能 的 时候, 以前 都 依赖于 后 端 公司 去 实现 的 东西。 有可能 现在 就是 通过 这样 搭 一个 work flow, 搭 一个 p eline 就 解决 了。 是 产 研 之间 的 配合, 它 其实 就是 会有 一些 变化。 对对对, 我 觉得 这 是个 很 有趣 的 例子。
就 后面 会 变成 什么样 的, 你 感觉 一个。
是 确实 有 很多 的 我们 以前 产品 经理 之所以 要 依赖 工程师 去做, 是因为 有 很多 业务 逻辑。 产品 经理 说的是 自然语言, 他 必须 得 通过 某种 代码 语言 去 实现。 现在 看起来, 至少 通过 某些 工具 可以 把 自然语言 直接 变成 一种 workflow 形式。 其次 就是说 你 未来 借助 语言 模型, 可能 本来 就能 把 你的 自然语言 变成 业务 逻辑 的 一些 抽象 表达。 是 但 它 可能 是 一些 可视化 的 那种 pipeline, 也 可能 是 直接 就 变成 另外 一种 标记 性 语言? 去 解决 这个 问题。 也就是说 以后 的话, 可能 一些 业务 逻辑 的 一些 部分 是 完全 是 由 P M 和 运营 这边 他们 可能 自己 就 定 了。 那 工程 那边 他 更多 的 关注 的 是 怎么做 并发, 是不是 怎么做 QPS, 做 性能, 怎么 样子 去做 扩展 这个 端的 事情。
也就是 后 端 会 变得 更 后 端, 前端 变更 前端, 然后 中间 的 核心 逻辑 其实 很多 是 产品 经理 来解决 掉。 的对 对 对对对, 那你 自己 不是 技术 背景 吗?
我不是 个 背景, 我 一直 做 产品 出身 的对。
所以 你 试起来, 你 觉得 就是现在 也 有人 在 讲说 研究 下一代 一定 是 懂 技术 的 产品 还好。
我 觉得 是 阶段性 机会。 因为 现在 这个 行业 本身 太 早期 了。 我 觉得 如果你 有 一些 技术 视野 和 视野, 不是说 你 要 搞 技术, 肯定 会 更 有助于 你 高效 的 去 理解 新的 模型 形态, 新的 模型 能力 边界, 对 吧? 但是 这 不是 一个 必须 的 前提。 比如 像 上次 我 讲 了 一个 课, 其实 听课 的 很多 的 一些 同学 他 没有 技术 背景。 但是 他们 听 完 我 那个 分享 之后 仍然 表示, 原来是 这么 一个 道理, 我也 理解, 你看 其实 他 也能 理解, 只不过 大家 以前 没想到 过 自己是 可以 读得懂 paper 的, 大家 抗拒 这件 事情。
而且 为什么 说 它是 个 阶段性 机会 呢? 是因为 在 这个 过程, 就是 在 这 两年 的 时间 里面, 因为 不懂 原理 和 懂 原理 之间 实在 差 太多 了。 很多 best practice 还没有 变成 常识, 比 别人 先 理解 他, 那么 你 就有 优势。 但 也许 过 两三年 之后, 就是 所有 这些 东西 都 变成 尝试 了。 你 不需要 懂 技术, 你 也 懂 这些 尝试 的 时候, 产品 经理 我 觉得 也 不一定 非得 懂 技术。 对, 是我 觉得 是 阶段性 机会。
那 篇 分享 上 有没有 哪几个 核心 的 点 是 能 给 大家 再 总结 一下 前面 那个。
关于 S D 的 那个 原理 的 问我 觉得 大家 可以 自己 去 看 那个 课程 的对, 那个 挺 对。 后半 部分 我们在 讲说, 就是我 在 学习 A I 的这 半年 里面, 我 觉得 作为 一个 产品 经理 应该 怎么样 去 学 A I, 我 大概 总结 了 三个 方面。 第一个 其实 不是 学习 的 方法, 而 更多 是一个 感悟 了。 你 应该 也 看过 那个, 就是你 更多 的 去 理解 原理 之后, 其实 你 对于 产品 形态 上 的 认知 会有 不一样的 想法。 比如说 这个 分享 里面 其实我 有 提到 一个点, 就是 当你 把 sporty 飞行 的 底层 原理 理解 了 之后, 其实 你 会 发现 它 是从 一个 完全 随机 的 一个 噪音 里面, 然后 通过 不断 的 降噪 的 过程 提取 出 一个 有 信息 意义 的。 就是 它的 随机 噪点 是 没有 信息 的, 然后 变成 一个 有 信息 有 价值 的 一个 图像。 假设 说 我们 有一个 X Y 轴 的 一个 平面 空间, 代表 了 全世界 所有的 概念。 他 就 是从 这个 里面 取 了 一个点, 把 那个 点 给你 还原成 了 一个 图像。
所以 当时 我在 那个 课程 分享 里面, 我 就有 提到 一个点, 说 以前 做 推荐 的 时候, 就是 不断 的 刻画 一个 用户 的 一个 画像。 但是 其实 刻画 用户 画像 这件 事情, 我们 已经 做 的 很 极端 了。 现在 各个 大厂 甚至 不需要 大厂, 你是 个 普通 公司, 你 在 刻画 用户 画像 这件 事情 上, 只要你 有 足够 的 数据, 其实 我们 都 能把 用户 刻画 的 足够 准的。
但 现在 最 麻烦 的 事情 不是 用户 画像 这件 事情。 而是 你 在 一个 确定 的 向量 空间 里面, 比如 一个 X Y 轴, 一个 平面 空间 里面, 你说 这个 用户 的 喜好 就是 这么 一个圈, 这个 圈 里面 圈住 的 就是 这个 用户 的 喜好。 但是 当你 拿着 这个 圈 去 公司 的 内容 库 里面 匹配 的 时候, 你 可能 发现 虽然 我 刻画 的 非常 精准, 但 并没有 适合 他的 内容 推荐 给他。 因为 相比 起 这个 用户 的 画像 刻画 来说。 内容 那边 的 供给 是 非常 稀疏 的, 它是 散布 在 各种各样 的 地方。 所以说 以前 的 推荐 它 其实 并不是 说真的 精准 的 是 你喜欢 什么 就 推荐 什么, 而是 说 你喜欢 什么, 但 我 有一个 内容 可能 靠近 你的 喜欢。 首先 这个 不太 精准, 其次 它的 供给 有限? 这 一个 是 最靠近 的, 下一个 就 越 靠 越远, 后面 就 越 靠 越远 了。
但 如果你 理解 了 十分 的 底层 原理 的 时候, 你 再 回来 想 这件 事情, 那么 我们 未来 就可以 做到 什么 呢? 就 不是说 拿 库 里面 的 内容 推荐, 而是 先 描绘出来 你喜欢 什么, 然后 再 在 你喜欢 的 那个 空间 里面。 因为 一个 空间 是 可以 无限 展开 的, 对不对? 那个 展开 里面 的 每一个 微小 的 点, 它 背后 所 代表 的 一张 图像、 一个 视频、 一篇 文字、 一个 音频 都 可能 是 你喜欢 的 东西。 而 这个 东西 不需要 先 在 内容 库 里面 准备, 是不是?
也就是说 我 只要 能 描绘出来 一个人 的 喜好, 我 就能 给他 提供 近乎 于 一个人一辈子 能 消耗 的 无限 的 内容 供给。 是 当你 这么 去 思考 推荐 系统 之后, 你 整个 想法 就 不一样 了。 但是 如果说 你 不 理解 很多 基础 的 底层 原理, 你是 没有 办法 这样 重新 去 思考 搜索、 推荐, 就是 我们 上 一代 做 的 这些 东西 到底 应该 怎么 样子 重新 去 思考 它的。 这个 是一个 非常重要 的 点, 就是 为什么 你 要 去 理解 原理, 对不对? 另外 也是 就是你 越是 去 了解 这个 原理 之后, 你 不管 是 站在 自己 去 构建 产品, 还是 说 去 帮助 身边 的 做 创意 做 设计 的 同学 缓解 焦虑 也是 有 帮助 的。 那就是我 越 懂 这个 里面 的 原理, 包括 越 自己 做 这个 行业 之后, 我 越 觉得 创造 的 价值 被 前所未有 的 提高 了。
怎么说 这个 意思 呢? 就是说 如果你 足够 去 理解, 你 就会 发现 现有 的 生成 的 整个 方式, 它 其实 还是 大量 的 依赖于 现有 的 数据 的 输入。 他 不断 的 在 贴近 靠拢 的 也都 是你 现有 的 数据。 他 所谓 的 创作 其实 是 来自于 对你 现有 的 可能 两个 数据 的 一个 组合。 是不是?
比如说 我 可能 用 一个 什么 素描 的 风格 画 了 一个, 但 我希望 他 最后 输出 梵高 的 风格。 但 其实 他 也 只是 说 素描 跟 梵高 的 风格 中间 的 一个 结合 的 一个点, 但是 他 仍然 是 靠近 这 两个 点的。 我们在 二维 空间 上去 看 的 时候, 你 觉得 好像 两个 点 中间 靠近 一个点 就 已经 把 这个 空间 压 得 很很 紧密 了。 但 事实上 他们 处在 这个 更 高维 的 空间, 这种 两个 空间 点 中间 的 那个 点, 并 不会 把 这个 空间 变得 更 紧密, 还是 很 稀疏 的。 在 这个 庞大 的 多 维空间 里面, 还 存在 着 非常 多 的 空白 和 未知。 而 那些 东西 是 AI 很难 去 想象 去 决定 出来 的, 而 那个 部分 就是 人类 的 创意 所在, 就是说 一个 电影 我 画面 怎么 切, 怎么 配 色彩, 镜头 怎么 转移, 这些 东西 全都 是 创意 所在。
但是 真的 觉得 危险 的 是什么? 危险 是 那种 在 已有 的 创作 基础上 做 重复劳动 的。 我 去 复刻 一张 画, 我 照着 一个 风格 再来一个, 这个 确实 是 会 很快 的 被 替代。 但是 真正 的 创作, 真正 的 在 我说 的 人类 的 所有的 概念 空间 里面, 去 带领 我们 去 探索 出 那种 未知 的 点, 会 不断 的 被 value, 就是 一定 会越来越 有 价值。
是看 外国 有 个 文章, 他们 统计 说 AI 出来 以后, 所有的 工作 的 G D 的 变化。 对 然后 他 发现 其实 反而 招 设计师 的 工作 变 多了, 因为他 发现 还是 需要 设计师 去 生 图。
对, 在 这个 一块 是我的 一些 感想。 后面 就是我 觉得 产品 经理 应该 怎么 学 A I, 我 当时 分享 了 两个 点, 一个点 是 说 我说 一 要 坚持 读 paper 就读, paper 非常 的 重要。 原因 就是 因为 比如说 我 当时 总结 了 fusion 的 这个 发展 历史, 其实 你 整个 看起来 也就 是从 20年开始 的那 整个 这 三年 的 时间, 它的 整个 信息量 有限 的。 基本上 就是 那 八 有 篇 经典 的 paper, 你 读完 串 在一起, 整个 原理 你 就 了解 了。 可能 再 过 个 五年、 十年, 当 很多 事情 都 变成 常识 了 之后, 你 懂 和 不懂 区别 不大。
但是 在 当下 来说, 你 通过 读 paper 给你 带 的 那个 信息 增值 那个 delta 的 部分 非常 的 大。 因为 大部分 是 零, 你 都 已经 不是 一了, 你 可能 是 二三 了。 那 这个 时候 的话, 你 整个 的 信息 差 就会 非常 的 充足。 那么 这个 时候 在 帮助 你 做 判断 的 时候 就会 很 有 帮助。
对我 今天 还 正好 写 一个点, 就 关于 信息 差 的。 总 有人说 别人 靠 信息 差 赚钱, 靠 信息 差 干 这个, 靠 信息 干 那个。 但 我 后来 想说, 这个 信息 差 其实 就是 在那 摆 着 的 信息。 但是 大多数人 他 就是 自己 不去 看。
对, 非常 open。 对。
最近 有 篇文章 他 还 蛮 火 的, 他是 说 把 赛罗奥特曼 所有的 访谈 看 了 一遍, 然后 写 了 篇文章, 对 吧? 其实 好多 大家 日常 在 讨论 的 答案, 赛 奥特曼 之前 自己 本来就 讲 过了。 对对对, 但 大家 就是 没有 去 看。
对, 因为我 自己是 有 一些 信息 洁癖 的, 我不是 特别 喜欢 看 那种 二次 咀嚼 的 东西。 只要 是 能有 原文, 能有 这个 信息 发生 的 地方 东西, 我 经常 都 去 看 那个地方, 因为 它是 最 原始 的 思考, 没有 经过 二次 咀嚼。
对, 但 具体 实 操 上 读书 本 到底 该 去哪儿 找, 你看 一些 比较 新的 或者 比较 好的 配 准, 这个 配 本 其实 也 很多。
还有 这样的, 这个 其实 还是 比较 容易 的。 你可以 关注 几个 村上 的 大号 是 吧? 比如说 A 魂 刚刚 离职 的 那个 AKI9 galaxy, 我 也就是 follow 了 一些 号, 然后 他们 推 一些 paper 我 就 去 看一下。 其实 很 就是你 要把 自己 泡 在 那个 语境 里面, 然后 你 看到 有 兴趣 的 朋友 就读, 我 就 一天 基本上 读 两三篇 左右。
你 读 是 精读 吗?
还是 我会 把 论文 分成 两个 部分, 一个 是我 认为是 那种 范式 型 的 创新, 另一种 就是 属于 雕花。 雕花 的 我 一般 就 快读 就是 找到 这两点, 就是 他 到底 在 雕 什么 花, 他 到底 通过 什么 方法 提升 了 几个 点, 我 就读 那个 部分, 但是 一些 范式 型 创新 我 都是 会 细读 O K。 对对对, 这个 读 paper 现在 有 个 非常 好的 好处, 就是 它 真的 能够 帮助 你 在 产品设计 和 技术改造 上能 带来 直接 的 收益。
对对对, 你 能不能 给 大家 具体 举 一个 例子。
我 分享 里面 就是 他 讲 去年底 的 时候, 那个 string division 就 那个 U C B 那边 和 日本 金融 大学 那边 他们 做 的 一个 工作。 他的 工作 最 牛逼 的 地方 就在于 说 他在 一张 4090 上面 用 S D C fusion 跑 出了 每秒 一百多 帧 的 生成 效果。 是 就 非常 难 想象。 你 就 想 就是 上半年 的 时候, 4090 还要 跑 个 10秒钟, 居然 一秒钟 可以 跑 一百多 帧, 这个 已经 是一个 千倍 的 速度 进化 了。 我 当时 看 的 时候 我 就 很 震惊。 对你 想想 如果 你是 通过 很多 的 公众 号 去 了解 这个 项目 的话, 可能 公众 号 就会 告诉 你说 什么 直播 已 死。 但是 让 你 去 看 他 那个 人家 那个 paper 的 时候, 人家 那个 标题 写 的 巨 清楚 无比。 String division 冒号 pipeline level solution 就是 去 优化 这个 速度, 人家 说是 它是 一个 pipeline level 的 一个 优化。
如果说 你 有 一些 基本 的对 split 的 一些 了解, 你 就 知道 它 整个 space 其实 不是 一个 单一 模型, 它是 一个 框架。 它 里面 其实 是 有 几个 非常 关键 的 模块, 像 做 文本 控制 的 clip, 做 V E 的 encode offer 好像 diffusion model 本身。 它 整个 过程 从头到尾 叫 pipeline。 也就是说 它 这个 时间 地 飞行 这个 方案 并 不是说 提出了 一种 新的 模型 方法 去 加快 它的 生成, 而是 说 它 在 整个 pipeline 的 过程中 去 优化。
那 我 就有 东西 可 看 了, 为什么呢? 因为我 自己 做 这个 生 图 的 类型 的 产品, 对不对? 我 虽然 没有 能力 去 改 模型, 去 练 模型, 那 我 优化 一下 这个 pipeline, 这个 是一个 我们 传统 工程 领域 上 的 一个 问题, 对不对?
我 就 去 细读 这 篇 论文, 他 提 了 六七个 不同 的 优化 点就 这里 可以 优化, 那 也可以 优化。 我 一看, 我说 我靠 这个 分 我们 可以 用, 内部 我们 可以 用, 所以 你看 其实 它 没有 那么 神秘 的, 而且 你 去 细读, 你 发现 它 里面 很多 优化 点 主要 部分 是在 模型 的 算法 上, 我 可能 需要 去 请教 一下 人才 看得懂。 但 他 很多 的 优化 点 都是 我们 传统 做 互联网 上 一代 产品 的 时候 的 一些 工程 优化 技巧。 怎么做 扩展 呢? 怎么用 空间 换时间, 内存 换 速度, 非常 有意思 是啊。 对, 最后一个 就是 在 现在 这个 阶段, 我 一定 推荐 大家 就是 要 自己 上手。 不管 是 说 你说 你 完全 不会 写 代码, 那么 像 国外 的 什么 vers l, hugging face, 这些 上面 都有 无数 的 可以 直接 免费试用 的 demo。 而 大部分 的 现在 的 那些 paper, 他们 在 发出 来 的 时候 通常 也会 配 一个 demo。
这个 节目 可能 跑 在 自己的 服务器 上, 可能 就是 在 having face 上, 对 吧? 你 都是 免费 的, 你 G P U 都 不需要 你 花钱 租, 人家 帮你 租 好了, 你 就 去 体验。 我 觉得 这个 体验 是 非常重要 的。 体验 的 方式 有 几种, 一种 就是 在 本地 上 跑, 你 要么 就是你 windows 就有 个 N D A 显卡, 要么 你 在 mac 上面, 比如 你知道 是 M 系列 的 芯片, 然后 有 个 32G 的 内存, 基本上 很多 的 模型 你 在 本地 都 跑 得 起来。 你 比如说 大 语言 模型 的 7B的 13B的 版本, 做 完 那个 八位 量化 之后, 在 我的 M2 的 32G 的 内存 上。 而且 是 完全 没没 问题 的。 那 伟达 好像 前 两周 也 出了 一个 那个, 对对对, 所以说 你 基本上 你 在 本地 上 可以 运行 很多 模型 去 找 感觉。
在 网上 的 新的 模型, 你 就 去 他们的 那些 hugger face 或者 他们 官方 的 那个 project page。 它 可能 是 连到 一个 google 的 notebook 里面, 你 就 去 点点点, 你 去 体验 一下。 我 觉得 这种 实际 的 动手 体验 是 非常重要 的 一个 部分, 就是 找 感觉 的 一个 部分。 因为你 可能 去 看 别人 的 一些 讲解, 或者 是看 一些 公众 号 文章, 你 其实 自己是 没有 那种 很 实际 的 体感 的。
比如说 当时 我在 分享 里面, 我 提到 一个点, 就是说 我说 我 第一次 在 本地 把 大 语言 模型 跑 起来 的 时候, 跑 起来 的那 一下 我 感觉 完全 不一样的 感受。 就是你 看到 自己的 这个 电脑 开始 吐 字儿 的 时候, 那种 感受 就是 hello world 的 那种 非常 震撼 的。 当你 看到 你 这个 电脑 你 一直 正常 跟 他用 了 那么 多年 了, 你 对 他的 能力 边界 认知 一直 认为 他是 一些? 就 我们 干 那些 事情 的 时候, 他 突然 开始 这 样子 投资 的 时候, 如果你 是个 产品 人 去 会 刺激 你 会 产生 非常 多 的 新的 想象 空间。
还有一个 动手 的 方面, 就是你 稍微 具备 一点点 的 代码。 那你 不是说 要 你 从头 写 一个 项目, 你 至少 会 get hub 克隆 一个 项目 下来, 会 简单 的 去 综合 环境 跑 一 跑。 那 我 就 特别 推荐 直接去 跑 demo, 或者 直接 在 上面 去 bu 的 一些 自己的 一些 小 实验, 去 满足 一些 你 自己的 想法, 或者 是 你们 现有 的 项目 做 一些 简单 的 融合。
这个 过程中 你 才能够 get 到 说, 其实 一个 模型 并 没有想象 中 运营 起来 那么简单 的。 它 中间 有 很多 的 环节, 不管 是 数据, 参数 这些 东西。 这个 里面 的 每一个 问题 的 解决, 有时候 都是 有 潜在 的 产品 机会 的。
比如说 有时候 我在 配 有些 模型 的 时候, 我 就 突然 就 发现, 这个 模型 出来 的 结果 好 有趣。 但是 普通用户 根本 用不了。 因为 它 中间 的 那个 数据 预处理 环节, 比如说 你 现在 做 声音 克隆, 你说 一段 一分钟 的话 让 我 来 克隆, 不是 直接 就 克隆 的。 你那 一分钟 我要 做 很多 的 预处理, 大概 有 七八 部。 普通人 我 根本 搞不定。 但是 你 要 想, 我说 我 搞不定, 这 不就 机会, 对不对? 我 如果 能够 帮 他 把 这个 数据 预处理 环节 整个 给 做了 训练 过程 给他 搞定, 直接 给他 deliver 最后一个 效果, 这 是不是 也是 一个 机会。
但 如果说 你 不 自己 去 体验 这个 东西, 首先 你 感受 不到 最后 结果 出来 的 起码 的 那一刻。 其实 你不知道 现在 要 做 的 那个 效果 中间 到底 还有 哪些 障碍。 这个 时候 你 去 多 体验 demo 多 build 的, 其实 它 培养 的 是你的 整个 的 认知, 以及 说 你 去 思考 这个 里面 在 工程 上、 产品 上 还有 哪些 机会。 因为 这个 行业 太 早期 了, 你 做 点 小小的 微小 的 工作, 他 都能 给你 带来 非常 大 的 回报。 是啊 R Y.
很高 的。 Twitter 上 其实 偶尔 有 一些 外国人 发 的 一些 有意思 的 小 产品。 对的, 我会 记得 印象 很 深刻。 就 他们 之前 发 一个 说 你 跟 电脑 另一端 的 对话, 然后 你 去 猜 对面 到底 是 大 模型 还是 一个 真人。 这样 东西 其实 挺好玩 的。 我 就在 想 如果 真 有 这样 东西, 我应该 会 去 玩 的, 但 国内 地址 也没有 人 做 类似的。
对对对, 或者说 就 特别 简单, 你 要 去 体验 一下, 你 去 自己 写 个 GPT s, 这种 简单 的话 都 不需要 写 代码 对 吧? 但是 说实话 就是 真的, 比如说 我们 平时 面 P M 我 就 问 了 一下, 你 有没有 创建 过 自己的 GPT s 可能 十个 人我 能 刷掉 九个, 大家 还是 不太 愿意 动手, 就 喜欢 看 别人 输出 一些。 但 你 自己 一 动手, 那个 信息 质量 比 你看 十篇 文章 都大。
但 你 十年 前 找 产品 经理 的 时候, 是 类似的 情况 吗?
有什么 区别 吗? 10年 前 14年 的 时候, 14年 最早 我 还 轮不到 我 招, 都是 别人 招 我是 吧? 所以 我们 回到十年前 比较 合适, 14年 我自己 有 个 感觉, 当然 这 可能 会 有些 stereo pe。 但是 我 觉得 最近 聊 的 一些 应届 的 同学 和 年轻 同学, 就是 大家 在 方法论 和 视野 上都 比较高。 对对对。
你 这个 情商高 的 说法, 或者 换句话说 就 不 接地气 是 吧?
我就是 感觉 就 很 像是 投 研 报告, 你 懂我 意思 吧? 对对对, 就是 他 分析 行业 起来 都 头头是道, 但是 都是 头疼 我们 播客 的。 你 要 问 他 具体 的 产品 细节 和 需求 市场 的 感觉, 我 觉得 就会 差 一些。 明白, 我 觉得 还是 因为 行业 更 成熟 了。
行业 更 成熟 了 是我 当时 在 想, 其实 最早 的 时候, 但是 我也 没 参加 过 的, 我知道 最早 的 时候 其实 张亮 他们 搞 那个 apple for.
对我 还给 他们 写 过 文章。
是 吧? 你 还 经历 过 那段, 对我 觉得 我 觉得 是不是 现在 更 像 那个 时候, 就是 很少 的 一撮 人。
对对对, 讨论 这个 东西, 我我我 自己 经常 有 这种 感受, 就是 天天 泡 在 这个 环境 里面, 觉得 世界 已经 翻天覆地 了。 结果 有时候 稍微 一 出来, 就 发现 世界 还在 原地踏步 那种感觉。 对, 就 自己 在 里面 觉得 AI 1日, 人间 千年。 但是 你 真的 出来 交流 的 时候, 发现 好像 大部分 人 还是 停 在。
我 觉得 因为 大多数 人是 他 要 等着 看 实际 产品。 对对对, 但 从 你看 paper 和 你 实际 做 的 角, 你 仍然 是 这个 感觉 太 恐怖 了。
真的 太 恐怖 了。 就是 每天 起来 都 出 一片 新 佩服 的 那种 压力 在 想 天哪 你说 这些 人是什么 时候 做 的 这个 工作? 为什么 每天 都有 新 工作 出来? 今天 也很 夸张, 我 今天 早上 就读 了 两篇 很 有 价值 的 了。 结果 刚刚 就 开车 来来 你 这边 之前, 我 又 看到 一篇 新的, 我 就 想 我说 能不能 谢谢你们。
就是你 最近 看到 的 一个 比较 意思 的 是什么?
如果 是 这 两天 的话, 我 比较 意思 的 是 有 一篇 上个星期 华为 的 诺亚方舟 实验室, 他们 发 了 一个 pix art sigma 的 模型。 因为你 今年年初 sora 出来 之后, 大家 突然 发现 说 其实 difficult transformer 看上去 是一个 更更 promising 的 未来, 是 吧? 对对对, 所以说 其实 整个 在 division model 这个 领域 里面, 大家 都在 做 多 探索。 我 觉得 pix art 的 signer 那个 模型, 他在 defeating 诠释 风格 方面 的 一些 探索, 就有 一些 非常 新颖 的 点就 你看 paper 看 多了 之后, 你 就 知道 哪些 工作 是 那种 细节 雕花, 哪些 工作 是 整体 前进。 对对对, 他 那个 paper 给 我的 感觉 就是 整体 前进, 我在 里面 看到 了 非常 多 的 一些 亮点, 所以说 我 现在 看 微博 就是 看到 一篇 文章 有一个 亮点, 我 觉得 OK 如果 看到 有 很多 亮点, 我 就 觉得 非常 爽啊。
有 那种 精神 上 的 爽 感。 这个 已经 无法 跟你聊 这个 了, 已经 跟不上 了。
主要是 就是 capable, 它 有 一些 入 门槛 的 压力。 就在于 说 你 至少 比如说 在 一个 领域 里面, 你 整个 这个 脉络 上 的那 89篇你 得先 读完, 你 才有 基本 的 了解 去 说 为什么 这 篇 论文 让 你 感到 兴奋。 对, 是 最后一个 问题。
今天的你 跟 去年 4 5月 或者 6 7月 的 时候, 你 觉得 核心 的 区别 和 变化 是什么? 在 任何 方面 都 可以。
我 觉得 可能 首先 就是 对于 基础 的 原理 理解, 我自己 现在 对于 很多 事情 怎么能 做, 不能 做 以及 怎么做。 包括 我 今天 中午 还 跟 一个 行业 内 一个 大佬 聊 完, 然后 他 来 问我 一些 他们 那个 A I 产品 该 怎么 样子 弄。 我 就 发现 他 现在 跟 我 讲 的 那些 问题, 我 基本上都 知道 背后 的 原因 是什么, 也 能够 告诉他 该 怎么怎么 样子 去 解决。 我 放到 去年 我 就 很难 想象。
对对对, 这个 一方面 跟 自己 学习 有关, 另外 一方面 跟 整个 行业 本身 的 进步 有关。 因为 慢慢 有 一些 best practice 出来 了, 这个 问题 就 该 这么 解, 这 是一个 方面。 对, 另外一个 方面 的话, 我 觉得 就是 信心, 我 觉得 去年 还是 抱着 一种 信仰 之 悦 的 感觉, 是 就是 纵身一跃。 但 我 现在 就是 信心 更 足, 就是我 觉得 这个 确实 没有 看 错, 真的 就是我 当时 做 移动 互联网 之后, 十几年来 最大 的 第二次 机会。 对我 信心 更 足。 对对对。
太好了, 太好了。 好, 那那 今天 差不多 这样。 O K O K O K, 感谢。