But something there.
我们 今天 很 开心 请 到了 星矢 宇宙 的 创始人 陶 芳 波。
真的, 你 再来 一下。
你是 需要 我 干嘛? 需要你 打个招呼。
这 样子 再 重来。 Hello, 大家好, 42章经 的 听众 们 很高兴 接受 曲 凯 老师 的 邀请。
然后 我 再 稍微 补 一点 问题, 就是 大家 知道 你 应该 很多人 是因为 mod O S 这个 产品。 知道 你们 当时 是 比较 早, 去年 在 很早 时候 就 出来 的 一个 agent 的 一个 产品 了, 是对 吧? 但 现在 最近 你是 在 做 一个 新的 产品, 可能 很多人 也有 看到, 就 me bot。 我 给 大家 简单 介绍 一下 这家 公司 的 一个 简单 历史。 就是你 怎么样 开始 的 这家 公司, 然后 盗卖 O S 又 到 现在 微博。
因为我 其实 是一个 做 A I 研究 的 人我 在 成立 这家 公司 之前, 其实 包括 读 博士, 包括 在 facebook, 在 阿里 的 达摩院, 我 一直 是一个 研究者 的 身份。 大概是 在 21年 年底 的 时候, 我 就 认为 A G I 的 时代 应该 是一个 快要 到来 的 时代。 所以 当时 就 成立 了 这家 公司, 名字 叫 星矢 宇宙。 他 其实 就是 想做 一个 agent 的 一个 世界。 这个 就是 大概 很多人 对于 星矢 宇宙 这家 公司 的 一个 最 初始 的 印象, 就是 做 agent 平台。
但是 过去 这一年, 其实 我们 思考 有 一些 变化。 一个 是 我们会 觉得 你 先 去 帮 每一个 个人 做好自己 的 agent, 比起 你 先 尝试 去 把 所有 现有 的 服务 和 软件 都 变成 agent 要 来 的 可 操作 的 多。 然后 第二 是 我们会 觉得 传统 就上 一代 的 那个 agent 的 技术, 我们 一直 在 做 的 那个 技术 更 像是 一个 脚手架, 它 有 一些 天然 的 一些 工程 带来 的 问题。 无法 让 AI 可以 变得 足够 的 聪明。 所以 我们 就 希望能够 把 现在 为 个人 做 的 这个 agent 具有 一个 自我 学习 能力。 所以 在 这样的 理念 下, 我们 就 推出 一个 新的 产品 叫 media bot。 大概是 在 今年 4月份 五月份 左右 的 时候, 是 做了 一个 内测 的 发布。 目前 大概 也有 个 小 几万 的 用户, 也 希望 大家 可以 来 应用。
Media box web 端 可以 直接 使用。 如果 是 移动 端 的话, 可能 还得 翻墙 到 海外 的 APP store 去 使用。 安卓 用户 的话 可以 直接 下载。
然后 你 应该 是 国内 接触 A 做 A I 包括 A 站 的 这些 概念 时间 最长的 人 之一 了。 所以 你 做到 今天, 你 对于 AI 这件 事儿 有 哪些 总结 的 一些 认知 什么 这些 点。
我 有一个 很强 的 感受 是 我们 可能 高估 了 A I 的 基础 能力 的 价值, 但 低估 了 它 在 场景 当中 的 know how 的 价值。 我 觉得 这个 是我的 一个 感觉, 也是 我 过去 做 mino s 的 时候 犯 了 一个 错误。 它 会 非常 像 计算机 革命, 计算机 革命 一开始 就是 I B M C E O 说 全世界 只需要 5台计算机, 所有人 都 连 我 这 你们 那些 任务, 这 五台 超级计算机 都 可以 解决。 Steve jobs 和 bill gates, 当时 他们 都 还 只是 二十 来岁 的 年轻人, 说 不行, 我们 不只 需要 5台玄机, 我们 不仅 需要 每个 人的 桌面上 有 一台 计算机, 甚至 我们 身上 都 得 有 各种各样 的 计算机。 那 今天 其实 我们 已经 看到 我们 身上, 我们 带 的 手表, 我们的 手机, 其实 就是 各种各样 不同 尺寸 不同 功能 的 计算机 了。 而 它 比起 5台超级计算机 而言, 它 带来 的 这种 个性化 的 价值, 它 对于 个人 服务 的 这种 体验 的 捕捉 是要 好得多 的。
这个 还是 挺 有意思。
对我 最近 经常 会 去 借鉴 那个 计算机 的 发展 历史, 就是 个人 计算机 是 怎么做 小型化 的。 其实 他 那 上面 的 文件系统 就是 今天 我们 讲 的 记忆系统 很 像。 然后 它 是因为 有了 这些 文件系统, 因为 有了 你的 个人 的 操作 在 上面, 它 还 构建 起了 一个 上面 的 应用 生态。 也就是说 你的 应用 生态 不会 构建 在 一个 超级计算机 上, 你的 应用 生态 其实 是在 构建 在 你的 个人 计算机 上。
你说 未来 基于 A I 的 这些 应用 生态 是 构建 在 GPT 上, 还是 构建 在 一个 个人 模型 上? 我 觉得 这就是 一个 很 有意思 的 问题 了。 但 A I 把 这个 发展 就 极大 的 压缩 了, 可能 从 大型机 到 个人 计算机 花了 30年。 从 A I 的 大 的 function model 到 personal model 可能 只要 花 五年。 但是 我 觉得 personal model 就是 新时代 的 personal computer。
一个 大 模型 结合 一个 场景 或者 个人, 它 会 形成了 一个 新的 boat。 这样的 一个 boat 会 成为 未来世界 的 一个 基础 单元。 企业 会有 他 自己的 bot, 个人 会有 他 自己的 boat 然后 这些 boat 和 bot 之间, 他 会有 自己的 新的 通信协议 和 自己的 网络。 这个 以 bot 作为 基础 单元 的 这个世界, 是 我们在 接下来 可能 30年 左右 会 去 逐渐 形成 的 一个 世界。 所以 我们 应该 在这个世界 里面 找到 到底 什么 报纸 是 最 值得 做 的, 什么 报纸 是 跟 这个 场景 结合 的 最好的。 然后 最后 毛 到 的 一个点, 也是 我在 创业 初期 的 时候, 其实 没有 想 的 特别 清楚。 就是 到底 最 重要 的 boss 是什么?
这个 怎么讲? 什么 叫 最 重要 的 boss?
是 就是说 如果我们 认为 未来 这个 世界上 会有 很多很多 的 boss 是 连接起来, 但是 boat 本身 又有 很多 不同 的 角色。 比方说 那个 character A I 里面 可能 有 一些 代表 了 名人 的 boat 小 商家 现在 很多 比如 在 网站 上 放 他的 那个 A I 的 一个 widget, 可以 跟 用户 交流, 其实 也 属于 一个 他 对外 展示 和 销售 的 一个 保存。 我们在 电影 里面 看到 的, 无论是 贾维斯 和 her, 都 像是 说 我 每个人 拥有 一个 类似 于 助理 或者 陪伴 的 boss。 硅谷 现在 也有 一个 很 有意思 的 分类, 就是 一家 A I 的 native 的 公司, 它 会 把 它 分类 到 它所 创造 的 这个 bot 的 类型 或者 职业 上。 比如说 他 认为 David 就是 创造 程序员 的 boat 的 公司, 然后 什么什么 就是 创造 可能 是 H R 的 boat 的 公司。
对, 国内 其实 我们 也有 一种 说法 是 说, 就 国内 SARS 这些 点 都不 太行, 对 吧? 他 讲说 未来 会不会 跳过 SARS 这个 阶段, 包括 美国 其实 也 在 讲 了, 就是 第三代 软件 之类 这种 说法 对 吧? 他 就是说 SARS 其实 是 一个人 还是 在 去 使用 各种 功能。 对, 但 后面 其实 你就是 用 一个 boss 就 好了。 包括 我们 最早 也 聊过 这 公司, 他是 做 做 物流 系统 的。 现在 物流 系统 可能 你 如果 真的 是用 sas 来 用, 需要 那个人 手工 的 去 调, 对 吧? 说 这个 订单 调整 它的 什么 优先级, 乱七八糟 的对, 但 他 完全 就可以 做到 一个 微信 的 报道 里面 原话 跟他讲, 你 帮 我 把 明天 的 这个 订单 改成 后天 下午 几点 再去 送。 其实 就 O K 了, 它 就是 一个 抱头 的 形态, 去 取代 了 之前 非常复杂 的 一个 软件 的 系统。
对, 但是 这 里面 就有 一个 很 有意思 的 问题。 当我们 在 说 A I 是 下一代 软件 的 时候, 会有 里面 有一个 其实 藏 得 很深的 一个 假设。 就是 因为 软件 本身 原来 都是 提供 服务, 提供 内容, 其实 是 供给 侧 的 形态。 Box 是 下一代 软件, 也 意味着 我们 想到 的 boss 其实 都是 供给 侧 的 box 比如说 他 代表 那个 红酒 厂商 的, 然后 它是 提供 某种 编程 服务 的, 是对 吧?
其实我 后来 觉得 最 重要 的 报纸 可能 不是 供给 侧 的 报纸, 而是 身份 型 的 boss。 它 其实 是一个 偏 需求 侧 的 boss。 因为 其实 大量 的 我们 日常生活 中, 其实 还是 在 有 需求 侧 的 属性。 我 产生 各种各样 的 需要, 然后 交给 这些 供给。 现在 一个 很 有意思 的 点 就是 如果说 发起 需求, 这个 其实 不是我 本人, 而是 和 我 绑定 的 互为 映射 的 这样的 一个 boss。 这个 but 有可能 就是我 认为 在 所谓 的 boss 的 世界 里面 最 重要 的那 一个 形态。 这个 其实 是 软件 以前 是 没有 这种。
形态 的对 之前 这块 需求 是谁 在 满足? 或者说 大家 在 什么 行为 上面 会 比较 类似 于 这种。
我 觉得 之前 的 满足 方式 是 静态 的, 它 其实 有点 像是 一个 身份。 之前 最早 的 身份 其实 是 类似 于 像 facebook 这样的 一个 身份, 或者说 我们会 用 email 这样的 工具 去 发送 我们的 需求。 但 现在 就是说 因为 A I 的 技术, 我可以 把 这个 身份 变得 非常 的 动态化。 而且 这个 身份 它是 完全 是你的 一个 映射。 所以 也 是因为 这个 原因, 我们 特别 想做 的 这个 产品 就 叫做 media box。 本质 上 是在 做 一个 boat, 它是 你 自己。 但 从 刚才 供给 和 需求 的 角度 来看, 它 其实 是一个 发起 需求, 整合 需求 的 一个 A I 而 非 提供 服务, 提供 内容 的 一个 明白。
对我 我们 再 往回 理 一下, 就是 其实 你 昨天 我们在 讨论 一个 问题, 就是 A I 的 最小 单元 到底是什么? 对, 然后 你的 答应 该是 就是 boat。
对, 就是 boat 它 有 两层 单元, 一层 单元 是 bot 另外 一层 单元 是 boat 的 之间 的 互动。 就 像是 点 和 边 的 关系。 在 一个 graph 里面, 点 也是 一种 单元, 边 也是 一种 单元。 然后 这个 边 大量 的 边 会 是 鲍 和 鲍 之间 的, 但是 也会 有 大量 的 边 是你的 这个 需求 侧 的。
但 如果说 比如说 你 刚才 提 的 这点, 如果 大量 的 这个 边 或者 是 互动 是 报道 和 报道 之间 完成 的那 它 到底 算是 好多个 board, 还是 其实 它 就是 一个 东西 呢? 就 比如 它 我们 就 把 它 当做 一 黑盒, 它 就是 按 这个 逻辑 完成 了, 对 吧? 那 有没有 必要 再去 分, 或者 再去 用 很多 个 报纸 的 逻辑 和 思路 去 设计 这个 东西?
它 作为 很多 个 报纸 设计 思路, 它 本质 上 并不是 因为 网络 就 一定 比 非 网络 好。 其实 他 有 很多 报纸 的 设计 的 原因, 是 为了 让 每一个 报纸 具有 一个 跟 真实世界 的 实体 的 一个 绑定。 比如说 这里 有 个 报纸, 他 就 叫 徐凯 的 报纸, 就是你 自己的 需求 侧 的 报纸。 然后 可能 那边 有 个 包子, 叫做 元气 森林 的 饮料 的 包子, 它 就是 一个 供给 侧 的 包子。 它 一旦 发生 这样的 绑定 了 之后, 你 和 你的 取 卡 的 boss 之间 就 形成了 一个 相对 来讲 独立 的 一个 优化 的 循环。
他的 目标 其实 并不是 为了 网络 当中 的 优化, 他的 目标 是 为了 使得 它的 所有的 服务 更 能够 对齐 到 你的 需求 上。 然后 元气 森林 的 那个 保证 它的 目标 是 使得 它的 提供 服务 的 能力 更 对齐 到 元气 森林 本身 的 背后 的 服务 的 提供 能力 上。 所以 这样的话 就可以 使得 整个 网络 里面 有 不同 的 人 拥有 不同 的 boss, 并且 独立 的 在 优化。 最终 会 使得 这个 网络 的 整体 的 效率 和 服务 的 能力 去 得到 提升。
是不是 我可以 理解 成就 是 它是 一个 每一个 对 每一个 主体 对应 一个 boss 对 每个 主体 对应 一个 boss。 所以 理论上 来说, 如果我们 非要 去 说 未来 boat 的 数量 来讲 的话, 应该 所有的 主体, 比如 每个人 肯定 是 有一个 的对 吧? 每个 公司 可能 有一个。 对。 然后 这个 包子 应该 理论 说是 兼具 谈 需求 和 给予 供给 的 这个 能力 的对 吧?
对对对, 就 每个 包子 会有 两个 部分, 一个 部分 是 他 跟 拥有 它的 这个 主体 之间 会 进行 持续性 的 对齐, 从而 更好 的 了解 我的 需求。 然后 另外 一部分 能力 就是 他 拥有 能够 加入 这个 网络 的 能力。 他 拥有 一套 可以 跟 这个 网络 免 别的 报纸, 或者 可能 也 包含 别的 传统 的 像 网站 这样的 服务 之间 去 互动, 并且 把 信息 进行 交换 的 能力。
然后 你 刚才 讲 的 me about 现在 是 做 的 就是 每个 个体 每个人 自己的 一个 对 吧? 但 我在 想 按 我们 刚才 讲 的, 比如 一个 部门, 你 也可以 把 它 当做 一个 实体 一个 我? 一个 更大 的 一个 我。 那 这种 未来 会不会 也是 一种 类似 v box 的 一个 潜在 的 用户 和 场景?
对, 当然 就是我 觉得 终局 就是 每个 个人 是 一定 都 会有。 因为 个人 是 在这个世界 里面 非常 独立 的, 公司 和 大型 的 组织 肯定 也会 有, 因为 它 也是 一个 相对 独立 的 单元。 但是 比如说 我公司 里面 的 一个 团队, 一个 部门 或者 一条 产品线, 它 适 不 适合 产生 它的 报价, 这个 东西 就 比较 tRicky 了。 它 取决于 这个 事情 到底 是否 拥有 一个 独立 持续 优化 的 需要。
我 感觉 理论 来说 应该 是, 但 除了 这个 我 还想 补充 一点, 我 觉得 你 刚才 讲 的 是 bot 它 必须 是 独立 的 持续 进化。 对我 在 想 另外一个 场景, 它 可能 就是 每天 要 重复性 的 工作, 起 一些 重复性 的 作用。 我 觉得 这种 时候 bot 也是 有用的。 就 比如说 就是 以前 一个 填表 的 场景, 我 来 填表, 然后 那边 有个人 审核。 对, 其实 这时候 bot 也能 持续的 产生 作用。 但 它 不一定 是你 现在 定义 的 这个 me bot 这种 最 典型 的 一个。
它 本质 上 还是 供给 侧 的。 供给 侧 当然 也可以 存在, 但是 我不会 把 那种 做 固定 任务 的 东西 当做 boat。 它 更 像是 一个 workflow, 它 应该 是 被包 着 使用 的 一个 类似 于 一个 它的 能力, 或者说 它的 一个 组件。
我 刚刚 也 在 想说, 就是 我们 刚才 提到 SARS 后面 会不会 A I 取代。 就 我在 想 所有的 可 被 操作 的 软件 服务 窗口。 其实 本质 上 来讲, 你 去 操作 它的 时候, 就是你 作为 一个人 的 意志。 你知道 你的 目的 是什么, 对不对? 然后 你 使用 一个 工具 或者说 一个 workflow 去 完成。 这个 时候 如果 A I 是 懂 你的, 他 知道 你 要 什么。 对它 又 具备 agent 我们 讲 的 我们 期待 的 看到 的 agent 的 一个 多线程 的 或者 多任务 的 操作能力 的话, 其实 这个 界面 你 就 没有 意义 了。
大家 之前 最早 的 时候 也 在 聊, 到底 未来 应该 是一个 什么 图片 图形 窗口 还是 聊天 界面 还是 怎么样 的。 我 觉得 除非 它是 一个 极 简 的, 就 只用 点 那么 两下 的, 这个 时候 可能 A I 的 作用 也 不一定 有 那么 大。 但 凡是 相对 复杂 一点 的 窗口, 需要 人 操作 的那 就 用 A I 替代 就 好了。 对你 就 跟他讲 就 好了。
我 觉得 最 典型 的 场景 就是 excel 这种。 我 可能 就是说 我想 算 出来 这个 月工资 的 排序, 对 吧? 还是 过去 一年 里面 一个多 复杂 的 一个 怎么样 的 一个 一堆 数据 得到 一个 结果。 那 现在 你 要 一个人 去 操作, 他 得 学 很多 东西 对 吧? 要 搞 很多 函数 什么 各种 操作。 那你 可能 你 跟 A I 说 一下, 他 自动 就 帮你 完成 了。 所以 未来 可能 excel 的 作用 也 没 那么 大 了, 或者 至少 他 这么 多 奇奇怪怪 的 函数 没有 那么 大 作用, 就 用 A I 就 好了。 所以 这块 我想 讲 的 就是说, 未来 可能 一切 复杂 的 系统 都会 被 一个 简单 的 聊天 界面 的 A I 取代, 然后 它 就 变成 一个 单元, 这个 可能 更多 的 是 偏 供给 侧 的对 吧?
按照 我们 刚才 讲 的对, 然后 你 讲 的 是 我们 仍然 也 需要 一个 需求 侧 的。 然后 需求 做 的 就是说 我 更 懂 这个人 日常 想要 什么东西, 然后 他 去 跟 那个 A I 去 沟通交流 就 好了。 我的 理解 就是现在 大家 第一 反应 是 让 A I 去 用 这个 word flow, 是因为 已经 有了 这么个 界面 对 吧? 但 其实 A I 出来 完全 可以 把 这个 界面 先 破 除掉, 然后 让 他 重新 用 他 理解 去 搭 就 好。 但 我 现在 有 很多人 讲说, 之所以 觉得 agent 的 后面 很难 达到, 因为 整个 人 学习 的 这个 过程 是 没有 数据 可以 去 标注, 会 去 遵循 的。 你 觉得 这个 问题 有什么 解决 方法 吗?
我 举 一个 很 有意思 的 例子, 我 前段时间 跟 一个 做 法律 的 一个 大哥 聊天, 他 应该 是 很 厉害 的 一个 律师。 他 一直 想做 一个 法律 agent, 他 一直 就 做不到 他 想要的 那个 专业 律师 的 水平。 然后 我们 就在 探讨 说 你的 律师 的 培训 过程 到底 是 怎么 完成 的? 他 到底 是 怎么样 从 一个 不懂 法律 的 人, 变成 了 今天 可能 律师 行业 的 一个 大佬, 可能 合伙人 之类。
他说 其实 大概 就有 分为 三大类。 第一类 他 就是 上 法学院。 上 法学院 的 第一步 就是 不断 的 疯狂的 看 case, 这就 有点 像是 预 训练 的 过程, 然后 老师 就会 去 教 他说 你 这个 东西 的 流程 是 先 去 查 这个 数据库, 查完 了 之后 把 这个 case 拿 过来 做 对比。 对比 完了 之后 我们 可能 去做 一些 结论。 这个 有 就 有点 像是 今天 的 A I 的 agents, 给他 一个 workflow 去 学习。 但是 他说 他 对他 来讲 这个 东西 更有 价值 的 方式。 其实 是 他 随着 跟 这些 专业 律师 真的 在 做 case 的 过程 当中, 他 会 发现 很多很多 不同 的 case 下, 他的 直觉 判定 方向, 甚至 workflow 的 使用 用 都是 完全 打破 的。 有的 情况下 他 可能 不是 马上 就 进入 到 一个 evidence 的 阶段, 而是 要 去 跟 法官 去 沟通。
而 这些 经验 是从 哪来的 呢? 是从 真实的 过程 当中, 通过 你 去 把 flow deliver 出去, 拿到 了 正面 或者 负面 的 反馈, 把 这部分 反馈 当做 记忆, 再 拿 回来 再 持续的 学习。 所以 它 很 明显 的 具有 一个 两 阶段 的 过程。
第一个 阶段 就是 我们 现在 理解 的 A I agent。 我 告诉他 法律条文 在哪, 就是 这边 可能 是你 要 的 刑法 的 整个 文案, 那 就是 rag 的 部分。 同时 我 再 告诉他 一堆 workflow, 说 他 如果 是 法律咨询, 你 就 走 123四五步。 他 如果 是 走 什么什么, 你 就 走 456七八步。 但是 如果 一个 新的 人 进来, 他他 遇到 了 这个 法律 情况 的 case 稍微 变化 一下, 或者 他的 需求 稍微 变化 一下, 你 这些 固定 东西 的 组合 就 解决不了 了。 你 依然 会 先 通过 这种 方式 去 服务 他, 然后 会 得到 负面 的 反馈。 他说 我 这时候 不需要 这个 东西, 或者说 你 给 我的 这个 方案 我 就 打官司 打输 了。 那么 他 就要 把 这个 反馈 拿 过来, 再 把 它 使用 这些 工具 和 使用 这些 内容 的 方式 给 打破 了 之后, 再 建立 新的 连接。
所以 它是 分两 阶段 的那 回过头来 讲 A I agent, 为什么 今天 所有的 A I agent 都很 笨? 我 觉得 差距 并不是 在 它它 的 初期 学习 的 部分。 初期 学习 的 部分 我们 用 工具化 的 方法, workflow 的 方法 给 它 搭建 基本 的 结构, 完全 OK。 它的 差距 在于 当 他 真的 在 实践 的 时候, 他 大量 的 实践 当中 获得 的 反馈 和 数据, 没有 办法 去 改造 它的 初期 给 他的 这个 设计。 这个 就是我 说 的, 他 需要 有一个 持续 认领 的 过程, 只有 这样 才能 达到 我们 想要的 agents 的 水平。
是 就 好像 你 就像 我们 经常 讲 脚手架 这个 词, 对 吧? 对, 就 真的 是 就是你 就 搭 了 一个 骨架 出来。 对, 但是 其实 在 这个 脑子 上 没有 给他 太多 的 骨架。
上 没有 智能, 股价 上 是 外部 的 工具 而已。 所以 现在 的 一个 最 关键 的 点, 无论 我们 说是 做自己 的 AI agent, 还是 说 做 供给 侧 的 A I agent, 我 认为 都 需要 去 思考, 或者 都 需要 去 尝试。 第二个 阶段 怎么做?
第一个 阶段 就是 脚手架 脚架, 第二个 阶段 就是 怎么 给他 更多 的 智慧 和 反馈。
从 真实的 数据 当中 实践 当中 去 获得 学习。
但 如果 按 你 这么 讲 的话, 应该 是 现存 的 数据量 越大, 以及 说 反馈 频次 越高 的 地方, 越 容易 先 把 这些 事情 做出来。
对我 同意。 有什么 领域 是 这样的 吗? 个人生活 的 领域 就是这样。 这个 不是 因为 你们 在 做 这个, 我 只能 说 这 是一个 我 并 不是说 这是 唯一 的 一个 明白。 当然 还有 比如说 我 觉得 销售 的 这个 领域 也是 这样的, 确实? 你 一个 销售 的 人员 每一天 要 打 30通电话, 是 你到底 这个 话 术 怎么说? 这个 workflow 怎么用, 这些 知识 怎么 使用 起来, 使得 我 销售 成功率 可以 提升 他。 如果 今天 你 创造 一个 销售 的 agents, 当你 创建 好的 那一刻, 他 就 不会 提升 了, 它的 成功率 就 已经 被 固定 在 一个 数字 上。
所以 你 刚刚 提到 你 觉得 个人生活 助理 对 吧? 这个 也是 类似的 这么 一个 场景。 原因 是什么 呢? 我 其实。 在 想到 这个 东西 怎么样 既 高频 又 给 反馈。
其实 我们的 思考 的 链路 是 这样的, 就是 在 未来的世界 里面, 他 一定 每个人 会有 一个 A I 而且 这个 A I 应该 是 高度 的 和 这个人 alien 到 一起 的。 但是 问题 就是说 个人 其实 是 非常 难 alien 的。 就像 以前 有 一句话 叫做 今天 踏进 这条河 的 人和 昨天 踏进 这条河 的 人, 其实 不是 同一个 人。
对, 而且 我们 经常 也 讲, 就是 每个人 其实 都 不了解 自己。 对, 还要 让 一个 AI 了解 你。
对他 也 甚至 说 不一定 那么 了解 自己, 但是 你 至少 有些 部分 你是 了解。 我 只能 说 人的 深层次 的 部分 不要说 A I 了, 连 人 自己 都 不一定 了解 自己, 但是 这个 是 绝对 有可能。 但是 这 里面 就有 一个点, 就是 如果你 真的 想 创造 一个 A I 那么 它 非常重要 的 一个点 就是 它 得 经历 跟 你 一样 在 经历 的 东西。 也就是说 他 得 拥有 你 在 拥有 了 这份 完整 的 记忆。 所以 我们 现在 其实 本质 上 想要 解决 的 就是 这个 点。 如果说 人是 一个 高度 由 记忆 决定 的 动物, 一种 生命体, 且 人 每天 他的 记忆 都 像 一个 瘤 一样, 不断 的 在 有 新的 记忆 灌进来。 而且 他 每天 新的 记忆 灌进来 的 时候, 我这个人 背后 的 整个 思想 结构, 对 世界 的 认识 都在 默默地 发生 着 变化。 那 这个 完整 的 过程 就 应该 被 复制到 A I 上。
然后 第二步 是什么 呢? 怎么 让 A I 能够 像 人 一样 去 获取 这部分 数据 里面 的 真正 跟 你 本质 有关的 那些 学习 到 的 东西, 对 吧? 这 里面 就 涉及到 一个 很 有意思 的 概念。 在 认知科学 里面, 它 对于 自我 有一个 区分。 一种 叫做 experience himself, 就是 经历 的 自我。 一种 叫做 remember itself, 叫做 记忆 的 自我。 它 说的是 每个人 其实 都在 经历 我的 这些 记忆, 就像 我在 经历 喂养 这些 数据 一样。 但是 事实上 最后 那个 remember itself 那个 真正 重要 的 技 主播 是谁 的 那个 自己, 其实 是 跟 你的 经历 不完全 相关 的。
它是 通过 一套 叫做 预测 的 机制 来 构建 出来 的。 有点像 什么 呢? 就是我 不断 的 在 经历 的 过程 当中, 其实我 人 同时 背后 有一个 网络, 不断 的 在 预测 我 接下来 的 经历 会 是什么, 我 接下来 会 产生 的 想法 是什么。 而 为了 预测 的 更 准, 并不是 完全 就是 把 过去 的 经历 重复 一遍 就可以 了。 你 必须 让 你的 remember itself, 在 这个 预测 的 过程 当中 学习 到。
我本人 是一个 举 个 例子 是一个 什么样 M B T I 的, 我 真正 感兴趣 的 是什么? 我的 思维 结构 是什么? 也就是 你 要 从 这个 experience 里面 抽象 出 一套 真正 的 人的 人格, 人的 思维 结构。 人 抽象 出来 的那 一层 很 复杂 的 意识, 这部分 就是 remember self 在 学习 的 东西。 然后 这部分 学到 的 东西 它是 高度 抽象 过 的。 它 其实 是 对于 我 今天 要 去做 一个 创业 的 决策, 情感 的决, 甚至 是 买 一个 东西 的 决策。 应该 喜欢 看 这部 电影, 还是 看 那 部 电影 的 一个 决策 真正 起到 作用 的对 吧? 就是 假如 说 我 今天 有 两部 电影 在 我 面前 我 都 没有 看过。
Experience self 是 没有 办法 帮 我 做 判断 的, 因为 它 对我 来讲 都是 数据, 它 不是 重复。 但是 remember itself 那个 记忆 的 自我 就可以。 因为 记忆 自我 在 训练 的 过程 当中, 其实 训练 到 的 就是我 到底 是一个 喜欢 惊悚 的 人, 还是 喜欢 爱情 的 人。 如果 我是一个 喜欢 爱情片 轻松 一点 的, 那么 我 肯定 会 去 看 那个 爱情片。
核心 就是我 要 让 一种 可 预测 的 机制 加入到 同样 的 这个 A I 的 训练 过程 当中。 AI 也 形成 一个 这样的 目标, 使得 它 我 预测 接下来 的 事情 和 预测 我 接下来 的 下一个 想法 更 准确。 这种 准确 训练 的 过程, 持续 训练 的 过程, 其实 就是 在 构造 一个 remember self。 所以 他 训练 出来 的 模型 就会 非常 像。 它 不仅 是 拥有 这些 记忆, 他 还 抽象 出了 像你 一样 去 理解 这些 记忆, 并且 把 这些 记忆 投射 到 未来 的 一种 模式, 这个 模式 就 对齐 了。
这个 听起来 挺 玄乎 的, 所以 实际上 它 在产品 上 是 怎么 实现 的?
不, 这个 是 训练 模型 的 一个 过程。 因为 我们 在产品 上 本身 就是 做 三件 事情。 第一件 事情 就是 刚才 讲 的 共生。 共生 从 现在 的 角度 来讲, 相当于 我们会 为 每一个 用户, 当然 他是 为了 构造 这个 A I 但 构造 这个 A I 的 过程 其实 就 有点 像是 为 每个 用户 构造 一个 记忆 流。 举 个 例子, 我 现在 在 跟 你 发生 一段 对话, 我可以 让 我的 A I 在这里 听 这 段 对话, 那么 这个 对话 就 进入 到 他的 记忆 流 里面 去。 我 看到 了 一个 很 好的 东西, 我 也可以 把 这 张 图片 发给 他, 或者说 我 脑子 里面 有一个 特别 好的 想法。 我 也会 按着 他 那个 录音 的 按钮, 它 就 自动 的 开始 记录 我 脑子里 的 想法。 所以 我在 外部 看到 的 信号 和 我 脑子 里面 的 信号, 都 可以 尽可能 的 让 我的 这个 A I 通过 一个 记忆 流 的 方式 给 保留 下来。
这是 产品 上 在 共生 这 一个 阶段, 我们 到 现在 做到 的 一个 程度。 但是 下一个 程度 一定 是 把 它 去 变成 一个 超越 于 手机 的 一个 形态。 就是 比方说 他是 一个 眼睛, 那么 这时候 他的 记录 就会 更加 自主, 它的 存在 就会 更加 背景 化。
是 就是你 肯定 希望 尽可能 多 的 记忆, 记忆 真的 是 越 共生 越好, 越 共生 越好。 而且 你 这个 东西 你 这么说 起来 就是 越早 用 越 好啊, 越早 用 越好。 其实我 刚才 想 了 一个 场景, 我们 是不是 可以 给 父母 用来 带 娃, 让 他 跟着 娃 一起长大。
而且 也可以。 因为我 觉得 共生 是一种 非常 高级 的 人机交互 的 一种 方式。 或者说 其实 所有人 100年 前 就 有人 想要 共识, 只是 说 一直 没有 这个 好的 技术。 硬件 也好, 软件 也好, 对 吧? 软件 今天 有 A I 我 觉得 是 可以 达到 共生 的那 硬件 可能 现在 我们 还需要 一个 更加 可 穿戴 的 设备。
但 本身 底层 的 A I 现在 它 也有 各种 问题, 对 吧? 比如说 大家 经常 讲 的 就是你 给他 一大 段 东西, 人 知道 要 记 什么 不 记 什么。 对, 但 AI 可能 不一定 知道, 所以 你 要 完成 这件 事儿, 是不是 也 持续 要 做 很多 底层 算法 的 一些 东西。 你 刚才 讲。
这段话 就是 典型 的 我 刚才 提到 的 体验 自我 和 记忆 自我 之间 的 差别。 人 为什么 会 知道 哪些 东西 我要 记, 哪些 东西 我 不用 记 呢? 是因为 他 选择 遗忘 其中 的 大部分, 使得 他 保留 下来 的 信息 对我 未来 的 决策 和 预测 是 最有 价值。
的这 怎么 人 有 这么 聪明 吗?
它是 隐性 的 发生 OK 隐性 的 发生 的。 甚至 有一个 很 有意思 的 理论, 就是说 我们 为什么 小时候 在 三岁 以前 是 记不住 东西 的。 是因为 三岁 的 时候 我们 那个 remember itself, 就是 我们 那个 模型 很差, 使得 他 预测 的 时候 错误率 极高。 小孩子 他 也 不懂 世界 是 怎么 运转 的那 错误率 可能 在 百分之八九十, 然后 错误率 特别 高了 之后, 他 就 记不住 这些 东西。 但是 三岁 之后 我们 就 记得 越来越多, 是因为 我们 那个 模型 稳定下来 了, 所以 我可以 预测 的 非常 好。 然后 你 就会 发现 大脑 当中 我 体验 经历 到 的 东西, 绝 大多 我 都会 忘掉。 比如说 你 今天 穿 的 裤子 是 黄色 的, 我 明天 一定 忘掉。
因为 不重要, 现在 说不定 就 忘了。
现在 就 忘了。 对, 但是 也就 说 我们 今天 通过 各种 感官 得到 绝大部分 信号, 其实 是 跟 我们 未来 对于 这个世界 的 预测 判断 是 没有关系 的。 所以 我 就 选择 把 它 忘掉。
对, 用 我们 做 内容 的 角度 来讲 是 或者说 做 访谈, 做 I C 之类 的 都一样。 就是你 应该 本身 是 带着 一个 框架 去 跟人 聊天, 对 吧? 你 感觉 是在 聊天, 那 其实 你是 在 寻找 那些 信息, 然后 你 把 它 填到 你 已有 的 一个 框架 里面 来, 对 吧? 然后 包括 我们 经常 讲 的 就是 要有 假设 再去 论证, 其实 也是 一样的 对 吧? 就 我 先 有一个 假设, 对, 然后 我 论证 了 微 箴 O K, 那 这块 就 放到 这个 框架 里面, 哪个 位置 对 是 假的, 我 就 再 继续 验证。
exactly。 这就是 我们 所说 的 所有的 框架 本质 上都 是 为了 预测 未来。 所以 所有的 框架 都是 错的, 只是 有 一些 预测 的。
不 那么 错 而已。 所以 你是 想 用 让 AI 也 具备 这个 能力, 对, 然后 也 复刻 这么 一个 流程。 对, 目前 是 能 做到 的 吗? 能 做到。
基本上 能 做到。 因为 很多人 理解 的 记忆 和 我 理解 的 记忆 是 很 不一样的。 我们 就说 狭义 的 记忆 是什么? 狭义 的 记忆 是 说 它 可以 记住 所有 东西。 这种 情况下 它 只有 一种 场景, 就是 a needle in a hay back。 比如说 我 读 一本书, 我可以 记住 所有的 细节。 比如说 西游记, 然后 我 就 问 三打白骨精 第二次 打 是在 什么 场景 下 发生 的那 他 肯定 能 记住, 对 吧? 这是 一般人 认为 的 狭义 的 记忆。
但 其实 真正 人的 记忆, 他 有 两个 点。 第一, 他 不会 记住 所有的 细节, 他 有的 时候 会 reference, 就是 哪怕 是一个 熟读 西游记 十遍 的 人, 他 也 记不住 里面 说 的 每 一句话, 但 他 手边 可能 有 部 西游记, 那么 他 这时候 需要 的 时候, 他 可以 去 找 那个 章节, 那一句话 他 可以 找到, 他, 这 叫 referencing, 可以 用 进去。 但是 他 留下来 的 那些 记忆 是什么 呢? 留下来 那些 记忆 是 帮 他 去 打开 除了 回忆 之外 的 更大 的 场景 呢?
这 其中 第一个 场景 就是 预测, 就是 我们 今天 想要 让 AI 获得 的 记忆 是 它 这个 记忆 它 不是 表象 的 那些 信息, 而是 它 抽象 的 参数, 或者说 抽象 了 你说的 大脑 里面 的 那个 框架, 使得 它 可以 预测。 举 个 例子, 我可以 预测 我 今天 跟 徐凯 来 聊, 我会 聊 那些 话题, 我自己 肯定 能 判断 出来。 但是 一个 只有 纯粹 memorizing 能力 的, 就是 死记硬背 能力 的 人, 他是 没有 这个 能力 的。
对, 这个 中文 是什么? 海底捞针 是 吧? 大海捞针 大海捞针。 对, 就 讲 这个 就 当时 大家 都 用 这个 测试 来去 验证 模型 能力 到底 怎么样。
但 我 听 完 你 讲, 你的 确实 是 这样 一个 正常人, 他 也 不会 是 这么 去 记 东西 的 对对对 吧? 但 这 里面 又有 一个 延伸 的 点, 就是 不同 的 人 他 记 的 东西 也 不一样, 对 吧? 就是 每个人 看一遍 西游记, 就 每个人 记下来 的 东西 也都 不一样, 对 吧? 这个 也 跟 他 自己的 你 刚才 讲 的那 两种 记忆 可能 是 很 有关系 的对, 所以 反正 anyway 我 觉得 整体 听起来, 我 觉得 你 真的 这个 事儿 是 make sense 的。 但 你 真的 要 用 AI 去 复刻 这个 人是 挺 难 的, 就 非常 难得。 一个 就是你 其实 相当于 是在 造人, 这个 事儿 如果 成立 的话, 你就是 在 造人。
或者说 我在 做用 一个 科幻 点的 概念, 叫做 上传 智能, 是 uploaded intelligence。
对我 看 了 这个 美剧, 而且 我 刚才 在 想, 如果 真的 把 一个 me bot 做出来 了, 它 最终 但 这个 讲 的 有点 远, 那 最终 是不是 它 反而 有可能 是对 人的 取代, 或者 至少 是 比如 这个人 他是 有 个 工作, 他 现在 需要 自己 干你 这个 v boss 出来 以后 真的有 那么 厉害, 以后 他 就 不需要 自己 干 这个 活 了。
但 这种 到底 是 称为 是 取代 还是 增强 呢?
对, 就是 对于 老板 来讲 是 取代 是 吧? 对对对, 他 自己 来讲 是 增强, 他 万一 增强 到 足够 强, 老板 发现 不用 他 了 就 取代 了。 对, 是我 觉得 没 个 几十年 应该 是 达不到 真的。 对对对。
那么 厉害, 或者 技术 上 也 达不到 你说的 那种 程度, 对 吧? 但是 真的 到了 那个 程度 之后, 会 不会变 这样 我也不知道。 就 刚才 那个 点 我可以 稍微 再 补充 一下, 我 觉得 特别 有意思。 因为 我们 就 做了 两组 实验, 一组 叫做 need in haydock, 就是 你说 大海捞针, 就是 狭义 的对 我们 对 记忆 的 理解 来 测试 它的 方法。 然后 另外一个 我们 叫 reasoning and hate deck。 当然 这个 reasoning 可以 是 预测, 预测 也是 一种 推理, 吧? 也可以 是一种 决策, 或者说 是 比如说 信息 的 推荐 的 准确度? 这些 都是 里面 有 大量 的 推理 在 发生 的。
当我们 做 reasoning in his stack 的 时候, 无论是 rap 还是 长 上下文 都 做得 非常 差。 只有 一种 方法 可以 让 他 做好, 就是 通过 我们 设计 的 记忆训练 的 方法, 使得 他在 训练 的 时候 就 不断 的 形成 你说的 背后 的 那个 思维 框架。 然后 这个 思维 框架 的 形成 本身 已经 有 很多 预先 发生 的 推理 在 里面 了。 然后 在 瞬间 在 使用 这个 思维 框架 的 时候 就会 非常 准, 质量 就会 非常 高。 然后 很多 带 推理 的 人物 只有 这种 模式 能 完成。 所以 这个 给 了 我们 很大 的 信心。 就是 当我们 在 说 要 有一个 AI, 它 要 达到 一个 跟 人的 高度 alignment, 它 不可能 只 靠 那种 记忆 能力, 就 记住 的 能力 就可以。 他 其实 是一种 广义 的 记忆, 其实 它 这 背后 就 带有 学习 和 理解 在 里面。
对我 觉得 听起来 就是你 这个 是一个 非常 高精尖 的 一件事。 所以 你们 现在 在技术上, 底层 技术 算法 上 会有 很多 投入 吗? 有 为了 做 这件 事儿。
有。 因为 我们 从 成立 第一天 就有 一个 部门 叫做 universe research。 过去 两年 其实 我们 一共 发 了 大概 有 200篇公众 号。
下 回头 我 还有 200篇paper。
没有 原因 是因为 那个 时候 我们 没有 想 明白 个人 模型 到底 它的 技术含量 在哪里。 一开始 我们 觉得 是 agents, 但是 现在 的 这种 agents 其实 它是 偏 工程 的。 它 也可以 发 paper, 但是 它 其实 并没有 真正 的 科学 在 里面, 它 更 像是 工程 上 的 一些 操作。 通过 prom engineer, 但是 后来 我们 意识到 agent 他 没有 一个 从 记忆 当中 学习 的 能力, 他是 不 构成 真正 的 agents。 所以 我们 才 最后 变成 说 我们 要 research 团队 必须 要 去 真正 死磕 这个 问题。
对我 觉得 你 这 两个 词 用 特别 好。 就是 前 大多数 的 一阵子 其实 在 做 工程 的 事情, 对 吧? 但 你们 现在 这个 事儿 确实 是 有点像 科学。
有点 科学。 对, 至少 是从 科学 里面 借鉴 了 很多 思想, 比方说 脑科学、 认知科学。 因为 我们的 目标 是 不一样的, 这就是我 认为 大 模型 的 另外 一条 路线。 就是 OpenAI 他们的 大 模型 思路 是 我要 创造 一个 超级牛 的 公共服务。 然后 这个 公共服务 是一个 模型 可以 被 很多 场景 很多人 去 共同 使用 的。 然后 我 认为 大 模型 的 路线 更 靠谱 的 是 做 独立 的 个人 服务。 也就是说 每个 人的 模型 它 都 应该 不一样。 这样的话 我 才 可以 让 这个 模型 跟人 贴合 的 非常 紧, 它的 转化 效率 才 可以 转到 极限。
但 这个 模型 它的 底层 仍然 是一个 大 模型。
也就是 公共服务。 只是 它的 第一阶段 的 训练 只是 为了 获得 常识 和 基础 的 推理 能力。 但是 他 必须 在 上面 有一个 continuous 个人化 的 过程, 并且 这个 个人化 的 过程 是 持续 进行 的。 也 不是 就 一次性 做 完就 不做 了也 不是 每半年 更新 一次, 而是 理想 的 情况 是 每天 要 更新 一次。 就像 人 每天 要 睡 个 觉, 其实 睡觉 的 时候 发生 很多 学习。 那么 A I 我 觉得 至少 如果 能 达到 一天 训练 一次, 一天 更新 一次 的 状态, 这 才是 符合 个人化 alignment 的 一个 对我。
又 帮 你们 想 了 一个 场景, 我 觉得 可以 每天 给他 写 份 日报, 对, 说 今天 干了 啥, 今天 学习 了 啥, 然后 今天 你的 哪 方面 能力 有 长进 了 多少。 对, 有 做。 所以 为了 做到 这个, 我可以 理解 说 你们 现在 整体 的 这个 工程 上 的 设计 跟 其他 的 很多 公司, 包括 你们 自己 之前 都是 很 不一样的。 对, 包括 reg 也好, postion 也好, 还有 一些 什么 解决 它的 长短期 记忆 等等 这些 问题。 就是 你们 自己 设计 的 一套 很 不一样的 流程 和 东西。
对, 我们 依然 有 rag, 就像 我说 人的 记忆 里面 references 还是 很 重要 的。 但是 它的 内核 是一个 可 自我 进化 的 一个 模型, 但 这个 模型 现在 我们 没有 serve 给 每一个人。 目前 我们的 服务 能力 还 只能 提供 可能 非常 有限 的, 最多 不 超过 100个人 可以 来 不断 的 维护 他 这个 个人 模型。 不到 100个人 可能 就是 我们 希望 可能 说 的 酷 一点, 就是 未来 前 100个上传 的 职能。
它是 涉及到 训练 这件 事情。
涉及到 持续 训练。
所以 你 相当于 说 你 给 每个人 配 一个 小 模型 的 感觉。
对, 给 每个人 设计 了 一个 小 模型, 然后 它的 参数 是 持续的 被 围绕 他 自己 来 更新 的。
那 你可以 我 觉得 找 些 有钱人 一个人 收 他 100万。
对。
之前 有 听 友 兮 博客 讲 好像 他 收 什么 给 传记。 对对对, 那 这个 也可以。 对对对。
这个 应该 比 传记 更 有意思。 因为 如果 这个 模型 建立 好的 传记 应该 只是 这个 模型 的 一个 应用 而已。
一个 use case 随时 就 写 出来。
一篇 随时 写 出来 就是 已经 带有 这些 东西。 所以 你看 它 其实 它的 场景 会 很 有意思。 这就是我 认为 boat 世界 的 下半场。 为什么 我 是从 media bot 去 切入 呢? 就是我 认为 首先 你 得先 帮 每一个人 训练 一个 他 自己的 模型。 然后 上面 无论是 传记 或者说 餐厅 推荐, 这也是 一个 场景 对 吧? 或者说 是 约会 的 时候 的 推荐, 约会 的 时候 社交 的 连接, 它 本质 上都 依赖于 他的 理解。 你是谁 才能 帮你 选 更好 的 约会 对象, 才能 帮你 选 你 真正 想要 看 的 电影 和 餐厅。 所以 只有 这部分 的 资产 被 构建 出来 了, 我 觉得 上面 的 所有的 服务 会 围绕 着 他 去 有 一种 新的 形态 发展 出来。 要不然 他 今天 还是 给 真人 用 的那 可能 给 真人 用 的 最好的 方式 就是现在 现在 的 这种 方式, 这是我 很 害怕 的 一个 事情, 或者 我 很 担心 的 一个 事情。
所以 这个 就是 你们 从 一开始 的 mod O S 到 现在 一 box 的 这么 一个 过 核心 逻辑, 就是 其实 仍然 是 boat, 但是 你 做 的 是 我们 刚才 讲 供给 那 一端 的对, 供给 那 一端 更 偏 workflow 的 感觉 的 东西。 然后 你 发现 这个 东西 不是 最 核心, 不是 最能 改变。
这件 事 我 主要 做了 两个 比较 大 的 调整。 第一 是我 把 我们的 锚点 从 供给 侧 走向 了 个人 的 需求 侧, 或者 是 个人化。 第二个 是我 把 一个 脚手架 的 东西 变成 了 一个 可 持续 学习 的 东西。 但 脚手架 还在, 相当于 脚手架 是 外围 的 内圈, 它的 内核 把 它 变成 了 一个 可以 持续 训练 的 东西。
从 供给 到 需求 这个 体验 你 当时 怎么 想到 的? 这个 我 觉得 还 有点 神奇。
这个 非常 有意思, 它 很 微妙, 就 觉得 可以 好好 讨论一下。 我们 也 做 过 很多 用户 访谈, 就是你 认为 你 未来 每天 待 在一起 的 A I 它 到底 是一个 什么 定位, 什么 身份。 然后 我 有一个 逻辑 很 有意思, 就是 我们 可以 用 一个 名称 代词 去 指代 它。
有 一部 很 有名 的 电影 叫 her, 它 有点 像是 说 我 将来 的 这个 超级 应用 或者 这个 超级 A I 是一个 陪伴, 然后 以 陪伴 为 中心 我 再去 做 一些 事情。 但是 我是我 他是 他 还有 一些 人 说 我没有 陪伴 属性。 我 觉得 ChatGPT 有点像 叫做 him, 我是一个 很 理性 的 一个 男性 的 感觉, 但是 他 可以 帮 我 做 很多很多 事情, 就是 所谓 的 助理。 然后 你看 minos 最早 去年 的 时候, 我们 其实 做 的 是 them, 就是我 认为 一个人 需要 那么 多 不同 职业 的 AI 合在一起 来 构成 我的 超级 ai 但是 现在 你 要 问我, 你是 密 了, 我 觉得 是 密。 就是 我们 问 了 很多很多 人, 他 发现 我 最能 信任 的, 最 想要 构造 的 是一个 超级 自我。 无论是 自己是 来 帮助 我的, 还是 说来 记录 我的, 甚至 未来 是 来 代表 我的我 都 希望 我 对 他的 这个 所谓 的 介词, 就是 那个 人称 指代 的 锚点 是在 密 上。 这也是 为什么 我们 叫 media bot 这个 好像 让人 更有 信任感 一点。
然后 更 觉得 说 OK 这个 A I 因为 你是 赫尔, 你 后来 赫尔 电影 你 也 看到 过 每个 人的 贺, 最后 发现 他们 居然 是 同一个 是 被 那个 公司 控制。 但 如果 是 me, 我知道 他 跟 我 更 近。 如果我 最后 还能 以 某种 方式 让 你 产生 了 这个 me 的 personal model, 它的 资产 可以 被 个人化。 也就是说 创造 这个 应用 的 公司 都 无法 获得 的 时候, 我 觉得 人 就 更 愿意 去 拥抱 这样的 A I 最后 这个 所谓 的 A I 个人化 的 时代 才 可以 被 完成。
对我 觉得 你 这个 事儿 讲 的 绝对 是一个 下一代 的 既 A I native 又 super APP 又 入口 的 一个 东西。 这个 故事 绝对 是 非常 的 性感, 但 实际 录 到 产品 上, 或者 我们在 听 的 他 要 成为 用户, 我不知道 他 现在 脑子里 有没有 感觉 说 这个 产品 到底 怎么用, 是 能 帮 我 做什么。
这个 其实 就 涉及到 关于 这个 产品 最底层 在 满足 什么 需求 这样的 一个 问题。 我 首先 认为 其实 有一个 人类 很 底层 的 需求 是 被 过去 的 产品 忽略 的那 就是 人 需要 一个 空间 来 自己 跟 自己 发生 对话, 自己 跟 自己 来 相处。 因为 我们在 这样的 时间 和 空间 当中, 我们 可以 获得 很多 情绪 上 的 稳定, 然后 可以 获得 很多 知识 上 的 提升 和 反思。 我想 如 我 有一个 这样的 A I 产品, 它是 另一个自己。 它 本身 的 成长 和 存在 这件 事情 可能 对于 很多人 来讲, 就是 满足 他 这个 底层 的 需求 的 一种 方式。 在那 之上 当然 也会 有 一些 更加 落地 的, 更加 实际 的 一些 use case。
第一个 use case 还是 偏向 于 帮你 能够 记住, 并且 能够 自动化 的 整理。 你可以 把 各种各样 模态 的 想法, 对话 图片 拍下来 的 一本书 里面 的 一些 有意思 的 段落, 所有的 东西 都 可以 交给 他。 他们 会 尝试 去 第一 肯定 是 能 帮你 记住, 我们 有一个 非常 好的 搜索 功能。 第二 是 他 会 帮你 分门别类 的 去 整理 出 不同 的 topic, 甚至 可以 去 挖掘出 里面 不同 的 人。 他 会 知道 说 这场 对话 里面 有一个人 是 曲 凯, 然后 他 会 把 所有 跟 曲 凯 有关的 我的 记忆 可能 都 对应 到 这个人 底下, 是一种 对你 记忆 的 一个 很 好的 组织 和 找回。
第二种, 当我们 发现 非常 有意思 的, 其实 是 延展 或者 叫 启发, 什么 意思 呢? 就是你 有的 时候 比如说 我们 把 这 段 对话 丢 给 A I 其实 它 除了 帮你 记住 它 放到 一些 框 里面, 装 到 他 自己的 脑子 里面。 他 还会 尝试 把 这 段 新的 记忆 和 你 原来的 历史上 的 所有的 记忆 去做 碰撞。 然后 他 会 做 connecting the dots, 然后 他 会 突然 告诉 你说 去 看 这个 东西。
其实 还有一个 很 有意思 的 理论, 跟 你 今天 讨论 的 这个 话题 有关。 或者说 你 今天 聊 的这 段 东西 和 你 上次 跟 另外一个 创业者 聊 的 他 这个 理念 是 非常 像 的。 这个 像 的 地方 在哪里?
这种 延展 我们会 发生 在 两个 阶段。 第一 是 当你 新 产生 一段 记忆 的 时候, 它 会 马上 给你 一种 延展。 第二 是你 每天 早上 起来 九点钟, 我们 会给 你 发 五个 延展。 这个 延展 就 意味着 什么 呢? 就是 他 会 借 你 昨天 以及 过去 更 长时间 的 记忆, 用 一个 晚上 的 时间 去 思考。 然后 早上 告诉 你说, 我想 了 一下, 我 觉得 这里 有一个 新的 东西, 有 一家 新的 公司, 你 去 看一看, 跟 你 这 两天 在 关心 那个 问题 会 很 像。
所以 现在 你 每天 你 会 有意识 的 很 多次 打开, 然后 包括 开会 什么 录音, 然后 喂 数据 对 微。
数据 我 有 几个 目的, 一方面 当然 我 本身 作为 创始人, 我 肯定 要 训练 我自己 的 模型, 对 吧? 我 用了 三个月, 大概 有 1500条 机 逻辑, 一 长 到 可能 是 一段 3个小时 的 谈话, 大概是 在 两三百 万个 token。 如果 全部 变成 文字 来 处理 的话, 就是 两三百 万个 token 其实 已经 非常 多了。 就 相当于 人 一年 左右 的 真实的 记忆 的 数据 的 token, 应该 是在 1000万token 到 1亿token 之间 有效 token。 另外 我 当然 因为我 跟 太多 人 聊 了, 我需要 A I 帮 我们 记住, 这个 是 也是 一个 需求。 但 同时 我 也会 在 有些 情况下, 我会 主动 跟 他 发起 聊天, 或者说 我会 去看看 A I 主动 给我 推 的 内容 是什么。 我们 有一个 区域, 就 刚才 讲 的 那个 主动 推送 区, 他 就会 突然 给 我说 一句话, 说 这个 就是 反正 跟 我 结 后 的 记忆 会 突然 给我 做 一个 延展。
明白。 对。 但 最后的 结果, 我在 想, 就 比如 用户 大家 都在 用, 用了 几年 特别 懂 自己 了。 然后 so what 就 最终 的 结果 会 是什么?
就 他 理论上 来讲, 他 给你的 启发 和 决策 应该 是 越来越 高质量, 越来越 你 觉得 是 这就是我 需要 的。
明白。 所以 你 觉得 v box 做到 最后, 它 会 是一个 什么样 的 产品?
我自己 是 觉得 他 有 机会 能够 成为 未来世界 的 一个 超级 入口, 或者说 叫做 super APP。
对我 觉得 你 这个 东西 如果 真 做成 了, 它 就 不 只是 实际 的 超级 入口, 它 就是 一个 世界。 对, 但是 这个 是 更 长远 了。
你看 它 上面 的 生态 会 和 它 一起 构成 这个世界, 那个 就是 很大 的。 你 甚至 可以 理解 为 互联网 的 下一代 应该 是以 密 box 为 入口, 然后 带有 很多很多 其他 报纸 所 形成 的 一个 共同 的 网络, 就是 下一个 互联网, 这个 就会 非常 大。 我 其实 背后 我也想 过 这个 问题, 就是 为什么 有 一些 应用 可以 成为 超级 入口, 有 一些 应用 它 只能 成为 一个 工具, 吧? 它 不能 构建 生态, 其实 是 很 有意思。 比方说 我们 现在 在 说 的 这个 超级 入口 大类 上, 其实 就 两类, 和 其他人 在 研究 就 两类。 第一类 是 基于 社交 的, 典型 的 就是 微信微信 和 可能 facebook, 第二类 是 基于 内容。 然后 我 为什么 觉得 这 两个 他 后来 能 成 呢?
我 后来 在 思考 一个 问题是 它 本质 上 是 跟人 本身 有个人 他 本身 的 数据 的 类型 有关。 就是 一个人 本身 的 数据 大类 上 来讲 只有 三份, 一份 是什么 呢? 就是说 我们 自己的 体验 的 数据, 你 自我 对话 的 部分, 或者说 是你 在 外面 散步 的 部分, 就是你 看到 的 这个 环境 里面 的 你 体验 得到 的 这些 经历 的 部分, 这是 一份 数据。 第二份 数据 就是 你的 社交 链接, 以及 在 这些 社交 连接 上 的 内容。 比如 我们的 谈话, 然后 聊天, 这个 就是 社交 的 数据。 第三 部分 就是 我们 自己 获取 外部 的 内容 的 数据。 比如说 古代 的 时候, 人们 没有 抖 音 可以 刷, 但是 可以 看书, 人 可以 看 戏剧, 对 吧?
人 可以 听 音乐, 听 戏曲, 它 其实 都有 这些 数据, 它 就是 他 消费 外部 的 内容 的 这部分 数据。 但是 原来的 这个 互联网 时代, 是 把 后面 两 部分 数据 非常 好的 给 数字化, 他 没有 把 个人 的 记忆 给 很 好的 数字化。 然后 由于 这 两 部分 数据 太 重要 了, 使得 它是 人 最 基本 的 需要, 社交 的 需要 和 内容 消费 的 需要。 然后 在 这些 需要 上 我 就可以 长出 以 这些 需要 为 起点 的 一些 生态。 所以 你 会 发现 社交 上面 也可以 买东西, 在 内容 平台 上 我 也可以 买东西, 我 社交 上面 可以 看 内容, 内容 上面 我 可能 也 还 可以 去 社交, 吧。 就是 它 都有 作为 入口 的 潜力。
那 今天, 我是 觉得 ai 时代, 如果你 还是 在 做 满足 说 内容 和 社交, 我想 作为 创业 来讲, 你 可能 还是 有 很大 挑战 的。 因为 内容 社交 已经 有 几个 非常 厉害 的 巨头, 他 也 想要 做 A 化 的 转型。 但是 有 什么东西 是一种 新的 数据, 带有 了 一种 新的 和 技术 的 互动 的 模式, 从而 有 机会 带来 一种 新的 生态 的 可能性 呢? 其实 就是 个人 级。 当你 把 个人 级 数字化, 然后 你 用 共生 的 方法 去 跟 他 交互。 最终 这部分 个人 记忆 相当于 你 自己 在 体验 人生 的 过程 当中, 它 成为 了 面向 别的 服务 和 内容 的 一个 入口。 我 觉得 这个 是一个 非常 可能 是一个 万 亿美金 的 机会。
但 这里 我 就在 想 这个 个人 记忆 到底 是 他 主动 还是 被动 的? 如果 让 他 需要 他 主动 记忆, 就 主动 跟 你 不去 互动。 对, 其实 这个 门槛 还是 有点 高, 对 吧? 如果 是 被动, 其实 现在 好多 比如 A 眼镜 什么的, 其实 就是 想 往 这个 方向 去 走。
是的, 它 最终 以 所谓 共生, 它 一定 是 带有 很强 的 被动 属性, 就是 always on 的 属性。 但是 我 觉得 这个 问题 并不是 一个 很 困难 的 问题。 我 觉得 两年 内 这个 主动 和 被动 主动性 的 记录 的 这件 事情 就可以 有 很 好的 解决方案 可以 解决。 那 我看 我们的 重点 其实 还是 一家 希望 去 在 这 里面 构建 模型 的 公司。 给 每个人 去 构建 他 自己 个人 模型 的 资产, 去 构建 他 个人 模型 的 基础设施。 这 其实 是 我们 擅长 的 东西, 而 不是 擅长 在 做 硬件 上。
所以 说到底 我 才刚 明白 你们是 一 最后 可能 是 一家 个人 小 模型 公司, 有点像 一个 什么 基因 克隆 公司 那种感觉。
对对对, 其实 我们的 目标 是 成为 这样的 一家 公司, 做 一个 上传 智能 公司, 或者 叫 基因 智能 克隆 公司。
所以 理论 来说 现有 的 它的 很多 社交 的 那些 数据, 以及 未来 如果 真的 每个人 有什么 眼镜 之类 的, 就 这个 到底 是不是 你们 做对。 如果你 能 接到 这个 数据 接口。
其实 也 O K 对, 就 我们 真正 在 尝试 构建 的 核心 竞争力 是 这个 K 那 现在 我们 需要 通过 一个 自己的 应用, 甚至 自己的 一个 硬件 去 打样, 对 吧? 然后 这是 他的 上半场, 就是 要把 记忆 拿 进来 训练 出 这个 模型。 他的 下半场 是当 每一个人 拥有 了 一个 他的 个人 克隆 智能 的 时候, 那 他 怎么 在 这 上面? 假如 全世界 有 一亿人 有 这个 克隆 智能, 那么 他 一定 会 有人 来 为 这样的 克隆 智能 做 生态。 做 社交 的 生态, 做 社交 的 应用。 比如说 基于 个人 模型 的 社交 应用, 基于 个人 模型 的 服务, 基于 个人 模型 的 一些 场景 化 的 玩法, 都 会有。 这时候 就会 需要 有 一些 很强 的 生态 的 能力。 我 也不 觉得 今天 我们 公司 有 这样的 能力。
这里 有 个 问题, 就是 最终 你 觉得 这个 个人 模型 它 到底 是一个 分散 的 还是 一个 集中 的。 就是现在 你说 字节 它 肯定 有 很多 数据, 对 吧? 然后 腾讯微信 也有 很多 数据。 对, 你可以 理解 成 我们 现在 每个人 已经 有 很多 类似 这样的 一些 米 bot, 它 分散 在 各个 不同 的 公司 里面, 对 吧? 可能 是以 各种 标签 的 形式 存在 的对 那 最终 这个 东西 到底 是 应该 被 合 起来, 还是 其实 它 仍然 会 是一个 分散 的 状态。 比如说 你 刚才 讲 的, 我 如果 有一个 更好 的 个人 的 模型, 我 就可以 更好 的 用 它 去做 相亲 和 匹配 对 吧? 但 也有 可能 有个人 他 就是 先 把 相亲 匹配 做 起来 了, 我就是 有你 这块 的 数据, 然后 我 也可以 专门 做 一个 只 用于 相亲 匹配 的 一个 小 模型。 对, 这 两种 情况 我不知道 你 有没有 思考 过 后面 会 怎么样。
其实 倒 不是说 没有 思考 过 这个 问题 是一个 很 有 价值 的 问题。 尤其是 在 涉及到 社交 和 内容 消费 的 时候, 其实 他们 两个 数据量 并 不小, 它的 数据量 也是 比较 大 的。 但是 我 最后 选择 的 是 说 人 对于 有点 像是 人 自我 对话 的那 部分 数据, 就 相当于 我 记录 日记 的 条 线, 再 配合 上 我们 线下 的 谈话 这种 线下 数据 是因为 这 两 部分 数据, 首先 他们 这些 平台 没有 很 好的 补货, 这 是一种 新 数据, 那 我 肯定 要 从新 数据 开始。 第二 是我 认为 这些 数据 更能 代表 要 一手 的对, 更 一手 更 自己的。 所以 我在 这些 数据 上面 给 我这个人 模型 创造 一个 更好 的 底座。
是 他 更 一手 的, 也是 更难 被 记录 的。 对他 之所以 现在 没有人 做, 就是 更难 被 记录。
对当 这个 更 一手 的 数据 形成了 一个 很 好的 个人 模型 的 底座 了 之后, 这时候 假设 说 它 上面 有一个 它 这个 模型 me bot 有一个 跟 内容 平台, 比如 跟 豆瓣 去 连接 的 能力。 他 把 豆瓣 的 信息 通过 个性化 去做 推荐? 然后 给 到 这个 用户。 那 这时候 其实 你是 借助 外面 的 生态 去 补充 了 那些 明白 在 场景 里面 的 个人 数据 合理。
就 有点像 我 总 觉得 手机 有的 时候 在 窃听 我 说话? 今天 我们 聊 的 一个 什么 品牌, 然后 哪个 平台 就 推 了。 对, 有点 这种 感觉 对 吧? 只是 说 你是 可以 他 主动 的 批量 的 更多 的 实现 这种。 比如 我们 今天 聊 了 这么 多 东西, 可能 如果 真的有 这么 一个 模型 跟 各个 平台 连 起来, 那 晚上 我 就能 刷 到 各种各样 的 东西 了, 对 吧? 或者 可能 直接 用 你 刚才 说 的 两种 记忆, 这个 东西, 可能 晚上 有 个 平台 就 推 文章 给我 了。
对对对, 如果 真的 能 到 这 一步 的 体验 就 很 好了, 能 做到 我我我 知道 能 做到 是 能 做到。 我说如果 真的 整个 互联网 生态 能 到 这 一步 了, 对 吧? 对对对, 得 你 先 做 强 了让 他们 接 你的。
对, 所以 我 觉得 先 应该 做个人 的 部分, 我的 判定 是 五年 内 这个 个人 的 部分 就 会有 几家 公司 冒出来。
是 就 我们 刚才 讲 一个 场景 了, 你可以 先 就是 先 在 密报 内部 自己 去 实现。
对对对, 你 讲 的 是个 下半场 吗? 我 觉得 下半场 会有 极大 的 想象力, 所有 东西 都会 被 重构。 但是 先 要把 上半场 做好。
是 然后 这 一切 的 根源 就是 报 的 是 A I 最小 单元。 对, 然后 你 觉得 个人 的 报 的 会 是一个 最 重要 的 主体。
对, 至少 是 第一阶段 应该 去做 的, 而 不是 等到 先 把 生态 有了, 然后 个人 的 再 才 慢慢 起来。 我 觉得 逻辑 是 反 着 的对。
然后 最后一个 问题 就是 未来 你的 每个人 个人 的 一个 模型 会 是 怎样 的 一个 关系。
现在 我们的 电脑 它的 模型 就 跟 这个 电脑 的 硬件 是 绑定 的, 但 我 觉得 可能 未来 的 这些 设备 更多 的 就是 提供 一个 显示。 就是 你走 到 哪, 你 比如 你 开车, 然后 你 看电视, 你 可能 也会 跟 电视 说 一些 东西, 然后 你 跟 这个 电脑 工作 的 时候 也会 用, 然后 手机 可能 到 哪天 会 用, 然后 手表 可能 晚上 还会 监测 你的 睡眠。 就是 它 可能 会 慢慢 形成 一个 脑子, 是一个 同样 的 脑子, 你 会有 很多 句 很多 具 不同 的 身体, 每个 设备 就 像是 它的 一个 身体。 甚至 未来 现在 人形 机器人 这么 火, 人形 机器人 背后 的 这个 脑子 可能 也是 这个 脑子, 这个 A I 形成 脑子。 它 没有 一个 实体, 但 他是 和 你 形成了 一种 共同 的 你的 人的 边界。
如果 真 到 这 一步, 感觉 得 国家 来做 这件 事儿, 对, 就 有点像 天网 要 被 监管。
他 太 敏感。 我不 觉得 这个 东西 应该 掌握 在 任何 一个 私营企业 的 人手。 所以 我说 了, 如果 哪一天 我可以 为 这件 事情 做 一点 infer 的 工作, 里面 有 一块 生意 是我 来做 的 就可以 了。 可以。
陶 局长。