用 声音。
碰撞 世界。
生动活泼。 欢迎来到 我是 next 科技 早知道 第八 季, 和 全球 创新 第一 时间同步。 Hello, 大家好, 欢迎来到 我们 今天 的 科技 早知道。 今天 这 期 节目 我们 不是 在 平常 的 我们 自己的 办公室 里面 录 的, 今天 我们是 在 虎 嗅 的 F M 创新 节 快 箱 真空 的 一个 玻璃房子 在 录 今天 这 期 播客。 今天 这个 节目 是 他们的 F M 不 停播 的 一个 视频 播客 间。 这 期 节目 我们 除了 是在 我们 自己的 渠道 里面 播出 之外, 然后 也会 制作 成 视频 放在 胡 秀 的 视频 号 和 他们的 小宇宙 账号 上面 来 播出。 因为 我们是 在 现场, 可能 背景 的 声音 还是 有 一点点 大 的, 我会 尽量 停顿 一下, 克服 一下 哈那 我们 今天 的 嘉宾 还 蛮 特别的, 是 我们 彩云 科技 的 创始人 以及 C E O 袁 新远。 Hello 新源。
hello 丁, 我是 彩云 科技 的 C E O, 今天 很高兴 跟 大家 聊天。
因为我 今天 有点 感冒, 有点 不太 舒服, 所以 我 把 跟 我们的 兼职 雅 贤 一起来 跟 我们 来 聊 这 一期 节目。 Hello 雅 贤, 大家好, 我是 雅 贤。 其实 最近 一个 新闻 是 出来 是 说 彩云 做了 一个 叫做 former 的 新的 大 模型, 而且 它的 效率 其实 比 transformer 要 高出 1.7到2倍。 刚刚 看到 这个 新闻 的 时候, 我自己 其实 是 不相信 的。 我也 去 问 了 身边 的 朋友, 其实 还是 蛮 想 直接去 采访 一下。 挺 远 的, 我 不知道为什么 彩云 要 做大 模型, 我们 应该 很多 听众 都是 这个 彩云 天气 的 用户。 我 帮 我们 讲一讲。 为什么? 因为 创业 也 蛮 久 了, 有 十 来年 了。 为什么 又从 应用 又 做到 了 大 模型, 又 开始 从 底部 开始 做起 呢?
这是 大家 对 我们的 误解。 因为 毕竟 你看 一个 APP, 你 只能 看到 它的 表面 和 可。 大家 都 觉得 我们是 做 天气 APP 公司, 但 实际上 不是 的。
我们是 一家 做 模型 的 公司, 我们 第一版 发 的 是一个 气象预报 模型。 因为我 是 擅长 做 算法 的, 是 算法 起家 的, 小时候 也就 一直 喜欢 搞 人工智能。 但是 你 搞 人工智能 这 有点 太空 了, 对 吧? 那个 时候 其实 觉得 这 东西 根本 就 做 不 出来, 也 卖 不了 钱。 就 是从 梦想 一步步 做起, 你 得 把 自己 养活, 这个 是我 觉得 也是 我 一个 特色, 我喜欢 做 一些 能 挣钱 的 东西, 验证 我的 东西 确实 有用, 也 获得 一些 社会 成就感。 所以 我 就 做 把 计算机视觉 的 模型 的 这样的 一个 技术 用 在 了 天气预报 上。 所以 这是我 做 的 第一个 项目。
在 这个 过程中 其实 一直都在 做 基础 模型。 当时 我们 也 做了 LSTM, 它 本来 是 做 机器翻译 的, 我们 把 它 用 在 了 雾 霾 预报 上。 这 15年 做 的 模型, 然后 到 17年 的 时候 我们 做了 彩云 小艺。
你说 我们 有什么 自 研 模型? 其实 因为 那个 时候 没有 那么 多 开源 模型, transformer 也没有, 所以 我们 只能 是 自 研 架构, 就是 我们 要 去 解决 我们 要 解决 的 问题。 但是 这个 世界上 没有 我们 需要 的 算法, 所以 我们 自己 去 研究 一个 算法 来解决 我们 要 解决 的 问题。 这是我 司 的 style。 所以 并不是 像 大家 可能 外界 认为 的, 我们是 一个 做 应用 的 公司, 突然有一天 开始 做 模型 了。 其实 真实情况 是 我们 一直 是 做 模型 的 公司。
这个 其实 也是 我们 一直 最大 的 一个 疑惑。 因为 可能 感觉 这 一波 投 大 模型 都 已经 过去了, 然后 有 六 小虎 出来, 大家 就 很难 会 把 彩云 放到 一个 什么样 的 一个 坐标系 里面。 又 看到 了 前两天 这 篇文章。
其实 我们 一直 是在 做 模型 的 公司。 只不过 我们的 风格 是 我们 不 喜欢 跟风, 我们 喜欢 做 创新。 所以 当 大家 都在 做 transformer 的 时候, 就是 把 国外 的, 比如说 lama 拿 过来 翻看 一下, 或者 是 把 transformer 的 论文 拿 过来, 用 同样 的 结构 配 上 中文 的 数据。
这个 不是 彩云 想做。
的这 不是 我们 想做 的。 我们 不想 要花费 巨额 的 上 千万美元 的 钱, 然后 只是 做 一个 复现 别人 的 工作。
那个 角度 来讲, 是不是 其实 你 已经 经过 了 这样的 阶段 了。 因为你 开始 也 想做 模型, 但是 做 完 模型 之后, 最后 还是 得 做 应用, 你 还是 得 赚钱。 所以 你是不是 已经 算是 比 别人 跑得快, 起码 是在 商业模式 和 思维。
上面 有 能够 赚钱 的 业务, 这是 跟 别人 不太 一样的 东西。 所以 我们 有 一些 空间, 就是 可以 去做 一些 纯粹 的 研究。 你 其实 要 解决 的 问题 不是说 你 要 出 一个 模型, 你 在 市场上 有 多少 认知。 而是 智能 到底是什么? 为什么 我们 可以 用 一些 Q K O V 据 神经网络 矩阵, 它 就 能够 做出来 神奇 的 效果? 编程, 为什么 之前 你 跟 siri 对话 他 都 像是 人工 智障, 现在 你 跟 ChatGPT 聊天 他 就可以 了。
这 中间 我 有什么 变化? 为什么 是 这样? 如果你 把 它 当做 一个 黑盒 去 玩耍, 去 使用, 这是 一拨 人的 想法。 但是 另外 还有 一拨 人的 想法 是, 既然 我 一直 都是 做 模型 的那 我 或者 我们 公司 是以 模型 见长 的。 那 我们 就 应该 想 一些 出行 不是 要 提高效率, 做 新 模型 初心 是 先 搞 明白 现在 的 模型 是 怎么 回事儿, 再 搞 明白 探究 这个 科学 问题 的 时候, 就是 意外 的 发现 这个 模型 它 里面 可能 有 一些 部分 是 这么 工作 的那 如果 再 改一改, 它的 工作效率 会不会 更高? 这样 就 做了 一个 E C former 的 缘起, 我们 也 现在 又 投 了 一篇 新的 论文, 是 关于 纯粹 的 分析 这个 transformer 是 怎么 运作 的。 可能 大家 觉得 他 没有 什么 价值, 但是 它 在 科学 上 是 满足 了 我们的 好奇心。 所以 我们是 一家 好奇心 驱动 的 公司。
为什么 大 模型 可以 运转? 因为你 如果 把 它 拆开 看, 它是 一层 一层 的 神经网络。 但 一层层 神经网络 很少 有人 去 关注 内部 是 怎么 回事儿。 我要 问 一个 问题, 比如说 上海 的 简称 是什么? 他 回答 是 who 对 吧? 那 它 里面 肯定 有一个 搜索, 还有一个 映射 的 过程。 那 这个 搜索 映射 的 过程 它是 怎么 就 一步一步 做出来 的?
里面 可能 就有 几种 东西。 比如说 查找 数据库 的 检索 向量 的 变换。 有 一些 是 常识 的 知识 是 存在 模型 的 mlp 层 的, 就是 一个 多层 感知机 的 层。 有 一些 查找 的 内容 是在 mutilate attention 里面 的 所谓 的 自 注意力 层。 你 通过 这些 你 就能 动态 的 调节。
比如说 你 发现 这个 模型 的, 比如说 有 幻觉 问题, 那 可能 他 对于 一些 知识 记得 不 牢固。 那你 会 发现 其实 它 是因为 mlp 层 的 数量 不够 多, 相当于 它的 常识 数据库 不够 多。 那 我们 把 这个 常识 数据库 就可以 给 它 扩展, 那 它的 效果 就会 变 好。 但是 他 虽然 常识 变 好了, 但是 他的 推理 能力 不会 增加。
推理 能力 又是 怎么样 完成 的 呢? 第一步 A 等于 B B 等于 C C 等于 D A 等于 1, 所以 D 等于 一。 这 当中 有一个 跳转 的 一个 过程。 每 跳转 这么 一个 过程, 你 就要 消耗掉 一层 至少 一层 神经网络 的 变换。 所以 跳转 的 过程 是 由 神经网络 的 层数 决定 的。 所以 推理 的 过程 是 由 神经网络 的 层数 来决定 了。 它的 上限 就是 单 次 inference, 一个 token 的 推理 过程, 多次 inference 的 推理 过程 可以 联合 在一起, 这样 我们 可以 延长 它的 推理 过程。
当然 我说 的 有点 专业, 总之 就是 这个 东西 在写 proud 的 时候 就 很 有用。 你 就 知道 这样 一个 模型 事实 问题是 怎么回事, 它的 推理 问题 又是 怎么 回事儿。 同时 了解 了 这些 之后, 比如说 我们 在写 prompt 的 时候, 给 大家 一个 tips, 显然 是 让 他 少 跳。 比如说 你 问 的 一个 问题是 这 篇文章 最后 一段 的 女主角 的 想 的 什么? 那你 就 不要 这么 问问题, 你 要 问 你 把 女主角 直接 写 出来。 比如 那个 比如说 小林, 你 就 写 小林 心里 想 的 是什么, 就 比 你 刚才 说 的 那个 要 效率 要 高。 少了 好几个 逻辑推理, 你 就 知道 原来 大 模型 应该 这么 用。 所以 这就是 我们 做 这种 工作 的 意义。
我 觉得 比较 焦虑 的 公司 很难 做到 的。 假设 我 拿了 10亿美元, 那 我 现在 是不是 需要 给 大家 一些 result, 两年 过去了, 那 十亿美元 变成 多少钱? 这是 有 很大 压力 的。 你 不能说 10亿美元 我 就 搞清楚 了, transformers 内部 这是 怎么 跳转 的, 好像 是 有点 说不过去。 我需要 有 D A U, 我要 有有 收入, 我要 给 大家 一些 东西 看。 但是 像 我们 这种 可能 前面 有 一些 积累, 我们 自己 挣 了 一些 钱, 当然 也有 投资人 的 支持。 在 这种 叠加 的 之下, 我们 就 没有 那么 的 焦虑, 所以 能够 更加 潜心 的 去 研究 这个 东西 究竟 是 怎么 回事儿。 所以 就 能够 做出来 比 别人 做 的 效率 提高 更多。
因为 大家 听起来 传送 了 两倍 好像 不多, 大家 都 是什么 十倍、 百倍、 1万倍。 但是 层面 不同, 就是你 不是 在 底层 结构 上 做 的 修改, 底层 结构 上 所做 的 这种 模型 结构 的 修改。 过去 七年 大家 全部 加在一起 的 有效 的 修改 是 非常少。 几乎 可以 说是 比如说 也就是 不到 50% 的 提升。 然后 我们 一把 做到 了 百分之百 的 提升, 而且 我们 后续 还能 接着 往 下, 这条路 打通 了 之后, 我们 可以 接着 往 下 做用 7B的 参数 实现 14倍的 效果, 听起来 不错, 那 其实 你 也可以 考虑 这 7B的 参数 就可以, 比如 实现 21B 的 效果, 那 会 更好 对 吧? 那 我们 就 省 了 很多。 最终 这条 走下去, 就是 开启 了 一个 新 赛道。 大家 原来 觉得 这个 东西 是 不可能 实现 的, 大家 所有人 都 是在 transformers 上 做。 大家 去做 的 东西 无非 就是 参数 多一点, 数据 多一点, 算 力 多一点。
卷 的 是 这个 东西。 大家 好像 现在 基本上 卷 的 是 算 力 和 数据, 但 好像 没有 特别 多 的 人 在 从 这个 模型 去。
其实 说到 这儿, 我 还有一个 问题, 就是 关于 这 模型 我 其实 想 比较 明确 一下, 就是 咱们 这个 D C former 模型 是 跟 transformer 是 完全不同 的 两件 事儿 吗? 还是 说 其实 我们 还是 借鉴 了 一些 transformer 的 一些 idea, 然后 从 那个 上面 build up 一些。
是一个 味儿。 对, 是一个 build up。 就像 传输 word 它 也是 在 比如 残差 神经网络, 它 也是 一个 最 基础 的 东西, 叫做 文本 神经网络 优化。 做 的那 篇 论文 就是 他在 90年代 的 时候 写 的 神经网络 分析 文本。 2一二年 的那 篇 论文, 他 也是 用 神经网络 去 解析 预测 下一个 单词 是什么。 这些 是 transworld 工作 的 基础, transformer 是 我们 工作 的 基础, 我们 在那 上面 就 做了 一些 改动。
对, 然后 我 下一个 问题 其实 也是 跟 这 模型 有关的, 就是 咱们 这个 模型 其实 它的 performance 其实 是 多方面 的。 咱们 说 的 1.7到2倍 的 提升 是 这种 完全 全方位 的 提升, 还是 说 可能 是在 我们 已有, 比如说 像 咱们 彩云 有 天气, 或者说 是 这个 网文 续写, 是在 这 一个 细分 赛道 上 的 提升 的。
不是, 是 全方位 的, 它是 一个 基础 结构 的 更改。 甚至于 它 甚至 可以 用 非 文本 上面 video translation 的 都是 可以 的。 就是 所有 用到 了 自 注意力 层 的 东西 都 可以 用上, 这 是一个 非常 底层 的 东西。
那 我 就有 个 哪 一 我的 问题。 刚才 大家 也 说 就是说 这种 大 模型 公司 都要 卷 算 力, 然后 要 卷 钱 是 吧? 你 像 咱们 彩云 可能 是 属于 一个 还是 比较 初创 的 这么 一个 公司。 那 为什么 没有 拥有 那些 钱, 那些 算 力 却 能 做出来, 那些 大公司 都还没 做出来 呢?
觉得 科技 的 进步 不是 完全 靠 钱 来完成。 如果 是 这样的话, 就不该 是 OpenAI 做出来, 而 应该 是 google 或者 microsoft 做出来。
穿梭 八字 基本上都 出来 了, 他 也没有 在 google 留 着。
对你 不能说 这个 世界上 钱 就 解决 了 是 一切。 但是 你 毕竟 你 比如说 你 要 做 这个 事儿, 你 有一个 入场券。 即使 没 这个 门槛, 实际上 这个 世界上 也有 各种渠道。 创业 是 什么的 东西? 创业 是 发挥 自己 所 能 去 解决 不可能 解决 的 问题。 比如说 就是我 当时 在 搞 天气预报 的 时候, 我 是不是 中国气象局 的, 我 其实 是 没有 基础 数据 的。
对, 这个 也是 我的 问题。 我在 跟 同事 聊 的 时候 就 还 挺 意外。
但是 我们 就是 排除万难。 比如说 我 就会 写信给 中国气象局 的 人, 我会 去 领导 办公室 敲门, 我是 一无所有, 就是 去 尝试。 我也 从 网上 扒 数据, 我 想办法 去 尝试, 要 想 解决 我 解决不了 的 问题, 这 才 叫 创业, 而 不是说 一切 万事俱备 都 给你 了。
像 算 力 这种 东西, 我 联系 了 google 的 开发者, 他 帮 我 联系 了 google 的 tensor pro research a cloud。 你 就 写信 去 申请, 就是说 我们 想做 什么什么 研究, 当时 就 给 我们 免费 批 了 一批 算 力。 甚至于 比如说 我 学校 是 或者 我的 投资方 可能 有 一些 闲置 的 显卡, 那 我们 就 去 找 看 这个 东西 能 不能用 上。 它是 取决于 一个 你的 主观能动性 和 你 有的 钱 之间 的 一个 权衡。 所以 不完全 是你 一定要 有钱 才能够 去 创业。 我 觉得 这个 是 对于 创业者 而言, 显然 不是 这样的。 就是 我们 原来是 去求 各种 算 力, 现在 我们 可以 用 一些 钱 去 采购, 这个 就 比 原来 好 一点, 然后 我们 能 做 的 事情 就 又比 原来 多一点。
大家 都说 百亿 级 模型 或者 是 千亿 级 模型, 那 我们 先 做 个 10亿级 模型 看一下 对 吧? 或者 我们 先 做 一亿 级 模型, 那 我们 做 完 之后 我们 发现 它 有 效果, 我们 肯定 是 先 在 1亿级 的 模型 上 证明 有 效果, 然后 在 10亿级 模型 下 证明 有 效果, 再到 百亿 级 模型 上 证明 有 效果。 所以 你 一步步 做 过去, 一开始 你 就 不用 花 那么 多 钱, 然后 你 就 发现 这个 事情 好像 是 有点 搞头。 你 有了 信心 之后, 你 就可以 去 找 投资人 说。
你看 O B A 也是 开始 这么 做 起来。
就是 一步一步 走 的。 你 作为 一个 创业者, 你就是 需要你 去 搭 一个 台阶, 然后 把 这个 事情 一步一步 的 往 上。 比如说 我们 现在已经 证明 了 百亿 级 模型 型 的 参数 量级, 实际上 我们 这个 东西 是 work 的那 下一步 我 就 证明 千亿 级 的 是 work。 那 如果 用 千亿 级 的 模型 能够 做到 万亿 级 模型 的 效果, 那不就 GPT4 就 做出来 了 吗? 如果说 我 万亿 级 的 模型 做到 了 10万亿级 模型 的 效果, 那 GPT5 不就 有了 吗? 这就是 一步一步 往 上 攀登 的 一个 过程。 对。
当然 咱们 要不要 聊聊 关于 scaling law 见 顶 这件 事情。
我们 来看 可能 我们的 背景 上面 也 写。
的 是因为 最近 几家 大 模型 公司, 包括 像 anas opic, 然后 包括 OpenAI 他们 最新 的 模型 都 出现了 说 最新 模型 不及 预期 的 这种 情况, 都在 推迟 对 吧? 对对对, 都在。 然后 就 好像 光 堆 算 力, 或者说 是 光 堆 参数 好像 有点 不 太行。 不知道 行远 怎么看 skal 见 顶 这件 事情, 或者 是对 咱们 这个 模型 训练 的 一个 影响。
你 就 想想, 因为 这个 世界上 的 数据 它是 有限 的。 就是你 把 互联网 上 全部 的 数据 都 拿到, 你 去 训练 你的 模型。 那你 训练 出来 的 东西 它的 size 总是 有一个 限度。
然后 还有一个 就是 能耗 的 问题。 有人说 现在 的 大 模型 已经 耗掉 全球, 不算 是 8% 还是 5% 这种 真的, 反正 百分之几 是 肯定 是 有了你 你 想想 如果说 我们的 参 数量 扩大 十倍, 我们的 数据量 扩大 十倍, 这 两个 是要 乘 的, 就是 相乘 就是 扩大 100倍。 那 假设 我们 原来是 5%, 那 我们 就 需要 500% 的 这种 乘以 100 500% 的 这个 能量 来 训练。 问题是 地球 上 的 能量 现在 就 百分之百, 就是你 要 用 五倍 现在 地球 上 全部 的 发电量。 这 两个 都 是一个 目前 遇到 的 瓶颈, 这个 瓶颈 怎么 解 呢? 就是我 刚才 提 的 就是 你 除了 这个 数据 和 算 力 之外, 还 有一条路 就是 模型 结构 优化。
因为 我们 今年 其实 做 过 可控 核聚变, 专家 是 说 了 可能 还得 三五十年。 然后 我们 其实 这 两天 还在 做 一个 选题, 是 光子 芯片 的 对光 算 力 芯片。 但 感觉 其实 如果 真的 能 产业化 的话, 可能 也得 十 来年。
他 也 认识 一些 光 算 力 芯片 的 朋友啊, 还有 我也 去 合肥 托卡马克 实验室 参观 过, 我也 发现 好像。
不是 那种 都 没有 那么 快。 对, 所以 您 觉得 还是 从 底层 的 模型。
的 底层 模型 改进 很快, 就是你 同样 的 参 数量, 你 能够 获得 十倍 的 推理 能力, 那 你的 整个 系统 的 提升 空间 就会 就 比来 大 很多。 大家 要 知道 智能 的 来源 是什么? 比如说 你 跟 一个 女生 谈恋爱, 他 对 你到底 这个 是什么 一个 意思 呢? 你 买的 东西 他 可能 接受 了, 因为他 有时候 出来, 有时候 不 出来, 然后 他 跟 其他人 好像 又 有点 关系, 所以 你 要在 里面 进行 一大堆 的 分析, 然后 最后 你 感觉 我 到底 要不要 继续 复 问题。 对, 这 是个 这一 这 当中 可能 有 几十层 的 这种 推理。 在 这个 陌陌 里面, 你 就 因为你 分析 了 之前 各种各样 的 行为, 还 跟 你 自己的 感觉 有关。 比如说 你 之前 做 一个 舔 狗, 然后 你 失败 了 你 可能 是一种 人。 你 做 一个 田园 狗, 你 成功了 你 又是 另外 一种 人。
所以 其实 你 本身 是 相信 skating law 的, 只是 说 现在 因为 各种各样 的 限制, 导致 了 他 现在没有 办法 满足 它。 比如说 像 能源 方面 的 需求, 所以 它 会见 顶。
是 这个 意思 吗? 就是你 要 知道 智能 的 最终 来源 是你 在 里面 的。 刚才 说 的 这个 套娃 层数 和 数据 存储量 这 两个 决定 了 智能。 所以 你的 套娃 层数 越多, 你的 数据 存储量 越多, 你的 模型 就 越 智能, 这就是 给 的 本质。 那 我们 就在 上面 加 数据, 加 专利 来 提高 这个 东西。 但是 现在 这 两个 是 有有 瓶颈 的, 但是 你 提高 模型 能力, 提高 模型 的 设计, 也 能够 提高 数据 存储量 和 A I 的 效果。
我们 过来 改 一下, 我们 当时 之前 的 skin 的 时候 的 随着 模型 的 参 数量 的 越多, 那 我们的 效果 就 会越来越 好。 那 我们 现在 说的是 应该 是 随着 模型 的 这种 效率 更高, 它的 效果 就会 越好。 对, 这个 应该 是 仍然 是 成立 的。
其实我 蛮 想说 说 刚才 中午 跟 行远 吃饭 的 时候, 就 感觉到 行远 聊到 自己的 产品, 然后 聊到 自己的 模型 就 特别的 有 激情。
您 放光 了。 对我 还 说到 其实我 是在 三月份 参加了 英伟 达 的 G T C 大会。 然后 我 其实 也是 当时 看到 老黄 跟 transformer 的 八字 在 台上 对话。 然后 我 就 突然 觉得 反映 到 我 觉得 秦 远 跟 charter AI 的 创始人, 我们 其实 是 非常 相像 的 两个人, 就 给 我的 第一印象 没有 passion 的 这样的 人。 所以 彩云 我们都知道, 因为 我们 自己的 同事 也有 在 用 彩云 天气 的, 彩云 小艺 是 第二个 产品。 然后 最近 是 叫 彩云 小梦, 在 海外 叫 dream。 我们 中午 其实 吃饭 的 时候 就在 聊 dreams ly 和 小梦 现在 其实 也是 清远 的 主要 的 这个 省 之一。 我们 今天 主要 先聊 一 聊 小梦。
是一个 给 大家 提供 A I 续写 服务 和 A I 角色扮演 的 一个 创作 和 消费 的 平台。 为什么 要 搞 这个 事儿 呢? 首 我 刚才 说 了, 我 一直 很喜欢 这个 A I 相关 的 东西。 但是 当时 想要 去做 语言 理解 是 太难 了, 所以 先 做了 天气预报 之后, 其实 在 学术界 15年 出了 一篇 论文 叫 renee。 那 篇文章 的 误差率 把 image net 上面 的 人类 的 误差率 大概是 5% 左右, 它 做到 了 3.5%。
所以 这 篇 论文 的 出现, 标志着 图像识别 问题 已经 被 机器学习 攻克。 对, 当然 后面 还 做了 各种各样 的 事情, 但是 它是 一个 分水岭, 就 在那 之后, 大家 觉得 这个 问题 已经 是 被 sf 掉 的 问题, 所以 大量 的 研究 学者 shift 到了 NLP 领域。 如果你在 twitter 上 关注 他们 的话, 他们 就会 现在开始 做 NLP 了。 因为 NLP 的 数据 更 复杂, 压缩 度 更高, 所以 理解 起来 更 困难。 图片 是 相对 简单 一点 的。
对你 NLP 就是 人工智能 自然语言 处理。
是的, 你 想 一个 小孩 他 可以 很 容易 的 认识 物体, 但是 他 要 学会 语言, 那就 需要 一些 时间。 语言 是 困难 的, 在 语言 这件 事情 上, 什么 又是 简单 的 呢? 就是 比如说 拼音、 翻译, 当你 最后 面 做 的 题 就 变成 阅读 理解, 最难 的 那个 题 是 啥 呢? 作文。 所以 这是 难度 逐步 增加, 我们 就 先 做 简单 的 翻译, 而且 它 也 有用。 所以 17年 就 出了 第一款 中英 同声 传译 软件, 也 获得 了 几百万 的 用户。 之后 但是 发现 同声 传译 这个 场景 还是 相对 的 窄, 但 后面 还有 疫情, 这些 没有 那么 多 使用 场景。 我 发现 大家 在 用 这个 软件 的 时候, 60%到70% 的 流量 是在 看 英文 的 小说。 我 后来 发现 从 这个 角度 上 分析, 其实 中文 的 或者说 文字 的 这种 消费量 也有 几个 大 的 来源。 一个 是 我们 平常 的 聊天 最大量, 其实 还是 越 因为 聊天 是 短句 的, 就 大量 的 文本 输入 其实 是 阅读。
就是 对 用户。
洞察 出来 的对 他他 不是 论文, 因为 看 论文 的 是 高精尖 科研人员, 他 也 不是 看 新闻。 你 会 发现 假设 这个 世界上 每天 文字 的 消费量 假设 是 100, 最大 的 不是 论文、 新闻 这些 东西, 而是 娱乐 娱乐 而是 娱乐。 可能 80就是 在 娱乐 上面。 这个 娱乐 是什么 呢? 就是 小说。 所以 这个 小说 的 创作 和 消费, 它 都是 中文 的 一个 非常 主要 的 东西, 至少 占 一半儿。 我 觉得 所以 这种 东西 就 很 值得 去 研究。
还有 一件事 就是 越做越 发现 小说 这个 东西, 它是 一个 对 世界 的 变化 的 描述, 就是 它 在 内部 实现 了 世界 的 某种 状态 的 表。 是 然后 这种 状态 的 表示 使得 他 可以 不停 的 去 演进, 所以 A I 小说 生成器 其实 就是 个 世界 模拟器。 你 告诉他 现在 是 什么样, 让 他 告诉你 接下来 会 是 什么样。 然后 这个 事情 就和 我 做 的 那个 天气预报 就 有点 异曲同工。 就是 因为 天气预报 它 也是 告诉你 地球 现在 这个 样, 问 你 明天 后天 是 啥样, 或者 是 接下来 2个小时 要不要 下雨。 小说 就是现在 这个世界 是 什么样, 这 两个人 要不要 相爱, 然后 这个 第三者 要不要 插足。 就是 个 开 个 玩笑, 或者 是 魔戒 是不是 要 打 过来 对 吧? 这种 那 打 过来 就是 打输, 打赢 了 就是这样 的 一种 也是 一种 东西, 所以 我 就 觉得 这个 东西 很 好玩。
还有 一点 是 当时 如果 想做 知识问答, 其实我 也 尝试 过 做 知识问答。 这是 每一个 有 理想 的 青年 可能 都会 去做 的。 知识问答 是 想 拆 box。 对对对, 我们 也 曾经 做到 过 那个 叫 M S marco 的 数据集。 这个 数据集 其实 你 问 搜索引擎 一个 问题, 搜索引擎 里面 的 网页 拿到 去 回答 这个 问题。
我们 曾经 上线 过 一个 版本, 你可以 在 微博 上 艾特 彩云 小艺, 然后 随便 问 他 一个 问题, 肖 战 会不会 骑自行车? 那个 天空 为什么 是 蓝色? 他 就会 告诉你 这个 答案。 我们 也 做 过 实验, 但是 我 始终 这个 准确率 就 只能 得到。 再 比如说 百分之七八十 这种 状态, 它 还有 百分之二三十 是 不对。
当然 现在 大家 发现 3.5 或者 GPT4 也是 其实 就是 幻觉 问题。 然后 当时 我 有一个 判断, 就是我 觉得 幻觉 问题 一时半会 解决不了。 但是 在 小说 创作 这件 事情 上面, 幻觉 问题 就 不是 问题。 对你 幻觉 还是 个 feature, 对 吧? 你 这个 脑 洞 大 开 挺棒 的。 所以 我 就 觉得 这个 领域 是不是 更加 适合 声称 是 AI 呢?
就 当时 其实 天气 已经 在 赚钱 了。
当时 还没有, 就是 19年 开始 做对 天气 赚钱, 那个 是 20年 疫情 的 时候。 被逼的 不好, 融资 不确定性 比较 大, 就 回归 商业 本质, 就 只能 回归 商业 本质 了。 对, 幸好 就是 拜 各位 用户 所 赐给 个 订阅费, 但是 产业 天气 用户 这些 订阅费 不要 骂 我, 我 都是 花 在 这个 做大 模型 上 的。 不是, 我们 也 在 推动 人类文明 的 前进, 对不对? 就是 大家 的 这个 彩云 天气 的 订阅费 也 是不是 白 给 的。 因为 先 做 的 小说 的 翻译 和 出海, 觉得 这个 有有 的 搞, 然后 就 翻译 其实 就 中文 到 英文, 续写 就是 上文 到 下文 是 数据 换 一下, 发现 真的 可以 搞。
21年 搞 了 之后, 其实 那个 时候 就是 一个 介于 GPT two 的 GPT3 的 时代 了。 GPT two 出了, 那 GPT3 还 没出。 然后 我们 大概 在 技术水平 也 在 这 两代 之间, 但是 在 中文 圈 大家 就 觉得 很 新鲜。 所以 当时 我们 上线 一周 获得 了 100万的 拥 用户。 在 B 站 上面 大家 用 它 来做 小说、 做 视频、 做 动画。 用 他在 做 剧本, 剧本 只有 做 动画, 然后 我们 获得 了 上亿 的 播放量。 当时 人民日报 官号 有 一篇 文章 就是 作家 会 失业 吗?
这是 221年.
五月份 的 事情。
还差 几个 月。
2222年 的 11月份 我们 就是 领先 了 11年 多。 22年 的 8月15 号 我们 发 了 2.0 版本, 就 1.0 版本 就是 续写 2.0 版本 就是 你可以 扮演 其中 一个 角色, 比 速度 比 创意 我们 还是 不错 的。 但是 后面 我 发现 那个 留存 是个 大问题。
但 这个 对 所有的 大 模型 都是 大问题。
然后 这个 事情 我 也有 深度 的 思考, 我 不是说 找 什么 解法, 我 先 说 问题 在哪里。 问题是 在于 我 把 它 叫做 算 力 等价 定理。 你 要 去 解决 的 问题 要 跟 你 付出 的 算 力 要 等价。 比如说 你 期待 我们 做 一个故事 创作 产品, 然后 这个 故事 创作 要有 消费性, 你的 P K 的 对象 不是 A I 也 不是 人类, 而是 netflix 是 爱奇艺。
十 3题你 要 到 这个 水准 大家 才会 去 看你 当然 不是说 一定 要是 这个 水准, 但是 至少 是个 顶尖 top 水准。 对你 AI 生成 一个 作 高考作文 水平, 那 肯定 是 没有 消费性 的。 比如说 我们 拿 三 刘慈欣 来 思考, 就是 他 写 三体 可能 花了 前后 可能 是 十年 左右 的 时间, 投入 多少 精力 去做 这个 剧情 设计。 你的 A I 要 想得到 一个 同样 水准 的 东西, 那你 付出 的 算 力 要 跟 他 类似。
比如说 假设 你 认为 刘慈欣 是个 万亿 级 参数 你的 模型, 那 这个 万亿 级 参数 模型 运转 了 十年 对 吧? 我们 才 做出 这个 东西。 你 要是 做 一个 千亿 级 的 模型, 你 要 做出 多少? 这 只是 打个比方, 这 真实的 可能 不一定 就是 刘慈欣 可能 比 万亿 级 多多 了。 大脑 是 100亿神经元 和 1000亿连接。 对, 就 很难 用 更 少 的 东西 得到 更多 的 效果, 至少 大家 要在 某 一个 量级 上。 所以说 我们 我说 整个 行业, 先 说 整个 行业, 就 整个 行业 来讲 的话, 就是 无论是 我们 要 去做 新药 发现, 要 去做 医疗, 要 去做 比如说 刚才 说 的 可控 核聚变 或者说 新材料。 对你 都 得 付出 等价 的 算 力。 就是你 不可能 指望 我 用 一块 花 一块钱 或者 1万块钱 的 事情, 这个 是 很难 的。 从 故事 创作 上面 来讲, 你 也很 难 想象 一个 大学生, 然后 他 能够 用 比如说 几分钟 做出 一个 三体 level 的 小说。
这 两年 其实 是看 了 一个 诡秘 之 主。 因为 它的 里面 的 世界 的 复杂性, 然后 包括 它 每一个 不同 的 它 可以 修炼 的 方向, 大概 可能 有 十多 20种。 所以 他 作者 在写 的 时候, 他是 需要 弄 非常 详细 的 这样的 一个 excel 表。 每一个 这个 领域, 然后 它 不同 的 这个 级别 又 对应 的 名字 和 能力 非常复杂。 对, 就像 您 刚刚 讲 的, 你 没有 等同 的 算 力, 也 构造 不出 那么 复杂 的 世界。
对, 诡秘 大概 一两百万 字, 你 在 这 一两百万 字 这个世界 当中 你 都不 崩, 然后 整个 人设 他 要是 精彩 太 合理 的这 是 非常 难 的 事情。 现在 的 A I 可能 也就 比如说 GPT 的 输出 token 是 之前 的这 GPT four 是 4K现在 增加 了 一点, 可能 到 8K或者 16K输入 是 100万token, 但 它 输出 是 相对 比较 少 的。 我们 可能 有有 上万 字 的 的 能力, 因为 我们是 一个 写作 的这 我们 专门 干 这个 的。 当然 这 只是 我们的 第一版, 因为 这个 还能 接着 往往 下跌。 我 刚才 也 提到 就是 百亿 千亿 往 上 做。
所以 就是 去 试 这个 虚构 的 比较 好是 吧?
对, 虚构 的 比较 好。 毕竟 我们在 作家 群体 上 还是 有 一定 的 声誉。
是 有 一些 这个 职业 的 作家 来看 过。
非常 我们 甚至 有 拿到 金鸡奖 的 作品。
输出 以后 还是 需要 人工 的, 在 要 人工 认识, 要 人工 认 一下。
是的, 不是 作家 头像。 它 主要 解决 的 是 两个 问题, 一个 是 有 细节 描写, 这个 是 非常 费劲儿 的。 明白, 我 去 一个 山, 那你 给 描述 这个 仙山 的 什么 样子, 那 比较 麻烦, 他 就 直接 搞定 了。 还有一个 是 灵感, 就是我 现在 卡 纹 了, 我不知道 这个 剧情 怎么样 写 比较 好。 突然 他 比如说 他 插入 一个 第三者, 我 就 觉得 这个 剧情 就 走下去 了。 对, 所以 这是 小梦 的 两个 作用。
去 试一试。 我 一直 想 写 这个 科幻小说 可以 试试。
可以, 对, 但是 现在 我 还 推出 了 一个 新的 版本, 就是 A I R P G 这个 版本 就是 它它 能够 穿越 到 这个世界 去 扮演 你的 角色, 就是 更加 面向 消费者。 我们 有 面向 作家 的 一个 版本, 就是 作家 可以 去 改动 服务, 但 消费者 提供 服务。 就是 刚才 提到 的, 就是你 做出来 的 东西 的 智能 度 其实 就 不够 消费性。 所以 这件 事情 就是说 为什么 留存率 不够 的 原因 是因为 它 达不到 那个 消费性。 但是 如果说 普通 的 像 我们 这种, 他 可能 刷 个 爱奇艺 或者 海外 的 刷 个 netflix 甜甜, 或者 是 这种 爆米花 就可以 了。 但是 你的 A 你 A I 做出来 的 东西, 可能 还没有 人家 爆米花 的 跌宕起伏, 或者 是 做出来 的 好看。 那 我 就算 了 对 吧?
是 说 剧情 不够 精彩, 还是 说 人物 不够 丰满。
还是 说 我们 要 分 几步 走。 第一步 是 我们 一定 首先 要 解决 的 事情 是 他 不 出错。 第一步 我们 要 觉得 会 穿帮 是吗? 现在 对, 会 穿帮。 我们 都 看过 一个 电影 叫 盗梦空间, 那 里面 有 个 architecture 的 职业 叫 造梦师。 但是 那个 造梦师 如果 他 水平 不行 的话, 你 做 着 做 着 梦 你 会 发现 这个 是个 梦, 你 就 他 就 醒了。 对, 就 我们 现在 的 A I 就是 这种 感觉。 你 某 一个 人物 突然 他 就 出 戏 了, 你 就会 醒来, 你 会 发现 不对, 它 就像 灰姑娘的水晶鞋, 它 就 消失了。
大家 为什么 那么 的 热爱 这个 东西? 因为 它 给 大家 的 一个 非常 好的 泡沫, 就是 给 大家 造 了 一个 很 好的 梦, 或者 我们 自己的 软件 character A I 这 类型 的 软 就是 A I 陪伴 类 的 软件, 就是 大家 想要 一个 梦境, 这个 是 每个 人都 想 可能 都 会有 的 东西, 但是 AI 现在没有 去 满足 他。 但是 当 在前 五分钟 你是 没有 感觉, 或者说 前 半小时 没有 区别 的。 所以 大家 会 非常 的 热爱 这个 软件 会 非常 的 热爱。 因为 前 半小时 你 玩 的 时候, 你 会 觉得 他 满足 了 你的 一切 幻想, 但是 你的 泡沫 崩 就 崩掉 了。
当然 这 只是 我的 一家之言 了, 其实我 认为 这 是个 非 共识。 大家 其实 在 做 多 模态, 就是 共识 是 多 模态。 大家 留存率 低 是什么 原因 呢? 没有声音 对不对? 没有 画面 我 来 搞 视频, 是不是 交互 做 的 不够 好, 我 来 把 语音 的 这个 交互 时间 变短, 我 变成 语音, 然后 给你 做 拟人, 这是 共识。 非 共识 就是 其实 是 这个 泡泡 吹 的 不够 大, 吹 的 不够 久。
容易 出现。 但 我 觉得 这个 还是 根据 你的 这个 用户 的 使用 场景 来看 了。 就像 我我我 昨天 在 办公室 里, 我 跟 俊 玉 也是 我们 共同 朋友。 我们在 试听 的 插 GPT 的 语音, 然后 我 发现 他 最近 又 加 了 很 尴尬 的 笑声。 每次 跟 他 对话 的 时候 觉得 我 觉得 是的 是的, 您 说 的 非常 的 好啊。
觉得 这个 也 实在是 太 崩溃 了。
它 确实 是在 迭代, 你说 我会 不会 就 不用 它 了? 我 还是会 用 它。 对, 但是 他 这个 笑声 我 就 觉得 很 出 戏。 我 就 问 你 一个 问题, 你干嘛 要 这么 多 感情 给我?
对, 就是 多 模态 是 共识, 但是 泡泡 吹 的 不够 久, 不够 持久, 这个 不是 共识。
但 我 觉得 这 可能 也是 像是 小梦 或者 是 Carter a 因为他 还是 base 在 大 的 描述 里面 的 这样的 一种 交互。 就 比如说 是 这个 共识 的 久 不久, 我 比如 我们 一个 G G P T 帮 我 做 一个 数学模型, 然后 我要 算 一下 这个 公司 的 什么 新 业务 的 营收。
我 不太 需要 他 长久 的 跟 我的, 但是 我说 的 是 ARPG 这个 赛道。 对, 就 这个 赛道 它的 当下 的 核心 问题, 造梦 造 的 不够 久, 就 造梦师 能力 不够。 而且 我 还 想说 一下, 造梦师 能力 它 其实 是个 指数 级别 的。 就是你 别看 30分钟 和 60分钟, 它 不是 一倍 的 时间。 就是你 在 30分钟 里面, 比如说 你可以 见 一个人, 你 在 60分钟 里面 你 可能 会见 两三个 人, 然后 去 到 3两三个 地点, 这 两三个 人 可是 要 交互 的。 你 想象 一下 你 自己 生活 的 在 一个 世界 里面, 你 生活 个 一周 你 能 见到 多少 人, 你 甚至 可以 飞 个 飞机 到 美国, 对不对? 你的 这个 过程, 他 飞机 上 见到 的 人, 然后 到了 空姐, 然后 再 回来, 然后 你 再 打电话 话 给 北京 的 人, 中间 还有 时差, 它 中间 不能 崩。 你 整个 世界 要 合理, 要 连贯。
他 还是 需要 一个 他 自己的 一套 逻辑, 就 世界大 模型 他 有啊。
对对对, 就是 这个 才 叫 真正 的 世界 模型。 是。
但 我 觉得 这个 还 挺 难 的。
您 的 意思 就是说 因为 大家 都 想做 多 模态, 所以 把 资源 都 投放 在 了 对对对 多 模态 那些 分支 上, 以至于 没有 在 垂直。
的 语言 的 这个 智能 度 的 东西 是 根本。 如果 没有。
这个 是 跑 的 最快 的。 如果 要 比如 其他 的 这个。
他 应该 是 最 容易 是 跑 的 最快, 应该 是 跑 的 最快 的。 对的, 因为 它 相对来说 是 最 容易 实现 的。
另外一个 问题 就是 像 凯尔特 瑞亚 到 现在 他 都 不怎么 赚钱。 我不知道 在 商业 变现 上面, 我们 刚 知道 彩云 是 后面 其实 是 开始 收费 了。 但是 比如说 像 小梦 是 怎么样 想 的, 因为 现在 大部分 的 国内 的 大 模型 全都 是 免费 的。
我 觉得 对 我们 比较 头 铁, 我们是 收费 的。 我们 还是 比较 罕见 的 正向 毛利率 公司, 就是 我们的 收 出来 的 费 cover 掉了 我们 服务器 成本。 这 是一个 思维 观念。 你 如果 经历 过 疫情, 发生 疫情 的 时候, 可能 中美 断航 的 时候, 你 会有 个 极大 的 焦虑。 我 觉得 经历 过 疫情 的 企业家 是 不一样的, 就是你 会 风险意识 比较高。 所以 我不 喜欢 做 那种 投入 很多, 然后 最后 可能 没有 回报, 公司 可能 会 挂掉 这种 事情。
就是我 希望 把 风险, 就是 以前 我 其实 一直 是 投资人 问我 能 用 多久, 可能 是 比如 18个月 或者 是 20个月。 对, 那 我 一般 可能 说 30个月 或者 50个月, 就 这种 尽量 让 风险 不要 那么 高。 而且 我 觉得 你 能挣 一些 钱 就 证明 你 有 社会 价值。 那 你可以 继续 加大 你的 投放, 然后 把 你的 社会 价值 不停 的 放大。 如果你 挣 不了 这个 钱, 那 说明 你 其实 就 你 创造 的 是 这个 价值, 不是 正向 的。
比方说 我 刚才 说 的, 比如说 我们的故事 创作 能力, 现在 消费者 达不到, 他 不给 你 钱, 他 就 那个 水准。 但是 作者 可以 用, 因为 作者 可以 自己 改, 他 你 出 事情 出错 了 没关系。 那 好, 那 我们 就 先 挣 作者 的 这份 钱。 可能 这个 钱 比较 少, 也许 就是 坐 的 人数 比较 少, 比如说 几百万 或者 1000万这个 量级。
但是 一旦 你的 这个 技术 突破 了, 就是 你的 技术 不断 的 突破, 也许 你 就可以 做 原来是 专业 作家, 后来 变成 爱好者, 然后 后面 变成 所有人, 最后 你 就可以 去 打 雨果奖, 打 诺贝尔文学奖 的 市场 了。 有一天 算 力 等价 定理, 假设 我 跟 刘慈欣 同样 的 花掉 了 10年 的 这个 时间 去 构思 一个 文章, 我 就 能够 跟 他 达到 相同 的 水平。 如果我 能够 有 更高 的 效率, 我 能够 花 100年。 因为 刘慈欣 没有 100年 的 生命。 但是 AI 有, 那 我 就有 可能 可以 做到 比 刘慈欣 做 的 更好。
行远 我想 一个 问题, 就是你 对 AI 写作 的 未来 的 预期 是什么?
可以 进入 任何 一个 世界, 然后 这个世界 它 都是 真实的。 然后 你可以 去 你的 想象力 是你的 上限, 最好 是 我们的 多 模态 也都 能 搞定。
就 像是 更加 像是 一个 你 自主 选择 的 黑客帝国, 不是 一个 被迫 的 黑客帝国。
是的, 你可以 去 选择 头号 玩家 那种, 你 就 带上 V R, 你 就 进入 了 那样 一个 世界, 一个 新的 世界。 这世界 你可以 去 赛车, 可以 去 星际 探索, 期待 是 我们 玩完 了 A I 的 这个世界 之后, 你 能够 获得 一些 东西。 在 现实 世界 当中, 很多 事情 你以为 是 这样, 实际上 并不一定 是 这样。 比如说 你 当 一个 皇帝, 然后 有 后宫三千佳丽, 你 觉得 超级 爽。 但 最后 你 发现 可能 大家 都 不跟 你 真心。 甄嬛 你看 完 之后 你 会 发现 我要当皇帝 绝不 那么 搞, 会 被 搞死。
用 短暂 时间 重活了 多 说 了 多少次 以后, 然后 发现 并不是 别人 的 人生 就 更好。
是不是? 对对对, 那 就是这样, 就是 人 人生遥控器。 当然 你 也 收获 了 一些 其他 的 东西, 你 收获 了 一些 东西, 你 得到了 人生, 弥补 了 之前 没有 弥补 的 遗憾。 但 你 也 学会 了 新的 东西, 然后 能够 反哺 你 现实 世界 的 人生, 然后 让 你的 生命 的 长度 得到了 极大 的 延展。 原来是 我们 人 只能 生活 一辈子, 这 是不是 很遗憾?
这 让 我 想起 了 三体人 侵略 我们的 时候, 先 给 我们 那个 头盔, 让 你 先 看一下 他们的 历史 也 学 起来。
其实我 刚才 问 秦 远 对 AI 未来 的 写作, 未来 想象, 我 其实 是 想 问 一个 什么 问题 呢? 就是 我们 所有 AI 的 这些 推理 能力, 包括 训练 能力, 都是 基于 已有 的 世界 架构。 其实 AI 说白 一点, 它 其实 是 基于 一种 归纳。 包括 说 我们 所谓 的 AI 能够 推导 物理 定律。 其实 它是 基于 已有 的 这些 物理现象, 然后 已有 的 这些 定律 来做 一个 外延。 所以 我们的 AI 创作, 它 其实 是 没有 办法 写 出来 一些 有 脑 洞 的 东西。
比如说 马尔克斯, 你 不是你 现在 看 我们 作者, 我们 已经 每天 要 产生 几亿 字 的 内容, 而且 都在 起点 上面 发表。 你 现在 看到 的 很多 书 其实 就是 A I 生成 的。
所以 你 但是 他们 都 不信, 他们 还是 霸 总 文学, 还 是不是 不是 不是 是不是。
你 他们 并没有 出来。 马尔克斯 不是 从 金瓶梅, 是从 红楼梦 上 衍生 的。 就是你 你可以 用 同一个 时间 关系 做 别的 东西, 它 仍然 是 创新。 但是 还有一个 是 A I 的 创新, 它 不仅 是 这种 衍生品 的 层面, 它是 更加 深刻 的 层面。 当然 现在 的 点子 可能 还是 A I 做 的, 但是 我们 一步一步 来, 就是我 认为 点子 这个 东西 它 也是 一个 搜索 并 筛选 的 过程。
就是 为什么 三体 好? 就是 因为 三体 想象 了 一个 三颗 星星 的 世界, 它是 什么 样子? 对 吧? 起点 是 假设 一个 星系 里面 有 三颗 太阳, 那 这些 那 里面 的 人是 什么样 的? 当然 这是 采访 刘慈欣 的 得到 的 答案, 就是 这个 篇文章 的 初心。 当然 根据 这个 后面 可以 推导 我们 宇宙文明 是 什么样 的那 这个 可能 是 目前 机器 还 做不了。 但是 将来 比如说 机器 可能 有 也有 很多 个 点子, 然后 我 从 这个 点子 里面 筛 出来 一些。
我们 作家 有一个 极其 精辟 的 描述, 就在 我们的 用户群 里面, 他是 这么说 的, 人类 的 想象 是 有限 的, 而 机器 的 想象 是 无限 的。 为什么 他 这么说 呢? 因为他 每次 点一下 换一换, AI 就 会给 他 一个 全新 不同 的 巨星 走向。
但是 AI 没有 办法 发现 量子力学 它 不能 代替 爱因斯坦。
那 可不 一定, 你知道 新 重整 化 方法 吗? 在 京 东边, 这 两个 都 颁给 了 AI, 但是 颁给 AI 这个 有 争议。 但是 重整 化 方法 不是, 它 其实 是 可以 发现 一些 新的 东西。 对我 仍然 是 算 力 等价 定理, 发现 量子力学 是 消耗 的 蓄力, 或者 海森堡 他们 一代 又 一代人 搞 了 好久, 然后 他 自己 去做 实验 这些 但是 这些 A I 不是 不能 做, 如果 给他 足够 多 的 时间。
我 觉得 行远 在 形容 一个 A G I 的 时代。 但 我 觉得 这 根据 现在 的 说法 还是 属于 雅 贤 描述 的, 我们是 在 两个 维度 上 在 讨论 这个 问题, 智能 涌现 到底是什么 时候 能够 出现? 好。
谢谢 大家 帮 我们是 帮 我们 斡旋。
这 你以为 的 创新 其实 可能 就是 一种 错误 或者 什么样 的 机制, 它 并不是 什么 神秘 的 东西。
你 觉得 未来 会 什么样? 让 你 觉得 特别 exciting 的, 特别 兴奋 的这 样子。
A I 产品 我 认为 像 材料科学 这种 是 有 很大 的 突破 可能性 的。 就是 常温 超导 材料 对 吧? 就是 之前 LK99 是 比较 火 的, 但是 LK99 其实 就是 一套 制备 方法。
对, 跟 这个 ala 41样, 它 其实 能够 通过 A I 能够 快速 是的。
很有可能。 如果说 能 这样的话, 那 也许 下一个 震撼 大家 的 时刻 可能 是 A I 做出 超人 超导 的 时刻。 我 觉得 这是 比较 期待 的 一个 产品。
先 把 我们的 底层 科学, 我们 再 上。
一个 一个 再 上 一个。 对, 而且 这 可 有可能 是 最终 你 会 发现, 就像 刚才 说 的, 提 问题 的 人 也 变成 了 A I 我们 现在 还好, 我们 能 提 几个 问题, 我们 放在 什么 常温 超导、 可控 核聚变、 黎曼猜想? 雨果奖 我 觉得 这 几个 都是 相对 比较 下一个 的 事情, 但是 哪个 先 被 搞定?
我 上周 主持 的 艺术家 和 A I 的 这方面 论坛, 我 旁边 的 汪明 安 教授, 然后 他 我忘了 是 哪 他 提到 的 哪一个 哲学家 说过, 未来 有了 A I 的 社会, 所以 就 只剩下 谈恋爱 和 艺术 了。
很有可能 对我 觉得 我 就 我就是。
那 小梦 还是 大有可为。
对, 就是 在 AI 创造 的 那个 泡沫 的 世界, 真的 是 令人 流连忘返, 是一个 非常 震撼 的 体验。 但 我就是 愿意 付出 我的 最近 一段时间。
的 全部 生命。 这个 生命 中午 您 说 的 就是 即使 是 可能 下 一秒钟 死掉 了, 然后 其实 也 不后悔。
再 在 做 这个 A I 故事 创作 这件 事情。 因为 很多 小孩 都有 这种 童年 梦想, 能够 创作 一个 自己的 想象 的 世界。 在那 想象 的 世界 里面 你可以 变成 变形金刚, 变成 奥特曼、 哆 啦 A 梦 等等。 但是 实际上 长大了 以后, 你 会 发现 这个世界 是 如此 的 boring。 然后 你 每天 都在 上下班, 这个 A I 的 这种 R P G 的 这种 技术, 它 就 又 把 你 拉回 了 小时候 的 那个 世界, 并且 比 你 小时候 想象 的 那个 更加 栩栩如生。
开始 颤抖 了 就 开始 颤抖 了。
就是 会给 你 带来 一种 灵魂 颤抖 的 体验。
我 玩 塞尔达 就 跟 这个 度假 一样, 我会 连续 就在 第一版, 那个 不是 王国 之 泪, 是在 前面 一 版 荒野 的 荒野 之 息。 对对对, 然后 就 玩 了 一个多 星期 就 啥 也 没干, 放假了, 就 在游戏 里 放假。 对, 就 这种 感觉 特别 爽。
对, 将来 你的 任何 一个梦想 都 能够 有 塞尔达 的 那个 质量, 然后 你 在 里面 去去 玩耍, 反正 我 觉得 是 值得 追求 的 一个梦想。
好的, 我们 今天 节目 也 差不多 了, 非常感谢 秦月 今天 做客 我们的 科技 早知道。
谢谢 秦 媛。 在 我们 也 感谢 一下 虎 嗅 为 我们 本次 节目 提供 支持, 特别 多 辛苦 的 老师 们 都在 这 支持 我们 录制。 对, 谢谢 大家。 行好。
我们 今天 节目 就 到 这边, 到 这里 了, 拜拜。 这就是 我们 今天 的 节目 了, 欢迎 你 订阅 分享 给 身边 的 朋友, 这 会对 我们 非常 有 帮助。 2024年 我们 还 制作 了 两档 全新 的 付费 节目, 不止 金钱 和 跳进 兔子洞 第三季 希望 可以 给 大家 提供 更加 优质 和 深度 的 内容。 另外 欢迎 你 加入 生动活泼 胡同 会员 计划, 支持 我们的 内容 创新, 还能 解锁 我们 所有的 付费 节目。 每周 会员 通讯 和 线下 活动 详情 可以 查看 单 集 简介。 好的, 那 我们 就 下期 再见。