We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 66. 和李志飞聊IPO、GPT-4o和你不知道的前沿科技创业的痛

66. 和李志飞聊IPO、GPT-4o和你不知道的前沿科技创业的痛

2024/5/23
logo of podcast 张小珺Jùn|商业访谈录

张小珺Jùn|商业访谈录

AI Deep Dive AI Chapters Transcript
People
李志飞
Topics
李志飞分享了出门问问作为“AIGC第一股”上市的经历,坦诚地回顾了12年创业的甘苦与反思。他认为,IPO是一个复杂的过程,需要处理大量合规和审批事务。他将前沿科技创业比作在充满不确定性的海中漂浮的冰块,需要低功耗运转,并时刻准备抓住机会。他认为,大部分前沿科技最终会消失,只有少数能够经受住市场检验。他分析了AI公司上市的挑战,包括港股的流通性和募资难度,AI行业的泡沫和项目制模式,以及激烈的市场竞争和未来生态位的竞争。他还分享了自己对GPT-4、Google Gemini等大模型的看法,以及对多模态技术发展趋势的判断。他认为,大一统模型应该基于自回归架构,多模态是未来发展方向,并对OpenAI的技术路线和领导层变动发表了自己的看法。最后,他总结了12年创业的经验教训,包括狂妄、无效勤奋和回归理性,以及对未来大模型公司发展方向的思考,强调了找到可持续商业模式和生态位的重要性。 张小珺作为主持人,引导李志飞分享了其创业经历和对大模型行业的看法,并就相关话题进行了深入探讨。

Deep Dive

Chapters
李志飞分享了前沿科技创业的挑战,包括技术不成熟、用户需求不清晰、项目制等问题,并讨论了AI公司上市的挑战和机遇。
  • 前沿科技创业面临技术不成熟和用户需求不清晰的问题
  • AI公司上市的挑战包括估值高、商业模式不明确
  • 李志飞的公司出门问问作为AIGC第一股在港交所上市

Shownotes Transcript

曾鸣 教授 的 形容 我们的 状态, 我 觉得 形容 的 特别 好。 他说 你 今天 就是 在 一个 局势 特别 不明朗 的 大海 中, 你 是在 一块 浮冰 上, 但是 你 这个 东西 随时 可能 这个 冰 就会 化 掉 或者 会 翻, 对 吧? 所以 你 要 有的 姿态 就是 低功耗 的 运转, 同时 非常 敏锐 的 察看 周边 有没有 尖兵, 一旦 有 尖 冰 你 要 准备 好, 你 还有 能力 跳上去。 今天 这个 结果 对得起 我 过去 的 努力 吗? 对的, 我 过去 受 的 一二年 受 的 磨难? 我 觉得 是 对不起 的。

所以 你是 其实 是 有点 不甘心 的那。

当然 不甘心 了, 中国移动 互联网 的 黄金十年, 我 居然 搞 成 这样。

Hello, 大家好, 欢迎 收听 张小军 商业 访谈录, 我是 腾讯 新闻 的 小俊。 这是 一档 描摹 我们 时代 的 商业 文化 和 新知 的 访谈 节目。 今天 的 嘉宾 是 李志 飞。 前不久 他的 公司 出门 问问 刚刚 作为 AIGC 第一股 在 港交所 完成 上市。 他在 节目 里 很 坦诚 的 聊 了 聊, 作为 一家 A I 公司, 一家 前沿 科技 公司, 在 熬过 12个年头 终于 站在 交易所 敲钟 的 那一刻, 他 到底 想 了 些 什么? 还有 那些你不知道的 前沿 科技 创业 中的 狂妄 与 痛苦。 他 称 自己 是一个 看见 过 创业 死亡 的 人, 他的故事 或许 能 给 今天 在 大 模型 浪潮 中 冲浪 的 选手 一点 启发。 此外 我们 也 点评 了 最近 的 GPT fo google A I 助手 和 字节 模型 大 降价 等 一系列 的 A I 最新进展。

四月 你们 公司 刚刚 上 是啊, 最近 工作 和 生活 有没有 什么 一些 新的 变化?

也 没什么 太多 新的 变化, 最大 的 变化 就是 上市 前 我们 要 做 很多 这种 routine 的 活, 或者 就是 为了 合规, 为了 达到 审批 的 结果, 要 做 很多 不 太太 具备 什么 挑战 或者 创新 的 这些 活。 上市 以后 这些 活 可以 少 很多, 这 可能 是 最大 的 变化, 我 觉得 还是 一个 很 复杂 的 一个 过程。 因为 以前 我们 去 看 别人 I P O 都 觉得 好像 很 简单。 你看 三个月、 六个月 反正 都能 搞得 定。 但 你 自己 经历 的话, 你 就 发现 其实 每一天 都 会有 很多 这种 主要问题。 去 解决 这些 问题 也 不是 一个 什么 创新性 的 问题。 你就是 要 不厌其烦 的 去 解释, 不厌其烦 的 做 很多 工作。 所以 这个 是 上市 前, 上市 后 这些 事情 可能 会好 很多。 所以 其实 上市 后 肯定 是 状态 要好 很多 的。

前段时间 其实 跟 你 也有 聊过, 我 都 没有 感觉 你 在 准备 上市, 你是 准备 多久?

作为 朋友 你 觉得 别人 这个 很 轻松, 对 吧? 我们 从 去年 3月份 启动 的, 六月份 交 表的, 所以 你看 差不多 接近 一年 的 时间。 挑战 在哪儿? 这个 太多 细节。 比如说 因为你 上市 是一个 面向 公众 发布 的 一个 招股, 对 吧? 那你 这些 公众 的 人 很多 时候 不是 专业人士, 不像 私募, 你 很多 都是 专业 的 V C 很多 东西 你 不用 跟 他 解释, 或者 你 也 不用 去 各种 什么 免责 声明。

但是 你 面向 公众 的话, 因为 从 这个 审批 机构 或者 监管 机构, 他 最 关心 那就是说 你的 信息 是不是 准确, 有没有 误导 大众。 因为 如果 比如说 你 误导 大众 了, 然后 人家 买 了 你 股票, 结果 发现 你 不是 这么 一 回事, 那不就 监管 就 没有 尽责。 所以 这 里面 全部都是 一些 很多 都是 监管 的 事情。 就是你 怎么 去 配合 监管, 让 他 觉得 你的 这个 招股书 的 描述 跟 你的 实际 的 情况 是 一致 的, 你的 公司 的 所有的 运营 是 合法 的对 吧? 你 对 未来 的 预测 也是 比较 纵横 的, 所以 这 里面 就 涉及到 很多 细节。

给你 举 个 例子, 我们的 中介 可能 有 四五十个 中介。 你 比如说 以前 私募 融资, 这 一轮 融资 可能 中介 就 三四个 中介 就 够了, 就 一个 律师 可能 是 最 重要 的。 但是 你 上市 就是 几十个 中介, 每一个 中介 他 既然 第一 是你 要 花钱, 第二 是 他 既然 参与 了 这个 过程, 那 他 一定 是 有 很多 事情 要 跟 你 公司 进行 交互 的。

所以 琐事 很多。

非常 琐碎, 而且 每天 你 都会 觉得, 这个 是不是 搞不定, 其实 最后 都能 搞定。

A I 公司 上市 的 挑战 是什么?

在 整个 港股 最大 的 挑战 还是 港股 的 流通性 跟 募资。 就是 因为 过去 这 两年 流通性 比较 差, 真正 的 市场化 的 投资 也 比较 少。 所以 对 很多 公司 来说, 第一个 就是 要 解决 能 摸 到 这个 市场化 的 钱 的 问题。 而 它的 好处 就是 A I 公司 是 大家 会 关注。 如果你 非 A I 公司 的话, 那些 投资者 可能 看 都不 看 A I 公司, 大家 会 关注。

但 我 觉得 很大 的 挑战 就是 因为 A I 公司 在 过去 中国 十年的 发展 过程中, 确实 有 一定 的 泡沫。 有 很多 是 估值 很高, 商业模式 又 没有 一个 可 持续的 商业模式, 亏 钱 也 亏得 很 厉害。 很多 公司 就是 因为 A I 公司 都是 技术 公司, 他 其实 都 不是 在 做 产品, 在 做 项目 制, 项目 制 的话 规模 不经济。 现在 大家 比如说 十年 前, 可能 大家 还 觉得 对 A I 有 各种各样 的 想象, 觉得 这个 商 也 怎么样。 那 现在 大家 看到 的 市场上 的 这些 过去 十年的 头部 的 公司 都是 比较 偏 项目 制 的。 所以 这些 东西 导致 募资 的 时候 可能 就会 很大 的 挑战。 估值 又 高, 然后 你 还 亏损, 又没 没有 看到 一个 说什么 以后 能 躺 着 赚钱 的 商业模式, 再加上 还有 一点 巨头 全部 都 进来 搞 A I 对 吧? 这个 竞争 很 激烈, 基本上 所有 最差 的 竞争 全部 进来 了, 吧?

怎么 解决 呢? 说 句 实在话, 这个 不是 凡尔赛, 我们 稍微 好 一点, 我们 估值 不高。 我们 过去 比较 偏 产品化, 我们 不 亏损, 长期 的 可持续性, 我们 至少 短期 是 已经 在 AIGC 的 应用 上 是 有 比较 大规模 的 营收 的。 当然 就是说 它的 增长 和 或者 是 可持续性 未来 会 怎么样, 跟 未来 的 竞争 是 很大 关系, 就是 前面 那个 估值 项目 跟 产品 的 关系, 那些 问题 对 我们 还好。 大家 可能 最 关心 的 就是说 你的 现在 这些 产品 你 现在 能 收到 钱, 你 现在 能够 有 很多 用户。 那 长期 来说 当 巨头 都 免费 进入 你 怎么办? 最近 在学 战略, 对 吧? 就是 有没有 你的 生态位。 当 这个 A I 机器 发展到 三年 五年 后, 在 整个 充分 竞争 之后, 你 在 这 三代 里面 有没有 你的 位置? 这 可能 是 大家 比较关心 的。

为什么 前沿 科技 总是 和 项目 制 挂钩? 这 是一个 现象 吗?

我 觉得 是 有 一定 规律 的。 所谓 前沿, 你 这个 东西 就是 一个 新技术。 新技术 的 特点 就是说 第一个 是 用户 的 需求 是 不清晰 的。 因为 用户 对 新技术 他 不 理解, 所以 他的 需求 他 可能 以为 你 这个 技术 能 干事, 干 这个 干 那个, 但 其实 自己 去 用 是 干不了 这些 东西 的。 所以 他的 需求 跟 你 这个 技术 之间 是 有一个 巨大 的 崇高, 所以 我 觉得 是 一点。

第二个 就是 技术 本身, 因为 你是 新技术 也是 不成熟 的那 这些 这种 东西 又 需求 又 不清晰 又 不成熟。 最后 当你 有一个 需求方 过来 的 时候, 那你 必然 就要 为 他 这个 场景 去做 很多 定制。 因为 只有 这样 他 才能 理解 说, 他的 需求 跟 你的 技术 之间 能够 怎么 匹配。 但是 刚才 说 的 技术 又 不成熟, 你 可能 为 他 这个 你 得 做好 的 定制 才能够 满足 他 需求。 关键 是 他 那个 需求 也 不一定 是 真实的, 都是 想象 的。

我 昨天晚上 跟 别人 聊天 说 to b 就是 甲方 跟 乙方 坐在 一起 自 嗨 前沿 科技 的 to b。 就 因为 双方都 对 技术 很 有 追求, 都 对 未来 很 兴奋。 但 其实 这些 需求 是不是 最终 的 客户 的 需求 其实 不知道。 所以 这 导致 必然 这种 前沿 科技 最好, 你看 商业模式 低于 大部分 to b 因为 to c 的话 更做 不好。 第二 就是 必然 to b 的 时候 也会 导致 很多 的 定制。

所以 导致 A I 到 今天 大头 还是 落在 to b 上。 朱 啸虎 说, 第一波 大 模型 的 爆发 肯定 在 to b 领域。

对, 肯定 是 这 样子。 当你 技术 不成熟, 然后 需求 也 不清晰 的 时候, 肯定 是 只有 找 一些 大 的 企业。 其实 对 他们 来说 也是 一种 所谓 的 创新, 所以 只有 他们 愿意 为 这个 创新 去 买单, 对 吧? 所以 肯定 就是说 这种 新的 技术 可能 就是 在 一些 比较 大 的 企业 的 to b 就 面向 大 的 企业 的 to b 先 跑。 然后 当你 这个 技术 变成 从 一个 前沿技术 变成 了 一个 非 前沿 或者 普通 技术, 技术 成熟度 能 做什么? 技术 的 边界 也很 清楚, 大家 摸 到了 用户 到底 能 用 这个 技术 能干 啥。 那 这个 时候 可能 是 to c 可能 会 更有 机会。

那你 经历 了 这 12年 的 创业 敲钟 的 那一刻, 你 当时 在 想什么?

就 你 要 我 讲真话 吗? 讲真话 就 那一个。 因为我 上台 之前, 我 一个 朋友 他 参加 过 很 多次 敲钟。 他说 你 待会 上去 的 时候, 你 要 摆好 一个 姿势, 这样 拍照片 好看。 第二 就是 中药 敲 的 响 一点。 所以 在那一刻 我想 的 就是说, 第一 我 这个 姿势 要 摆好, 这样 大家 能 拍照 别人, 否则 就是 随便 敲 一下, 那 可能 人家 没 拍 就 结束了, 对 吧?

第二, 就是 因为 当时 他说 要 声音 要 响 一点 的 时候, 我第一 反应 就是我 敲 重。 后来 我 就 特别 担心 他 这个 锤子 会 被, 我就是 前面 他 不是 有一个 布 的 那个 东西 吗? 会 被 我 敲 飞, 所以 我 就 提醒 自己 不要 太重。 我 当时 想 的 就 这个。

事情 现在 在 想什么?

没有。

就是我 觉得 确实 收获 了 人生 照片。

就是我 觉得 对我来说, 就 那一天 我 觉得 我是 在 做 一个 非常 机械 的 角色。 因为 很多人 给我 拍照, 我 还要 做 一个 所谓 的 一份 30秒还是 一分钟 的 演讲, 还要 穿着 西装, 这个 其实 是我 特别 不 喜欢 的, 对我 特别 不 喜欢, 所以 那一天 对我来说 就是 度日如年。

那一天 完成 以后, 晚上 要 回家了 或者 回 酒店 了。 你 当时 进入 一个人 的 状态。

你在想什么 呢? 其实 真的 没有 什么 太多 感觉。 对, 其实 你看 那一天 是 敲钟 那一天 是 比较 确定 的。 反而 敲钟 前一天 就是我 说 整个 上市 会有 各种各样 的 这个 东西 有可能 过不去, 或者说 有可能 会 延迟 对 吧? 就是 基本上 到 前一天 晚上 敲钟 前一天 晚上 第二天 的 事情 就是 一个 形式 就 确定 的。 所以 我 觉得 没什么 太多 想法。 对, 真的。

不过 我 觉得 你 这个 过程 还是 能 看得出, 一个 前沿 科技 要 进入 真正 的 被 大众 所用 到, 还是 一个 非常 漫长 的 过程。

对。

那就 远远 比 你 想象 的 漫长。

而且 有一个 所谓 的 漏斗 模型, 就是 大部分 所谓 的 前沿 科技 最后 都会 消失掉 的。 比如说 你 有 100个前沿 科技, 可能 就是说 能 经过 这个 漏斗 模型 的 检验, 就是 能够 从 一个 技术 包装 成 一个 产品, 能能 形成 一个 商业模式。 而且 技术 的 投入 跟 最后 你 商业 产生 的 价值 能 产生 一个 匹配, 使得 你 这个 可 持续 就是 大部分 技术 都 经历。 不过 在 当时 那个 时间点 经历 不了 这个 漏斗 的 检验, 当然 并 不是说 这个 技术 没用, 比如说 他 这个 东西 可能 十年 以后 又 回来了, 就是 因为 环境变 了, 技术 成熟 了。 然后 需求 成熟 了, 或者 有 新的 需求 出现, 那你 这个 技术 又 重新 拿出来, 可以 去 经历 这么 一个 模型 的 检验。

这个 是 很 正常 的。 过去 12年 你 看到 过 的 没有 漏 下来 的。 技术 就 已经 消失 在 创业者 的 视野 里 的 有 哪些?

很 简单, 比如说 当时 你看 2013年 的 goog 眼镜, 就是 典型 的 很酷 很 炫。 我记得 当时 大家 包括 我们 自己 都说, 我们 看到 了 未来, 就 感觉 未来的世界 就是 应该 这 样子 的。 就 戴 了 眼 真是 little 的 就是 看到 了 未来, 因为 戴 了 眼镜, 对 吧? 就是你 感觉 所有的 世界 都 被 A I 给 数字化 了。 但是 很快 这个 产品 就 包括 A R V R 这 整个 行业 确实 经历 了 这么多年 都 没有 发展 起来。 但是 比如说 我们 现在 看 这个 最新 的 GPT4O 或者 是 google 的对 吧? 它 也 延伸 了 一个 眼睛。 那你 觉得 你 又 看到 了 未来。

其实 你 确实 回来了。 对。

这就是我 觉得 前沿 科技 的 特征。

前沿 科技 创业 充满 了 不确定性。

当然了 你看 比如说 很多 如果 是非 科技 的 创业, 如果 你是 商业模式 的 创新, 那你 可能 是在 一个 成熟 的 市场 去 可能 用 一种 新的 模式 去 颠覆 别人。 但是 从 技术 角度 来说, 你 技术 只是 这个 起点, 技术 产品 商业化 至少 有 这 三个 环节。 这 每一个 环节 刚才 说 了 这个 漏斗 可能 都会 把 你 漏掉。 因为 不成熟 或者说 最后 就是 不 匹配。

今天 大规模 投入 大 模型 投 早 了 没?

我们 讲 一个 宽泛 的 未来 是 很 简单 的。 比如说 未来 一定 是 A I 的 时代, 甚至 我 可能 在 2014年, 我 就说 每一个 公司 都 会有 一个 人工智能 部门。 这个 其实 都 某种程度 上都 是 很 简单 的 一种 判断, 这就是 所谓 的 一个 危险。

对 未来, 但是 我 觉得 真正 重要 的 是 说, 你 需要 有一个 路径 跟 这个 节奏 的 判断。 就 因为你 刚才 问 的 是一个 节奏 或者 是 路径 的 问题, 今天 的 大 模型 他 是不是 应该 这么 投入? 然后 第一步 该 干什么, 第二步 该 干什么, 我 觉得 这 可能 是 更加 重要 的 问题。

创业者 要 花 更多 时间 去 思考 这个, 有 一句话, 没有 路径 和 节奏 规划 的 危险 都是 耍流氓。 真的 是 这样, 包括 我们 自己 都很 容易 说, 你看 我 几年 前 我 就 判断 了 这个 怎么样, 对 吧? 就 感觉 就是 运气 不好, 然后 没有 成功 对 吧? 但 其实 不是 的, 你 只是 一个 很 粗糙 的 想法 而已。 其实 有 这个 粗糙 的 想法, 正常 的 人都 会有, 基本上 不太会 差 的 很 离谱 的。 但可 核心 真正 形成 不行, 能不能 成功 对 吧? 我 觉得 可能 是 这个 路径 跟 节奏 的 规划。

比如说 做大 模型, 就是 几种 情况。 第一种 情况 是 说, 如果 是 巨头 跟 这个 创业 公司 同时 达成 了 一个 共识, 但 这个 共识 都是 错 的那 在 这种 情况下 谁 会 死? 那 肯定 是 创业 公司, 因为他 熬 不 下去, 对 吧? 这 是一种 情况。 另外 一种 情况 是 说, 创业 公司 先于 巨头 半年 一年 形成了 某种 对 未来 的 认知。

而且 有一个 说 有一个 比较 精准 的 规划, 对 吧? 巨头 可能 在 一年 以后, 这个 时候 创业 公司 有 一定 的 概率 成功。 就是 你可以 利用 这一年 的 时间差, 你 能不能 建立 某 一种 壁垒, 对 吧? 就是 如果你 建立 不了 壁垒, 我 觉得 创业 公司 也会 死。

所以 就是说 你 做 前沿 科技, 如果 非常 抽象 的 说, 真正 的 做 前沿 科技 公司, 你 能不能够 在 第一 有 个 先发 优势。 第二 你 能够 利用 这个 先发 优势, 建立 一个 还 不错 的 壁垒, 或者 找到 某 一种 模式 是 巨头 看不到 的这 是 可能 你 唯一 能够 如果 在 一个 比较 竞争 比较 激烈 的 赛道 里面, 唯一 能够 生存 下去 的 一个 可能性。 但 我 这说 的 是一个 非常 理性 的 一个 东西, 因为 其实 还有 很多 别的 因素。 我 刚才 是 讲 本质 就是 这 样子。 但是 比如说 你 还有 资本 的 这种 不确定性, 就算 你 这个 东西 一看 就是 没 希望, 但 有 就是 有一个 投资者, 他 就是 要 给你 10亿美金 或者 是 多少 亿美金, 让 你 去 搞 这个 事情。 那 可能 你 这就 刚才 那个 紧迫感, 就是我 说 你 一定要 在 一年 就 找到 这个 先发 优势 带来 的 壁垒 的, 可能 又 给你 续 了 一条 命。 说白了 就是 你可以 可能 再 等 个 两年, 对 吧?

这个 我 觉得 绝大部分 最好, 绝大部分 创 的 这个 前沿 科技 公司 能 活 下来, 可能 也要 有 这种 比较 好的 运气 的 因素 在这里 面对 吧? 否则 就是 确实 很 残酷。 尤其 在 今天 中国 这种 前沿 科技 的 竞争 是 非常 充分 的。

甚至 你 在 2012年 的 时候, 我 刚回来 创业 的 时候, 我 觉得 那个 时候 中国 的 科技 公司 没 那么 强, 资本 没 那么 发达。 所以 这个 时候 我可以 利用 一个, 因为我 是 骨骼 的 科学家 的 身份, 我 可能 获得 一个 不应该 存在 的 优势。 就在今天 可能 这个 优势 就 不存在 了。

今天 太多 了 是 吧? 对。

就是 都 见 多了。 是的。

那 我们 聊 回来 聊 一 聊 最近 的这 几场 大 模型 公司 的 发布会。 因为 这 一周 真的 是 太 密集 了, 他们 为什么 都 选择 这个 时间? 先是 灵异 万物 在 OPPO I 前一天, 然后 OPPO A I google 自己。 今天 又有 腾讯 云 的 发布会。

在 五月份, 这 年终总结, 所以 这个 能 理解。 而且 本来 google I O 就 每年 都 差不多 都是 这个 时候, 对 吧? OpenAI 也许 就是 看 了 google I O 的 事情, 前一天 随便 搞 了 一个 事情。

我不知道 怎么看 这次 open I 的 发布。

有谁 让 你 觉得 亮眼。 我 觉得 他们 两个 google I O 跟 GPT4O 从 他们 这个 两个 表现出来 的 东西, 也是 共识 非常 强烈 的 一个 事情。 第一个 就是 你看 两个 公司 都在 把 这个 多 模态 作为 一个 最 主要 的 事情。 第二, 都 做 这个 助手。

所以 我 觉得 从 这个 角度 来说, 可能 也 是因为 其实 你看 多 模态 可能 去年 R T two 出来 的 时候, 其实 它 就是 基于 语言 模型, 然后 再加上 这个 视觉, 再加上 动作, 就是 V L V L A, 对 吧? 那个 在我看来 就是说 它是 一个 prototype, 它 至少 证明 了 这种 语言 模型 为基础, 然后 把 别的 模态 加进去, 然后 混合 成 一个 单一 的 模型 是 可行 的。 后来 我忘了 接下来 是 什么时候 发布 的, 它 也是 同样 的 路线。 但是 那个 时候 我 觉得 你看 jm lie 的 肯定 没有 这么 大 的 影响力。 我 觉得 这次 OpenAI 它 把 这个 多 模态 模型 能够 做出来 的 应用 的 想象 空间 给 打开 了。

这个 我 觉得 是 虽然 我们 回过 来看, 我们 都 觉得 这 不是 很 直白 的 吗? 但是 没有 一个人 能够 做 一个 实时 的 演示 给 你看 的 时候, 其实 我们 都 还是 我们的 信念 是 不 牢固 的。 所以 就是 看到 他们 这 两家, 就 很显然 这个 第一 是 多 模态, 可能 就是 是 非常重要 的。 可能 最 重要 的 可能 全文 本 的 语言 模型, 它 作为 一个 应用 形态, 其实 是 没有 什么。 我自己 觉得 它 不会 成为 一个 主流 的 东西, 就是 纯 语言 纯 文本 的。 它 作为 一个 应用 形态。

就 chat P T 现在。

这种 东西 对我 觉得 一定 是 多 模态 的。 这个 我 确实 去年 8月份 在 阿里云 当时 不是 阿里云 组织 了 一个 活动。 对, 就 C C 什么的。 对我 就说 这个 多 模态 是 C 位, 不是 花屏。 因为 那个 时候 可能 就 觉得 大家 觉得 多 模态 就是 做 着 玩玩 第一次, 但 可能 大家 也没有 意识到 这个 东西 很 有 多 重要。 第二 觉得 技术 还 不一定 搞得 定。

所以 我 觉得 这次 给我 一个 特别 强烈 的 感知 第一 就是说 这个 技术 发展 是 非常 快 的。 你看 那个 时候 就是我 觉得 隐隐约约 觉得 这个 R T two 觉得 多 模态 的 流程 能 跑 通, 然后 在 演示 了 一些 东西。 但是 我 觉得 立马 到 现在 这 半年 的 时间, 它 这 还是 个 demo, 实际 我们 还 不知道。 能够 看到 一个 可以 实时 的 交互 的 一个 助手, 而且 是在 这个 交互 的 过程中, 真的 是 A I 就像 一个 圆 一样, 它 可以 参与 多元 的 讨论, 可以 跟 你 开 一起 开会。

我 觉得 这个 东西 任何 激进 的 人 在 去年 那个 时候, 从 如果你 从 技术 原理 角度 去 思考, 我 觉得 都 应该 都 不会 觉得 有 那么 快 的这 是从 那个 技术 层面, 第二个 从 这个 应用 层面, 就是说 助手 对 吧? 其实 就是 以前 比如说 你看 我们 做 语音助手, 就是 语音 交互 做 实时 这个 事情 是 不 新鲜 的, 但是 不是 基于 大 语言 模型 的对 吧? 而且 以前 是 所谓 的 pipeline, 有 降噪 唤醒 对 吧? 有 语音识别, 然后 自然语言 理解、 搜索, 然后 对话, 然后 T T S 大概 有 七八个 步骤 就 做 一个 语音 交互。

如果说 你 用 以前 的 小的 N O P 的 模型, 那 你是 可以 做到 实时。 但是 以前 的 语音助手 大家 都 知道 就是 很 智障, 它它 不 能够 跟 你 进行 一个 自由的 对话, 他 经常 答非所问。 后来 有了 大 模型 以后, 去年 大家 开始 把 这个 串 起来, 它 确实 好处 就是 比 以前 更加 聪明 了, 但是 它 很大 的 问题 就是 延时 很大。 现在 就是说 又 没有 智障, 然后 又是 实时, 这个 是一个 新的 东西, 多 模态 的 这种 交互。 我 认为是 如果 是一个 文字 对不对, 那你 可能 就说 你 要 做 一个, 你 想想 如果 一个人 他 只会 说话, 他 没有 眼睛, 他 不 能够 做 多 模态 的 感知 或者 是 动作 的 时候, 那 他 你 任何 事情 都 得用 文字 的 方式 去 给他 描述, 这个 效率 得多 低。 而且 你看 现在 他 这个 就是说 啊 真正 的 人是 说 我就是 一个多 模态 的 动物, 我的 交互 就是 多 模态 的, 就是我 说 的话 的 时候 我 可能 要 做 一些 动作, 我会 给 你看 一个 什么东西, 包括 微信 聊天, 我也 给你 发 个 视频, 他是 这么 一个 态 交互 过程。 这一次 这 两个 助手 的 发布, 我 觉得 就 基本上 你可以 看到 他 就是 跟 校园 一样的 交流。 所以 我 觉得 这个 是 可能 是 确实 是 很 新的 一个 事情。

他 这次 核心 突破 的 技术难题 是什么?

第一 我们 也 不知道, 因为他 没有 写 论文, 对 吧? 我们 都是 猜测。 这个 先行 要 免责, 这里 边 有 几个 点。 第一个 点 就是说 它是 一个 大一统 的 模型, 对 单一 的 模型 特别 重要。

年初 还在 说 这个 非常 难。

对, 肯定 是 难 的 这个 事情。 这 第一次 它的 大一统 模型 就是 各个 模态 在 同一个 模型 里边。 第二 我 觉得 他 应该 大 概率 是 基于 GPT 这个 架构。

这个 是我 一直 想 强调 的 一个 事情。 我 认为 语言 模型 最大 的 作用 就是 建立了 这个 认知 的 基础。 因为 有了 认知 你 做 很多 事情 就 会好 很多。 我 一直 举 一个 例子, 比如说 你 要 叫 一只 猴 炒菜, 跟 你 教 一个 小朋友, 哪怕 六岁 的 小朋友 炒菜, 这是 难度 是 不一样的。 因为 这个 小朋友 建立了 对 这个世界 的 认知, 它 有 个 认知 模型, 炒菜 的 时候 你 就可以 用 语言 跟 他 描述 怎么 炒 吧? 然后 很多 常识 它 都有 一只 猴子, 他 可能 就是 没有 认知 的 基础。 炒菜 这个 本身 是 一个多 模态 或者 是一个 具 身 智能 的 任务, 所以 有了 认知 模型 的 基础, 我 觉得 你 后面 的 多 模态 什么 狙神 智能 什么 agent 的 才有可能。

这 第一 它是 大 系统 的 模型。 第二 就是 刚才 讲 的 它是 以 这个 语言 模型 作为 一个 认知 的 基础, 在 这个 模型 里边 去 加入 别的 很多 感知 的 模态。 我 认为 要 做到 它 这个 效果 还是 有 一定 难度 的。 为什么呢? 比如说 我们 模型 工厂 那个 模型, 它的 原理 也是 这样的。 首先 我 把 这个 声音 我也 把 变成 token。 这里 边 说 你 要把 它 变成 大一统 的 模型, 可能 很 重要 的 一个 基础 就是 要 能被 所有的 模态 都能 变成 token。 跟 文本 一样。

像 我们的 那个 模型 工厂 的 配音 的 模型, 我们 确实 就是 去年 4月份 就 开始 说, 我在 语言 模型 的 基础 之上, 我 加入 声音 的 训练。 声音 全部都是 跟 文本 一样 变成 token, 无论是 输入输出 都是 token。 它 这个 模型, 比如说 我们的 语言 模型 可能 是 非常 小的, 也就是说 它 就 只能 做 配音 这个 事情。 即使 你 要 如果你 要 去 问 他说 很 复杂 的 这种 各种 问题, 知识类 的、 百科 类 的, 或者 甚至 推理类 的 东西, 他 可能 都 不行, 因为 他的 语言 模型 太弱 了。

那你 可能 会 问 就是说 那你 为啥 不用 一个 大 的 语言 模型, 然后 在 大 的 语言 模型 的 基础 之 上去 加 声音 呢? 对 吧? 一个 就是你 要 有一个 很强 的 语言 模型, 而且 因为 你的声音 的 数据 是 非常少 的那 你 语言 模型 的 数据 是 非常 多 的, 对不对? 那 这个 时候 你的声音 加进去, 可能 你 这个 模型 出来 连 发音 都 发 不 出来。 而 你 看到 现在 它 这个 东西, 一方面 他 又 能够 做 语音 的 生成 和 理解, 另外 一方面 他的 语言 能力 本身 就 文本 语言 认知 能力 没有 下降。 甚至 你 看到 那个 博客 上 的 那些 指标 什么 在 那个 M M L U 上面 这个 4O的 模型 的 文本 的 认知 能力 是 强于 GPT4 的。

这个 我 认为是 还是 很难 的。 就是你 怎么能够 做 一个 超大规模 的 模型, 有 认知 的 能力。 在 这个 基础上, 你 又又 能够 加入 多 模态 的 能力。 而且 之间 完全 都 是用 prom 的, 能 自由 切换。

通过 prom 的 方式, 比如说 你 去, 比如说 sorry, 那 可能 就 很难 做到 这种, 对 吧? 你 很难 用 prom 的 方式 可以 自由的 去 给 它 instruction, 去做 各种各样 的 事情。 所以 这个 是 以 GPT 为基础, 就是 一个 统一 的 架构。 所有的 token 进去, 又有 认知, 又有 很大 的 认知 的 能力, 加入 别的 模 不太 能够 自由的 切换, 我 认为 这个 还是 很大 的 一个 突破。

复刻 它 有 多难? 还是 需要 的 是 更多 的 算 力, 算法 还是 数据?

我 觉得 就是 看见 以后 大家 产生 信仰 就 没 那么 难 了。 但是 过去 这 一切 都 证明 了 这个 东西, 比如 骚扰 这个 东西, 你 想 不想 不 出来 吗? 也 想象 出来 GPT2 之后 就 没有 什么 新 东西 了。

原理 上 我 觉得 所有的 一切 都 能够 想 得 出来, 都能 预知 到。 但是 第一 是你 有没有 这个 钱。 第二, 你 就算 有 这个 钱, 你是不是 能有 这个 信仰, 说 我就是 把 这个 钱 全部 砸 进去, 就 干 这么 一个 事情, 就是 用 这条 技术路线, 这个 是 更难 的 地方, 就是 包括 哪怕 是 今天, 比如说 我不知道 你们 有没有 注意到, 比如说 它 这个 模型, 它的 助手 的 模型 是 没有 视频 生成 的。 它的 视频 生成 无论是 google 还是 OpenAI, 又是 另外 单独 的 一个 模型。 它 现在 是 有 声音 的 生成, 就在 那个 大一统 的 模型 里面, 它 应该 是 没有 视频 生成 的那 这是为什么? 对, 这就是 因为 sorry, 它 就 不是 用 这个 所谓 的 自 回归, 不是 用 G B 架构, 大家 都说 他是 用 D I T, 就是 diffusion 的 架构。 所以 我 就 一直 觉得 很 好奇 对 吧?

就是说 OpenAI 它 作为 GPT 的 始祖, 那 他们 为什么 没有? 但 我相信 他 一定 在 做, 对 吧? 他 一定 就是说 但是 他 第一个 版本 或者 他 发出 来 这个 骚扰, 他 就 不是 用 自 回归 的, 也就是说 这个 东西 没有 被 人 做出来。 第二 就是说 就算 做出来, 没有人 对 这个 东西 有 信仰, 说 我就是 应该 用 一个 自 回归 的 模型。 就是 无论是 理解 跟 生成, 多 模态 的 理解 跟 生成, 在 一个 模型 里边 全部都是 自 回归。 这个 当然 我相信 open I 一定 有人 在 做, 但是 他 是不是 把 这个 东西 当做 一个 all in 的 方向, 这个 不清楚 T.

P T 负 O 和 sora 相对来说 哪个 更 重要, 对于 今年 的 大 模型 市场 来。

我 偏向 于 认为 我自己 的 信仰, 就是 大家 在 有没有 钱 是 另外 一 回事。 我的信仰 是我 认为 就 应该 这个 大一统 的 模型, 应该 基于 这个 自 回归 理解 和 深层 放在 一起 早点 学。

是 另外一个 分支 去了。

它是 只是 生成, 它是 基于 这个 diffusion, 不是 基于 这个 自 回归 的。

他 可能 是 OpenAI, 可能 上面 还有 很多 团队, 他 自己 长 出来 的 一个 团队。 是的, 他的 那个 也很 年轻。 他 对 因为。

对 工程师 他 也有 自己 的信, 他 觉得 自 回归 不 靠谱, 他 觉得 d fusion 更 靠谱, 然后 可能 他 就 相信 那个 东西。 为什么? 我 觉得 从 这个 整个 长期 来说, 我 认为 自 回归 就 应该 统一 这个 东西。 就是 因为 自 回归 它 可以 提供 一个第一次, 已经 证明 了 你看 声音 是 放在 自 回归 模型 里边, 确实 非常 好, 而且 G B D 是 典型 的 自 回归 模型, 对 吧?

它的 很 好的 好处 是 你可以 通过 prom 的 方式 非常 自由的 跟 他 进行 交互。 然后 你可以 做 所谓 的 few shot, 就是 它 可以 做 encounter sly。 这样的话 你 就可以 很快 的 适应 这种 新的 任务。 也就是说 从 最终 的 用户 的 角度 来说, 这种 是 会能 提供 一个 非常 自由的 接口。 这 可能 是 过去 这 两年 大 模型 如果 从 除了 原理 以外 是 最大 的 突破。 就是 因为 你可以 通过 语言, 通过 这种 prom 的 方式, 不能 给他 举例子, 他 就 能够 给你 立马 学会 这种 新 任务 的 这种 能力, 这 可是 最大 的 进步。 所以 我 觉得 我们 应该 在 这个 GPT 最大 的 优势 继续 往 下去 发展。

而且 事实上 现在 至少 目前 看你 从 那个 演示 来看, 除了 视频 的 生成 不在 这里 边 以外, 另外 图片 的 理解 也 在 里边 了。 因为 理解 跟 生成 就是 具体 的 记 技术细节 有 一些 不一样。 但 不管 怎么样, 它 只 差 了 一个 视频 的 生成, 就是 在 那个 视频 是 更难 一些。

所以 最晚 才 进来。

因为 视频 肯定 比如说 你 就 从 一个 很细 的 细节, 比如说 你 一秒钟 可能 就说 几个字, 或者 你 能 打 几个字, 然后 声音。 如果我们 要把 它 token ize 成 token 的话, 一般 现在 的 这个 token ize 或者说 也 可能 就是说 几十个 token 1秒钟, 对 吧? 这样 才能 做到 无损 的 那个 表示。 然后 如果 是你 一个 视频 的话, 可能 可能 就要 几百个 token 1秒钟。 它是 一个 文字 到 声音 到 视频 每一个 这 都是 至少 是一个 数量级 的 token 长度 的 要求 的 提升。 因为 这个 token 长度 就 决定 了 L G P T 的 inference 的 成本 速度 能不能够 实时 都 完全 取决 这个 token 的 长度, 就是 在 模型 规模 是 一样的 情况下, 就是 你的 上下文 到底 有 多长。

我不知道 大家 有没有 注意 一个 细节, google 不是说 他 发布 了 这个 模型 是 200万的 token, 你看 这个 可以 是什么 十万 行 代码 还是 什么 来 的, 就是 差不多 是 可以 放进 10万行 代码。 2个小时 的 视频 这个 东西 其实我 觉得 是 非常 有意思 的 一 东西。 就是说 如 过 你 有 200万的 token, 未来 也就是说 你 把 1个小时 的 视频 放在 这个 GPT 里面 去, 你是 可以 对它 进行 非常 深度 的 理解。 但 这次 他们 没 怎么 去 讲 这方面 的 应用, 但 我 觉得 是 非常 革命性 的。

比如说 你看 google 好像 有一个 例子, 比如说 index 你 所有的 照片。 那个 照片 你可以 问个问题 说, 我的 小孩子 什么时候 学会 游泳 的? 他是 怎么 一步一步 进步 的对 吧? 你 想想 一个人 你 要把 所有的 照片 翻出来, 你 要 总结 出来 都 比较 难。 但是 一旦 你 发 了 index, 就是 把 所有的 图片 跟 视频 放在 一个 context 里面, 然后 又有 语言 模型 的 这种 认知 能力、 抽象 能力, 那 他 就能 回答 这种 以前 完全 不可能 的 问题。 包括 就是 比如说 你 现在 给他 一个 监控录像, 你知道 当时 这 发生 的 一个 事件 可能 是 有 两个, 你知道 是在 几点 到 几点 之间, 比如说 8点到10点 之间, 那你 只用 把 这个 2个小时 的 视频 塞 给 未来 多 模态 的 模型, 对 吧?

然后 你 问 你 用 自然语言 问 他 一个 问题, 你说 这个 里边 的 当时 这个 人是 假设, 就是 他是 怎么 摔倒 的。 就是 假设 是 最后的 结果 就 有人 摔倒 了, 伤 的 很 厉害, 然后 他 跟 别人 说 我是 被 那个人 推倒 的。 其实 基。 他是 有 能力 是 把 整个 来龙去脉 全部 给你 总结 的 很 清楚。 就 如果 他 也 声音 也 录 进去 了, 对 吧? 当时 他们是 怎么 吵 的, 因为 什么 原因 吵吵 了, 谁 先 动手, 动手 以后 又是 到底 是 推 的, 还是 他 自己 假装 倒 下去 了。 那你 讲 一个 原因。 要 去 分析 整个 过程, 你 可能 要 看 好久 对 吧? 但是 未来 有 这个 多 模态 的 模型 就 很 简单。

我 注意到 他们 对于 这个 模型 有一个 描述, 是 它 更 具有 人性, 更 具有 人性 背后 是什么 作为 支撑?

他 其实 想说 的 就是说, 因为 是一个 端 到 端的 系统。 比如说 这个 声音 的 对话 过程中, 因为 以前 的 pipeline 的 系统, 你的 很多 信息 因为 是个 pipeline, 你说 一句话, 我 先 做 语音识别, 转成 文字, 原 文字 再去 理解, 理解 我 再去 找 一个 答案, 找 了 一个 答案, 我 再 又 把 它 转成 这个 声音, 是 这么 每一个 步骤。 比如说 你说的 那句话, 做 语音识别 过来 的 时候, 你的 情感 的 那些 标签 都 没了。 就是 以前 就是 没有 说 你 当时 说 那句话 的 情感 是什么, 那 我 回来的 时候 也 不可能 也 对应 的 正确 的 情感。 但是 如果 一到 端 到 端 就 没有 刚才 那 几个 步骤, 所有的 信息 全部 都在 一个 模型 里面, 没有 被 丢掉。 所以 这个 时候 才能 像 人 一样 说, 你 当你 跟 我 分享 今天 一个 很 开心 的 这个 消息 的 时候, 那 我 可能 是 什么的, 吧? 就会 做出 这样的 反应。 对, 更 多是 一切 的 一切都是 因为 端 到 端端 到 端 背后 是 说 你 在 一个 大一统 的 模型 里面 糅合 了 所有 这个 东西。 你 没有 做 p yell ine 的 决定, 因为你 做 pipeline, 就是我 前面 丢掉 了 信息。

后面 就 看不见 了。 对它 为什么 叫 GPT.

做 O O 不就是 全能。

为什么 open I 这 几次 发布 它 都 没有 沿着 它的 主线, 就 我们 以为 的 可能 会 把 GPT4.5 或者 GPT5, 但是 还 先发 了 一个 sorry, 又 发 了 一个 GPT, 是不是 也 说明 技术 迭代 曲线 方法。

就是我 觉得 看你 期望 的 技术 迭代 是 哪个 方向。 如果你 期待 的 迭代 方向 是 说 它的 推理 能力、 规划 能力 变得 更强, 那 肯定 现在 是 没有, 对 吧? 如果 你的 期望 是 说 他 能够 更加 有用, 真正 应用 基于 GPT 模型 能 做出 很 好的 应用, 那 我 认为 这个 多 模态 是 更 重要 的。 因为 你的 推理 跟 规划 考 的 是你的 智商, 但是 就是说 你 这个 模型 能不能够 能 说话、 能 看 图, 能 生成 视频, 没有 最 这个 动作。 这 作为 一个人, 就是你 要在 社会 上去 进行 交互, 并 不见得 每个 人都 需要 180的智商。 但是 你 总得 能 说话, 你 能 走路, 你 能够? 我 认为 这些 技术 点 是 更 重要 的, 而且 我 觉得 这 东西 也 同样 的 难。 就是 刚才 说到 就是说 你 在 语言 模型 加入 别的 模态, 你 既 能 保持 语言 模型 的 能力, 又能 别的 能力 也 能够 进去。 这个 事情 不是 一个 那么 容易 的 事情, 你 可能 要 做好 多 实验。 这 也 是从 这点 角度 说, 我们 必 就 给 OpenAI google 这种 credit。

大家 都说 没什么 新的 技术, 那你 做 一个 给我 看看, 对不对? 为啥 人家 就是 第一个 做出来, 那就 只能 说明 了 两点。 第一, 人家 真是 有钱, 因为他 可能 做了 各种各样 的 实验。 因为他 有钱 可以 同时 做 很多 实验? 第二 人家 的 人才 密度 还是 强。 这些 人 一方面 有的 对 未来 有 自己的 判断, 对 算法 的 原理 非常 清楚, 有 很强 的 工程 能力。

他们 就是 代表 了 全世界 最前沿 的 团队, 而且 他们 在 推动 的 这个 技术 方向 的 进步, 就是 比如说 学术界 对 吧? 那 学术界 讲 这个 多 模态 的 理论 肯定 是 一大堆 的 各种各样 的 理论。 但是 你 想想, 如果不是 这 两个 公司 面对 全球 所有的 眼光, 在 他们 所有的 眼光 的 关注 下 高度 竞争, 怎么 可能 半年 的 时间 能够 从 去年 的 R T two 什么 german I 到 今天 这个 地步 呢? 如果 是 靠 学术, 或者 靠 咱们 别的 这些 没钱 的 公司, 或者 人才 密度 不够 强 的 公司, 可能 十年 都 不会 有 这种 进展。

在 所有人 的 目光 瞩目 下 做 实验。

对我 觉得 我们 还是 得 给 他们 足够 的 尊重。

你怎么看 后来 google 在 第二天 的 反击 呢? 就 他们 两个 的 表现 谁 更优?

这 两个 就是 真的 是 两个 演员 的 感 演员, 就是 两个 不同 时代 的 企业, 或者 甚至 两个 不同 属性 的 企业。 高价 总结 的 很好, 就是说 发布会 就是 特别 像 一个 看 国企 各个部门 的 汇报 的 会议。 他 不是 发 了 一百多个 产品, 对 吧? 然后 每个 部门 上 来讲 五分钟, 讲 十分钟, 又 搞 了 一堆 新的 产品 的 名字。 比如说 你看 视频, 视频 生成 又 搞 了 一个 will, 以前 他的 名字 就 已经 多 到 我 都 记不住 了, 什么 video point world, 什么 luma, 什么什么 一大堆 对 吧? 最近 又 搞 了 一个 新的 名字, 我不明白 他 到底 想 干 啥, 对 吧? 所以 从 这个 角度 来说, 整个 发布会 的 效果 不知道 open, 是不是 提前 知道 了, 就是 提前 就 临时 搞 了 一个 发布会, 为什么 你们是 这么 猜 的?

网上 不是 有 很多 照片, 他们 那个, 你看 三个 奥特曼 也 没上去, 就是 一个 二三十个 人的 就 做了 一个 演示, 我 觉得 这就是 两种 不同 的 风格, 我 觉得 那 都 应该 给 他们 足够 的 尊重。 还是 比如说 google, 我 觉得 它的 不同 的 认知 就是说 你看 OK, 我的 搜索引擎 可以 这么 搞, 我的 照片 应用 可以 这么 搞, 我的 gmail 可以 这么 搞, 我的 youtube 可以 这么 搞。 就 除了 基础 模型 本身 的 提升 以外, 发给 大家 看到 的 是 很多 这种 多 模态 的 A I 能够 成熟 的 时候, 能够 跟 他 以前 的 这种 海量 用户 的 应用 结合起来, 会有 什么样 的 想象 空间?

我 觉得 这个 效果 还是 达到 了, 只不过 就是 对 绝大部分 普通 吃 瓜 群众 来说, 它 这个 效果 就 很差。 搞 了 两个 多 小时, 珍贵 人家 20分钟, 而且 人家 比你早 一天。 因为 所有的 观众 都是你 前一天 做到 了, 你 第二天 还 一样 的话, 就 觉得 你 就 抄。 虽然 那 不可能 抄, 怎么 抄, 对 吧? 怎么 可能 抄 的 这么 快? 对 google.

除了 他们的 汇报 形式, 对 他们的 技术, 实际 技术 你 觉得 和 open I 的 不一样 是吗?

我 看不出来, 我 觉得 就是 高度 的 同质化。 搜索 能力 就是我 觉得 一方面 是 模型 的 能力, 一方面 是 这个 模型 跟 用 结合 的 能力。 我 觉得 从 模型 的 能力 角度 来说, 我 看不出 有什么 本质性 的 差别。 但是 从 展现 出来 的 应用 形态, 我 觉得 google 还是 更加 强大 的, 肯定 是 更加 丰富 的 一个 生态。 因为 它 从 T P U 都 到 操作 系 里面, 怎么 操作系统, 什么 边缘 计算 对 吧? 再到 上面 的 各种 应用 的 结合, 全部 都有。

比如说 他 跟 搜索 结合 会 蚕食 他 原有 的 搜索 市场。

用户 的 习惯 的 迁移 这个 肯定 发生。 这 对他 来说 不是 一个 问题, 就是 一个 升级换代。 你 可能 问 的 就是 更多 就是 对他 已有 的 商业模式 会 不是 一个 挑战。 对 比如说 广告 这种 商业模式 会 怎么样, 对 吧? 这个 我没有 很强 的 判断, 但 我的 直觉 就是说 多 模态 的 这种 模型, 这种 交互 一定 会 让 你 广告 的 形式 会 变得 更加 丰富, 更加 精准。 所以 从 这个 角度 来说, 我 认为是 不会 的。

在 open I 开 发布会 的 与此同时, 依恋 也 离职 了。 你 怎么 看待 他的 离职, 让 你 觉得 对于 后续 open 有什么 影响?

我 其实 发 了 一个 朋友圈, 就是你 今天我 大概 重复 一下 那个 观点 对 吧? 我 觉得 今天 OpenAI 肯定 从 技术 能力 角度 说, 肯定 不 缺 一个 一点。 但 我 觉得 很多 时候 一个 技术 leader 的 作用 就是你 怎么 来做 一个 技术 战略 的 取舍。 这个 东西 第一 这个人 需要 有 很强 的 技术 的 vision, 对 未来 有一个 很 强烈 的 判断。 第二 它是 有 这种 真正 做大 的 决策 的 自信心 跟 能力, 还有 大家 要 信任 他, 我 觉得 至少 如果 去 看 以前 的 GPT 的 这些 GPT1GBD3 这些 我 认为 都 是要 有 信仰 的, 这个 决策 应该 是 起到 了 这个 作用。

现在 比如说 我们 刚才 前面 聊到 的 说 你的 GPT 的 模型 能不能够 把 视频 生成 也 做到 这里 边 来。 而且 全部 就是 大一统 的 这种 自 回归 的 这种 方式, 这个 可能 就是 一个 豪赌。 如果你 没 赌 对, 可能 真的 你就是 花了 很多 钱。 然后 你 可能 比 google, 比 另外一个 读 的 就 晚 了 三个月。 现在 的 竞争 是 晚 三个月, 那是 很 致命 的对 吧? 但是 如果你 读 对了, 那你 可能 就 领先 三个月。 所以 这个 就是我 觉得 OpenAI 这样的 公司 肯定 是 需要 这样的 技术 力 的。 他们的 C E O 是 绝对 不可能 有 这种 能力 的那 他 新的 这些 什么 首席 科学家 有没有 这个 能力, 这个 我们 不知道, 因为 没有 太多 他的 信息。

我 觉得 这 可能 是我 那个 朋友圈 是 写 的 很 叫 什么 大舍 大 得, 大赌 大 赢, 对 吧? 其实 这个 听起来 很 玄乎, 但 事实上 就是这样 的。 你 想想 当年 那个 GPT1 的 时候, 他 能够 很快 出来, 大家 所有的 学术界 全部 都 认为 对的 是 对的, 他们 就 搞 decode only, 那 这个 东西 还是 带来 很多 好处 的对 吧? 就是 简单, 能 通用。 包括 就是你 在 做 GBD3 的 时候, 你 能够 第一个 做 1750亿 的 参数, 把 公司 所有的 计算资源 全部 往 这 里面 怼。 我 认为 这 是一个 是 需要。 比如说 我 去做 这个 事情, 我 可能 就 做不了 这个 决定。 你 下面 的 人都 是 聪明人, 都会 告诉你 这个 不 靠谱, 那个 不 靠谱。 每个 人都? 包括 都会 跟你讲 说 算 力, 你 不应该 这样, 对 吧?

但 我们 不知道 伊朗 具体 的 决策 是 啥, 但 不管 怎么样, 他 当时 首席 科学家 没有 他的 许可, 他 哪怕 不 阻拦, 就是 很大 的 一个 决策。 他 不 一定要 自己 提出 这个 选择, 他 甚至 都 不需要 去。 做 这个 选 哪一个, 他 只要 做出 一个 决策 说 OK 我 OK, 因为 他是 负责 一个 责任 的, 对 吧? 比如说 你 一个 没有 这个 卫生 的 人, 他 肯定 说 那 我们 再 讨论一下, 或者 我们 再 想想, 或者 是 你们 两个 都 做做 实验 给我 看一看。 大部分 这种 决策者 他 会 这 样子, 对 吧? 所以 我 觉得 伊朗 更 多是 这样的 角色。 就是 因为我 觉得 在 未来 这个 技术 本身 肯定 是 没有 说 一定 就 一定 是 这样 open。 要 能 他 还得 往前走, 要 一直。 而且 他 大家 对 他的 期望 不是 一个 普通 的 公司, 他是 要 真的 要有 很强 的 反 共识 能力 的, 然后 有 很强 的 这种 赌博 的 能力 的那 这些 东西 新的 C E O 别的 那些 人我 觉得 肯定 没 这种 能力 的, 因为 他不懂。

你怎么看 项目 这个人, 我 觉得 他 现在 也 比 以前 更有 争议 了。

我 非常 不 喜欢 这个人。

为什么 非常 不。

喜欢我 看过 他的 几次 采访, 但 我 这个 观念 是在 去年 就 形成了。 我 后来 我也 懒得 关注 他, 我 从来 都不 关注 他。

这个 采访 是 在在 他们 那个 宫斗 事件发生 之前。

我 去年 3 4月份 的 时候, 我 看过 一年 的 几次 采访, 我 看过 这个 sam 的 几次 采访。 至少 我 作为 一个 观众, 我 从来 没有 从 他的 采访 里面 获得 任何 认知, 听到 的 全部都是 废话。 政治 正确 的话, 然后 一年 你 能 他 能够 跟 你 他是 一个 工程师, 同时 又是 带有 一点 哲学家 的 这种 味道, 也是 一个 科学家。 他 能够 把 哲学 的 思考 跟 科学 的 信仰 到 工程 的 最终 大概 我们 应该 怎么做 取舍。 就是你 能 看到 他的 感受到 他 很 背后 的 很多 这种 思考, 他的 这个 思想。 而且 我 认为 他 还是 一个 至少 受 这个 采访 是一个 比较 真诚 的 人。 你 问 他 问题 的 时候, 他 会 尽量 的 去 正面 的 回答 你。 就 从 这 两种 风格, 我 天然 就 不会 喜欢 sam 的 这种 风格。

你 觉得 sam 不 真诚, 一点 都不 真诚, 不 拉 了 很多 在 自己 不懂 的 地方 装 水 糊弄 一下。 对, 就是 非常 浮夸, 比如说 动物 的 就是 岩壁 称 A G I 什么 芯片 要 用 7万亿, 17万亿 对 吧? 就是我 觉得 因为 可能 就 我的世界 是 这样, 如果我 觉得 你 这个人 说 的话 都不 靠谱, 你说的 任何 东西 我 都 不想 听 的。

那 马斯克 是 这样的 吗?

所以 我 觉得 他们的 特点, 我 其实 有 一次 我是 总结 过 的。 我 觉得 他们 就是 宏大 叙事, 有限 交付, 这是 他们的 特点。 你 看到 没有? 他们 特点 就是我 先 给你 搞 一个 宏大 叙事 的 一个 事情, 吧? 跟 大姐 说 你就是 来自未来 的 人, 对 吧? 但是 他们 跟 那些 骗子 不太 一样, 因为 绝 大部 骗子 是 不做 交付 的, 他们 做 有线 的 交付, 他的 交付 跟 他 前面 说 的 一定 是 差距 很大 的。

我 本来 有 一次 我想 发 个 朋友圈, 我 觉得 这 对 科技 来说 挺 可悲 的, 某种程度 上 是 很 可悲。 但是 后来 我也 没没 发现, 我 觉得 可能 对 普通 大众 来说, 只有 他们 这种 才能够 大众 才能 认同 他们, 才能 理解 这个 科技, 才 愿意 给他 更多 关注。 有了 关注 他 才能 拿到 更多 资源。

那你 就 项目 跟 马斯克 是 一类。

人我 觉得 是我 觉得 一个 mask 可能 如果 在 这 两个 之间, 我 可能 会 更加 偏向 于 elon 马斯克。 虽然 他 也是 大嘴巴, 或者说 红 大趋势 无限 吹牛, 但是 最后 做 有限 的 交付 往 下一个 方向 跑, 对 吧。 但是 我 觉得 in on mask 给 人的 感觉, 比如说 你 不管 怎么样, 他 做 的 这个 电动车 这个 事情 是 非常 难 的, 他 能够 这么 坚持 的 做 下去。 而且 确实 他 虽然 是 宏大 叙事, 但 我也 觉得 他 应该 还是 在 一线 要 干 很多 事情。 从 这个 角度 来说。

你 今天下午 不在 一线。

我不知道, 我 没看到, 至少 就是我 我 就 跟 他说, 我 觉得 我 也不 认识 他, 对 吧? 就 是从 我的 角度, 我只是 从 一个 很 抽象 的 角度 去 看 这个人。

这个 很 有意思, 难道 不是 共识 吗? 也 或许 大家 会说 sam 是一个 很 政治化 的 人, 但是 我没有 听 过 别人 说 我 特别 不 喜欢他。

我 觉得 某种程度 上, 我 觉得 他 会 把 open a 带 向 一个 很 平庸 的 境地, 成为 一个 大公司 不能 成为 一个 大公司 还是 一个 问题, 但是 它 会 把 open I 带。

向 一个 平庸 的 公司。 你 觉得 GPT5 比 你 想象 的 来得 晚 吗?

我 一点 不 关心 这种 东西。

为什么? 就 模型 能力 的 提升 这条 线, 你 会 怎么 不知道。

GP65只是 个 数字, 你 又 不知道 GP65 有什么, 你为什么 关心 这个? 而且 我自己 觉得, 我 还是 觉得 如果你 要 我 选择, 我 认为 就是说 在 今天 GPT 基础 之上, 把 多 模态 真正 把 它 做好。 因为 就是现在 这次 的 无论是 google 的 还是 OpenAI, 它 只是 一个 演示。 而且 这个 演示 是 这些 工程师 产品 经理 自己 在 演示, 不是 普通用户 的 使用。 我 能 想象 在 接下来 的, 比如说 哪怕 是 你我 这样的 科技 用户 应用, 一定 是 跟 他的 演示 东西 是 天差地别 的, 更 别说 那些 硅谷 以外 的 世界。 因为 我们 以前 做 语音助手, 我 演示 给 你看 的 时候, 你 都 觉得 我 就是 以前 我 演示 给 所有人 都讲, 这个 好 棒。 然后 一旦 买 了 我们的 手表, 用了 我们的 语音助手, 我 就 变成 终身 客服, 你知道 吧?

因为 你的 科技, 刚才 前面 讲到 前沿 科技 很大 的 问题是 不成熟, 对 吧? 所以 我 觉得 我 更 期待 的 是 说, 他们 真的 能够 把 一个多 模态 的 模型 做到 极致。 这个 东西 决定 了 能不能够 有 好的 应用。 你 推理 能力, 第一 是 技术 突破 会 比较 难。 第二 我 觉得 今天 大 模型 没有 出现 kilar APP, 并不是 因为 GPT 的 智商 还 不够 好, 而是 因为 刚才 说 的 这些, 比如 多 模态 就是 一个 非常重要 的 一个 peace。 没有 这个 东西 我 觉得 就 很难 这个 应用 的 空间 很难 打开。 所以 就是我 更 希望 多 模态 做 的 足够 好。

然后 第二, 能够 把 深层 跟 理解 都 统一 到 多 模态 的 这个 大 模型 里边, 而且 是 最好 就是 用 我说 的 自 回归 这种 方式。 然后 在 这个 之后, 能够 把 这个 多 模态 的 下一步, 就是我 能够 把 自身 智能 的 东西 结合 进去。 因为 还有 动作。

也是 在 这个 架构 里面。

对, 然后 再 后面 才是 说 我的 推理 能力 是不是 有 更强 的 提高, 然后 这个 以后 才 会有 所谓 的 agent 如果说 我们 一定要 有 一条 路径, 我 认为 这条 路径 比如说 现在 转 agent 的, 我 认为 就是 没有 意义 的。 因为 你的 基础 根本 就 不 踏实, 就 空中楼阁。 我 去年 就说 过去 年 就是 没有 好的 多 模态, 没有 好的 推理 能力, 你 在 agent 就是 空中楼阁。 如果 这样的话, 你 今天 做 的 所有的 东西 都是 在我看来 都是 浪费时间。

聚 生 智能 现在 的 瓶颈 是什么?

那个 就是 完全 的。 第一 是 我们 如果 纯粹 从 算法 原理 角度 来说, 吧? 我 刚才 说 智能 肯定 需要 有 多 模态。 因为 一旦 涉及到 一个 物理 世界, 就是 一个多 模态 的 世界。 那你 还有 后面 就是你 得 有 这个 环境 的 适配 的 能力。 比如说 今天 的 GPT 的 模型, 它是 不会 动态 适配 的。 它 现在 的 环境 就是 一个 语言 的 虚拟 虚 语言 构造 的 虚拟 的 环境。 说 的 很 抽象, 它 就是 这么 一 回事, 因为 它 就是 个 虚拟世界, 对 吧?

但是 一到 物理 世界 为啥 一定要 有 多 模态 呢? 因为 物理 世界 比如说 你进来 这 我 这个 房间? 机器人 我 首先 得 有 摄像头, 我 得 有 各种 传感器 碰撞传感器, 我 才能 感知 我 周边 这个 环境。 但是 光 感知 还 不够, 我 还得 是我 还得 adjective 去 适应 它。 因为 否则 的话 我 这个 模型 就 不 通用。 我 换 一个 房间, 你 这个 机器人 就 不行了。 所以 这些 东西 我 觉得 都是 很难。

但是 我 觉得 多 模态 这种 巨型 智能 环境 的 适应, 我 觉得 这些 问题 至少 从 原理 上 是 和解 的。 但是 你说 推理 能力 能够 变得 多 强, 已有 的 这种 套路 可能 真的 是 不无 解 的, 因为 现在 大家 套路 无非 就是说 我 用 更大 的 规模 嘛, 在 已有 的 这个 架构 里面 你 可能 也 加入 不了, 虽然 什么 q star 对 吧, 但 那些 东西 我们 都 没看到 嘛, 所以 就是 总结 来说, 与其 去 追问 说 GPT5 什么时候 出来, 推理 能力 能 什么时候 变强? 我 更多 问 的 是 说 你 这个 多 模态 的 模型, 现在已经 demo 的 能不能够 做 的 非常 的 稳定, 真的 是 可用。 这个 是我 觉得 需要 很多 技术 上 的 打磨 的。 第二, 你的 视频 的 生成 什么 能不能够 都 集合 到 这 里面。 第三 就是 什么 聚 生 智能 东西 能不能 加进去。 第四 才是 说 这个 推理 这种 的 东西, 然后 再 什么 agents.

你 觉得 中国公司 追 他们 刚 发布 的 这些 形态 需要 多长时间?

好 追 吗? 就是我 觉得 如果 只是 加上 声音 的 模态, 是 应该 不是 那么 难 的。 这个 不好 说, 你看 因为 它 这个 是 图片、 视频、 声音 文本, 以 文本 为基础, 后面 三个 东西 都在 里面。 那 如果 只是 加 声音, 比如说 我们 自己 就 做出来, 只是 我们 那个 声音 模型 只能 做 配音, 不能 做 问答。 原因 是因为 我们 那个 语言 模型 不够 大。 我们 只要 逐步 的 语言 模型 足够 大 了 以后, 我 还是 这个 声音 还 能够 用。 但是 这个 我 就 只能 做 一个 语音助手。 我 觉得 做 一个 端 到 端的 语音助手 这个 事情, 我 感觉 是 应该 不是 那么 难 的。

但是 就是说 你 加入 了 图片 跟 视频 的 模态 行不行, 这个 不好 说。 而且 包括 你 能不能 做到 实时, 就是 刚才 讲到 就是说 你看 为什么 语音 这个 实时 他 立马 就 做到 了。 因为 这个 只需要 你 今天 GPT 这个 token 的 influence 的 能力, 比如说 一秒钟 你 能够 出 几十个 token 就 够了。 因为 声音 就是 一秒钟 压缩 下来 就是 几十个 token。 所以 基本上 你 只要 把 刚才 那个 东西 跑 通 了, 你 可能 某种程度 上 你 什么 都 不用 干, 它 自然 就能 做到 实时。 但 视频 我们 刚才 说 了, 它是 又是 可能 二是 跟 是 跟 声音 比, 是你 需要 压缩 的 东西, 它 那个 一秒钟 表示 东西 可能 需要 20倍。

也就 说 你 今天 的 这个 GPT, 如果你 这个 大 的 模型, 你 要在 视频 上 做到 实时, 就是 精细 的 实施, 就是你 可能 需要 20倍的 速度 的 提升 这个 推理, 那 这个 东西 我 认为 本身 是 肯定 是 有 挑战 的对 吧? 当然 就是 这里 边 我也 挺 困惑 的, 比如说 你看 google 戴 的 那个 眼镜, 对 吧, 戴 着 眼镜 不是 看起来 也有 一个 实时 的 东西, 对 吧? 就是 实时 的 视频 的 这个 可以 实时 的 拍 个 视频, 然后 就可以 做 分析, 吧?

那 他是 怎么 做到? 我的 解释 就是说 因为他 可能 就是 做了 高度 的 压缩。 比如说 如果你 真的 拿了 一个 摄像头, 你 从 这一 拍 过去, 他 可能 会 miss 掉 很多 信息, 就是 有些 问题 他 就是 回答 不 出来 的。 所以 它 不是 一个 精细, 就是 能够 每 一帧 你 都 能够 很 精细 的 进行 分析。 然后 后面 要 问问题 的 时候, 每 一帧 他 都能 回答 的对 吧? 因为 反正 我 就 总共 就 我 一秒钟, 我 就 只能 处理 几十个 token。 那你 现在 的 视频 我要 做 进一步 正常 情况 下比 正常 情况下 还要 做 十倍 的 压缩, 那么 必然 就 丢失 了 很多 信息。 我 就说 你 刚才 说 问题, 就是说 做到 这个 实时 的 系统 图片 视频, 我 认为 这个 还是 有 一定 难度 的。 而且 中国 的 绝大部分 模型 公司, 据我所知 都 还在 转 语言 模型, 根本 就 没有 多 模态 的 能力, 就是 多 模态 模型 都还没 没没 跑 通。

对, 那你 用 豆包 没, 你怎么看 自己的 那个 发布会? 这 两家 开 完了 以后, 自己 也 在 国内 又 开始 卷。

我 从 去年 4月份 我 就 觉得 就是 这 样子 的, 必然 就 这 样子。 这 有什么。

自己的 大 降价。

必然 这 样子, 而且 会 趋向于 0, 无限 接 近于0。 因为 真的 这个 不是我 瞎说。 比如说 我 去年 9月份 十月份, 我 跟 一个 大 模型 创业者 聊天, 我问 他 现在 有什么 商业模式? 然后 他说 他在 我说 在 国内 有什么 收入? 他说 除了 他们的 A P P 里面 的 收入 以外, 还有 A P I 调用 的 收入。 当时 我 就说 了 一下, 我 觉得 这个 东西 我 建议 你 现在 就 直接 把 它 关掉。

大 模型 创业 公司 吗? 就 这 几家。

对, 就是 A P I 的 调用。 我说 这个 东西, 因为他 当时 跟 我说 一年 能 收, 反正 也 收 不少 钱。 具体 数字 我 就 不说, 反正 是 比较 大 的 一个 数字。 我 觉得 这个 东西 肯定 是 不可 持续的, 就是 没有 道理 说 你 能够 到 明年 还能 收到 这个 钱。 所以 我的 意思 说 这是 必然 的。 O K A P I 的 调用 的 成本 会 接 近于0, 这是 必然 的。

第二, 说到 字节 这样的 形式, 在 我们 AI1.0 时代 就 出现 过, 比如说 语音识别 T T S 的 调用? 包括 做 项目? 巨头 当时 他们 要 搞 to b, 一 进来 就是 免费, 或者说 真的 是 什么 一元 中标 不 都有 吗? 你记得吗? 对不对? 只不过 他们 过去 这几年 因为 经济 不好 消停 了。

那 字节 他 不是 to b 很弱, 对 吧? 他 进来 他 能 有什么 招 呢? 那 不就是 又 从来 来 一遍 呗。 我 觉得 这个 就是说 句 不好听 的, 这种 大公司 其实 所有 公司 都一样, 就是 穷 的 只剩下 钱, 那 怎么办? 那就 只能 这么 搞, 没有 什么 想象力。

字节 的 人 说 他们 预计 24年 年底 到 25年初, 企业 的 大 模型 占 用量 将 出现 一个 抖 可 上升 流量 激增 的 拐点。

你 认同 吗? 有可能。

但是 what 就 用 起来 了。

大 模型 对 整个 生态 是 好事, 对 创业者 不是 好事, 以 A P I 为 商业模式 的 公司 不是 好事, 对 整个 生态 对 用户 来说 都是 好事。 说白了 就是 巨头 们 免费 请 大家 用 大 模型 挺好的。 但是 你 对 比如说 对 一个 模型 公司, 或者说 我 以前 以 A P I 调用 为 主要 商业模式 的那 这个 时候 可能 真的 就是你 得 重新 想想 你的 商业模式 是 啥。

包括 自己 大 模型 公司 未来 会 怎么样 呢?

我不知道, 我 没法 回答 他们 会 怎么样, 就是我 觉得, 但是 我可以 讲 一些 抽象 的 东西。 我 觉得 今天 所有的 大 模型 公司 或者 在 大 模型 赛道 创业 的 公司, 包括 我们 这样的 公司, 我 觉得 都 思考 的 几个 最 核心 的 问题。 第一 还是 我 刚才 说 的, 我们 想象 一下 三年、 五年 以后 这个 充分 竞争 之后, 你的 位置 在哪里? 我就是 这是 最 核心 的 一个 问题。

基于 这个 再往下 想, 就是说 你到底 能 有一个 什么 可 持续的 商业模式。 有 上 一代 的 那种 做 项目 制 的, 我 觉得 这种 商业模式 至少 是 太苦 了, 对 科技 公司 来说, 就 苦 的 都 没意思 了。 我 觉得 做 的对 吧? 就是你 要 是不是 有一个 可 持续的 这个 商业模式, 那你 要 想 的 就是说 好 当 那个 第一 是你 能不能 找到 那个 生态 的 自己的 一个 定位, 生态 的 定位 对 吧? 这个 东西 是 很难 的, 就算 你 能 找到 那个 时候 你 还活 不 活 的, 或者说 是 为了 到 那个 时候 出现了 这么 一个 位置 的 时候, 你的 能力 是不是 就是 叫 什么? 不要 出现 隔 不 配对, 你 有没有 这个 能力?

比如说 你 今天 如果说 你 现在 认为 未来 我是 要 大 模型 公司, 我是 要 有一个 自己 超级 A P P, 有 比较 大 的 用户 流量, 然后 我的 商业模式 是 广告 变现。 假如 说 这个 上 你 今天 就得 琢磨 的 是 说, 我真的 能 hold 得 住 那个 位置 吗? 对, 什么 意思 呢?

就是说 比如说 我公司 是不是 有 很强 的 这个 产品 的 能力, 我真的 是不是 能够 了解 用户 的 需求, 很 敏锐 的 抓 到 他们的 某 一个 很小 的 点, 然后 做 起来? 我 有没有 很强 的 做 产品 的 能力, 我 有没有 这种 商业化 的 能力。 包括 如果说 你 如果 国内 你 觉得 不行, 我要 做 海外, 我 有没有 国际化 的 能力, 然后 才是 之前 模型 的 能力。 我的 意思 说 作为 大 模型 公司 也好, 做 应用 或者说 我们 说 采购 一体 的 公司 也好, 可能 都 得 思考 这个 问题。 因为 未来 非常 不确定, 我们 能 做 的 一切, 能 做 的 事情, 就是我 今天 让 我自己 尽量 准备 好。

产 模 一体 指的 是。

产品 跟 模型 一起 做。 如果说 你 不想 做 上 一代 的 那种 to b 项目 制 的 公司, 那 可能 这是 唯一 的 一条路。 因为 只 做 产品, 我 认为 至少 在 未来 三五年, 因为 这个 模型 本身 还在 一直都在 变化, 不可能 有一个 非常 成熟, 完全符合 你 产品 需求 的, 然后 你 还能 建立 壁垒 的 一个 产品。 这 可能 比较。 所以 最后的 壁垒 就是说 你 能不能够 产品 跟 模型 一起 做, 在产品 中 收到 一些 独有 的 数据, 而 不是 互联网 上 的 那些 公开的 数据。 某种程度 上, 形成 一个 所谓 的 数据 飞轮, 那你 就 可能 能够 做出 一些 不一样的 模型, 你的 产品 有 一些 不一样的 竞争力。

你 最近 跟 他们 交流 觉得 怎么样? A I 创业者 大 模型 创业者 今年 的 状态 大家 是 什么样 的?

我 不太 跟 大家 交流。

因为我 记得 去年 下半年 说。

我 现在 交流 的 反而 就 是非 科技 企业。

我看 你 写 了 个 朋友圈。

对, 真心 觉得 就是说 因为 科技 企业 的, 因为 自己 我自己 也 做了 很多年, 我 有 很 自己 很 强烈 的 一些 观点, 个人 的 事儿 我也是 挺 悲观 的, 这个 应该 能 看得出来。 我 觉得 没有 什么 新鲜事, 基本上 还是 熟悉 的 套路, 对 吧?

如果 定制 化 项 做 项目, 你说的 熟悉 的 套路 是 这个 吗?

就是 to V C 基本上都 这样的, 很难 找到自己 的 产品 或者 商业模式。 这些 问题 都是 这个 不是说 现在 的 创业者 不行, 都很 厉害。 这个 咱们 必须 承认, 我的 意思 说 还是 没有 突破 过去 的 这些 惯性。 当然 你 要 突破 惯性 本来 就是 很难 的对 吧?

所以 我自己 觉得 对我 更有 启发 或者 更 有意思 的 反而 就是我 因为我 在武汉 上学, 最近 有 一些 C E O 他们是 卖 大米 的, 卖 饺子 的, 然后 卖 零食 的。 这些 人员 我 认为 都是 非常 厉害 的 人。 因为 他们 不是 靠 我们 说 我 有一个 高学历, 我 有一个 什么 goole 科学家 的 光环, 然后 莫名其妙 就 有人 给 了 我 很多 钱, 然后 就 开始 他们 不是 的对 吧? 人家 都 是从 0到1, 一步 一步一个脚印 真正 做出来。 所以 他们 反而 是对 这个 行业 是 有 最深 洞察 的。 就是 哪怕 你 卖 个 大米, 比如说 我 跟 你 去 卖 大米, 我们 亏得 一塌糊涂。 肯定 的 在 人家 就能 卖出, 一年 卖 几十个 亿。

然后 赚 几个 亿。 有 学到 什么 门道 道 没?

我 觉得 是 第一 是 学习 他们 思考 的 方式。 其实 这些 人 反而 因为他 所处 的 行业 是 一些 传统 行业, 它是 可以 很多 方法论 是 可以 用 的 比较 深 的。 因为 科技 行业 最大 的 问题是 不确定, 刚才 前面 讲到 反而 有 很多 方法论 都是 不知道 怎么 应用, 这 也 不定, 那 也 不定。

这 锤子 找 钉子。

对, 就会 导致 你 就是说 你的 甚至 有时候 我 以前 我 就 刻意, 我就是 什么 战略 什么 鬼, 我 就 觉得 这个 东西 都 没什么 用, 对 吧? 但是 就是我 说 那些 传统 行业, 因为 它 更 多是 它 已经 发展 了 这么多年, 它 其实 形成了 很多 底层 的 这个 逻辑 经营 逻辑, 对 吧? 所以 他们 也是 非常 强调 说 这个 本质 是什么, 最底层 的 逻辑 是 啥。 我很喜欢 的 就是 听 他们说, 为啥? 我 就 比如说 我 看开 一个 餐馆, 这个 没什么 任何 门槛, 为什么? 凭什么 是你 能 做到 这么 大? 那 他 就会 跟 你 去 讲, 他们 是 怎么 思考 这个 行业, 他 找到了 某 一个 什么 点, 然后 又是 怎么 慢慢的 把 它 放大。 我 觉得。

了解 这个 过程 对 我们 去 思考 科技 是 有 帮助 的, 为什么呢? 因为他 那个 东西 是 日常 的 东西, 没有 那么 多 不确定, 技术 没有 不确定性, 用户需求 没有 不确定性, 他 把 这个 问题 就 变得 很 容易 理解。 拿着 那个 问题 再来 思考 科技, 那 你就是 想 哪些 东西 是你 尽量 把 它 那些 不确定 的 你 把 它 扔出去, 对 吧? 把 确定 的 东西 找 出来, 那你 可能 就能 套用 那些 方法论。 或者 至少 其实 方法论 并不 代表 你 一定 就能 做好 一个 公司, 很多 时候 但是 至少 能 帮助 你 理解 这个 行业 是 怎么回事。

那你 找到了 什么样 的 方法论 呢? 在 科技 的 行业 里面 能 找到 确定性。

所以说 你看 比如说 我 特别 不 喜欢 讲 战略, 最近 我 可能 跟 别人 一 聊天 一 聊 就 聊到 战略, 对 吧? 比如说 你看 战略, 其实 我们 每一个 公司, 只要你 C E O 你 一定 做 过 战略。 哪怕 是 就是你 最好 做 一个 很 好的 财务 的 预测, 未来 三年 的 这个 预算 的 规划。 这个 东西 本身 就是 一个 战略 的 结果。 如果你 能把 这个 东西 做到 极致, 其实 你的 战略 是 没问题 的。 但是 你 可能 从来 都 没有 思考 过 战略, 你到底 思考 过 什么东西? 你的 方法论 是 啥? 但是 我 觉得 比如说 包括 我 在武汉 学习, 还有 最近 跟 别人 聊, 就是 跟 传统 的 那个 聊。

我 就 觉得 比如说 你 战略, 你就是 第一 要 找到 几个 要素, 你 对 未来 有一个 vision, 基于 这个 vision, 你 找到自己 的 定位。 主要 两个 东西, 一个 就是 你的 这个 用户 价值 的 定位, 就是 你为什么 用户 提供 什么样 的 价值, 这 可能 是 最最 根本 的 东西。 其次 就是说 我 刚才 说 的, 因为 科技 行业 上 所在 的 竞争 是 非常 激烈 的。 你的 所谓 的 生态位 市场, 你 有了 这个 东西 以后, 你 再去 想 定位 很 清晰, 对 未来 想想 你 对 未来 的 看法 也很 清晰。 你 才是 说 我 短期 定 一个 很多 目标, 对 吧? 有了 目标 了, 你 接下来 就 走 我 到达 这个 目标 的 路径 跟 节奏 是什么? 你看 就 这 我 所以说 它 叫 什么 战略 六 要素。 你说 这个 东西, 以前 可能 我 去做 很多 选择 的 时候, 我的 脑海中 隐隐约约 也 想 过 这个 东西。

但是 我 从来 没有 这么 清晰 的 去 说, 只有 六个 要素, 这 六个 要素 里边 我要 问 什么 问题? 甚至 以前 想 的 很多 东西 的 时候, 你 可能 就是 miss 掉 其中 一个 很 重要 的 因素 的。 我们 失败 的 例子。 比如说 我们 2015年 去做 这个 智能手表, 不能说 失败, 我说 从 战略 角度 来说 也许 就是 不对 的。 回过 来去 看, 为什么呢? 比如说 做 智能手表 这个 事情, 可能 五年 以后 就是 没有所谓 的 生态位 的。 就是 在 竞 充分 竞争 的 情况下, 就是 因为 手机 厂商 都会 做, 他 一定 做, 而且 是 关键 是 他 顺带 着 做做 就可以 做 的 很好。 因为 能力 跟 他的 手机 是 完全 通用 的, 是 重合 的那 这个 时候 确实 就是说 那个 时候 可能 如果我 那个 时候 有 这个 方法, 那 我 可能 会 更加 努力 的 会 去 思考 O K 我 选择 做 智能手表。

我在 五年 以后, 当 巨头 都 进入 都 充分 的 投入 的 时候, 我 怎么 去 占据 一个 位置, 那 我 可能 会 去 想 更多 的 差异化, 或者 我的 执行 路 会有 一些 不一样, 这个 我自己 觉得 是, 那你 还会 做 智能手表, 我们 现在 在 做, 我们 做 海外, 但是 比如说 我们 可能 我 瞎说, 这个 东西 都 不能 假设 的对 吧? 比如说 当年 第一天 我 就 奥运 做 海外, 我 不做 国内 第二, 我 不做 那么 多 智能 硬件。 这就是 我们 刚才 说 的, 因为你 利用 有限 的 时间差, 你 能够 建立 一个 壁垒。 那 可能 就是 如果 从 成功学 的 角度 来说, 他们 就会 我们 可能 的 状态 可能 会 更加 成功。

而且 关键 核心 是 他 不一定 有 思考。 这个 可能 说 的 有点 玄乎, 但是 我 觉得 确实 就是说 今天 的 由于 现在 这个 创业, 因为 现在 大家 都 知道 融资 不好 融, 对 吧? 那 你的 今 环境 不确定, 那是 需要 有 很强 的 战略 选择 能力。 因为你 没有 那么 多 子弹, 你 可能 就 一发 子弹 打 完了 就 没了你 就 结束了。 过去 十年 是 资本 泡沫、 科技 泡沫, 中国经济 上行, 你 打完 一发, 这 投资者 又 给你 两发, 对 吧? 那 你可以 多 做 几次 选择题, 你可以 多 尝试 几次。 但 现在 我 觉得 是 没有 那种 奢侈 的。

我 觉得 还 挺 有意思 的。 因为 面对 大 模型, 其实 每个 巨头 它的 做法 都 不一样。 你看 阿里 就 激进 的 跟 他的 阿里云 绑定, 做法 相对 激进。 腾讯 就 很 佛, 字节 搞 大江 下, 你怎么看 他们 每一个 公司 的 这种 做法? 还 包括 百度, 百度 和 自己 都是 一把手 工程。

我 觉得 每一个 公司 有所 的 战略, 每个 公司 都是 基于 自己的 状态, 对 自己的 认知 做出 了 一个 惯性 的 选择。 比如 腾讯 他 急 啥 呢? 不用 急, 有 微信 怕 啥, 吧? 有 数据 有 场景, 晚 三个月 跟 早 三个月 有什么 区别? 我 一直 这样的 观点? 而且 我 觉得 他 确实 就 更多 考虑, 就是说 他 应该 花 更多 时间 去 思考 这个 大 模型 给 用户 带来 的 价值 到底 是 啥。

阿里 不 一直 都是 流量 焦虑, 所以 他在 这个 东西 上 他 一定 是要 更加 接近。 而且 阿里云 确实 未来 大 模型 的 能力, 在 一个 公有 云 的 平台 上 肯定 是 非常重要, 可能 是 最 重要 的 一种 能力。 如果你 没有 这个 能力, 你的 云 争议 都 不一定 能够 持续。 但是 我 觉得 它的 好处 就是 他 可以 不靠 大 模型 赚钱。 大 模型 对他 来说 就是 一个 引流 的 东西。 他 最好 是 卖 服务器, 卖 算 力, 就是 卖卖 那些 云 服务。 所以 这个 是 我自己 觉得 他们是 比较 如果 做 的 好是 比较 稳 的 字节 他 就 应该 干 这个 事情。

因为他 有 能力, 他 现在 也很 强大, 而且 确实 这种 因为 大 模型 很多 东西 生成 社会 的 内容 有 很大 的 变化 的对 吧? 比如说 你 现在 很多 都是 员工 在生 的 内容, 未来 是不是真的 A I D ugc 先 A I 生成, 然后 user 再去 做 一些 微调 对 吧? 就是 A I ugc 这种 形态 可能 未来 就会 很 厉害。 如果说 你 现在 不去 投入, 那你 可能 你的 最 主要 的 业务 有 会 也会 出问题。

百度 也 一样, 因为 很显然 就是说 大 模 跟 搜索 的 结合, 这个 是一个 未来 的 趋势。 今天 工作 就 已经 演示 给 你看 了, 反正 你 不 升级, 那 别人 会 升级 那你 怎么办? 所以 我的 意思 说, 在我看来 都是 很 自然 的 选择。

现在 很 难受 的 或者 很 可悲 的, 就是说 谁 又 没有 什么 独特 的 招式, 就是 因为 这个 东西 看不清楚。 比如说 我们在 创业 公司 里边, 我 因为我 我 找 了 一个 稍微 不一样的 招式。 比如说 我就是 做 这个 A I 机器 的 工具, 商业模式 就是 这个 会员 我 也 不提, 至少 我的 主要 商业模式 不是 给你 提供 个 A P I 或者 给你 to b 做 项目 的 定制。 我也 不是 靠 to c 的 用户 来做 订阅。

世界上 绝大部分 大 模型 创业 公司 都是 刚才 那 三种。 你看 ChatGPT 就是 做 A P I 的 调用 收费, ChatGPT 会员 的 收费, 当然 他 不做 项目 的 定制, 别的 很多 创业 公司 可能 就是 做 项目 的 定制 收费。 我们 不做 那 三种, 我们 找 的 是一个 所谓 的 profession consumer。 我 提供 的 也 不是 一个 to c 的 A P P, 但 我也 不是 个 to b 的 定制, 我是一个 创作者 的 更加 专业 一点 的 工具。 所以 目前 认为 我 认为 我们 找到 一个 比较 独特 的 定位。 但是 这个 东西 就是 刚才 说到, 比如说 三年 五年 以后, 那你 这个 位置 还 存在 吗? 比如说 如果 这个 剪 映 它 全部 都 免费 做 的 比 你 还好, 那你 怎么办? 那你 就得 每次 逼 着 我 去 想 的, 就是说 因为 剪 映 是一个 to c 的 A P P。

在我看来 目前 的 现状 就是 比如 它的 配音, 它 也有 配音, 但 都是 免费 的。 它 可能 就 没有 非常 专业 的 一些 功能。 比如说 我们 声音 会有 几千个 声音 的 选择, 它 可能 就 没 那么 多。 我们的 那个 声音 生成 有 很多 编辑 的 功能, 重读、 连读 你 都 可以 用, 它 可能 就 不一定 有 这么 丰富。 所以 这个 就是 短期 这种 是 比较 独特 的。 但是 长期 你 这种 独特性 还 能不能够 牵引 住 这个 用户, 而且 是 关键 是 能不能 收到 钱, 这 东西 是一个 巨大 的 亏损。

那 我们 要 做 的 就是说, 我 觉得 上次 曾鸣 教授 给我 形容 我们的 状态, 我 觉得 形容 的 特别 好。 当时 我们 班上 把 我 这个 作为 一个 案例, 我 提 的 问题 就是说 在 未来 的 AIGC 这个 时代, 三五年 以后, 我们 这些 A I 工具 还有 没有 生态位? 他的 答案 就是 一定 没有。 但是 他说 我 觉得 你 已经 做到 最好 了, 为啥? 他说 你 今天 就是 在 一个 局势 特别 不明朗 的 大海 中, 你 是在 一块 浮冰 上, 就 你 现在 在 一块 浮冰 上, 但 至少 你不在 水下, 你 在 冰上, 但是 你 这个 东西 随时 可能 这个 冰 就会 化 掉 或者 会 翻, 对 吧? 所以 你 要 有的 姿态 就是 低功耗 的 运转, 同时 非常 敏锐 的 察看 周边 有没有 尖兵。 一旦 有 尖兵 你 要 准备 好, 你 还有 能力 跳上去。 我 觉得 这个 讲 的 很 好啊, 我 觉得 今天 所有的 大 模型 公司 可能 都 得以 这种 姿态 去。

你 就算 找到了 商业模式, 现在 就算 有 用户量, 你 也是 在 一块 浮冰 上, 你是 不 牢靠 的, 对不对? 所以 在 这个 扶贫 上 你 能 做 的 就是你 不要 晃动 的 很 厉害, 因为你 自己 会 摔下去, 能量, 所以 你 要 低功耗 的 运作。 但 你 要 同时 要 练 各种各样 的 功夫, 然后 同时 保持 对 周围 的 警惕 敏锐。 一旦 有 新的 所谓 的 A I native 的 这个 形式 的 出现, 你 能不能够 快速 的 跃迁 到 那 一块 真正 有 用户需求, 有 长期 的 商业价值, 有 生态位 的 这个 产品 形态。 如果你 看到 了, 你 能不能够 以 最快的速度 跳上去。

低功耗 运转 是不是 意味着。 不能 去 投入 做 GPT4, 不能 投入 去 赶 GPT5, 我 本来就 不做 这个 事情 了。

其他人? 其实 你看 就是说 我 觉得 世界上 如果我们 简单粗暴, 我们 所有的 一切都是 为了 简单化 才能 讨论 跟 模型 或者 应用 有关系 的。 我们 把 它 分成 三类 公司。 一类 公司 就是 这些 要 带领 人类 往前走 的卡 T 卡 的 大 模型 公司。 一类 是 说 利用 大 模型, 比如说 利用 开源, 最好的 开源, 自己 去 在 那个 基础 上去 开发。 但 他 还是 要 拥有 自己的 模型 能力, 自己 host 了 自己的 模型, 不是 调用 第一类 公司 的 A P I, 这是 第二类 公司。 第三类 公司 就是说 你就是 调用 第一类 的 A P I 或者说 是 第二类 公司 帮你 做 个 定制。

首先 就是 你看 全世界 范围内, 第一类 公司 可能 就是 不 超过 十个 或者 十几个, 中国 可能 三四个。 因为 这个 是你 需要, 比如说 腾讯、 阿里 或者 自检 不能用 lama 的 开源 了, 那你 必须 自己 从头开始 搞, 这个 没办法。 但是 这种 的 是一个 持久战, 消耗 是 非常 厉害 的。 我 认为 觉得 大 概率 只有 巨头 能够 坚持下去。 因为 他们 不靠 这个 赚钱, 他 有 别的 现金流 的 业务, 他 可以 一年 亏 十几 亿美金, 20亿美金 去 搞 这个 事情。 他的 人才 密度 也 足够 好, 只不过 他 稍微 慢一点。 所以 这是 第一类。 我 觉得 绝大部分 跟 A I 创业 的 公司 应该 都 归属于 第二类 公司。

第二类 公司 就是 什么 叫 低功耗? 就是说 南 马 这样的 开源 的 模型, 他 把 前面 的 基础训练 的 事情 给 做了, 就 花了 几千 万美金, 或者 是 每次 升级 花 几个 亿美金, 对 吧? 那你 在 这个 基础 之上, 你 有 去 修改 它的 能力, 其实 没什么 区别。 本质 上 就是 要 建立 这个 能力 也是 挺 不容易 的。 就是你 基本上 所有的 那些 什么 retraining for tuning, 什么 online mon 的 inference 的 优化 都要 自己 做 一遍 的。 但 你 肯定 跟 第一类 比, 就是说 因为 你的 投资 算 力 就 不用 那么 大。 就 绝大部分 公司 应该 是 说 这个 里边 我 去 拥有 自己的 模型 的 能力, 去 为我 的 应用 去 我 刚才 说 的 什么 采 蘑 结合, 采 蘑 一体。 这个 可能 中国 有 四五十个 这样的 公司, 就 包括 二线 的, 就 除了 的 巨头 以外 的 互联网公司, 包括 我们 这样的 创业 公司, 我 觉得 应该 都 属于 这么 一个 类别。

第三类 就是 应用 方, 应用 方 他们 刚 开始 一定 也会 挣扎 的 想做 第二类 公司。 他们 知道 他 肯定 做不到 第一类 公司, 他 反正 想做 第二类 公司, 因为他 想 自己 控制。 但是 折腾 了 一阵子, 他 一定 会 发现 这个 东西 不 靠谱 的, 投入产出比 不 靠谱, 自己 搞不定。 你 可能 真的 是, 比如说 自己 花 1000万元 搞定, 你 给 什么 100万给 第二类 公司 给你 搞得 好好的。 但 他 有 个 过程 就是 回答 你的 那个 问题, 就是说 所谓 低功耗。

我 觉得 第二类 公司 是 可以 说 低功耗 的 做 模型, 同时 去做 自己的 产品, 也是 存在 一种 可能性。 就是 当 A I native 的 机会 出现 的 时候, 或者说 适合 你的 机会 出现 的 时候, 你是 有 能力 纵身一跃 跳 到 那个 尖 冰上。 因为你 在 尖 冰上, 你 可能 就 接下来 可以 五年 可以 躺 着 赚钱。 这个 我 觉得 是 所有的 模型 公司 也好, 都 跟 大 模型 相关 的 应用 也好, 可能 都 得 思考 的。

A I native 为什么 还没有 爆发?

因为 本身 大 模型 也就 一年 多, 我们的 期望 不能 太高, 对 吧? 我 觉得 已经 是 非常 快了。 第二 是我 还是 觉得 没有 多 模态 这种 东西 就是 做 不好 阴影 有 多 模态, 然后 成本 足够 便宜。 这 两个 东西 我 觉得 现在已经 慢慢的 浮现 出来 了。 所以 我 觉得 就 未来 一年 两年 的 应用 肯定 还是 有 很多 形式 的, 它 不一定 是 终局, 包括 我 一直 觉得 今天 我们 做 的 所有的 东西, 可能 都 是一个 短暂 的 产品 形态, 短暂 的 商业模式, 这是 有可能 的。 但是 我 刚才 说 德行, 就是说 你 能不能够 在 这个 过程中 建立 一些 比较 核心 的 能力。 当 有 新的 商业模式, 新的 产品 形态 出现 的 时候, 你 有 能力 去 过渡到 那个 新的 范式 下去。

回望 你 这 一二年, 你 觉得 你 心理 上 的 高点 和 低点 分别 是在 什么时候?

就是 我们 当年 拿了 google 的 钱 以后, 我们 一路狂奔 的 做 各种 算法, 做 语音助手。 语音助手 你看 我们 都很 狂妄。 为什么 说 首先 要 定义 下一代 的 人机交互? 结果 用户 不争气, 又 回到 了 以前 老的 交互方式。

我们说好 我们 定义 下一代 的 人机交互 设备, 就是 所有的 推 手机 以外 的, 我 认为 自然语言 交互 会 比较 好的 场景 我 都 做。 我 觉得 那 就是 非常 膨胀, 确实 我们的 理念 都 没问题。 如果你 是一个 大公司, 在 一个 无限 资源 的 情况 下等。 比如说 我们 当时 2017年, 我们的 应该 是 17年。 因为 我们 当时 已经 有 手表、 耳机、 音箱、 车载 的 设备。

我们 说 我们 要 做 一个 跨 场景 的 V P A。 V P A 就是 虚拟 个人 助理, 就是现在 的 助理 对 吧? 因为我 觉得 助理 的 特色 就是你 要 改变 语音 交互, 你 必须 要有 这个 用户, 就是说 用 这个 助手 是一个 高频 的 应用。 当时 还有 我说 要 30% 以上 的 交互 时间 是在 这种 非 手机 设备 以上。 然后 我们 做 的 就是说 这个 V P N 必须 无处不在, 因为 否则 了 你 想不起来, 因为他 是你的 一个 助理, 如果 这个 助理 他是 你的 秘书, 如果说 你 一个月 才 想 起来 一次, 你 可能 你 就 觉得 这个 秘书 对你 没 啥 用。 你的 每天 就 想起 他, 那 这个 时候 你就是 各种 场景 都要 包括 掉, 他 无所不能, 对 吧? 所以 这个 是 我们 当时 的 一个 跨 场景 的 全能 虚拟 个人 助理。

确实 我们 就是 一直 顺着 那个 我们 当时 做了 很多 场景 联动 的 东西。 比如说 我 有一个 视频, 我 对 着 耳机 说 我要 买单 趴, 手表 弹 出 一个 二维码, 这是 联动, 对 吧? 这个 其实 做了 很多 事情 能够 联动 的。 但是 我是 现在 回过头来 看, 如果我 作为 一个 大公司 的 高 管, 我 去 drive 这个 什么 虚拟 个人 助理 的 项目, 这个 没问题。 因为 比如说 google 这样的 公司, 每年 不知道 浪费 多少钱, 最后一个 想 都 没有我 起码 能 搞 出 各种 新 概念。 就 比如说 搞 个 发布会, 一定 不像 他 现在 那 样子。

但是 就是你 作为 一个 创业 公司, 那个 就是 妄念。 就是你 怎么 可能 靠 一个 小 创业 公司 推动 用户 习惯 的 改变, 你 还 怪 用户 不争气, 他们 很快 的 适应 了 上 一代 的 人机交互 方式。 你 还想 一个 设备 没有 成为 主流 的 时候, 你 就 想 所有的 设备 一起 能够 联动。 但是 你 想想 那个 交叉 同时 把 你的 手表、 音像、 耳机、 车载 的 人 有 几个 呢? 那是 非常少 的, 对不对? 所以 这 都是 属于 妄念。

我 觉得 脖子 还是 要 以小博大, 你 不可能 做 一个 生态。

都 靠自己 来做。 对你 不能 以 一己 之 力 去 说 改变 整个 交互方式。 你 觉得 现在 这个 不行, 我 就 自己 干。 我 觉得 这就是 非常 的 失败 案例, 这就 很 狂妄, 而且 就是 对 商业 竞争, 对 刚才 说 战略 的 选择, 对 所谓 的 生态位 什么 路径。

至少 不是, 我 不记得 你 当时 是 拿了 多少钱, 这么 狂妄。

大众 那个 时候 拿了 1.8亿美金, 前面 google 拿了 4000万美金。

拿 这么 多 钱 是什么 感觉?

不然 多 我 其实 没感觉。 我 觉得 这个 可能 说 起来 可能 投资者 觉得 我不 靠谱, 我 连 账号 在哪 都 没有 搞 明白。 我自己 我 从来不 看 的, 我 到 财务 看。 对, 就是我 很早 我们 公司 我 就有 一个 理念, 专业化 的 人 干 专业 的 事情, 这 不属于我 的。

然后 你 没有 看过 你的 账 上 资金。

我真的 就是 到了 2 0119年 的 时候 才 意识到。

没钱 了。

花 那么 多 很快 的, 18年 的 时候, 那个 时候 我们 一千多 人, 公司 的 项目 简直 就是 多如牛毛。

是 外界 也是 这么 感觉 的。

外界 我也不知道 外界 怎么讲。 你看 那个 时候 其实 是我 最 勤奋 的 时候, 这就是 典型 的 用 战术 的 勤奋 掩盖 战略 的 懒惰。 我 每天 从早到晚 去 开会, 就 可能 从 早晨 10.1般, 吃饭 都是 开会 的, 傍晚 也是 晚饭 也是 开会。 我应该 跟你讲 过 这个 故事, 真的 是。 有 一次 我 一个 朋友, 其实 他 也是 高 管, 京东 的 高 管。 这个 你 都 可以 去 跟 他 对我 是不是 说过 这 句 话。 我 跟 他 吃完饭 以后, 我 突然 看到 那个 太阳 降落 的 时候, 然后 我 跟 他说 这 可能 是我 最近 两个月 以来 第一次 看到 太阳 降落 的 这个 状态。 两个月 以来, 因为 以前 我 从来 都 是在 办公室 一直 在 开会。

因为 办公室 没 窗户。

不是你 没时间 就 往 窗外 看, 因为 那时候 在 骂人, 就是 各种 烂 事情。 你 想想我 一个 算法 工程师, 我们 要 做 硬件, 而且 是 做 那么 多 硬件, 做 海外, 做 国内 各种 东西 都 做。 但 其实 自己 还是 挺 兴奋 的。 因为 通过 那 两年, 我是 觉得 我 了解 了 很多 以前 我 从来不 了解 的 东西, 学习 了 很多, 从 学习 角度 来说 是 非常 快, 虽然 很 累, 但是 很 快乐。 什么 供应链, 什么 硬件? 海外 市场 怎么 搞? 国内 怎么 搞, 但是 唯一 少 想 的 就是 竞争 是 啥, 定位 是 啥? 没有 太多 这种 思考, 更 多是 做。

事情 你是 先 想 了 一个 大 的 愿景。

然后 你 就 我们 就是 典型 的 使命 驱动, 这个 我们是 少有 的。 可能 就是说 在 2012年 P P T 写写 就 写下 我们的 使命 是 定义 下一代 的 人机交互。 第一页 使命 定义 下一代 人机交互。 做到 14年 的 时候, 觉得 下一代 的 人机交互 定义 不了 了。 因为 用户 已经 习惯了 上 一代 的 人机交互。 然后 说好 改 定义 下一代 的 人机交互 设备, 你 就 找 那个 入口。 对, 因为你 交互方式 的 改变 是 一定要 除了 软件 本身 以外。

一定要 硬件 配合 的。 但是 你 这个 想法 就 有点 是你 自己 安插 的。

就是我 对 未来 有 一对 未来 莫名 有一个 莫。 莫名其妙 的 危险, 但是 没有 实际 的。 刚才 说 战略 的 六 要素, 我 只有 第一个, 也没有 想 我的 用户 价值 定位 是什么? 我的 生态位 的 定位 是 啥? 也没有 想 目标 短期 的 目标 以及 路径 跟 节奏 都 没有 想。

那你 什么时候 意识到 公司 没钱 了? 19年 了。

19年 是 19年 也 不是 没钱。 前几天 那个 富盛 还是 我 凡尔赛, 说 因为 我们 19年 是 我们 账 上 只剩下 四个 亿, 还是 三个 亿, 人民币 是 吧? 对, 这么 多。 对, 这 原件 你 还 四个 亿。 是, 但是 你 要 知道 那个 时候 其实我 自己 也很 清楚, 因为 我们 工资 就 发 三个 多亿 一年。 对, 然后 这么 快, 我们 所有的 卖 硬件 本身 应该 是 不 赚钱 的, 还有 一堆 库存, 我们 有 四个 亿 的 库存。 那你 想想, 然后 我 有 一千多个 人, 那你 怎么能够 站 得 过来 呢?

你 一千多个 人 发 3亿, 对, 为什么 这么 贵?

这 很 正常, 因为 我们 还有 线下 门店, 当时 我们 还有 线下 门店, 我们 有 20个线下 门店。 我的 意思 就是 很多人 觉得 是 凡尔赛, 真 不是 凡尔赛。 那个 时候 是我 真真正正 感受到 这个 公司 会 死掉 的。 我 这个 确实 是, 比如说 即使 前面 回忆 起来 真的 是 这 样子 的, 不管 没 给钱 我们 也会 死掉。 可能 我们 账 上 也 只剩下 三四个 月 的 钱, 只是 我没有 去 看 而已, 没有 想 goole 给 了 我们 4000万美金, 2014年 我们 17年 那个 时候 应该 就 没钱 了。 也是 比如说 因为 我们是 2017年 4月份, 大众 给 了 我们 1.8亿美金, 如果 他 晚 给 四个 月 可能 也 挂 了, 只是 我不知道 而已。

你 两笔 融资 是 怎么 拿到 的?

我 觉得 那个 时候 真的 就是 中国 一片 欣欣向荣。 你看 包括 google 对 中国 也是 有 想法 的, 像 安卓 进入 中国 什么的 吧? 那 现在 大家 都 没 想法 了 对 吧? 大众 是 极度 的 焦虑 的, 因为他 觉得 他 跟 A I 时代 完全 脱钩。 所以 就是我 觉得 并 不是说 现在 当时 我们 觉得 牛逼 哄哄, 觉得 是 我们 自己 也 牛逼, 对 吧? 那 其实 你 想想 跟 你 有 啥 关系, 人家 战略投资 你 不是 因为你 有 多 牛, 而是 因为 人家 想 干 一个 什么 事情, 人家 formal 就是 人家 想 干 这个 事情, 然后 他在 市场上 找 了 一个 OK, 你 就 你, 当然 这个 过 我 觉得 你 可能 唯一 牛 的 就是说 他 可能 差 了 五个。 最好 选 了 你就是 他 选择 了 你, 不是说 你 选择 了 他 20年.

最少 钱 的 时候 还有 三四个 亿。

我 2019年 我们 就是 做了 很多 一 文化, 本来 我 觉得 2019年 差不多 就是 这个 公司 要 触底反弹 了。 其实 现在 想想, 就算 没有 疫情, 也 不能 触底反弹 的 OK。 但 当时 很多 时候 创业者 真的 就是 幻觉, 很 厉害 的 就是 幻觉。 就是 觉得 我记得 我 还 写 过给 全 仍然 写 过 一封信, 说 我们 接下来 就是 换挡 加速, 换 个 档, 然后 加速, 我们 接下来 就是 要 盈亏 平衡 怎么样。 因为我 觉得 其实 我们 那个 时候 2019年 也就 裁 了 25% 的 人, 一点 都 不多。 但是 我 认为 动作 已经 很大 了, 我 觉得 接下来 可以 活 下来 了。 就是 因为你 对 未来 想象 的 说, 我 这个 硬件 能 卖 多少钱, 我的 to b 能 怎么样。

你 发现 创业者 真的 是 有的 时候 最近 这 一个月 收 了 1000万, 就 开始 想, 那 我 平均 一个月 估计 接下来 做 2000万, 一年 有 12个月, 那 我 就 接下来 一年 的 收入 有 2.4个 亿, 你知道 吧? 真的 很多 会 这么 犯 觉得, 但 其实 你 这个 月 做了 1000万, 也许 下个月 就 只有 500万了。 比如 to b 的 单子 对 吧?

承诺 你 收入 增长。

就是 很多人 幻觉 到 就是说 才 做 1000万, 你 问 他 营收 多少, 我 两点 几个 亿。 但 其实 可能 因为你 其实 没有 一个 可 持续的 商业模式, 而且 核心 的 就是说 哪怕 to c 也 一样, 你 没有 考虑到 竞争。 我们 以前 就这样, 我们 发 了 一个 新品, 第一个 月 卖 了 2000万。 我 就会 想 我 这个 产品 很好, 可以 卖 2.4个 亿。 结果 再 过 两个月, 三星 发 了 一个 竞 品, 你 趴 你 这个 东西 就 一个月 只能 卖 从 2000万就 只能 卖 1000万了。 这个 其实 是 很多 创 这个 扯 的 有点 远, 就是 创业者 幻觉 的 非常 厉害。

我 甚至 遇到 过 那种, 比如说 现在 我 跟你聊 天, 这个 C E O 跟 我 讲 了, 我们 要 做 海外, 我们 要 怎么样, 对 吧? 你 感觉 对于 一副 崇拜 我的 羡慕 的 表情 看来 真好, 我 要是 他 这个 公司 就 好了。 结果 明天 一看 新闻 说 他们 公司 一半 裁员。 我 遇到 过 很多 这样的 情况, 也就是说 创业者 他 为了 坚持下去, 就是 得 自己 幻觉 的 很 厉害。

他是 为了 坚持下去 主动 幻觉, 还是 他 就是 这种 性格 容易 幻觉。

可能 你 从 某种程度 上 你 不 幻觉, 真的 坚持不下 去。 你 想想 如果 你知道 你 明天 就要 裁员, 就要 挂掉, 你 今天 还有什么 心思 来 跟 我 吹牛 呢? 对 吧? 因为他 当时 想 跟 我们 谈 一个 合作, 跟 我说 什么什么 这个 巨头 也 看 我们 要 投 我们, 那个 巨头 也 看 我们, 然后 我们的 业务 怎么样, 我们 接下来 有什么 规划, 当时 我 觉得 真棒。 所以 我 觉得 就是 刚才 说 的 那个 低谷, 第一步 就是 2020年 就 疫情。 因为我 觉得 判断 2019年 判断 觉得 我们 应该 触底反弹, 我们 要 换挡, 2020年 就是 加速, 2019年 是 换挡 的 这个 阶段, 但 结果 疫情 不就 来了 吗? 就是你 不但 没有 触底反弹, 那个 底 还有 那么 深。 那个 时候 我 觉得 是 2020年 肯定 是 非常, 你说的 低点, 我 觉得 我 都 抑郁 了。

那个 时候 你 那个 时候 公司 还是 有 现金 的。

也 没多少 了, 可能 只剩下 两个 亿 了。

有 剩下 两个 亿 还是 有 垫底 的。 但是 我 这 我 你 你 要 不上。

你 要 明白, 我 觉得 很多 公司 真的 没有 理解 到 这种。 你 一个 科技 公司, 你 要 做 一个 产品, 弄 一个 技术, 跑 一个 模式 出来, 没有 两三年 是 跑 不通 的。 我们 当时 所有的 过去 的 那些 产品 跟 模式, 我 认为 它 都是 亏 钱 的那 你 只能 寄 希望 说 有一个 新的 产品 能够 扭转 这个 格局, 对 吧? 但是 这个 过程 没有 两三年 是 不可能 的。

有 多少钱 才能 垫底? 一直 对于 一个 前沿 科技创新 公司 来说。

那就 看你 公司 的 规模。 但 我 觉得 永远 就是你 至少 要有 18个月 的 现金流, 未来 如果 没有 18个月, 我 觉得 就 基本上 就 很难 了。 比如说 你 有 一部分, 营收 营 收看 你 有没有 毛利, 你的 营销 成本 有 多 高。

所以 后来 怎么 度过 的 那个 节点。

2020年 继续 裁员 了, 从 心态 上 就是 躺平 了。 是 这个 可能 讲 出 是真的 不太好, 甚至 我 都 觉得 我 有意识 的。 因为我 当时 我不想 跟 任何人 说话 了, 我 觉得 我就是 表现出来 给 别人, 就 觉得 这个 公司 C E O 已经 不想 干活 了。 因为 我们 当时 公司 还是 人才, 很多人 还是 想 干活 有 抱负, 所以 那些 贵 的 人 他们 就 离开了, 就 觉得 你 C E O 都 感觉 不想 干活 了, 这 可能 是我的 战略性 涨 平。 这 一方面 是我 状态 就是 很 不好, 想 跟 别人 说话 也 更 别说 打鸡血。 我 所有的 我 做 的 事情 就是你 把 这个 团队 给我 砍掉, 或者说 有 五个 人 给我 砍成 一个人。 那些 负责人 就 跟 我说, 那 就会 崩盘 这个 事情 我说 那就 崩, 没关系 的。

我 做 的那 就 给 N 加 几。

裁员 N 加 1, 都是 N 加 1, 那 还 不错, 基本上 还是 没有 闹 什么 纠纷。 所以 2020年 我 认为是 比较 才 到。 当然 那个 时候 只剩 300人不到, 好像 才 很多 是 主动 离开了, 确实 很多人。 包括 我们 当时 在 南京, 我们 把 我们的 总部 迁 在 南京, 北京 只出 不 进, 要 进 只能 在 南京 进。 如果说 我自己 判断, 他说 确实 没有 这么 加, 这 一个人 可能 会 崩盘 的 情况下, 我 给他 说好, 那你 在 南京 我 给你个 IT count。

通过 主动 控制 headcount, 通过 战略性 躺平, 对还 做了 一个 事情 就是 算 P M L。 就 你 刚才 说 的 每一个 产品线, 每一个 小 业务, 我 给他 分 的 很细。 你的 成本 多少? 你的 人力 成本 怎么 分摊 的? 公摊 怎么 算? 给你 分摊 给你, 你看 算下来 你是 亏 钱 的, 你 怎么办?

以前 在 2020年 之前, 所有的 业务 的 人都 会 跑过来 跟 我要 人 说, 我 这个 全部 告 我 这个 什么什么 的。 自从 把 那个 P I L 给 算 出来 以后, 没有人 找 我要 人的, 都是 主动 我要 来 招 个人 的, 说 我 不行, 我 这个 养不活。 我 觉得 这些 你看 这个 撇开 战略, 这个 战术性 的 东西 也是 挺 有用的。 就是 这些 动作 还是 包括 你看 我们 当时 我给你 举 个 例子 有 多 夸张。 当时 我们 公司 有 4个IT 我们 现在 公司 就 一个 I T 当时 我们 有 4个IT 的 时候, 我们 要 搬 个 家, 我们 还 得请 外包, 因为 搬家 的 时候 I T 系统 要 重新 网线 什么 电 什么 要 从 他们说 他们 搞不定, 需要 外包公司 来 帮忙 才能 搬 个 家。 我们 现在 一个 I T 搬 个 家 也 不会 请 外面 的 I T 公司。 这 听起来 我们的 I D 同学 听 了 不要 骂 我。 但是 就是我 就 想告诉你, 其实 很多 公司 的 泡沫 是 很 厉害 的, 尤其是 在 这个 科技 公司。

这个 状况 就 一直 持续 到了 二三年。

2020年 是 很难。 我们 不是 21年 我们 就 魔音 工 坊 出来 了 吗? 不, 2020年 就 出来 了。 2 0121年 下半年 就 很 好了, 而且 大众汽车 我们 跟 他 谈 了 一个 deal, 拿到 了 新的 钱 就 缓 过来 了。 至少 觉得 离 死亡 没 那么 近。

接近 过 创业 死亡 的 人我 觉得 是。

但 我 觉得 我们 这个 听起来 惨, 对 吧? 但 你 跟 绝大部分 那些 传统 公司 的 惨, 那 都 不能 比。 人家 那个 真的 可能 就是 下个月 公司 就 没钱, 很多 这种 非 科技 公司, 因为 科技 公司 我们 还是 得 知足, 就是 确实 是 市场 给 了 你 足够 多 的 关注 力, 然后 给 了 你 足够 多 的 钱。 那你 非 科技 公司 很多 公司, 如果 是你 这么 烂 的 一个 公司, 我 觉得 我们 就是 烂 公司。 那个 时候 就是你 这么 不去 逼 着 自己 思考 战略, 什么 怎么 竞争, 对 吧? 那 你就是 该死。

二三年 大 模型 这 一波 来, 其实 对 你们是 积极 的对 吧?

我 觉得 看 你怎么看, 就 是从 大家 对 我们 公司 的 人, 因为 可能 二三年 也 没人 关注 我们 了, 可能 很多人 觉得 我们 公司 已经 死掉 了。 二三年 之前 应该 就是 很多人 觉得 我们 公司 已经 死 了, 只是 还有 个 名字 在那 而已。 我 觉得 可能 就是 2023年 之后, 又有 一些 人 会 想起 还有 这么 一个 公司。

再 关注 你 做 不做 大 模型。

这个 可能 还是 有些 好处 的。 我 觉得 不好 的 地方 其实 是我 觉得 我们在 2020年 我 就 找到了 一条 比较。 就 刚才 说 通用 的 大 模型, 只是 规模 不大。 包括 我们 开始 做 A I 机器 的 应用, 我们 2020年 我们 做 配音, 21年 我们 也 做 数字 人, 包括 21年 也 做 过 写作, 是 不 成功。 因为 那个 时候 模型 的 推理 速度、 通用性, 也没有 instruction tuning 这些 东西, 对 吧? 所以 就是 效果 不好。

二三年 之后, 我 觉得 一方面 我们 肯定 是 跟 别的 公司 一样, 因为 这个 技术 更 成熟 了。 我们 以前 很多 产品 做 不好 体验 的, 现在 能 做好, 我 觉得 这是 有 好处 的。 但是 你说 从 竞争 的 角度 来说, 本来 但 我 觉得 我们 可以 按照 我们的 节奏, 也 不受 人 关注。 比如说 我 就 安安静静 的 做 这些 工具, 也 没人 关注 你, 也 没人 知道 你 有什么 营收, 其实 这是 挺好的。

其实 你看 我在 二三年 之前, 我 从来 没有发 过 什么 魔音 工 坊 的 任何 东西。 在 我的 朋友圈 我就是 刻意 的, 就是 因为 前面 的 竞争 搞得 我就是 痛不欲生。 就是 前面 做 的, 以前 我们 都是 动不动 搞 发布会, 2 0119年 之前 对 吧? 19年 之后 我们 再也 不搞 发布会 了, 朋友圈 再也 不去 讲 公司 的 什么 产品, 对 吧? 很多人 因为 那个 时候 母婴 工厂 哪怕 是 20年 下半年 也有 知名度 了, 就在 那个 配音 的 小圈子 里面。 但 没人 知道 是 我们 公司 干 的, 不知道 是 有什么 一个 A I 公司 干 的。

对你 找到 真正 有 增长 的 产品 的 时候, 干嘛 要 让 别人 知道?

对对对, 但是 我的 意思 2023年 就是 一下子 又 引入 了 一大批 人 在 关注 这个 AIGC, 我 觉得 如果 很 自私 的 角度 来说, AIGC 再 玩火 两年 对 我们 更好。 因为 那个 趋势 我 已经 看 得很 清楚, 真的 就在 2019年 的 年会, 我 就 跟 高佳 给我 做 的 P P T。 然后 我们 就 其中 有 一页 的 P P T, 我说 未来 A I 的 应用 跟 商业化 就是 生成, 而且 生成 是 跟 识别 这种 多 模态 的 生成。 因为你 只是 一个 文字 的 生成, 其实 用 无感 的 声音、 图片、 视频 这些 是 用户 能 感知 到, 而且 他 对 这个 质量 的 要求 没 那么 高, 不像 理解 错了 就 错了。 所以 我 觉得 我们 已经 走 在 一个 无比 正确 的 路上 了。 就是 如果 没有 超强 的 竞争, 没有 大家 一堆 资本 的 钱 又 进来 又 搅局, 对 吧? 那 其实 对 我们 来说, 这个 所谓 的 战略 冷静期 至少 有 两年。 我们 可能 今天 可能 我不知道, 也许 会 更好。

你 二三年 的 时候 是不是 想 过 要 独立 再创 一个 大 模型 的 业?

二月份 想 过。

你 不是 采访 过 我 吗? 我是 后来 四月份 才 采 的 你的。

我就是 觉得 那个 时候, 因为我 经历 了 上 一代 的 竞争, 首先 我 对 说有 一大笔钱, 然后 去 搞 一个 事情, 但是 这个 事情 本身 我 又 看不到未来, 或者 我没有 信仰, 我 对 这个 事情 我是 没有 兴趣 的。 我 二月份 的 时候 是真的 是对 这个 技术 本身 的 那种 自然 的 冲动, 就 觉得 这个 东西 我 不干, 那 我 未来 就 白活 了, 过去 也 白干 了, 因为 确实 是 那种 状态。 但是 到 4月份 的 时候, 我就是 觉得 这个 东西 不是我 想要的。 就算 我 赢 到 钱, 我 每天 我 也会 很 难受。 因为 我看不到 我可以 把 这个 事情 能 持续 做 下去 的 这种 可能性。 所以 后来 我 你看 我 宁愿 我 写 飞过 税, 这 对我来说 真的 有的人 就 觉得 很 奇怪。

比如说 R T two 出来 的 时候, 我 写 了 一篇 很长 的 一两万 字, 其实 阅读量 也 没 几个。 因为 可能 大部分 人都 看不懂, 什么 jm lie 出来, 什么 sora 出来。 我 每次 都是 去 研究 它 写 个 什么 2万字 的 深度 解读, 就算 没什么 阅读量, 我 其实 也 无所谓。 因为 对我来说 就是 释放 我 对 这个 技术 的 这种 爱好 也好。 很多 时候 就这样。

一旦 你 把 这个 能量 释放 了, 要 以前 比如说 2019年 之前, 我 就会 折腾 公司 说, 这个 牛逼 来 我们 来 搞, 十个 人 就 开始 搞。 那你 你 想 那个 对 公司 来说 就是 代价 很高 的。 就是你 不要 打 一场 战争, 因为 打了 那个 战争 之前 你 很 悠闲, 一旦 进去 以后 你 就 出不来 了。 一旦 开打, 因为你 总是 想赢。

但是 我 觉得 现在 比如说 R T two 出来, 那 我 就 没 我说 来来 咱们 来做 一个 机器人 的 模型, 或者 是 搞 一个 机器人 对 吧? 要 以 2019年 以前 的 那个 状态, 我 一定 是 第一个 跑 进去 说来 我们 现在 去 搞 个 机器人, 把 这个 大 模型 给 放进去, 然后 你看 能不能 有 这个 R T two 或者 比 R T two 更强 的 能力, 一定 是 那种 动作。 但 现在 我 就 发 一个 文章, 让 我 对 这个 技术 的 冲动, 通过 写 这个 东西, 思考 这个 东西, 先 把 它 释放出来, 再 更加 长远 的 思考 一下, 也 看一看 有没有 你的 机会。 没有 机会, 那你 没 必要 去 把 自己 拖 到 那个 不可能 赢 的 地方。

其实 很 痛苦 的 二月, 大家 情绪 都很 高涨 的 时候, 你 不是 跟 王 慧文 当时 聊 了 一下 吗? 就是 你们 得出 什么 结论?

我 得出 的 结论 就是我 觉得 最 竞争 的 残酷性 比 上 一代 更 残酷。

他们 跟 我说 都 说是 你们 没聊 妥, 是因为 他 要当 C E O 那。

怎么 可能 呢? 我们 就 没聊 到。

这个 在 王后 文 再 投 你 一笔 钱。

即使 我说 了, 就算 他 给我 钱, 我也 不会 要 的。 到 后面 到了 四月份 的 时候。

你 自己 心态 扁 了。

不是我 不信 这个 东西, 就是我 不 认为 这个 东西 有 你的 机会 你 能 开心 的。 我 又 不是 第一次 创业, 就是我 为什么 要把 自己 拉入 一个 又 回到 以前 那个 状态, 对 吧? 用钱 我 觉得 很多 创业 公司, 科技 公司, 但 我 老 喜欢 总结, 就 发现 就是 很多 公司 就是 科技 公司, 它 从 第一天 就 进入 了 负 循环, 什么 意思 呢? 就是 你看 绝大部分 科技 创业 公司, 它的 高点 是什么? 就是 在 融资 那一刻, 那 之后 它 会 经历 很 漫长 的 一段, 他 痛不欲生 的 阶段。 就 你 刚才 说 高点 和 低点 对 吧? 绝大部分 在我看来, 公司 的 高点 就是 融资。 融 完 资 以后, 他 其实 很 慌, 没有 方向感, 或者说 在 竞争 中。 由于 是 到 后天, 当你 真正 在 中国 创业 的 一阵, 你 在 竞争 中 那种 无力感, 包括 对 用户需求 的 无。 就是我 刚才 说 了, 我 都 觉得 用户 怎么 这么 不爱 科技。 我记得 以前 我 跟 2014年 还是 15年, 我说 你看 我们 这个 手表, 我的 成本 都 850块钱 了, 我 900块钱 卖给 你 这么 多 高科技, 我们 这么 熬夜 弄出来, 我 都 相当于 是 免费 送给你, 你为什么 不要 呢?

你 这是 典型 的 伪 需求。

对, 就是你 会 陷入 到 那种 深深的 自我 怀疑。 所以 我就是 回答 你 问题, 我 就 觉得 我 现在 特别 羡慕 的 公司 是什么? 我不 羡慕 这些 什么 赢 大钱。 然后 在我看来 第一天 就是 融资 就是你 高点, 你就是 在 负 循环。 接下来 因为你 会 亏得 越来越 厉害, 你 为了 融资 你 又 搞 一些 莫名其妙 的 事情, 然后 有 一笔 钱 你的 这个 担子 压力 更大, 然后 你 就 继续 这个 窟窿 补 不上, 很多 公司 处于 这种 状态。

我 觉得 另外 一种 也许 存在 在 中国 这个 环境 下 存在 另外 一种 真的 就是你 第一天 我 哪怕 就是 做 一个 小生意, 但是 偏 科技 的 不是 不 偏 科技, 对 吧? 但是 这 是一个 真实的 用户 的 需求 竞争, 也 不是 是 说 你 完全 不能 handle 的 那种。 我 先 形成 一个 正向 循环, 我 不亏 多少钱, 我 盈亏 平衡。 我在这 基础 之上, 我 不停 的 拓展, 这个 才是 就是你 最后的 高点 是 应该说 你 做出来 一个 产品 过三年 以后, 五年 做出 了 一个 产品, 很多人都 不知道 突然 出现了 这么 一个 产品, 甚至 都 不知道 是你。 但 我 觉得 这种 状态 是我 更 喜欢 的。

我们 创业 已经 真的 是 苦 到。 我 觉得 其实我 前面 没 说, 就是 你说 上市 那一刻, 那一天 我 什么 感受? 我想 今天 这个 结果 对得起 我 过去 的 努力 吗? 对的, 我 过去 受 的 一二年 受 的 磨难 吗? 我 觉得 是 对不起 的。 因为我 刚 开始 追求 的 根本 不是 这点 事情。

对 吧? 所以 你是 其实 是 有点 不甘心 的那。

当然 不甘心 了, 中国移动 互联网 的 黄金十年, 我 居然 搞 成 这样, 应该做 移动 互联网, 不应该 这么 早 说。 不那 倒 不是我的 意思, 就是说 我们的 成就 跟 同时代 的 公司 比那 简直 就 天差地别。 我们 对 这个 用户 带来 的 价值 也是 天差地别 的, 差 的 很远。

你 在 那个 湖畔, 你们 班上 是个 什么 案例?

因为 当时 的 问题 就是说 每一个人 每个 C E O 讲 他 最大 的 战略 挑战 是 啥, 找到 这个 真正 的 问题是 啥。 所以 我们 当时 我说 我们 挑战 就是 我不知道 在 AIGC, 今天我 觉得 我们是 有一个 成熟 的 产品, 有 商业模式, 有 用户。 但是 你是 战略 问题, 就 站在 三年 五年 汉, 我不知道 这个 A I 的 工具 是不是 还有一个 生态位, 这 是我的 问题。

大家 讨论 了 半天, 有的人 安慰 我, 有的人 说 你 直接 就 关掉, 什么 都 有啊, 有 我们 同学 里边 对 吧? 最后 曾 老师说 这个 问题 也 不是 问题, 已经 是 答案, 没有答案 就是 没有。 所以 你的 问题 应该 变成 说 在 A I 机器 时代, 你 能够 找到 的 生态 会 是 啥? 听起来 很 玄乎, 但是 给我 启发 很大。 就是说 所谓 的真 问题是 说, 如果你 这个 问题 已经 有 答案, 就 不是 一个 真 问题 了。 因为 它 已经 变成 答案 了, 你 应该 问 下一个 问题, 既然 这个 不是你 的, 你 这个 不存在 生态位, 就是 放弃 幻想, 逼 着 你说 你 去往 下 思考。

好, 这 期 节目 就是这样。 如果 你喜欢 我的 节目, 欢迎 前往 苹果 podcast、 腾讯 新闻 宇宙、 喜马拉雅、 QQ 音乐 订阅 张小 珺 商业 访谈录。 如果你 有 其他 想 邀请 的 嘉宾, 想听 的 内容, 或者 你 有 任何 想 探讨 的 话题, 都 欢迎 各位 听众 朋友们 在 评论 区里 留言。 我们 下期 再见, 拜拜。