We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode E162|清华姚班如何培养天才:给最有挑战性的问题和足够的自由度

E162|清华姚班如何培养天才:给最有挑战性的问题和足够的自由度

2024/8/7
logo of podcast 硅谷101

硅谷101

AI Deep Dive AI Chapters Transcript
People
吴翼
前OpenAI研究员,清华大学交叉信息研究院助理教授,边塞科技创始人,专注于强化学习和人机协同。
泓君Jane
硅谷101创始人与播客主理人,曾任《财经》杂志驻美记者,著有多篇获奖专栏文章。
Topics
泓君Jane:清华姚班在人工智能领域培养了众多杰出人才,涵盖企业创始人、学者等,展现了其卓越的培养模式。 吴翼:姚班发展历程分为三个阶段:理论计算机科学主导、海归学者回归和与一流高校接轨。始终重视理论基础,课程难度大,但给予学生很大的自由度,鼓励学生自主探索,最终实现人才涌现。姚期智先生的个人魅力和教学方法,以及对学生充分的信任和支持,是姚班成功的关键因素之一。姚班的成功在于汇聚优秀人才,给予他们有挑战性的问题和足够的自由度,从而实现人才的涌现。课程难度大,但学生有更多自主支配时间,可以进行科研、实习和访问等活动。重视理论,但鼓励学生探索不同方向,例如AI、机器学习等。姚先生的教学理念注重培养学生的探索精神,即使听不懂讲座也能从中受益。不同时代的学生想法不同,现在的学生更自信,有更多选择。 吴翼:清华姚班的成功模式可以复制,但需要时间和资源积累。姚班的成功并非偶然,而是建立在特定历史时期和环境的基础上。高校独立研发大模型存在成本和效率上的挑战,产业界更适合进行大规模模型的研发。从事颠覆性创新研究,不应追逐当下热门领域,而应关注下一个重大方向。大模型研发更适合在产业界进行,学术研究应回归其本质,探索创新方向。OpenAI的成功与其坚持“规模化”(Scaling Law)的策略有关。顶尖人才通常具有很强的自驱力,能够找到自己热爱并愿意为之付出努力的事情。保持批判性思维,避免盲目自信,持续学习和调整自身观点。优秀人才既是筛选出来的,也是培养出来的,但其成功并非完全可预测。

Deep Dive

Chapters
吴翼回顾了姚班的发展历程,从最初的理论计算机科学到后来的多元化课程设置,以及姚班培养模式的特点,包括重视理论、课程难度大和给予学生足够的自由度。
  • 姚班分为三个发展阶段:理论计算机科学、海归学子留学归来、一流高校接轨。
  • 姚班重视理论培养,课程难度大,但给予学生足够的自由度。
  • 姚班的课程设置灵活,允许学生有更多自主支配时间进行科研和实习。

Shownotes Transcript

Hello, 大家好, 我们的 听众 中有 朋友 可能 听说过 J J lake。 这 是一个 位于 硅谷 中心 mountain view 的 创新 空间 加 孵化器, 也是 硅谷 101的公司 所在地。 我们的 很多 节目 就是 在 J J lake 的 会议室 里 诞生 的。

J J lake 正在 招募 创业 团队, 申请 他们的 孵化器 项目, 主要 关注 在 先进 制造、 生物医药 等 硬 科技领域, 特别 适合 希望 利用 好 亚洲 的 生产 制造、 供应链、 市场 等 优势 的 创业者。 J J lake 可以 给 创业者 提供 最高 价值 600万美金 的 创业 支持, 在 过去 的 五年 里, 有 450 多家 团队 申请 了 他们的 孵化器, 108 家 团队 入选, 总 融资额 超过 4亿美金。 此外, J J lake 也 向 创业者 提供 虚拟办公室、 共享 工位、 独立 办公室 等 各种 服务。

不管 大家 对 租用 jj lake 的 办公 空间 感兴趣, 还是 对 孵化器 项目 感兴趣, 都 可以 联系 J J lake 的 负责人 柳毅 夫。 他的 邮箱是 Y L I U, 艾特 J J L A K E R 点 C O M Y 柳 J J laker dot com。 我 也会 把 他的 微信号 和 邮箱 放在 我们的 show note 中, 需要 的 小伙伴 可以 直接 联系 他。 下面 就请 收听 我们 今天 的 节目。

欢迎 收听 硅谷 101, 我是 红军。 我们 今天 来 聊 一 聊 中国 顶级 A I 人才 的 黄埔军校, 他们 很多 都 来自 于清华 姚 班。 在 过去 的 20年 里, 清华 姚 班 出了 很多 人工智能 独角兽 公司 的 创始人, 比如说 小马 智 行 的 楼 天城, 旷 视 科技 的 唐 文斌、 应 琦 等, 包括 现在 很 火 的 大 模型 公司 月之暗面, 它的 创始人 杨 之 林 在 过去 几年 也是 姚 班 的 任课教师。 除此之外, 姚 班 也 培养出 了 一群 顶级 的 A I 学者, 他们 相继 进入 斯坦福大学、 普林斯顿大学、 杜克大学, 还有 清华大学 等 国内外 知名 的 大学 任教。

这个 传奇 的 计算机 实验班 是 图灵奖 得主 姚期智 先生 于 2005年 在 清华 成立 的。 如果说 进入 清华 已经 很难, 那 进入 姚 班 的 本科生 需要 经过 更加 严格 的 选拔, 由 姚先生 亲自 制定 培养 计划。 姚 班 至今 成立 已经 20年 了, 我 非常 的 好奇, 姚 班 到底 经历 了 怎么样 的 发展 过程? 而 号称 打造 一流 本科 柯 生的 姚 班, 到底 又是 怎么样 去 培养 这样 一群 天才 的那 今天 我们 邀请 到了 2010级 的 姚 班 学生, 同时 现在 也 选择 回 姚 班 任教 的 吴毅 老师, 吴 老师 现在 也 任 清华大学 交叉 信息 研究院 助理 教授。 Hello 吴 老师你好。

hello 大家好。

吴 老师 本科 也是 在 清华, 姚 班 博士 在 U C berkeley 之前 还在 OpenAI 的 时候 做 过 研究员。 现在 同时 也是 边塞 科技 的 创始人, 整个 背景 是 非常 厉害 的。

谢谢, 过奖 了。 我是 2010年到2014年 的 时候 在 要 班 读 本科。 然后 14年到19年 的 时候, 在 你 读 PHD19年 的 二月份 一直 到 20年 的 七月份 在 欧 本院 工作。 然后 20年 8月份 就 回到 清华 姚 班 重新 当 老师 了, 所以 现在 也是 在 姚 班 当 老师。

对 那 吴 老师 我是 非常 好奇, 2020年 的 时候, 当时 你是 为什么 会 辞去 OpenAI 研究员 的 工作, 回到 清华 交叉 信息 研究院 的?

开玩笑 的 说 肯定 是 那个 时候 不知道 有 ChatGPT 这样的 东西。 当然 说正经 的话, 其实我 是在 2018年 的 时候 就 决定 回 茶园 当 老师, 然后 当时 也 签 了 这个 offer。 我 当时 应该 是 整个 姚 班 历史上 第一个 回 姚 班 当 老师 的, 自己 毕业 出去 的 学生。 所以 我 去 找 OpenAI 工作 的 时候, 其实 那个 时候 就 已经 确定 我 2020年 的 八月份 要 回国, 所以 其实 是 入 职 之前 就 确定 的, 所以 导致 那个 时候 我没有 拿 股票。

现在 后悔 吗?

也 还好, 没有 那么 多倍。

对, 其实 你 刚刚 有 提到 你是 在 这批 清华 要 搬出去 的 学者 里面, 相当于 是 第一个 回 学校 任教 的那 在 你 之后 还 会有 其他 的 之前 的 学生 学成归来, 回到 姚 班 来 任教。 大家 现在 在 研究 的 一些 整体 的 方向 是什么? 可不可以 给 我们 介绍 一下?

还 挺 多 的。 我 回去 之后 我也 帮 我们 院 代言。 因为我 在 姚 班 还算 人缘 挺好的, 所以 剩下 的 都 还 认识, 所以 我也 劝 了 不少 人 回来, 就 比如说 我们 院 我是 零字 班 的, 所以 三字 班 就 回来了。 现在 我们 苑 三字 班 有一个人 回来, 然后 可能 五字 班 也 有人 回来。 所以 现在 可能 我们 院 本科 是 姚 班 毕业 的 得 有 三个人, 清华 毕业 的 就 更 多了。

我们 现在 把 时间 拉 回到 2010年, 你是 2010年到2014年 再 要 搬。 你 在 上学 期间, 在 清华 姚 班 的 期间, 你 觉得 他们的 学习 方法 跟 学习 体验 有什么 特别之处? 有 哪些 让 你 印象 深刻 的 地方? 因为 我们 知道 姚 班 其实 他是 有 两类 学生, 一类 就是 竞赛 类 的 学生, 可以 说 也是 海选 的 天才 中的 天才。 还有 一类 是从 清华 的, 应该 是 其他 的 本科生 中选 的 一些 感觉 都是 非常 优秀 的 人, 我 很 好奇 他们是 怎么 去 培养 一群 极为 优秀 的 人的。

姚 班 其实 有些 阶段 了, 我们 说 一下 当时 那个 时候, 当时 的话 姚 班 大概是 30个人, 只有 一个班。 现在 其实 挺 多了, 现在 可能 有 七八十个 人, 然后 也有 不同 的 方向。 我 觉得 姚 班 基本上 分了 三个 阶段。 我 觉得 第一个 阶段 就是 姚先生 刚回来 的 时候, 姚先生 刚回来 的 时候 是 2005年 第一次 开始 搞 这么 一个 实验班。 当时 是一个 我 觉得 是 姚先生 个人风格 影响 特别 强烈 的 一个 阶段。 04年 05年, 比如说 当时 罗 天成 现在 这个 pony A I 的 创始人 楼 教主, 楼 教主 就是 当时 四 字 班 04年 第一届 1班的 学生, 他们 那个年代 的 姚 班 就是 以 理论 计算机科学 为主, 因为 这是 姚先生 自己的 老本行, 当时 有一个 客观 的 原因, 也是 姚先生 觉得 理论 计算机科学 是 整个 计算机科学 的 基础, 但是 为什么 在 国内 没有 好的 理论 计算机 培养 体系 和 课程? 所以 当时 姚先生 回来 专门 以 理论 计算机科学 为 中心 设计 的 一套 培养 方案。

基本上 是 到了 10年 左右, 在 我们 这几年 这 一届 学生呢 基本上 开始 因为 姚 班 也 运行 了 一段时间, 开始 有 新的 老师 回来。 比如说 像 我们 院 现在 刚 评 上正 教授 的 一些 老师, 基本上都 是我 在读 本科 的 时候 从 海外 陆续 回来的。 比如说 我们 院 的 徐薇 老师 也是 broke 毕业 的, 然后 有 黄龙 波 老师、 李健 老师, 这些 都是 我在 读书 的 时候 从 海外 回来的。 从 那个 时代 回来 之后, 我们 依然 是 开始 有 各种各样 的 别的 课程, 比较 广泛 的 课程 开始 设置。 这 是一个 时间段。

然后 再到 可能 就是我 回来 前后 这个 时间段。 整个 院 里面 基本上 像 我们 10年 左右, 这 一批 本科生 开始 有人 回国。 整个 院 基本上 我 认为 和 美国 的 一流 高校 基本上 接轨 了。 课程体系 也好, 培养 体系 也都 好, 也都 非常 前沿, 非常 全面 了。 所以 是 这么 一个 发展 阶段 的。

基本上 不变 的 事情 是, 一 姚 班 非常重视 理论, 就是 计算机 理论, 所以 确实 有 不少 的 理论课。 第二件 事情 是 姚 班 的 课程 确实 非常 难, 就 总体上 非常 难。 像 我们 那个 时候 理论课 就 非常 多, 非常 重, 也 难度 非常 大。 像 现在 的话, 因为 他们的 课程 特别 多了, 每 一门课 都是 像 我们 这种 海外 回来的 老师 新 开 的, 所以 难度 也 非常 大, 所以 比较 偏重 理论, 比较 难。 第三 是 姚 班 学生 确实 培养 自由度 非常 大, 这也是 不变 的。 举 个 例子, 比如说 我们 读书 那会儿, 我们的 总体 要求 的 学分 或者 学时 数量 比起 其他 院系 是 少 的, 就 客观 上 说是 少 的。

你说 课程 少 还是 什么 少?

课时 就 比如 学分 是 一样的, 但是 我们 需要 坐在 课堂 里面 的 时间 会 比 别的 学生 少一点。 但 这个 原因 也 是因为 我们 课程 难, 所以 他 就 认为 你 课后 需要 花 更多 的 时间, 所以 就 把 有 一些 学识 放在 了 课后。 但 事实上 导致 我们 需要 在 课堂 上 坐在 那儿 的 时间 是 少 的。 或者说 我们 必须 要 花 的 一些 非 自主 安排 的 时间 是 比 别的 院系 要 少 的, 并且 更 灵活。 就 导致 什么 呢? 导致 我们 院 的 学生 有 更多 的 自主 支配 时间。

自主 支配 时间 他 可以 自己 做 科研, 他 可以 去 实习, 还 可以 去 访问。 其实我 那个年代, 2010年 左右, 当时 最好的 科研 的 机构 是 微软亚洲研究院。 因为 当时 中国 没有 那么 好的 A I, 所以 你 想做 A I 的话, 需要 去 微软亚洲研究院, 那是 最好的地方。 但是 去 实习 是要 花时间 的, 大部分 的 院系 其实 是你 不可能 有 学生 能够 抽出 时间 去 实习。 我们 院 如果你 真的 把 课 排好, 你是 可以 一周 真的 做到 有 2到3天 时间 没 课。 大家 就是 在 研究所 里面 呆 着 了。 比如说 我们 院 现在 基本上 能够 做到 大三 的 一个 学期 可以 不 排课。

就 出去 实习。

对, 他们 就会 选择 出去 实习, 会 选择 去 美国 访问。 这些 事情 医院 里面 都 非常 鼓励。 当然 它是 有 个 发展 流程 的, 但是 总体上 姚先生 是 能够 做到 重视 理论 培养, 然后 课程 难 给 大家 足够 的 空间。

我想说 的 是, 这些 人 其实 他 不是 培养出来 的, 而是 他 涌现。 什么 叫 智能 的 涌现? 其实 姚 班 这个 班 也 比较 像 涌现 这些 人 他们 做 的 研究。 比如说 我 那个 时候 做 的 一些 研究, 我也 不是 院 里面 老师 带 的, 像 我们 班里 很多 的 这些 研究, 我 现在 我们 班里 有 很多 做 教授 的 同学, 当时 我们 也 有些 做 的 比较 好的 同学, 他们 做 的 研究 其实 也 不是 跟 院 里面 的 老师 特别 相关。 但是 没有关系, 你 只有 给 了 他们 足够 的 让 他们 知道 这个世界 是 这么 大。 然后 把 很多 好的 人 攒 在一起, 你 再 给 他们 时间, 他 就会 自动 的 涌现 出来。 所以 姚先生 做 的 事情 都是 把 这些 最好的 人 把 它 聚集 起来。 聚起来 之后, 给 他们 时间 和 空间, 并且 告诉 他们 这 世界上 有 很难 的 问题, 然后 大家 就会 自己 探索。 所以 有的 时候 也会 说 姚 班 比较 卷, 那 确实 可能 有一点 卷。

对我 听 下来 就 感觉 是 把 全 中国 最 聪明 的 一群 人 首先 先 聚集 起来, 然后 给 他们 足够 有 挑战 的 问题, 再 让 他们 有 足够 的 自由度 去 探索。 对我 今天 还 看 了 一个 姚先生 的 采访, 我 觉得 挺 有意思 的。 它 里面 有 一段话 是 说, 如果你 有 一门课 就是你 拿到 的 分数 并 不高。 他说 这 是一个 好事儿, 至少 你知道 你 以后 的 事业 方向 就可以 不用 选 这个 方向 了。 所以 我 看得出来, 他 其实 是一个 非常 古 鼓励 大家 去 找到自己 擅长 的 东西 跟 热爱 的 东西 的 一个 学者。

挺 有意思 的。 我 觉得 你说 这个 话 确实 我 还有 印象, 就 姚先生 自己 本身 也是 挺 风趣 很 幽默 的, 而且 姚先生 也是 大家, 他 讲 的 很多 话 其实 挺 深刻 的。 有些 话 是我 读书 的 时候 其实 不 觉得, 但 回头看 的话, 其实 他 讲 的话 是 很 深刻。 但 这个 深刻, 我 可能 在 我 读书 的 时候 也 不一定 知道, 他 其实 也会 讲 一些 玩笑话。

但是 其实 想想 蛮有意思 的。 比如说 我们 当时 我们 院 会 经常 组织 一些 讲座, 其实 我们 院 的 讲座 密度 是 非常 高 的, 也会 鼓励 本科生 去 听 讲座。 我们 那个年代, 姚先生 还会 每年 请 我们 吃 一次 饭, 跟 我们 做 一些 文化。

然后 我们 就 问 他, 我说 我们 班里 有 个 同学 问, 说 姚先生 这个 talk 都是 前沿 talk, 我们 听不懂 怎么办? 对 吧? 你 还要 让 我们 去 听 讲座, 但 我们 都 听不懂。 姚先生 说 没有关系, 对 吧? 听 你 听不懂 的 讲座 可以 培养 科学家 的 气质。 像 其实 也 挺 对的, 因为 大部分 时候 你就是 听不懂, 对 吧? 所有 时候 都是 听不懂, 听着 听着 可能 就 听懂, 或者 你 大概 从 里面 能够 收获 到 一点 东西, 就能 对你 有用的。

读书 的 时候 很 容易, 大家 会 觉得 你 所有的 东西 都要 搞懂。 可能 你来 摇 班 你 会 发现 上来 你 就会 发现 你 怎么 这些 人是 这个 样子 的, 这个 东西 怎么 这么 难。 你 很快 就会 意识到, 反正 有 很多 东西 都是 不懂 的, 有 很多 讲 的 一些 话吧, 就是你 那个 时候 可能 印象 挺 深刻 的, 但 他 确实 对你 产生 了 很多 的 影响。

你 大学 的 时候, 你的 主要 精力 跟 你 怎么 去 设定 自己的 目标 的。

我 属于 班里 成绩 一般 的那 一种, 就 我自己 去 搞 竞赛 的。 可能 你 高中 的 时候 还 觉得 自己 挺 厉害 的, 然后 你 到了 摇摆 之后 就会 发现 周围 的 都是 一些 什么人 啊哈 卷 不过。 所以 我 当时 其实 知道 自己 反正 G P A 应该 卷 不过 这些 人我 就 想 我 把 我 一些 我喜欢 的 课 就 好好 上, 不 喜欢 的 就 拉倒 就算 了。

我 当时 也 确实 在 M S I 花了 挺 多 的 时间, 然后 我 当时 也 去 berkeley 访问, 所以 当时 也是 非常感谢 院 里面 给 了 我们 一个 机会。 我 当时 是 后来 是 拿到 了 院里 的 资助。 当然 我 去 伯克利 访问 的 时候, 其实 并不知道 苑 里面 有 这样 政策。 然后 最后 也是 院 里面 觉得 发现 这些 小孩 自己 还能 去 找到 一些 海外 的 机会, 能 去 访问, 去 做出 一些 科研 的 成绩。 所以 也 把 访问 这件 事情 变成 一个 制度性 的 固定 下来。 也是 表 班 大三 学期 有一个 学期 可以 资助 大家 去 海外 访问。

也是 基本上 从 我们 那 一届, 我 跟 我的 几个 同学 自己 探出 了 一些 路, 然后 姚先生 觉得 很 不错, 然后 从 21年 开始 就 一字 扳 开始 试点, 到 基本上 二 字 班 开始 就 固定 下来, 形成 一个 传统。 这个 也 是从 我们 那 届 开始 的。 所以 我们 那 届 的 人 就是 属于 大家 都 比较 能 折腾, 但是 折腾 的 客观原因 是 我们 确实 比 别人 闲 一点, 我 当时 还算 比较 能 折腾, 因为我 其实 大二 就 去 M S I A 实习。

大二 的 暑假 其实 当时 我去了 facebook。 我 当时 是 facebook 历史上 第一个 从 大陆 过去 的 本科生 实习生。 对, 当时 也 去 了解 了 一下, 就是 当时 硅谷 弯曲 以及 当时 的 很多, 你 反正 看到 了 那样的 一个 世界。 然后 到了 大三 的 暑假, 我 又 去 U C B C B 访问, 后来 就 跟着 我的 导师 继续 读 P H D。 所以 我 基本上 属于 我们班 还 比较 能 折腾, 朋友 比较 多 的 那种。 那 肯定 不是 成绩 最好的我 我 当时 应该 是 排 30% 的 样子, 我们 30个人我 好像 排 第十, 这样 肯定 就是 属于 成绩 一般 的那 一挂。

在 这样 一个 环境 里 也很 好了。 我 跟 大家 介绍 一下, 无意 其实 是在 你 高 2暑假 的 时候 就 拿到 了 number one 竞赛 中的 金牌, 然后 是 被 清华 交叉 信息学 学院 保送 去 的 要 班 对 吧?

不完全 对我 是 搞 信息学 竞赛 的, 所以 我是 高一 暑假 保送 的 清华, 然后 高二 全国 比赛 拿了 金牌, 然后 高三 进 的 国家队。 在 我们 那个年代, 因为 姚 班 只有 30个人。 当时 按照 惯例 是 信息学 只有 国家队 才能 进 耀斑 的。 所以 我 其实 一直 不知道 我 能不能 进 老班, 直到 我 高三 确实 进了 国家队。

所以 才 进 OK。 然后 你 刚刚 提到, 其实 你是 第一个 自己 去 找到 这种 海外 的 访问 机会, 包括 是 当年 应该 还 叫 facebook, 就 facebook 的 第一个 直接 从 大陆 招 过去 的 实习生。 你是 怎么样 去 发现 这样的 一些 新 机会 的, 跟 探索 出来 这条路 的。

其实 挺 有意思 的, 这个 都是 阴差阳错, 我可以 分享 一下 当时 是 怎么回事。 首先 我 当时 比较 能 折腾, 我 当时 就 特别 想 去 实习。 我 实习 的 时候 我也 脸皮 比较 厚, 我 去 找 我的 师兄, 所以 我 找 了 六 字 班 的 我的 一个 师兄 叫 唐 文斌。 唐 文斌 是 现在 旷 视 科技 的 C E O, 当时 他 也是 搞定 C I 的。 他 创业 也是 很 成功了, 上 一代 人工智能 企业 里面 很 成功 的 例子。

然后 我 找 陶文 兵, 陶文 兵 我说 师兄 你 帮 我 想想 办法, 我想 去 google。 因为 当时 一二年 的 时候, google 中国 还是 很 好的 一个地方, 现在 google 就 几乎 撤出 中国 了。 他 就 找 了 他的 师兄, 他 以为 那个 师兄 在 google, 结果 那个 师兄 刚好 刚 跳槽 去了 facebook。 然后 谭 文斌 帮我找 的 时候 也 没 说 想 干嘛, 他 就说, 这个 师弟 帮 我 推荐 一下 谭 文彬 的 师兄, 我们 一个 二 字 班 的 师兄 就 随手 就 内推 了。

于是 到 我 这儿 就会 发现, 有一天 突然 我在 我的 邮箱 里面 收到 一封 来自 facebook 的 邮件, 说 想 不想 来了 面试 一下。 然后 我 就 打电话 去 跟 他家 面试, 我 就 跟 H R 说 facebook 在 中国 也没有 office。 我说 我 去 哪 实习? 他说 你来 美国? 我说 咦 这个 好, 然后 就 面试, 面试 了 就 去了。

第一次 去 美国 的 时候, 还 不知道 美国 的 签证 很 麻烦, 然后 还 被 关 了 小黑屋, 反正 有 很多 很 好玩的 事情。 那时候 20岁, 第一次 去 美国 也 挺 有意思 的。 现在 回想 也是 我 前两天 还 回想 一二年 过去了, 其实 中间 有 很多 很 有意思 的 时间点。

比如说 我 一二年 的 时候, 我在 facebook, 是我 师兄 帮 我 介绍, 然后 我 就有 了 facebook 的 机会。 其实 16年 我还在 字节, 我 当时 是 字节 跳动 A I lab 的, 可能 前 几号 团队 成员, 当时 也是 我 另外一个 师兄, 但 他 不是 姚 班 的那 他 一个 师兄 然后 介绍 我说 祝 国内 有 特别 好的 机会, 你回来 看一看。 我在 OpenAI 的 时候, 也 是因为 我 有 一些 berley 的 师兄 也是 朋友, 然后 我 刚好 去了 有些 合作, 然后 我 就 去了。 我 所以 就会 发现 其实 过去 一二年 还是 有 很多人 在帮 我, 我 确实 踩 到了 一些 这样的 时间点。 然后 在 每个 时间点 都能 以 比较 insider 的 角度 去 见证 一些 事情。 但是 也 确实 是 每个 事情 也 不能 完全 说是 我自己 其实 有 很多人 在帮 我。

所以 我 觉得 姚 班 其实 这个 团体 也很 感谢 姚先生。 因为 有一个人 他 有 这样的 号召力, 或者说 他 能 愿意 把 这样 最好的 人 聚 在一起, 并且 给 他们 足够 的 自由度。 如果 没有 这些 人 聚在一起 并且 有 这样的 联系 的话, 其实 一个人 的 能力 是 很小 的。 尤其 在 一个 时代 的 大势 下面, 很多 事情 都是 随机 的那 它 就是 因为 人和 人的 碰撞, 它 能 碰上 这些 火花。

是 接下来 你 要不要 跟 大家 介绍 一下, 姚 班 有 哪些 非常 厉害 的 科技 公司 的 创始人, 或者说 有 哪些 非常 顶级 的 学者?

还 真不少。 我 能 说 像 一些 名字, 因为我 确实 跟 这些 人 关系 还 挺好的。 比如说 狮子 班 比较 有名 的 罗 天成。

狮子 班 是 指 2004年.

OK 历史上 第一届 要 办。 我们 从 早 往后 说, 04年 其实 有 最 有名 的 业界 的 人, 其实 就是 罗天 成就 小马 智 行 的 C T O 也是 竞赛 出身, 第一届 姚 班。 然后 学界 的话 其实 四 字 班 有 葛 荣, 葛 荣 是 清华 计算机, 因为 那个 时候 我们 还没有 独立 建院, 所以 还是 在 计算机系 在一起。 计算机系 历史上 非常 传奇 的 一个 人物, 就 基本上 门门 功课 考 低 的 那种。 葛 荣 现在 在 杜克大学, 她 也是 song fellowshi p 5字 班, 当时 有 周元, 好多 基本上都 是 竞赛 出身 的, 有 很多 这个 faculty, 像 周媛 是 最近 也是 原来的 UIUC 当 faculty。 然后 最后 回到 清华, 像 我们 六 字 班 就要 到 谭 文斌, 谭 文 兵 是 旷 视 科技, 旷 视 科技 当时 是 杨木 唐红 兵 应 其 六 字 班, 七字 班 要 班 的。 我们的 同学 比如说 到 7字班 的, 我们 有 就 开始 有 很多人 开始 当 教授 了。

比较 有名 的 其实 八字 班, 八字 班 是 出了 好多 人。 比如说 八字 班 的 陈丹 琪 是在 princeton 做 自然语言 处理 的 助理 教授, 然后 她的 老公 雨 化成 也是 八字 班 的 同学, 也 在 普林斯。 然后 八字 班 还有 在 斯坦福 任教 的 马 腾宇, 马 腾宇 应该 最近 也 开 了 自己的 公司 voyage ai 马 腾宇 和 陈丹 琪 应该 都是 strong fireship。 然后 九 字 班 的话, 比如说 到 我们班, 我们班 可能 比较 有名 的 吴家 俊 在 斯坦福。 当 fact 我们班 可能 有 七八个 发口 地, 就 七八个 在 高校 任教 的。 然后 最 有名 的 肯定 是 吴家 俊, 斯坦福 的 发口 地, 吴家 骏 是 当时 我 隔壁 宿舍。 我们 这 届 其实 也有 不少 开 公司 的, 我自己 开 了 一个 小 公司, 也是 做大 模型 agent 相关 的 公司。

再 往后 比较 年轻 的 也有, 我们 最近 三 四班 刘 壮 应该 是 刚 去 普林斯顿 当 教授。 最近 应该 是 三字 班, 应该 是 开始 在 找 教职 的 这么 一个 状态。 然后 一字 扳 应该 也有 一些 去 当 教师 的。 所以 基本上 你 看到 那个 分界线 在 八字 班 左右, 基本上 每 一届 都能 数 出来 好几个。 在 顶级 高校, 我爱 命 就是 美国 top ten university, 甚至 我说 to p 5 top six university 任教 的 就 每 一届 都 会有。 所以 基本上 这个 开花结果 其实 也 很快 就 很快 从 他们 基本上 任教 开始, 也就是说 从 姚 班 成立 的 第一批 学生, 可以在 美国 最 顶级 的 高校 任教。

可能 花了 十年。 那 在 产业 里面 的。

产业 还 挺 有意思 的, 是 刚好 都 和 人工智能 相关。 那你 像 自动驾驶, 其实 楼天成 小马 智 行 是 最早 的 公司。 然后 上 一波 人工智能 其实 也 挺 有意思 的。 就是 face 加加 旷 视 科技, 谭勇 兵 因 其 仰慕 上 一代 人工智能 创业 到 还 真的 是 大 模型。

这 一代 的 这些 创业 公司 里面, 其实 差 院 的 老师 参与 的 会 非常 多, 就是我 自己 肯定 是一个 例子。 大 模型 像 杨 之 林 其实 也 在 我们 院 之前 任教 过 很长 一段时间。 他 做 的 U G M 面 其实 也是 国内第一 梯队 的 做大 模型 基础 能力 的 公司。 最近 的 自身 智能 这 一波, 其实 也 好多 公司 都有 我们 院 老师 的 参与 或者 团队 参与。

其实我 觉得 也很 有意思, 是因为 姚 班 确实 是 不管 是 汇聚 老师 也好, 还是 汇聚 学生 也好, 他是 把 中国 相当 一部分 最好的 人才 聚集 在一起。 而 这 几 波 创业 浪潮 来看, 它 恰好 也都 是 技术 驱动 的 这些 创业 浪潮。 他 对 人才 的 要求 就会 比较高。 所以 很 巧 的 事情 就是 创业 的 趋势 恰好 和 姚 班 的 特点 比较 匹配。 所以 我们 也得 说 确实 赶上 了 这样 一些 好的 时间 能够 参与 进去。

我 觉得 一个 是 时机, 还有一个 是不是 因为 首先 是 有 姚期智 先生 牵头, 同时 你们是 一个 非常 年轻 的 院系, 它 没有 历史 的 包袱 在 里面, 所以 它 能 发展 的 很快。

如果 看 院系 发展 的话, 我 同意 它 确实 是一个 年轻 的 院系。 首先 我 觉得 这是 肯定 的, 就是 它的 包袱 会 少一点。 比如说 我们在 做 课程 改革 的 时候, 我们在 不管 是 人事 还是 招聘, 还是 说 在 教学 方案 培养 上 变化 都 可以 变得 很快 很 灵活, 这是 一方面。 但 我 确实 觉得 跟 姚先生 自己 他 花 的 时间 和 他 投入 的, 不管 是 自己的 声誉 还是 自己的 经历 都是 很 有关系 的。 比如说 最 早期 的 时候, 为什么 在 清华 还没有 是 任何 世界一流 计算机 研究 命题 的 时候, 它 能 吸引 到 一批 国际 学者 和 最好的 学者 来 给 姚 班 上课。 他在 最 早期 的 时候, 我们 其实 有 很多 的 课 是 微 瑞 亚洲 研究院 的 老师 来 上课 的。 这些 其实 都是 靠 姚先生 自己的 个人 光环。 当 他在 做 完 这 一步 启动 之后, 开始 能够 吸引 到 更多 的 海外 的 老师 回来 任教 的 时候, 再 往后面 的 工作 其实 就 比较 顺其自然 了。

比如说 到 现在, 我 觉得 姚 班 的 发展 就 很 正轨 了。 就 比如说 基本上 我们 所有的 老师 都是 美国 top 4CSPHD program 回来的 老师。 那 基本上 这种 情况下 的话, 姚先生 就 不太 用 操心 每个 课 到底 谁 开, 对 吧? 就是 他 基本上 每个 课 每个 方向 都 知道 有 最好的 老师 去 教授, 他 不太 用 管 这些 事情 了。 但 在 早期 的 时候, 每 一门课 其实 都 是要 花 很多 心思 的, 就 去 找 谁。

姚先生 会 自己 去 写 教材。

他 自己 也会 上课, 然后 真的 会。 姚太太 其实 也 给 我们 上 过 课, 亲自 给 我们 上 一些 前沿 的 课程, 然后 去 请 人 回来 也很 重要。 因为 这个 其实 就是。

而且 很 扩展 大家 的 视野, 对不对?

就是你 那个 时候 在 大家 看不到 外面的世界 的 时候, 是 需要 有你 看到 最好的 人 长成 什么样 的。 这件 事情 是 没有 姚先生 牵 这个 头, 并且 他 愿意 亲自 去 卖 这个 面子 是 做不到 的。 所以 万事开头难, 最早 的 季节 永远是 最 困难。

你 现在 觉得 姚 班 的 传奇 可以 复制 吗? 比如说 清华 或者 北大 其他 院系 的 老师, 能够 找到 一个 足够 重量级 的 教授 来去 复制 小班 的这 套 模式。 看 能不能 打 造成 一个 综合 实力 非常 强 的 一个 研究院。 你 觉得 有可能 吗?

我 觉得 这个 话, 我们 首先 得 承认, 有 相当 多 的 地方 都在 复制 这样的 培养 方式。 然后 我 觉得 其实 对 学生 来说 是 一件 非常 好的事情。 大家 都 发现 奥 姚 班 原来 给予 优秀 的 学生 最好的 资源, 他们是 可以 涌现出 最好的 教学 成果。 就是 很多 高校 其实 都在 模仿, 当然 我们 先 且不说 这个 时候 能不能 模仿 出来, 当然 我 觉得 因为 他们的 模仿 对于 姚明 来说, 姚 班 也 在 往前走, 所以 不是 姚 班 就是 停 在 原地, 大家 会 来 模仿。 所以 我 觉得 再加上 人才 的 密度 和 培养 的 模式, 它 总是 需要 累积 和 时间 的。 一个 班级 的 惯性 也好, 还是 他的 培养 体系, 以及 他 师资 的 团队, 以及 他的 研究 的 整个 氛围 是 一步一步 往前走 的。 其他 学校 我 觉得 是 可 复制 的。 如果 他 能 找到 同样 的 资源 和 时间, 并且 大家 真的 可以 凑出 这样的 人, 但是 他 也是 需要 时间 的对。

要 搬到 现在 也是 有 24年, 对不对?

20年 了 对 吧?

也 20年 了, 20年。

对, 所以 他 也是 需要 时间。 第二个 角度 是我 觉得 不能 以 现在 的 标准 来看。 我们 想 的 是在 2004年 或者 2005年 那个 时间点, 是不是 有可能 有 别的 人 把 这件 事情 做成。 就像 我们 总 说, 比如说 我们 说 百度 搜索 现在 用 的 不好, 但是 回到 2000年 那个 时间点, 有人 能比 百度 做 的 更好 吗? 到 2010年 左右, 甚至 也没有 人 可以 比 百度 做 的 好。 所以 我们是 不能 抛开 那个 时间点 来看 这样的 事情 的。

在 那个 时间点, 清华 甚至 没有 一节 计算 理论课。 清华 我们 也得 客观 的 说, 计算机科学 是在 会议 发 论文。 那个年代 是 没有人 能够 在 顶级 会议, 或者 几乎 没有人 能够 在 顶级 会议 上 发 论文 的。 现在 大家 都 知道 了, 清华 的 这个 数量? 就是你 要 跟 美国 的 高校 比, 也 完全 不 落下风 的。 但是 那个年代 是 没有 的, 所以 我们 不能 跳脱 那个 时代 来看 这个 问题。

在 那个年代 我 觉得 是 不可 复制 的, 甚至 即使 在 现在, 我 觉得 依然 不太 可 复制。 但 有没有可能 在 未来 的 十年, 大家 慢慢 能够 有一个 新的 集体 出现? 但 我 觉得 是 好事, 因为 出现 的 越多, 我 觉得 这 对 中国 的 教育 也是 一件 好事。

对, 因为你 现在 也 在 差 院 做 助理 教授, 就 是从 你 来看你 觉得 你们 目前 还有 哪些 挑战 是 没有 被 解决 的?

我 觉得 不能 叫 没有 被 解决。 就是我 的 观察 会 发现 每 一代人 真的 很 不一样, 你 会有 一种 很 强烈 的 感觉, 一代人 做 一代人 的 事情。 我 还 挺 有意思 的, 是因为 我 刚好 跟 0405 的 人, 就是 十年 前 的 人 很熟。 比如说 我 跟 卢 天成 私交 很好, 然后 我 跟 当时 一些 我的大 师兄们 私交 也就 很好。 我自己 又 属于 一代人, 然后 我自己 当 班主任, 所以 我会 观察 到 后面 一代人 是 很 不一样的。 比如说 我 你 去 采访 一个 0405届 的 大师兄, 说 你 当年 为什么 要 选 这个 方向? 所有人 的 回答 基本 都是 姚先生 的 个人魅力。

就 大家 当时 看到 的 就是, 这个世界 原来是这样 的。 大家 原来 可以 做 计算机 理论 科学。 所以 当时 0405 或者 早年 的 这些 师兄 师姐 们, 是 有 大量 的 人 去做 理论 计算 科学 的这 是 完全 是 极 强大 的 个人魅力。

到 我们 这 届 开始 的 时候, 我们 开始 知道, 我们 去看看 A I 看看 别的 方向, 然后 自己 想 去 寻求 机会 来 让 我们 自己 也 很多 同学 是 做 理论 的, 但是 大家 会 开始 说, 是不是 可以 去 做做 A I 去 做做 机器学习, 去做 一 做 别的 什么东西。 会 开始 想, 我们 是不是 要 去 海外 去 看一看? 但是 总体 来说, 我们是 处在 一个 我 很想 去 找 机会 的 一个地方。 我知道 外面的世界 是 更大 的, 我自己 想 去寻找 这样的 机会。 但是 你看 现在 的 小孩 的 心态 就 完全 不一样。 就现在 的 小孩 就会 发现, 我 有 好多 选择, 我要 去 春游, 我要 去 M I T 的。

现在 经常 小孩 跟 我说, 吴 老师 我 这个 项目 做 完了, 我 就 不想 做了。 我说 你 后面 什么 计划? 他说 我 春节 想 去 M I T 看看, 我 说好的。 对, 然后 他们 也会 更 自信。

就 比如说 在 我 那个年代, 我们 其实 更 多是 那时候 是 没有 太多 的 选择。 那时候 清华 已经 有 不少 的 团队 能 发 顶级 会议 论文 了, 但是 还是 很少。 比如说 我想 我 第一次 发 NIPS 的 时候, 2012年 那个 时候 可能 NIPS 只有 60篇论文, 可能 清华 有 几个 老师 能 发 一两篇 论文。 但 现在 不一样 了, 现在 你 可能 去 找 清华 能 发 非常 多 笔数 的 论文, 那时候 还没有。 所以 那时候 还是 想 的 是, 有没有 一个地方 能够 给我一个机会, 让 我 去 证明 自己 现在 的 小孩 就是 这个世界 123我都 去看看, 我 有 这么 多个 选择, 他们 会 比 我们 更 自信 一些, 发自内心 的 更 自信 一些。 然后 他们 也 确实 有 更好 的 资源。

但是 这个 事情 就是 一代一代 的 先 有 姚先生 的 个人魅力, 能够 让 一些 学生 开始 走向世界 一流。 其实 他们 都 是在 比较 偏 理论 的 方向, 然后 他们 会 再 回来 吸引 到 一批 不同 方向 的 老师。 有了 这些 老师 之后, 会 培养 出新 的 一批 学生。 然后 这 一批 学生 成为 世界上 可能 可以 站得住脚 的 研究 的 学者 之后, 再 培养出 的 学生 他们 就会 更有 第一 视角, 他是 一代一代 人, 所以 这种 每 一代人 的 使命 不一样的 感觉 会 很 有意思。

所以 你 回答 你的 问题, 就是说 有没有 什么 未 解决 的 问题, 我会 觉得 很难说。 我知道 有什么 问题 没有 解决, 因为你 其实 不知道 下一代 人 会 被 人 长成 什么样, 我们 不太 能够 预判 说 下一个 时代 长成 什么样。 但是 你知道的 事情 是 这个 时代 也 在 一定 在 往前走。

大家 的 想法 不太 一样 了, 对不对?

但 这就是 它是 一个 好事儿。

对对对, 更加 多元化。

一代 更 比 一代 强, 他 应该 是 这样。 所以 我 很难说 我会 预判 到 未来 有什么 新的 结果, 我 觉得 只能 说 我 这 代人 也 只能 做 我 这 代人 的 事情。

对你 在 会 自己 带 博士生 吗?

对, 我有我 是 博士生 导师。

你们的 目标 是 更多 的 培养 好的 学者, 还是 培养 好的 产业界 人才, 还是 说 我 只要 培养 好的 人才 就可以 了。

我 觉得 不同 的 老师 可能 不一样。

风格 不一样。

你 我 觉得 我的 风格 其实 会 非常 不能 叫 偏 产业, 我 觉得 我的 风格 是 相对 特殊 一点。 我的 风格 更 像是 在 sta 更 像 创业 团队。 所以 可能 我的 个人风格 有关, 可能 跟 O B I 当年 早期 的 风格 也 有关, 可能 跟 我自己 读 P H D 我自己 就 经常 做 一些 大 的 项目 也有 关系。 所以 导致 我的 风格 就会 特别 偏向 我们 要 做 一个 完整 的 项目。 我 觉得 我不会 以 这种 最后 他是 当 老师 还是 去 工业界 来 判断 到底 是 怎么 培养人才。 所以 我会 以 按照 我的 风格 和 我的 想法 跟 他们 做 沟通。 最后 到底 是 做 老师 还是 去 公司 里, 他们 自己 决定。

现在 清华 叉 院 它 在 哪些 方向 它的 科研 实力 特别 强。 就是你 刚刚 其实 也 提到 了, 有 很多 之前 毕业 的 学生, 他们 成长起来 了也 回校 了。

首先 我们 察院 还是 理论 做得 非常 好。

计算机 理论。

对 理论 计算机科学 这也是 传统 方向。 就是 每 一年 都有 非常 好的 学生, 他们 现在开始 本科生 都 可以 去 发表 一些 最佳 论文 级别 的 成果 了, 非常 厉害, 所以 理论 一直 都是 非常 前沿 的。 然后 我们 系统 方向 其实 有 几个 非常 强 的 老师。 几个 老师 从 芯片 到 系统 其实 都 是在 美国 可以 拿到 很好 教职 的 老师。 他们 回国。 我们 院 也有 一个 专门 做 trip t 芯片 的 公司 北极 雄心, 还有 一家 专门 做 一些 加密 计算 的 芯片 的 公司, 也有 一些 硬件 的 公司, 所以 这 也 挺 强 的那 当然 我 还得 说, 确实 AI 方向 是 这几年 确实 非常 强 的 一个 大 模型 和 具 身 智能。 尤其 具 身 智能 可能 我们 永远 算是 聚 生 智能 这个 方向 人才 密度 最高 的 一个 学院 了。

你 刚刚 提到 聚 生 智能 的 几家 特别 厉害 的 公司 是 哪 三家?

我们 院 自己是 有一个 孵化 出去 的, 是 陈 建宇 老师。 陈 建宇 老师 有一个 叫 心动 机缘, 是 做 人形 机器人 的 公司, 这也是 清华 自己的 项目。 还有 就是 我们 院 的 像 高阳 老师、 许华 哲 老师、 赵航 老师 他们 参与 的 或者说 他们 团队 有 联系 和 合作 的 一些 公司。 他们 也是 作为 主要 的 顾问 也好, 球员 也好, 就是 参与 的 公司。 反正 参与 我 就 不说 了。

我 观察 到 现在 整个 在 人工智能 的 这个 方向, 从 学术 或者 研究 向 工业 的 转换, 这个 链条 已经 越来越 短 了。 就 比如说 我们 以前 在 科研 跟 工业 之间, 它 可能 还 存在 着 一个 学界 研究 的 非常 前沿。 但是 你 要把 这个 东西 拿来 应用 它 可能 是 需要 花 很多年 的 时间 的。 但是 我 觉得 在 人工智能 这个 方向, 尤其是 OpenAI 出来 之后, 特别是 大 模型 出来 之后, 研究 向 工业 的 转换 就 变得 越来越 短 了。

提 一个 假设性 的 问题, 因为 现在 整个 清华 叉 院 它的 人才 密度 也很 高, 同时 你们 也有 非常 多 的 研究 在 同时 进行。 你 觉得 有没有可能 清华 独立 研究 的 大 模型 它 能够 冲出来? 因为我 知道 现在 很多 美国 的 高校, 他们 也 在 跟 美国国会 游说。 如果我们 这个 事情 只 任由 工业界 去 发展, 因为 他们是 能 募集 到 最多 的 钱 的那 你 不给 学术界 支持 的话, 其实 整个 学术 圈 在 这 一块儿, 它的 研发 实力 就会 变得 差 一些。 所以 我是 在 想, 有没有可能 未来 的 一些 突破 可以 从 学术 圈 先 开始, 或者说 学术 圈 能 做 一个 媲美 工业 圈 同样 质量 或者 更好 的 大 模型。

对, 这 有 几个 角度, 我不想 一 上来 就 给 个 答案。 首先 第一个 角度 是 为什么 这个 周期 变短 了? 我 觉得 其实 不是 转化 周期 变短 了, 而是 在 这个 阶段 的 AI 或者 AI 的 发展趋势, 导致 AI 的 发展 特别 重 工程, 并且 成本 越来越高 了, 导致 很多 的 规模化 的 研究 不再 是 一两个 研究员 可以 独立 完成 的。 所以 他 必须 用 一个 更 高效 的 或者 更 强大 的 运营 实体 和 团队 来完成 这样的 工作, 所以 公司 会 更 合适。 所以 导致 很多 的 工程化 的 研究 工作 移交 到了 公司, 或者说 在 学校 里面 很难 开展, 这是 第一个。

第二个 事情 是 说 有没有可能 在 国内 学校 里面 做出 一个 媲美 工业界 的 大 模型。 单说 这件 事情 不太可能, 这个 就是 一个 纯 成本 的 问题。 就 比如说 我们 就 讲 训练, 对 吧? 我们 现在 讲 大 模型 就是 万卡 集群, 不说 别的, 我们 要 训 一个 大 模型, 他 要 1万张 卡。 然后 我们 要 多少 paradise 的 数据, 好 洗 数据 谁 去 洗? 我们 把 那个 系统 搭 出来, 要 让 1万张 卡 运营 一个月 的 时间 会 报错, 对 吧? 谁 去 搭建 这个 系统, 这 都 不是 几个 博士生 的 方式 可以 做 完 的那 学校 的 这个 运营 体制 就是 一个 以 博士生 为主, 博士生 每个 人都 有 自己的 课题。

这样的 大量 的 工程 比较 像 欧洲 的 那种 量子 对撞机 一样。 他 就是 在 这个 环境 下, 是 很难 指望 一个 由 博士生 组成 的 这个 团体 去 完成 这样的 一件 事情。 当然 你说 欧洲 量子 对撞机 是不是 也是 由 一堆 博士生 和 研究员 做成 的, 其实 他 也是。 但是 这个 就在于 你 需要 拨 那么 多 钱, 它的 成本 也很 高。 但是 我 就说 它 不光是 钱 的 问题, 你 就 想 是不是 我们 对于 A I 的 发展速度, 允许 像 量子 的 撞击 一样, 花 那么 长 的 时间 研究 一个 科学 问题。 A I 其实 它的 时间 要求 比 那个 高。 我们 客观 的 说, 比如说 我们 想 验证 引力波, 其实 引力波 的 项目 也 很大, 也 养活 了 无数代 的 P H D。 但是 你 是不是真的 允许 我们 花 30年、 20年 的 时间 去 研究 引力波 这 一个 东西, 一个 命题。 A I 其实 不 允许, A I 这个 迭代 周期 比 它 快 多了。 我们 如果 去 想象 A I 的 迭代 周期 的话, 它的 投入 和 它 到底 在 多少 年 多少 短 的 时间 里面 完成 了 这样的 投入, 它的 组织 度 是 要求 非常 高 的。

尹 立波 当时 花了 多少钱?

钱 也 很多, 但是 她 确实 做了 20年 的 时间。

当时 韦伯 望远镜 它的 数字 是 花了 100亿美元。 其实 我们 来看 的话, 你 就 觉得 比如说 我们 投入 这么 多 钱 去 研发 AI, 他 可能 也是。

可以 的这 理论上 是的, 所以 我没有 说 他 不可能。 我只是 说 大家 是不是 会 允许 我 投 100亿美元, 30年 之后 我 做出 一个 A I 来。

大家 会 显得 太慢 了, 但 产业 发展 的。

更快 对 产业 发展 的 更快。 所以 这就是我 的 观点。 就是说 在 A I 一个 它 本身 是 有 极大 经济 价值 的 这么 一个 领域 内, 你 一定 非要 研究 的 体制 去 完成 这么 一件 事情, 其实 是 很 低效 的。

如果你 让 学界 去 完成, 以 他的 组织 形态 和 周期 来看, 那么 他 可能 就是 会 需要 3到5年 的 时间, 就 3到5倍 的 时间 才能 完成 这么 一个 项目。 它 不是 不可能。 因为 我们 看 我们 可以 参照 所有的 这种 天文 重大 科研 问题, 他是 怎么 来做 的, 他是 可以 的, 但 它 就是 组织 度 会 更慢。 在 商业 就是 一个 如果你 有 商业机会, 它 就是 组织 度 更快 的 一个 更 惨烈 竞争 的 一种 模式。 所以 我 就 想说 有没有可能 做 呢? 我 觉得 是 不太可能, 因为他 没有 必要, 这 是一种 很大 的 浪费。 OK 对对对。

还是 效率 上, 它 不是 一个 最高 的 承载 的 形式。

对, 就像 特别 简单, 就是 为什么 NASA 要把 它的 一些 项目 转移到 space x 其实 是一个 逻辑, 如果 它 能 产生 商业价值 的话, 那 商业 可能 就是 效率 最高 的 一种 行为, 我 觉得 是 没有 必要。 那么 再 回到 研究 本身 来说, 研究 本身 他 本身 在 做 一件 什么 事情 呢? 他 其实 在 做 的 是一个 好的 研究, 需要 以 十年 为 尺度 去 观看。 我们 大家 可能 想 的 事情 都 是啊, 我们 现在 做 个 研究, 它 在 两年 之后 可以 产生 A G I, 但 其实 不是 的, 因为 我们 去 看 A G I 是 怎么 来 的。

他 最早 要 提到 hinton, hinton 开始 做 back publication, 把 它 调 work back publication 的 nature paper。 大概是 80年代, 然后 到 90年代 有 烟 了 坤, 然后 90年代 的 2000年 左右 有效 ban, 就 开始 做 神经 概率 语言 模型。 然后 到 alex net, 到 alex net 之后 再到 OpenAI getting load。

伊利 娅 开始 说 我们 一定要 把 大 模型 用 最大 的 网络, 最多 的 数据。 中间 得 多少 年? 80年代、 90年代, 2000年 才有 概率 语言 模型, 就 神经网 基于 神经 语言 网络 的 概率 语言 模型。 就是 要 需要 班主任 拿 奖 的 文章 到 attention 1几年, 然后 再到 伊利亚 用 一种 极其 偏执 的 方式 把 大 数据 这件 事情 演绎 到 极致。 这个 中间 从 到 GPT3 的 这个 时间点, 中间 得过 了 80年代到20年、 40年 的 时间。 所以 我 觉得 严 乐 坤 前段时间 说 了 一句话, 我 觉得 他 某种程度 上 是 对的。 当然 他是 经常 会 跟 现场 的 一些 主流 唱反调, 就是 他说 的话 不一定 都 对, 但 他 有 句 话 说的是, 如果你 读 P H D, 那 不应该 做大 语言 模型。

这 句 话 本身 我 觉得 对于 大部分 P H D 来说 是 不公平 的。 因为你 不能 总 说 你 为了 hinton 而 让 大部分 的 学生 都 不去 做 这些 研究, 对 吧? 大部分 的 学生 99.9% 的 人 还 不是 很 疼。 但是 从 培养 hinton 的 角度, 如果你 想 去做 一个 颠覆式 的 最重量级 的 创新 的话, 那 确实 你 不应该 看 现在 最 火 的 东西, 你 应该 bet the next big thing。 他 其实 这么说 没错, 只是 说 美国 有 那么 多 P H D, 你 都 按 你 这个 来, 那 一将功成 万 骨灰, 对 吧? 但是 某种程度 上, 科研 是 应该 有人 去做 这样 自由的 探索 的。 所以 我会 觉得 这个 事情 没有关系。

如果你 想 去 做大 模型, 那么 现在 来看 最合适 的 体制 就是 在 公司 里, 在 商业 竞争环境 下, 他 才能 成立 的 最快。 如果你 想 去做 的话, 就 去 找 一些 这样的 机会。 因为我 觉得 很多 公司 也是 很 开放 的。 比如说 我在 伯克利 的 时候, 很多 大公司 都 跟 伯克利 合作。 然后 在 清华 的 时候, 其实 你 也可以 跟 很多 公司 有 合作。 如果 是 学术研究 的话, 我 就会 觉得 还是 回归 学术研究 的 本质。 你 去做 一些 有意思 的 事情, 做 一些 有 创新 的 东西。 这些 大家 没有 想到 的 角度, 它是 回归 学术 本质 的 一件 事情。 什么 合适 的 体制 和 机制 去做 一件 什么样 的 事情, 大家 没有 必要 又 既要 又要。

非常 理解, 讲 的 很好, 特别 有意思。 我 上 一期 采访 了 陈 渝北, 你 应该 也 认识。 我 认识 北 哥。 对, 因为 他是 一样的 学生, 他在 节目 里面 说 了 跟 你 一样的 样 说 的这 句 话, 如果 你是 博士 的话, 不应该 去 研究 大 模型, 然后 表达 了 跟 你 相似 的 观点, 很 有意思。 对, 然后 你 刚刚 其实 开始 的 时候, 就是你 有 提到 你 早期 在 OpenAI 实习, 它 其实 也是 一个 项目组 的。 然后 他 以 这种 项目 制 的 方式 来进行。 当时 你 在 的 时候, 我知道你 是在 研究 智能 体 的 方向。 2020年 他 其实 是 有 一篇 GPT3 的 论文 出来, 你 当时 有 注意到 那个 方向, 因为我 记得 他 还有 机器人 的 项目。

对 吧? G P3 其实 内部 2019年 就 已经 看到 了, 就 所有的 论文 里 写 的 东西, 19年 的 上半年 其实 大家 都 已经 看到 了。 当然 这是 公司 内 非常重要 的 一个 方向。

那个 时候 的 open a 还 比较 像 个 研究院, 他 当时 有 个 charter, 就是 对外 有的 时候 A G I 要 怎么 去做, 他 就说 那 逻辑 也 特别 简单。 那 A G I 的话 它 肯定 要有 视觉 能力, 对 吧? 所以 他 有 个 视觉 team, 有 语言 能力, 有 个 语言 听, 要 决策 能力, 是一个 强化 学习 team。 它 有 交互 的 能力, 所以 要 多 智能 team。 它 有一个 本体, 所以 有 机器人 T, 当然 还有 安全性, 解释性 这些 东西, 所以 就 大概 这么 多个 team。 所以 他 基本上 确实 是从 A G I 是 怎么 来 的 这个 方向 来 定 team 的。 但是 所有的 这个 team 有 个 比较 标准 的 principle, 就是 我们 希望 scale up。 这个 也是 OpenAI 其实 能 跑 出来 的 一个 原因。

是因为 skill up 这件 事情, 这么 笃定 的 坚信 的 人 其实 很少。 直到 ChatGPT 大家 发现 what scale up 可以 出 ChatGPT, 那 大家 一起 scale up 就是 一个人 告诉你 他 可行 的 时候 和 你 根本 不知道 的 时候 是 不一样的。 所以 欧文 安 是一个 知道 他的 几个 创始人 非常 笃定 的 坚信。 其实 就是 伊利亚, 我 觉得 伊利 带给 欧布 安 带来 最大 的 财富, 就是 他 真的 很 坚信 这件 事情, 矢志不渝 的 践行, 所以 最后 排除万难 做成 了, 就 发现 真的有 这样的 效果。

所以 那个 时候 不管 是 做 强化 学习 也好, 还是 做大 模型 也好, 还是 语言 模型 也好, 就是 语言 模型。 那时候 还不 叫 大 模型, 就 语言 模型 或者 是 视觉 好, 大家 都是 采取 scale up 的 路线 的。 现在 不在 小规模 计算 上去 做文章, 这是 统一 的。

因为 我们 欧 班 牙 内部 是 有 很多 交流, 然后 有 all hands 为 每个 团队 去 分享 做什么。 所以 很早 的 是 19年 的 时候 就 看到 大 模型, 然后 看到 内部 去 使用, 你 会 发现 这个 东西 有点 厉害。 只是 在 那个 时候 你 得 非常 懂行 的 人才 能 意识到 这个 模型 很 厉害。 因为 那个 时候 的 GPT 它 不好 用。 普通人 去 用 的话 会 觉得, 你为什么 老 说胡话? 你为什么 老 重复 我 的话 它 不好 用。 这就是 后来 做 对齐, 去做 chat, 叫 他们 叫 alignment 或者 叫 instruction following 就是 要 让 遵从 人类 指令, 就是 人 说 一个 什么 话, 比如说 你 帮 我 写 个 文章, 他 就得 写 个 文章, 而 不是 好。

举 个 例子, 对, 所以 他是 知道 这些 东西 都 做好 之后, 是 刚好 那个 点 是 ChatGPT, 所以 他 突然 就 爆了。 但 之前 这些 能力 其实 19年 的 时候 大家 都都 已经 看到 了。 所以 我 确实 是 很 早就 看到 了 这个 东西, 但是 我 确实 也没有 那么 笃定, 不然 我 回国 境, 20年 就 应该做 在 中国 做 一个, 对 吧? 当时 我 也没有 那么 笃定。

你 当时 为什么不 那么 笃定?

我 有 几个 方向, 就是我 自己的 兴趣 可能 还是 做 交互。 所以 我 一直 觉得 语言 加上 决策 是一种 非常 好的 交互 的 方式, 我 还是 从 强化 学习 角度 去 出发 的。 所以 我 回来 之后 做 的 事情 是我 首先 从头 搭 了 一套 跟 OpenAI 类似 规模 的 一套 强化 学习 的 训练 系统。 但 我 确实 没有 去做 语言 模型, 就是我 觉得 没有人 可以 预测 到 ChatGPT 的 成功, 因为 即使 open I 自己 也没有 预测 到, 就 内部 的 人 也没有 月 测。

那个 时候 大家 虽然 看到 了 一些 科学 上 的 进展, 但是 他的 进展 不 那么 明显, 他 没有 到 一个 质的飞跃。

那个 点 是 很 奇怪 的。 我问 过 我的 同事, 就 ChatGPT 可能 O B 做了 一个 轴, 只 做了 一个 礼拜。 ChatGPT 没有 人是 说 我知道 他 一定 可以 成功, 然后 一定 可以 有 这么 大 的 社会 影响力。 GPT3 其实 它 有 很强 的 影响力, 它是 当时 是 best paper, 然后 在 整个 学术 圈 是 很 轰动 的, 但是 没有 真的 扩散 到 这么 大我 当时 可能 也是 对 A I 到来 的 速度 可能 也是 没有 做好 那么 强 的 准备, 那 可能 跟 疫情 有关系, 大家 想 的 问题 都 确实 没有 那么 笃定。 所以 现在 回头 来看, OpenAI 能够 那么 笃定 的 坚持 一个 方向, 坚持 那么 多年, 其实 也是 挺 难得 的。

是的, 依恋 为什么 那么 笃定?

他 就是 这么 一个 很 偏执 的 人。 你 就 想 一个 正常人 是 不会 这么 笃定 的, 只有 一个 非常 偏执 的 人才 可以 这么 笃定。 当然 这个 事儿 是 在于 他 最后 成功了, 所以 我 觉得 这个 事儿 是 大家 不能 总是 回头看 最 成功的人 是 怎么样 的。 因为 所有 成功的人 都能 找出 1万个理由。

但 在 同时 我想 跟 大家 说 的 事情 就是 在 open I 同时期, 其实 有 很多 创业 公司, 做 A I 的 创业 公司, 甚至 是 做 A G I 的 创业 公司 也 不止 open I 一家。 比如说 有家 公司 叫 vicarious, 他们的 路线, 当时 我 伯克利 有 个 我 同组 的 师兄, 还有 个人 去了 那里, 差不多 也是 做 A G I。 但 他的 路线 就是 逻辑推理, 他 觉得 需要 去 把 逻辑 的 东西 放在 A R 里边 去。 最后一个 公司 被 迪曼 收购 了, 大家 可能 不知道 这个 公司, 但是 我 就 想说 同时期 在 美国 做 A 加 的 公司 不是 欧美亚 一家, 是 欧文 亚 跑 出来 了。 当然 你 现在 可以 回过 头 去 分析, 它 有 好多好多 的 原因, 对 吧? 伊 它 有 伊利亚, 可能 sam 在 合适 的 时候 引入 了 投资, 然后 大家 做 这个 skin 的 路线 又是 正确 的。

他 也有 别的 公司, 甚至 也有 N G O 的 公司。 比如说 alan to institute, 当时 比如说 做 语言, 做 对话 的 也 并 不是我 本来 有 一家 叫 semantic machine, semantic machine 后来 被 microsoft 收购。 然后 当时 也是 stanford 的 faculty 和 berkeley 好的 faculty 一起 做 的 一个 公司。 大家 用 相对来说 传统 对话 模型 的 巅峰, 做出 了 最好的 巅峰。 他们是 把 编程语言 和 对话 模型 放在 了 一起, 做了 一个 最后 应该 是 被 合并 到 微软 产品 里面 去 的 一套 系统。 所以 就有 很多 这样的 公司, 最后 只是 OpenAI 大成 了。 所以 我 觉得 是 大家 看 问题 可能 稍微 辩证 一点儿, 也 有人 在 拜 特别的 东西, 他 失败 了 对 吧? 当然 他们 有 个 共性, 就是 所有 成功的人 都 bat 了 一个 东西。

对对对, 而且 你 刚刚 其实 提到 open I 里面 有 非常 多 的 项目组。 比如说 需要 有 A I 的 眼睛, 所以 就 做 视觉 什么的, 然后 用手 就 机器人。 我 之前 一直 知道 OpenAI 里面 有 非常 多 的 研究 项目, 但是 其实我 自己是 没有 想到 他的 这些 研究 项目 之间 是 有 这么 完整 的 一套 逻辑 的。 他 有一套 逻辑 对我 听你讲 了 才 觉得 他的 整个 的 研究 架构 非常 的 清晰。 但是 即使 在 这么 多 的 非常 清晰 的 研究 架构 中, 它 也是 一个 非常 小 方向 的 一个 小的 点 跑 出来 了。

对, 确实 是 这样。 他在 早年 的 时候 是 有一个 比较 大 的 章程, 这个 章程 也会 调整。 然后 在 那个 时候 的话, 大家 会 按照 这样 组织 的 方式 去 看 A I 看 A G I。 但是 确实 是 语言 模型 和 视觉 投入 是 挺 多 的。 我们 得 承认 像 强化 学习组 就会 人 很多, 然后 我们 组 大概 六个人 左右, 强化 学习组 或者 机器人 组 的 会 人 多一点, 然后 语言 模型 也会 人 稍微 多一点。 但是 人的 规模 也就是说 小 几十号 人, 因为 公司 一共 才 100人, 而且 确实 最后 这个 东西 跑 出来, 他 最后 是 语言 上。

当然 你可以 回头 说 这里 有 特别 多 的 evidence, 就 比如说 人类 的 智慧 其实 就是 语言, 对 吧? 你可以 现在 这么说, 跑 出来 之后 你可以 这么说, 在 那个 时间点? 你 要是 O V I 早就 知道 这件 事情 的话, 那 我 觉得 GPT3 可能 还能 早 两年 出来。 对, 就 大家 都 不知道, 但是 在 迷雾 里面 在 往前走。

对我 其实 注意到 你的 整个 经历, 不管 是在 姚 班, 然后 在 微软 研究院 的 实习, meta 的 实习, 包括 你 还 去过 头条, 然后 后来 的 OpenAI 的 工作 经历, 跟 现在 做 精 差 医院 的 助理 教授 的 经历。 我 觉得 你 一直 是在 整个 领域 里面 跟 最 顶级 的 人才 一起 合作 的。 如果 让 你 总结 的话, 就是你 觉得 非常 顶级 的 人才, 他们 有 一些 什么样 的 特质 呢? 我知道 这个 问题 也 非常 的 大, 或者说 就是你 非常容易 被 一些 什么样 的 特质 所 打动 和 吸引。

我 觉得 说 一些 共性 的, 因为我 觉得 不同 人的 风格 其实 差别 挺 大 的。 这些 聪明 的 学生, 首先 我 觉得 一个 共性 是 大家 都 会有 很强 的 自驱力。 因为 这个世界 就是这样, 所有的 所谓 的 成功 也好, 或者说 你 取得了 一些 成绩 也好。 其实 就是 在 你 到了 大学 之后, 就 没有人 会 再会 逼 着 你 做什么 事 了。 大部分 的 事情 是你 自己 想 去 折腾, 这个 是个 底线。 你 再到 了 社会上 更 明显, 学校 里面 还好 一些, 你 还有 成绩, 甚至 你 在 学术 圈 里面 都 还是 好 一点。 大概 就是 每年 都 会有 paper, 做 research 还 比较 regulate, 比较 routine。

那你 到 社会上 的话, 没有人 会 教 你, 所以 最后 所有的 事情 是你 自己 想做 一件 事情。 所以 最后 我会 觉得 所有的 这些 人都 会有 比较 强 的 自驱力, 他 知道 自己 想 做什么。 所以 我会 给 大家 的 建议 还是 看看 自己 想 做什么, 找 一个 自己 适合 的 事情, 并且 你 会 愿意 为 他 花 很多 时间 的 事情, 这 是我的 感觉。 而且 一般来说 你 会 发现 你 觉得 最 钦佩 的 这些 人, 他们 都 会对 很多 事情 有 自己的 看法。 自己的 看法 和 理解 是 他 自己 想 出来 的那 他 追根 到底 是因为 他 自己 愿意 去 想。

有 哪些 是 大家 普遍认为 都 对, 但是 自己 看法 的 事情。 这 可能 是一个 投资人 特别 喜欢 问 的 问题。

就是 我会 觉得 我自己 看 问题, 我 回顾 我 过去 12年, 因为我 就 后来 因为 最近 我们 看 了 一些 报道, 我 就 特别 想起 很多人 想起 我 可能 12年 前 在 硅谷 遇到 的 一些 事情。 然后 就会 会 想 最近 一二年 我自己 的 很多 观点 是 会 发生变化 的, 就 随着 你 自己的 认识 会 发生 很多 的 变化。 我 其实 觉得 不在乎 对不对? 关键 是你 自己 也 一定要 有 不断 的 有 自己的 想法, 并且 会 自己 调整 自己的 想法, 因为 你就是 会 想 的 不对。 我 20岁的 时候, 我 为 凭什么 能够 看 明白 这个世界? 为什么 能 看 明白 facebook 未来 会 成为 一家 很 伟大的 公司? 凭什么? 我 能 看出来 就 不对 了, 对 吧?

都是 事后 总结。

就 一定 是你 没有 经历 过, 没有 踩 过 坑, 你凭什么 会 知道 一个 非 共识 的 事情 呢? 只是 我 现在 来看 会有 一个 小的 经验, 就是 如果 在 一个 时间点, 所有人 都 觉得 你是 对的, 那你 可能 再 想想。 对, 就是 一旦 有 个 时间, 你 会 觉得 你说的 所有 话 别人 都 觉得 好。 对, 一般 都 你 再 想想, 尤其 你 还 不是 亲历者, 你 就 再 想想。 对, 因为 人是 很 容易 在 一个 舒适 圈 里面 的, 就是你 觉得 自己 说 的 很 对, 然后 你 朋友 觉得 你 很 对, 这些 人 做 的 很 对你 会 觉得 自己是 对的。 但 往往 其实 世界上 没有 绝对 的 东西, 都 会有 一些 你 没有 看到 的 面。 但是 由于 你 碰到 的 所有人 都 觉得 你说的 对你 可能 就 没有 这个 动力 再 去寻找 到底 她 哪里 是不是 不对劲 的 地方。 这 是我的 建议。 第一件 事 就是 正面 说, 就是 永远 不要 too confident, 一般 都 有点 问题。 第二件 事情 是 也 不要 太 焦虑, 因为 反正 你 想 的 所有 东西 都是 有问题 的, 接受 这一点。

对, 好, 这 两句 总结 很 经典。

然后 这 第二件 事情 也是, 一般 这些 比较 有 自驱力 的 人, 还 比较 能 折腾 的 人, 一般 心态 都 比较 好。 因为 折腾 等于 受挫, 折腾 等于 失败。 因为你 不折腾 不会 失败, 就 永远 不会 失败, 对 吧? 你 只要 做了 就有 可能 会 失败, 就会 踩 坑, 就会 遇到 一些 不顺心 的 事情。

那一个人 能 一直 折腾 下来, 一般 都 心态 好 一点 都 比较 好。 他 要么 自己 特别 自洽, 也有 可能 比较 淡然, 都 有可能。 但是 一般 心态 比较 好, 所以 我 就说 这是 to fold 一个, 就是 能 折腾 的 时候 都 折腾 一点。 其实 人是 怕 待在 自己的 舒适 圈 里面 待 太久 了, 你 可能 会 丧失 你的 一些 敏锐 的 感觉。 就像 我说 的, 很多人 说 你 对的 时候 你 可能 有问题。 第二件 事情 就是 心态 好 一点, 因为 如果你 要 折腾 的话, 那你 要 折腾 好久 了。 如果你 天天 心态 不好, 那就 可能 就 熬到 那个 时候。

对, 所以 很多 时候 考验 的 最后 是 大家 的 心力 值。

确实 是 这样。 我 也得 说 回到 姚 班 这个 事情, 确实 会给 人 挺 多 打击 的。

你 受到 的 打击 是什么?

就 印象 特 深刻。 我 那时候 大一 刚 进 学校 的 时候, 我 那时候 还是 搞 竞赛, 我自己 心里 觉得 我这个人 应该 挺 厉害 的。 去 学校 之后, 我们 当时 做 一门课 的 作业, 进入 门 的 作业, 当时 是一个 美国 的 来 的 老师 给 我们的 作业 做 的 巨 难 无比。 我也 其他 有些 课 会 比较 划水, 我 就在 宿舍 里面 就 盯 着题 做, 我 就 做 一天 做 两天 还 不会 做, 然后 我 就 怎么办? 我 就 上楼, 那时候 脸皮 比较 厚, 我 就 上楼 敲 我 一个 同学 的 门, 他说 他在 打游戏, 然后 他 就说 keno 作业 做了 吗? 天牛 说 没 做。 我说 你 要不 帮 我 看看 这 题 怎么做。 他人 还 很好, 他在 那 打 C S 然后 他 还 真能 暂停。 我也不知道 他是 队友 怎么 容忍 他的, 然后 就说 好好的, 我 来 帮你 看看。 然后 他 就 你知道 我 做了 两天 的 作业, 他 就 说好的, 我 帮你 看看, 然后 就 开始 拿着 支 笔 在那 写写 吧 写 吧, 就 写 完了, 他 说来 这样 拿走, 然后 我 就 觉得 这事 好 离谱。

瞬间 感受 到了 智商 被 碾压。

对我 觉得 就是 好 离谱, 这 好 离谱。 对, 就是 冲击 是 很大 的。 你 会 觉得 自己 怎么 我们 就说 人和 人的 智商 真的 就是 跟 动物 差距 还要 大 的 这种 感觉。 对, 其实 很多 小孩 进 窑 班 的 时候 会有 这样的 挫败感。 所以 我们 也是 很多 时候 会 希望 能 帮 大要 调整 过来, 因为 这个 路 很长, 对 吧?

就是你 回头看 这些 我们 混 的 还 不错 的, 其实 都 挺 chill 的对, 你知道 这个 大哥 他 没 打游戏, 对 吧? 然后 我 有一个 现在 五个 同学 的 C M U 当 faculty, 后来 他 去了 沙特 当 faculty 跳槽 了。 他们 天天 都在 宿舍 里 用 触摸板 打 dota, 我 印象 特别 深刻。 对对对, 就 很多 这种, 大家 没有 特别 焦虑。 然后 我们 那时候 还 天天 踢球 什么的, 大家 关系 也都 挺好的。 你 反正 天天 焦虑 的 人, 一般 坚持 不到 十年之后。

说 的 特别 好。 由此 我 又 衍生 出来 一个 新 问题, 其实我 注意到 很多 学校 它 在 培养 人的 时候, 他在 学术 上 是 有一套 培养 方法 的。 就是你 刚刚 讲 的 很多 事情, 其实 尤其是 你 步入 社会 之后, 很多 时候 是 心态。 你 觉得 清华 姚 班会 注重 对 大家 心态 的 培养 吗?

有 这 几方面, 一个 是 姚先生 自己的 个人魅力, 他 确实 会给 我们 很多 high level 的 比较 大师 的 一些 指导。 这些 话 我 觉得 反正 年轻 的 小孩儿 肯定 都 听不懂, 这 肯定 的 很 正常。 因为我 自己 经历 过 这 十年, 我 就 知道 那个 话, 反正 我 现在 看 就会 觉得, 老板 说 的 好。 对, 但 我 放在 十年 前 我 不可能 听懂 的, 甚至 可能 现在 也没有 完全 听懂, 也有 可能。 所以 肯定 是 姚先生 自己的 有 个人魅力, 能 给 大家 带来 一些 启发。 但 我 觉得 更多 的 事情 还是 学生 自己 相互之间 的。

我 觉得 总体 来说, 姚 班 大家 这个 相互 互相帮助 的 气氛 还是 不错 的。 尤其 在 比如说 像 我们班 或者 像 我们 一 三级 的那 一届。 比如说 这 一届 刚 毕业 的 林子 班, 其实 都是 整个 班级 氛围 非常 好的 班级。 然后 相互 帮助 真的 会 不是 大家 独立 作战 的。 就是 大家 我记得 一 三级 毕业 的 时候 特有 经典 的 一个 事儿, 他们 当时 毕业 的 时候 给 姚 先 送 了 个 礼物, 是 他们 班 里面 发 的 论文。 当时 发 了 四十多篇 论文 那个 班 里面, 然后 好像 大家 他们 画 了 一下 他们 那个 口 also 的 我 觉得 他们 好像 班级 里面 两两 之间 都会 合作 过 论文, 关系 会 非常 好啊, 但 不是 每 一届 学生 都 这样 了。

就是我 只能 说 姚 班 有 这样的 一些 传承, 但是 很多 引导 其实 是 潜移默化 的, 他 也 不是 刻意 的。 像 我们班 这种 关系 特别 好的, 或者 一 三级 关系 特别 好的, 可能 也 不是 每一集 都 这样, 这种 化学反应 的 事情 也不 可控, 尤其 现在 姚 班 有 七八十个 人 了 之后, 其实 不 可控 的 因素 会 变得 更大。 那 只能 说 可能 这就是 我们这一代 人 想做 的 事情, 我们 就 希望 能 让 这些 学生 心态 好 一点, 能够 让 他们 更 平和 的 去做 他们 想做 的 事情。 那 可能 是 指 我们这一代 人的 回到 学校 之后 的 命题 所以 每 大学生 确实 命题 不一样。

对, 特别 好。 你 要不要 简单 介绍 一下 你 现在 自己的 公司, 边塞 科技 是 做 什么的?

再有 就是 我们 2023年 的 时候, 从 上海 就是 姚先生 在 上海 成立 了 一个 研究院, 叫 上海 汽车 研究院。 我们 院 的 很多 教授 会 在 上海 汽车 研究院 有 自己的 项目, 然后 有 自己的 团队。 研究院 是一个 N G O, 它 会有 一种 更 灵活 的 方式 开展 科研项目。 所以 我们在 上海 一直 有一个 自己的 团队, 然后 我们 做 强化 学习, 大规模 训练 的 一些 方向。

在 2023年 去年 的 时候, 我们 就 因为 整个 大 模型 的 浪潮, 然后 我们 就 孵化 出来 整个 团队 从 气质 研究院 孵化 出来, 成立 一家 公司 的 边塞 科技。 然后 在 上海 主要是 做大 模型 agent 最早 的 时候 做 的 一些 电子表格 助手, 然后 做 过 一些 财会 的 助手, 做 过 一些 简历 招聘 的 助手。 很多 这样的 A I agent。 这也是 用 A I 来做 一些 自动化 和 决策 的 相关 的 事情, 也 跟 我们 自己 做 的 研究 一直 都 比较 相符。 所以 是 这么 一家 以 强化 学习 和 大 模型 技术 为 核心, 然后 做大 模型 智能 体 的 这么 一家 公司, 然后 也是 一个 小 团队。 好。

有没有 什么 我没有 问 到, 但是 你 想 补充 的 点。

在 早期 的 姚 班招生 其实 是以 数学 竞赛 为主。 因为 姚 班 最早 的 时候 是以 理论 计算机科学 为主, 所 它的 很多 选拔 和 招生 是 比较 偏向 物理 和 数学 的。 所以 我 那 一届 计算机 竞赛 进入 姚 班 的 其实 只有 四个人。 我们班 30个人, 就 只有 四个 人是 计算机 竞赛 进 小班 的。 然后 因为我 跟 我 室友 是 国家队, 然后 是 吴家 骏 是 考 进来 的, 还有 另外一个 同学 也是 最后 面试 进来 的。

很长 一段时间 都 是以 数学 为主, 因为 总体 的 培养 比较 偏 理论, 大家 觉得 数学基础 比较 重要。 然后 慢慢 开始 就 随着 人数 比较 多了 之后, 对 我们 现在 七八十个 人 的话, 基本上 就 招生 面会 比较 广。 30个人的 时候 其实 竞争 还 挺 激烈 的。 所以 那时候 我也 是因为 我 最后 确实 进了 国家队, 我在 进入 国家队 之前, 我 都 不知道 我 能不能 进 窑 班。

但是 你 开始 的 时候 是 很想 去 的, 是不是 就 已经 有一个 目标 了?

去 实在 就 想 去, 但是 你 就 很 担心, 最后 你 别真 给我 考 数学, 然后 没 考 进。 但是 我们 后来 发现 这帮 小孩 也都 很 聪明, 他们 一般 保送 了 之后 就 在家 刷 半年 数学、 物理, 然后 考试 都 考 得 很好, 也能 进。 对, 因为我 现在 我 带 的 这个 班 里面 的 学生, 我 就说 你们 当时 怎么 搞? 他说 就 知道 考 物理 和 数学, 我们 在家 就 专门 学 了学 了 半年。 对。

最后 还有一个 问题, 你 觉得 好的 人才 他是 筛选 出来 的 还是 培养出来 的? 当然 我知道 这 两者 都很 重要, 但是 我 更 想知道 是 这些 人 他 本来就 很 聪明, 还是 说 他 可以 一种 好的 方式 把 他 培养 的 更好。

我 有 一本书 叫做 the greatest cannot be planned, 就是 讲 伟大的 事情 是 不可能 被 计划 的。 所以 我想说 他 确实 是 被 培养出来 的, 但 他 不是 被 计划 出来 的。 首先 它 需要 选拔。 因为我 觉得 精英教育 和普 世 教育 是 不太 一样的。 精英教育 其实 是 蛮 残酷 的, 精英教育 我自己 会有 这样的 感觉。 比如说 本来 我们是 在 高中 的 时候, 我们 做 搞 竞赛, 然后 你 在 全国 搞 竞赛, 然后 你 到了 摇摆, 然后 再到 博尔 克利, 你每 一。 是的, 这样的 选拔 和 竞争 都是 非常 残酷 的, 所以 选拔 是 不可避免 的。 因为你 如果 希望 最后 培养 的 是 最 顶尖 的 人, 它 就是 在 竞争 中 产生 的。 其实 企业 也是, 然后 研究 也是, 人 也是, 所以 选拔 是 不可避免 的。

培养 要不要 培养 是 需要 的。 比如说 你 需要 给 这些 人 足够 的 空间, 你 也 需要 给 他们 足够 的 适度 的 压, 你 不能 没有 压力, 还要 给 他们 让 他们 添 上 看, 这个 是 培养 的 一部分, 很 重要。 对, 培养 是 很 重要 的。 因为 在 大家 没有 习惯于 往 上 看 的 时候, 你 老师 是 需要 做 这样的 引导 的, 让 大家 能够 去往 天上 看。 但是 这是 培养 和 选拔, 但 他 是不是 可以 确定 一定 能够 出来, 谁 呢? 不知道, 这个 是 不可 预测 的, 你 只能 说 按 这么 做大 概率 十年之后 应该 会 有人 成功。 但是 会 是谁 呢? 你不知道。 所以 选拔 很 重要, 培养 很 重要, 但是 你 也要 做好。

确实 就有 可能 很多人 就 没有 成功。 比如说 摇 三十多个 人像 我们班 算是 当 老师 非常 高 的 一届 了, 我们 可能 只有 3分之1 的 人 在 当 教职, 剩下 3分之2 个人 了。 所以 我 就 想说 他是 培养 和 选拔, 但是 没法 被 计划。

说 的 非常 好, 我 觉得 今天 收获 特别 多。 客气。 好, 谢谢 吴 老师。

好好, 谢谢你, 谢谢。

这就是 我们 今天 的 节目。 如果 大家 喜欢 我们的 节目, 欢迎 在 你 所 收听 的 音频 渠道 来 订阅。 我们 中国 的 听众 可以 通过 小宇宙、 苹果 播客、 喜马拉雅、 励志 F M 网易 云 音乐 来 订阅。 我们 海外 的 听众 可以 通过 苹果 播客 还有 spotify 来 收听 我们。 当然 你 也可以 用 youtube 搜索 硅谷 101播客 来 找到 我们。 我是 红军, 感谢 大家 的 收听。