欢迎 收听 硅谷 101, 这是 一档 分享 当下 最 新鲜 的 技术 知识 与 思想 的 科技 博客。 我是 红军, 本 节目 由 不 只是 代 餐 的 若 饭 赞助 播出, 关注 微信 公众 号 若 梵 若是 若无其事 的 若 饭 是 好好 吃饭 的 饭。 回复 硅谷 101, 咱们 硅谷 101 的 听众 如果 也是 弱 饭 的 新 用户, 就可以 获得 8折优惠。 近几年 生物学 界 出现了 很多 令人振奋 的 新进展, 比如说 像 基因 编辑 技术, 还有 我们 这 期 的 主角 阿尔法 fold, 这 应该 是一个 生物 跟 计算机 的 交叉 领域。 那 这 期 跟 我们 坐在 一起 聊 这个 话题 的 是 斯坦福 生物学 的 博士后, 是 韩 朵。
Hello, 韩 朵, 你好你好。 这 期 我们 其实 要 聊 的 是 阿尔法 4。 因为 在 7月22号 的 时候, deep mind 他在 nature 上 发 了 一篇 论文, 就是说 阿尔法 它 已经 预测出 了 35万 种 蛋白质 结构, 几乎 涵盖 了 所有 人类 蛋白质 组 以及 20种生物 的 蛋白质。 我看 了 一下, 他 7月15 号 还 发 了 一个 论文, 他 其实 是 开源 了 深度 学习 神经网络 的 阿尔法 fold 2的1个 模型。
我看见 在 业界 这 事儿 出来 了 以后, 就是 有 很多 评论者 都说 这是 人工智能 对 科学 领域 最大 的 一次 贡献。 也 有人说 这 是一个 划时代 的 进步。 但是 对我 这种 生物 小白 来说, 我 就 很 想知道 它 背后 的 意义 是什么。 你 可不可以 简单 跟 大家 聊 一下, 就 你的 研究 方向 是什么? 像 阿尔法 food 它 现在 的 预测 以及 它的 数据库 开源 对 你的 影响 是什么?
因为我 其实 是 生物 和 物理 交叉 背景 过来 的, 我 现在 研究 方向 主要 也是 希望 用 很多 的 物理 知识, 用 定量 的 方式 来 研究 生物学 本身。 我 现在 选择 这个 研究 体系 呢 是 细菌 的 菌群, 简单 来说 就是 在 一个 比较复杂 的 环境 里, 细菌 群体 实际上 是 有 很 多种不同 的 个体 组成 的, 可以 联想 生态学 中, 比如说 有 羊 和 狼, 可能 还有 其他 的 一些 物种 组成 的 一个 比较复杂 的 生态链。 我 现在 研究 方向 主要 就是 研究 在 这样 一个 由 细菌 组成 的 生态系统 中, 不同 的 群 之间, 就 不同 的 细菌 之间, 他们是 怎么样 来 互相 影响, 最终 达到 一个 平衡 的 状态。
像 阿尔法 food, 这次 它 已经 预测 确定 了 98.5% 的 所有 人类 的 蛋白 结构。 这个 事情 对你 自己的 研究会 有 影响 吗? 或者说 他 会不会 帮助 到 你 现在 的 研究?
当然 会 的。 我自己 的 研究 其实 不太 关心 人类, 不是说 人类 不重要, 只是 说 我自己 的 研究 更多 的 是在 细菌 这个 方面。 但是 其实 阿尔法 四 他 虽然 最近 发表 的那 篇文章 是 强调 说 他在 人类 基因组 中 做出 了 很多 贡献。 是的。 但是 它 开源 的那 一些 蛋白质 结, 其实 除了 人类 之外, 我记得 应该 还有 19还是 20种其他 的 生物。 这些 生物 其实 就 涵盖 了 包括 植物 细菌, 我们 熟悉 的 一些 寄生虫, 其他 的 方面, 各种各样 的 细胞 都有。 然后 其中 也有 相当 一部分 是 跟 细菌 相关 的 基因。 这些 蛋白质 其实 是我 个人 来说 更 关心 的 一些 内容。
所以 它 在 开源 这个 数据库 以后, 你 有 上去 看你 现在 研究 的 这些 细菌, 它的 蛋白质 结构 是 怎么样 的 吗?
当然 有了。 其实我记得 就是 他 开源 是 上个星期 的 事情, 应该 是 周四 那一天。 周四 周五 我 周围 基本上 所有的 同事 都在 他的 蛋白质 网站 上, 然后 所有人 感觉 都在 搜 他们 自己 研究 的 碳 排 质 那个 网站。 没有 crush, 没有 崩溃, 我 觉得 还是 让 我 很 惊喜 的。
我不知道 你 现在 的 研究 是不是 会 确定 你 所 研究 的 这些 细菌 的 蛋白质 结构。 你是 知道 它们的 结构 的 吗?
事实上 我们是 不知道, 这个 是 阿尔法 四 它 跨时代 意义 的 一部分。 因为 事实上 蛋白质 结构 很 重要, 但是 又 很难。 很 重要 是 说 我们 只有 知道 了 这个 蛋白质 的 结构, 我们 才能 更好 的 去 猜 它 有什么 功能。 生物 研究 里 经常 有 一句话 说 结构 决定 功能。 打个比方 像 汽车, 我们 看见 一个 小轿车, 看见 它 有 四个 轮子, 那 我 觉得 OK 我知道 它 可能 会 开。 但 有一天 我 看到 一个 大卡车, 它 也有 轮子, 那 我 就可以 觉得 它 也能 开 在 平 路上 开。 看到 一艘船, 你 就会 觉得 它 大概是 不能 在 陆地 上开 的, 因为 它的 结构 不一样。
对于 蛋白质 来说, 其实 也有 类似的 很多 功能 相似 的 蛋白质, 它 就 会有 很 相似 的 结构。 但是 因为 蛋白质 个体 很小, 我们 现在 即使 是用 一般 的 显微镜 都 没有 办法 去 看。 除非 是 比如说 施一公 老师在 做 的 这种 冷冻电 竞, 要 到 那样 一个 很高 的 精度, 用 非常 高级 的 仪器 才能够 看得 比较清楚 蛋白质 的 结构。 所以 对 我们 来说, 我们 研究 了 很多 蛋白质, 我们 想知道 它的 功能, 但是 我们 很难 看到 它的 结构。 阿尔法 四 的 预测 结果 很大程度 上 帮 我们 有一个 很高 知名度 的 猜测, 说 这个 蛋白质 大概是 长 什么样 的那 对 我们 研究 来说 就 很 有 帮助。 因为 我们 知道 它 大概 长 什么样, 可以 把 预测 的 结构 跟 我们 已知 的 其他 蛋白质 的 结构 进行 比较, 来 猜测 它 有什么 作用。 然后 顺着 这个 猜测 方向 再去 设计 实验, 再去 验证, 那 就可以 省 很多 的 时间 和 精力。
相当于 是 他 可以 辅助 你们 把 它的 结构 给 确定 了。 他 现在 的 那个 结构, 其实 你们 也 不知道 他 预测 的 是不是 准确 的。 但是 他 自己 用 算法 或者 在 他 之前 已知 的 预测 其他 的 蛋白质 结构 中, 它 被 证明 过 是 准确 的。 所以 它 相当于 可以 省 很多很多 的 力气 帮你 去 确定 它的 结构。 就是 你们 还要 去 确定 一遍 阿尔法 四 的 结果 是不是 准确 的对。
因为 在 生物学 里 或者说 在 实验 科学 里, 我们班 说 实验 是 检验 真理 的 唯一标准。 我们 只有 拿到 它的 实验 结构, 我们 才能 非常 自信 的 说 OK 我们 这个 结果, 这个 结构 是 正确 的。 但是 好在 阿尔法 A 4的现在 有 很多 蛋白质, 我们是 已知 结构, 或者 我们 对 它的 结构 有 一定 的 猜测。 根据 这些 已知 的 结果 再看 阿尔法 four 预测 的 这个 结果。 因为 这 两个 通常 来说 都很 相近, 所以 我们 现在 对 这些 结构 不知道 的 蛋白。 我们 也 相信 阿尔法 四 在 很大程度 上 能够 预测 到 一个 比较 精准 的 结构。
你 自己 查完 以后, 它 会 改变 你 现在 的 整个 的 研究 进程 跟 研究 方向。
这个 其实我 觉得 很 依赖于 我自己 的 课题 的 进展 状况。 我 觉得 特别 让 我 激动 的 是 一点, 上周五 查 一个 蛋白质, 这个 是 大概 我们 两年 前 发 的 一篇 文章, 跟 普林斯顿 的 一个 教授 合作 研究 一个 膜蛋白 的 功能。 事实上 我们 当时 因为 不知道 这个 膜蛋白 的 结构, 也没有 任何 的 信息。 所以 我们 大概 有 一年 的 时间 就 反反复复 在 猜 说 热 蛋白 它 可以 做 这些 事情。 那么 它 到底 在 细菌 里 起了 一个 什么样 的 作用? 我们 就 反反复复 的 假设, 它 可能 是 跟 另外 这 一个 蛋白 有 相互作用, 或者说 它 可能 跟 细菌 的 其他 成分 有 相互作用。 就 需要 在 这个 过程中 来回 不断 的 设计 不同 的 假设, 然后 再 设计 实验, 最后 发现 大 概率 就是 这个 猜想 不对。 然后 我们 就 需要 回到 第一步, 就是这样 一个 不断 迭代, 不断 思考 的 过程。
最后 当然 我 觉得 也很 幸运 了, 就是 经过 了 一些 这种 反复 的 过程, 我们 最终 至少 是猜 对了 蛋白质 的 功能, 最后 跟 我们的 实验 结果 也是 相符 的。 这个 文章 去年 已经 发表 了, 但是 今年 一看, 我 上 周一 查 阿尔法 四对 我们 这个 蛋白质 的 预测 结果。 对, 如果我 当时 就 知道 有 这样 一个 预测 结果, 我 觉得 基本上 看到 我们 就 知道 他 肯定 是 跟 蛋白质 里面 的 磷脂 分子 有 相互作用。 因为 它 有 一些 很 典型 的 结构, 我们是 在 其他 的 膜蛋白 中 看到 过。 有时候 我 就在 想, 如果 阿尔法 ford 能够 提前 两三年 出来 的话, 我 之前 那个 项目 可能 能 提早 一年 就 做 完。
他 其实 能 帮 你们 加快 这种 进度。
对我 觉得 科学 中 做 研究 的 时候 好玩, 但是 又 很 折磨 人的 过程。 就是你 要 不断 的 提出 假设, 然后 很多 时候 可能 会 不对。
我记得你 上次 说 在 蛋白质 的 研究 中, 解 结构 是 最难 的。 而且 基本上 解除 了 一个 蛋白质 的 结构 就可以 发 一篇 nature 的 论文。
对, 如果 是 大家 比较关心 比较 重要 的 结构 的话, 解除 了 结构 不仅仅是 结构 本身, 而且 往往 意味着 我们 对 它的 功能 又会有 进一步 更 细致 的 认知。
如果说 他 已经 预测 可以 确定 98.5% 的 人类 的 蛋白 结构 的话, 那 是不是 说 我们 人类 的 每一个 蛋白 可以 干嘛? 它的 作用 是什么? 是不是 这些 信息 就 慢慢的 都 会越来越 越 透明, 越来越 公开 了, 就 意味着 人体 的 秘密 可能 会 被 攻破 了。
当然了, 我 觉得 我们 做 生物 的 都 希望 有 这么 一天。 所有的 蛋白质 我们都知道 它 在 干什么, 我们 知道 它 会 在 什么 情况下 发生 什么的 变化。 Alpha 4目前 的 方向, 我 觉得 是一个 很 有 希望, 非常 promising 的 一个 方向。 但是 可能 跟 大众 理想 的 最终 的 我们 从 模型 就能 知道 所有 蛋白质 干什么, 这 中间 可能 还有 一定 的 差距。
差距 在哪里?
我 现在 能够 想到 的 主要 有 两个 方面。 第一 就是 咱们 也 知道 数据 是 我记得 是 98.5%, 它 不是 百分之百, 就是说 还有 那么 1.5% 的 蛋白质, 它 现在没有 办法 很好 预测 它的 结构。 稍微 再说 的 技术 一点, 为什么 会有 这么 一些 蛋白质 它 没有 办法 预测 呢? 这些 蛋白质 很大 一部分 是 他们 中有 很多 无序 结构。 大致 来说 想象 一下 就是 很多 蛋白质 其实 从 产出 开始, 它 有一个 大致 固定 的 结构。 Alpha fold 就是 在 预测 这个 结构 本身。 还有 少部分 蛋白质 它 其实 是 很多 变 的, 很多 情况下 它 甚至 没有 一个 固定 的 结构。
它 会 一直 变化 在 不同 的 环境 里, 不同 的 情境 下。
它 都会 改变 的。 是的, 当然 所有 蛋白质 都会 多多少少 有一点 变化。 还是 拿 我们的 比喻, 就是说 我们 有 辆车, 你的 车门 是 可以 打开 关上, 但是 这个 过程中 你 还是 能 看到 它是 一辆车。 然后 有 一些 所谓 的 无序 蛋白, 你 可能 想象 说 橡皮泥 可以 很 随意 的 把 它 捏成 它 想要的 形状, 或者说。 在 不同 环境 中有 不同 的 形状, 这个 过程中 它的 结构 其实 很 不确定。 阿 法嗣 的 目前 的 算法 对于 这 一类 的 蛋白质 就 比较 有 困难。
蛋白质 折叠 到底 是在 干什么?
蛋白质 首先 它是 一个 有 20种氨基酸 组成 的 分子。 我们 先 想象 蛋白质 最初 被 合成 出来 的 时候, 实际上 是 一个二维 的 链条。 我们 可以 想象 就 比如说 一根 项链, 然后 上面 有 20种不同 的 串珠。 二 这种 不同 的 氨基酸 之间 他们 会有 不同 的 相互作用, 有些 相互作用 强, 有些 弱, 有些 甚至 是 会 排斥。 那么 根据 这些 很 神奇 的 基本 物理 作用力, 最终 这根 项链 就会 折叠 成 一个 特定 的 形状。 最后 折叠 成 的 这个 形状 就 完成 之后 的 这个 形状 就是 我们 所谓 的 蛋白质 的 结构。 但是 实际上 我们 很难 预测出 我们 怎么样 从 这个 碳链 开始 到 这个 结构, 阿尔法 four 实际上 现在 做 的 就是 这件 事情。 我 只要 知道 这个 项链 上 有 多少 珠子, 每一个 位置 都 是什么 珠子, 我 就 知道 最终 它 折叠 成 的 3D形状 会 是什么 样子。
为什么 不能 直接 从 第一性 原理 出发 去 直接 计算, 而是 需要 阿尔法 四 的 这种 人工智能 第一性。
原理 计算 不是 没有人 尝试 过, 基本上 我们 可以 做 大概 很短 的 排练。 比如说 十几个 氨基酸, 这么 长 的 排练 是 我可以 做出来 的。 多了 就 不行, 太多 了 就 复杂度 是 指数 型 上涨 的, 最终 很大程度 上 受到 了 我们 计算能力 的 限制。
它 可能 是一个 有 无限 种 可能 的 情况, 因为 它 可以 折叠 成 无数种 情况, 对 它的 那个 队列 无限 长, 所以 很 难以 人的 方式 去 计算。 对, 要 用 机器 去 计算。
即使 是用 机器, 因为 我们 机器 计算 也是 要 用 时间 的。 最终 大家 估计 需要 的 计算资源 就 解 一个 正常 大小 的 蛋白质, 一般 经常 就是 上 千个 氨基酸。 这个 过程中 其实 就是 我们 现在 人类 有的 计算资源, 基本上都 不可能 允许 我们 从 第一性 原理 开始 算。
在 做 这个 采访 之前, 还在 网上 搜 了 一些 资料。 蛋白质 折叠 问题是 过去 50年 里面 生物学 的 一个 巨大 的 挑战。 而且 要 算出 蛋白质 的 结构 非常 的 难。 因为 蛋白质 是 由 20氨基酸 组成 的, 但是 它是 有 很多很多 个 不同 的 序列, 因为 它 可能 很长。 计算 一个 蛋白质 结构 是要 十 的 300次方 这样的 一个 计算 量。
对, 如果你说 是用 类似 于 穷举 的 方法, 就是 我们 把 所有 可能 的 相互作用 全都 算 点 的话, 我 觉得 这个 数据 听起来 是 很 合理 的。
是的, 然后 宇宙 中有 多少 原子, 十 的 80次方 就说 要 算出 蛋白质 结构, 靠 这样 计算 的 方式 几乎 是 不可能 的。 所以 后来 大家 就会 根据 它的 一些 功能 来 观察, 我们 先 排除 掉 一些 可能性, 有 一些 像 什么 冷冻 点 进, 还有 一些 核磁 共 核磁共振 的 方法 来 算 它的 结构。 但是 现在 我 观察 到 像 生物学 界 每年 也会 去做 这样 一些 算 蛋白质 结构 的 一些 比赛。 能够 算出 这些 蛋白质 结构 的, 在 过去 的 几年 里 都是 深度 学习 算法, 跟 算法 相关 的对 对, 其实 除了 阿尔法 fold, 我 注意到 华盛顿 还有 一家 公司 对 Chris Baker.
他们是 Baker lab rosa。 他们 跟 R 的 基本上 是 同一时间, 也就 过去 这 两 三周, 他们 在 science 上 发表 了 一篇 论文, 就是 他们的 roa 的 和 改进 算法。 这个 算法 应该说 他们 做 的 也很 不错。 但是 alpha fold 我 只能 说 就是 数据库 太大, 然后 精度 又比 手 塞塔 略微 高 一点, 所以 可能 是 吸引 了 更多 的 眼球。
你说的 这个 数据库, 但 它的 数据库 是 哪里 来 的?
我说 的 数据库 就是说 它 公开的 这个 蛋白质 的 结构 量 比较 大。 Baker lab 他们 发 的那 篇文章 更多 的 是在 讲 他的 算法 本身。 他用 这个 算法 预测 了 一些 蛋白质 的 结构, 并没有 像 阿尔法 fod 把 20种不同 的 生物 基本 所有 蛋白 全都 算了 一遍。
对, 我记得 阿尔法 第一年 参赛 的 时候, 就是 在 预测 蛋白质 结构 的 比赛 里面, 他们 第一年 参赛 好像 就 拿了 六十多 分。 他 其实 当时 的 那个 分数 不是 很高, 第二年 很快 就 拿到 了 一个 92.4 的 高分。 是的, 92.4 的 高分 其实 是。
去年 年底 的 11月份.
仅仅 过去了 半年, 突然 就有 了 一个 这么 大 的 数据库, 然后 说 它的 准确性 达到 了 98.5%, 他 为什么 可以 提高 的 这么 快 呢? 就是你 会对 这 一块 有 研究。
这里 其实 两个 问题 我们 分开 慢慢说。 第一个 是 说 为什么 他们 18年 到 去年 这个 改进 是 他们 在 算法 上 应该 是 做了 很多 的 调整, 也是 一个 很 有意义 的 改进。 从 60% 几 提高到 90%几。 这个 数据 上 来说, 应该 是 算法 的 改进 和 技术 上 的 加成 比较 多。 可能 也有 计算机 资源 就是 摩尔定律 的 加持 吧。 因为 毕竟 两年 多 时间 里, 我 觉得 计算资源 本身 也是 一个 很快 的 提高 的。
如果我们 比较 去年 11月份 到 现在 的 算法, 说实话 从 我看 他们的 文章 的 内容 来看, 我 并没有 看出 他们 对 算法 进行了 什么 很 本质 的 调整。 我 个人 的 猜测 是 表面上看 起来 进步, 只是 说 当时 蛋白质 预测 比赛 的 时候, 他们 其实 只 解 了 唯一 的 一个 蛋白质, 所以 他们的 准确度 只是 根据 这 一个 蛋白质 算 出来 的。 现在, 就 相当于 有 更大 的 数据库, 然后 有 更多 的 蛋白质。 他们 算 的 是一个 在 这么 多蛋白 中的 一个 平均 的 分数, 应该 都是 90%。
数据量 大 了, 它 其实 算法 层面 上 没有 很大 的 改变。
对我 的 理解 是 他们 背后 基本上 的 算法 应该 是 没有 什么 大 的 变化。 从 去年 11月份 阿尔法 fold 在 这个 比赛 中 获奖, 到 一直 拖 到 今年 5月份 才 把 这个 文章 发出 来。 我 估计 中 间隔 半年 时间, 有 相当 一段时间 他们 就是 在 重复 的 跑 这个 算法, 然后 把 所有 不同 蛋白质 的 结构 全都 算了 一遍。
你 有 去 官网 看 他们的 一代 跟 二代 的 更新, 因为 他们 不是 开源 了。 对, 以及 他的 这个 办法 上 的 改变。
我 只 看过 他们 文章 中 提 的 一些 改变, 因为我 毕竟 不是 自我 人工智能 方向。
你是 看 的 nature 的那 篇 论文 对 吧? 对, 两篇。
对, 还有 他们 去年 alpha fold 在 比赛 中 获奖 之后, 他们 也 发 了 一篇, 但是 那 篇 更 简单, 而且 当时 因为 算法 也没有 完全 开源 出来, 只是 讲 了 一下 实现 的 基本 逻辑。
简单 来说 就是 他们的 数据库 变大 了。
我 觉得 可能 是 算法 本身 可能 没有 太大 的 变化, 主要 就是 他们 肯定 有 更多 的 参考 的 数据库。 另外 因为 评分 的 标准 不一样, 之前 的 评分标准 说 就是 这 一个 蛋白, 现在 他们 算了 很多 蛋白, 最后 相当于 是一个 平均分。 我们 也 一直 知道 gasp 这个 用 计算机 预测 生物 结构 的 比赛, 本身 他们 选取 的 蛋白 往往 都是 一般 概念 上 就是 觉得 不是 很好 预测 它的 结构 的 一些 蛋白, 所以 在 这个 蛋白 上 表现 的 稍微 逊色 一点, 其实 也是 很。
正常 的那 他们 现在 有 预测 到了 这么 多 的 人类 蛋白 结构, 又是 这么 大 的 一个 突破, 它 可以 用来 干什么 呢?
我 觉得 首先 从 我们 做 生物 科研 的 人的 角度 来讲, 我 觉得 就像 刚刚 讲 过 的 那个 例子 一样, 是一个 很 好的 让 我们 去 查找 蛋白质 结构 本身。 然后 从 这个 蛋白质 结构 可以 来 让 我们 猜测 蛋白质 有什么 功能。 这个 过程中 其实 也是 很 好的 能够 加速 我们的 科研 的 进展。
但 比如说 在 药物 研发 方面 跟 疾病 治疗 方面。
这 一步 来说, 我 觉得 首先 是 它 还有 一定 的 差距。 这也是 我 现在 对 R F4 的 下一步, 我 个人 很 希望 看到 的 事情。 当我们 说 药物 的 时候, 我们 通常 指的 是 小分子, 不是 蛋白质 本身。 但是 很多 小分子 它 其实 可以 结合 在 蛋白质 上。 这个 结合 的 过程中, 会 细微 的 改变 蛋白质 的 结构, 从而 调节 它的 功能。 现在 阿尔法 四 它 出的 整个 数据库 是 只 包括 蛋白质 本身 的。 当然 我 觉得 这 是一个 非常重要 的 第一步, 但是 我 个人 很 希望 看到 的 第二步, 就是 他 能不能 再 把 这个 过程 再 努力 的 做 下去, 做 的 更 复杂 一些。
能够 包括 很多 的 小分子。 我们 就可以 知道 这些 小分子 对 蛋白质 的 结构 到底 起了 什么样 的 影响, 怎么 去 改变 这个 蛋白质 的 结构。 事实上 很多 现在 的 制药 公司, 包括 很多 的 start up, 他们 也 在 做 类似的 工作。 就是 我们 知道 有 一些 蛋白质, 比如说 对 人类 的 疾病 是 有 影响 的那 我们 就 想 研究 什么样 的 小分子 能够 改变 这些 蛋白质 的 结构, 从而 来 影响 它的 功能。
当然 现在 大家 做 的 比较 多 的 还是 说, 比如 像 jtac 这种 做 制药 的 大厂。 他们的 做法 就是 他们 现在 有 很大 的 一个 小分子 库。 他们 其实 有 这个 财力 合成 了 很多 小分子, 然后 他们 就 一种 一种 去 试, 在 实验 里 去 试。 如果 想象 一下 这 一步, 我们 最后 能够 用 类似 于 阿尔法 出口 的 方式 让 计算机 来解决 这个 事情。 那么 效率 肯定 是 比 一个 一个 去 在 实验 中 做 要 快 很多 的。
我 听说 之前 比如说 我们 想要 知道 一个 这样的 蛋白质 结构, 可能 要花费 几十万 美元 去 买 设备, 去做 实验, 去 一次一次 的 算, 而且 时间 都 很长。 它 相当于 就 把 时间 跟 成本 都省 下来 了。 其实 你们 最后 只用 稍微 去 验证 一下 这个 是不是 对的, 微调 就可以 了。
是的。
可以 说 他的 这些 蛋白质 结构 公开 了 以后, 每一个 制药厂 它 都会 在 一个。 因为 比如说 它 针对 不同 的 疾病, 会 在 一个 细分 方向 上 研究 这些 小 分子结构 跟 蛋白质 结构 结合 产生 的 一些 变化。 如果说 这些 制药厂 可以 去 利用 这些 人类 的 蛋白质 结构, 也可以 很快 的 去 加快 他们 药物 研发 的 速度, 是不是 以后 制药厂 也会 需要 去 养 一只 AI 团队 呢?
其实 很多 大厂 现在 也是 有 所谓 的 计算 生物学 方向, 也有 做 像 你说的 这样 一些 过程。 但是 我 觉得 就是 谷歌 本身 的 能力 特别 强, 计算资源 也 非常 的 丰富。 我 觉得 如果 有 谷歌 这样的 公司 愿意 去做, 愿意 用 他们的 计算资源 和 他们的 这些 专业人士 来做 这件 事情, 并 把 数据 公开出来, 可能 是一个 更 高效 的 过程。
提速 整个 行业 研究。 是的, 你 刚 提到 了 像 华盛顿 的那 家 公司, 他们 也 做 的 很 不错。 只是 你 觉得 他们的 那个 数据库 小 一点。 在 每年 的 task 的 比赛 中 也有 很多 A I 的 算法 团队, 现在 在 做 这个 事情 的 非常 多。 那 决定 大家 做 的 好 跟 不好 的 关键点 是 在哪里 呢?
一个 重要 的 因 这也是 为什么 我 觉得 谷歌 其实 很 适合 做 这件 事情, 就是 计算资源。 因为我 看过 华盛顿 那 一家, 他们的 算法 和 他们的 这个 文章, 和 阿尔法 fold 比 起来 一个 很 明显 的 区别 就是 alpha fold 需要 的 资源 要 大 很多。 我记得 应该 是 明显 更大 的 内存 预测, 一个 蛋白 在 G P U 上 所 需要 的 时间 也 更长。 我 估计 这就是 为什么 最后 性能 的 差异。 很多 时候 可能 也是 大家 因为 说 我的 算 力 只能 支持 计算 这些 内容, 最后 不得不 做出 了 一些 妥协。
就 相当于 是 拼 算 力拼 设备。 算法 可能 只是 其中 的 一部分, 虽然 afford 也有 很多 顶级 的 生物 物理学家。
当然了, 算法 本身 我 觉得 到 一定程度, AI 算法 跟 底层 的 设备 也是 分不开 的。 因为你 有 更强 的 硬件, 你可以 算 的 更快。 那么 在 算法 上 你 就可以 做 更多 的 调整, 或者说 让 它 跑 更 多次 的 迭代。 这个 过程中 往往 是 能 更好 的 提高 他的 算法 的 表现力 的。
在 你们 现在 的 工作 中, 你们 会有 哪些 方法 去 预测 跟 检验 蛋白质 的 结构? 你们的 工作 是 每天 对 着 显 近 看 蛋白质 的 分子结构, 还是 说 上升到 了 用 计算机 来去 跑 数据?
大部分 的 科研 都是 说 的 难听 一点 就是 无所不用其极。 就是 我们 手里 有什么 技术, 我们 都会 尽可能 的 用上。 看 蛋白质 的 结构 这件 事情 我们 做不到。 但是 如果我们 有 机会 跟 这种 结构 生物学 的 实验 是 合作, 让 他们 来 帮 我们 解 结构, 那 我们 也是 非常 欢迎 的。 通常 就 我 个人 而言, 我们 经常 会 做 的 一件 事情 是 我们 绕开 结构。 因为 结构 其实 是一个 很难 做 的 过程。
就 太难 了。 对。
是 我们 可以 去 猜 它 有 什么样 的 功能。 然后 我们在 实验 中 就 设计 说 它 有 这样的 功能。 那么 我们 可以 考虑 说 用 一些 方法 来 要么 是 增强, 要么 是 抑制 它的 功能。 然后 看 我们 这个 猜想 对不对。 如果 这个 猜想 最后 验证 了 实验 中 是 可行 的, 我们 甚至 可以 提出 更多 的 猜想。 当 很多 这样的 猜想 都在 实验 中 被 验证 之后, 就 相当于 你可以 用 排除法 排除 掉 其他 不可能 的 功能。 那么 最后 剩下 的这 一个 功能, 逻辑 上 讲 就是 他 唯一 可能 实现 的 方式 了。
所以 它 其实 就是 一项 一项 的 试, 就 感觉 特别 耗费 时间。
是 科研 很多 时候 是一个 很 漫长 的 过程。 因为 没有人 知道, 没有人 做 过 这件 事情, 所以 也没有 人 能 给 一个 很 直接 的 指导, 最后 还是 要 自己 去 一项 一项 的 试。
他 现在 阿尔法 fold 它 对 哪个 方向 的 帮助 是 最大 的? 蛋白质 结构 研究 的 那个 方向 它 其实 帮助 最大, 还是 说 它 消灭 了 这个。
职业 说 起来 很 有意思, 就是我 也 认识 几个 结构 生物学家, 他们的 日常工作 其实 就是 解 蛋白质 结构。 很 好玩的 是 很多人都 说 他 偏偏 就是 没有 解除 我 研究 的 那个 蛋白。
那 为什么会这样? 因为 他们 研究 的 更难 吗?
对, 因为 现在 比如说 就像 我们 刚刚 说 的, 有 一些 无序 的 蛋白 或者 有 一些 蛋白。 比如 最近 可能 大家 也都 知道, 比如说 基因 编辑 非常 火 的 crip, 它 里面 就是 核心 的 一个 蛋白 cassine。 这次 的 他们的 数据库 里 就 没有 这个 蛋白。 为什么 会解 不出 cassine? 我 觉得 不是 解 不出, 只是 他们 没有 去 挤。 因为 cassine 这个 蛋白 并 不在 他们 解 过 的这 二十种 生物 里面, 它 是从 另一种 平常 大家 其实 研究 的 不是 很多 的 细菌 里面 提取 出来 的, 所以 就 没有 很 正常。
但是 另一方面, 其实 结构 生物学家 们 关心 的 话题 往往 是 说 纯 从 生物 意义上讲, 他们 现在 最 关心 的 一些 蛋白。 而 阿尔法 四 的 这次 采取 的 做法, 是我 先 找 这些 我 最 有意思 的 生物体, 把 他们 所有的 蛋白 都 做 一遍。 我相信 如果 阿法 fod 还要 继续 这个 项目, 他们 可以 继续 扩展 他们的 数据库 的话, cataline 应该 会 是一个。 我 觉得 原则上 讲 预测 cassine 的 这个 结构 应该 没有 任何 难度, 只是 他们 现在没有 去做。 但是 类似的 例子 就是 其实 有 很多 其他 的 蛋白质, 大家 生物 领域 很感兴趣。 但是 阿尔法 四 的 目前 数据库 还没有 扩充 到 这样 一个 阶段。
因为 他们说 他们 已经 确定 了 98.5% 的 人类 蛋白 结构, 那 偏偏 大家 感兴趣 的 都是 那 1.5%。
因为 大家 感兴趣 的 很多 时候 不是 人类 蛋白, 它是 比如说 它 是从 细菌 里 出来 的 一个 蛋白, 只是 他 对 基因 编辑 很 有用, 大家 现在 是 拿 它 作为 一个 工具 来 使用。 类似的 还有 很多, 比如说 你 可能 会 关心 我们 种植 植物 的 时候, 怎么样 来 调整 各种 植物 的 产出, 这些 往往 也有 一些 核心 的 蛋白质 在 控制。 比如说 我是 要 让 它 开花 开 得 更大, 还是 让 他 结果 结 得 更大, 果子 里面 是要 葡萄糖 更多 还是 淀粉 更多, 这些 都有 特定 的 酶, 也就是说 我们 说 蛋白质 在 调节, 但是 因为 这个 范围 实在是 太 广 了, 你 像 我们 平时 吃的 蔬菜水果, 可能 随便 数一数 也有 那么好 几十种 了。 如果我们 要 真的 完全 去 预测 所有的 蛋白质 的 结构, 从 这个 计算 量 来说, 也 总得分 一个 轻重缓急。
一步一步 来。 Psi 现在 它的 结构 是 有 确定。
有 实验 中的 结构。
只是 说 阿尔法 fold 没有 去 解, 但是 其实 人类 已经 把 它 研究 出来 了, 所以 才 会有 基因 编辑 技术 的 产生。
是的, 如果 从 时间 先后 上 来说, 大家 是 先 知道 castine 可以 用作 基因 编辑, 后来 去 解 的 结构, 这也是 一个 互相促进 的 过程。 我们 知道 它的 结构 之后, 我们 就可以 更 明确 的 来 根据 这个 结构 定向 调节 它的 功。 可以 让 他 更 高效 的 去做 剪辑, 或者说 有 更高 的 精度, 不会 发生 一些 我们 所谓 的 of target。 偶尔 会 发生 那些 乱 检 的 情况, 都 可以 尽量 的 来 实验 中 来 继续 改造 这个 蛋白, 让 它 更 适用于 我们的 基因 编辑。
就是 要 防止 基因 脱 板对 韩 朵 其实 很 厉害, 因为 我知道你 是 高中 时候 就 拿了 国际 物理 竞赛 的 第一名。 是的, 我记得 那一年 其实 你 也是 创下 了 国际 物理 竞赛 的 三个 历史 总分 第一, 实验 分 第一, 也是 历史上 唯一 一个 同时 获得 三个 单项 第一名。 你的 女神 就是 你的 很多 同学 也 提到 了, 你 在 北大 物理系 也是 大神 级 的 人物。 对, 就是 为什么 会 从 物理 来 转向 研究 生物?
首先 是我 觉得 我 个人 比较 喜欢 看到 实验 和 理论 相结合 的 研究 方式。 物理 我 个人 觉得 目前 因为 物理 可能 是 也是 它 发展 的 时间 比较 长, 整个 领域 有 比较 明确 的 区分。 我们 有 实验 学家 专门 来做 实验, 我们 有 理论 学家 基本上 大部分 时间 都 是在 搞 理论。 然后 我们 来 合作 做 这样 一件 事情, 这个 模式 很好。 但是 我 个人 更 喜欢 是 我自己 能够 同时 来做 一点 实验, 然后 做 一点 理论。 所以 你 现在 算是 在 跨学科 跨年, 可以 这么说, 然后 就是 去了。
然后 生物学 我 觉得 就 给我 提供了 一个 很 好的 机会。 这些年来 我 觉得 有 很多 也是 跟 我 类似, 就 物理 计算机 背景 的 人, 更多 的 直接 来 学习 生物 本身, 用 我们在 物理 计算机 学到 的 一些 知识 来解决 生物 问题。 就像 A R A A O D 也是 一个 我 觉得 很 典型 的 例子。 是的。
所以 现在 你 在 研究 的 领域, 比如说 细菌 群落 这些, 它 还是会 涉及到 很多 的 物理 的 理论知识 的对。
因为 我们 很多 时候 是要 做 这种 类似 于 数学建模。 这个 模 本身 也 依赖于 本科 的 时候 学到 的 物理 知识。
我看见 在 阿尔法 fold 里面 它 也有 用到 一些 物理 知识。 就是 除了 生物 的 知识 以外, 他们 会 把 研究 这个 领域 的 专家 叫做 生物 物理学家。 是的, 为什么呢?
生物物理 这个 词 回到 历史上 说, 生物学 本身 最初 开始 的 时候 更 接近 于 博物学。 就 大家 可能 比较 熟悉 的 例子 就是 达尔文 他们 最初 开始 做 生物学 的 时候, 基本上 就是我 去 采集 标本, 然后 我 来 记录 标本 长 什么 样子。 从 这个 过程中 总结经验。 物理学 其实 是一个 可以 说是 反向 的 过程。 先 提出 一些 理论 或者 简化 的 数学模型, 然后 我们在 实验 体系 中 去 验证, 然后 来 总结 规律。 这个 过程中 更多 的 就是说 这种 抽象 的 建模, 然后 包括 定量分析 的 这些 手段, 其实 是 物理学 最初 发展 起来, 然后 逐步 渗透到 生物学 里 的。 所以 可能 大家 也就是 习惯 上 把 这种 用 比较 偏 物理 的 手段 来解决 生物 问题 的 这样 一个 方式。 就这样 一种 交叉学科 就 命名 为了 生物 物理学。
对我 觉得 像你 这样 非常 好啊, 就是 又有 物理学 的 知识, 又有 生物学 的 知识, 如果还能 有一点 计算机 的 知识 就 感觉 无敌 了。
我 觉得 现在 大家 趋势 都是 想做 所谓 的 跨学科 科研。
对, 因为 其实 你们 如果 有一个 计算机 的 团队 来 辅助 你们, 你们的 科研 效果 会不会 产量 会 提高 很多?
当然 会。 比如说 像 我和我 周围 的 同事, 我们 都会 写 一点 代码。 而且 事实上 就是我 科研 中 也有, 我 估计 可能 3分之1 到 2分之1的 时间 就是 在 电脑 面前 写 代码 东西, 包括 处理 数据。
包括 是 占 了 一快 一半 了。 你 刚才 3分之1 到 2分之1.
对我 觉得 接近 一半, 就是我 自己 实验 和 在 电脑前 的 工作 可能 是 差不多 是 一半一半 的。 我自己 觉得 这样 也 挺好。 但是 我也 知道 如果 计算机 方面 的 工作 能够 更多 的 有 专业人士 比 我 更 懂 计算机。 然后 能够 更快 的 写 代码, 更 高效 的 写 代码, 把 这个 代码 的 复用 性 做得 更好 的话, 我相信 其实 对 科研 本身 也是 很 有 好处 的那。
你们 现在 在 研究 的 过程中, 会 跟 计算机系 或者 像 物理系 有 一些 比较 深度 的 合作。 斯坦福 在 跨学科 的 研究 方面 是 怎样 的?
我 觉得 斯坦福 在 平台 上 是 给 了 很多 的 支持 的。 一方面 是 其实 系 与 系 之间 除了 物理 空间 上, 因为 在 不同 的 楼, 除此之外 其实 没有 任何理由 阻拦 我。 比如说 我 完全 可以 去 物理系 找 一个。 教授 说 我想 跟 你 合作, 然后 我 觉得 你们 组 的 什么 技术 对我 很 有 帮助, 实际上 讲 是 完全 行得通 的。 而且 其实 斯坦福 还有 很多 所谓 的 跨学科 的 这种 奖学金 和 基金, 其实 就是 来 支持 无论是 学生 也好, 教授 们 也好, 如果 他们 想 去 开展 这样 跨学科 的 研究 项目 的话, 也有 很多 这样的 经费 来做 独特 的 支持。
你 现在 有 跟 计算机 去 合作 吗?
我没有, 可能 是因为 我的 背景 还是 比较 偏 物理 和 理论。 事实上 更多 的 是 有 一些 就像 我 现在 其实 正好 在 做 一个 完全 是 生物 信息 方面 工作。 就是 斯坦福 医院 的 一个 医生, 他 自己 有些 临床 数据 找我 来 帮 他 做 处理 数据。 其实我 觉得 很多 时候 我自己 在 这个 过程 中更 像是 扮演 了 一个 物理 或者 计算机 背景 的 人。 也很 希望 有 更多 的 比 我 更 懂 物理, 比 我 更 懂 计算机 的 人 能够 加入到 这个 圈子里。
那 为什么? 如果 他 需要 的 是 物理 跟 计算机 的 信息, 他 不是 去 找 物理 或者 计算机系 的 学生, 而是 找 一个 生物系 的 博士, 后来 去做 这样的 一部分 工作。 好 问题。
这个 是 跨学科 合作。 现在 一个 本质 上 是 沟通 之间 有一个 很深的 沟, 不是 代沟, 但是 也是 一个。
这就是 大家 互相 不了解。 比如说 我是 学 计算机 的, 我 可能 并 不了解 生物 领域 原来 需要 这么 多 的 计算机 知识。
这是 一方面。 而且 另一方面 就是 如果我们 真的 找 了 一个 只 懂 生物 的 和 一个 只 懂 计算机 的 人, 他们 其实 的 沟通交流 成本 很高。 生物 的 人 最后 会 告诉你, 我想 处理 这个 数据, 我 想得到 生物 上 的 什么 结论。 但是 计算机 的 人 只会 问 你, 你 这个 算法 你 需要 什么 输入, 然后 你 需要 算 什么东西, 你 希望 得到 什么 输出。 双方 不是 在 同一个 频道 上 交流。
一个 是 思维 不一样, 另一个 是因为 他 不太懂 研究 的 一些 具体 过程。 所以 他 需要你 把 所有的 东西 都 设定 好, 他 只是 去 写 一个 执行 的 代码。 对, 但是 你 希望 他 对 代码 是 有 自己的 想法。
对我 希望 是 找 一个 外包公司, 就是我 把 数据 从 我的 实验 记录本 上移 交给 他, 然后 剩下 的 事情 都 让 他 负责。 当然 这个 就是说 我 觉得 双方都 很 理想化, 事实上 这种 合作 往往 是 互相 都 努力 的 往前 跨 一步, 就是 一个 比较 理想 的 状态。 我 觉得 就是 生物学家 们 能 懂 一些 算法, 不是 说真的 懂得 说 能够 写 代码 本身, 但是 可能 对 算法 有所 了解, 输入输出 是什么? 中间 过程中 哪些 过程 是 比较简单 的, 哪些 数据 是 可能 是 比较 难 调 的, 对 这些 有 概念。 同时 计算机专业 的 人 也 能够 迈出 一步 来 了解 我们 这个 生物学 本身, 我们 想 解决 的 问题 是什么, 然后 实验 上 的 限制 是什么。
我 听 过 很多人 抱怨, 也 不是 抱怨 了, 但 至少 就是 会 觉得 比较 沮丧。 就是 在 这类 合作 中, 有时候 他的 合作者 就 会说, 我的 算法 里, 我 对 这个 数据 的 精度 要求 很高。 你 有没有 办法 给我 拿到 更 高精度 数据 或者 更多 的 数据。 就 比如说 你 这里 只 给 了 我 三只 小鼠 的 数据, 但是 我 觉得 如果我 这个 算法 要 能够 比较 好的 表现 的话, 我需要 100只小鼠 的 数据。 但是 100只小鼠 的 数据 可能 就是 大家 三年 的 工作量, 事实上 可能 不太 容易 做到。
有时候 领域 之间 的 不了解, 就会 导致 对话 没有 办法 进行 下去, 或者说 需要 很多 的 更改。 然后 来来回回 讨论 的 过程。 这样的 交流 成本 有时候 会 比 工作 本身 省下 的 时间。 对。
就是 相当于 你 自己 做, 比 你 找 一个 团队 做 更 节省时间。
有时候 是 这种 感觉。 但是 如果 有 很多 懂 生物 的 计算机 学家, 可能 这个 问题 就 会好 很多。
其实我 觉得 这样 如果 有 一支 固定 的 团队, 他 一直 在 这个 方向 学习 跟 有所 训练 的话, 可能 也会 好 一点。 是的, 所以 我 觉得 如果 真正 要 让 这种 跨学科 交流 起来, 可能 还得 有 一些 类似 于 体制 上 的 保证。 比如说 这个 穴位 就是 生物 计算机 双学位 的, 大家 就是 在一起 工作 的。 或者 就是 把 物理 空间 设 到 一块儿, 让 大家 每天 都 能够 交流, 看 项目 怎么 进行, 他 才会 推进 的 更 顺利。
是的, 我 觉得 说 的 非常 对。
你们 学校 里 有 研究 蛋白质 结构 的 实验室 吗?
有啊, 有 做 计算 的, 也有 做 冷冻电 竞 的。
就是现在 还是 用 冷冻电 镜。
解 来 比较 多。 对 冷冻电 镜 相对来说, 我的 理解 是对 样品 的 制备 对的 要求 更 低。 而且 同时 可以 看到 更 多蛋白 是 更 接近 它的 生理 状态 的 结构。
那 有了 阿尔法 food 还需要 冷冻 点心 吗?
当然 需要 了, 还是 要 验证 的。 一个 是 验证, 另外一个 就是 像 我们 刚刚 说 的 alpha fold, 它 目前 只能 解除 蛋白质 本身 的 结构, 但是 很多 小分子 它 会 非常 细微 的 改变 蛋白质 的 结构, 这些 对 它的 功能 也是 很 有意义 的。 目前 阿 a fod 其实 没有 这部分 信息, 但是 冷冻电 镜 上 来说, 就是 蛋白质 本身 的 结构 和 加 一个 小分子 的 结构, 很大程度 上 来说 就是 做 的 难度 是 差不多 的, 所以 他们 完全 有 能力 做 更 精细 的 结构 的 区分。
我 觉得 阿尔法 ford 就像 你说的, 他 是不是 很快 就可以 加上 这 一步 了, 它 会 一步一步 来。
对我 希望, 我 觉得 这个 才是。 如果我们 真的 要 谈 应用 的话, 我 觉得 有 小分子 的 这个 结构 可能 是 离 应用 会 更 近 一步。
冷冻电 镜 它的 成本 大概是 多少? 比如说 你们 用 一个 冷冻电 镜 去 验证 一个 结构, 就是我 不太 了解 这个 实验 的 过程, 那 它 大概 需要 多久 呢?
冷冻电 竞 的 成本 上 来说, 应该 还是 一个 比较 贵 的 仪器。 斯坦福 应该 整个 学校 也就 只 买 了 几台, 而且 大部分 情况下, 我 听说 的 是 即使 预约 上 也 非常 紧张。 就是 有 很多 实验室 其实 都想 去 用 冷冻电 镜 看 他们 样品, 但是 因为 机器 只有 这么 几台, 然后 大家 预约 的 时候 其实 经常 也 需要 排队, 所以 造价 上、 经费 上 是一个 限制 因素。
但 像 这种 难道 学校 不是 应该 更多 的 进 一些 设备 吗? 因为 大家 都 排 不上 实验, 这个 对 身体 问题 很 严重。 斯坦福 这么 有名 的 学校。
但是 斯坦福 就是 至少 对 我们的 冷冻电 竞买 了也 没 几年。 前几年 刚刚 买的 时候, 当时 大家 都 宣传 说 斯坦福 的 冷冻电 竞 好像 是 北美 最大 的 冷冻电 镜 中心。
这 已经 是 已经 是。
好像 是 尽可能 多 的 买 了 仪器。 但是 经不住 大家 的 科研 热情。
也有 可能 是不是 因为 这个 方向 热 了, 研究 这 一块儿 的 人 越来越 多了。 因为我 感觉 实验 设备 的 引进 跟 新的 实验 方法 的 推行, 它 会 引导 更多 的 人 向 实验 的 方向 去 流动。 因为 大家 通过 这些 实验 可以 得到 一个 确定 的 结果。 谁 也 不想 自己 做了 好几年 的 博士, 觉得 没有 方法 可以 去 验证 自己的 结果。 所以 我 感觉 它 也 算是 一个 相辅相成 的 一个 事情。 对我 觉得 有 道理。
刚刚 提到 了 像 最近 生物学 上 的 重大进展, 还有一个 是 基因 编辑 技术, 然后 还有一个 是 M R N 疫苗 技术。 我 很 好奇 就是 为什么 在 短短的 几年 内, 新 编辑 从 出现 到 拿 诺贝尔奖 也 没多久。 这 为什么 会 出现 这么 多 生物 领域 的 大 的 突破 跟 创新 呢? 他 有没有 一些 基础科学 的 研究 突破?
个人 的 看法 是 基础科学 的 进步 跟 新的 技术 之间 是一个 迭代 的 过程, 其实 能起到 一个 相互促进 结果。 因为 如果我们 说 基因 编辑 技术, 其实 crisper 不是 第一个, 很 可能 也 不会 是 最后一个。 但是 crisp r 出现, 正好 我 觉得 就是 把 技术 门槛 降到 了 一个 程度, 基本上 所有 实验室 都能 做, 而且 基本上 在 所有的 生物 里面 都 可以 做。 之前 的 一些 基因 编辑 技术 相对来说 就 更 复杂 一些, 做 起来 对 实验室 的 限制 也 比较 多, 对 具体 我们 能 在 哪些 动植物 里面 实现 的 限制 也 相对 比较 多。 其实 很 限制 他们的 发展。 这是我 觉得 一方面 就是 技术 简化 之后 门槛 低 了, 有 更 多人 能 做了。 另一方面 我 觉得 很多 程度 上 可能 也是 有 运气 的 成分。
这 两年 因为 我们在 湾区, 可能 我们 也 看见了 南 三藩 这 一边。 记得我 上次 看过 的 数据 是 已经 有 上 百家 生物技术 的 startup, 就是 近几年 创立 的。 以前 南 三藩 也有 一些 大 的 生物技术 公司, 比如 指南 tak 就 在那边。 然后 谷歌 之前 收购 的 very 也是 在那 一片, 都是 相对来说 还是 比较 大 的, 比较 成 规模 的 公司。 然后 现在 又 多了 很多 的 小型 start up, 一方面 是 他们 那边 相当于 说 形成了 一个 集群 效应。 然后 据 我 听说 的 也会 存在 大家 的 器械, 大家 各种 资源 可以 共享。 我 觉得 科技 上 很多 风投 的 公司, 其实 现在 也很 看好 一些 新的 生物技术。 对, 资金 上 的 加成 加上 人才 的 流入, 很多 程度 上 也会 加速 这个 行业 的 发展。
对我 觉得 从 我 播客 的 收听 量 上 也可 可以 看得出来, 因为 其实我 在 生物 方向 聊 的 并不是 很 专业。 但是 每 一期 跟 生物 相关 的 创业 或者 投资 的 话题 收听 量 都 特别 高。
说明 大家 可能 也 开始 关注 这个 新 领域 了。
对, 说明 大家 在 看 这个 方向。 是的, 所以 你 会有 意向, 比如说 你 想 继续 做 学术, 还是 你 有 意向 去 加入 一家 生物 创业 公司。
我 个人 还是 比较 倾向 于 做 学术。 学术 和 生物技术 公司 有时候 其实 如果 细分 一点 的话, 就像 科学 和 技术 的 区别。 科学 来说, 我们 考虑 的 时候 更多 的 不是 实用性, 而是 说 它 有 什么样 的 机理, 什么样 的 原理。 然后 这些 比较 形而上 的 东西 最终 是要 影响 下游 的 产业。 但是 我 对 这 一部分 的 发现 的这 一类 工作 更 感兴趣。 然后 技术 上 很多 时候 我们 要 考虑 的 问题 不太 一样, 更多 的 是 我们 怎么样 把 过程 做得 更 高效、 更 经济、 更 实用。 我 觉得 科学 和 技术 都是 很 重要 的, 但是 我 个人 的 品味 来说, 我 更 喜欢 做 科学 一点点。
现在 我 其实 看见 就 这么 多 技术 出现 以后, 就 这么 多 从 源头 上来 解决 了。 比如说 像 基因 编辑 的 门槛 大大的 降低 了 以后, 包括 像 阿尔法 fold 把 蛋白质 的 结构 公布 了 以后 我。 觉得 好像 研究 到 产业 的 这个 转换 的 链条 已经 变得 非常 多了。
是的, 而且 这个 线 现在 也 画的 越来越 不清楚 了。 因为我 也 知道, 比如说 我在 斯坦福, 斯坦福 其实 有 相当 多 的 教授 都是 要么 是在 给 生物技术 公司 做 咨询, 做 一个 这种 他们 所谓 的 outside consult。 也有 一部分 其实 自己 在 斯坦福 做 教授 的 同时, 自己 也 下海 去 开 公司。 所以 他们 自己 也 经常 是 把 自己的 科研成果 可以 直接 转化 到 一些 新兴 的 start up 的 技术 过程中。 然后 我 觉得 这个 过程, 随着 大家 创业 的 门槛 降低 之后, 这 一类 的 事情 应该 会越来越 常见。
你 觉得 现在 创业 的 门槛儿 降低 是 哪几个 门槛 降低 了, 哪几个 方向 是 最有 可能 转换 的? 从 细分 的 领域 也可以 说 一下, 就 刚刚 我们是 在 从 一个 技术 工具 的 角度 上 来说, 从 细分 的 领域 上 来说, 可以 实际 到 应用 的 像 R N 疫苗 算是 一个 细分 的 领域。
我 觉得 一个 来说 当然 这 肯定 是因为 有有 我 个人 的 经验 在 里面。 我 觉得 唱到 菌群 其实 是一个 很 有意义, 同时 也是 很 有 希望 来做 的 一个 长期 的 方向。 一方面 是 我们 可以 通过 测量 肠道菌群 来 预测 一个人 的 健康状况。 再 想 远 一点, 甚至 可以 是 根据 一个人 现在 的 肠道菌群 来 帮 他 设计 一个 比如说 膳食 计划表。 可以 想象 一下, 就是我 经常 会 幻想。
个人 定制 化 的 菜, 对。
就是 会有 一天 能够 实现 这种。 就是我 测 了 一下 我 现在 肠道菌群, 发现 我 缺 某 一种 菌。 那 我 之后 几天 的 食物 中, 我 就 可能 需要 比如说 多 喝 酸奶 来 补充 特定 的 益生菌, 让 我的身体 回到 一个 最 健康 的 状态。
所以 它 是不是 可以 解决 便秘 的 问题?
希望 是我 还 看。
了 你 在 知乎 上 写 的 一系列 的 专栏, 就是 讲 肠道菌群 的。 我 觉得 好 有意思。 比如说 如果 真的 吃 一个 体质 瘦 的 人的 屎 是不是 能 变 瘦?
我也 希望 这样, 但是 我 现在 好像 有没有 很强 的 动力 去 尝试, 因为 目前 我们 对 肠道 军 了解 还 比较 有限。 就像 你说的 这个 例子, 就是 只是 为了 减肥, 那么 风险 可能 就 有点 大。 因为 你不知道 吃 了 别人 的 屎 之后 会有 什么 副作用。 但是 这个 过程 就是 我们 科学 上 讲 叫 粪 菌 移植。 就是说 把 一个人 的 肠道菌群 移植 到 另 一个人 体内。 这个 手段 在 治疗 特定 的 疾病, 比如说 溃疡性结肠炎 之类 的, 确实 已经 是一个 非常 成熟 的 手段 了。
已经 是 应用 了 对 吧?
对, 只是 应用 的 范围 还 比较 小, 基本上 是在 比较严重 的 病人。 然后 我们 其他 的 治疗 手段 都 没有 效果 的 时候, 在 考虑 实行。
这种 方式。 我 觉得 这个 方向 还是 挺 有 应用 前景 的。
是的, 当然 更 希望 以后 我们 研究 清楚 了, 就 不用 那么 复杂 了, 我们 可以 从头开始 在 实验室 培养 我们 需要 的 细菌, 然后 就 一直 这 一些 固定 的 细菌, 那么 风险 就会 小 很多。
这个 领域 你 研究 清楚 了, 你 就可以 直接 产业化 了。
是的, 所以 这就是我 说 我 觉得 这 可能 是一个 未来 5到10年 内 比较 有 希望 产业 落地 的 这样 一个 方向。
比如说 它 可以 解决 便秘 的 问题, 可以 解决 乳糖不耐受 的 问题, 甚至 还 可以 解决 胖瘦 的 问题, 包括 很多 疾病。 是的, 好的, 好, 谢谢 韩 朵, 谢谢。 我 最近 收到 了 一些 听众 的 来信, 大家 有 问 硅谷 101有没有 文字 版本? 是的, 我们 有 文字版。 我们的 文字版 在 微信 公众 号 硅谷 101上。 如果 大家 都 听到 这里 了, 而且 对 文字版 感兴趣, 可以 去 关注 一下 我们的 微信 公 号。 另外 是我 发现 硅谷 101 的 评分 在 苹果 上都 只有 3点2分。 所以 如果 大家 喜欢 我们的 节目, 也 拜托 大家 可以 给 我们 一个 五星 好评, 谢谢, 感谢 大家 的 收听。