用 声音 碰撞 世界。
生动活泼。
Hello, 大家好, 我是 丁丁, 欢迎 收听 全新 一期 科技 早知道。
Hello 大家好, 我是 刘灿。 在 上周 的 选题 会上, 科技 早知道 的 主创 团队 在 讨论 一条 非常 有意思 的 新闻, 就是 国内 最受 关注 的 结构 生物学家 之一 颜宁 教授, 他 宣布 即将 辞去 普林斯顿大学 的 教职 并 正式 回国。 那 关于 他 辞职 回国 的 原因, 目前 确实 有 很多 猜测。 一种 比较 有趣 的 说法 是, 结构 生物学家 可能 很快 会 被 alpha 四 这样的 人工智能 所 取代。 那 alpha 4其实 是 谷歌 旗下 的 曼 团队 所 开发 的 一款 蛋白质 预测 的 模型。 关注 科技 早知道 的 听众 一定 不 陌生, 因为 从 2020年 他 第一次 成功 预测 蛋白质 结构, 我们 就在 聊 它。 到了 今年 的 7月28日, F A 已经 成功 的 解锁 了 地球 上 所有 已知 生命体 的 蛋白质 预测 结构。 在 此前 结构 生物 领域 其实 大部分 的 重要 课题 都是 10年 才有 一个 重大成果 出现, 所以 今年夏天 alpha 4的这个 新发现 其实 也 让 很多人 感慨。
而 仅仅 过了 三个月, 在 推特 上 meta 的 首席 科学家 杨立 坤, 他 则 分享 了 他们 团队 开发 的 新的 模型。 这个 模型 目前 是 可以 预测 超过 6亿种 蛋白质。 据说 这个 量级 以及 它的 预测 速度 都是 远超过 alpha 我们 就 觉得 像 结构 生物学 领域 的 这种 进化 速度, 在 没有 算法 的 时代 其实 是 非常 难以想象 的。 而 本期 的 节目 是 九月份 我 和 硅谷 投资人 张璐, 还有 辉瑞 研发部 的 国 才 讨论 当下 的 这个 时点, 该 如何 理解 alpa 四 这样的 人工智能 去 给 生物制药 领域 带来 的 影响。 我们 觉得 这些 讨论 内容 其实 在 当下 这个 场景 可能 可以 给 大家 提供 一些 有趣 的 思考 角度, 所以 就有 了 本期 节目, 欢迎 大家 的 收听。
大家好, 我是 国 彩, 来自 辉瑞 研发 药物 科学 部门。
大家好, 我是 张璐。 很高兴 今天 又 可以 来 和 大家 继续 讨论一下 过去 这 短短的 一年 时间, alpha ford 给 我们 带来 的 一些 新的 技术 上 的 突破 和 给 我们 未来 带来 的 商业机会。
首先 我可以 快速 的 问 一下 两位, 你 觉得 有 哪些 工作 你们 现在 是 看到 说 alpha four 已经 在 影响 你们的 投资, 或者 是 影响 你们的 这个 工作 呢? 我想 请 国泰 先来 聊聊 好了。
因为我 来自 辉瑞, 我 接触 的 工作 大部分 都是 和 药物 的 发现 研究 相关 的。 所以 阿尔法 四 的 这个 突破, 或者说 相关 的 人工智能 领域, 使得 我们 传统 的 药物 研发 的 模式, 正在 发生 一系列 也 天翻地覆 的 一个 变化。 总的来说, 从 以前 的 一个 实验 科学, 从 一个 随机 筛选 会 过渡到 一个 计算 科学, 到 一个 合理 的 设计。 前面 的 更多 依靠 人的 经验 会 转移到 一个 数据 驱动。 从 最初的 final top screening 也是 人工 驱动, 所以 过渡到 我们 以前 讲 过 的 C A D D 计算机辅助 设计。 那么 随着 阿尔法 狗 和 人工智能 的 出现了 药物 的 一个 设计 和 发现, 会 逐渐 过渡到 一个 新的 名词 叫 A I D D, 也就是 人工智能 辅助 药物 设计。
总的来说 药物 阿尔法 狗 和 人工智能 在 药物 研发 的 各个环节 都在 逐步 参与, 最 主要 的 目前 还是 集中 在 药物 discovery 阶段。 从 靶点 发现 确定 八点 以后 确定 找 的 一个 先导 化合物。 然后 在 谢 的 化合物 确定 以后, 去 对 谢 的 化合物 进行 优化, 最终 筛选 出 一个 最优 的 药物 分子 的这 几个 方面, 我 看到 阿尔法 狗 和 人工智能 正在 起到 一个 非常 关键 的 一个 作用。
所以 国 才 您 的 说法 我 简单 的 理解 一下, 就有 可能 是在 新药 开发 的 阶段, 可能 alpha four 它的 应用 场景 还是 在 比较 早期 的 环节。
可以 这么 理解 吗? 对的, 人工智能 目前 大部分 的 应用 还是 集中 在 早期 研发 阶段。 我们 具体 的 阿尔法 狗, 它 可能 在 最 早期 的 一个 靶点 发现 阶段, 甚至 早 于 靶点 发现 阶段, 他在 起到 一个 革命性 的 一个 颠覆 作用。
张路, 我不知道 你 怎么 看待 alpha 4现在 的 一些 热潮, 您 觉得 您 现在 的 投资 里面 有 哪 一些 其实 是 能够 看到 alpha four 已经 很快 落地, 还是 他 其实 距离 落地 相对来说 有 一段距离。
其实 在 某种 定义 上 它 已经 有 一些 落地 了。 因为 其实 在 一年前 在 nature 上 发表 论文 的 时候, 其实 当时 deep mind 的 研究 团队 就 已经 开始 对外 免费 公开 了 alpha fold 它的 源代码 以及 数据库。 所以 从 自从 一年前 的话, 已经 有 很多 的 学者 已经 开始 访问 数据库, 而且 通过 这些 数据库 的 信息 在 帮助 他。 无论是 在 科研, 甚至 说 是在 一些 疫苗 的 研发, 还有 包括 一些 抗生素 耐药性, 还有 包括 一些 其他 的 比如说 是 像 环境污染, 塑料 污染 中的 一些 应用, 在 进行 非常 强 的 一个 支持 作用。 所以 在 某种程度 上, 阿尔法 fold 已经 在 进入 到 商业化 应用 的 一个 阶段。 现在 因为 我们 有了 一个 更加 强大 的 数据库, 所以 这个 数据库 也是 帮助 我们 开放 了 更多 的 一个 新的 可能。 同时 我 觉得 很 重要 的 一点, 也是 向 公众 提供了 一个 非常 好的 信息源, 让 大家 看到 人工智能 和 生物学 的 一个 结合。 我们 经常 讲 叫 digital live science, digital putis.
怎么样 可以 去 把 数据 的 价值, 数据 的 力量, 人工智能 的 力量 真正 运用 到 生物学 中 来。 而且 生物学 中 其实 核心 我们 也是 有 很多 编码 和 数据, 怎么样 去 找到 它的 相关性。 我 觉得 其实 alpha fold 也是 通过 这样 一种 形式, 让 更多 的 人 了解到 了 这样的 一层 应用。
同时 它的 呈现 方式, 这也是 我 非常 想 强调 的。 它 其实 最终 的 呈现 方式 是一个 非常简单 易用 的, 就像 搜索引擎 一样的 数据库。 再加上 这个 数据库 又被 谷歌 放到 了 它的 公开的 云 平台 上, 在 各种各样 的 数据库 里 都 可以 去 应用。 它 就 大大降低 了 各种各样 不同 背景 的 学者 使用 这个 数据库 的 一个 门槛。
你 不需要 是 有一个 数据分析 或者 人工智能 背景, 你 可能 就是 一个 单纯 的 纯 生物学。 从 化工 背景 的 你 过来 用 这个 数据 会 非常 简易 方便。 甚至 是 说 可能 它是 一个 技术 背景 没有 那么 强 的 创业者, 他 去 使用 这个 数据库, 可能 也会 得到 很多 非常 有用的 对他 初创 企业 的 一些 支持 和 帮助。 所以 我 觉得 这个 是 让 我 感觉到 最 兴奋 的 一点。 这也是 为什么 我们 会能 预见到 alpha fold 对于 未来 数字 生物学 的 整体 的 商业 应用 进行了 巨大 的 一个 推动 的 力量。
可能 这里 先 有 第一个 问题, 就是 alpha four 它 到底 是 怎么 去 找到 我们 说 地球 上 所有 已知 蛋白质 的 这种 结构 预测 方法。 因为他 这个 跨度 其实 还 蛮 大, 而且 用时 还 蛮 短 的。 郭 才 你是 怎么 理解 他的? 这个 方法 是 怎么 找到 的?
这个 确实 是一个 比较 难以 回答 的 问题, 可能 比较 枯燥, 先 给 大家 预警 了。 我们 先 要 看一看 阿法 F 的, 我们 现在 讲 的 是 阿 ford 2.0。 我们 要 先 了解 一下 阿尔法 四 最初的 一个 工作 原理。 我们都知道 蛋白质 它是 一个 氨基酸 序列 的 三维 结构, 最初 它 可以 回到 20个氨基酸 的 一个 序列。 阿尔法 四 的 最初的 工作 原理, 它 就是 通过 预测 蛋白质 中 每 对 氨基酸 之间 的 一个 距离 分布, 以及 连接 它们的 每个 化学键 分子 界 的 角度, 对 这些 所有 氨基酸 对的 测量 成为 一个二维 的 一个 距离 直方图。 然后 通过 卷积 神经网络, 这个 词 也是 比较 难懂 的。 它是 专门 图 处理 图像 的 一种 算法, 来 最后 构建 出了 蛋白质 的 一个 3D结构。
最近 的 一次 突破, 关键在于 它的 算法 进行了 一个 更新。 它 不再 使用 爵迹 神经网络, 而是 使用 了 一个 模仿 人类 注意力 的 一个 网络 架构。 它的 专有名词 叫 attention。 Attention 它 可以 聚焦 到 多个 细节 部位, 其实 主要 包括 两个 部分, 一个 是 神经网络, 一个 是 结构 模块。 在 神经网络 中 它 将 它的 一些 图 网络, 也就是 把 所有 这些 蛋白质 的 相关关系 列出 一个 图表, 然后 再 通过 和 多 序列 对比 完成 一个 结构 的 预测。 这是 神经网络 在 得到 神经网络 的 结果 以后, 就会 到 第二个 结构 模块 structure module。 然后 把 前面 得到 的 神经网络 的 信息 转换 成为 蛋白质 的 一个 3D结构。
在 这个 部分 它的 主要 突破 就是 使用 到了 我们 说 的 叫 attention。 Attention 就是 模仿 人的 这个 注意力。 我们 人的 注意力 不是 像 我们 想象 的 那样 比较 focus, 我们 其实 是 可以 注意 遇到 多个 细节, 多个 角度。 它 会 以 某个 原子 为 原点 来 构建 一个 3D的 一个 参考 槽。 然后 通过 对 预测 信息 进行 旋转 平移, 最后 得到 一个 结构 框架。 这个 确实 比较 晦涩 难懂 一点。
确实 好的, 我也 试图 消化 这个 信息, 张璐 就是你 你 刚刚 怎么 理解 国 才 刚刚 的 描述, 就是 alpha 4是怎么 去 做了 一个 跨越式 的 飞行, 找到 现在 地球 上 所有 已知 的 两亿 种 蛋白质 呢?
对我 觉得 其实 刚才 国 才 已经 给 了 一个 非常 详尽 的 解释 了。 就 整体 它的 一个 技术 的 一个 逻辑。 那 我 可能 多 稍微 解释一下, 也是 给 大家 更加 的 形象 的 讲 一下 刚才 国 才 提到 的 这个 新的 算法 attention。 一个 不 恰当 的 比喻 就可以看 成说 可能 以往 大家 想到 的 这个 机器学习 处理 数据 更多 的 是一个 pattern matching, 对 吧? 我们 看到 什么 去 比对。
但是 attention 它 更多 的 类似 于 我们 潜意识。 我们的 意识 的话 是 线性 的, 但是 我们的 潜意识 实际上 是在 同 时刻 多个 信息源。 它是 一个 立体 的 方式 去 帮助 你 做了 一个 判断 和 决策。 所以 很多 时候 我们在 日常 中 做 决策 的 时候, 大家 不一定 能够 通过 我们的 正常 的 意识 和 逻辑 去 看出来 我的 这个 逻辑 线 到底 是 怎么样。 我 就 突然间 觉得 我要 选 这个 数字, 我 买彩票 选 这个 数字, 然后 我 去 到 什么 地方 选 这个 颜色, 我要 选 哪 辆车, 走 左边 走 右边。
很多 时候 是 潜意识 在 帮助 我们 做 决策。 其实 潜意识 他的 大脑 的 计算能力, 处理 数据 的 能力 是 我们 正常 的 这个 意识。 我们 又是 sub conciousness 和 cautious, 其实 是 我们 cautious 的 几十万倍。 所以 大家 可以 从 这个 角度 就可以 理解 说 这个 新型 的 算法, 它 其实 是 把 无论是 处理 数据 的 能力, 它的 通量, 还有 包括 他的 三维 的 架构, 还有 包括 他 把 信息 整合 的 方式, 和 以前 都是 很 不一样的。
也是 这个 原因, 我们 可以 从 以前 可能 是 几十万个 这样的 一个 蛋白 结构, 是在 一年前 在 数据库 里, 到 现在 是 上 亿个 蛋白 结构 被 发现, 然后 被 完成。 所以 这个 实际上 是 一方面 是 算法 的 一个 提升, 但 另外 一方面 我 觉得 其实 也是 要 有一个 很 重点 的 强调。 就是 很多人 可能 会 下意识 的 觉得, 是因为 人工智能 的 技术 的 提升。 因为 只有 人工智能 能 达到 这样的 一个 数字 生物学 的 结果, 其实 有 一大部分 的 贡献 是 来自于 传统 的 或者说 是 已有 的 这些 结构 生物学家 所 积累 的 这么多年 的 经验, 积累 了 这么多年 的 数据。 这个 是 所有的 数据 算法 去 发展 的 机遇 的 一个 根本。 也是 在 过去 这么多年 的 很多 的 数据, 还有 信息 的 积累, 产生 了 一个 从 量变 到 质变 的 一个 阶段。
包括 如果 大家 去 看 deep mind, 他的 团队 在 开发 阿尔法 四 的 团队 里面, 当然 有 很多 非常 知名 的 人工智能 科学家。 但 有 很多 大部分 其实 是 蛋白 结构 的 生物学家。 所以 我 觉得 这方面 也是 希望 大家 可以 看到 的, 就是 我们在 应用 人工智能 的, 尤其是 偏向 医疗 生命科学 这个 方向 的 时候, 是 需要 两边 的 专家 将 各种各样 的 信息 和 专业知识 汇聚 到 一起, 才可能 在 最终 出现 像 阿尔法 fold 这样 非常 跨世纪 的 富有 变革性 的, 真的 会 改变 产业 未来 的 非常 有利 的 工具。
那 回归 到 落地 场景 里面 的话, 国产 你 会 觉得 比如说 刚刚 张伟 京 提到 alpha four 这次 一个 非常重要 的 做法 就是 他 免费 的 公开 了 他的 数据集。 允许 大家 去 允许 各国 的 科学家, 各个领域 的 科学家 和 研究 学者 去 使用 这些 数据, 研究 这些 数据。 这样 会不会 更快 的 加速 在 工业界 还有 学术界 相关 的, 不管 是 新药 研发 还是 疾病 研究 的 进展 呢?
这个 答案 我 觉得 是 肯定 的。 因为 这种 公开 自己的 算法 和 数据集 的 做法, 其实 是对 全人类 最大 的 一个 贡献。 就像 前面 张璐 提 的, 那些 枯燥 的 结构 生物学 变得 就 更加 易得。 好像 引用 施工 老师 的 说法, deep might 或者 up for d go 是 使得 每个 人都 可以 成为 一个 结构 生物 化学家。 我们 都 理解 从 D N A R N A 到 蛋白质, 它的 结构 是 属于 一切 物质 的 基础。 所以 他在 这个 公开 数据 的 做法, 在 深层 蛋白 模型 的 方面, 它是 一个 非常 巨大 的 作用。
而且 但 另 一点 我也想 提出 另一个 观点, 就是 其实 生物科学 和 医学, 我们 更多 的 它是 一个 实验 科学。 我们 预测 的 这些 结构 不仅 是 说 可以 去 设计 一些 新的 蛋白 结构, 而且 也会 促进 目前 已有 的 这些 实验 科学 的 一些 数据。 比方 我们 可以 看到 最近 的 这些 冷冻电 镜, 或者 X 射线 的 这些 数据 的 一些 理解, 也会 起到 一个 积极 的 一个 作用。
你 刚刚 提到 这 一块, 我们 其实 还有 挺 好奇 的 部分。 因为我 知道 这个 alpha 4在出来 之后, 其实 有 一部分 的 学术, 包括 外界 的 观察 认为 说 好像 现在 对的 评价 有点 过于 有 夸大 的 嫌疑 了。 比如 您 刚刚 提到 的, 可能 alpha 4现在 更多 的 是 会 关于 蛋白质 结构 的 预测, 但是 他 没有 办法 去 提供 实际 的 蛋白质 结构。 而 这个 可能 说是 比如说 我们 去做 核磁共振, N M R X 射线, 它是 可以 去 做到 的。 这个 数据 价值 可能 对 实验 科学 或者 是 实际 去做 新药 开发 的 研究 学者 来说, 可能 还是 有 一定 的 差距。 我不知道 你 怎么 理解 这种 质疑 和 说法。
因为 我们 研究 的 目的 不是 去 获得 一个 蛋白质 的 结构, 我们 更多 的 是 利用 蛋白质 的 结构 去 设计 一个 新的 药物 分子, 或者说 新的 一个 生物制品。 不是说 我们 有了 这些 所有的 蛋白质 宇宙 就 万事大吉。 这 里面 有 几个 观点。 第一个, 我们 看到 蛋白质 本身 它是 一个 比较 是一个 动态 的 一个 系统在 体内 它的 不同 的 条件下, 它 和 不同 的 小分子 化合物 在 不同 的 pocket 的 地方, 它 会有 不同 的 构象, 不同 的 结构。 而且 在 不同 的 怀孕 条件下, 它 也会 出现 不同 的 变化。 所以 我们 大家 可以 理解 这个 蛋白 结构 它 不是 像 我们是 水泥 钢筋 那样, 是一个 固定 的 一个 变化。
第二个 目前 业界 对于 阿尔法 four 的 这个 2.0 处理 的 结构, 它 还是 有一个 自信 的 区域。 这些 出来 的 结构 还是 需要 大量 的 实验室 的 这些 数据, 就像 灿灿 您 提到 的 用 X C N M R 这些 实验 数据 去 进一步 去 确认。 特别是 它 跟 不同 的 一些 小分子 化合物 和 蛋白质 结合 以后, 它的 构象变化 去做 进一步 的 解析。 阿尔法 D 只是 给 大家 起了 一个 最 开始 的 打开 了 一扇门, 但 门 后面 还是 有 这个, 我们 才 真正 开始 了解 蛋白质 的 它的 千姿百态 的 一种 变化。 从这一点 觉得 我 觉得 可能 阿法 ford 最终 到 实际 的 工业 应用, 还是 有 一定 的 距离。
张璐, 你 怎么 理解 alpha four 它的 所 提供 的 数据 价值?
我 觉得 首先 第一点 就是 价值 是 非常 巨大 的, 它 确实 是一个 非常 有 变革性 的 新的 技术。 但 同时 的话, 刚才 郭 才 也 提到 整个 其实 生物 行业, 它 其实 它 也是 有一个 上游 下游 的 阿尔法 fold, 它 其实 提供 更多 是在 上游 层面 上, 我 现在 给你 已经 预测出 了 这么 多 蛋白质 的 一个 结构, 那 它 对 下游 的 更多 的 接下来 的 那些 应用 就有 了 更强 的 意义。 但是 它 不能 替代 下游 的 每个 一个 步骤, 它 只是 在 上游 在 发挥 功能。 但 一方面 的话, 其实 就是说 现在 是 两 亿多个 蛋白质 结构 被 预测 到。 其实 不 只是 这样, 他 可以 非常 精确 的 预测 到 蛋白质 的 结构, 正式 精确 到 比如说 像 原子 的 精度 到 尺寸 到 分钟。 所以 这是 它 在 上游 层面 上 非常 巨大 的 一个 贡献。
但 另外 一方面 的话, 我记得 当时 deep mind 他们的 团队 也 对外, 当时 其实 表哥 他 也 说, 其实 现在 在 超过 他们 已经 预测出 的 2亿个 蛋白质 结构 中, 其实 大概 我记得 好像 是 30%。 35% 的 结构 是 具有 高精度 的, 它是 可以 通过 实验 手段 获取 的 这样的 结构 精度。 所以 就和 这个 传统 的, 比如说 低温 冷冻电 镜 获得 的 是 可以 是 相 比较 的。 但 80% 的 结构 的 可靠性 是 可以 用于 很多 后续 分析。 但 他 并没有 说 已经 精确 到 就 完全 是 高精度 的 实验 手段 获取 的 这个 精度。 所以 我 觉得 在 这个 层面 上, 大家 也 需要 有一个 理性 的 态度 去 看待 它。 当然 在 接下来 这几年, 我 也会 预期 它 会有 更多 的 一个 发展。
现在 我们 至少 说 有一个 很大 的 进步, 是 我们在 不需要 去 问 说 到底 是 什么样 的 蛋白 折叠 结构。 我们 现在 要 接下来 去 问 的 是 说, 这个 蛋白 折叠 结构 它 有 什么样 的 作用。 除了 作用 之外 的话, 我们 也要 看到 说, 比如说 像 很多 结构 生物学家, 他 除了 预测 这个 结构 之外, 他 做 完 之后 还要 再去 花 很多 的 时间 去 分析 它的 结构, 然后 再去 解释 它的 功能。 这 两步 就是我 刚才 说 的 下游, 我们 还需要 更多 的 投入 去做。
接下来 解释 它的 功能 之后, 我们 再进一步, 无论是 在 制药, 在 很多 我们 其他 提到 的 数字 生物学 层面 上 的 应用, 都 可以 去 持续 发展。 但是 大家 可以 想想, 以前 我们 需要 花 多少 时间 去 一个 一个 去 探索 出来 蛋白 的 结构 到 店。 现在 这 一步 基本上 已经 大部分 被 做 完了, 那 我们 就可以 更多 的 时间 和 资源 关注 到 接下来 这 几步。 所以 我 觉得 一定 要是 分 两步 去 看。 一方面 一定要 看到 说 这个 技术 的 先进性 和 他的 变革性。 同时 也有 一个 理性 的 预判, 就是 对 工业界 的 投入 以及 下一步 还需要 继续 做 的 工作 在哪里。
所以 其实 我们 既不 能够 简单 的 用 药物 开发 的 速度 和 新药 开发 的 数量 来 作为 一个 考量。 Alpha four 到底 有没有 对 实际 应用 场景 做出 巨大贡献 的 这样 一个 参考 指标。 同样 的 我们 也 应该 对 alpha 4在上游 做出 的 贡献 给出 一个 比较 客观 的 评价。 就是 它 确实 是 帮助 大家 去 解决 了 可能 最 无聊 最 繁琐 的 工作 那 一部分, 解放 了 大家 去 思考 其他 问题 的 一个 方式。
是的, 我 特别 喜欢 你说 那个 词 就是 解放。 因为 其实 阿尔法 fold 刚 出来 之后, 我记得 当时 我们 上次 讨论, 我 就 记得 那 一段时间 有 很多人 在 讲, 很多 媒体 也 在 讲说, 有了 alpha fold, 那 是不是 要 替代 掉 结构 生物学家, 结构 生物学家 要 失业 了。 但 其实 很 对 很 重要 的 一点, 其实 当然 是 替代 不了 的, 更多 的 是 说 他 解放 了 结构 生物学家, 可以 让 他们 时间 更 高效、 更 有效 的 花 在 像 我 刚才 提到 的 下一步 去 解构, 然后 去 解释 它的 功能, 然后 去 进一步 进行 下一步 的 下游 探索。 我 觉得 这个 是 非常重要, 是一个 解放。
我也想 开口 一下 张璐 的 说法。 我 觉得 阿富汗 四 的 出现 不在 他是 一个 突破, 是一个 解放。 但 我们 更多 的 觉得 M A ford 它 还是 一个 起点, 是一个 人工智能, 它 更多 的 是一个 工具。
对于 我们 人类 而言, 就像 刚才 讲 的, 我们 不再 需要 花费 巨大 的 精力, 巨大 的 物力, 还有 更多 的 resource 去 花 在 一个 蛋白质 的 一个 结构 上面。 我们 可以 向 下面 更 一步 的 去 发展。 我们 更多 的 是 感兴趣 的 是啊 有了 蛋白质 结构 以后, 蛋白质 的 它的 活性 位点 是 到底 是 在哪里, 他是 哪个 破开, 都 可以 和 我们的 药物 分子 去做 结构。 我们的 药物 分子 里面 是不是 可以 对 某个 蛋白质 分子 做到 它的 一个 策略 的 一个 改化。 比方说 一个 糖基化 甲基化, 那么 蛋白质 分子 它的 它 和 蛋白质 和 蛋白质 它 也是 有 这个 protein interaction 这个 作用, 也是 特别 感兴趣 的, 所以 我想 特别 echo 张璐 的 说法。 他 对于 我们 科学家 的 脑力、 人力、 物力 是一个 解放, 使得 我们 整个 人类 可以 把 更多 的 精力 去 投到 下一个 阶段 去做。 科学 无止境。
对, 是的。
休息时间 又 再次 插播 一条 关于我们 自己的 广告。 上周 我们在 生动活泼 的 公众 号 推 文 里面 发布 了 会员 专属 的 生动 胡同 一周年 活动。 科技 早知道 的 线上 会员 直播 活动 将在 下周 11月19日 的 中午 举办。 到时候 科 早 的 三位 主播, 我 Richard 和 徐 老师 会 分别 在北京、 伦敦 和 硅谷, 以 远程 连线 的 方式 跟 胡同 的 会员 们 见面, 分享 我们在 这一年 里 看到 的 创投 趋势, 以及 我们 各自 的 一些 职场 成长 经验教训。 另外 趁着 这一次 胡同 一周年, 我们 想要 给 订阅 的 新 伙伴 或者 续订 的 老街坊 们 准备 了 不同 的 优惠。 老街坊 的 续订 优惠 已经 通过 胡同 来信 发送到 了 各位 的 邮箱 里, 请 大家 注意 查收。 新的 伙伴 可以 查看 每期 节目 的 solo 和 公众 号, 了解 我们 solo 胡同 会员 的 订阅 方式, 欢迎 大家 持续的 支持。 生动活泼, 谢谢你们 的 慷慨 帮助 我们 持续 制作 优质 的 内容。
既然 alpha 4对上游 的 影响 这么 大, 那 自然而然 可能 就会 有一个 问题, 为什么 一直 我们 没有 看到 能够 在 影响力 和 知名度 上 和 alpha 4并称 的 这样 类型 的 产品 或者 技术 出来? 两位 是 怎么 看看 的?
其实我 可以 先 讲 一下, 因为 一来 是 说 这 确实 是一个 非常 困难 的 要 去 解决 的 一个 问题。 其实 像 最早 deep mind 去 参加 的 C S P 的 那个 比赛, 当时 也 不支持 有 deep 方案 的。 其实 当时 各 大 科技 公司, 像 比如说 微软, 他们 其实 都有 派 队伍 参赛。 只是 说 阿尔法 fold 是在 我记得 大概是 18年 的 时候, 最早 当时 应该 是 拿到 了 第一名。 后来 2020年 当时 是 alpha fold two 是 拿 冠军, 而且 是 产生 了 非常 大 的 一个 影响。 但 当时 其实 也会 看到 很多 其他 的 公司 也 在 参与, 只是 说 他们 无论是 从 算法 还是 说 从 结果 来看 是 最好的。
那 为什么 这么 难 呢? 一来 是 提到 说 首先 他 其实 对于 数据量 的 需要 是 非常 巨大 的, 而 这个 数据 也是 非常 昂贵 的。 一般 的 初创 企业 确实 很难 在 早期 可以 负担 这么 贵 的 数据。 你 首先 你 能不能 获得 这样的 数据, 这就是 一个 渠道 的 问题。 二来 是不是 有 这个 资金。
同时 我 刚才 也 提到 说, 阿尔法 的 团队 他 不 只是 只有 人工智能 科学家, 他 有 很多 结构 生物学家。 然后 也 需要 非常 资深 的 专业 的 结构 生物学家。 通过 他们 这么多年 的 知识 积累, 来 为 人工智能 算法 提供 它的 一个 基础 和 数据分析 的 一个 逻辑。 这样的 人才 其实 也 非常 的 屈指可数。
当然 谷歌 deep mind 他们 就 聚集 了 全世界 可能 最 顶尖 的 这样的 一批 人, 然后 将 最好的 信息 汇集 到了 一起。 他们 每年 的 成本 也是 巨大 的。 这些 人 无论是 他们 自己的 人力 的 成本, 还有 是 算 力 的 成本, 开发 的 成本 都是 巨大 的。 所以 我 觉得 无论是 从 技术 门槛、 资源 门槛、 数据 门槛, 还有 说是 资金 门槛, 确实 就 设 了 几个 很大 的 壁垒 在那里。 让 可能 其他 无论是 初创 企业, 甚至 说 其他 大 的 公司, 都 很难 做到 和 阿尔法 ford 去 竞争。 确实 我们 其实 在 市面上 也会 去 看, 确实 F F fold 现在没有 任何 的 和 他 可以 去 相近 的 竞争对手。
但 另外 一方面 也很 让人 很高兴 的 一件 事情 就可以 看到, 就像 我 提到 的, 自从 他们 在 内侧 的 文章 发表 之后, 他们 将 数据库 开源 了。 不仅 是 源代码 开源, 他 同时 把 整个 数据库 开源, 同时 做 的 如此 容易, 让 所有的 人都 可以 去 应用。 我 觉得 这个 真的 是对 整个 产业 的 一个 非常 大 的 贡献 和 推动。
樟 路, 我 这里 补充 一个 问题, 就 据 您 的 了解, alpha four 它的 算 力 成本 跟 人员 的 投入 成本 大概 会 是在 什么样 的 一个 量级 和 范围 呢?
算 力 成本 我 可能 不好 给 估计, 我知道 他 大概 人力 成本。 然后 deep man 的 现在 他 全球 可能 是 有 1000名员工, 大部分 的 这种 专家 都 是在 100万美美 金 左右。 100万美金 以上 有 虽然 可能 比 这个 还要 更高。 当然 1000名员工 中 也有 可能 说 一半左右, 他 可能 是 相对 薪酬 低 一点 的, 但 也 有些 人的 薪酬 非常 的 高。 所以 你可以 算 一下 他 每年 的 人力 成本 在 多少?
10亿左右, 十 亿美金。
对, 10亿美金 可能 到不了, 我 觉得 可能 就是 几 亿美金 左右, 然后 再加上 他的 算 力 成本 等等等等。
明白。 国 才 你 觉得 这 样子 的 团队 的 支出, 对你 自己的 观察 来说, 其实 也是 在 国内 很难 看到 有 与 之 相匹配 的 团队 的 能够 做到 这么 大 的 人力 成本。 因为你 提到 其实 上海 蟑螂 有 很多 在 做 这种 尝试 的 团队。 对我 倒是。
对 这个 问题 有 自己的 看法。 我 倒 不 觉得 我们 从 整个 科研 的 或者 什么 来看 的话, 需要 一个 竞 品 的 出现。 我 觉得 deep my 的 他 最伟大的 地方, 它 可能 是 就像 张璐 刚才 讲 的, 他是 集结 了 所有的 这些 投入, 还有 人类 科技 的 突破, 特别是 算 力 算法 和 数据, 它 在 恰当 的 时刻 出现了 一个 强大 的 一个 突破。 因为 这个 蛋白 这个 宇宙 出现了 一个 破局 者, 我 都不 觉得 人类 需要 这么 多 的 算法。
另一个 角度, 我们 更多 的 一个 竞 品 去 投入到 这个 工作 中 来, 我 觉得 deep my 的 这个 开头 也就 足够 了。 就像 我们 前面 聊 的, 我们 更多 的 是 往 向前看, 集中 在 下一个 阶段。 关注 在 国内 的, 尤其是 在 上海 药谷 这个 方面, 大家 其实 人工智能 的 公司 主要 集中 在 还是 做 药 的 这个 方面。 他们 更多 的 是 关注 是 如何 去 找到 一个 合适 的 靶点。 找到 靶点 以后 如何 发明 一个 全新 的 化合物, 或者说 然后 发现 这个 化合物 以后, 怎么样 设计 好 临床 的 方案, 来 提高 临床 的 成功率。 所以 就像 我们 刚才 讲 的, 这种 最 上游 的 或者 是 基础科学 的 一个 研究, 更多 的 是一个 结合 人类 的 或者 最 先进 的 科技, 有有 几个 突破 也就 足够 了。
有一个 团队 把 基础 打好, 给 大家 一起 用 就行了, 对 吧? 更多 团队 应该 在 其他 的 层面 做对。
是的。 因为 其实 就像 我 刚才 提到 的 非常 伟大的 一点, 也是 非常幸运 的 一点 是 他们 现在 把 所有 东西 都 开远 了, 那 我们 为什么 还要 去 找 精品 呢? 就 可能 不 恰当 比喻, 就像 互联网 免费 给 大家 使用, 然后 大家 在 这个 基础 之 上去 建立 各种各样 的 应用 一样。 那 现在 deep mind 其实 把 这个 开源 之后, 大家 所有人 都 可以 使用 这样的 一个 巨大 的 非常 强有力 的 数据库, 然后 同样 可以 下载 数据, 同样 可以在 这个 基础 上去 进行 下游 的 各种各样 方向 的 一个 开发。 所以 我 觉得 这是 他 最大 的 意义。 其实 就是 像 刚才 提到 的, 为 我们 下一步 的 数字 生物学 奠定 了 一个 新的起点 和 基础。 在 这个 基础 之上, 我们 所有人 都 往 上 迈 了 一大步, 可以 去 更快 的 把 一些 好的 应用 做出来。
如果我们 给 些 具体 的 想象 未来 的 想象 空间, 那 我 可能 先请 郭 才 来 提 回答 一下 这个 问题 好了。 我们 如果 alpha 4他已经 把 这个 基础 都 搭 好了, 我们 未来 在 哪些 时间段 会 看到 说 在 药物 的 这个 领域 里面 会有 一些 非常 细小 的 进展, 是 很快 我们 就能 看到 它 落地 的。 不管 是在 国内 还是 在 海外。
其实 这 是一个 很 好的 问题。 对 这个 问题 大家 有 正面 的 反馈, 也有 谨慎 的 态度。 我自己 觉得 大概 在 三五年 之内, 我们会 会 特别 受益 于 阿尔法 ford 的 这个 突破。
下面 一步 讲到 就是 我们 有了 蛋白 结构。 如果 利用 蛋白 结构 把 它 做成 一个 药物 预测 蛋白 结构, 也就是 新药 研发 的 第一步。 我 觉得 是 下面 一步 可能 我们 就会 用 另外 的 人工智能 的 场景。 根据 蛋白 结构 和 小分子 配体 会 建立 药效 模型, 然后 利用 药效 模型 来进行 虚拟 的 筛选, 得到 虚拟 化合物。 再 把 上面 的 这个 化合物 再 抛开 到 这个 靶 蛋白 上, 把 它 进行 综合 评估, 最后 合成 出 实际 的 化合物 进行 活性 筛选。 活性 筛选 以后 最后 得到 lead compound, 最终 lead compound 进行 测试, 进入 动物 实验, 最后 到 临床实验。
我 刚才 讲 的 这些 蛋白 结构 以后 的 这些 步骤, 目前 我知道 在 国内, 在北京、 上海、 广州, 我们是 有 很多 的 非常 先进 的 公司 在 做 这些 工作。 所以 我的 结论 是 阿法 port 使得 以前 特别 难以获得 的 这些 蛋白 结构 变得 简单化。 简单化 以后, 后面 的 这些 步骤, 我们是 有 已有 的 经验, 也有 的 产业 是 可以 去 对接 的。 在 制药 的 早期 的 临床 前 的 开发 领域, 我会 预见到 他 会 是一个 井喷 的 一个 现象。
我想 我 好奇 他 井喷 的 那个 时间点, 现在 你们 业界 是 会有 一个 判断 吗?
其实 另外一个 角度 可以 给 大家 讲, 就是 为什么 大家 特别 于 最新 一个 人工智能 呢? 我们 讲到 传统 的 制药 行业, 其实 跟 人工智能 是 自相矛盾 的 一个 行业。 因为 我们 传统 的 制药 行业 它是 一个 实验 科学, 我们 更 讲 的 是 数据 说话, 然后 就是你 最终 的 结果 来看, 我们 也 知道 每年 的 有 很多 的 高等级 的 文章, C N S 上 发表 的 文章 到 最终 到 药物 领域 都 证明 是 不对 的。 所以 这个 原因 是什么 呢? 也就是 我自己 的 理解, 就是 实际上 它是 一个 传统 与 现实 计算 科学 与 实验 科学, 高速 迭代 和 慢工出细活 这 两个 方面 的 一个 矛盾 点。
我 特别 谨慎 的 把 它 这个 井喷 时代 归结为 在 这个 临床 前 或 临床 早期 的 一个, 所以 我 觉得 阿尔法 狗 它 对于 这个 人工智能 用于 早期 化合物 的 发现, 它是 具有 决定性 意义 的。 但是 对于 临床 阶段 的 应用, 我 还是 持 比较 谨慎 的 态度。 我们 也 在 看到 周围 的 一些 公司, 把 互联网 的 一些 或者 迭代 的 一些 速度 应用 到 药物 上面, 可能 它 会 出现 一些 奇迹。 以往 我们 药物 行业 可能 需要 三年、 五年 会 找到 一个 先导 化合物。 人工智能 可能 也就 三五个 月, 就会 找到 这样 一个 化合物。 但是 有一点 我想 指出, 目前 还没有 一 没有 一例 人工智能 设计 要 到 获 批, 大部分 都 处于 临床 前 阶段, 有 少数 的 处于 早期 临床 阶段。 我们都知道 临床 的 二期 是一个 关卡, 有 大概 40%到50% 的 分子 会 在 临床 2A的 这个 阶段 会 被 kill 掉。 所以 我 觉得 还是 他 开 了 一扇门, 但是 后面 还需要 有 很多 的 工作 去做。
国 才 我 觉得 非常 详细 了, 张路 你 怎么 想? 刚刚 国 才 的 这个 反馈。
对我 补充 一下, 国 才 最后 讲 到了 临床 这 一部分。 这个 其实 也是 确实 我 觉得 很多人 可能 不了解 制药 行业 会 误会 的 一点。 因为 我们 也会 有些 时候 在 硅谷 碰到 纯 人工智能 背景 的 这样的 创业者。 他 可能 会 想说, 我 所有的 过程 都 通过 人工智能 去 智能化。
然后 包括 说 后期 的话, 临床 是不是 有 一些 用 合成 数据模型 就 去做 一些 替代, 但 现实 是 不太可能 的。 因为 一方面 的话, 当然 技术 有 它 技术 的 先进性。 但 另外 一方面 我们 还是 要 意识到 现在 人工智能 技术 和 我们 真正 的 人脑 的 智力 水平, 还有 包括 我说 我们 人体 的 复杂度, 它 还 是不是 在 一个 量级 的, 它是 没有 办法 进行 模拟 和 替代 的。 所以 从 阿尔法 四 的 角度, 它是 上游 提供了 这样的 一个 非常 好的 工具。 我们 节约 了 在 上游 的 时间, 但是 在 下游 的 每个 步骤 一步 还是 不能 缺少, 还是 要 一步一步 去 走。 所以 我 觉得 还是 要 去 尊重 这样 一个 产业, 它 正常 的 产品 开放 的 一个 周期。
甚至 说实话 这个 可能 有些人 同意, 有些人 不 同意。 但 我们 经常 聊 在 医疗 领域, 在 生物医学 领域, 有些 时候 在 临床 过程中 很多 参数 的 调节, 它 也 不是 我们 开玩笑 讲说 它是 art and science, 对 吧? 它 也 不是说 完全 是一个 science 层面 上 的。 我不知道 郭 才 有没有 这种 感受。 所以 在 这个 过程中, 你的 不停 的 过程 的 调节, 过程中 积累 的 经验 数据, 你 都是 没有 办法 通过 人工智能 去 进行 一定程度 的 辅助 的。 所以 我 觉得 这个 也是 大家 需要 认识到 的 一点。
刚才 你 也 问 到 说 alpha fold 是不是 有 一些 其他 的, 包括 现在 我们 看到 近期 的 一些 潜在 的, 接下来 两三年 的 会 产生 一些 应用, 我们 还是 非常 非常 期待 的。 因为我 觉得 一来 是 它 大大降低 了 大家 在 数字 生物学 这个 领域 创业 创新 的 一个 成本 和 门槛。 因为 之前 你 想 没有 一个 公司 或者 一个 企业 可以 有 这么 大 的 成本 投入 去 有 获得 这样 一个 有利 的 工具。 但 现在 这个 工具 大家 都 可以 用了, 利用 这个 工具 可以 去 做什么? 这就是 下一步 每个人都会 去 探讨 和 探索 的。
哪些 可能 是 对于 商业 应用 更 近 一点。 比如说 一个 很 简单 的 方式 就是 可以。 我记得 前一段 也 跟 一些 创业者 有 聊到, 他们 就可以 通过 现在 afford 的 这个 数据库, 可以 快速 去 在 上面 做 一个 软件工具, 去 找到 结构 了 相似 的 蛋白质。 这 其实 就可以 帮助 我们 更快 去 认识到 这些 蛋白质 和 彼此 的 关系, 他们 有 各种 特性 的 蛋白质 的 一个 进化 过程, 然后 包括 去 通过 相似 结构 的 蛋白质 去 理解 这个 你 可能 一个 是 已知 的 一些 特性, 另外一个 未知 的 特性, 可以 去 查明 它的 一个 特性 的 一个 基础。 甚至 说 比如说 比较 近 的 就是 要 了解 一下, 是不是 跟 那些 导致 癌症、 致癌 的 东西 相关, 去 了解 一些 我们 可能 日常 中 去 看到 的 一些 疾病, 它的 诱发 的 一些 因素 和 原因。
另外 的话, 就是 我们 刚刚 经历 的 这个 大范围 的 疫情。 在 未来 如果 再 出现 大量 的 大规模 发生 的 流行病、 传染病 的 时候, 我们 也可以 快速 的 通过 这样的 一个 比对。 现在 我们 已经 有 2亿个 这么 巨大 的 一个 蛋白质 结构 的 一个 数据库。 可以 进行 快速 的 比对, 快速 的 去 进行 它的 特性 的 寻找, 快速 的 开发 出来 相关 的 一些 特性 的 疫苗 等等。 所以 我 觉得 这个 都是 我们在 未来 这几年 就会 看到 很多 的 商业 应用 会 在 这个 方向 去 发力。 很 可能 也会 很快 的 进入 到 现实 的 这个 市场 应用 中。
你 刚刚 提到 的 一些 疾病, 就 比如说 像 阿尔兹海默症 这种, 就是 你可以 对 它的 蛋白 再去 做 进一步 的 研究, 并且 开发 出 相对 应 的 合适 的 新药。
对, 当然 因为我 其实 投 很多 关注, 比如说 阿兹海默症, 就是 认知障碍 这方面 的 一些 各方面 的 技术 发展。 核心 的 是 过去 这 几十年 确实 技术 发展 比较 缓慢。 当然 现在 阿尔法 fold 会给 它 进行 很大 的 一个 推动, 但 真的 到 把 像 制药 这一 层面 的话, 可能 还是 需要 比较 多 的 时间, 不是 一点 时间。
因为 我们 现在 其实 还 一个 很大 的 问题是, 我们 并没有 清晰 的 能够 去 了解 不同 的 人 得了 这个 阿兹海默症 之后, 他的 诱因 到底是什么。 其实 不同 的 人 他 得 同样 的 疾病, 他的 诱因 可能 是 完全不同 的那 因为他 诱因 不同 的话, 他 整个 疾病 的 进程 也是 很 不一样的。 有些人 进展 的 很快, 有些人 进展 的 很慢, 为什么? 这个 其实 都是 有 很多 个性化 的 东西 在 里边, 所以 哪怕 说 我们 现在 有 阿法 fod 可以 去 看 这些 蛋白 的 特性, 但 这个 蛋白 特性 可能 不是 他 唯一 的 一个 诱因。 所以 你 可能 说 只是 去 定向 治疗, 他 不一定 能够 对 每个 人都 有效。 当然 这个 要 展开 讲会 是一个 比较 大 的 话题, 当然 是 有 希望, 但是 可能 在 这个 领域 还是 需要 更多 的 工作 去 进行 投入 和 开发。
那 是否 合适 下一个 这样的 判断, 即便 alpha 4它再 持续的 去 突破, 在 实际 的 应用 场景 里面, 除了 我们 现在 知道 的 这些 大家 有 关注 的 热点 之外, 要 出来 更快 的 新的 投资 热点。 不同 的 投资 热点 可能 未必 短时间 内 我们 能够 看到。
其实 还是会 看到 的。 我 觉得 其实 很 重要 的 一点, 我们 作为 投资人, 包括 尤其是 在 医疗 领域 深耕 这么多年 投资人 来讲 的话, 非常 希望 看到 的 一点 就是 这个 领域 可以 吸引 更多 优秀 的 人才, 更多 大量 的 资金 来 投入。 那 现在 阿法 fold 它 不仅 降低 了 创新 的 门槛, 它 也 吸引 了 更多 人的 一个 兴趣 和 注意。 而且 我 觉得 很多 时候, 比如说 我们 每个 人都 有 自己 思维 的 一个 定式, 然后 用 我们的 局限性, 那 可能 我们 一直 在 生物 医疗 领域, 那 可能 想到 的 各种各样 的 应用 和 看 问题 的 角度 是 局限 的那 如果 吸引 各种各样 不同 背景 的 人 进来 到 的 这个 领域 去 探索 数字 生物学, 然后 用 阿尔法 这样 一个 有力 的 工具, 很 可能 我们 看到 的 商业 应用 的 角度 会 和 我们 以前 想象 的 都 不一样。 所以 我 觉得 我 还是 非常 乐观, 而且 非常。
期待 的对。 尽管 我们 前面 讲 对 阿尔法 负 的 从 正面 的 意义 和 它的 局限性 做了 很多 的 讨论, 可能 我 更多 体现 在 它的 局限, 它的 上游 的 方面。 但是 我 个人 其实 特别 乐观, 我 觉得 afford 他 真的 是 他 打开 了 一个 宇宙 的 大门, 我 个人 对 投资 没有 太多 的 接触, 但是 从 科学 的 角度 和 产业 的 角度, 我 觉得 它 打开 了 无数 的 想象力。
我们 以前 大家 都 停留 在, 其实 大家 都是 struggling 在 一个 蛋白 结构。 你 想象 我们 现在 很 容易 灿灿 你 都 可以 拿到 一个 蛋白 的 一个 跨 膜蛋白 的 一个 结构。 那你 就 想 这个 蛋白 结构 它是 到底 是 如何 去 引发 那个 疾病 的 呢?
我记得 上次 我们 讲 过 两个 蛋白质 的 结合。 我们 要 研究 一个 小分子 抑制剂 去 阻止 两个 蛋白 的 结合。 我们 举例 为是 两头 大象 在 打架, 我们 要 研发 一个 蚂蚁 去 阻止 他们 打架。 这些 可能 我 觉得 包括 蛋白质 和 这些 蚂蚁 之间 的 怎么 它是 到底 结合 在 哪个 位点 呢? 我们 举 个 例子, 蚂蚁 不可能 去 抓住 大象 的 鼻子, 它 可能 抓住 某 一个 位点 就会 阻止 它的 结合。
或者 两个 蛋白质 它的 结合 是什么 呢? 蛋白质 和 D N A 它 有没有 结合? 蛋白质 和 R A 它的 复杂性, 还有 刚才 张璐 讲 的 我们 对于 C N S 的 神经 退化 性疾病, 还有 对于 我们的 老大难 问题, 我们的 抗生素 的 研发, 还有 我们的 新冠 病毒 留下 的 如何 更快 的 去 开发 出新 冠 药物, 或者 我们 现在 最 流行 的 M R A 药物 的 研发。 以前 大家 想象 这些 都会 被 一个 你知道 蛋白 的 结构。 现在 我们 进入 了 一个 全新 的 一个 领域, 全新 的 宇宙。 所以 我 觉得 从 科学 上 看我 能 看到 这些, 我 觉得 投资 人们 也 肯定 能 从 中间 找到 不断 的 新的 兴趣 点。
对我 可能 想 再就是 也 补充 一下。 因为我 觉得 可能 大家 刚 开始 我们 就是 聊到 有 2亿个 蛋白 结构 被 发掘。 有一点 我也想 提到 说, 它 不 只是 动物 的 蛋白 结构, 其实 它 也 覆盖 了 像 植物, 还有 包括 像 细菌, 还有 包括 像 真菌、 微生物, 蛋白质 结构。 因为 其实 我们 也 最近 一直 在, 就 过去 几年 看 一个 方向, 那 就是 合成 生物学。 所以 我 觉得 从 这个 角度 的话, 其实 合成 生物学家 对于 他们 来讲 也是 一个 非常 好的, 非常 有利 的 工具。 现在 合成 生物学 这方面 的 商业 应用 还有 发展 也是 非常 快速 的。 而且 尤其是 我们 现在 讲 就是 像 植物, 真菌 相关 的 一些 合成 生物学 的 一个 进展, 其实 都 可以 被 大大的 推动。 所以 就像 刚才 提到 的, 就是 解放 了 大家 的 想象力 和 生产力。
从 结构 生物学家 的 角度, 从 合成 生物学家 的 角度, 到 整个 生物 数字 生物学, 我是 非常 期待 接下来 三四年, 而且 我也 相信 这个 领域 会 是一个 孕育 大 机会 的 领域。 也 特别 希望 今天 如果 很多 无论是 创业者 还是 投资人 在 听 这个 节目 的话, 可以 更多 的 关注 和 更多 的 去 投入。 我们 还是 需要 更多 的 人才 进来。 我 觉得 其实 资本 总是 有的, 其实 最 缺 的 还是 人才, 而且 尤其 缺少 的 是 跨行业 的 人才。 不是说 只是 单纯 从 它是 一个 生物学 背景, 或者说 纯 人工智能 背景。 而是 希望 可以 激发 更多, 就像 deep man 的 阿肆 的 团队 一样, 这 两批 可能 背景 完全 不一样的 人, 甚至 说 以前 可能 交互 不多 的 人, 可以 去 形成 一个 非常 强有力 的 团队 去 进行 各方面 的 应用 的 发展。
两位 觉得 在 of a four 还没有 能够 解决 的 问题 里面, 我们 说 A I 加 生命科学 未来 他 想要 解决 的 行业 痛点 还 会有 哪些? 不论是 对 工业界, 还是 对 投资人, 还是 对 创业者 来说。
制药 行业 的 痛点 可能 和 我们 这个 芯片 行业 刚好 翻过来, 我们是 遵循 的 一个 道 摩尔定律。 也就是 我们的 出 成果 会越来越 难, 成本 会越来越 高, 研发 的 周期 会越来越 长。 所以 这个 时候 行业 的 一些 痛点, 我 觉得 阿尔法 狗 的 这个 出现, 我们 刚才 已经 讲 过, 他 至少 在 早期 临床 阶段, 它 开发 了 一个 起到 了 一个 决定 作用。 我们 也 看到, 可能 在 未来 的 3到5年, 或者 现在已经 有 人工智能 的 公司 在 早期 阶段 起到 了 降本增效 的 作用。 而且 这个 痛点, 我们 也 看到 越来越多 的 数据 的 计算 的 科技 巨头 像 谷歌、 微软, 像 我们 中国 的 华为。 腾讯、 百度、 字节 跳动 越来越 觉得 去 要 去 加入到 这个 制药 行业。 用 计算 的 数据 的 结果 想 去 颠覆 这个 制药。 我自己 个人 还是 蛮 期待 两方面 的 碰撞, 去 解决 传统 制药 行业 的 这些 痛点 的。
会有 新的 F 跑 出来 吗? 就是 下一个。
up for 的。 我自己 其实 刚才 听到 张璐 讲 了 一个 名词, 合成 生物学。 我 课程 是 比较 觉得 乐观, 在 合成 生物学 的 这个 领域 会有 一个 下一个 阿尔法 ford 会 出现。 因为 刚才 张璐 也 提到, 我们 现在 的 科学 不是 一个 单一 的 一个 学科, 更多 的 是 需要 一个 复合 的 人才, 需要 去 碰撞、 去 交流, 去做 一些 事情。 回到 合成 生物学 的 一个 本身, 它 本身 就是 一个 交叉学科。 它是 基本上 有 生物学、 化学计算 科学、 生 信息学、 材料 学等 多个 学科。 它是 用 一个 工程 的 思维 去 理解 一个 合成 生物 的 一个 过程。
其实 人工智能 已经 在 合成 生物学 的 领域 已经 在 发挥作用。 但是 这个 还 停留 在 传统 的 算法 的 这个 阶段。 我 觉得 这是 阿尔法 ford 的 一个 突破。 或许 对于 人 人工智能 在 合成 生物学 领域 的 发展 的 能起到 借鉴 的 作用。 而且 合成 生物学 领域 它 会 集合 实验室 自动化 这 一条, 它是 又有 这个 理论 的 预测, 又有 实 用 实验室 自动化 的 实践。 这个 我 觉得 比较 乐观 的, 可能 在 3到5年 之内, 我们会 看到 在 合成 生物学 领域 会 出现 一个 巨大 的 突破。
国 才 他 怎么 跟 实验室 自动化。
结合 在一起 我们都知道 这个 所谓 的 人工 生物学 方面, 它 其实 有一个 基本 的 一个 循环, 叫做 D B T L 人工智能。 它 会 产生 一个 设计 实验室 自动化 帮忙 他 去 验证 这 它的 设计 是否 合理。 然后 反馈 会给 人工智能 加上 人工智能 它 本身 的 一个 算法 和 数据库 的 一个 不断 的 扩展 扩容。 可以 想象 它是 一个 正向 的 一个 迭代 的 一个 过程。 正向 迭代 的 过程, 我 觉得 可以 想象 我们 刚才 看到 阿尔法 for d 2.0, 它的 主要 突破 就是 它的 一个 算法 和 它的 数据库 一个 突破。 所以 如果我们 可以 mimic 这个 阿尔法 获 的 成功 的 路径 的话, 我 觉得 在 合成 生物学 领域 也会 出现 下一个 重大 的 突破。
有意思, 张路 你 怎么 想?
对我 非常 同意 国 才 老师 讲 的。 而且 我 可能 会 更 乐观 的 觉得, 不仅 会 出现 合成 生物学 呼吸 像 阿尔法 四 的 这样的 一个 量级 的 创新, 它 可能 会 出现 很多 个 加尔 法 fod 这样的 一个 不同 领域 应用 的 非常 具有 变革性 的 创新。 而且 在家 这几年 可能 很快 会 涌现。
而且 我 觉得 其实 非常 同意 刚才 郭 才 提 的 一点, 就是 它是 一个 正向 反馈。 那 我们 经常 讲说 你 用 人工智能 核心 是什么? 是 高质量 海量 的 数据。 现在 阿尔法 fold 通过 这样 一个 巨大 的 数据库 结构 的 这么 多蛋白 结构, 它 又是 一个 海量 的 数据, 可以 支持 下一步 的 算法 的 进一步 的 升级。 包括 在 这个 过程中, 这些 数据 也会 去 支持 这些 结构 生 数学家 去 进行 传统 实验 的 过程中, 获得 更加 精确 的 数据。 所以 这 是一个 越来越 正向, 越来越 加速 的 一个 进展 的 方式。
所以 我 觉得 其实 我们 现在 可能 可以 把 现在 这个 时刻, 我们 拥有 了 alpha fold two 这样 一个 巨大 的 数据库 工具, 用 工具 看作 一个 这个 行业 的 一个 拐点。 那 在 拐点 之后 的话, 它 就 不是 一个 线性 的 增长 了。 接下来 这几年 它 会有 一个 指数 性 的 增长, 而且 它 会 分叉, 分叉 到 各种各样 不同 的 层面 的 应用。 所以 合成 生物学 非常 看好 alpha fold two 的, 它 本身 的 工业界 应用 也 非常 看好。
那 我们 就 一起来 期待 一下。 因为我 觉得 上一次 从 F4 one 到 two, 然后 再再 到 现在, 它 解构 所有的 这种 已知 蛋白质, 其实 它的 更新 和 迭代 速度 是 越来越快。 没准 六个月 之后 又有 新发现, 到时候 我们 再 邀请 国 才 张路 一起来 帮 我们 看一下, 在 那个 阶段 我们 到底 能不能 看到 A I 在 科学 里面 alf 4还能为 我们 创造 什么样 的 想象 空间, 还有 哪 一些 有意思 的 玩家 可以 让 我们 打开 链接。 今天 就是我 觉得 节目 我们 聊到 这儿 已经 非常 充分 了, 也很 感谢 郭 才 和 张璐 的 时间, 希望 有 机会 可以 再再 找 两位 再 多 聊 一 聊。
好的, 谢谢。
这 期 what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G 艾特 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。
如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是 添加 声 小 音 小助手 的 微信, 声 F M1 数字 的 一 备注 早知道 听众 群 就可以 加入。 期待 你的 加入, 我们 下期 见。