We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S6E37|如果 AI 就能解锁蛋白质,世界还需要结构生物学家吗?

S6E37|如果 AI 就能解锁蛋白质,世界还需要结构生物学家吗?

2022/11/9
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
刘灿
国才
张璐
推动太空投资和提供深入行业分析的风险投资专家。
Topics
刘灿:AlphaFold 的出现引发了结构生物学家是否会被取代的讨论,AlphaFold 在蛋白质结构预测领域的突破速度远超以往,改变了生命科学领域的研发速度。 国才:AlphaFold 等人工智能技术正在改变药物研发模式,从实验科学向计算科学和合理设计转变,数据驱动取代了经验驱动。人工智能在药物研发各个环节参与,主要集中在药物发现阶段,包括靶点发现、先导化合物筛选和化合物优化。AlphaFold 开源算法和数据集对全人类做出了巨大贡献,加速了新药研发和疾病研究的进展。AlphaFold 的预测结果可以促进对现有实验数据的理解,例如冷冻电镜和X射线数据。AlphaFold 提供的蛋白质结构预测结果需要结合实验数据进行验证,不能完全替代实验手段。 张璐:AlphaFold 的开源数据库和代码促进了其在科研和商业领域的应用,降低了使用门槛,推动了数字生物学的商业应用。AlphaFold 数据库易于使用,降低了不同背景学者使用门槛,推动了数字生物学的商业应用。AlphaFold 新算法“attention”类似于人类潜意识,能够同时处理多个信息源,提高了数据处理能力和预测精度。AlphaFold 的成功离不开传统结构生物学家多年积累的数据和经验,是数据积累的质变。 AI 在生命科学领域的应用需要人工智能科学家和生物学家的合作。AlphaFold 提供高精度蛋白质结构预测,但并非所有预测结果都达到实验精度,仍需结合实验数据。AlphaFold 降低了研究者的时间成本,使其能够将更多精力放在蛋白质结构功能分析和下游应用上。不能仅用药物开发速度和数量来评价 AlphaFold 的贡献,需理性看待其在不同阶段的价值。AlphaFold 并非取代结构生物学家,而是解放了他们,使其能够专注于更高级别的研究。AlphaFold 的成功源于其巨大的数据量、资金投入和顶尖人才团队,这构成了高昂的进入门槛。AlphaFold 开源数据库为数字生物学奠定了基础,促进了下游应用的发展。AlphaFold 降低了数字生物学领域创业的门槛,促进了商业应用的发展。AlphaFold 数据库可用于开发软件工具,加速蛋白质特性研究和疾病研究。未来几年,数字生物学领域将涌现多个 AlphaFold 级别的创新,应用范围广泛。 国才:不必追求 AlphaFold 的竞品,其开源性已足够推动行业发展,更多团队应专注于下游应用。在未来三到五年内,药物研发领域将显著受益于 AlphaFold 的突破,尤其在临床前和早期临床阶段。AI 在药物研发中的应用存在矛盾点:计算科学与实验科学、高速迭代与慢工出细活的矛盾。AI 无法完全替代药物研发中的临床试验阶段,因为人体复杂性无法完全模拟。AI 有望解决制药行业研发成本高、周期长等痛点,并促进与科技巨头的合作。合成生物学领域有望出现下一个 AlphaFold 级别的突破,AI 与实验室自动化的结合将加速其发展。 张璐:DeepMind 的人力成本巨大,每年可能达到数亿美金。

Deep Dive

Chapters
This chapter explores the impact of AlphaFold on pharmaceutical research, discussing its role in accelerating drug discovery and development. Experts from Pfizer and Fusion Fund share their perspectives on AlphaFold's capabilities and limitations.
  • AlphaFold's impact on traditional drug development is significant, shifting the focus from experimental science to computational science and data-driven approaches.
  • AlphaFold's database is publicly accessible, lowering the barrier to entry for researchers and entrepreneurs.
  • The technology is already being applied in various fields, including vaccine development and tackling antibiotic resistance.

Shownotes Transcript

用 声音 碰撞 世界。

生动活泼。

Hello, 大家好, 我是 丁丁, 欢迎 收听 全新 一期 科技 早知道。

Hello 大家好, 我是 刘灿。 在 上周 的 选题 会上, 科技 早知道 的 主创 团队 在 讨论 一条 非常 有意思 的 新闻, 就是 国内 最受 关注 的 结构 生物学家 之一 颜宁 教授, 他 宣布 即将 辞去 普林斯顿大学 的 教职 并 正式 回国。 那 关于 他 辞职 回国 的 原因, 目前 确实 有 很多 猜测。 一种 比较 有趣 的 说法 是, 结构 生物学家 可能 很快 会 被 alpha 四 这样的 人工智能 所 取代。 那 alpha 4其实 是 谷歌 旗下 的 曼 团队 所 开发 的 一款 蛋白质 预测 的 模型。 关注 科技 早知道 的 听众 一定 不 陌生, 因为 从 2020年 他 第一次 成功 预测 蛋白质 结构, 我们 就在 聊 它。 到了 今年 的 7月28日, F A 已经 成功 的 解锁 了 地球 上 所有 已知 生命体 的 蛋白质 预测 结构。 在 此前 结构 生物 领域 其实 大部分 的 重要 课题 都是 10年 才有 一个 重大成果 出现, 所以 今年夏天 alpha 4的这个 新发现 其实 也 让 很多人 感慨。

而 仅仅 过了 三个月, 在 推特 上 meta 的 首席 科学家 杨立 坤, 他 则 分享 了 他们 团队 开发 的 新的 模型。 这个 模型 目前 是 可以 预测 超过 6亿种 蛋白质。 据说 这个 量级 以及 它的 预测 速度 都是 远超过 alpha 我们 就 觉得 像 结构 生物学 领域 的 这种 进化 速度, 在 没有 算法 的 时代 其实 是 非常 难以想象 的。 而 本期 的 节目 是 九月份 我 和 硅谷 投资人 张璐, 还有 辉瑞 研发部 的 国 才 讨论 当下 的 这个 时点, 该 如何 理解 alpa 四 这样的 人工智能 去 给 生物制药 领域 带来 的 影响。 我们 觉得 这些 讨论 内容 其实 在 当下 这个 场景 可能 可以 给 大家 提供 一些 有趣 的 思考 角度, 所以 就有 了 本期 节目, 欢迎 大家 的 收听。

大家好, 我是 国 彩, 来自 辉瑞 研发 药物 科学 部门。

大家好, 我是 张璐。 很高兴 今天 又 可以 来 和 大家 继续 讨论一下 过去 这 短短的 一年 时间, alpha ford 给 我们 带来 的 一些 新的 技术 上 的 突破 和 给 我们 未来 带来 的 商业机会。

首先 我可以 快速 的 问 一下 两位, 你 觉得 有 哪些 工作 你们 现在 是 看到 说 alpha four 已经 在 影响 你们的 投资, 或者 是 影响 你们的 这个 工作 呢? 我想 请 国泰 先来 聊聊 好了。

因为我 来自 辉瑞, 我 接触 的 工作 大部分 都是 和 药物 的 发现 研究 相关 的。 所以 阿尔法 四 的 这个 突破, 或者说 相关 的 人工智能 领域, 使得 我们 传统 的 药物 研发 的 模式, 正在 发生 一系列 也 天翻地覆 的 一个 变化。 总的来说, 从 以前 的 一个 实验 科学, 从 一个 随机 筛选 会 过渡到 一个 计算 科学, 到 一个 合理 的 设计。 前面 的 更多 依靠 人的 经验 会 转移到 一个 数据 驱动。 从 最初的 final top screening 也是 人工 驱动, 所以 过渡到 我们 以前 讲 过 的 C A D D 计算机辅助 设计。 那么 随着 阿尔法 狗 和 人工智能 的 出现了 药物 的 一个 设计 和 发现, 会 逐渐 过渡到 一个 新的 名词 叫 A I D D, 也就是 人工智能 辅助 药物 设计。

总的来说 药物 阿尔法 狗 和 人工智能 在 药物 研发 的 各个环节 都在 逐步 参与, 最 主要 的 目前 还是 集中 在 药物 discovery 阶段。 从 靶点 发现 确定 八点 以后 确定 找 的 一个 先导 化合物。 然后 在 谢 的 化合物 确定 以后, 去 对 谢 的 化合物 进行 优化, 最终 筛选 出 一个 最优 的 药物 分子 的这 几个 方面, 我 看到 阿尔法 狗 和 人工智能 正在 起到 一个 非常 关键 的 一个 作用。

所以 国 才 您 的 说法 我 简单 的 理解 一下, 就有 可能 是在 新药 开发 的 阶段, 可能 alpha four 它的 应用 场景 还是 在 比较 早期 的 环节。

可以 这么 理解 吗? 对的, 人工智能 目前 大部分 的 应用 还是 集中 在 早期 研发 阶段。 我们 具体 的 阿尔法 狗, 它 可能 在 最 早期 的 一个 靶点 发现 阶段, 甚至 早 于 靶点 发现 阶段, 他在 起到 一个 革命性 的 一个 颠覆 作用。

张路, 我不知道 你 怎么 看待 alpha 4现在 的 一些 热潮, 您 觉得 您 现在 的 投资 里面 有 哪 一些 其实 是 能够 看到 alpha four 已经 很快 落地, 还是 他 其实 距离 落地 相对来说 有 一段距离。

其实 在 某种 定义 上 它 已经 有 一些 落地 了。 因为 其实 在 一年前 在 nature 上 发表 论文 的 时候, 其实 当时 deep mind 的 研究 团队 就 已经 开始 对外 免费 公开 了 alpha fold 它的 源代码 以及 数据库。 所以 从 自从 一年前 的话, 已经 有 很多 的 学者 已经 开始 访问 数据库, 而且 通过 这些 数据库 的 信息 在 帮助 他。 无论是 在 科研, 甚至 说 是在 一些 疫苗 的 研发, 还有 包括 一些 抗生素 耐药性, 还有 包括 一些 其他 的 比如说 是 像 环境污染, 塑料 污染 中的 一些 应用, 在 进行 非常 强 的 一个 支持 作用。 所以 在 某种程度 上, 阿尔法 fold 已经 在 进入 到 商业化 应用 的 一个 阶段。 现在 因为 我们 有了 一个 更加 强大 的 数据库, 所以 这个 数据库 也是 帮助 我们 开放 了 更多 的 一个 新的 可能。 同时 我 觉得 很 重要 的 一点, 也是 向 公众 提供了 一个 非常 好的 信息源, 让 大家 看到 人工智能 和 生物学 的 一个 结合。 我们 经常 讲 叫 digital live science, digital putis.

怎么样 可以 去 把 数据 的 价值, 数据 的 力量, 人工智能 的 力量 真正 运用 到 生物学 中 来。 而且 生物学 中 其实 核心 我们 也是 有 很多 编码 和 数据, 怎么样 去 找到 它的 相关性。 我 觉得 其实 alpha fold 也是 通过 这样 一种 形式, 让 更多 的 人 了解到 了 这样的 一层 应用。

同时 它的 呈现 方式, 这也是 我 非常 想 强调 的。 它 其实 最终 的 呈现 方式 是一个 非常简单 易用 的, 就像 搜索引擎 一样的 数据库。 再加上 这个 数据库 又被 谷歌 放到 了 它的 公开的 云 平台 上, 在 各种各样 的 数据库 里 都 可以 去 应用。 它 就 大大降低 了 各种各样 不同 背景 的 学者 使用 这个 数据库 的 一个 门槛。

你 不需要 是 有一个 数据分析 或者 人工智能 背景, 你 可能 就是 一个 单纯 的 纯 生物学。 从 化工 背景 的 你 过来 用 这个 数据 会 非常 简易 方便。 甚至 是 说 可能 它是 一个 技术 背景 没有 那么 强 的 创业者, 他 去 使用 这个 数据库, 可能 也会 得到 很多 非常 有用的 对他 初创 企业 的 一些 支持 和 帮助。 所以 我 觉得 这个 是 让 我 感觉到 最 兴奋 的 一点。 这也是 为什么 我们 会能 预见到 alpha fold 对于 未来 数字 生物学 的 整体 的 商业 应用 进行了 巨大 的 一个 推动 的 力量。

可能 这里 先 有 第一个 问题, 就是 alpha four 它 到底 是 怎么 去 找到 我们 说 地球 上 所有 已知 蛋白质 的 这种 结构 预测 方法。 因为他 这个 跨度 其实 还 蛮 大, 而且 用时 还 蛮 短 的。 郭 才 你是 怎么 理解 他的? 这个 方法 是 怎么 找到 的?

这个 确实 是一个 比较 难以 回答 的 问题, 可能 比较 枯燥, 先 给 大家 预警 了。 我们 先 要 看一看 阿法 F 的, 我们 现在 讲 的 是 阿 ford 2.0。 我们 要 先 了解 一下 阿尔法 四 最初的 一个 工作 原理。 我们都知道 蛋白质 它是 一个 氨基酸 序列 的 三维 结构, 最初 它 可以 回到 20个氨基酸 的 一个 序列。 阿尔法 四 的 最初的 工作 原理, 它 就是 通过 预测 蛋白质 中 每 对 氨基酸 之间 的 一个 距离 分布, 以及 连接 它们的 每个 化学键 分子 界 的 角度, 对 这些 所有 氨基酸 对的 测量 成为 一个二维 的 一个 距离 直方图。 然后 通过 卷积 神经网络, 这个 词 也是 比较 难懂 的。 它是 专门 图 处理 图像 的 一种 算法, 来 最后 构建 出了 蛋白质 的 一个 3D结构。

最近 的 一次 突破, 关键在于 它的 算法 进行了 一个 更新。 它 不再 使用 爵迹 神经网络, 而是 使用 了 一个 模仿 人类 注意力 的 一个 网络 架构。 它的 专有名词 叫 attention。 Attention 它 可以 聚焦 到 多个 细节 部位, 其实 主要 包括 两个 部分, 一个 是 神经网络, 一个 是 结构 模块。 在 神经网络 中 它 将 它的 一些 图 网络, 也就是 把 所有 这些 蛋白质 的 相关关系 列出 一个 图表, 然后 再 通过 和 多 序列 对比 完成 一个 结构 的 预测。 这是 神经网络 在 得到 神经网络 的 结果 以后, 就会 到 第二个 结构 模块 structure module。 然后 把 前面 得到 的 神经网络 的 信息 转换 成为 蛋白质 的 一个 3D结构。

在 这个 部分 它的 主要 突破 就是 使用 到了 我们 说 的 叫 attention。 Attention 就是 模仿 人的 这个 注意力。 我们 人的 注意力 不是 像 我们 想象 的 那样 比较 focus, 我们 其实 是 可以 注意 遇到 多个 细节, 多个 角度。 它 会 以 某个 原子 为 原点 来 构建 一个 3D的 一个 参考 槽。 然后 通过 对 预测 信息 进行 旋转 平移, 最后 得到 一个 结构 框架。 这个 确实 比较 晦涩 难懂 一点。

确实 好的, 我也 试图 消化 这个 信息, 张璐 就是你 你 刚刚 怎么 理解 国 才 刚刚 的 描述, 就是 alpha 4是怎么 去 做了 一个 跨越式 的 飞行, 找到 现在 地球 上 所有 已知 的 两亿 种 蛋白质 呢?

对我 觉得 其实 刚才 国 才 已经 给 了 一个 非常 详尽 的 解释 了。 就 整体 它的 一个 技术 的 一个 逻辑。 那 我 可能 多 稍微 解释一下, 也是 给 大家 更加 的 形象 的 讲 一下 刚才 国 才 提到 的 这个 新的 算法 attention。 一个 不 恰当 的 比喻 就可以看 成说 可能 以往 大家 想到 的 这个 机器学习 处理 数据 更多 的 是一个 pattern matching, 对 吧? 我们 看到 什么 去 比对。

但是 attention 它 更多 的 类似 于 我们 潜意识。 我们的 意识 的话 是 线性 的, 但是 我们的 潜意识 实际上 是在 同 时刻 多个 信息源。 它是 一个 立体 的 方式 去 帮助 你 做了 一个 判断 和 决策。 所以 很多 时候 我们在 日常 中 做 决策 的 时候, 大家 不一定 能够 通过 我们的 正常 的 意识 和 逻辑 去 看出来 我的 这个 逻辑 线 到底 是 怎么样。 我 就 突然间 觉得 我要 选 这个 数字, 我 买彩票 选 这个 数字, 然后 我 去 到 什么 地方 选 这个 颜色, 我要 选 哪 辆车, 走 左边 走 右边。

很多 时候 是 潜意识 在 帮助 我们 做 决策。 其实 潜意识 他的 大脑 的 计算能力, 处理 数据 的 能力 是 我们 正常 的 这个 意识。 我们 又是 sub conciousness 和 cautious, 其实 是 我们 cautious 的 几十万倍。 所以 大家 可以 从 这个 角度 就可以 理解 说 这个 新型 的 算法, 它 其实 是 把 无论是 处理 数据 的 能力, 它的 通量, 还有 包括 他的 三维 的 架构, 还有 包括 他 把 信息 整合 的 方式, 和 以前 都是 很 不一样的。

也是 这个 原因, 我们 可以 从 以前 可能 是 几十万个 这样的 一个 蛋白 结构, 是在 一年前 在 数据库 里, 到 现在 是 上 亿个 蛋白 结构 被 发现, 然后 被 完成。 所以 这个 实际上 是 一方面 是 算法 的 一个 提升, 但 另外 一方面 我 觉得 其实 也是 要 有一个 很 重点 的 强调。 就是 很多人 可能 会 下意识 的 觉得, 是因为 人工智能 的 技术 的 提升。 因为 只有 人工智能 能 达到 这样的 一个 数字 生物学 的 结果, 其实 有 一大部分 的 贡献 是 来自于 传统 的 或者说 是 已有 的 这些 结构 生物学家 所 积累 的 这么多年 的 经验, 积累 了 这么多年 的 数据。 这个 是 所有的 数据 算法 去 发展 的 机遇 的 一个 根本。 也是 在 过去 这么多年 的 很多 的 数据, 还有 信息 的 积累, 产生 了 一个 从 量变 到 质变 的 一个 阶段。

包括 如果 大家 去 看 deep mind, 他的 团队 在 开发 阿尔法 四 的 团队 里面, 当然 有 很多 非常 知名 的 人工智能 科学家。 但 有 很多 大部分 其实 是 蛋白 结构 的 生物学家。 所以 我 觉得 这方面 也是 希望 大家 可以 看到 的, 就是 我们在 应用 人工智能 的, 尤其是 偏向 医疗 生命科学 这个 方向 的 时候, 是 需要 两边 的 专家 将 各种各样 的 信息 和 专业知识 汇聚 到 一起, 才可能 在 最终 出现 像 阿尔法 fold 这样 非常 跨世纪 的 富有 变革性 的, 真的 会 改变 产业 未来 的 非常 有利 的 工具。

那 回归 到 落地 场景 里面 的话, 国产 你 会 觉得 比如说 刚刚 张伟 京 提到 alpha four 这次 一个 非常重要 的 做法 就是 他 免费 的 公开 了 他的 数据集。 允许 大家 去 允许 各国 的 科学家, 各个领域 的 科学家 和 研究 学者 去 使用 这些 数据, 研究 这些 数据。 这样 会不会 更快 的 加速 在 工业界 还有 学术界 相关 的, 不管 是 新药 研发 还是 疾病 研究 的 进展 呢?

这个 答案 我 觉得 是 肯定 的。 因为 这种 公开 自己的 算法 和 数据集 的 做法, 其实 是对 全人类 最大 的 一个 贡献。 就像 前面 张璐 提 的, 那些 枯燥 的 结构 生物学 变得 就 更加 易得。 好像 引用 施工 老师 的 说法, deep might 或者 up for d go 是 使得 每个 人都 可以 成为 一个 结构 生物 化学家。 我们 都 理解 从 D N A R N A 到 蛋白质, 它的 结构 是 属于 一切 物质 的 基础。 所以 他在 这个 公开 数据 的 做法, 在 深层 蛋白 模型 的 方面, 它是 一个 非常 巨大 的 作用。

而且 但 另 一点 我也想 提出 另一个 观点, 就是 其实 生物科学 和 医学, 我们 更多 的 它是 一个 实验 科学。 我们 预测 的 这些 结构 不仅 是 说 可以 去 设计 一些 新的 蛋白 结构, 而且 也会 促进 目前 已有 的 这些 实验 科学 的 一些 数据。 比方 我们 可以 看到 最近 的 这些 冷冻电 镜, 或者 X 射线 的 这些 数据 的 一些 理解, 也会 起到 一个 积极 的 一个 作用。

你 刚刚 提到 这 一块, 我们 其实 还有 挺 好奇 的 部分。 因为我 知道 这个 alpha 4在出来 之后, 其实 有 一部分 的 学术, 包括 外界 的 观察 认为 说 好像 现在 对的 评价 有点 过于 有 夸大 的 嫌疑 了。 比如 您 刚刚 提到 的, 可能 alpha 4现在 更多 的 是 会 关于 蛋白质 结构 的 预测, 但是 他 没有 办法 去 提供 实际 的 蛋白质 结构。 而 这个 可能 说是 比如说 我们 去做 核磁共振, N M R X 射线, 它是 可以 去 做到 的。 这个 数据 价值 可能 对 实验 科学 或者 是 实际 去做 新药 开发 的 研究 学者 来说, 可能 还是 有 一定 的 差距。 我不知道 你 怎么 理解 这种 质疑 和 说法。

因为 我们 研究 的 目的 不是 去 获得 一个 蛋白质 的 结构, 我们 更多 的 是 利用 蛋白质 的 结构 去 设计 一个 新的 药物 分子, 或者说 新的 一个 生物制品。 不是说 我们 有了 这些 所有的 蛋白质 宇宙 就 万事大吉。 这 里面 有 几个 观点。 第一个, 我们 看到 蛋白质 本身 它是 一个 比较 是一个 动态 的 一个 系统在 体内 它的 不同 的 条件下, 它 和 不同 的 小分子 化合物 在 不同 的 pocket 的 地方, 它 会有 不同 的 构象, 不同 的 结构。 而且 在 不同 的 怀孕 条件下, 它 也会 出现 不同 的 变化。 所以 我们 大家 可以 理解 这个 蛋白 结构 它 不是 像 我们是 水泥 钢筋 那样, 是一个 固定 的 一个 变化。

第二个 目前 业界 对于 阿尔法 four 的 这个 2.0 处理 的 结构, 它 还是 有一个 自信 的 区域。 这些 出来 的 结构 还是 需要 大量 的 实验室 的 这些 数据, 就像 灿灿 您 提到 的 用 X C N M R 这些 实验 数据 去 进一步 去 确认。 特别是 它 跟 不同 的 一些 小分子 化合物 和 蛋白质 结合 以后, 它的 构象变化 去做 进一步 的 解析。 阿尔法 D 只是 给 大家 起了 一个 最 开始 的 打开 了 一扇门, 但 门 后面 还是 有 这个, 我们 才 真正 开始 了解 蛋白质 的 它的 千姿百态 的 一种 变化。 从这一点 觉得 我 觉得 可能 阿法 ford 最终 到 实际 的 工业 应用, 还是 有 一定 的 距离。

张璐, 你 怎么 理解 alpha four 它的 所 提供 的 数据 价值?

我 觉得 首先 第一点 就是 价值 是 非常 巨大 的, 它 确实 是一个 非常 有 变革性 的 新的 技术。 但 同时 的话, 刚才 郭 才 也 提到 整个 其实 生物 行业, 它 其实 它 也是 有一个 上游 下游 的 阿尔法 fold, 它 其实 提供 更多 是在 上游 层面 上, 我 现在 给你 已经 预测出 了 这么 多 蛋白质 的 一个 结构, 那 它 对 下游 的 更多 的 接下来 的 那些 应用 就有 了 更强 的 意义。 但是 它 不能 替代 下游 的 每个 一个 步骤, 它 只是 在 上游 在 发挥 功能。 但 一方面 的话, 其实 就是说 现在 是 两 亿多个 蛋白质 结构 被 预测 到。 其实 不 只是 这样, 他 可以 非常 精确 的 预测 到 蛋白质 的 结构, 正式 精确 到 比如说 像 原子 的 精度 到 尺寸 到 分钟。 所以 这是 它 在 上游 层面 上 非常 巨大 的 一个 贡献。

但 另外 一方面 的话, 我记得 当时 deep mind 他们的 团队 也 对外, 当时 其实 表哥 他 也 说, 其实 现在 在 超过 他们 已经 预测出 的 2亿个 蛋白质 结构 中, 其实 大概 我记得 好像 是 30%。 35% 的 结构 是 具有 高精度 的, 它是 可以 通过 实验 手段 获取 的 这样的 结构 精度。 所以 就和 这个 传统 的, 比如说 低温 冷冻电 镜 获得 的 是 可以 是 相 比较 的。 但 80% 的 结构 的 可靠性 是 可以 用于 很多 后续 分析。 但 他 并没有 说 已经 精确 到 就 完全 是 高精度 的 实验 手段 获取 的 这个 精度。 所以 我 觉得 在 这个 层面 上, 大家 也 需要 有一个 理性 的 态度 去 看待 它。 当然 在 接下来 这几年, 我 也会 预期 它 会有 更多 的 一个 发展。

现在 我们 至少 说 有一个 很大 的 进步, 是 我们在 不需要 去 问 说 到底 是 什么样 的 蛋白 折叠 结构。 我们 现在 要 接下来 去 问 的 是 说, 这个 蛋白 折叠 结构 它 有 什么样 的 作用。 除了 作用 之外 的话, 我们 也要 看到 说, 比如说 像 很多 结构 生物学家, 他 除了 预测 这个 结构 之外, 他 做 完 之后 还要 再去 花 很多 的 时间 去 分析 它的 结构, 然后 再去 解释 它的 功能。 这 两步 就是我 刚才 说 的 下游, 我们 还需要 更多 的 投入 去做。

接下来 解释 它的 功能 之后, 我们 再进一步, 无论是 在 制药, 在 很多 我们 其他 提到 的 数字 生物学 层面 上 的 应用, 都 可以 去 持续 发展。 但是 大家 可以 想想, 以前 我们 需要 花 多少 时间 去 一个 一个 去 探索 出来 蛋白 的 结构 到 店。 现在 这 一步 基本上 已经 大部分 被 做 完了, 那 我们 就可以 更多 的 时间 和 资源 关注 到 接下来 这 几步。 所以 我 觉得 一定 要是 分 两步 去 看。 一方面 一定要 看到 说 这个 技术 的 先进性 和 他的 变革性。 同时 也有 一个 理性 的 预判, 就是 对 工业界 的 投入 以及 下一步 还需要 继续 做 的 工作 在哪里。

所以 其实 我们 既不 能够 简单 的 用 药物 开发 的 速度 和 新药 开发 的 数量 来 作为 一个 考量。 Alpha four 到底 有没有 对 实际 应用 场景 做出 巨大贡献 的 这样 一个 参考 指标。 同样 的 我们 也 应该 对 alpha 4在上游 做出 的 贡献 给出 一个 比较 客观 的 评价。 就是 它 确实 是 帮助 大家 去 解决 了 可能 最 无聊 最 繁琐 的 工作 那 一部分, 解放 了 大家 去 思考 其他 问题 的 一个 方式。

是的, 我 特别 喜欢 你说 那个 词 就是 解放。 因为 其实 阿尔法 fold 刚 出来 之后, 我记得 当时 我们 上次 讨论, 我 就 记得 那 一段时间 有 很多人 在 讲, 很多 媒体 也 在 讲说, 有了 alpha fold, 那 是不是 要 替代 掉 结构 生物学家, 结构 生物学家 要 失业 了。 但 其实 很 对 很 重要 的 一点, 其实 当然 是 替代 不了 的, 更多 的 是 说 他 解放 了 结构 生物学家, 可以 让 他们 时间 更 高效、 更 有效 的 花 在 像 我 刚才 提到 的 下一步 去 解构, 然后 去 解释 它的 功能, 然后 去 进一步 进行 下一步 的 下游 探索。 我 觉得 这个 是 非常重要, 是一个 解放。

我也想 开口 一下 张璐 的 说法。 我 觉得 阿富汗 四 的 出现 不在 他是 一个 突破, 是一个 解放。 但 我们 更多 的 觉得 M A ford 它 还是 一个 起点, 是一个 人工智能, 它 更多 的 是一个 工具。

对于 我们 人类 而言, 就像 刚才 讲 的, 我们 不再 需要 花费 巨大 的 精力, 巨大 的 物力, 还有 更多 的 resource 去 花 在 一个 蛋白质 的 一个 结构 上面。 我们 可以 向 下面 更 一步 的 去 发展。 我们 更多 的 是 感兴趣 的 是啊 有了 蛋白质 结构 以后, 蛋白质 的 它的 活性 位点 是 到底 是 在哪里, 他是 哪个 破开, 都 可以 和 我们的 药物 分子 去做 结构。 我们的 药物 分子 里面 是不是 可以 对 某个 蛋白质 分子 做到 它的 一个 策略 的 一个 改化。 比方说 一个 糖基化 甲基化, 那么 蛋白质 分子 它的 它 和 蛋白质 和 蛋白质 它 也是 有 这个 protein interaction 这个 作用, 也是 特别 感兴趣 的, 所以 我想 特别 echo 张璐 的 说法。 他 对于 我们 科学家 的 脑力、 人力、 物力 是一个 解放, 使得 我们 整个 人类 可以 把 更多 的 精力 去 投到 下一个 阶段 去做。 科学 无止境。

对, 是的。

休息时间 又 再次 插播 一条 关于我们 自己的 广告。 上周 我们在 生动活泼 的 公众 号 推 文 里面 发布 了 会员 专属 的 生动 胡同 一周年 活动。 科技 早知道 的 线上 会员 直播 活动 将在 下周 11月19日 的 中午 举办。 到时候 科 早 的 三位 主播, 我 Richard 和 徐 老师 会 分别 在北京、 伦敦 和 硅谷, 以 远程 连线 的 方式 跟 胡同 的 会员 们 见面, 分享 我们在 这一年 里 看到 的 创投 趋势, 以及 我们 各自 的 一些 职场 成长 经验教训。 另外 趁着 这一次 胡同 一周年, 我们 想要 给 订阅 的 新 伙伴 或者 续订 的 老街坊 们 准备 了 不同 的 优惠。 老街坊 的 续订 优惠 已经 通过 胡同 来信 发送到 了 各位 的 邮箱 里, 请 大家 注意 查收。 新的 伙伴 可以 查看 每期 节目 的 solo 和 公众 号, 了解 我们 solo 胡同 会员 的 订阅 方式, 欢迎 大家 持续的 支持。 生动活泼, 谢谢你们 的 慷慨 帮助 我们 持续 制作 优质 的 内容。

既然 alpha 4对上游 的 影响 这么 大, 那 自然而然 可能 就会 有一个 问题, 为什么 一直 我们 没有 看到 能够 在 影响力 和 知名度 上 和 alpha 4并称 的 这样 类型 的 产品 或者 技术 出来? 两位 是 怎么 看看 的?

其实我 可以 先 讲 一下, 因为 一来 是 说 这 确实 是一个 非常 困难 的 要 去 解决 的 一个 问题。 其实 像 最早 deep mind 去 参加 的 C S P 的 那个 比赛, 当时 也 不支持 有 deep 方案 的。 其实 当时 各 大 科技 公司, 像 比如说 微软, 他们 其实 都有 派 队伍 参赛。 只是 说 阿尔法 fold 是在 我记得 大概是 18年 的 时候, 最早 当时 应该 是 拿到 了 第一名。 后来 2020年 当时 是 alpha fold two 是 拿 冠军, 而且 是 产生 了 非常 大 的 一个 影响。 但 当时 其实 也会 看到 很多 其他 的 公司 也 在 参与, 只是 说 他们 无论是 从 算法 还是 说 从 结果 来看 是 最好的。

那 为什么 这么 难 呢? 一来 是 提到 说 首先 他 其实 对于 数据量 的 需要 是 非常 巨大 的, 而 这个 数据 也是 非常 昂贵 的。 一般 的 初创 企业 确实 很难 在 早期 可以 负担 这么 贵 的 数据。 你 首先 你 能不能 获得 这样的 数据, 这就是 一个 渠道 的 问题。 二来 是不是 有 这个 资金。

同时 我 刚才 也 提到 说, 阿尔法 的 团队 他 不 只是 只有 人工智能 科学家, 他 有 很多 结构 生物学家。 然后 也 需要 非常 资深 的 专业 的 结构 生物学家。 通过 他们 这么多年 的 知识 积累, 来 为 人工智能 算法 提供 它的 一个 基础 和 数据分析 的 一个 逻辑。 这样的 人才 其实 也 非常 的 屈指可数。

当然 谷歌 deep mind 他们 就 聚集 了 全世界 可能 最 顶尖 的 这样的 一批 人, 然后 将 最好的 信息 汇集 到了 一起。 他们 每年 的 成本 也是 巨大 的。 这些 人 无论是 他们 自己的 人力 的 成本, 还有 是 算 力 的 成本, 开发 的 成本 都是 巨大 的。 所以 我 觉得 无论是 从 技术 门槛、 资源 门槛、 数据 门槛, 还有 说是 资金 门槛, 确实 就 设 了 几个 很大 的 壁垒 在那里。 让 可能 其他 无论是 初创 企业, 甚至 说 其他 大 的 公司, 都 很难 做到 和 阿尔法 ford 去 竞争。 确实 我们 其实 在 市面上 也会 去 看, 确实 F F fold 现在没有 任何 的 和 他 可以 去 相近 的 竞争对手。

但 另外 一方面 也很 让人 很高兴 的 一件 事情 就可以 看到, 就像 我 提到 的, 自从 他们 在 内侧 的 文章 发表 之后, 他们 将 数据库 开源 了。 不仅 是 源代码 开源, 他 同时 把 整个 数据库 开源, 同时 做 的 如此 容易, 让 所有的 人都 可以 去 应用。 我 觉得 这个 真的 是对 整个 产业 的 一个 非常 大 的 贡献 和 推动。

樟 路, 我 这里 补充 一个 问题, 就 据 您 的 了解, alpha four 它的 算 力 成本 跟 人员 的 投入 成本 大概 会 是在 什么样 的 一个 量级 和 范围 呢?

算 力 成本 我 可能 不好 给 估计, 我知道 他 大概 人力 成本。 然后 deep man 的 现在 他 全球 可能 是 有 1000名员工, 大部分 的 这种 专家 都 是在 100万美美 金 左右。 100万美金 以上 有 虽然 可能 比 这个 还要 更高。 当然 1000名员工 中 也有 可能 说 一半左右, 他 可能 是 相对 薪酬 低 一点 的, 但 也 有些 人的 薪酬 非常 的 高。 所以 你可以 算 一下 他 每年 的 人力 成本 在 多少?

10亿左右, 十 亿美金。

对, 10亿美金 可能 到不了, 我 觉得 可能 就是 几 亿美金 左右, 然后 再加上 他的 算 力 成本 等等等等。

明白。 国 才 你 觉得 这 样子 的 团队 的 支出, 对你 自己的 观察 来说, 其实 也是 在 国内 很难 看到 有 与 之 相匹配 的 团队 的 能够 做到 这么 大 的 人力 成本。 因为你 提到 其实 上海 蟑螂 有 很多 在 做 这种 尝试 的 团队。 对我 倒是。

对 这个 问题 有 自己的 看法。 我 倒 不 觉得 我们 从 整个 科研 的 或者 什么 来看 的话, 需要 一个 竞 品 的 出现。 我 觉得 deep my 的 他 最伟大的 地方, 它 可能 是 就像 张璐 刚才 讲 的, 他是 集结 了 所有的 这些 投入, 还有 人类 科技 的 突破, 特别是 算 力 算法 和 数据, 它 在 恰当 的 时刻 出现了 一个 强大 的 一个 突破。 因为 这个 蛋白 这个 宇宙 出现了 一个 破局 者, 我 都不 觉得 人类 需要 这么 多 的 算法。

另一个 角度, 我们 更多 的 一个 竞 品 去 投入到 这个 工作 中 来, 我 觉得 deep my 的 这个 开头 也就 足够 了。 就像 我们 前面 聊 的, 我们 更多 的 是 往 向前看, 集中 在 下一个 阶段。 关注 在 国内 的, 尤其是 在 上海 药谷 这个 方面, 大家 其实 人工智能 的 公司 主要 集中 在 还是 做 药 的 这个 方面。 他们 更多 的 是 关注 是 如何 去 找到 一个 合适 的 靶点。 找到 靶点 以后 如何 发明 一个 全新 的 化合物, 或者说 然后 发现 这个 化合物 以后, 怎么样 设计 好 临床 的 方案, 来 提高 临床 的 成功率。 所以 就像 我们 刚才 讲 的, 这种 最 上游 的 或者 是 基础科学 的 一个 研究, 更多 的 是一个 结合 人类 的 或者 最 先进 的 科技, 有有 几个 突破 也就 足够 了。

有一个 团队 把 基础 打好, 给 大家 一起 用 就行了, 对 吧? 更多 团队 应该 在 其他 的 层面 做对。

是的。 因为 其实 就像 我 刚才 提到 的 非常 伟大的 一点, 也是 非常幸运 的 一点 是 他们 现在 把 所有 东西 都 开远 了, 那 我们 为什么 还要 去 找 精品 呢? 就 可能 不 恰当 比喻, 就像 互联网 免费 给 大家 使用, 然后 大家 在 这个 基础 之 上去 建立 各种各样 的 应用 一样。 那 现在 deep mind 其实 把 这个 开源 之后, 大家 所有人 都 可以 使用 这样的 一个 巨大 的 非常 强有力 的 数据库, 然后 同样 可以 下载 数据, 同样 可以在 这个 基础 上去 进行 下游 的 各种各样 方向 的 一个 开发。 所以 我 觉得 这是 他 最大 的 意义。 其实 就是 像 刚才 提到 的, 为 我们 下一步 的 数字 生物学 奠定 了 一个 新的起点 和 基础。 在 这个 基础 之上, 我们 所有人 都 往 上 迈 了 一大步, 可以 去 更快 的 把 一些 好的 应用 做出来。

如果我们 给 些 具体 的 想象 未来 的 想象 空间, 那 我 可能 先请 郭 才 来 提 回答 一下 这个 问题 好了。 我们 如果 alpha 4他已经 把 这个 基础 都 搭 好了, 我们 未来 在 哪些 时间段 会 看到 说 在 药物 的 这个 领域 里面 会有 一些 非常 细小 的 进展, 是 很快 我们 就能 看到 它 落地 的。 不管 是在 国内 还是 在 海外。

其实 这 是一个 很 好的 问题。 对 这个 问题 大家 有 正面 的 反馈, 也有 谨慎 的 态度。 我自己 觉得 大概 在 三五年 之内, 我们会 会 特别 受益 于 阿尔法 ford 的 这个 突破。

下面 一步 讲到 就是 我们 有了 蛋白 结构。 如果 利用 蛋白 结构 把 它 做成 一个 药物 预测 蛋白 结构, 也就是 新药 研发 的 第一步。 我 觉得 是 下面 一步 可能 我们 就会 用 另外 的 人工智能 的 场景。 根据 蛋白 结构 和 小分子 配体 会 建立 药效 模型, 然后 利用 药效 模型 来进行 虚拟 的 筛选, 得到 虚拟 化合物。 再 把 上面 的 这个 化合物 再 抛开 到 这个 靶 蛋白 上, 把 它 进行 综合 评估, 最后 合成 出 实际 的 化合物 进行 活性 筛选。 活性 筛选 以后 最后 得到 lead compound, 最终 lead compound 进行 测试, 进入 动物 实验, 最后 到 临床实验。

我 刚才 讲 的 这些 蛋白 结构 以后 的 这些 步骤, 目前 我知道 在 国内, 在北京、 上海、 广州, 我们是 有 很多 的 非常 先进 的 公司 在 做 这些 工作。 所以 我的 结论 是 阿法 port 使得 以前 特别 难以获得 的 这些 蛋白 结构 变得 简单化。 简单化 以后, 后面 的 这些 步骤, 我们是 有 已有 的 经验, 也有 的 产业 是 可以 去 对接 的。 在 制药 的 早期 的 临床 前 的 开发 领域, 我会 预见到 他 会 是一个 井喷 的 一个 现象。

我想 我 好奇 他 井喷 的 那个 时间点, 现在 你们 业界 是 会有 一个 判断 吗?

其实 另外一个 角度 可以 给 大家 讲, 就是 为什么 大家 特别 于 最新 一个 人工智能 呢? 我们 讲到 传统 的 制药 行业, 其实 跟 人工智能 是 自相矛盾 的 一个 行业。 因为 我们 传统 的 制药 行业 它是 一个 实验 科学, 我们 更 讲 的 是 数据 说话, 然后 就是你 最终 的 结果 来看, 我们 也 知道 每年 的 有 很多 的 高等级 的 文章, C N S 上 发表 的 文章 到 最终 到 药物 领域 都 证明 是 不对 的。 所以 这个 原因 是什么 呢? 也就是 我自己 的 理解, 就是 实际上 它是 一个 传统 与 现实 计算 科学 与 实验 科学, 高速 迭代 和 慢工出细活 这 两个 方面 的 一个 矛盾 点。

我 特别 谨慎 的 把 它 这个 井喷 时代 归结为 在 这个 临床 前 或 临床 早期 的 一个, 所以 我 觉得 阿尔法 狗 它 对于 这个 人工智能 用于 早期 化合物 的 发现, 它是 具有 决定性 意义 的。 但是 对于 临床 阶段 的 应用, 我 还是 持 比较 谨慎 的 态度。 我们 也 在 看到 周围 的 一些 公司, 把 互联网 的 一些 或者 迭代 的 一些 速度 应用 到 药物 上面, 可能 它 会 出现 一些 奇迹。 以往 我们 药物 行业 可能 需要 三年、 五年 会 找到 一个 先导 化合物。 人工智能 可能 也就 三五个 月, 就会 找到 这样 一个 化合物。 但是 有一点 我想 指出, 目前 还没有 一 没有 一例 人工智能 设计 要 到 获 批, 大部分 都 处于 临床 前 阶段, 有 少数 的 处于 早期 临床 阶段。 我们都知道 临床 的 二期 是一个 关卡, 有 大概 40%到50% 的 分子 会 在 临床 2A的 这个 阶段 会 被 kill 掉。 所以 我 觉得 还是 他 开 了 一扇门, 但是 后面 还需要 有 很多 的 工作 去做。

国 才 我 觉得 非常 详细 了, 张路 你 怎么 想? 刚刚 国 才 的 这个 反馈。

对我 补充 一下, 国 才 最后 讲 到了 临床 这 一部分。 这个 其实 也是 确实 我 觉得 很多人 可能 不了解 制药 行业 会 误会 的 一点。 因为 我们 也会 有些 时候 在 硅谷 碰到 纯 人工智能 背景 的 这样的 创业者。 他 可能 会 想说, 我 所有的 过程 都 通过 人工智能 去 智能化。

然后 包括 说 后期 的话, 临床 是不是 有 一些 用 合成 数据模型 就 去做 一些 替代, 但 现实 是 不太可能 的。 因为 一方面 的话, 当然 技术 有 它 技术 的 先进性。 但 另外 一方面 我们 还是 要 意识到 现在 人工智能 技术 和 我们 真正 的 人脑 的 智力 水平, 还有 包括 我说 我们 人体 的 复杂度, 它 还 是不是 在 一个 量级 的, 它是 没有 办法 进行 模拟 和 替代 的。 所以 从 阿尔法 四 的 角度, 它是 上游 提供了 这样的 一个 非常 好的 工具。 我们 节约 了 在 上游 的 时间, 但是 在 下游 的 每个 步骤 一步 还是 不能 缺少, 还是 要 一步一步 去 走。 所以 我 觉得 还是 要 去 尊重 这样 一个 产业, 它 正常 的 产品 开放 的 一个 周期。

甚至 说实话 这个 可能 有些人 同意, 有些人 不 同意。 但 我们 经常 聊 在 医疗 领域, 在 生物医学 领域, 有些 时候 在 临床 过程中 很多 参数 的 调节, 它 也 不是 我们 开玩笑 讲说 它是 art and science, 对 吧? 它 也 不是说 完全 是一个 science 层面 上 的。 我不知道 郭 才 有没有 这种 感受。 所以 在 这个 过程中, 你的 不停 的 过程 的 调节, 过程中 积累 的 经验 数据, 你 都是 没有 办法 通过 人工智能 去 进行 一定程度 的 辅助 的。 所以 我 觉得 这个 也是 大家 需要 认识到 的 一点。

刚才 你 也 问 到 说 alpha fold 是不是 有 一些 其他 的, 包括 现在 我们 看到 近期 的 一些 潜在 的, 接下来 两三年 的 会 产生 一些 应用, 我们 还是 非常 非常 期待 的。 因为我 觉得 一来 是 它 大大降低 了 大家 在 数字 生物学 这个 领域 创业 创新 的 一个 成本 和 门槛。 因为 之前 你 想 没有 一个 公司 或者 一个 企业 可以 有 这么 大 的 成本 投入 去 有 获得 这样 一个 有利 的 工具。 但 现在 这个 工具 大家 都 可以 用了, 利用 这个 工具 可以 去 做什么? 这就是 下一步 每个人都会 去 探讨 和 探索 的。

哪些 可能 是 对于 商业 应用 更 近 一点。 比如说 一个 很 简单 的 方式 就是 可以。 我记得 前一段 也 跟 一些 创业者 有 聊到, 他们 就可以 通过 现在 afford 的 这个 数据库, 可以 快速 去 在 上面 做 一个 软件工具, 去 找到 结构 了 相似 的 蛋白质。 这 其实 就可以 帮助 我们 更快 去 认识到 这些 蛋白质 和 彼此 的 关系, 他们 有 各种 特性 的 蛋白质 的 一个 进化 过程, 然后 包括 去 通过 相似 结构 的 蛋白质 去 理解 这个 你 可能 一个 是 已知 的 一些 特性, 另外一个 未知 的 特性, 可以 去 查明 它的 一个 特性 的 一个 基础。 甚至 说 比如说 比较 近 的 就是 要 了解 一下, 是不是 跟 那些 导致 癌症、 致癌 的 东西 相关, 去 了解 一些 我们 可能 日常 中 去 看到 的 一些 疾病, 它的 诱发 的 一些 因素 和 原因。

另外 的话, 就是 我们 刚刚 经历 的 这个 大范围 的 疫情。 在 未来 如果 再 出现 大量 的 大规模 发生 的 流行病、 传染病 的 时候, 我们 也可以 快速 的 通过 这样的 一个 比对。 现在 我们 已经 有 2亿个 这么 巨大 的 一个 蛋白质 结构 的 一个 数据库。 可以 进行 快速 的 比对, 快速 的 去 进行 它的 特性 的 寻找, 快速 的 开发 出来 相关 的 一些 特性 的 疫苗 等等。 所以 我 觉得 这个 都是 我们在 未来 这几年 就会 看到 很多 的 商业 应用 会 在 这个 方向 去 发力。 很 可能 也会 很快 的 进入 到 现实 的 这个 市场 应用 中。

你 刚刚 提到 的 一些 疾病, 就 比如说 像 阿尔兹海默症 这种, 就是 你可以 对 它的 蛋白 再去 做 进一步 的 研究, 并且 开发 出 相对 应 的 合适 的 新药。

对, 当然 因为我 其实 投 很多 关注, 比如说 阿兹海默症, 就是 认知障碍 这方面 的 一些 各方面 的 技术 发展。 核心 的 是 过去 这 几十年 确实 技术 发展 比较 缓慢。 当然 现在 阿尔法 fold 会给 它 进行 很大 的 一个 推动, 但 真的 到 把 像 制药 这一 层面 的话, 可能 还是 需要 比较 多 的 时间, 不是 一点 时间。

因为 我们 现在 其实 还 一个 很大 的 问题是, 我们 并没有 清晰 的 能够 去 了解 不同 的 人 得了 这个 阿兹海默症 之后, 他的 诱因 到底是什么。 其实 不同 的 人 他 得 同样 的 疾病, 他的 诱因 可能 是 完全不同 的那 因为他 诱因 不同 的话, 他 整个 疾病 的 进程 也是 很 不一样的。 有些人 进展 的 很快, 有些人 进展 的 很慢, 为什么? 这个 其实 都是 有 很多 个性化 的 东西 在 里边, 所以 哪怕 说 我们 现在 有 阿法 fod 可以 去 看 这些 蛋白 的 特性, 但 这个 蛋白 特性 可能 不是 他 唯一 的 一个 诱因。 所以 你 可能 说 只是 去 定向 治疗, 他 不一定 能够 对 每个 人都 有效。 当然 这个 要 展开 讲会 是一个 比较 大 的 话题, 当然 是 有 希望, 但是 可能 在 这个 领域 还是 需要 更多 的 工作 去 进行 投入 和 开发。

那 是否 合适 下一个 这样的 判断, 即便 alpha 4它再 持续的 去 突破, 在 实际 的 应用 场景 里面, 除了 我们 现在 知道 的 这些 大家 有 关注 的 热点 之外, 要 出来 更快 的 新的 投资 热点。 不同 的 投资 热点 可能 未必 短时间 内 我们 能够 看到。

其实 还是会 看到 的。 我 觉得 其实 很 重要 的 一点, 我们 作为 投资人, 包括 尤其是 在 医疗 领域 深耕 这么多年 投资人 来讲 的话, 非常 希望 看到 的 一点 就是 这个 领域 可以 吸引 更多 优秀 的 人才, 更多 大量 的 资金 来 投入。 那 现在 阿法 fold 它 不仅 降低 了 创新 的 门槛, 它 也 吸引 了 更多 人的 一个 兴趣 和 注意。 而且 我 觉得 很多 时候, 比如说 我们 每个 人都 有 自己 思维 的 一个 定式, 然后 用 我们的 局限性, 那 可能 我们 一直 在 生物 医疗 领域, 那 可能 想到 的 各种各样 的 应用 和 看 问题 的 角度 是 局限 的那 如果 吸引 各种各样 不同 背景 的 人 进来 到 的 这个 领域 去 探索 数字 生物学, 然后 用 阿尔法 这样 一个 有力 的 工具, 很 可能 我们 看到 的 商业 应用 的 角度 会 和 我们 以前 想象 的 都 不一样。 所以 我 觉得 我 还是 非常 乐观, 而且 非常。

期待 的对。 尽管 我们 前面 讲 对 阿尔法 负 的 从 正面 的 意义 和 它的 局限性 做了 很多 的 讨论, 可能 我 更多 体现 在 它的 局限, 它的 上游 的 方面。 但是 我 个人 其实 特别 乐观, 我 觉得 afford 他 真的 是 他 打开 了 一个 宇宙 的 大门, 我 个人 对 投资 没有 太多 的 接触, 但是 从 科学 的 角度 和 产业 的 角度, 我 觉得 它 打开 了 无数 的 想象力。

我们 以前 大家 都 停留 在, 其实 大家 都是 struggling 在 一个 蛋白 结构。 你 想象 我们 现在 很 容易 灿灿 你 都 可以 拿到 一个 蛋白 的 一个 跨 膜蛋白 的 一个 结构。 那你 就 想 这个 蛋白 结构 它是 到底 是 如何 去 引发 那个 疾病 的 呢?

我记得 上次 我们 讲 过 两个 蛋白质 的 结合。 我们 要 研究 一个 小分子 抑制剂 去 阻止 两个 蛋白 的 结合。 我们 举例 为是 两头 大象 在 打架, 我们 要 研发 一个 蚂蚁 去 阻止 他们 打架。 这些 可能 我 觉得 包括 蛋白质 和 这些 蚂蚁 之间 的 怎么 它是 到底 结合 在 哪个 位点 呢? 我们 举 个 例子, 蚂蚁 不可能 去 抓住 大象 的 鼻子, 它 可能 抓住 某 一个 位点 就会 阻止 它的 结合。

或者 两个 蛋白质 它的 结合 是什么 呢? 蛋白质 和 D N A 它 有没有 结合? 蛋白质 和 R A 它的 复杂性, 还有 刚才 张璐 讲 的 我们 对于 C N S 的 神经 退化 性疾病, 还有 对于 我们的 老大难 问题, 我们的 抗生素 的 研发, 还有 我们的 新冠 病毒 留下 的 如何 更快 的 去 开发 出新 冠 药物, 或者 我们 现在 最 流行 的 M R A 药物 的 研发。 以前 大家 想象 这些 都会 被 一个 你知道 蛋白 的 结构。 现在 我们 进入 了 一个 全新 的 一个 领域, 全新 的 宇宙。 所以 我 觉得 从 科学 上 看我 能 看到 这些, 我 觉得 投资 人们 也 肯定 能 从 中间 找到 不断 的 新的 兴趣 点。

对我 可能 想 再就是 也 补充 一下。 因为我 觉得 可能 大家 刚 开始 我们 就是 聊到 有 2亿个 蛋白 结构 被 发掘。 有一点 我也想 提到 说, 它 不 只是 动物 的 蛋白 结构, 其实 它 也 覆盖 了 像 植物, 还有 包括 像 细菌, 还有 包括 像 真菌、 微生物, 蛋白质 结构。 因为 其实 我们 也 最近 一直 在, 就 过去 几年 看 一个 方向, 那 就是 合成 生物学。 所以 我 觉得 从 这个 角度 的话, 其实 合成 生物学家 对于 他们 来讲 也是 一个 非常 好的, 非常 有利 的 工具。 现在 合成 生物学 这方面 的 商业 应用 还有 发展 也是 非常 快速 的。 而且 尤其是 我们 现在 讲 就是 像 植物, 真菌 相关 的 一些 合成 生物学 的 一个 进展, 其实 都 可以 被 大大的 推动。 所以 就像 刚才 提到 的, 就是 解放 了 大家 的 想象力 和 生产力。

从 结构 生物学家 的 角度, 从 合成 生物学家 的 角度, 到 整个 生物 数字 生物学, 我是 非常 期待 接下来 三四年, 而且 我也 相信 这个 领域 会 是一个 孕育 大 机会 的 领域。 也 特别 希望 今天 如果 很多 无论是 创业者 还是 投资人 在 听 这个 节目 的话, 可以 更多 的 关注 和 更多 的 去 投入。 我们 还是 需要 更多 的 人才 进来。 我 觉得 其实 资本 总是 有的, 其实 最 缺 的 还是 人才, 而且 尤其 缺少 的 是 跨行业 的 人才。 不是说 只是 单纯 从 它是 一个 生物学 背景, 或者说 纯 人工智能 背景。 而是 希望 可以 激发 更多, 就像 deep man 的 阿肆 的 团队 一样, 这 两批 可能 背景 完全 不一样的 人, 甚至 说 以前 可能 交互 不多 的 人, 可以 去 形成 一个 非常 强有力 的 团队 去 进行 各方面 的 应用 的 发展。

两位 觉得 在 of a four 还没有 能够 解决 的 问题 里面, 我们 说 A I 加 生命科学 未来 他 想要 解决 的 行业 痛点 还 会有 哪些? 不论是 对 工业界, 还是 对 投资人, 还是 对 创业者 来说。

制药 行业 的 痛点 可能 和 我们 这个 芯片 行业 刚好 翻过来, 我们是 遵循 的 一个 道 摩尔定律。 也就是 我们的 出 成果 会越来越 难, 成本 会越来越 高, 研发 的 周期 会越来越 长。 所以 这个 时候 行业 的 一些 痛点, 我 觉得 阿尔法 狗 的 这个 出现, 我们 刚才 已经 讲 过, 他 至少 在 早期 临床 阶段, 它 开发 了 一个 起到 了 一个 决定 作用。 我们 也 看到, 可能 在 未来 的 3到5年, 或者 现在已经 有 人工智能 的 公司 在 早期 阶段 起到 了 降本增效 的 作用。 而且 这个 痛点, 我们 也 看到 越来越多 的 数据 的 计算 的 科技 巨头 像 谷歌、 微软, 像 我们 中国 的 华为。 腾讯、 百度、 字节 跳动 越来越 觉得 去 要 去 加入到 这个 制药 行业。 用 计算 的 数据 的 结果 想 去 颠覆 这个 制药。 我自己 个人 还是 蛮 期待 两方面 的 碰撞, 去 解决 传统 制药 行业 的 这些 痛点 的。

会有 新的 F 跑 出来 吗? 就是 下一个。

up for 的。 我自己 其实 刚才 听到 张璐 讲 了 一个 名词, 合成 生物学。 我 课程 是 比较 觉得 乐观, 在 合成 生物学 的 这个 领域 会有 一个 下一个 阿尔法 ford 会 出现。 因为 刚才 张璐 也 提到, 我们 现在 的 科学 不是 一个 单一 的 一个 学科, 更多 的 是 需要 一个 复合 的 人才, 需要 去 碰撞、 去 交流, 去做 一些 事情。 回到 合成 生物学 的 一个 本身, 它 本身 就是 一个 交叉学科。 它是 基本上 有 生物学、 化学计算 科学、 生 信息学、 材料 学等 多个 学科。 它是 用 一个 工程 的 思维 去 理解 一个 合成 生物 的 一个 过程。

其实 人工智能 已经 在 合成 生物学 的 领域 已经 在 发挥作用。 但是 这个 还 停留 在 传统 的 算法 的 这个 阶段。 我 觉得 这是 阿尔法 ford 的 一个 突破。 或许 对于 人 人工智能 在 合成 生物学 领域 的 发展 的 能起到 借鉴 的 作用。 而且 合成 生物学 领域 它 会 集合 实验室 自动化 这 一条, 它是 又有 这个 理论 的 预测, 又有 实 用 实验室 自动化 的 实践。 这个 我 觉得 比较 乐观 的, 可能 在 3到5年 之内, 我们会 看到 在 合成 生物学 领域 会 出现 一个 巨大 的 突破。

国 才 他 怎么 跟 实验室 自动化。

结合 在一起 我们都知道 这个 所谓 的 人工 生物学 方面, 它 其实 有一个 基本 的 一个 循环, 叫做 D B T L 人工智能。 它 会 产生 一个 设计 实验室 自动化 帮忙 他 去 验证 这 它的 设计 是否 合理。 然后 反馈 会给 人工智能 加上 人工智能 它 本身 的 一个 算法 和 数据库 的 一个 不断 的 扩展 扩容。 可以 想象 它是 一个 正向 的 一个 迭代 的 一个 过程。 正向 迭代 的 过程, 我 觉得 可以 想象 我们 刚才 看到 阿尔法 for d 2.0, 它的 主要 突破 就是 它的 一个 算法 和 它的 数据库 一个 突破。 所以 如果我们 可以 mimic 这个 阿尔法 获 的 成功 的 路径 的话, 我 觉得 在 合成 生物学 领域 也会 出现 下一个 重大 的 突破。

有意思, 张路 你 怎么 想?

对我 非常 同意 国 才 老师 讲 的。 而且 我 可能 会 更 乐观 的 觉得, 不仅 会 出现 合成 生物学 呼吸 像 阿尔法 四 的 这样的 一个 量级 的 创新, 它 可能 会 出现 很多 个 加尔 法 fod 这样的 一个 不同 领域 应用 的 非常 具有 变革性 的 创新。 而且 在家 这几年 可能 很快 会 涌现。

而且 我 觉得 其实 非常 同意 刚才 郭 才 提 的 一点, 就是 它是 一个 正向 反馈。 那 我们 经常 讲说 你 用 人工智能 核心 是什么? 是 高质量 海量 的 数据。 现在 阿尔法 fold 通过 这样 一个 巨大 的 数据库 结构 的 这么 多蛋白 结构, 它 又是 一个 海量 的 数据, 可以 支持 下一步 的 算法 的 进一步 的 升级。 包括 在 这个 过程中, 这些 数据 也会 去 支持 这些 结构 生 数学家 去 进行 传统 实验 的 过程中, 获得 更加 精确 的 数据。 所以 这 是一个 越来越 正向, 越来越 加速 的 一个 进展 的 方式。

所以 我 觉得 其实 我们 现在 可能 可以 把 现在 这个 时刻, 我们 拥有 了 alpha fold two 这样 一个 巨大 的 数据库 工具, 用 工具 看作 一个 这个 行业 的 一个 拐点。 那 在 拐点 之后 的话, 它 就 不是 一个 线性 的 增长 了。 接下来 这几年 它 会有 一个 指数 性 的 增长, 而且 它 会 分叉, 分叉 到 各种各样 不同 的 层面 的 应用。 所以 合成 生物学 非常 看好 alpha fold two 的, 它 本身 的 工业界 应用 也 非常 看好。

那 我们 就 一起来 期待 一下。 因为我 觉得 上一次 从 F4 one 到 two, 然后 再再 到 现在, 它 解构 所有的 这种 已知 蛋白质, 其实 它的 更新 和 迭代 速度 是 越来越快。 没准 六个月 之后 又有 新发现, 到时候 我们 再 邀请 国 才 张路 一起来 帮 我们 看一下, 在 那个 阶段 我们 到底 能不能 看到 A I 在 科学 里面 alf 4还能为 我们 创造 什么样 的 想象 空间, 还有 哪 一些 有意思 的 玩家 可以 让 我们 打开 链接。 今天 就是我 觉得 节目 我们 聊到 这儿 已经 非常 充分 了, 也很 感谢 郭 才 和 张璐 的 时间, 希望 有 机会 可以 再再 找 两位 再 多 聊 一 聊。

好的, 谢谢。

这 期 what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G 艾特 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。

如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是 添加 声 小 音 小助手 的 微信, 声 F M1 数字 的 一 备注 早知道 听众 群 就可以 加入。 期待 你的 加入, 我们 下期 见。