欢迎 收听 硅谷 101, 这是 一档 分享 当下 最 新鲜 的 技术 知识 与 思想 的 科技 博客。 我是 红军。 最近 可以 说 ChatGPT 它是 火 出了 圈。 我想 很多人都 已经 在 讨论 ChatGPT 在 方方面面 的 应用 是 怎么样 的, 它 可以 做什么 事情? 今天 我们 就 从 生物科技 的 角度 来 聊 一 聊 P P T 跟 生物技术 的 结合。 今天 跟 我们在一起 的 嘉宾 是 水木 未来 的 创始人 郭 春龙。 Allen, hello.
Allen 你好, 嘿 红军 好, 我在北京。
对, 我们 上次 见面 还是 在 旧金山 的 时候, 那个 时候 感觉 ChatGPT 它 其实 还是 有 讨论 热度 的, 但 没有 像 今天 这么 热。 我 现在 觉得 所有的 新闻 都 已经 被 它 占领 了。 科技 新闻。
去年 我 印象 硅谷 那边 是 11月30 号, 北京 这边 12月1号, 最早 的 时间 就 尝试 了 一下。 我是 12月3号 发 了 一个 朋友圈。 当时 的 感觉 就是 这个 事儿 真的 会 改变 不止 一两个 行业, 会 改变 人类 生活 工作 的 方方面面。 结果 也就 这么 两个 多月 的 时间, 据说 已经超过 1亿的 用户。 这个 事儿 也许 能够 跟 当年 无论是 黄教 主管 他 叫 iphone moment, 或者 是 类比 互联网, 当时 的 时候 出了 一个 browser, 这 是一个 tipping point。
对, 因为你 是在 做 生物医药 领域, 你 可不可以 先 讲 一下 ChatGPT 它 跟 你们 公司 是 怎么 结合起来 的? 它 对 你们 公司 的 改变 大 吗?
其实我 自己 并不是 从 开始 的 时候 做 生物医药 行业, 我 恰恰 是 之前 做 I T 互联网 行业 有 十多年 的 时间。 本科 在 清华 学 的 是 核物理, 之后 在 U C berkely 做 double in。 过去 十几年 时间 做 I T 互联网。 从 15年 开始 跟 我的 一个 老朋友 王宏伟 教授 开始 在 探讨 规划 未来 的 当时 的 未来。 今天 我们 现在 其实 已经 在 create future, 将 life size 跟 A I 计算 相互 结合。
我们 相信 生命科学 是在 各个 学科, 各个 行业 的 发展 当中 相对 比较 晚 的 被 数字化。 水木 从 建立 第一天 拥有 全球 最大 的 一个 cross E M 的 平台, 到 今天 为止, 我想 我们 已经 给 全球 几百家 的 合作方 客户 提供了 最好的 结构 生物学 方面 的 服务。 结构 生物学 用 电镜 来去 解析 生物大分子 结构。 事实上 你可以 把 它 当成 是 我们 这个 碳基生命 或者 是 生物 世界 一个 数字化 的 过程。 它 相当于 是 carbon based 一个 world 和 silicon based world 一个 interface。 在 生命 的这 几亿年 时间 的 演化 历史上, 速度 总体上 还是 比较慢 的当 有了 芯片 之后, 集成电路 过去 这么 五六十年 时间 里面, 人类 见到 一个 又 一个 的 被 数字化 的 行业, 学科 发展 的 规律 就 不再 像 以前 那样 是 近乎 是 现行 的, 现在 是一个 指数 发生 的 增长。
GPT 我们 知道 A I 过去 十年 时间 里面 有一个 突飞猛进 的 发展, 但是 很多人 讲 起, 我 指的 是在 ChatGPT 出来 之前 讲 起 A I 的话, 还 感觉 这个 事情 里 所谓 的 改变 人类 的 生活, 我 还 有点 远, 更多 的 还是 读 一些 图片 呢。 阿尔法 food two 出来 之后, 整个 的 生命科学 里面 的 科学家 也好, 还是 产业 从业者, 对于 A I 有了 一个 更 具体 深刻 的 认识, 觉得 A I 可以 能够 相当程度 准确 的 预测 蛋白质 的 结构, 但 这个 离 design 生成 还是 有点 远。 ChatGPT 实际上 对 整个 的 生物医药 行业, 我想 它 带来 的 就 跟 它 面向 所有 其他 行业 带来 的 一些 全新 的 可能性 一样, 会 改变 整个 生命科学 的 这个 面貌 的。
他 会 怎么 改变 呢? 你 可不可以 讲 一下 他 对 你们的 一个 实际 帮助 是什么?
对 水墨 一个 以 电竞 和 结构 生物学 为 核心技术 的 公司 来讲, 实际上 是 至少 是 两方面 的。 一方面 ChatGPT 未来 要 进一步 的 能够 在 生命科学, 尤其是 把 结构 数据 利用 的 更好。 因为 所有的 A I 是 上 你的 基础, 前提条件 是 有 高质量 的 数据。 无论是 在 最初 训练 模型 的 一个 基本 的 bootstrap, 还是 后期 不断 的 优化。 电竞 事实上 是 提供了 训练 下一代 的 生成式 the general biology 的 一个 基础 和 training data。 所以 对于 电竞 和 结构 生物学 的 实验 数据 有 更 大量 的 需求。 没有 这些 数据 A I 无从谈起, 它的 效果 的 改进 更 无从谈起, 这是 一方面。
第二 有了 这些 数据, 事实上 在 新一代 的 生成式 A I 基础 之上, 我们 真的 是 可以 能够 生成 一些 之前 自然界 完全 不存在 的 新的 蛋白。 不 只限于 蛋白, 还 包括 其他 的 一些 核酸, 就是 生物大分子。 通常 讲 这个 影响 是什么 样子 的 呢?
我们 把 A I 或者 是 数字化 计算 在 生命科学 里面 的 应用 分成 至少 两个 阶段。 在 A I 出来 之前, 大家 最 关心 的 事情 是 怎么 利用 这种 计算 或者 A I 的 手段, 帮 我们 更好地 理解 自然界 已有 的 这些 蛋白, 它们的 结构。 所以 阿尔法 for two 它是 你 给 它 一个 sequence, 它 能够 帮你 比较 准确 的 预测 它 可能 会长 成 什么 样子。 阿尔法 伏特 度 之所以 在 过去 两年 时间 有一个 大 的 突破, 恰恰 是 之前 的话 是 积累 了 几十年 的 X 光 为主 的 结构 生物学 的 数据, 有的 这些 training data。 所以 阿尔法 二 它 可以 能够 在 之前 X 光 比较 擅长 的 领域, 就 这种 比较 小的 中小型 的 单链 蛋白, 它 可以 做 的 相当 的 准确。 因为 之前 积累 的 数据 都是 围绕 着 这种 比较 小的 中小型 单链 蛋白 的 结构 的 数据。
这个 是 上 一段 A I 在 生命科学 里面 的 一个 重点 的 应用, 用 这种 预测 的 方式 来 预测 我们 已知 的 这些 sequence 它 会长 成 什么 样子。 但是 进入 到 general 的 A I 时代, 事实上 科学家 或者 是 贝尔 泰尔 公司 就 真的 可以 能够 在 一个 近乎 无穷大 的 一个 广阔 的 这种 蛋白质 序列 和 结构 的 空间 里面 去 创造 一些 之前 并 不存在 的。 举 个 例子, 一种 可能 就是我 可以 给 A I 说 一句话, 说 帮 我 生成 一个 能够 和 GPR75, 这 是一个 很 重要 的 肥胖症 的 靶点, 能够 相互 结合 的 蛋白质 或者 是 多肽。 从 功能 方面, 从 结构 方面, 我们 提 一个 简单 的 需求。 A I 的话 它 就可以 output 一堆, 比如说 78个 生物大分子。 当然 最后的话 我们 还是 要 去 验证, 验证 的 阶段 仍然 还是 需要 电信 来去 最后 提供 biological 的 和 structure 的 verification。 我想 这个 会 是 一方面。 A I 对于 整个 的 生命科学, 对于 创新 药 的 研发, 对于 像 水木 这样的 结构 生物学 的 平台, 甚至 对于 croll E M 这样的 一个 最新 突破 的 技术, 它 带来 的 一些 机会 和 相互促进 的 一种 应用 场景。
你 刚刚 提到 了 针对 肥胖症 的 一种 靶点, 在 你们 现在 现实 的 工作 中, 你们 已经 会 拿 ChatGPT 去做 这种 生成, 还是 它 只是 一种 理想。 我问 这个 问题 的 初衷, 其实 是我 想知道 他 现在 在 生物 领域 的 表现 怎么样。 因为 其实 对于 这种 大 语言 模型 来说, 它 能够 生成 什么样 的 东西, 取决于 大家 给他 灌 了 什么样 质量 的 数据。 我不知道 现在 他在 你 所 需要 的 生物 的 学科, 当你 给他 一个 打点, 然后 有一个 需求 的 时候, 它的 数据量 或者 他 现在 的 模型 的 智能 程度, 是不是 已经 到了 能 给你们 真的 能 用 的 一个 结果 的 地步 了。
非常 好的 问题, 应该说 还没有 那么 ready。 生命科学, 尤其是 当我们 谈到 的 是 生物大分子 的 一些 结构 功能 数据 的 时候, 因为 我们 还是 需要 对 这个 数据 做 标签。 不同于 互联网 上 或者 是 我们的 真实世界 当中 存在 的 这种 大量 的 语言文字 的 信息, 这个 是 ChatGPT 能够 得以 突飞猛进 发展 的 一个 前提条件。
在 生命科学 领域 里面 加标签 的 成本 要 高 很多。 你 给 一段话 加上 个 标签, 事实上 这个 可能 成本 最 多一分钟 甚至 几秒钟 的 事儿。 但是 你 要 希望 给 一个 蛋白质 的 序列 加上 标签 的话, 往往 需要 涉及到 大量 的 实时 延时, 包括 电竞 的 数据 解 数据, 它的 成本 要 高 很多。 当然 以 水木 这边 为 代表 的 一众 实验室 和 商业化 的 公司, 在 这个 生命科学 数字化, 简单 点 说 的话, 我们 就是 解 蛋白质 的 结构 或者 生物大分子 的 结构 这块 的话, 效率 已经 比 之前 提升 很多 了。
未来 几年 的话, 我们 预期 可以 能够 用 很 低成本 很 高效 的 输出 大量 的。 比如说 针对 某一类 或者 某 一个 靶点。 我们 就 希望 针对 这个 靶点 去 创造出 一些 自然界 之前 还 没有过 的 蛋白质, 能够 和 它 结合。 当然 我 现在 讲 的 是 生物 药。 另外 一方面 的话, 你可以 是 针对 这种 小分子 药物, 这 是一个 很 具体 的 场景。 我 通过 先 去 实验室, 通过 大 通量 的 白质 或者 抗体 的 生成, 然后 把 它 输入 到 电竞 的 平台。 用 高通量 电镜 结构 解析 的 技术 可以 能够 生成 高质量 的, 也 还需要 一定量 的 基础 去 作为 training data。
反过来 训练 这个 A I 模型 之后, 我 再 提供 一段 功能 或 结构 的 需求 描述。 比如 像 我 刚才 讲 的, 我需要 一个 针对 GPR75 或者 是 GPR88 的 拮抗剂, 还是 机动性。 这样 A I 的话 它 就可以 基于 之前 的 训练 来去 看 高效 的 输出 一些。 这 一些 有可能 是 三五个, 也有 可能 是 三五十个, 取决于 我们的 一些 具体 参数 的 一些 调 优。
你 刚刚 提到 了 互联网 上 的 数据, 它 可能 就 还 比较 容易 获得, 那 优质 的 生物 结构 的 这种 数据 它 从 哪里 来? 或者说 我们 也 刚刚 反复 聊到 阿尔法 fold, 它 在 预测 蛋白质 解构 这件 事情 上 他 做出 的 贡献。 他的 这种 预测 是否 又能 变成 一种 类似 于 新的 数据源 呢?
好 问题, 生命科学 或者 是 生物医药 行业 很 特殊, 一方面 我们 有 类似 于 像 P D B 数据库 这样的 公开 public domain 的 数据集。 P D B 事实上 就是 阿尔法 food two 得到 很好 训练 的 一个 前提条件。 这个 数据集 是不是 可以 能够 很 好的 为 生成式 的 A I 提供 一个 training data? 简单 直接 的 回答 是 no。 因为 之前 P D P T 里面 积累 的 数据, 主要 还是 简单 的 蛋白, 或者 是 简单 的 蛋白 和 一些 小分子 的 复合物 的 结构。 这个 对于 我们 刚才 提到 的 这样 一个 目标 和 问题 能够 贡献 的 有限。 下面 生成式 的 A I 要 面临 的 挑战 和 机会 就是 在于 P P I 或者 是 蛋白 相互作用。
我们 事实上 就要 给 生成式 的 A I 提供 这样的 一个 数据集。 高质量 的 又 得 有 一定 的 量 的 基础。 大量 的 我们 预期 的 这个 数据集 是 需要 由 新一代 的 结构 生物学 的 平台 来去 生成。
不知道 有没有 回答 你的 问题, 就是 新一代 的 A I 对于 数据 这块 的 要求 一定程度 甚至 更高 一些。 这是 现在 已有 的 公开的 数据库 里面 是 不 具备 的。 有 一些 大公司, 包括 像 诺和诺德、 安进、 辉瑞 这样的 公司, 它 有 自己的 是 实验室 的 蛋白 库, 甚至 一些 抗体 跟 八点 复合物 的 数据库。 但是 总体上 这些 东西 完全 不 公开。 是不是 这样的 公司, 它 可以 能够 很 好的 把 他的 已 有的是 实验室 的 结构蛋白, 甚至 一定 基础 的 数据库 能够 公开出来。 Unlikely 或者 是 全世界 的 科学家 联合 起来, 能够 一起 搭建 一个 这样的 公开的 数据库。 或者 有 某个 创业 公司, 它 通过 自己 高通量 的 这个 平台 来去 generate 这样 一个 数据库。 这个 是 未来 我想 在 chat D P 时代 最 重要 的 一个 机会 和 挑战。
我是 看见 这 一轮 基于 开放式 大 模型 它的 创业。 就 比如说 硅谷 的 有一个 生物医药 科技 公司, 它 叫做 profit ent fluent。 对对对, 它 现在 也 推出 了 一个 大 语言 模型, 叫做 pro gen。 它 也是 做 这种 类似 于 蛋白质 语言 生成 这 一类 的。 而且 我看 新闻稿 里面 还 写 他们 通过 ChatGPT 做 的 一个 A I 模型, 创造 了 一个 新型 抗菌 蛋白 的 东西。 这个 蛋白 它 现在已经 验证 了, 它 可以 是在 实验室 里面 杀死 细菌。 这个 就是 ChatGPT 跟 一个 创业 公司 合作 创建 出来 的 蛋白。
除了 这家 公司 以外, 其实我 观察 到 有 很多 2015年 创建 的 公司。 比如说 generate by medicines, 还有一个 是 standing G M 然后 现在 还有一个 叫做 huma 点 A I 他们 跟 OpenAI 联合 发布 了 一个 叫做 life sound 的 平台。 就是 很多很多 这样的 创业 公司。 我 现在 的 一个 疑惑 是你 觉得 这些 做 应用层 的 公司, 它的 核心 竞争力 到底是什么 呢?
没错, 有了 ChatGPT 和 一种 类似的 底层 的 模型, 打开 了 在 各行各业, 包括 在 科学 创新 药 研发 领域 的 一些 应用 的 机会。 基本上 会有 一大批 创业 团队 开始 跳 到 这个 新的 战场 里面, 推动 在 各个领域 里面 的 最新 的 应用。 在我看来 这些 公司 如果 真正 想 建立 壁垒, 一方面 确实 取决于 他们 能够 自己 生成 数据 的 能力, 这个 是一个 fundamental 的 一个 chAllenge 和 opportunity。 另一方面 数据 之上 能不能 很 好的 和 他们的 算法 相互 结合。
其实 这 段时间 大家 听到 的 generate A I 也是 一个 大 的 umbrella 在 里面, 也 还有 不同 的 类型。 刚才 你 提到 的这 几家 公司, 你 像 refluent, 它 事实上 就是 典型 的 一个 基于 ChatGPT 这样的 模型。 另外 一家 the boss 那 家 叫 generate bio medicine, 和 prefiling 不大一样, 它是 基于 另外一个 生成 模型, 叫 扩散 型 的 模型。 这 两个 还是 有 差别 的。 扩散 的 模型 主要是 基于 文本 生成 图像, 用 这样的 一个 模型 A I 一个 绘画 程序 就可以 生成 一个。 前段时间 有一个 蛮 火 的 叫 mid journey, 不知道 你知不知道 这个 A I 绘画。
程序 对 我们 聊过, 还有 dali too me jersey 对 吧?
他 生成 的 这个 太空 歌剧院 又 获得 了 数字 艺术类 别的 冠军, 应该 是 去年 也是 OpenAI 的。 ChatGPT 它 始终 是从 另外 一条 路径 上, 不能说 去 解决 完全 一样的 问题。 但 这 两家 公司 你可以 认为 的话 是 有 一些 代表性 的, 一家 是 扩散 模型, 另外 一家 是 ChatGPT。 这个 很 典型 的 一个 模型, 两个 各有 优势。
扩散 的 模型 以 generate bio medicine 为 代表 的, 它是 可以 生成 这种 蛋白质 的 骨架, 但是 没有 办法 给出 一个 精确 的 蛋白质 的 氨基酸 的 序列。 反过来, refluent 事实上 你 给 它 一个 功能 的 描述, 它是 可以 能够 提供 一个 序列。 但是 它 并不 能够 精准 的 提供 蛋白 这个 结构。 两者 下面 的话 实际上 是 需要 做 一些 结合。 我想 这也是 水木 基于 电竞 平台 的话 下一阶段 要 做 的 探索。 就 结合 这种 扩散 模型 和 ChatGPT, 去 把 从 功能 或 结构 直接 能够 生成 一个 全新 的 蛋白质 的 这个 问题, 让 它 得到 更 彻底 的 解决。
相当于 你们 想做 这 两者之间 的 结合, 对 吗? 一个 类似 于是 语言 生成, 一个 类似 于是 图片 生成, 你们 想做 这 两个 之间 的 结合 最 完整 的 一个 解决方案。
是的, 当然 你 也 不能说 把 这 两个 往 那一 拼。 这 里面 很 关键 的 一点 就是 无论是 在 早期 的 模型 训练, 还是 后期 生成 蛋白质 结构 的 verification, 都 需要 电竞。 结构 生物学 电竞 的 实验 方法 在 里面 扮演 一个 非常 关键 的 角色。 事实上 上次 我在 boston 见到 january bio medicine 的 核心 团队 的 时候, 他们 正在 搭建 自己的 in house 的 crown E M 就是 冷冻电 竞 的 平台。 这一点 也 一定程度 上 在 我 预料 当中, 他们的 回答 也是 cross E M 冷冻电 竞 对于 整个 的 生成式 的 A I 下面 进一步 的 去 推动 这种 蛋白质 的 设计 至关重要, 非常 关键。
可以 理解 电竞 在 中间 起到 了 一个 验证 的 环节?
从 数据 原始 training data 的 生成, 这是 第一步, 到 后面 你 生成 之后 做 完了 蛋白质 的 设计, 最终 完成 verification 的 闭环。 电竞 在 里面 是 起到 一个 上下游 的 一个 衔接 作用, 没有 电竞 的话 是 没有 办法 形成 一个 闭环 的。
我 理解 了 我们 做 这种 生成式 AI 跟 生物 的 结合, 它是 在 解决 哪个 环节 的 问题, 可以 给 大家 大概 科普 一下 吗? 因为我 相信 很多 听 我们 播客 的 听众, 他 可能 是 偏 互联网 行业 居多。 他们 其实 对 生物医药 行业, 它的 整个 的 上下游 是 怎么 工作 的 可能 不太 知道。
很 重要。 这样 讲, 我们 说 生命科学 一定程度 上 除了 我们 好奇, 希望 了解 生命 的 本质 是什么, 为什么 人 会有 思想, 为什么 细胞 会 动 这些 基本 的 生命科学 的 问题 之外, 最 关键 的 应用 场景 或者 终极目标 是 治病, 或者 是 再 往前走 一步。 通过 药 有点 窄, 现在 往往 用 这个 serpula s 这 可以 是 某种 疗法。 其实 的 目标 是 解决 人类 或者 生物界 在 疾病 方面 或者 衰老 方面 的 终极 问题。 近点 说是 能够 治愈 癌症, 这是 到 目前为止 人类 最大 的 一个 生命 的 威胁 挑战。 长 点 说 的话 是 能够 甚至 一定程度 上 战胜 衰老, 让 人类 能够 在 自然规律 面前 可以 获得 更大 的 自由。
过去 这 一百多年 的 时间, 生命科学 或者说 是 生物医药 取得了 已经 非常 巨大 的 进步。 从 早年 的 青霉素 的 发现 衍生 了 一批 抗生素, 到 近期 比如说 中国人 到 目前为止 给 全世界 的 生物医药 做 的 主要 的 贡献 就是 青蒿素。 我们 都 还是 一定程度 上 在 黑暗 当中 摸索, 是 靠 盲 筛 或者 是 偶然 的 机缘。 青霉素 是一个 非常 偶然 因素 才发现 的。 这样的 方法 也好, 场景 也好, 是 广泛 的 存在 于 生命科学 和 生物医药 的 科研 当中。 一个 底层 的 原因 就是 我们 之前 并不 掌握 一些 今天 具备 的 先进 的 技术手段。 从 X 光 到 今天 的 冷冻电 镜, 它 可以 能够 让 科学家 在 分子 甚至 原子 层面 清晰 的 看到 生物大分子 它的 结构, 从 结构 来 推导 功能, 有 这样 一个 大 的 背景。
回到 A I 的 这个 话题, A I 最初的 时候 是 作为 一种 技术手段, 来 帮助 科学家 更好地 理解 已知 的 蛋白质 的 结构。 因为 毕竟 测序 的 技术 的话 要 提前 一段时间 发展到 目前为止 已经 比较 成熟 了。 所以 我们 很 容易 的 能 拿到 自然界 当中 存在 的, 包括 人 体内 的 这种 蛋白 或者 生物大分子 的 序列 的 信息。 但是 结构 的 信息 在 很 长时间 内 都 困扰 着 科学界。 能 不能用 比较 容易 的 技术 手 通过 测序 的 方法 来去 先 了解 蛋白质 的 基本 的 property。 我 再 通过 A I 的 方法, 通过 预测 的 方式 去 帮 我 间接 的 知道 它的 结构 长 什么 样子。
大家 知道 这个 生命科学 里面 有一个 最 重要 的 一个 法则, 就是 序列 决定 结构, 结构 决定 功能。 一定程度 上 我们在 两边 通过 测序 的 方法 了解 蛋白质 或者 是 生物大分子 它的 氨基酸 的 序列。 另外 一端 在 功能 方面, 我们 通过 传统 的 这种 生化 方法, 或者 你 简简单单 看 那个 病人 有什么 病, 就 知道 他的 function。 但是 中间 结构 这个 环节 一直 是 断 的。 所以 这 是在 两年 前 的 时候, 看到 阿尔法 for two 取得 这么 大 的 一个 突破。
全世界 为之 欢呼 的 一个 主要 的 原因, 就是 我们 终于 把 序列 到 结构 的 链接 给 它 开始 建立 起来 了。 但是 它的 意义 也 只限于 说 我 对于 已知 的 这些 蛋白, 我 开始 能够 从 序列 预测 它的 结构。 还有一个 更 重要 的 问题 就是 我们 要 去 治疗 某 一个 疾病, 针对 某 一个 靶点, 要 找到 一个 能够 和 这个 靶点 相互 结合 的 实现 某种 功能 的 一个 新的 分子。 这个 新的 分子 最大 概率 它 可能 真的 不是 自然界 已知 的 这个 序列, 或者 是 已知 的 蛋白质。
大家 通常 认为 小分子 它的 药 的 结构 的 空间 可能 是 十 的 50次方 这样的 一个 很大 的 一个 空间。 做 一个 小分子 药 要在 10的50次方 母 这样的 一个 space 里面 找到 最合适 的 一个 小分子, 本身 已经 是一个 很大 挑战 了。 如果我们 现在 在 探讨 的 是 这个 生物 药, 那 这个 空间 的话 就要 比 10的50次方 还要 更加 提升 很多 的 数量级。 用 传统 的 方法 来 设计 这个 生物 药, 显然 没有 可能 去 穷尽 这些 空间 的 可能性。 但是 有了 这个 生成式 的 A I, 我想 科学界 和 生物 医药界 就 掌握 了 一个 更 powerful 的 工具, 来 探索 之前 对 人类 而言 基本上 是 一片 黑暗 的 近乎 无穷大 的 生物 药 的 广阔 的 空间。 给他 提供 一个 基本 的 需求。 它 会给 你 输出 很有可能 能 满足 你 需求 的 一个 全新 的 蛋白质, 一个 抗体, 甚至 是 一段 核酸。
我 觉得 整个 过程 听起来 非常 的 震撼。 就 简单 来说, 它 其实 是在 我们 制药 或者说 治病 的 第一步, 就是 研究 发现 药物 发现 的这 一步, 它 起着 非常 重大 的 作用。
对 大家 对于 生物医药 可能 最熟悉 的 场景 还是 医院 或者 是 吃的 这个 药。 但 事实上 这个 药 进 到 病人 口中 之前 的话, 往往 需要 很多年 的 摸索。 在 过去 这 一百多年 的 时间 当中, 做 药 的 方法 或者 是 研发 新药 的 方法, 基本 都是 靠 盲 筛。
有了 结构 生物学, 科学家 就可以 像 举 个 例子, 就像 设计 一把 钥匙 去 开 一把锁。 我们的 某个 疾病, 它 是因为 某个 分子 产生 问题 了, 我们 称之为 这个 分子, 就是 这个 疾病 的 靶点。 我要 去 设计 一个 分子, 可以 是 小分子, 也可以 是 大分子, 和 这个 靶点 相互 结合, 就像 一把钥匙开一把锁。 以前 我的 方法 就是 我 有 一。 一个 库, 这个 库 里面 可能 会有 11个小分子, 我 就 把 这个 11个小分子 挨个 试 一遍, 最终 有可能 找到, 有可能 这 11个小分子 里面 没有 一个 能 开 热 玛索, 这就是 原来 方法 的 问题。
现在 我 用 最新 的 手段 实验 方法, 传统 的 是 X 光, 新一代 的 是 通通 电镜, 去 精确 的 测量 观测 到 这个 锁 长 得 是什么 样子, 它的 锁眼 是 什么样 的 结构。 我 就可以 去 设计 一个 或者 是 小分子, 或者 是 抗体 序列 来去 和 它 很 好的 结合。 这就是 一把 钥匙 开 把 锁。 如果你 能够 找到 的这 把 钥匙, 它 副作用 又 小, 功能 又 强, 这就是 一个 最好的 药。 以前 我们 吃的 很多 的 药 未必 是 最好的, 它 或者 是 有 很多 的 副作用, 或者 是 它的 功能 没有 那么 强。 技术手段 的 价值 在于, 第一 找到 一个 钥匙, 第二 这个 钥匙 的话 比 以前 的 钥匙。
还要 更好 一些。 那你 觉得 有了 ChatGPT, 它 可以 帮 科学家 节省 多少 的 时间 呢?
这个 几乎 是 很难 去 量化 评估。 最 关键 的 是 有些 靶点 没有 新的 技术手段, 你 可能 100年之后 还 找不到 合适 的 分子。 我 很难 用 一个 说 平均 能 节省 多少 时间 这个 词 来 概括 新的 技术 对于 这样的 一个 人类 面临 的 终极 问题 的 解决 手段 带来 多少 的 好处。 他 打开 了 一些 全新 的 可能性。 Exactly.
我 理解 它 类似 于 就是 有 一种 全新 的 方法, 它 能 帮你 短期 迅速 验证 这些 无穷的 可能性, 给你 一些 更 靠谱 的 可能性 的 解决方案 方案。 这样 来 理解 的话, 接下来 就 可能 是 整个 生物医药 突飞猛进 的 时候 了。
现在 说 立刻 两三年 之内 的话, 就会 产生 这种 是 有的 这样的 tive。 AI 的话, 再 过 两年 一款 基于 generate A I 的 药 就 上市, 这个 太早 了。 因为 我们 先 来看 整个 的 医药 研发 过程, 刚才 讲 的 都 还是 在 早期 阶段。 没错。
真正 让 一款 药 从 发现 优化 开始 进 到 临床 ready, 临床 123期最终 F D A 批准, 往往 需要 经过 漫长 的 过程。 那 A I 是不是 能够 在 后续 的 这些 药物 验证 当中 能够 发挥 更大 的 价值, 这个 一定 会有 很多 的 帮助。 但是 它 并 不像 早期发现 阶段 会有 这么样 的 一个 实质 的 提升 的 价值。 因为 后期 它 毕竟 还 涉及到 你 要把 这个 药 放到 动物 里面, 或者 放到 人的 真正 身体 里面 去 测试。 这个 过程 还 不太 容易 说 几个 数量级 这样的 效率 的 提升。
我们 上次 其实 在 旧金山 有 聊到 一款 药物, 他 从 最 开始 研究 到 最后 形成 一款 能够 上市 的 药物, 它 中间 有 哪些 环节? 而且 我 今天 还是 用 这个 问题 去 问 了 一下 ChatGPT, 我 觉得 他 给 的 回答 也 非常靠谱, 跟 你 上次 跟 我 讲 的 特别 像。 他说 第一个 环节 首先 是 研究 发现, 就是 科学家 要 找到 一种 新的 治疗 方法, 这个 是 基于 大家 对 生物学、 药理学 的 研究。 第二个 是 药物 开发, 当 他 有了 方法 以后, 他 要 去 开发性 的 药物, 包括 合成 化合物, 对 其 进行 筛选 和 评估。 第三个 方向 就是 有 一些 基本 评估, 评估 药物 的 有效性、 安全性。 前面 的 基本上都 是在 研究 阶段 的那 之后 他 就会 进入 到 动物 实验, 然后 到 临床试验。 临床试验 以后 就是 药物 去 通过 药物 批准。 最后一个 就是 进入 到 这些 药厂 的 销售渠道, 然后 市场推广 大概是 这么 七个 步骤。 我 觉得 好像 ChatGPT 的 回答 还 挺 靠谱 的。 然后 我们 刚刚 讲 的, 包括 你们 做 的, 我们 理解 应该 就是 在 最早 的 药物 发现 环节。
是的, 1发现 环节 至关重要。 因为 之后 你 对于 它 进行 的 处理, 药 代, 包括 临床 的 123期, 你的 分子 已经 确定 了, 你 只是 不断 的 去 深化, 了解 它的 功能 和 它的 副作用。 如果 早期 你的 分子 选 的 不对, 你 会 发现 后期 的 development, 尤其是 进入 临床, 最终 花 的 钱 越来越 多了。 有 太多 的 项目 死 在 临床 的 一期、 二期 甚至 三期, 最终, 这样的 项目 就 血本无归, 得 重新 回到原点 来去 找 新的 分子。 所以 最早 阶段 的 分子 的 发现, 如果 它 能够 覆盖 更大 的 广阔 的 空间, 就有 更大 的 成功 的 概率。 这个 对于 后期 的 验证 至关重要。
所以 你可以 认为 早期 的 这个 研发, 它 相当于 是一个 baby 的 诞生。 如果 他的 基因 是 好的, 那 之后 长成 成人 的话, 他 可以 能够 给 社会 做出 很多 的 贡献, 他 会 是一个 好 药。 如果 他的 基因 本身 就有 问题, 那 虽然 他 也 能够 活, 但 可能 其实 过去 这么多年 的话, 也 还是 有些 药。 你 会 发现 长大成人 之后 的话, 资质 平庸, 甚至 是个 傻子, 这样的 情况 是 有的, 有 很多。
你 可不可以 从 整个 生物制药 的 产业链 条, 包括 商业 上去 给 大家 解析 一下 一款 药 它 成本 最高 的 是 哪些 环节。 包括 你们 做 这个 药物 发现, 谁 会给 药物 发现 买单, 你们的 下游 是 哪些 公司。
我 举 个 例子, 因为 最近 刚刚好 有一个 非常 典型 的 一个 deal。 生物医药 行业 的话, 经常 你 会 发现 一款 药 达成 了 一个 重量级 的 合作。 巴斯顿 有家 公司 叫 一家 公司, 是一个 很 特殊 的 存在。 原因 是 另外 一家 公司 基于 纽约 的 叫 shopping 沙丁 格, 做了 有 三十多年 时间。 直到 两三年 前 的 时候 刚刚 上市。 一家 做 基于 结构 和 计算机辅助 设计 的 软件 的 这样的 一个 公司, 做了 有 30年 的 时间。 他 背后 的 股东 包括 籴 少, 比如 gates, 这家 公司 对于 刚才 我们 提到 的 基于 结构 和 A I 去做 药物 研发 非常 关键。 一方面 当然 是 他 做 的 时间 很久, 第二 的话 他 确确实实 他 提供 的 工具 基本上 被 行业 里面。 无论是 大 的 药 企 还是 创业 公司, 只要 这个 团队 是在 认真 的 做 药物 研发, 基本 都 离不开 这个 薛定谔 的 工具。
Limbers 是 十几年 前 薛定谔 投 的 一个 biot 公司。 因为他 意识到 如果 只是 提供 工具 的话, 他 没有 办法 去向 市场 证明 你看 我的 工具 多 有用。 因为 生物医药 整个 的 研发 周期 实在是 太 长了, 你 真正 去 完成 一个 闭环 往往 需要 几年, 甚至 十几年, 甚至 一二十年。 投资 这家 nimbus, 他 就 希望 向 全球 展示, 你看 我 除了 提供 工具 之外 的话, 我 还 可以 用 我的 工具, 真正 的 意义 上 推动 一些 完全 是 基于 计算 和 结构 的 药物 研发。 这家 公司 经过 十几年 时间 的 发展, 在 去年 12月份 的 时候 正式 announced 他的 一款 药 卖给 他 ki 的 五天 制药 卖 了 六个 billion dollars。 更 关键 的 是 有 upfront 首付 是 40亿美金, 这个 对于 任何 一个 高台 公司 都 是一个 home run。
Limbs 经过 十几年 的 时间, 真正意义 上 完成 了 一款 基于 结构 计算 的 精准 的 药物 的 发现 和 后期 的 开发。 进入 到了 现阶段 的话, 应该 是 临床 二期 它 可以 收 了。 我 用 这个 例子 来说 一下, 在 整个 的 药物 研发 过程 当中, 最 关键 的 一个 环节, 其实 就是 早期 你 这个 分子 的 确定。 对于 一个 全新 的 靶点, 最难 的 地方 也是 怎么能够 找到 一个 分子 能够 和 它 结合。 当然 这个 结合 还有 多种 方式, 为了 实现 不同 的 功能, 有 一些 靶点 你 需要 找 的 是一个 抑制剂, 就是 抑制 这个 靶点 蛋白 的 功能。 有 一些 八点 的话 你 需要 找 的 这个 激活剂, 另外 一些 的话 需要 一些 拮抗剂。 找到 这样的 一个 starting point 是 后续 所有 开发 的 一个 基础。
在 很多 的 表态 公司 里面, 事实上 这个 过程 都 还是 很 随机 的, 有 很大 的 运气 成分。 有了 结构 生物学, 包括 性 和 刚才 提到 的 这个 生成式 的 A I 我想 我们在 最早 的 源头 创新 这个 分子 的 发现, 这 阶段 的话 就有 了 更 强大 的 武器。 后期 在 分子 基础 之上 做 进一步 的 优化。 无论是 说 降低 它的 副作用, 提升 它的 溶解度 吸收率 这些 经验 也好, 还是 平台 也好, 团队 也好, 市场上 相对来说 的话 是 比较 成熟 的。 但 他 花钱 越 往 下游 做 会越来越 多, 尤其是 进 到 临床 一期、 二期、 三期, 往往 到了 三期 的 时候, 十 亿美金 这样的 临床试验 都 不在 很 少数。
早期 阶段 并 不是说 花钱 最多 的, 但 它 一定程度 上 是 最难 的。 它的 难 不 在于 说 你 不 掌握 这些 资源, 而 在于 它是 一个 更 接近 于 科学 探索 的 一个 属性。 所以 很多 的 药 企 他 把 这 阶段 的 工作, 一方面 仰仗 外部 大量 的 生生死死 的 小的 胞胎 公司, 另外 一些 来源于 大学 科研院所。 这也是 为什么 boston 成为 全球 药物 创新 的 一个 核心 的 基地, 因为 那 里面 有 harvard 和 M I T。 这也是 为什么 北京 在 中国 这 轮 生物医药 创新 当中 会 扮演 很 重要 的 角色。 因为 北京 这儿, 尤其是 昌平 的 生命科学 园 紧靠着 北大清华。 中国 的 原创 科研, 尤其是 生命科学, 尤其是 结构 生物学 的 原创 科研, 在 过去 十几年 时间 里面 已经 取得了 很 突飞猛进 的 发展。 甚至 在 一些 学科 领域 里面, 比如说 结构 生物学 和 电竞 方面, 已经 超出 了 哈佛、 剑桥, 成为 全球 的 一个 制高点。
我 觉得 这 可能 也 回答 了 为什么 像 辉瑞 这样的 公司, 它 其实 在 二十多年 的 时间, 它的 股价 是 一直 在 处于 一个 低迷 期。 他们 公司 是 一直 在 做 药物 收购。 我 印象 中 他 上 一款 自己 造神 的 药 还是 伟哥 这 款 产品, 对 吧? 没错, 对他 之后 你说 他 自己 独立 研发 的 药物 有什么 呢? 可能 还有 一两款。 但 它 绝大部分 在 这个 20年 里 创造 辉煌 的 药, 它 都是 靠 收购 而来 的。 我们 去 观察 这家 公司 的话, 它 可能 更 像是 一个 类似 于 投资公司。 因为 它 要把 市场上 的 这些 可能成为 爆款 的 要 收购 过来, 更 像 一个 销售渠道, 像 一个 做 药物 审批 的 这样的 一个 机构, 对 吧? 这就是 大 药厂 为什么 创新 越来越 乏力。 他 要 去 跟 这些 前面 小的 这种 药 企 的 创业 公司, 甚至 你说的 大学 的 科研 实验室 来 合作。
你说的 没错, 大 药 企 经过 过去 这么 一两百年 的 发展, 才 意识到 源头 创新 是件 很难 的 事情。 之前 无论是 辉瑞、 mark, 都 曾经 栽 在 一些 大 的 项目 上, 一个 项目 上 损失 10亿美金 是 少 的。 所以 经过 这 几十年 的 发展, 大家 形成了 这样的 一个 合作 共赢 的 模式, 是一个 生态系统。 大 药 企 最 关注 的 是 它的 渠道 和 资本, 它 对于 管线 创新 和 后期 研发 的 管理, 更 像是 资产管理 源头 创新 领域 里面 是要 仰仗 大量 的, 尤其是 像 boston 湾区, 还有 3 vago, 美国 的 去 三四个, 不断涌现 出来 的 小型 的 这种 百 奥泰 公司 的 团队, 失败 概率 非常 高。 但是 失败 没关系。
资金 的话 大家 看到 无论是 在 boston 还是 在 硅谷, 会有 大量 的 围绕 着 生命科学 的 这些 专门 的 基金。 这些 基金 相对于 中国 生物医药 领域 的 基金 有 个 很大 的 差别。 那你 可能 注意到 第一 它的 很多 的 资金 L P 是 来源于 这些 大 的 药 企 的。 大地 药 企 通过 这些 基金 在 很 早期 参与 投资 这些 初期 的 高风险 的 创业 企业, 到大 奥泰 公司 发展到 一定 阶段 的 时候, 它 有可能 甚至 在 preclinical, 也有 可能 是在 一期、 二期、 三期 的 时候 作为 接盘, 把 它 在 下游 的 时候 再 给 它 收到 大 的 药 企 里面 来。 可以 大 央企 在 整个 尤其是 美国 的 生态系统 里面 扮演 一个 非常 关键 的 角色。 他是 早期 源头 创新 的 资金 提供者, 也是 奥 泰尔 公司 产生 阶段性 成果 之后 的 进一步 的 接盘 的。
中国 整个 的 生态系统 还 远远 没有 形成。 一方面 是 中国 的 医药, 大家 比较 了解, 它 有 很大 一部分 是 传统 中药 的。 这部分 一定程度 上 在 创新 方面 之前 跟 全球 的 接轨 不是 非常 的 完整 和 紧密。 经过 过去 十几年 时间, 大 药 企 在 中国 的 这个 研发 之前 还是 做了 很多 的 投入。 虽然 最近 的话 撤 了, 但 已经 为 中国 的 整个 生物医药 行业 培养 了 大批 相关 的 人才。 不过 从 资本 方面 到 产业链 的 完整性 方面, 在 创新 方面 是 远远不够 的。 这个 是 中美 两边 从 资本 到 生态系统 方面 很大 的 一个 差别。 另外 还有 一点, 美国 的 巴尔 泰 公司 很多 都是 由 基金 直接 孵化, 基金 在 里面 占 的 比例 很高。
基金 是 指 什么? 基金 是 指 药 企 的 基金 还是 风险投资 基金?
风投 基金 当然 这 风投 基金 里面 有 很多 背后 都有 药 企 的 身影。 像 那个 大 的, 比如 这个 flagship, 像 sir rock, 那 有 很多 硅谷 boston 这边 为 代表 的, 他们 很喜欢 去 由 基金 来 主导 全局 孵化 背后 的 原因 很 简单, 因为 这些 基金 一方面 掌握 专业知识、 行业 经验、 人才 资金, 它 基本上 处于 主导 的 全局 的 位置。 他 看到 了 一个 趋势 方向, 看到 的 行业 里面 或者 是 大学 实验室 里面 有一个 新的 机会 和 新的 技术, 他 可以 能够 迅速 的 去 组织 一个 团队, 然后 提供 大量 的 资金。 往往 一开始 的 时候 就是 几十个 million 负责 创新 的 大学 科学家。 他 只要 提供 他的 源头 的 核心技术 和 他的 发现 就 够了, 并不需要 他 去 操心 产业化。 包括 团队 搭建 和 公司 的 运营, 是 由 基金 方 他们 来去 组织 整个 的 运营管理 的。
中国 这方面 的 尝试 并不多, 虽然 已经 开始 有 基金 开始 这么 尝试 了。 背后 的 原因 很 简单, 因为 你的 投资方 这方面 经验不足, 资源 不足。 有 很多 中国 的 投 生物医药 的 公司 的 基金, 它 事实上 是从 投 I T 转来 的, 还有 一些 投 一些 传统 的 这种 项目 来 转向 投药。 因为 看到 了 生物医药 这个 机会, 但是 他们 在 生物医药 行业 方面 的 经验 背景, 技术 的 洞察力 都是 远远不够 的。 所以 他 没有 能力 去做 这种 全局 的 事。
就 简单 来说, 如果 要 做成 生物医药 非常 专业 的 投资 机构 的话, 他 可能 既 需要 懂 这些 非常 前沿 的 技术, 同时 他 需要 懂 每一个 药 里面 他的 研发 背景, 包括 科学家 他的 研究 脉络。 所有的 不管 是 说 新冠 还是 艾滋, 还是 其他 的 一些 流行 疾病 或者 癌症, 它的 那个 研究 支线 是什么? 同时 这个 是 药物 的 一边, 还要 懂 销售 到 批准 到 渠道, 就 方方面面 的 事情。 类似 于 创业 公司, 他 只需要 做 一件 事情, 就是你 把 这个 药物 的 最 开始 我们 刚刚 说 的 那个 研究 发现 分子结构 弄出来 就行了。 后面 的 这些 其实 他 可能 就 卖给 大型 药 企, 或者 这些 基金 就 来 帮 他 找 下一步 的 接盘 手 了。
没 没错 没错, 对于 任何 一个 初创 公司, 要 想 掌握 将 一款 药 从 源头 创新 到 临床试验 推向市场 这个 完整 的 链条 里面 所有的 技能, 这 基本上 不 现实 的。 美国 的 资本市场 已经形成 了 这样的 一个 套路, 它的 基金 事实上 背后 依托 于 大 药 器 核心 的 这些 partner, 都 还是 在 大 药 企 里面 工作 了 很多年。 从 最初 这个 源头 创新 到 后期 的 药物 的 研发、 审批、 流程、 监管 都很 清楚。 即使 他的 基金 里面 没有 完整 所有的 人, 但 他 很 容易 能够 在 行业 里面 抓 到 这个 对应 的 人, 迅速 的 组成 一个 团队。 这个 是 美国 之所以 能够 成为 全球 药物 研发 创新 的 driver 的 一个 很 重要 的 原因。
如果我们 总结 一下 说 谁 在 为 像 你们 公司, 或者 像 project, 或者 像 generate bio medicines 这种 公司 来 买单 的话, 就是 做 药物 研发 的 这些 创业 公司 和 大型 药厂。
大型 药厂 是 整个 产业链 的 背后 的 driver。 水木 这个 平台 和 模式, 它 更多 的 是 给 源头 创新 带来 全新 的 可能性。 实验 方法 结构 生物学 的 这样的 一个 基础 的 能力。 结合 A I 今天 的 生成式 的 A I 能够 让 创新 药 企 在 源头 最 早期 的 时候, 可以 能够 探索 比 之前 广阔 的 多 的 大 的 分子 空间。 我想 这个 是 底层 的 一个 physical 的 background。 如果 没有 这样的 技术 结合, 是 实验室 和 A I 的 计算 的 能力, 靠 传统 的 方法 有 很多 的 疾病 靶点 是在 做 1000年 也 做 不 出来 的。
你 刚刚 提到 了 美国 有 三大 医疗 创新 中心, 在 boston 硅谷 跟 3d ago。 可不可以 分别 聊 一下 这 三大 医疗 中心 它是 怎么 形成 的, 背后 的 一些 背景 文化。
我自己 并不是 生物医药 这个 背景 的, 一定 有人 讲 的 比 我 好。 我 这次 疫情 期间 的话, 终于 可以 有 机会 到 boston 呆 了 几个 月 的 时间。 湾区 我 相对 更 了解 一些, 不过 之前 在 湾区 的 时候, 更多 的 是从 I T 互联网 的 角度 来去 切入 的。 Boston 情况 比较 特殊, 它的 创新 药 的 核心 称之为 kindle square, 是一个 面积 不大, 位于 M I T 麻省理工 校园 边上 的 很小 的 一个 区域。 在 这么 小的 一个 区域 里面 汇聚 了 全球 最 顶级 的 药 企, 包括 它的 研发 总部, 还有 大量 的 早期 的 药物 研发 的 公司。
Kindle square 的 崛起 是 早 在 大概 20年 前 吧, 背景 也 比较 有意思, 就是 这个 区域 本来 是一个 脏乱差, 以前 甚至 是 没人管。 原来 本来 肯尼迪 要 在那边 建立 一个 NASA 的 一个 新的 基地, 后来 肯尼迪 总统 遇刺 之后 的话, 这事 就 撂下来, 以至于 很多年 时间 呢, 里面 是 一些 落后 的 厂房, 管理 也很 乱。 后期 政府 是 要求 M I T 把 这块 给他 接管 起来, 给他 做好。
到了 20年 前 的 时候, 开始 有 像 C I C 这样的 孵化器 一步一步 的 建立 起来。 从 最早 罗氏 辉瑞 开始 入驻 到 kindle skirt。 经过 这么些 年 的 发展, 尤其是 过去 大概 七八年 时间, can do square 已经成为 全球 药物 创新 的 最 核心 的 一个 基地 了。 它的 优势 在于 非常 的 集中。 你 基本上 在 办公室 里面 下楼 吃 个 饭, 可能 能 碰到 几十个 邀请 的 人。 无论是 作为 C R O 的 公司, 还是 L T G 的 总部, 它是 一个 人才 汇聚 信息交流 的 一个 非常 方便 的 一个地方。
相对 波斯顿 而言, 湾区 地域 广阔 一些, 发展 空间 更大。 但 这个 也 使得 相互 的 交流 没 像 cambridge 那边 那么 便捷。 从 区域 方面, biotech 的 这个 汇集 地, 从 旧金山 里面 的 mission E U C S F 当年 那个 genetech, 你可以 认为 湾区 的 bell tech 行业 发源 于 genentech 微生 贝 那边 汇聚 的 一部分 孵化器 和 创新 企业。 往 南 到 south na cisco, 往 下游 沿着 这个 半岛 像 some motel, some carles, 甚至 再 往 南三 列表 这边 也有 很多 的 创新 药 企 汇聚。
硅谷 的 发展 从 最 开始 为什么 叫 silicon valley? 是因为 以前 是 芯片 的 一个 发源地。 到 20年 前 的 时候, 其实 已经 从 silicon valley 变成 了 一个 internet valley。 到 今天 生物医药 行业 的话 开始 进一步 的 发展。 也许 某一天 的 时候, 就会 变成 一个 biotech valley。
但是 硅谷 的 最大 的 优势 在于 的话, 它 确实 是对 新技术 非常 的 开放, 从 文化 上 的话 兼容并包。 对于 我们 中国人 的话, 我 到 波士顿 感觉 虽然 环境 很好, 但 你 感觉 中国人 在那边 的话 还是 一个 guest。 但是 在 湾区 这块 的话, 它是 一个 purely international 的 一个 tag hub。 无论是 亚洲人 还是 中国人 的话, 相对而言 的话 会 feel 更 at home。 Boston 那边 也有 很多 的 中国 的 创业者, 做 biotech 的 C E O 但 你 发现 在 boston 的 中国 的 biotech 的 C E O 拿 的 钱 几乎 90% 多 都是 中国 的 钱, 还是 有点 泾渭分明。
传统 的 白人 的 基金 和 中国 的 资本 在 美国 都有 涉猎, 但是 两边 的 文化 并没有 在 boston 这个 区域 里面 完全 融合。 这个 事情 在 city valley 我 觉得 就 没 那么 明显。 总体上 无论是 基金 也好, 还是 创业者 也好, 相对而言 的话 是 更加 开放 的 一个 环境。
3d echo 这 一块 的话, 我 了解 的 没有 那么 多。 它的 区域 优势 一方面 也有 不错 的 大学, 气候 也 非常 棒。 从 历史 方面 的话, 并没有 像 湾区 和 boston 这样 汇聚 这么 密集 的 巴尔 泰克 公司。 但是 未来 发展 的话, 我想 空间 也 还是 很大 的。
然后 你 刚刚 其实 也 提到 了, 整个 中国 不管 是在 制药 上 的 环境, 还是 在 投资 上 的 环境, 跟 美国 还是 有 很多 的 不一样的。 你 觉得 这个 是 跟 中国 的 大型 药厂, 它 还没有 形成 像 美国 这种 药厂 的 非常 市场化 的这 一套 是 有关系 的 吗?
这个 因素 就 太多 了, 跟 中国 的 文化 有关系, 跟 中国 的 传统文化 在 医药 领域 里面 根深蒂固 的 一些 习惯 观念 有关系。 毕竟 中国 这个 中药 还是 渗透到 中国人 的 血液 里面 去。 事实 中药 企业 对于 今天 我们 讲 的 这种 源头 创新 的 新药 研发 基本上 不 沾边儿。 你可以 认为 那 是一个 文化产业。 所以 真正意义 上 技术 驱动 的 新药 研发 在 中国 还是 一个 相对 的 新事物, 这是 第一。
中国 的 优势 反倒 是在 大学 的 基础 科研 方面, 相对于 海外 的 同行, 我 认为 差距 没有 那么 大。 甚至 一些 个别 领域 已经超过 海外 最 顶级 的 院所。 可是 在 综合 的 药物 研发 和 新药 产业 方面 的 发展, 差 的 可能 不是 十年, 这 是一个 大 的 背景 的 背景。 刚才 我 已经 提到 有 文化 的 因素, 有 药物 产业。 你的 总体 规模 没有 到 那个 份儿 上, 你 就 没有 充裕 的 过剩 的 资本 去 反过来 去 回补 你的 早期 的 原创 科研。 这也是 中国 的 大 的 药 企, 在我看来 可能 还没有 发展到 那个 份儿 上, 到 现在 为止 也没有 任何 一家 中国 的 企业 能 进 到 全球 的 前 十, 差 的 还是 有些 距离。
假以时日 无论是 在 市场 规模 方面, 还是 在 源头 创新 方面, 应该 中国 还是 处于 一个 不断 的 高速 的 上升期。 目前 来看 的话, 至少 在 美国 的 市场 上大 药 企 是 有 这样的 利润 空间。 可以 使得 它 在 市场上, 在 药物 上市 了 之后, 能 赚 到 巨额 的 利润, 才 可以 支持 它 独步 全球 的 这种 研发 能力。
讲 的 非常 好, 因为 你们是 2017年 成立 的, 你们 在 做 的 过程中 正好 遇到 了 这次 像 生成式 A I 整个 市场 的 一次 类似 于 大 爆发。 你 自己 觉得 身处 其中, 这 对 你们 来说 是 一次 非常 大 的 机会 吗?
非常 大对 任何 一个 行业 里面 关注 源头 创新, 关注 数字化 的 变革 的 企业 来讲 的话, 这 都 是一个 巨大 的 机会。 类似 于 如果你 做 无线 互联网 出了 一个 iphone。 如果你 关心 的 是 信息产业, 二十几年 前 在 硅谷 的 时候, 这个 netscape 互联网 的 大 爆发。 这 几轮 技术 和 市场 的 突破, 都 是因为 某个 产品 真正 引爆 的 需求, 让 大家 看到 了, 这世界 原来可以这样 子。
对于 水木 而言, 因为 我们 本身 是 发源 于清华 的 科研, 有一个 在 结构 生物学 的 电竞 方面 最好的 技术 跟 平台 的 基础。 我们 意识到 jt A I 的话 会 改变 整个 的 生物医药 产业。 A I 最 关键 的 还是 要有 数据 的 支持。 如果 没有 数据 的话, A I 它是 个 空壳。 对于 水墨 这样的 数据 产生 的 平台 来讲 的话, 我想 这 是一个 巨大 的 机会。 这也是 这 轮 变革 当中, 我想 我们 有的 一些 独特 的 优势。 再往下, 怎么能够 让 A I 一方面 在 结构 产出 数据 这个 过程 本身 来去 提升 效率, 这是 之前 水木 在 A I 方面 投入 的 重点。 虽然 之前 也有 一波 又 一波 的 A I 制药 公司, 但 我们会 觉得 他的 想象 空间 还是 有限 的。
Generate A I 这次 取得 这么 大 的 突破, 会 对于 全 行业 会 带来 一波。 第一 是 洗牌。 就 以前 的的 A I 在 新时代 目前 看来 的话, 已经 变得 somehow irrelevant。 大家 站在 一个 全 新的起点 上。 原来 做 蛋白质 设计 的 一些, 无论是 实验室 还是 行业 里面 的 一些 公司, 大家 都会 站在 一个 全 新的起点 上。 以前 的 一些 看 似的 优势, 现在 目前 也 变得 irrelevant。 这个 我想 是 行业 技术革命 的 一个 很 有趣 的 一个 事实。 抓住机会, 然后 结合 自己的 一些 独特 的 资源 和 优势, 就 能够 在 换 道 的 过程 当中 的话 能够 领先 行业。
我是 在 想, 现在 如果 你们 要 去做 生成式 A I 的 应用层, 大家 通常 现在 会 用到 的 一个 是 OpenAI。 但 OpenAI 它的 模型 并不是 开源 的, 他 只 给 大家 提供 一种 A P I 接口。 那 假设 这种 A P I 接口 断了, 就 以后 他 不 公开 分享 了, 这个 会 怎样? 这 是一种 假设。
另外 是 除了 OpenAI 在 做 这件 事情 以外, 其实 行业 里面 还有 很多 公司 在 做。 包括 现在 我们 看到 像 谷歌、 微软, 他们 都在 去做 这个 方向 的 研发。 包括 OpenAI e 它的 创业 系 就 已经 分裂 出 30家OpenAI 的 黑手党 了, 30家公司。 另外 还有 比如说 像 伦敦 的 stability 这家 公司, 它的 模型 是 开源 的。 我不知道 大家 在 做 这件 事情 的 时候, 在 底层 模型 上 是 会 怎么样 做 选择, 是 会 直接去 接 OpenAI 的 A P I 接口, 因为 它 可能 是 效果 比 好的。 还是会 去 选 类似 于 像 stability 的 这种 开源 模型, 然后 来做 优化, 把 模型 掌握 在 自己 手里。
好 问题, 对于 journey A I 在 一些 独特 的 dora in 的 应用, 我想 现在 像 您 讲 的话, 大家 有 多个 选择。 关于未来 整个 市场 的 格局, 会不会 出现 像 搜索引擎 时代 一家独大, 还是 说 会有 数量 众多 的 基础 模型 用 在 不同 领域, 不同 公司, 甚至 在 同一个 应用领域 里面, 大家 也会 有 不同 的 选择。 就像 带 我的 笔记本 也可以 选 I B M 的。 我想 大 概率 目前 看来 是一个 好消息, 是 应该 是 百花齐放 的 概率 会 更大 一些。 就是 在 这种 行业 的 垂直 应用 里面。 对于 我们 而言 的话, 我们会 倾向 于 用 一些 开源 的, 这样 你 会 拥有 更大 的 自主权。 我们 认为 底层 的 大家 的 模型 的 差异 并 不会 那么 大更 关键 的 还是 你的 training data。
你们 选的是 什么?
可以 透露 吗? 现在 还 不能。
现在 还 不能。 好的, 等 你们的 好消息, 等 你们的 产品 发布。 但 你们 确认 你们是 会 去做 应用层 这样的 一些 事情。
这个 就 好比 任何 一个 做 零售 的 公司, 当 互联网 到来 的 时候, 如果你 不去 做 电商 的话, 都会 被 远远 甩 在 时代 的 脚步 后面 一样。 我相信 任何 一家 和 我们 类似的 公司, 都要 去 拥抱 这个 新的 技术, 它 已经 到来 了, 会 改变 很多很多 事情。
好, 谢谢 Allen。 今天 非常 的 精彩。 我 觉得 我自己 作为 一个 生物 小白, 学 了 很多 跟 生物 方面 相关 的 知识, 同时 也 看到 了 新技术 跟 生物 行业 相结合 和 未来 可能 产生 一些 非常 令人兴奋 的 一些 变化。 谢谢 红军, 很 开心 跟你聊, 拜拜。 这就是 我们 今天 的 节目。 如果 大家 喜欢 我们的 节目, 可以在 你 所 收听 的 音频 渠道 来 订阅 我们, 也可以 给 我们 写 评论, 写 留言, 感谢 大家 的 收听, 谢谢。