科技生物学是一个结合数据、技术和生物学以增强科学过程的领域——而人工智能有可能进一步增强生物制药行业。在本期英伟达人工智能播客中,主持人Noah Kravitz与Recursion的联合创始人兼首席执行官Chris Gibson讨论了该公司如何利用人工智能和机器学习来大规模加速药物研发。收听本节目,了解Gibson如何通过提高效率和降低研发成本来讨论人工智能如何改变生物制药行业。</context> <raw_text>0 您好,欢迎收听英伟达人工智能播客。我是您的主持人Noah Kravitz。
我今天的嘉宾是Recursion的首席执行官兼联合创始人,Recursion是全球领先的生物技术公司,或者像他们所说的那样,是科技生物公司之一。Chris Gibson在犹他大学攻读医学博士学位期间开展的研究工作为Recursion的创立奠定了基础。如今,该公司致力于解码生物学,以彻底改善人们的生活。
Recursion正在构建其领域内最大的专有数据集之一。他们刚刚发布了世界上功能最强大的超级计算机之一,并且是引领人工智能驱动药物研发这一蓬勃发展的领域的公司之一。Chris将向我们详细介绍这一切以及更多内容。因此,让我们直接进入正题。Chris Gibson,欢迎您,非常感谢您参加英伟达人工智能播客。谢谢,Noah。我很高兴来到这里。和往常一样,我会尽量在介绍中加入尽可能多的内容来设置场景。
你做了很多,你正在做很多,但我还是想把话筒交给你。也许我们可以从你向听众解释Recursion的全部内容开始。是的,我想告诉你关于Recursion的事情,但首先我想告诉你我们正在解决的问题。所以每个人都认识患有某种疾病的人,而这种疾病没有很好的治疗方法。你的亲戚死于癌症。你认识患有阿尔茨海默病或帕金森病或其他一些毁灭性疾病的人。而今天,尽管世界上拥有所有令人难以置信的技术,
进入临床试验的药物中有90%失败了。我们行业投入临床开发的10种药物中有9种在到达患者之前就失败了。所以这告诉我,生物学就是一个巨大的复杂泥潭。它的复杂程度非常高,以至于尽管全世界有数十万名科学家,以及大约50%,
每年500亿美元的行业研发投资,我们仍然做得不好。因此,我们设想也许有一种方法可以将新技术结合起来,尝试对生物学采取不太偏颇的方法,尝试退一步说,与其试图理解每个基因如何与每个基因相互作用,以及每种药物如何与每个基因相互作用,并试图在我们的大脑中构建所有这些,这就是传统上所做的方法。
我们能否真正采取一种工业化的方法,利用自动化和人工智能构建生物学图谱,然后利用这些图谱来告诉我们去哪里,基本上让算法告诉我们去哪里开发药物?这就是我们在过去10年中一直在努力的方向。
所以现在我们是一家所谓的临床阶段生物技术公司。我们自己有五种药物正在进行临床试验。我们与罗氏基因泰克和拜耳等公司建立了大型合作关系,将药物带入生物学领域中非常困难的领域。我们刚刚与英伟达(我们的合作伙伴之一)一起构建了这台令人难以置信的超级计算机。因此,我认为我们确实是引领生物学与技术交叉领域的公司之一。对,对。
有无数的事情需要深入探讨。但在我们继续之前,我想问一下,你使用了“地图”这个词。你谈到了工业化的方法,绘制生物学图谱。这让我想到像绘制人类基因组图谱这样的事情。两者之间是否存在相似之处?它是一种类似的方法吗?或者它是如何工作的?是的。所以传统上,我们行业的人一次只研究一种疾病。因此,如果我们想一起研究一种疾病,我们会阅读文献,组建一个团队,然后我们会为那种疾病构建
具体的实验。我们会生成数据,5到10年后,也许我们会有一种药物进入临床试验,你知道那里的成功率是多少。失败率为90%。还有一种不同的方法,那就是与其一次只研究一件事情,不如构建庞大的数据集?
涵盖非常大的范围。我认为人类基因组计划就是一个很好的例子。人们说,让我们绘制整个人类基因组图谱。而如今,已经有数千万个基因组被绘制出来,我们可以对它们进行比较和对比。我们正在使用其中一些相同的数据。因此,我们采取了这种方法,在最初投入更多资金来构建真正庞大而复杂的数据集
在一开始,你花费很多钱来构建这个数据集,而你还没有足够的数据来真正取得任何疾病方面的进展。但随着时间的推移,你开始建立这些网络效应,你知道,今天,如果我们在我们的自动化实验室中进行实验并得到一些结果,我们可以将其与我们在过去几年中进行的超过2.5亿次实验进行比较。所有这些数据都是相关的。因此,与其一次只研究一种疾病,与其只研究生物学的片段,
我们实际上是在构建一个体积,我们正在稀疏地采样这个体积,然后使用人工智能来填充我们可以预测的其余部分。对。这在业界是一种独特的方法吗?我认为这在业界是相当独特的。是的,有一些公司正在采取类似的方法。我不知道有任何公司已经生成了……
如此广泛的数据集。我们已经用CRISPR-Cas9敲除了你们中的一些听众可能听说过的一些基因。它就像一把分子剪刀,可以让我们剪掉基因。我们已经敲除了人类基因组中每个基因在多种不同人类细胞类型中的基因。我们已经分析了数百万个分子。所有这些数据现在都存在于多个层面上。我们称之为组学。
人们可能听说过基因组学。好吧,我们正在构建表型组学、转录组学、体内组学和蛋白质组学以及所有这些组学数据层。你可以把它想象成,你知道,回到谷歌地图的时代,对吧?从飞机上的地图开始,我们大致知道了所有街道的位置。然后最终你有了街景,汽车在四处行驶。我们正在构建所有这些相同的层,但我们不是在物理世界中这样做,而是使用一个
装满机器人的大型自动化实验室来进行数百万次实验,以找出生物学和化学的道路、街道和交叉点是什么。这是一个复杂的空间。我的意思是,我认为这可能是人们可以研究的最复杂的问题之一。我只能想象。也许到这次谈话结束时,至少我会更多地了解自己不知道的东西。
所以也许我们可以从研究生工作开始,这种工作播种了Recursion。如果这是错误的方法,那就采用不同的方法。但我认为这可能会帮助我和听众理解这个问题,问题的范围,以及你为什么以及如何开始采用这种方法。是的,当然。我认为这是解释我们在Recursion所做工作的绝佳方式。所以我加入了一个名叫Dean Lee的人的实验室。Dean现在实际上是默克研究实验室的总裁。所以他是默克的首席科学家。
非常优秀的临床科学家,才华横溢的人。实验室非常多元化。有医生、工程师、遗传学家和分子细胞生物学家。我们正在研究所有这些很酷、很难的问题。我们正在研究的事情之一是一种罕见的遗传疾病。
称为脑血管畸形。我敢打赌,大约1%的听众听说过它,因为世界上大约1%的人患有这种疾病。所以这是一种罕见的疾病,但它并不那么罕见。它的患病率是囊性纤维化的六倍。
好的。但是没有药物。没有治疗方法。因此,人们对这种疾病知之甚少。我们试图弄清楚这种疾病是如何发生的。我们使用传统的分子和细胞生物学方法,我可以跳到我身后的白板前,我可以画出蛋白质X到蛋白质Y到蛋白质Z。我们认为蛋白质Z含量过高会导致这种疾病。对。经过十年的研究,我们认为我们已经弄清楚了。
我们坐在实验室里,我们想,我们认为这种叫做row A的蛋白质是导致这种疾病的原因。我们服用row A抑制剂并将其放入小鼠体内。五个月后,我记得坐在实验室会议上,我们公布了数据。是的。哦,我们改变了小鼠。我们朝着错误的方向改变了小鼠。它们变得更糟了。它们有了更多的病变。
这是生物学中的一个问题之一。就像,作为人类,我们是还原论的解决问题者。我们采用一个非常复杂的系统,并试图将其简化为蛋白质A、蛋白质B、蛋白质C等核心元素,以便我们可以将其放在白板上或放在自然论文中。是的。
现实情况是,在生物学中,可能存在数百种相互关联,数千个反馈回路共同作用。如果你采取还原论的方法,我认为这可能是我们90%的临床试验失败的原因。我们需要探索生物学的方式不是采取还原论的方法,而是
而是提升我们对生物学的理解,理解整个复杂系统,并构建真正包含每个基因如何与其他每个基因相互作用的地图。所以这很难。我的意思是,我们已经研究了10年了,但在那次失败之后,我们在Dean的实验室里采用了这种方法的早期版本,
我们拍摄了人类细胞的显微镜图像,我们在那里模拟这种疾病,我们拍摄了健康人类细胞的显微镜图像,我们训练了一个基本的机器学习分类器来识别两者。然后我们将数千种药物添加到患病细胞中,我们只是问机器学习分类器,是否有任何患病细胞看起来再次健康?对。无需了解生物学中其他任何事情。对。而今天,Recursion距离读取针对我们通过这项工作发现的药物的第二阶段临床试验结果只有几个月的时间了。对。这种药物的作用方式完全出乎意料。它并没有针对RoA或其他任何东西。所以我想说的是,当你接受生物学的复杂性并让生物学给你答案时,它可能会令人惊讶。它可以挑战教条。但是如果你愿意遵循这一点,
我们的信念是,最终,随着足够的技术和投资,这可能是一种更可持续的工业化方式。所以我完成了我的博士学位。我从医学院休假,后来退学了,因为Recursion最终开始起飞并创立了公司。我们在过去10年中一直在科技与生物的交汇点上进行建设。所以大约10年前,
当你得到这些实验室结果并且事情朝着错误的方向发展时,你或实验室的同事,或者只是同事们,是否有一种感觉,我们知道有一种不同的方法来接受这种复杂性,但我们现在无法做到,因为它对人脑来说太大了,即使是数十个最优秀的人脑并行工作也无法做到。信息量太大,无法筛选。
你知道吗?我的意思是,你说你使用了ML分类器,但它是否像这样,如果技术稍微好一点,或者当时的思维状态是什么?是的,我认为是这样的。所以,所以我们有这个想法,要,要,要使用技术来尝试采取一种不太偏颇的方法。
我们不是第一个这样做的人。当时有其他一些人在从事类似的工作,但你知道,人工智能并没有真正被,这是2011年左右的事情。人工智能并没有真正被用作一个术语。当时它是一种机器学习。人们没有做很多神经网络方面的工作。我的意思是,ImageNet甚至还没有出现。所以我们想,
属于非常早的一波,当然在生物学领域,属于非常早的一波人说,让我们使用计算机视觉来查看图像。这项工作实际上是由Broad研究所的一位名叫Ann Carpenter的女性开创的。她构建了我们使用的软件工具。
帮助我们加快速度。是的,我们希望软件更好。但与此同时,我们当时正在挑战生物学的边界。所以我们现在在Recursion所做的是,我们开创了这种方法的工业化。我开玩笑说的是,如果你参观了我们位于此处的总部,并且你看到一个机器人实验室,那有一个令人悲伤和令人兴奋的事实。那就是这个机器人实验室平均每15分钟就能完成
我整个五年博士生涯中所做的所有实验。所以这在某些方面令人悲伤,在其他方面令人兴奋。我只能想象你感到谦卑。与此同时,你也很兴奋。是的。是的,太棒了。就是这样。所以,我不知道你是否想直接跳到现在,或者最好的方法是什么,但我想了解Recursion现在正在做什么。是的。我的意思是,我认为我们可以跳到我们今天所处的位置,那就是,
我们采用了这种创建良性循环的理念,我们称之为湿实验室和干实验室。这意味着经验数据生成。一个湿实验室,我们在那里用人类细胞进行真实的实验,一个干实验室,这是我们的超级计算机系统以及我们所有的软件工具和人工智能工具。是的。
我认为我们在这里Recursion所做的事情类似于许多科技公司。是的。所以,你知道,Netflix正在记录你正在观看的内容,你何时观看,你何时打开,你何时关闭,家里的谁在观看,你何时关闭场景。他们现在实际上正在进行预测,进行A/B测试,并通过这个循环返回,直到今天,Netflix根据对人们流行内容的算法建议来生成内容。对。
这就像药物发现的版本。我们正在进行实验。我们正在破坏基因,并向不同的人类细胞类型添加化合物及其组合。我们的A/B实验是,我们对哪些基因和哪些药物彼此关联做出一系列预测。然后在下一周,我们返回并测试这些预测,并创建这种飞轮方法。当然,问题是生物学是多余的。
如此,如此复杂。存在这种组合爆炸,就像,你知道,我们总是开玩笑说,大约有21,000个人类基因。在生物学中,有一件非常酷的事情叫做合成致死性或合成关系,你可以开始预测两个基因是相关的。如果你破坏这两个基因并且你得到一个意外的大或小的效果,它会告诉你它们可能处于某种反馈回路中。
对。如果我们要进行这种敲除每个基因与每个其他可能基因的合成实验,大约有2.5亿次实验。这是可行的。我们已经进行了2.5亿次实验。我们花了10年时间才做到这一点,但我们现在每周最多可以进行220万次实验。所以这是可行的。
但是如果我说,如果我们按基因、基因、基因,三个基因来做呢?现在你谈论的是数万亿次实验。如果你想象做四个基因,就像你瞬间在生物学中真正探索这一点,你就会遇到这种组合爆炸,我们无法蛮力解决。我们不会能够凭经验做到这一点。所以这就是人工智能的妙处,就像在所有其他技术领域一样。如果你可以稀疏地填充这个巨大的体积,这个基因、化合物、细胞类型和相互作用的矩阵,
如果数据可靠,ML和AI工具通常非常擅长帮助你填充和预测中间会发生什么。我认为这就是我们试图构建的东西。这就是对我们来说的地图。所以,请原谅我,这是一个非常简化的提问,但它是否是你在干实验室进行实验,在AI中完成所有工作,你知道,计算机系统,然后那些最有希望取得进展的实验进入湿实验室的情况?这是一种基本情况吗?是的,完全正确。是的。然后这些良性循环的妙处在于,如果我们从干实验室做出的预测进入湿实验室并奏效,它非常可靠。太棒了。好的。我们有一个新项目。让我们把它推进到患者那里。对。如果它不起作用,我们现在那一周就生成了一堆新数据,我们可以用这些数据重新训练模型。对。
而这些新数据存在于模型做出错误预测的空间中。因此,根据定义,随着你不断地经历这个良性循环,尽管生物学和化学的复杂性,你开始取得进展,因为生物学中有一些区域有点像,你知道,像中西部地区,你知道,玉米田,只要你能看到,它看起来
相隔100英里看起来相当相似。生物学中还有其他一些地方,就像,你知道,落基山脉或,你知道,无论什么。它就像,你向左走10英尺或向右走10英尺,情况就大不相同。因此,我们可以帮助使用这种迭代方法来磨练我们需要更多数据的生物学部分和我们需要较少数据的生物学部分。生物学中是否存在某些区域,
再说一次,我在这里将过于简单化,更容易或更难,我不知道这是否要绘制出来,或者要理解,或者要能够,你知道,
采取行动?当然。所以有一些生物学领域,我们认为更容易开始。还有一些生物学领域,我们确切地知道是什么导致了这种疾病。所以对我来说,这里有三个领域。一个是遗传疾病,如囊性纤维化。我们知道CFTR基因的突变会导致囊性纤维化。对。好的。另一个很好的例子是一些癌症,我们知道某些基因的突变会导致这些癌症。第三个是传染病。好的。
我们知道这种病毒或这种细菌会导致这种疾病。我们喜欢这些的原因是,如果我们在实验室中用细胞模拟这些疾病,你知道,我们添加病毒或破坏基因,我们知道我们至少部分地再现了与生物学相关的某些东西。更难的领域是神经科学。所以以阿尔茨海默病为例。
我们真的不知道是什么导致了阿尔茨海默病。存在争议。有些人认为他们知道,但针对这些靶标的大多数药物都失败了。所以,我们真的不知道是什么原因造成的。那么你如何着手尝试了解阿尔茨海默病呢?这实际上是神经科学领域,可能是最难的领域之一,因为
我们真的不知道是什么导致了许多不同的神经系统疾病。因此,我们实际上与罗氏和基因泰克(最大的生物制药公司之一,也是最具创新性的公司之一)建立了长达数十年的合作关系,以绘制神经特异性细胞中的基因组图谱,以便我们可以开始揭示其中的一些答案。但是这些领域,这些是生物学中最难的部分。是的。
对,对。我们应该谈谈超级计算机吗?是的,让我们谈谈超级计算机。好的。所以我想象一下,从一开始就采取某种,我不知道,“流氓”不是正确的词,但采取一种不同的方法,对吧?一种无偏见的工业化方法。是的。
然后现在谈论绘制事物。而且有很多。我们最近有一位嘉宾谈到,他有一个很好的比喻来形容他对他的领域所知和所不知之间的区别,对吧?所以类似的事情,对吧?所以我想象一下
数据量,计算量。就像任何其他问题一样,它只会越来越高。所以多年来,也许你可以谈谈导致你,我们现在是Biohive 2了吗?- 我们现在是Biohive 2了,是的。- 好的,也许你可以向我们介绍一下。- 是的,我的意思是,我们一开始是在我的笔记本电脑上,然后我们搬到了一台我们在内部构建的服务器上,叫做高尔基体,我们最终在弃用它时为它哀悼。
但今天,我们拥有大约50 PB的专有生物数据。这些数据与文本和其他事物略有不同。其中一些是文本,但很多是图像。它们非常占用内存,内存密集型。你知道,它们是大图像。因此,一些传统的基于云的方法对我们来说并不完全适用,因为你最终会因为内存方面的原因而使GPU饿死。
因此,在2020年,我们决定需要构建一台超级计算机,以便最好地利用我们积累和构建的这个巨大的数据集。因此,我们构建了一台名为BioHive 1的超级计算机。在发布时,它在全球超级计算机500强榜单上排名第85位或第58位左右。我们发现缩放定律适用,痛苦的教训适用于生物学。那就是
更多的数据和更多的计算都会给你带来更好的结果。我们每天都在生成更多的数据。因此,我认为在生物学中,数据比计算更大的瓶颈。不像其他领域那样存在军备竞赛,因为……
还没有足够相关的像我们正在构建的数据一样的数据,让每个人都能做到这一点。我们正在构建数据,但我们也知道我们需要更多的计算能力。所以大约六个月前,我们宣布……
实际上,英伟达在去年夏天投资了我们。然后,随着我们继续与他们建立关系,我们最终决定构建Biohive 2,它刚刚问世。在全球超级计算机500强榜单上排名第35位。它大约有23 petaflops,有504个H100。现在我们只是……
弃用了biohive one及其300多个A100,我们正在将其转移到新的设施中,因此我们将拥有这个弗兰肯斯坦A100,是的,是的,巨大的超级计算机,至少在我们这个领域,犹他州盐湖城这家生物技术科技生物初创公司Recursion现在拥有并运营着
世界上任何生物制药公司中速度最快的超级计算机,从辉瑞到所有公司。太棒了。这很酷。是的,是的。不,这太棒了。我们,你知道,多年来一直在做播客,这个“工具民主化”的短语一直几乎像一句口头禅。一段时间以来,它一直在考虑,
一位律师,他在公寓办公室里的电脑有一块GPU,他意识到他可以使用它来做一些机器学习的事情。你知道,类似的事情,对吧?你们规模比这大得多。但正如你所说,与行业中长期存在的巨头相比,你们能够做到这一点真是太棒了。
你有没有一个很好的故事、一个经验教训或一些令人惊讶的事情,特别是关于构建Biohive 2和这个过程,这是某些事情,你知道,你必须克服的障碍,或者你期望的事情会以一种方式进行,但结果却大相径庭,或者,你知道,也许只是一个轶事?是的,我的意思是,构建Biohive 2是一项巨大的努力。多个团队走到一起,Recursion团队、英伟达团队和其他供应商团队,
我们最终希望在提交给最近的全球超级计算机500强榜单之前完成这项工作。好的。而且,你知道,现在GPU的普及和人工智能的重要性,我们得到了我们的GPU
我们得到了我们的集群,但我们缺少机架和电缆,某些机架和某些电缆。这些东西在提交全球超级计算机500强榜单前15天才到达。因此,我们的团队在数据中心睡行军床,英伟达团队也加入了我们。他们付出的努力,我们从获得所有材料开始,在15天内让它运行起来,进行了老化测试和基准测试。
它最终成为,据我所知,第一个板载H100设置。它最终具有非常非常好的性能。
优秀。我今天的嘉宾是Chris Gibson。Chris是Recursion的联合创始人兼首席执行官,Recursion是全球领先的生物技术公司,科技生物公司,我想过一会儿再问你这个问题,该公司位于犹他州。正如Chris刚才详细介绍的那样,他们现在是自豪的拥有者和维护者,是全球排名第35位的超级计算机Biohive 2吗?是的,第35位。
科技生物学,我认为,只是对生物技术一词的颠倒,技术正在引领前进的道路?是的,就是这样。我的意思是,生物技术一词是在80年代创造的,用来谈论使用人类蛋白质作为药物。好的。当时,那是技术,是基因泰克真正开始了这一切。所以要感谢他们,他们是第一家,他们创造了他们的行业生物技术。
我们会称之为生物技术,但这已经被占用了。所以我们领域中有人称之为科技生物学。技术处于前沿。这是一个很好的术语,用来描述现在数百家在该领域中更具数字原生性的公司,这些公司正在构建技术真正成为其构建基础的空间。明白了。
科技生物学是将数据、技术和生物学结合起来以增强科学过程的一个领域——而人工智能有可能进一步增强生物制药行业。在本期英伟达人工智能播客中,主持人Noah Kravitz与Recursion的联合创始人兼首席执行官Chris Gibson讨论了该公司如何利用人工智能和机器学习来大规模加速药物研发。收听本期节目,了解Gibson如何讨论人工智能通过提高效率和降低研发成本来改变生物制药行业。</context> <raw_text>0 在准备这次谈话时,我注意到使用了BioHive这个名字。我认为这也是一个公私合作的名称,你也在其中扮演着角色。所以也许你可以谈谈这个。当我刚才听你说话时,我在想我们最近做的一些播客。我们在药物研发领域做过一两个,在科学领域做过很多。
而且我们越来越听到,我认为技术是其中很大一部分,显然它使开源协作以及与大量数据的其他协作更容易在世界各地进行。所以我对BioHive的细节以及您对当前技术状态的看法都很感兴趣。
你知道,科学公司、生物技术公司在某种资本主义环境中工作,你试图竞争,你确实在竞争。但与此同时,鉴于你正在做的工作,分享显然非常重要。所以也许你可以从Biohive开始,谈谈当今该领域的合作情况。是的,我认为这一代科技生物公司,我们确实相信
如果我们都在合作,至少在流程的某些阶段,我们都会做得更好。因为,你知道,归根结底,如果有一种疾病没有治疗方法,我们仍然有工作要做。因此,我们非常相信投资于我们工作的社区。去年我们收购了一家名为Valence的公司。
该公司现在基本上正在为人们构建一个社区,以便托管不同基础模型和其他在生物学中很重要的东西。他们正在托管数据集。他们真的在投资建设这个社区。我们也相信这在我们工作的地方也是如此。BioHive是我们所说的帮助塑造、汇聚和建设犹他州生命科学生态系统的基层组织。
我们还在其他方面进行投资,你知道,我们在多伦多、蒙特利尔、伦敦和加利福尼亚州米尔皮塔斯设有办事处。因此,我们也在这些地方进行投资,因为我们觉得我们正处于30年的旅程中,我的意思是,我们看到英伟达已经走过了30年,我们觉得我们才走过了10年,我们的30年旅程是为了证明我们认为对世界可能产生巨大影响的这一愿景。
我们知道,如果你在这个时间表上走这样的轨迹,你必须在前进的道路上建立围绕你的社区。因此,这些对我们来说都是重要的投资。开源数据集一直是我们不仅帮助建立社区,而且多年来吸引人才的关键部分。因此,我认为我们将继续推动制药和生物技术行业对这些方法更加开放。太好了,我很高兴听到这个消息。
有数据、有计算、有硬件。还有软件,使这一切运行的工具。我想问你一个关于Recursion工具Lowe的问题,我听说过一点。我的理解是它有助于协调工作流程。它以某种方式使用生成式AI。这是什么?
是的。所以,你知道,我们一直在构建所有这些软件工具。其中一些正在利用神经网络和其他东西。我们现在拥有数十个这样的工具,而且它已经变得足够复杂,以至于如果你是在Recursion工作的科学家,你就无法跟上所有工具的所有版本,对吧?这只是,你知道,你就像看看你的iPhone,有数万个应用程序。很难知道如何使用所有这些,对吧?同样的情况也发生在科学领域。因此,我们所做的是构建一个大型语言模型,并且
对其进行微调,以实际与所有这些工具的API进行交互,并根据自然语言了解何时使用不同的工具。所以我可以进去,我可以说,给我五个非小细胞肺癌的新靶点。我只是输入并按回车键。
然后大型语言模型知道我们在Recursion构建的哪些软件工具可以查看我们的数据、公共数据,可以查找这些数据集之间的套利,并且它可以向你展示一些关于你可能想要追求的靶点的见解。然后你可以说,设计一种可以抑制这些靶点之一的药物。它将使用生成式AI和AlphaFold或其他预测的该靶点的蛋白质结构。
然后它将帮助设计一个可以结合到该靶点结合位点的分子,并且我们预测它会抑制它。你可以用自然语言完成所有这些,然后你可以说,设计并执行一个实验来验证这种相互作用。然后它可以从我们的供应商那里订购化学品。它可以设计一个我们可以在我们的自动化湿实验室中运行的实验。
从安全的角度来看,我们让一个人批准该实验,因为我们想确保我们没有运行任何可能做坏事的坏实验。而且你也不想意外地运行一个价值600万美元的实验,因为没有人批准它。对,对。所以我们让一个人参与其中,但如果有人批准了,你就可以运行实验。所以对我们来说,我认为这很像70年代末和80年代初的个人电脑,当时你从像Apple one这样的电脑过渡到,你必须是这个专家用户,你必须知道如何焊接所有这些东西。
然后有了Lisa,有了图形用户界面,你实际上就可以开始让这些工具民主化了。我们认为现在也正在发生同样的事情,但它不是图形用户界面,而是发现用户界面。Lowe是我们对这个问题的看法。有一家大型制药公司GSK正在构建其中一个。还有几家初创公司正在构建这些。但最终,我们认为这些类型的工具将意味着
即使你没有30年的化学和生物制药行业经验,你刚毕业,你仍然能够通过这种方法更快地做出更大的贡献。太棒了。你刚才回答了我下一个问题,但我还是会问。Jensen最近说过一些话,我认为是几个月前,在一个采访中,有人问到计算机科学领域的未来。他说类似的话,
我的建议是学习你感兴趣的领域,发展你的专业知识,
因为我们已经走上了这条道路,我们正到达一个点,你知道,你不会,我是在转述,你没有用这些确切的词,你并不一定需要学习编写Python脚本或学习R来整理数据。你将使用自然语言提示。然后你的专业知识将真正变得有价值,因为你将能够使用AI系统,验证它们的输出等等。听起来,你知道,这有点像,
Recursion在某种程度上也处于这种状态。你对这种轨迹有什么看法?也许可以详细说明一下你刚才所说的,即使是新毕业生也能够因为自然语言提示而对该领域做出更多贡献?
是的,不,我认为他完全正确。我认为他在1月份我们举办的一场活动中与我们同台,他说过类似的话。我们讨论的是古典教育在学习如何解释问题、识别正确的问题以及如何提出和回答关于该问题的问题方面的重要性。这才是重要的。它不会是编码,因为一切都将是自然语言。
所以我同意他的观点。因此,我们现在正在寻找擅长在界面上操作的人。我们实际上不需要一个记住整个分子细胞生物学教科书的人,就像我们不再需要医生记住我们将会拥有的每一种可能的疾病一样
我们将拥有这些工具,这意味着你可以输入,这是病人有的症状,或者这是我在数据中看到的。然后这些工具将帮助提取所有这些没有人需要记住的深度信息。关键在于有人能够利用这些信息并说,好吧,我该如何处理这些信息?下一步是什么?我可以运行的杀手级实验是什么?或者,我该如何治疗这个病人?所以,是的,我们将转向一个人们擅长的地方
整合许多不同的想法和数据。这些是我们正在寻找的人。我们正在寻找的不仅仅是生物学博士,而是喜欢使用所有不同新人工智能工具的生物学博士,或者计算生物学家,这些人真的在这些界面上工作。对,对。所以我想你在开头提到过,Recursion已经创造了一些现在正在试验的药物?是的,我们有五个项目正在进行临床试验,还有更多项目即将进入临床试验。
好的。所以我问这个问题是为了了解未来会发生什么,对Recursion来说,以及对整个行业、更广泛的领域来说。Recursion的计划是继续开发更多药物,获得更多实际的解决方案来表达它进入试验?Recursion未来几年的目标是什么?这是一个很好的问题。归根结底,重要的是什么?
是让病人服用药物,让病人恢复健康,对吧?所以有人必须开发产品。当我们创立Recursion时,我们相信我们将构建所有这些工具来帮助人们确定要构建哪些产品,然后他们将去构建这些产品。令我们惊讶的是,我们弄错了的是这个行业对这些新技术工具的迟疑。嗯哼。
我认为这是监管环境与FDA和EMA的结合。这是它与该行业普遍保守性质的结合,该行业每年为每种新药批准投入26亿美元的研发资金。哇。
所以,记住,成本之所以这么高,是因为90%的药物在临床试验中失败了。所以,开发成功的药物成本并不高。只是你必须,你必须把所有的钱都花在所有的失败上。因此,该行业一直很保守,我们觉得他们并没有像我们希望的那样快地采用这项技术。我们想让这些我们相信的药物死去吗?
对。
有时你必须垂直发展,对吧?如果你真的相信某件事,有时你必须垂直发展。一个很好的例子是特斯拉建造超级充电网络。我保证他们不想建造超级充电器。他们就像,当然,加油站会看到未来人们会使用电子产品,他们会安装超级充电器。不,不,每个人都很迟疑。所以他们不得不建造它。那肯定很糟糕。是的,我们也必须建造它。但归根结底,如果我们能让病人服用药物,我们会很高兴。
所以在我们结束之前,Chris,你几次提到过,就在刚才,关于该领域的转变以及你第一次做研究生工作时一直到现在的迟疑,以及你必须垂直发展并开始自己生产药物的原因。人们抵制改变。技术需要时间来适应。从文化上讲,在全球范围内,我们几乎肯定处于这场由自动化和人工智能以及其他一切技术推动的巨大工业革命的初期阶段。在这个文化方面,有没有大的……我的意思是,这是一个大问题吗?这是数据、计算……
所有这些东西。但从文化上讲,你是否觉得你正在建立一种不同的做事方式?随之而来的是否有障碍?是的,绝对的。我会说数据、计算对我们来说是护城河,但我们最大的护城河是我们的文化。我们必须让软件工程师、数据科学家、生物学家、化学家、药物开发者和支持职能部门的所有这些不同的人在这些深厚的技术领域工作
走到一起。这基本上意味着我们必须创造一种新的语言,一种所有这些人都可以在同一个环境中(字面意义和比喻意义上)构建的新语言。所以我想几年前我们这里有一位大型制药公司的C级高管。在他出门的路上,他说,我们永远无法复制这种文化。这是你最大的竞争优势。
对。有了足够的钱,我们就能做其他所有事情,但我们做不到。我认为这可能是真的。这就是为什么有时那些新兴的年轻公司最终会比一些更大的公司更具创新性。这与文化有关,以及其他任何事情。不,绝对的。Recursion现在有多大?有多少人?我们现在大约有550人。哇。
太棒了。我的意思是,对于你正在做的事情来说,它相对较小。我的意思是,对于你正在做的事情来说,它可能非常非常小,但这太令人惊奇了。对于那些想了解更多信息的人,我们涵盖了很多方面。我们可以花一个小时的时间来讨论你如何构建BioHive 2。但对于那些想要更多Recursion故事的人,想要深入了解你正在从事的一些工作,具体细节,甚至正在寻找新角色、伟大的文化加入的人,他们可以去哪里了解更多信息?
是的,访问recursion.com。你可以了解职业生涯。你可以阅读我们所有的论文。你也可以访问rxrx.ai,在那里我们拥有大量数据集。如果你是一名数据科学家,并且想使用一些生物学数据,你可以在那里下载它们。太棒了。
Chris Gibson,很高兴认识你。我学到了很多东西,这会让我在处理这些信息时产生更多的问题。所以我们可能必须再次这样做,但我感谢你抽出时间来参加播客,告诉大家你正在做的工作。而且,你知道,说你正在努力寻找能够通过改善健康来改变人们生活的解决方案,这感觉就像轻描淡写、陈词滥调一样。所以祝你和你的团队一切顺利。谢谢,Noah。非常感谢。谢谢。
再见。
再见。