随着人工智能渗透到社会的一些领域,它也迅速涌入其他领域。它正在产生巨大影响的一个领域是蛋白质科学——也就是“生命的基础构建模块”,蛋白质!制片人伯利·麦考伊与主持人艾米丽·匡谈论了蛋白质科学的最新进展:来自谷歌DeepMind的人工智能程序AlphaFold3。此外,他们还讨论了更广泛的人工智能蛋白质科学领域,以及研究人员为何希望它能够解决从疾病到气候变化的一系列问题。您希望我们报道人工智能的其他方面吗?请发送电子邮件至[email protected]。了解更多关于赞助商信息选择:podcastchoices.com/adchoicesNPR隐私政策</context> <raw_text>0 此消息来自ShipBob。经营全球电子商务业务,您有很多事情要做。ShipBob可以从其全球履行网络中挑选、包装和运送您的订单,让您有更多时间发展业务。访问ShipBob.com获取免费报价。您正在收听NPR的Shortwave。
嘿,嘿,短波狂热者们。我是艾米丽·匡,制片人是伯利·麦考伊。伯利,你好吗?你好,艾米丽。你好。你今天要给我们带来什么?好的,艾米丽,今天我想深入探讨人工智能如何彻底改变蛋白质科学领域,也就是生命的基本组成部分——蛋白质。我听说过它们。是的。我的意思是,这就像你科学家时代所研究的东西。是的,是的。我喜欢蛋白质。哦,是的。
我们喜欢你爱它们。但是,人工智能在这个领域是如何推动发展的呢?嗯,科学家们用它来深入研究一个问题,这个问题困扰着蛋白质科学家60多年了。那就是,数百万种这些构建模块是什么样的?就像它们的形状?就像它们的形状,是的,完全正确。为什么这如此重要?嗯,蛋白质执行其特定工作的能力,例如通过你的身体输送氧气或将光转化为糖,
完全依赖于其独特而复杂的形状。因此,要了解它的工作原理,您需要了解它的形状。但是,为什么科学家不能仅仅通过实验来确定形状呢?他们可以对某些蛋白质进行实验,但是这些实验可能需要数年时间。艾米丽,这是因为科学家基本上需要拍摄蛋白质的分子照片来绘制其复杂的形状。
但是让蛋白质配合拍摄照片,例如保持静止,而不至于散开,这可能非常棘手。这可能需要一名研究生整个博士课程的时间来弄清楚一种蛋白质。而其他蛋白质则被放弃了,因为它们永远不会配合。蛋白质听起来很难,说实话。所以挑战是如何确定蛋白质的形状?
无需进行这些极其繁琐的实验。这是人工智能发挥作用的地方吗?是的,为了让您了解人工智能如何改变蛋白质领域,有一个科学家每两年举办一次的蛋白质竞赛。出来吧,一场蛋白质竞赛,好吧。
是的。他们在过去的30年中一直在举办这项比赛,各小组基本上会竞争谁能够最准确地预测最多的蛋白质形状。这绝对是书呆子中心。我们喜欢。在过去的30年中,参与者实际上只取得了渐进式的进展。但在2020年,谷歌DeepMind使用了AlphaFold2,这是其人工智能蛋白质预测模型,艾米丽。
AlphaFold 2彻底击败了其他竞争对手。哇。好的。改变游戏规则。现在,谷歌DeepMind团队已经将这一人工智能工具提升到了一个新的水平,将其扩展到蛋白质之外。
所以今天节目中,我们将介绍科学家如何利用人工智能在理解生命的基本组成部分方面取得了巨大进步。此外,还将介绍其他研究人员如何利用这项技术设计全新的蛋白质,这些蛋白质以前从未在自然界中出现过。以及人工智能如何帮助我们解决我们今天面临的最大问题,从疾病到气候变化。您正在收听NPR的科学播客Shortwave。
此消息来自NPR赞助商Sierra。无论行业如何,企业与客户的联系方式都决定了其品牌。如今,联系始于对话。Sierra是面向希望提供更好、更人性化客户体验的企业的AI平台。使用Sierra,您的AI代理可以快速解决问题。没有预设回复,没有无休止的等待音乐,没有挫败感。
只有基于Sierra的更好的客户体验。访问sierra.ai了解更多信息。此消息来自BetterHelp。六月是男性心理健康月,每年有600万美国男性患有抑郁症。如果您感到不知所措,您可以做的最强大的一件事就是寻求帮助,BetterHelp可以简化这一过程。
参加简短的在线问卷调查,并在家中与合格的治疗师联系。今天访问BetterHelp.com/NPR即可获得您第一个月10%的折扣。这是BetterHelp,H-E-L-P.com/NPR。
此消息来自Square。您最喜欢的邻里场所正在使用Square来完成从弥补现金流缺口到扩展到新地点的一切事情。无论您的业务在哪里发展,Square都会满足您的需求。访问square.com/go/NPR了解更多信息。
好的,伯利,所以科学家们似乎几十年来一直在试图弄清楚蛋白质复杂的形状,以便更好地了解它们的工作原理。为什么这如此复杂?
嗯,简短的答案,艾米丽,是理论上存在着如此多的方式可以让单个蛋白质折叠,以至于这是一个很大的问题。因此,如果您展开蛋白质,它看起来就像一堆长串上的珠子。这些珠子是称为氨基酸的小分子。哦,我记得生物学课上讲过这个。大约有20种氨基酸。是的。每一种都略有不同。对。因此,每一种都有略微不同的形状,这决定了……
决定了该部分链条如何折叠。因为蛋白质通常具有数百个甚至更多的氨基酸,所以您可以看到想象它所有可能的折叠方式会变得多么复杂。是的,听起来像是数千种不同的形状,或者是什么,数十万种不同的形状。好吧,试试数十亿兆种,艾米丽。理论上,单个蛋白质折叠的方式比我们夜空中恒星的数量还要多。
这听起来像是一场辉煌的噩梦。对吧?我很好奇。好的,你说人工智能帮助我们取得了一些飞跃,朝着解决方案迈进。这项技术是如何工作的?因此,这个AlphaFold模型是一种称为深度学习程序的人工智能,这是一个巨大的数据处理点网络,称为节点。这个网络的目的是学习,然后根据它所学到的内容进行预测。
在AlphaFold和其他类似模型的情况下,它从科学家几十年来根据其实验数据积累的大量蛋白质结构集合中学习蛋白质。好的。所以其想法是,在这些模型使用所有这些仔细收集的实验数据进行学习后,它们就可以预测它们还不了解的蛋白质的形状。没错。好的。
好的,回到2020年的蛋白质竞赛,AlphaFold是如何击败其他竞争对手的?因此,他们基本上改变了其模型的整个架构。他们之前一直在使用人工智能,但还记得长链上的珠子类比吗?如果氨基酸是珠子,即使一颗珠子离另一颗珠子很远,当它们全部折叠起来时,它们也可能彼此相邻。因此,对于AlphaFold 2,该模型查看了所有不同氨基酸之间的距离以及
以及来自已解决蛋白质结构的先前知识。太棒了。预测的准确性和速度大大提高了。好的。我假设这对所有研究蛋白质的科学家来说都产生了巨大的影响。完全正确。伦敦国王学院的结构生物学家朱利安·伯格隆就是其中之一。他研究推动细菌的尾状附属物。所以它被称为鞭毛,而且非常复杂。这是一个巨大的组件。♪
所以它比细菌细胞本身还要长。它由20到25种不同的蛋白质组成,但其中许多蛋白质具有数十万个拷贝。这些巨大的螺旋桨机器赋予某些细菌使你生病或在牙齿上形成牙菌斑的能力。因此,朱利安的实验室正在试图弄清楚这些巨大的机器是如何工作的。
它们的各个部分是什么样的,以及它们是如何组合在一起的。因此,当AlphaFold 2模型出现时,他不得不尝试一下。我输入了一个序列,然后几个小时后我得到了模型,我想,哦,我的上帝,它做到了。我们已经为此问题苦苦挣扎了几个月,甚至几年。突然间,我给我的实验室发了消息,我说,我们对所有东西都建模。是的。
而且由于此模型,我们有数十个项目立即取得了进展。好的,所以听起来AlphaFold一夜之间改变了他实验室的发展轨迹。是的。但是他怎么知道使用AlphaFold 2实际上会起作用呢?是的,准确性非常重要,对吧?尤其是在您将所有其他实验都基于结果的情况下。
并且需要注意的是,与其他人工智能一样,AlphaFold2并非总是正确的。因此,您不能仅仅按字面意思接受结果。但与其他一些人工智能不同的是,结果中包含一个分数,基本上告诉您结构的每个部分的准确性如何。好的。其他人在该领域使用AlphaFold2吗?
是的,这实际上是AlphaFold与其他蛋白质预测人工智能模型的不同之处。它非常易于使用。因此,基本上,任何从事蛋白质研究的人,甚至只是拥有蛋白质序列的人,都可以将其插入并获得结果。我和谷歌DeepMind的研究副总裁普什米特·科利谈过,他告诉我为什么对他们来说让这个工具开放访问如此重要。我们在谷歌DeepMind的科学项目中的使命宣言
是利用人工智能来加速它
并推进科学。好的,我正在浏览AlphaFold网站,我看到科学家们将此模型用于各种用途。他们正在从事疟疾和癌症研究、药物发现、塑料降解酶的研究。上周,DeepMind发布了一个新版本AlphaFold 3,它可以预测蛋白质和其他附着在其上的生物分子的3D结构。为什么这些其他生物分子很重要?
是的。所以我知道我们谈论了蛋白质有多么重要。我喜欢它们。但我必须承认,它们很少单独工作。而且……
如果我们真的想知道生物学是如何运作的,我们需要了解蛋白质是如何与其伴侣分子一起工作的。因此,它确实为您提供了更详细、更准确的体内发生情况的图像,蛋白质不仅仅是孤立存在。它们在一个非常丰富的生物空间或蛋白质汤中相互作用。
RNA和DNA以及小分子,它确实揭示了这些丰富的相互作用。以前版本的这些蛋白质预测软件会模拟每个氨基酸的位置。但是在这个新版本AlphaFold3中,
它在更小的级别上绘制事物。因此,它模拟了单个原子的位置。哇。因此,他们可以预测多蛋白复合物的结构,例如细菌鞭毛,或者像血液中的蛋白质那样,附着在铁原子上的蛋白质。这太强大了。好的。
AlphaFold预测的局限性是什么?是的,肯定存在局限性。普什米特说,当蛋白质具有单一确定的结构时,该模型效果最佳。但是有些蛋白质具有不止一种形状,或者它们的部分结构有点松散。想想煮熟的意大利面和未煮熟的意大利面。
好的。所以该模型在某些情况下似乎难以预测,结果也表明了这一点。是的。所以其想法是,这些结果会说,嘿,我对蛋白质的这个区域不太有信心,只是让用户知道。哦。另一个限制是预测能力取决于可用训练数据的数量。嗯哼。我提到有很多蛋白质的训练数据,但是……
有些类别可用的训练数据要少得多。例如,可用于RNA的结构数据要少得多。好的,所以预测的准确性取决于数据。没错,没错。但是艾米丽。但是伯利。科学家还可以通过另一种方式在蛋白质领域使用人工智能。好的,那是什么?生成全新的蛋白质。
人类今天面临着新的问题,我们活得更长了。我们正在污染和加热地球。可以合理地认为,如果经过数百万年的进化,其中一些问题将得到解决。但我们不想等那么久。
所以其想法是,我们现在可以创造出全新的蛋白质来解决这些在进化过程中并不相关的问题,从而使世界变得更美好。这是大卫·贝克。他是一位生物化学家,也是华盛顿大学蛋白质设计研究所的主任。而且
而且他多年来一直在研究蛋白质。他实际上开发了早期蛋白质预测模型之一。他的实验室有一个类似于AlphaFold3的人工智能程序。它被称为RosettaFold All Atom。但他关注的重点是设计这些全新的蛋白质。这听起来太未来主义了。
对。比如什么类型的新的蛋白质?到目前为止,他们已经做了诸如设计新的蛋白质抗体之类的事情,这些抗体对于对抗感染很重要,在这种情况下,是用来对抗流感的。他们制造了一种称为开关蛋白的东西,可以用作环境传感器。他们还制造了可以帮助储存碳的蛋白质,这是对抗气候变化的一大障碍。我认为在医学、可持续性、食品、
技术方面,我认为利用蛋白质设计来改变我们当前做事方式的机会巨大。因此,这些预测性和生成性人工智能模型从根本上改变了蛋白质科学领域。
再说一次,肯定有改进预测能力的空间。但是随着该领域在预测准确性和设计潜力方面的转变,我的意思是,这确实让这位退休的蛋白质狂热者想起了我的科学时代。伯利,非常感谢你为我们带来了这个关于生活中小事的大新闻。谢谢,艾米丽。
本集由瑞秋·卡尔森制作。它由我们的节目主持人丽贝卡·拉米雷斯编辑。伯利核实了事实。高桥崇树是音频工程师。特别感谢杰夫·布鲁姆菲尔德。贝丝·多诺万是我们的高级总监。科林·坎贝尔是我们的播客战略高级副总裁。我是艾米丽·匡。感谢您收听NPR的Shortwave。
此消息来自Capella大学。在Capella,您将学习可以在工作场所立即应用的相关且需求量大的技能。有了Capella大学,不同的未来比您想象的更近。访问capella.edu了解更多信息。此消息来自Jackson。让我们面对现实吧,退休规划可能会令人困惑。
在Jackson,我们正在努力为每个人(从您开始)阐明退休计划。我们易于理解的资源和用户友好的数字工具有助于简化您的整个体验。您可以对Jackson提供的清晰的退休计划充满信心。在Jackson.com寻求您应得的清晰度。Jackson是Jackson Financial Incorporated的简称。
Jackson National Life Insurance Company,密歇根州兰辛市,以及Jackson National Life Insurance Company of New York,纽约州普尔切斯市。此消息来自NPR赞助商Rosetta Stone,一家拥有30年语言学习经验的专家。现在,NPR听众可以以50%的折扣获得Rosetta Stone对25种不同语言的终身会员资格。访问rosettastone.com/NPR了解更多信息。