We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Finding a Single Source of AI Truth With Marty Chavez From Sixth Street

Finding a Single Source of AI Truth With Marty Chavez From Sixth Street

2024/5/22
logo of podcast a16z Podcast

a16z Podcast

AI Deep Dive AI Chapters Transcript
People
M
Marty Chavez
Topics
Marty Chavez: 本人职业生涯致力于构建金融、科学、工业领域的数字孪生模型,利用计算技术解决生命科学问题,并应用于金融领域风险管理。他认为,高保真度的模型可以进行反事实分析,从而改进决策。在金融危机期间,他参与开发的SecDB系统帮助高盛有效地管理风险,避免了更大的损失。他还强调了数据质量对AI模型训练的重要性,以及在AI应用中关注系统与现实世界交互边界的必要性。他认为,监管应关注AI系统与现实世界交互的边界,而不是试图理解AI系统的内部运作。他认为,当前的AI技术在处理那些随时间变化缓慢的数据方面表现出色,但在处理市场等快速变化的数据方面,其有效性还有待观察。他还谈到了AI在生命科学和生物技术领域的应用潜力,以及构建企业内部所有数据的单一可靠数据源的重要性。 David Haber: David Haber主要负责引导对话,并就Marty Chavez的观点进行提问和补充。他与Marty Chavez讨论了AI技术在金融服务和生命科学领域的应用,以及监管在其中的作用。

Deep Dive

Chapters
Marty Chavez discusses his transition from graduate work in healthcare and AI to Wall Street, detailing his early career and the pivotal projects he worked on at Goldman Sachs.
  • Chavez's early interest in building digital twins of biological systems.
  • His transition to Wall Street and the creation of the SECDB project at Goldman Sachs.
  • His role as a commodity strategist and the challenges of introducing himself to the trading desk.

Shownotes Transcript

我简直不敢相信他在1981年对我说过这句话,但他确实说过,生命科学的未来是计算的。贯穿我整个职业生涯的主题是,我一直致力于构建一些金融、科学或工业现实的数字孪生体。

我们审视了这一点,心想,哇,我们最好对这个非常大的未对冲头寸做点什么。这就是多德-弗兰克法案的历史。就像,我们真的不知道金融危机中出了什么问题。

所以,让我们来规范一切吧。我认为99%的IT都是繁文缛节,并没有让世界变得更好。这是我遇到的许多早期“核冬天”之一。

大家好,欢迎回到ASIC T.C.播客。我是主持人Steffen。今天我们有一期来自一个名为“In the Vault”的新系列的特别节目。

本系列节目邀请了一些金融生态系统中最有影响力的人物,当然也包括我们今天的嘉宾Marty Chavez。Marty现在是Sixth Street Partners的合伙人和副董事长。然而,他长期以来就擅长发现技术如何有效地颠覆其他行业。

从他在医学领域的应用人工智能博士学位,到成为创建SECdb(或许无法预测全球金融危机,但却帮助高盛幸免于难的软件)团队的创始工程师之一,他都做出了贡献。所以今天,Marty与a16z的普通合伙人David Haber坐下来,他们讨论了很多内容,包括这项新技术浪潮中的发展方向以及监管机构和立法者在其中的作用。当然,如果您喜欢这一集,请不要忘记查看我们的新系列“In the Vault”。您可以在我们的a16z Live页面上找到它,我们也会在节目说明中包含链接。在那里,您可以找到与全球支付公司CEO Jeff Sloan和Marco Argenti(高盛的CIO)的其它节目。

您好,欢迎收听“In the Vault”,a16z金融科技播客系列,我们将与金融服务领域最有影响力的领导者们坐下来交谈。在这些对话中,我们将深入了解这些领导者如何指导和管理一些美国最重要公司的幕后情况。我们还将深入探讨影响该行业的关键趋势,当然,还会讨论人工智能将如何塑造未来。

我们很高兴今天邀请Marty Chavez来到节目中。Marty目前是Sixth Street Partners的合伙人和副董事长,这是一家全球投资公司,管理着超过750亿美元的资产。在加入Sixth Street之前,Marty在高盛工作了二十多年,担任过首席信息官、首席财务官、全球市场主管,并担任公司管理委员会的高级合伙人。

他也是传奇软件系统SECdb的创始工程师之一,许多人认为该系统帮助高盛避免了全球金融危机最糟糕的影响。在我们的谈话中,Marty将探讨金融服务领域技术的演变以及人工智能的潜在影响。让我们开始吧。

提醒一下,此处内容仅供参考,不应被视为法律、商业、税务或投资建议,也不应被用于评估任何投资或证券,并且并非针对a16z基金的任何投资者或潜在投资者。更多详情,请访问a16z.com/disclosures。

Marty,非常感谢您来到这里。我们非常感谢。

David,很荣幸。我一直期待着这次谈话。

Marty,您拥有令人着迷的职业生涯,显然在将华尔街交易业务转变为软件业务方面发挥了非常关键的作用,尤其是在高盛和现在的Sixth Street。但您还在Broad研究所、斯坦福医学和许多令人惊叹的公司董事会任职。也许您可以向我们介绍一下您的职业生涯,以及这些经历中的一些要点。

好吧,让我谈谈我做的一些事情,然后重点就会显而易见了。所以我是在新墨西哥州的一个偏远小镇长大的。

我有一个时刻,真的就像电影一样,在我大约十岁的时候毕业了,我父亲搂着我的肩膀说,医学和计算机是未来,你会非常擅长计算机。这是1974年。对每个人来说,这可能并不明显,但对我父亲来说很明显。

他是一位技术绘图员,是国家实验室的成员之一,他们刚买了一台巨大的计算机,他的团队用它来绘制核武库中武器的精美蓝图。在我很小的时候,我就拥有最新最好的设备,非常昂贵,而且我的父亲,嗯,在新墨西哥州,你没有时间和选择,尤其是在那个时代,基本上只有旅游业和军工复合体。所以我选择了军工复合体。

在我16岁的时候,我的第一份暑期工作是在阿尔伯克基的空军武器实验室。政府认为在新墨西哥沙漠引爆炸弹有很多问题。一些科学家当时有一个疯狂的想法,我们可以模拟炸弹爆炸,而不是实际引爆它们。

他们拥有一台早期的Cray超级计算机,所以对于一个对计算机略知一二的孩子来说,这是一个令人惊叹的机会。我的第一份工作就是参与这些大型Fortran程序,这些程序将使用蒙特卡洛模拟。

我早期就接受了这种技术的洗礼,你会模拟单个粒子从一颗中子弹爆炸中散射出来,然后计算由此产生的冲击波。我的工作是将这个程序从MKS单位转换为电子静止质量单位。这对我来说肯定比旅游业的工作更有意思。

所以我做了这个。然后下一个重要的时刻是我去了哈佛,当时我还是个孩子,我选修了一门软件工程课程。你碰巧也选修过吗?

我没有选修软件工程。我也去了哈佛。我想,我想我们也认为你学习的是化学,是这样吗?

所以你必须立即声明一个专业或方向。你选修了软件工程课程。而我不知道这一点,也不知道要声明什么专业,肯定是一些科学专业。

我去了科学中心,科学教授们正在为他们的系招募学生。我记得Stevenson坐在对面的桌子上说,“你是做什么的?”这有点像一个挑剔的问题,我想。

我说,“我是一名计算机科学家。”我简直不敢相信他在1981年对我说过这句话,但他确实说过,“生命科学的未来是计算的。”这太令人惊叹了,对吧?如此具有预见性,我想,哇,这肯定是真的。他说,“我们将为你专门构建一个课程,并将重点放在模拟上,重点放在构建生物系统的数字孪生体上。”所以我直接去了他的实验室,在那里进行了一些关于蛋白质结构的早期工作,并致力于建立蛋白质数据库。

谁知道呢?即使在当时,他也想解决蛋白质折叠问题。我还记得他说,“这可能需要50年,也可能需要100年,我们可能永远也无法解决这个问题。”

这显然非常重要,因为那个蛋白质数据库是AlphaFold的基础数据,AlphaFold后来出现并解决了这个问题。所以贯穿我整个职业生涯的主题是,我一直致力于构建一些金融、科学或工业现实的数字孪生体。数字孪生的神奇之处在于,你可以进行各种实验,你可以提出各种在现实中提出会很危险或不可能提出的问题。

然后你可以根据这些问题的答案来改变你的行动。对于华尔街来说,如果你有一个高保真度的交易业务模型,这是我和许多其他人作为大型团队的一部分共同努力实现SECdb的结果,那么你可以利用这个模型,你可以提出各种反事实的“如果”问题。正如高盛的CEO Lloyd Blankfein,他几十年来一直委托并资助这项工作,所说,“我们不是在预测未来,我们是在精确地预测现在。”从那以后,我一直都在做这种事情的某种变体,这太迷人了。

我不想花更多时间深入研究SECdb,因为我显然也参与了金融危机期间的压力决策。但也许可以回到过去,然后你最终在医疗保健和人工智能领域攻读研究生学位。你是如何从那里进入华尔街的?也许可以谈谈这个转变,因为对大多数人来说,这并不明显,然后我们会深入探讨你的高盛时期。我得到了一个转折点。

我对构建生物数字孪生体的问题如此兴奋,以至于对我来说,继续在研究生院学习似乎是正确的选择。实际上,我想开始赚钱。我真的很感谢我的母亲,她让我相信,如果我没有获得博士学位,我就不会成功。我相信她是对的。所以我申请了斯坦福大学,这是我的梦想学校。所以发生的事情是,我参与了一个关于医学中人工智能的项目,该项目起源于斯坦福大学,由Ted Shortliffe领导,即使在当时,他也因构建第一个用于诊断血液细菌感染的专家系统而闻名。

所以我加入了这个项目,我和一些我的大学同学一起,利用他的工作,思考我们能否将这项工作,这种专家系统推理,放入一个正式的,可能是贝叶斯,框架中?答案是:可以。但缺点是它在计算上是难以处理的。

所以我的博士论文是寻找快速随机近似方法,以便在较短的时间内获得可证明几乎正确的答案。这是一个令人惊叹的项目,但我们很早就意识到,计算机太慢了,无法解决我们想要解决的问题。医学中诊断的实际问题是,你大约有1000个疾病类别和大约10000个各种临床发现。

实验室检查结果、表现、症状。因此,他们必须计算的联合概率分布大约是1000的10000次方。这是一个大问题。

我们取得了一些进展,但很明显,计算机不够快,我们都感到沮丧。这是人工智能的许多早期“核冬天”之一。我直接走进了其中一个,我开始觉得说“人工智能”很尴尬,对吧?这根本不像人工智能。

我们中的一些人四处寻找其他事情要做。我收到一封信,放在我系里的邮箱里。这封信来自一位猎头。

高盛已经联系了他。我还记得这封信。我把它保存在某个地方。

上面写着,“我被要求列出硅谷拥有斯坦福大学计算机科学博士学位的企业家名单。而你就在我的名单上。”

在1993年,在LinkedIn出现之前,你必须做一些挖掘才能建立这样的名单。我认为我被解雇了,而且短期内不会再有工作了。我不知道该怎么办。

我在纽约有一些大学朋友,我打算去银行免费旅行。这就是我最终进入高盛的原因。这似乎并不正式。

我只是喜欢他们正在进行的一个似乎很疯狂的项目。这个项目是:我们将构建一个分布式事务保护对象关系数据库,它将包含我们的外汇交易业务,这本身就是一个全球性业务。所以我们不能只在一个地方进行交易,我们需要有人从头开始用C++编写一个数据库。

幸运的是,我没有上过数据库课程,这反而让事情变得更容易了。因为如果我上过,我会说,“这太疯狂了。你为什么要从头开始编写一个数据库?”而且我对数据库一无所知。

所以我非常幸运地作为第四位工程师加入了三人核心SECdb设计团队。非常幸运的是,有一天老板走进我的办公室说,“商品业务的交易策略师辞职了。恭喜你,你成为新的商品策略师,去交易大厅介绍一下自己吧。”

他本来不会让我去介绍自己的。说实话,我们有点害怕他们。所以在1994年,我出现在石油交易大厅的中间,对于一个来自西班牙的计算机极客来说,这是一个奇怪的地方。

这是一个多么令人惊叹的故事。你知道,我最喜欢的格言之一,我相信,而且经常重复,那就是机会存在于专业领域之间。我个人非常喜欢探索这些交叉点。我觉得你的职业生涯一直都在这些交叉点上。也许可以快进到金融危机。众所周知,SECdb确实帮助该公司度过了这段时期,并且真的,是什么让SECdb与其他在那一刻损失数十亿美元的华尔街公司不同?你们是如何应对的呢?是的,从这里开始,我们将进入流行文化领域,因为当然,当你开始谈论这些事情时,你必须提到《大空头》,对吧?SECdb向高盛的首席财务官David Viniar展示了在金融危机期间的情况。

我们和其他人一样,在抵押债务义务(CDO)上持有巨额头寸。它们的评级很高。所以SECdb是另一回事。

而且IT是有价格的,这个价格在他们的模拟中可以上下波动,在模拟中,IT会根据概率分布受到冲击,然后是非参数或基于情景的冲击。我们研究了这个问题,认为哇,我们最好对这个非常大的未对冲头寸做点什么,也就是IT的涨跌。我们当时并不知道金融危机即将来临。

当然,我们在媒体和其他地方被指控各种疯狂的事情,比如他们说只有他们才对冲。所以他们一定知道危机即将来临。我们只是对现状的预测,认为最好对冲这个头寸,这就是“大空头”的由来。

问题是,如果雷曼倒闭,会发生什么?我们谈论雷曼就像它是一个单一实体一样。我们的账簿上承担着对47个不同的雷曼实体的风险,这些实体之间存在复杂的子公司担保、非担保、关联和非关联关系。

所以非常复杂。但昆虫DB IT都在里面,你可以随意移动它。

你也可以很容易地从对方角度生成报告。我现在把它说得好像它很完美一样。它并非完美无缺。

我们那个周末不得不编写大量软件。但关键是我们把所有东西都放在了一个虚拟的地方。这只是一个整合它们的问题。所以这也是传说的一部分,但也是事实。

雷曼申请破产保护的47个实体破产保护申请后一小时内,我们的团队就出现在了雷曼总部,我们有47张纸,上面写着我们针对每个实体的索赔,这些索赔涵盖了公司所有业务。而华尔街许多大型机构花了几个月才做到这一点。这就是C的威力。

T.B. 当然,它并不完美,但这是其他人所没有的东西。

就像皮吉一样。回到上一点,监管对技术的历史影响,对金融服务的影响是什么?我想到了,比如,在全球市场上,不同资产类别转向电子交易,对吧?这在历史上往往是由监管变化、新兴技术驱动的吗?我们都对此很好奇,也想知道它如何影响未来。

是的。监管是变革的有力驱动力,技术变革也是如此。有些事情是不可避免的。我坚信带有约束和规则的资本主义。

我们可以,而且将会就规则的性质、规则的深度、谁制定规则以及如何实施规则进行激烈的辩论。所有这些都非常重要。但要说,哦,我们不需要任何规则,或者相信我们,我们会照顾好自己。

我还没见过这种方法奏效。所以在某些情况下,监管机构会说些什么。例如,在多德-弗兰克法案中,有一段非常简短的文字说,美联储将监督一项名为DFAST模拟的模拟,即多德-弗兰克法案。

我甚至不记得其余部分代表什么,对吧?这将是美联储工作的一部分,模拟银行在严重不利情景下的表现。这是一个强大的概念,对吧?你必须模拟未来的几个季度的现金流、资产负债表和损益表。

法案中并没有详细说明这些内容,但随后监管机构介入并真正利用它,说你必须模拟未来九个季度,未来九个季度,对吧?整个银行,从头到尾。然后,在一个非常重要的举动中,当时负责该规则的监管机构代理主管、美联储理事表示,我们将把该模拟与资本行动联系起来,无论你是否可以支付股息,或者是否可以回购股票,或者是否可以支付员工报酬。

因为他知道这会引起所有人的注意。如果只是一个模拟,那就另当别论。但如果你需要在支付任何人的钱之前做好这件事,包括你的股东和员工,那么你就会投入大量的精力。

所以这导致了巨大的变化,使系统更加安全和稳健。我们在疫情期间看到了这一点。电子交易的早期阶段、人工智能的早期阶段,实际上给我们带来了一个有力的教训,对吧?

监管机构做出了巨大的努力,说我们必须了解这些算法的想法,因为它们可能会操纵市场,可能会平滑市场,可能会使市场崩溃。我们总是争辩说,你永远无法弄清楚或理解他们在想什么。这是停机问题的变体。

但在计算机进行思考与现实世界之间的边界上,存在一些API,存在一些边界。在这个边界上,就像在铁路控制的早期阶段,在那些交叉路口,你最好确保两列火车不会相撞,对吧?这就是事故发生的地方。

但是,当火车只是在轨道上运行时,让它们在轨道上运行,只要确保它们在正确的轨道上。这将成为大型语言模型的一个重要原则。随着AI开始行动并引起世界变化,我们必须非常关注这些边界。

这也许可以很好地过渡到今天。你对金融科技和摩根大通的崛起有着巨大的影响力,以及开发人员、决策者的崛起,也许可以谈谈今天特别是一般人工智能。

这项技术与你1991年获得博士学位时的人工智能有何不同?你认为它不仅对金融服务,而且对其他行业的影响是什么?好吧。

对于全盘考虑,当然。我记得80年代末、90年代初,在斯坦福大学这个项目中,我们是亚洲人,对吧?然后我们会看看这些连接主义神经网络的人。

我不得不说,但这是真的,我很抱歉他们。我们认为,就像那样工作,模拟神经元。你一定是在开玩笑。

好吧,所以他们只是不断地刺激这些神经元。然后就发生了液态。从某种程度上来说,太阳底下没有新鲜事。不久前,我和约书亚·本吉奥进行了一次精彩的谈话,他确实是这方面四五个主要人物之一,在这个人工智能的复兴中取得了令人难以置信的成果。

他谈到他的工作是基于将这些旧的连接主义网络与神经网络结合起来,神经网络设计贝叶斯网络,反之亦然。所以有些想法又回来了。但可以肯定地说,尽管研究的河流采用了这种连接主义网络方法,但现在产生所有成果的是这种方法。

大卫,你会如何描述所有这些算法,因为它们只是软件,对吧?一切都是图灵等价的,对吧?但它们是非常有趣的软件。它们最初使用的是图像,互联网上的猫的图像。人们上传猫的照片。

现在,你有了数十亿张人们标记为包含猫的图像,你可以假设所有其他图像都不包含猫,你可以训练网络来识别是否有猫。然后是所有这些变体,这只猫多大了?这只猫生病了吗?它有什么疾病?所有这些事情,也许从十年前开始,你开始看到惊人的结果。

然后在Transformer论文之后,我们有了另一个版本,那就是填空,或者预测接下来会发生什么,或者预测之前发生了什么,这就是Transformer和我们现在拥有的所有聊天机器人。太神奇了。我希望我们都能更详细地了解它们是如何做到这些事情的。

我们开始理解它,它完全取决于训练集,也完全取决于平稳分布,对吧?所以这一切之所以有效,是因为猫或不是猫,猫的变化非常缓慢,是进化的时间。它们不会日复一日地变化,但日复一日变化的事物,例如市场,这些技术将如何发挥作用就不那么清楚了。

但它们确实在做令人惊奇的事情。我们在我的公司使用它,我们正在生产中使用它,我们非常清楚所有风险。我们围绕它制定了很多政策。

它让我想起了电子交易早期狂野西部的日子,当时我们授权我们中的一些人进行一些研发。但对我们投入生产的东西非常谨慎。我们从简单的事情开始。

感觉这是一个独特的时刻,或者也许对我来说是独特的,有很多势头正在发生。自下而上和自上而下,自下而上是因为,我不知道,大约40%的财富100强公司正在使用GitHub Copilot、OpenAI或微软的产品。

在商业上,每个首席执行官或每个董事会成员都可以将提示输入到这些模型中,并完全理解其魔力,并想象它可能对他们的业务产生的影响。所以,似乎许多这些公司的员工都想要你所描述的生产力提升。边界就像,你知道,这如何影响我们公司的员工资本效率?我们可以在哪里部署这项技术?我想,当你与其他大型公司的首席执行官交流时,他们会向你寻求建议,你如何向他们建议?如何在他们的组织中部署人工智能,在这些公司内部,短期、中期和长期的机会是什么?

真正首要的任务。这是我们在Golden长期从事的工作,我们很高兴将Golden留在一个能够利用生成式人工智能的地方。我非常快速地谈谈这一点,那就是为整个企业的所有数据建立单一事实来源。一个时间旅行的事实来源。

今天什么是真实的,我们在三年前某一天收盘时知道什么是真实的,对吧?我们拥有所有这些信息,它经过清理、创建和命名,我们知道我们可以依赖它,因为所有这些训练都是垃圾进垃圾出。所以,如果你没有基本事实,那么你所做的只是传播谬误,你只会陷入谬误,并想象一些不正确且不可操作的东西。

所以,正确地获取你的单一事实来源。这个数据工程问题。我认为很多公司在这方面做得非常糟糕。我对新的Gemini 1.5上下文窗口、一百万个token之类的东西感到非常兴奋。我只是想从山顶上喊出来,如果你参与过这个游戏,并且一直在使用检索增强生成,这很强大,但你会遇到这个问题。

如果我必须处理一个复杂的文档,它会引用自身的部分和块,否则你就会失去所有这些,除非你有一个非常大的上下文窗口,打破链接上下文窗口的二次时间复杂度是巨大的。我认为在接下来的几个月里,你会看到很多这样的变化。曾经非常困难的问题将变得非常容易。我知道。你怎么看?

我认为每家公司都需要某种使用Golden的工具,也许用Golden作类比,它在组织中占据了很大一部分,尤其是在许多部分,联邦化,我认为可以而且应该利用软件。许多这些工作流程都可以用人工智能来增强,从法律到合规,到最终入职,到我们正在谈论的风险管理。但我认为它将对企业产生深远的影响。

显然是有偏见的。我想一个人们经常争论的话题是监管对这项技术采用的影响。你对政府在这方面的一般作用有什么看法?以及你对加速或减缓这一进程的建议是什么?他们有什么责任?

好吧,我在金融危机中学到的一件事是对监管机构和立法者的巨大尊重。他们有一份非常艰巨的工作,而且与他们合作,成为关于企业如何运作的可靠知识来源,非常重要。

我的意思是,很多人只是去见监管机构,他们只是在为自己说话,并希望监管机构或立法者不会理解这一点,我认为这是一种非常糟糕的方法,而且很有可能只会让他们生气,对吧,这绝对不是正确的结果。所以我一直在花很多时间与监管机构和立法者以及许多不同司法管辖区的机构打交道。你已经听到了一些我的想法,那就是让我们不要采取我们在电子交易中最初采取的那种方法。

那种方法是写一份关于你的电子交易算法如何工作的长篇文档。然后第二步是将该文档交给一个控制小组,然后该小组可以阅读该文档并断言该算法的正确性,对吧?这就是停机问题。平方它,这不仅是一个坏主意,而且是一个不可能的想法。

相反,让我们在所有存在现实世界接口的地方,尤其是在存在与另一台计算机的现实世界接口的地方,投入大量的精力、大量的标准和证明,对吧?所以类比是电子交易,你几乎无法阻止交易员通过电话喊单,导致你的银行倒闭,对吧?你可以。

如何?你将如何防止这种情况发生?对吧?但你真正担心的是那些进行数百万次交易的计算机,对吧?即使它们非常小,也能非常快速地进行IT操作,你可能会造成可怕的事情发生。

所以,我总是告诉监管机构的另一件事是,请,请考虑责任的概念,对吧?他们从这个想法开始,让我们让大型语言模型的创建者对大型语言模型发生的每一件坏事负责。对我来说,这完全等同于说,让我们让微软对人们在Windows电脑上做的每一件坏事负责,对吧?这是完全普遍的。

所以这些大型语言模型很像操作系统。因此,我认为监管必须首先发生在这些边界、这些交叉点、这些控制点,然后看看我们接下来会做什么。我希望看到一些这样的法规尽早出台,而不是晚出台。

不幸的是,人类历史的模式是,我们通常会等到发生真正糟糕的事情,然后再去进行清理,事后进行规范,而且通常会做得过火。这就是《多德-弗兰克法案》的历史。就像我们真的不知道金融危机中出了什么问题一样。

所以让我们来规范一切。我认为99%的都是繁文缛节,并没有让世界变得更好。其中一些,例如汽车安全法规,是深刻的,确实使系统更安全、更可靠。我希望我们首先做到这些,而不仅仅是繁文缛节。

但我知道你对生命科学也很热情。你从那里开始了你的研究生生涯,我相信你现在是Recursion的董事会成员。

一家制药公司。

是的。是的。也许谈谈你对生成式人工智能在生命科学,特别是生物技术领域的影响的看法。

好吧,这太史诗般了,不是吗?就在几个月前,我经历了一个令人惊叹的时刻。我有机会在J.P.摩根医疗保健活动上为英伟达的黄仁勋做炉边谈话。那是一个Recursion赞助的夜晚。我们真的谈论了他从芯片设计中学到的一切。

所以黄仁勋,非常谦虚,会说,好吧,他只是那一代芯片设计师中的第一位,他们是第一批使用软件从头设计芯片的人。这实际上是他唯一知道如何设计的方式。他喜欢在视频中说英伟达是一家软件公司,它确实是。

但这似乎与英伟达应该是一家硬件公司的说法相矛盾。他谈到了他业务中使用的模拟层。

这些层并没有一直延伸到斯特拉特气体方程。我们甚至可以很好地处理小分子,对吧,求解小分子的斯特拉特气体方程。但它确实深入到非常低的层次,并且深入到非常高的层次,例如这个芯片运行的是什么算法,而这都是软件模拟。

他在那次谈话中说,在某个时刻,英伟达必须按下按钮,说“制造这个芯片”,按下这个按钮的成本为五亿美元。所以你真的想对你的模拟充满信心。嗯,药物非常类似,只是它们在进入第三阶段临床试验时成本远高于五亿美元。

所以对我们所有人来说,很明显,你应该能够进行这些模拟并找到药物。现在第一步将只是略微提高成功概率,从第二阶段到第三阶段临床试验的成功概率,这将非常有价值,因为现在失败的成本高达数十亿美元。

是的,但最终,我们能否仅仅在巨大的可能性空间中找到药物,找到那根针?这个问题令人难以置信。根据碳链的大小,

但让我们选择一个数字,大约有十万亿种可能的化合物,而全球只有四千种获批药物。这是一个很大的数字。如果人工智能能够帮助我们浏览这个空间,那将是巨大的进步。

但我敢打赌,我们将以这种方式遇到生物学。生物学比最复杂的芯片复杂得多,我们甚至不知道复杂了多少个数量级,以及有多少抽象层次。但问题是,我们是否有足够的数据来训练大型语言模型?

来推断生物学的其余部分?或者我们需要更多的数据?我认为每个人都很清楚,我们需要更多的数据。我认为我们不太清楚的是,我们需要多十个数量级的数据,还是一百个数量级的数据?我们只是不知道。太神奇了。

是时候成为一名生命科学家了。

这是有史以来最好的时代。我们在Alphabet董事会说过这句话,这是一个令人难以置信的人群。当我听到谢尔盖·布林和拉里·佩奇说这是有史以来最好的时代时,其他科学家当然也同意这一点。这太神奇了。

非常感谢你的时间。很高兴与你交谈,你拥有如此令人着迷的职业生涯,我们非常感谢你抽出时间。

谢谢。

感谢收听“In the Vault”。您可以访问a16z.com/podcasts收听我们所有的剧集。要了解有关最新金融科技新闻的更多信息,请务必访问a16z.com/fintech,并订阅我们的每月金融科技通讯。感谢收听。