您好,这是Babbage的免费剧集。要每周收听节目,您需要成为《经济学人》的订阅者。更多信息,请在线搜索Economist Podcasts Plus或点击节目说明中的链接。
六个月后,您或许能够跑完5公里,预订梦想中的旅行,或者每次照镜子都能看到更浓密、更丰盈的秀发。通过HERS,您可以获得皮肤科医生信赖的、临床验证的处方药,其成分超越了非处方产品。无论您更喜欢口服还是局部治疗,HERS都能满足您的需求。
开始很简单。只需在线填写一份问卷,持牌医生就会为您推荐个性化方案。最棒的是?一切都在网上完成。如果开了处方,您的治疗药物会直接送到您家门口。无需去药房,无需等待,也无需担心保险问题。
此外,治疗费用每月低至35美元。立即开始您的免费在线问诊,网址为a4hers.com/deal。网址是F-O-R-H-E-R-S dot com斜杠deal。复方产品未经FDA批准,也未经验证其安全、有效性和质量。需要处方。价格根据产品和订阅计划而有所不同。请访问网站查看完整详情、限制和重要的安全信息。《经济学人》。
乳腺筛查的过程是两位人类阅片者查看乳房X光照片,然后做出决定,如果他们意见不一致,则会请第三位人类阅片者来判断。杰拉德·利普是苏格兰东北部负责乳腺癌筛查的放射科医生。
杰拉德和他的团队最近想了解人工智能工具如何帮助他们的服务。我们让10,000名女性接受了系统检查,当两位人类阅片者都说乳房X光照片上没有发现任何异常时,人工智能就派上用场了。然后,人工智能会给出读数,并指出:“这张乳房X光照片上有一些东西”,并在乳房X光照片上画一个圆圈,说:“您是否想更仔细地查看一下这个区域?”
我们做的第一批病人中,有一位名叫芭芭拉的女士。芭芭拉是一位70多岁的女士,这将是她最后一次参加筛查项目。我们以后就再也见不到她了。人工智能确实在她的右乳房中突出显示了一个非常细微的区域,两位人类阅片者之前已经说过没问题,他们并不担心。
在人工智能的辅助下,我们专家阅片者本人再次查看了这个区域,并说:“让我们给她一次机会,让我们把她叫回来,再看看这个。”我想是我给她做了超声波检查和活检,发现乳房里有一个很小很小的东西,大概只有5毫米大小。当结果出来后,不出所料,芭芭拉是我们利用人工智能作为额外阅片者或安全措施所发现的11名女性之一。
人类阅片者认为这是正常的,但在她的情况下,这是一个严重的癌症,否则它会在她不知情的情况下在后台生长。您可能以前听过像芭芭拉这样的故事。在过去五年左右的时间里,计算机视觉工具已被证明可以发现从X光照片上的骨折到视网膜扫描中疾病的早期迹象等各种问题。它们甚至已被用于辅助手术。
人工智能的应用清单将在未来几年呈爆炸式增长。
我知道我已经是非常优秀的放射科医生了,因为乳腺筛查项目表明我们很优秀,但人工智能给了我们一点优势。在筛查中,我们会查看很多正常的乳房X光照片。您需要查看六到八千张乳房X光照片才能发现癌症。也就是说,900张乳房X光照片是正常的。因此,如果我能自动化并减少这1000张乳房X光照片中的900张,那么实际上就能有更多时间与病人面对面交流。
新型、更大的人工智能模型有望使医疗保健更容易获得,帮助医生更快地发现疾病,并改变医学研究的开展方式。但承诺是一回事,实践是另一回事。这些技术究竟会在多久后真正造福患者?本播客是关于世界卫生组织如何应对人工智能潜力的两集系列节目中的第一集。
首先,我们将研究患者在何处以及何时可以从医疗保健中的人工智能模型中受益。下周,我们将展望未来。医学研究人员和医生将如何利用最新的人工智能模型以全新的方式理解和治疗疾病?我是阿洛克·贾,这是来自《经济学人》的Babbage。今天,第一部分,人工智能如何改善患者的体验。♪
为了讨论人工智能在医疗保健中新兴的作用,《经济学人》的健康编辑娜塔莎·洛德加入了我们。她最近撰写了一份关于该主题的特别报告。感谢您的加入,娜塔莎。感谢邀请。娜塔莎,人工智能和医疗保健是一个我们过去已经报道过很多次的话题。在人工智能应用的有效领域已经有一些例子,人们也谈论了它一段时间以来的潜力。
现在,是什么具体的焦点让你觉得它很有趣呢?我想,过去一年中生成式人工智能尤其是在医学领域中可能实现的事情方面引起了相当大的轰动,这使用了过去的人工智能工具和我们将要发明的工具。而且,你知道,可能性不仅仅在于诊断,还在于技术。
提供个性化健康建议的工具,快速分类大量患者的能力,撰写病历并总结与患者的会面,甚至从医疗数据中发现新的见解并进行药物研发。因此,人工智能的潜在用途非常广泛。好的,那么……
那么,根据您的看法,如果您从最广泛的角度来看待这个问题,您认为医疗工作者未来能够用人工智能解决的最大问题是什么?
我的意思是,从根本上说,人工智能能够做到的是复制相当复杂的知识形式。因此,如果您考虑医疗保健中有哪些大问题,那就是没有足够的医生或护士、精神科医生,您能想到的任何医疗专业人员,都没有足够的人来满足地球上大约70亿人的需求。
所以是获取问题,对吧?这似乎是一种非常有趣和引人入胜的方式。如果您有能够替代部分临床工作人员功能的生成式人工智能,从本质上讲,您将有更多人能够获得这些服务。这就是您所说的。
是的,我们目前正处于这种非常困难的境地:全球人口老龄化,医疗成本上升,慢性病负担沉重,医疗工作者严重短缺。因此,即使在短期到中期,如果我们能够利用这些技术,
实际上,即使我们从大局来看,在未来10到20年内没有解决医疗保健问题,也有很大的潜力来提高生产力并满足人类需求。所以问题是,我们能从这项技术中获得多少,以及能多快获得?好的,这就是我们接下来在节目中要探讨的内容。娜塔莎,我们稍后会再回来找你。
使用计算机视觉来帮助诊断患者的工具之一称为MIA。这是由Chiron Medical公司构建的人工智能模型,杰拉德·利普(我们在节目开始时听到过他的声音)一直在苏格兰使用该系统从乳房X光照片中检测癌症。
许多人可能不知道,通常需要两位放射科医生查看乳腺癌筛查中的每一张乳房X光照片。彼得·卡奇卡梅蒂是Chiron的首席执行官。您可以想象,这是一个很大的数量,两位医生可以查看大量的照片。每当他们意见不一致时,就会请来第三位医生。
但即使有两名医生,据估计和预期,超过五分之一的癌症会被错过。因此,显然这意味着可以做出很多改进。
那么人工智能能做什么呢?它可以提高癌症的检出率。我们的结果表明,我们可以将癌症检出率提高多达13%。有了它,我们可以预期实际上可以将乳腺癌筛查中漏诊的癌症数量减少一半。好的,那么谈谈这项技术吧。您描述的工具背后是什么类型的人工智能模型?它是如何工作的?
是的,MIA基于大量不同的AI组件。
这主要意味着卷积神经网络。好的,所以输入是扫描或乳房X光照片,数据会通过神经网络的各层传递。每一层都会寻找图像中可能构成病灶或其他问题的特定内容。一旦数据通过神经网络的所有层,算法就可以确定患者是否可能患有癌症。
在做出决定之前,Mir会将图像通过几个不同的网络。所以想象一下,一大群专家,比如,我不知道,数百名放射科医生坐在一个房间里查看每一张乳房X光照片,然后他们集体做出决定以获得最佳结果。如果您仔细想想,人工智能可以在数据集中自行查找信息,例如,在乳腺癌筛查图像中,
人类可能无法处理。也许是不同的图案,也许是更精细的灰度等等。从实际的角度来看,这意味着人工智能可以拥有与医生非常不同的能力。这意味着我们需要使用人工智能并对其进行优化,使其成为医生的最佳补充能力,而不是试图与医生竞争。
告诉我模型的训练对象。您是如何使神经网络能够识别乳房X光照片上乳腺癌的样子?因此,我们使用了整个患者的纵向数据。对于阴性病例,我们想确保患者多年来没有阳性迹象。对于阳性病例,我们想确保我们考虑了阳性癌症的所有不同方面。
重要的是,我们应该根据我们所能获得的尽可能多的真相(例如活检和其他随访)来训练算法,而不是根据医生的说法,因为否则我们只会接近医生所能做到的水平,而无法开发补充能力。所以我们谈论的是乳房X光照片的图像,但也包括来自与这些图像相关的活检的数据,也许吧。
所有这些都被标记,以便模型知道哪些包含潜在肿瘤,哪些不包含。是的,标记过程是机器学习工程的关键要素之一。真正理解该领域,什么是阳性,什么是阴性,以及理解某些事情是否确定。通常有多少数据输入?我的意思是,有多少扫描,多少活检,我们谈论的是什么数量级?
数量级是几百万。对于人工智能来说,重要的不是您需要查看的病例数量,而是您需要针对其训练的最大信息量进行优化。例如,如果我有一个算法,它是在
欧洲某个特定国家训练的。如果您获得更多此类病例,这远不如您获得来自全球不同种族的人(来自亚洲、南美洲、非洲)更有价值。我明白了。所以您希望获得尽可能多样化的全球数据集?以一种特定方式实现多样化,从而提供最高的信息量,以便您可以减少混杂因素。好的。那么MIA目前在哪些临床应用中呢?
它在匈牙利和英国都有临床应用。然后,请您介绍一下放射科医生将如何使用它。所以,你知道,病人来了,他们做了扫描,有一张乳房X光照片可用。这是否与放射科医生同时查看相同内容一样,会输入到模型中?是的。一旦患者扫描完毕,人工智能就会……
在几秒钟内做出判断,甚至在患者离开房间之前。但是,这些结果可能会被保留,以支持一个无偏见的流程。医生先查看图像而不考虑人工智能的输入是一个非常好的主意。这样他们就不会受到它的影响。没错,这样他们就不会受到影响,这样就能最大限度地发挥人的能力,然后人工智能会确定是否需要进行调整等等。
然后它可以向首席放射科医生发出警报,例如,“可能错过了癌症”或“您的放射科医生可能过度诊断了”等等。最终做出决定的始终是人类放射科医生。他们有权决定。人工智能是一种工具,用于在人工智能确信时发出警报。
因此,医生很有可能改善患者的预后。彼得,这太令人着迷了。非常感谢您抽出时间。非常感谢您。计算机视觉系统在放射科中具有巨大的潜力,可以从医学图像中检测特定疾病。但人工智能使患者生活更轻松的能力远不止于此,正如我们的制作人之一杰森·霍斯金所发现的那样。
当您走在波士顿的街道上时,很难不被这座城市作为创新中心的作用所提醒。
生物技术领域众多有创意的想法的核心是两家世界领先的机构,麻省理工学院和哈佛大学。我的兴趣在于我们如何培养人工智能医生。那是普拉纳夫·拉杰波卡尔。他是哈佛医学院的助理教授。五年前,如果您是这个领域的工作人员,您通常会有一个模式专业和一个疾病专业。
例如,我过去对胸部X光片感兴趣,特别是对胸部X光片进行研究以识别肺炎的迹象。
但是,随着时间的推移,该领域的发展方式越来越清晰的是,您可以开始考虑解决放射科医生所处理的全部问题需要什么。因此,现在我的团队致力于思考解释胸部X光片和/或CT扫描和/或MRI扫描。
我们不是从疾病的角度来考虑这个问题,而是真正从我们所说的通才医学人工智能的角度来考虑这个问题,在这个角度中,您试图构建这些人工智能模型,使其能够做的不仅仅是检测一种疾病。那么,为什么该领域发生了变化呢?是什么样的技术促成了这种变化呢?嗯,有三种关键技术真正带来了进步。其中一种是自我监督学习。
自我监督学习的思想是能够在不需要大量注释的情况下进行学习。我们在这方面进行了一些创新,世界上的其他几个小组也进行了类似的创新。所以,通过注释,您的意思是图像在训练集中被标记。因此,在乳腺癌的例子中,专家会仔细检查并告诉模型阳性癌症病例是什么样子,阴性癌症病例是什么样子。它从中学习。
但是自我监督学习使这个过程不那么费力。所以这是改变的第一件事。那么下一件事是什么呢?第二套真正流行的技术是多模态学习,它
在多模态学习中,我们不仅对从单一模态学习单一模态感兴趣。例如,我不只是对从胸部X光片中学习感兴趣。我可能对从胸部X光片和相关的临床报告中学习感兴趣,以便了解,例如,哪个胸部X光片与哪个临床报告相匹配。
或者我可能有一些相关的临床信息,例如患者病史以及我们如何输入图像信息和临床背景信息,这在我们过去几年中建模方面有了很大的改进。好的,最后是什么?第三个方面是生成式人工智能,用于生成语言,
来描述我们在图像中看到的内容。这与放射科医生的做法非常接近。他们会写一段文字,全面地介绍每个器官、每个过程,并对其进行评论。
这项技术在过去几年中得到了真正的突破,使我们能够创建更有趣的模型,这些模型开始看起来像我们对放射科医生的期望。您的系统是否包含所有这三件事?没错。那么它的效果如何呢?这是一个很好的问题。例如,我们发表了一项关于CheckZero算法的研究,
您能够达到与放射科医生相同的性能,以检测胸部X光片中的疾病,但这次几乎没有放射科医生明确提供的注释。一年后,我们达到了一个更高的里程碑,最近我们的团队已经证明我们可以直接输出这些临床报告
当我们将这些报告交给放射科医生时,有时它们来自模型,有时它们来自另一位放射科医生,我们问,您有多喜欢模型生成的报告?我们发现它目前差不多。
所以我想您到目前为止所说的一些内容,您试图构建人工智能医生,算法正变得与放射科医生一样好。这会让一些人感到害怕,对吧?人工智能会取代医生吗?嗯,我认为有一种传统的方法来思考这个问题,那就是这些不会取代放射科医生。我认为这是……
大部分都是错的。
现在,您只是严重短缺。因此,在印度,数量已经变得如此之高,胸部X光片甚至没有由放射科医生报告。这意味着,坦率地说,很多人不擅长阅读胸部X光片,他们承受着做出这些决定的压力,而这些决定会对患者产生很大的后续影响。
现在考虑一下将人工智能纳入其中。如果您有自主的放射科医生,并且您部署他们来提供初步读数或在没有专家能够进行解释的地区提供服务,想象一下这对社会有多少积极的益处。
我们只是没有其他选择。全球放射科医生的培训处于停滞状态。您所看到的指数级增长曲线是老龄化人口的影像需求的增长。这是一个5%的复合年增长率。因此,您认为这个问题只会越来越严重。
而我们眼前看到的解决方案将是能够进行这些读取的人工智能模型。我可以看到,在难以获得医疗保健的地区,自主放射科医生将非常有用。但是人们肯定会对这个想法感到害怕,尤其是在您考虑信任问题时。
你知道,我经常在我的研讨会上问这个问题。我问人们,你们有多少人信任你们的医生?令人惊讶的是,实际上并没有很多人举手。
有趣的是,为什么我们信任医生?原因之一是他们有证书证明我具备放射科医生的资格,并且他们必须每隔几年更新一次。因此,这是我们在一个社区中建立的系统,该系统了解我们如何看待人类医生的许可。
因此,同样,我认为我们需要为这些人工智能医生制定许可原则。好的,现在您谈到的所有这些未来技术都依赖于生成式人工智能。我认为大多数人与生成式人工智能的互动都是玩类似ChatGPT的东西。你知道,也许人们已经用它们来检查他们可能有的症状。但是ChatGPT显然没有被许可作为医疗设备。
但是这种通用技术有用吗?我最近试图找出我能为我的一些背痛做些什么。当我查看谷歌以及我能够从ChatGPT中理解和收集的内容时,在它能够提供给您的信息深度方面存在巨大差异。
当然,这带来了一个问题,那么我该如何验证它告诉我的是真的呢?嗯,我总是可以在独立的来源上查找这些独立的来源对ChatGPT对我的医疗问题的看法有什么说法。但这实际上并没有被记录在案。
正如我所认为的那样,例外情况并不多。无论我们是否喜欢,我们至少在患者方面一直在使用这些系统。这里的警告是,这些
大公司通常不想提出医疗建议。因此,他们调整他们的模型,以便能够避免提出医疗建议。从监管的角度来看,这可能是一件好事。然后他们不必担心被归类为医疗设备。
但我认为这确实带来了权衡,因为新英格兰医学杂志最近对ChatGPT的早期版本进行了评估,以评估其回答医学问题的能力。结果表明,它实际上做得相当不错。
这让你对这些系统功能强大有了了解。坦率地说,在许多地方,拥有此类工具将极大地改善能够获得的医疗保健质量。这太令人着迷了。普拉纳夫,非常感谢您与我交谈。感谢您的邀请。
您可以看到为什么大型语言模型(例如为ChatGPT等提供支持的模型)可以帮助更好地理解疾病。毕竟,它们已经吸收了互联网上几乎所有可用的数据,并试图理解这些数据。这包括医院或医疗系统提供的真实网站、医学期刊上的文章,甚至医生或患者在线发布的第一手资料。
但是,这个巨大的训练集也可能包含不准确之处或错误信息。此外,生成式人工智能产生结果的方式使其难以完全信任。但是这些挑战能够克服吗?能否利用ChatGPT的对话能力来创建可靠的医疗机器人?接下来就来看看。
六个月后,您或许能够跑完5公里,预订梦想中的旅行,或者每次照镜子都能看到更浓密、更丰盈的秀发。通过HERS,您可以获得皮肤科医生信赖的、临床验证的处方药,其成分超越了非处方产品。无论您更喜欢口服还是局部治疗,HERS都能满足您的需求。
开始很简单。只需在线填写一份问卷,持牌医生就会为您推荐个性化方案。最棒的是?一切都在网上完成。如果开了处方,您的治疗药物会直接送到您家门口。无需去药房,无需等待,也无需担心保险问题。
此外,治疗费用每月低至35美元。立即开始您的免费在线问诊,网址为aforhers.com/deal。网址是F-O-R-H-E-R-S dot com斜杠deal。复方产品未经FDA批准,也未经验证其安全、有效性和质量。需要处方。价格根据产品和订阅计划而有所不同。请访问网站查看完整详情、限制和重要的安全信息。今天在Babbage,我们正在探讨医疗人工智能工具如何改善患者的体验。
我们之前听到过的《经济学人》健康编辑娜塔莎·洛迪一直在研究聊天机器人医疗保健中的应用。
娜塔莎,我们刚刚听到ChatGPT实际上可以作为医疗建议的有用工具。您现在正坐在演播室里和我一起。所以让我们来测试一下ChatGPT,看看它是否能解决您可能遇到的某些医疗问题。我必须说我持怀疑态度,但是您的手机上装有ChatGPT。最新的更新意味着它现在可以说话了。所以为什么不给它一些症状,看看它认为您出了什么问题呢?好的。好的。
你好。我现在遇到了一些问题。无法理解您所说的内容。你好,你能帮我一下吗?当然可以。你需要什么帮助?嗯,我有一个让我担心的医疗问题。我今天一直感到呼吸急促,胸部左侧有一阵剧痛。听起来您正在经历可能很严重的症状。
对于呼吸急促和胸部剧痛等症状,务必立即就医。您可以打电话给医疗服务提供者或去急诊室吗?是的,我可以。这听起来是个好主意。对于这样的症状,尽快请专业人士检查很重要。问问ChatGPT它实际上认为您出了什么问题。但是您实际上认为我出了什么问题呢?我需要知道。
我不是医生,所以我无法诊断出问题所在,但是呼吸急促和胸部剧痛等症状可能是由多种原因引起的,从较轻微的肌肉拉伤到更紧急的问题,例如心脏问题或肺部问题。它可能是什么样的心脏问题?胸痛和呼吸急促可能与几个与心脏相关的问题有关。以下是一些可能性:
一、心脏病发作。当流向心脏一部分的血流被阻塞足够长的时间导致其死亡时,就会发生这种情况。二、心绞痛。这是冠状动脉疾病的一种症状,当心脏在下巴或背部被阻塞时会发生这种情况。三、心包炎。这是围绕心脏的衬里发炎,可以确定确切的原因和适当的治疗方法。
现在,这很有趣,因为您使用的ChatGPT版本有很多防护措施,显然它不想告诉您它到底在做什么。它说它不是医生,它说您应该寻求医疗建议,这可能是明智的,对吧?这正是应该做的。但在它建议您可能正在心脏病发作之前,花了数分钟时间,我的意思是,这不好笑。那时您会躺在地板上。我
无法动弹。这在医疗建议中真的有多有用?嗯,它显然并非旨在有用。那个版本不行,不。但是我的意思是,我们距离能够建议任何出现这些症状的人都能够安全地与聊天机器人进行对话,并且这将是最佳行动方案的情况还有很长的路要走。我的意思是,这是一个好建议。
据我所知,一切都正确。我不是医生,但如果你要给出诊断,那么这样做是有规定的。你必须进行一些测试。而且,你知道,你必须遵守一些规定。而这项特定技术并没有经过这些程序。我认为仅仅期望
公开可用的ChatGPT模型能给我们提供医疗建议是不公平的。我认为它并不糟糕。我的意思是,我认为这是个很好的测试,因为我们知道多年来人们一直在使用谷歌搜索医生,他们称之为“谷歌医生”。我们现在知道,人们不仅会用ChatGPT查询他们的症状,我们也知道医生也在这样做。
我们还知道,人们正在使用这些工具来解决医学谜团。但是尽管有这样的前景,你能解释一下为什么ChatGPT这类通用模型永远不可能成为医疗设备吗?我们缺少的信息是,我们不知道有多少人在使用这些工具并得到错误的答案,或者得到错误的保证,认为他们没事,而实际上并非如此。而且
这就是我们甚至还没有开始用这些工具解决的问题。这就是为什么我们不能依赖它们的原因。此外,因为它们是生成式的,所以每次你问它们问题时,都会得到不同的答案。所以,你知道,在第10次问这个问题之后,谁知道它是否会给我同样的准确建议。当然,你知道,我们之前讨论过幻觉。生成式AI的
幻觉,它们编造事实。有时很难理解它们是如何得出结论的。所以这些都是信任的问题。当然,信任在医学方面可能是最重要的事情,因为你需要了解治疗你或给你建议的人是如何得出结论的,以及如果事情出错会发生什么。所以我认为下一个问题是,
你能制作一个更专业的医疗聊天机器人吗?人们是否正在尝试做这些事情?它们会带来什么好处?好吧,你可以得到医疗聊天机器人。有一个叫做Ada Health的聊天机器人,它是一个基于文本的聊天机器人。所以你输入你的症状。这是一个症状检查器。它不承诺诊断,但它经过多年的精心设计,并拥有所有需要的数据
内置到其中,以便它能够基本上评估你输入的内容并提出问题,然后权衡症状可能是什么,然后给你一系列可能的答案。这是一个受监管的医疗设备。所以我们有这个。
当然,问题是,对于这类聊天机器人来说,它们有点笨拙,你必须经历一个问答树。这可能是一个相当漫长的过程。你可能感冒了,你可能不得不坐下来回答许多非常不同的问题,其中一些问题似乎很奇怪。
但问题是,我们能否桥接这两个系统?我们能否将这个准确的基于文本的聊天机器人与这个令人惊叹的对话式ChatGPT工具桥接起来?我们能否拥有一种界面来询问这个更准确的医疗聊天机器人?这正是人们正在思考的。所以下一步
进化的步骤可能是你与听起来像ChatGPT的东西进行对话,但在幕后,你拥有一个更可靠、更健壮、更可解释和可证明的AI聊天机器人。
我的意思是,有一些方法可以确保大型语言模型的输出更准确,并且不会编造信息。我的意思是,这是所有行业都存在的问题。我听说过的解决方案包括只允许大型语言模型访问特定数据库中的数据。所以你选择了
论文或医学信息的数据库是正确的,你向大型语言模型提问,但告诉它只从那个特定的数据库中查找答案,你知道它被称为检索增强生成
然后,改进大型语言模型响应的另一种方法是用非常准确的特定标记信息微调通用大型语言模型。比如说医学信息,这意味着当你问问题时,它不再是通用的LLM了。它拥有关于某些疾病的特定才能和知识。
所以它不太可能给你错误的信息。最终,所有这些都必须经过监管机构的审查。他们必须对人们想出的任何东西进行监督。但我认为在技术方面还有很长的路要走,才能说,实际上,这太难了,无法做到。所以今天的AI似乎很有前景。但在诊所现在发生了什么?
我在节目的开头说过,我们将看看人工智能时代患者的经历。但我非常怀疑到目前为止我们讨论的内容是你去看医生或去医院时的经历。当然,我的也不是。制作人Jason Hoskin一直在调查原因。
如果你开发了一种可以对某些东西进行分类或提供指示性诊断的AI算法,那么你必须做的最起码的事情就是让监管机构审查它,并获得监管许可,才能将该设备推向市场。Hugh Harvey曾经是Chiron Medical的临床主任,这家公司我们之前听说过,它使用AI来检测乳腺癌。
Chiron是有史以来第一个获得监管批准的AI系统,我做过这件事。这是第一个获得欧洲批准的深度学习计算机视觉系统,是的。Hugh现在经营一家名为Harjian Health的咨询公司。
他们帮助其他AI公司遵守医疗器械法规。对于行业新手来说,这一步有点繁琐,因为你必须开发一个质量管理体系。你必须证明任何用于医疗目的的软件都是安全、有效和网络安全的,我相信患者会同意这是他们希望从这些设备中看到的最起码的事情。他们是如何做到这一点的呢?他们如何证明这些东西是安全的呢?
所以你从你的假设开始,你的设备可以执行X功能。然后你进行文献综述,以确定在医院系统的标准护理下,目前这项工作做得有多好。
然后,你按照记录在案的流程开发你的设备,以证明你已经识别了风险并减轻了这些风险,并证明你已经满足你所识别的用户需求。然后你进行某种形式的临床调查,以证明你的设备能够做到你所说的那样。然后你将这些数据提交给监管机构。所以目前在临床环境中部署的工具,在它们可以做什么方面是相当狭窄和严格的。
但是新的模型,它们更通才。那么,根据定义,每次都会给出唯一输出的生成式AI模型,它们带来了多大的挑战呢?它们是否构成了更大的瓶颈和挑战?为了奠定背景,这里要说明的是,没有一个大型语言模型获得了用于医疗目的的监管批准。正如你所说,这可能是因为这些系统有产生幻觉的倾向,这是
我们尽最大努力也无法在一定程度上控制的,而且它们是非确定性的,这意味着如果你给大型语言模型一个特定的提示或特定的输入
你不会每次都得到相同的输出。而这是监管机构迄今为止不愿意给予监管许可的原因。还有准确性。衡量通用系统的准确性非常非常困难。如果你拥有一个潜在的输入和输出无限的系统,我们不知道它出错的频率有多高。而不仅仅是它出错的频率,还有它出错的严重程度。
在我们能够衡量这一点之前,这些东西作为预期医疗设备是不安全的。很难构想出一个学术框架,通过该框架可以评估其在整个泛化能力上的表现。而且我还没有看到有人全面地做到这一点。
你知道有哪些大型语言模型和生成式AI想要获得监管批准吗?有很多想要获得监管批准的。绝对的。今天早上我有三封电子邮件,人们问我如何获得监管批准。我上周实际上参加了一个与一群监管机构的会议,几乎一致认为,目前的监管框架和供应商产生的现有证据不足以允许使用这些技术,尤其是在高风险情况下。
你知道,如果他们有一个通才模型,你声称它几乎可以解决任何医疗问题。好吧,这包括患有癌症的儿童或新生儿败血症,我们都同意这是一种非常高风险的情况。我们应该关注更低风险的用例,也许是行政领域的事情,而不是试图直接将其用于诊断领域。你认为这需要彻底改革吗?因为它们在医疗环境中显然具有巨大的潜力。
不,我会反过来说。我实际上会说,大型语言模型的开发者需要改进他们的证据生成。如果你想提出伟大的主张,你需要提供非凡的证据。如果我们要,你知道,释放医疗保健领域的这场明显革命,那么肯定有人需要证明这些东西是安全、有效和网络安全的,而不是对监管机构说,好吧,你能降低门槛吗?
我想说的另一点是,你知道,如果有人明天发明了一种药物,他们需要10年时间才能将其推向市场。我认为我们没有理由将大型语言模型匆忙送入医院,忽略证据以及生成证据的典型时间框架。这是一个非常有用的比较。节目中提出的另一件事可能是,人工智能的监管和政策框架应该与医生的执照类似。
你认为这可能是一种好的思考方式吗?我实际上不这么认为。我不同意这种说法。我认为将大型语言模型与功能齐全的人类医生进行比较是对技术的拟人化,我认为我们应该真正避免这种情况。我认为假设这项技术与人类一样强大是相当危险的,因为它并非如此。
是的,大型语言模型的能力比之前的一些线性模型更广泛,但它绝不是处于人类的智力水平。所以说,好吧,我们应该使用与我们评估人类相同的监管结构,我认为这是一件危险的事情。大型语言模型没有道德责任,也没有像医生那样的几十年经验。
再说一次,如果我们要像对待医生一样对其进行监管,那么医生需要五到六年时间才能完成医学院的学习。然后他们需要,我不知道,七到十年时间才能成为顾问。所以,好吧,如果你想对大型语言模型这样做,让我们等待10到13年,并在最后看到你的证据。
而且,我听起来很悲观,我意识到这一点,但我认为我们都会同意,我们实际上想做的是花时间将最安全、最有效的产品推向市场。这就是我们一开始制定这些规定的原因。Hugh,非常感谢你。谢谢。尽管在将大型语言模型等生成式AI系统应用于医疗保健方面存在挑战,
但更多更窄、更具体的工具正在进入诊所。例如,我们之前探讨过的癌症检测模型MIA。那么,所有这些对未来的患者意味着什么呢?为了结束这一集,我再次邀请了经济学家的Natasha Loder。Natasha,我们讨论了诊断、建议等等。那么,随着聊天机器人和……
这些人工智能模型与医疗系统更紧密地集成,它们在照顾患者方面还有什么用处呢?所以说,这真的取决于你的时间范围,答案是什么样的。最终,你知道,它们可以成为一种24/7的第一线服务,提供建议、分类,甚至是诊断。
但实际上,我们将从低风险活动开始,例如建议和症状检查,以及
你会看到更先进的AI、更有雄心的AI更早地出现在没有医疗保健的地方,例如农村社区、发展中国家,尤其是在支持慢性健康需求的患者的国家,这些国家的医生非常少。在这些环境中,使用某种AI系统支持患者的风险必须放在一边,因为他们根本没有得到任何支持。
这就是医疗保健通常看待任何创新方式的方式。这就像,你知道,风险是什么?好处是什么?所以在医疗保健匮乏或某些人群几乎没有医疗保健的国家,AI工具可能是一个快速的答案。然后从长远来看,对你和我来说,也许
我们将使用这些作为私人医生。他们将拥有我们自己的个人医疗信息,并能够对我们可能提出的问题给出相当复杂的答案。是的,他们能够获取你多年的医疗信息、血液检查、任何其他信息、你可能服用过的任何药物,并以你目前无法在没有人类医生的情况下做到那样提供相当具体的建议。即使那样,它也仅限于医生在信息或记忆方面可以提供的任何东西,以及他们如何治疗你。我的意思是,这是一个典型的问题。你可以去看你的医生,他们可能只有几分钟时间来扫描你最近的病史。他们不会回顾多年的记录。然而,那里的信息可能与你今天遇到的问题高度相关。所以AI有可能
使医学更复杂,减少错误和误诊的数量。对我来说,非凡的是,我们可以用这项技术真正开始满足更多人的需求。Natasha,我们在这一集中涵盖了很多内容,并探讨了不同类型的人工智能模型在医疗保健中可以使用的不同方式。
你最近做了很多关于这方面的报道,我只是很好奇你对这件事的看法。你知道,我们不想仅仅因为新技术的出现而对事情过于兴奋,但正如你所说,它在获得更多医疗保健、更好的医疗保健方面潜力巨大。请告诉我,我应该对此感到多兴奋。
好吧,这完全取决于时间范围,展望未来10年、20年,这是具有变革意义的。我认为它将彻底改变诊断、治疗、患者护理,几乎医疗保健的各个方面,包括基础模型,这些模型基本上会吸收生物学和医学,并使其更易于理解和解释。但在短期到中期,我不太清楚
这些技术将以多快的速度传播。这是因为需要克服许多伦理、监管和技术挑战,以确保其安全部署。
这将需要监管机构实际投入更多资金。他们需要更快地行动。他们需要在对这些技术的监督方面付出更多努力,因为如果我们要安全地引入它们,这就是需要做的。但是,是的,我很兴奋。我迫不及待地想看看未来会发生什么。
我认为你已经成功地使这个答案变得非常合理,因为不是很多AI人士总是谈论如何
这些技术在短期内被高估,在长期内被低估。万一有人不知道基础模型是什么,我们将在关于医疗保健中人工智能的两集系列的下一集中讨论这个问题。人工智能在医疗保健中最重要和最有趣的用途之一。我期待下周再次与你交谈,看看所有这些将如何改变医学研究方面的事情。听起来不错。医疗保健中人工智能的故事并没有就此结束。
要收听本系列的第二部分Babbage以及更多内容,你需要成为Economist Podcast Plus的订阅者。只需点击节目说明中的链接即可。感谢Gerald Lipp、Peter Kachikometi、Pranav Rajpukar、Hugh Harvey和经济学家Natasha Loder。你可以在经济学家的应用程序上阅读Natasha关于人工智能在医疗保健中前景的完整10页报告。深入了解她的报道非常值得。节目说明中有一个链接。
感谢收听。本周的Babbage由Jason Hoskin和Lawrence Knight制作。混音和声音设计由Nico Rofast完成。执行制片人是Hannah Marino。我是Alok Jha,在伦敦,这里是经济学人。
使用Wealthfront现金账户,你可以从合作银行获得4%的年百分比收益,直到你准备好投资。现金账户可以让你在无需支付账户维护费用的情况下增长你的资金,并且你可以随时免费进行即时取款。钱在这里运作得更好。访问Wealthfront.com开始储蓄和投资吧。
Wealthfront Brokerage LLC成员FINRA SIPC提供的现金账户。Wealthfront不是银行。截至2024年12月27日,现金存款的APY具有代表性,可能会发生变化,并且不需要最低限额。现金账户中的资金被转到合作银行,在那里它们可以获得可变APY。