We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

#309 ‒ AI in medicine: its potential to revolutionize disease prediction, diagnosis, and outcomes, causes for concern in medicine and beyond, and more | Isaac Kohane, M.D., Ph.D.

2024/7/15

The Peter Attia Drive

AI Deep Dive AI Chapters Transcript

People

Isaac Kohane

Peter Attia

Topics

Peter Attia: 本期节目主要探讨人工智能在医学领域的应用，涵盖其当前和未来的影响，以及相关的伦理和监管问题。讨论内容包括人工智能在疾病预测、诊断和治疗中的潜力，以及其在影像医学、机器人手术和精神卫生保健等方面的应用。同时，节目也探讨了人工智能可能带来的负面影响，例如工作岗位的流失和潜在的伦理风险。 Isaac Kohane: Kohane 医生回顾了自己在人工智能领域的职业生涯，从早期基于规则的系统到如今基于神经网络和大型语言模型的系统。他强调了大数据、深度神经网络和GPU技术在推动人工智能发展中的关键作用，并分享了人工智能在医学影像、疾病早期诊断和预测方面的成功案例，例如视网膜病变的识别。他还讨论了人工智能的伦理和监管挑战，包括其可能造成的误用、工作岗位流失以及潜在的生存风险。此外，他还探讨了人工智能在增强临床医生能力、解决医生短缺问题以及推动机器人手术发展方面的潜力。他认为，人工智能可以帮助提高医疗保健的质量和效率，但同时也需要谨慎地进行监管，以确保其安全和伦理应用。他认为，人工智能的未来在于整合患者数据，改进诊断，并应对数据可及性和法规遵从性方面的挑战。他还预测了人工智能在自主机器人手术和精神卫生保健方面的应用前景。最后，他还探讨了人工智能对医疗行业的影响，包括新的商业模式以及来自既有医疗机构的潜在阻力，以及人工智能在未来十年对医学以外领域的潜在影响，包括人工智能达到与人类相当的创造力和专业水平的可能性，以及数字永生和遗产等问题。 Isaac Kohane: 他详细阐述了人工智能技术的演变过程，从早期基于规则的系统到如今基于神经网络和大型语言模型的系统，并指出人工智能的定义和衡量标准也在不断变化。他认为，大数据、深度神经网络和GPU技术是推动人工智能发展的三大关键因素。他以自己早期使用GPT-4的经验为例，说明了大型语言模型的强大能力，并指出其在医学诊断和治疗中的应用潜力。他还讨论了人工智能的伦理和监管问题，以及其对医疗行业和社会的影响。他认为，人工智能可以帮助提高医疗保健的质量和效率，但同时也需要谨慎地进行监管，以确保其安全和伦理应用。

Deep Dive

Chapters

Isaac Kohane, a leading physician-scientist, discusses the evolution of AI in medicine, from early iterations to the current third generation. He highlights how AI is transforming medical specialties, enabling early disease diagnosis, and paving the way for advancements like autonomous robotic surgery.

AI is revolutionizing image-based medical specialties such as radiology, pathology, and dermatology.
AI can recognize retinopathy as accurately as experts, demonstrating its potential for early disease diagnosis.
Large language models, like GPT-4, can provide diagnostic insights and assist with tasks like writing prior authorization letters.
The integration of AI into healthcare raises ethical concerns and regulatory challenges, especially regarding patient privacy and data security.

Shownotes Transcript

嘿，大家好，欢迎收听《驱动》播客。我是你们的主人彼得·阿提亚。这个播客、我的网站和我的每周通讯都专注于将长寿科学转化为每个人都能理解的东西。我们的目标是提供健康和保健方面的最佳内容，为此我们组建了一个优秀的分析师团队来实现这一目标。

对我来说，在不依赖付费广告的情况下提供所有这些内容极其重要。为此，我们的工作完全由我们的会员支持。作为回报，我们提供独家会员专属内容和福利，这些内容和福利超出了免费提供的范围。

如果您想将您在这个领域的知识提升到一个新的水平，我们的目标是确保会员获得的回报远远超过订阅价格。如果您想了解更多关于我们高级会员资格的好处，请访问peteratiamd.com/subscribe。

本周我的嘉宾是艾萨克·科汉，他叫扎克。扎克是一位医生、科学家，也是哈佛医学院生物医学信息学系的主任，同时也是布里格姆妇女医院的医学副教授。扎克在医学文献中发表了几百篇论文，并撰写了广泛使用的书籍《整合基因组学的微阵列》和《医学中的AI革命：GPT-4及以后》。他也是新推出的《新英格兰医学杂志AI》的主编。

在这一集中，我们讨论了人工智能的演变。在我们进行这次采访之前，我并不清楚我们实际上正处于人工智能的第三代，而扎克参与了第二代和显然是当前的第三代。我们讨论了人工智能今天影响医学的能力。换句话说，它在哪里产生影响，以及在短期内它将在哪里产生影响？什么看起来非常有可能，当然，我们也讨论了未来可能发生的事情。显然，在这里你开始思考一下科幻小说和

以及我们希望它可能达到的目标之间的区别。对我来说这是一次非常有趣的播客，这确实是我知道的很少的一个话题，而这些往往是我最喜欢的剧集。所以，话不多说，请欣赏我和扎克·科汉的谈话。

扎克，非常感谢你今天加入我。这是一个非常相关的话题，也是我一直想谈论的话题，但我不知道该和谁谈。最终我们找到了你。所以，再次感谢你抽出时间分享你的专业知识。让大家对你的背景有所了解。你通过医学院和培训的道路是什么样的？这可不是一条典型的道路。不。发生的事情是，我

我在瑞士长大。我的家人中没有人是医生。来到美国，决定主修生物学，然后在70年代后期，我被计算迷住了。所以我辅修了计算机科学，但我仍然完成了我的生物学学位，然后去读医学院。然后在医学院第一年的中途，我意识到，天哪，我

这与我预期的不一样。这是一个高尚的职业，但它不是科学。它是一种艺术。它不是科学。我认为我将从事科学工作。所以我暂时放弃了，去攻读计算机科学博士学位。现在是20世纪80年代初。这是计算机科学的鼎盛时期。

人工智能。这实际上是第二个鼎盛时期。我们正在经历第三个鼎盛时期。这是一个充满希望的时代。从回顾的角度来看，很明显它不会成功。有很多夸大其词的地方。今天也有。但与今天不同的是，我们没有将其发布给公众。它实际上并没有按照我们认为的方式工作。它

一个非常有趣的时期。我的论文导师，麻省理工学院的彼得·索洛维奇教授说：“扎克，你应该完成你的临床训练，因为我没有得到很多临床医生的尊重。因此，为了将理性的决策带入诊所，你真的需要完成你的临床训练。”所以我完成了医学院的学习，在儿科和儿科内分泌学方面进行了住院医师培训，

这实际上非常令人愉快。但当我完成学业后，我重新开始了在计算方面的研究，在波士顿儿童医院建立了一个实验室，然后在医学院建立了一个生物医学信息学中心。就像几乎所有其他努力一样，获得资金会引起当权者的关注。所以我获得了大量的资助。所以他们让我开始这个中心，然后

最终成立了一个新的生物医学信息学系，而我担任系主任。我们现在有16位生物医学信息学的教授或助理教授。然后

我参与了许多机器学习项目，但像其他人一样，除了可能比大多数人早一点之外，大型语言模型让我大吃一惊。2022年10月，我接到彼得·李的电话。实际上，我没有接到电话。这是一封来自迈克尔·克莱顿小说的电子邮件。上面写着：“扎克，如果你接电话，我不能告诉你这是关于什么的，但这绝对值得。”

所以我接到彼得·李的电话，我以前认识他，他当时是卡内基梅隆大学的计算机科学教授，也是那里的系主任。然后他去了ARPA，然后去了微软，他告诉我关于GPT-4的事情。这是在我们任何人听说过ChatGPT（最初是GPT 3.5）之前。他告诉我关于GPT-4的事情，当其他人还不知道它存在的时候，他让我提前接触它。只有少数人知道。

我开始用难题来测试它。我被叫下来了。我只是记得我的训练，我被叫到育儿室。有一个孩子阴茎很小，阴茎底部有一个洞，他们无法触诊到睾丸，他们想知道该怎么办，因为我是一个儿科内分泌学家。

所以我问GPT-4：“你会怎么做？你在想什么？”它让我了解了这些非常罕见的模糊性器官病例的整个检查过程。在这种情况下，它是先天性肾上腺增生症。

在怀孕期间以及随后在出生时，过量雄激素的产生会导致阴蒂肿胀，形成阴茎的腺体，小阴唇融合形成类似阴茎的东西。但是没有睾丸，有卵巢。所以有一个完整的内分泌检查，

包括基因测试、激素测试、超声波检查，它都做了。这让我大吃一惊。这真的让我大吃一惊，因为在计算机科学领域，我们中很少有人真正认为这些大型语言模型会像它们那样扩展。

这是完全没有预料到的。在彼得·李向我介绍这个问题后，我和比尔·盖茨谈论了这件事。他告诉我，微软研究院的他的一线工程师，他许多最优秀的计算机科学家都没有预料到这一点，但微软的一线工程师只是在观察规模的扩大，你知道，GPT-01

他们只是看到它会随着数据量和模型大小的增加而不断扩大。他们说，是的，当然，它会达到这种专业水平。但我认为，我们其他人因为非常重视自己的智力，所以无法想象我们如何仅仅通过扩大模型和数据集来获得这种对话能力。

扎克，这实际上是我今天想要思考的方式的完美介绍，也就是说，听我们说话的没有人没有听说过人工智能这个词，但实际上几乎没有人真正理解发生了什么。所以，如果我们想谈论人工智能如何改变医学，我认为我们首先必须投入

一些严重的带宽来理解人工智能。现在，你提到了你在80年代初攻读博士学位时，你正处于人工智能的第二代，这让我认为第一代是在二战之后不久，这就是为什么艾伦·图灵的名字出现在所谓的图灵测试上。所以也许你可以向我们介绍一下艾伦·图灵提出的内容，图灵测试是什么，

以及它被提议是什么，以及第一代人工智能是什么。我们不必花太多时间在这上面，但很明显它没有奏效。但让我们也许谈谈围绕它的假设以及它是什么。二战后，我们有了计算机器。任何一位严肃的计算机科学家都能看到，你可以拥有

这些可以生成其他过程的过程。你可以看到这些过程如何获取输入并变得更加复杂。因此，在二战之后不久，我们实际上有了人工神经网络，感知器，它大致模拟了神经元的思想，神经元可以从环境中获取

输入，然后具有一定的期望。如果你更新神经元正在发生的事情，它将更新进入该人工神经元的权重。所以回到图灵，他只是提出了一个测试，基本上说

如果一个计算实体能够基本上保持它在对话中的位置，而不会透露它是一台计算机，

而其他人会误认为它是人类，那么，就所有意图和目的而言，这将是智能行为。人们对它施加了各种各样的额外限制。坦率地说，人工智能的一个标志是它不断地改变我们认为是

智能行为的目标。如果你在60年代告诉某人，世界象棋大师将被计算机程序击败，他们会说，好吧，那是人工智能。真的，那是人工智能。然后，当卡斯帕罗夫被蓝色，被IBM机器击败时，

人们说：“好吧，它只是做得很好。它正在搜索未来所有可能的举动。它也知道所有的大师级举动。它拥有一个庞大的百科全书式的存储库，其中包含所有不同的大师级举动。”这并不是真正的智能行为。

如果你告诉人们它可以识别人的面孔，并在互联网上的任何图片中找到你的祖母，他们会说：“好吧，那是智力。”当然，当我们做到这一点时，不，那不是智力。然后当我们说它可以写一首说唱诗时，

关于彼得·阿提亚，基于你的网页，它做到了，好吧，那将是智能的。那将是创造性的。但如果你说它是基于对人类创造的所有文本创建的计算模型来实现的，尽可能多地收集，即1到6TB的数据，

而这个计算模型基本上是在预测下一个词将会是什么，不仅仅是下一个词，而是数百万个可能的词中，下一个词的概率是多少？这就是产生说唱的原因。有些人认为这是不对的。

智力。所以图灵测试的目标一直在变化。所以我必须说，我不再认为这是一个有趣的话题，因为它实际上正在做什么。无论你想称之为智能与否，

这取决于你。这就像讨论狗是否聪明？婴儿在能够识别物体的恒定性之前是否聪明？最初，婴儿，如果你从它面前藏起什么东西，它就消失了。它又回来了。这是一个惊喜。但在某个早期阶段，他们学会了即使他们看不到物体，物体也是恒定的。存在智能行为的范围。我想提醒自己的是

有一个非常简单的计算模型来预测下一个词，叫做马尔可夫模型。几年前，人们正在研究鸣禽，他们能够仅仅使用一个非常简单的马尔可夫模型来预测鸣禽的完整歌曲，下一个音符和下一个音符。所以从这个角度来看，我知道我们认为我们都很聪明，但事实上，你和我，不用费太多心思就能想出流畅的言语

好的，所以模型现在有万亿个参数。它不是一个简单的马尔可夫模型，但它仍然是一个模型。也许稍后我们将讨论这如何不幸地与已故卡尼曼关于快速思考和慢速思考的概念相联系，以及他关于系统一的概念，这是一种模式识别，这与我认为我们在这里看到的情况非常相似，以及系统二的概念，这是更深思熟虑的

以及我们引以为豪的更清醒的思考方式。但我们所做的许多事情都是这种反射性的、非常快速的模式识别。

所以如果我们回到二战，那就是你所说的我们看到基本上基于规则的计算成熟的时候。任何回顾并观看过关于曼哈顿计划或破译各种事情（例如谜机）的电影的人，这都是直接基于规则的计算能力。我们显然已经达到了极限

我只能走这么远。但似乎在我们从那里过渡到一些人所说的基于上下文的计算（你的Siri或Alexa所做的）之前，有一段很长的停顿，这比那更进一步。

然后，当然，你会从那里过渡到你已经谈到的蓝色或沃森，在那里你拥有可能更进一步的计算机。然后，当然，我们现在所处的位置是……

GPT-4。我想谈谈这方面的计算方面，但我更想谈的是这种想法，即这似乎正在发生以一种非常非线性的速度。我听到了你的观点。我从未这样想过。我听到了你关于目标移动的观点，但我认为你关于

选择正确方向的直觉也很重要，那就是让我们少关注我们从未完全达到渐近线定义的事实。让我们看看实际的输出，它是惊人的不同。那么，在你所谓的第二波人工智能的博士学位期间发生了什么？目标是什么，失败在哪里？所以，在第一个时代的目标是，你编写了计算机化的

汇编语言或Fortran之类的语言中的计算机程序。你可以做的事情是有限的。你必须是一个真正的计算程序员才能以这种模式做一些事情。在20世纪70年代的第二波中，我们提出了这些基于规则的系统，我们在其中用类似英语的规则说。如果有一位病人发烧，

你从实验室得到一个分离物，并且分离物中的细菌是革兰氏阳性的，那么你可能患有链球菌感染，概率为如此等等。这些基于规则的系统，你现在正在用人类知识的水平进行编程，而不是用计算机代码进行编程，问题在于几个方面。A，你将生成数万条这样的规则，而这些规则将以你无法预料的方式相互作用。

我们知道的还不够，我们无法从人类那里获得正确的概率。如果你发烧并且在验血中没有看到任何东西，那么正确的概率是多少？还有什么其他的情况？存在大量的可能性，从人类那里获得所有这些规则最终非常昂贵，而且结果不稳定。由于当时网上没有多少数据，

我们无法进入下一步，即拥有数据来实际驱动这些模型。当时的资料来源是什么？书籍、教科书和期刊，由人类专家解读。这就是为什么其中一些被称为专家系统，因为它们是从专家的内省中得出的，然后他们会提出规则、概率和

一些早期工作，例如，有一个名为Misen的程序，由斯坦福大学的Ted Shortlift运行，他开发了一个抗生素顾问，它是一套基于他和他的同事的规则

从不同的传染病教科书和传染病专家那里推断出来。它只保持最新，只要他们继续查看文献，添加规则，微调它。如果两个规则之间存在不希望的交互，则必须调整它。非常劳动密集型。然后，如果出现新事物，则必须

添加一些新规则。如果艾滋病发生了，你必须说，“哦，有一种新的

病原体，我必须制定一些规则。如果你是一名静脉注射吸毒者，或者你是一个男性同性恋者，那么概率将有所不同。所以很难跟上。事实上，人们并没有。它是用什么语言编程的？这是Fortran吗？不，不。这些是所谓的基于规则的系统。因此，例如，mycin系统被称为e-mycin，本质上是mycin。所以这些看起来像英语。超级劳动密集型。

超级劳动密集型，而且你无法让它保持最新。当时没有电子病历。它们都是纸质记录，因此没有根据诊所的情况提供信息。

为了让我们拥有今天所拥有的东西，必须发生三次革命。这就是为什么我认为我们最近取得了如此巨大的飞跃。在我们谈到这一点之前，这是一个令人兴奋的问题，但我只想回到第二代。是否有其他行业比医学更成功？军队中是否有应用？政府的其他地方是否有应用，它们更接近实用性？是的。所以有一家公司……

它是在20世纪70年代的残余，当时在波士顿有一大堆计算机公司，我们称之为128。这些公司在当时很有名，比如王安电脑，比如数字设备公司。对于波士顿来说，这是一个非常悲伤的故事，因为那是……

硅谷获得了围绕它的计算机公司的珍珠。其中一家公司，数字设备公司，开发了一个名为R1的程序。R1是配置你订购的小型计算机的专家。所以你想要一些功能，它实际上会配置所有

所有工业组件、处理器、磁盘，它会了解所有例外情况以及你需要知道什么，什么布线，什么内存配置，所有这些都完成了，它基本上取代了几位拥有这种非常罕见知识来配置系统的人。它也用于几个政府后勤工作。但即使这些努力，尽管它们成功并被商业使用，

也受到限制，因为事实证明，一旦你达到大约三千到六千条规则，没有一个人能够跟踪所有这些规则可能起作用的方式。我们过去称之为复杂性障碍，这些规则将以意想不到的方式相互作用，你会得到不正确的答案，这些答案是不符合常识的。

因为你实际上并没有捕捉到现实世界的一切。所以它非常狭隘地关注。如果专业知识稍微超出关注领域，如果说这是一个传染病程序，并且患者的心脏状况有一些影响，而你没有准确地模拟这一点，它的性能就会迅速下降。同样，如果

数字设备公司有一款全新的型号，它有一个完全不同的部件没有包含在内，并且有一些没有建模的依赖关系，它的性能就会下降。所以这些系统非常脆弱，没有表现出常识。它们具有专家行为，但这是非常狭隘的。当时在医学中有一些应用一直延续到今天。例如，

早在当时，我们就有了这些系统相当熟练地解释心电图，至少是第一遍，直到它们被专家心脏病学家审查。还有一个程序可以解释所谓的血清蛋白电泳，你通过电梯度分离蛋白质来进行诊断，例如骨髓瘤或其他蛋白质疾病。而那些

也已临床应用，但它们只在非常狭窄的领域发挥作用。它们绝不是通用推理机。所以让我们回到这三件事。为了让我们达到今天的水平，有三件事已经克服了第一次和第二次尝试人工智能的相对失败。我可以猜到它们是什么，但让我们让你来介绍它们。

第一个是大量的数据，我们需要大量在线数据才能

开发具有有趣性能和质量的模型。因此，ImageNet是第一个这样的数据集之一，它包含数百万个带有注释的图像集合，重要的是。这其中有一只猫。这其中有一条狗。这是一个蓝莓松饼。这其中有一个人。拥有这些对于

让我们训练第一个非常成功的神经网络模型至关重要。因此，拥有这些大型数据集非常重要。另一个，在医学中也有等价物，那就是在PubMed上线之前，我们没有关于医学的大量文本信息。所以所有文献，至少医学文献，我们都有它的摘要在PubMed中，

此外，我们还有一部分是开放获取的，因为政府通过赠款为此付费。有一个叫做PubMed Central的东西，它包含全文。所以突然之间，在过去的10年中，这种情况发生了变化。然后是电子健康记录，在奥巴马签署HITECH法案后，电子健康记录也毁掉了许多医生的生活，但也恰好为这些系统生成了大量文本。

所以这是在线生成的大量数据。第二个是神经网络模型本身。我提到的在二战后不久开发的感知器被人工智能先驱马文·明斯基

证明具有根本性的局限性，因为它无法执行某些数学函数，例如所谓的异或门。正因为如此，人们说这些神经网络不会扩展。但有一些真正的信徒继续推动并制作越来越先进的架构和那些多层深度神经网络。所以，与其拥有一个神经网络，不如在上面叠加

一个神经网络，另一个神经网络，再一个神经网络，依此类推，这样第一层的输出就会传播到第二层神经元，到第三层，第四层，等等。对不起，这是一个理论上的数学突破还是一个技术突破？

两者都是。两者都是，因为有了这样的见解，我们实际上可以提出所有需要的数学函数，我们可以用这些多层网络来模拟它们，而这是一种理论上的见解，但如果不是因为汗流浃背的青少年，主要是玩电子游戏的十几岁男孩，我们永远也不会从中得到任何东西。为了拥有第一人称射击游戏

能够以高分辨率显示外星人或怪物的高分辨率图像，24位颜色，每秒60帧。我们需要拥有处理器，非常并行的处理器，

这将允许你进行线性代数计算，这将允许你计算每秒60帧时屏幕上每个点的颜色强度。而这仅仅是因为执行此操作所需的矩阵乘法数学。你拥有如此之大的N×M矩阵，你正在交叉和点乘巨大的矩阵。巨大的矩阵。事实证明，这可以在并行中运行

所以你想要拥有多个并行处理器，能够再次以每秒60帧的速度渲染这些图像。所以基本上，你的屏幕上数百万位被渲染成24位或32位颜色。为了做到这一点，你需要让刚才提到的线性代数并行运行。因此，这些并行处理器被称为图形处理单元，GPU，被开发出来。

GPU由几家公司开发，有些公司继续经营，有些公司没有，但它们对于电子游戏的成功至关重要。现在，许多聪明的数学家和计算机科学家意识到，用于驱动图像计算的相同线性代数也可以用于计算神经网络中神经元之间边缘的权重。

因此，响应刺激更新权重的数学，例如，神经网络的权重更新可以在线性代数中完成。如果你有这个处理器，所以一台典型的计算机有一个中央处理单元。所以这是一个处理单元。GPU

拥有数万个执行这一非常简单的事情的处理器：线性代数。

因此，通过在你的简单PC上拥有这种通常只有超级计算机才拥有的并行性，因为你需要以每秒60帧的速度显示图形，突然之间给了我们这些商品芯片，使我们能够计算这些多层神经网络的性能。所以这个理论上的突破是第二部分，但如果没有实际的……

实现能力，我们用GPU实现的。所以英伟达将是这方面最成功的例子，大概是这样吧？它不是第一个，但它绝对是最成功的例子。它之所以成功并创建了一个实施者生态系统，其原因有很多，这些实施者在其英伟达架构之上构建了他们的神经网络深度学习系统。

你会回顾日历并说这是哪一年或哪个季度实现了逃逸速度吗？是的。所以大约在2012年左右，每年都会举行一场持续的比赛，看看谁拥有最好的图像识别软件。这些在GPU上运行的深度神经网络在2012年能够

显著优于所有其他竞争对手的图像识别能力。这非常清楚地表明，每个人都醒悟过来，说：“哇，我们知道神经网络。我们没有意识到这些卷积神经网络会如此有效。”而且似乎唯一能阻止我们的是计算速度和数据集的大小。

这在影像领域推动了快速发展，并在医学领域很快产生了影响。仅仅六年后，我们就看到了关于

视网膜病变识别的期刊论文，视网膜病变是影响视网膜（眼睛后部）的疾病。一篇来自谷歌的论文指出，我们可以根据眼底图像识别不同阶段的视网膜病变。这也敲响了警钟，因为，是的，目标位移的一部分。能够在网页上识别猫和狗是很棒的。但是，突然之间，我们认为

是专业人类专长的事情，可以通过相同的软件堆栈来完成，只要你给它足够的视网膜病变病例，它就能很好地工作。此外，更令人惊讶的是，有一种叫做迁移学习的东西，你可以调整这些网络，让它们识别猫和狗，

在识别猫和狗的过程中，它学习如何识别小圆圈、线条和模糊等。你首先在整套图像上，然后在视网膜上训练神经网络，效果要好得多。如果你直接进行训练，我只会对视网膜进行训练。

因此，这种迁移学习令人印象深刻。然后，作为一名医生，另一件令我们许多人印象深刻的事情是。2018年，一篇谷歌的文章发表后，我被要求为《美国医学会杂志》撰写一篇社论。令我们印象深刻的是，在那篇出版物中，医生的主要作用是什么？

它只是双重的。一个是标记用于训练的图像。这是视网膜病变，这不是视网膜病变。然后充当其性能的评判者。就是这样。其余的是计算机科学家使用GPU和图像进行工作，对其进行调整，就是这样。看起来与医学院完全不同，你拥有专家级的视网膜病变识别能力。这是一个警钟。

你提到了谷歌2017年的论文，我认为论文的标题是“注意力就是全部”。注意力就是你所需要的。我不是指这个。我指的是2018年发表在JAMA上的一篇论文。啊，对不起。你在谈论那篇伟大的论文，“注意力就是你所需要的”。那是关于转换器的发明，这是一种特定类型的神经网络架构。

我说的是这些是普通的，相当普通的卷积神经网络，与可以检测猫和狗的网络相同。这是2018年一个重要的医学应用，视网膜病变。除了计算机科学家之外，没有人注意到“注意力就是你所需要的”这篇论文。谷歌发表了这篇精彩的论文，说，你知道，如果我们不仅识别

一起出现的文本。此前，我们先撇开图像不谈，有一种说法认为，如果我看到哪些词一起出现，我就能识别出文本中许多相似之处。我可以

通过一个词的上下文来暗示它的含义。因此，如果我看到这个词，它的周围有王国、王冠、王位，那就是关于国王的。女王也是如此。我们创建了所谓的嵌入向量，用简单的英语来说，它是一串数字，表示

对于任何给定的词，概率是多少？这些其他词与它一起出现的频率是多少？仅仅使用这些嵌入，这些向量，这些描述其他词共现的数字列表，我们就能完成许多所谓的自然语言处理工作，即查看文本并说：“这就是它的含义。这就是正在发生的事情。”但在2017年的论文中，

他们实际上又前进了一步，那就是对句子中你关注的具体位置的洞察，句子之前和之后的内容，它的实际顺序很重要，而不仅仅是简单的共现。知道这个词在句子中的位置实际上会产生影响。这篇论文表明，在识别方面，性能有了很大的提高。

从这篇论文中产生的转换器架构让许多研究人员（不是我）清楚地认识到，如果将这种转换器架构扩展到更大的模型，以便在更多文本（整个互联网）中学习位置依赖性和此向量，则可以训练它来执行各种任务。这个转换器模型，称为预训练模型。所以

对不起，我觉得谈论这个很无聊，除非我和书呆子同事一起工作，这个转换器，这个预训练模型，可以把它想象成一个有多个变量的等式。

在GPT-4的情况下，我们认为大约有万亿个变量。它就像一个等式，每个变量前面都有一个数字，一个大约有万亿长度的系数。这个模型可以用于各种目的。一个是聊天机器人的目的，即给定这个词序列，下一个要说的词是什么？现在，这并不是你可以使用这个模型的唯一用途。

但这被证明是转换器模型在文本方面的突破性应用。

为了补充你之前所说的话，扎克，你会说这是促成第三波人工智能的第三件事吗，转换器？这不是我在考虑的事情。对我来说，我认为数据驱动人工智能的真正突破大约在2012年左右。这是另一个。如果你在2018年和我谈话，我会告诉你我们正处于一个新的鼎盛时期，每个人都会同意你的说法。人工智能非常令人兴奋，仅仅是因为图像识别能力。

这是一种超出我们许多人仅仅从神经网络规模扩大中所预期的额外能力。这三点，为了确保我前后一致，分别是大型数据集、多层神经网络（又名深度神经网络）和GPU基础设施。这将我们带入了2012年至2018年阶段。

2017年的飞跃发展成为我们现在所知的整个大型语言模型转换器架构，这种发展对我们许多人来说是出乎意料的，但这已经是人工智能时代兴起之后的事情了。已经有数十亿美元的泡沫投资流入泡沫公司，其中一些公司做得很好，而许多公司则做得不好。

转换器架构已经彻底改变了人类状况的许多方面，我认为。但我认为它已经是第三波的一部分了。关于GPT，我觉得大多数人，到GPT-3发布时，或者肯定是在3.5发布时，这已经超出了计算机科学家、行业投资者等人的视野。

这现在正变得像2000年初的谷歌一样，成为一个动词。显然，在96年和97年，有些人知道谷歌是什么，但到了2000年，每个人都知道谷歌是什么，对吧？关于GPT 3.5或4，有一些事情是某种转折点，我认为你此时不可能不知道它是什么。

我不知道这是否与故事相关，也就是说，这是否说明了我们现在所处的轨迹？我认为，扎克，在过去一年中变得如此清晰可闻的另一件事是，关于如何规范这件事的讨论得到了提升。

这似乎是你只有在你觉得这件事有可能以我们尚未察觉的方式对我们造成伤害时才会争论的事情。那么，你能对此发表什么评论呢？因为这显然是对人工智能技术发展的认可，非常严肃的人们正在讨论

暂停、暂停令、法规。在80年代，没有公开讨论过这个问题，这可能说明了80年代，它还不够强大，不足以构成威胁。那么，你能否让我们了解一下人们现在正在争论什么？在这两方面的明智、合理的主张是什么？让我们让你来决定这两方面是什么。我假设一方面是说，

全力以赴，让我们继续发展，不要规范它，让我们尽情享受吧。另一方面是，不，我们需要一些制动器和障碍。并非完全如此。你完全正确，聊天机器人现在已经成为一个常用的名词，这可能是随着GPT-3.5的出现而发生的，我认为它大约出现在2022年12月左右。但是现在是

是的，因为开箱即用，我告诉你的那个预训练模型可以告诉你诸如如何自杀、如何制造毒素之类的事情。它可以让你做很多有害的事情。所以存在这种担忧。我们可以讨论针对这些首要努力所采取的措施。

然后，有一组科学家，有趣的是，他们从说“我们永远无法从这种特定架构中获得通用智能”转变为说“哦，我的天哪，这项技术能够以我从未预料到的方式进行推理”。

现在我非常担心，要么是因为它怀有恶意，要么是因为它试图做一些对人类产生不良副作用的事情，它构成了生存威胁。现在，另一方面，我不相信有人说，让我们低下头继续前进，

让我们看看我们能多快达到人工通用智能。或者如果他们确实这么认为，他们也不会公开说出来。扎克，你能定义一下AGI吗？我想我们都听说过这个词，但是否有一个准被接受的定义？首先，没有，我甚至讨厌自己提起它，因为它会开始——我本来打算在你之前提起它，无论如何，这是不可避免的。这是一个不幸的失误，因为人工通用智能——

对很多人来说意味着很多事情。我之所以会失误，是因为我认为它再次是一个移动的目标，它很大程度上取决于观察者的观点。有一个叫伊莱泽·尤德科夫斯基的人，他被称为“末日论者”之一。他提出了关于一个足够聪明的

智能系统如何找到说服人类做坏事的方法，或者控制我们的基础设施以摧毁我们的通信基础设施或让飞机坠毁的精彩场景。我们可以讨论这是否相关。另一方面，我们有，比如说，OpenAI和谷歌。

但令我着迷的是，与微软合作开发了GPT-4的OpenAI根本没有公开表示“让我们不要对其进行监管”。事实上，他们说的是“请监管我”。萨姆·阿尔特曼进行了环球旅行，他说：“我们应该对此非常担忧。我们应该规范人工智能。”他在国会面前说：“我们应该规范人工智能。”

所以我感觉有点粗鲁，因为萨姆很友好地为我和彼得·李以及特里·戈德堡合写的关于GPT-4和革命的书写了前言

在医学方面。但我一直在想，他们为什么如此坚持监管？有两种解释。一种是真诚的，而且很可能是真诚的愿望，即对其进行监管，以便我们检查这些机器，这些程序，以确保它们实际上不会做任何有害的事情。

不幸的是，另一种可能性是所谓的监管锁定，这意味着我是一家资金雄厚的公司，我将与国会一起制定关于所需内容的法规，你需要检查哪些框才能被允许运行。如果你是小公司，你就不会有一群律师拿着大额支票来遵守所有监管要求。

所以，我认为萨姆，我个人不认识他，我想他是一个非常有动机的个人。但无论是出于监管锁定的原因，还是出于真正的担忧，都没有任何声明说，让我们低下头继续前进。他们确实说，让我们受到监管。话虽如此……

在你甚至开始考虑末日论者的设想之前，我认为我们还必须担心另一个同样具有潜在危险的智慧，那就是人类。人类如何使用这些伟大的工具？正如我们所知，GPT-4最早的用户之一是试图完成作业并解决给他们提出的难题的高中生，

我们也知道，各方一直在利用这些程序惊人的文本生成和交互能力来传播虚假信息，与聊天机器人进行交流，

并且第三方可以使用这些引擎做各种恶意的事情。我认为，对我来说，这是当今明确而现实的危险，即个人如何决定使用这些通用程序？如果你看看乌克兰-俄罗斯战争中发生的事情，我看到越来越多的自主飞行器携带武器。

武器并投掷炸弹。我们看到在我们自己的军队中，越来越多的自主无人机具有越来越大的自主能力。这些都是专门用来做危险事情的。许多科幻小说迷会提到《终结者》系列中的天网。但我们现在正在字面意义上建造它。

扎克，在《终结者》中，他们提到某个时刻，我不记得是哪一年，比如1997年左右。我认为他们谈到天网如何变得“自我意识”。不知何故，当它变得自我意识时，它只是决定消灭人类。自我意识是电影中对AGI的表达吗？你认为自我意识在更技术性的术语中意味着什么？或者它是超级智能？这里有很多术语，我不知道它们是什么意思。

好的，自我意识是指一个智能实体可以回顾，向内审视自身的过程并认识自身的进程。现在，这非常含糊，但道格拉斯·霍夫斯塔特可能对自我意识的含义做了最

有思想和清晰的阐述。我不会对其进行公正的评价，但如果你真的想读一本试图解释它的精彩书籍，那就是《我是一个奇怪的循环》。

在《我是一个奇怪的循环》中，他解释了，如果你有足够的处理能力，并且你可以表示构成你的过程的模型，换句话说，你能够审视你在想什么。你可能对自我意识有一些感觉。这有点像信仰行为。许多人工智能研究人员不认同这个定义。自我意识之间存在差异

和实际的原始智力。你可以想象一台超级强大的计算机，它可以预测你周围发生的一切，并且没有意识到自己是一个实体。事实仍然是，你需要具备最低限度的智力才能具有自我意识。所以苍蝇可能没有自我意识。它只是去寻找好闻的粪便，并做它被编程要做的事情。

但是狗具有一定的自我意识和对周围环境的意识。它们没有完美的自我意识。它们不会在镜子中认出自己，它们会对着镜子吠叫。鸟类会在镜子中认出自己。

我们以多种方式认识自己。因此，智力与自我意识之间存在某种关联，但这些不一定是依赖性函数。所以我听到你说的是，看，当前最好的AI工具存在明确而现实的危险，因为人类可以将它们用于邪恶目的。在我看来，这种最可扩展的例子仍然相对较小，因为

它对我们物种的大规模生存威胁不大，对吗？是的，也可能不是。如果我试图用病毒进行功能获得性研究……好点子。我可以非常有效地使用这些工具。是的，这是一个很好的例子。存在这种脱节，也许你比我更了解这种脱节。存在那些真正的生存威胁，然后还有这种更模糊的东西……

我们正确地担心偏见、错误的决定、幻觉。我们可以讨论这可能是什么。以及我们在人类日常生活中使用它。并且担心可能会犯的错误。担心工人被取代，就像自动化取代了一系列其他工人一样，现在我们有了在知识产业中发挥作用的东西，

自动地，就像我们用人工智能取代了许多编辑和插画家一样，这将在哪里停止？现在更多的是在白领领域。因此，人们担心由此可能造成的损害。在医学领域，我们是否得到了好的建议？我们是否得到了坏的建议？在这些不同的决策程序中，谁的利益得到了优化？这另一个层面根本没有达到灭绝事件的程度

但许多政策制定者和公众似乎对此表示担忧。这些都是合理的观点。现在让我们谈谈医学领域的现状。我喜欢你的第一个例子，几乎是我们认为理所当然的例子，但你去医生办公室做心电图检查，30年前是这样，今天也是这样，你会得到相当不错的读数。它会告诉你你是否有房室阻滞，它会告诉你你是否有束支阻滞。这么说吧，它们读心电图比我好。

这已经不算什么了，但它们确实做到了。下一个我们可以看到这种情况的领域是什么？在我看来，放射学是一个医学领域，它当然是基于图像像素的医学，这将是下一个看到人工智能发挥作用的最合乎逻辑的地方。目前人工智能在放射学中的现状如何？

在所有基于视觉的医学专业中，人工智能看起来可以做得和许多专家一样好。那么，图像鉴赏亚专业是什么？病理学，当你用显微镜观察组织切片时。放射学，当你观察X光或MRI时。皮肤病学，当你观察皮肤照片时。

因此，在所有这些基于视觉的专业中，计算机程序本身做得和许多专家一样好。但它们并没有取代医生，因为图像识别过程只是他们工作的一部分。现在，公平地说，就你在放射学方面的观点而言，在人工智能出现之前，我们今天已经在

许多医院会通过卫星将X光片发送到澳大利亚或印度，在那里，夜间会由从未见过病人的医生或经过专门培训的人员进行解读。然后将报告发回给我们，因为他们距离我们12个小时。一夜之间，我们将获得这些解读的结果。人工智能可以自动完成同样的功能。因此，这取代了一种

让我更深入地探讨一下。让我们从相对简单的图像类型开始，例如乳房X光照片或胸部X光照片。这是一张单张图像。我的意思是，对于胸部X光片，你会得到一张前后位片和一张侧位片，但让我们假设你正在查看一张前后位片或一张单张乳房X光照片。

放射科医生会查看它。放射科医生也会了解临床信息。因此，他们会知道为什么这位病人会出现这种情况，例如，在半夜在急诊室进行胸部X光检查。他们是否呼吸短促？他们是否发烧？他们是否有以前的X光片？我可以将其与各种信息进行比较。

我们现在是不是已经到了可以将所有这些信息提供给人工智能的地步，以提高其得出的任何诊断的预测试概率？

当你提到预测试概率时，我很高兴。不要在我身边说脏话。我喜欢我的贝叶斯定理。是的。你刚才说了很多，因为你刚才说的实际上超出了简单的卷积神经网络所能做的，因为它们实际上无法取代放射科医生，因为它们无法很好地考虑病人的既往病史。这需要转换器的出现

你可以同时拥有图像和文本的多模态。现在，它们将比当今许多放射科医生做得更好。

我认为，放射科医生作为一项工作，目前还没有受到任何威胁。最让医生恼火的预测之一是由杰弗里·辛顿做出的，他是神经网络架构的知识领袖之一。我认为是在2016年，我对此的估计可能不准确，但六年后，我们将不需要放射科医生。

这显然是错误的。它之所以错误，是因为A，它们不具备我们刚才讨论过的那些能力，即了解临床背景。但这也是一个事实，即我们没有足够的放射科医生。意思是进行培训？实际开展工作。因此，如果你看看美国医学，我会让你打断我。但如果你看看住院医师项目，我们没有获得足够的放射科医生。

我们有大量的介入放射学申请者。他们赚了很多钱。这是很高的声望。但直接的放射科医生，不够。

初级保健医生，我走访医学院，询问谁将成为初级保健医生，几乎没有人。因此，初级保健正在美国消失。事实上，麻省总医院和布里格姆医院正式宣布，他们不再看初级保健病人。人们仍然去看皮肤科，仍然去做整形手术。我做的儿科内分泌学，全国有一半的职位没有被填补。

像自闭症这样的儿童发育障碍，这些职位，有一半被填补。PID。在现有专业知识方面，出现了一个巨大的差距。所以这与我们想象的不同，我们有大量的医生需要被取代。只是我们在一些非常受欢迎的重点领域有盈余。

然后，对于你感兴趣的所有初级保健和初级预防工作，我们几乎没有医生可用。是的。让我们再回到放射科医生身上，因为我再次专注于这一点，因为它似乎是最……好吧，最接近解决的问题。再次，如果你说，看，我们缺乏能够在急诊室、急诊诊所和医院工作的影像放射科医生。

这难道不是我们最想应用我们最好的图像识别技术、我们强大的GPU，然后将它们插入我们的转换器和语言模型中，以便我可以获得……

临床病史、既往病史、以前的图像、当前的图像，你不需要将其发送给澳大利亚的放射科医生进行解读，然后澳大利亚的放射科医生再将其发送回这里的放射科医生进行检查。就像，如果我们只是想填补一个空白，这个空白应该是可以填补的，对吗？这正是它被填补的地方。而在这场谈话中一直让我分心的是

还有另一组我们没有谈到的AI用户，那就是病人。以前，这些工具都不对病人可用。随着GPT-3.5和4以及现在的Gemini和CLAWD-3的发布，病人一直在以我们从未预料到的方式使用它们。

让我举个例子。有一个孩子走路困难，咀嚼困难，然后开始出现顽固性头痛。妈妈带他去看过多个医生，他们做了多次影像学检查，没有诊断，一直持续疼痛。她只是在GPT-4中输入了所有报告，并询问GPT-4，诊断是什么？GPT-4说，

系带脊髓综合征。然后，她带着所有影像学检查结果去看了一位神经外科医生，并问道，这是什么？他看了看，说，系带脊髓综合征。我们有如此多的误诊和未诊断患者。我将简要提到的我的背景的一部分是，我是所谓的未诊断网络协调中心的首席研究员。这是一个网络，拥有12家学术医院，从华盛顿大学沿着西海岸向下，

斯坦福大学、加州大学洛杉矶分校，到贝勒大学，沿着东海岸向上，哈佛医院，NIH。我们每年都会看到几千名患者。

这些患者没有得到诊断，他们正在遭受痛苦。这只是那些未被诊断患者的一小部分。是的，我们运用了一整套计算技术和基因组测序来帮助这些人。但很明显，那里还有更多未被诊断的患者。但对你来说，扎克，问题是，在这个例子中，母亲是……

使用GPT-4并输入了这一点，我的意思是，她之前可能已经看过许多医生了。你是否惊讶于沿途的医生中没有一个人说过，哎呀？我不知道，但让我们看看这个GPT-4能做什么。我认识的大多数临床医生都没有我过去所说的谷歌反射。我记得我还在病房的时候，我们有一个患有畸形的儿童。他们看起来不一样，

我问住院医师，“诊断是什么？”他们说，“我不知道，我不知道。”我说，“他有这个、这个和这个发现。诊断是什么？”我说，“你将如何找出答案？他们不知道。”我只是说，“让我们把我说的话输入谷歌。”在前三个回复中，有诊断结果。

他们会在生活中使用这种反射，但在诊所里却没有。医生现在处于非常不幸的境地。他们真的被逼得很紧

他们被告知要使用某些技术工具。他们变成了数据录入员。他们没有谷歌反射。他们没有这种反射，谁有时间查阅期刊论文？他们没有谷歌反射。更不用说，让我们查阅病人的病史，看看GPT-4会得出什么结论。

我很高兴看到早期医生们说，哇，你看，我刚完成了病史采集，把它输入GPT-4，然后说，给我写一封预授权函。他们实际上在推特上发布了这件事，一方面，我非常高兴，因为这为他们节省了五分钟的时间来写信给保险公司，请求批准我的病人进行这项手术。

我不高兴的原因是，如果你使用ChatGPT，你使用的是OpenAI提供的程序，而不是微软在受保护的Azure云上运行的GPT-4版本，该版本符合HIPAA规定。对于那些不知道HIPAA的观众来说，HIPAA是我们保护病人隐私的法律框架。如果你违反了它，你可能会被罚款，甚至会被监禁。

所以换句话说，如果一位医生想把任何信息输入GPT-4，他们最好不要识别它。没错。所以他们只是把病历记录输入ChatGPT，这就是HIPAA违规行为。如果有一个符合HIPAA标准的微软版本，它就不是。所以他们用它来改善自己的生活。医生们用它来改善医疗保健的业务，行政部分，这非常重要。但总的来说，

只有少数医生将其用于诊断敏锐度。那么更复杂的放射学呢？很明显，普通X光片是最直接的事情之一，尽管对于任何看过胸部X光片的人来说，它远非直接。

但是，一旦我们开始观察三维图像，例如横断面图像、CT扫描、MRI，甚至更复杂的图像，如超声波等，在辅助阅读这些类型的图像方面，人工智能的最新技术水平是什么？所以这是一个非常令人兴奋的消息，那就是

还记得我说过拥有大量数据很重要，这是突破的三个要素之一。所以突然之间，有很多数据围绕着，例如，超声心动图，你心脏的超声波。通常需要大量的训练才能正确解释这些图像。因此，最近有一项来自Echo Clip Group的研究，我认为是由加州大学洛杉矶分校领导的，他们收集了一百万张超声心动图

和一百万份文本报告，并基本上训练模型，同时创建我谈到的图像和文本的嵌入。只是为了确保人们理解我们在谈论什么，这不是，这是一张猫的图片，这是一个描述，猫。

当你输入图像时，你输入的是视频。现在，你输入的是多维视频，因为你有时间尺度，你有多普勒效应。这是一个非常复杂的视频。

这是一个非常复杂的视频，它是三维的，并且是从不同角度拍摄的奇怪视角。它取决于用户。换句话说，放射技术员可能是好是坏。如果是我做的，那就太糟糕了。回声技术员

没有医学院的债务。他们不必上医学院。他们不必学习微积分。他们不必学习物理化学，所有你必须在医学院经历的障碍。你没有医生的态度债务。所以两年后，他们掌握了所有这些技能，并且他们做得相当不错。他们做得非常出色。但我的意思是，他们的技能在很大程度上决定了图像的质量。是的。但我们今天仍然需要心脏病专家来阅读和解释它。

对。顺便说一下，这就是我要说的，在我们摆脱技术人员之前，我们将摆脱心脏病专家。我们在同一页上。我在这次谈话中的目标是护士执业者和医师助理可以使用这些工具来替代许多专家临床医生。这是一个很大的悬而未决的问题。十年后医生的真正工作是什么？我认为我们不知道答案，因为你快进到刚才的谈话。

非常好。那么，让我们考虑一下。我们还没有谈到介入医生。所以我们仍然需要讨论介入放射科医生、介入心脏病专家和外科医生。我们可以稍后讨论外科医生和达芬奇机器人的作用。但我认为我们正在做的就是确定医生的啄食顺序。让我们甚至不要通过替代的视角来思考它。让我们从增强的视角开始。

放射科医生最容易增强，病理学家、皮肤科医生、查看回声、心电图和压力测试的心脏病专家，那些解释视觉数据和使用视觉数据的人

将是最容易增强的。第二批将是那些解释语言数据和视觉数据的人。现在我们谈论的是你的内科医生、你的儿科医生，你必须解释症状并将它们与实验室值结合起来，并将其与故事和图像结合起来。

就层级而言，这是一个公平的评估吗？绝对是一个公平的评估。我唯一要挑剔的是，这不是挑剔，我要不断回到这一点，那就是在我们没有初级保健的地方。美国医学院协会提交的数据显示，到35岁，也就是从现在算起只有11年，我们将缺少大约5万名初级保健医生。正如我告诉你的，我今天无法在布里格姆或MGH获得初级保健。在这种情况下，你必须问问自己，我们如何才能用护士执业者、医师助理以及这些人工智能来替代初级保健？因为根本没有医生可以替代。

所以告诉我，扎克，我们在技术上增强到什么程度了？如果英伟达不再推出任何芯片，如果他们真的说，你知道吗，我们只对建造高尔夫模拟器感兴趣，我们已经完成了这项工作的进展，而且这已经尽善尽美了。我们有足够好的GPU，足够好的处理器吗？

多层神经网络，你只需要更多的数据和训练集，我们现在就可以进行我们过去五分钟描述的增强了吗？简短的答案是肯定的。让我说得更具体一些。在波士顿，大多数私人服务每年花费在5000美元到20000美元之间。你可以获得这种非常低成本的私人服务，我非常惊讶他们没有做到以下几点，叫做One Medical。One Medical被亚马逊收购。

他们那里有很多护士执业者。你可以预约，你可以和他们发短信。我相信这些人可以在订购正确的影像学检查、正确的心电图、正确的药物方面得到帮助，并评估你持续的心力衰竭，并且只在极少数情况下决定你需要去看专科心脏病专家。

或今天的内分泌科专家。这仅仅是改进现有模型、评估它们的问题，因为并非所有模型都是平等的。对我们来说，这是一个监管问题，即哪些模型做得更好？它们并不都一样。我认为我们不需要技术突破就能让目前的

准专业人员达到初级医生的水平。让我快速地说一个很糟糕的老笑话。你如何称呼班级垫底的医学生？医生。所以，如果你能让医生中垫底的50%的人达到前50%的人的水平，那将改变医疗保健。

现在，我们可以朝着其他超人的能力发展，如果我们愿意的话，我们可以讨论一下，这需要下一代算法、英伟达架构和数据集。现在一切停止了，我们已经可以改变医学了。这只是创建模型的汗水投入的问题，

弄清楚如何将它们包含在工作流程中，如何支付它们，如何创建一个对我们社会有效的报销系统和商业模式。但在我看来，没有技术障碍，我们所谈论的一切都是采用当今医学的最佳案例

并用人工智能增强它，这样你就可以将每个人的护理水平提高到最佳水平，没有差距，并且可以扩展。好的，现在让我们谈谈另一个问题，那就是你认为人工智能在解决我们即使在最好的医院、最好的医生和最好的日子里也无法解决的问题方面有哪些潜力？让我举个例子。

在我们看来，直到阿尔茨海默病似乎到了实际上不可逆转的地步，我们才能真正诊断出来。也许在好日子里，我们可以非常早期地阻止轻度认知障碍（MCI）患者的病情发展。

也许通过早期淀粉样蛋白检测和抗淀粉样蛋白药物。但是，想象一下，有一天人工智能能够倾听一个人的声音，观察他们眼睛的运动，研究他们步态的运动，并提前20年预测一个人是否正处于神经退行性疾病的边缘，并在我们也许能够真正逆转疾病的时候采取行动，这是否属于科幻小说？这有多科幻？

我认为这根本不是科幻小说。你知道吗，今天观察视网膜，视网膜图像，简单的卷积神经网络，甚至不涉及转换器的网络，仅仅通过观察你的视网膜，就可以告诉你你是否患有视网膜疾病，你是否患有高血压，你是男性还是女性，你的年龄以及你寿命的一些估计。这只是观察你的眼睛后部并看到足够的数据。

我在2005年发表在《自然》杂志上的一项研究中扮演了很小的角色，该研究由布鲁斯·扬克纳领导。我们正在观察死于各种原因（通常是意外）的各种年龄的人的前额叶。我们看到了，这对像我这样的人来说是个坏消息，40岁以后，你的转录组，也就是开启的基因，会骤然下降。你30%的转录组下降了。因此，在40岁左右的基因表达似乎存在很大差异

但在基因表达方面，有一位90岁的老人看起来像年轻人，所以我们中的一些人也许还有希望。

但后来我事后想了想，还有其他一些东西实际上具有更平滑的功能，并没有完全跟进，比如我们的皮肤。所以我们的皮肤会衰老。事实上，我们所有的器官都会衰老，而且它们衰老的速度不同。你说皮肤的转录组，你没有看到像你在前额叶皮质中看到的那样，在特定年龄出现这种悬崖式效应，不同的器官衰老的速度不同，但拥有正确的数据集，

以及能够看到我们没有注意到的细微差别。

这让我非常清楚，早期检测部分，没问题。这可能非常简单。治疗部分，我们也可以讨论。但同样，我们很早就从著名的弗雷明汉心脏研究中获得了一个预测指标，该指标可以根据少数几个变量来预测你何时会患上心脏病。现在我们有了这些人工智能模型，它们基于数百个变量可以预测各种其他疾病。

我相信它很快就会做到阿尔茨海默病。我认为你将能够看到步态、语音模式、描绘你的身体、描绘你的皮肤的组合。

以及你所说的眼球运动，将是一个非常准确的预测指标。顺便说一下，我们最近发表了一项关于眼睛的非常好的研究，在汽车中，仅仅通过观察驾驶员，就可以计算出你的血糖水平。因为糖尿病患者以前有时无法获得驾驶执照。

因为担心他们会因低血糖而昏倒。所以有一项非常好的研究表明，你只需要观察，将摄像头对准眼睛，就可以准确地计算出血糖水平。我认为这种检测相当简单。

关于你能做什么，这是一个不同的问题。在我们讨论你能做什么之前，我只想更深入地探讨一下预测方面。你提到了弗雷明汉模型或多民族动脉粥样硬化研究（MESA）模型。到目前为止，这两个模型是预测主要心血管事件风险最流行的模型。但是你需要其他东西来构建这些模型，那就是有足够的时间来观察结果。在弗雷明汉队列中，这是70年代末和80年代初，然后你有了弗雷明汉后代队列。

然后你必须能够跟踪这些人的低密度脂蛋白胆固醇、高密度脂蛋白胆固醇和甘油三酯。后来，最终，他们加入了钙评分。所以如果今天我们说，看，我们想要能够预测30年的死亡率，

这是今天任何模型都无法做到的。这是我的一大块心病，我们通常通过10年风险的视角来谈论心血管疾病，我认为这是荒谬的。我们应该谈论终身风险，但坦率地说，我会接受30年风险。如果我们有一个30年风险模型，

我们可以获取更多输入。我绝对喜欢看视网膜。顺便说一下，扎克，我相信视网膜检查应该成为今天每个人医学的一部分。我整天都会进行视网膜检查而不是糖化血红蛋白A1c检查。如果我能看到我所有病人的视网膜，我再也不会看另一个A1c了。但我的意思是，即使

今天有效。我们可以定义数据集，让我们做得过分一些，以后可以修剪，但我们想在每个人身上看到这50件事来预测每种疾病。有没有办法避免我们需要30年才能看到这一点在观察故事如何发展方面取得成果？或者我们基本上会说，不，我们将用五年时间来做这件事。这不会那么有用，因为五年预测基本上意味着你已经抓住了疾病发作的人。

我会说三个词，电子健康记录。事实证明，这在美国并不是答案。为什么？因为在美国，我们四处走动。我们不会在一个医疗系统中停留那么长时间。所以我很少会对你的所有测量结果进行测量，彼得，你所有的糖化血红蛋白、你所有的血压、你所有的门诊就诊、你做过的所有影像学检查。

然而，在以色列并非如此。例如，在以色列，他们有这些医疗保健组织（HMO），其中一个，Clarit，我与他们关系良好，因为他们发表了所有关于疫苗有效性的重大COVID研究。他们为什么能做到这一点？因为他们拥有整个可用的人口。

他们拥有大约20到25年的详细病人数据和家庭关系数据。所以，如果你有这种数据，凯撒永久医疗也有这种数据，我认为你实际上可以接近。但是你将无法获得视网膜、步态、语音，因为我们仍然必须预先获得这些数据。我将声称存在代理，粗略的代理，但是……

对于步态、跌倒和听力问题，去看听力学家。现在，这些是更嘈杂的测量结果。

因此，像我这样的数据迷总是对自己嘀咕，完美是好的敌人。等待30年才能获得完美的数据集并不是现在帮助病人的正确答案。有些事情我们现在就可以知道，我们今天就可以知道，但我们不知道，因为我们没有费心去寻找。给你举个简单的例子。我做了一项关于自闭症的研究。

大约15年前使用电子健康记录。我看到有很多胃肠道问题。我和一位儿科专家谈过，他们有点不屑一顾。他们说，大脑不好，肚子疼。

我见过很多炎症性肠病。在我看来，这与大脑功能有关，这没有道理。长话短说，我们做了一项大规模研究。我们期待着成千上万的人。果然，我们发现了一些患者亚组，他们有与自闭症相关的免疫问题，他们患有1型糖尿病、炎症性肠病、许多感染。这些都是可以知道的，但它们是未知的。坦率地说，我有一些父母比我为他们做过任何其他事情都更感激我，

临床上，因为我告诉这些父母，他们并没有幻觉，这些孩子确实有这些问题。医学界只是没有认识到这一点，因为没有人有广阔的视角来观察这些趋势。所以，我不了解阿尔茨海默病领域，就像我不了解其他领域一样，我敢打赌，你今天可以通过观察足够多的病人来发现阿尔茨海默病的一些趋势，你会发现一些具有更多额颞叶成分的病人，

一些具有更多有效成分的病人，一些具有更多感染和免疫成分的病人。这些今天是可以知道的。扎克，你已经暗示了这样一个事实，那就是我们正在与客户打交道，如果医生是客户，那么他并不一定是技术最先进的客户。老实说，像许多人工智能客户一样，如果技术足够好，就会面临被技术边缘化的风险。

然而，你需要客户访问病人才能使数据系统更好，使训练集更好。那么，在接下来的十年里，你如何看待这种动态的相互作用？

这是一个正确的问题。因为为了让这些人工智能模型发挥作用，你需要大量的数据，大量的病人。这些数据从哪里来？所以有一些医疗系统，比如梅奥诊所，认为他们可以通过这种方式获得足够的数据。有一些数据公司正在努力与医疗系统建立关系，以便他们可以获得去识别的数据。我押注其他东西。

有一种趋势是消费者将越来越多地访问他们自己的数据。21世纪治愈法案由国会通过，它规定应以编程方式向患者提供他们自己的数据访问权限。现在，他们并不期望你的祖母编写一个程序来以编程方式访问数据，但是通过拥有这项权利，

它使其他人能够这样做。例如，苹果有一个叫做Apple Health的东西。它上面有一个很大的心形图标。如果你是在他们已经连接的800家医院中的一家，比如Pass General或布里格姆妇女医院，并且你是在那里的病人，如果你向它进行身份验证，如果你提供你的用户名和密码，它将下载到你的iPhone中，你的实验室结果、你的药物、你的诊断、你的手术，以及所有可穿戴设备的东西，你作为门诊病人获得的血压。

以及各种其他形式的数据。这现在已经发生了。没有很多公司正在利用这一点。但是现在，数千万美国人的数据已经可用。

有趣的是，扎克，目前的数据形式有多不友好？我给你举一个我们诊所中愚蠢的例子。所以，如果我们把病人送到LabCorp或波士顿心脏或你选择的任何实验室，我们想根据这些结果生成我们自己的内部报告，我们想对这些结果进行一些分析，布局趋势表等等。

我们必须使用我们自己的内部软件。几乎不可能从实验室中提取这些数据，因为他们发送给你的是PDF报告。他们的API很糟糕。关于这一点，没有什么用户友好的。所以，即使你的手机上有MyHeart或任何东西，MyHealth的东西，它也无法导航。它不可搜索。它不会显示随时间推移的趋势，例如

从数据的角度来看，有没有比医疗行业更不友好的行业？没有，没有。有一个很好的理由，因为他们把你囚禁了。但是，彼得，好消息是你正在和一个真正的书呆子说话。让我告诉你两种解决你问题的方法。第一，如果它在Apple health中，有人实际上可以编写一个程序，一个iPhone上的应用程序，它将这些数据作为数据。

数字，而不是刮取它。它可以运行你自己的趋势程序。你实际上可以直接使用它。此外，Gemini和GPT-4，你实际上可以给它这些PDF。

实际上，通过正确的提示，它实际上会获取这些数据并将它们转换为表格电子表格。我们不能这样做，因为HIPAA，对吗？如果病人从病人门户网站获得它，绝对可以，你可以这样做。病人可以这样做，但我不能那样使用病人的数据。如果病人把它给你，绝对可以。真的吗？哦，是的。

但它没有去识别。没关系。如果病人说，彼得，你可以获取我过去10年的50份LabCorp报告，你可以将它们运行到ChatGPT中进行刮取，并给我一个Excel电子表格，它将完美地将所有内容制成表格，然后我们可以将其运行到我们的模型中以构建趋势并寻找事物。我没想到这是可行的。

所以它无法通过ChatGPT完成，因为你的律师会说，彼得，你将因HIPAA而被处以一百万美元的罚款。我不是微软的推销员。我不持有任何股票。但是，如果你在受HIPAA保护的Azure云上使用GPT，你绝对可以使用它并获得病人同意。100%你可以做到。斯坦福大学现在正在使用GPT处理病人数据。

Epic正在使用GPT-4，它绝对可以合法地被你使用。人们不明白这一点。我们现在已经完全绕过了OCR。我们不需要浪费时间让那些不在首字母缩写光学字符识别中的人，这是15年前我们试图刮取这些数据所做的事情。彼得，让我告诉你，《新英格兰医学杂志》。我在那里担任编辑委员会成员，我们三个月前刚刚发表了一张他们的照片。

一周前，这位72岁的老人，看起来像一堆红印子。对我来说，这看起来像是有人在挠自己。它说，等等，他们睡不好觉。这是本周的图片。本周的图片。

我拿走了整件事，我删除了一个重要的事实，然后把它给了GPT-4，图像和文本。我想出了我认为它会是两件事，要么是博来霉素毒性，我不知道那是什么样子，要么是香菇毒性。我删除了什么……

是前一天吃了蘑菇的事实。所以这个东西就像看，这个东西就像看图片一样。GPT-4吐出这个？是的。我认为大多数医生都不知道这一点，扎克。我认为大多数医生不明白。首先，我无法告诉你我得了多少次皮疹。好吧，我试图把照片发给我的医生，或者我的孩子得了皮疹，我试图把照片发给他们的儿科医生，他们不知道是什么。就像，

我们正在摩擦两根棍子，你正在告诉我打火机。是的。这就是我的意思，没有初级保健医生的病人。我知道我一直重复自己。他们明白，因为皮疹或症状而等待三个月，他们有一个打火机。他们说，我会用这个打火机。肯定比没有医生好。也许更好。那是现在。

快速说明一下。我对FDA一无所知。所以我从FDA下载了不良事件报告文件。这是一个大型压缩文件。我去对GPT-4说，请分析这些数据。它说，根据这个表解压，我认为这是关于不良事件的，这是位置。你想知道什么？我说，告诉我关节炎的疾病改良药物有哪些不良事件。它说，哦，

要做到这一点，我必须连接这两个表，它就这样做了。它创建了自己的Python代码。它做到了，它给了我一份报告。这现在是医学教育的一部分吗？你在哈佛，对吧？你是在美国最好的三所医学院之一，可以说是世界上最好的医学院之一。这是否是当今医学生教育的一个组成部分？他们在这方面花费的时间是否与他们在组织学方面花费的时间一样多，我在那里花费了

一千个小时在显微镜下观察幻灯片，我从未尝试过理解。再说一次，我不想说这样做没有价值。有，我很感激做过这件事。但我想了解教育的相对平衡。就像听诊器一样。是

可以说我们应该使用听诊器以外的东西。让我确保我没有被解雇，或者至少没有被严厉殴打，告诉你，我们的医学院院长乔治·戴利明确表示，他想改变所有的医学教育，以便这些学习贯穿四年。但这需要一些努力。

现在让我们继续医学的下一部分。我们已经从纯粹的基于图像的识别过渡到如何将图像与语音、故事、文本结合起来。你已经令人信服地证明，我们不需要任何更多的技术突破来增强这些。在这一点上，这纯粹是一个数据集问题和意愿问题。现在让我们转向程序性问题。在我们有生之年，

扎克，如果需要进行根治性前列腺切除术，那么概率是多少，顺便说一下，目前永远不会进行开放手术。这是一项达芬奇机器人彻底改变了的手术。不再有失血了。当我还是住院医生的时候，这是我们做过的最血腥的手术之一。

顺便说一句，这是唯一一项我们让患者提前两个月捐献自身血液的手术。这就是我们对他们需要输血的保证程度。所以我们干脆说，去他妈的。手术前几个月来，捐献你自己的血，因为你至少需要两单位的血。如今，这项手术在很大一部分机器人身上取得了令人难以置信的成功。

但外科医生需要移动机器人。我们是否到了可以改变这种情况的地步？让我告诉你我们今天的现状。今天，已经有研究收集了一堆手术的YouTube视频，并训练了一个这样的通用模型。所以它说，哦，

他们正在用手术刀切断这条韧带。顺便说一句，这离血管太近了。他们应该把它稍微移到旁边一点。这种情况已经发生了。根据我们在一般机器人领域看到的，我认为达芬奇机器人由机器人控制10年是一个非常安全的赌注。这是一个非常安全的赌注。

在某些方面，10年算不了什么。不算什么，但这却是一个非常安全的赌注。事实上，现在，我要回到我们之前的讨论，我可以根据你的发现比任何初级保健提供者更好地进行基因诊断，解读基因组测试。所以你用这个例子，扎克，因为……

这是一个巨大的数据问题。换句话说，很明显你能做到这一点，因为数据量，我的意思是，有30亿个碱基对需要分析。所以当然你会做得更好。但将其与症状联系起来。是的，是的。但你说手术是一个数据问题，因为如果你把它变成一个像素问题。像素和运动。和自由度。是的，就是这样。

记住，在交通中移动汽车有很多自由度。顺便说一句，生命也危在旦夕。现在，医学并不是唯一一项生命攸关的工作。在交通中以每小时60英里的速度驾驶一堆金属也危及生命。上次我看的时候，有几家制造商

他们说，或者他们努力的一部分，他们正在用机器人控制多个自由度。是的。我最近和一个人谈过话，我不会说出公司名字，我想，但它是深度参与自动驾驶汽车领域的公司之一，

他们非常大胆地声明，他们为此做了一个相当有说服力的论证，如果道路上的每辆车都达到他们的自动驾驶技术水平，你就不会再有死亡事故了。但关键是每辆车都必须达到那个水平。我不知道你是否对这个领域了解足够多，但这对你来说有意义吗？首先，我是一个糟糕的司机。

我是一个更好的司机。这不是广告，但事实是我是一个更好的司机，因为我不在特斯拉上，因为我是一个糟糕的司机。事实上，对于医学来说，这是一个非常好的信息，因为我将改述这一点。我知道得足够多，知道在驾驶特斯拉时需要晃动方向盘，否则它会认为我只是在发呆。但我没有意识到的是这一点。我很糟糕。我会拿起我的手机看看。我没有意识到它在看着我。它基本上说，扎克，放下手机。所以，好吧，我放下了。

三分钟后，我又拿起它，它说：“好吧，就是这样。我正在关闭自动驾驶。”所以它关闭了自动驾驶，现在我必须全神贯注。然后我回家，它说：“好吧，那很糟糕。你再做四次。在下次软件更新之前，我将关闭自动驾驶。”我之所以提到这一点，是因为它需要一定的信心才能对你的客户群这样做，说：“我正在关闭他们为我购买的东西。”

在医学中，如果我们有一个为我们思考的AI，我们有多大可能在方向盘上睡着？这是一个真正的问题。例如，我们知道早在90年代，像昂丹司琼这样的药物的剂量，人们会没完没了地谈论你应该多久给一次，剂量是多少，一旦你把它放入订单输入系统，95%的医生只会使用默认值。

那么，在医学中，我们该如何让医生保持清醒呢？我们是否敢于应对我刚才描述的汽车所面临的挑战？所以回到正题，

我相信，由于我所看到的自主性和机器人技术，尽管我们认为这很花哨，但控制痴呆症机器人可能会产生较少的坏结果。偶尔，有人会割伤什么东西，你必须进行全面手术，或者他们回家，他们在回家的路上死了，因为他们失血过多。我认为这只会更安全。

这对我来说难以置信。但说实话，我无法理解已经发生的事情。所以我想我会尽量保持谦逊，说我保留愚蠢的权利。

再说一次，有些事情似乎比其他事情容易得多。就像我更容易相信我们将能够取代介入心脏病学家一样，自由度、复杂性和图像显示的内容、导管显示的内容以及输入的内容（支架）之间的关系，差距要小得多。是的，我能看到一座桥梁。

但是当你谈到进行惠普尔手术时，当你谈到逐个细胞地切除肠系膜上动脉肿瘤时，我在想，哦，我的上帝。既然我们有记录，我要说，我指的是你例行的前列腺切除术。是的。头十年，我今天会接受这个赌注。

让我们更进一步。让我们谈谈心理健康。我还要争辩说，这是当今医学领域服务不足的领域。你迄今为止所说的一切都产生了共鸣。根据我自己的经验，我完全同意，儿科和初级保健的资源，我的意思是，这些事情目前令人遗憾。

哈佛大学有60%的本科生正在获得某种心理健康支持，这完全超过了大学健康服务所能提供的资源。所以我们必须将我们的一些心理健康外包出去。这是一所非常富有的大学。

总的来说，我们没有资源。所以我们生活在一个这样的世界里，我认为证据非常清楚，当一个人抑郁时，当一个人焦虑时，当一个人患有任何类型的心理或情绪疾病时，药物治疗起着作用，但它不能代替心理治疗。你必须能够将这两件事结合起来。数据表明，你的心理治疗师的知识

很重要，但它不如你与那个人的融洽关系重要。现在，基于此，你认为所有医学中最神圣、最受保护的（如果你想用这个词）职业将是精神病学吗？我希望如此。如果我有一个精神病学GPT在和我说话，我不会认为它理解我。

另一方面，在20世纪60年代或70年代，有一个名为ELIZA的程序，它是一个简单的模式匹配程序。它只会模仿所谓的罗杰斯式治疗师，我真的很讨厌我的母亲。你为什么说你讨厌你的母亲？哦，这是因为我不喜欢她喂我的方式。她喂你的方式是怎么回事？非常非常简单的模式匹配。

而这个由麻省理工学院的乔·魏森鲍姆开发的ELIZA程序，他的秘书会把自己锁在办公室里与这个东西进行对话，因为它不会评判。这是在80年代？70年代或60年代。哇。是的。事实证明，有一大群病人实际上宁愿有一个非人类、非评判性的人，记住他们上次说过的话，表现出同情心

口头表达同情心。再说一次，我和彼得·李一起写了这本书，彼得·李在这本书中大肆宣传GPT-4是如何表现出同情的。在这本书中，我与他争论说，这没什么大不了的。我说，我记得在医学院被告知，一些最受欢迎的医生之所以受欢迎，是因为他们是深度的移情者，不一定是最好的医生。所以我说，对于某些事情，

那只是我。我可以想象很多，例如，认知行为疗法被完成，并被一部分人接受。这对我来说不行。我会说我只是在和一些愚蠢的程序说话。但如果它能让你洞察自己，并且它是基于数百万患者的智慧，谁能说它更糟呢？它肯定不会评判。也许它会减少。所以扎克，你天生就有问题。

可能就在第一次人工智能热潮之后，你在第二阶段在智力上、学术上成熟起来，

现在，在你职业生涯的成熟阶段，在你声望的顶峰时期，你正乘着这个第三个版本的浪潮，我认为没有人会争论它会消失。当你展望未来十年时，我们将从医学开始，你对人工智能最兴奋的是什么，最害怕的是什么？

具体来说，关于医学，我最担心的是它如何被医疗机构用来维持现状，在实践中浇筑混凝土。我最兴奋的是替代医学。

商业模式，年轻的医生在医院模式之外创建企业。医院是这些非常非常复杂的实体。他们赚取数十亿美元，一些较大的医院，但利润率非常小，1%到2%。当你拥有巨额收入，但利润率非常小的时候，你会非常厌恶风险。

你不会想改变。所以我兴奋的是，有机会为患者提供数据驱动的见解，新的业务和新的方法。

我担心的是医院进行大量的信息封锁和法规，这将使这些新业务更难创建。可以理解的是，他们不想被打扰。这就是危险所在。在你害怕的这种情况或那种情况下，扎克，患者自己能否与这些新公司、这些具有颠覆性的公司合作，并说，看，

我们有法律框架规定，作为患者，我拥有我的数据。我拥有我的数据。相信我，我们在我们的实践中知道这一点。仅仅因为我们的患者拥有数据并不意味着它很容易获得。我的实践中没有哪个方面比

从医院获取数据更糟糕、更低效。这实际上是可笑的。绝对可笑。我确实支付数百美元来获取我的患者在这个网络中从医院提取的罕见和未知疾病的数据，因为支付某人进行这种提取是值得的。是的。但现在我告诉你这是可行的。所以你说，正因为如此，你相信患者拥有数据的法律框架与

人工智能和公司，你认为这将足以抵御你最大的恐惧吗？我认为，与我10年后由机器人进行前列腺切除术的预测不同，我不那么确定，但我认为在未来10年内，至少有一家公司会想出如何利用患者的权利通过肮脏的API访问，并且

使用人工智能对其进行清理，为人类医生或医疗专业人员提供决策支持，以创建替代业务。我确信，因为需求就在那里。我认为你会看到一些公司甚至愿意冒风险。我的意思是，如果他们做得比某个性能水平更好，他们就会得到更多报酬。或者如果他们做得更糟——他们得不到报酬。

是的。我相信可能有公司在这个领域，但这是因为我不想低估医疗机构压制威胁的能力。所以让我们拭目以待。

好的。现在让我们转向医学以外的人工智能。同样的问题。在未来十年，你最害怕什么？所以我们可能不是在谈论自我意识和天网，而是在未来十年，你最害怕什么，你最兴奋的是什么？

我最害怕的是社交网络的许多弊端被这些人工智能的使用放大，进一步加剧了充斥我们网络社交体验的认知混乱和恶意。它可以用来加速它们。所以这是我最害怕的。

两周前我看到一篇文章，是一个人。我不记得他们目前是否在联邦调查局工作，或者以前是否在联邦调查局工作。他们说他们相信，我认为是在75%到90%之间，引号中的“个人”实际上并非个人。我不知道你是否花足够的时间在社交媒体上对此有看法。不幸的是，我不得不承认，我的女儿，

她现在20岁了，但四年前她给我买了一个马克杯，上面写着“推特瘾君子”。我花的时间够多了。如果很大一部分是机器人，我不会感到惊讶，情况可能会变得更糟。区分现实和人类将越来越难。越来越难，越来越难。这是真正的问题。我们是基本的社会动物。如果我们无法理解我们的社会环境，

在我们的大多数互动中，这会让我们发疯。或者我应该说更疯狂。我最积极的一面是，我认为这些工具可以用来扩展所有人的创造性表达。如果你像我一样是一个糟糕的司机，我将成为一个更好的司机。如果你是一个糟糕的音乐家，但有很好的耳朵，

你将能够以以前无法做到方式表达你的音乐才能，我认为你会看到以前从未想过成为电影制作人的电影制作人表达自己，我认为人类的表达将得到扩展，因为

就像印刷术允许各种……事实上，这是一个很好的类比，因为印刷术也引发了许多战争，因为它允许人们清楚地表达他们对教会的反对等等，它使许多坏事发生，但它也允许以没有印刷术就无法实现的方式表达所有文学作品。我期待着人类的表达和创造力。我无法想象你没有玩过人工智能的一些图片生成或音乐生成功能，或者如果你没有玩过，我强烈推荐你玩。

你会感到惊讶的。我没有。我可能应该承认我对人工智能的互动仅限于真正的chat GPT 4，基本上是解决问题。为我解决这个问题。顺便说一句，我认为我是在一个非常初级的水平上这样做。我可以在那里真正提高我的水平。就在我们开始这个播客之前，我想到了一个我一直让我助理解决的问题，因为A，我没有时间解决它，而且我不确定我会如何解决它。这将花费我很长时间。我一直让她解决它。

这实际上很难。然后我意识到，哦，我的上帝，我为什么不请chat GPT-4来做呢？所以我开始输入问题。这是一个有点复杂的问题。一旦我们完成了这个播客，我可能会马上回到它。但我没有创造性地做过任何事情。我要说的是，这对人类的伟大意味着什么？

所以现在，如果你看一本写好的书，以及获得普利策奖的人，你会认出，我不知道你是否读过西德·穆克吉，对吧？他是我最喜欢的作家之一，当谈到写作关于科学和医学时。当我读到西德写的东西时，我在想，哇。

他之所以如此特别是有原因的。他和几乎只有他才能做一些我们做不到的事情。我写过一本书。没关系。我可以写一百本书。我永远不会像西德那样写作，这没关系。我并不比西德差。我并不比西德差，但他有一种特殊的才能，我可以欣赏，就像我们都可以欣赏一位杰出的运动员或杰出的艺术家或音乐家一样。

如果这条界限变得模糊，这意味着什么？

这是正确的问题。是的，西德写得像诗歌一样。这是一个我不喜欢的答案。我多次听到过。人们说，哦，你知道深蓝在国际象棋中击败了卡斯帕罗夫，但国际象棋比以往任何时候都更受欢迎，即使我们知道世界上最好的国际象棋棋手是电脑。所以这是一个答案。我一点也不喜欢这个答案。因为如果我们创造了SidGPT，而Sid写了……

阿尔茨海默病，第二大疾病，他用完整的Sid风格写了它。但这不是Sid，而是同样具有同理心的家庭参考。对。将历史与故事与科学交织在一起。是的。如果它做到了这一点，而它只是一台电脑，你会有什么感觉，彼得？

我的意思是，扎克，你是在问一个关键问题。我认为我会同样喜欢它，但我不知道我会赞扬谁。也许我有一种弱点/倾向，想要崇拜。你知道，我不是一个宗教人士，所以我的偶像不是宗教人士，但我确实倾向于喜欢看到伟大。我喜欢看看写了一些令人惊叹的东西的人，然后说，

这让我惊叹。我喜欢能够看看历史上最好的F1车手，并研究他们所做的一切，使他们如此伟大。所以我不确定这方面意味着什么。我不知道它会如何改变这一点。我在瑞士日内瓦长大。尽管我有这种美国口音，但我的父母都是波兰人。所以我之所以有美国口音，是因为我在国际学校与许多美国人一起上学。我读的都是我父亲从英国给我买的科幻小说。所以我是

一个科幻小说迷。所以让我用科幻小说来回答这个问题。这不会在10年内发生，但可能会在50年内发生。你将有偶像，偶像将是，是的，格雷戈罗维奇写了一部伟大的小说，但你知道，AI 521？

他们对人类状况的理解是奇妙的。当我读他们的小说时，我会哭。他们将成为生态系统的一部分。他们将是我们内部的实体。他们是否具有自我意识将成为一个哲学问题。让我们不要走那条狭窄的道路，那条令人厌恶的兔子洞，在那里我想知道，彼得是否真的有意识？他是否与我相同的过程？我们不会知道这些，或者也许我们会知道，但如果他们就在我们中间，这重要吗？

他们将有品牌。他们将围绕他们建立公司。他们将是超级巨星。他们将是来自堪萨斯州的Fubar博士，接受iordific医学培训。我们替代医学的关键人物，不是人类。但我们喜欢他们所做的。好的，最后一个问题。

从智力角度来看，我们多久才能永生？所以如果我今天死了，我的孩子们将无法再获得我的想法和沉思。在我有生之年，是否会有一个点，人工智能可以被训练成与我完全相同，并且

至少从目标的角度来看，到了我死后，我的孩子们可以说，爸爸，我应该如何处理这种情况？它可以用我会的方式回答他们。

这是一个很好的问题，因为这是GPT-4发布后不久产生的一个早期商业计划。事实上，我和马克·库班谈过很短的时间。因为他看到了GPT-4，我认为他获得了他的声音、所有作品的商标或版权。

和肖像，这样别人就不能创造一个以他所有方式回应的马克。我会告诉你，这听起来很疯狂，但有一家名为rewind.ai的公司，我现在正在运行它。出现在我屏幕上的所有内容

它正在录制。它听到的每种声音，它都在录制。如果屏幕上出现字符，它会使用OCR识别它们。如果出现声音，然后如果我有问题，我说，我什么时候和彼得·阿提亚谈过话？他会为我找到它。我会说，我在谈论谁？人工智能和阿尔茨海默病。他们会找到这个声音。

时间轴上的视频。扎克，这是多少TB的数据？令人惊讶的小。只是GB。怎么可能？因为A，它使用苹果硅实时压缩它。其次，你和我都老了，你没有意识到GB在拥有TB的标准Mac上并不大。

那是1000GB。所以你可以极大地压缩音频。它实际上并没有拍摄视频。它只是在屏幕每次改变一定数量时拍摄多个快照。是的，它并没有试图获得视频分辨率本身。不，它正在这样做。我可以看到时间轴。这非常了不起。所以有足够的时间。

在我看来，数据，这样通过足够的类似对话，有人可以创建一个相当好的近似值，至少是公开的扎克。那么下一个问题是，扎克是否愿意在录音设备上使用Rewind AI，他的手机24/7在他私人的时刻，在他亲密的时刻，

当他和妻子争吵时，当他对孩子们生气时，当他与他的博士后有最棒的经历时。如果你考虑一下我们从好、坏、丑陋中获得的全部体验，如果我们想形成我们自身的本质，这些可能都是必要的。你设想有一天人们会说，“看，我愿意承担与之相关的风险，”并且这样做存在明显的风险，但是

但我愿意承担这些风险，以便拥有这种遗产，这个数据集将被转化为遗产。我认为从死里复活来和你孩子说话实际上相当令人毛骨悚然。

所以我实际上还有其他目标。这就是我处理它的方式。我们一直受到监控。我们有iPhone。我们有Alexa设备。我不知道实际上是谁存储了什么以及什么。人们将以我们知道或不知道的方式使用这些数据。我觉得是我们，小人物，如果我们有自己的副本，我们可以说，好吧，实际上，这就是我当时所说的。是的，这是断章取义的。是的，这是断章取义的。我可以做到。我有一个助理可以……

只需找到它，准确地找到它，并找到我说过它的所有时间。

我认为这很好。我认为让你的孩子从死里复活并提供建议会弄乱他们的头脑，尽管他们可能会被诱惑。从技术上讲，我认为这不会那么困难。再说一次，谈到rewind AI，再说一次，我在他们那里没有股份。我认为我可能已经为在我的电脑上运行许可证付过钱，但麦克风总是开着的。所以当我与办公室的学生交谈时，它

它正在记录下来。所以我的生活中有一些时刻我不希望被记录下来。我的生活中有很多部分实际上是以这种方式存储的。好吧，扎克，这是一个非常有趣的讨论。我学到了很多东西。我进入这次讨论时可能与普通人的知识水平差不多，也许略多一些，但在人工智能的一般原理、人工智能的演变方面，显然并没有多多少。

我想，如果有什么让我惊讶的话，很多事情都让我惊讶，但没有什么比你为我特定领域和你特定领域（医学）的演变所描绘的时间尺度更让我惊讶的了。我不知道我们离达到那种智力水平如此之近。彼得，如果我是你，这不是一个提议，因为我太忙了，但你是一个有能力的人，并且你有一个很棒的网络。

如果我经营你正在经营的诊所，我会利用现在的时间。我会获得那些视频和声音，并让我的所有患者（当然是在征得他们的同意的情况下）成为其中的一部分，并实际跟踪他们的进展。不仅仅是他们报告的方式，而是通过他们的步态，通过他们的外表。你可以做伟大的事情。

在你正在做的事情中，并推进最先进的技术。你问，谁会去做？你正在做一些有趣的事情。你可以使用这些技术作为另一个非常聪明、全面的助手来突破界限。扎克，你让我思考了很多事情。我很感谢你的时间，显然也感谢你的洞察力和多年的奉献，这使我们能够坐在这里进行这次讨论。非常感谢你。非常荣幸。感谢你的时间。

感谢收听本周的《驱动》节目。对我来说，在不依赖付费广告的情况下提供所有这些内容非常重要。为此，我们的工作完全由我们的会员支持。作为回报，我们提供独家会员专属内容和福利，这些内容和福利超出了免费提供的范围。因此，如果您想将您对这个领域的了解提升到一个新的水平，我们的目标是确保会员获得的回报远远超过订阅价格。

高级会员资格包括多项福利。首先，全面的播客节目说明，详细介绍了我们在每一集中讨论的每个主题、论文、人物和事物。街上的说法是，没有人的节目说明能与我们的相媲美。

其次，每月问答或AMA剧集。这些剧集包含对订阅者问题的详细回复，通常侧重于单个主题，旨在为会员特别感兴趣的主题提供大量清晰度和细节。当然，您还可以访问这些剧集的节目说明。

第三，提供我们由专业的调研分析师团队精心制作的高级时事通讯。这份时事通讯涵盖了与长寿相关的广泛主题，并提供了比我们免费的每周时事通讯更详细的信息。第四，访问我们的私人播客订阅源，您可以访问每一集，包括AMA（美国医学会）的节目，无需收听您现在和常规播客订阅源中收听的开场白。

第五，Qualies，另一个仅限会员的播客，我们将其制作成精彩片段集锦，其中包含《驱动》之前剧集的最佳片段。这是一种不错的方式，可以追赶之前的剧集，而无需逐集收听。最后，还有其他不断添加的福利。如果您想了解更多信息并访问这些仅限会员的福利，您可以访问peteratiamd.com/subscribe。

您也可以在YouTube、Instagram和Twitter上找到我，所有账号的用户名都是PeterAttiaMD。您也可以在Apple Podcasts或您使用的任何播客播放器上给我们留下评论。本播客仅供一般信息用途，不构成医疗、护理或其他专业医疗服务的实践，包括提供医疗建议。不会形成医患关系。

使用本信息和与本播客链接的资料的风险由用户自行承担。本播客中的内容并非旨在替代专业的医疗建议、诊断或治疗。用户不应忽视或延误就其所患的任何医疗状况寻求医疗建议，并且他们应就任何此类状况寻求其医疗专业人员的帮助。

最后，我非常重视所有利益冲突。有关我的所有披露信息以及我投资或咨询的公司，请访问peteratiamd.com/about，我在那里保留一份所有披露信息的最新有效列表。

#309 ‒ AI in medicine: its potential to revolutionize disease prediction, diagnosis, and outcomes, causes for concern in medicine and beyond, and more | Isaac Kohane, M.D., Ph.D. 01:55:15 Share

The Peter Attia Drive

Deep Dive

Shownotes Transcript

#309 ‒ AI in medicine: its potential to revolutionize disease prediction, diagnosis, and outcomes, causes for concern in medicine and beyond, and more | Isaac Kohane, M.D., Ph.D.