We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

#290 ‒ Liquid biopsies for early cancer detection, the role of epigenetics in aging, and the future of aging research | Alex Aravanis, M.D., Ph.D.

2024/2/19

The Peter Attia Drive

AI Deep Dive AI Chapters Transcript

People

Alex Aravanis

Topics

Alex Aravanis: 本期节目讨论了液体活检和表观遗传学两个相互关联的主题。首先，他追溯了基因组测序和肿瘤测序的发展历程，为详细探讨液体活检作为癌症早期检测方法奠定了基础。讨论内容涵盖了细胞游离DNA、DNA甲基化、灵敏度、特异性以及与液体活检相关的预测值等关键概念。随后，Alex Aravanis探讨了DNA甲基化与衰老生物学之间的复杂相互作用，并探讨了利用细胞重编程逆转衰老过程中发生的表观遗传变化的可能性。他还介绍了他在将工程技术应用于医学问题上的经验，以及如何利用这些技术来解决生物学中的重要问题。他详细阐述了下一代测序技术的发展，以及如何利用这些技术来降低测序成本，并将其应用于临床实践。他还讨论了液体活检技术的三个应用方向：筛查、治疗选择和监测。 Peter Attia: Peter Attia与Alex Aravanis讨论了液体活检和表观遗传学在癌症早期检测和衰老研究中的作用。Peter Attia详细询问了液体活检技术的原理、发展历程以及在临床实践中的应用。他特别关注了GRAIL公司开发的多癌早期筛查试验Galleri，并探讨了该试验的灵敏度、特异性、阳性预测值和阴性预测值。此外，他还与Alex Aravanis讨论了表观遗传学在衰老中的作用，以及如何利用细胞游离DNA甲基化模式来识别癌症的组织来源。他们还探讨了细胞和表观遗传重编程以及衰老研究领域的其它令人兴奋的工作。Peter Attia还提出了关于早期癌症检测方法是否能改善整体生存率以及如何平衡灵敏度和特异性的问题。

Deep Dive

Chapters

Alex Aravanis, CEO and co-founder of Moonwalk Biosciences, discusses his journey from electrical engineering to medicine. His PhD research at Stanford, under the mentorship of Dick Chen, focused on applying engineering principles to understand the brain's communication processes. This led to groundbreaking discoveries about synaptic vesicle function, published in Nature.

Quantum unit of communication in the brain is the synaptic vesicle
Developed a method to study how information is transmitted between cells
Published in Nature

Shownotes Transcript

嘿，大家好，欢迎收听《驱动》播客。我是你们的主人，彼得·阿提亚。这个播客、我的网站和我的每周通讯都专注于将长寿科学转化为每个人都能理解的内容。我们的目标是提供最好的健康和保健内容，为此我们组建了一个优秀的分析师团队。

对我来说，在不依赖付费广告的情况下提供所有这些内容极其重要。为此，我们的工作完全由我们的会员支持。作为回报，我们为会员提供独家会员专属内容和福利，这些内容和福利远远超出免费提供的范围。

如果您想将您在这个领域的知识提升到一个新的水平，我们的目标是确保会员获得的回报远远超过订阅价格。如果您想了解更多关于我们高级会员福利的信息，请访问peteratiamd.com/subscribe。本周我的嘉宾是亚历克斯·阿拉维纳斯。亚历克斯是Moonwalk生物科学公司的首席执行官兼联合创始人。

我应该事先说明，我也是Moonwalk生物科学公司的投资者和顾问。我和亚历克斯在医学院是同事，所以认识亚历克斯已经有25年多了。在Moonwalk之前，亚历克斯是Illumina的首席技术官，高级副总裁兼研发主管。在他的领导下，Illumina推出了业界领先的产品，用于生成

并分析世界上大部分基因组数据。他开发了大型基于基因组的研究和临床应用，包括用于罕见病诊断的全基因组测序、用于癌症的综合基因组分析以及用于选择最佳疗法的最先进的AI工具，用于解释基因组信息。

亚历克斯是几家生物技术和医疗保健公司的创始人，包括Grail Bio，他曾担任首席科学官和研发主管。在Grail，他领导了其多癌早期筛查测试Gallery的开发，我们将在本播客中详细讨论。他拥有30多项专利，并担任几家生物技术公司的科学顾问委员会成员。

亚历克斯获得了斯坦福大学的电气工程硕士和博士学位以及医学博士学位，并在伯克利获得了工程学士学位。

在本集中，我们讨论了两个相关的主题：液体活检和表观遗传学。我们涵盖了基因组测序和肿瘤测序的演变。然后，我们详细讨论了亚历克斯在Grail和液体活检方面的工作，包括对细胞游离DNA、甲基化、敏感性特异性以及液体活检的阳性和阴性预测值的理解。然后，我们深入探讨了表观遗传学、甲基化和衰老生物学。

这是一个特别复杂的主题，但说实话，如今在生物学领域，很少有主题能像这个一样让我兴奋。而且我怀疑我的热情在这里会表现得非常明显。所以，话不多说，请欣赏我和亚历克斯·阿拉维纳斯的谈话。

嘿，亚历克斯。很高兴今天能和你坐在一起。我真希望我们能当面进行这次谈话，因为我们已经有几个月没见面了，即使那也是一次偶然的相遇。我想作为背景介绍，你我认识已经有20多年了。我想我们一起开始读医学院已经有25年了。很难相信已经这么久了，对吧？感觉像一百万年前，又像昨天。是的，那些都是美好的时光。所以……

亚历克斯，我记得我们第一次见面时，我们几乎立刻就因为我们都是工程师而产生共鸣。我记得我们在医学院有一群好朋友。我们共同的一点是，我们都不是预科生。我们都是那种他们用来形容为非传统医学道路的人。所以让我们简要地谈谈你的背景。

你作为一名电气工程师进入，然后你在一位名叫迪克·陈的非常著名的科学家的实验室里攻读博士学位。也许可以告诉大家一些你在那项工作中所做的事情，以及是什么让你对科学足够兴奋，从而偏离了传统的医学博士道路。

是的。我的博士学位是电气工程。斯坦福大学的校园有一个很酷的配置，工程学院就在医学院的对面。因此，随着时间的推移，我对应用信号处理技术、电路设计、成像、人工智能等越来越感兴趣。但我对医学中的一些问题比对工程更感兴趣。

一些传统的工程产品和类似的东西。你遇到了一位世界著名的神经科学家，正如你提到的，大卫。

迪克·陈，他对大脑中交流的量子单位（即单个突触小泡）的基本问题非常感兴趣。当时的问题是它看起来像什么以及它是如何运作的？这对我来说是将这些工程工具应用于生物学中真正重要的问题并帮助解决这些问题的开始。第一个故事是《自然》杂志上的一篇很棒的文章，我们在这篇文章中最终解答了量子如何在细胞之间传递的问题。

然后继续做了一些其他的类似项目。你能谈谈这些吗？这些信息是如何传递的？

用我的工程和通信背景来解决这些问题真的很有趣。但是，如果你观察大脑中的一个中心神经元，并观察信息传递的速度，它似乎比终端中的突触小泡数量要快得多，对吧？所以有这个，好吧，终端中只有30个突触小泡，就像电子显微镜一样，但你却在几秒钟内看到了数百次传输。那么这是怎么回事呢？

并且有各种各样的理论。有一个单独的小泡正在融合并保持融合，并通过它泵送神经递质而不会坍塌。这就是你如何获得如此快速脉冲的原因。我们想出了一个很酷的术语，叫做“亲吻和奔跑”来解释这种现象。它再次帮助解答了这样一个基本问题：大脑是如何拥有如此多的神经元，却能够在每个连接上传输如此多的信息。

所以，亚历克斯，如果你考虑一下你在博士期间学到的所有东西，我的意思是，我想，在你所做的实验室里做博士研究的好处之一是，你与其他一些非常有思想的人重叠，包括播客之前的嘉宾卡尔·德塞罗斯。

你认为你在哲学上（不一定是技术上）学到的最重要的事情是什么，这些事情正在为我们今天要讨论的事情服务吗？所以我们今天要讨论很多关于液体活检的内容。我们将讨论很多关于表观遗传学的内容。我们当然会讨论很多使这些事情成为可能的技术。当你回顾你在电子工程方面的背景时，有哪些可转移的技能

所以我认为其中之一是工程学中的一句谚语，那就是如果你不能建造它，你就无法理解它。因此，仅仅理解某物的描述并不等于你可以从头开始构建它。所以在生物学中你并不总是能做到这一点，但你可以做一些实验来检验这个概念：我是否真的能让它工作？所以我认为这是一个对我很有帮助的工程概念。另一个，它并非工程学的专属，而是非常以第一性原理为基础。我们真的理解这是如何运作的吗？

在那个特定的实验室里，人们非常重视做一些总能学到东西的实验，无论它是否证实或否定了你的假设，你都能学到关于这个系统的新东西。不要做那些你可能什么也学不到的实验。这是一种非常强大的思考方式。

为了节省时间，我们快速前进一下。在我去住院医师培训之后，在你完成博士学位之后，我们显然有一个有趣的岔路，我们仍然发现自己并肩在同一家公司工作了四年，这再次带来了许多有趣的故事，包括我最喜欢的，我和你迷失在德克萨斯州中部，实际上不是在德克萨斯州中部。

而是在埃尔帕索郊外，汽油几乎用完了，我的意思是，这里没有手机信号。我们有麻烦了，但我们不知何故一起摆脱了困境。是的。是的，我记得，我们这些加利福尼亚人认为在西德克萨斯州中部10到15英里外一定有一家星巴克。结果是，

你可以走数百英里而没有星巴克。没错。用八分之一的油箱经过一个加油站，说我们在下一个加油站停下来可能是一个战略错误。还有你救了我一次，因为我忘了袖扣，因为你有一些牙线。你还记得吗？哦。我不知道你是否记得。就是这样。是的，你有一些牙线。没错。完全是麦克盖弗的举动。但无论如何，让我们快速前进到所有这些事情。所以我不知道现在是哪一年。一定是……

大约是2012年？你是什么时候第一次到Illumina的？2013年初。好的。跟我谈谈那个角色。你被招募到Illumina做什么？也许可以告诉那些不知道Illumina是什么的人一些关于这家公司的情况。

是的。如今，Illumina是最大的DNA测序技术制造商。所以，当你听到人类基因组被测序时，诸如表达数据、RNA测序、大多数液体活检、大多数肿瘤测序、发现患有罕见病的儿童的基因变异等，大多数都是用

Illumina技术完成的。他们还制造处理DNA的化学物质、生成这些信息的测序仪以及帮助分析这些信息的软件。因此，我真正地将这项工具从一项非常小众的研究技术转变为医学中的标准护理，并发表了数十万篇论文，并且极大地推动了科学发展。所以11年前，你出现在那里。你扮演的角色是什么？

这是Illumina历史的早期。吸引我加入这家公司以及我被招募的原因是帮助开发更多临床应用和这项技术的更多应用应用。因此，这项技术已被某些测序专家用于基础研究，但公司和我同意这一愿景，认为，嘿，这可以用于更多用途。这可以用来帮助每个癌症患者。这可以用来帮助患有遗传疾病的人。

我们如何开发这项技术及其其他方面，例如检测和软件，以实现这一目标？我被聘用去做这件事。当你甚至说了一点之后，亚历克斯，我意识到我们许多人，我和你都会认为这里面的一些术语是理所当然的，测序以及其中涉及的内容。但我仍然认为对于一些听众来说，这可能仍然是一个黑匣子。鉴于我们今天要讨论的主题，我

我认为仅仅向人们解释一下，例如，在90年代末和2000年代初，“人类基因组”被测序时做了什么。这意味着什么，以及从第一次以最模拟的方式通过蛮力完成到现在你到达的时候发生了怎样的变化？

10、11年前。所以也许带我们了解一下测序基因组实际上意味着什么，并且随意添加一些关于DNA的一些基础知识以及结构等等，因为它与之相关。这真的是非常重要的基础知识。

人类遗传学的快速入门。所以在身体的大多数细胞中，你都有23对染色体。它们非常相似，除了X和Y染色体，在男性和女性中显然是不同的。每条染色体都代表着

实际上是大量以非常有序的方式包装在一起的DNA，其中DNA缠绕在称为核小体的蛋白质周围，这些蛋白质由组蛋白组成，然后它被包装成称为染色质的东西，这是一种DNA和蛋白质的混合物，再次被包装在一起，然后你制造出这些染色体单位。现在，如果你要解开所有这些染色体，

拉动毛衣上的线，并完全解开它，如果你要将它们首尾相连，你将拥有30亿个碱基。所以在30亿个位置中的任何一个位置的ATCG代码，你将有一串字母。每一个字母都是ATC或G，长度为30亿。所以对整个人的基因组进行测序就是读取个体的代码。

一旦你这样做，你就会知道他们在每个位置的特定代码。所以在上个世纪末，这被认为是一项相当艰巨的任务。但我认为，正如我们的国家经常做的那样，决定这是一项非常值得做的事情，以及其他几个

坚信科学的领先国家。因此，他们在世界各地的中心资助了人类基因组计划。因此，在世界各地的中心，人们都在试图测序这30亿个碱基的片段，以构成第一个完整的人类基因组。所以这非常有名。有两项努力。一项是由NIH领导的公共努力，

以及当时的弗朗西斯·柯林斯。他们有一种特殊的方法，他们所做的是切出基因组的大部分，然后使用一种较旧的测序方法，称为毛细管电泳，来测序每个碱基。

一项是由克雷格·文特尔和一家名为Solera的公司领导的私人努力，他们采取了一种截然不同的方法，那就是他们将基因组切成更小、更小的片段，这些片段小到你不一定知道

先验地知道它们来自基因组的哪个部分，这就是为什么他们要通过公共努力进行这个更漫长、更费力的过程。但有一个很大的创新，那就是他们意识到，如果你有足够的这些片段，你可以使用一种数学技术，从这些单个片段中重建它，你可以取单个片段，看看它们在哪里重叠。再说一次，我们在这里谈论的是数十亿个片段。你可以想象一下在数学上重建它。

计算量非常大，非常复杂。但这样做的好处是你可以更快地生成数据。因此，在更短的时间内和更少的资金下，他们实际上赶上了公共努力，然后在2000年末和2001年初左右同时完成了人类基因组的草图。然后在《自然》和《科学》杂志上同时发表了人类基因组草图这一科学里程碑。

亚历克斯，Solera将DNA分解成的大致长度是多少？他们一次性取出兆碱基的块，大约是一百万个碱基。然后他们会分离它，然后将其分解成更小的片段，这些片段是千碱基片段。

一次一千个碱基。再说一次，所以他们会取一块拼图，但他们会知道它是哪一块，然后将其分解成越来越小的块。然后在你有了千碱基序列之后，他们会将所有这些重新组合在一起，而不是与私人努力形成对比，他们称之为鸟枪法测序，也就是你只是把整个东西都磨碎了，强行测序，然后使用信息学来找出什么东西放在哪里。

在鸟枪法测序中，它们被分解成多小？它们被分解成千碱基和百碱基、数百碱基的片段。但关键是，你只需要强行测序，而不是这种更精细的方法，试图取单个片段并将其分解，然后重建它们。

所以是2001年初。这被发表了。顺便说一句，我们知道这个人的身份吗？我想我们知道被测序的个人的身份，对吧？我不记得了。我认为最初的一个仍然是匿名的，可能是多个人的组合，仅仅是因为所需的DNA数量。这需要。是的。是的。此后不久，克雷格·文特尔，他可能是第一个被命名的人，我们有他的

基因组。明白了。人们经常说，亚历克斯，这项努力在测序结束时花费的成本，如果你决定现在再做一个人，那么直接做这项努力的成本将达到十亿美元。

在将这项技术从当时的测序成本（让我们说，每个序列大约10亿美元）转变到10年后的状态时，情况如何？是什么技术（或复数形式的问题）导致了成本的降低，以及它提高了多少个数量级？

我们回顾并进行了这项分析。因此，如果你在最初的人类基因组结束时真的说，嘿，我想再做一次。并且你从之前的研究中获益匪浅。几亿美元将是一个增量基因组。到2012年，它已经降到了几万美元。所以我们称之为四个或五个数量级的改进。

是什么带来了这种变化？所以当你出现在Illumina的那一天，如果出于研究目的，或者一个非常富有的人说，我必须知道我的整个基因组序列，并且他们愿意为此支付25000美元，或者一个实验室正在将其作为临床试验或研究的一部分进行，那么他们从Illumina购买了什么来实现这一目标？

这是一系列发明，使测序反应能够小型化。然后你可以通过小型化来进行数量级更多的DNA测序。

较旧的测序仪，它们有一个小的玻璃管。随着DNA的通过，你对其进行测序。它被转换成二维格式，有点像载玻片，你有很多DNA片段粘在上面，数百万，最终数十亿。然后你同时测序所有这些片段。因此，每个单独的测序反应都进行了巨大的小型化，这使得你可以在一个系统中生成更多、更多的测序仪。

同时进行DNA测序。有一种非常重要的化学物质被开发出来，称为合成测序，由一位我认识的剑桥化学家尚卡尔·巴拉苏布拉马尼亚姆开发，他开发了氧化铝测序化学物质，最终通过一家名为Celexa的公司，Illumina收购了这家公司。他开发的剑桥原始化学物质已经产生了世界上大部分的基因组数据。

是什么让这种化学物质如此进步？它使你能够小型化测序反应。因此，你可以在一个很小的载玻片上拥有大量的片段，最终达到数十亿个。它还允许你做一些

称为循环测序的事情，以非常精确、高效和快速的方式，你一次读取一个碱基，你可以控制它。所以你可以想象一下，你有大约10亿个DNA片段，你正在每个片段的第三个碱基上，你想知道每个片段的第四个碱基是什么。它允许你同时在所有10亿个片段上测序一个碱基，在你的整个草坪上读取它，然后你

一旦你读取它，添加一个碱基，读取所有内容。因此，这允许这种巨大的并行化。让我们谈谈我们今天的情况。据我回忆，我上次查看时，今天进行全基因组测序的费用大约是1000美元，500到1000美元。这大约准确吗？是的。彼得，这太贵了。今天，几百美元。好的。所以今天几百美元。是的。

我觉得我之前在一张图表上看过这个，这是我注意到为数不多的几件事之一，它的改进速度比摩尔定律还要快。也许可以告诉大家摩尔定律是什么，为什么经常谈论它。我认为每个人都听说过它。也许可以谈谈它基本上是一个阶跃函数，如果我没记错的话，有两个摩尔定律，但中间还有一个更大的改进。但也许首先告诉大家摩尔定律是什么。

它不像物理定律那样，但它成为微处理器行业的一种趋势。它指的是微芯片上晶体管的密度以及每个晶体管的计算能力的成本。这以几何级数下降，以一种稳定的方式。

我实际上不记得确切的数字，例如每两年翻一番之类。但它有一个几何因子，该行业遵循了几十年。它现在已经不太遵循了。我的意思是，晶体管正在下降到

原子尺度，但比人们想象的要快得多。它基本上始于60年代末。正如你所说，它一直持续到达到原子化学的极限。是的。因此，这种不懈的努力才使整个软件工程高科技产业成为可能。所以……

回到我的问题，那就是，如果你只看从2000年到今天的测序成本，它有点像两条曲线。有一条不懈的曲线，它到达了我们在2013年的位置。但之后价格又大幅下降了一次。我猜这与鸟枪法测序或其商业化有关。我的意思是，不是它的概念，它已经存在了。这听起来对吗？

是的。所以当Illumina真正开始交付……

高通量下一代测序，由于小型化，它带来了一个新的更快曲线。因此，这种能够在一个小区域内测序数十亿个片段的能力，我有幸参与了这项工作。Illumina继续降低密度，提高化学反应速度，以及所有相关的光学、工程软件，这使得成本降低的速度比摩尔定律快得多。

其他公司是否参与了下一代测序的最终结果？是的，很多。其中一些公司仍然存在。没有一家公司像Illumina那样成功，但也有一些重要的参与者。今天，这是行业标准。我认为没有测序没有使用下一代测序？不，绝大多数是下一代测序。

有一些利基应用使用其他方法，但在99%的生成数据中，都使用某种版本的下一代测序。明白了。所以你刚才提到

让你加入Illumina的部分努力可能不仅基于你天生的才能，还基于你也有临床背景的事实。你是一位医学博士和博士，如果他们的愿望是能够扩展到临床应用，这将是一个自然的契合。那么，在这个过程中，液体活检的想法是在什么时候出现的呢？也许可以谈谈今天我们要讨论的该领域一家公司的历史。

首先，我应该谈谈肿瘤测序，它早于液体活检。几家公司，最著名的是Foundation Medicine，使用Illumina技术开发了肿瘤测序。所以有一些学术研究，但他们试图开发它，并且是第一家成功将其作为临床产品开发的公司。

你可以想象的是，有一些与癌症相关的基因经常发生突变。了解肿瘤有哪些突变对预后有很大的影响，对治疗也有很大的影响。随着时间的推移，我们有了越来越多的靶向疗法，你知道，如果你的肿瘤有一个非常特殊的突变，它更有可能对靶向这种肿瘤的某些药物产生反应。

当时，随着越来越多的这些突变被确定为可能对肿瘤的治疗很重要，说对每个突变进行PCR检测变得不切实际。所以想象一下，你想知道患者的肺癌肿瘤中是否有100个潜在的突变，单独进行每一个检测，这需要大量的费用，并且有很多假阳性。所以……

像Foundation Medicine这样的公司说，嘿，为什么我们不一次性测序所有这些位置呢，鉴于下一代测序？所以他们会制作一个面板来测序，比如说500个基因或几百个基因，这些基因在大多数实体瘤中最重要。

在大多数实体瘤中，然后他们会对它们进行测序。然后在一个测试中，他们会看到绝大多数可能与该癌症患者的治疗相关的潜在突变。所以这在今天的肿瘤学中仍然是一个非常重要的工具。很大一部分肿瘤都被测序了，这就是人们能够获得许多类型的药物的原因。许多肺癌、黑色素瘤的靶向疗法，或者你听说过像我

微卫星不稳定性或高突变负荷，这些都来自肿瘤测序。一旦确定了这一点，然后一些人，最著名的是约翰·霍普金斯大学的人，以及其他地方的人，开始提出这个问题，好吧，你知道，我们能否从血液中测序肿瘤？你可能会说，好吧，你的肺部有一个肿瘤。为什么血液测序与观察肿瘤相关？事实证明，血液中存在肿瘤DNA。并且

这很有趣。所以在40年代后期，人们首次发现血液中存在细胞外的DNA，即所谓的细胞游离DNA。然后在70年代，人们注意到癌症患者血液中存在大量的细胞外DNA，其中一些可能来自肿瘤，来自癌症本身。如果你了解任何关于

肿瘤生物学，你知道癌细胞一直在死亡。所以你认为癌症生长得很快，这是真的，但它们实际上以惊人的速度死亡，因为这是无序的生长。许多分裂的细胞都有各种基因组问题。所以它们死亡或被切断血管。但肿瘤的疯狂之处在于，如果它是一个侵袭性肿瘤，是的，它生长很快，但肿瘤内的细胞死亡量也很高。每次这些细胞中的一个死亡时，一些DNA就有可能进入血液。所以正是这种洞察力以及肿瘤测序表明，嘿，如果我们对这种无细胞DNA进行测序呢？我们能否最终对循环中的某些肿瘤DNA或癌细胞DNA进行测序？早期结果，特别是来自约翰霍普金斯大学的这个小组的结果，开始表明这确实是可能的。

然后，一些公司，再次使用Illumina技术，然后我们也开始在Illumina进行这项工作，我们自己开发了无创活检分析、测试和技术，这些技术发展成了无创活检。在这种情况下，它是针对晚期癌症的。所以它是针对被诊断患有癌症的患者。你想知道，他们的肿瘤是否有突变？你可以从血液中得到它。有一个很大的好处，那就是，正如你所知道的，对于肺癌来说，进行活检可能是一个非常危险的主张。你可能会导致气胸。你可能会让某人住进ICU。你知道，在极少数情况下，这种手术会导致死亡。因此，能够

从血液中获得突变谱确实很有吸引力。所以这促使许多公司走上了为晚期癌症开发这些无创活检的道路。所以Alex，让我们谈谈那里的几件事。告诉我无细胞DNA片段的典型长度。有多少碱基对或范围是多少？

是的，这取决于具体的背景，但大约是160个碱基对。那就是ATCG代码的160个字母。它有这个长度有一个非常特殊的原因，那就是如果你拉动毛衣上的线，你会解开染色体。

你一直这样做，直到你得到大约160个碱基对的东西，你会发现DNA，对，它不仅仅是裸露的，它还包裹在称为核小体的物质周围，核小体是一个八聚体。

或八个这些组蛋白在一个立方体中，DNA绕着它缠绕两次。这是这种更大的染色体结构的较大染色质的最小单位。所以它是160个碱基的原因是，这或多或少是绕两圈的几何形状。因此，DNA可以被血液中的酶切割，但核小体可以保护

DNA不被切割成小于约160个碱基对的任何东西。这意味着在血液中发现的无细胞DNA仍然绕着核小体缠绕两次，就像它仍然依附于它，这就是保护它不被切割得更小的原因吗？

就是这样。你提到这显然是它的第一个应用，大概是寻找无需组织活检就能弄清楚患有晚期癌症的人的突变是什么的方法。据推测，到目前为止，收集信息非常容易。

数百个160个碱基对的片段，并使用相同的数学方法根据少数重叠来重新组装它们，说这是实际的序列，因为据推测，他们正在观察的基因比160个碱基对长得多。

就是这样。所以在2014年、2015年，信息学相当复杂。因此，你可以从片段中获取大量DNA序列，并轻松确定它与哪个基因相关。我记得在某个时候，大约一年前或两年前，我在播客中与我的另一个医学院同学Max Dean进行了一次讨论，并且

关于观察那些临床上无疾病的患者的复发情况。你带走了一位接受过切除术，加上或减去一些辅助化疗的患者，从肉眼和X光片来看，他们似乎没有疾病。问题就变成了，癌症是否复发了？我们越早发现，我们再次全身治疗他们的机会就越好，因为

在肿瘤学中，一个相当确立的事实是，肿瘤负担越低，反应越好，突变越少，逃逸越少，等等。那么，这种技术是否成为这种技术的下一个迭代，即如果我们知道肿瘤的序列，我们能否在无细胞DNA中寻找这种特殊的肿瘤？是的。

是的，是的。总的来说，观察血液中的肿瘤DNA有三种应用。一种是筛查，我们稍后会讨论，即那些没有癌症或99%没有癌症的人，试图找到患有癌症但不知道的人，以及浸润性癌症。这种应用我们称之为治疗选择，即你是一位癌症患者，试图决定哪种靶向治疗最适合你。然后你提到的另一个是第三个应用，我们称之为

通常是微小残留疾病，或观察反应，即你正在接受治疗，你想知道，血液中的肿瘤DNA量是否无法检测到？以及它的速度，它是否正在变化？因为正如你提到的，这可以告诉你，你的治疗是否有效？肿瘤DNA负担或负荷正在下降。它是否无法检测到，你可能已经治愈了，你的体内不再有肿瘤DNA的来源？

或者它即使在旨在治愈的治疗后仍然存在，而这种肿瘤DNA的存在基本上意味着，我们现在很遗憾地意识到，你并没有被治愈，或者患者并没有被治愈，因为某个地方仍然存在一些组织病灶，这些组织病灶仍然带有这些突变，因此是肿瘤，即使它无法通过任何其他方式检测到。那么，在什么时间点……

我们将要讨论的这家名为Grail的公司，它在何时成立，以及作为Illumina之外的一个独立实体，它的动力和动机是什么？因此，一些技术和科学上的见解与通常在这种情况下的一些真正古老的企业家和投资者一起汇集在一起。

这种无创活检技术在晚期癌症中的应用，很明显可以从血液中对肿瘤进行测序，而且很明显这实际上是肿瘤DNA，这对癌症患者很有用。所以我们知道有肿瘤DNA。我们知道可以做到。但是该领域不知道的是，你是否可以在早期癌症、局限性癌症（很小）中看到这一点？这方面的数据不多，但存在这种可能性。

在另一种完全不同的应用（称为无创产前检测）中，也有一组非常有趣的偶然发现。同样，完全不同的应用，但它主要是由香港的一位科学家Dennis Lowe发现的，你可以在血液中看到胎儿DNA，更具体地说是在血液中看到胎盘DNA。它也是无细胞DNA。

他实际上与斯坦福大学的教授之一Steve Quake一起开发了一种根据这种胎盘或胎儿DNA来寻找血液中三体性的技术。这被称为无创产前检测。所以你要做的是对孕妇的无细胞DNA片段进行测序。你观察DNA。如果你看到额外的DNA，例如，在

21号染色体的位点，那么这表明女性体内有一些组织，可能是胎儿或胎盘，正在释放外骨骼

额外的21号染色体。因此，这最终成为了一种检测妊娠早期三体性（21号、18号、13号染色体）的极其灵敏和特异的方法。它对后续版本的测试也有影响。在美国，它使羊膜穿刺术减少了约80%，因为该测试作为

筛查测试非常灵敏和特异，因此许多女性现在不必再进行羊膜穿刺术及其周围的风险。同样，这是无细胞DNA的完全不同的应用。但发生的事情是，在最初几百次测试的早期商业化过程中，率先进行这项测试的公司，其中一家是Illumina收购的一家名为Veronata的公司，开始在极少数情况下看到非常不寻常的DNA模式。

这不仅仅是21号、18号或13号染色体，而且通常被称为染色体碎裂，即染色体上有很多、很多异常。两位真正进行这项分析并真正引起Illumina和全世界关注的女性是Meredith Hawkes Miller，一位

这家Illumina拥有的公司Varanata的病理学家和实验室主任，以及另一位生物信息学科学家Darya Chudova。他们最终证明这些女性实际上患有癌症

她们是育龄期的年轻女性。她们最终生下了健康的婴儿，但她们患有浸润性癌症，并且通过这种无创产前检测在其无细胞DNA中被诊断出来。当她们开始向人们展示这些模式时，很明显它们显然是由癌症引起的。

如果你有很多染色体异常，这与生命或胎儿不相容。因此，当你看到这种全基因组染色体变化时，很明显我们偶然发现了这些女性的癌症。

让我们稍微谈谈这个，实际上，因为我想深入探讨一下。这太有趣了。所以让我们退一步。所以再次，每当你提到我们正在对无细胞DNA进行采样时，我们都应该记住。我们正在寻找这些微小的160个碱基对的片段，它们包裹在小的核小体周围。现在，让我们回到围绕21三体性的初始用例。

使用160个碱基对，是否足以识别任何一条染色体？据推测，你也在对母体血液进行采样，所以你知道母体染色体是什么样的，并且据推测，你将这两者并列作为你的对照。这是其中一部分吗？

不是这样的。所以它们都混合在一起。在孕妇和母体血液中，这是一个混合物。所以你有无细胞DNA。大多数无细胞DNA来自她自己的细胞和组织。然后你叠加了一些主要来自胎盘的无细胞DNA。所以你看到的是这种无细胞DNA的混合物。

然后你进行测序。有不同的方法可以做到这一点，但最常见的方法是鸟枪法测序，你对数百万个这些片段进行测序。每次你对一个片段进行测序时，你都会根据它的序列将其放置在染色体中。你的第一个片段，你说，嘿，当我把它与人类基因组草图进行比较时，这属于2号染色体。你对第三个片段进行测序，你说，嘿，这个序列看起来像14号染色体。你继续把它们放在染色体桶里。

如果你每个组织都有均匀的染色体分布，你知道，或者两条染色体，你所期望的是，这种分布将是平坦的，每个桶的水平大致相同。但是，在携带患有三体性胎儿的女性中，你会看到21号染色体桶中增加了50%。

你实际上看到的更多的是5%或10%。因为再次记住，90%可能是母体血液，对吧？所以所有这些都将是均匀的。但在10%的胎儿中，你将额外增加50%。所以总数可能额外增加5%或10%。但这却是一个巨大的信号，很容易检测到。

这难道不有趣吗？它只是让你了解数字有多大，如果5%的差异是图表之外的、不容置疑的意义上的增加。我想确保，再次，人们理解你刚才所说的，因为这非常重要。因为大多数无细胞DNA属于母亲，并且因为胎儿/胎盘无细胞DNA的数量微不足道，

即使根据定义，三体性意味着一条染色体增加了50%，你已经从两份拷贝变成了三份拷贝。在完全稀释的样本中，这可能只转化为百分之几，但这足以让你测试的大量数字产生决定性的统计学意义上的差异，从而触发阳性测试。是的。说得很好。是的。

Alex，我想回到这个故事，因为这显然是故事的开始，但让我们回到另外几件家务事。刚才，我们谈到了肿瘤背景下的无细胞DNA。有人可能会听到我们说，等等，伙计们，你们刚才说大多数无细胞DNA来自这位母亲。99.9%的情况下，她没有癌症。这些无细胞DNA来自哪里？当细胞被破坏时，无论是

通过坏死还是凋亡。有很多细胞更新，对吧，复制细胞，特别是上皮细胞、血细胞等等。随着自然生物化学的破坏，细胞核中的一些DNA最终会进入循环，再次，它们包裹在这些核小体周围。所以它本质上是细胞死亡，细胞更新是它的来源。并且由于，再次，在任何时候，

数百万个细胞正在死亡和更新。血液中总有一些基础水平的无细胞DNA。而且，我不知道你是否做过计算。如果没有，我不想让你当场难堪。但是你对我们现在坐在这里时，你的身体或我的身体里有多少碱基对的无细胞DNA在漂浮有一个大概的猜测吗？

我可以说的是，如果你取一个10毫升的血液试管，这是这些测试使用的很多东西，你移除了所有细胞DNA，记住某些细胞中的DNA数量巨大……当然，白细胞、红细胞等等。去除所有这些。是的。数量巨大。

你可能在一个10毫升的血液试管中大约有几千个细胞的无细胞DNA，这并不多。只是为了确保我理解你，你说的是几千个细胞。每个细胞将是30亿个碱基对。是的，是的。

哇。一方面，这听起来不多，因为有数十亿个细胞。另一方面，它听起来仍然很多。这仍然是一个巨大的计算问题。当我们进入早期检测时，它就会变得具有挑战性，对吧？如果你考虑一下，对于基因组中的任何位置，你只有几千个表示，因为只有几千个细胞。所以这开始限制你检测的能力

百万分之一或十万分之一发生的事件。所以Alex，你还记得这些孕妇的偶然病例吗？而且，我想我们应该回顾一下并重新解释一下，因为它是一个如此重要和深刻的发现。在筛查三体性的过程中，有少数几个病例，

他们发现的不是母亲有额外的染色体可以归因于胎儿，而是她有许多基因的重大突变，这些突变

也可能以相对较小的数量出现，因为它们并不存在于她的所有细胞中。对吗？是的。所以你可能会期望在大多数情况下出现平坦的模式，对吧？或者当胎儿患有三体性时，你会看到这些非常著名的积累，主要是在21号染色体上，但偶尔也会在18号或13号染色体上。

相反，你所看到的是在许多染色体上增加和减少单体性和三体性，这即使作为胎儿也与生命不相容。但有一种生物学现象，你会看到染色体的巨大变化。这通常发生在癌症的情况下。你还记得那些年轻女性的癌症最终是什么吗？我的意思是，我假设是乳腺癌，但它们可能是肺癌，任何东西？

是的。所以Meredith和Daria，她们在JAMA上发表了一篇论文，对于任何感兴趣的人来说，这篇论文详细介绍了这十几个病例以及每个病例中发生的事情。这是一个混合体。我认为有一个神经内分泌、子宫、一些胃肠道癌症。这是一个各种不同事物的混合体。那是什么时候？我们将尝试找到这篇论文，并在节目说明中链接到它。那是2015年在JAMA上发表的。明白了。

这似乎令人难以置信。当然，人们不知道反事实。人们不知道有多少女性患有癌症但没有被发现。但是，可以安全地假设这10位被确定的女性都患有癌症吗？

是的。是的。所以没有假阳性。我们只是不知道有多少假阴性。对。是的。这是促成使用无细胞DNA进行癌症筛查可能性的证据之一，即这些偶然发现。正如我前面提到的，我们已经知道，是的，肿瘤确实会将无细胞DNA送入血液，但这有力地证明了

在实际临床实践中，你可以在无症状个体中发现未诊断的癌症，并且它具有高度特异性，这意味着当使用这种方法发现它时，它几乎，好吧，我认为在最初的那些病例中，每个病例都是，但几乎每个病例都被证明患有癌症。

现在，根据你的观点，这不是一项筛查测试，因为即使在相对健康和育龄妇女中，在10万人的群体中，你预计一年左右会有10倍或50倍的癌症数量。所以很明显你错过了大多数癌症。所以这不是一项筛查测试。对。但这只是一个概念验证。

是的。一个意外的概念验证，它确实引起了Illumina的注意，我认为在该领域，我们的注意力是，嘿，使用无细胞DNA和基于测序的方法，可能可以开发出一种针对癌症的非常特异的测试。那么，系统地解决这个问题的下一步是什么？

我和Illumina的其他一些人，以及我提到的两位科学家Meredith和Daria，以及当时的首席医疗官Rick Klausner，他长期从事癌症研究和癌症筛查工作。他是比尔·克林顿执政期间的前国家癌症研究所主任。所以这是美国国立卫生研究院在比尔·克林顿领导下的国家癌症研究所。他当时是Illumina的首席医疗官。我们开始越来越多地谈论

基于这种无细胞DNA技术，开发或确定一种通用血液癌症检测的可行性需要什么？从最基本的原则出发，我确实提出了一个问题，为什么在50年的时间里，许多公司和大量的学术研究都没有

没有人开发出一种广泛使用的血液癌症检测方法，不仅仅是许多癌症，甚至是任何癌症。真正唯一的例子是PSA。而且，那里的假阳性率如此之高，以至于它的益处与危害多次受到质疑。这就是为什么它不再具有USPS TF A级或B级的原因。

根本原因是特异性。有很多东西很敏感，这意味着在癌症中积累的蛋白质、生物化学物质、代谢物会增加。但问题是它们在许多良性疾病中也会增加。所以，你知道，一个大的良性前列腺会排出大量的PSA，几乎所有其他蛋白质或代谢物都会这样做。

迄今为止的生物标志物都非常敏感，但假阳性率都在5%或10%左右。因此，如果你想象对整个人群进行筛查，你不能让十分之一的人接受潜在癌症的检查。因此，需要解决的关键技术问题是，好吧，你如何才能获得假阳性率为1%或

半百分点的假阳性率，因为如果你想对相对健康的无症状人群进行广泛的癌症筛查，这就是你需要的。这就是为什么

我们认为使用无细胞DNA可能是可能的，因为肿瘤DNA可能比蛋白质和其他良性疾病中常见的物质更特异。所以这就是相信的原因。我们不知道的事情是，好吧，早期肿瘤会排出多少DNA？如果它不排出任何DNA，那么就没有什么可以检测到的。另一个是异质性。癌症不像传染病或……

有一个非常具有识别性的抗原或序列。每个肿瘤都是独一无二的，对吧？所以即使是两种都是相同组织学亚型的肺癌，

它们可能很少或根本没有共享突变。因此，你可以有两个鳞状细胞肺癌，老实说，它们没有任何共享突变。所以现在你需要观察数百个、数千个甚至数百万个医生才能看到足够的潜在变化。这就是NGS非常适合的地方，即你如何克服需要寻找未定义疾病的异质性？我不能告诉你这三个突变

是你需要为这种癌症找到的突变。每种癌症都有大量不同的突变。然后这让我们开始思考，好吧，除了对许多位置进行测序和进行非常深入的测序以及使用无细胞DNA外，我们还需要使用人工智能或机器学习，因为我们必须学习这些复杂的关联和模式，没有一个人能够管理数千个

不同的突变谱，并试图找到共同的信号等等。一年内出现的情况是，看，这可能是可能的，但我们将不得不招募非常庞大的人群来研究和寻找信号并开发这项技术。然后，我们将需要非常大型的研究来进行干预，并证明它在临床上有效，即它实际上有效。我们将不得不使用NGS并对

整个基因组进行广泛测序。只有这样才有可能。因此，该公司当时决定，这是一个董事会层面的决定，最终，鉴于所需资金的数量，鉴于科学和技术风险，这更有意义，作为一个独立的公司。

鉴于你需要招聘的那种对这件事充满热情的人，将其作为一个独立的公司是有意义的。因此，当时的首席执行官Jay Flatley在2016年初宣布了该公司的成立，然后将其从Illuminon中剥离出来。我有幸成为它的联合创始人之一。

让我们回到2016年。你们现在正在开设新店。你们有这家新公司。它被称为Grail。你们已经从Illumina带走了一些像你这样的人，并且据推测，你们现在也在招聘。你们立即开始着手解决的头两三个问题是什么？当我编写启动研究和开发计划时，我的写作方式是，我们需要评估A，

无细胞DNA中的每个潜在特征，这意味着任何已知的在无细胞DNA中寻找癌症的方法，我们都需要评估。如果我们要这样做并招募这些队列和所有这些利他主义者，并且我们要花钱去做这件事，

我们不需要只关注一种方法或某人最喜欢的方法，或者他们认为可能有效的方法。我们需要查看每一个。所以这就是我们所做的。我们为突变开发了一种分析和软件，然后是一堆其他东西，染色体变化、片段大小的变化以及许多其他东西。我们说，看，我们将逐一测试每一个，我们将组合测试它们，我们将找出最好的方法。

Rick提出了一条我认为非常有帮助的座右铭，那就是我们将找出如何做到这一点，或者我们将证明这是不可能的。我认为这在思考如何进行这些初步实验方面非常有帮助。所以有很多构建这些分析，

我们需要大量的数据集来训练机器学习算法。所以我们有这项名为CCGA（循环无细胞基因组图谱）的研究，我们招募了15000名患有和未患有每种主要癌症类型的个体，在大多数情况下，有数百名。然后我们测试了所有这些不同的机器。

方法，我提到的那些方法，以及重要的是，基于甲基化的分析方法。我们进行了盲法研究来比较它们，看看任何一种方法是否都能检测到很大一部分癌症？任何一种方法是否有可能以高特异性做到这一点？因为如果我们要开发一种可以用于广泛人群的通用癌症检测方法，这就是我们需要做的。所以让我们回顾一下并谈谈其中的一些事情，因为这里有很多内容。所以你一开始就说，看，我们将

确保我们正在测量无细胞DNA的任何可测量特性，我们正在量化它，我们正在记录它。我们谈到了一些，对吧？所以片段长度，这似乎相对固定，但据推测，在足够大的样本量下，你会在那里看到一些变化。这重要吗？当然，实际的基因序列，这是你的看家本领，能够测量它。

你当然也提到了我们还没有讨论过的甲基化。所以我们应该解释一下这意味着什么。

除了片段长度、序列和甲基化之外，我还缺少哪些其他特性？还有其他几个。一个是染色体变化。正如我们在癌症中提到的那样，染色体的数量经常会发生变化。所以许多癌症，这很疯狂，它们通常会使染色体的数量加倍。所以你可以从23个变成……

加倍甚至三倍。但这些染色体并不正常。所以你通常会有染色体的臂或结构会发生重排。

因此，也有一种方法可以在游离 DNA 中观察到这一点。就像我们在无创产前检测中提到的那样，您可以查看每个染色体或染色体一部分的 DNA 量。因此，我们研究了所谓的染色体异常。我们还研究了游离 RNA。事实证明，循环中也有来自肿瘤的 RNA。Alex，它的稳定性如何？我原以为

RNA 不会像 DNA 那样非常稳定，DNA 当然是双链的，而且非常稳定。你如何捕获游离 RNA？

裸露的 RNA 并不稳定。但是，如果 RNA 与蛋白质结合，则会受到保护，其中一种类型称为有机体蛋白，如果 RNA 与其结合，则会受到保护。我认为这通常是正在转录过程中的信使 RNA，但在某种程度上，

在翻译发生之前，细胞会发生破坏，导致溶解或其他情况。你基本上只是得到了游离的 RNA，呃，

因为你碰巧在那个时候抓住了它，它是一个复制细胞或其他什么？或者它只是在翻译蛋白质？是的。或者在细胞凋亡过程中，它是在某种程序性细胞死亡过程中被消化或结合。相对于细胞死亡的数量而言，该数量较低。因此，据推测，大多数 RNA 都被破坏了，但仍有足够的 RNA 被保护并与蛋白质结合。无论它是否是细胞碎片或垃圾，或者是有意的……

这是一个不同的问题，但它确实存在。还存在囊泡结构，即 RNA 可以包含在其中的小膜泡。最常见的一种被称为外泌体，它们是循环中的这些小囊泡。因此，您可以通过多种不同的方式保存细胞外信使 RNA 和其他类型的 RNA。因此，我们也研究了这一点。博士

量化所有这些东西需要多长时间？据推测，我认为你暗示过这一点，但我们不仅仅是在关注这些事情中的任何一件。你也在问这个问题，这些因素的组合能否提高测试的保真度，对吗？

是的。因此，这个最初的研究阶段花了近三年时间，耗资数亿美元。我们必须为此类研究招募有史以来规模最大的队列，即我提到的 CCGA 研究。并且有不同的阶段。有一个发现阶段，然后是多个开发和验证阶段。我们必须制作世界上最好的检测方法来观察这些特征中的每一个，并且

然后我们必须处理所有这些样本，然后分析它们。我们以非常严格的方式进行了这项工作，最终测试都是盲法进行的，分析也是盲法进行的。因此，我们可以确保结果没有偏差。然后我们比较了所有这些，我们还比较了它们的组合，并且

我们使用复杂的机器学习方法来真正最大限度地利用每种类型的个体数据，无论它是否是突变、染色体变化还是甲基化。

你提到 CCGA 有 15,000 个样本。其中有多少样本是癌症样本，有多少是对照样本？它们的分布是什么样的？大约 60% 是癌症样本，40% 是对照样本。是的，40%。你暗示过这一点，但为了确保我理解，你显然首先从一个有偏差的集合开始，在这个集合中你知道发生了什么，然后你转向一个盲法无偏差的集合进行确认。这实际上是你所做的方法吗？

是的，是的。通常被称为训练集和测试集。是的。

Alex，当一切都结束时，当您首先识别出所有可测量和可知的事物时，请告诉我们出现了什么。对不起，在我们这样做之前，我一直让我们脱离甲基化。解释所有特征的甲基化。我认为我们还没有讨论过这一点。因此，DNA 甲基化是 DNA 的化学修饰。特别是在 ATCG 代码中的 C，C 代表胞嘧啶。所以这是一个特殊的受体。

DNA 中的核苷酸或碱基。哺乳动物生物学可以甲基化。这意味着它可以添加一个甲基，但甲基只是一个带有三个氢的单个碳原子，然后与胞嘧啶键合。这就是 DNA 甲基化。因此，说胞嘧啶被甲基化，意味着它具有该单个核苷酸

甲基与之键合。事实证明，人类基因组中大约有 2800 万个位置可以被甲基化。它通常发生在所谓的 CPG 位点，如果您沿着 DNA 的一条链前进，这并不是 DNA 的配对，而是一条链，G 紧随 C 之后。这就是 CPG 的含义。它是一个 C 与一个磷酸键连接到一个 G。

因此，在基因组中的这些位置，存在可以甲基化胞嘧啶并使其去甲基化的酶。同样，在人类基因组中总共 30 亿个碱基中，大约有 2800 万个这样的位点。这些化学修饰非常重要，因为它们会影响诸如基因表达之类的因素。

它是所谓的表观遗传学中更重要的类别之一，表观遗传学是指基因组或代码本身之外的变化。

如你所知，在人体的大多数细胞中，DNA 代码都是相同的。显然，细胞是截然不同的。因此，T 细胞与神经元非常不同。除了 T 细胞受体之外，所有基因都是相同的。代码是相同的。那么，为什么细胞不同呢？好吧，这就是表观遗传学。例如，基因的哪些部分被甲基化，或者哪些部分与阻止进入 DNA 的组蛋白相关联，这最终决定了哪些基因被转录。

哪些蛋白质被制造，以及为什么细胞会呈现出非常不同的形态和特性。甲基化是控制它的一个非常基本的代码。所以我称表观遗传学为基因组的软件。遗传密码有点像硬件，但你如何使用它，你何时使用哪些基因，什么组合，这才是真正的表观遗传学。

读取这些 CPG 位点上的甲基化序列的技术差异或区别是什么？与

与您简单测量碱基对序列的容易程度相比。因此，您可以测量 C、G、A、T、C、C、A、T、G 等。但在相同的读数中，您是否也获得了哪些 C 被甲基化，或者您是否进行了单独的分析？

有不同的技术可以做到这一点。对于游离 DNA，您通常需要对数十亿个或数百万个这些小片段进行非常精确的测序。它的方法是，这增加了化学的复杂性，您以一种编码甲基化状态的方式预处理 DNA

在 ATG 序列中，然后您只需使用只能看到 ATCG 的测序仪。但是，由于您已经编码了信息，因此您可以对其进行反卷积并推断哪些位点被甲基化。为了更具体一些，有些化学物质会例如使未甲基化的胞嘧啶脱氨基。

然后，该脱氨基胞嘧啶有效地转化为尿嘧啶，它是 RNA 中的第五个字母。然后，当您复制 DNA 并扩增它时，

在测序之前，它会作为 T 扩增，因为 U 在被 DNA 聚合酶复制时会变成 T。然后你最终会得到一个序列，你期望看到 C，但你看到的是 T。如果你在那里看到一个 T，那么你就知道，啊哈，这肯定是一个未甲基化的位点。它来自 U，而 U 是未甲基化的 C。太棒了。对。如果 C……

没有改变，那么你就说，那么那一定是一个被甲基化的位点。因为你会看到 G 与它们相反。哦，对不起。如果 C 被甲基化，你会看到相反的 G，因为你不会把它变成尿嘧啶。

对，对。是的，太棒了。这种技术被称为亚硫酸氢盐测序。还有其他方法可以做到这一点，但这是一种主要方法。好了。现在回到我几分钟前开始提出的问题，但后来意识到我们还没有讨论甲基化。因此，您可以使用少量血液做所有这些不同的事情。因为同样，你谈到 10 毫升甲基化。

从大的方面来看，这是一个非常少量的血液。那是两小管血液。很容易做到。据推测，这里存在一个优化问题，您在此处对它进行了最小-最大化处理，并意识到，好吧，如果我们可以提取一升血液，这将很容易做到，但这在临床上是不可能的。是的，引用 Theranos 的话来说，用指尖血来做这件事会很好，但你永远不会得到结果。

那么，你最终得到 10 毫升了吗？这只是一个优化问题，让你达到这个数量，这是我们可以提取的血液量，不会不合理，但仍然具有足够高的保真度，并且也许以另一种方式提问？如果你提取的话，你能做得越来越好吗？

八管血液而不是两管？是的。有两个考虑因素。一个是实际的考虑因素。你需要一个格式，你的标准静脉穿刺和标准体积在一定程度上低于可能危及某人的体积。这是一个很大的实际问题。但事实证明，最终限制测试灵敏度的是背景生物学。因此，对于广泛的癌症筛查，更多的血液实际上并不能帮助你。

现在，还有其他应用用于监测或治疗选择，您正在寻找一个非常特殊的靶标，患有癌症的人，您知道是什么类型的癌症，在那里您可以提高灵敏度。但只是为了进行癌症筛查，你通常不受血液量的限制。那么，甲基化最终是否成为提供非常非常高特异性的最具预测性的因素？或者它是……

这些可测量因素的某种组合？是的，这非常出乎意料。我会说，在开始时，大多数人认为突变将是最灵敏的方法。我们中的一些人认为染色体变化将是最灵敏的。我会说甲基化信号有点像黑马。我不得不几次努力才能让它继续进行。

但同样，我们真的去除了，让数据告诉我们该做什么。它不是来自其他实验的偏差。让我们以一种全面而严格的方式来做这件事。最终，甲基化的表现最好。因此，它最灵敏。因此，它检测到了最多的癌症。重要的是，它非常特异。它实际上具有潜力，最终确实达到了低于 1%。

假阳性率。然后甲基化具有另一个非常独特的特征，那就是它可以预测癌症的类型。我们现在称之为癌症起源部位是什么？它起源于哪个器官或组织？

有趣的是，将它们全部加在一起并没有改善甲基化。我现在可以解释为什么事后看来是这样。你可能会认为，嘿，更多类型的信息和信号更好，但实际上并非如此。因此，我们最终得到一个明确的结果，即游离 DNA 中的甲基化模式是最有用的，并且添加其他信息不会提高性能。

你认为这是为什么？因为这有点违反直觉。我可能可以想到一些例子，你可以通过添加更多信息来降低信号。但我很好奇，你是否有关于为什么只有一个指标最终成为最佳指标，以及任何附加信息只会稀释信号的生物学目的论解释。

这归结于这是一个很好的工程原理，对吧？如果你想改进你的预测，你需要一个额外的信号来携带信息并且与你的初始信号无关。如果它完全相关，那么它实际上并没有添加任何东西。让我们举个例子。假设你在高速公路立交桥上，你正在开发福特的图像识别。

你说，好吧，我最初要使用的是一种算法。它将寻找一个带有字母 F-O-R-D 的蓝色椭圆形。这很好。现在假设你说，好吧，我知道有些福特汽车的侧面也有数字 150，F-150。所以我将添加它，对吧？如果你考虑一下，如果你的基于蓝色椭圆形的算法已经相当不错，那么

添加 150 不会有所帮助，因为无论何时出现 150，蓝色椭圆形也总是存在。

现在，如果蓝色椭圆形并不总是存在，或者有些福特汽车没有蓝色椭圆形，那么其他一些信号可能会有所帮助。因此，最终发生的情况是，甲基化信号在癌症中更为普遍，并且更为扭曲，以至于其他所有信号实际上都没有添加任何东西，因为无论何时你可以看到其他信号中的一个，你也可以看到更多异常的甲基化片段。

是的，这真是太棒了。我想我还想再次回到过去，确保人们理解你们为此带来的使命宣言，那就是高特异性是必须的。因此，人们已经听到我在播客上这样做过，但以防万一有些人没有听到这个例子或忘记了它，我有时喜欢使用机场中的金属探测器类比来帮助解释灵敏度和特异性。

因此，灵敏度是金属探测器检测不应通过的金属的能力。让我们明确一点，机场的人们并不关心你的手机、笔记本电脑、手表或皮带是否通过。他们关心的是你是否携带枪支或爆炸物。这就是我们安装金属探测器或刀具或类似物品的原因。这就是金属探测器存在的原因。

它必须足够灵敏，以至于任何携带这些东西的人都不能通过。另一方面，特异性会说，因此，如果你正在优化灵敏度，你会让它检测到任何通过该东西的金属。根据定义，你会阻止很多人。你会阻止每个人走过。如果他们的拉链是用金属制成的，你会阻止他们。

或者假肢、大皮带或靴子等。你的眼镜上有一点金属，你会被阻止。因此，你必须以某种方式调整它，以便你的测试也具有一定的特异性，即我不能只阻止所有人。在理想情况下，我希望每个没有携带那些真正糟糕的东西的人都能够通过。我们通过一定数量的金属来定义坏东西。

因此，你的特异性是说，我不希望我的测试在好人身上被触发。好吧。我希望我的测试在坏人身上被触发。

现在，当你们设计这样的测试时，例如 Grail 测试，我想我应该回顾一下，任何曾经穿着完全相同的衣服穿过两个不同机场的人都会意识到，有时它会触发，有时它不会。你意识到并非每台机器的设置都相同。这是因为机场、TSA 的工作人员会提高或降低灵敏度，这也会改变特异性。

当你们建立这种检测方法时，你们是否有能力有意识地提高和降低灵敏度和特异性？虽然我理解你们的任务是一个非常高特异性的测试，但如果有的化，该系统的控制或操作在哪里？

所以有一个阈值。这很复杂。从概念上讲，算法内部有一个阈值，对吧？因此，您可以想象，在您拥有所有这些不同类型的甲基化变化的综合图谱之后，这些变化可能发生在数百个每种癌症类型的片段中，然后您将其与癌症之外可能发生的甲基化变化进行比较，我们还没有讨论过这一点，这非常重要。

因此，大多数甲基化模式在个体之间的相似细胞类型中是相当相似的。但确实会发生随着年龄、种族或环境暴露等而发生的变化。你想要的是这两个群体完全不同。但事实证明，确实有一些重叠。

因此，在癌症中出现的片段也可能在癌症之外出现。算法在一个非常复杂的态空间中试图分离这些群体。无论你是否会

将某物称为潜在癌症并说检测到癌症信号，这取决于算法是否认为它与该癌症组相关，还是与非癌症组相关？但同样，这些之间有一些重叠。因此，你设置重叠的位置，就像在没有癌症的个体之间，但由于某种原因，异常水平的片段有点像癌症

这将决定你的特异性。有一个可以旋转的旋钮，你可以增加严格性，减少假阳性，但随后你将开始错过一些真阳性。现在，甲基化如此之好的原因是，这些群体相当分离，比世界上以前见过的任何东西都好，这就是为什么你可以获得高特异性和相当好的灵敏度的原因。但是的，确实有一些重叠。

这意味着你必须做出权衡并进行调整。

在公司内部，是否围绕权衡进行了具体的讨论，即假阳性比假阴性更好？让我们举一个你之前提到的例子，对吧？因此，前列腺特异性抗原有点像它的镜像，对吧？这是一个高度、高度灵敏的测试，特异性非常低。它显然是一种蛋白质，因此它是一种完全不同类型的检测方法，对吧？当然，这是一个更粗略的测试。但其想法是，理论上，当然，我可以……

给你很多例子，患有前列腺癌的人的前列腺特异性抗原会很高。因此，你不会错过患有癌症的人。但正如你之前指出的那样，

你会抓住很多没有患癌症的人。正因为如此，正如你所说，现在不再正式推荐使用前列腺特异性抗原筛查。它现在已经被降级为只是与你的医生谈谈它。当然，其想法是，看，有很多男性在升高的前列腺特异性抗原的基础上进行了不必要的前列腺活检，而这实际上应该归因于他们的良性前列腺增生或

前列腺炎或其他什么。因此，尽管我们今天有更好的方法来筛查前列腺癌，但这项测试高度倾向于永不错过癌症。在其当前格式下，在低患病率人群中，这实际上是为其设计的人群，对吧？这是作为一种筛查工具设计的。它似乎比阳性预测值具有更好的阴性预测值，对吗？

它在两者中都相当高，因为阴性预测值也与患病率有关。我们只给出一些数字，对吧？因此，在 CCGA 研究中，但在名为 Pathfinder 的干预性研究中，阳性预测值约为 40%。这是所有阶段吗？是的。所以这是所有癌症，所有阶段，对吧？

这是一项人群研究。因此，它是该群体中出现的任何自然癌症和阶段。所以大约有 6500 个人。Alex，你还记得在那个人群中的患病率是多少吗？

这是一个低风险人群吗？是的。它混合了略微升高的风险人群和平均风险人群。就风险而言，我认为你会欣赏这一点，我认为 50 岁以上的人都是高风险人群。这就是大多数这些研究发生的地方，对吧？所以，我的意思是，年龄是你患癌症的最大风险因素。50 岁以上的人群患癌风险增加了约 10 倍。

相对于 50 岁以下的人群而言。55 至 65 岁是癌症成为头号死因的十年。

我会说在发达国家，我的意思是，这实际上正在增加，对吧？我的意思是，我们在代谢性疾病和心血管疾病方面取得了如此令人难以置信的进展。在发达国家，癌症预计将超过心血管疾病成为头号杀手。无论如何，老年人群的患病率，我不会称之为低风险。我会称他们为该年龄组的平均风险，对于整个人群来说仍然相对较高。但这是一个混合患病率，略低于 1%。

其中一些研究确实存在健康志愿者偏差。在 6500 人的队列中，患病率为 1%，这相当低，阳性预测值为 40%。

是的，没错。那么所有阶段的灵敏度是多少？如果我的电子表格在我面前，很容易计算出来，但它必须是 60% 或更高。灵敏度和特异性必须接近，超过 99%，对吧？这些是粗略的数字。是的，没错。那里的一些重要统计数据，对吧？因此，在研究期间显现的癌症中，大约有一半是由

通过测试检测到的。该测试实际上使干预性研究中检测到的癌症数量比仅通过标准护理筛查检测到的癌症数量增加了一倍。干预性研究，Pathfinder 研究，受试者根据指南接受标准护理筛查。因此，Grail Galleri 测试检测到的许多癌症也由标准护理检测到，这是你所期望的。但随着 Galleri 测试的加入，发现的癌症总数大约增加了一倍。这主要是没有筛查测试的癌症。但回到阳性预测值，只是

大多数筛查测试的阳性预测值都是个位数。你可能比我更有经验，但很多次，一位女性同事、朋友或某人的妻子打电话说，你知道，我做了一次乳房 X 光检查。他们发现了一些东西。我必须进行后续检查，活检等等。实际上，20 次中有 19 次是假阳性。这是一个我们或好或坏地接受了巨大假阳性率的例子，加上

抓住一些癌症，对吧？这就是为什么围绕乳房 X 光检查存在相当多的争论。但同样，这是一种阳性预测值约为 4.5% 的情况。大多数最初检测呈阳性的人最终不会患癌症。

但仍然可能值得。现在我们谈论的是，我们正在接近一到两次阳性测试最终会导致可能可操作的癌症诊断。所以，我认为有时当人们听到 40% 时，他们会说，哎呀，这意味着仍然有相当一部分人会得到阳性测试，这意味着检测到癌症信号，最终却没有。但同样，对于筛查测试来说，这非常高产。

我认为另一种思考方法是回到机场类比。因此，这是一个金属探测器，它基本上是在说，看，我们愿意对没有刀具的人发出哔哔声，以确保每个携带刀具或枪支的人都能够被抓住。因此，阴性预测值让你对坏人有了洞察力。因此，40% 的阳性预测值意味着

意味着，让我们使数字更简单一些。假设阳性预测值为 25%。这意味着，对于你阻止的每四个人，只有一个是真正的坏人。想想在实际机场是什么样的。

一天中金属探测器响了多少次，一天中他们抓到坏人的次数是多少？答案是它可能一天响 10,000 次，而他们平均抓到零个坏人，所以这让你了解阳性预测值有多低，灵敏度有多高，特异性有多低，所以是的，我认为这是一个很好的看待方式，即

如果你正在筛查一个风险相对正常的群体，那么 20% 的阳性预测值是非常非常好的。我认为这也解释了责任的负担落在医生身上。

作为一个医生，我认为你必须能够在任何测试之前明确地与你的病人谈论这个问题。我认为病人需要理解，嘿，如果我在这里得到阳性测试，那可能不是真正的阳性。我必须具备承受这种情绪不适的能力，并且我必须愿意进行后续测试。

因为如果这个东西说，哦，你知道，Alex，看起来你患有肺癌。下一步是我将进行胸部 X 光检查，或者我将进行低剂量胸部 CT 检查。这不仅会带来一些风险，在这种情况下是辐射，尽管数量几乎微不足道。但我认为最重要的是，这是与之相关的情绪不适的风险。我认为老实说，当你以这种方式向病人呈现数据时，它会

他们真的理解了，他们真的可以为自己做出伟大的知情决定。顺便说一句，对于其中一些病人来说，这意味着谢谢，但不用了。我只是不想经历这个。这也很好。让我们谈谈在各种组织学和各个阶段出现的一些真正有趣的东西。我今天与你的同事进行了一些非常有趣的讨论。

我想为了完整地讲述这个故事，你不再是 Grail 公司的一部分了。也许只是解释一下，这样我们就可以回到 Grail 的事情，但为了让人们了解你的轨迹。我们应该这样做。是的。我在 Illumina 工作，然后我帮助创立了 Grail，并担任联合创始人，领导研发工作，并

和临床开发。实际上，我回到了Illumina担任首席技术官，负责公司所有的研发工作。真的，非常棒，有趣的工作。随后，Illumina收购了Grail，Illumina的全资子公司。那是大约三年前的事了。最近，我离开了Illumina，创建了一家新的公司，一家非常有趣的生物技术公司，我担任首席执行官。

不再积极参与这两家公司。我和我以前的所有同事关系都很好。很高兴看到他们的进步。我还应该说，我还是铝业的股东，只是为了充分披露。

是的，谢谢你。正如你所说，你有很多同事仍然在Grail工作，我认识他们。让我真正感兴趣的一件事是，同样，一些组织学差异和癌症的分期差异。因此，如果你查看开放数据，一些事情很突出。因此，有一些组织学，如果你将它们按分期放在一起，看起来不如其他组织学好。

例如，谈谈一下使用Gallery测试检测前列腺癌。

我认为你指的是，不同癌症的性能差异很大。因此，它们都具有高度特异性，因此假阳性率非常低，因为整个测试只有一个假阳性率，这可能值得稍后花一些时间讨论。但例如，对许多胃肠道癌症或某些肺癌组织学的敏感性是

该测试非常擅长检测早期局灶性癌症，尤其是在前列腺癌和激素受体阳性乳腺癌中。对一期癌症的检测率较低。但这涉及到一个非常重要的问题，那就是你想要检测什么？所以你想检测今天被称为癌症的所有东西吗？或者你想要检测的是会生长并最终造成伤害的癌症。

因此，一般癌症筛查的奇怪之处在于既有过度诊断也有漏诊。大多数小的乳腺癌、大多数导管内癌，甚至大多数小的前列腺癌都不会杀死患者或造成发病率，但有一小部分会。因此，对于那些，我们有

我决定再次进行权衡，我们将选择切除东西并进行治疗，以确保去除较小百分比，即使我们正在去除大量其他所谓的癌症，这些癌症不太可能发展成任何危险的东西。另一方面，70%死于癌症的人死于未筛查的癌症。所以有很多漏诊，对吧？

你应该记住，最终死于癌症的人中，有70%的人死于在进行类似Grail的Gallery测试之前没有确立筛查的癌症。所以我们有这种奇怪的混合，有很多癌症我们知道我们过度诊断了，但我们这样做是为了一个合理的权衡。然后，还有大量的癌症死亡发生，而基本上没有诊断。

但回到那些漏诊的病例，它回到了在你的血液中存在肿瘤DNA意味着什么？因此，测量和检测血液中肿瘤DNA的癌症是一种功能性指标。

要在你的血液中获得肿瘤DNA，你必须有足够的细胞，它们必须生长得足够快，死亡得足够快，并且能够接触到血液。这些是你需要的条件。现在，如果你有一个小的、包膜的、不生长的肿瘤，那么猜猜看？它不会在血液中含有DNA。因此，与解剖学的影像学检测不同，这实际上是一种功能性检测。你正在查询是否存在具有

质量、细胞活性和死亡以及进入血液以将其DNA显现到血液中的癌症。因此，它实际上是在根据癌症是否具有活性进行分层。现在，有趣的是，这种功能性检测与最终的

死亡率高度相关。Grail发布了一套非常好的数据，你可以查看Kaplan-Meier曲线。因此，在CCGA研究过程中，现在已经进行了，我不知道，五年以上，你可以说，好吧，

生存曲线是什么样的？如果你的测试结果呈阳性，你的癌症被检测到，而你的测试结果呈阴性，这意味着你的癌症没有被Grail测试检测到。两者之间存在很大差异。因此，基本上，如果你的癌症无法通过Grail测试检测到，那么你的预后非常好。

比患有该癌症的普通人群好得多。因此，这表明两件事。一是，A，这些癌症可能实际上并不危险，因为与它们相关的死亡率并不高。也许这也是为什么它们无法将它们的肿瘤DNA放入血液中的原因。另一个是，无论现有的标准护理是什么，它都运作良好。

现在，如果你查看Kaplan-Meier曲线中所有被检测到的癌症，它们都与大量的死亡率相关。因此，它显示的是，它是危险的癌症，是导致大多数死亡率的癌症，这些癌症是该测试正在检测的癌症。这种生物学原理非常有意义，那就是，好吧，一个快速生长的肿瘤可以将其DNA带入血液，那么它可能也是一个危险的肿瘤，它会变得具有侵袭性并

扩散。因此，它再次是一种功能性检测。因此，如果你的测试被这些测试之一检测到，例如Gallery测试，它说明了关于肿瘤的一些非常深刻的事情，那就是它足够活跃，可以将其信号带入血液。如果未经治疗，它很可能最终与发病率和潜在的死亡率相关。我认为这是一个悬而未决的问题

这些无法检测到的肿瘤以及癌症，我们知道有很多惰性疾病。这到底意味着什么？该测试对此的敏感性较低。是的，我会说，当我浏览这些数据并浏览每个组织学的分期时。

我大约在18个月前做了这个练习。最让我印象深刻的是敏感性和特异性

差异，或者说，我应该说三阴性乳腺癌和激素阳性乳腺癌之间的敏感性差异。你提到了这一点，但我希望重申这一点，因为我认为在同一“疾病”乳腺癌中，我们清楚地知道存在三种疾病。有一种是雌激素阳性，有一种是HER2阳性，有一种是三阴性。

这些是三种完全无关癌症的决定性特征。

除了它们都起源于同一个乳腺这一事实外。但这几乎是相似之处的终点。它们的治疗方法不同，预后也不同。为了举两个最极端的例子，你带一个患有三阳性乳腺癌的女性，即雌激素受体阳性、孕激素受体阳性、HER2阳性。你带一个没有这些受体阳性的女性。Gallery测试的性能差异

在一期和二期，所以这些癌症甚至还没有扩散到淋巴结

激素阳性的一期和二期的敏感性约为20%，而三阴性的一期和二期的敏感性为75%。因此，这强调了你的观点，即三阳性癌症是一种非常非常糟糕的癌症。在一期和二期，你检测到75%的敏感性预示着非常糟糕的预后。

现在，我认为这里真正重要的问题，我相信这个问题正在被问到，是这种筛查能力是否会导致更好的结果？因此，我将陈述我的偏见，因为我认为陈述你的偏见很重要。我已经公开多次说过，但我还会再说一遍。

我的偏见是，是的，会的。我的偏见是早期检测会导致早期治疗。即使治疗与晚期癌症中使用的治疗相同，由于肿瘤负荷率较低，结果也会更好。顺便说一句，我想指出两种最常见的癌症。

作为这方面的例子，即乳腺癌和结直肠癌，在辅助治疗环境中与转移性环境中的治疗几乎没有区别，但结果却大相径庭。换句话说，当你带一个患有乳腺癌或结直肠癌的患者，你进行手术切除，他们处于三期或更低期，你给他们辅助治疗，他们的生存期要长得多

比那些接受切除但患有转移性疾病并接受相同辅助治疗的患者长得多。甚至根本不相上下。因此，这就是我争论的原因，我们越早知道自己患有癌症，我们越早开始治疗，我们就越好。但怀疑论者会反驳我说，彼得，

Grail测试唯一要做的事情就是告诉更多人坏消息。因此，我们将承认人们将获得更好、更相关的诊断，我们不会提醒他们患有不相关的癌症并过度治疗他们，我们将提醒他们患有阴性或更严重的癌症，但这不会转化为生存率的差异。所以

你对此有何看法，这个问题如何才能得到明确的解答？这是一个非常重要的问题，随着时间的推移，它将得到明确的解答。因此，我们应该讨论Grail的一些研究以及他们是如何进行的。正如你所说，统计数据非常深刻。因此，大多数实体瘤，如果疾病是局灶性的，没有扩散到另一个器官，五年生存率为70%到80%。

转移性四期疾病少于20%。分期诊断与五年生存率之间的这种相关性是天壤之别。显然，每个人都希望自己和他们的亲人，大多数人都在局灶性疾病类别中。现在，有一个学术问题，就像你说的那样，好吧，这是真的。但这是否真的证明，如果你通过这种方法而不是

今天发生的所有各种方法偶然发现处于该局灶性疾病的人，你将获得相同的结果。当然，我想你可以提出一些非常理论上的可能性，即不知何故不会，

但这似乎不太可能。我认为这涉及到一个根本性的问题，那就是，我们要等待几十年才能看到这一点吗？同时放弃这种可能性，这可能是可能的，即尽早发现这些癌症并尽早干预会改变结果。我完全赞成。

我认为每个人都会随着时间的推移进行更大规模和更确定的研究。但是，我们永远不会进行这项研究的想法，或者只是采取一种虚无主义的观点，即在完成这项研究之前，我们不会尽早发现癌症并进行干预。我认为这样做是不合理的，尤其是在假阳性率较低的情况下。我认为还有其他几种方法可以解决这个问题，那就是如果你的说法是真的，我遇到过一些人并被他们称为。Grail测试发现了阳性。

我可以想到一位在测试中发现卵巢癌的前同事。你认为当她去看她的妇科医生并说，看，

测试说我可能患有卵巢癌，他们做了超声波检查并发现了一些东西。妇科医生说，你知道吗？由于这是通过一种新方法发现的，让我们不要干预。存在恶性肿瘤。它是卵巢癌。我们知道自然史是什么，但我们不会干预。类似地，对于卵巢癌、胰腺癌、头颈癌等病例也是如此。我不明白这种逻辑，因为今天，

人们确实会出现。这些疾病的早期版本并不常见，卵巢癌、胰腺癌、头颈癌等，我们治疗它们。那么，如果你可以通过这种方式找到它们，为什么不治疗它们呢？我只是不知道任何……

胃肠外科医生会说，好吧，你是幸运的人之一。我们在一期或二期发现了你的胰腺癌，但我们不会治疗它，因为几十年来没有确凿的证据表明死亡率不会更好。所以我明白了学术观点，Grail和其他公司正在投入巨资来增加数据。我们拥有这项技术，却要让大量癌症发展到晚期才进行治疗的想法是

我认为这不是潜在益处与证据负担的正确平衡。

那么，现在在欧洲进行前瞻性现实世界试验了吗？是的。让我们谈谈这个。英国国民保健署（NHS）已经在约14万人的群体中试行了GRAIL测试。因此，它涉及顺序测试，我认为至少两次测试，然后他们查看结果。这是一项干预性研究，结果会返回。

他们正在寻找一个非常有趣的终点。死亡率需要时间。我的意思是，有些癌症，我的意思是，最终要看看在不同阶段得到诊断以及干预是否会改变这一点，这可能需要一年的时间，在某些情况下需要二十年的时间。

但他们提出一个非常有趣的替代终点，即减少四期癌症。以下是逻辑。这很有道理，那就是，如果人们不再被诊断为四期癌症，并且说三期癌症大幅减少，那么最终减少死亡率岂不是合情合理？因此，如果你消除了癌症的晚期版本，这

杀死了大多数人，并且你知道你必须经历。大多数人不会死于二期癌症。他们被诊断为二期癌症。他们死了，因为事实证明它不是二期癌症，它扩散了。如果你进行一项研究，在几年内，当你筛查人们时，不再有，让我们举个极端的例子，四期癌症，那么你就改变了人群的分期，并且你正在消除晚期转移性癌症。

因此，再次，我认为，在我们等待结果的同时，我个人认为，发现癌症的潜在益处非常显著。现在对许多患者进行测试是有意义的。然后我认为这个减少四期癌症的终点。是的，这是一个巧妙的、巧妙的终点。

我知道，许多反对癌症筛查的人倾向于引用的一件事是，许多癌症筛查研究即使在癌症特异性死亡率降低的情况下，也没有发现全因死亡率的改善。所以，嘿，我们做了这项结肠镜检查研究，或者我们做了这项乳腺癌筛查研究，它确实降低了死亡率。

乳腺癌死亡人数，但它实际上并没有转化为全因死亡率的差异。我在之前的播客中解释过这一点，但对于那些没有听到的人来说，了解原因仍然值得。对我来说，这是一个非常非常，哦，我该如何委婉地说？这是一个对文献非常误导的观点，因为你没有意识到的是，这些研究从未针对全因死亡率进行过验证。

如果你将乳腺癌死亡率降低40%或30%，

这转化为全因死亡率的微不足道的降低，因为乳腺癌仍然只是50种癌症中的一种。即使它是一种相对普遍的癌症，在研究的时间段内，通常是五年到七年，实际上死于乳腺癌的女性人数与死于任何疾病的女性总数相比仍然相对较小。

我在之前的播客中讨论过，很难在误差范围内检测到这一点。因此，如果你真的想能够看到这如何转化为全因死亡率的降低，你需要大大增加这些研究的规模，即使你真正想要做的是检测癌症特异性死亡率的降低。我说这一切。

要说我认为NHS研究中有趣的一点是，它是一项泛筛查研究。据我所知，这是第一次。换句话说，它有可能检测多种癌症，因此你有很多射门机会。潜在地，这可以显示全因死亡率的降低，而不仅仅是癌症特异性死亡率的降低。我必须看到功效分析，但我不知道研究人员是否提前考虑到了这一点。你知道吗？

我的意思是，他们将长期跟踪这些患者。他们将能够获得死亡率数据。我不知道它是否针对全因死亡率进行了验证。我认为这不太可能，仅仅是因为你所说的原因，即数字会非常高。我的意思是，再次，如果你要验证它是否能在几年内减少四期癌症，这可能还不够。有趣。好吧，时间会证明一切。

Alex，如果我们还有几分钟时间，我想转向一个你和我最近经常谈论的话题。因此，作为披露，你提到你最近离开了Illumina。你创建了另一家公司。我作为投资者和顾问都参与了这家公司，这是一个非常令人着迷的话题。但是

我们经常谈论的一件事是回到表观基因组的作用。所以我认为你做得很好，解释了它并将其置于上下文中。因此，我们有这30亿个碱基对，结果发现，其中约2800万个碱基对在其C上也有一个甲基。

我会补充一些我们在播客中没有讨论的细节，但只是为了提出来。一般来说，当我们出生时，我们拥有某种最大集合。随着年龄的增长，我们往往会失去它们。随着人的年龄增长，这些甲基化位点的数量会减少。你显然最重要的是解释了它们的作用，我们相信它们最重要的作用是影响基因表达。

值得指出的是，衰老有很多标志。有很多事情被认为是在根本层面上的，它描述了为什么我和你今天看起来和运作方式与25年前我们见面时完全不同，那时我们还是一半人。我可以在那里做一个拉普拉斯傅里叶笑话，但我不会说。

我想问题是，Alex，你认为甲基化在衰老的生物学中扮演什么角色？

这是一个宏观问题，但是……是的，是的。你谈到了衰老的标志。作者是谁？我认为是Hanrahan大约10年前提出了衰老的标志。他最近做了一个演讲，谈到甲基化可能是衰老标志的标志。他指的是越来越多的数据表明，表观遗传变化是

对衰老最具描述性的，并且越来越与衰老事件有因果关系。

有很多数据表明，年龄相当但健康状况不同的人，例如吸烟者与非吸烟者、锻炼者与不锻炼者、肥胖者与非肥胖者，其甲基化模式可能大相径庭。还有一些数据比较了百岁老人与

非百岁老人。显然，这是一个复杂的分析，因为根据定义，年龄存在差异，但你可以了解不同的甲基化模式。显然，我们很久以前就确定，百岁老人并不是通过他们的行为获得百岁老人的身份。

看看查理·芒格和亨利·基辛格，这两位最近去世的人，年龄都差不多100岁，尽管没有任何证据表明他们做了任何照顾自己的事情。因此，显然他们的生物学和基因具有很强的保护作用。

正如你所说，有很多这样的标志。我认为最初的论文谈到了九个，而且这个数字有所增加。但我认为你的观点是，表观基因组位于顶部，并且它可能正在影响其他基因组。因此，当我们考虑线粒体功能障碍时，这……

没有人会否认我和你的线粒体功能障碍与25年前相比差远了。我们的营养感应途径、炎症，所有这些事情都在随着年龄的增长朝着错误的方向发展。你认为这些是如何与甲基化、表观基因组以及基因表达相关的？也许让我们将其简化为一种工程框架。如果我们采取

25年前我第一次见到你时彼得的表观基因组，对吧？并且我们知道对于每种细胞类型和每个细胞，在所有2800万个位置上的甲基化状态是什么。我们已经记录了这一点，我们拿到了你今天的表观基因组，其中大多数细胞已经偏离了这一点，我们可以将所有这些状态翻转回去。这就是我思考这个问题的方式，细胞不会消失，只是它们是否具有甲基会发生变化。

有些地方会获得它，有些地方会失去它。如果我们可以将所有这些都翻转回去，这是否会迫使细胞像25年前那样运作？表达基因，它控制这些基因的保真度，它们之间的相互作用，它是否会被重新编程回那个状态？

所以我认为这是一个非常具有挑衅性的假设。我们不能肯定地说，但越来越多的证据表明这可能是可能的。因此，对我来说，这是一个迫在眉睫的问题，那就是，现在我们有能力对其进行表征，我们知道它是什么样的，

在与青春相关的更高功能状态下，我们正在获得能够调节它并实际改变表观基因组的技术，而不是修饰蛋白质或基因表达，而是实际进入并重新甲基化和去甲基化某些位点，我们能否将事物重新编程回早期状态？如果它是控制所有其他事物的根源，那么你就会获得细胞和生物体所具有的所有其他特征。

这是一个非常令人兴奋的问题。因为如果答案是肯定的，或者即使是部分肯定的，那么它就为我们提供了一种非常具体的方法来解决这个问题。

因此，我们谈论标志，而标志是复杂且相互关联的。我喜欢表观基因组的地方在于我们可以读取它，并且我们正在获得直接修改它的能力。因此，它实际上是控制所有这些其他事物的最根本的层面。它再次为我们提供了，也许回到早期的讨论，一种非常直接的工程方法来解决这个问题。

让我们谈谈这是如何完成的。一年前，你参与了一项相当了不起的工作，最终发表在《自然》杂志上。如果我没记错的话，它对整个人类表观基因组进行了测序。因此，如果我们大约24年前进行了人类基因组计划，那么我们就有了表观基因组计划。你能谈谈这个，并解释一下技术上是如何完成的吗？

是的，在Grail Gallery测试的开发中，我们知道对于多癌症测试来说，一项关键能力将非常重要。因此，这与今天的多数癌症筛查非常不同，后者一次只进行一种癌症的筛查。因此，如果你有一个血液测试，它会告诉你存在癌症信号，

这个人应该接受癌症检查，你真的想知道癌症可能位于哪里，因为那是你应该开始检查的地方，并且你希望它非常准确，因此如果算法检测到癌症，而它实际上是头颈癌，你希望

该测试也表明它可能是头颈癌，然后进行内窥镜检查，而不必进行大量的全身成像或全身PET-CT等。因此，我们开发了一种称为癌症起源部位的东西。因此，今天的测试具有该功能。如果你检测到信号，它还会预测癌症的位置。它会给出前两个选择，前两个选择。在做到这一点方面，它的准确率约为90%。但它是如何工作的？

已经得到该结果的医生和患者将其描述为一种神奇的东西，它可以检测癌症并预测癌症。它基于甲基化模式。

因此，甲基化决定了细胞身份和细胞状态。因此，再次，DNA代码在你的细胞中或多或少是相同的，但甲基化模式却截然不同。当细胞复制时，为什么它会继续成为相同类型的细胞？当上皮细胞复制时，与T细胞或心肌细胞相同的DNA，但它不会变成这些细胞，它仍然是。这是因为甲基化模式，这确切的

2800万个甲基化状态也会被复制。因此，就像DNA有一种复制代码的方法一样。有一种酶会查看并将模式复制到下一个细胞。因此，这个确切的代码决定了，再次，它是大肠上皮细胞还是输卵管上皮细胞等等。因此，我们知道

在无细胞DNA中制作预测器唯一的方法是拥有所有不同甲基化模式的图谱。因此，与耶路撒冷大学的Yuval Dor合作，我们费力地从健康个体那里获得了手术残留物。他开发了分离大多数在癌症中发生转化的细胞的单个细胞类型的方案。然后我们获得了纯甲基化模式，我们对所有这些细胞类型的整个甲基组进行了测序，就像对整个基因组进行测序一样。我们在一年前将其发表为人类甲基组及其主要细胞类型的第一个图谱。因此，我们第一次可以说，嘿，这就是使你成为胰腺中产生胰岛素的β细胞的代码，而不是其他东西

有趣的是，人体中只有一个细胞的胰岛素启动子没有甲基化。那就是β细胞。其他每个细胞，该启动子都被大量甲基化，因为它不应该产生胰岛素。

当你有无细胞DNA并查看甲基化模式时，正是这些类型的信号使算法能够预测，嘿，这不仅仅是看起来像癌症的甲基化信号。模式以及甲基化的内容和未甲基化的内容看起来像结直肠组织。

或结直肠癌。这就是算法的工作方式。因此，这个图谱再次是诊断学的一个真正突破，它使癌症起源部位变得有用。它也用于许多MRD或那些癌症监测测试，因为它非常灵敏。

但这同时也带来了一种有趣的可能性，那就是，如果你要开发治疗方法，或者你想说，使细胞恢复活力或修复那些发生变化或变得病理性的细胞，如果你比较良好状态下的甲基化模式与不良状态下的甲基化模式呢？这是否会告诉你需要修复的确切位置？然后，使用另一种可以翻转这些状态的技术，

这是否会将细胞逆转或恢复到原始状态或所需状态？所以，Alex，与基因组不同，基因组在衰老过程中不会迁移太多，我的意思是，它显然会积累突变，但如果人数足够多，我想我们可以很快地弄清楚这一点。你需要纵向分析来

某个个体，即在个体内部，来真正研究甲基化组？你需要能够说，在理想情况下，彼得的表观基因组在他一岁时，也就是出生时、一岁、两岁、三岁、四岁、五十岁时的样子，这样你不仅可以看到甲基化位点如何决定

组织特异性或分化，而且还可以看到它在正常衰老过程中是如何变化的？我认为很多都不是个体特异性的。

举个例子。所以在T细胞方面做了相当多的工作。如果你观察一下，比如说，耗尽的效应T细胞与幼稚记忆细胞相比，年轻人往往拥有更多这样的细胞，这给了他们更多的储备来做一些事情，比如对抗疾病，对抗癌症。有非常明显的甲基化变化。某些基因会被甲基化或去甲基化。这些变化似乎与

T细胞功能的变化。我相信这些代表了T细胞群体衰老时发生的根本性变化，最终你会拥有越来越多的T细胞，相对来说，这些T细胞是无用的。因此，如果你想使T细胞恢复活力，修复这些甲基化状态将对每个人都有益。现在，肯定有一些

一小部分甲基化位点可能正在漂移或降解，这些位点可能是特定于个体的。肯定有一些性别特异性位点。有一些种族特异性位点。但巨大的、巨大的变化似乎更多地发生在功能丧失、年龄的巨大变化上，这些变化可能在个体之间是共通的，或者在癌症的情况下，我们也发生了巨大的变化。

当你考虑这个领域时，一个术语出现了。如果人们一直在关注这一点，他们可能听说过所谓的山中因子。事实上，山中因子的发现获得了诺贝尔奖。你能解释一下它们是什么，以及它们在你刚才讨论的所有事情中扮演什么角色吗？

山中和他的同事们发现，如果你取完全分化的细胞，例如成纤维细胞，并将它们暴露于特定的四种转录因子的混合物中，细胞会恢复到类似干细胞的状态。这些被称为诱导多能干细胞。你让一个

一个分化的细胞，它是特定类型的成熟细胞。我认为他们的大部分工作都在成纤维细胞上。当细胞暴露于这些转录因子时，而这些转录因子是等级结构顶部的强大因子，它们会引发基因表达的大量变化。基因被打开，被关闭。然后最终，如果你让它继续下去，你最终会得到某种类型的干细胞。

之所以如此令人兴奋，是因为它提供了通过人工过程创造干细胞的可能性。如你所知，从胚胎或其他来源获取干细胞存在很多争议。这现在创造了一种方法，可以通过仅仅取个体的自身细胞并将其去分化回干细胞来创造干细胞并将其用于医学研究。

这在多大程度上改变了细胞本身的表型？换句话说，成纤维细胞具有一堆表型特性。干细胞的特性是什么，其中有多少是由甲基化变化驱动的？换句话说，我试图理解这些转录因子是如何在这个回归过程中（缺乏更好的词）发挥其影响的。

我们将细胞类型特异性特征称为体细胞特征，如T细胞受体。这是T细胞的特征，或树突或轴突是神经元的特征，或L型钙通道是心肌细胞的特征。所以这些都是非常细胞类型特异性的特征。因此，如果你打开这些山中因子，然后回到多能干细胞，你就会失去大部分这些特征。而“多能”这个词意味着成为任何事物的潜力。

至少在理论上是这样。所以你失去了大部分这些细胞类型特异性特征。因此，iPSC的使用是为了重新分化它们。这就是人们一直在尝试做的事情。它开启了这样做的能力，那就是你创造了这个干细胞，它现在有可能分化成其他东西。你给它不同的混合物，你试图让它成为神经元或

肌肉细胞，然后将其用于组织替代疗法。这方面有很多研究，很多团队都在尝试这样做。你还在问这与表观遗传学和甲基化状态之间有什么关系。这还没有得到很好的探索。这正是我和其他人兴奋去做的事情，因为这可能是你

你正在间接地用这些山中因子影响表观基因组。如果你将其转化为表观遗传编程协议，你就可以更好地控制它。因为山中因子面临的一个挑战是，如果你这样做的时间足够长，最终干细胞会变得更像癌细胞，并且变得不受控制地生长。

因此，再次，在了解这种细胞重编程和去分化方面取得了巨大的突破，但我们将其以实际方式用于组织和细胞替代的能力还不存在。我希望通过将其转化为表观遗传水平，它将更容易处理。

你提到这通常是用成纤维细胞完成的。我想实验已经做过，你将山中因子撒在心肌细胞、神经元等上面。它们不会完全退回到多能干细胞吗？我认为在不同程度上是这样。

我的意思是，如果你真的拥有多能干细胞，我想理论上来说，它来自哪里应该无关紧要，对吧？因为它具有多能性。所以对于发育因子来说，你的第一个神经元来自哪里？你有一个干细胞，然后在胚胎或胎儿中，有一些因子会诱导该干细胞变成这些其他类型的细胞和组织。所以

所以如果它确实是多能的，你应该能够做到这一点。现在，我认为你正在谈论一些不同的东西，这被称为部分重编程。他和追随他工作的人。他们正在尝试做的事情是，中途停止。那么，如果你取一个……

心肌细胞或T细胞已经失去了很多功能，你给它这些山中因子，但你阻止它真正失去其细胞身份之前。它是否会获得其更高功能的年轻状态的一些特性，而不会

失去它。所以有一些关于这方面的具有挑衅性的论文。有一位名叫胡安·卡洛斯·德尔·蒙特的人做了一些这方面的工作，并在小鼠身上取得了一些非常具有挑衅性的结果，这些结果是通过这些部分重编程协议进行的，并使

再次，这是小鼠，所以所有通常的警告都适用，但在功能和视力、认知方面取得了非常显著的改善，再次，在这些小鼠指标中。所以当然有兴趣尝试了解这如何能够转化为人类。再次，那里的担忧是，如果你不控制它，那么你可能会制造出本质上是肿瘤的东西。

所以，它开启了整个科学领域，即有可能进行这种戏剧性的去分化，如何在一个人类恢复活力的背景下真正利用它。我们还不知道如何做到这一点，但很多人都在努力弄清楚这一点。如果你必须猜测，带着一点乐观，但不是空中楼阁式的乐观，你认为这个领域十年后会是什么样子？

十年听起来很长一段时间。它听起来不再那么长了。几十年似乎比我记得的要快。所以十年后很快就会到来，但这仍然是该领域取得进展相当长的时间。你现实地认为在解决……

衰老表型方面会发生什么，通过某种衰老逆转方法，一些真正零保护的干预措施。所以我持乐观态度，我是一个信徒。我认为对于特定的器官、组织和细胞类型，将会有使它们恢复活力的治疗方法。很难想象十年后，人类的每一个细胞和组织都会完全恢复活力，但关节组织、视网膜、免疫细胞。我们正在学习如此多的关于与恢复活力和更健康状态相关的生物学知识。然后结合这一点，操纵它们的工具，这同样重要，你可以理解生物学是什么，但没有办法干预。进入并

在基因组水平上编辑它们，在表观遗传水平上编辑它们以改变状态，以及将它们传递到非常具体的组织和器官的递送技术也在取得巨大的进展。所以我肯定看到了十年后的世界，我们可能会有治疗骨关节炎的恢复活力疗法。

各种视网膜病变的恢复活力，我们可以使使你更能抵抗疾病，更能抵抗癌症的整个免疫细胞类别恢复活力。我认为我们将看到一些能够真正改善健康寿命的事情。

Alex，我认为这个领域比生物学中的任何其他领域都更让我兴奋，也就是说，我认为在我的职业生涯中，没有什么比这个问题更能抓住我的想象力了。也就是说，如果你可以将表观基因组恢复到

到早期存在的版本，你能把表型带回来吗？这可能是在组织水平上，正如你所说，我能让我的关节感觉像25年前那样吗？它能使我的T细胞像25年前那样发挥作用吗？很明显，人们可以由此推断并想到整个生物体。所以无论如何，我对你们和这个领域的其他人正在做的工作感到兴奋。

我很感激你抽出时间谈论一些不再是你主要项目的事情，但你可能对液态活检提供了与任何人一样好的历史。然后显然是对今天困扰你的问题的略微一瞥。太棒了。好吧，像往常一样，很高兴和你聊天，彼得。很高兴我有机会深入探讨这个问题。没有很多地方可以这样做。谢谢。谢谢，Alex。

感谢收听本周的《驱动》节目。对我来说，在不依赖付费广告的情况下提供所有这些内容非常重要。为此，我们的工作完全由我们的会员支持。作为回报，我们提供独家会员专属内容和福利，这些内容和福利超出了免费提供的范围。因此，如果你想将你对这个领域的了解提升到一个新的水平，我们的目标是确保会员获得的回报远远超过订阅价格。

高级会员资格包括多项福利。首先，全面的播客节目笔记，详细介绍我们在每一集中讨论的每一个主题、论文、人物和事物。街上的说法是，没有人的节目笔记能与我们的相媲美。

其次，每月问答或AMA剧集。这些剧集由对订户问题的详细回复组成，通常侧重于单个主题，旨在为我们会员特别感兴趣的主题提供大量清晰度和细节。当然，你还可以访问这些剧集的节目笔记。

第三，提供我们的高级时事通讯，该时事通讯由我们敬业的研究分析师团队编写。这份时事通讯涵盖了与长寿相关的广泛主题，并提供了比我们免费的每周时事通讯更详细的信息。第四，访问我们的私人播客订阅源，该订阅源为您提供访问每个剧集的权限，包括AMA，无需您现在正在收听的演讲以及您常规播客订阅源中的演讲。

第五，Qualies，我们制作的另一部会员专属播客，作为精彩片段集锦，精选了《驱动》以前剧集的最佳片段。这是一种在不必回顾并收听每一集的情况下赶上以前剧集的好方法。最后，还有其他沿途添加的福利。如果你想了解更多信息并访问这些会员专属福利，你可以访问peteratiamd.com/subscribe。

你也可以在YouTube、Instagram和Twitter上找到我，所有用户名都是PeterAttiaMD。你也可以在Apple Podcasts或你使用的任何播客播放器上给我们留下评论。本播客仅供一般信息目的，不构成医疗、护理或其他专业医疗服务的实践，包括提供医疗建议。不会形成医患关系。

使用本信息和与本播客链接的资料的风险由用户自行承担。本播客中的内容并非旨在替代专业的医疗建议、诊断或治疗。用户不应忽视或延迟获得任何医疗状况的医疗建议，他们应寻求其医疗专业人员的帮助以应对任何此类状况。

最后，我非常重视所有利益冲突。对于我的所有披露以及我投资或咨询的公司，请访问peteratiamd.com/about，我在那里保留所有披露的最新和活跃列表。

#290 ‒ Liquid biopsies for early cancer detection, the role of epigenetics in aging, and the future of aging research | Alex Aravanis, M.D., Ph.D. 02:05:32 Share

The Peter Attia Drive

Deep Dive

Shownotes Transcript

#290 ‒ Liquid biopsies for early cancer detection, the role of epigenetics in aging, and the future of aging research | Alex Aravanis, M.D., Ph.D.