We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Mastering Medical Statistics: Elevate Your Clinical Decision Making

Mastering Medical Statistics: Elevate Your Clinical Decision Making

2025/1/15
logo of podcast Aussie Med Ed- Australian Medical Education

Aussie Med Ed- Australian Medical Education

AI Deep Dive AI Chapters Transcript
People
A
Adam Badenoch
G
Gavin Nimon
Topics
Gavin Nimon: 我认为医学统计在现代医疗保健中起着至关重要的作用。它是循证医学的基础,使我们能够做出明智的决定,无论是选择最佳治疗方案、评估干预措施的有效性,还是了解患者的风险和益处。在今天的AussieMedEd节目中,我们将探讨医学统计的世界,研究它如何影响临床指南,帮助我们批判性地评估研究论文,并为日常临床实践提供信息。我们还将讨论其他研究设计、样本量的重要性以及如何在研究论文中发现潜在的偏差。 在节目的最后,我还想谈谈人工智能在数据分析中的作用,以及它可能带来的好处和陷阱。 Adam Badenoch: 我同意Gavin的观点。医学统计对于医疗专业人员至关重要,因为它为我们提供了评估研究结果、做出明智的临床决策以及改进医疗实践的工具。理解数据的类型(数值型或分类型)以及如何对数据进行分类和描述是理解医学统计的基础。数据可以分为数值型(离散型或连续型)和分类型(名义型或有序型)。连续型数据通常用中心趋势(均值、中位数、众数)和数据分布(范围、四分位数间距、方差)来描述。均值利用所有数据点的信息,但容易受极端值影响;中位数忽略了数据两端的值,因此更稳健。 在假设检验中,零假设通常是两组之间没有差异,检验旨在判断数据是否与零假设一致。p值表示在零假设为真的情况下观察到数据的概率,p值越低,拒绝零假设的信心越高。样本量大小会影响p值,0.05的显著性阈值是人为设定的。为了保持研究的完整性,需要在研究开始前定义临床重要性的差异和分析方法,并坚持使用预先设定的显著性阈值。置信区间提供了一系列可能的值,这些值包含了真实总体值,并能反映效应量的大小。 在解读医学研究中的统计数据时,最常见的陷阱是假设研究设计良好且结论有效。研究设计是影响研究质量的最重要因素,随机对照试验优于观察性研究。发表偏倚是指发表阳性结果的研究比阴性结果的研究更多,这会影响Meta分析的结果。系统综述是对文献的系统性检索,而Meta分析则整合多个研究的结果,得出平均效应。前瞻性注册研究,公开宣布研究计划,可以避免p值寻觅等问题。敏感性分析可以帮助评估研究结果的稳健性。CONSORT工具和清单可以帮助设计和评估研究。t检验和卡方检验是常用的统计检验方法。 将证据整合到临床实践中需要多方面努力,包括与同事沟通、参与质量改进项目以及考虑组织变革等。人工智能在数据分析方面具有巨大潜力,但也存在引入偏差的风险。为了确保人工智能分析结果的可靠性,需要公开发布代码、数据和输出结果以便进行验证。对于连续型变量且服从正态分布的数据,可以使用t检验或线性回归模型进行分析。

Deep Dive

Shownotes Transcript

我很高兴地告诉大家,Aussie Media是由OPC Health赞助的,OPC Health是澳大利亚一家假肢、矫形器、诊所设备、压缩服装和康复设备供应商,服务对象包括医生、物理治疗师、矫形技师、足病医生和手部治疗师。如果您想了解OPC Health提供的产品,请访问opchealth.com.au,在线查看其产品系列。

医学统计在塑造现代医疗保健方面发挥着根本性的作用。它是循证医学的基础,使我们能够做出明智的决定,无论是选择最佳治疗方案、评估干预措施的疗效,还是了解患者的风险和益处。在今天的AussieMedEd节目中,我们将探讨医学统计的世界,探索它如何影响临床指南,帮助我们批判性地评估研究论文,并为日常临床实践提供信息。

我们将涵盖每位医疗保健专业人员在审查研究时都应熟悉的必要统计概念,从数据类型和统计概念到更复杂的主题,如假设检验、p值、置信区间以及相关性与因果关系。我们还将讨论其他研究设计、样本量的重要性以及如何在研究论文中发现潜在的偏差。

今天加入我的嘉宾是Adam Badenoch博士,他是一位麻醉师,拥有生物统计学硕士学位。他将帮助我们为您分解所有这些内容。无论您是研究新手还是希望更新您的知识,本期节目都将为您提供更好地理解和应用临床实践中证据的工具。欢迎来到Aussie Med Ed。音乐

大家好,欢迎收听Aussie Med Ed,这是一档澳大利亚医学教育播客,它采用务实的 подход 来对待医学状况,通过采访医学领域的专家。我是Gavin Diamond,一位居住在阿德莱德的骨科医生,我正在Karnaland广播。我想提醒大家,这个播客可以在所有播客播放器上收听,也可以在YouTube上观看视频版本。

我还想提醒大家,如果您喜欢这个播客,请订阅或留下评论,或给我们点赞,因为我非常感谢您的支持,这也有助于频道的增长。我想先从感谢制作本播客的土地的传统主人——考尔纳人开始,并向过去、现在和新兴的长者致敬。音乐

现在我很荣幸地介绍Adam Badenoch博士,他是一位在南澳大利亚接受过培训的麻醉师,他在困难气道管理、医学教育和模拟以及肝胆和肝移植和麻醉方面拥有专门的奖学金。2023年,Adam获得了阿德莱德大学的生物统计学硕士学位,

他将自己的临床专业知识与对研究、统计和麻醉专业(如耳鼻喉科、神经麻醉和肝移植护理)的浓厚兴趣结合起来。Adam,非常感谢你来到Aussie Med Ed。统计学对我来说一直是一个非常困难和令人困惑的概念,可能是因为它融合了数学和一些不寻常的概念。你能否首先为每个人解释一些基本的关键统计概念?人们应该了解的基本原则以及如果他们试图分析医学研究应该知道什么。

当然,Gavin。首先,感谢你邀请我。有时我也觉得统计学有点令人困惑和复杂,所以别担心,我认为,如果你有这种感觉的话。很多人都在同一条船上,它肯定包含了一些

相对不直观的概念或逻辑。但我认为你是对的,涵盖一些基础知识通常会有所帮助。我认为需要理解的一些关键概念是:有哪些类型的数据以及我们如何对其进行分类?我们如何描述不同类型的数据?

以及与假设检验相关的基本概念。因此,数据类型通常可以分为数值型或类别型,数值型数据可以进一步分为离散型或连续型数据,类别型数据通常进一步细分为名义型或有序型类别。

名义类别变量只是一个没有逻辑顺序的变量。一个很好的例子可能是头发颜色。

与有序变量相反,有序变量本质上是类别的。它对事物进行分类,但它们有自然的顺序,例如小、中和大。就数值数据而言,离散数据本质上就像一个整数。它不采用连续的值范围,而是属于......

离散数字,而连续数据本质上是对理论上可以描述为完全连续过程的某种东西的数值表示,它可以采用任何特定值。因此,如果我们考虑连续数据,我们通常用其中心趋势来描述它,即数据量最大的地方。

位于哪里以及数据如何围绕该中心趋势区域展开。

因此,描述中心趋势最常见的方法是均值、中位数或众数。众数是最常见的值,中位数是第50个百分位数的值,均值有许多不同的定义,但通常的算术平均值只是所有值的总和除以值的个数。分布可以描述为从最低值到最高值的范围,并且

您可以描述该范围的子集,例如四分位数范围描述了中间50%的值。

因此,它受偶尔出现在范围两端的极端异常值的影响较小。方差是一个术语的定义,它描述每个单独点与您使用的任何中心趋势度量(通常是中位数)的距离。

当我们谈论数字时,我们想平均这些数字,这就是均值,但我理解均值并不那么好。它受异常值的影响,这就是为什么中位数更有用的原因。这是正确的吗?是的,这取决于数据的分布。因此,均值通常是一个很好的值,因为它包含了每个单独数据的信息。

数据集中的数据点,并在其计算中使用该信息,因此您不会丢弃任何信息,但由于其计算方式,它可能会受到少量特别高或特别低的值的相当大的影响,如果存在这样的值,这些值并不能真正代表数据的典型值。中位数取中间50%的值,因此

它实际上是丢弃了来自数据集顶部和底部的数据信息。因此,我认为,如果范围两端的这些值实际上是有效的,那么与均值相比,使用它不太理想。

被认为是典型且代表真实数据集的。但如果它们是不寻常的高或低的异常值,而我们认为它们并不真正代表真实总体,那么丢弃这些信息并只使用中间50%是件好事。范围使这个概念更进一步,它只使用数据集中的两个值。因此,您的数据集中可能有百万个值

要简单地用范围来描述它,它所做的就是取最低值和最高值,通常在它们之间加一个短横线。你会说,你知道,数字的范围是从这个到这个。

它不会告诉你数据集中间还发生了什么。因此,这显然会受到异常值的影响,并且不会告诉你范围中间的情况。但我认为它很有用,这是一个有用的概念,特别是当与中位数结合使用时。因此,中位数查看中间50%的异常值。

范围查看极端两端,然后结合起来可以很好地描述数据的分布情况。所以我会说,这有点因情况而异。所有这些都被用作描述数字以解释结果的一种方式,作为评估治疗对某些个体或对整个人群是否有用的方法。我的意思是,统计学是一种数学......

它不仅对医学有用,而且在金融、工程、农业和所有生活领域都得到应用。因此,在任何可以使用数字来表示现实世界中存在的现象的地方,统计学都很有用。因此,其应用几乎是无限的。我想统计学的一个关键概念,另一个概念是

人们在解释医学文献中的统计数据时经常会忘记的一点是,每当我们进行一项研究或分析一个数据集时,通常情况下,这是一个从真实总体中抽取的样本,并且

例如,我们可能招募了100名在过去12个月内接受过膝关节手术的患者,这些患者来自您在过去12个月内进行的所有手术患者。

现在,您在12个月内进行的手术患者可能远不止100名。我们在研究中关注的是您所进行的所有手术患者的一个样本。或者我们可能试图将我们的想法推断到所有接受过膝关节手术的患者,而不仅仅是您,也不仅仅是在今年。因此,当我们分析一项研究时,我们正在分析患者这一概念

从更大的真实总体中抽取的样本是一个非常重要的概念。而且,当我们回到解释一些分析参数和检验假设时,很多这个框架都是基于

估计如果我们收集了每个进行电子手术的人的数据,这些值在真实情况下会是什么。我们已经介绍了假设的概念。如果您能解释得更详细一些,那就太好了。当然。

因此,假设检验是一种使用统计方法来反驳零假设的方法。这种思维框架通常源于这样一个概念,除非我们知道我们将以某种方式改善生活或医学,特别是对于我们的患者,否则我们通常会坚持现状,除非我们知道

我们正在做的事情可以使事情变得更好。基于首先不造成伤害的基础上。没错,没错。也基于这样一个事实,即您可以随机变化

在数据集中。我们不想对这些数据进行过多的推断。我们只想进行需要大量努力的更改(有时),如果我们知道那里存在真正的影响,而不仅仅是数据集中的某些随机变化。因此,通常情况下,一项涉及假设检验的研究将有一个零假设,在最简单的场景中,这将是一项涉及两组和单一干预测试的研究。

零假设是两组之间没有差异,这意味着治疗没有任何效果。因此,如果我们进行一项检验,一项假设检验,我们实际上是在查看我们来自单个样本的数据集,并试图确定该数据是否与零假设一致。

如果它与零假设的偏差很小,我们可能会说,这里可能存在很小的真实影响,但这可能也归因于偶然性。而如果我们样本中的数据与零假设非常不一致,那么这更有说服力地让我们说,好吧,

实际上,我们认为我们在这里收集了足够的证据,可以自信地反驳这个零假设,并且在拒绝这个零假设时,我们显然会提出一个替代假设,这可能是治疗改善了我们正在关注的结果,或者可能使结果更糟,我们可以估计它增加了多少或减少了多少,这就是假设检验背后的总体思维框架和思想,并且

我相信这在计算发生这种情况的可能性并使用我们所谓的p值方面有效。绝对正确。是的,p值是在零假设为真的情况下观察到数据集的可能性。显然,您的数据与您在零假设下所期望的数据的偏差越大,

由于偶然性而产生的结果的可能性(而您的治疗没有任何真实效果)会变得越来越小,因为差异会变得越来越极端。关于p值需要记住的重要一点是,它们近年来受到了相当多的批评,主要是因为它们只传达了这些信息。它们传达了您的结果仅由于偶然性而产生的概率。因此,这种可能性越低,您对拒绝零假设的信心就越大。但它不会告诉你任何关于......

您实际观察到的变化的大小。我一直认为增加样本量会降低或增加获得正p值的可能性,这可能是它受到批评的原因之一。我还意识到,0.05的实际值只是由早期的统计学家费舍尔任意决定的,他认为1/20是一个合理的数字。这是绝对正确的。因此,您选择的值为......

您认为是显著的p值与您将归因于偶然性的p值的阈值是完全任意的。长期以来,人们一直约定将该值设定为5%或0.05。但是,随着医学文献越来越普遍,越来越多的研究和论文发表,

日复一日,年复一年,我们开始看到一些现象,即可能存在其他问题,例如发表偏差和其他一些零碎的事情,这意味着这种传统的思维方式,即,你知道,1/20的可能性是永远不会发生的,除非存在真实的影响。如果你有成千上万的

每天发表,他们都在检验假设,你知道,这远不止20篇论文。你会得到很多由于偶然性而具有统计学意义的结果。因此,出于这个原因,人们可能开始推动使用更低的p值来定义显着性,或者只是鼓励读者解释p值,而不必

感觉被迫为它们赋予一个单一的任意阈值,以确定它们是否显着。您当然可以将其视为一个概率机会,即该数据集仅由于偶然性而产生的可能性,并且

并自行决定您是否认为那里存在真实的影响。频谱的另一端呢?所以你目前所说的意思是0.05可能有点高。那些谈论事情接近显着性的人呢?这方面可能有两个方面。一方面,我认为为了维护研究过程的完整性,您确实需要忠实于传统的科学方法,我认为要......

声称您已经发现了某事物之间的因果关系,这需要很多事情都符合要求。其中之一是观察到差异,由于您的干预而产生的真实差异。做到这一点的真正方法是在开始研究之前定义您认为在临床上重要的差异,并定义如何分析结果,并且作为其中的一部分,我认为您确实需要定义显着性阈值并坚持在您的分析和书面报告中,这当然会让作者感到沮丧,我认为他们在数据集中观察到

可能他们正在寻找的效果,效果可能比他们预期的要小一些,或者数据集中的方差比他们预期的要高一些。结果,他们的p值并不像他们在实验开始前选择的阈值那么小。所以在这些情况下......

我认为作为已发表论文的作者,您只需要坚持您事先的决策框架即可。但这并不是说,作为读者,我们不能也考虑这样一个事实,即p值只是结果由于偶然性而产生的概率。是的,任意阈值很重要,但我们不会

它们可以用另一个框架来解释,我想,作为读者,如果您不是在注册研究时设定水平的人。那么我的另一个想法呢?研究越大,研究的效力越大,达到显着性的可能性就越大。因此,它几乎看起来像,如果您只是不断增加样本量,那么一切都会成为0.05 p值?是的。

我很高兴地告诉大家,Aussie Med Ed得到了HealthShare的支持。HealthShare是一家数字医疗公司,为澳大利亚各地的患者、全科医生和专家提供解决方案。HealthShare的两款产品是Better Consult,这是一份术前问卷,允许全科医生在咨询开始之前了解患者的议程,以及HealthShare的专家转诊目录,这是一个专家和相关医疗保健目录,帮助全科医生找到合适的专家。

是的,这是正确的。在计算p值时,通常会影响它的因素是效应量、数据集中存在的方差以及样本量是多少。因此,对于给定的效应量和数据集方差的任何组合,数据集越大,p值就越小。因此,随着电子病历、数据链接和数据共享变得越来越普遍,出现大型数据集的可能性变得越来越现实,也越来越普遍。这当然也是值得记住的一种现象。

因此,每当呈现p值并且它非常小时,这意味着它们

那里可能存在某种影响,但p值可能由于这三个原因中的任何一个而很小。因此,数据集中的方差低、效应量大或样本量很大。因此,如果效应量很大,那么这显然对我们临床医生来说非常重要。其他两个是

是更重要的统计现象,对治疗的有效性并不那么重要。因此,在考虑p值时,查看样本量很重要。因此,如果您看到一个正p值,但您实际上看到实际的总体结果具有非常小的影响,您可能会想,好吧,知道这一点很有用,但这不会像具有正p值和样本量小的巨大方差那样真正改变我的临床实践,在这种情况下,您会说,这非常重要。

没错。关于您也看到的置信区间这个想法呢?我觉得有点困惑,因为它似乎有一个范围,中间有一个数字。你能解释一下吗?这与我们正在讨论的p值有关吗?当然。因此,置信区间是一系列似是而非的值,真实总体值将在其中以特定程度的置信度存在。

通常,它们表示为95%置信区间。因此,这是一个值范围,它将包含真实总体值,置信度为95%。因此,在许多方面,它们类似于p值,但它们具有额外的优势,即提供了一个值范围,而不仅仅是一个概率值。

是否由于偶然性而产生。因此,置信区间提供的数值范围可以使您了解效应量的大小。通常,这可以围绕估计值计算。因此,您可能会估计两组之间的平均血压差异,

因此,平均血压差异具有单个特定值,这就是您在置信区间范围中间看到的数值。在其两侧,您有置信区间范围的边缘。这就是血压差异可能具有的似是而非的值的范围。

因此,在这种情况下,如果您随后服用一种调节患者组血压的药物,那么它们将具有一个范围和95%的置信区间。然后您是否以这种方式比较两个置信区间?你是怎么做到的?理想情况下不是这样。因此,您可以计算第一组中的血压值以及围绕该值的置信区间。

您可以计算第二组中的血压值以及围绕该值的置信区间。如果知道您的研究目的是比较血压的差异或在您服用治疗药物时血压如何变化,那么最好做的是将您的试验结果故意设为血压的差异。因此,这是血压一减去血压二。这然后成为一个单一的值。

然后,您可以围绕该单点计算置信区间。

差异值,这比简单地比较两个单独创建的置信区间之间的置信区间的重叠更有用,也是一种更有效的方法来判断两组之间的差异。当我们开始讨论我们使用的不同检验和事物时,我们可能会稍后回到这个例子,并讨论它是参数检验还是您在这种情况下将使用的检验。

如果我们进一步推进,那么解释医学研究中统计数据的常见陷阱是什么,以及如何避免这些陷阱?我认为最常见的陷阱可能是假设一项研究进行得很好,并且结论是有效的。我发现最好假设相反,并要求作者证明你是错的。如果我做不到,我就仍然怀疑。几乎就像是对您正在阅读的研究的零假设一样。

没错。那么,您需要寻找的精心设计且稳健的研究的关键特征是什么?有很多因素,实际上有一长串需要寻找的东西,因为良好的研究实际上只是一个正确地做很多小事情的过程。如果你把所有这些小事都做对了......

那么你就会做好研究。如果你没有做任何这些小事,那么就是糟糕的研究。中间还有很多东西,他们做了一些事情是对的,或者很多事情是对的,而有些事情做得不好。但我认为一些重要的概念是理解概念,例如研究设计可能是最重要的单一因素。所以虽然是

进行一项精心设计的病例系列研究或一项精心设计的观察性研究。如果我们假设所有研究都以类似的严谨性进行,那么随机对照情景

盲法试验比任何类型的观察性研究都要好得多。进行了一些尝试以调整混杂因素的观察性研究比病例系列研究更好。病例系列研究比病例报告更好。因此,人们可能熟悉的基于证据的金字塔中的证据级别仍然有效。可能对此的警告是

事实上,发表偏差是一种真实的现象,它肯定会影响荟萃分析的结果。荟萃分析和系统评价通常位于该金字塔的顶部,但有时如果荟萃分析显示两组之间存在差异,

或者治疗有效,那么最好进行一项精心设计、稳健、大型、务实的单一试验来证实这些结果,以确保它不是由于发表偏差造成的。如果您有一个系统评价或荟萃分析,该分析

表明两组之间没有差异,那么我们可以非常有把握地说,这并非由于发表偏差造成的,您可能可以将该结果视为真实结果。我本来想快速地问一下听众,什么是系统评价和荟萃分析。你能向他们解释一下这其中涉及的内容吗?是的,系统评价只是对文献的系统搜索。一个

荟萃分析是一个过程,用于从多项研究中提取结果,并得出平均效应。因此,荟萃分析和系统评价通常是结合在一起的。在进行荟萃分析之前,您需要进行系统评价。因此,荟萃分析的想法是

它是一种生成大量数据来回答问题的方法,而不必在一个新的试验中进行。它使用医学文献中现有的结果来得出您认为是真实的结果。如果您有多个小型试验,这尤其有用,特别是如果它们的结果存在一些差异。

发表偏差是指提取了许多研究,但所有个体研究的质量都不高,因此它们会影响结果?是的,发表偏差通常是这种现象,即表明两组之间存在差异的研究

治疗有效性比那些没有显示差异的研究更有可能发表。因此,当人们进行系统评价时,通常您只能找到已发表的研究。因此,可能有一系列人们进行的研究代表了您的治疗或干预的真实效果,这些研究从未发表,因此从未进入系统评价和荟萃分析。太棒了。

我一直在学习。那么,我们还需要注意哪些其他类型的偏差才能设计一项良好、稳健和理想的研究?从本质上讲,您可以想到的任何可能在研究中出错的事情都可能是偏差的潜在来源。这在很大程度上取决于研究设计和您正在做的事情。您可能正在进行一项调查。可能有一些您提出问题的方式有点具有引导性。这可能会导致偏差。

如果您正在测量结果,那么如果测量结果的人没有以特别客观的方式进行测量,并且如果他们知道分配给哪个组的参与者,那么我们作为人类在内在的偏见,无论我们是否打算这样做,都会发生。

试验进行中还存在其他现象,即患者可能由于特定原因而被排除在试验之外,这可能会使结果产生偏差,或者

或者,如果我们正在查看降压药降低血压的程度,如果降压效果最好的药也杀死患者,那么患者由于死亡而退出我们的数据集这一事实将稀释观察到的治疗效果来自降压效果最好的药丸。

因此,潜在的偏差来源实际上是无穷无尽的,通常可以将其归类为一些更常见的形式,但它实际上可以是任何东西。任何导致与真相系统偏差的东西。

是的,但在服用药丸的讨论中,如果您服用红色药丸与蓝色药丸,蓝色药丸可能会更镇静,并且由于安慰剂效应,血压下降幅度会略大一些,这也会导致治疗偏差。这是正确的吗?是的,绝对正确。除了排除偏差并确保对其进行了适当的评估和进行之外,您在研究中还想做其他任何特别的事情吗?还有什么其他事情可以使研究总体上更好?

是的,其他一些更重要的点是

可能需要预先注册你的研究,公开宣布你打算做什么,你要研究谁,你要收集哪些参数,你真正感兴趣的主要结果是什么,以及你将如何分析它。如果你能在研究开始之前描述所有这些事情,那么你就会更有信心得到一个有效的结果和结论。另一种方法

这样做是不公开披露任何这些事情,而只是在研究结束后公布你的结果并描述你的结论。这样做的问题是这种p值狩猎现象,这是我们前面提到的发表偏倚的一种症状。因此,作者知道,如果他们的研究组之间存在差异,他们的研究更有可能发表,而且经常

科学家、临床研究人员会进行研究,因为他们认为那里存在需要观察的影响。因此,如果人们被留给自己处理,一些固有的偏见就会出现,人们可能会

你知道,改变他们最初打算关注的结果,因为他们在研究中收集到的其他结果现在似乎是一个更有趣的结果。你知道,两组之间存在差异,现在看来,你知道,在临床上相当重要。所以也许我们会报告这个结果。

或者他们会稍微改变他们定义主要结果的方式,并报告新定义的版本,因为这提供了更具有统计意义和更有趣的结果。因此,预先注册研究、方案和统计分析计划有助于防止这些事情发生。显然,对于听众来说,这只是可能潜入研究中的事情,我们需要小心。

是的,我的意思是,人们确实会不时地研究这个问题。他们会从相当有声望的期刊中随机抽取样本,并检查这些事情发生的频率。虽然这并不是说这种情况总是发生,每个人都会这样做,但它在所有学科的医学文献中确实具有显著的流行性。

在这种情况下,我们需要寻找哪些危险信号?这仅仅是你已经谈到的那些事情吗?你想到的还有什么特别的东西吗?总的来说,这是我们刚才谈到的所有良好研究标志的反面。任何时候你没有看到那些潜在的坏研究标志,

有时,在研究中帮助你安心地认为发现是可靠和真实的是敏感性分析。因为有时,尽管我们尽了最大的努力,实际上有多种有效的定义结果或分析特定变量的方法。

这些不同的定义和分析方法各自都有其自身的假设和缺点,并不是说这样做一定是不对的,而是在分析过程中做出了一些固有的假设,因此敏感性分析旨在提出这样的问题:如果我们没有做出这些假设会怎样,或者如果我们使用所有

另一种但同样有效的初级结果定义,如果我们以另一种也被认为适合我们领域的方式进行分析,你知道吗?所以要经历这个过程,然后验证一下,如果我们没有做出这些假设,我们以这种替代方式做了,我们最终会得到相同的结论,还是会改变我们的研究结论,以及

因此,如果你进行了一系列敏感性分析,每次都得到不同的答案,那么在能够对结果充满信心方面,这相当令人不安。而如果进行了一系列敏感性分析,并且它们都支持相同的结论,那么你就可以更有信心,这些在分析过程中每一步以及结果定义中做出的假设,以及可能的主要结果的选择

同样,不会成败研究,我想。在我们说话的时候,我想到一个问题,有没有什么工具可以帮助你分析你正在阅读的研究?有没有什么指南,你需要查看的特定复选框?是的,有。有一些非常有用的指南、复选框和帮助工具包。可能最重要的是,它在所有方面都最广泛适用

所有研究设计和所有研究都是 CONSORT 工具和清单。CONSORT 是一个旨在促进高质量研究的组织。

研究,他们已经制定了一系列指南和清单,如果你正在考虑设计一项研究来使用,或者作为读者,这都非常有用,你知道,任何时候你拿起一项新的研究并阅读它,如果你正在运行一个期刊俱乐部或类似的东西,它们都可以成为一个极好的资源来使用,并且他们为不同的场景提供了不同的清单,有一个针对随机对照试验的指南和清单,有一个针对荟萃分析的,还有一个针对

观察性研究,它们非常有用。那么,我们需要了解或应该注意的常见检验是什么?我认为目前使用最常见的检验是

目前将是用于连续数据的学生 t 检验和用于分类数据的卡方检验或费舍尔精确检验。这两种检验相对容易计算,并且在各种不同的场景中都非常稳健,因此它们已经成为

常用检验是有原因的,它们可以应用于各种各样的场景,因此它们是关于有多少其他检验的好检验,那里有大量的不同检验,以及是否咨询统计学家

在某些情况下,我认为如果你有信心自己分析数据集,那么这将是一件很棒的事情。还有一些时候,你知道,如果你感觉不太自信,那么让统计学家参与进来是一件非常好的事情。而且,你知道,数据集和分析的复杂性各不相同。因此,你作为个人所处的位置以及

以及研究数据集和分析在这个范围内的位置总是会因不同的项目而有所不同。我想,多年来在我的统计研究中,我学到的一件事是,有时犯错是多么容易。因此,我肯定已经学会了对让统计学家参与进来有一个非常低的阈值。你知道,即使我现在是一名合格的统计学家,我也对让其他人参与进来有一个非常低的阈值

不一定让他们做全部分析。在某些情况下,如果超出我的范围,我会请别人为我做全部事情。在其他情况下,我可能会只要求对我的工作进行一些监督。所以我认为任何这些情况都可以。这取决于你感觉舒服什么。

即使对于特定个人来说,这也会因项目而异,因为不同的项目涉及不同程度的复杂性。但我总是会偏向于复杂性。

如果你不确定,我会让统计学家参与进来,而且我总是会偏向于做这项工作,并进行这项思考,如果你要在项目早期而不是后期让统计学家参与进来,你知道,理想情况下,任何研究的初始设计阶段都是应该进行这种参与的地方。医疗保健专业人员如何才能有效地将这些对研究的评估和更好的循证医学整合到他们的临床实践中?你对此有什么想法?

这是一个棘手的问题。因此,改变临床实践是困难的,绝对不是我的专业领域。我认为理解......

证据是第一步,这当然是我更舒服的地方。从那里开始,我认为,你知道,还有许多其他组织和人际因素开始变得越来越重要。我想,你知道,你如何进行这种转变?我想开始和你同事谈谈

你读到的这个新的证据可能是第一步。你会从他们那里得到一些反馈。如果你们都同意,嘿,这是一个有希望的新发现,也许我们应该考虑改变我们的做法。至少那时你身边有朋友。所以这可能是......

就我的专业水平而言,我会做到这一点。在那之后,你知道,还有很多其他人,很多我的同事更精通,

质量改进计划和组织变革的想法,管理者的作用也包括在内。它也开始成为一个管理领域。因此,根据你试图实施的改变是什么,这可能相当复杂和困难。以及是否有证据支持在患者结果方面或在成本效益方面有效

医疗保健美元储蓄几乎只是更大更复杂的机器中的一小部分,才能真正改变临床实践,我认为。我还知道,临床实践的这种改变背后也有一门科学,这并不是我的专业领域。好吧,我们真正总结的是,统计数据对于分析结果很重要,但除非你进行了一项适当进行的研究,

评估可能存在的偏差,概述你计划沿途评估的内容,并使用适当的统计数据进行分析,否则你不能真正确信你显示的结果绝对是现实生活中实际发生的事情。你还必须以类似的方式评估你正在阅读的研究,并使用你提到的 CONSORT 等工具来评估它们。还要意识到,当你评估一个结果时,这可能对临床实践有用,可以邀请一个团队来帮助批判性地评估它。

这将是我们今天讨论内容的一个很好的总结吗?是的,我认为这是一个很棒的总结。做得好。我一直喜欢总结一下人工智能的使用。人工智能在帮助分析数据方面扮演什么角色?或者这是否会带来更大的引入偏差的风险?

看,我认为你击中了要害。它具有巨大的潜力,但也存在重大偏差和问题的可能性。我认为人工智能涵盖了一系列不同的概念。与统计数据最相关的可能是机器学习,它

机器学习是一种基于一些预先指定的自动化规则来分析数据的方法,但通常它是一个多层过程或一个自身多次反馈的过程。但是每一层或每次进行此过程时,它通常都在进行某种

相对简单或直接的分析技术,这并不是什么新鲜事物,而是已经存在于世界上的东西,例如逻辑回归模型。如果你有一个二元结果,

机器学习模型可能会使用诸如随机森林程序之类的程序,这可以使用一系列分层的逻辑回归模型来决定最终的二元结果模型。它这样做并不一定公开很多信息。我认为我们之前可能讨论过的一件事现在与评估 AI 相关的是

查看研究中完成的所有分析计划的诊断始终是一件好事。因此,理想情况下,如果人们可以展示他们的诊断

以去身份识别的方式进行研究数据集,展示他们用来分析它的代码。一些技术,如回归模型,通常可以进行测试,以查看模型实际与观察到的数据拟合得有多好。因此,这些模型诊断也可以很好地呈现。

因此,有一些事情在良好的研究中可以很好地寻找,而这些事情的缺失有时可能是坏研究的标志。对于 AI 来说,它只是将其提升到了一个新的水平,因为它做了如此多的计算工作,需要大量的代码,并且代码的输出很多,因为它在这个迭代过程中一遍又一遍地运行多个模型。

但真正确保他们没有做任何愚蠢的事情的唯一方法是查看所有这些代码和所有这些输出。因此,我们并不一定期望每个人都能理解这些代码和输出,但有些人可以,

我认为我们要问的一件事是,每次有人将机器学习用作研究的分析方法的一部分时,这些事情都会被发表,只需发表代码,理想情况下是数据集和输出,以便可以对其进行验证。

基本上,如果不了解实际计算的所有复杂性,你真的无法确定由此产生的数字是否正确。不,没错。在某些情况下,它也可能非常有用。例如,我认为在图像识别中,通过迭代过程的模式识别方面可能非常有用。但是你将其与具有数值结果的东西进行对比。例如,如果我们回到我们的血压数据,

场景中,在血压研究中,结果通常是一个数字,可以根据相对简单的公式计算出来。因此,你会看到有些人偶尔会将机器学习模型应用于计算血压研究结果

这是一个巨大的计算能力浪费,并使用迭代过程,该过程从对数字可能是什么的某种随机猜测开始,并根据你的观察数据集逐渐缩小范围。当你实际上可以计算

通过相对简单的公式应该是什么值。因此,有时它也会被滥用。它已经成为人们喜欢应用于他们正在做的事情的一个有点性感的术语,无论它是否实际上是推导出答案的最优雅或最准确的方法。好吧,最后用血压模型结束,你会使用卡方检验还是学生检验来分析治疗后血压的差异,或者在这种情况下你会倾向于使用什么?

是的,所以血压是一个数值结果,理论上可以取任意多个值,而不仅仅是整数。因此,它是连续变量的一个很好的例子,我们知道它在大多数人群中是相对正态分布的。因此,我们可以使用学生 t 检验来分析它,或者线性回归模型是两种应该给你相同答案的好方法,本质上。

精彩。好吧,亚当,非常感谢你来到 Aussie MedEd,启发我们了解统计数据和医学的使用。非常感谢你。不用客气,加文。是的,感谢你邀请我。很高兴成为你节目的参与者。太棒了。再次感谢你。我想提醒你,今天介绍的所有信息都只是一种观点,治疗所有医疗状况的方法有很多种。这只是普遍建议,可能会因你执业或接受治疗的地区而异。

这些信息可能不适合你的情况或健康状况,你应该始终寻求你居住地区医疗保健专业人员的建议。此外,如果你对今天提出的信息有任何疑问,请联系你的全科医生或寻求澳大利亚生命线等卫生组织的帮助。再次感谢收听播客,请订阅播客以收听下一集。在此之前,请注意安全。我想让你知道 Aussie Med Ed 由 AVARD 医疗法律赔偿保险赞助。

他们告诉我,他们提供全面的支持来帮助医生安全地执业,并相信他们拥有广泛的保障,这些保障不断发展以满足你在不断变化的监管环境中的需求。他们在澳大利亚设有专业的医疗赔偿团队,并在紧急情况下可以全天候联系医疗法律专家。