Polls were less error-prone in 2024 compared to 2016 and 2020, with state-level polling being the most accurate in at least 25 years.
The average polling miss was 2.7 percentage points nationally and 2 percentage points in battleground states, significantly better than the 4 percentage point average over the past 25 years.
Pollsters might have faced non-response issues among Trump supporters, a problem that has persisted since 2016 and 2020.
River sampling, which drives people to answer polls through social media ads, had the lowest bias and error.
Weighting by past vote was seen as a way to ensure a proper mix of past Trump and Biden voters, though it's not clear if this method will be effective in future elections with different candidates.
Low response rates force pollsters to model the electorate, making all polls essentially models rather than representative samples.
Polls did a good job showing movement among Black and Latino voters towards Trump and among young voters, though some overestimated movement among Black voters and underestimated among Latinos.
While some pollsters still value live phone polls, the rise of new methods like river sampling suggests that the gold standard may be shifting to more innovative approaches.
All polls are now models due to low response rates, and there is no longer a single gold standard method. Instead, there are good pollsters who use effective modeling techniques.
Yes, pollsters are optimistic as polls continue to provide valuable insights into public opinion and democratic processes, despite the challenges posed by low response rates.
<raw_text>0 我们都在生活中有计划,也许是进行一次跨国公路旅行,或者只是想在没有背痛的情况下完成这次锻炼。无论我们的计划是大是小,突发的还是经过多年筹备的,良好的健康帮助我们实现这些计划。在Banner Health,我们提供的不仅仅是医疗服务。无论你在计划什么,无论你要去哪里,我们都在这里帮助你到达目的地。Banner Health。呼气。
露丝,你感觉怎么样?你知道,我得了行走性肺炎,我的两个孩子也得了,但我实际上感觉很好。我只是听起来很糟糕,这只是选举在作祟。你告诉我的是,这更像是一个行走性肺炎的开场,而不是一个冷场?哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
大家好,欢迎收听FiveThirtyEight政治播客。我是盖伦·德鲁克。选民在2024年选举中感到风险很高。通货膨胀、边界、堕胎权和民主规范都在选票上。我们知道结果如何。但2024年对另一群人来说也是一次高风险的选举。
民调专家。在2016年出现了一次高调但并不历史性的大失误后,2020年又出现了历史性的大失误,民调的信任度一直在下降。低响应率已成为民调面临的真正挑战。连续第三次总统选举的大失误可能会对选举民调造成致命打击。
但事情并没有那么糟糕。平均而言,2024年的民调创下了有记录以来最准确的一年,国家层面失误2.7个百分点,战场州仅失误2个百分点。在过去的25年中,平均民调失误为4个百分点,因此这是一个显著的超常表现,最终取得了成功。
但当然,这并不是复苏故事的结束。首先,民调连续三次低估同一政党的支持率。此外,在这些平均数的背后,是试图了解公众的非常不同的方法。而接触愿意参与调查的选民的障碍仍然存在。
那么这对这个播客非常关注的项目意味着什么,即准确了解公众在民主中所想和所需的?与我一起讨论这一话题的是两位对此进行了深入思考的人,数据分析主管艾略特·莫里斯。欢迎来到播客,艾略特。嘿,盖伦。还有《纽约时报》的民调编辑露丝·埃格林克。欢迎,露丝。你好,你好,我的声音依然很嘶哑。你知道,我们仍在从选举中恢复中。没错。
正如听众可能知道的,露丝,你是负责为美国公共舆论研究协会整理这次选举民调后评估报告的人之一。露丝,报告进展如何?让我澄清一下。艾略特和我都在那个委员会里。不,露丝必须写所有内容。是的,露丝,进展如何?目前还处于早期阶段。对于那些不知道的人来说,民调行业有一个由10到12人组成的委员会,来自不同的民调社区,无论是非党派民调者、民主党民调者、共和党民调者,公共的、私人的。每四年,我们的任务是审视民调的质量。我认为
你在引言中所说的完全正确,今年的民调历史性地表现良好。没有大的失误,但这是连续第三年民调低估特朗普的支持率几百分点。他们几乎准确地得到了卡马拉·哈里斯的选票份额,但低估了特朗普,平均低估了1到2个百分点,具体取决于州和国家及其他因素。方法、模式和不同的技术决策之间存在很大的差异,这就是我们和委员会将要深入研究的内容。但我认为我们整体的叙述是,今年的民调表现相当不错。
从2024年成功的方面来看,是否清楚2016年和2020年出错的原因?我知道我们有一些理论,对吧?2016年是教育问题。极化在某种程度上让我们措手不及。2020年是因为,嘿,那是在疫情期间。另外,
但或许还有一些挑战在于接触特朗普支持者,这种情况超出了教育分歧。此外,2020年的一个结论是一个大耸肩。我们不知道100%发生了什么。这次选举是否给我们提供了更多的信息,艾略特?
我认为一旦我们有机会将民调数据与选民数据合并,看看谁实际上投票了,这将有助于我们弄清楚在特朗普支持者中是否存在任何非响应现象。我对行业能否找到解决方案并不太乐观。
如果这是一个非响应问题或其他问题,低估了特朗普在意识形态光谱的支持者,在某种程度上,当他不在选票上时,这种情况可能会消失,民调专家将能够宣布胜利。如果美国测量公众意见的最聪明的人无法做到完美,也许我们就不应该期待他们做到这一点。
我们在2022年没有遇到这个问题,而在2020年则非常严重,在2024年情况稍微好一些,这告诉我这是一个独特的特朗普问题。我们还没有找到解决方案。我认为今年是一个有趣的年份,因为有这么多不同的方法,这为我们提供了一个很好的实验机会,让我们可以看看每种不同方法的表现。但如果我们尝试了这种多样化的方法,结果却没有有效接触到特朗普支持者,
这可能是我们无法克服的挑战。好吧,露丝,你完美地预测了。哦,你一定是个民调专家。你完美地预测了我下一个问题,即在不同的方法中,哪种方法似乎在评估公众意见方面表现最好。在这里提供一些背景,我们在选举前讨论了民调者是否应该根据回忆投票或过去投票进行加权的问题。
而根据过去投票进行加权,简单来说,就是询问选民他们在上次选举中投票给谁,然后确保你相应地加权,以便在样本中有适当数量的特朗普选民和拜登选民。历史上,这种方法的挑战在于人们并不总是记得自己在上次选举中投票给谁。结果如何?根据过去投票进行加权似乎是一种有效的公众评估方法吗?
我会说,我认为根据过去投票进行加权的人在这次选举中得到了验证,因为这并没有以人们担心的方式对他们造成伤害。也许这对这次选民群体是独特的,且与以前的选民类似。
也许这是我们在未来确保准确性所需做的事情。但我会说,在谈论不同方法的表现时,我想把话题抛给艾略特,因为我所说的任何内容都将基于艾略特进行的非常好的分析。没问题,露丝。
是的,我们看到新方法的表现更好,而一些传统方法的表现则不如预期。不过,再次强调,我们讨论的都是半到一个百分点的准确性差异,所以不是颠覆性的差异。似乎表现更好的模式是...
我们称之为河流抽样的方法,这种方法促使人们在他们看到网页上的广告时,通过手机或电脑回答公众意见调查,或者当他们在Instagram上滚动时,广告可能会出现,邀请他们参与调查。这种河流抽样的民调在偏差和错误最小的情况下表现最好。因此,不仅他们的结果接近实际情况,即使他们在某些情况下高估或低估了某个人,他们的偏差也没有对哈里斯表现出如此高的倾斜。而且,我所说的偏差是一个百分点和两个半百分点之间的区别。表现较差的在线自愿参与面板的民调效果不佳。而仅仅依靠电话民调的民调统计表现也不佳。
那么,特别是根据过去投票进行加权的情况呢?我们还没有能够深入研究这个问题。我知道皮尤研究中心的科特尼·肯尼迪最近在《华盛顿邮报》的一篇采访中表示,这似乎有所帮助。仅凭轶事来看,表现更好的民调类型通常也是那些倾向于依据过去投票进行加权的类型。所以我认为她是对的。但我认为我们还没有真正理解因果关系。
我会说,在《纽约时报》圣安东尼奥大学民调中,我们在考虑是否根据过去投票进行加权的持续争论时,回过头来重新加权了我们之前的调查,如果我们根据过去投票进行加权,它们的准确性会降低。
在2020年和其他年份,如果我们根据过去投票进行加权,它们的准确性会降低。现在,这并不意味着这不是今年表现良好的方法,但我只是重新加权我们自己的调查,使它们在历史上显得不那么准确,这真的很有趣。是的,露丝,从十年的角度来看,我确实认为我们应该对根据过去投票进行加权的做法放慢脚步,因为认为
在拜登担任现任总统、特朗普对抗的不是真正的拜登,而是拜登的副总统的选举,可能与四年前的选举有些相似。在特朗普时代的中期民调在2018年和2022年也非常准确,但不一定依赖于种族。
回忆投票。而且,选民的构成与特朗普总统选举的选民有很大不同。因此,在2028年,如果我们在选票上有完全不同的候选人,而人们从这次选举中决定根据过去投票进行加权是新的黄金标准,我们可能会
通过打击过去的战斗,为我们行业带来新问题。是的,我认为这是对的。我认为还有另一个挑战,这将需要我们进行一些深入研究。
许多根据过去投票进行加权的民调也非常集中在摇摆州,那里结果总是接近。因此,他们根据过去投票进行加权,因此将边际拉近并没有造成损害。但举个例子,我们在佛罗里达州进行了民调。我们的民调结果显示特朗普领先13个百分点。我们因为这个结果而受到很多批评,因为这似乎是一个有些离谱的结果。如果我们根据过去投票进行加权,它将远离这个结果。
佛罗里达州的结果非常接近。我认为是特朗普领先12或13个百分点。因此,我认为这也取决于情况。我们需要深入研究在哪些地方有效,在哪些地方无效。正如你所说的,不仅仅是为了打击过去的战斗。但如果这对我们有帮助,就不应该反对它。我认为我们需要进行一些深入挖掘和反思,以确定它的有效性和有效性所在。
你提到了这次选举中的另一个重要话题,那就是群体效应。因此,一个可能性是,由于所有这些民调者都使用了相同的加权方法,结果可能都看起来非常相似,都是由于根据过去投票进行加权。还有可能人们在群体效应中。我们能否在事后对此做出一些分析,艾略特?
是的,因此我对群体效应并不太信服。当你根据与结果相关的因素对样本进行加权时,比如过去投票,甚至种族和教育以及民调者加权的所有其他因素,你应该期望标准差比没有做这些事情时要低,因为你在某种程度上是根据接近结果的因素来调整样本。有很多民调者需要进行加权,需要进行处理,因为样本从一开始就不具代表性,无法代表他们试图代表的事物。
他们可能在加权方面做得更多。他们可能需要做更多的工作,而不仅仅是过去投票,以使样本具有代表性。是的,我的意思是,卡洛斯·奥迪尔上周在播客上说过,民调者在某种程度上已经成为自己的模型者。因为响应率如此之低,你在某种程度上必须模拟你期望出现的选民,因为你在接触人们时遇到了很多困难。
我很好奇,露丝,你是否认为这是对今天民调者面临任务的公平评估。同时,与此相关的是,民调者在衡量特定群体之间的变化方面表现如何,这可能是加权发挥作用的地方?
所以道格·里弗斯来自YouGov,一直在强调由于响应率低,现在所有的民调都是非概率民调。因此我们都必须做好一定程度的建模。我认为他并不是完全错误的,对吧?
例如,1%的响应率。是的,慷慨地说。几十年前,当我们的响应率为30%时,我们觉得这些民调代表了美国。正如艾略特所说,无论我们是在前端进行样本设计,就像我们在时间西雅图所做的,还是在后端进行加权,
我们也在这样做。我们正在进行比以前的民调者更多的建模。你知道,安·塞尔泽已经是许多年的黄金标准,即使她今年发布的异常值,实际上也并没有采取这种方法,而是非常轻微地加权样本,实际上并没有。她们没有根据教育进行加权。她们对样本的加权非常轻。你真的在今年看到了这一点,这样的方式已经不再有效。
这已经不再能够准确捕捉事物。因此,我认为这让我们看到,这种方法在我们获得的响应率下不再有效。在亚组移动方面,我认为民调在选举前很好地展示了这种移动,特别是关注黑人选民和拉丁裔选民。那里有许多好的超样本和深入分析。
这帮助我们理解这些群体正逐渐远离民主党,转向特朗普。
你知道,这并不是一个惊喜,或者对任何密切关注民调的人来说,这都不应该是惊喜。还有年轻人,尤其是年轻男性,我们在民调中一遍又一遍地看到了这一点。我想回想起一年前多一点,《华盛顿邮报》首次显示特朗普在年轻选民中具有强劲的支持率。他们因此受到了很多批评。对吧。这似乎是一个真实的异常发现,谈到群体效应,他们绝对不是。
这后来被证明在接下来的时间里,来自不同组织的调查显示年轻选民对特朗普的开放态度。因此,我认为,
但你知道,我们可以讨论很多关于准确的点估计,确保民调尽可能准确的事情。但当我们看到广泛的趋势和选举的故事时,我认为民调在告诉我们这些亚组的变化,以及选民中广泛的愤怒和不信任方面做得很好,对民主党不信任,对共和党的开放态度。我们确实在之前看到了很多这些。
是的,似乎总体而言,民调可能高估了黑人选民之间的一些变化,而低估了拉丁裔选民之间的一些变化,作为平均水平。我认为我们需要一点时间来... 我对出口民调持怀疑态度,我们需要一点时间才能确定。所有真正的专家都知道你必须等到选民验证的调查。确实如此。但你之前提到的一个问题,涉及到我们在这次对话中应该强调的一个更大问题,那就是...
安·塞尔泽长期以来一直是黄金标准的民调者。她的最后一项民调显示哈里斯在特朗普赢得的州领先3个百分点。这是一个16个百分点的失误。而结合艾略特之前提到的内容来看,目前看起来一些最准确的民调者是那些试图采用新方法的人,比如在社交媒体上投放广告以吸引人们点击。
我在FiveThirtyEight工作过够久,曾经非常坚持什么是黄金标准,那就是现场电话民调。然后我们在几年后又退一步,认为实际上没有什么优势。
查看我们通过现场电话民调获得的结果。有些新方法的结果同样准确或不准确。没有太大区别。我们准备在2024年说,实际上黄金标准是一种更糟糕的方式,而这些新方法实际上会在未来更准确吗?
我认为我还没有准备好这么说。也就是说,这些方法的兴起与我们的政治极化时代之间存在有趣的关联,以及特朗普在选票上连续三次的选举,我认为我从中学到了很多。
你知道,民调者已经做了几十年,你希望有一种方法可能在每次选举中都有所不同,但在几十年中却保持稳定。我想看看这些新方法在过去几次选举中的表现非常出色。我想知道它们是否在几十年中保持稳定,而不是适应我们政治中的特定时刻或特定候选人。
现在这听起来有些怀疑,但我认为这是一种带着爱的怀疑。就像我很高兴,我很兴奋,但我想知道这是否是一种能够在所有不同情况下表现良好的方法。我是恐龙中的一员,我们仍然进行现场电话民调。我仍然看到我们这样做的价值,我还没有准备好放弃它。
此外,正如你所说的,卡洛斯·奥迪尔也表示,他们最终根据过去投票进行了加权,还说现场电话民调在接触拉丁裔选民方面表现最好。所以今天的民调看起来像是一系列可以选择的选项。获得最准确的结果可能意味着需要从不同的方面进行拉动。我们离感恩节很近,可以用这个比喻。
是的,我会说,皮尤对非概率调查的精彩分析显示,年轻选民和拉丁裔选民在非概率调查中尤其可能声称他们拥有核潜艇许可证。
这非常深深扎根于我的脑海中。极其愚蠢。但他们的观点是,这些人要么不是实际的受访者,要么是注意力不集中,实际上并没有认真对待调查。结果是,出现了这种过度代表性,几乎是不可能的,显示了拉丁裔和年轻受访者在非概率调查中的低质量。
因此...
尽管总体而言,他们在一些这些人口子群中表现良好,但很难知道。
我将提出两个公理,我认为人们应该从这次选举中带走的公理。正如内特·科恩和露丝所讨论并撰写的那样,我在两年前的书中也提到过。第一个是,现在所有的民调都是模型。就像道格所说,现在没有概率样本了。没有代表性的民调了,使用统计学的词代表性。所有民调都是模型。作为一个推论,第二件事,
如果它们都是模型,那么就没有黄金标准的民调了。因为你已经承认存在一个数据生成过程正在变化,变得更加困难。因此,我认为现在没有黄金标准的民调。我可能会说有黄金标准的民调者,但实际上有好的民调者。有一种好的方法来应对公共舆论数据建模的问题。不幸的是,我认为我们在安·塞尔泽身上看到的就是,旧的黄金标准的民调方法。
在我看来,这种方法已经不再有效一段时间了,而我们今年没有足够的运气再次让它奏效。今天的播客由Shopify赞助。准备好为你的业务做出最明智的选择了吗?向Shopify问好,全球商业平台,让销售变得轻而易举。
无论你是开始在线商店,开设第一家实体店,还是订单达到一百万,Shopify都是你的增长伙伴。通过Shopify的全方位电子商务平台和现场POS系统,在任何地方销售。通过Shopify最佳的结账系统将浏览者转变为买家,转化率比其他平台高36%。通过Shopify Magic,您的AI驱动的全能助手,轻松销售更多。
你知道吗,Shopify支持美国10%的所有电子商务,并支持全球品牌,如Allbirds、Rothy's和Brooklinen?加入175个国家的数百万成功企业家,得到Shopify广泛的支持和帮助资源。因为成长的企业,都是和Shopify一起成长的。今天就开始你的成功故事。在shopify.com/5S注册体验每月1美元的试用期。
那是shopify.com/538。今天的播客由GiveWell赞助。你是一个注重细节的人。你想了解事物的真实运作方式。所以当你进行慈善捐赠时,你应该查看GiveWell,这是一个独立的资源,提供严格、透明的研究,关于伟大的捐赠机会,他们的网站甚至会让最注重细节的读者惊讶。
忙碌。GiveWell现在已经花费超过17年时间研究慈善组织,并且只将资金指向他们发现的少数高影响力机会。超过100,000名捐赠者使用GiveWell捐赠超过20亿美元。
严格的证据表明,这些捐赠将拯救超过200,000条生命,并改善数百万人的生活。GiveWell希望尽可能多的捐赠者能够对高影响力捐赠做出明智的决定。你可以在他们的网站上免费找到所有的研究和推荐,并且你可以对他们推荐的基金或慈善机构进行税前可抵扣的捐赠,GiveWell不会抽成。
访问GiveWell.org了解更多或进行捐赠。选择播客并在结账时输入538政治,以确保他们知道你是通过我们听说他们的。再次强调,访问GiveWell.org进行捐赠或了解更多信息。
在我们结束之前,我确实想谈谈一个话题,那就是,你知道,多年来我们因包括你提到的一些民调新手而受到了一些批评,他们为特朗普描绘了一个更美好的前景。我不需要点名。西蒙·罗森伯格等人曾表示。
这些倾向于共和党的民调者正在“淹没”这个领域,等等。我们是否得到了证明?我们可以停止谈论这个问题吗?我们还需要谈论淹没这个领域吗?是的,我认为,我确实认为我们仍然需要讨论聚合模型是否考虑了频率和家庭效应等问题。
适当地。但我会说,我们更全面的聚合方法得到了很好的验证。回想起2010年代初,当时非概率研究被左右批评为替代水平,而此时与现场电话民调相当,尽管在某些低质量的自愿参与在线面板中存在一些问题。我们讨论的有两个不同的问题。一个是
自愿参与的民调,通常表现良好。另一个是这些倾向于共和党的民调,并不代表所有自愿参与的民调,而是一种特定类型的民调,通常使用自愿参与的方法。
我们在《纽约时报》也做同样的事情,我认为许多其他负责任的汇总机构也是如此,那就是你包含所有内容,但你要考虑住房效应。根据历史准确性、方法论决策、透明度,你等待,这会降低很多民调的权重。所以,我的意思是,2022年很有趣,这是一个大问题。人们对此感到担忧,比如,
泛滥成灾和红色浪潮。这几乎更多地与人们在野外消费的民调有关,而不是他们看到的那些考虑了这些民调的平均值。今年我们没有看到这个问题那么多,主要是因为一些同样的民调机构显示的结果与其他民调机构显示的结果更相似。但我认为,当你查看平均值时,像聪明的汇总机构已经在考虑这些事情了,而且在2022年也是如此。
不过,我确实希望人们谨慎对待,不要太快更新他们的先验概率。这只是一年。如果你采取这种观点,我也采取这种观点,那就是大多数民调都应该受到类似的或相关的方向性无响应的影响。因为如果人们不回答一种调查方式,他们可能也不会因为他们内在的任何原因而回答另一种调查方式。这只是一个平均值陈述。这并非适用于每种类型的民调。
如果你采取这种观点,那么你需要很多选举来确定一种民调方法或民调机构是否比替代水平更好,或者仅仅是像平均调查一样。
我不希望人们从这一点得出结论,认为他们只需要阅读特拉法加、阿特拉斯情报和拉斯穆森报告就可以了,因为这在2018年是不正确的。在2022年也是不正确的。这些民调机构似乎确实有一种诀窍,那就是不会被影响其他类型模式的那种引力无响应所吸引。而且我
说实话,如果这种情况持续发生,他们应该为此获得赞誉,而且可能值得倾听一些关于他们正在做什么的其他反馈。但也有可能他们只是运气好,或者他们找到了一些在特朗普参与竞选的二三年内有效,但在未来无效的方法。这是完全可能的。民调专家们在这里玩的是一场漫长、漫长的游戏。所以人们不应该反应过度。
最后,我们对衡量美国人在民主社会中的想法和愿望这一项目的未来是否乐观?
是的。哦,是的。非常乐观。我们继续很好地理解美国人对什么感兴趣、关心什么、他们对民主的感受、他们的感受。我的意思是,我们在这方面没有谈论很多,你知道,我们准确地预测堕胎并不是一些人预期的那样主要的问题。如果你从民调预测选举结果的非常具体的用途退一步,并将民调理解为衡量民主社会中公众舆论的标准,
我认为我们有希望在未来几十年继续这样做。这是了解人们想法的最佳方式,而不是你那些与你感觉相似的人的小型泡沫生态系统。这是了解政治光谱上的人们感受的最佳方式。这并没有改变。
是的,有时我知道没有人收听这个播客,但有时我会在野外遇到一些人,他们会说,好吧,为什么会有这么多民调?为什么我们不直接与人们交谈?好吧,猜猜看?民调就是人。民调就是人。我就说到这里。谢谢,露丝和埃利奥特。谢谢。谢谢。
我的名字是加伦·德鲁克。我们的制作人是谢恩·麦基翁和卡梅伦·特雷达维安。您可以通过发送电子邮件至podcast.538.com与我们联系。当然,您也可以在推特上向我们提出任何问题或评论。如果您是节目的粉丝,请在Apple Podcast Store中给我们留下评分或评论,或告诉别人关于我们。感谢收听,我们很快再见。
睡够八个小时。使用Cox获得所有服务。互联网和无限流量的移动线路,包括Wi-Fi设备,无需签订年度合同。访问cox.com对角线加值。仅限新客户,限时优惠。无需签订年度合同意味着没有最低期限协议和提前取消费用。适用其他限制。