We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 538's New Polling Averages Show Close Presidential Race

538's New Polling Averages Show Close Presidential Race

2024/4/25
logo of podcast FiveThirtyEight Politics

FiveThirtyEight Politics

AI Deep Dive AI Chapters Transcript
People
G
G. Elliott Morris
G
Galen Druk
Topics
Galen Druk:就2024年美国总统大选的民调平均值进行了讨论,重点关注了特朗普和拜登在全国和各战场州的支持率,以及罗伯特·肯尼迪·小将的影响。分析了民调结果的潜在误差来源,包括系统性偏差和样本代表性问题,并探讨了影响选举结果的各种因素,例如种族极化、教育程度和投票率。 G. Elliott Morris:详细解释了五十三八的民调平均值模型,包括其数据处理方法、误差范围和对各种潜在偏差的调整。他分析了民调结果中阳光地带州和北方战场州之间的差异,并解释了这种差异可能由多种因素造成,例如民主党在非白人选民中的支持率下降、在低教育程度选民中的下降幅度更大以及白人选民在不同地区的差异。他还讨论了罗伯特·肯尼迪·小将的影响以及其支持率可能随着选举日临近而下降。此外,他还对民调的准确性和可靠性提出了担忧,并建议未来需要改进民调方法以提高其代表性和准确性。 Galen Druk: 对当前民调结果进行了总结,并与G. Elliott Morris 讨论了民调结果的意义和局限性。他强调了民调结果的不确定性,并指出民调结果不能完全预测选举结果,但可以帮助理解当前的竞选形势。他还就民调中可能存在的偏差和误差进行了讨论,并强调了对民调结果进行谨慎解读的重要性。

Deep Dive

Chapters

Shownotes Transcript

538总统大选民调平均值正式上线!这意味着不再需要逐个民调分析带来的反复震荡;如需了解全国和战场州竞选的整体情况,请访问abcnews.com/538。在本期538政治播客中,加伦与数据分析总监G·埃利奥特·莫里斯讨论了平均值的要点以及他们考虑的数据类型。了解更多关于您的广告选择的信息。访问megaphone.fm/adchoices</context> <raw_text>0 您是一位播客听众,这是一个播客广告。通过Lipson Ads的播客广告,接触像您一样优秀的听众。从数百个顶级播客中选择,提供主持人推荐,或在数千个节目中投放类似这样的重制广告,以通过Lipson Ads接触您的目标受众。立即访问LipsonAds.com。网址是L-I-B-S-Y-N-Ads.com。

好的,我准备好了。我已经打开了电子表格,也打开了您的页面,还有咖啡。你还需要什么吗?我不知道你是在开玩笑还是认真。总是开玩笑。我们是英国人吗?这是一个过于英国化的词吗?我不知道你是否错过了你一直在做的所有民调平均值计算,但这是美国。这些民调是苏格兰的。这就是它们看起来如此奇怪的原因。

您好,欢迎收听FiveThirtyEight政治播客。我是加伦·德鲁克,祝贺FiveThirtyEight民调平均值日快乐。是的,没错。今天我们发布了州和全国民调平均值。从今天起,将不再出现逐个民调的恐慌。每个人都会说,把它放到平均值里,

然后继续。就这样。当然,我开玩笑的。仍然会有很多恐慌,但亲爱的听众,您不必参与其中,因为您掌握了538的平均值。事实上,您现在就可以在538.com上查看它们。

但如果您更喜欢听觉学习,截至4月24日下午3点,特朗普在全国范围内领先拜登半個百分點,所以大致持平。在亚利桑那州、佐治亚州、内华达州等阳光地带州,也许还可以加上北卡罗来纳州,特朗普平均领先拜登4到6个百分点。在宾夕法尼亚州和密歇根州等北部战场州,特朗普领先约一个百分点,

而威斯康星州是特朗普唯一没有领先的州。在那里,这是一个势均力敌的局面。在全国范围内,小罗伯特·肯尼迪获得约10%的支持率,在战场州的支持率则为较高的个位数。在我们深入探讨之前,先快速说明一些注意事项。当然,距离选举日还有六个多月的时间,因此这些数字可能会发生变化,而且在现在到11月5日之间可能会发生相当大的变化。

这些数字周围也有误差幅度,我们稍后会讨论。这些数字也没有考虑系统性民调误差的可能性。这是选举预测的工作,当然,这即将到来。因此,事不宜迟,让我们来讨论一下数据分析总监埃利奥特·莫里斯。欢迎来到播客,埃利奥特。嘿,加伦。很高兴来到这里,并将我们的平均值公布于世。

这就像养育一个孩子,然后把它送入世界,你不知道它会产生什么影响。

你希望一切顺利,但有什么担忧吗?模型可能是个反社会者。我们还不确定。我们必须看看它在动物周围的行为。哦,天哪。好的,我还想说,如果您对这些平均值本身或对大选有任何疑问,您知道在哪里可以联系我, [email protected],或者当然,在推特上。所以,埃利奥特,首先,一个更私人的问题。这些平均值中的任何一个……

让你感到惊讶吗?或者你在整理平均值的这个过程中学到了你以前不知道的东西吗?好吧,就结果而言,我认为对大多数人来说最引人注目的发现是,所谓的阳光地带州(或非白人州)与那些白人战场州之间的差异。我的意思是,这两组州之间的平均差异为5到4个百分点,这与直觉相悖。

在过去十年里,民主党一直在非白人选民中获得支持,直到2020年这种转变,以及可能在2024年。所以这是一个叙事破坏者。特朗普在威斯康星州、宾夕法尼亚州和密歇根州的平均领先优势仅为一个百分点,但在佐治亚州和北卡罗来纳州则领先五个百分点。我认为这会让很多人感到惊讶。这具体是关于种族吗?

种族动态,也就是说拜登在白人选民中的支持率保持得更好,而在有色人种选民中的支持率下降?还是教育两极分化?我的意思是,我知道内华达州等地方的四年制大学学位获得率并不高,例如。这是否起到了作用?或者这真的是种族两极分化下降的故事?

我们没有交叉表平均值,所以我只能推测。我可以举一些例子。我要说的是,似乎有三种情况正在发生。是的,民主党在非白人选民中失去了一些支持,包括黑人和西班牙裔选民。这似乎比几个月前炒作的40个百分点的变化要小一些。我的意思是,也许是五个。

所有这些州的边际变化总共只有五个百分点。因此,根据定义,任何一个子群体都不可能发生海啸般的变化。因此,对于种族两极分化,是的,种族两极分化减少了。它似乎主要发生在人口中受教育程度较低的选民中。这就是为什么内华达州和亚利桑那州的下降幅度可能更大,因为那里的整体受教育程度低于中西部各州。

然后是白人选民,是的,他们在全国不同地区的情况有所不同。北方比南方更世俗化。所以拜登可能在这些人中做得更好。他们当然受教育程度略高。他们与传统上与民主党利益相关的工人阶级政治联系更紧密。例如,使用启发式方法,比如工会。是的。

我认为把所有这些加起来,今天的民主党看起来有点白,而且看起来更像是一个由白人选民组成的工人阶级政党,但对非白人选民来说并非如此。距离大选还有很长时间。谁知道这是否会持续下去?但今天看来是这样的。需要明确的是,如果今天是选举日,而且这些民调是准确的,那么特朗普将赢得选举人团,而且还会以半個百分點的优势赢得全国普选票。当然,正如我们提到的,距离选举日还有六个多月的时间。

但是当我们查看选举人团的计算方法时,看起来拜登必须赢得威斯康星州(这是一个势均力敌的局面)、宾夕法尼亚州和密歇根州,并且可能会输掉我们在这里讨论的其他州才能达到270票。在这三种上中西部/铁锈带州中,哪一个州将成为这种情况下的临界州?是的。

所以今天是密歇根州,特朗普以1.3个百分点的优势领先拜登。再说一次,不要把这当成金科玉律。我们会讨论到这一点。但至少密歇根州现在是北部战场州中最共和党的州。这是特朗普首先赢得的州。

按顺序排列,这是让他获得第270张选举人团选票的州。宾夕法尼亚州紧随其后,为负一个百分点,所以可能是这两个州中的任何一个。但威斯康星州看起来是最蓝的,如果你在2016年和2020年查看这些临界概率,我认为这有点令人惊讶。好吧,埃利奥特,如果你熟悉威斯康星州民调误差的历史,这可能并不令人惊讶。触发了。我的意思是,我们可以……

如果我们想的话,可以直接深入探讨。我的意思是,我们确实在威斯康星州看到了相当糟糕的民调,所有州都是如此。你知道,我相信随着我们越来越接近选举日,我们会更多地讨论这个问题。但在过去两次总统大选中,全国范围内的误差大约在2到4个点之间。但人们意识到民调误差似乎并不像

比这更大,或者出现比这更大的意外,部分原因是选举人团的情况。我们在一些州看到了相当大的民调误差,特别是像威斯康星州这样的州。你对今天民调准确性的现状感觉如何?平均值试图做的是找到我们获得的所有民调数据中最可能的趋势线。

你知道,我们想知道的是,今天的公众舆论大致是什么样的。这与这些测量值的质量无关。我们应该就此再做一个播客。

当所有民调都在抽样调查同一批高度参与政治的人口,而回应率低于1%时,存在很大的风险因素。出现失误的可能性很大。人们必须记住这一点,但这对我们的预测来说是一个数量问题,而不是平均值。

需要明确的是,这些民调周围存在误差幅度,但这并不是潜在误差的来源。它既不是来自民调中的系统性错误,也不是来自距离选举日还有六个月的时间。它更多地来自民调本身就存在误差幅度这一事实。那么这些禁令有多大,在我们进一步深入研究这些数字之前,先让大家了解一下?

因此,如果您今天访问该网站,您会看到全国民调平均值周围大约有两个百分点的置信区间,而在州一级则接近四到五个百分点。这种不确定性代表了我们对公众舆论状态的不确定性,这是通过这些民调揭示的,没有考虑任何系统性偏差或距离选举日剩余的时间。这不是预测。

你知道,我们在密歇根州只有六个民调或类似的东西。每个民调都有自己的误差幅度。那么,如果我们去掉其中一个民调会发生什么?或者如果该民调的结果不同,这会如何影响平均值?我们还将讨论我们对这些民调进行的所有调整,以试图解释民调机构和方式等偏差。所有这些调整也带来一些不确定性。所以我们试图表达,对,即使我们有一个最可能的平均值,因为数据中存在噪声,而且今年的民调数据中存在大量噪声,让我告诉你,平均值中也存在不确定性。噪音听起来像什么?砰。我不知道。好吧,剪辑一下。我们要把它做成一个按钮。从现在到选举日,我都会一直按它。

埃利奥特,之前曾有人谈到选举人团普选票差距的减少。部分原因是我们在讨论的铁锈带和阳光地带之间的这种分裂,那就是如果铁锈带对拜登的支持率保持得更好,那么共和党在选举人团中的优势可能就不会那么大了。根据这些平均值,这种情况似乎已经实现了吗?

因此,今天的民调平均值确实显示,共和党(特朗普)的选举人团优势有所下降。威斯康星州是2020年的临界州。拜登以0.7个百分点或类似的优势赢得了它。他在全国范围内的领先优势为4.5个百分点。因此,那里的偏差在三个百分点以上。对。

现在,密歇根州(临界州)与全国范围内的差距大约是一个百分点,尽管它一直在大幅波动。再次提醒,所有这些噪音都是买方自负。所以几周前,它接近两个百分点。现在是一个。它可能会回升。

因此,如果保持全国普选票不变,这是一种下降,是对拜登选举人团前景的相对改善。换句话说,如果2020年的一切都相同,并且你拥有这种程度的选举人团普选票差距,那么拜登将更有可能赢得比他实际赢得的更多选举人团选票。

这部分是因为我们一直在讨论的种族两极分化减少了,对吗?是的,这是因为拜登在那些北部战场州的地位有所提高。如果你把所有阳光地带摇摆州,内华达州、亚利桑那州、佐治亚州和北卡罗来纳州都交给特朗普,他将获得268张选举人团选票。顺便说一句,这是一场非常接近的选举。这就像副总统候选人的事。你是在试图在选举人团中制造平局吗?呃,

不,我永远不会希望某个选举结果,尤其是混乱的结果。但如果发生了……但如果发生了,你将别无选择,只能每天收听这个播客两个月。我相信人们会一遍遍地剪辑它。他不在乎混乱。

所以,对。所以是268。特朗普必须再赢得一个州才能赢得选举人团。但拜登在这些州的表现比你预期的要好。在那些北部战场州,他的表现比你在那些南部战场州的表现所预期的要好大约三个百分点。所以这一切都取决于那些北部各州。嘿,你之前指出了,最近那里的民调相当糟糕。所以不要把这当成金科玉律。但至少民调就是这样说的。是的。

是的,说到要对民调误差保持开放的心态,我认为我总是告诉人们,我们应该对战场州将会是什么保持开放的心态。考虑到所有因素,这是一种相当狭隘的理解选举的方式。我们可以包括北卡罗来纳州。我们可以包括明尼苏达州、缅因州、新罕布什尔州。有很多州,比如说,特朗普的地位提高了一到两个点,都在发挥作用。

有些州,我的意思是,拜登必须大幅提高他的地位,才能开始让一些曾经被认为是战场州的地方,比如爱荷华州、俄亥俄州或佛罗里达州发挥作用。民调看起来怎么样?就目前而言,明尼苏达州是否比亚利桑那州或佐治亚州更接近?

所以我们在新罕布什尔州没有任何民调。我们在缅因州和明尼苏达州确实有一些民调。这些民调并不违反直觉。如果你只是让每个州……

根据全国投票所暗示的情况,向特朗普倾斜五个百分点,你就会得到同样的答案。在新罕布什尔州和缅因州,这是一场势均力敌的比赛,在明尼苏达州,可能略微倾向于民主党,这基于邻近州拜登的剩余超额表现。所以,我认为当我们达到根据这些民调和其他因素模拟选举人团结果的地步时,

不会有非常宽的尾部,因为没有很多竞争激烈的州,但会有很多我们所说的质量,非常高的可能性,一场势均力敌的选举会以任何一种方式结束,仅仅是因为竞争激烈的州数量众多。看,现在它倾向于特朗普,选举,正如我们指出的那样。但是,是的,围绕这一点有很多不确定性,尤其是在我们还没有民调的州。

从数量上来说,距离选举日还有六个月零两周,我们应该对民调寄予多少希望,也就是说,我们应该预期这些民调会有多少变化?是的,如果你试图用这么早的民调来预测选举,你就会有这段时间。这对于我们来说是有用的,因为它可以帮助我们理解目前存在的竞选活动,并试图弄清楚

就像在新闻编辑室里,我们可以根据此做出报道决策。哦,看起来缅因州正在发挥作用。我们可能应该派一名记者去那里。如果你是一个竞选团队,这对你是有用的,因为你想知道你是否需要在某些地方分配资源。我认为,如果你是一个读者,这对你是重要的,因为……

任何特定时刻的公众舆论都很重要。它会影响……我们生活在一个民主社会中。人们的想法很重要。我们生活在一个社会中。但这对早期预测选举结果并没有用。我的意思是,如果所有民调都显示拜登领先10个百分点,那么你应该将你对11月份的预期校准得更倾向于拜登,而不是太多。如果特朗普在所有这些州都领先10个百分点,那么就会像,哦,拜登面临着一场艰苦的战斗。

现在,所有这些都足够接近,以至于在全国范围内,拜登领先5个百分点到特朗普领先5个百分点之间,都是完全合理的猜测。在任何一个方向上,350张选举人团选票之间的任何数字,也都是完全合理的。这是很接近的。所以它可以用作一个信号,但不能真正用作谁会获胜的信号。

说到民调变化,如果人们访问530.com,他们会看到平均值追溯到3月初。因此,您已经可以看到它们是如何随着时间的推移而变化的。您会看到,根据3月1日的平均值,特朗普在全国范围内领先拜登两个百分点。现在,领先优势接近半個百分點。我们已经在播客中讨论过拜登的一些变化,无论是在

认可方面还是其他方面。这里发生的事情很清楚吗?我的意思是,我们不应该对半個百分点的领先优势大惊小怪,我们可能也不应该对一点半的变化大惊小怪。但是,如果你必须确定过去一个月半的趋势,那是什么?

看,我不会对一个民调或一个州的四到五个百分点的变化解读太多,但平均值旨在消除噪音。因此,拜登得票率增加两个百分点或特朗普得票率下降两个百分点可能很重要。我认为我们可以解读这一点,并说,哦,这是真正的变化。这是公众舆论的真正变化。所以……

为什么会发生这种情况?我可以想到几个假设。所有这些显然都与推测相反。特朗普再次成为新闻焦点。如果你回顾过去十年,查看显示民主党或共和党候选人(包括希拉里·克林顿)媒体报道的图表,你会看到他们的优势与民调之间存在相当明显的反向关系。也许拜登正在看到一点国情咨文演讲的推动,或者像初选获胜的推动。

或者如果它消退的话,就会反弹。但这都是推测。平均值并不是因果推断的工具,就其本身而言,它可以帮助我们讨论政治和识别趋势,但不能解释原因。是的,这就是困难之处。数据总是告诉我们是什么,但它很难告诉我们为什么。我想另一种了解原因的方法是,变化在哪里?它是否发生在……

3月份对拜登持负面看法的人现在说他们会投票给拜登。它是否发生在那些一个月半前根本没有意见的独立人士身上?它是否发生在小罗伯特·肯尼迪的选民身上,我们已经看到他们的一些?我们即将讨论他。我们已经看到他的一些支持率下降,他们说,我以为我会投票给小罗伯特·肯尼迪,但我过去一个月半发现他与我对拜登的看法不一致。

X或Y政策。变化发生在谁身上很清楚吗?是的,它在所有群体中都相当平行。就像我说的,密歇根州、宾夕法尼亚州和威斯康星州的变化更大一些,在某种程度上,爱荷华州和俄亥俄州也是如此。所以,你知道,我认为你可以解读这一点,并说,媒体非常喜欢关注的传统温和摇摆选民群体,为了特朗普的第一次选举,也许他们正在

他们正在移动,温和派。但同样,我们仅从交叉表中获得的证据表明,拜登增加了他的得票率,巩固了他对那些传统民主党群体的支持,尤其是黑人和年轻的美国人。我认为我四五个月前在这个播客上,我们当时正在讨论我们是否

相信年轻美国人之间的赛马数字。我们当时的理论是,当人们在电话上回答陌生人,或者在他们的手机或电脑上回答互联网上的空盒子时,他们访问他们头脑中不同的信息,而不是他们实际上会在11月份投到选票上的信息。当时,这些信息是

看看拜登在经济、以色列、加沙、移民等方面表现得多么糟糕,总的来说,他很老。语气只是负面的。所以现在语气似乎好了一些。我们似乎正在看到更多复苏。同样,我们似乎也在那些可能更多地从他们的回应中获取这种语气的选民中看到了更多复苏。但是。

这将是一个非常好的调查实验,供某人进行。交叉表不一定能回答这个问题。好的,所以小罗伯特·肯尼迪在全国范围内获得了大约10%的支持率。在战场州的支持率略低一些。大约是8个百分点左右。

我说的是优势,但拜登的得票率约为41个百分点,特朗普的得票率约为41个百分点,大致在全国范围内。因此,显然,这两位候选人都没有获得多数票。将这两者加起来,你大约得到了82%的选民。你可能还会为小罗伯特·肯尼迪增加9个百分点。这将使你接近92%。还有一些人说,也许他们不投票,他们投票给第三方候选人,等等。

当你完全不考虑小罗伯特·肯尼迪时,这会改变多少比赛?我们正在关注什么样的优势?当肯尼迪被列入调查时,对特朗普和拜登的支持率都会下降约三个百分点,但对拜登的支持率下降更多。对拜登的支持率下降约3.4个百分点,对特朗普的支持率下降约三个百分点。所以大约有4%的人……

通常会说,我会投票给其他人。然后,如果你提到小罗伯特·肯尼迪,更多的人会投给他。当这种情况发生时,对乔·拜登的惩罚大约为四分之一到半個百分点,0.4个百分点。那里的中位数估计是不确定的。

通常,当我们在本播客中谈论小罗伯特·肯尼迪时,人们会说,好吧,也许他今天获得了10%的支持率,但这可能无法持续下去。随着我们越来越接近选举日,他会崩溃。这就是第三方候选人总是发生的事情。你同意这种说法吗?你认为有什么理由可以预期他的支持率会比过去的第三方候选人保持得更好吗?在我们对预测的研究中,为了说明这一点,在4月下旬和5月初,我们发现对第三方候选人的支持往往会下降约一半。

因此,我们应该预期这些选票中有五个百分点会流向任何一位候选人。同样,今天平均值的推论是,乔·拜登将从中获得更多收益,大约0.4个百分点。所以我们不知道这是否属实。就像在11月份,这些选民的实际构成是悬而未决的。因此,这种影响显然在零的误差幅度之内。我们真的不知道。你知道,如果你假设小罗伯特·肯尼迪是一个典型的独立候选人,

那么你会对这些数字解读更多。就我个人而言,我认为我们今天在政治中看到了更多的不满和疏离,尤其是在年轻选民中。我一直都在这种假设下运作,使用一些交叉表作为一些轻微的轶事证据。

他确实比加里·约翰逊或吉尔·斯坦等传统候选人拥有更强的持久力,尤其是在年轻选民中,他们似乎并没有真正利用肯尼迪今天拥有的相同媒体生态系统和在线生态系统。

你知道,对我来说,平均值的一个重要收获是,两位主要政党候选人都没有接近50%。而且看起来我们很可能会最终陷入一种情况,那就是在11月5日之后,没有一位候选人会获得公众的多数授权。

如果你查看特朗普和拜登今天的支持率,并将其与他们的民调平均值进行比较,你会发现那些赞成特朗普的人说他们会投票给他。那些赞成拜登的人说他们会投票给他。这意味着大约有20%的选民大致上对这两位候选人都没有好感。所以这指的是,你知道,这个双重讨厌者群体,那些对特朗普和拜登都持负面看法的人,以及他们将要做什么。他们可以投票给小罗伯特·肯尼迪,

或者其他第三方候选人,他们可以勉强投票给拜登或特朗普,或者他们根本不投票。让我们首先解决这个问题。鉴于拜登和特朗普的数字目前如此糟糕,你认为这很可能会成为一次投票率低的选举吗?完全是。人们说他们对投票的兴趣下降了。

现在对投票给任何一位候选人的热情都低于2020年,尤其是拜登的支持者,那些上次投票给他的人。所以老实说,我认为我们的模式假设应该是投票率将低于2020年。人们有点厌倦了。这是同样的比赛。肯尼迪并没有带来很大的新奇因素。结果证明下降幅度接近六个百分点。我的意思是,这将是很多,但这在历史上并非史无前例。

有趣的是,你说拜登的选民似乎特别没有投票的热情。当民调机构进行民调时,他们可以查看所有美国成年人,他们可以专门查看注册选民,或者他们可以进一步收紧镜头,只查看可能的选民。

而且看来,当你查看可能的选民时,拜登的表现比你查看注册选民时要好一些,也就是说,在最可靠的选民中,在选民中最有可能实际出来投票的人中,拜登的支持率更高。这种优势有多大?有没有什么原因?

这里存在两种相关性。一种是你的受教育程度越高,你投票的可能性就越大,对吧?也许你更接近一些灌输了你这种投票美德的公民教育。也许你接触到的投票社会群体、媒体广告或其他东西更多。你只是更了解。同样,存在一种相关性,尤其是在白人选民中,但在整个国家中也是如此。你的受教育程度越高,你投票给民主党的可能性就越大。

所以,你知道,这是一个可靠的发现。因此,民主党人越来越依赖受过教育的选民,他们在投票率较低的选举中表现更好,这完全不足为奇。这一发现是有道理的。如果我们现在没有看到这一点,那几乎会令人惊讶。好了,以防万一还不够书呆子气,现在我们要更书呆子一点了。

今天的播客由Shopify赞助播出。准备好为您的业务做出最明智的选择了吗?向Shopify问好,这是一个全球性的商业平台,让销售变得轻而易举。

无论您是开设在线商店,还是开设第一家实体店,还是达到百万订单,Shopify都是您的成长伙伴。使用Shopify的一体化电子商务平台和店内POS系统,随时随地销售商品。使用Shopify转换率最高的结账系统将浏览者转化为买家,比其他平台高出36%。借助Shopify Magic(您的AI驱动的全明星)轻松销售更多商品。您是否

知道Shopify占据了美国所有电子商务的10%,并支持Allbirds、Rothy's和Brooklinen等全球品牌?加入遍布175个国家的数百万成功企业家,他们得到了Shopify广泛的支持和帮助资源的支持。

因为不断发展的企业,都与Shopify一起成长。立即开始您的成功故事。在shopify.com/538注册每月1美元的试用期。这是数字,而不是字母。shopify.com/538。

今天的播客由GiveWell赞助播出。您是一个注重细节的人。您想了解事情的真正运作方式。因此,当您向慈善机构捐款时,您应该查看GiveWell,这是一个独立的资源,用于对优秀的捐赠机会进行严格、透明的研究,其网站甚至会让最注重细节的读者

忙碌不堪。GiveWell现在已经花费了17年以上的时间研究慈善组织,并且只将资金定向到他们发现的少数几个影响力最大的机会。超过10万名捐赠者使用GiveWell捐赠了超过20亿美元。

严谨的证据表明,这些捐款将挽救超过20万人的生命,并改善数百万人的生活。GiveWell希望尽可能多的捐赠者对高影响力的捐赠做出明智的决定。您可以在他们的网站上免费找到他们所有的研究和建议。您可以向他们推荐的基金或慈善机构进行免税捐款。GiveWell不抽取佣金。

再次强调,网址是givewell.org,您可以在这里捐款或了解更多信息。

您用来计算平均值的模型正式称为贝叶斯多层次动态线性模型,它使用称为马尔可夫链蒙特卡罗的统计方法进行拟合,我想明确一点,我完全理解这是什么意思。Galen,拜托,你得告诉大家。对于普通听众来说,这到底是什么意思?

这是什么意思?- Galen,你对无U转采样器了解多少?- 一切。- 太棒了。- Elliot,用最通俗易懂的术语来说,我们现在在谈论什么?-民调平均值通常遵循三种方法之一。一种是您获取所有民调,并将它们放入Excel电子表格中,然后对过去30天发布的民调进行平均。也许您会对过去一周发布的民调给予更多权重,或者其他什么。或者您可以通过点绘制趋势线。

想象一下您本科统计学课程中,图表上显示的是

身高在x轴上,体重在y轴上。通常情况下,随着身高的增加,体重也会增加。为了准确了解这种关系,您会在这些点上拟合一条直线。或者您可以将它们结合起来,这可以做得很好。它允许您在更接近选举时对更激进的趋势线给予更多权重,这是一种新颖且重要的做法。所有这三种方法都存在一个统计问题,即

如果您分多个步骤进行建模,例如先取平均值,然后进行调整,然后再取平均值,并在其上进行调整,并将所有这些东西堆叠在一起,那么您将无法可靠地衡量数据中的不确定性。因此,我们选择了一种稍微复杂一点的方法,以便我们可以比民调平均值更恰当地考虑这种不确定性。

归根结底,我们是在进行曲线拟合。我们正在通过点绘制趋势线。事实上,我们的模型的工作方式非常酷,因为它同时绘制了所有州所有政党支持率的趋势线。我们进行各种调整,例如针对房屋效应(我稍后会正确列出)。但重要的是人们要知道,这旨在恰当地考虑不确定性。这就是您从马尔可夫链蒙特卡罗模拟中获得的结果。

那么您同时试图考虑什么呢?民调机构的偏差,根据我们的民调机构评级进行的评级,还有什么?想象一下,您现在是一名民调机构,正在尝试生成民调。

您必须获得要呼叫的人员列表,然后呼叫他们,编写访谈问卷,并对他们进行访谈。您会以某种方式对数据进行加权,使其具有代表性,以解释上述民调的响应率低于1%,然后将其发布。所有这些选择都可能影响民调的结果。因此,我们希望考虑哪些民调机构进行了这项民调的影响,我们通常将其称为房屋效应。我们还发现,在

在线来源发布的民调和通过电话发布的民调之间存在系统性差异,尤其是在质量较低的在线来源中,那些没有对进入样本的人进行控制的来源。因此,一些在线民调机构使用来自已注册的大量人群的代表性样本。这非常有趣。

这要好得多。你知道,我们希望考虑正在抽样的总体。可能选民的民调更适合预测选举。因此,我们将民调调整到可能选民的总体。您已经讨论过肯尼迪的第三方调整。然后就是随机性。民调可能会因为

与所采访样本相关的许多因素而出现偏差。例如,也许昨天接电话的人只是怪人。这称为抽样误差。然后还有一些非偏倚的随机来源,这些来源可以在流程进行过程中进入您的民调。这称为非抽样误差。我们也会考虑这些因素。所以……

老实说,如果您听到这个并认为,好吧,这听起来像是民调出错的许多不同方式。是的,这就是重点。这就是为什么我们进行大量不同的民调并将它们平均在一起的原因。我们只想确保我们正在进行,我们正在正确地衡量所有这些可能出错的不同因素的影响,以便我们可以讲述关于它们的故事并交流民调中正在发生的事情。因此,模型考虑的一部分是,

削弱了可能的异常值民调可能对平均值产生的影响。出于好奇,这是否有可能,例如,过度强调传统观点,对吧?就像一个古老的故事一样,选举前一周,安·塞尔泽在爱荷华州发布了一项民调,显示……

以8个百分点的优势获胜,而民调平均值显示这是一个势均力敌的局面,实际上安·塞尔泽是对的。你知道,它最终比之前预期的要接近得多。当然,我在这里谈论的是2020年。模型是如何考虑这一点的,你知道,你不想过度拟合传统观点,并且,你知道,

最终得到一个半心半意的平均值,并对异常值可能是领先指标的可能性持开放态度。是的,您可以通过多种方式做到这一点。我们还考虑了民调机构的评级,即538民调机构对民调机构的评级。因此,如果您在历史上是一名优秀的民调机构,并且您已经通过经验证明您的异常值是良好的、可靠的信号,那么该模型将考虑这一点,并比其他情况更接近您。但是

从哲学上讲,实际上没有真正的方法可以忽略异常值民调。如果您相信,我认为这在经验上是正确的,即长期民调的平均值比任何单个民调在整个期间的准确性都要高,类似于,你知道,就像指数基金通常在股市中击败对冲基金一样,那么您就需要取平均值。如果您不相信这一点,那么您应该成为民调机构并自己动手。

我们倾向于相信,这在我们工作中也得到了经验上的证明,即所有民调的平均值,考虑到所有其他因素,并根据模型的决定对比赛中的移动量做出适当的反应,是更好的方法。

这让我们回到了,在许多方面,平均值与民调一样好。在2016年,显然,全国民调的偏差约为2个百分点,但在一些战场州的误差有所增加。

这意味着选举的结果与全国民调所表明的结果并不一致。甚至在2020年,上中西部战场州也表明,误差更像是4个百分点。因此,选举的结果仍然与民调所表明的结果一致,但人们觉得,哇,这比我根据进入时的平均值和预测所预期的要接近得多。我们解释2016年方式是

好吧,我们没有按教育程度进行加权。我们错过了这种沿教育线划分的两极分化,最终产生了非常大的影响。因此,虽然我们可能在民调中获得了大量共和党人,或者我们可能获得了大量民主党人,即使与他们在选民中的存在比例成比例,我们也得到了错误的人。我们的样本中没有足够的非大学学历选民。因此,我们错过了一些表面之下正在发生的事情。

在2020年,各种解释再次出现,但其中之一是COVID,对吧?您所处的环境中,一方在更大程度上鼓励其选民待在家里,不参加社交活动等等,并且可能更容易接听电话,并且更倾向于这样做。最倾向于投票给拜登的人更倾向于接听电话,您可能在那里会有一些错误。

您不可能现在就查看环境。是的,让我把我的水晶球从壁橱里拿出来……拿出你的水晶球,看看此刻可能存在哪些担忧。但是……

我想给你这个机会。如果您要说,这是我此刻对民调的担忧,在我们实际发生之前,我们将无法进行这种事后分析。但在开始时,您有任何担忧吗?因为在2016年之后,更多的人开始按教育程度进行加权。在这一点上,疫情已经结束。因此,如果这就是原因,那么它在2024年将不会成为问题。我们现在处于什么位置?

在回答这个问题时,我只想谈一件事。经常被引用为对平均值的批评的另一件事是2022年。好吧,这纯粹是胡说八道。平均值在22年是正确的。好吧,平均而言。我不会容忍这种胡说八道。

如果您对州一级误差进行平均,那么当然可以。但是有一组参议院竞选,平均值中存在右倾偏差,这来自发出信号表明他们正在采取不同措施来试图提升声音的民调机构——

低社会信任度,或通过某种奇怪的方法来支持该群体,从而获得更多倾向于共和党的选民。他们在其他民调良好的选举中产生了更倾向于共和党的投票结果。就像与过去的战斗作斗争可能会让你陷入困境。是的,这些民调机构正在与过去的战斗作斗争,而平均值实际上无法处理这种情况。现在,我们今年的平均值的工作方式通过考虑……来解决这个问题

所有民调机构的全国房屋效应。如果您在宾夕法尼亚州、密歇根州、佐治亚州和亚利桑那州发布可靠的共和党调查,那么您今年将获得比以前的方法所提供的更强的房屋效应。我们确实尝试过考虑这一点。现在,再次强调,正如您所提到的,如果所有民调都因为人们接听电话或填写在线表格的方式而存在偏差,

导致偏差,我们对此无能为力。我们受制于美国良好、高质量的公众舆论数据,我们可以尽最大努力

辨别趋势、有偏差的公司和历史上更准确的公司等等。但归根结底,如果所有民调都偏离10个百分点,那么平均值将偏离5到10个百分点之间。但要回到您的问题,我认为确实有一些事情需要担心。我认为民调过度代表积极参与的美国人存在问题,这通常可以通过加权来解决,但今年可能无法解决。由于政治分歧似乎正在上演

你知道,在新闻中,这会对回答民调的人的类型产生残留影响,这些人非常关注新闻,而不一定是更广泛的公众。因此,当我之前谈到您有一群民主党人正在对有关乔·拜登的民调进行抗议回应时,那么从某种意义上说——

导致拜登的数字低于他们实际投票的情况。但我同时也担心那些不回答民调并且通常不参加选举的人的总体代表性。而这些往往是相同类型的人。

这与我们在2020年看到的偏差类型相似,但这次可能会更加夸张,民调没有代表那些不志愿服务或不经常发布政治言论的美国人。如果这些群体像……

受通货膨胀的影响更大,或者普遍对事情的发展方向或参与对外战争感到不满,那么民调将高估对民主党的支持,低估对共和党的支持。我认为我们需要在这里做更多工作。再次强调,在我们进行选举之前,我们的情况会变得更加清晰。但当然,您提出的警告是,我们永远无法真正知道民调误差的方向是什么。因此,我们的预测将相对不受此影响。

但当然,我们对民调可靠性所讲述的故事是我们参与此类对话时增加很多内容的地方。最后一个问题。如果您能获得更多的数据,那会是什么?

我希望美国的每个民调都能发布他们加权的变量。在2016年,我们有这种严重的偏差集中在那些没有确保其样本中有足够非大学学历(尤其是白人,但所有选民)的民调机构中。

提前知道这一点并对其进行索引,在您的平均值中考虑这一点,例如对按更多变量进行加权的民调机构给予更多权重,或者寻找具有不同加权方案的民调之间的系统性差异,这实际上有助于您的模型工作。我们可以对此进行一些粗略的反向测试,这将是我们预测模型的一部分,我们将在其中考虑我们认为做得更好的民调机构组

超越我们对您的评级。这在过去的样本外选举中有所帮助。但我们没有民调级别的这种粒度数据,因为许多民调机构只是没有告诉我们他们是如何进行民调的。我将在这里做一个额外补充。

如今,许多民调机构都在混合使用方法。他们通过电话进行民调,在线进行民调,通过短信进行民调,并将它们合并在一起,称之为一项民调。这并不是您想要进行此操作的方式。您需要寻找不同方法之间、在不同模式下获得的人员类型(尤其是在子群体中)之间的系统性差异,然后将这些

考虑因素纳入某种模型、您的加权方案中,并考虑这一点。这今年也可能导致很多错误。我们应该回到挨家挨户敲门吗?哦,太棒了!你有1000万美元吗?民调机构只是在社区中随机行走并挨家挨户敲门?让我们开始吧。Elliot,就此,我们今天就要说再见了。

我会提醒大家,他们可以在FiveThirtyEight.com查看这些平均值。此外,如果您对这些平均值或选举有任何疑问,请访问FiveThirtyEight.com或Twitter上的播客。但就目前而言,谢谢您,Elliot。嘿,谢谢,Galen。

我的名字是Galen Druk。我们的制作人是Shane McKeon和Cameron Chertavian,我们的实习生是Jayla Everett。Jesse DiMartino负责视频编辑。正如我提到的,您可以通过[email protected]与我们联系。您当然也可以在Twitter上向我们发送任何问题或评论。如果您是节目的粉丝,请在Apple Podcast Store中给我们留下评分或评论,或告诉别人关于我们。感谢收听,我们很快再见。