We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Is The Eurovision Song Contest Rigged?

2023/5/18

FiveThirtyEight Politics

AI Deep Dive AI Chapters Transcript

People

Courtney Kennedy

Galen Drew

Gianluca Baio

Topics

Gianluca Baio：通过构建贝叶斯模型分析欧洲歌唱大赛投票数据，研究是否存在系统性偏见。结果表明，虽然存在一些国家之间相互投票的轻微倾向，以及一些歌曲特征（如语言、演唱者性别）对投票结果有轻微影响，但这不足以解释比赛结果，也没有证据表明存在系统性地歧视任何国家。英国脱欧前，曾有观点认为英国在欧洲歌唱大赛中总是名落孙山，是欧洲国家歧视英国的表现，但该研究并未发现支持这一观点的证据。此外，他还指出，媒体宣传、各国的积极参与以及一些非歌曲本身的因素（如举办地选择、纪念活动等）也可能影响投票结果。 Galen Drew：介绍了皮尤研究中心关于美国民调现状的调查结果，指出如今的民调行业与2000年相比发生了巨大变化，民调方法多样化，准确性也存在挑战。讨论了民调方法的准确性、成本以及公众对民调的信任度等问题。 Courtney Kennedy：详细阐述了当前美国民调行业面临的挑战，包括样本代表性不足、不同民调方法的准确性差异、以及如何有效地接触不同人群等。她指出，2020年大选后，民调机构对方法的调整比2016年更大，这反映了行业对提高准确性的重视。同时，她也指出了在不同民调方法中，在线调查是目前最流行的方法，但其准确性也存在问题，需要进行大量的加权处理。

Deep Dive

Chapters

The podcast episode explores the long-standing accusations of bias in the Eurovision voting process, featuring an interview with statistics professor Gianluca Baio who created a model to detect potential biases.

Shownotes Transcript

自1956年以来，欧洲各国每年都会聚集在一起参加欧洲歌唱大赛——这是一场主要由流行和电子音乐艺术家参加的比赛，它常常让人感觉像是对欧洲音乐品味的戏仿。长期以来，人们一直指责投票过程存在偏见，上周六的比赛——瑞典获胜——也不例外。在本期播客中，加伦与统计学和健康经济学教授吉安卢卡·拜奥交谈，他创建了一个模型来确定是否存在真正有利于或不利于某些国家的偏见。加伦还与皮尤研究中心方法和创新副总裁科特尼·肯尼迪交谈，她最近发表了一项研究，该研究表明，今天的民调行业与本世纪初的民调行业几乎没有相似之处。拨打座机电话的真人时代已经过去了，但这对公众舆论研究的准确性意味着什么呢？了解更多关于您的广告选择的信息。访问megaphone.fm/adchoices</context> <raw_text>0 您是一位播客听众，这是一个播客广告。通过 Lipson Ads 的播客广告，接触像您一样的优秀听众。从数百个顶级播客中选择，提供主持人推荐，或在数千个节目中投放像这样的复制广告，以通过 Lipson Ads 接触您的目标受众。立即访问 LipsonAds.com。网址是 L-I-B-S-Y-N-Ads.com。

我认为，自欧洲歌唱大赛创立以来，其本质和核心一直是一种非常具有政治意义的声明。它的目的是将铁幕以东的所有欧洲国家团结在一起，并在战后为重聚制造轰动效应。所以，它从定义上来说就是一个政治行动。

您好，欢迎收听 FiveThirtyPolitics 播客。我是加伦·德鲁。今天的节目可能应该附带一个书呆子警告。所以在周一的播客中，我们开玩笑地问民调专家他们最喜欢的民调是什么。好吧，今天我们将实际查看一个民调专家的民调。

皮尤研究中心最近发布了他们多年来一直在进行的民调专家调查结果。基本上，他们会询问民调专家他们用来接触美国人的方法。他们发现，今天的民调行业与 2000 年的民调行业几乎没有相似之处。

在本世纪初，大约有 29 家全国性民调机构，所有这些机构几乎都完全依赖于真人通过电话随机拨打受访者。

如今，大约有 69 家全国性民调机构，只有 4% 完全使用随机拨号。民调机构的数量和民调方法都显著增加了。所以今天和我一起讨论这对我们这些试图弄清楚美国人真正想法的人意味着什么的是皮尤研究中心方法和创新副总裁科特尼·肯尼迪。欢迎来到播客。非常感谢。

我还应该提到，对于任何欧洲歌唱大赛的粉丝，特别是任何对上周末的结果感到困惑的人，在节目的后面，我将与伦敦大学学院的一位统计学教授一起，他创建了一个贝叶斯模型，是的，一个贝叶斯模型来检测欧洲歌唱大赛投票系统中的偏差。你以为民调专家的民调会是你今天听到的最肮脏的事情。无论如何，我们将讨论这个问题。但是科特尼，让我们谈谈民调。

首先，民调专家除了让真人随机拨打美国人的电话外，还在做什么？他们正在做各种各样的工作。这是有趣的、高级别的发现之一。这并不是说该领域已经确定了一种方法，而是我们发现使用了许多不同的方法，不同类型的在线民调。我们有

使用通常被注意到的在线民调，例如选择加入的面板或河流样本。您还有其他在线民调实际上是在线下招募的，以试图保留概率抽样的元素。

然后通过这项研究，我们还看到了诸如短信之类的、越来越多的新兴方法的增长。我们发现，大约 10% 的全国公共民调专家正在使用短信。通常不是他们接触公众的唯一方式，但这是一种补充的方式来接触人们。清楚了吗？我们是否对哪种……

最准确？我知道这不是这项研究特别关注的内容，但是否有任何关于现在最佳方法的新兴智慧？绝对没有共识。不过，我对文献的解读是，我们有最近的选举，这绝对是最受关注的。如果您查看过去四五年的大选，

似乎并没有一种方法比其他方法高出一筹。而这种无效的发现实际上有点令人惊讶，因为在纸面上，某些方法看起来要好得多，例如它们应该提供更具代表性的随机样本。但是由于与选举民调以及试图预测我们由于许多原因而尚不知道的未来选民群体有关的所有变数，这并没有实现。所以我想说的是，如果您查看最近的选举，在最准确的方法方面没有明确的领导者。现在，如果您退一步，有很多研究评估不同民调方法的准确性，不使用选举作为基准，而是使用我们从政府那里知道的其他事情的基准数据，例如

有多少美国人拥有医疗保险，有多少美国人有驾照或每天吸烟，对吧？政府有很多东西测量得非常好，并且提供了良好的估计，虽然不完美，但很好。因此，有一系列研究进行所谓的基准测试，您将联邦政府的基准数据与不同的民调方法进行比较，看看这些方法中哪一种返回的结果更准确。现在，

我认为，这组研究确实表明，那些从公众的随机样本开始其过程的民调，无论是电话号码还是地址，它们往往会返回更准确的估计。但这并不是在选举的背景下，我再次承认这通常是吸引最多关注的事情。

对。您认为这部分是因为公众在他们愿意回应民调的可能性方面存在某些偏见吗？例如，询问您是否拥有医疗保险，这可能看起来有些私密，最终与询问您将投票给谁并不相同。

是的，我认为有几个因素。一件事情，我代表 APOR（这个全国民调组织）与许多同事一起深入研究了这个问题。我们对 2016 年大选前的民调进行了事后分析。

而且，你知道，针对你之前的问题，我们查看了是否有任何特定方法在 2016 年做得更好。如果你必须选择一个，那实际上是 IVR，即交互式语音应答或机器人电话。因此，如果您在手机上接到电话并接听，它是一种自动的问答类型的东西，那就是机器人电话。这些在 2016 年……

做得相当好。但这并不是因为它们擅长获得美国公众的纯粹代表性样本。他们不是。他们非常倾向于老年人和白人。但在 2016 年，如果您试图准确了解特朗普的支持程度，这被证明是有帮助的。所以我认为这是

在选举中，您可以获得不同错误相互抵消的奇怪事情，对吧？如果您试图很好地了解年轻、多元的公众群体，而他们实际上不太可能投票，那么这样做可能对您没有好处。所以我的解读是，将为您提供

你知道，所有美国成年人的最具代表性样本并不一定会为您提供对选举结果的最佳样本或最准确的预测。再次，因为我们没有，你知道，普遍投票，并且我们在不同的人口中看到不同的投票率。

这是一个非常有趣的观点。您的调查显示，许多民调专家同时使用多种方法来试图找到他们所提出的任何问题的答案。现在民调专家只是在墙上扔意大利面条，或者试图用不同的方法抵消不同的偏差，这种情况有多普遍？

是的，这是我最喜欢的研究发现，大约 40% 的全国性民调专家正在使用两种或多种方法来试图接触美国公众。我的意思是，两种或多种样本来源。例如电话号码或地址，或两种或多种模式，例如在线、电话、纸质等。有时他们会使用多种方法。

像这样的方法在同一民调中，例如，哦，我们在网上进行了一些采访，我们通过机器人电话进行了一些采访，或者有时他们会将其分成两个不同的民调，并使用一种方法进行一个民调，使用另一种方法进行另一个民调。现在真是多种多样。这让我发现了一件非常有趣的事情，那就是你看到了更多这样的

对变化的承诺，2020 年后方法论的变化比 2016 年后更多。使用三种或多种方法（很多，对吧？）的三种或多种方法的民调专家的比例在短短两年内翻了两番。

2020 年之后。有一段时间，就像在皮尤一样，我们也是其中之一。我们仍在进行电话调查，并逐渐减少。我们已经转向在线，并且发现需要进行一种年度调查，该调查提供纸质回复或在线回复。我们并不孤单。其他民调组织也在这样做。所以

是的，似乎没有，你知道，一种方法是，是完美的，可以接触到公众中的每一个人。因此，您确实会看到很多这种不同方法的组合，以试图接触年轻人和老年人，你知道，使用不同的方法。

是的，我发现调查中的这一发现非常有趣，即 2020 年后比 2016 年后有更多的迭代。我认为，至少在公众中，对 2016 年民调错误的情绪反应可能比 2020 年的民调错误更大，尽管重要的是，2020 年的民调错误实际上比 2016 年的民调错误更大。我对这个问题的看法是，

因为当然调查并没有告诉我们为什么会发生这种情况，但是，你知道，我自己也花了很多时间在战壕里，我在想，你知道，很多民调专家得出结论，2016 年之后，他们需要做的是，你知道，等待教育。例如，如果我们知道三分之二的美国人没有四年制大学学位，但是

只有 40% 的样本没有四年制大学学位。你必须把那些没有四年制大学学位的人数算作一倍半，这基本上就是权重的作用方式。

然后我们认为这将是解决方案。当然，这不是一种抽样方法。这只是一个等待方法，这项调查没有调查。但在 2020 年之后，一旦所有民调专家都这样做，并且仍然存在错误，他们就会说，哦，也许我们实际上必须出去寻找一种不同的方法来接触人们，而不仅仅是等待。当然，我们没有一个明确的原因来解释为什么会这样，但这，我的理论听起来对你来说合理吗？

我认为这一切都是正确的。我从与业内人士交谈中要补充的另一层是

2016 年之后，每个人都担心，对吧？但正如你所说，对 2016 年的回应相当温和，而且更技术化，更多的是在等待。部分原因也是因为 2016 年之后，我们不知道这仅仅是该领域一次糟糕的年份，还是我们必须应对的长期持续错误的开始。坦率地说，无论我们是否喜欢，2020 年都给出了答案，对吧？

正如你所说，同样的系统性错误低估了各种共和党候选人，它重复出现，而且如果有什么不同的话，情况更糟了一点。因此，当我 2020 年后与同事交谈时，人们的声音中有一种不同的语气。他们就像，哦，我现在被吓坏了。我将致力于不仅仅是调整权重的边缘，而是从根本上改变我们——

我们在哪里抽样以及我们如何进行民调。所以是的，2020 年的谈话基调绝对发生了变化。我认为这是因为我们得到了一个答案，这个问题不会轻易消失。你如何解决民调在 2018 年和 2022 年非常准确，而实际总统选举民调却一片混乱的某种难题？好吧，

我的意思是，这听起来可能有点简单，但数据向我表明，如果您查看 2018 年和 2022 年，如果唐纳德·特朗普没有真正出现在选票上，那么民调往往会更准确。而且，你知道，如果你看看他是如何谈论民调的，这并不是什么秘密，就像他的一个突出信息一样

是告诉他的支持者不要进行民调，传播民调被操纵的叙述等等。我的意思是，你知道，对民调界没有帮助的事情。我认为他的许多支持者，数据表明，他们听从了他的话，他们确实停止了参与民调。所以我认为你收到了候选人发出的信息。是的，这对该行业来说是一件很难应对的事情。

是的，这很重要，需要提到的是，这与对民调专家撒谎不同，我认为这是人们普遍存在的理论，即有些人告诉民调专家他们将投票给其他人。更重要的是，他们根本没有回应民调专家。没错。并且已经进行了几项关于这种“害羞的特朗普”现象的研究。我们在皮尤做了一项，其他人也做了。我对这个问题的解读是……

这可能解释了那些投票给特朗普但故意说他们没有投票给特朗普的人的概念。这可能在我们选举后看到的错误中占一到两点。但是如果民调的误差幅度更大，如果民调的误差幅度为 5、6、7 个百分点，那就是无回应。据我所知，这意味着你的样本中一开始就没有足够的特朗普选民。

正如我在开头提到的那样，曾经有一种方法可以进行高质量的民调，那就是现场接线员进行随机拨号。那是简单的答案。但是现在，最常见的方法是什么？所以我们还没有得出关于什么最准确的结论，但与此同时，人们最依赖的是什么？

那将是使用所谓的选择加入样本进行的在线调查。不久前，我使用 FiveThirtyEight 的一些数据进行了一次分析，我查看了，你知道，所有试图衡量总统支持率的民调，不同方法的比例是多少？超过 80%

以此衡量，公共民调是选择加入的在线民调。因此，如果您必须问我哪一个最受欢迎，那就是这种类型。但我还是要强调，在线调查还有第二种版本，你知道，再次，它更基于概率，从公众的随机样本开始。这些正在获得一些关注。我认为我们在研究中看到，大约 30% 的全国公共民调专家正在进行这种在线

在线民调。所以你确实看到了两者。

而且该领域经历了大约 10 年，在过去的 10 年中，在线选择加入的增长曲线非常陡峭。但这似乎有所减弱。它绝不会消失，因为成本动态就是这样。这是许多人所能负担得起的。但这不再是这种情况，即在线选择加入将简单地接管该领域并淘汰

所有其他形式的民调。我认为五年前这是一个悬而未决的问题。增长如此巨大，但看起来其他方法实际上正在保持自己的地位。你认为今天

对准确性或较低成本的追求正在推动我们在该行业中看到的许多变化吗？因为当您谈到在线选择加入民调时，对于任何统计学学生来说，您都会立即说，好吧，您不是从随机样本开始的。

那么我该如何信任这个民调呢？您必须进行多少权重才能摆脱一开始就创建的难题，即您没有从随机样本开始？那么，这真的是成本在起作用，而不是对准确性的追求吗？

我认为这取决于谁在进行民调。有些组织，我们在皮尤很幸运，也许盖洛普和其他一些组织也很幸运，我们可以负担得起这两种类型，并且能够密切关注准确性并进行衡量。

并真正投入我们的资源来做更昂贵的版本。但我认识到，有很多调查研究人员认为，基于概率的版本超出了他们的承受能力。因此，对他们来说，这可能是一个问题，如果我进行调查，它必须是选择加入的，否则我根本不进行调查，对吧？所以我尽量不要太武断，因为我认识到这对某些人来说是等式。所以我想另一种说法是……

你知道，对某些人来说，成本确实是驱动力。他们没有太多精力关注准确性，但有些组织确实如此。您往往会看到主要媒体和一些更引人注目的州和大学调查中心能够同时关注准确性和成本。当民调专家从在线选择加入样本开始时，他们必须做些什么才能获得更准确的结果？

你必须对它进行大量的权重调整。但说实话，我们所有人都是如此。即使是基于概率的民调专家也必须进行大量的权重调整。但是当我查看选择加入空间时，我认为哥伦比亚广播公司新闻采取的方法……

以及其他一些看起来像是我最好的方法，因为他们可以在可能的情况下与选民档案记录进行匹配。他们将进行非常复杂的建模，以尽量减少错误。他们从认识到他们获得的样本并不真正具有代表性开始，他们的责任是

利用他们拥有的所有统计能力，通过各种建模方法使其具有代表性。您认为今天民调专家面临的最大挑战是什么？它仍然只是接触那些选择退出民调的共和党选民的一部分，还是超越了这一点？我认为这是其中一部分。我认为另一个是，正如我提到的那样，

每个人都只想在线进行调查，但如果准确性非常重要，那么您将为此而苦苦挣扎。因此，问题是如何接触那些不太热衷于参与在线民调的公众群体？因为我们在数据中看到了这一点。在线面板，我曾经使用过的任何在线面板，都倾向于低估那些更虔诚的人、更保守的人、那些

受教育程度较低的人和投票给唐纳德·特朗普的人。因此，您将系统性地低估使用在线方法的人口中非常重要的一部分。但我几分钟前说过，

超过 80% 的公共民调只是在线进行的，对吧？因此，我们面临着这种非常流行的方法被使用，但大量研究表明该方法遗漏了部分人口的真正难题。因此，你知道，我们正在努力解决这个问题。解决方案并不明显。因此，我们看到许多组织采取了不同的方法来解决这个问题。

对你来说，把这件事做好有什么风险？你知道，为什么这么关心这个问题？

好吧，我职业生涯都在从事调查研究，我非常关心我们所做的事情很重要，信息能够向公众提供关于正在发生的事情的无党派、公正的信息，这非常重要。他们不能仅仅依靠政治家来断言公众认为 X 或认为 Y。你需要一个你可以信任的人来

说，你知道，问题是如何在公众中发挥作用的。所以我非常相信民调领域在做得好的时候能够做什么。我认识到，你知道，2016 年和 2020 年，该行业遭受了巨大的声誉打击。你知道，当你与普通人、朋友和家人交谈时，你会听到它。你会听到怀疑，你会听到信任的丧失。而且

因此，作为关心该领域的人，我真的很想解决这个问题。我每天都与我的同事交谈，例如，我们能做些什么来解决这个问题？这是一个等待的解决方案吗？我们需要尝试新的模式吗？该领域的人们都在做什么？这确实让我彻夜难眠。

当然，我们本周早些时候在播客中提到，美国公共舆论研究协会的会议是上周举行的。你在会议上看到有什么让你感到希望的吗？是的，是的。几年来，我感到沮丧的一件事是，一些进行更严格、更昂贵的基于概率的民调的组织倾向于不

对他们进行多少建模和统计调整过于积极，因为我认为他们倾向于，哦，好吧，我们是从随机样本开始的。是的，您可以从随机样本开始，但并非每个人都会参与。所以我看到的是，例如，

在谁在统计上更擅长解决更多问题方面，您会看到使用选择加入数据或非概率数据的人们更有创造力和主动性。我觉得一些基于概率的民调专家终于开始赶上来并认识到。而我真正想说的是，在诸如政党和过去投票等方面进行权重调整。因为你在 APOR 上看到的很多不同演示文稿中的一件事是

即使你在 2020 年的民调中拥有正确的共和党人比例，几乎每个人都有太多投票给拜登的共和党人，对吧？因此，你必须非常积极。即使你从随机样本开始，我认为你也必须积极主动，

并且你正在等待尝试解决这些问题。我听到更多人认识到，是的，我们必须根据过去的投票或政党进行权重调整。我们必须尝试解决这样一个事实，即对政治更感兴趣的人更有可能进行调查。只是对我们作为该领域所面临的一些局限性的更多认识和讨论。我认为我在这个播客中提到过，事实上，在我们报道它的时候，2022 年的选举对我来说

感觉像是自马匹竞赛民调变得如此普遍以来的第一次后民调选举。我的意思是，公众和专家本身都在质疑数据。例如，数据会显示民主党人在全国各地的众议院选区或不同竞争性竞选中表现相当不错。

专家和公众似乎都忽略了这一点，并说，好吧，你知道，共和党人做得很好。我们预计共和党人会做得很好，等等。最终，最终，许多被质疑的民调是正确的。所以我想问你的问题是。

我们是否在某种程度上处于后民调时代？例如，就“哦，我们期待民调能让我们了解未来会是什么样子”而言，我们是否已经失去了公众？我们现在是否处于一个不同的时代，它只是被不同地看待？

我认为在华盛顿特区的圈子里，是的。是的。我认为这种质疑民调并纠正上个周期民调错误的整个叙述，在不久的将来不会消失。坦率地说，其中一些是公平的，因为我们作为一个行业确实连续两次进行了相当糟糕的选举。但我不会将其描述为后民调时代，因为尽管我们作为该领域可能面临挣扎，

我只是无法回避这样一个事实，即总会有对良好民调的需求。多年来，人们一直在炒作，你知道，例如，哦，如果我们只是抓取 Twitter，对吧，我们可以更准确地了解公众。好吧，事实证明并非如此，对吧？很多人试图取代民调并试图

到达公众所在的地方，但没有一个奏效。我的意思是，坦率地说，民调仍然是我们获得公众如何对黑人的生命问题、多布斯案判决等做出反应的横截面的最佳工具。它仍然是我们最好的工具。我只是不能，我看不到未来对民调信息的需求会消失。是的，而且我的意思是，

当您查看根据民调的准确性做出财务决策的人或组织时，例如他们仍在使用它。公司仍在使用它。企业仍在使用它。竞选活动仍在使用它。尽管怀疑它很流行，但实际上将自己的财富押注在这些问题上的人仍在使用它。当然，你知道，对我们来说，

对于那些认为在民主社会中人们的想法很重要的人来说，这比出现在匹兹堡的一条随机街道上并只询问你看到的头四个人要好得多。所以，你知道，我在为你加油。我在为整个行业加油。

谢谢。是的，我完全同意。我的意思是，对吧，营销是一个数十亿美元的行业，它主要根植于进行调查以了解人们对信息和产品等的反应。而且，你知道，我认为部分原因也是

你知道，公司和竞选活动，他们将继续进行民调，他们将拥有这些信息。因此，问题是公众是否应该拥有与行业领导者和政治领导者相同类型的信息，你知道，我认为是的。我认为让公众获得与其他人相同的信息符合公众利益。

好的。非常感谢您今天加入我。科特尼·肯尼迪是皮尤研究中心方法和创新副总裁。感谢您的邀请。

您是一位播客听众，这是一个播客广告。通过 Lipson Ads 的播客广告，接触像您一样的优秀听众。从数百个顶级播客中选择，提供主持人推荐，或在数千个节目中投放像这样的复制广告，以通过 Lipson Ads 接触您的目标受众。立即访问 LipsonAds.com。网址是 L-I-B-S-Y-N-Ads.com。

您是一位播客听众，这是一个播客广告。通过 Lipson Ads 的播客广告，接触像您一样优秀的听众。从数百个顶级播客中选择，提供主持人推荐，或在数千个节目中投放类似这样的重播广告，以通过 Lipson Ads 接触您的目标受众。立即访问 LipsonAds.com。网址是 L-I-B-S-Y-N-Ads.com。

上周末是年度欧洲歌唱大赛。如果您不熟悉它，首先，您在做什么？其次，去 YouTube 上搜索一下。第三，请继续听我说。所以这是一个自 1956 年以来每年举办的比赛，每个欧洲国家和一些客座国家都会提交一首歌曲，这些歌曲通常是通过每个国家的比赛选出的。

最著名的获奖者包括 ABBA 和席琳·迪翁。如果您想知道，席琳·迪翁是加拿大人。她在欧洲歌唱大赛上做什么？她代表瑞士。我不太确定是怎么回事。但无论如何，别问。

所以上周末，瑞典第七次赢得比赛，这仅仅是因为评委的积分。公众最喜欢的表演是芬兰。我当时正在观看比赛并在推特上愚蠢地谈论它。我们收到了一些听众的回复，要求我们深入研究欧洲歌唱大赛的投票方法。所以这就是我们今天要做的。

和我一起讨论的是伦敦大学学院统计学和健康经济学教授 Gianluca Baio。欢迎来到播客，Gianluca。非常感谢。感谢您的邀请。而且很有趣的是，我经常被邀请就欧洲歌唱大赛发表我的专业意见，这有点破坏了我研究和日常工作中所有严肃的工作。但它也很棒。所以我对此非常高兴。

好的，也许我们会在播客结束时给你机会宣传你正在做的其他严肃工作。但是，你知道，我们非常重视 FiveThirtyPolitics 播客上的投票方法。所以，就我们而言，这不仅仅是一些愚蠢的文化活动。

不，不，当然不是。我应该说，听众们可能会惊讶地发现，有多少社会科学研究致力于欧洲歌唱大赛的投票模式。当我开始谷歌搜索时，发现有很多研究。但我特别关注您的分析，因为首先，您实际上创建了一个贝叶斯模型来调查投票中的偏差。然后第二，

我浏览了您的推特，发现您对上周末的比赛和我一样有类似的反应，那就是摩尔多瓦应该获胜。绝对的，是的。我喜欢他们的表演。

它也让我有点着迷，因为第一反应不是，“哦，我喜欢这个”。但到了歌曲结尾，我确信，是的。夜曲，夜曲，夜曲与月亮

它几乎具备了一切。这是一首朗朗上口的曲子。表演实际上很引人注目。制作质量很好。像瑞典，拜托。就像一个女人独自演唱一首歌曲，这首歌听起来与她多少年前已经赢得的歌曲并没有什么不同。那是八年前的事了。所以是的，我不知道发生了什么。梦想游戏。

我认为你是绝对正确的。当我们着手进行我们的工作时，那是从 2012 年到 2014 年，通过某种数据收集，在一边做这件事，

我们主要的动机是，当时英国正处于后来成为脱欧的准备阶段，当时的政治环境中有一个阶段，一些政客只是试图将任何事情都融入到一种背景下，即欧洲总体上是社会生活中一个糟糕的组成部分，而英国在许多方面总是处于劣势。

你会认为欧洲歌唱大赛只是一件愚蠢的事情，就像每年都会举行的一场关于没有人真正喜欢的愚蠢音乐的比赛。这只是一个美好的夜晚。但它被用作一个平台来表达更大的观点。对我们来说，对我的合著者 Marta 来说，

我应该说，她也是我的妻子，所以我们还有另一个既得利益。但我们觉得奇怪的是，人们可以仅仅基于没有真正证据的说法就做出这些说法。基本上，人们只是说，“哦，我们没有赢得欧洲歌唱大赛，我们总是最后一名，这证明欧洲讨厌我们，因此我们应该脱欧。”

所以重点是，让我们看看这是不是真的。让我们看看数据中是否有任何信号表明存在对英国行为的积极歧视。好吧，我们即将深入探讨这个问题。但我应该说，脱欧后的那一年，英国没有收到任何评委的投票，也没有收到任何公众的投票？所以看来可能存在一些偏见。是的，但行为非常糟糕。

不，我的意思是，有很多事情正在发生。如果你愿意，我们可以更深入地探讨这个问题。我认为我有一些数据驱动和更科学的推测，以及一些更疯狂的推测，我认为在更大的范围内，这些推测同样有效。当然，我会……

我更倾向于科学的那些，但如果你愿意，我可以谈谈这个。在 5.38，我们从科学开始，然后我们可以变得奇怪。但我认为首先我们应该向任何不了解情况的听众解释投票是如何进行的。是的。

因此，首先，当欧洲歌唱大赛在 1956 年成立时，有一个评审团为每个表演打分，然后获得最高票数的表演将赢得比赛。后来，我认为在大约 70 年代中期，我不记得确切的日期，他们引入了这种混合系统，其中一部分投票来自专家评审团，另一部分来自专家。

电视投票，本质上。所以人们最初被要求通过电话提交他们的投票，现在则通过他们的应用程序，欧洲歌唱大赛应用程序。然后将投票合并。所以有……专家可以使用 12、10、9、8、7、6、4、3、2、1（我认为）和 0 的计分系统进行投票。所以你只为 12 个国家打分，其他表演得 0 分。

电视投票采用略微不同的系统，人们可以使用他们的应用程序，今年我认为他们最多可以提交 20 票，所以理论上你可以为同一个表演投票 20 次，或者如果你愿意的话，可以为不同的表演投票，然后将它们全部加起来，然后重新分配，再次给出某种 12 到 12、10、9，依此类推，一直到零。

我应该说，我试图投票给摩尔多瓦，但为摩尔多瓦投 20 票要花费 20 欧元。所以，我的意思是，他们使用的是什么类似于人头税的系统来允许欧洲歌唱大赛的电视投票？而且，这是美国第一次可以参加。所以我对此感到兴奋，但我最终没有这样做，因为我反对人头税。

我认为从欧洲这样做要便宜得多，但我同意你的观点，摩尔多瓦很好，但还不至于为此投资 20 美元或 20 欧元。

确实。好的。那么在多大程度上……你提到了英国在脱欧前的困境。在多大程度上存在偏见指控？这是第一次，还是从一开始就是游戏的一部分？我认为从一开始就是游戏的一部分，因为显然该系统本身就容易受到此类指控。你尤其是在一开始，有一组专家在闭门会议上投票。所以……

谁知道会发生什么，我认为这可能还有一些其他事情发生在歌曲之上，因为你可以争辩说，当你进行适当的选举并根据宣言或某些像正常投票一样重要的事情进行投票时，也许人们可以基于理性做出决定，也许不是

这只是关于一首歌，所以产品的质量是绝对主观的，所以很难做出绝对的判断。所以指控一直存在。那些指控是什么？是说，像在英国的情况下，“哦，欧洲其他国家只是不喜欢英国”？它比这更阴险吗？就像，“西方不喜欢东方”？或者还有其他动机在起作用？

我认为从历史上看，尤其是在冷战期间，这始于 50 年代，然后持续了整个冷战时期，我认为实际上最初邀请苏联集团的国家参加欧洲歌唱大赛，他们有自己的欧洲歌唱大赛版本。

然而，有一些国家，如立陶宛、爱沙尼亚、拉脱维亚，它们与西方世界的边界接壤。例如，他们会接收来自瑞典电视台的信号，他们实际上正在观看欧洲歌唱大赛，这受到那里一些政权的反对。因此，最初的指控是某种集团投票，即苏联的所有国家都倾向于互相投票，而不管歌曲的质量如何，他们并不总是为其他国家投票。

后来，我认为这主要发生在英国，有一种说法是英国被孤立了，各国不会投票给英国的行为。

原因并非因为他们的行为缺乏质量或被认为缺乏质量。以至于 BBC 的评论员 Terry Wogan 在某个时候在直播中辞职并说，这一切都是被操纵的，没有人爱我们，所以我明年不会做了。政客们也加入了这个行列，并说，

提出这样的论点，好吧，这证明我们应该退出欧盟，因为欧洲不爱我们。这是另一个例子。好的，所以你建立了一个贝叶斯模型来调查这有多少是真的。你发现了什么？

是的，完全正确。所以，如果你想有点迂腐和傲慢的话，主要的研究假设是，让我们看看数据中是否真的有证据表明，不同的国家倾向于以系统的方式互相投票，以及是否存在强烈的信号表明国家 A 总是会给国家 B 打高分，而总是会给国家 C 打低分。

所以我们所做的是建立这个模型，我认为从 Stasi 的角度来看，有趣的一点是，你知道，有时你会建立模型来尝试进行预测，就像你试图预测大选的结果一样。在我们的例子中，这并不一定是主要输出。我们不想预测明年谁会赢。我们想做的是平衡一些潜在的结果

混杂因素在你得到的信号中，这样你就可以尝试隔离西班牙对意大利的投票是否总是存在系统性方向性，或者瑞典对丹麦的投票是否总是存在系统性方向性。也就是说，

除此之外，例如，投票的自然流动，这可以解释为什么某个国家倾向于获胜，仅仅是因为其他国家的青睐。反过来，为什么一个国家永远不会获胜，因为其他人故意不想投票给他们。

模型的输出，我们实际看到的，考虑到一些情境因素，例如比赛年份和行为的一些特征。它是一首集体歌曲吗？是一首独唱歌曲吗？是由女艺术家还是男艺术家演唱的？是用本国语言还是英语演唱的？所以考虑到所有这些不同的因素，然后尝试考虑某种地理关系

那么，你更有可能给隔壁的国家更高的投票吗？你更有可能给那些共享一些文化背景的国家更高的投票和更高的分数吗，就像你拥有语言方面的共同点的苏联集团一样，例如？

在排除这些因素之后，基本上考虑到这些因素之后，我们追求的主要输出是残差，剩下的东西。剩下的东西是一个强烈的信号吗？你仍然倾向于比其他任何事情都更强烈地从一个国家投票给另一个国家？实际上，我们看到的是，在这个方向上并没有如此强烈的信号。有一些……

例如，丹麦倾向于始终给瑞典打高分，但这不是你认为这会搞砸所有结果，这就是瑞典获胜的原因。更重要的是，我们没有发现任何相反的证据。所以任何国家都不管其他任何事情，永远不会投票给任何其他表演者。

所以在这种情况下，你正在控制许多因素，人们可能会认为存在一些偏见，对吧？例如，投票给你的邻居或投票给一首用英语演唱的歌曲。事实上，我几个月前还在斯德哥尔摩。

在 ABBA 博物馆。他们认为，当他们凭借《滑铁卢》获胜时，他们的想法是他们需要用英语演唱才能赢得欧洲歌唱大赛，并且，你知道，获得成功。所以，我的意思是，看看其他一些社会科学研究，嗯，

在是独唱还是集体表演、是用英语还是提交歌曲的国家的语言演唱、是女性还是男性等方面，是否存在实际的偏见？

我认为许多模型，当然包括我们的模型，都发现所有这些不同的事情都有一些小的影响。所以一般来说，如果你历史上用英语演唱歌曲，你更有可能获得更高的分数，我认为这可能不会随着时间的推移而保持不变。可能存在某种变化点，即在某个年份之前，这是这种趋势，如果你用英语演唱，你会有

更高的机会吸引更多兴趣。然后它被反转了，也许在最近的几届比赛中，用本国语言演唱的表演比过去更多。所以信号随着时间的推移甚至不稳定。但是你所获得的任何东西的幅度都不是很大。基本上，没有什么你可以说，“是的，这就是解释。这就是原因。如果你有一首这样的歌曲，你当然会从国家 blah, blah 获得更高的投票。”

没有什么表明这样的事情。所以，如果有人聘用你作为顾问，比如明年的摩尔多瓦就像 Gianluca，我们聘用你来给我们一些关于如何赢得欧洲歌唱大赛的建议。你可以根据你的实际想法给他们一些建议，如果你真的想赢，这些是你可以做的一些细微的事情来提高你的几率吗？

我认为没有万无一失的措施。事实上，在我们最初的论文发表后，我有一名硕士生做了一些分析，她所做的是尝试从 Spotify 获取数据来控制歌曲的特征，一些你可能与歌曲相关的硬数据，例如

每分钟节拍数，或者你是否会有一首更摇滚的歌曲等等。是的。她试图弄清楚是什么关键特征造就了欧洲歌唱大赛的获胜者。我认为这项分析有一些警告，我们实际上从未进一步研究过

比这更远，主要问题是并非所有歌曲都有这种硬数据，我们可以很容易地找到。所以有很多混乱，而且无论如何都没有明确的信号。我认为你可能会从所有这些小特征中获得一些小优势

例如，你知道，你有一个女性表演者，这可能会增加从一些国家获得更高投票的机会。但这并不是真正让你赢得欧洲歌唱大赛的原因。没有一个单一因素会推动你的成功。这是一个很好的观点。我们甚至还没有讨论流行音乐与摇滚乐与电子音乐的角度。但本质上……

一定有某种魔力。流行歌曲并不一定比摇滚歌曲更有可能获胜。当然，去年的获胜者是意大利的 Maneskin 乐队，祝贺他们，这是一个摇滚乐队。所以它不像……

与今年的相比，今年是一个独自演唱流行歌曲的女性表演者。去年是一个集体表演者用意大利语演唱，这是一首摇滚歌曲。它也是一首非常非欧洲歌唱大赛风格的歌曲，Måneskin。它就像相反的。♪

但我认为，这再次属于推测的范畴。我在这里没有任何真正的证据，实际上我从未研究过它，我甚至不想研究。但我认为，如果你开始关注欧洲歌唱大赛获得的报道，你可能会怀疑这是一件愚蠢的事情，没有人应该关心，但他们确实关心，而且在它真正开始之前很久就开始关心。而且有很多种

几乎从二月、三月开始，也就是在比赛实际开始前的几个月，他们就开始说“哦，今年瑞典是最热门的热门选手”，当意大利获胜时，我们是热门选手，你知道，博彩公司已经押注意大利会表现得非常好，我认为，你知道，现在你可以提前很久收听比赛的歌曲。我认为到二月，你可以收听所有将在五月晚些时候参加比赛的歌曲

但可能还有更多。可能各个国家都有某种有意识的行为，他们说，好吧，我们非常非常有兴趣明年举办比赛，这并非微不足道的事情，因为你知道，组织整个欧洲歌唱大赛是一项非常昂贵的企业。通常情况下，国家广播公司将在欧洲歌唱大赛机制的监督下负责组织工作。

而且，你知道，这更像是阴谋论的范畴，而不是统计学。但你总是会得到一个明确的解释，说明为什么一个国家可能会获胜。例如，今年瑞典获胜，明年将是 50 周年纪念。我认为 ABBA 第一次赢得比赛或第一次参加比赛。

当意大利获胜时，正值 COVID 之后的一段艰难时期，Monaschim 在参加比赛之前就获得了很高的评价。即使不考虑歌曲的质量，也有很多事情发生。

我认为这会影响最终在电视投票中投票的人的情绪，也许评委们也是如此。所以我认为还有更多的东西，这很难用模型来捕捉。是的，是的。我听说过这样的理论，瑞典获胜是因为 ABBA 在 1974 年凭借《滑铁卢》获胜。所以这将是对……

欧洲歌唱大赛及其遗产的庆祝，就创造而言，我认为它可能是历史上最著名的获胜者，它将在瑞典举行，等等。我不是说它被操纵了，它是决定性的。瑞典说明年我们想举办它并让我们获胜。我认为它不会那样运作。

但当然，如果一个国家愿意并且他们投资于以某种方式设计的行为，而且还有整个背景和良好的理由，那么也许种子就会种在人们的脑海中，这会有所帮助。好吧，而且似乎这颗种子更多地种在评委的脑海里，而不是公众的脑海里，因为这次比赛开始时，

芬兰的歌曲《恰恰恰》，这更像是一种硬核电子音乐，我不知道该如何准确地描述它，在 TikTok 上疯传。每个人都在听它。它最终赢得了所有公众的投票。所以那里存在两种相互竞争的能量，那就是，是的，因为人们可以提前收听，它在 TikTok 上疯传，

公众在比赛实际开始之前就已经完全支持芬兰了。但我认为，为了欧洲歌唱大赛的遗产和品牌推广等等，也许对评委来说，支持瑞典更有意义。

在所有这些中，我很想知道你是否还有其他结论，或者你研究过的投票模式的社会科学研究，你知道，在我们结束关于欧洲歌唱大赛投票模式的严肃谈话之前值得承认。

不，我的意思是，就像我说的那样，我认为有趣的是试图揭穿你可以根据硬证据提出主张的想法，而这些证据实际上并不存在。我认为这就是模型发现的。我们没有发现，如果你尝试进行某种系列分析并尝试消除所有情境因素并考虑它们，那么剩下的东西，这将表明某种蓄意行为，

朝一个方向或另一个方向走实际上并不存在。如果它存在，它的幅度也不会改变结果。我认为这是主要结论。我认为可能还有更多。我认为有些事情很难在建模中，在统计建模中进行匹配。我认为这是真的，他们拥有这两个不同的系统，评委和电视投票系统，

也许有助于某种再平衡。很明显，Fjällräb 会得到电视投票中人们的大量青睐。这是针对那种疯狂之夜的经典欧洲歌唱大赛行为，哦，这些人太棒了，让我们为他们投票。

所以如果有人想重新平衡事情，他们可能会确保评委以某种方式投票。但公平地说，瑞典也获得了大量的公众投票。芬兰赢得了公众投票，但这并不是百万比零。瑞典在这两方面都做得很好。最终，我认为这就是推动他们前进的原因。是的，当然。我的意思是，所以你确实发现，最终……

对与你接近或共享文化亲和力的国家有一些有利的偏见。我的意思是，这是否意味着英国可能处于劣势，因为它是一个岛屿？我的意思是，显然，仍然有一些国家靠近它，但它是一个岛屿，并且已经建立了自己的某种身份和文化，这与欧洲是分开的。我的意思是，我认为这是……

欧洲的英国文化也是一种主导文化。如果你看看欧洲歌唱大赛中每一种可能的音乐产业，英国的产业都是一种主导产业。大多数在 Spotify 或其他地方销售数百万张唱片或位居排行榜首位的表演者都来自英国。所以我认为没有任何积极的厌恶或不想……

奖励英国的参与。这是公平的，我认为这里也承认，当英国几年前最后一名时，许多实际参赛的表演者

也许欧洲人对英国脱欧并不高兴，但歌曲真的不太好。而且，你知道，你不会获得很多选票也并不令人惊讶。就是这样。所以我认为，在我们的模型中，地理方面，我们有一个邻里结构，即离你最近的国家在地理和文化层面都被认为更接近。

所以有一个考虑这个因素的元素。例如，我们确实看到一些信号倾向于表明爱尔兰倾向于给英国的行为打相对较高的分数，但反过来却并非如此。所以同样，你可以说，实际上爱尔兰应该与英国一致，而英国并没有给爱尔兰打高分，尽管他们都说英语，并且根据某些指标，他们可以说是很接近的。

好吧，这也很有趣，因为爱尔兰在欧洲歌唱大赛的历史上一直比英国做得更好。是的，是的。所有这些都非常有趣。另外，我错了。我说 Maneskin 去年赢了。Maneskin 去年没有赢。乌克兰去年赢了，这可能也是一个重要的政治信号，那就是在俄罗斯入侵期间对乌克兰的支持。是的。毫无疑问。

所以是的，我的意思是，在这个非常古怪的、有趣的歌曲比赛中，似乎有很多政治因素。

我同意，我同意，是的。我认为自欧洲歌唱大赛成立以来，其本质本身就是一个非常政治性的声明。它旨在将铁幕这边的所有欧洲国家聚集在一起，并在战后为重聚制造轰动。所以它从定义上来说就是一个政治行动。

有趣。好吧，我说在播客结束时，我会让你喊出任何你想提到的与欧洲歌唱大赛无关的严肃工作。我知道你是一位统计学教授和健康经济学家。我们的听众应该知道什么与欧洲歌唱大赛无关？

我认为我做的许多正常的严肃事情，尤其是在成为我部门负责人之后，都非常非常无聊。我认为你的听众不想知道任何关于这些的事情。所以，是的，最好只是谷歌搜索并找到欧洲歌唱大赛的东西以及一些足球预测的东西。也许那很有趣。哦，有趣。好的，你有没有想过为欧洲歌唱大赛创建一个实际的预测模型？

我做过，这就是为什么我一直在推动我的学生尝试找到关于歌曲硬性品质的数据的原因。这更像是一个夏季项目，让我们一起玩得开心一些，它实际上从未发展成为一个完整的建模和论文。但我认为困难在于寻找数据，一个你可以与欧洲歌唱大赛数据匹配的一致的数据集。说得通。

自1956年以来，欧洲各国每年都会聚集在一起参加欧洲歌唱大赛——这是一场主要由流行和电子音乐艺术家参加的比赛，往往让人感觉像是对欧洲音乐品味的戏仿。长期以来，人们一直指责投票过程存在偏见，上周六的比赛——瑞典获胜——也不例外。在本期播客中，加伦与统计学和健康经济学教授吉安卢卡·拜奥交谈，他创建了一个模型来确定是否存在真正有利于或不利于某些国家的偏见。加伦还与皮尤研究中心方法和创新副总裁考特尼·肯尼迪交谈，她最近发表了一项研究，该研究表明，今天的民意调查行业与本世纪初的民意调查行业几乎没有相似之处。随机拨打座机电话的真人时代已经过去了，但这对公众舆论研究的准确性意味着什么呢？了解更多关于您的广告选择的信息。访问megaphone.fm/adchoices</context> <raw_text>0 好的。好吧，我们就说到这里。吉安卢卡，非常感谢你今天加入我。非常感谢你。吉安卢卡·拜奥是伦敦大学学院的统计学和健康经济学教授。我的名字是加伦·德鲁。托尼·周在控制室，也在进行视频编辑。您可以通过发送电子邮件至[email protected]与我们联系。您当然也可以在推特上向我们提出任何问题或评论。如果您是节目的粉丝，请在Apple Podcast Store中给我们留下评分或评论，或告诉别人关于我们。

感谢收听，我们很快再见。

Is The Eurovision Song Contest Rigged? 56:35 Share

FiveThirtyEight Politics

Deep Dive

Shownotes Transcript

Is The Eurovision Song Contest Rigged?