贡献者:戴维·斯皮格哈尔特爵士教授 | 机会、运气和无知;如何将我们的不确定性转化为数字。我们都必须面对对未来将会发生什么、已经发生什么以及事情为什么会这样发展的诸多不确定性。我们将好的和坏的事件归因于“偶然”,将人们贴上“幸运”的标签,并(有时)承认我们的无知。 戴维·斯皮格哈尔特将展示如何使用概率论来剖析所有这些想法,并演示如何将你的无知量化,然后衡量这些数字的准确性。在此过程中,我们将考察三种类型的运气,并判断德伦·布朗连续抛掷十次硬币正面朝上是幸运还是不幸。</context> <raw_text>0 欢迎收听伦敦政治经济学院的LSE活动播客。准备好聆听一些在社会科学领域最具影响力的国际人物的演讲。各位晚上好,感谢大家今天参加这次令人兴奋的公开讲座。我叫王腾耀,我是这里统计系的一名统计学教授。我非常荣幸能主持这次活动,并欢迎斯皮格哈尔特爵士教授今天来到伦敦政治经济学院。
斯皮格哈尔特教授是剑桥大学统计实验室的统计学名誉教授。他是我们时代最具影响力的统计学家之一,不仅以其对统计学界的开创性贡献而闻名,而且以其致力于提高公众对统计学的理解而闻名。他曾担任剑桥大学温顿风险与证据沟通中心的主任。
在那里,他的工作重点是如何有效地向公众和政策制定者传达统计证据。在他辉煌的职业生涯中,斯皮格哈尔特教授在贝叶斯统计方面取得了重大进展。他的研究包括开发新的统计方法及其在公共卫生中的应用。
他领导了开创性的WinBus软件的开发,该软件首次使复杂的贝叶斯方法能够被统计学及其他领域的科研人员所使用。他的研究已被来自广泛学科的科研人员大量引用。除了学术界之外,斯皮格哈尔特教授一直是统计素养的不知疲倦的倡导者。
在座的许多人可能知道他为BBC和TED演讲所做的贡献,这些演讲激励了数百万人批判性地思考数字和概率。他非凡的贡献为他赢得了无数奖项。他于2007年当选为皇家学会会员,
2014年因其对统计学的贡献而被授予爵士称号,并于2020年获得皇家统计学会金奖。我们也非常高兴地重点介绍斯皮格哈尔特教授的最新著作,她今天将对此进行讲解。该书名为《不确定性艺术:如何驾驭偶然、无知、风险和运气》,出版于去年。
这本富有洞察力的著作探讨了我们如何在瞬息万变的世界中更好地理解和接受不确定性。您可能已经看到了演讲厅外的展位。讲座结束后,将举行图书销售和签名活动,这是一个不容错过的机会。在我们开始之前,我有一些注意事项。请确保您的手机已切换到静音模式。 LAUGHTER
我应该早点说这个。这样我们才能在没有任何干扰的情况下享受讲座。另外,我很高兴地告诉大家,今天的活动正在直播,并将被录制下来。因此,您可以稍后观看它以回顾斯皮格哈尔特教授的见解,并与您的家人和朋友分享。
现在,让我们欢迎斯皮格哈尔特爵士教授发表关于《不确定性艺术:与偶然、无知、风险和运气共处》的演讲。谢谢。谢谢。
谢谢。非常感谢您的精彩介绍,也感谢大家今晚的光临。很高兴看到这么多人来听讲。我今天真的非常兴奋。好的,这就是我将要讨论的内容。那就是我。我是名誉教授,这意味着我是一个年老退休的老人。并且
并且是英国统计局的非执行董事。所以我确实用我的时间做了一些有用的事情。好的,只是一些背景介绍。我过去做统计方法论。我过去做的是那种困难的事情
现在伦敦政治经济学院的系里的人正在做的事情,以及20世纪80年代人工智能、贝叶斯方法和贝叶斯计算方面的事情。但我很幸运,在2007年得到一位友好的亿万富翁的资助。这是我对每个人的职业建议。找一个友好的亿万富翁。
然后向他索要很多钱。这很棒。然后你可以做你想做的事情。所以,你知道,只是一些通用的建议。只要找到一个。我得到了慈善资助,担任温顿公众风险理解教授。然后我就可以从事沟通工作了。所以,我和汉娜·弗莱一起制作BBC纪录片和其他纪录片,我跳伞,诸如此类的事情。我参加了《淘汰赛》。
我在阿根廷跳过那些大红球,掉进泥里。所以我做了这个。我甚至上了《荒岛余生》,这两件事是我人生的愿望,一个是参加《淘汰赛》,另一个是上《荒岛余生》。所以我做了一切我曾经想做的事情。我不必再做任何事情了。好的。我还写了一些书。
我过去写的是不受欢迎的畅销书,但现在我写的是相当受欢迎的畅销书,这很棒。这是最新的一本,您可以从所有优秀的书店和外面买到。这就是章节。实际上,有点放纵。我告诉你,好东西。另一件事是,写一本非常受欢迎的书,然后你就会被要求再写一本,你可以做你想做的事情。所以这是一个很好的,这就是发生在我身上的事情。所以,这是一本非常放纵的书。我把所有我真正感兴趣的东西都放进去了,
所有我思考和争论了50年的东西,都在这里。我今晚只讲一部分。我将讨论运气,一点巧合,一点关于模型的置信度,我做了一些关于深度不确定性的研究,
等等。哦,还有将你的无知转化为数字,因为我稍后会给你一个小测验。所以这是一个我感兴趣的随机主题范围。所以是不确定性。我在书中首先讨论的是什么是“不确定性”?人们说,这并不是确定的。那么“确定”是什么意思呢?
我知道“确定”意味着你必须开始思考真理等等。但我喜欢这个定义,即对无知的清醒认识。
当你不知道自己不知道的时候,当你承认自己对将会发生什么、目前正在发生什么或事情为什么会发生一无所知的时候。但我将其限制在原则上你可以实际找到答案的事情上。所以当他们说我不确定今晚吃什么,在这个餐馆吃什么时,这是不对的。
我谈论的是当我不确定最好的披头士唱片是什么的时候。不,不,我不确定,你知道,穿什么。不,这些都不是我谈论的,因为没有正确的答案。我谈论的是确实有答案的事情。当然,你可能对未来、现在、过去或事情发生的原因一无所知。所以我喜欢用一枚硬币来说明这一点。这是一枚硬币。当我抛掷它时,正面朝上的概率是多少?
好的。正面朝上的概率是多少?零到零。不,来吧。零到一。
不。现在他说零或一。这很典型,典型的是伦敦政治经济学院的教授对这种观点的过时看法,这是由于,你知道,一种过时的,所谓的频率论的概率观,它认为一旦事情发生了,你就不能给它一个概率。现在这是完全错误的。当然你可以给它一个概率。你可能会给它什么概率?你的概率?
是的,50%。这不是我的概率。实际上,关键是这表明概率是对不确定性的衡量,而这种不确定性是你和外部世界之间的关系。它不是对象的属性。它是你的属性以及你与该对象的关系。实际上,我应该向你展示硬币。看看硬币。
翻过来。是的,非常好。这是一枚漂亮的两英镑硬币,但问题是它是非法的,因为它有两面都是正面。之后再看看它。它制作得非常精美。它有两面都是正面。所以最初,当你们都说,哦,在我抛掷它之前是50-50时,你们是错的。你们错了。你们天真地相信我。这表明,你在任何情况下给出的任何概率,任何数字,
都是一种构建。它是一种基于对世界运作方式的假设的主观构建。你可能是对的。因此,它再次表达了你对世界的无知。这是一个相当有力的想法。
这意味着那种要么是零要么是一的陈述完全是愚蠢的,但这就是你所期望的。好的,这本书是关于解构我们生活中作为人的不确定性。
以及如何,我喜欢这个,我编造了这个。如何思考,我没有编造第一个,我是偷来的。但这就是如何慢慢地思考不知道。如果你考虑快速思考和慢速思考,我们对很多事情都一无所知,而且我们经常使用我们的直觉。这是关于放慢速度,而不仅仅是使用我们对无知的直觉。
我想举一些例子来说明这一点的重要性,以及当我们思考我们的不确定性时,开始思考量级的重要性。我们有多不确定?这是书中一个很好的故事,猪湾事件。现在,你们中的一些人,实际上你们年纪太大了......
记得这个,因为它是在1961年,因为在1959年,你知道古巴革命,菲德尔·卡斯特罗当他接管革命的共产主义者接管古巴时,并且
几乎立即,中央情报局就开始策划推翻卡斯特罗,并与古巴流亡者合作。他们计划让1500名古巴流亡者入侵古巴南海岸的猪湾,我去过那里。那是一个非常漂亮的地方。并且......
但这却是秘密的。美国军队不知道这件事。这是一次完全由中央情报局进行的行动。然后肯尼迪在1961年当选总统后,知道了这件事。他委托参谋长联席会议对这一计划是否可行进行了审查。他们认为成功的几率约为30-70。要么是70%的失败几率,这是他们的想法。
不幸的是,当这份报告提交给肯尼迪时,“70%的失败几率”已经被“有相当大的成功几率”这句话所取代。我不知道你会如何解释“有相当大的成功几率”这句话,但这听起来并不是一个坏主意。我相信这并不是他批准它的唯一原因,但他批准了它,结果是一场彻底的灾难。
所有入侵者都被杀害或俘虏。卡斯特罗本人在保卫古巴时跳下坦克,这是一团糟。顺便说一句,你知道,这使得古巴更加靠近苏联势力范围。第二年是古巴导弹危机,这是我们离核战争最近的一次。所以这是一场彻底的灾难。我认为,这表明,对于重要的问题,仅仅使用像“相当大的几率”这样的词语是非常非常危险的。
自从猪湾事件以来,人们已经意识到了这一点。因为词语很容易被误解。因此,最好至少粗略地定义这些词语。如果你现在看看气候变化,例如,政府间气候变化专门委员会的报告,他们都会,哦,我忘了这个。我认为这是介于,这意味着介于55%到70%的概率之间。
我认为这是他们对“可能”的定义。因此,不同的组织使用不同的方法将词语和数字编码在一起。但我将讨论英国情报机构。如果他们说某事是可能的,这意味着概率在55%到75%之间。那是军情五处、军情六处和其他情报部门。所以这是英国官方的概率尺度。而且是公开的。是公开的。
我在军情五处做了一个演讲,他们给了我一个马克杯。这是一个军情五处的马克杯,我非常小心地保存着它。上面写着,如果你的咖啡在这里,你需要再加满,你很可能需要再加满,因为“很可能”意味着80%到90%之间。所以“可能”是55%到75%之间。所以如果你认为成功的几率是30%,
你会正式称之为不可能。现在,这与猪湾事件相比,难道不是一个巨大的进步吗?这是强制性的,这样当情报部门的人使用“可能”这样的词语时,他们就必须这样理解。我认为这是一个巨大的进步。
好的,这是一个例子,说明这些想法是如何在2011年被使用的。这是奥巴马总统坐在桌子旁,决定该做什么,因为情报部门认为本·拉登就在阿伯塔巴德的这个大院里。他必须决定是否派遣海豹突击队,嗯,实际上是去杀了他。所以......
他所做的事情,其中一件重要的事情是,他让多个团队审查证据,判断本·拉登在大院里的可能性有多大。多个独立的团队。这实际上是奥巴马总统事后的一段话。不,他没有接受过关于此事的采访。所以......
一些人认为只有30%到40%的几率,另一些人认为高达80%到90%。所以这些是充满热情的人,这些是悲观的人,或者可能是所谓的红队,我们稍后会回到这一点,红队的想法,你故意找一些比较悲观的人,试图找出所有可能出错的地方。经过长时间的讨论,奥巴马说这基本上是50-50,他决定去做,这是一个正确的决定,他批准了突袭,
所以从那时起,人们提出的一个问题是,所有不同的情报部门是否应该事先聚在一起,提出一个单一的数字给决策者?那么谁认为他们应该聚在一起呢?谁认为他实际上收到这些不同的决定更好呢?是的,没错。
但有些人写道,哦,他们应该聚在一起。不,决策者应该知道意见分歧的时候。他是做决定的人。他应该知道这些分歧。所以我认为这实际上是一个非常好的例子,说明你如何才能做出非常困难的决定。我们稍后会回到一个类似的例子。所以关于这些概率的关键是,它们不是基于分析。这些纯粹是判断,纯粹是判断。
就像在超级预测比赛中,人们对未来将会发生的事情做出判断一样,他们不是在进行计算,这些是概率评估。我现在只想向你们证明,向你们展示这些,我们将称之为主观概率,纯粹来自你脑海中的数字,是可以根据其质量来衡量的。所以我现在要让你量化你的无知。
看起来相当无知的一群人。所以我将问你一系列问题,你说明你更喜欢,不要大声说出来,A还是B作为答案。不作弊,没有维基百科,没有手机。
然后想想你有多自信。那么你对A的把握是10分之10吗?还是10分之7?或者只有10分之5?然后你给你的信心一个数字5到10。我会告诉你答案,然后你根据这个规则给自己评分。现在这是一个非常非常重要的规则。这是如此非武断。所以如果你说我10分之10确定答案是A,而你是对的,你得25分。如果错了,你就会损失75分。
它是完全不对称的,非常残酷,惩罚过度自信。如果你说5,你可以保持在0。如果你说10分之8,而你是对的,你得21分,错了,你损失39分。我会把它留在这里,因为我稍后会问你,这个规则背后的公式是什么?
这些数字的规律是什么?所以看看这个。现在是第一个问题,埃菲尔铁塔还是碎片大厦更高?现在你可以在纸上做这个,但你也很聪明。我相信你可以在脑子里进行这个计算。没有手机。埃菲尔铁塔还是碎片大厦更高?所以做出判断。你认为是A还是B?
如果你必须回答,哪个是A或B。你们都必须这样做。然后你必须说明你有多自信。你10分之10确定吗?10分之6?10分之7?好了。你们都做出判断了吗?好的。你做出判断了吗?答案是什么?埃菲尔铁塔。仅仅是......仅仅是......现在......有人......
有人对碎片大厦打了10分之10吗?是的!好吧,你一开始就做得非常糟糕。而我做这个测验的目的正是为了防止这种行为。对不起,你一开始就做得非常糟糕。好的,谁年纪更大,威尔士亲王威廉还是威尔士王妃凯特?谁年纪更大?
A还是B?你对你的答案有多自信?而那些10分之10确定并且错了的人,我希望你们能吸取教训。好的。你做出判断了吗?答案是?是的,她大六个月。好的。哪个成立较早,伦敦政治经济学院还是帝国理工学院?嘘,嘘,嘘,嘘。
哪个成立较早,伦敦政治经济学院还是帝国理工学院?好的。做出你自己的判断,A或B。你的信心。答案是什么?A。1895年对1908年。根据维基百科。我根据维基百科说的。好的。你做得怎么样?还有两个,还有两个。哪个更大,比利时还是瑞士?就土地面积而言。忘记山脉等等。
只是土地面积,比利时还是瑞士更大。不,都是维基百科,所以你可以在维基百科上立即做到这一点。但你不允许这样做。好了,你做出判断了吗?答案是什么?是的,B。可能很容易。好的。最后,米克·贾格在伦敦政治经济学院学习的年份是哪一年?1960年到62年,还是61年到63年?现在,你必须算出来,来吧,在哪里......
滚石乐队什么时候开始录制唱片?他现在多大年纪了?你可以做一些计算,所以你也许能够算出来。好的。答案是61年到63年。而且他只离开了,他只离开了,直到他实际上签署了录音合同,然后他才离开。好的,那么你做得怎么样?我可以问一下谁得了正分吗?
还不错,还不错。有人得了很多分吗?有人超过80分吗?哇。有人超过80分吗?这真的很好。好的。得分很多的人非常好。要么他们很幸运,要么他们知道很多。有些人非常谨慎,保持在5、6和7左右,所以保持在0左右。是的。好的。所以这些人很好。所以你有一群人实际上知道他们知道什么。他们有一群人知道他们不知道什么。
这真的很好。现在还有第三种人得了相当低的负分。耶!谁低于负100?哦,是的,太好了,非常好。好的,所以那些得到非常低负分的人认为他们知道一些事情,但实际上不知道。这些人不是你想要作为你的财务顾问的人。
现在关于这一点,我的意思是这有点像笑话,这可能看起来像个笑话,但这非常严肃。这些测验被用于培训情报分析人员等等,以防止他们过度自信。不要说这是极其可能的,而实际上并非如此。
所以它是在,实际上,评分规则是由格伦·布劳尔在1951年在天气预报中开发的,用于评估概率天气预报员对降雨概率的预测。它也是超级预测比赛中使用的评分规则,当人们判断未来事件的概率时。数字的规律是什么?是的,是的。你知道吗?还是你算出来的?好的,无论如何,他说,平方误差损失。
看看你能得到的最高分是25。所以看看当你开始犯错误时你会损失多少。因为那时你不会损失任何东西。你会损失1。你会损失4。你会损失9、16、25、36、49。所以你会损失误差的平方。
所以这是一个标准的平方误差损失,它已经被广泛使用。而且它具有特殊的理论特性,鼓励你诚实。因为如果这是一个线性评分规则,它只是一条直线,它实际上会鼓励你夸大你的信心。所以这背后有真正的数学意义。好的,运气。
你们中的一些人可能很幸运。你只是猜测,你对某事打了10分之10,而你猜对了。所以你可能很幸运。我喜欢这个定义,即个人化的机会运作。所以关键是运气,你知道,当你幸运或不幸时,它们是不可预测的事件,它们不受你的控制,但它们会产生影响,无论是好是坏。
所以这是发生在你身上的事情,不是你的错,你也没有做任何事情来应得它。我举个例子。我用我祖父塞西尔·斯皮格哈尔特在第一次世界大战中的例子。当时的斯皮格哈尔特中士。他最终,他在1918年初的工作是1918年1月帕森代尔地区的旅级毒气军官,这可能是你能拥有的最糟糕的工作。
可能,因为他必须在战壕系统中走动,检查毒气设施。为了得到这份工作,我认为预期寿命只有几周,他必须参加考试。想象一下,为了一个致命的职位而参加考试。这就是我们谈论的那种地形。
无论如何,他写了一本日记,我们仍然保存着,保存那本日记可能是非法的,他在日记中描述了他的工作:“荒凉,回程时险些逃脱,及时通过真是幸运”等等。他在这个职位上只待了三个星期。然后在1918年1月29日,他从鹰战壕回家时被炸了。现在,你可能可以猜到他活下来了。
否则,其他人会在这里走来走去招待你们。他被送回伤员清理站,被宣布为B2,并避免了前线。从那时起,战争的其余时间他都在后方,这真是太幸运了,因为他的营随后被转移到索姆河,正好赶上1918年一百万德国士兵的进攻,他们不得不两次冲锋陷阵。
到那时,他已经是一位少尉了,他会是第一个爬上梯子吹哨子的人,他不会再在那里了,我也不会在这里。所以,你知道,他是幸运还是不幸?嗯,你知道,思考这个问题的一种方法是,在某些方面他很幸运,在其他方面他不幸,因为他一开始就不幸地在那里。
然后他幸运地活了下来。所以哲学家们,我认为,已经对运气做出了非常有用的解构。第一种,也是最重要的一种,是他们所谓的构成性运气。这就是你出生的运气。所以我会说,我们都很幸运能在这个时代和这个地方出生。好的?
与历史上一些绝对可怕的时代和地方相比,我们本可以出生在那里。我的意思是,当你本可以出生在那里时,这听起来有点傻,因为那不会是你,因为你只是因为一连串荒谬的幸运事件才来到这里。
事实上,在研究这个的过程中,我开始思考,我为什么在这里?我的祖父活了下来,但所有这些其他的事件,我的母亲在1936年在炮火下逃离上海,所有这些事情。然后,哦,天哪,听众中有孩子,没关系。不要告诉任何人。然后我开始思考我自己的受孕。现在,
你有没有想过你自己的受孕?我的意思是,不仅仅是青少年会说,“呃!”想想他们的父母发生性关系。我的意思是,这真的很难。我必须等到我的父母去世后才能考虑这个问题。
然后我意识到我是在1952年11月在北德文郡受孕的,我查了天气记录。哦,我的上帝,全国各地都出现了严寒。就是这样,下雪结冰,诸如此类的事情。所以那是一个几乎没有暖气的房子。那么他们会做什么呢?而我就在这里。所以我很容易就不存在了。但我我认为我在出生的地方和时间以及我出生的人方面有极好的构成性运气。
我的基因和所有的一切都是重点。但随后你还有偶然的运气,那就是在正确的时间出现在正确的地方,或者在错误的时间出现在错误的地方。所以我的祖父有不幸的构成性运气,因为他正好赶上了第一次世界大战。在1918年初,当德国炮兵将目标对准十字路口和道路时,他非常不幸地徘徊在战壕系统中。然后你还有结果运气。
这仅仅是因为它碰巧在那时通过你无法控制的任何事情而奏效。关键是炮弹没有落得足够远,所以他只是被炸伤了,而没有被炸死。所以这很有用。他活到了81岁。所以......
我从我的一个朋友那里得到一个很好的例子。这是一起飞机失事,一架道格拉斯飞机在1949年飞入萨德尔沃思沼泽地,机上几乎所有人都遇难了。它飞进了雾中。除了斯蒂芬·埃文斯。你可能认识斯蒂芬·埃文斯。他是伦敦卫生与热带医学院的统计学家。他小时候就乘坐过那架飞机,但他没有死。
那么他的运气如何呢?关键在于,他有着糟糕的环境运气,碰巧乘坐了那架飞机。只是,你知道,并非出于他自己的过错,他乘坐的那架飞机撞上了山腰。当飞机上几乎所有人都遇难时,他却有着难以置信的好结果运气,得以幸存。那么他的构成性运气呢?他的构成性运气在于,他的父亲曾在皇家空军服役,知道飞机上最安全的地方是在后面。
所以他总是让他的家人坐在飞机的最后面。不幸的是,他的小弟弟被杀害了。但斯蒂芬现在还活着,唯一的原因就是他父亲让他坐在飞机的后面。你就会意识到,你的生活会受到完全不受你控制的事情的极大影响。我认为,这是一个对这些事情有用的解构。所以也许想想吧,它如何影响你自己的生活。因为构成性运气......
实际上,决定论意味着你知道你出生时的身份,我们知道这是一个巨大的影响。我很想认为,哦,我是大卫·斯皮格尔哈尔特爵士教授,是因为我的努力工作等等。不。你知道,其中很大一部分仅仅是因为我出生时的身份。
你知道,我的基因,我的成长环境,在我的时代,你知道,我的父母没有钱,但有免费教育、免费医疗、免费大学,几乎能够在你出来的时候选择你想要的工作,最终的养老金。我的意思是,真的,你知道,我们这一代人吃掉了所有的馅饼。对其他人来说,真是太糟糕了。所以基本上,构成性运气意味着你生活中的很多事情仅仅是由你出生时的身份决定的。所以从中得到的教训是你必须尽力而为。
我非常喜欢这个比喻,你应该尽力而为,因为你可能会认为,你知道,我们都是独一无二的,你知道,我们在生物学上是独一无二的,没有人像我们一样。你几乎可以肯定的是独一无二的,就像每一次洗牌几乎可以肯定的是独一无二的一样。
因为我现在正在洗牌,我会说,整个人类历史上从来没有做过这样的洗牌,从来没有产生过这样的牌序。我将再次洗牌,我可以说,我非常有信心,整个人类历史上从来没有做过这样的洗牌。我不能在逻辑上确定。你知道,这可能是真的。有人以前做过这样的洗牌的可能性极小。
而且它确实看起来是这样,所以每一次洗牌都是不同的。现在,为什么我对此如此有信心呢?关键是你首先要考虑如何思考这个问题,考虑有多少种洗牌方式。那么有多少种洗牌方式呢?当你想到洗牌时,第一张牌可以是52张牌中的任何一张,第二张牌可以是51张牌中的任何一张。
下一张牌可以是50张牌中的任何一张,以此类推,我们可以将它们相乘,得到所谓的52阶乘。这就是有多少种不同的洗牌方式。现在你可以尝试在你的计算器上这样做,很快数字就会超出你的屏幕,过了一会儿它就会爆炸。不要这样做。不要在家尝试,因为它是一个非常大的数字,而且
这是一个很大的数字。哦,不,它比这还要大一点。哦,是的,是的,不,那,那,那,是的。不,实际上,它也比这大一点。哦,我忘记了一些零。它有这么大。大约是10的68次方,大约是10的68次方。它与我们星系中原子数量大致相同,也就是洗牌的数量。
所以你可以算出来,我做了一些事情,你知道,如果你认为历史上每一个活着的人什么都不做,只是终其一生洗牌,那么他们中的两个人曾经做过同样的洗牌的概率大约是10的负19次方分之一,这绝对是微不足道的。这是你可能能够猜到两个手机号码的几率。这就是整个人类历史上两个人曾经产生过相同洗牌的几率,假设这一切都是随机进行的,对吧?
并且有一个荒谬的假设,那就是每个人一生中所做的就是这些。所以我可以非常有把握地说,不仅每一次洗牌都与我做的不同,而且没有两次洗牌是相同的。
很难理解,因为这是一个概率的例子,它比我们想象的要小得多。现在我们将讨论一些可能完全相反的例子,这些例子比我们想象的要常见得多。所以让我只展示一小段视频。你可能看过这个。这是达伦·布朗,一位魔术师。这是几年前的一个名为《系统》的节目。我只想让你看看。
但我希望你观看这段视频,并尝试找出它怎么可能,因为理解这一点的关键是理解这个系统的关键。他说他要连续抛十次硬币正面。一,这是正面。二,这是正面。不,电影中没有剪辑。三,正面。正面,这是四。正面,五。六。四次,我停下来。六。
七,还有三次,八,九,是的,最后一次,十。连续十次正面。非常感谢。好的,问题是......我稍后会告诉你。等等。他是怎么做到的?真的,这是一个单次拍摄。他是怎么做到的?对不起?是的......
他应该很幸运。这样做有一千分之一的几率。所以它是二分之一乘以二分之一乘以二分之一十次。大约是一千分之一的几率。啊,哦,你多么怀疑啊。是的,不,他是。他实际上是在抛硬币。是的。对不起,它不是两面都是正面的。你在抛硬币吗?对不起?是的。
啊,有些人,因为是的,不像那样扔进弹跳的罐子里。我认识珀西·迪亚科尼斯,斯坦福大学的概率学教授,他可以抛硬币,让它按照他想要的任何方式出现,因为他是一位训练有素的魔术师。但这与你把它扔到坚硬的表面上不一样,因为那样它就会发生那种混乱的反弹。是的?是的,是的。我们听说过。是的。他抛了九个小时。
他们在节目后面揭示了这一点,显示了......哦,不,对不起。所以他抛了九个小时的硬币,然后才做到这一点,这表明,你注意到他有多么出色,他让它看起来像是第一次。他非常酷,非常专业。现在他已经抛了九个小时了。想象一下,当他抛到八次的时候,他一定是怎么想的,哦,像这样。他保持着冷静,好像他知道会发生那样的事情。所以,
他连续抛了十次硬币正面。他是幸运还是不幸?幸运还是不幸地花了九个小时才做到这一点?谁认为他只花了九个小时就幸运了?
谁认为他不幸地花了九个小时这么久?好的,稍微有点倾向于不幸。所以让我们看看我们能做什么。让我们做一些计算。让我们做一些数学运算。所以他抛了九个小时的硬币,才连续抛出十次正面。正如我所说,这样做的概率大约是一千分之一。那么,一个一千分之一的事件需要多长时间才能发生呢?所以平均而言,你预计需要一千次尝试。如果你尝试一千次,你期望它发生一次。现在,你不知道,不能保证,
实际上有63%的几率会发生,但这......他进行了大约1600次尝试。我通过计算他花了多长时间以及知道九个小时是多少来计算的,所以我估计他花了大约960次。所以我认为他不幸地花了这么长时间。平均而言,你期望某人进行一千次尝试,他花了更长时间。现在我的同事詹姆斯·格莱姆做到了,他只花了一个小时就做到了。
它就在那里。整个过程都在YouTube上。这是你能想象到的最乏味的YouTube视频。只是他一直在抛硬币。但至少它只有一个小时长。因为当他在拍摄时,你不知道这只需要一个小时就能完成。但他做到了。你可以在YouTube上找到它。我不认为它有很多完整的浏览量。
但它在那里作为证据。所以他只花了一个小时。好的,关键是我们可以做一些计算。现在我们正在讨论的是一个事件,连续抛十次硬币正面,这个事件发生的概率是一千分之一。所以平均需要多长时间才能做到这一点。但实际上我们可以计算出来,这就是所谓的几何分布,它是等待时间
在这样的事件发生之前。现在它立即发生的概率是一千分之一,就在那里。这就是它第一次发生的概率。现在它第二次发生的概率是一千分之一,它第二次发生的概率乘以1减去一千分之一,也就是它第一次没有发生的概率。
所以它略微减少了,所以我们可以得到花费这么长时间的概率,它越来越低,你将花费3000次的时间概率确实非常低。所以它具有这种形状的分布,称为几何分布,其平均值为1000,众数为1,最有可能的时间是立即发生。达伦·布朗花了这么长时间,詹姆斯·格莱姆花了这么长时间。所以他不走运,他在分布的尾部。
所以有时我们可以对某人的运气有多好进行概率计算。我们稍后会回到更多例子。所以我现在要做的是,既然听众中有一些更学术性的人,我将做一些稍微更技术性的事情。
因为当我们进行统计时,学校的学生将进行统计,进行估计,产生概率,也许估计概率,并产生置信区间等等。我只是想说,我一生都在做这些事情。我一生都在教这些东西。而现在我认为,实际上,这是错误的。这是你年老时可以做的事情。所以我不会说这是错误的。这是不充分的。
因为每一个这样的评估,每一个我们计算的区间都是基于假设的。而这些假设可能是错误的,就像我抛硬币,而它是一个两面都是正面的硬币一样。所以它是基于模型的。它是基于我们理解的模型。
我们知道所有模型都是错误的。因此,我们得出的每一个计算概率,每一个置信区间都是错误的。它过于自信。它应该总是更宽,因为它依赖于可能不正确的假设。事实上,它们肯定是不正确的。所以在许多不同的领域,
人们已经超越了我们所熟知和教授的标准统计建模,我花了毕生时间来教授它。人们超越了它,然后他们进行分析,然后说,是的,但它不是很好。你知道,我们现在没有多少信心,或者我们对我们的分析有真正的信心。这是一种解放。你们这些做数据分析的人,能够说,是的,我已经尽力了,但它不是很好,这是一种解放。
而且每个人都在没有互相交谈的情况下独立发展,许多不同的领域都发展了自己的置信度量表,或者与证据的质量、模型的质量有关。在情报部门,人们会给出概率,但他们也会表达他们对整个分析、对他们理解的信心。健康干预措施是一个等级量表,一个星级评定,用于衡量人们对其评估的信心程度。气候建模,他们会给出概率和置信度。
以及英国在COVID方面的政策分析,每一个做出的COVID判断都伴随着对证据及其对过程理解的低到中等、中等、中等、高或高置信度的评估。这是一个定性量表。我们这样做是在几年前,两年前,当我们在受影响的血液调查中工作时,当时我们作为一个团队,被要求调查有多少人
因为感染了不良的感染血液制品,在1970年到1991年之间感染和死亡,因为这是一种大规模的丑闻,我们被要求对此进行分析。对于像HIV感染这样的事情,你可以计算它们。我们不知道名字,但有登记册。所以我们可以相当准确地、以高度的信心
有多少人感染了HIV,大约有1250人通过接受血液制品感染了HIV,主要是血友病患者。太可怕了。有些只是通过输血感染的,主要是血友病患者。但是对于像丙型肝炎这样的事情,我们不知道。我们没有登记册。我们不知道有多少人。有一些人在20世纪80年代通过输血感染了丙型肝炎,他们至今仍然不知道。
所以如果你认识某个上了年纪的人,开始出现一些问题,他们没有得到诊断,有肝脏问题,让他们检查丙型肝炎。所以他们可能在分娩时接受过输血等等。
很多人都不会,这非常困难。所以我们给出了一个评估,我们估计大约有27000人感染了丙型肝炎。我们给出了一个相当大的不确定性区间,21000到39000。但随后我们说,现有证据能够回答这个问题的信心有多大?只有中等。换句话说,我们完成了所有的分析,然后说,是的,但它并没有那么好。
还不错。我们已经尽力建立了一个非常复杂的统计模型。但是其中包含大量的假设,主观判断等等。能够做到这一点是非常令人振奋的。所以这意味着你可以超越你所能计算的东西,你实际上可以表达你对你理解的更深层次的不确定性。对于乙型肝炎,我们被问到有多少人被感染,我们拒绝回答,因为我们对证据的信心太低,我们说我们甚至不会尝试给出一个数字。
非常令人振奋,因为这就是所谓的强制性科学。当你被告知要进行分析并产生一个数字时,即使那里没有好的数据。所以如果你曾经参与过强制性科学,有时拒绝回答。所以这说明的是,当我们进行分析并得出我们漂亮的区间时,不要相信它。
这在COVID期间得到了很好的说明。还记得COVID中的R数吗?我们每隔一周左右就会得到,哦,R数是1.2。这意味着平均而言,一个被感染的人将影响1.2个人。因此,由于这个数字大于1,所以疫情仍在蔓延。并且有多个团队。有八个不同的团队,使用12个不同的模型来估计R。
他们每周都会在一个会议上聚在一起,决定他们对此的看法。这是一种,你知道,你得到12个,18个,所以12个不同的模型。这些是一周的估计值。它们大多数时候甚至都不重叠。所以这是一个非常自信的。这是相当自信的。它甚至与这个不重叠。而它们都在估计同一个量。
基本上来自相同的数据,但使用完全不同的模型结构,有一些是确定性的,有一些是基于主体的模型,所有的一切,微分方程,每个人都在使用不同的方法,那么你该怎么做呢?这向我展示了他们所做的事情,他们聚在一起讨论,然后产生一个综合答案,这个答案在中间,比他们所说的任何一个都要宽,我认为这是一个相当不错的方法,但这表明,如果只有一个团队这样做,那就很危险了
并且你知道这个团队,“好吧,我说我们绝对相信这一点。”不,我们不能那么自信。所以这是一个至关重要的重要性,奥萨马·本·拉登的例子也表明了这一点,获得多种视角的至关重要的重要性。特别是,所有区间都太窄了,因为它们假设其分析的真实性。
所以他们产生了一个汇总估计。但真正好的事情是他们每周都会公布这些结果。你可以在网上获得所有这些东西。这难道不是开放和慷慨的吗?科学的一个很好的例子,表明科学是一项合作活动。当然,他们在气候变化方面也这样做。他们汇集所有模型的结果,而不是相信任何单个模型。
好的,关于这一点,还记得我提到的红队这个概念吗?所以红队是指你有多个团队在调查同一个问题,红队是那些悲观的人。你不想让他们在身边。他们总是寻找可能出错的地方,他们是悲观主义者,他们说,不,不,不,不,不,不。
国防部是那些人,看,这是一整本红队手册。他们真的推崇红队的理念,以强调、揭示隐藏的偏见、挑战假设和信念、找出逻辑上的缺陷。这些人确实会惹麻烦。他们扰乱了群体思维和决策机构的舒适性。所以这是一条非常有力的路线。国防部是那些大力推广这一点的人。
即使是将信心放在模型上,也不够深入。现在这将进入我们所说的某些深度不确定性。现在想象一下,这个人是谁,特朗普?他上周开始,轰轰烈烈地开始了。想象一下,如果你是政府、企业或任何其他机构,试图为未来四年关于美国的计划
我的意思是,谈谈深度不确定性。这将非常困难,因为你根本不知道会发生什么。不可预测性是巨大的。
所以我们正在谈论拉姆斯菲尔德的已知未知数。有时我们可以做到,我们可以指定一个特定的事情。也许对于乌克兰战争,我们可以列出可能性,也许吧。也许开始对每一个可能性都赋予概率。可能,相当困难。但在某些领域,我们甚至不知道可能性是什么。我们甚至不知道会提出什么问题。真正的未知未知数。
所以,我的意思是,一个好的红队应该试图将未知的未知数转化为已知的未知数。它应该想象所有可能发生的事情,你知道,列出所有可能性。所以基本上,我们正处于这种情况,有时我们甚至无法考虑可能发生的事情。
这是一个定义明确的列表。这是当我们不知道可能发生什么的时候。我们甚至无法列出可能发生的事情。这是我们什么时候可以对事情赋予概率?我们也许能够赋予数字,有时我们不知道数字是什么。我认为这是一个很好的想法,我从其他人那里偷来的,一个很好的二维表,在这个角落里,这是好的东西,这是我们教给学生的东西。
当我们知道可能性并且可以赋予数字时。风险分析。然后在这里,我们仍然知道这些事情,但人们对他们的概率并不满意。他们可以给出粗略的概率,也许只是一个可能性列表。他们也许能够对事情进行排名。他们可以粗略地做一些事情,但他们有点理解可能发生的事情,他们知道可能发生什么。这个,我们不知道可能发生什么。我们甚至无法想象可能发生什么,而且我们根本不知道数字是什么。
所以这就是深度不确定性。这就是我们只剩下试图产生一些场景、叙事、富有想象力的场景的地方。当然,对此的回应是弹性决策。应该能够经受住任何事情的考验的决策,因为我们知道,无论发生什么,都是我们从未想到的事情。你必须非常谦逊。你必须承认你不知道。在那个领域工作是相当困难的。
现在这个你可能会觉得有点奇怪。这是你不知道可能发生的事情的列表,但你却愿意赋予概率。我认为,什么?这似乎非常奇怪。现在这样做的人是英格兰银行。英格兰银行这样做。
哦,对不起,深度决策,我忘记了这个。是的,如果你有深度不确定性,这是左下角。对不起,我跳过了。这是左下角,未知的未知数。哦,是的,是的,是的,完全正确。所以国防部,为了处理已知的未知数,他们雇佣了科幻作家。
这难道不酷吗?这是一本非常好的书。它们是很棒的短篇故事。你可以下载这个。它们是很棒的短篇故事。关于无人机接管伦敦的非凡故事。太棒了。只是为了尝试考虑所有可能发生的事情。他们永远无法想到人工智能实际上会发生什么。
我们永远无法做到这一点,但我们可以尝试去思考它。我们需要谦逊,做出能够经受住我们可能从未想到的事情的考验的决策。对不起,我说过这些。我忘记了我有一张幻灯片来介绍它。好的,这个角落是奇怪的一个。我们不知道会......我们不知道可能发生什么,但我们想赋予它概率。现在,这就是英格兰银行所做的,或者至少过去是这么做的,
因为我认为他们现在已经取消了扇形图,我认为这完全是愚蠢的。他们制作了扇形图。所以这是对从2000年初到2023年末三年内GDP增长可能性的预测。这个带,这是30%的概率。这是基于建模和判断的混合。这是60%的概率。这是90%的概率。这就是他们所做的全部。最后的10%是未分配的。
他们说其他事情可能会发生。10%的概率是其他事情可能会发生。我们不知道,它可能在任何地方。他们这样做也很好,因为这就是2020年发生的事情。这是他们的范围,这就是发生的事情。他们并没有错。他们并没有错。因为他们说,对不起,有10%的概率是其他事情会发生,我们没有说它可能是什么。所以当那个预测之后发生这种情况时,他们并没有错。
所以我认为这是重要的。他们实际上确实考虑到了这一点,我们可以对“以上都不是”赋予概率,然后通过保持弹性将其纳入我们的决策中。我认为这是一个巨大的见解。好的,所以......哦,上帝,我最好结束。
哦,是的。哦,上帝。是的,快结束了,快结束了。我会很快地浏览一下这个。对不起。危机中的沟通,仅仅是因为这是一个关于COVID的相当重要的主题。他建议说,哦,我会很快地做。你知道,
这是有很多不确定性,但我们需要沟通的地方。食品标准局局长约翰·克雷布斯,你必须说出我们知道什么,我们不知道什么,必须诚实地对待这一点,我们正在做什么来找出答案,以及人们在此期间可以做些什么来确保安全。但最后一点,建议可能会改变。现在,这被称为临时性,这是政客们无法做到的事情。他们完全无法说,好吧,我们将这样做,但这可能行不通,然后我们将改变并做其他事情。
因为然后我们将了解更多信息。所以我们建议这样做,但是,你知道,但是我们会回来,我们的建议可能会改变。他们在COVID期间从未说过这句话,这就是为什么一年后人们仍在擦拭表面,而这完全是浪费时间。他们应该在那之后就知道这一点,而且他们在大约六周后就知道这一点。然而,每个人仍在擦拭表面。绝对没有意义。所以那种说法就这样卡住了。
因为他们否则会被指责为做了180度大转弯,因为他们没有承认他们所说内容的任何临时性。好的,所以巧合。现在,我必须快速浏览一下这个。为什么它们如此频繁地发生?为什么它们只发生在我身上一次?我得到了六个双黄蛋。它们就在那里。所以这只是一个例子,我得到了六个双黄蛋,而一千个鸡蛋中只有一个是双黄蛋。
那么这是一个百万分之一,百万分之一,百万分之一的事件吗?一千分之一,六次。好的。所以我会让你考虑一下。这似乎有点令人惊讶。我正要做一个令人难以置信的煎蛋卷。你知道,那里有一点白葡萄酒。所以生日巧合经常发生。让我们就这样做吧。我认为我们有时间。我只想,我会简要地介绍一下巧合。你能向你两边的邻居说一下你的生日,并说出你电话号码的后两位数字吗?
嗨,我打断一下这个活动,向您介绍另一个很棒的伦敦政治经济学院播客,我们认为您会喜欢。伦敦政治经济学院智库邀请社会科学家和其他专家来回答一个智慧的问题。例如,为什么人们相信阴谋论?或者,我们能负担得起超级富豪吗?来看看我们吧。您只需在收听播客的任何地方搜索伦敦政治经济学院智库即可。现在,让我们回到活动现场。
现在,请将您的生日和手机号码的后两位数字分别写在纸上。好了。停。
好了,都写好了吗?都写好了吗?现在,听众席上应该有近300人。所以我预计会有两个人坐在彼此旁边,他们不是双胞胎,却有着相同的生日。有没有人与他们的邻居生日相同?有吗?不是双胞胎?你们之前知道吗?你们已经知道了。好的,没错,这相当......有没有人对此感到意外?有。
是吗?很意外?哦,酷。好的,一对人知道,一对人不知道,这正是我预期的。好的,手机号码,因为有1/365的几率,300个机会让它发生,所以大约是一个。现在,手机号码,有多少人坐在手机号码后两位数字相同的人旁边?哦,拜托,一定有人。你说什么?不,不,必须是相同的顺序。是的。
必须是相同的顺序。拜托。真的吗?你们那里有两对吗?两对。后两位数字。你们的两位数字是什么?三对。还有其他人吗?我有没有漏掉谁?他们只有两对吗?哦。哦,我有点运气不好。它应该是......这是一个泊松分布,平均值约为2.9。所以我预计会在两到三对之间。这有点令人失望。一对。这有点倒霉。所以我运气不好。我运气不好。事情就是这样发生的。
所以有时你可以判断事情,但是对于生日巧合,我没有时间来解释这个技巧,你知道,23个人,你知道,这里几排,有50%的几率他们中有两个人有相同的生日。但是一个,35个人,有81%的几率两个人共享一个生日。80个人,几乎可以肯定两个人有相同的生日。哦,这是一个例子,他使用了2023年女子世界杯,因为在世界杯阵容中,有23个人在一个世界杯阵容中。
所以有32支球队,其中17支球队至少有一对生日相同的球员。所以超过一半的女子世界杯球队都有一对生日相同的球员。三支球队有两对,摩洛哥和尼日利亚有三对。我喜欢尼日利亚的那一对,因为这里有Glory和Christy,她们都是圣诞节出生。是不是很可爱?
好的,比赛。现在,手机号码的后两位数字,这是一个你可以使用的很好的例子。我的意思是,我现在不会计算这个,如果23个人,有94%的几率。这是一个很容易记住的例子。如果有20个人,那么他们中有两个人手机号码后两位数字相同的几率为87%。
我现在没有时间来演示它,因为我知道。所以我知道在这两排,前两排,几乎可以肯定有两个人有相同的数字。但我不想耽误太多时间。所以你可以......
你知道,你应该可以通过以此打赌来赚钱。好的,哦,这里还有一个,但这里还有一个,我现在就要结束了。现在,这里有一个有趣的例子,这是一个托盘游戏,人们在18世纪玩过,每个人都会有一套牌。所以有人拿着梅花,有人拿着所有的方块,你一次一张地翻牌,啪,啪,啪,然后如果你都翻到五或者都翻到六,你就喊“碰”。
现在,如果两个人玩这个游戏,你会押注哪一个?会有匹配还是不会有匹配?你认为哪一个更有可能发生?13张牌,你一次一张地翻牌。匹配的概率是多少?谁认为匹配的可能性大于不匹配?谁认为不匹配的可能性大于匹配?是的,有63%的几率会匹配。
所以几乎有三分之二的几率。所以如果你玩这个游戏,总是押注会有匹配。现在,奇怪的是,这并不取决于你有多少张牌。如果你每人有一整副牌,并且如果数字完全匹配,那么仍然是63%。如果你只有五张牌,它仍然是63%。匹配的概率并不取决于有多少张牌。
我现在不会尝试演示它。对于那些对此感兴趣的人来说,它是1减去1/e。但这非常不寻常。欧拉研究过这个问题。在5的时候它只是一个近似值,但它越来越接近63%,1减去1/e。所以这是一个自1700年以来就存在的游戏,而且它仍然有点,你知道,对人们来说不太直观,因为它并不取决于有多少张牌。
好的,我现在要停下了。他们是怎么得到六个双黄蛋的?很简单。我买了一盒双黄蛋。同样,这表明,不要相信。你知道,不要相信这些数字。一百万分之一,百万分之一,百万分之一。真是胡说八道。而且,是的,你可以随时得到它们。看,特易购卖3.8英镑。在Waitrose,特易购只要2英镑就能买到双黄蛋。所以,
你想要做的这个技巧是,买一盒双黄蛋,然后回家把它们换成你家蛋盒里的鸡蛋。这样,当他们开始打破它们时,它们都会是双黄蛋,他们会说,哦!所以这是一个很好的技巧,一个可以用来戏弄所有人的好技巧。祝你好运,非常感谢。[掌声]你想过来吗?哦,是的。
谢谢你,David,非常精彩的演讲。现在我们有一些时间来听听观众的提问。任何想提问的人,请举手。我看到那边的那位先生第一个举手了。
谢谢。我叫Jay,我是伦敦政治经济学院的本科生。感谢您今天抽出时间,教授。我想问一下您关于未分配概率的问题,英格兰银行的10%的事情。您不认为这暗示着某种认识论上的不负责任吗?因为你只是承认,你只是说,哦,我对这部分实际上什么都不知道。
因此,我觉得你几乎是在否定经济学中理性行为人的整个概念。谢谢。是的,但是你相信这个理性行为人理论。我的意思是,这是一个错觉,完全的错觉,认为我们可以理性,认为我们知道这些。这个理性行为人理论,它是一个理论,因为它依赖于能够指定所有结果并赋予概率。你两者都做不到。
你通常不知道所有可能发生的事情,你当然也不知道概率,因为概率本身也不存在。我还没有深入探讨这个问题,但我认为概率本身并不存在。它们只是基于假设和判断而构建的。所以,是的,它完全否定了理性行为人理论以及一切,因为我认为,我只是不认为这是一个明智的,它是一个理论。认为它在实践中以任何意义上都适用是不好的,因为它做出的假设是不现实的。
所以我认为,谦逊地承认我们无法说出所有可能发生的事情,并赋予其他我们尚未想到的事情一小部分,也许是一小部分或相当大一部分的概率,这更现实。
在我看来,这是一件非常合理的事情,我很高兴英格兰银行这样做。你可以把它想象成分布的一个未建模的尾部。在书中,我只是谈到如果你只是假设尾部的帕累托分布,你实际上会得到相同的结果。但你知道,你甚至不需要做那么多的建模。你只需要说还有其他东西。
所以我认为这是对理性行为人理论的反驳,并指出这是不现实的。但是我并没有像欧文·金和约翰·凯的“激进不确定性”一书那样走得那么远,他们想把整个事情都抛弃。我只是想处于量化和放弃量化之间的中间地带,因为我认为你应该始终尽力进行量化
但不要假装你真的可以做到。谢谢。我想这位女士举手了。是的。
你好,我是Radhika。我在这里读研究生课程。所以我有一个问题,它不是完全学术性的,但是作为一个统计学家,你对墨菲定律有什么看法?关于墨菲定律?是的。哦,这太棒了。是的。是的。所以墨菲定律是,任何可能出错的事情都会出错。我认为这实际上是一种红队思维模式。
这是一种红队思维模式。它预料到任何事情都可能出错。这几乎是红队的定义。它总是只考虑问题是什么,什么可能出错,并至少在某种程度上为这些意外情况做好计划,增强对可能出错事物的抵御能力。我不认为把它作为一种完整的人生哲学是明智的,因为它是不正确的。
它是不正确的。但作为一个规划程序,作为一个方法,作为一个心态,尤其是在一群人中,我认为它确实非常合理。但我认为它是不正确的。因为它就像运气。我的意思是,运气并不存在于外部,作为一个事物。这是我们事后对发生的事情的描述。你知道,它不是某种外力。谢谢。还有其他问题吗?那边有一位。
非常感谢您,教授。我去年从伦敦政治经济学院毕业,获得了统计学硕士学位。这不是统计学问题,而是更多关于建议的问题,对吧?它也与纳西姆·尼古拉斯·塔勒布的一些片段产生了共鸣,他也在这个领域做了一些工作。但作为一个年轻人,我接触到老年人的智慧。
我接触到事实和统计数据。老年人的智慧可能已经延续了几个世纪,几千年,但是统计数据一夜之间就可以完全摧毁这种智慧,或者至少看起来是这样。那么,当我在两者之间时,你如何建议我处理这个问题?哦,哦。
哦,我认为这超出了我的能力范围。是的,我的意思是,你怎么做。我的意思是,我认为这些是相互竞争的知识来源。在某种程度上,我不喜欢在两者之间进行选择的想法。我实际上认为老年人的智慧是,你可以把它想象成拉姆斯菲尔德没有提到的第四个象限。这是已知的未知数。
这是人们可能知道但几乎没有意识到的事情。他们掌握的知识,是隐性知识。它是非分析性的,但实际上可能是正确的,只是因为你知道他们甚至可能不知道他们拥有这种知识,或者它来自哪里,或者任何类似的事情。所以我认为这显然是一个非常宝贵的理解来源,特别是因为所有统计模型都是错误的。它们充满了假设和判断。
我们不是理性行为人。所以我认为这很好地反驳了这种量化和分析的冲动,因为我们可以欺骗自己,认为我们实际上理解了事情。所以这是一件困难的事情。我认为始终牢记这两点是很好的,因为它们不应仅仅被视为知识来源的“非此即彼”。我认为这是我的态度。
- 谢谢。我们有一些来自网上的问题。让我读给你们听。第一个问题是,第一个猜测游戏,答案是A或B,可以是一场你想要成为最佳的比赛。
这是否会鼓励冒险和过度自信的估计?不应该。评分规则是这样的,它应该惩罚那些夸大自己信心的人。这就是为什么使用平方误差来教授这一点,你可以证明你的预期分数是通过诚实来最大化的。
我明白了。但我认为这里的重点是,如果你想成为整个人群中最好的,那么不知何故......是的。这取决于。同样,如果你只是试图跨越一个门槛,换句话说,你有一些......损失函数表明,好吧,除非我是最好的,否则这是没有意义的。那么,即使你可能会惨败,或者你可能会成功,也可能值得冒险说10分满分。但这并不是......
这是特定的损失函数。如果你试图最大化你的预期分数,那么你应该努力诚实,不要过度自信。好的。我们这里还有一个问题。所以,根据抛硬币的例子,你认为解释重复发生的罕见事件最终会发生最好的方法是什么?
哦,这是一个很好的观点。好吧,是的,我之前也谈到过这个问题。现在当我谈到罕见事件时,我既谈到罕见事件,也谈到在更大的背景下这种事件发生的可能性有多大。
所以我在书中做了这些事情,几年前,在八天内发生了三起重大飞机坠毁事件。现在这是一个非常罕见的事件,但是你可以计算出,你知道,在一个移动的八天窗口中,在十年内,这很有可能在某个时候发生。
同样,我上周在对露西·莱特比的调查中提供了证据,在切斯特郡伯爵医院2015年观察到的死亡人数与前几年的相比,概率约为0.008,这是一个罕见的事件,但是有150个新生儿病房,所以你期望每年都会发生这样的事件。我明白了。我想这里的重点是,罕见事件是不同的。
这取决于它们有多罕见。是的,罕见事件经常发生。好。让我们再问几个......听起来有点矛盾,但这是真的。我的意思是,中彩票对个人来说是一个极其罕见的事件,但它总是会发生。让我们从观众那里再问几个问题。我看到那边有一位年轻的先生。是我吗,这位年轻的先生?什么样的......正如你一直在......
四处演讲,而且你出版了你的书,你都遇到过哪些有趣的负面反应,它们来自哪里?哦,我明白了。哦,关于这本书。哦,负面反应是......好吧,这很有趣。有些人只是说它太技术化了。另一些人说它不够技术化。它试图,你知道,以一种不令人满意的方式取悦所有人,你知道,加入了一些数学。但有些人说,哦,我想要更多。所以它永远无法完全满足任何人,因为有些人......
我在亚马逊上收到了一些评论,说关于如何在组织内进行情景分析的详细工作不够。好吧,我提到了,但它不是风险管理书籍。它不是它的用途。它不是组织管理书籍。另一件事是,我认为很多人可能会放弃
因为你知道关于运气和巧合的章节是相当轻松的内容,正如我们刚才向你展示的那样,然后它确实变得有点沉重,当我开始谈论统计建模和置信区间太窄时,所以在某种意义上,你知道,试图写一些东西来取悦所有人,很可能它不会取悦任何人,但是
对不起,我可以继续吗?这很有趣。我更倾向于考虑统计学界持不同哲学观点的人。哦,好吧,我的意思是,这本书是主观贝叶斯方法的绝对论战,当然,其主要论点是概率并不存在。我们只是编造的。
我真诚地相信这一点,而且我刚刚在《自然》杂志上发表了一篇论文也这么说。概率并不存在。可能在量子水平上存在,但我甚至对此都不确定。或者很多人甚至都不相信这一点。它作为外部世界的客观属性而存在。所以我认为概率不是。我认为它只是我们自身不确定性的表达。所有数值概率都是人为构建的。
而且我不认为它们甚至是在估计一个真实的潜在概率。这是一个相当极端的观点,我50年前就被灌输了这个观点,我从未改变过,而这本书实际上是一种伪装得很不好的论战
来论证概率并不存在,我们在大学和学校教授的东西完全是错觉。但是没关系,我认为它非常有用,我所论证的是,假装它存在,假装存在诸如机会和概率之类的东西非常有用。这确实很有用,但不要相信它们实际上存在于外部世界。
我的意思是,悖论在于,在我几乎愿意承认存在概率分布的情况下,例如气体分子四处反弹和彩票球四处反弹,我认为确实会产生,而且是可以检验的,对数字的均匀概率分布。悖论在于,这是一个完全确定性的论点。
情况是那里根本没有任何随机性,彩票球只是使用牛顿力学四处反弹,它只是极其复杂,所以你最终会得到一个均匀的概率分布,所以具有讽刺意味的是,在我愿意承认概率实际上存在的地方,其中一个领域是完全确定性的,它只是我们无知的表达,是的,我们还有时间再问几个问题
但这是一种相当极端的观点。是的,这边一位。体育博彩。有一整节关于体育博彩的内容。
有一整节内容是关于如何计算足球进球概率的,因为进球往往遵循泊松分布。如果你可以模拟一场比赛中进球的预期数量,并使用每支球队的进攻强度和防守弱点的系列数据,你就可以为进球数量产生一个概率分布。我在书中描述的是大约
15年前的体育博彩水平,当时模型相当简单,人们发表了这些模型。人们发现它们有效,你可以从中赚到很多钱,于是所有在这个领域工作的人都开始在博彩公司工作。我的前任,剑桥大学的统计学教授,离开了剑桥大学加入了一家体育博彩公司。所以重点是,大约15年前,在过去的......
15年或10年左右,人们能够通过相当基本的足球和赛马模型赚到很多钱。现在这变得更加困难了,因为博彩公司和博彩交易所,有很多人在做如此好的分析,以至于真的很难战胜赔率。
在过去的好几年里,人们通过统计建模赚了很多钱。但现在它变得更加困难了,因为人们正在对赛马和足球进行非常复杂的建模。所以我现在不建议把它作为职业。过去,我会说这是一个非常好的职业。我不再这么认为,我认为,是的。
谢谢。我认为我们有一些非常好的问题。不幸的是,我们的时间已经用完了。让我们再次感谢戴维·斯皮格尔哈特教授精彩的演讲。感谢您的收听。您可以在您最喜欢的播客应用程序上订阅伦敦政治经济学院活动播客,并通过留下评论来帮助其他听众发现我们。访问lse.ac.uk/events以了解接下来有什么活动。我们希望您很快能参加伦敦政治经济学院的另一个活动。