We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Episode 7: Lies, Damn Lies, and Statistics

Episode 7: Lies, Damn Lies, and Statistics

2020/7/5
logo of podcast The Theory of Anything

The Theory of Anything

AI Deep Dive AI Chapters Transcript
People
B
Bruce Nilsen
C
Cameo
Topics
Bruce Nilsen:本期节目讨论了统计数据在社会中的广泛应用和误用,以及人们如何利用统计数据来掩盖对未知事物的认知不足。他通过多个例子,例如女性患乳腺癌的概率、新冠病毒的死亡率以及疾病筛查测试的准确性,说明了统计数据通常应用于群体,而非个体,将群体统计数据直接应用于个体判断是不准确的。他还介绍了概率论的两种用途:一是描述实际概率,二是弥补我们对未知事物的认知不足,并指出我们通常使用概率论来弥补我们对未知事物的认知不足,而非仅仅用于计算真实概率。在讨论机器学习时,他指出机器学习虽然有其独特的工具和词汇,但其根本还是建立在统计学基础之上的,其核心问题是如何将统计数据应用于个体预测,而这并没有简单的答案。他还讨论了机器学习中可能存在的种族和性别偏见问题,以及如何通过调整训练数据或算法来减轻这些偏见。最后,他总结了我们会在各种情境中使用概率论,但其适用性和意义并非总是明确的,并强调统计数据适用于群体,而非个体,在应用统计数据时需要考虑其局限性。 Cameo:Cameo在节目中与Bruce Nilsen一起讨论了统计数据的应用与误用。她指出统计数据适用于群体,而非个体,因此不能直接将群体统计数据用于个体预测。她还指出,人们常常错误地认为统计数据(例如疾病死亡率)在人群中均匀分布,而忽略了其个体差异性。在讨论新冠病毒死亡率时,她指出使用统计数据来弥补我们对未知事物的认知不足,这在解释不同地区新冠病毒死亡率差异时尤为明显。在讨论机器学习时,她指出解决机器学习模型中的偏见问题,需要考虑如何提高模型对不同群体的预测准确性,而非仅仅关注消除偏见本身。在讨论种族偏见时,她指出在消除机器学习模型中的偏见时,需要权衡模型的准确性和公平性。最后,她总结了人们常常利用统计数据来支持自身的偏见,并对其他群体做出假设。

Deep Dive

Chapters
Cameo and Bruce discuss the common misuse of statistics, particularly in the context of individual probabilities versus population statistics, using examples like breast cancer risks.

Shownotes Transcript

任何理论播客可能需要您的帮助。我们拥有一小群忠实的听众,我们希望向其他人宣传播客,以便其他人也能欣赏它。据我们所知,我们是唯一一个涵盖戴维·杜伊奇哲学所有四个方面以及其他有趣主题的播客。如果您喜欢这个播客,请在 Apple Podcasts 上给我们五星好评。这通常可以在您的播客播放器中直接完成,或者您可以搜索“任何理论播客 Apple”之类的关键词。

有些播放器有自己的评分系统,在任何评分系统上给我们五星好评都会有所帮助。如果您喜欢某一集,请考虑发推文或在 Facebook 或其他社交媒体上链接到我们,以帮助宣传。

如果您有兴趣在经济上支持播客,我们有两种方法可以做到这一点。第一种是通过我们的播客托管网站 Anchor。只需访问 anchor.fm/four-strands (F-O-U-R-S-T-R-A-N-D-S)。有一个支持按钮,允许您进行定期捐款。如果您想进行一次性捐款,请访问我们的博客 fourstrands.org。那里有一个使用 PayPal 的捐款按钮。

谢谢。欢迎收听《任何理论》播客。我是布鲁斯·尼尔森。我和卡梅奥在一起。今天我们要讨论卡梅奥自己选择的话题,那就是统计学。您可能听说过关于谎言、该死的谎言和统计学的笑话。今天我们要讨论的是人们如何使用或滥用统计学。

是的,我有一些例子。我和金米在午餐时开始了这个对话。这是在冠状病毒恐慌期间。所以这是一个在线午餐。嗯,我们谈到了一些事情。假设有一位52岁的妇女,她听到这样一种说法:40岁以上的妇女患乳腺癌的几率为5%。那么她患乳腺癌的几率是多少?

有人知道吗?可能假设是5%的几率,对吧?对。好的,但假设后来她听到这样的统计数据:50岁以上的妇女患乳腺癌的几率为6%。她既超过50岁,也超过40岁。那么哪一个适用于她呢?同样,您可能会认为这意味着6%。哦,她实际上属于6%的类别。但是现在假设这位妇女后来听说,

60岁以上的妇女患乳腺癌的几率为10%。现在,她的患乳腺癌的百分比是多少?

我会停下来思考一下。卡梅奥,你此刻怎么想?嗯,这些百分比都不对,我的意思是,因为你和我已经讨论过这个问题了,这些百分比实际上都不能代表她患乳腺癌的可能性。是的。因为乳腺癌通常基于个人和个体因素,你知道吗?是的。所以在这个例子中,很难弄清楚

她甚至不属于这些类别中的任何一个,对吧?我的意思是,50岁以上的妇女包括60岁以上的妇女,她们患病的几率要高得多。那么这是否意味着她的几率低于6%?可能吧。你知道,根据这些数字很难弄清楚,因为统计数据适用于人群,而不适用于个人。所以我们使用统计数据,就好像它们适用于个人一样,但实际上它们从未直接适用于个人。是的,而且你知道,即使……

即使在人群内部也是如此。我们之所以想谈论这个话题,是因为我们看到了很多关于有多少人会死于冠状病毒的统计数据。对。你知道,最初人们并没有那么害怕,比如两三周前,因为,你知道,

死亡率低于流感,或者死亡率只比流感高1%,或者我们理解的各种不同的百分比。当人们考虑这些百分比时,他们很多时候都会假设这些百分比会一致地应用于整个人群。对。如果我知道,如果我们知道死亡率是10%,

这很可怕,因为我认识的十个人中就有一人可能会死。但是最近一直在我脑海中的一本书是康妮·威利斯写的《末日之书》,其中一个人口……

最终死亡率达到100%,这是一个小群体,因为他们无法照顾自己,他们最终都死于死亡率只有20%的东西。- 对。

所以这就是你和我最初开始谈论,让我们进入这种想要谈论概率模式的事情。我很高兴你现在有这张幻灯片,概率论的两种用途。是的。概率论有两种用途。我认为人们对此并没有过多考虑。好的,比如拿一个骰子。在你掷骰子之前,掷出六的几率是多少?

显然是六分之一。现在你可能不会考虑这一点,

但是现在我拿一个骰子,我把它盖在一个碗里。所以我不知道我刚刚掷了什么。好的。骰子在碗底是六的几率是多少?显然是六分之一。好的。但是这两个例子之间实际上存在差异。一个是实际概率,另一个是无知。所以我们使用,我们使用概率来掩盖无知,来讨论我们不知道的事情。

事实上,这可能是我们今天使用概率论的主要方式,就是用来讨论事情。现在您可以从这个例子中看出它是有道理的,对吧?这不仅仅是愚蠢的事情。骰子是六的几率是骰子要么是六,要么不是六,对吧?它已经被掷出了。它要么是六,要么不是六,对吧?所以严格意义上的概率根本没有涉及到,而且

然而,说六分之一的概率对我们来说仍然有意义,对吧?因为我们只是不知道它是什么,但我们知道它是通过一个赋予它六分之一几率的过程产生的,对吧?你有点让我头脑混乱了。

所以它变得更疯狂了,对吧?那么这两个例子的区别是什么呢?嗯,很难描述这两个例子的区别,好吗?除了显而易见的一个例子,一个是直接的概率,另一个则与无知有关。好的。好的,我们使用概率来掩盖我们的无知,来衡量我们的无知。在某些方面这是有道理的,在某些方面则没有道理。

当我们开始对事物使用概率论时,哪种方式并不总是显而易见的。好的。假设我们想发现某种疾病有100%的几率,如果你有某种基因,你就有100%的几率患上某种疾病,而这种基因存在于万分之一的人身上。好的。我想问的问题是,你知道的,我患上这种疾病的几率是多少?好的。是的。

一开始,我们可以说,嗯,万分之一的人有这个基因。我们可以把它当作概率来处理。我们可以说你患上这种疾病的几率是万分之一。好的。如果你活得足够长或者其他什么,对吧?当然。好的。所以,这很有道理,对吧?我们这样使用概率论并不是完全愚蠢的,但它也有一些不妥之处。好的。

好的,关于概率论的一个快速入门,这样我就可以使用一些符号了。所以我们把P(疾病)放在括号里,如果你正在听这个。如果你在 YouTube 上观看这个,那么你可以看到屏幕,但如果不是,那么

你必须在这里暂时忍受一下我。所以P(疾病),这是你患上这种疾病的百分比几率。所以我们假设它是0.01%的几率,万分之一。

好的。接下来是给定你拥有该基因的疾病概率,竖线表示给定。那么这是100%的几率。好的。如果你知道你拥有该基因,那么你患上这种疾病的概率就不存在了。你会患上这种疾病。好的。然后是如果你没有该基因,你患上这种疾病的概率。在这种情况下,我们声称它是0%。如果你知道你没有该基因,那么你就不可能患上这种疾病。好的。

所以我们真正要问的问题是,你拥有该基因的概率是多少?对。我们假设这也是0.01%,因为万分之一的人拥有该基因。但是你拥有基因的几率并不是随机的。好的。显然这取决于,你知道,你的父母是谁,对吧?他们是否拥有该基因。

这不会在整个人群中随机分布。这可能是全世界范围内的几率,但也许印度没有人拥有该基因,或者在那里更罕见等等。对。所以你所属的人群在这个例子中很重要。而那,

0.01%的几率实际上并不适用于你,对吧?这只是,这是我们所能想到的表达我们无知的最好方法,如果这说得通的话。

它实际上非常有道理。我喜欢这个例子,特别是考虑到冠状病毒以及我们对哪些人群最有可能受到严重打击进行了多少讨论。当你比较德国和意大利目前的死亡率时,

有很多东西隐藏在表面之下,很多人都在推测导致不同死亡率的原因。对。而实际上我们只是为了掩盖我们的无知。这很有趣。继续,布鲁斯。好的。这是一个著名的例子。我显然正在学习机器学习并攻读硕士学位。这在我的机器学习课程中出现过。这到处都出现。他们总是提到这个。

这是一个经常被使用的例子。所以这是筛查疾病的想法。

好的。你有一个疾病检测。假设它是冠状病毒检测或其他什么,对吧?而且它的准确率为95%。好的。我们的意思是,如果你患有这种疾病,它显示阳性的概率为95%。这就是第二行,对吧?对。好的。但它会产生5%的假阳性。这意味着如果你没有这种疾病,它仍然显示阳性的几率为5%。好的。

好的。现在假设这种疾病是千分之一,即0.001。你刚刚被检测为阳性。你患有这种疾病的几率是多少?所以卡梅奥,只用你的直觉,根据我目前告诉你的内容,估计一下你认为几率是多少。

嗯,你知道,简单的答案,我大脑想要的答案是,我有95%的几率患有这种疾病。是的。好的。因为这是简单的数学,对吧?就是说,嗯,这已经是我能猜到的最好的了。那么你为什么认为这个数字是错的呢?嗯,我不确定我相信它是错的还是对的,因为……

因为我不相信所有这些数据都一定与我或任何人在这个特定情况下相关。好的。所以实际上有一种方法可以使用贝叶斯定理来计算实际概率,贝叶斯定理值得单独一期节目来讲解,所以我不会深入探讨。但是如果你看这里的屏幕,我会给出贝叶斯定理的公式。贝叶斯定理的作用是它允许你——

切换顺序。我们知道,如果你患有疾病,获得阳性的概率是多少。我们真正想知道的是,如果你有阳性结果,你患有这种疾病的几率是多少。好的。所以我们想把这个,

翻转过来。你看到我如何用贝叶斯定理来显示它可以被翻转吗?是的。好的。现在,我不会使用贝叶斯定理。我只是给你一些更直观的数字。好的。以下是实际数字。假设我们有10万人。根据我们的数字,其中有多少人患有这种疾病?嗯,是千分之一。所以其中100人患有这种疾病。好的。其余的人没有。

现在我们对他们所有人进行检测。在这100个患有这种疾病的人中,95个检测结果为阳性,5个检测结果为阴性。好的。因为这就是数字。这就是几率,对吧?对。好的。现在在这99,900人中,5%的人检测结果为阳性,95%的人检测结果为阴性。好的。所以有4,995人检测结果为阳性。

如果你在这个测试中得到阳性结果,那么你就在这5,090人中,其中只有95人患有这种疾病。换句话说,你患有这种疾病的几率为1.9%。有趣。好的。好的。如果我检测结果为阳性。如果你的检测结果为阳性。所以这就是为什么对整个人群进行这样的筛查测试没有意义的原因。

所以这里的假设是我们对整个人群进行检测,在这种情况下,我们说的是10万人。当然。你实际上永远不会在现实生活中这样做。在现实生活中以这种方式使用这样的测试是愚蠢的。你实际上是去看医生。医生首先检查你,说,哦,你的症状表明你患有这种疾病,这——

虽然我现在不知道概率是多少,但这让你进入了更高的概率类别。当然。患有这种疾病。然后测试就有一些意义了,对吧?当然。但是如果你只是走出去,只是对每个人进行测试,那么测试基本上就毫无用处了。是的,因为,嗯,但是,你知道,

对于我们人类来说,当我们看到数字时,我们认为95%的准确率是一个相当不错的数字。是的。当我们看到这个时,我们会说,好的。事实上,当你把这个例子放在这里时,我首先想到的事情之一是避孕套。避孕套在每次正确使用时被认为有98%的准确率。

但是即使98%的准确率也不高,如果你想做的是预防怀孕的话。对。而且也很有趣,显然,如果你,假设由于某种原因你必须测试全世界,你实际上想做的是多次进行测试,对吧?哦,对。这将非常昂贵,但就像你想让测试结果降到,好的,这是最有可能患病的群体。

然后你想要再次测试他们。然后你想要再次测试他们,直到你达到一个合理的几率水平。这需要一段时间才能达到。

嗯,因为你会有5000个检测结果为阳性的人,然后你会再次进行测试。是的。你可能会再次得到相同的百分比,因为你正在缩小准确率范围。是的。但也要考虑一下,你想要做的是阻止疾病的传播。假设它是具有传染性的。你仍然有5个检测结果为阴性但患有这种疾病的人。对。这是……

你必须以某种方式处理它们,对吧?所以……

令人着迷。好的。好的。现在让我们谈谈机器学习。机器学习是基于统计学的。那里有一个关于机器学习实际上只是统计学的笑话模因,我在节目的原始版本中包含了它,然后认为,你知道,我不确定我是否应该包含它,因为我不确定它来自哪里。但是一个关于机器学习实际上只是统计学的笑话,对吧?但它已经被重新定义,所以人们喜欢它。

对。我们无法判断人们是否喜欢它。是的,所以这并不完全正确。机器学习是一个独立的研究领域,它有自己的词汇表,它有自己的工具,这些工具与统计学不同,但它植根于统计学。这部分当然是正确的。许多机器学习技术实际上是统计学习技术,统计学家使用这些技术。

然后他们有自己的,机器学习有自己独立于统计学习技术的技术,例如神经网络,统计学家不使用这些技术。对,对。所以,但是它们的工作方式相同。其思想是

我们试图根据我们接受过训练的一些样本对个人进行预测。这是一个完全相同的问题。你如何将统计数据应用于个人?对此没有简单的答案。所以机器学习试图提出某种方法来自动划分人群,以便它能够为你提供一个关于个人的好答案。

而且它有很多问题。这就是整个研究的重点,我们如何解决这些问题?对。所以,我这里有这张图,让我来描述一下,这是我实际硕士论文中的内容。对。所以这是什么,这是,有一个名为糖尿病数据集的数据集,他们在纳瓦霍印第安人中检查糖尿病,他们

可以使用机器学习技术来根据某些特征预测某人是否会患上糖尿病,好吗?

所以我在这里做的是所谓的t-SNE,它将大量不同的维度展平到两个维度。这样你就可以对机器学习中发生的事情有一个直观的了解。我们这里有类别0和类别1。所以类别0是红色的。这意味着你没有糖尿病。类别1是蓝色的。这意味着你患有糖尿病。

那么这个机器学习技术在这里做了什么?嗯,它根据已经被展平为简单的X和Y的许多不同的统计数据,获取这个庞大的人群。它说,我要画一条线。如果你在直线上方,那么我预测你患有糖尿病。如果你在直线下方,我预测你没有。好的。你可以看到那条线,对吧?好的。嗯,

好吧,现在,如果你真的仔细观察,糖尿病和非糖尿病都相当混合在一起。好的。但是你可以看到,它相当巧妙地画了一条线,这样,如果它预测你患有糖尿病,那么它正确的几率就大于50%。如果它预测你没有糖尿病,那么它正确的几率就大于50%。

所以它只是画了那条线,然后说,好的,就是这样,为这些人预测糖尿病,为这些人不预测糖尿病。然后它知道它将根据这种技术使用这条线来最大化它的百分比几率,这就是所谓的逻辑回归。

它预测,它将通过在那里画线来最大化它的预测。好的。好的。现在,当我以这种方式表达时,你看到了它是一种多么简单的数学技术,对吧?它甚至不是那么聪明,对吧?我的意思是,我们把机器学习当作某种,你知道,与人类智能相对应的东西,但实际上它只是简单的。

统计学,对吧?它只是测量,好的,如果我在这里猜测,我会最大化我的预测。现在我们在样本集上这样做,请注意我将其称为训练集。好的。它在训练集上的准确率为70%。然后

在我的交叉验证集上,它略低一些。嗯,原因当然是它训练得很好,在它训练的集合上得分很高。好的。问题是它在现实生活中表现如何?好的。我们不知道你实际上永远无法知道它在现实生活中表现如何。你用来模拟这种情况的方法是,首先我们有称为交叉验证集的东西,我保留一些样本,在我训练之前不让他们查看。然后我有一个我没有在这里显示的测试集,我没有,我没有,

我就像,也许每次我训练它时,我都会使用交叉验证集,但是随着时间的推移,这会污染交叉验证集,因为它慢慢地学习,哦,我需要调整一下,因为它做得还不够好。它开始间接学习交叉验证集。然后我在最后使用一个测试集,它从未见过,然后这应该让我对我的最终

训练有信心,你知道我得出的结论实际上会在现实生活中起作用,因为我现在正在用我保留的一些样本进行检查,它以前从未见过。对。它在测试集上的得分总是低于在训练集或交叉验证集上的得分,在现实生活中,它的得分会更低。对。这正是因为

没有简单直接的方法可以将统计数据应用于个人。所以这就是这些年来我们想出的所有技术,试图解决这个问题。好的。而且这里面真的很有趣。

由此产生的事情。所以你可能听说过像种族主义机器学习或性别歧视机器学习之类的东西。好的,这是完全相同的问题。好的,这是统计问题,试图将其应用于个人,但在特殊情况下。所以我在这里放了两个实际的在线杂志引用,一个来自维珍,一个来自连线,在即将到来的

它谈到了谷歌照片如何存在一个问题,它对,你知道,有人注意到他们非洲裔美国朋友的照片被标记为大猩猩。

所以他们为此感到尴尬。那么他们是如何解决的呢?他们只是删除了大猩猩作为标签,这样它就不可能做到这一点。他们没有任何直接的方法来尝试让它正确标记。所以他们只是删除了大猩猩作为标签。这样它就不能那样做了。他们也不会为此感到尴尬。所以他们实际上并没有真正解决这个问题。另一个有趣的是连线的故事。所以,而这种说法

有点轻描淡写了这里真正发生的事情。其想法是,他们有这样一种东西,可以根据你的照片预测你的性别,而且它很有效,它非常有效。好的。但是,如果你是,而且它说,如果你是一个,如果你是一个白人,它会预测得很好,但如果你是一个非裔美国女性或一个皮肤较黑的女性,那么它往往会出错很多。好的。这里真正发生的事情是

它的样本集可能基于,比如说,美国的人群。白人比黑人多。所以当它训练时,它发现深色皮肤是一个很好的预测指标,它应该猜测它是男性。所以它倾向于猜测黑人女性是男性。哦,有趣。好的。因为……

因为它们只是训练集的一小部分,所以这并没有真正破坏它试图进行预测的统计数据。所以它使得预测引擎的最终结果只有在你是白人的情况下才有用。

对,对。所以他们实际上必须做的是,他们必须专门针对非裔美国人进行单独的训练,以便它能够学会正确预测,而不是使用肤色作为基础。你知道,继续。嗯,只是,这非常吸引人。第一个例子,谷歌在这方面投入了大量的资金。就像他们,他们,

他们可能对这个错误感到震惊。这段话说道,近三年来,谷歌实际上并没有修复任何东西。所以我假设这是在2018年。你认为谷歌试图做什么来解决这些问题?我的意思是,我认为他们什么也没做的事实有点,有点误导。我认为他们实际上正在试图解决这个问题。是的。

所以,你知道,有一些技术可以用来解决这些问题。这实际上是目前一个很大的研究领域,是如何让,他们通常这么说,是如何让机器学习不带有种族主义色彩。但这里有一个更广泛的问题,那就是如何从一开始就使机器学习准确,这样它就不会试图对广大的人群进行猜测,而是更擅长对你所属的人群、你关心的人群进行猜测。对。

有一个类似的研究。那个,那个在与本做生意的解决方案流的人,我忘了他的姓,本·泰勒。哦,是的,是的,是的。所以我参加了他在一个会议上的一个演讲,他创建了一个,一个机器学习,一个,一个,

一个引擎,它会拍下你的照片,然后告诉你你的长相如何。好的。有趣。而且,嗯,而且显然,这也有伦理问题。你知道,我的意思是,比如,你想让你的孩子拍下自己的照片,然后被评为四分吗?嗯,但是,但是它有效。好的。它,它会拍照。你可以

把基拉·奈特莉放进去,它会告诉你她很漂亮,你知道,它实际上确实正确地预测了这个人是否漂亮。对。而且,嗯,

他指出的其中一件事是,他们不得不进行专门的培训才能做到这一点,所以,他们,他们,他们得到的数据集是从……他们找到了一些约会网站,可以下载数据。所以他们可以下载图片,可以下载来自真实用户的评分。对。有趣。那是,所以他们下载了,他们从这个网站上获取了这些数据,然后进行了训练。

如果我没记错的话,他们不得不慢慢下载,以免被发现,然后从这个网站上下载数据,然后进行训练。

现在,事情是这样的。你接受的训练对象是与该约会网站所针对的人群相匹配的人群,为了论证起见,假设那是美国。好的。那么你将拥有与该人群的种族构成相匹配的人群。因此,显然非裔美国人将是少数民族,对吧?当然。

所以他们会进行这些评分。当然,会发生的事情是,我的意思是,你可以查一下,某些种族在约会方面比其他种族更受欢迎,对吧?这是许多不同约会网站研究已经很好地证明的事情。它会与那些相匹配。所以,如果你有一些在约会中不太受欢迎的种族,他们的外貌评分会自动降低。

所以他所做的是,他会进行调整,使其无论你的种族是什么,都能进行等效评分,方法是只查看该人群,然后根据该人群进行评分。如果它给你一个7分,那么你在该子群体中的评分就是7分,而不是在整个人群中的评分。这就是他使其不带有种族歧视的方式。哦,真有趣。好的。

现在,这里有趣的一点是,假设你只是约会网站上的一个普通人。

预先调整的数字实际上可能很好地代表你的观点,对吧?所以你已经调整了它,使其不带有种族歧视,但就某些人的预测而言,它实际上在某种程度上不太准确了,对吧?大概是多数人。对,因为虽然人口本身可能并不存在种族歧视,但它很可能会发现它认为有吸引力的东西是有吸引力的。没错。

是的,很有意思。好的,所以,它有点表明这些问题并没有真正简单的答案,对吧?当你使机器学习不带有种族歧视时,你为此放弃了一定的准确性。或者你必须找到某种方法,我的意思是,这里还有其他有趣的事情。例如,即使你的训练集中没有种族,它也可能能够通过你的邮政编码等信息来确定种族

对。所以即使在其使用的数字中没有任何种族信息,它最终也可能变得带有种族歧视。如果它与种族之间存在某种关联,它仍然会找到并使用它。

因为它只是试图……有一些案例,例如他们会预测你再次入狱的几率,或者诸如此类的事情。他们会将其用于假释。而且,你知道,如果你遇到这样的案例,你知道,如果它开始使用种族,并且开始说,好吧,你知道,所有黑人男性都不会获得假释。对。

现在,你真正谈论的是彻头彻尾的种族主义机器学习,它极大地偏向于一个种族。你可以理解为什么人们想要想出某种方法来调整它,使其不再这样做。所以,你知道,回到统计学上来。

这实际上很有趣,因为我们在文化中使用和谈论统计学的方式就是这样。我们很多时候使用统计数据来支持我们自己的偏见。是的。并对人口的其他部分或诸如此类的事情做出假设,例如,我们有统计数据表明,

人们再次入狱的可能性有多大。我们将其用作歧视某些人群的方式。对。这真的,真的很有趣。我的意思是,没有办法解决,即使你解决了机器学习的问题,解决人们的大脑问题也难得多。是的。

这实际上是一件有趣的事情,人们非常担心机器学习中的种族歧视。但是你可以证明的一件事是,人类是有偏见的,种族主义的,性别歧视的,对吧?即使他们并非有意为之,他们也可能是这样。但这里有一些非常有趣的事情。例如,有一个……

有人从统计学上发现,所以他们给……他们让这些在狱中的囚犯进行整容手术,让他们更具吸引力。他们发现,那些做过手术的人没有再次入狱。

所以他们有这样一个理论,他们说,好吧,一定是现在他们因为更具吸引力而更容易被接受,所以他们能够找到工作,成为社会的一部分,而且他们没有理由再去抢银行然后再次入狱,对吧?所以这是最初的理论。一些科学家可以……

提出了这个替代理论。他说,我想知道是不是不是这种情况。所以他去做了这项研究,我不知道是男性还是女性,但我要说他是男性。他去做了这项研究,他们找来了一些出庭的人,拍下了他们的照片,然后根据他们的吸引力对他们进行评分。然后他们会看看有多少人最终入狱。他们发现陪审团不会将有吸引力的人送进监狱。

哦,真有趣。所以现在这是你给这些人做了整容手术的另一种解释。他们不一定更适应社会了。他们只是不再被送回监狱了。哈哈哈哈哈哈哈哈哈哈。

顺便说一句,对我来说,这项研究的有趣之处在于,几乎没有人再去受审了。我们的司法系统已经取消了审判作为司法程序的一部分。人们真正去受审的情况非常罕见。事实上,我看到一些统计数据说

我不记得了。实际上,我不记得了。无论如何,好的。所以这太棒了。我有一个朋友是律师,他告诉我。他去受审。他和他的律师伙伴们,他们去受审。他们说,我们真的去受审。但如果你看到那些大型广告牌,如果你受伤了,就打电话给某某。他说,他们从来不去受审。每个人都知道这一点,对吧?他们只是试图庭外和解。对。

所以他案件的一部分是,你真的应该选择一个打算去受审的律师团队,对吧?他们会庭外和解,但如果必须的话,他们会去受审,因为这样他们实际上比那些靠不去受审赚钱的人更有优势。对,对。就是这样。这很有趣。好吧,

我认为我们可以围绕这个话题展开一些有趣的话题。我们以后再谈这个。好的。好吧。那么几率是多少?好的。这实际上只是为了举一些例子。我们不必专门讨论其中的任何一个。我在这里要说明的是,我们使用概率论

在各种不同的事情上。我这里有一份很长的清单,列出了一些我们可能会尝试使用概率论来处理的事情。有些非常有意义。有些在某些情况下作为无知的一种衡量标准是有意义的。有些根本没有任何意义。

那么掷六面骰子掷出六的几率是多少?在扑克中获胜的几率是多少?感染冠状病毒的几率是多少?你这里没有,但是死于冠状病毒的几率是多少?对。中彩票的几率是多少?49人队击败迈阿密海豚队的几率是多少?哦,我喜欢,奥巴马是上个世纪最佳总统的几率是多少?是的。我们这么说,至少我们使用概率论的语言。

而且我们所说的意思并不总是那么清楚,对吧?例如,奥巴马成为上个世纪最佳总统的几率在概率论方面可能毫无意义。它可能根本没有任何意义,对吧?全球变暖是一个真正问题的几率

目前尚不清楚该语言概率在这种情况下是否有意义。好的。49人队击败海豚队的几率,我们会在这种情况下使用概率论,并且我们会根据他们最近的获胜情况来进行判断。对。目前尚不清楚这意味着什么。

你知道,这对你来说可能是一件不错的事情。这可能并不完全不合适,比如试图说奥巴马是不是最好的总统,但也不太清楚它是否有意义。因此,无论你得出的几率是多少,可能都不应该太当真,因为它实际上将由许多其他因素决定。你看过或读过《罗森克朗茨与吉尔登斯吞死了吗?》

这是一个戏剧,一个荒诞的存在主义戏剧。戏剧的第一部分以两个角色开始,其中一个角色反复抛硬币,正面,正面,正面,他连续抛出正面,正面,正面,正面,正面。

这是一件非常美丽的事情,因为当人们考虑几率时,我们想要的一件事是,我们希望几率能够均匀地应用。

他们进行的研究中,会让人们尝试编造,通过数字字符串来显示随机性。回到你的六面骰子,他们可能会让一群人一起编造一个假设的掷骰子结果,数字会是什么样的。他们总是可以……

找出哪个是由人编造的,因为人们希望几率能够均匀地应用。他们希望正面朝上的几率为50%,最终也会如此,但这只是达到目标需要多长时间的问题。你可能会连续抛出正面一百次。这可能会发生。因为每次抛掷都是一个新的机会。它不知道之前的机会。对。对。

事实上,有趣的一点是,人类并不能很好地模拟随机性。事实上,石头剪刀布,SolutionStream 经常这样做。我通常用来让我获得……我并不总是赢,但让我在比赛结束时获得好名声的技巧是,人们压倒性地选择石头。对。

对。所以你只需要选择纸作为你的第一次选择。之后,你只需要选择任何东西。对。你会以这种方式更频繁地获胜。我和我的妻子过去常常玩石头剪刀布来决定谁去做一些不愉快的事情。我每次都赢。

这让她很生气,对吧?当时我不知道这是非随机的。我后来才知道。但无论出于何种原因,我碰巧玩的方式都会击败她碰巧使用的策略。我想,我第一次不太可能选择石头,而她第一次更有可能选择石头。因此,我获胜的频率非常不成比例。

所以石头剪刀布不是随机的,对吧?甚至有可能制定一个明确的策略来为你赢得胜利。我喜欢总是……

说,你知道,你玩弄人们的心理。这也很有趣,因为你有了,在扑克中获胜的几率是多少?你知道,扑克是,有一些统计数据,以及获得牌的几率,但你赢得扑克并不是基于你手中的牌。对。你赢得扑克是基于你玩牌的方式

牌桌。是的。以及你操纵周围的人以及操纵他们对任何特定时间每张牌的统计数据或概率的理解,以及已经出现在牌桌上的牌,以及许多其他与机会无关的事情。

他们最近做了一个……这是……他们一直在为不同的游戏开发人工智能算法。所以显然我们最初有深蓝的国际象棋,然后围棋被阿尔法围棋击败,被其统治。他们最近刚刚完成了德州扑克。

有趣的是,他们讨论了是否应该尝试在游戏中阅读人们的面部表情。他们决定不这样做,因为他们意识到,如果他们试图在游戏中阅读人们的面部表情,人们就会学会通过伪造面部表情来击败人工智能。

所以他们让它只玩几率,它达到了能够击败所有只玩几率的人类的程度。但那不是人类玩的方式,对吧?人类实际上是互相阅读的。无论如何,是的。这就是为什么我用它作为例子,因为扑克不是一件纯粹的偶然的事情。它看起来似乎很大程度上是基于机会的,而且确实是,但它实际上并非完全是偶然的。

另一个有趣的是微软上涨了10点。我们根据将概率论和钟形曲线(正态分布)应用于股票及其波动程度来衡量股票及其风险。但实际上导致股票波动的是现实世界中的事件。

对,这与概率分布无关。对。这就是尼古拉斯·塔勒布的《黑天鹅》的概念,即它是现实生活中的黑天鹅罕见事件

这将导致股票……如果股票真的遵循概率分布,那么遵循概率分布的金融事物将发生10西格玛事件,这在整个宇宙历史上只会发生一次。如果那样的话,而它们在股市上经常发生,每50年左右发生一次,对吧。罕见,但并非那么罕见。事实上,那些罕见的波动,

决定了……你知道,股市价值的一半。所以,嗯,如果你只在……你知道,十年中最好的20次波动中将你的钱投入股市,那将是股市价值的一半。嗯,而且,

所以我们试图使用概率论。在这种情况下,它与概率有关,但它不是概率论,对吧?它完全由其他东西决定。完全不可预测的随机事件根本不遵循概率论。这就是尼古拉斯·塔勒布的《黑天鹅》这本书所要表达的,对吧?

事实上,我们试图在与概率有关但并不遵循概率分布的情况下使用概率论。- 对。- 所以我们使用这些数字,因为这是我们能做的“最好”的方法,但实际上这只是概率论的不恰当使用。- 好吧,回到我刚才说的,我认为你的第一张幻灯片,我们再次使用统计数据来掩盖我们的无知。

嗯,我们死于冠状病毒的几率是多少?我们不知道,对吧?他们试图做的是,他们试图说,好吧,在感染冠状病毒的人中,有多少人死亡?好吧,这有一定的道理,对吧?就使用概率论来掩盖我们的无知而言,你会认为

看,如果100人感染了冠状病毒,其中一人死亡,那么你死亡的几率就是一百分之一,对吧?

好的,但首先,我们实际上不知道人口是多少,因为我们不知道有多少人感染了冠状病毒,有多少人没有感染。对。我们只知道已报告的病例。显然,如果你死亡,那么报告的病例数量将会不成比例地增加。是的。所以这会自动夸大冠状病毒死亡人数。这就是你听到3.8或类似数字的原因。这就是这个数字的来源。而且情况不会那么糟糕。

我们不知道它有多糟糕。它可能很糟糕。流感的死亡率为0.1%。冠状病毒的死亡率可能为0.7%。是流感的七倍,这就是我们对冠状病毒如此谨慎的原因,因为它可能比流感致死的频率要高得多。对。然而,即使那样,它也不是一种均匀分布的病毒。

人口。就像流感一样,我的意思是,我经常得流感,而且我从来都不担心会死,对吧?因为我不属于最容易死于流感的人群,这些人是老年人。冠状病毒也会有类似的情况。你死于它的几率将取决于你的年龄,对吧?我的意思是,假设死亡率为1%,

对你个人来说,不会是1%。它将取决于你的年龄,对吧?好吧,年龄也可能只是众多因素之一。没错。你知道,你是否吸烟30年了,你知道,你60岁了,你已经吸烟30或40年了?是的。

你所在社区的医疗保健水平如何?我怀疑我们会看到人口

死亡率要高得多。我们会看到人口死亡率要低得多,这甚至可能取决于州一级,你知道,犹他州是一个非常健康的州。我们的死亡率最终可能会比肥胖症很多的地方低得多。我的意思是,我们实际上还没有看到或了解……

导致死亡的原因。对。显然,这也将与你的生活条件有关?你的医疗系统有多好?它将基于许多不同的因素,可能基于

早期与后期,当时它让人措手不及,而现在我们知道这是一个我们必须担心的病毒。对。可能会极大地影响死亡率。所以试图在这种情况下使用概率论可能有一定的道理。但同样,你必须记住,统计数据适用于人群,而不是你。对。是的。

好吧,这是本周播客的精彩总结。是的。说到这里,谢谢。这很有趣。这是一次很棒的谈话。是的。谢谢你,Cameo。谢谢。