We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode A new data infrastructure for the social sciences?

A new data infrastructure for the social sciences?

2025/6/4
logo of podcast LSE: Public lectures and events

LSE: Public lectures and events

AI Deep Dive AI Chapters Transcript
People
D
David B Grusky
M
Mike Savage
Topics
David B Grusky: 自然科学非常重视测量,并致力于测量工具的创新。相比之下,我认为社会科学更关注概念创新。如果社会科学像自然科学一样重视测量问题,将会发生什么?我提出了一个思想实验:如果我们对建立社会观测站的承诺与我们对建造太空观测站的承诺相匹配,会怎么样?我将讨论美国的测量基础设施如何不足,以及我们能做些什么。如果真的建立了新的基础设施,它会解决一些问题,也会带来一些新的问题。我将首先介绍这个系统最原始的形式,然后讨论如何通过修改后的基础设施来解决这些问题。

Deep Dive

Shownotes Transcript

欢迎收听伦敦政治经济学院的LSE活动播客。准备好聆听一些在社会科学领域最具影响力的国际人物的演讲。欢迎来到伦敦政治经济学院。今晚很高兴见到大家。我是迈克·萨维奇。我是LSE的名誉社会学教授,也是国际不平等研究所的教授研究员。

今晚我很高兴欢迎大卫·格鲁斯基参加此次活动。大卫是斯坦福大学人文与科学学院爱德华·阿莫斯·埃德蒙兹教授、社会学教授和贫困与不平等中心主任。正如我们许多人所知,他是美国领先的不平等、贫困和社会分层社会学家之一。

他的出版物很多。我认为最突出的是他愿意在一个更大的全球背景下思考美国的研究。因此,除了对研究美国贫困做出了重大贡献外,他还非常关注其多方面的问题,思考性别问题。他为我们关于社会阶层思考的辩论做出了贡献,并质疑英国社会学家理解阶层的一些方式。所以他真的准备好了去宏观思考

并全球思考。今天,他将展示一个关于社会科学新数据基础设施的大胆愿景,问号。所以我们期待着,他将发言大约一个小时,然后留出大约半个小时的时间进行提问和讨论。

如果您想加入社交媒体上的这场对话,主题标签就在那里。我知道我们现在不怎么用X了,是吗?但是无论您首选哪个平台,您都可以使用该主题标签发推文或使用任何合适的表达方式。最后,将有机会提问,包括房间里的人,还有一个庞大的在线观众,我有一台iPad,可以将问题无缝地反馈给我。好的,事不宜迟,欢迎大卫·格鲁斯基。(掌声)

谢谢你,迈克,感谢你的慷慨介绍。在这个时代看到一些朋友真好。我直接进入正题。我显然是在谈论望远镜。我把这个放在那里,因为在我看来,自然科学和社会科学之间最显著的区别之一是,在自然科学中,他们非常重视测量。

并且非常致力于在测量工具方面进行创新。相比之下,在社会科学中,我认为我们对概念创新更感兴趣。人们甚至可以说我们迷恋这种类型的创新。所以我在这里想问,如果我们像自然科学家那样重视测量问题,会发生什么?所以这是我的思想实验。

如果我们致力于建设一个社会天文台,一个我们真正认真对待我们对测量世界上正在发生的事情的承诺的天文台,如果我们建设社会天文台的承诺与我们建设空间天文台的承诺相匹配呢?就像詹姆斯·韦伯太空望远镜,大约100亿美元。

所以这是计划。这就是我在这篇演讲中要做的。我将讨论我们美国测量基础设施的不足之处。我认为这与其他国家的情况类似,但我将关注我所了解的国家。所以它如何不足,为什么不足,以及我们可以做些什么。然后在阐述这一点之后,我将描述这种新的基础设施(如果我们真的要建设它的话)的后果,以及

它将解决一些问题,并将带来一些新的问题。我应该警告你,这可能不是我通常会做的演讲。它会从正常和标准开始,也许很无聊,然后会有一个曲线球。它会走向你可能没想到的方向,你会担心这个方向。这就是为什么我要谈论这种新基础设施会产生的问题。它会带来问题,我将

讨论我们如何通过改进的基础设施来解决这些问题,但我将首先以最严峻的形式阐述它。好的,但首先是问题。我们试图解决什么问题?当前的测量基础设施在哪些方面存在不足?第一个问题是我们过于依赖可能具有代表性的研究。所以我想让你考虑一下

我们需要什么样的数据才能在美国内部做出影响每个人的生活的大型决策。例如,我指的是关于如何平衡我们对尽可能降低失业率和通货膨胀率的承诺的决策。我们如何匹配,我们如何处理这些相互竞争的目标?好吧,我们当然非常依赖数据来做出这些决策,这些决策会影响所有美国人的日常生活。

我们特别依赖当前人口普查来做出这些决策以及许多其他构成美国政策基础的决策。而我想在这里强调的一点是,对这些关键调查的回复率正在下降,而且下降速度往往非常快。当然,

我们本身并不关心回复率。我们关心的是我们想要估计的参数是否或是否存在偏差,对吧?并且有一些方法可以处理回复率下降,以确保我们仍然可以获得我们关心的参数的无偏估计,例如自适应调查设计等等。但是我的观点是,它们非常昂贵。

而且我们没有理由相信,随着回复率继续下降,它们将继续有效。因此,由于尝试在概率样本的背景下处理无响应非常昂贵,社会科学家越来越多地转向非概率抽样。这张图表是由皮尤研究中心发布的,它都是关于访问美国的所有调查机构并找出他们正在进行哪种类型的

抽样。在这里,我们越来越看到橙色部分表示他们依赖非概率抽样,特别是在线主动参与。现在,我们为什么关心?我们关心的是,他们进一步证明了这一点(这很难证明,但他们尽力而为)。他们进一步证明,当你越来越依赖非概率抽样时,

你不太可能确定感兴趣的参数。偏差更大。因此,这个决定,它更便宜,但这个决定会带来成本,即以我们想要的方式告知我们的政策,以完成我们想要完成的科学工作。

所以这是第一个问题。我们依赖的是面临回复率不断下降的调查,或者正因为如此,我们依赖的是本身就有问题的非概率样本。第二个问题是,我们的研究往往力量不足。我们似乎喜欢小样本。

尤其是在社会科学、心理学和社会学中,我们经常依赖小样本,这意味着我们的研究力量不足,结果往往没有定论。现在部分问题在于我们

在社会学内部建立了一种文化,在这种文化中,我们认为收集你自己的数据、拥有这些数据是一种通过仪式。这被视为学者工作的基本组成部分。但是这种对科学生产手段的私有化对我们分析的力量以及结果的结论性程度有影响。因此,小样本问题是另一个我们应该担心的问题。

这是第三个问题,即缓慢的科学问题。我们生活在一个危机丰富的时代。这显然是事实。在这个危机丰富的时代,我们需要了解人们是如何回应的,他们的感受、想法和行为,因为这些危机正在席卷整个系统。例如,我指的是分配危机。

不断上升的不平等,在许多方面不平等的急剧增加,快速的全球气候变化,治理失败,失控的技术变革,发生了很多事情,人口的反应方式我们可能无法理解,除非我们进行实时监控,但我们没有能力做到这一点。如果你没有做到,这是一个失败,我们必须承认这一点,未能发现民粹主义的兴起。

造成的巨大损失,因为我们没有看到它并做出相应的回应。惊人。我认为,为了完成我们作为社会科学家的工作,值得进行必要的监控。我们失败了。因此,我们需要在这个危机丰富的时期进行发现的工具。我们不知道随着进一步的危机席卷系统会发生什么,部分原因是我们过去在监控工作中失败了。

因此,我们不能依赖无所不知的调查设计者来提出需要提出的问题,以了解人口的状况。这太难了。我们需要有发现的工具,对吧?不需要无所不知,只需要让我们找出正在发生的事情。我们没有做到。我们需要。所以我想指出的第四个问题是,在数据收集方面,劳动分工过度。

这是一个非常分散的数据环境。ICPSR拥有超过21,000项研究,跨研究的劳动分工在方法和主题方面是巨大的。所以我们有研究、调查,

专门研究家庭和儿童福祉、社会和经济流动性、物质使用和滥用、价值观、态度和观点、社交网络、衰老和退休等等。这种按主题和方法进行碎片化的代价是什么?很难理解和检查跨领域的过程。我们了解筒仓中发生了什么,但你需要能够将所有这些整合在一起,这意味着需要一些综合性研究。

当这种碎片化与私有化相结合时,这种碎片化尤其致命。因此,原始数据所有者,那就是我们,人民,对吧?原始数据所有者的数据被政府机构、调查机构、公司和个体科学家所占用。一旦从人民手中获取数据,我们就很难分享它们,对吧?

因此,如果您有碎片化和私有化,那么在理解正在发生的事情方面就会出现问题,因为我们已经私有化了人民的数据。所以我已经和你们分享了四个问题。这四个问题的后果是什么?我认为是缓慢的积累和赤裸裸的科学失败,例如,未能及时发现民粹主义的兴起。

现在,对这个问题根源的典型诊断似乎是开放科学诊断。也就是说,我们的科学运作不佳,我们需要开放它,我们需要预先注册,我们需要有规范性保障措施来

阻止那些坏人,那些数据捏造者做坏事。如果我们更成功地建立了这个规范性和监管系统,我们就可以确保科学按照它应该的方式进行。很难反对建立一套更严格的规范来指导科学生产,绝对如此。

但我认为,正如我试图论证的那样,还存在许多数据问题也导致了我们的失败、缓慢的积累以及科学生产的其他缺点。事实上,其中一些数据问题使得这种情况成为可能。如果您有非常小的样本,这允许,比如说,p值篡改,它会鼓励p值篡改,我们需要承认我们的数据环境是如何运作的。

导致了一些问题,我们应该尝试修复数据环境。这不是理所当然的。它不必像现在这样发展。希望我们有一些代理,一些能力来构建更好的数据环境。好的。那么,为什么我们的数据基础设施在这么多方面都存在不足呢?我认为是钱。我们对科学的资金投入不足。

在美国,我们决定进一步减少资金投入,但即使在那之前,资金投入也严重不足,至少与我们对自然科学的资金投入标准相比是如此。所以,再次提出这个问题:如果我们对建设一个社会天文台的承诺(一个能够监测世界正在发生的事情的天文台)与我们对建设太空望远镜的承诺相匹配呢?

资金投入约为100亿美元。我不嫉妒这100亿美元中的任何一笔。我认为太空望远镜非常有价值。但我认为,我们应该同样致力于建设一个社会天文台,以保护我们免受我们监测不力时出现的问题的影响。我已经谈了很多关于詹姆斯·韦伯望远镜的事情,但在自然科学领域还有其他更昂贵的项目正在进行中。我认为部分问题在于

社会科学家不梦想很大。他们认为这些梦想不可能实现,这最终变成了一个自我实现的预言。所以我鼓励我们尝试考虑一下,如果不存在资金限制,我们需要什么样的监控基础设施。这可能不会在美国发生,但它可能在其他地方发生。然后尝试实现这些梦想,而不是从一开始就放弃。

所以这是一个梦想。最后,我会说这是一个坏梦,我会修改它。但我首先想阐述一下这个梦想,然后我们可以讨论如何修改它。所以这个梦想就是我将标记为动态数据系统的梦想。它将通过提供态度、行为和社会过程的即时人口水平测量来解决我们的基础设施问题。

所以核心思想是建立一个基于代理的网络,其代理数量与美国成年人数量相同,即2.6亿,然后让这些代理活跃起来,并根据行为蓝图行事,并相互互动,你可以把它想象成一个模拟,但希望它与世界上正在发生的事情密切相关,所以我将讨论这个动态数据系统会带来的威胁,以及这种创新的成本,我将这样做

在演讲的剩余部分,但我主要只是要阐述这个系统,而不会谈论这些威胁。你会说,“哦,我的上帝。”因为这些威胁会清晰地显现出来。然后我们将讨论如何应对这些威胁。但我首先想把它阐述出来。然后我们将讨论如何解决如果这个系统按照我描述的方式实际构建出来将会出现的威胁。

好的,构建这个动态数据系统需要四个步骤。不是四个威胁,而是四个步骤。第一步,相当标准。它只是关于利用现有行政数据来构建一个适合人口的人口。标准问题。接下来的三个步骤不太标准。它关乎实施新的数据共享协议。这将很难做到,而且其含义可能……

可能令人担忧。接下来的两个步骤更令人担忧。它是通过行为蓝图激活数据系统,然后允许代理进行交互。我将带您逐步完成这四个步骤。不过,在我开始这四个步骤之前,我应该说,

所有对由此产生的数据基础设施的分析都必须在非常安全的设施中进行,例如我们已经在美国拥有的联邦统计研究数据中心,并且尚未发生任何重大违规事件。因此,它们是政府的伟大成就之一,非凡的成就,使

非常重要的研究,而这种系统必须存在于安全的环境中,例如联邦统计研究数据中心。好的,让我们开始吧。四个步骤。第一步是构建人口支柱。这只不过是简单地链接现有行政数据,以涵盖美国约2.6亿成年人的全部人口。已经在进行中了。

我一直与许多其他人一起努力帮助构建这个系统。

这包括链接税收、人口普查和其他行政数据,并将它们提供给合格的研究人员和安全的联邦统计研究数据中心。美国一些最重要的研究都是利用这些关联数据进行的。我们所知道的,比如说,美国社会流动性,很大程度上来自这些关联数据。我们所知道的还有其他来源,但最近一些最重要的结果来自这些

这些关联的行政数据,以及许多其他研究也利用了这些数据。这是一个伟大的成就。但是这项工作必须通过增加关联机会来加强,使更多学者能够访问这些数据,同时绝不放松我们对保密的承诺,联邦统计研究数据中心迄今为止在这方面做得很好。所以这只是继续这项好工作。现在。

这里稍微偏离一下,谈谈即使是这种现有的关联工作也存在一些担忧,我甚至还没有谈到那些令人不快的事情,而且已经有一些担忧了。正如我已经强调的那样,好消息是,上述基于FSRDC的倡议成功地保护了机密性,同时支持了关键的社会科学研究,没有发生重大违规事件,一切顺利,取得了伟大的研究成果

机密性得到保护。这是好消息。坏消息是,通过数据科学公司Palantir与联邦政府合作,正在努力建立另一个关联数据系统,一个独立的关联数据系统。它基本上是为了……好吧,是为了应对国家安全威胁,但最终它是一个监控系统。那么这个系统到底是什么呢?首先,您将解密数据。

这些数据是机密的,以便可以将其用于此目的。其次,您正在向机构负责人提供访问这些数据的机会。所以我们现在有了双系统设置。我们有一个Palantir驱动的监控系统和一个独立的人口普查研究系统。现在,从我的角度来看,这是一个非常重要的点,但也许它并不重要。我认为研究系统并没有启用监控系统。

是特朗普的行政命令建立了这个全新的数据关联倡议。所以你可以说我们应该取消对研究系统的资助,以防止监控系统,但它们实际上是相当独立的系统。并不是说一个系统只是被用于监控目的,而是一个新的系统被建立起来,它正在利用我们拥有的最好的数据科学技术来构建,这些技术主要嵌入在那家著名的公司中,这家公司离我住的地方只有几个街区,那就是Palantir。

尽管你可能会说我们仍然应该进行研究,并利用关联的行政数据取得好的成果,我认为这是正确的。没有理由停止这样做。无论如何,我们仍然会有监控。但另一个需要提出的问题,并且与我们稍后要讨论的内容相关的问题是,研究系统中发生的任何努力是否可能会产生结果

工具和见解,可以应用于监控系统。因此,您必须以以前不必的方式担心这种溢出效应。现在你可能会争辩说,Palantir已经拥有了它所需要的所有数据科学力量,这可能是真的。那里有非凡的人才。很多辞职,但也有很多人愿意做这项工作。好的。即使是我们现有的数据关联系统,在恶意方面也已经出现了一些问题

参与者使用它,不是研究系统,而是一个类似的系统,现在正在建立用于监控目的。但让我们继续。让我们继续进行第二步。所以第一步只是,你知道,对现有的用于研究目的的数据关联系统进行增强。我们还需要做的是利用调查数据。这需要更多,所以我们需要的不仅仅是行政数据,但问题在于调查数据通常是由调查机构收集的,它们用于一次性目的,并且没有共享。

这意味着同意参与这些调查的受访者正在被,人们可以说,被剥削和虐待,因为他们的数据没有被充分利用。这就是为什么我们有这么多调查的原因。人们不断被问到同样的问题。所以你会想要……

利用现有的调查,并将它们纳入这个基础设施。这已经再次发生。正如我们已经关联行政数据一样,在某些情况下,我们将调查数据与这些行政数据关联起来,但在这种理想的系统下,需要进行更多这样的关联。我们有数百项相关的政府调查,数千项专有调查,

当然,我们并没有为全国每个人都进行调查,远非如此,但它们对于校准我将要讨论的数据系统和更新数据系统仍然非常有价值。所以你会想利用这些数据。因此,您必须激励调查机构将数据贡献给这个更大的集体基础设施。现在,它们被调查机构囤积起来用于一次性目的。所以你需要一个新的社会契约。它可能是这样的。你可以对调查机构说,

如果您同意将您的数据与这个集体基础设施共享,作为交换,您可以访问通过行政数据系统收集的数据。

这对调查机构来说将具有巨大的价值,因为他们不必重新收集已经知道的数据。他们将专注于他们的增值数据。当然,如果您这样做,就必须有一种新的同意协议。当然,受访者必须被告知这些数据将被贡献给这个集体基础设施,他们必须同意这一点。但我确实相信调查机构会接受这笔交易,因为它是有意义的。

为了更有效的数据收集工作。它将结束数据丢弃的困境,用数据共享承诺取代一次性研究数据收集工作,该工作产生了如此多的调查,人们一遍又一遍地被问到同样的问题,从而尊重受访者的贡献。好的,这就是第二步,激励数据共享,这样我们就不必进行如此多的调查。它们可以更针对性地满足我们需要的增值数据。接下来的步骤,第三步和第四步,是最关键的步骤。

让我们开始吧。它们包括激活代理并允许代理进行交互。到目前为止,它只是对行政数据进行常规关联,并与调查数据关联。我们已经这样做了。只是做得更多而已。但是下一步更像是秘密调味料。它是通过定性数据和大型语言模型激活数据系统。

所以这依赖于新的、仍在涌现的证据,即定性数据,特别是美国之声项目数据,可以提供暗物质注入的行为蓝图,这些蓝图可以用来激活这些代理。我会详细讨论这一点,但在那之前,让我们先看看AVP,以便您了解数据来自哪里。所以它是美国最大的具有代表性的综合性定性研究。它包含两到三个小时的沉浸式对话。

该协议涵盖了关键的生活领域,一个人的生活的全部轨迹,转折点,危机,家庭生活,朋友,就业,健康和心理健康等等。它以提示“告诉我你的人生故事”结束,然后是一系列类似的引人入胜的提示。

在我阅读这些记录时,这通常是一种治疗性和宣泄性的体验。这不像我们许多人都经历过的调查折磨。这是一次引人入胜的谈话。那么动态数据系统将如何使用AVP呢?答案是每个AVP记录都作为一个行为蓝图,告诉我们受访者如何思考和行动。它捕捉到激活代理的暗物质,并且

然后允许我们通过该代理成功地代表受访者。现在,长期以来一直有人提出这种暗物质的说法,但现在已经有证据支持这种说法了。我想描述一些证据。它已经在TED演讲中出现过了。你可能听说过,也可能没有,但让我阐述一下。我将阐述Park、Zhao、Shaw、Hill、Cai、Ringel、Moritz、Willer、Lang和Bernstein的一篇论文。他们做了以下事情。

他们拿到了一个AVP记录,我现在应该从一开始就说,不是美国之声项目的数据,他们要求我们使用这些数据,我们查看了我们的同意协议,我们认为它不支持他们想要使用的用途,他们想要使用这些数据,所以我们说我们不能与他们共享AVP数据,但我们愿意共享AVP协议,他们确实使用了该协议,并且他们收集了一个全新的数据集,其中

他们确实告知受访者他们希望如何使用这些数据。因此,他们有一个与他们想要使用的用途一致的同意协议。好的,所以现在他们有了这些新的AVP数据。不是我们的数据,而是具有支持他们想要使用的用途的同意协议的数据。他们拿到了一个AVP记录,并将其输入到一个本地LLM中,一个本地LLM中,所以它不会让受访者面临任何威胁。

危及他们的机密性。他们告诉本地LLM在处理记录后基本上要像这个人一样行事。然后他们问,所以现在你有一个LLM在扮演这个人的角色。然后你可以向这个被指示扮演记录中所代表的人的LLM提出问题。

他们提出了一些没有直接嵌入记录本身的问题,也就是说,需要从记录内容中进行一些推断的问题。他们向扮演受访者角色的LLM提出了问题。然后他们回到记录的原始受访者那里,提出了同样的问题,并比较了答案。他们发现,当LLM扮演受访者角色时所提供的答案与受访者本人提供的答案之间存在高度一致性。

现在你可能会问,是否可以用定量数据构建同样高质量的双胞胎,他们的答案,实际上自从那时起,它已经被许多其他研究复制了,是没有的,调查数据似乎不包含使LLM能够成功地扮演记录中所代表的人的暗物质,所以这是性能记分卡,如果你只给LLM调查和

类似于行政数据提供的内容,它可以提供的性能相当不足。这些数据中没有任何暗物质。但是如果你给LLM AVP数据,

你会得到更好的性能。现在,如果你在AVP数据中添加调查和管理数据,它们的性能不会有太大提高。所以,似乎所有暗物质都在定性数据中。这很不寻常。定性研究人员长期以来一直说存在暗物质。很多人说,真的吗?真的有暗物质吗?好吧,似乎确实有。

如果我们的意思是,当大型语言模型获得该成绩单后,可以很好地预测该人的反应。因此,您可以想象构建2.6亿个激活代理,其中一些代理的质量非常高,因为您拥有它们的相关AVP数据。其他代理的质量较低,因为您只有它们的调查或管理数据。

那是第三步。你用行为蓝图激活代理。第四步,我们要把它做成一个交互式数据系统。到目前为止,我们不允许这些人互动并相互影响,但现在让我们这样做。您可以通过在这些代理上叠加网络结构来做到这一点。例如,您可以使用美国的手机数据,这些数据指示人们通过他们的ping相互接触的时间。

您可以使用这种类型的网络结构,但也还有其他结构,以近似地模拟人们在美国相互互动的方式。并且有一些方法可以填补国家网络结构中的缺失部分,并实际地在整个人口中叠加一些与这些人相互互动方式非常接近的东西。

现在您可以允许网络扩散过程运行,这样人们就可以以与实际发生的情况非常一致的方式相互接触,然后他们就可以相互影响。好的。所以我称之为动态数据基础设施,原因有四个。

首先,随着新的管理数据可用,您可以使用反映在这些管理数据中的更改来更新代理。他们收入、就业以及更多方面的变化。您可以对整个人口进行此操作。您可以使用调查数据进行更新。这更零星,但一部分人口会持续参与调查,您可以相应地更新他们的向量。

您可以使用新的AVP访谈进行更新,这应该以我稍后将要讨论的设计目的进行,然后您将拥有网络诱导的扩散过程,因此它在这四个方面都是动态的,所以让我谈谈AVP更新访谈,您希望保持、保持、保持这个代理群体……

为此,由于AVP提供的行为蓝图至关重要,您需要确保管理一定数量的AVP访谈。它们很昂贵。因此,您可能需要这样一种设计目的。两方面。第一个方面是采访网络中关键节点的人。那些实际上是意见领袖的人。核心人物,那些在……

网络的两个部分之间架起桥梁的人,那些可能具有影响力的人。您需要识别这些人,并且可以通过网络叠加并对其进行过采样,以便我们能够控制关键意见领袖及其变化方式。第二个方面是您需要采访各种类型的人。让我更详细地解释一下我所说的“各种类型的人”是什么意思。

您希望您的访谈能够代表现有的各种行为蓝图。那么你该如何做到呢?那么,我所说的“各种类型的人”是什么意思?这实际上是性格、职位和地点的相互作用。我们想知道的是人类经验的维度。

有些人的人生经历与我大致相同,他们的观点、态度和信仰也与我大致相同。我想弄清楚在美国有多少种类型的人拥有大致相似的人生经历。我们要确保我们代表每种类型的人,并经常采访他们,并经常重新采访他们,以便我们能够看到在所有这些危机席卷全国之际,人们是如何变化的。

所以我们不知道人类经验的维度。同样,它大致上将是性格、职位和地点的相互作用,但是有很多地方,有很多不同类型的身份和位置性,有很多性格,为了很好地描述行为蓝图,可能有数百万种类型的人。如果有数百万种类型,我们需要进行大量的AVP访谈。如果类型较少,则数据采集成本会降低。

现在,另一个必须记住的问题是,类型可能会发生变异,对吧?随着时间的推移,曾经的一种类型可能会分裂成两种。例如,在不同社区、略微不同的社区中的人们,随着新的事件席卷全国,他们的反应方式可能略有不同。你必须跟踪这一点。我并不是说这便宜或容易。这是我们需要的数据基础设施,以便跟踪正在发生的事情。

那么它们多久变化一次?我们不知道,但我们必须跟踪这一点。如果发生变异,如果一种类型分裂成两种,您必须知道这一点。那么,就成本而言,最坏的情况是什么?您需要进行多少次AVP访谈?好吧,最坏的情况是,有许多类型的人,数百万种类型。

而且它们变化迅速,我们发现,正如早期研究(但这仍然是早期阶段)所表明的那样,我们需要AVP来理解行为蓝图。从成本角度来看,这是一个最坏的情况,因为进行沉浸式访谈很昂贵。但它有多贵?

我没有谈到我详细讨论的那篇论文是如何收集他们的AVP数据的。他们收集数据的方式与我们收集数据的方式大相径庭。在最初的AVP部署中,在扣除一些前端成本(弄清楚如何做到这一点)之后,大约花费了400万美元,每位受访者的成本约为1500美元。这并不便宜。我相信你可以降低这个成本,但并不便宜。

在那支我讨论过的团队最近一次AVP部署中,你知道它花了多少钱吗?每人40美元,因为他们使用了AI访谈。因此,要记住的一点是,通过AI访谈,他们获得了非常强大的行为蓝图。想象一下,如果我们进行面对面的访谈,我们可以做些什么。但这意味着,在这个价位上,你实际上可以进行大量的AVP访谈。

现在,你当然希望做得很好,而且我不是访谈专家,远非如此,但我显然不会认为,我不会争论,完全基于AI的访谈。你需要有一位人类监督员来介绍项目,与受访者交谈,询问他们是否同意使用基于AI的工具进行访谈。

并且始终监督访谈,以确保他们根据需要进行干预。因此,它不会像那个没有这种更复杂基础设施的团队那样便宜。你还可以想象一种AI访谈,其中你会获得关于在哪里可以找到最重要和最丰富的数据来源的实时指导。

您可以想象一些方法,使这些访谈在了解人们生活中发生的事情方面特别成功。所以我们不会做任何这些事情,对吧,因为我们稍后会讨论的原因。但我希望我们不会做任何这些事情。但我首先想谈谈如果我们做了会得到什么,然后谈谈我们如何修改这种说法,使其更易于接受。

嗨,我打断这个活动是为了告诉你另一个很棒的LSE播客,我们认为你会喜欢。LSE IQ邀请社会科学家和其他专家回答一个聪明的问题,例如为什么人们相信阴谋论,或者我们能否负担得起超级富豪?来看看我们吧。只需在你获取播客的任何地方搜索LSE IQ即可。现在回到活动。所以

让我只谈谈如果你拥有这种基础设施的好处。主要的是,这些好处解决了我在开头提到的基础设施问题。所以让我逐一介绍这些好处。首先,它解决了实时监控问题,对吧?我们在这一方面存在真正的问题。我们没有能力以任何接近实时的方式了解人口在哪里、他们在想什么、感觉如何以及在做什么。

如果我们做到了,好处将是巨大的。我们将知道人们在政治态度方面的立场。例如,我们将知道是否出现了新的民粹主义变种。我们将知道,我们对社会态度有了更好的理解,我们的新型自主性和不满情绪正在出现。这非常重要。

我们将更多地了解经济态度或正在出现的新型经济反抗,或者更平淡地说,我们将了解消费者情绪,这是我们关于货币政策的决策以及我们如何平衡我们对充分就业和低通货膨胀的承诺的基础。如果我们能够更好地衡量经济态度,那么仅此一项的价值就将是巨大的。

以及更多。基本上,我们将拥有一个实时监控基础设施,这意味着我们将了解民粹主义等发展,而不是在为时已晚时,而是在它们发生时。我们可以拥有一个更具响应性的系统,了解人们在哪里。

代理还可以回答调查问题,他们可以参与沉浸式访谈,他们可以作为实验参与者,而无需任何受访者负担,无需任何成本,除了最初构建基础设施的成本,但没有边际成本,对吧?我谈了很多关于分析能力不足的成本。

我们已经习惯了这些成本。我们认为这是不可避免的。我们在小型样本上进行大部分科学研究,这些样本往往是不确定的和具有误导性的。如果我们拥有这种基础设施,

全人口分析将免费提供。我们将有足够的能力进行所有交叉分析,分析小型和隐藏的人群,分析非常细致的地理位置(在街区层面),评估可能的干预措施,甚至是地方性的干预措施。我们经常对样本量做出的妥协将不复存在。

响应率怎么样?我谈了很多我们面临的响应率问题以及由此导致的代表性不足问题。在数据系统环境中,保证100%的响应率,对吧?双胞胎总是会回应。在真实的人类环境中,人们会认为响应率的下降将不那么显著。

速度较慢,因为在这个系统下受访者的负担会减少,你不需要一遍又一遍地问他们同样的问题,而这种负担的减少……会阻止下降,非概率抽样的兴起怎么样?我们求助于非概率样本的主要原因是它们很便宜,对吧?如果我们拥有这个动态数据系统,则无需求助于非概率抽样,您将可以……

作为研究人员免费访问此数据系统。所以,如果你有这样的系统,你认为它会在社会科学发生的方式上如何发挥作用?我的猜测是,它将逐渐过渡到这个平台。因此,最初,它只会用作合成试验数据。我们现在已经拥有这样的数据集,它们就是这样使用的。所以想象一下,你想……

对某些社会问题进行干预。你阅读文献,大约有100种可能的干预措施已被提出。你没有足够的资金带着100种可能的干预措施进入现场,所以你想对它们进行分类,并尝试猜测哪些干预措施最有可能产生回报。因此,您可以在此数据基础设施中对其进行测试。也许你找到了十个看起来最有希望的,然后你带着这些干预措施进入现场,进行RCT。

你将能够进行更全面的分析……

以一种经济有效的方式对这些合成试验数据进行分类。但是,如果我们一次又一次地发现,当你进入现场时,你得到的结果与你使用这些合成试验数据得到的结果完全相同,会怎么样?在某些时候,我们可能会说,真正的黄金标准就在这里,在这个动态数据系统中。当然,你总是必须进行持续的校准,以确保该系统不会误导你。这将是……

可能最重要的成本将是持续的校准和检查。但我们很可能会发现它确实有效,真正的黄金标准是动态数据系统。我想谈谈实现这种系统所需的所有工作,然后我会谈谈我认为比我在这里描述的系统更可行的系统。但首先,我们该如何实现呢?

有一些数据任务,有一些分析任务,有一些大型语言模型任务,有一些网络任务,有很多工作要做。我无法谈论所有这些,但我只想给你一个样本,说明必须发生什么。显然,这还处于早期阶段,我所说的许多事情最终可能无法实现,这取决于研究结果如何。但是你想做什么?你想开发一个更好的AVP,它在构建这些行为蓝图方面更成功。

AVP从未被设计用于构建行为蓝图,并且肯定有理由相信,如果这是目标,那么可以做得更好。你还想探索是否首先需要AVP。有一些暗示性证据表明你确实需要,但这还处于早期阶段,这很可能是错误的。很可能调查和管理数据的组合可以完成这项工作,并构建相当好的行为蓝图。

必须完成许多计算机科学任务。我描述的研究依赖于非常简单的提示工程。他们做得很好,这表明,如果你改用微调的本地大型语言模型,你可以做得更好。因此,您可以想象创建一个大型训练集,为每个人提供所有可用的管理调查和定性提示及其响应。

然后,您将使所得权重可供FSRDC的合格研究人员使用。这很可能会产生更好的结果。我们不知道。我们需要弄清楚。这就是我要说的关于进一步任务的所有内容。除此之外,还有许多其他任务。但我现在想谈谈一些威胁以及为什么我们不想构建我刚才描述的内容。这对你来说可能已经很明显了,但我还是想列出来,然后谈谈我们可以构建什么,我认为这可以解决这些威胁。

因此,一些威胁并不是那么令人担忧。它们只是技术故障。我已经提到了一些。我们可能无法以我讨论的方式激励合作和数据共享。我们可能无法成功捕捉人口异质性。大型语言模型在这方面存在问题。我应该说,这里的基本任务是,现在大型语言模型被认为是一种虚拟助手。我们想把它们变成人类。

成功地模仿人类。这是一个很大的要求。因此,我们可能无法很好地做到这一点。我们可能无法很好地捕捉趋势,捕捉衰老的影响、时期效应、队列更替。我谈到了我们如何做到这一点,但这可能不会非常成功。并且可能会有越来越多的无响应。我声称不会,它会朝着完全相反的方向发展,但我可以想象受访者会反抗,说:“我不想参与这种类型的系统。”

而且我们可能会遇到更多极端的无响应问题。如果你没有这个系统背后的调查的真相,你就什么都没有。以下是更令人担忧的领域,所有这些都损害了机密性和滥用。有一些更简单的用户漏洞,因此服务器可能会被入侵。我说所有这些都必须在FSRDC内发生,但该系统可能会被破坏。

你可能会遇到披露规避审查被破坏的情况。你可能会遇到各种各样的机密性泄露,这将非常令人担忧。但真正令人担忧的是政府入侵,对吧?这就是为什么你不能这样做。所以让我们谈谈背景,你可以在其中做这样的事情的政治背景。如果你有一个良性政府,如果你知道研究系统不会被重新用于监控,你可以这样做。但我们永远不会知道……

这种从良性政府向监控国家的转变是否会发生。因此,这种情况似乎永远不会满足。现在你可能会说,好的,即使在一个监控国家内,你也可以想象在这种情况下构建这样的系统是可以的。因此,您可以想象……

拥有我在这里所说的不同目标保护。因此,研究系统可能并非为与监控系统目标相同的目标而构建。因此,您可以说,我们在研究系统中学习到的任何东西都不会对监控有所帮助。因此,他们必须构建一个单独的监控系统。因此,我们并没有以任何方式启用该监控系统。我只是认为这是不正确的。第二种保护是我所说的资源保护。你可能会说,好吧,无论……

用于构建此系统的资源可能有多大,它们总是与政府构建监控系统所拥有的资源量相比相形见绌。现在在美国向Palantir投入的资金令人难以置信。

因此,我们将始终淹没为研究目的而发生的事情。你可能会说,那么,基于研究的系统将毫无用处,因为你只会在这个监控部门中构建一个更好的系统。也许现在可以做些什么,但我仍然认为这不足以让人相信我们应该继续进行。所以让我们假设,正如我现在所做的那样,计算结果与我刚才描述的数据系统相反。有什么办法吗?

有什么办法是可以接受的吗?我快完成了,迈克。一个小时,五分钟。解决方法与我描述的惊人地相似,但我相信它是安全的。虽然如果我错了,我希望你能告诉我。我们会看到的。看看你的想法。这是备用系统。非常相似。这就是为什么我以它自己的辉煌来描述这个系统,因为它会带你到这里,我认为。所以我想构建一个模拟的人口代理。那么你该如何做到呢?

首先,它非常相似,你首先必须确定人的类型数量。所以这个过程是一样的,类型是由性格、地点和身份或位置性的交集定义的。可能有很多。所以你仍然必须做这项工作,找出美国实际上有多少种生活经历。我应该说……

相同类型以非常简单的方式定义,对吧?当提示某个问题时,会以相同方式回应的人。如果他们以相同的方式回应,那么就我们的目的而言,他们是同一种类型。只是他们必须以相同的方式回应许多提示,对吧?因为我们希望它可用于各种研究目的,对吧?无论如何,你仍然必须确定人的类型数量。然后,你用虚构的代理填充国家。同样,2.6亿个代理,每个成年人一个,基于这些类型。

所以我们将知道美国的所有类型,并且我们知道属于每种类型的总人口比例。我们将使用它。我们将创建一个复制美国现有类型的人口。然后,你将包括填充美国社区。美国所有现有的社区都将填充正确数量的正确类型的代理。

并且您将确保模拟的社区层面边际分布(按年龄、性别、种族、态度、收入以及所有其他可用变量)再现实际的社区层面边际分布,因此我们现在创建的是真实的社区,而不是真实的人,我们在填充这些社区方面尽最大努力,但在社区层面,人与代理之间不再是一一对应关系,边际是正确的……

但我们没有一一对应的关系。你再次用模拟的自发网络覆盖它,并使用管理数据、调查数据、ABP访谈进行更新。除了你在社区层面破坏了一一对应关系之外,所有其他方面都相同。我相信这将消除我们对将此类系统用于监控的担忧。最后一页,迈克。准时。所以总结一下。

我相信我们确实存在问题。我们需要了解在这个危机四伏的世界中正在发生的事情。这非常重要。像过去那样失败的代价极其高昂。我们应该花费相当于确保我们拥有一个能够完成工作的监控系统的成本的水平。未能做到这一点的后果是令人震惊的,就像我们现在所经历的一样。

这是不构建更好的监控系统的代价。如果我们不更好地倾听人们的声音,我们甚至不知道我们的下一个失败将会是什么。我们需要弄清楚发生了什么,在危机接踵而至之际进行实时监控,因为我们过去未能很好地进行监控。所以我认为需求是真实的。我们只需要确保我们以一种不会启用监控的方式来做到这一点。我认为这是可能的。

所以,我就说到这里。谢谢。太棒了。我的意思是,我喜欢这些宏伟的蓝图和雄心壮志。我认为社会科学家应该有雄心壮志。所以,我们都为大卫的……鼓掌……你不能不为这种缺乏雄心壮志而鼓掌。聪明。让我们积攒起来。我们在网上有一些很好的问题,但让我们从现场的问题开始。所以,如果你能举手,简单介绍一下你是谁,然后提出你的问题。那边。

嗨,非常感谢。我是克里斯汀·扎雷克。我在这里的社会学系。听完你的演讲,我想起了大卫·洛奇写的一本书,叫做《易地而处》,书中有一位来自海湾地区的教授来到英国。我认为是在英国北部,这篇文章……

但是它在……然后英国的那位去了海湾地区,他们的整个生活仅仅因为改变了国家和所在位置而发生了变化。实际上,从非常典型的海湾地区风格来看待你的演讲……从演讲、宏伟的想法……

正在进行中。它也让我想到,你谈论的一切仍然局限于国家,就数据收集、测量以及其他一切而言。当你想要解决的危机从根本上说是全球性的时。我认为这也提出了这个问题。所以假设你实现了你的愿望清单,假设你确实获得某种技术账单以及其他一切,这很好,有很多钱给你,你可以继续前进,你可以做你现实版本的这个。

当你能够从国家内部收集输入时,当你想要回答的问题最终是全球性的时,当你能够模拟美国社会如何运作时,会出现哪些潜在问题?

你想停下来吗?是的,我认为这是一个很好的问题。我认为答案的一部分,它很简单且令人不满意,但我只会以对一个好问题的令人不满意的回应开头,那就是,迈克也参与其中,我们需要在许多国家开展类似的倡议。我认为这是可行的。第二个可能令人不满意的回应,如果没有那个问题,

这种方法是,许多正在发挥作用的全球性冲击最终会影响美国人民。如果你监控了我描述的网络中的那些关键节点,你就会看到这些全球性冲击是如何影响人们的。你可以做一项名义上的工作,就像那样,监控美国人民对冲击的反应,其中一些是全球性的,一些是国内的。

但尽管如此,正如你所说,我认为我是对的,从试图在美国建设更好社会的狭隘角度来看,你可以完成这项工作,因为你至少会知道人口是如何对这些全球性冲击做出反应的。但我同意理想情况下你想要更多。但是,是的,即使是我也无法像你要求我那样大胆地梦想。还有其他问题要问简吗?是的。

非常感谢。我是简·埃利奥特。我目前正在领导一个试点项目,即位于III的英国声音项目。我已经与大卫进行了一些交流。谢谢你,大卫。这是一场发人深省的演讲。精彩的讲座。谢谢。我有很多问题可以问你。我只关注一个。所以你从关注自然科学开始,事实上他们非常重视测量。

这是一种描述它的方式。另一种是自然科学中的一些问题实际上是相当明确的。所以他们知道他们想知道什么,但这非常难以找到。所以他们需要测量,他们需要巨大的强子对撞机或望远镜。

在社会科学中,我们部分问题实际上是弄清楚应该是什么问题。这就是我从这个精彩的愿景和具有挑衅性和令人不安的愿景中缺少的东西,我们实际上可以提出哪些问题来造福人们?这很有趣,我的意思是,显然你不能在一个讲座中涵盖所有内容,但是当你这么说我们因为没有看到民粹主义的兴起而失败时,

但另一种说法是,这并非失败。失败之处在于,我们创造了不平等的条件,使民粹主义得以兴盛,而民粹主义是对人们物质条件的完全合乎逻辑的回应。我不清楚的是,如果我们知道这种不满情绪正在上升,这是否也能给我们提供解决问题的线索?

所以这可能更多的是评论而不是问题。但这很有趣。谢谢。这是一个很好的问题。即使这是一个评论,我能否用更少的篇幅来回应?我完全同意。但我认为……

我说如果我们早点知道民粹主义,我们就能阻止它,我夸大了。我认为这并非不可能。让我退一步,谈谈我认为可以解决的一些危机,因为它们更容易处理。例如,想想芬太尼,直到大量的伤亡才让它变得明显,但如果我们有这样的系统,我们就能更早地发现它。

我认为这是一个更容易处理的问题。我认为我们有很多容易处理的问题没有解决,因为我们根本不知道发生了什么。现在,我认为不可能回到民粹主义的案例。如果我们早点发现这个问题,那些长期以来一直在谈论收入不平等加剧的人

长期以来一直在谈论该国某些部门的痛苦,而且非常痛苦,感到迷茫,通常是因为特权的丧失,但尽管如此

从他们的角度来看,这同样真实。如果我们早点知道这一点,那些关于解决结构性原因的论点可能会被采纳和倾听。但我同意,他们可能不会。但这种情况发生的几率会提高。即使是略微提高有意义的回应几率,也是我们想要的。

我实际上在线收到了一些问题,我会将它们链接到此。如果可以的话,我会问他们。第一个来自卡尔,他是伦敦政治经济学院社会学专业的毕业生,也是伦敦政治经济学院历史专业的研究生。我不同意所谓的在人文科学领域未能预测民粹主义的说法。例如,伦敦政治经济学院有一个非常有影响力的课程,叫做“民族主义的理论与问题”。它从未低估民粹主义复兴的潜力。

并非基于定量方法和更好的数据,但在某些方面,这门课程非常准确,因为它强调了垂直联系优先于水平联系,安东尼·史密斯有时称之为“民族复兴”,因此,各种未能预测趋势和社会运动可能是理论上的失败,所以我想这里的问题是

也许社会科学是问题所在,我们应该考虑历史,更好的历史。这实际上也是维贾伊·斯瓦奥(Vijay Swao)的第二个问题,他是伦敦政治经济学院的前学生。社会科学是科学吗?极权主义、共产主义和法西斯政权以及美国都使用“社会科学”一词,而将其描述为“社会研究”则更为谦逊和准确。如果你称之为科学,

那么,你是否会制造宣传?我想问题在于,是否投资更多、更好、更科学的社会科学,这是一种被认可的观点,实际上我们需要认识到社会科学的局限性,并考虑更多以人文科学为导向或其他理解问题的方式。是的,这是一种方法。放弃社会科学的梦想……

尝试以其他方式解决我们的问题。我认为这是错误的。我完全同意,目前所实践的科学是有缺陷的,在所有我们都希望我们所有人都能理解的方式上都是有问题的。开放科学运动解决了一些问题,但绝不是全部问题。因此,科学是一个非常有缺陷、有问题的企业。

是,我同意,这是无可争辩的。认为没有希望建立能够帮助我们的科学,这就是我和那条评论分道扬镳的地方。之前的那条是什么?我已经忘记了,但我对那条也有反应。第一个关于基本上认为民粹主义是由人文科学或学者预测的论点。

我们有长期的历史趋势。是的,我认为这是绝对正确的。有很多非常非常重要的早期分析解释了正在发生的事情,只是不够多。必须有一支合唱团的声音。必须有一个数据集一次又一次地显示它,并且许多分析都会揭示它。我只是认为还不够。总有一些人能做到正确,但我们需要一支合唱团的声音,而我们没有。

你好,我是巴黎政治学院的CNRS社会学家Yann Renizio。非常感谢你

这是一个非常非常有趣的演讲。为了稍微具有挑衅性,我想说的是,你在雄心壮志方面有点不足,因为你多次提到“行为蓝图”这个词,但在我看来,你的整个设计只依赖于一种行为,那就是回答问题。

这可能是预测你想要预测的东西(即民粹主义、重大危机)的一个很大的不足,因为人们所说的和他们在事情非常重要时所做的事情之间往往存在很大的差距。所以,是的,你能对此做出反应吗?谢谢。是的,这些都是很好的问题。太好了。

但我认为你不必照字面意思理解人们所说的,对吧?你看看他们所说的背后,理解他们所说的意思。这是有启发性的定性研究的工作。

这只是提供使这项研究成为可能的数据。我的意思是,这不仅仅是经典的解释性分析(这非常重要,可以帮助解决你如此出色地提出的问题),还有自然语言处理,我们拥有的各种技术可以深入了解人们所说的内容并理解其含义。我认为在这方面我们拥有相当不错的工具,并且AVP和其他来源提供的定性数据。

可以增强这些努力。我不认为,调查数据并非我们所需的原因之一是,它们在这方面并不丰富,对吧?你只有对一个问题的回答。那么,你能用它做什么呢?它是如此之薄,对吧?但如果你进行沉浸式访谈,我认为它很丰富,你可以超越人们所说的内容去理解它的含义。- 你好,非常感谢。我叫托马斯,我是数学专业的博士生

我有两条评论和一个问题。我的第一个评论实际上与我认为简所说的有关,即你应该更多地关注你想要回答的问题类型。我实际上认为恰恰相反。我认为这个论点的优势在于它是与问题无关的。你知道,你正在提出一个通用的基础设施,然后你可以提出或研究人员可以向该模型提出任何他们想要的问题。因此,你并非带着特定的研究问题。你正在构建一种

模拟,然后能够回答你提出的任何可能的问题。这是我的第一个评论。第二个评论是,你在最后提到,与其对个人进行一对一的基于主体的建模,不如采用一种代理模型,其中

你没有根据个人进行校准,而是复制宏观结构。然后你说,好吧,我们首先必须将人的类型硬编码到系统中。但是,我认为这也可以是一种浮动参数,你可以实时校准,对吧?你可以从宏观数据中学习有多少类型的人,并在学习模型时实时调整系统参数。

这是我的第二个评论。第三个问题是,你谈到了交互网络,你谈到了很多关于地理空间交互、手机网络的内容。但是很多交互是在线进行的,对吧?它在互联网上。那么,你是否还需要构建一个互联网副本以及后台的潜在空间,人们在其中进行交互,并且你还会输入有关在线行为的信息?

是的,三个问题。关于你应该如何回应简的评论,我完全同意。我应该这样做,并且认为已经完成了。这是一个很好的观点,我同意。简,关于你的另外两点,我认为你再次说到点子上了。

绝对的,我同意面对面互动是不够的,在线互动也很有价值。有很多方法可以使这些数据可用。我不知道,我的阅读,而且我并没有真正精通网络分析,但我读到的内容是,大多数人试图将在线互动证明为面对面互动相当强烈的概括,可能并没有巨大的附加值。

但只要存在,就应该利用它。绝对的。完全同意。实际上,我没有理解,现在我没有完全理解你的第三点。也许你可以再讲一遍?所以你说,好吧,我们构建这个现实世界的副本,我们硬编码个性类型。所以首先我们需要出去,我们需要收集所有关于人们是什么样子的调查数据,然后我们将它构建到模型中。但是如果你让它成为一个你可以校准的参数,你也可以根据宏观参数进行校准

对你知道的社会是什么样的研究,所以你说,好吧,人类个性的维度是n,而n本身就是一个参数,你可以根据传入的调查数据进行校准,它可以是,它可以是,它可以适应,我认为是的,好的,我明白了,所以谢谢你,我认为我的回应是,只要你购买

基于一项研究的结论。因此,显然现在得出任何结论都为时尚早。但是,只要你相信我们真的无法在没有美国之声项目或至少类似的定性数据的情况下理解人类经验的维度,我们需要理解行为蓝图,那么从调查数据中进行校准将非常困难,对吧?它不够丰富。这是一个可以检验的主张,你可能是对的。亚伯拉罕怎么样?

谢谢。正如我所说,这非常具有挑衅性和趣味性。我想问一个关于你所说的数据集最新版本安全性的问题。所以我想知道的是,让我们想象一下拥有你所描述的数据集的专制监控国家的世界。

我突然想到,它不会阻止某人以一种预测的方式使用它来创建一种“加强版盘查”。所以他们大概能够做的是,提取个人类型的特征,甚至将这些特征定位在社区和地区,然后用它来理解人们可能有什么样的行为或价值观。

这是有前途的,因为这种模型可以做一些预测工作来尝试理解,然后它使他们能够识别应该被观察的群体,至少应该被观察和调查,或者实际上更积极主动地阻止人们采取某些行动,所以你知道,这可能是试图预防性地阻止抗议,例如,或者你知道,甚至

与犯罪或其他事情有关,但它可以被预测性地用来识别应该成为政府监控目标的个人群体。这可能会令人担忧,但我可能误解了你所表达的内容。我认为这是对的,而且……

问题是这种分析是否比其他更精确的分析更有价值。我的怀疑是,会有更便宜的方法达到目的。但如果你是对的,而且没有,那么这将是一个令人担忧的问题。在这里继续。我可以回应这一点,那就是我认为这在很大程度上预设了拥有地理空间信息,对吧?因此能够将个人与物理位置联系起来。

但我关于互联网的观点是,如果你说,好吧,现在大多数互动实际上是在线进行的,那么人们就处于这个非物理的潜在空间中,对吧?他们身处现实世界中的哪个位置并不重要。更重要的是他们在这种意识形态空间中的位置?这大概会降低监控的风险,因为你将无法将个人精确定位到某个物理位置。我要去这里。简?麦克风来了。是的。

好的,这是一个非常有趣的辩论。所以为了继续这个话题,对我来说,这已经发生了。所以这不是国家监控精确定位人们并将他们围捕起来,并说“不要参加抗议”,而是Facebook和各种其他东西通过算法向人们提供他们想看到的东西。所以我们已经有了某种奇怪的社会工程,这意味着当我查看Instagram时……

我看到,好吧,我不会告诉你,但我看到符合我非常无聊的更年期习性的东西。是的,我敢打赌,如果你登录的话,你不会看到和我一样的东西。好的,我一直喜欢一点幽默,但无论如何。

所以我认为我们已经生活在一个社会中,在这个社会中,一些公司拥有这种能力,那么回到社会科学问题上来,我们如何才能确保社会科学家能够充分利用这种数据?

而不是仅仅让这个世界的Metas来使用它。但我也想对汤姆做一个快速的回应,因为我确实知道综合研究,但我们仍然需要知道它可以回答哪些类型的问题。这又回到了简的观点,关于我们是否真的可以从这一点预测人们的行为?无论如何,我已经说了很多了。我会闭嘴。去回应,大卫。

很多行为都体现在你可以向人们提出的查询中,只要存在这种对应关系,那么你就可以开始了。当然,行为的对应关系绝非完美,因此,我认为必须指出的是,

虽然从字面上理解查询,从字面上理解对查询的回应可能不会告诉你关于行为的信息,但对记录的更深入解读可能会。这将是我的假设。但就更大的问题而言,我认为我至少暗示了很多我们关心的根本性问题。我们非常关心政治态度,对吧?我们非常关心社会态度、自身免疫性冷漠。我们关心……

各种干预措施的影响,其中一些影响我认为可以通过我们可以进行的查询的回应来充分捕捉。这是一个可以检验的主张,但即使我们无法做到这一点,这也是最终目标。了解人们的政治态度和社会态度。非常感谢你。我真的很喜欢这个演讲,它开启了我们如何思考社会科学的整个世界。

这与我们刚才讨论的内容有关。但是,我们真的能预测这些行为吗?我更多的是从这样的角度思考:我们如何才能

这些化身是否会像真人一样做出回应。所以我认为还应该对真人进行大量的有效性检查。但我同时也认为行为是多么复杂,以及我们是否真的可以,当我们问一个化身,

你的政治立场是什么?然后当你问一个真人时,我不知道,也许几周后或几个月后,你如何才能真正地,我们如何比较相同的东西?或者像人与非人主体之间可能出现的问题是什么?- 是的,一种思考方法是,为了使

这种可辩护的方法。我们只需要做得比我们目前做的更好。我们目前正在做的是推断,对吧?当我们有缺失数据时,我们会进行推断。这只是一个插补技术。它很可能更好。它完美吗?不,只是更好。因此,很容易过度插补

代表这种方法与我们已经做的事情有多大的不同。它并没有那么不同。我们进行推断。我们的插补方案不太好。我们可以做得更好。它完美吗?不。仍然会有错误。因此,一个悬而未决的问题是,我们可以改进现有插补的程度。所以我认为我们同意。

也许,我担心事实上我们可以做得比你认为的更好。我宁愿它做得不如我想象的那么好,但这只是一个研究问题。我从斯图尔特·麦克艾弗那里收到了两个在线问题,这些问题询问了人工智能,并与我们讨论过的各种问题相关联。但论点是,第一个问题是,因为人工智能是在特定人群及其数字表达(即精通数字技术等等)上进行训练的,

这是否意味着你可能会错过那些可能成为未来民粹主义者的人?然后与之相关的是,由于人工智能基于过去数据的表达,如果你依赖于基于人工智能的模型,是否会存在你不会必然捕捉到新兴事物的问题?是的,这将是令人担忧的。事实上,这条评论在以下方面是正确的

据我了解,现有努力在复制人口异质性方面最大的失败之一是它被压制了。与现实世界相比,在人工智能生成的响应中,我们获得的异质性较少。因为LLM被构建为消除人类中一些更成问题的反应,但这些反应已经被

从LLM中训练出来。因此,我们需要通过某种微调来恢复通过某种方式获得的异质性。问题是我们能否成功做到这一点。到目前为止,这只是一个不完美的练习。很难重新创建已经被熨平的这种异质性。但猜测是我们可以做到。最后,还有最后一个问题吗……

两个问题。让我们快速提出三个问题,然后回答一个,是的?是的,你想下一个吗?可能是一个无聊的问题。它基本上是关于你的后备系统。你将邻里作为最低级别的聚合,但为什么你会特别选择它,因为你进行了所有这些数据链接,并且你可以选择几个级别的聚合?

谢谢大卫,我真的很喜欢这个演讲。我真的很喜欢拥有一个100亿英镑的社会科学项目的大胆设想。我的问题是,有了这种雄心壮志,

你似乎在寻找真理。在社会科学中,我觉得很少有真理。目前我们拥有许多不同的方法和方法论的好处是,你至少可以争论这些不同版本的真理。我只是想知道,如果你的愿景实现,你认为其他形式的社会研究将处于什么位置?坚持下去。不,你不能。

大卫,最后一句话。我喜欢这些问题。一点也不无聊。据我了解,这仅仅是降到最低可能的级别,这样就不会冒重新识别人们的风险,对吧?这是一个技术问题。我的意思是,总是有风险的,我们必须有一个可以接受的重新识别风险,我们希望以不可容忍的水平降到最低可能的空间级别。

我想这并不是一个零和博弈。拥有使用这种基础设施进行研究的能力,根本不会排除所有其他理解世界的方法。

我认为这不是一个零和博弈。如果我们通过这种数据基础设施拥有更强的研究能力,我们将拥有更多的社会科学家,因为成为社会科学家将更有回报,因为我们可以获得更多关于世界正在发生的事情的非常有价值的证据,而且我们不会挤压任何其他方法。我们只会拥有更多优秀的社会科学,并且我们将更接近于理解世界正在发生的事情。

我认为我们应该停止了。我只想最后说,你知道,我自己的观点是,许多社会科学令人遗憾地没有应对我们身处世界的位置所带来的挑战,并且非常倾向于利基研究群体。获得我们需要考虑的帮助真是令人耳目一新。

我们面临的所有挑战和困境,并思考如何扩大社会科学的规模,以及如何正确地思考这个问题。所以,真的,真的,我认为这是一场精彩的讨论。非常感谢大卫。感谢各位的光临。谢谢。

感谢您的收听。您可以在您最喜欢的播客应用程序上订阅伦敦政治经济学院活动播客,并通过留下评论来帮助其他听众发现我们。访问lse.ac.uk/events以了解接下来有什么活动。我们希望您很快能参加伦敦政治经济学院的另一场活动。