There is a need because we lack direct ways to study the mentality and behavior of people from ancient civilizations. Traditional methods, such as archival data and cultural products, are indirect and limited. AI can potentially provide more direct insights by simulating ancient participants based on historical texts.
Experiments have replicated 70 different large-scale survey experiments using simulated participants from ChatGPT, with results correlating at about 0.9 with real human data. This suggests that AI models can capture significant aspects of human psychology.
Using historical texts is challenging because they are biased towards the perspectives of literate, elite, and educated individuals from the past. This can lead to a skewed understanding of ancient populations. Researchers need to account for these biases by using additional historical records and weighting responses.
WEIRD stands for Western, Educated, Industrialized, Rich, and Democratic. It refers to the fact that the majority of participants in behavioral science come from these types of societies, which are not representative of the global population.
Potential use cases include testing the universality of certain psychological traits by extending the temporal window back to ancient societies. For example, researchers could examine differences in preferred sexual strategies between men and women in societies that lived hundreds or thousands of years ago.
AI could be used to generate new hypotheses for social psychology research. A recent study found that GPT-4 generated hypotheses that were considered more compelling and probably true by social psychologists, suggesting that AI could become a valuable tool for generating research ideas.
本期节目由亚马逊Prime赞助播出。节日期间没有什么比培根曲奇更美味的了。有了Prime,我可以快速免费地将所有食材直接送到家门口。无需最后一刻去商店抢购。当然,我还会在亚马逊音乐上播放我最喜欢的节日歌单。这是创造难忘回忆的终极配乐。从流媒体到购物,一切尽在Prime。访问Amazon.com/Prime,充分利用您感兴趣的一切。
最近人工智能非常火热。一些公司想让我们相信,机器学习强大到几乎可以预测未来。
但是,使用人工智能来探索过去,甚至与早已灭绝的文明成员“对话”呢?这里是《科学美国人·科学速递》,我是瑞秋·费尔特曼。今天我的嘉宾是亚利桑那州立大学社会心理学负责人兼副教授迈克尔·瓦努姆。他是最近一篇观点论文的合著者之一,这篇论文提出了一种关于如何使用ChatGPT等工具的有点诡异的新用途。
迈克尔,非常感谢您今天加入我们。乐意之至。感谢邀请我。所以,你们这篇新论文有点……
有点像“机器里的幽灵”的感觉。跟我们讲讲你们要解决的问题吧。是的。我一直对文化变迁很感兴趣,在这方面做了很多工作。但当我们试图了解那些已经不在人世的人的心理或行为时,我们会遇到一些局限性。我们显然没有时间机器,对吧?我们不能
把死者带回来,让他们参与我们的实验或进行经济游戏。因此,像我这样的研究人员通常必须使用相当间接的替代方法,对吧?也许我们会获得关于婚姻、离婚或犯罪之类的档案数据,或者我们会查看文化产品,例如人们在书籍中使用的语言,然后我们试图
推断人们可能持有什么样的价值观,或者他们对不同类型的群体有什么样的感受。但这都是间接的。如果我们能够真正获得今天从人们那里获得的那种数据,仅仅是从,比如说,古罗马人、维京人或中世纪波斯人那里获得的数据,那将是多么令人惊奇啊。
在过去一两年里,让我真正兴奋的是,人们开始意识到,你可以用像ChatGPT这样的程序模拟至少是现代参与者,令人惊讶的是,我认为令人兴奋的是,它复制了行为科学中大量经典效应。所以我们想,嗯。
如果我们能够根据这些由现代人的著作创建的模型做到这一点,也许我们可以根据古代人的著作做到这一点。这可能会开启一个全新的可能性世界。
是的。你能否详细介绍一下那些使用语言学习模型复制心理学现象的实验?其中一个更强大的实验试图用ChatGPT模拟的参与者复制70个不同的大型调查实验。
他们发现,结果与人们对真实人类的观察结果的相关性约为0.9。当然,这不是任何人设计Llama或ChatGPT的目的,但在制作能够以非常自然的方式与我们交谈的这些模型的过程中,
他们似乎捕捉到了相当多的人类心理学。你在论文中提到,一些人已经在使用历史文本训练大型语言模型。那么到目前为止,他们在做什么呢?到目前为止,这些都只是初步尝试。人们只是想看看,好吧,如果我们根据中世纪欧洲文本训练一个模型,它对太阳系、医学或生物学的理解是什么?
他们对行星的数量不正确。他们相信人体的四种体液。所以,据我所知,到目前为止,还没有人将这些经过微调的模型真正用于现代实验或调查。但我猜想这种情况很快就会发生。我真的很想看看人们会发现什么。是的,是的。
所以在阅读你的论文时,我想到的一件事是我们看到的化石记录中固有的偏差。我们对过去生命形态的认识受到保存下来的东西的影响,而这又受到各种因素的影响,例如气候和我们所谈论的生物体的身体。
我想象一下,在历史上大多数时间和地点,某些人在书面文本中都被过度代表了。那么,你建议研究人员如何驾驭这一点,以确保我们不会对人们的真实情况产生这种非常有偏差的认识呢?对于这种提议来说,这是一个非常棘手的挑战。
因为,在人类历史的大部分时间里,没有人是识字的。写作是相对较近的事情。对吧。在某些社会拥有文字的时期,实际上很少有人知道如何阅读和写作。更少的人写下了流传到现代的东西。所以你得到的数据会偏向……
那些更精英、受教育程度更高的人。我们认为可能有几种方法可以解决这个问题,而且这些方法并不完美,对吧?但也许如果我们结合使用它们,我们仍然可以处理这些模型中固有的偏差。
一种方法是,我们对社会阶层如何影响现代人口的心理学了解得相当多。因此,我们可能会对这些模型进行一些微调,或者我们可以让它们进行实验和调查,然后对它们的反应进行加权,以试图解释这种偏差。是的。
在某些情况下,我们还有其他历史记录和分析来源。如果这些记录更广泛地捕捉到过去人口的心理或行为模式,我们可以看看这些历史大型语言模型的结果是否与这些结论一致。
但这确实很棘手。这将是一个需要克服的真正挑战。是的。当然,这并不是使用历史数据特有的挑战。这也是我们在用现代数据训练LLM时遇到的挑战。哦,绝对的。对。而且
激发这个想法的一件事是穆罕默德·阿塔里和颜涛等人的一些工作,他们表明,当前的大型语言模型看起来真的很奇怪,因为它们与西方和英语国家人口的心理更接近,而不是世界其他许多地区。我的意思是,嘿,这说得通,对吧?鉴于训练数据过度代表了这些社会。但这也很令人兴奋,因为它表明,如果你有不同的语料库
那么你将捕捉到一些时代精神,以及创造它的那些人的特定文化心态。是的。你能否告诉人们在这种情况下WEIRD代表什么?因为我认为这是一个非常好的首字母缩写词。是的。这是乔·亨里奇大约十年前提出的一个首字母缩写词,它代表西方、受过教育的、工业化的、富裕的民主国家。
事实证明,目前只有少数人类生活在这种社会中。但是,无论你如何划分,行为科学中的绝大多数参与者都来自这些样本。这很重要,因为事实证明,文化会以多种方式影响我们的思维和行为,从我们持有的价值观到我们在公共场合喜欢的个人距离。
基本的视觉注意和认知模式、合作率。这是一个非常长的清单。不,我的意思是,我可以肯定地想象,你知道,谈论古代历史非常引人入胜,但我可以肯定地想象研究人员试图使用,你知道,一些像
19世纪、20世纪,甚至21世纪来自弱势群体的文本,以重新审视,你知道,那些可能遗漏了大量人口的心理学研究。是的,我认为这是一个非常好的主意。在某种程度上,我们回溯的时间越近,进行这种研究就越容易。是的。所以,虽然想象一下将范围推到非常非常久远以前是令人兴奋的,
但可能一开始,你知道,最初的起点将是让我们回顾100年或150年。是的。说到这里,你知道,想象一下,如果这个想法完全成功,我们正在进行大量的“不死心理学”项目。你的一些理想用例是什么?我做了很多受进化心理学启发的研究。而且
有时我们会进行实验或调查,我们会尝试从世界上的每个大陆获取数据,看看人类心理的某些部分是否具有普遍性。当我们发现它时,这真的很令人兴奋。但我们正在从说它是普遍的并且具有适应性意义,
到这就是过去的人们,尤其是远古时代的人们是如何思考的,这是一个推论性的飞跃。因此,能够将这个时间窗口稳固地推回到过去,你知道,像肯雷克和施密特等人发现男性和女性在偏好的性策略方面存在差异。你知道,你想要大量的伴侣和不稳定的关系,还是你更喜欢拥有更专属的关系和更少的伴侣?
这似乎在全球范围内都适用。但是,如果我们开始从生活在数百或数千年前的社会中看到这些东西,我们对这些东西确实是人性的核心部分就会更有信心,我认为。完全正确。这个想法是面向未来的,并且有点推测性,对吧?我没有在我的电脑上准备好一个这样的东西来运行。但萨钦、贝克和卡尼曼
的同事最近发表了一篇论文,他们在论文中让GPT-4为社会心理学研究生成数十个新的假设。
然后让实际的社会心理学家生成新的假设。事实证明,其他社会心理学家认为,人工智能提出了更令人信服、可能更真实的观点。有趣。因此,我们将来可能会看到人工智能不仅用于模拟参与者或编码数据,甚至用于生成想法。你可以想象那种奇怪的闭环,像我这样的人可能会失业。是的。
好吧,希望不会。我认为总会有空间容纳那种独特的人为因素。但我认为考虑人工智能如何真正成为我们的一种有趣工具是很好的。所以非常感谢你今天抽出时间来和我们聊天。哦,谢谢,瑞秋。我很高兴。我很享受这次谈话。
这就是本周五的“迷恋”的全部内容。我们将在周一回来进行每周新闻综述。周三,我们将讨论一些几乎和人工智能幽灵一样诡异的事情。黑色星期五购物的心理学。科学速递由我瑞秋·费尔特曼制作,以及丰达·姆旺吉、凯尔索·哈珀、麦迪逊·戈德堡和杰夫·达尔维西奥。谢恩·奥波西斯和亚伦·沙塔克负责检查我们节目的事实。我们的主题音乐由多米尼克·史密斯创作。
订阅《科学美国人》,获取更多最新的、深入的科学新闻。这里是《科学美国人》,我是瑞秋·费尔特曼。祝你周末愉快。