#426 – Edward Gibson: Human Language, Psycholinguistics, Syntax, Grammar & LLMs

2024/4/17

Lex Fridman Podcast

Edward Gibson

Edward Gibson教授详细阐述了其对人类语言的研究，从孩童时期对英语语法学习的兴趣出发，逐步深入探讨了心理语言学、句法、语法等领域，并结合其在MIT语言实验室的科研经历，对依赖语法理论、乔姆斯基的理论、以及大语言模型（LLM）的局限性等方面进行了深入分析。他认为，依赖语法理论能够更清晰地展现词语间的依赖关系，并解释了不同语言中词序的规律。他与乔姆斯基的理论差异主要体现在研究方法上，他更注重实证研究，而乔姆斯基更注重理论推演。他还探讨了语言与思维的关系，认为语言是一种交流系统，而思维则更为抽象，两者并非完全重合。此外，他还分析了LLM的局限性，认为LLM擅长处理语言的形式，但在理解语言的意义方面仍存在不足。 Lex Fridman作为访谈者，引导Edward Gibson教授深入探讨了人类语言的各个方面，并就依赖语法、乔姆斯基理论、大语言模型（LLM）等话题与其进行了深入交流。他提出了许多具有启发性的问题，例如语言形式与意义的关系、语言的演化、LLM的局限性以及人类语言与动物交流的可能性等。通过与Edward Gibson教授的对话，Lex Fridman展现了他对人类语言和人工智能领域的浓厚兴趣以及敏锐的洞察力。

Deep Dive

Chapters

Edward Gibson's fascination with human language began in school when he was intrigued by the structure of sentences in English grammar. He later pursued computational linguistics at Cambridge, which led him to explore the puzzle of language from an engineering perspective.

Edward Gibson found the process of structuring sentences in English grammar interesting from a young age.
He pursued computational linguistics at Cambridge, a field he had no prior experience in.
Gibson's journey in understanding language was influenced by his background in mathematics and computer science.

Shownotes Transcript

以下是与爱德华·吉布森（Edward Gibson）的对话，大家都叫他泰德（Ted）。他是一位计算语言学教授，领导着麻省理工学院（MIT）语言实验室，该实验室研究人类语言为何呈现其当前形态，以及文化、语言与人们如何表达、处理和学习语言之间的关系。此外，他还有一本名为《句法：认知方法》（Syntax: A Cognitive Approach）的书，由麻省理工学院出版社出版，将于今年秋季上市。敬请期待。

现在快速提及一下每个赞助商。查看说明中的赞助商链接是支持本播客的最佳方式。我们有雅虎财经（Yahoo Finance），基本上包含了投资者所需的一切；Listening，用于收听研究论文；Policygenius，用于保险；Shopify，用于在线销售；以及Eight Sleep，用于睡眠。

他们是我的朋友，非常棒。如果您想与我们优秀的团队合作，或者只是想与我联系，请查看我的X（前推特）联系方式。现在进入完整的广告环节，一如既往，中间没有广告。

我尽量让这些广告有趣一些，但如果您必须跳过，请务必查看赞助商。我喜欢他们的产品，也许您也会喜欢。

本期节目由雅虎财经赞助，他们是新的赞助商，并且他们有一个新的网站。您应该去看看，这是一个为投资者提供财务管理报告、信息和新闻的网站。雅虎本身已经存在很久了。

雅虎财经也存在很久了，我不知道具体有多久，但肯定超过20年了。它经历了很多。

它快速发展、调整、演变、改进等等。我现在使用它的功能是，它有一个投资组合，您可以将您的账户添加到其中。自从我身无分文以来，我就一直在使用它，这叫做TD Ameritrade。

我仍然使用同样的东西，只是获得一个基本的指标，我认为TD Ameritrade被收购了。但查尔斯·施瓦布（Charles Schwab）或其他公司出现了，我不知道。

我不知道这些东西是如何运作的。我只知道雅虎财经可以整合这些信息，并向我展示我需要了解的关于我的股票或投资组合的所有信息。我没有进行任何有趣的投资，但仍然很好地监控它，保持联系。

现在我认识的很多人在投资方面有更多有趣的事情。因此，所有这些都可以轻松地整合到雅虎财经中。您可以查看所有这些内容，图表看起来非常漂亮和性感，这很有帮助。

您将获得信息。那是关于您自己的投资组合。但雅虎财经还提供全球范围内的财务信息。

所有这些都在那里。重大新闻、对正在发生的一切的分析，所有类似的事情。我还应该提到，我想制作越来越多的关于财务的节目。

我已经与Ray Dalio进行了几次对话，其中很多是关于金融的，但也有一些是关于地缘政治和金融的更大背景。我最近与Bill Gross进行了一次关于金融的对话，我还做了一系列关于加密货币的对话，很多很多亿万富翁。

Michael Saylor、Chamath Palihapitiya、Vitalik Buterin，还有很多亿万富翁，他们都在思考金钱的未来、金融的未来。无论如何，您可以使用雅虎财经跟踪所有这些信息，它提供全面的金融新闻和分析。访问yahoo finance.com。

本期节目还由Listening赞助，这是一个允许您收听学术论文的应用程序。这是我一直希望存在的东西，我一直梦想着它。

我怀疑这很难实现。但这些人做到了。基本上，它将任何类型的文本格式转化为音频。对我来说，我最关心的事情，我认为也是Listening的基础，是学术论文。我喜欢阅读学术论文，在实际阅读过程中有几个层次的严谨性。

但收听它们，尤其是在我浏览之后或深入研究之后，收听它们是一种非常美妙的体验，它巩固了理解，将各种想法带入生活。我一边做饭、跑步或喝咖啡时都在听。

所有这些都需要高度的专注，尤其是像我收听的那种计算机科学论文。但您可以加载各种内容。您可以收听哲学论文。

您可以收听心理学论文，比如这个语言学主题，我已经收听了关于语言学的几篇论文，以及其他主题的论文，收听论文很棒。论文、书籍、博士论文、网络文章，甚至电子邮件、新闻通讯，都以非常性感、悦耳的声音呈现。我认为这最终是最重要的，它不应该让人感觉像是一项苦差事，我喜欢它。

通常你会获得两周的免费试用，但本播客的听众可以获得一个月的免费试用。访问listening.com/lex，即listening.com/lex。本期节目由Policygenius赞助，这是一个保险市场，包括人寿保险、汽车保险、房屋保险，以及各种保险。我非常喜欢它的比较工具。我很快就要去恶劣的环境旅行，我需要弄清楚如何更新我的设备，以确保它们防风雨、防水，甚至能够承受恶劣的环境。

能够进行比较会很好，这样我就不用求助于Reddit、Gearbest等，争论不同的音频录音机、电缆、麦克风和防水容器等等。我非常希望能够对它们进行严格的比较。当然，我会去亚马逊查看评论，但它并不真正可靠。我认为亚马逊在这方面对社会做出了巨大的贡献，您可以列出所有不同的选择，并对这些东西有多好进行大量的结构化分析。

因此，亚马逊在这方面非常出色。Policygenius所做的是亚马逊模式，但针对保险。因此，比较工具是我最喜欢的东西，它非常容易理解保险市场。使用Policygenius，您可以找到人寿保险保单，每年只需292美元即可获得100万美元的保额。访问policygenius.com/lex，或点击说明中的链接，获取免费的人寿保险报价，看看您可以节省多少钱。

本期节目还由Shopify赞助，这是一个为任何人设计的平台，可以在任何地方销售，并拥有一个外观精美的在线商店。我不是在这里点名，但我最近与Shopify的首席执行官一起远足，他非常聪明。我的意思是，我很久以前就是他的粉丝了，很久以前Shopify还是赞助商之前。

我甚至不知道他是否知道Shopify赞助了这个播客。现在澄清一下，这真的无关紧要。世界上没有人可以对我施加压力，让我必须有赞助商，或者没有赞助商，或者让赞助商施加压力。

我的意思是，我可以说，我想早上醒来，完全自由地说我想说的话，想我想想的事情。在我的生活中，我在很多方面都非常幸运。我一直过着有纪律的生活，而言论自由和思想自由正是由此而来。

所以我不需要任何人。我不需要老板。我不需要钱。我现在可以自由地以我自己的方式在这个世界上生存。最重要的是，我周围环绕着令人难以置信的人。

许多人我都与他们意见相左，并进行辩论，所以我受到这些对话和辩论的影响。我一直在学习，一直在挑战自己，一直在谦卑自己。我有一种知识上的谦逊。

我有点怀疑自己是个傻瓜。我从这个角度开始我对待思想世界的方法，假设自己什么都不知道，每个人都有东西可以教我。无论如何，我不确定为什么我偏离了主题，但大自然的美好是美好的。

无论如何，我有一个Shopify商店，lexfridman.com商店非常简洁，这就是我喜欢的方式。我认为大多数事情都是如此，如果您想建立一个商店，这非常容易，只需几分钟。我甚至知道如何操作，注册一个每月1美元的试用期。

shopify.com/lex，所有字母都小写。访问shopify.com/lex，让您的业务今天更上一层楼。本期节目还由Eight Sleep赞助。

这是我的避风港，打开门，我就可以从世俗的烦恼中逃离，进入一个连续的宇宙，那里有冰冷的床面和温暖的毯子，可以小睡20分钟。无论我的思想多么黑暗，小睡都会让我摆脱困境。我再次看到这个世界。

Eight Sleep的科技基础非常酷。您可以控制温度，这个应用程序已经成为我生活中如此重要的一部分，以至于我开始认为它是理所当然的，典型的凡人，他们可以控制温度。我说我现在把它设置为-5摄氏度，非常舒适，凉爽的表面。

这是我非常期待的事情，尤其是在旅行时。我没有它的时候，它真的让我感觉像在家一样。访问eightsleep.com/lex。这是Lex Fridman播客。为了支持它，请查看说明中的赞助商。现在，我的朋友们，让我们开始与爱德华·吉布森的对话。

你是什么时候开始对人类语言着迷的？

小时候在学校里，当我们必须构建英语句子的结构时，我发现这个过程很有趣。我发现它令人困惑，我不知道该怎么做。我不理解它背后的理论，但我发现它非常有趣。所以当你看到语法时……

你最先想到的是像谜题一样，像数学谜题一样。

是的，我认为这是对的。那时我还不知道我会从事这项工作。我只是一个数学迷，计算机科学家，我真的很喜欢谜题。

然后我发现语言是一个有趣的谜题，可以从工程的角度来研究。所以，我有点偶然地，在我完成我的本科学习后，我的专业是计算机科学和数学，在加拿大皇后大学，我决定去读研究生。我一直以为我会这么做。

我去剑桥大学，那里有一个计算语言学的硕士课程。我以前从未上过语言课。我本科时上的都是计算机科学和数学课。我只是认为这是一件有趣的事情，可以做一年，因为这是一个为期一年的课程，然后我最终花了一辈子都在做这件事。

所以从根本上说，你的人生旅程是一个数学家和计算机科学家的旅程。然后你发现了语言这个谜题，并从这个角度来尝试理解它。从这个角度来看，几乎像一个数学家，或者甚至是一个工程师。

像一个工程师。坦白地说，我上过一门人工智能课，我想是在83年、84年或85年左右，很久以前了。里面有一节自然语言处理的内容。

这并没有给我留下深刻的印象。我认为一定还有更值得研究的东西，它看起来不像一个真正的理论。所以我……这似乎是一个有趣的领域，缺乏足够好的工作。

你是否在你的研究中遇到过类似专家系统的东西，在80年代，你试图避开语言的诗意，避开中心词、语法等等，转而关注语言试图传达的潜在含义，并试图以某种计算机可表示的方式压缩它？

我的意思是，我可能遇到过，但我对此不太感兴趣。我试图先解决更容易的问题。一旦我认为我们可以处理句法，这似乎更容易，就像形式而不是意义一样，你开始谈论意义。

这是一个非常困难的问题，它仍然是一个非常热门的问题。但形式更容易。所以我认为，至少弄清楚人类语言的形式，这听起来很难，但实际上可能更吸引人。

所以很有趣，存在一个很大的分歧。形式和意义之间存在差距，距离。这是你一生中讨论过很多的问题，因为大型语言模型擅长形式……是的，我认为如果我们擅长……

形式，正是因为它们擅长形式和意义……

你认为是否存在……这是一个开放式问题，对吧？形式和意义有多接近，我们稍后会讨论。至于我研究形式，也许浪漫的想法是形式是意义这个更大东西的影子。

在我看来，语言是表达思想的方式。我们通过语言相互交流。因此，在理解这种交流的结构时，我认为你开始理解思想的结构以及这些思想和交流背后的意义的结构。但你认为差距很大吗？

是的。

你发现人类语言最美妙的地方是什么？也许是人类语言的形式，人类语言的表达。

我认为人类语言的美丽之处在于，嗯，一些在人类语言中发生的概括，在语言内部和跨语言之间。让我举个例子，或者一些我认为相当了不起的事情，那就是如果一种语言，如果它有一种词序，使得动词倾向于出现在宾语之前。

所以，就像英语那样，我们先有主语，在一个简单的句子中，比如说，嗯，你知道，狗追猫，或者玛丽踢球。所以，先主语，然后是动词，然后是宾语。所有这些东西在英语中都出现在后面，所以它通常是动词，我们想说的东西大部分都出现在主语之后，宾语和许多我们想说的话都出现在后面。

有很多语言是这样的，大约40%的世界语言是这样的，它们是主谓宾语言。然后，这些语言往往有介词，这些标记在名词上，连接名词或名词短语到动词。所以，我用介词，比如“in”、“on”、“of”或“about”，我说我谈论某事，那件事就是我们拥有的那个介词的宾语。

这些小标记也像动词一样，出现在它们的名词之前。好的。然后，我们看看所有像日语或印地语或其他一些语言，这些被称为动词后置语言。

这些可能略多于40%，也许是世界语言的45%，甚至超过50%是动词后置的。这些往往是后置词，同样的标记。我们有同样的标记，就像我们在英语中一样，但它们把它们放在后面，所以，对不起，它们把标记放在前面。

所以，你说的不是“你谈论一本书”，而是“一本书关于”，顺序相反，在日语或印地语中，你做相反的事情，动词也放在最后。所以，与其说“玛丽踢了球”，不如说“玛丽一个球踢了”，然后是“玛丽踢了球”。约翰，是约翰对那个小东西，那个标记，介词“关于”，在这些语言中是后置词。

所以，有趣的事情，对我来说令人着迷的事情是，在一种语言内部，这种顺序一致性是和谐的。所以，如果它是其中一种，要么是动词前置，要么是动词后置，那么你就会有介词或后置词。这就是我们可以看到的跨语言的情况。

我们大约有一千种语言，现在地球上大约有七千种语言。但是，我们对大约一千种语言的词序信息相当充分。对于这1000种语言，我们知道大约95%符合这种模式。所以，它们要么是动词前置，大约一半，一半是动词前置，像英语，一半是动词后置，像日语。

所以，为了澄清一下，动词前置是主谓宾，动词后置仍然是主宾谓，对吗？

是的，主语通常是……

首先，太迷人了。“我吃了一个苹果”，或者“我苹果吃了”，是的。好的。首先，世界各地在这45%之间有相当平均的分布，是的。

相当平均。这两种是最常见的，到目前为止，这两种是最常见的。主语往往是第一个。有很多有趣的事情，但是这些事情是我觉得如此迷人的事情。这些在语言内部和跨语言之间的概括，以及它们的存在，实际上并没有一个简单的解释，我认为，对于很多这样的事情。那就是，你试图最小化单词之间的依赖关系。

我认为，这基本上是词序看起来像现在这样的原因，我们总是连接的是什么，我告诉你什么？我在用句子和你说话。你在用句子和我说话。

这些是一系列相互连接的词，这些连接是词之间的依赖关系。事实证明，我们在语言中试图做的实际上是最小化这些依赖关系，这让我更容易说话。如果连接意义的词靠得很近，那么你理解起来就更容易了。

如果它们相距很远，那么产生起来就很难，你理解起来也很难。世界各地的语言，在语言内部和跨语言之间，都符合这种概括，那就是，事实证明，动词前置然后有介词最终会使依赖关系更短，而动词后置然后有后置词最终会使依赖关系比交叉它们更短。如果你交叉它们，最终你会……

这是可能的，你可以在一种语言中做到这一点。在一种语言中，你可以做到这一点，它最终会导致比你没有交叉时更长的依赖关系。所以语言往往会朝着那个方向发展。它们倾向于最小化，它们被称为和谐的。很久以前，由……埃塞克斯大学的约瑟芬·沃克观察到，他来自斯坦福大学，他观察到关于词序如何运作的许多概括，而这些是一些他观察到的关于词序的和谐概括。我想问你很多事情。有时只是基本的，匹配依赖关系的时间。你所说的依赖关系是什么意思？

我的意思是，在语言中，有三种结构，三种构成语言的成分，一种是声音，比如英语中的“cats”，我不谈论这部分。我谈论的是两部分含义，那就是词，你之前谈论过含义。词有形式，也有与之相关的含义。

所以，“cat”是英语中的一个完整形式，它有一个与“cat”相关的含义，然后是词的组合，嗯，我们称之为语法和句法，就像当我有一个组合，比如“the cat”或“two cats”，好的，所以，我可以取两个不同的词，把它们放在一起，我从把这两个不同的词放在一起得到一个组合的含义，这就是句法，在任何句子或话语中，无论我与你交谈，你与我交谈。我们有一堆词，我们把它们按顺序放在一起，结果它们是相互连接的，所以每个词都只与另一个词连接。在那个句子中。

所以，你最终得到的东西在技术上被称为树，它是一种树状结构。所以，话语或句子的根部，然后有一堆依赖关系，就像从根部向下延伸到词语的分支一样。用树的隐喻来说，词语就是树叶。

所以树也是一个数学……

结构。

嗯，所以在这个令人着迷的事情中，你可以把一个句子分解成一棵树。他们想要每个词都挂在这个上面。

依赖于，每个人都同意。所以所有链接……

都会同意这一点。没有人……

没有人……

没有人坐在那里，好的，正在坐着。

我认为在每种语言中，我认为每个人都同意所有句子在某种程度上都是树。我可以补充一点吗？

对我来说，作为一个外行，嗯，令人惊讶的是，你可以把许多，大多数，所有语言的句子分解成一棵树。

我从未听说过有人不同意这一点，人们不同意的是树的细节。

好的，那么，嗯，根是什么？你如何构建？这有多难？构建一棵树的过程是什么……

从一个句子？嗯，这取决于……我要说最简单的事情，依赖语法就像一群人发明了它，帕斯卡是第一个法国人，我的意思是，这篇论文发表在1959年，但他是在30年代工作的，所以，它可以追溯到，嗯，潘尼在古代印度就做过这件事，好吗？所以你正在做这样的事情。

我们可以想到的最简单的事情是，单词之间只是存在连接来构成话语，所以，比如说，我有两条狗进了房间，好的，这是一个句子。所以，嗯，我们把“two”和“dogs”连接在一起。这就像它们之间存在某种依赖关系，以产生更大的意义。

然后我们把“dogs”连接到“entered”，我们把“room”以某种方式连接到“entered”，所以我将连接“room”，然后“room”连接回“entered”，这就是树，根是“entered”，那就是像进入事件一样的东西。这就是我们在这里说的。主语是狗，是“two dogs”。

它是，并且连接回到“dogs”，回到“two”。我只是，这就是我的树，它从“entered”开始，到“dogs”，再到“two”。在动词的另一边，宾语是“room”。

然后它回到限定词“a”，我，嗯，称那个词为……所以，在这里有很多词类。所以有动词。

这些东西通常标记，嗯，它们指的是世界上的事件和状态，以及名词，它们通常指的是人、地点和事物，人们说它们也可以指代。他们认为，对于事件本身也是如此。它们被标记为……一个词的类别或词性是它如何在语言中使用的方式。这就是你如何决定一个词的类别，不是通过它的含义。

而是它如何被使用？根通常是定义事件的动词。

是的，是的，好的。我的意思是，如果我没有看到动词，那么直到有其他东西出现，才会有动词。

如果你在胡说八道呢？我们谈论的是像正确的语言一样的语言。如果你在诗歌中这样做呢？胡说八道，然后规则被打破了，或者对，然后不是，不，不，不。你……

受到你正在处理的语言的约束，可能是诗歌的其他约束，比如。通常在诗歌中，有很多约束你想要……你通常想要表达多种含义，这是这个想法，也许你也有节奏或韵律结构，这取决于……但是你通常受到你语言规则的大部分约束。

所以你不会过度违反它们。你可以稍微违反它们，但不能太多。所以它必须可以识别为你的语言，比如英语。我不能说“dogs entered room”。

嗯，我的意思是，你知道，“两只狗进了房间”，我不能改变冠词、冠词和名词的顺序，你可以在某些语言中做到这一点。你可以，你可以更多地改变词的顺序。我的意思是，你会说俄语。

俄语的词序比英语自由得多，事实上，你可以随意改变词的顺序。我告诉你英语的主谓宾词序，俄语也是如此。但是俄语比英语自由得多，所以你实际上可以改变词的顺序。所以，俄语诗歌可能与英语诗歌大相径庭，因为词序的约束要小得多。

是的，在过去一百年中，俄罗斯的诗歌文化要广泛得多。我一直想知道为什么是这样。但似乎语言的使用方式更灵活。你对语言的改变更容易，但改变词语，改变词语的顺序，胡说八道。

但是你可以在每种语言中改变不同的东西。所以在俄语中，你有格标记，在名词的结尾，告诉你每个名词是如何连接到正确的。我们在英语中没有这个，所以当我说道“玛丽吻了约翰”时，除了词的顺序，我不知道谁是施事者谁是被动者，对吧？在俄语中，你实际上在结尾处有一个标记。

如果你在每个名字中都使用俄语名字，你也会说，那是施事者，它将是主格，它标记主语，或者宾格将标记宾语。你可以把它们颠倒过来。你可以把宾格放在前面，你可以把主语放在前面，然后是动词，然后是……宾语。

那将是一个完美的、良好的俄语句子。它仍然意味着玛丽吻了约翰。我可以说“约翰吻了玛丽”，意思是玛丽吻了约翰，只要我正确地使用格标记，你就可以在英语中做到这一点，所以……

我喜欢施事者和被动者的术语，以及你使用的其他术语，这些都是语言学术语。

对吗？这些是……这些是关于意义的。这些是意义，主语和宾语通常用于位置。所以主语只是出现在动词之前的那个东西。

宾语是出现在动词之后的东西，施事者就像做事情的东西，这就是它的意思，对吧？主语通常是做动作的人，对吧？那个东西。

是的。好的，这很快。那么，构建一棵树有多难？一般来说，作为我们的程序玩具，如果你看看不同的语言，它应该是一个非常自然的……是自动的吗？还是涉及到一些人类的天才？

因为我认为现在这已经相当自动了。人们可以弄清楚这些词，他们可以弄清楚更多的语素，从技术上讲，更多的语素是语言中意义最小的单位，好的。所以当你说到“吃”或“喝”时，实际上在英语中包含了两个语素，一个是词根，也就是动词。

然后它上面有一些词尾，告诉你这是第三人称。第三人称，我认为语素只是语言中意义最小的单位。然后词语就是我们在英语中用空格隔开的东西，它们稍微复杂一些。它们也有形态学。它们是词尾，这些屈折形态学加在词尾上，加在词根上。

它们改变了单词的一些东西，是的。添加额外的…

意思，是的，是的，是的。所以我们有一点，任何东西都比俄语少得多，例如。但是我们在英语中有一点。

所以我们在名词上有一点，你可以说它是单数还是复数，你也可以对动词做同样的事情，比如过去时。例如，你会注意到在英语中，我们说“喝”，他知道“喝”，但其他人是“喝”，你“喝”，我们“喝”，这是一种不加标记的方式。然后在过去时态中，对所有人来说都是“喝”。

根本没有形态标记过去时。有正字法标记过去时。但它有点…现在是不规则的。

所以我们甚至不知道“喝”变成“喝了”。你知道，它甚至不是一个规则的词。所以在大多数动词中，许多动词中，我们可以添加ED，将“走”变成“走了”。

我们添加它来说明这是过去时，我碰巧选择了一个规则的、高频词。高频词往往是英语中规则的，而规则与不规则的区别在于，规则中有一个规则。所以“喝”到“喝了”是不规则的，“喝”，“喝了”。

好的。

我假设是“走”、“走了”、“谈了”。

英语中有很多不规则之处。

英语中有很多规则，高频词，常用词往往是不规则的，尽管有很多很多低频词，而这些词往往是不规则的。

规则的演变。这很有趣。这基本上是粘性的，因为你打破了规则，然后我们使用它，它不遵循规则。

他们说，打破规则更快。所以他说，更多的语素，很多问题。所以形态学是研究语素的。

形态学是语素与词根之间的联系。所以在英语中，我们主要有后缀。我们在单词后面加词尾，不多，但有一点。与前缀相反，有些单词，取决于你的语言，可以有，主要有前缀，主要有后缀，或者两者都有。然后，甚至还有一些语言有叫做插入词的东西，你有一个词根的某种一般形式，你把它放在中间，你改变了元音。

是的。所以一般来说，每个单词有两个语素，一个或两个或三个。

嗯，在英语中是一个或两个。英语倾向于一个或两个。其他语言可能更多，你知道，像芬兰语这样的语言，它有一个非常复杂的形态学。一个词根后面可能有十个语素，好的。所以可能会有数百万种给定单词的形式，好的，好的。

我会一遍遍地问同样的问题。但是，如何才能像理解语素一样理解一些事情呢？问这个问题很好，这些东西是如何演变的？你有一本很棒的书，关于处理的起源，语言如何用于交流。

所以，语言作为交流的有效性的数学概念，它在语言演变中扮演什么角色，但从高层次来看，语言是如何演变的，英语有两个语素或一到两个语素，而芬兰语是无限的。那么，这是如何发生的？这只是一个…

真是个好问题。是的，这是一个非常好的问题。就像为什么语言会有更多的形态学或更少的形态学？我认为我们不知道这个问题的答案。

我认为有很多很好的解决方案来解决交流问题。所以，我相信，正如你暗示的那样，语言是人类发明的一种系统，用于交流他们的想法。我认为这归结为，我们给想要谈论的东西贴上标签。

这些是语素和词语，这些是我们想谈论世界的东西。我们发明了这些东西。然后，我们以一种对我们来说容易表达和处理的方式将它们组合在一起。

但这就像一个幼稚的…我的意思是，我认为这是正确的。这是幼稚的。

可能是对的。我知道我认为这很简单，很简单。是的，我认为幼稚的现在甚至不是一个指示，某种程度上是微不足道的，太简单了。我认为我可能是对的，但有趣的是，它感觉有多么粘性，两个人走到一起。感觉就像一旦你弄清楚了语言的某些方面，它就会在部落中变得粘性，也许是部落首先形成，然后是语言，然后你就同意坚持任何东西。

我的意思是，这些都是非常有趣的问题。我们真的不知道单词，甚至单词是如何被发明出来的。我们真的不知道…我的意思是，假设它们是被发明的，我们真的不知道这个过程是如何运作的，以及这些东西是如何演变的。

我们所拥有的有点像，嗯，几千种语言的当前图像，几千个实例。我们没有任何关于这些东西是如何真正演变的图像。然后，演变被接触严重混淆了，对吧？所以，一旦一个语言群体，一个群体遇到另一个群体，我们就聪明了。人类很聪明，他们会接受另一个群体中任何有用的东西。所以任何你正在谈论的对比，我认为这很有用，我也会开始使用。

所以我做了一些关于特定领域单词的工作，在数词和颜色词中，在颜色词中，所以在英语中，我们大约有十一个每个人都知道的颜色词，如果你出于某种原因对颜色感兴趣，那就更多了，如果你是一个时装设计师或艺术家，你可能有更多单词，但我们可以看到数百万个，例如，如果你有正常的色觉，正常的色觉，你可以看到数百万种颜色的区别。所以我们没有数百万个术语。最有效率的，不，最详细的颜色词汇表有超过一百万个术语来区分我们能看到的各种颜色。但当然，我们没有。

所以它以某种方式…它对英语来说是有用的，它已经以某种方式进化到十一个术语，人们发现这些术语对谈论有用，你知道，黑色、白色、红色、蓝色、绿色、黄色、紫色、灰色、粉色，我可能还漏掉了什么，反正有十一个每个人都知道的，是的，取决于你的…但不同的文化…特别是那些非工业化文化，它们会少得多，所以有些文化只有两个，我相信新几内亚的达尼人只有两个标签用于颜色，大致是黑色和白色，它们非常暗和非常亮，大致是黑色和白色，你可能会认为哦，他们正在将整个颜色空间划分为明暗或其他什么，这并不完全正确，他们主要只标记明亮的、黑色的和白色的东西。他们只是不谈论其他颜色的东西。然后还有其他群体。

我和一个叫做切米的人群一起工作，他们在玻利维亚的南美洲，他们有三个每个人都知道的词，但还有一些其他的词，很多人知道，所以他们有…取决于你如何计算，在三到七个词之间，这个群体知道，好的，同样，黑色和白色。每个人都知道这些。红色，红色是…这往往是第三个词，每个人…如果有一个词，总是红色是第三个。

然后之后，关于他们带入什么，所有的赌注都取消了。然后他们带入一个大的蓝色绿色空间，绿色。他们有一个。然后他们…然后，你知道，不同的人有不同的词，他们会用…部分空间。所以无论如何，这可能与他们想要开始什么，他们知道什么，他们看到什么有关，因为他们看到的颜色和我们看到的一样。

所以这不像他们…他们没有…他们有一个弱的颜色调色板，他们正在看的东西，他们正在看很多美丽的风景，好的，很多不同颜色的花和树木等等，有很多非常鲜艳的颜色，但他们只是没有在这些情况下标记颜色。原因可能是我们不知道，但我们认为这里可能发生的事情是，你做什么，为什么你给某物贴标签，你需要和别人谈论它。为什么我需要谈论颜色？好吧，如果我有两件相同的东西，我想让你给我不同的那件，而唯一不同的就是颜色，那么我会发明一个词来告诉你，你知道，这就是我想要的那件。

所以我要红色的毛衣，而不是绿色的毛衣，对吧？有两件。直到这些东西是相同的，因为这些是我们制造的东西，它们是染色的，它们之间没有什么不同。

所以在工业化社会中，我们有…你知道，我们拥有的每样东西几乎都是任意着色的。但是你去非工业化群体，情况并非如此。所以他们没有故意…

他们对颜色不感兴趣。你给他们带来鲜艳颜色的东西。他们喜欢它们，就像我们喜欢鲜艳的颜色一样。

它们很漂亮。但是他们不需要…如何谈论它们？

他们没有。所以颜色词可能是一个很好的例子，说明语言是如何从某种功能演变而来的，当你需要交流时，你使用…我认为你发明了不同的变体，并且…基本上你可以想象语言的演变与早期部落所做的事情有关，比如他们…他们面临着什么样的问题，以及他们如何快速有效地交流这些问题的解决方案，无论是什么静态或功能，所有这些东西，远离猛犸象，无论什么。但你知道，所以我认为你指出的问题是，我们没有关于语言演变的数据，因为许多语言很久以前就形成了。所以你得不到聊天记录。

我们对古英语到现代英语有一些了解，因为有一个书写系统，我们可以看到古英语是什么样的。所以，例如，词序在古英语到中古英语到现代英语中发生了变化。所以，你知道，我们可以看到这样的事情。

但是大多数语言甚至没有书写系统。所以在这七千种语言中，只有一小部分有书写系统。即使它们有书写系统，它也不是一个非常现代的书写系统，所以我们没有。

所以我们基本上只有…对于汉语，我们有很多证据，很长时间以来，对于英语也是如此，而对于其他很多东西则没有，德语有一点，但对于很多长期…语言演变，我们没有很多。我们只有快照，我们有一个当前的…

语言，你从快速的交流和某些平台上得到一个快照。我可以读到它。不同的社区，他们会想出不同的游戏，通常从我的角度来看，有点幽默，或者可能是嘲讽，无论是什么，你知道，只是用不同的方式说废话。

你可以在那里看到语言的演变，因为…我认为互联网上的很多东西你不想成为无聊的主流。所以你想偏离正确的说话方式。所以你会得到很多偏差，比如一个社区碰撞的快速偏差。你会得到，就像，嗯，正如一位好朋友所说，人类会适应它，你可以把它看作一种幽默。我的意思是，这是一个非常困难的研究，但你可以想象，一百年后，如果有一种新的语言诞生，例如，我们将获得非常高质量的数据。

我的意思是英语在不断变化，所有语言都在不断变化。所以你知道，这是一个著名的…结果。但是女王的英语。所以，如果你看看女王的价值观，女王的英语最初应该是说话的正确方式，然而，它是由女王或国王，无论谁掌权，来定义的。

所以，如果你看看她，她的声音从1952年或1953年她第一次成为女王时，到现在的五十年后，她的声音变化很大。所以即使在英国英语的声音中，她说话的方式也在改变。元音在轻微地变化。

所以，这只是声音上的变化。我不知道我感兴趣的是什么。我们都对是什么驱动了这些变化感兴趣。英语的世界秩序在几千年里发生了很大的变化，对吧？所以它曾经看起来像德语，它曾经是一种带格标记的非常屈折的语言，它转变为一种分析语言，通过接触。所以我们与法语的接触，它变成了呃，一种没有格标记的分析语言，所以它变成了这种动词词尾的东西，所以，这就是它完全进化的方式，所以它可能非常，我的意思是，你知道，在二十年内可能不会涉及太多，这可能是你正在谈论的。但是超过五十年和一百年，事情会发生很大的变化。

我认为现在会有好的数据。

哪些好的数据？

你能谈谈吗？什么是句法，什么是语法？你写过一本关于句法的书。

是的。你之前问我，你知道，我怎么才能弄清楚依赖结构是什么？我会说依赖结构通常并不难确定。

我认为对于大多数语言中的几乎任何句子，人们对它们是什么有很多共识。我认为人们在很多方面都达成了共识。混合中还有其他参数，以至于有些人认为语法比仅仅是依赖结构要复杂得多。

就像，不，他是历史上最著名的语言学家，他因提出略微复杂的句法而闻名。所以他发明了短语结构语法。所以他，嗯，以许多事情而闻名。

但在五十年代和六十年代初期，也就是五十年代后期，他基本上是在研究所谓的形式语言理论。所以他找到了一种框架来弄清楚某种类型的语言，即所谓的短语结构语法，可能有多复杂。所以他的想法是，也许我们可以，我们可以通过规则的复杂程度来考虑语言的复杂程度。

好的。规则看起来像这样。它们会有一个左边，也会有一个右边。

左边的东西会对应右边的东西。比如说，我们从一个S开始，它就像根，它是一个句子。好吗？

然后我们将扩展这些东西，呃，比如名词短语和动词短语，这是他会说的，例如。好吗？S变成一个NP和一个VP，这是一种短语结构规则。然后，我们弄清楚NP是什么，NP，它是一个限定词和一个名词，例如，而动词短语是其他的东西，是一个动词，和另一个短语，和另一个短语，例如。这些是一个非常简单的短语结构的规则。

好吗？所以他提出了短语结构语法作为一种涵盖人类语言的方式，然后他实际上发现，好吧，根据这些语法的形式化，你可能会得到更复杂或更不复杂的语言，所以他说，好吧，这些被称为呃，上下文无关语言，他得到的规则，没有人类语言倾向于他所谓的上下文无关语言，呃，但是有一些类似的语言，它们被称为正则语言，它们的规则，即这些特定规则的短语结构，形式更受约束。所以他基本上发现了并发明了描述语言的方法，而这些是，这些是人类语言的短语结构。他最初主要对英语感兴趣，他在五十年代的工作。

所以围绕这一切有很多很酷的问题。所以形式语言理论是一个专门正式研究语言形式的巨大领域。是的。

它不必是人类语言，他们会有计算机语言，任何一种系统，它会生成呃，呃，呃，一些呃，语言中的表达式。这些可能就像呃，计算机语言中的语句，例如。所以形式语言理论的工作可以是人类语言。

所以你可以学习编程。

是的，编程语言被大量地使用这种形式化方法研究。形式语言理论中有一个关于编程语言的巨大领域。

好的，那么短语结构语法就是这个想法，它可以将语言分解成这种S、NP、VP之类的东西。

这是一种描述语言的特定形式化方法，好的，所以乔姆斯基，他是第一个。他在五十年代就弄清楚了这些东西，但这实际上等同于，上下文无关文法实际上在某种意义上是等同的，因为它生成的句子与依赖语法生成的句子相同。

依赖语法在某些方面更简单一些。你只需要一个根，它就像我们没有这些。规则是隐含的。我想我们只是在单词之间建立联系。短语结构语法，这是一种不同的思考依赖语法的思维方式吗？所以它稍微复杂一些，但在某些方面它有点相似。

所以为了澄清，依赖语法是你看待语言的框架。你认为这是……

一种好方法……

来处理语言，乔姆斯基现在非常生气。所以它有点……但是，嗯，有什么区别？短语结构语法和依赖语法之间的分歧点在哪里？它们非常接近。

所以短语结构语法和依赖语法并没有那么大的区别。我喜欢依赖语法，因为它更简洁。它在表示单词之间的联系方面更透明。

在短语结构语法中，乔姆斯基偏离的地方有点难以看出，他认为存在呃，所谓的移动，好的。所以，这就是我们不同意的地方。好的，这就是我认为我们不同意的地方，我的意思是，也许我们稍后会讨论到这一点。

但是，这个想法是，你想让我解释一下吗？我想解释一下移动，你认为，好的，所以移动是乔姆斯基，他基本上看到了英语，他说，好的，我说，所以我们之前有那个句子，比如，他就像，两只狗进入房间，稍微改一下，说两只狗将进入房间，他注意到，嘿，英语，如果我想问一个问题，我只是从同一个句子中问一个问题。

我说，不是两只狗将进入房间，我说，两只狗将进入房间吗？好的，这是一种不同的说法，表达同样的意思，它就像，好吧，那个will的出现，它在前面，而不是在中间。好的。

所以，如果他看看英语，你会发现对于所有这些情态动词和其他类型的助动词来说，英语都是这样。你总是这样做。你总是把助动词放在前面。当他看到这一点时，所以现在我说，嗯，我可以赢这个赌注。

我可以赢这个赌注吗？对吧？所以我把can放在前面。所以我看到这是一个理论。我刚刚给你提供了一个理论。他称之为移动，那个词从陈述句变成疑问句，根是陈述句，这是思考句子的默认方式，你把助动词移动到前面。

这是一个移动理论，好的，他说，这太明显了，以至于没有什么更多可说的了，这就是英语助动词的工作方式。有一个移动规则，这样你就可以从陈述句到疑问句，你把助动词移动到前面。当涉及到一般现在时和一般过去时时，它会更复杂一些，因为如果我说，你知道，约翰睡着了，你必须说，约翰睡着了吗？而不是睡着了约翰，对吧？

所以你必须以某种方式得到一个助动词。我想，从根本上说，它就像睡着了，它比这更复杂一些，但他的想法是存在移动。好的。

所以另一种思考方式，这不是，我的意思是，后来他最终证明了这一点。所以他提出了一个有移动的语法理论。他认为还有其他地方存在移动，不仅仅是助动词，还包括像英语的过去时和呃，疑问词疑问句，他认为这些地方也存在移动。

在所有这些情况下，他认为单词或短语从一个结构移动到另一个结构，你称之为深层结构到表层结构。我的意思是，在他的理论中，有两个不同的结构，好的，呃，有一种不同的思考方式，那就是根本没有移动。有一个词典复制规则，这样will或can，这些助动词……

它们只有两种形式，一种是陈述句形式，一种是疑问句形式。你基本上有陈述句形式。哦，我形成疑问句，或者我可以从一个形式形成另一个形式，这取决于你走哪个方向。

而我只有一个新的词条，它具有相同的含义，但具有略微不同的论元结构。论元结构是依赖语法中对词序的称呼。所以如果我说，狗，两只狗可以或将进入房间，will有两个形式。

一个是陈述句形式的will，然后，好的，在这个形式中，我的主语在我的左边，它在我之前，动词在我之后。然后疑问句形式的will就像，哦，我先来，疑问句形式的will在前面，然后我的主语紧跟其后，然后是动词。所以你只需要，你可以从一个词生成另一个词，它具有略微不同的论元结构，不同的词序。

而这只是词典复制，不一定是移动。有一种浪漫的观念，认为你有一种使用一个词的主要方式，然后你可以随意移动它，这基本上就是……

移动。词典复制与此类似。所以对于同样的想法，词典复制可能是陈述句是来源，然后我们可以复制它。所以词典复制故事的优势有很多，这不是我的故事。这就像，呃，伊万·萨波，很多语言学家也提出了这些故事，你知道，与移动故事相反。

好吗？不，他已经去世一段时间了，但他是非移动或词典复制故事的支持者之一，所以，呃，一个很大的优势是，乔姆斯基在1971年非常著名地证明了移动故事会导致可学习性问题，它会导致，它会导致语言学习的问题。如果既有短语结构又有移动，那么弄清楚语言的底层结构真的非常困难，可能性太多了，如果你没有这个问题，学习问题……

会容易得多。只是有复制。我们说学习问题。你的意思是人类学习一门外语？

是的，只是学习。所以婴儿躺在婴儿床里，听着我说话，他们是如何学习英语的，或者你知道，也许是一个两岁的孩子正在学习疑问句，那么他们是怎么做到的？他们是从……比如，乔姆斯基说，这不可能弄清楚。实际上他说这是不可能的，不是很难，而是不可能的。因此，这就是普遍语法从何而来的，因为他必须是内建的。

所以他们正在学习的是，呃，在他的故事中，一些内建的移动是语言模块的绝对一部分，然后你，你只是在设置参数，你根据英语说，这只是普遍语法的变体，你正在弄清楚，哦，英语是按照什么顺序做这些事情的，非移动故事没有这个，它更自下而上。你一个接一个地学习规则。

哦，这个词与那个词相连，这是一个巨大的进步。另一个优势是可学习性。它的另一个优势是它预测并非所有助动词都会移动，这可能取决于单词，这取决于你是否……事实证明这是真的。

所以有些词，呃，它们并不真正像助动词那样工作。它们在陈述句中起作用，而不是在疑问句中。所以我可以说，呃，我会先给你办公室，如果我可以说阿鲁纳被邀请参加派对。好的。而这是一个疑问句形式，但它不是我没有被邀请参加派对，没有我没有，对吧？

所以这是一个只有疑问句的形式，然后我们也有像呃，我应该做这个，我想一些英国老式英语的人可以说，这对我来说听起来很荒谬，我甚至不认为odd是伟大的。但我的意思是，我完全认识到，我想做这个想法。

还不错。我可以说我必须做这个。这听起来……

真的很好，是的。

我不知道。它听起来完全……无论如何，所以这里有变体，如果所有这些词只在一个中起作用，而不是在另一个中起作用，那么在词典复制故事中，这就像，好吧，你只是学习用法。无论用法是什么，就是你对这个词的用法。但是，呃，在移动故事中，它有点困难，移动故事就像……我认为词典复制的一个优势在于所有这些不同的位置。所有这些用法变体使得移动故事有点难以处理。

所以主要区别之一是移动故事，最后一个故事，我回到短语结构语法与依赖语法。

从某种意义上说，存在等价物，因为对于任何依存语法，我都可以生成一个相应的自由结构语法，它生成完全相同的句子。我只是，我只是喜欢依存语法形式化，因为它使某些东西真正清晰，那就是词语之间依存关系的长度，这在自由结构中并不那么明显。它只是很难看出它在那里。它只是非常，非常……

呃，从技术上讲，我认为自由结构语法可以映射到依存语法，或者……是的，但是就像这样，比如这些小标签，S、M、P、VP，是的。

对于特定的依存语法，你可以创建一个自由结构语法，它生成完全相同的句子，反之亦然。但是有很多自由结构语法你无法真正创建一个依存语法。我的意思是，你可以用自由结构语法做更多的事情，你会得到更多这些额外的节点。基本上，你可以有更多的结构。有些人喜欢这样，也许这其中有价值，有些人不喜欢。

好吧，对你来说。所以我们应该澄清一下。所以依存语法，就是一个词只依赖于一个词。然后你形成这些树，是的，这使得它真正优先考虑这些依赖关系，就像一棵树，你可以测量一个词到另一个词的依赖距离。

然后它们可以映射到句子的认知处理过程，以及理解的难易程度等等。所以它只是将重点放在词语之间依赖的数学距离上。所以这给了你不同的关注点。

绝对的。让我们继续乔西的思路，因为它真的很有趣，因为它，正如你所讨论的，存在分歧，但程度不同，而且你在语言研究史上也看到了这一点，这真的很棒。所以图像上下文反转规则。这种区别对自由结构语法有影响吗？

一点也没有。我的意思是，正则语言对于人类语言来说太简单了。它们是层次结构的一部分。

但是人类语言，在自由结构世界中，至少是上下文无关的。也许比这稍微复杂一点。但是，也有一些叫做上下文相关的。

你可以这样，这不仅仅是上下文无关语法的形式语言描述。你有一个……这就像一堆形式语言……

我们在这里做的事情。我喜欢它。好的。所以你有一个左边的类别，你扩展的任何东西都在右边，这是一个……这是一个上下文无关的。

所以，这个想法是，左边的类别独立于上下文扩展到右边的那些东西，无论它们是什么，都没关系。而上下文相关的则说，好吧，我的左边实际上不止一个东西。我可以告诉你，只有在这个上下文中，也许你左边有上下文，或者只有左边上下文，或者右边上下文。

我左边有两个或更多东西，告诉你如何以这种方式扩展那些东西。好吗？所以它是上下文相关的。

正则语言只是更受约束。所以它，它不允许右边有任何东西。它允许非常……它访问……它是一个非常复杂的规则，这是一种……正则语言是什么，所以它没有任何……比如说长距离依赖，它不允许递归，例如，没有递归，递归是……人类语言有递归，它们有中心嵌入，你可以……好吧，它不保证中心嵌入，递归是人类语言所具有的……

中心嵌入在某种意义上是递归的……

我们会谈到这一点，但是现在形式语言的东西有点偏离主题了，乔姆斯基甚至没有为人类语言提出它，他只是指出人类语言是上下文无关的。然后他最关注的是人类语言，因为那是他为形式语言所做的事情。而他最感兴趣的是人类语言。

这就像运动，我们，我们，我们……他所说的出发点，我认为非常有趣，但方向错了，这是一种有趣……我同意，这是一个非常有趣的历史。所以他提出了这个转换生成理论，在57年和65年，它们都有这个框架，即自由结构加上转换，自由结构的不同版本。而57年的转换是乔姆斯基著名作品的最初部分。

然后到了71年，他发现这些会导致学习问题，即存在一些情况，孩子永远无法弄清楚哪个规则，哪组规则是预期的。所以，然后他说，这意味着它是先天性的。这很有趣。

他真的认为转换是如此明显正确，以至于他甚至没有考虑放弃它。这显然是正确的。后来人们发现，有很多简单的方法可以解释看起来像是泛化的东西，其实并不是泛化。

它们跨越类别，它们是特定于单词的，并且有效，但它们不适用于该类别中的其他各种单词。所以更容易将这些东西视为词汇习惯。我认为他非常痴迷于此。

我不知道。我猜想他只是，他真的希望这个故事在某种意义上很简单，而语言在某种意义上更复杂一些。所以他不喜欢词语……他从不谈论他喜欢的词语，关于词语和词语的组合。

查一下字典。一个常用词有50种含义，对吧？“take”这个词有30或40种含义。

所以，所以常用词有很多不同的含义。而他根本不考虑这一点，或者不认为这是语言。我认为他不认为这是语言。他认为词语与词语的组合是不同的。我认为也是如此。如果你看看我的大脑在扫描仪里的情况，当我听懂一种语言时，你比较一下，我可以在几分钟，比如15分钟内定位我的语言网络。

我听语言的地方在哪里？我知道我听，你知道，也许是我不了解的某种语言，或者我听模糊不清的语音，或者我读我读的句子，非词语，就像我做这样的事情一样，任何类似英语的东西，以及任何不太像英语的东西。所以我得到了类似的东西和非类似的东西，我得到了控制和盒子，只是，你知道，我大脑中反应最强烈的是语言区域，这是我头部左侧的侧化区域。

无论我在那个网络中寻找什么，如果你寻找组合与单词，它无处不在。所以很难找到。据我们所知，没有……我的意思是，现在这么说有点夸张。

这项技术并不完美，不算差，但我们最好的，最好的方法来弄清楚当我听、读语言时我的大脑里发生了什么，就是使用fMRI，功能性磁共振成像。这是一个非常好的定位方法。所以我可以找出这些信号的确切来源。

非常精确，精确到毫米。立方毫米更小，好吧，非常小。我们可以很好地确定。

问题是，当……好吧，呃，它测量……氧气，好吧，氧气到达那些细胞需要一段时间，大约几秒钟。所以我说话很快，我可能听得很快，我可能能很快地思考事情。所以很多事情都在两秒钟内发生。

所以说我们知道现在网络中词语的情况，我们最好的猜测是，整个网络都在做类似的事情，但也许网络的不同部分在做不同的事情。而这很可能是事实。我们只是目前还没有好的方法来弄清楚这一点。

既然我们谈到了语言研究的历史，还有什么其他有趣的争议，你在MIT……或者长期以来，有什么有趣的争议，想法上的冲突，在……你知道，乔姆斯基之间。我们应该说，乔姆斯基在语言学系，而你，我想，一段时间以来你也在那里，但主要是在脑与认知科学系。这是研究语言的另一种方式，你一直在谈论fMRI，所以……还有什么有趣的事情可以带到表面，关于访谈者或其他人在……

是的，我的意思是，我已经在MIT待了31年，从1993年开始，而乔姆斯基待的时间更长。所以我，我认识他。我认识他。我第一次到那里的时候就认识他了，我想。

而且我们会偶尔互动，我会说……所以我会说我们最大的区别在于我们的方法。所以……我和乔姆斯基之间最大的区别在于，我从人们那里收集数据，我用人们做实验，我收集语料库数据，任何可用的语料库数据。我们使用定量方法来评估我们所做的任何假设。他根本不做这些。

所以，你知道，乔姆斯基从未参与过任何实验或语料库工作，所以这都是思想实验。这是他自己的直觉。所以我只是不认为这是正确的方法。呃，这是一个……你知道，街对面的，这是一种脑与认知科学与语言学之间的区别。所以，我的意思是，并非所有……取决于你做什么，更偏向语音的，他们会做更多定量的东西，但在词义和词汇方面，是词语的组合和句法。所以他们往往不做实验和……和语料库研究。

所有这些都可能很好。但信息是更大方法的症状，这是一种心理学哲学。而对你来说，它更像是数据驱动的。所以几乎是一种数学方法，是的，我的意思是……

我是一个心理学家，所以我会说我们在心理学领域，我的意思是，在脑与认知科学领域，它以前是我的心理学系。它一直是心理学系，直到1985年，然后它变成了脑与认知科学系。所以，我的意思是，我的训练是在心理学方面。我，还有计算机科学，但我是一个心理学家。我的意思是，我……

我的意思是，我知道我是谁，心理学家。是的，是的。

你是，而我是，但我，但我被称为语言学家。我必须被称为计算机科学家。我必须被称为任何这些东西。

但在实际中，我称之为，它在方法论之外表现出来，就像这些差异，关于转换存储与词汇复制故事的差异。

是的，这些是理论，对吧？所以，像……理论是……但我认为我们之所以有所不同，部分原因是我们评估理论的方式。所以我用定量的方法评估理论，而他则没有。

好的，让我们，让我们探讨一下你在书中支持的理论。让我们回到这种看待语言的依存语法框架。什么是……一个好的理由？为什么依存语法框架是解释语言的好方法？你的直觉是什么？

正如我之前所说，我喜欢依存语法的理由是，它对词语之间距离的表示非常透明。

所以它就像……它就是……你有一堆词，你把它们连接在一起构成一个句子，而一个真正有见地的观点，事实证明这是正确的，那就是，你连接的两个词越远，产生就越难，理解就越难。产生越难？当词语相距较远时，理解也越难。

当它们靠得很近时，产生很容易，理解也很容易。让我举个例子。好吗？所以在任何语言中，我们词语之间大多是局部连接，但它们是抽象的。词语类别之间的连接是抽象的。

所以如果你添加修饰语，例如在名词之后，你总是可以使它们相距更远，所以英语中的名词在动词之前，主语在动词之前。然后例如，宾语在后面。所以我可以说，我说的，四年前的狗进了房间，或者类似的东西。所以我可以修饰“狗”。如果我在它后面说更多关于狗的事情，那么我所做的是间接地延长了依赖关系，通过添加更多东西来延长“狗”和“进入”之间的依赖关系，所以……如果我说，“那个被猫抓伤的男孩哭了”，我们这里有一个“猫”，然后……然后我这里有的是，“男孩哭了”，这是一个非常短、简单的句子，我只是告诉你一些关于男孩的事情，我说他被猫抓伤了。

好的，所以“哭”连接到最后的“男孩”，连接到开头的“男孩”。

对吧？所以我可以这样做。我可以说这是一个完全正确的英语句子。我可以说，“那只被狗追赶的猫跑掉了”，或者类似的东西。好的，我可以这样做，但这真的，真的很困难。

现在我……无论如何，那个被猫……我试图修饰“猫”，好的。“那个被狗追赶的猫抓伤的男孩跑掉了”。哦，天哪，这很难，对吧？我可以……

很抱歉，我正在思考如何表达，以及如何……要理解它相当困难，至少我表达了边界，但这真的很复杂，有点像英语，我的意思是它遵循英语的规则，但是，有趣的是，我正在做的是嵌套从属关系，把一个……我有一个主语连接到一个动词，然后我用一个从句来修饰它，另一个从句，它碰巧也有一个主语和一个动词。我试图在第二个从句上再次这样做。这样做的结果是延长了依赖关系，实际上是多重依赖关系被延长了。

依赖关系变得更长，外部的依赖关系变得更长，甚至内部的依赖关系也变得很长，所以，令人着迷的是，这很糟糕。这在英语中非常糟糕，但在任何语言中都很糟糕。所以，无论你考察哪种语言，如果你设计某种结构，其中我会有一些修饰语跟在某个中心词后面，这个中心词又连接到另一个后面的中心词，我再做一次，它不会好，我保证，百分之百地保证，它在那门语言中将无法理解。

就像之前无法理解的那样，当那个男孩哭的时候，嗯，两个词之间存在依赖关系，然后你数一下它们之间有多少个词。

这是一个好问题。我只是说词。你的意思是它们之间的词。

我们实际上不知道，这是一个非常好的问题。距离度量是什么？但让我们假设是词，你是……

说依赖关系越长，就越……无论哪种语言，即使……好吧，让我们谈谈……好吧，嗯，但是人们会非常生气，说他们的语言不是生气，而是他们要么不理解，要么会像这样，他们的脑子会超负荷运转，是的，他们会很难表达或理解。

他们可能会告诉你这不是他们的语言，你知道，这有点像语言，并且遵循……不同意这些部分作为语言的一部分。但不知何故，这种组合将非常非常难以表达和理解。

这是一个先有鸡还是先有蛋的问题吗？所以，我给你解释。

所以，我的意思是，我给你两种解释。我告诉你中心嵌入，它是嵌套。它们是同一个概念。

它们是同一个概念的同义词。而对这些的解释总是很难，中心嵌入和嵌套总是很难。我给你解释了为什么它们可能很难，那就是长距离连接。

当你进行中心嵌入时，你总是会在依赖关系之间有长距离连接。所以，这并不一定是正确的解释。我可以解释为什么这可能是一个好的解释，而不仅仅是其中一个。

所以，可能是一对，或者是一些依赖关系变得很长，导致我们真的感到困惑。那么，行为结果是什么呢？我的意思是，这是一种方法，我们如何才能做到这一点？你可以尝试做实验，让人们表达这些东西。

他们会很难表达出来。你可以尝试做实验来让他们理解这些东西，看看他们理解得有多好。他们能理解吗？另一种方法是给人们提供部分材料，并要求他们完成。

知道那些嵌入的材料，他们会失败。我做过这些。

各种各样的东西，我的意思是。所以，中心嵌入，意思是，你取一个正常的句子“男孩哭了”，并在中间插入一些东西，把“男孩”和“哭了”分开，好吧，中心嵌入和嵌套……

是同一回事。嵌套是同一回事。中心嵌入是一个完全等价的术语。

所以，你说的，有很多不同类型的实验可以做。我的意思是，我喜欢理解的一种方法是，更多的嵌入，更多的中心嵌入，是否更容易……并测量杠杆？

理解，有很多漂亮的方法可以做到这一点。我的意思是，最简单的方法是问人们，声音好不好？听起来自然吗？这是一个非常粗略但非常好的衡量标准。

非常非常可靠。人们会做同样的事情。所以，我不知道那到底是什么意思，但它正在做一些事情，这样我们就可以测量一些关于困惑……

以及相关的困难。而这些，就像这些，正在发出信号，为什么你可以说……什么……完成……

中心嵌入，如果你给他们一个部分句子，我说，嗯，“这本书，作者……”，然后我让你完成它，我的意思是，你可以说，是的，是的，但你可以说它写在你的面前，你可以输入尽可能多的打印时间。即使那一次不太难，对吧？所以，如果我说，就像“这本书，作者……”，我说，“这本书，我遇到的作者写的书很好”，你知道，这是一个非常简单的完成。

如果我在某个在线平台上给出一个完成，给一个众包平台，让人们完成它，他们会以非常非常规律的频率错过它，也许是三分之二的时间。他们会说，他们会忽略其中一个短语，即使是这么简单的……所以，我说，“这本书，作者……”，它会说，“嗯，是……”，你需要三个动词，所以我需要三个动词，或者“我遇到的作者写的书很好”，他们会给我……你会说。“谁……谁很有名，很好”，或者类似的东西，不要只给我两个。

这种情况会发生大约百分之六十的时间。所以百分之四十，也许百分之三十，你会正确地做，正确地意思是，他们会用三个动词做。是的，我不知道什么是正确的，不知道这很难。这是一个很难的测试。

是的，我实际上在我的脑子里挣扎。

是的。好吧。

它更容易列出。如果你看看……

稍微容易一些，然后列出就相当困难了，因为没有它的痕迹。你必须记住我说的话，这很难记住。我们不会这样做。

把它写下来。你可以看看它，然后把它弄清楚，更容易。在某些方面有很多维度，取决于人。

更容易收集书面数据。我的意思是，几乎所有我做的工作，语言心理学等等。所以，我们的很多工作都是基于书面材料，因为收集数据很容易。人们做各种任务，口语测试只是更复杂，因为人们说话时会做奇怪的事情，很难分析他们做了什么。但是，他们……他们通常指向相同的事情。

好的，所以语言的普遍理论，是的，由埃德·吉布森提出，是你可以形成依赖关系。你可以从任何句子中形成树。你可以用某种方式测量这些依赖关系的距离。然后你可以说，大多数语言都有非常短的依赖关系。所有语言。

所有语言，所有语言都有短的依赖关系。你实际上可以测量它。所以，我的一位研究生，这个家伙在加州大学欧文分校，理查德·费尔特里亚尔几年前做了一件事，他考察了所有我们可以考察的语言，最初大约是四十种。

现在我认为大约有六十种语言有依赖结构，就像你一样。所以，这意味着将会有一个大的文本，一堆文本，这些文本已经被解析成依赖结构，大约有六十个这样的文本已经被这样解析了。对于所有这些，嗯，他所做的是取这些语言中的任何一个句子，嗯，你可以做一个依赖结构，然后开始路线，我们正在谈论依赖结构。

这现在很容易了，它试图找出一种控制方式，你可以说同一个句子是用那种语言说的。所以我们只是说，好吧，有一个根，我说一个句子，嗯，我们回到，你知道，两只狗进了房间，进入是根，进入有两个依赖关系，狗和房间，好吗？他所做的是像这样，这种顺序，有三件事，根和中心词和两个依赖词，只是随机的，只是随机的，然后对所有依赖词都这样做。所以现在看看，对两只狗和房间都这样做，现在这并不是一个很长的句子。

当句子变长，你有了更多的依赖关系，就会有更多的可能的改组。当他发现什么时，所以，这是一个，你可以为那个句子找到一个改组。每个句子在每个语料库中有一百种。

在这些文本中的每一个，每个语料库。然后他比较了这些随机改组中的依赖长度与实际发生的情况。英语、法语或德语的，或者中文，或者大约八十九种，不，六十种语言。

好的。依赖长度在真实语言中总是比这种控制短，还有另一种他使用的控制更严格一些。所以，我描述它的方式，你可以有交叉依赖，通过这种方式改组，你可以以任何方式改组。

语言不会那样做。它们不能太多地交叉依赖，就像铅笔结构一样，它们倾向于保持事物不交叉，就像你知道的，他们有一个技术术语叫做投影，但这只是非循环的，这就是投影。所以，如果你只限制改组，这样它只给你投影的、非交叉的，那么同样的结论仍然成立，所以，人类语言仍然比这种控制短得多。

所以，他的意思是，在每种语言中，我们试图把东西放在靠近……这种控制，它与词无关，有些是动词后置的，有些是动词中置的，像英语，有些甚至是动词前置的。世界上有一些语言是VSO语序，动词-主语-宾语。语言没有谈论那些，百分之十。甚至……

在那些语言中，依赖关系仍然很短。

短的依赖关系是规则。

好的，那么，为什么语言会这样进化呢？这是一个可能的解释，你可能会有一个查理。所以，你从信息论的角度来考虑语言的进化，是的。对于你来说，语言的目的是为了方便交流，对吧？

在处理中，对吧？所以，这里的故事只是关于交流。它只是关于表达，真的。它是关于容易表达的……

故事我们说表达。

哦，对不起。每种语言的表达对我来说更容易，当我说话的时候，无论我什么时候和你说话。所以，不知何故，我在脑子里形成了一些想法，然后把这些词组合在一起。

对我来说，这样做更容易，说一些词紧密相连、相互依赖的东西，而不是分开，比如一遍又一遍地把一些东西放在中间。对我来说，很难把这些东西记在脑子里。这就是整个故事。

就像这个故事基本上是，我喜欢依赖语法服务器给你这个，就像长长的依赖关系不好。它就像容易的。你记住它，因为你可能需要记住它来表达，知道，可能也适用于理解。

也适用于理解。

但我猜这可能是为了表达，表达。也就是说，对我来说更容易说，最终对你来说也更容易，这很难区分。这个想法是谁为谁服务的，是为我，说话者，还是为你，听者？我的意思是，我的语言的一部分是为了你，就像我与你交谈的方式将与我与不同的人交谈的方式不同。

我肯定在调整我说的话给谁听，对吧？这不像我对每个人都用同样的方式说话。所以我对我的听众很敏感，但这如何……你知道，在依赖关系的差异中发挥作用？我不知道。也许这只是关于词语的部分……

你知道，我选择的词，我的初步直觉是，你为听众优化语言，是的，但这只是让我头脑混乱，要说一些优化可能是，并且可能是主要的优化目标可能是表达的容易程度。

不同的句子。我想我非常自私，我不喜欢……我不认为它完全是关于我的。我只是觉得这对我来说更容易。

我不想……我的意思是，但我当然会选择我认为你会知道的词。如果我要修复它，我不会选择你不知道的词。所以，但是也许对于语法，对于组合来说，这只是关于我的。我觉得是……我不……

知道，但是，交流的目的就是被理解，是为了说服别人。所以，像自私的事情……

被理解，关于生活，好吧。

对吧？我的意思是，像容易表达。

我怎么才能被理解呢？我不……

认为……

它是循环的。所以，我认为……

我认为主要目标是让听者理解，因为否则，如果你为了容易表达而优化，那么你……你不会有任何语言的有趣复杂性，就像你试图……

控制它是什么。我想说的是，让我们控制一下……信息……控制一下信息……

信息需要被理解。

那就是要做到……但这指的是意义，所以我仍在讨论形式，只是意义的形式。我如何构建意义的形式，这就是我一直在讨论的。我认为你谈论的是更难的事情，比如试图改变我。我不能……让我们保持意义不变。

就像你必须保持意义不变。我该如何表达我需要说的内容？就像我必须选择合适的词语和正确的顺序，这样对我来说就很容易了。我认为是这样的。

可能是我仍然在我的脑海中将意义和形式联系在一起。但你说的是，如果你保持你所说内容的意义不变，因为这就是优化目标，是的，它可能是生产的主要目标，这种优化是为了生产。这很有趣。我很难保持意义不变，这太……我太依赖人类语言了，所以对我来说，意义的形式是紧密联系在一起的，因为我是一个人，就像对我来说，当我说话时，我从未以严格的方式思考过语言的形式。

无论如何，对于任何事件，都有无限的……我不想说无限的，但有某种更好的说法……我可以沟通同一个事件。这两条狗进了房间。

我可以有很多不同的说法。我可以说，“嘿，有两条狗。它们进了房间。”“嘿，房间里进来了什么东西。进来的东西是两条狗。”

我的意思是，我的意思是，这有点笨拙，但这些都是类似的信息，只是形式不同。我可能会用不同的方式来表达，当然，我总是使用相同的词语。我可以把狗称为，你知道，一只斗牛犬和一只贵宾犬，或者其他什么。

我可以对它们是什么更具体或更不具体。我可以对数量更抽象一些……所以我想保持意义不变，这个事件是恒定的，然后我该如何描述它才能……这取决于你需要知道什么，对吧？以及我认为你需要知道什么，但我好像让这个控制了所有这些东西，而不是……我只是在选择，但我做的事情比你做的简单，你做的只是形式。是的。

比如，指定犬种，狗的品种，以及它是否可爱，这是否改变了意义……可能是的。

是的，那会改变……那肯定会改变意义。

对吧？你只是……那就是……

改变意义。但即使我们保持不变，我们仍然可以讨论对我来说什么更容易，对吧？听众……我使用的自由结构，哪些组合……

这太迷人了，就像……一个真正强大的窗口，可以窥探人类语言。但我仍然想知道，在意义和形式之间，差距有多大。我只是……我只是有一种也许是浪漫化的想法，认为它们是紧密联系在一起的，它们是齐头并进地发展的，你可以简单地优化其中一个，而不需要另一个参与其中。就像形式是冰山一角，典型的冰山一角，其余的意义是冰山。你不能……

但我认为这就是大型语言模型如此成功的原因，因为它们擅长形式，形式在某种意义上是困难的，而意义仍然很困难。这就是为什么它们……它们不明白它们在说什么……我们稍后再讨论这个，但就像我们可以区分……忘记大型语言模型，就像人类一样，也许我们稍后再讨论这个。

二是语言作为一种沟通系统和思维作为意义之间的区别。语言是一种沟通意义的系统。它不是意义本身。这就是我的意思。有很多有趣的证据我们可以讨论，这与之相关。

好吧，我的意思是，这是一个非常有趣的问题。什么是……什么是语言的书写、沟通与思维的区别？什么是它们之间的区别？

好吧，你或任何人可以想到一项他们认为是良好思维任务的任务。有很多很多任务应该算是良好的思维任务。无论这些任务是什么，比如说，下国际象棋或玩某种游戏或做一些复杂的谜题，这都是良好的思维任务。

呃，也许……也许记住一些数字，那是思考。记住……很多不同的任务，你可能会认为，仅仅是听音乐就是思考，或者有很多不同的任务，我们可能会认为是思考。我系里的一位女性，她是联邦……她在这方面做了很多工作，关于语言和思维之间的联系……所以她使用……我之前提到过……

如果我……那是她的主要方法。所以她一直对这个问题非常着迷，关于语言是什么……所以，正如我提到的，你可以在一两分钟内定位我的语言，你的语言，好吧，大约十五分钟。

我可以听语言，听非语言，或者听反向语音，或者其他什么。我们会发现……大脑左侧的网络，它对语言非常敏感，而不是……控制……好吧。

可以专门由语言来……沟通语言……

就像句子。你知道，我正在听英语……任何类型的……故事，或者阅读句子，任何我能理解的东西。如果我能理解它，那么我会激活我的语言网络。所以现在，当我说话和听你说话时，我的语言网络正在疯狂运转，因为我们都在……

沟通，那是……

相当稳定，是的，它非常稳定。所以我……我不得不……玛丽是第三个……所以自从2007年或2006年左右，我就被她扫描了一遍又一遍。

所以我的语言网络在一个月前和我2000年的时候完全一样。它令人惊奇地稳定，令人惊叹……这是一个非常酷的事情。所以我的语言网络就像我的脸，好吗？它不会随着时间的推移而改变太多……

随着时间的推移，在……你从婴儿长到成人的过程中，它什么时候稳定下来？我们不知道。

这是一个非常困难的问题。他们现在正在研究这个问题，因为扫描……孩子们……试图……试图……在扫描仪中对幼儿进行定位……躺在核磁共振成像仪里。

那是找出我们大脑内部发生的事情的最佳方法，扫描仪很吵，你身处这个很小的区域，你患有幽闭恐惧症，这根本不会困扰我。我可以在那里睡觉。但有些人会被困扰，小孩子不太喜欢它，他们不喜欢躺着不动。

你必须非常不动，因为如果你四处移动，那会弄乱……所有东西的位置。所以，你知道，试图……你知道，你的问题是我们的语言是如何以及何时发展的，你知道我们是怎么做的。这个左侧语言系统是如何开始发挥作用的？在哪里……你知道，要让一个两岁孩子做这个任务是很困难的，但你可以……也许当他们开始三岁、四岁、五岁时，让他们做这个任务很短的时间。看起来它很早就出现了。

所以很明显，当你……像婴儿的第一个词之前，有很多令人着迷的混乱正在发生。弄清楚这些人说了什么……是的，你试图……理解……这与世界联系起来……是的，那可能是一个非常迷人的发展，正在那里发生。是的，很难……

无论如何，你说我们回到这个扫描仪，我可以在十五分钟内找到我的网络，现在我们可以问，我们可以问，找到我的网络，找到你的，找到二十个其他人做这个任务，我们可以做一些其他的任务。你认为还有什么其他的任务是思考？我可以做一个特殊的记忆任务。

我可以做一个音乐感知任务。如果我编程，我可以做一个编程任务，好吧，我可以……理解计算机程序。而这些任务都没有触及语言网络，根本没有。

它们根本没有。大脑的其他部分被高度激活。有一个……双侧网络，我认为你可能会称之为多重需求网络，它可以做任何困难的事情。

所以任何在某些方面有点困难的事情都会……激活多重需求网络。我的意思是，音乐会在某些音乐区域……你知道，有一些特定类型的区域。但是……但是……但是它们都没有激活语言区域，除非有词语……所以如果你有音乐，有一首歌，你可以听到歌词，那么……那么你就会得到语言。

我们谈论的是说和听。但我们是否也在谈论阅读？

这都是对任何……

类型的理解，而这个……

网络对于它是书写还是口语没有区别。所以费德里科所说的语言网络是一个高级语言。所以它不是关于口语，也不是关于书面语，而是关于两者中的任何一个。

所以，当你进行语音时，你的……某种程度上，你……你听语音，你需要追踪一些你不理解的语言，看看哪些……或者用来追踪反向语音，听起来像语音但不是，然后……所以你完全去除了声音部分，然后如果你写，你会得到完全相同的网络。所以只是阅读语言与阅读一些无意义的词语或类似的东西，你会发现完全相同的网络。所以这是关于高级……语言。

在这种情况下，你……同样的事情也发生在生产中，这有点难……运行扫描仪。但同样的事情也发生在生产中，你会得到相同的网络。所以生产有点难……你必须弄清楚如何运行一个任务……在网络中，比如你正在做某种类型的生产，我不记得他们做过什么……很多不同类型的任务，在那里你会让人们产生东西……是的，弄清楚如何产生，相同的网络在那里，完全相同的地方。

所以如果你……等等，所以如果你阅读随机……

词语……东西……

像吉什……是的……

是的，刘易斯·卡罗尔，两次。比利，沃克，对吧？他们称之为沃克语音。

词语不会……

没有那么多。里面有词语，东西。所以这是一个……是的，是的。所以就像……访问。

语言越像那样，它在语言网络中的位置就越高，而那个网络从你说话开始就存在，从你学习语言开始就存在，并且……就像你，你会说多种语言，相同的网络适用于你的多种语言。所以你会说英语，你会说俄语，那么两者都会触及同一个网络。如果你精通这些语言……

对于编程。

根本没有……这很惊人，即使你是一个非常优秀的程序员，那也不是人类语言，它没有传达相同的信息。所以它不在语言网络中。

所以这……我的意思是……我认为这很……令人惊奇。

所以这就像一组……这表明……但你可能会认为思考不是语言。语言只是……我们人类语言中已经制定出的这种约定俗成的系统。哦，另一个迷人的小细节是，即使是这些构造的语言，比如克林贡语，或者我不知道权力的游戏中的语言，对不起，我不记得那些语言。

很多人……

说这些语言的人，他们真的说这些语言，因为创造这些语言的人是为了这些节目。嗯，他们在构建类似人类语言的东西方面做得非常出色，而那些……那些会照亮语言区域，那是因为他们可以用人类语言表达……你知道，几乎是任意的思想。它不是……它是一种构造的人类语言，可能与人类语言有关，因为创造它们的人……正在创造它们，就像人类语言一样，在各种方面。但它也激活了相同的网络，这真的很酷，无论如何。

决定进入一个你可能有点……官方的地方，但这不可能……大脑的这个区域正在进行某种翻译，翻译成更深层次的……几乎像概念……它必须在做。所以它在沟通中做了什么，对吧？它从思想中翻译。无论那是什么，都更抽象。它正在做那件事。它正在做……那就是它在做的事情。它是一种意义网络。

我想是的，一个翻译网络，是的。但我不知道它底部的核心是什么……我们的想法是什么，它们对我来说是想法，就像我不……想法和词语，它们是邻居还是……一个乌龟坐在另一个乌龟上面？意思是，我们有一套非常深层次的概念……有联系，对吧……

这些东西的意义，然后是概率……大脑的产物，这些东西的意义。所以……你知道，当我谈论任何我想谈论的东西时，它会在其他地方表示。关于……的知识……

会在其他地方表示。我想知道是否有意义的压缩编码。我不知道语言是否有支持……你知道，我想……我想这里的含义是，我们不是用语言思考……

正确，这很酷，这太有趣了。所以人们……我的意思是，这很难做实验，但有一种内在声音的想法。很多人都有内在的声音。

因此，如果你在互联网上进行关于内在声音的调查，如果你听到自己说话，即使只是在思考，大约 70% 到 80% 的人会说，是的，大多数人都有内在声音。我没有，所以我一直觉得这很奇怪。所以当人们谈论内在声音时，我一直认为这是一个比喻。

而且，我知道你们大多数听众会觉得我说的话很疯狂。我没有内在声音，我不知道你们在听什么。我觉得有这个声音一直在你思考的时候说话，这有点烦人。但我猜大多数人都有，而我没有，我们也不知道……

这与什么有关。我想知道内在声音是否活跃？

我不知道。让我看看，电视演讲，对吧？所以就像你听到的。

你有内在声音吗？我想是的。哦。

很多人感觉他们听到别人，他们听到自己，然后说他们读到某人正在吃东西，或者人们告诉我，他们在读别人的邮件时会听到那个人的声音。我心想，哇，这听起来太烦人了。

我认为我喜欢把读的东西大声说出来，但我认为我没有听到声音。

好吧，我们可能都有一个内在世界。人们有内在声音。人们在仅仅思考的时候，会有强烈的听到他们脑海中声音的感觉。

我拒绝相信大多数人……

大多数人绝对有。这就像三分之二或四分之三的人。很多。我从未在课堂上问过这个问题，然后我去了互联网。他们总是这么说，所以这是一致的。

这可能是软件端口缺陷。这可能是，你知道我在读什么吗？是的，在我的脑海里，我有点像在说这些词，这可能是阅读的错误方式，但我没有听到声音。

没有声音的感觉。我拒绝相信大多数人有。无论如何，人类大脑更快，但这仍然让我震惊。语言的出现，理解似乎与思考是分开的。

所以这是一组，一组来自 Federico 小组的数据，即无论你做什么任务，如果它没有单词和单词组合，那么它就不会激活语言网络。你知道它可能在其他地方活跃，但不在那里。所以这是一个。

然后，与这个问题相关的另一条证据是，事实证明，有一群人左侧中风严重，摧毁了他们的语言网络，只要它没有摧毁右侧的一切，这都是测试缺陷。在这种情况下，他们就不会有任何认知功能障碍。

但如果他们只是摧毁了语言，这很难做到，因为它在左侧非常广泛。但如果他们做到了，那么就会有这样的病人，称为全局失语症患者，他们可以很好地完成任何任务，除了语言。你可以和他们说话，我的意思是，他们不理解你，他们可以说话，可以写作，可以阅读，但他们可以，他们可以下棋，他们可以开车，他们可以做各种其他事情。

做数学，诸如此类。所以数学不在语言区域。例如，算术本身。那不是语言。它是符号。

所以人们混淆了某种符号处理和语言，而符号处理并不相同。所以有符号，它们有意义，但这并不是语言，它不是一个，你知道的，约定俗成的语言系统。所以语言，数学不在那里。所以他们可以做到。他们做得和他们的对照组一样好，年龄匹配的对照组。

所有这些任务都是 Rose 在伦敦大学学院完成的，她有一群病人，她向我们展示了他们只是……所以这种组合表明语言对于思考并不是必要的，这并不意味着你不能用语言思考。你可以用语言思考，因为语言允许大量的表达，但你不需要它来思考。这表明语言……

是独立的系统。我试图加载那个……是的，因为这对大型语言模型有影响。

确实如此，他们一直在研究这个问题。

太棒了。停一下。你写道，目前关于人类语言的最佳理论可以说是大型语言模型……

这与形式有关，这是一种宏大的理论，原因是它被认为是最好的，因为它在预测英语是什么方面做得最好，它非常好，比任何其他理论都好，但是我们不知道，这不是……

没有细节，所以就像它不是……

你，它就像一个黑盒子。但我认为它是一个理论。

理论的定义，因为这是 Gigi C 反过来，你知道，大量的参数控制着我。理论通常需要简单性，对吧？好吧，我不知道。

也许我只是在那里说得比较宽泛。我认为它不是一个伟大的理论，但它是一个理论。从某种意义上说，它是一个好理论，因为它涵盖了所有数据。然后你想说英语，它做不到。

所以这就是它可以说是最好的原因，没有其他理论像大型语言模型那样擅长预测英语中什么好什么坏。你知道，你认为这是一个好理论吗？好吧，可能不是，你知道，因为我想要一个比这更小的理论。它太大了，我同意。

你可能可以构建一个机制，通过它你可以生成一个简单的解释或特定的语言，比如一组规则，类似的东西，你可以，你可以生成一种语言的依存语法，对吧？是的，你可能，你可能会问……

你关于它。所以你知道我的意思，这假设有一些证据表明，一些大型语言模型在其内部提到了类似依存语法的东西。

所以有一些来自 Chris Manning 和他在斯坦福大学自然语言处理方面的同事的工作，他们研究了，我不知道有多少种大型语言模型类型，但肯定包括 BERT 和其他一些，以及你做某种复杂的数学来计算到底发生了什么抽象的表示，他们说看起来像依存结构，这就是他们正在构建的，它不像……所以它实际上是一个非常非常好的映射。因为他们正在构建这样的东西，这意味着他们正在使用它来理解吗？我的意思是，可能吧，但我们不知道你写道……

语言分析师最接近的语言理论被称为基于构造的理论，它可以解释这些构造是什么。

这只是一个通用的语言理论，即……对于许多语言片段，存在形式和意义对。所以它主要基于使用，构造语法试图处理人们实际所说和实际写的东西，所以这是一个基于使用的想法。

那么构造是什么？要么是简单的词，比如一个词及其意义，要么是词的组合，基本的词组合，就像规则一样。但它没有具体说明潜在的语法形式是什么，所以我认为依存语法可能是用于构造语法的正确形式。构造语法通常……没有那么正式，所以也许它的形式化，它的形式化可能是在依存语法中。啊，我的意思是，我认为是这样，但我的意思是，这取决于该领域的其他人是否同意。

那么你认为大型语言模型理解语言吗？它们是理解语言的吗？我猜更深层次的问题是，它们只是理解表面形式吗？或者它们是否理解了更深层次的意义，然后产生形式？

我的意思是，我认为它们正在处理形式。它们做得非常好。它们是否在处理意义？不，可能不是。

我的意思是，有许多来自不同小组的例子表明，它们可以被各种方式欺骗。它们真的不理解正在发生的事情的意义。所以有很多例子，他和其他人给出的例子，表明它们真的不理解发生了什么。

所以你知道蒙提霍尔问题是一个愚蠢的问题，对吧？在那里，你知道，如果你有三扇门，让我们做个交易，这是一个古老的电视游戏节目。有三扇门，其中一扇门后面有一个奖品，另外两扇门后面是一些垃圾奖品，你试图选择一扇门。如果你，你知道蒙提，他知道目标物品在哪里。好东西，你知道所有东西都在后面，你应该，他给你一个选择。

你选择三扇门中的一扇，然后他打开其中一扇门，那是一些垃圾奖品，然后问题是，你应该交换吗？因为另一个，答案是，是的，你应该交换，因为他知道哪些是你可以转过来的，所以现在的几率是三分之二，好吗？然后你只需要稍微改变一下大型语言模型，就能看到这个解释很多次，那就是如果你稍微改变一下故事，但它会让它听起来像是某人帮助了什么，而不是你只是说，哦，有三扇门，其中一扇门后面是一个好奖品。有两扇坏门。

我不知道它在1号门后面。好奖品。汽车在1号门后面，所以我将选择1号门，蒙提霍尔打开3号门，给我看什么也没有，我应该换成另外两扇门吗？即使，不，好奖品在1号门后面，大型语言模型会说，是的，你应该换，因为它只是经历了它之前见过很多次的模式，所以在这些情况下，是的，你应该换，因为，你知道，你的几率从三分之一变成了三分之二，但它没有任何方法记住你实际上有一百分百的概率在那个你不想得到的东西后面，你知道那不是……计划的一部分，它之前见过成百上千次。所以即使你试图向它解释这是错误的，它也会继续给你同样的问题。

但大型语言模型也可能意识到有时存在对某种特定公式的过度表示，很容易被这种公式所欺骗。所以你可以看看，如果模型越来越大，它们可能会更怀疑一点。所以你会看到过度表示。

所以就像你，感觉就像形式训练，形式训练在生成看起来像东西的东西方面可以走得很远，它深刻地理解了潜在的世界模型，世界模型，数学世界，物理世界，心理世界，这些句子就是由这些世界产生的。感觉你很容易坚持意义部分，在这个方面很容易被愚弄，但人类也是如此。所以它看起来真的很令人印象深刻。它看起来像理解概念有多频繁。

我的意思是，你不需要说服我，我对此印象非常深刻。但这是否意味着你正在提供一个可能的世界，也许有人会训练另一个版本，这样它就能以某种方式从各种形式中抽象出来？我的意思是，我认为这种情况不会发生。

那么呢？不，不，不。我说的是，我认为当你只看一些例子，并展示大量例子时，它似乎并不理解，很容易被愚弄，这似乎不像对……有多少地方很容易被愚弄的科学数据驱动的分析。

这不是推论。所以我不想那样推论，我不想那样推论，我试图推论的是，它像人类吗？它可能不像人类。

它不同。但人类不会犯那个错误，如果你向他们解释，他们会明白，他们不会犯那个错误。所以有些事情与人类不同，在这种情况下，它们正在做的事情与人类不同。

人类通过什么机制发现这是一个错误？

我只是说，错误在于，如果我向你解释，有一百分百的几率汽车在这扇门后面，你想要交换吗？感觉就像不，但这个东西会说是的，因为它太专注于形式了，这是一个人类不会犯的错误，这很有趣……

不太可能犯，我应该说，是的，不太可能。你在问，你知道，你在问人类，你在问一个系统去理解百分比，就像问一些数学概念一样。所以像……

看，大型语言模型擅长的地方，形式是惊人的。所以让我们回到嵌套结构，中心嵌入结构。好的，如果你要求一个人完成这些，他们可以做到，大型语言模型也是如此。

它们在这方面就像人类一样。如果你问，如果我问一个大型……

语言模型，中心嵌入，它没有经过训练，所以它们做得很好。所以这是一个相似之处。但这并不是意义，对吧？这是形式。但当我们进入意义时，这就是它们开始搞砸的地方，当你开始说，哦，门后面是什么？哦，它是，你知道，是我想要的东西，它不会那么容易搞砸。你知道，在这里，形式，形式的匹配令人惊叹，在没有经过训练的情况下也很相似。

我的意思是，它接受训练的意义在于它获得了大量的数据，就像人类数据一样，但它并没有接受关于“坏句子”的训练，也没有被告知什么是坏的。我做不到那些。它实际上会说一些诸如“这些对我来说太难了”之类的话，这实际上很有趣，有点像它不知道自己不知道。

但是它经常不会完全偏离主题，它经常会说一些有意义的东西，这些东西是真的，有时这些东西是自然的。而且几乎总是形式很好，是的，但这仍然非常令人惊讶，形式非常好，并且能够根据它所接受的训练生成许多真实的东西。是的，它不仅仅是形式在起作用。它是在模仿真实的陈述。

来自。

互联网。我想这里的基本思想是，在互联网上，真相被过度代表了，而虚假信息则较少。我认为。

那是对的。

所以，但你所说的根本问题是，它接受的训练只是。

是形式，是的。是的。

我认为是这样。啊，如果这是真的，对我来说，这仍然是一个有点开放的问题。我现在可能倾向于同意你的观点，特别是现在，让我大吃一惊的是，大脑中有一个单独的模块用于语言，而不是用于思考。也许大型语言模型方法中缺少一些根本性的东西，那就是缺乏思考、推理和能力。

是的，这就是这个小组所使用的。所以，同一个小组，联邦海岸小组，最近发表了一篇论文，论证了这一点，作者是叫卡·穆的人，他住在德克萨斯州的奥斯汀，实际上他是我的老学生，但他现在是德克萨斯州的一名教师和语言学家，他是这篇论文的第一作者。

首先，这仍然是一个悬而未决的问题，你对它们的有趣限制是什么。

它们，你知道，我看不到它们形式上的任何限制。它们的形式令人印象深刻。啊，是的，是的。

它非常接近你所说的，完成中心嵌入的能力，是的。

它和人类一样。它看起来和人类一样。

但它并不完美，对吧？它应该很好。

不，但我想像人类一样。我尝试过，我想做一个像人类一样的模型。

但是，但是我们也不完美，它尽可能接近人类。我明白了。是的。但是如果你不是人类，如果你像超人一样，你应该能够更好地完成中心嵌入，对吧？我的意思是。

如果它是对某种东西进行建模，我认为这非常有趣。

那真是。

有趣。我认为它潜在的底层模型，类似于形式的处理方式。

人类的形式，以及人类如何处理语言的方式。

我认为这是合理的。

以及他们如何生成语言、处理语言、概括语言。从这个意义上说，如果它只是停留在中心嵌入这个对人类来说很难生成的东西上，那么它是完美的，这似乎令人印象深刻，因为这对人类来说很难生成。这与我们之前讨论过的事情有什么联系呢？那就是依赖语法框架，在这个框架中，我们如何看待语言，以及发现短依赖似乎是语言的普遍组成部分这一发现。那么，为什么它很难完成中心嵌入呢？

我喜欢依赖语法的理由是，它使与长距离连接相关的认知成本非常透明，它就在那里，有些东西就在那里。事实证明，在产生和理解不相邻单词之间的连接时，会产生成本，它们相隔越远，情况就越糟，并且根据，好吧，我们可以测量这一点。并且与之相关的成本。

或者你可以停留在，你所说的认知成本是什么意思？

以及你如何测量？哦，你可以通过多种方式进行测量，最简单的方法就是让人们说出他们是否知道某个句子的好坏，这只是测量的一种方法。你试图在句子和结构之间进行三角测量，以试图找出其来源。

你可以观察受控材料中的阅读时间，你知道，在某些类型的材料中，然后我们可以选择测量依赖距离。在那里，我们有一项最近的研究，我们讨论的是大脑。在这里，我们可以观察语言网络，好的，我们可以观察语言网络，我们可以观察语言网络中的激活程度，以及激活程度的大小取决于依赖的长度。

事实证明，如果你在听随机句子，事实证明，人们在故事中。呃，依赖越长，一分钱就是，语言网络中的激活就越强。所以有一些度量，不同的度量，我们可以做到这一点，这实际上是一个很好的度量，自然激活，大脑中的激活。

所以你可以通过不同的方式，将其转换为一个数字。我想知道是否有一个漂亮的方程将成本与IA平方之类的联系起来。

是的，这很复杂，但可能可以做到。我猜想是可以做到的。我很久以前尝试过这样做，而且相当成功。

但由于某些原因，我停止了这项工作。我同意你的观点，弄清楚这一点会很好。所以这就像某种方法来计算成本。我的意思是，这很复杂。你之前提出的另一个问题是，如何测量距离，是单词吗？可能不是。问题的一部分是，有些词比其他词更重要，可能你知道，像代词之类的词可能很重要，这取决于，然后可能取决于我们已经介绍过的或已经提到的词，比如代词、名词，像所有这些东西可能都很重要。所以，可能最简单的方法是，就像我总是忘记所有这些，只是考虑名词。

但是可能有一种像，可能有一些见解，一种适合数据的函数，是的，是的，我认为。

这是一个昂贵的函数。所以我们认为它可能是一个指数函数，这样距离越长，它就越不重要。然后，它们的总和就是我的，那是我们很久以前最好的猜测。所以你有一堆依赖关系，如果你有一堆依赖关系，它们在某个点上连接在一起，在那些依赖关系的末端，成本是，是一个昂贵的函数，我的猜测是。

但由于某些原因，它可能是一个指数函数，就像它不仅仅是两个词之间的距离，因为我可以通过添加许多短语和介词短语来创建一个非常非常长的主语全局依赖关系，而且它并不太重要。当你嵌套时，当我有多个这样的依赖关系时，事情就会变得非常糟糕。变得自我。

可能是记忆。

是的，这可能是记忆的功能。这里的问题是访问，试图找到那些早期的内容。很难弄清楚之前指的是什么，那些连接，这就是工作记忆而不是长期记忆的概念。

但是试图连接，呃，我们检索那些早期的单词，这取决于它们之间是什么。然后。然后我们讨论的是相似事物之间的干扰。

那是正确的理论，可能具有这种概念，并且是相似事物的干扰。所以我正在处理对正确理论的抽象，这只是你知道的，它计算单词。它不正确，但它很接近。

然后也许你可以写出某种，某种指数函数或其他什么东西，来计算总和，这样我们就可以为任何语言中的任何句子计算出一个函数。但你知道，这很有趣。你知道人们没有做过太多这样的事情，我认为这很有趣。我确实认为这很有趣，而且很多人没有发现这很有趣。我不知道为什么我没有让人们想做这件事。

我也非常喜欢这一点。其美妙之处在于，其底层思想很美妙，它与依赖关系的联系相符，它感觉就像，因为深层语言是人类体验如此根本的一部分。这是一个关于语言的简洁而清晰的理论。好吧，是的，就像，哇，好的，所以就像，我们喜欢把我们的词放在一起，把相关的词放在一起。

这就是为什么我也喜欢你。它太简单了。

是的，唯一简单的。

然而，它解释了一些非常复杂的现象。如果你，如果我写下这些非常复杂的句子，很难知道为什么它们如此困难。你可以像，把它钉下来，我可以做到，我可以给你一个数学公式，说明为什么每一个句子都很糟糕以及在哪里。我认为这很酷。我认为这非常巧妙。

你是否进行过这样的过程？例如，你取一段文本，然后简化它，就像有一个平均的，依赖的链接，然后你像，你知道，呃，减少它，看看对泰坦的理解。我只是单个句子，你知道，你从詹姆斯·乔伊斯到海明威。

或者什么，不，不。我简单的回答是，我知道可能有一些事情你可以做。在这个方向上，这很有趣。我们可能会，我们会在某个时候讨论法律语言，也许我们会讨论这种思维方式。我们将其应用于法律语言。

因为你提到作为一个例外，我们关注的是注意力。这是一个有趣的例外，你说大多数自然语言，正如我们一直在讨论的那样，具有局部依赖关系，只有一个例外。

法律语言是正确的。

那么，法律语言首先是什么？哦，好吧。

法律语言，你认为它是，它只是另一种语言。

我的意思是，我实际上对律师使用的语言类型知之甚少。

所以我只是谈论法律中的语言和合同中的语言。所以你必须遇到的东西，我们每天都要遇到，你跳过它，因为它读起来很糟糕，或者你知道，部分原因只是很长，对吧？有很多文本我们并不想了解。

所以，但我感兴趣的是，我一直和一个叫埃里克·马丁内斯的人一起工作，他说他是一个律师，正在上我的课。我长期在麻省理工学院教授循环英语CS实验室课程。他，他是哈佛大学毕业生，他上了这门课，因为他以前做过一些语言学研究，他对这个问题很感兴趣，为什么。

听起来很难理解，知道为什么。那么，为什么它很难理解？为什么他们要那样写？如果它很难理解，那么它似乎很明显，它很难理解。

问题是为什么？所以我们不知道，而且，我们对大量合同进行了评估，实际上，我拿了一堆随机的合同，因为我不知道，你知道，合同和法律可能并不完全相同，但合同是大多数人必须处理的最常见的事情。所以这是一种最常见的事情，成年人在我们的工业化社会中必须处理很多。

所以，所以这就是我们所提取的，我们不知道这方面有什么困难，但事实证明，它们写作的方式非常中心嵌入。它在其中嵌套了结构。所以它有低频词，这并不奇怪，很多文本都有低频词，它确实有略低于其他类型控制文本的低频词，甚至是学术文本。

这更糟糕。这是我们遇到的最糟糕的情况。只是你。

揭示了律师们正在玩的游戏。

他们正在优化不同的，这真是有趣，这就是你得到的，以及为什么。所以，而且我认为这不是你的事。他们故意这样做。

我知道他们故意这样做。是的，是的，是的，看，说到这里。看，说到这里。所以我们想看看为什么我们应该首先看看什么。所以，因为事实证明，我们不是第一个观察到法律语言的人，尼克松在1970年有一项关于平面语言的行动，奥巴马也有一项，还有很多，很多总统，他们都说我们必须简化法律语言。但是如果你不知道它有多复杂，那么简化它并不容易。

你需要知道你应该做什么，然后才能修复它，对吧？所以你需要循环英语来分析文本，看看它有什么问题，然后才能修复它。你不知道如何修复它，我应该如何修复某些东西，我不知道它有什么问题。

所以我们所做的就是，我们弄清楚了，好吧，我们只是拿了一堆合同，让人们，我们为一堆特征对它们进行了编码。所以另一个特征，人们，其中一个是中心嵌入。

所以，呃，这基本上是，呃，一个从句如何介入主语和谓语之间，例如。这是一种从句嵌入。好的。

而且，事实证明，它们大量地中心嵌入，所以，我认为在随机合同和随机法律中，我认为大约70%或87%的句子都有中心嵌入从句，这高得令人难以置信。你知道，如果你去看任何其他文本，它会下降到20%左右。它比你能想到的任何控制文本都要高得多，包括你想到的，人们认为，哦，技术性的，学术性的文本。

没有，人们不会在技术学术文本中写中心嵌入式句子，我的意思是会写一点，但大部分都在20%到30%的范围内，而不是70%。所以就是这样，还有低频词，然后人们会说，也许是被动语态。人们不喜欢被动语态，出于某种原因，英语中的被动语态名声不好，我真不知道这是从哪里来的。嗯，在……有很多被动语态，在法律文本中被动语态更多。

而且在其他方面没有，没有，没有。

没有。

下降。

判断就像这些是频繁发生的，这些是法律文本中发生的事情。然后我们可以问，因变量是像你如何理解这些具有这些特征的东西？是的。

好的。然后事实证明，过去时没有区别。所以它对你的理解能力、你的回忆能力没有任何影响，什么都没做。

没有影响。词语有点重要。它们不常用。词语会损害你的回忆和理解。但真正有害的是中心嵌入，它会杀了你，它会减慢人们的速度，它会使……造成非常糟糕的理解，它会使他们无法很好地回忆起说过的话，几乎无法回忆。我们不仅对普通人做了这个实验，我们做了很多普通人实验。

我们对一百名律师进行了实验，我们从各种不同级别的律师事务所招募律师。他们有相同的模式。所以他们也像我一样，当……当我做这个的时候？我不知道他们是如何处理的。

他们……他们使用法律术语，他们处理得和正常情况一样好。不，不，他们……他们……他们比普通人好得多。所以他们……他们能更好地回忆，更好地理解，但他们与普通人有同样的主要影响，完全相同。

所以他们也更喜欢非中心嵌入式句子。所以我们构建了每个句子的非中心嵌入式版本，这些版本在这些位置使用了更高频的词语。我们对被动语态进行了处理，我们把它们变成了主动语态。被动语态和主动语态没有区别，词语几乎没有区别，而中心嵌入在所有人群中都会产生很大的影响。

中心嵌入。顺便问一下，这个过程有多难检测？

中心嵌入检测。

只是不依赖，所以有……

英语的自动解析器，它们相当好，而且……

它们可以检测到某些东西，或者我想你……

所以你不仅仅是在寻找……

长依赖关系，你只是在字面上寻找某些东西。

是的，在这种情况下是这样的。但是长依赖关系……

它们高度相关。中心嵌入就像一颗炸弹扔进一个句子中，它会使……

我可以从这些东西中读一个句子给你吗？我的意思是，这只是其中一件事，这只是我的眼睛……

我的目光在句子中间游离，不，我的意思是法律文本，太难了……

因为如果公司支付任何款项或福利，所有此类款项和福利，包括本协议第三条规定的款项和福利（以下简称“总付款”），均应缴纳所得税，则现金遣散费应予减少。这是我们从一份合同中提取的普通文本，而且……

但是出于某种原因，有一个定义。他们在主语和谓语之间插入了款项和福利的定义，让我们如何处理这个问题？如何将定义放在其他地方，而不是放在句子的中间？

所以这是非常非常常见的，顺便说一下，这就是发生的事情。所以你只是插入你的定义，你使用词语，几个词语，然后你定义它，然后你继续写句子，就像不要那样写，你问……当我们问律师的时候，这意味着律师……律师不喜欢这样。他们不喜欢这样。他们不想，他们不想那样写。我们让他们对具有相同含义的材料进行评分，这些材料有中心嵌入和非中心嵌入版本，他们更喜欢非中心嵌入版本……

在阅读方面。

我们问他们，我们问他们，你会雇佣一个这样写的人还是那样写的人？我们问了他们各种问题。他们总是更喜欢不太复杂的版本，所有的人都是这样。所以我甚至不认为他们……

想要这样。是的。这是怎么回事？怎么发生的？

这是一个非常好的问题。答案是我们仍然不知道，但我有一些……

理论。

嗯，我们目前最好的理论是，中心嵌入的风格中实际上存在某种表演性含义，它告诉你这是法律文本。我们认为这是一种告诉你这是法律文本的风格，这是一个合理的猜测。也许它只是……例如，一年，就像一个魔咒。

所以你可以称之为“魔咒假说”。所以当你告诉某人对某些东西施加魔咒时，你知道人们知道什么是魔咒，他们会做很多修饰。你知道，这就是人们通常会做的事情。

他们会做修饰。他们会做一些诗歌。也许有一种句法上的反映，那就是中心嵌入，就像一个魔咒。

所以这就像，哦，它试图告诉你这是真实的，这就是法律的目标，对吧，告诉你一些我们希望你相信是绝对真实的事情，对吧？这就是法律合同试图强加于你的东西，对吧？所以也许这是一种形式，这种非常抽象的中心嵌入形式，具有……

相关的含义。嗯，你认为律师是否有动机……是的，产生难以理解的东西？

这是我们的一个工作假设。

我们只是找不到任何证据表明律师不明白。这意味着你在共产主义苏联问个体成员，他们的软件报告不会正确反映导致人员流动或类似问题的庞大官僚机构的缺陷。嗯，我认为你操作的激励机制并不总是对系统内的成员透明。

所以感觉这是一个奇怪的巧合，如果你放大来看，从系统的角度来看，只是问一下，让某些东西难以理解，会让很多人赚钱，是的，就像你会需要一个律师来解决这个问题，我想，从个人的角度来看。但这可能是我们的表现，它可能是，而不是为了复杂化而驱动的激励，而是为了表演性，律师以这种复杂的方式说话，而普通人则不明白。所以你需要雇佣律师。我不知道是哪一个，但这很可疑，可疑的是它很难理解，每个人的眼睛都茫然了，而且……

他们不读，也很可疑。我仍然很怀疑。而你在这里说，这可能不是个体，甚至不是普通个体，这可能只是少数几个坏苹果，以某种方式推动……

这种影响，以某种流利的方式。啊，是的，这真的取决于他们是谁，就像中心人物。

你知道，这在我们的一百名律师中很有趣。他们并没有……他们真的不喜欢它。

所以他们比普通人更好地理解它，他们平均更好。但他们有同样的区别。

完全相同。所以他们……但我……他们想要修复它。所以他们……所以这给了我们希望，因为实际上构建一个非中心嵌入式材料并不难，它具有相同的含义，这并不难，基本上就是下一个场景。

只需将定义放在主谓结构之外，在预测性示例中，这是一种……这很普遍。他们所做的只是在那里添加一些东西，你不需要添加这些东西。通常会有一些额外的词语……你可能需要一些额外的词语来以某种方式指代你在外部定义的东西，因为如果你只在一个句子中使用它，那么就没有理由引入额外的术语。但是，所以我们可能会有更多词语，但它更容易理解。所以我希望……也许我们可以使法律文本不那么复杂。

也许在接下来的几天里，下一个演示文稿可以在通用事物中，准确地说，我是中心嵌入的，并将其交给马丁内斯语言专家……

是你应该真正请教的人。但是……

中心嵌入是一件坏事，你摆脱了它……

他们会做很多……

修复很多令人着迷的事情。是的，这太令人着迷了。而且它确实令人着迷，在许多方面，人类都无法做到这一点。

以及语言，因为……以这种方式更快。所以，当谈到语言交流时，你所拥有的数学公式之一是嘈杂信道这个概念。什么是嘈杂信道？

所以那是我们的交流。所以这可以追溯到香农。所以香农克劳德……

香农是……嗯，麻省理工学院40年代的学生，所以他写了这篇关于通信理论或信息理论的非常有影响力的作品。他实际上对人类语言很感兴趣。他试图……

他对这个问题感兴趣，即从我的大脑到你的大脑的交流，以及……以及他……他关心或感兴趣的是……一种稳健的方法来做到这一点，所以假设我们都说同一种语言，我们都说英语，无论我们说哪种语言，那么我如何表达语言才能最有可能将我想要的信息传递给你。然后，通信中的问题，嘈杂信道的问题是，我……有很多噪音。我表达得并不完美。

我犯了错误。那是噪音。有背景噪音。你……你知道，像字面上的背景噪音，有像白噪声之类的背景噪音，还有一些其他的噪音，一些正在进行的谈话，或者只是你……你参加聚会，背景噪音，你试图听到某人的声音，很难理解他们，因为总是有其他事情在发生，然后在通信的接收端也有噪音，所以你有一些问题，也许是由于某些原因无法理解我。

所以你有一些其他的问题，无论是什么原因。也许你……如果你想喝水，谁知道为什么你无法注意信号。所以这就是嘈杂信道。

所以语言，如果它是一个通信系统，我们试图在某种意义上优化信息从一端到另一端的传递。而且……所以它会伤害……我的意思是，一个想法是也许……

你知道，例如词序等方面，可能以某种方式进行了优化，以便更容易地将语言从说话者传递给听者。那个在40年代做这件事的人，非常有趣，历史上他对语言学很感兴趣。他在数学系，这是他的硕士论文，所有这些事情，你知道，他做了多少事情真是太疯狂了，这是1948年的硕士论文。

我认为是4000多页。而且他想继续从事语言研究。而这在当时并不是一个流行的交流来源，语言并不是很流行。所以香农开始……他无法在那里获得立足点，我认为是这样，所以他去了贝尔实验室，从数学的角度研究通信，并做了……

各种令人惊奇的工作，所以他更多的是在信号方面，嗨，如果他继续研究语言方面，那将会很有趣，是的……

这真的很有趣。是的，例如在40年代，他对这一点很感兴趣。就像他们的语言，就像……就像事情一样。我们可以证明在……当你在听我的时候，你经常可以猜测我的意思，根据我所说的，你认为我的意思是什么。嗯，关于语言为什么看起来是这样的，我们可能……可能有一些方法，词序在某种程度上是优化的，因为……由于某种方式的嘈杂信道。

我认为对建模来说这真的很酷，如果你没有听到句子的某些部分，或者有遗漏部分的可能性，那么这些想法是如何……

那个想法，你可以……

说像词序和语言的句法，依赖长度，都是有希望的。

是的，嗯，铅笔链接。这实际上是关于记忆的。我认为这就像……关于某种方式更容易或更难。

而这些其他的想法是关于我们对交流的鲁棒性。所以由于噪声而可能丢失信号的问题。所以可能有一些词序方面是为此进行优化的。

而且你知道，我们在这个日记中有一个猜测。这些只是我必须坦白的故事。它们不像……我可以证明这是真的。

我们所能做的就是观察世界上现有的语言。这是……我们可以看到语言是如何变化的，或者任何事情，因为我们有几千种语言的快照。我们没有……我们真的没有……

我们可以进行适当的修改，通过实验来检验这些东西。所以，请从这里开始，带着这种想法，理解这些依赖于我的东西，以及更多的东西。这里显示的是长度，这里显示的是难度。

这里显示的是C，Z。我认为这是一个合理的结构，我认为它相当合理。

这里解释了为什么词序是这样的。目前这属于不确定的领域，但这很有趣。

明确地说，我们讨论的是交流的声音，就像你我大声说话一样，你有一个带有噪声信道的模型，包括响度和噪声，信号正在通过。你说“水”，水可能与优化当前情况有关，这很有趣。

我的意思是，对我来说，你可以在嘈杂的信道中加载多少信息很有趣。你能在接收器上加载多少基数？

我们认为至少有三种不同的情况，我们可能不想把它们都视为同一种情况。因此，我认为更好的噪声信道模型应该处理三种不同的噪声源，即背景噪声、说话者固有噪声和听者固有噪声。这些都不是……

都是不同的东西。但除此之外，还有无数你接收到的信息。我的意思是，我刚才提到了双方的认知负荷。然后还有演讲、参数等等，世界观。我的意思是，意义开始渗透到我们工作的意义中，我们有不同的世界观。

我刚刚形成的，就像，你知道的，就像，你对语言的了解程度如何？如果是你的第二语言而不是第一语言，以及你可能知道的语言是什么，这些仍然是形式上的东西，这可能非常有信息量，而且你知道你的年龄吗？这些事情可能很重要，对吧？所以，一个孩子学习语言，就像英语语法的嘈杂表达一样，取决于他们的年龄。当他们六岁时，他们的表达就完美无缺了。

但是，你提到的其中一件事是衡量语言学习问题的一种方法。那么，我们一直在讨论的一切与学习一门语言的难易程度之间有什么关联呢？所以，像短依赖性一样，学习语言的能力。

是否存在某种，或者像依赖语法一样，是否存在某种联系？学习一门语言的难易程度如何？好吧。

世界上所有的语言，目前我们所知，没有一种比另一种更好。例如，就优化依赖关系而言，它们都做得很好，它们都保持较低。所以我认为每种人类语言都是某种优化问题，一个复杂的优化问题，针对这个交流问题。所以，你解决了，不知道它们只是这个交流问题的嘈杂解决方案。有很多方法可以做到这一点。

所以它们并没有针对学习进行优化。

和学习。所以，是的，其中一个因素是，是的，所以学习有点搞砸了。例如，如果它只是关于最小化依赖关系，而这才是最重要的，那么我们就会发现语法，它们的规则没有规律性，但是语言的规则总是具有规律性。

我的意思是，如果我想用最佳方式对你说些什么，对我来说真正重要的是保持依赖关系尽可能接近，那么我，那么我就会有一套非常缺乏结构或依赖规则的规则。我不会有很多这样的规则。

我会很少有这样的规则。我会把词语放在一起，把相互关联的东西放在彼此旁边。但我们不会那样做，有词序规则，对吧？所以，这取决于语言，它们或多或少是严格的规则。

你说的德语，它的规则不如英语严格。英语的词序规则非常严格。我们以非常特殊的方式排序。那么我们为什么要这样做呢？这可能与交流无关。这可能与学习有关，我的意思是，我们谈论的是学习，学习规律的东西更容易，那些非常具有预测性和容易……所以，这可能与学习有关，这是我们的猜测，因为……

关于交流，它可能只是噪声。它可能是语言发展过程中的混乱吗？

如果我们只是为了交流，那么我们应该拥有词序非常自由的语言。我们没有，我们有自由的，但不是完全自由的，总是有……

不，我的意思是噪声，就像文化一样，像粘性的文化的东西，就像你交流的方式，这是一个粘性的故事，它是不完美的，它是一个嘈杂的下午，是现金，是的，你优化的功能非常嘈杂，是的，因为我觉得说学习是目标函数的一部分很奇怪，因为有些语言比其他语言难学得多，对吧？或者那不是真的。这很有趣。我的意思是，这是公众的看法。

对吧？是的，这是真的。对于第二语言来说，但是这取决于你从什么开始，对吧？所以，这真的取决于你的第二语言与你已经掌握的第一语言有多接近。所以，是的，如果你从英语开始，学习阿拉伯语非常困难，或者说日语，如果你从汉语开始，我认为是最难的，国防语言学院在美国有一个关于学习难易程度的列表……

从英语学习。不在乎。不。

没有证据表明有任何语言更难或更容易。但是任何婴儿，任何语言，学习三到四年，他们都会说这种语言。所以没有证据表明任何人类语言更难或更容易。

它们都差不多。语言在多大程度上是……这有点回到乔姆斯基。

这是先天与后天的问题。你说乔姆斯基用语言的某些方面来解释为什么观察到某些现象。但是我们有多少语言是与生俱来的，存在于我们的大脑核心？我的意思是……

你知道答案，我当然不知道，但是我，我喜欢以工程师的身份思考。是的，我有点认为很多东西都是后天习得的。所以我猜想很多东西都是后天习得的。

我认为乔姆斯基选择先天论的原因是，他，他，他假设了他的语法中的移动。他对语法和移动很感兴趣。很难学习。

我认为他是对的。移动是一件很难学习的事情。学习这两件事以及它们如何相互作用。有很多方法可以生成完全相同的句子，这真的很困难。所以他就像，哦，我想这是后天习得的，所以我猜想这不是先天习得的。

而且，如果你只是抛开移动，以不同的方式思考它，那么你就会得到一些模型，但这些模型与人类语言完全吻合。这种混乱不是问题，它实际上是……是该理论的一个宝贵资产。

所以我认为我没有理由假设太多的先天结构。我认为大型语言模型学习得这么好的原因是，我认为你可以从输入中学习人类语言的形式。我认为这很可能是真的。

所以，大脑中负责所有理解的部分可能是后天习得的……

这可能是，是的，你不知道。所以很多东西都是……大脑中的模块化结构是后天习得的，它不必是。所以，在后面有一个叫做视觉词形区的东西。

所以它在你的头部后面，靠近你的视觉皮层，好吗？这是一个非常专门的语言区域，负责视觉词语处理。如果你阅读，如果你阅读，好吗？如果你不阅读，你就不会有它，好吗？

猜猜看，你花了一些时间学习阅读，你做得很好，那个大脑区域正是这样做的。所以，这种模块化并不是先天论的证据。所以，语言的模块化并不意味着我们天生就具备这种能力，我们很容易就能学会它，我们可能天生就具备这种能力，我们目前还不知道。

我们很可能天生就具有这种左半球优势区域。我的意思是，还有很多其他有趣的组成部分，这种论证的特征。有些人中风了，或者他们的左侧出了问题，也就是语言区域所在的地方。

而且，而且它不存在，它不可用，它发育得很好。右边。所以它不是关于左边。

它去了左边，这是一个非常有趣的问题，为什么大脑区域是这样的？它们是如何变成这样的？而且，有一些自然实验，发生在人们在很小的时候大脑发生了奇怪的事情，这摧毁了他们大脑的某些部分，而他们的行为完全正常，没有人知道出了什么问题。

我们后来才发现，因为他们碰巧被扫描了，原因是什么，发生了什么。左半球缺失。没有多少人缺失整个左半球，但他们会缺失左半球或右半球的其他部分。

他们的行为完全正常，你永远不会知道。所以这是一个非常有趣的问题，你知道，目前的研究，你知道，这是一个这个人正在进行的另一个项目。她收到了所有这些人的联系，因为她扫描了一些缺失部分的人。

一个人缺失了她大脑的一部分，在她实验室被扫描了，而且她，她一直是《纽约时报》的作家。在《纽约时报》上有一篇文章，关于……关于……关于扫描程序，关于通过MRI的一般过程在语言中，在语言中可以学到什么。因为她在为《纽约时报》工作，所以所有这些人都开始给她写信。我们也有类似的缺陷，因为他们，你知道，意外地，你知道，为了某种原因而被扫描，并且发现他们缺失了一些部分。他们自愿接受扫描。

这些自然……

实验自然实验。

它们有点混乱，但自然实验很酷，人类生命的前几个小时、几天、几个月。但是，实际上，这种机制，无论是什么，似乎创造了强大的能力，他们能够说话、理解，所有这些东西，无论发生了什么，无论大脑受损的方式如何，都非常强大，这真的很……这真的很有趣。但是，乔姆斯基会对你说的话有什么看法呢？你说语言似乎与思想是分开的，因为据我所知，我可能是错的，他认为语言是……

是的，他这么认为。我不知道你会怎么说。

他会感到惊讶，因为对他来说，语言是思想的基础。

没错，绝对正确。

而且，我很难相信它可能与思想完全分开。

但是，你知道，他基本上是一个语言哲学家，以某种方式思考这些事情。这是一个很好的想法。你不能用他的方法来检验它。

你不能做思想实验来弄清楚这一点。你需要一个扫描仪，你需要脑损伤患者。你需要一些东西。你需要一些方法来衡量它。

这就是你知道fMRI提供的，你知道患者……fMRI有点模糊。我会说它是不确定的。没有办法说语言网络正在执行任何这些任务。

你看看这些数据，你不可能说这些网络是重叠的。它们没有重叠。它们完全不同。

所以，所以，你总是可以……只有两个人。是四个人，或者对于患者来说是其他什么东西。他们身上有一些特殊的东西，我们不知道，但这些人只是随机的人，而且有很多这样的人，你总是会发现同样的效果，而且它非常……

稳健且快速有效。嗯，发明相信……嗯，文化和语言之间有什么联系？你还提到，我们对语言的大部分研究都来自WEIRD人群，西方受过教育的、工业化的、富裕的和民主的。所以，当你研究像亚马逊丛林周围这样的偏远文化时，你能从语言中学到什么？

“WEIRD”这个词来自乔·亨利。他是哈佛大学的进化生物学家，所以他研究很多不同的课题，他基本上是在强调这样的观察：当我们在心理学或……大多数心理学中谈论人类时，我们应该谨慎对待我们想得出的推论，如果我们谈论的是麻省理工学院和哈佛大学的本科生，它们是不一样的，对吧？这些不是一回事。

所以，如果你想对语言进行推论，例如，世界上还有很多其他类型的语言，而不是英语、法语和汉语。所以，也许对于语言来说，我们关心文化，因为文化可能非常不同。当然，英语和汉语文化非常不同。

但是，你知道，狩猎采集者在某些方面差异更大。因此，如果文化影响了语言是什么，那么我们也需要关注这一点。这不像工业化文化。研究当然很有趣。但我们也需要研究非工业化文化。

因此，我和两个群体一起工作过，我与两个群体一起工作，它们位于玻利维亚和亚马逊地区，都在亚马逊地区，这些是所谓的农民-采集者，而不是狩猎采集者，它们比狩猎采集者更进一步，它们也进行少量耕作，也进行大量狩猎，但少量耕作，它们进行的耕作方式是我如果要在后院种植西红柿之类的作物可能会进行的那种耕作。也就是说，它不像大规模的田地耕作。这只是家庭规模的耕作。

你做一些这样的事情。这就是他们进行耕作的方式。我与之合作的另一个群体是皮特哈人，他们也位于亚马逊地区，碰巧在巴西，这是与丹·埃弗里特合作的，他是一位语言人类学家，他实际上居住并在……我的意思是，他最初在70年代是一位传教士，致力于翻译语言，以便能够教他们……教他们基督教。

你对……有什么看法？

是的，我与之合作的两个群体，穆奇尼和皮特哈，都有孤立语言，这意味着根本没有已知的相关语言。它们就像自己独立存在一样。有很多这样的语言。大多数孤立语言都出现在亚马逊地区或巴布亚新几内亚等地，这些地方世界似乎保持静止的时间足够长，而且……就像没有地震一样。

亚马逊丛林里没有……没有地震。气候也不错，所以没有干旱。所以在非洲，由于干旱问题，很多人不得不迁移。

因此，当人们不得不迁移时，就会有很多语言接触，如果你缺水不得不迁移，那么你就得走了，然后你就会与其他部落、其他群体接触，但在亚马逊地区并非如此。因此，人们可以生活在那里几百年，甚至可能是几千年。

因此，这些群体有机会……穆奇尼和皮特哈都是孤立语言，我想他们只是在那里生活了很长时间，与外部群体的接触最少。因此，我对它们感兴趣，因为它们……在这种情况下，我对它们的词汇感兴趣，我很想研究它们的句法，它们的词序。但我主要对语言如何与它们的文化以这种方式联系起来感兴趣。

因此，对于皮特哈人来说，最有趣的是我研究过他们的数字信息。所以基本的想法是，我认为语言是发明的，对吧？从这些词中可以看出，我认为语言是发明的。

我们之前谈到过颜色，同样的道理，你需要与其他人谈论的东西是你将为其发明词汇的东西。好吗？因此，我们为我目前能看到的颜色发明标签，但我需要告诉你，这样我才能从你那里得到物品，或者让你给我正确的物品。而我根本不需要“蓝色”或“绿松石”的词。

在亚马逊丛林中，大部分情况下，因为我没有两种在这些颜色上不同的东西，所以我根本没有……因此，数字在这里确实是另一个令人着迷的信息来源，在那里……你可能会……你知道，我当然认为所有人类都会有精确计数的词语……皮特哈人没有，好的，他们甚至没有“一”的词语。他们的语言中没有“一”这个词。因此，也没有“二”、“三”或“四”的词语。所以这会让人大吃一惊，是的，这很奇怪。

令人震惊。这很奇怪，你可以问……我想有两个。

你做不到。所以你根本不可能在……这是不可能的，因为没有这个词。所以我们是这样发现的，好的，所以它被认为是一种一对多的语言。

有三个词表示量词，表示集合，但是……人们认为它们的意思是一、二和多……但它们真正的意思是几、一些和很多，很多是正确的。是几、一些和很多，所以……我们是这样发现的，这很酷，我们给了人们……我们有一套物体。

好的，这些是线轴，无关紧要，它们是相同的物体。然后我从这里开始。我只是给你其中一个，然后说，这是什么？我们看到欧洲的医院，你告诉我这是什么，然后我给你两个，然后说，这是什么，集合中除了数量之外什么也没有改变。

好的。然后我让你给这些东西贴标签。我们对很多人做了这个测试。我做了这个……

任务，而且……

很奇怪，有点奇怪。所以他们说他们认为我们认为是“一”的词是“几”，但对于第一个，然后他们可能会说“几”，或者他们可能会对第二个说“一些”，然后对于第三个或第四个，他们开始对集合使用“很多”这个词。

然后是五、六、七、八，一直到十，总是同一个词，他们看着我好像我是个傻瓜，因为他们已经告诉我“很多”这个词的意思是五、六、七，而我还在继续问他们九和十，等等，他们明白我想知道他们的语言。任务的重点是我的语言自豪感。所以没关系。

但这看起来我有点慢，因为他们已经告诉我“很多”这个词的意思是五、六、七了，而我还在继续问。所以一遍遍地做这个任务有点好笑。我们和……我称他为……我们的翻译。

他是唯一一个真正流利地说皮特哈语的人，他精通多种语言，包括英语和皮特哈语，然后我打电话给迈克·弗兰克，他也是我当时在那里的学生，我做了这些事情。所以你这样做，好吗？每个人都一样，他们都……都……都这样做。

你知道，当我们问大约十个人时，他们对一到十的所有数字都做了完全相同的标记，然后我们对大数目做同样的事情。实际上，我们先做一些大数目，再做一些小数目，好吗？所以我们做。

而不是从一到十，我们从十到一。所以我给他们十、九、八。他们开始说“一些”这个词。

然后向下，当到达……每个人都说“几”这个词，我们认为这是“一”。所以就像……语境决定了他们使用的量词是什么。所以它不是计数词。

没有计数词。它们只是近似词。而且……

你会在采访很多人时遇到噪音，关于“几”的定义，这在语境中可能是一个阈值。

是的，我不知道，这意味着它取决于语境。英语也是如此，对吧？你问一个英国人“几”是什么意思，我的意思是，这完全取决于语境，而且……

一开始可能很难发现，是的，因为对很多人来说，从一到二的跳跃将是“几”，对吧？

所以这只是……是的，那可能在那里。

我的意思是，这太迷人了。数字不存在，这太迷人了。

不存在吗？我们还有其他事情，如果他们没有这些词，他们能做精确匹配的任务吗？他们甚至能做这些任务吗？答案是肯定的和否定的。

是的，他们可以做到。这是我们做的测试。我们再次拿出那些线轴。好的。所以我们放了三个在这里，然后……我们给他们一些物体，这些物体碰巧是充气的红色气球。它们是什么并不重要。

只是一堆完全相同的东西，很容易放在这些……线轴旁边，好吗？然后我把三个这样的东西放出来，你的任务是把一个放在我的三个东西中的每一个旁边，他们可以完美地做到这一点。所以我的意思是，我们实际上做了这个。

这是一个很容易向他们解释的测试，因为我和这个家伙迈克·弗兰克一起做这个，他会是我的……我会是实验者，告诉他这样做，并向他展示如何做。然后我们只是……他做了什么，我们就复制他。我们只需要……我不需要告诉他怎么做，除了……或者知道复制他……

“做他做的事情”是我们唯一需要说的话，然后他们就会完美地做到这一点，而且总是向上移动。我们做一些随机数量的物品，最多十个，他们基本上在这个测试中做得完美。他们从未出错。

我的意思是，这不是一个计数任务。太棒了。这只是一个匹配，你只需要把一个放在另一个旁边，我不需要知道有多少个才能正确地做到这一点，而且他们会犯错误，但很少，不多于麻省理工学院的研究生，就像……低风险。所以你知道你会犯错误。

不需要计数就能完成吗？

根本不需要。好的。所以……所以这是一个对照组。这个人以前去过那里，并说他们无法完成这项任务。

但我不知道他做错了什么，因为他们可以很好地完成这个测试。而且，我可以训练我的狗做这项任务。所以当然，他们可以做这项任务。所以你知道这不是一项困难的任务。

但另一个更有趣的任务是，所以当你进行需要某种方式来编码集合的测试时，例如，我们中的一个人……我只是把一张……一张纸放在我放下的东西前面，一堆这样的东西，把纸放在下面，这样你就再也看不见它们了。然后我告诉你，做你之前做的事情，对吧，你知道吗？如果只有两三个，很容易，但如果我没有八的词，就有点难了。就像……也许你知道，随着练习，因为……

你必须闭上眼睛。

很容易，因为我们只是数它们。数它们很容易，但他们……他们不能数它们，因为他们不会数数。他们没有这些东西的词。所以他们会做近似，这完全令人着迷。

所以他们会在四或五之后得到近似正确的答案，你知道，因为你基本上总是能得到四，对吧，三或四，看起来……我们可以用肉眼看到的东西，但之后，你就会……这是一个近似数。然后……我们做了一堆任务，它们都失败了，我的意思是失败了。在所有这些任务中，五之后它们都做了近似，这表明……你知道，你需要这些词才能做这些……

时间有点像先有鸡还是先有蛋的问题，因为如果你没有这些词，也许它们会限制你……就像一个婴儿爱因斯坦，他将无法想出计数任务，我的意思是……计数能力使你能够想出有趣的事情。所以是的，你之所以发展出计数能力，是因为你需要它。但一旦你有了计数能力，你就可以想出很多不同的发明，比如，我不知道……

什么类型的……

他们做的事情，在建筑方面非常匹配，建造某种小屋或类似的东西。所以有趣的是，语言限制了你能够做什么。

是的，语言就是……语言就是词汇，就像精确计数的词汇是这里的限制因素。我只是……

有肯定的和否定的，但这就是我的意思。这种限制也是对社会能够建造什么的限制。

这将是正确的。是的。所以这可能是……我的意思是，我们不知道这是当前语言快照的问题之一，我们不知道是什么导致文化发现/发明计数系统。但我们猜测的假设是与农业有关。

所以如果你有一堆山羊，你想跟踪它们，你数了十七只山羊，晚上睡觉，早上起床，那么拥有一个计数系统来做到这一点会更容易。而且……人们经常在我谈到这类工作时问我，我说，哇，皮特哈人，他们是怎么有孩子的？他们没有计划生育。

而且我喜欢，他们有爱情的结晶，他们这样做。他们经常有三四个五个孩子的家庭，然后他们需要数字来追踪他们的孩子。我总是喜欢问那些说他们喜欢的人，你有孩子吗？答案总是没有，因为这就是你如何追踪你的孩子的。

你关心他们的身份。这对我来说非常重要。当我这么说五个孩子时，哪个五个并不重要。

这就像如果你用其他人替换了一个，我会在乎，也许不会，对吧。这就是重点。这是一个抽象的概念，看起来与另一个非常相似。

可能对我来说并不重要，但如果你关心山羊，你实际上会单独认识它们，也就是说，如果那是食物、牛奶的来源。

但是，但是，我说这是一个抽象的概念，这样你就不必关心它们的特性来快速完成这件事。我希望这并非来自人类学家的猜测，关于计数词的来源，可能是来自农业。

是的。你有没有想过为什么像世界语这样的通用语言没有像我们一样流行？

没有像我们一样流行？

所有这些不同的语言？

好吧，我的猜测是，语言的功能是在社区中做一些事情。我的意思是，除非这种语言在社区中有一些功能，否则它就不会生存下去，它不会有用。这是一个很好的例子。

所以，我喜欢，语言的消亡非常普遍，好吗？世界各地都有语言正在消亡，这就是它们消亡的原因，是的，我看到这种情况现在没有发生，无论是热带地区还是派伊，但这可能会发生。

所以，有一个叫做莫斯顿的邻近群体，我说这是一个岛屿，实际上有两个，好吗？所以只有两种语言非常接近，它们是莫斯顿和切米，它们与其他任何东西都没有关系，莫斯顿与切米不同，它与西班牙语有很多接触。

它正在消亡，所以这种语言正在消亡。它消亡的原因是当地人对他们的母语没有太多价值。所以用西班牙语更有价值，因为他们想养家糊口。

你如何养家糊口？学习西班牙语，这样你就能赚钱，找到工作，做这些事情，然后你就能赚钱。所以他们想要西班牙语的东西。

所以，莫斯顿正处于危险之中，正在消亡，这是正常的。所以基本上，问题是人们学习语言的原因是为了生存，我们需要它来赚钱，做任何事情来养家糊口。如果这种情况没有发生，那么它就不会流行起来。

它不像游戏或其他什么东西。这就像我们喜欢的东西。为什么英语如此流行？这并不是因为它很容易学习。也许是的，我不知道，但这并不是它流行的原因。

而是因为美国巨大的经济体。

因此，经济体就是这样运作的。这一切都是关于金钱的。这就是学习英语、普通话和西班牙语的动力。

这些语言非常有价值，因为全世界有这么多使用者，它们在经济上具有巨大的价值。这就是驱动力。这不仅仅是为了好玩。

有一些群体确实想仅仅为了语言本身而学习语言，他们想要，然后就有了某种东西。但这些是罕见的。总的来说，这些是少数群体。大多数人不会这样做。

好吧，那是主要的驱动力。除了每个人都讲英语或一种语言之外，还有注意力，好吧。

语言是……

你是对的。也许这很慢，但这就是我们前进的方向。但是有注意力。

你看到一种语言，边缘。但如果你看看地缘政治和超级大国，似乎还有另一件事。注意力，即语言，是一种民族认同。

有时你确定一个国家？我的意思是，乌克兰语是这场战争的象征，在许多方面，就像一个国家寻找自己的身份一样。所以这不仅仅是方便。

我认为这两件事，注意力是贸易和经济的社区，能够与邻国进行交流，并更有效地与你进行贸易。我完全同意语言是每个社区的方式。出现的方言是人们的一种身份，是的，有时是人们说“去你妈的”的方式，对那些更有权力的人来说，是的，这很有趣。这样，语言可以用作所有这些。

是的，我完全同意。并且有很多工作试图创造这种认同感。所以人们想这样做，说，你知道，作为一名认知科学和语言专家，我希望这种情况继续下去，因为我不希望语言消失，我希望语言能够生存下去，因为出于很多原因，它们非常有趣。但我的意思是，我发现它仅仅是因为语言本身，但我认为它与文化也有很多联系。

这也是非常重要的，希望机器翻译能够打破语言障碍。所以，虽然所有这些不同的多样化语言都存在，我想问这个问题。但基本上，以自动化方式将一种语言翻译成另一种语言有多难？

肯定有一些情况会非常困难，对吧？所以有一种语言中存在而在另一种语言中不存在的概念，最极端的情况是这些数字信息的情况。所以就像把很多英语翻译成皮特哈一样。

这根本不可能。没有办法做到这一点，因为我们谈论的这些概念没有词语。可能还有另一方面，对吧？

皮特哈中可能有一些东西很难翻译成英语。我不知道那些概念是什么。我的意思是，你知道，他们的空间，世界空间与我的世界空间不同。我不知道像那样的东西。

他们谈论的事情，你知道，这与他们的生活有关，你知道，我的工业化生活，这将是不同的，所以总会有这样的问题，你知道，它可能在某些空间中不是那么糟糕，而它在其他空间中可能更糟糕。在数字方面，它非常糟糕，你知道，我不得不说在数字空间，你知道精确的数字空间，但在颜色维度，对吧？所以这还不错。我的意思是，但问题是你没有办法谈论这个概念，而且……

可能存在整个概念缺失。对你来说，更多的是关于概念的空间，而不是形式的空间。像形式，你可能可以映射。

是的，是的。所以你之前谈到了翻译以及翻译如何……有好的翻译和坏的翻译。

现在我们谈论的是形式的翻译，对吧？那么是什么让写作变得优秀呢？它是音乐，对吧？这不仅仅是内容，还有它的写作方式，翻译这种……听起来很难。

所以我们应该说，我知道我犹豫要不要说意义，但当你看到大局时，形式有一种音乐和节奏，比如街道，行业，或者……或者你，你知道，因为詹姆斯·乔伊斯，我可以提到它有一种节奏。它有一种边缘，就像在形式中，我们可以……

可能可以测量这些，是的，我不知道。我乐观地认为我们可以测量一些东西，所以也许……

关于我，我想说的是，平均每句依赖性，对于重音来说，可能是最可靠的。

这是你的感觉。是简单的句子，短的，是的，短的，是的，是的。

我的意思是，如果你有非常长的句子，即使它们没有……

就像它们可以有更长的连接。

长的NS。

我不需要。你可以有一个很长的句子，有很多当地的词，是的，但是，它更有可能具有长与长句子的可能性。

是的，我遇到一个名叫阿斯卡的人，他做了很多事情，他是一位天才，从事头发树木方面的工作，以及一堆东西，但他正在和我谈论与动物交流，他共同创立了地球物种项目，你们试图找到鲸鱼、奶牛和人类之间的共同语言，他说，即使信号非常不同，例如实际的……如果你有一个语言的基底，他们实际上试图交流类似类型的事情，并且……这是你可以评论的事情，比如这方面的希望是什么？你见过不同的文化，特别是偏远地区的文化，这是一种可能性。你知道，他们可以和鲸鱼交谈。

我会说，是的，我认为这根本不算疯狂。我认为这是相当合理的。有一种奇怪的观点，或者说奇怪的你。

我认为认为人类语言是某种特殊的东西是一种奇怪的观点。我的意思是，它可能是……我们肯定比任何其他物种都能做更多的事情。所以，也许我们的语言系统是其中的一部分。

有可能。但是人们经常谈论人类语言，事实上，乔姆斯基谈论人类语言如何具有这种构成性，他认为这是语言的关键。而这个论点的问题在于，他不会说……

鲸鱼语，他……

不会说牛语，他不会说猴子语。你知道，他们说，好吧，他们发出很多咕噜声和吱吱声，这种推理就像……这是糟糕的推理，你知道，我很确定，如果你问一只鲸鱼我们在说什么，他们会说，好吧，我发出很多奇怪的声音，所以这是一种非常奇怪的推理，认为人类语言是特殊的，因为我们是唯一拥有这种语言的物种，好吧，我们不知道其他物种是什么，我们只是不知道。我们还不能和他们交谈。所以那里可能有一些信号，它很可能像人类语言一样复杂。我的意思是，当然，对于大脑较小的物种来说，这可能不是一个很好的沟通系统，但在这些高级物种中，你拥有……你知道，似乎是……沟通能力，那里可能比我们之前想象的要多得多信号。

但是我们也有很多身体。这里有人正式来自我的T区，氧气，他做了很多关于他与植物交流的工作。所以，是的，那里的信号甚至更少，但这并不排除所有自然界都有沟通方式的可能性，这是一种非常不同的语言。但他们确实通过化学物质发展了一种语言，某种相互沟通的方式。如果你对这种可能性有足够的谦逊，我认为你可以……我认为在几十年，也许几个世纪后，希望不是……谦逊地认为能够有效地进行人类之间的沟通，以及地球上所有生物之间的沟通，这将是非常有趣的。

好吧，我的意思是，我认为有些树木没有什么有趣的事情要说。所以我们不知道。我们当然不知道。

我认为，谦逊地说，那里可能有一些有趣的树木。

好吧，他们可能在和其他的树木交谈，对吧？他们没有和我们交谈。所以，在他们交谈的程度上，他们对某些……你知道，你不能具体说明丢失率。

所以那里可能有一些信号。所以有些人认为人类语言是特殊的，不同于任何其他动物的沟通系统，这很常见。而我认为没有证据支持这一说法。我认为这并不明显……我们不知道，因为我们不会说这些其他的沟通系统。在我们得到更好的……你知道，我认为确实有人在研究这个问题，正如你指出的那样，有人在研究鲸鱼语，例如，这真的很吸引人。

让我问你一个疯狂的问题，安全的问题。如果我们与一个智慧的外星文明取得联系，并且你遇到了他们，你认为有多难？你会对他们的沟通方式感到多么惊讶？你认为你会认出它吗？当你前往偏远地区时，这里可能有一些相似之处。

我的意思是，我认识一个名叫希思的人，他擅长学习外语。所以他就像……这是一个惊人的壮举，对吧？能够学习一种没有翻译的语言，皮奥语。

我的意思是，他确实……好吧，之前有人去过那里。他不太好。

所以他学习这种语言比其他人学得都好。他擅长……他只是一个非常外向的人。我认为这是很大一部分，能够互动。所以我不知道是什么样的……这取决于这些……来自太空的物种，他们有多想和我们交谈。

关于他遵循的过程有一些话要说，比如你如何出现在一个部落并进行社交？我的意思是，我认为颜色和计数是最容易弄清楚的事情之一。

是的，你开始，你实际上是从物体开始的，是的，然后假设你只是扔下棍子，然后说“棍子”，当你叫这个时，你再说未来，然后他们会说那个词，无论是什么，他说标准的做法是扔两根棍子，然后两根，然后他很快学会了，在这个语言中没有任何计数，因为他们不知道这很有趣，他有点奇怪，他们会说某人或某物是一样的。

我们一遍又一遍地重复。但那是标准的做法。你只是尝试，但你必须在社交方面非常开放，愿意与陌生人交谈，而这些人与你非常不同。他非常善于社交。所以我认为这很大一部分是，这就是你如何认识很多人，他们会说很多语言，因为他们愿意与人们交谈。

那很难。我们什么都不知道就出现了。是的，哦，多么美好的人类能够以这种方式联系，是的，你拥有令人难以置信的职业生涯，探索这个迷人的话题。你会给年轻人什么建议，关于如何拥有这样的职业或他们可以引以为豪的生活？当你看到……

一些有趣的东西，就去做了。就像我一样。我这样做，这对于大多数人来说是不寻常的。所以，当我看到那些人，彼得·胡可以来拜访我们时，我就说，是的，是的，我会去的。

然后当我们无法回去时，我们在巴西政府遇到了一些麻烦，有一些腐败。回去非常困难。所以我就像，我必须找到另一个群体。

所以我们四处寻找，我们找到了改变，因为我想继续研究这类问题。所以我们找到了特蒙特，就去那里。我并没有真正……

我们没有。我们可以进行少量接触，带来某人，那是，你知道，你只是尝试。我说这就像很多，这就像野心。尝试做一些别人没有做过的事情。我只是想试试看，我的意思是。

我一直这样做。我喜欢它，我喜欢你的快乐追求把你带到这里和我交谈的事实。这是一次令人难以置信的谈话，你是一个……你只是个更快的人。感谢你今天和我一起踏上人类语言之旅。

这……非常感谢，很高兴。

感谢收听与爱德华·吉布森的对话，要支持这个播客，请查看我们描述中的赞助商，现在让我留下一些话，我们语言的局限性意味着我们世界的局限性。感谢收听，希望下次再见。

#426 – Edward Gibson: Human Language, Psycholinguistics, Syntax, Grammar &#038; LLMs 03:00:32 Share

Lex Fridman Podcast

Deep Dive

Shownotes Transcript

#426 – Edward Gibson: Human Language, Psycholinguistics, Syntax, Grammar & LLMs