For thousands of years, we've thought of language as one of the key features that makes humans unique. But with the rapid evolution of large language models, the line between human communication and AI is starting to blur. On this episode, we explore the possibilities and limits of AI-generated language, how it's changing the way we communicate, and the implications for what it means to be human.Learn more about sponsor message choices: podcastchoices.com/adchoicesNPR Privacy Policy</context> <raw_text>0 在《北方要点》播客中,你将听到来自五大湖地区精彩的故事。我应该说,我在伊利湖畔长大。卡普河。那是我们最后去的地方。我来自Wukwemcung原住民部落。人们普遍认为白鱼角拥有最糟糕的场地条件。这可不是梅斯基特湖或白湖。朋友,这是五大湖。
收听来自NPR和Interlochen公共广播的播客《北方要点》。这是《脉搏》,关于健康和科学核心人物和地点的故事。我是梅肯·斯科特。基因治疗研究员斯特凡·卡达基正在撰写一篇关于最近去里约热内卢出差的博客文章。这篇博客文章是关于费城儿童医院和巴西国家癌症研究所之间合作的。
这篇博客文章还提到一个有趣的细节,即这种合作完全是偶然发生的,当时斯特凡在2022年去里约参加狂欢节。所以,
所以他正在敲打这篇文章。他的电脑上有一个谷歌AI应用程序,他看到只需点击几下,他就可以将这篇文章转换成由人工智能语音驱动的两个主持人的播客。所以
所以他心想,为什么不呢?几分钟后,应用程序就完成了。这个巴西项目非常吸引人。所以科达基博士去里约参加狂欢节,不知何故最终引发了整个合作。太疯狂了。对。就像你在电影里看到的一样。是的。这一切都始于那次旅行。他看到了与INCA合作的机会。那是巴西的国家癌症研究所。他们拥有专业知识。但像许多国家一样,他们也在努力应对这些成本。斯特凡印象深刻。
它实际上对材料进行了推理,突出了关键思想,并使整个故事更引人入胜。但它也有一些令人不安的地方。它既令人印象深刻,又有点滑稽。人工智能语音甚至说,“呃”和“呃”。所以听起来像真人。老实说,它听起来有多自然,有点令人毛骨悚然。我也觉得很毛骨悚然。听起来太真实了。
区分人工智能生成的语言和人类语言变得越来越困难。你会发现自己想知道,我在和人说话还是和机器人说话?人类语言是我们独有的关键因素之一。这是我们表达自己的方式,是我们分享和联系的方式。那么,人工智能生成的语言的存在对我们的存在意味着什么?它是否挑战了作为人类的意义?
与此同时,人工智能正在提供研究语言和获得对交流的全新见解的新方法。在本集中,人工智能、语言,以及我们是在使用工具还是工具在使用我们?
首先,让我们听听一位语言学家怎么说,她一直对围绕大型语言模型(如ChatGPT)及其能力和局限性的一些炒作持批评态度。艾米丽·本德。她是华盛顿大学的语言学教授。几年前,她合著了一篇被称为“章鱼论文”的文章。
这是一个思想实验,一个虚构的场景,突出了大型语言模型的能力和局限性。这个思想实验涉及两个人,他们是英语使用者,被困在两个荒岛上……
并且彼此隔开,但他们可以看到对方。他们可以看到那里还有其他人,他们发现有一些电报设备。他们都会莫尔斯电码,所以他们开始互相发送信息。但很快,一只超级聪明的深海章鱼发现了传输信息的电缆。它长期追踪着通过的模式。
然后有一天,它变得顽皮起来,它决定要剪断电缆,因为它有剪刀(因为这是一个思想实验),并开始将点和划线发回给其中一个英语使用者,冒充另一个人。
但问题是,它什么也没理解。它只知道接下来可能出现的模式。一个被困的人发送了一条消息。“多么美丽的日落。”章鱼回过来,点和划线加起来是,“是的,它让我想起了熔岩灯。”
但当然,章鱼不知道日落是什么,熔岩灯是什么,甚至不知道这些词的意思,对吧?两个人互相更新他们在岛上的生活和成就。“嘿,看,我做了一个椰子弹弓。让我给你看看。”章鱼回过来,“不错、酷、干得好”之类的话,这些话只是在这种情况下可能出现的话。但有一天,其中一个人发送了一条求救信息。
救命!我被熊追赶了。我只有一根棍子。我该怎么办?现在章鱼被难住了。它发回的任何东西都不会有意义。我们在论文中的笑话是,如果章鱼能侥幸逃脱这么久,那么这个人(如果他们在熊的袭击中幸存下来)就会发现他们不是在和另一个岛上的人说话,而是在和一个只是向他们发送看似合理的字符串序列而不是任何有帮助的东西的东西说话。而这……
涉及到大型语言模型和语言以及语言是什么的一个重要论点,那就是意义的作用以及语言如何具有意义。它什么时候有意义?你如何表达?语言从哪里获得它的意义?
是的。所以作为一名语言学家,我看到了意义的两个层次。一方面,我们称之为约定俗成的意义。也就是说,在一个言语社群中,我们对像书、猫、狗、彩虹、睡眠这样的词的指称有共享的知识,你知道,它不一定是名词,这些东西指的是什么。这是我们在彼此交谈时都可以利用的资源。
然后第二个层次是真正的交际意图。那就是当我们选择一些词,以某种顺序、在某种语境下说出它们时,我们试图表达什么。这两者都是意义。语言模型唯一可以访问的是第一个层次的影子。
因为意思相近的词会在相似的语境中出现。这就是语言模型所建模的一切。我想,即使是彼此交谈的人类也会为此而苦苦挣扎,当我们使用短信时,对吧?因为第二层很容易丢失。
在这些简短的书面交流中,我们有时会推断出不存在的交流意义。所以我可能会读到这样一句话,“我会马上到那里”,以一种快乐的方式。或者我可能会读到,“我会马上到那里”。但有时,即使是我们人类彼此交谈,这种意义也会丢失。
是的,绝对的。这是一个很好的短信例子。所以语言的基本用途是面对面的共同存在的交流,在那里我们可以看到对方,我们共享相同的环境,并且
我们拥有所有融入我们语调、语气的因素。我们是否在微笑?你可以在广播中听到微笑。但在短信中,你却看不到。因此,当我们只有文字和一些表情符号时,我们必须进行更多的推断,这与我们面对面交流时所做的事情相比,后者仍然涉及推断,但它基于更多信息。
在你的另一篇著名论文中,你将语言模型描述为随机鹦鹉。它们基本上是在重复,它们将事物拼接在一起,以赋予它们似是而非的意义和感觉。告诉我你的确切意思是什么。
是的,所以“随机鹦鹉”这个词真的流行起来,这很有趣。这是一种生动地表达这些系统没有理解、没有思考、没有推理,然后给出答案的概念的方法。相反,正如你所说,它们是从训练数据中拼接字母序列,甚至不是单词,以匹配概率的方式。
这就是随机性很重要的原因。它不仅仅是随机的。它不仅仅是掷骰子并选择任何结果,而是根据概率分布随机的。所以所有关于哪些词一起出现的信息都会影响输出选择的决定,这使得它看起来很合理,但它仍然只是概率。
鹦鹉学舌,你知道,我不会贬低这些可爱的动物,我相信它们有内在的生活。但这就像英语动词“鹦鹉学舌”,意思是重复而不理解。所以它只是根据训练数据中的概率随机地重复事物,而没有理解它们。对此,有些人争辩说,这就是我们。我们都是随机鹦鹉,对吧?我正在重复你所说的话。
无论我说什么,我都是从其他人那里得到的,所以我也是在鹦鹉学舌,这可能是论点。是的,我听过这个论点,这是一个非常不人道的论点,因为我们确实从其他人那里获得想法,并在其基础上进行构建,我们从其他人那里学习短语,并重复使用它们。但当我们这样做时,我们这样做是因为它们对我们有意义,我们这样做是为了进行交流。将我们的经验和活动简化为其可观察的形式
以便你可以声称语言模型与人类一样好,这实际上是贬低了作为人类的意义。对你来说,这真的是这里问题的核心吗?为什么这如此重要?这是其中一个重要部分。我认为我们真的需要捍卫
作为人类的意义,以及作为整体的人类,正如华盛顿大学艺术学院院长所说,还要真正看到我们对世界的理解、工作和创造力的价值。如果我们允许这种科技公司的做法,“好吧,如果我能制造出看起来像它的东西,那就足够好了。”
成为讨论的框架,那么我们真的放弃了很多我们应该坚持和坚守的阵地。现在,我们与之互动的许多聊天机器人显然是为了让我们相信它们是人类,并且它们有理由让我们与平等的人交谈。为什么?为什么要这样做?
这是一个非常有趣的问题。这背后有很多设计选择,对吧?聊天机器人绝对没有理由使用“我”代词,因为里面没有“我”,对吧?但它们被设计成这样做。我认为部分原因可以追溯到试图构建熟悉且易于使用的系统的历史。有一种观点认为,技术无摩擦是好的。因为我们习惯于使用语言与他人交谈,那么如果我们可以以同样的方式与计算机交谈,
那么计算机将易于使用。我认为这就是一些愿望。我认为这真的很误导,因为这是一个设计选择,它使得难以理解系统实际上能做什么以及你可以和不应该将它用于什么。所以我记得那个旧的,你还记得当你写东西时会弹出的旧回形针吗?我一直觉得回形针很烦人。是的。
但我同时也知道回形针不像我,你知道,所以感觉就像,好吧,这个东西有点烦人,但它非常清楚。我们的关系非常清楚。而如今,我发现自己越来越困惑。
是的,是的,完全正确。我认为使用拟人化设计选择是可以的。所以回形针,你知道,它不像人一样,但它有眼睛和笑脸,对吧?当然,从回形针中出来的语言,再次,好像里面有一只眼睛在说话,但它的功能是明确限定的,很容易理解它能做什么和不能做什么。
我们现在拥有的大型语言模型是那些在如此多的数据、如此多的主题和如此多的不同风格上进行训练的东西,它们可以模仿几乎任何东西。因此,明确其功能的边缘变得尤为重要,而不是用这种拟人化的光泽来模糊它。
你认为我们是否有能力与听起来像我们一样的东西交谈,而不会假设它确实像我们一样?拟人化的趋势非常深远。人们经常指出,我们看着电源插座,看到一张脸。
我们一直在寻找世界上的其他人。因此,一些呈现为人的东西是危险的。如何?这里有什么危险?再次有什么风险?
所以在个人层面,存在巨大的错误信息机会,对吧?如果你拥有一个以权威的方式说话并采用维基百科文章或医学解释器等语气的东西,那么很容易将其视为知识渊博的东西,然后根据不正确的信息做出错误的决定。
所以在个人层面,这是一种巨大的问题。你上升一级,你会考虑我们的信息生态系统。人们获取这些信息,“嘿,ChatGPT告诉我”,然后他们把它放到世界上。他们不一定说明他们从哪里得到它。现在我们有污染在信息生态系统中流动。你知道,我试图,我正在和我女儿一起写一篇论文。当然,
现在的问题是,你是否仍然需要学习如何为你的英语课写论文?你知道,写关于伊利亚特主题的四百万篇论文有什么意义?但有可能她可能会看到一些新的或有趣的东西,或者它会让她思考,而不是像这个东西一样吐出论文。是的。
没错。这里面有一系列非常重要的问题。我们要求高中生写论文并不是为了保持世界高中论文的供应量。这不是这项练习的目的,对吧?学习写作是为了学习如何参与思想、组织思想和发展论点。如果你只是将合成文本放入你的文档中,你就没有做过任何这些事情。
但你可以复制粘贴。你可以复制粘贴,是的。所以这真的取决于老师们要明确我们为什么要做这项工作,做这项工作的价值是什么。你知道,这是一个有趣的挑战,也许是当前时刻的一线希望,因为这是我们一直应该做的事情。现在我们被迫去做。我给艾米丽播放了一些我们之前听到的人工智能生成的播客,这些播客是关于去巴西进行研究旅行的。
这是一次疯狂的旅程,从里约狂欢节的中心直接进入一些严重的癌症研究。是的,我们正在谈论CAR-T细胞疗法。这是一个很好的例子,说明有时最好的解决方案是跳出框框思考,对吧?连接你意想不到的那些点。完全正确。所以在我们进入桑巴和科学的联系之前,让我们确保每个人都在同一页上。好的,对我来说……
这是一台机器,它获取书面语言,将其转换成对话,它听起来有点像我在NPR的《早间版》上听到的东西。是的,是的。我不得不说,在各个地方都超级令人尴尬。艾米丽,你必须跳出框框思考。对,对。天哪,巴西和科学不知何故不在一起的想法,当然巴西也在进行科学研究。是的。
所以这部分令人尴尬,但你从一个真实的人那里也可能会遇到令人尴尬的事情。是的,声音非常流畅。如果你想想我们习惯于从火车站的广播中听到的文本转语音技术,即使现在他们仍在使用相当笨拙的文本转语音技术。
这个,你无法检测到它,对吧?听起来非常流畅。它像“呃”一样有犹豫。所以它听起来真的像是来自一个人。这让我想知道,你知道,他们为此使用了什么训练数据?如果这是谷歌,几乎可以肯定的是,这背后是一堆YouTube内容,我猜,才能训练它,对吧?是的。
所以,好吧,你得到了一些令人信服的东西。如果你遇到它,如果收听这个节目的某个人只听到那部分,而没有听到前后部分,
他们很容易相信那是真人谈论的事情。在一个人实际上在他们的博客文章草稿中写的东西(他们对内容负责)到进入播客的内容的转换中,事情会潜入进来,对吧?自动化的问题之一是它允许你快速地做事。因此,如果有什么不对,你可以一遍又一遍地造成这种伤害。而且
这也意味着我们很少有时间真正彻底地检查,我们是否喜欢他们所说的?对吧?它说,播客版本实际上,它是否足够忠实?是否出现了一些我们不想放到世界上的东西?如果它出现在世界上,谁对此负责?我认为解决这个问题的方法是真正擅长引用我们的来源,并坚持在我们所引用的来源中引用来源。
并公开重视真实性,例如明确说明这来自真人。这就是我找到信息的方式。如果你想回去检查,这里是你可以继续关注的地方。合成版本将开始模仿它,因为它最终会进入训练数据,但它们实际上不会做得很好,对吧?如果引用的来源甚至是一个真实的来源,它们将无法可靠地连接到它。这将是我们用来区分的剩余内容。
艾米丽对这些大型语言模型还有另一个重大担忧。这些系统吸收然后放大偏见的方式。所以我们正在获取包含所有这些东西的训练数据,谁知道是什么,因为它没有被很好地记录。我们不知道训练数据中有什么,但我们可以肯定的是,它反映了各种偏见。因为这些系统只是获取概率,它们也会获取这些概率并再次输出它们。
还有其他方法可以保护我们的口语和书面语不被吸入这个漩涡吗?就像听到这个播客一样,我不得不说我有点生气,因为我想,哇,这是基于人类创造的东西,对吧?努力工作。机器吸收了它,然后吐出来。砰。听起来不错,对吧?但是我们有没有办法捍卫我们自己的语言?
反对这个。是的,这些都是有趣的问题。我只是想指出,吸入它的不是机器。是建造机器的人。是的,是的。这背后有人为因素。这是有人为因素,并且有盈利动机,尽管目前还不清楚是否有人通过这些东西赚钱。
但下一步不是,那里没有明确的利润,但每个人似乎都认为有。所以这就是窃取所有这些数据的动机。我认为,你知道,这些过程很慢,但我了解到现在有一些法院正在审理此事。所以我们也许能够做一些澄清。
通过监管进行集体反击。然后只是在个人层面,你可能会三思而后行,你把什么放在云端,以及你把什么放到世界上。关于语言和这些大型语言模型,你认为未来会发生哪些事情?需要注意哪些事情?
我认为始终值得关注它们被集成到系统中的不同位置,并保持怀疑态度。作为一名语言学家,我很感兴趣地看到,当人们故意以更具创造性的方式使用语言来区分我们所说的内容与机器的输出时会发生什么。我认为这可能会很有趣。但总的来说,我认为随着我们弄清楚如何区分合成文本和经过身份验证的文本,这将变得很重要且有趣。
真实的文本和语音,并真正标记和重视真实的文本。你能举个例子说明如何以更具创造性的方式使用语言来区分我们自己吗?是的,所以基本上是提出新的隐喻,例如提出新的俚语,训练数据中没有的东西。社会语言学家观察到的一件事是
各种压力可能会推动语言的快速变化。因此,如果你有一个被污名化和边缘化的社区,他们可能会迅速发展和转变俚语,以确保他们的语言不被外人理解。
所以这是一个不同的情况,但可能会导致类似的结果,如果我们有这些输出可能出现的下一个词的系统的同质化力量,如果人们开始将它们用作写作助手,那么你将获得非常相似的文本。然后人们就有空间通过提出新的隐喻、创造新术语、以新的方式使用单词来区分自己。这可能是一个令人兴奋的语言时刻。
艾米丽·本德是西雅图华盛顿大学的语言学教授。你正在收听《脉搏》。我是梅肯·斯科特。我们正在谈论人工智能和语言。接下来,人工智能如何帮助保护濒危语言。所以我教它。我说,这是水的词。这是喝的词。这就是你说的,我喝水。现在,你会怎么说他会喝水?
接下来是《脉搏》。此消息来自Stamps.com。Stamps.com简化了您的邮寄需求,并为您的工作日节省了宝贵的时间,让您有更多时间专注于只有您才能做的事情。访问Stamps.com,并使用代码NPR享受特价优惠。
我是塔尼娅·莫斯利,《新鲜空气》的联合主持人。在一个充满声音片段和短暂注意力跨度的时代,我们的节目完全是深入探讨。我们对电影、书籍、电视、音乐和新闻界最佳作品背后的人物进行长篇访谈。在这里,我们的嘉宾以你从未听过的方式敞开心扉,谈论他们的过程和生活。收听来自NPR和WHYY的《新鲜空气》播客。
收听来自NPR的《流行文化快乐时光》播客。
当马尔科姆·格拉德威尔向NPR的《贯穿始终》播客颁发皮博迪奖时,他赞扬了它的历史和道德清晰度。在《贯穿始终》中,我们将带你回到新闻事件的起源,例如总统权力、衰老和福音派。每周都与我们一起进行时间旅行,收听来自NPR的《贯穿始终》播客。
这是《脉搏》。我是梅肯·斯科特。我们正在谈论人工智能和语言。到目前为止,我们已经了解了模仿人类语音的大型语言模型。现在,让我们来看看人类如何使用人工智能来研究语言并获得新的见解。
全世界大约有7000种语言,它们不仅仅是帮助人们交流。语言是一个群体身份的重要组成部分。它们是将历史、文化和遗产联系在一起的纽带。但今天,世界上近一半的语言濒临灭绝,预计到本世纪末将灭绝。
母语使用者正在消失,土著社区仍在应对政治迫害的后果,几个世纪以来,政府强迫他们放弃自己的语言。人工智能可能是保护这些语言的重要工具,但有一些障碍可能会妨碍这一进程。妮可·库里有更多信息。
当贾里德·科尔曼上大学时,他听到了他曾曾曾祖父的声音。这是一次令人惊奇的经历。贾里德是加利福尼亚州欧文斯谷大松树派尤特部落的成员。这段录音代代相传,它是加利福尼亚州主教市大型语言档案的一部分。
贾里德的远祖正在说他们的母语派尤特语。我第一次听的时候,我不知道他在说什么。在成长的过程中,你知道,每个人都知道一些词。你知道,你知道,比如水的词,坐的词,你知道,这里和那里有一些随机的词。但是
我根本不会说这种语言。偶然发现这段录音是学习这种语言的途径。贾里德开始浏览这个档案,收听长老的录音、研究人员和语言学家进行的采访。他甚至找到了一本词典。所以他决定利用这些资源学习派尤特语。
贾里德是一位计算机科学家,所以他也在想,他是否可以利用这些技能使这个过程更容易被其他人接受,有点像Duolingo。他首先建立了一个在线词典。但真正随着ChatGPT和大型语言模型的爆炸式发展,我第一次看到了在这个领域进行研究和学习的机会
我看到了将人工智能用于濒危语言复兴的潜力。像谷歌和OpenAI这样的大型科技公司已经开始使用机器学习来复兴濒危语言,希望将它们从灭绝中拯救出来。本质上,机器学习模型将根据互联网上的例子进行训练,但这对贾里德来说成问题了。
尽管贾里德的部落拥有这个录音档案,但派尤特语被认为是一种低资源语言。这还不够。例如,谷歌翻译已经使用机器学习模型一段时间来进行翻译了。它的工作方式是,它接受数百万甚至数百万个句子的训练,直到它学会如何翻译。
你不能对濒危语言这样做。我们只是没有那么多句子。这对许多土著语言来说是一个障碍。所以贾里德试图为派尤特语解决这个问题。
也许我们不给它很多例子并像传统的人工智能方法那样训练它,而是给它关于语言的规则。我们给它一个词汇表。然后使用这些规则,因为ChatGPT非常聪明,对吧?它可以弄清楚如何构建我们想要构建的句子。然后我们会看看你的表现如何。所以我教它。我说,这是水的词。这是喝的词。这就是你说的,我喝水。对吧?
然后,这就是你称呼“他”的方式。现在,你会怎么说“他会喝水”?你明白我的意思吗?所以,就像,我在测试它。我没有给出答案,但我给出了足够的信息,让人类能够弄清楚这一点。
这个工具被称为大型语言模型辅助规则型翻译。高级语言使用者和教师与Jared描述的工具一起工作,由于这个独特的过程,它还有一个优点:当它不知道答案时,它不会像其他聊天机器人那样输出错误的翻译。
就像当你和Chachupiti交谈时,你永远不应该假设它是准确的,因为它总是编造东西。Chachupiti可以很有创意和趣味。所以你永远无法区分它是在发挥创意还是在编造东西。
Jared说这个系统知道它的局限性。例如,如果我问,我如何在Paiute语中说“我要吃面包喝水”?我们的翻译系统基本上会说,“好吧,我不知道怎么说”,因为我只知道如何翻译非常简单的句子。但我可以告诉你如何说“我要吃面包”、“我要喝水”。
Jared说他的模型仍处于起步阶段,但他希望该工具能够提供准确的翻译,并帮助新一代学习和说他们的母语。在新西兰的另一边,毛利人,另一个土著群体,在使用人工智能复兴他们的语言时遇到了不同的问题。
毛利语,被称为毛利语(Te Reo),在19世纪开始衰落。由于新西兰欧洲人口的增加,毛利语开始衰落。
除此之外,还有强烈的语言歧视。那是彼得·卢卡斯·琼斯。他是毛利人,他指的是1867年的《土著学校法》。该法案禁止在学校说毛利语,这是白人同化过程的一部分。
这意味着试图在学校说这种语言的孩子会被殴打。直到20世纪80年代,《毛利语法案》才将毛利语确立为新西兰的官方语言,与英语并列。这是为了劝说社区说他们的母语。但到那时,能够流利地说这种语言的人已经少得多了。
彼得·卢卡斯是名为Tehiku的广播公司的首席执行官,该公司三十年来一直在收集已录制说话者的档案。所以我们一直在……
运营部落广播30年,运营广播基础设施,包括广播、电视和我们的模拟型内容创作。但我们很快了解到,数字化我们的语言不仅是出于档案保存的目的,而且是为了确保我们的语言在世界数字未来中占有一席之地。
记住我们的语言属于濒危语言之列。Tehiku最终决定基于这个档案构建一个语音到文本模型,但这证明是一个复杂的过程。例如,有时一个词的发音会改变其含义,这会导致错误的翻译。不同单词的语音拼写和发音
影响了模型的准确性。因此,他们需要对程序进行基准测试,逐字更正。这就是我们所做的。我们教我们自己的人如何标记和标记语音数据,如何标记和标记语言数据。
考虑到语境,文化语境。彼得·卢卡斯强调,翻译的准确性至关重要。昨天,我在一个大型科技翻译工具中用毛利语写了一些东西。我用毛利语写的是:“男人和女人,要保住这片土地”。
它给了我一个英文翻译,而这个英文翻译是“白人男子,白人女子,保住这片土地”。所以我想说的是,重要的是,作为土著人民,我们实际上要设定翻译质量、发音质量、准确性和精确度的基准。
因为否则我们所做的就是,我们在开发大型科技公司为我们领导的结果时被排除在外。彼得·卢卡斯说,他们的语音到文本模型的准确率达到了92%,超过了大型科技公司的类似尝试。他们还推出了一款应用程序,可以提高用户对Tariho的发音。
除了为他们的社区构建准确的工具外,土著群体还强调拥有他们收集和使用的数据的重要性。彼得·卢卡斯说,这有点像掌控你自己的命运。
许多土著群体多年来一直被边缘化,并被剥夺了他们的文化。甚至一些早期的语言保护项目也把档案锁在大学里,远离那些可以从中受益的人。因此,创建这些有用的资源并拥有它们,决定了它们在未来将如何被使用。我们的工具只能用于善事。
我们希望确保我们创建的工具能够改善我们社区成员的生活,并且不会造成任何伤害。这就是拥有数据很重要的原因。这个故事是由妮可·库里报道的。
接下来,一位研究人员正在挖掘四十年来的录音档案,以了解口语是如何随着时间变化的。在她谈话的中间,她说,“总是有很多人,因为我工作时间是早上7点半到下午3点”。她实际上发音“work”这个词时,与大多数/ə/相比,她的舌头向前移动了一点点。
你可以看到她如何在不同的语境下调节她在“work”中/ə/的发音。接下来是《脉搏》节目。
在Planet Money播客的《指标》节目中,我们在这里帮助你理解特朗普关税的经济新闻。在博弈论中,它被称为触发策略,有时也称为严厉触发,这听起来有点像牛仔。关于主权财富基金究竟是什么。为了获得每天的见解,请收听NPR的《指标》节目,来自Planet Money。我们都经历过这种情况,在城市里四处奔波,寻找洗手间,却找不到。
请问你们有洗手间可以使用吗?一个非常简单的自由市场解决方案是,我们可以付费使用洗手间,但我们不能。在Planet Money播客中,关于我们曾经拥有数千个付费厕所以及为什么它们被禁止的故事。来自NPR的Planet Money,无论你在哪里收听播客。
精彩的谈话才能成就精彩的派对。但是,你如何提出真正让房间活跃起来的问题呢?好吧,在Life Kit这里,我们帮到你。你几乎走过但没有走的路是什么?在我们最新的节目中,如何提出能让你的派对闪闪发光的神奇问题。收听NPR的Life Kit播客。这是《脉搏》节目。我是迈克和斯科特。我们正在讨论人工智能和语言。
大型语言模型正在帮助研究人员获得关于语言的新见解。例如,通过挖掘一个宝贵的收藏,其中包含数百小时的录音,这些录音是在四十年间收集的。它们是在费城街头收集的,目的是真正了解口语是如何变化的,这种变化的速度比我们从研究书面文本中收集到的要快得多。
一位语言学先驱在20世纪70年代开始了这项工作,现在新一代的研究人员正在继续他的未竟事业。格兰特·希尔有更多信息。约书亚·普洛特金是宾夕法尼亚大学的生物学教授,他使用数学来研究生物学,特别是生物体的进化以及驱动这些变化的原因。
他说,同样的数学模型也可以用来理解截然不同的环境中的变化。对我来说,研究病毒的进化(我确实在做)或生物体的进化同样有趣,但文化和行为的进化也一样。该领域为理解病毒如何进化而开发的数学模型……
也可以应用于,并且正在应用于文化进化。归根结底,无论什么类型的变化,都归结于概率。你拥有的数据越多,你对该概率的分析就越准确。这就是约书亚研究语言进化的原因。数千年来书写和书籍中捕获的大量数据。
这就像一个化石记录,与自然界中任何可以找到的东西都不一样。因此,自古以来,人们就一直在做这种工作,利用文本来追踪新的发明和大规模迁移如何影响单词和语法的演变。
约书亚认为他的数学模型可以解锁新的发现,隐藏的模式和力量,这些模式和力量悄悄地塑造了我们今天的谈话方式。但是当他告诉他的语言学家朋友们他想对这些珍贵的印刷材料进行什么样的分析时……
他们并没有那么兴奋。也许这很有趣,但他们觉得,“这并不是真正的语言”。语言就像我们现在正在做的。就像,我在说话,你在听,你在说话,我在听。他们说,真正的语言是口语,而不是书面语。这真的很复杂。它很混乱。
它很快,而且不知何故毫不费力。对于语言来说,变化很快,每天都在无数的随意互动中发生。就像你第一次听到你的新邻居在垃圾还没被收走时说“sheesh”一样。第二天,你发现自己在杂货店没有你最喜欢的酸奶时也说了同样的话。
或者可能是发音。一位同事说“either”,现在你这样说,而不是“either”。我想,“如果我们有一些关于口语如何随着时间变化的数据集就好了?”那将是研究一个真正重要的文化变革的宝库。
然后约书亚发现这种金矿确实存在,就在校园对面步行15分钟的路程。是的,我们有整整一书架这样的活页夹,你可以看到每个活页夹都有,如果上面写着pH 73……
梅雷迪思·塔明加是宾夕法尼亚大学的语言学家,也是费城邻里语料库的守护者,该语料库收集了四十年来对费城普通民众的400多份录音。
从1972年到2012年。当我还是研究生的时候,所有这些材料都以硬拷贝的形式保存在磁带柜里。当时,比尔的实验室是一座古老的维多利亚式房屋。我只是害怕建筑物着火。因为这是所有这些录音的唯一副本,这些录音来自社会语言学历史上史诗般的跨度。该项目是梅雷迪思的长期导师威廉或比尔·勒博夫的创意。
这是他三年前在虚拟颁奖典礼上发表的讲话。我33岁时开始学习语言学。我曾在一家工业化学公司工作了10年,我带来了数值记录的习惯。1961年,勒博夫辞去了化学家的工作,回到哥伦比亚大学上学,并如他所说,开始追求人类语言的普遍特性。
当勒博夫进入该领域时,语言学家已经开始转向研究口语而不是书面语,探究人们是如何说话的。
这是梅雷迪思再次发言。外勤人员会去,他们会试图在一个小村庄里找到有代表性的人。他们会说,“给我你们最老的农民”。然后他们会说,“这是我的词表”。都是,你知道的,有点像农具术语。比如,你怎么,你知道的,你管这种犁叫什么?你管那种犁叫什么?比尔·勒博夫看到了这种方法的两个问题。第一个是所有的笔记。
我突然想到,该领域可以从这项新发明的采用中获益,即录音机,并保留人们实际上所说的话。如果你可以记录人们说话的声音,你以后可以测量他们产生的声波,并捕获一种全新的数据形式。可以分析这些数据以确定说话者说话时舌头的确切位置。
尽管如此,勒博夫知道,如果你找不到解决另一个问题的办法,这些数据点将毫无用处。事实上,被研究人员提示和观察会改变人们的说话方式。他们可能会感到不自在,使用不同的词语,或者试图掩盖地区口音。所以勒博夫想要完成一个新的观察水平——
记录人们日常的语言,同时以某种方式让他们感到足够舒适,以至于不会去想他们使用的语言。他的早期工作产生了革命性的成果。勒博夫第一次能够展示阶级和社会态度如何影响单个单词、短语甚至发音。
现在这似乎显而易见,但勒博夫用数字来证明这一点。他可以量化这些压力,衡量它们对人们如何说某些元音的影响。但最终,他想把这项工作更进一步,以捕捉这些表达方式如何随着时间变化。为了完成所有这些,他开始在宾大开设一门全新的语言学课程,称为Ling 560——
梅雷迪思作为研究生学习了这门课程。这门课真的与我所上的任何其他课程都不一样。这是一年制的,作业很奇怪。
学生们必须四人或五人一组,在费城找到一个街区,街道一侧只有停车位。这些是人们在物理上更靠近的地方的街区。互动和语言交流的沃土。学生们会画出他们选择的街区的图画,认真研究它们,同时尽量不被注意。
比尔会教你的其中一件事是,不要穿着宾大的运动衫出去。尽量打扮得像个普通人。然后,学生们一个接一个地向邻居介绍自己。你好,我是一名研究人员,我来自宾大,我有一个麦克风。我可以录下你的声音吗?他们没有提到他们正在进行一项关于语言的研究。他们会询问人口统计信息,人们在这个街区的历史。
关于童年游戏的问题,甚至人们是否曾经打过架的问题。这些主题的设计是为了让人们觉得有趣或会参与谈论的事情。
我一开始是SEALs女孩,后来被降职到仓库。这种情况持续了40年,比尔·勒博夫派了几代研究生到费城各地,让人们敞开心扉,真诚待人。他们有一个SEAL,我永远不会忘记有一天,我赚了116美元,他们把它从我这里拿走了,给了这个老SEALs女士,因为我被商店称为临时工。我太生气了,我大喊大叫,他们把我降职到仓库。♪
人们分享了关于他们生活、他们的恐惧的私密细节。这就是为什么,至少目前为止,没有多少研究人员可以接触到这些磁带。少数被选中的人之一是约书亚·普洛特金,这位生物学教授的办公室就在校园对面几分钟的路程。
他们有400个不同说话者的录音,包含大约200万个说出的单词。当他在隔壁发现这个数据宝库时,他开始阅读勒博夫的分析和结论。
勒博夫的研究人员手工抄录了所有录音,将单词与声波匹配,并绘制了人们在发出这些特定声音时舌头的确切位置。这项工作带来了新的观察结果。它发现某些元音在100年内其发音发生了非常剧烈的变化。想想water和wooder,high school和high school。
但约书亚注意到了一些不同之处,那就是人们经常在一次谈话的过程中改变他们如何发音相同的单词。例如,在一份对1952年出生的女性的采访录音中。在她谈话的中间,她说,“总是有很多人,因为我工作时间是早上7点半到下午3点”。她实际上发音“work”这个词的方式不同。
与她自己在谈话中其他地方发出的大多数/ə/发音相比,她的舌头向前移动了一点点。有许多成千上万的其他/ə/元音音素的发音,你可以看到她如何在不同的语境下调节她在“work”中/ə/的发音。
为什么这位说话者突然改变了她从一句话到下一句话如何发音“work”这个词?随机性并非罪魁祸首。这是一件系统性的事情。似乎有什么东西推动着发音来回变化。
所以对我来说,最简单的假设,因为我不是语言学家,最愚蠢的假设是,你可能想以某种方式发音的原因之一是为了避免误解。我想以某种方式发音,这样即使在谈话的语境中,你也不会混淆我指的是其他一些词。所以我们预计,你知道,一次又一次,
人们会选择,或者甚至下意识地,我想“选择”不是正确的词,只是下意识地调节他们的声音产生以避免误解。但是现在,Josh需要一种方法来评估这个假设。为了开始研究这一点,我们必须知道,好吧,当她说“work”以某种方式时,听者听到其他词的几率是多少?
像wake或walk这样的词。以W开头的短词,听起来有点像work,并且考虑到语境,也可能用在那个句子中。这就是ChatGPT发挥作用的地方。
GTP告诉我们的是,考虑到句子结构,“总是有很多人,因为我工作时间是早上7点半到下午3点”,GTP告诉我们所有这些替代词的可能性。事实证明,“work”实际上是最可能的词,也就是她实际上说出的词。但“walk”也很可能。它的可能性大约是“work”的一半。
因此,说话者在说“work”时可能下意识地努力做到格外清晰,就好像约书亚在ChatGPT的引擎盖下看到的那些相同的计算也发生在这个人的大脑深处一样。把她的舌头向前移动实际上是把它从ah和ahk移开。所以她绝对有点
至少在这种情况下,对吧,她对“work”这个词的发音,她对那个声音的产生,就好像下意识地她正在把她的元音音素从唯一可能在那里造成混淆的另一个词“walk”移开,
约书亚的研究仍处于起步阶段。这个例子可能只是一个偶然事件。但如果我们看到同样的事情发生,你知道,超过一百万次,那么我们开始认为,好吧,实际上,确实有一种压力来调节你的感知。
声音的产生,即使是下意识的,也是为了避免误解。这就是我们想要做的研究。在ChatGPT的帮助下挖掘这些档案,他可以更快地完成这项研究。我是格兰特·希尔,来自《脉搏》节目。
这是我们本周的节目。《脉搏》节目是费城WHYY制作的节目,由我们的创始赞助商萨瑟兰家族和联邦基金会提供支持。你可以在任何地方收听我们的播客。我们的健康和科学记者是艾伦·余和丽兹·童。我们的实习生是朱丽安·科赫。
查理·凯尔是我们的工程师。我们的制作人是妮可·库里和林赛·拉扎尔斯基。我是梅肯·斯科特。感谢收听。
嗨,我是莎拉·冈萨雷斯。经济最近一直是新闻的头条。它总是出现在新闻中。Planet Money总是随时解释它。在每一集中,我们都会讲述一个有时古怪、有时令人惊讶、总是引人入胜的故事,帮助你更好地理解经济。因此,当你听到关于加密货币或你的税款究竟去向哪里时,ya sabes。
收听NPR的Planet Money播客。想象一下,一个来自NPR的节目,不像NPR。一个节目,关注的不是重要的事情,而是愚蠢的事情,其中包含关于人们在裤子里走私动物、称职的罪犯和荒谬的科学研究的故事。并称之为《等等,别告诉我》,因为好名字都被占用了。收听NPR的《等等,别告诉我》。是的,这就是它的名字。无论你在哪里收听播客。
每周五在《所有歌曲都被考虑》节目中爱上新的音乐,这是NPR的音乐推荐播客。周五是我们整个节目分享本周所有最伟大的新发行的日子。让寻找新音乐再次成为你生活的一部分。收听来自《所有歌曲都被考虑》节目的“新音乐周五”,无论你在哪里收听播客。