本期节目由Shopify赞助播出。当您将业务切换到Shopify时,忘记选择电商平台的烦恼吧,Shopify是全球电商平台,可在您销售的任何地方为您的销售注入活力。使用Shopify,您将利用与全球领先品牌使用的相同的直观功能、值得信赖的应用程序和强大的分析工具。立即注册,享受每月1美元的试用期,网址为shopify.com/tech(全部小写)。网址是shopify.com/tech。
感受Brooks Running和全新Ghost Max 2带来的极致体验。它们是您应得的跑鞋,旨在简化您的步幅并帮助保护您的身体。在超高堆叠的超级舒适氮气注入缓震层上享受舒适的落地感,让您每天的每一步都轻松自如。Brooks Ghost Max 2。从技术上讲,它们是一种自我保健的方式。Brooks,让我们一起奔跑吧。访问brooksrunning.com了解更多信息。
这里是《难以解释》。我是诺姆·哈森费尔德。几个月前,我去科罗拉多州参加了阿斯彭思想节。这是一个汇集了众多科学家、记者、政治家、教师以及各种各样的人们,一起交流和展示他们想法的节日。
我当时在那里为《难以解释》录制了一场关于动物交流的现场对话。我有幸与两位杰出的科学家卡伦·巴克尔和埃扎·拉斯金进行了交谈。卡伦是不列颠哥伦比亚大学的教授,她写了一本关于动物交流的书,名为《生命之声》。埃扎是地球物种项目的联合创始人,这是一个试图利用人工智能解码动物交流的非营利组织。
我们进行了一次广泛的对话,从一个基本的发现开始:我们的世界充满了比许多人最初想象的要多得多的动物声音。从那里,我们讨论了这些声音可能意味着什么,是否存在某种形式的语言,以及科学家是否有一天能够利用人工智能来破译动物在说什么。为了清晰和长度,我们对这段对话进行了一些编辑。以下是我们的对话。
所以,在我们开始讨论研究人员今天如何尝试解码动物声音之前,我认为有必要谈谈他们最初是如何意识到这些声音值得解码的。卡伦,你的书中有一个故事,讲述了欧洲和美国的科学家是如何真正开始发现这些声音甚至值得探索的。你谈到了鲸鱼的歌声。
所以我想知道你能不能为我们稍微设定一下场景,比如大约100年前海洋声音的研究现状是什么样的?是的,让我们回想起大约100年前。当时普遍认为只有人类拥有语言,而且其他物种不具备复杂的交流能力。
当然,这是西方科学中的一个盲点,我们将在今天的谈话过程中逐步解开这个盲点。但当时,西方科学最显著的方面之一实际上是一种遗漏的罪过。当时并没有进行大量的动物声音记录工作,也没有进行大量的尝试解码这些声音的工作。而这一切都在……
少数研究人员(其中一些人与当时用于监听水下海洋声音的保密海军工作有关)开始尝试解码和分类他们在海洋中听到的极其复杂的水下声音时发生了改变。因此,这些科学家最初主要努力记录鲸鱼发出的非常深刻和令人惊叹的声音,这些声音现在我们都很熟悉,
但在当时对西方科学家来说却相当令人震惊。你知道,座头鲸那种歌剧般的呜咽声,抹香鲸那种非常断断续续、强大的震耳欲聋的声音。海洋深处有一整套交响乐,西方科学在很大程度上对此一无所知。他们的工作在一位名叫罗杰·佩恩的叛逆科学家及其才华横溢的妻子凯蒂·佩恩(一位受过古典音乐训练的音乐家)……
将海军科学家提供给他们的一些保密录音出版成专辑后引起了公众的注意,这张专辑至今仍是史上最畅销的自然专辑,获得了白金销量,并且是改变了结束工业捕鲸运动态势的主要因素之一,可以说是拯救了许多鲸鱼物种免于灭绝的因素之一。所以鲸鱼是我们的……
西方科学家重新认识到土著文化长期以来就知道的事情。
许多物种都能够进行复杂的交流。从那时起,许多其他物种开始向西方科学展现自己。但我一开始就要强调,这是人类长期以来就掌握的知识,不知何故,我们忘记了我们曾经忘记过,我们才刚刚开始真正记住如何记住。所以,你知道,谈论我们忘记的事情,或者也许是我们……
直到最近才意识到的东西。你知道,这不仅仅是水下的声音,对吧?这不仅仅是我们因为没有潜艇而无法听到的深层声音。我想知道你能不能告诉我们一些……
我们没有技术就无法听到,但一直围绕在我们身边的声音?绝大多数这些声音对人类的裸耳来说是听不见的。它们要么高于我们的听力范围(在高超声波范围内),要么低于我们的听力范围(在低次声波范围内)。
这有一个进化原因,叫做声学生态位假说。所以在大多数生态系统中,你得到的情况就像收音机上的电台一样。不同的物种会在特定的频率组(频段)上广播声学交流,并且能够在相同的频率范围内听到。我们听到的频率几乎与我们能够发声的频率相同。
对于超声波和次声波来说,记录超出人类听力范围的能力只有大约100年的历史。但人工智能所做的是,它允许大规模地解析和分类这些数据。我们扭转了20世纪生物学的一个非常根本的限制
我们过去基本上是数据匮乏。现在由于廉价的数字录音设备,以及从北极到亚马逊的许多此类录音设备,我们拥有了大量的数据。现在我们有了人工智能,它可以做一些(并非全部)自动化的事情。
跟踪、分类、解析。这并不意味着我们能够随后采取下一步进行翻译,但这让我们走得更远。所以你正在谈论现在使用人工智能,使用我们拥有的更多数据,使用人工智能来分析它,
阿萨,我想知道你能不能谈谈你使用人工智能来绘制语言形状的研究。比如,当我们可能无法理解语言时,人工智能如何帮助我们在语言之间进行翻译?是的。我将分两部分讲述这个故事。我们于2017年启动地球物种项目的原因是,一些根本性的东西发生了变化,对吧?因为如果你要翻译一种没有罗塞塔石碑的语言,这在人类历史上直到大约2017年之前都不存在。然后这种情况发生了变化。那么发生了什么变化呢?人工智能获得了构建代表语言的形状的能力。对于房间里的人工智能专家来说,这些被称为潜在空间或嵌入空间。但这些形状非常有趣,因为它们将语义关系转化为几何关系。这是什么意思?想想看
像英语这样的语言。现在想象一个星系,其中每一颗恒星都是一个词,意思相近的词彼此靠近,而共享语义关系的词则共享几何关系。国王对男人就像女人对王后。所以在这个形状中,国王到男人的距离和方向与女人到王后的距离和方向相同。所以你只需要做国王减去男人,这会给你一个距离和方向。你把它加到男孩身上,它就会等于王子。你把它加到女孩身上,它就会等于公主。语言的所有内部关系都编码在这个形状中。对。
如果你仔细想想,比如,狗与男人、狼、毛皮、吠叫和嚎叫都有关系。它在这个形状中将它固定在一个空间点上。然后,如果你解决了每个概念与其他每个概念之间的巨大多维数独难题,就会出现这个代表语言所有内部关系的刚性结构。计算机不知道任何东西的含义。它只知道它们是如何关联的。而2017年的深刻见解就在这里。
两种语言的形状可能相同吗?所以我手里拿着一朵葡萄牙语词云。你手里拿着一朵英语词云。在我的星系中代表女人、王后、国王、男人的恒星之间的数学关系或多或少与你的词云中的数学关系(即空间关系)相同。没错。如果我要扔掉
克里语或因纽特语,重叠较少,但或多或少许多这些概念在人类语言中是不变的。
这就是为什么我们现在能够使用人工智能有效地翻译我们不同的词云。完全正确。你只需将一个形状旋转到另一个形状的顶部。即使一种语言中有一些词在另一种语言中不存在,但狗这个点最终会在两者中处于相同的位置。你对同一个形状模糊地眯起眼睛。这对英语和西班牙语有效。你会觉得,好吧,这些是相关的语言,很明显。但这对芬兰语(一种奇怪的语言)、阿拉姆语和乌尔都语也有效,很明显。
世界语,就像每种人类语言一样,都大致符合这种普遍的人类意义形状。那一刻我们意识到,有一条路可以走。你认为如果我们为动物交流构建这个形状,它是否适合普遍的人类意义形状,而重叠的部分,我们应该能够直接翻译成人类的体验,而不重叠的部分,我们应该能够看到复杂性。因此,这使我们能够开始获得……
模糊的宝丽来图像,这些图像超出了人类的想象力。让我们回到我们可以翻译我们不同的词云(英语和因纽特语),然后将其外推到非人类交流系统这一概念上。所以首先,你必须想象一下,科学家现在有能力用非人类交流机制来创建这些潜在空间或词云。例如,
现在有一本包含数千种声音的大象词典,野外生物学家已经费力地记录了每个信号的含义。例如,非洲象对蜜蜂有一种特定的信号。它们害怕蜜蜂。蜜蜂可以进入它们的鼻子和耳朵,蛰它们。因此,当大象听到这种声音时,它们会表现出非常具体的行为。通过回放实验进行测试,我们有了这个大象词典
但这里有很多假设,因为我们还没有证明大象的潜在世界观、感受、体验到的、具体化的体验(研究人员称之为Umwelt)与人类有任何相似之处。因此,我的词云可能不包含任何实际上与埃扎的词云重叠的概念,除了极少数例外。因此,人工智能翻译可能是一个死胡同,
或者它只能让我们开发出一小部分可翻译的概念,并且可能还有其他规则支配着我们尚未弄清楚的这些非人类交流系统。我将举几个例子。
可能是动物物种在一年中的不同时间使用不同的语言。有点像,你知道,如果你熟悉印度古典音乐,拉格,你知道,有晨拉格,晚拉格。所以你必须抛弃你对语言的所有假设。如果它们是迁徙物种,它们可能对世界的不同地区使用不同的语言。白令海峡的语言可能与你分娩的夏威夷温暖水域的语言不同。所以
我们才刚刚开始尝试弄清楚埃扎试图做的事情是否可行。我个人的猜测(我很想听听你的看法)是,这将是一种不完整的翻译。我们将能够检测到名字。我们将能够检测到警报呼叫。我们将能够检测到赋予环境特征的标签,这些标签在语言上是不变的。但是还有许多更复杂的概念,我们将不得不发明全新的科学类型
才能开始理解。这些将结合实地观察和人工智能。绝对的。我只想说,我们所有的工作都是建立在野外生物学家几十年辛勤研究的基础之上的。因此,我们所做的一切都是与他们合作进行的。但随后要补充你所说内容的几点想法是,首先,我们描述这种使用旋转进行翻译的方式,那是2017年的人工智能技术。现在这已经有点像石器时代了。
还有许多其他技术我可以谈论,这只是众多工具中的一种。但为什么我们应该期望,就像我同意的那样,抹香鲸的Umwelt可能完全不同。它80%的时间都在海洋深处一公里完全黑暗的环境中度过。为什么我们应该期望有任何重叠呢?我将举两个例子说明为什么可能存在重叠。
然后我将谈谈为什么我认为这甚至超出了语言的范畴。第一个例子是镜子测试。就像,你怎么知道另一个生物是否有自我意识?你可能会发现的一种方法是,你会在它们身上画一个点,而它们没有意识到这个点。然后你把一面镜子放在它们面前,就像,
如果它们看到这个点,并且开始试图把它弄掉,这表明它们将镜子中的图像与自己联系起来,它们有自我形象。现在,如果它们没有反应,这实际上并不能告诉你任何信息。研究人员长期以来一直认为大象无法通过镜子测试,但事实证明它们只是在使用小镜子。对吧?所以,但许多物种确实通过了这种镜子测试。这意味着如果它们在交流,它们很可能在交流
丰富的内在性,比如自我意识,这是我们拥有的最深刻的东西之一。另一个例子,正如我在我的演示文稿中提到的那样,一段关于狐猴咬蜈蚣以获得快感的令人难以置信的视频。所以它们就像从蜈蚣身上吸食一样。它们变得超级依偎。它们进入这些恍惚状态。这有点像一个原型的火人节。而且
海豚也做同样的事情。它们会故意膨胀河豚,也会从它们的毒液中获得快感,并在最初的“Puff Puff Pass”中将它们传递给对方。
所以大猩猩和黑猩猩会旋转。它们会抓住藤蔓旋转,让自己变得非常头晕。超越意识的状态似乎是我们许多物种之间共享和渴望的东西。所以,这也是一件非常深刻的事情,如果我们交流,或者如果它们交流,它们很可能在交流。所以有一些,我认为,非常有趣的重叠领域。我们正在进行的这场对话,从某种意义上说,感觉就像我们……
我们就像飞速前进,还有一个障碍我们必须克服,那就是弄清楚这种翻译,人工智能几乎已经到位了。我们也使用了大量拟人化的语言,我觉得这绝对是
我理解我们为什么要这样做。我们没有更好的词来表达这些概念。我想澄清一下,科学家不使用这种语言。他们使用非常专业的术语。例如,科学家不会使用“名字”这个词。他们会说“个体声音标签”或“声音特征”。
同样,大多数研究非人类物种交流机制的科学家都会使用“交流”一词,而不是“语言”。因为语言在复杂的组合能力、象征性内容、句法等等方面都得到了充分的人类中心定义,因此其他物种是否拥有“语言”还有待证明。
我只想澄清一下,虽然埃扎和我以一种在公众面前传播科学的方式使用了这些术语,但科学界非常严格
也许是不正确的,但尽管如此,它在设定人类和非人类物种之间的界限方面非常严格。但这项研究最终可能做的一件事是,它可能会产生足够的证据,让我们确实说:“啊,是的,其他物种确实有语言。我们可能需要改变我们对语言的定义才能做到这一点。”或者,“啊,是的,其他物种确实通过语言传达象征意义,
就是这样。我们还没到那一步。所以,我认为,这项科学将逐步引导我们走向非常有趣的地方,以便在大量经验证据的基础上提出这些根本性问题。我想知道,你知道,我们简要提到了关于成为蝙蝠或鲸鱼或任何这些感知世界完全不同的东西意味着什么的Umwelt问题。我想我只是想知道,
我们是否可能正在向动物传达一些动物可能以不同的方式理解的东西,并以看起来符合我们期望动物行为的方式行事,因为这就是我们理解事物的方式。
但我们是否甚至可以想象我们实际上可以进行交流,而我们双方都知道我们彼此理解?我的意思是,任何两个人之间都存在同样的问题。交流的神话是它首先就发生了。是的。我认为实际的、务实的、科学的回应是回放实验。这就是这些实验的测试方法。我们假设这个声学信号意味着这个。
我们可以在野外或实验室控制条件下播放它。我们看到了我们预测的结果。大象的蜜蜂警报呼叫会导致非常具体的物理行为,一群大象聚集在一起,给自己除尘。现在,除此之外,
我的意思是,交流的行为是一个深刻的谜。地球上任何两个生物都相信它们实际上能够彼此理解,这实际上是相当神奇的。所以科学是接近一些伟大谜团的方法之一,而交流就是其中之一。
但我认为这之所以能抓住如此多的公众想象力,阿扎和我过去也讨论过这个问题,是因为这也是一个伟大的谜团,它一直是各种神话和精神传统中大量反思的主题。所以这就是这项工作的一些丰富之处。这也是它在科学界引起的一些争议。我们在这里将从谈话中短暂休息一下。
回来后,我们将询问我们是否应该尝试翻译动物交流。我们还没有触及的一个问题是一种应该问题。是的。假设我们可以使用人工智能来分析这些语言形状,以某种基本的方式弄清楚动物可能彼此在说什么,也许我们可以与它们交流,也许我们可以倾听它们,
了解人类,我可以想象可能有一些不太友好的方法来处理这种情况。我想知道你对能够理解动物和能够与它们交流的危险有什么看法。
所以我想举一个非常具体的例子,说明我们作为物种在不久的将来必须展现的新责任。所以你们,我相信,都遇到过ChatGPT。你可以用中文构建像ChatGPT这样的聊天机器人,即使你不会说中文,对吧?你可能也见过所有深度伪造的东西,对吧?
现在,只需三秒钟的任何人的声音,就可以继续用他们的声音说话,说出他们所说的话。这意味着在几个月到几年内,我们将能够构建基本上是合成的聊天机器人、合成的鲸鱼、合成的白鲸、合成的使用工具的乌鸦,它们能够以一种……
你知道,它们不明白。它们不是在和同类说话。想象一下你拥有超能力,你的超能力是能够走到一个你不懂他们语言的人面前。你有点竖起耳朵听着。你就像,好吧,我看到这个模式在这个模式之后。你开始用这些模式胡言乱语,你不知道你在说什么。另一个人就像,是的,哇。这是道格拉斯·亚当斯的巴别鱼。是的,但这里有一个情节转折。你将能够与……
在你理解之前交流。所以事实就是这样。我们实际上正在与斑胸草雀进行我们的第一个实验,可能在今年晚些时候。我们正在与圈养种群进行实时双向交流,看看我们能否做到,比如开始跨越这种沟通障碍,能够在理解之前说话。这是
很明显,这让我们能够更快地开始解码。但座头鲸的歌声会病毒式传播,对吧?比如在澳大利亚海岸附近唱的歌可以传播,你知道,一千公里。座头鲸的歌声有时会在一个或两个季节内被全世界的人们听到。
所以如果我们不小心,对吧,如果我们只是创造一只开始唱歌的鲸鱼,尤其是在我们不理解它意味着什么之前,我们可能会搞砸智慧传统,对吧?创造一种鲸鱼QAnon。我们不知道。这意味着在那之前,因为这意味着,就像,这是一件非常……
一件疯狂的事情,我认为我们不会这么快就到达这里,在接下来的12个月、5年内,肯定在2030年之前,我们将有能力进行实时双向交流,动物到人工智能,不一定是动物到人类,而是人工智能。
我们需要制定一种跨物种交流的《日内瓦公约》、一项基本指令、一系列规范、IRB审查的方式。我们需要建立很多东西,我认为你也可以谈谈这个。是的,我认为还有更邪恶的用途。精确狩猎。
当然还有精确捕捞。-是的,偷猎。-是的,偷猎。这无疑将加速偷猎者和护林员之间的猫鼠游戏。还有一种幽灵般的可能性,即能够驯化以前人类无法驯化的物种。所以我们可以在某些情况下使用它,这就是我的下一本书的主题,
用于生物多样性保护目标。与此同时,它可以让不法分子(记住全球非法野生动物贸易规模有多大)进一步利用他们捕捉到目前无法触及的动物的能力。所以长期来看,多物种对话的《日内瓦公约》很好。
在此之前,我认为鉴于生物多样性危机,我们面临着一个更紧迫的问题,即这些技术的邪恶用途。唯一值得庆幸的是,人工智能可能并不像我们想象的那么好。所以,你知道,首先,我们像往常一样非常以自我为中心。我们是人类。我们假设其他物种实际上想和我们交谈。
它们可能觉得很无聊,你知道,或者它们可能只是认为这些声音是胡言乱语,你知道,应该避免,这是正确的,或者它们可能只是能够检测到它不是由它们物种的其他活体成员发出的,并予以避免。所以我希望我们会发现自己比我们想象的要愚蠢一些。
它们会发现自己比我们认为的要聪明。也许这会给我们创造更多喘息的空间。但毫无疑问,从长远来看,深度伪造人工智能技术会带来很多风险。你认为鉴于这些风险,你认为这是科学家应该推进的事情吗?我的意思是,我相信我们应该暂停。我和阿萨在这点上意见不一致,我认为。我认为肯定有一些门槛,如果我们跨越了这些门槛,我们就应该暂停,我们应该停止。绝对的。事情是这样的。
我们正在肢解生命之树,在某些时候,我们将砍掉人类赖以生存的树枝。所以我们正处于“Hail Mary passes”的境地。我认为,努力展示的希望,而且,重点实际上并不是与动物交谈。重点实际上是理解和倾听。
在此过程中,我们正在创造能够解决我们在所有保护生物学和动物行为学研究中看到的根本性问题的技术。我们交谈过的每一位生物学家都需要进行分类、降噪、信号检测,以了解生物多样性,了解它们的行为。因此,在我们努力解码的过程中所构建的工具
是加速保护生物学的根本工具,在保护科学的范围内
加速保护,就像我们试图大规模地做到这一点一样。但随后会出现一些时刻,我们会发生视角转变,这会改变一切。我们谈到了座头鲸的歌声,但也谈到了人类登上月球以及人类服用那种“概览效应”的药物,看到我们作为一个悬浮在太空中的淡蓝色小点,地球行星,宇宙飞船地球,对吧?这就是环保署成立的时候。
诺亚诞生了,现代环保运动开始了,《清洁空气法案》通过了,那是在尼克松时代,对吧?所以这里的目标是,历史上有一些时刻
超级大国运动。没有灵丹妙药,但也许有银色子弹。也许如果我们知道这种情况即将发生,我们可以武装其他每一个保护组织。自然权利,非人类的人格,伊尔·威尔逊的“地球一半”,更大的海洋保护区。当这成为全世界都看到的事情,并成为政治家优先事项的首位时,
突然间,我认为我们可以加速,并成为其他所有保护和气候行动的倍增器。我认为,这就是值得追求的原因。我想知道,是的,在我结束之前,我想知道,你能否稍微谈谈你为什么认为我们应该暂停?我会的,但我还想补充阿萨的一点。所以气候变化和生物多样性危机是密切相关的。
在我们向地球上增加几十亿人口的未来20年或30年中,根本性的挑战是一种类似诺亚方舟的挑战。在我们有生之年,还会有多少物种存在?而声学,无论我们是否真正实现了物种间的交流,都是保护主义者工具包中的一种强大工具。
因为仅仅通过使用数字生物声学,你就可以获得一种非常低成本、非常有效的监测机制,这种机制比人工监测侵入性要小得多。而这现在正是在世界各地建立起来的东西。由于时间有限,我无法详细介绍技术细节,但非常简单地说,生物和生态声学指标允许我们仅仅通过倾听……
气候变化正在扰乱物种、物种迁徙和移动以及物种数量或消失的程度等。因此,我们可能永远无法实现物种间的交流,但如果我们对环境工作感兴趣,我们可以并且都应该做的是支持将数字声学、生物和生态声学纳入保护工作,作为一种低成本、侵入性最小、功能强大的工具
所以我希望这是你们所有人的一个重要信息。我认为,关于暂停的问题实际上是关于人类不太擅长的事情,那就是拥有创造空间的能力
在我们认为自己能够做到的事情和追求那件事之间。所以有一个……在科技界,在科学界,有一种无所不能的精神。
我能做到,所以我想要去做。但这里有一个“应该做”的问题,我认为需要非常非常仔细的考虑。而且我认为没有,我听到我不同意你的观点,现在没有令人信服的理由继续这项可能对其他物种造成如此巨大损害的工作
这可能导致精确狩猎和偷猎。如果没有制定许多伦理框架,这意味着要更新《濒危物种国际贸易公约》,更新许多国际环境监管框架。人工智能治理提出了一个更普遍的问题,对吧?所以我的观点是我们需要在这方面把我们的家务事处理好。就像有时,人类基因组学研究暂停了,并且有一些禁区,比如克隆,
我认为我们可以为这方面的人工智能科学制定一套禁区,这将允许技术进步继续取得进展,但不会引发我们几乎才开始理解的那种风险。关于这一点,我认为我们实际上是同意了的,那就是……笑声
当我们承担新的权力责任时,你必须问的是,这种权力如何与智慧联系在一起,以及如何知道这项技术即将到来,因为无论如何,模拟市场力量在人类领域推动的任何信号的能力。
因此,我们需要尽快加快所有伦理和法律的更新。这是潘多拉的盒子,对吧?每一项新技术都会带来新的责任。我认为从事这项研究的研究人员数量足够少,我们可以在这方面做得更好,在释放这项技术之前理清责任。我完全同意。
非常感谢Asa Raskin和Karen Bakker以及Aspen研究所。如果你想了解更多关于这里历史的信息,我推荐Karen的书《生命之声》。它包含了我们提到的鲸鱼的故事,还有一些关于从健谈的海龟到蜜蜂交流等一切的引人入胜的故事。你也可以在aspenideas.org观看我们进行的完整讨论的视频。本集由Bird Pinkerton制作。它由Brian Resnick和Meredith Hodnut编辑,他们也管理我们的团队。
我们从Christian Ayala那里得到了混音,音乐来自我,Serena Solon核实了事实,我们很高兴她加入了团队。Mandy Nguyen不怕蜘蛛。如果你喜欢这个节目,如果你留下评论或直接给我们发送想法,我们会非常高兴。你可以通过[email protected]给我们发邮件。我们阅读每一封邮件。Unexplainable是Vox Media Podcast Network的一部分,我们下周再见。