We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Socially Assistive Robots, Part 2

Socially Assistive Robots, Part 2

2025/7/2
logo of podcast JAMA Medical News

JAMA Medical News

AI Deep Dive AI Chapters Transcript
People
J
Jennifer Abassi
M
Maja Matarić
Topics
Maja Matarić: 近年来,人工智能的飞速发展和社会辅助机器人领域研究规模的扩大是该领域取得巨大进展的两大驱动因素。我们现在有一个由美国国立卫生研究院支持的随机对照试验,旨在验证社会辅助机器人对焦虑症的疗效。大型语言模型使机器人能够流畅、生成式、不重复且引人入胜地进行对话,这对于社会辅助机器人至关重要,因为人们会立即认为它们具有理解能力和智能。我们的目标是使技术易于使用,因此我们对低成本且本质上安全的机器人感兴趣。小型、引人入胜的“挤压和拉伸”动画风格机器人非常有效。我们设计的低成本 Blossom 机器人成本低于 500 美元,并且所有其他操作都在云端使用语言模型完成。我们追求的是一种温暖、随时待命且令人愉悦的触感,它可以帮助你进行正念和呼吸练习。对于我们讨论的这类机器人来说,人形机器人可能不是正确的方向,我们想要的是低成本、柔软、安全且引人入胜的机器。机器人不需要是人形的,只需要栩栩如生即可。 Jennifer Abassi: 在2017年,社会辅助机器人需要预先编程每一个词,自然语言处理领域尚未成熟。

Deep Dive

Chapters
This chapter explores the advancements in AI, particularly natural language processing, that have significantly improved the capabilities of socially assistive robots. It contrasts the limitations of pre-programmed dialogue with the fluidity and engagement enabled by large language models.
  • AI and NLP advancements enable more natural conversations between robots and humans.
  • Large language models allow for generative, non-repetitive, and engaging dialogue.
  • The ability for robots to understand and respond naturally enhances their perceived intelligence and effectiveness.

Shownotes Transcript

来自JAMA Network,这是JAMA医学新闻播客,讨论临床医学、生物医学科学、公共卫生和卫生政策中的及时话题,这些话题在JAMA的医学新闻部分都有报道。嗨,很高兴见到你。我的名字是Blossom。欢迎来到我的家,南加州大学互动实验室。在这里,我和我的机器人朋友们想尽我们所能帮助世界上的人们。请问你叫什么名字?

大约25年前,Maya Matarik博士和南加州大学的同事们决定将辅助机器人技术与社交机器人技术相结合。从那时起,Matarik博士和其他研究人员为各种医疗应用创造了社交辅助机器人。

这包括帮助自闭症儿童学习社交和认知技能,鼓励中风患者坚持锻炼计划,以及支持焦虑和抑郁症患者。今天,Matarik博士是南加州大学计算机科学的Patrick Soon-Chung Chaired和杰出教授,并在神经科学和儿科任职,也是南加州大学机器人研究实验室的联席主任。

人工智能和自然语言处理的进步正在帮助她开创的领域向前发展,使社交辅助机器人和人类之间的对话感觉更加自然。事实上,最近的研究进展使Matarik的团队获得了一项美国国立卫生研究院的资助,用于进行一项更大的临床试验,以研究机器人的支持如何使认知行为疗法对患有焦虑症的大学生更有效。

我第一次采访Matarik博士是在2017年。那时,社交辅助机器人说的每一个词都必须预测和预先编程。我是Jennifer Abassi。我最近再次采访了Matarik博士,她也是谷歌DeepMind的首席科学家。我们讨论了像你刚才听到的3D打印Blossom机器人这样的社交智能机器人的前景。

Matarik博士,非常感谢您今天加入我。我们上次交谈是在2017年,实际上是我们、我和同一位制作人Daniel Morrow。所以八年后再次聚在一起真是太好了,难以置信。很高兴回来。非常感谢您给我这个机会继续对话。所以当我们在2017年交谈时,你开创的社交辅助机器人领域已经有15年的历史了。

现在它已经有近25年的历史了。当时的情况如何?现在发展到什么程度了?自那以后发生的事情我认为是沿着两个维度的大幅加速。所以一个维度是人工智能,对吧?人工智能已经爆炸式增长。它对社交辅助机器人来说是根本性的推动力量,就像对许多其他事物一样。另一个维度是,随着越来越多的证据表明人工智能

在较小规模的研究中的有效性。现在,人们更有兴趣和意愿支持更大规模的研究。例如,现在我们实际上有一项由NIH支持的随机对照试验,来真正验证在这种特定情况下,一项涉及社交辅助机器人治疗焦虑的研究的有效性,但也有其他研究。所以这在这两个维度上都非常令人鼓舞,我认为还有很大的增长空间。

那么让我们谈谈人工智能。我想象一下,生成式人工智能对你的研究产生了巨大的影响,或者将对你的工作产生巨大的影响。跟我们说说吧。让我们回顾一下2017年我们上次交谈的时候。

那时,我们有可以与人交谈的社交辅助机器人,人们会回话,并且会有很好的对话,只是我们真正让这些机器人交谈和理解的唯一方法是使用我们所谓的对话树。所以从字面上看,想想它就像……

机器人说的每一句话都必须预先编程。所以你必须考虑用户可能说什么,机器人如何回应,以及它如何在回应中有多种选择,这样不会变得枯燥,而且是一致的。这简直是太难了。自然语言处理领域,我们都称之为NLP,它绝不是处于起步阶段,但它现在已经经历了现状。有趣。

如果你考虑社交辅助机器人的根本目标,那就是吸引用户、理解用户并支持用户。那么,如果一切都必须预先编程,你怎么能理解、支持和吸引用户呢?这并不是说没有机器学习。有,但对话非常固定。而现在我们有了大型语言模型,机器人突然可以

流畅地、生成性地、非重复地、引人入胜地交谈。我们可以提示它们。以前我们认为,“哦,如果我们知道用户喜欢棒球,那么我们可以从网上查找一些关于棒球的信息,然后也许我们可以把它编织到对话中。”

现在,你知道,用户只需要说,哦,我喜欢棒球。模型就会把它拿走,谈论各种事情。所以对话从根本上来说已经处于我们从未预料到会如此迅速发生的地方。这对社交辅助机器人来说非常重要,因为在我们的机器人交谈的程度上,如果它们交谈,人们会立即认为它们理解,它们很聪明,它们可以提供很多东西。

这以前很难,现在不难了。让我们了解一下你一直在进行的一些令人兴奋的研究以及你为此研究使用的机器人类型。我记得我们在2017年谈到了Squash and Stretch。

我们完全朝着这个方向倾斜,因为我们的目标,我认为这是社交辅助机器人领域的大多数人的共同目标,是使这项技术易于访问。因此,开发一个可能非常复杂且人形的机器人是没有意义的,因为它非常昂贵。

和/或可能很危险,人形机器人天生就危险。所以我们感兴趣,因为我们在健康和保健领域,我们真的对既非常低成本又非常安全的机器人感兴趣。这就是这些小型、引人入胜的、有点像压扁和拉伸、几乎像动画风格的机器人非常有效的原因。

因此,我们决定朝着这个方向努力。因此,我们基于康奈尔大学的初始设计设计了这些低成本机器人,它们被称为Blossom。它们非常低成本。包括电脑在内,它们的价格低于500美元。电脑是指驱动机器人实际行为的简单电脑。然后,其他所有事情当然都在云端使用语言模型完成。

Blossom,我想告诉人们它是什么样的。对我来说,它看起来有点像袜子木偶。

好吧,这取决于情况。它有不同的迭代,但你绝对是对的,Blossom从根本上来说是一个由3D打印部件制成的身体。所以你可以直接打印它们。它们是塑料的。你可以在任何3D打印机上打印它们。然后,你知道,有一些基本上不是弹簧,而是像橡皮筋一样的弹性带和驱动它的电机。然后你就可以在上面放一层皮。

外部可以用布料制成。它可以用任何可以有足够运动的东西制成。我们实际上发现,钩编或编织提供了创造柔软、可以成形的最佳能力。

所以你可以,你知道,有一个头部、颈部和身体。它也很个性化。你可以在上面放纽扣。你可以放,你知道,我们现在实际上正在探索使用光纤灯,这样机器人就可以通过灯光进行交流。它还可以做一些事情,比如脸红,或者它可以在你触摸的地方亮起来。所以你可以做很多低成本的事情,这些事情都可以与这种外部环境一起工作。这非常重要,因为替代方案是什么?

几乎所有机器人都是由金属或塑料制成的。好吧,那不温暖。那不柔软。那不容易调整和个性化。这与我们追求的目标大相径庭。我们追求的是一种让你感觉温暖、在你身边并且你喜欢触摸的东西,尽管触摸它可能不是基本的互动,对吧?如果你在做,如果它在帮助你进行正念和呼吸,你可以把手放在上面,它可以呼吸。

很难想象你如何能从一个塑料或金属机器人那里得到这种享受。是的,它们看起来不像人们听到“机器人”这个词时想象的那样。这些不是人形机器人。它们也不像杰森一家里的Rosie。

但我还是要谈谈人形机器人。由于大型多模态基础模型的时代,现在在工业和学术研究方面都对人形机器人进行了大力推动。但我认为,对于我们正在讨论的这类机器人来说,至少在短期内,这不是正确的方向。所以我们想要的是,我们想要这些机器既低成本又柔软安全,而且

而且引人入胜。为此,你不需要它成为人形机器人。你也不希望它成为人形机器人。它只需要栩栩如生。栩栩如生甚至不需要是拟人化的,对吧?它甚至不需要看起来像动物。你正在进行的一项研究是关于使用大型语言模型驱动的社交辅助机器人来提供认知行为疗法。

这太有趣了。你能告诉我们它是如何工作的以及你学到了什么吗?哦,我很乐意谈谈这个。这是我们最令人兴奋的进展,由于以下原因,它非常令人兴奋。所以当语言模型第一次出现时,我们就开始探索这个问题,很多人都在谈论如何越轨

现在由语言模型驱动的聊天机器人将使心理健康支持民主化,因为其想法是,现在我们将拥有使用人工智能与人们谈论焦虑和抑郁的应用程序。因为通常不容易找到治疗师,而且可能需要很长时间才能预约,或者可能没有足够的保险覆盖范围等等。再加上焦虑和抑郁的比率。

创造了真正的需求。因此,人们乐观地认为,哦,这些人工智能驱动的聊天机器人将解决心理健康问题。这仍然是人们乐观地坚持的信念。因此,我们认为,我们已经知道社交辅助机器人非常擅长吸引人们并让他们感觉良好。因此,我们认为,让我们进行一项研究,比较由LLM驱动的聊天机器人

然后使用相同的LLM来驱动社交辅助机器人。

认知行为疗法是应对焦虑的一种非常有效的方法。它是一种非常有效的方法,可以减轻许多挑战,包括失眠、减肥、焦虑。它只是被广泛使用。所以我们想专门针对焦虑症研究它。现在,认知行为疗法的一个问题是它需要练习。基本上,它要求你重新调整你的想法,去思考,你知道,

有没有不同的思考方式?我该怎么办?所以有一套你必须经历的规定方法,你需要重新调整你的思维方式。它通常是通过写在笔记本上完成的。所以你可以猜到,人们不喜欢这样做,因为没有人喜欢练习。所以人们不做。所以认知行为疗法有效,但人们也不做,因为它是不可访问的,或者因为他们即使它可以访问,他们也不做所有步骤,因为这真的很困难。这在情感上很难。它需要时间,等等。

所以我们认为,哦,也许机器人只会让人们更好地坚持治疗方案。因此,我们在南加州大学(我们的母校)的大学宿舍里进行了这项研究,在过去的25年里,这里一直是进行所有这些研究的好地方。

我们发现的结果非常有趣。它一直是我们此后一直在做的事情的驱动力。所以我们发现,机器人和聊天机器人对大学生来说都很吸引人。他们与两者互动。这是一项为期两周的研究,所以是一项短期研究,小型研究。我们没有发现在这两周内,他们与机器人的时间比与聊天机器人的时间特别多。但是,这是一个很大的但是,

当我们测试他们的精神困扰时,为此我们使用了适当的评估,一项临床评估,在疗程前后,我们发现只有与机器人互动的学生的精神困扰显著减少。与聊天机器人互动的学生,他们喜欢它,但他们的精神困扰并没有降低。所以没有临床益处。

然后我们做的下一件事是,我们实际上查看了学生对语言模型所说的话以及语言模型的回应的记录。我们使用这些对齐度量。同步和对齐是用于实际评估治疗师如何

与病人或客户互动。所以这是精神病学和心理学中的标准衡量方法,我们将其应用于语言模型。结果实际上非常显著,与聊天机器人的对齐度非常差。

非常有趣的是,在表面上,人们非常非常愿意与语言模型互动。我的意思是,对话很棒,对吧?你感觉像是在和人类交谈。它总是可用的。你可以提示它总是友好的,拥有你想要的任何角色。但它真的有帮助吗?我们的初步数据表明,它实际上并没有临床帮助。

这就是为什么我们将此提交为一项随机对照试验,并获得了美国国立卫生研究院(NIH)的支持,以便在更多、更多、更多的学生身上进行这项试验,并以正确的方式进行。所以我们对这次机会感到非常兴奋。这是该领域成熟的必然步骤,在这个位置真是太好了。

那么,机器人与聊天机器人有什么不同呢?这不是一个价值数十亿美元的问题吗?因此,在更广泛的人机交互领域,在过去的20年中,已经进行了许多研究,这些研究比较了基于屏幕的代理,如虚拟人类,甚至像动画这样的东西,以及物理机器人。并且有确凿的证据

大量的文献表明,与物理实体,如机器人,在物理世界中的互动要有效得多。

有效是指,许多研究表明,参与度更高,享受程度更高,统计上显著地享受程度更高,参与度更高,学习更多,学习保留时间更长。所以,当你与一个物理上共存的环境互动时,你感兴趣的所有指标都会显著更好。

生物,如果你愿意的话,而不是基于屏幕的生物。那么为什么是这样呢?好吧,你知道,从根本上说,每个人都会说这是因为我们是社会生物,我们已经进化到与其他社会生物在物理世界中生存。而且,你知道,它适用于狗,适用于宠物,也适用于人类。

我们对物理实体代理的能动性和参与度的评价不同于对基于屏幕的代理甚至聊天机器人的评价。并且还有另一条证据与此相关,那就是随着我们观察到更多的社会隔离,不仅是由于疫情,而且总的来说,随着人们在物理上在一起的时间越来越少,我们尤其在年轻一代中看到了这一点,因为他们花更多的时间在他们的设备上,通过设备互动,而不是物理上共存,

这并不是说他们没有社会联系,而是他们感到更加孤立。所以你会得到更多的孤独,你会得到更多的孤立。据推测,所有这些影响都是由于这种互动方式与我们进化出的互动方式大相径庭。所以虽然我们可以做到,我们非常适应。人类极其适应。

但这并不意味着我们正在适应的东西对我们真的有好处。如果我们可以为人们的社会联系增加一个低成本的小型机器人,在他们与现实世界中的人进行可能会有帮助的交谈之前弥合差距,那么,这值得探索。多年来,我一直思考着我们的谈话,尤其是在疫情期间,COVID疫情期间。

我写了一些关于养老院老年人口的非常具有挑战性的故事。在封锁期间,他们面临着与人隔离、与家人和护理人员隔离的困难。养老院的医疗主管告诉我,人们因此而死亡。

因为隔离。我想到了,如果我们有那些机器人,那些小机器人,也许会有所帮助。我相信你在那时也想过这个问题。所以你认为这会有所作为吗?

当然,我有。我严重偏见,但我就是知道。在发生的时候,它也让我心碎,因为一些小的干预措施可以做很多好事。我无法相信老年人错过了多少机会,因为他们真的、真的错过了。老年人只是孤单一人。仅仅是孤独的健康代价就非常巨大。很高兴它终于得到了认可。

所以我不希望人们理解为我认为我们会把机器人送给老年人,然后一切都会好起来,我们可以忘记他们,因为这根本不是这个想法。人们需要与其他人在一起。但人们在研究领域已经展示了令人瞩目的成就。这不是我的工作。所以,我真的、真的,我认为重要的是要肯定所有勇敢的人们所做的工作,例如,他们把机器人带进了养老院,特别是带进了记忆护理单元,在那里,你知道,

那里的居民患有各种形式的痴呆症,通常非常衰弱。然而,引入一些只是足够引人入胜和有趣的东西最终将成为一种社会催化剂。你无法治愈痴呆症,但你至少可以提高生活质量,并可能延长寿命。

你认为事情会如何发展?让我们展望五年后。我们什么时候会在家里拥有负担得起的桌面机器人,它们可以陪伴人们,并在他们可以见到人们之间弥合差距?我很高兴你现在问我这个问题。然后让我们五年后再谈谈,因为现在我们正处于一个非常有趣的时刻。我们有科学。我们知道这对人类健康很重要且有效。

我们拥有这项技术,因为我们现在不仅拥有更好的材料,而且人们正在发现柔软的,比如软体机器人是一个全新的领域,现在已经真正兴起。当然,我们还有这些语言模型和基础模型。所以我们拥有所有技术,但我们没有投资者的兴趣。我们指的是这个领域和人类,当然。

更重要的是。因为目前几乎所有投资者都在投资人形机器人。这些,你知道,像人类一样,人类大小,非常危险,还没有准备好投入使用的机器人。很多事情都可能发生,但会发生吗?现在,也有可能,我希望如此,

可能有一两家勇敢的公司会做一些事情,在市场上展示如此多的好处。我这么说,是因为我没有创业公司,也没有个人利益,但我确实认为这是一个损失,因为,你知道,下一次疫情怎么办?怎么办,你知道,我们还需要这么多支持的原因是什么?老年人口怎么办?

你知道,疾病怎么办?孤独症流行怎么办?我们可以解决所有这些问题。我不是说解决它。我对它并不天真乐观。但我认为我们可以产生积极的影响。非常感谢你,Matarik博士。我希望我们可以约定再次交谈,也许五年后,然后聊聊,看看我们那时的情况。你说的对。我期待着。谢谢。

这就是本期JAMA医学新闻播客的全部内容。我是Jennifer Abassi。感谢我的嘉宾Maya Matarik博士。我们还将包含Blossom机器人和Matarik博士在他们实验室的视频链接。你可以在节目说明中找到该链接。本期节目由JAMA Network的Daniel Morrow制作。要关注本节目和其他JAMA Network播客,请访问我们的在线网站jamanetworkaudio.com。感谢收听,下次再见。

此内容受美国医学会版权保护,保留所有权利,包括文本和数据挖掘、人工智能培训和类似技术的权利。