首先,本周国际新闻编辑David Malakoff加入播客讨论NIH间接费用资助政策的重大变化,生物医学界对削减的强烈抗议以及由此引发的诉讼。接下来,机器能理解人类无法理解的宠物和牲畜哪些方面?总部位于巴黎的自由科学记者Christa Lesté-Lasserre加入主持人Sarah Crespi,讨论训练人工智能解读动物面部表情。目前,这种方法可用于发现处于困境的农场动物;将来,它或许能帮助兽医和宠物主人更好地与他们的动物朋友沟通。最后,佐治亚理工学院的博士后研究员Keya Ghonasgi谈论了最近发表在《科学机器人》上的一篇论文,该论文论证了反对在可穿戴机器人控制中使用机器视觉的理由。事实证明,在增强型外骨骼上增加摄像头的成本——例如隐私损失——可能超过拥有机器人辅助工具的益处。本周的节目由Podigy协助制作。关于科学播客 作者:Sarah Crespi;Christa Lesté-Lasserre;David Malakoff 了解更多关于您的广告选择的信息。访问megaphone.fm/adchoices</context> <raw_text>0 本周的节目部分由Science Careers赞助播出。正在寻找一些职业建议?想知道如何取得进步或如何更好地平衡工作与生活?访问我们的网站,了解其他人是如何做到的。使用我们的个人发展计划工具,访问特定主题的文章合集,或搜索令人兴奋的新工作。
Science Careers由Science和AAAS制作,是一个免费的网站,其中包含丰富的资源,可帮助您充分利用您的职业生涯。立即访问sciencecareers.org开始使用。
这是2025年2月14日的科学播客。我是Sarah Crespi。本周,我们邀请到了国际新闻编辑David Malakoff。他将与我们讨论NIH资助政策可能发生的重大变化。我们将讨论生物医学界对潜在削减的强烈抗议以及由此引发的诉讼。接下来,自由记者Christa Lestay-Lassaire将讨论训练人工智能解读动物面部表情。
如今,这种方法可用于发现处于困境的农场动物。将来,它或许能帮助兽医和宠物主人更好地与他们的动物朋友沟通。最后,我们邀请到了研究员Kea Ganoski。她将与我们讨论反对在可穿戴机器人控制中使用机器视觉的理由。
事实证明,在增强型外骨骼(我们穿戴的东西)上增加摄像头可能会付出过高的代价,例如隐私损失。这可能会超过拥有机器人辅助工具的益处。
现在,我们邀请到了Science的国际新闻编辑David Malakoff。他是一位国际编辑,但过去曾担任我们的政策编辑,并且长期报道美国政府。他撰写了关于特朗普政府最近宣布的一项公告,该公告改变了NIH向研究人员拨款的方式。你好,David。感谢你来到节目。是的,谢谢Sarah。很高兴来到这里。那么,让我们从时间说起吧。我们在2月11日星期二录制本节目。NIH在周末之前星期五宣布了这项变化。
他们说了什么?他们在星期五宣布了什么?是的,这对研究界来说是令人震惊的三四天。发生的事情是,华盛顿特区时间星期五深夜,NIH发布了一份备忘录。这份备忘录基本上说,他们正在单方面改变研究机构收到的资金数额。
可以报销研究费用。这些费用包括设施、管理拨款的行政人员以及与所进行的研究没有直接关系的其他杂项费用。这就是为什么它们被称为间接费用。因此,他们表示将把这一比例限制在15%。
解释间接费用的运作方式有点复杂,但最重要的是,大学可以根据拨款规模获得这些费用的报销。这是一笔巨款。当在大学工作的研究人员获得拨款时,一部分资金直接用于实验成本,也就是他们必须进行实验的购买费用。但一部分资金必须用于
必须用于建筑物。维持照明。没错,维持所有允许拥有多个实验室的庞大机构运作的基础设施。没错。2023年,NIH表示他们向研究人员拨付了约350亿美元。其中260亿美元是直接费用。
但90亿美元是这些间接费用。他们声称,通过改变公式,他们可以节省这90亿美元中的约40亿美元。但是研究人员及其机构怎么说呢?他们说,好吧,但我们如何继续运作?就像,是的,你支付老鼠的费用,但你没有支付容纳老鼠的建筑物的费用。对。我认为简短的回答是,他们非常愤怒。
他们对这种做法如此突然、没有经过讨论感到不满。他们还表示,如果没有大量的间接费用支付,就不可能拥有世界一流的研究机构。这里有很多历史渊源,Sarah,但简而言之,包括第一届特朗普政府在内的各个政府都试图削减间接费用。
大学通常几乎总是认为,联邦政府支付的间接费用实际上是不够的。它们实际上并没有涵盖他们所做研究的全部成本。但最终,这对研究机构、研究型大学来说是一项巨大的预算削减。
看起来就是这样。但其中一个问题是,如果NIH真的能够做到这一点并节省,比如说,40亿或50亿美元,引号内的“节省”,而不是将其用于间接费用,他们会用这些钱做什么?例如,今年的这笔钱已经被拨款了。
那么,它会回到用于基础研究的直接费用吗?他们会用它做其他事情吗?所以,这只是许多问题中的一个。这实际上涉及到谁制定预算?谁决定政府所有这些不同机构获得多少资金?在之前的政府中,它被提出为
立法变更,对吧?而不是政策变更。- 没错。例如,在第一届特朗普政府中,他们提议将间接费用率削减至10%。这次他们提议将其削减至15%,但他们将其作为他们向国会提出的预算请求的一部分。
基本上发生的事情是,国会说,不行,我们不做那样的事情。事实上,他们更进一步。他们说,我们不仅不做那样的事情,而且我们将通过一项规定,说,嘿,NIH,你不能单方面做出这种改变。你基本上必须来到国会。好的,让我快速回顾一下。特朗普在第一任期内,他们将其作为预算提案提出。国会说,不,你不能那样限制上限。你必须实际上......
通过一项立法。他们将其变成了法律。你必须通过立法来降低NIH的上限。特朗普政府的最新努力并没有这样做。它通过发布NIH的备忘录来改变上限。这让我们想到了法院,对吧?他们将不得不解决这个问题。没错。这项变更是在星期五晚上宣布的。到星期六早上,生物医学研究界的许多专家都说,这不仅是一个非常糟糕的主意,而且完全是非法的。
首先,它违反了国会2018年通过并一直保留至今的这项规定,该规定指出NIH不能单方面这样做。其次,他们说它违反了所谓的《行政程序法》,这是一部非常重要的法律,名称非常枯燥,但它基本上决定了联邦机构应该如何制定政策变更。
这就像你曾经看到过的那样,哦,这现在开始了,它开放公众评论,对吧?这就是我认为当我听到这句话时会想到的。就像某个机构正在提出变更,并且开放公众评论。我们通过《科学新闻》一直都在报道此事。
没错。这是一个典型的例子,说明受《行政程序法》等规章约束的流程。在两起不同的诉讼中,一起由22个拥有民主党总检察长的州提起,另一起由大学和研究团体提起,包括代表最大研究型大学、最大公立大学的团体,
研究型大学界的重量级人物,他们都向联邦法院提起诉讼,他们都认为这是非法的,他们都要求法官,“嘿,在我们能够解决这个问题之前,发布一项临时限制令。”他们都赢了。法官在星期一晚上发布了基本上是全国范围的临时限制令,并说,“嘿,2月21日回到法庭。”
让我们谈谈这个。我们不知道那时会发生什么。我们将回到法官的席位前,我们必须听取双方的论点。对。那么,从现在到21日之间会发生什么呢?双方将提交他们的简报、他们的论点。法官将阅读这些内容。他们将出庭并回答问题。在那之后,我们不知道法官做出决定需要多长时间。在那之后,即使做出决定后,任何一方都可以上诉。所以这可能是一个非常漫长的过程。
现在,我只想花一秒钟的时间来讨论一下这里的限制令,因为我们在国家科学基金会NSF中看到,存在限制令,但它并不像预期的那样在各方面得到普遍适用。你担心还是研究人员担心这也会发生在NIH吗?关于这些法官的命令正在发生的事情,并没有太多清晰的说明。
有一些迹象表明,政府可能已经决定要违抗这些法官的命令,但在某些情况下,情况非常复杂。但最重要的是,研究人员担心法官的命令不会得到遵守,资金也不会重新流入。我在
科学新闻界和认识的研究人员中看到了对此的很多反应。但人们对此的担忧程度非常高。是的。我的意思是,Sarah,星期五晚上的反应在社交媒体上真是太令人惊叹了,人们发布新闻稿。我采访的一位研究人员将这份备忘录比作向大学投下原子弹。
另一位说,大型研究型大学团体之一说,这将使美国的竞争对手感到高兴,因为它将掏空我们的研究机构,并使我们竞争力大大下降。所以人们真的很生气。谢谢,David。这对我理解现在正在发生的事情非常有帮助。希望我们很快就能了解更多信息。好吧,这是一个我们肯定会关注的故事。谢谢,Sarah。
David Malikoff是Science的国际新闻编辑。你可以在science.org/podcast找到我们讨论的故事的链接。要了解我们所有的科学政策报道,你可以访问science.org/scienceinsider(一个词)。请继续收听关于使用机器学习更好地了解动物的故事。
在节目开始之前,我想请你考虑订阅《科学新闻》。你已经听过我们的一些编辑在这里的讲话,David Grimm、Mike Price。他们以准确性和良好的热情处理最新的科学新闻,考虑到每周可能超过20篇文章,这真是太令人惊叹了。你会听到我们记者的讲话。他们遍布世界各地,撰写关于各个主题的文章,他们来到这里分享他们的故事。订阅的资金,大约每周50美分,
直接用于支持非营利性科学新闻报道、追踪科学政策、我们的调查、国际新闻,是的,当我们发现新的木乃伊秘密时,我们也会报道。通过你的订阅来支持非营利性科学新闻报道,网址为science.org/news。向下滚动,点击右侧的“订阅”。那就是science.org/news。点击“订阅”。
人工智能在视觉模式识别方面非常出色,它可以吸收大量示例并在数据中找到这些模式。这种方法已应用于许多科学问题。我们在播客中讨论过从卫星图像中寻找栅栏或通过分析音频频谱来区分肺结核咳嗽,仅举几例。现在研究人员正在
开始使用AI来观察动物的面部。到目前为止,AI不仅可以区分猪,而且还开始学习如何判断它们的面部表情可能意味着什么。本周的科学新闻中,自由科学作家Krista Lestay-Lassere撰写了关于使用AI来了解动物的文章。你好,Krista。欢迎回到科学播客。
你好,Sarah。你知道,是什么让你决定撰写这篇关于动物、机器学习和人工智能的更大型文章?我一直都在写关于这些动物面部表情的文章,主要是在马身上。马的面部表情有很多研究。你知道,它们是这些猎物物种。它们不想引起捕食者的注意。因此,它们已经发展出通过非常细微的面部表情进行相互交流的能力。所以
它实际上是自然而然地结合在一起的,我只是反复看到人们对解读动物面部表情感兴趣。对。这里有一些例子吗?你知道,解读动物面部表情或它们的情绪有什么好处?正如你所说,为什么马受到了如此多的关注?首先,它对疼痛非常有帮助。这就是一切开始的地方,你知道,是为了找出,例如,在兽医情况下,很多时候它们不会告诉你
它们需要更多的止痛药。但它们的面部表情会表明它们不舒服。还有一个问题是,例如,马的腿、脚甚至背部可能出现问题,导致它们跛行,这意味着它们看起来像是在跛行。但这有时甚至非常细微。我们不希望马被骑乘,尤其是不参加比赛。
如果它们正在遭受任何形式的痛苦。因此,它们的面部表情实际上可以成为我们了解它们感受的第一种方式,甚至在它们表现出我们可以察觉到的任何身体动作之前。因此,这对于动物福利和良好的关系非常重要。所以你谈到的一个项目叫做IntelliPig。他们试图用这种技术做什么?
这是他们所谓的智能农场理念的一部分,在这个理念中,我们将我们对机器学习的了解应用到可以改善农场动物生活的情况中。因为你有一位农民,他非常了解他的动物,但他如何才能一天观察一千只动物以确保它们安好?但他可以要求AI扫描每只猪的面部。
他们从猪的面部身份开始。我不知道你是否见过,Sarah,
一头大白猪,不,我的意思是,它们看起来都差不多。你很难区分猪A、猪B、猪C和猪,你知道,355。但这个AI在检测一只对我们来说看起来与另一只猪完全相同的猪方面,准确率可以达到97%。因此,他们从面部ID开始,但他们也会观察并说,这只猪今天怎么样?他们可以
识别出显示疼痛、任何压力类型的面部表情。他们还会记录他们上周、上个月甚至更早拍摄的照片。他们可以进行比较,看看这只猪随着时间的推移情况如何,并根据这只特定猪的需求进行调整。这只猪是否需要兽医护理?也许是不同种类的饲料。这只猪是否需要不同的社交环境才能让动物更舒适?这些模型的输入只是变形。
大量的视觉数据。他们从哪里获得IntelliPeg或我们关于此有一个非常好的图形的这些多孔表情?数据从哪里来?模型是如何训练的?模型的训练首先基于动物行为专家的直接信息。因此,动物行为专家能够说,好的,这只动物很痛苦。
或者这只动物很紧张,或者这只动物可能并不痛苦或紧张。很难肯定地说,因为我们无法询问它们,但在他们最好的猜测中,这是一张照片或一段视频,显示的是一只状况良好的马的脸。这是一段视频或一张照片,显示的是一只刚刚进行去势手术的马,你知道,这只动物可能很痛苦。
或者是一只刚刚接触到非常强势的老母猪的猪,这些老母猪正在骚扰它。因此,我们知道它也很紧张。多年来,动物行为专家一直在进行他们所谓的“面部动作编码”,他们正在捕捉动物面部表情的这些特定方面,以说明眼睛向上移动、嘴巴向下移动、耳朵向后移动。这是一个迹象
疼痛、压力或类似的东西。最初的想法是,研究人员正在教机器识别人类已经识别出的面部表情的这些不同方面。然后随着时间的推移,研究人员意识到,你知道,他们实际上可以对机器说,好的,看,这是一只手术前的兔子,可能是一只快乐的兔子。
这是一只刚刚做完手术的兔子,很可能很痛苦。我们还没有给它止痛药。机器,请告诉我们你看到了什么区别?对。对。所以让它接管学习过程,以捕捉人类没有明确定义的东西。是的。
没错。这就是我们实际上看到AI在识别这一点上胜过人类的地方,尤其是在最近一项关于绵羊疼痛的研究中,人类能够识别出60%、67%左右的疼痛绵羊,但AI能够识别出近90%的区别。我们有点挠头,说,等等,你是怎么看到的?因为我做到了,我错过了。我
我完全错过了。人们可以进去弄清楚这些机器正在捕捉到什么吗?是的,绝对可以。这目前是一个大问题,他们称之为“黑匣子”。机器到底发现了什么?但他们
幸运的是,这是一个软件程序,允许我们看到它,它会创建所谓的热图,它们会查看面部的哪个区域,它们在哪里捕捉到最大的差异?大多数情况下,它实际上是在眼睛周围。通常是耳朵,但也可能是眼睛周围。
这太有趣了。到目前为止的主题一直是疼痛或不适。我认为这是更容易在数据中进行注释的东西,对吧?你就像,你可以清楚地说,我知道,鉴于上下文,这是一只疼痛的动物或一只紧张的动物。但更微妙、更复杂的情感呢?也许宠物主人或马主人
马主人。最终,这就是我们想要的,对吧?我们需要知道他们的感受才能告诉机器。我们需要注释这些图片,并说,这是一匹困惑的马。这是一只沮丧的猫。然后,那么我们如何获得那部分?那怎么做......
工作?你正在谈论的实际上是我们所说的“基本事实”。我们真的需要确保,如果我们说这是一只快乐的猫或一只沮丧的狗,我们肯定知道这只动物确实感受到了这种情绪。首先,我的意思是,大多数研究人员甚至不想使用这些
词语。他们不想说动物快乐或悲伤,因为我们只是不知道它们到底在感受什么,但我们确实知道它们可以有积极或消极的情绪。因此,为了讨论的目的,让我们假设它们快乐或悲伤,或者我们可以稍微预测一下。因此,他们能够创造一些这样的情况
最近有一项研究,研究人员让狗感到沮丧。他们教导它们,如果它们坐在特定的地方并等待一分钟,它们就会得到奖励。然后他们不得不等待奖励,他们感到沮丧。因此,他们能够比较渴望的狗。他们就像,哦,太好了,我们将得到奖励。然后突然奖励没有来了。因此,我们,你知道,可以假设它们可能感到沮丧或类似的情绪,但只是与马类似的东西。
研究人员能够拍摄这些动物并向AI提供这些图像,并说,这是动物渴望时的样子。这是动物沮丧时的样子。这是动物既不渴望也不沮丧时的样子。它只是,你知道,正常状态。但更有趣的是,对于马来说,他们添加了一个不同的元素,马根本没有得到奖励。它消失了。
因此,马要么感到沮丧,要么在某个时候变得我们所说的失望,至少是马的失望等价物,对吧?这真的很新,AI能够捕捉到沮丧和失望之间至少有一些区别,这真的很令人兴奋,因为这不仅仅是消极情绪的问题。这是区分两种不同类型的消极情绪。没有。
很多这种数据。我不知道为什么这在我的故事中真的打动了我。我甚至无法估计互联网上有多少猫和狗的照片。我知道,我知道。太多了。但没有关于它们的数据,对吧?你不能只是下载所有Flickr并说,找到猫,因为你不知道猫正在经历什么。所以,你必须自己想办法解决这个问题,这需要一段时间。听起来要对动物中这些更复杂的情绪进行研究需要一段时间。
你的故事最后提到的另一件事,我认为这非常有趣,那就是鸡的面部活动并不多。那么我们如何了解我们的鸡呢?我们可以将这些动物的其他信号整合进来,以更全面地解读它们吗?是的,很多面部表情研究都是针对哺乳动物进行的,你知道,因为哺乳动物与我们共享许多相同的面部肌肉。但是当你来到其他类型的动物、其他动物群体、鸟类、鸡时,它们表达情绪的方式不同。显然,鸟类不可能,你知道,像那样移动它们的喙,这可以帮助我们理解面部表情。所以还有其他方法可以做到这一点。我的意思是,动物也很善于发声。它们不像我们那样拥有语言,但它们确实会发出咕噜声。它们会尖叫。这些非常重要。它们通常充满了情绪信息。它们的一般肢体语言,我们必须随着时间的推移观察肢体语言。所以不仅仅是,不仅仅是
不是快照,以及它们正在进行的一系列动作,这些动作可以为我们提供更多关于它们感受的信息。而且,也可能还有许多其他事情,包括它们的体温以及它们散发出的热量,也可以提供很多关于它们正在做什么的信息。因此,AI在帮助我们整合所有这些方面还有很长的路要走。这是一项艰巨的工作。有很多信息,但是它
这是AI可以作为我们合作伙伴帮助我们了解动物感受的东西。是的,绝对的。当涉及到农场或兽医时,他们会想要,他们不会与他们的动物建立密切的联系,他们可以依靠这种联系来做出这些判断。他们将能够将其用作工具。而我个人,你知道,我的猫真的很难读懂。我有三只,这太疯狂了,但它们彼此之间都非常不同。你知道,我很想要一个小的AI,它只会说,
她不开心。而这真的很重要,对于你的三只猫来说,也能够拥有一个AI来说明你的猫彼此之间在说什么,这也很重要。哦,我的天哪。不仅仅是它们与你沟通的内容,还有它们彼此之间沟通的内容,以确保这是一个它们在一起快乐的时刻。或者也许这是一个Sarah应该介入并说,好的,你们其中一个暂停一下。冷静下来。这就是梦想。好吧,Krista,非常感谢你与我交谈。谢谢,Sarah。Krista Liste of the Serp。
是一位总部位于巴黎的自由科学作家。你可以在science.org/podcast找到我们讨论的故事的链接。不要换台。接下来,我们将讨论为什么机器人裤子可能不应该安装车载摄像头。
《科学机器人》论文有很多视频。我浏览了它们,几乎所有发表的论文,你都会看到这些令人难以置信的机器人主题变体。你知道,我们看到磁控微型机器人沿着血管内部巡航,这些嗡嗡作响的无人机正在高速穿过森林。我看到很多实际上是可穿戴设备,旨在以不同的方式停留在身体上。
我看到一个用于额外抓握选项的第三个拇指,一个从背部安装伸到肩膀上方的额外手臂,用于举重。
以及这些可以更有效地捕获和利用步行能量的裤子,为什么我们现在没有这些东西呢?这似乎是可以实现的。最近在《科学机器人》上,Kea Godosky及其同事撰写了关于可穿戴设备采用缓慢以及为什么在这些技术中包含计算机视觉可能不是一个好主意的文章。你好,Kea。欢迎来到科学播客。你好。感谢你的邀请。哦,当然。我相信有很多因素导致可穿戴技术的采用
技术较慢?一些关键问题是什么?在我们的论文中,我们特别讨论了可用性、可靠性、隐私和成本方面的挑战。在我看来,最大的是可用性。我们从中获得的好处是否抵消了与使用设备相关的成本或挑战?外骨骼,特别是下肢外骨骼,是这些类型技术的特别成问题的应用。
让我补充一点,当我们说下肢外骨骼或假肢时,这些基本上是帮助行动、帮助你行走或从你自己的行走中获得更多力量的东西。例如,很多人不想在外出时穿戴非常显眼的东西。他们不想引起人们的注意。因此,这些设备必须小巧且不显眼。特别是对于计算机视觉来说,如果你有像摄像头这样的东西,并且你穿着衣服在上面
如果一个可穿戴设备上装有摄像头,那么要么这个设备因为摄像头被衣服遮挡而无法使用,要么摄像头现在位于衣服上方,这再次让人注意到你穿戴着什么东西。为什么要在下肢外骨骼上安装摄像头?当然,有一些用例......
拥有摄像头和视觉是控制设备的重要方面。这就是我们控制行走方式的方式,我们观察要去哪里。是的,其中有很多自动化。所以我们知道如何移动,我们不一定要看我们踩在哪里,但这是我们移动方式的重要组成部分。这就是使用计算机视觉的动机。但这里的问题是
例如,在下肢装置、下肢假肢或外骨骼中,了解我们何时即将走上楼梯或我们将要改变行走表面非常有用。这是一个非常重要的用例。但同样,如果你没有光线,或者你的衣服遮挡了摄像头,它就不一定那么有用。
另一个重要的用例是,许多人,特别是那些有残疾的人,希望将外骨骼用于日常活动,尤其是在浴室里,对吧?你想能够舒适地独立站立和坐下。你不想让别人在那里。你也不想在那里装摄像头。没错。
没错。这与隐私方面有关,但我认为可靠性、隐私和成本这三者都与该设备最终是否足够实用以至于人们愿意继续使用它有关。那么,让我们稍微谈谈一些其他用例,在这些用例中,可穿戴设备可能有也可能没有从机器人视觉中受益。你能谈谈这可能适用的其他一些方式以及是否要使用计算机视觉的考虑因素吗?
也许我先谈谈我认为计算机视觉或机器视觉非常有帮助的环境。那就是在上肢假肢中。人们对此已经研究了很长时间。他们研究了我们如何识别一个人即将抓取的物体以及应该如何进行这种互动?也就是说,虽然我们可以使用机器视觉,但还有许多其他侵入性较小、更私密的方法可以做到这一点。
例如,我们可以使用肌电图的肌肉激活测量来进行这种对人可能想要进行的抓握类型的感知和预测。这并不一定是最好的解决方案,但它确实非常有效。然而,我们并没有真正看到它在现实世界中得到广泛采用。部分原因是,即使对一个人可能想要做什么有了这种程度的了解,设备的行为方式也会让人感到疏远。
对这个人来说很陌生。如果这个人感觉自己不知道设备在做什么或无法预测设备即将做什么,他们就不想继续使用它。这是一个界面问题。因此,你知道你的设备在做什么以及你的设备知道你在做什么,这可以通过摄像头来辅助,但不一定,这并不一定是最好的解决方案。是的。我有一些补充,但在进入正题之前
我想提一下另一个应用,在我们研究小组中,我们已经看到这是一个问题。那就是,我们喜欢使用这些外骨骼,特别是腿式外骨骼,来辅助高强度任务,应用于能源部、军队等等。在许多这些非常敏感的应用领域中,
我们不能再使用摄像头了。因此,隐私又成为另一个问题。是的,有一些解决方案,例如,你可以让所有事情都在机载进行,并将数据处理得非常私密。虽然你可以减轻很多这些挑战,但为了做到这一点,你增加了设备的重量,增加了设备的本地计算能力。而这
再次,现在正在削弱设备实际上可以帮助你的功能。因为如果它更重,那么它对你的帮助就不如它更轻、仍然能够做到同样的事情那样大。是的,我可以看到这些比率,比如成本上升了,重量上升了,可用性上升还是下降了?所有这些都在波动。拥有摄像头、拥有视觉会影响这些东西对你的作用。回到你之前关于它是关于......
人与机器人之间共享的界面,我们应该考虑这一点的一种方式是,是的,人类在与环境互动时会使用视觉。但这种视觉是我们用来自己做决定的。而如果机器人根据其视觉做出决定,它们可能不一定与人类试图做的事情完全相关。
相反,可能存在这样的论点:我们应该改为关注从人类自身获得的信号,并利用这些信号来驱动机器人应该做什么。是的。我们还在整合许多其他东西,声音和触觉反馈以及本体感觉,我们四肢的位置。所有这些都融入到我们的决策中,即使我们没有注意到。没错。机器人只是说,我看到楼梯了。而你却说,但我正在跑步。对。
没错。如果你走到楼梯跟前,机器人认为你想上楼梯,但你不想。所以你想停下来,但现在机器人想让你动。所以你创造了一个非常不安全的环境。在较低肢体空间中,许多这些问题都会加剧,因为灾难性问题的范围要大得多。绝对正确。
我认为这是我在你的文章中读到的一点非常有趣的地方,那就是,你知道,我们使用视觉,但它可能会让我们失败,无论是天黑了还是有一些东西在我们和我们想要看到的东西之间。我们有所有这些并行系统可以帮助我们在这种情况下。如果同样的故障会影响你的假肢,那么你也必须在那里安装其他系统来补偿视觉的故障。那里的论点也是,如果
如果我们完全依赖视觉,那么我们就需要有备份系统。我们有非常好的系统可以工作,并且可以作为备份。但在这种情况下,视觉到底增加了什么?如果我们可以用我们已经拥有的系统做到所有这些,那么视觉是否能给我们带来更多的东西来抵消我们现在添加到系统中的成本和重量?是的,那么其他一些传感器或其他一些过程的例子是什么?
会替代我们在前面讨论过的一些场景或其他设备中的计算机视觉?我们喜欢使用的传感器具体是IMU,惯性测量单元。你知道,它们给我们提供了关于人体每个关节的加速度和角度信息
关于人体每个关节。因此,它们基本上告诉我们,你如何移动?你移动的速度有多快?你的关节是如何相对于彼此移动的?这可以给我们提供很多信息。我们甚至可以使用它来识别,你知道,你是在走路吗?你是在跑步吗?等等。它不如视觉那样具有规定性
精确,但它仍然有很长的路要走。我简要提到的另一个是肌肉激活,我们使用肌电图来测量它。这告诉我们,你知道,你激活肌肉的程度如何?你的大脑基本上是如何告诉你的身体移动的?以及这些信号是如何通过你的肌肉传递到外骨骼的,比方说?听起来更像是读心术。所以更侧重于佩戴者的意图。
研究人员确实研究过使用脑电图或脑电波来预测一个人可能正在做什么,并使用它们来尝试控制外骨骼。是的。那么你认为
从大局来看,可穿戴设备类别中最终会进入我们生活的是什么?你对此有什么预测吗?或者你感觉有什么东西会成功并成为我们日常生活中的一种常见物品吗?我认为我们需要在设备的重量和可用性方面取得突破。我们面临的一些具体挑战是
我们可以拥有的传感器的最小数量是多少?我们可以减少设备本身的重量、电池的重量吗?电池是可穿戴设备中一个巨大的问题。我们可以摆脱许多这些可能导致设备效率不如预期的东西吗?
所以这是需要发生的一件事。然后另一件事是,我们仍然不一定知道,尤其是在外骨骼的背景下,设备应该如何表现才能让人们从中受益最大。部分原因是,如果你与外骨骼互动过,它会让人感觉非常陌生,尤其是在开始的时候。
然后随着时间的推移,你就会习惯它。但是如果你改变了外骨骼的行为方式,你对它的反应也会改变,等等。因此,需要来回进行一些调整。让外骨骼学习和理解人类的需求,我认为,是这些设备需要发生的事情的重要组成部分。是的。所以是用户界面。这些技术有日常用例吗?
比如肢体支撑之类的东西?是的,我很高兴你问这个问题。所以我们实际上有一个用例,我们想帮助完成高能量的任务。所以想想你可能在仓库工作的情况,那里有背部外骨骼或膝盖外骨骼来帮助完成举重任务。这是一个已经发生的事情的例子。已经有这样的被动设备存在,我们正在研究类似的动力系统。
我认为另一个非常有趣的例子是可穿戴设备,可以帮助人们徒步旅行或更舒适、更轻松地行走。现在有一些公司正在研究一种类似电动自行车的裤子,现在可以让你徒步旅行更舒适、更轻松一些。喜欢它。
我想说,这篇论文的根本主题是,是的,机器视觉在未来当我们拥有已经非常有效的设备时可能会非常棒。问题是,特别是对于商业应用来说,我们
还没有达到那个水平。你会看到我们的一些合著者实际上是业内人士,并且正在使用这些设备。他们看到采用率不足,无论是动力外骨骼还是动力假肢。这在很大程度上是因为这种不匹配。他们花费了所有这些钱,然后他们得到一个设备,要么它没有为他们做他们认为它会做的事情,要么它的行为方式让他们感觉不舒服。
所以他们最终没有使用它。这种放弃是我们需要解决的商业应用问题。就可穿戴设备而言,我们仍然不一定有很好的方法与人类进行物理互动。因此,即使计算机视觉能够准确地找出一个人想要做什么,但这并不一定意味着设备会按照人的意愿行事。我在《科学机器人》杂志的页面上看到很多触觉反馈的东西,那就是
机器人告诉你,或者在这种情况下,我想假肢告诉你它正在接触什么。这太复杂了。是的。这实际上也回到了我前面提到的观点,我们需要了解人类的视角以及他们想做什么。但与此同时,人类也必须了解设备,这种双向性是在我们能够进行更复杂的或高级的、无论更简单还是更难的传感设备之前需要建立的东西,我们首先需要了解我们的设备用于人与机器人之间实际交互的目的。
所以基本上,我们理解设备将要做什么的能力以及设备告诉我们它将要做什么的能力仍然有限,我们仍在学习如何让它发挥作用。计算机视觉只能在一定程度上帮助解决这个问题,它实际上会干扰我们从设备中想要获得的许多其他东西。因此,最好先把它放在一边,直到我们更擅长让这些设备为我们工作,并找出视觉将真正优化它们的用例。是的,这听起来完全正确。
非常感谢你,Kea。这太棒了。非常感谢你邀请我。Kea Ganosky是佐治亚理工学院的博士后研究员。她将于今年夏天加入莱斯大学担任助理教授。你可以在science.org/podcast找到我们讨论的科学机器人论文。
本期《科学播客》到此结束。如果您有任何意见或建议,请写信至[email protected]。要在播客应用程序中找到我们,请搜索“科学杂志”或访问我们的网站science.org/podcast收听。本节目由我和Sarah Crespi以及Kevin McLean编辑。我们得到了Podigy的Megan Tuck的制作帮助。我们的节目音乐由Jeffrey Cook和Wenkloy Wen创作。
代表《科学》杂志及其出版商AAAS。感谢您的收听。您收听我们是为了了解科学领域的新发现。但您知道我们是美国科学促进会(AAAS)的一部分吗?AAAS是一个非营利性出版商和科学协会。当您加入AAAS时,您将帮助支持我们的使命,即为了所有人的利益而促进科学发展。
成为AAAS银牌会员或更高等级会员,即可获得一年《科学》杂志订阅和独家礼品。今天就访问AAAS.org/join加入。网址是A-A-A-S点O-R-G斜杠join。