We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Is AI Ready For Robots?

Is AI Ready For Robots?

2025/3/31
logo of podcast Short Wave

Short Wave

AI Deep Dive AI Chapters Transcript
People
C
Chelsea Finn
E
Elon Musk
以长期主义为指导,推动太空探索、电动汽车和可再生能源革命的企业家和创新者。
G
Geoff Brumfiel
G
Google
谷歌通过推出Gemini 2.0 AI 模型和 AI Mode 搜索模式,进一步提升了其在人工智能领域的竞争力和创新能力。
K
Ken Goldberg
M
Matthew Johnson-Roberson
M
Moojin Kim
P
Phulkit Agrawal
R
Regina Barber
Topics
Elon Musk: 我认为AI技术可以成功应用于人形机器人,软件和AI推理计算机都适用于此类机器人。 Google: 我们正在将Gemini 2.0的智能应用于物理世界中的通用机器人代理。 Moojin Kim: 我们正在使用AI技术开发新型机器人,但这仍然是一个漫长的过程,还有很多工作要做。 Geoff Brumfiel: 传统的机器人编程需要工程师编写详细的指令,而AI技术可以通过让机器人学习任务来简化这一过程。AI机器人通过强化和削弱神经网络中的连接来学习任务。 Chelsea Finn: AI有潜力使机器人能够理解并执行简单的日常任务,例如制作三明治、清洁厨房或补充杂货店的货架。我们的长期目标是开发软件,使机器人能够在任何情况下都能够智能地运行。 Regina Barber: AI机器人技术有望实现通过简单的指令完成复杂任务的可能性,例如制作冰淇淋圣代。 Ken Goldberg: 尽管AI技术发展迅速,但AI驱动的机器人技术尚未达到科幻作品中描绘的水平。机器人AI的训练数据不足,限制了其发展速度,需要海量数据才能达到与虚拟聊天机器人一样的水平。 Phulkit Agrawal: 利用模拟环境可以加速机器人AI的训练,但在处理复杂物理交互方面存在局限性。模拟环境在处理诸如抓取物体等任务时,由于对力的理解不足,容易导致物体飞出或机器人损坏。 Matthew Johnson-Roberson: 将AI应用于机器人面临着更深层次的问题,不仅仅是数据量的问题,还在于问题的定义方式。机器人需要完成的任务比预测下一个单词复杂得多,需要找到合适的训练方法。

Deep Dive

Chapters
The episode explores the integration of AI into robotics, moving beyond virtual applications and into physical reality. It starts by mentioning Tesla's Optimus and Google's AI-powered humanoid robots, highlighting the gap between ambitious claims and practical achievements in robotics.
  • AI's presence in virtual life (search, phones, emails),
  • Tesla's Optimus and Google's humanoid robots powered by AI,
  • Historical disappointment of robots compared to expectations

Shownotes Transcript

人工智能似乎充斥着我们的虚拟生活。它存在于我们的搜索结果和手机中。但当人工智能从聊天中转移到现实世界中会发生什么?NPR科学编辑兼记者Geoff Brumfiel前往斯坦福大学规模化机器人交互智能实验室,了解科学家们如何利用人工智能驱动机器人,以及他们即使执行简单任务也面临的巨大障碍。阅读Geoff的完整报道。对更多人工智能故事感兴趣?请将您的想法发送电子邮件至[email protected]。了解更多关于赞助商信息选择:podcastchoices.com/adchoicesNPR隐私政策</context> <raw_text>0 此消息来自NPR赞助商Atio,这是人工智能时代的CRM。连接您的电子邮件,Atio会立即构建一个强大的CRM,其中包含您曾经拥有过的每家公司、联系人以及互动。在attio.com/NPR开始您的免费试用。您正在收听来自NPR的Shortwave。

嘿,Shortwave听众们。我是Regina Barber。人工智能似乎充斥着我们的虚拟生活。它存在于我们的搜索结果和手机中,它甚至试图阅读我的电子邮件。但NPR科学记者Jeff Brunfield注意到,人工智能不再仅仅出现在网络上了。它开始渗透到现实世界中。是的。我不知道你去年是否收听了特斯拉的盛大营销活动,Regina。没有。但人工智能在那里。说到机器人……

特斯拉显然是一家汽车公司,但特斯拉首席执行官埃隆·马斯克将活动很大一部分内容都放在了一个由人工智能驱动的名为Optimus的类人机器人上。软件、人工智能推理计算机,所有这些实际上都应用于类人机器人。

谷歌刚刚发布了另一个使用人工智能运行的类人机器人。我们将Gemini 2.0的智能带入物理世界中的通用机器人代理。

好的,Jeff,但即使在人工智能出现之前,人们和公司也一直在对机器人做出很大的承诺。他们做到了。他们做到了。而且正如你所知,Gina,与愿景相比,机器人总是令人失望。是的,那是真的。这就是为什么我开始了解人工智能和机器人的真相。真相。我认为我在埃博拉混合坚果中找到了它。今天的节目中,当人工智能从聊天中转移到现实世界中会发生什么?

我们正在研究人工智能如何可能彻底改变机器人技术。您正在收听NPR的科学播客Shortwave。

此消息来自NPR赞助商微软Azure。人工智能平台的转变带来了巨大的机遇,但通往成功的道路并非总是清晰的。引领转变是微软Azure的一个新播客,来自各行各业的领导者和远见卓识者分享了他们在驾驭这个新技术时代时所学到的东西。立即收听并订阅,探索现实生活中真实创新的故事。您可以在任何收听播客的地方收听。

好的,Jeff,你对了解人工智能如何在机器人中工作很感兴趣。你从哪里开始的?我没有去特斯拉或谷歌,但我确实在去斯坦福大学的路上经过了它们。好的。特别是IRIS实验室,它代表规模化机器人交互智能。

我得到了一位名叫Moojin Kim的研究生的参观。Moojin致力于一种新型机器人,它由类似于聊天机器人中使用的人工智能驱动的。这是朝着机器人版ChatGPT迈出的一步,但仍有很多工作要做。

好的。好吧。你想让我看看它能做什么吗?当然可以。那么,Jeff,机器人是什么样子的?这并不是大型科技公司推出的那种类人机器人。它只是一对带有夹子的机械臂。好的。但有趣的是,它由一个名为OpenVLA的人工智能模型驱动。

所以首先,我们应该快速地说一下,你知道,一个普通的机器人必须非常非常仔细地编程。工程师必须为它想要执行的每个任务编写详细的指令。是的。而人工智能应该改变这一点。没错。这就是这里发生的事情。这个机器人由一个可教的人工智能神经网络驱动。

神经网络的工作方式与科学家们认为人脑的工作方式类似。基本上,网络中存在这些数学节点,它们以类似于大脑中神经元相互连接的方式彼此连接着数十亿个连接。因此,当您去编程这种东西时,它只是关于加强节点之间重要的连接以及削弱其他不重要的连接。

因此,在实践中,这意味着Moojin可以通过展示来教OpenVLA一项任务。因此,基本上,无论您想做什么任务,您只需一遍又一遍地重复它,也许重复50次或100次。机器人的AI神经网络就会针对该任务进行调整,然后它就可以自己完成该任务了。是的,这让我想起了我们做的那个微笑机器人的故事,那个机器人只是观看大量人们微笑的视频,然后它就学会了如何微笑。

是的,完全一样,只是这个机器人不仅仅是微笑,它实际上是在做事。为了向我展示,Moojin拿出了一个装有各种混合坚果的托盘,我输入了我想要它做什么。好的,所以用勺子把一些带坚果的绿色混合坚果舀到碗里。

哦,我的天哪。看看会发生什么。好的,Jeff,就我个人而言,我一直期待着机器人技术中出现人工智能,因为你可以教它做某事,你可以要求它做某事,比如为我做一份冰淇淋圣代,而无需任何花哨的编程或特殊知识。就是这样,你知道吗?这确实是运行这个实验室的研究人员的梦想。她的名字叫Chelsea Finn。因此,从长远来看,我们希望开发允许机器人在任何情况下都能智能运行的软件。

而“智能”的意思是,机器人可以理解像“把一些绿色的东西舀到碗里”或“为我做一份圣代”这样的简单命令,然后在现实世界中执行。即使只是做一些非常基本的事情,比如能够做三明治、能够清洁厨房或能够补充杂货店货架。这些都是可以帮助人类完成工作或在家中完成任务的简单任务。

现在,Chelsea还共同创立了一家名为Physical Intelligence的创业公司。它最近展示了一个可以从烘干机中取出衣物并折叠的移动机器人。同样,这个机器人是由人类训练其强大的AI程序来训练的。好的,冰淇淋圣代,这是为了进步吗?折叠是不是更容易开始?我的意思是,Gina,我实际上认为折叠更难。让我给你看一段视频。

好的,它正在去烘干机。它正在把东西拿出来,放进篮子里。

它和我洗衣服时的专注度一样。它看起来几乎像我一样讨厌折叠。哦,我的上帝,它做得非常好。是的,是的,对吧?哇。这是一个复杂的任务。它必须把这些衣服拿出来。它必须弄清楚它们是什么。它甚至没有头,但我却赋予它个性。它看起来好像在说,“哦,我只需要再折叠一件。”好的,那么它真的像只是教机器人做什么一样简单吗?因为……

如果是这样,这些机器人就不会到处都是了?是的。我的意思是,对。在视频中看起来很酷。事实是,你知道,当你把这些机器人拿出来一遍又一遍地尝试完成这些任务时,它们会感到困惑。它们会误解。它们会犯错误,然后它们就会卡住。

所以,你知道,它可能能够在90%或75%的时间里折叠衣物,但在其余的时间里,它会弄得一团糟,然后人类必须进去清理。明白了。好的。我和加州大学伯克利分校的教授Ken Goldberg谈过话,他非常强调人工智能机器人还没有到来。对。

机器人不会一夜之间突然变成科幻小说中的梦想。好的,告诉我为什么。因为人工智能聊天机器人已经变得非常快地好多了。那么为什么这些机器人会卡住呢?

好的,人工智能在过去几年中确实得到了大幅改进,但这是因为聊天机器人拥有大量的学习数据。它们基本上使用了整个互联网来训练自己如何编写句子和绘制图片。但Ken说……对于机器人技术来说,什么都没有。我们没有任何东西可以开始,对吧?没有……

机器人命令根据机器人输入生成的例子。如果机器人真的需要像虚拟聊天机器人朋友一样多的训练数据,那么让人类一次教它们一项任务将需要很长的时间。你知道,按照目前的进度,我们将需要10万年才能获得这么多的数据。什么?

好的,太久了。比如,有没有其他选择?一定有。是的。科学家们现在正在探索它们。其中一种可能是让机器人的AI大脑在模拟中学习。一位正在尝试这种方法的研究人员名叫Phulkit Agrawal。他在麻省理工学院工作。模拟的力量在于我们可以收集非常大量的数据。

例如,在三个小时的模拟中,我们可以收集100天 worth 的数据。所以对于某些事情来说,这是一种非常有前景的方法,但对于其他事情来说,这更具挑战性。例如,让我们谈谈走路。当你只是处理地球和你的身体时,四处走动的物理学实际上很简单。当你进行运动时,你知道,你主要是在地球上。你知道,你无法施加任何力量来使地球移动。

因此,模拟可以做得相当好。但是,如果你想让你的机器人尝试从桌子上拿起一个杯子或其他什么东西,那就复杂多了。或者力量。你知道,如果你施加了错误的力量,这些物体可能会很快飞走。

基本上,如果你的机器人不理解它所携带物体的重量和大小,它就会把东西扔到房间的另一边。还有更多。你知道,如果你的机器人遇到任何你没有完全完美模拟的东西,那么它将不知道该做什么。它会坏掉。好的,听起来这些模拟有局限性,而现实世界的训练将需要一段时间。我开始明白为什么机器人不会像明天一样出现。

没错。一些研究人员认为,实际上,试图将人工智能应用于机器人技术还有更深层次的问题。其中一位是匹兹堡卡内基梅隆大学的Matthew Johnson Roberson。在我看来,问题不在于我们是否有足够的数据?更重要的是,问题的框架是什么?让我们再谈谈人工智能聊天机器人。

Matt说,尽管它们拥有令人难以置信的技能,但我们要求它们执行的任务实际上相对简单。你知道,你查看人类用户键入的内容,然后尝试预测用户想要看到的下一个单词。机器人需要做的远不止是撰写句子。对。预测下一个最佳单词效果非常好。

这是一个非常简单的问题,因为你只是在预测下一个单词。目前还不清楚我能否使用20小时的GoPro镜头,然后就能就机器人如何在世界上四处移动产生任何有意义的东西。

换句话说,我们希望我们的机器人执行的科幻任务与句子写作相比是如此复杂。除非研究人员能够找到正确的方法来教机器人,否则可能没有足够的数据。或者让机器人教机器人。是的。这也是一种选择。它们可以自学。好的,Jeff,你已经把我从乐观主义者变成了悲观主义者。这是我每天都会走的路。我开始认为人工智能,就像……

它在机器人中永远不会运行得很好,或者这将需要很长的时间。如果你把我变成了悲观主义者,我很抱歉,Gina。这种情况会发生。我将不得不把你拉回来,因为——

人工智能已经以非常有趣的方式进入机器人技术。例如,Ken Goldberg共同创立了一家包裹分拣公司。就在今年,他们开始使用人工智能图像识别来选择机器人抓取包裹的最佳点。哦,好的。是的,他告诉我,效果非常好。我认为我们将看到很多这样的情况。人工智能被用于机器人问题的某些部分,你知道,行走或行走。

视觉或其他什么,它将取得重大进展。它可能不会同时出现在所有地方。

为了真正以积极的音符结束,让我们回到斯坦福实验室。记住,我要求它抓一些混合坚果,对吧?是的。所以机器人正确地识别了Moojin Kim松了一口气的正确垃圾箱。通常情况下,它识别物体并走向它的那个位置,就是我们屏住呼吸的地方。然后非常非常缓慢地,有点犹豫地,它伸出爪子,拿起勺子。哦!

它做到了。Mujin,我刚刚编程了一个机器人吗?你做到了。看起来它正在工作。在我看来,这令人难以置信。记住,没有人真正对机器人进行精确的编程。这完全是神经网络学习如何移动爪子并自行响应命令。对我来说,这能起作用真是太不可思议了。我认为这将导致一些非常酷的发展。我很高兴听到更多,Jeff。非常感谢你向我们提供这份报道。非常感谢你。

我们将在我们的剧集说明中链接Jeff的完整故事,其中包含机器人视频。本剧集由Burleigh McCoy制作,由我们的节目主持人Rebecca Ramirez编辑,并由Tyler Jones事实核查。Jimmy Keeley是音频工程师。Beth Donovan是我们的高级总监,Colin Campbell是我们的播客战略高级副总裁。我是Jeff Brumfield。我是Regina Barber。感谢您收听来自NPR的Shortwave。

NPR为全国各地的社区提供信息和联系,在危机时期提供可靠的信息。联邦资金帮助我们完成创造更知情的公众的使命,并确保公共广播对每个人都可用。了解更多关于维护公共媒体未来的信息。访问protectmypublicmedia.org。

我是Tanya Mosley,是《新鲜空气》节目的联合主持人。Amanda Knox因她没有犯下的谋杀罪而被监禁近四年。当她被无罪释放时,她做出了一个不同寻常的决定,与为她定罪的检察官交朋友。也许他可以帮助她理解她的案子。我花了数年时间思考这个问题并试图理解它,直到我意识到我可以直接问他。在《新鲜空气》播客中收听这段采访。

当Malcolm Gladwell向NPR的ThruLine播客颁发皮博迪奖时,他赞扬了它的历史和道德清晰度。在ThruLine上,我们将带您回到新闻事件的起源,例如总统权力、衰老和福音派。每周在NPR的ThruLine播客中与我们一起进行时间旅行。