人工智能在很多方面都比人类优秀,但体力劳动——即使是看似简单的任务,比如叠衬衫——经常会难倒人工智能机器人。切尔西·芬恩是斯坦福大学的教授,也是物理智能公司的联合创始人。切尔西的问题是:你能建立一个能够教任何机器人完成任何任务的人工智能模型吗?通过订阅Apple Podcasts或Pushkin.fm上的Pushkin+,抢先获得《你的问题是什么?》节目的无广告访问权限。Pushkin+订阅者可以访问无广告剧集、完整有声读物、独家狂欢和所有Pushkin节目的额外内容。在Apple上订阅:apple.co/pushkin在Pushkin上订阅:pushkin.com/plus查看omnystudio.com/listener以获取隐私信息。</context> <raw_text>0 Pushkin。这是一个iHeart播客。每个成功的企业背后都有一个愿景。将愿景变为现实需要的不仅仅是努力。它需要正确的财务基础和支持。这就是Chase for Business的用武之地。凭借便捷的数字工具、有用的资源和个性化的指导,他们可以帮助您的企业自信地向前发展。了解更多信息,请访问chase.com\business。Chase for Business。让您的财富更上一层楼。
Chase移动应用程序适用于特定移动设备。可能需要支付短信和数据费用。摩根大通银行,美国国家银行,FDIC成员。版权所有2025,摩根大通公司。你十年后的职业生涯是什么样的?你现在正在做什么来帮助你实现目标?你越早开始提升技能,你就会越早做好准备。这就是为什么AARP提供各种类别的再培训课程,例如市场营销和管理,以帮助您的收入与您的寿命一样长久。没错。
AARP为您提供大量免费的技能提升课程,因为您今天采取的步骤将帮助您在未来热爱自己的工作。这就是为什么您越年轻,就越需要AARP。了解更多信息,请访问aarp.org/skills。在商业领域,人们常说您可以获得更好、更便宜或更快的服务,但您只能选择其中两种。如果您能同时拥有这三种服务呢?那是
这正是Cohere、汤森路透和Specialized Bikes自升级到下一代云——Oracle Cloud Infrastructure以来所拥有的体验。OCI是用于您的基础设施、数据库、应用程序开发和AI需求的超高速平台,您可以在高可用性、持续高性能的环境中运行任何工作负载,并且比使用其他云的成本更低。
它为什么更快?OCI的块存储为您提供每秒更多的操作。更便宜?OCI的计算成本降低高达50%,存储成本降低70%,网络成本降低80%。更好?在一次又一次的测试中,OCI客户报告说,与其他云相比,延迟更低,带宽更高。这是为AI和您所有最大工作负载而构建的云。
现在,无需任何承诺,即可免费试用OCI。访问oracle.com/strategic。网址是oracle.com/strategic。从比喻意义上说,人工智能无处不在。它可以撰写论文,可以报税,可以设计药物,可以制作电影。但从字面意义上说,人工智能并非无处不在。你知道,大型语言模型可以告诉你,比如,27种叠衬衫并将其放入抽屉的方法。
但是,你买不到任何能够真正叠好衬衫并将其放入抽屉的机器人。不过,也许在不久的将来,会有一个能够使用人工智能学习如何叠衬衫并将其放入抽屉的机器人。或者,你知道,做肉酱千层面、打包箱子、插入电缆。换句话说,将会有一个能够使用人工智能学习如何做任何事情的机器人。
我是雅各布·戈德斯坦,这是《你的问题是什么?》节目,我与那些试图取得技术进步的人交谈。今天的嘉宾是切尔西·芬恩。她是斯坦福大学的教授,也是一家名为Physical Intelligence(简称Pi)公司的联合创始人。切尔西的问题是:你能建立一个能够将人工智能带给机器人的AI模型吗?或者,正如她所说:我们正在尝试开发一个能够控制任何机器人完成任何任务的模型。
Physical Intelligence成立于去年,但该公司已经筹集了超过4亿美元的资金。投资者包括杰夫·贝佐斯和OpenAI。该公司筹集了如此多的资金,部分原因是他们试图做的事情非常困难。运动技能,以精细的方式移动的能力,叠衬衫,插入电缆,对我们来说感觉很简单,很容易,很基本。
但切尔西告诉我,基本的运动技能实际上非常复杂。我们用身体、双手、双腿、双脚进行的所有运动控制……
我们在做的时候并没有考虑很多。我们所做的实际上非常复杂。这实际上是一个非常非常难以在人工智能系统和机器人中开发的问题,尽管它很简单。原因是,它本身就非常复杂。其次,我们没有大量的数据来做这件事,部分原因是它对人类来说太基本了。对。让我们谈谈数据方面,因为这似乎是
真正的故事,对吧?最大的挑战。在大型语言模型和计算机视觉的背景下,这一点尤其有趣,它们似乎以一种奇怪的方式作为互联网的结果而出现,对吧?仅仅因为我们碰巧拥有互联网上大量单词和图片的数据,我们才能够训练语言模型和计算机视觉模型。但我们对机器人没有这些数据,对吧?没有机器人的训练数据数据集,这似乎是您和整个机器人领域面临的巨大挑战。
是的,所以我们没有一个关于如何控制电机来完成非常基本的事情的开放互联网。也许我们最接近的东西是,我们有做事情的人的视频,也许这可能有用。但与此同时,如果我看罗杰·费德勒打网球的视频,你并不能因此而成为一名优秀的网球运动员。同样,仅仅通过观看人们做事情的视频,也很难真正提取出背后的运动控制。因此,这种数据缺乏,这种数据的稀缺性使得它成为……
在某些方面,这是一个与
语言和计算机视觉不同的问题。我认为我们仍然应该从语言和计算机视觉中学习很多东西,并收集像这样的大型数据集。它在这方面带来了新的挑战,新的可能性。我认为从长远来看,我们应该能够获得大量数据,就像在自动驾驶中一样,我们有很多汽车有效行驶的数据。机器人也可以在世界上收集数据,学习如何拿起芥末酱并将其涂在热狗面包上,
或者学习如何打开橱柜来收纳一些物品。我们可以获得这种数据,但它不是免费提供的。你仍然面临着核心问题,那就是没有你可以用来训练模型的物理现实数据的巨大宝藏,对吧?这似乎是巨大的挑战。你对此怎么办?你如何开始着手解决这个问题?
是的,所以我们首先通过遥控操作来收集数据,人们控制机器人来完成任务。然后你不仅会获得视频数据,还会获得视频以及完成这些任务所需的动作或电机指令。我们在自己的办公室收集了数据。我们还在旧金山的家庭中收集了数据。我们还有一个
适中的仓库。在某些方面,实际上,我们目前的运营规模相当小,因为我们成立还不到一年。实际上发生了什么?如果我去你的仓库,有人正在进行遥控操作,我会看到什么?它看起来像什么?是的,我们……
这有点像控制木偶。操作机器人的那个人,他们在某种程度上拿着的是一套机器人手臂,但它们是非常轻便的机器人手臂。我们用它们来测量关节的位置。这几乎就像一个精心设计的电子游戏控制器或类似的东西。它实际上不是机器人手臂,对吧?它是你用来控制机器人、让机器人移动的东西。是的。
没错,没错。然后我们记录下来,然后直接将这些控制指令转换为机器人。我们有一些只是机器人手臂的机器人,你只需要控制机器人手臂。它安装在桌子上或类似的地方。但我们也有我们称之为移动机械手的机器人,它们有轮子和机器人手臂,你可以控制机器人如何四处移动以及手臂如何移动。我们正在做这样的任务,比如
擦拭柜台、折叠衣物、将餐具放入洗碗机、将电缆插入数据中心机架、组装纸板箱,还有许多其他可能对机器人有用的任务,并记录所有数据。所以我们在机器人上安装了摄像头。机器人电机上的关节上也有传感器。我们以同步的方式记录时间。所以当你这样做的时候,它就像……
有点像现实世界的电子游戏,你移动你的手臂,基本上实时地,机器人手臂正在移动并拿起你想要它拿起的东西。就像,感觉怎么样?有没有什么曲线,比如一开始真的很糟糕?告诉我,带我经历一个例子。
这实际上取决于人。有些人可以很快地学会它。有些人学习速度较慢。我为自己成为一名相当优秀的操控员而感到自豪。所以我完成的任务复杂到用机器人剥一个煮熟的鸡蛋。不。这很复杂。你用手剥煮熟的鸡蛋怎么样?用我自己的手也很难,是的。用机器人就更难了。告诉我关于机器人剥煮熟的鸡蛋的事情,因为这听起来很难。
是的,所以机器人,基本上我们使用的所有机器人都是某种钳形抓手。它们被称为平行爪抓手,只有一个自由度,比如打开、关闭。两个钳子。基本上是两个钳子。是的,两个钳子,两条手臂。是的,没错。我用过同样的设置。手臂上有六个不同的关节,所以它可以移动,具有完整的……
基本上是全方位的3D空间和3D旋转。你可以用它来感觉煮熟的鸡蛋。你没有任何触觉反馈,所以你实际上感觉不到鸡蛋。这实际上是让它更困难的事情之一。但是你实际上可以,你可以使用视觉反馈来……
所以仅仅通过自己观察鸡蛋,我就能知道你是否与某些东西接触。你只使用爪子的一只爪吗?就像我看到你稍微挤压一下来把它弄碎,然后使用爪子的一只爪来剥掉蛋壳。
是的,没错。所以你首先要把它弄碎,然后用一个抓手抓住它,然后使用抓手中的两个手指中的一个来剥掉蛋壳。当我们这样做的时候,我们只煮了两个鸡蛋,第一个鸡蛋……
这实际上是斯坦福大学。第一个蛋白石研究生最终打破了它,所以我做了第二个蛋白石。我能够成功地没有打破它并完全剥掉它。当然,这需要一些耐心,而且我无法像用我自己的手那样快地完成它。但是,我想,这表明我们在控制机器人方面的能力。是的。
做相当复杂的事情。是的。很明显,我的意思是,这是一个特技或游戏或一些有趣的事情,可以用机器人来做。但据推测,在这种情况下,就像折叠衣服和吸尘一样,存在学习,对吧?我们的想法是,你做几次,然后机器人就能做到。然后据推测,也会有泛化。但首先要学习,比如,简而言之,你必须做多少次才能让机器人学会它?
是的,这实际上取决于你希望机器人处理不同条件的程度。所以在我们的一些研究中,我们能够向机器人展示如何做某事30次或50次。这听起来可能有点多,但如果你做的是一项简单的任务,你通常可以在不到一个小时内完成。
由此,机器人可以在特定情况下,如果你只在狭窄的环境中演示过它,比如单一环境、单一特定物体,机器人可以从不到一小时的数据中学习到这一点。机器人在一小时内学习到的东西的例子是什么?
哦,是的。我们把鞋子穿在脚上。我们撕掉一块胶带并把它贴在一个盒子上。我们还把衬衫挂在衣架上。所以这不算多。我的意思是,特别是当你提到机器人时,你真正指的是模型。所以每个机器人,对吧?据推测,或者每个或多或少都像那个机器人一样的机器人,对吧?这就像,你不是在教一个机器人。你是在教每一个机器人,因为它是,它是
根本上是软件。这是一个AM模型。它不是硬件。是的。是的,需要注意的是
如果你想做到这种数据效率,那么如果它像是在同一个,比如同一个颜色的桌子,物体开始时大致相同的初始条件,效果最好。例如,同一件衬衫。所以这只是用一件衬衫,而不是任何衬衫。所以存在同心圆的泛化性,对吧?比如完全相同的衬衫、完全相同的位置、完全相同的桌子,与折叠一件衬衫相比,与折叠衣服相比,对吧?与……
那么这是否只是无限困难?这如何运作?在某种程度上,这是你的巨大挑战,对吧?是的。所以泛化是最大的挑战之一。不是唯一的一个,但它是一个很大的挑战。而且
在某些方面,我的意思是,首先要确保你收集的数据不仅仅是一件衬衫,而是收集很多衬衫或很多服装的数据。理想情况下,还要收集很多不同纹理的桌子的数据,以及视觉上的外观,还有像
如果你在摩擦力非常低的表面上折叠,比如非常光滑的表面,与可能在毯子上的表面相比,当你试图将衬衫移过桌子时,它的行为会有所不同。所以在机器人体验的数据集中,场景的变化很重要。
我们已经看到证据表明,如果你正确地设置事物并在许多场景下收集数据,你实际上可以泛化到全新的场景。例如,在PyO5版本中,我们发现,如果我们在大约100个不同的房间里收集数据,那么机器人就能够在它从未去过的房间里完成一些任务。你提到了……
所以Pi 0.5是你们发布的最新模型,对吧?告诉我关于这个模型的信息。这个模型允许机器人做什么?什么机器人、什么设置和什么任务?
是的,是的,当然。所以我们关注的是泛化。所以之前的模型,我们关注的是能力,我们做了一个非常复杂的任务,即折叠衣物。从那里,我们想回答,好吧,那个模型在一个环境中有效。它相当脆弱。如果你把它放在一个新的环境中,它将无法工作。所以我们想看看,如果我们将机器人放在新的环境中,有新的物体、新的光照条件、新的家具,机器人能否成功?为此,我们在这些机器人上收集了数据
移动机械手,这听起来像是一个糟糕的名字,但它是一种带有两只手臂和轮子的机器人,可以像类人机器人一样四处移动,但我们使用的是轮子而不是腿。在这方面更实用一些。我们训练机器人做一些事情,比如
整理床铺或擦拭表面的污渍,或将餐具放入水槽,或将物品放入抽屉,将衣物、脏衣服从地板上捡起来并放入洗衣篮,诸如此类的事情。然后我们测试了,在像这样在许多环境中收集数据后,与其他数据(包括互联网上的数据)一起汇总,机器人能否在它从未去过的家中做这些事情?是的。
在某些方面,这听起来有点基本,就像人们没有问题……
如果你在一个家里能做某事,你可能就能在另一个家里做同样的事情。对人类来说,这似乎不是一件复杂的事情,但对于在数据上训练的机器人来说,如果它们只在一个地方接受过训练,那么它们的世界就是那个地方。他们从未见过任何其他地方。这实际上是现有方法的一个很大的挑战。是的,这是一个进步。我们能够看到它绝对不完美,这涉及到另一个挑战,即可靠性。但我们能够看到
机器人做它从未去过的家里的事情,我们把它设置好,让它去做事情,它做了一些有用的事情。所以就像在经典的设置中,一个机器人在一个房间里接受训练,它甚至不知道那个房间是一个房间。这就像对机器人来说,整个世界就是那个世界,对吧?如果你把它放在另一个房间里,它就在一个完全陌生的世界里。
没错。所以,例如,我们正在谈论挂衬衫。它的整个世界就像那个,比如一个黑色的桌面,光滑的,一件蓝色的衬衫,一个衣架。它不知道这个关于其他衬衫和其他衣架的整个宇宙。它不知道有一个叫做衬衫的类别。它只知道那件衬衫。是的,它甚至不知道什么是衬衫。是的,它甚至不知道什么是衬衫。对于Pi 0.5,你让机器人做什么,它做得怎么样?
是的,所以我们训练了一个模型。我们实际上使用了一个预训练的语言模型,它还有一个视觉组件。我们在大量数据上对其进行了微调,包括来自旧金山不同家庭的数据,但实际上还有很多其他数据。所以实际上只有2%的数据是在这些带有手臂的移动机器人上。所以我们可以存储我们之前所有数据中所有电机的移动方式,然后训练模型来模仿我们存储的数据。这就像……
预测下一个单词。但它不是预测下一个单词,而是预测下一个动作或类似的东西。是的,没错。我们已经训练它预测下一个动作或下一个电机指令,而不是下一个单词。我们进行了一个额外的训练过程,让它专注于并擅长家庭中的移动机器人数据。然后我们在一个新的家中设置机器人,并向它发出语言指令。所以
我们可以向它发出低级语言指令,或者我们实际上也可以向它发出高级指令。所以最高级别的命令可能是打扫卧室。我们最近也一直在思考更多的问题是,你能否更详细地描述你希望它如何打扫卧室?但我们还没有做到这一点。所以我们可以说打扫卧室。我们也可以告诉它把脏衣服放在洗衣篮里。这将是一种……
一项子任务,我们可以告诉它像拿起衬衫把衬衫放在洗衣篮里,然后在我们告诉它这个命令之后,它就会执行这个命令,实际上在大多数情况下,它会成功地在现实世界中实现这个命令,它做得怎么样
所以这取决于任务。平均成功率约为80%。所以肯定还有改进的空间。在许多情况下,它能够相当成功。我们也看到了一些失败模式,例如,如果你试图将餐具放入水槽,有时其中一个餐具是砧板,而拿起砧板对机器人来说实际上非常棘手,因为你需要将其滑到柜台的边缘然后抓住它,或者以某种方式抓住
某种程度上将手指放在砧板下面。所以有时它能够成功地做到这一点。有时它会挣扎并卡住。然而,令人兴奋的是,它能够,我们能够将它放在从未去过的地方。我正在做一些相当合理的事情。那么你现在在做什么?接下来你想做什么?是的,当然。所以接下来我们关注的是可靠性和速度。所以
我提到这些任务的成功率约为80%。我们如何将其提高到99%?我认为,如果我们能够提高可靠性,这在我看来,在我们能够真正让这些东西在现实世界中发挥作用之前,这是主要缺失的因素。
所以从80%提高到99%很有趣。我的意思是,我想到了自动驾驶汽车,对吧?几年前,我不知道,10年前,15年前,他们似乎快到了。我知道他们现在更接近了。我知道在旧金山,确实有自动驾驶汽车,但它们仍然非常边缘化。这确实看起来像几乎到了在不同的环境中意味着不同的事情,但我不知道。
从80%到99%是否非常困难?自动驾驶汽车的例子是否能为你的工作提供任何启示?自动驾驶汽车的类比非常好。我认为幸运的是我们可能不需要
有些情况下我们可能不需要它像汽车一样可靠。汽车,安全风险要高得多。伤害人们更容易得多。在机器人中,存在安全风险,因为你在物理世界中,但更容易采取软件预防措施,甚至硬件预防措施来防止这种情况。所以这更容易一些。我的意思是,99%可能对汽车来说还不够好,对吧?他们可能需要
比这更多的九,而对于家用清洁机器人来说,它可能就足够了。是的,在某些情况下。我们还在考虑这样的情况,也许甚至低于这个水平也没关系。如果我们将人类和机器人一起工作,更多的是关于……
帮助人们更快或更有效地完成任务。所以我认为可能会有这样的情况,但我们仍然需要机器人的性能和可靠性更高,以便更快地完成任务。我们稍后回来。你可能认为现在加入AARP为时过早,对吧?好吧,让我们花点时间谈谈这个。
你15年后会看到自己是什么样子?更具体地说,你的职业生涯、你的健康、你的社交生活?你现在正在做什么来帮助你实现目标?有很多方法可以让你今天开始为你的未来做准备,与AARP一起。你梦寐以求的梦想工作?注册AARP再培训课程,帮助你实现它。
你只在沙发上谈论过的积极的生活方式呢?AARP有健康提示和健康工具,可以让你在未来几年保持活力。但这些经历都不是没有结交朋友的。通过AARP志愿者活动与您的社区联系。所以可以肯定地说,加入AARP永远不会太早。他们在这里帮助你的金钱、健康和幸福与你的寿命一样长久。
这就是为什么你越年轻,就越需要AARP。了解更多信息,请访问aarp.org/wisefriend。
想想iHeart。
流媒体、广播和播客。让我们在iHeartAdvertising.com向您展示。网址是iHeartAdvertising.com。你想象一下最初的现实世界用例是什么?我不知道。有很多机器人公司的例子试图从一个应用程序开始,并专注于它。我认为从观察这些公司中吸取的教训是
然后你最终会花很多时间在特定应用程序的问题上,而少花时间开发我们认为从长远来看会更有效的这种通才系统。所以我们非常专注于了解核心问题是什么?
瓶颈和开发这些通才模型的核心缺失部分。我们认为,如果我们现在选择了一个应用程序,我们会失去对更大问题的关注,因为我们需要解决特定于该应用程序的问题。所以我们非常关注我们认为是核心问题
技术挑战。我们正在处理某些任务。其中一些是家庭清洁任务。我们也有一些更像工业的任务,只是为了实例化和实际迭代机器人。应用程序的范围可以从家庭到工作场所到工业环境。智能机器人和智能物理机器有很多用例。
你一直在从事哪些工业任务?
我之前提到的一个例子是插入电缆。例如,在数据中心有很多用例,这是一个具有挑战性的任务。另一个例子是建造纸板箱并将物品装入其中。我们还做了一些包装任务,这与许多不同的运输操作高度相关。然后即使是折叠衣服,这似乎也是一项非常家庭化的任务,但事实证明,有些公司
默认情况下,大量的衣服。所以这也是从长远来看可以在更大规模的设置中使用的东西。所以我读到你们已经开源了你们的模型权重,并向硬件公司提供了机器人的设计。我对这个很感兴趣
以及这套决策,对吧,这套战略决策。告诉我关于这个。基本上是放弃知识产权,对吧?是的,是的,当然。这是一个非常困难的问题,特别是开发通才系统的这个长期问题。我们认为这个领域非常年轻且复杂。
有几个原因。一个原因是我们认为该领域需要成熟,我们认为让更多的人能够胜任使用机器人和使用这种技术将从长远来看对公司有利。通过开源,我们使人们更容易做到这一点。然后第二件事是,像,
我们现在开发的模型还处于非常早期的阶段。而一两年甚至三年后,我们将开发的模型的能力将远远超过我们现在拥有的模型。这有点类似于OpenAI开源GPT-2和GPT-3。他们实际上并没有开源GPT-3,但我认为如果他们开源了,今天仍然会处于非常优秀的地位。是的。
什么情况可能会导致贵公司无法成功,甚至会阻碍整个领域的发展?
我认为我们并不完全了解获得真正强大模型所需的数据规模。这里存在一个“先有鸡还是先有蛋”的问题,因为一旦你拥有一个非常好的模型,收集数据就容易得多。这需要大量的数据。是的。或者,如果世界上有数千个机器人运行你的模型,那么每天都会有海量的数据涌入你这里,对吧?是的,是的,完全正确。所以这是一方面。我实际上
可能对此稍微少一些担忧。然后我认为另一件事就是让这些东西真正有效地工作存在技术挑战。我认为在过去一年两个月,也就是过去14个月里,自从我们公司成立以来,我们取得了令人难以置信的进步。老实说,比我预期的要多,与我们创业之初相比。我认为这太疯狂了……
我们能够让机器人完成卸下和折叠衣物的任务,这是一个10分钟的任务。而折叠衣物是一件很有名的事情。
一个难题,对吧?就像机器人领域的人们在谈论人们认为很容易的事情实际上对机器人来说很难时,经常会谈到的那样,对吧?是的,绝对正确。绝对正确。我的意思是,你必须处理各种各样的变化,衣服是如何互相褶皱的。而且,就像你需要做一些非常小的、细微的事情才能让它平放在桌子上,并且折叠得很好,甚至堆放整齐
随着任务时间的延长,出错的机会也更多了,卡住的机会也更多了。因此,如果你正在执行一项需要10分钟的任务,在这10分钟内,机器人有很多次可能会犯无法恢复的错误,或者只是卡住等等。因此,能够完成如此长时间的任务开始表明这些模型通过从这些错误中恢复过来所具有的弹性。
所以当我们第一次尝试折叠衣物时,常见的故障模式之一是它会按照我当时的标准很好地折叠衣物。我会对机器人非常满意,然后它会把整堆衣物推到地上。有点像教幼儿折叠衣服。是的,是的,完全正确。有没有某个特别的时刻……
你看到一个机器人使用你的模型完整地折叠衣服10分钟,并且成功了?
是的。首先,我们从在桌子上平放的衬衫开始折叠。我们很快就能做到这一点。事实证明这很容易。对此我并不太惊讶。然后我们从那样开始,像一个随机的球一样,像某种皱巴巴的状态放在桌子上。然后你必须把它弄平,然后折叠它。由于所有变量以及必须弄清楚如何将其弄平,这使得问题变得极其困难。我们在这个问题上卡住了几个月。
至少几个月,我们尝试的一切,机器人的成功率都是0%。它无法真正取得进展。我认为在去年的8月或9月,我们开始看到生命迹象,当时我们尝试了一种新的方法……
继续在一个遵循一致策略的数据的精选部分上训练模型。这种高质量的后期训练似乎确实使模型工作得更好。然后我最兴奋的时刻是我第一次看到模型连续五次平整、折叠和堆叠物品。是的,我还记得那天晚上回家后非常兴奋。这似乎是我们刚刚找到了这个重要的缺失的拼图碎片。
所以我问你,为什么它可能无法工作,或者什么可能会减缓该领域的发展?然后我们谈到了快乐衬衫的故事。但如果五年后事情进展不如你想象的那么快,那可能发生了什么?我提到我认为融入练习,例如允许机器人练习这项任务,应该对……
允许机器人变得更好非常有帮助。我们不知道这种方法究竟会是什么样子。所以这就像一个研究问题。对于任何类型的研究问题,你都不知道解决方案会有多难。我认为还有一些其他的、更细微的未知因素也与此类似。我们团队有很多非常有才华的研究人员,因为我们认为需要一些这样的未解突破才能真正解决这个问题。
那么,如果它运作良好并且事情取得进展,在这个世界里,你会担心什么?
好问题。我的意思是,如果事情进展顺利,我总体上不应该太担心。我确实认为,低估实际部署和传播技术的挑战通常很容易。这需要时间。当技术还不存在时,这意味着世界还没有准备好接受这项技术。我认为那里有很多未知数。对我来说,关于
例如,语言模型,最了解它们的人似乎最担心它们,这在历史上对技术的看法中通常并非如此,对吧?原子弹可能是例外。所以我很想知道,我的意思是,那些担忧,比如,你是否也分享这些担忧?你对开发机器人基础模型有什么担忧吗?关于恶意行为者使用它,甚至?是的。
我确实认为,是的,有很多技术具有双重用途。我认为有些技术的应用是有害的。我认为语言模型社区中的许多担忧都源于赋予这些系统更大的自主性。我认为我与机器人一起工作了很多。
而且我不认为它们会以任何方式接管世界。对于我们当前版本的机器人来说,这很容易做到,如果我们往上面泼一些水,机器人就不会有麻烦。这对你来说可能是个问题,但我相信你可以解决这个问题。我们正在努力。我们实际上确实有一个新的版本,它实际上更防水,但这并不是我担心的问题。好的,很有趣。
基本上,仅仅因为你认为我们可以,无论如何,如果需要我们可以关闭它?是的。我认为总会有双重用途的担忧,但我认为这项技术的优点超过了一些缺点。那么,告诉我快乐的故事吧。我们应该选择多少年来说一个快乐的故事?十年?十年太快了吗?我不想给它设定一个数字。我认为——好的。
对于研究,你不知道事情需要多长时间。我设想一个世界,在这个世界里,当你开发硬件时,教它做一些事情,教它做一些有用的事情并不太难,而不仅仅是拥有那些不是特别智能的机器,比如洗碗机和洗衣机等等。
如果你愿意,可以更宏大一些。在这个世界里,人们会教机器人做什么?我想,如果我们要更宏大一些,我认为在帮助人们变老、让他们更独立方面存在许多挑战。我认为这是一个巨大的挑战。我认为,我不知道,制造业,有很多地方存在着虐待劳动力的行为,如果……
是机器人而不是人。是的,有很多很多例子。我认为还有一些甚至难以想象的事情,因为这项技术还不存在。所以我考虑的很多事情都是机器人如何在不同的情况下帮助人类,让他们更有生产力。但一旦某些东西存在,就像你经常一样,人们很有创造力,会想出新的使用方法。我们稍后将回到闪电轮。
你可能认为加入美国退休人员协会(AARP)还为时过早,对吧?让我们花点时间谈谈它。你认为自己15年后会是什么样子?更具体地说,你的职业、你的健康、你的社交生活?你现在正在做什么来帮助你实现目标?有很多方法可以让你今天开始为你的未来与AARP一起做准备。
你梦寐以求的理想工作?注册AARP的再培训课程,帮助你实现它。你只在沙发上谈论过的积极的生活方式呢?AARP有健康提示和健康工具,可以让你在未来几年保持活力。但这些经历都不是没有结交朋友的。通过AARP志愿者活动与你的社区联系。所以可以肯定地说,加入AARP永远不会太早。
他们在这里帮助你的金钱、健康和幸福像你一样长久。这就是为什么你越年轻,就越需要AARP。在aarp.org/wisefriend了解更多信息。
想想iHeart。
流媒体、广播和播客。让我们在iHeartAdvertising.com向你展示。那就是iHeartAdvertising.com。很好,让我们以闪电轮结束。与机器人一起工作让你对人体欣赏的一件事是什么?我们的皮肤非常神奇。好吧,我们没有谈论……
我的意思是,触觉或冷热感,对吧?我的意思是,你正在构建的模型,你正在使用的机器人没有这些,但它们可以有,对吧?它们可以有触觉。有人正在研究这个吗?你对此感兴趣吗?
很多人都在研究它。我认为这很有趣。我认为硬件技术与我希望它在稳健性、廉价性和分辨率方面达到的水平相比,还不够成熟。也就是说,我们实际上在机器人的手腕上安装了摄像头,以帮助它获得某种触觉。例如,如果你在用手指接触物体时看着你的手指,
你可以看到它围绕物体变形。实际上,你只需看着你的手指,就可以对触觉反馈有一些概念,这与我们的皮肤获得的触觉反馈类似。是的,而且摄像头很便宜,非常容易使用,非常耐用,比现有的触觉传感技术更耐用、更便宜。我听说你说类人机器人被高估了。我很想知道你为什么这么认为。
我认为在尝试开发技术时,简单性非常有用且重要。当你引入比需要更多的复杂性时,它会大大减慢你的速度。我认为类人机器人引入的复杂性是
是的,我认为如果我们正在使用的所有机器人都是类人机器人,我认为我们不会取得我们所取得的任何进展,因为我们将面临额外的挑战。我还认为,在一个我们需要数据的世界里,优化数据收集的便捷性非常重要。控制类人机器人的所有不同关节和马达比控制更简单的机器人要困难得多。你会拟人化机器人吗?
我讨厌人们拟人化机器人。我认为这是具有误导性的,因为机器人的故障模式与人的故障模式非常不同。它会误导人们认为它会像人一样行事。就像,像什么?
哦,如果你看到一个机器人做一些事情,比如后空翻,甚至折叠衣服,你会认为任何事情……如果你看到一个人这样做,那么他们可能也能做很多其他事情。如果你将机器人拟人化,那么你就会认为你看到的这些能力具有代表性,就好像它是一个人一样,它可以在任何地方后空翻,或者它可以用任何衣物在任何地方折叠衣服。或者你肯定会认为一个可以后空翻的机器人可以……
折叠衬衫,但不能。没错,没错。所以有时给一些事情赋予情感或说机器人今天心情不好很有趣,因为当然有时感觉就是这样。但是当它超越了乐趣和笑话,它可能会产生我认为没有意义的后果。我读到一位研究人员说,如果机器人系鞋带,他们就会退休,然后你的一个机器人系了鞋带。
我想他们没有退休。但是我很好奇,你需要看到机器人做什么才能退休?我不知道。我想我之前举过一个例子,我希望看到机器人做到这一点,我认为这还不算退休级别,但能够进入它从未去过的厨房,然后做一碗麦片。非常基本,但是
尤其与后空翻相比。我自己不会后空翻,但我可以做一碗麦片。但这需要能够在环境中找到物体,能够与像麦片盒这样精细的物体互动。也许甚至可以使用工具来打开麦片盒。倒入液体。
是的。所以这是一个我喜欢的任务。实际上,如果我们集中精力并为此收集数据,我甚至可以看到我们能够轻松地展示它的演示。所以实际上,我认为它比几年前我可能想象的更近了。就在你思考它的同时,它越来越近了。你就像,哦,等等,我们可以做到。
是的,我的意思是,我们实际上已经收集了倒麦片的数据,比如打开麦片盒并将麦片倒入碗中。我们还没有进行液体处理和倾倒,但我认为我们实际上将在本周在机器人上进行。我要求硬件团队制造一个防水机器人,所以我们离目标不远了。很多部件都组合在一起了。我也喜欢和机器人一起工作,而且我还很年轻,我认为还不算太老。所以我并不认为自己很快就会退休。
切尔西·芬恩是斯坦福大学教授,也是Physical Intelligence的联合创始人。你可以发送电子邮件至[email protected]给我们。请务必给我们发邮件。我阅读所有邮件。今天的节目由加布里埃尔·亨特·张制作,亚历山德拉·格里顿编辑,莎拉·布鲁吉尔制作。我是雅各布·戈德斯坦,我们下周将推出另一集《你的问题是什么?》。这是一个iHeart播客。