今天,我们播放的是由我们的朋友 Modern CTO Podcast 制作的一期节目,他们最近很友好地邀请我作为嘉宾参加。我们讨论了生成式 AI 的兴起,在技术方面取得成功的意义,以及领导者在指导技术实施工作时需要考虑的一些因素。您可以在 Apple Podcast、Spotify 或您收听播客的任何地方找到 Modern CTO Podcast。我们可以从火星上使用 AI 中学习什么?
在今天的节目中找出答案。我是来自 Nest JPL 的 Vandie Verma,您正在收听《我和 AI》。欢迎收听《我和 AI》,这是一档关于人工智能和商业的播客。在每一期节目中,我们都会向您介绍一位在人工智能领域进行创新的个人。我是 Sam Ransbotham,波士顿学院分析学教授。我还是麻省理工学院斯隆管理评论的 AI 和商业战略客座编辑。
我是 Sherwin Korubande,BCG 的高级合伙人,也是我们 AI 业务的领导者之一。麻省理工学院 SMR 和 BCG 自 2017 年以来一直在研究和发表关于 AI 的文章,采访了数百名从业人员,并对数千家公司进行了调查,了解构建、部署和扩展 AI 能力以及真正改变组织运营方式需要什么。
大家好,欢迎。今天,Sherva 和我非常兴奋能与 NASA 喷气推进实验室的首席工程师 Vandi Verma 谈谈。这真是太酷了。Vandi,从我们之前的预览来看,我们真的很高兴你能来参加节目。感谢你抽出时间与我们交谈。
感谢你们邀请我。我承认我对你的工作非常着迷。我相信每个人都是,但让我们向大家介绍一下你的工作。你能先大致介绍一下 JPL 以及你具体的角色吗?我是 NASA 喷气推进实验室移动和机器人系统副经理。我还担任火星 2020 任务的首席工程师,该任务包括
毅力号漫游车和机智号直升机。JPL 是一个专门为太空探索建造机器人的 NASA 中心。NASA 的使命是探索、发现和扩展知识,造福人类。而我们所做的就是其中的机器人方面的工作。当你提到机器人时,我想到了人工智能。
但是火星任务似乎对于 AI 等新技术来说是一个非常具有挑战性的场所。你和 JPL 如何在你们使用机器人的工作中使用 AI?是的。AI 在一段时间内改变了我们所谓的技术。我们在地面上做的事情和我们在机器人身上做的事情有所不同。我将谈到其中的一些。总的来说,
我们更倾向于自主能力,更接近你可能认为的自动驾驶汽车所使用的东西。其中很多可能并非经典的机器学习本身,尽管我们使用它来为我们的许多工作提供信息。事实上,对于毅力号来说,我们已经完成的 88% 的驾驶都是自动驾驶。
因此,漫游车配备了摄像头。它正在拍摄图像。它正在检测地形并找出哪些地方存在危险,并绕过障碍物。这实际上非常有趣,因为它正在以前没有人见过的地形上行驶。所以我们甚至不能……
提供那种信息,对吧?这绝对是一种自主导航的形式。我们还在驾驶结束时努力取得很大进展,因为我们身处这种非常恶劣的环境中,并且我们的任务是收集和缓存一定数量的毅力号样本,因为这是我们第一次真正将它们带回地球。
但我们希望它们来自尽可能不同的地点。所以我们想进行大量的驾驶。所以如果你一直停下来,
你将无法取得太大进展。但谁知道沿途是否会有一些真正令人兴奋的东西,而我们却错过了。在我们看来,我们称之为“恐龙骨”。因此,漫游车具有 AI 功能,它将拍摄广角图像,查看大片地形,然后尝试找出其中最有趣的特征
我们有一系列仪器,但其中一种仪器是 SuperCam 仪器,它可以做很多事情。它有一个激光器,你可以从远处用激光照射岩石,它会产生等离子体。
我们用望远镜镜头研究了它。这是一个非常狭窄的视野,你知道,一个米勒弧度。因此,如果你想对整个视野进行这样的操作,你将花费数天时间。因此,基本上,我们将使用 AI 来找出我们应该照射什么最有趣的东西。然后你可以,你知道,发送数据并告诉地球上的科学家。这也很有价值。所以我们这样做。
然后,你知道,还有规划。我们使用了许多资源,这些资源主要来自火星上的航天器。环境恶劣。因此,考虑一下如何加热物体,将其保持在合适的温度,我们有多少电力?你需要与地球通信。地球在哪里?我们还在机载设备上进行规划,它更侧重于全局。所有这些都是我们所做工作的例子。
那里有很多例子。事实上,你主要是在自主驾驶,这似乎是一个令人着迷的世界。你提到了发现一些有趣的东西。那里的目标函数是什么?你如何判断某事是否有趣?我知道我认为什么是有趣的,但告诉我机器如何判断什么是有趣的过程。
我认为关于定义什么是有趣的最有趣的事情之一是它把它放在了人类身上。我们实际上很难告诉机器我们想要它们做什么,对吧?为了让我们能够判断什么是有趣的,
我们有很多不同的参数,科学家可以使用这些参数来指定。我正在寻找特定大小、特定反照率和形状的浅色岩石,这些岩石在这个区域很有趣。我们可以改变这一点。因此,根据我们所处的不同地形,我们有这些不同的模板,地面上的科学家会帮助我们确定。我们将这些发送给机器人,说我们正在寻找这种东西。
我们也进行了一些研究,我们告诉它,你现在跟踪我们已经看到的所有东西。它被称为新颖性检测,我们实际上还没有部署它,但是
找到我们还没有看过的东西。这是另一个,你知道。但这里有两件事。当我们进行探索时,我们既寻找新事物,也尝试用多种不同的仪器来表征我们已经看到的事物,因为我们试图为我们的假设收集统计上显著数量的数据。我们试图弄清楚
火星上可能存在生命,特别是远古生命?因此,这个难题,有一些假设,你试图回答具体的问题。这就是科学家们随后会告诉机器人他们感兴趣的东西。我们实际上已经使用超级计算机将这些转化为参数,然后我们可以将这些参数上传到机器人。所以人们大致描述了他们想要什么,然后你有一些
超级计算机或地球上的某些东西,试图将这些转化为一组参数,然后你发送给漫游车来确定要寻找什么?我理解正确吗?没错。我认为,这是一个 AI 可以提供很大帮助的领域,对吧?因为我们在机器人技术领域,在许多领域仍然处于这样一个阶段,我们有很多旋钮。我们可以做很多事情,但诀窍在于调整事物。
这个多元空间。事实上,你知道,仅仅在毅力号上,我们称之为软件中的参数。这甚至没有考虑到硬件设计和其他方面。我们有超过 64,000 个显式参数。
这些参数保存在非易失性存储器中。这甚至没有考虑到你可以发送的命令的参数。因此,表达你必须说的话的方式有很多种。这就是我们可以使用很多能力的地方
来了解对于我们想要做的事情来说,正确的组合是什么。是的,像这样的东西的组合似乎会爆炸。因此,它似乎是机器学习的一个很好的工具,可以用来找出当你有这么多参数可供选择时,应该选择哪组最佳参数或下一个参数。就像你说的,你不能用激光照射火星的整个表面,你也不能同时探索 64,000 个参数。是的,你完全正确。然而,挑战和
让它成为一个如此有趣的环境的原因在于,误差幅度非常小。所以你不能做实验。当将航天器成功送上火星如此困难时,它是一项国家资产。所以我们说你并不胆怯,但你正在尽一切努力来确保它会成功。你不能让车辆冒险。好的。
大多数听众显然不会探索火星。但是当我们考虑你可以进行的类比时,人们现在正在决定风险投资组合,决定他们将多少东西交给机器来决定新颖性或决定在哪里驾驶。
其他人也在做出类似的风险决策。现在,鉴于资产及其所在位置,你似乎对风险的容忍度极低。但我感觉其他使用人工智能和新技术的人也必须做出类似的风险决策。
我认为你完全正确。事实上,我认为在某些方面,你可能会认为我们有风险承受能力,但我们必须如此频繁地做出这些决定。如果我们真的非常厌恶风险,我们将什么也不做,根本不动。这是
制定一个评估它的流程,并了解在特定情况下该阈值在哪里,是团队中的每个人在做任何工作时都会学习的事情。所以我认为这实际上是可以在其他领域推广的东西。回到你之前谈到的自动驾驶,你真的无法在一个你从未去过的地方练习驾驶。那么,你如何在到达那里之前练习呢?
这有两个方面。一个是,我们如何让自主能力进行练习?然后,我们如何让仍然需要在某种程度上指导自主能力的人进行练习?所以我们两者都做。就为一个如此不同的行星体建造机器人而言,对吧?火星上的重力不同,你知道,压力、温度,所有这些东西。我们创造机器人。
模拟,我帮助编程的一些在毅力号上运行的软件。从一开始,我们就开发软件模拟,因为我们可能实际上并没有完整的地球复制品。我们在地球上创建了一个全尺寸模型进行测试。但这也在任务的早期阶段不断发展。所以我们正在建造硬件,他们也在进行实验。什么是最好的车轮设计?随着我们编写软件,什么是最好的材料?
并且有很多想法是关于如何构建这些模拟,以便它们能够帮助我们。
正确地模拟我们所处的环境。但是,我们也开始剥离某些硬件接口。因此,我们将让真正的飞行软件运行在更商业化的接口机器人部件上,但在火星场地上。我们有一个火星场地。它不是火星,但我们试图让它有斜坡、基岩和其他特征。然后我们构建了运行我们将在火星上使用的实际计算的完整复制品,并使用传感器对其进行测试。
之后,我们进行具体的测试。因此,我们将对某些部件进行热真空室测试。我们分阶段进行。当我们进入大气层时,我们会使用地球上的飞机进行一些测试,因为我们必须看看我们如何在火星上着陆。但除此之外,一旦我们到达火星,我们就会分阶段进行。因此,我们可能会让自主导航告诉我们它会做什么,但实际上并没有进行导航。我们将让人类进行
直接驾驶,就像我们所说的那样,但我们实际上让它破碎并说,让我们看看你会怎么做。所以我们分阶段进行。我们确实希望快速取得进展,因为如果你这样做的时间太长,那就是在火星上浪费宝贵的时间。这就是我们推出基于时间的技术的方式。现在,就人类而言,自从 2008 年以来,我一直为多个不同的任务驾驶火星上的机器人。你开始了解火星,这需要时间。所以我们一直在缩短时间
我们有学员,我们有课堂课程。因此,我们从火星获取驾驶和数据,并让他们离线规划。然后我们有影子。因此,现在大多数驾驶实际上都有其他人在我训练的键盘上,你正在看着他们,就像你训练成为飞行员一样。所以我们这样做。这实际上仍然需要数年时间。我们中的一些人帮助建造了机器人,将在 Sol 0 开始,也就是
我们在火星上着陆任务的开始时间。然后很快,在半年到一年内,我们将开始让下一批人来。因为如果你看看任务,它们可以在火星上停留很长时间。所以你必须有人接受过这方面的训练。实际上,就其他人正在做的事情而言,这其中有很多有趣的方面。你提到了模拟和构建数字孪生。你不想在火星上练习。你想在地球上练习,或者数字地练习,尤其是在数字上。
正如你提到的,我之前没有意识到,即使你可以练习,硬件也不存在,甚至无法练习,这也在同时发生。但还有这个想法,即人类也在这个过程中学习。并且
你不会让任何人第一天就独自驾驶。你也不会让漫游车第一天就自己驾驶。所以这个学习过程也很有趣。我还认为这很有趣,你谈到缩短时间,随着你获得更多经验,你可以缩短时间。由于我们世界上有这么多人在部署人工智能解决方案来做不同的事情,我猜很多人一开始会非常仔细地观察它们
但随后逐渐越来越信任它们。我猜想你与你在键盘上谈到的另一个人一起工作的方式也是如此,可能第一天看着他们打字,但现在在键盘上的时间更少了。所以我认为有很多类比,即使火星似乎是一个陌生的环境,也可以与其他人如何使用人工智能进行类比。
是的,我认为你完全正确。有趣的事情之一是,你可以从地球的完全不同的地方,一个可能具有不同移动特性的完全不同的机器人那里获得什么,但人类能够很好地提取模式。因此,如果你是一个漫游车驾驶员,在一个漫游车任务中,你实际上会花费更少的时间,就像你说的那样。但它的一部分也是我们正在使我们的用户界面变得更加复杂。如果你看
我们用来操作和驾驶机器人、操作机械臂并实际取样的界面,这在某些方面甚至更复杂,
它们也发生了显著的演变。我们过去会发送指令,就像字面上的命令行指令一样,就像你对程序上的函数调用所做的那样。现在我们以图形化的方式进行操作,你基本上是在地图中选择航路点。所以我认为这也很有帮助,因为我们已经开始让人类专注于人类直觉的方面,以及
我们积累并可以带给问题的丰富经验,因为 AI 仍然,即使它变得非常复杂,我们拥有的能力仍然受到技术的限制。
我们当时创造它的想象力。从在火星上操作机器人几十年以来,我们对此非常清楚。我们总是告诉自己,什么东西超出了我们的想象?因为它会发生。每次都会发生。我们总是对这些令人惊奇的事情感到惊讶,我们最终以我们从未打算的方式使用它。这有点像你一直以来在为各种其他地球应用开发的技术中看到的那样。
人们还会想出什么并用它做什么?人们是疯狂的。我们没有创新。对。这正是你想要的,因为你不仅仅是想一遍又一遍地做同样的事情。你提到了“惊喜”这个词,我认为这是一个有趣的事情。我们讨论过的一件事是
你做了所有这些模拟,并且你希望事情能够正常工作,但你并不希望事情完全完美地工作,因为你试图发现一些你没有预料到的东西。所以告诉我们一些关于这个过程是如何运作的,嘿,我们希望事情按照我们想要的方式运作,但我们也愿意接受一些我们没有预料到的事情发生。
你关于模拟不会完全像事情执行那样进行的观点非常好。事实上,它几乎从未如此。部分原因是我们正在自主驾驶
是因为漫游车将从其质量摄像头拍摄的详细表面信息、图像,我们无法对其进行足够精确的模拟。因此,我们在地面上模拟的任何路径,它都在对地形进行采样。你知道,我们有一个抽象,我们有一个轨道地图,但它是在一个非常粗略的水平上进行的。如果我们已经有了那张详细的地图,我们甚至不需要自主导航。我们将直接编写脚本让它驾驶。
一旦它行驶 5 米、10 米,它对环境的信息就比我们发送此命令之前多得多。因此,在那一点上,它比我们所能做到的任何事情都更有能力做出决策并做正确的事情。所以我们必须学会不要过度约束它。这实际上是很难教给新人的事情之一,那就是你已经在你的模拟中完善了它,但你必须预料到
你的模拟实际上是一个模拟。它不是现实。如果你没有给它留下足够的回旋余地,它实际上会惨败。因此,我们有这些我们称之为“保持在盒子内”的东西,对于自主能力来说,我们有点
希望人类说,我有一些见解,我希望你待在这个区域内。它可以是 100 米,对吧?就像一个非常大的区域。所以我们创建了这些皮带,来系住行为,但如何确定皮带的长度是一门艺术。Vandi,这是一次非常有趣的讨论。你也可以分享一下你最终是如何担任这个职位的吗?我记得看
火星探测漫游车着陆。当时我在研究生院。我当时正在攻读机器人学博士学位,因为我已经上过一门课了。这是一门编程课,但我们当时正在编程移动机器人。这太有趣了,我想我花了我所有的空闲时间。就像,在我们课程结束时进行的比赛中,我们必须让这些机器人穿过迷宫。
这对我来说太迷人了,你可以将理论应用于一台实际的机器,并看到它在环境中做一些事情,对吧?就像我一直在使用 AI 一样,实际上,我的硕士学位是 AI。这太迷人了。但是在这里,你实际上可以看到在物理世界中运行的机器人,这是一种非常令人满意的感觉。我喜欢太空探索。太空和机器人的结合是完美的契合。
而这些机器人最终持续了这么长时间,火星探测漫游车机遇号的任务原本应该是 90 天。但我毕业了,它还在火星上。所以我实际上从未想过我实际上会参与其中。而我确实参与了。所以我认为这就是它的由来,我对此很着迷。当我在大学时,我
NASA 与大学之间有很多合作,因为任务的很大一部分是教育。因此,你可以接触到这一点。你可以处理对 NASA 来说很有趣的问题。我的论文与之非常吻合。这就是我如何参与其中的。非常酷。你应该感谢一些工程师让任务持续了这么久,让你能够参与其中。我们有一个环节,我们想问一些快速的问题。在我们这样做的时候,只需回答你首先想到的事情。你认为目前人工智能最大的机会是什么?
我认为最大的机会,我认为实际上是在机器人技术方面。令人震惊的是。是的。好的。人们对人工智能最大的误解是什么?我认为他们最大的误解是它可以推断。那么你想要的第一份职业是什么?
我想驾驶飞机。我爸爸是飞行员。我想成为一名丛林飞行员。好吧,从那以后,你获得了飞行执照。是的,我获得了。你已经实现了,是的。你认为我们是否在努力让 AI 适应它不适合的解决方案?我们在任何地方都将此工具应用于错误的地方吗?
我认为在某个阶段,你可能会这么说神经网络。所以我实际上有点害羞地说,这是错误的地方吗?这取决于你的标准,以确定在当前技术阶段是否值得这样做。我认为这取决于你的阈值和你的视野。好的,这是公平的。
那么,你认为现在人工智能能够做到但目前还无法做到的一件事是什么?你能改变的一件事是什么?你知道,其中一件事是,我们拥有海量数据。在将其应用于一些太空探索中的局限性在于,你仍然需要对标记或它提取的内容进行大量审核。所以我认为仍然有很多
调整。我认为这是挑战所在。如果他能克服这一点,我认为潜力将被释放出来。精彩的讨论。我猜想,当然,我们的听众中没有人驾驶火星上的机器人,但我认为人们可以从你在这个过程中学到的东西中学到很多东西。人们可能不会为模拟火星而构建数字孪生,但他们正在构建数字孪生来模拟地球上的过程。
我们所有人都在越来越多地通过这些设备和 AI 传感来体验世界。即使我们不从事太空领域的工作,我认为我们也可以从你和你的团队学到的东西中学到很多东西。感谢你今天抽出时间与我们交谈。感谢你与你的听众分享我们所做的一些事情。感谢收听。下次 Sam 和我将与 Capital One 的首席科学家兼企业 AI 主管 Prem Natarajan 会面时,请加入我们。
请在新的一年加入我们。感谢收听《我和 AI》。我们相信,就像你一样,关于 AI 实施的对话不会仅限于此播客。这就是为什么我们在 LinkedIn 上专门为像你这样的听众创建了一个小组。它被称为“AI for Leaders”。如果你加入我们,你可以与节目创建者和主持人聊天,提出你自己的问题,分享你的见解,
并获得来自麻省理工学院 SMR 和 BCG 关于 AI 实施的宝贵资源,你可以通过访问 mitsmr.com/AIforLeaders 来访问它。我们将把链接放在节目说明中,我们希望在那里见到你。