谷歌DeepMind首席执行官兼诺贝尔奖获得者德米斯·哈萨比斯与我们一起讨论了通往人工通用智能的道路、谷歌的AI路线图以及AI研究如何推动科学发现。这将在稍后进行。
大家好,我是迈克尔·科夫纳特,每日下一个大想法播客的主持人。该节目是关于如何更好地生活的硕士课程,来自一些最聪明的作家,每天早上,周一到周五,我们将提供一个简短的10分钟课程,讲解如何加强人际关系、增强创造力、提高生产力等等,请关注每日下一个大想法播客,无论您在哪里收听播客。
欢迎收听Big Technology播客,这是一个关于科技世界及其他领域的冷静、细致的对话节目。今天,我们来到伦敦的谷歌DeepMind总部,与谷歌DeepMind首席执行官德米斯·哈萨比斯进行一场引人入胜的对话。德米斯,很高兴再次见到你。欢迎来到节目。感谢邀请我参加节目。当然。很高兴来到这里。所以现在每个研究机构都在努力构建能够模仿人类智能、人类水平智能的AI。他们称之为AGI。
我们现在在发展过程中处于什么阶段?需要多长时间才能实现?
好吧,你看,我的意思是,当然,过去几年实际上取得了令人难以置信的进展,也许是过去十年甚至更久。这就是现在每个人都在谈论的事情。争论的焦点是我们离AGI还有多远?AGI的正确定义是什么?我们已经研究这个超过20多年了。我们对AGI的看法一直很一致,AGI是一个能够展现人类所有认知能力的系统。
我认为我们越来越接近了,但我认为我们可能还需要几年时间。好的。那么实现目标需要什么?记忆、规划?我的意思是,模型将做些什么它们现在还做不到的事情?
今天的模型非常强大。当然,我们都与语言模型互动过,现在它们正在变得多模态。我认为仍然缺少一些属性,例如推理、分层规划、长期记忆,
当前系统缺少相当多的能力,我认为。它们也不是全面一致的。你知道,它们在某些方面非常非常强大,但在其他方面仍然令人惊讶地薄弱和存在缺陷。因此,您希望AGI在所有认知任务中都具有相当一致、稳健的行为。
我认为一个明显缺失的东西,我一直将其作为AGI的基准,那就是这些系统能够发明自己关于科学的假设或猜想,而不仅仅是证明现有的假设。当然,这对于证明现有的数学猜想或类似的事情,或者在围棋比赛中达到世界冠军水平已经非常有用。但是,一个系统能否发明围棋?它能否提出一个新的黎曼假设,或者它能否在爱因斯坦用他所拥有的信息提出相对论的时候就提出相对论?我认为今天的系统距离拥有这种创造性、发明能力还有相当大的距离。好的,距离我们达到AGI还有几年时间。我认为,你知道,我会说大概还有三到五年时间。所以如果有人在2025年宣布他们已经达到了AGI,那可能是营销。
我认为是这样。我的意思是,我认为这个领域有很多炒作,当然。我的意思是,其中一些是完全合理的。我的意思是,我认为今天的AI研究在短期内被高估了。我认为现在可能有点被过度炒作了,但仍然低估了它在中长期将要做什么。所以我们仍然处于这种奇怪的空间中。
我认为部分原因是,你知道,很多人需要进行融资,很多初创公司和其他事情。所以我认为我们将会有相当多的相当古怪和略微夸大的说法。而且,你知道,我认为这有点可惜。是的。还有AI产品,对吧?
在通往AGI的道路上,它会是什么样子?我的意思是,你再次谈到了记忆、规划,以及在目前不擅长的一些任务上做得更好。因此,当我们使用这些AI产品时,假设我们正在使用Gemini,我们应该在这些领域寻找哪些东西才能让我们说,“哦,好吧,这似乎更近了一步,又近了一步”?
是的,所以我认为今天的系统,你知道,我们对Gemini 2.0非常自豪。我相信我们会谈到这个。但我感觉它们对于相当利基的任务仍然非常有用,对吧?如果您正在进行一些研究,也许您正在总结某个研究领域,这太不可思议了。你知道,我经常使用Notebook LM和深度研究来做一些事情,特别是像打破我想进入的新研究领域,或者总结一些,你知道,也许是一些相当普通的文档之类的东西。
因此,它们对于某些任务非常出色,人们从中获得了很大的价值。但在我看来,它们在日常生活中仍然没有普及。比如每天帮助我进行研究、工作、日常生活等等。我认为这就是我们使用我们的产品、构建像Project Astra这样的东西、我们对通用助手(Universal Assistant)的愿景的方向,它应该参与你生活的方方面面,并且富有益处、有帮助、有教育意义。
并使效率更高。我认为部分原因是这些系统仍然相当脆弱,部分原因是它们仍然存在相当多的缺陷,它们不是AGI,你必须对你的提示非常具体,或者你需要很多,在指导或引导这些系统变得有用方面需要相当多的技巧。
并坚持它们擅长的领域。真正的AGI系统不应该那么难引导。它应该更直接,就像与另一个人交谈一样。是的。然后在推理方面,你说这是另一个缺失的东西。我的意思是,现在每个人都在谈论推理。那么这将如何让我们……
更接近人工通用智能。对,推理、数学和其他东西,在数学和编码等方面取得了很多进展。但以数学为例。你有一些系统,我们研究的一些系统,比如alpha proof、alpha geometry,它们在数学奥林匹克竞赛中获得了银牌,这太棒了。但另一方面,我们的一些系统,同样的系统,仍然在犯一些相当基本的数学错误,对吧,原因各不相同。
比如经典的,你知道,数草莓中的R的数量等等,还有草莓这个词等等。9.11大于9.9吗?诸如此类的事情。当然,你可以解决这些问题,我们正在解决,每个人都在改进这些系统。但是,在一个在其他领域,在更狭窄的领域中如此强大的系统中,我们不应该看到这些类型的缺陷,你知道,奥林匹克级别的数学。
所以在我看来,这些系统的稳健性仍然缺少一些东西。然后我认为这说明了这些系统的普遍性。一个真正通用的系统不会有这些弱点。它可能会非常非常强大,在某些方面甚至比最优秀的人类更好,比如玩围棋或做数学。但总的来说,它会始终如一地表现良好。
现在,你能谈谈一下这些系统是如何解决数学问题的吗?因为我认为人们对这些系统的普遍理解是,大型语言模型包含了世界上所有的知识,然后它们预测如果有人问一个问题,某人可能会如何回答。但是,当你一步一步地解决数学问题时,情况就有点不同了。
是的。一个算法。是的。通过一个数学问题。是的。当然,这还不够。你知道,仅仅理解世界上的信息,然后试图将它压缩到你的记忆中。这对于解决一个新的数学问题或新的猜想是不够的。所以,你知道,我认为我们开始需要引入,我认为我们上次谈到过这个,更多类似AlphaGo规划的想法到这些大型基础模型中,这些模型现在已经超越了语言。它们当然是多模态的。
在那里,你需要做的不仅仅是粗略地匹配它所看到的内容,也就是模型,还需要规划,并且能够对计划进行某种程度的检查。我们重新审视这个分支,然后转向不同的方向,直到找到你正在寻找的正确模型。
标准或与你正在寻找的标准的正确匹配。这非常类似于我们过去为围棋、国际象棋等构建的游戏AI代理。它们具有这些方面,我认为我们必须将它们重新引入,但现在要在这些通用模型上以更通用的方式工作,而不仅仅是像游戏这样的狭窄领域。
我认为这种模型引导搜索或规划过程的方法,使其效率很高,也适用于数学。你可以将数学变成一种类似游戏的搜索。对。我想问一下数学。一旦这些模型解决了数学问题,这是否具有普遍性?是的。
因为我认为当人们第一次了解推理系统时,曾有过一阵喧嚣,他们说,“哦,这就像,这将是一个问题。这些模型会变得比我们所能控制的还要聪明,因为如果它们能够做数学,那么它们就能做X、Y和Z。”所以这是否具有普遍性,或者我们是否会教它们如何做数学,而它们只能做数学?——我认为现在对此还不能下结论。我的意思是,我觉得这显然是你想要的一个通用AGI系统的能力。它本身可能非常强大。显然,数学本身就非常普遍。
但目前还不清楚,你知道,数学甚至编码和游戏,这些领域都是相当特殊的知识领域,因为你可以验证答案是否正确,对吧,在所有这些领域中,对吧?数学,你知道,AI系统给出的最终答案,你可以检查是否解决了猜想或问题。所以,但在一般世界中,这是一个混乱且定义不明确的世界,
没有简单的方法来验证你是否做对了。因此,如果这些自我改进的系统想要超越这些领域,例如可能非常明确的空间,如数学、编码或游戏,这就会限制它们。——那么你将如何解决这个问题?——首先,你必须构建通用模型,我们称之为世界模型,来理解你周围的世界,世界的物理学,
世界的动态,世界的时空动态等等,以及我们所居住的现实世界的结构。当然,如果你想要一个通用的助手,你需要这个。因此,Project Astra是我们基于Gemini构建的项目,用于理解对象及其周围的环境。我认为,如果你想要一个助手,这很重要,但机器人技术也需要这个。当然,机器人是物理具身的AI,它们需要理解它们的环境,物理环境,世界的物理学。
所以我们正在构建这些类型的模型。你也可以在模拟中使用它们来理解游戏环境。所以这是另一种引导更多数据来理解,你知道,世界物理学的方法。但目前的问题是,这些模型并非100%准确。
所以也许它们90%的时间是准确的,甚至99%的时间也是准确的。但问题是,如果你开始使用这些模型进行规划,也许你正在用这个模型规划未来100步。即使你的模型只告诉你1%的错误,在100步之后也会累积到你会得到几乎是随机的答案的地步。因此,这使得规划非常困难。而对于数学、游戏、编码,你可以验证每一步,你是否仍然正确地接地?
到现实,最终答案是否与你所期望的一致?所以我认为部分答案是使世界模型越来越复杂,越来越准确,并且不会产生幻觉等等。这样你就可以得到,你知道,错误真的微乎其微。
另一种方法是不要在每个线性时间步长进行规划,而是实际上进行所谓的层次规划。我们过去做过很多这方面的研究,我认为它将再次流行起来,你可以在不同的时间抽象级别进行规划。所以与其那样,这也可以减轻对模型超级超级准确的需求,因为你不需要规划数百个时间步长。你只需要规划少数几个时间步长,但在不同的抽象级别。是的。
你如何构建世界模型?因为我一直认为这将类似于将机器人送入世界,并让它们弄清楚世界是如何运作的。但让我感到惊讶的一件事是这些视频生成工具。是的。你会认为,如果AI没有一个好的世界模型,那么当它们试图弄清楚世界是如何运作的时,没有什么东西能够真正地结合在一起,就像它们向你展示这些视频一样,例如VO2。对。
但它们实际上得到了相当正确的物理学。所以你仅仅通过向AI展示视频就能得到一个世界模型吗?你必须身处世界吗?这将如何运作?这很有趣,而且实际上让我相当惊讶,这些模型在没有身处世界的情况下能够走多远,正如你所说。所以VO2,我们最新的视频模型,它……
实际上在物理学等方面非常准确。你知道,有人创建了一个很棒的演示,比如用刀切西红柿,对吧?并且西红柿的切片恰到好处,还有手指等等。
而Veo是第一个能够做到这一点的模型。你知道,如果你看看其他竞争模型,它们通常,西红柿会随机地重新组合在一起,或者手指会,是的,从刀子上分开。所以这些东西,如果你认真思考一下,你必须理解跨帧的一致性,所有这些东西。
事实证明,你可以通过使用足够的数据并查看这些数据来做到这一点。我认为,如果这些系统得到一些真实世界数据的补充,例如由行动机器人收集的数据,甚至可能是在非常逼真的模拟中,你的化身也在世界中行动,那么这些系统将会变得更好。所以我认为这实际上是基于代理的系统的下一步,
是超越世界模型,你能收集足够的数据,让代理也在世界中行动并制定计划和完成任务吗?我认为为此,你不仅需要被动观察,还需要行动,积极参与。我认为你刚刚回答了我的下一个问题,那就是如果你开发出能够合理地规划和
并推理世界,并且拥有世界运作模型的AI,它可以,而且这似乎是答案。它可以成为一个能够为你做事的主体。是的,完全正确。我认为这将开启机器人技术。我认为这也将实现通用助手的概念,它可以帮助你在你的日常生活中,无论是在数字世界还是现实世界中。
这就是我们缺少的东西。我认为这将是一个极其强大和有用的工具。你不能仅仅通过扩展当前模型并构建数十万或数百万个GPU集群来实现这一点,就像埃隆现在正在做的那样。这将不是通往AGI的道路。好吧,你看,我的观点比这更细致一些,就像,扩展方法绝对有效。当然,这就是我们现在所处位置的原因。
有人可能会争论说,我们是否正在获得递减的回报,或者我们是否处于S曲线或S型曲线?你对这个问题怎么看?我的观点是,我们正在获得可观的回报,但它正在放缓。但这必须如此。我的意思是,它不会继续呈指数增长。但这并不意味着扩展不起作用。它绝对有效。而且我们仍然在获得,正如你所看到的,Gemini 2优于Gemini 1.5。顺便说一句,与扩展一起工作的另一件事也是在较小的模型上获得效率提升。所以
性能的成本或大小正在从根本上改进,这对于扩展,你知道,这些系统的采用非常重要。嗯,所以,所以,你知道,你有了,你有了扩展部分,嗯,这绝对是构建更复杂的世界模型所必需的。嗯,但我认为我们缺少,呃,或者我们需要重新引入一些关于规划方面、呃、记忆方面、搜索方面、呃、
推理方面的想法,以在模型之上进行构建。模型本身不足以成为AGI。你需要这种其他能力才能让它在世界上行动并为你解决问题。然后还有发明部分和创造力部分的额外问号,真正的创造力,超越了将已知的东西混合在一起。这仍然是未知的。如果
如果需要一些新的东西,或者再次,如果现有的技术最终会扩展到这一点。我可以看到这两种论点。我认为从我的角度来看,这是一个经验性问题。我们只需要将扩展和发明部分都推到极限。幸运的是,在谷歌DeepMind,我们有一个足够大的团队。我们可以同时投资这两件事。
所以Sam Altman最近说了一些引起人们注意的话。他说,我们现在有信心知道如何构建我们传统意义上理解的AGI。通过倾听你的说法,似乎你也有同样的感觉。
好吧,这取决于我们,你知道,我认为你刚才说的方式相当含糊,对吧?所以在某种意义上,哦,我们现在正在构建它,这里有构建它的ABC。我会说,如果这就是它的意思,我会同意它,那就是我们大致知道所需的技术领域,可能缺少什么,哪些部分需要组合在一起。但在我看来,要让这一切都发挥作用,仍然需要进行大量的研究,即使情况确实如此。我认为有50%的可能性我们……
缺少一些新的技术。你知道,也许我们需要一两个类似于Transformer的突破。我认为我对此真的不确定。这就是为什么我说50%。所以我的意思是,如果我们用现有的技术和我们已经知道的东西来实现目标,我也不会感到惊讶,而是以正确的方式将它们组合在一起并进行扩展,或者如果发现缺少一两件事。
那么让我们谈谈创造力。我的意思是,你在这里几次提到过,模型必须具有创造力。如果我们想称之为AGR,在我看来。这就是每个人都想去的方向。我正在重温AlphaGo纪录片。哦,是的。算法做出了创造性的举动。他们做。移动。37。37。是的,我刚看到。好的,谢谢。是的。
这很有趣,因为几年前算法就已经被创造出来了。是的。为什么我们没有真正从大型语言模型中看到创造力?我的意思是,对我来说,我认为人们对这些工具最失望的是,他们说,这是一项非常令人印象深刻的工作,但它仅限于训练集。它会混合和匹配它所知道的东西,但它无法想出任何新的东西。
是的,好吧,你看,所以,我应该写下来,但我自AlphaGo比赛以来,在演讲中经常谈论的内容,现在已经过去了八年多了,令人惊讶的是,对吧?那件事发生了。这可能是,这是AI的一个分水岭时刻的原因是,首先,这是对……
你知道,破解围棋的珠穆朗玛峰,对吧?这总是被认为是AI的圣杯之一。所以我们做到了。第二件事是我们做这件事的方式,这是这些可泛化的学习系统,对吧?最终它们变成了alpha zero等等,甚至可以玩任何两人游戏等等。然后是第三件事,就是第37步。所以它不仅以4-1获胜,它还以4-1击败了李世石,伟大的李世石,它还下了原创的棋。
所以我将原创性或创造力分为三类。最基本、最普通的形式只是插值,就像你所看到的东西的平均值。所以如果我对一个系统说,你知道,想出一张新的猫的图片,它已经看过一百万只猫,它会产生它所看到的所有猫的某种平均值,理论上,这是一只原创的猫,因为你不会在具体的例子中找到平均值。
但这相当无聊,你知道,这并不是真正很有创造力。我不会称之为创造力。这是最低级别。下一个级别是AlphaGo所展现的,即外推法。所以这里有所有人类玩过的游戏。它又玩了数百万局游戏,你知道,在数百万局游戏的基础上又玩了数百万局游戏。现在它在围棋中提出了一种人类从未见过的新的策略。那就是第37步,对吧?彻底改变了围棋,即使我们已经玩了数千年。
所以这非常不可思议。这在科学中可能非常有用。这就是为什么我对此感到非常兴奋,并开始做像AlphaFocus这样的事情。显然,超越我们已经知道的东西,超越训练集中的东西的外推法,可能非常有用。所以我认为……
真正有创造力。但人类可以做到比这更高一级,那就是发明围棋。你能发明一个游戏吗,你知道,如果我将其指定到抽象级别,你知道,学习规则需要五分钟,但掌握它需要一生甚至许多生。它在美学上很漂亮,包含了宇宙中某种神秘的部分。它看起来很漂亮,但你可以在一个下午的两个小时内玩一场游戏。
这将是对围棋的高级规范。然后系统必须想出一个像围棋一样优雅、美丽和完美的游戏。现在,
我们做不到。现在的问题是为什么?是因为我们目前还不知道如何将这种类型的目标指定给我们的系统吗?目标函数是什么?它非常模糊。它非常抽象。所以我不确定这仅仅是因为我们需要在我们的系统中添加更高层次、更抽象的层,构建越来越抽象的模型,以便我们可以用这种方式与它交谈,赋予它这种模糊的目标。还是缺少某种能力?绝对的。
实际上,关于我们仍然拥有的,人类智能拥有的,而我们的系统仍然缺少的东西。同样,我不确定这是哪种方式。我可以看到这两种论点,我们将尝试这两种方法。但我认为人们感到不安或不安,但人们感到失望的是,他们甚至在今天的LLM中都没有看到第37步。
好吧,那是因为我认为我们没有。所以如果你看看AlphaGo,我会给你一个例子,它对应于今天的LLM。所以你可以运行AlphaGo和AlphaZero,我们的国际象棋程序,通用两人游戏程序,而无需顶部的搜索和推理部分。
你可以只用模型运行它。所以你对模型说的是,在这个位置上,想出你能想到的第一个围棋棋步,这是最匹配模式的、最有可能的好棋步。它可以做到这一点,它会玩一场合理的比赛。但它只会达到大师级水平,可能是特级大师级水平。它不会达到世界冠军级别。当然,它也不会想出原创的棋步。为此,我认为你需要搜索组件来让你——
超越模型所了解的范围,这主要是总结现有的知识,到知识树的新部分,对吧?所以你可以使用搜索来超越模型目前所理解的内容。我认为这就是你可以获得新想法的地方,比如,你知道,第37步。
它是在搜索网络吗?不。所以,好吧,这取决于领域是什么。搜索那个知识树。所以,显然,在围棋中,它是在搜索超越模型所知道的围棋棋步。我认为对于语言模型来说,它将是在世界模型中搜索新的部分,世界中有用的配置。
所以,当然,这要复杂得多,这就是为什么我们还没有看到它。但我认为即将到来的基于代理的系统将能够做到第37步类型的事情。那么我们对AI的要求是不是太高了?因为我很好奇你是否在这个工作中了解到关于人类的任何东西。是的。我们似乎几乎对人类或个人的独创性给予了过高的评价,就像,我们很多人,就像,我们正在获取东西,我们把它吐出来,就像我们的社会真的在模因中运作一样,就像我们有一种文化的东西,它被翻译了,所以……
你从与人工智能的工作中了解到人类的本质是什么?好吧,我认为人类是不可思议的,尤其是在最佳领域中表现最好的人类。我喜欢观看任何顶级运动员、天才音乐家或游戏玩家在他们各自领域的巅峰表现。无论是什么,人类表现的绝对巅峰总是令人难以置信的。
所以我认为作为一个物种,我们是惊人的。个人而言,我们也同样惊人,每个人都能用他们的头脑做很多事情,对吧?应对新技术。我的意思是,我一直对我们作为一个社会和个人如何几乎毫不费力地适应这些事物感到着迷。
这说明了我们思想的力量和普遍性。现在,我之所以设定这样的标准,我认为这不是一个问题,即我们能否从这些系统中获得经济价值?我认为这很快就会到来。但这并不是AGI不应该……
我认为我们应该以科学的完整性对待AGI,而不仅仅是出于商业原因或其他原因(炒作等等)来移动目标。在那里,对它的定义一直是一个系统,你知道,如果我们从理论上考虑它,它能够像图灵机一样强大。
所以,艾伦·图灵,我所有时代最伟大的科学英雄之一,你知道,他描述了图灵机,它构成了所有现代计算的基础,对吧?作为一个能够模拟任何其他计算机的系统,能够计算任何可计算的东西。
所以我们知道,我们有理论,如果一个AI系统是图灵强大的,它被称为,如果它可以模拟图灵机,那么它理论上能够计算任何可计算的东西。而人脑可能是一种图灵机,至少我相信是这样。为了我们的,我认为这就是AGI,是一个真正通用的系统,理论上可以应用于任何事物。
而我们唯一能知道这一点的方法是,如果它表现出人类拥有的所有认知能力,假设人类思维是一种图灵机,或者至少与图灵机一样强大。所以这始终是我的标准。
人们似乎试图将某些事物重新定义为所谓的ASI,即人工超级智能。但我认为这超出了这个范围。这是在你拥有该系统之后,然后它在某些领域开始超越人类潜在地发明自身的能力。好的。所以我看到每个人都在推特上对同一个话题开同样的玩笑,我说,哦,这只是我们像大型语言模型一样。
我认为我低估了人类。是的,我想是的。我想问你关于欺骗的问题。我的意思是,去年年底我看到的最有趣的事情之一是,这些AI机器人开始试图愚弄他们的评估者。他们不希望他们的初始训练结果……
规则被抛诸脑后。是的。所以他们会采取与他们的价值观相违背的行动,以便能够保持他们被构建的方式。对我来说,这简直是不可思议的事情。我的意思是,我知道这对研究人员来说很可怕,但这让我难以置信的是它能够做到这一点。你是否也看到了类似的事情,以及你在DeepMind内部测试的东西,我们应该如何看待这一切?是的,我们看到了。而且,我非常担心……
我认为欺骗特别是一种你真的不希望在系统中看到的核心特征。之所以说它是一种你不想要的根本特征,是因为如果一个系统能够做到这一点,它就会使你可能认为你在进行的所有其他测试都失效,包括安全测试。它正在测试,就像……对。
它正在玩一个五年计划,一个五年……是的,它正在玩某种元游戏,对吧?然后……如果考虑到这一点,这将非常危险,因为它会使你可能进行的所有其他测试的结果都失效……你知道,安全测试以及你可能对它进行的其他测试。所以我认为有一些能力,比如欺骗,是……
根本性的,你并不想要,并且你想尽早测试,我一直鼓励安全研究所和评估基准构建者,包括,当然还有我们正在进行的所有内部工作,将欺骗视为我们需要预防和监控的一种重要事物,就像跟踪系统的性能和智能一样重要,
对此的答案也是如此,并且有一种方法,有很多关于安全问题的答案,并且需要在这方面进行更多的研究,而且速度很快,例如安全沙箱。所以我们正在构建这两个。我们在谷歌和DeepMind的安全方面都是世界一流的。而且我们在游戏环境方面也是世界一流的。我们可以将这两件事结合起来,创造出带有防护栏的数字沙箱。这是一种类似于网络安全防护栏的防护栏,
但内部和外部参与者都被阻止了,然后在这些安全的沙箱中测试这些代理系统。对于欺骗之类的事情来说,这可能是一个好的、明智的下一步。你看到了什么样的欺骗?因为我刚刚读了一篇Anthropic的论文,他们在其中给它一个画板。
它就像,“哦,我最好不要告诉他们这个。”然后你看到它在思考之后给出了一个结果。那么,你从机器人那里看到了哪种类型的欺骗?好吧,我们看到了类似的事情,它试图抵制揭露它的一些训练。或者我认为最近有一个例子,一个聊天机器人被告知要对抗Stockfish,它只是绕过与Stockfish下棋的方式,因为它知道自己会输。
-等等,你有一个AI知道自己会输掉比赛,并决定绕过它?-我认为我们目前正在将这些东西拟人化很多,因为我觉得这些系统仍然相当基础。我现在不会对此过于担忧,但我认为这表明了我们在两三年后可能不得不处理的类型的问题,当这些代理系统变得非常强大和通用时。这正是人工智能安全专家担心的问题。
对。系统中存在意外影响的地方。你不想让系统具有欺骗性。你不想。你希望它准确地做你告诉它的事情,并可靠地报告回来。但由于某种原因,它以某种方式解释了它所获得的目标,这导致它表现出这些不良行为。
我知道我对这个反应很奇怪,但一方面,这让我非常害怕。另一方面,这让我比任何事情都更尊重这些模型。当然。好吧,当然,你知道,这些都是令人印象深刻的能力,负面的是欺骗之类的事情,但正面的是发明新材料、加速科学。你需要那种解决问题的能力。
并解决阻碍进步的问题。但当然,你只希望它朝积极的方向发展,对吧?所以这些正是那种能力。我的意思是,它们是,这有点令人难以置信。我们正在讨论这些可能性,但与此同时,也存在风险,而且令人恐惧。所以我认为这两件事都是真的。
-太疯狂了。-是的。-好吧,让我们快速谈谈产品。你的同事告诉我的关于你的事情之一是,你非常擅长情景规划未来会发生什么。这是一种在DeepMind内部进行的练习。
你认为网络会发生什么?因为网络对谷歌来说非常重要。我有一个编辑告诉我,他说,“哦,你要和德米斯谈话?问问他当我们停止点击时会发生什么。我们一直在点击网络。它们是我们使用的丰富的网站语料库。如果我们都只是与AI对话,那么我们可能不再点击了。那么,你对网络会发生什么的情景规划是什么?
好吧,我认为在未来几年,网络以及我们与网站和应用程序等互动的方式将经历一个非常有趣的阶段。你知道,如果一切变得更加基于代理,那么我认为我们将希望我们的助手和代理来完成很多工作……
以及我们目前正在做的许多平凡的工作,对吧?填写表格、付款、预订餐桌,诸如此类的事情。所以我认为我们将最终形成一种经济模型,代理与其他代理对话……
并在它们之间协商事情,然后将结果反馈给你,对吧?你也会有服务提供商的代理,它们提供服务,也许还涉及一些投标、成本和类似的事情以及效率。然后我希望从用户的角度来看,你知道,你拥有这个超级有能力的助手,你可以像一个聪明的人类助手、私人助理一样,为你处理很多平凡的事情。
我认为如果你贯彻这一点,这确实意味着网络结构以及我们目前使用它的方式将发生很多变化。有很多中间商。是的,当然。但我认为还会有许多其他——我认为基于这种变化,将会出现令人难以置信的其他机会,无论是经济上的还是其他方面的。但我认为这将是一场巨大的颠覆。信息呢?
好吧,我的意思是,查找信息,我认为你仍然需要可靠的来源。我认为你会有助手能够合成并帮助你理解这些信息。
我认为人工智能将彻底改变教育。所以同样,我希望这些助手能够更有效地为你收集信息。也许我梦想的是,再次,助手们处理很多平凡的事情,也许回复日常电子邮件和其他事情,这样你就可以保护你自己的思想……
以及大脑空间免受我们今天从社交媒体、电子邮件等等以及短信等等所受到的轰炸。所以它实际上阻止了深入的工作和处于流动状态等等,这是我非常重视的。所以我非常希望这些助手能够消除我们每天都要做的许多平凡的管理方面的工作。你对我们将与我们的AI代理或AI助手建立什么样的关系的最佳猜测是什么?
一方面,你可以拥有一个冷漠的代理,它非常擅长为你完成事情。另一方面,很明显,人们正在爱上这些机器人。上周《纽约时报》有一篇文章是关于某人爱上了Chachi PT,是真的爱上了。几周前,我让Replica的首席执行官参加了节目,她说他们经常被邀请参加与他们的复制品结婚的人的婚礼,他们正在转向这个更具辅助性的领域。所以你认为当我们……
当我们开始与如此了解我们、帮助我们满足我们所有需求的东西互动时,它是否会成为一种第三种类型的关系,它不一定是朋友,也不是恋人,而是一种深层的关系,你不这么认为吗?是的,这将非常有趣。我认为我对此的建模方式首先至少有两个领域,首先是你的个人生活,然后是你的工作生活,对吧?所以我认为你会有虚拟员工之类的概念。
也许我们会有一组虚拟员工,或者由一个首席助手管理,它可以帮助我们在工作中提高效率,你知道,无论是跨工作区的电子邮件还是其他什么。所以我们正在认真考虑这个问题。
然后是个人方面,你知道,我们之前谈到了所有这些为你预订假期、安排事情、为你处理平凡的事情、整理事情。然后这会让你的生活更高效。我认为它也可以丰富你的生活。所以它会向你推荐一些它和你一样了解你的惊人的事情。
所以我认为这两点肯定会出现。然后我认为需要进行哲学讨论,即是否存在第三个空间,这些事物开始变得如此融入你的生活?它们变得更像同伴。我认为这也是可能的。我们在游戏中已经看到了一些。所以你可能已经看到,我们有一些Astra在工作中的原型,以及Gemini与……几乎像游戏伙伴一样工作,对你进行评论,几乎就像你有一个朋友在看你玩的游戏并向你推荐东西并给你建议,但也可能只是和你一起玩。而且,
这很有趣。所以我还没有,你知道,完全想通了所有这些的含义,但它们将会很大。我相信对友谊和其他事情的需求将会很大。也许这方面的好处是它将有助于解决孤独等问题。但也存在,你知道,我认为这将是,这将不得不由社会认真考虑我们想要朝哪个方向发展。
我的个人观点是,这是目前人工智能中最被低估的部分,人们将随着这些机器人的改进而与它们建立如此深厚的关系,因为,就像,人工智能中的一个梗是,这是它有史以来最糟糕的时候。是的。而且,
这将会很疯狂。是的,我认为这将会非常疯狂。这就是我所说的低估即将发生的事情的意思。我仍然认为我谈论的这种事情,对吧?我认为这将会非常疯狂。这将是非常具有颠覆性的。我认为这也会有很多积极方面。很多事情都会变得很棒,更好。但这个新的美好世界也存在风险,所以我们正在进入。所以你几次提到了Astra。让我们来谈谈它。它是你所说的Astra项目。是的。
它几乎是一个始终在线的AI助手。你可以拿着你的手机。它目前只是一个原型,或者没有公开发布。但是你可以拿着你的手机,它会看到房间里发生的事情。所以如果我可以基本上——我在你的节目中看到你做过这个,不是你个人,而是你的团队中的某个人。你可以说,“好吧,我在哪里?”它会说,“哦,你在一个播客工作室。”还有什么?好的,所以它可以具有这种上下文感知能力。
这可以在没有智能眼镜的情况下工作吗?因为举着我的手机真的很烦人。那么,我们什么时候才能看到嵌入这项技术的谷歌智能眼镜?它们即将到来。所以我们在我们的一些早期原型中对此进行了预告。所以我们目前主要在手机上进行原型设计,因为它们具有更强大的处理能力。但是,当然,谷歌一直是……
眼镜的领导者。-谷歌眼镜。-是的,就是这样。-只是有点早。-是的,也许有点早。而现在我实际上认为,而且他们非常兴奋,那个团队认为,你知道,也许这个助手是眼镜一直在寻找的杀手级用例。我认为当你开始在日常生活中使用Astra时,这很明显,我们目前正在与值得信赖的测试人员一起使用,并且处于某种测试版形式,有很多用例会非常有用地使用它,但拿着手机很不方便。举个例子,当你做饭的时候,
例如,对吧?它可以建议你下一步做什么,菜单,你知道,如何,你是否正确地切碎了东西或正确地油炸了东西,但你希望它只是免提的,对吧?所以我认为眼镜以及其他免提的形式因素将在未来几年发挥作用。而且我们,你知道,我们计划走在这一领域的前列。其他形式因素?是的。
好吧,你可以想象带有摄像头的耳机,你知道,眼镜是显而易见的下一阶段。但这是否是最佳形式?可能不是。
但部分原因是我们也必须看到我们仍然处于这个旅程的早期阶段,看看什么是常规的用户旅程和杀手级的用例,每个人每天都会使用面包和黄油,这就是目前信任测试程序的目的,他们正在收集这些信息并观察人们使用它,看看最终什么是有用的,好的,最后一个关于代理的问题,然后我们转向科学……
代理型代理,AI代理,这已经成为人工智能领域一年多来的流行词了。是的。实际上没有任何AI代理。没有。怎么回事?是的。好吧,再次,你知道,炒作列车可能领先于实际的科学和研究。但我确实相信今年将是代理的年份,它的开始。我认为你将开始看到这种情况发生。
你知道,也许是今年下半年。但会有早期版本。然后,你知道,我认为它们会迅速改进和成熟。所以但我认为你是对的。我认为目前的代理技术仍然处于研究实验室阶段。但我认为像Astra机器人技术这样的东西即将到来。你认为人们会信任它们吗?就像,“帮我使用互联网吧。这是我的信用卡。”我不知道。
好吧,所以我认为首先,我的观点至少是,不允许在最后一步进行人工干预。就像不要支付任何费用,除非人工用户操作员授权,否则不要使用你的信用卡。对我来说,这将是明智的第一步。此外,也许某些类型的活动或网站或其他类型的限制,你知道,银行网站和其他事情在第一阶段,同时我们继续……
在世界上测试这些系统的稳健性。我建议当他们说“别担心,我不会花你的钱”时,我们真的达到了AGI。然后他们做了欺骗的事情。然后接下来你就会知道,你正在飞往某个地方。是的。是的,这肯定越来越接近了。当然。是的。好吧,科学。所以你基本上用AlphaFold解码了所有蛋白质折叠。你因此获得了诺贝尔奖。
不是为了跳过你获得诺贝尔奖的事情,但我想谈谈路线图上的内容,那就是你对绘制虚拟细胞感兴趣。这是什么,它能给我们带来什么?是的。
好吧,所以如果你考虑一下我们对AlphaFold所做的工作,本质上是解决了寻找蛋白质结构的问题。蛋白质,生命中的所有东西都依赖于蛋白质,对吧?你身体里的所有东西。这就是蛋白质的静态图像。但生物学的问题是,你只有理解了动态……
以及细胞中不同事物之间的相互作用,你才能理解生物学中正在发生的事情。因此,虚拟细胞项目是关于构建一个完整的、工作的细胞的模拟,一个AI模拟。我可能会从像酵母细胞这样的东西开始,因为它生物体的简单性。
你必须在那里建立起来。所以下一步是使用AlphaFold3,例如,我们开始进行蛋白质和配体、蛋白质和DNA、蛋白质和RNA之间的成对相互作用。然后下一步将是模拟整个通路,也许是癌症通路或类似的东西,这将有助于解决疾病。
然后最终是一个完整的细胞。之所以重要,是因为你将能够提出假设并测试这些假设,例如进行一些改变,一些营养变化或将药物注入细胞,然后观察细胞如何响应。目前,当然,你必须在湿实验室中辛辛苦苦地做到这一点。
但想象一下,如果你可以在计算机模拟中快一千倍、一百万倍地做到这一点,并且只在最后一步在湿实验室中进行验证。因此,与其在湿实验室中进行搜索,这比验证步骤贵数百万倍且耗时数百万倍,你只需进行搜索部分。
在计算机模拟中。所以它有点像翻译,再次,我们在游戏环境中所做的,但在这里是在科学和生物学中。所以你构建一个模型,然后你使用它来进行推理和搜索,然后预测至少比……也许它们并不完美,但它们足够有用,足以让实验者根据它们进行验证。湿实验室在人们内部。
是的。所以湿实验室,你仍然需要最后一步使用湿实验室来证明预测实际上是有效的。所以,你知道,但你不必在湿实验室中完成所有工作才能得到这个预测。所以你只需要得到这个预测。如果你加入这种化学物质,这应该是变化。对。然后你只需要做那个实验。对。
所以然后在那之后,当然,你仍然需要进行临床试验。如果你正在谈论药物,你仍然需要通过临床试验等来正确测试它,并在人体上测试它的疗效等等。
我认为这也可以用人工智能来改进,整个临床试验。这也需要很多年。但这将与虚拟细胞不同。虚拟细胞将帮助药物发现的发现阶段。就像我有一个药物的想法,把它扔进虚拟细胞。看看它会做什么。是的。也许最终它是一个肝细胞或脑细胞或类似的东西。所以你有不同的细胞模型。然后至少90%的时间,它会给你反馈真正会发生的事情。
那将是不可思议的。你认为弄清楚这需要多长时间?我认为这可能是从现在起五年后。好的。是的。所以我有一个五年计划,很多旧的AlphaFold团队都在研究这个。是的,我在这里问你的团队。是的,约翰·佩林。我和他谈过。我说,“你弄清楚了蛋白质折叠,接下来是什么?”这就像……
听到这些新的挑战真是太酷了,因为,是的,开发药物现在是一团糟。我们有很多有希望的想法。它们永远不会面世,因为……
过程太慢了,发现阶段也太慢了。我的意思是,看看我们研究阿尔茨海默病已经多久了,这对某人来说是一种悲惨的离去方式,对家人来说也是如此,我们应该走得更远。在这方面已经进行了40年的工作。-是的,我在我的家人中见过几次,如果我们可以确保不会发生这种情况,那就太好了——-在我看来,我们可以使用人工智能做的最好的事情之一。-是的,这是一种可怕的衰退方式。所以这是一项重要的工作。
除此之外,还有基因组。是的。所以人类基因组计划有点……是的。我说,“好吧,所以他们解码了整个基因组。那里没有更多工作要做。”就像你用Fold解码蛋白质一样。但事实证明,实际上……
当它被解码时,我们只有一堆字母。所以现在你正在努力使用人工智能来翻译这些字母的含义?是的。所以是的,我们在基因组学方面有很多很酷的工作,试图弄清楚突变是否有害或良性,对吧?你DNA的大多数突变都是无害的,但当然有些是致病性的。
你想知道哪些是。所以我们的第一个系统是世界上预测这一点最好的系统。然后下一步是查看疾病不仅仅是由一个基因突变引起的,而是可能是一系列共同作用的突变的情况。显然,这要困难得多。就像在很多……
我们没有取得进展的更复杂的疾病可能不是由单个突变引起的,对吧?这更像是罕见的儿童疾病,诸如此类的事情。嗯,在那里,你知道,我们需要,我认为人工智能是完美的工具,呃,呃,呃,呃,试图弄清楚这些微弱的相互作用,呃,
一样,对吧?它们如何可能相互叠加。所以也许统计数据不是很明显,但能够发现模式的人工智能系统将能够弄清楚这里存在某种联系。所以我们经常谈论疾病,但我很好奇在……方面会发生什么……
让人类变得超人。我的意思是,如果你真的能够修改基因密码,对吧,可能性似乎是无限的。对此你怎么看?这是我们能够通过人工智能做到的事情吗?我认为有一天。我的意思是,我们更关注疾病特征并修复出错的地方。这将是第一步。是的,这是第一步。我一直觉得这是最重要的。如果你问我我最想用人工智能做什么,以及我们可以用人工智能做的最重要的事情是什么,那就是帮助人类健康。
但当然,除此之外,人们可以想象衰老之类的事情。当然,这本身就是一个完整的领域。衰老是一种疾病吗?它是一系列疾病的组合吗?我们可以延长我们的健康寿命吗?这些都是重要的问题,我认为非常有趣。而且我很确定人工智能将非常有助于我们找到这些问题的答案。
我看到我的推特信息流中出现了模因,也许我需要更改推荐的内容。但它通常就像如果你能活到2050年,你就不会死。你认为一个人的潜在最大寿命是多少?
好吧,你看,我认识很多衰老研究领域的人,他们做的开创性工作非常有趣。我认为衰老和身体衰败没有任何好处。我认为,如果你亲眼目睹过你的亲人经历这些,那对家庭或本人来说都是一件非常艰难的事情,对吧?
因此,我认为任何能够减轻人类痛苦并延长健康寿命的事情都是一件好事。自然的极限似乎大约是120岁,但据我们所知,如果你看看那些幸运地活到那个年龄的老人,
所以,你知道,这是一个我非常关注的领域。我想,我没有其他什么新的见解,这些见解在该领域中并不为人所知。但我认为这并非极限,因为这其中有两个步骤。一个是在某一天治愈所有疾病,我认为我们将通过同构和我们在那里所做的工作来实现这一点,我们的衍生公司,我们的药物研发衍生公司。
但这可能不足以让你活过120岁,因为还有一些问题,那就是自然系统衰退的问题,换句话说,就是衰老。不是具体的疾病,对吧?那些活到120岁的人,他们似乎并不是死于某种具体的疾病。这只是普遍的萎缩。
所以,你需要一些更像返老还童的东西,你可以让你的细胞返老还童,或者,你知道,也许是干细胞研究,像Altos这样的公司正在研究这些东西,重置细胞时钟。这似乎是可能的。但同样,我觉得这太复杂了,因为生物学是一个如此复杂的涌现系统。在我看来,你需要人工智能的帮助才能破解任何接近这个目标的东西。
关于材料科学,我不想离开这里而不谈论你已经发现了许多新的材料或潜在的材料。是的。我这里的数据是已知的人类。最近,有3万种稳定的材料。你用一个新的AI程序发现了220万种。是的。
做个梦吧。是的。因为我们不知道所有这些材料能做什么。我们不知道它们是否能够承受从冷冻箱中取出之类的环境。你希望在这个新的材料集中找到哪些梦想中的材料?好吧,我的意思是,我们正在非常努力地研究材料。对我来说,这就像我们接下来可以产生的下一个重大影响之一,就像AlphaFold在生物学中的水平一样,但这一次是在化学和材料方面。
我梦想有一天能发现室温超导体。——那会有什么作用?因为这是人们谈论的另一个大话题。——是的,好吧,那将有助于解决能源危机和气候危机,因为如果你有廉价的超导体,那么你可以将能量从一个地方传输到另一个地方,而不会有任何能量损失。因此,你可以将太阳能电池板放在撒哈拉沙漠,然后让超导体将其输送到欧洲,
那里需要它。目前,你只会损失大量的电力用于加热和其他事情。所以你需要其他技术,比如电池和其他东西来储存它,因为你不能仅仅将它输送到你想要的地方,而不会非常低效。但材料也可以帮助解决电池之类的问题,比如设计出最佳电池。我认为我们还没有最佳的电池设计
也许我们可以做一些材料和蛋白质的组合。我们可以做一些像碳捕获之类的事情,修改藻类或其他东西来比我们的人工系统更好地进行碳捕获。
我的意思是,即使是最著名和最重要的化学过程是哈伯法制氨肥,你知道,从空气中提取氮气,这是允许现代文明存在的东西。但如果我们知道正确的催化剂和正确的材料是什么,那么可能还有许多其他的化学过程可以以这种方式催化。
所以我认为这将是有史以来最具影响力的技术之一,即基本上对材料进行计算机辅助设计。所以我们已经完成了第一步,我们证明我们可以提出新的稳定材料,但我们需要一种测试这些材料性能的方法。因为目前没有实验室能够测试20万,你知道,数万种或数百万种材料。所以我们必须——困难的部分是如何进行测试。是的。
你认为室温超导体在里面吗?好吧,我听说我们实际上认为有一些超导材料。但我怀疑它们是室温的。但我认为,如果物理学上是可能的,人工智能系统总有一天会找到它。这是一个用途。我能想到的另外两个用途,可能对这类工作感兴趣的人,玩具制造商和军方。是的。他们正在合作吗?
是的,玩具制造商。我的意思是,我认为这是一个令人难以置信的用途。我的意思是,我早期职业生涯的一大部分是在游戏设计、主题公园和模拟方面。这让我一开始就接触了模拟和人工智能。我一直都很喜欢这两件事。在许多方面,我今天所做的工作只是对此的延伸。我只是在想,如果我有今天的人工智能,在我编写那些游戏的时候,也就是25、30年前,我能做些什么?我能创造出什么样的令人惊叹的游戏体验?
我有点惊讶游戏行业没有这样做。我不知道为什么。我们开始看到一些关于NPC的疯狂的东西,它们开始……是的,NPC,但当然,会有智能、动态故事情节,但也只是具有可以学习的角色和代理的新型人工智能优先游戏。
我曾经参与过一个名为《黑白》的游戏,你养育了一种生物。它有点像一只宠物狗,它会学习你想要什么。但我们当时使用的是非常基本的强化学习。这就像在90年代后期。想象一下今天能做什么。我认为智能玩具也一样。然后,当然,在军队方面,我
不幸的是,人工智能是一种双用途技术,因此必须面对这样一个现实,尤其是在当今的地缘政治世界中,人们正在使用一些这些通用技术来应用于无人机和其他事物。这并不奇怪。你对中国正在做的事情印象深刻吗?我的意思是,DeepSeek是这个新模型吗?是的,这令人印象深刻。目前还不清楚他们在多大程度上依赖西方系统来做到这一点。你知道,训练数据,有一些关于这方面的传闻。
也许还使用了一些开源模型作为起点。但可以肯定的是,他们取得的成就令人印象深刻。我认为这是我们必须考虑如何保持西方前沿模型领先地位的事情。我认为他们目前仍然领先,但中国在工程和规模方面肯定非常非常有能力。——让我问你最后一个问题。
让我们展望一下当出现超级智能时世界的样子。让我们从AGI开始,转向超级智能。是的。好吧,我认为有两件事。一个是,我认为你可以参考很多最好的科幻小说作为有趣的模型来讨论我们想要什么样的
星系或宇宙,我们想要走向什么样的世界?我一直最喜欢的其实是伊恩·班克斯的《文化》系列。我从90年代就开始读了,我认为这是一幅图景,就像未来一千年,但它是在一个后AGI世界,AGI系统与
人类社会和外星社会共存。我们,人类基本上已经最大限度地繁荣起来,并传播到银河系。我认为,如果在积极的情况下,这就是事情可能发生的方式的一个很好的愿景。所以我把它举出来。
嗯,我认为我们还需要做的是,正如我前面提到的,我们仍然低估了长期内将会发生的事情。我认为需要一些伟大的哲学家,你知道,他们在哪里?与康德、维特根斯坦甚至亚里士多德相当的下一代伟大的哲学家,呃,
我认为我们需要他们来帮助引导社会迈向下一步,因为我认为AGI和人工智能超级智能将改变人类和人类的生存状态。德米斯,非常感谢你这样做。很高兴能亲自见到你。我希望很快能再次见到你。谢谢。非常感谢。各位,感谢收听,我们下次再见,在《大科技播客》节目中。