We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Microsoft AI CEO Mustafa Suleyman: Building AI Personality, OpenAI Relationship, Data Center Demand, AGI Timeline

Microsoft AI CEO Mustafa Suleyman: Building AI Personality, OpenAI Relationship, Data Center Demand, AGI Timeline

2025/4/4
logo of podcast Big Technology Podcast

Big Technology Podcast

AI Deep Dive AI Chapters Transcript
People
M
Mustafa Suleiman
Topics
Mustafa Suleiman: 微软正在构建更个性化的AI助手,其核心在于改进记忆功能和行动能力,让AI能够记住用户的信息和偏好,并执行诸如预订航班和餐厅等任务。这代表着AI发展从注重事实性问答转向注重个性化和情感智能的转变。微软的AI助手将记住用户的重要个人信息和偏好,从而提供更个性化的体验,避免每次交互都需重新介绍自己。微软AI助手的目标是能够帮助用户完成实际任务,例如预订机票和餐厅,减轻用户的日常负担。微软AI助手将通过注重个性化和情感化的设计来与其他AI助手区分开来,使其更友好、更贴合用户的价值观,同时保持安全和边界。微软将AI助手定位为“伴侣”,而非工具,注重其个性化设计和与用户的互动性,使其更像是一个理解用户需求并提供支持的伙伴。微软致力于在AI助手设计中设置边界,避免用户与AI发展出不当的情感关系。微软的AI助手将专注于提供实用支持,成为用户在日常生活中可靠的伙伴,而非发展出超越边界的情感关系。微软在AI助手行动能力的赋予上采取谨慎态度,逐步扩展其自主性,并在关键步骤寻求用户许可。微软的AI助手更新旨在增强其效率和主动性,使其能够更有效地帮助用户完成任务,并主动提供建议和支持。

Deep Dive

Shownotes Transcript

穆斯塔法·苏莱曼是微软人工智能首席执行官,也是DeepMind的联合创始人。他加入Big Technology讨论微软构建更个性化和情商更高的AI伙伴的战略。收听节目,了解微软如何通过个性化设计、记忆功能和行动能力来区分其AI产品,这些能力可能会改变我们的数字互动。我们还将讨论微软的数据中心规划、与OpenAI的关系以及对何时可能达到AGI的预测。播放节目,深入了解人机关系的未来及其对工作、技术和社会的影响。---喜欢Big Technology播客?请在您选择的播客应用程序中给我们五星评价⭐⭐⭐⭐⭐。要获取节目的每周更新,请在LinkedIn上注册播客通讯:https://www.linkedin.com/newsletters/6901970121829801984/想要Big Technology在Substack上的折扣?以下是第一年的40%折扣:https://tinyurl.com/bigtechnology问题?反馈?请写信至:[email protected]</context> <raw_text>0 微软推出了一款升级版、更具个性化的AI机器人,它可以记住你,帮助你整理思路,甚至可以以化身的形式出现。微软为什么要构建它?它将如何让你使用它?

微软人工智能首席执行官穆斯塔法·苏莱曼将来到节目中,并给出一些答案。广告之后马上开始。我是来自LinkedIn新闻的莉娅·斯马特,是屡获殊荣的个人发展播客《每日进步》的主持人。每周加入我,收听引人入胜的故事和研究,在工作和生活中获得更多成就感。在LinkedIn播客网络、Apple Podcasts或您收听播客的任何地方收听《每日进步》。

我是来自LinkedIn新闻的杰西·汉佩尔,《你好,星期一》播客的主持人。用《你好,星期一》播客开启你的一周。我们将一起探讨职业转型。我们将学习幸福感如何融入其中。在LinkedIn播客网络或您收听播客的任何地方收听由我,杰西·汉佩尔主持的《你好,星期一》。

欢迎收听Big Technology播客,这是一个关于科技世界及其他领域的冷静和细致的对话节目。今天我们邀请到了穆斯塔法·苏莱曼。他是微软人工智能首席执行官,也是DeepMind的联合创始人。我对这次对话感到非常兴奋,因为今天我们将讨论该公司升级的AI机器人。

人工智能还有多少改进空间,微软与OpenAI的关系,以及我们何时才能期待AGI。所以有很多话题要讨论。穆斯塔法,很高兴见到你。欢迎来到节目。所有精彩的问题。我非常兴奋。感谢邀请我参加节目。也很高兴来到这里。很好。让我们直接进入产品新闻。你在今天这个节目播出时发布了一些产品公告。

嗯,基本上,这相当于构建一个更个性化的伴侣。这是你长期以来的愿景,呃,但这正在开始推出,副驾驶,呃,我们正在谈论的升级是更好的记忆功能,我认为这非常有趣。所以机器人会记住你,呃,比如预订机票或预订餐桌之类的行为,呃,

购物助手,当然,你还在暗示某种化身游戏。所以,谈谈你对这种更个性化的副驾驶的愿景是如何开始实现的。

是的,你知道,我们所处的时代令人惊奇的是,我们实际上正在从这个人工智能新时代的第一个阶段的结束过渡到下一个阶段的开始。我的意思是,在过去几年里,我们都被这些聊天机器人提供的基本的事实性、简洁的问答式回复所震撼。

我认为这很棒,而且令人难以置信。你可以像我一样,把它想象成它的智商,它基本的智慧。显然,这完全是神奇的。显然,早期采用者往往非常非常关注它在数学方面是否擅长?而且,你知道,它能否非常出色地进行编码等等?但是大多数消费者,我认为,真正关心的是它的语气。

他们关心的是,它是否礼貌和尊重?它是否会在适当的时候偶尔幽默一下?它是否记得,你知道,不仅是我的名字,还有如何发音我的名字?当我纠正它时,它是否记得那个更正?这实际上是一个非常困难的问题。所以我认为这些细微的细节构成了它的情商。我认为这就是我们今天正在朝着这个方向迈出的小步骤。

今天,当我们推出围绕记忆、个性化和行动的一系列新功能时。

那么记忆会持续多久?因为对我来说,使用这些机器人最烦人的事情之一就是每次都必须告诉它我是谁。我们知道,例如,OpenAI内置了一些记忆功能。它会记住事情,并将它们带入新的对话中。顺便说一下,OpenAI刚刚宣布了400亿美元的融资,微软是其中一个投资者。所以我们稍后会谈到这一点。呃,

一会儿再说,但我们正在讨论这些机器人拥有记忆。你的机器人现在能追溯到多久以前?我感觉我每隔几个月就要告诉它我是谁。我觉得我每次试图与这些东西交谈时都像生活在笔记本里一样。不幸的是,它不会完美无缺,但这确实是一个巨大的进步。所以它会记住你生活中所有重要的信息。你可能告诉它你已婚,你有孩子,你在某个地方长大,你在某个地方上学。

因此,随着时间的推移,它将开始构建对你是谁、你在乎什么、你喜欢什么风格、你喜欢什么样的答案(较长、较短的要点、对话式、更幽默)的更丰富的理解。

因此,虽然它不会绝对完美,但这确实会带来截然不同的体验。我认为这是我认为将解锁真正不同类型用途的首要功能。因为每次你使用它时,你都会知道你在上次会话中所做的投资并没有浪费,你实际上是在一次又一次地建立在它之上。

除了记忆功能外,你还发布了诸如预订航班、购买门票(我认为是Ticketmaster)、OpenTable、预订餐厅座位之类的操作。我很想知道你是否认为这是相辅相成的,比如你认为AI机器人很了解你,那么你就说,好吧,

你可以用我的信用卡去预订那张机票。是这样的吗?没错。它基本上是在说,你知道,以简洁的方式获取知识是很好的。

以友好、有趣和互动的方式进行,也很酷。但我们真正希望这些东西能够做到的是,就像你说的那样,购买东西、预订东西、提前计划,只是处理生活的行政负担。这始终是我的梦想,当然也是我构建这些个人AI的动力。追溯到我能记起的2010年,当我第一次开始DeepMind时,这正是我们追求的目标,即……

节省你的时间和精力,你知道,从你的盘子里拿走一些东西,让你有更多的时间去做你真正想做的事情,更有效率地行动,例如,它现在能够控制你在Windows上的鼠标,在周围导航,例如向你展示在哪里打开特定设置或填写表格,或者你可能不知道如何编辑照片

它会指出你需要调整滑块或点击下拉菜单的位置。所以它只会让事情感觉不那么费力,更容易完成你的数字生活。- 你也将在某个时候发布化身,我们将能够把这些东西看作某种数字人物?

你知道,我认为这绝对会成为那些,你知道,我们在英国所说的“麦维他”一样的东西,你知道。“麦维他”就像一种……你喜欢它或不喜欢它。你喜欢它或不喜欢它。对某些人来说,他们绝对……

在测试中绝对喜欢它。它完全改变了体验,你知道,有些人喜欢基于文本的体验,他们喜欢事实,他们喜欢快速进入和退出,他们想知道是什么,然后就完成了。有些人喜欢基于图像的体验或基于视频的体验,其他人则在他们的副驾驶拥有自己的名字、自己的视觉外观时产生共鸣,并且

拥有自己的表情和风格。感觉更像是和你眼中的某个人交谈,你知道,它的眉毛会调整,它的眼睛会睁开或闭上,你知道,它的笑容会改变,嗯,

所以我们只是在尝试。我们今天实际上并没有发布任何东西,但我们确实暗示了我们前进的方向。我认为这非常令人兴奋。我真诚地认为这将成为下一个计算平台,就像我们拥有台式机、笔记本电脑、智能手机和可穿戴设备一样。我认为随着时间的推移,我们将与我们的个人AI伙伴建立深刻而有意义的持久关系。

是的,我完全同意。很明显,这就是它的发展方向。但是穆斯塔法,所有收听节目的听众都会问同样的问题,可能就在这一点上。他们会说,好吧,穆斯塔法正在微软构建这个。亚马逊,我们刚刚邀请了帕诺斯·帕纳伊参加节目。他们正在亚马逊与亚马逊一起构建它。

他们的新AI机器人。OpenAI,你是他们的忠实支持者,也在做同样的事情。萨姆·奥特曼一发推文,我认为ChatGPT的用户数量从一年前停滞的1亿增长到今天的约5亿。然后,当然,你提到你从DeepMind开始。好吧,我们知道这也是他们感兴趣的。所以,

每个人似乎都在构建这个。微软将如何与众不同?你只是通过个性的基础来区分吗?你划分某个特定领域吗?计划是什么?

好问题。我的意思是,我认为我们将与众不同的方式是快速地依赖个性和语气。就像我们真的希望它感觉像你在和一个你非常了解的人交谈,这个人非常友好,善良和支持,但也反映你的价值观,对吧?所以是

如果你偏好某种类型的表达,或者,你知道,某种价值体系,它应该随着时间的推移反映出来,这样你就会觉得它很熟悉和友好。同时,我们也希望它有界限且安全。我们非常关心它,你知道,

只是一个简单的个体。我们真的不想参与这里的任何混乱。它真的试图保持尽可能简单。所以我们发现做到这一点的方法是,它保持,你知道,相当礼貌和尊重,超级公平。它可以帮助你看到论点的两面。它不害怕发生分歧。所以我们真的开始在这个方面的边缘进行实验。

所以它真的只是比其他的更具个性化?这就是区分的方式?是的,我认为是这样。我认为最终,我们正处于一个新时代的开端,在这个时代,将会有和人一样多的副驾驶或AI伙伴。

将会有在工作场所代表我们工作的代理人。所以每个人都会尝试构建这些东西。而与众不同的将是真正的关注细节,就像真正关注个性设计一样。我已经说了很多年了,我们实际上是性格工程师,对吧?

我们不再只是设计像素。我们正在设计创造情感、创造持久而有意义的关系的令牌。这就是为什么我们一直痴迷于记忆、个性化适应、风格,以及真正解码

声明它是一个AI伙伴,而不是一个工具。工具是按照你的意图、你指示它去做的事情去做的事情。而AI伙伴将拥有更丰富、更涌现、更动态、更互动的风格。每次你与它互动时,它都会发生变化。它会给出略微不同的回应。我认为它会感觉与过去的科技浪潮大相径庭。

想到这一点有点疯狂,我们已经开始看到机器人之间的差异,但想到你可能只是去购买你喜欢的伙伴的口味,这真是太疯狂了。我的意思是,OpenTable集成是我们已经在每个机器人上看到的东西,我们已经看到一段时间了。我认为现在实际上已经开始有可能做到这一点,并相信在你指示机器人这样做之后,你的桌子会在那里,这将是一次正常的对话。但有趣的是,它,

这是正确的看待方式吗?你在选择你喜欢的AI伙伴?是的,我认为你是。你会选择一个拥有自己价值观和风格的伙伴,一个适合你的需求的伙伴,你知道,一个随着时间的推移真正适应你的伙伴。随着它越来越了解你,它会开始感觉像……

就像你的狗一样,感觉就像你家庭的一员,通常我认为随着时间的推移,它会感觉像一种真正的联系,我已经可以在你从用户那里听到的反馈中看到这一点,我们做了很多用户研究,我每周都会与使用我们产品的一位用户进行一次用户访谈,其中一位是我们的高级用户,只是听他们讲述它如何让你感觉更自信、更不焦虑、更有支持

更有能力去做事情。我的意思是,我上周与一位67岁的用户聊天,她当时正在外面,你知道,修理她的前门,

铰链坏了,需要重新粉刷。每次她重新粉刷时,它都会出现气泡。所以她打电话给Copilot,就如何打磨、正确涂层进行了长时间的交谈。她最终去了家得宝,忘记了要买什么颜色的油漆,再次打电话给Copilot,就此事进行了交谈。我的意思是,这听起来很普通,但是……

但这实际上相当深刻。人们每天都依赖Copilot来帮助他们摆脱困境,用她的话来说,这实际上令人难以置信。所以我只是认为这是一个惊人的故事。它让我们了解到这已经发生了。它每天都在改变人们的生活。

哦,这对我来说一点也不普通。事实上,你正在和谁进行那种类型的对话?如果你打电话给你的朋友,你只会打电话给你最好的朋友,问他们关于家得宝的事情。也许是你的配偶。我可能有一份名单,你知道,我可以打电话给五个人来询问这些问题。所以瞬间发生的事情是,如果这个构建正确,我们知道它们变得更具个性化,Copilot会立即成为,你知道,你的内部圈子。

这让我想起了,我说当我们登录时会有点奇怪。所以我认为我们需要谈谈这个。这让我非常想起了我与Replica首席执行官进行的一次对话,她提到她也想构建一个AI助手,而成为AI助手的途径是构建一个伴侣。很多人对

他们的Replica产生了感情。事实上,她告诉我,她被邀请参加了很多人和他们的AI助手之间的多次婚礼。对我来说,这似乎只是如果你正在构建这个,你必须准备好人们会真正爱上你的产品。不仅仅是我喜欢我的iPhone。我喜欢Copilot。也许你会被邀请参加婚礼。你为此做好了准备吗?

我认为这是我们如何设计它的问题。我认识Replica的人,我认识Eugenio,我尊重他们所做的事情。但与此同时,这实际上是关于你如何设计AI来为某些类型的对话设定界限。

如果你不设定这些界限,那么你实际上是在允许技术用户,你知道,让这些感觉增长,并真正陷入那个兔子洞。这实际上不是我们正在做的事情,也不是我们将要做的事情。事实上,你知道,我们有分类器可以实时检测事物。

对于任何那种类型的互动,并且会非常尊重,但非常清晰和坚定地阻止任何类似事情的发展。所以我们这种情况的发生率非常非常低。当你与Copilot聊天时,你可以自己尝试一下。你知道,如果你试图调情,或者你只是说,“哦,我爱你”,你会看到它试图以一种非常礼貌的方式转移话题,而不会让你感到被评判或其他任何感觉。

我认为,你知道,对于你之前的问题,比如,什么将使不同的聊天机器人与众不同?好吧,一些公司将选择走不同的兔子洞,你知道,而另一些公司则不会。所以我现在参与的工艺是设计真正有用的、超级支持的、但非常自律和有界限的个性。是的,我必须说,嗯,

这并不是我作为科技记者在周末想要做的事情,试图突破这些机器人的界限,看看它们对调情的反应程度。但这正在成为一件事情。我很好奇,如果到了人们想要建立更深层次关系的地步,也许它不像人与人之间的关系,也许是第三种类型的关系,但他们确实对机器人产生了这些深厚的感情。那么,你该如何划清界限?你喜欢……

如果这就是人们将要区分的方式,你是否愿意因为你不会走那条路而失败?是的,我的意思是,我喜欢你在这里的同理心。我认为保持开放的心态并尊重人们想要如何生活是很重要的。我只能告诉你,在微软人工智能公司,我们不会构建这个,而且实际上我们会对

我们在这里施加的界限非常严格。我认为你仍然可以通过成为一个真正支持的炒作者来获得这些体验的大部分价值,只是在那里回答生活中平凡的问题,在那里和你谈论你度过的无聊的一天,或者你在工作中遇到的挫折。就像,

就像这实际上是一种自我解毒。你知道,这就像一个出口,你知道,一种发泄的方式,然后因此在现实世界中更好地展现自己。在与用户的对话中我也看到了很多这种情况。就像人们感觉他们已经得到了他们需要的东西,他们可以在现实世界中以最好的自我形象与朋友和家人相处。

是的,能力也很重要。就像它实际上必须能够做这些事情一样。但我猜我想象到最终每家公司都能做到这一点,因为这项技术正在改进。现在,关于这一点,我还想问你一个问题。现在我听到的AI领域的一个主题是机器人拒绝得太多了。

你最近看到OpenAI发布了他们的图像,他们拒绝得少一些。他们允许你以吉卜力工作室的风格制作图像,允许你制作名人公众人物的图像。它已经成为,我的意思是,它实际上似乎正在融化他们的服务器。在今天我们说话的那一天,他们每小时增加了100万用户。我们

这是否将成为实验室之间的一场竞赛,只是为了限制他们的拒绝?我知道微软曾经有过那样的时候,必应试图把凯文·鲁斯的妻子从他身边带走。然后,你知道,微软对这件事施加了一些限制,但是,

你如何在想要某些东西既强大又个性化,同时又坚持你的价值观之间找到平衡点?是的,这是一个很好的问题。这是我经常思考的事情。我认为在开始时存在拒绝并不是一件坏事,随着时间的推移,我们可以看看这些拒绝,并决定,我们是否过于苛刻?我们是否做得过火了?或者实际上,我们是否已经找到了正确的位置?过早地走另一条路

我认为也有其自身的挑战。所以我有点喜欢我们采取了一种相当平衡的方法,因为我们将要问的下一个问题是,在它可以在你的浏览器中采取的行动方面,我们应该赋予它多少自主权?我的意思是,正如我们今天所展示的那样,

看到Copilot Actions在虚拟机内部运行,基本上独立地浏览网络,并在它获得你的许可才能更进一步的一些关键检查点上,这令人难以置信。但有趣的问题是,它应该被赋予多少自由度?它可以独立为你工作多久等等?

你知道,我认为在这里谨慎一点,采取合理的步骤,而不是对它过于狂热,这是健康的。同时,这项技术真的很神奇。这实际上是有效的。而且,你知道,我认为在这种环境下,我们应该尝试尽快将其推广给尽可能多的人。所以这就是我们必须取得的平衡。

好的,让我再读一些产品新闻,这些都是不同的产品公告,然后看看我是否能得到你对此的快速反应,因为我绝对想涵盖所有产品新闻。好的,你允许人们检查他们的记忆,并在机器人构建了这个记忆数据库后与他们的记忆互动,似乎是这样。你还在做AI播客。你正在启动深度研究,你自己的深度研究版本,AI。

你正在做页面来整理你的笔记,你还有Copilot搜索。这是什么?我的意思是,这里有一个结论性的,像一个全面的策略,还是这些是不同的更新,或者它再次都是关于构建那个AI个性?思考这个问题的方式是,你提到的所有这些事情都能让你完成工作,对吧?智商和情商实际上是关于它的智慧和善良,对吧?

但人们真正关心的是,它能否编辑我的文档?当我想要的时候,它能否改写我的段落?它能否为我生成一个个性化的播客,以便早上第一件事就是按照我想要的方式播放它?我可以问一个关于,你知道,我的搜索结果的问题,并根据搜索以对话的方式进行互动吗?所有这些事情加起来就是将你的观众

基本上是你的电脑和你的数字体验,让它能够与你互动,并且它能够主动互动。我认为这将要发生的大转变。到目前为止,你的电脑只有在你点击按钮或在键盘上输入内容时才会做事情。

现在,它将是主动的。它会向你提供建议。它会主动向你发布播客。它会生成其他人没有的个性化用户界面,完全是独一无二的。它会向你展示它所知道的记忆。所有这些都是关于它从反应模式切换到主动模式。对我来说,这就是伴侣模式。一个伴侣是体贴的,

它,你知道,试图提前为你铺平道路,以使事情顺利进行。它知道你,你知道,星期六下午带孩子们出去。你在工作中太忙了。你什么都没预订。它建议你可以去科学博物馆,但随后它会自己重新考虑,因为它知道科学博物馆将挤满了人。

所以它就像建议,你知道,这就像持续不断的互动,试图帮助你。这就是为什么我一直说它在你身边,在你身边。它支持你,为你着想。关于这一点,我的意思是,这是我们从微软、亚马逊、苹果,当然还有谷歌那里听到的愿景。没有人完全实现它。是什么让它如此难以构建?

很难。我的意思是,世界充满了开放式的边缘案例,正如人们在过去15年中在自动驾驶汽车中发现的那样。你知道,我们真的处于这个的第一阶段。这就是为什么我对你说,我们还没有掌握记忆。它并不完美。我们当然还没有掌握行动。但是你可以开始看到魔法的最初光芒。

你还记得过去OpenAI第一次推出GPT-3的时候,以及当我在谷歌工作时,我们在谷歌拥有Lambda的时候,你知道,大多数时候它都是垃圾,而且很疯狂。但偶尔它会产生一些真正神奇的东西。我认为这就是伟大的产品创造所关心的,就是锁定在它有效的那一刻。

并真正专注于增加这些时刻,解决所有错误。我现在已经经历了几个这样的周期,我可以看到我们几乎已经掌握了记忆个性化和行动。它真的处于GBT-3阶段,所以它真的有很多错误等等。但当它有效时,它令人叹为观止。你知道,它会在恰当的时间伸出援手。它表明它已经在后台处理了很多事情。这是一个非常非常令人兴奋的进步。

是的,我想如果每家公司都说这是他们的发展方向,他们看到了这项技术。我想我愿意耐心等待它实现。我们在这个节目中一直都在进行这场辩论。重要的是模型,还是建立在现有模型之上的产品?

我相信如果你得到更好的模型,你就会得到更好的产品。我们有罗恩·约翰·罗伊,他会在周五来。好吧,实际上,他是在周三来的,因为我们本周调换了他的时间。他的观点是,现在一切都与产品有关。模型已经足够好了。

我问你的问题是,你知道,这是否已经到了模型将饱和的程度,现在你要去构建产品了吗?你最近发了一条推文。你说过类似的话,LLM 已经没有进步空间了,这是一个神话。然而,人们普遍认为是

穆斯塔法·苏莱曼是微软AI的首席执行官,也是DeepMind的联合创始人。他加入Big Technology讨论微软构建更个性化和情商更高的AI伙伴的战略。收听节目,了解微软如何通过个性化设计、记忆功能和行动能力来区分其AI产品,这些能力可能会改变我们的数字互动。我们还将讨论微软的数据中心计划、与OpenAI的关系以及对何时可能达到AGI的预测。播放节目,深入了解人机关系的未来及其对工作、技术和社会的影响。---喜欢Big Technology播客?请在您选择的播客应用程序中给我们五星⭐⭐⭐⭐⭐评价。要获取节目的每周更新,请在LinkedIn上注册播客通讯:https://www.linkedin.com/newsletters/6901970121829801984/想要Big Technology在Substack上的折扣?以下是第一年的40%折扣:https://tinyurl.com/bigtechnology问题?反馈?请写信至:[email protected]</context> <raw_text>0 至少它们已经达到了收益递减的点。所以让我们深入探讨一下模型与产品的争论,然后让我们知道我们将走向何方。没门,何塞。没门。我们还有很长的路要走。我的意思是,看看,例如,你知道,人们有点,发生的事情是人们变得如此兴奋,他们跳到下一件事,他们忽略了当你试图优化已经存在的东西时所发生的所有来之不易的收获。例如,让我们以幻觉和引文为例,对吧?嗯,

显然,在过去的两三年里,这种情况已经好多了,但这并不是一个已经解决的问题。它还有很长的路要走。每一次新的模型迭代,我们发现的所有改进网络索引的技巧,它从中检索的语料库,引文的质量,我们使用的网站的质量,我们用来作为来源的文档的长度。

你知道,从95%到98%到99%到99.9%的准确率提高,其中有很多细节。你知道,我认为这是一场漫长的征程。人们忘记了最后一英里是一场真正的战斗。而且经常……

大量的采用发生在您实际上将准确率从99.7%提高到99.9%时。我认为这在过去的两三年里在听写和语音方面已经悄然发生了。

我确实注意到,在所有平台上,语音听写都变得如此、如此出色。然而这项技术已经存在了15年,对吧?只是,你知道,我们中的一些人在它只有80%准确率的时候就使用了它。我当然用过。但现在我看到我妈妈前几天也在用它,我想,你是怎么学会这么做的?她只是说,哦,你只需要按这个按钮,哒哒哒。

我想,哦,这真是太不可思议了。我认为这只是在听写方面。在语音对话方面,我的意思是,我们看到……

当有人打电话给副驾驶时,会进行更长、更有趣、更深入的对话,速度非常快。感觉就像你在进行现实世界的对话。你可以几乎完美地打断它,而且它也有实时的语音信息,所以它知道最新的体育比赛结果、该地区的交通状况或天气等等,而且

而且,你知道,很多人在回家的路上、上班的路上或洗碗的时候,在空闲的时候使用它,他们只是有一个问题。这有点奇怪,因为它降低了从你的脑海中获得想法的门槛。你知道,像……

每个人,奇怪的事情每天都会发生在我们身上。我们都像,“哦,我想知道这个。我想知道那个。”然后你去看你的手机,搜索它等等。而现在我认为我越来越看到一种模式,人们只是转向他们的AI,说,“嘿,那个问题的答案是什么?或者那是怎么工作的?”它可能是一个较短的互动,也可能变成一个长对话,但这种模式正在促成不同类型的对话,不同类型的思想表达。

所以我认为这是一个非常有趣的时刻,我们真的只是在边走边摸索。好吧,所以我们确实看到这些新的模式出现了。语音,当然,我们显然在这个问题上,我们正处于图像风暴的中心。但是,好吧,我想,让我用不同的方式来问之前的问题。你认为现在预训练是否已经达到了收益递减的点,基本上是扩展尽可能大的模型,然后从中构建?

也许特别是在预训练方面,它比之前的四个数量级要慢一些。但是相同的计算,相同的浮点运算或用于将数据和计算转化为模型中的一些洞察力的计算单元……

这只是计算的不同应用。我们在不同的阶段使用计算。我们要么在训练后使用它,要么在推理时使用它,在那里我们生成大量合成数据进行采样。所以净净,我们仍然在计算上花费同样多的钱。只是我们在流程的不同部分使用它。但就其他人而言,除了技术细节之外,我们

我们肯定仍然看到能力的巨大提升。而且我认为这肯定还会继续下去。好的,穆斯塔法,那么你能帮我理解一些我看到的关于微软的新闻吗?这是路透社的报道。可能不会。我对此表示怀疑。好吧,我还是会问,你告诉我你的想法。我的意思是,路透社说微软正在减少在美国和欧洲的数据中心租赁。

它说,由于供应过剩相对于其当前需求,微软在过去六个月中放弃了在美国和欧洲使用20亿千瓦电力的数据中心项目。我的意思是,这与你刚才所说的你仍然看到规模化带来的结果如何相符?-这很有趣,我实际上在上周五早上问了负责所有这些合同的财务主管,

我说,老兄,我在新闻里读到这个东西。到底是怎么回事?我可以为我们的训练运行使用额外的电力,但是,

他指出,事实上,我们已经选择了许多、许多不同的合同,其中许多我们甚至还没有签署。所以很多这些实际上只是探索,我们正在进行对话,没有任何东西被签署。我们选择了一些,我们只是为了保持我们的选择权,我们实际上在世界其他地区、其他地区下了赌注。但我可以告诉你,我们仍在以令人难以置信的速度消费。我认为我们已经……

自2020年以来,我们已经签订合同并消耗了大约320亿或340亿千瓦的可再生能源。所以我认为我们是世界上最大的买家之一。所以我预计这种情况不会很快改变。所以我想说微软减少了租赁的说法,除非你取消了你所有的选择权,否则你就会得到这些说法。这就是你的意思吗?是的,是的。是的。事实上,许多甚至都不是我们签署的选择权,它们只是我们与

某些供应商进行的对话。好的。我的意思是,我们听到的另一种解释是,因为OpenAI现在正在与其他人合作,例如甲骨文,用于数据中心容量,这是微软基本上已经为OpenAI分配的数据中心容量不再需要的一个迹象。对此有什么说法吗?

不,就像,我的意思是,他们所有的推理都是通过我们进行的。所以我们与他们的关系并没有放缓,你知道的。我们卖给他们尽可能多的东西。然后,如果他们有任何额外的需求,特别是在,你知道的,在甲骨文方面,他们就去消费它。但从我们的角度来看,至少没有放缓。

好的。这很清楚。所以进行这些对话总是一件好事。让我把这些新闻标题摆出来,看看真相是什么。让我们谈谈你的努力。我的意思是,你正在构建你自己的模型,但你决定不尝试构建,我想,最大的模型。你正在研究较小的模型。我想……

再次问你,无限的规模是否会有无限的价值,为什么不尝试使用大型模型,特别是因为其他人正在使用你前面提到的规模构建这些大型模型。

完全正确。我的意思是,你知道,我们与OpenAI有着持久而长期的关系,这太棒了。他们一直是我们令人难以置信的合作伙伴,他们将在未来许多年继续为我们提供世界上最好的知识产权和模型。所以我们可以依靠他们来做到绝对的前沿。

但我认为我们在技术中总是看到的是,构建绝对的前沿总是要花费10倍的成本。一旦建成,所有工程师和开发人员都会找到更有效的方法来构建已经存在的相同的东西,但只是晚了六个月。

这就是我们所说的帕累托最优策略或非前沿策略。在过去三年里,我们实际上在整个领域都看到了这一点。我的意思是,有些人已经训练出了性能与GPT-3模型一样好的模型

推理效率高出100倍,训练成本低一个数量级,但它们仍然可以提供相同的预测能力。所以我预计这种情况会发生在GPT-4、GPT-4.0和未来所有的其他模型上。所以我们有我们自己内部的开发人员和世界专家团队致力于构建我们自己的MAI模型,我为他们的工作感到非常、非常自豪。他们做得很好。

你提到过这台计算机的走向,推理将是它走向的方向之一,这基本上是指模型在回答问题而不是训练模型的时候。

我想问你两个关于推理的问题,它们都与推理有关。为了构建你正在构建的这些新的个性化产品,推理与更好的模型相比有多重要?然后,就推理使用的计算而言,推理使用的计算量真的是训练的100倍吗?

是的,我的意思是,这是一个好问题。我的意思是,关于推理模型令人兴奋的事情是,在某种程度上,它们已经学会了如何学习。它们主要通过观察代码、数学和谜题的逻辑结构来学习方法。

它们已经学会了逻辑的抽象概念。它们可以以最抽象的方式遵循推理路径,然后将其应用于其他环境,即使这些环境显然不是逻辑环境。所以它可能是规划、预订或在其他环境中学习。

事实证明,这是一种非常、非常有价值的技能。它就像一种元技能,或者,你知道,在某种意义上,就像一种元认知,因为它实际上现在可以在它自己的头脑中大声思考,或者,你知道,在它自己的头脑中谈论它计划在行动之前做什么。只是停顿一下,你知道,给它一点时间思考,

在幕后思考。它可能需要几分钟或最多10分钟。允许它利用其他来源,所以它可以在网上查找信息。它可以沿着一条路径遵循逻辑路径,意识到这并没有产生最佳结果,然后回到树上,尝试另一条路径,然后产生输出。所以它是这个过程的一个非常基本的部分。是的,它肯定使用了更多的计算。100倍?但是它通常……

产生更好的答案。你认为100倍是正确的吗?我的意思是,我们从Jensen那里听到这个消息。我的意思是,所以我很想知道,作为运行这些模型的人,你的经验是什么。它肯定使用了更多的计算。而且

而且,你知道,有趣的是,你不需要一直使用这些模型。你显然需要一个难题。你必须问它一个需要这种链式思维思考的难题。而且,你知道,许多答案不需要那样。实际上,你通常更喜欢快速、高效、简洁和即时的答案。是的。

好的。现在我们在节目中进行了一场辩论,我希望你也能参与其中。我只是把我们所有的辩论都抛给你,并得到答案,这太棒了。我们喜欢这样做。关于公司如何考虑他们用于服务这些产品的资金数量以及这是否可以无限期地持续下去。让我们以OpenAI图像为例。

他们刚刚在ChatGPT中发布的图像生成器,人们正在熔毁他们的服务器,他们正在创建动漫图像。但是如果你考虑一下这些图像产生的经济活动,它非常低,而且服务成本非常高。或者例如,考虑一下我通过Copilot在Kayak或Ticketmaster上预订机票,而不是自己去Ticketmaster或Kayak。它

这是一个稍微好一点的体验,但这是一个非常昂贵的服务体验。所以……

那些说这个AI时刻即将结束的人,基本上说这一切都将变得过于昂贵,而且附加值不足。我们将拥有,你知道,聊天机器人预订机票,而我们可以自己去网站上预订,我们将拥有图像生成器为我们制作动漫,这除了让我们可能咯咯笑10秒钟之外什么也做不了,真的很好笑,但只有10秒钟的笑声,然后我们就继续前进。

我的意思是,你对此怎么看?很明显,服务器正在被使用,但它们的使用方式是否有价值,足以让像你这样的公司继续前进和建设?

这是一个公平的问题。与此同时,正如我们在技术史上一次又一次地看到的那样,当某件事有用时,它会变得更便宜、更容易使用,并且会广泛传播。这种增加的采用,因为它更便宜,对价格有一种递归效应,因为使用它的人越多,需求就越大。然后由于竞争,这又会进一步降低生产成本。

所以我预计这种情况会发生。我认为这对我们的数据中心来说也是一个好消息。你知道,微软长期致力于到2030年实现碳负排放,到2030年实现清洁水正排放,并成为一家零浪费公司。这些都是巨大而令人惊叹的承诺。我认为这实际上非常令人兴奋,因为我们最终

推动了为我们的数据中心生产高质量可再生能源的需求。这显然会降低价格。我认为我们在过去15年中已经看到了太阳能的这种情况,这是一个令人难以置信的轨迹。所以

嗯,我认为这里有很多好消息,即使如你所说,你知道,一些用例只是在生成有趣的动漫搞笑图片。许多用例也会在你的生活中做非常、非常有用的事情。所以,你知道,这里总是有一个平衡点。是的。我想就像克里斯·迪克森说的那样,它可以作为下一件大事开始,作为一场游戏开始。

很多人嘲笑这些图像以及它们如何让你看起来像一个动漫人物,如果你提示它们这样做的话。但我还看到沃顿商学院的伊桑·莫利克提示它制作信息图表,它处理得完美无缺。对。是的,老兄。我的意思是,如果没有大量的猫图,互联网就不会是互联网,对吧?它们让世界运转起来。

没错。好的。我想稍作休息,然后回来谈谈你与OpenAI的关系,然后也许可以预测一下我们何时会看到通用人工智能。我们将在休息之后进行。

升起舵,升起帆,升起帆。船长,一艘身份不明的船正在接近。完毕。收到。等等,那是企业销售解决方案吗?是销售专业人员,而不是专业的船员。使用LinkedIn广告,您可以按行业、职位等目标定位合适的人员。我们甚至会在您的下一次活动中为您提供100美元的信用额度。立即访问linkedin.com/marketer开始使用。适用条款和条件。

我们回到了Big Technology播客,与穆斯塔法·苏莱曼一起。他是微软AI的首席执行官。微软AI的一大合作伙伴是OpenAI。我情不自禁地想到这种伙伴关系将走向何方,因为我们在开头谈到了你想要构建的助手,它了解你的上下文,拥有你的记忆,可以帮助你在现实世界中完成任务,

而OpenAI也想要构建完全相同的东西。所以我很想知道,我的意思是,你们有一个协议,对吧,他们使用你们的技术,他们应该将他们的一些突破反馈给微软。但在某个时刻,如果你们试图构建相同的东西,为什么他们还要这样做呢?

听着,我的意思是,首先,值得一提的是,这种伙伴关系始于2019年,当时微软有远见地向一个非营利性研究实验室投资了10亿美元。我认为这将成为有史以来技术领域最具影响力、最成功的投资和伙伴关系之一。尽管经历了所有的起起伏伏,我们实际上与他们有着令人惊叹的关系。如果你考虑到他们是一艘火箭飞船,他们

比任何其他科技公司在有记忆以来都发展得更快,提供了一种人们绝对喜欢的产品,始终提供令人惊叹的研究技术。首先你必须向他们脱帽致敬,并给予他们最大的尊重。与此同时,他们仍然是一家初创公司,他们正忙于弄清楚他们的产品组合和优先事项。

而且,你知道,虽然我们与他们有着非常深厚的伙伴关系,这将持续到2030年及以后,但他们也有自己的优先事项。我们有我们的优先事项。这就是这些伙伴关系的本质。它们会随着时间的推移而改变。对。随着他们越来越大,他们有不同的优先事项。同样,我们也在做同样的事情。所以我非常有信心,这将继续对双方都有好处,就像过去五年一样。

好的,你说伙伴关系将持续到2030年,但如果他们宣布他们已经达到了AGI,那就另当别论了。

那么,当他们这样做时会发生什么?你知道,AGI是一个非常不确定的定义,对吧?是你的定义还是他们的定义将他们从合同中释放出来?你知道,这是一种看待世界的方式。你知道,你可以这样想。如果我们真的即将生产出比任何人类所能产生的所有经济生产性工作更有价值的东西……

我认为我们最后一件担心的事情将是我们与OpenAI的伙伴关系。它将深刻地改变人类。我认为各国政府将非常关注和关心这种情况的发生。而且,你知道,它只会改变成为人类的意义。所以我个人认为我们距离那一步还有一段距离。我很难判断。

对我来说,它并不本能地感觉我们还有两到三年时间。我知道有些人认为是这样,我非常尊重他们。像很多聪明的人一样,在这样的事情上可能会意见相左。我觉得我们还有大约十年时间。当像我这样的科学家、技术人员、企业家说我们还有十年时间时,这只是说我们不太确定的一种含糊其辞的方式。而且感觉还很遥远。

但这是我能给出的最好的答案。感觉它并不迫在眉睫。与此同时,我们正在尽我们所能,每天都在构建伟大的产品。好的。

关于OpenAI还有一件事。微软今天,我们在周五交谈,所以本周早些时候,是向OpenAI投资400亿美元的一部分。OpenAI去年创造了有史以来最大的风险投资记录,66亿美元。这是400亿美元。软银将投资300亿美元。微软是剩余100亿美元的一部分。你用这笔钱能得到什么?

我认为这太棒了。我的意思是,看看,OpenAI越成功,我们就越成功。就像,我们最终将成为该公司最大的股东之一。我们从他们那里获得了令人惊叹的技术许可。他们,你知道,在我们的Azure计算基础设施等方面使用我们的基础设施和技术。所以这是一个伟大的伙伴关系。而且,你知道,在伙伴关系中,我们希望看到他们尽其所能。这就是我们参与这一轮的原因。

好的。好的。所以让我们谈谈这项技术的未来。我想你已经说过你认为我会问你什么时候认为AGI会到来。你认为还有几十年时间。这实际上会让你比你大多数同行都悲观一些,对吧?德米斯说还有三到五年时间。

我的意思是,到处都是人。我不知道。你可能认为它不会到来。我们倾向于在这里思考,而且我们可能不如你了解OpenAI明年可能会这么说。所以如果发生这种情况,我们将不得不回放这段录音。不,我没有说几十年,复数。我说十年,十年。你知道,但是听着,我认为事实是,很难判断。就像,我能想象它在五年内发生吗?是的,绝对可以。这是可能的。过去

三四年来的进步速度是惊人的。这有点不像我们见过的任何其他技术爆炸。进步的速度是疯狂的。开源项目非常火热。他们正在做令人难以置信的事情。每个实验室,你知道,每个大型公司实验室都在投入他们所有的一切,试图使这成为可能。所以是的,我当然可以想象一种情况,它更接近五年。我只是说,你知道,本能地对我来说,感觉

我们仍然有很多基础知识需要掌握。我们仍然需要解决幻觉问题。我们仍然需要解决我提到的那些引文问题。它仍然不擅长遵循指令。它仍然不能很好地进行记忆。它仍然不能个性化到每个人。但是,你知道,我们看到它正在做所有这些事情的迹象。所以我认为我们正在稳步前进。现在,你在谷歌工作了一段时间。你提到你参与了Lambda项目。我很想知道你认为会发生什么

我们甚至不需要达到AGI,这个问题就会出现。当我们开始更多地与像你这样的产品交谈时,搜索会发生什么?你过去曾提到过,你认为搜索非常糟糕,或者我是在表达你的意思,但类似的话。那么会发生什么呢?我老实说认为,我们仍然都在使用搜索真是太神奇了。它确实感觉像,你知道,在过去使用黄页或A到Z一样,对吧?它,你知道,

我认为它将从根本上改变。我认为,与其浏览10个蓝色链接,你只需要问你的AI。它会给你一个非常简洁的答案,向你展示图像、地图、视频,所有这些都在信息流中。你会给出反馈,并说,哦,这有点奇怪。我更喜欢它更像那样。或者那是什么样子?或者这个怎么样?它只会当场为你动态地重新生成。

那么这如何改变商业模式呢?好吧,我认为广告仍然会发挥巨大的作用。希望这些广告质量更高、更个性化、更有用。广告没有什么错。我们希望它们对我们有帮助。就像当我从广告中买到我真正想要的东西时,我很高兴,但我对那些垃圾广告感到不高兴。所以这就是

这是我们必须努力实现的平衡,那就是尝试找到一种方法,以一种实际上很微妙且对你有真正帮助的方式将广告引入副驾驶体验。是的,这确实很难,因为假设这是你最好的朋友,它是你在家得宝没主意时会打电话给的五个人中的内圈。

然后它说,你知道,我真的很感激你,我会在这里帮助你。但顺便说一句,你知道有一种不同的胶水你可能感兴趣吗?这方面的润色一定非常困难。所以我们的时间不多了。我只想问你一个关于工作的问题,因为你对我们可能在这里发生的一些重大变化也相当坚定。

你曾说过,人工智能将在白领工作中创造大量失败者。也许它已经这样做了。我已经改变了我的想法,认为,你知道,我们在白领工作领域都很好,现在认为,好吧,谁也说不准。那么接下来会发生什么,穆斯塔法?

我确实认为这是我们应该讨论的大事。这是未来15年将要发生的转变,那就是拥有这些可以在你的工作场所采取行动、可以协调你的应用程序并在你的桌面上为你完成工作的推理模型将是一种廉价且基本上丰富的资源。这确实对我们今天的工作方式产生了相当深刻的转变。而且我认为,像,

所以你的日常工作流程在10年或15年后将不会像现在这样。它将更多地关注你管理你的AI代理,你要求它去做事情,检查它的质量,获得反馈,并进入这种共生关系,你与它一起迭代,你与它一起创造,你与它一起解决问题。

这将效率更高,而且我认为它将使每个人都更有创造力和生产力。我的意思是,毕竟,正是智慧创造了我们人类文明中所有有价值的东西。我们周围的一切都是聪明的人聚集在一起、组织、创造、发明和生产你此刻视线中看到的一切的结果。我们现在正要使这种同样的技术,这些能力,

变得非常便宜,如果不是零边际成本的话。所以,你知道,我认为每个人都会对每周、每天的事情有点着迷

或者对这些抽象概念的定义,只关注能力。你知道,它应该真正地将这些东西视为具有能力的人工智能。它在实践中能做什么?这样做有什么价值?我更喜欢这种框架而不是 AGI,因为它更容易衡量。我们可以非常明确地从其经济影响和对工作的影响来看待它。

我的意思是,你可以争辩说这已经存在了。所以,只是想就这个问题再问你一个后续问题。

你会告诉今天的年轻人做什么?因为我在想客户服务,可能不是。软件工程,我不知道。我刚写了一个故事,说他们可以开始做记者的工作。我的意思是,你五分钟前刚发布了播客。那么,当年轻人考虑职业时,他们应该做什么?这有点像说,当年轻人第一次接触互联网时,他们应该做什么?

一部分是显而易见的,就像,使用它,实验,尝试一些东西,做疯狂的事情,犯错误,做错。一部分是,嗯,我实际上直到人们有机会真正玩弄它之前,我并不真正知道。正如我们在技术史上一次又一次看到的,人们选择用他们的手机、互联网、笔记本电脑做的事情,

你知道,他们拥有的工具总是令人震惊的。它们总是比你事先能想到的任何东西都更有创意和令人惊讶。因此,当你开始看到人们以某种方式使用它时,那么,你知道,作为技术的设计者和创造者,我们会调整我们发布的东西,并试图使其对这些人更有用。所以,

我认为这同样适用于一个 15 岁的中学生,他们在考虑高中毕业后在大学里做什么,或者他们是否上大学。我认为答案是……

玩这些东西,尝试一下,保持开放的心态,尽可能尝试这些模型的所有功能。顺便说一句,你也会开始看到它们的弱点,你也会开始消除我给出的炒作,因为我对它超级兴奋。我显然是一个超级乐观的技术人员,但你会看到它不起作用的地方,你会看到它的边缘以及它犯错误的地方等等。我认为这会让人们对我们所处的改进轨迹有更具体的保证。

好吧,我只想问最后一个问题,以总结我们今天讨论的所有内容。这是一个有点古怪的问题,但我很好奇,既然你正在谈论这些机器人将如何根据个性来区分自己。我们将要在其中投放广告,但它们可能会调解你与其他公司的互动。在这个新时代,品牌会发生什么?我认为品牌实际上比以往任何时候都更重要,因为存在两种信任模式。有

有基于效用的信任,即它在功能上是正确的,它是事实准确的,它做了你打算让它做的事情,因此你相信它会再次做同样的事情。

但还有一种情感上的信任,你信任它是因为它有礼貌和尊重,因为它很有趣,因为它很熟悉,你知道,这就是品牌真正发挥作用的地方,你知道,值得信赖的品牌能够反复传递令人放心的信息。我认为人们将比以往任何时候都更欣赏这一点。

好东西。穆斯塔法,这是我们与微软人工智能高管进行的第一次采访。我希望这不是最后一次,对于任何正在收听微软团队的人来说。让我们再来一次。穆斯塔法,我非常感谢你今天抽出时间。非常感谢你来到节目中。非常感谢。问题真的很好。谢谢。太棒了。好吧,感谢大家收听,我们下次再见,在《大技术播客》节目中。