今天,我们播放的是由我们的朋友 Modern CTO Podcast 制作的一期节目,他们最近很友好地邀请我作为嘉宾参加。我们讨论了生成式 AI 的兴起,在技术方面取得成功的意义,以及领导者在指导技术实施工作时需要考虑的一些因素。您可以在 Apple Podcast、Spotify 或您收听播客的任何地方找到 Modern CTO Podcast。
地平线上有哪些令人兴奋的全新 AI 工具?在今天的节目中找出答案。我是微软的 Eric Boyd,您正在收听《我和 AI》。欢迎收听《我和 AI》,这是一档关于人工智能和商业的播客。在每一期节目中,我们都会向您介绍一位在 AI 领域进行创新的个人。我是 Sam Ransbotham,波士顿学院分析学教授。我还是麻省理工学院斯隆管理评论的 AI 和商业战略客座编辑。
我是 Sherven Kodubande,BCG 的高级合伙人,也是我们 AI 业务的领导者之一。麻省理工学院 SMR 和 BCG 自 2017 年以来一直在研究和发表关于 AI 的文章,采访了数百名从业者,并对数千家公司进行了调查,了解构建、部署和扩展 AI 能力以及真正改变组织运营方式需要什么。
今天,Shervin 和我很高兴能邀请到微软 AI 平台公司副总裁 Eric Boyd。Eric,感谢您抽出时间与我们交谈。欢迎。很高兴能与你们两位在一起。让我们从 AI 平台公司副总裁开始吧。您能告诉我们这个职位需要做什么,以及它的范围是什么吗?您都做些什么呢?是的,当然。AI 现在显然是一个很热门的词。我在微软领导 AI 平台团队,
而且,你知道,AI 平台团队真正关注的是几件事情。我们做的一件事是,为那些试图构建和训练自己的 AI 模型以提高生产力的人们提供工具。这就是 Azure 机器学习,这是一套我们对外提供的工具。但我们也在内部使用这些相同的工具。因此,像 Bing、Office、Azure 等微软各团队都在使用这些工具来构建我们在微软所做的一切中使用的所有模型。
我们做的另一件事是我们自己构建一些模型。我们称之为认知服务。因此,如果您想要语音、视觉和语言方面的最新和最强大的模型,我们有一个认知服务模型可以做到这一点,您可以直接将其作为 Web 服务调用。因此,通过这样做,我们真的……
与我们在微软研究院拥有的研究部门合作,推动我们拥有的最先进的研究,真正推动 AI 的发展,然后将其提供给微软内部的服务以及通过 Azure 提供给我们的客户。我的工作是构建所有这些产品,并弄清楚我们如何在快速发展的 AI 领域最好地满足所有客户的需求。我真正喜欢的是这个想法,
如果每个使用这些工具的人都必须从头开始发明它们,显然这将需要永远的时间。而且大多数企业的目标不是语音合成或语音生成。没错。因此,我的意思是,这似乎正是构建这些小型组件并交付它们的正确方法。您如何知道要构建什么?您如何告诉人们如何使用它们?这是如何运作的?这个基础设施和生态系统是如何开始发挥作用的?是的。
是的,我的意思是,我们在微软非常荣幸地拥有许多我们已经经营了一段时间的不同业务。因此,我们能够随着时间的推移与他们所有人一起工作和学习。因此,基本上,我们在 AI 领域所做的一切都是源于我们在微软内部需要的某些东西。
当我们试图考虑客户需要什么时,我们已经证明了这些服务的有效性。如果这是一个关于如何训练模型的工具,那么我们在 Bing 和 Office 中拥有数千名开发人员和研究人员,他们正在训练模型来完成您作为微软用户每天都会体验的事情。当我们考虑语音识别时,我们会与 Microsoft Teams 合作,因此我们可以使用我们已经构建的语音识别软件来转录每次通话。然后……
我们将这些完全相同的东西提供给我们的客户,因为我们知道,在我们发现它们有价值的地方,我们的客户也将会发现它们有价值。这已经成为我们主要的创新引擎之一。
随着该领域的不断发展,Azure 显然拥有数千数万家遍布全球、遍布各个行业的企业客户。因此,我们会去拜访他们,与他们交谈。这也为我们提供了许多关于公司在哪些方面遇到困难的见解。
但是,你知道,与你描述的类似,许多公司都认为,语音识别并不是核心业务,但我需要在我的产品中使用它。因此,我可以浪费大量的时间和精力来训练语音识别模型,这非常难以做到,也很难有效地做到。但是,如果我只需要使用你已经为我们构建的最先进的东西,这对我的业务来说会更好。因此,这最终成为许多客户最终经历的思考过程。是的,我喜欢这一点,因为,我的意思是,我在课堂上使用的比喻是,
没有人说,“嘿,你知道,我有一家很棒的书店,但我们真的应该购买我的书,因为我们有一个很棒的工资系统。”我们很快发现,这是单一公司能够做好的一件事。我们有
我们不妨让这些单一公司做得很好,因为你的竞争优势并非来自拥有一个很棒的工资部门。我们也看到了这一点。我们与许多创业公司合作,创业公司必须专注于他们的竞争优势是什么。任何不是竞争优势的东西,他们都必须去别的地方寻找。创业公司来到我们这里,知道,“嘿,我们拥有他们可以使用并使他们的产品变得很棒的最新技术”,同时专注于真正对他们的业务至关重要的事情。
而这其中的另一部分是,当人们使用这些服务时,你将不断改进这些服务。你不仅要构建它一次。你必须。这些东西变化如此之快。然后投资足够的资金来跟上步伐的想法令人望而生畏。是的,如此之快。这个领域发展速度之快真是令人难以置信。
我们通过语音 API 提供的语音质量实际上每个月都在提高。我们进行了测量,并且有数据可以支持这一点。我们的视觉模型最近在质量上有了爆炸式增长,我们看到了很多疯狂的事情。然后,我们甚至不要开始讨论语言,对吧?大型语言模型现在非常强大。因此,那里正在发生巨大的爆炸。
是的,你提到语言我很高兴。我明天在课堂上实际上只是在谈论 OpenAI 产品。那里的发展只是,首先,我很生气,因为我每个学期都必须重新制作我的幻灯片等等。但是我每次教书时看到的进步都令人震惊。我甚至不能用我的,“哦,是的,哈哈,这就是 AI 失败的地方”。找到这些地方越来越难了。它们仍然存在,但找到它们越来越难了。
前沿正在快速发展。当你看到指数级增长时,你面前的墙实际上是垂直的。所以
我们似乎开始看到这种进步。你提到了 OpenAI,显然我们与他们做了很多工作,为他们提供所有基础设施,并将他们的产品推向市场。每个人都在热议 ChatGPT 以及它似乎取得的所有惊人进步。我真的很高兴人们现在开始看到它,因为我们已经研究这类事情一段时间了,开始看到我们将能够因此而实现的所有应用。它非常强大,非常令人兴奋。
它将改变一切。它将改变我们与计算机交互的所有方式。所以看到这一点真的很令人兴奋。Eric,听起来你的角色很大一部分都集中在 Azure 产品上。但让我们也回到你提到的另一大方面,即微软为最终用户开发的所有其他产品。将技术进步融入人们每天都在使用的这些产品中的过程是什么?我们考虑了几件事。首先是,
大规模地建立和运行这些模型很困难。每个公司都在努力解决这个问题,好吧,我刚刚取得了一些新的突破,我该如何真正大规模地部署它?这就是我们制作真正简化这一过程的工具的地方。Azure 机器学习是我们部署微软所有模型的方式,用于 Office 或 Teams 等任何东西。
你正在调用托管在 Azure 机器学习中的模型。因此,任何其他想要这样做业务都可以继续进行,并且知道它可以大规模运行。他们知道微软已经建立并信任其业务,因此他们可以将其业务押注于此。这是一件非常难以解决的事情。从故障案例到故障转移到负载扩展,所有这些,我们只是将其全部构建在其中。因此,人们不必弄清楚如何去做。
但另一方面,我们也有一些疯狂的想法,也许我们可以构建一个能够理解人们说话的模型。我们如何才能让它真正出现在产品中?因此,将研究从实验室带到企业级产品,我们真正能够以正确的规模执行,这是一个巨大的工作。这是我们经历的很多工作,只是从字面上逐个模型地弄清楚我们如何才能使这些东西尽可能高效,并且
然后找出我们以最佳方式在产品中建立它们的方法。
Shervin 和我发布了我们正在进行的研究。我们发现,我们询问的 66% 的人报告说他们没有使用人工智能或很少使用。然后稍微反驳一下,43% 的人随后回应说,“哦,不,不。是的,我使用了,一旦我开始思考这个问题。”我猜想这实际上低估了根据你所说的事情,因为如果你考虑使用 Office 产品的人数以及其中嵌入的 AI 的数量,
但这不算数,对吧?我的意思是,对我来说算数。我不知道。这是我……对我来说也算数。这是我一直在推动我的团队做的一件事,我希望我们能够考虑一下场景和产品,在这些场景和产品中,使用 AI 功能的人的比例为 100%,对吧?
你可以考虑一些事情,例如,在这个 Teams 通话中,我们有转录功能,因此我们可以打开转录功能。但并非每个人都使用它。你可以在一整天都不使用转录功能的情况下度过。你绝对无法避免 AI 的产品是什么,因为它是产品本身固有的?搜索当然就是这样。你无法避免在搜索中使用 AI。当你与你的手机交谈以使用语音撰写短信时,
你 100% 的时间都在使用 AI。因此,随着我们看到这些场景,越来越多的东西是不可能的,对吧?如果我现在要从我的三个要点开始,然后让我将其扩展成一段话,就像,好吧,你不可能在没有 AI 的情况下做到这一点。因此,每次你使用该功能时,你都在使用 AI。它非常普遍,但这是……
还有更多场景即将出现。我的意思是,整个 AI 驱动的应用程序领域即将开始蓬勃发展,如果没有支持它的 AI,该应用程序根本不存在。所以这将非常令人兴奋。
它不存在,但与此同时,它也不必是它的展示部分。我认为当我们询问人们关于 AI 的问题时,他们会想,“嗯,我今天是否与人形机器人交谈过?”而你谈论的是嵌入式案例,它们是另一个过程的一部分。
但可能是该过程不可或缺的部分。好吧,而我们关注的很多事情之一是如何制作能够帮助人们的 AI。AI 不必是它的核心。人是它的核心。如果你考虑一下,我们现在有一个产品设计师,你正在设置你的 PowerPoint 演示文稿,你试图用它来创建漂亮的艺术品和风格。因此,我们已经将 DALI 嵌入其中。DALI 是一个系统,你可以说一些话,它会给你一张图片,描述你刚才描述的内容。
告诉它制作。我想要一只在月球上奔跑的粉色大象,它正在和独角兽玩耍。你会得到一张非常可爱的图片,正是那样。所以……
在那里,人仍然是焦点,对吧?AI 是一种非常强大的工具,但最终,我们正在帮助你发挥创造力去构建一些东西,做一些你以前无法做到的事情。我认为,这个新的生成式 AI 领域令人兴奋之处在于人们正在宣传这一点,我该如何使用这些图像创建工具、这些文本创建工具来
真正让我的创造力更进一步,我是一个糟糕的艺术家。我什么都不画。但是能够说,我想创建这种类型的图像或具有这种类型的感觉或风格,这令人兴奋。
这确实令人兴奋。我会说,我也开始使用了。我制作课堂幻灯片。对我来说,去 Dali,输入我想要表达的一个要点,然后我得到五个图像供我选择,这非常容易。实际上,这花费的时间比这长得多,因为我对胡乱使用它感到非常兴奋,它变成了一个拖延工具。是的,它会吸引你。
我过去也做过同样的事情,对吧?当然,你过去是怎么做的?你会去一个图像搜索引擎搜索一些东西,你永远找不到你想要的东西,你无法以正确的方式调整它。对我来说,我通常在寻找一些有趣的东西,对吧?如果我正在制作演示文稿,而我没有让大家笑,那么我知道他们已经厌倦了。
所以我正在寻找某种方式来,你知道,增强它。因此,你需要一些不寻常的场景。因此,它可能不存在。你不会找到一些搜索它的图像。能够拥有这个能够真正帮助你做你想做的事情的创意工具。我的意思是,这就是 AI 赋予你作为个人去做一些你以前无法做到的事情的能力。它不是核心,但它绝对是你在使用它时可以做的事情的应用的动力。
而其中一些事情是次要的。我的意思是,我明天课堂上的实际案例是,我将给他们一些包含大量错误的机器学习代码,他们的挑战是修复我犯的所有错误。所以我的图像是学生们在戏弄教授。没有这样的库存照片。但 Dali 为我提供了许多不同的选择。但是,你知道,这很有趣,如果那张图片以前不存在,
好吧,我会在课堂上表达我的观点。所以,你知道,现在这些生成性示例感觉很好,但只是次要的。带我们走上这样一条道路:这些东西比我所说的有趣的插图更重要,更能创造价值。带我再走一步。
- 我的意思是,也许我先说反面观点。有人前几天开玩笑说:“我们离 CEO 将有四个要点并要求 AI 为他的员工创建两页备忘录的日子不远了,而员工将使用 AI 将这份两页备忘录缩减为四个要点,然后去阅读它们。”- 哦,我喜欢这个。- 我觉得这很有趣。但这种类型的过程,对吧?我已经使用 AI 来说:“你知道,我需要写一封很难写的电子邮件。我想确保我的语气正确。
这就是我写它的方式。你能让它更礼貌一些吗?或者你能给我一些建议,告诉我应该如何更改吗?你知道,能够获得对此的有价值的输入和反馈。这真是太神奇了。这真的很有帮助。所以,是的。
然后非常重要,你将尝试根据此结果所做的工作。我们有很多场景。我们在 Dynamics 中嵌入了 AI,现在是 Microsoft Dynamics。它是一个 CRM 和广告工具。我们使用它的一件事是帮助人们创建广告文案。他们可以创建为他们生成的广告文案。
一个类似的用例,我们与 CarMax 合作。CarMax 拥有地球上每一辆车。他们希望有一个独特的页面来描述地球上的每一辆车。因此,每当我谈到 CarMax 时,我都会说,我的第一辆车是 1986 年的福特 Tempo。
1986 年的福特 Tempo 是一堆垃圾。它在 1986 年是一堆垃圾,现在也是。但那是我的第一辆车。所以 CarMax 想要一个页面来描述 1986 年的福特 Tempo。他们有关于它的用户评论,
它,但他们想要一个描述它的页面。这对于搜索引擎优化来说会非常有效。因此,他们使用 GPT-3 来总结他们在每个品牌、每个型号、每一年中获得的评论,然后为其生成一个页面。这将花费他们数年时间,实际上是数年时间。他们计算了如何做到这一点。但现在,他们拥有这种真正高质量、有价值的内容,这些内容正因为此而将人们引向他们的网站。
而令人兴奋的是你提到的规模方面,这是个性化的,但同时也是大规模的。我认为在那里……
我们看到了很多希望。完全正确。我认为这非常令人兴奋,你可以做到这一点,你可以运行它几个小时,完成大量工作。再次,与这个主题一样,这是帮助人们做得更好的 AI。作为一名编辑,你可以查看这些内容并查看它们是如何出现的,并且能够比以前更快、更高效地工作。
我们到处都能看到 AI 真正帮助人们做以前无法做到的事情的例子。我们与许多公司合作,他们规模各异,对吧?你真的必须根据他们今天遇到的问题来为他们提供他们今天可以使用解决方案。
我真正喜欢这次谈话的是,我们不仅仅是在谈论少数几家科技公司,这些公司正在使用先进的工具做一些先进的事情。你能评论一下如何将这些工具提供给其他公司和其他人员(不是超级用户)的过程,以及你如何看待这种情况在未来几年中的发展?
我认为现在已经发生了技术的民主化。如果你考虑一下你的手机与三十年前能够获得这种计算能力的人相比有多强大,如果你考虑一下互联网和在线信息与三十年前相比的获取方式,我们会看到这种转变无处不在,你正在将权力掌握在更多人的手中。
因此,我认为 AI 将成为其中的一部分,也是其加速器。当你考虑创建应用程序的能力时,现在需要了解计算机科学、如何编写代码、了解编程语言以及能够使用工具来做到这一点。然后你看看 GitHub 的 Copilot,它只是触及了表面
它可以有多强大,可以描述一个概念,并让 AI 将其翻译成代码。我们将有更多的人,因为有了 AI,他们现在能够创建应用程序。他们能够完成以前无法想象完成的工作,他们可能需要
去雇佣某人来为他们构建一些东西。我认为我们将看到这种民主化继续发生。即使是 ChatGPT,我认为我们也开始看到一些民主化的迹象,让我们向世界展示,“嘿,这就是可能发生的事情。”它可能是最终的作业作弊者,因此我们将不得不处理现在所有需要针对其进行过滤的文章,不,ChatGPT 没有写这个。但只是让人们接触到你可以做的事情的想法,然后考虑一下这将如何转化为工作
下一家公司,接下来将赋能越来越多人的方式,对我来说,这就是民主化真正腾飞的地方。我可以放心地这么说,因为我们会在考试后播出,但实际上,我本周的考试问题之一是使用 chat TPT 并进入
回答问题,然后第二步是改进它。以它给你的作为起点,并改进它。但我对你说的话感到兴奋的是,它实际上与我们上一期与 Ziad Obermeier 的对话有关,他是一位急诊医学医生,他试图构建 ML 模型来解决健康问题。
如果你像 Ziad 一样,对医学和 ML 都非常了解,那很好。但你谈论的事情是让那些可能没有那么深入参与 ML 和 AI 的人能够使用这些工具。我认为这才是真正令人兴奋的地方。
这将是一件重要的事情。医学是一个如此伟大的领域,对吧?我们看到在医学信息、生物工程和所有这些不同领域中涌现出如此多的东西。它实际上触及了我另一个最喜欢的主题,我们必须确保我们以正确和负责任的方式做到这些。因此,每当你有一个模型将要做出任何医疗判断或建议时,你必须确保它不会对不同的群体产生偏见。你必须确保它是公平的。
我们与英国国家医疗服务体系合作的一个例子正是这个问题,试图帮助他们了解,当他们拥有一个模型时,它在什么时候是公平的,它在什么时候具有正确的结果,以及他们是否以正确的方式使用它,因为我们确实希望确保所有这些应用程序的力量真正带给每个人,而不仅仅是能够从中受益的小部分人,我的意思是,你之前提到过稀缺性,我认为
在可能与应该之间。我的意思是,当我们不能这样做时,我们不必进行关于是否应该这样做的讨论,因为我们受制于可能。但现在我们可以了,那么应该就变得重要得多。这让我想到,随着我们放松数据科学和机器学习算法的压缩或放松稀缺性,那么我们将在这里打地鼠,并且越来越需要
能够回答这个问题的人。在我们都准备好之前,我们将进行巨大的转变。
显然,在某些方面对这方面有很多兴趣。我们如何让人们可以使用 AI 并以负责任的方式做到这一点,尤其是在我们知道并非每个人都会遵守我们愿意遵守的相同规则的情况下?你知道,在微软,我们对此进行了大量思考。因此,我们发布了我们的一套负责任的 AI 原则,即公平、透明和安全,以及
真正地努力让自己承担责任。我们还发布了我们的负责任 AI 标准,这是我们在内部遵循的一套实践,说明我们如何确保我们考虑特定产品可能产生的所有影响。然后我们考虑如何减轻这些影响,并尝试以真正负责任的方式发布和使用它们。我们认为这是我们的义务,我们需要确保我们尽可能地推动这一点,
但当然,也有一些地方必须对我们作为社会应该做什么或不应该做什么进行一些政府监管。如果你把它留给公司,公司会做出不同的决定。这必须成为政府的决定。因此,我们已经看到了这一点,我们甚至在某些地方提倡这一点,例如执法部门的面部识别,你知道,这是我们不提供的东西。但我们也认为这确实需要政府来监管,因为我们无法阻止每个人都这样做。
太好了。Eric,我们有一个环节,我们会问我们的嘉宾五个问题。只需回答你脑海中首先想到的东西。第一个是,你最自豪的 AI 时刻是什么?我的意思是,很难不对 ChatGPT 的工作感到自豪,它只是看到了光明。这是最让我想到的,但仅仅是它的潜在影响,我认为绝对是,这将是我的快速回答。你刚刚谈到了偏见和透明度,但除了这些之外,你对 AI 感到担忧的是什么?
我的意思是,这可能是我最担心的事情,确保它被负责任地使用,并确保它的好处真正惠及所有人。这是我们有义务做的事情。我们正在创造这些东西。如果我们以不了解的方式去做,那么我们就对此负责。因此,我们承担了这个责任。
非常认真地对待,然后希望确保我们在这方面做得很好。这是我们看到整个行业真正接受的事情,我们与之交谈的所有客户也是如此。这是他们总是寻求帮助的事情之一。所以我对此感觉很好,但这绝对是我们非常警惕的事情。
你最喜欢的、不涉及技术的活动是什么?我非常喜欢骑自行车。所以基本上任何户外活动都可以,现在西雅图又冷又下雨。所以我们开始考虑滑雪季了。那也是另一件事。
你小时候想从事的第一份职业是什么?你长大后想做什么?我想成为一名飞行员。我的祖父在空军学院任教。我实际上申请了空军学院,本来可以去那里,但是我的视力不太好。所以,如果你的视力不好,他们不允许你飞行。所以,你知道,《壮志凌云》第一部对我的影响很大。所以看到第二部回归,感觉很有趣。你对未来人工智能最大的愿望是什么?
人工智能改变我们所做的一切事情的方式,真的让我印象深刻,而且这种改变是积极的。
所以我们已经开始看到,人工智能开始渗透到许多我们可能从未想过领域的各个领域,从财务预测到零售店的库存管理。就像我们看到人工智能对这些领域产生了很大的影响一样。但我认为我们真的有条件让它彻底改变我们今天与世界互动的方式。
我认为这将是一种非常积极的方式。这就是我大力推动并试图努力实现的目标,嘿,我们该如何帮助实现这一目标?因为我认为这将非常棒。
太棒了。谢谢。这次谈话非常精彩。我们非常高兴您抽出时间与我们交谈。我认为您提到的将这些工具交到并非顶级科技公司手中,而是交到每个人手中,这将具有爆炸性的影响。我认为人们会喜欢听到这些。感谢您今天抽出时间与我们交谈。很高兴与您交谈。感谢您邀请我。
感谢收听。下次我们将与Sherva一起会见Michelle McCracken,她正在帮助达美航空公司教一线员工了解分析和人工智能。感谢收听《我和人工智能》。我们相信,与您一样,关于人工智能实施的对话不会仅限于本播客。这就是为什么我们在LinkedIn上专门为像您这样的听众创建了一个小组。它被称为“人工智能领导者”。如果您加入我们,您可以与节目创建者和主持人聊天,提出您自己的问题,分享您的见解,
并获得来自MIT SMR和BCG关于人工智能实施的宝贵资源,您可以访问mitsmr.com/AIforLeaders来访问它。我们将把链接放在节目说明中,我们希望在那里见到您。