嗨,各位听众。欢迎回到《No Priors》。今天,我们邀请到了Brett Taylor,他的传奇职业生涯横跨多个领域,从创建谷歌地图到担任Facebook的CTO和Salesforce的联席CEO,期间还创立了两家公司,并担任Twitter和现在的OpenAI的董事会主席。他和Clay Bavor共同创立了Sierra,该公司正在为下一代客户体验创建公司代理。
我很高兴今天能邀请到这样一位杰出的技术专家和各级领导者,也是一位老朋友。Brett,欢迎你。Brett,非常感谢你今天加入我们。很高兴。谢谢你们的邀请。让我们直接进入正题。代理今天有效吗?你如何定义代理,或者你想让我定义代理吗?你来定义代理。你是专家。代理在学术界和我在行业中看到的含义有所不同。我认为这两种定义都很重要。
首先,我从我所认为的经典学术定义开始,代理系统是一种软件可以自主推理和采取行动的系统。它来源于“agency”(代理)这个词。
由于这样一个广泛的学术定义,我认为它成为使用这个词的人的“墨迹测验”。在现在的行业中,我认为有三种类型的代理正处于工作的边缘。我认为第一种,很多网民都在谈论的是个人代理。我认为这可能是三种类型中最早的一种,但也可能是最令人兴奋的一种。这是可以对你的收件箱进行分类的代理,
安排假期,帮助你准备会议,管理你的日历,所有这些。我认为它之所以最早,是因为我认为制作一些演示非常有趣,但是我认为
人机交互,甚至代理与我们作为个人所依赖的所有系统之间的交互都非常复杂。你可以将推理和系统集成的表面积视为几乎无限的。因此,我认为这可能是优秀个人代理的一个先决条件。
可能需要比目前可用的技术更多,尽管在这个领域有很多有趣的初创公司。你可以想象一些有趣的公司正在开拓有意义的利基用例,这些用例会随着技术的改进而扩展。第二类代理,我认为这种代理确实存在于某些类别中,我称之为基于角色的代理。所以它们是做工作的代理,一个非常具体的工作,
有一些像Harvey这样的公司提供法律服务。所有编码代理。我认为现在有一些相当有效的代理可以胜任计算机程序员的工作。我认为这非常令人兴奋,因为我认为当你缩小范围时
我称这些案例为狭窄但深入的。如果你只是想——任务范围和集成范围。没错。你访问的工具,甚至你如何评估有效性,例如,如果你正在构建一个编码代理,实际上已经有非常好的基准了。同样,编译器会发出错误消息,你可能有集成测试
你最终会得到这种支架,实际上,从实践的角度来看,它限制了你必须完成的真正研究的范围。我认为,总的来说,随着基础模型的出现,现在很多有效的AI都是你已经将研究领域变成了工程领域。我认为你可以为某些技术适用的领域设计非常有效的基于角色的代理,例如法律。
像软件工程领域和类似的事情。我的看法是,个人代理领域可能是像苹果、谷歌、OpenAI和其他拥有大型消费者品牌的公司。对于基于角色的代理,我认为在每个领域可能都有有意义的公司,因为我认为要有效地做到这一点,需要人工智能专业知识和该领域专业知识的融合。
另一个类别,也是我的公司SierraWorks所在的领域,我称之为公司代理。它实际上……
不仅仅是关于自动化或自主性,而是在这个会话式AI的世界中,你的公司如何在数字世界中存在?我总是用1995年的比喻,如果你在数字世界中存在,这意味着拥有一个网站并出现在雅虎目录中,对吧?在2025年,在数字世界中存在可能意味着拥有一个你的客户可以与之交互的品牌AI代理,以完成他们在你的网站上可以完成的所有事情。无论是,你知道,询问你的产品和服务,
进行商务活动,提供客户服务。我认为这个领域现在已经可以使用现有技术来实现了,因为,同样,与基于角色的代理一样,它不是……
煮沸众所周知的海洋,技术上。你对你的客户体验有明确定义的流程,有明确定义的系统作为你的记录系统。这实际上是在说,在这个我们已经从网站到应用程序再到现在的会话式体验的世界中,你想要围绕你的品牌建立什么样的会话式体验?这并不意味着它是完美的或容易的。否则,我们不会围绕它创立一家公司。但它至少是明确定义的。我认为
现在在人工智能领域,如果你正在研究人工通用智能,你对代理的理解可能意味着不同的事情,这没关系。这只是一个需要解决的不同问题。
但是我认为,你们投资的许多公司,Sierra的工作重点是说,现在使用现有技术是否存在一些唾手可得的机会?我绝对认为有。你能描述一下构建公司代理的“挖掘”周期吗?研究与现实之间有什么差距?你如何
作为工程团队,你投资什么?你如何理解不同客户环境的范围?就像这里的投资方向是什么?——对不起,打断一下,但作为起点,甚至可能值得定义Sierra今天为客户提供的产品是什么,然后,
你希望它走向何方?然后我们可以将其反馈到,这些组件是什么?因为我认为显然,大家正在成为你垂直领域的领导者,但对于更广泛的受众来说,了解你的关注重点会很棒。是的,当然。我将举几个例子来说明这一点。因此,如果你购买了一个新的Sonos音箱,或者你的音箱出现了技术问题,你就会看到令人讨厌的橙色闪烁灯。你现在将与Sonos AI聊天,它由CIRA提供支持,以帮助你入门,帮助你调试,无论是硬件问题、Wi-Fi问题,
诸如此类。如果你是一个SiriusXM用户,他们的AI代理名为Harmony,我认为这是一个令人愉悦的名字。从升级和降级你的订阅级别到你在购买新车时获得试用版时与你交谈。
总的来说,我想说我们帮助公司构建面向客户的品牌代理。品牌是其中重要的一部分。它是你的品牌的一部分。它是你的品牌体验的一部分。我认为这非常有趣和引人注目,因为我认为就像,你知道,当我回到1995年的时候,你的网站就在你的名片上。这是你第一次拥有这种数字存在。我认为同样的新奇感,而且我们可能会以同样的方式回顾今天的代理
感觉,哦,那太古朴了。如果你回到Wayback Machine,查看早期的网站,你会发现它要么是某人的电话号码,仅此而已,要么看起来像DVD介绍屏幕,有很多图形。客户开始使用的许多代理通常围绕客户服务领域,这是一个非常好的用例。
但我确实相信,如果你快进三到四年,你的代理将包含你的公司所做的一切。我以前用过这个例子,但我喜欢它。但想象一下一家保险公司,当你与他们互动时,你可以做的一切。也许你正在提交索赔。也许你正在比较计划。我们之前谈论过我们的孩子。也许当你孩子长大到可以拥有驾照的年龄时,你正在将你的孩子添加到你的保险费中。
所有上述内容,你知道,所有上述内容都将由你的代理完成。这就是我们正在帮助公司构建的内容。Sierra最初专注于面向消费者公司。是的,绝大多数客户都是消费类公司。从技术上讲,B2B公司和消费类公司之间没有太大区别,只是你拥有的客户数量不同。我一直喜欢从第一性原理思考这项技术能够实现什么以前不可能的事情。如果你考虑一下,
典型的对话成本。因此,如果你今天打电话给呼叫中心,大多数服务团队的关键指标之一是他们的每次联系成本,即完成该电话的劳动力和技术的全部成本是多少?
对于大多数电话来说,服务该电话的成本为13美元。现在有了AI,你可以将这项成本降低到远低于1美元。因此,你实际上将对话成本降低了一个数量级。
因此,如果你只是对这个进行计算,例如哪些公司会从这种成本中获益最多,我不确定,这取决于数学方程式,查看分子和分母。但是,如果你以数百万消费者来衡量,那么对于消费类公司来说,价值显然大不相同。对于许多消费品牌来说,因为进行对话是一件非常昂贵的事情,你不会轻易做到这一点。
你知道,有整个网站致力于寻找公司的电话号码,因为通常情况下,在某些方面,它们对消费者并不友好。你将这些推向这些数字自助服务体验。我现在真的很兴奋,因为与客户进行对话的成本降低了一个数量级。也许你可以多做一倍。你知道,这实际上意味着什么?因此,对于这些技术趋势,我认为你通常从数字化你目前所做的事情开始。但我实际上认为二阶效应将是,天哪,
既然进行对话不再是一个巨大的成本中心,我该如何将进行对话作为我的客户体验的关键部分?因此,回到你的问题,我认为与拥有100名客户的B2B公司相比,与大型消费类公司进行这种对话更有意义。这并不意味着它没有价值。我只是说影响程度和所做决定的差异相当大。
你能描述一下利用当今基础模型的功能并使其在公司代理环境中发挥作用的一些主要挑战吗?一种技术,我认为你们可能在你们的播客中谈论过,现在非常常见的是所谓的检索增强生成。它本质上意味着
你使用大型语言模型,而不是使用模型及其在预训练过程中的固有知识来发出答案,而是将该模型与内容数据库相结合,并说,使用内容作为真相来源,并要求模型总结来自该数据库的选定内容。这是一种迂回的方式,说明如果你可以将代理和提供给它的知识联系起来,但你也可以
使用现成的模型并将其与专有的业务数据集成。所以这现在是一种非常流行的技术。我想说这是一个非常令人兴奋的领域,但我们在实践中发现,对于几乎任何有意义的客户体验来说,这种广泛的技术投资类别都严重不足。如果你考虑一下你与你所关心的品牌进行的所有互动,其中有多少对话是在提问?
可能没有一个。这都是关于采取行动的,对吧?它是升级或降级订阅。它是退货。它是保修更换。它是,你知道,向保险公司提出索赔。所有这些不仅不是简单的回答问题,而且还在可能超过10个记录系统上采取行动。这可能是一个非常复杂的过程。通常情况下,这个过程既有业务目标。你知道,我们如何
阻止你取消或说服你不要取消,可能还有合规目标。如果你想象一下成为一家符合HIPAA标准的医疗保健相关公司,那么对你可以做什么和不能做什么有很多限制。你可能身处一个真正受监管的行业。所有这些都意味着,这种构建可以基于内容的代理的想法是一个很好的演示,但实际上并不一定是一个有影响力的产品。
这就是我们真正试图解决的技术领域。我们正在努力创建一个平台,你可以在其中编排任意复杂程度的过程,不仅在AI中拥有代理权,而且还拥有防护措施。总的来说,过去二十年的大多数软件系统都是执行速度非常快的规则引擎,无论规则是作为源代码实现还是在低代码平台中实现。
现在我们正在转向一个目标和防护措施的世界。因此,企业现在有机会表达业务流程,而不仅仅是一组规则和决策树,而是说,你想要实现什么?你希望AI在哪些方面拥有代理权?也就是说,你希望它在哪些方面具有创造力?以及你不想让它在哪些方面具有创造力?这是一个非常有趣的技术问题。我认为这也是一个非常有趣的问题,我想说,社会和商业问题。许多公司一开始会说,
我想精确控制AI的行为,这是一个很好的目标。实际上,我们的平台确实支持它。但是如果你这样做,它可能会相当机械化。你实际上正在消除人们在与ChatGPT等事物互动时感受到的许多神奇之处,这从根本上来说是这些模型中固有的创造力和代理能力。另一方面,如果你将这个旋钮调到,你知道,这是Spinal Tap 11关于代理GPT,
你知道,你可能会产生幻觉。它可能会违反你的政策,或者更微妙的是,它可能只是不是一个伟大的品牌大使,你知道,对于你的品牌所做的事情。所以我想说,我认为我们正在努力构建一个更深层次的东西,那就是你如何针对非确定性创造性软件进行编程?我们需要构建哪些抽象来表达目标和防护措施,这样你就不会消除我认为使
这些体验令人愉悦的创造力和代理能力。这就是为什么ChatGPT比历史上任何服务更快地获得了1亿用户。但你也可以向你的董事会、你的CEO、你的客户表明,已经到位了正确的防护措施。然后就是你真正感到舒适的地方。你在哪些方面对AI拥有代理权感到舒适?所以这是一个非常有趣的技术问题。我认为它也是
一个新的设计问题,几乎是一个哲学问题,关于你希望在多大程度上将创造力赋予软件,而这在几年前还无法进行讨论。
你认为你提到的那些不同方面,防护措施,或者在某些情况下,我看到人们正在开发代理构建自己的推理引擎和其他东西,它们在核心基础模型或LLM之上添加自己的模块。你认为作为一家公司,你需要自己做多少,而最终会集成到像OpenAI或Anthropic这样的核心模型公司中?
如果你不介意的话,我会先放大一下,给你我的市场观点,然后我会进入你的问题。有一句马克·吐温的名言,“历史不会重演,但它会押韵。”我认为
人工智能市场将与过去15年云市场的押韵。如果你看看它的发展情况,总的来说,你最终会得到少数几家基础设施即服务提供商,它们代表了云计算中绝大多数的资本支出投资,即大多数软件即服务公司向其中一家基础设施提供商支付租金,例如亚马逊网络服务、Azure或谷歌云。同样,因为数据中心开发具有规模经济性,所以初创公司没有必要构建自己的数据中心,或者初创公司实际上构建基础设施即服务业务。所需的资本支出以及
资本支出的积极反馈循环根本行不通。我认为这可能会在前沿模型中发挥作用。我们最终会有一小部分公司进行预训练,这是模型构建中真正资本密集的部分。不是因为他们是唯一拥有优秀研究人员的地方,而是因为如果你看看资本支出要求,
实际上要获得该资本支出的回报。你真的想把它租给很多人。然后对于很多公司来说,
特别是那些已经进行预训练的初创公司,他们发现像获得回报一样具有疑问。你认为从长远来看,这最终只会成为主要的云提供商,或者云提供商加上一两个其他参与者吗?因为从根本上说,正如你所说,存在资本支出和支付能力方面的问题。第二个方面是,如果你实际上正在这些云提供商中的一个上运行所有应用程序、所有数据以及其他所有内容,那么向第三方服务发出 ping 会增加延迟。因此,你增加了往返行程,增加了第二个关于
批准、预算、安全等方面的购买行为。所以你认为它只会大致整合到云中,加上或减去?我认为它最终会大致成为云提供商与大型研究实验室的合作,这大致是目前的格局。我不确定我完全同意安全和延迟方面的问题。这可能是真的。这很有趣,我认为,大多数公司,大多数大型企业现在使用多个云提供商。他们中的大多数使用软件即服务,并不一定关心它在哪里托管,只要满足安全性和可靠性要求即可。当然,对此有一些例外,但我认为,由于20年的软件即服务,人们已经将他们的期望演变为不问,你知道,你从哪里获得电力?
而只是说,你的这项服务的SLA是什么?我认为这是一个积极的趋势。所以我认为可能需要克服有意义的延迟和安全问题,但所有这些都在同一个基质中,我不确定我会做出这样的飞跃。我可能错了。我认为软件即服务的发展已经发展了这一点。但是回到我的历史押韵点,我认为你将有一小部分基础模型构建者进行预训练工作
我认为将会有一个工具公司市场。人工智能领域的一个很好的例子可能是Scale AI。Snowflake是云计算领域的一个很好的例子,它也可能是人工智能领域的一个例子。我认为所有这些工具公司,它就像淘金热中的镐头一样。如果你试图迁移到云端,你需要什么软件?如果你试图在你的业务中使用人工智能,你需要哪些工具和软件?然后是最终类别解决方案。就像在云时代一样,你
你可以使用亚马逊网络服务、Azure或GCP的服务来构建几乎任何东西,但大多数公司都不想这样做。大多数公司都想解决问题。构建自己的CRM或ERP系统的总拥有成本是没有意义的。我认为公司花了很长时间才意识到这一点,但他们现在肯定意识到了。我认为人工智能的情况也大致如此。如果你想
自动化客户服务,与Seria合作比自己构建要容易得多,成本也低得多。如果你想自动化你的法律流程的一部分,与Harvey交谈可能比尝试自己构建更合乎逻辑,原因与软件即服务相同。因此,总的来说,回到你的问题,你知道,
你如何构建技术,基础模型提供商将做什么?我认为更高阶的问题是,你提供的价值是什么,你如何解耦,你是否在模型之上增加了足够的价值来成为一家真正的公司?答案是,如果每次发布新的AI模型时,它都会以某种方式降低你的价值,这可能表明你实际上并不是一个解决方案。它可能是在模型之上略微增加的价值。我认为有很多初创公司不幸地
闻起来像这样。这并不一定有很多价值。当模型改进时,Sierra会发生什么?如果我们做得对,我们的平台就会变得更好。我认为我们的客户和我们的平台(我们称之为Agent OS)本质上是在定义其客户体验的目标和防护措施。每次我们有新的技术可以更有效地完成这项工作时,我们都会将其插入,你就会得到
更好的案例解决、更好的客户满意度、更少的负面体验,这非常好。同样,当你从软件即服务公司提供的任何网络服务在技术改进时变得更好时,这就是我们想要提供的。
但我们的客户聘用我们做的事情与模型无关。它与他们的客户体验有关。所以从根本上说,这就是我们思考的方式。作为一名企业家,我认为如果你不适合这些领域中的一个,那就很危险。至少这是我的观点,因为……
当模型改进出现时,有一个真正的问题。如果这是提供的价值的50%,那么你就会处于这种令人不安的价值谷底。但我认为,所有用例都将来自基础模型的想法可能是错误的。我的意思是,现在很难预测未来。
但我认为这相当于说,你知道,15年前,天哪,不会有一家软件即服务公司。每个人都将自己构建,或者使用……提供的乐高积木。有些企业说过这话。是的。是的。而且我实际上……很长一段时间。是的。我实际上认为那里可能出现了相反的情况。
而且,你知道,大多数企业,例如,我一直想知道,你想在哪里创新?你知道,如果你是一家大型零售商,你拥有的工程师相对较少,你没有资源自己实施所有内容。你想在哪里脱颖而出?你想在哪里与众不同?对于大多数公司来说,你知道,他们受益于上涨的浪潮,提升所有投资软件即服务平台的船只。我只是看到同样的事情正在这里发生。所以我对创新非常看好。
回到我们对代理的定义,所有创建基于角色的代理的公司,它们显然会相互竞争。但我认为在这个领域有有意义的公司,而且我可能会与他们合作,而不是假设它来自基础模型提供商,因为他们正在解决所有独特的问题。让我们以编码代理为例
开发人员工作流程、安全、不同的编程语言,所有这些东西。我实际上认为这里有很多价值。我还认为,依赖编码代理可能会产生二阶效应,它们如何融入你的团队、治理、代码审查,所有这些事情,我现在还没有
足够周到地列举出来,但这就是为什么在这个领域存在一家公司。而且我对这家公司长期存在非常看好,甚至不知道一半的名字。我认为,正如你所说,与SaaS的类比是一个非常有说服力的类比,因为人们总是谈论基础模型上的包装器以及这些公司将如何消失。你可以争辩说,很多SaaS就像SQL数据库上的包装器一样。在某种意义上,这有点像同一件事。是的,我认为同样的事情可能是Shopify、Salesforce、ServiceNow所说的。是的,完全正确。而且这些都是……
伟大的公司,你知道,有趣的是,它们最终变得非常像,让我们说Salesforce的数据库供应商,并且很长一段时间都是非常重要的供应商,而且它确实最终被墨迹化了,值得一提的是,如果你相信我的类比,那么关于云市场的真正有趣的事情是……类比有时也很危险,好吧,让我们说类比的例外有时有点隐藏,但你知道基础模型提供商将受益于这项投资,你知道这些
我真的认为这些基础模型具有巨大的内在价值。而且,你知道,因此,构建在其上的任何解决方案,基础模型提供商都将从所有这些惊人的用例中收取税款。这对所有参与者来说都非常棒。正如你所暗示的那样,你知道,不同的应用程序公司可以选择在不同时间使用不同的模型。因此,它创造了很多
可能健康的竞争。对于Sierra的客户来说,最重要的事情是,我们正在为我们的客户提供未来的保障。未来的保障,这样你就不会遇到新技术出现时出现故障的可怕情况,但是
当有伟大的新技术出现时,以更有意义的方式,我可以打开它吗?我可以从中受益吗?我认为,对于这个领域中的许多解决方案和应用程序公司来说,这最终将成为它们提供的主要价值之一。对于任何尝试过提示工程或使用工具进行提示工程的人来说,我不得不说,
这些模型的低级水平并不像你的提示那样适用于未来,我的意思是模型可能会更好,但它并不严格更好,它实际上是,你知道,令牌和模型之间存在非常紧密的契合,所有这些东西,你知道,好吧,有很多有趣的工具在那里,我不确定这是否像大多数公司应该或想要操作的层一样,就像你知道你的公司不想知道你正在进行数据库迁移一样,这很无聊但很重要,你知道软件即服务
提供的是你不需要关心这一点。没有停机时间。是的。另一件有趣的事情是商业模式。在Sierra,我们真正专注于我们所说的基于结果的定价,按完成的工作收费。我看到这个领域有很多初创公司都在这样做。在人工智能时代,这是软件即服务的另一个非常强大的部分,我认为你可以,我认为最好的AI公司正在将其商业模式与客户的商业模式相结合,按结果收费。我认为这是一个非常
强大的新商业模式,也许与基于订阅的软件和软件即服务时代的想法一样强大,再次,提供开箱即用的解决方案并将公司的实际商业模式与结果相结合非常有意义,并且与付费代币相比有很大不同。我认为
实际上与客户建立这种一致性也很有价值。对这一点的承诺也表明,对这些解决方案的价值有多大信心和雄心壮志。这并非易事,但应用公司领域中最令人兴奋的事情之一是,您确实看到了与现有解决方案相比价值的巨大提升。是的,我认为,如果您与经济学家交谈,
他们会谈论软件作为生产力驱动因素,有时以非常抽象的方式,当然,如果您知道,有时这非常明显,例如,我不记得了,但在财务部门使用和不使用微软Excel之前,它必须推动了仅仅是第一推理,例如计算尺与Excel或计算器相比,Excel当然推动了生产力,但在过去的20年中,它一直相当间接,你知道,每个人
或增量收益。或增量,但每个收听过企业销售周期的人都会展示一些关于投资回报率 (ROI) 的幻灯片,并且所有这些 ROI 计算,您都会花费所有这些时间尝试,如果每个人都能获得 5% 的更多收益,我不想说这是
胡说八道,但就像,你知道,我认为很多采购和 IT 人员都看过数百个这样的演示文稿。你会想,我们是否真的减少了部门的人数?我们是否真的衡量了这些事情?我认为在人工智能时代,因为这些系统可以在适当的防护措施下自主采取行动,
我们更接近于软件实际上完成一项相当可衡量的任务。如果有一个类比,它有点让我想起了从基于展示次数的广告转向基于每次点击付费的广告。这并不意味着您完全转向交易,但您正在接近。在 Elad 和我曾在谷歌经历的这种转变中,客户只是愿意为点击支付不成比例的更多费用,因为即使您可以对一些展示次数进行半途衡量,您越接近,直接归因的价值就越大。而且
这对现在的公司来说是一件好事,你知道,你应该对你的软件,你知道,提供商有更高的标准,你知道,而且,你知道,而且,你应该更接近价值。我认为这是一个很好的趋势。而且,你知道,回到我们关于法律、编码和服务的类比,就像你实际上可以看到它产生的价值这个功能,你知道,它实际上分析了这份合同,你知道,它做了这件事,你就像那样,我实际上知道如何评估它。
就像我们长期以来一直在为我们的员工评估价值一样。你知道你必须支付多少咨询费才能完成 X、Y 或 Z。你知道你的呼叫中心每位联系人的成本。这真是了不起。我认为这将真正改变软件供应商和公司之间的关系。我认为这将使软件供应商成为他们合作公司的真正合作伙伴,因为他们实际上正在交付有价值的东西。这是可以衡量的。我认为这是一个非常积极的变化,因为如果您与任何公司交谈
首席信息官,并询问他们是否从购买的所有产品中获得了他们希望的价值?你会看到他们的脸上血色全无。他们会有恐怖故事,对吧?关于……沮丧。是的,沮丧。而且这很复杂。我认为这是一个非常积极的趋势。也许一个非常高调的例子是 Klarna,他们公开谈论如何有效地实施客户支持工作流程
对于他们自己的业务,我认为最终导致净推荐值大幅提高、客户满意度提高、每位客户的时间减少。他们基本上自动化了一堆工作流程。与此同时,他们还将团队规模减少了,我认为是 700 名代表或人员。因此,它对他们的业务运作方式以及他们如何与客户打交道以及他们可以支持的语言产生了巨大影响
人员等等。因此,似乎现在出现了这些非常突出的例子,说明您正在谈论的这种巨大影响。我认为影响就在这里。这就是为什么我对许多处于应用领域的公司感到非常兴奋的原因,因为我认为他们现在更接近于有形的价值,而不是广泛地。您认为其他一些关键应用领域是什么?我提到了我现在看到的企业采用率最高的三个领域,基本上是编码、客户成功,
我认为现在正在努力进行销售生产力或销售和营销生产力。您认为还有哪些领域是您提到的法律领域,您认为哪些领域是
这些领域近期即将到来的浪潮,这些领域非常清楚地表明这些事情将产生非常大的影响。我不确定这是一项工作,但我真的很期待自动化分析师的角色,尤其是后台分析,并且不一定是取代,而是分析师的钢铁侠套装。如果您从表面上看分析师的高级角色,那就是综合复杂数据以向利益相关者提供见解。
而且,你知道,如果你从第一性原理考虑大型语言模型擅长什么,那就是总结、综合、推理,我认为这里有一些非常有趣的应用。这确实看起来很复杂。你知道,语言模型不一定擅长数值或表格数据,除非做了大量工作。
特定领域的资料可能包含基础模型本身并不具备的含义或复杂性。因此,在我看来,这就像编码一样,就像法律一样,实际上微调是有益的,特定领域的专业知识是有益的。正如我所说,我不确定分析师是一个角色。我认为不同部门可能有不同的
分析师,但如果您查看一家公司和一家更大的公司,有多少人的工作是获取数据、制作演示文稿、执行所有这些转换,再次,我认为无论是否
你知道,取代,我不确定,但肯定可以增强并使其效率更高、更实时。我认为这也很令人兴奋。我们可以回到你刚才说的目标和防护措施吗?就像你描述的那样,我们正在摆脱,你知道,复杂的规则引擎作为商业软件。对于您的客户来说,这是一种相当大的思维转变。您如何与他们一起工作,你知道,
或者我想评估 Sierra 代理的工作情况,并让人们对此感到满意。是的,我会从技术上描述一些事情,然后再说一些操作方面的事情。因此,从技术上讲,我们与许多客户合作,实际上是为了规范和定义他们的流程,你知道,有时我们的客户会提出非常明确的流程。有时他们没有。我们喜欢发送由事实知识组成的代理
以及程序知识,你知道,流程遵循什么,以及与系统的集成
我们花了很多时间讨论您想要在哪里设置防护措施,在哪里想要创造力,以及在哪里想要代理。然后,我们在概念验证中进行大量实验,让它上线,并通过这项技术遇到现实生活中冷酷无情的现实。这是否真的达到了您认为的预期?有了这些,我们为客户体验团队开发了许多工具。
我们认为人工智能不应仅仅是技术团队的领域。负责贵公司客户体验的团队,也许是在首席数字官办公室,也许是一个正式的客户体验团队,他们应该成为掌控这些体验方向的人。因此,我们构建了许多工具和平台,让这些团队可以审核和改进代理,并随着时间的推移实际掌控其代理的行为。
而且这并不是一件经常发生的事情。回到更深层次的问题,即让人们感到舒适,这些都是非常有机的系统。因此,如果您想象一下您是一家零售商,并且您访问了一个零售网站,那么该网站上可能有一个菜单,列出了您拥有的所有类别。男士、女士、
鞋子、裤子,等等。您点击它们,它会过滤列表。此时,这是一种标准的零售模板。我不确定它是否最好,但这就是我们生活的这个世界。如果您想象一下有一个对话式 AI 代理,它是一个自由格式的文本框。
因此,它是完全自由格式的。所以,回到我的糟糕类比,它有点像从雅虎目录转向谷歌搜索。你知道,你拥有你可以做的一切的分类法,到一个自由格式的文本框,你想让我们做什么?因此,
它往往比我认为人们最初设想的要广泛得多。我认为它往往会产生一种长尾的客户体验,我们不仅没有为代理设计这些体验,而且我们的客户也没有预料到。我认为这是一个非常有趣、更深层次的问题。我们谈到了一个疯狂的,比如欺诈退货案例,没有人知道发生了什么。是的,没错。我的意思是,这确实是客户的声音,字面意义上的。
所以我认为这是一个非常令人兴奋的动态。有一本书叫做《长尾》,我把它与谷歌联系在一起很多。我认为埃里克·施密特可能是为它写的序言,如果我没记错的话。但我确实认为,随着互联网世界从目录转向搜索,
网页数量的增加,您最终不仅拥有大型热门网站,还拥有长尾博客。这确实是,并且是网络的一个非常了不起的部分。我认为我们在客户体验方面正在朝着这个方向发展,您可以在那里策划可供客户使用的少量屏幕。如果您转向 AI 代理的世界,
你可以说,对不起,我帮不了你。但你可能要做的是把它处理得更像数字绘画。哇,这是我们的客户想要的东西。
与我们谈谈如何满足这种愿望和需求。因此,这是一种非常有趣的客户洞察力的结合,但我认为这是一种开发客户体验的全新方式,这种方式更具机动性。因此,随着人们的学习,它将具有适应性。相当适应性强。这是一个始终在线的系统。它不仅仅是运行 A/B 测试。它有点不受控制。它是一个系统和有机体,你不断地。因此,我们的平台有很多内容是关于如何授权客户体验团队来管理这一点?
新的边缘案例,新兴的客户行为,而不是模型行为。没错。就像今天在野外发生了什么新事情?外部事件、争议、流行的产品发生了变化。您如何不仅从中获得见解,而且如何以不消除动力的方式不断发展这个代理
客户体验团队的代理机构,其工作是定义这一点,但也包含 AI 的自然、有机、新兴行为。如果您向前滚动,我不知道是什么,六个月、十二个月,就像今天我们有文本框一样,语音模式即将到来。视频化身现在已经存在。我们应该期望 Sierra 化身像你或 Clay 那样更个性化和更丰富吗?保真度重要吗?
确实如此。实际上,去野外看看一些 Sierra 代理,看看每个代理的个性有多么不同,这真的很有趣。我认为您的代理应该是品牌大使。大型语言模型如此引人注目的一点是它们能够观察与之交谈的人的情绪。由于指令微调,这是使这些大型语言模型具有对话性的机制,它们会自然地反映出来
你的情绪和语气,但你也可以控制和修改它。因此,对于您的品牌,如果您想要一个不拘一格的品牌,您可以拥有它。如果您想要一个更朴素的品牌,就像一个奢侈品牌一样,您可以拥有它。您是否将其作为提示的一部分来执行,或者您是否在训练后执行,或者您如何将其实际应用到您的产品中?上述所有方法的组合。你知道,有些语气和品牌适合
提示取决于模型。有些品牌更敏感,你知道,就像你不想让你的 AI 代理提供医疗建议或财务建议一样。那种语气,那种实质。我们做了很多我们所谓的监督模型。因此,我们有模型来监督其他模型。这是乌龟一直到最后。我们在办公室里的笑话是,人工智能中每个问题的解决方案都是更多的人工智能,这真的很令人兴奋。我认为这是我们平台的有趣之处,
你知道,我们有很多工具可以用来解决这些有意义的问题。我认为这真的很令人兴奋。同样,每当我想到品牌体验时,我都会想到苹果。如果您去库比蒂诺的办公室或走进苹果商店,您会打开他们的产品包装。它有点同样的氛围,你知道,你会看到“加利福尼亚制造,加利福尼亚设计”,你会想,这是一个苹果产品。
我得到的体验。我认为你应该,你知道,把你的代理视为你品牌体验的一部分,因为它可以有个性,你知道,它可以因人而异。这真的不一样。你知道,这有点像
黑色星期五,也许 15 年前,每个人都得到了相同的活动。我猜想今年的黑色星期五,大多数人的收件箱邮件都将是个性化的。因此,我们已经转向更个性化的体验。代理会从一种个性开始吗?然后,也许几年后,人们会充满信心地说,让我们真正反映与之交谈的人的个性或人口统计数据。简短的答案是我们不会为客户规定这一点。但是,事实上这是可能的
真的很酷。我的意思是,这太棒了。你谈到了语言。能够反映说话者的语言,而不是你为呼叫中心配备人员的语言,这是一件多么令人感同身受的事情。它使以前在成本上令人望而却步的事情成为可能,这是一件非常令人感同身受的事情。另一件事,你知道,
有聊天、语音、视频的乐趣和个性。视频化身将令人难以置信,你知道,那就是与品牌进行 FaceTime。这只是一个非常酷的想法。我还认为,你知道,你刚才谈到的是,我认为是 Klarna 的用例。我认为我们不能低估这对消费者有多大的影响。人们拥有糟糕的客户体验的首要原因是他们不得不等待,尤其是在诸如客户服务之类的环境中。
就像,你知道,对于大多数入站互动来说,有些事情是不对的。你知道,你有一个需要满足的需求。无论对方电子邮件、聊天或电话号码的效率有多高,你都不会立即连接或解决问题。我认为这是人工智能的机会。这就是为什么,你知道,客户满意度、MPS 可以真正得到提升。这并不是对
以前做这件事的人的指责,这些人天生就处于劣势,因为他们落后于……你是排队中的第 10 位,你正在等待,对吧?所以——这是一个规模不匹配的问题。当你结束等待时,你已经不太高兴了。另一边那些优秀的人也许可以扭转局面,但这个机会是即时的。我认为这很了不起。我的意思是,那是
我一直试图提醒我们的客户,不要想太多。即时满足实际上是这些系统的主要价值之一。其余的都是锦上添花。是的,即使只是你如何考虑人员配备,因为你突然可以使用单个代理支持多种语言,而对于人类来说,很难掌握 30 种语言。因此,即使是这些事情,正如你所说,也会真正影响队列和客户。还有俚语、行话和习语。我认为期望某人说 10 种语言是完全不合理的,每种语言都
知道一个术语,知道这个。你还有,有很多非常微妙的事情。假设你的公司推出了一款新产品。想想重新培训需要多长时间,你知道,呼叫中心中的 5000 名代理关于该新产品。好吧,你可以通过按一下按钮来完成人工智能。因此,这项技术有很多非常有趣的,你知道,二阶效应,这对每个消费者都非常有益。
因此,您对该行业拥有令人惊叹的优势。你知道,你很早就担任 Facebook 的首席技术官。你是 Salesforce 的联合首席执行官。
你在 OpenAI 的董事会任职,你正在运营 Sierra。我们已经谈了很多关于语言和应用程序的事情。你简要提到了视频化身之类的东西。除了核心企业语言用例之外,您是否还有其他对人工智能或其他模式产生影响且您非常兴奋的重大技术趋势?或者您认为即将出现的一些重大趋势是什么?我真正感兴趣的趋势是,未来我们与计算机和软件交互的主要形式是什么?关于过去十年我的叙述
不是整整 20 年,而是 15 年,智能手机基本上已经吞噬了所有相邻技术。我不知道是否可以衡量,但目前有多少百分比的人机交互是通过智能手机上的触摸屏进行的?90%?99%?我实际上不知道。这取决于你的衡量方法等等。这并不意味着键盘……
和鼠标会消失。你知道,这是针对专业任务,而不是日常互动。而且
我认为这非常有趣,即使对于大型消费公司来说,也很难创造出更多能够真正达到规模的消费设备,因为智能手机在很多事情上都做得相当好,这实际上已经消除了其他所有东西的市场。现在,对话式界面有效地工作了,我认为我们可能已经通过 GPT-4 达到了这个拐点,尽管这本身就是一个有趣的辩论话题,
你现在可以与软件网络对话了。因此,就像多点触控意味着人们可以放弃他们的黑莓手机一样,多模式语音到语音模型、聊天(我认为已经达到了这一点)以及未来显然的视频的出现是否意味着我们将看到俗称的口袋里的消费设备以更有意义的方式发生转变?你对形状因素有什么假设吗?
由于智能手机的持久性,如果我必须选择的话,我认为智能手机将保留下来,但与 AirPods 和 CarPlay 等其他设备相结合,你将通过不同的模式与之进行交互。但是你口袋里的 Anker 超级计算机可能不会消失。但我并没有说我希望如此。我之所以提出这个问题,是因为有多少消费设备公司试图在智能手机旁边构建一些东西
非常合适。我认为智能手表可能算得上是成功,但它仍然远不及智能手机的市场。我认为这非常有趣。我还想知道,我不知道是哪一年,但当每个人都在柜台上安装 Alexa 时,那是几年前?——是的,我想说是 2015 年或 16 年左右。——2015 年,16 年。——是的。——是的。——这些会卷土重来吗?
你知道,这些会突然再次成为有效的计算机吗?它会使,你知道,智能耳机再次流行吗?然后我真正感兴趣的另一件事,我不知道是应该乐观还是悲观,那就是,我们会花更少的时间盯着屏幕看吗?显然,对话式人工智能能够通过语言和语音与我们交谈,以及我们能够通过语言和语音与计算机互动。
当然,理论上,这意味着你不需要一直把屏幕放在你面前。这是否意味着技术会更多地退居幕后,还是会添加到其他所有东西中?我希望产品设计师能够利用这一点。因此,许多需要我们盯着屏幕看的东西,……
有点像大量的推送通知,把我们吸了回去。AI 代理能否帮助我们综合其中的一些内容,这样我们就不会出现下意识地拿起它的反应?这可能是天真乐观的,但我只是希望,现在我们有了这些与计算机互动的新方法,而不仅仅是通过这一个设备和一个屏幕,
即使它是在技术上由该设备调解的,我也为此感到兴奋,因为我认为我们至少已经达到了这种体验的局部最大值。现在,你知道,想象一下……它还没有连接到你的大脑。是的,我知道人脑接口可能会很有趣。我对……
我最近举了这个例子,但如果你还记得应用商店里的第一个应用程序,它们就像手电筒之类的东西,是硬件功能的拟物化、字面解释。然后后代说,好吧,GPS、屏幕和互联网的融合是什么?你得到了像 WhatsApp、Uber、Instacart 和 DoorDash 这样真正有意义的东西。我的感觉是,现在与软件对话已经达到了有效性的事件视界,
会有我们依赖的计算体验的有意义的部分像对话优先一样吗?这是否意味着你可以用完全不同的方式使用它?你知道,你提到设备可能会更多地消失,但有两种消失方式。它不是最显眼的位置。你不会一直盯着它看。因此,你与之互动的方式发生了变化。第二部分是,如果事情变得非常对话式或个性化驱动,或者
或者其他什么,你日常互动中的人际互动比例会转移到计算机界面与人类之间吗?是的。因此,如果您不是与客户支持代表聊天,而是与代理聊天,那么可能还有其他类似的应用程序。我很好奇你如何看待随着时间的推移,人类时间中与其他人互动与与数字代理互动的时间比例
代理或其他东西?您是否认为这是一种朝着一个方向还是另一个方向的趋势?我会告诉你我希望世界成为的样子,如果你想的话,我们可以深入探讨悲观主义。我希望在这个人工智能的世界里,代理将成为我们个人生活中、商业生活中体验的有意义的一部分。有了这些代理,有了适当的防护措施和安全措施,
软件可以代表我们采取行动。通过这样做,它使我们不必做这些事情,并存在于我们生活的世界上。无论我们只拿一个代表公司的 CIRA 代理,也许你的个人代理正在与它聊天。
也许当你试图弄清楚这个问题时,你的代理正在代表你采取行动,你可以继续生活。我认为技术的目的是为我们解决问题。希望在人工智能和人工智能赋予的代理能力的世界中
技术可以消失并退居幕后。显然有一些例子,人们与化身交谈。有,你知道,元宇宙之类的东西。我认为这些是有意义的,当然人工智能会改变这些空间的深度和实质性。但我希望对大多数人来说,这是我们如何看待电子游戏等事物的一种演变。它们是一种有意义的娱乐形式。但是
你知道,你可以放下手机,你可以摘下 VR 眼镜,进行交谈,不必花费更多时间在电脑上戳按钮来让它做事情,让你的代理代表你做。这是一个很好的结束语。感谢您的谈话,布拉德。我很荣幸。谢谢。
在 Twitter 上关注我们 @NoPriorsPod。如果您想看到我们的脸,请订阅我们的 YouTube 频道。在 Apple Podcasts、Spotify 或您收听的任何地方关注该节目。这样你每周都会收到一集新剧集。并在 no-priors.com 上注册电子邮件或查找每集的文字记录。