We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

A Blueprint for Enterprise Agent Adoption

2025/1/31

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

AI Deep Dive Transcript

People

Swami Chandrasekaran

Topics

Swami Chandrasekaran: 企业对AI代理的关注度很高,虽然最近被其他AI技术短暂盖过,但依然是热门话题。企业AI代理的采用正处于早期阶段,虽然技术在不断进步,但可靠性和工具的成熟度仍有待提高。我提出了一个名为TACO的框架,将AI代理分为任务型、自动化型、协作型和编排型四种,它们的区别在于规划和协调的复杂程度。TACO框架并非严格的分类,而是提供一种思考AI代理类型和复杂性的方法,企业可以根据自身需求选择合适的代理类型。企业对AI代理的期望值很高,往往会直接跳到理想状态,而忽略了当前技术的局限性,这需要调整设计方法。企业准备采用AI代理需要考虑多个因素,包括明确目标、数据准备、专家知识、策略制定、技术选择和技能培养等。企业在构建AI代理时,可以选择自建、使用商业平台或直接购买现成产品,需要根据自身情况选择合适的方案。AI代理的采用可能既有自下而上的创新,也有自上而下的标准化,需要找到两者之间的平衡。企业需要考虑员工层面的AI代理采用,包括收集员工意见和解决员工担忧。个人AI代理和企业级AI代理的开发和应用存在差异,需要不同的技能和管理方式。企业级AI代理的采用需要谨慎,需要考虑安全、治理和风险管理等因素。企业应该积极尝试和实验AI代理,并与内部AI团队合作,建立标准化流程。

Deep Dive

Shownotes Transcript

AI 代理是 2025 年企业最大的主题之一,但采用情况如何? 在本次对话中,毕马威的 Swami Chandrasekaran 细分了在大型组织中实施代理的实际情况。从企业准备状态到 TACO(任务执行者、自动化程序、协作者、协调者)等框架,本次讨论涵盖了企业在规模化部署代理之前需要考虑的事项。

由以下机构提供: 毕马威 - 请访问 ⁠⁠⁠⁠⁠⁠⁠⁠⁠www.kpmg.us/ai⁠⁠⁠⁠⁠⁠⁠⁠⁠ 了解更多关于毕马威如何帮助您利用我们的 AI 解决方案创造价值的信息。 Vanta - 简化合规性 - ⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw Superintelligent 提供的代理准备情况审核 - 请访问 https://besuper.ai/ 以请求您公司的代理准备情况评分。 AI 每日简报可帮助您了解 AI 领域最重要的新闻和讨论。在您收听的任何地方订阅《AI 每日简报》播客版本:https://pod.link/1680633614 订阅时事通讯:https://aidailybrief.beehiiv.com/ 加入我们的 Discord:https://bit.ly/aibreakdown

<raw_text>0 在今天的 AI 每日简报中,我们将讨论企业 AI 采用的蓝图。AI 每日简报是一个关于 AI 领域最重要的新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的 Discord 链接。大家好。今天,我们再次进行一期略有不同的节目,但我对此非常兴奋。不可否认的是,今年对大多数企业来说最大的主题,或者至少是对大多数企业来说最令人兴奋的主题,是代理。

我对为什么我认为代理让企业以与以往不同的方式思考(甚至可能比某些通用人工智能助手类型的工具更甚)有很多理论。但在本次对话中,我邀请到了毕马威美国 AI 卓越中心负责人 Swami Chandrasekharan。

本次对话并非对代理进行一般性概述,而是关于企业代理采用或至少是测试的蓝图的第一部分。Swami 分享了他的 TACO 框架,该框架将不同类型的代理分解为任务执行者、自动化程序、协作者。

我们讨论了他观察到的企业尝试采用代理时最常见的挑战。最终,我们试图提供一些您可以作为企业采取的积极步骤,以推进您的代理战略。

我们当然没有完成整个代理战略蓝图。我们将不得不再次邀请 Swami 来继续讨论。正如您将看到的,Swami 绝对不是普通的顾问。他拥有深厚的技术背景,曾担任 IBM Watson 的执行架构师等职务。他拥有 30 多项专利,并撰写了多本关于应用 AI 的书籍和文章。因此,事不宜迟,让我们深入探讨这次对话。好的,Swami,欢迎来到 AI 每日简报。您好吗,先生?

Diego、Nathaniel,感谢你们的邀请。我是你们的节目的忠实粉丝。非常感谢。是的,我们只是在开玩笑。所以直到大约,我不知道,24、48 小时前,我们还在讨论 AI 最热门的话题。我认为在很短的一段时间内,这可能被 DeepSeek 和 R1 取代了。但总的来说,我认为关于代理的这场对话仍然是许多人思考的核心问题。

不过,在我们开始之前,我希望您能分享一些关于您日常工作的内容,以便为本次对话提供背景信息。

我住在达拉斯。我是毕马威的合伙人。我领导着公司的 AI 和数据实验室。这实际上意味着,作为我们正在运行的大型转型项目 AIQ(由 Steve Chase 领导)的一部分,AI 和数据实验室是一个相当重要的组成部分。我对 13 岁的孩子解释我的工作的方式是,我做三件事。

当我说是“我”的时候,指的是我和我的团队。我们做了很多实验。所以,说得不好听点,我们公司没有一个完整的研发部门。因此,我们围绕着今天不存在但明天会存在的事物进行大量的实验、创新和研发,无论是关于如何使用语言模型,还是如何构建高级 RAG 知识系统技术,甚至是代理框架,或者如何评估这些模型。

我做的第二部分是,帮助在公司内部建立 AI 技术、架构和模式的标准化。所以我们不会做五次同样的事情。第三部分是,鉴于我在毕马威咨询方面的经验,我与许多人合作,为我们的客户共同孵化新事物,以便我更接近客户并了解问题,这样我不会与我的工作脱节。

简而言之,我认为我在公司里拥有最好的工作,有很多乐趣,也有很多责任。

太棒了。所以准备工作很完美。我认为今天的对话很大一部分将关注代理的实际情况,了解您所处的位置,特别是相对于客户而言,这很有用。让我们从这个问题开始。当您想到 2025 年与代理相关的内容时,它们显然是一个关键主题。每个人都在关注它们。

但在企业中,特别是企业中,代理的采用情况究竟如何?我们处于哪个阶段?让我们从这里开始。我还有很多后续问题。是的,让我快速地设定一下背景,双关语,对吧,来了解网络代理。所以当大型语言模型出现时,我们开始通过提示与之交互,进行无根据的交互。我们喜欢它。

然后我们开始通过更长的提示、少样本提示等方式慢慢地引入更多上下文。然后,由于 Meta,我们有了检索增强生成的方法,我们说,看,为什么我不拦截提示并转到语料库,带回相关的片段,然后将其提供给模型?所以我们开始了解 RAG 的概念,或者我们在毕马威所说的知识辅助。但是,在这两种范例中,您仍然坐在那里输入提示。

你离开了,你在做这件事。你最终可能会进行长链式链接等等,但你仍然在输入提示。这就是行动。所以代理来了。整个概念是,我能让这些机器实现更大的目标吗?这些机器能否自己找出并规划并采取行动?无论是研究某个主题,还是根据我的 ERP 系统核对资产负债表,

它现在开始做事情了。所以从根本上来说,代理的构成在于您如何定义您的指令、表达为指令的目标、长格式提示、这些提示如何通过规划器被推理和理解为必须执行的任务。为了执行任务,我需要哪些工具来完成工作。然后还有一些东西,比如知识、记忆和

呃,上下文等等,所以从根本上来说,它不仅为大型语言模型提供了额外的工具,还赋予了它在目标或您试图实现的相邻目标的上下文中进行推理的能力。好的,Swami,您给出了一个很好的理论定义,如果您看看今天可能实现的目标,我一直在解释的所有事情都是可能的

使用 LangChain 和 LamaDex 等框架,您可以确定性地链接这些步骤。例如,如果我想核对资产负债表,我可能有两种分解函数。每个函数可能都有一个长格式指令。我用 Python 执行函数一,将该输出提供给第二个函数,我就可以实现了。这没有什么代理行为,因为您正在硬编码步骤。

真正的代理行为将是,例如,我表达资产负债表核对。我该怎么做?作为一个专家,我说资产负债表将包含以下字段。我在资产负债表输入中查找以下部分。然后我去 ERP 系统做某些事情。所以你表达的是人类专家会如何解释。现在的问题是,任何大型语言模型都能推理和理解你在说什么吗?

可能直到大约六个月前或更早之前,他们还不能。这对他们来说非常困难。在所有大型科技公司发布的语言模型的每一次迭代中,推理能力,更重要的是,更长的指令、更长的提示,它们开始做得相当好。即使您回到三年前或两三年前,这些更长的指令也是不可能实现的。现在您可以做到了。

所以您拥有的能力是更好的推理,更好地理解您通过这些长格式指令所说的内容,这些指令在过去是不可能的。那么这给我们留下了什么?所以您可以很好地理解指令,您可能可以将它们分解成任务。

现在的问题是,那些被分解的任务和用于这些任务的工具是否足够可靠?答案是,陪审团还在那里。就我们尝试和使用的工具和平台而言,陪审团还在那里。它需要一些指导。好吧,语言模型可以推理。将此转化为一组任务、计划、指令并执行这一行为。

它正在实现,它正在变得更好。但长话短说,我们今天可以做的是简单的代理。我想出了一个更简单的定义或更简单的四种方法来定义您可以使用的代理类型。首字母缩写词 TACO,任务执行者、自动化程序、协作者和协调者,这是多代理协调。

关于 TACO 的一件事是,人们区分了,我听说人们谈论过,哦,某些代理无法访问所有工具。我的观点是,在 TACO 框架中,所有四种类型的代理都将访问相同的知识语料库。它将访问代理创建操作所需的所有工具的广度和深度。它将访问内存。

您将访问相同的算法。所以这四个都是固定的。那么有什么不同呢?这四者之间的区别在于规划和协调。TACO 中的 T,任务执行者,它们的目标是单一的。一个目标,但可以分解成多个任务。它们可以被链接,易于管理,易于测试,易于推出。当您转向自动化程序时,这是下一个

它们通常会跨系统、跨应用程序。这些是端到端的流程。订单到现金、线索到现金、采购到付款、招聘到退休。它们涉及多个应用程序和多个系统。所以目标可能是相似的,这意味着确保简化订单到现金流程的执行,但它们会分解成子目标。

每个子目标都可能涉及不同的应用程序和不同的系统。因此,在它所做的范围方面,它变得有点复杂。规划变得复杂,协调变得复杂。在协调中,您必须管理状态以及所有这些事情。第三部分是协作者。我一直都在思考这个问题。所以存在这样一个概念,即人工智能能否用作队友,代理能否用作队友?

不再是您告诉代理做某事,然后它返回。你与它一起工作。这就像您每天与团队成员一起工作一样。所以它更偏向于人机协作,与机器合作完成任务。这在其他形式的代理中也存在,但在这里更为突出,它只是主要内置的。TACO 中的最后一部分 O 是多代理,其中我让代理调用其他代理,存在代理间协作。

当然,所有这些都会使复杂性增加。所以就像我之前说的,我们今天在哪里?我认为已经对任务执行者进行了大量的实验和原型设计。这将是固有的,因为有很多平台,包括开源商业平台,您可以快速构建它们。我们可以讨论一下。但我认为在代理之年,如果 25 天,我会看到更多任务执行者。这是我的预测。

您认为,在没有任何特定组织的背景下规定一条正确的道路显然非常危险。但是您是否认为该 TACO 框架实际上是四个单独的类别,还是它们之间存在某种线性关系,因为您在考虑采用时,如果您在一个企业中,从任务执行者开始然后转向下一个是有意义的,或者,您是如何考虑这个问题的?

是的,我不希望这是一个人为的框架,我们将所有东西都改造到这四个类别中。该框架是为了一个心智模型、心智图景而设计的。看,我该如何分解代理?不是所有东西。因为这样做的原因是,每个人都跳进了多代理协调,甚至没有考虑基础知识。所以这是第一点。第二点是,当您与客户交谈时,他们很可能会谈论一些场景,这些场景不仅会重叠,

而且很可能需要他们关注,首先是,好吧,让我做端到端流程自动化程序,因为这就是我需要的。我想简化我的门店绩效管理,或者我想简化我的采购到付款流程。或者当您转向另一个客户时,您可能会说,看,我更关注增强我的员工潜力,所以给我一个可以作为我的 AP、AR、ERP 财务流程队友的 AI 代理。

所以,是的,将事物放入桶中是危险的,但这并不是重点。重点是消除整个代理系统的奥秘以及复杂性是如何产生的。如果您开始合并和组合,那没关系。但至少您了解了各个反馈。

是的,这很有趣。你知道,我认为让代理采用变得引人入胜的一件事是,与例如过去几年的更广泛的通用人工智能采用相比,企业相对于之前的技术变化而言,移动速度非常快。

来抓住通用人工智能并试图利用它。现在,显然还有很多组织落后,感觉落后,很少有组织。我认为我们倾向于发现,最领先的组织

也最清楚他们在采用方面还有多少事情要做。所以这并不是说他们已经处于最终状态,或者任何类似的情况。但我确实认为,因为他们已经关注代理一段时间了,他们可能对他们最终如何使用代理、让他们最兴奋的可能性有更强的了解。

我认为这可能导致您所看到的一些情况。他们跳到了他们希望从代理的理想状态中获得的东西。他们甚至想象到了技术所处位置的前面,而不是仅仅追赶它现在能做什么,这可能会根据目前实际准备就绪的东西和尚未准备就绪的东西而产生挑战。

是的,每个人都对这个代理应该为他们做什么抱有期望和想法。如果您查看客户服务和营销职能,他们会说,我的代理版本是,我能为软件开发或销售开发代表创建一个客户的数字版本吗?

它可以与客户交谈,可以提出问题,可以帮助完成销售并获得佣金等等。所以他们开始将其视为合成员工。您进入企业,进入中后台职能部门。他们从流程的角度思考。我作为更大采购到付款端到端流程的一部分,接收、审查、批准或拒绝发票的方式是特定的。

所以我对代理应该如何运作有一个概念。它不是一刀切的,就像你说的那样,但与此同时,关键责任是,当你谈论它们时,你并不是试图采用现有技术并进行改造,然后说,哦,我有代理。例如,我的一个信念是良好的旧业务流程工程,就像您坐下来为端到端流程设计业务流程一样。

它采取了一种特殊的方法。流程工程出现,您说,分解您的领域,将其分解为一级到 N 级,可以达到七级或八级,在那里您可以对流程的外观有一个巨大的泳道视图。这就是我们表示流程的方式。这不是机器思考的方式。现在有了推理能力,我可以将同样的事情几乎表达成一个长格式指令。您可以将其留给机器来说,看,你去定义流程,执行所需步骤。

来执行它。所以我们也改变了我们设计代理的方法,这也是必不可少的和重要的。结果是一样的。我想要一个更好、更高效、更精简的流程。但你的方法不同。所以重点是,代理的切入点是不同的。它们最终会在某个时间点融合,但鉴于我们目前所处的阶段,

期望值广泛存在。

集中式安全工作流程,完成问卷的速度提高了 5 倍,并主动管理供应商风险。Vanta 可以通过将您与审计员和专家联系起来以快速进行审计并建立您的安全程序来帮助您启动或扩展您的安全程序。此外,Vanta 在整个平台中都使用了自动化和人工智能,为您节省了时间,让您可以专注于公司建设。加入超过 9,000 家全球公司,例如 Atlassian、Quora 和 Factory,他们使用 Vanta 来实时管理风险并证明安全性。

在有限的时间内,该受众可以获得 Vanta 的 1,000 美元折扣,网址为 vanta.com/nlw。即 v-a-n-t-a.com/nlw,可享受 1,000 美元的折扣。如果 2025 年 AI 有一个明确的事情,那就是代理即将到来。按行业划分的垂直代理、水平代理平台。

每个职能的代理。如果您经营一家大型企业,您明年将尝试使用代理。鉴于这有多新,我们所有人都会回到试点模式。

这就是 Superintelligent 在今年年初提供新产品的原因。这是一个代理准备情况和机会审核。在短短几周内,我们会深入研究您的团队,了解哪些类型的代理适合您进行测试,您需要哪些类型的基础设施支持才能做好准备,并最终获得一套可操作的建议,让您准备好弄清楚代理如何改变您的业务。

如果您对代理准备情况和机会审核感兴趣,请直接与我联系,[email protected]。在主题行中输入“代理”一词,以便我知道您在谈论什么。让我们让您成为 AI 市场最具活力部分的领导者。您好,AI 每日简报听众。快速休息一下,分享毕马威最新 AI 季度脉搏调查的一些非常有趣的发现。

您是否知道,67% 的业务领导者预计人工智能将在未来两年内从根本上改变他们的业务?然而,并非一切顺利。他们面临的最大挑战包括数据质量、风险管理和员工采用等问题。毕马威正走在帮助组织克服这些障碍的最前沿。他们不仅仅是在谈论人工智能,他们正在领导这项工作,提供切实可行的解决方案和实际应用。

例如,超过一半的受访组织正在探索使用 AI 代理来处理行政事务和呼叫中心运营等任务。因此,如果您希望在 AI 领域保持领先地位,请关注毕马威。他们不仅仅是对话的一部分,他们正在帮助塑造对话。了解毕马威如何在 kpmg.com/US 推动 AI 创新。您在为人们提供建议时会考虑什么?

或者只是广泛地考虑这个问题,您正在考虑企业中的代理准备情况,那么一些需要考虑的支柱是什么?数据有多重要?政策有多重要?正如您刚才阐述的那样,了解目标有多重要?代理准备情况的一些关键支柱是什么?是的,您已经说出了我本来要说的三件事。首先,为什么是代理?我从这个问题开始。

其基本原理是什么,其动机是什么?所以首先定义,不要先谈论名为代理的技术。您总是试图解决什么问题?所以如果我是一个客户,如果他们是一家零售商,他们会说,你知道吗,我希望我的门店,我的实体门店的销售额有更好的增长。

好的,你们现在在做什么?他们说,好的,我们有这些东西,但是门店,销售额会受到影响,因为某些门店不遵守某些政策和程序,他们没有考虑客户满意度或客户评论以及所有这些事情。好的,然后我们说,好的,目标是采用更好、更切线的方法来进行门店绩效分析

这样您就可以提高绩效并增加您的销售额和奖励。所以第一点是您想做什么,代理是否是正确的答案?所以让我们假设您已经走上了这条道路,说,看,我想优化我的流程,同时重新构想我的流程,优化我的人力资源。然后您谈论,好的,数据来自哪里?您有数据吗?您可以访问所有数据吗?首先,如果您必须将其数字化,您是否已经对数据进行了检测?

并且该数据是否已制作,是否干净,以及关于数据可用性和准备情况的所有优点。第三点是,我认为您没有在列表中提到,Nathaniel,那就是谁是能够阐明今天正在发生的事情以及需要改变什么的人类专家?我们该如何获取这些知识?

您选择一个领域,选择任何密集型领域,即使是像客户服务这样简单的事情,从客户提出退款请求的那一刻起,您会做什么?您遵循的流程是什么,以及从那时起如何使用代理概念重新构想?

所以仍然需要人类专业知识来阐明。我的意思是,有一些理论在流传。我可以进行模拟吗?我可以查看人类的行为并从中学习吗?是的,您可以,但它们还不完全可靠。所以为什么是代理,数据,人类专业知识,阐明整个思维过程以及如何构建代理?

然后进入政策三件红事。好的,您想要什么?您想赋予这些事物多少自主权?这并不是一个,它可能处于非常广泛的原则层面,说,看,我不希望任何具有财务影响的决策在没有人工参与的情况下获得批准。也许我希望人工参与三个步骤或三个阶段。

所以围绕如何引入人类有一个完整的策略。您在哪里引入它们?监督的级别是什么?代理的等效终止开关是什么样的?如果您想停止代理一天,该怎么办?如果这些代理开始不起作用,您的后备机制是什么?所以所有这些政策、信任、安全、可靠性方面是一个大桶。

第四个重要的市场是每个人,这是一个我与客户一起看到的非常有争议的话题,那就是您将如何构建代理?好的,一切顺利。您获得了数据,您获得了专家,您获得了政策,您知道如何构建它们。您将去哪里构建它们?所以今天,有很多开源框架,大型科技公司、小型科技公司、初创公司,它们都是开放的。

他们都有自己的平台。那么您去哪里标准化和构建呢?同样,我的想法是,直到整个事情稳定下来,您可能必须保持多语言,选择一些选择,非常有主见,然后去构建和尝试它们。有些会起作用,有些不会。所以您必须准备好进行整合和合并。那么您将使用的工具技术基础设施是什么?我甚至没有使用大型语言模型,因为大型语言模型,我认为它们会变得很棒。

它们已经很棒了,它们会继续变得很棒。最后一点是关于技能。您是否有构建此项的技能?还有一件事,好的,您有技能。构建代理是一回事。第二天及以后的操作是完全不同的事情。您将如何维持?所以我们谈到了模型漂移和数据漂移。现在出现了代理漂移。有什么保证代理不会漂移?它会偏离其构建的目的。您如何保留它们或保留它们?

数据是否正在改变?您为强化提供了多好的反馈?所有这些都出现在第二天及以后的操作中。所以在我看来,我认为这些是我会考虑的类别。

您是否拥有,我认为这是一个非常有用的框架。您认为人们,您看到人们的第一次体验有多少是他们自己使用这些通用框架之一进行的,而不是尝试更现成的产品?我的意思是,这个问题只在最近几个月才出现,因为越来越多的现成产品可用,但是,您知道,与客户服务代理一起工作,或者这是否与您正在考虑使用的代理类别有关?

是的,所以如果您仔细研究您在哪里构建代理,我认为它会细分为三个子问题或子领域。您将使用开源构建自己的代理吗?您将选择一个商业平台,例如 Copilot Studio 或 AgentSpace 吗?第三个选项是您将购买代理吗?所以你去 Agent Force 会说,好的,我已经有一个销售教练代理了。您只需购买、配置和使用它即可。

体验每月都在变化。我们今天拥有的与六个月前拥有的不同。再说一次,还有一个。我查看整个代理工具空间的方式是,存在低代码工具,例如 Copilot Studios 和那些工具。然后在最右边,您有专业代码工具,例如 Langar 应用程序、Crew AI 和 Autogens 等。然后在中间,我称它们为中代码工具。

您可以来回切换。这意味着我可以编写代码,我可以编写 GUI,拖放,所以我可以同时做这两件事。最初,人们倾向于使用专业代码选项,他们意识到,虽然它为他们提供了很大的灵活性,但他们最终必须自己构建很多东西。所以有很多代码行需要编写、维护和管理。除非您有一个协调良好的工程团队、开发团队,否则脆弱性就会开始出现。您最终可能会重新创建相同的东西

例如,相同的工具做同样的事情可能会被多次重新创建。所以存在这种风险......你需要拥有一套特殊的技能和能力才能自己进行编码。现在,如果你转向低代码,我的意思是,我可以很快、很容易地开始。但我看到了一些障碍,他们说,哦,我想做这个 Excel 事情。

我代理中一个步骤的比较,我无法进行非常深入的 Excel 分析,因为我的 Excel 包含多个复杂的单元格、行和标题,例如。就像我说的,这就是为什么需要整个多语言方法。就像你需要首先决定

我的代理架构将是什么样的?作为企业,我需要哪些工具?让我们制定一个策略,以可重用的方式构建这些工具。然后,无论我在我的专业代码中还是在我的本地构建我的代理,它们都可以访问同一套工具。因此,让我们更关注在相同的指导方针、原则和安全性的前提下完成任务。如果你准备好从第二天开始维护这些代理,你就可以做出选择。

所以我认为陪审团还在那里,就目前而言,没有一个平台拥有你所需的一切。如果你拥有某些东西,那么就会有一些它无法提供给你,或者你遇到的摩擦点。我不知道我是否会一开始就正确地表达这个问题,但是对于现在的生成式 AI,某种程度上是非代理的生成式 AI,大型语言模型和辅助副驾驶式工具,

很多采用正在发生,至少是由企业中负责思考 AI 转型的某个中心机构进行调解的,对吧?所以也许这是一个重新利用的创新团队,它触及所有业务线、所有后台职能以及所有那些只是了解每个人的不同利益相关者并成为不同用例和不同工具等的渠道的事情。所以它是自上而下的,不是以一种激进的方式,而是一种......

你知道,仍然像通过一个中央实体一样。你认为代理的采用会反映这种模式吗?它会来自分析所有不同选择的中央团队吗?还是会更自下而上一些,即某个特定部门、某个特定业务线或某个特定领域正在尝试对他们来说直接且有目的的东西?

你无法阻止草根创新。这就是现实。人们将继续创新并提出新的方法,因为我所担任的角色,我属于那个中央组织。所以公开声明,对吧?我正以坐在那个部分、那个世界的角度提供我的观点。我相信帮助标准化方法、技术、平台,包括你在构建代理时所包含的安全措施,

将极大地帮助各部门和不同业务部门的人们将时间和精力投入到构建中。我看到很多时间和精力都花在了尝试构建自己的代理平台或尝试制作自己的代理平台上。这就像说,我试图构建我自己的,我试图构建一辆汽车,但我公司有四个团队,每个团队都在构建自己的供应链或装配线。为什么要尝试这样做呢?

我们为什么不构建一个好的高效的 Model T、丰田、特斯拉,你选择最好的供应链来组装生产线,包括为其提供动力的供应链。你专注于设计 Model 3 或丰田 Camry 或你最喜欢的任何汽车。因此,标准化,给他们

平台并提供指导方针,让他们专注于困难的部分。困难的部分,就像我之前说的,引出日常工作的知识并将其转化为代理。这需要时间,这是一项重要的工作。如果每个人都专注于,我也要构建平台,我也要构建代理,那么谁来做这件事呢?

所以听起来有点两者兼而有之。从基础设施的角度来看,某些功能与整个组织或至少跨职能的讨论相关,而各个单元或组实际上需要和理解的目的也很明确。是的,是的。另一个观察数据点是,我们已经发现各个团队的时间非常紧张,这意味着他们没有太多时间去

研发、选择平台、评估平台、评估选择。我对代理进行什么样的评估?这个与另一个相比。他们已经有事情要做和构建了。因此,尽量减少这些工作,并让中央团队提供指导。让我从部门或职能或组级别再深入一层。

你在多大程度上考虑个人级别、员工级别的采用以及其中的挑战,无论是获取员工对哪些任务实际上适合自动化或他们希望获得代理支持的哪些事情的看法,还是员工对替代等问题的态度和担忧?当公司进入这个领域时,你看到有多少这样的讨论?

一方面,例如,毕马威的 Microsoft M365 副驾驶向我们美国的所有员工提供服务,例如,联邦政府除外。因此,他们可以访问所有工具,可以创建所谓的个人副驾驶,你可以将其指向你自己的 SharePoint 语料库并开始与之交互。因此,他们今天可以在几秒钟内完成这项工作。所以有这种级别的

大型科技公司如微软提供的功能,并提供给大型公司。现实情况是,它们是可用的。它们就在那里。接下来的发展是,他们还将说,好吧,你可以构建你自己的代理来自动化你的日常任务。所以有一种理论来自大型科技公司,他们希望推动工具以获得更多采用、更好的采用,他们说,看,你可以自己构建辅助代理,这将很容易。我的看法是,看,

嗯,这在纸面上都很好,但想象一下,你将拥有成千上万个这样的代理遍布各地。代理将采取的行动,我们必须仔细管理它们。你不想开始做那些会泄露你的知识产权、泄露你的知识、泄露你的数据、让你面临风险的事情......

所以一个工具是构建者。代理的构建者必须是某种类型的人,他们不仅要经过技能培训和其他事情,还要了解以特定方式构建代理的含义。因此,你将开始看到仅限于我作为工作所做的个人代理。所以今天在我的电脑上,我可以有一个 shell 脚本可以做一些事情,这些事情仅限于我自己的特定环境中发生的事情。

我认为,企业级代理将走一条由经历过一定程度的资历和步骤的人员构建的道路,如果我可以这么说的话。我认为两者都不会停止。

你是否会在某个时刻看到它们的融合,公司开始?我的意思是,关于生成式 AI 本身的一个引人入胜的事情是,这是影子 IT 第一次成为一个问题,同时也是一个创新领域,他们正在积极尝试理解它,以便他们可以潜在地引入,对吧?就像你想了解人们使用他们的个人 Gmail 注册的原因,不仅是因为你希望他们不要在没有你知情的情况下将重要的公司数据放在这些平台上,

而且还因为你可能想要采用这些。鉴于在代理的个人助理方面存在多少竞争,对吧?我们在 Operator 发布几天后录制这段内容。我可以看到一种融合,企业开始尝试自上而下地采用代理,或者至少是以单位为单位、组为组、功能为功能的方式。同时,员工正在引入已经开始自动化他们自己个人流程的助手。是的。

自从 Operator 发布以来,让我们以它为例。当 Operator 可能对每个人都可用时,我可以构建一个 Operator,我可以将其用于我的,例如,我的周末计划或我的日历,假设我可以登录到 Outlook 网页版,查看我的日历并查看重叠的会议,并告诉我哪些会议我应该考虑取消,例如。

但这正是我在释放一个 Operator,并在我的个人环境空间中释放一个 Operator,假设有 10 个人发现它并说这是 Operator 的一个非常好的用途,这是一个非常好的个人代理,你可以与我分享它,所以我想说的重点是个人代理的共享范围将受到限制

如果你保持这种方式,它就不会渗透到整个企业。它仍然是在批准的平台上构建的。这不像有人擅自在一个未经批准的平台上构建了自己的代理。我仍然在谈论经过批准的平台,但它是个人构建的,但共享范围是有限的。我预见到一个世界,你将看到有机创新正在发生,有人会破解

这个难题,哦,这是 Operator 或代理或副驾驶等的最佳创新用途,我认为应该在企业级别提供,以通过该级别,你必须通过测试、评估、安全和其他事项的阶段门,以便你拥有适当的治理,因为对于企业而言,我认为它们与推出产品没有什么不同,它们正在你的企业中推出产品,你不会只是

在不知道它在你的工作场所做什么的情况下随意推出。所以我认为,我进入这个领域时有一些想法,我想做什么,但现在已经清楚的是,我认为这一集将能够成立,我将把它定义为一个,

几乎像一个代理就绪清单,但我认为我们只完成了第一部分。我的建议是,也许可以做一个总结性的问题,但我们应该在下个月回来,做一个第二部分,在那里我们可以深入探讨一些关于用例等更具体的细节。我想在我们到达那里之前,如果你对下个月有一个一般的建议,你将不会与这些听众交谈,因为他们正在考虑在他们的公司采用代理。

你鼓励他们避免、尝试或仅仅将其设置为其框架的一部分以最大限度地提高他们今年考虑采用代理的方式是什么?是的,一件事情总是很难,但我们会尝试。我强烈鼓励的一件事是不要停止实验。我的意思是,你必须这样做。只有这样,你才能理解正在发生的事情。

A Blueprint for Enterprise Agent Adoption 40:46 Share

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

Deep Dive

Shownotes Transcript

A Blueprint for Enterprise Agent Adoption