We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

EP 395: AI Agents - Everything you need to know

2024/11/5

Everyday AI Podcast – An AI and ChatGPT Podcast

AI Deep Dive AI Chapters Transcript

People

Jordan

一位在摄影技术和设备方面有深入了解的播客主持人和摄影专家。

Topics

Jordan: 本期节目探讨了AI代理的定义、功能、发展历程以及在各个领域的应用。AI代理技术已经从科幻走向现实，并被广泛应用于各个大型企业。AI代理可以分为手动触发、自主运行和半自主运行三种类型，其核心功能包括大型语言模型支持、工具交互、自主规划、记忆能力、任务执行能力和学习适应能力。大型科技公司如微软、Salesforce和OpenAI都在大力发展AI代理技术，并推出了相应的工具和平台，例如微软Copilot Studio和Salesforce Agent Force。AI代理技术具有巨大的潜力，可以提高生产力、节省成本并创造新的商业机会，但也存在伦理和安全方面的挑战，需要谨慎对待。未来，AI代理技术将对工作方式产生深远的影响，人类需要适应新的工作模式，并注重创造性和战略性思维的发展。

Deep Dive

Chapters

Introduction to AI agents, their recent surge in popularity, and the different types of AI agents.

AI agents are not science fiction; they are here and available.
There are three types of AI agents: manual, autonomous, and semi-autonomous.

Shownotes Transcript

这是每日AI节目，一个简化AI并将其力量带到您指尖的每日播客。每天收听，获取实用的建议，以提升您的职业、事业和日常生活。想象一下，数百万由AI驱动的代理人自主地完成工作，无需人工干预，由大型语言模型驱动，完成许多我们讨厌的重复性、繁琐的任务。

这并非什么未来景象。现在就可以实现。我认为，尤其是在过去一周，AI代理人一直是热门话题。因此，今天我们将讨论AI代理人，它们是什么以及为什么每个人突然都在谈论并努力实施AI代理人。好了，在我们开始之前，先听一下我们微软合作伙伴的简短介绍。

那么，为什么您应该收听微软的工作场所播客？因为它是为那些知道必须适应才能保持领先地位的领导者准备的。工作实验室是寻找现实世界经验教训和可行见解的地方，以指导您和您的组织完成您的AI转型。

这就是W O R K L A B。没有空格，可在您收听播客的任何地方获得，感谢微软。让我们回到正题。我很期待这一期。您知道是谁吗？是乔丹，这是每日AI节目。如果您是新来的，欢迎加入我们。如果您正在收听播客，许多人都是，请务必查看节目说明。

节目说明中会有一个链接，点击即可访问我们的网站your-everyday-ai.com。该网站包含数百集、数小时的AI相关内容。所有内容免费提供，让您像免费的AI大学一样学习。本节目专为每天使用AI的人们而设，包括直播、播客和免费每日新闻通讯。

我直接进入AI代理人，您知道吗？我要从这里开始，因为这在一年以前是什么时候？是的，在2023年末，我发布了2024年24个大胆的AI预测，对吧？我想这可能是在11月。

所以，大约十个月前，我声称2024年会发生的事情之一，这些都是，坦率地说，非常大胆和疯狂的预测。奇怪的是，其中许多都实现了。当我发布这些预测时，很多人不同意我的观点，但我确实在6月份做了一个中期节目。

奇怪的是，几乎所有预测要么已经实现，要么正在按计划实现，而其中一项预测尚未完全实现。正如我在2024年所说，我们可能会看到比人类更多的AI代理人。现在是2024年9月，过去一周对AI代理人来说绝对是疯狂的一周。

就像世界上所有大型、万亿美元的公司聚集在一起，说：“好了，让我们开始吧，三，二，一，开始！”然后每个人都出去宣布、推动、突出或更新和改进他们的代理功能。因此，在今天的节目中，我们将讨论一些基础知识，我还想听听您的意见，所以我想听听我们的直播观众对代理人的问题。所以，所有加入我们的人，比如科比、迈克尔、安塔纳斯和马里奥，还有所有其他听众。

感谢您的加入。您有什么问题？但还有播客听众，我总是把我的个人链接、电子邮件和节目说明中的链接放在一起。

所以，请务必查看。联系我，告诉我您对AI代理人的问题。但有一件事我想先谈谈，因为我们今天将讨论这个问题，那就是有不同类型的AI代理人。所以，有些AI代理人需要手动触发，对吧？

所以我可以坐在这里，基本上点击一个按钮，让那个AI代理人执行一系列任务，对吧？所以有手动AI代理人，有自主AI代理人。所以这些AI代理人基本上全天候运行。

然后介于两者之间的是一些半自主代理人。我是在创造这个术语吗？是的，我正在创造这三个分类。

如果您在谷歌搜索，可能找不到太多信息，但我认为我们必须将它们分成这三个不同的类别。在我们讨论中间的半自主代理人时，请记住这一点。这可能是由工作流程触发的，也可能是由客户查询触发的。

也可能是计划要发生的事情，对吧？所以有三种不同的类型。一种是人为触发的，一种是完全自主的，全天候运行，还有一种可能是由事件、Web钩子、客户查询或Zapier等工具触发的。

在我们讨论AI代理人世界正在发生的一切时，请记住这一点。让我们从概述开始，因为AI代理人不再是科幻小说，它们也不再是新事物。我们将稍后讨论时间。

但您知道，代理人实际上已经讨论了十多年了，对吧？但只是由于最近在生成式AI和大型语言模型方面的进步，才将AI代理人推向了讨论的中心，并渗透到每家主要公司。美国和世界最大的公司都强调了他们对AI代理人的投资。

这不再是像两年前那样边缘化的讨论话题，对吧？您必须是大型语言模型或生成式AI或像我这样的OpenAI专家，才能真正积极地讨论AI代理人。但现在不是这样了。

普通美国人，尤其是美国人，您可能已经在这周听到过关于它们的信息，我们将讨论一些新闻。

如果没有，您很快就会听到关于AI代理人的信息。我认为设定这个基础很重要。还有另一件事，正如我所说，它们不再是科幻小说。

它们甚至不再是概念。它们就在这里，它们是真实的，它们是可用的，还有另一件事。这就是为什么它们既是无代码的，又是低代码的。因此，即使您想在组织中部署这些代理人，也不需要一支软件开发人员大军。

如果您有人能够理解人类语言并使用键盘和鼠标，那就足够了，您可以连接AI代理人，无论它们是半自主的、自主的还是手动触发的。如果您有人能够与AI系统沟通并点击按钮，您今天就可以开始在您的组织中部署这些代理人。正如我所说，我认为这具有成为非常强大和令人兴奋的潜力的，这可以为已经使用AI代理人的大型公司带来数十亿美元的实际节省。例如，我相信亚马逊每年在研发方面的支出接近数百亿美元。因此，当您谈论为公司节省数十亿美元的潜力时，这并非高概率事件。

实际上正在发生的事情。但您知道，生产力，当然会飙升，当您考虑重复进行的手动测试，然后说：“嘿，为什么不训练一个代理人来完成其中80%的工作呢？”尽管今天可以做到，对吧？因此，在生产力、业务增长和新机会方面，前景广阔。但当然也有缺点，对吧？令人清醒的现实。

你们，我从未喜欢过你们在每日AI节目中听到的虚假叙述，因为当我们说“AI不会取代您的工作”时，这就像一个安全毯。有人使用AI，这会发生，因为使用AI的人，尤其是如果他们使用AI代理人，理论上，一个人的工作可以完成两到三到十到二十到三十个人的工作，对吧？因此，当我们谈论AI代理人的安全性和伦理方面时，当然存在巨大的挑战和陷阱。

所以它们既令人恐惧又令人兴奋，同时也是如此。但这就是我认为现在是进行此对话的正确时机。

所以让我们直接进入正题。我想谈谈一些最新的突破，以及为什么现在尤其重要。对吧？自从我开始每天AI节目，一年半多以前，我就一直在思考这个问题。

AI，您知道，超过一年半以前。但我认为现在是正确的时间，因为在过去十天里，控制我们工作方式的三家最大或最重要的公司都全力投入AI代理人。让我们谈谈一些。

首先是微软，对吧？我们昨天谈到了一个专门的节目。所以，如果您没有观看那个节目，请务必观看。

所以我们谈到了微软Copilot的Copilot浪潮，所以微软Copilot浪潮的一部分是谈论微软Copilot Studio。它基本上是一个拖放式AI代理构建器。这些是可定制的代理人，用于微软Copilot 365。

它们能够自动化跨应用程序的复杂工作流程。这里最重要的一点是，因为这都与您公司的信息有关。它是否能够与动态信息一起工作，对吧？因为如果代理人很愚蠢或很慢，或者它无法访问您公司的信息，那有什么用，对吧？这就是为什么我想从微软开始讨论，因为它正在推出。我相信它应该在2024年9月底之前可用。

因此，拥有个性化业务交互的上下文记忆对于个性化业务交互至关重要，对吧？我认为这是过去两年中代理人承诺和承诺之间出现差距的原因之一。当它与大型语言模型结合起来，并在生产中看到它们时，它具有这种能力。首先，它在技术上是否可行，对吧？两年前这非常困难，对吧？您必须有一堆专家，对吧？比我更懂的人。

您必须做很多繁琐的工作才能让它发挥作用，现在有了工具，就像微软Copilot Studio一样，无代码和低代码的能力。这意味着，您可以输入一些内容，让AI帮助您构建AI代理人。您可能需要点击几个按钮来连接您的数据库，对吧？

所以，也许从SharePoint、OneDrive或其他微软365产品开始。但此时，您可以与外部工具、内部工具和实时数据源集成。这一点不容忽视，对吧？我认为微软的浪潮公告取得了不错的效果。

但我认为第二波公告实际上弥合了差距，我认为从Copilot最初的宣传到我们今天所处的位置，我认为第二波公告真正弥合了差距。这些东西正在带来大型语言模型的结合，这些模型可以通过AI代理人完成自主工作，并利用实时数据，对吧？这并非唯一重要的事情，对吧？这一点非常重要。

Salesforce，是的，实际上本周是Salesforce Dreamforce大会，我们看到Salesforce首席执行官基本上说：“嘿，我们几十年来一直是CRM公司。我们正在努力转型。我们现在是一家由AI驱动的代理公司。”

他说的，不是我说的。因此，您必须查看他们名为Agent Force的新产品。我们将稍后详细介绍。但您知道，Salesforce是世界上最大的公司之一，对吧？领先的技术公司之一。

如果您是一家大型企业组织，最终向客户、客户或其他企业销售产品，对吧？无论您是B2B还是B2C，都有很大概率您正在使用Salesforce，对吧？无论您是否在销售团队中，都有很大概率您会花大量时间在Salesforce中查看所有这些数据，以帮助您更好地管理客户关系。

因此，Agent Force是自主的销售、客户服务和营销代理人，具有Salesforce CRM和数据云的深度集成，以及Salesforce的低代码和几乎无代码环境，可快速部署。还有另一件事，协作，对吧？对于Salesforce来说，这一点非常重要。我想谈论的第三个方面是OpenAI。

当然，OpenAI并非像微软和Salesforce那样，几十年来一直主导着技术领域。但我认为他们实际上是世界上最重要的公司之一。原因如下：我刚才提到的，例如，微软由OpenAI GPT-4提供支持。另一家我们每天可能都会使用的公司，对吧？如果您是美国人，您每天可能都在使用微软Windows，或者您每天都在使用苹果或Mac。

您知道吗？苹果和Mac都将由OpenAI GPT-4提供支持，对吧？苹果智能，是的，他们有自己的小型语言模型来处理某些查询，在本地处理，但对于其他查询，他们会将您发送到OpenAI GPT-4。我们已经听到过微软的意愿，他们愿意整合OpenAI最新的模型，OpenAI的O-1。

所以有GPT系列模型，对吧？然后有推理系列模型，也就是O-1，对吧？但有许多公司，正如我提到的，微软和苹果实际上都在使用OpenAI技术，但我敢说有成千上万甚至数十万家公司，您可能经常使用它们，对吧？您可能没有使用数十万家，但有成千上万家公司，我们每天都在使用。

所以，如果您使用的是，您认为您可能正在使用，哦，这个由AI驱动的房地产应用程序，您知道吗？他们正在使用GPT-4，对吧？所以我们也必须关注OpenAI在AI代理人或由AI驱动的代理人领域所做的事情。

我认为我们必须关注他们最近的模型，这个草莓、Q星O-1，对吧？所以，上周OpenAI发布了O-1预览版和O-1模型。这些又是新系列的模型，对吧？我们甚至还没有接触到他们最强大的模型，也就是他们的最强大的推理模型O-1。所以我们基本上有O-1预览版和O-1模型，但这是一个能够推理的代理模型，它能够在幕后思考。

这正是能够将代理工作流程带入我们每天依赖的成千上万的软件和服务的关键方面。所以，正如我所说，例如，微软有他们的新Copilot Studio代理人。Salesforce全力投入Agent Force，对吧？这并非昙花一现的趋势。

我们可能会在每个大型软件中看到这一点。您可能会看到代理功能，并且很有可能它们是由OpenAI支持的。所以，嘿，这是几小时前发布的，Sam Altman的精彩演讲，在目标3上取得了令人难以置信的超额完成，尽管它花了很长时间，然后他链接到OpenAI技术目标博客文章，这就是目标3的内容：构建具有有用自然语言理解能力的代理人。

我将快速阅读。我们计划构建一个能够执行由语言指定的复杂任务的代理人，如果任务不明确，则要求澄清任务。今天，有希望的算法用于监督语言任务，例如问答、句法分析和机器翻译。但对于更高级的语言目标，例如进行对话、完全理解文档以及遵循自然语言的复杂指令，还没有。我们预计将开发新的学习算法和范式来解决这些问题。

所以，这个山姆·阿尔特曼刚刚分享的博文，虽然是旧博文，但他明显暗示，通过OpenAI的模型，他们基本上已经超越了这个目标，对吧？他们说过，我们希望开发新的算法和范式来解决这些问题，也就是让AI代理能够理解文档并按照自然语言执行复杂指令。所以，我们稍后会更多地谈论OpenAI的模型，各位直播间的观众，如果你们的问题还没被问到，请尽力提出。现在我要处理这些问题了，对吧？

让我们谈谈AI代理的构成要素，对吧？AI代理到底是什么？我想要从最近的一些例子开始，因为实际上，从微软、Salesforce到OpenAI，所有这些事情都发生在短短几天内，对吧？

这可能是行业发展的一个巧合。但我认为我们也必须谈谈AI代理的构成要素，对吧？各位，这是中年人的话题。这是AI代理的六个核心功能。

还有其他定义AI代理的清单，对吧？因为它听起来就像一个流行语，对吧？就像公司以前想用AI或生成式AI或大型语言模型一样，他们试图在财报电话会议上尽可能快地抛出这些流行词。

现在，你们会听到关于AI代理的相同预测错误。那么，AI代理和大型语言模型有什么区别呢？嗯，首先，随着大型语言模型功能的增加，两者之间的界限可能会变得模糊。

但我认为，这里有六个核心功能，它们构成了AI代理。所以，你们需要检查所有这些框，对吧？首先，它需要由大型语言模型提供支持，这使得它能够进行自然语言处理。

这意味着普通用户需要能够用简单的英语或他们使用的任何语言与AI代理交谈或输入文字。它需要能够理解人类语言。这是第一点。

如果你需要在前端编写Python代码才能让某些事情发生，在我看来，那不是AI代理。它可以是一个代理，当然，对吧？但不是我定义的。

它需要由大型语言模型提供支持。它需要有自然语言处理能力，需要理解人类。第二点，它需要能够与工具交互。它需要能够使用外部工具，对吧？第三点，它需要能够自行规划，处理复杂任务。AI代理需要能够规划如何执行任务，有时你会看到这种“链式思考”推理，这有点像我们看到的，比如草莓或OpenAI的模型。

第四点，你需要能够访问记忆或公司数据，对吧？如果一个代理没有记忆或访问公司数据的能力，那么它就没有用，我甚至不会认为它是一个代理。这可能通过第二点，即工具交互来实现，但它需要这个功能。

第五点，这是一个重要的问题。它应该能够在外部执行任务，无论是手动触发、自主触发还是半自主触发。它需要能够实际执行某些操作，而不仅仅是理论上说明如何执行，对吧？这是区分大型语言模型和AI代理的一个方面。

我们现在尤其在代理力量和微软的Copilot Studio中看到了这一点。还有其他一些功能，我们稍后会从谷歌、Meta等公司谈到。

它需要能够实际执行任务，这是我们从微软365 Copilot及其工作室中看到的新功能。基本上，他们的AI代理构建器是，他们可以执行任务，但你必须给予它访问权限，或者你必须点击“是”，你可以执行这个任务，但我可以。

第六点，学习和适应，对吧？这是另一个重要的问题。如果一个代理不能学习和改进，对吧？通常，如果它由大型语言模型提供支持，它可以学习和改进。

但我需要快速总结这些要点。第一点，大型语言模型和自然语言处理。第二点，它需要能够与工具或外部工具交互。第三点，能够规划或进行链式思考推理。第四点，访问记忆或公司数据。第五点，能够实际执行任务。第六点，能够学习和适应，以便变得更好。我们必须快速休息一下，向大家介绍微软的工作室。

那么，为什么应该听微软的工作室播客？它探讨了商业领导者正在提出的问题，他们如何指导组织进行AI采用之旅？这项技术如何帮助他们创造新的产品和商业模式，并最大化价值？他们应该如何帮助团队适应这个新工作时代？为什么在使用AI时完全透明很重要？在工作实验室中找到答案。那就是工作实验室。没有空格，在任何播客平台上都可以找到。

让我们回到节目，对吧？这些是六个核心功能，这正是AI代理与大型语言模型不同的原因，因为现在，大型语言模型，我认为，除了OpenAI的模型未来会做的事情之外，目前没有工具访问权限，对吧？老实说，如果我能访问GPT-4拥有的所有工具，例如代码解释器/高级数据。

现在，如果它能访问，即使我认为Dolly不太好，如果我能访问上传文件的能力，如果我能访问浏览网页的能力，如果它能访问集成浏览，如果OpenAI的模型现在能访问这些功能，它就是一个代理，对吧？它现在就是一个由AI支持的代理。它没有访问这些功能，尽管OpenAI表示，这些功能很快就会出现，所以基本上，你们现在有ChatGPT和OpenAI的两种不同产品。

你们有GPT-4模型，它没有，嗯，第三点，即规划、链式思考推理和任务执行能力，第五点。但是，GPT-4模型没有这些功能，但新的推理模型有，所以OpenAI拥有所有这些功能，这就是我认为山姆·阿尔特曼的不太明确的推文意味着比我们想象的要多得多。所以，就像我说的，大型语言模型是文本生成，对吧？而代理是决策、执行和完成任务，在现实世界中学习。

让我们快速回顾一下历史，非常快速。我不想让这个播客持续一个小时。要谈论现代AI代理，首先必须提到LangChain。

LangChain在这一领域非常超前。所以，在2022年10月，LangChain发布了。

不要误会我的意思，但想想看，这就像早期互联网上的点击式导航，对吧？所以你可以访问不同的大型语言模型，然后将它们串联起来，创建一个工作流程来创建某种代理。所以，它又非常超前，但你不能不谈论LangChain。

然后，在2023年11月，OpenAI发布了GPT。

所以，首先是LangChain，在第三季度推出了LCM，这基本上是他们用于灵活代理创建的语言。然后，我们看到，在OpenAI的11月，能够创建GPT。所以，这还不是AI代理，但这是一个框架，对吧？

所以，通过自定义GPT，这基本上是能够执行代理任务，对吧？不是代理，更像是一个助手，你可以创建大型语言模型的自定义版本，上传一些数据。它可以访问所有这些工具，并且可以完成单个任务，对吧？它可以真正执行链式思考推理，并且可以自主或半自主运行。

但是，GPT确实迈出了重要一步。然后，我们快速前进到2024年初。所以，在视频中，他们展示了他们的AI硬件加速功能。

所以，你可以跳过Nvidia在这方面的参与。然后，我们进入2024年4月，Meta AI通过Llama 3开始整合并逐步展示其代理工作流程。谷歌在他们的I/O大会上也做了类似的事情，展示并预览了代理构建功能。

然后，我们来到现在，在过去几天里，我们看到了OpenAI发布了模型，预览了代理推理，一旦它可以访问GPT模型拥有的所有功能。然后，我们看到了微软Copilot Studio的第二波，拥有这些增强代理功能。

然后，我们看到了Salesforce的代理力量，这标志着这家全球最大的软件公司之一，从CRM公司转变为AI代理公司。这是一个非常简短的历史，以及最近的历史，对吧？但是AI代理已经存在很长时间了，对吧？让我们谈谈它们如何改变工作。

嗯，如果你还在听这个播客，而你没有看到它们如何执行工作以及如何改变工作，那你就得看看墙上的字，对吧？还要看看世界上最大的公司，对吧？嗯，我已经谈到了微软，对吧？嗯，我已经谈到了苹果，对吧？

苹果通过其苹果智能。所以，苹果和微软控制着我们使用的设备。而微软已经拥有所有外部，是的，AI代理，它们已经出现了。

它们是我们正在做的事情的重要组成部分。苹果还没有做到，因为他们落后于其他公司两年，但苹果智能正在出现。

所以，预计在未来，你们会开始在苹果设备上看到某种自主或半自主工作负载。在视频中，对吧？我正在谈论世界上最大的公司。

在视频中，它们创造了引擎，对吧？它们实际上是未来我们所有人如何工作，如何驱动AI代理的引擎。就像我说的，谷歌在他们的I/O大会上，在他们的顶尖AI代理构建器中宣布了AI代理。

嗯，随着它们继续改进，我认为Gemini模型在后端对于开发人员来说非常棒，在他们的AI工作室中。但对于普通用户来说，前端可能不太好，对吧？

但是，通过顶尖AI代理构建器，再次强调，这是世界上最大的公司之一。然后，你们有亚马逊，对吧？嗯，亚马逊正在投入数十亿美元用于大型语言模型。

他们拥有自己的大型语言模型平台。嗯，亚马逊正在开发简单的议程。工作流程，以及Meta，对吧？这些实际上是美国六大公司，也是全球六大公司。

他们正在以某种方式、形状或形式投资于AI代理。所以，你们必须看到墙上的字。你们必须关注资金，关注时间，关注注意力，所有这些都集中在AI代理上。

所以，这将极大地影响我们所有人的工作方式。它现在在我们眼前展开，让我们谈谈一些业务用例，对吧？嗯，我听到你们在LinkedIn和电子邮件中联系我，我总是很感激。

你们总是说，嘿，我们必须听到更多业务用例，对吧？有时我会提供一些例子。所以，Salesforce的代理力量，对吧？嗯，他们为此制作了一个视频。

我们将把这个视频放在新闻稿中，这是一个五分钟的简短视频，展示了如何在Salesforce的代理力量中构建这种无代码或低代码代理。所以，在这个例子中，嗯，你可以使用你的CRM数据，设置参数，设置规则，你不需要非常技术。它可以拖放。

所以，在我的屏幕上，我再次将屏幕分成左右两部分，在左侧，使用自然语言，你设置了AI代理如何响应的参数和规则。然后，它连接到你的Salesforce数据。然后，你基本上可以创建聊天，对吧？这是一个有趣的聊天。

聊天机器人曾经非常超前，但它们却毫无用处，对吧？因为使用聊天机器人，大型语言模型，你必须设置所有这些明确的条件，这可能只占聊天中实际发生的对话的百分之一，但现在，我认为，通过大型语言模型中的自然语言处理，你可能可以覆盖所有客户查询的99%。但是，通过代理力量，你基本上可以访问你的Salesforce数据，创建一个简单的代理，然后将其放在你的网站上。

在这个Salesforce的例子中，嗯，客户问，嘿，关于订单，他们有一个问题，Salesforce的代理回答了这个问题，然后他们说，嘿，我需要安装，然后他们说，下周五怎么样？所以，他们不是说，嘿，下周五，9月27日怎么样，他们只是说下周五，对吧？所以，你必须拥有大型语言模型中的自然语言处理能力，才能处理对话中的细微差别，将其转换为数据，然后将其连接到你的数据库，对吧？然后，Salesforce代理提供选项，他们说，在这些日期有以下可用时间。

然后，他们提供了一些选项。然后，这个人说2点30分，然后这是选项之一，然后代理安排了时间，并相应地更新了CRM，对吧？所以，这非常重要，我的意思是，我知道这是一个非常简单的例子，对吧？但是客户服务，我不知道，我不知道未来，在不久的将来，人类是否会是客户服务的主要力量。

这不再有意义，对吧？它真的没有意义了。如果你能正确使用它，这都是非常新的。你必须谨慎对待，但你也有其他工具和软件提供类似的功能，对吧？我刚才提到了微软Copilot Studio。

但是，是的，这将彻底改变客户服务的方式。嗯，让我们谈谈销售，嗯，销售和营销，Zapier，他们称之为AI助手？但它们实际上是Zapier的核心，我们之前在节目中介绍过。

类似地，这些更像是半自主的，但可以通过拖放来实现。所以，你必须连接到其他第三方软件，或者，例如，你不用Salesforce，你可能使用其他软件，对吧？但是，你可以通过拖放，使用自然语言，连接到大型语言模型和API，构建这些半自主代理。

对吧？所以，当我们收到网站上的查询时，你可以设置一些简单的自然语言规则。如果有人选择选项A，你应该发送这封电子邮件，但要以一种考虑到他们填写表格中所有信息的格式来撰写，对吧？你基本上可以结合设置规则、设置条件触发器，然后访问互联网上的几乎任何软件或服务。

所以，当你拥有这种由AI支持的代理，连接到你的数据和服务时，你就能看到未来。嗯，编码。我们正在谈论真实的业务用例。

嗯，我知道我问过你们。我收到了各种各样的回应，对吧？你们想了解有关AI编码、AI软件开发的更多信息，对吧？因为这也在发生变化。嗯，我认为这显然让那些已经从事软件开发或工程工作的人的工作更容易。

人们在现场用Python进行编码吗？这些工具，比如Replit代理、Cursor AI，对吧？能够与AI，嗯，Davinci，嗯，AI软件工程师，嗯，来自Cognition，对吧？OpenAI在其模型发布中突出展示了这三家公司。所以，仅这三家公司，还有更多，但这些可能是，嗯，AI Replit代理，嗯，Davinci来自Cognition，可能是最突出的三家。

这些是AI支持的软件代理，对吧？所以，是的，你有一些代理，理论上可以做任何事情，但你也有更专业和目标明确的AI代理。但是，是的，这改变了。

软件开发人员和工程师可以做的事情是无限的。然后，这还会带来新的功能，对吧？这是另一个方面。通过AI代理，它们为其他人带来了新的功能，因为我现在可以在Cursor AI上，例如。我可以使用自然语言说，嘿，为我构建一个执行此操作的程序，我需要它。

然后，大概在解决三个或四个、五个问题之后，我实际上创建了一个软件来解决我自己的问题，对吧？所以特定工作领域的技能即将发生改变。所以，是的，有通用人工智能代理，对吧？但是，也有特定领域或技能的人工智能代理。

我认为，回放代理、Cursor AI 和 Devon 都是很好的例子，它们体现了这些好处。在我们总结时，你们应该能够看到好处，对吧？这可是 24/7 不停歇的工作，对吧？如果我们谈论的是更自主的代理方面，Salesforce 自己就表示，他们预计明年会看到数十亿美元的收益，数十亿美元，是的，我没有疯。

人们认为我疯了，当我提出一些大胆的预测时，他们会说，未来会有比人类更多的 AI 代理，人们会嘲笑我，我会说，你们这些家伙真是傻瓜。然后 Salesforce 说，在一年内，他们预计他们的代理会带来数十亿美元的收益。这部分是营销吗？嗯，你知道，是梦想家式的愿景，当然，在 Dreamforce 大会上已经发生过。

这是现实吗？这绝对有可能成为现实。

是的，这可能是现实。因为现在我可以创建 10 个、20 个、30 个、40 个代理。你实际上拥有能够创建其他代理的人和软件。所以，实际上，自主代理可以全天候工作，创建其他自主代理。代理之间可以相互交互，这不再是科幻小说。

两三年前，你们知道，在 Reddit 和 Quora 上闲聊的人们，会想，这会不会很酷，而现在它已经成为现实，对吧？所以，好处是 24/7 工作，使用你最新的知识来设置安全措施，这也有助于非技术用户。

这是另一个重要的事情，对吧？因为再次强调，实际上，我们可能已经拥有由人工智能驱动的代理超过十年了。但是，随着生成式 AI 的普及，门槛降低了，所以，你十年前可能会说，是的，有人工智能代理，嗯，可能更多的是手动或半自主的，对吧？但是现在任何人都可以做到。

你可以在本播客的开头开始这个过程，现在可能已经创建了五个。这对我来说也是一个加快速度的关键，对吧？我们不能谈论这个而不谈论挑战和局限性，对吧？所以推理质量非常重要，嗯，真正定义这个代理计算机接口（ACI），有时被称为，嗯，在设计用于工具使用的有效接口方面。

这也是一个挑战。但我认为我们从代理力量和 Copilot Studio 看到的，嗯，真的，嗯，非常巨大，并且我们也会从谷歌的 Vertex AI 代理构建器中看到，它会如何发展。但是，模型也有局限性，对吧？

这些大型语言模型中现在存在偏见，理论上这些偏见正在驱动这些 AI 代理。所以，这是一个巨大的挑战。所以，道德和安全，对吧？特别是当 AI 代理开始学习和适应时，嗯，对吧。然后，当我们开始谈论多代理环境时，我并不是在谈论末日论，每天都在谈论《终结者》中的天网。

但是，你必须考虑这一点，对吧？你设置了一些可能很弱的安全措施，然后你，你知道，建立一个由 50 个自主 AI 代理组成的系统，它们可以相互交流，例如，可能，嗯，打开一个模型的眼睛，对吧？理论上，坏事可能会发生，对吧？

如果你没有足够的“人在回路”中，我知道你可能不太愿意承认这一点。有时，这样说有点夸张，说，嘿，人类是 AI 的保姆。但是，如果你在适当的时机没有足够的人在回路中，未来一系列协同工作的自主代理可能会非常危险，对吧。

如果你不持续地有人监督它们，如果你没有设置严格的安全措施，并且不断对这些代理进行质量控制，未来也可能非常可怕，对吧？所以，我不想，我不想跳过偏见、刻板印象、安全、道德，对吧，甚至谈论工作岗位流失，因为无论谁说什么，AI 最终都会夺走更多工作岗位，它创造了，对不起，这并不是我悲观，而是我现实主义，对吧。

这就是为什么世界上最大的公司都投入数十亿美元用于通用 AI、GPU 和 AI 代理，对吧？然而，他们却在创纪录的利润下解雇了数万名员工，对吧？我不知道为什么人们不，嗯，我知道我们作为人类在谈论 AI、我们的工作、职业和工作的意义时需要乐观，对吧？但是你也必须现实。

华尔街讨厌员工。华尔街喜欢利润。华尔街真的会开始喜欢 AI 代理，对吧？密切关注微软和 Salesforce 的股票，看看未来一年会发生什么。

所以，你们会明白我的意思，对吧？那么未来会怎么样？我不知道未来会怎么样。我只知道它肯定与 AI 代理有关，就像我说的，美国前六家公司中，除了苹果之外，微软、谷歌、甲骨文、亚马逊和 Meta 都公开表示，他们正在投资或研究 AI 代理，或者他们已经全面投入。

然后我们再谈谈 Salesforce，它是世界上最大的公司之一，它与许多其他财富 500 强公司都有联系，对吧？像大多数大型企业一样，都在使用 Salesforce，我甚至不知道 Salesforce 是什么。最大的竞争对手？是甲骨文，对吧？谁知道呢？我的意思是，我可能认识其中一些人，但你们明白我的意思。

最大的公司，它们决定了我们的工作方式，都在全力投入 AI 代理。让我们总结一下。是的，所以这里有一些关键的要点。我们正处于从，是的，AI 到生成式 AI 再到 AI 代理的重大转变时期，对吧？你不能谈论这种转变而不谈论通用人工智能。

并且，你知道，更强大的模型和 AI 代理，某种程度上是通往通用人工智能的下一步，它让 AI 在所有任务上都比世界上任何人都聪明，并且可以完成所有这些任务，而几乎不需要人类干预，对吧？我认为代理是通往那里的一个步骤。无论你是否支持通用人工智能，这都不重要。但我们必须谈论它。所以我们还必须谈论 AI 代理的双重性。嗯，说实话，过去一周发生的一切都让我震惊。

这就是为什么我说我们必须做一期关于这个的节目，对吧？嗯，我认为一年前还为时过早，但现在事情已经很明显了。你必须关注它，我们必须谈论它，我们必须与企业领导者和决策者谈论它。

你必须以正确的方式实施 AI 代理，你必须优先考虑人类。你必须优先考虑安全措施。数据非常重要，在疯狂地争先恐后地成为第一家实施代理力量或微软 Copilot 等大型 AI 代理的公司时，你不能忽略这一点。

你不需要这样做。你应该现在就行动起来，对吧？如果你还没有在大型语言模型中建立生成式 AI，你基本上就完蛋了，对吧？

你应该已经开始讨论这些自主工作负载、由 AI 驱动的自动化和 AI 代理。无论你明天是否实施它，你都必须进行这些讨论。这不是我建议你做的事情。

你必须现在就开始计划，对吧？所以，嗯，让我们看看这里有一些问题。嗯，让我们看看。嗯，这部分是作为直播进行的。

我知道我有时会喋喋不休，但我认为，即使在 AI 发生的一切事情中，我们现在花了很多时间与 AI 交谈，我认为进行一次人类对话很重要。所以，播客听众，你们可能会在我们的直播中听到我问很多问题，感到有点烦躁。听众，但我希望这是一个。

而且，播客听众，请加入我们。我希望这是一个我们可以进行真正的人与人之间对话的地方，对吧？我希望这是一个我们可以一起探索和学习的地方。

嗯，这里有一个来自 Kobe 的问题，嗯，有人加入我们，他说，Jordan，你对在 Zapier 的 APP 中心使用代理的看法是什么？嗯，Kobe，嗯，你提前阅读了。你建立过任何代理吗？你发现这个应用程序有效吗？所以，当 Zapier 中心首次推出时，我进去玩了一下。

说实话，我建立了一个或两个基本的流程。我之后没有再回去，我正在后悔，因为我真的应该。我们每个月都为此付费，但我几乎没有利用它。

但我认为，特别是对于可能没有 Salesforce 的公司，或者不想完全投入代理力量的公司，因为我还没有提到的一件事是，我相信代理力量每对话收费两美元。我不确定这种营销策略，但这就是为什么他们可能会有很多聪明人告诉他们这是正确的方法。但是，嗯，Zapier 中心和微软 Copilot Studio，他们的 AI 代理构建器，可能是两个最强大的 AI 代理，它们已经准备就绪。

嗯，我认为，嗯，微软 Copilot 显然更强大，因为它可以立即使用你的实时数据。而 Zapier 中心，你正在构建这些代理，嗯，我不会说你正在拼凑它，对吧？当它内置在你的计算机上使用的软件中时，它会更流畅，而不是你需要将各个部分拼凑在一起。

玛丽问了一个反驳的问题，如果 AI 将要“接管”，人类还能做什么？这是一个好问题，对吧？是的，我认为这很重要。

我有点，嗯，在节目中已经讨论过了，对吧？谈论未来的工作是什么？我认为这更多的是负责任地使用人在回路中。

嗯，我希望，对吧。谁知道呢？也许我们真的会看到一些公司做出道德选择。

我认为不幸的是，许多公司在整个组织中使用模型时，从上到下，嗯，在他们弄清楚 AI 代理时，我认为许多公司会急于解雇数千名员工。我们已经看到这种情况发生在大型科技公司身上，对吧？我认为这将大量发生。

这将大规模发生。不幸的是，我并不是在胡说八道。我正在遵循数据，正在遵循显而易见的事实。

那么人类将做什么？嗯，希望是更具创造性和战略性的思维，你知道，也许我们会看到，例如，四天工作制变得很普遍，对吧？嗯，谁知道呢？但是我不知道人类在大型语言模型变得更聪明、更强大，以及我们看到由 AI 驱动的代理时，在其中的作用是什么。但我确实知道，在过去几十年中，我们一直被奖励专业知识，对吧？

你被奖励你头脑中关于你特定行业的决策事实。我并不是说这会消失，但这将大大贬值。你对营销的了解并不重要。

你对运输和物流的了解并不重要，对吧？因为这些 AI 代理，当它们可以访问你的公司数据时，当它们可以访问理论上的世界历史时，对吧？它们可以适应并访问你的公司数据，学习和改变，对吧？你大脑中关于你特定行业的专业知识突然变得不那么有价值了。所以，我确实知道未来的工作。

需要我们更具创造性和战略性地思考。我认为，就像现在一样，三十年前谁会想到美国几乎所有知识型工作者都会在互联网上工作。我认为在不久的将来，我们每天都会在 AI 周围工作。

所以，无论是微软 Copilot，还是，你知道，你的代理力量，或者谷歌的 Vertex AI 代理，无论你是否正在构建自己的 AI 代理，我假设未来几年的大多数工人将以某种方式、形状或形式在生成式 AI 和大型语言模型周围工作，就像我们现在都在互联网周围工作一样。最后一个问题，我们正在讨论如何确保在工作场所和学校中公平地检测 AI 代理的使用，并防止在没有适当证据的情况下错误地指责依赖 AI？这是一个好问题。

Tera，我不知道。我不知道。也许这与玛丽的问题有关，人类将做什么？嗯，人类，当我们需要优先考虑道德、安全、消除偏见，对吧？嗯，公平、公平和不平等，对吧？

这些是当 AI 代理和大型语言模型接管我们大部分手动、日常知识工作任务时，我们必须解决的问题。这是一个好问题，Tera。

不用担心，我们将在每天的 AI 中帮助我们所有人发现未来的工作方式。至少我们知道未来一段时间的工作方式，但我们将在每天的 AI 中继续解决这些问题。感谢你们加入我们。

如果你还没有，请访问 your-everyday-ai.com。订阅我们的免费每日新闻通讯，我们将在今天的节目中回顾。是的，我知道这很长，但我认为这是一个重要的讨论，因为我不会感到惊讶，如果明年我们还会进行同样的讨论。

我不会感到惊讶，如果世界上有数十亿 AI 代理。这不仅仅是我的大胆预测。你从 Salesforce 也听到了。

但我所知道的是，未来的工作是生成式 AI，世界上最大的公司都在全力投入 AI 代理。感谢收看。

我们明天将在每天的 AI 中再见，期待更多每天的 AI。谢谢。今天《每天的 AI》节目到此结束。

感谢你们的参与。如果您喜欢本期节目，请订阅并给我们评分。这有助于我们继续进行更多 AI 魔法。访问 your-everyday-ai.com 并注册我们的每日新闻通讯，这样你不会落后。祝你们一切顺利，我们下次再见。

EP 395: AI Agents - Everything you need to know 53:24 Share

Everyday AI Podcast – An AI and ChatGPT Podcast

Deep Dive

Shownotes Transcript

EP 395: AI Agents - Everything you need to know