欢迎来到AI Unraveled的特别深入探讨。很高兴来到这里。现在这个节目是由Etienne Newman创作和制作的。他是一位资深工程师,也是加拿大一位充满激情的足球爸爸。没错。而且,如果您发现我们进行的这些探索很有价值,请花一点时间点赞和订阅。
这确实有助于我们为您带来更多AI见解。绝对的。每一份帮助都很重要。所以今天我们将真正关注一些非常基本的东西。我们正在讨论智能AI系统背后的核心设计原则。是的,那种能够感知、推理、计划和自主行动的系统。这是一个很大的话题。是的。而我们今天的重点,很大程度上借鉴了这份非常有见地的指南,《20大代理模式:构建智能系统的实践指南》。可以把它想象成我们正在查看蓝图,AI开发人员现在用来构建这些复杂代理的基本结构。没错。我们可以说,我们正在揭开一些尖端AI开发的神秘面纱。这里的目标是真正提取这些关键思想,解释它们为什么重要,以及它们是如何在今天的AI框架中实际使用的。对。我们需要清晰度。
那些你希望看到的“啊哈”时刻,希望不会陷入令人难以承受的行话中。所以是核心内容。没错。是的。哦,在我们正式深入探讨之前,如果您想巩固您的AI知识,也许让您的职业生涯更上一层楼。那么,一定要查看Etienne的AI认证预备书籍。它们非常全面。他现在已经写了不少了,不是吗?是的。针对Azure AI工程师助理、Google Cloud生成式AI领导者认证、
AWS认证AI从业者以及Azure AI基础考试的学习指南 哇,几乎涵盖了所有方面,你可以在deed sham kick comm上找到它们,当然,我们会在节目说明中添加链接,如果你对这个领域认真对待,这些都是必不可少的资源,绝对可以。所以代理系统,这个人谈论了很多关于它们的内容,我们到底在谈论什么?好的,在其核心,一个代理系统
实际上是具有代理功能的软件架构。代理。这意味着它可以感知其环境,可以处理信息,然后至关重要的是,它可以采取行动来实现它被赋予的特定目标。对,听起来……
嗯,与传统软件的通常工作方式大相径庭。是的,非常不同。你的典型软件只是遵循一组指令,对吧?步骤A,步骤B,步骤C。非常死板。预定义的路径。没错。预定义的路径。然而,代理系统之所以引人注目,是因为它们可以自主行动。它们积极主动地追求目标。即使没有持续的人工干预,它们也能有效地运作。所以它是AI,可以某种程度上
更好地自我管理,尤其是在事情变得复杂的时候。正是如此。而促成这种转变的重大变革,实际上是大型语言模型LLM的兴起。好的。LLM是如何推动这一发展的?
嗯,这些模型基本上使AI代理能够超越仅仅遵循规则。它们展示了我们所说的涌现能力。涌现能力,它们并非被明确编程去做的事情。没错。只是从模型的庞大规模和训练数据中产生的东西,例如复杂的推理、规划多个步骤来解决问题、记住过去的对话。拥有记忆。对。记忆意识和能够灵活地使用不同的工具来完成任务。
这是对旧系统的巨大改进,旧系统大多只是对您给出的任何输入做出反应。所以更少反应,更主动,目标驱动。就是这样。主动的、目标驱动的实体,能够更独立地做出复杂的决策和解决问题。这确实是一次飞跃。所以回到指南,当您试图构建这些类型的智能系统时,为什么这些模式如此重要?啊,好问题。
这些代理设计模式已经成为真正利用LLM的力量来获得我们正在谈论的自主性的重要工具。所以它比仅仅向LLM抛出一个巨大的提示并期待最好的结果更有条理。更有条理。与其使用一个庞大而复杂的提示,不如使用这些模式通过一系列更小、更集中的交互来指导LLM的推理和行动。
这是一种设计思维过程的方式。好的,所以这是一种更有条理、可能更可靠的方式来构建这些AI思维。没错。这些模式为常见问题提供了一种共享语言,并且它们提供的解决方案是可重用的,在开发这些代理时反复出现。减少猜测。将其转向工程。正是如此。更少的反复试验,更多可靠的工程实践。那么实际的好处是什么?为什么要使用这种基于模式的方法?实际上,有很多好处。模式确实鼓励模块化。您可以从小而易于管理的部分构建复杂的系统。我想这有助于扩展规模。绝对有助于扩展规模。它还使系统更容易更改或以后添加。
而且至关重要的是,它们有助于管理复杂性。考虑协调多个代理或不同的工具或复杂的工作流程。模式为此提供了结构。听起来可以避免以后很多麻烦。哦,绝对的。此外,使用已建立的模式意味着开发人员在同一页面上。他们采用最佳实践。这导致更一致、通常更高质量的AI。该指南区分了……
结构化工作流程和这些动态代理模式。对我们来说,关键区别是什么?对。因此,结构化工作流程通常遵循固定的顺序。步骤一,步骤二,步骤三,总是相同的。非常可预测。对于您确切知道需要发生什么的任务非常有用。就像装配线一样。有点像。是的。然而,代理模式赋予AI代理更多自由,更多自主权,在
决定下一步做什么。因此,当事情有点不确定时,它们更好。没错。对于模棱两可的任务或AI需要根据当前情况和自身推理做出决策的任务更好。更大的灵活性。好的,这说得通。但是有缺点吗?这种灵活性有什么权衡吗?是的,可能会有。代理系统有时需要更长的时间,你知道,增加延迟,并且与更简单的直接方法相比,它们可能会使用更多计算资源。
所以更多开销。可能,是的。关键原则应该是使用最简单的方法来完成工作。当它们提供的灵活性以及复杂的思维真正超过潜在的额外成本时,代理模式最有价值。所以这些模式不仅仅是代码片段。它们更像是……
AI应该如何思考、如何解决问题的蓝图。这是表达它的完美方式。代理认知架构的蓝图,它如何推理、计划、学习、交互。每个模式都有其优点和缺点,理解这些对于做出明智的设计选择至关重要。好的,让我们深入了解一些细节。该指南涵盖了一些基础模式。首先。
提示链。核心思想是什么?提示链。好的,可以把它想象成将一项大型复杂的任务分解成一系列较小的链接步骤或提示。眨眼毛巾。一个步骤的输出成为下一步的输入。因此,您创建了这个操作链,所有这些操作都朝着更大的目标努力。就像那个装配线的想法一样,但用于AI任务。为什么这样做而不是只使用一个大的提示?否则对LLM来说是不是太多了?通常情况下,是的。
它有助于处理可能一次性压倒LLM的任务。也许推理太复杂了,也许LLM的上下文窗口不够大。它一次可以处理的文本量。对。或者也许只是尝试一次做太多事情会增加出错的几率。通过将其分解成更小的焦点提示,每个步骤都更容易让LLM正确完成。总体精度更高。通常情况下,是的。
更高质量的结果。你能举个例子吗?让它更具体一些。当然。假设您需要营销文案,但还需要Twitter、LinkedIn、Facebook的版本。不同的长度,不同的语气。没错。因此,链中的第一步可能是LLM生成主要信息。
然后,后续步骤可以获取该输出,并专门针对每个平台的限制和受众进行调整。好的,我明白了。或者也许你喜欢写报告。先列出提纲,然后起草章节。完美的例子。一步生成提纲,下一步起草引言,然后是正文段落,依此类推。每个步骤都建立在之前的步骤之上。
说得通。该指南还提到了这些链中的门。它们是用来做什么的?啊,门。这些基本上就像您可以放在链中步骤之间的检查点一样。检查什么?验证。您可以在步骤二的输出进入步骤三之前以编程方式检查它。它是准确的吗?格式正确吗?它找到了所需的信息吗?所以你可以尽早发现错误?
甚至可以改变方向。没错。它增加了一层控制和可靠性。如果出现问题,您可以停止,或者可能回退或尝试不同的方法。明白了。好的,下一个模式。
工具使用和函数调用。听起来像是赋予AI超越文本的超能力。差不多就是这样。这个模式完全是关于让LLM代理与外部工具交互。例如API、数据库,或者运行一些代码。他们为什么需要这个?LLM不是在整个互联网上训练的吗?嗯,是的,也不是。它们是在一个庞大的数据集上训练的。但是这些数据会过时,对吧?有一个知识截止日期。啊,所以他们不知道当前事件或实时股价。是的。
没错。此外,他们无法直接在现实世界中做事情。他们无法发送电子邮件、预订航班、查询实时数据库。或者有时甚至无法可靠地进行复杂的数学运算。对。他们也有计算限制。因此,工具使用允许LLM弄清楚何时可以使用外部工具。
使用正确的信息生成对该特定工具的调用,然后使用该工具的输出进行思考。因此,LLM可能会说,嗯,我需要明天的天气预报,然后调用天气API工具,获取数据,然后将其用于其响应。正是如此。该过程通常如下。LLM识别对工具的需求,生成结构化函数调用,例如告诉系统哪个工具以及要发送什么信息,系统运行该工具,
LLM获得结果,观察使用该观察结果继续或给出最终答案。
这非常强大。打开了无限的可能性。我们还看到了哪些类型的工具?哦,很多。网络搜索是一个常见的工具。代码解释器,因此AI可以编写和运行代码来解决问题。数据库接口,就像你说的那样。访问CRM系统的客户服务机器人。提取实时市场数据的金融工具。没错。AI助手控制你的智能家居设备。它真正弥合了LLM的知识和AI之间的差距。
动态实时世界。它使它们更强大、更知情。说到知情,如果您正在收听并希望真正加深您自己的理解,甚至获得认证,我们之前提到的Etienne Newman的AI认证预备书籍,在djamgac.com上,非常适合这个。它涵盖了诸如Azure AI工程师助理、Google Cloud生成式AI领导者等内容,
绝对值得一看。链接在节目说明中。很好的提醒,基础知识在这里至关重要。好的,下一个模式,基本规划。
这感觉像是我们正在走向能够真正制定战略的AI。是的,这是个很好的想法。基本规划是关于代理能够获取高级目标的能力,这可能需要多个步骤。例如计划我的假期或撰写研究论文。没错,这类事情。代理自主地将这个大目标分解成一系列较小的、可实现的子任务或行动。
所以它不再仅仅是反应了。它正在自己制定路线图。这是核心思想。超越仅仅是即时响应,走向提前思考,走向战略。代理获得目标,思考所需的步骤,制定计划,可以是一个简单的列表,也可以更复杂,然后开始执行该计划。所以对于那个假期示例……
它可能会将其分解成研究目的地、检查航班价格、寻找酒店、创建每日行程。正是如此。每个都成为整体计划中的一个子任务。或者对于软件开发,AI可能会计划、设计数据库模式、编写API端点、构建前端组件、编写测试。它弄清楚逻辑顺序。这绝对感觉像是朝着更智能行为迈出的巨大一步。不仅仅是自动化,而是思考。
它是战略性思维。好的。我们今天要讨论的最后一个基础模式是反思和自我纠正。
这听起来很有趣。AI从自身学习。正是如此。反思和自我纠正使AI代理能够查看其自身的输出、自身的决策,甚至自身的推理,并批判性地评估它们。评估什么?错误?错误,是的。但也包括不一致之处、偏差,或者只是质量可以提高的领域。然后至关重要的是,它使用这种自我评估来改进其方法,甚至重做输出。
所以AI可以充当它自己的质量检查员,它自己的编辑。有点像,是的。典型的流程是代理首先产生一些东西,一个答案、一个计划、一段代码。然后进行反思步骤。代理本身,或者可能是专门的评论代理,分析该输出。
它如何分析?它可能会将其与已知事实进行比较,检查逻辑缺陷,查看它是否符合某些质量标准。根据该评论,代理可以修改其工作。这个生成-反思循环甚至可能发生几次。在实践中,它的好处是什么?更好的结果。通常情况下,要好得多。它可以捕捉AI可能犯的其他错误。它允许代理改进,而无需人工指出每一个缺陷。对于第一次尝试可能并不完美的大型复杂任务尤其有效。例如
例如撰写一篇非常复杂的文档,它可以检查其论证的清晰度或检查其事实。正是如此。或者编码代理可以检查其代码是否存在错误或效率改进。
这种自我批评和改进的能力,是使AI更强大、更可靠的关键一步。这真是太棒了。AI的元认知。好的,我们已经讨论了这些模式。该指南还简要提到了框架。这些模式实际上是如何构建到真实的AI应用程序中的?对。嗯,越来越多的AI开发框架使将这些模式付诸实践变得容易得多。
像库或工具包之类的框架。没错。它们为开发人员提供预构建的组件、工具和方法来构建事物。基本上,它们简化了设计、构建和部署使用这些模式的代理的过程。你能否说出一些人们可能会听到的大型框架?当然。有Google Agent Dev Kit,通常称为ADK。Crew AI越来越受欢迎。Langchain及其较新的基于图的版本Langgraph被广泛使用。微软有Autogen和Semantic Kernel。好的。这些框架……
它们具有实现工具使用或规划等功能的特定功能。哦,绝对的。它们通常具有专门为这些模式设计的模块。内置的方法来处理提示链序列,轻松集成API以进行工具使用的方法,创建和管理计划的结构,用于反思的循环。
它们提供了支架。因此,它们处理管道,让开发人员更专注于代理的逻辑。这是表达它的一个好方法。它们通过提供现成的核心构建块来简化构建这些复杂的代理系统。同样,如果您打算动手操作并可能获得认证,那么了解这些框架至关重要。
而Etienne在djamgettech.com上的那些预备书籍涵盖了诸如Azure AI基础知识或AWS AI从业者考试中使用的底层技术,这确实有助于连接这些点。绝对的。理论是一回事。实际实施是另一回事。所以让我们尝试总结一下。正如我们今天所阐述的那样,这个代理AI的整个世界实际上是建立在这些基础设计模式之上的,不是吗?确实如此。它们是我们设计AI系统进行思考、行动,
甚至现在自己学习的基本方法。- 从提示链的逐步逻辑。- 到使用工具和规划获得的动态问题解决。- 以及通过反思自我改进的关键能力。这些确实感觉像是推动AI下一步发展的核心概念。- 是的,希望这次深入探讨能让您,学习者,更清楚地了解代理AI背后的原因和方法,那些关键的见解。- 但这里有一个想法要留给您。随着这些模式变得越来越复杂,
当我们学习以更复杂的方式将它们编织在一起时,我们与AI的关系将如何改变?有趣的问题。我们将不再把AI系统仅仅视为工具,而是视为工具吗?
嗯,真正的合作者。也许正在解决我们甚至还没有想到的问题。这绝对是一个值得关注的迷人前沿,不是吗?潜力巨大。确实如此。如果这次讨论激发了您的好奇心,我绝对建议您研究一下我们所基于的《20大优生模式指南》。是的,如果您想更深入地了解和实际构建这些智能系统,它是一个真正的宝库。最后一次,如果您准备好真正提升您的AI知识,请在Ian Newman的AI预备书籍中获得认证。
Azure AI工程师助理、Google Cloud生成式AI领导者、AWS认证AI从业者、Azure AI基础知识。它们都在djumgate.com上。链接在节目说明中。说真的,这是您AI之旅中非常棒的资源。我完全同意。扎实的准备。好的,感谢您加入AI Unraveled的这次特别深入探讨。我们希望您觉得它很有见地。是的。感谢收听。直到下次,继续探索人工智能这个迷人的世界。