这是第 876 集,主题是 Hugging Face 的 Small Agents。欢迎回到 Super Data Science Podcast。我是主持人 John Krohn。今天我们将深入探讨 Hugging Face 的 Small Agents(スモールエージェント,一个词),
一项赋予 AI 模型更多自主性的新发展。Hugging Face 是一个开源 AI 巨头,其背后技术包括 Transformers 库,现在它将注意力转向了 AI 代理,即 AI 模型可以自行规划和执行任务的程序。而它们最新的库 Small Agents 使构建这些代理比以往任何时候都更加简单。
在本短集中,我将为您分解 small agents 的用途、工作原理以及为什么它们对开发人员、企业和研究人员来说意义重大。好的,让我们首先描述一下 small agents 究竟是什么。简而言之,它是 Hugging Face 推出的一个新的 Python 库,它简化了 AI 代理的创建,使它们更容易被开发人员和数据科学家访问。
Hugging Face 本身将 small agents 描述为一个解锁语言模型代理能力的库。它正是如此。这意味着您可以使用大型语言模型 (LLM),例如专有的 OpenAI 模型、Meta 的开源 LAMA 模型或 DeepSeq 的完全开源模型,并轻松地赋予它行动的能力,使用工具、调用 API 并执行多步骤推理来完成任务。
在幕后,Small Agents 的设计具有最小的复杂性。核心逻辑仅包含几千行代码,保持抽象轻量级且高于原始 Python。这种简洁性是有意的。它允许开发人员理解和调整代理行为,而无需深入研究过于复杂的框架代码。Small Agents 实际上是 Hugging Face 早期 Transformers.Agents 模块的继任者,它最终将取代后者,反映了为使该库精简且用户友好而吸取的经验教训。
其最突出的功能之一是其代码代理方法。与一些以抽象 JSON 或文本表示操作的代理框架不同,small agents
代理,small agents,代理,实际上是将 Python 代码作为其推理和采取行动的方式。换句话说,AI 代理通过生成代码来决定下一步做什么,例如调用工具或执行计算,然后执行该代码。这种以代码为中心的方法非常强大,因为它利用了 Python 的全部灵活性来执行代理的操作。为了确保安全,这些代码执行可以被沙盒化
在隔离的环境中运行,以防止代理对您的实际系统造成任何损害。因此,您可以灵活地让代理编写代码,同时又具备安全措施。如果您更喜欢更传统的方式,Small Agent 仍然支持使用结构化文本进行操作的标准工具调用代理,因此您可以选择。
Small Agents 还带有头等工具集成。您可以通过使用 @tool(这是一个 Python 代码装饰器)装饰它并向您的函数添加一些类型提示和文档字符串,轻松地将任何 Python 函数转换为代理可以使用的工具。这些工具集成可以是任何东西,从网络搜索功能到数据库查询或计算器。更好的是,Hugging Face 已将其与 Hugging Face Hub 集成。
这意味着您可以从 Hugging Face Hub 共享和加载工具。因此,用户社区可以发布,正在发布有用的代理工具,例如天气 API 获取器或文本翻译器,您可以插入他们创建的那些代理并在几秒钟内将其上传到 Hub。这有点像 AI 代理工具的应用商店。
另一个关键特性是 Small Agents 与模型无关。您不会被锁定到单个 AI 模型或提供商。它支持任何大型语言模型。您可以使用我刚才描述的 Hugging Face Hub 中的开源模型,该库通过 Hugging Face Transformers 库或 Hugging Face 推理 API 加载它们。或者,您可以通过名为 LightLLM 的集成使用来自 OpenAI、Anthropic 或其他公司的基于 API 的模型。
如果您有本地模型,您甚至可以连接它们。从本质上讲,无论是运行在您笔记本电脑上的 70 亿参数开源模型,还是通过云 API 运行的尖端模型,您都可以将其插入 small agents。
这种灵活性非常适合想要在不同环境中试验或部署代理的开发人员。为了概括技术亮点,Small Agents 提供以下五个功能:简洁性——因此基于数千行代码的轻量级、清晰的代码易于理解。最小抽象——意味着您几乎直接使用 Python 代码,而不是晦涩的配置。二,
编写并执行 Python 代码来执行操作的代理具有基于代码的操作,能够以熟悉的语言进行复杂的行动和多步骤推理,并进行沙盒化或安全保护。这是一种独特的代理编写代码设计。
三,small agents 具有工具集成和共享功能。这是一种定义工具(仅 Python 函数)以及通过 Hugging Face Hub 共享这些工具或整个代理的便捷方法。这促进了可重用性和社区协作。
四,Small Agents 提供任何模型支持。因此,通过统一的接口与从本地模型到最流行的 API 的各种 LLM 兼容。您可以选择适合您需求或约束的模型。然后第五,最后,Small Agents 具有开箱即用的可用性。因此,它甚至提供了一个命令行界面
small agent CLI,只需一个命令即可运行代理,以及一个用于 Web 浏览任务的专用 Web 代理。这使您可以快速测试和部署代理,从而无需编写大量样板代码即可轻松入门。
好的,希望这听起来很酷,但是您实际上可以用 small agents 做什么呢?嗯,很多。所以有效地,无限的选择,但让我在你的脑海中产生一些想法。因为 small agents 允许 LLM 使用工具并执行多步骤推理,所以它在各个行业开辟了许多实际应用。以下是一些有趣的例子,实际上所有这些都适用于任何类型的代理 AI 框架。
但是是的,在这里我们将专门讨论 small agents。例如,您可以在研究中进行复杂的问答。您可以构建一个代理,在给定一个难题的情况下,它会搜索网络,查找信息,然后撰写答案。
例如,Hugging Face 提供了一个演示,展示了一个代理如何使用搜索工具来计算一只以全速奔跑的豹子穿过艺术桥需要多少秒。我认为这是在巴黎。Hugging Face 的创始人最初来自巴黎。您可以使用类似 OpenAI 每月 200 美元的深度研究功能来开箱即用地回答这类问题。
或者,您可以尝试使用 small agents 作为一种研究助手,从各种来源获取事实和数据来回答您的查询或撰写报告。
作为另一个例子,因为没有一篇关于代理的内容是完整的,如果没有旅行计划的例子,我们开始吧。假设您需要规划一次具有许多参数的旅行或活动。使用 small agents,您可以创建一个代理,该代理接受一个高级目标,例如在 3 月 28 日至 4 月 7 日之间规划前往东京、京都和大阪的旅行,然后该工具将调用该代理
然后 small agents 将调用工具来收集信息,搜索航班,检查火车时刻表,查找酒店评论等等。事实上,您可以使用 small agent 命令行界面在一行中执行此操作,您只需键入 small agent(一个词),然后用自然语言说计划在 3 月 28 日至 4 月 7 日之间前往东京、京都和大阪的旅行。就是这样。
该代理可以分解任务,也许可以使用地图 API 获取距离或使用网络抓取工具获取景点,并为您返回一个组织良好的行程。这种多步骤规划代理
可能对您、旅行社、活动策划者或个人助理有用。是的,再次强调,这里有无限的可能性。除了调用 API 外,small agents 还可以驱动 Web 浏览器(例如图形 Web 浏览器)来执行操作。Hugging Face 提供了一个名为 Web Agent(一个词)的东西来做到这一点。因此,它可以接受诸如转到电子商务网站、导航到销售部分、单击第一个产品并获取其详细信息和价格之类的指令。
然后,这里为您提供的最后一个现实世界的例子是,由于 small agents 可以执行 Python 代码,因此您可以让它们动态地执行数据分析。想象一下,一个代理收到一个提示,要求分析上个月的销售数据并按增长率确定前三名产品。
它可以使用 pandas(一个用于表格数据的 Python 库)加载 CSV,然后计算结果并输出摘要。它基本上可以将数据处理和语言生成结合在一起。这太酷了。
这些例子只是触及了表面。关键是 Small Agents 允许 LLM 通过工具和代码以受控的方式与世界互动。这意味着任何涉及查找信息、转换数据或根据中间结果做出决定的任务都可能由 AI 代理处理。由于 Hugging Face 使共享组件变得容易,因此社区可以快速构建一个用于无数利基应用程序的工具和代理库。
好的,现在让我们放大。small agents 如何融入更广泛的 AI 生态系统?它们对企业和数据科学家意味着什么?在 2024 年,尤其是在 2025 年,从自主研究助手到可以像人类一样使用软件的 AI,关于 AI 代理的讨论很多。Small agents 是这场运动的一部分,它的引入很可能会
你知道,对所有这些产生不可忽略的影响。对于企业而言,small agents 可以降低使用 AI 自动化复杂任务的门槛。一家公司无需依靠整个工程师团队来将定制解决方案拼接在一起,而是可以使用 small agents 来制作一个 AI 代理的原型,例如,处理客户询问或仅使用几行 Python 代码执行市场研究。因为它支持本地和开源模型,所以担心数据隐私的公司可以将所有内容保存在他们自己的安全服务器上,即本地服务器上,
这种灵活性意味着企业可以在使用强大的专有模型或更便宜的免费开源模型之间进行选择,无论哪种模型适合其需求和预算,都在同一个框架内。简而言之,Small Agents 可以帮助公司更快、更经济高效地将其 AI 驱动的自动化注入其工作流程中。对于数据科学家和软件开发人员而言,Small Agents 是您工具箱中一个既易于访问又通用的新强大工具。如果
如果您曾经使用过 Langchain 等框架或使用过 OpenAI 的函数调用,您会发现 Small Agents 为您提供了类似的功能,但它也轻量级且透明。它是完全开源的,因此您可以检查其工作原理、调试它或扩展它。极简主义的设计意味着您也可能很快就能学会它。
这意味着您个人(不仅仅是大团队)可以尝试构建您自己的代理。最后,对于研究人员而言,small agents 提供了一个方便的平台来研究 AI 模型在获得更多自主权时的行为。对推理、工具使用和多步骤决策感兴趣的研究人员可以使用该库来测试新想法。您可以互换任何模型这一事实意味着它非常适合基准测试。例如,较小的开放模型与较大的专有模型在代理角色中的表现如何?那
这听起来也像是对您在商业上构建的任何工具进行基准测试的有用问题。好的,总而言之,Hugging Face 的 Small Agent 是一个方便的新框架,它以小型、简单和易于访问的形式将 AI 代理的概念带入主流。
在今天的短集中,我介绍了 small agents 的工作原理及其关键功能,从代码编写代理和简单的工具集成到对任何您想要的模型的支持。我们探讨了您可以构建的内容示例,例如旅行规划器、网络抓取工具和研究助手,所有这些都可以应用于任何行业。如果您一直在等待开始在您特定的商业或学术领域中使用您自己的代理 AI 应用程序,那么现在可以使用 small agents 了,这可能是开始的好时机。
想要集思广益,思考您可以使用 AI 代理功能构建的产品或功能?没问题。与您的同事、朋友或您最喜欢的对话式 LLM(如 Claude 3.7 Sonnet、Google Gemini 或 OpenAI 的 GPT 4.5)交谈。
我应该在本集结束时指出,我只是这个库的忠实粉丝。这些是我的个人观点。本集或本节目的任何一集都没有 Hugging Face 的赞助。所以是的,我只是认为这是一个值得检查的好东西。它可以使 AI 代理进入现实世界变得非常
非常容易。关于不特别绑定到 Hugging Face 作为您应该使用的代理框架,还有很多其他选择可供您开发和部署 AI 代理。所以
在本集的前面,我已经提到了 Langchain,它是当今最流行的代理框架。Langchain 功能强大且功能丰富,在可扩展性、内存管理和内置集成方面都超过了 small agents,使其成为复杂代理工作流程的理想选择。Lama Index 是另一个可靠的选择。它擅长管理大型数据集和内存密集型检索任务,提供 small agents 中没有的开箱即用的数据集成功能。
Pydantic AI 通过显式模式验证提供结构化、类型安全的代理输出,这与 small agents 更简单但控制较少的输出处理形成对比。然后,就多代理系统而言,Microsoft AutoGen 专注于具有动态协调和通信的协作多代理系统,而 small agents 主要关注单代理任务。最后,你不能谈论多代理。
代理系统没有流行的 Crew AI 框架,该框架是专门为通过明确定义的角色和任务来协调多代理团队而构建的,使其在协调代理协作方面优于 small agents。
协作。当然,我们在节目说明中提供了所有这些框架的链接,包括 Small Agents、Langchain、Llama Index、Pydantic、Microsoft、Autogen 和 Crew。好了,这就是今天的节目内容。如果您喜欢它或认识可能考虑与他们分享本集的人,请在您最喜欢的播客平台上留下节目的评论。在 LinkedIn 或 Twitter 帖子中标记我,并留下您的想法。如果您还没有订阅该节目,显然要订阅。
然而,最重要的是,我希望您能继续收听。直到下次,继续在外面摇滚,我期待着很快与您一起再次享受 Super Data Science Podcast。