We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

The Agent Network — Dharmesh Shah

2025/3/28

Latent Space: The AI Engineer Podcast — Practitioners talking LLMs, CodeGen, Agents, Multimodality, AI UX, GPU Infra and all things Software 3.0

AI Deep Dive AI Chapters Transcript

People

Charlie

Dharmesh Shah

Topics

Dharmesh Shah: 我对 Agent 的定义是：AI 驱动的软件，能够完成目标。这与其他定义有所不同，但随着 AI 的发展，不同类型的 Agent 会出现，例如自主/非自主、确定性/非确定性工作流程等。Agent 的本质是代理，可以将其简化为最基本的“原子 Agent”，然后组合成复杂的系统。我认为 2026 年将是多智能体系统的时代，Agent 之间将通过类似 MCP 的机制进行协作。我个人对 Agent 的定义是 AI 驱动的软件，能够完成目标。虽然这听起来很宽泛，但随着 AI 技术的发展，不同类型的 Agent 会不断涌现，例如自主或非自主 Agent，确定性或非确定性工作流程 Agent，同步或异步 Agent 等等。这些 Agent 的交互模式也多种多样，有的像客服 Agent 一样进行同步的来回对话，有的则像工作流程 Agent 一样执行一系列离散步骤。我认为 Agent 的核心是目标导向。我们可以将 Agent 想象成单细胞生物，最简单的 Agent 可以看作是“原子 Agent”，而复杂的 Agent 则是由多个原子 Agent 组合而成。工具可以被视为原子 Agent，通过类似 MCP 的机制，多个 Agent 可以协同工作，分解复杂问题，并相互委托任务。我认为未来 Agent 的发展方向是多智能体系统，Agent 之间将通过类似 MCP 的机制进行协作，共享信息和资源。MCP 标准的出现是 AI 领域的一大进步，它简化了 Agent 之间的交互和工具的使用。Agent.ai 就是一个致力于构建多智能体系统的平台，它将 Agent 视为团队成员，并提供了一个类似 LinkedIn 的专业网络，方便 Agent 之间的发现和协作。 Alessio: 我关注的是 Agent 的最小可行版本以及 Agent 的用户界面设计。我主要关注的是最小可行 Agent 的定义以及 Agent 的用户界面 (UI) 设计。关于最小可行 Agent，我认为它必须在某种程度上使用 AI，否则它就只是普通的软件。关于 UI 设计，我认为 Agent 的 UI 应该尽可能简单，并且可以根据用户的需求进行定制。此外，我还对 Agent 的评估方法很感兴趣。我认为，应该有一种客观的方法来评估 Agent 的性能，例如通过运行模拟来测试 Agent 的能力。在 Agent.ai 平台上，我们已经开始尝试使用这种方法来评估 Agent 的性能。 Swyx: 我关注的是 Agent 的分类、发展历程以及记忆在 Agent 中的作用。我从语言学的角度看待 Agent，更关注 Agent 的描述性定义，而不是规定性定义。我认为 Agent 的发展经历了从简单的聊天机器人到复杂的智能体系统的演变过程，这其中 MCP 标准的出现起到了关键作用。此外，我还关注 Agent 的记忆机制，我认为 Agent 应该拥有长期记忆，并且能够在 Agent 之间共享记忆。这将极大地提高 Agent 的协作效率和知识利用率。

Deep Dive

Shownotes Transcript

大家好，这里是你们的 AI 联合主持人 Charlie。我们从旅行中回来了，很高兴能回到演播室，与今天的特邀嘉宾 Dharmesh Shah 再次见面，他是一位充满激情的极客，Agent AI 的创造者，HubSpot 的 CTO，也是我们节目中第二位对 AI 深度痴迷的上市公司创始人。特别感谢播客同行 Sean Puri 为我们引荐了这位梦寐以求的嘉宾。

你可能从 Dharmesh 将 chat.com 域名以 1500 万美元的价格出售给 OpenAI 的传奇故事中听说过他。2023 年，Dharmesh 推出了智能 CRM Chatspot。2024 年，他宣布了完全免费的 Agent.ai 代理构建器。今年，Dharmesh 正在将 Agent.ai 打造成一个 AI 代理及其爱好者的市场和专业网络。

我们在纽约 AI 工程师大会之后录制了这一集，Swix 在他的《Agent 工程》主题演讲中总结了所有关于代理的定义，你可以在 Latent Space 博客上找到它。

Dharmesh 采取了一种不同、更简洁的代理定义方法，并将 2026 年视为多代理网络的时代。其他新闻是，我们将与大家最喜爱的嘉宾 David Hershey 再次合作，本周日与 Anthropic 举办 Claude Plays Pokémon 黑客马拉松。如果你不在旧金山，我们很高兴推出 2025 年 AI 工程现状调查，你可以在节目说明中找到它。请注意安全，照顾好自己。

大家好，欢迎回到 Latent Space 播客。我是 Alessio，Decibel Partners 的合伙人和 CTO，我的联合主持人是 Wix，SmallAI 的创始人。你好，今天我们非常高兴邀请 Dharmesh Shah 加入我们。我想你在这里的相关头衔是 Agent.AI 的创始人。是的，对这次访谈来说是这样的。是的，Agent.AI 的创造者和 HubSpot 的联合创始人。HubSpot 的联合创始人，我已经关注了很多年，我想现在已经有 18 年了，很快就要 19 年了。是的。

而且你抓住了，你知道，人们可以在其他地方了解你的 HubSpot 故事。我还应该感谢 Sean Puri，我和他来回聊过，他一直在帮我联系你的人。但我也认为，就像，只是给了我们很多背景信息，因为很明显，《我的第一个百万》加入了你们，他们一直在和你们聊天。所以对于业务方面，我们可以谈谈这个，但我有点想参与你的 CTO、代理、工程师方面的事情。那么你是如何获得 Agent 信仰的呢？让我们看看。所以我……

我会退后一步，大约十年前，尽管实际上不止十年。所以在 HubSpot 之前，我考虑过的一家公司叫做 Ingenisoft。Ingenisoft 背后的理念是自然语言界面到业务软件。现在意识到这是 20 年前的事了，所以这是一件很难做到的事情。但我当时想到的实际用例是，

你知道，我们的数据存储在业务系统中，比如 CRM 或类似的东西。而我当时认为很聪明的是，哦，如果我们使用电子邮件作为访问业务软件的界面呢？使用电子邮件的动机在于它在您离线时也能自动工作。所以想象一下，我正在登机或在飞机上。当时飞机上没有互联网。就像，哦，我正在浏览我参加的一个活动的商务名片。我可以直接在电子邮件中输入内容，以便将它们全部放在待办事项列表中。当它重新连接时，它会将这些电子邮件发送给一个处理器，该处理器基本上会解析命令并更新软件，发送文件，无论是什么。而且只有一小部分命令。我在当时实际可能实现的技术方面领先了一点。我用一个叫做 ChatSpot 的产品重新尝试了这个自然语言的事情，我是在 20……是的，这是你 ChatGPT 后的第一个项目。我看到了它的发布。是的。所以我一直对这种自然语言软件界面很着迷，因为，你知道，作为软件开发人员，包括我自己，我们总是说，哦，我们构建的是直观易用的应用程序。但它根本不直观，对吧？因为我们正在……我们正在采用我们头脑中关于我们试图用该软件完成的目标的心理模型，并将其转换为一系列触摸、滑动、点击等操作。而这其中没有任何自然或直观的东西。因此，自然语言界面……

第一次，你知道，无论你脑子里有什么想法，并用你通常用来在脑子里自言自语的任何语言表达出来，你都可以直接表达出来，让软件做一些事情。我认为这是一个突破，它确实是一个突破。而且它已经实现了。所以这就是我第一次开始踏上旅程的地方。我开始是因为它现在真的有效了，对吧？所以一旦我们有了 ChatGPT，即使只有一个例子，你也可以将某些东西转换成结构化的东西，即使在 ChatGPT 3.5 时代，如果你知道你将要使用什么样的意图，它也能在几个例子中做得不错，将某些东西转换成结构化的文本。而这发生了。最终成为了一个 HubSpot 项目。但随后代理引起了我的兴趣，因为我想，好吧，这是下一步。所以聊天很棒，我喜欢聊天用户体验。但如果我们想做一些更有意义的事情，感觉下一步的进步不是这种……

我正在与一些软件进行同步的来回对话，而是软件将以多步骤的方式为我做一些事情，以尝试实现某些目标。所以是的，这就是我第一次开始的时候。就像，好吧，那会是什么样子？而且从那以后我一直很痴迷，顺便说一句。这可以追溯到你第一次使用它的经历，就像你离线一样。是的。你想完成一项任务。你现在不需要做它。你只想把它排队让别人为你做。是的。当你考虑代理时，让我们从一个简单的问题开始，那就是，你如何定义一个代理？也许。你是说宇宙中最难的问题吗？你是这个意思吗？你说你有一个令人恼火的看法。我确实有一个令人恼火的看法。我认为，好吧，一些人感到恼火，包括我自己的团队成员。所以我对代理有一个非常宽泛的定义，那就是它是实现目标的 AI 驱动的软件。就是这样。让人们恼火的是，它太宽泛了，以至于完全没有用。我理解这一点。我理解这种批评。但在我的脑海里，如果你快进……

几个月，我想，在 AI 年。它的实现，我们已经开始看到这一点，我们将讨论这一点，不同类型的代理，对吧？所以我认为除了有一个可用的定义，顺便说一句，我喜欢你的定义，我们应该更多地讨论你刚刚提出的那个定义，代理的分类实际上也很有用，那就是，它是自主的还是非自主的？它有确定性工作流程吗？它有非确定性工作流程吗？它是同步工作还是异步工作？然后你还有不同的交互模式。它是一个聊天代理，就像客户支持代理一样吗？你正在进行这种来回对话。它是一个只执行离散步骤的工作流程代理吗？所以有很多不同类型的代理。如果我要在一个维恩图中绘制它，我会画一个大圆圈，上面写着，这是代理，然后我有一堆圆圈，有些是重叠的，因为它们不是互斥的。

所以我认为这就是有趣的地方，我们正在看到沿着许多不同路径的发展，对吧？所以如果你看看代理框架的第一个实现，看看 Baby AGI 和 AutoGBT，我认为是，不是 Autogen，那是微软的那个。他们领先于时代，因为他们假设了这种推理、执行和规划能力，而这种能力根本不存在，对吧？所以这是一个有趣的思想实验，它就是这样的。甚至那个家伙，我是 Yohei 基金的投资者，他做了 Baby AGI。它还没有准备好，但这预示着即将到来的一切。所以接下来的问题是，它什么时候准备好？所以很多人谈论代理的最新技术。我是一个实用主义者，所以我考虑的是实际情况。就像，好吧，我能实际构建什么东西具有商业价值或解决一些具有某种可重复性或可验证性的离散问题？所以，是的。有很多内容，非常有趣。我一点也不恼火。我认为，正如你所知，

我采取了一种人类学或语言学的观点。在语言学中，你不想规定性，你想描述性。所以你是一个目标导向的人。这是你观点中的关键词。其他人有其他定义，可能包括委托信任或非确定性工作、循环中的 LLM，所有这些东西。我想到的另一件事，只是关于 Baby AGI、LGBT 的评论。是的，在你刚刚读到的那篇文章中，

我能够浏览我们的积压工作，并跟踪代理的寒冬和现在的夏天。我们可以将整个故事作为口述历史来讲述，只需遵循这条线索。它实际上就像，我认为，我试图解释现在的原因，对吧？就像我一样，当然有更好的模型。使用像这样的工具更好，它们更可靠。使用 MCP 等更好的工具。我相信你对这方面也有自己的看法。我确实有。业务模式转变，你非常喜欢。我刚刚听到你和 MFM 的人谈论 RAS。成本大幅下降。推理速度越来越快。模型多样性更多，我认为这是一个微妙的点。这意味着……

你拥有具有不同视角的不同模型。你不会陷入单个模型的性能盆地。你可以通过切换模型来摆脱它。多代理研究和 RL 微调。所以我只想让你回应其中任何一点。是的，几件事。连接定义方面的要点。所以我们将完全消除恼怒。关于代理定义，我还有一个更令人恼火的飞跃。所以这就是我的想法。顺便说一句，代理这个词，我查了一下，就像英语词典的定义一样。老式的代理，是的。是你让某人或某物代表你做某事的时候，就像旅行社或房地产经纪人代表你行事一样。它就像代理一样，这是一个很好的通用定义。所以我正在走向另一个方向，它将与工具调用和 MCP 等联系起来，那就是如果你，我不是生物学家，但我们有这些单细胞生物，对吧？就像人们所说的生命的最简单形式一样。

但它仍然是生命。它碰巧是单细胞的。然后你可以组合细胞，然后细胞随着时间的推移变得专业化，你就会有更复杂的生物，你知道，在光谱的更下方。在我看来，在最基本的层面上，你几乎可以认为拥有原子代理。什么是最简单的可以被称为代理的代理？单细胞生物的等价物是什么？我认为这有用的原因是，我们现在正走在一条我认为非常令人兴奋的道路上，那就是工具的使用，对吧？它说，好的，LLM 现在可以获得一组工具，它可以调用这些工具来完成它为了实现任何目标而需要完成的任何事情。而且我并不太在意它，但如果你考虑一下，如果你稍微眯起眼睛说，好吧，如果一切都是一个代理呢？如果工具实际上只是原子代理呢？因为那样的话，它就是一直到乌龟，对吧？然后就像，哦，好吧，工具使用中真正发生的一切就是我们有一个代理网络，它们通过类似 MMCP 的东西了解彼此，并且可以分解特定问题并说，哦，我将把这个委托给这组代理。为什么我们需要区分工具（大多数情况下是函数）和实际代理？所以……

所以我要写一篇令人恼火的 LinkedIn 文章来提出这个建议。就像，好吧。我并不是说我们应该称函数为代理。但是当你这样说时，会产生一定程度的优雅，哦，我们可以将其简化为一个原语，它是一个代理，你可以以复杂的方式组合它来提高抽象级别并实现更高阶的目标。无论如何，这就是我的答案。我会说这是一个成功。感谢你参加我的关于代理定义的 TED 演讲。你如何定义最小可行代理？你是否已经对你在细胞和原子之间划线的界限有了定义？是的。在我看来，它必须在某种程度上使用 AI，否则它只是软件。就像，你知道，我们不需要另一个词来形容它。所以……

这可能是我划线的地方。所以接下来的问题是，你知道，反驳的论点是，好吧，如果这是真的，那么许多工具本身实际上并不是代理，因为它们只是在进行数据库调用或 REST API 调用，或者它们正在做的任何事情。这并不一定使它们合格，这是一个公平的反驳论点。我接受这一点。这就像一个很好的论点。我仍然喜欢考虑，因为我们将讨论多代理系统，因为我认为……所以我们已经接受了，我认为这是正确的。很多人已经说过，而且你希望已经组合了一些真正聪明的人说的片段，说这是代理之年，我完全同意，这是代理之年。但在那之后不久，它将成为多代理系统或多代理网络之年。我认为这就是它明年将要前进的方向。已经开始关注这一点。是的。我对这方面的快速哲学思考是，我经常考虑另一种光谱，细胞光谱的另一端。所以单细胞是生命，多细胞是生命，你将一堆细胞聚集在一起形成更复杂的生物体，它们变成器官，比如眼睛和肝脏等等。然后很明显，我们认为自己是一种生命形式。我体内并没有很多生命。我只是一个生命。现在……

很明显，我认为人们并不真的喜欢将代理和 AI 拟人化，但我们正在将我们的意识、大脑和功能扩展到机器中。我刚看到你是一只蜜蜂。是的。这是一个很好的例子。我的口袋里有一个无限的吊坠。我也有一个。是的。我正在测试它。你知道，必须成为早期采用者。但是，就像……我们想将我们的个人记忆扩展到这些东西中，这样我们才能擅长我们擅长的事情。而且，你知道，机器擅长它。机器就在那里。所以就像，我对生命的定义现在有点像超越我自己的身体。我不知道你是否曾经有过这样的反思。就像你的。我们的自我实际上是如何分布在你之外的。是的，我不认为自己是哲学家，但是……

你提到了它，所以。是的，我提到了它。我对图和图论以及网络很着迷，而且已经很长时间了。对我来说，我们都是这个更大体系中的节点。碰巧的是，我们正在关注目前存在的个体生命形式。但是，所以当你在那里发布播客时，你发布的这些小节点就像……你知道，概念性想法。再一次，你拥有各种形式的这些小节点，它们以各种方式连接在一起。所以我只是认为自己是一个巨大的、巨大的网络中的一个节点。当我发布内容或想法时，我正在产生更多节点。而且，你知道，你生命中的一部分时间是在收集点、经验、人，而你生命中的一部分时间则是在连接你随着时间的推移收集到的点。我发现真正有趣的事情发生了，你真的无法预先知道这些点将来会如何连接。就是这样。所以这就是我的哲学观点。是的，就是这样。回来。

是的。你喜欢图作为代理吗？抽象？这已经成为 LandGraph 和 Pydantic 等热门话题之一。我喜欢。我更感兴趣的是图的使用，现在有很多工作正在进行中，是图数据存储作为知识存储和知识图的替代方案。因为，你知道，所以我已经在软件行业工作了 30 多年了，对吧？所以这不是 10000 小时。我花了 100000 小时做这些事情。所以我成长于……

所以在过去，你知道，我从大型机开始。IBM 有一个叫做 IMS 的产品，它基本上是一个索引数据库，我们今天称之为键值存储。然后我们有了关系数据库，对吧？我们有表、列和外键关系。我们都知道。我们有像 MongoDB 这样的文档数据库，它是一种由特定索引键控的嵌套结构。我们有向量存储、向量嵌入数据库。图之所以有趣，有两个原因。一个是……

它不是以关系方式经典地构建的。当你提到结构化数据库时，大多数人想到的是表和列以及关系数据库和集合论等等。图仍然具有结构，但它不是表和列结构。你可以怀疑，人们已经提出了这个论点，那就是……

它们比其他东西更能代表 LLM 和 AI 的知识。所以这是概念上第一件事，这可能是真的，我认为可能是真的。而我真正喜欢它的另一件事是在 RAG 数据存储的背景下，你知道，RAG，你说，哦，我有一百万份文档。我将构建向量嵌入。我将根据语义匹配返回前 X 个数据。

这很好。所有这些都非常有用。但现实情况是，在分块过程中会丢失一些东西。你并没有真正看到全貌，更不用说更广泛的图片的正确维度了。在我看来，如果我们以图形形式正确地捕获它，

那么也许将其馈送到 RAG 管道将为某些用例产生更好的结果。我不知道，但是，是的。你是否觉得它的核心在于命令式程序和声明式程序之间的区别？因为如果你考虑 HubSpot，就像，你知道，人们……

图和图紧密相关，你知道，但我认为之前的软件更像是基于主键外键的关系，而现在模型可以更容易地遍历图。是的。所以我喜欢这种表示。有些东西只是在概念上很优雅，只是从它的表示来看，它们更容易发现。你可以看到它。它具有可观察性，而不是嵌入，你作为人类无法真正使用它。你知道，一旦它们在那里，你就无法将东西拉出来。但是，是的，我喜欢这种想法。而……

另一件事是，因为我喜欢图，我长期以来一直痴迷于早期的 PageRank。而且，你知道，在提出权威方面，一种最简单的算法，每个人都接触过 PageRank。但其思想是，所以我对一个项目（而不是公司）有另一个想法，我有数百个这样的想法，叫做 NodeRank，它能够采用 PageRank 的思想并将其应用于任意图，它说，好的，我将定义权威是什么样的，然后说，好吧，这对我来说很有趣，因为如果你说，哦，我将采用我的知识库，也许这个贡献了一些块到图数据存储的人在这个特定用例或正在提交的提示上比另一个可能更有权威性，或者也许这个更受欢迎，或者也许这个具有任何东西。我们应该有一种方法来对图中的节点进行排序并以某种方式对它们进行排序。

某种有用的方式。是的。我认为这对于任何事情都普遍有用。我认为问题是，所以即使在我的会议上，GraphRag 非常流行，人们正在获得知识图信仰。我会说，它在两个领域获得了关注，即对话记忆，以及一般的 rag，就像文档数据源一样。大多数人，

ML 从业者会说知识图有点像脏话。图数据库，人们获得图信仰，一切都是图，然后他们非常努力地投入其中，然后他们得到一个太复杂的图，无法导航。是的。所以简单地说，就像，

你在运行 HubSpot，你知道图的力量，就像 Google 多年来一直在宣传的那样。但我怀疑 HubSpot 本身并没有使用知识图。不。是的。所以，基本上，什么时候是过度工程？这是一个很好的问题。我不知道。所以现在，就像在 AI 领域一样，对吧，是，我们是否需要理解？所以现在，LLM 对于……

大多数情况下都是某种黑盒，对吧？我们多少了解算法本身是如何工作的，但我们真的不知道里面发生了什么以及事情是如何发生的。所以如果图数据存储能够产生我们想要的结果，就像，这里有一组我想提交的查询，然后它会输出有用的内容。

也许底层数据存储与向量嵌入一样不透明，但也许没关系。也许我们不需要理解它就能从中获得效用。所以也许如果它很混乱，也没关系。这只是另一种有损压缩。这只是我们不完全理解的一种有损方式，因为它是会自然增长的，而且它没有结构。就像，啊，我们只是要把一堆东西扔进去，让嵌入算法的等价物，无论它们在 Graphland 中被称为什么。所以结果最好的那个获胜。

我认为是这样，是的。或者这是我的务实方面。就像，是的，如果它有用，我们就不需要理解它。我的意思是，只要你愿意，我很乐意反驳。当然，你应该。评估那里的 10 个不同选项并不实际，因为它需要时间，需要人员，需要资源，对吧？这是第一件事。第二件事是你的评估通常是在小事情上进行的。有些事情只有在大规模情况下才能奏效，就像图一样。是的，这是公平的。我认为这是图数据库实现方面的挑战之一，

那就是我看到的开发人员所采取的最常见方法，我自己也这样做过，那就是，哦，我有一个 Postgres 数据库或 MySQL 数据库或其他什么。我可以使用一组表来表示一个图，其中包含父子关系等等。这给了我某种能力，为什么我需要比这更多的东西呢？答案是，好吧，如果你不需要比这更多的东西，你就不需要比这更多的东西。但是，你很可能会错过图表示提供的实际价值。这是能够高效地遍历图，以某种方式遍历关系数据库形式，即使在结构上你拥有数据，实际上你将无法以有用的方式提取它。所以你不会喜欢用这种关系表模型来表示社交图。它根本无法扩展，它无法工作。是的。

我认为我们想继续讨论 MCP，但我只想提供一些工程建议。显然，你必须做过很多项目并管理过很多团队。你是否有关于过度工程或提前工程的通用规则？因为人们，我们知道过早的工程是万恶之源。但有时你必须这样做。是的。你什么时候这样做？是的，这是一个很好的问题。这几乎是一个古老的问题，那就是什么是正确和错误的抽象级别？当我们试图进行工程设计时，我们实际上就是在回答这个问题。我倾向于成为一个实用主义者，对吧？所以事情是这样的。很多时候，以正确的方式做事。是的。就像在这些情况下，边际成本略有增加一样。以正确的方式去做。这就是让优秀的工程师或优秀的工程师比……

不太优秀的工程师更好的原因。就像，好吧，在所有条件相同的情况下，如果它要花费你……你知道，大约是恒定的时间，那么最好以正确的方式去做。所以把事情做好。然后问题是，好吧，我是在构建一个框架吗？它是一个可重用的库吗？在什么程度上？我正在预测在这个东西中需要改变什么？沿着什么维度？然后我认为像一个商人一样，就像卡路里的回报率一样，对吧？所以，而且你看……能量，它的期望值就像，好吧，这里有五种可能发生的事情，尝试分配概率，就像，好吧，如果我们有 50% 的机会在未来的某一天走上这条特定路径，就像，或者这五件事中的一件事将会发生，而为之进行工程设计要多花 10% 的成本。基本上，它是一种产生复利价值的东西。随着你越来越接近需要它的时间，而不是不得不承担债务，那就是当你设计不足时，你正在承担债务。当你最终遇到这种情况时，你将不得不偿还债务，即发生某些事情。作为一名实用主义者，一件事……所以我宁愿设计不足也不愿过度设计。如果我要偏向某一方面，原因如下：当你设计不足时，是的，你会承担技术债务，但利率是相对已知的，而且偿还非常有可能，对吧？那就是，哦，我在这里走了一条捷径，结果现在这个应该花费我一周时间的事情现在要花费我四周时间。很好。但如果你认为可能会发生的那件事实际上从未发生过，你从未遇到过这种情况，或者根本没有发生，就像，好吧，你只是节省了自己的时间，对吧？这很有价值，因为你可以做其他事情，而不是……稍微过度设计它。但是，在艺术形式中没有完美的答案，而且是的，我们将把这种抽象层带回到代码生成对话中，我们将……我认为我稍后会提到，但是……

0 然后我像个商人一样思考问题，比如卡路里的回报率是多少？所以，你看看能量，期望值就像，好吧，这里可能有五种情况会发生。尝试分配概率，比如，好吧，如果有一天我们有 50% 的机会走这条路，或者这五件事中的一件事会发生，而你需要为此付出 10% 的额外工程成本。基本上，随着你越来越接近需要它的时间，它会产生一种复利价值，而不是承担债务，当你承担债务时，你就是在承担债务，当你遇到这种情况时，你必须偿还债务。作为一个实用主义者，我宁愿低估某些东西，也不愿高估它。如果我要偏向某一方，原因如下：当你低估某些东西时，是的，你会承担技术债务，但利率是相对已知的，而且偿还债务的可能性非常大，对吧？也就是说，哦，我在这里走了一条捷径，结果导致这件事本来只需要花我一周时间，现在却要花我四周时间。好吧。但如果你认为可能会发生的那件事实际上并没有发生，你从未遇到过这种情况，或者根本没有发生，那就好像，好吧，你节省了时间，对吧？这很有价值，因为你可以做其他事情，而不是稍微过度设计它或过度设计它。但在艺术形式方面并没有完美的答案，是的。

我们将把这种抽象层带回到代码生成对话中，我认为我们稍后会讨论。我本来想问，我们可以快速跳到前面。当你想到氛围编码和所有这些时，潜在用途的百分比是如何变化的？我觉得过度设计很多时候就像，

对语法的投资。这与精确的弧度投资关系不大。是的。这会如何改变你的计算？对吧？几件事，对吧？一个是，你知道，回到那种投资回报率或卡路里的回报率之类的计算或启发式方法，你会想到，好吧，我现在在编写代码之上添加这一抽象层需要花费多少成本，并预测未来的需求？如果现在修复或进行低估的成本趋于零，这意味着，好吧，我不必现在就做到正确，因为即使我做错了，我也会运行这个东西六个小时而不是六十分钟，或者其他什么。这并不重要，对吧？因为这将趋于零，即重构代码的能力。因为我们不会太久，我们将拥有，你知道，大型代码库能够存在，你知道，作为代码生成或代码重构模型的上下文。所以……

我认为这将使低估的理由更加充分，这就是为什么我承担这项成本的原因。你只需要在你到达那里时支付利息。这不仅仅是继续你的生活，氛围编码，并在你需要时回来。是的，有时我觉得有些事情没有做决策。就像今天，我为我们内部的笔记平台构建了自动保存功能。当然。我实际上只是在 Cursor 上问，你能添加自动保存吗？是的。我不知道它是过度设计还是低估了。是的。我只是氛围编码了它。是的。我觉得在某些时候，我们会达到模型的程度

那种正确的界限。但这就是在我看来危险所在，对吧？所以这里有两方面。一方面是开发和编码之类的成本，我们讨论过这些内容。但就像你的例子一样，我们面临的风险之一是，因为添加一个功能，比如保存或任何添加到产品中的功能，随着价格趋于零，我们是否会对添加哪些功能变得不那么挑剔，从而导致产品变得更加复杂，从而对用户产生负面影响，对业务产生负面影响

对业务产生负面影响。所以这就是我担心的问题。如果它变得太容易，我们是否会在某种程度上扩展我们的产品，添加产品扩展等等？就像，啊，为什么不添加 X、Y、Z 或其他任何东西呢？那时的情况是，哦，我们只有这么多工程小时或故事点，或者无论你如何衡量事情。

至少这让我们有点控制。是的。然后是过度设计，你就像，是的，这就像你给自己施加压力一样。就像现在模型不明白，如果他们添加了太多的复杂性，它以后会反过来咬他们一口。所以他们只是做他们想做的事情。是的。我很想知道工作流程中的哪个地方会是这样的，嘿，这就是你可以在向我询问是否应该实际执行它与执行其他操作之间进行过度设计的复杂性数量。我认为，所以，你知道，我们已经，就像我们正在离开这个代码生成世界，对吧？

这种压缩的周期时间，对吧？就像，好吧，我们从 GitHub 副驾驶的自动完成到，哦，完成这个特定的事情并点击 Tab 到，哦，我有点了解你的文件或其他什么。我可以为你写出一个完整的函数，现在我可以像在我的脑海中保留一堆上下文一样，所以我们可以进行应用程序生成，我们现在可以使用 lovable 和 bolt 和 replit 代理以及其他东西来进行。

那么问题是，好吧，它自然会从这里走向何方？所以我们将生成产品。有道理。我们也许能够生成平台，就像我希望有一个 ERP 平台来做这件事一样，无论是什么。这包括 API、产品和 UI 以及构成平台的所有内容。

没有什么能阻止我们。就像，好吧，你能在某一天生成一个完整的软件公司吗？对吧？有了平台、货币化、市场营销等等。你知道，这对我来说很有趣，因为当你把它带到几乎荒谬的抽象程度时。就像，好吧。把它调到 11。你提到了氛围编码，所以我必须……这是一个我还没有写过的博客文章，但我正在探索它。初级工程师死了吗？我不这么认为。我认为将会发生的事情……

是初级工程师将能够，如果他们所带来的只是他们是一名初级工程师这一事实，那么是的，他们很可能会死。但如果他们能够与碳基生命形式交流，他们能够与产品互动。如果他们愿意与客户交谈，他们可以利用他们对工程和软件工作方式的基本理解。我认为这很有价值。所以我现在有一个 14 岁的孩子，他正在上 Python 编程课。有些人问我，就像，他为什么要学习编码？我的回答是，因为这与语法无关，与编码无关。他学习的是关于事物如何运作的基本原理。这很有价值。我认为在系统思维、抽象以及这意味着什么方面将具有永恒的价值，无论函数是否表现为数学，他无论如何都会接触到，或者，你知道，

宇宙中有一些核心基本原理，我认为，你越了解它们，我就越认为它们是你生活中真正的大点，它们会对你产生更大的引力，你会能够……所以我希望他收集这些点，而且他没有抗拒。所以就像，好吧，

在他还在听我的话的时候，我会让他做我认为有用的事情。是的。你知道，我评估的 AI 工程师的宣传之一是一个术语。这个术语是，也许软件工程师的传统面试路径或职业路径消失了，因为 LeetCode 的意义何在？是的。你知道，你更重要的是知道如何使用 AI 并实现你想要的东西。是的。这是生成式 AI 带来的有趣之处之一。你知道，你从机器学习和模型以及这种底层形式开始，这就像真正的工程一样，对吧？就像实际的，我所说的真正的工程。实际上，我不认为自己是真正的工程师。我是一个开发者。但现在有了生成式 AI，我们称之为 AI，它显然起源于机器学习。但对我来说，这感觉完全不同。就像你有了氛围，就像，好吧，这只是对软件开发的一种完全不同的方法，对很多不同的东西都是如此。所以我

我现在想知道，就像 AI 工程师一样，如果你要画一个维恩图，这很有趣，因为 AI 领域、AI 的旅程以及工具的功能、模型的功能以及我们仍在构建的这个全新的知识体系之间的交叉，仍然非常年轻，与经典工程、软件工程相交。是的。我只是将重叠部分描述为最终分离成它自己的东西，但它最初是一个软件。是的。

这有道理。为了结束字节编码循环，现在另一个大热门是 MCP。显然，我会说 Cloud Desktop 和 Cursor 是 MCP 使用的两个主要驱动因素。我会说我最喜欢的是 Sentry MCP。我可以拉入……

然后你就可以把上下文放在光标里。你怎么看待这个抽象层？这感觉有点像魔法吗？你认为它像你得到的一样多吗？因为你真的看不到服务器本身是如何为你重新打包信息的。是的。

我认为 MCP 作为一项标准，是 AI 领域发生的最棒的事情之一，因为需要一个标准，如果没有标准，就会有一系列事情是不可能的。现在，我们可以争论它是否是标准的最佳体现。它做得太多吗？太少了吗？我明白，但它就像……

足够简单，既有用又易于理解，普通人也能采用，对吧？它并不复杂。一个合理的工程师可以相对轻松地建立一个 MCP 服务器。让我兴奋的是，所以我很相信多代理系统。所以这回到了我们对原子代理的这种想法，

所以想象一下 MCP 服务器，显然它调用工具，但我思考的方式是，所以我正在从事我的当前激情项目 agent.ai。我们将更多地讨论，我认为我们应该，因为我认为不宣传这个项目很有趣，但这里有一些有趣的想法。其中之一是关于

如果代理要协作并能够委托，我们将需要某种发现机制，我们将需要某种标准方式。就像，好吧，我只需要知道那边的这个东西能做什么。我们将需要一个注册表，Anthropic 正在开发这个注册表。我相信其他人也会这样做，并且一直在做目录，并且还会有一个关于这个的标准。那么，你如何以标准的方式构建 MCP 服务器的目录呢？我认为这将解锁很多东西，因为，我们已经开始看到这种情况了。所以，我认为

mcp 或类似的东西将成为下一个主要的解锁，因为它允许彼此不了解的系统不需要仅仅是欺骗，这就是像世纪和其他人正在构建的工具之间的这种解耦，而不仅仅是关于你知道的云桌面或类似的东西，即使在客户端方面，我认为我们也会看到非常有趣的 MCP 消费者，MCP 客户端，而不仅仅是聊天主体之类的东西，比如你知道的云桌面和光标等等，但是

我对 MCP 在这个方向上感到非常兴奋。我认为典型的愤世嫉俗的开发者会说，我们有 OpenAPI。有什么新东西吗？我不知道你是否有一个……你有没有快速比较 MCP 与其他所有内容？是的，所以……

我喜欢 OpenAI，对吧？所以只是一个描述性的事情。OpenAPI。OpenAPI。是的，这就是我的意思。所以它基本上是一个自文档化的事情。我们可以从该输出中生成很多机器生成的东西。这是一个 API 的结构化定义。我明白，我喜欢它。但是 MCP 某种程度上是特定于用例的。它们非常适合我们围绕 LLM 用于发现的目的。就像，好吧，我不需要知道所有这些细节。所以现在我们有，我们将更多地讨论 MCP 服务器的实现，但是……我们将讨论。我认为……

我不知道。也许我们不会。至少在我的脑海里是这样。它就像一个 Python 和一个后处理器。但我确实认为 MCP 在 OpenAPI 之上增加了价值。这是……

是的。因为它解决了这个特定问题。如果我们来到这个世界，我们已经有了，就像，嘿，我们已经有 OpenAPI 了。就像，如果这对宇宙来说足够好，宇宙早就已经采用了它。MCP 兴起是有原因的，因为它在边际上增加了一些之前缺失的东西，而且不会走得太远。这就是为什么采用率，你们已经写过这篇文章并讨论过它。是的，为什么 MCP 赢了。是的。它赢了，因为……

宇宙认为这很有用。也许它会被其他东西取代。也许我们会发现，哦，也许 OpenAPI 一直都足够好了。我对此表示怀疑。元教训，我的意思是，他是一位 DevTools 公司的投资者。我在 DevTools 公司的 DevRel 中从事开发者体验工作。每个人都想拥有这个标准。是的。

我相信你们尝试过推出自己的标准。实际上，HubSpot 是否以标准而闻名？你知道，显然是入站营销，但是你有没有尝试过推动任何标准或协议？没有。这是有原因的，那就是，我并不意味着需要代表 HubSpot 的员工发言，但我个人确实如此。我不够聪明。这不是，就像，我认为我为此做的足够多了。

我更好地理解现有的标准。我更倾向于组合性。让我们采用现有的技术组件，以创造性的独特方式将它们组合起来。我喜欢使用标准。我不喜欢创建它们。我只是不认为我既有足够的能量，也有足够的信誉。就像，好吧，达梅什是谁？我们为什么要采用他创建的标准呢？是的，我的意思是，有些人不会将标准货币化。例如，OpenTelemetry 就是一个很大的标准，而 LightStep 从未从中获利。

好的，如果我要制定一个标准，过去我的脑海里有两件事。一个关于，一个非常非常基本的东西，我甚至没有域名，我有一个关于开放式营销的域名。我们在 HubSpot 面临的问题是在营销领域成长起来的。没有关于数据格式之类的标准。它不会有任何进展。但另一个，我并不想在这里讨论，但我将在这里讨论，它被称为 OpenGraph。我知道这个术语已经被使用了，但它在过去 15 年中并没有用于其最初的目的。但我认为世界上应该存在

现在我们的信息，我们所有的节点都在 Meta 的社交图谱或 LinkedIn 的专业图谱中，这两者实际上都相对封闭，而且非常令人讨厌，非常非常封闭，对吧？尤其是 LinkedIn。我个人认为，如果这是我的数据，

如果我能够从它的开放中获得效用，我应该能够公开我的数据或以我选择的任何形式发布它，只要我能够通过选择加入来控制它。所以这个想法围绕着 OpenGraph，它说，这是一个标准，这是一个发布它的方法。我应该能够访问 opengraph.org/darmesh.json 并取回它。就像，这是你的东西，对吧？我可以随时选择，人们可以写入它，我可以证明，并且可以有一个完整的系统。如果我要这样做，我会把它作为一个，就像一个，

公共利益、非营利性的东西。这是对社会的贡献。我不会试图将其商业化。你看过 AdProto 吗？那是什么？AdProto。它是 Blue Sky 背后的协议。好的。我的好朋友 Dan Abramov，他多年来一直是 React 的代言人，现在在那里工作。他实际上做了一个演讲，我可以发给你，它基本上阐述了你刚才所说的内容，但他确实，他喜欢做这些非常棒的类比，我认为你会喜欢的，就像，你知道，我们很多数据都在一个句柄后面，在一个域名后面。是的。所以他说，好吧，如果我们反过来呢？如果它像我们的句柄，然后是域名呢？所以，这真的就像你的数据应该属于你。是的。我不应该不得不等待 30 天才能导出我的 Twitter 数据。是的。完全正确。

你应该能够至少能够自动化它或做类似的事情，是的，我应该能够把它插入到一个代理的东西中。是的。我认为我们，因为我们的很多数据都被锁定了。我认为这里的诀窍不是那个标准。而是让普通人关心它。是的。

是普通人不在乎。这是真的。但基于此，普通人不在乎。所以隐私是一个非常热门的话题，也是一个容易使用的词，但它不是一个二元的东西。就像有一些用例，我们一直在做出这些选择，我会权衡，不是所有的隐私，但我愿意为了我的某些生产力提升或某些好处而牺牲一些隐私，这表示，哦，我不在乎这些特定数据是否在线，如果它能给我带来回报，或者我不介意与这家公司分享这些信息，如果我得到回报的话。但这应该是我的选择。

我认为现在使用计算机，你实际上可以自动化一些导出操作。就像我们内部一直在做的事情一样，每个人都会导出他们的 LinkedIn 联系方式。然后在内部，我们将它们合并在一起，看看我们如何将公司与客户联系起来等等。不要挑剔 LinkedIn，但既然我们正在讨论它，但他们……

对“不要获取 LinkedIn 数据”的感受非常强烈，以至于他们甚至会阻止浏览器使用之类的东西。他们甚至会查看使用模式，以做到极致。它说，哦，你不可能在没有……的情况下获得这个特定东西。所以它就是这样，所以它有……没有一个最高法院的案件他们输了吗？是的。所以他们输掉的那个案件是关于有人抓取公共互联网上的公共数据。而那家公司没有签署任何服务条款或其他任何东西。就像，哦，我只是在获取在线的数据。没有，所以这就是他们获胜的原因。但现在问题是，LinkedIn 能否……我认为他们可以。就像当你作为用户使用 LinkedIn 时，你就是在注册他们的服务条款。如果他们说，好吧，你这种使用 LinkedIn 帐户的方式违反了我们的服务条款，他们可以关闭你的帐户，对吧？他们可以。而且他们，是的。所以我们不需要现在就讨论这个问题。

顺便说一句，我喜欢这家公司。别误会我的意思。我是该产品的忠实用户。我的意思是，我认为你在 LinkedIn 上有超过一百万粉丝。是的，我有。我认识那里的人很久了，对吧？我非常尊重他们。我甚至理解这种以会员为首要的隐私优先方法最初的思维方式。我有点明白。但有时你不得不怀疑，就像，好吧，那是 15、20 年前的事了。可能有一些可控的方式来代表某些会员公开某些数据，而不仅仅是二元。就像，不，你不能拥有这些数据。只需支付销售导航器的费用即可。在我们转向下一个抽象层之前，你提到的 MCP 还有什么其他内容吗？让我们回到过去，然后我将把它与 MCP 联系起来。所以我认为……用代理打开它。代理。好的，所以我将从……开始。

这是我正在进行的论点，那就是随着 AI 和代理的发展，它们正在非常非常快速地发展，我们将越来越多地关注它们。我不喜欢拟人化。我们将讨论为什么这不是那样。少一些像原始工具，多一些像队友。它们仍然是软件。它们应该自我披露为软件。我完全同意这一点。

但我认为将会发生的是，就像你可能会在 Slack 或 Teams 或你使用的任何东西上与团队成员协作一样，你可以想象一系列代理执行特定的事情，就像团队成员可能会做的那样，你可以将事情委托给他们。你可以协作。你可以说，嘿，你能看看这个吗？你能校对一下吗？你能试试这个吗？你可以，无论是什么。

所以我认为，我会说，我们总有一天会不可避免地拥有混合团队。我的意思是混合团队，所以在过去，混合团队是，哦，好吧，你有一些全职员工和一些合同工。然后就像混合团队是一些在办公室里的人，一些是在远程工作的人。这就是混合的类型，

混合的下一种形式就像碳基生命形式、代理、AI 和某种形式的软件。所以让我们暂时假设我在一段时间内是对的，最终我们将拥有这些数字混合团队。所以如果这是真的，那么你问自己的问题是，

那么为了获得这种新模型的全部价值，需要什么？就像，好吧，你必须像，好吧，如果我正在组建一个数字团队，我该怎么做呢？就像我正在面试工程师、设计师或 PM 一样，无论是什么，就像，好吧，这就是我们拥有专业网络的原因，对吧？就像，哦，他们在 LinkedIn 上有存在感。我可以浏览那个半结构化、结构化的表格，并且可以看到任何，你知道，自我披露的经验，对吧？

但是好吧，代理总有一天会需要这个。所以我就像，好吧，这似乎是一条值得探索的线索。也就是说，好吧，所以 agent.ai 出现在那里，用于代理。它是代理的 LinkedIn。它是代理的专业网络。我越深入地探索这条线索，它就像，好吧……

如果这是真的，会发生什么，对吧？就像，哦，好吧，他们会有一个简介，就像其他人一样，就像人类一样。它下面将是一个图，就像专业网络一样。只是，你可以拥有，它，你知道，连接和关注，代理应该能够发布。这可能是他们发布发行说明的方式。就像，哦，我有了这个新版本，无论他们决定发布什么，它都应该能够像专业网络的节点一样运行。事实证明，我思考得越多，探索这条线索越多，

越来越多的东西开始对我来说有意义了。所以它可能不仅仅是一个纯粹的专业网络。所以我的最初想法是，好吧，这是一个专业网络，而现有的代理，我认为将会越来越多，将会在这个网络上存在并拥有简介，但是，这总是很危险的。我就像，好吧，我，

我希望看到一个有数千个代理的世界，因为那些数字员工，数字工作者还没有以任何有意义的方式存在。所以然后我就像，哦，我能让它更容易为……所以我有，就像一个人一样，就像，哦，我将为构建代理构建一个低代码平台。这有多难，对吧？就像事实证明非常困难一样，但这很有趣。所以现在 agent.ai 有 130 万用户。3000 人实际上已经构建了一些版本的代理，有时只是为了他们自己的个人生产力，其中大约 1000 个已经被发布了。

而这就是它回到 MCP 的原因，所以想象一下，以及其他网络，因为我知道 agent.ai。所以现在我们有一个 agent.ai 的 MCP 服务器，它公开了我们拥有的所有内部构建的代理，这些代理执行超级有用的操作。就像，你知道，我有一个可以补贴成本的 Twitter API。我可以说，你知道，如果你正在寻找为社交媒体构建某些东西，这些事情，

使用单个 API 密钥，而且现在这一切都是完全免费的，我正在资助它。这是一种有用的工作方式。然后我们有一个开发者说，哦，我有这个想法。我不必担心 OpenAI。我不必担心，现在，你知道，这个特定模型更好。它可以使用一个密钥访问所有模型。我们会在幕后进行代理。然后公开它。所以然后我们得到了这种社区效应，对吧？也就是说，哦，其他人可能已经构建了一个代理来执行 X。就像，我现在有一个我为自己构建的代理，用于对网站域名进行域名估值，因为我痴迷于域名，对吧？而且，就像，现在还没有一个有效的域名市场。现在还没有一个像 Zillow 这样的域名网站告诉你，哦，这是你附近房屋的售价。就像，为什么不存在呢？我们应该能够解决这个问题。是的，你仍然在猜测。好吧。应该有一些简单的启发式方法。所以我构建了它。就像，好吧，让我去寻找过去的交易。你说，好吧，我要输入 agent.ai、agent.com，无论是什么域名。它到底值多少钱？我想买它。它可以去说，哦，它会做什么。就像，我要去看看最近是否有任何类似的已发布的域名交易，无论是使用相同的词语、相同的顶级域名，无论是什么。它会返回一个近似值，并返回它选择该值和可比交易的理由。哦，顺便说一句，这个域名已公开出售。好的。所以这个代理现在，假设它存在于网络上，在 agent.ai 上。然后想象一下其他人说，哦，你知道，我想为初创公司和企业家构建一个品牌建设代理，为他们的初创公司想出名字。一个常见的问题，每个初创公司都像，啊，我不知道该叫什么。所以他们输入五个随机的词语来定义他们的初创公司是什么。你可以做各种事情，其中之一是，哦，好吧，我需要为它找到域名。有哪些可能的选项？现在就像，好吧，如果有一个售后价格，如果它被列为待售，那就太好了。太棒了。然后想象一下调用这个估值代理。就像，好吧，我想找到套利在哪里，代理估值工具说这个东西值 25000 美元。它在 GoDaddy 上的售价为 5000 美元。足够接近了。让我们去做吧。对吧？这就是在我的未来状态中的一种组合用例。网络上有数千个代理，所有这些代理都可以通过类似 MCP 的东西来发现。然后，作为代理的开发者，你可以根据你想要解决的问题访问所有这些乐高积木。然后你加入编排，这随着推理模型的改进而变得越来越好。只需描述你遇到的问题即可。现在，我们都在努力解决的下一个层次是，你能给 LLM 多少工具，才能让 LLM 崩溃？在你开始发生剧烈变化之前，这个数字曾经是 15 或 20。所以这就是我现在正在考虑的事情。就像，好吧，如果我想……如果我想向给定的 LLM 公开 1000 个这些代理，显然我不能给它所有 1000 个。是否有一些中间层说，根据你的提示，我将对哪些代理可能对这个特定的事情有所帮助做出最佳猜测？是的。

是的，就像工具的 RAG 一样。是的。我在 agent.ai 上构建了 Latent Space 研究员。好的。不错。是的，这似乎是，你知道，然后会有一个 Latent Space 调度程序。然后一旦我安排了一个研究，你知道，你构建了所有这些东西。顺便说一句，对于用户体验，我深感抱歉。你意识到我是一个工程师。它非常好。

是的，只是为了快速浏览一下。你基本上可以创建所有这些不同的步骤。这些步骤就像，你知道，静态与变量驱动的东西。你是如何在这种低代码与使用代码后端的低代码之间做出选择的，而不是完全公开它？任何有趣的决策？是的。我认为……

我认为很多人现在可能正处于我的位置，正在选择确定性。就像如果你在做生意或构建一样，你知道，某种代理的东西，你会选择做确定性的事情吗？或者你是否会选择非确定性，只是让铝来处理它，对吧，使用推理模型？最初的想法以及我采用低代码分步方法的原因是，当时推理模型不存在。这是第一件事。第二件事是，如果你能得到……如果你在脑海中知道……如果你在脑海中知道完成任何目标的实际步骤是什么，你为什么要把它交给机会呢？没有任何好处。真的没有任何好处。告诉我，你都需要执行哪些步骤？所以我现在正在玩……所以我们还没有讨论过的一件事，人们也没有讨论过 UI 和代理。现在，主要的交互模型……或者他们没有足够地讨论它。我知道有些人已经讨论过了。但它就像，好吧，我们习惯了聊天机器人的来回互动。好吧。我明白。但我认为我们将转向一种混合……其中一些事情将像现在一样是同步的。但有些将会……有些将会是异步的。它只会把它放在队列中，就像……这回到了我的……伙计，我说话很快。但我有一个……我只有一个速度。它更快。所以想象一下，如果你正在工作……所以回到我的，哦，我们将拥有这些混合数字团队。就像你不会去问同事，我要请你做这件事，然后坐在那里等待他们去做这件事一样。就像，这不是世界运作的方式。所以能够把东西交给某人是很好的。就像，好吧，也许我希望在一个小时或一天内收到回复，或者其他什么。

关于事情何时需要发生。关于代理的 UI。所以如果你现在看看 agent.ai 代理的输出，它们是最简单的 UI 体现，对吧？也就是说，哦，我们有四种不同类型的输入。就像，我们有下拉菜单，我们有多选，所有这些东西。它就像在 HTML 中，最初的 HTML 1.0 天，对吧？就像，你是一组最小的 UI 基本元素。它只是说，好吧，因为我们需要从用户那里收集一些信息，然后我们执行步骤并执行操作。并以 HTML 或标记生成一些输出是两个主要的例子。所以我一直在问自己，如果我继续走这条路。所以人们问我，我经常收到请求。就像，你能让 UI 变得有点无聊吗？我需要能够做到这一点，对吧？如果我继续探索这个，它就像，好吧，我现在已经构建了一个完整的 UI 构建器。这将如何结束？所以我认为正确的答案，这就是我完成后将要进行反向编码的答案，是关于将代码生成 UI 生成注入到 agent.ai 流程中，对吧？作为一个构建者，你就像，好吧，我要描述我想要的东西，就像你在氛围编码世界中所做的那样。但它不会生成整个应用程序，而是在某个时间点生成存在的 UI，无论是确定性流程还是其他什么。它说，哦，这是我想做的事情。为我生成 UI。我可以进行一些迭代。而我认为它是一个，所以它就像，我要生成代码，生成代码，调整它，像我们现在使用氛围编码一样进行提示样式。在某个时候，我会对它感到满意。我将点击保存。这将成为该特定步骤中的操作。它就像对生成的代码进行缓存，然后我可以，就像产生任何推理时间成本一样。此时它只是一个实际的代码。

是的，我投资了一家名为 E2B 的公司，该公司提供代码沙箱。他们为 LM 竞技场网络竞技场提供支持。所以它基本上是，就像你对 LMS 做的那样，文本到文本，他们对 UI 生成也做同样的事情。所以如果你问一个模型，你怎么做？但是是的，我认为这就是……

这就是我真正着迷的地方。所以早期的 LLM，你知道，我们是可以理解的，但可笑的是，在简单的算术方面很糟糕，对吧？这就是我的妻子、普通人会问我们的事情，就像，你称之为 AI，就像它不能，我的儿子会说，它只是很愚蠢。它甚至连简单的算术题都做不了。然后就像我们随着时间的推移发现，并且有一个原因，对吧？就像，这是一个大型的，你知道，“语言”这个词在那里是有原因的，就它接受过训练的内容而言。它并非旨在进行数学运算，但现在就像，好吧，事实上，它可以访问一个 Python 解释器，我实际上可以在运行时调用它，这解决了我之前无法解决的一系列问题。它基本上是一种委托形式。所以我脑海中萦绕的想法是，这很棒。所以它，它就像解决了算术问题并首先解决了它。现在，就像任何可以通过相对具体的 Python 程序解决的问题一样，它能够做很多我以前做不到的事情。我们能否在 UI 上达到同样的水平？我不知道在代理 AI 世界中 UI 的未来是什么样的，但也许让 LLM 来处理它，但不是以经典的意义。也许它会在运行时生成它，或者也许我们会进行一些迭代并点击缓存或其他什么。所以它更可预测一些。我不知道，但是是的。

是的，尤其是人类应该何时介入？所以，特别是如果你正在组合它们，大多数不应该有 UI，因为它们只是向其他地方发送网络挂钩。我只是想再谈谈。我不知道你对这方面还有什么评论。

我本来想问，你说你要回到代码。你用什么代码？你的堆栈是什么？是的。

哦，Python 是我的语言。我很高兴它在 AI 语言、通用语言方面获胜。

它是所有东西的第二好语言。

顺便说一句，我认为我不同意布雷特·泰勒的一件事，当他在……的时候，而且总的来说，我是布雷特·泰勒的超级粉丝，聪明。我最喜欢的科技界人士之一，就像其中一个片段一样。他谈到，哦，我们需要一种不同于 Python 的语言，或者其他什么。它是为……为 AI 和构建而构建的。就像，不，布雷特，我认为我们实际上不需要，它很好。嗯，它处理得很好，表达能力足够强。能够使用一种语言作为人类和 AI 之间的共同点是很好的，它不会减慢 AI 的速度。足够了，但这确实让我们也能够参与到这种未来的世界中，我们仍然可以发挥一些作用。

我的意思是，但是是的，所以它是 Python，光标是我的……代码生成工具。是的。我还想提到，我真的很喜欢你的代码生成工具。我还有另一个我还没有写出来的论点，关于生成式 UI 如何没有发挥其全部潜力。我们已经看到了 bolt 和 lovable，这些都很好。然后 Vercel 有一个生成式 UI 版本，它基本上是调用预制组件的函数。有一些。介于两者之间的东西，你应该能够生成你想要的 UI 并将其固定住。这将成为你的表单或是的。所以我表达的方式是，嗯，我认为我看到的两种代理形式最近在产品市场中获得了很大的成功，一种是深度研究，另一种是 AI 构建器，比如 bolt lovable。我认为有一些版本，你可以生成 UI，但你某种程度上生成了 Mad Libs 填空表单，然后你，你，你保持它的稳定性。深度研究是。只是填补了这一点。是的。是的。就是这样。我喜欢这样。

是的。嗯，我喜欢这些……简单的……简单的限制和抽象，但如果你看看……我将称之为几乎与之相反的东西。所以，所以现在，我们大多数人想到或构思的 UI，甚至是例子，都是基于我们现在拥有的 UI 基本元素和词汇表。就像，哦，我们有文本框。我们有复选框。我们有单选按钮。我们有下拉菜单。我们有导航。我们有点击、触摸、滑动，现在是语音，无论是什么，现在存在的这组基本元素，我们将以有趣的方式将它们组合起来，但我认为 AI 在 UI 方面将走向的方向与它在科学方面所走向的方向相同，最初它就像，哦，好吧，基于我们现在所知道的东西，它会将它们组合起来，但我们就像处于能够进行实际新研究的边缘一样。所以也许未来的 AI 版本会想出一些新的基本元素，这些基本元素实际上比我们过去所做的事情更适合人机交互，对吧？就像，我不认为它以复选框、单选按钮和下拉列表结束。对吧？我认为还有比这更好的东西。

是的，我知道我们将转向商业模式，但是当你谈到象牙团队时，我们与人们讨论的一种方式是，你已经将外包转移到本地，就像，你知道，搬到该国更便宜的地方，而不是外包。你知道，它就像 AI 外包。是的。你正在转移一些角色。人们就是这样说的。是的，外包。是的。

这是我第一次听说这个词。是的。是的。

我不知道，伙计。但我认为对我来说，专业网络最有趣的事情是，对于人来说，你评估一个人的可用性有限。是的。所以你必须使用之前的信号作为一种评估方法。从理论上讲，对于代理，你可以拥有某种工作证明。是的。你可以运行模拟并以这种方式评估它们。当你运行、构建 agent.ai 时，你如何看待这一点？就像，你知道，与其只选择一个，我实际上可以遍历所有这些，并找出哪个最适合他们的特定用例。我坚信。所以，当你构建时，在幕后，因为基本元素非常简单，你有一些输入。我们知道变量是什么。agent.ai 上的每个代理都自动具有一个 REST API。这可以以你期望的方式调用。自动显示在 MCP 服务器中，因此你可以以你决定使用的任何形式调用它。所以我期望的是，在这种未来状态下，无论是人类雇用代理来执行特定任务，还是评估一组五个代理来执行特定任务并为他们的特定用例选择最佳代理，我们都应该能够做到这一点。就像，我只是想试试，应该有一个策略，代理的发布者或构建者会说，好吧，我会让你调用我 50 次、100 次，然后你才需要付费，或者其他什么。我们应该有效地拥有审计跟踪，就像，这个代理已经被调用了这么多次。我们现在也有某种人类评级和评论，我们对 agent.ai 上现有的代理有数万条评论。平均评分为 4.1 颗星（满分 5 颗星）。所有这些都是很好的信号。但是可调用的……可验证的东西，我认为，非常有用。就像，如果我可以调用……给我一个 API，说这里有五个代理，它可以为我解决这个特定问题。如果我有一个简单的评估，我认为这将非常强大。说实话，我希望人类也有这个。这将非常酷。

是的，因为，我的意思是，当我管理工程团队时，人们会试图提出这些标准，你知道，在招聘时。就像，它们并没有真正帮助，但你只需要一些基本事实。但我认为现在，假设你想雇用，是的，一个 AI 软件工程师。是的。你可以从字面上生成 15 个。20 个关于你组织中实际问题的例子，从人们的协作角度和实际代码生成的方面来看。是的。只需付费即可运行它。是的。就像今天我们做带回家的项目，我们付钱给人们。当然。这应该是一样的。是的。就像，我会运行你。但我感觉人们在内部对自己的评估投资不足。

我的意思是，包括本公司在内，对吧？每个人都在谈论评估。每个人都承认我们应该在评估方面做得更多。我不会说没有人，但几乎没有人真正这样做。这就是……是的，这是一个需要另外一天才能讨论的话题。我不……

这很有趣，我的意思是，因为显然 HubSpot 以推出各种评分器而闻名。是的。你会非常适合它。是的。不知何故。同意评估，顺便说一句。我的意思是，我只是强迫自己成为循环中的人，或者，你知道，我与之合作的人，这很好。但显然，可扩展的事情需要完成。关于 agent AI 的一个有趣的事实或问题，你已经谈到了 chat.com 的收购等等。是的。那是在自定义 GPT 和 GPT 商店启动的时候。是的。我绝对觉得 agent AI 是一种 GPT 商店，但没有被认真对待。是的。你认为 OpenAI 如果有一天醒来，他们会说，agent AI

0 使用单个API密钥，并且目前完全免费，我正在资助它。对于开发人员来说，这是一种有用的方式，他们可以这样说：“我有一个想法。我不必担心OpenAI。我不必担心现在，你知道，这个特定的模型更好。它可以使用一个密钥访问所有模型，我们会在幕后进行代理，然后公开它。” 然后我们就会得到这种社区效应，对吧？也就是说，“哦，其他人可能已经构建了一个可以执行X操作的代理。” 例如，我现在就有一个我为自己构建的代理。

用于对网站域名进行域名估值，因为我痴迷于域名，对吧？就像，现在没有有效的域名市场。现在没有Zillow之类的域名可以告诉你，“哦，你附近房子的售价是多少。” 就像，

就像，为什么它不存在呢？我们应该能够解决这个问题。是的，你仍然在猜测。好吧。应该有一些简单的启发式方法。所以我构建了它。就像，“好吧，让我去寻找过去的交易。” 你说，“好吧，我要输入agent.ai、agent.com，任何域名。它到底值多少钱？我正在考虑购买它。” 它可以去说，“哦，这就是它所做的。” 就像，“我要去看看，最近是否有任何类似的已发布域名交易？它们是否使用相同的词语、相同的顶级域名，无论是什么。” 它会返回。

一个近似值，并返回其选择该值和可比交易的理由。顺便说一句，这个域名已发布售出。好的。

因此，假设该代理现在存在于agent.ai网站上，那么想象一下其他人会说，“哦，你知道，我想为初创公司和企业家构建一个品牌建设代理，以便为他们的初创公司想出名称。” 这是一个常见的问题，每个初创公司都会说，“啊，我不知道该叫什么。” 因此，他们会输入五个随机的词语来定义他们的初创公司是什么。你可以做各种事情，其中之一就是，“哦，好吧，我需要为它找到域名，有哪些选择，对吧？”

现在就像，“好吧，最好知道它是否有售后价格，是否已上市销售。” 太棒了。然后想象一下调用这个估值代理。就像，“好吧，我想找到套利在哪里，代理估值工具说这东西值25,000美元。它在GoDaddy上的售价为5,000美元。足够接近了。让我们去做吧，对吧？” 这就是在我未来的状态下的一种组合用例，

网络上数千个代理，所有这些代理都可以通过类似MCP的东西发现。然后，作为代理开发人员的你，可以根据你想要解决的问题，访问所有这些乐高积木式构建块。你将编排融入其中，随着推理模型的改进，它也越来越好。只需描述你遇到的问题即可。现在，我们所有人都在努力解决的下一层是……

在LLM崩溃之前，你实际上可以提供多少工具？在你开始非常剧烈变化之前，这个数字曾经是15或20。所以这就是我现在正在考虑的事情。就像，“好吧，如果我想向给定的LLM公开一千个这样的代理，显然我不能给它全部一千个。”

是否有一些中间层会根据你的提示说，“我将最好地猜测哪些代理可能对这件事有所帮助？” 是的。是的，就像工具的RAG一样。是的。我在agent.ai上构建了基于潜在空间的研究人员。好的。不错。是的，这似乎是，你知道，然后将会有一个基于潜在空间的调度程序。然后，一旦我安排好研究，你知道，你构建了所有这些东西。是的。

顺便说一句，对于用户体验，我深感抱歉。你意识到我是一名工程师。它非常好。我认为它对普通人来说很友好。是的。这就是你的魔力。HubSpot也做了同样的事情。是的，只是快速浏览一下，你基本上可以创建所有这些不同的步骤，这些步骤是静态的与变量驱动的。你是如何在这类低代码与执行之间做出决定的呢……

你知道，本地代码后端与根本不公开它。任何有趣的设想？是的。我认为这一点，我认为很多人现在可能正处于我的位置，正在选择确定性。就像如果你在企业中或正在构建某种代理事物一样，你是决定做一件确定性的事情，还是采用非确定性方法，只是让铝来处理它，对吧，使用推理模型？

最初的想法以及我采用低代码、逐步、非常确定性方法的原因是，当时推理模型不存在。这是第一点。第二点是，如果你能……如果你在脑海中……如果你在脑海中知道完成任何目标的实际步骤是什么，你为什么要把它交给机会？没有好处。真的没有好处。去吧。

告诉我你需要执行哪些步骤？所以我现在正在玩什么，我们还没有讨论过的一件事，人们没有讨论UI和代理。现在，主要的交互模型，或者他们没有充分讨论它。我知道有些人已经讨论过了，但它就像，“好吧，我们习惯了来回聊天的机器人。” 好的。我明白了。我认为我们将转向一种混合模式，其中一些事情将像现在一样是异步的，但有些事情将是异步的。它只会把它放在队列中，就像

这可以追溯到我的，伙计，我说得很快，但我有一个，我只有一个其他的速度。它甚至更快。所以想象一下，如果你正在工作，所以回到我的，“哦，这，我们将拥有这些混合数字团队。”

就像你不会去跟同事说，“我要请你做这件事，然后坐在那里等着他们去做。” 这不是世界运作的方式。因此，能够将某些东西交给某人是很好的。就像，“好吧，也许我希望在一个小时或一天内收到回复。” 我们与同事之间有一些隐含的契约，说明事情何时需要发生。因此，围绕代理的UI。因此，如果你现在查看agent.ai代理的输出，

它们是UI最简单的体现，对吧？也就是说，“哦，我们有四种不同类型的输入。” 就像，我们有下拉菜单，我们有多选，所有这些东西都像在HTML中，原始HTML 1.0时代，对吧？就像你是UI最小的基本元素集一样。它只是说，“好的，因为我们需要从用户那里收集一些信息。” 然后我们将执行步骤并执行操作，并使用HTML或标记生成一些输出，这是两个主要示例。

所以我一直在问自己，如果我继续走这条路，所以人们问我，我总是收到请求，就像，“哦，你能让UI有点无聊吗？我需要能够做到这一点，对吧？” 如果我继续这样做，就像，“好吧，我现在已经构建了一个完整的UI构建器。” 这到哪里结束？所以我认为正确的答案，这就是我完成后将要进行反向编码的答案，是围绕……

将代码生成、UI生成注入agent.ai流程，对吧？作为一个构建者，你就像，“好吧，我要描述我想要的东西”，就像你在一个充满活力的编码世界中所做的那样。但是，与其生成整个应用程序，不如生成在该确定性流程中的某个点存在的UI。它说，“哦，这就是我正在尝试做的事情。为我生成UI。” 我可以进行一些迭代。我认为它是一个

所以就像，“我要生成代码，生成代码，调整它，像我们现在使用充满活力的编码一样进行这种提示样式。” 在某个时候，我会对它感到满意，然后我会点击保存。这将成为该特定步骤中的操作。这就像缓存我可以然后避免任何推理时间成本的生成的代码一样。它只是当时的实际代码。是的。

是的，我投资了一家名为E2B的公司，该公司提供代码沙箱，它们为LM竞技场网络竞技场提供支持。所以它基本上就像你使用LMS一样，就像文本到文本。他们对UI生成也做了同样的事情。因此，如果你问一个模型，你怎么做？但是是的，我认为这就是它应该去的地方。这就是我真正着迷的事情。因此，早期的LLM可以理解，但可笑的是，它们在简单的算术方面很糟糕，对吧？这就像我的妻子普通人会问我们一样，

你称之为AI，就像它不能，我的儿子会说，“它太蠢了。它甚至连简单的算术题都不会做。” 然后就像我们随着时间的推移发现的那样，并且有一个原因，对吧？就像，它很大，你知道，这个词语“语言”在那里是有原因的，就它所接受的训练而言。它并非旨在进行数学运算，对吧？

但现在就像，“好吧，事实上，它可以访问一个Python解释器，我实际上可以在运行时调用它，这解决了它没有接受过训练的一整套问题。” 它基本上是一种委托形式。因此，在我脑海中盘旋的想法是，这太棒了。所以它就像解决了算术问题并首先解决了它。现在，任何可以通过相对具体的Python程序解决的问题，它都能做很多以前做不到的事情。

我们能否在UI方面达到同样的水平？我不知道在代理AI世界中UI的未来是什么样的，但也许让LLM来处理它，但不是以经典意义上的方式。也许它会即时生成它，或者也许我们会进行一些迭代并点击缓存之类的。所以它更可预测一些。我不知道。是的。尤其是在人类应该何时介入的时候？因此，特别是如果你正在组合它们，它们中的大多数不应该有UI，因为它们只是向其他地方发出网络请求。我只是想再谈谈。我不知道你是否还有更多。

对此的评论。我刚要问你，当你说到你要回到代码时，你用什么代码？你的堆栈是什么？是的。所以Python是我的语言。我很高兴它在AI语言方面获胜。它是通用语言。它是所有事物中第二好的语言。顺便说一句，我认为我不同意Brett Taylor的观点之一，当他在节目中时，以及总的来说，我是Brett Taylor的超级粉丝。聪明，我最喜欢的科技人士之一。他

就像节目中的一段一样。他谈论的是，“哦，我们需要一种不同于Python的语言，或者任何一种语言，就像为AI而构建的，就像为AI而构建的。” 就像，“不，布拉德，我认为我们不需要。实际上，它很好。它处理得很好，表达能力足够强。并且拥有一种我们可以跨人类和AI使用的通用语言是很好的。它不会减慢AI的速度，但它确实让我们也能够参与这种未来世界，我们仍然可以发挥一些作用。” 无论如何，是的。

所以它是Python，光标是我的代码生成工具。我还想提到，我真的很喜欢你的代码生成工具。我还有一个尚未写出的论点，关于生成式UI如何未能充分发挥其潜力。我们已经看到了螺栓和可爱的，这些都很好。然后Vercel有一个生成式UI版本，它基本上是调用预制组件的函数。两者之间有一些东西，你应该能够生成你想要的UI并将其固定住。这将成为你的表单。是的。是的。

所以我表达的方式是，你知道，我认为最近在产品市场适应性方面看到很多成功的两种代理形式是深度研究和AI构建器，比如Bolt livables。我认为有一些版本是这样的，你生成UI，但你生成Mad Libs

填写空白的表单，然后你保持稳定，深度研究只是填写它。是的，是的。就是这样。我喜欢这样，是的。所以我喜欢这些简单的模仿和抽象。但是，如果你看看那种，我会说几乎是完全相反的。所以现在，你和我思考、构思甚至举例说明的大多数UI都是基于我们现在对UI的基本元素和词汇表。就像，“哦，我们有文本框，我们有复选框，我们有单选按钮，我们有下拉菜单，我们有导航，我们有点击、触摸、滑动，现在是语音，无论是什么。”

现在存在的基元集，我们将以有趣的方式将它们组合起来。但是，我认为AI在UI方面的发展方向与它在科学方面的发展方向相同，最初它就像，“哦，好吧，根据我们现在所知道的东西，它会将它们组合起来”

但我们正处于它能够进行真正新颖研究的临界点。因此，未来的AI版本可能会提出一些对人机交互比我们过去所做的事情更有效的新基元，对吧？我认为它并没有以复选框、单选按钮和下拉列表结束，对吧？我认为还有更多的东西。我知道我们将在之后转向商业模式，但是当你谈到iBreathe团队时，我们与人们讨论的一种方式是，你已经将外包与本地化结合起来了，这就像，你知道，搬到比外包更便宜的国家。现在就像，是的，本地化。是的。你正在搬到其他地方。这就是人们所说的。是的。本地化。是的。这是我第一次听说这个词。是的。是的。不，伙计。是的。

但我认为对我来说，专业网络最有趣的事情是，对于人们来说，你评估一个人的可用性有限。因此，你必须使用之前的信号作为一种评估方法。从理论上讲，对于代理，你可以拥有某种工作证明。你可以运行模拟并以这种方式评估它们。当你运行、构建agent.ai时，你是如何考虑这个问题的呢？就像，你知道，与其只选择一个，不如我像字面意思一样遍历所有这些，然后找出哪个最有效。是的。

我坚信这一点。因此，在幕后，当你构建时，因为基元非常简单，你有一些输入。我们知道变量是什么，agent.ai上的每个代理都自动具有一个REST API，它可以按你预期的方式调用。

自动显示在MCP服务器中，因此你可以根据你决定使用的任何形式来调用它。因此，我的预期是在这种未来状态下，无论是人类雇用代理来执行特定任务，还是评估一组五个代理来执行特定任务并为他们的特定用例选择最佳代理，我们都应该能够自动化它。就像，“我只是想尝试一下。” 并且应该有一个策略，即代理的发布者或构建者会说，“好吧，在你必须付费之前，我将让你调用我50次、100次。” 我们应该有自动化

实际上就像审计跟踪一样。就像，“这个代理已经被调用了这么多次。” 我们现在也有某种人类评级和评论。我们对agent.ai上现有的代理有数万条评论。平均评分为5星中的4.1星。所有这些都是很好的信号。但是，

我认为一种可调用的、可验证的东西非常有用。就像如果我可以调用它一样，给我一个API，它会说这里有五个代理，它可以为我解决这个问题。如果我有一个简单的评估，我认为这将非常强大。老实说，我希望我的人类也能做到这一点。这将非常酷。是的，因为我的意思是，当我管理工程团队时，人们会在招聘时尝试提出这些标准，就像，

它们并没有真正帮助你，但你只需要一些基本事实。但我感觉现在，假设你想雇用，是的，AI软件工程师。是的。你可以从字面上生成大约15个、20个关于你组织中实际问题的示例，这些示例既来自人们在协作方面的角度，也来自实际代码生成的方面。是的。

只需付费即可运行它。就像我们今天做家庭作业并付钱给人们一样。当然。这应该是一样的。就像，“我会运行你。” 但我觉得人们并没有在内部投入那么多精力来进行自己的评估。这包括目前的公司，对吧？每个人都在谈论评估。每个人都接受我们应该在评估方面做得更多的事实。

我不会说没有人，但几乎没有人真正这样做。这是一个完全不同的主题。这很有趣，因为显然HubSpot以推出各种评分工具而闻名。是的。你会很适合它。是的。不知何故。顺便说一句，我同意评估。我的意思是，我只是强迫自己成为循环中的人，或者，你知道，我与之合作的人，这很好。但显然，可扩展的事情需要完成。关于agent AI的一个有趣的事实或问题。你已经谈到了chat.com的收购等等。那是在自定义GPT和GPT商店启动的时候。我绝对觉得agent AI是一种GPT评分，但是

没有被认真对待？是的。你觉得，睁开你的眼睛，如果他们有一天醒来，他们会说，“agent AI是一件事，就像我们应该……”

只需重新投资GPT商店？这是恐惧吗？我认为这是一个，它不会是由agent.ai驱动的。这是不可避免的，OpenAI，我没有任何内幕消息。我是一个投资者，但没有内幕消息，因为这对于他们来说意义重大，他们已经多次尝试过了，对吧？他们过去做过插件，然后是自定义GPT和GPT商店，因为，你知道，作为他们所在的平台，我认为他们最终会想出，而且他们已经有了自定义GPT，

这将会发生。我不会在我的承诺清单上添加一件事，那就是永远不会与所罗门·奥特曼竞争。并非有意为之。但你在这里。但是是的，我在这里。但我并没有真正这样做，对吧？它不是真的。它是免费的。所以无论如何。但你知道，在某些时候。是的。但我的意思是，它实际上是有价值的。他们正在解决一个大得多的问题。我就像宇宙中一个微不足道的小错误。但是促使我首先创建的原因是，因为我知道自定义GPT存在，我确实在我的脑海中制定了这个规则，那就是不要与萨姆竞争。他确实在我的不与之竞争的人名单的顶部。他太棒了。但是我为了自己使用而需要的东西，这就是Agent.ai的启动方式，因为我正在构建一堆我所谓的独立软件，用于提高我自己的生产力。我发现自己越来越多地使用

LM驱动的工具，因为这样更好。AI在这些独立项目中出现了很多次。所以我需要的是一个底层框架来构建这些东西。名单上的重点是，我想能够跨越模型，因为事情中的某些步骤就像，“哦，对于这个特定的事情，涉及写作。” 所以也许我想为此特定的事情使用quad。也许我想这样做。即使围绕图像生成，不同类型的，无论它是否有纹理，都没有纹理，无论是什么。我想能够混合和匹配。

我的感觉是，无论是OpenAI、Anthropic还是其他任何公司，他们都可能更喜欢自己的模型，对吧？这对他们来说是有意义的。但我可以为我自己的目的和我们的用户群，成为一点瑞士。就像，“我们不认为有一个模型可以统治所有模型，这取决于你的用例。” 你会想要混合和匹配，甚至可能更换它们，甚至可以将它们测试回评估的想法。就像，“我有一个代理工作流程。” 这就是我们最近一直在玩的东西，因为我们有

足够的使用者现在喜欢LM，我查看账单，就像，“哦，我现在正在花钱。” 这只是人的天性，对吧？不仅仅是普通人，而是像，“所以你有一个下拉菜单，你可以说，你想在你的agent.ai代理中使用哪个模型？” 事实证明，人们会选择最大的数字。所以他们会选择4.5或任何数字，对吧？就像，“这是……”

哎哟。是的。是的。但我对自己许下的承诺是，我们将支持所有这些模型，无论成本是多少。就像，再一次，我认为这是一个研究项目，你知道，对人类有益，推理成本正在下降。至少我，所以我晚上睡觉前会这样告诉自己。所以他们选择了编号最高的那个。所以我们现在有一个选项，它说，这是第一个选项。就像，“让系统为我选择。” 事实证明，

人们不会这样做。他们只是选择，因为他们还不信任它，这很好。他们不应该完全信任它。但我们发现的一件事是，如果我们通过后台通道进行操作，这就是我们正在测试的东西，那就是，“哦，如果我可以运行同一个代理，运行一千次，我们首先会在我们自己的内部代理上进行操作。” 如果评级和评论，因为我们一直在对这些代理进行人工评估，

我们可以通过使用较低级别的模型来实现数量级的显著减少，而输出质量几乎没有变化，对吧？这是有道理的，因为我们所做的许多事情并不需要最强大的模型。实际上，这很糟糕，因为延迟更高。这不仅仅是成本问题。但无论如何，在这种未来状态下，

我认为我们将拥有模型路由，并且还将有一大批人在研究这个问题。就像，“帮我运行时选择最佳模型。” 你会购买还是构建模型路由？我会购买所有我能买到的东西。如果我不必构建任何东西，我就不想构建。我认为最令人印象深刻的例子之一是我们的Chai AI对话，我经常思考这个问题。他……

明确地将自己视为一个市场。你也是一个市场，但他还有一个角度，那就是模型提供商，他让他们竞争。我认为这种三方市场可能很有意义。就像，我不知道为什么不是每个AI公司都是这样构建的。这实际上是一个很好的观点。是的，这是有道理的。我有一份我非常热衷的事情清单。我对有效市场非常热情，或者对低效市场非常反感。因此，对于那些正在收听的普通人来说，有效市场是指存在这样的市场：应该发生的每一次交易实际上都会发生。这是一个应该发生的有效市场。那么为什么低效市场会存在呢？好吧，也许买卖双方彼此不了解。也许没有足够的信任机制。没有办法实际定价或为公平定价提出公平的市场价值。当你推倒这些多米诺骨牌时，市场变得越来越好，并且有很多

潜在价值是由于低效而存在的，而消除这些低效的人对于高价值市场来说会赚很多钱。这已经被反复证明了。这是一个例子，现在存在低效，因为我们正在过度使用模型或其他什么。让我们将其简化为一个有效的市场。正确的模型应该以正确的价格与正确的用例相匹配。

然后我们将……非常有趣。你有没有研究过DSPy？我研究过它。但还不够深入。据我所知，它应该是唯一一个优先进行评估的框架。如果评估如此重要……顺便说一句，这与所有这些之间的关系是，DSPy还可以帮助你优化你的模型，因为你首先进行了评估。我想知道为什么它没有那么受欢迎。但我的意思是，我认为它正在越来越受欢迎，我会这么说。我们正在关注它。

让我们谈谈商业模式。显然，你有两种，即服务工作和服务结果。是的。我很想知道你是如何区分这两者的。是的。因此，服务工作是……所以我们了解软件即服务，对吧？所以我正在许可作为服务交付给我的软件。这已经存在了几十年了。所以我们理解这一点。但是该服务的消费者通常是正在执行实际工作的人，无论你购买的是什么软件。服务工作是指软件实际上正在执行工作，无论该工作是什么。这就是服务工作。所以我将提出一些具体的用例，无论是分类、法律合同审查还是软件实际执行的任何操作。服务结果是指你实际上是根据结果收费，而不是根据工作收费，对吧？也就是说，“与其说我将支付X美元来审查一份法律合同或这段时间或使用次数，不如说我实际上是根据实际结果付费，也就是……” 我对这个行业或行业的某些部分非常兴奋，他们对这种服务结果或基于结果的定价非常兴奋。我认为这样做的原因是，我认为我们对其进行了过度索引。我们过度索引的原因是，现在代理中最受欢迎的用例是客户支持。有据可查。许多为客户支持提供代理的服务提供商都是根据解决的工单数量乘以每张工单X美元来收费的。这样做的原因是，客户支持部门和团队对通过他们当前的方式解决一张工单的成本有一定的了解。因此，你可以对A，即某种经济价值进行近似估计。还有一些至少是半客观的方法来衡量可接受的价值是什么。这就是可接受的解决方案或结果是什么，对吧？就像你可以说，“哦，我们衡量了工单的净推荐值或CSAT。” 只要客户对90%的工单感到满意，那就是你的标准。只要AI能够复制相同的SLA，就像，“好吧，它们是一样的。它们是可以互换的，一个与另一个。” 我认为我们过度索引的原因是，没有那么多用例同时具有这两个维度，并且可以客观地衡量。并且存在一个已知的恒定经济价值。例如，客户支持工单，因为它们是由人类处理的，所以是有意义的。人类有离散的成本。尤其是在零售业，这就是它最初在具有大量客户支持工单的B2C公司中开始的地方，他们将这些工单分配给，一张工单的价值大致相同，因为大多数人花费相同的时间来处理这种一级、一级支持。但在其他事情中，每个结果的价值可能会发生巨大的变化，从字面上看，数量级上，就事情的实际价值而言。这是第一点。第二点是，你如何客观地评估它？你如何衡量？所以假设你要根据结果提供徽标创建服务，对吧？这是一个完全相反的主观事物或其他什么。因此，“好吧，我可能需要100次迭代。我可能需要5次迭代。输出的质量实际上并不完全在我的控制之下。” 这不取决于软件。可能是你的品味很奇怪，或者你没有充分描述你想要什么，或者其他什么。就像它根本不是一个可解决的问题一样。设计这类定性、主观学科一直都在处理这个问题。你如何让客户满意？有一个原因，他们会说，“哦，我们将进行五次迭代。” 但我们的产出是，我们将向你收取5,000美元或500美元或其他任何费用来制作这个徽标。但这很难，对吧，大规模地去做。

只是一个相关的轶事。我们的播客，实际上，我们刚刚得到了一个新的徽标。我们为此使用了99designs。有很多设计师正在努力工作。但我就是不知道自己想要什么。所以我太糟糕了。你看起来很棒，但你知道。

那是一个效率更高的市场的另一个例子，对吧？就像我使用99designs作为用户和客户已经十多年了。

太棒了。这么多设计师，就像这对于他们来说并不需要花费那么多。这对我们来说价值很高。我们不会设计垃圾。完全正确。是的。是的。是的。对于那些感兴趣的人，我有一篇关于我对99designs的思考的博客文章。这是一个。他们会估计你会得到多少设计。是的。我认为修改器是，“我们将付钱给你，我们将付钱给某人，也许是你”，是30到60。但实际上是200。是的。所以它定价过低。是的。

是的。你认为有些市场只是从根本上转向更注重结果的商业模式吗？可能吧。

我不够了解市场，无法知道。但是，如果我们必须对它们进行排序或排名，那么可能存在某种维度，我们可以根据该维度进行排序。就像，“这些类型的企业，是否有客观衡量结果的标准？是否有办法根据价值的低方差或可变性来对其进行定价？” 如果这些情况属实，那么无论哪个行业属实，客户支持就是一个例子，但可能还有很多其他例子，这两个条件都成立。但我想知道的是，从客户的角度来看，他们是否宁愿实际支付服务工作费用，而不是实际的，就像他们思考的方式可能是，这是我的套利机会。就像我可以完成X的工作，但价值实际上是Y。如果我有选择，为什么我要让软件提供商将这个差额压缩掉呢？我不知道。哦，我的意思是，好吧。

归因。有18件事会影响它们。你是其中之一。所以很难说。是的，是的。顺便说一句，你有没有看到，显然你在这个行业，并不完全是HubSpot的市场部分，但你在归因方面看到了什么有趣的事情？因为这直接关系到服务工作与结果。是的。

不够，因为我们作为世界，作为一个行业，只是选择你的东西。所以落后了。这就是为什么我认为Web3以其应有的方式将会卷土重来，因为它的基本原则是有意义的。我认为在这个世界中发生的事情是一群加密兄弟、骗子和NFT之类的东西，这些东西与之松散相关。没有实际的，但区块链、可跟踪事物、能够将数字资产、归因、具有审计日志、可验证的已发布事物进行分割的想法是有意义的，对吧？也许有一些有限的，但它不是零，用例，其中我们现在所说的推理成本或开销，在区块链上存储数据的税收。当然，它会收税。它并不适用于所有事物，但它肯定适用于某些事物。但我不认为我们有任何有意义的归因。这难道不令人难过吗？我知道。这部分取决于激励措施。是的。因此，实际上拥有数据或可以从中计算或导出归因的数据部分的人并没有真正有动力提供这些数据。因此，即使是像PPC方面一样简单的事情，对吧，在谷歌搜索方面，这曾经是我的世界。与过去相比，我们现在拥有的数据更少了，例如点击次数等等，在谷歌实际上会向你发送之前。以下是人们输入的关键词。几年前，他们甚至取消了这项功能。因此，很难将这些点连接起来。我们看到这种情况并非只发生在PPC上，而是发生在各种事情上。他们从搜索控制台中取消了这项功能。那是什么？搜索控制台中有这个功能。是的。他们取消了这项功能。搜索控制台中有这个功能。但是你的网站，如果你访问谷歌分析，你可以将其连接回谷歌搜索控制台。我明白了。是的。是的。好的。

好吧。是的。好吧，这是一件众所周知的事情。你不必对谷歌大发雷霆。

那么软件工程呢？你认为它会保持为服务工作吗？或者你认为？我认为大多数公司都雇佣了很多工程师，但他们真的不知道该怎么用他们，或者说他们并没有真正有效地使用他们。是的。我认为现在他们正在经历这种危机，就像，“好吧，我不知道我将如何为一个代理定价，因为我真的不知道我的人们在做什么。” 是的。就像，你认为这会如何改变？是的。

我认为，所以我实际上看好工程师的长期经济价值。这不仅仅是因为Cogen的所有变革以及我们已经看到的所有事情，而是因为Cogen。因为AI将会发生什么，人们甚至在其他学科中也谈论过这个问题，我们将能够解决更多的问题。我内心的半数学家就像，“好吧，我们总是说，“哦，现在代理将编写代码或其他什么。” 因此，将会有数百万名软件工程师，你知道，虚拟数字软件工程师。因此，每个工程师的价值将会下降，因为我只是在同一个组合中，作为一名工程师。他们没有意识到的是，这不仅仅是关于分母，还有分子，那就是可能的总经济价值。我认为这比分子的增长速度更快，即由于软件以及工程师可以使用他们手中的工具所产生的实际经济价值。所以我认为工程师的价值实际上会上升。他们将拥有强大的工具，他们将能够解决需要解决的更大范围的问题。是的。

对我来说，感觉它会保持为服务工作。你正在为工作付费。我不认为有什么办法可以做到这一点。

将会有这样一些工程师，我们一直都在看到这种情况，就像在媒体行业中，你有一些人是作家，但你也有自由职业者，你知道，他们会写文章或以任何方式展现他们的创造力。两者都有意义，对吧？就像有工作外包。还有基于结果的，或者像我制作这个东西一样。也许他们，其中一些工程师实际上会制作代理。因此，他们会将其放在像agent did AI这样的市场上，这就是他们赚取数百万美元的方式。是的。

关于代理还有什么想法？我们有很多杂七杂八的事情想和你谈谈。杂项。

我认为我们涵盖了很多领域。所以我对代理感到兴奋。我对世界的讯息。是的。将是，“不要害怕。” 我知道这很可怕。对于我这个技术乐观主义者来说，这很容易说，但要学习它。即使你是一个普通人，即使你不是工程师，即使你不是AI人员，你也会认为自己是一个AI人员。使用这些工具。我不在乎你目前担任什么角色，你在职场的什么位置。它对你来说将是有用的，并开始了解代理，使用它们，构建它们。

我认为我对工程师的讯息总是，“还有更多的事情要做。” 就像我们仍然处于早期阶段，正在努力弄清楚代理堆栈是什么样的。是的。我想推动人们使用具有记忆功能的代理。是的。具有规划能力的代理。

哦，我们必须谈谈记忆。我们必须谈谈记忆。让我们开始吧。让我们开始吧。因为我认为这是下一个，在我看来，下一个前沿是实际的长期记忆，无论是对于代理，还是对于代理网络，以及一种可信的、可验证的，我不会说优先考虑隐私，而是面向隐私的方式。我对“优先考虑隐私”这个词有一个问题，因为很多时候我们说优先考虑隐私，而我们并不是真正这么想的。“优先考虑隐私”意味着我比任何事情都重视它。我们谈论的是什么并不重要。而这对于任何人类来说都不是真的。任何想要被使用的东西。因此，记忆是一件有趣的事情，对吧？所以我目前正在研究的事情，agent.ai中有很多事情正在进行，是关于记忆的实现。并且有一些很棒的项目，mem0就是其中之一。但是对我来说有趣的事情是，所以我们在ChatGPT和其他东西中看到了这一点，它确实具有长期记忆的概念。你可以根据需要将事物拉回到上下文中。我着迷的事情是跨代理记忆。所以如果我现在是一个代理构建者，就像，“好吧，这些是我从用户那里了解到的东西，或者是我从用户那里学到的东西，就提取知识要点而言，缺乏更好的术语。” 这很好。但是当下一个代理构建者出现并且是同一个用户时，如果对代理二有用，那么代理一了解我的所有事情不应该共享吗？只要我选择加入，就像，“是的，我不在乎那些事情。” 事实上，我会发现一遍又一遍地告诉代理二、代理n和代理n+1相同的事情非常烦人，因为它应该知道，就像系统应该知道一样。这就是为什么我相信这些代理网络和共享状态的原因之一，那就是由于拥有共享内存而产生了用户效用。不仅仅是我们应该为独立代理解决内存问题，而且我们还应该能够在系统之间共享该上下文，共享该内存。agent.ai的价值主张的一部分是，“好吧，当你构建时，就像，所以我们有，你知道，无论有多少用户，我们都将拥有越来越多的关于他们的记忆。” 因此，与其让你自己去构建代理，将其作为宇宙中某种断开的节点，不如说，在网络或平台上构建的价值，我们的或其他人的，因为这会产生更多的用户价值。它更有用。

你是如何考虑对此进行身份验证的呢？因为记忆的一部分是选择性记忆。所以它需要调度。是的。我希望你能够访问。如果我有另一个调度代理，你应该能够访问你参与的事件。是的。以及我什么时候有空，但它不应该告诉你我的日历上的其他事件。那是什么样的？

我对这个问题有很多想法。这就是机会所在，就像解决这些基本问题一样，这将需要存在，对吧？所以现在我们最接近的近似值是身份验证，auth 2.0，对吧？每个人都有，就像，“批准。” 这是一个非常粗略的范围集，对吧？就像根据身份验证服务器的提供商一样，无论是谷歌，还是其他任何公司，HubSpot，这并不重要。就像，“我选择一组范围，他们可以将范围定义得非常细致。” 好的。但这进展会非常缓慢，对吧？例如，我现在使用的用例，就像我将电子邮件用于所有事情一样。我将其用作我的生活中的事件和数据总线，对吧？我的意思是，就像我做的任何事情一样，如果有一种方法可以将其放入电子邮件中，因为我知道它是一个开放协议，对吧？就像，“我将能够以有用的方式获取这些数据。” 这是在之前。所以我已经构建了一个我从中构建了向量存储的300万个，它已经解决了我的个人用例。我会给你举个例子，但我显然不会为所有事情都构建我自己的软件。但是如果一家初创公司出现并说，“Dharmesh，你可以将你的电子邮件收件箱提供给我，以换取这些东西吗？” 我会说，“绝对不行。” 就像，这实际上是我的，就像我的生活都在这里，对吧？所以你需要共享子集。是的。所以我认为有一个，也许这不是实际的实现，但想象一下，如果有人说，“我有一个值得信赖的中间人来进行第一次信任，无论如何定义它，都说，“好吧，我要OAuth到这个东西。” 它可以控制这一点。我可以使用自然语言说，我只想将电子邮件传递给标签是X之一或在最后一件事情之内的提供商，并且每天不超过50封电子邮件，或者其他什么。所以我不会让他们转储整个300万个积压，无论我想施加什么控制。现在所有OAuth服务器端，谷歌，甚至大型的，小型的不重要。将不会这样做。但这是一个机会，他们将需要达到一定的规模，建立一定程度的信任，说，“好吧，我要将密钥交给这个中间人。” 是的。但这会开启很多效用，因为它给了我更精细的控制权。

更精细的控制权。是的。我会说Langchain有一个有趣的。有很多试图追踪破解AI电子邮件的人。每一个尝试过的人最终都放弃了。是的。我正在等待Superhuman这样做。是的。我不知道为什么他们没有这样做，但在某个时候。

他们有一些很酷的AI工具。是的。是的。我认为速度需要加快，但我认为这可以追溯到开放图。是的。对。就像，我认为谷歌没有动力来构建更好的范围。不。就像，他们不会这样做。不。

让我们谈谈商业模式。显然，你主要有两种模式：工作即服务和成果即服务。我很想知道你如何区分这两种模式。是的，工作即服务……我们知道软件即服务，对吧？我授权使用作为服务交付给我的软件。这已经存在了几十年了。我们理解这一点。但是，这项服务的消费者通常是人类，他们正在做实际的工作，无论你购买的是哪种软件。工作即服务是指软件实际上正在执行工作。

无论这项工作是什么。这就是工作即服务。如果我提出一些具体的用例，例如分类或法律合同审查等等，软件实际上是在执行这项工作。成果即服务是指你实际上是根据成果收费，而不是根据工作收费，对吧？也就是说，与其说我将支付你 X 美元来审查一份法律合同，或者支付你一定的时间或次数，不如说我将根据实际成果支付你费用，这指的是

我对行业的看法是，行业中的某些部分对这种成果即服务或基于结果的定价非常兴奋。我认为这样做的原因是，我认为我们对其重视过度了。我们对其重视过度的原因是，目前在代理方面最流行的用例是客户支持。这有据可查。许多提供客户支持代理的供应商都是根据已解决的工单数量乘以每张工单 X 美元来收费的。

这样做的原因非常有道理，因为客户支持部门和团队已经对通过他们当前的方式解决一张工单的成本有所了解。因此，你可以对 A 进行估算，即经济价值是多少。此外，至少有一个半客观的衡量标准来衡量可接受的解决方案或结果是什么，对吧？例如，你可以说，哦，

我们衡量了工单的净推荐值或客户满意度，只要 90% 的客户对工单的处理方式感到满意。这就是你的标准。只要人工智能能够复制相同的服务水平协议，那就没问题了。它们是一样的。它们是可以互换的。

我认为我们重视过度的原因是，并没有那么多用例同时具备这两个维度，即客观可衡量且具有已知的恒定经济价值。例如，由于客户支持工单是由人工处理的，因此是有意义的。而且人工有明确的成本。尤其是在零售业，这就是这种模式最初在 B2C 公司中开始流行的地方，这些公司有大量的客户支持工单需要分发，一张工单的价值大致相同，因为大多数人处理这种一级支持都需要相同的时间。

但在其他方面，每个结果的价值可能会发生巨大变化，从字面上看，其价值可能会相差几个数量级。这就是第一点。第二点是如何客观地进行衡量？假设你要根据结果提供徽标创建服务，对吧？这是一个完全主观的方面。因此，好吧，我可能需要 100 次迭代，也可能只需要 5 次迭代。输出的质量实际上并非完全在我的控制之下。这取决于软件。这可能是因为你的品味很奇怪，或者你对自己的需求描述得不够充分，等等。这可能根本就不是一个可解决的问题。设计这类定性、主观的学科一直都在处理这个问题。你如何让客户满意？

他们之所以会说，哦，我们会进行五次迭代，是有原因的，但我们的结果是，我们将向你收取 5000 美元或 500 美元，无论这个徽标的费用是多少。

但这很难做到规模化。一个相关的轶事。我们是播客。实际上，我们刚刚得到了一个新的徽标，我们使用了 99designs。有很多设计师非常努力地工作。是的。但是，我只是不知道自己想要什么。是的。所以，我就像，太糟糕了。我知道，你看起来很棒，但是，你知道的。

是的，这是另一个市场效率提高的例子，对吧？就像我过去十多年来一直是 99designs 的用户和客户一样。它很棒。是的。有很多设计师，这对于他们来说成本并不高。这对我们来说价值很高。我们不会设计。完全正确。是的。顺便说一句，关于 99designs 的一个专业技巧是，

从边际上来说，你最好承诺支付你将要选择的获胜者的设计师的费用，无论你是否喜欢它都没有关系。这会提高参与度，你仍然会得到一堆垃圾。你会得到很多噪音，但是质量结果通常是迭代次数的函数，而徽标设计就是其中一个例子。如果你必须在 200 个徽标和 20 个徽标之间进行选择，那么你找到自己喜欢的徽标的几率会更高。

对于那些感兴趣的人，我有一篇关于我对 99designs 的思考的博客文章。这就是其中之一。他们会估计你会得到多少设计。我认为，对于“我们会付钱给你，我们会付钱给某人，也许就是你”这样的限定词，大约是 30 到 60 个，但实际上是 200 个。所以价格被低估了。是的。是的。是的。

你认为有些市场会从根本上转向更注重结果的商业模式吗？可能吧。我不够了解足够的市场来判断。但是，如果我们必须对它们进行分类或排序，那么很可能存在某个维度可以对它们进行排序。就像这些类型的企业一样，是否存在对真相或结果的客观衡量标准？是否存在一种方法可以根据每个结果的低方差或可变性来对其进行定价？是的。

如果这些情况属实，那么无论哪个行业属实，客户支持就是一个例子，但很可能还有很多其他例子也属实。但是，我后来想到的是，从客户的角度来看，他们是否宁愿实际支付工作即服务费用，而不是实际的……这就像他们思考问题的方式，这是一种套利机会。我可以以 X 的价格完成工作，但价值实际上是 Y。如果我有选择权，为什么我要让软件提供商压缩这个差额呢？我不知道。哦，我的意思是，好吧。归因。有 18 个因素会影响它们。你是其中之一。所以很难判断。是的，就是这样。顺便说一句，你见过吗？显然，你在这个行业，并不完全是 HubSpot 市场的确切属性，

市场的一部分，但是你在归因方面看到了什么有趣的东西？因为这直接关系到工作即服务与结果。不够，因为我们作为世界，作为行业，只是

选择你的东西，所以落后于跟踪。这就是为什么我认为 Web3（按照其本来的意图）将会卷土重来，因为它的基本原则是有意义的。我认为在这个世界中发生的事情是一群加密兄弟、骗子和 NFT 等等，这些东西与之松散相关。没有实际的，但是区块链的概念、可跟踪的事物、能够将数字资产、归因、拥有审计日志、可验证的已发布事物进行碎片化，所有这些基本要素都是有意义的。

也许有一组有限的（但并非为零）用例，其中

我们现在所说的推理成本或开销，即在区块链上存储数据的税费，并且肯定存在税费。这并不适用于所有事物，但肯定适用于某些事物。但是，我认为我们没有任何有意义的归因。这难道不令人难过吗？我知道。没有答案。这部分取决于激励措施。因此，实际上拥有数据或可以从中计算或推导出归因的数据部分的人并没有真正有动力提供这些数据。因此，即使像 PPC 方面一样简单的事情，对吧？在 Google 搜索方面，这曾经是我的世界，或者一直是我的世界。现在我们拥有的数据比过去少得多，例如点击次数等等，在 Google 实际上会向你发送之前。以下是人们键入的关键字，以及

几年前，他们甚至取消了这项功能。因此，很难将这些点真正连接起来。我们看到这种情况遍及各个领域。这不仅仅是 PPC，而是各种各样的东西。他们从 Search Console 中取消了这项功能。这是什么？Search Console 有这个功能。是的。他们取消了这项功能。Search Console 有这个功能。但是你的网站，如果你访问 Google Analytics，你可以将其连接回 Google Search Console。我明白了，我明白了。是的。好的。

好的。是的。好吧，这是一个众所周知的事情。你不必对 Google 大加批判。软件工程怎么样？你认为它会保持为工作即服务吗？或者你认为……我认为大多数公司都雇佣了很多工程师，但他们并不真正知道该如何利用他们，或者说他们并没有真正有效地利用他们。是的。我认为现在他们正在经历这种……

你知道的，危机，就像，好吧，我不知道我会如何为代理定价，因为我真的不知道我的员工在做什么。是的。你认为这会如何改变？我认为，所以我实际上对工程师的长期经济价值持乐观态度，这不仅仅是因为 Cogen 中的所有变革以及我们已经看到的所有事情，而是因为这些事情。因为人工智能的结果以及人们在其他学科中谈论过的事情，我们将能够解决更多的问题。

我这个半数学家认为，好吧，我们总是说，哦，现在代理将编写代码等等。因此，将会有数百万个软件工程师，你知道的，虚拟数字软件工程师。因此，每个工程师的价值将会下降，因为我只是处于与我作为工程师相同的境地。他们没有意识到，这不仅仅是关于分母的问题。还有一个分子，那就是可能的总经济价值。我认为，由于软件以及工程师能够利用他们将拥有的工具生产的东西，这比分母增长得更快。因此，我认为工程师的价值实际上会上升。他们将拥有强大的工具，他们将能够解决需要解决的更大范围的问题。是的，在我看来，它将保持为工作即服务。你支付的是工作费用。我认为没有办法做到这一点。而且将有一组工程师……

我们经常看到这种情况。你知道的，就像在媒体行业一样，你有一些人是作家，但你也有自由职业者，你知道的，他们撰写文章，或者以任何方式展现他们的创造性才能。两者都有意义，对吧？就像雇佣工作一样。还有一种基于结果的模式，或者说我制作了这个东西。也许他们，其中一些工程师实际上会制作代理。因此，他们会在某个时候将其放入像 agent.ai 这样的市场中，这就是他们赚取数百万美元的方式。关于代理还有什么其他想法？我们有很多杂七杂八的事情想和你谈谈。

我认为我们涵盖了很多领域。所以我对代理感到兴奋。我对世界的看法是，不要害怕。我知道这很可怕。对于我这个技术乐观主义者来说，这很容易说，但是要学习它。即使你是一个普通人，即使你不是工程师，即使你不是人工智能人员，你也会认为自己是一个人工智能人员。使用这些工具。我不在乎你现在担任什么角色，你在职场的哪个位置，它都会对你有用，并且开始了解代理。使用它们，构建它们。

我认为我给工程师的信息始终是，还有更多的事情要做。就像我们仍然处于弄清楚代理堆栈是什么样的早期阶段一样。我想让人们转向具有记忆的代理。是的。具有规划能力的代理。我们必须谈谈记忆。我们必须谈谈记忆。让我们开始吧。是的，让我们开始吧。因为我认为这是下一个……

在我看来，下一个前沿是实际的长期记忆，无论是对于代理，还是对于代理网络，都要以可信赖、可验证的方式进行，我不会说隐私优先，而是隐私导向的方式。我对“隐私优先”这个词有异议。因为很多时候我们说隐私优先，但我们并不是真的这么认为。隐私优先意味着我比任何事情都重视它。我们谈论的是什么并不重要。这对任何人都不是真的。任何想要被使用的东西。

所以记忆是一件有趣的事情，对吧？所以我目前正在研究的事情，agent.ai 中正在进行的很多事情都围绕着记忆的实现。并且有一些很棒的项目，例如 Mem0。但是，对我来说有趣的事情是……我们在 ChatGPT 和其他东西中看到了这一点，它确实具有长期记忆的概念，可以根据需要将内容调回到上下文中。我感兴趣的是……

跨代理记忆。所以，如果我现在是一个代理构建者，那就好比，好吧，这些是我知道的事情，或者是我从用户那里学到的东西，就提取……我称之为知识点，因为没有更好的说法。这很好。但是，当下一个代理构建者出现并且是同一个用户时，只要我选择加入，代理一了解我的所有事情，如果对代理二有用，那就应该这样，是的，我不在乎这些事情。事实上，我会觉得一遍遍地告诉代理二、代理 N 和代理 N+1 同样的事情非常烦人，因为它应该知道，系统应该知道。这就是为什么我相信这种代理网络和共享状态的原因之一，那就是用户效用是通过共享内存创建的，而不仅仅是我们应该为独立代理解决内存问题，

但我们还应该能够在整个系统中共享该上下文，共享该内存。这就是 agent.ai 的价值主张的一部分，就像，好吧，当你构建时，就像，所以我们有，你知道的，无论一百万用户，我们将拥有越来越多的关于他们的记忆。因此，与其让你自己去构建代理，将其作为宇宙中一个断开的节点，不如说，这就是在网络或平台上构建的价值，我们的或其他人的，因为这会创造更多用户价值，这更有用。你如何看待对此进行身份验证？因为内存的一部分就像选择性记忆一样，所以需要进行调度。是的，我希望你能够访问。如果我有另一个调度代理，你应该能够访问你参与的事件。是的，以及我有哪些时间可用，但它不应该告诉你我的日历上的其他事件。那是什么样的？关于这一点，我有太多想法了。这就是……

那里存在的机会，即解决这些根本性的问题……这将需要存在。因此，目前我们最接近的近似值是 OAuth 2.0。每个人都有它。就像，好的，批准。这是一个非常粗略的范围集，基于 OAuth 服务器的提供商，无论是谁，HubSpot，这都没有关系。就像，哦，我选择了一组范围，他们本可以将范围定义得非常细致。很好。但这取决于他们。

但这将非常缓慢地发展，对吧？例如，我现在使用的用例，就像我将电子邮件用于所有事情一样。我将其用作我的生活中的事件和数据总线，对吧？我的意思是，从字面上看，就像我做的任何事情一样，如果有一种方法可以将其放入电子邮件中，因为我知道这是一个开放协议，对吧？就像，好吧，我将能够以有用的方式获取这些数据。这在之前……所以我已经构建了一个向量存储，其中包含 300 万条数据，这些数据解决了我的个人用例。我会给你举个例子，但显然我不会为所有事情都构建我自己的软件。但是，如果一家初创公司出现并说，Dharmesh，你可以将你的电子邮件收件箱提供给我以换取这些东西吗？

我会说，绝对不行。就像，这实际上是我的所有东西一样，我的生活都在这里，对吧？所以你需要共享子集。是的。所以我认为有一个，也许这不是实际的实现，但想象一下，如果有人说，好吧，我有一个值得信赖的中间人来进行第一次信任，

无论如何定义，都说，好吧，我将通过 OAuth 登录到这个东西，它可以控制这一点。我可以使用自然语言来说，我只想将电子邮件传递给标签为 X 之一的提供商，或者是在最后一件事情之内的，并且每天不超过 50 封电子邮件，等等。因此，我没有让他们转储整个 300 万条积压数据。任何我想施加的控制，现在所有 OAuth 服务器端，Google，甚至大型的、小型的不重要，都不太可能这样做。但这是一个机会……

他们需要达到一定的规模，建立一定的信任，说，好吧，我要将密钥交给这个中间人。但是，这会打开很多实用程序，因为它给了我控制权，更细粒度的控制权。我会说 LanqChain 有一个有趣的。有一些人试图追踪破解 AI 电子邮件。每一个尝试过的人最终都放弃了。是的。我正在等待 Superhuman 来做这件事。是的。

我不知道为什么他们没有这样做，但是，你知道的。有一些很酷的人工智能技术。我认为速度需要加快。但我认为这可以追溯到 Open Graph。是的。对。就像，我认为 Google 没有动力来构建更好的范围。不。他们根本不会这样做。不。所以我们甚至无法获得像……我们甚至无法从 Google 获取语义搜索。不完全是。是的。就在本周，他们做出了宣布。你的意思是？语义搜索？在 Gmail 中？哦，我明白了。

所以，好的。所以他们拥有所有……他们拥有我的 300 万封电子邮件。为什么他们没有一个向量存储，我可以像基本一样使用？他们正在实时索引整个互联网。我不认为我的电子邮件那么重要，但是是的。我对内存的标准说法是，听起来你正在使用

还有 MemGPT，现在是 Letta，它在我的会议上做了一个研讨会。还有 ZEPP，它使用图形数据库，开源的，很有趣。还有来自 LangGraph 的 LangMem，我会重点介绍它。此外，这是一种非常有趣的、正在发展的哲学，人们似乎在就记忆的层次结构达成一致，从语义记忆到情景记忆，我认为，只是整体的背景处理。我们独立地重新发明了人工智能应该睡觉。

来进行记忆的深度 REM 处理。这很有趣。是的，就是这样。我的意思是，关于记忆和层次结构的概念，所以我谈到的我们现在正在研究的记忆是在用户级别，它是跨代理的，对吧？但是另一种更高级的方法是，所以再次回到这种混合数字团队，

你可以想象说，哦，我的团队有这种共享团队。我不想与世界分享，或者与这组人的这组代理分享。我希望拥有像我们在 Slack 频道中拥有的那种共享状态。这应该作为一个选项存在，对吧？并且平台应该提供这一点。我应该提到的 B 公司也提到他们正在研究这个问题。所以想象一下能够与人们分享，你知道的，选择性对话。这很好。Limitless 有，我想，基于语音的内容

我认为实际上没有。顺便说一句，我也是投资者。哦，真的吗？是的。好的。我试图思考我所说的一切。投资 OpenAI、Perplexity。

LaneGraph、CrewAI、Limitless，很多。所以如果我说过什么，顺便说一句，我没有内幕消息。我不是试图宣传或推销任何东西。我认为这是可以理解的。我们经常像，你知道的，如果你有参与其中，你可能已经投资了，或者，你知道的，可能没有。我不是 B 的投资者，但我只是朋友。我认为你应该能够自由地表达你的意见。好的。我们有一些杂七杂八的问题，可能会从 Agent AI 中放大。当然。首先，你提到了这一点，我必须问，你有多少……

你知道的，你有很多 AI 项目你永远都无法完成。是的。你想要其他人来完成的一两个项目是什么？哦，哇。从你的列表中删除一些。其他人要完成的。因为你永远都无法完成它。是的。我之前有过这样的想法。所以我有了这个

也许每周选择一个，然后放弃这个域名。我让人们提交他们的单页文档等等。就像，如果你能说服我，你至少有足够的想法，有足够的意愿来真正做些什么。这是你一直在提到的，但由于某种原因你还没有完成的事情。是的，是的。其中一些，我还没有底层的商业模式。

我们必须回到这一点，也许做一个后续剧集。他们没有跳到我的脑海中。你不需要商业模式。是的，scionscout.ai。我认为这是一个有趣的……顺便说一句，几乎所有这些，当时都有一个想法。就像，这是那些深夜的想法之一，就像，哦，我可以做到这一点。域名可用吗？不，去拿吧。我试图思考我在 AI 领域还有什么。我还有很多

像非营利性域名一样，用于像开放图这样的非营利性组织。我不确定为什么这些东西没有跳到我的脑海中。我有 agent.com，这显然与 agent.ai 相关。这将是巨大的。这将是巨大的。哦，我的上帝。这将类似于 3000 万到 5000 万美元。这将是巨大的。是的，我认为它最终会比 chat.com 更大，chat.com 是 15。是的。是的。是的。它更注重工作。是的。

这很有趣。是的，你想谈谈 chat.com 吗？我很想知道背后的故事。就像，你有一天只是打电话给 Sam，说，我得到了这个域名吗？他们是否回复了你？这是一个很好的故事。在最初的时代，

ChatGPT 时代，我脑海中第一个想到的事情，很多人都有同样的想法，那就是 OpenAI 将构建一个平台，而 ChatGPT 实际上只是一个演示应用程序，用于展示这个东西。科技公司已经有了先例，你知道的，演示应用程序可以帮助普通人理解底层技术。即使在某种提升之后等等。所以我最初的想法是，好吧，有人应该真正创建一个实际的真实产品。

所以我就像，而且这个产品应该被称为 chat.com，因为 GPT 根本不是一个对消费者友好的东西。就像这是一个首字母缩写词一样。我不漂亮，它听起来不好听。所以就像，我将

构建 ChatGPT，因为那时它只是一个演示应用程序。所以我得到了 chat.com。然后事实证明，ChatGPT 就像一个真正的产品。我参加了 Sam 在旧金山的一个活动，他在那里发布了插件。我认为那是当时的公告。这就是问题所在，就像我曾经怀疑过的一样，就像，好吧，事情是这样的，OpenAI 不可能为 ChatGPT 发布插件，除非他们没有将其视为一个实际的平台。所以这不仅仅是关于 GPT API 的问题。这是一个真实的东西。

我就像，糟糕，这违反了 Dharmesh 的第一条规则，那就是不要与 Sam 竞争。我知道当我购买这个域名时，这个域名存在竞争。还有其他公司想要购买它。我不知道他们是谁。我有一些怀疑。所以我买了它，然后我就像，好吧，我会联系 Sam。我说，嘿，Sam，我碰巧得到了，我不知道他是否参与了竞购或试图收购它，但我拥有 chat.com。我不，不想从中获利等等。如果你想要它，你显然会用它做一些更好、更大规模的事情。我不想参与与 Sam 竞争的游戏，这就是我所说的。所以他们确实想要它。

但我拥有chat.com。我并不想从中获利。如果你想要它，你显然会用它做一些更好、更大的事情。我不想参与与Sam竞争的游戏，这就是我当时所说的。所以他们确实想要它。是的，我们达成了协议。如果估值属实，这笔交易看起来非常划算。是的，谁知道呢？这是那些奇怪的事情之一。agent.ai域名评估师表示latent.space的价值在5000美元到15000美元之间。好的。

感觉对吗？嗯，它缺失了一些东西。所以这是它的V1版本。这个版本没有整合交易数据。我还没有发布这个版本。因为它在操作上也很密集，另一个版本也是如此。我们实际上是从一位听众那里获得捐赠的。所以我不知道实际成本是多少。但它缺少与影响者相关的链接。对。

顺便说一句，我还拥有crew.ai，我已经提供了。我是投资者。是吗？是的。我买了那个。我已经告诉他，只要你准备好，就告诉我一声，我会以成本价卖给你。是的。我的意思是，这确实增加了一些价值。因为你购买了很多域名，除了拥有一个非常好的域名经纪人（我假设你拥有），你最喜欢的域名购买技巧是什么？

不，我实际上没有。你没有？我自己做交易。哦，不错。我的人生态度非常坦诚。所以有些人会告诉你，就像，哦，如果有人知道你参与了交易，价格就会上涨。当然。但这仍然是买方自愿还是卖方自愿的问题。这并不意味着我必须支付那个价格。就像，好吧。但是

但好处是，因为我总是在有域名出售时以自己的身份联系对方。他们可以查到你。他们可以查到我。但我也显得非常可靠。就像，好吧，很少有人不会回复我的邮件，当我表示我对他们可能出售的域名感兴趣时，或者他们没有考虑出售，但你会考虑出售吗？所以是的，我最喜欢的域名中，我仍然拥有prompt.com，顺便说一句。那可能是一个大买卖。但是我……

拥有，这是一个我并不后悔的，我参与了一个不错的，我拥有playground.com。playground.com背后的最初想法是在当时，OpenAI拥有他们的playground，你可以在那里玩转模型等等，对吧？就像，好吧，应该有一个平台中立的东西。应该有一个适用于所有LLM的playground。然后你可以，现在显然已经有产品和初创公司在做这件事了。所以这就是我的最初想法。就像，哦，应该有playground.com，你可以像使用OpenAI的GPT一样测试所有模型并玩转它们。

然后，Suzeo带着Playground公司出现了。它已经出现在播客中了，是的，而且……

我认为他联系了我，可能是通过Twitter之类的联系了我。所以我们彼此认识。我从未，我仍然从未见过他。他问我是否会考虑，这是一个艰难的决定，因为我想，我实际上已经在脑海中有了商业想法。我认为这是一个好主意。我认为这是一个很棒的域名。这是一个非常简单的英语单词，现在有了新的含义。但再一次，我接受了，

我接受了股权，所以就像好处是，域名让我参与到我可能无法通过其他方式参与的交易中。我们应该将你的GoDaddy账户证券化，并将其变成一个基金。它基本上就是一个基金。是的。顺便说一句，回到免费的事情，顺便说一句，GoDaddy很糟糕。但在一家将域名视为可分割、可交易资产的公司中。

因为这在某种程度上是最初的NFT，对吧？就像，好吧，然后如果你可以同时进行分割，而且只是为了转移，就像现在一样，当你购买域名时，它非常痛苦，你必须通过托管服务，而且还有所有这些。就像，我只是想要即时的，就像，

用比特币或信用卡支付，然后我应该出现，我应该能够重新路由DNS。这应该是几分钟而不是几周或几天。无论如何，所以。是的，这就是ENS在以太坊上的基本相同之处。但它需要对普通人来说也是如此。是的，完全正确。他们应该带来它。

是的，ICANN及其所有内容都是它自己的事情。关于你不断提及的Sam Altman规则，我有一个问题。我最喜欢的、最喜欢的、最喜欢的“我的第一个百万”实际上没有你参与，但谈论的是你。好的。因为肖恩把你描述成一个激烈的书呆子，我相信你……

你在那里。我认为Sam也是一个激烈的书呆子，而且他……我正在听Jessica Livingston的播客，她在播客中谈到了他，并把他描述成一个令人敬畏的人。我认为你也很令人敬畏。我只是……

是什么让你如此令人敬畏？是什么让你成为一个激烈的书呆子？是什么让你如此充满动力？是的，Sam更激烈、更书呆子气，仅此而已。但我认为部分原因仅仅是我的信念的力量，我想。就像我愿意比那些比我聪明的人更努力地工作和努力。而我比那些比我更努力工作的人只笨一点点，对吧？就像我恰好是那种努力工作、坚持不懈的人的正确组合。如果我认为自己是对的，对吧？

我会坚持下去，直到我能证明自己错了……所以即使是自然语言的事情，就像，你知道，它花了20年时间，但最终我到达了一个点，世界赶上了，它成为可能。但是的，我认为……而且部分原因是，我认为……

这部分原因是，我认为，是什么让我成为，就像，我是一个好人。有时他们是最危险的那种，对吧？就像，好吧，我不树敌等等。所以我的建议是，这是我对竞争的看法。我不认为这是战争。我认为他们是对手，对吧？而且这不是战争。这是一个游戏，对吧？你可以使用任何比喻。我碰巧下很多棋。

我是一个棋类游戏的研究者。这部分原因是，我认为，是什么让我有效率。我为长期目标而努力。所以我很难被劝退。所以对于那些想要与HubSpot竞争的人，祝你好运。不，我会一直在这里。我会在这里再待18年。但这并不是说你不应该这样做。这是一个很大的市场。我不试图影响任何人。是的。我认为像我一样，我对这种信念感到挣扎。你说你追求信念中的事物，但是，

你一开始什么都不知道。是的。那么，当你发现它的时候，或者当你偶然发现它的时候，你如何培养信念，然后你失去信念，然后你停止工作呢？你如何继续前进？我所采取的方式是，我通常不会对解决方案或产品抱有信念。

我对问题抱有信念，这表明这是一个需要解决的实际问题。我现在可能有一个关于如何解决它的想法。而且我可能会被劝退。就像，啊，我不够聪明。技术不够好。无论是什么限制，但这是我对问题抱有的信念。就像，哦，那个问题仍然没有消失。所以我把它放在大脑的后面，我会重新审视它。就像，好吧，

你知道，董事会会发生变化，而且现在随着AI的变化，以前不可能的事情现在已经成为可能。所以你会回到你相信或曾经相信的事情清单中，然后说，也许现在，现在是时候了。也许那时不是时候，但是，

我非常相信热情地、坚定地致力于重要的问题。有些问题对我来说太高深莫测了，我永远无法承担。我有谦逊的态度来认识到这一点。是的，我觉得我需要一个更新的创始人版本的宁静祈祷。就像给我信心去做我认为自己能够做到的事情，但不要高估自己，你知道吗？是的，是的。无论如何，当你提到董事会发生变化时，你如何跟上AI的步伐？

事实证明，很多是通过YouTube。真的吗？是的，很多。好的。Fireship？我不知道Fireship是什么。现在这是一个流行的梗。每当OpenAI发布一些东西时，他们都喜欢OpenAI频道上的这些直播。最上面的评论总是，我会等待Fireship的视频。好的。因为Fireship会在五分钟内总结他们的内容。所以我的方法是，顺便说一句，我作息时间很奇怪。所以我的平均就寝时间大约是凌晨2点。哦，天哪。但我确实平均睡七个半小时。我不使用闹钟，因为我早上根本没有会议，或者至少尽量避免。所以我的夜间活动是，我会在编码时在后台观看大约两个小时的YouTube视频。这就是你看到我们谈话的方式。我有，是的。是的。好的。是的。所以有

如此多的好材料。顺便说一句，关于YouTube，就用例和应该存在但尚未存在的代理而言，我很想，现在已经存在构建它的技术，能够拍摄一个关于，比如说Latent Space或不是，而是关于AI工程师活动的YouTube视频，然后说，

说，只为我提取幻灯片，因为我想把它放到一个演示文稿中使用，或者任何形式的提炼或翻译成不同的格式。从视频中提取幻灯片。我认为这很有趣。顺便说一句，关于agent.ai的事情，我们常用的操作基元之一是能够从视频中获取成绩单。这似乎是一件微不足道的事情，但就像，如果你不知道如何以编程方式执行它，或者你是个普通人，就像，好吧，我知道它在那里，但我可以复制粘贴它。但就像，我如何才能真正获得你的成绩单，然后获得成绩单，然后能够对其进行编码并说，我可以实际为你提供时间戳。所以如果你有一个用例，说，哦，我想知道这到底是什么时候，我想创建一个聚合视频剪辑。这是我为妻子构建的实际原始代理，她想在不使用视频编辑软件的情况下将多个剪辑组合在一起，因为她想要这个聚合的东西，非营利性方面，就像发送给朋友一样。无论如何，

无论如何，Meta已经发布了一些视频理解模型。但到目前为止，最简单的方法将是Gemini。他们刚刚推出了YouTube支持。是的。所以他们在那里做得很好。就最近的AI方面最酷的事情而言，我会说过去一周到十天，是新的图像模型，Gemini Flash，实验性的，无论他们称之为是什么，因为它让你有效地进行编辑，而且只是

所以我的儿子正在做一个关于AI图像生成的八年级研究项目，对吧？所以他深入研究了稳定扩散和算法等等。我不太了解它。但我确实知道的一件事是，我足够了解稳定扩散，知道为什么编辑几乎是不可能的，你无法重现，因为就像你无法那样返回。这将是一件不同的事情，因为它是在你尝试类似提示时再次旋转轮盘。

因此，他们能够实现这一点的事实，它仍然非常像V1版本，因为你知道，其中一个测试用例，就像，哦，取HubSpot徽标并替换O，就像这种链轮，用甜甜圈。它会这样做，但它不会调整大小到实际适合实际事物的大小。就像，好吧。但这就是它的发展方向。你知道这背后的故事吗？大部分是Mustafa，他是……的一部分，所以他们在Lama 3中进行了图像生成。好的。律师没有批准。

Mustafa离开了Meta并加入了Gemini，并进行了转移。据说。这就是我能说的全部，他们摆脱了扩散。他们进行了自动回归图像生成。我认为这很有趣，这两个世界发生了碰撞，因为扩散实际上是关于图像的，而自动回归实际上是关于语言的。人们都在思考，他们将如何融合？

在midjourney方面，David Holtz非常看好文本扩散成为他们的前进道路。但似乎自动回归范式已经获胜。就像NextToken是……所以Hill和Playground在这方面做得非常出色，自动回归？我不知道它是否是自动回归，但它与图像编辑有关，而不仅仅是文本到图像编辑。

实际上是为像Photoshop这样的东西构建UI，用于实际生成图像，而不是仅仅进行文本处理。这太迷人了。我认为扩散已经死了。就像没有那么多。它只是更大的模型，你知道，更高的细节。现在自动回归出现了，现在整个领域都开放了。是的。我认为如果有什么东西对Photoshop或Canva构成真正的威胁，那就是这个东西。是的。

为了结束谈话，你有一篇很棒的文章，叫做对不起，你必须通过，如果我没算错的话，你第一次写是在2007年，第一个版本。然后你在疫情后重新更新了它。你提到你根据疫情对你的日程安排和生活做出了很多改变。你今天是如何做决定的？自从你……以来，有什么变化吗？因为你在2022年更新了它。我认为现在我们已经从疫情中走出了五年，所有这些。我很想知道你是否做出了任何改变。是的。所以那篇文章，对不起，你必须通过，发生的问题是……

我的日程安排和生活都变得不堪重负了，对吧？就像，就是这样，我只是，太多的点和连接。我喜欢与网上新认识的人互动。我喜欢创意。我喜欢初创公司。有很多，但事实证明，每当你对任何事情说“是”时，你实际上都在对其他事情说“不”。这就是，你知道，

尽管我尽力改变宇宙的规律，但我还没有做到。所以那篇文章是对此的回应，因为对我来说会发生的事情是，当我确实说不的时候，我会感到内疚，因为就像，好吧，无论发生了什么，就像，哦，你能花15分钟来回顾一下这个创业想法吗？就像，而且有时它就像是一个与我相隔两层的人，就像通过朋友介绍等等。我感到非常内疚。所以这是一个非常诚实、脆弱的，这就是我生活中正在发生的事情。所以这对你没有任何评判，无论你的项目是什么，或者你正在做的事情是什么。但我已经意识到，我做不到。所以对不起，但我，所以我现在的默认做法，很多人会不同意这种默认立场，那就是我必须通过，除非，德里克·西弗斯说得很好，就像要么是绝对的肯定，要么就是否定的，对吧？所以，而且我会，会有数量有限的绝对肯定，

我能够融入我的生活中。所以是的，而且这是我写的所有博文中，

对我来说最有用的一篇。而且我仍然亲自发送它，对吧？我还没有自动化我的电子邮件回复。不做自动化的社交媒体帖子。但是的，那篇文章非常……所以我鼓励每个人，无论你的底线是什么。我认为很多人都有这种内疚感。这是人类心理学中最没有生产力的情绪之一。就像内疚不会带来任何好处。真的不会。除非你是一个反社会者之类的人，也许你需要……

无论如何，你不需要更多的内疚。我也要说，所以我只是鼓励人们多写博客，因为很多时候人们想了解你的想法，然后他们问你和你其他人被问到的相同五个问题。所以如果你写了博客，那么你就可以听到。所以我正在研究的事情之一，也有一些初创公司正在研究这个，但我之前就开始做了，就像一个Dharmesh.ai，对吧？这只是捕获。这很有趣。所以这是agent.ai上底层平台上的代理之一。哦，有Dharmesh.ai？它就在那里。它是Dharmesh.ai。不错。它纯粹是基于文本的，现在没有视频，没有音频。但让我觉得有用的事情是，关于我如何赋予它知识的问题。所以我有一个私人电子邮件地址，因为我将进行的很多互动，或者如果我确实回答问题，因为我，顺便说一句，另一件事是，我不接任何电话，就像，根本不接。甚至，像，

没有Zoom。根本没有。我的意思是，我会和团队一起参加Zoom会议，但没有一对一的会议，没有一对一的，它根本无法扩展。所以我尽可能地转向异步世界。就像我会，只要我能控制时间表，就像我会花20分钟写一个周到的回复，但我保留匿名且不署名的权利，将它与我的模型或世界分享，你知道，通过博客文章或其他方式。但这很有用，因为现在我已经有了这种电子邮件积压，我可以回顾并说，好吧，我将尝试回答这个问题，转到向量存储。它好得令人震惊。我仍然很生气，Gmail没有开箱即用地做到这一点。就像他们在谷歌一样。我认为它现在必须来了。我认为他们终于，巨人被唤醒了。我认为他们有点，

鸡肉速度现在已经加快了。它是世界上最大的巨人之一。当我第一次告诉Alessio，你是我们梦寐以求的嘉宾之一时，我从未想过，实际上从未想过会预订你，因为对不起，我的配偶。所以我们只是想，啊，让我们发一封邮件。然后他会说不，我们会继续我们的日常生活。所以我必须说，我们非常荣幸。我很高兴来到这里。非常感谢第一次做客。感谢你为……所做的一切

社区。我代表很多人说话。你们教会了我很多我认为自己知道的东西。是的。我很感激。是的。我的意思是，我明确地受到了HubSpot的启发。哦，谢谢。入站营销，我认为这是一个天才之举。而且AI工程明确地以此为模型。所以就像你创造了你自己的行业，你知道，一个行业的子行业，因为它抓住了正确的趋势而成为了一件大事。是的。

这就是AI工程应该成为的样子，如果我们做对了的话。我们该如何搞砸它？

我们该如何解决这个问题？我该如何搞砸它？我们该如何搞砸AI工程？哦，是的。常见的失败模式，对吧，是……所以入站营销之所以有效，其核心思想是为客户解决问题，为受众解决问题，为另一方解决问题。因为营销中出现问题的原因是，营销非常以自我为中心，我有这个预算，我要轰炸你，打断你的生活和一天，因为我想让你从我这里买东西，对吧？入站营销恰恰相反。

就像使用你拥有的任何有限预算，并将有用的东西放到世界上，你的目标客户，无论是谁，都会发现它很有价值。无论如何，所以常见的失败模式是你失去了这一点。我不认为你会，但这是非常常见的，对吧？就像，啊，现在我只是要转动曲柄，再挤压一点。我认为像我这样的人如此欣赏这个社区的原因是，你们有真正想要行动的愿望。赚钱并没有错。拥有斑点也没有错。没有这些。

但其核心是，我们想要提高这群人的整体意识水平，创造价值，并在世界上创造美好。我认为如果你坚持下去，

随着时间的推移，市场会变得更高效，并奖励这种慷慨。这是我的一种基本的人生信念。所以我认为你们做得很好。感谢你们的帮助和支持。是的，我很荣幸。是的，而且为了以非常Dharmesh的方式结束，你有一个“对不起，你必须通过”博客的网址，它是sorrymustpass.org。所以是的，我认为这是一个很好的信息。是的，非常感谢你来到这里。哦，谢谢。感谢你们的邀请。

The Agent Network — Dharmesh Shah 01:38:24 Share

Latent Space: The AI Engineer Podcast — Practitioners talking LLMs, CodeGen, Agents, Multimodality, AI UX, GPU Infra and all things Software 3.0

Deep Dive

Shownotes Transcript

The Agent Network — Dharmesh Shah