We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode MCP, Agents and What AI Engineers Are Thinking About Right Now feat. Swyx

MCP, Agents and What AI Engineers Are Thinking About Right Now feat. Swyx

2025/4/17
logo of podcast The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

AI Deep Dive AI Chapters Transcript
People
S
Swyx
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
Swyx: 我认为AI工程师峰会的成功之处在于紧跟工程师的步伐,快速反应,比传统的机器学习会议更快地捕捉到最新的技术趋势。我们注重工程师能够实际应用的知识,强调动手能力,而非空洞的理论讨论。在规划2024年峰会时,我们面临一个挑战:'Agent'一度被认为是负面信号,但随着OpenAI等公司发布的Agent相关产品,情况发生了逆转。因此,我们果断地将Agent作为峰会的核心主题,并对Agent工程的专业化进行了深入探讨。我们认为,Agent工程的兴起是模型性能提升、工具改进以及商业模式转变共同作用的结果。模型性能的提升使得Agent能够达到人类基准,而多模型可用性、模型贬值曲线以及商业模式的转变则进一步促进了Agent的发展。 我们关注Agent在大型企业中的实际应用,而非仅仅是演示。来自Jane Street、Bloomberg、Ramp等大型企业的Agent应用案例在峰会上很受欢迎。强化学习(RL)和Windsurf等Agent应用案例也受到关注。 MCP协议的成功在于其作为非模型的工具,定义了工具与模型的交互方式。Anthropic在峰会上对MCP的详细介绍和未来规划,激发了人们的兴趣。MCP的成功原因包括其AI原生性、开放标准等特点,以及其在GitHub上的星数增长速度超过预期。OpenAI对MCP的支持以及Google的后续跟进,改变了Agent协议竞争的格局。MCP的成功促使人们将Agent视为一个新的创业领域,而非仅仅是一个工具。 我们对Agent工程的定义进行了探讨,并提出了六个要素:意图(I)、记忆(M)、规划(P)、控制流(C)、授权(A)和工具使用(T)。下一次峰会将增加MCP和Local Llama相关的主题,并关注安全和职位相关的主题,以及'vibe coding'相关的议题。我们希望通过峰会,帮助企业领导者更好地理解AI战略制定和人才招聘的重要性,并促进工程师与其他部门的协作。 主持人: 2024年AI工程领域的一个重要转变是“AI工程师”角色的扩展,以及“Agent工程师”的兴起及其与传统AI工程的互动。企业对Agent的未来预期是正确的,但当前Agent的能力有限,企业需要权衡投资时机。MCP等技术能够加速Agent能力的提升和新用例的出现。OpenAI和Lillian Wang对Agent的定义有所不同,这反映了对Agent工程定义的不一致性。“vibe coding”带来的新挑战需要逐步解决,但它也赋予了设计师和产品经理更大的自主权。企业领导者需要关注AI战略制定和人才招聘,其他方面可以授权给工程师。

Deep Dive

Chapters
This chapter explores the current discussions within the AI engineering community, focusing on the evolving role of AI engineers and the importance of staying updated on technological advancements. It emphasizes the significance of hands-on experience and building in the AI field.
  • The role of AI engineers is evolving.
  • The line between technical and non-technical roles is blurring.
  • Hands-on experience is crucial for AI engineers.

Shownotes Transcript

What's at the top of AI engineers' minds? Swyx, organizer of the AI Engineer Summit and host of Latent Space, joins us to discuss MCP (Model Context Protocol), the rise of AI agents, and how the role of AI engineers is evolving.Find our guest online:https://x.com/swyxhttps://www.ai.engineer/https://www.latent.space/Get Ad Free AI Daily Brief: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://patreon.com/AIDailyBrief⁠⁠⁠⁠⁠⁠⁠⁠⁠Brought to you by:KPMG – Go to ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://kpmg.com/ai⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ to learn more about how KPMG can help you drive value with our AI solutions.Vanta - Simplify compliance - ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw⁠⁠⁠⁠⁠⁠Plumb - The Automation Platform for AI Experts - ⁠⁠⁠⁠⁠⁠https://useplumb.com/nlw⁠⁠⁠⁠⁠⁠The Agent Readiness Audit from Superintelligent - Go to ⁠⁠⁠⁠⁠⁠https://besuper.ai/ ⁠⁠⁠⁠⁠⁠to request your company's agent readiness score.The AI Daily Brief helps you understand the most important news and discussions in AI. Subscribe to the podcast version of The AI Daily Brief wherever you listen: https://pod.link/1680633614Subscribe to the newsletter: https://aidailybrief.beehiiv.com/Join our Discord: https://bit.ly/aibreakdown </context> <raw_text>0 今天在AI每日简报中,我们将讨论非工程师需要了解的AI工程领域现状。AI每日简报是一个每日播客和视频节目,内容涵盖AI领域最重要的新闻和讨论。要加入讨论,请关注我们节目说明中的Discord链接。我认为AI令人兴奋的一点是,它正在打破技术人员和非技术人员之间的壁垒。

AI是一种中介技术,非技术人员可以通过它开始从工程和开发的角度理解创造的工具。当人们试图运用他们大脑的这一部分时,我经常推荐给他们的资源是Latent Space播客和新闻通讯,以及由一些相同的人员制作的AI工程师峰会。

具体来说,今天的嘉宾Swyx是所有这些令人惊叹工作的核心人物。他对AI工程领域的对话现状有着极其敏锐的洞察力。因此,今天我们将讨论AI社区中人们正在讨论和构建的重大主题,以及这些主题对我们其他人的影响。好了,Swyx,欢迎回到AI每日简报。你好吗,先生?

很好。我是节目的长期听众,很高兴回来。是的,我认为这将是一次非常有趣的对话。我们在录音前聊到,我认为非常有价值,而且我希望从这次对话中得到的是,帮助我的听众,我认为我的听众平均而言……

非工程师的比例高于你的听众。所以,你知道,帮助企业和非工程师理解AI工程领域的主要讨论方向。我认为目前很清楚的是,对于那些身处技术领域并使用技术进行构建的人们来说,无论他们是工程师、开发人员还是其他角色,尝试关注技术发展始终是有价值的。

构建者们正在构建什么,他们如何构建,他们使用什么工具。我认为这在AI领域尤其重要,对吧?非工程师和工程师之间的界限越来越模糊,对吧?也许在某些地方会引起一些不满。所以我认为这将非常有价值。我认为你显然对这一点有独特的优势,你在制作内容方面,例如Latent Space,以及通过策划AI工程师峰会,都展现了这一点,对吧?所以我们刚刚结束了一个峰会,

我想现在已经过去几个月了,感觉就像一分钟前的事。那次在纽约的峰会非常有趣。你今年夏天将在旧金山举办AI工程师世界博览会。

所以我认为我们可以一起回顾一下,利用这些策划过程来阐明人们的想法,以及即使在这么短的时间内这些想法是如何变化的。也许首先,我认为你刚才分享的关于你如何思考策划过程的想法,实际上对于人们进入这场对话非常有用。是的,当然。谢谢。是的。

策划过程,你知道,这是我第三年做这件事了,所以我并不觉得我已经完全掌握了。但是,你知道,我认为最主要的是,我们的优势在于我们与工程师保持密切联系,并且我们反应迅速。

比机器学习会议更快。这是两件事,因为有很多竞争对手,有很多会议,但是,例如,NeurIPS、ICML、ICLR等研究会议,我不知道人们是否知道,为了在一个这样的会议上发言,你必须提前六个月提交论文。

所以在AI领域,这是很长一段时间。这仅仅是因为NeurIPS已经有38、39年的历史了。在他们刚开始的时候,速度并没有这么快。而现在却不一样了。而且,你知道,很难改变这样的传统。

然后其他会议通常是为业务主管、发言人和对这类事情感兴趣的人组织的。所以他们不会深入到技术细节中。我认为这其中的关键问题是,有很多炉边谈话,有很多小组讨论。每个人都毫无准备地出现,他们唠叨30分钟,然后就结束了,你什么也记不住。

所以我非常强调的是,工程师们将带走什么来完成他们的工作,以及如何改进这些工作。这意味着我要求我的演讲者做很多准备。但这也意味着,这会带来我们得到的结果,那就是,真正有意义的演讲。来参加的人实际上是想认识那些动手能力强、实践经验丰富的人。

所以,是的,我的意思是,这很奇怪,因为,就像,亲自动手比,你知道,像大型公司首席执行官那样上台谈论我们五年内都不需要工作,要稍微不那么有声望一些。但是,你知道,那些需要亲自动手的人也需要一个聚集的地方。这就是我所做的。

是的。而作为一名参与者,至少在上次峰会上,我帮助主持和做一些事情,我认为我的观点是,总的来说,行动发生在亲自动手的时候。即使你是,现在每个人都是建设者,这是重点,无论他们是用代码构建还是用其他方式构建。如果你完全参与到

AI和Agent领域。那么让我们谈谈今年早些时候的峰会。从外部来看,感觉上一个重要的转折点或变化是,

对这个问题的扩展,这个问题在很大程度上定义了2024年,那就是什么是AI工程师?以及,如何成为一名AI工程师?这意味着什么?你需要考虑什么?什么是Agent工程师?Agent工程如何与变化、修改、转换这个框架相互作用?我很想知道,这是否是你思考问题的方式,这是否是一个重要的转变,以及你想要促进的对话的含义是什么。是的。

是的,我不知道人们是否理解,当时这感觉像是一种冒险,因为我们在11月份左右做出了这个决定。实际上,在去年的很多时间里,“Agent”这个词有点不好,因为有一些Agent初创公司失败了。人们有点把它……你知道,我们告诉人们不要在他们的描述中使用“Agent”,因为它定义不明确,而且使用过度,以至于人们……

不再喜欢看到它了。这是一个反向信号,表明你正在做一些有趣的事情。然后它随着O1以及随后所有其他Agent的发布,包括Operator Deep Research等等,发生了真正的转变。

Manus现在很疯狂。所以去年的世界博览会,我们有九个主题。九个主题中只有一个是关于Agent的。所以我们真的必须决定,好吧,现在是Agent的正确时机,我们将全力以赴。我认为还有一个考虑因素与工程师可以独特地做什么以及研究人员可以做什么有关。而且,你知道,我们还有其他关于开放模型的讨论,我们还有关于

GPU和推理以及多模态模型等等的讨论。但是很多这些都开始与堆栈的研究层纠缠在一起。这些都很好,但是它们主要由拥有进行这些研究的资源的人主导。而且已经有研究会议了。所以我们真的想做一个工程师会议。我认为在模型之上进行工程层面的专业化,将它们转变为Agent

是关键。我一直在等待那一刻,感觉时机到了,尤其是在去年年底发布NCP之后。所以我宣布我们将全力以赴地投入Agent领域,我们规划了,我们认为Agent工程的学科是什么。最终结果大相径庭,但我们确实确定了他们的提案范围。人们来了,而且非常受欢迎。所以我的意思是,我可以详细介绍那些表现良好的演讲,但这只是一个高层次的概述,那就是我们对Agent做了一个高层次的押注。然后我做了主题演讲,解释了为什么是现在?我认为有一个非常强的……

时机问题,如果你正确但为时过早,你仍然是错的,而且我认为,我认为你知道,2025年是Agent之年这一整体趋势,我认为可能是正确的,你怎么认为?不用重述整个主题演讲,你认为关键的转折点是什么?是推理模型吗?是更好的基础设施吗?我的意思是,你认为是什么导致了这种转变,使其成为现实?

如果我可以分享我的屏幕,我会,你知道,对于YouTube上的观众来说。我有九个要点,其中很多都是缓慢烘焙的,对吧?就像这些在模型性能方面一直在改进一样。所以我现在在屏幕上看到的是Gaia基准测试的元性能。

顺便说一句,如果你们想了解更多关于Gaia真正是什么以及他们的意图是什么,我们去年采访了Gaia团队。但是这些事情在这个S型曲线上一直在改进,我们现在正处于

S型曲线的顶部,我们开始达到人类基准。我认为我们越接近人类基准,我们就越能开始实际使用它们,而不是仅仅报告基准分数并说,这很可爱,但我现在要回到使用我的直觉了。但是还有其他一些东西,对吧?例如,有更好的能力、更好的工具、更好的工具。但是,例如,我喜欢强调第二层的东西,因为我认为人们并没有真正……

人们总是关注第一层,那就是,哦,我们现在有了推理模型而不是非推理模型,这使得一切都有所不同。当然,这会有所帮助,但是你可以在没有推理模型的情况下构建Agent,并且仍然可以从所有这些其他方面获益。所以多个前沿实验室,例如Grok 3现在有一个API。Gemini 2.5 Pro可以说是世界上最好的模型。你不会被限制在一个模型上,因此你可以将不同的能力组合在一起并摆脱困境。

模型的折旧曲线也是一个持续的力量,对吧?这都是摩尔定律以及我们稍后可以讨论的其他好东西。我认为在业务方面我想强调的最后一件事是,我们实际上真的……

正在从成本加成模式转向交付的结果模式,你只是根据令牌数量收费,然后你可能会稍微提高一点价格。这是一个巨大的变化,对吧?因为现在的重新定义是从,好吧,你能多好地消耗我的令牌,变成了你能完成我多少工作?因此,你的价值就这么多。这其中的差距是几个数量级。

是的,非常有趣。那么,你试图将哪些类型的演讲结合起来,你知道,来实现这一点并使其栩栩如生?哪些演讲取得了成功,你知道,特别是,我很想知道你对哪些演讲最能引起人们共鸣的主观看法。你没有预料到?

或者你预料到了,你知道,在那些最能引起人们共鸣的演讲中。是的。好吧,我的意思是,我们仍在发布所有演讲的过程中。所以我事先不知道所有内容。但是你可以看到,像Big Lab这样的任何东西都很好。当然。因为我们在纽约组织,我们真的也想关注生产中的Agent,对吧?我认为这次会议的副标题是“工作中的Agent”。

所以,我认为很多人看到了演示,然后他们说,这很可爱。我可以把它用于有趣的演示,然后他们可能永远不会真正使用它。但是谁在工作中真正使用这个东西?它对任何财富500强公司有什么影响?

你知道,如果他们因为他们如此聪明、如此庞大、如此资源丰富而想通了,他们想通了什么是我没有想通的?对吧。所以,所以我从Jane Street、Bloomberg、BlackRock那里请来了人,顺便说一句,他们的演讲并没有

被批准发布。所以所有参加的人都会获得独家内容,我们不能发布。Alpha Baby。还有Ramp。是的。所以大型公司中关于生产Agent和AI的演讲,例如

Jane Street、Bloomberg、Ramp。顺便说一句,Ramp,我认为在这次演讲之后宣布了110亿或120亿美元的估值。两者之间没有关联。然后我想RL非常火爆,我们可以谈谈这个,但还有Windsurf,我认为我总是很惊讶,你可以在……之后成为第二名……

移动者,并且仍然做得非常好。而且,而且,你知道,只要你,你设计你的Agent很好,你,你,你采取了……

足够好的差异化,你拥有足够好的差异化,人们会给你一个机会。我认为这非常令人鼓舞。我认为这仅仅意味着,如果你认为某些事情已经结束或某个类别已经完成,也许你应该更加努力。是的。当我抽出时间查看时,再次采样并非所有东西都在上涨,但是

一些杰出的演讲包括用于Agent的RL、Windsurf,然后,当然,也许我们可以现在讨论的一个是MCP,

MCP讨论。我预计这个演讲会很受欢迎,所以它确实……是的。是的。好吧,所以我希望,像其中一件非常有趣的事情是你写了一篇帖子,或者你们写了一篇帖子,叫做《为什么MCP赢了》,我认为这非常有趣。我认为我为此做了一整集节目。基本上,这是一篇很长的帖子。是的。我的意思是,你不断创作优秀的内容,我会继续……你知道,为我的听众重新组合它。而且,

所以我认为部分有趣之处在于,它如此新近,但现在在我的记忆中仍然如此清晰,MCP已经完全接管了对话,对吧?几周前,谷歌首席执行官问到是MCP还是不是MCP,然后昨天回答了这个问题,或者从录制这个节目的时候算起是昨天。但是你正在反思MCP发布后的这段时间

对其的反应,所以你基本上认为最初的反应很好,但随后它安静了一段时间,你能带我们回到11月底发布的时候,到12月和1月,你当时是如何看待MCP的,然后你看到了对话的回升,以及你将其归因于什么?是的,我会把功劳归于Alex Albert,我认为他在某个地方有一个关于MCP的时间表……但是是的,它是在

有很多兴趣。我认为它是Hacker News的头条新闻。但我认为并没有大量的后续行动,因为人们已经习惯了……

大型公司发布协议,然后它失败了或者根本不起作用。人们可能不记得的一个最近的例子是Meta实际上发布了一个Llama Stack,这是一个完整的开源框架和堆栈。所以每个框架都嵌入了一个协议。所以,我的意思是,这就是那里的见解,每个人可能在试图一次性强加所有这些观点方面走得太远了。

Anthropic采取了不同的方法,采用了一个其他框架可以构建在其之上的协议。也许正是这个最小可行产品实际上是唯一可行的产品,因为其他所有东西都会强加太多意见给所有构建东西的人。所以我认为……

很多人开始探索它,我认为像将其集成到他们的工作流程中一样。我认为这可能是由IDE驱动的。所以像Zed和Windserve,然后最终是Cursor,我认为是最后一个添加它的。也许Copilot也是。我不太确定那里的确切顺序。但是我认为,

是的,我的意思是,我真的知道这将很有趣,我认为对于一个大型实验室来说,发布一些不是模型的东西是很好的,它说明了工具应该如何与模型交互,

我认为就OpenAI在2023年和2024年使用其函数调用规范和工具调用所做的事情而言,这做得很好,但并没有MCP那样令人兴奋,我认为Anthropic尝试一下真的很棒,我想重点介绍他们。这实际上是我对他们的计算量。他们真的……

一路走到了最后。Anthropic一直是我会议的坚定支持者。所以他们出现了,他们做了大约两个小时的演示,他们有很多新的alpha。他们从未在其他任何地方发布过。

然后他们还谈到了他们的未来计划,在会议上宣布了官方的MCP注册表。所有这些都激起了更多的兴奋,因为我认为从大型实验室发布这些东西的另一件事是,他们需要后续行动。人们需要相信这是一件正在积极开展的事情。我认为你喜欢的我的陈述之一是,协议的强大程度取决于已经使用它们的人。所以你只需要相信

如果我投资MCP,我的所有朋友都会投资MCP。所有我想与之比较的人都投资了MCP。所以,是的,我的意思是,你知道,那个研讨会做得非常好。我们发布了它,这是一个不错的成功。我认为我比任何人都早地看到了这些数字,因为我可以看到……我可以看到。我查看了下载统计数据,我查看了……你知道,所有东西的趋势。所以我认为这是我关注的图表。我想,

好吧,你知道,我应该现在就说出来吗?现在说出来是不是太早了?就像,这正是……你知道,就像MCP发布三到四个月一样。

已经有很多尝试创建某种Agent基准或Agent标准,但没有像这个一样的。我只是想,哦,我认为MCP赢得这场比赛的几率相当大。我试图向自己解释它为什么赢了。我最终得到了这七个原因,对吧?或者六个原因,那就是,它是AI原生,它是开放标准,等等。你已经在你的播客中讨论过这些了。你猜怎么着?我不知道你自那篇文章以来是否看过这个图表。

我没有。不,我没有。是的,好吧,我们可以点击它。它已经……我们可能需要一些时间来加载数据。但是基本上,我预测MCP将接管……

所以这只是GitHub星标,对吧?所以我们在很短的时间内从零增长到15000,比任何人都快。但现任者是OpenAPI。这是基本上是旧行业标准的庞然大物。而那个有30000个星标。所以它基本上一直在那里。所以我做了一个保守的预测。我想,它将在7月份左右达到30000个星标。

不,它在本月就超越了。太疯狂了。今天的节目由Vanta赞助播出。Vanta是一个信任管理平台,帮助企业自动化安全和合规性,使他们能够展示强大的安全实践并扩展规模。在今天的商业环境中,企业不能仅仅声称安全,他们必须证明这一点。通过实现SOC 2、ISO 27001、HIPAA、GDPR等框架的合规性,企业可以展示强大的安全实践。

我们每次将企业与Superintelligent的Agent服务提供商联系时,都会看到这一点有多重要。对于企业来说,许多这些合规性框架根本无法协商。

问题是,处理安全和合规性既费时又复杂。这可能需要数月的工作,并占用宝贵的时间和资源。Vanta通过自动化35多个框架的合规性,使其变得轻松快捷。它可以在几周而不是几个月内使你准备好接受审核,并为你节省高达85%的相关成本。事实上,最近的一份IDC白皮书发现,Vanta客户每年获得535000美元的收益,该平台在短短三个月内就能收回成本。

事实胜于雄辩。超过10000家全球公司信任Vanta,包括Atlassian、Quora等等。在有限的时间内,听众可以在vanta.com/nlw获得1000美元的折扣。网址是v-a-n-t-a.com/nlw,可获得1000美元的折扣。

听众朋友们,你们是否负责安全部署和使用值得信赖的AI?毕马威(KPMG)有一份首创的AI风险和控制指南,为组织提供了一种结构化的方法,以开始识别AI风险并设计控制措施来减轻威胁。

毕马威(KPMG)的AI风险和控制指南与众不同之处在于,它概述了实际的控制考虑因素,以帮助企业管理风险并加快价值创造。要了解更多信息,请访问www.kpmg.us/AIGuide。网址是www.kpmg.us/AIGuide。

今天的节目由Super Intelligent赞助播出,更具体地说,是由Super的Agent准备情况审核赞助播出。如果你已经收听了一段时间,你可能已经听我说过这个了。但基本上,Agent准备情况审核的想法是,这是一个我们创建的系统,可以帮助你在你的业务中进行基准测试和规划机会。

在你的组织中,Agent可以专门帮助你解决问题,创造新的机会,再次强调,这完全是为你量身定制的。当你进行这些审核时,你将进行一次基于语音的Agent访谈,我们将与你的一些领导和员工合作。

来规划组织内部的情况,并找出你在Agent旅程中的位置。这将产生一个Agent准备情况评分,其中包含对优势、劣势、关键发现以及当然是一系列非常具体的建议的深入解释,然后我们能够帮助你找到合适的合作伙伴来实际完成这些建议。因此,如果你正在寻找一种启动你的Agent战略的方法,请发送电子邮件至[email protected],让我们把你连接到Agent时代。

是的,我的意思是,对我来说,严格从竞争压力中获取信号,因为……你知道,因为OpenAI非常引人注目,因为当他们宣布Agent SDK时……

这有点像,好吧,很酷,你知道,也许是不成熟的自然解释是,明白了,将会有一个Agent协议战争,对吧?这是在开发人员忠诚度方面,我们将争取的另一个竞争方向,然后五分钟后他们说,我们喜欢MCP,我们也支持MCP,我想,好吧,这是一个完全不同的游戏,显然谷歌随后也跟进

而且,你知道,我确实认同你在协议网络效应方面提出的观点。显然,在其他人构建的地方构建具有巨大的优势。它很快就克服了引导问题,你知道,这几乎就像,如果每个人都能更快地走到一起并做出决定,这对每个人来说都是如此好,就每个人相互提供的集体价值而言,你知道吗?是的。

你知道,你现在有的人正在考虑这是一个新的初创公司类别,而不仅仅是一个新的工具,而是一个实际的构建事物类别,你还有Darmesh Shah,我知道他最近也在节目中,他一直在LinkedIn上发布所有与MCP相关的初创公司想法,他没有时间去做,你知道,而且我认为当有人回应说他们正在做那件事时,他资助了其中一家公司,哦,哇,是的,所以所以它

看到这个生态系统发展得如此之快,并开始蓬勃发展,真是太酷了。是的。所以我认为人们认为我是一个MCP节目,因为显然我只是展示了一点点,但我对此有点谨慎,对吧?就像我看到协议被炒作,然后又变得非常不火一样。而且,你知道,在开发者领域中最近的一个例子是GraphQL。

这就像,是的,这是REST之上的一层更好的东西。每个人都在进行REST与GraphQL的讨论等等。这让人想起MCP与OpenAPI。这基本上是一样的。顺便说一句,GraphQL出现的所有问题也出现在MCP中。例如,你如何进行授权?你如何连接到远程MCP并发现它们?完全一样。

因为这些都是相同类型的问题,我称之为M乘以N到M加N问题,对吧?这就是你如何通过添加一个具有标准接口的合法抽象来解决组合问题,每个人都插入其中,对吧?

这是一个普遍的概念,每个人都理解。MCPR 的作者非常清楚这一点。在我们与他们进行播客采访后,他们与我讨论过这个问题。所以,我的意思是,我认为良好的治理和判断力仍然会胜出。他们有一种方法可能会搞砸这件事。我认为我也参加了这些 TBPN 播客,他们说,这会导致代理爆炸吗?我说,代理爆炸已经发生了。这并没有真正……

改变任何轨迹。但这基本上提高了集成的质量。这是一个枯燥的答案。就像,你知道,你在一款应用中编写的集成,你期望在另一款应用中也能看到,因为添加它们非常容易。而且你不必等待他们添加,比如,你知道,Notion 只是因为它在他们的待办事项列表中,而且他们还没有优先考虑它。不,它开箱即用,因为Notion昨天刚刚发布了MCP。就是这样。它不会带来超级……

或者除了它们更广泛,可以与更多事物集成之外的任何东西,但我们仍然必须解决代理的许多其他核心问题。所以我认为这是一个很好的、很好的警告,我从这个角度来看待它。所以,你知道,再次回到企业受众,我认为许多企业现在正在努力弄清楚的是

呃,有趣的是,当他们考虑代理和代理能力时,我认为当他们在头脑中和理想的眼中想象代理可以做什么时,他们的方向是正确的

他们对事情的发展方向是正确的。问题是,在大多数情况下,它还没有实现,对吧?代理可以做的事情更加有限,更加谨慎,等等,对吧?他们想象的和真正兴奋的事情与他们现在所处的位置之间存在差距。一个重要的计算是

在多大程度上、以多快的速度和以何种方式进行投资,这取决于变化的速度。这确实非常具有挑战性,因为答案很明显,对于大多数情况来说,这实际上不可能是全力以赴地构建你目前最想构建的东西,因为在许多情况下,它并不完全符合他们的预期,但它也不能处于光谱的另一端。只需等待它准备好,因为到那时你就会落后了。所以,嗯,我认为他们正在努力理解,

在过渡期间该做什么。而且,嗯,

称之为加速力量,我认为这是对您刚才用 MCP 描述内容的另一种说法。它很无聊,因为它不会产生更多代理,也不会改变轨迹。但是,通过拥有,你知道,你的观点,不必等待Notion集成,不必等待,你知道,你正在等待的其他一些东西,它确实感觉可能会加速新功能上线的速度。而且,你知道,连接到生态系统的每一件新事物都可能会打开一些额外的用例。

是的。我大体上同意这一点。是的,我们可以讨论从演讲、从会议上获得的代理工程的其他要素。是的,我认为 MCP 是一种很棒的协议,但想象一下,如果所有其他东西都有标准。

是的,让我们谈谈除此之外的其他部分。是的。那么,会议上发生的另一件事是在之后跟进的,OpenAI 实际上预览了他们如何看待代理,他们发布了,这是面向 AI 副总裁的 OpenAI 演讲,在你来之前的一天。

他们说,代理是一个 AI 应用程序,它由以下部分组成:一、配备指导其行为的指令的模型;二、扩展其能力的工具访问权限,即 MCP;三、它可以封装在一个具有动态生命周期的运行时中。

这就是他们预览的内容,然后他们在之后启动了 Agents SDK。我的意思是,他们告诉我他们正在做的事情。所以我完全了解这一点。所以有趣的是,这是一种定义形式。然后是 Lillian Wang,她曾经是 OpenAI 的安全系统主管,她对代理有不同的定义

代理的特征,她说,代理是大型语言模型加上记忆加上规划加上工具使用。所以每个人都同意模型层,每个人都同意工具使用,然后他们在其他所有方面都存在分歧。Agents SDK 没有记忆,没有规划技能。然后 Lillian Wang 忘记了你需要模型的提示。而且还需要这个运行时,实际上是这个疯狂的循环

就像循环中的代理决定下一步做什么一样。所以我认为它非常混乱。而且,你知道,我不喜欢那样。它看起来非常没有条理,因为人们并没有认真对待定义什么是代理工程。所以我尝试了一下。共有六个要素,对吧?所以它是 I-M-P-A-C-T,只是因为我,你知道,每当有很多要素时,我喜欢有一个首字母缩略词来记住它们。我不是想强推它。是的,伙计,是的。

你知道,你必须……国会也这样做来命名法案。你必须让它令人难忘。我记得,比如,我认为,比如,有一个……

绝地合同之类的东西。无论如何,它是一个非常有趣的首字母缩略词。但是 IMPACT,这里唯一强制的首字母缩略词是 I。I 是意图,因为意图实际上是从 OpenAI 刚刚用于他们所谓的提示中借用的。但我认为你还需要编码目标和评估,这意味着如果你,比如评估是一种提示,

因为一旦你针对评估运行代理,你就可以获取评估的负面结果,然后再次提示它以获得积极的结果。

这就是你的意图。就像你想要,你想要编码或分类以及执行的年份是什么,嗯,其他一切都很简单。M 是记忆。P 是规划。C 是控制流。这是运行时,嗯,如果,如果由大型语言模型驱动的 else,嗯,a 是权威,因为 OG 的含义,人类对代理的含义,比如我的房地产经纪人,我的,嗯,你知道,房地产经纪人,无论什么。嗯,

是代表我工作,因为我相信你会代表我工作,维护我的利益。而且,再次,就像在技术定义中一样,工程师们,他们喜欢信任是你最后考虑的事情。但实际上,对于消费者来说,对于企业来说,信任可能是第一位的。如果我不信任这个东西,我不会使用它。最后一个是工具使用,这是每个人都同意的事情。

那么让我们谈谈将这种想法带入现实,看看我们现在所处的位置。你生活在一个对这个领域理解快速变化的环境中。现在你再次必须将其结构化,以夏季峰会的节目单的形式呈现。那么,自从你计划上次活动以来,你对需要包含在演讲系列中的内容的想法是如何变化的?对于你们正在进行的各种类型的专题讨论,这在实践中是什么样的?是的。反馈循环非常紧密,对吧?所以 MCP 表现得非常好。所以现在我们加倍努力,我们现在,我们刚刚宣布了一个完整的 MCP 专题讨论,由 MCP 团队主持。然后我们只是让他们邀请他们的主要贡献者。它就像一个 MCP 小型迷你会议,对吧?我的,就像我,

我只是喜欢我能做出这样的决定,因为我知道其他会议做不到这一点。所以我们会这样做,因为我们可以。我们对 Local Llama 也做了同样的事情,因为他们早就应该举办一次会议了。他们是那里最大的开放模型社区。

在我们 L 演讲中,来自摩根士丹利的 Will Brown 的演讲也做得非常好,因此我们宣布了一个推理在我们的 L 专题讨论中。所以基本上,我并没有努力推动 AI 工程的概念,只是因为我喜欢谈论这些想法,然后让它们有机地获得关注,因为……

如果时机不好,或者概念不太合适,我不会改变人们的想法。对。但我只想关注我们可以让世界上顶尖的演讲者聚集在一起的个别问题或领域,并且,

他们主要会做他们的演讲,但实际上他们是在那里互相认识。就像我,我完全知道作为策划演讲的人,演讲实际上并不那么重要。只是人们出现并在走廊里聊天。所以,你知道,就是这样。就像我,你知道,我们想要,我们想做一个好节目。我们想帮助不在旧金山的人了解 AI 的现状。但是,是的,

最终,人们只是会亲自见面并线下交谈,你知道,决定下一步做什么。所以,是的,这就是全部内容,对什么有效以及人们想要更多什么的快速回应。然后,我认为对于夏季会议来说,我认为你必须拥有一套东西,即使它们不是那么令人兴奋,比如没有人,你知道,

非常关心安全,但他们确实关心,你知道,最终,尤其是在他们投入工作时。所以是的,我们有一个安全专题讨论,你知道,因为我们必须这样做。然后我的工作是找到最有趣、最实用的演讲者,他们不会让你对,你知道,你已经知道应该做的事情感到厌烦。诸如此类的事情。我还想关注工作。所以,我认为,

我在 AI 工程方面做得最聪明的事情之一就是直接以我试图创造的工作来命名它。我认为围绕 AI PM 和 AI 设计师的工程方面存在关联性,他们与 AI 工程师一起工作。

所以我给他们一个机会。我邀请设计和 PM 来谈谈他们如何与工程一起工作,或者只是在他们应该如何做他们的工作方面进行思想领导。我们永远不会成为一个完整的 PM 会议,产品管理会议。我们永远不会成为一个完整的会议设计。但我认为如果我们能向他们展示他们在工程方面有发言权,我认为这是他们想要的东西。

是的。所以这实际上,以及,我显然想谈论的主题之一是,是氛围编码。我实际上认为这感觉像是一个,一个有趣的桥梁,因为,所以我们刚刚收到来自,来自 Shopify 首席执行官的笔记,对吧?这就是新的 AI 命令。其中一部分,你知道,显然是每个人都关注的部分是,在你证明 AI 做不到之前,不要招聘新员工。嗯,但对我来说最能引起共鸣的部分之一,作为,你知道,在这个新的环境中建立公司的人,是,

实际上是,你必须用 AI 对所有东西进行原型设计,对吧?所以,你知道,他没有说得那么清晰,但是,你知道,对谈论产品的东西有一个软禁令,而不是展示你可以上手的产品。这也是我们在内部也做出的转变。就像,你知道,在六家公司的核心贡献团队中,

与超级智能公司一起,你知道,一位首席工程师兼首席技术官,但每个人都在使用 lovable 或 bolt 或 for sale 或任何他们,你知道,他们的,他们的首选工具。

当他们有关于功能或想要更改事项的想法时,对吧?这已经成为一种常态。仅仅从纯粹的效率角度来看,对于人们来说,通过实际看到它的某些奇怪的小原型,更容易进行第二步或第三步思考他们试图表达的内容。而且它非常容易。我的意思是,这是一个 2 倍、3 倍、5 倍,你知道,在

就他们以速度向他人传达信息的能力而言。所以我认为这非常有趣,因为它可以作为桥梁,因为,你知道,AI 工程的这种新能力的一部分是,它本质上更具邀请性,或者也许意外地更具邀请性是一种更好的说法,让非工程师能够以某种方式在他们自己的层面上与工程师互动。

是的,我不确定对此该说什么,除了我大体上同意。你知道,我认为它是组织所有部门的推动者。而且,哦,天哪,我一直想……

拥有这样一套人们应该尝试的推荐堆栈,但我知道如果我这样做,那么人们会因为我没有包含某些东西或错误分类某些东西而生气,但这几乎就像一个必要条件,你应该在你的公司中拥有其中一个,对吧,嗯,而且,这很吸引人,我认为那些

积极主动并且不介意在最前沿冒险的人,他们会找到使他们更高效的工作流程,这将使他们在思想竞争中获胜,我想。所以我对此有点理想化。但是,是的,很乐意详细讨论任何内容。顺便说一句,我认为氛围编码是由我的导师安德烈创造的,并且在某种程度上脱离了语境,

是的,很大程度上。是的,足够大了。是的,非常荒谬。他实际上是在谈论氛围。就像,他没有说一杯葡萄酒,但你可以想象他听着,你知道,我不知道,像现代爵士乐一样,在他做的时候喝着葡萄酒,你知道,与他的编码工具交谈。是的,但我认为他来自一个他拥有专业知识来查看代码的地方,而不是阅读每一行,而是获得代码的氛围。如果它看起来正确,它可能就正确了,然后提交并继续。

现在它的含义是,你不需要专业知识,你只需要感受一下,然后希望一切顺利。许多人实际上非常成功。这就是 Bold 和 Lovable 如此成功的原因。但我认为他们也会遇到麻烦,并且不知道如何摆脱困境。这方面会有很多资金浪费。也许其中一些浪费是可以接受的,因为当它有效时,它的效率非常高。

但我认为我在这里试图增强的是最佳实践是什么?当你进行氛围编码时,你如何保持正轨而不偏离轨道?是的,我认为氛围编码的爆炸式增长,因为它显然触动了人们的神经,就扩展力量而言,谁可以创造什么。

随之而来的是这整套新的挑战和问题,需要逐一解决。而且,你知道,就像,我,我经常考虑这种,你知道,它对企业的可及性如何?也许这不仅仅是氛围编码,你知道,使用文本到代码工具,而是这整套新的

某种代理的,你知道,或代理启用的编码环境,你知道,它们很奇怪,或者也许,你知道,你不会期望大型公司内部对很多事情产生抵制。我认为,这方面不正当的部分通常是

只是不想看到事情发生变化的愿望,你知道,就像那些喜欢他们在大型公司中移动速度的工程师一样,并不一定想强迫,强迫,嗯,一夜之间增加五倍。嗯,但更合理的批评是,很多这些东西都没有,没有针对,你知道,拥有数千个不同贡献者的庞大遗留代码库进行优化。而且,你知道,今天编写代码的人明天可能就不在了。但是,但是,它也感觉像那些,呃,

与这种不同方法相关的每一个新挑战,似乎每天都有两家新公司出现来解决这个特定挑战。这就像针对这些新问题的打地鼠游戏。你认为,我想作为一个快速的预览,你希望用那个氛围编码专题讨论带来什么?只是真正了解这些挑战是什么以及如何解决它们?你对此有特别的看法。是的。

它比这更实验性。我可能只想对人们进行讨论的对话进行采样。所以我想现场演示一个优秀的氛围编码器是如何进行氛围编码的。也许是因为人们可以从中学习。我想对氛围编码进行负面评价。比如为什么你不应该进行氛围编码,或者为什么氛围编码注定要失败,等等。我想听听一位正在构建

氛围编码平台的人的演讲,可能是 Bolt,因为我更接近 Bolt 的 Eric。我想对这个领域进行采样,并让人们进行探索,因为我自己并不真正知道我对它的看法。我所知道的是,我非常赞成人们拥有更多自主权和权力来创建软件并……

我有很多设计师和 PM 告诉我,仅仅是因为这些编码工具,他们能够在没有工程团队的许可或优先级的情况下做他们想做的事情。这对他们来说太棒了。这对他们的客户来说也很好。所以这里有一些东西。老实说,我不知道氛围编码是否是最好的名字,但这是人们现在拥有的东西。所以我必须这么称呼它。

是的,这非常有趣。所以这太棒了。我喜欢和你谈论这些事情。也许作为结束语,当你考虑我们进行的许多对话时。

是关于领导者如何思考 AI 和代理转型遍及他们的整个公司。而且,你知道,正如我暗示的那样,一个有趣的张力是,感觉在企业之外,

围绕编码和工程的许多用例都是产品市场匹配度最高的地方,或者至少非常清楚的是,最大的变化正在发生。然而,当涉及到,你知道,在大型公司工作的工程师时,这往往是一个更顽固的领域。如果你,

如果你是一个,你知道,某种一般的领导者,对吧,一家公司的首席执行官,他正在努力思考如何帮助支持、鼓励、要求他们的工程组织开始根据这些变化而发展。你会如何考虑这个问题?或者,你知道,你会让他们从哪里开始关注或深入研究?

是的。这就是为什么我们有一个领导力专题讨论。我们将领导力日重新命名为 AI 架构师,因为 Brett Taylor 称他们为 AI 架构师。是的。所以很奇怪,对吧?因为一方面,工程师们一直在抛出所有这些术语和行话。另一方面,我觉得领导者们只需要埋头苦干,注意他们的工程师没有做的事情,比如合规性、安全性和法律方面的一切。

你知道,所有那些人们不想要的东西。然后,但是有一件元事情,他们必须参与其中,那就是定义战略和招聘。

所以这是他们真正需要与工程师和其他要素保持高度同步的两件事,而其他方面他们可以对工程师进行某种程度的指导。那么这样有意义吗?还有什么你想详细讨论的吗?不,我知道这完全有意义。是的。所以有一个关于定义战略的环节。我基本上在每次会议上都会进行招聘演讲。

我认为就目前而言,它与软件工程非常接近,因为你 90% 是软件工程师,然后像 10% 的面试循环或要求或其他什么会看到你对 AI 的要求。但我认为这会随着时间的推移而分开。一旦你开始

构建所有这些学科,包括工具调用、规划、控制流、权限等等,这就开始成为它自己的学科,这就是我认为这个 AI 工程师职位描述的原因,你知道,我们仍在探索它。我们仍在构建,你知道,三年过去了,这,这,对我来说很令人兴奋,因为我可以帮助定义它。而且我还,你知道,遇到了该领域的所有重要人物,但是,它,它,

对于所有事情来说,它都是一个模糊的概念。界限绝对模糊。

不,太棒了。好吧,我很兴奋。我,你知道,我使用这些活动作为我应该关注什么的基准。我也鼓励其他人这样做。感谢你再次来到节目,期待我们下次见面。是的。感谢你的支持,伙计。如果你能来,就来吧。是的。它在 6 月 3 日至 5 日在 NSF 举行,我们,我的意思是,我们正在把它变成一年一度的事情。所以我们已经在计划 2026 年了。它将在户外举行,这很有趣。所以,

旧金山夏天的景色很美。是的,我喜欢。好的。谢谢,肖恩。谢谢。