We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Now Anyone Can Code: How AI Agents Can Build Your Whole App

Now Anyone Can Code: How AI Agents Can Build Your Whole App

2024/10/18
logo of podcast Lightcone Podcast

Lightcone Podcast

AI Deep Dive AI Insights AI Chapters Transcript
People
A
Amjad Masad
F
Francesc Campoy
G
Gary
无足够信息创建详细个人资料。
Topics
Gary: AI 驱动的软件开发平台 Replit Agent 降低了软件开发的门槛,让更多人能够参与到软件开发中,即使没有编程经验也能在短时间内构建复杂的应用。 Amjad Masad: Replit Agent 通过简单的自然语言提示,即可自动生成代码并构建完整的 Web 应用,包括前端、后端和数据库等,极大地简化了软件开发流程。Replit Agent 使用多 Agent 系统,结合多种模型(包括 Claude Sonnet 3.5 和 GPT-4O)以及自主研发的嵌入模型和检索系统,能够高效地生成和编辑代码,并克服了传统 RAG 系统的局限性。Replit Agent 的编码方式类似于人类程序员,会犯错并进行调试,用户可以参与其中并进行代码修改。学习编程仍然非常重要,它能够赋予开发者更大的能力和控制力,学习编程的回报随着 AI 技术的发展而不断提升,掌握一定的编程技能将越来越有价值。Replit Agent 未来将支持更多代码库和技术栈,并提升自主性,支持后台运行和团队协作,并集成人工专家协助功能。 Mark Mandel: Replit Agent 可以显著缩短软件开发时间,节省大量人力成本,Replit Agent 体现了 AGI 的潜力,能够根据用户的需求自主设计和构建应用,并具备一定的推理和学习能力。 Yiu-Jing Li: Replit Agent 可以自动处理软件开发中繁琐的依赖安装和配置工作,极大地提高了开发效率。 Francesc Campoy: Replit Agent 不仅能够根据用户需求生成代码,还能够像开发伙伴一样与用户互动,提出问题并根据用户的反馈进行调整,Replit Agent 可以帮助无代码用户逐步学习编程,提升开发能力,Replit Agent 的组织架构采用了任务小组模式,不同团队协同工作,提高了开发效率。

Deep Dive

Key Insights

What is Repl.it Agent and how does it change the software development landscape?

Repl.it Agent is an AI-powered platform that allows users to generate and deploy functional custom software through simple prompts. It democratizes coding by enabling anyone, regardless of technical expertise, to build apps quickly. This shifts the landscape from requiring extensive coding knowledge to leveraging AI agents for rapid development, making software creation accessible to a broader audience.

What was the first app built during the live demo of Repl.it Agent?

The first app built during the live demo was a personal mood tracker. It logged the user's morning mood, coffee and alcohol consumption, and exercise habits. The app was created using Flask, Vanilla.js, and Postgres, and it included features like visualization and reminders.

What models and technologies power Repl.it Agent?

Repl.it Agent uses a multi-agent system powered by models like Claude Sonnet 3.5 for CodeGen and GPT-4O for specific tasks. It also incorporates in-house models for embeddings, retrieval systems, and indexing. The platform leverages tools like Lankchain for agent DAGs and Lanksmith for debugging traces, ensuring efficient code generation and editing.

How does Repl.it Agent handle debugging and testing?

Repl.it Agent includes a language server that provides real-time feedback on coding errors, similar to human coding. It also performs automated testing, such as taking screenshots and using computer vision to verify app functionality. Users can manually test and debug the code, making it a collaborative process between the AI and the user.

What are some examples of apps built using Repl.it Agent?

Users have built a variety of apps, including a personal memory map app that attaches files and audio to locations, a Stripe coupon tool for course creators, and a Hacker News clone. These apps were created in minutes, showcasing the platform's ability to quickly turn ideas into functional software.

What is the future vision for Repl.it Agent?

The future of Repl.it Agent includes improving reliability, expanding support for any tech stack, and adding more interactive features like drawing and voice commands. The platform also aims to introduce single-step agents for advanced users, allowing them to preview and approve changes before implementation.

How does Repl.it Agent compare to no-code tools?

Repl.it Agent offers more flexibility than no-code tools by generating actual code, which users can edit and customize. While no-code tools often hit limits in functionality, Repl.it Agent allows users to push beyond those constraints, making it a more powerful solution for complex projects.

What organizational changes did Replit undergo to develop Repl.it Agent?

Replit formed an agent task force, bringing together teams from IDE, DevX, UX, and AI to collaborate on the project. The organization flattened its structure, focusing on rapid progress through weekly meetings where priorities were set and issues were addressed. This approach allowed for quick iterations and significant advancements in the agent's development.

Chapters
The episode starts by comparing the impact of personal computing in 1984 to the potential of personal software in 2024, facilitated by AI agents. A live demo showcases Replit Agent building a mood tracking app from a simple prompt, highlighting its ability to generate code, manage dependencies, and even suggest features. The discussion then delves into the technical aspects of the agent, including its multi-agent system, model choices (Claude Sonnet 3.5, GPT-4O), and the crucial role of the retrieval system.
  • Comparison of 1984's personal computing revolution to 2024's personal software era
  • Live demo of Replit Agent building a functional web app from a simple prompt
  • Replit Agent's multi-agent system, utilizing Claude Sonnet 3.5 and GPT-4O
  • Importance of the retrieval system in editing and code generation

Shownotes Transcript

1984年,Mac电脑将个人计算带给了大众。

2024年,我们拥有了个人软件。你实际上能够指挥这支庞大的智能体大军,我想到了米老鼠和《幻想曲》,就像学习一种新的魔法能力一样,突然间所有的扫帚都开始行走、说话和跳舞,这是一种令人难以置信的景象,能够随时随地构建任何你想要的东西。有人有一个想法已经15年了,但是没有

工具来构建它,却能够在15分钟内构建它。他录下了自己的反应。我差点为此落泪。欢迎回到《光锥》的另一期节目。我是加里。这是贾里德、哈吉和戴安娜。我们共同资助了价值数千亿美元的公司,就在一开始,只有几个人有一个想法。而今天,我们有……

我们最好的校友之一来展示他刚刚推出的Repl.it Agent。阿姆贾德,非常感谢你今天加入我们。我很荣幸。谢谢你们的邀请。是的,我们刚刚发布了这款产品。它处于早期访问阶段,这意味着它几乎还是测试版软件。

但人们对此非常兴奋。它有时有效。所以有很多bug,但我们将在这里进行现场演示。我想构建一个应用程序,一个可以跟踪我的早晨情绪与我前一天所做的事情相关的个人应用程序。所以我想开发一个应用程序来记录我早晨的情绪,以及诸如

我前一天所做的事情,例如我上次喝咖啡的时间,或者我是否喝酒,以及我那天是否锻炼。

现在把它发送给智能体。你有一个聊天界面。所以你可以看到智能体刚刚读取了消息,它现在正在思考。马克·曼德尔:我们在这里看到的实际上是如何与另一个用户聊天?还是专门针对——弗朗切斯科·坎波伊:是的,我的意思是,它很相似。它与Repl.it上的多人游戏体验非常相似。马克·曼德尔:明白了。

所以这里说我为你创建了一个计划来记录你每天的情绪。该应用程序将显示你的情绪、咖啡、酒精摄入量和锻炼情况。它还建议其他功能。例如,它建议可视化,这听起来不错。提醒,我不知道,我会记住的。所以我们只选择这两个步骤。

尤金·李:我认为也很酷的是,它选择了非常容易上手的技术栈。Flask、Vanilla.js、Postgres,非常好。马克·曼德尔:现在我们看到的是我们所说的进度面板。进度面板是——你可以看到AI正在做什么。现在它正在安装包。它实际上编写了很多代码。看起来它构建了一个数据库连接等等。它现在正在安装包。我们很快就能看到结果。尤金·李:这真的很酷,因为我认为很多时候

对于新的软件工程师来说,令人烦恼的部分之一就是获取所有包和依赖项以及选择正确的东西。而这个智能体为你完成了这一切。所以这里有我们的情绪应用程序。我可以说我今天感觉很好。我昨天喝了咖啡,但我没有锻炼。我记录了我的情绪,然后查看历史记录,

所以它只是一个提示就完成了一个完整的web应用程序,没有你的进一步指示。是的。它有一个后端。它有Postgres。我可以部署它。所以这已经非常有用了。你有这个评分,你有历史记录。它问我是否做对了。它实际上要求你为他们测试它。

是的,它实际上自己进行了一些测试。所以它在这里截了一个屏。所以它知道至少有一些东西被呈现出来了,但它希望有人实际进去做一些质量保证。它是否使用计算机视觉来查看屏幕截图?是的。好的。是的。现在所有的模型都是多模态的,所以它相当简单。现在后端是什么?

我们实际上有几个模型,因为它是一个多智能体系统,我们发现不同的模型适用于不同类型的智能体。主要的CodeGen模型是Claude Sonnet 3.5,它在CodeGen方面是无与伦比的。它是最好的。但在某些情况下,我们使用GPT-4O。还有一些增强的

内部模型,例如我们构建的嵌入模型。这是一个超快的二进制嵌入模型。检索系统和索引,这些都是内部构建的。而使这项工作发挥作用的一个重要部分是检索系统。

因为弄清楚要编辑什么,事实证明,这是使这些智能体发挥作用的最重要的事情。你不仅仅是超越了RAG,因为RAG达到了这个的极限。你基本上必须找到一种新的方法来搜索并找到代码中需要编辑的正确位置。是的。这实际上是我认为还没有发生的事情,但我认为……

对于所有这些多智能体系统来说,人们将从RAG转向构建像这样的自定义编排。

所以这是非常值得注意的。这是你发现的一件非常酷的事情。马克·曼德尔:是的,仅仅将代码库放入RAG是行不通的。你实际上有几种不同的表示方法,可以让智能体更好地工作。马克·曼德尔:没错。我们现在正在使用趋势功能。马克·曼德尔:哦。不错。马克·曼德尔:所以我们有一些图表。我们这里没有很多条目。我可以要求它创建数据。马克·曼德尔:哦,真的吗?你也可以让它创建数据?马克·曼德尔:是的。现在它要求我部署,因为它完成了。它就像,它不会部署。

在这里,我们有活动趋势,比如我每天都在做什么?马克·曼德尔:就是这样。它直接从一个想法变成了一个部署的web应用程序,世界上任何人都可以访问它。弗朗切斯科·坎波伊:没错。而我真正兴奋的事情之一是个人软件的概念。1984年,Mac电脑将个人计算带给了大众。2024年——

我们拥有个人软件。我认为我们刚刚体验到了这一点。你知道,Karpathy刚刚在推特上谈到了Repl.it Agent。他说,这是一种感受AGI的时刻。你刚刚感受到了AGI吗?我肯定感受到了。我昨晚也感受到了。昨晚我花了几小时使用Repl.it Agent制作了一个Hacker News克隆。不错。有一些时刻,我确实感受到了AGI。是的。

首先,它实际上对你要制作什么以及如何设计它有非常好的直觉。就像我们看到的那样,你并没有给它制作滑块的想法,就像表情符号一样。它自己想出了这一点。然后第二件事是它。

当我使用它时,感觉我有一个开发伙伴,他会问我问题。他会让我改变一些东西。有一次它卡住了。它不确定如何做某事。所以它问我如何做这件事。然后我告诉它,然后它说,酷,明白了。然后继续进行。是的。

是的,感觉很棒。有时你想给它一些帮助,对吧?如果你知道如何自己调试,你想去调试,或者你去问ChatGPT一些事情然后回到它这里。只需提供更多信息。你将能够对它做出反应。这确实感觉像是在与开发人员交谈。你应该做……

Gronk的事情并使用不同的模式。你可以使用图G编程,它只会告诉你想法不好,它无论如何都想构建其他东西。哦,那将很酷。就像有一个切换开关,例如,像一个过度工程师。是的。就像过度设计一切一样。没错。所以它添加了这个切换开关,但我认为它不起作用。我认为它没有连接到x轴。是的。我认为关于所有这些AI程序员的有趣之处在于,它不像

我们创造了一些超级智能,它能够在没有任何错误的情况下从头到尾完美地构建一个完整的应用程序。它实际上像人类一样编写代码,就像它编写一些代码一样,就像,“嗯,我认为这是正确的,但我并不确定。我想我会试试。”然后它尝试,“哦,不,我有一个bug。”它就像,它是一样的。是的。是的。而且,同样,我们的设计决策一直是,这是一个同事,你可以关闭它,你可以查看代码。

你可以自己编写代码。自己修复它。自己修复它。同样,如果你不知道如何编写代码,我希望当你阅读智能体正在做什么时,你已经学习了一些编码知识。顺便说一句,我认为我们这一代人就是这样学习编码的,不是通过智能体,而是通过做这些渐进的小事情,比如编辑你的MySpace页面或做GeoCities……

的事情,我觉得我们有点失去了

渐进式学习的规模,现在你需要获得计算机科学学位或参加编码训练营才能弄清楚这一点。但是如果我们制作了这个有趣的东西,人们可以在其中构建副项目并接触到代码是什么,我认为这将是完美的。同样,我的观点是,我们距离完全自动化的软件工程智能体还有很长的路要走,人们仍然应该学习如何编写代码。你必须编写更少的代码

但你必须阅读代码。在某些情况下,你必须调试它。智能体将带你走得很远,但有时它会卡住,你需要进入代码并弄清楚。是的,我认为这实际上非常重要。我一直在会见很多18、19岁的大学生

他们说,“好吧,代码会自己编写,对吧?我不必再学习这些东西了。”我说,“不,那完全不是真的。我认为现在知道如何编写代码实际上更有优势了,比以往任何时候都更重要。它实际上会让你更强大。你不需要在所有事情上都深入研究。你实际上能够指挥这支庞大的

智能体大军。我想到了米老鼠和《幻想曲》,就像,你知道的,学习一种新的魔法能力一样。你知道的,突然间所有的扫帚都开始行走、说话和跳舞。这是一种令人难以置信的景象,能够随时随地构建任何你想要的东西,就像,从任何电脑,从任何web浏览器。是的。我试图提出一个摩尔定律类型的东西,就像,

学习代码的回报每六个月翻一番或类似的东西。所以在2020年学习一点代码并没有那么有用,因为你仍然会被阻塞。你不知道如何部署某些东西。你不知道如何配置某些东西。让我们看看2023年的ChatGPT。学习一点代码。我们将带你走得很远,因为ChatGPT可以帮助你。

然后是2024年,学习一点代码是一个巨大的优势,因为我们有像这样的智能体和其他智能体。有很多非常酷的工具,比如Cursor和其他工具,它们只需一点编码就能让你走得很远,并将它向前扩展。六个月后,你将拥有更强大的力量。

所以程序员正处于这种力量不断增长的巨大轨迹上。告诉我们更多关于这项技术背后的信息。这有点迷人。它的核心是,正如我之前描述的那样,它是一个多智能体系统。你有一个核心类似React的循环。所以React是一个智能体链式思维类型的系统。

提示已经存在了几年了。大多数智能体都是基于此构建的。但我们的也是一个多智能体系统。我们使用工具调用为它提供了大量的工具。这些工具与向人们公开的工具相同。顺便说一句,你需要非常小心如何公开这些工具以及如何

智能体是否能看到它们?例如,我们的编辑工具会返回来自语言服务器的错误。所以我们这里有一个语言服务器,一个Python语言服务器。如果我犯了一个错误,就像一个人在编码一样。

在这里的任何地方,它都会向我显示。同样,当智能体在编码时,它会从语言服务器获得反馈。所以同样,你想尽可能地把它当作一个真正的用户来对待。因此,对于任何操作,它都会获得反馈,然后它可以对该反馈做出反应。所以这些是工具。同样,这是包管理、编辑、部署、数据库。所有这些都是工具。

然后还有很多事情可以确保它不会完全偏离轨道,因为这很容易。我们都使用过偏离轨道并进入无限循环的智能体。它有时仍然会这样做,但我们还有一个循环正在进行反思,它一直在思考,

我做对了吗?我们使用了大量的Lankchain工具。所以LankGraph是Lankchain的一个有趣的新工具,它允许你很好地构建智能体DAG。它们有一些日志记录机制和一个名为Lanksmith的工具,你可以查看跟踪信息。

查看DAG的跟踪信息非常非常困难和复杂。所以调试这些东西相当困难。因为你需要一个工具来实际可视化该图。现在没有很多工具可以做到这一点。所以有这个反射工具,反射智能体,

我们之前讨论的另一件事是检索至关重要。同样,这必须是神经符号的。它必须能够进行RAG风格的嵌入检索,但它必须能够查找代码中的函数和符号。

这就是为什么我认为我可能会推断得更多,即使我们进入具有非常非常大的上下文窗口的基础模型的世界。我的意思是,Gemini已经达到了数百万个token。你仍然需要非常专业的东西来进行这样的查找,因为应用于不同的上下文,

了解函数并将其更像最终编译的方式,例如AST图。大型上下文窗口,你完全可以用它们来搬起石头砸自己的脚。是的。因为模型很容易,实际上,你知道的,模型会更多地偏向于最后的内容。有点像人类。是的,没错。所以你仍然需要进行上下文管理。嗯,

你需要弄清楚如何对记忆进行排序。这个智能体每次执行一个步骤时,都会进入一个记忆库。然后每次我们进入下一步时,我们将能够选择正确的记忆并弄清楚如何将它们放在上下文中。例如,如果你选择了错误的记忆,如果你选择了包含bug或其中有错误的记忆,无论如何,

它可能仍然认为存在bug。但是如果你已经从中恢复过来,你想确保创建bug的记忆要么被修复它的另一个记忆增强,要么完全从上下文中删除。所以记忆管理在这里至关重要。你不想将所有记忆都放在上下文中。

你想要能够为正确的任务选择正确的记忆。我觉得这是一个对情境意识以及所有这些科幻小说,你知道的,AGI明天就会杀死我们这种论点的非常具体的反驳,仅仅是因为这一切都是基于更大的上下文窗口、更多参数,向它投入GPU,它就会起作用。你不能仅仅通过扩大规模来实现。

你不会仅仅通过扩大规模就能得到你想要的东西。在让这些智能体相互协作、真正聪明地了解中间表示并能够回退、模拟人类的行为方面,实际上有很多效用。我的意思是,这有点像……

案例研究,就像,“哦,是的,你不能仅仅将所有东西扩大50倍,就能让它按照他们认为的方式工作。”是的。在许多方面,构建这样的系统会让你谦卑,以不同的方式设定你对AI和AI进展的期望,因为是的,这些系统非常脆弱。它们真的仍然不擅长遵循指令。人们经常谈论幻觉问题,

我认为更大的问题是遵循命令。让他们真正做正确的事情太难了。你认为AGI的路径是什么?所以我对AGI的看法是,也许我们会得到一些我们可以称之为功能性AGI的东西,那就是……

我们自动化所有这些在经济上具有实用性的任务。我认为这是可以实现的。我认为这几乎是一个蛮力问题。这是一种痛苦的教训,对吧?你认为这是否涉及做很多像你们所做的事情,比如基本上构建……

像仔细微调每个任务的智能体组的编排一样。为编程做你们所做的事情,但为客户支持、销售、每个会计、每个功能做同样的事情。是的,我认为是这样。也许你最终可以将所有这些都放入一个模型中。机器学习的历史是,我们创建系统,我们

我们在这些模型周围发展这些系统,最终模型将吞噬这些系统。所以希望我们所做的一切在某个时候,有一天会有一个端到端的系统,一个可以做到这一点的机器学习系统。特斯拉,你知道的,著名的,你知道的,拥有所有这些逻辑等等。现在,你知道的,我认为在V13之后,他们,它只是端到端的训练。

所以最终我们会到达那里。但我不会认为这是真正的AGI,因为你向它扔出一些超出分布范围的东西,它将无法处理。我认为真正的AGI需要高效的学习。能够被扔到一个没有任何信息的環境中,能够

通过检查环境来理解环境并学习导航该环境所需的技能。而LLM并非如此。也许它们是其中的一部分,但它们根本不是高效的学习者。你实际上证明了这一点,因为你描述LLM的方式是直觉机器。为了让它们在编程任务中发挥作用,你必须添加一层

具有符号表示,例如在编程和AST中,编程和计算工作中的许多概念,例如图灵完备的DAG等等,对吧?是的,没错。这些都非常明确的经典计算机科学。经典AI,是的。我们进行回溯等等,是的。这不是通用的,这是专门的。我的意思是,非常有用的专业。是的。

所以它上线才四天。是的。但人们已经用它做了一堆非常有趣和令人印象深刻的事情。你想谈谈你看到人们用它做的一些最令人惊讶和有趣的事情吗?是的。我最喜欢的一件事是我看到有人有一个想法已经15年了,但没有工具来构建它,却能够在15分钟内构建它。他录下了自己的反应。这是一个个人应用程序。他构建了一个应用程序,他可以在……

在地图上放置记忆并将文件和音频文件附加到它上面。关于他生活的记忆。我在这里上学,然后添加一张图片,等等。当应用程序出现并且他测试它时,他就像,他非常惊讶。我差点为此落泪。我想,

能够释放人们的创造力是如此有益。然后我想与Apple Photos集成或使用它来实际构建导出工具。是的。另一个用户Mekke构建了一个Stripe优惠券工具。

所以他有一个课程,他在Stripe上运行它,他想能够向人们发送优惠券。所以他在5到10分钟内构建了它。实际上,我认为你无法在无代码环境中构建这样的东西。你会非常努力地挣扎。你可能会使用两三个无代码工具。人们在前端使用Bubble,在后端使用Zapier等等。有时我很惊讶无代码人员实际上非常

非常聪明而且非常努力,因为他们想出了如何使用无代码创建这些系统的方法。但这实际上更容易为它生成代码。它是无代码人员的编码工具。是的,是的。所以,是的,我们看到那里有很多吸引力。这实际上是一个挑战。我认为无代码工具通常面临的挑战是跨越这条界限,即

一开始非常无代码,然后他们发现人们不断突破他们想要在这些工具中构建的东西的限制。然后无代码工具令人沮丧的部分是,如果你达到了极限,你就被卡住了。你无法解决它。酷的是,正如你之前所说,如果你能让无代码人员切换到Replit,也许一开始他们根本不会编程。他们只知道如何提示它。但随后在某些时候他们会喜欢

查看代码,他们会意识到他们可以编辑它。这并不难。然后这就是他们逐渐成为程序员的方式。是的,这很有趣。我尝试使用它来构建一个简单的招聘CRM,这实际上是你将使用Airtable来做的事情。其中一个建议,当它告诉我计划时,其中一个,哦,你想要这个功能正是这样。它就像基于角色的权限等等。我想,哦,这就像一个复杂的事情

一开始的提示或建议。马克·曼德尔:是的,这是一个每月10,000美元的企业功能,你可以直接提示并让它工作。太疯狂了。我的意思是,这就像低门槛、高上限的定义。世界上所有最大的软件公司都非常有力地抓住了这个想法。

我最喜欢的是构建某些东西的这种多个数量级的时差。有人说他们花了18个月的时间来构建一个初创公司。他们能够在10分钟内使用Replit生成相同的应用程序。有人说他们花了一年的时间来构建某个应用程序,他们能够在一个小时内使用Replit Agent构建它。但是是的,我认为它会节省时间。

你知道的,数百万美元的人工小时。真是一个好时代,伙计们。我可以使用Replit Agent并将其应用于我现有的编码堆栈吗?还没有。明白了。所以同样,它还处于非常早期的阶段。我们构建了,同样,我们构建的检索系统是为了能够做到这一点。

我们应该能够将其放入任何代码库中,快速索引代码库,并能够为其提供关于代码库的智能。该系统还具有文件摘要和项目摘要。因此,当我们索引系统时,我们使用LLM来创建这些小的摘要,以便智能体了解项目是什么。所以我们有相应的基础设施。但这是下一步。

我们还想为想要的人添加更多自主性。因此,对于这个团队版本,我们希望能够将其发送到后台。能够给它一个提示,然后它分叉项目,尽可能自主地工作。然后完成后,它会向你发送一个拉取请求。或者如果它遇到问题,它会向你反馈问题。

我想做的另一件事是,你知道的,对这个的愿景是,你知道的,我们有这个赏金计划和赏金,人们提交他们想要构建的东西或他们遇到的问题,我们社区的用户会以一定的价格帮助他们解决问题。我在想,你知道的,智能体并不完美。所以也许智能体也可以召唤一个人。

所以它拥有的另一个工具是能够召唤赏金猎人。所以它会进入市场并询问与它合作的创建者,“嘿,我遇到问题了。你想为此投入一些资金吗?我们可以去抓一个专家。”

所以它就像,“是的,酷。是的,投入50美元,我们将进入这个市场,希望是一个实时市场。我们将说,50美元,我们有这个问题。你能来吗?”一位人类专家作为另一个多人游戏进入系统,要么通过提示智能体来帮助你,要么通过自己进入并编辑代码来帮助你。这太聪明了。我的意思是,让整个人成为你拥有的这个更大的智能编排系统中的另一个智能体。是的。我非常喜欢Licklider的……

人机共生。这始终是重点。我喜欢谈论AGI等等,但我只是觉得计算机通过成为我们的延伸以及与我们结合而变得根本上更好,而不是成为竞争对手。我完全同意你。人类团队。我们需要印制T恤。是的。

你今年早些时候有过一个,我想,有点像Chesky时刻。我们都被这个演示震惊了,而且,你知道的,你一直在努力重塑所有软件的部署和编写方式已经有一段时间了。我的意思是……

是什么让这一切成为可能?你确实进行了裁员并重组了你的组织。发生了什么?是的,去年我们进行了一轮大规模融资。我们感觉自己正在快速进步,而且充满活力。我觉得我需要,好吧,发展公司。很长一段时间,Jared 知道,很长一段时间,Replit 只占 10%。

很小。它实际上是从你的公寓里运营的?是的。持续了多少年?很多年,大概三四年。而且我们很多年只有四五个人。所以我们从 2021 年开始发展壮大。即使那时你已经有大量用户了?是的。就像你只有四五名员工时,就有数百万用户了?是的,没错。所以我们一直都很精简,但我去年想,好吧,我们有非常大的雄心壮志。我们必须招聘人员。我必须招聘高管。我必须建立管理架构。我必须成长起来

这是投资者告诉你的吗?就像,哦,你必须招聘人员。不,实际上是我自己犯傻了。但这绝对是普遍的建议。我的意思是,你从通常建议初创公司这样做的那种世界吸收了这些建议。没错。没错。这变得非常糟糕。

我们有很多,你知道,多个层级。我们开了很多不同的会议,我试图从中运营公司。我们有高管会议、员工会议等等。我们有路线图。我们有规划会议。我只是无法摆脱这种感觉,这一切都是角色扮演。这不是工作。这是角色扮演。但现在我们没有路线图。

现在,实际上,我们只处理三到四件事。我参与了所有这些事情,我知道那里发生了什么。我知道人们在做什么。我认为我们通过缩小规模、扁平化组织结构,效率提高了很多

我认为有一点,这是一个我认为我们从许多创始人那里听到的故事。我很好奇这将如何发展,我觉得实际上引发很多管理模式的原因是感觉人们有更多想法可以付诸实践,并且他们有资源去执行。你意识到官僚主义正在蔓延,你实际上无法像你想要的那样快速完成想法。所以我觉得每个人都在裁撤中层管理人员,就像

我很好奇同样的情况,同样的诱惑我认为还会再次发生。我认为我们个人思考的一点是,当你让从零到一变得容易时,它实际上有助于你产生更多好主意,因为你会想,哦,是的,实际上,我可以非常非常快速地启动事情。

所以接下来看看人们如何留下来会很有趣。现在你有了更小、更扁平的组织结构。你会得到更多关于你想做的事情的想法。然后保持自律,不要回到,哦,是的,我们实际上应该做我们可能做的十件事,而不是你可以记住的五到六件事,我认为这实际上是一个挑战。MARK MANDEL:我想这里有一个相互冲突的想法,因为有 Parker Conrad 的复合型初创公司。

但关于复合型初创公司有趣的一点是,我认为他们试图明确地让其他产品线感觉像一家初创公司,并像一家独立的初创公司一样进行管理,这有点像与部门责任相反。

我还认为,对于 Rippling 和 Parker 来说,他以这种招聘策略而闻名,他只雇佣或试图雇佣很多前创始人,然后让他们负责产品线,这显然对 Rippling 非常有效。我认为大多数人很难做到这一点,因为除非公司已经证明成功,或者你只是

顶级招聘人员。Parker 的招聘能力绝对属于顶级 0.1%。但 Parker 完全找到了远程办公的方法,因为他几年前在我们这样做的时候在 YC Growth 做了一个演讲

而且他还在处理支持工单。哦,是的。他告诉我们了。Harge 实际上几个月前接待了他,就在那里。他说过。他基本上说,他喜欢回复客户支持工单,他永远不会放弃,因为这是他了解客户真正情况的直接信息来源。是的。

是的,我的意思是,这完全是创始人的推动。我认为也许他正在做复合型初创公司。他给了他们很大的自主权,但他关注细节。这对这个 AI 代理来说是如何发展的?我们讨论了你是如何从技术上构建它的。你是如何从组织上构建它的?

这是一个很大的赌注。这是一种全新的技术,reflet 团队以前没有接触过。你是如何从组织上实现的呢?是的,好问题。我们过去多次尝试构建代理,但技术还不成熟。最后,当我们感觉技术成熟时,实际上是我们的一名员工 Zen Lee,他启动了这个新版本的代理,做了一个演示,他向我展示了这个演示。

它非常简单。它就像代理一样,调用几个工具并在 ID 中执行操作。但我可以看到它终于快来了。我几乎可以尝到它的味道了。在这种感觉下,就像,好吧,我们将进行这个大赌注。因此,它创建了一个名为代理工作组的东西。因此,在这个工作组中,来自许多不同团队的人员。所以你有 IDE 团队。

在 SaaS 工作组中的存在。你拥有负责包管理等工作的 DevX 团队。你拥有 UX 和设计组件,以及 AI 团队。所以你拥有以 AI 团队为中心。所以它几乎类似于 Carpathia 图表。所以我们以图表工作的方式来组织它。内核操作系统是 AI 团队,然后它们连接到由工具团队创建的所有这些工具。

然后在所有这些之上,你拥有产品而不是 UX 主题,它正在处理入口点以及你如何构建它,这也很难。设计很难。我们每周开两次会。在星期一,我们有这个论坛会议,我们的 AI 主管 Michele 将进行运行,我们将看到哪里坏了,哪里出了问题。他们将制定本周的优先事项。

然后在星期五,我们有代理沙龙,我进行运行,我查看哪些有效,哪些无效。我问他们他们的优先事项。我们可能会重新确定一些事情的优先级。我可能会更改产品中的一些内容。我们快速地进行重大更改。所以我们每周都取得了巨大的进展。运行是什么意思?

进行代理运行。实际上是真正地使用产品并查看它在哪里中断。查看它在哪里中断并确定修复其中断位置的优先级。太棒了。是的。每个团队基本上也构建了自己的代理吗?

其中一些团队确实如此,因为其中一些团队必须……屏幕截图工具是一个代理,因为你必须让 AI 查看屏幕截图,提出想法,然后将它们返回给主管理器代理。因此,ID 团队编写了屏幕截图代理,然后包管理团队构建了可能是技术栈设置类型的配置,这真的很酷。是的。

组织结构运作得非常好。我的意思是,出奇地好,因为我认为它类似于我们以用户为中心的方式工作。

现在用户是 AI。FRANCESC CAMPOY:代理接下来会有什么?你想添加什么?你认为它的下一个重大飞跃是什么?MARK MANDEL:可靠性。我认为现在最重要的事情是可靠性,确保它不会旋转,确保它不会中断,然后将其扩展到支持你想要的任何堆栈。所以现在,当用户给我们一个堆栈时,我们并没有真正倾听。我们拒绝。代理拒绝。它就像,啊,我只会用 Python 或其他什么来做。

但如果你真的想要……狡猾的工程师模式。所以我们希望能够接受用户关于堆栈的要求。你应该拥有 Paul Graham 模式,我只会用 Lisp 编写它。你知道这个模式的东西真的很像愚人节的东西。Paul Graham,过度设计。是的。

糟糕的 UI。不关心 UI。一切都是正确的,但非常令人困惑。那交互呢?我的意思是,你提到了 Licklider 和整个人机共生理论。就像,文本是否已经走到了尽头?你认为人们会想要与他们的 AI 代理交互的其他方式有哪些?你应该能够在……

以及 UI 上进行绘制,并通过绘制与 AI 进行通信,对吧?应该能够说,嘿,这个按钮不起作用,也许将这个移到这里或这个文件,你知道,重构这个文件,等等。所以,你知道,如果整个东西是一个你可以绘制的画布,你可以更富有表现力地与代理进行沟通。当然,你正在谈论,你知道,而不是打字,能够说话和绘画。想象一下你也在 iPad 上。我们有一个 iPad 应用程序。

它可能会变得非常非常有趣和有创意。有点像你在 Figma 中做的完整 UI 模型。你可以手绘它并让它去做。就像运营一个真正的工程产品团队的感觉一样。没错。然后我们将添加更简单的代理工具。所以现在,代理会接管并编写所有内容。但很多人只是想要更多代理。

更高级的用户。所以我们希望能够进行单步或单动作代理。例如,我想添加此功能,向我展示你将要做什么。我将进行试运行,向你展示所有差异,向你展示它将安装的所有包,然后你将能够接受或拒绝它。这样,你知道,更高级的用户将对他们编写的代码有更多控制权。

Amjad,非常感谢你来到这里,并以如此深刻的方式向我们展示未来。如果我想自己做这一切,我该怎么做?好吧,首先,我想说它仍然只是测试版软件。如果你很勇敢,并且想测试它并给我们反馈,请访问 Replit,注册我们的核心计划,因为这个东西很贵。我们不能免费提供它。你将能够在主页上看到那个模块,上面写着“你今天想构建什么?”

然后你可以完成它并开始使用代理。心中有一个想法。只写几句话。不要把它弄得太复杂或太技术化,然后开始吧。你很快就会了解如何使用代理。它应该非常直观。

并与我们分享你正在构建的内容。很高兴能够分享、转发人们使用代理构建的内容。太棒了。好吧,是时候感受 AGI 了。我们下周见。