Vibecoding -- 即对文本转代码工具说话,并用你的话进行编程——作为一个概念和一种追求,它已经爆炸式发展。NLW 分享了一篇关于这个想法如何超越仅仅是编码,而成为一种与 AI 交互的新方式的最新文章。https://www.oneusefulthing.org/p/speaking-things-into-existenceSPECIAL OFFER要获取你现成的代理,请访问 https://www.lindy.ai/,并在标题中包含“LINDY”一词,发送邮件至[email protected]。由以下机构提供:KPMG – 访问 www.kpmg.us/ai 了解更多关于 KPMG 如何帮助您利用我们的 AI 解决方案创造价值的信息。Vanta - 简化合规性 - https://vanta.com/nlw来自 Superintelligent 的代理准备情况审核 - 访问 https://besuper.ai/ 以请求您公司的代理准备情况评分。AI每日简报帮助您了解 AI 中最重要的新闻和讨论。在您收听的任何地方订阅 AI 每日简报的播客版本:https://pod.link/1680633614订阅时事通讯:https://aidailybrief.beehiiv.com/加入我们的 Discord:https://bit.ly/aibreakdown </context> <raw_text>0 今天在 AI 每日简报中,这是一个氛围编码的世界,我们都生活在这个世界中。AI 每日简报是一个关于 AI 中最重要的新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的 Discord 链接。
今天是周末,这意味着,当然,我们将进行一篇长篇阅读。今天我们将讨论氛围编码,实际上是所有关于氛围的东西。为了给您一些背景和上下文,因为这是您在这个节目以及其他地方听到的越来越多的一种说法,让我们回到这个术语的起源,令人难以置信的是,这实际上仅仅是大约 40 天前的事。
2 月 2 日,当然也是 OpenAI 创始团队成员的 Andrej Karpathy 在 X 上发布了一条消息,说有一种新型的编码方式,我称之为氛围编码,你完全沉浸在氛围中,拥抱指数级增长,并忘记代码的存在。这是可能的,因为大型语言模型(例如带有 Sonnet 的 Cursor Composer)越来越优秀了。此外,我刚刚用 Super Whisper 与 Composer 交谈过,所以我几乎没有碰过键盘。我
我要求做一些很蠢的事情,比如将侧边栏的填充减少一半,因为我太懒得去找它了。我总是接受所有内容,我不再阅读差异了。当我收到错误消息时,我只是将它们复制粘贴进去,没有任何注释,通常情况下,这样就能解决问题。代码超出了我通常的理解范围。我必须认真阅读一段时间才能理解它。有时大型语言模型无法修复错误,所以我只是绕过它,或者要求进行随机更改,直到它消失为止。对于一次性的周末项目来说,这还不错,但仍然很有趣。我正在构建一个项目或网络应用程序。
但这并不是真正的编码。我只是看到一些东西,说出一些东西,运行一些东西,然后复制粘贴一些东西,它大部分都能工作。需要明确的是,现在很多人都在进行氛围编码,这不仅仅是 Andrej。正如他指出的那样,部分原因是新工具(如 Bolt)的可用性,Bolt 在短短几个月内就拥有了 2000 万用户。然后是 Lovable,它的增长曲线如此陡峭,我现在必须向下滚动才能向您展示它是什么样子。
创始人 Antoine Osico 本周早些时候写道,Lovable 的增长上周增加了近 50%,现在每天新增 1500 个客户。
2 月 18 日,AI 创建者 Riley Brown 展示了术语“提示工程”和“氛围编码”之间的 Google 搜索比较,并表示他将在一年后再次检查。很明显,Riley 的论点是,一年后氛围编码将比提示工程更多。这是一个相当大胆的主张,考虑到提示工程已经进入词汇库的程度。3 月 11 日,他回来指出,这仅仅用了三周时间,氛围编码正在爆炸式增长,实际上即将超越提示工程,成为 Google 搜索兴趣的焦点。
这就是本周长篇阅读的背景介绍,它再次来自 Ethan Mollick 教授的 One Useful Thing 博客。这篇文章在本周早些时候发表,标题为《将事物化为现实:在充满氛围的工作世界中的专业知识》。我将阅读其中的许多摘录,而今天因为我在视频中,实际上是我来阅读它们,然后我们将进行一些对话。Mollick 教授首先回顾了 Karpathy 创造“氛围编码”一词的情况,但随后说道:“我认为这种方法的影响远远超出了编码的范围,但我希望首先自己进行一些氛围编码。”
从那里,他指出,根据您使用的界面,仍然可能存在一些棘手的问题。他写道:“我决定尝试使用 Anthropic 的新型 Cloud Code 代理,它使 Cloud Sonnet 3.7 大型语言模型能够操作您计算机上的文件并使用互联网。实际上,我甚至在使用 Cloud Code 之前就需要 AI 的帮助。我只会使用几种非常具体的编程语言进行编码,并且完全没有使用 Linux 机器方面的经验。然而,Cloud Code 只能在 Linux 上运行。幸运的是,Cloud 告诉我如何处理我的问题,因此在进行了一些氛围故障排除后,我就可以使用 Cloud Code 了。”
我输入 Cloud Code 的第一件事是“制作一个 3D 游戏,我可以在其中放置各种设计的建筑物,然后驾驶我创建的城镇”。大约四分钟后,我得到一个可运行的应用程序,而无需我进一步输入。Ethan 分享了一个生成的视频。他继续说道:“它很漂亮,但有点无聊,所以我写道:‘嗯,这一切都太无聊了。此外,有时较大的建筑物无法正确放置。也许我控制一辆消防车,我需要扑灭建筑物中的火灾?我们可以添加交通工具之类的东西。’”
几分钟后,他写道:“它将我的汽车变成了消防车,增加了交通工具,并使房屋着火。现在我们开始进入正轨了。但仍然有一些东西需要修复。我给了 Claude 反馈。看起来好多了,但消防车在移动时外观会发生变化。车轮突然出现,交通工具没有任何问题,也没有任何挑战。此外,火势不会蔓延,一切看起来都像是 20 世纪 80 年代的样子。让这一切变得更好。”在看到结果后,我将其作为一系列三个问题发出了第四个也是最后一个命令。
“我可以重置棋盘吗?你能让建筑物看起来更真实吗?你能添加一架竞争对手的直升机,试图在我之前扑灭火灾吗?”Andy 指着视频说:“这是一个可运行的,虽然有点粗糙的游戏,但它包括全天候循环、光线反射、任务和一台电脑控制的竞争对手。所有这些都是使用最热门的编程语言——英语——创建的。”现在,Mollick 教授说,他在故事中遗漏的一件事是,在第三个和第四个提示之间,出现了一些问题,而他不知道如何解决。
它需要与 AI 本身进行大量的来回互动才能弄清楚如何解决它。这确实增加了他的 API 费用。Ethan 写道,他继续说道:
“在用文字创造事物的世界中,专业知识显然仍然很重要。毕竟,你必须知道你想创造什么,能够判断结果是好是坏,并给出适当的反馈。但是应用专业知识并不一定需要大量的工作。例如,”他说,“我最近使用 Manus 的经验,Manus 是中国推出的一种新型 AI 代理。它基本上使用 Claude,但允许 AI 访问各种工具,包括进行网络研究、编码、创建文档和网站等等的能力。”
“这是我见过的功能最强大的通用代理,但与其他通用代理一样,它仍然会犯错误。尽管如此,它仍然可以完成一些令人印象深刻的事情。”然后,他分享了一个例子,说明当他要求 Manus“创建关于电梯推销的互动课程,并使用最好的学术建议”时,Manus 生成了什么。他写道:“你可以看到系统设置了一个任务清单,然后逐一完成这些任务,在构建页面之前进行网络研究。”
“作为一名创业学教师,我认为它生成的输出在表面上令人印象深刻。这是一个涵盖了推销基础知识的完整课程,没有明显的错误。然而,我也可以立即看出它过于冗长,并且没有提供知识检查或互动练习的机会。我给了 AI 第二个提示:‘将互动体验直接添加到课程材料中,并添加指向高质量视频的链接。’即使这是最基本的反馈,也足以大大改进课程。”
“如果我要部署这个课程,我会进一步推动 AI 并更多地策划结果。但看到只需一点指导就能取得多大的成就,这令人印象深刻。但也有其他氛围工作模式。虽然课程创建展示了 AI 处理轻松、结构化的创造性工作的能力,而只需最少的指导,但研究则代表着一个更复杂的挑战,需要更深入地整合专业知识。所有这些都导致了 Ethan 的下一部分内容:氛围工作。今天的节目由 Vanta 提供赞助。信任不仅仅是赢得的,更是被要求的。”
“无论您是正在应对第一次审核的初创公司创始人,还是经验丰富的安全专业人员正在扩展您的 GRC 计划,证明您对安全的承诺从未像现在这样重要或复杂。这就是 Vanta 的用武之地。企业使用 Vanta 通过自动化合规需求来建立信任,这些需求涵盖 35 多个框架,例如 SOC 2 和 ISO 27001。集中的安全工作流程可以将问卷调查完成速度提高 5 倍,并主动管理供应商风险。”
“Vanta 可以帮助您启动或扩展您的安全计划,通过将您与审核员和专家联系起来,快速进行审核并设置您的安全计划。此外,由于平台中使用了自动化和 AI,Vanta 可以为您节省时间,让您可以专注于发展您的公司。加入超过 9000 家全球公司,例如 Atlassian、Quora 和 Factory,他们使用 Vanta 来管理风险并实时证明安全性。”
“现在正在发生一场巨大的转变,从使用 AI 来帮助您完成工作,
到部署 AI 代理来为您完成工作。当然,在这种转变中,存在大量复杂性。首先,在这些看似数千个代理中,哪些实际上已经准备好投入使用?哪些可以做到他们承诺的事情?除此之外,哪些代理实际上适合我的工作流程?哪些可以与我们目前开展业务的方式集成?这些是超级智能代理准备情况审核的核心问题。”
“我们构建了一个可以扩展到整个团队的语音代理,它可以映射您的流程,更好地了解您的业务,找出您目前在 AI 和代理方面的现状,以便提供真正适合您和您公司的建议。”
“我们专有的代理咨询引擎和代理能力知识库将为您提供行动计划、建议和具体的后续措施,帮助您迈出进入新型代理员工世界的新一步。要了解有关 Super 的代理准备情况审核的更多信息,请发送电子邮件至 [email protected],或者直接给我发送电子邮件,[email protected],让我们为您设置我们有生之年最具颠覆性的技术。”
“他写道:‘在专业知识的前沿,AI 的使用变得最有趣。不幸的是,对于所有撰写此类工作的人来说,它们也是最难解释的用例。’”
“我有一组关于众筹工作的大型匿名数据集,这些数据是我近十年前收集的,但从未有机会用于任何研究目的。这些数据非常复杂,包括一个巨大的 Excel 文件、一个解释 Excel 文件各个部分含义的代码本以及一个详细说明 Excel 文件中每个条目的数据字典。处理这些数据需要频繁地交叉引用这些文件,如果您长时间没有处理这些数据,则尤其繁琐。”
“我很好奇,在 AI 的帮助下,我能够在使用这些旧数据撰写一篇新的研究论文方面取得多大的进展。我首先从 OpenAI 获取了一份关于组织如何影响众筹的最新文献的深度研究报告。我能够根据我的知识检查报告。我知道它不会包含所有最新的文章,因为深度研究无法访问付费学术内容,但它的结论是可靠的,在考虑哪些主题值得探索时,对 AI 很有用。”
“因此,我将报告和三个文件粘贴到我的大学提供的 ChatGPT 安全版本中,并与多个模型一起生成假设。AI 建议了多个潜在的方向,但我需要根据哪些方向实际上会对该领域做出有意义的贡献来过滤它们。这是一个需要多年相关研究经验的判断性决定。然后,我与模型来回工作以检验假设并确认我们的发现是正确的。AI 处理了数据分析的复杂性并提出了许多建议,但是
虽然我提供了关于下一步该做什么的总体指导和方向。在几个点上,AI 提出了统计上有效的方案,而我根据我的数据知识知道这些方案是不合适的。我们一起完成了假设检验,得出了相当可靠的发现。然后,我将所有之前的输出提供给 O1Pro,并要求它撰写一篇论文,在此过程中提供了一些建议。它远非一部巨著,但它将对知识现状做出可靠的贡献。更有趣的是,它只花了不到一个小时就创建出来了,而相比之下,思考、计划、写作、编码和迭代则需要数周时间。”
“即使我必须花一个小时来检查工作,它仍然会节省大量时间。我从未编写过一行代码,但这仅仅是因为我足够了解如何检查结果并确认一切都有意义。我用简单的英语工作,节省了数十个小时的工作,如果没有 AI,我根本无法以如此快的速度完成这些工作。但在许多地方,AI 还没有解决问题的本能。AI 远不能独自工作。人类仍然在氛围工作的世界中提供氛围和工作。这导致了他的结论:工作正在发生变化。”
“他写道:‘工作正在发生变化,我们才刚刚开始理解这一点。从这些实验中可以清楚地看出,人类专业知识和 AI 能力之间的关系并非一成不变。有时我发现自己扮演创意总监的角色,有时扮演故障排除者的角色,而有时则扮演验证结果的领域专家的角色。正是我的复杂专业知识(或缺乏专业知识)决定了输出的质量。’”
“当前的时刻感觉像是过渡时期。这些工具还不够可靠,无法完全自主地工作,但它们已经足够强大,可以极大地增强我们的成就。为我的游戏进行的 8 美元的调试会话提醒我,AI 能力的差距仍然很重要,而了解这些差距在哪里本身就成为一种专业知识。也许更有趣的是,这种格局变化的速度有多快。仅仅 18 个月前,我用 AI 助手花了一个小时完成的研究论文是不可能以这种速度完成的。”
“与其对 AI 将如何改变工作得出明确的结论,我发现自己正在收集关于一个移动目标的观察结果。目前看来一致的是,就目前而言,最大的价值并非完全放弃对 AI 的控制,也并非完全坚持人类的工作流程,而是为每个特定任务找到正确的协作点,这是我们都在学习的一项技能。好吧,Ethan 这里又有一篇很棒的文章。感谢你写这篇文章。我想插一句,实际上是在这个结论上……”
“Mollick 教授在这里完全正确。根据我的经验,我认为大多数人的经验也是如此,关键是要弄清楚如何与 AI 协作。但就目前而言,完全控制它或完全不控制它,这两种极端都不正确。然而,在……”
“与此同时,我认为这一点导致人们对未来做出了错误的假设,或者更确切地说,使他们难以想象几乎肯定会出现的未来,在这种未来中,在许多情况下,完全放弃对 AI 的控制将更有意义。我们很难想象轨迹和模式。有许多偶然因素将影响代理的作用,
但我有时觉得我们正在坚持这些想法,即 AI 不会取代我们,但使用 AI 的人会取代我们,这意味着如果我们只是弄清楚如何使用 AI 来更好地或更高效地完成我们的工作,我们就会安然无恙。我现在正在写一篇尚未发表的文章,我暂定名为《是的,AI 将会取代你的工作》。重点不是没有人再有工作了。”
“而是当涉及到知识工作时,至少我认为,从功能上讲,我们所做的所有任务,至少那些不是关于品味、选择、考虑和计划的任务,尽管即使是最后一部分也值得商榷,是的,将来很可能由 AI 完成。”
“我们工作的意义将发生如此剧烈的转变,以至于如果一个人从 Chachapiti 之前的时期昏迷到五年后或任何时候这个时期被实例化,他将无法识别在这两个时期中拥有完全相同职位的那些人的角色,并且
正在做所谓的“同一件事”。然后,当然,问题就变成了该怎么办。就目前而言,对我来说唯一有意义的事情就是全力以赴,尽最大可能利用 AI 或代理的帮助或替代来扩展你能做的所有事情的边界。”
“只有在边缘和边缘,甚至那些还不完全有效工作的边缘,我们才能瞥见即将到来的情况。如果你想成为帮助塑造你未来角色实际作用的第一人,成为第一个这样做的,你必须全力以赴。无论如何,这是一个我们将继续讨论的话题。但现在,再次感谢 Mollick 教授的这篇文章。感谢各位的收听,一如既往。下次再见,和平。”