We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
N
NLW
知名播客主持人和分析师,专注于加密货币和宏观经济分析。
T
Thomas Potacek
Topics
Thomas Potacek: 我主要关注LLM在软件开发中的影响,对其他领域持保留态度。即使AI停滞不前,LLM仍然是我职业生涯中第二重要的工具。现在使用LLM编码的开发者使用AI代理,这些代理能够自主探索代码库、编写文件、运行测试并迭代结果。如果你还在手动复制粘贴代码,那你并没有真正理解LLM的潜力。LLM可以处理繁琐的代码、查找信息,并且不会感到疲倦。我一直对合并到主分支的代码负责,无论是否使用LLM。如果LLM生成的代码有误,代理会检测到并纠正。幻觉问题已被解决。使用AI代理是一种技能和工程项目,需要提示、索引和工具。LLM只有在被允许的情况下才会产生糟糕的代码。即使是最优秀的开发者,仍然需要进行策划、判断和指导。许多人对LLM的怀疑实际上是源于对自身能力的投射。专业的软件开发者应该关注解决实际问题,而不是成为工匠。LLM可以处理琐碎的任务,为重要的事情腾出空间。我欣赏平庸的代码,因为并非所有代码都同等重要。LLM的代码可能重复,但我的代码可能包含不必要的复杂性。我并不关心LLM是否会成为AGI,重要的是它是否有效。我不知道LLM是否会让我们的情况变得更好,但它可能会取代许多软件开发者。我们的工作也同样面临被取代的风险。LLM对代码的消化比你更深入。现在的开发者使用异步代理,让LLM处理多项任务,然后回来查看结果。我不如LLM代理那样擅长审问日志。我不是一个盲目乐观的人,但有些真实的事情正在发生。我们需要停止为糟糕的论点让路。 NLW: 工程师如果一直在回避AI,那么这篇文章很有价值,因为它出自一个发现AI工具具有变革性的人之手。这篇文章的价值在于作者没有做道德或价值判断,只是说这些工具太强大了,不容忽视。我们正在经历从助手时代到代理时代的转变。现在使用编码代理就像使用队友、初级开发人员、结对程序员一样。这种与AI交互的方式将越来越普遍。年轻人不会纠结于AI的道德规范,他们只会用它来胜过所有不使用它的人。他们产生的价值以及产生价值的速度,是任何政策施加的护栏都无法以任何有意义的方式减缓的。许多用例将继续发展,彻底改变它们所触及的一切。在系统中比在系统外能造成更大的破坏。

Deep Dive

Chapters
This chapter focuses on AI-assisted coding, refuting common skeptic arguments. It highlights how experienced coders are already leveraging AI agents for significant productivity gains, and why dismissing AI in this field is no longer justifiable.
  • LLM-assisted coders use 'agents' that interact directly with codebases, run tools, and iterate on results.
  • AI significantly reduces tedious coding tasks and googling.
  • Concerns about code understanding and quality are addressed; the coder remains responsible for reviewing and merging code, regardless of AI assistance.

Shownotes Transcript

今天在 AI 日常简报中,我们将探讨为什么 AI 怀疑论者是错的。AI 日常简报是一个每日播客和视频,内容涵盖 AI 领域最重要的新闻和讨论。

大家好,欢迎回到 AI 日常简报。快速公告。首先,感谢今天的赞助商 KPMG、Blitzy 和 Vanta。与往常一样,如果您想收听无广告版本的节目,请访问 patreon.com/AIDailyBrief。无广告版本每月只需 3 美元。当然,今天是节目的长篇阅读环节。一篇名为“我的 AI 怀疑论者朋友们都是疯子”的文章在过去一周左右的时间里席卷了 AI 推特圈。

现在,这篇文章特别关注 AI 编码,但正如您将看到的,其中一些内容更广泛地适用。我们将逐段阅读一些摘录,然后稍加讨论。这篇文章的作者是 Thomas Potacek,Thomas 想在重要的警告中明确一点,引用如下:“我只讨论大型语言模型对软件开发的影响。对于艺术、音乐和写作,我什么都不知道。我倾向于相信这些领域的怀疑论者,但我只是不相信他们对我的领域的看法。”

Thomas 写道,这是一篇关于 AI 辅助编程的真挚的挑衅性文章。科技高管们正在强制实施大型语言模型的采用。这是一个糟糕的策略,但我明白他们的出发点。

我认识的一些最聪明的人坚信 AI 是一种时尚,是下一代 NFT 热潮。我一直不愿反驳他们,因为,好吧,他们比我聪明,但他们的论点并不严肃,值得我们去反驳。极其有才华的人出于怨恨而从事大型语言模型已经做得更好的工作。大型语言模型的所有进展都可能在今天停止,而大型语言模型仍然将成为我职业生涯中发生的两件最重要的事情之一。

然后,Thomas 谈到他自 90 年代中期以来一直在使用一系列不同的语言编写软件,最终得出结论:无论你如何定义资深开发者,我都符合条件。

在第一部分“水平设定”中,Thomas 写道:“首先,我们需要达成共识。如果你六个月前尝试使用大型语言模型编写代码却失败了,那么你并没有做大多数资深大型语言模型辅助编码人员正在做的事情。今天使用大型语言模型进行编码的人使用的是代理。代理可以自行浏览你的代码库。他们直接创建文件,运行工具,编译代码,运行测试,并迭代结果。”

“他们还可以将任意代码从树或在线的其他树中提取到他们的上下文窗口中,运行标准的 Unix 工具来导航树并提取信息,与 Git 交互,运行现有工具,并进行你通过 MCP 设置的基本上任意的工具调用。如果你在 ChatGPT 页面上发出请求,然后将生成的错误代码粘贴到你的编辑器中,那么你并没有做 AI 支持者正在做的事情。难怪你们互相说不通。”

现在 Thomas 转向积极的方面。对于观看视频的观众,我在这里表示歉意,但对于只收听音频的观众,他分享了一张包含四个象限的图片。这四个象限分别是:1. 有趣且重要,2. 乏味且重要,3. 乏味且无意义,4. 有趣且无意义。Thomas 继续说道:“大型语言模型可以编写你将来需要编写的大部分乏味代码。大多数项目中的大部分代码都是乏味的。大型语言模型大大减少了你将来需要谷歌搜索的内容数量。”

“它们自己查找信息。最重要的是,它们不会感到疲倦。它们不受惰性的影响。想想你想要构建但没有构建的任何东西。你试图确定一些第一步。如果你处于一种新编程语言的学习阶段,你就会开始编写代码。但你没有,所以你把它推迟了一天、一年或整个职业生涯。一想到新项目的所有簿记、谷歌搜索和依赖关系问题,我的血压就会上升。大型语言模型可以被指示来解决所有这些垃圾问题。”

“它通常会把你精确地带到事情几乎可以工作的那一刻,而开发意味着调整代码并立即看到事情变得更好。这种多巴胺的冲击是我编写代码的原因。”

“当然也有缺点。有时需要做一些棘手的事情,但你不想做,所以你重构单元测试,用你正在做真正工作的谎言来安慰自己。但大型语言模型可以被告知去重构你所有的单元测试。一个代理可以在虚拟机中花费数小时来处理你的测试,然后稍后返回一个 PR。如果你听我的话,你就会知道。你会感觉更糟糕的牦牛剃毛。你最终会做真正的工作。”

“但是你不知道代码是什么。”顺便说一句,Thomas 在这里使用这些章节标题来反映他听到的常见抱怨。所以,再次强调,这个标题是“但是你不知道代码是什么”。Thomas 写道:“你是一个氛围编码的 YouTuber 吗?你不会阅读代码吗?如果是这样,这是一个敏锐的观点。否则,你到底怎么了?你一直对合并到主分支的内容负责。五年前是这样,明天也是,无论你是否使用大型语言模型。如果你用大型语言模型构建了一些人们将依赖的东西,请阅读代码。事实上,你可能还会做更多的事情。”

“你会花 5-10 分钟把它改成你自己的风格。大型语言模型正在显示出适应本地习惯的迹象,但我们还没有达到那个阶段。人们抱怨大型语言模型生成的代码是概率性的。不,它不是。它是代码。它不是 YAC 输出。它是可知的。大型语言模型可能是随机的,但大型语言模型并不重要。重要的是你是否能够理解结果以及你的防护措施是否有效。”

“阅读其他人的代码是工作的一部分。如果你不能理解大型语言模型生成的无聊的重复性代码,那就是技能问题。你如何处理开发人员在截止日期前产生的混乱局面?在过去的一个月左右的时间里,Gemini 2.5 一直是我的首选。它为我生成的几乎没有任何东西无需编辑即可合并。我相信有一种技巧可以让最先进的模型一次性完成一个功能并进行合并,但我并不关心。我喜欢四处移动代码,并在删除所有愚蠢的注释时暗自窃笑。无论如何,我必须逐行阅读代码。”

“但是幻觉!如果幻觉对你很重要,那么你的编程语言让你失望了。代理进行 lint 检查。它们编译并运行测试。如果它们的大型语言模型发明了一个新的函数签名,代理会看到错误。它们会将其反馈给大型语言模型,大型语言模型会说,哦,对了,我完全编造了这个,然后再次尝试。只有当你观察代理生成的思维链日志时,你才会注意到这种情况的发生。不要这样做。这就是我喜欢 Zed 的代理模式的原因。它恳求你切换标签并让它工作,并在完成后用桌面通知提醒你。”

“我相信仍然有一些幻觉很重要的环境。但是幻觉是开发人员在有人建议使用大型语言模型时首先提出的问题,尽管它或多或少是一个已经解决的问题。但是代码很糟糕,就像初级开发人员的代码一样。”

“实习生的月薪是 20 美元吗?因为 Cursor.ai 的费用就是这样。成为高级开发人员的一部分是提高能力较弱的编码人员的生产力,无论是肉体上的还是代数上的。熟练地使用代理既是一项技能,也是一项工程项目,包括提示、索引,尤其是工具。只有当你允许大型语言模型这样做时,大型语言模型才会生成糟糕的代码。也许目前的混乱是关于谁在做什么工作。今天,大型语言模型做了大量的打字、谷歌搜索、测试用例和编辑-编译-测试-调试循环。但是”

“但是,即使是世界上最顽固的资深开发人员仍然拥有策划、判断、指导和方向。此外,让我们停止自欺欺人,认为我们人类的第一稿有多好。但它在 Rust 方面很糟糕。许多大型语言模型的怀疑可能实际上与大型语言模型无关。这是投射。人们说大型语言模型无法编写代码,而他们真正想表达的意思是大型语言模型无法编写 Rust 代码。公平地说。但是人们选择语言的部分原因是大型语言模型与它们的配合程度。所以 Rust 开发人员应该关注这个问题。”

“但是工艺!”

“你喜欢精美的日本木工吗?所有手工工具和指物接合?我也是。在你的业余时间去做吧。我的地下室有一个基本的木工车间。我可以从制作一张桌子中获得很多满足感。如果那张桌子是工作台或烧烤桌,当然,我会自己制作。但是如果我需要一张桌子供人们在我的办公室里坐着,我会买一张现成的桌子。专业的软件开发人员从事的是为不会编写代码的人解决实际问题的工作。我们日常工作中不是工匠。”

“史蒂夫·乔布斯错了。我们不需要在雕塑中雕刻看不见的脚。没有人关心逻辑电路板的走线是否美观。如果我们构建的任何东西都能持久,那不是因为代码库很漂亮。”

“此外,这并不是真正发生的事情。如果你花时间仔细地将函数优化成优雅、流畅、最小的函数表达式,那么警钟应该响起。你在牦牛剃毛。现实世界已经耗尽了你的注意力。你并没有让自己感到安慰。等等,大型语言模型擅长这一点。它们吞噬繁琐的工作,并为你的判断和价值观真正重要的重要事情扫清道路。但是平庸……”

“作为一名中后期职业的程序员,我已经开始欣赏平庸。你应该很幸运能从水龙头中几乎毫不费力地获得它。我们都会编写平庸的代码。平庸的代码通常很好。并非所有代码都同等重要。有些代码应该是平庸的。在一个随机的单元测试上投入最大的努力?你做错了什么。你的团队负责人应该纠正你。开发人员喜欢炫耀代码。他们担心大型语言模型降低了质量上限。也许吧,但它们也提高了质量下限。”

“Gemini 的下限高于我自己的。我的代码看起来不错,但不够彻底。大型语言模型的代码是重复的,但我的代码包括一些愚蠢的扭曲,在那里我过于聪明地试图简化事情。大型语言模型并非在每个方面都平庸。它们几乎肯定比你拥有更多算法技巧。但我有点跑题了。这并不重要。如果我们从大型语言模型那里获得的只是真正平庸的代码,那仍然是巨大的进步。这意味着人类需要编写的平庸代码就少了那么多。”

“但这永远不会成为 AGI。我不在乎。聪明的从业者被 AIVC 炒作周期搞得焦头烂额。我不能责怪他们。但这并不是一个论点。事情要么有效,要么无效,无论黄仁勋怎么说都一样。本期节目由 Blitzy 赞助播出,Blitzy 是一个企业自主软件开发平台,具有无限的代码上下文。”

“Blitze 与你最喜欢的编码副驾驶一起使用,作为你的批量软件开发平台,为寻求在大型代码库上实现显著开发加速的企业服务。虽然传统的副驾驶可以帮助完成逐行代码补全,但 Blitze 通过首先记录你的整个代码库,然后并行部署超过 3000 个协调的 AI 代理来批量构建数百万行高质量代码,从而在 IDE 之前工作。规模差异惊人。副驾驶可能在几秒钟内为你提供几百行代码,”

“但 Blitzy 可以生成多达 300 万行经过彻底审查的代码。如果你的企业希望加快软件开发速度,请访问 blitzy.com 预约定制演示,或点击“开始使用”立即开始使用该产品。今天的节目由 Plum 赞助播出。如果你正在为客户或同事构建代理工作流程,那么是时候重新审视 Plum 了。Plum 是 AI 专家创建、部署、管理和获利复杂自动化的地方。”

“凭借一键式更新可触达所有订阅者、用于个性化的用户级变量以及保护你的提示和工作流程 IP 的功能,它是发展你的 AI 自动化实践的最佳场所。使用 Plum,在相同时间内服务两倍的客户。立即注册,网址为 useplum.com。网址是 U-S-E-P-L-U-M-B.com/N-L-W。今天的节目由 Vanta 赞助播出。在当今的商业环境中,企业不能仅仅声称拥有安全性,他们必须证明这一点。”

“通过遵守 SOC 2、ISO 27001、HIPAA、GDPR 等框架,企业可以展示强大的安全实践。”

“问题是,处理安全和合规非常耗时且复杂。这可能需要数月的工作,并占用宝贵的时间和资源。Vanta 通过自动化 35 多个框架的合规性,使其变得轻松快捷。它可以在几周而不是几个月内让你准备好接受审计,并为你节省高达 85% 的相关成本。事实上,最近的一份 IDC 白皮书发现,Vanta 客户每年获得 535,000 美元的收益,该平台在短短三个月内就能收回成本。”

“事实胜于雄辩。超过 10,000 家全球公司信任 Vanta。在有限的时间内,听众可以在 vanta.com/nlw 获得 1,000 美元的折扣。网址是 v-a-n-t-a.com/nlw,可获得 1,000 美元的折扣。”

“今天的节目由 Agency 赞助播出,Agency 是一个用于代理间协作的开源集体。当然,代理是目前最重要的主题,不仅在这个节目中,而且我认为对各行各业的企业来说也是如此。其中一部分是代理开始能够执行的任务范围的扩大。虽然单个代理可以处理特定任务,但真正的力量来自于专门的代理协作解决复杂问题。然而,”

“目前,这些代理之间没有标准化的基础设施来发现、沟通和相互协作。这就是 Agency(拼写为 A-G-N-T-C-Y)的用武之地。Agency 是一个开源集体,正在构建代理互联网,这是一个全球协作层,AI 代理可以在其中一起工作。它将连接跨供应商和框架的系统,解决企业在发现、互操作性和可扩展性方面面临的最大问题。”

“凭借思科、Crew.ai、Langchain 和 MongoDB 等贡献者,Agency 正在打破孤岛,构建互操作 AI 的未来。塑造企业创新的未来。访问 agency.org 立即探索用例。网址是 A-G-N-T-C-Y.org。”

“但是他们抢走了我们的工作。开源也是如此。我们过去曾为数据库支付高昂的费用。我们这个领域的前提是将其他人的工作自动化。经济学家称之为生产力提高。你知道这意味着什么,对吧?更少的人做同样的事情。最近有没有和旅行社、场内经纪人、唱片店店员或暗房技术人员谈过话?当出现这个论点时,自由主义倾向的风投开始高唱。燃灯者、创造性破坏、新的工作类型。也许吧。但我没有被催眠。我完全不知道大型语言模型之后我们是否会过得更好。”

“事情可能会对我们变得更糟。大型语言模型确实可能会取代许多软件开发人员。这不是我们可以骑的高头大马。我们的工作与其他所有人的工作一样,都在科技的火力线中,过去三十年来一直如此。我们不是东海岸的码头工人。我们不会阻止自身的进步。”

“但是剽窃。人工智能正在深刻地,而且可能是错误地,威胁着视觉艺术家,如果你不从事艺术工作,你可能很难理解这一点。我们想象艺术家们将他们的工作时间花在突破表达的极限上。但是媒体和艺术家们并不是在创作画廊作品。他们根据简报进行创作,为杂志封面、博物馆展示、动态图形和游戏资产制作出合格的插图和构图。大型语言模型轻松地、令人震惊地达到了行业质量标准。令人恼火的是,他们最擅长的事情之一就是制作足以胜任的、与人类创意作品相似的作品。”

“我的家人从事视觉艺术工作。我不能和他们谈论大型语言模型。我不怪他们。他们可能没错。”

“与此同时,软件开发人员发现看似从 GitHub 上的公共存储库中提取的代码片段,并因此而抓狂。许可证怎么办?如果你是一名律师,我服从你的意见。但如果你是一名打出这张牌的软件开发人员,请原谅我,当我要求你把这个担忧抛诸脑后时。没有哪个行业比软件行业更蔑视知识产权了。媒体和开发人员认为《星球大战》和 Daft Punk 是公共资源。开发人员的伟大文化产品一直是反对任何可能给可获利的媒体共享网站带来不便的保护措施。当他们在政策方面失败时,他们会通过胁迫来规避它。”

“他们建立了全球规模的海盗网络,嘲笑任何试图为电视节目保留新发行窗口的人。这都是特殊的恳求。大型语言模型比你更深入地消化代码。如果你不相信字体设计师可以对字母形式的终端和计数器提出道德要求,那么你当然不能对红黑树具有所有权。积极案例重述。几天前我开始写作时,我写了一个章节来设定大型语言模型辅助编程的最新技术水平。”

“蓝鱼片比大型语言模型的版本寿命更长。在你阅读这段文字的时间里,一切都变了。今天的孩子们不仅使用代理,还使用异步代理。他们醒来,为大型语言模型自由联想 13 件不同的事情,然后冲咖啡,填写 TPS 报告,开车去火星奶酪城堡,然后检查他们的通知。他们有 13 个 PR 需要审查,3 个被丢弃并重新提示,5 个得到初级开发人员相同的反馈,5 个被合并。”

“我现在正在喝火箭燃料,一个朋友告诉我。我的团队中那些不接受 AI 的人,就像他们站在原地不动一样。他不是在骗我。他不工作在 SFBA。他没有任何理由撒谎。有很多事情我不信任大型语言模型。没有大型语言模型可以访问这里的生产环境,但我曾是事故的第一响应者,并向 4.0(不是 0.4 mini,而是 4.0)提供了日志记录的记录,并观察到它在几秒钟内发现了我们几个月来一直在抱怨的主机上的 LVM 元数据损坏问题。”

“我比大型语言模型代理更擅长审问开放搜索日志和蜂巢跟踪吗?不,我不是。令我的许多朋友感到不安的是,我不是激进分子或未来主义者。我是一个国家主义者。我相信复杂的制度体系的偶然持久性以及回归均值。我编写 Go 和 Python 代码。我不是迷信者。但确实发生了一些事情。我那些最聪明的朋友却对此不屑一顾。也许我能说服你。也许我不能。可能我不能。但我们需要停止为错误的论点腾出空间。”

“但我厌倦了听到这些。在这里,我重新加入你的公司。每天,Hacker News 首页的一大部分都分配给大型语言模型。增量模型更新、使用大型语言模型的初创公司、大型语言模型教程、反对大型语言模型的长篇大论。这很烦人,但 AI 也非常重要,我谨慎地使用了这个词。它正在获得 2008 年智能手机获得的那种关注,但没有互联网获得的那么多。”

“这似乎是正确的。我认为这在未来一年会变得更加清晰。关于随机鹦鹉和氛围编码的酷孩子傲慢态度无法承受更多与现实的接触。我正在嘲讽这些人,但我指的是我的意思。他们比我聪明。当他们克服这种矫揉造作之后,他们将使编码代理比今天更有效。这就是这篇文章的内容。”

“我认为这在高层次上非常有价值的是,很明显,如果你是一名一直避免这些事情的工程师,我无法想象如果你正在收听这个节目,你就是,但也许有人会把这个节目发给你。这个人不像我,他不是 AI 播客主持人或 AI 企业家。他只是简单地发现,这套新工具从根本上和不可否认地具有变革性。它之所以有价值,是因为他没有做出道德判断或价值判断。”

“他甚至没有像我和你们许多人可能珍视的那样,对这一切在另一边如何发展抱有技术乐观主义。相反,他只是说这些工具太强大,不容忽视。我认为对于这个领域中任何版本的任何怀疑论者来说,这是一个相当不错的起点。”

“我认为这篇文章中另一个极其重要和有价值的地方是,它在很大程度上体现了我们现在正在经历的转变,事实上,我相信,它在我们不知不觉中,甚至在某些情况下,在我们没有注意到的情况下,从助手时代转变为代理时代。”

“正如 Thomas 指出的那样,这不仅仅是一些基本的编码辅助。这实际上是将编码代理用作队友、初级开发人员、结对程序员。它设置了一堆提示,然后去做其他事情,然后回来与已生成的内容进行交互。”

“它是后台代理。它是异步代理。这将越来越成为我们与 AI 交互的方式。如果你是一名普通消费者,并且你使用了深度研究,那么你已经对此有了一些了解。你告诉你在使用的任何大型语言模型进行深度研究你想要的东西。它会提出一些澄清性的问题,然后它会告诉你离开,让它去做它的工作。”

“5、10、15 分钟后,无论是什么,你回来后,它要么得到了你想要的东西,要么你再次运行它。但它在你做其他事情的时候发生了。而这本身就完全改变了这里的实际能力集。”

“第三点,这是一个潜台词,我认为这极其重要,那就是,对于某些人来说,这些争论是无关紧要的,因为他们只是简单地跳上了这趟列车,并一路狂奔。我认为这尤其体现在代际差异上。年轻人不会去讨论 AI 的伦理道德。他们只会利用它来超越所有不使用它的人。”

“句号。全文结束。故事结束。他们创造的价值量以及他们创造的速度,将几乎不可能被任何政策强加的限制以任何有意义的方式减缓。当然,这并不意味着没有一部分 AI 应该受到”

“伦理和价值观以及我们想要生活的社会的问题。但是,当这些对话发生时,许多、许多用例将继续前进,彻底改变它们所触及的一切。”

“当谈到影响 AI 的形状时,对于那些站在外面自负地说 Thomas 提到的任何组合的事情以及我们在其他领域听到的所有其他论点的人,我会留下这种情绪,如果不是确切的引言,那就是来自《SLC Punk》结尾的句子,在主人公意识到在盐湖城做一个倦怠的人不会对世界有任何帮助之后,如果他真的想有所作为,那么抓住机会去哈佛大学学习法律可能比”

“我们可以在系统内部造成更大的破坏,而不是在系统外部。现在,今天的 AI 日常简报就到这里。下次再见,和平。”