We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
播音员
主持著名true crime播客《Crime Junkie》的播音员和创始人。
Topics
播音员:Anthropic 的报告揭示了人们实际使用 AI 的情况,特别是 Claude 在编码方面的应用。研究发现,人们使用 Claude 进行编码的任务远超预期,且主要用于自动化任务而非增强人类能力。最常用的编程语言是 JavaScript 和 HTML,主要用于构建面向用户的应用程序,特别是简单的应用程序和用户界面。初创公司是 AI 编码工具的早期采用者,这可能是因为它们更愿意尝试新技术以获得竞争优势。此外,'氛围式编码' (vibe coding) 的兴起,让开发者可以使用自然语言描述目标,让 AI 处理实现细节。个人项目也占了相当大的比例。 总的来说,AI 编码工具的应用正在快速增长,并且在不同领域和用户群体中都得到了广泛应用。虽然企业级应用仍处于起步阶段,但其潜力巨大。 Harry Wang 教授:我个人使用 AI 编码工具的经验与 Anthropic 报告中的三个主要模式相符。我认为,如果将 Cursor、Windsurf 和 Klein 等平台的数据纳入研究,将会进一步强化这些发现。

Deep Dive

Shownotes Transcript

今天在AI每日简报中,我们将探讨人们目前实际如何使用AI。AI每日简报是一个关于AI最重要新闻和讨论的每日播客和视频。感谢今天的赞助商Plum、Vanta和Superintelligent。要获得AI每日简报的无广告版本,请访问patreon.com/AIDailyBrief。

大家好。在我们深入今天的节目之前,先快速说明几点。主要内容很长,这是一个有趣的探索性话题,所以今天没有新闻标题。我们明天会继续报道。正如我多次提到的,对于那些正在寻找AI每日简报无广告版本的用户,您现在可以前往patreon.com/AIDailyBrief找到它。最后,我想了解一下大家的看法。

AI每日简报社区对超级智能的故事给予了巨大的支持和重视。我们正在考虑为来自这个社区的投资者保留我们当前轮次的一部分。但是,我正在尝试评估大家的兴趣。如果您认为我们应该探索这一点,请发送邮件至[email protected],主题为“super”。提前感谢您的意见。有了这些,让我们进入今天的节目。

欢迎回到AI每日简报。自从ChatGPT发布以来,一直萦绕在AI周围的一个问题是,好吧,人们实际上将这些东西用于什么?每当我制作关于我如何实际使用AI、我的技术栈之类的节目时,总会有很多人感兴趣。另外,如果您了解Lenny的播客,他们刚刚宣布了他们网络上一个名为“How I AI”的新播客,内容正是关于这一点的。重点是,人们真的对其他人如何使用AI并从中获得价值很感兴趣,这是有道理的。这

这是一个全新的领域,尽管人们首先尝试的是那些显而易见的事情,但我认为所有使用这些工具的人都有一种感觉,那就是我们才刚刚触及表面,最好的还在后面。

因此,即使只是在一个非常短的时间窗口和一个非常短的快照中,当有人进行一些研究或查看有关人们实际如何使用AI的数据时,这总是很有价值的。今天,我们将研究最近发布的几个例子,我们首先来看Anthropic的一份新报告,特别是来自他们的经济指数,他们称之为“AI对软件开发的影响”。该研究之前的版本研究了AI在不同职业和教育领域的应用,

但这一次重点关注编码,正如您所知,这是目前Claude的主要用例,如果不是主要用例的话。事实上,他们写道:“也就是说,与Claude关于计算机相关任务的对话比根据从事相关工作的人数预测的要多得多。”

因此,他们想更深入地挖掘一下。他们所做的是对Claude.ai以及Claude Code(他们的专业编码代理)进行了50万次,也就是50万次与编码相关的交互,以了解人们如何以这种方式与代码进行交互。在所有这些之后,他们发现了三种模式。第一种是编码代理用于更多自动化。这非常重要,并且会为一些人使用“代理”这个词提供理由。并且

Anthropic写道:“在Claude Code上的79%的对话被认定为自动化,换句话说,就是AI直接执行任务,而不是增强,即AI与人类能力协作并增强人类能力。”这与Claude.ai对话的49%形成对比。

这意味着使用Clawed Code的人将其用作代理,而不仅仅是编码助手。他们发现的下一个模式是AI编码人员通常构建面向用户的应用程序。他们数据集中最常用的编程语言是JavaScript和HTML,在编码用途方面,用户界面和用户体验任务位居前列。他们指出,“这表明,专注于创建简单的应用程序和用户界面的工作可能会比那些纯粹专注于后端工作的岗位更快地受到AI系统的影响。”

现在,我认为这里可能有一点跳跃。我理解为什么这会成为结论之一,但我认为另一个结论可能是简单的应用程序和界面是vibe编码人员与这些工具相交的很多地方。例如,对于喜欢捣鼓的人、新的vibe编码人员以及那些不是工程师但刚开始构建东西的人来说,自然的倾向是

是原型前端,将他们的想法变为现实。举个例子,如果您查看我在Lovable或SoftGen上创建的项目,这是一个类似的应用程序,它正在构建一个真正以社区为中心的vibe编码平台,我构建的大约90%的东西可能都在前端或用户体验部分。这并不是因为这些工具无法构建完整的堆栈,它们可以,而是因为很多都是我自己的实验,而这是我先尝试的。

无论如何,Anthropic发现的第三个关键模式是,在使用Cloud Code方面,初创企业绝对是早期采用者。虽然初创企业在整体编码工作中所占比例远小于企业,但它们在Cloud Code上的对话中占33%,而

在被认定为与企业相关的Cloud Code对话中,这一比例仅为13%。老实说,这并不令人意外。事实上,我们在Superintelligent发现的最显著的事情之一是,企业工程部门对编码工具的抵制程度有多高。我认为这可能有许多原因,其中一些原因可能是合理的,例如工具的设计方式更适合个人使用而不是大型企业协作,以及一些不太正当的用途,例如人们基本上不想改变他们现有的习惯。

现在,这里还有一些其他有趣的发现,这些发现更细致一些。为了深入研究这种vibe编码用例,Anthropic将不同的编码工作分为不同的用例。这些包括从软件架构和代码设计到UI/UX组件开发,再到调试和性能优化,以及Web和移动应用程序开发。

等等。Anthropic指出,排名前五的编码任务中有两个是UI开发和Web及移动应用程序开发,分别占对话的12%和8%。他们写道:“……这些任务越来越适合一种被称为vibe编码的现象,在这种现象中,经验水平不同的开发人员用自然语言描述他们期望的结果,并让AI负责实现细节。”

该公司的结论是,创建简单的应用程序和界面的这些较轻量级的编程任务可能是首先受到AI影响的。他们写道,随着AI越来越多地处理组件创建和样式任务,这些开发人员可能会转向更高级别的设计和用户体验工作。现在,让我们看看使用AI编码工具的人群,以及

Anthropic发现,大约30%的编程对话与个人项目有关,而大约25%的对话与企业工作有关。请记住,他们将此细分为Claude Code对话和Claude.ai对话,而初创企业在这两者之间的差距要大得多。13%与编程相关的Claude.ai使用来自初创企业领域,而这些用户在Claude Code会话中占33%。

除了认识到初创企业是编码代理的早期采用者之外,这并不令人意外,Anthropic补充说,“涉及学生、学者、个人项目构建者以及教程和学习用户的用途共同代表了两个平台上的一半交互。换句话说,个人,而不仅仅是企业,是编码辅助工具的重要采用者。这些采用模式反映了过去的技术转变,其中初创企业使用新工具来获得竞争优势,

而成熟的组织则更加谨慎,并且通常在公司范围内采用新工具之前会进行详细的安全检查。AI的通用性质可能会加速这种动态。

如果AI代理能显著提高生产力,那么早期采用者和后期采用者之间的差距可能会转化为巨大的竞争优势。现在,正如我提到的,我认为这不仅仅是一个安全问题。我还认为这是当前一代编码助手和vibe编码工具的设计局限性,因为它们尚未完全为企业做好准备。也就是说,我已经看到许多初创公司涌现出来,他们正试图专门将vibe编码引入企业,我认为这种情况很快就会发生。

另一个有趣的发现是,与非编码任务相比,人类更有可能继续参与编码任务。在Anthropic之前对非编码任务的分析中,他们发现只有3%的对话涉及自动化和人工反馈循环。

对于编码,这个数字是所有编码对话的21%。Anthropic所谓的指令自动化也相应下降。换句话说,就是告诉AI完成一项任务,并在完成后返回。这可能反映了编码的迭代性质,需要返回并改进代码以使一切正常工作,或者这可能是AI当前局限性的反映,即无法一次性完成复杂的软件而无需进一步反馈或额外步骤。

再说一次,在我使用SoftGen AI或Lovable等工具时,让我或多或少倾向于特定平台的一件事是它在解释我的提示方面有多好,更具体地说,是在我意识到我没有很好地提示它并且不得不回去更好地解释自己之后修复问题的能力。现在,我认为当谈到社区对Anthropic发现的回应时……

总的来说,这对于人们来说是通过了嗅探测试。特拉华大学教授Harry Wang写道:“我个人的经验与他们确定的三种模式非常吻合。”他还补充道:“尽管没有包含Cursor、Windsurf和Klein的数据,但我认为纳入它们会进一步加强这些发现。”All About AI写道:“事实证明,AI在软件开发中做了很多繁重的工作,但开发人员仍然参与了重要的事情。”今天的节目由Vanta赞助。

Vanta是一个信任管理平台,可以帮助企业自动化安全和合规性,使他们能够展示强大的安全实践并扩展规模。在当今的商业环境中,企业不能仅仅声称拥有安全性,他们必须证明这一点。通过符合SOC 2、ISO 27001、HIPAA、GDPR等框架,企业可以展示强大的安全实践。

而且我们每次在Superintelligent将企业与代理服务提供商联系起来时,都会看到这一点的重要性。对于企业来说,许多这些合规框架根本无法协商。

问题是,处理安全和合规性既费时又复杂。这可能需要数月的工作,并占用宝贵的时间和资源。Vanta通过自动化35多个框架的合规性,使其变得轻松快捷。它可以在几周而不是几个月内让您准备好接受审核,并为您节省高达85%的相关成本。事实上,最近的一份IDC白皮书发现,Vanta客户每年获得53.5万美元的收益,该平台在短短三个月内就能收回成本。

事实胜于雄辩。超过10,000家全球公司信任Vanta,包括Atlassian、Quora等。在有限的时间内,听众可以在vanta.com/nlw获得1000美元的折扣。网址是v-a-n-t-a.com/nlw,可获得1000美元的折扣。

今天的节目由Superintelligent赞助,我今天非常高兴地告诉大家我们的咨询合作伙伴计划。新的Superintelligent是一个平台,可以帮助企业确定要采用哪些代理,然后通过我们的市场,找到可以帮助他们实际构建、购买、定制和部署这些代理的合作伙伴。

这种体验的关键是我们所说的代理准备情况审核。我们部署了一套语音代理,可以采访您团队中的成员,以发现代理在推动实际业务价值方面最有效的地方。从那里,我们提出了一系列建议,这些建议可以转化为市场上的RFP或其他类型的变更管理活动,以帮助您为新的代理驱动型经济做好准备。

我们现在发现,咨询顾问将代理准备情况审核带给他们的客户作为帮助他们推进代理部署流程的一种方式,取得了巨大的成功,咨询顾问的角色是帮助他们的客户根据我们的建议确定合适的机遇,并帮助管理合作伙伴选择流程。基本上,审核大大减少了我们咨询合作伙伴的发现时间,这是我们非常高兴看到的事情。如果您经营一家公司,并且拥有可能适合代理准备情况审核的客户,

请发送邮件至[email protected],主题为“consultant”,我们将立即回复您有关咨询合作伙伴计划的更多信息。再次说明,地址是[email protected],并在主题行中输入“consultant”。今天的节目由Plum赞助。如果您正在为客户或同事构建代理工作流程,那么是时候再次关注Plum了。Plum是AI专家创建、部署、管理和获利复杂自动化的场所。我们

凭借一键式更新(可触达所有订阅者)、用于个性化的用户级变量以及保护您的提示和工作流程IP的能力等功能,它是发展您的AI自动化实践的最佳场所。使用Plum,服务客户数量翻倍,时间缩短一半。立即注册,网址为useplum.com。网址是U-S-E-P-L-U-M-B.com/N-L-W。

这就是关于编码用例的所有内容,但是人们现在实际上将AI用于哪些其他用例呢?接下来,我们有一项来自哈佛商业评论的研究,名为“2025年人们如何真正使用生成式AI”。作者Mark Zao-Sanders写道:“一年前,我写了一篇文章,讲述了人们如何真正使用生成式AI。用例几乎平均分配在个人和业务需求之间,大约一半涵盖两者。”该

哈佛商业评论编辑和我认为需要更新这项研究。在过去12个月中发生了很多事情。然后他介绍了在过去一年中一直是本节目核心内容的所有事情。现在,方法论在这里很重要,因为我不知道这是否会像Anthropic的研究那样具有决定性或通过嗅探测试。马克

马克写道:“我采用了与去年相同的方法,但搜集了更多数据。有更多的数据需要搜集,并将结果限制在过去12个月。我查看了Reddit和Quora等在线论坛,以及包含该技术明确具体应用的文章。”所以基本上,马克试图寻找人们如何谈论使用生成式AI。他发现顶级用例发生了很多变化。在2024年,他的顶级用例按顺序排列是:产生想法、治疗和陪伴、

特定搜索、编辑文本、探索感兴趣的话题、娱乐和胡闹、故障排除、增强学习、个性化学习和一般建议。这一次,第一名是治疗和陪伴。第二名是组织我的生活。第三名是寻找目标。第四名是增强学习。第五名是生成代码。第六名是产生想法。请记住,这从2024年的第一名下降了。第七名是娱乐和胡闹。第八名是改进代码。第九名是创造力。第十名是健康生活。

现在,我要直接说明,这篇文章的作者并不是说这是一项科学研究。这是一种有趣的方法,可以用来了解人们如何沟通他们对AI的使用情况,从而了解趋势和模式。它会有一些固有的局限性,因此您应该将其视为一项证据,而不是真理。但是,我认为其中一些是令人惊讶的。

例如,高度个性化用例的惊人集中度,治疗和陪伴、组织我的生活和寻找目标,所有这些都在任何与业务相关的事情之前。我的问题当然是,这在多大程度上说明了这些是顶级用例,而不是

这些是人们出于某种原因有兴趣谈论的顶级用例。现在,即使是这样,并且我们需要根据一件事情有多有趣来谈论而不是仅仅去做来进行一些固有的缩放或加权,仍然有一些领域趋势线都加起来了。我当然是在谈论马克在第五名和第八名中发现的Anthropic结果,生成代码和改进代码。

改进代码从之前的19上升了,生成代码从47上升了。基本上表明,将编码代理和工具用作增强器(即改进代码),以及用作代理(即生成代码)都大幅上升了,但将其用作代理并实际生成代码的上升幅度更大。

现在,从具体的用例中放大来看,马克还尝试按主题对所有排名前100的用例进行分组。因此,他发现的六个主题是内容创建和编辑、技术援助和故障排除、个人和专业支持、学习和教育、创造力和娱乐以及研究分析和决策。正如我提到的,变化最大的是个人和专业支持在一年内几乎翻了一番,从排名前100的用例中的17%跃升至31%。

现在,这有点超出了本节目的范围,本节目显然更关注AI的业务用例,但仍然值得分享马克关于治疗用例的看法。他说:“……许多发帖者谈到与AI模型进行治疗如何帮助他们处理悲伤或创伤。AI辅助治疗的三个优势非常明显。它全天候可用,它相对便宜,在某些情况下甚至免费使用,而且它不会受到其他人的评判。AI作为治疗的现象在中国也被注意到。”

尽管关于计算机化治疗的全部潜力的争论仍在继续,但最近的研究提供了一个令人放心的观点,即AI驱动的治疗干预已经达到了相当高的复杂程度,以至于它们与人工编写的治疗反应难以区分。现在,有趣的是,马克将这一点与一个更广泛的趋势联系起来,即指导和建议从人类转向AI。他继续说道,

越来越多的专业服务现在正在由生成式AI部分提供,从治疗和医疗建议到法律咨询、税务指导和软件开发。他以安永为例,说明了这一趋势正在进行中。他写道,

包括部署150个AI代理,专门用于与税务相关的任务。现在,这反映了《商业内幕》最近的一篇长篇报道,名为“正在改变麦肯锡、波士顿咨询和德勤咨询工作方式的AI热潮”。

这篇文章的重点是,咨询公司不仅销售AI咨询服务,而且在某种程度上也是这些工具最快的企业采用者。这篇文章提供了一些非常具体的例子。例如,麦肯锡有一个内部生成式AI聊天机器人,名为Lilly。Lilly连接到麦肯锡的全部知识产权,包括超过10万份文件和访谈,并且使用率很高。

麦肯锡合伙人告诉BI,该公司4.5万名员工中超过70%现在都在使用Lilly,而那些使用它的人每周大约使用17次。他们将其用于研究、总结文件、分析数据和集思广益。在一个案例研究中,他们发现员工使用该工具节省了30%的时间。这与毕马威在其最近的季度脉搏调查中发现的情况相符,在该调查中,他们发现AI生产力工具的每日使用率大幅跃升。

从去年的第四季度22%跃升至今年第一季度的58%。毕马威的脉搏调查采访了收入超过10亿美元的公司中的100多位高级领导。现在,这些类型的工具并不是咨询顾问可以访问的唯一工具。还有更精细的工具,例如用于甲板和PowerPoint演示文稿创建的工具。我认为总的来说,所有这些都讲述了使用成熟的故事。

当然,我们在Superintelligent也对此有第一手的了解。日复一日,我们都在进行审核,以绘制机会图谱并了解公司如何使用AI。这让我们对公司正在使用和没有使用这些工具的地方有了相当好的了解。他们使用这些工具的许多地方不会让您感到惊讶。

SDR代理非常受欢迎,内容创建代理、客户服务代理。这些是人们目前对代理最自信的外部工作领域。代理被大量使用的另一个领域是内部工作。因此,内部知识管理,帮助员工解答他们的问题。这里的一个共同点是,这些都是重要的工作领域,但与例如关键任务产品或运营工作相比,风险相对较低。

公司尚未使用AI,特别是代理的地方,是其业务中绝对需要每次都正确完成的部分。例如,许多财务用例都被搁置了。

甚至一些咨询用例也受到限制,因为您无法处理97%的成功率。它必须更接近100%。我们最近在Anthropic首席执行官Dario Amadei关于可解释性紧迫性的文章中讨论了这一点,他在文章中指出,可解释性不仅关乎社会一致性问题,也关乎业务用例。总的来说,当你退一步看时,很明显的是AI的使用正在增加。它在广度和深度上都在增加。

使用它的人比以往任何时候都使用得更多,而且使用它的人比以前更多。老实说,如果您真的想看看哈佛研究表明了什么,那并不是关于一个用例优于另一个用例。而是关于存在适用于所有事物的用例这一事实。这些用途将会改变,但我认为趋势线非常清晰。这就是今天的AI每日简报的全部内容。一如既往地感谢您的收听或观看。直到下次,再见。♪