今天在AI每日简报中,我们将探讨AI公司如何实际使用AI。AI每日简报是一个每日播客和视频,内容涵盖AI领域最重要的新闻和讨论。
嘿,大家好,朋友们。快速通知一下。首先,感谢今天的赞助商Blitzy、Plum和Super Intelligent。要获得节目的无广告版本,请访问patreon.com/AIDailyBrief,每月只需3美元起。还有一点需要注意的是,由于一些最后一刻的旅行安排,我提前录制了这一期。这意味着,像这类节目经常发生的那样,我们今天不做新闻头条。所以,如果发生了一些疯狂的事情,这就是为什么我不在这里谈论它。
我们明天将恢复正常的节目,然后在周五的7月4日休息。下周应该会再次完全恢复正常。尽管如此,我一直非常期待谈论这份报告,因为我们在这个节目中讨论的大多数报告都来自企业视角和企业采用情况,这当然与你们许多人正在做的事情相符。这是一份关于构建AI的公司如何使用AI的报告,并且
我认为这是一种“做我所做的,而不仅仅是说我所做的”的事情,这使得它非常有价值。这份报告来自Iconic,这是一家财富管理和投资公司。总而言之,尽管它在这里很独特且非常有用,但许多主要主题都非常相似。换句话说,我们已经完全摆脱了试点和实验阶段。我们正在尝试新的商业模式。支出和预算正在增加。人才真的很重要。与你过去听到我谈论过的非常相似的主题,但是
但是来自那些坦率地说最了解情况的公司。
那么,这份报告中包含哪些类型的公司呢?尽管这些都是AI构建者,但实际上范围相当广泛。一方面是AI赋能型公司,它们只是在其现有产品中添加AI功能。这就像Atlassian,它拥有工作管理软件,正在构建该软件的AI版本。这大约占这300名调查受访者的31%。另一类AI赋能型公司是那些创建新AI产品
的公司,而这并不是他们的核心产品。例如Salesforce,其中Agent Force显然是他们的一个重要优先事项,但它仍然不是Salesforce的核心产品。该群体占受访者的37%。最后一类是AI原生公司,例如11 labs,他们的全部重点是他们的核心AI产品。这占受访者的32%。
不出所料,那些AI产品是其主要产品的公司在其AI产品的开发方面进展得更快一些。虽然34%的AI赋能型公司将其AI产品仍处于测试阶段,但只有10%的AI原生公司停留在测试阶段。这两个类别都有大约42%的AI产品处于通用可用性阶段。但是,只有13%的AI赋能型公司正在扩展其AI产品,而47%的AI原生公司正在扩展其AI产品。
说到他们正在构建什么,那就是主要的主题了。是代理工作流程、垂直AI应用程序以及水平AI应用程序、AI平台和基础设施以及核心AI模型。仍然有62%的AI赋能型公司正在以某种形式或方式开发代理,而79%的AI原生公司也是如此。一个非常有趣的问题,当然是从那些试图做出这些类型决策的大公司员工的角度来看,是他们使用哪些模型。
答案很明确,是多个模型。
事实上,每个受访者平均使用的模型数量为2.8个,这意味着,如果你的公司正在努力决定使用哪个模型,我们可能正处于一个尝试将不同的模型用于不同目的的阶段。OpenAI遥遥领先,Anthropic位居第二,谷歌和Meta则紧随其后,位居第三。Mistral、DeepSeq和Cohere也有一定的代表性。有趣的是,在选择哪个模型时,
准确性是首要考虑因素。74%的受访公司将其准确性列为前三项考虑因素。另一方面,开源和供应商锁定非常非常低。只有9%的公司将开源作为关键考虑因素,
只有6%的公司将供应商锁定作为关键考虑因素。24年和25年之间的一个真正有趣的区别是,在24年,成本实际上是最不重要的考虑因素,而今年它却排在第二位,有57%的公司将其列为前三项考虑因素。我认为,这一大幅跃升反映了这样一个事实:我们已经从实验阶段进入全面生产阶段。换句话说,当你只是在进行实验和测试时,
成本的优先级低于让事情运转起来。但是,当你实际扩展一个将拥有大量用户的产品时,成本就会产生很大的影响。最重要的是,我们还有诸如DeepSeek之类的低成本模型进入并展开竞争等外部因素,这使得成本成为一个考虑因素。
说到他们发现的不同模型的挑战,我认为这份清单对于任何与AI互动的人来说都非常熟悉。幻觉排在首位,其次是可解释性和信任度、改进投资回报率、计算成本。一个有趣的是,我们稍后会再讨论,四分之一的受访者将寻找合适的用例列为前三大挑战,考虑到这些公司正在构建AI模型,这很有趣,仍然有四分之一的公司发现寻找合适的用例是一个挑战。
代理这个大主题怎么样?简而言之,代理来了,宝贝。Iconic将这些群体分为高增长公司和所有其他公司。在高增长公司中,近一半(47%)正在积极地在生产中部署AI代理,另有42%正在试点或内部用例中试验AI代理。
即使在所有其他公司中,非高增长公司中也有大约三分之一(32%)正在积极部署AI代理,另有32%处于试点或实验阶段。我认为部署数量的32%很有趣,因为这与毕马威季度脉搏调查中发现的大型企业将AI代理投入部署的数量几乎完全相同,而这本身就比上一季度(仅为11%)有了巨大的飞跃。那么,公司是如何做出所有这些决定的呢?
简而言之,一旦公司达到一定的规模或大小,基本上是1亿美元,他们就开始更频繁地拥有专门的AI领导层。而且,规模越大,这个百分比就越高。他们正在招聘各种不同的AI特定角色,其中最重要的是技术角色,例如AI工程师和数据科学家。
但你也会看到仍然在招聘提示工程师、AI设计专家,AI产品经理是一个主要类别。46%的人表示他们招聘速度不够快,其中60%的人表示招聘速度太慢,原因是合格候选人不足。
有趣的是,公司最大的成本中心是人才。随着产品的扩展,这会随着时间的推移而下降,但它仍然代表着这些AI产品成本的一大部分。例如,在积极扩展其AI产品的公司中,其AI预算的36%用于薪资、招聘和技能提升。相比之下,AI模型训练占12%,AI模型推理占10%。
说到哪些成本最难控制,人们正在考虑很多事情。存储成本、训练成本、模型再训练、推理成本,都有40%到50%的受访者将其列为前三项最难控制的成本。但这个类别中遥遥领先的是API使用费,有70%的人将其列为控制成本的首要挑战。
现在,关于他们如何试图控制这些成本,有趣的是,尽管他们在模型考虑方面并没有特别重视开源,但有41%的人表示他们有兴趣转向开源模型以帮助控制成本。
现在,这项研究中一个真正有趣的事情,这可能与我们在企业领域看到的略有不同,那就是他们试图从AI使用中获得什么。到目前为止,追踪最多的投资回报率类别是生产力提升。75%的组织通过观察生产力提升来衡量AI的影响。另有51%的人关注成本节约。相比之下,只有20%的人在考虑收入增长。
现在,这与我们最近看到的毕马威季度脉搏调查结果不同,该调查发现46%的大型企业同样认为生产力和效率是AI的目标,而收入增长和新的机会也是AI的目标。我认为这反映了这样一个事实:许多这些公司只有几年的历史。
而那些传统企业有更多空间进行商业模式的颠覆和转型,这些公司只是第一次找到自己的商业模式。他们不处于转型和颠覆模式,但他们正在努力更有效地完成他们正在做的事情。内部AI生产力的预算预计在2025年将近翻一番,
公司平均为此花费的总收入在1%到8%之间。我发现一个非常重要且引人入胜的注释,这非常能反映我们在企业领域也看到的情况,那就是内部生产力AI的预算越来越多地来自研发和业务部门等现有领域,而不是来自某个创新预算。24年到25年之间,
来自创新预算的百分比从47%下降到23%,我认为这反映了从实验阶段到全面部署阶段的转变。本期节目由Blitzy赞助播出。现在,我与许多渴望实施尖端AI的技术和业务领导者进行了交谈。但他们的优秀工程师并没有构建竞争优势,而是陷入了现代化古老的代码库或更新框架的困境,只是为了维持运营。
这些项目,例如将Java 17迁移到Java 21,通常意味着要组建一个团队一年或更长时间。当然,副驾驶可以提供帮助,但我们都知道它们很快就会达到上下文限制,尤其是在大型遗留系统上。Blitzy改变了这种局面。
Blitzy的自主平台处理繁重的工作,处理数百万行代码并自动进行80%的必要更改,而不是工程师完成80%的工作。一家大型金融公司使用Blitzy在短短三个半月内对2000万行Java代码库进行了现代化改造,节省了30,000个工程师工时,并加快了其整个路线图的进度。
请将主题行中包含“modernize”的邮件发送至[email protected],以获得优先加入。在竞争对手之前访问blitzy.com。今天的节目由Plum赞助播出。你投入了大量时间,测试提示,改进JSON,以及在画布上整理节点。现在是时候为你的工作获得报酬了。
Plum是唯一一个专为希望将其AI工作流程产品化的技术创作者设计的平台。使用Plum,你可以构建、共享和获利你的流程,而无需放弃你的提示或配置。当你准备好进行改进时,只需单击一下即可将更新推送到你的订阅者。
在useplum.com(带B的plum)启动你的第一个付费工作流程,并开始扩展你的影响力。今天的节目由Superintelligent赞助播出,特别是代理准备情况审核。每个人都在努力弄清楚哪些代理用例将对其业务产生最大的影响,而代理准备情况审核是做到这一点最快最好的方法。
我们使用语音代理来采访你的领导和团队,并处理所有这些信息以提供代理准备情况评分、关于该评分的一组见解以及关于组织差距和应追求的高价值代理用例的一组高度可操作的建议。一旦你确定了正确的用例,就可以使用我们的市场来寻找合适的供应商和合作伙伴。所有这些加起来就是一个更快、更好的代理策略。
请访问bsuper.ai或发送电子邮件至[email protected]了解更多信息。
为了大力推销一下,这正是我们设计代理准备情况审核的原因。没有人想花大量时间来弄清楚究竟该如何使用这些工具,这些工具显然如此强大。他们只想能够使用它们来获得价值。这就是为什么我们试图缩短用例发现的时间,以便人们能够花更多时间来获得实际价值。现在,也许不出所料,公司使用AI越多,就会发现越多的用例。
对于超过50%的员工积极使用AI工具的公司,他们平均有7.1个不同的用例。
最受欢迎的用例可能是你想象中的那些。编码辅助占77%,内容生成和写作占65%,文档和知识检索占57%,产品和设计占56%,销售生产力占45%。一个可能低于你想象的用例是客户参与和客户服务,其中42%将其列为首要用例。但再一次,我认为这反映的是略微不同的公司群体,而不是它实际上并不那么受欢迎。
换句话说,这些公司在其生命周期中非常非常年轻。他们往往拥有不太成熟的客户服务组织。我认为这可能更好地解释了为什么他们不太频繁地部署该用例。
说到哪些用例对生产力的影响最大,绝大多数都看到了15%到30%的生产力提升。另一方面,编码辅助是影响生产力的首要用例。事实上,对于那些高增长公司来说,他们目前有33%的代码是由AI编写的。这比我们从谷歌和微软那里听到的还要多。但对于所有其他公司,即使是非高增长公司,
也有27%的代码是由AI编写的。这显然是迄今为止最大的突破性用例,并且目前正在产生巨大的影响。一个仍然是实验领域的领域是定价模式。36%的公司仍然主要使用订阅或基于席位的模式,而只有19%的公司使用基于用量的模式,6%的公司使用基于结果的模式,但混合模式现在是最受欢迎的类别,占38%。
我希望我们将看到更多关于商业模式的实验,并且我们将看到基于用量和基于结果的数字上升。事实上,37%的受访者表示他们确实计划在未来12个月内更改其AI定价模式,考虑诸如基于消费和基于结果的定价,以及考虑投资回报率。现在,这份报告的一个部分,我作为播客无法充分解释,但你绝对应该花一些时间去研究,
那就是标题为“AI构建者技术栈”的部分。在这里,他们查看了每个不同领域公司正在使用的工具。因此,对于模型训练和微调、大型语言模型和AI应用程序开发、监控和可观察性、推理优化、模型托管、模型评估、数据处理、向量数据库、合成数据、DevOps和MLOps、产品和设计。
如果你试图构建你公司技术栈,请查看构建者实际正在使用什么。我想至少在这个阶段提到的几个是,编码辅助是GitHub Copilot和Cursor之间的双雄争霸,近四分之三的开发团队使用GitHub Copilot,而Cursor紧随其后,有50%的受访者已经使用它。我们最近看到亚马逊的开发人员正在游说他们放弃内部工具,而改用Cursor。似乎这种情况也在更广泛地发生。
不过,我想提到的一个问题是,我们最近在这个节目中多次讨论过,那就是模型评估。当我们谈论AI工程世界博览会时,我们谈到了评估是如何成为构建者之间越来越热门的话题,但它仍然滞后,这似乎注定会在未来几个月成为关注的焦点。即使在构建者中,情况也确实如此。
关于模型评估的调查主要结论是,没有明确的独立领导者。事实上,20%的受访者不知道他们使用哪个工具进行评估,大约四分之一的受访者承认他们要么不知道,要么没有合适的工具。这种情况肯定会改变,并且代表着公司构建评估工具以及公司通过更好地进行评估来领先于竞争对手的巨大机会。
如果你正在寻找一个脱颖而出的投资领域,这是值得考虑的事情。说到脱颖而出,报告的最后一部分是对不同内部生产力用例中一些关键趋势的考察。我想说的是,最大的收获是现有企业确实具有优势。
例如,在销售生产力方面,一个关键趋势是:“许多团队直接从Salesforce获得其AI驱动的销售功能,这表明一种简单的途径是依赖现有CRM内置的推荐、预测和机会评分,而不是附加单独的服务。”在营销自动化方面,他们写道:“营销人员绝大多数都转向画布生成功能来创建符合品牌形象的视觉效果和快速的内容迭代。
使其成为营销堆栈中最常见的AI接触点。在客户参与方面,团队绝大多数都依赖Zendesk和Salesforce的嵌入式AI功能来进行客户互动,这表明轻松地插入现有的票务和CRM工作流程仍然优于采用独立的会话式AI平台。在更灵活和探索新解决方案的地方,如果说不是全新的,那么在AI领域是如此不同,以至于它确实开辟了新的机会,例如知识检索和文档。
尽管如此,这确实突显了所有这些垂直AI公司将面临多么大的挑战,他们必须与那些即使在初创公司中也根深蒂固的传统平台竞争。这份报告中还有很多内容。
而且我认为,如果你身处一家企业,正在努力检查并了解你的现状以及你的采用情况,这一点尤其重要。除了查看以企业为中心的调查外,还要查看这份构建者的报告。在某些领域,它可能会让你感到害怕,因为他们相对于代理部署而言领先了多少。但在其他领域,他们也面临着一些同样的问题。例如,帮助员工弄清楚如何实际使用这些工具。
这既证实了该行业发展速度之快,也证实了我们都在一起。即使对于那些正在构建技术的公司来说,许多这些转型也极其极其困难。正如我所说,我将在节目说明中包含这份报告的链接。非常感谢Iconic制作了这份报告。我认为它非常有价值。当然,还要感谢你们一直陪伴着我。下次再见。和平。