We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode How AI Agents Are Transforming Customer Support, with Decagon’s Jesse Zhang

How AI Agents Are Transforming Customer Support, with Decagon’s Jesse Zhang

2025/1/16
logo of podcast No Priors: Artificial Intelligence | Technology | Startups

No Priors: Artificial Intelligence | Technology | Startups

AI Deep Dive AI Chapters Transcript
People
J
Jesse Zhang
Topics
Jesse Zhang: 我认为AI代理在客户互动和客服方面具有最佳应用前景,因为大型语言模型非常适合处理这类任务。Decagon的AI代理特别注重透明性,让企业客户能够了解代理的决策过程、使用的数据以及答案的来源。AI代理的益处在于节省人力成本和时间,同时提高客户满意度,从而提升客户留存率和转化率。我们与Built Rewards公司的合作案例表明,AI代理能够帮助企业停止客服团队的扩张,并最终减少客服岗位数量,同时提升客户体验。Decagon的核心竞争力在于其构建在AI模型之上的软件层,包括模型编排和各种软件工具,以确保透明性和可控性。对于Decagon的AI代理而言,指令遵循能力比定量推理能力更重要。Decagon的AI代理支持多种沟通渠道,包括语音和文本,以满足不同客户的需求。语音模型的延迟仍然是一个问题,但可以通过各种技术手段来缓解,例如流式传输和语音到语音模型。许多来自数学竞赛背景的人才涌入AI创业领域,这与创业的普及以及这些人才之间的社区联系有关。Decagon与其他AI创业公司之间存在非正式的互相帮助和支持。数学竞赛背景在Decagon的招聘中起到一定的参考作用,但并非决定性因素。未来几年,我期待AI模型在多模态方面的进步,以及AI代理在各种应用场景中的普及,并关注人类在监督和编辑AI代理方面的工作变化。AI代理的成功取决于其易于逐步部署和量化投资回报率的能力。 Elad Gil: (This section would contain Elad Gil's viewpoints and supporting evidence if available in the transcript. Since the provided transcript focuses heavily on Jesse Zhang's perspective, there isn't sufficient information to construct a comparable response for Elad Gil.)

Deep Dive

Chapters
Jesse Zhang, co-founder of Decagon, discusses his company's AI-powered customer support platform. Decagon's platform is already used by major companies like Rippling and Notion, significantly impacting their customer service operations and improving customer satisfaction. The platform boasts tangible benefits such as cost savings through reduced headcount and increased efficiency.
  • Decagon provides AI-powered customer interactions for large enterprises and startups.
  • The platform has resulted in significant cost savings and improved customer satisfaction for clients.
  • A case study with Built Rewards showed a reduction of around 65 support agents.

Shownotes Transcript

今天在No Priors节目中,Decagon的联合创始人兼首席执行官Jesse Zhang与Elad一起讨论了代理式客户支持的未来。Decagon为Rippling、Notion、Duolingo、Classpass、Substack、Vanta、Eventbrite等公司提供AI驱动的客户互动。Jesse分享了创办Decagon背后的理念,为什么他认为客户支持是代理技术的理想切入点,以及哪些AI领域最让他兴奋。他们还讨论了基于语音的界面、当前能力中的延迟问题,以及年轻数学奥林匹克社区与当今AI初创公司之间的联系。每周注册新的播客。将反馈邮件发送至[email protected]在Twitter上关注我们:@NoPriorsPod | @Saranormous | @EladGil | @TheJesseZhangShow节目要点:0:00 简介0:30 创办Decagon3:15 为客户支持和客户运营采用代理的业务影响8:00 用于客户成功代理的AI基础设施和模型12:05 基于语音的功能和文本转语音引擎15:00 克服延迟16:25 数学和AI社区的交叉21:12 AI的令人兴奋的领域25:29 代理的优势和劣势</context> <raw_text>0 您好,欢迎收听No Priers。今天我和Decagon的联合创始人Jesse Zhang对话。Decagon是一家早期公司,致力于为客户支持构建企业级生成式AI。

该公司成立于2023年8月,其平台已被Rippling、Notion、Duolingo、ClassPass、Eventbrite、Vanta等大型企业和快速发展的初创公司使用。Jesse,欢迎来到No Priorities。当然。感谢你的邀请,Eli。当然。也许我们可以从你的背景和Decagon的工作开始。你是一位连续创业者。在此之前你创办了另一家公司,Antique Bot。

而且,你知道,现在你和Ashwin创办了Decagon,你们已经在这个项目上工作了一段时间,并且看到了一些来自Rippling、Notion、Eventbrite、Vanta、Substack等公司的非常有趣的采用情况。对。所以你已经真正为公司开辟了一个真正的空间。你能告诉我们更多关于Decagon做什么、如何运作以及公司关注点的信息吗?

当然,是的。关于我的简短背景。在博尔德长大,参加了很多数学竞赛,诸如此类。在哈佛学习计算机科学。正如你提到的,我大学毕业后就创办了一家公司。那家公司最终被Niantic收购,然后我离开去创办这家公司。我和Ashwin通过共同的朋友认识,正式是在一家风投公司的非正式聚会上认识的。当我们聚在一起时,我们想,好吧,

从第一家公司获得的最大教训是,你不能过度思考事情。我们一开始只是对AI代理感兴趣。这是一项非常令人兴奋的技术,可以说是这一代最酷的事情。我们只是与你列出的一些客户进行了交谈。我认为多年来,我们在如何与人们交谈以及提出哪些问题方面做得越来越好。

通过这个过程,我们最终确定了我们目前的用例,也许是我们认为这些代理的黄金用例,那就是客户互动、客户服务。这个用例非常适合LLM擅长的事情。所以我们从那里开始构建。对。我们仍然没有过多考虑,你知道,部门或其他任何事情。就像,好吧,我们面前有很多客户。我们如何才能让他们满意并真正喜欢我们正在构建的东西?

然后就导致了我们现在的处境。我想说的是,现在作为一家公司,Techagon,我们为人们提供这些AI代理,用于客户服务、客户体验方面。到目前为止,使我们与众不同的是,我们非常注重透明度。因此,当人们使用我们时,特别是这些大型公司,对他们来说非常重要的是,代理不是一个黑匣子。

他们觉得,好吧,即使LLM很酷,而且你可以用它们做很多事情,他们也可以看到决策是如何做出的,使用了哪些数据,你是如何得出答案的,如果我想获得反馈,我可以这样做,诸如此类。所以目前我们正在与许多拥有大型支持团队的大型公司合作。

所以几乎任何拥有相当规模的支持运营的公司都适合我们。这很有道理。这很有趣,因为我觉得过去一年AI领域真正引人注目的一件事是,Klarna的首席执行官在X上发布或推文谈论AI对其客户支持或服务团队的影响。Klarna是一种来自欧洲的先买后付服务。而且

你知道,他的推文基本上说,在最初的四周,他们处理了230万次客户服务聊天。客户满意度与人工相当。与人工相比,重复咨询减少了25%。它在两分钟内解决了客户的差事或问题,而人工代理则需要11分钟。而且他们立即在23个市场和35种语言中全天候提供服务,因为AI支持很多事情。所以,是的。

你知道,对那家公司产生了巨大的影响。我认为他们将700名全职代理调去做其他工作,对吧?就Klarna本身作为一家组织的影响而言。在你的客户采用这种技术时,你看到了什么样的影响?你如何通过你真正为这些客户带来的东西以及他们最终用户的满意度来思考?这是一种思考它的有趣方式,那就是,你知道,所有这些人都在交付这个用例,对吧?就像,你知道,有很多布道者,这很好。Klarna的文章很棒。该行业有很多顺风。我认为我们看到的一个有趣的事情是,人们获得的好处大致相同,但不同的人优先考虑不同的主题。

所以在这一点上,说几年后这些代理将变得非常普遍,这甚至不是什么热门话题。人们可以使用它们进行所有这些客户互动。它们将无处不在。所以正如你所说,好处是什么?对于我们的客户来说,它总是相同的。它是这种情况下的总工作量的一小部分,例如对话和代理。那么这能为我们节省多少工作?

然后第二,我们的客户有多开心?客户满意度评分是多少,MVS评分是多少?这两个通常是迄今为止的领导者。正如我之前所说,不同的人可能对每个人的评价略有不同。

然后还有一些其他的事情,比如,好吧,我们要确保准确性,对吧?如果我们在受监管的行业中,这对于我们来说必须非常准确。所以这就是好处所在。就像我们节省了很多钱。我们节省了时间和资源。但另一方面,我们也让客户更开心了。因此,这可以导致更高的留存率和更多的转化率。而且那里还有更多的好处。就像你基本上把每个客户的私人管家放在他们的口袋里。

他们可以随时随地、任何语言、全天候与之聊天。这对许多企业来说可能是具有变革意义的。你能否举一个客户的例子作为案例研究,说明这产生了什么影响,它如何提升了他们的指标以及他们使用Dekogon取得的成功?当然,是的。所以我们刚刚与一家名为Built Rewards的公司进行了一项大型案例研究。对我们来说是一个很好的用例。他们拥有非常庞大的用户群,并且发展非常迅速。你实际上可以使用它来赚取积分或进行支付。

我的很多朋友都在使用这款产品。然后,因此,因为你拥有庞大的客户群,所以人们会有问题,人们会有一些需要帮助的事情。因此,支持查询的数量基本上与用户数量成线性增长。正因为如此,因为他们发展如此之快,基本上呈指数级增长,这意味着支持查询的数量也在呈指数级增长。所以当他们第一次开始使用我们时,那就是主要目标。就像,天哪,我们被所有这些数量压垮了。我能帮你吗?

所以最终发生的事情是,是的,在开始使用我们大约一个月内,他们能够停止扩大团队规模。AI将接管很多自动化工作,使一切变得非常顺利。然后现在,基本上,我们已经快一年了。他们已经能够真正重组他们的客户支持团队。

再说一次,我们在案例研究中发布了这一点,他们能够量化,好吧,节省了多少,对吧?所以到目前为止,大约是65名代理的员工数量。

所以非常切实的区别。然后对我们来说,这也很好,因为我们能够在那里为他们提供价值。这就像一个非常容易获得投资回报率。但客户体验也快了很多。他们会收到很多社交媒体帖子,内容是,天哪,我刚刚尝试了奖励支持功能。这感觉不像我们以前使用过的任何AI或聊天机器人系统。所以这让我们很高兴。

你能否更多地告诉我你们从技术和基础设施的角度构建的内容?所以我想有一些核心模型是任何人都可以访问的,对吧?GPT-4,我在GPT-4的世界里,云十四行诗等等。然后还有你们在其之上构建的所有东西,以便使它能够很好地适用于你们的特定用例和客户支持代理。你能告诉我们更多关于你们随着时间的推移所构建的内容吗?当然。就像你说的,每个人都可以访问相同的模型。

我们非常把自己看作一家软件公司。我们显然在AI方面做了很多工作,并且大量使用了AI模型。但我认为现在大多数应用程序都是真正的软件公司,而AI模型是每个人都可以使用的工具。所以你构建的大部分alpha或大部分特殊的东西都在模型之上。你会看到编排层或围绕它的软件。

对我们来说,重点一直放在这两方面。编排层是你可以如何将所有这些不同的模型组合在一起。你可能已经设置了评估来衡量每个模型在某些方面的表现如何。你把它们放在一起,把它们放在一起的总体目标是围绕客户的业务逻辑来塑造它。这是第一部分。

你构建的另一件事就是非常经典的软件,对吧?你拥有这个AI代理,它就是我之前所说的所有事情,比如,你知道,透明度对我来说是一件大事,你真的不希望这感觉像是一个黑匣子,只是他们在回答问题,所以

你如何构建工具来查看,好吧,代理正在使用什么数据?它正在采取哪些步骤?我可以分析所有这些传入的对话吗?如果你有数百万次对话,就像,好吧,没有人会阅读所有这些。那么你如何才能让AI、LLM阅读每一次对话,告诉你事情进展如何,找出他们知识中的差距,给你一个细分,比如,好吧,这些是你应该关注的主要类别。出现了一种有趣的趋势。

所以这就是我们正在构建的围绕它的所有软件。这通常是它的结构。我认为编排层对于每个代理来说都是不同的,对吧?比如我们的代理与编码代理,编排看起来会大相径庭。但最终,你只是在LLM之上构建一种结构。是的。看来我们正处于真正代理式事物发展初期。这包括对包括某些推理形式的事件链进行排序的能力。显然,有一些像O1和其他东西已经出现,开始尝试解决这个问题,但我们似乎在扩展曲线上还处于相当早期的阶段。你认为哪些主要的科技缺失才能真正将你或你对下一级代理系统的愿景提升到一个新的水平?是的,所以我们前几天讨论的一件事是,AI模型实际上有不同类型的智能,最近O1或十四行诗等方面的许多发展都围绕着,我想,定量推理智能。所以他们在编码方面做得更好,他们在数学方面做得更好。对我们来说,这些东西确实有帮助,但实际上它们并不是最大的区别制造者。所以在我们的用例中,最重要的智能类型,我们可能会将其描述为指令遵循。所以你只需要一堆指令,比如,你能按照它到电视吗?我相信还有其他类型,但是……

对我们来说,我们很高兴看到其他领域的发展。人们,每个人都说,哦,核心模型和智能正在发生停滞。我认为当大多数人这样说智能时,他们可能指的是推理能力。对我们来说,以及我们使用的代理流程,指令遵循是一个非常重要的部分,因为你必须像,

你知道,想想客户服务,你知道,SOP或流程,或者类似的东西。你必须非常准确地做到这一点。所以我知道主要实验室正在进行关于这方面的研究。我认为这是我们明年期待的一件事。另一个似乎真正触及客户成功和客户支持以及用户体验的领域是基于语音的支持。

我认为AI领域中有一件事被低估了,因为我们一直在谈论大型语言模型和对文本的理解,而且显然这些东西对其他一切都很重要,但我感觉我们几乎低估了文本转语音引擎以及理解口语然后用音频回应的能力,对吧?所以有一些公司,比如Cartesia、11 Labs、OpenAI、谷歌等等,他们开始提供一些这些服务和API。这对你们正在做的事情有多大的影响?或者这是一种单独的产品类型?或者你如何看待这些东西的语音组件?好问题。巨大的影响。所以我们现在的客户正在尝试我们的语音代理。如果你只是考虑我们的空间,对吧,比如你

总体问题是相同的,即你有一群客户。他们有疑问、问题或需要讨论的事情。渠道对他们来说真的无关紧要。有些人喜欢语音。有些人喜欢聊天。有些人喜欢电子邮件。有些人喜欢短信或其他什么。所以我们的工作是处理所有这些。显然,你从文本开始,因为这是最简单的。这对于客户来说也很容易评估。

我认为现在你已经到了大型公司非常感兴趣语音的地步,而且他们已经看到了基于文本的代理的结果,他们想,好吧,是的,我们应该能够生成语音并对电话呼叫做同样的事情。如果没有你刚才列出的模型,这一切都是不可能的。对。那些公司,所以11 Labs、OpenAI正在做一些很酷的事情,Cartesia。

我认为今年这些模型在语音听起来有多逼真方面也取得了巨大进步。此外,延迟在我们的用例中非常重要,因为如果你正在拨打电话,你希望事情感觉非常迅速。所以,是的,对我们来说是一个非常非常重要的话题。随着这些公司变得更好,我的意思是,我们现在正与他们密切合作,了解他们如何

你实际上如何在规模上构建这些东西。但随着它们变得更好,这对于我们继续交付这些语音代理也至关重要。说得通。是的,我的感觉是,问题之一是延迟,就需要足够的时间来获取音频流或某人的谈话,将其翻译成文本,将其馈送到语言模型,然后再次将其输出为语音。

这感觉好像有很多停顿,或者人们必须等待。人们一直在尝试在后台做一些不同的事情,比如流式传输潜在的解决方案,然后能够尝试缩短这个延迟时间线。你认为延迟仍然是一个问题,还是通过更深入地将语音集成到这些服务的模型中来解决的?或者你认为延迟何时会成为这些应用领域的已解决问题?

我的意思是,延迟当然是一个大问题,当然,对于语音模型来说也是如此。所以现在,我们正在尝试使用语音到语音模型。OpenAI正在做很多这方面的工作。我认为显然有很多权衡。语音到语音的延迟很棒。但是,对于这些生产用例,有时你确实需要额外的计算周期。所以获取数据,进行多次模型调用,

或者可能还有其他原因导致你无法进行语音到语音的转换。所以,好吧,这是一个你可以考虑的选项。另一个是你描述的那个,你正在进行转录或语音到文本的转换,然后在文本中进行所有计算,然后在最后生成语音。

这当然会造成一些额外的延迟。正如你提到的,很多人已经想出了相当巧妙的方法来解决这个问题。你可以先开始生成东西。在我们的用例中,你总是可以做一些事情,比如,请稍等。我正在查找你的数据。所以这些都是我们正在尝试的事情。

我认为对于我们与之合作的每个客户来说,都有不同的权衡。所以我们真的试图根据我们从他们那里听到的东西以及他们所拥有的优先级来构建我们所构建的东西。这很酷。我认为一件有趣的事情是,如今AI领域有多少公司是由具有数学奥林匹克竞赛或IOI或其他背景的人创办的,对吧?我认为你是……

高中时参与了数学奥林匹克竞赛。我认为Decagon实际上为团队举办了一些数学奥林匹克竞赛活动,这不像你们典型的欢乐时光,但还有其他团队和公司。在此之前有Ramp等等,但我认为Brain Trust团队和PICA团队以及Cognition(Evan推出的)都有共同点。你认为这是从哪里来的?你认为为什么这个社区现在在AI领域如此活跃?这是一个好问题。我的意思是,我们实际上年龄也差不多。所以我们从初中、高中就认识了。首先,这是一个很棒的社区。对我们来说,我们团队中有很多人有数学竞赛、编码竞赛的背景。

我认为更多的是这个社区一直都在。数学竞赛已经存在了一段时间,并且有很多非常聪明的孩子参加。这也是人们互相认识、建立联系和建立友谊的好方法。我认为主要的是,在过去几年,也许是过去五六年,只是……

因为初创公司已经变得更加主流,所以很多这个群体的人转向初创公司,而不是传统上是学术界或量化交易等等。所以他们只是涌入了一大批非常聪明、非常有才华的人进入初创公司领域。由于存在这种社区方面,人们可以看到其他人正在做什么,以及什么有效,以及人们正在构建的公司的类型,这些公司是

我希望我没有说它们都一样,但我认为很多有这些背景的人现在都在从事初创公司的工作。这就是为什么人们一直在构建的公司有很多,你知道,我想,进步。你们有没有通过创业之旅互相支持的方式?因为我觉得每一代人,都会有一群人建立了一些更有趣的公司,他们都会互相互动。他们提供建议,也许他们会互相投资天使基金。就像每个五到七年,都会有一个蓬勃发展的社区,它会改变是谁。我觉得,你知道,IOI之类的数学奥林匹克竞赛社区或编码竞赛社区现在非常活跃。这方面有没有正式的版本,或者你们只是在非正式地互相帮助?

是的,我投资了你们刚才列出的很多公司的天使基金。他们的很多创始人也是我们公司的天使投资者。这显然是非正式的。只是朋友们互相帮助。我认为主要的是,在公司建设方面,有很多表面积,对吧?正如你所知,这就像,你如何招聘员工?你如何进行销售?你如何构建这个东西?你如何构建薪酬?我不知道。有无限的事情。

所以,是的,拥有其他数据点显然非常有帮助。所以我经常和他们一起出去玩,玩游戏,玩纸牌游戏。这是一种我经常与很多人一起玩的中国桥牌版本。而且这很有趣,你们都处于人生的相对相同阶段。所以,是的,就像你说的,确实有很多友情和帮助在流传。

来自数学奥林匹克竞赛社区的这种背景是否影响了你在Decagon的招聘或招聘实践?有一点。我的意思是,如果其他人有相同的背景,并且经历了相同的竞赛或项目,那么这显然是一个很好的信号,因为我对这些人做了什么有很好的了解。我的联合创始人Ashwin也有类似的背景。他不是在美国长大的,而是在印度,他也参加了很多这些竞赛。所以

是的,我认为那些从小就做了很多这些事情的人之间有一些关联。然后,你知道,现在我们都是成年人了,你知道,当你谈论招聘时,这里有一些信号。但在大多数情况下,就像有很多有才华的人在这里,无论你是否参加过数学竞赛。

NSF,你知道,在Declan,在其他公司,我认为我们的招聘流程或多或少都是一样的。这是一种很好的活动触发器,我想。所以当你举办这些活动时,你知道,人们会出来,你可以得到一群对相同事物感兴趣的人。我们将举办更多活动,并非所有活动都将基于竞赛,显然,比如,你知道,谜题等等,在那里你可以得到很多有趣的工程师和人们带来他们的朋友。这对我们来说非常重要。

然后我想对于AI来说,在未来几年你最兴奋的是什么?或者如果你要推断出12到24个月,你最期待的是什么?或者你在等待什么?

所以显然,模型变得更好很棒。模型在不同模式下变得更好,也很好。我们谈到了语音。还有其他部分,其他模式也与我们间接相关。所以你谈到了很多我们的公司——我们的很多客户都有软件产品。所以如果你是向AI代理提问,并且它拥有你整个屏幕以及你所做所有互动的上下文,那就太好了。这将是很棒的。你甚至可以更进一步,让它

实际上帮助你导航东西,所以你可以做很多事情,在那里你谈论其他模式,甚至只是更高级的模型能力,比如我们从Anthropic看到的计算机使用演示,在我看来,目前还没有准备好投入生产,但随着它的改进,你可以做很多,你知道,很酷的事情,所以模型方面是我们兴奋的一件事,不是核心模型方面,我认为我们有一个论点是,

随着时间的推移,再次,AI代理,我认为在这一点上,不可否认的是,它们将会有一个合理的爆炸式增长,在许多不同的用例中使用。我认为有些用例比其他用例需要更长的时间,但它们提供的价值是相当不可否认的。所以肯定会有很多AI代理出现在世界上,在我们的用例中,客户服务和其他用例。

但我们有一个论点是,人类代理和我们这样的人的工作性质也将发生相当大的变化。将要改变的一件事是,将会有更多的人监督和编辑代理。所以这是我们考虑的事情。我们期待那里的许多创新,因为现在,很大一部分,就像我之前说的,我们关心的是让人们

你知道,我们客户的人工代理和他们的领导团队可以进入并进行更改,并且像拥有很多可见性和控制权一样监控代理。那是什么样的呢?对吧。如果你把它与人类进行比较,如果你正在监控一个人,你可以实时给他们反馈。你可以说,哦,不,不,不要这样做。你做错了这件事。下次请这样做。

当你这样做的时候,AI在这里有很多不同的可能性,因为你知道它们有一些与人类不同的地方,对吧?它们是无限可扩展的,它们是……你可以……你可以硬编码一些东西,所以……这可能是明年我们期待的另一个领域,这真的很酷,而且……你是否认为这是相对于市场上其他提供客户成功和支持的公司的主要差异化领域?

是的,现在这可能是最大的事情,当我们……关于我们这个领域有趣的事情是,我认为这可能适用于很多AI代理领域,那就是结果是可以量化的,就像你基本上在使用代理,并且你可以对照,好吧,人类的表现如何,以及这能为我节省多少钱,客户体验的质量有多好

因此,当人们评估我们所在领域的公司时,评估方法相当量化。人们会说,好吧,这东西还不错。让我先在 1% 的业务量上试用一下,然后逐步增加,或者也可以尝试其他方案。或者,你知道,像 Salesforce 这样的老牌公司也会认为这是一个非常令人兴奋的领域。所以他们也会有替代方案。然后你只需要对所有人进行基准测试,对吧?比如,统计数据如何?指标如何?每个人的工作做得怎么样?

我认为到目前为止,我们的表现非常好。其主要原因在于这种透明性,即为人们提供可观察性、可解释性和对 AI 的控制权。而在这个领域还有很长的路要走,对吧?还有很多事情可以做。到目前为止,这是我们的专长。这很好。我之前与您的客户进行过一些对话,随着人们开始尝试这些代理,他们会打电话给我,询问有关该领域不同公司的问题等等。他们倾向于指出的三件事是:你们交付速度非常快。

你们的团队和公司反应非常迅速。但第三,也是最重要的一点,产品往往表现优异。所以,我认为随着时间的推移,看到这一点真的非常棒。您如何看待 AI 代理在短期内成功与不成功的领域?基本上,我们一直在思考的一件事,这在我们刚开始创业时对我们来说非常重要。

那就是不同类型的代理之间存在巨大的差异,它们成功的程度以及推出速度会有很大差异。因为当我们刚开始创业时,我们对要构建什么持开放态度,我们知道代理技术令人兴奋。那时,我们甚至不知道未来 12 个月或 24 个月内是否会出现任何实际的用例。但我们一直在探索。

我认为我们的观点是,对于目前绝大多数用例来说,由于很多原因,目前的模型还无法实现真正的商业应用。其中一个重要原因是,在许多领域,实际上并没有逐步构建的结构。它必须一开始就很好,几乎完美无缺。

如果您考虑一下安全之类的领域,好吧,您有所有这些模拟器,这很有道理。有很多日志,这非常适合 AI 模型。但是这项工作的目标是,您需要捕捉发生的任何小事情。因此,由于模型本质上是非确定性的,买家很难真正信任那里的 Gen AI 解决方案。

尤其是代理解决方案。所以我认为这个选项的进展会非常非常慢,比人们想象的要慢得多,即使人们有很酷的演示,并且,你知道,看起来似乎有效,但真正进入成熟选项可能非常缓慢。这就是我们一直在思考的一个有趣的事情。另一方面,也有很多领域,表面上看起来像是,哦,这在这里很完美。

但是后续的问题是,实际上很难量化正在发生的投资回报率。我会举一个例子,比如,有很多文本到 SQL 公司,诸如此类的东西,你可以看到它有效。但基本上,每个人的第一反应都是,哦,这很酷。但是,你知道,我们仍然需要有人监控和编辑它。所以它变成了一种副驾驶。

好的,那么我们该如何衡量我们应该为这些代理中的一个支付多少费用呢?这非常困难,因为大多数团队并没有那么多数据科学家。因此,如果您声称您拥有一位 AI 代理数据科学家,那么,好吧,让我们将您与真正的科学家进行比较。您可能无法取代真正的科学家。所以我认为这就是很难量化投资回报率的地方。你节省了一些人的时间,但是

正因为如此,如果我是一家大公司,我很难证明,好吧,我要给你一份关于这个 AI 代理数据科学家的巨额合同。我认为这些是我们一直在思考的事情。我们不是在思考。目前,我们显然只是在询问客户他们愿意投资某些事物的意愿。但事后看来,我认为我们在回顾过去一年。这是一个很大的……

一直存在的事情,那就是出现的用例必须具备这两个特性:它必须能够缓慢推出,不必一开始就完美无缺,但它已经提供了价值,我认为编码代理就是一个很好的例子,你可以为它们划分一些任务,然后它们就会完成这些任务。

另一个方面是投资回报率。您必须能够轻松地量化投资回报率。在我们的案例中,幸运的是,您拥有支持代理团队,并且人们会非常密切地跟踪指标。所以这是我们一直在思考的事情。我认为由此得出的结论可能对近期许多 AI 代理用例更为悲观。但我认为,随着这些模型的改进,它们将解锁许多新的用例。

非常有趣。Jesse,非常感谢您今天加入我们。非常感谢。感谢您的主持。很高兴见到你。在 Twitter 上关注我们 @NoPriorsPod。如果您想看到我们的脸,请订阅我们的 YouTube 频道。在 Apple Podcasts、Spotify 或您收听节目的任何地方关注该节目。这样您每周都会收到一集新剧集。并在 no-priors.com 上注册电子邮件或查找每集的文字记录。