We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
C
Chris
投资分析师和顾问,专注于小盘价值基金的比较和分析。
E
Eddie
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
主持人: 我们团队开发了一个语音代理,用于自动化顾问咨询,以提高代理准备审计的效率。这个语音代理可以同时采访很多人,提高信息收集效率,这在以前是无法实现的。 Eddie: 对于特定业务流程,现成的语音代理产品很少能完全满足需求,通常需要定制化开发或集成。为了使语音代理更有效,需要对底层模型进行定制化开发,并添加辅助代理来控制对话流程,例如,我们开发了一个独立的子代理来评估对话并选择下一个问题,以及一个“漂移检测器”子代理来监控对话并进行干预,防止语音代理陷入无意义的对话。语音转录模型和核心模型可能存在不一致,也需要处理这种情况。为了更好地控制语音代理,需要建立多种评估指标,但评估语音代理访谈质量很难,因为“好的访谈”本身就是一个主观概念。为了提高用户体验,可以赋予用户更多控制权,例如允许用户跳过问题或选择问题。在实验室环境中评估语音代理的可靠性非常困难,需要结合实际用户测试,评估语音代理需要找到合适的平衡点,既要进行实验室测试,也要考虑实际应用中的意外情况,例如用户情绪激动或中断对话。 Chris: Fractional AI 的核心业务是帮助非AI公司利用生成式AI改进运营和产品服务。语音代理技术日益成熟,应用场景广泛,且用户体验良好。语音交互适合收集开放式、非结构化的信息。语音代理技术对咨询行业有颠覆性影响,但同时也解放了咨询顾问的时间,使其专注于更高价值的工作。AI擅长处理重复性工作,从而解放人力,使其专注于更高级的任务。企业应该将语音代理视为能够代替人工完成工作的工具。语音代理的应用场景广泛,例如处理电话呼叫、进行市场调研等。在实际应用中,语音代理需要处理各种意外情况,例如用户情绪激动或中断对话。

Deep Dive

Shownotes Transcript

在本集中,来自 Fractional AI 的 Eddie 和 Chris 讨论了构建实用的语音代理。他们分享了现实世界的例子、解决的问题以及关于开发语音系统的宝贵见解,包括如何使用户体验无缝衔接、处理意外交互以及公司今天成功利用语音代理的方式。查看 Fractional:https://www.fractional.ai/获取无广告 AI 每日简报:⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://patreon.com/AIDailyBrief⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠由以下公司提供:KPMG – 请访问 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://kpmg.com/ai⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 了解更多关于 KPMG 如何通过我们的 AI 解决方案帮助您创造价值的信息。Vanta - 简化合规性 - ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw⁠⁠⁠⁠⁠⁠⁠⁠Plumb - AI 专家自动化平台 - ⁠⁠⁠⁠⁠⁠⁠⁠https://useplumb.com/nlw⁠⁠⁠⁠⁠⁠⁠⁠来自 Superintelligent 的代理准备情况审核 - 请访问 ⁠⁠⁠⁠⁠⁠⁠⁠https://besuper.ai/ ⁠⁠⁠⁠⁠⁠⁠⁠申请贵公司的代理准备情况评分。AI 每日简报帮助您了解 AI 中最重要的新闻和讨论。订阅 AI 每日简报的播客版本,无论您在哪里收听:https://pod.link/1680633614订阅时事通讯:https://aidailybrief.beehiiv.com/加入我们的 Discord:https://bit.ly/aibreakdown </context> <raw_text>0 今天在 AI 每日简报中,我们将研究构建语音代理的案例。AI 每日简报是一个每日播客和视频,内容涵盖 AI 中最重要的新闻和讨论。要加入讨论,请关注我们节目说明中的 Discord 链接。

今天,我们将做一些与众不同的事情,而且我对此非常兴奋。正如你们可能听说过的,在过去的六个月里,我们在 Superintelligent 团队一直在开发一个语音代理,它实际上是我们作为代理准备情况审核的一部分部署的一种新型自动化顾问的核心。代理准备情况审核是一个流程,我们通过这个流程进入公司内部,采访员工关于 A,他们目前参与的所有 AI 活动和代理活动,以及 B,更广泛的工作。

目标是根据他们的同行和竞争对手,对他们的 AI 和代理使用情况进行基准测试,并规划他们实际部署代理以获得价值的机会。我们做到这一点的核心部分是我们开发的一个语音代理,它可以同时、按需、全天候地采访数十、数百甚至数千人,从而完全解锁了一种比顾问以前拥有的任何方法都更具差异化的信息捕获能力。

今天,我们将与我们的合作伙伴 Fractional 谈谈,他们一直在帮助我们构建这项技术,以对实际构建语音代理的过程进行案例研究。这是一个非常引人入胜的过程,我们很高兴分享一些经验教训,尤其因为我们认为这项技术中的许多人可能会在未来几个月或几年内将其用于自身目的。好的,Eddie、Chris,欢迎来到 AI 每日简报。你们好吗?

很好。太棒了。感谢你们的邀请。是的,这将是一次有趣的经历。我的意思是,我们讨论的是你们已经构建的东西,我们一起构建了很多版本。我认为,这与我们通常的内容有点不同,因为

与仅仅谈论理论上市场上正在发生的事情或人们理论上正在构建的东西不同,我们实际上是在谈论我们已经上线并进行了一些实践的东西,这么说吧。因此,为了开始,也许你们可以简要介绍一下 Fractional 和你们自己,以便人们在深入探讨之前了解相关背景。是的。我是 Chris,Fractional 的首席执行官兼联合创始人。这项业务背后的基本论点是,整个 AI

浪潮中最大的赢家将是非 AI 企业,也就是那些可以使用生成式 AI 来改进其运营、产品和服务的普通公司,而这些公司需要帮助。他们尤其需要来自能够将这种神奇的“幻觉”成分转化为生产级系统的顶级工程师的帮助。因此,Fractional 的目的是将这些工程师聚集在一个房间里,让他们一起从事生成式 AI 项目,

并互相学习最佳实践,从而建立世界上最优秀的工程团队。从第一天起,这就是我们的愿景。而且一切都在按计划进行,对于一家初创公司来说,这总是令人兴奋的。我认为这是我们整个职业生涯中第一次出现这种情况。

所以这很棒。与你和你的团队一起开发语音代理非常有趣。太棒了。Eddie,也许我可以通过我的第一个问题来稍微介绍一下你,以便做好准备。我认为我们今天主要想谈谈将语音代理投入生产的过程。我认为我们已经学习了很多东西。我们在实践中不断学习新东西。但也许首先,

我认为从宏观角度来看,当涉及到考虑 AI 转型的企业客户时,我们总是要处理的一个大问题是购买与构建的问题,对吧?我想知道,你们在第一线处理这个问题。在这个时候,这是否是思考问题的正确方法?尤其是在涉及代理时,

实际上是否存在严格的购买与构建等级?所有的一切是否都只是构建的某种范围?例如,你认为代理的购买与构建的现状如何,尤其是在公司考虑进入代理领域时?

是的,我认为一切都在某个范围内存在。我认为,对于非常适合代理解决方案的工作流程或产品功能,你很少能直接购买现成的产品就能正常工作。现成的产品非常适合通用的生产力工具,以及诸如深度研究之类的通用工具,这些工具非常棒。但是,当涉及到企业中特定的定制工作流程时,

我认为存在一个范围,即我们是完全从头开始构建?我们是在构建现有市场上良好、强大的新基元之上?我们是否正在进行一些构建工作,只需要集成现成的工具?但我认为很少看到现成的工具能够很好地替代现有的人工工作流程。

是的。这正是我们的经验。一切都在某种程度上是构建的,即使只是定制的。因此,有了这个背景,你们现在有机会花大量时间思考语音代理,深入研究语音代理。市场上显然对语音代理产生了共鸣。很多人正在发现很多不同的用例。你对原因或归因于什么有什么看法吗?

我认为这项技术已经得到了很大的改进。我认为应用程序是显而易见的。任何拥有某种呼叫中心或在其业务中存在与语音相关的瓶颈的企业都在关注这项技术,因为我认为应用程序是显而易见的。

广泛而明显。而且技术终于成熟了。如果你有在野外与其中一个东西交谈的经验,到目前为止我只有几次,但它们开始变得越来越频繁。每次我都会对作为消费者所获得的愉快体验印象深刻。因此,我认为我们将开始看到这些东西无处不在。

此外,我认为语音非常适合某些类型的数据收集。我认为你将在用例中看到这一点。我们将在稍后深入探讨 Super 的用例。当你进行研究以了解大型公司内部的情况时,你会做的一件事就是去采访人们并向他们提问,而不是仅仅向他们发送调查问卷,这是有原因的。固定数据输入类型任务

不适合许多需要大型开放式响应的情况,并且希望人们能够随意表达,并且能够在思考中实现,诸如此类的事情在语音中非常自然地发生。正如 Chris 所说,这项技术终于达到了我们可以开始处理以前只有人工访谈员才能完成的工作的地步。是的。

是的,我认为这很有趣。因此,作为背景,我们将讨论我们一直在合作的语音代理,这是一种数据收集体验,对吧?它旨在捕捉人们当前工作流程、当前 AI、用于帮助我们向他们推荐其代理机会的信息,这是核心思想。出发点,这个想法的中心起源是

A,正如你所说,Chris,这项技术已经足够好了,对吧?你实际上可以让代理采访人们,而且它做得相当不错。并非现成的,正如我们将看到的。我们必须进行大量的开发才能使其工作,但仍然,其功能是存在的。第二点,我认为,Adi,这是你刚才谈到的,它实际上不仅仅是与人工等效物一样好的体验,而是

有很多理由推荐它作为一种更好的、实际的、更好的体验。首先,能够通过语音收集信息并让人们交谈而不是让人们打字,对于许多人来说,如果不是大多数人,这要容易得多,他们可以随意谈论某事,而不是坐下来,试图收集他们的想法,试图组织它并打字。无论如何,它都快得多。

对吧?如果你让人们交谈,那么每单位时间的获得的信息量将会高得多。所以这是第一点。其次,能够按需、按自己的时间安排进行采访,无论何时何地,也许是在上班的路上,无论何时何地,例如凌晨 4 点,你无法醒来,而不是必须安排人工采访,这同样也是,这并非 1 倍的改进,而是 10 倍的便利性改进。因此,我认为这两点结合起来,即技术

技术已经到位,而且它实际上是一种更好的潜在体验,这使得巨大的差异。当然,这正是我们进入时的见解。是的。除此之外,你无需雇佣数千名顾问团队来进行你们想要的采访。

是的。事实上,有趣的是,也许可以回到这一点,但是,我已经与许多顾问进行了交谈,在构建了这个之后。一方面,它至少对他们试图做的事情的一部分具有相当大的破坏性,对吧?这是顾问们为此类数据收集收取大量费用的东西。有趣的是,我不断遇到的是,

顾问们并不认为他们的价值,他们的主要价值在于收集信息。这就像他们拥有的专有知识和经验,他们分析信息的方式。因此,他们实际上非常看好。他们不希望强迫他们的客户将大量预算用于数据收集。他们宁愿能够将其用于实际处理、分析以及接下来如何处理它,对吧?因此,即使这部分在理论上具有破坏性,我认为它也是

也可能改变我们看待该行业发展的方式。我认为还有一些大量的见解可能没有被那些咨询场景中的许多内容所捕捉到,仅仅是因为你受到只能进行 10 次采访之类的限制。而如果你能够同时进行 1000 次定制采访并能够处理从中返回的数据,那么你能学到什么呢?

重点不在于顾问们想做什么,也在于此。这就像我们在几乎我们做的每一个项目中都广泛看到的。这是那些重复性的工作,这些工作会占用你想要在待办事项列表中完成的高阶任务的时间,而这些任务没有时间去做,而 AI 非常适合这些任务。而且我们经常发现这种确切的动态,即我们正在自动化人们只是理解的东西。

撞墙,做很多次,而且它不是超级刺激智力的,那种东西。我们可以委托语音或文本,并让人们去做高阶任务。太棒了。那么,让我们深入探讨一下实际构建语音代理的过程以及我们学到了什么。所以,Eddie,我不确定从哪里开始是正确的,但我让你从这里开始深入探讨。

是的,当然。所以,你知道,我认为你刚才正确地指出了,技术是存在的,但这并不意味着它可以直接使用,或者说你不需要在这里做很多定制工作。在这个用例中,我们真正依赖的技术是构建这个采访代理。顺便说一句,这个代理在实践中的工作方式是,我们用一组采访问题和目标来配置它。所以这里有一些我们希望让人们去做的事情。这是我们询问他们的原因。我们优先考虑这些目标。这就是这个非常代理的系统的输入,然后它负责决定我该如何措辞这些问题?我什么时候跟进?我接下来问什么?我什么时候达到了我的目标?

所以它有很多代理权。它高度不受约束。我们现在可以访问的现成技术,这里有几种不同的替代方案,但我们为这个项目选择的一种是 OpenAI 实时 API,它具有强大的实时语音功能。它有很好的、逼真的声音,听起来很像人,而且它在能够即时做出决策方面也很聪明。

如果你只是向该模型提供一个单一的提示,告诉它关于采访和它可能要问的问题,我的意思是,你会得到一个非常酷的结果,但你会发现它总是偏离轨道。它会问奇怪的问题。当它跟进时,很难调整。如果你的唯一控制机制是一个巨大的单一提示,

你的手真的被绑住了。因此,我们很快发现,虽然它运行了一些采访效果很好,但它运行了一些采访效果很差,我们对接下来发生的事情的控制非常有限。因此,它失败的一个领域是

它并不总是能聪明地选择在什么时候问什么问题,当我们预先告诉它所有问题时,它将决定何时、哪个问题是下一个问题。因此,我们最终做的是抽象出一个完全独立的子代理。它像在后台并行运行一样,评估对话。这项任务的全部内容是,如果我们现在要继续下一个问题,我们应该继续哪个问题?然后核心代理只是被告知,这是你现在正在处理的一个问题和目标。

所以这是一个例子,说明我们如何将这个东西从偏离轨道带回到正轨。我们添加的另一件事是这种,我们称之为漂移检测子代理。我认为有一段时间我们称它为兔子洞检测器。这些大型语言模型非常,你知道,渴望取悦。他们真的,与大型语言模型互动很多的人,知道一个大型语言模型的个性,对吧?所以我们有点像卡住了,

我们希望它提出后续问题。我们不想限制它永远不要提出后续问题。但是,如果你给它一点绳子,最终会发生什么,你知道,无论你说什么,它都像,“哇,你的工作太有趣了。太疯狂了。告诉我更多关于那方面的信息。”只是不断挖掘。

因此,我们最终做的是添加这个整个侧流程,它监视对话,并进行评估,好吧,这个东西是否偏离了轨道?我们是否走在了正确的道路上?我们是否应该在幕后强制进行工具调用以强制继续下一个问题?因此,有很多这样的子组件构成了整体的大型代理体验,实际上是一堆子组件。但也许更令人惊讶的是,任何深入研究语音的人之前都见过这种情况,但我认为这对很多人来说是令人惊讶的,

我们在这里想要做的一件事是展示一个令人愉悦的 UI。因此,这实际上增加了很多约束。一个约束是你需要知道正在问什么问题。这样你就可以在屏幕上显示一个小复选标记。你需要知道你接下来计划做什么。因此,这实际上在幕后增加了相当多的复杂性。这影响到事情的一个领域是显示成绩单。所以,像,

我们想显示到目前为止发生的事情的书面记录。事实上,如果他们愿意,我们甚至希望用户能够通过文本进行交互。OpenAI 模型实际上使这变得非常容易。它们返回带有 JPI 响应的音频后续和到目前为止发生的事情的记录。问题是该记录是由一个单独的模型生成的。它是 Whisper 在侧面运行,只是进行基本的语音转文本。核心模型和记录模型可能彼此不一致。

我认为你可能有过这样的经历,你像在这些采访中的一个,有一个打喷嚏或咳嗽之类的事情。我认为核心模型做对了。它就像,“保重”。但是,记录的输出只是像代表底层训练数据随机的东西。就像它说的,“别忘了点赞和订阅”,或者它会用韩语说出来之类的话。是的,我们有很多像随机背景噪音变成外语切换的情况。是的,是的,完全正确。所以有很多东西可以使这个东西保持在正轨上,对吧?

结果之一是,你现在有很多不同的旋钮和杠杆。你可以调整核心提示。你可以调整你正在使用的模型。你可以更改你正在问的问题。你可以更改目标的措辞和大量的自由度。我的意思是,这很好,因为你现在有很好的基元来控制你的采访,但它很可怕,因为你知道,任何事情都可能发生,你不想在用户面前测试所有这些,这些 AI 项目通常,嗯,

在你的开发过程的早期,构建强大的评估绝对至关重要,你知道,某种自动生成指标的方法来告诉你你的表现如何以及你想要了解的关于你的问题的所有关键内容。

这太难了。就像语音一样,它是开放式的。没有真正像伟大的真理来源一样。像,我不知道。你在项目的早期是否考虑过真理会是什么样子?我的意思是,对我来说,我想,我们能否收集一组人工访谈的录音?即使我们这样做了,我甚至不知道我们将如何处理它。是的。我的意思是,为了用非常简单的语言重新表述这个问题,好的采访听起来、看起来、感觉如何?

事实证明,一旦你深入研究,它就像,“哇,这真的很主观”,因为它就像,“这是一个好的采访,因为它获得了好的信息吗?”“这是一个好的采访,因为它得到了提示吗?”“这是一个好的采访,因为它没有让你拖得太久吗?”“这是一个好的采访,因为人们不必重复自己吗?”你知道,它可能是所有这些事情。你还要加上仅仅是人为差异的层次,就像我们一样,你知道,例如,我们现在正在与一家主要的制药公司进行现场直播,

与每个部门的每个人,250 个不同的个性进行相同的采访。对他们来说,什么是好的,在仅仅从人类偏好角度来看之前就已经高度可变。所以是的,我认为这实际上是一件非常具有挑战性的事情。我认为我们所做的一件事,我知道你将用评估来采取不同的方向,但即使回到体验随着时间的推移而发展的方式,

是我们添加了更多旋钮。基本上,我们使体验更易于控制。基本上,使用户体验更好的捷径是赋予用户更多修改体验的能力,对吧?所以,你知道,正如你刚才所说,Eddie,一开始,如果你非常开放,事实上,我鼓励人们尝试使用语音代理的一个很好的用例是,你越愿意让 AI 漫游,你就能获得一些真正有趣的东西。

对我们来说,我们受到很大的限制。我们真的需要回答一组问题。有一些排序很重要。因此,我们最终,我认为对于这个特定项目来说,一个重要的时刻是创建了一个界面体验,人们可以通过该界面

从不同的问题跳转到问题。所以,你知道,我们已经添加了一个跳过或停止按钮,但我们想走得更远。我们觉得我们必须走得更远,那就是,“我想看看所有问题,说,我不关心所有这些,但我确实想回答那个问题。”所以,你知道,有很多不同的方法来回答它,但是,你知道,它很快就会变成一个产品设计过程。是的。而且,

你想知道,关于什么构成了一个好的采访,你想在一个实验室环境中知道你会进行好的采访。我认为你之前关于何时构建、何时购买的问题,实际上语音代理是一个领域,有很多很棒的工具正在出现。有一家公司,Bland AI,浮现在脑海中。他们为设计语音代理制作了一个很棒的产品。他们使将语音代理放在电话上以设计对话流程等变得非常容易,

但我认为就采用而言,采用发生在人们愿意从真实用户对话中即时学习的地方,当它偏离轨道时。在实验室环境中确保你确信当我将其发送到财富 500 强公司进行采访时,我不会做任何愚蠢的事情的工具,获得这种信心真的非常困难。我们在这个项目中最终做的是,我们构建了这个用于创建合成对话的独立系统,我们收集所有这些关于我们认为我们会采访的真实人物类型的书面角色。这是一个营销人员,这是他们使用的工具,这是他们与之互动的人,诸如此类的事情。我们写出这种角色,然后我们让一个单独的大型语言模型扮演假客户的角色。我们在文本领域进行这些采访,在文本中,我们的代理正在采访这个假用户,然后我们之后测量关于对话的大量内容。

你之前问过,你知道,是什么构成了一个伟大的对话。我们在这个项目上花了大量时间试图定义它。而且,我们最终得到了所有这些我们生成的指标,它们都不完美,对吧?就像你必须……

对于所有这些评估类型的问题,你必须找到 80-20 的原则,我不希望花费所有时间来开发一个完美的实验室指标来衡量什么是完美的对话,因为有很多东西是你直到进入野外才会知道。我认为我们有过这样的经历,有人在对话中途开始用德语与它交谈。幸运的是,它只是起作用了,但我们在实验室里不会猜到这一点。

是的,你知道,为了增加这一点的复杂性,只是为了说明,你知道,我认为我的感觉是我们学到了很多东西,我们解决了很多问题,但是会出现新的问题。我认为一个持续的挑战是评估,我们有一个很棒的,你知道,一个很棒的工具套件来测试,例如,看看不同的角色可能会如何互动。

但是 AI 仍然默认假设所有这些角色都会真诚地参与完成采访所需的时间。而像在我们测试的前三次采访中,一位首席执行官在第四个问题中途开始咒骂这个东西,然后退出。顺便说一句,他最终回来了,这是一个非常有用的采访。所以一切都解决了。但是,

AI 并没有,合成测试人员并没有认为根据他们的个性冲出房间作为他们测试的一部分。是的,我不知道你是否做过这个,但有时我只是觉得很有趣,进入 ChatGPT 并试图获得最后一句话。而且它永远不会发生,对吧?你说,好吧,再见。它就像,“好吧,再见。”每次,他们都不会放弃。但我确实认为,像调整底层一样,通常你使用这些评估只是为了构建测试。

软件。就像你正在编写一个自定义工作流程,你相当了解好的样子。然后问题是,我们的系统好吗?在这里,你就像在设计一个采访的同时设计一个可以支持采访的系统。自由度的数量非常非常高。我认为这在任何语音和任何对话方面都是常见的。像,你知道,正在开发 ChatGPT 的开发人员

他们的工作是弄清楚,我们是否进行了良好的对话?你知道,我们搞砸了吗?这些都是非常模糊的事情来衡量。是的。你知道,我认为,对我来说,一种经验和教训是,这很有帮助,尤其因为我们的用例实际上是帮助人们弄清楚在哪里,你知道,部署代理或考虑哪些代理用例。

我们真的,你知道,对代理的确切含义有各种不同的定义。但我倾向于回到我认为企业认为它非常非常清晰和简单的方式,那就是,

AI 是我用来改进工作的工具。代理是,你知道的,为我工作的工具。在语音代理的背景下,这一点非常清晰明了,我们将客户交给它,让它提出我们需要获取信息的一系列问题,而我们无法干预它是否偏离轨道或做得不好,或者,你知道的,这只是一件小事。它,你知道的,风险并不大,但最终我们让代理来进行面试,

这与我们使用 ChatGPT 来准备面试之类的活动截然不同。事实证明,艾迪,我认为这部分是你的观点。一旦你允许某个事物去做这件事,自由度就会比普通的软件体验大得多。即使在相对受限的环境中,比如我们真正需要你回答 20 个问题。

是的,我认为现在每个人心中都有一个问题,那就是什么是代理?每个人都有自己不同的定义,不同的问题框架方式。这在现在的对话中是一个热门话题。我认为我们都同意这是一个高度代理的例子,我认为这很明显。我们倾向于认为代理是一种频谱。有些代理性较弱,有些代理性较强。而且,

有一些子属性会导致某些事物感觉更具代理性。例如,其中一个因素是任务的开放程度如何?在这里,它是完全开放的,对吧?比如你被安排了一次面试,但你可以真正改变你的做法。另一个是它的复杂程度如何?我们有一些开放式任务,但任务是垃圾邮件检测。最终结果就像,你知道的,这是垃圾邮件还是不是垃圾邮件?这个是超级开放式的。你定义的目标非常广泛。是的。

然后最后一个是,我认为你刚才谈到的,那就是最终是谁在采取行动?是否有某个幕后系统最终向某人提出建议?在这种情况下,没有,对吧?就像没有人坐在那里观看面试一样。这个人直到你审查面试结果并试图将其综合起来时才会参与进来。即使那样,我认为这也在待办事项列表中,准备下一步解决,对吧?我们将继续推进,看看我们可以在这个过程中应用代理的多少地方。

因此,当我们放大来看,经历了这段经历之后,显然你同时承担着大量不同的项目。这让你想到了什么?你对语音代理的其他用例感到兴奋吗?你认为公司应该认真考虑这些问题吗?也许是具体的用例,或者是你认为它们特别适合的类型的问题或机会?

是的,我认为是入站电话,尤其是在这个范围内,你通常寻找的是呼叫量的 50% 用于非常简单的任务,并从能够升级到更复杂事物的功能开始。这是一个类别。另一个类别是出站 B2B 电话。例如,打电话给保险公司收集信息。这是另一个大类别。一般来说,他们的最佳实践之一是

你总是希望与代理交谈的人知道他们在与 AI 代理交谈,而不是假装它是一个人。我认为人们非常宽容与 AI 代理通话,而且他们往往会有非常积极的体验。但我可以想象,如果从一个人那里隐瞒它,将会是一种非常糟糕的体验,让自己陷入非常糟糕的体验。

如果我只是回顾一下我上周的情况,我所看到的语音代理,它们到处都是,而且它们在各自方面都非常有趣。例如,我们看到医疗保健领域的人们目前正在做很多事情,这与你的用例非常相似。你知道的,今天有人进行面试,有人采访了许多医生来进行市场调查。而且,我认为这是否开放取决于正确的答案,你知道的,这是一个受监管的地方,允许语音代理这样做。或者语音代理是否在旁边提供建议。

但在任何一种情况下,它似乎都可以提供帮助。我们已经看到铁路行业的人们乘坐火车进行安全检查,他们今天试图在一个应用程序上做笔记,这非常尴尬。他们正在火车上采访一名列车员,大声与他们交谈,但也在试图做笔记。这只是一个糟糕的用户体验。因此,代理可以指导这成为一种更好的体验。

一名现场的技术人员需要参考大型复杂机器的操作手册。与其翻阅手册,他们或许可以通过语音进行交互。太棒了。是的,我的意思是,我当然认为,

我们的经验非常积极。正如我一开始所说的,这并不是对替代方案的 1 倍或 2 倍的改进。这是一个巨大的,你知道的,它,它,你甚至无法计算它。就像它一样,以前不可能采访公司中的每一个人关于他们所做的事情并尝试绘制代理机会图。现在有可能了。理论上,如果他们都在同一时间这样做,这一切都可能发生。

在半小时内。所以我们非常兴奋。我们喜欢与你们一起合作。我们很高兴越来越多的公司与它互动,为我们提供更多学习的背景。今天也感谢你们抽出时间分享,并期待在继续构建它的过程中再次邀请你们。太棒了。非常感谢你们的邀请。是的,感谢你们的邀请。