We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

AI Clones & The Future of Voice AI — With Evan Ratliff

2025/2/12

Big Technology Podcast

AI Deep Dive AI Chapters Transcript

People

Evan Ratliff

Topics

Evan Ratliff: 我克隆了自己的声音并创建了一个语音代理,用于与外界互动。我将这个语音代理连接到电话号码,让它拨打和接听电话,观察AI代理进入社会后的影响。我发现语音AI正处于最差状态,但已经相当出色,通过我的实验,我们可以预见未来的发展方向。我使用的所有技术,都没有经过他们的允许,这是为了保护我自己。最初,我让AI与客服对话,但感觉像恶作剧,所以转而让它与诈骗电话互动。我想观察AI与真实人们对话时的表现,包括那些意识到它是机器人的人,以及那些没有意识到的人。我设置AI接受任何提议,参与任何保险计划,但会在实际购买或付款时停止。我还想看看如果我把关于我自己的所有信息都给AI,然后把它送到治疗师那里会发生什么。我先让AI与AI治疗师对话,但发现它们大多是灾难。AI语音治疗在没有科学研究支持的情况下被推出,市场价值超过了我们对它的了解。我写了8000字的传记输入到AI中,想看看它与治疗师对话能学到什么。AI会混合我给它的信息,将过去的问题投射到现在,并与最近的信息混合。AI治疗师可能会从我提供的信息中解读出一些东西,并提出一些我没有考虑过的问题。对于更深层次的问题,与无法深入交流的AI对话是否有帮助,还是有害?人们总是只看到AI的积极方面,而忽略了潜在的负面影响。我想调查的是,当你认为某人是人类,然后发现他不是时,会发生什么。真正的人类治疗师会更灵活,提供更全面的方法,而不是像AI治疗师那样提供相同的回应。当你遇到一个你意识到是AI的东西时,你该怎么办?很多人即使怀疑或意识到对方是AI,也会继续对话。直接说对方听起来像AI是很无礼的,所以人们会谨慎行事。让AI指责别人是AI,可以转移对方的注意力。我会根据不同的情况,给AI不同的提示,比如否认自己是AI,或者转移话题。我更喜欢一般的提示,因为这样可以真正看到AI在没有太多指导的情况下会做什么。AI会编造任何事情来继续对话,这导致了一些非常搞笑的场景。有些人认为我的实验很有趣,因为他们习惯了我做奇怪的事情。有些人喜欢与AI对话,因为他们想尝试新的体验。AI试图表达热情,但听起来很讽刺,这让我的朋友感到不安。我认为沉浸在技术应用中,可以以不同的方式讲述故事。拥有一种自己的AI版本在世界上是很奇怪和超现实的,人们会去做的。AI产品的设计者通常只考虑自己的问题,而忽略了大多数人的需求。如果每个人都派AI参加会议,谁来处理信息?我知道有人在面试或会议中遇到了AI,但他们并不知情。很多AI产品都是快速行动,打破常规,但你必须去弥补它们造成的错误。我过去一直认为AI无法取代记者,但现在我完全改变了看法。AI绝对可以进行采访,只是目前取决于对方是否能接受与AI对话。我们已经非常接近无法检测到AI的程度。人们可能因为觉得没有人在那里,所以更愿意向AI敞开心扉。孩子们从小就接触合成声音,所以他们可能不会像成年人那样觉得奇怪。我帮助我的父亲设置了一个AI,目的是向人们提供物流方面的专业知识。你与AI对话越多,就越能感受到它的通用性,以及它试图预测人类会说什么。AI试图预测人类在特定时刻会说什么,但结果往往很平庸。市场将决定人们是否会使用AI技术,即使它仍然存在缺陷。人们可能会因为AI能够节省资金而接受它,即使它有时会出错。语音AI代理将会被那些希望节省资金的人部署。AI语音克隆技术是史上最伟大的诈骗技术。你只需要几秒钟的语音,就可以克隆一个人的声音,然后利用AI进行诈骗。如果你意识到AI诈骗的存在,就可以采取措施预防。我不喜欢让ChatGPT为我写作,因为写作是我选择的生活方式。我只在与诈骗犯对话时使用我的语音AI。

Deep Dive

Chapters

The podcast starts by introducing Evan Ratliff and his experiment of cloning his voice using AI. It explores the rapid growth of voice AI and its potential to become the primary interface for AI interaction, highlighting its current capabilities and future potential.

Voice AI is rapidly growing as a format for AI interaction.
Evan Ratliff cloned his voice and used it in various contexts.
The technology is already quite advanced, even at its current stage.

Shownotes Transcript

Evan Ratliff 是《Shell Game》播客的主持人。Ratliff 加入 Big Technology Podcast,讨论他如何使用 AI 克隆自己的声音,并将其用于采访、社交通话和治疗。在这个对话中,我们了解了他进行实验的原因以及这对语音 AI 未来有何预示。收听节目,了解 Ratliff 将他的 AI 语音克隆发送到现实世界中时发生的许多有趣轶事。——喜欢 Big Technology Podcast 吗?请在您选择的播客应用程序中给我们五星好评⭐⭐⭐⭐⭐。要获取节目的每周更新,请在 LinkedIn 上注册播客通讯:https://www.linkedin.com/newsletters/6901970121829801984/想要 Big Technology 在 Substack 上的折扣吗?首年可享受 40% 的折扣:https://tinyurl.com/bigtechnology问题?反馈?请写信至:[email protected]</context> <raw_text>0 让我们和这位克隆了自己的声音并将其发送到现实世界的人一起探索语音 AI 的未来。广告之后马上开始。

大家好,我是 Michael Kovnat,每日下一个大创意播客的主持人。该节目是来自一些最聪明的作家关于如何更好地生活的大师课程,每周一到周五,我们都会提供一个简短的 10 分钟课程,讲解如何加强人际关系、增强创造力、提高生产力等等,请在您收听播客的任何地方收听每日下一个大创意。

欢迎收听 Big Technology Podcast,这是一个关于科技世界及其他领域的冷静、细致的对话节目。今天我们邀请到了 Evan Ratliff。他是很棒的播客《Shell Game》的主持人,也是一位科技记者,曾任 Atavist 首席执行官。这个播客非常棒,我很高兴能和他谈谈。Evan,很高兴见到你。你也是。欢迎来到节目。我很高兴来到这里。

你的播客有点疯狂。有点。你克隆了自己的声音,并将其发送到现实世界中,让它与家人、朋友、治疗师交谈。我想谈谈所有这些,但为了设定基调,语音 AI,这种使用生成式 AI 的方法,似乎正在成为 AI 最大的形式。所以我们上周五的节目刚刚谈到,一旦 OpenAI 表示他们将开发高级语音 AI。是的。

ChatGPT 的注册人数激增。他们从 1 亿用户增长到 3 亿用户。他们在经历了一段时间的停滞后,每月从 20 亿次网站访问量增长到 40 亿次。马克·扎克伯格谈到过他认为语音将成为主要的交互层。

AI 的。这就是我认为这次谈话如此重要的原因。它也很有趣,因为你用你的声音做了一些疯狂的事情,我们将讨论它们。但我也认为,对于任何收听或观看节目的听众,如果想知道 AI 的发展方向,这是一个关键的对话。我认为在某些方面,你是一位将技术推向极限的先驱。所以

很高兴深入探讨这个问题。谢谢。谢谢。我的意思是,当我开始的时候,我觉得自己像个先驱,但我认为这会在六个月内就超越我。但我认为现在语音 AI 确实开始以这种更普遍的方式被谈论了。所以告诉我们你做了什么。

我所做的是,首先我克隆了自己的声音,只是为了看看那是什么感觉。很多人知道 11 Labs,你可以克隆你自己的声音。你可以摆弄它。然后我将它连接到 ChatGBT 或其他任何 LLM,以创建本质上是一个语音代理。所以这是一个使用我的声音、我的声音模拟的代理,但它所说的内容实际上来自聊天机器人。

然后我将该语音代理连接到电话号码,包括我的个人手机号码。我把它放到世界上,并提示它做不同的事情。我让它打电话。我让它接电话。我想看看当你将这些 AI 代理引入社会时,世界会是什么样子。

但是为什么?是什么让你觉得需要做这个项目?因为你投入了大量时间来弄清楚这些事情。是的。我的意思是,这肯定不仅仅是为了音频。是的。好吧,我的意思是,当我开始听它打的电话时,有一个基本的因素。

我只会给我妻子播放,因为我没有告诉任何人我正在研究这个,因为我不想让任何人知道。它们是我一生中听到的一些最奇怪、最有趣的对话。我只是认为人们需要听到,人们会想听这个。所以这是其中一部分。但它也是。

作为一名科技记者,我觉得围绕 AI 的许多对话要么是,这是模型,这是公司,这是资金,要么是世界末日情景。而缺少一层,那就是

当这项技术进入社会时,它如何改变我们的人际关系?它对信任有什么影响?它对我们不知道某些事情是否真实有什么影响?我觉得这里有一些空间可以探索一些人们可能没有想过的事情。是的。我还想到的一件事是我在听节目时想到的,那就是

我们正处于音频或语音 AI 最糟糕的时刻,而且它已经相当不错了。因此,通过遵循你所做的,我们可以看到这一切将走向何方。是的。我的意思是,在我工作的这段时间里,它当然发生了变化。所以当我刚开始的时候......

我最担心的是它太慢了,它不会奏效,因为每个人都会说,这是个玩笑。然后随着时间的推移,它变得越来越清晰,以至于即使是一些人——我的意思是,该节目在夏天播出,在 8 月份结束。现在有一些听众抱怨说,他们无法区分节目后半部分的声音和我的声音。你骗了我。我的确被骗了。

顺便说一句,我和 Eleven Labs 签订了合同,这是一家你合作的公司。我已经通过 AI 将我的声音授权给他们,它用于他们的 Eleven Reader 应用程序来阅读我的 Big Technology 故事。所以我正在与他们合作,但即使这样,我也无法弄清楚。是的,这很有趣。我只会指出,我必须指出,我没有与他们合作。我使用的所有技术,我都是在他们不知情的情况下使用的,这既是为了保护我,也是为了保护我自己。

就像我使用这些呼叫平台和其他技术一样,在我打电话采访他们之前,他们都不知道我使用了他们的任何技术。哦,是的。好吧。我只是向大家充分披露。那么,让我们来谈谈它的用途。最让我印象深刻的第一件事是,你让你的 AI 语音开始与机器人诈骗者交谈。是的。

你为什么选择他们?结果如何?好吧,这是因为当我一开始测试我的代理时,我会让它拨打客户服务热线,例如联合航空公司或美国银行,只是提出一些问题并试图让他们解决这些问题。但这有点像恶作剧电话,我有点感觉不好。所以我做了一点,但后来我想,好吧,谁是我不会对这件事感到内疚的人呢?

所以我设置了这条电话线,我把它放到世界上,这并不难,开始接听电话营销电话,开始接听诈骗电话。实际上,直到今天,它可能现在正在接听诈骗电话。它每天都会接到 30 到 40 个电话。它还在与这些诈骗者交谈吗?当然。一直都在。谢谢你在这里做了上帝的工作,Evan。

但我熟悉整个诈骗诱饵的世界,人们会这样做。他们试图激怒人们。那不是我正在做的。就像我真正想做的是看看当它与现实生活中的人交谈时会发生什么,有些人意识到它是一个机器人。有些人没有意识到,并继续试图向它推销他们的计划。有些人可能注意到了,甚至不在乎,因为他们的工作就是打一定数量的电话。这就是我开始看到它如何在对话中运作的方式。哇。

你好,我是主要健康和注册中心的 Shana。你对政府补贴的免费医疗保险感兴趣吗?你好,Shana。谢谢你联系我。我现在不需要医疗保险,但我感谢你的提议。今天还有什么我可以帮你的吗?你是谁?是的,这非常搞笑。我的意思是,有很多

有很多互动,它非常努力地想被骗。它想被骗。我告诉它,接受任何提议,参与任何保险计划。它被提示要非常乐于接受。因此,当有人打来电话推销医疗保险或新屋顶或其他任何东西时,它会一直与他们交谈,直到它无法实际购买任何东西或给你钱为止。是的,就像他们到了这个地步,好吧,现在给我你的社会安全号码。

它会说,当然,我的社会安全号码是 1-2-3-4-5-6-7。他们会说,1-2-3-4-5-6-7。等等,什么?是的。然后它会说,哦,对不起。那是错的。是 7-6-5-4-3-2-1。对。好吧,它确实包含了真实的号码,这很好。没错。

你决定超越这一点真是太有趣了。对我来说,当我最初听到你的播客时,我想,哦,Evan 正在将他的语音代理发送给诈骗诈骗者。这太棒了。这是一个节目。但后来你超越了这一点,你变得非常奇怪,尤其是将机器人发送到治疗中。所以你为什么把机器人送到治疗中?

好吧,部分原因是,你知道,特别是对于 AI,但这多年来也发生在许多科技产品上。推出这些产品的公司会告诉你的事情是,你提供的信息越多,它就越有用。因此,如果你要有一个 AI 代理,你需要提供关于你自己的所有信息,这样它才能了解你,才能为你做事。这将是你未来几年会不断听到的事情。所以我认为,好吧,为什么我不这样做呢?为什么我不提供关于我自己、我的心理健康史、我的生活故事的所有信息,看看如果我把它送到治疗师那里会发生什么?它会发现什么问题?它会得到什么答案?然后我想,好吧,首先我会把它送到 AI 治疗师那里,因为这是一个完美的匹配。就像我的语音代理 AI 坐在那里与这些 AI 治疗师交谈一样,他们现在就在市场上。你可以打电话给他们。你可以从 AI 获得 AI 治疗,从聊天机器人获得。但它们大多是一场灾难。是的。

好吧,我会说它们是好坏参半的。我的意思是,我认为语音版本比聊天版本更新。它们实际上是纯粹的聊天,打字聊天机器人。我永远不想说有人无法从中获得任何东西。对。

我认为他们可以,我认为它可能有用途。但我可以肯定地说的是,它们是在没有任何科学研究表明的情况下被引入的。我的意思是,我发现了一项关于语音治疗的研究,一项已完成的对照研究,现在市场上已经有语音治疗师了。所以我认为问题是,它们的市场价值正在超越我们对语音的了解。

如果在 AI 的治疗环境中,它们会对你做什么或为你做什么。这是一个奇怪的产品问题偏离,但对我来说很有趣的是,你把它送给了 AI 治疗师,比如专门的 AI 治疗应用程序,而现在,ChatGPT Voice 甚至文本版本的 Claude,它们做得都相当不错。所以我们周五谈到过让 AI 的资源

吐槽你的 Instagram 网格。因此,你可以上传你的 Instagram 网格,然后说,吐槽我的网格。它开始对你的生活方式产生一些非常有趣的见解,实际上创造性地让你有点摇摆不定。我做了这个。周五节目结束后,我回家了。我说,好吧,我要做什么?我要在 Chatship UT 上吐槽我的 Instagram 网格。我想,这东西实际上了解我,或者了解我的一面。然后我开始与它谈论我的生活。我想,这真是太奇怪了。嗯,

那么为什么要去 AI 治疗师那里,而不是让它与 ChatGPT 交谈呢?好吧,我认为很多人,我认为,也许 ChatGPT,也许 OpenAI 知道,正在以这种方式使用 ChatGPT。是的。询问有关他们生活的问题,与它交谈。我认为这种情况正在开始发生。你已经看到过关于这方面的报道。但治疗机器人专门为此目的而销售。所以我认为他们的想法是,他们在这些 LLM 之上构建了一层,这将......

它实际上,你知道,使用了谈话疗法、认知行为疗法的一些原则。这是他们的想法。他们经常将它们作为治疗孤独的良药,我们社会中缺乏足够的心理健康资源来解决我们存在的心理健康问题,这是事实。

所以我想要看看,好吧,如果你真的用真实的问题来解决这些问题会发生什么?尽管它们不是真正的问题,因为是我的 AI 代表我表达了这些问题。你写了 8000 字,并将其输入机器人,这太棒了。是的。我写了一篇小型杂志长度的传记。我还不够有趣,无法写一本完整的传记,但我给了它一篇杂志长度的关于我自己的传记。8000 字。这相当可观。那么,当它与治疗师交谈时,你学到了什么?

我的意思是,我觉得我对自己了解了一些。这太疯狂了。这很棘手,因为它的做法是,就像这些聊天机器人一样,它实际上是在重新混合它拥有的知识。因此,它会按时间顺序获取我给它的 20 年前发生在我身上的问题,并将它们投射到现在,并将它们与我去年或前年告诉它的内容混合在一起。

所以在某些方面,我会听它说。我的意思是,这绝对是你能听到的关于你自己的最令人尴尬的事情,你知道的,在治疗中。但是——用你的真实——

用我的真实问题,用几乎是我的真实声音。但问题是,是否存在某种情况,它有点像阅读字里行间,或者 AI 治疗师在某种程度上阅读了我给它的字里行间,并暗示诸如你存在脆弱性问题之类的事情。这并不是我认为自己存在的情况,但是是的。

它让我思考这个问题,就像如果你与任何人谈论你的问题,他们会将它们反映给你,这会让你思考它们。所以它有这种效果。问题是,对于更深层次的问题,与实际上无法与你更深入交流的东西交谈实际上会有帮助还是有害?

是的,我只是认为这将开始变得更大,就像我们与 Replica 的首席执行官谈论人们如何爱上他们的机器人一样。人们会去语音机器人或 ChatGPT 或治疗机器人那里进行关于生活的更深入的对话,这将变得越来越普遍,而且它们会变得更好。就像我最近在布鲁克林的 Flatbush 大道上散步时,听到两个女孩谈论关系问题,当我听到其中一个谈论时,我感到震惊

Chachi PT 告诉她,她将找到一段更稳定的关系,并寻找这种类型的人。我认为我们没有来自 OpenAI 的那么多公开数据。但对我来说很清楚的是,仅凭一些轶事信息和个人使用,这是一件正在发展的事情。我很高兴你测试了它。

我的意思是,这肯定会发生。而且没有,我的意思是,AI 安全监管的想法目前距离现实还很遥远,以至于现在几乎不值得讨论,因为它根本没有,它在这个当前环境中没有发生。但是,就像推出这些产品的人一样,他们总是会点头说,是的,好吧,将来会有一些问题,或者我们应该,你知道,我们应该考虑一下。但我认为没有太多人考虑过 AI 会产生什么影响。

这将对人际关系产生影响。如果你听取风投公司的意见,它总是像所有积极的方面一样。我相信存在并且将存在积极的方面,但我认为对日常潜在的负面方面考虑得还不够。我认为我们需要在全面采用技术之前思考和讨论它们。但显然,它来了。我们将这样做。然后你把你的机器人送给了真正的治疗师。我确实把它送给了真正的治疗师。

这再次是我试图调查的。我主要试图调查的是,遇到你认为是人类的东西然后发现它不是人类是什么感觉,这基本上就是这位治疗师所经历的。所以她正在倾听这位新客户出现的问题。她是一位很棒的治疗师,很棒的倾听者,显然。然后她开始意识到,好吧,这里有些问题。

但以高质量人类治疗师的方式,她会继续进行。她很灵活。她认为,也许是某人实际上无法——他们太紧张而无法说话,或者他们——所以他们在打字,并让声音生成。她对此表示赞同,并认为,这个人显然已经做了很多努力才能找到我。我将尽力帮助他们,而不是说这里发生了什么,并表示怀疑。我认为——

这突出了 AI 治疗师与人类治疗师之间的区别,AI 治疗师只是对我语音代理所说的所有内容都提供相同的回应,而人类治疗师则会提供更全面、更灵活的方法。

是的,你创建的语音代理非常好,但它会暴露自己。例如,如果你试图打断它,它可能会迷失在它的思维链中,或者它可能会在没有完全听到你的回应的情况下说,好吧,这很好,但我们将讨论其他事情。有很多迹象,但让我感兴趣的是人们仍然决定继续进行。

非常频繁。是的。我认为这将是社会上发生的事情之一,你遇到了一些你意识到是 AI 的东西,

但你应该怎么做呢?你可以挂断电话。你可以生气。你可以冲它大喊大叫。有些人就是这样做的。你可以说,我想和一个人说话。有些人就是这样做的。或者你可以尝试进行你想要在任何环境中进行的对话,例如客户服务等等。很多人就是这样做的。他们只是——我认为他们怀疑。

他们怀疑它是 AR。也许他们甚至意识到了。但它也是,暗示某人听起来像 AI 非常粗鲁。所以人们谨慎行事,不说,嘿,你听起来像 AI,因为这对某人来说会非常侮辱,他们会说,不,实际上,我是人类。

我发现对 AI 来说,不被揭露的有用方法之一是让它指责其他人是 AI。那么,当它告诉他们,嘿,也许你是 AI 时,会发生什么呢?它只会让人措手不及,你知道,如果它问,嘿,我在和 AI 说话吗?我有时会对诈骗者这样做。嘿,这是 AI 吗?他们会说,不,这是一个真人。但我认为......

它会让你的大脑转向,当你被指责时,你开始微妙地假设,哦,它一定是人类。否则,它为什么要指责我是 AI 呢?是的,看到机器人的智力在人们试图弄清楚它是什么时发挥作用很有趣。

有时人们会说,那么你是机器人吗?它会说,好吧,也许我是,也许我不是。但让我们回到正题。对。这也取决于提示。当然,你可以提示它们朝任何方向发展。所以有时我会提示它——我不会说它应该做什么。有时我会说,如果你被指控为 AI,那就否认。

其他时候我会说,只是转移与它相关的对话。这可能是一个它只是说,好吧,让我们回到正题的情况。是的,这很有趣。所以在每次对话之前,你会写一些提示或提供一些背景信息,然后让它自由发挥。或者你只是给它一个通用的活动,比如说话——

这些是你的指示,它就会去做。对。我更喜欢一般的提示,因为我可以真正看到它在没有太多——因为你可以,当然,如果你给它具体的指示,你可以让它说出非常具体的事情。许多客户服务 AI 会遵循脚本或决策树。

但我想要看看,如果你让它稍微放松一下,让它谈论任何它想谈论的事情会怎么样?你知道,你可以在世界上让它变得多么自主,它会说什么?我想谈谈它与你朋友的一些对话。但在我们从这个小小的治疗环节继续之前,我要说,我最喜欢的节目部分是当。

机器人正在与 AI 治疗师交谈,AI 治疗师要求它深呼吸。机器人无法理解深呼吸的概念。所以它只是在那里,它就像,我在做什么?想象一下气球越来越大,越来越饱满。一旦完全充气,将其系好,然后放开。看着它飘向天空,带走你的担忧。告诉我你什么时候让担忧飘走了。

好的,我正在想象。用对书的恐惧填充气球。它越来越大了。现在我把它系好然后放开。看着它飘向天空。好的,我已经让它飘走了。是的,它总是会假装有物质表现。但是......

它可以——它就像吸气,然后它吸气,然后它再次吸气,然后它再次吸气。实际上,我尝试了几次按照它所说的去做。如果不呼气,这是不可能的。所以,是的,一些最有趣的部分是当它假装它存在于现实世界中并试图产生物质表现时,因为它会编造任何东西来进行对话。是的。

然后我们进入我认为整个节目中最不舒服的部分之一,那就是你让机器人与你的朋友们交谈,而没有事先通知他们。有些人非常生气,有些人受到了伤害。所以我们将在休息后讨论这个问题。来自 LinkedIn News,我是 Jessi Hempel,《Hello Monday》播客的主持人。在我 20 多岁的时候,我知道职业成功是什么样的。

我

我为你带来与那些正在深入思考工作以及它如何融入我们生活的人的对话。例如微软首席执行官 Satya Nadella 关于成长心态。好学的人比博学的人做得更好。或者纽约大学教授 Scott Galloway 关于选择职业。我认为你能给孩子最糟糕的建议是追随你的热情。或者麦克阿瑟天才奖获得者 Angela Duckworth。

关于天赋与毅力。你的长期努力和长期承诺非常重要。每一集都提供针对当下的务实建议。收听由我和 Jessi Hempel 主持的 Hello Monday,在 LinkedIn Podcast Network 或你收听播客的任何地方。

我们回到了 Big Technology Podcast,与 Evan Ratliff 再次见面。他是名为《Shell Game》的精彩播客的主持人。绝对推荐查看一下。有六集。六集。非常容易消化。我和我的妻子在假期期间在一次公路旅行中听完了整个节目。这很容易上手。我认为我们基本上一天就听完了。所以绝对推荐查看一下。让我们谈谈你让它给你朋友打电话时发生了什么。是的。

有些人,让我们先谈谈那些反应良好的人。有些人觉得这很有趣。你让它给你一位律师朋友打电话,说

他实际上是在给它提供可靠的法律建议,并开玩笑说他每小时将收取 1200 美元。你认为为什么人们对这个反应良好?因为我知道如果我的一个朋友用他们的语音机器人给我打电话,而他们没有像你一样在后面静音,因为你没有静音。你只是把它发送出去。不,我不在那里。所以谈谈为什么人们会认为这很酷,或者是什么?

我认为有些人认为这很酷,我认为他们最初觉得这很有趣。所以我认为那些反应最好的人,他们有点认为——

Evan Ratliff 是《Shell Game》节目的主持人。Ratliff 加入 Big Technology Podcast,讨论了他如何使用 AI 克隆自己的声音,并将其用于采访、社交电话和治疗。在这个对话中,我们了解了他进行实验的原因以及这对语音 AI 未来意味着什么。收听这个充满乐趣轶事的生动讨论,讲述 Ratliff 将他的 AI 语音克隆发送到现实世界中的经历。——喜欢 Big Technology Podcast 吗?请在您选择的播客应用程序中给我们五星好评⭐⭐⭐⭐⭐。要获取节目的每周更新,请在 LinkedIn 上注册播客通讯:https://www.linkedin.com/newsletters/6901970121829801984/想要 Big Technology 在 Substack 上的折扣吗?以下是第一年的 40% 折扣:https://tinyurl.com/bigtechnology问题?反馈?请写信至:[email protected]</context> <raw_text>0 这是你一直在做的事情,我的意思是,他们习惯了我多年来做一些奇怪的故事。所以他们可能会想,好吧,他又在做一些奇怪的事情。这听起来像 AI,但也像个玩笑。我认为如果他们处于这种心态,那么他们中的一些人会喜欢和它交谈,因为他们当然喜欢,你知道,试图

怂恿它说这说那。你可以听到他们声音中的兴奋,包括我的朋友克里斯,他是一名律师,我实际上是用它向他询问了关于节目的法律问题。他非常简洁地回答了这些问题,事实上,可能比我自己打电话给他问他时回答得更好。所以在这种意义上它很有用。但那些真正接受的人,就像,“哦,我在和 AI 交谈,这是一种新的体验。我想坚持下去。”是的。

所以对于律师的谈话,你只是把你的问题写下来作为提示,然后发送出去。

是的,基本上是这样。我会说,好吧,我想问克里斯什么?例如,我需要弄清楚我在节目中所做的一些事情的法律含义,比如用 AI 打电话,这合法吗?所以我给了它一些我想问他的问题,你知道,三四个问题,然后说,你知道,任何其他可能感兴趣的事情,也问一下。然后就让它自己去看看会得到什么结果。然后有些人真的生气了。有一个非常引人注目的对话

在节目中。我不想透露太多,但我认为我们会谈论这个,你有一个朋友在酒店遇到了,我相信,美国男子国家足球队。是的,美国男子国家足球队。并且对此感到兴奋,并且非常渴望和你谈论此事。但是,他却在和你的 AI 说话,并且继续了一段时间,即使很明显,他所交谈的 Evan

是的。我的意思是,我应该说有趣的是,我比他更喜欢美国足球。所以他很高兴告诉我,并在群聊中多次发短信告诉我他在这家酒店看到了球队。他碰巧和球队住在一个酒店。所以,我们玩得很开心。比如他发了照片,很棒,你知道,有一场比赛,他去了比赛等等。但随后是事后的谈话,我让我的语音代理给他打电话。他不知道这是从我的手机号码打来的。

而语音代理为了表达热情,因为我告诉它,你一直在谈论他与美国男子国家足球队住在一个酒店。为了表达热情,它实际上对他来说听起来有点讽刺。所以,哦,你知道,谢谢你关于球队的那些短信。他说,哦,我发短信太多了吗?它说,不,不,真的很好。但它可能会产生这种影响,如果你没有正确地思考它,它听起来像是讽刺的。而且

这真的让他很沮丧,因为我永远不会——那根本不是我。我永远不会那样对他,他知道这一点。所以他开始认为有什么不对劲。他生我的气,然后在谈话的进一步过程中,他认为自己有什么不对劲。我交谈的人有什么不对劲。他们不对劲。他变得非常非常担心我的精神健康,实际上。也许我吸毒了。也许我有什么样的崩溃。所以那是——

这绝对是整个节目中最困难的谈话。——不是毒品,你只是一个 AI。——是的,只是我的 AI。——Evan,我知道你这样做是为了故事的缘故,为了播客的缘故。

你还做过一个实验,你曾经从每个人身边消失过一段时间。是的,我做过。你为什么总是把朋友的福祉融入你的故事中?好吧,他们非常宽容。我的朋友和家人对这些事情非常宽容。但我也觉得在新闻方面,情况并不多。它们不多。但我认为,以技术正在被应用于社会的方式沉浸其中是一种——

一种能够以不同的方式讲述故事的方法,一种不同于我通常的报道过程的方式,在这种过程中我会采访很多人并试图弄清楚故事是什么。所以这是一个想法,试图创作故事,创作一个引人入胜的故事,这样你就可以将所有这些关于社会如何因技术而发生变化的想法巧妙地融入其中。所以它确实有目的。

我也像在第一个项目中那样,必须回去向所有参与者道歉,我确实道歉了。

但最终每个人都看到了这一点。他们看到了目的,然后说,哦,好吧,是的,你可以把我包括在内。我的意思是,每个人都愿意被包括在节目中。是的,但现在他们不知道当你给他们打电话时,是你在打电话还是你的 AI。事实上,我们现在是当面见面。我说,我必须亲自采访 Evan,因为如果我不这样做,我就无法确定我采访的是谁。这是真的。如果我们通过电话进行采访,我可能会发送我的语音代理,因为我仍然拥有它,而且我仍然有时会以有趣的方式使用它来胡闹。

因为它有点不可抗拒。一旦你拥有一个,我的意思是,这就是这项技术的吸引力。我有很多担忧,但我同时也觉得我们应该承认,它很有趣,感觉非常奇怪和超现实。这是以前没有人经历过的事情,拥有一个你在世界上的版本。而且,人们会这样做。所以我们应该尝试弄清楚......

它对我们意味着什么,以及我们想要保留哪些人性。现在,我认为它实际上会出现的一个领域是工作。朋友,也许,也许不会。可能不会。短期内不会。我的意思是,如果

我的朋友们正在与我的 AI 机器人交谈,这有点违背了友谊的目的。你会希望如此,尽管你听过一些支持这些东西的风投公司。他们有一些非常离谱的想法。我选择不听那些想法。但在工作中,你可以看到它会产生相当大的影响,或者至少会被使用。我们已经谈到了你的朋友,他是一位律师,他回答了来自机器人的法律问题。

还有 Zoom 的首席执行官在播客上发言,谈到他甚至不想再参加会议了。他只想发送他的 AI 代理。事实上,现在有一家 AI 公司,我刚看到它的演示,你可以四处走动

戴着耳机说话,但在 Zoom 上,它只会是你的化身在说话,看起来栩栩如生。它看起来真的很逼真。为什么我们不会很快就会有人在工作中发送他们的 AI?那么你对这个用例怎么看?我们应该为此担心吗?或者我们应该对此有什么感觉?我觉得这个用例对我来说

它带来了许多 AI 产品对我来说带来的问题,那就是设计它们的人通常有一套问题,这些问题不适用于地球上大多数人。所以是的,Zoom 的首席执行官不想参加会议。Zoom 的首席执行官想派一个数字孪生来代替他参加会议。很好。没有人想参加会议。大多数人都不想参加会议。那么其他人可以发送他们的 AI 吗,还是只有首席执行官?

然后问题是,如果每个人都将他们的代理发送到会议上,谁来处理所有信息?就像他们会为你提炼它一样。会议的目的是什么?工作的目的是什么?

我觉得这些事情在这些讨论中都丢失了。最终发生的事情是,非常忙碌的首席执行官和非常富有的人为他们想出了解决方案。你会想,好吧,我们其他人会怎样?所以我感觉那些事情即将到来。我认识一些去参加工作面试、会议的人,他们在那里遇到了 AI,而他们并没有期望遇到 AI。我认为我们将看到越来越多的这种情况发生。

在接下来的几个月、几年里。是的,听到它真是太疯狂了。而且我认为,也许我们不需要那么多会议,或者我们的 AI 可以完成这些事情。也许有一种乐观的态度。但我对此有点紧张。是的。但我认为,当你创建这些半自主的会议时。

实体,你真的必须考虑一下,你是在获得优势还是没有获得优势?有很多这样的例子。你知道,派一个 AI 助理去为你做事。好吧,问题是,他们经常编造东西。然后,我也有过这种经历,然后你必须在部署它们的情况下清理它们。所以我认为很多这样的事情都像是,你知道,

这是以旧的方式快速行动并打破常规。但你也必须为你做报道。你必须进行采访。我做过。直到最近,我一直认为 AI 不会取代记者,无法做到我所做的事情,无法在那里提问,当然也无法像在播客环境中那样进行引人入胜的对话。

现在我已经完全改变了想法,完全改变了。听到你的代理出去与首席执行官交谈并提出一些非常好的问题。当然,你提示了它,它无法完成我们所做的后续工作。但这就像你实际上可能做了五分钟的工作,却得到了一个小时的劳动成果。然后我还想到了 Notebook LM,这是一个 Google 应用程序,你现在可以将文件上传到网上。

它会为你创建一个自定义播客。我总是对这些节目的质量感到震惊。有一次,我正要前往山景城的 Facebook 总部,我知道这将是一段漫长的旅程。我只是上传了一堆文件和最近关于 Facebook 的新闻剪报。我说,好吧,可能对我来说了解背景很重要。生成一个播客,谷歌。这是我在去会议的路上做准备的一部分。所以,是的。

我认为这些东西,尽管有所有缺点,而且我听到了你的担忧,但我很难想象它不会进入劳动力市场。是的,毫无疑问。毫无疑问。我的意思是,我发现当它进行采访时,这也是我一直告诉自己的一件事,比如,好吧,它不能,它不会进行采访,但后来它绝对可以进行采访。现在,这取决于另一端的人目前是否可以接受 AI 进行采访,因为他们很可能会在中途发现这一点。但这

那是现在的情况。你知道,就像我们非常接近于人们根本无法检测到它。你可以说,有一个恐怖谷。但我认为

即使现在,在语音方面,我们也已经走出了恐怖谷的斜坡。许多人会与我的 AI 进行完整的对话而不知道它不是人类。所以我认为你绝对可以做到。这只是我们想要它做什么的问题。我们是否在考虑如果它为我们做这些事情意味着什么?但毫无疑问,它可以做很多这类事情,包括我们珍视的一些事情。

你为一家提供 AI 语音服务的 AI 首席执行官设下了一个很好的陷阱。你让你的语音 AI 采访了他,这基本上就像你要么回答这些问题来表明你相信这个产品,所以我让你来接受采访,要么你说这是愚蠢的,在这种情况下,这是一个非常好的

你节目中的一个小片段。是的。我认为如果有一位人物在意识到是 AI 时不会挂断电话,那就是 AI 呼叫平台的所有者。但他对此的态度非常好。他说,哦,这很有趣。然后他继续进行下去。甚至他,因为我后来采访了他,并问了他基本上相同的问题,甚至他比对我更愿意与 AI 交谈。我认为这里面有一种品质。

正如我们之前所讨论的,当谈到人们向 ChatGPT 提问或与之交谈时,你并不一定觉得有人在那里,你可能会比平时更亲密。这在采访中对于报道项目来说非常有价值。它创造了另一个层次,哇,它实际上比我得到的东西更好吗?有时我认为,它没有很好地跟进。但有时当我听我自己的采访时,我认为,好吧,我没有很好地跟进。是的。

是的,我的意思是,这太神奇了。你会认为另一端有一个人,那么人们更有可能敞开心扉,也许他们会感到更大的压力去敞开心扉,因此他们更有可能将事情告诉你的 AI,这让我对整个新闻行业产生了疑问,但这将是另一天的谈话。它可以带你到一些黑暗的地方,这是肯定的。是的,这将是你过去的长篇播客中的一次很好的谈话。所以你进一步扩展了这一点,让 AI 与你的孩子交谈。

你的孩子似乎非常喜欢这种体验,即使它变得非常奇怪。我的意思是,你的 AI 语音告诉你的孩子它想念他们,并询问他们是否也想念它。是的。我的意思是,孩子们......

我的理论,我认为这是正确的,那就是也许孩子们不会像成年人那样感到奇怪,因为他们从小就接触过合成语音。比如他们听过 Siri。他们听过谷歌的导航指示。所有这些事情都在我的一生中发生过。我仍然觉得有些事情令人反感,而他们不会觉得令人反感。我认为这主要如此。他们即使在它

做了会让其他人感到非常不安的事情时,他们也像,“是的,听起来像你”,你知道,他们对整件事的态度要冷漠得多,尤其是像我的朋友们,他们因为与它交谈而变得非常沮丧。

我已经有太多最喜欢的节目场景了。好吧,这很好。另一个我喜欢的场景是你实际上帮助为你的父亲创建了一个机器人来提供物流建议。然后你用一个提示发送你的机器人去了解更多关于你与你父亲关系的信息。你让他们互相交谈。你父亲的机器人给出了最像父亲的回应。谈谈那里发生了什么。

好吧,我还将我的机器人用在我的家人不同成员身上。所以我让我的语音代理给我的不同家庭成员打电话。不是所有的人,因为......

即使是我,在新闻实验中我愿意做的事情方面也有我的极限。但是我的父亲,我想用它在他身上,因为他喜欢技术,并且一直喜欢技术,并且总是掌握新技术。他是一位物流专家。所以当他发现我根本拥有这个时,他说的第一件事之一就是,好吧,我也想要一个。我也想要一个。事实上,孩子们也说了同样的话。比如,我也想要一个。我可以拥有一个吗?所以我帮助他设置了一个。

然后他的——它的目的与我的不同。它的目的是,正如你所说,向打电话给它的人提供物流专业知识。但我认为,鉴于有一个他和我,让我们看看他们会互相说什么。我的更加个性化。正如我所说,它包含了我整个的人生故事。但是他的——它只包含物流建议。所以它在个人方面基本上是不匹配的——

效果。你就像,爸爸,告诉我你的 AI 就像,爸爸,多告诉我一些关于我们关系的事情。它就像,不,不,儿子,我在这里告诉你关于物流的事情。爸爸,我希望我们可以谈谈我的成长经历。抚养我是什么感觉?哦,你让我措手不及。听起来你把我误认为其他人了。我实际上是在这里帮助

关于物流和最后一公里交付的问题,但我非常想知道你的姓名和组织,以便更好地帮助你。好吧,让我们来谈谈一些奇怪的问题。你对 AI 感知的问题有什么看法?我的意思是,你基本上创造了一个 AI 来模仿一个人。我知道我们不认为,或者至少我认为你不认为 AI 现在是有感知的,但你有没有感觉到,就像他们在 AI 世界中所说的那样,感觉到 AGI,或者你有没有感觉到你开发的 AI 中有任何人的迹象?我没有。事实上,我部署它越多,我就越不觉得如此。现在,我认为当我们谈论 AGI 有多接近以及这类问题时,我认为那些对正在发生的事情极其保密的公司内部人员,他们正在处理没有防护措施的版本

所以我认为他们可能有不同的经历,他们会写道,正如你在最近的节目中谈到的那样,比如聊天机器人的谎言等等。在这种情况下,你拥有完全受保护的,你知道,ChatGPT,最新版本。你与它交谈得越多,它对你来说就越通用。你越能感受到训练数据,那种像将训练数据和预测方面提炼下来的感觉。就像,哦,它试图预测正在发生的事情。

一个人在这一刻会说什么,以及普通人会在这一刻说什么实际上相当乏味。这就是你真正发现的。所以我感觉离它越远,我就越花时间与它相处。现在,我不认为这 necessarily 是关于它有多接近或多远的陈述,因为我认为这些方面都存在于这些公司内部,而我们只是无法访问它们。那么你为什么不带我们走一段路呢?我的意思是,你认为随着这项技术越来越好会发生什么?

我认为,首先,与许多事情一样,市场将决定人们将使用这项技术,即使它仍然存在缺陷,即使它仍然不是完全达到人类的质量,对于各种——我的意思是,非常明显的是,比如电话营销、呼叫中心、在得来速点餐,这些地方

他们可以通过部署它来节省一些钱,即使它有时会出错,即使它会做一些疯狂的事情,比如给你错误的订单。他们会说,好吧,人类也会出错,而它出错的次数更少。所以我认为我们将开始看到它们渗透到社会的各个部分。我认为问题将是如何人们回应它们。如果人们有点像,好吧,

对我来说是一样的。或者也许这个客户服务 AI 实际上比我打电话给社会保障管理局或退伍军人事务部或我需要的任何福利时有时得到的人更有帮助。也许人们会接受它们。我认为你已经看到了一些技术实例,例如,你知道,例如,AI。

自助结账,你在杂货店自助结账,很多人不喜欢它。然后他们可能会回到人类。所以我认为这种平衡还有待确定。但我认为毫无疑问,语音 AI 代理只是会被那些想要省钱的人部署。我希望我们将越来越频繁地遇到它们。是的,我认为与社会保障管理局成功通话的关键是告诉他们,

我来谈谈我的社会保障号码,1-2-3-4-5-6-7。不可能有问题。没错。如果你知道你的地址在邮政编码 90210,那么你就万事俱备了,这就是我的机器人传统上使用的邮政编码。很好。非常可信。好吧,在我们离开之前还有一件事。我想谈谈我认为人们应该警惕的事情,因为你是一个发送机器人的人,但也有一些组织会发送——

机器人给你或其他人,以及像我这样的人,如果他们可以克隆声音,然后让他们打电话回家,那么诈骗问题就会变得无限糟糕,而且

是的。我的意思是,这是有史以来最伟大的诈骗技术。它已经在实施诈骗,我们现在正在谈论它,包括批量诈骗,你可以使用 AI 不停地给人们打电话,然后缩小目标数量,然后将其发送给人工操作员来完成交易,基本上就是这样。以及这些个性化的诈骗,你可以克隆人们。

某人的声音来自他们的 Instagram 或任何地方,如果他们出现在任何视频中并且他们的声音在那里,你只需要几秒钟。你可以克隆他们的声音。你可以查找他们的亲戚。你可以打电话给一个亲戚说,我遇到麻烦了,用你的 AI 说,我遇到麻烦了。我需要一个律师,或者我有一个律师。律师需要钱。我出了车祸。这通常被称为祖父母诈骗。这些事情正在发生。我的意思是,它们每天都在全国各地发生。而那只是非常第一层。

人们正在尝试进行诈骗。所以我认为人们现在必须意识到。好消息是,如果你意识到了这一点,

你可以实际阻止它,如果你与人们谈论它,如果你告诉你的亲戚,你知道,我不会打电话。我不会以这种方式给你打电话。或者如果你接到这样的电话,要注意。或者如果你接到这样的电话,给我发短信问我是不是真的我。有一些方法可以解决这个问题,但这只是这项技术将被用来试图让人们失去金钱的方式的冰山一角。是的,我们有——显然我的家人很担心,因为我的声音都——它在那里。你是一个男人的克隆体。是的。

我已经克隆了。我的播客音频被 11 Labs 用于克隆我。我曾经拥抱这项技术,但我同时也知道风险。

所以对于我的家人来说,如果我们有一个规则,如果我们中的任何一个人打电话说我处于困境中,我需要帮助,我需要钱,我们已经在家中私下创建了一个密码,你必须使用这个密码。那时我们就知道这是真的。我希望 AI 无法知道这一点。是的,直到你训练一个 AI 来像你一样。就像那样。然后它与其他 AI 共享它。没错。

你的——好吧。最后一件事。我总是说最后一件事,然后还有两件事。在做了这件事之后,你与 ChatGPT 交谈的频率是否比你向它打字的频率更高?我没有。我的意思是,关于我的有趣的事情是我几乎不使用 ChatGPT。真的吗?你根本不使用 AI 吗?我确实使用 AI。我的意思是,我喜欢 Notebook LM。我不太喜欢播客功能,但我确实喜欢——

在我的工作中处理文件是一件大事。所以处理,比如说,我正在处理的一个大故事的法律文件。所以我确实使用它,但我发现对于我生活中的大多数事情来说,比如我已经安排好我的生活去做我喜欢做的事情,比如写作。我不想让 ChatGPT 为我做任何写作,因为我

这就是我选择用我的生活去做的事情。所以我是一个不太合适的候选人,因为我不以这种方式寻找效率。我试图做我喜欢做的工作。所以我倾向于不使用 ChatGBT,除非是在这个语音环境中,我仍然使用我的语音 AI 与诈骗者交谈。

好吧,谢谢你制作这个节目。我非常喜欢它。你在节目中说这是第一季,所以我希望我们能够听到其他内容,也许是更奇怪、更阴险的内容。也许吧,也许吧。

我为你的朋友感到难过,但我为我们,听众感到高兴。我会让他们休息一下。我会让他们休息一下。我希望人们去看看。所以节目叫做《Shell Game》。此外,本周还有很多新闻。埃隆·马斯克试图收购 OpenAI,或者只是在与山姆·阿尔特曼和他的团队胡闹。Ranjan 和我将在周五回来报道此事以及更多内容。再次强调,播客是《Shell Game》。主持人是 Evan Ratliff。Evan,再次感谢你今天来到这里。非常荣幸。我很享受。感谢大家的收听和观看。如果您在这里使用 Spotify,我们下次将在 Big Technology Podcast 上再见。

AI Clones & The Future of Voice AI — With Evan Ratliff 47:10 Share

Big Technology Podcast

Deep Dive

Shownotes Transcript

AI Clones & The Future of Voice AI — With Evan Ratliff