S7E33 | 3秒克隆声音？我们怎么面对 AI 的黑暗面

2023/11/1

What's Next｜科技早知道

AI Deep Dive AI Chapters Transcript

L

Leander

丁

丁教

丁教：深度伪造技术已造成巨大经济损失和社会影响，克隆声音和视频的难度和成本有待考证，但AI合成语音已能达到较高相似度，部分情况下可骗过亲友和机构。 Dr Adrian Kaehler：生成逼真的人声AI需要大量的声音样本，短音频难以实现精准复制，但学术研究中的AI算法，即使使用几秒钟的样本也能生成令人信服的合成语音，未来AI合成语音技术将更加成熟，普通人难以分辨真伪。引导AI说出特定的话语可以帮助判断真伪，因为AI难以完全复制说话者的个人特质和表达习惯。目前检测AI生成的文本的工具如同猫鼠游戏，准确率有限，学校不应回避AI技术，而应提高论文写作标准。 Leander：当前AI生成的文本质量已经超过80%的人类，难以仅凭文本内容判断真伪；未来AI生成图像和视频的质量也将超越80%的人类，普通人难以分辨真伪；目前大部分AI检测工具基于文本，且准确率不高，新的检测方法需要更精细的区分人工和AI生成的比例；在图像生成领域，AI生成的图像已难以与真实图像区分；AI加速了虚假信息的生成和传播，平台需要不断迭代技术和策略来应对；平台打击虚假信息的机制如同“猫鼠游戏”，AI生成虚假信息的效率和成本非常低，平台难以实时有效地应对；平台打击虚假信息的过程需要时间，包括发现问题、人工标注、制定规则、机器学习等多个步骤，存在时间差；社交平台对选举相关内容的监管非常重视，采取了多项措施，例如设立专门团队、鼓励可信赖信息源、利用社交网络追踪虚假信息等；目前各平台主要关注自身发展，缺乏合作制定统一的AI生成内容标准或检测机制；公众人物的信息泄露在AI时代难以避免，即使没有AI，信息也可能被大规模收集；AI只是降低了成本；目前AI语音生成无法做到实时高质量的交互，存在时间差。

Deep Dive

用声音。

碰撞。

世界生动活泼。 Hello, 大家好，欢迎来到我们今天的 what's next 科技早知道。今天的这一期有一点点不太一样，算是我的一个小小的尝试。大家都知道我们上一期跳票了，其实背后一个原因是我确实是生病了。然后另外一个原因是我在为这一期的节目做准备，准备的难度比我预想的要高了不少。好吧，我还是蛮期待大家听完这一期节目的一个反馈的那希望大家能够多多给我一些建议。

好了，下面就是我们今天的这一期节目。最近深度伪造名人的声音视频已经被玩坏了，不知道大家有没有刷到过这些视频。最近我去了很多地方， heller swift 霉霉流利的在讲中文。我和日本。以及郭德纲和赵本山在流利的说英文是 thank .

C C T V for this event。

在选题会上大家也给我抛出了非常多相关的一些选题。比如说是 A I 诈骗的真实度，现在到底是什么样的一个程度了，有多容易能够深度伪造一个人。在 ChatGPT 出来的将近一年多的时间里面，人工智能领域其实是有了爆发式的发展。细数这把双刃剑的另一面，其实也在蓬勃的发展。不管是在国内还是海外，一艘 A I 诈骗就会出来非常多耸人听闻的信息。 A I 诈骗成功率接近百分之百。微软发布的 A I 声音生成工具，只需 3秒钟即可模仿人说话，十分钟被 A I 换脸骗走 435元。 You really example of how criminals can use technology to manipulate your own voice, or someone you love to pray on your worst fears.

对于我自己来说，我是不是也要给家人打个招呼了？毕竟我已经录了百来期播客，我的声音真的是到处都有。那克隆一个人的声音和视频到底有多容易？成本又是什么样子的？所以我还真的就和我们的后期负责人迪卡一起实验了几个在市场上现在免费并且公开的产品。这几个产品分别需要我提供半个小时的语音素材，以及另外一款产品是英文的。他让我读了对方提供的大概有七十多个句子，大家可以听下这个真实程度。

您好，为了更好的爱护您的车辆，请您在 1到2个月内或 3000公里左右来电进行车辆首保性服务。原本很简单，拥有一份淡泊兴致，观天空云卷云舒，品人生起起落落。 Hi, i'm 对 welcome towards next podcast。 Today, let's talk about generating audio.

我在办公室拿出来，也同样的放给了我们的团队小伙伴们听。大家觉得可以打个 70分，他们感觉其实蛮像我的。但是如果真要接到这样的电话，他们其实并不会相信是我直接打给他们的。 Today we're going to create an avatar that looks and moves like me.

华尔街日报的记者 joana stern 也去做了一个类似的挑战。他先去了深度伪造公司森西亚公司在纽约的一个 studio，在绿幕前面采集了自己全身多角度的形象的视频，又去了一家叫做 eleven labs 的音频深度伪造的公司，录制了大概超过一个多小时的声音的音频。但在完成训练之后，他挑战 24小时之内用 A I 克隆的自己和同事以及家人交流。 I called her about her d 的， i just heard about w 那结论是 A I 女生的电话成功骗过了朋友和家人，甚至他当时用了 A I 的声音跟采访的对象也是 S N A P C A T C E O evan speer。 Hey.

do you know .

that A I 在表露了自己是 A I 的语音之后，艾文 speak 只是表示说我还以为你今天是特别的严肃。朱安娜的语音也同时骗过了她的银行，顺利的通过语音识别的环节进入了下一步 mAiling address。 Joana 但是在最后一步，他失败了。他在用 A I 虚拟形象跟团队进行视频会议的时候，因为说话的逻辑跟不上，无法做身体的动作或者是手势，所以很快的就被识别出来了。这个成功率已经非常的令人惊讶了。但是对于网传的 3秒钟的克隆语音，或者是只要一张照片就能换脸的技术，到底真实度有多高？

OK generally recording and I send you. 带着这些问题。

我采访了我的朋友 A I 领域的科学家 Adrian keller 博士，他也是在 A I 领域的连续创业者。另外为了方便大家的收听，我们也把英文采访进行了中文的翻译与配音。

If you wanted to do in an 首先得承认。

用 A I 来生成类似于真实人声的声音其实挺难的。因为你需要获得某个人的声音样本之后，才能使用技术来进行处理。这个过程通常需要大量的声音样本才能达到真实的合成效果。所以仅仅依靠一小段的音频，比如你在社交媒体上发布的语音，想要进行真实的复制其实是不太可能的。但是前一段微软团队曾经开发过一个相当高质量的语音合成示例，所以在这种研究领域，而不是大众的产品领域，你确实可以发现一些 A I 的技术能从相当短的样品中合成一段相当不错的音频。如果这个声音样本越独特，那复制起来也就越容易。所以假如你想克隆兔八哥这样著名卡通人物的声音就相当容易了。那相比之下，复制一个普通人的声音就没那么简单了，因为普通的人生几乎没有像卡通人物那样具有极容易辨别的特征。

我觉得对于那些还。

在在学术研发中的 A I 算法来说，几秒钟的样本做出来的合成语音其实已经能让人信服了。但这也取决于你想要说服谁了。假如有人自称是你的亲人或者是你身边的朋友，只要你有理由怀疑对方的身份，那被 A I 复制出来的声音大概率就骗不找你。当然了还有在一些场景中，你会很难确认对方是谁。比如在电话里 A I 的合成技术其实是能模拟那种声音失真的效果，这会让你感觉更真实。其实在未来的 2到3年里，合唱这种高仿真度的音频差不多可以成为每个人都可以触手可及的事情了。

那当我们接到了不太确信的电话时候，有什么方法能够快速的验证呢？

Again, if you are something of the next 打个比方。

如果你怀疑正在和你对话的是 A I 语音，那么你可以引导他说出一些特定的话，从而帮助你进行真伪的判断。同样需要引起注意的是，如果没有足够的声音样本， A I 就无法准确的捕捉到说话者的个人特质。也就是说一个人其实是有多种的表达方式来表达相同的意思的。所以其实在几秒钟的语音片段里，那些你的声音、腔调、嗓音，甚至是你的生理结构特征，其实在某种程度上是比较好被模仿的。但是要准确还原一个人说话的习惯和方式，就需要 A I 进行大量的样本了。

What are talking about?

不过说实话，在不远的未来， A I 在这方面会做得更出色，它会变得更擅长像人类一样自然的表达自己。

市场上像是指维纳使用的深度伪造的公司。 Synthesia 在六月份宣布完成了由 assad 领投的 9000万美元的 C 轮融资，公司的总估值达到了 10亿美元。节目开头让 Taylor swift 开始说中文的这个公司叫做 H Y Y J A N，是由华人创始人创建的，也是拿到了来自 I D G、红杉中国、真格基金累计近千万元的投资。但在深度伪造技术快速发展的同时，其实也有不少公司竞相开发人工智能。

深度伪造的探测器有一款广泛被应用的工具叫做 GPT zero，号称有 100万的用户。并且他们能够快速的检测文本是由 open N I 的拆 GPTGPT3 或者是 4，或者是还是谷歌的伴儿生成的那据纽约时报的报道说，来自哈佛大学、耶鲁大学和罗德岛大学大概有六千多名的教师使用了这样的一款工具，检测学生的作业到底是不是 A I 生成的那对于这些探测工具我也充满了好奇，到底它的准确率能有多高？这个问题 A 是这么回答的。

i don't know this is a kind of useless.

因为它就像在玩猫捉老鼠的游戏一样。因为每种工具都在不断的发展，最终都希望能够超越另一种工具。如果你的孩子在这样的学校里，我强烈建议你让他们赶快去换一个学校。因为假如一间学校让你的孩子去避免接触正在发展的这些 A I 技术，那简直就是在教育他们如何在劳动力的市场上去彻底的失败。每所学校特别是大学都应该竭尽所能的让学生们去及时的了解和掌握这些技术。我觉得学校可以做的反而是提高论文写作的标准，并且告诉学生们要充分利用 A I ChatGPT 或者任何你们能获得的 A I 工具，去完成一篇你能力范围内最出色的论文。

虽然 agent 没有正面的回答我的问题，但从侧面表达了他认为这样的工具现在还是比较鸡肋的那我们就真的对 A I 和深度伪造创作出来的不良内容没有办法了吗？所以我就又采访了一位在平台工作的 A I 算法科学家 linder。

嗨大家你好。

如果是从我们现在的这种普通人的角度，我们怎么样能够分辨出不管是一篇文章，或者是一个图片，或者一个声音，他到底是人工智能生成的，还是是真人在后面说实话。

我觉得这个很困难。因为我们从 A I 的这个成熟度来说，文字的 A I 你让 A I 给你写邮件，或者说你写一个东西，让 A I 给你润色一下， A I 的能力已经比 80% 人要好了，这是我自己的感受。然后你会发现 A I 写出来的东西很有礼貌，对吧？他的逻辑很顺畅的，它很标准。我们可以说这种文本是比 80% 的人写的英文要好，但是不代表他写的这个行为逻辑，他这个风格是坏的。所以你怎么一眼看出他是机器人或者人写的。如果你觉得他特别礼貌，比如说他不是一个土生土长的美国人，他可能只有六个月的英语经验，但是他他的写的特别好，那很有可能是机器写的。

当然是我们现在是讨论是现在的这个 A I 技术。我不知道如果让你展望一下，再过个三年、五年，会不会可能这个人眼和生殖机器我们也难以分辨了。

我觉得会是这样的，计算机上面我们存储这个信息，我们是用最少的这个 bits 来存储文字对吧？那比较多一点的就是图像，再到视频。对于 A I 来说也是一样的，它首先是从文字开始来解决这个问题。好他的 A I 已经比 80% 也好了，那到图像，图像是不是也会比 80% 也好呢？我觉得已经快到了。到视频可能两年、三年，它可能也会比 80% 的要好。它一旦过了那个 80% 的点之后，我觉得对于一个普通人来说，它能不能识别就已经是很困难的事情了。

因为我觉得之前有个非常有名的心理学的测试，是说你觉得自己比全世界的人长得好看吗？平均水平来说，但是 6%到60% 到 70人都会说我自己比 50% 的人好看，但这是不合理的，跟 A I 也是一样的。他可能会觉得说我的写作是 80%。但是其实如果真正有一个量化来说，其实你并没有，那你已经被 AI 打败了。你在被 A I 打败的情况下，你是不可能去识别 A I 的。

因为它比你更好。现在有一些工具，我们在现在这个阶段是可以用的吗？

其实是有的，不管是在工业界还是学术界，大家都在做这方面研究。我觉得现在大部分的研究还是基于文本的这个测试。比如说像之前的一些测试集是或者一些算法，它是做一个叫我们叫 binary classification，就是零或者一。就是我给你一篇文章，你来说它整篇是机器生成的，还是不是机器生成的对吧？就是或者全部是人工，或者全部是机器，那是有这样的数据集。但是很快之后大家发现了真正的 A I 在生活用上，或者在真正的用途上，它不是这样的一个行为模式。大家会用它怎么说呢？会是一个文章生成出来，它可能是一半人工一半机器，或者说我人写一个开头，机器给我生成，中间我再写个结尾。

2022年也会有一些新的基准测试集出来叫 real or fake 对吧？他就是做了这样的一个事情，他是我挑一个样本出来，然后这个样本可能有十句话，然后第一句话是人工的，从第二句到第十句之间，我可能在某一个点是机器生成的，然后往后都是机器生成的。然后你会用这个算法去来 detect 或者叫鉴别我们在哪一个点上这个是机器生成的。

但是到现在为止，我觉得大家在这个数据集上的表现还不是我觉得不能说是一个可用的状态，还是有很多的错误在。因为他太像了，他在很多情况下实在是太像了。所以你导致魔法打败魔法也是一个很困难的道路。

所以未来这个成功率有可能会提高吗？

我觉得是会的，而且还大家还是需要做很多很多的研究。像我说的用魔法打败魔法，你用什么样的数据去去训练这个魔法？因为第一个魔法是大看了全网的数据训练出来的那你想要鉴别全网的数据和真实的人，那你就需要有你要给他指示，你要告诉他怎么去鉴别这个事情。我觉得还是有一些路要走。但是我看到了大家其实的这个表现也是在不断提升的。比如说最一开始的时候，大家可能在这几个测试上只能做到可能 20%、 30%。然后慢慢的也会变来变了 50%、 60% 对吧？那大家也会慢慢的提升。

但是依然给到我的是一个蛮相反的结论。他觉得比如在图像生成的领域，基本上已经很难辨别出是人做的还是 A I 做的了。

It's a little hard to say, right? These things are coming.

这个很难说，这些技术发展的太快了。如果说是静态图像而言，我们已经做到了，实际上并没有想象中的复杂。我刚才还和一些朋友辩论网络中的某张图片到底是真的还是 A I 合成的。我觉得在这个讨论中，似乎没有人能说服其他人去相信自己的观点，所以我认为像 Midjourney 这种图像生成的模型，在合适的情况下可以生成与现实世界那种原始照片。

几乎没有什么区别的图像。

如果我们指望不上各种探测 A I 内容的工具，那大公司特别是平台，大家是否有技术和政策去发现并且禁止不良的 AI 内容呢？

AI 不仅帮助很多普通的创或者说我更快的创造更多更好的内容，他同时也帮助了一些这些我们叫 sister 叫 abuser，或者去分发这些不好信息的人，他也更快的去制作和分发这些内容了。比如像他以前他肯定要雇人说我要捏造一些虚假消息，比如说说拿来打仗了，但其实没有打仗。然后他要去雇人去做这个消息，然后去分发这一些，这些确实很贵。但是现在来说，对大家来说，它可能用一个 GPT 或者用一些图像生成的，它就可以把一些人脸合过去，或者把一些打仗的照片传过去。

对对对，这次这个巴以冲突其实是还蛮明显的，然后还有乌克兰战争。

对的。一方面它是可以大量的生成这些不好的内容。第二个是他的这个做坏事的逻辑，它迭代速度也变快了，你可以把它想象成平台和这些人之间的关系，是一个警察抓坏人或者警察抓黑帮的这么一个逻辑，对吧？那大家都在迭代，以前的时候他迭代速度可能是你往前走 1米，我往前走 1米，你往前走 1米，往前走 1米，可能是一天走一步对吧？那现在有了 A I 之后，他可能一天之内走了 100步。对于平台来说，你也需要在一天之内走 100步去抓住他这些东西。

这个东西其实是永无止境的。因为除非有一天达到一个程度，说是他发现他没有办法轻易的去制造这些消息。或者说他制造这些消息的成本要远远大于他制造这些消息获得的收益，他才会停止。但是总会有人去要去找平台漏洞去做这些事情。

因为我跟另外一个朋友聊，他觉得现在就是他的平台抓住他的机制有点像是 catching game。还是现在 A I 的创作了这些可能 scheme 的这样的一些内容，它的效率和它的成本是非常快和非常低的。所以可能现在平台还是在在往上在赶。对，是这样子的一个情况是吗？

对的，因为对于平台来说，他需要抓住这些 scheme。按照传统的他这一套逻辑，他是要做什么事情呢？比如说这些 scheme 发生了，然后你就会看到一些 scheme 相关的指标，就是你平台内每天都会追踪这指标，你的这个指标就会嗖嗖嗖往上涨。那往上涨你就会去发现它是为什么网站你会发现原来是这里的内容。然后这一类内容就会经过人工的标注，证明它是哪一类，哪一类违反了哪类的规则，或者说可能是一些新的规则。然后你需要从 legal 的角度去创造这些规则，然后让人工去标注，标注的数据再返回给机器去学习，然后机器才能抓住这些 pattern。

这个其实是需要花时间的，包括甚至可能有些新的 pattern 出现之后，你的 legal 需要 active 力的去制定一些新的 policy，对不对？因为你制定任何的 policy，对于大的平台来说，你不可能说我制定一个 policy，我限制你这些部分内容的分发，然后我在内部消化就完了。你制定 policy 你可能还需要对外去沟通。除非是一些特别紧急的情况，比如说跟儿童安全相关的，或者像这次以色列巴勒斯坦战争相关的，可能特别紧急的或者美国大选之类的，他可能会 move 的更快一点，但是总是有一个时间差。

明白，我看其实像是 information 这样的一些媒体渠道，他也在做一些猜想。下一轮的美国大选其实也就是一年多的时间了。然后平台其实在上一个周期的时候，是有很多的没有想到的事情发生。我不知道这个新的一轮的这样的一个 style 平，他现在在想些什么。就从你现在可能观察到的。

选举这个事情，其实我觉得所有的这个社交平台，大家都是还是挺敏感的。因为它是很政治化的一个事情，尤其是在上一次或者上次总统大选的时候，大家发现了大量的虚假信息的宣传。然后一些有组织的黑客行动，可能会导致一些选票情况的不均衡，或者是一些不公平的情况发现。

我觉得几个角度。第一个，现在的社交平台，大家一般都会有一个专门的叫 news team。他们专门负责跟新闻相关的内容在这个平台上的分发，这个内容的收集，这些内容的标注，它会来控制这个 news 的 quality。然后第二个是大家现在做的越来越多的是就是我们要鼓励更多的可信赖的信息源头。比如像一些认证过的一些新闻的频道，比如说华尔街日报，纽约时报，或者一些当地比较有知名度的一些报纸或者社交媒体。这些可信赖的新型拳头，它就会可以这么说，在内部它打分会更高一点。

然后第三个是我们之前在之前的一轮的或者两轮选举之间，我们发现像这种假新闻在大规模的情况下都是有组织的。其实你是可以通过这个社交媒体的，我们叫 social network。对，就是你可以通过图网络来进行追溯的。一般来说像这些埃批之间或者这些账号之间，它是有一定的联系的。比如它会互相转发，他会点赞，然后他会在某个时间有一些行为模式的相似性。那这些通过这些 social network 的这些 tracking，我们也是可以把它们做一个聚类，然后进行一个。

整体的打击的。其实今年各大平台官方确实出台了一系列的措施。比如说是欧盟通过了人工智能法案。在今年的三月 tiktok 更新了社区指南，强制要求创作者在任何逼真的场景中公开 A I 的使用情况。到了七月份， meta、微软、 google、 OpenAI 和亚马逊在内的七家领先的科技公司，都向白宫自愿承诺对 A I 生成的内容进行标记。九月份 google 宣布从 11月中开始，政治广告中使用的任何人工智能生成的内容都要在平台上做出声明。平台虽然出台了这么多的政策来监管，但为什么没有说我们统一一起来制定一个 A I 生成的标准，或者是类似水印一样的探测机制，这样生成的内容就更容易被检测出来呢？

我的理解是现在行业内可能大家没有一个统一的说所有人联合起来，我们要做这个事情。因为现在大家所有人的目的，首先是还是需要增长，就是大家推广自己的 A I 的，大家还是在攻城略地的状态。所以一般在这种求增长的阶段，大家不太会说我坐下来谈一谈这个安全的问题，或者说我们坐下来搞一个协议。那个时候一般是在战争结束之后说，你的地盘我也抢不动了，我的地盘你也抢不动了。好，大家再来聊一聊做一个联盟。

这个太大实话了。大平台寻求增长可以理解，那普通的 A I 创业者，他们的逻辑又是什么样的呢？

我觉得这是硅谷。

的一个特点。在科技领域里，我可能和其他的技术爱好者一样，会被认为是一个坏人。但是硅谷的文化就是坚持的越多，优秀的技术越好这样一个态度。其实你的产品可能会以某种负面的方式被用到，但如果他也能展示出有价值或者是有积极一面的话，那么就应该继续被发展下去，并努力通过寻找其他的方式来抑制它的消极影响，而不仅仅是去回避这项技术。因此在硅谷我们非常重视创造力，对创造力和技术创新的热爱，无论对错都远远超过了其他的顾虑。

这里又回到了技术工具论，我们可以用技术做好事，也可以用技术做坏事。再回到我们做这期节目的初衷，我们普通人怎样才能保护自己呢？特别是像我这样在互联网上有很多自己音视频的个体。

我觉得可能对于公众人物来说，这个是不可避免的。因为我去搜 linked in，我可能会搜到你的照片，我会收到你的历史记录，这是你自愿公开的。就算李英不让我去下载你的数据，我也可以把你领英的数据截图下来，或者我在电脑上，拿鼠标过去把这个数据 copy 下来。

这也是不可避免的。可能没有 A I 这个事情也是可以的，只不过现在这个更容易了而已。

对，或者说其实有像之前就算没有 A I 它也可以大规模的下载你的声音。比如说它可以写一个数据爬虫，然后他在 youtube 上，在 podcast 上跟你的名字答案相关的，然后跟生动活泼相关的，我都下载下来，然后他自己在人工过滤一遍，或者是他都可以做。

确实是的，我以及身边不管是海外还是国内的朋友，每天几乎能接到几十个未知号码的骚扰电话，邮件更是不计其数了。 AI 也只是让他们成本降低了，那可能提高每个人，特别是年长的家人对新的技术的认知和警觉，才是我们能够做的。对于音频视频的诈骗，我们现在要做到完全的实时的沟通，其实还是漏洞百出的。只要沉着冷静的应对，其实就能够发现破绽。

通常来说，如果我们想渲染一句话，那渲染的时间会比这句话的总长度要长 10到100倍的时间。举个例子，如果你想渲染 2秒钟的 A I 音频，那么你至少需要 20秒的时间能达到一个相对差强人意的效果。但是你需要 200秒的时间才能达到一个相对高的质量。所以目前这种实时交互的 A I 语音还是。

很难实现的。 Hundred times faster if you want to get high quality results.

好了，今天的节目就到这里了。最后我用 agent 的一段话来做今天节目的结尾。

这句话不是我写的。

是我在网上看到的。它是关于未来的真实世界和虚拟现实完全混淆在一起的一段内容。他是这么说的。

The year is twenty thirty dickery art is so realistic， literally anything could be cake. The uncertainty has grip the world in fear. I go to hood my wife for comfort. SHE is cake.

It's brilliant.

节目最后，我们正在为关注工作机会的伙伴们同步一则招聘信息，生动活泼最近开放了节目营销和商业化项目管理的全职岗位，详情可以在节目单集介绍中查阅。同时我们也继续欢迎有意成为节目监制或者制作人的伙伴加入。如果你对商业科技内容创作感兴趣和有经验的话，想在声音领域有更多的探索，就快来通过 H R F 升 F M 到 C N 与我们联系。

这期 what nex 科技早知道就到这里了。听完之后如果你有任何的想法，欢迎在评论区里面给我们留言，我们每一条都会认真的看。如果你喜欢我们的节目，请记得给我们五星或者好评，分享给更多的朋友，也会对我们非常有帮助。你也可以单独写邮件给我，邮箱地址是听 T I N G at 声点 F M，我都会一一回复。同时公众号和微博也可以搜索生动活泼声是声音的声，节目相关的更多信息会在公众号里出现，微博和公众号都会有不定期的福利给到大家。

如果你想要跟我们更加紧密的讨论和分享，或者是想要认识和你一样有求知欲的新朋友，可以加入我们的微信群。进入听众群的方法是在公众号文章中扫码添加，或者是公众号后台回复科技早知道，即可获取邀请码。期待你的加入，我们下期见。

S7E33 | 3秒克隆声音？我们怎么面对 AI 的黑暗面 26:11 Share

What's Next｜科技早知道

Deep Dive

Shownotes Transcript

S7E33 | 3秒克隆声音？我们怎么面对 AI 的黑暗面