We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode An AI Serial Killer, Scary Good Voice AI, Robot Rock, Israel‘s AI-powered Weapons

An AI Serial Killer, Scary Good Voice AI, Robot Rock, Israel‘s AI-powered Weapons

2021/7/9
logo of podcast Last Week in AI

Last Week in AI

AI Deep Dive AI Chapters Transcript
People
A
Andrey Krenkov
D
Daniel Bashir
S
Sharon Zhou
Topics
Andrey Krenkov: AI语音技术已经发展到能够根据少量人类表演生成新的游戏角色对话的程度,这引起了视频游戏演员的担忧,但也为小型游戏开发者提供了新的机会。这项技术可以模仿任何人的声音,并可能对许多领域产生重大影响。 大型科技公司正在利用AI技术分析大量的音乐数据,以预测下一个流行巨星或热门歌曲。AI可以帮助发现有潜力的音乐人,但它也可能缺乏人情味,并导致人们试图操纵算法以获得成功。音乐的流行性是不断变化的,这使得AI难以预测新的音乐类型或声音的流行程度。 大多数主要的AI研究论文很少考虑AI技术的负面影响,即使在2020年创建了NeurIPS影响声明后,这种情况也没有得到改善。AI伦理研究关注AI的负面影响,但大多数AI研究论文更关注性能和准确性。 Sharon Zhou: AI语音技术可以生成新的对话,无需演员参与,但这引发了演员对其艺术被取代的担忧。AI可以帮助发现有潜力的音乐人,特别是那些在Spotify或SoundCloud等平台上发布作品的小型艺术家,但这可能会导致缺乏人情味,以及人们试图操纵算法以获得成功的现象。AI在音乐选择方面更客观,但人们可能会试图操纵算法。 机器学习可以帮助预测免疫疗法对癌症患者的有效性,并帮助医生更好地理解哪些患者会对免疫疗法有反应,从而提高治疗效果。 Daniel Bashir: 谷歌AI发布了一个基于机器学习的框架,游戏开发者可以使用它来快速有效地训练游戏测试代理。谷歌发布了一个翻译维基百科传记数据集,用于评估大多数翻译模型中是否存在性别偏见。埃隆·马斯克承认自动驾驶汽车比他预期的更难。一个AI狼羊游戏的研究表明,AI可能会以意想不到的方式优化目标,这突显了预测神经网络行为的难度。美国需要建立一个更广泛、更包容、更强大的AI创新生态系统,以促进AI研究的发展。

Deep Dive

Chapters
The episode discusses the advancements in voice AI technology and its impact on video game actors, highlighting both the benefits and the controversies surrounding its use.

Shownotes Transcript

您好,欢迎收听今天的Skynet Let's Talk AI播客,在这里您可以听到AI研究人员讨论AI的最新动态。这是我们最新的“AI上周回顾”节目,其中我们将总结和讨论上周一些最有趣的AI新闻。我是周博士。我是Andrey Krenkov。在本期节目中,我们将讨论用于配音和音乐的AI,以及一些关于AI研究价值的研究,

以及一些关于亚马逊解雇员工和以色列军方使用AI的新闻。

那么让我们直接开始吧。首先,我们有一篇名为“语音AI现在好得吓人,游戏演员讨厌它”的文章。是的,这里的语音AI指的是根据人类演员的表演生成游戏角色新对话的能力,但随后您可以生成更多台词。这由一位Modder演示,他为一款热门游戏创建了一个mod,其中

包含主角的额外对话,而无需演员参与。是的,这非常酷。我们听了音频,听起来确实令人印象深刻。莎伦,你对此怎么看?我认为它以这种非常非正式的方式发布非常酷。因此,这位Modder,这位用户,在一个AI模型上训练了为某个角色(主角)配音的配音演员,并且

然后,当然,这个角色就可以说很多不同的新东西,而无需该演员参与。当然,感觉不太好的部分是在演员方面。演员们觉得他们的艺术正在被夺走、被利用或被取代。文章深入探讨了这场争议。

没错。它对演员进行了一些非常好的采访,并且很好地触及了这一点。它也提到了积极的一面,那就是对于制作游戏的较小型开发者来说,这使得他们更有可能拥有基于AI的对话。因此,也许存在一种两全其美的方案,即不将其用于主角,而是将其用于填充一些次要角色或其他角色的空白。

我认为我们可以预期越来越多的音频AI或语音AI可以非常轻松地模仿这些……任何人的声音,你的声音,我的声音。我实际上有一个包含我声音的模型,但是……

它可以学习任何人的声音,然后可以以某种方式授权,或者在这种情况下,它并没有完全授权。它以这种不太正式的方式出现。但我认为我们可以预期这种趋势会持续下去。你的声音模型听起来好吗?听起来像我,尤其是在主题上,所以在分布式方面。当它谈论Gans时,听起来像我。是的。

是的,我认为你是对的。这项技术已经存在,它尤其会与配音演员相关,但可能在许多其他领域也会以较小的方式发挥作用,生成合理的音频的能力将产生重大影响。这只是AI在本十年改变做事方式的另一种方式。

是的。接下来是《卫报》的另一篇文章:《机器人摇滚:大型科技公司能否挑选出流行音乐的下一位巨星?》这篇文章基本上谈到了许多不同的公司,特别是那些可以分析海量不同技术数据库的公司。

不同的表演,并能够挑选出或预测谁可能是下一位流行巨星,下一首热门歌曲,而无需人工筛选和收听大量不同的歌曲,可能数万首,甚至更多。自从包括华纳音乐集团在内的一些非常非常大的集团

(麦当娜、红辣椒乐队都来自这里)也一直在考虑这个问题,并一直在考虑如何利用AI更快地识别人才,这已经引起了相当大的关注。

是的,我认为这很有趣。我的意思是,这是一种假设,我想,你可以认为AI被用来分析音乐数据库。但这篇文章很好地概述了现状和一些理由。显然,一些寻找音乐表演者的人,你知道,

我认为用算法来挑选有前途的音乐家有点不人道。

但与此同时,这篇文章很好地论证了它可能是一件积极的事情,因为它可以选择那些只是将作品发布到Spotify或SoundCloud的小型艺术家,他们永远不会被选中。也许即使他们没有成为超级巨星,它也能带来适度的成功,例如一百万次播放量或类似的东西。它举了一个轻松器乐的例子,

这不会成为超级巨星,但可以获得很多播放量。所以是的,很有趣,也是另一个例子,你知道,这很可能会成为标准,大概吧。

一方面,我认为,你知道,这种AI更客观。它是基于……我们关注的某些类型的指标,这可能就像点赞、观看次数或某种……跳出率等等。但是。

但我认为还有另一方面,我想知道人们是否会开始尝试操纵它,并尝试找到一种方法来成为下一位流行巨星,因为现在这是一个自动化过程,而且没有太多的人为因素或人为参与。所以这可能非常有趣。这可能很有趣。但这篇文章也提出了一点,我觉得很有趣,那就是

你知道,可以与《点球成金》这本书进行比较,对吧,棒球变得更依赖统计数据来招募球员。但音乐的问题在于,你知道,我们认为好的、有趣的或新颖的东西一直在变化。所以对于音乐家来说,这是一种好处,如果你创造了一种新的类型或新的声音,

AI可能很难预测它会流行,即使它确实流行。所以,你知道,人们仍然有机会让AI感到惊讶,我想。绝对的。接下来是我们的研究部分。第一篇文章来自VentureBeat:《研究发现,很少有主要的AI研究论文考虑负面影响》

好的。所以可能不出所料,有一篇论文研究了……所有这些不同的AI研究论文,并发现我们并没有真正考虑负面影响。甚至……我认为98%甚至都没有提到负面潜力。1%提到了它,但没有讨论它。1%讨论了它,并且

他们声称0%加深了我们对负面潜力的理解,你知道,这取决于你如何定义它。但令人悲伤的是,在我们的任何AI论文中,情况并非如此。话虽如此,我相信唯一能做到这一点的是《黑镜》中的下一部剧。所以这就是唯一的东西。安德烈,你对此有什么想法吗?

是的,我的意思是,正如你所说,这并不令人惊讶。显然,你知道,AI伦理作为一个子领域,主要关注这些事情。在这里,你知道,他们比较了论文关注的内容,大多数论文关注的是性能,例如准确性或基于过去的工作。很少有论文提到这些伦理方面的事情,例如互操作性或偏差等等。

所以是的,一点也不令人惊讶。但我发现令人惊讶的是,他们还表明,即使在2020年创建了NeurIPS影响声明之后,仍然存在一种趋势,即仍然没有提及负面内容。它仍然只是积极的,这可能是一个很好的观点。我还认为

这并不令人惊讶,但如果他们进行后续研究,看看情况是否会随着时间的推移而改变,这将很有趣。我不知道,你会期望多年来事情不会如此偏颇吗?我认为我们会改进,尤其是像这样的研究,将这些事情公之于众。改变事情也需要时间

我们甚至如何为论文撰写叙事,对吧?这周围的整个文化。这周围的整个设计以及如何撰写论文的整个理解,这是

你知道,可以说是前进的最佳方式,但它确实如此,并且不鼓励在考虑负面潜力方面具有多样性。但我认为人们意识到它不仅仅是一盏明亮的闪光灯,而且除了作为一种工具之外,它还可以被武器化,并且我们现在被允许甚至被鼓励将这些内容放入我们的出版物中。

是的,没错。因此,即使现在并不令人惊讶,这些论文通过量化确实鼓励朝着这个方向发展,我对这一点非常有希望。

接下来是我们的下一篇文章,重点关注研究,我们有《研究人员转向机器学习来预测免疫疗法何时有效》。这是关于这篇论文:《可解释系统生物标志物预测对免疫检查点抑制剂的反应》。有点棘手。

但基本上,这里的想法是有一种免疫疗法可以帮助免疫系统对抗癌症。它非常有益,但它并不适用于所有人。

因此,我们需要一种方法来了解为什么有些患者对特定类型的免疫疗法没有反应。基本上,这篇论文表明,如果你很聪明地使用机器学习,你就可以了解……患者何时会对……这种治疗,这种ICB治疗有反应。而且……是的,你知道,它的……结果相当积极。而且……

似乎是另一个例子,你知道,AI可以有益于并增强医生的工作,而不是取代他们。对。根据我的理解,事实是我们没有关于免疫疗法实际反应的很多数据。

相反,在这里,作者正在研究来自同一数据集的替代免疫反应,以便这可以帮助模型进行泛化,并为模型提供更多关于不同可能事物的更大空间的数据。我认为这就是他们用来获得预测免疫疗法反应更好结果的所谓“技巧”或“窍门”,这非常重要,因为我们

我认为如果我们知道或如果我们可以更好地预测谁对不同类型的治疗反应最好,尤其是在治疗非常昂贵并且可能需要很长时间甚至如果治疗无效或需要很长时间才能起作用会伤害患者的情况下,这是一件大事。是的。

是的,没错。我在这里发现有趣的一点是,他们使用了大约7000名患者的数据,但他们使用的一种方法只是多任务线性回归。线性与深度学习相反。所以,你知道,并非所有事情都需要深度学习和机器学习。在某些情况下,非深度的东西也能奏效。

是的,但是正如我们所知,在机器学习研究中,事情正在回归到MLP,即多层感知器路线。这是真的。我们发现,基本上,在AI研究中,我们可能只需要选择最简单的模型之一,将其扩展得非常大,其中包含大量数据。

几乎同样有效,如果不是更好,对吧?事实证明,我们所有的研究都是浪费时间,我们应该只做简单的事情,这有助于我们更多地了解这个领域以及什么不起作用,也许……是的

好的,接下来是关于AI伦理和社会的下一部分。我们的第一篇文章标题为《亚马逊正在使用几乎没有人为干预的算法解雇Flex员工》。它来自Ars Technica。还有一篇标题更辛辣的文章来自彭博社,标题为:

被亚马逊的机器人解雇。是你对抗机器。好的。所以这篇文章或这组文章清楚地说明了亚马逊的Flex项目(这是一个在大流行期间开始的项目,旨在雇用人们,主要是作为承包商,这些司机来帮助他们交付不同的物品)的情况。

问题是他们正在使用这种AI算法来决定是否雇用人们,但也决定是否解雇人们。有时这会导致非常不公平的结果,或者有时会导致在解雇原因方面缺乏灵活性。

亚马逊表示,你知道,我们正在使其非常透明,你知道你的评分是多少。但从许多这些采访中可以看出,许多这些司机在出现问题时并没有太多发言权。例如,如果亚马逊储物柜没有为其中一位司机打开,那么他们的排名就会下降,因为看起来他们没有放下东西。

是的,这非常……实际上有点像《黑镜》,因为,你知道,这听起来很像Uber的做法。你只需注册,上传你的文件即可。但是在这里,你知道,人们实际上正在获得一份工作,听起来像是。你被雇用了,你被解雇了。这一切都是由这个应用程序处理的,你知道,这个应用程序显然有这些不同的功能。

司机可以看到的指标,例如你的速度有多快,你的送货速度有多快,但是所有这些实际的人为因素……都会妨碍,然后算法无法解释它,所以我不知道,我想这并不令人惊讶,但我认为这非常令人沮丧

是的,令人悲伤的是,即使是这种全职类型的零工,这基本上就是零工工作所减少到的程度。

是的,这确实让你想知道,你知道,事情是否会变得更加疯狂,以及我们如何才能在使人们能够获得一些额外收入的同时,又不让……你知道……算法做出所有决定,并且对为亚马逊或其他公司努力工作的人不公平。

没错。接下来是我们的下一篇文章:《以色列在加沙袭击中使用了世界上第一个AI引导的战斗无人机群》。这篇文章来自《新科学家》。

好的,所以以色列国防军(IDF)在加沙地带使用了一群小型战斗无人机来攻击武装分子。这是第一个AI引导的无人机群。它仍然由人类操作。

是的,这里的想法是人类可以……引导无人机集合,去哪里,做什么。然后AI负责协调这些多个无人机。这就是为什么它被称为蜂群。实际上,关于蜂群机器人技术有一个完整的领域。是的。是的。所以它是半自主的。它不是完全自主的……杀手机器,但是是的。

它仍然表明,在战争中AI的使用有所增加。这篇文章还提到了半自主机器人和机枪,是的,它是半自主的,但具有一些自主功能。所以……

是的,这很有趣,我想,只是看到这些东西开始慢慢出现。你知道,它不是终结者,但看起来我们可能会看到这些东西逐渐变得更依赖AI。当文章说带有机枪的机器人时,你肯定会想到终结者,但它的图片实际上只是一辆坦克。

是的,它就像一辆六轮小坦克,就AI而言,它只是帮助人类瞄准。所以,你知道,不要太担心。你知道,AI不像终结者,但是它……它在辅助……是的,不同的功能,例如瞄准,例如,如果它有很多传感器数据,它可以比人更好地瞄准。

是的。是的。所以很有趣,也许有点令人担忧,但与此同时,如果你深入了解细节,它并不像科幻小说让你想象的那么糟糕。

接下来是我们的最后一篇文章,像往常一样,我们喜欢用一些有趣的事情来稍微轻松一下气氛。我们有一篇文章名为《谷歌的算法将一名工程师误认为是连环杀手》。因此,如果你进行任何谷歌搜索,你知道通常你会看到这些小的弹出窗口,关于某人的信息弹出窗口,例如公众人物。在这种情况下,是Guy Hristo Georgiev。

他被命名为连环杀手,尽管他只是一名工程师。这对他来说……不好,但也有些好笑。而且,你知道,这是另一个例子,我们看到AI可能会以奇怪的方式有点古怪。

所以发生的事情是,因为他与一个真正的连环杀手同名,所有传记都是正确的。他们只是碰巧选择了……

最接近或最容易获得的照片或其他东西,并将其用作照片。但这张照片实际上是他自己的,而不是连环杀手的。所以这很不走运。是的,我想如果你与一个也称为虐待狂的连环杀手同名,这已经很不走运了,这听起来不是一件好事。是的,但好消息是……

谷歌在收到联系后很快就纠正了这一点。所以至少,你知道,在这种情况下,有人可以纠正这个AI错误。

这就是我们本期节目的全部内容。如果您喜欢我们对这些故事的讨论,请务必分享和评论播客。我们将非常感激。现在,请务必继续收听几分钟,以便从我们自己的新闻播报员Daniel Bashir那里获得一些其他精彩新闻故事的快速摘要。谢谢,Andra和Sharon。现在,我将介绍一些我们尚未涉及的其他有趣故事。我们关于研究方面的两个故事都来自谷歌AI。

正如Market Tech Post报道的那样,“谷歌AI最近宣布了一个基于机器学习的框架,游戏开发者可以使用它来快速有效地训练游戏测试代理。该系统不需要ML专业知识,适用于多种游戏类型,并且可以在不到一小时内训练一个ML策略,该策略可以根据状态生成游戏动作。”

谷歌还提供了一个开源库来展示如何使用这些技术。第二个故事涉及神经机器翻译,它在过去几年取得了重大进展,但它生成的自然流畅的翻译往往会因训练翻译模型的数据中的偏差而受损。

同样由MarkTech Post报道,谷歌发布了翻译维基百科传记数据集,该数据集评估大多数翻译模型中是否存在性别偏差。如果它像声称的那样有效,它可以帮助ML模型更好地关注代词,并在很大程度上减少性别偏差。

在我们今天关于商业方面的唯一一个故事中,埃隆·马斯克应该表示祝贺。这位坚韧不拔的天才终于意识到,自动驾驶汽车比他估计的要困难得多。但是,正如The Verge报道的那样,这并不是突然的谦逊。

相反,这是他在推特上宣布关于软件新版本的公告,他和特斯拉仍然称之为“完全自动驾驶”。我们关于AI和社会的第一篇文章始于2019年的中国,当时两名大学生构建了一个AI项目,其中涉及狼与羊的游戏。

正如Lawrence Eng在Medium上写道的那样,“两只狼和六只羊将被随机放置在一个游戏空间中,狼必须在20秒内抓住所有羊,同时避开巨石。”与强化学习设置一样,一个积分系统被编程为激励AI狼提高它们的性能。目标是看看AI狼是否会最大化它们的得分。

但研究人员发现,狼并没有去抓羊,而是大多自己撞向巨石自杀。由于狼每次移动而不抓羊都会受到负面惩罚,因此它们通过简单地最小化这些负面奖励来进行优化。

这个故事在网上疯传并引发了讨论,主要有两个要点:这种奇怪的行为是程序化理性化和客观优化的结果;很难预测哪些条件对神经网络很重要或不重要。

在我们的最后一个故事中,拜登政府一直在AI领域采取行动。最近,它履行了国会关于创建国家AI研究资源特别工作组的授权。该工作组致力于加强美国的根基并推动AI的进步。

但正如该工作组成员李飞飞为《The Hill》撰写的那样,美国需要建立一个更广泛、更包容、更强大的创新生态系统,该系统超越拥有大部分资金资助AI研究的行业巨头。

该生态系统应包括学术界、民间社会和联邦政府。这些群体无法获得大型科技公司可用的相同AI研发基础设施。但李飞飞警告说,如果没有在学术界进行的基础研究,创新可能会很快枯竭。

李飞飞认为,国家研究云将平衡参与AI研发各方的需求,并使AI研究民主化,这是刺激新研究的必要开端。非常感谢您收听本周的Skynet Today Let's Talk AI播客。您可以在skynetoday.com上找到我们今天讨论的文章,并订阅我们的每周新闻通讯,其中包含更多内容。

不要忘记在您收听播客的任何地方订阅我们,如果您喜欢该节目,请留下评论。在我们下周回归时,请务必收听。