卢克,我是你父亲。如果你听不出来,我正在努力展现星球大战反派达斯·维达那冷酷无情的威胁感。电影中,他最初的配音演员是詹姆斯·厄尔·琼斯。
我很确信,人工智能在模仿达斯·维达那令人胆寒的语气和独特的节奏方面会做得更好。事实上,机器学习现在可以制作出高度逼真的声音克隆,这部分解释了为什么广受欢迎的电子游戏《堡垒之夜》的制作商选择使用人工智能来重现电影中达斯·维达的声音,而不是让一位在世的演员来配音。不过,这激怒了一些好莱坞人士,他们已经正式提出了投诉。
在今天的节目中,我们将找出原因,并将探讨生成式人工智能可能如何影响游戏世界。我是威廉·李·亚当斯,这是来自英国广播公司世界服务的《世界上的什么》。我们稍后会详细了解那份投诉,但我先解释一下是谁提出的。它来自SAG-AFTRA,即美国演员工会和美国电视广播艺术家联合会。
这是一个代表超过16万名成员的工会,其中包括演员、特技协调员,以及对本次对话来说也许最重要的配音演员。所以让我们开始吧。我正在采访英国广播公司记者利夫·麦克马洪。利夫,你好。你好,威廉。你好吗?非常好。感谢你加入我们。
首先,在星球大战系列电影中,达斯·维达的声音是由已故演员詹姆斯·厄尔·琼斯配音的。他当然在2024年9月去世了。我假设这位演员的遗产继承人允许他的声音用于《堡垒之夜》。我们知道他们对使用他的声音和人工智能的立场吗?是的,他们确实允许……
……《堡垒之夜》使用他的声音,事实上,他们在《堡垒之夜》宣布人工智能达斯·维达功能的声明中表示,他一直认为这位标志性超级反派的声音与星球大战的故事密不可分,他一直希望各个年龄段的粉丝都能继续体验它,所以他们也表示认为这次合作将
让更老和更年轻的西斯尊主粉丝都能在《堡垒之夜》中欣赏这个角色。所以从一开始,他们对这次合作就持非常积极的态度。他们在游戏中是如何使用这个声音的?
我认为他们使用它的方式是让人们与达斯·维达互动,他是游戏中的一个大逃杀Boss。他之前就出现在《堡垒之夜》中。他们把他带回来了,但这次有所不同。这次,他是一个人们不仅可以对抗他这个非常强大的Boss,还可以将他招募到自己队伍中的版本。更重要的是,如果他们愿意,他们可以和他
通过用自己的声音与他聊天来互动,他们会得到语音回复。而这正是由人工智能驱动的元素。这是使用人工智能软件生成的詹姆斯·厄尔·琼斯的声音,它允许粉丝们与他互动。
当然,SAG-AFTRA对这件事有不同的看法。你能告诉我们为什么他们就人工智能的使用对《堡垒之夜》提出投诉吗?所以SAG-AFTRA声称,制作《堡垒之夜》的Epic的子公司Llama Productions,他们……
表示,基本上,Llama Productions选择用人工智能技术取代人类表演者的工作,但更重要的是,这样做并没有事先通知工会他们计划使用人工智能,也没有机会就该使用的条款进行谈判。
所以它也表示,它非常欢迎其成员及其遗产行使权利来控制数字复制品的使用方式,并欢迎他们对新技术的采用。但它希望参与其中,以便更广泛的演员及其成员也能从中受益。
他们说,我们必须保护我们谈判与取代我们成员工作的声音使用相关的条款和条件的权利,包括那些以前在电子游戏中模仿达斯·维达标志性节奏和语调的人。所以,在大型的星球大战系列游戏的几款电子游戏中,都有连续的演员为达斯·维达配音。我认为它正在为达斯
那些演员以及更多游戏寻求这些保护。你刚才在回答中提到了“取代”这个词。这是否触及了人工智能可能会让配音演员失业的更广泛的担忧?
是的,确实如此。我们已经看到这种担忧在人工智能行业以及许多创意领域都在蔓延,我认为创意人员特别担心公司会为了降低成本而采用一些更快、更容易、更直接的技术,而这些技术不需要支付那么多费用。重现声音或重现音频或图像的成本更低。这已经成为一个巨大的担忧,尤其是在游戏行业,在过去几年里,游戏行业一直在全球范围内苦苦挣扎,并且还受到了大规模裁员的影响。我们看到演员和开发者,也就是电子游戏前端的人员,都非常担心
他们的工作将面临风险,因为公司正在寻求节省成本,并采用生成式人工智能等新技术。我想暂停一下,看看如何使用生成式人工智能为非玩家角色或NPC创建声音。这是来自获得艾美奖的动画工作室Baobab Studios的拉里·库特勒。
NPC角色通常由游戏中的AI系统控制。而这个AI系统正在实时收集用户的输入。所以它会考虑用户的行为。它实际上也可能考虑对话或语音。如果是语音,它实际上会运行一个语音到文本转换器,它会将语音转换成文本。如果是语音,它实际上会运行一个语音到文本转换器,它会
它还可能将游戏的其他方面作为背景考虑在内。然后,AI系统需要决定下一步该做什么以及角色可能会说什么。过去,这个AI系统实际上会非常复杂,并且会成为针对该个体角色的定制系统。而有了生成式人工智能,这实际上变得简单多了。我们实际上可以嵌入一个大型语言模型,例如ChatGPT
到AI系统中,此外,我们还可以微调或定制大型语言模型以适应特定角色的个性。现在,LLM实际上正在根据用户输入即时决定和创建响应。
这些响应是文本形式的。因此,我们必须将其转换为语音表演。这是通过一个名为文本到语音的模型完成的。顾名思义,文本到语音实际上是从LLM获取文本响应,并将其转换为合成语音。所以在很多情况下,这是在多个不同的预设语音中进行选择,
但最近,我们能够克隆演员的声音。因此,我们可以让演员通过说台词来训练模型。随着时间的推移,训练文本到语音模型所需的数据量实际上正在变得越来越少。
然后,文本到语音模型会即时发出像那个演员一样的声音。生成式人工智能使您可以开始在游戏中看到更丰富的NPC角色。我认为我们才刚刚触及皮毛。更令人兴奋的是,这些变化发生的速度甚至比几年前还要快。
利夫,现在回到你这里。对于SAG-AFTRA的投诉,《堡垒之夜》怎么说?好吧,我们已经联系了Epic征求意见。他们还没有回复。看看他们的回应将会很有趣……
但我们也知道,SAG-AFR等工会和Epic等游戏公司之间正在就这些条款以及围绕保护员工和企业进行更广泛的对话和讨论。
特别是保护演员免受生成式人工智能的侵害,这已经成为一个非常大的症结。所以我们还没有收到回复,但我相信听到他们的说法会很有趣。♪
利夫,让我们稍微放宽一下视角。游戏公司使用人工智能语音的更广泛影响是什么?好吧,我们之前已经谈到过这一点,但表演者们真的很担心,游戏工作室可能会使用生成式区域来复制他们的声音或他们的外貌来为电子游戏角色制作动画,而最终没有给他们适当的报酬或提供公平的补偿或荣誉。此外,还有这样一种想法,即无法
无法完全控制你的数字复制品或这个AI语音版本,并失去对它在未来几年如何使用、在哪里使用、它说什么或不说什么的控制权。我认为,在各个领域,公司都转向人工智能
人工智能来制作通常由人类完成的事情,对此也存在持续的反弹。我认为人们喜欢从他们消费的内容中感受到那种人情味,在游戏中也是如此。我认为现在的游戏,尤其是大型游戏,比以往任何时候都更贵。为此,我认为观众期望投入大量的时间、精力和考虑,而他们往往觉得使用
可以立即完成工作的生成式人工智能,而且无法思考,无法感受任何东西,这一点并不常见。
无法拥有像人类可能带来的那种同样的情感联系。并且只是补充你刚才所说的话,也许演员最大的防御就是他们本身是人类,他们可以更充分地融入角色。与电脑不同,他们实际上可以表演。我想给你播放一下阿利斯泰尔·麦高恩的这段剪辑。他是英国的一位模仿演员。你必须了解这个角色。这不仅仅是声音。所以人工智能是否能够复制……
人的灵魂,因为声音反映了你灵魂的一切,人的灵魂。我在戏剧学校时有一位很棒的声乐老师叫帕特西·罗登伯格,她说一切都在声音里。
我们知道这一点,西塔,特别是由于我们对人们性格的暗示。即使有人身体略有不适或情绪低落,在打电话的日子里,你会听到他们,五秒钟内你会说,你还好吗?你听起来不一样。你还好吗?你听起来很低落。你还好吗?你听起来像看到了鬼魂或其他什么东西。所以一切都在声音中反映出来。现在,人工智能能复制人的灵魂吗?
所以阿利斯泰尔指出了一个非常明显但也非常重要的一点。人类不是机器人。生成式人工智能,你可以编程它,你可以尝试教它,你可以使用机器学习让它生成一些东西。但最终,观众、听众、接收端的人,他们有心。算法或科学很难穿透人心。♪
所以利夫,让我们展望未来。生成式人工智能领域的监管呢?你认为未来的监管会如何变化?我认为监管机构开始更多地关注围绕人工智能的这场辩论,特别是它如何影响人们的生计以及对此的担忧。我认为
虽然很多事情仍然悬而未决,但我们一直在看到很多的是配音演员和游戏行业的工作人员试图与工会合作,协商更好的条款和保护措施,以帮助确保任何人工智能的使用都得到他们的同意,并且有明确的限制和明确的语言来规定它。
就这方面应该是什么样子,还有很多事情需要敲定。所以还有很多事情悬而未决,我预计要过相当长一段时间,我们才能达到这样一种程度,即特别是艺术家和创意人员能够明确地感受到他们的权利和观点在语言中得到了充分的体现。
立法。来自格拉斯哥的英国广播公司记者利夫·麦克马洪,感谢你的解释。不用客气,感谢你的邀请。今天的节目就到这里。如果你对游戏感兴趣,我们还有几集你可能想看看。其中包括《沙特阿拉伯为何封杀Pokemon Go?》和《游戏障碍,有哪些迹象需要注意?》。你可以在任何你正在收听我们的地方找到它们。我是威廉·李·亚当斯,这是来自英国广播公司世界服务的《世界上的什么》。我们很快再见。