We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

How AI digital doppelgängers could change the way we communicate w/ Synthesia CEO Victor Riparbelli

2024/12/17

The TED AI Show

AI Deep Dive AI Insights AI Chapters Transcript

People

Bilal Sadoo

探讨AI技术与人类社会交叉点的主播和媒体人。

Victor Riparbelli

Topics

Bilal Sadoo: 本期节目探讨了AI数字分身技术如何改变沟通方式，以及这项技术带来的机遇和挑战。数字分身技术可以模拟真实的互动，让粉丝与公众人物互动，并应用于约会软件等领域。Synthesia等公司帮助人们创建数字分身，并被广泛应用于企业沟通策略和员工培训中。 Victor Riparbelli: 数字分身技术并非为了取代现有沟通工具，而是为了更逼真地模拟现实人际互动体验。随着AI技术进步，“数字人类”的概念越来越贴切，因为AI可以高度模拟人类行为。Synthesia提供两种创建数字分身的方式：选择现成头像或定制个人头像，两者使用率相当。用户对数字分身的初始反应与对自拍视频的反应类似，但最终都对结果感到满意。数字分身的接受程度取决于具体应用场景。研究表明，人们更喜欢观看AI生成的视频而非阅读文本，且完成AI视频的速度更快。Synthesia数字分身的视觉逼真度很高，但在肢体语言和情感表达方面仍有提升空间。AI在生成逼真数字分身方面比人工动画更有效。Synthesia未来将支持用户基于现有数字分身创建不同场景下的新视频。用户完全拥有其创建的数字分身，并可自主决定是否删除。Synthesia正在考虑建立一个市场，允许用户许可其数字分身用于商业用途。Synthesia的数字分身技术对企业而言是解决问题的关键工具，而非简单的附加功能。视频将成为企业标配，但高质量内容创作仍然至关重要。Synthesia对平台内容的审核非常严格，以防止其被用于传播错误信息。Synthesia将内容审核的重点放在内容创作阶段，而非分发阶段。未来，实时互动的数字分身将成为可能，但其应用仍需谨慎。在一年内，数字分身技术将能够模拟高保真度的视频通话。数字分身技术可能取代部分人工客服工作，但不会完全取代需要人际互动的职业。未来，拥有数字分身将如同拥有社交媒体账号一样普遍。未来，数字分身可能承担部分用户的虚拟生活任务。未来，人们需要具备更强的媒体素养来辨别线上内容的真伪。未来，内容验证将成为互联网的默认机制。数字分身技术能够赋予更多人表达能力和创造力。 Bilal Sadoo: 本期节目讨论了AI数字分身技术的应用、风险和伦理问题，并展望了这项技术未来的发展趋势。

Deep Dive

Key Insights

Why are digital avatars necessary in a world with so many communication tools?

Digital avatars aim to replicate the human experience of communication, offering a more lifelike interaction compared to text, which abstracts away nuances of speech and expression.

What is the difference between a digital avatar and a digital human in Victor Riparbelli's view?

The terms 'avatar' and 'digital human' both refer to AI-generated representations, but 'digital human' implies a closer resemblance to actual human life, especially as AI improves and becomes more lifelike.

How does Synthesia create digital avatars, and what is the process like?

Synthesia requires around 3-4 minutes of video footage, which can be recorded with a webcam or phone. The avatar can then be customized with different voices, scripts, and languages, and can be used in various environments.

What are the two main ways people can use Synthesia to create digital humans?

Users can either choose from off-the-shelf avatars or create custom avatars of themselves, with both options being equally popular.

How do people typically react when they first encounter their digital avatars?

Many people are initially self-conscious, but they often appreciate the final result, especially if it allows them to avoid the discomfort of being on camera.

What are some of the benefits of using digital avatars for businesses?

Digital avatars allow businesses to create video content more easily and affordably, enabling them to communicate with customers and employees in a more engaging way than text alone.

How does Synthesia handle the ethical concerns around misinformation and misuse of avatars?

Synthesia has strict content moderation policies and requires explicit consent for creating avatars. They also work to ensure that avatars are not used for harmful purposes, though they acknowledge that no system is perfect.

What is the future of digital avatars in terms of real-time interaction?

Synthesia plans to launch real-time avatars within the next year, which will allow for more lifelike, interactive experiences, potentially indistinguishable from human conversations.

How does Victor Riparbelli envision the role of digital avatars in customer service and human interactions?

While some roles like customer service may be fully automated, others that require human connection, like sales or hospitality, will likely retain a human element, as people value the personal touch.

What does Victor Riparbelli believe will happen to media literacy in a world of digital avatars?

He believes that media literacy will become even more critical, as people will need to critically evaluate the authenticity of content, presuming that most online content is fictional unless proven otherwise.

Shownotes Transcript

随着人工智能技术的进步，越来越难以区分人类和计算机的工作。但人工智能是变得更像人类了，还是我们变得更数字化了？Synthesia是一个使用人工智能生成逼真视频化身的视频平台，进一步模糊了人类及其数字化分身之间的界限。在本集中，Bilawal与Synthesia的首席执行官Victor Riparbelli坐下来讨论拥有你自己的AI化身的益处，公司如何使用此工具来改进沟通，以及为什么在真实与虚假界限越来越模糊的世界中，媒体素养比以往任何时候都更重要。他们剖析了向公众提供这项技术所带来的风险，Synthesia为保护其用户而制定的严格规则，并质疑拥有数字克隆的伦理问题。请收听，看看你是否会在不久的将来将你自己的AI化身派去参加那些无聊的会议。有关TED AI Show的文字记录，请访问go.ted.com/TTAIS-transcripts Acast托管。有关更多信息，请访问acast.com/privacy。</context> <raw_text>0 嗨，我是比拉尔·萨杜，TED最新播客《TED人工智能秀》的主持人，我与世界领先的专家、艺术家、记者交谈，帮助你在人工智能改变一切的世界中生活和发展。我很高兴能与IBM合作，他们是本集的官方赞助商。

现在，从生成式AI试点到实际部署的路径往往充满障碍，例如自由数据流的障碍。但如果我告诉你有一种方法可以在你的数据所在位置部署AI呢？使用Watson X，你可以在任何环境中部署AI模型，在云端帮助飞行员导航飞行，在许多云端帮助员工自动化任务，在本地部署，以便设计师可以访问专有数据，

以及在边缘部署，以便远程银行出纳员可以协助客户。Watson X帮助你在任何需要的地方部署AI，以便你可以将你的业务带到任何需要去的地方。访问ibm.com/Watson X了解更多信息，并开始在你最需要的地方注入智能。

嗨，我是比拉尔·维尔萨杜，TED最新播客《TED人工智能秀》的主持人，我与世界领先的专家、艺术家、记者交谈，帮助你在人工智能改变一切的世界中生活和发展。我很高兴能与IBM合作，他们是本集的官方赞助商。在IBM商业价值研究所最近发布的一份报告中，在接受调查的公司中，三分之一的公司在试点阶段后暂停了AI用例。

我们都经历过这种情况，对吧？你对AI的可能性感到兴奋，启动了一堆试点项目，然后就鸦雀无声了。这些试点项目被困在孤岛中。你的资源耗尽了，扩展起来也令人望而生畏。如果不用数百个试点项目，而是有一个能够扩展的整体战略呢？IBM可以提供帮助。

他们拥有65,000名拥有生成式AI专业知识的顾问，可以帮助你设计、集成和优化AI解决方案。访问ibm.com/consulting了解更多信息。因为使用AI很酷，但在你的业务中扩展AI，才是更高一个层次。

证明信任比以往任何时候都更重要，尤其是在你的安全程序方面。Vanta帮助集中程序要求并自动化针对SOC 2、ISO 27001、HIPAA等框架的证据收集，因此你可以节省时间和金钱，并建立客户信任。

使用Vanta，你可以持续了解控制状态。加入超过8,000家全球公司（如Atlassian、FlowHealth和Quora），他们信任Vanta实时管理风险并证明安全性。这是一种新的GRC方法。访问vanta.com/TED Audio了解更多信息。网址是vanta.com/TED Audio。

嘿，我是比拉瓦尔。在我们开始节目之前，我想请你帮个小忙。如果你喜欢TED人工智能秀，请花一点时间在你的播客应用程序中评分并留下评论。你最喜欢哪些剧集？你想听到更多关于哪些主题的讨论？你的反馈帮助我们塑造节目，以满足你的好奇心，邀请优秀的嘉宾，并为你提供最佳体验。♪

如果你可以上网，随时随地与你最喜欢的音乐家聊天，你想付多少钱？如果你可以随时联系一位私人约会教练，帮助你提升在线约会技巧呢？这有吸引力吗？或者，如果你可以制作你的数字副本，并将你的分身发布到网络上，为你处理一些在线身份工作呢？

很多事情实际上已经触手可及。公司正在学习将AI技术与视频、音频和动画工具配对，以有效地模仿真实的人和真实的互动。例如，音乐家FKA Twigs制作了自己的数字克隆，并用它让粉丝与她的一个版本互动。约会应用Bumble的创始人谈到了约会未来可能始于数字化身进行预先面试。

这有点颠覆了AI的论点，不是吗？我们已经讨论了很多关于AI变得过于人性化的潜力和风险，但这是相反的故事。这是关于人类变得更像数字化的故事，从某种意义上说，是成为数字人类。如果你觉得这很有用，有一些公司随时准备帮助你创建你的数字版本。其中一家公司叫做Synthesia。

使用你用手机或网络摄像头录制的简短五分钟视频，你可以构建一个合理的人类复制品。然后，你可以选择一个声音，给它一个脚本，将其翻译成几十种语言，添加一些设计润色，现在你可以将看起来相对专业的视频内容推送给你的粉丝、员工或任何人。无需布景、演员或汗水。

Synthesia的许多客户不是个人。他们是像喜力、Zoom、施乐这样的大型全球公司。Synthesia表示，超过50,000名客户已将其数字化身融入其沟通策略。

在当今竞争激烈的市场中，作为团队领导者，我们需要做的不仅仅是胜任自己的工作。这意味着我们需要成为领导者、教练和培训师。我们还需要体现公司价值观、使命和愿景。这听起来可能像一个通用的、典型的计算机生成的声音。当然，它是。但它也是伊莱克斯（一家全球家电公司）用来分发视频模块以帮助培训其员工的Synthesia化身的声音。

这项技术令人印象深刻，以至于去年夏天，投资者将Synthesia的估值提升至独角兽级别，达到令人羡慕的10亿美元估值。似乎很多人对看到数字人类起飞并接管我们现在以及未来彼此沟通的方式非常感兴趣，并且现在也为此投入了大量资金。

但在我们努力构建栩栩如生、有用的数字化身的过程中，我们是否正在改写我们对人际沟通的理解？在一个可能很快就会被数字分身主导的世界中，我们是谁？我是比拉尔·阿尔-萨杜，这是TED人工智能秀，我们将在这里弄清楚如何在人工智能改变一切的世界中生活和发展。

你的AI模型真的了解代码吗？它的特定语法、结构和逻辑？IBM的Granite代码模型了解。它们是为代码而专门构建的，并接受过116种不同编程语言的训练，可以帮助你快速生成、翻译和解释代码。因为你的AI模型对代码了解得越多，它就能越能帮助你。现在就访问ibm.com/granite开始吧。IBM，让我们创造。

在一个充满数字分身的世界中，成为人类意味着什么？我知道，这是一个很大的、引人深思的哲学问题。但维克多·里珀贝利是那些经常思考这个问题的真实人类之一。他是Synthesia的联合创始人。

嘿，维克多，欢迎来到节目。谢谢，伙计。很高兴来到这里。首先，为了让这次谈话更清晰，我们已经有许多沟通工具了，你已经谈到文本是人类沟通的原始数据压缩。但现在我们有视频通话、消息、社交媒体、播客、新闻通讯、电子邮件，等等。为什么需要数字化身？我认为，从根本上说，

我们为沟通发明的几乎所有技术都抽象化了一些东西，对吧？文本是最明显的例子，如果你把我和你在现实生活中交谈并传递某种信息，与你感知信息、解释信息的方式进行比较，

这将与我向你发送完全相同的文字信息的方式大相径庭。我的意思是，甚至在文本出现之前，对吧？我们有洞穴壁画以及各种其他技术，这些技术基本上帮助我们存储信息并将其传递给其他人，时间和地点不同。从那时起，我们一直在做的就是尽可能地使这些技术尽可能接近我们在现实生活中所拥有的体验。

我认为我们有很多方法可以做到这一点。但显然，这样做最终的方法是你可以复制与某人交谈的实际人类体验。当然，数字人和数字化身是其中重要的一部分。关于这一点，我听说你将你的化身称为数字人。在你看来，有什么区别？

我认为有很多不同的词语围绕着AI克隆、AI化身、AI人。我认为最终，我认为它们都大致代表相同的东西。如果你说它是化身、面孔或角色，这意味着它是一个非人类实体，而如果你使用“人”这个词，则意味着它有某种不同之处。在我们现在所处的时代，计算智能正在非常非常迅速地发展，

也许我认为人们现在谈论数字人的原因是，它实际上感觉……

我们可以创造出非常接近人类生活的东西，对吧？在现实世界中，但在此之前，我认为是在数字世界中。我们所有人都在与ChatGPT和大型语言模型互动。我们亲眼目睹了它的力量，以及它能够假装成人类的程度。如果我们也能赋予它们这种视觉表达和音频表达，数字人，我们实际上确实感觉我们会非常接近

能够创造出感觉像数字人的东西，不仅仅是因为我们使用了这个词，而是因为当我们与它互动时，它实际上感觉像那样，对吧？明年，我们将推出一个我们可以实际交谈的实时化身。我认为可能有一些东西，那就是当我们开始将其更多地视为人类，而不是将其视为技术时。我认为一个很好的方法是

当你想到像ChatGPT这样的聊天机器人时，一件非常有趣的事情是我自己也这样做，我认为大多数人也这样做，那就是当你与这些系统互动时，人们实际上非常有礼貌。是的，当然。你与ChatGPT交谈就像它是一个同事一样。你说“请”。这有点奇怪，对吧？因为你正在与一台据我们所知没有感情的计算机互动。但由于这项技术现在如此强大，尽管我们有意识地知道我们正在与大型语言模型互动，

很难有这种感觉，对吧？我认为这是我们与机器的关系即将发生巨大变化。数字人将是对此最明显的表达。一个人可以使用Synthesia创建数字人有两种方式。他们可以选择你拥有和构建的这些现成的化身，或者他们可以定制自己的化身。我很想知道，哪种方式更受欢迎？

实际上大约各占一半。一开始，我们有点像，哪个更重要，对吧？我认为随着时间的推移，很明显，这个问题没有答案。它们都服务于不同的目的。我们在公司成立之初就学到的一件事是，人们如此喜欢这款产品的一个重要原因是他们不必亲自上镜。他们不喜欢自己的声音。他们不喜欢自己的口音。因此，围绕Tenduza的价值主张的一个重要部分实际上是人们

可以制作视频而无需成为自己，对吧？这是一个相当大的突破。但也很明显，也有一些用例是你希望成为自己的，对吧？因此，如果你是一位首席执行官，正在为明年的公司战略制作视频，那么来自一个匿名化身就有点奇怪了。如果你是一位销售人员，正在向你的潜在客户或现有客户发送视频，以更新他们产品中发生的事情，那么这很符合逻辑，所以等等。所以我认为这只是，将会有许多不同类型的用例。我认为我们将看到人们自己化身的混合。我们将看到

完全生成的化身，这些化身是针对公司和我们的客户的，对吧？所以你可以构建你自己的知识产权，如果你愿意的话。还将有一些现有的名人，这将

在他们如何以比以前更可扩展的方式与品牌合作方面，将会有一个巨大的突破。看，即使对我自己来说，我也希望我的数字化身、数字人能够被委派去做很多事情，特别是录制视频的设置过程，我认为这很痛苦。但我对你说过的那类人群很好奇，他们对不必经历这种痛苦感到非常兴奋，或者可能没有在到处都是摄像头的这个世界上成长起来，并拥有自拍文化。

当这些人第一次遇到他们的数字化身时，你通常会看到什么样的反应？很多人非常害羞，就像他们录制自己的屏幕录制或自拍视频一样。

但人们喜欢他们喜欢的结果。我认为这里一个有趣的轶事是，例如，在Instagram的早期，Instagram采用的重大增长策略实际上是图像和视频上的滤镜，对吧？这实际上非常简单。就像你拍一张照片，然后你让它稍微饱和一点。你把它变成黑白的，或者其他什么。但这使得这张照片看起来比以前好得多，对吧？而人们之前用家用相机拍摄的每一张照片，如果没有经过人工编辑，看起来

相当糟糕，这对于大多数人来说是不可行的。所以我认为我们看到很多这样的情况与化身相同。

人们想要修饰自己。他们想确保自己像，你知道，在一个灯光良好的环境中拍摄，穿着最好的衣服。他们希望成为自己最好的代表。但总的来说，人们喜欢它，对吧？人们，尤其是那些不想出现在视频中的人，一旦他们对自己的化身感到满意，就会为他们解锁很多东西。例如，那些原本每周都被要求录制几次视频的高管，现在不必这么做了。他们可以与团队合作，自动创建内容。

然后我认为人们也有这种……在个人层面上，对吧？第一次看到你的化身是很奇怪的。第一次听到自己说一种自己不会说的语言也很奇怪。这显然是你的声音。听起来像你。我认为这对人们来说是对未来的一个非常有趣的瞥见，对吧？很多这些……

我喜欢生成式AI作为一种文化运动和技术运动的原因是，它如此易于访问，以至于我们所有人实际上都能亲身体验这些技术意味着什么，对吧？它们能做什么？它们有多强大？我认为这只是对AI可以做的一些事情的一种非常直观的体验。我认为每个人都觉得，好吧，这只会越来越好，对吧？尽管我们已经取得了很大进展，但还有很多事情要做。

我的意思是，这些化身真的很酷。而且我要说，我的意思是，特别是来自VFX和CG背景，在这个阶段你可以看出它们仍然是化身。存在着整个恐怖谷问题。我很想知道在消费方面，人们的反应如何？上下文在那里是否重要？例如，如果人们在销售入站电子邮件中对视频做出反应，与在银行网站上与之对抗，以及虚拟首席执行官的讲话。

人们如何在这些不同的情况下对这些数字人做出反应？

所以我认为你在这里说对了，对吧？这与上下文密切相关。我很确定，如果我用我的化身录制一封写给我女朋友的情书……这就像“你把这个外包了吗？”她可能会有点失望，因为我派我的化身去做这件事，而不是我自己。但如果你是一个用户，试图在银行网站上了解你的抵押贷款申请，并且你看到10页包含非常复杂信息的文本，

几乎每个人都更喜欢观看简化信息的视频，对吧？所以我们通常看到我们的许多客户，我认为几乎所有客户，他们都会介绍化身，比如，“嗨，这是你的虚拟引导员。这不是真人。这是一个化身，它将帮助你完成购买流程。它将帮助你加入我们的公司，等等。”我们压倒性地看到的是，人们真的喜欢与这些视频互动，特别是如果替代方案是文本的话，对吧？

我们刚刚与伦敦大学学院进行了一项大型研究，因为我们想调查人们如何对这些视频做出反应。有一些有趣的统计数据。其中之一是

人们实际上比观看人类视频更快地完成了化身视频。这是因为当他们观看人类的视频时，人类更不完美，对吧？比如，你知道，我们可能会使用太多词语，或者我们说的话有点笨拙，或者其他什么。因此，人们会倒回视频以再次观看某个部分。但对于化身来说，因为它从一开始就写好了脚本，所以信息实际上更简洁。

而且压倒性地表明，人们更喜欢通过观看AI视频而不是阅读文本进行学习。你刚才提到的研究，你提到的统计数据对我来说很有意义，对吧？这就像你正在提炼信息，并以比比如说与人类进行冗长的对话更清晰的方式进行沟通。虽然，你知道，有些人比其他人更简洁，对吧？

但是，对于首席执行官的例子来说，逼真度对你来说有多重要？也许为了让情况更清晰，如果我要求你对你的化身目前的逼真度进行1到10分的评价，你会把它放在哪里？我认为如果你，我认为你必须稍微剖析一下。我认为你将逼真度视为它看起来有多真实？我认为它非常接近10分。我认为……

如果你拍摄视频的静止画面，我认为很难看出它是一个化身，这很大程度上是因为AI非常擅长渲染。我认为化身仍然需要改进的地方是肢体语言与你所说内容的匹配。我们所说的话有一种节奏。当我对你说话时，我的眉毛会以特定的方式移动，我的手会以特定的方式移动。我们用身体进行这种交流，我们在现实世界中没有注意到这一点，因为我们所有人都在这样做。

但当我们看到一个肢体语言有点不同步的化身视频时，我们会注意到这一点。因此，当今市场上大多数化身产品以及

不是我们的，而是大多数化身公司通常的做法是，你拍摄一个人的真实视频，然后无限循环播放，只是改变嘴唇。这种错觉在较短的时间内效果很好，但你会开始产生一种奇怪的感觉，头部运动不协调，他们的手势与所说内容不符，这会让你有点不知所措，对吧？我认为这里还有待改进。我们很快就要推出的新模型具有完整的肢体语言，包括手势。这会有很大的不同。

然后我认为在声音方面，还有一些不完美之处。但我认为视觉质量或多或少已经到位了。更多的是关于化身肢体语言和情感表达的最后百分比，对吧？

你所说的对我来说很有道理。所以这几乎就像视觉保真度，如果你只看这一点，那就很酷。它已经跨越了恐怖谷。但另一方面，是的，你完全正确。比如那种情感品质和肢体语言，比如运动，这仍然需要一些改进。而这部分就像，同样，AI会，我认为我们内部的模型或多或少已经解决了这个问题。但基本上，我认为我们看到的是，无论你投入多少人类动画师来制作数字人的动画，

我们都无法完美地制作动画。作为人类，我们对最细微的不一致之处都非常非常敏感，对吧？AI和生成式AI的惊人之处在于

旧式的方法是这样的，对吧？你作为一个人坐下来，试图列出关于某人应该如何移动的确切说明。当然，对于AI来说，我们正在做的是相反的事情。我们说，我们不会告诉你该做什么。我们只会向你展示人们实际移动方式的许多例子。你可以自己弄清楚这意味着什么，对吧？所以我们不会告诉计算机，嘿，这里有……

六七块面部骨骼和肌肉以及所有这些抽象的东西，从某种意义上说，是我们人类用来制作数字人动画的。我们可以把这些都抛在脑后，并对机器说，你找出身体如何运作以及人们如何移动的自己的分类法。这可能是一个人类永远无法坐下来理解的50亿参数模型。但如果计算机理解它，

谁在乎呢，对吧？它可以产生看起来和感觉都非常逼真的输出。我认为这是我们在每种模式中看到的，对吧？只是AI非常擅长这一点，因为它可以比人类更抽象地思考，并且在更多参数和维度上思考，对吧？

1-800-鲜花通过帮助你应对生活中的重要时刻来减轻压力，让你轻松找到完美的礼物。

从鲜花和饼干到蛋糕和巧克力，1-800-鲜花可以帮助你找到合适的礼物来表达你的感受。要了解更多信息，请访问1-800-Flowers.com/ACAST。网址是1-800-Flowers.com/ACAST。订婚可能会很紧张。在BlueNile.com上，选择合适的戒指不会很紧张。BlueNile.com的珠宝商已经将闪耀的科学技术运用到极致，拥有美丽的实验室培育钻石，值得你最辉煌的时刻。它们是最闪耀的。

他们的实验室培育钻石经过独立分级，保证与天然钻石相同，并可直接送货上门。使用代码LISTEN，在BlueNile.com上购买500美元或以上商品可享受50美元的折扣。网址是BlueNile.com，代码LISTEN可享受50美元的折扣。

瑞恩·雷诺兹在这里，我想，这是我为Mint拍摄的第100个广告。不，不，不，不，不，不，不，不，不。我的意思是，说实话，当我开始做这个的时候，我以为我只需要做四个这样的广告。我的意思是，每月15美元即可享受无限高级无线服务。为什么还有人支付两到三倍的价格？对不起，我不应该在这里指责受害者。准备好后，请访问mintmobile.com/switch试用一下。对于

我喜欢这个，因为这绝对是你所说的与好莱坞传统做法的巨大区别，就像，你知道，疯狂的灯光舞台扫描，你基本上在这个圆顶里，周围都是指向你的灯，或者，你知道，美杜莎扫描，你必须做出这些明确的表情。

所以这真的让我很好奇，你知道，对于你提供的许多现成化身，你在生成这些化身时确实捕获了大量你自己的训练数据。当然，人们也可以制作自己的数字孪生体，自己的复制品。是的。这个过程现在是什么样的？未来会是什么样的？

现在，我们需要大约三到四分钟的某人的镜头。这只是，我的意思是，可以用你的网络摄像头录制。你可以用手机录制。你可以去工作室。今天，你仍然基本上是输入即输出，正如我们通常所说的那样。因此，如果你用你的网络摄像头录制，你将获得一个视频作为回报。你的化身将是你坐在那里用网络摄像头录制自己的样子。如果你去工作室，那将是你待在工作室的样子。我们很快就要推出的重要功能是能够基本上创建你自己的化身一次，然后录制

创建你化身在不同环境中的新变体。例如，假设你录制了一个你在家里播客工作室里坐着的视频，但现在你实际上想录制一个你在山顶上、驾驶飞机或跳伞的视频，以及其他无数的事情。

然后，我们可以通过你只需使用文本提示自己进入新的场景来为你创建那个化身。酷。这将是一个巨大的、巨大的、巨大的突破。所以它的工作方式是我们仍然需要一些你的视频。我们需要一些你的视频的原因是，如果我们只是从你的图像开始，这基本上是你希望它工作的方式，对吧？你拍一张照片，然后你可以生成你自己的场景。然后我们不知道你长什么样

你如何移动，你的头是如何转动的，对吧？甚至我的牙齿，你知道吗？甚至你的牙齿，你说话的方式，我们永远无法仅仅从一张照片中推断出来，对吧？因为信息根本不存在。但我们想要做的是，我们想要建立一个模型，它能准确地说，这就是你移动、说话以及你的手与你所说的话如何配合的方式。

然后一旦我们有了这个模型，我们就可以更容易地说，好吧，这是你站在山顶的照片。这是你在超市里的样子。这是你在酒吧后面的样子，或者其他什么。然后我们可以开始创造这些新的场景。我认为，你知道，这将是那些在人们使用产品的方式和你能从中获得多少乐趣方面产生巨大影响的进步之一。

我喜欢这样。它有点像取代了整个绿屏视觉效果工作流程，对吧？如果你只是在合理漫射、良好的光线下捕捉它，你突然就可以，你知道，选择一堆不同的背景。就像虚拟制作民主化了一样。在我被带走并对此过于兴奋之前，我确实有一个问题。比如，如果有人创建了这个化身，假设我创建了它，谁拥有它？我可以授权我的数字分身吗？

所以你拥有它100%。如果你想删除它，我们当然会完全删除它。无需多问。情况将永远如此。我们正在考虑如何处理肖像权，以及我们是否应该创建一个市场，让人们可以将他们的肖像权出租给品牌或创作者。这还不是我们拥有的功能。令人兴奋的是，它开启了如此多使用你的肖像权的新方法，对吧？所以假设你是一位名人，例如。名人与品牌互动的传统方式是

你会说，好吧，大明星小姐，我们将进入这个仓库。我们将和你一起拍摄广告。我们将拍摄大量静态照片。这将是我们未来所有活动的素材。也许他们还会录制一些社交媒体片段。然后你就完成了。你已经录制了所有内容，现在品牌可以使用它了。

这解锁的是，如果你有一个电子商务商店，每次有人购买产品时，你都希望从一位知名人士那里发送感谢信息。突然之间，这位名人并不一定需要做太多事情，只需要说：“是的，我同意。我将授权我的肖像权。”也许与其说是对名人的巨额预付款，不如说是每次有人在该商店购买产品时，名人就获得1美元的报酬，对吧？

如果商店想尝试其他人，可以快速更换名人。或者也许他们认为，对于一部分客户来说，名人A是最佳选择。对于另一组客户来说，名人B是正确的选择。因为这里的一切都是用代码生成的，你实际上可以开始做这些事情。

所以我认为我们将看到名人和一些人合作的民主化，在某种程度上，今天你需要数百万美元和巨额预算才能与大牌名人合作。通过这种方式，名人实际上可以选择他们想与谁合作，对吧？也许一位名人更愿意与遍布美国各地的500家小型手工商店合作，每家商店都向他们支付，你知道，什么……

但更少，但总计支付的金额与一次大型可口可乐活动相同。我认为这实际上非常有趣，因为我的猜测是，如果你问一些小名人他们更愿意与谁合作，

他们可能更愿意与销售他们真正喜欢的产品的小型手工商店合作，而不是那些向他们投入数百万美元的大型品牌，对吧？所以我认为我们将看到许多新的商业模式出现。我个人认为这非常令人兴奋。这确实令人兴奋。它让我回到了贵公司对B2B的关注。鉴于你的大多数客户都是企业，对吧？

你知道，他们使用它来做什么样的东西？而且，你知道，过去，你将这种说法描述为，你知道，它是娱乐行业的维生素，但对企业来说却是止痛药。这是为什么呢？

当我们创立公司时，我们最初，正如你所说，我们着手为视频专业人士构建工具，以提高效率。我们做的第一件事是构建这种AI配音功能。你拿一个真实的视频。我们做了一个非常著名的视频，大卫·贝克汉姆，显然是用英语说的。然后我们可以拍摄那则广告，并将其制作成10种不同的语言。所以看起来大卫·贝克汉姆在这种情况下是用不同的语言说话。这绝对是一个非常酷的产品。它引起了很多兴趣，并且在市场上表现不错。

但我们只是有一种感觉，如果我们明天消失，他们会找到另一种解决问题的方法，对吧？这是一种很酷的事情，但这并不是真正的止痛药，对吧？这是一件不错的事情。围绕一件不错的事情建立一家大公司非常困难。你想出售人们真正需要的东西。因此，当我们努力将该产品推向市场，并真正尝试从第一性原理构建对视频的理解时，我们突然有了这种感觉，即

世界上有很多今天没有制作视频的人，他们渴望制作视频。当我们与这些人交谈时，他们显然没有在视频行业工作，对吧？他们在大型公司工作。他们就像营销经理、培训讲师、销售专业人员等等。他们都在告诉我们，他们渴望制作视频。他们有很多很棒的内容，很多他们想与客户和员工分享的知识。

但没有人再阅读了，对吧？他们发送的这些电子邮件最终都存档了。所以他们想制作视频。他们试图制作视频。问题是，如果你在一家大公司工作，通常有很多内容要制作，这意味着你必须制作的视频数量非常多。通常需要翻译它们。在你拍摄它们之后需要更新它们，因为你的业务发生了变化。

而这对于真实的视频来说是不可能的。因此，对于这些人来说，如果我们能给他们一种制作视频的方法，这种方法比用相机拍摄要容易一千倍，也便宜一千倍，那么他们可能对这些视频的质量低于视频行业的要求是可以接受的。因为对于这些人来说，替代方案不是来自相机的真实视频。替代方案是文本。所以这就像，你是将它与真实的视频进行比较吗？你是将它与文本进行比较吗？

这不像人们说的那样，我们过去用相机拍摄的所有这些内容，我们现在将用Cintiq代替。人们说的是，好吧，我们拥有所有这些文本，所有这些幻灯片和所有这些静态信息，我们现在可以将其转换为视频内容。一旦我们弄清楚这一点，这便成为我们的转折点。我认为有……

我喜欢你之前说的话，因为我们也有同样的感觉，对吧？这就像，潜在的视觉效果的最大市场实际上将在几年后成为企业沟通，而不是好莱坞，这有多奇怪，对吧？这非常矛盾。就像没有人会想到会发生那样的事情。但在许多方面，我认为最大的想法、最有影响力的想法总是感觉非常奇怪和非常矛盾，对吧？比如Airbnb，我认为这就像，如果人们只是邀请直接睡在他们的家里？是的。

花一点钱。每个人都会说，你绝对疯了，对吧？但我认为这就是技术的作用。它挑战了许多这种固有的假设。我认为在我们的小世界里，这是一个很好的例子。因为最终我们所做的，正如你所说，是特效，对吧？是视觉效果。我们称之为AI，因为我们使用AI，但在其核心，对吧，它与好莱坞多年来一直在尝试做的并没有太大区别。

绝对是视觉效果的艺术和科学。我很好奇，对吧？在消费者方面，存在短视频疲劳和视频疲劳。每个人都在一直制作视频。但在企业方面，正如你提到的，有很多内容根本不会转换为视频形式。

如果你将其推向极限，你认为是否存在类似的风险，即我们最终会用一堆一次性内容污染我们的信息流？这将就像企业B2B视频内容的冲击一样。但我认为将会发生的是，视频将成为门槛。所以今天，电子邮件是门槛，对吧？

你不会在不发送电子邮件的情况下运营公司。在某个时候，如果你向我发送包含大量文本的电子邮件，你根本不会打开它们，对吧？你未来的收件箱将更像你的TikTok信息流，你只需快速浏览一下哪些内容有趣。而且一如既往，就像今天的电子邮件一样，仅仅因为某些东西变得

更容易制作。你仍然必须是一个伟大的讲故事的人。你仍然必须弄清楚什么才是吸引我注意力的正确方法，才能让你看完你的视频，并与你联系，或者你希望我做的任何事情。我认为所有这些关于讲故事、打造优秀产品和擅长沟通的事情都不会消失。所以我认为现在是真的，未来也是如此，这关乎策划和脱颖而出。

因此，我们正在看到内容爆炸式增长。当然，每次像你正在创建的工具出现时，人们都会将其用于错误信息和虚假信息。对。因此，过去曾发生过Synthesia化身被用来传播虚假信息的情况。这些事件在多大程度上促使你锁定或限制这些化身的技能？

因此，安全方面对我们来说一直非常重要，并且你知道，自从我们在2017年创立公司以来，我们是在一个名为“自由海洋同意控制协作和内容”的道德框架下这样做的，我们永远不会在未经明确同意的情况下创建任何人的化身，这是一种硬性停止，这意味着我们可能会失去一些病毒式传播，因为我们不会为名人的讽刺或其他任何事情制作有趣的视频，对吧，但这是我们决定做出的选择

第二个是来自控制，对吧？这就是基本的內容审核，即我们对你可以使用该平台做什么以及不能使用该平台做什么采取非常强硬的立场。我们是一家B2B产品公司。我们与企业合作。因此，在某些方面，我们可能过于严格。你知道，有一些我们非常严格限制的合法内容类别。我们付出了很多努力，无论是机器还是人类，以确保人们不会将我们的平台用于他们不应该做的事情。

我认为，对于过去发生的这些事件，我们总是会被通过的视频所评判，而我们每次都会从中吸取教训。在许多方面，对吧，当你进行概念审核时，无论你采取什么方向，很多人都会不同意你。是的，你不会让每个人都满意。的确。当然，当涉及到新闻和政治等问题时，尤其如此。

宗教等等，这变得非常非常棘手。无论你做什么，都会有人不喜欢，对吧？因此，其中一个具体实例，我认为这是我们在内部讨论了很多的实例，即有人制作了一个视频，我将省略它的细节，但本质上是一个关于非常棘手的话题的视频，对吧？一个会将人们一分为二的话题，要么你非常赞成，要么你非常反对。而该视频实际上完全是事实性的。

但一家大型报纸并没有将其视为一种宣传信息。这对我们来说非常有趣，因为我们对它进行了事实核查，里面没有任何不真实的东西。你可以争辩说，以某种特定方式谈论它是一种策略，可以让人们相信某些特定的事情。但我的意思是，所有沟通都具有这些特性。而且

因此，我们决定采取更加严格的措施。因此，除非你是企业客户，否则我们不允许新闻和时事内容。这实际上很可惜，因为我们有很多非政府组织、公民记者和那些在平台上制作精彩内容的人，但这最终太难管理了。因此，我们决定这样做……

制定这项规则。所以这是我们一直在努力的事情。正如我所说，我们并不声称自己是完美的，但我认为我们今天已经拥有非常非常好的系统，可以将坏人拒之门外。

我必须说，你采取的立场确实更加严格。我听到大多数平台创建者都将此推到分发点，他们说，好吧，创建工具不应对此负责。分发平台应该是那些，你知道，采取行动的人。看，我认为这些问题非常困难，对吧？而且有很多不同的思考方式。你可以从哲学角度思考它们。如果有一个问题是言论自由，从实际的角度来看，这仅仅是关于排除

我们都同意是坏人的坏人吗？这是一个经济问题吗？因为我过于严格并且为其他竞争对手敞开了大门，所以我的公司增长受到阻碍了吗？有很多角度。这不是一个简单的问题，对吧？我们讨论了很多的是，现在正在发生转变，尤其是在人工智能领域，许多公司正在将审核点转移到创建点，对吧？

当然，对于大型语言模型，我们一直看到这一点，对吧？有很多事情他们根本不会谈论。他们肯定不会帮你制作炸弹的配方之类的。但即使是更普通的主题，比如政治显然是一个明显的主题，他们也会非常谨慎地绕过这些事情。就我们而言，情况大致相同，我们实际上限制你创建内容。我一直将此解释为，这实际上非常新颖，对吧？想象一下，当你使用PowerPoint、Microsoft Word时，

它会阻止你制作关于如何做可怕事情的幻灯片，对吧？这对大多数人来说是一个非常奇怪的想法。但在许多方面，这实际上就是我们正在做的事情和我们正在构建的事情，对吧？没有人曾经……

让微软对学校枪击案凶手可以用Microsoft Word撰写他们的宣言负责，对吧？或者我确信有人制作了关于如何在战争中做邪恶、可怕的事情的PowerPoint演示文稿等等。但我们从未将此视为微软的责任。我们一直认为这是内容实际上传到某个地方后分发平台的责任。

但我确实认为，作为一个社会，在我们开始推出这些东西时，我们可能最好格外小心。然后，你知道，也许在10年、15年后，我们会对事情有不同的看法。

这些技术应该如何使用和管理。但作为起点，我的道德倾向和我公司的其他成员的道德倾向是，最好稍微落后一点，比某些人感觉舒服的要严格一些。现在，基于讨论并展望未来，你谈到了明年，你将拥有可以实时与之交谈的这些化身。我们遇到了一件有趣的事情。我们与ChatGPT高级语音模式一起制作了这一集，

其中施加在其上的防护栏和限制几乎阻止了化身变得完全像人类一样，你知道吗？如果它过于局限，你可以看到这些接缝，这会破坏幻觉。你如何看待这种张力，尤其是在你转向这些更具表现力的产品体验时？我完全同意你的观点。我认为

作为人类，我们如此擅长检测非人类的东西，这对我来说是如此令人着迷。当你与语音模式聊天时，对吧，就像你理解一样，好吧，这将帮助你回答一些实际的事实问题。每次你要求它发表意见或表现得像人一样时，它都会默认回到，你知道，回到那种像

某种程度上的机器人语音。在某个时候，你知道，我认为这些限制将会解除。对于与感觉非常非常逼真的计算机进行交互，存在巨大的市场和巨大的需求，对吧？所以我认为我们将看到这种界限随着时间的推移而消失。至于我们，

我认为，我们再次做出了成为一家B2B公司的决定。因此，在不久的将来，我们不会提供虚拟男友和女友。但我认为许多这些特性在商业环境中也很有趣，对吧？例如，如果你是一名销售人员并且进行销售培训，如果你可以与潜在客户进行角色扮演，

可以对其进行编程并提示其以特定方式行事，你可能比阅读有关如何应对不同异议的文档要快得多。我认为还有很多其他潜在的更具争议性的应用。想想心理学、治疗师和医生。我认为我们将在未来几年看到很多这样的应用出现。我认为最终，

对于许多这些用例来说，要真正发挥作用，它必须感觉非常逼真。我认为，如果你正在与一个看起来像90年代电脑游戏的销售模拟器进行交互，

你只会与它断开连接。它不会起作用，对吧？我认为现在我们非常非常接近，就像穿过恐怖谷一样，它实际上会感觉非常非常接近于与真实的人进行Zoom通话。这很有趣，即使你的重点是B2B，你刚才也概述了一系列场景，其中盒子足够大，你可以拥有非常有意义的互动体验。所以我必须问你，我们距离拥有可以让人感觉与人类对话无法区分的AI化身还有多远？

老实说，我认为我们并不遥远。我认为在12个月内，你可能能够以相当高的保真度模拟Zoom通话。我认为这方面的语音组件正在走向成熟。那里有很多很棒的技术。而视频部分，取决于你试图模拟什么，但是

如果你看看我们现在正在互相观看的视频，对吧？这是一个压缩的Zoom提要，那么这并不是最难复制的事情。而且你已经会预期到一堆伪影、压缩和所有这些东西，对吧？所以如果这是目标，那么我认为你离它并不遥远。

让我用稍微不同的方式来问这个问题，尤其是在视觉保真度方面。并以你之前的例子为例，多久之后你才能将那封数字情书寄给你的女朋友，而她相信它实际上来自你？我认为明年。我认为它并不遥远。我认为看看我们现在正在构建的东西，我们拥有这些组件。我们已经教导了一个系统如何

预测与你所说的话相符的正确的肢体语言、面部表情、手势。我们可以生成高质量的语音，使其听起来深沉、真实和富有情感。所以我真的不认为它超过12个月。这将非常有趣。通常，在内部，我们将其称为视频的ChatGPT时刻。我认为ChatGPT如此强大的原因在于它真正突破了恐怖谷，对吧？你第一次使用ChatGPT时，它如此人性化，以至于你开始下意识地像对待人类一样与它交谈。

无需多想。我认为对于音频和文本转语音，

已经做到了这一点。对于视频，我认为这已经非常接近了。因此，在内部，我们认为这就像当你能够生成YouTube上博主的视频一样，你知道，传统风格，就像坐在我的卧室里，对着你说话一样，你可以在足够高的质量、足够高的保真度下生成它，你会在某一天下班回家后，戴上化身视频，然后坐下来观看化身说话18分钟，就像很多人对博主所做的那样。这就是这些技术的总市场爆炸式增长的地方，比如，

一千倍。我认为当这种情况发生时，潘多拉魔盒就打开了。关于这意味着什么，将会有很多伦理问题、文化问题和艺术问题。我认为我们正处于一个非常有意义和强大的时刻。

那么让我们来谈谈这些伦理问题。我的意思是，这很有趣，对吧？假设你拥有这些可以实时与之交谈的逼真化身。这项技术最终能否完全取代人类，例如，在客户服务角色中？

你如何看待这种张力，对吧？这就像，你如何确保这项技术增强而不是取代人际互动？因为一直萦绕在我脑海中的事情是，在晚上11点左右开车到酒店。而不是那里有人，而是一个iPad。你知道，它是多模式的。它可以看到我。它会检查我，我会做所有事情。它很完美。它可以全天候工作。但那里没有人。你已经看到一些酒店尝试这样做，他们现在基本上有一个远程工作人员扮演这个角色。

但最终它将是自主的。这只是一个例子。你如何看待潘多拉魔盒的打开？我认为最终有两种用例。例如，如果你打电话给客户支持，你并不真正关心客户支持代理是谁，对吧？你只关心以最快的方式解决你的问题。我认为如果我们用代理或机器人来代替它，我认为没有人会在乎。我认为这肯定会发生。这是一个技术足够好时的问题。

如果你以销售人员或酒店接待员为例，我认为有些酒店会想要最便宜的房间。他们希望拥有最快的体验，就像拿到房卡并进入房间一样。

其他酒店会非常重视在门口迎接你，为你拿行李，解释这个周末城市里发生了什么等等。这是一个非常依赖服务的商品。我认为对于那些事情，我们真的会重视人际关系。我认为这与销售人员的情况有点相似。很多人想和销售人员交谈，因为……

这是你与其他人建立的关系，对吧？我认为我们无法取代这一点。我认为人情味和人性元素在未来会变得更加重要。人工智能在取代整天在Excel电子表格中打字的人方面会比服务员在当地餐馆给你带来很棒的体验要快得多。

我认为这说得很好。但我想问你，你是否预见到一个拥有数字化身像拥有社交媒体个人资料一样普遍的世界？例如，Meta最近宣布了在其平台上为创作者提供数字化身工具。绝对的。我认为这只是技术的演变。

我们今天拥有的个人资料。从某种意义上说，你在社交媒体网络上的个人资料也是你的克隆。它可能不像你的化身那样可见，但这就是它，对吧？它是你的数字代表。

如果我回到童年时代，那时我在论坛上，对吧，我们会使用用户名。然后是下一代论坛，你会有一个用户名和一张个人资料照片。然后你会有一个带有个人资料页面的个人资料照片，你可以在上面写一些关于你自己和你的兴趣或其他任何东西的内容。然后我们都升级到社交媒体。现在我们不仅有一张自己的照片，我们还有一整套照片来谈论我们自己。在TikTok上，我们有一整套视频来解释一些关于我们自己、我们是谁以及我们在世界上的位置等等。所以我认为在许多方面，这只是这种自然演变。

我们将拥有代表我们在数字空间中的数字角色。那么你是否想象这项技术发展到一定程度，例如，我的数字自我不仅代表我在虚拟世界中，而且从某种意义上说，它也代表我过着我的虚拟生活？是的。

我不认为这不可能，你知道的。我认为，再说一次，我不认为我会像与现实生活中的朋友互动那样享受与朋友的机器人互动，因为我知道那实际上是他。我认为这将是，再次，更实际一些。也许我们会有一些代理人，比如，“嘿，你六个月没见过西蒙了。”

我们为什么不安排一下？我会说，是的，这实际上是个好主意，对吧？然后我的AI会去找西蒙的AI，说，“嘿，这些人很久没见面了。我们为什么不给他们安排几个月后见面呢？”我们知道他们都喜欢听电子音乐。所以让我们找一场音乐会，或者

嗯，你知道的，在附近找个狂欢派对，然后安排好，对吧？所以我想，再说一次，它更实用，我认为。我不认为这会像我们的AI代表我们进行交流，然后向每一个人详细说明在我们学生生活中讨论的内容。我希望不会这样。但我认为这类事情，我认为我们会看到更多，对吧？首先，作为一个生活非常忙碌的人，我认为这实际上非常棒。但我认为从非常哲学的角度来看，你可以争辩说

基本上，网上的一切都不是真实的，对吧？就像你的Instagram个人资料并不是你真实的写照。我们尽可能地展现自己最好的一面。我认为我们的化身和我们在自己周围创造的所有数字内容可能只是对此的一种延伸。

我认为我们必须学习的，而且我实际上感觉到年轻一代在某种程度上正在学习的是，这就像，它是基于现实的虚构，对吧？我通常用这个例子，就像你去参加一个晚宴，或者你的父母去参加一个晚宴，你也是如此，但在不同的时代和年龄，对吧？你坐在餐桌旁，问人们，“你好吗？”人们在现实生活中和在Instagram上做的完全一样，对吧？很少有人坐在桌旁说，“实际上，你知道吗？

我真的很讨厌我的妻子。我想离婚。我讨厌我的工作。大多数人都会说，“还不错”。就像我们向世界展现自己的一种形象。所以我认为这就像这种展现自己的想法并不是Instagram创造的。这种情况一直存在。它或许被放大了。它放大了它，并在许多方面使它更加具体。但我认为大多数人类行为几千年来都是一样的。我们只是用不同的方式表达它。

所以在未来，这些数字人类是逼真的，他们已经跨越了恐怖谷。这对个性意味着什么？就像，我们会因为无法分辨我正在采访的是维克多本人还是你委托你的深度伪造来进行采访而感到困惑吗？对我来说，这是难以分辨的。在这种情况下，透明度和个性会发生什么？我认为如果你看看文本，就像你多年来一直能够制作文本并与网上任何人分享。

多年来。我认为现在，我们大多数人都具有一定的批判性思维，仅仅因为某些东西以文本或互联网上的某种形式存在并不意味着它是真实的。如果你看到某个随机账户发的一条推文说第四次世界大战刚刚爆发，或者其他什么，你的第一反应是，这可能不是真的。你必须用新闻来源来验证这些信息，或者你必须做其他什么。我认为现在将会发生的是

我们将不得不从一个世界转变过来，在这个世界里，一般来说，如果有人用麦克风、用摄像机被录制下来，大多数人都会认为，仅仅因为它存在就意味着它是真实的。这种情况将不再存在，对吧？因此，我们所有人学习如何具备媒体素养就更加重要了。我们需要从不同的角度看待事物。谁创作了这件内容？它是什么时候创作的？这是来自可靠的来源吗？我认为这些技术发展得非常快。

我认为这将桥接到一个世界，在这个世界里，我们默认不相信我们在网上看到的一切。我们假设一切都是虚构的。一切都是好莱坞电影，对吧？我认为这也只是说我们基本上回到说，我们只能相信那些发生在我们面前的事情，如果我们亲眼看到了它。

这并不意味着我们不能相信我们在网上阅读或看到的一切。我们只需要对仅仅因为某些东西存在就认为它是真实的这一点更加批判性，对吧？我认为这实际上将是一件好事，我们默认认为几乎所有东西都是假的，然后我们从这一点出发倒推。我们可以从这一点出发倒推，有几种方法。我们正在与Adobe和其他一些科技公司合作，开发一种叫做C2PA的东西，其理念是为内容添加指纹和水印。

我认为我们将进入一个内容默认经过验证的世界。当你用手机拍照时，当你使用Synthesia制作视频时，当你使用Photoshop创建图像时，你可以选择将该内容注册到全球所有世界内容的数据库中。我讨厌这个词，但我实际上认为区块链在这里可以是一个很好的解决方案，因为它是不变的。

当你将其上传到YouTube或任何你的社交媒体平台时，它会查看内容。它会在全球所有世界内容的数据库中识别它，并说，“这段视频最初是由维克多在2019年创作的。它是用Photoshop或Synthesia或其他什么软件制作的。这里有一些关于它的信息。我们知道它最初来自哪里。”这将使我们进入一个互联网世界，我认为在这个世界里，大多数内容都将得到验证。这将帮助你做出决定，以便

评估每一件内容，基本上，然后将处于一个内容未经验证的世界。它会像个眼中钉一样突出。我认为你是对的。我们正进入一个内容验证成为默认设置的世界，我们将拥有大多数创作内容的出处。撇开

对技术的担忧。关于数字化身的潜力，最让你兴奋的是什么？人类希望在这个未来中互动、生活、工作和玩耍？如果你正确地执行你的使命，什么事情会进展顺利？我认为技术的妙处在于，它使每个人都能发出声音，能够将他们的想法付诸实践。

与世界分享他们的知识。这里有两个主要途径，当然一个是分发，即一旦你创作了内容，你就可以分享它，另一个是创作，对吧？我认为我们在许多模式中已经看到，当你允许更多人创作时，它是多么强大。

如果你看看最近的例子，就在我自己的生活中，你知道的，我喜欢音乐，我亲眼目睹了我们能够制作数字乐器，并且我们可以对事物进行采样的事实是如何导致新的流派，例如电子音乐、浩室和科技音乐，例如，对吧？那不是，那在使用真实的乐器的情况下是不可能的。是的。

当你看到最近相机技术非常容易获得时，比如YouTube，我的意思是，像我们现在正在做的播客，这些都是在我们发明大规模普及这些技术的技术之前不存在的基本格式。所以对我来说，所有这一切的承诺就像，如果每个人都能成为斯皮尔伯格呢？如果任何一个电影系学生都能走出去说，“我有一个好主意。而我只需要实现它的是大量的时间和一个好主意，对吧？”

我们将讨论大量的内容，这些内容永远不会被任何人观看。这将是糟糕的内容。但也会有一些来自世界某个小国家的电影系学生，设法创作出令人惊叹的艺术作品，尽管他们没有与好莱坞联系。我认为这才是最让我兴奋的事情。它就像解放创造力，文化和艺术是推动人类进步、创造世界和平、弥合我们之间存在的差距的重要组成部分。

我认为这将对世界产生巨大的积极影响。我们已经在许多其他类型的媒体中看到了它的作用，并且也获得了视频。我认为这将改变世界。喜欢它。维克多，非常感谢你加入我们。谢谢。维克多·里珀贝利是Synthesia的联合创始人兼首席执行官。是的，我很确定我与的是真正的维克多，而不是他的数字孪生。

不过，在一两年内，即使是这种确定性也可能值得商榷。让我着迷的是，我们是如何无意中通过我们日常的技术妥协为数字人类铺平了道路的。我的意思是，想想看。我们已经完全适应了颗粒状的视频通话、音频故障和尴尬的缩放延迟。这些缺陷实际上为数字化身创造了完美的着陆平台。我们已经在这样一个世界中运作，在这个世界中，足够好的视频质量，嗯，你知道的，足够好了。

但Synthesia向我们展示的不仅仅是制作令人信服的数字人类。它还关乎如何大规模地改变我们创造和分享想法的方式。当我开始制作视频时，这意味着无数小时的拍摄、重拍和费力的编辑，只是为了传达一个简单的信息。现在，我们正在接近一个世界，在这个世界里，任何有想法的人都可以用任何语言、任何数量的完美交付的镜头在几分钟内制作一个视频演示。这种创造力是令人难以置信的。

但这也意味着我们正在走向一个引人入胜的文化十字路口。很快，我们在网上看到的一切都可能带有自己的数字出生证明，一个经过验证的创作链，准确地告诉我们它来自哪里以及它是如何制作的。这就像我们正在为数字时代构建一个新的信任架构。在一个任何人都可以创建任何视频，任何人都可以发表任何言论的世界里，也许最宝贵的东西不是使这一切成为可能的科技。

而是它背后的故事。TED AI Show是TED音频集体的一部分，由TED与Cosmic Standard联合制作。我们的制作人是多米尼克·吉拉德和亚历克斯·希金斯。我们的编辑是陈班班。我们的节目主持人是伊万娜·塔克。我们的工程师是亚洲·皮拉尔·辛普森。我们的研究员和事实核查员是克里斯蒂安·阿帕塔。我们的技术总监是雅各布·温尼克。我们的执行制片人是伊丽莎·史密斯。

我是比拉尔·维尔萨杜。别忘了评分和评论，我们下次再见。

你猜怎么着？人寿保险可能比你想象的要便宜得多。事实上，大多数人认为人寿保险的价格是实际价格的三倍。因此，有了State Farm人寿保险，你可以在不打破银行的情况下保护你的亲人。不确定从哪里开始？State Farm拥有超过19,000名当地代理人，可以帮助你选择适合你的需求和预算的方案。今天就开始吧，联系State Farm代理人或访问statefarm.com。

无论你服役于哪个部门，军队的根基都非常深厚。在美国军事大学，我们认识到军人及其亲人的牺牲。这就是为什么我们将我们的军事学费优惠扩展到你的家族谱系。父母、配偶、合法伴侣、兄弟姐妹和受抚养人都可以享受我们每学分仅需250美元的优惠军事费率。美国军事大学。为全家人节省开支。访问amu.apus.edu/military了解更多信息。

没有什么比奥马哈牛排无与伦比的品质和味道更能带来舒适和快乐了。每一口都保证完美无瑕。现在，你可以在omahasteaks.com上享受全场5折的难忘礼物。此外，使用促销代码HOLIDAY额外享受30美元的优惠。凭借五代人的经验，他们始终如一地提供世界上最好的牛排体验。

奥马哈牛排的送礼专家让送出完美的礼物变得轻而易举，精心策划的礼品套装包含美食佳肴。从传奇牛排到令人垂涎欲滴的甜点等等，在omahasteaks.com上享受限时全场5折优惠。

此外，我们的听众可以使用促销代码HOLIDAY额外享受30美元的优惠。omahasteaks.com全场5折优惠。使用促销代码HOLIDAY额外享受30美元的优惠。可能需要最低消费。

How AI digital doppelgängers could change the way we communicate w/ Synthesia CEO Victor Riparbelli 50:17 Share