We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Why Runway CEO Cris Valenzuela thinks AI filmmaking is the future

Why Runway CEO Cris Valenzuela thinks AI filmmaking is the future

2025/6/5
logo of podcast Decoder with Nilay Patel

Decoder with Nilay Patel

AI Deep Dive AI Chapters Transcript
People
C
Cris Valenzuela
Topics
Cris Valenzuela: 作为Runway的CEO,我亲眼见证了AI视频生成技术的巨大进步。从最初的低分辨率抽象图像到如今的4K高清视频,AI模型在质量、一致性和整体输出方面都取得了显著提升。这不仅改变了人们对AI的体验,也为创意产业带来了前所未有的机遇。我相信,AI不仅能降低内容制作的成本,还能帮助更多人实现他们的创作梦想。我们公司致力于推动AI技术在视频领域的应用,让每个人都能轻松地制作出高质量的视频内容。当然,我们也面临着一些挑战,比如如何平衡技术创新与版权保护,如何确保AI的使用符合伦理道德。但我坚信,通过不断的探索和合作,我们一定能够找到解决这些问题的方法,让人工智能更好地服务于人类社会。 Cris Valenzuela: 我认为AI视频生成技术的核心在于其学习能力和创造性。AI模型并非简单地复制数据,而是通过学习数据中的模式和规律,创造出全新的内容。这种创造性是AI视频生成技术的核心价值所在。我们公司一直致力于开发具有创造性的AI模型,让用户能够通过简单的操作,生成出令人惊艳的视频作品。当然,我们也意识到,AI技术的发展可能会对一些传统行业带来冲击。但我相信,通过积极的转型和适应,这些行业也能够找到新的发展机遇。我们公司愿意与各行各业合作,共同探索AI技术在不同领域的应用,实现共赢发展。

Deep Dive

Shownotes Transcript

今天,我将与Runway首席执行官兼联合创始人Cris Valenzuela进行对话。这次对话很特别:上个月,Cris和我参加了艾利克斯合伙公司在纽约市举办的一次活动,所以你们会时不时听到现场观众的声音。 Runway是一个领先的AI视频生成平台,而且它一直在改进。这使得Cris和他的公司与AI行业的其他所有部分一样,都面临着创作者、艺术家和版权法的冲突——你们将听到Cris和我在这里深入探讨所有这些问题。

请填写这份简短的调查问卷,帮助我们规划Decoder的未来。谢谢! 鸣谢: Decoder是The Verge制作的节目,也是Vox Media Podcast Network的一部分。 我们的制作人是凯特·考克斯和尼克·斯塔特。我们的编辑是乌尔萨·赖特。 Decoder的音乐由Breakmaster Cylinder创作。了解您的广告选择。访问podcastchoices.com/adchoices</context> <raw_text>0 本节目的支持来自Atio。Atio是一款面向下一代公司的AI原生CRM。其强大的数据结构能够适应您的业务模式,在几分钟内同步所有联系人,并为您的业务提供可操作的数据。Atio还允许您创建电子邮件序列、实时报告和强大的自动化功能,所有这些都可帮助您构建重要内容,即您的公司。

加入Flatfile、Replicate、Modal等行业领导者。您可以访问addio.com/decoder,您将获得第一年15%的折扣。网址是A-T-T-I-O dot com/decoder。

支持来自ServiceNow。我们致力于帮助人们从事他们真正想做的有意义的工作。这就是为什么这段广告是由真人撰写和朗读的,而不是AI。您知道人们不想做什么吗?枯燥乏味的工作。现在,借助内置于ServiceNow平台的AI代理,您可以自动化业务各个领域的数百万个重复性任务,包括IT、人力资源等等,以便您的员工能够专注于他们想做的工作。这就是让AI代理为人们服务。

轮到你了。访问servicenow.com。本节目的支持来自Alex Partners。市场正在以惊人的速度发展,我们才刚刚开始了解AI、网络威胁和关税等颠覆性力量将如何改变游戏规则。赢家将是那些优先考虑执行并知道何时适应的人。为了获得无与伦比的见解,他们可以求助于Alex Partners Disruption Index。敬请关注,稍后节目中将详细介绍。

面对颠覆,企业信赖Alex Partners在真正重要的时候完成任务。在disruption.alexpartners.com上阅读有关最新趋势和C级高管见解的更多信息。Disruption.alexpartners.com。您好,欢迎收听Decoder。我是尼尔·阿帕托,The Verge的主编,Decoder是我的关于宏伟构想和其他问题的节目。今天,我将与Runway首席执行官兼联合创始人克里斯·瓦伦苏埃拉进行对话。

这次对话很特别。克里斯和我上个月参加了艾利克斯合伙公司在纽约市举办的一次活动,所以你们会听到背景中的观众声音。Runway是领先的AI视频生成平台之一。基本的概念现在已经很熟悉了。您从参考图像开始,无论是您使用Runway自己的模型创建的图像,还是您上传的图像。您输入提示,Runway就会输出完整的视频序列。

Runway最让我感兴趣的是,虽然现在AI炒作正处于高潮,但这家公司还有更深层次的东西。克里斯于2018年创立了Runway,所以他经历了AI的一些繁荣和萧条时期,当我们谈论这项技术及其能做什么和不能做什么时,你们会听到他的经验。

当克里斯在纽约大学担任研究员时,开始更认真地探索AI视频生成,那时我们大多将AI称为机器学习。你们会听到克里斯讲述与现在相比,当时的这项技术是多么原始。也就是说,AI炒作确实失控了,Runway与AI行业的其他所有部分一样,都面临着创作者、艺术家和版权法的冲突。你们将听到克里斯和我在这里深入探讨所有这些问题。

你们会听到克里斯在这个对话中反复提到一个主题,那就是他不认为Runway是电影制作的颠覆性局外人,而是一个积极参与者。他认为Runway是一种工具,它将把电影制作和其他形式的艺术表达带给更多人,而不是像破坏球一样冲击好莱坞的末日力量。

你们会听到他说他们现在正在与许多大型电影制片厂合作。Runway已经与狮门影业达成了协议,就在本周,该公司又与AMC Networks达成了另一项协议。在该公告中,克里斯表示,采用AI视频生成将是,“引用”每个娱乐公司的成败攸关时刻。

但与好莱坞合作并不意味着Runway在AI与艺术之争中就摆脱了困境。事实上,Runway本身就是一起关于使用艺术作品训练AI的集体诉讼案的一部分。去年,有消息透露,Runway曾在大量的受版权保护的YouTube素材上进行过训练,包括YouTube上的Furchas频道。

所以我尽可能直截了当地问克里斯,Runway是否确实在YouTube上进行了训练,如果这些大型AI版权诉讼案中哪怕只有一个没有以他们的方式结束,那么该行业如何才能在一个所有这些公司都必须向创作者支付巨额款项的世界中生存下去。

我认为你们会发现我们在这方面的来回讨论非常坦率,克里斯阐述了他自己对AI行业如何处理这一话题以及接下来可能发生的事情的一些辩护。这是Decoder,所以我们当然也谈到了Runway的结构。克里斯有很多话要说,关于Runway如何作为一个研究实验室运作,以及在发布和改进实际产品并将其交付给专业人士的同时,同时致力于开发可能使现有技术过时的新的模型和工具之间存在的张力。

在我们开始之前,还有一点需要注意。Decoder正在规划未来,我们希望听到您的意见,以了解我们如何改进我们的节目。您可以访问voxmedia.com/survey提供您的反馈。我们将不胜感激。好的,Runway首席执行官克里斯·瓦伦苏埃拉。我们开始吧。你在大型AI热潮之前就创办了一家公司。是的。我们之前开玩笑说网址是Runway ML。是的,因为那是人们在之前称呼AI领域的方式——机器学习。是的。自热潮以来,这种方法发生了哪些变化?你是否不得不重新思考……

“好的,现在每个人都理解训练模型是什么了,GPU市场也更贵了。”变化是什么?发生了很多变化。我认为我们在2017年或2018年创立了这家公司。ML是我们广泛提及AI领域的方式。我认为有几件事发生了变化。首先,模型变得非常出色。这对每个人来说都是显而易见的。我希望在座的各位都使用过AI模型。我假设这种情况已经发生了。

七年前,没有人这样做。我认为一致性、质量以及所有模型的整体输出都变得非常好。这改变了人们对AI的体验。我认为第二件事变得更真实的是,模型的价值和实用性对许多人来说变得更加明显。几年前,它更多的是关于它如何被潜在使用的理论。我们仍然有很多途径并不完全知道它将如何改变事物。

我们只是很了解它。在其他一些方面,它已经改变了很多事情。例如学习、教育,很明显,我认为从现在到未来,几乎每个学生都将开始使用AI模型来学习。

但我认为这已经发生了飞跃。然后当然还有竞争。现在每个人都关注这一点。当我们开始的时候,真的没有人试图构建。八年前,当我告诉你们我们将拥有能够以超现实的方式渲染视频的AI模型时,我们进行了同样的对话。人们认为我们疯了。现在这就像一个显而易见的方向。而且还有很多人也在试图解决同样的问题。是……

你实际完成工作的能力是否受限于你最初拥有的计算量?仅仅是规模定律让你达到了……所以规模,我认为这是我们作为行业已经认识到的主要因素之一,规模很重要。我认为我们随着时间的推移所吸取的教训是,如果你只是扩大计算规模,那么它就会使模型运行得非常好。我认为一开始这并不明显,我认为在过去几年中它变得越来越明显。

然后更多的计算,是的,绝对有帮助。但更多的计算、更多的数据以及更好的算法。所以这不仅仅是一种成分。这不仅仅是如果你获得更多的计算能力,事情就会突然变得更好。我认为这是不同事物组合的结果。让我实际操作一下。当你们刚开始的时候,

渲染一帧视频需要多长时间,现在需要多长时间?所以当我们开始的时候,你做不到。就像,这是一件事。就像,我们做过的第一件事就是一个文本到图像模型。有大约256像素宽的图像。而且它们,就像,如果你曾经见过马克·罗斯科的画作,就像,非常抽象,那就是它所能达到的最接近的东西,你知道吗?所以如果你想渲染一张脸或一栋房子或其他什么东西,它就像,在颜色范围内,但它就像,非常不准确。

所以我们从那个像素化的、非常低分辨率的图像过渡到20秒长的4K内容,内容中包含非常复杂的运动和动作。所以我认为当时视频甚至不在你所能想象的范围之内。

然后随着时间的推移,它变得非常可行。现在我认为我们开玩笑说我们一直在移动目标,我们从Runway得到的反馈就像,“很好,克里斯,你可以生成,我不知道,火星上的弹跳球。但是你知道,在Frank 27中,球的方向略微偏离了。”我说,“很好。这是一个很好的反馈,因为我会解决它。但你也意识到,就像一年前,你根本没想到这是可能的。”是的。

我认为大型平台公司如此投资视频生成的一个原因是,它们的目标是广告行业。你提到你有广告客户。马克·扎克伯格,这甚至不再微妙了。他就像,“我要摧毁广告行业。”他大声说出来。我认为他是在几周前或上周的Stripe Sessions上说的。他的说法是,

你甚至不必做任何事情。只要来找我,告诉我你想要的任何客户,以及你产品的想法。我会生成视频广告,并将其放入信息流中,你只需看着钱滚滚而来。这是一种非常扎克伯格式的思维方式。但这是你看到的第一个大型市场,好的,我们将降低

制作广告的成本,这将带来一些回报。这就是你们的需求来源吗?我认为对于许多从未有机会做广告的人来说,这是一个非常有吸引力的概念和世界。有很多企业根本无力支付广告公司或与广告公司合作,让制作团队拍摄AAA电影或广告。

我认为部分原因是,如果你真的能帮助其他人做到这一点,我认为这很棒。它肯定会提高许多人的标准,因为现在任何人都可以做到。我认为这与摧毁广告公司无关。我认为这是一个过于简单的概括。我认为这更多的是关于你减少制作某些东西所需的时间。制作任何内容的成本将大幅度或有望降低到推理成本。

因此,如果你擅长制作东西,擅长构思想法,你将拥有能够帮助你生成任何你需要的东西的系统。但你仍然需要有一个好主意,对吧?所以你仍然有广告公司,你仍然有才华横溢的创意人员,但制作东西所需的时间可能会大幅减少。这有望为许多其他人打开从事此类工作的大门。我的意思是,我认为……

马克想打电话给广告代理。他是一个非常有侵略性的人。但我之所以这样问,是因为我看到了这么多产品和这么多功能,但它们还没有与业务成果联系起来。对于许多公司来说,IBM上个月可能进行了一项研究,称他们看到的公司AI投资中有25%获得了投资回报。这是一个很低的数字。每个人都在尝试并弄清楚。

我在广告方面明白了。我理解,对吧?这只是客户获取成本。你是否在电影制片厂或其他地方看到过,仅仅降低成本就值得投资?是的,绝对的。就在之前,我刚与一家制片厂通话,我们正在讨论他们想为其测试Runway的剧本。

而且典型的,我不知道你们是否曾经在电影行业工作过,但就像你创作剧本,一旦你拿到剧本,接下来通常要做的事情就是分镜图。所以你基本上会拿走分镜图,然后有人会花一两周时间来绘制,这就像一个场景,或者几个场景,而不是整部电影,但是

这真的很贵,而且很费时。所以当他们向我朗读他们需要我们Runway帮助的剧本时,我一边在现场生成分镜图,当他们读完时,分镜图就完成了,所以他们我认为第一件事是,他们无法意识到或完全理解发生了什么,因为他们从未以这种速度工作过。对他们来说,速度也是成本,如果你必须完成

手工制作所有这些服务器所需的时间,并且他们让编剧实时进行,那么它就会缩短整个项目开发和完成所需的时间。所以你会有所有这些时刻和差距,AI真的可以帮助你加快自己的工作,尤其是在创意产业中,事情仍然是手工完成的。我实际上想问你这个问题,因为我知道你对创意产业和创造力行为有很多思考。

对此的反驳是,编剧和分镜艺术家之间的差距以及沟通和翻译所需的时间是魔法发生的地方。让AI将此转化为机械过程而不是创造性过程,

实际上降低了创意的质量。你对此有何感想?是的,我不完全同意这种说法。我认为部分原因是,我认为有时我们过于痴迷于我们制作事物的方式。编剧的目标是将他脑海中或他世界中的想法表达出来。

如果你能够更快地做到这一点,那么使用你周围的这套技术和工具的最明显方法就是,我认为这很棒。你可以更快地迭代概念,你可以更快地理解你的想法,你可以与更多人合作,你可以制作更多东西。如今媒体的一个主要瓶颈是,人们在一个项目上工作四年、三年。

然后你可能会实际进行工作,学生可能会因为许多不同的原因决定取消它。所以如果你仔细想想,你花了一辈子,或者像你生命中的四年,在一个

从未面世的事情上工作,因为它碰巧被天气原因取消了。我认为这个想法应该是,你不需要在一个项目上工作。希望你可以从事更多项目。所以这也变成了数量前景,我认为我们应该考虑这一点,因为现在我们受到工作方式的限制,它非常缓慢,并且受到所有这些过程的严格限制。如果你能够增强这一点,那么人们就可以开始做越来越多的事情。我认为这很棒。这就是你的模式吗?数量会推动业务发展吗?

我认为数量会带来质量。你创作得越多,作为一名艺术家,你创作得越多,你就会做得越好。就像每个艺术家可能都从未画过一次画,然后说,“哦,对不起,我是一个大师。”毕加索画了成千上万幅画。你们中的许多人从未见过所有这些。你只看到了大约1%。

音乐家也是如此,人们每天都在演奏,直到你找到真正奏效的东西。我认为工具也应该是这样的。它们应该能够增强你的工作方式,以便你可以做更多的事情。然后由你选择你在做什么。但是,我创办这家公司是因为我一直想拍电影。我在智利长大,我从未有机会买过相机。我27岁的时候才拿到我的相机。这相当晚了。

而且部分原因是它非常昂贵。我买不起Adobe软件,当时它非常昂贵。我认为我可能不会成为一名伟大的电影制作人,但如果我有机会讲述我脑海中的故事,那就太好了。我认为这是一个技术障碍,阻止了我这样做。现在,世界各地的孩子们都在使用Runway并实现这些想法,这让我感到非常着迷。这很棒。

Runway的定价是如何运作的?你的收入来自哪里?模式是什么?这很简单。这是一个订阅。你只需为产品付费,你就可以访问它的不同部分。他们有一个免费层,所以你也可以免费使用它。然后我们与学校合作。纽约大学,纽约大学电影学院开设了一门课程,教授学生如何使用Runway。所以他们不是去电影学院给你一台相机,而是给你Runway。

所以我们也与其他几所学校这样做。所以对于所有这些,我们只是免费提供访问权限。你会——你合作的制片厂,他们会支付很多钱吗?他们会为用户补贴吗?不,我的意思是,对于企业来说,是的,我们会收费。我的意思是,学生可以付费。但他们也会付费,因为这很有用。如果它能帮助你做一些事情,那么当然,价值是值得的。你们盈利了吗?

不,我们正在发展壮大,我认为我们所做的一部分工作是比其他任何事情都更投资于研究。你的跑道通向哪里?我认为同样,我一直痴迷地从事这项工作,我会说在过去的12到18个月里,模型已经达到了你可以用它做非常好的事情的地步。我认为公司总是有一个优化功能需要运行,那就是你想优化现在正在运行的东西,还是你想继续发展?

我认为对我们来说,我们真的想继续发展。我们可以投资很多研究,并且有很多增长领域我们可以继续前进。所以我认为现在的张力一直是,我们是想优化这个,还是下一个?我认为我们想转向下一个。我认为有很多事情我们实际上还没有完全发现,我们可以做,我们想做。我们需要稍作休息。我们马上回来。本节目的支持来自Alex Partners。

颠覆是新的经济驱动力。可预测的商业周期已经结束。40多年来,Alex Partners一直在帮助公司在不确定性中制定制胜的商业战略。当今最大的挑战之一是什么?AI的兴起。随着AI重塑科技格局,Alex Partners致力于帮助您的公司蓬勃发展。

在他们的第六届年度Alex Partners Disruption Index中,一项对3200名高级管理人员进行的全球调查显示,65%的高管认为AI和机器学习为他们的公司提供了积极的机会。62%的首席执行官预计明年将发生重大的商业模式变化。面对颠覆,企业信赖Alex Partners能够直奔主题,在真正重要的时候交付成果。

在disruption.alexpartners.com上阅读有关最新趋势和C级高管见解的更多信息。Disruption.A-L-I-X partners.com。

本节目的支持来自Pure Leaf冰茶。

你知道下午某个时刻你撞墙了吗?你没有时间进行自我护理仪式或呼吸新鲜空气,所以你可能会喝一杯饮料来让你恢复过来。但不知何故,它并没有奏效,或者让你感觉更糟。你需要的是高质量的休息,茶歇。你可以用Pure Leaf冰茶做到这一点,真正的冲泡茶,有多种浓郁清爽的风味,含有恰到好处的天然咖啡因。

手持Pure Leaf冰茶,你会感到神清气爽,充满活力,并有新的动力来应对接下来的事情。下次你需要按下重置按钮时,拿起一杯Pure Leaf冰茶。是时候喝茶了,是时候喝Pure Leaf了。

我们回到与Runway首席执行官克里斯·瓦伦苏埃拉的现场对话。休息期间,我们谈到了Runway的增长及其商业模式,尤其考虑到今天的AI视频仍然处于起步阶段。但现在我想问克里斯解码器问题,特别是关于何时投资研究以及何时真正按下扳机发布产品的问题。

我在Decoder上问每个人的一个问题是:Runway的结构如何?你如何组织公司?它非常精简。有人那天认为我们有1000人,我认为这是他们能给我的最好的赞美。我们大约有100人左右。它非常扁平,非常注重自主性。

然后我们非常关注我们所做的事情,而不是目标。我们不相信目标。我们有一种工作方式,我们只是设定界限,以及我们希望人们进行研究或探索的地方。因为我们所做的很多事情以前从未做过。所以如果我告诉你如何到达那里,我可能错了,因为我们从未做过。所以这是研究。你必须尝试和失败。所以我们所做的是设定约束或界限以及我们希望你进行实验的地方。

这是我们所做的研究的最佳成果,是关于设定正确的界限,然后让人们去,你知道吗?让人们自己工作,自己想出如何去做。所以你就像完全的整体主义,没有组织结构图?

我的意思是,某种程度上有一些工作图表,但人们会合作。我们有一个工作室,一个内部工作室,创意人员、制作人和电影制作人与研究人员一起工作。这些人坐在同一张桌子上,说着同一种语言,他们来自不同的背景,但他们设法一起合作。所以,是的,这就是你想激发的。我之所以对这个问题感兴趣,特别是对你们规模的AI公司感兴趣的原因之一,

是因为它与模型的能力、正在进行的研究以及你可以构建的产品类型之间存在着深厚的联系。我没有看到很多很棒的专注的AI产品。Runway实际上可能是其中之一。但在广泛的情况下,有ChatGPT,它只是一个对前沿模型的开放式界面。然后我们将看看会发生什么。

你认为随着你的发展壮大,产品会变得更专注吗?或者你认为你仍然需要在构建模型的团队和产品团队本身之间建立联系?我认为产品和模型的联系有助于产品团队更好地理解即将发生的事情。因此,您需要了解技术过去的工作方式是在更低的研发周期中。现在研究往往以非常快的周期进行。所以产品的问题,我认为产品是现在最难做的事情之一,因为

你确定你想工作的产品领域,你设计它并开始构建它,当你构建它时,它已经过时了。

你基本上浪费了六个月的工作,或者无论它需要多长时间。所以产品需要像研究组织一样运作。我们告诉团队的方式是,看,我们有研究科学家从事研究,但公司里的每个人都是科学家,因为每个人都在进行实验。所以在花费太多时间做某事之前,进行实验。构建一个简单的原型,了解它是否值得,然后与研究人员核实你正在使用的那个东西,它是否会变得有用,或者它是否会存在,或者它是否真的不会被下一代模型所淹没。

经常发生的事情是,我们的客户带着具体的问题来找我们,例如,“嘿,模型这样做,但它不做那样。你能为此构建一个特定产品吗?”我们可以。我们可以为此构建一个产品,或者我们可以等待下一代模型,它会立即做到所有这些。所以这是棘手的部分,因为你总是试图赶上,追赶。我认为那些了解研究的公司比那些试图追赶的公司处于更好的位置。

我在这里一直在做一种比较,你不会喜欢的,但我还是要做。我几百万年前就开始报道科技新闻了,白发和胡须。当蓝牙出现时,每个人都知道产品将会是什么。每个人都看到了耳机……

美国每个房地产经纪人都戴着巨大的摩托罗拉耳机。就像,“哦,你想要AirPods。”然后标准在接下来的十年里都没有准备好。然后苹果实际上必须在标准之上构建一个专有层才能制作AirPods。这花了整整十年。它根本没有准备好。而且在我们要构建什么之间存在真正的舞蹈?产品是什么?我们可以构建它吗?技术是否支持我们的目标?是的。

你描述的是同样的动态。让我对你的描述感到困惑的是,模型会一次又一次地吞噬产品。你怎么知道要构建什么产品?是的,这很难。因为每个人都能看到AirPods,对吧?每个人都喜欢,电脑会和我说话。这会很好。是的,但我认为这不仅仅是电脑会和我说话。我认为它如何与你交谈以及何时表达情感的部分有很多……

今天,我与Runway的首席执行官兼联合创始人Cris Valenzuela进行了交谈。这次对话很特别:上个月,Cris和我参加了艾利克斯合伙公司在纽约市举办的一次活动,所以你会不时听到观众的声音。 Runway是一个领先的AI视频生成平台,而且它一直在改进。这使得Cris和他的公司与其他所有AI行业的参与者一样,都面临着创作者、艺术家和版权法的冲突——你将在这里听到Cris和我对此进行深入探讨。

请填写这份简短的调查问卷,帮助我们规划Decoder的未来。谢谢! 鸣谢: Decoder是The Verge制作的节目,也是Vox Media Podcast Network的一部分。 我们的制作人是Kate Cox和Nick Statt。我们的编辑是Ursa Wright。 Decoder的音乐由Breakmaster Cylinder创作。了解您的广告选择。访问podcastchoices.com/adchoices</context> <raw_text>0 投入研究的产品,你知道吗?问题是,说实话,没有人真正知道未来的产品体验会是什么样子。因为我们进行的很多互动,是我们以前从未想过能够实现的。所以,只有让人们使用它,你才能意识到这一点。我认为这在研究中经常发生,比如,研究人员花费大量时间进行红队演练和所有工作,然后你把它发布出去,然后,不到两分钟,就有人,比如,

想出了如何在完全不同的方式下使用它。事实上,我认为这很好。它表明,我认为前一代软件是基于这样一个理念:你选择一个垂直领域,然后就进入那个领域。

然后下一代软件是基于这样的理念:你选择一个你想要在世界上运作的原则,然后你围绕这个原则构建模型。我们的原则是,你将观看和消费的每个像素或更多像素都将被生成,都将被模拟。这就是我们运作的原则。因此,你可以基于这个理念开发许多不同的产品。所以这有点像选择一个垂直领域和选择一个你想要运作的原则之间的区别。

但是现在,当你决定要构建哪些产品时,你正在从用户那里获得市场反馈。你有一些工作室使用这个工具,一些机构使用这个工具。你必须做出一些决定,对吧?我们确实如此。我们要在哪些方面填补产品的空白,哪些方面要等待?你如何做出这些决定?我们非常关注研究,关注理解即将发生的事情以及哪些事情值得构建。我认为总会有一个权衡,特别是对于初创公司来说,如果你花费太多时间在错误的事情上,它实际上可能会让你失败。

我认为我们倾听用户的意见,但有时用户并不真正知道他们想要什么。他们非常了解问题,但他们无法清楚地表达问题的解决方案。所以你不会发现自己完全按照他们的描述来构建产品,因为他们无法描述他们不知道即将出现的东西。所以,我不知道,我认为这有点像艺术,我想。你变得非常擅长直觉,并且能够判断,好吧,即使这件事现在可能是一个很好的交易,我们现在也不会去做。所以,我认为公司总体上会构建……

直觉,这只是做了足够多次之后积累的经验,然后说“不”。你必须经常说“不”。客户会提出很好的想法,但就是说“不”。不是因为你认为自己无法解决这些问题,而是因为这会让你陷入错误的事情中。这是我广泛询问每个人的另一个问题。你如何做出决定?你的框架是什么?如何做出决定?什么样的决定?所有决定。

我认为有不同的决定。有些决定是更长期的、不可逆转的,而有些决定是更容易逆转的。我认为我们非常认同这样一个理念,那就是进行实验,并愿意了解你的假设是否错误。如果你需要做出决定,那就去做,因为你相信它会奏效。如果它没有奏效,你可以

改变主意,你知道吗?有时产品决策来自其中的品味因素。我认为总的来说,品味已经成为指导公司运作的一种好方法,我会说,对于我们在营销和招聘方面的运作方式。我认为没有一个特定的框架,但总的来说,品味和直觉的概念在我们如何做出决策方面已经变得清晰。你认为随着你达到下一个规模,你是否需要改变这一点?对吧?在100人的时候,你可以说,听我的。是的。在1000人的时候,可能不行。是的。

我们一直在谈论“公司型公司”这个概念。我们不想成为一家“公司型公司”。“公司型公司”是指一家像公司一样运作的公司,因为这就是公司运作的方式。你会说,不,不要那样做。成为一家专注于解决问题、研究约束或用户需求的公司。不要关注那些你应该做的事情,因为你是一家公司。

我对此感到焦虑,因为一旦你失去了这一点,并且陷入了其中,你就完了。你将停止创新。你将专注于错误的事情来进行优化。我认为这可能是文化对团队的强化。我仍然会面试公司里的每个人。我仍然非常参与我们如何做出产品决策。一旦你退缩,可能就是事情变得……组织往往……

如果你们不不断地推动他们,就会寻求缓慢的速度。你认为会不会出现底层模型的能力下降,而你必须投入更多精力到产品中的情况?也许吧,但我认为我们还没有接近那个阶段。即使我们现在停止研究,我们全行业共同决定停止研究。我认为还有10年、20年的创新就在那里,潜伏着,等待着有人去发现它们。我认为我们还没有达到那种你可以说,“嘿,这就足够了”的阶段。

因为我认为还有太多的空间可以发展,并且有模型可以思考。比如,我们两周前刚刚发布了一个模型。我不是开玩笑。每天,我都会打开我们的用户和Twitter和Instagram,都会有新的用例。比如,就在来这里之前,有人用它来,比如,基本上是用来做衣服的。所以你可以试穿任何东西。比如,你基本上可以访问任何在线商店,任何电子商务网站,上传你的照片,然后,比如……

以超逼真的方式看到自己穿着它,我从未想过你可以用它来做这个。但你可以。所以,是的。我和微软的首席技术官Kevin Scott谈过,他以稍微不同的方式表达了同样的观点。他说,我们今天拥有的模型中的能力比任何人都知道如何利用的要多。我同意。对我来说,这就像,

好吧,那么我们应该开始构建有意义的产品。但问题是,下一代模型会吞噬我的产品。是的。什么时候才能稳定下来,让任何人都可以,比如,

制作一些好的产品。这是一个很好的例子。这是垂直领域和原则之间的一个很好的区别。如果你考虑一个垂直领域,那么你将选择一个解决方案,并朝着这个方向努力。如果你考虑一个原则,你应该假设你试图在产品中构建的许多东西最终都将成为新模型的未来。因此,如果你想花时间在这个上面,你的产品应该领先许多层。因此,原则应该是,例如,图像生成。

零样本。零样本意味着,如果你想要一个模型做某事,你不需要训练它。你只需要向它展示一些例子。因此,如果你有正确的例子,你可以广泛扩展模型可以执行的任务范围。所以一个好主意可能是找到、收集你可以用来教模型的示例。然后它会改变你处理产品的方式。所以我认为垂直领域和原则之间的区别与这一点有关。

该行业的一个主要趋势是每个新模型的成本都在呈指数级增长。Sam Altman正在世界各国首都巡回演讲,说:“我能得到一万亿美元吗?”也许他会得到。你永远不知道。他可能会得到。你是否也面临同样的成本曲线,每个新模型都贵得多?你有一万亿美元吗?答案是肯定的吗?如果你有一个……

AI的发展通常分为两个阶段:扩张阶段和优化阶段。扩张阶段就像,好吧,我们正在发现我们可以做什么。如果你考虑两三年前的模型,是的,它们很贵。现在,大多数这些模型你都可以在你的笔记本电脑上训练,因为模型已经发展到你可以优化它们的阶段。工程师喜欢一件事。

那就是优化事物。所以如果你告诉他们,这里有一个有效的东西,请优化它,人们会非常努力地去做。对于一些两三年前的模型来说,现在就是这样。从头开始训练它们非常便宜。

我认为有些新模型仍然处于扩张阶段。我们还没有完全弄清楚如何优化它们。但我们会。但我认为发生的事情是一样的。如果你花费太多时间优化它们,那么权衡是你将停止研究新的扩张。我认为现在大多数公司都在押注扩张。所以他们押注的是为了扩张而支付更多费用,而不是试图优化和降低有效事物的成本。你在哪里?

我认为我们仍然处于扩张阶段。拥有扩张的能力,拥有创新的能力,这要困难得多。然后拥有赶上并进行优化

游戏更容易。我认为我们的赌注是,好吧,这是一个优势点,你可以继续推进事情,并不断突破界限。大型平台公司,微软、谷歌、亚马逊、OpenAI与微软达成了协议,对吧?他们运行自己的超级计算中心。这对你们来说是一个竞争威胁吗?这对你们来说是一个优势吗?

谷歌是投资者。所以我们与他们密切合作。同样,企业有不同的职能。如果你是一个超级计算中心,你可能从事的是优化事物的工作。你需要为每个人提供廉价且可扩展的东西。这与一个正在构建这些新事物的研究实验室的功能不同。所以,同样……

将两者结合起来可能是一件好事,因为你有一个好的研究实验室和一个好的优化实验室。然后你可以进行技术上的转移,这将允许公司运行这些东西,销售它们,然后获得反馈,而公司,公司的另一部分则致力于下一件事,这就是我们所处的位置。如果谷歌是投资者,你们是否在使用GCP?是的。那么你们只是让他们购买NVIDIA H100吗?你们对此担心吗?

是的,Vue和Vitas是同一个投资者。顺便说一句,AI行业到处都是这种情况。这非常明显。好吧,我认为是那些看到这一点的人,我认为你想激发这一点。你想激发……我们现在讨论的许多事情在八年前并不那么明显,直到许多人开始对此做出正确的押注。

我认为,同样,取决于你所处的位置,与那些理解这一点并希望与你长期合作的人合作可能是一个很好的功能。我认为我们合作的人可以帮助我们达到这一点。我认为英伟达作为投资者是AI行业的一件很有趣的事情。他们正在投资那些推动其芯片在所有这些地方使用的应用程序。也许其中一些会成功,也许不会。这就是投资的本质。但在某些时候,一切都必须加起来。

才能真正为英伟达带来回报。你是否感受到这种压力,即Runway必须成为一个足够大的业务,才能证明所有基础设施支出是合理的?我认为证明来自你看到的客户价值和你看到的采用率。我认为这就是方法,这就是你如何看待AI产品在短短几周、几个月内从零收入增长到数百万收入的方式。这是以前从未见过的。这是因为它只是,它是一种完全不同的体验,它是一种完全不同的价值。

如果你对此充满雄心,我认为,是的,它肯定会达到这一点。我们已经看到了这一点。

不过,例如视频还处于早期阶段。我们的最新模型Gen 4,字面意义上只有一个月半的时间。所以世界上大多数人甚至还没有体验过它。所以这也是一个分销问题。你如何接触到所有可以使用它的人?你们的收入达到了数百万美元吗?是的,超过了。你们是否有达到数十亿美元收入的途径?我们希望,是的,在未来几年内。我问的是,所有这些公司都必须创造数十亿美元的收入才能获得所有这些投资。我认为他们会。许多公司会。我的意思是,再次,如果……

从第一性原理来考虑。如果你从事广告或电影制作业务,如果你从事电影制作业务,你将花费数亿美元来制作一部电影。

如果我可以承担这个过程,并帮助你以几百万美元的成本完成它,那么所有的差额,我都可以根据我帮助你改进的程度向你收费。希望我可以向你收取更少的费用,这样你就可以做更多的事情。如果你扩大规模,那么你不仅在帮助他们,而且还在扩大最初可以做这件事的人的范围。因为如果你考虑专业的电影制作,这是一个非常小的行业,主要是因为它非常昂贵。

好吧,如果我有一些东西可以降低成本,那么我可以扩大那些可以进入这个行业的人的定义。从市场的角度来看,这很好,因为有更多的人可以做他们从未想过自己可以做的事情。我们需要再稍作休息。我们马上回来。这条消息来自Rinse。

如今,你可以通过手机做很多事情。预订假期,买卖股票,但你也可以让你的脏衣服消失,然后洗好叠好再出现,使用Rinse。

使用Rinse应用程序安排取件,在你意识到之前,你的衣服就回来了,叠好,准备穿。他们甚至可以干洗。立即注册,在Rinse.com获得您的第一笔订单20美元的折扣。网址是R-I-N-S-E dot com。

本节目的支持来自Pure Leaf冰茶。你知道下午某个时刻你撞墙了吗?你没有时间进行自我护理仪式或呼吸新鲜空气,所以你可能会喝一杯饮料来让你恢复过来。但不知何故,它并没有奏效,或者让你感觉更糟。你需要的是高质量的休息,一个

茶歇。你可以用Pure Leaf冰茶做到这一点。用各种浓郁清爽的风味酿造的真茶,含有恰到好处的天然咖啡因。手持一杯Pure Leaf冰茶,你会感到神清气爽,充满活力,并有新的动力去迎接接下来的挑战。下次你需要按下重置按钮时,拿起一杯Pure Leaf冰茶。是时候喝茶了。是时候喝Pure Leaf了。

本集由亚马逊Prime赞助播出。从流媒体到购物,Prime帮助你从你的爱好中获得更多乐趣。因此,无论你是犯罪剧迷,还是喜欢偶尔阅读扣人心弦的小说,凭借Prime Video、亚马逊音乐和快速免费送货等服务,Prime让你轻松从你所喜欢的事情或正在喜欢的事情中获得更多乐趣。访问Amazon.com/Prime了解更多信息。

我们回到与Runway首席执行官Chris Fonsuela的现场对话,讨论好莱坞如何应对AI视频以及TikTok和YouTube的压力。我还想知道,当一些具有里程碑意义的AI版权诉讼在法庭上审理时,他认为AI和娱乐行业可能会发生什么。

电影行业真的很有趣。它承受着巨大的压力。压力之大,以至于HBO Max每六个月就改名一次,以获得任何它可以获得的关注。这很棒。我想它有效。但从根本上说,他们正在与TikTok用户和YouTuber竞争,对吧?Netflix知道这一点。Netflix知道YouTube是最大的竞争对手。制作YouTube视频的成本已经……

只是制作漫威电影成本的一小部分。这基本上给电影行业带来了巨大的压力。你认为AI真的可以缩小这种差距吗?是的,我认为……并且保持高质量?是的,所以我认为这就是重点。我认为内容的最后前沿,最后前沿是任何人都可以制作的低质量内容。我认为那是TikTok和YouTube。比如,数十亿人在那里制作各种各样的东西。这与高制作工作室之间的区别在于内容的质量。

输出,像素和视频的输出质量如何。对我来说,这主要是一个技术障碍。它不是一个讲故事的障碍,也不是一个想法的障碍。这就像,是的,制作一部高端科幻电影非常昂贵,因为你必须雇佣很多人,并使用非常昂贵的软件。所以,我认为对我们来说,以及我认为许多媒体公司都在考虑的最后前沿是,数十亿人制作高端内容。

我认为,如果你从事传统的媒体业务,而你还没有意识到这一点,你可能会非常害怕。因为那时你将与任何人竞争,世界上任何地方的任何人都可以凭借少量预算和非常好的想法创造出惊人的东西。我们已经看到了这一点。今年的奥斯卡最佳动画奖,我不知道你是否看过,它是一部名为《Flow》的电影。预算很小,我认为不到1000万美元。

它只是一群非常优秀的人使用优秀的软件工作。他们击败了价值1亿或2亿美元的制作而获得了奥斯卡奖。这仅仅是因为你有一群非常聪明、有才华的人使用合适的软件工具。所以,另一方面,这些工作室也对他们的知识产权非常警惕。这是他们用来赚钱的东西,对吧?他们将其分发到不同的分销渠道,不同的地区。他们起诉在BitTorrent上盗版他们作品的海盗。

你已经对很多这些内容进行了训练,对吧?有报道称Runway在许多YouTube频道上进行了训练,包括The Verge的频道,顺便说一句。这就是你的万亿美元。在我看来,AI行业已经过高的成本结构中最大的威胁是,到处都是诉讼,可能会说你必须向所有这些创作者付费。你考虑过这种风险吗?

这是我们分析和工作方式的一部分。我们与不同的工作室和公司合作,了解如何根据他们的需求和他们想要做的事情来训练模型。对我来说,帮助每个人理解这些模型实际上在做什么仍然至关重要。因为我们对AI视频的许多假设是,你输入一个提示,然后你得到一部电影。所以,如果你是个工作室,而这实际上是真的,我现在的次数少了,但我过去经常在我的收件箱里,在我的电子邮件里收到很多剧本。

人们会说:“嘿,我是一个制片人或编剧。我一直在制作这个节目。我已经完成了整个剧本,而且很棒。我听说你们制作AI视频,所以这是剧本。制作我的电影。”我意识到很多人认为AI视频或AI像素生成或使用AI制作视频意味着你输入一个提示,然后你得到你认为自己再次参与的整部电影。

而现实情况是,不,它不是那样工作的。比如,它可能永远不会那样工作。你仍然非常参与其中。你需要告诉模型如何使用它。你需要告诉模型你想要使用的方向和输入。比如,我认为部分原因是,也许在过去12个月里,大多数人对AI的体验都是通过聊天机器人。

所以AI的概念已经被浓缩成聊天机器人的概念。所以如果你有一个聊天机器人,你就有了AI。对我来说,这些东西是将一个巨大的领域总结成一个非常简单、过于简化的概念。

所以当你考虑文案写作时,你会考虑创作。我认为对我来说,所有的重点仍然在于,你在制作什么?你对它有很大的控制权。这些不是会自行制作东西的工具。你是决定如何制作它们的人。所以你必须对如何使用它们负责。这就是重点。但是,

但是要训练模型,你需要摄取大量数据,对吧?使模型在扩张模式下更有效的两件事是更多的计算能力和更多的数据。你是否考虑过你是否需要为训练模型而摄取的数据付费?是的,同样,我们已经与合作伙伴合作,以特定方式获取所需的数据。但同样,重要的是要理解这些模型并不是试图复制数据,对吧?我认为常见的误解是,我明白了,人们认为你可以输入电影的一个场景,然后你可以在Runway中得到电影的一个场景。

这些不是数据库,所以它们不会存储数据,它们在学习。它们是学生。它们正在学习数据,它们正在学习数据中的模式,并且它们使用这些模式来创造一些全新的东西。所以我认为需要考虑的一个论点是,这些系统正在创造全新的东西,特别是对于视频来说,它们正在创造全新的东西,像素。当然,你使用它们的方式应该是一种负责任的方式。

而且模型并没有试图存储任何东西。对我来说,这是一种区别,因为它改变了你如何思考最初训练模型的方式。如果你把它们看作数据库,你将有一套不同的假设、用例和担忧,如果你把它们看作通用工具,比如相机。我一直把Runway说成是相机,你知道吗?就像相机允许你做任何你想做的事情一样。如何使用它取决于你。

你可以因为使用相机而惹上麻烦,或者你可以通过使用相机来制作伟大的电影。所以你选择。使用相机很容易惹上麻烦。是的,我知道。但我认为,看,我在智利长大,有很多电影我没有机会看到。我看到它们的方式是在街角买的。

我不知道你是否见过那种人们站在剧院里录制东西的情况。是的,我的意思是,那是相机的不当使用。但我认为社会的总体假设是,让我们不要禁止相机。让我们在剧院里制定一个规范,你不能那样做。如果你那样做了,你就会惹上麻烦。我认为我们都同意,这是一种很好的做法。这个论点现在正在法律体系中展开。有很多很多案件。

我们上次经历这种情况时,基本上是谷歌赢得了一系列关于构建数据库的案件,也许有所不同。但谷歌就像一家友好、年轻的公司,溜进办公室,在上班时戴着针织帽。谷歌搜索的内在效用对每位法官来说都非常明显。YouTube的内在效用,它遇到了很多麻烦,对每位法官来说都非常明显。他们通过某种方式克服了它。比如,他们不得不向一些人支付一些钱,他们不得不赢得一些案件。他们不得不投入大量资金进行诉讼。

他们赢了,因为他们很可爱,他们是谷歌。那是一个非常不同的时代。科技公司总体上不再被认为是年轻和可爱的,对吧?比如,没有人认为Meta和亚马逊像谷歌一样是应该以当时的方式构建未来的可爱公司。你是否考虑过这种风险……

他们可能会输掉这些案件,这会对你的业务造成什么影响。因为你正在谈论的这种动态,这是否是非侵权使用,这里是否有广泛的效用。是的,这个论点可以追溯到80年代的Betamax案。比如,这一切都在那里。但它不必像过去那样发展,对吧?比如,法官只是一群人,正如我们在美国发现的那样。他们只是做出决定。如果结果不符合你的意愿怎么办?

我很难对每一个案件发表意见。我认为这比这更复杂。我认为谷歌对世界整体产生了巨大的影响。我认为很难不同意这一点。我认为世界变得更加广阔了。信息变得更容易获取。我认为这很难不同意,对吧?我认为每项新技术都会带来新的挑战。我不同意这一点。我认为是的。

你正在将真正强大的技术交到每个人的手中,这意味着每个人,对吧?所以有一些关于AI的用例,你应该阻止,你应该确保在上面有监管和安全系统。我认为每家公司都不一样。所以我认为很难……我从科技中学到的一件事,我把它作为一个艺术家提到了。我去过艺术学校,我开始从事科技工作,主要是因为……

我对艺术应该如何与科技合作有自己的看法。这是我的想法。所以我仍然认为自己是科技圈的局外人。我认为我需要考虑的一件事是,并非每个人都以同样的方式运作。我认为并非所有公司都一样。公司在运作方式上往往有所不同。我认为有不同的方法来应对这种变化。对我来说,很难把每个人都归为一类,然后说,是的,所有科技公司基本上都在做同样的事情。

让我正确地写下这一点。你们在YouTube上进行训练,对吧?你们在YouTube频道上进行训练?我们在各种不同的数据集上进行训练。所以我们有团队负责图像、视频、文本和音频。我们不会透露我们如何训练我们的模型,因为这是我们研究的独特性。

你是否使用了YouTube的数据进行训练?我们使用各种不同的数据集来训练我们的模型,具体取决于任务。这并不是说我们是否使用了这个或那个数据集进行训练。我们与不同的公司签订了协议,也与其他公司建立了合作关系。我们的训练方式对我们来说非常独特,而且竞争非常激烈,所以我们可能永远不会透露我们的训练方法,因为它对我们模型的训练方式来说非常独特。是的。

YouTuber拥有其视频的版权。如果发现你使用了YouTube的数据进行训练,并且数百名YouTuber向你索要钱款,无论金额多少,Runway的财务模型是否仍然可行?我想这又回到了这些模型在做什么的问题,对吧?好吧,我说的是,如果OpenAI输掉了与《纽约时报》的官司,并且发现使用《纽约时报》的内容进行训练构成侵权,那么闸门就会打开。目前还不清楚OpenAI是胜是负。如果Meta输掉了与图书出版商的官司,

在过去几周里,他们的表现并不理想。闸门打开了。如果这些闸门打开,你的业务还能维持吗?不,我认为,再次强调,将整个AI行业概括为聊天机器人和一家公司所做的事情,我认为这是一个错误。我认为,再次强调,视频和媒体的工作方式非常不同,还有很多其他的考虑因素。我认为,关于AI如何工作的大量假设

我在视频领域看到的,就像在1992年对手机发表意见一样。你可能只是在早期看到这项技术将如何改变行业的影响,而且你可能以前从未经历过。

因此,我认为随着时间的推移,将会发生的一部分事情是,围绕版权和其他问题的许多想法将会随着人们对它的实际工作方式的理解而开始改变。例如,我和一位你可能都看过的主要节目的制作人共进晚餐。他说,我非常反AI。好吧,你为什么反AI?他说,因为它这样工作,它那样做。我说,不,它不是这样工作的。让我告诉你它是如何工作的。