We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Tech leaders on next phase of the artificial intelligence revolution

Tech leaders on next phase of the artificial intelligence revolution

2024/12/6
logo of podcast Washington Post Live

Washington Post Live

AI Deep Dive AI Insights AI Chapters Transcript
People
C
Clay Shirky
S
Shyam Sankar
Topics
Shyam Sankar: 人工智能技术能够显著提升军事决策效率,缩短军事行动时间,增强威慑力,维护和平。其核心作用并非创造全新的应用场景,而是显著提升现有业务效率,例如目标识别、信息处理和资源分配等。人工智能不应该取代人类决策者,而应作为辅助工具增强其决策能力,如同为人类穿上钢铁侠战衣。在军事领域的应用并非全新问题,关键在于如何规范其使用,确保符合法律和道德规范,并防止技术落入敌方手中。 人工智能在商业领域的应用也日益广泛,能够显著提高效率,例如在医疗、汽车制造等行业。AI可以作为一种新型劳动力,辅助人类更快地完成工作,提升竞争力,而非造成失业。 数据安全和隐私保护是AI应用的关键,需要关注数据来源、访问控制和用途限制,确保数据不被滥用。

Deep Dive

Key Insights

What is the OODA loop and how does it apply to military decision-making?

The OODA loop stands for Observe, Orient, Decide, Act. It is a decision-making process pioneered by Colonel John Boyd in the 70s and 80s. In a military context, it emphasizes the importance of making decisions faster than the adversary. AI helps accelerate this process by improving targeting, damage assessment, and logistics, enabling faster and more efficient decision-making.

How does Palantir's AI technology enhance military operations?

Palantir's AI technology enhances military operations by enabling faster decision-making through the OODA loop. It uses sophisticated computer vision and sensor fusion algorithms to identify targets, process large amounts of data, and prioritize logistics. For example, it reduced a division's footprint from 400 to 20 people, making them harder to detect and more effective in the field.

What are the concerns about AI in warfare and how does Palantir address them?

Concerns about AI in warfare include the potential for 'digital dehumanization' and escalation of conflicts. Palantir addresses these by ensuring human commanders remain in control, using AI as a tool to augment human decision-making rather than replace it. They also emphasize adherence to legal and ethical standards, such as the laws of armed conflict.

How is AI being adopted in commercial industries according to Palantir's CTO?

AI is being widely adopted in commercial industries, particularly in the U.S., to improve efficiency and productivity. For example, AI is used in healthcare to manage patient discharge summaries and revenue lifecycle management, and in manufacturing to inspect welds in seconds instead of minutes. Companies like United Airlines, Ferrari, and Kohl's are leveraging AI to gain competitive advantages.

What is the purpose of Palantir's AI boot camps?

Palantir's AI boot camps are designed to help customers build production-ready AI use cases in just eight hours. The goal is to move beyond theoretical discussions and provide hands-on experience with AI, demonstrating its potential beyond chatbots. Participants leave with practical applications that can be integrated into their workflows.

How does Runway's AI technology transform filmmaking?

Runway's AI technology, such as its Act One algorithm, allows filmmakers to translate performances into animated characters without the need for motion capture or rigging. This significantly reduces the time and cost of production, enabling creators to focus on storytelling rather than technical processes. It was used in the Oscar-winning film 'Everything Everywhere All at Once' for tasks like rotoscoping.

What is the potential impact of AI on Hollywood and creative industries?

AI has the potential to democratize filmmaking by reducing costs and enabling more people to create high-quality content. While it may disrupt traditional roles, it also opens up new opportunities for storytelling and innovation. For example, AI can generate real-time video, creating personalized experiences that were previously impossible.

What are the challenges of AI adoption in organizations according to Connor Grennan?

The biggest challenge of AI adoption in organizations is the need for a behavioral shift rather than just technological implementation. Leaders must foster a learning culture and encourage employees to integrate AI into their workflows. Without this mindset change, AI adoption will remain limited to specific use cases rather than driving broader organizational transformation.

What industries are leading in AI adoption and what results have they seen?

Industries leading in AI adoption include technology, pharmaceuticals, and banking. These sectors have seen significant improvements in R&D, pattern recognition, and operational efficiency. For example, AI has accelerated drug discovery in pharmaceuticals and optimized financial processes in banking. However, industries like agriculture have seen less incremental lift due to prior optimizations.

What is the future of AI in the next five to ten years according to Cristóbal Valenzuela?

In the next five to ten years, AI is expected to revolutionize media and entertainment by enabling real-time video generation and personalized storytelling. This will create a new media format that blends elements of film and video games, offering unique, on-the-fly experiences. The technology will continue to evolve, making high-quality content creation more accessible and affordable.

Shownotes Transcript

加入华盛顿邮报直播纽约站,与Palantir首席技术官Shyam Sankar、Runway首席执行官Cristóbal Valenzuela和顶级经济专家进行对话,讨论人工智能对各行业公司以及美国全球技术竞争力的影响。

<raw_text>0 本华盛顿邮报生活播客由IBM赞助播出。如何在构建AI应用程序时保持领先地位?从领先一步开始。IBM的高性能Granite模型针对企业任务(例如特定领域的流程和工作流程)进行了优化。它们的设计使您可以减少训练,更多地进行创作。准备好立即开始了吗?现在就开始吧,访问ibm.com/granite。IBM,让我们一起创造。♪

- 您正在收听华盛顿邮报直播的播客,将新闻编辑室实时带给您。- 下午好,欢迎大家。我是乔纳森·凯普哈特,华盛顿邮报的副主编,和我一起的是您刚才在介绍中看到的这位朋友,就在10秒钟之前,Shyam Sankar,Palantir Technologies的首席技术官兼执行副总裁。Shyam,欢迎来到华盛顿邮报直播。- 谢谢你的邀请,乔纳森。

今年,Palantir赢得了一份价值1亿美元的美国政府合同,这将使所有五个军种都能获得AI工具。首先,您能否解释一下军队正在或将要使用的这项技术的运作方式?

实际上,我们一直在做的工作始于MAVEN项目,我认为该项目始于2018年,这是军方为推动威慑而进行的一项紧急计划。如果我们看看今天的世界,我认为我们已经失去了威慑力。我们在以色列发生了一场大屠杀。我们有朝鲜将军在乌克兰受伤。我们有一个非常激烈的伊朗,可能距离潜在的核弹只有几个月的时间了。

那么我们如何重新获得威慑力来维护和平呢?所以这里的想法是,你不想挑起争端。你希望你的对手如此害怕你,以至于战斗不值得。

为了推动这一进程,我们开始与将军们一起研究他们的核心目标:我如何才能更快地做出决策?约翰·博伊德上校在70年代和80年代开创了这项工作。他们称之为OODA循环。观察、定向、决策、行动。我如何才能更快地做到这一点?谁最快速地完成这个决策过程,谁就会获胜。等等,它又叫什么?OODA循环。OODA循环。是的。再说一遍。观察、定向、决策、行动。

好的,请继续。是的。那么我们如何应用呢?那么非常具体地说,你如何将人工智能应用于决策?我认为这确实是机会所在。人工智能并不能帮助你解决你从未想过的新用例。它实际上帮助你在你今天拥有的核心业务中做得更好。在军事环境中,那就是目标定位。我如何找到我的敌人?我如何完成目标定位过程?我如何评估造成的损害,然后重复这个过程?

好的,你们有多少人看过电影《鹰眼》?等等,什么?好的。那么你们有没有人在想电影《鹰眼》,其中……它不完全是一个人工智能实体,但它是一个与军队合作、与政府合作的机器,而且它有点失控了。我们为什么不应该担心……

你与政府签订合同提供的技术不会以这种方式失控?也许是矛盾的,因为我们都为此担心,所以我们应该少担心一些。我的意思是,问题是技术从根本上来说是一种工具,我们有一个

负责战场的人类指挥官。问题不在于如何用人工智能取代人类,我认为这不太可能奏效。问题是如何在这个人类周围开发一套钢铁侠套装,以便他们拥有决策优势。

好的,那就是在拥有决策优势的人周围穿上钢铁侠套装。但是人权观察是许多警告所谓的“战争中的数字非人化”的活动团体之一。对于那些认为这项技术可能会进一步加剧冲突的人,您会怎么说?

我认为历史会表明……所以我们看看人工智能,你可以认为它是一件根本上全新的东西。但是,如果你看看70年代的战斗机,如果你是一名战斗机飞行员,是你雷达告诉你有一个你无法看到的敌机。你相信你的技术,相信那东西确实存在。然后当你按下火控……

你也无法引导它到达最终目的地。你相信技术会做到这一点。所以我认为这是我们如何管理它。人类在哪里参与循环?我们如何对此进行保证?我们是否遵守关于军事决策的合法武装冲突法?这真的很重要。我认为这很重要,因为它实际上不是一个新问题。它确保我们遵循我们今天作为民主社会所遵循和相信的程序。

你知道,我刚刚意识到,当我问你第一个问题时,你能告诉我们军队正在或将要使用的技术吗?你并没有确切地……你能给我一个具体的例子吗?是的,当然。所以我们开始的第一个项目是,将军说,我想在24小时内做出1000个决定。你知道,我们看电影,我们认为找到敌人很容易。我们一直都知道他们在哪里,我们可以神奇地按下一个按钮……

事实并非如此。事实上,根据教条,任何少于72小时的目标定位时间都被认为是动态行动。所以通常你计划用三天的时间来弄清楚如何去寻找和打击敌人。所以今天,显然,我们会说这是荒谬的。这听起来很漫长和迟缓,人们会移动,我们将错过机会窗口。那么我该如何不仅做到更短,而且如何在24小时内完成1000次这样的行动呢?

当你开始这个过程时,你会意识到,哇,第一个问题是我甚至找不到一千个东西。好的,那么你如何使用复杂的计算机视觉和传感器融合算法来找到一千个东西呢?

然后你会想,哇,我无法处理一千个东西。好的,那么你如何应用人工智能来为那些正在经历军事决策过程的人提供杠杆作用,以便能够做到这一点呢?然后你意识到,好吧,你知道,不太性感的问题,后勤实际上是,好吧,我现在可以找到并处理它们,但我没有足够的弹药来做到这一点。我该如何优先考虑?什么才是值得的?

追捕那些会对敌人产生威慑作用的东西。所以这里有一个很大的线团需要拉扯,有很多,你知道,这是一个复杂的状态机,如果你愿意的话。有很多决定正在做出,你试图弄清楚今天的瓶颈是什么?我们如何做得更好?- 我们将继续讨论其他一些事情,但我现在彻底着迷了。所以我很想知道。

鉴于你刚才所说的一切,你是否回顾了,比如说,杀死本·拉登的任务,并试图使用你现在拥有的技术以及你当时能够知道的事情,你会如何做得不同?

我没有做过具体的回顾,但我可以说,乔治城大学对CSET(安全与新兴技术中心)进行了一项研究,他们研究了从现在到第二次海湾战争,Maven如何改变了目标定位过程。

他们发现,例如,20个人可以完成以前需要2000个人才能完成的工作。所以我认为有很多效率。显然,我们也希望规模更小。它使我们能够隐藏。我们有一个在国家训练中心训练的陆军部队。他们能够将他们的师规模从400人减少到20人,这很容易被敌人发现。它需要一个

大量的车辆和基础设施来支持20人,而红队甚至在沙漠中都找不到他们。因此,这将使美国军人更易于生存,更有效率。所以贵公司的AI工具也被联合航空、法拉利、科尔氏等公司用于商业用途。这说明了什么关于企业在采用AI方面的现状?我

我认为,特别是美国企业遥遥领先。欧洲、澳大利亚和亚太地区也有一些亮点,但我认为美国政府现在正在迎头赶上,并且已经真正接受了这一点,因为从根本上说,AI的采用是经验性的。你无法真正思考它。你不能仅仅分析问题。你必须卷起袖子,尝试一下。

并处理那些真正重要的问题。例如,我们管理着美国21%的医院床位,并利用它来推动患者出院总结,利用它来推动收入生命周期管理。我刚刚看到一个汽车制造商的一个非常酷的用例,它每焊接一次需要30分钟,座椅上有400个焊接点,需要检查焊接质量。

使用视觉语言模型,你可以将每个焊接点的时间缩短到几秒钟。因此,你拥有的产能的效率、停留时间减少、空闲时间减少才是真正的巨大杠杆所在。那么为什么人们不应该害怕人工智能会对他们潜在的生计造成什么影响呢?因为在你刚才使用的例子中,

我的意思是,现在有多少人没有做这项现在由人工智能完成的工作?我认为这是一个我们需要认真思考的真正问题。我认为他们不应该害怕。我认为我的工作经验是……所以与纽约的一家大型保险公司合作,我们已经自动化了他们的保险承保流程,这个流程过去需要三周的时间,现在只需要一个小时。它非常手动,很多复制粘贴,很多……

数据的整理。你可以把人工智能想象成一种附加到这个人身上的新型劳动力,帮助他们更快地完成所有这些工作。事实上,他们明确表示不会裁员。他们说,这对我们来说是一个竞争优势。如果我的竞争对手需要三周时间来承保保险,而我只需要一个小时或一天的时间,

我将获得所有最好的风险。我将利用它来赢得市场。所以令人兴奋的部分是,这实际上是一个机会,让我们能够提高商业公司的雄心壮志,更快地做更多的事情。你能告诉我你们做的这些训练营的情况吗?训练营的目的是什么?

训练营,所以我们让客户进入一个房间,在八个小时内,我们一起构建一个用例。我们亲自动手,他们带着一个可投入生产或接近可投入生产的用例离开。实际上,这个想法的产生是因为我们意识到,当我们与人们进行演绎式互动,只是谈论这项技术时,他们会停留在聊天机器人的想法上。

而且,你知道,聊天机器人有一定的作用,但是我认为它们也——实际上非常有限。人工智能可以做到的事情远不止这些。那么你如何引导他们进行一次体验式旅程,从聊天机器人开始,体验它的局限性,然后意识到,实际上,这些大型语言模型几乎就像一种新型的逻辑运行时。我将编码人类否则会执行的逻辑

将其与我已有的软件集成,并将其构建到我今天现有的人员执行的工作流程中,以构建一些具有相当魅力和神奇的东西,这些东西可以投入生产。我将,让我们谈谈,我想也许参加一个这样的训练营。是的。那么,你能告诉我情报收集和隐私问题之间的平衡吗?公司应该如何考虑这个问题?这实际上是我们公司成立的理念之一,那就是

比恐怖主义更糟糕的只有对恐怖主义的反应。没有人想生活在一个奥威尔式的世界里。如果你要收集数据,你必须能够保护你正在收集的数据,无论是在医疗保健领域、商业领域还是政府领域的情报领域。你必须在其中建立强大的保护措施。你必须考虑两个类别。一个是数据的来源。我在什么权限下收集了什么数据?这告诉我我需要如何管理和保护这些数据。

第二部分是访问控制。人们通常考虑的是基于角色的访问控制,也许是基于分类的访问控制,但还有第三类我认为非常重要,那就是基于目的的访问控制。如果你是一位医疗患者,你可能已经同意将你的数据用于特定目的。

不是为了任何随机的、非谓词式的调查,而是为了某种研究或那种研究。那么,在某人进行分析的背景下,我们如何在这个周围创建一个虚拟云来保护它,围绕着它同意的目的,你可以追溯到收集数据时拥有的权限?

我的意思是,假设我们已经阅读了所有条款和条件,你放弃了该同意。现在,你在乌克兰和以色列部署了技术。你如何确保你的工具,在那里使用的工具不会落入对手手中?

好吧,我认为我们对美国也有这种担忧。如果你有,你知道,你带到现场的边缘单元,你必须确保你正在保护它。我认为这些平台足够复杂,它们实际上不仅需要军事支持基础设施,还需要工业支持基础设施来驱动它们。所以你尽可能多地在你的软件中构建控制,在……

让我们称之为保护工件本身的二进制级别,但更重要的是访问软件以及谁可以将它用于什么目的。那么,民主国家能否与像中国这样的专制政权竞争,中国不像我们在美国那样有同样的伦理约束呢?短期内,很容易看出违反我们想要生活的世界规则可能会给你带来实际优势。我认为从长远来看,你会造成大量的错误,实际上会使情况变得更糟。我举一个例子,我认为我们能够比我们的对手更快地继续在大型语言模型方面取得进展的原因之一是

如果你在中国构建大型语言模型,你必须切除它的部分功能。你必须确保它不会说出某些它不允许说的话,而那些话恰好是真的。这将成为一个非常困难的游戏。你不能精确地——它不像数据库那样,你可以说,不要说这个事实。它实际上——你正在切除它的重要部分,这将改变它的行为。所以我认为开放、创新,记录表明它始终获胜。真正重要的是意志。我们是否关注这些问题?

我会说现在关于人工智能,我们可能有点过度关注人工智能的供应方面,构建模型,训练模型。这真的很重要。但我们看到的是,模型实际上正在变得更好,但它们也在趋同,封闭和开源模型变得越来越相似。等式的另一面也很重要。这就是所有经济价值所在的地方,也就是需求方。

好的,我们构建了这个非常棒的模型。我们只是用它来背诵华丽的诗歌吗?或者我们用它来改善生活,改善人类状况吗?它对医院有影响吗?它对工厂车间有影响吗?我们如何改进这方面的工艺?因为我认为我们正处于人工智能的早期阶段。

我把它比作从模拟计算到数字计算的转变。现在,我们真的可以假装流过你的CPU的是零和一。事实并非如此。它实际上是一个模拟波形,但抽象是如此之好

这需要围绕它进行如此多的工程设计。同样,我认为我们拥有这个强大的随机人工智能精灵,我们需要围绕它构建一个工具链,使我们能够可靠地利用这些东西来改善人类状况。几周后,我们将迎来美国的新政府。你希望这对人工智能和人工智能监管意味着什么?

我几乎会重申我的最后一点,那就是我认为监管与否,我对此没有非常非常强烈的意见。我确实有强烈意见的是,我们需要开始实施它。我们不需要欣赏这个问题,不需要过多地思考它,而是实际上,不断上升的医疗保健成本本质上是一个国家安全问题。我们如何利用它来改善护理和管理成本?让我们处理真正重要的问题。我们如何改善交通?我们如何改善公民获得的服务?

你认为四年后人工智能创新将达到什么水平?

好吧,我喜欢比尔·盖茨引言的反义。比尔·盖茨有一句引言,我们高估了我们在两年内将取得的进展,低估了在十年内将取得的进展。我认为对于人工智能来说,我们有点高估了十年后会发生什么,而我们严重低估了未来两年内可能发生的事情。两年前,我们几乎没有经历过ChatGPT时刻。我认为两年后,我们将无法想象没有人工智能的软件。我们看到越来越多的国家……

在人工智能方面越来越依赖私营部门进行创新?我们是否应该担心政府依赖那些政策观点可能会根据政治而改变的企业家?好吧,

好吧,我认为我们需要管理这一点,但我认为这可能是一个均值回归。所以,如果你看看帮助美国赢得二战和冷战的工业基础,那是亨利·福特、亨利·凯泽。不是诺斯罗普·格鲁曼。是杰克·诺斯罗普和勒罗伊·格鲁曼。瓦内瓦尔·布什有一句很棒的引言,听起来像是现在说的,那就是……

他当时正在对罗斯福总统说,我们真的需要让我们的平民参与武器制造,因为他们可以做的比军队自己能做的要多得多。所以我认为,将我们的民用和政府组织结合起来,是我们与中国等专制政权竞争的方式。在我们剩下的时间里,也许在场的各位都,你知道,对人工智能很了解,并且对此感到兴奋,但可能有一些人正在通过直播观看,……

在线观看,因为他们想知道什么是人工智能,因为他们害怕它。在我们剩下的40秒钟里,告诉人们为什么他们不应该害怕人工智能。因为我认为我们已经过度神秘化了它。我认为一个非常世俗的技术,硅谷,已经用另一种形式的宗教取代了一种形式的宗教,那就是AGI和杀人机器人以及他们希望成为的事物。

我认为我们应该稍微淡化一下人工智能。我们应该说人工智能只是有效的软件。我们今天所说的计算机视觉,我们认为它并不太花哨,它曾经是尖端技术。它曾经是你可以在图片中找到猫的最酷的事情。现在它微不足道了。我们只是把它当作软件来考虑。我认为,随着我们继续吸收人工智能创新,我们将把它视为有效的软件。

人工智能,有效的软件。Sean Suncair,Palantir Technologies的首席技术官兼执行副总裁。非常感谢您今天来到这里。谢谢,乔纳森。

我是Euni Kim,我是邮报的企业和个人科技技术编辑。现在和我一起的是NYU Stern商学院的首席AI架构师Connor Grennan,以及麦肯锡全球研究所的主任Qualen Ellenrud。欢迎,非常感谢你们的加入。谢谢。谢谢。

康纳,上个月是ChatGPT两周年纪念日,你们可能很多人都在使用它。数亿人在学校和工作中使用它。但是根据Slack委托进行的一项研究,使用率一直保持在33%的水平。那么这说明了什么呢?

这是一个很好的问题。我认为这是一个令人着迷的统计数据。我个人认为,人工智能的采用率确实被夸大了。所以我与各行各业的组织进行交流,如果你在一个大房间里,你不会看到很多人每天多次使用它。所以我认为这说明了什么,这种使用率持平的想法,说明了几件事。已经采用的人已经采用了。我还认为这很有趣,这可能会有点

有争议,但我不喜欢,我教大型公司,我不教用例,因为我认为教用例是我们过去使用技术的方式,但这太广泛了,这就像回到过去,试图用用例向人们解释电力一样。就像没有人早上醒来会说,我今天要如何使用电力,对吧?更像是你遇到了一个问题,然后你使用了电力,这就是ChatGPT和这些其他大型语言模型

R,你必须用一种新的方式来思考它。当我们只考虑用例时,就会发生这种情况。你会找到你的三四个用例。它会趋于平缓。人们不会增长。你必须改用一种新的思维方式和一种新的行为方式。这就是我的印象。

所以,Quylet,我想转向你,因为你预测人工智能可能会在现在到2030年之间导致120亿个职业变化。哪些工作将会发生变化?是的,1200万个职业变化,不仅仅来自生成式人工智能,当你将生成式人工智能添加到自动化、老龄化和消费变化中时,将所有这些加在一起,从现在到2030年。

我们估计,仅在美国,就有1200万个职业变化。它们主要,大约85%,属于四大类工作。客户服务和销售,对,因为你将很多东西转移到网上,以及最后一英里的交付。食品服务,所以服务员、女服务员、酒保。办公服务,行政助理,很多都被自动化了。然后是生产或制造。这四大类职业中的三类主要由女性担任。

这部分解释了为什么女性需要改变职业的可能性比男性高50%,这是由于生成式人工智能以及所有其他变化造成的。

这是一个非常有趣的发现。康纳,作为首席AI架构师,你扮演着传教士的角色。你对房间里的工人和领导有什么建议?他们应该拥有什么样的武器库才能在工作场所保持人工智能的领先地位?对,通常武器库就像,哦,精通技术或数字技术,但这实际上并非如此。没有技术……

你不需要学习和使用这种能力。这纯粹是一种行为上的改变。但与此同时,我认为我在视频中说过,这就像说,“哦,好吧,你只需要练习一下。”这就像说,“少吃多运动。”就像,“是的,伙计,我知道,少吃多运动,但我没有这样做。”因为这很难。这是一种行为上的改变。所以在这种情况下,当我问,“我们实际上应该做什么?我们如何让人们走上正轨?”

我实际上真的把这归咎于领导层,你应该考虑领导层必须是,你必须有一个伟大的学习型组织。你必须有一个非常脆弱的领导层,告诉人们,嘿,听着,这不会取代你。你必须诚实地说,当然,但是。

这不是我们想取代你,只是ChatGPT取代你将是垃圾,他们会称之为垃圾GPT,相反,你拥有的是你想要增强的东西,我喜欢之前的发言者所说的钢铁侠套装,那太酷了,我想要一个,但是事情是这样的,当你给人们ChatGPT时,你正在增强他们擅长的事情,如果你有一家公司的人,你已经雇佣了他们。

因为他们在为你的组织创造价值方面非常出色。你并不想取代他们。你想做的是增强他们所做的事情。我认为人们对人工智能将如何创造收入过于关注。我说,你公司里已经有人在那里创造收入了。想想你在做什么,什么能为你创造价值,并让你的组织接受培训,因为你已经拥有了能够做到这一点的头脑。嗯哼。

- 康纳,我想补充一点,我认为具体的技能,不是编码或其他什么,而是你如何使用技术?所以我认为这种开放的学习心态现在比以往任何时候都更重要,因为我们之前谈到的这种变化速度正在加快。

技术技能,但只是与技术互动并以不同的方式工作是一回事。我还认为技术互补技能,在这种情况下是社会和情感技能,你如何与人互动,建立信任,建立关系,表现出同理心,这些都是生成式人工智能正在尝试做但还不能很好地做到的事情。我认为,随着生成式人工智能的采用并真正处理所有这些其他元素,这些互补技能的价值将会增加。

这太棒了。这就是为什么她会站在舞台上。但另一件事是,这也是一个行为像人类的软件。所以所有这些我们需要的技能,所有同理心技能,沟通技能,这些也让你在使用生成式人工智能方面变得出色。它让你成为超级用户,因为你像对待人类一样与它交谈。我喜欢这样。是的。

加入华盛顿邮报直播,在纽约与 Palantir 首席技术官 Shyam Sankar、Runway 首席执行官 Cristóbal Valenzuela 和顶级经济专家进行对话,讨论人工智能对各行各业公司以及美国全球技术竞争力的影响。

<raw_text>0 让我们换个话题,谈谈生产力。Qualen,你去年也预测,由于生成式人工智能,到 2030 年,自动化可以接管美国经济中 30% 的工作时间。给我们举一些这些任务的例子。是的。

有很多任务属于这 30%,可以解决。一个是计算技能,处理非常简单的数据,要么对数据做出非常直接的判断,要么将其组合成一个文件,然后根据该文件添加真正的判断和经验。这些可以解决许多不同类型的技能和活动。

但我认为,当你把这 30% 加起来时,它非常不均匀。对于在座的各位和在线的各位来说,可能是 30%,这意味着我们的工作不会被生成式人工智能淘汰,但我们将不得不学习不同的工作方式。但对于这四类主要被淘汰的工作,回到办公室服务、客户服务和销售,这些工作主要消失了。因此,需要发生职业转换。

Connor,你培训了许多公司高管和公司关于生成式人工智能。当这些领导者或公司寻求采用时,他们面临的一些最大障碍是什么?是的,我认为领导者面临的最大障碍是

如果你身处领导岗位,你往往很擅长理解如何驾驭数字化转型之类的事情。我认为,这与典型的数字化转型非常不同,因为在典型的数字化转型中,你通常是在采用一种产品,用新产品替换旧产品。你必须淘汰旧产品,因为每个人都想留着它。他们喜欢他们的铅笔和纸。你说,不,你必须使用新产品。但最终每个人都会改变。你给他们看视频,所有这些东西。

这完全不同。所以我认为一开始,他们正在使用,我与大脑有很多合作,他们正在使用他们大脑的错误部分,这是

我们如何从这个转变到这个,而不是变革管理,领导层也擅长变革管理,但他们并没有将此视为变革管理。他们将其视为数字化转型,而不是认为我们必须改变行为。好吧,你知道,你之所以成为领导者,是因为你知道如何改变行为。你之所以成为领导者,是因为你理解如何改变人们的工作方式、价值观等等,所以我认为最大的障碍是

相信这只是你提供给人们的东西,然后你就放手不管了。有时我想到的一个比喻是,这就像认为如果你给,你知道,在每个美国家庭都放一台跑步机,你就能治愈心脏病一样。这不可能发生,因为你可以得到越来越好的跑步机。我们看到这些工具越来越好。

但这并不是……当我从跑步机上下来时,我并不是因为忘记阅读跑步机的说明书才下来的。对吧?我下来是因为……我告诉我的妻子我必须洗衣服。但真正的原因是我不想……我的大脑想要……

快速的回报,它想要节省能量,就像沙发和一碗多力多滋一样,对吧?不是跑步机。我们必须以不同的方式思考这个问题。ChatGPT 和这些工具更像是一种跑步机的行为,而不是,好吧,每个人都会学习如何使用这个新的 CRM 系统,例如。——所以需要改变行为,但需要转变思维方式。

回到 Slack 的研究,我认为很多参与该研究的员工表示,他们害怕告诉老板他们实际上使用了 ChatGPT,因为害怕被指责不称职或作弊。

你认为使用生成式人工智能的思维方式正在转变吗?我会把它交给 Koyalyn。——是的,我认为它确实开始转变了。有趣的是,在类似的研究中,我们发现实际上年轻女性更不愿意使用 ChatGPT,因为它感觉像是违反规则或作弊。但是当公司非常清楚地说明指导方针时,事实上,

我们允许你,我们鼓励你使用 ChatGPT 来举这些例子或在这种情况下,或者如果你甚至要求在人员审查中使用它,每个人都必须使用它,那么这些性别差距和其他差距就会缩小。所以我认为明确何时可以使用它,何时应该使用它,将有助于解决许多这些挑战。

公司如何才能更透明或更公开地谈论在其组织中使用人工智能?组织在使用方面应该采取什么好的策略?我不知道有什么策略。如果有人看到新的 GPT 或 CLAWD 模型出现,就没有说明书。你上 Twitter 或 X 查看人们如何使用它。我们这样做的方法完全搞砸了。

但我认为 Quayle 的说法完全正确。领导层必须树立榜样。我看到的做得相当好的公司是那些领导层领导学习型文化、并且略微脆弱的公司,他们会说,嘿,这就是我在生活中如何使用它。这就是我遇到的困难。但他们也必须给予许可。如果你使用生成式人工智能,你并没有作弊。

如果你使用生成式人工智能,你并没有作弊。我们不再是五年级学生了,对吧?没有评分标准,公司只想要创造价值。我总是先与高级领导团队合作的另一个原因是,如果我和团队合作,你培训他们,他们都很兴奋,那么会发生什么?他们会把他们八小时的工作日变成六小时的工作日,但这不会影响公司收入,对吧?而且,如果你没有教高级领导如何真正使用它,就会出现一些问题。

首先,他们没有基准来衡量新的八小时工作日应该是什么样子。所以你必须向他们展示,就像走工厂车间一样,给他们一个使用它的框架,而不仅仅是一些用例,而是一种新的思维方式。第二件事是,正如 Quillen 所说,它有点像真的歪曲了人才评估,对吧?如果你在你的组织中有一个超级明星,但你又有一个年轻人在崛起,他们好得多,

问题是年轻人可能正在使用生成式人工智能,而其他人则没有,你必须像教育你的整个组织一样,否则人才评估就会失效。我认为你确实需要,但我们必须承认一些风险,即你的内部数据、你的知识产权会随着不受控制的使用而泄露,所以我认为对于这些情况,出于这些目的,非常明确的指导方针

我们希望你使用它。对于其他方面,我们必须小心。我认为还有一些关于数据方面的风险,对吧?我们正在将生成式人工智能用例嵌入其中,这些用例是基于历史数据构建的,这些数据中也存在固有的偏差。因此,你延续了这一点,将其放入黑盒中,

它会非常令人信服地吐出答案,即使是人工参与的,也将其视为真理。我们只是延续了最初数据中的一些偏差。所以我认为明确的指导方针将有助于全面解决问题。我们有一个来自观众的问题。来自印第安纳州的 Susan Orr 问道,到目前为止,哪些公司或行业已经成为人工智能的主要采用者?他们从中看到了什么结果?Connor,我会把它扔给你。是的,Quillen,

显然可能会有更好的看法,但我合作的公司都在以不同的方式努力。我认为说“这家公司做得很好,因为他们有……”很危险,我不会说出名字,但你知道,他们使用了 700 个自定义 GPT 或类似的东西,这很好,但是你是否在整个组织中都采用了它?我真的认为,对不起,老生常谈,但这需要思维方式的转变,所以如果我问这个房间里的每个人谁使用 Excel,每个人可能会举手,因为我们正在使用它进行

个人预算,我们正在用它来制作清单等等。但如果房间里有三个投资银行家,他们每天会使用它 30 次,以完全不同的价值主张来达成数十亿美元的交易。这就是 Chachapiti。当我们问人们哪些公司做得很好时,我认为没有好的基准。如果你对这一点有不同的看法,我很乐意听听。没有伟大的公司能够做到这一点。每个人都处于这个巨大的滑动标尺上,因为我们正在谈论改变我们的工作方式。所以我认为指出一家公司并说,

你可以说,嘿,宜家正在这样做,或者沃尔玛正在这样做。这很好。这仍然只是一个用例。我只是没有以那么严格的术语看待它。但也许你看得不一样。不,我会说,从广义上讲,行业是科技,我们都在阅读头条新闻。我会说制药业,因为生成式人工智能可以在研发中发挥如此大的作用,发现人类甚至无法识别的模式。然后还有银行。

有趣的是,在另一方面,生成式人工智能的提升并不多,例如农业,他们多年前就已经优化了田间作物灌溉模式等等。因此,增量提升不多,但在各行各业的分布相当广泛。

就聊天框或当前的生成式人工智能产品而言,它确实由 OpenAI 和大型科技巨头主导。你认为这种情况会持续下去吗?或者你是否看到了可能竞争的其他新兴企业?

所以我认为会有更多的整合。我认为情报在某种程度上开始商品化了。我认为我们现在刚刚看到亚马逊的 Nova。Anthropix Cloud 是一款出色的产品。OpenAI 有 GPT,一款出色的产品。Gemini 是一款出色的产品。

但是有人在极限测试它吗?即使 GPT 推出了这个新的推理模型,房间里有多少人真的看到了巨大的区别?这更多的是关于人们如何使用它以及用户界面。我认为这些公司,我认为谷歌在这方面做得非常好,正在解决用户界面问题,而不是,你知道,没有很多公司有资金来构建新的基础模型。所以我认为我们可能会有五到六家公司,除非我不知道更多。但我认为

这不像,哦,大型新兴企业。新兴企业将构建新产品并构建新的用户界面,我们看到 Perplexity 就是一个很好的例子。但我不知道我们会看到另一家大型公司突然出现。Rylan,这些主导大型科技公司实际上控制着人工智能,拥有我们所有的数据,这有点令人担忧吗?……

谁知道他们在做什么,对吧?所以如果预测是这些人会继续变得更有竞争力,越来越大,有什么担忧吗?

我认为有一些担忧。在每一代人需要越来越多的资本才能保持领先地位方面,肯定存在升级动态。但是,我确实看到公司层面存在一种真正的不安情绪,即把所有的鸡蛋都放在一个篮子里,无论是哪家公司。因此,有很多“让我们分散一下,看看下一代会带来什么”的想法。因此,我们可能会看到只有几家公司继续在不同竞争对手之间参与其中。

让我们换个话题,展望一下未来。一年后,如果你有一个水晶球,我们在人工智能发展方面会走到哪里?我不知道。不,我在开玩笑。我的意思是,是的。

好的,我认为代理是一个很好的起点。什么是代理?有人真的知道吗?微软将代理称为一件事。Salesforce 将代理称为另一件事。它们实际上并不是代理。我们看到 Anthropic 推出了看起来像代理的东西。我认为代理的构建将需要更长的时间。再次,除非 Quillian 看到不同的东西。所以我不确定。我认为采用速度仍然会比我们想象的慢。我就是这么认为的。但我确实认为……我认为人们会倾向于使用代理,因为人们会认为这是一种……

真正推动他们公司收入或能够重组公司,甚至可能真正影响劳动力的一种方式。

我认为技术将继续以惊人的速度发展。我认为在公司层面,我们现在开始看到这个两周年纪念日,在真正找到最终结果影响的公司之间存在真正的分歧。我想说只有大约 10% 的公司真正从生成式人工智能中获得了真正的价值。每个人,对吧?这是一个董事会层面的问题。这是一个首席执行官层面的问题。没有领导团队没有生成式人工智能,至少没有试点计划,这

哪些公司真正获得了价值?非常非常少。我想说大约十分之一。我认为在明年,我的预测是我们将看到真正获得价值的公司之间的差距越来越大,无论是增长价值,还是最终结果的影响,以及实际上能够捕捉到这一点的公司与仅仅涉足的公司之间的差距。这种差距将会扩大。好吧,我们肯定会密切关注这些发展。非常感谢你们的宝贵时间,Connor 和 Qualen。谢谢。谢谢。不要走开。我们还有更多采访即将到来。

以下部分由华盛顿邮报直播活动的赞助商制作和付费。华盛顿邮报新闻编辑室没有参与此内容的制作。好的。大家好。你们好吗?我是 IBM 的 Rob Thomas。很高兴与大家在一起。我与 Asha Vary 共同出席,她是 Meta 的合作伙伴关系副总裁。

还有 Clay Shirky。Clay,你有一个很长的头衔,人工智能和技术副教务长。在教育方面,这意味着当任何数字技术进入课堂时,我都会帮助纽约大学适应。好的。优秀。开放的话题,可能是关于人工智能时最常用、最滥用,但也最重要的术语之一。所以让我们谈谈开源技术。

开放标准、开放技术,这些术语是什么意思?它们为什么重要?Clay,我先从你开始。好吧,我会说,因为我们现在有了开放标准、开源这样的历史。

许多人在看待开放性时,都关注成本控制、可定制性、公司无法突然添加新许可证或使你与你的工作脱节的能力。所有这些都很重要,但让开放性在以前几代人中变得重要的,是惊喜和协调。

我听到 Yung-Hee Kim 在此之前问我的同事 Connor 关于员工是否披露他们是否使用人工智能的问题。开放性最大限度地提高了披露率。当所有工作都在公开进行时,你会发现人们真正关心的是什么。因此,你会得到你从未想过自己会得到的用例。

这有点像比尔·乔伊定律的推论。无论你是谁,大多数聪明人都为其他人工作。无论你是谁,大多数聪明的主意都在其他人的脑海里。因此,开放性使你能够看到最大数量的

对新技术的兴趣和参与。然后,因为它是在公开场合,从事类似工作的人会找到彼此并进行合作。你开始获得的不仅仅是小团队在从事这些工作。你开始获得那些导致 Linux 或维基百科发展的庞大网络。我认为我们正处于一个点上,我的意思是,你会有更好的了解,因为你拥有领先的开放模型,但我认为我们正处于一个点上,

将领先模型定制到特定领域与拥有下一代前沿模型相比具有竞争力。说得很好。Ash,你在 Meta 的观点,因为你坐在与 Clay 不同的位置。你如何看待这个术语“开放”?是的,我大体上同意。实际上,我完全同意你所说的所有内容。

对于那些不知道的人来说,Meta 从成立之初就拥有非常悠久的开放和开源历史。我们就像一家小型创业公司,我们只是没有很多工程师,但我们需要很多帮助来让网站,Facebook 网站启动并运行并保持运行。我们只是开始开源我们堆栈的各个组件。如果你考虑像 React 这样的东西,

React Native 在我们转向移动设备的那一天,我们真的发现,如果你把软件放在那里,保持开放,并且你,比如,让社区围绕它建立起来,人们不仅会发现价值,而且会改进它。他们让它变得更好。你从世界上所有存在的能量中获得巨大的倍增效应。

真正推进你正在从事的工作。因此,社区受益,因为他们拥有这个可以用来做任何他们需要做的事情的开放软件。其他人正在让它变得越来越好。我们作为一家公司也受益于将其发布,因为我们也从社区那里获得了回报。因此,整个社区飞轮非常非常重要,也是我们发现的核心要素之一。

我们只是将这种理念扩展到人工智能。到目前为止,我认为我们已经发布了大约 1000 个开源人工智能项目。

当你具体查看模型时,这些都是难以创建的昂贵事物。如果你考虑训练 LLM,所需的 GPU 数量、所需的数据量、所需的工程人才数量——我甚至没有谈论电力、数据中心和能源以及所有这些事情。很多,而且非常昂贵。这并不是大多数公司都能做到的事情。

因此,从某种意义上说,如果你仔细观察,你不想让世界看起来像少数真正强大的科技公司或非常富有的公司在那里构建模型,阻止它们并向你收取任何你想要的费用,而没有任何透明度。我们的观点大相径庭,因为我们受益于,并且看到了像 PyTorch 这样的开源社区及其推动的创新所带来的好处。

从我们的角度来看,这实际上是关于使人工智能和 LLM 民主化。因此,我们将我们的模型发布出来。我们现在已经为多个版本的 LLAMA 做到了这一点。人们可以获取它们,可以在它们的基础上构建,可以构建一系列作品,可以根据自己的需要使用它们。他们可以下载它们。然后,对于你的创新点,当我们发布 LLAMA 2 时,我认为大约两周内,一些开发人员已经在树莓派上运行它了。

因此,如果你考虑访问,特别是当你走出西方或全球南方以及其他地区时,它很昂贵。你没有权力。对。

通过开源和创新实现的所有这些民主化都是我们思考方式的核心。社区,你两次使用了这个词,通常会给你答案,这是我们发现的。当我们开源我们的花岗岩模型时,我们把它们放在那里,每个人都去了一个。他们说时间序列是我们见过的 LLM 中最独特的东西。这就是每个人都去的地方。所以这里有一个关于生态系统的问题,你们都在谈论。但我猜你们两个看到的不同。

Clay,你对围绕这个的生态系统有一个看法。Ash,你可能会有不同的看法。也许 Clay,你先开始。我不知道我们是否有不同的观点。我们坐在不同的位置。对。所以我有点迷茫,因为通常当学者在 IBM 的舞台上时,是为了被痛骂不具有创业精神或其他什么。我的意思是,我们只是被痛骂的对象,哦,他们太慢了。但学院擅长的是同时从多个角度解决问题。

正如你所听到的,我有一个花哨的头衔,但我并不负责纽约大学的教师使用人工智能。事实上,我有时很难让他们打开我的电子邮件。所以我只能通过劝说来工作。我学到的是,一个部门一个部门地,他们有不同的需求。物理学家和哲学家的使用方法不同,化学家和编舞家的使用方法也不同。因此,与其幻想我们可以编写某种自上而下的框架,

我们实际上是在寻找那些地方,不是完全自下而上,我们不是说每个教员都必须自己解决自己的问题,而是哪里有一群志同道合的人更有可能成为为我们解决问题的社区?我们始终发现,例如,我们有一个游戏设计学院,他们是第一个制定关于图像生成政策的人,而不仅仅是文本生成。

在这些情况下,我实际上是一个薪水过高的自行车信使。我从学校的一个部门接收信息,然后将其移动,向其他需要它的人展示。我认为这种既能在小群体中孵化,又能将学到的经验扩展到更大群体

的能力将是一个巨大的加速器。现在我们有了开放模型,特别是 LAMA 模型,现在我们有了达到前沿水平的强大开放模型,我们实际上没有选择,我们不再面临在力量和灵活性之间做出选择。

我们可以真正依靠灵活性来学习不同社区如何使用这些工具。与其认为我们必须等待 AGI 或某种万能模型,我们可以说我们可以将定制应用于我们拥有的模型,并且每个群体都能从中受益匪浅。

你对生态系统、社区的看法,基于 Clay 的观点,Ash?是的,我认为非常相似,但在我们所关注的范围上可能更大一些,我的意思是,对我们来说,最容易查看的是跟踪下载量,对吧?因为我们把它放在那里,然后让人们去运行它。我认为我们刚刚超过了 6 亿次模型下载量,这转化为,我认为,大量的人在进行实验。

但是你进一步考虑一下。这有点像漏斗的顶部。对我们来说,这实际上是关于是否有公司正在建立?

正在使用 LLAMA 作为成分。我们对模型,特别是 LLAMA 模型的愿景非常像 Linux,使其民主化,以便任何人都可以使用它,并以此为基础进行构建。如果你考虑互联网,它是一个 LAMP 堆栈。我们可以成为 L 吗?今天人工智能的 LAMP 堆栈的组件是什么?我们把它放在那里

我们正在观察开发人员如何使用它,我们正在寻找围绕它的创新,你知道,无论是像正在建立的公司,还是,你知道,公司内部使用它来优化流程或解锁新的体验,我们开始看到很多,你知道,从像 AT&T 这样的

现在正在构建消费者聊天机器人,并使其更容易获得客户支持,到梅奥诊所正在对放射学进行各种疯狂的事情,以加快发现医学问题和疾病的速度。我真的认为这只是冰山一角。

所以我认为是,对不起,Clay,你有评论吗?我只是想说,关于这些用途的种类,我会说另一件事。我们共同拥有 50 年的卷曲反射来处理数字工具,这些工具从实用开始,然后变得强大,对吧?第一个电子表格出现,它只做几件事,但它发展成 Excel,我们都实现了 Excel。网络浏览器也是如此,应用商店也是如此,等等。这些工具的工作方式并非如此。它们一开始很强大,但不实用。

我们正在尝试寻找加号和减号的位置

幻觉和差距可以融入现有流程。没有人看到这些工具,你知道,JotGPT 已经两岁了,它的公开实例化上周六也已经两岁了。22 年底看到它的人都没有说,哦,我知道如何将它融入我的生产流程。他们说,哦,我的上帝,它刚刚做了什么?而且,像,驯服这种反应是,我认为,这些社区可以帮助我们做的事情的一部分,那就是弄清楚,鉴于当前工具的优缺点,以及鉴于它们持续产生惊喜,有时是我们不想要的惊喜,

谁的错误检查制度、人工参与的整合最适合这些工具。开放允许他们利用他们学到的东西来修改训练、检索增强生成,甚至只是围绕工具的包装器,而当你登录到这个远程模型时,你无法更改参数,你得不到这种方式。所以一年前的今天,我相信,

我们启动了人工智能联盟。IBM 和 Meta 是该联盟的主要赞助商之一。Ash,你想回顾一下过去一年吗?我很想听听 Clay 的反应。是的,你看,我认为这是一年,将

像我们这样的大型公司以及自那时以来加入的所有其他成员聚集在一起,在一个不断发展的领域,然后在信任和安全方面取得胜利。我认为这是真正非常出色的一年。我认为我们还有很多事情要做。我特别引以为豪并为之振奋的事情之一是……

我们真的将包容性放在心上,当您想到参与讨论的声音时,尤其是在硅谷的讨论桌上,通常是其他硅谷公司或美国科技公司。我认为联盟真正拥抱全球南方和其他发展中经济体的方式,如果您想到 IIT 孟买从第一天起就参与其中,这非常重要……

我们知道这将改变一切。我认为这是联盟的一大胜利,它汇集了通常不会被听到的声音,当然,在 101 号公路沿线不会被听到。我认为这也为数据设定了新的基调。

我们公开了我们用来训练模型的所有数据源。我认为这迫使其他人思考透明度。克莱,当你听到这样的事情时,你有什么反应?纽约大学认为这是一个机会,可以解决我们最大的问题,那就是将如此多的数据投入如此多的计算所带来的令人咋舌的资本成本。我们永远无法与……

Meta 或 IBM 在基础设施方面竞争,但我们经常在计算机科学和电气工程系,以及在我们的社会学系、游戏设计系中拥有直觉和用例。参与分享想法和机会的人际网络,我认为这非常重要,这很重要,因为它是行业和学术界,很明显,学术界很重要,但我认为这对整个联盟来说很有价值。

当我们考虑这种意外和协调的事情时,随着这些事情开始在世界上采取更多行动,行业关注于对前沿模型进行特定于行业的调整将变得越来越重要。

人们,你知道,这个词“代理”被广泛使用。它并没有得到很好的定义。如果您搁置代理的想法,只是说,这能否产生除 1 和 0 之外的输出?它实际上能否导致软件或某些情况下机器……

采取不可逆转的行动。制定关于最佳实践的行业指南非常重要。工具的智能程度如何并不重要。各个行业都必须弄清楚可接受的误报和漏报范围是多少。我认为,对于学术环境来说,这部分行业尤其有趣,因为……

我们都在关注学生毕业后的工作,也在试图根据我们在学校内部了解的情况来弄清楚未来行业应该是什么样子。

说得很好。你们两位都给了我们很多需要思考的东西。艾什,克莱,我要感谢你们两位来到这里。感谢你们的真知灼见。非常感谢。好的。我把话筒交给《华盛顿邮报》。现在,让我们回到华盛顿邮报直播。大家好,再次欢迎大家。对于那些刚到现场和在线的朋友们,我是《华盛顿邮报》的副主编乔纳森·凯普哈特。现在和我一起在舞台上的是 Runway 的联合创始人兼首席执行官克里斯托瓦尔·瓦伦苏埃拉。克里斯,欢迎来到华盛顿邮报直播。感谢你们的邀请。

好的,我们知道 Runway 是什么。告诉我们它的起源故事。是什么促成了它?催化剂?简而言之,我来自智利,八年前我搬到纽约在纽约大学学习。我喜欢钻研,我在 2016 年钻研了神经网络 AI 的兔子洞。我和当时的联合创始人一起在学校相遇,开始构建这个想法……

将人工智能应用于艺术家、创意人士和电影制作人。所以六年前我们在学校相遇后创立了这家公司,从那时起,这已经是一段相当长的旅程了,但我们仍然非常专注于同样的痴迷和同样的兔子洞。好吧,让我们带大家进入这个兔子洞。我将向观众展示您的技术能够做什么。看看这段视频。观看。还是我们没有视频?

我认为这是维罗妮卡告诉我的,我们不会有的东西。我在看这里吗?你会解雇我,因为咖啡店的楼上到处都是热牛奶?我的意思是,只是一杯拿铁。没什么大不了的。一切都没问题。一切都很好。这将是有史以来最好的一天。前几天把我的手机摔坏了。你知道我多喜欢那部手机。好吧,好吧。深呼吸。好吧,也许你不必那么用力地呼吸。好吧。

谁知道有这么多种豆子可供选择?蚕豆、黑豆、肾豆、黄油豆、白豆。现在你惊讶了。

哦,哇。我开始认为你不了解这种情况的严重性。你一路来到机动车辆管理局,却没带驾驶执照。大家冷静点。请冷静下来。我不知道如何在不闭上眼睛的情况下感到悲伤。完美。我们做到了。非常感谢。非常感谢。就是这样。好了,下一个是谁?

因此,制作这些动画不需要动作捕捉或绑定。用外行人的术语解释一下,也就是说,用我能理解的术语解释一下,你的技术是如何工作的。是的,你刚才看到的算法我们称之为 Act One。它允许你做的是,它允许你进行表演。所以这很重要。你需要一个演员。你需要有人朗读剧本或表演精彩的台词。

然后,你可以用这个算法将表演转换成你看到的任何角色或你想要的任何角色。这曾经需要一支庞大的人员队伍和非常昂贵的技术才能做到,因为正如你所说,你需要动作捕捉和这些复杂的系统。这代表着向前迈出了重要的一步。你不需要任何东西。你只需要一个非常好的想法和 Runway。你结合……

你可以将它们结合起来,获得你刚才看到的视频中的渲染效果。非常简单。那么,对于那些看到这一点并认为,正如你刚才所说,这将夺走许多工作的人,你有什么话要说呢?现在有数百人……

如果我想在过去这样做,我将需要一支庞大的人员队伍。现在你告诉我,我只需要一个想法和 Runway,说出来,我就能把它变成现实。那么,为什么好莱坞不应该害怕 Runway 呢?好吧,

首先,重要的是要提醒自己,好莱坞电影是技术史。我们之所以拥有好莱坞,是因为我们拥有伟大的技术。我认为相机是艺术领域的一项重大突破。我认为 Runway 就像一台类似的相机。它是一种设备,是一种工具,可以让你进行讲故事。

在好莱坞的历史上,技术一直在变化。它一直在变化,使我们能够做一些过去需要我们以不同方式做的事情。例如,我不知道你是否记得,但电影曾经是无声的。我们有无声电影,然后我们有了有声电影,有声电影突然有了电影的音频和音乐。人们当时最大的担忧之一,这是事实,是剧院里的乐队会发生什么?剧院里曾经有乐队。对。

我认为,这项工作,这项工作发生了变化。

它从现场表演变成了录音棚,现在你可以拥有更一致的音效行业,并且创造了更多工作岗位,对吧?所以对我来说,这非常相似,它不是逐帧动画。而是你想讲述的故事。我认为这可以创造更多工作岗位,更多以前可能无法实现的应用,因为成本太高或耗时太长。现在,我不知道人们是否知道这一点,但你的技术被用于……

2022 年奥斯卡获奖电影《万物皆有裂痕》。那次经历怎么样?并向我们介绍一下我们今天看到的电影中使用了多少人工智能。但首先,谈谈《万物皆有裂痕》。所以在电影制作过程中,有很多不同的东西,很多不同的部分和过程,它们都非常复杂。

在这个过程中,有很多部分你可以拥有更好、更自主的系统来帮助你。其中一件事情叫做转描。所以转描是电影制作中非常基本的一部分,它允许你将背景与前景分开。所以如果我有一张你的照片,我想在后面添加一些东西,我必须基本上把你从照片中剪掉。直到最近,人们做这件事的方式都是手工的。

它只是逐帧进行。一秒钟有 24 帧。所以你花了好几个小时、好几天、好几周、好几个月做一些非常手工的事情。所以我们有算法和工具,在我们这种产品集中,允许你在很短的时间内做到这一点。

所以,我曾经想要的一切,那部电影背后的一些编辑都专门使用 Runway 来完成这种工作,这可以将制作电影的时间从几周缩短到几分钟,这样你就可以专注于其他类型的工作或任务。

所以还有很多其他部分,你可以找到可以使用像 Runway 这样的工具来帮助自己的优化阶段。你曾经说过,我想引用你的话,“我们正走向一个你消费的所有媒体和内容娱乐都将由人工智能生成的世界。”鉴于此,你认为未来五到十年会走向何方?你说我们正走向一个世界。

是五年、十年、五个月还是五个星期?好吧,如今的人工智能发展非常迅速,所以很难预测。但我认为我多次试图阐明的是,有两种看待这个问题的方法。有一种是短期版本,另一种是长期版本。

短期来看,我们将会有很多新的所谓的 AI 电影,对吧?所以你将得到一部曾经需要 1 亿美元才能制作的电影。你可能可以用 1000 万美元的预算制作它。类似的视觉效果,类似的内容。这些将是 AI 增强的或 AI 增强型电影。但最终,一旦你达到实时视频,所以你在这里看到的视频大多是 10 秒钟的。制作它们需要 10 秒钟。你将拥有实时视频。你将能够实时渲染视频。

你将能够以实时的方式创作故事和叙事。对我来说,这与电影不同。这是一种新的媒体形式。这是我们尚未共同体验过的事情。想象一下,拿起你的手机,打开你的电视,你正在观看在你体验时正在生成的东西。它可能是我们称之为视频游戏的组合。它可能感觉像一部电影。它可能感觉是其他东西。我认为这就是我们正在为之准备的世界。这与虚拟现实有何不同,每个人都戴着……

他们的面罩。它完全不同还是一样?对我来说,虚拟现实就像你可以体验这样的东西的设备和媒介,对吧?但是……

但是你仍然在虚拟现实中观看。你正在观看别人之前制作的东西。你正在观看相同的体验。如果我戴上耳机或打开电视,我们都在观看相同的东西。这与众不同,因为我可以生成个性化体验。我可以生成一个适合你的视频或电影,一个故事。这与我正在观看的不同。而我正在观看的,没有人曾经看过,因为它在我体验时正在生成。

现在是这样吗?我们正在走向那里。你现在就可以进行实时视频生成。这是可行的。有两件事尚未解决,那就是它的单位经济学需要有意义才能在全球范围内分发。以及质量。这种实时视频生成才几个月可行。所以我们还处于非常早期的阶段。

我认为我们还有四分半钟的时间。我认为我们有时间做这件事。你的公司还有一个名为 Frames 的模型。是的。我们将展示一些使用 Frames 的视觉效果,但你能解释一下我们正在看什么以及如何使用 AI 来创建它吗?所以这些都是生成的……

使用我们新的名为 Frame 的模型生成的图像。所以 Frame 是一种最先进的图像模型,它是专门为讲故事、电影制作和电影而创建的。

所以它可以让你控制、定义并告诉模型你想要的相机类型、你想要的胶片颗粒类型、你想要的拍摄类型以及你想表达的表情类型。所以它对我们合作的制片厂和我们合作的电影制作人来说特别好。这是一个非常非常灵活的模型,只用于故事时间。

好吧,这很有趣。它为我的下一个问题提供了一个很好的过渡。我的意思是,你去过艺术学校。是的。那么,你在那里的经验如何影响你公司正在开发的技术,影响导致 Frames 的技术呢?我想这要回到一开始的兔子洞。所以我之所以进入兔子洞,是因为我痴迷于艺术史和软件工程。十年前,我试图将这两件事融合在一起。

所以 Runway 在某种程度上是我们在艺术和科学方面与我的联合创始人共同拥有的蓬勃发展的成果。我认为让我们与众不同的是,了解艺术创作过程和了解故事的讲述方式、了解艺术家如何运用工艺,对于构建艺术家的工具来说非常必要。

如果你对艺术家和制作以及电影制作的工作方式有一个过于简单的假设,那么构建真正有意义且有趣的艺术创作工具将非常困难。所以对我们来说,它一直围绕着这两个世界的融合,艺术和科学。我们一半的团队是艺术家,他们帮助发展研究。所以不仅仅是研究人员。是研究人员与艺术家一起工作。

你还在与许多工作室合作。跟我们谈谈你最近与狮门影业的合作以及你希望实现的目标。当然。所以这是我们最近宣布的一种首创的关系,一种伙伴关系。我们正在与狮门影业及其团队密切合作,做几件事。首先是……

使用我们的工具,帮助他们在制作中使用它们,在未来的电影中,在短片中使用它们。他们有很多不同的项目,我们正在融入其中。那里的目标是帮助他们讲述更好的故事。

第二个是,我认为,拥有大量数据目录的好处是,你可以创建非常具体的模型和非常具体的工具,这些模型和工具特定于你的世界。所以想想《疾速追杀》。他们可以获取《疾速追杀》的数据、模型和视频,并创建一个特定版本,他们可以在《疾速追杀》的下一个版本中使用。

这可能是他们拥有的东西,或者他们可以向其他人开放使用。所以这是一种在数据方面和工具方面的关系。我们还剩不到 90 秒的时间,但我们将延长一点时间,因为我有两个问题。继续。我将最后一个问题作为倒数第二个问题来问。立法者显然多年来一直在研究人工智能法规。你认为这会对你的业务产生什么影响……

你的创造能力?你有什么,好吧,首先,你认为华盛顿会做些什么?国会会在人工智能监管方面做些什么?你认为他们正在讨论的任何事情都会影响人工智能……

你的工作?好吧,我认为应该如此。这是一项新技术。它非常强大。对某些人来说,它具有颠覆性,它将改变很多事情。我认为监管的重要之处在于,它需要在适当的时候深思熟虑地进行。我认为现在还为时尚早,无法完全了解这种……

这项技术可以如何使用。你想要确保不会发生的一件事是,你停止创新。就像我们正处于一项新的重大媒体变革的开始,它可以帮助和促进并创造许多新的就业机会。我们的工作是确保我们能够继续扩大这一规模。我认为可能有一种情况是,监管实际上会停止……

这个过程,我想确保它不会发生。最后一个问题,你知道,康纳,他参加了两个小组讨论,我和他谈到了 Runway 和 ChatGPT,以及所有这些技术,特别是 Runway,你说它升级了。是的。所以现在每个人都可以访问你在 Runway 上做的事情,这让我回想起……

互联网出现时以及它对新闻业的意义。当我 80 年代在大学读书时,我们有三大新闻网络,几家主要的全国性报纸,而且,你知道,我在校报和广播电台工作。所以,你知道,我是信息和新闻的守门人之一。好吧,有了互联网,

我的母亲和我拥有相同的信息和新闻访问权限。然后每个人都可以访问相同的信息。这样做的危险是,人们开始把自己封闭在他们自己的小新闻孤岛中,在那里他们消费的是迎合他们世界观的新闻。我们为什么不应该害怕?为什么好莱坞不应该害怕,或者创意人士不应该害怕,因为现在……

像我这样的非创意类型可以访问 Runway,我不会想出一些东西并强迫他们离开。汹涌的人群将把好莱坞推到一边,为他们自己创造的娱乐节目让路。

所以我想说的第一件事是,我认为创造力是一种心态。每个人都可以有创造力,每个人都应该有创造力。如果有人有故事要讲,他们就应该讲。你不应该因为行业、资源、你拥有的技术而受到限制。所以在某种程度上,这是讲故事的真正民主化,因为你可以制作以前你从未想过要制作的电影和故事。这很好。我认为最好的电影尚未制作。最好的故事尚未讲述。我们需要听到这些故事。我实际上认为相反的情况是……

那就是,如果我们只听到相同数量的人的声音,那么故事将永远相同。那里有数十亿人,我们以前从未听说过。有很多很棒的故事,相信我,很棒的故事,如果你只是给他们合适的资源,你就会听到他们的声音。也许它会改变你的观点。也许它会改变你看待世界的方式。这就是艺术的作用。艺术的作用是你创造一些东西,希望你会创造并改变人们的感知和观点。

看,现在我要离开这次谈话,跳进你跳进去的兔子洞。Runway 的联合创始人兼首席执行官特里斯托巴尔·瓦伦苏埃拉,非常感谢你今天来到这里。谢谢。谢谢。感谢收听。有关我们即将推出的节目的更多信息,请访问 WashingtonPostLive.com。