We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode OpenAI Faces Lawsuit from News Organizations Over Alleged Unfair Deals

OpenAI Faces Lawsuit from News Organizations Over Alleged Unfair Deals

2024/5/3
logo of podcast No Priors AI

No Priors AI

AI Deep Dive AI Chapters Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
主持人:多家美国主要报纸,包括纽约每日新闻、芝加哥论坛报等,起诉OpenAI和微软版权侵权。这些报纸的母公司是Alden Global Capital,它们指控OpenAI和微软未经许可使用其文章训练AI模型,并删除了版权管理信息,如记者姓名和标题。诉讼还包括商标稀释索赔,声称OpenAI和微软未经授权使用其商标。此外,新闻机构还指控OpenAI和微软的AI模型出现“幻觉”,损害了其声誉。OpenAI和微软则回应称,AI模型并非故意复制粘贴新闻内容,这只是罕见的bug。此次诉讼的核心在于OpenAI是否在未经授权的情况下使用新闻文章训练其AI模型,以及这是否构成版权侵权。这起诉讼将对AI公司如何使用新闻内容产生重大影响,并可能改变新闻出版商的盈利模式,因为生成式AI工具正在颠覆传统的搜索引擎和新闻获取方式,AI新闻简报的兴起也正在改变人们获取新闻的方式。

Deep Dive

Chapters
This chapter explores the lawsuit filed against OpenAI by eight major US newspapers, all owned by Alden Global Capital, for copyright infringement. It examines the financial motivations behind the lawsuit and the role of Alden Global Capital in consolidating the legal action.
  • Eight major US newspapers, owned by Alden Global Capital, are suing OpenAI and Microsoft for copyright infringement.
  • The lawsuit alleges OpenAI used copyrighted articles without permission or payment to train its model.
  • Alden Global Capital's financial motivations are highlighted as a key driver of the lawsuit.

Shownotes Transcript

在本集中,我们将分析多家新闻机构针对OpenAI最近的交易行为提起的诉讼,并探讨其对更广泛的AI领域可能产生的影响。加入AI Box候补名单:⁠⁠⁠⁠⁠⁠https://AIBox.ai/⁠⁠⁠⁠⁠⁠AI Facebook社区: ⁠⁠⁠⁠https://www.facebook.com/groups/739308654562189⁠⁠⁠⁠Podcast Studio AZ: ⁠⁠⁠⁠https://podcaststudio.com/az⁠⁠⁠⁠Podcast Studio Network: ⁠⁠⁠⁠https://podcaststudio.com/network/⁠⁠⁠⁠ </context> <raw_text>0 今天,AI领域出现了一些重大新闻,那就是五家主要的美国报纸目前正在起诉OpenAI侵犯版权,他们也在起诉微软。我认为,你不会只想起诉一家新兴公司。你想要起诉实际上给他们提供所有资金的人,当然就是微软。所以这是一笔非常有趣的交易和诉讼。我想把它分解一下。我们过去也见过类似的诉讼,但所有这一切都发生在OpenAI.com之后。

与多家新闻公司达成了大量新协议。我们与Axel Springer达成了协议。他们上周刚刚与《金融时报》签署了一项协议。当然,过去我们也看到他们与《纽约时报》达成了和解协议。所以在我看来,这里真正发生的事情可能是OpenAI正在与许多新闻出版公司达成协议。

他们基本上是在为他们的内容付费,或者其他什么。这完全没问题。但我认为,正因为如此,当然我们会有一些其他的公司说,嘿,我们想要分一杯羹,对吧?他们不希望只有《纽约时报》从诉讼中获得赔偿。他们都想加入。你几乎可以看到,如果有一个存钱罐,每个人都想砸碎它。OpenAI向其他新闻公司支付的资金越多,新的公司就会加入。我认为,由于OpenAI基本上是从整个行业的

互联网上进行训练的,是的,你可以为每一家新闻公司辩护,说它们都被包含在训练集中。我想说的一件重要的事情是,在这些诉讼中,我们将进一步分解具体细节,但要总结一下,OpenAI是从例如《纽约时报》的数据进行训练的,这并不意味着如果OpenAI将《纽约时报》的网址列入黑名单(我实际上不认为他们这么做了,因为我认为他们想要所有这些数据),但假设他们这么做了,因为他们不想与他们发生任何诉讼。

这并不意味着他们将完全免于使用《纽约时报》的数据进行训练,因为互联网上的任何人都很容易复制和粘贴文章并在自己的网站上重新发布。这是第一步,也许《纽约时报》会对那个网站生气,尤其如果该文章应该在其付费墙后面。但是,当某些内容属于合理使用时,情况会变得有点棘手,例如,你访问互联网上的任何文章,并且你

复制一段或几句话,然后在某个地方引用它们,对吧?你就像,《纽约时报》在其文章中说,发生了这样的事情。而且,免得你认为《纽约时报》的文章有一些完全受保护的类别,例如,我看到彭博社和《纽约时报》

也引用了其他人的话,或者其他博客,或者,最近,我们发生了巨大的科技丑闻,马库斯·布朗利一直在评论大量的AI技术,他给出了差评,无论如何。这是一个很大的病毒式时刻。它在推特上。是的,每家主要的新闻公司都在引用他YouTube视频中的直接引语。他们还在引用他的前账户以及在他前帖子中发表评论的人的直接引语。所以,

我不知道。在我看来,这一切都是合理使用,对吧?事情发生了,评论也随之而来。我之所以说这一切,是因为当你进行这些诉讼并说OpenAI从《纽约时报》的片段中进行训练时,情况会变得有点棘手,因为他们实际证明这一点的方式是尝试联系OpenAI并说,嘿,给我关于这件事的这篇文章中的一个确切的引语。如果

如果OpenAI吐出一个来自《纽约时报》文章的直接引语,《纽约时报》就会说哈哈,我们抓到你了,对吧?无论如何,但这并不一定意味着它实际上来自原始文章,它可能是某人引用它,这甚至算不算不好,因为引用正在发生的事情并谈论它们是一种合理使用,我认为,很明显,如果你……说在这个特定事件中发生了什么,并且像字面复制粘贴了整篇《纽约时报》文章,那将是很糟糕的,但是它

并没有这样做。我认为它更进一步。抱歉我在这里用了这么多比喻,但最后一件重要的事情是,随着这些AI工具越来越流行,甚至在ChatGPT出现之前,当我们有像Jasper AI这样的东西时,我在两年前的9月份就一直在使用它,我大量使用了这个东西。这基本上是DaVinci,它是ChatGPT发布之前的旧版本,无论如何。关键是,

人们正在使用这些AI工具来改写文章。今天,你可以将一篇《纽约时报》的文章放入ChatGPT中,让它改写,即使《纽约时报》可能拥有该文章的独家数据。然后也许《纽约时报》可能会对此感到生气。但与此同时,这与我阅读一篇《纽约时报》文章并写下我对他们所说内容的评论有什么区别呢?每个人都在这样做。

所以有很多灰色地带。因此,这些诉讼有点意思。让我们深入了解这里到底发生了什么。那么,这些报纸是谁呢?它们是由一家公司拥有的八家大型报纸。我认为这很重要。同一投资公司,即奥尔登环球资本,是

我认为这很重要,因为它不像所有这些人都是朋友,他们聚在一起起诉OpenAI。实际上,是奥尔登环球资本正在起诉OpenAI。让我们明确这一点。第二件事是,《纽约时报》曾有过类似的诉讼,他们获得了很多……他们有很多出版物索赔。直到现在……

他们是唯一一个真正对他们采取法律行动的人。有趣的是,他们似乎仍然可能是唯一一个采取法律行动的独立方,而不是像这是一个投资集团。所以,你知道,他们是一个投资集团,所以他们可能想要钱,无论如何。这绝对是关于钱的。因此,许多其他报纸,包括《金融时报》、《美联社》和Axel Springer,都发表了具体的声明。

与OpenAI和其他AI公司达成了付费协议,他们每年获得数百万美元,以使其内容被包含在内。微软没有谈论此事。他们没有评论整个故事,整个诉讼,而OpenAI对此则更加健谈。但是,这些

公司实际上是一个大型企业集团。我们有《纽约每日新闻》、《芝加哥论坛报》、《奥兰多哨兵报》、《南佛罗里达太阳哨兵报》、《圣何塞水星新闻报》、《丹佛邮报》、《橙县纪事报》和《圣保罗先驱报》。好吧,如果说实话,这些都是地方报纸。对。我想《芝加哥论坛报》可能是其中较大的报纸之一。但除此之外,是的,这些都是地方城市新闻。实际上是一家大型投资公司。

因此,他们都由Rothwell, Figg, Ernest和Manick律师事务所代表,这是两家支持《纽约时报》对OpenAI和微软提起诉讼的律师事务所之一。所以这就像我们看到一家大型投资公司拥有这些报纸中的许多。他们雇佣了与《纽约时报》相同的律师事务所来起诉OpenAI。诉讼是在与时报诉讼相同的地区提起的,这

很有趣,因为如果选择相同的法官来监督这两个案件,他们实际上可以选择合并这两个申诉。这是故意为之的吗?这是随机的吗?显然这是故意的。他们

他们认为《纽约时报》的这场诉讼可能会进展顺利,或者有很高的成功几率。因此,这家投资公司抓住了其旗下的一系列报纸。他们在同一地区提起类似的诉讼,希望同样的法官来审理。如果同样的法官来审理,他可以合并这两个案件。从本质上讲,这家投资公司将搭乘《纽约时报》案的便车。因此,你显然可以看到所有这一切背后都有相当强烈的经济动机。但这很有趣。是的。

据Axios报道,一位显然熟悉此事的人说。所以,我的意思是,熟悉此案,我喜欢对此附加一个警告,因为当没有一个人的名字在后面时,我讨厌这种消息来源。你可以在新闻中经常看到假新闻。但无论如何,据Axios报道,一位熟悉奥尔登子公司(拥有这些报纸)的人说,该报目前选择起诉

这两家公司,而不是试图达成协议。所以《纽约时报》在提起诉讼之前,曾与OpenAI和微软进行了几个月的谈判……OpenAI表示这令人惊讶,因为他们说我认为我们会达成协议,但你知道,这显然花了很多时间。当他们说试图达成协议但没有成功时,这意味着他们要价太高,或者根据OpenAI的说法,要价太高,OpenAI不想支付他们要求的价格,所以他们说好吧,我们会起诉你……

显然,情况也是如此。他们试图达成协议,然后现在提起诉讼,因为他们没有得到他们想要的价格。看看他们是否最终能得到这个价格将会很有趣。我认为这将是一个先例,你知道,这将对这些AI公司能够做什么产生很大的影响。所以。

目前,奥尔登并没有排除其更多(我认为他们拥有60家报纸)最终加入诉讼的可能性。他们现在从八家开始。我认为这意味着他们找到了八家报纸,他们有很高的几率被包含在数据集中。他们说,好吧,我们可能不100%知道或无法证明所有60家报纸是否都被包含在内,但他们说,

他们说不会排除将所有60家报纸都加入这场诉讼。我想如果最终每家新闻网站都能获得一定数量的钱,那么他们就会说,好吧,60家比8家要好得多。所以他们可能会把它们全部扔进去。看看会发生什么将会很有趣。

那么这一切是如何运作的呢?与《纽约时报》的诉讼类似,我认为这项申诉的核心是围绕OpenAI使用其文章来训练模型的版权侵权索赔。这些报纸,或者这家投资公司,目前正在指控OpenAI和微软“未经许可和未经支付,盗用数百万篇出版商的受版权保护的文章”。当然,这是为了从ChatGPT中赚钱。所以

这家报纸目前还声称,OpenAI和微软在引用信息时删除了版权管理信息,例如记者的姓名和头衔。因此,诉讼还包括稀释商标索赔,该索赔声称OpenAI和微软……

他们没有获得授权来使用这些信息。他们还说,他们在ChatGPT和Copilot的答案中使用了这些报纸的商标。你可以将微软和OpenAI一起加入这项申诉,因为Copilot的背后实际上也是ChatGPT,对吧?

报纸还指控这两家公司声誉受损,原因是AI的幻觉。所以他们基本上说,看,你们正在使用我们的信息,你们正在使用它来为人们提供答案,但它也可能产生幻觉并说出错误的事情。这对我们来说是不利的,因为我认为这一点有点无关紧要,因为,很明显,也许,好吧,也许如果我用稻草人来论证这一点,或者用钢铁人来论证这一点,也许他们所说的意思是……

根据《纽约时报》的文章,这件事发生了,对吧?所以也许ChatGPT会这么说。然后它有一些错误的事实。然后他们说,这会损害我们的声誉,因为现在它将我们的品牌名称与之联系在一起。简单的解决方法是,告诉ChatGPT永远不允许它说《纽约时报》或《华盛顿邮报》等等。这显然有优缺点。这会让它感觉质量较低。我认为

如果他们想强硬,OpenAI就会这样做。至于窃取他们的版权和品牌,在我看来,这就像谷歌一样。这有助于他们的品牌推广。引用他们使他们保持相关性。坦白说,我上次去《纽约时报》阅读文章是在很久以前了。可能是因为它有付费墙,也可能是因为……

我不知道。你知道,我通过其他方式获取新闻。我从时事通讯中获取,我从不同的地方获取。所以看起来它变得不那么重要了。如果你想保持相关性,我认为被引用可能是一件好事。如果我在某个地方看到它被引用,即使是在ChatGPT中,我更有可能去阅读一篇《纽约时报》的文章,而不是它从未提及这个名字。所以这很有趣,因为他们很生气他们使用了他们的数据,但他们不希望他们使用他们的名字,无论如何。

让我们谈谈大局。我认为这场诉讼的结果对于AI公司如何将新闻融入其内容中至关重要。到目前为止,新闻出版商显然只是依赖于来自搜索流量的广告收入。我们已经看到了20年了。生成式AI工具可以从根本上消除这一点,因为我

我并不总是使用谷歌。我的意思是,说实话,我不,是的,我使用Perplexity。我使用You.com。我使用许多其他工具而不是谷歌。所以谷歌正在受到冲击,但我正在获得简洁的答案总结。我还使用时事通讯,这已经取代了我的……AI时事通讯很棒。嗯,

大声喊出来。所以,我用它来获取我的许多AI新闻,它们会引用来源,但如果他们给我一个非常简洁的答案,我不会点击它,我知道他们只是使用AI工具来总结一篇文章等等。但如果他们只是在那里总结一下,我不需要谷歌来查找它,也不需要阅读文章来获取信息。所以,是的,这两者之间是相当具有颠覆性的。所以。

这就是模式,它肯定正在受到冲击。他们都对此感到担忧,他们都不希望这种情况发生。所以看看结果如何将会很有趣。OpenAI目前已经反对这两起诉讼。他们正在法庭上抗辩这两起诉讼。他们说,《纽约时报》特别指出OpenAI的工具是如何逐字复制《纽约时报》的内容的。他们说这只是

吐出相同的东西,他们说这是一个罕见的错误,我们正在努力将其降至零,换句话说,ChatGPT的设计并非为了复制粘贴,所以如果发生这种情况,这可能不是经常发生的事情,这是一个罕见的错误,他们正在努力将其降至零,正如他们所说

所以,是的,显然一切都会被改写。无论如何,看看结果如何将会非常有趣。如果你今天喜欢这个播客,如果你学习了关于这些诉讼以及未来格局将如何发展的新知识,我真的很感激你点赞视频或给我们评价。如果你在Apple或Spotify上收听,请订阅,我会在下一个视频中与你见面。