We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode News Companies Sue OpenAI for Allegedly Violating Contract Terms

News Companies Sue OpenAI for Allegedly Violating Contract Terms

2024/5/3
logo of podcast AI Education

AI Education

AI Deep Dive AI Chapters Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
我今天要报道一个关于人工智能的大新闻:五家主要的美国报纸正在起诉OpenAI版权侵权,同时还起诉了微软。我认为,仅仅起诉新兴公司是不够的,还需要起诉为其提供资金支持的微软。这是一个非常有趣的诉讼案件。OpenAI最近与多家新闻机构达成了协议,例如与Axel Springer和金融时报的合作,以及之前与纽约时报的诉讼和解。我认为,OpenAI与众多新闻出版公司签订协议,向其支付内容费用,这引发了其他公司的效仿,他们也想分一杯羹。OpenAI的训练数据可能包含所有新闻公司的数据,这使得所有新闻公司都有理由起诉。即使OpenAI排除了特定新闻机构的数据,也无法完全避免其训练数据中包含该机构的数据,因为数据很容易被复制和转载。互联网上复制和引用文章片段可能构成合理使用,这使得版权侵权的界定更加复杂。许多新闻机构也会引用其他来源的内容,这进一步模糊了版权的界限。许多主要新闻机构都直接引用了Marcus Brownlee YouTube视频和社交媒体评论中的内容,这可能构成合理使用。证明OpenAI使用了特定新闻机构的数据,需要OpenAI输出该机构文章的直接引用,但这并不一定意味着OpenAI直接使用了原始文章。OpenAI输出的引用内容可能来自其他来源的引用,这使得判断其是否构成侵权变得困难。早期的AI工具就已经被用于改写文章,这与人们阅读文章后撰写评论并无本质区别。使用AI工具改写文章与人们阅读后发表评论之间存在灰色地带。起诉OpenAI的八家报纸都属于同一家投资公司——Alden Global Capital。纽约时报此前也曾对OpenAI提起类似诉讼,但它是独立行动的。Alden Global Capital起诉OpenAI的主要动机是经济利益。许多新闻机构与OpenAI达成了付费协议,而微软对此事保持沉默。起诉OpenAI的八家报纸都是地方性报纸,属于Alden Global Capital旗下。Alden Global Capital聘请了与纽约时报相同的律师事务所,并在同一地区提起诉讼。Alden Global Capital的诉讼策略可能是为了搭便车,利用纽约时报的诉讼结果。Alden Global Capital的诉讼策略是希望法官合并两起案件。Alden Global Capital选择起诉OpenAI和微软,而不是谈判达成协议。Alden Global Capital可能因为谈判未能达成理想的赔偿金额而选择起诉。此案的结果将对AI公司如何使用新闻内容产生重大影响。Alden Global Capital可能将旗下更多报纸加入诉讼。Alden Global Capital可能会将所有60家报纸都加入诉讼。此次诉讼的核心是OpenAI未经授权使用新闻文章训练模型,构成版权侵权。诉讼还包括OpenAI和微软删除版权管理信息以及稀释商标的指控。诉讼指控OpenAI和微软在ChatGPT和Copilot中使用了新闻机构的商标。诉讼还指控OpenAI和微软因AI的幻觉而损害了新闻机构的声誉。AI的幻觉可能会损害新闻机构的声誉,但可以通过技术手段来解决。OpenAI使用新闻机构的数据可能反而提升了它们的知名度。新闻机构担心AI工具会取代搜索引擎和广告收入。此案的结果将对AI公司如何使用新闻内容以及新闻出版商的商业模式产生重大影响。生成式AI工具正在颠覆传统的搜索引擎和新闻获取方式。AI新闻简报正在取代传统的新闻阅读方式。新闻出版商担心AI工具会影响其广告收入。OpenAI否认ChatGPT故意复制粘贴新闻内容,并表示这只是一个罕见的bug。

Deep Dive

Chapters
Major US newspapers are suing OpenAI and Microsoft for copyright infringement, alleging that OpenAI's training data included copyrighted material without permission. The lawsuits raise complex issues around fair use, data scraping, and the impact of AI on traditional news publishing.
  • Five major US newspapers are suing OpenAI and Microsoft.
  • The lawsuit alleges copyright infringement and the unauthorized use of copyrighted articles to train AI models.
  • The case questions the boundaries of fair use in the context of AI training data.

Shownotes Transcript

在本期节目中,我们将仔细审查新闻机构针对OpenAI最近达成的交易而采取的法律行动,探讨其法律影响和更广泛的行业影响。加入AI Box候补名单:⁠⁠⁠⁠⁠⁠https://AIBox.ai/⁠⁠⁠⁠⁠⁠AI Facebook社区:⁠⁠⁠⁠https://www.facebook.com/groups/739308654562189⁠⁠⁠⁠Podcast Studio AZ:⁠⁠⁠⁠https://podcaststudio.com/az⁠⁠⁠⁠Podcast Studio Network:⁠⁠⁠⁠https://podcaststudio.com/network/⁠⁠⁠⁠ </context> <raw_text>0 今天,我们在AI领域有一些重大新闻,那就是五家主要的美国报纸目前正在起诉OpenAI侵犯版权,他们也在起诉微软。我认为,你知道,你不想只起诉这家新兴公司。你想起诉实际上给他们所有钱的那个人,当然就是微软。所以这是一个很有趣的交易和诉讼。我想把它分解一下。我们过去也见过类似的诉讼,但所有这一切都发生在OpenAI.com之后。

与多家新闻公司达成了一系列新协议。我们与Axel Springer达成了协议。他们上周刚刚与《金融时报》签署了一项协议。当然,过去他们也与《纽约时报》达成了这项诉讼和协议。所以在我看来,这里真正发生的事情可能是OpenAI正在与许多新闻出版公司达成协议。

他们基本上是为他们的内容付费,或者其他什么。这完全没问题。但我认为,正因为如此,当然我们还有很多其他公司会说,嘿,我们想要分一杯羹,对吧?他们不希望只有《纽约时报》从诉讼中获得赔偿。他们都想加入。你几乎可以看到,如果有一个存钱罐,每个人都想砸碎它。OpenAI向其他新闻公司支付的钱越多,新的公司就会加入。我认为,因为OpenAI基本上是从整个行业进行训练的

互联网,是的,你可以为每一家新闻公司辩护,说它们都被包含在训练集中。我想说的一件重要的事情是,在这些诉讼中,我们将进一步分解细节,但要总结一下,OpenAI是从例如《纽约时报》进行训练的,这并不意味着如果OpenAI将《纽约时报》的网址列入黑名单(我实际上不认为他们这么做了,因为我认为他们想要所有这些数据),但假设他们这么做了,因为他们不想与他们发生任何诉讼。

这并不意味着他们将完全免于使用《纽约时报》的数据进行训练,因为互联网上的任何人都很容易复制和粘贴文章并在自己的网站上重新发布。现在,这是第一步,也许《纽约时报》可能会对那个网站生气,或者其他什么,特别是如果它应该在其付费墙后面。但是,当某些事情相当公平使用时,情况就变得有点棘手了,例如,你访问互联网上的任何文章,并且你

你复制一段或几句话,然后在某个地方引用它们,对吧?你就像,《纽约时报》在其文章中说,这件事发生了。而且,免得你认为存在某种完全受保护的《纽约时报》文章类别,例如,我看到彭博社和《纽约时报》

也引用其他人的话,或者其他博客,或者,最近,我们发生了巨大的科技丑闻,马库斯·布朗利一直在评论大量的AI技术,他给出了差评,无论如何。这是一个很大的病毒式时刻。它在推特上。是的,每家主要的新闻公司都在引用他YouTube视频中的直接引语。他们还在引用他的前账户以及在他前帖子中发表评论的人的直接引语。所以,

我不知道。在我看来,这都是合理使用,对吧?事情发生了,评论也随之而来。所以我之所以说这一切,是因为当你进行这些诉讼并说OpenAI从《纽约时报》的片段中进行训练时,情况就变得有点棘手了,因为他们实际证明的方法是他们试图找到OpenAI并说,嘿,给我关于这件事发生的这篇文章中的确切引语。如果

如果OpenAI吐出《纽约时报》文章中的直接引语,《纽约时报》就会哈哈,我们抓到你了,对吧?所以无论如何,但这并不一定意味着它实际上来自原文,它可能是某人引用它,这甚至不好吗?因为像我们从正在发生的事情中获取引语并谈论它们是一种公平使用,我认为,很明显,如果你……说了这个特定事件中发生的事情,并且像字面复制粘贴了整篇《纽约时报》文章,那将是很糟糕的,但是它

但它甚至没有这样做。我认为它更进一步。抱歉我在这里用了这么多比喻,但最后一件重要的事情是,随着这些AI工具越来越流行,甚至在ChatGPT出现之前,当我们有像Jasper AI这样的东西时,我在两年前的9月份就一直在使用它,我一直在大量使用这个东西。这基本上是DaVinci,它是ChatGPT发布之前的旧版本,无论如何。重点是,

人们一直在使用这些AI工具来改写文章。今天,你可以将一篇《纽约时报》的文章放入ChatGPT中,让它改写,即使《纽约时报》可能拥有该文章的独家数据。然后也许《纽约时报》可能会对此感到生气。但与此同时,这与我阅读一篇《纽约时报》文章并写下我对他们所说内容的评论有什么区别呢?每个人都在这样做。

所以有很多灰色地带。因此,这些诉讼有点意思。让我们深入了解这里到底发生了什么。那么,这些报纸是谁呢?它们是由一家公司拥有的八家大型报纸。我认为这很重要。同一投资公司,即奥尔登环球资本,是

我认为这很重要,因为它不像所有这些人都是朋友,他们聚在一起起诉OpenAI。实际上,是奥尔登环球资本正在起诉OpenAI。让我们明确这一点。第二件事是,《纽约时报》曾有过类似的诉讼,他们得到了一大堆……他们提出了一大堆出版物索赔。直到现在……

他们是唯一一个真正对他们采取法律行动的人。有趣的是,他们似乎仍然可能是唯一一个采取法律行动的独立方,而不是像这是一个投资集团。所以,你知道,他们是一个投资集团,所以他们可能想要钱,无论如何。这绝对是关于钱的。因此,许多其他报纸,包括《金融时报》、《美联社》和Axel Springer,都发表了具体的声明。

与OpenAI和其他AI公司达成了付费协议,他们每年获得数百万美元,以使其内容被包含在内。微软没有谈论此事。他们没有评论整个故事,整个诉讼,而OpenAI则对此事说得更多一些。但这些是谁

基本上是一家大型集团的公司。我们有《纽约每日新闻》、《芝加哥论坛报》、《奥兰多哨兵报》、《南佛罗里达太阳哨兵报》、《圣何塞水星新闻报》、《丹佛邮报》、《橙县纪事报》和《圣保罗先驱报》。好吧,如果说实话,这些都是地方报纸。对。我想《芝加哥论坛报》可能是其中较大的报纸之一。但除此之外,是的,这些都是地方城市新闻。实际上是一家大型投资公司。

因此,他们都由Rothwell, Figg, Ernest和Manick律师事务所代表,这是两家支持《纽约时报》对OpenAI和微软提起诉讼的律师事务所之一。所以这有点像我们看到一家大型投资公司拥有这些报纸。他们雇佣了与《纽约时报》相同的律师事务所来起诉OpenAI。诉讼是在与时报诉讼相同的地区提起的,这

很有趣,因为如果选择相同的法官来监督这两个案件,他们实际上可以选择合并这两项申诉。这是故意为之的吗?这是随机的吗?显然这是故意的。他们

他们认为《纽约时报》的这项诉讼可能会进展顺利,或者有很高的成功几率。因此,这家投资公司抓住了其旗下的一系列报纸。他们在同一地区提起类似的诉讼,希望同样的法官来审理。如果同样的法官来审理,他可以合并这两个案件。从本质上讲,这家投资公司将搭乘《纽约时报》案的便车。因此,你显然可以看到所有这一切背后都有相当强烈的经济动机。但这很有趣。是的。

据Axios报道,一位显然熟悉此事的人说。所以,我的意思是,熟悉这个案子,我喜欢对此附加一个警告,因为当没有一个人的名字在后面时,我讨厌那种消息来源。你可以在新闻中经常看到假货。但无论如何,据Axios报道,一位熟悉奥尔登子公司(拥有这些报纸)的人说,该报目前选择起诉

这两家公司,而不是试图达成协议。所以《纽约时报》在提起诉讼之前,曾与OpenAI和微软进行了几个月的谈判……OpenAI表示这令人惊讶,因为他们说我认为我们会达成协议,但你知道,这显然花了很多时间。当他们说试图达成协议但没有成功时,这意味着他们要价太高,或者根据OpenAI的说法,要价太高,OpenAI不想支付他们要求的价格,所以他们说好吧,我们会起诉你……

所以显然,同样的事情。他们试图达成协议,然后现在提起诉讼,因为他们没有得到他们想要的价格。看看他们是否最终能得到这个价格将会很有趣。我认为这将是一个先例,你知道,这对这些AI公司来说有很多影响,他们能够做什么。所以。

目前,奥尔登并没有排除其更多公司(我认为他们拥有60家报纸)最终加入诉讼的可能性。他们现在从八家开始。我认为这意味着他们找到了八家报纸,他们有很高的几率被包含在数据集中。他们说,好吧,我们可能不是100%知道或能证明所有60家都是,但他们说,

他们说不会排除将所有60家报纸都加入这场诉讼。我想如果最终每家新闻网站都能获得一定数量的钱,那么他们就会说,好吧,60家比8家好,或者比那多几倍。所以他们可能会把它们全部扔进去。看看会发生什么将会很有趣。

那么这一切是如何运作的呢?与《纽约时报》的诉讼类似,我认为这项申诉的核心是围绕OpenAI使用其文章来训练模型的版权侵权索赔。这些报纸,或者这家投资公司,目前正在指控OpenAI和微软“未经许可和未经支付,盗用数百万出版商的受版权保护的文章”。当然,这是为了从ChatGPT中赚钱。所以

该报目前还声称,OpenAI和微软在引用信息时删除了版权管理信息,如记者姓名和头衔。因此,诉讼还包括稀释商标索赔,该索赔基本上声称OpenAI和微软……

他们没有获得授权来使用这些。他们还说,他们在ChatGPT和Copilot的答案中使用了报纸的商标。你可以将微软和OpenAI一起加入这项申诉,因为Copilot的背后实际上也在运行ChatGPT,对吧?

报纸还指控这两家公司声誉受损,原因是AI的幻觉。所以他们基本上说,看,你们在使用我们的信息,你们在用它来给人们答案,但它也会产生幻觉并说出错误的事情。这对我们来说是不好的,因为我认为这一点有点无关紧要,因为,很明显,也许,好吧,也许如果我用稻草人来论证这一点,或者用钢铁人来论证这一点,也许他们所说的意思是……

根据《纽约时报》的文章,这件事发生了,对吧?所以也许ChatGPT会这么说。然后它有一些错误的事实。然后他们说,这会损害我们的声誉,因为现在它将我们的品牌名称与之联系在一起。简单的解决方法是,告诉ChatGPT,他们可以对其进行硬编码,使其永远不允许提及《纽约时报》或《华盛顿邮报》等。这显然有优缺点。这会让它感觉质量较低。我认为

如果他们想强硬,OpenAI就会这样做。至于窃取他们的版权和品牌,在我看来,这就像谷歌一样。这有助于他们的品牌推广。这使得引用他们是相关的。坦白说,我上次去《纽约时报》阅读文章是在很久以前。可能是因为它有付费墙,也可能是因为……

我不知道。你知道,我通过其他方式获取新闻。我从时事通讯中获取,我从不同的地方获取。所以看起来它变得不那么重要了。如果你想保持相关性,我认为被引用可能是一件好事。如果我在某个地方看到它被引用,即使是在ChatGPT中,我更有可能去阅读一篇《纽约时报》的文章,而不是它从未提及这个名字。所以这很有趣,因为他们很生气他们使用了他们的数据,但他们不希望他们使用他们的名字,无论如何。

让我们谈谈大局。我认为这项诉讼的结果对于AI公司如何将新闻纳入其内容中将非常重要。到目前为止,新闻出版商显然只是依赖于来自搜索流量的广告收入。我们已经看到了20年了。生成式AI工具可以从根本上消除这一点,因为我

我不总是使用谷歌。我的意思是,说实话,我不,是的,我使用Perplexity。我使用you.com。我使用许多其他工具而不是谷歌。所以谷歌在这方面受到了冲击,但我得到了简洁的答案总结。我还使用时事通讯,这已经取代了我的……AI时事通讯很棒。嗯,

大声喊出来。所以,我喜欢用它来获取我的很多AI新闻,它们会引用来源,但我不会点击它,如果他们给我一个非常简洁的答案,我知道他们只是使用AI工具来总结一篇文章等等。但如果他们只是在那里总结一下,我不需要谷歌来找到它,我不需要阅读文章来获取信息。所以,是的,这两者之间是相当具有颠覆性的。所以。

这就是模式,它肯定受到了冲击。他们都对此感到担忧,他们都不希望这种情况发生。所以看看结果将会很有趣。OpenAI目前已经反对这两项诉讼。他们正在法庭上抗争这两项诉讼。他们说,《纽约时报》特别指出OpenAI的工具是如何逐字复制《纽约时报》的。所以他们说它只是

吐出相同的东西,他们说这是一个罕见的错误,我们正在努力将其降至零,换句话说,ChatGPT的设计并非为了复制粘贴,所以这可能不是经常发生的事情,如果发生,这是一个罕见的错误,他们正在努力将其降至零,正如他们所说

所以,是的,显然一切都会被改写。无论如何,看看结果将会非常有趣。如果你今天喜欢这个播客,如果你学习了关于这些诉讼以及未来格局将如何发展的一些新知识,我真的很感激你点赞视频或给我们评价。如果你在Apple或Spotify上收听,请订阅,我会在下一个视频中与你见面。