We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
E
Eli Schaefer
Topics
Eli Schaefer:新闻机构指责Perplexity AI新闻引擎剽窃和网络爬取。他们认为Perplexity在总结新闻文章时会逐字复制原文内容。这引发了关于Perplexity是否应该为用户使用其AI生成的剽窃内容负责的争议。 我认为这是一个复杂的问题,涉及到技术、法律和道德等多个方面。一方面,Perplexity作为AI工具,其功能是根据用户请求提供信息,它本身并不主动进行网络爬取和剽窃。另一方面,Perplexity生成的总结中包含了受版权保护的文本内容,这确实引发了版权和道德方面的担忧。 Perplexity的回应是,总结URL与网络爬取不同,因为Perplexity只是应用户请求提供信息,而非主动爬取数据,因此剽窃责任在于用户而非Perplexity。这与搜索引擎Google的运作模式类似,Google显示的搜索结果包含了来自各个网站的文本内容,但这并不意味着Google在剽窃。 然而,Perplexity的这种说法并不能完全消除人们的担忧。因为Perplexity生成的总结中包含了大量的原文内容,这使得用户很容易进行剽窃。因此,Perplexity需要承担一定的责任,例如改进其AI模型,避免生成包含过多原文内容的总结,或者在生成总结时明确标注信息来源。 此外,AI图像和文本生成也面临类似的版权问题,因为它们是基于已有的受版权保护的素材进行训练的。这需要我们重新思考AI技术与版权之间的关系,制定更完善的法律法规来规范AI技术的应用。

Deep Dive

Shownotes Transcript

在本集中,我们将深入探讨有关复制、粘贴、冲突以及 AI 在新闻业中的伦理困境的伦理问题。 </context> <raw_text>0 大家好,欢迎回到 AI 播客的另一集,我们将讨论人工智能的最新发展及其未来发展方式。我是你们的主人 Eli Schaefer。我很高兴今天能和你们在一起。我们有一集精彩的节目,所以让我们开始吧。

好的,今天我们要谈论一个名为 Proplexity 的 AI 搜索引擎。如果你不知道 Proplexity 是什么,它基本上是

一个你可以向其提问,它会给你答案的 AI 工具。这就是他们的超链接所说的。它说,Perplexity 是一款免费的 AI 驱动的答案引擎,可以为任何问题提供准确、可信和实时的答案。这只是对该服务的一个简短总结。因此,Perplexity 于 2022 年推出,并且

在过去两年中对 AI 领域产生了非常大的影响,并且一直在不断发展壮大,这太疯狂了。所以正在发生的事情有点疯狂。这是我们在其他大型语言模型中也看到过的情况,而 Perplexity 也不例外,你

新闻媒体公司指控他们两件事。一个是剽窃。第二个是网络抓取。网络抓取的本质是,当一个机器人浏览互联网、访问网站、从这些网站获取数据,然后将其放入索引中时,这与 Google 使用的方法类似,以便网站可以显示在那里。所以这就是网络抓取。并且

他们被指控的原因是,已经进行了一些研究,其中来自不同新闻媒体的人员会向其提供其新闻文章的链接,并要求其对文章进行总结。它输出的一些文本与文章中的内容逐字相同。显然,这对这些新闻媒体来说是一件大事。嗯,

剽窃是他们想要阻止和保护的事情。而且由于 Perplexity 是一家足够大的公司,他们仅仅想要追究他们的责任是有道理的,因为如果他们能够抓住他们做一些不道德或非法的事情,他们可能会赚到很多钱。所以这是一件非常重要的事情。现在,

尽管他们被指控犯有网络抓取罪,但 Perplexity 的业务主管 Domitry(我希望我说的对)说,所以他说总结 URL 与抓取不同。抓取是当你

所以他基本上说总结 URL 与网络抓取不一样。他说,这就是他的说法。他说,当你四处收集信息并将其添加到你的索引中时,就是这种情况。他指出,Perplexity 的 IP 可能会显示为访问对机器人禁止访问的网站的访问者。

只有当用户将 URL 放入队列中时,这并不符合抓取的定义。所以他基本上说的是,虽然它看起来像是网络抓取或网络爬取,这两个术语是不同的,因为该公司的 IP 地址正在访问这些网站并收集数据,他们所说的本质是,

AI 实际上只是在满足人类的要求。因此,这与全天候运行的自动化机器人不同。它实际上只是一个机器人,它只是在满足请求,即访问网站,从中获取数据,然后将其带回给用户。然后他们说的是,

现在,用户是否使用这些数据取决于用户。如果他们使用这些剽窃的内容,那么责任就落在他们身上。这并不是 Perplexity 的错。这就是他们采取的立场。就像你在 Google 中搜索某些内容一样,来自实际网站的文本结果会显示在该网站下。这并不意味着 Google 剽窃了它。这只是意味着 Google 正在向他们展示来自该网站的内容。所以,

非常有趣。我很想知道你对此的看法,因为……这已经成为一段时间以来的担忧。即使是图像生成,例如,AI,人们也……

指控其使用受版权保护的材料,因为它是由人们创作的实际艺术作品训练出来的,然后它会生成自己创作的图像,有点像受这些艺术作品的启发,文本生成也是如此,所以

是的,我很想知道你的想法。一定要告诉我。别忘了订阅。今天的节目就到这里。非常感谢您的收听。这是一次非常好的讨论。我知道我肯定学到了很多关于人工智能的知识。我肯定在使用它时会更加谨慎。别忘了订阅。我们下一集再见。