We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

AI In Journalism, The Ethical Dilemma

2024/10/4

Artificial Intelligence: AI News, ChatGPT, OpenAI, LLM, Anthropic, Claude, Google AI

AI Deep Dive AI Chapters Transcript

People

Eli Schaefer

Topics

Eli Schaefer：新闻机构指责Perplexity AI新闻引擎剽窃和网络爬取。他们认为Perplexity在总结新闻文章时会逐字复制原文内容。这引发了关于Perplexity是否应该为用户使用其AI生成的剽窃内容负责的争议。我认为这是一个复杂的问题，涉及到技术、法律和道德等多个方面。一方面，Perplexity作为AI工具，其功能是根据用户请求提供信息，它本身并不主动进行网络爬取和剽窃。另一方面，Perplexity生成的总结中包含了受版权保护的文本内容，这确实引发了版权和道德方面的担忧。 Perplexity的回应是，总结URL与网络爬取不同，因为Perplexity只是应用户请求提供信息，而非主动爬取数据，因此剽窃责任在于用户而非Perplexity。这与搜索引擎Google的运作模式类似，Google显示的搜索结果包含了来自各个网站的文本内容，但这并不意味着Google在剽窃。然而，Perplexity的这种说法并不能完全消除人们的担忧。因为Perplexity生成的总结中包含了大量的原文内容，这使得用户很容易进行剽窃。因此，Perplexity需要承担一定的责任，例如改进其AI模型，避免生成包含过多原文内容的总结，或者在生成总结时明确标注信息来源。此外，AI图像和文本生成也面临类似的版权问题，因为它们是基于已有的受版权保护的素材进行训练的。这需要我们重新思考AI技术与版权之间的关系，制定更完善的法律法规来规范AI技术的应用。

Deep Dive

Shownotes Transcript

在本集中，我们将深入探讨有关复制、粘贴、冲突以及 AI 在新闻业中的伦理困境的伦理问题。 </context> <raw_text>0 大家好，欢迎回到 AI 播客的另一集，我们将讨论人工智能的最新发展及其未来发展方式。我是你们的主人 Eli Schaefer。我很高兴今天能和你们在一起。我们有一集精彩的节目，所以让我们开始吧。

好的，今天我们要谈论一个名为 Proplexity 的 AI 搜索引擎。如果你不知道 Proplexity 是什么，它基本上是

一个你可以向其提问，它会给你答案的 AI 工具。这就是他们的超链接所说的。它说，Perplexity 是一款免费的 AI 驱动的答案引擎，可以为任何问题提供准确、可信和实时的答案。这只是对该服务的一个简短总结。因此，Perplexity 于 2022 年推出，并且

在过去两年中对 AI 领域产生了非常大的影响，并且一直在不断发展壮大，这太疯狂了。所以正在发生的事情有点疯狂。这是我们在其他大型语言模型中也看到过的情况，而 Perplexity 也不例外，你

新闻媒体公司指控他们两件事。一个是剽窃。第二个是网络抓取。网络抓取的本质是，当一个机器人浏览互联网、访问网站、从这些网站获取数据，然后将其放入索引中时，这与 Google 使用的方法类似，以便网站可以显示在那里。所以这就是网络抓取。并且

他们被指控的原因是，已经进行了一些研究，其中来自不同新闻媒体的人员会向其提供其新闻文章的链接，并要求其对文章进行总结。它输出的一些文本与文章中的内容逐字相同。显然，这对这些新闻媒体来说是一件大事。嗯，

剽窃是他们想要阻止和保护的事情。而且由于 Perplexity 是一家足够大的公司，他们仅仅想要追究他们的责任是有道理的，因为如果他们能够抓住他们做一些不道德或非法的事情，他们可能会赚到很多钱。所以这是一件非常重要的事情。现在，

尽管他们被指控犯有网络抓取罪，但 Perplexity 的业务主管 Domitry（我希望我说的对）说，所以他说总结 URL 与抓取不同。抓取是当你

所以他基本上说总结 URL 与网络抓取不一样。他说，这就是他的说法。他说，当你四处收集信息并将其添加到你的索引中时，就是这种情况。他指出，Perplexity 的 IP 可能会显示为访问对机器人禁止访问的网站的访问者。

只有当用户将 URL 放入队列中时，这并不符合抓取的定义。所以他基本上说的是，虽然它看起来像是网络抓取或网络爬取，这两个术语是不同的，因为该公司的 IP 地址正在访问这些网站并收集数据，他们所说的本质是，

AI 实际上只是在满足人类的要求。因此，这与全天候运行的自动化机器人不同。它实际上只是一个机器人，它只是在满足请求，即访问网站，从中获取数据，然后将其带回给用户。然后他们说的是，

现在，用户是否使用这些数据取决于用户。如果他们使用这些剽窃的内容，那么责任就落在他们身上。这并不是 Perplexity 的错。这就是他们采取的立场。就像你在 Google 中搜索某些内容一样，来自实际网站的文本结果会显示在该网站下。这并不意味着 Google 剽窃了它。这只是意味着 Google 正在向他们展示来自该网站的内容。所以，

非常有趣。我很想知道你对此的看法，因为……这已经成为一段时间以来的担忧。即使是图像生成，例如，AI，人们也……

指控其使用受版权保护的材料，因为它是由人们创作的实际艺术作品训练出来的，然后它会生成自己创作的图像，有点像受这些艺术作品的启发，文本生成也是如此，所以

是的，我很想知道你的想法。一定要告诉我。别忘了订阅。今天的节目就到这里。非常感谢您的收听。这是一次非常好的讨论。我知道我肯定学到了很多关于人工智能的知识。我肯定在使用它时会更加谨慎。别忘了订阅。我们下一集再见。

AI In Journalism, The Ethical Dilemma 05:50 Share

Artificial Intelligence: AI News, ChatGPT, OpenAI, LLM, Anthropic, Claude, Google AI

Deep Dive

Shownotes Transcript

AI In Journalism, The Ethical Dilemma