We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

AI for Shaming Politicians, the New AI Art Scene, DeepFake Phishing

2021/7/16

Last Week in AI

AI Deep Dive AI Chapters Transcript

People

Andrey Krennikov

Daniel Bashir

Topics

Andrey Krennikov：一个比利时艺术家使用AI技术创建了一个项目，通过识别政客在工作中使用手机的行为来公开批评他们。该项目利用公开的视频和图片数据，自动发布推文，指出这些政客的注意力不集中。这是一种新颖的AI应用方式，虽然略带娱乐性，但也引发了关于AI监控和问责的讨论。 Sharon Zhou：AI生成的艺术场景正在蓬勃发展，黑客们开发了新的工具，例如VQGAN+CLIP，使得用户可以通过文本提示生成图像。这些图像通常具有超现实和非比寻常的风格，展现了AI技术在艺术创作中的潜力。 Andrey Krennikov：Google发布了一个数据集，用于研究机器翻译中的性别偏见。该数据集包含不同语言中人物的传记，旨在分析机器翻译中常见的性别错误，例如代词使用错误和性别一致性错误。这有助于改进机器翻译模型，减少性别偏见。 Sharon Zhou：EleutherAI的一周年回顾文章总结了该组织在过去一年中取得的成就，包括发布开源GPT模型、与Google合作使用TPU以及在AI安全方面的长期目标。这展示了开源AI社区的活力和贡献。 Andrey Krennikov：一项Mozilla的研究表明，YouTube的推荐算法仍然存在问题，例如推荐极端内容、错误信息和不当内容。这项研究使用了众包的方法，收集用户对推荐视频的反馈，揭示了算法中存在的缺陷。 Sharon Zhou：虽然文章标题略显耸人听闻，但微软、普渡大学和本·古里安大学的研究人员进行的一项调查显示，攻击者可能会利用AI生成的深度伪造技术进行网络钓鱼攻击。这突显了AI技术在网络安全领域带来的新挑战。 Andrey Krennikov：埃隆·马斯克承认自动驾驶比他想象的要难，特斯拉车主们则因其错过的最后期限而取笑他。这反映了AI技术发展中的挑战和现实。 Daniel Bashir：Facebook AI团队训练了一个能够在行走时实时适应不同地形条件的机器人。该机器人通过试错和环境信息学习如何快速适应。 Daniel Bashir：IBM Watson在2021年温布尔登网球锦标赛中被用于实时生成比赛集锦，通过分析球员反应、观众情绪和比赛数据来选择精彩片段。 Daniel Bashir：Mozilla基金会的一项研究表明，YouTube的视频推荐算法仍然存在问题，该算法会推荐极端内容和错误信息，Mozilla呼吁加强监管和透明度。

Deep Dive

Chapters

An AI system is used to identify and publicly shame politicians who use their phones during work, highlighting a novel use of surveillance technology.

Shownotes Transcript

本周：

在我们的新闻汇总文本版本中找到更多内容：https://lastweekin.ai/p/124

<raw_text>0 你好，欢迎收听Skynet今天的《让我们谈谈AI》播客，在这里你可以听到AI研究人员讨论AI的最新动态。这是我们最新的《上周AI》节目，在这里你将获得上周一些最有趣的AI新闻的摘要和讨论。我是Sharon Zhou博士。我是Andrey Krennikov。

本周，我们将讨论一些关于AI生成艺术的有趣话题，机器翻译中的偏见爆炸，以及YouTube的推荐AI仍然有点像恐怖秀。

好的，让我们直接进入主题。实际上，第一篇文章的标题是“这个AI公开羞辱政治家，但别急着笑”。这篇文章来自Next Web。实际上，有一个专门的Twitter和Instagram账号致力于此，讲述的是一位比利时艺术家实际上...

设计了一种新的方式来捕捉不当行为的政治家。他基本上是拍摄政治家的视频或照片，并标记那些在工作时使用手机的政治家。这是一种非常有趣的监视方式。可以说，这种监视方式是可以接受的。我只是开玩笑。但确实能够指出那些可能疏忽的政治家或那些在看手机的政治家。是的，这很有趣，对吧？

显然，这有点像一个艺术项目。如果你去Twitter，你可以看到它自动发布这些推文，上面写着“亲爱的分心者”，然后是政治家的Twitter账号。接着说“请保持专注”。还有他们使用手机的视频。这效果很好。这让我想起，有些眼睛用于追踪学生的注意力，我认为他们已经被提出来了。

这些在某些情况下肯定更糟。但这确实是一个有趣的、幽默的小项目，不太严肃，而且是一个我没有想到的AI的新颖用途。所以这很不错。我完全同意。

接下来是一些同样有趣、也有点不同的东西。我们有下一篇文章，标题是“AI生成的艺术场景爆炸，黑客创造了突破性的工具”。

所以如果你在Twitter上关注AI，你可能已经看到这种情况。确实，我看到很多，基本上是有一种新的方式来使用AI技术生成艺术图像。在这种情况下，它被称为VQgen加Clip。基本上，我有一个叫Clip的模型，它可以告诉你一幅图像与某些文本的匹配程度。

所以，你实际上无法生成图像。但人们想尝试，因为OpenAI也有一个图像生成的东西。因此，一些黑客设计了一种方法，基本上将这些图像生成GAN类型的东西与Clip结合起来。

现在任何人都可以输入一段文本提示，比如，我不知道，火山上空飞翔的独角兽。然后生成一幅大致符合这个描述的图像。它真的很超现实，非常酷。因此，很多人开始玩这个，包括我自己。这太棒了。是的，我的意思是，我认为这真的很酷，尤其是因为...

OpenAI没有发布他们的DALI模型，呃，这直接使得你可以输入文本然后生成图像，因为他们发布了Clip的权重。人们正在将不同的模型融合在一起，使用BQGAN。

来生成这些场景。我见过一些非常迷幻的东西。人们的创造力真是太棒了。嗯，有人展示了时钟表情符号，这生成了很多时钟表情符号的东西。嗯，它在生成模式或找到高度模式的东西方面非常出色。

是的，这很有趣。DALI创建了这些非常清晰的图像。著名的是，有一个鳄梨椅子，它创建了这些非常合理的鳄梨椅子。而由于这是拼凑在一起的，你会得到这些...

有点混乱，几乎总是超现实且不太符合比例的图像，结果变得非常有趣。它传达了文本的意图，但以一种非常，你可以说是艺术的或意想不到的方式。是的，你可以用文本做任何问题。其中一个例子是一个由小城堡统治的星球的抽象画。

它产生了一些非常酷的东西。所以是的，这篇文章很好地概述了这一点。还有很多内容可以深入探讨。你应该去看看，这真的很有趣。

与此相关的是，有一篇来自伯克利的博客文章，标题是“外星梦与新兴艺术场景”，它提到基本上是使用Clip生成艺术。博客文章中提到，能够将这些东西放出来真的很棒，因为艺术家觉得他们仍然对自己的艺术有创造控制权。即使他们输入自然语言，它仍然感觉像是

他们在操控这些词语，来生成艺术。是的，是的。这篇博客文章在新闻文章之前几个月发布，详细介绍了这一切是如何发生的，并对其工作原理进行了很好的解释，还有很多图像的例子。所以这两篇文章都值得一读，以便了解基础知识。

然后，是的，我自己也参与其中。我找到了这个小的协作笔记本。开始非常简单。你知道，有说明。你根本不需要技术背景。玩起来也很简单。我肯定玩得很开心。所以如果这听起来有趣，你知道，去看看。

但接下来是一些稍微严肃一点的内容，我们的研究新闻文章。首先，我们有Google AI推出了一个数据集，用于研究机器翻译中的性别偏见。是的，这听起来就是它的意思。Google创建了这个翻译的维基百科传记数据集，

这个数据集非常具体地设计用于分析机器翻译中的常见性别错误，包括在代词省略语言中不正确的性别选择、不正确的所有格和不正确的性别一致性。因此，基本上，这有一个不同语言中传记的数据集，这些语言对性别的处理不同。所以我们知道，例如，在某些语言中，性别问题更多

在西班牙语等语言中，而在英语中，你可能在某些动词或各种情况下不使用性别。因此，在这里，是的，他们基本上有一堆人的传记，

还有一些摇滚乐队和运动队。是的，还有，他们已经被专业翻译，这从英语翻译过来，这很有趣。

因此，是的，这个数据集，因为你有专业翻译，没有像代词省略和性别一致性这样的错误，你可以分析机器翻译模型，看看它们是否存在这些错误。因此，这非常具体于机器翻译和性别偏见。实际上，如果你没有深入思考这些问题，似乎有点难以理解。

对。我认为他们将这一点提出来并对此进行研究是非常重要的。它让人感觉受限，事实是它围绕翻译和性别偏见而具体。我认为这很好，因为这是一个非常大的问题，考虑到它的规模

以及它可能影响的内容，但我喜欢它是如此具体，以至于这是一个问题，我让我感觉因为我们可能有这个数据集，也许还有一些基准，我们实际上可以朝这个方向推动。而且它具体到我觉得我们可以做到这一点。是的，这正是我所想的。你知道，机器翻译是超级常见的。你知道，它无处不在。每个大公司都有它。好吧，很多大公司都有它。

因此，你可以很容易地看到这如何成为他们部署的标准，以便他们现在可以使用它来分析一些非常具体类型的错误，这些错误在没有，正如你所说的，针对这些类型的错误的非常具体的东西的情况下很难捕捉到。而显然，这非常重要，因为这是不同语言的一个主要特征。因此，是的，我认为这指明了我们可能如何能够实际测试这个

你知道，AI模型的部署，可能通过，专注于主要类型的错误。对。接下来是一些不太确定的东西。下一篇文章是“漫长而奇怪的旅程：Eleuther AI一周年回顾”。所以Eleuther AI是一个非营利组织，发布了这些开源的GPT模型，最近的GPT Neo和GPT J，

后者有60亿个参数，并试图向实际的1万亿个参数迈进，超越OpenAI的GDP率。

这只是他们对过去一年发生的事情的回顾，所有疯狂的事情，因为它是如此众包，他们的Discord频道真的火了。然后他们获得了来自Google的大量TPU的使用。现在有这么多的努力，使这些大型语言模型开放并可供公众使用。

是的，我一直在松散地关注Eleftheria AI，所以这是一次非常有趣的阅读，了解更多。此外，这也是一次非常有趣的阅读。它以一种非常非企业化的方式写成，充满了很多表情包和愚蠢的网络语言。因此，除了有趣之外，它在某些情况下也相当有趣。

我学到了很多。所以正如你所说，他们发布了一些GPT-3类型的模型，但他们也参与了很多艺术创作。因此，VQGAN加Clip，正如我们刚才讨论的，他们在他们的服务器上玩得很开心。这是他们Discord的很多内容。他们还有一些我之前不知道的关于AI安全的长期目标。

所以是的，非常有趣的阅读，非常有趣的阅读。我推荐你去查一下。回顾中有没有什么细节让你印象深刻，Sharon？老实说，表情包。

表情包太搞笑了，所以我真的鼓励你去看看。我也一直在关注他们，可能更多一些。所以我觉得我有点了解发生了什么。我没有在他们的Discord上待太久。我意识到我实际上在那时注册过。但我确实玩过很多GPT-Neo模型。是的。是的，表情包确实让这值得一读，即使你知道这个故事。

接下来是一些更严肃的内容。我们进入伦理和社会部分，基本上是AI在现实世界中的实际应用。首先，我们有来自TechCrunch的这篇文章。YouTube的推荐AI仍然是个恐怖秀，主要众包研究发现。

因此，著名的一个例子是AI可能产生的负面影响，可能是无意的，就是YouTube的推荐算法，已被发现做了各种事情，比如它有

推荐使某人变得更加极端，呃，向他们展示愤怒和愤怒的观点，以便他们可以对某个群体、某种信仰体系等变得更加极端，还有一些推荐引擎的例子，你知道，呃，做一些非常奇怪的事情，涉及儿童，让他们看到一些，我不知道，呃

奇怪的东西，甚至可能是不适当的东西。因此，在这项研究中，Mozilla采取了众包的方法。他们允许人们安装一个名为Regrets Reporter的浏览器扩展，用户可以标记推荐给他们的YouTube视频，并表示他们是否对此感到遗憾，原因包括COVID-19、恐慌、错误信息或不适合儿童的卡通。并且

简而言之，研究发现视频推荐AI仍然非常糟糕，仍然存在很多问题。因此，是的，Mozilla确实在密切关注并指出这一点，因为显然这非常糟糕。我觉得Mozilla在开创这项研究真的很有趣。

因为显然，谷歌不会发布这样的东西，正如我们所知。但Mozilla绝对可以，并且几乎有动力去做。因此，很高兴这件事得以曝光。很遗憾的是，这种情况仍然存在，因为我知道这个消息很久以前就爆出了，实际上，这是我会说的第一个AI问题之一。并且它仍然没有得到很大程度的解决...

这令人担忧。因此，不幸的是，这仍然是一个问题。我希望人们能对算法有更多的控制权。确实。是的，这里有很多有趣的东西。这是一篇相当长的文章，研究本身也相当详细。我发现一个有趣的细节是

他们有一个指标，带有这些遗憾的视频每天的观看次数比其他视频多70%。因此，你知道，有一个常见的论点是，问题在于YouTube优化了参与度，这选择了真正的、你知道，极端和误导性内容，获得点击。是的，这项研究支持了这一点。

这真的很有趣，显然也是一项很好的研究，可以对谷歌施加一些压力以进行更改。接下来是我们伦理部分的下一篇文章，攻击者使用攻击性AI创建深度伪造进行网络钓鱼活动。这篇文章来自Venturebeat。

所以，Andrea和我讨论过这个。这是一个有点吸引眼球的标题，因为文章中没有明确的、非常、非常具体的例子。但他们确实提到，深度伪造在图像和文本中变得越来越猖獗，进行网络钓鱼的机器人将变得更加有效。

是的，这有点有趣，因为，正如你所说，没有发生任何事情。没有攻击者使用攻击性AI。因此，标题是误导性的。但这是关于微软、普渡大学和本古里昂大学的研究人员发布的最近一项调查。我们还有其他人，所以这是一个大团队。

这项调查探讨了这种攻击性AI的威胁。从某种意义上说，这很好，对吧？因为在网络安全中，你希望提前为任何潜在攻击做好准备。可能这实际上是件好事，他们提前考虑到了这一点。我认为现在在网络安全和AI之间有这种交集，这很有趣，我之前并没有见过。我是说，可能有一些研究，但

这似乎是一个非常大的研究，可能会对实际世界产生影响。最后，我们有我们通常的最后一篇文章选择，这是一件相当有趣的事情，不是很严肃，也不是很有影响力。因此，在这里我们有我们的有趣文章。埃隆·马斯克承认自动驾驶比他想象的要难，因为特斯拉车主因错过截止日期而嘲笑他。

所以你讨论了很多，我认为很多人都知道这一点，埃隆·马斯克不断声称自动驾驶何时会实现。因此，我认为他有很多预测。你知道，我认为在2015年，它是几年的时间。然后它应该在2018年发生，然后在2019年。

近年来，他变得更加谨慎，但他仍然在做这些关于事情何时会出现的声明，甚至在今年，说它将在6月发生，然后又推迟了。

因此，是的，这里有趣的部分是，这篇文章有一些例子，说明特斯拉车主如何嘲笑一些声明，比如将他们的账户重命名为“两周”，有一些引用，你知道，这很有趣，我认为我对这些声明感到恼火。

是的。所以，我的意思是，大家都知道他不守时限。但我会说，话虽如此，他确实在执行上做得很好，像他确实实现了他所承诺的，只是时间框架上远远不够。

我仍然很欣赏，因为我认为有很多人声称他们会做某事，但从未做到。我认为在这种情况下，他们通常也不会设定截止日期。因此，我仍然赞扬他最终的执行，尽管是在一个更长的时间尺度上。

是的，有些事情可以说是，你知道，瞄准月球，然后没有完全命中。因此，正如你所说，我也同意，这些预测是小事，但实际进展非常令人印象深刻。再说一件有趣的事情是，这个故事部分是因为他对这位记者的回应。

所以是的，他对这位记者说，基本上概括地说，自动驾驶是一个困难的问题，因为它需要解决现实世界AI的大部分问题。我没有想到会这么难，但从事后看来，困难是显而易见的。没有什么比现实更复杂。

因此，很多人嘲笑他，因为“从事后看来，困难是显而易见的”这一部分。很多人说他的预测从一开始就是荒谬的。因此，现在他与AI领域许多人的共同观点接轨，这有点有趣。但这只是一个有趣的小事，不是什么大事。

对。这就是我们这一集的内容。如果你喜欢我们对这些故事的讨论，请务必分享并评论这个播客。我们会非常感激。现在，请务必再停留几分钟，听听我们自己的播报员Daniel Bashir为您带来的其他一些有趣新闻故事。谢谢你，Andrea和Sharon。现在我将介绍一些我们没有涉及的其他有趣故事。首先是关于研究方面的一个故事。

与卡内基梅隆大学和加州大学伯克利分校的研究人员一起，Facebook的AI研究团队教会了一台机器人如何在行走时实时调整条件。这台机器人由中国初创公司Unitree制造，在不同的地形上移动时会调整步态，比如石头和楼梯。

正如CNET报道的那样，研究人员通过在塑料上倒油以创造光滑表面，并在机器人的背上放重物来测试机器人的平衡。每次，机器人都能恢复并继续前进。一位研究人员表示，机器人通过试错和周围环境的信息快速学习如何适应。这台机器人没有计算机视觉。

AI for Shaming Politicians, the New AI Art Scene, DeepFake Phishing 25:07 Share

Last Week in AI

Deep Dive

Shownotes Transcript

AI for Shaming Politicians, the New AI Art Scene, DeepFake Phishing