We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode AI for Shaming Politicians, the New AI Art Scene, DeepFake Phishing

AI for Shaming Politicians, the New AI Art Scene, DeepFake Phishing

2021/7/16
logo of podcast Last Week in AI

Last Week in AI

AI Deep Dive AI Chapters Transcript
People
A
Andrey Krennikov
D
Daniel Bashir
Topics
Andrey Krennikov:一个比利时艺术家使用AI技术创建了一个项目,通过识别政客在工作中使用手机的行为来公开批评他们。该项目利用公开的视频和图片数据,自动发布推文,指出这些政客的注意力不集中。这是一种新颖的AI应用方式,虽然略带娱乐性,但也引发了关于AI监控和问责的讨论。 Sharon Zhou:AI生成的艺术场景正在蓬勃发展,黑客们开发了新的工具,例如VQGAN+CLIP,使得用户可以通过文本提示生成图像。这些图像通常具有超现实和非比寻常的风格,展现了AI技术在艺术创作中的潜力。 Andrey Krennikov:Google发布了一个数据集,用于研究机器翻译中的性别偏见。该数据集包含不同语言中人物的传记,旨在分析机器翻译中常见的性别错误,例如代词使用错误和性别一致性错误。这有助于改进机器翻译模型,减少性别偏见。 Sharon Zhou:EleutherAI的一周年回顾文章总结了该组织在过去一年中取得的成就,包括发布开源GPT模型、与Google合作使用TPU以及在AI安全方面的长期目标。这展示了开源AI社区的活力和贡献。 Andrey Krennikov:一项Mozilla的研究表明,YouTube的推荐算法仍然存在问题,例如推荐极端内容、错误信息和不当内容。这项研究使用了众包的方法,收集用户对推荐视频的反馈,揭示了算法中存在的缺陷。 Sharon Zhou:虽然文章标题略显耸人听闻,但微软、普渡大学和本·古里安大学的研究人员进行的一项调查显示,攻击者可能会利用AI生成的深度伪造技术进行网络钓鱼攻击。这突显了AI技术在网络安全领域带来的新挑战。 Andrey Krennikov:埃隆·马斯克承认自动驾驶比他想象的要难,特斯拉车主们则因其错过的最后期限而取笑他。这反映了AI技术发展中的挑战和现实。 Daniel Bashir:Facebook AI团队训练了一个能够在行走时实时适应不同地形条件的机器人。该机器人通过试错和环境信息学习如何快速适应。 Daniel Bashir:IBM Watson在2021年温布尔登网球锦标赛中被用于实时生成比赛集锦,通过分析球员反应、观众情绪和比赛数据来选择精彩片段。 Daniel Bashir:Mozilla基金会的一项研究表明,YouTube的视频推荐算法仍然存在问题,该算法会推荐极端内容和错误信息,Mozilla呼吁加强监管和透明度。

Deep Dive

Chapters
An AI system is used to identify and publicly shame politicians who use their phones during work, highlighting a novel use of surveillance technology.

Shownotes Transcript

本周:

在我们的新闻汇总文本版本中找到更多内容:https://lastweekin.ai/p/124

<raw_text>0 你好,欢迎收听Skynet今天的《让我们谈谈AI》播客,在这里你可以听到AI研究人员讨论AI的最新动态。这是我们最新的《上周AI》节目,在这里你将获得上周一些最有趣的AI新闻的摘要和讨论。我是Sharon Zhou博士。我是Andrey Krennikov。

本周,我们将讨论一些关于AI生成艺术的有趣话题,机器翻译中的偏见爆炸,以及YouTube的推荐AI仍然有点像恐怖秀。

好的,让我们直接进入主题。实际上,第一篇文章的标题是“这个AI公开羞辱政治家,但别急着笑”。这篇文章来自Next Web。实际上,有一个专门的Twitter和Instagram账号致力于此,讲述的是一位比利时艺术家实际上...

设计了一种新的方式来捕捉不当行为的政治家。他基本上是拍摄政治家的视频或照片,并标记那些在工作时使用手机的政治家。这是一种非常有趣的监视方式。可以说,这种监视方式是可以接受的。我只是开玩笑。但确实能够指出那些可能疏忽的政治家或那些在看手机的政治家。是的,这很有趣,对吧?

显然,这有点像一个艺术项目。如果你去Twitter,你可以看到它自动发布这些推文,上面写着“亲爱的分心者”,然后是政治家的Twitter账号。接着说“请保持专注”。还有他们使用手机的视频。这效果很好。这让我想起,有些眼睛用于追踪学生的注意力,我认为他们已经被提出来了。

这些在某些情况下肯定更糟。但这确实是一个有趣的、幽默的小项目,不太严肃,而且是一个我没有想到的AI的新颖用途。所以这很不错。我完全同意。

接下来是一些同样有趣、也有点不同的东西。我们有下一篇文章,标题是“AI生成的艺术场景爆炸,黑客创造了突破性的工具”。

所以如果你在Twitter上关注AI,你可能已经看到这种情况。确实,我看到很多,基本上是有一种新的方式来使用AI技术生成艺术图像。在这种情况下,它被称为VQgen加Clip。基本上,我有一个叫Clip的模型,它可以告诉你一幅图像与某些文本的匹配程度。

所以,你实际上无法生成图像。但人们想尝试,因为OpenAI也有一个图像生成的东西。因此,一些黑客设计了一种方法,基本上将这些图像生成GAN类型的东西与Clip结合起来。

现在任何人都可以输入一段文本提示,比如,我不知道,火山上空飞翔的独角兽。然后生成一幅大致符合这个描述的图像。它真的很超现实,非常酷。因此,很多人开始玩这个,包括我自己。这太棒了。是的,我的意思是,我认为这真的很酷,尤其是因为...

OpenAI没有发布他们的DALI模型,呃,这直接使得你可以输入文本然后生成图像,因为他们发布了Clip的权重。人们正在将不同的模型融合在一起,使用BQGAN。

来生成这些场景。我见过一些非常迷幻的东西。人们的创造力真是太棒了。嗯,有人展示了时钟表情符号,这生成了很多时钟表情符号的东西。嗯,它在生成模式或找到高度模式的东西方面非常出色。

是的,这很有趣。DALI创建了这些非常清晰的图像。著名的是,有一个鳄梨椅子,它创建了这些非常合理的鳄梨椅子。而由于这是拼凑在一起的,你会得到这些...

有点混乱,几乎总是超现实且不太符合比例的图像,结果变得非常有趣。它传达了文本的意图,但以一种非常,你可以说是艺术的或意想不到的方式。是的,你可以用文本做任何问题。其中一个例子是一个由小城堡统治的星球的抽象画。

它产生了一些非常酷的东西。所以是的,这篇文章很好地概述了这一点。还有很多内容可以深入探讨。你应该去看看,这真的很有趣。

与此相关的是,有一篇来自伯克利的博客文章,标题是“外星梦与新兴艺术场景”,它提到基本上是使用Clip生成艺术。博客文章中提到,能够将这些东西放出来真的很棒,因为艺术家觉得他们仍然对自己的艺术有创造控制权。即使他们输入自然语言,它仍然感觉像是

他们在操控这些词语,来生成艺术。是的,是的。这篇博客文章在新闻文章之前几个月发布,详细介绍了这一切是如何发生的,并对其工作原理进行了很好的解释,还有很多图像的例子。所以这两篇文章都值得一读,以便了解基础知识。

然后,是的,我自己也参与其中。我找到了这个小的协作笔记本。开始非常简单。你知道,有说明。你根本不需要技术背景。玩起来也很简单。我肯定玩得很开心。所以如果这听起来有趣,你知道,去看看。

但接下来是一些稍微严肃一点的内容,我们的研究新闻文章。首先,我们有Google AI推出了一个数据集,用于研究机器翻译中的性别偏见。是的,这听起来就是它的意思。Google创建了这个翻译的维基百科传记数据集,

这个数据集非常具体地设计用于分析机器翻译中的常见性别错误,包括在代词省略语言中不正确的性别选择、不正确的所有格和不正确的性别一致性。因此,基本上,这有一个不同语言中传记的数据集,这些语言对性别的处理不同。所以我们知道,例如,在某些语言中,性别问题更多

在西班牙语等语言中,而在英语中,你可能在某些动词或各种情况下不使用性别。因此,在这里,是的,他们基本上有一堆人的传记,

还有一些摇滚乐队和运动队。是的,还有,他们已经被专业翻译,这从英语翻译过来,这很有趣。

因此,是的,这个数据集,因为你有专业翻译,没有像代词省略和性别一致性这样的错误,你可以分析机器翻译模型,看看它们是否存在这些错误。因此,这非常具体于机器翻译和性别偏见。实际上,如果你没有深入思考这些问题,似乎有点难以理解。

对。我认为他们将这一点提出来并对此进行研究是非常重要的。它让人感觉受限,事实是它围绕翻译和性别偏见而具体。我认为这很好,因为这是一个非常大的问题,考虑到它的规模

以及它可能影响的内容,但我喜欢它是如此具体,以至于这是一个问题,我让我感觉因为我们可能有这个数据集,也许还有一些基准,我们实际上可以朝这个方向推动。而且它具体到我觉得我们可以做到这一点。是的,这正是我所想的。你知道,机器翻译是超级常见的。你知道,它无处不在。每个大公司都有它。好吧,很多大公司都有它。

因此,你可以很容易地看到这如何成为他们部署的标准,以便他们现在可以使用它来分析一些非常具体类型的错误,这些错误在没有,正如你所说的,针对这些类型的错误的非常具体的东西的情况下很难捕捉到。而显然,这非常重要,因为这是不同语言的一个主要特征。因此,是的,我认为这指明了我们可能如何能够实际测试这个

你知道,AI模型的部署,可能通过,专注于主要类型的错误。对。接下来是一些不太确定的东西。下一篇文章是“漫长而奇怪的旅程:Eleuther AI一周年回顾”。所以Eleuther AI是一个非营利组织,发布了这些开源的GPT模型,最近的GPT Neo和GPT J,

后者有60亿个参数,并试图向实际的1万亿个参数迈进,超越OpenAI的GDP率。

这只是他们对过去一年发生的事情的回顾,所有疯狂的事情,因为它是如此众包,他们的Discord频道真的火了。然后他们获得了来自Google的大量TPU的使用。现在有这么多的努力,使这些大型语言模型开放并可供公众使用。

是的,我一直在松散地关注Eleftheria AI,所以这是一次非常有趣的阅读,了解更多。此外,这也是一次非常有趣的阅读。它以一种非常非企业化的方式写成,充满了很多表情包和愚蠢的网络语言。因此,除了有趣之外,它在某些情况下也相当有趣。

我学到了很多。所以正如你所说,他们发布了一些GPT-3类型的模型,但他们也参与了很多艺术创作。因此,VQGAN加Clip,正如我们刚才讨论的,他们在他们的服务器上玩得很开心。这是他们Discord的很多内容。他们还有一些我之前不知道的关于AI安全的长期目标。

所以是的,非常有趣的阅读,非常有趣的阅读。我推荐你去查一下。回顾中有没有什么细节让你印象深刻,Sharon?老实说,表情包。

表情包太搞笑了,所以我真的鼓励你去看看。我也一直在关注他们,可能更多一些。所以我觉得我有点了解发生了什么。我没有在他们的Discord上待太久。我意识到我实际上在那时注册过。但我确实玩过很多GPT-Neo模型。是的。是的,表情包确实让这值得一读,即使你知道这个故事。

接下来是一些更严肃的内容。我们进入伦理和社会部分,基本上是AI在现实世界中的实际应用。首先,我们有来自TechCrunch的这篇文章。YouTube的推荐AI仍然是个恐怖秀,主要众包研究发现。

因此,著名的一个例子是AI可能产生的负面影响,可能是无意的,就是YouTube的推荐算法,已被发现做了各种事情,比如它有

推荐使某人变得更加极端,呃,向他们展示愤怒和愤怒的观点,以便他们可以对某个群体、某种信仰体系等变得更加极端,还有一些推荐引擎的例子,你知道,呃,做一些非常奇怪的事情,涉及儿童,让他们看到一些,我不知道,呃

奇怪的东西,甚至可能是不适当的东西。因此,在这项研究中,Mozilla采取了众包的方法。他们允许人们安装一个名为Regrets Reporter的浏览器扩展,用户可以标记推荐给他们的YouTube视频,并表示他们是否对此感到遗憾,原因包括COVID-19、恐慌、错误信息或不适合儿童的卡通。并且

简而言之,研究发现视频推荐AI仍然非常糟糕,仍然存在很多问题。因此,是的,Mozilla确实在密切关注并指出这一点,因为显然这非常糟糕。我觉得Mozilla在开创这项研究真的很有趣。

因为显然,谷歌不会发布这样的东西,正如我们所知。但Mozilla绝对可以,并且几乎有动力去做。因此,很高兴这件事得以曝光。很遗憾的是,这种情况仍然存在,因为我知道这个消息很久以前就爆出了,实际上,这是我会说的第一个AI问题之一。并且它仍然没有得到很大程度的解决...

这令人担忧。因此,不幸的是,这仍然是一个问题。我希望人们能对算法有更多的控制权。确实。是的,这里有很多有趣的东西。这是一篇相当长的文章,研究本身也相当详细。我发现一个有趣的细节是

他们有一个指标,带有这些遗憾的视频每天的观看次数比其他视频多70%。因此,你知道,有一个常见的论点是,问题在于YouTube优化了参与度,这选择了真正的、你知道,极端和误导性内容,获得点击。是的,这项研究支持了这一点。

这真的很有趣,显然也是一项很好的研究,可以对谷歌施加一些压力以进行更改。接下来是我们伦理部分的下一篇文章,攻击者使用攻击性AI创建深度伪造进行网络钓鱼活动。这篇文章来自Venturebeat。

所以,Andrea和我讨论过这个。这是一个有点吸引眼球的标题,因为文章中没有明确的、非常、非常具体的例子。但他们确实提到,深度伪造在图像和文本中变得越来越猖獗,进行网络钓鱼的机器人将变得更加有效。

是的,这有点有趣,因为,正如你所说,没有发生任何事情。没有攻击者使用攻击性AI。因此,标题是误导性的。但这是关于微软、普渡大学和本古里昂大学的研究人员发布的最近一项调查。我们还有其他人,所以这是一个大团队。

这项调查探讨了这种攻击性AI的威胁。从某种意义上说,这很好,对吧?因为在网络安全中,你希望提前为任何潜在攻击做好准备。可能这实际上是件好事,他们提前考虑到了这一点。我认为现在在网络安全和AI之间有这种交集,这很有趣,我之前并没有见过。我是说,可能有一些研究,但

这似乎是一个非常大的研究,可能会对实际世界产生影响。最后,我们有我们通常的最后一篇文章选择,这是一件相当有趣的事情,不是很严肃,也不是很有影响力。因此,在这里我们有我们的有趣文章。埃隆·马斯克承认自动驾驶比他想象的要难,因为特斯拉车主因错过截止日期而嘲笑他。

所以你讨论了很多,我认为很多人都知道这一点,埃隆·马斯克不断声称自动驾驶何时会实现。因此,我认为他有很多预测。你知道,我认为在2015年,它是几年的时间。然后它应该在2018年发生,然后在2019年。

近年来,他变得更加谨慎,但他仍然在做这些关于事情何时会出现的声明,甚至在今年,说它将在6月发生,然后又推迟了。

因此,是的,这里有趣的部分是,这篇文章有一些例子,说明特斯拉车主如何嘲笑一些声明,比如将他们的账户重命名为“两周”,有一些引用,你知道,这很有趣,我认为我对这些声明感到恼火。

是的。所以,我的意思是,大家都知道他不守时限。但我会说,话虽如此,他确实在执行上做得很好,像他确实实现了他所承诺的,只是时间框架上远远不够。

我仍然很欣赏,因为我认为有很多人声称他们会做某事,但从未做到。我认为在这种情况下,他们通常也不会设定截止日期。因此,我仍然赞扬他最终的执行,尽管是在一个更长的时间尺度上。

是的,有些事情可以说是,你知道,瞄准月球,然后没有完全命中。因此,正如你所说,我也同意,这些预测是小事,但实际进展非常令人印象深刻。再说一件有趣的事情是,这个故事部分是因为他对这位记者的回应。

所以是的,他对这位记者说,基本上概括地说,自动驾驶是一个困难的问题,因为它需要解决现实世界AI的大部分问题。我没有想到会这么难,但从事后看来,困难是显而易见的。没有什么比现实更复杂。

因此,很多人嘲笑他,因为“从事后看来,困难是显而易见的”这一部分。很多人说他的预测从一开始就是荒谬的。因此,现在他与AI领域许多人的共同观点接轨,这有点有趣。但这只是一个有趣的小事,不是什么大事。

对。这就是我们这一集的内容。如果你喜欢我们对这些故事的讨论,请务必分享并评论这个播客。我们会非常感激。现在,请务必再停留几分钟,听听我们自己的播报员Daniel Bashir为您带来的其他一些有趣新闻故事。谢谢你,Andrea和Sharon。现在我将介绍一些我们没有涉及的其他有趣故事。首先是关于研究方面的一个故事。

与卡内基梅隆大学和加州大学伯克利分校的研究人员一起,Facebook的AI研究团队教会了一台机器人如何在行走时实时调整条件。这台机器人由中国初创公司Unitree制造,在不同的地形上移动时会调整步态,比如石头和楼梯。

正如CNET报道的那样,研究人员通过在塑料上倒油以创造光滑表面,并在机器人的背上放重物来测试机器人的平衡。每次,机器人都能恢复并继续前进。一位研究人员表示,机器人通过试错和周围环境的信息快速学习如何适应。这台机器人没有计算机视觉。