本周:
在我们的新闻汇总文本版本中找到更多内容:https://lastweekin.ai/p/124
<raw_text>0 你好,欢迎收听Skynet今天的《让我们谈谈AI》播客,在这里你可以听到AI研究人员讨论AI的最新动态。这是我们最新的《上周AI》节目,在这里你将获得上周一些最有趣的AI新闻的摘要和讨论。我是Sharon Zhou博士。我是Andrey Krennikov。
本周,我们将讨论一些关于AI生成艺术的有趣话题,机器翻译中的偏见爆炸,以及YouTube的推荐AI仍然有点像恐怖秀。
好的,让我们直接进入主题。实际上,第一篇文章的标题是“这个AI公开羞辱政治家,但别急着笑”。这篇文章来自Next Web。实际上,有一个专门的Twitter和Instagram账号致力于此,讲述的是一位比利时艺术家实际上...
设计了一种新的方式来捕捉不当行为的政治家。他基本上是拍摄政治家的视频或照片,并标记那些在工作时使用手机的政治家。这是一种非常有趣的监视方式。可以说,这种监视方式是可以接受的。我只是开玩笑。但确实能够指出那些可能疏忽的政治家或那些在看手机的政治家。是的,这很有趣,对吧?
显然,这有点像一个艺术项目。如果你去Twitter,你可以看到它自动发布这些推文,上面写着“亲爱的分心者”,然后是政治家的Twitter账号。接着说“请保持专注”。还有他们使用手机的视频。这效果很好。这让我想起,有些眼睛用于追踪学生的注意力,我认为他们已经被提出来了。
这些在某些情况下肯定更糟。但这确实是一个有趣的、幽默的小项目,不太严肃,而且是一个我没有想到的AI的新颖用途。所以这很不错。我完全同意。
接下来是一些同样有趣、也有点不同的东西。我们有下一篇文章,标题是“AI生成的艺术场景爆炸,黑客创造了突破性的工具”。
所以如果你在Twitter上关注AI,你可能已经看到这种情况。确实,我看到很多,基本上是有一种新的方式来使用AI技术生成艺术图像。在这种情况下,它被称为VQgen加Clip。基本上,我有一个叫Clip的模型,它可以告诉你一幅图像与某些文本的匹配程度。
所以,你实际上无法生成图像。但人们想尝试,因为OpenAI也有一个图像生成的东西。因此,一些黑客设计了一种方法,基本上将这些图像生成GAN类型的东西与Clip结合起来。
现在任何人都可以输入一段文本提示,比如,我不知道,火山上空飞翔的独角兽。然后生成一幅大致符合这个描述的图像。它真的很超现实,非常酷。因此,很多人开始玩这个,包括我自己。这太棒了。是的,我的意思是,我认为这真的很酷,尤其是因为...
OpenAI没有发布他们的DALI模型,呃,这直接使得你可以输入文本然后生成图像,因为他们发布了Clip的权重。人们正在将不同的模型融合在一起,使用BQGAN。
来生成这些场景。我见过一些非常迷幻的东西。人们的创造力真是太棒了。嗯,有人展示了时钟表情符号,这生成了很多时钟表情符号的东西。嗯,它在生成模式或找到高度模式的东西方面非常出色。
是的,这很有趣。DALI创建了这些非常清晰的图像。著名的是,有一个鳄梨椅子,它创建了这些非常合理的鳄梨椅子。而由于这是拼凑在一起的,你会得到这些...
有点混乱,几乎总是超现实且不太符合比例的图像,结果变得非常有趣。它传达了文本的意图,但以一种非常,你可以说是艺术的或意想不到的方式。是的,你可以用文本做任何问题。其中一个例子是一个由小城堡统治的星球的抽象画。
它产生了一些非常酷的东西。所以是的,这篇文章很好地概述了这一点。还有很多内容可以深入探讨。你应该去看看,这真的很有趣。
与此相关的是,有一篇来自伯克利的博客文章,标题是“外星梦与新兴艺术场景”,它提到基本上是使用Clip生成艺术。博客文章中提到,能够将这些东西放出来真的很棒,因为艺术家觉得他们仍然对自己的艺术有创造控制权。即使他们输入自然语言,它仍然感觉像是
他们在操控这些词语,来生成艺术。是的,是的。这篇博客文章在新闻文章之前几个月发布,详细介绍了这一切是如何发生的,并对其工作原理进行了很好的解释,还有很多图像的例子。所以这两篇文章都值得一读,以便了解基础知识。
然后,是的,我自己也参与其中。我找到了这个小的协作笔记本。开始非常简单。你知道,有说明。你根本不需要技术背景。玩起来也很简单。我肯定玩得很开心。所以如果这听起来有趣,你知道,去看看。
但接下来是一些稍微严肃一点的内容,我们的研究新闻文章。首先,我们有Google AI推出了一个数据集,用于研究机器翻译中的性别偏见。是的,这听起来就是它的意思。Google创建了这个翻译的维基百科传记数据集,
这个数据集非常具体地设计用于分析机器翻译中的常见性别错误,包括在代词省略语言中不正确的性别选择、不正确的所有格和不正确的性别一致性。因此,基本上,这有一个不同语言中传记的数据集,这些语言对性别的处理不同。所以我们知道,例如,在某些语言中,性别问题更多
在西班牙语等语言中,而在英语中,你可能在某些动词或各种情况下不使用性别。因此,在这里,是的,他们基本上有一堆人的传记,
还有一些摇滚乐队和运动队。是的,还有,他们已经被专业翻译,这从英语翻译过来,这很有趣。
因此,是的,这个数据集,因为你有专业翻译,没有像代词省略和性别一致性这样的错误,你可以分析机器翻译模型,看看它们是否存在这些错误。因此,这非常具体于机器翻译和性别偏见。实际上,如果你没有深入思考这些问题,似乎有点难以理解。
对。我认为他们将这一点提出来并对此进行研究是非常重要的。它让人感觉受限,事实是它围绕翻译和性别偏见而具体。我认为这很好,因为这是一个非常大的问题,考虑到它的规模
以及它可能影响的内容,但我喜欢它是如此具体,以至于这是一个问题,我让我感觉因为我们可能有这个数据集,也许还有一些基准,我们实际上可以朝这个方向推动。而且它具体到我觉得我们可以做到这一点。是的,这正是我所想的。你知道,机器翻译是超级常见的。你知道,它无处不在。每个大公司都有它。好吧,很多大公司都有它。
因此,你可以很容易地看到这如何成为他们部署的标准,以便他们现在可以使用它来分析一些非常具体类型的错误,这些错误在没有,正如你所说的,针对这些类型的错误的非常具体的东西的情况下很难捕捉到。而显然,这非常重要,因为这是不同语言的一个主要特征。因此,是的,我认为这指明了我们可能如何能够实际测试这个
你知道,AI模型的部署,可能通过,专注于主要类型的错误。对。接下来是一些不太确定的东西。下一篇文章是“漫长而奇怪的旅程:Eleuther AI一周年回顾”。所以Eleuther AI是一个非营利组织,发布了这些开源的GPT模型,最近的GPT Neo和GPT J,
后者有60亿个参数,并试图向实际的1万亿个参数迈进,超越OpenAI的GDP率。
这只是他们对过去一年发生的事情的回顾,所有疯狂的事情,因为它是如此众包,他们的Discord频道真的火了。然后他们获得了来自Google的大量TPU的使用。现在有这么多的努力,使这些大型语言模型开放并可供公众使用。
是的,我一直在松散地关注Eleftheria AI,所以这是一次非常有趣的阅读,了解更多。此外,这也是一次非常有趣的阅读。它以一种非常非企业化的方式写成,充满了很多表情包和愚蠢的网络语言。因此,除了有趣之外,它在某些情况下也相当有趣。
我学到了很多。所以正如你所说,他们发布了一些GPT-3类型的模型,但他们也参与了很多艺术创作。因此,VQGAN加Clip,正如我们刚才讨论的,他们在他们的服务器上玩得很开心。这是他们Discord的很多内容。他们还有一些我之前不知道的关于AI安全的长期目标。
所以是的,非常有趣的阅读,非常有趣的阅读。我推荐你去查一下。回顾中有没有什么细节让你印象深刻,Sharon?老实说,表情包。
表情包太搞笑了,所以我真的鼓励你去看看。我也一直在关注他们,可能更多一些。所以我觉得我有点了解发生了什么。我没有在他们的Discord上待太久。我意识到我实际上在那时注册过。但我确实玩过很多GPT-Neo模型。是的。是的,表情包确实让这值得一读,即使你知道这个故事。
接下来是一些更严肃的内容。我们进入伦理和社会部分,基本上是AI在现实世界中的实际应用。首先,我们有来自TechCrunch的这篇文章。YouTube的推荐AI仍然是个恐怖秀,主要众包研究发现。
因此,著名的一个例子是AI可能产生的负面影响,可能是无意的,就是YouTube的推荐算法,已被发现做了各种事情,比如它有
推荐使某人变得更加极端,呃,向他们展示愤怒和愤怒的观点,以便他们可以对某个群体、某种信仰体系等变得更加极端,还有一些推荐引擎的例子,你知道,呃,做一些非常奇怪的事情,涉及儿童,让他们看到一些,我不知道,呃
奇怪的东西,甚至可能是不适当的东西。因此,在这项研究中,Mozilla采取了众包的方法。他们允许人们安装一个名为Regrets Reporter的浏览器扩展,用户可以标记推荐给他们的YouTube视频,并表示他们是否对此感到遗憾,原因包括COVID-19、恐慌、错误信息或不适合儿童的卡通。并且
简而言之,研究发现视频推荐AI仍然非常糟糕,仍然存在很多问题。因此,是的,Mozilla确实在密切关注并指出这一点,因为显然这非常糟糕。我觉得Mozilla在开创这项研究真的很有趣。
因为显然,谷歌不会发布这样的东西,正如我们所知。但Mozilla绝对可以,并且几乎有动力去做。因此,很高兴这件事得以曝光。很遗憾的是,这种情况仍然存在,因为我知道这个消息很久以前就爆出了,实际上,这是我会说的第一个AI问题之一。并且它仍然没有得到很大程度的解决...
这令人担忧。因此,不幸的是,这仍然是一个问题。我希望人们能对算法有更多的控制权。确实。是的,这里有很多有趣的东西。这是一篇相当长的文章,研究本身也相当详细。我发现一个有趣的细节是
他们有一个指标,带有这些遗憾的视频每天的观看次数比其他视频多70%。因此,你知道,有一个常见的论点是,问题在于YouTube优化了参与度,这选择了真正的、你知道,极端和误导性内容,获得点击。是的,这项研究支持了这一点。
这真的很有趣,显然也是一项很好的研究,可以对谷歌施加一些压力以进行更改。接下来是我们伦理部分的下一篇文章,攻击者使用攻击性AI创建深度伪造进行网络钓鱼活动。这篇文章来自Venturebeat。
所以,Andrea和我讨论过这个。这是一个有点吸引眼球的标题,因为文章中没有明确的、非常、非常具体的例子。但他们确实提到,深度伪造在图像和文本中变得越来越猖獗,进行网络钓鱼的机器人将变得更加有效。
是的,这有点有趣,因为,正如你所说,没有发生任何事情。没有攻击者使用攻击性AI。因此,标题是误导性的。但这是关于微软、普渡大学和本古里昂大学的研究人员发布的最近一项调查。我们还有其他人,所以这是一个大团队。
这项调查探讨了这种攻击性AI的威胁。从某种意义上说,这很好,对吧?因为在网络安全中,你希望提前为任何潜在攻击做好准备。可能这实际上是件好事,他们提前考虑到了这一点。我认为现在在网络安全和AI之间有这种交集,这很有趣,我之前并没有见过。我是说,可能有一些研究,但
这似乎是一个非常大的研究,可能会对实际世界产生影响。最后,我们有我们通常的最后一篇文章选择,这是一件相当有趣的事情,不是很严肃,也不是很有影响力。因此,在这里我们有我们的有趣文章。埃隆·马斯克承认自动驾驶比他想象的要难,因为特斯拉车主因错过截止日期而嘲笑他。
所以你讨论了很多,我认为很多人都知道这一点,埃隆·马斯克不断声称自动驾驶何时会实现。因此,我认为他有很多预测。你知道,我认为在2015年,它是几年的时间。然后它应该在2018年发生,然后在2019年。
近年来,他变得更加谨慎,但他仍然在做这些关于事情何时会出现的声明,甚至在今年,说它将在6月发生,然后又推迟了。
因此,是的,这里有趣的部分是,这篇文章有一些例子,说明特斯拉车主如何嘲笑一些声明,比如将他们的账户重命名为“两周”,有一些引用,你知道,这很有趣,我认为我对这些声明感到恼火。
是的。所以,我的意思是,大家都知道他不守时限。但我会说,话虽如此,他确实在执行上做得很好,像他确实实现了他所承诺的,只是时间框架上远远不够。
我仍然很欣赏,因为我认为有很多人声称他们会做某事,但从未做到。我认为在这种情况下,他们通常也不会设定截止日期。因此,我仍然赞扬他最终的执行,尽管是在一个更长的时间尺度上。
是的,有些事情可以说是,你知道,瞄准月球,然后没有完全命中。因此,正如你所说,我也同意,这些预测是小事,但实际进展非常令人印象深刻。再说一件有趣的事情是,这个故事部分是因为他对这位记者的回应。
所以是的,他对这位记者说,基本上概括地说,自动驾驶是一个困难的问题,因为它需要解决现实世界AI的大部分问题。我没有想到会这么难,但从事后看来,困难是显而易见的。没有什么比现实更复杂。
因此,很多人嘲笑他,因为“从事后看来,困难是显而易见的”这一部分。很多人说他的预测从一开始就是荒谬的。因此,现在他与AI领域许多人的共同观点接轨,这有点有趣。但这只是一个有趣的小事,不是什么大事。
对。这就是我们这一集的内容。如果你喜欢我们对这些故事的讨论,请务必分享并评论这个播客。我们会非常感激。现在,请务必再停留几分钟,听听我们自己的播报员Daniel Bashir为您带来的其他一些有趣新闻故事。谢谢你,Andrea和Sharon。现在我将介绍一些我们没有涉及的其他有趣故事。首先是关于研究方面的一个故事。
与卡内基梅隆大学和加州大学伯克利分校的研究人员一起,Facebook的AI研究团队教会了一台机器人如何在行走时实时调整条件。这台机器人由中国初创公司Unitree制造,在不同的地形上移动时会调整步态,比如石头和楼梯。
正如CNET报道的那样,研究人员通过在塑料上倒油以创造光滑表面,并在机器人的背上放重物来测试机器人的平衡。每次,机器人都能恢复并继续前进。一位研究人员表示,机器人通过试错和周围环境的信息快速学习如何适应。这台机器人没有计算机视觉。