We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Satellite Image Data, Moderating AI Dungeon, Consolidating Autonomous Vehicles

Satellite Image Data, Moderating AI Dungeon, Consolidating Autonomous Vehicles

2021/5/13
logo of podcast Last Week in AI

Last Week in AI

AI Deep Dive AI Chapters Transcript
People
A
Andrey Kronenkov
D
Daniel Bashir
S
Sharon Zhou
Topics
Daniel Bashir: 本周新闻综述涵盖了白宫推出AI.gov网站以促进AI研究和教育,Google科学家Sami Bengio加入苹果领导新的AI研究部门,Argo AI开发出性能优于Velodyne LiDAR传感器的自主研发传感器,以及百度在中国推出首个商业化无人驾驶出租车服务等重要事件。这些事件反映了AI技术在各个领域的快速发展和应用。 Dr. Sharon Zhou: 关于中国发布的全球最大卫星图像数据库FAIR 1M,其高分辨率和密集标签对于训练AI模型至关重要,但也引发了对隐私和伦理的担忧。该数据库的公开发布将促进卫星图像识别技术的进步,并应用于城市扩张追踪、野生动物迁徙监测等领域。 Andrey Kronenkov: 关于防止AI人脸识别的两篇论文,其中一篇提出了一种新颖的方法,通过减少图像中的错误来欺骗模型;另一篇则构建了一个完整的系统,并用真实数据进行了评估。名为Fox的工具已被下载近50万次,有效防止了微软、亚马逊和Face++等公司的AI人脸识别。 Dr. Sharon Zhou: AI Dungeon游戏因生成不当内容而引发争议,开发者增加了内容审核工具,但用户对此不满。AI内容审核的挑战在于难以区分无意中的不当内容和真正的不当内容。随着AI系统越来越强大,需要找到有效的方法来控制其生成不当内容的能力,并解决AI系统中存在的偏见问题。 Andrey Kronenkov: 自动驾驶汽车领域正在整合,公司数量减少,估值下降。这反映了人们对该领域的预期更加现实,同时也表明该领域正在走向成熟。

Deep Dive

Chapters
This chapter covers recent developments in AI, including the launch of AI.gov by the White House, Sami Bengio's move to Apple, and advancements in autonomous vehicle technology by companies like Argo AI and Baidu.

Shownotes Transcript

您好,欢迎收听Skynet Today的Let's Talk AI播客,在这里您可以听到AI研究人员关于AI的实际情况以及哪些只是耸人听闻的标题。这是我们最新的“AI上周回顾”节目,您可以在其中快速了解上周的AI新闻,以及AI研究人员之间对我们对这些新闻的看法的一些讨论。只是

首先,我们将把它交给Daniel Bashir来总结上周AI领域发生的事情。我们将在几分钟后回来,更深入地探讨这些故事并发表我们的看法。您好,这里是Daniel Bashir,为您带来每周新闻摘要。本周,我们将讨论白宫的AI网站、Sammy Benjia的新工作以及两个自动驾驶故事。为了使AI研究更容易在全国范围内获得,白宫启动了AI.gov网站。

据Axios报道,白宫的目标是激发人们对AI的热情,并扩大教育机会。该网站的目标受众是普通大众,它旨在使公众更容易获得对AI感兴趣的人们的信息。用户可以了解AI如何在全国范围内使用,例如在应对疫情方面。

该网站也旨在通过为研究人员提供计算和数据来促进研究发展,并通过提供有关奖学金和研究金项目的信息来促进科学领域的公平。在AI领域的其他地方,曾管理Timnit Gebru并在她离职后离开谷歌的杰出谷歌科学家Sami Bengio最近加入了苹果公司。

据路透社报道,Bengio预计将在苹果公司领导一个新的AI研究部门,该部门隶属于他们的机器学习和AI战略高级副总裁John Gianandrea。Bengio的新职位是在谷歌工作了大约14年之后,在那里他是谷歌大脑研究团队的早期领导者,并在推进深度学习方面发挥了重要作用。接下来,除非你是特斯拉,如果你正在建造一辆自动驾驶汽车,那么你可能正在使用激光雷达传感器。

如今,许多自动驾驶系统都使用来自硅谷的Velodyne LiDAR公司的激光雷达系统。但据福布斯报道,位于匹兹堡的Argo AI正在使用其自行开发的传感器来满足其性能要求。虽然性能最高的Velodyne旋转传感器被认为不足以满足高速公路的速度要求,但Argo的激光雷达声称性能明显更好。

转向中国,中国科技巨头百度最近推出了一项付费无人驾驶出租车服务,成为中国第一家将自动驾驶商业化的公司。

据TechExplorer报道,这是百度第一次进行没有安全驾驶员坐在方向盘后的演示。取而代之的是,安全人员坐在前排乘客座位上。多达10辆机器人出租车同时在1.2平方英里的区域内运行,在北京西部的首钢公园8个站点之间运送乘客。

百度以其搜索引擎而闻名,但去年开始在开放道路上测试自动驾驶。其机器人出租车服务已在中国三个城市运送超过21万名乘客,并计划在未来三年内扩展到30个城市。这就是本周新闻摘要的全部内容。敬请期待对近期事件的更深入讨论。

谢谢,Daniel。欢迎回来,听众们。既然您已经了解了上周新闻的摘要,请随时留下来听两位AI研究人员对这些新闻进行更轻松的讨论。我是Sharon Zhou博士,是机器学习小组的四年级博士生,与Andrew Ng一起工作。我的研究方向是生成模型以及将机器学习应用于医学和气候变化。和我一起的是我的联合主持人……

我是Andrey Kronenkov,斯坦福视觉与学习实验室的三年级博士生。我主要专注于机器人操作和强化学习的学习算法。让我们像往常一样直接进入正题。第一个故事来自《南华早报》,标题为“中国创建世界最大的卫星图像数据库以更好地训练AI”。

这篇文章是关于FAIR 1M数据库的,即北京航天信息研究中心发布的高分辨率遥感影像中细粒度目标识别的数据库。

是的,正如它所指出的那样,这是一个规模更大的卫星图像数据库。它包含15000张高清卫星图像,大约有100万个场景。因此,它具有非常精确的标签,例如飞机的特定型号、特定类型的运动场、棒球场、篮球场、不同类型的道路等等。所以也许并不令人惊讶,但有趣的是,与任何其他AI领域一样,卫星图像也越来越受到关注,我们拥有越来越多的数据集。而这是最新一个越来越大的例子。所以,Sharon,有什么想法吗?

这是一个大型标签数据库。它被密集地标记了100万个标签。我想说场景的数量,15000,实际上并不算大。可能值得注意的是,事物被标记得多么密集,以帮助训练这些模型。可能有用的是这些是高清模型。

或者说是高分辨率,对不起,高分辨率图像来训练我们的模型,以便它们能够非常仔细地看到事物。并且您可以想象有大量的不同物体,正如Andre指出的那样,它不仅仅是一架飞机或一条道路。它是道路的类型,例如交叉路口或环岛,飞机的类型,例如波音747之类的,这将有助于

这些算法显著地。我想到的一件事是,他们也开始使用一些在中国用卫星图像训练的AI来追踪新疆城市扩张的速度,以及西藏高原野生动物的活动如何受到不同基础设施建设的影响,

用于中国一直在大力推行的“一带一路”倡议。我的意思是,这里没有说的是,显然有一些有趣的与平民相关的事件,与中国的许多少数民族群体有关,显然包括维吾尔族等等,我想这些也可能用于监控。嗯,但是

总的来说,我认为利用这个巨大的数据库并开始为其添加标签以使我们能够构建更强大的视觉模型是一件令人兴奋的事情。是的,完全正确。我认为,有一些方法可以从消极的角度看待这一点,而且可能并非没有道理。但与此同时,这是一个将公开发布的数据集。

事实上,这篇文章指出,5月份,来自许多国家的AI研究人员将在北京参加一项比赛,争夺使用该数据库的卫星图像识别技术的奖杯。因此,这里的意图似乎通常是为了推动该领域的进步。卫星图像的用途远不止于跟踪卫星。

对于,我不知道。我实际上不知道细节,但我相信它们是。所以,是的,我想值得注意的是,

此外,现在有很多不同类型的数据集。而这是其中之一,可能在新闻中报道较少,但它仍然很有趣。是的。并且与气候应用等非常相关。例如,我可以想象它对其中一些事情有用。

但回到我们在本播客中经常讨论的一个经典话题,我们可能已经有点厌倦了,但事实就是这样。我们有下一篇文章,《如何阻止AI识别你的自拍照》,来自《科技你》。这是一篇相当简短的文章,它只是重点介绍了Eichler的两篇论文。

特别是关于人脸识别,如何防止人脸识别在特定照片上工作,其中一篇是名为fox的系统,它使用了相对成熟的想法,但更像是一个系统,并且在其项目网站上有一个可以下载的东西,然后另一篇论文是

使用稍微不同的、更新颖的想法,看起来它在某些情况下可能效果更好。所以,是的,有趣的是,以这种方式撰写一篇关于相当新的研究的文章。你对这两篇论文怎么看,Sharon?这些论文很有趣。我认为第二篇论文几乎让我迷惑了它的内容,因为……

最初,当我浏览它时,我认为,你知道,这只是你图像上的对抗性例子。但事实并非如此。他们实际上正在研究如何减少图像上的错误,以便……

而不是对抗性例子,我们添加不同的噪声来愚弄模型,让它认为它是什么,对于这个,它让模型认为它实际上是一个好例子,并且不再有任何东西可以从中学习。我认为这是一个巧妙的方法。嗯,另一篇论文,

很大程度上依赖于我们之前见过的原始类型的对抗性例子,但它围绕它构建了整个系统,然后开始针对真实数据和真实攻击进行评估,看看它是否真的有效。是的,完全正确。而且,

我认为特别巧妙的是,除了论文本身之外,这篇文章指出,这个Fox工具已经被下载了近50万次。事实上,在他们的论文中,只是看看……

引言和他们的贡献,它说实验表明,针对来自微软、亚马逊和Face++的最新面部识别服务,成功率达到100%。他们分享他们的伪装照片作为训练数据,然后将生成的模型应用于同一人的未伪装测试图像。所以,是的,我认为看到也许

更实际的论文,更少理论性的论文,这很酷。当然,我们已经看到类似的东西,但是,你知道,这篇Fox论文似乎更多地与现实世界系统有关。事实上,你知道,看看最初于6月发表的论文,它似乎也是Eichler之外的一个安全研讨会的一部分。所以,嗯,

是的,我认为总是很有趣地看到可能阻止面部识别变得普遍和不可避免的事情。可能仍然,你知道,不保证不用担心它,但是至少……

它确实表明,未来有一些潜力可以防范它。对。我认为也很酷的是,这是一个现实世界系统的例子,它将研究更进一步推进到现实世界,但仍然以论文的形式打包。我希望在未来看到更多这样的情况,因为我们……在研究方面有很多挑选的例子,但这

让我们渴望更多。让我们渴望,你知道,这真的有效吗?所以,我认为Fox论文确实强调了这一点。

说到人脸识别的黑暗面,我们下一篇文章来自《连线》,标题为《它始于AI驱动的地下城游戏,然后变得更加黑暗》。这篇文章是关于AI Dungeon的,这是一个在线游戏,你基本上可以使用GPT-3或某种文本生成技术

来制作你自己的冒险游戏。你可以通过文本与它交谈并设计你自己的游戏。我们之前已经报道过这个,但最近有很多关于AI Dungeon的讨论,因为它只是生成不同的故事情节,它可以生成一些相当不合适的故事情节。例如,我认为引起新闻关注的最大一点是

涉及恋童癖场景。这不好。这有点像,哦,糟糕,我们需要多少才能引入审核来帮助控制这些事情。是的,我认为这是一个略有争议的话题。那么,这篇文章报道说,创建该游戏的公司添加了审核工具。

OpenAI的内部提示,看起来是这样。OpenAI的首席执行官Sam Altman表示,在这种情况下,审核决定并不困难。他们基本上说你必须做一些事情来避免这种情况。而这个工具的用户实际上对此很不满,对吧?从某种意义上说,

限制了用户的创造力或自由。嗯,一方面,很明显你不应该允许非常不合适的事情,例如涉及儿童的性行为。我想人们可能会质疑的是,如果这些是粗略的审核尝试,那么……

最终会过度扩展。例如,一些人被引用为抱怨说它过于敏感,我无法提及一台8岁的笔记本电脑而不会触发警告消息。我认为这里真正棘手的是如何

真正找到实际上不合适的事情与可能无意中听起来不合适的事情之间的界限。你在哪里划线等等?你知道,我认为这里有很多问题,我认为这是一个很好的案例研究,因为,你知道,至少这是一个游戏,你知道,这是一个基于文本的叙事游戏,但是,

随着我们获得越来越强大的系统,例如Clip,你可以使用一些文本来描述,来生成任何你想要的东西。我可以想象,还有更多例子,AI可以用来创造非常不合适的东西,你知道,非常非常糟糕的东西。我们将需要弄清楚如何处理这个问题。而这是一个很好的例子。

是的,绝对的。绝对的。基本上,它最终会到来。但是,是的,我认为它确实将自己呈现为一个机会,来,你知道,给模型增加一些限制。是的。我看到的一件事是这种说法,人们总是会滥用工具。对。所以,你知道,这取决于用户不做坏事,而不是工具。

我确实看到了一个很好的反驳论点,那就是,你知道,对于AI来说,这可能并非用户的意图。例如,AI可能会随机添加一些色情内容,对吧?而这并非意图。而且,我认为这是一个有趣的观点,那就是,你知道,

我们确实需要以某种方式引导我们的AI系统,我认为这是AI整体上一个相当大的问题,例如,你如何控制、了解你的AI系统的限制以及

我认为在这种叙事背景、艺术背景下,这具有这种意义。当然,还有很多其他背景,例如自动驾驶汽车、强化学习,在那里存在同样的问题,例如,你永远不知道你的AI会做什么。有些事情你不想让它做,但这实际上很难做到。

对。当您无法真正预测它会做什么或无法控制时,对其进行监管和设置界限非常困难。因为我认为我可以想象,你知道,对于炸药或枪支或其他东西,我们有法规,我们不会仅仅把它交给用户,让他们随心所欲地使用它。你知道,对它仍然有一些控制。例如,你不允许用它伤害另一个人。这是非法的。所以,是的。

我觉得仍然有一些需要发生并且可以发生的方法来控制它。但我认为这更难,因为它不像AI系统那样清晰易懂或容易在任何地方划线。完全正确。还有一件事让我想起了我确实看到了一项研究,一篇最近发布的论文表明,GPG-free具有……

相当严重的反穆斯林偏见。例如,它不需要太多的暗示或只是提出随机话题,就可以很容易地导致它散布一些相当负面的描述、刻板印象等等。例如,即使只是提到清真寺而没有完整的描述,也会进入非常负面的描述。所以……

完全正确。对。所以,是的,许多人指出存在偏见,存在这些大型语言模型的问题,在使用它们之前需要真正解决。而这只是一个已经存在的例子,我想,以及一个需要立即采取行动的有趣案例。对。绝对的。

说到控制事情,我们的最后一篇文章标题为《自动驾驶汽车世界正在萎缩,这是迟早的事》。这是《The Verge》的文章。这篇文章基本上谈到了自动驾驶汽车世界正在变得越来越小。参与者越来越少。人们正在合并。而且估值也在下降。因此,Waymo的首席执行官实际上已经辞职。这是上个月宣布的。而且

Waymo的估值自2018年以来下降了近85%,这是一个巨大的下降,尽管其估值仍然为300亿美元。所以我认为人们开始变得更加现实,对该领域的炒作减少了。它正在显著整合。

是的,我认为这篇文章很有趣,主要是因为我们上周讨论了Lyft出售其自动驾驶汽车部门的情况,而这篇文章紧随其后,可能部分原因是由于此原因。

它还提到了其他事情,例如Aurora与Uber的自动驾驶汽车部门合并,送货机器人初创公司Nuro收购了自动驾驶卡车公司Ike。总的来说,已经发生了大量的合并、合资企业和合作,是的,正如它所说,已经发生了大量的整合。

我认为我们还没有看到,是的,我们还没有看到新的初创公司。而像2015年、2016年那样,似乎每周都会有一家新公司由一些AI研究生创立,你知道,他们想做自动驾驶。但是,是的,似乎已经出现了一种真正的趋势,

许多公司被收购,正在出现,现在实际上只有几家非常大的公司致力于机器人出租车自动驾驶这样的大问题,这些公司例如Cruise、Remo、特斯拉,也许还有百度……

但是,是的,我认为其他独立公司更专注于规模较小的、更具物流性质或比完整问题不太具有挑战性的问题,我认为很多从事这些系统工作的工程师可能对此并不感到惊讶。对。我认为。

当埃隆·马斯克预测到2020年或其他时候我们将拥有自动驾驶汽车时,许多人都对此嗤之以鼻。是的,我想大多数人是对的。我们还没有。而且看起来它不会很快到来。但与此同时,我们仍在取得进展,我们仍然可以期待它。对。绝对的。

说到这里,非常感谢您收听本周的SkyNet Today Let's Talk AI播客。您可以在skynetoday.com上找到我们今天讨论的文章,并订阅我们每周的类似新闻通讯。无论您在哪里收听播客,都可以订阅我们。如果您喜欢这个节目,请不要忘记给我们评分和评论。请务必收听下周的节目。