您好,欢迎收听今天的《扫描今日:让我们聊聊AI》播客,在这里您可以听到AI研究人员对AI现状的看法。这是我们最新的《上周AI》节目,其中您将获得对上周一些最有趣的AI新闻的快速总结和讨论。我是Andrey Karenkov,斯坦福大学视觉与学习实验室三年级的博士生。我主要关注机器人操作的学习算法。和我一起的是我的联合主持人……
嗨,我是Sharon Zhou博士,安德鲁·英格团队机器学习小组四年级即将毕业的博士生。我的研究方向是生成模型以及将机器学习应用于医学和气候。
我们今天的第一篇关于研究的文章标题是《GPT-3,一篇令人失望的论文》。这是一篇发表在greaterwrong.com上的博文,对GPT-3论文进行了分析,并阐述了为什么它令他们如此失望。所以这是一篇……
GPT-2的狂热用户自称写了很多关于GPT-2的文章,但对GPT-3非常失望,因为它感觉只是更大的GPT-2。为了肯定GPT-3,我想说它确实是。他们在论文中也相当直白地提到了这一点。安德烈,你对此有什么看法?这篇博客中有什么特别吸引你的地方吗?
是的,我对这篇博文有点失望,因为听到人们有时非常批判性的观点总是很有趣的。但是,正如你在这里所说,失望的要点仅仅是,你知道,显然他们想要的不只是更多的GPT-2。我认为……
某种程度上很奇怪,这个人似乎低估了GPT-3真正有趣的部分,那就是它是一个少样本学习器,只需几个关于更新权重或根本不进行优化的例子,它就能做很多事情。
然后,是的,在这篇博文中,这个人说,我可以想象有人认为这非常重要。如果他们认为这表明了Transformer语言模型能够以极其高效、类似人类的方式快速学习事物的能力。好吧,我认为你应该这样想,因为这正是人们,包括我,感到兴奋的地方。据我们所知,这是一个相当新颖的现象。所以,是的。
我不知道。这篇文章读起来很有趣,但我不会说它有什么太有见地的内容。是的,我理解对GPT-3没有进行任何概念性转变的失望,但它确实显示出了一些实质性的改进,这些改进确实改变了我们对语言模型的看法,并在该领域推动了拐点。
但当然,对于少样本学习,它并不是,你知道,它并不完美。这让我们想到了研究下的第二篇文章,标题是《纽约大学、Facebook和CIFAR提出了“真正的少样本学习”用于语言模型,他们说这些模型的少样本能力被高估了》。安德烈,你想谈谈这篇文章吗?当然。
是的,我发现这篇文章很有趣,因为正如我们刚才所说,对于GPT-3和其他最近的模型,整个想法是你可以训练一个模型,然后给它一个例子,而根本不需要重新优化它,就像给它一个输入并要求它继续,它就能做各种事情。比如你给它一个加法的例子或只是它的输入,然后它就能继续这样做。
它似乎运行得很好。到目前为止,它主要还是定性的。有一些努力使其更定量。而这篇文章基本上批判性地审视了它的工作原理。他们所展示的是,基本上人们一直在作弊。就像,是的,在测试……
少样本能力时,他们在验证集上进行了模型选择。因此,他们使用不同的超参数训练了一堆不同的模型,并在验证集上挑选了最好的一个。因此,该团队……
提出了一个名为“真正的少样本学习”的概念,你不能使用任何验证数据集。你只有你的训练集。因此,你只有给定的少样本。它的效果差得多,对吧?而且很难选择合适的提示。因此你可能会得到意想不到的结果。
所以,是的,我认为这很有趣。我认为这是一个很好的例子,说明即使AI中发现的东西经常有点粗糙或结果并非人们所想的那样,我们也在互相批评。然后,你知道,像这样的论文……
确实指出了社区的误解之处,以及,你知道,科学研究做错了什么,并且,你知道,试图纠正它。所以,是的,我认为这很巧妙。我认为总的来说,你知道,对于很多这些模型和设置,我看到了很多趋势……
在测试集类型的场景中。这并不是,你知道,它不像这个真正的少样本学习之前的少样本学习那样极端,但它确实,你知道,以一种不公平且不现实的方式使用了验证集。我在其他地方也看到了这种情况,尤其是在应用机器学习的领域,他们认为使用验证集甚至不是完全分开的测试集来进行模型选择是可以的。
这真的很糟糕,因为你肯定过拟合了,或者你在用你的测试集做一些事情,而这并不一定是分开的或现实的。所以我认为这是未来重要的工作。是的,当然。我发现这在强化学习中很有趣,因为你实际上总是使用测试集。是的。
我会引用你的话。够了。我只是在开玩笑。是的,是的,是的。好吧,每个人都知道。这是一个公开的秘密。每个人都知道,是的。是的,有趣的讨论,研究可能仍然值得怀疑。不要相信任何研究论文。这就是我们的结论。你知道,一切都是值得怀疑的。这就是AI。是的。
但让我们继续关注研究之外,关注现实世界的应用,在那里也许你,你知道,赌注更高,你不想……
那么多。我们用这篇文章作为第一个例子:《谷歌风投支持的Merlin Labs正在研发能够驾驶飞机的AI》。正如标题所示,这是关于Merlin Labs的,它开发用于驾驶飞机的自主系统,并刚刚在获得谷歌风投和Merlin提供的2500万美元资金后公开亮相。
它表示希望成为飞行器领域的权威自主平台。是的,它现在拥有50名员工,在莫哈韦航空航天港拥有一个专门的飞行设施,而且其系统已经进行了数百次无人驾驶测试飞行。所以,好吧,这似乎很酷。这让我不禁想知道,你知道,
这是一个你尤其希望你的系统可靠且不会出错的例子。这完全是AI难以做到的事情。所以,很酷,但我确实想知道他们是否真的可以在保证安全的同时使用AI。莎伦,你怎么看?
我很惊讶这现在才宣布。我觉得自从自动驾驶汽车热潮以来,我一直都在期待这个。开发自动驾驶飞机似乎是显而易见的。我认为对于飞机来说,你知道,很多飞机几乎是自动驾驶的。你知道,它们并不是明显的五级自动驾驶,但它们有很多自动驾驶功能。
而且人类在很大程度上,有些人说,你知道,与驾驶相比,对于许多商业航班来说,他们只是在参与其中,当然,驾驶并非如此。所以我绝对能看到这种情况发生,当然。
我们想要对飞机更加小心。飞机上会有更多的人。当然,对于货物来说,可能没那么糟糕。这有点像货船甚至卡车。但是,你知道,飞机坠毁肯定会有问题。
所以我很想看看事情会如何发展。听起来他们有足够的时间来做这件事,直到他们需要,比如说,来自政府交易之类的收入。是的,找到AI的新应用总是令人兴奋的。而这是我从未见过的。让我们拭目以待。也许我们最终都能乘坐更便宜的航班。
说到自动驾驶汽车,我们这里还有另一个关于更传统类型汽车的故事。正如你提到的,我们有一辆自动驾驶卡车完成了950英里的旅程,比人类驾驶员快10个小时。
是的,这是一个关于Too Simple公司的故事,这是一家专注于卡车无人驾驶技术的运输公司。它表示,一辆从亚利桑那州向俄克拉荷马州运输西瓜的长途卡车旅程的80%是由自动系统驾驶的,其余20%由人类驾驶员驾驶。
正如标题所说,这比人类驾驶员快10个小时。是的,我想看到这个例子很不错。我确实想知道这是否真的令人惊讶或新颖。我的印象是,这种演示已经存在了。莎伦,你怎么看?是的。
我实际上对它几乎达到了四级自动驾驶水平感到相当印象深刻,而且它真的取得了进展,并显示出比人类更强大的前景。我认为仍然存在一个剩余的问题,那就是,车上有一名人类驾驶员,如果出现问题,他应该接管。
这个人不应该休息吗?卡车也应该休息吗?我认为,你知道,很明显,最可能发生的情况是卡车本身行驶得很好,而这个人在这段路程中睡着了。所以……
你知道,我想会有安全问题,但我能看出事情的进展速度比例如城市驾驶快得多,人们到处乱窜,这只是大部分是空旷笔直的高速公路
是的,我认为在高速公路上不那么严格是有道理的,对吧?直线行驶数英里。你可以看到在没有亲自驾驶的情况下是可以的。因此,我们可能会在自动驾驶汽车出现之前看到更多自动驾驶卡车。这是有道理的。对的,对的。
现在转向AI的社会用途和AI的社会影响。我们这里的第一篇文章是关于金县成为全美第一个禁止人脸识别软件的地区。这来自Como新闻。
所以,西雅图所在的华盛顿州金县实际上是美国第一个永久禁止人脸识别软件的县。而且,你知道,支持者们对此举表示高度赞扬。
金县没有政府机构使用人脸识别软件。是的,这基本上禁止了整个县使用人脸识别软件。警察也没有使用它。所以对他们来说,这不是一个巨大的争议。
根据我对西雅图的了解,我并不太惊讶他们是第一个县。我能看到他们非常支持这样的事情。也许波特兰,他们的县,我原本以为他们会是第一个。但我并不太惊讶他们在这方面取得了进展。是的,没错。我的意思是……
我认为这之所以成为新闻或很酷,是因为这是第一个这样做的县。我认为这也是报道的内容,也是它之所以重要的原因。这篇文章确实指出,目前波特兰、旧金山和波士顿已经出台了类似的禁令。所以我想在城市层面,这已经成为一种趋势了。现在,这是一个越来越多的趋势。
所以这很有趣。是的,也许很多关于人脸识别的事情将更多的是地方性的,而不是联邦性的,这很有道理。我想警察工作在某种程度上通常是地方性的。所以我认为这是合理的。
我发现有趣的是,软件禁令有一个例外,允许执法部门或政府机构遵守《国家儿童搜寻援助法》。所以,你知道,对于紧急情况,我想你可以使用人脸识别,但除此之外不行。
是的,这是有道理的。它也针对特定人群,特别是儿童,无论好坏,我想。是的,可能,你知道,他们实施的方式非常周到,所以这是有道理的。
接下来是另一个可能更糟糕的故事,我想。也许绝对是积极的。我们有《The Verge》报道的《自主机器人开始在战争中杀人》。所以上周,根据利比亚内战的一份联合国报告,另一份出版物宣布,杀手机器人可能首次自主猎杀了人类。
这里的杀手机器人是Kargu 2系统,它是一款四旋翼无人机,制造于土耳其,只是一个绑有炸弹的消费级无人机。所以它可以飞进去,并且可以使用计算机视觉手动操作或自行转向。
所以这里有一段话指出,撤退的部队不断受到无人驾驶作战飞机和致命自主武器系统的骚扰,并因此造成重大伤亡。但实际上,报告中只有这么一小段。
所以,即使它产生了大量的新闻报道,实际上,这篇来自Verge的文章对此进行了深入研究。目前,它似乎对这是否是第一次,你知道,如果它真的那么糟糕,还不是很清楚。但即便如此,我认为这绝对是我们可以越来越期待的事情的迹象,尤其是在这种事情上。我认为现在建造起来似乎很容易。
所以,终结者。是的,让我们看看事情会如何发展。我认为,你知道,这完全取决于你如何定义杀手机器人。我认为,“杀手”部分可能不言自明。“自主”部分也不言自明。但是“机器人”部分,你知道,如果只是一支枪自己发射子弹,
使用人脸识别或人员检测或坦克检测,这算不算杀手机器人呢?我认为我们想象的是阿诺德·施瓦辛格,或多或少,但是,它,它,我想它取决于。基于这个不断变化的定义,也许它更早以前就发生了。所以,谁知道呢,
是的,没错。这篇文章非常详尽。它讨论了如何定义杀手机器人,以及对AI进行监管的努力。所以我想说,这绝对是一篇值得阅读的文章,可以了解更多细节。但简短的版本是……
可能没那么糟糕。如果你看到这些标题,那就暂时不要太担心。但请注意,这些东西没有监管,这将来可能是个问题。为了以轻松的语气结束……
我们今天将要讨论的最后一篇文章来自《连线》,标题是《不要出现在这个人工智能耻辱殿堂》。所以,基本上有一个AI事件数据库或AI耻辱殿堂。这是由人工智能伙伴关系主办的。他们基本上包含……
AI失败的事件,例如AI完全失败的地方。这包括掉进喷泉的安全机器人(第68号)和将黑人标记为大猩猩的谷歌照片整理服务(第16号),以及……
这个不光彩的角色是由肖恩·麦格雷戈创建的。他在Sentient担任机器学习工程师。
这确实突出了AI中的一些重大问题,尤其是在公司内部。在迄今为止记录的100起事件中,有16起涉及谷歌,比任何其他公司都多,有7起涉及亚马逊,有2起涉及微软。所以它只是揭示了一些……
AI中AI失败的一些重大事件,也揭示了幕后的公司,并进行统计,也许在某种程度上让相关人员承担责任。是的,我认为这很不错。我不知道这本身是否一定有用,但是,
我认为,由于AI还很年轻,或者说是在过去十年才兴起并商业化,也许很多事情都是出乎意料的,而设计这些东西的工程师或产品人员可能没有意识到系统可能崩溃的方式,这可能是非常出乎意料的。你知道,
当然,你可以认为可能存在偏见,但你可能并没有让你的机器人去注意喷泉,对吧?你可能没有考虑过人脸识别存在的问题,例如,将你标记为奇怪的东西。所以……
我认为这对于让人们更多地了解AI失败的奇怪方式是有用的。我认为有趣的是,有大量的元数据。因此,在这100起事件中,有16起涉及谷歌,比任何其他公司都多,然后是亚马逊7起,微软2起。所以关于数据库的另一个问题,不仅仅是拥有有用的例子,
它也是一种让大公司承担责任的方式,以确保这些事情不会发生,而不是让它发生然后试图清理它。那种事情。没错。这就是我们本期节目的全部内容。但请务必再停留几分钟,以便从我们自己的新闻播报员丹尼尔·巴希尔那里获得一些其他精彩新闻故事的快速总结。
首先,在研究方面,开发成功的AI项目的主要障碍之一是数据质量。85%的AI项目失败,最近的一项研究显示,96%的组织存在训练数据质量和数量方面的问题。
正如VentureBeat报道的那样,各组织正在发现,当优质数据不可用时,可以通过合成数据或人工生成的数据来弥补这一差距。其次,Phys.org报道称,卡内基梅隆大学的研究人员开发了一种新方法,使用机器学习算法来分离可用于开发药物的天然产物。
在商业和应用方面,我们有两个新的OpenAI挑战者。据Pulse News报道,韩国Naver公司推出了一种新的基于韩语的语言模型系统HyperClova,其参数数量甚至超过GPT-3。第二个挑战者来自中国。
正如Ping West报道的那样,北京人工智能研究院推出了其预训练深度学习模型悟道(Wudao)的最新版本,其规模是GPT-3的10倍。悟道是一个多模态模型,经过训练可以处理文本和图像领域。最后,关于AI和社会的一些故事。
臭名昭著的人脸识别公司Clearview AI,正如福布斯所写,受到了欧洲大量隐私投诉,这些投诉声称该公司通过非法使用个人数据违反了该集团严格的数据保护法。随着欧盟考虑新的AI立法,批评声也来自美国。
正如前谷歌首席执行官埃里克·施密特警告的那样,该集团的AI透明度要求将对欧洲造成巨大挫折。据Politico报道,施密特声称,监管将阻碍美欧合作,以与中国在AI创新方面展开竞争。
最后,在明星研究员蒂姆尼特·格布鲁离职后,谷歌继续就其对道德AI研究的承诺发表公开声明。但是,正如道德AI小组的现任成员告诉Vox Recode的那样,该团队一直处于停滞状态,他们严重怀疑公司领导能否重建学术界的信誉,或者是否会听取该小组的担忧。
非常感谢您收听本周的《天网今日:让我们聊聊AI》播客。您可以在skynettoday.com上找到我们今天讨论的文章,并订阅我们的每周新闻通讯,获取更多内容。如果您喜欢该节目,请不要忘记在您收听播客的任何地方订阅我们并留下评论。请务必在我们下周回归时收听。