斯坦福AI实验室博士Andrey Kurenkov和Sharon Zhou讨论本周主要的AI新闻。 查看此处讨论的所有新闻以及更多内容,请访问www.skynettoday.com 主题:深思熟虑 Kevin MacLeod (incompetech.com) 根据知识共享许可协议授权:署名 3.0 许可协议 </context> <raw_text>0 大家好,欢迎收听Skynet Today的Let's Talk AI播客,在这里您可以听到AI研究人员对AI实际情况以及哪些只是耸人听闻的标题的看法。我是Andrey Kornikov,斯坦福视觉与学习实验室三年级的博士生。我的研究主要集中在机器人操作的学习算法上。和我一起的是我的联合主持人……
我是Sharon,机器学习小组的三年级博士生,与Andrew Ng一起工作。我的研究方向是生成模型、改进神经网络的泛化能力以及将机器学习应用于应对气候危机。希望你一切安好,Sharon。这是我们的播客第10集,至少是以新闻讨论的形式。所以我们已经做了一段时间了。是的,我想……
讨论新闻并关注AI领域(不仅仅是研究领域)的动态,是否改变了你的看法或让你更多地思考?它确实让我更多地思考,也让我更多地思考我的研究以及我们实验室的研究,它如何影响人们以及它又是如何被感知的。
是的,我同意。我认为,作为AI研究人员,我们实际上并没有那么多的动力或压力去关注AI在学术界之外的现实世界中发生了什么。但更了解它并跟上它的步伐确实很酷。它确实让我更多地反思我的研究以及它与这些趋势的关系。这正是NeurIPS指南希望我们感受到的。
是的,整个领域都在朝着这个方向发展,我认为这大概是最理想的。你知道,我们在数据集上取得了精神上的进步等等。更多地思考这些东西将如何影响现实世界是很好的。有趣的是,事实上有一些新闻文章,也许像
关于我们工作的科普文章,这让我们更多地思考这个问题,因为我们听到那些没有深入研究的人在反思它。我想有些领域没有这种优势,他们没有其他人来反思……
基本上是他们的工作。所以他们不会免费得到它,从某种意义上说。他们将不得不花时间在外面真正地反思它。在这里,我认为我们有这种优势,已经有这些新闻文章来反思我们的大部分工作。它只是让我们更容易让我们的思想更多地思考它。是的,这是一种奢侈,也许也是一种诅咒,AI是……
你知道,我认为很多人觉得它很有趣很酷,所以围绕它有很多媒体炒作和关注。我认为,AI研究人员经常会对媒体如何呈现AI现状感到恼火,对吧?因为它与我们感知到的并不完全一致。但正如你所说,也有积极的方面。
但关于播客和我们自己的讨论就到这里。让我们开始讨论本周的新闻。首先是VentureBeat的一篇文章,标题是《OpenAI开始公开追踪模型效率》。这是一篇关于OpenAI这家半营利性公司的一些新研究的新闻报道,该公司于5月5日宣布,它已经开始追踪那些达到最先进效率的机器学习模型,它相信这将有助于识别可扩展的候选者并实现最佳整体性能。所以这篇文章主要讲的是你需要花费多少能量,多少计算才能得到
高性能的AI模型。关于OpenAI的发现是,在过去的十年里,在相当长的一段时间里,实现优秀或最先进性能所需的计算量一直在多个领域持续下降。
事实上,OpenAI声称,关注这些模型也将“描绘出一幅算法成功的定量图景”,这反过来将通过重新关注AI的技术属性和社会影响来为政策制定提供信息。
我认为这绝对是正确的。正如我们可以深入探讨他们调查中发现的一些细节一样,例如,他们发现谷歌的Transformer架构以少61倍的计算量超越了之前的最先进模型Seek2Seek,该模型也是由谷歌开发的。
他们还发现,DeepMind的AlphaZero系统(一个从零开始学习掌握国际象棋、将棋和围棋游戏的系统)仅一年后就以少8倍的计算量与该系统前身AlphaGo Zero的改进版本相匹配。
总的来说,他们还推测,算法效率可能会超过摩尔定律带来的进步,摩尔定律是指集成电路中的晶体管数量每两年翻一番的观察结果,它解释并推动了AI和大型软件的许多成功。
是的,我倾向于同意你的观点,这种追踪实际上可以做到他们所说的那样,即重新关注效率这个话题。非研究人员可能不知道的是,到目前为止,在AI研究中,效率(需要多少计算)并没有被广泛讨论。所以通常当你阅读一篇论文时,你会……
有一个图表或表格显示性能统计数据,你会说,哦,我能够达到这个性能水平。但是,除非你的论文专门讨论这个问题,否则你通常不会包含达到这个性能水平所需的计算量。
这实际上一直是AI研究中的一个缺陷,或者可以说是批评之处,在某些情况下,你会得到非常好的新结果,但这需要巨大的计算量,只有大型公司或实验室才能做到。
因此,这种追踪似乎指向了一个未来,在这个未来,评估和具体包含系统所需的计算量以及它与先前工作的计算量相比,可能会成为一种标准。
我认为Open AI推动这一点非常重要。我认为在研究中,人们会关注准确性而忽略效率,就像你说的那样。但在实践中,在工业界,人们非常关心效率,因为这与增加成本、增加推理时间以及各种事情有关。这在实践中非常重要。我看到业界人士,特别是公司非常关心这个问题,因为
但他们不知道如何在已经发布的研究中搜索这个信息,这些研究只显示了准确性的排行榜,而没有显示效率。因此,作为其基准测试工作的一部分,OpenAI还表示,它将首先关注视觉和翻译效率基准,特别是ImageNet和WMT14(机器翻译基准)。
并且它将考虑随着时间的推移添加更多基准。我认为这将对学术界产生非常非常好的推动作用。我也对OpenAI印象深刻。
能够成为工业界和研究界之间的桥梁,并能够推动这样的事情,因为我认为他们或许已经能够从工业界获得一些见解,看到这是一个需求,但也能够以学术界和类似的研究人员能够接受的方式来实施它。
是的,我同意。我认为这很有趣,这是传统实验室或研究人员可能缺乏动力或能力去做的事情。只是花时间来收集信息并提交这种报告。
这并不完全符合标准的研究实践。所以通常你会有一些想法,你会写一篇论文来讨论它,你会得到一些结果和实验。在这里,他们只是收集已知的信息,并说明我们应该关注效率。所以这确实表明,他们那种准学术、准工业的地位可以用于善事,就像在这种情况下一样。
值得注意的是,这种观点,即人们应该关注效率,与艾伦人工智能研究所、卡内基梅隆大学和华盛顿大学的研究人员一致,他们去年也倡导将效率作为与准确性(仍然更常见)一样常见的指标。
当然,这与绿色AI或使AI更高效的工作是相辅相成的,这样我们就可以减少对气候变化的整体影响。所以我认为这是一个伟大的推动,并且朝着正确的方向前进。同意。是的。
那么让我们继续讨论我们的下一篇文章,名为《AI可以模拟数百万次经济来创建公平的税收政策》,这篇文章来自Technology Review。这篇文章是关于一个名为“AI经济学家”的项目,该项目是由Salesforce公司完成的。基本上,它是
关于这个项目,他们创建了一个模拟的小型城市。你可以把它想象成像《模拟城市》之类的游戏,其中有一些工人概念,他们使用AI技术来尝试开发一个系统
税收政策。我说税收,我们应该承认这是在这个有限的模拟中,但他们设计了一种试图最大化生产力的税收政策。所以有多少工作完成,同时也最大限度地减少不平等。所以富人和穷人之间的差距。
他们表明,如果你模拟很多试验和很多不同的税收政策,你实际上可以得到一些非常有趣的东西。至少在模拟世界中,使用这种技术比一些传统的税收模型更好。所以这是一个很酷的结果,当然,它非常有限,因为它并没有真正模拟人类社会的全部复杂性,但仍然很有趣。Sharon,你对此有什么看法?
我认为这是一个很酷的方向,但当然,AI已经被证明非常有效,或者至少能够很好地优化环境,只要有明确的……
找到奖励、目标,整个环境都被映射和已知。我认为只是在这种有限的游戏环境中,它非常有效。所以我并不惊讶它在这里很有效。但当然,理解这个模型在哪里失效,模拟在哪里与现实世界不符,我认为这就是它会失效的地方。虽然我确实发现非常有趣的是,他们确实通过亚马逊Mechanical Turk对100多名众包工人进行了测试,以了解它将如何影响人类行为。所以这在野外有点东西。但当然,之前做过这些实验,通常也很有限。
是的,正如你所说,AI模型是已知的。如果你给它一个封闭的世界,一个小游戏,你今天可以开发出一些相当令人印象深刻的性能。所以这篇文章实际上将此与DeepMind的AlphaZero进行了比较,AlphaZero学习以超人的水平玩围棋。我想一个有趣的比较是,AlphaZero现在实际上被职业选手用来尝试深入了解围棋并学习关于围棋的新知识。
所以这里的希望,我认为,是经济学家可以使用它来进行某种测试或验证关于
不同税收政策的想法,这当然是有希望的,但也可能需要进一步发展这个想法。但作为一个方向,它仍然看起来很酷。我认为我们都可以同意我们对目前的税收政策并不满意,也许吧。我们总是可以做得更好,但我感觉我们永远不会满意。我认为我们总是可以做得更好。是的。
我认为这实际上是具有挑战性的,因为奖励函数是什么?目标是什么?我们为谁优化?谁应该“快乐”。对吧。所以,我认为在进行什么样的优化方面可能会变得棘手。
现在让我们谈谈一家我们经常谈论的公司,Clearview和监控。这篇文章来自The Verge。文章标题是《Clearview AI将停止向私营公司销售有争议的人脸识别应用程序》。
我们在之前的播客节目中已经介绍过他们。Clearview AI最近一直是科技新闻中最热门的话题之一,特别是围绕监控及其行为的伦理问题。因此,他们有争议的人脸识别应用程序允许用户(通常是警察)拍摄某人的照片,并立即在其Clearview AI数据库中找到匹配项。
该数据库从许多网站(如社交媒体,例如Facebook、Twitter等)大量抓取图像,以创建人们的个人资料。在BuzzFeed新闻的一篇文章中,很久以前就曝光了Clearview声称其产品用于执法,但也有许多其他客户,包括美国银行、梅西百货和沃尔玛。名单还在继续,数千家。那里也有一些个人。
这篇文章引用道,Clearview AI表示,它将不再向私营公司和非执法机构销售其应用程序。它还将终止所有合同,无论合同是用于执法目的还是在伊利诺伊州的合同。是的,我认为这是一个非常受欢迎的发展。一件有趣的事情。
表明有一组积极的记者实际报道和审查这些公司似乎会产生影响,因为在我们实际谈论这篇新闻文章后,我认为在几个播客之后,他们现在正在宣布这一点。我想一个问题是,这够了吗?我的意思是,
他们不再向私营公司销售产品是件好事,但这仍然看起来像是一个蛮荒的西部,而且他们一开始能够做到这一点真的很奇怪。这篇文章指出,他们实际上正在终止伊利诺伊州的所有合同,这是因为实际上有一起针对
处理伊利诺伊州生物识别信息隐私法案的诉讼,该法案实际上禁止使用人脸识别软件。但这并不适用于美国其他地区。因此,似乎Clearview仍然希望在其他地方运营。所以,是的,我不知道。你认为Clearview应该……
自我约束,Sharon,或者我们需要更多对其进行审查?我认为根据它的运营方式,我认为它绝对需要对这家公司进行更大的、更大的约束。我不太确定他们是否谨慎地没有侵犯隐私。是的,还值得注意的是,一些报道是由于泄露而产生的
来自Clearview。我认为如果他们泄露了他们的照片库,他们的身份库,这绝对会导致更糟糕的参与者,更糟糕的公司获得它们。所以,我们现在仍然可以有这家公司在几乎没有监督的情况下运营,这似乎非常奇怪。我个人希望很快看到更多这样的情况。
对此进行补充,有一篇文章名为《极右翼的AI,我们不能忽视的历史》。总而言之,我们最近看到很多令人担忧的故事,讲述了这些公司如何将AI用于监控,例如Clearview和Banjo。虽然这些公司的运营令人难以置信。
足以令人震惊。我们还看到,他们与许多具有可疑用途的参与者也有联系,特别是与极右翼组织有关。
是的,这里有一些更具体的细节。OneZero的一份报告谈到了Banjo的创始人兼首席执行官Damian Patton是如何成为三K党迪克西骑士的前成员的。所以他十几岁的时候实际上是一个极右翼成员。
实际上还犯了一些罪行,我认为他年轻的时候向一些住房开枪。还有一份关于Clearview AI创始人的报告
表明他与各种极右翼人士有联系。例如布莱巴特新闻的作家、披萨门阴谋论者等等。所以这是一个有点模糊的联系,这些首席执行官有这些联系。这并不一定意味着存在巨大的阴谋或任何事情,但尽管如此,它确实表明
再次,让人感觉有点奇怪,那些持有某种极端观点或有联系的人正在经营这些公司,你知道,这些公司基本上是在进行监控。因此,由于AI被极右翼使用,AI也被一个相当自由的国家使用。所以下一篇文章来自Slate,标题是《法国正在使用AI来检测人们是否戴着口罩》。
我们已经听到过关于世界各国如何在疫情期间追踪其公民的故事。在30多个国家为了应对疫情而加强监控的项目中,中国、新加坡和以色列的项目都因担心侵犯隐私而受到特别关注。
因此,即使是法国这样一个以非常反对监控而闻名的国家,也将其AI工具整合到了巴黎地铁的闭路电视摄像机中。
因此,虽然法国已经表现出愿意使用监控来监控公民的行为,但他们的使用并不像听起来那么具有侵入性。这篇文章指出,法国初创公司Dataka Lab创建的系统识别出似乎戴着口罩的乘客数量
该公司表示,无需收集和存储有关个别乘客的数据。据The Verge报道,该软件可在安装它的任何位置运行,因此数据永远不会发送到云端或Ducata的实验室办公室。这也被称为边缘计算。
因此,它基本上每15分钟生成一次统计数据,然后发送给只有权访问显示戴口罩乘客比例的仪表板的当局。所以它根本不会指出个人。而这正是法国试图将自己与其他受到特别关注的国家区分开来,但他们也希望能够部署某种监控来鼓励其公民戴口罩。
是的,这是一种不同的监控模式,它似乎在很大程度上保护了人们的隐私,同时仍然允许进行监控和数据收集,这对于了解在哪里分发口罩、在哪里没有戴口罩等是有用的。
我很想知道,Sharon,如果我们在美国海湾地区有这样一个系统,你会对这种追踪戴口罩的行为感到满意吗?我想这取决于将要采取的行动。所以他们看到了这些统计数据,但这将使他们能够执行哪些类型的行动?是的,它确实……
了解拥有这些数据的动机是有意义的。但这篇文章指出,自4月下旬以来,它已被安装的一个地方,度假城市戛纳,计划向所有居民免费提供口罩。因此,这项技术可能有助于分配、评估需求以及了解政府关于口罩的信息是否有效。
我认为这是一件有效的事情,只要它不被用作进入大规模监控的敲门砖。虽然他们一直在做的事情,即试图非常小心地保护隐私,我认为这是有效的。所以这篇文章确实指出,尽管现在在法国公共交通工具上戴口罩是强制性的,并且该国正在考虑对个人处以135欧元(约合147美元)的罚款
因为没有戴口罩,该软件仍然不会被用来识别、谴责或处罚人们。
我认为这一点很重要,因为他们基本上试图做的是识别人们可能没有戴口罩的热点地区,然后也许在那里部署某种执法。不要直接使用该软件,这随后会落入该软件的缺陷和潜在的大规模监控之下,但也许可以更有效地部署执法。我认为人们对这一点有点
更满意?是的,我认为这里有一些好处。首先,正如你所说,实现本身是边缘AI。因此,计算是在机载进行的,这意味着它可能更有限。例如,你不能仅仅将其更改为人脸识别的大规模监控系统。它可能更有限,这是一件好事。
正如你所说,有一个明确的范围,即这不会被用来寻找或识别人们,它只是被用来收集热点。如果你以这种方式使用AI,那么如果你注意你如何向我们这些普通人传达和解释这些事情,那么监控可能是可以接受的。
我认为这可能是一个其他国家可以效仿的非常好的模式。因为在此之前,这些模式有点令人震惊或不舒服,我想说。也许这是美国或其他国家可能更愿意采用的模式,尤其是那些拥有民主制度的国家。
是的,我认为这很有道理,因为欧洲经常在隐私和AI法规方面领先。我们已经听到过一些关于如何做到这一点的报告。所以很高兴听到他们正在尝试这样做,并且在实践中以一种似乎经过深思熟虑的方式去做,至少在这种情况下是这样。
好的,就这样,我们将结束我们Let's Talk AI的第10集。非常感谢您收听本周的节目。您可以在skynettoday.com上找到我们今天在这里讨论的文章,并订阅我们每周的类似新闻通讯。无论您在哪里收听播客,请订阅我们,如果您喜欢这个节目,请不要忘记给我们评分。请务必收听下周的节目。