您好,欢迎收听Skynet Today的Let's Talk AI播客,在这里您可以听到AI研究人员关于AI的实际情况以及哪些只是耸人听闻的标题。这是我们最新的“上周AI”节目,您可以在其中快速了解上周的AI新闻,以及两位AI研究人员对这些新闻的一些讨论。
首先,我们将把时间交给Daniel Bashir来总结上周AI领域发生的事情。我们将在几分钟后回来,更深入地探讨这些故事,并给出我们的独到见解。大家好,这里是Daniel Bashir,带来我们每周的新闻摘要。本周,我们将关注Clearview AI的一个故事、Facebook的两个故事以及ACM FACT会议的新闻。
首先,《伊利诺伊州生物识别信息隐私法案》禁止未经明确同意收集图像、指纹和虹膜扫描等数据。Clearview AI的争议性运营显然违反了这些规定,计划对该法律和最高法院提出质疑。
正如OneZero报道的那样,它声称该法案之前的解释需要澄清且缺乏一致性。与此同时,国际监管机构发现这家初创公司的技术违反了隐私法,并采取了行动,包括加拿大和德国。这只是一个备案,并不保证我们会看到最高法院的案件,但这将是第一次。法院已经就数据隐私问题做出裁决,但没有具体针对面部识别。
接下来,如果Google Glass还不够,Facebook正在开发自己的智能眼镜,据报道正在权衡将其中的面部识别技术构建的法律影响。MacRumors报道称,Facebook的AR和VR主管Andrew Bosworth在一次内部会议上告诉员工,该公司正在评估是否存在允许其将该技术集成到新设备中的法律框架。
Bosworth强调,目前尚未就此做出任何决定,开发AR眼镜的工作仍处于早期阶段。Facebook去年首次公开谈论智能眼镜项目,声称该产品将于2021年初上市。这款眼镜有望与Snapchat和亚马逊的产品竞争。
面部识别和其他AI技术建立在数据的基础之上。为了让图像识别算法学会正确识别不同的人,人类必须花费大量时间标记图像以提供给这些算法。正如Wired报道的那样,Facebook构建了一个名为SEER的自监督算法,该算法几乎无需标签的帮助就能学会识别图像。
该算法从Instagram上抓取了超过10亿张图像,并自行决定哪些物体看起来相似。例如,它将带有胡须、毛皮和尖耳朵的图像收集到一堆。
当提供少量标记的图像(包括一些标记的猫)时,它能够对这些堆进行分类。Facebook的Yann LeCun经常说,使用标记数据来训练算法的传统方法无法扩展,长期的进步将取决于像SEER这样的算法。
其他研究人员表示,SEER拥有令人印象深刻的结果,并且这种方法将使我们能够承担更雄心勃勃的视觉识别任务。但也有局限性。此类算法需要巨大的计算能力。最后,VentureBeat报道称,公平、责任和透明度ACM会议(FACT)已暂停与谷歌的赞助关系。
这一决定紧随谷歌解雇道德AI负责人Margaret Mitchell和Timnit Gebru以及重组道德AI团队之后。会议赞助联席主席Michael Ekstrand表示,让谷歌成为赞助商将不利于社区,并阻碍会议的战略计划。
但这并不意味着FACT将不再得到大型科技公司的支持。DeepMind是该会议的另一个赞助商,该公司今年也发生了自己的AI伦理争议,也是谷歌旗下的公司。FACT还寻求了微软、福特基金会和麦克阿瑟基金会的资助。根据FACT网站,帮助创立该组织的Gebru继续就数据和算法评估提供咨询,并担任项目委员会主席。
Mitchell也是会议联席主席和项目委员会成员。这就是本周新闻摘要的全部内容。敬请期待对近期事件的更深入讨论。感谢Daniel,欢迎各位听众回来。既然您已经了解了上周新闻的摘要,请随时留下来听两位AI研究人员对这些新闻进行更轻松的讨论。
其中一位是我自己,Sharon,机器学习小组的四年级博士生,与Andrew Ng一起工作。我的研究方向是生成模型,并将机器学习应用于应对气候危机以及医学领域。和我一起的是我的联合主持人。你好,我是Andrey Konarkov,斯坦福视觉与学习实验室的三年级博士生。我的研究主要集中在机器人操作的学习算法和强化学习。
像往常一样,我们将直接进入对上周新闻的讨论。首先是我们的第一个重大新闻,即2021年AI指数,该指数表明尽管疫情肆虐,但AI仍然取得了重大增长。是的。
AI指数是斯坦福大学和其他地方一项非常有趣的努力,旨在记录和定量地跟踪AI的发展。因此,他们收集了大量指标,例如发表的论文数量、学生入学人数、公司数量等等。
成立出版社,一大堆。这些报告有数百页。是的,这里值得注意的是,尽管COVID危机对经济造成负面影响,但对AI的私人投资却大幅增加。
其他有趣之处是中国在重要的学术著作方面超过了美国,就其被引用次数较多的同行评审期刊而言。但在过去十年中,美国在整体AI会议论文方面仍然领先。
是的,AI指数中还有很多其他内容。因此,如果您对AI的发展感兴趣,那么一定要去谷歌搜索一下,您就可以找到这份报告并阅读它。它是免费公开的。Sharon,您对此有何看法?
我想说,论文中的大多数观点对我来说并不令人惊讶,但看到所有这些观点都总结在一起真是太好了。例如,AI领域的女性和少数族裔(黑人和西班牙裔)代表性仍然较低,但正在增长。
还有就是从学术界到大型公司的“人才外流”,教授和博士生都是如此。对此我并不感到特别惊讶。那些不打算进入学术界的人。所以我是
而且,像公司主导着我们研究人员使用的工具。是的,这似乎与社区内部发生的事情都一致。这些是我认为并不特别令人惊讶的趋势。我认为这总结了AI目前的走向。没错。是的,这份报告
没有什么令人惊讶的地方,也许除了我们提到的对AI的私人投资持续增长之外。但许多其他事情只是表明您自己可能观察到的事情,但如果没有定量测量,您实际上可以跟踪它并看到这些情况确实如此等等。
是的,绝对很酷。这份年度AI指数将继续跟踪正在发生的事情并报告AI的情况,阅读它总是很有趣的。所以我建议这样做。
接下来是更具体的科研方向。下一篇文章的标题是《人工神经网络中的多模态神经元》,来自OpenAI,重点介绍了他们的CLIP模型,他们在其中发现了这些更高级别的神经元
并且可以在更高的抽象层次上更容易解释。他们称之为多模态神经元。例如,这样一个多模态神经元可能是蜘蛛侠神经元,或者很久以前流行的哈利·贝瑞神经元。因此,基本上他们一直在发现CLIP在发现更高级别的概念和模式方面是如何做的或发现了什么。
是的,他们发现了一些非常有趣的东西。很多都与地理位置或面部表情有关。当然,它也严重依赖于训练数据。他们也看到了其中的漏洞。例如,他们发现没有找到旧金山神经元,而且他们还发现CLIP模型中存在偏差,例如,中东神经元与恐怖主义有关。
是的,我认为这非常令人兴奋。正如您所指出的那样,这里存在某种相似之处,即在生物神经元中,存在某种相似之处。这里有著名的哈利·贝瑞神经元。
它会对与哈利伯顿相关的信息做出反应。这可以是图像,可以是文本,也可以是记忆。是的,任何与这个概念相关的东西。这有点不同。通常在神经网络中,我们看到您训练神经网络来识别物体,例如,
它们不一定能推广到,你知道,如果它们被训练来识别面孔,它们可能无法识别面孔的素描,或者它们无法识别。如果你如果你给它文本说“脸”,它不会认为那是脸。
而在这里,是的,这种工作方式的具体之处在于,他们已经证明它对真实照片和手绘素描照片以及只是图像文本的文本都有反应。他们还表明,之前的模型实际上并没有以类似的方式做出反应。所以我发现这很有趣。
相当引人入胜,我认为。这似乎是进步的标志,并且在质量上是一种相当新的
大型神经网络的结果。当然,CLIP在展示通过训练文本与图像的匹配,可以获得非常准确的分类,并且比之前的实践更好地泛化方面已经非常令人印象深刻。但我认为这非常酷。
对。我认为这项工作有一些先例,我很想强调一下,因为我认为围绕这一点已经做了一些工作,但可能不像OpenAI的营销团队那样在博客文章中引起那么大的轰动。
那就是。我认为David,是的,David Bowe关于重写生成模型以及GAN能看到什么或不能看到什么的工作。我认为在他的工作中,他能够找到一个树神经元,并能够打开和关闭它,从而在空间中放置树木或移除树木。
来自生成模型,并且比CLIP小得多。他还能够重写规则,这意味着……
如果数据中没有看到戴帽子的马,只看到戴帽子的骑手,但也许也可以让马戴帽子。他启用了一个界面,只需对一层进行一些快速优化即可适应该规则,并使神经元朝那个方向发射,可以说是这样。所以我想有一些……
我认为这并不是唯一一项研究过生成模型或更广泛模型中神经元做什么的高级理解的工作。但令人兴奋的是,在这个巨大的模型中,我们可能会看到更多的东西,对吧?因为那个模型要小得多,而且只在教堂或较小的数据集上进行训练。所以是的,
所以,是的,能够看到这种信息非常酷,它可能会成为许多反深度学习者所希望的东西的关键,即对更高级别抽象有意义事物的表示。我认为我们正在看到模型是如何隐式地学习它们的,也许不是所有东西,也许不是所有东西都完美无缺,但它确实学习了其中的一些东西。
是的,完全正确。我认为,正如OpenAI经常出现的情况一样,这里没有必要的新想法或新颖的研究,但他们从扩展和仔细观察中获得的结果本身就非常引人入胜。他们确实有一些有趣且非常新颖的东西。
这是一种他们称之为排版攻击的新型攻击。因此,对于这个模型来说,他们已经证明,众所周知,我们之前已经看到,对于神经网络来说,如果您拥有模型的权重,您可以对图像进行小的修改,并且可以对熊猫作为狗进行非常愚蠢的错误分类,对吧?
如果您对图像进行小的扰动。但对于这个模型,他们表明,即使您不需要访问模型的权重,您也可以拿一张纸,在上面写一些文字,然后把它贴在一个物体上,它就会错误分类。所以有一张苹果的图片,然后他们拿一张纸,在上面写上iPod,然后分类就是iPod。
因此,这意味着如果我们继续发展这些模型,那么我们将有更简单的方法来欺骗它们并以意想不到的方式与它们作对,而您甚至不需要任何代码。你只需要能够……
做一些简单的事情。这也基于一些之前的想法,例如,人们可以贴在停车标志上的贴片,以使其不被识别。是的,很高兴在这里看到这一点,以提醒我们我们的模型仍然有一些故障模式。
当然。我看到它在Twitter上流传,非常有趣,人们,这几乎就像,“哦,如果模型隐式地可以学习OCR或视觉文本与实际文本之间的映射,那么它将非常容易受到这些类型的攻击,您只需将其他单词的图像贴在苹果上,它就会将其分类为其他东西。呃,
是的,这很有趣。好吧,让我们转向AI的不同用途和不同类型的研究,这可能有点反乌托邦或奇怪。我们有《技术评论》的文章《认识判断你美丽程度的AI算法》。所以,是的,
这篇文章是关于越来越多的初创公司提供可以使用AI来对你外表提供反馈的服务。例如,有一家公司Quove Studio……
最初是一家为模特经纪公司修饰图像的工作室,但现在它是一家面部美容咨询公司,承诺能解答什么使面孔有吸引力的问题。所以……
是的,他们提供诸如美容产品建议以及如何在电脑上增强图像的技巧等服务。但对我们来说最有趣的是,有一个面部评估工具,这是一个AI系统,它会查看你面部的图像,告诉你你的美丽程度,然后告诉你你可以做些什么。因此,他们提供了这篇文章,内容非常广泛,有很多细节,并且
呃,如果你觉得这很有趣或关注,呃,提供尝试这项服务,呃,是的,所有的一切都需要,呃,卸妆,呃,拍一些特写照片。然后有一个支持返回建议,你知道,据说可以解决缺陷。所以,呃,
有一篇关于笑纹的文章……是的,显然他们需要手术干预。有一份由医生撰写的完整手术建议报告。还有不同的产品,精华素。是的,所以……
我想这很有趣。我绝对没有意识到这是如此广泛,而且显然有大约20家不同的公司在做这件事,还有一个开源工具。是的,非常不寻常,而且通常不是一个好主意,但如果做得好的话,可能在某种程度上是有用的,所以看到这一点有点奇怪,我想。
你的看法是什么,Sharon?我可能能够更详细地谈谈这一点,因为我可能是目标用户。我绝对可以看出这如何有用,特别是对于那些喜欢听取他人意见的人来说。我绝对觉得这是一种……
危险的斜坡,就像,“哦,这只是迎合整个Instagram。我只关心我的外表”之类的市场,以及所有正在发生的事情,现在对孩子们来说尤其不好。
但我可以看出,对于那些想要知道如何让自己看起来更好的人来说,这样的东西是多么令人向往。我认为这里确实存在一点WebMD效应。我的意思是,建议有时可能有点极端。因此,就像WebMD一样,谁……
你知道,即使我只是打喷嚏,它也总是说你得了癌症。就像,你可能得了癌症。所以我认为也有一些极端的建议。在这种情况下,我担心会有非常商业化的建议,这些建议可能实际上对一个人没有好处。我认为,如果像购买美容产品一样,那并没有什么害处,但如果是一些,你知道,
就像,“哦,你应该做整形手术。”我觉得,好吧,这开始触及一些界限,就这到底对人们和我们的文化做了什么而言。当然,在一些文化中,整形手术是常态,并且被广泛接受,这并没有被视为坏事。所以我认为它会改变。
事情。我们喜欢,我们应该意识到这一点,呃,它可能会做,它可能会改变我们的文化,就我们如何看待虚荣心等等而言。所以。是的,当然。呃,很高兴听到你的观点,显然对我来说,我不是目标用户。我不,我甚至比大多数男性更少,我会说,呃,不,但皮肤护理或任何类似的东西。呃,
但我读到过去有一些有趣的报告与之相关,显然TikTok和Snapchat都呈现不同的内容,特别是TikTok有一个著名的推荐算法,可以为你提供个性化的视频Feed,并旨在吸引用户并获得点赞。
并且有一些讨论和一些说法称,该算法将美丽评分作为推荐算法的一部分,是的,基本上,推广的内容是为据说更漂亮的人准备的。
而且,我认为,是的,我们确实看到了一个不太积极的应用,它非常成问题且令人遗憾。显然,因为他们的外表而惩罚人们是不公平的。这有点粗鲁,特别是考虑到,据我们所知,这些算法存在偏差。因此,这篇文章指出……
Face++,它有一个开源工具。实际上有一项研究表明,它始终将肤色较深的女性评为不如白人女性有吸引力。一般来说,欧洲人的特征比其他类型的特征更高。所以,是的,像往常一样,有警告,像往常一样,
AI可以以积极的方式和非常消极的方式使用。它需要一些,你知道,仔细考虑你想在哪里划线,然后你想如何应用AI。是的,绝对的。
所以绝对是一个敏感的领域,我们将拭目以待。我知道几家美容公司已经考虑过这个问题,或者至少帮助思考过,“哦,我们可以根据
某种虚拟的东西,就像说不需要去商店,也不需要让任何人亲自看你一样,就像某种更极端的东西,这可能只是对美的判断。我可以想象这种情况会发生。
我看到这对很多孩子来说都发生了很多。我认为这会非常消极。我所说的极端消极,不仅仅是指他们的自尊心受到一点打击。我的意思是,就像它一样。它确实。是的。
它确实会影响,呃,自杀的想法和行为,尤其是在女孩中。所以,呃,这真的很伤人。呃,所以希望也有,你知道,考虑到了这一点,就像这样的事情。是的,当然。呃,绝对,呃,
需要谨慎对待的领域,但当然它也可能有用。你知道,我们都想努力改善自己,也许向算法寻求建议比向其他人寻求建议更容易,例如。没错。我宁愿选择模型而不是我妈妈,例如。
但让我们转向我们的最后一篇文章,转向AI的非常不同的应用。我们有《科学美国人》的文章《AI系统可以像狗一样嗅出疾病》。这篇文章是关于2月份发表的一项研究,其中一个大型团队报告了一个AI驱动的系统,该系统在从尿液样本中正确识别前列腺癌病例方面的准确性与训练有素的狗一样高。
麻省理工学院的一位研究人员Andreas Mersin(也是我们的合著者)认为,这项技术可以集成到智能手机中。因此,可能会有一个带有AI软件的微型传感器,可以帮助检查疾病,正如这篇文章所说那样。
是的,在高层次上,它的工作原理是细胞会产生从不同事物(如皮肤、血液、尿液)散发出来的化学物质。这个团队开发了一种人工鼻子,包括这种纳米鼻子,它可以像狗一样检测这些化学物质。然后我想这里很酷的是……
存在一种复杂的模式,我们使用化学混合物,这很难知道。因此,训练AI能够仅从原始数据中做到这一点,这通常是这种情况。
是的,非常酷。Sharon,我不知道,你见过类似的东西吗?或者这让你想到了什么?我一直都在等待这个。我和人们谈过……
你知道,事情在人类水平上是什么样的。我只是说,狗的水平呢?狗的鼻子很好。我们应该达到狗的鼻子水平,对于AI来说。这正朝着这个方向发展。所以我对它的发展感到兴奋。因为它本质上将是一个不同的基准,对吧?它将是狗。我认为这很酷。是的。
如果我们可以,你知道,对于我们所知的拥有最佳X感官的物种,我们将尝试让AI达到那个X。我认为这也与围绕……
你知道,声音和气味通常用于检测疾病。我认为人们一直在开发所谓的嗅觉相机。这仍在进行中。但是,如果我们可以轻松地量化气味并编码气味,那么这项工作就会容易得多。这绝对让我想到了,你知道,超出
视觉范围的工作,呃,尤其是在检测疾病方面。如果我们可以使用其他传感器来拾取不同的、不同的……
所以声音,我认为人们至少一直在尝试,我没有看到非常有希望的结果。我看到人们为此付出了巨大的努力,也许我们会取得一些进展。我认为我们在之前的节目中提到过,但是,你知道,使用咳嗽声来检测COVID。所以,我认为,你知道,我们可以推动超越成像的方向。看到这一点也很令人兴奋,并且也能够,
从本质上讲,将此视为狗级别的智力或鼻子智力、嗅觉智力等等,你知道吗?是的,完全正确。这里很有趣的是,新网络被训练来模仿狗。所以,你知道,他们实际上是从……
英国组织Medical Detection Dogs训练的狗。因此,有一只拉布拉多犬和一只威尔士猎犬被训练来识别尿液样本。然后AI从数据中模仿它们,然后标记病例。他们达到了相同的水平,这并不令人印象深刻,或者说,你知道,不……
超级准确,阳性病例的准确率为71%,阴性病例的准确率为70%到76%,这与AI的狗相似,所以是的,我认为我同意,看到AI被训练到达到狗的准确率非常酷,这还指出
如果你有更多的训练,你可以让狗达到96%的准确率。所以这非常令人兴奋。这似乎绝对会为检测不同的疾病提供更简单的方法。正如我们在AI之前的应用中所看到的,只要它经过精心开发并且没有偏差,
这是一种明确的AI良好应用。所以看到进步总是令人兴奋的。最后,非常感谢您收听本周的Scana Today Let's Talk AI播客。您可以在scanatoday.com上找到我们今天讨论的文章,并订阅我们每周的类似新闻通讯。无论您在哪里收听播客,请订阅我们,如果您喜欢这个节目,请不要忘记给我们评分。请务必收听下周的节目。请务必收听下周的节目。