We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode AI Nirvana Song, Facebook Fairness Dataset, No-Code AI

AI Nirvana Song, Facebook Fairness Dataset, No-Code AI

2021/4/16
logo of podcast Last Week in AI

Last Week in AI

AI Deep Dive AI Chapters Transcript
People
A
Andrey Karenkov
D
Daniel Bashir
S
Sharon Zhou
Topics
Daniel Bashir: 本周新闻主要关注 Google AI 伦理团队的动荡,包括 Sami Bengio 的辞职,以及由此引发的关于 AI 伦理和负责任创新的讨论。此外,新闻还报道了纽约警察局秘密使用 Clearview AI 的面部识别技术,以及对情绪识别技术可靠性和潜在风险的担忧。最后,新闻还报道了 AI 在药物研发领域的最新进展,特别是利用 AI 加速蛋白质工程,以降低成本并提高效率。

Deep Dive

Chapters
Discussion on Facebook's new dataset aimed at improving fairness in AI models, focusing on its potential to address bias and the implications of its usage restrictions.

Shownotes Transcript

您好,欢迎收听Skynet Today的Let's Talk AI播客,在这里您可以听到AI研究人员关于AI的实际情况以及哪些只是耸人听闻的标题。这是我们最新的“AI上周回顾”节目,您可以在其中快速了解上周的AI新闻,以及两位AI研究人员对这些新闻的一些讨论。首先,我们将把时间交给Daniel Bashir来总结上周AI领域发生的事情,我们将在几分钟后回来更深入地探讨这些故事并发表我们的看法。

大家好,这里是Daniel Bashir,为您带来每周新闻摘要。本周,我们将讨论更多来自谷歌和Clearview AI的新闻、情绪识别以及用于药物开发的AI。

首先,Gebru事件仍在继续。在Timnit Gebru及其AI伦理联合负责人Margaret Mitchell被解雇后,多名谷歌员工离开了公司。现在,据彭博社报道,负责谷歌AI伦理小组的研究经理Sami Bengio于4月6日星期二辞职。Bengio于2007年加入谷歌,负责管理谷歌大脑团队的数百名研究人员。

Bengio在电子邮件中宣布了他的离职,他直接管理Gebru和Mitchell,并被两位联合负责人视为盟友。Bengio开发了多个流行的机器学习框架,包括Torch和TensorFlow,并且在帮助构建谷歌大脑方面发挥了重要作用。接下来,BuzzFeed新闻为我们带来了更多关于Clearview AI的消息。

虽然纽约警察局在2020年初表示与这家备受争议的人脸识别公司没有关系,但新的公共记录请求中的文件显示,纽约警察局早在2018年就开始使用Clearview,并一直与该公司保持着关系。

这些文件包括电子邮件和正式合同,授权从2018年12月到2019年3月进行Clearview试用。纽约警察局与Clearview的关系包括面对面会议和首席执行官Juan Tontat提供的客户支持。

4月5日星期一,纽约警察局发言人没有回答有关互动的问题,并将面部识别描述为“有限的调查工具”。在大流行期间,科技公司推出了情绪识别软件,用于远程监控员工甚至儿童。

正如研究员Kate Crawford为《自然》杂志撰写的那样,一个例子是Four Little Trees系统。该程序在香港开发,声称可以评估儿童在做课堂作业时的情绪。2019年对文献的回顾发现,没有可靠的证据表明AI可以检测情绪,并且人们越来越关注情绪识别技术的使用和滥用。杰出的研究人员已经支持对这种技术的监管,

正如Crawford所写,“正如各国有法规来执行开发药物的科学严谨性一样,他们也应该对声称了解我们精神状态的技术进行监管。”一段时间前,谷歌DeepMind声称找到了蛋白质折叠问题的解决方案,并指出他们的AlphaFold算法将来可用于辅助药物研发。

最近,这方面取得了更多进展。正如SciTechDaily报道的那样,由于瑞典查尔姆斯理工大学的工作,AI现在可以生成新颖的功能性活性蛋白。一位研究人员表示,这项工作具有许多应用潜力,包括更快、更经济高效地开发基于蛋白质的药物。

“基于AI的蛋白质工程加速带来的其他好处包括降低开发成本,以及实现环境可持续的工业流程和消费产品。”这就是本周新闻综述的全部内容。敬请期待对近期事件的更深入讨论。

谢谢,Daniel,欢迎回来,各位听众。既然您已经听取了上周新闻的摘要,请随时留下来听两位AI研究人员对这些新闻进行更轻松的讨论。一位是我自己。我是Sharon Zhou博士,是Andrew Ng机器学习小组的四年级博士生,即将毕业。顺便说一下,我已经答辩了。我的研究方向是生成模型以及将机器学习应用于医学和气候。和我一起的是我的联合主持人,

我是Andrey Karenkov,还不是医生,但希望很快就能成为。希望如此,是的。我是斯坦福大学视觉与学习实验室的三年级博士生。我主要专注于机器人操作的学习算法和一些强化学习。

好的。那么,像往常一样,我们将直接开始讨论上周关于AI的有趣新闻。首先是这篇关于用新的数据集阐明AI公平性的文章。这是一篇非常有趣文章。我认为,呃,它谈论的是Facebook发布的一个新的数据集。

基本上,在他们的新闻稿中,引用一下,Facebook AI构建了一个开源的新型独特数据集,名为“随意对话”,包含45,186个参与者进行非脚本对话的视频。

它作为AI研究人员的工具,可以帮助他们评估其计算机视觉和音频模型在年龄、性别、外观、肤色和环境光照等子群体中的公平性。这里很酷的一点是,这些都是付费的个人,他们明确提供了自己的年龄和性别信息。

这显然是新的,不同于以前存在的东西。所以这是一个公平的角度。是的,我认为这里有很多有趣的细节。Sharon,你有什么特别注意的吗?嗯,我注意到的重点是

AI研究人员现在更刻意地考虑他们的数据集,以及许可或使用他们的数据集意味着什么,以及允许什么,下游使用案例允许什么,不允许什么。你不能根据用户协议从这些数据中预测某些事情。我认为这是朝着,也许政府还没有制定出法规,但人们和研究人员开始更多地考虑这个问题,并开始设定

我认为,在我们现在发布数据集的方式上,一个非常重要的先例,我们现在更多地考虑偏差和公平性。是的,当然。这非常有趣。首先,因为这是数据集的意图,对吧?为了评估不同模型在不同子群体中的公平性。试图捕捉模型中的偏差,这显然是我们看到过很多的问题。

正如你所说,这里另一个有趣的部分是,实际上存在一个数据用户协议,不允许某些任务,例如训练识别性别、年龄和肤色的模型。我们已经看到相当多的争议出现,特别是由于AI的应用,在是否应该这样做方面,即使它有效,也是值得怀疑的。所以你看到过像根据你的脸预测性取向,或者我们看到过像根据你的声音生成你脸的图像。这两篇论文实际上都在

发表后引发了一些批评。在优秀的场所也是如此。是的,它们也在优秀的场所发表。这非常有争议,而且是由知名人士发表的,所以非常有争议。是的,正如你所说,这似乎是一个良好的开端,或者也许是一个迹象,表明作为一个群体,我们正在以一些有趣的方式吸取这些争议教训。我当然没有看到

对,对。没错。

在我们继续之前,Facebook的这份新闻稿中还有其他一些有趣的事情。因此,他们还提到这里一个重要的应用是深度伪造检测器。

他们指出,你知道,已经有不同的最先进的检测器了,但我们仍然存在悬而未决的问题,包括这些检测器在不同子群体(如年龄、性别和肤色)中的表现如何。是的,他们在这里说,这对于基本上所有子群体都非常重要。

他们实际上与其他行业领导者合作开展了一项深度伪造检测挑战。我想这里的想法是,Facebook AI及其数据集旨在特别推动这项工作。他们进一步表示,此次发布是Facebook长期以来以负责任的方式构建AI技术倡议的一部分。

从积极改善经常服务不足的社区的Facebook体验,到邀请新的方法来防止仇恨言论传播。所以这是Facebook关于其公平倡议的一个非常积极和令人印象深刻的发布。

Sharon,我们之前聊过,我们确实有点怀疑这是对一个月前发表的那篇文章的回应。正确。所以我想我们应该提到,有一篇相当长的文章

让我看看标题是什么。《麻省理工学院技术评论》的文章,Facebook如何沉迷于传播虚假信息。这篇文章基本上批评说,Facebook内部的公平小组做得不够,过于关注偏差,而不是其他问题。所以,是的,如果你对这方面感兴趣,也值得阅读。

公平努力以及Facebook的AI小组在做什么。对。绝对的。我认为深入了解每家公司在其小组名称背后实际在做什么很重要,因为这并不一定意味着这就是他们在做的。我想最著名的是谷歌的伦理团队。是的。

无可奉告。不再评论了。我们已经讨论得够多了,是的。是的,世界已经讨论得够多了。但同时可能也不够。是的,你知道,这确实很巧妙。我认为,是的,这确实表明AI伦理和公平以及AI领域正在成熟,你会有这样的努力,你知道,实际上正在做一些

在之前的几年里,我们看到了很多原则声明、伦理清单之类的东西。现在看到工具、数据集和技术得到更多开发,这很巧妙。与此同时,对这些问题的报道质量也越来越高。总的来说,你知道,这两件事都很有趣。

我认为这表明我们作为一个领域正在进步。对。绝对的。

说到AI伦理,我们的下一篇文章标题是《对与白人至上主义有关的AI进行的政府审计未发现AI》。这是来自VentureBeat的文章。所以这个标题有很多东西需要解释。但基本上,本月有消息称Banjo首席执行官Damian Paton实际上是白人至上主义组织的一员。Banjo用于监控。更重要的是……

他们实际上根本没有在幕后使用AI。因此,自从该公司与白人至上主义组织有联系,而且实际上并没有使用AI技术以来,围绕算法偏差和歧视以及隐私的问题就层出不穷。犹他州实际上最近暂停了他们对Banjo 2000万美元合同的监督,原因就是这个。Andrey,你对此有什么看法?是的。意外还是不出所料?两者兼而有之,我会这么说。我们在开始之前聊过,你知道,公司声称自己是AI驱动的,但实际上,你知道,幕后只是……

你知道,人们在运行它,或者是一些软件,根本没有实际的AI。AI只是营销,呃,可能比人们理解的更常见,因为很难知道。呃,我昨天和一个朋友聊天,然后发现这个很有趣,呃,有一家公司测量你的身体成分,呃,

使用你知道的,高级传感器或其他东西来测量你的体脂。他们的名字是,呃,Dexafit,几年前我实际上试用过。显然,去年或今年,他们把名字改成了Dexafit.ai。哦,我的上帝。所以肯定,我的意思是,我认为我们可能已经过了这个阶段,但肯定有一个阶段,很多公司,你知道,在他们的名字中加上“.ai”,呃,

这到底有多大程度还不清楚。这个例子尤其表明,当你决定与特定公司合作时,需要有更多能力进行审计。在这里,就像,很有趣,有一个合同,对吧?一份2000万美元的合同,而且……

直到现在才知道根本没有AI。嘿,他们有很棒的销售人员,幸运的是没有技术人员,呃,非常尴尬,是的,是的,我对此并不感到特别惊讶,没有技术人员参与,并不感到惊讶,因为我不知道Theranos就是这样,但是呃

是的,但是,就像这里有很多东西需要解释,他们有很多虚假宣传,而且还有非常可疑的事情。如果他们没有这项技术,那么会发生什么?这只是白人至上主义者决定谁,就像人们一样,你知道,就像发生了什么事情等等。这就像,或者是谁,或者政府或警察应该做什么,你知道,这实际上是他们控制了这一点。而这也很可怕。呃,

本身就是这样。是的。这里很有趣。还注意到,联邦政府目前正在资助一项倡议,为公共安全创造技术。国家标准与技术研究院现在正在评估面部识别系统的质量,并可能致力于为监控、自动驾驶等制定更多标准。所以这个案例我认为展示了

这种需求,而且非常引人注目。是的,绝对的。我很高兴NIST在处理这个问题。在我们继续之前,这里还有一件有趣的事情。这份揭露没有算法的审计报告实际上是公开的。大约25页。你可以去阅读它。所以让我给你引用一些有趣的部分。

这是来自犹他州总检察长办公室的州审计办公室关于Banjo有限审查的内容。我们可以跳到Banjo正在吹嘘的系统,名为Lifetime。

显然,Banjo表示Lifetime能够根据来自外部来源(如社交媒体或私人安全数据)的数据集成来执行实时事件检测。Banjo吹嘘Lifetime能够识别儿童绑架案件、主动枪击案件、交通事故、事件检测和实时事件。

我印象深刻。我知道,这听起来非常令人印象深刻。是的,这些与陈述类似,包括在其RFP中,这导致了一份合同。所以大概这就是对犹他州的处理方法。是的,我理解为什么犹他州会买它。我知道。然后,是的,审计的回应是,

正如向委员会介绍的那样,Lifetime似乎是来自犹他州政府来源(如911、调度传感器、警察机构和交通摄像头)的汇总数据的仪表板。Banjo明确向委员会表示,Banjo没有使用符合行业对人工智能定义的技术。

哎哟。这太残酷了。是的。对于政府报告来说,这有点辛辣,而且很有趣。对于政府报告来说。我认为是这样。我没有读过很多政府报告。我同意。你说得对。因为,我们不期望政府报告是这样。哇。好的。是的,这确实很辛辣。我同意。我完全同意。呃,

那么,进入我们的下一篇文章,也是关于不编码的,但方式不同。所以,公司正在争先恐后地通过无代码软件将AI带给大众。这是《财富》杂志的一篇文章。基本上,这并不令人惊讶,但是公司正在

出现在市场上,并且显然需要非技术人员或非AI专家能够创建他们自己的AI模型和系统,并能够运行AI。所以这些公司包括obviously.ai、DataRobot、Levity、Clarify、Teachable Machines、Lobe和Accio,呃,仅举几例。呃,并且,呃,

文章中提到的一个参与者是Primer,这是一家专注于NLP解决方案(自然语言处理解决方案)的公司,任何人都可以运行这些东西。

我认为这种趋势并不一定令人惊讶,但看到越来越多的人能够开发他们自己的AI系统,这确实很有趣。当然,这本身也带来了一些问题,对吧?因为,我的意思是,越多的人负责这些系统或模型,他们就越有可能将自己的偏见嵌入其中,并将此提升到一个新的优化水平。

是的,是的。这已经发展了一段时间了。我认为随着AI变得越来越重要,这可能是行业早期尝试做的事情之一,即让普通大众更容易创建AI模型。正如你解释的那样,有很多这样的事情

公司,至少有十几家,甚至更多。是的。是的。所以这篇文章本身并不令人惊讶,但如果你不知道这一点,阅读它会很有趣。我认为这确实表明了

某种程度上,无论什么类型的公司和行业。这是其中之一。现在也有很多公司专注于标注数据和收集数据集。你知道,可能至少有十几家这样的公司出现了。

有很多公司提供语音识别、计算机视觉等高级标准AI任务的API。所以,是的,我一直觉得很有趣,为什么会有几十家公司做同样的事情。

这在AI变得流行之后很快就发生了。我想,是的,哪些公司能够成熟并最终发展壮大,这将很有趣,而我想,大多数公司不会存在太久。对,对。

看到所有这些公司出现也很有趣,因为现在有用例了,这几乎就像AI正在成为一种消费产品,而不是谷歌内部运行的东西。所以它在人们使用的方面变得越来越广泛。是的,这让我想到,我认为这变得如此容易获得的最糟糕的结果是,我认为对于大公司来说,

他们有钱,通常会获得专业知识,了解AI的人。围绕AI有很多炒作,很多人毕业后都上了课等等。谷歌和Facebook也有内部课程。所以有很多学习方法。但我怀疑的是,有了这些超级容易获得的东西,我们将得到更多……

个人、小型团队,构建一些非常可疑的小型网络应用程序和应用程序。这让我想起了性别识别,你输入文本并根据文本猜测性别。这真是太荒谬了。是的,我可以预见更多此类事情的发生。

是的,这肯定可能发生。你说得对。我认为,是的,我的意思是,很多公司都在向小型企业和消费者销售。所以这将是各种各样的东西。这就像,如果每个人都接触到AI,那么对世界来说意味着什么?是的,没错。所以是的,这是值得关注的事情。这也让我想起了,

我个人没有使用过任何这些工具。我的意思是,你和我一样,都习惯了用AI编写代码,我相信。太习惯了,这里用“太习惯了”这个词是正确的。说实话,我们不应该这么习惯。为了我们自己的好,就是这样。我们花了太多时间调试和弄清楚不同的东西。这很悲伤。这很悲伤。

但与此同时,我使用过一些类似的工具。特别是有一些工具可以轻松创建基于AI的艺术。

是的,所以我使用过一些这些工具。我想不起名字了,但它们非常流行。而且,你知道,其中一个工具有这样的想法,通过使用生成模型混合不同的东西来发展艺术。

你只需点击,只需点击不同的图像,你知道,使用一些滑块,不需要自己编写任何代码。是的。Artbreeder。是的。Artbreeder。没错。是的。是的。所以这就是我用过的那个。然后它看起来非常有趣。Artbreeder中有一个非常繁荣的社区。该工具本身随着时间的推移已经发生了很大的发展。我认为这是一个无代码的例子,呃,

AI,从某种意义上说,对吧?绝对的。没错。没错。我不知道。你玩过Artbreeder吗?哦,我玩过很多Artbreeder,我在我的课堂上展示过它,在我的两门课上都展示过。是的,我也认识Joel,就是制作它的人。令人难以置信的是

他们围绕它建立了一个如此庞大的社区。我非常印象深刻。我觉得,老实说,这是与生成模型交互的最佳方式。没错。是的。而且阅读这篇文章让我想起我应该回去再玩一会儿。我曾经非常沉迷于它,并生成了几十张图像。然后,是的,

有点厌倦了,但它会很有趣,现在它非常强大,你知道,如果你觉得很酷,我会建议听众们搜索Artbreeder,并试着玩一下,你会感到惊讶的。是的,绝对的。我甚至作为研究人员也感到非常惊讶。是的,我觉得这是与GAN交互的最佳方式,因为它们就是GAN

好的,然后是我们的最后一篇文章。一些有趣的东西,也与我们刚才讨论的艺术有关。文章的标题是《通过AI软件创作的涅槃乐队新歌,距科特·柯本去世27年后》。这是来自billboard.com的文章。是的,这是一篇非常有趣的文章。

所以这里的故事是,有一个名为“27俱乐部失落的磁带”的新音乐项目,它利用AI分析每位选定的音乐家多达30首歌曲,这些音乐家都与心理健康问题作斗争,并在27岁时去世,其中包括科特·柯本、吉米·亨德里克斯、吉姆·莫里森和艾米·怀恩豪斯等人。

这是由Over the Bridge和位于多伦多的组织创建的,旨在提高音乐界对心理健康的认识,他们创建了“27俱乐部失落的磁带”。他们已经发布了几首歌曲,包括这首听起来像涅槃乐队的歌曲,以及另一首听起来像艾米·怀恩豪斯的歌曲。

所以我将插入一小段,这样你就可以品味一下这首歌,然后听一听,看看它与涅槃乐队有什么关系。然后我们将立即回来讨论。我的手紧紧抓住地狱之神

好了,你们回来了。我希望你们印象深刻。我听的时候印象深刻。在我听来,这听起来像涅槃乐队,而且总体上也是一首好歌。我知道我们都在开始之前听过这些歌。你的印象如何,Sharon?

太棒了。太棒了。我知道它并非完全是端到端的机器,但它正在接近,而且非常好。我对此印象非常深刻。它确实听起来像艾米·怀恩豪斯。我不太了解其他人,但它确实听起来像艾米·怀恩豪斯。是的,我的意思是,我们之前见过这种生成音乐甚至模仿音乐的事情。

由特定的人创作。所以OpenAI有一个大型项目。但这里有趣的是,所有这些先前的事情,你都能听到它们是AI生成的。有一些AI伪影或类似的东西,即使整体风格、类型和声音都差不多,它们仍然相当粗糙或……

有很多奇怪的AI伪影。而在这里,它听起来非常干净。它听起来像一首可以发布的歌曲。我想这部分是因为他们有一位真正的音频工程师。这些不仅仅是AI模型的原始输出。他们似乎有非常,呃,

他们想出了如何以一种好的方式做到这一点,他们使用了不同的AI组件。所以他们使用Magenta来分析这些艺术家歌曲的构成。然后他们使用遗传算法来创建,或者他们也使用神经网络来分析艺术家的歌词。是的,这是另一个例子,表明

AI和一个拥有很多技能的有天赋的人的结合可能比仅仅使用AI更好。是的。无论如何,这是一个非常有创意的项目,一个非常有趣的AI应用。我个人认为,这是一种提高人们对音乐家心理健康的认识的有趣方式。这不是我想出的方法。是的。我认为他们这样开头非常好。我,我,

我真的很欣赏这一点。我有时会,所以我无法判断这有多真实,但他们确实谈论这一点,并谈论,你知道,就像这是,这是巨大的动力,也许是一个原因,在这种情况下,它,

更可以接受,或者至少更有趣,最终是为了提高这种认识,而不是仅仅说,嘿,看看这个,也许他们没有同意,但无论如何……是的,在我看来,这似乎相当真实,呃,实际上令人震惊的是,呃

你知道,他们正在研究所有这些27岁就去世的音乐家。这太年轻了。我现在28岁了。对。这似乎是一种非常早的死法。这显然非常悲惨。是的。所以,是的,这是一个,我没有见过,你知道,一个如此有趣且具有这种类型的AI应用

呃,真正以心理健康为导向的目标,而且呃……是的,非常有趣,我会建议听众们去看看,你知道,呃,听听我们的歌,也许和你的朋友分享,因为我认为这很酷,而且呃,你知道,我想这也是一个很好的信息来传播

是的,绝对的。我对Magenta取得如此大的进步印象深刻。谷歌的Magenta团队取得了如此大的进步。我认为这是一个非常酷的应用。是的,我认为这也表明,总的来说,这是一个缓慢的过程,但用于艺术的AI一直在发展,你知道,在过去的十年里。所以有很多,相当多的艺术家使用AI,

实际上有一个网站专门列出了所有这些应用程序。这现在表明,你知道,软件工程以外的人,不是,你知道,

0 那些在某种意义上并非真正有天赋的软件工程师,也许更多的是音乐家,现在能够开始使用现有的工具来做一些有趣的事情,而这些事情实际上直到一两年前才开始发生,但我认为这实际上相当令人兴奋,而且在人工智能领域可能讨论得不够多的是,当它足够易于访问时会发生什么,以及人类和人工智能的结合真正导致了

非常棒的事情。是的,就像这些歌曲一样,你可能想完整地听一下,因为它们听起来比任何东西都更有趣。是的,它们非常精彩。因此,有了这篇文章,非常感谢您收听本周的《天网今日》让我们聊聊人工智能播客。您可以在skynettoday.com上找到我们今天讨论的文章,并订阅我们的每周新闻通讯,其中包含类似的文章。

无论您在哪里收听播客,请订阅我们,如果您喜欢这个节目,请不要忘记给我们评分和评论。务必下周收听。务必下周收听。