厌倦了不断听到关于 COVID-19 的消息?斯坦福人工智能实验室的博士生 Andrey Kurenkov 和 Sharon Zhou 也一样,他们本周主要讨论的并非与病毒相关的新闻……但也有一些与病毒相关的新闻。 查看此处讨论的所有新闻以及更多内容,请访问 www.skynettoday.com 主题:深思熟虑 Kevin MacLeod (incompetech.com) 根据知识共享许可协议授权:署名 3.0 许可协议 </context> <raw_text>0 您好,欢迎收听 Skana Today 的 Let's Talk AI 播客,在这里您可以听到人工智能研究人员对人工智能实际情况以及哪些只是耸人听闻的标题的看法。本周,我们将关注一些与 COVID-19 无关的人工智能新闻和故事,这与我们之前的几期节目不同。然后,您猜对了,我们将会有更多关于 COVID-19 和人工智能的新闻。
您可以在 scannettoday.com 上找到我们今天讨论的文章,并订阅我们每周的类似新闻通讯。
我是 Andrey Karenkov,斯坦福视觉学习实验室三年级的博士生。我主要专注于机器人操作的学习算法。和我一起的是我的联合主持人。我是 Sharon,机器学习小组的三年级博士生,与 Andrew Ng 合作。我的工作是生成模型,改进神经网络的泛化能力,并将机器学习应用于应对气候危机。
好的。Sharon,我很好奇。你是否厌倦了我一直在思考和谈论 COVID-19?
所以,我肯定已经适应了新的常态,我会这么说,尽管我的实验室一直在积极开展 COVID-19 项目。我的导师 Andrew 和我,以及斯坦福医学院的一些人,最近发表了一篇文章,详细介绍了在应对疫情方面取得成功的国家与我们目前的差距。
所以你在写这篇文章的时候,你多少有点考虑过这个问题,我明白了。只是一点点,你知道的。只是足够写出来,仅此而已。只是每晚,但这没关系。
就半天。是的,是的。我很幸运,我的研究与健康无关。只是让机器人四处移动东西,不会太糟糕。所以我正试图回到研究中,并将其作为我的主要关注点。但当然,很难逃避我们所处现实的困境。
这实际上是对你能够避免 Twitter 的程度的考验,我相信。这是很大一部分。事实证明,我不太擅长避免 Twitter。但我想就目前而言,本期节目的希望是我们可以稍微避免 COVID-19,而是讨论一些其他实际上非常有趣和酷的人工智能新闻,并谈论自……以来一直在发生的一些更大的趋势。
自从这一切开始之前,并且会在之后继续发生。首先,我们有一篇文章标题为“科学家开发出能够将大脑活动转化为文本的人工智能”。它涵盖了来自加州大学旧金山分校的 Joseph G.
Macon 及其同事的工作。他们在《自然神经科学》杂志上发表了一篇题为“使用编码器-解码器框架将皮质活动机器翻译成文本”的论文。所以基本上,它是在说你可以记录一些脑电波
皮质活动是你的脑电波,并将其转换成文本。所以这有点像读心术,但正如你将要讨论的那样,根本不是那样。从高层次来看,它的工作方式是通过跟踪四名志愿者的神经数据来开发的,这些志愿者的脑中植入了电极阵列
在他们说话时监测癫痫发作。因此,他们将用于检测癫痫发作的传感器重新用于尝试收集数据,然后学习将来自这些脑电波映射到他们所说的内容。
所以现在,该系统目前适用于在某人大声说话时检测到的神经模式。所以你必须已经大声说话了,但它并没有捕捉到你口中发出的实际语音。相反,它是你在说话时正在发生的神经模式。呃,
专家表示,它最终可以帮助那些无法说话或打字的患者进行交流,例如患有闭锁综合征的患者,这意味着患者可能处于植物人状态,无法交流,但仍然有意识。因此,研究中的参与者被要求多次大声朗读 50 个设定好的句子,同时跟踪神经数据。这些参与者回应
大声朗读来自两个不同数据集之一的句子。一个是图片描述集,30 个句子,大约 125 个独特的单词,只是为了让您了解这个集合的局限性。是的,然后收集到的数据被输入到一个机器学习算法中,该算法将每个口语句子的脑活动数据转换为一串数字。
然后为了确保这些数字只与语音的各个方面相关,系统比较了从城市活动的小块中预测的声音。是的。与实际录制的音频。呃,然后将大量的数字串输入到系统的第二部分,然后将其转换为单词。他们使用了。
现代尖端人工智能的几种构建块来构建这个完整的管道,从脑电波到实际文本。这串数字本质上是编码器-解码器网络中编码的一部分。将其视为嵌入,例如在其他神经网络中。所以这部分并不新颖,但这里新颖的是数据和准备工作。
至于一些结果,该系统从输出完全无意义的内容改进到实际学习该数字串如何与单词对应,这非常令人兴奋,因为从概率上讲,如果只有 50 个句子,那么随机概率选择正确句子的几率为 2%。
是的,所以它在某种程度上能够工作,这非常有趣和酷。特别是,有趣的是,这里的训练和测试是在同一组句子上进行的。
这可能意味着该系统学习了一些琐碎的东西。它只是学习了,给定脑电波来确定它训练过的句子中,这个人说了哪个句子,而不是实际从脑电波中识别每个单词。但实际上有一些线索表明它并没有这样做。其中一个就是它犯的错误。所以它,它,
有时会犯一些非常有趣的错误,例如,当有人说那些音乐家和谐地演奏得妙不可言时,系统将其解码为菠菜是一位著名的歌手,这非常不同,但你确实有音乐家与歌手的这种关联,然后另一个错误是有一卷电线放在墙边
变成了,罗宾会戴黄百合吗?几乎有点荒谬,不太清楚它是如何发生的,但这确实意味着没有一个简单的解决方案。所以,如果我错了,请纠正我,Andrey,但本质上,模型解码的句子实际上并不在训练集中。所以这里没有发生信息检索搜索问题。
是的,没错。这些荒谬的句子不在训练集中。这个人说的是合理的事情。所以,虽然输入在训练集中,但输出不在。因此,系统并非每次都输出训练集中的内容这一事实意味着它正在尝试泛化到某种程度。
有趣的是,该系统的准确性能够超过以前的一些方法。虽然准确性因人而异,因为该系统是在每个人身上单独训练的,但对于一名参与者来说,平均每个句子只有 3% 需要进行一些更正。这实际上非常低。系统会正确地理解大部分句子,例如 97% 的句子,对吧?
会正确理解。这高于专业人工转录员 5% 的单词错误率。这非常有趣。与人工错误率相比,对于这一个特定的参与者来说,实际上更低。
但研究小组强调,与后者不同,人工转录员,该算法只处理数量非常少的句子,而人类,我们可以处理非常大的语料库。特别是转录员可能可以处理比我更大的语料库。
确实,是的。为了扩展这些警告和结论,它看起来非常酷。你已经可以想象关于人工智能如何读懂你的思想等等的耸人听闻的标题了。但这里有很多需要注意的地方。首先,当你超出它训练的 50 个句子时,系统会变得更糟。所以它在根据脑电波找出它已经看到的句子方面做得很好,但是当你尝试新的东西时,它就不太好了。这意味着该系统可能依赖于学习特定句子(例如仅仅记住句子)、从脑活动中识别单个单词以及识别所有这些内容的一般模式的组合。
因此,研究人员在论文中指出,尽管我们希望解码器能够学习并利用语言的规律性,但仍需证明需要多少数据才能将我们的微型语言扩展到更通用的英语形式。对于每个人来说,只有 50 个句子是不够学习一般性东西的。它足以展示一种概念证明,这正是它的目的。
但这种方法略微有希望的是,它比以前的方法使用的数据更少。它为每个参与者使用了不到 40 分钟的训练数据,以及有限的句子集合,这既是这里的局限性,也是一个优势。
这与类似系统通常需要的数百万小时相比。但远非巨大的重大突破,远非所谓的“读懂我们的思想”,让我们记住,该系统仍然是在有人大声说话时训练的脑电波。所以,虽然这是一项很棒的研究,但另一位研究人员指出,
好的,谷歌也可以做得一样好。你可以在这里使用像谷歌、Siri 或 Alexa 这样的语音系统,效果会一样好或更好。没错。这是一个很好的例子,说明你如何能够获得非常酷的研究成果,非常酷的人工智能结果。我认为我们可以同意这实际上非常酷。到目前为止,我还没有见过类似的东西。但它也不是什么改变世界的大事件。这是朝着……方向迈出的一小步。
在这个方向上,还需要做大量的工作,撰写更多论文,收集更多数据,进行更多工程设计,才能最终得到一个有用的系统来帮助那些可以使用这种东西的人。但就目前而言,我们只看到一种轻微的科学进步,这就是研究真正取得进步的方式。是的,这也表明也许
这是一篇《卫报》的文章,标题再次是“科学家开发出能够将大脑活动转化为文本的人工智能”。文章标题有点夸张。这不仅仅是你没有说话时的普通脑活动。而是在你实际大声说话的时候。
大声说话。是的,这是媒体报道人工智能(例如《卫报》)的常见现象。通常,文章的内容相当可靠,它们确实指出了警告,并且确实得到了正确的细节,但标题确实倾向于更令人兴奋的方面,并隐藏了使其不那么令人兴奋的更实际的事情。是的。
所以每当你看到一个很酷的标题时,都要记住这一点。仅仅看到标题是不够的。你需要阅读文章的内容才能真正了解发生了什么。
在这种情况下,这篇文章很好地阐述了细节。但当然,有时你必须一直读到论文才能真正了解这些细节是什么,以及哪些被夸大了或没有被夸大。或者希望你会收听我们在这个播客上的节目。希望这就是我们在这里阐述所有警告和您应该知道的事情的原因。说到需要警告并且不应该被夸大的事情,我们的下一篇文章是
标题为“即使拥有大量数据,人工智能也无法预测孩子的未来”。它来自《技术评论》。它讲述了一篇新论文,一篇发表在《美国国家科学院院刊》上的新研究,基本上阐述了即使大量研究人员都试图预测儿童的生活结果,
许多人使用从 15 年收集的数据中获得的许多不同的输入,所有尝试的模型都没有真正奏效。所以背景是,存在这样一种假设,即与人类或更基本的统计分析相比,向给定情况提供足够数据的算法将做出更准确的预测。所以这项研究是
由普林斯顿大学的三位社会学家提出的,他们要求数百名研究人员(约 160 个不同的研究团队)建立预测模型,以预测儿童、父母和家庭的六种生活结果,使用超过 4000 个家庭的近 13000 个数据点。
因此,无论他们使用简单的统计数据还是尖端机器学习,没有一个研究人员能够达到合理的准确性水平。是的。是的。实际上,这篇论文的标题是“通过科学大众合作测量生活结果的可预测性”。它大约有 50 位或可能更多合著者,并且有 160 个团队参与构建这些预测模型。所以是的,
它确实表明,如果你有很多科学家,你可以尝试很多不同的方法,并得出一些事情不可行或不如我们想象的那么可行的有力结论,这是他们在这里的主要论点,即同时有这么多人尝试这件事是有用的。
不过,我在这里要评论一下,鉴于人们生活的多样性,数万个数据点实际上相当少。所以需要进行此预测任务的数据方差。所以我对这些模型无法做到这一点并不感到非常惊讶。是的,这是真的。我认为数据点是……
部分地,这表明了它的多样性或数量。但与此同时,正如我们所知,对于现代尖端机器学习来说,它需要大量数据才能真正泛化到训练集之外。在这种情况下,可能不够。说到数据,我们实际上可以深入了解一下这是什么。
所以我们使用来自一项 15 年前的社会学研究的数据,名为“脆弱家庭和儿童福祉研究”,该研究由普林斯顿大学社会学和公共事务教授、这篇论文的主要作者之一 Sarah McCallaghan 领导。所以这篇最初收集数据的论文试图了解未婚父母所生孩子的未来生活,以及拥有未婚父母如何影响他们。
收集这些数据的方式是,在 200 年期间,从大城市医院出生的儿童中随机选择家庭。然后在孩子们 1 岁、3 岁、5 岁、9 岁和 15 岁时,从这些家庭收集数据。
这项数据需要相当大的 IRB 审查。是的,我必须想象,这需要付出相当大的努力才能进行 15 年的数据收集工作,涉及许多家庭和许多孩子。所以即使数据不多,它也是实际上很难获得的数据。是的,它是敏感数据。普林斯顿大学的社会学教授说,
她和她的同事们随后设计了一项挑战,以众包对这项研究最终阶段的六个结果的预测,他们认为这些结果在社会学上非常非常重要。因此,这六个结果包括孩子在学校的平均成绩、他们所谓的“毅力”或他们在学校的自述毅力以及他们家庭的整体贫困程度。
然后,给定这些结果,挑战参与者获得了数据子集来训练他们的算法,组织者保留了一些数据用于评估,以查看这些算法能够多好地泛化并为在训练数据中没有看到的人做出新的预测。然后在五个月的时间里,数百名研究人员,包括计算机科学家、统计学家、计算社会学家,
尽力做出预测。他们有相当长的时间来使用所有这些数据来开发一个好的模型。
文章指出的一点是,最复杂的机器学习技术也比简单得多的方法准确性高不了多少。并且可解释的算法通常与深度学习等黑盒技术具有几乎相同的预测能力,在算法评估风险或选择资源分配方向的上下文中。
在黑盒技术的额外好处不值得可解释算法中可解释性的大成本的地方。是的,我认为……
这是一个结论,除了这个结论之外,就是用这么多的数据是做不到的。虽然我们确实注意到,有了更多的数据,你可能会得到更好的结果,但这对于政策制定者来说是一个有用的信息,如果你想预测一些非常复杂的事情,比如 GPA 或其他结果……
即使有了这个经过精心控制的数据收集(可能是因为收集的数据量或模型,或者两者兼而有之),结果也不是很好。因此,鉴于这项尝试是多么困难和多么不成功,政策制定者应该非常小心,不要过分强调采用人工智能技术来预测各种结果。
对。但即使人工智能在这项任务上并不成功,人工智能擅长的是。在我们的下一篇文章中,一篇题为“势不可挡的人工智能飞轮和新巨头的诞生”的博客文章。是的,这篇有点诗意。非常,非常诗意。这是由 Della Perrault 撰写的,他是 AI 基金会的研发副总裁。
它专注于检测深度伪造和一般的人工内容,包括语音、语言和视觉。从高层次来看,Dell Up 详细说明了人工智能为所有级别的无情优化创建了引擎。
他之前曾评论过人工智能将渗透到我们现在所知道的一切中。无论我们在哪里做出决定,例如使用特定的启发式方法或设置常量的值,学习模型都发挥着作用。他建议,从高层次来看,我们将深入探讨的例子,他在本文中详细介绍了这些例子,
表明像谷歌这样拥有大量资金和计算能力的大型公司将能够增加其相对于其他公司的优势,以及在人工智能飞轮、人工智能正反馈循环中发展壮大,从而提高计算能力、提高数据中心优化能力,从而提高内容质量。
创造了这些大型、庞大、大型科技公司。是的。所以这是有点高层次的。所以让我们深入了解更具体的细节。例如,所有级别的这种优化几乎意味着,只要你可以获得数据并将其提供给算法,你就可以优化你的任何运营流程的任何部分。
几年前的一个例子是 DeepMind 如何使用机器学习将数据中心的功耗至少优化了 40%。这意味着谷歌和其他大型公司可以不断构建越来越复杂的数据中心并优化数据使用,因此对他们来说实际上不会花费更多。另一个例子是谷歌如何
使用机器学习来优化大型神经网络、多个 GPU 和其他计算资源的放置,这意味着他们在训练大规模人工智能模型方面比小型参与者拥有更大的优势。这真的很令人感兴趣。我知道数据中心背后的一些人
优化、电力优化工作。它实际上对气候相关活动也很重要,这就是我做的一些研究。如果他们能够优化他们的数据中心,他们也可以使用更少的电力,因此成为更小的能源消费者。谷歌肯定有这个……
激励措施,因为他们也是大型能源资源所有者,目前正在为他们自己的数据中心和计算提供动力。所以他们试图为此进行优化肯定是有道理的。是的,当然,在某种程度上,这不仅对谷歌有利,对所有人都有利,因为他们可以使用更少的能源。本文中引用的另一个例子是
最近发布的一篇论文,名为“学习型寿命感知内存分配器”,它基本上是关于如何在计算机中、在生产服务器中更好地分配内存,以便你拥有更快的内存访问速度。所以直觉上,如果你优化了内存分配,你可能会期望互联网运行得更快。
这些各种例子的高层次观点是,你可以将机器学习用于
在我们过去只是手工实现事物的各个部分,无论是数据中心能源优化,还是计算机内存分配,我们都可以从系统中实际发生的事情中学习,并进行优化,使其比我们手工所能做的更好。虽然这在减少能源消耗和加快计算速度方面有很多好处,但它也有缺点,即
对于已经拥有大量基础设施的大公司来说,这样做更容易,因此这给了他们更大的优势。说到巨头、大型科技公司的优势,我们下一篇文章或博客文章来自《梯度》,标题为“迈向语音转文本的 ImageNet 时刻”。因此,语音转文本技术在过去十年中取得了很大进展,但它
人们认为只有谷歌、Facebook 和百度等大型公司才能提供可部署的解决方案。几个原因包括通常在论文中使用的计算要求很高,这人为地提高了进入壁垒。因此,普通研究人员很难真正参与进来。
参与其中并改进这些模型,甚至验证这些模型。其次,由于词汇量、说话者和压缩伪影的多样性,语音需要大量数据。因此,当前可公开获得的现有数据集并没有那么多样化。
最后,还有一种心态,即放弃实用的解决方案,而采用不切实际但最先进的解决方案,正如文章所述。这篇文章的作者继续进行了一个项目,试图减轻其中一些担忧。
是的,所以他们在本文中描述了这个项目。为了更具体一些,语音转文本是指当你对 Siri 说话时,当你对好的谷歌说话时,这些系统会听到你说的话,然后将其翻译成文本,然后可以回应你。所以所有这些系统,比如 Siri……对不起,我不确定如何帮助你,但我每天都在学习更多。好的,太好了。这应该完全融入其中。好的。
另外,为什么你的 Siri 是个男人?我不知道。我喜欢那个声音。在我被打断之前,我说的是谷歌和 Facebook 以及所有这些大公司的这些系统。这些系统是专有的。所以用来训练它们的数据。用来训练它们的算法。
我们也没有公开发布,无论是作为开源代码和数据,还是作为论文。虽然我们知道其中涉及的一些部分,但我们不知道全部细节,这确实损害了小型实验室、小型从业者进入该领域的能力。因此,本文或作者在这里
概述了他们为尝试使其更容易并使整个领域朝着并非只有这些大公司能够在这里做事情的方向发展而采取的一些步骤。因此,做出的三个主要贡献是:一、引入了多样化的 20,000 小时开放式 STT 数据集,该数据集是在知识共享非商业许可下发布的。因此,世界各地的研究人员都可以使用它。呃,
第二,它证明了仅使用两台消费级且广泛使用的 GPU 就可以获得具有竞争力的结果。这些是来自 NVIDIA 的 1080Ti。第三,它提供了大量的设计模式,使各种研究人员和从业者(不一定是世界上的谷歌、Facebook 和百度)更容易进入语音领域。
是的。所以回到第一个关于大型数据集的观点,“迈向语音转文本的 ImageNet 时刻”这个标题指的是 ImageNet 数据集,这是一个非常大的图像数据集,经常用于计算机视觉,并且使许多任务更容易完成,计算量更少,数据更少。因此,他们在某种程度上做出的主要贡献是,他们注意到现有的学术数据集
有很多缺点。它们太干净了,听起来像是来自录音棚,它们过于关注一个领域,例如只是电话交谈或新闻,它们主要使用英语,而且它们太小了,无法做任何令人印象深刻的事情。因此,由于这些缺点,大约六个月前,这些作者决定收集和共享一个史无前例的俄语口语语料库。我们将
首先的目标是 10,000 小时,这比任何其他此类开放数据集都要大。
所以这个数据集本质上解决的是现有的学术数据集如何存在缺点,例如过于理想。它们太干净了。它们是在录音棚里录制的。没有背景噪音。它们的领域太窄了。它们只关注特定的一组,比如说,词汇或句子类型或说话者的类型、特定人群说话的类型。
而且它们也大多是英语。是的。所以他们收集了这个大型数据集作为回应。他们还在本文中描述了他们如何着手尝试不同的 AI 技术并进行大量实验。
最终,他们能够在数量上获得与已发表的研究相当的良好性能,但这需要更少的计算硬件,这也是大公司拥有更大优势的另一种方式。
所以这篇博客文章的有趣之处在于,它在某种程度上突出了人工智能一直在民主化的过程中。基本上,任何掌握一些编程知识的人都可以自学最新的尖端人工智能理念,实现一些代码并尝试一些想法。另一方面,人工智能的一些子领域,例如语音转文本,
仍然使拥有大量计算资源和数据访问权限的学术团体更容易取得进展,而学术界或行业以外的从业者实际上无法参与其中。因此,这是一项努力,试图改变这种情况,并让我们朝着一个大实验室和行业能够
并非唯一能够取得任何进展的地方前进。本着使人工智能民主化的精神,我们想用对斯坦福大学教授 Chelsea Finn 的采访来结束我们的一系列与 COVID-19 无关的文章,标题为“人工智能女性,我当然感觉自己是一个少数群体”。
作为人工智能女性特别项目的一部分,《中型》出版物 Synced 与斯坦福大学计算机科学与电气工程助理教授 Chelsea Finn 进行了交谈,Andrey 和我都认识她。她的大部分工作都集中在机器人和其他智能体如何通过学习和互动来发展广泛的智能行为。
是的。所以这篇文章深入探讨了很多细节,我认为我们两个人以及任何从事人工智能工作的人都意识到了这一点,但这仍然值得强调,并确保我们正在努力取得进展。所以我们
这里的主要焦点是,女性在计算机科学和人工智能领域仍然严重缺乏代表性。如果你想要一些量化指标,Sync 的“人工智能女性”系列之前的分析发现,在 21 个最领先的人工智能会议中,只有 18% 的论文作者是女性。截至 2015 年,女性仅占美国计算机科学专业学生的 18%。
所以大约 50% 的人是女性,而只有 18% 的女性真正发表论文并在 AI 和 CS 领域获得学位。
我听说,高级教员的比例要糟糕得多,因为女性现在才在改善人才输送方面得到越来越多的关注。我认为切尔西在文章中给出的一个具有启发性的观点是,例如,在人工智能和机器学习会议上,
我当然觉得自己是少数群体,我知道有很多情况是我唯一一个女性,例如,在研讨会上发言或在一些活动上发言。
但她还说,她很高兴斯坦福大学还有许多其他女性计算机科学教师。因此,当她们培养下一代人工智能教师和人工智能研究人员时,她们拥有一个社区。是的,事实上,我认为斯坦福人工智能实验室的这一点非常好,在过去的几年里,我们已经
招聘了多名新的女性教师。切尔西去年加入了教师队伍,在此之前,我们有来自欧洲的机器人专家珍妮特·博格德。我们还有来自伯克利的 Dorsa Satig。因此,教师人数迅速增加,这肯定指引我们走向了一个良好的方向。
我认为斯坦福大学,特别是计算机科学系,非常重视多元化招聘。我对此印象非常深刻。我和其他机构的人聊过,他们根本就不是这样。
所以氛围非常不同。因此,当你故意尝试招募少数群体时,例如,这有望创造一个更好的环境,在那里存在这种社区。是的。切尔西还在采访中提到,她与“AI for All”等项目合作过,该项目旨在帮助年轻女性进入 AI 和 CS 领域。
而这个 AI4ALL 项目实际上是由我实验室的一位教授李飞飞发起,旨在真正尝试改变现状,让少数群体更容易进入该领域。因此,你越让女性和少数群体担任高级职位,情况就越容易改变,数字就越容易改善。所以至少很好的是……
我们可以补充一个积极的说明,那就是情况正在发生变化。如果我们都记住我们应该努力改进,它们就会改进。我肯定为“AI for All”做出了贡献,因为我最近还在一所高中做了一次演讲,这次演讲是由“AI for All”赞助的活动。所以他们的影响范围相当广,至少在我们这里是这样。
是的,这是一个值得注意的好事情。作为博士和研究人员,我们应该努力改善这种情况。但是现在,你可能一直在等待我们关于 COVID-19 和 AI 的每周更新,我们会尽量简短一些。我们这里的第一篇文章标题是《负责任地使用人工智能来对抗冠状病毒大流行》,来自 TechCrunch。
它基本上是在谈论,正如我们在之前的剧集中谈到的那样,许多人工智能应用程序正在被多个国家的各个机构使用。诸如疾病的监测、监控、检测之类的事情,每个人都试图非常迅速地做到。因此,这篇文章是关于联合国委员会的建议……
如何确保记住在构建 LGBTI 系统时要小心人权。
是的。他们特别指出,我们必须记住,人工智能的使用可能会引发非常真实和严重的人权问题,这些问题可能会造成损害并破坏社区对政府的信任。他们提出了关于负责任使用的几项建议
例如,数据匿名化。一些国家正在追踪个别疑似患者及其接触者,而其他国家则正在收集匿名数据以更一般的方式研究人员的流动。
他们还制定了目的限制,这基本上是确保收集和处理个人数据以追踪冠状病毒的传播,但不应将其用于其他目的。这与 GDPR 或欧盟的通用数据保护条例类似,这项政策已经存在一段时间了。但现在是时候将其变成人工智能的全球原则了。
是的。他们提到的其他一些事情是,跨国共享数据是个好主意,而不是囤积数据。最终,对于这些已建立的系统,如果它们是按时间限制建立的,那就太好了,这样它们不一定会继续存在。我们不会出现普遍存在的监控。
但除了讨论这些建议外,文章还指出,联合国区域间犯罪和司法研究所已在海牙建立了一个专门从事人工智能和机器人技术的中心。这是致力于专门研究人工智能与犯罪预防和控制、刑事司法以及法治与安全相关的国际行为者之一。
因此,该中心旨在帮助各个国家主管部门了解这些技术带来的机遇,同时应对与这些技术相关的潜在陷阱。它不只是一个专门针对 COVID-19 和人工智能的中心。它更广泛地关注人工智能。但在这一刻,许多人工智能系统正在非常迅速地部署,该中心比以往任何时候都更重要。
但话虽如此,人工智能确实发挥着有用的作用。这在上周斯坦福大学通过 Zoom 虚拟举行的会议上得到了详细说明,特别是斯坦福 HAI。会议的标题是……
人工智能与 COVID-19,技术如何理解、追踪和改善健康结果。因此,这次会议召集了大约 30 名人工智能研究人员和专家,通过虚拟方式会面,讨论人工智能可以帮助理解 COVID-19 并潜在地减轻疾病本身的方法。
和发展公共卫生危机。因此,我们讨论了这次会议的一些要点,我们上周确实简要地谈到了这一点,就这次会议而言,这是一次非常临时性的会议,他们从一个完全不同的主题转向了它,只是为了解决当前的问题。
是的。这次会议就在上周三举行,实际上是向公众开放的。我认为你可以在 YouTube 上收看。我自己也看了一点。会议的有趣之处以及总结它的文章(我们现在正在报道)是,有很多个别研究人员和项目被特别强调。
所以我们将快速地浏览它们,因为看到正在发生的事情很有趣。例如,陈·扎克伯格生物中心的传染病数据科学家露西·李说,她的组织正在开发一种工具来估计未报告的感染。然后在斯坦福大学,医学副教授尼加姆·沙阿和他的同事们正在磨练数据科学如何在操作上做出反应,例如,我们的地区将有多少患者,需要多少 ICU 病床,以及在临床上,这意味着我们应该测试哪些患者。他们还指出了进一步研究的关键领域,即哪些药物可以帮助我们。
在卡内基梅隆大学,统计学和机器学习副教授瑞安·蒂布希拉尼的流行病学预测团队已从研究流感转向 COVID-19,以预测短期预测,这将为公共卫生官员制定政策决策提供信息。
与此同时,斯坦福大学机械工程博士候选人蒂娜·怀特设计了一个开源应用程序,使用匿名蓝牙数据来追踪 COVID-19 的传播。
HAI 联席主任李飞飞的研究提供了一种人工智能方法,可以帮助老年人留在家里。例如,传感器和摄像头可以以安全和合乎道德的方式向临床医生发送有关睡眠或饮食模式的有价值的信息。
这次会议主要关于学术界,但不仅仅是学术界。因此,还讨论了 QRI 联合创始人泽维尔·马图里安如何讲述他的公司机器学习工具如何创建个性化的诊断评估。
然后来自 Kaggle 公司的 Anthony Goldblum 提供了一些描述,说明他们如何提供公共数据和挑战,让人们合作应对危机。还有一些工作是寻找治疗 COVID-19 的方法。
斯坦福大学遗传学医学博士和博士生陈斌斌(也是我的好朋友之一)说,疫苗是控制大流行和防止其复发的最有效方法之一。他的团队使用人工智能检查 COVID-19 蛋白的片段,以确定它们如何应用于潜在的疫苗。
斯坦福大学生物工程研究工程师斯特凡诺·伦齐正在使用自然语言处理、蛋白质结构预测和生物物理学来检查可以重新用于对抗这种疾病的现有药物,以识别潜在的药物。是的。所有这些加在一起都表明,除了监控之外,还有很多应用。人工智能有很多有前景的用途。当然,这些正在开发中。尽管如此,它们还不成熟,但是……
许多研究人员、许多学者、许多行业都在努力,希望人工智能能够发挥积极作用。如果你想了解更多信息,你可以搜索“以人为本的人工智能研究所”、“斯坦福大学”、“COVID-19”,并找到所有这些细节,甚至观看完整的会议记录。
非常感谢您收听本周的 Skynet Today 的 Let's Talk AI 播客。你可以在 SkynetToday.com 上找到我们今天讨论的文章,并订阅我们的每周通讯,其中包含类似的文章。无论你在哪里收听播客,请订阅我们,如果你喜欢这个节目,请不要忘记给我们评分。请务必下周收听。