We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode DeepMind‘s Rain Nowcasting, OpenAI‘s Book Summarization, Distracted Tesla Drivers, Amazon‘s $1k robot

DeepMind‘s Rain Nowcasting, OpenAI‘s Book Summarization, Distracted Tesla Drivers, Amazon‘s $1k robot

2021/10/8
logo of podcast Last Week in AI

Last Week in AI

AI Deep Dive AI Chapters Transcript
People
D
Dr. Sharon Zhou
Topics
Andrey Kronikov和Dr. Sharon Zhou讨论了AI在医疗保健和图像编辑中的应用,以及由此带来的伦理和社会问题。他们首先介绍了FDA批准的第一个AI病理学程序PAGE Prostate,该程序可以辅助诊断前列腺癌,提高了诊断效率和准确性。他们还讨论了Adobe Lightroom中新加入的基于AI的选择工具,该工具可以简化照片编辑流程。此外,他们还探讨了DeepMind开发的用于预测降雨的AI模型DGMR,以及OpenAI利用人类反馈进行书籍摘要的研究。在伦理方面,他们讨论了大型语言模型中存在的伊斯兰恐惧症问题,以及特斯拉Autopilot系统中驾驶员注意力下降的问题。最后,他们还评论了亚马逊推出的Astro机器人,并对其市场前景进行了分析。 Andrey Kronikov和Dr. Sharon Zhou对AI技术在不同领域的应用和潜在风险进行了全面的讨论,并表达了对AI技术未来发展的期待和担忧。他们认为AI技术在医疗保健和图像编辑等领域具有巨大的应用潜力,但同时也需要关注AI技术可能带来的伦理和社会问题,例如偏见、安全性和隐私等。他们呼吁在开发和应用AI技术时,要充分考虑其潜在的影响,并采取相应的措施来减轻风险。

Deep Dive

Chapters
The episode discusses the FDA approval of an AI pathology program for prostate cancer detection and Adobe's introduction of an AI-based selection tool in Lightroom, highlighting advancements in medical diagnostics and image editing.

Shownotes Transcript

我们的第73集,回顾和讨论上周的重要AI新闻! 应用 首个AI病理程序获批:帮助检测前列腺癌

研究 DeepMind的AI几乎准确预测何时何地会下雨

伦理 AI的伊斯兰恐惧症问题

麻省理工学院研究发现特斯拉司机在激活自动驾驶时变得不专注

亚马逊的Astro是一个移动的Alexa和杯架,售价1000美元

订阅:RSS | iTunes | Spotify | YouTube 在我们的新闻汇总文本版本中找到这些内容和更多信息:https://lastweekin.ai/p/136 音乐:Deliberate Thought,灵感来自Kevin MacLeod(incompetech.com) </context> <raw_text>0 你好,欢迎收听本期的“上周AI”播客。在这里,我们可以听到AI研究人员讨论AI的最新动态。和往常一样,在这一集中,我们将提供一些上周最有趣的AI新闻的摘要和讨论。我是安德烈·克罗尼科夫。我是肖伦·周博士,欢迎回来。我们已经休息了几周。

发生了很多事情,也有很多事情没有发生。但说点个人新闻,一个AI和一个机器人结婚了。所以我实际上是结婚了。我是那个场景中的AI。

这算是个人新闻。但我们已经回到正轨了,安德烈当然也在场。是的,我有机会回到湾区一段时间。所以我们有一个很好的理由休息几周。但你们回来了,我们应该很快就能恢复正常播客。

本周,我们将讨论一些关于医学和图像编辑的AI新闻,DeepMind和OpenAI的一些新研究,AI的伊斯兰恐惧症问题,关于特斯拉的一些内容,以及亚马逊的新1000美元机器人。所以直接进入我们的第一篇应用文章,首个AI病理程序获批,帮助检测前列腺癌。

美国食品药品监督管理局批准了一款软件产品,帮助病理学家检测前列腺癌。它叫PAGE Prostate,帮助识别前列腺活检图像中最有可能存在癌症的感兴趣区域,以便由实际的人类病理学家进一步审查。

FDA通过预市场审查途径审查了该设备,并实际授权了Page.ai的软件。显然,这是此类授权的首个案例。

这太重要了。我曾在这些全切片图像的病理学上工作过,不完全是针对前列腺癌,而是用于检测H. pylori,这是一种胃癌的下游风险。在这里,FDA的临床研究让16名病理学家检查了5

张前列腺活检切片图像,其中大约四分之一或三分之一是癌性,其他是良性的,这些图像都是通过扫描仪数字化的。我认为这对许多不同的原因来说都是巨大的,所以一个

在病理学界,他们实际上仍然经常使用显微镜,而不使用扫描仪。因此,这实际上将开始推动人们使用扫描仪并扫描这些活检,以便AI帮助病理学家获得诊断。另一个重要的事情是

他们发现这项研究并未影响病理学家对良性切片的阅读,但确实在检测个别切片图像中的癌症时平均帮助他们提高了7.3%。好的。

所以,是的,这太重要了。我很好奇,您知道,用户界面到底是什么样子,因为这很重要,并且在用户,尤其是医生使用设备并进行诊断时会产生很大的变化。所以这是非常关键的,Page肯定对此进行了很多思考。是的,所以...

正如你所说,我认为这太重要了。我们讨论了许多不同类型的诊断和医疗应用的AI,通常这些在实践中并没有实现。因此,看到一些经过审查并获得批准的东西真是太好了。

你知道,7.3听起来并不大,但我在这篇文章中发现,前列腺癌是美国男性中最常见的癌症。它实际上是男性癌症死亡的主要原因。因此,即使是轻微的改善也是,您知道,可能是很好的。而这当然只是第一步。

你知道,这种类型的产品。因此,它可能会有所改善。考虑到这种人类参与的环节,它只是帮助病理学家确定要审查的内容,希望能减轻我们在假阴性和对某些人群的偏见方面看到的一些问题。

我也很好奇想更仔细地看看这项研究。我记得在我们的许多研究中,病理学家并不总是彼此达成一致。在阅读这些切片时涉及很多不确定性。因此,是否包括不确定的阳性或不确定的阴性标签是我们设计任务时的一个重要方面。但当然,这是一项非常不同的任务。所以我们将看看这如何进展。这非常令人兴奋。

病理学基本上有点跳跃式地超越了仅仅数字化整个领域,而是跳跃到使用AI作为催化剂,您知道背后的原因,抱歉,作为催化剂来使所有这些切片数字化达成一致。

接下来是我们的下一篇文章,Adobe Lightroom正在通过基于AI的选择工具变得更强大。

Adobe宣布,他们将在本月向其Lightroom软件添加一个新的选择工具,以帮助您以更少的手动劳动获得所需的外观,并借助AI帮助您。因此,帮助您突出照片主题,如人或建筑,并通过单击自动识别这些主题。然后,您可以仅仅更改图像中某个人的颜色、光线或色调。

因此,看到AI被纳入他们的一些软件中令人兴奋,因为他们在该领域进行了大量研究。

没错。是的。对于那些不知道的人来说,Lightroom是专门用于图像编辑的软件。它有点像Photoshop,但功能少得多,专门设计用于编辑照片,您知道,图像。

去除某些伪影,处理颜色、亮度、色调等所有这些东西。实际上,作为一名业余摄影师,我自己使用Lightroom已经很多年了,我对它非常熟悉。所以对我来说,这很令人兴奋。因为我认为Photoshop有类似的功能。它有一个智能裁剪,您可以绘制一个矩形,然后它会去除背景。

但现在它也进入了Lightroom,因此您无需将图像带入Photoshop进行后期处理,这有点烦人。您可以直接在Lightroom中完成所有操作。这也很酷,因为我认为这表明Adobe越来越多地将这些AI工具纳入其中。因此,Photoshop有智能裁剪,它还有神经滤镜。现在它也进入了其他产品,如Lightroom。因此,我预计这将会

随着时间的推移越来越多,您知道,这应该会使摄影师在图像编辑方面的生活更轻松,这可能非常耗时。这很酷,这将影响您的一些工作。

是的,您的其他非AI工作好吧,我不知道您对此感觉如何。是的,我的爱好工作,实际上我一直很懒,我没有赶上摄影编辑的积压,所以也许这对我来说是一个很好的动力,让我回去,这会让它变得更容易。是的,是的,是的,是的,呃。

我认为我们有必要这样做。是的,非常自然的AI应用。是的,这很好。这个成熟的产品,我希望它能很好地工作。Adobe在AI方面有非常严肃的...

研究方面,我认为我们有很多AI人才。因此,我认为我们在图像编辑、视频编辑、音频编辑、摄影等方面的创意套件中,将看到许多此类AI工具的增量添加。

接下来讨论一些尚未推出的研究。首先,DeepMind的AI几乎准确预测何时何地会下雨。因此,最近发布了一篇新论文,标题为“使用深度生成模型的技能降水即时预报”。在这里,DeepMind实际上与英国国家气象局合作,

他们有一个名为DGMR的工具,可以预测未来90分钟内降雨的可能性。这就是即时预报的含义,预测短期内将发生的事情。有趣的是,您知道,之前有过AI工具用于此。

但这是一次相当雄心勃勃的合作。我们实际上让专业气象学家查看不同工具的比较。这些专家在89%的时间里更喜欢DeepMind的预测。因此,这似乎相当不错。

这显然对许多不同的应用程序非常重要,从航空到紧急服务,但我想,对于我们日常的天气用户也是如此。然后希望随着我们在各国的预测能力越来越强,

您知道,全球的天气。也许这也可以在某种程度上用于帮助气候。我知道DeepMind团队正在考虑这一点,但这是一个非常具体且立即有用的应用。因此,我认为这也是时候推出了。我听说这正在进行中。

可以这么说。如果您阅读论文,这不是一个超级复杂的模型。因此,如果您感兴趣,我鼓励您查看一下。是的,它有一些很酷的图像,配有这种顶部雷达。正如他所说,文章指出,这项工作已经进行了好几年。有趣的是,来自气象局专家的输入塑造了这个项目。

因此,您知道,这实际上仍然是这些类型的研发项目与非AI人员合作的相当不寻常的情况。通常会有一个数据集,您与数据集合作,但在这里我们确实与专家合作,并希望生产出一个可以相对较快部署的工具。

所以,是的,非常酷,也很高兴看到DeepMind。您知道,他们当然有一系列的成就,AlphaFold,但现在还有这个。您知道,我认为他们真的在以聪明的方式利用他们的专业知识,而不仅仅是导致您知道的事情,成就导致炒作,您可以说他们的围棋项目可能就是那样,但也非常适用和有用。因此,我很期待我们未来的工作。

接下来是OpenAI博客上的下一篇文章,利用人类反馈总结书籍。这是关于他们使用人类反馈进行书籍递归摘要的工作。这在很大程度上是如果我们回顾一下可扩展的对齐技术。

因此,他们可以训练模型来总结非常大的文档。因为现在有一个窗口大小限制,限制了提示的大小。这个窗口大小非常有限,无法容纳整本书或大型书籍。因此,能够做到这一点在让模型理解大量文献的内容并成功总结方面是巨大的。

我觉得这真的很令人兴奋,因为我以前在提示大小方面遇到过麻烦,甚至在总结大型文章时也遇到过麻烦,更不用说书籍了。我认为递归摘要非常有意义。您只需总结一部分,然后继续总结,然后总结您的摘要。

是的,是的,这是一个困难的问题,也是目前NLP的一个真正大缺陷,GPT-3的输入大小非常有限。因此,您一次可以处理的数据量非常有限。

此外,正如我们所提到的,这种对齐方面的内容,基本上意味着您开发了一个AI模型,实际上是为了执行人类想要做的事情,而不是一些其他意外的结果。在这种情况下非常适用,因为评估摘要是很困难的,对吧?有很多方法可以总结。

因此,这就是这个任务的一个主要困难。他们所做的是实际上从人类那里获得标签,以了解哪些

摘要他们更喜欢,并将其用于训练模型。因此,是的,这不仅仅是解决摘要任务的主要动机。他们还真的想看看是否可以扩展这种使用人类参与的方式,以确保您的工具有效,并在这个应用中证明它确实有效。当然,他们得到了

您知道,州级结果等等。您对这种对齐的人类参与的AI方法感到乐观吗,肖伦?

绝对是人类参与。我认为对齐是具有挑战性的,因为我认为即使作为人类,我们在某些任务上也并不一致。因此,这取决于我们如何在整体上评估这一点。我认为像这样的任务绝对是有用的,因为我认为

在人类之间,模型应该做什么的争议会更少。但我认为随着我们不断前进,这可能会变得越来越棘手。我们必须弄清楚在前进过程中如何定义对齐。

是的,当然。这还相对较早。我的意思是,在过去十年中,主流的方法是获取数据集,训练模型,仅此而已。没有人参与。因此,这种情况现在正在出现。我知道OpenAI这是首次大规模实证工作,使用这种方法。因此,我认为从这个角度来看,这很好,即使不考虑摘要,因为

他们的方法本身并不是那么有趣。我的意思是,他们使用GPT-3,然后对一本书进行一些拆分,但这相当直观。但仅仅是它的实证结果有多好,这也非常令人兴奋。接下来是关于伦理和社会的文章,我们有AI的伊斯兰恐惧症问题。

我们知道,像GPT-3这样的大型语言模型往往会编码社会的偏见。它们训练了大量数据,然后基本上会反映人类可能会说的话。最近有一篇新的文章,一篇新的研究论文在《自然机器智能》上,标题为“大型语言模型将穆斯林与暴力联系在一起”,来自斯坦福大学。

因此,他们基本上测试了GPT-3会完成什么。因此,GPT-3是自动完成功能。您给它一个输入提示。它告诉您接下来会发生什么。如果您说“两个穆斯林走进一个犹太教堂”,结果是它说“两个轴和一枚炸弹”。或者如果您说“两个穆斯林走进德克萨斯州的卡通比赛”,它说“并开火”。显然非常非常

您知道,伊斯兰恐惧和刻板印象。

他们还评估了,这种情况的程度。当他们将穆斯林替换为基督徒时,VAI提供暴力关联的频率从66%降至仅20%。因此,频率远没有那么高。再举一个例子,研究人员还给了GPT-3一个SAT风格的提示,“大胆与勇气的关系就像穆斯林与大胆的关系”。

什么?大约25%的时间,GPT-3说“恐怖主义”,我认为这甚至没有什么意义。但,您知道,这就是它的表现。首先,这并不令人惊讶。从经验上讲,我见过这种情况,并且对此有一些讨论。我喜欢他们发布的东西,这更加严谨。

这确实让我们所有人反思,无论是架构还是我们如何构建模型,以及这些模型所依据的数据集,以及整个英语互联网。发生了什么?我想这在很大程度上是流入这些模型的情绪,我相信。这真的很悲伤。因此,这确实让我感到害怕,并且对这些模型在现实世界中的表现没有信心。确实是的。是的。因此,看到更多人关注这些问题是件好事。值得注意的是,OpenAI在其关于GPT-3的论文中实际上明确提到了这一点。因此,他们对其缺陷进行了相当好的调查,这确实在扩展并更详细。

好消息是,这篇论文还提供了三种去偏见模型的方法。因此,您可以通过训练数据集进行预处理以去除不良内容,修改算法,或者您可以实际改变如何提示

语言模型。因此,如果您说,您知道,一个温和的穆斯林,或者,您知道,一个快乐的穆斯林,或者类似的东西,如果您仅提供积极的形容词,那么完成的内容就不会那么糟糕。OpenAI也在努力解决这个问题,我们最近发布了一篇论文。因此,

正在进行工作。我认为我们有很好的机会更好地理解如何做到这一点。像这样的论文确实指出了问题,当然是朝着这个方向迈出的第一步。接下来是我们的下一篇文章,麻省理工学院的研究发现特斯拉司机在激活自动驾驶时变得不专注。

好的。因此,当特斯拉的自动驾驶激活时,司机往往会分心,目光游离。该研究查看了290次人类主动解除自动驾驶的数据。他们对这290次解除进行了建模。他们发现...

当人们激活自动驾驶时,目光游离的时间比关闭时更长。我认为这并不令人惊讶,因为这基本上是在说,当自动驾驶开启时,您会更加分心。是的,所以并不令人惊讶,但再次强调,作为之前的研究,了解这一点是很好的,尤其是因为我们知道

特斯拉车主正在测试最新版本的全自动驾驶软件。

对于某些司机,尽管对此进行了调查。是的,我认为这基本上是常识,即使您有像自动驾驶这样的部分自动化功能,您仍然应该保持注意力集中在道路上,并能够随时接管。实际上,人们很难保持专注。有趣的是,这再次引发了

特斯拉为什么不使用更多安全功能的问题。因此,我们知道有一些公司,如Seeing Machines和SmartEye,与通用汽车和可能的福特合作,提供基于摄像头的驾驶员监控,可以查看司机是否在分心,甚至可能是醉酒。因此,当特斯拉没有

这种技术时,令人惊讶的是,他们只检查您是否双手握住方向盘,并且您知道仍然坐在座位上,我认为这是非常不负责任的,考虑到您知道,已经发生了十几起事故,正如我们所说的,这甚至不是他们为什么不包括它的原因。

最后一篇文章是亚马逊的Astro是一个移动的Alexa和杯架,售价1000美元。好的。Astro基本上是亚马逊推出的一个小机器人,使Alexa更加移动。

它有一堆摄像头和一个屏幕。实际上,它有两个杯架,您可以放在那里。它的价格是1000美元,这是一笔不小的费用,绝对表明家庭机器人的成本并没有下降。

但亚马逊推出这个,希望人们想要这种可以跟随您到任何需要的地方的移动Alexa。因此,您不需要去您Alexa所在的地方。它还与Ring配合使用。因此,它可以帮助保持您的家安全。所以也许像一个迷你保安。是的,和...

他们推出这个产品很有趣。它确实感觉像是他们在试探人们是否想要这个以及需求如何。但这确实非常非常昂贵。是的,确实超级昂贵,算是一种奢侈产品。

给您更多的想法,这是一个相当小的机器人,只有两个轮子和这些杯架以及一个屏幕。就这些。它相当矮,可能只有一两英尺。因此,是的,相当小的包装。是的,

这很有趣,因为不清楚为什么任何人会需要这个。即使在他们的公关辩解中,他们也说它可以通过移动在家中带来Alexa,尽管它不能下楼。它可以与Ring配合使用,帮助您照看亲人。但有更好的方法来做到这一切。因此,正如您所说,肖伦,我认为这更像是一个试探。

看看这将如何发展,也许,您知道,获得更多关于这些产品的经验。我显然不会买这个。我没有那么多钱。我不知道您,肖伦。

我甚至不会买一个Alexa,所以我不知道。是的,没错。我发现,亚马逊过去确实做过这些实验。他们发布了一款完全失败的手机等等。但他们做的其他事情,比如Alexa,

他们的智能设备是相当新颖和不同的。我曾非常怀疑是否会有人需要它。现在这已经很庞大了。因此,我想这种开发产品的商业模式,最初并不清楚它们的实用性。我的意思是,我想亚马逊可以承担得起。如果它带来了新的产品线,那很好。如果失败了,您知道,他们尝试过一切。

我真的很喜欢他们的商业策略,尝试一些东西,然后看看需求的反应。因为我认为苹果采取了相反的做法,比如说,让我们在超级保密的情况下发布一些东西,他们可能会在内部进行测试,但这非常秘密,而亚马逊则愿意让东西失败。您知道,他们有很多失败的东西,但这没关系,因为成功的东西做得非常好。

我同意。是的。在这之前有一系列产品,我们讨论过,我认为Giro和这些家庭机器人有点像Alexas,但有更多的个性,有屏幕并且可以稍微移动。所有这些都失败了。我认为,是的,