Spain has a strong environment for startups and a growing AI industry, with many professionals in various engineering fields. It encourages engagement with AI talent from the country.
Gabriel's interest in AI began in 2012 with AlexNet, but he also noticed the potential of NVIDIA's GPUs for parallel computing in geospatial data processing as early as 2010.
Geospatial data, especially raster data like images or digital terrain models, requires significant computational power due to the large number of pixels and complex calculations, such as watershed analysis.
Esri has integrated various open-source AI frameworks into its platform, making it easier for geospatial practitioners to apply AI without needing to manage complex installations or data movement.
Gabriel's first major AI project involved using deep learning models to count people on beaches during the COVID-19 pandemic to manage crowd control and provide insights into beach usage patterns.
Gabriel works with aerial surveys, satellite imagery, LiDAR data, and traditional databases. His region, Cantabria, is covered by a national aerial survey plan every three years.
Gabriel highlights limitations in computing power and the inherent challenges of convolutional neural networks (CNNs), which may not always perform as expected, even with well-prepared data.
Gabriel combines model architectures, such as using ResNet as a feature extractor with UNET for segmentation, and also combines inference results from different models to overcome individual limitations.
Gabriel is excited about the potential of Zero Shot learning and the integration of AI models with large language models, which could make geospatial analysis more intuitive and accessible.
欢迎收听《实用人工智能》。
如果您从事人工智能工作,或者渴望从事人工智能工作,或者好奇人工智能相关技术如何改变世界,那么本节目就是为您准备的。感谢我们的合作伙伴 Fastly 以超快的速度将我们所有的播客发送到您收听的任何地方。请访问 Fastly.com 查看他们的信息。还要感谢我们在 Fly 的朋友们。将您的应用程序服务器和数据库部署到靠近用户的服务器。无需运维。访问 Fly.io 了解更多信息。
欢迎收听另一期《实用人工智能》。我是 Daniel Witenack。我是一名数据科学家,也是 PredictionGuard 的创始人。今天我非常兴奋,因为在过去的几个月里,我的生活充满了大型语言模型,我感觉自己被这些信息淹没了。
但是,还有很多事情正在发生,在 AI 世界中,除了文本模式之外,还有很多令人惊奇的事情正在发生。今天,我们邀请到了加布里埃尔·奥尔蒂斯 (Gabriel Ortiz),他是西班牙坎塔布里亚政府的首席地理空间信息官。欢迎,加布里埃尔。你好吗?谢谢。谢谢。感谢您邀请我,并给我机会与您和听众分享
我们在过去几年里关于空间分析,特别是人工智能方面取得的成果。是的,在我们开始谈话时,有一件事让我印象深刻,首先,您是节目的听众,我很高兴您现在成为节目的嘉宾。这太棒了。我很高兴我们有听众在实践中做着令人惊奇的事情。
但同时,您在西班牙,那里是我最喜欢的地方之一。我在研究生期间的合作者在圣塞巴斯蒂安,我在那里待过一段时间。我知道,尤其是在那个地区和西班牙,有很多创新正在发生。在西班牙从事人工智能工作是什么感觉?我认为西班牙是一个伟大的国家,可以在所有工程分支领域找到专业人士。
人工智能行业正在发生很多事情。有很多好的,你知道,初创企业蓬勃发展的环境。我真的很鼓励你,
与西班牙的人才合作。是的,太棒了。那里不仅有令人惊奇的工作,而且还是我去过最美丽的地方之一。即使您登录后,我们的听众看不到,但我通过您的窗户看到了您身后美丽的阳光、树木和小镇。所以我有点嫉妒。你提到了圣塞巴斯蒂安。我离圣塞巴斯蒂安很近。
桑坦德是一个非常非常美丽的城市。是的,是的。我们提到您从事地理空间工作。我知道,所以我几次参加了 Mapscaping 播客,这很有趣。我知道那个行业……
是的。
你更多的是从地理空间方面来的。那么,您能否告诉我们一些关于您作为地理空间从业人员如何开始接触深度学习以及了解它对您所在行业的意义的信息呢?当然。
我在特殊行业工作了 30 多年。我开始从事地形控制、工程测深控制工作。然后,我转到工程公司,设计高速公路和铁路,处理环境数据。
一直使用地理信息系统 (GIS),正如你们许多人所知,它是一种允许您操作和分析海量数据的技术。
然后我开始为坎塔布里亚政府工作。正如您提到的那样,我现在担任首席地理空间官员。但是,如果您直接从西班牙语翻译过来,它就像制图和地理信息系统服务主管一样。
我的职责不仅负责数据生产,还负责在我们组织内部开发用于分析您的空间数据的基础设施。这意味着对我们的员工,也对我们外部的利益相关者,这对我们来说非常重要,对公民、社区以及与您的空间数据合作的公司来说也是如此。
我和我的团队,我们的 DNA 中根深蒂固的是我们使用人工智能和其他技术提供的公共服务。我们每天都尽最大努力实现这一目标。是的,听到您对如何看待自己的工作以及您所服务的民众的动机,这真的非常鼓舞人心。我
我想知道从实际角度来说,您提到了地理信息系统工具和该空间中的数据处理。当然,深度学习和
人工智能领域有其自身独特且有时很奇怪的工具。因此,我想知道,您能否就地理空间从业人员如何开始采用深度学习技术以及所有这些技术发表评论,我假设这些技术与地理空间人员过去使用的工具集不同。那么,目前
深度学习与地理空间相结合的工具状况如何?这很难吗?它在此时是相当分割的还是更集成的?- 乍一看,这似乎令人生畏和令人气馁,但我不得不说,这并不那么困难,对吧?只是为了稍微揭开神秘面纱,人工智能技术。正如您之前提到的,我不是人工智能研究人员。我是一位地理空间行业的专家。
我会告诉你我的故事,我如何开始的。我的第一次接触,或者至少是我第一次关注人工智能是在 2012 年,当时 AlexNet 在 ImageNet 挑战赛中取得了成功。在那个时候,图像分类很棒,但它并不适用于空间行业。它有一个应用程序,您可以利用它,但这不是我们每天都在做的。
在此之前,我不得不说,是在 2010 年或 2011 年左右,我了解了 NVIDIA 使用 GPU(通用 GPU)的工作。我认为 Bill Daly 在您早期的一集中谈到了这一点。
这对我来说非常有趣,因为在地理空间行业中,我们在计算能力方面经常有很大的需求。当我们使用我们所谓的栅格数据时,这只不过是以网格组织的数据。
从拓扑结构上看,网格,例如,图像就是栅格数据,但例如数字地形模型也是如此,它是一个网格,您在每个像素中,在每个像元的中心存储地形相对于平均海平面的高度值,例如。
并且您对该数据模型执行计算。例如,获取领土一部分的分水岭或视野,并且该计算可能持续数天甚至数周,因为尽管底层运行的数学并不复杂,但发生的事情是您有如此多的像素,以至于最终变得非常费力。
而 NVIDIA 在那些日子里开始做的是能够并行化大量的计算。并且,而不是在您的 GPU 上使用四个计算线程或八个计算线程,它们能够在数百甚至数千个计算线程中传播所有计算。这引起了我的注意,因为它对我来说非常重要。但在那个时候,我认为,
加布里埃尔,你需要一个 GPU,但不是为了人工智能。我没有考虑过这一点,而是为了不同性质的计算。然后在 2015 年、2016 年,我们见证了新一代深度学习的兴起
模型架构。仅举几例对计算机视觉产生重大影响的架构。ResNet 在 2015 年,我认为它是在 2016 年发布的,我不太确定。然后是 UNET,它已被广泛使用。2017 年,Facebook 人工智能研究小组提出并提出了 MaskR-CNN。你知道,它是 FastR-CNN 的演变。
在 2018 年,我第一次在地理空间领域看到了演示
我们的数据提供商 Esri,实际上。我认为您在之前的剧集中也邀请了几位 Esri 的工作人员。他们当时展示的是如何使用当时的单次射击检测器自动检测游泳池和石油钻井平台。这对我来说是一种顿悟的时刻,因为我意识到,好吧,你必须投入你的时间。这绝对会改变游戏规则。
你必须开始研究这个。所以那是那一刻。从那时起,你知道,有两种人,对吧?
我将使用一个比喻来解释这一点。当你看到人工智能的结果时,有些人认为这是魔术,每个人都喜欢魔术师。有些人最终爱上了魔术师。他们痴迷于角色、神秘感和整个噱头。但其他人只想了解诀窍。我认为我属于第二组。所以
这不仅仅是看起来像魔术,关键是如何做到这一点。从那时起,我开始工作,如果愿意,我们可以深入探讨这一点。
但正如我之前所说,这并不那么困难。是的,太棒了。是的,我认为我赞扬您深入研究,并且,你知道,不要太早,那时它只是一个研究课题,但随着它开始进入实际应用,您真的采用了它并弄清楚了如何在您的上下文中适当地应用它,我认为这很棒。
也许不是每个人都采用这种方法,所以我对此表示赞赏。因此,对于您正在使用的工具,我认为这对于那些没有做过太多地理空间工作的人来说可能很有用。所以我了解到有一些主要的工具,如 ArcGIS 和其他工具。然后你有了……
Jupyter 笔记本,您可以在其中训练模型或 GPU 服务,您可以在其中运行推理和其他内容。这些是否合并了?因此,作为 GIS 专业人员,您正在使用的工具中,一些深度学习工具是否已集成到这些工具中?或者就目前而言,主要是我要从地理空间方面导出我的数据
然后使用笔记本,然后将其导入?这是一个好问题。正如我之前所说,我们的软件提供商是 Esri。我们与 Esri 合作多年,他们在将许多开源框架集成到其平台方面做得非常出色。
我认为,因为我们试图遵循文献,但我们总是落后。你知道,每周都很难。我也是。不可能。甚至,你知道,构建和完成拼图以及安装所有框架并将所有内容投入工作的问题是
可能非常复杂。因此,使用 Esri 技术对我们来说是一个很大的优势。他们在印度有一个研发团队,我认为
这些人正在为促进这项工作的应用做大量的工作。在您之前的几集中,您一直在讨论使用人工智能的用户界面,无论这是否有用。它确实很有用,因为它是一种使技术民主化和易于访问的方法。这是故事的一部分。我认为它有……
极大地促进了我们的工作,因为您不仅需要框架,还需要整个平台来移动海量数据。您的空间行业对您必须处理的数据要求很高。这不仅仅是开源框架,还有您如何准备标签,如何构建数据库,还有更多科学内容。
此外,除了这些之外,我所做的是开始从互联网上完全免费的各种优秀资源中获得与人工智能相关的核心概念。你知道,在 YouTube 上,你可以学习来自麻省理工学院、斯坦福大学的课程,这些课程可以向你介绍一些最简单的概念,例如感知器、反向传播或随机梯度下降。
所以我为自己设计了一个双重策略。首先,培训以获得使用现成模型的实践经验,但同时,培训也学习人工智能领域底层概念。我认为这很重要。
许多人认为人工智能是一个黑盒子。它不是黑盒子。它是数学在起作用。当然,它不是线性的。你无法完全预测正在发生的事情,但许多事情是可以理解的。好吧,加布里埃尔,我喜欢你对如何建立这些技术的思维模型的观点。我认为这对其他人来说是一种鼓励,既要……
探索这些技术,但也要记住它们是什么以及它们应该如何作为工具与它们交互。但我对您在使用这项技术期间能够完成的一些项目非常着迷。我想开始深入研究其中一些。您向我指出的一些真正令人着迷的项目让我想起了站在海滩上,
我知道。
是的,绝对的。我开始使用深度学习是在最后。我认为那是 2019 年底还是什么的。然后是疫情。
疫情结束后,你知道,随着限制的解除,坎塔布里亚政府的某个人说,嘿,我们有点担心在海滩上出现不受控制的人群的可能性,因为我不得不说坎塔布里亚是一个著名的旅游目的地。我们有 100 多个海滩。
因此,在 COVID-19 的传播方面,您可能会遇到很大的问题。他们很担心。他们首先问我的是,我们如何计算每个海滩有多少人,以及潮涨潮落时的情况等等。
但这只是对海滩面积或面积进行简单计算。我说,我认为我可以做得更多,我会数人数。他们说,什么?你疯了吗?是的,我没有喝醉。我认为我可以做到,因为我有一些使用单次射击检测器的经验,并且
在那个时候,比单次射击检测器更多的模型。这就是我们所做的。我们研究了内容,人们,因为通常我们有一个空中测量档案,这些档案总是像往常一样在晴朗的天空、阳光明媚的日子里进行,那时每个人都在夏天的海滩上。所以我们非常了解……
每个海滩的使用行为,在不同的日子、不同的月份、无论是否是周末还是劳动节,我们都有大量的待分析数据,我们开发了一些深度学习模型,即使您更改输入信号,这意味着更改
航拍调查,它有效。我们可以预测每个海滩的区域,不仅是在海滩上人口的绝对数字方面,而且是在人们试图集中的区域方面
之后,我们发布了一个小型应用程序,您可以在播客的注释中看到,在那里您可以看到一些地图。出于好奇,如果您想前往海滩并保持安静和轻松,你知道,没有太多干扰,您可以看到哪些地方最适合这种用途。
所以这是一个很棒的经历,我们的第一次发布经验。是的,这太迷人了,在你说了之后,它很有意义。我知道在这里我可以想到很多类似的应用。我知道像在美国的国家公园里,你知道,考虑人群以及对自然环境的影响或其他类似的事情,并帮助规划一年中某些时间的拥挤情况。有很多
这非常实用。这太棒了,因为,是的,您利用您一直在积累的知识,在 COVID-19 期间真正地应用它,当时有这种特殊的需要。但后来听起来
持续使用,因为即使我只是一个消费者,就像我是一个普通公民,我想享受海滩,这些信息对我来说非常有用,我知道我自己,我可能会去海滩的安静的地方,是的,然后坐下来听海浪的声音,所以……还有比我
现在描述的更有趣的问题需要解决。后来我们开始努力模拟领土运作的某些方面。
您必须将领土作为一个整体,作为一个活生生的实体来理解,其中一切与一切相关。因此,我们开始切片每个变量,并尝试在人工智能的帮助下解决这些变量。例如,我们开发了一些有趣的模型。如果需要,我们可以深入研究您今天使用的架构。
稍后或您感兴趣的任何内容,但一些用于检测和分类植被的有趣模型
还有城市增长的演变,还有像追踪汽车之类的事情,这就像社会的一种替代物,社会如何移动。因为所有内容都在我们的航拍调查中,您只需要具备将这些信息带回并将其转换为有用的东西的技能。随着时间的推移,我们已经能够完成一些项目
更重要的结果。我不会谈论深度学习模型,而是谈论追踪领土的解决方案。是的,您几次提到了航拍调查。对于我们听众中不从事地理空间工作的人来说,这可能很有用。他们可能认为
以及谷歌地图之类的东西,哦,我可以去看看卫星图像,但它不是最新的,对吧?它可能是一张很久以前拍摄的照片。您谈到了航拍调查,您实际上可以了解某个区域的当前信息,以及历史信息。
您能否帮助我们的听众理解,作为一个专业人士,您可以访问哪些数据,以及这些数据是如何在实践中收集并提供给您的?我不得不说,我一直在谈论的所有内容也可以用卫星图像来执行,你知道的。嗯哼。
有一些区别,但当然你可以用卫星图像来做。我们更多地使用航拍调查的原因是因为我们更专注于捕捉这种图像
信息,而不是处理卫星数据。我的地区坎塔布里亚并不大,我们在西班牙有一个国家计划,每三年用航拍调查覆盖全国,我们还有一个卫星图像库
无论如何,您可以使用这两种输入信号。结果会有细微的差别。但除了使用传感器进行图像捕捉外,无论是机载传感器还是卫星传感器,我们还使用一系列技术。例如,激光雷达数据。我知道许多听众都使用过激光雷达数据。激光雷达也可以是机载的。
事实上,这是后来从飞机上使用的技术的起源,你知道的。在我们领域中,它越来越重要。我们还使用,你知道的,记录系统,传统数据库和许多其他东西。如果我必须说一些关于我的工作的事情,那就是
这非常有趣,因为有一天我们使用 COVID 数据,例如,另一天我们使用能源数据,另一天使用环境数据。坎塔布里亚政府在许多领域拥有权力和职责。如果您忘记面积覆盖的差异,这就像您的一个州一样,只有得克萨斯州或佛罗里达州,我认为西班牙面积介于得克萨斯州和佛罗里达州之间,但整个国家和我的地区都相当小,但由于这个原因,这是一个非常有趣的工作场所,并且数据来自许多不同的技术和许多不同的数据库音乐
再见。
这是一个 ChangeLog 新闻简报。OpenObserve 是一个云原生可观察性平台,专为日志、指标、跟踪和分析而构建,旨在以 PB 级规模工作。巨大!根据其创建者的说法,引用,“它非常简单易于操作,与需要几十个旋钮才能理解和调整的 Elasticsearch 相反。”使用 OpenObserve,您可以在两分钟内启动并运行。
一个确实有趣的报价。以下是评论部分中的一些精选报价。
用户 get to the choppa 说,引用,“我三天前才尝试过这个,作为运行家庭实验室并且尚未设置日志记录的人。这是一个伟大的发现。我不必学习和组合三个或更多日志技术。它只是一个单一的、多合一的监控服务器,带有 Web UI 仪表板、日志过滤/搜索等。Docker 容器的 RAM 使用量低于 100 MB。”结尾引用。
用户 Surge Axe 说,引用,“有趣的产品。感谢您的努力。绝对想尝试一下。但是,对我来说,设置系统并不是当今的主要痛点。
值得一提的是,注册云服务并不难。问题始于摄取点。”结尾引用。您刚刚听到了我们周一 ChangeLog 新闻的五个顶级新闻之一。订阅播客以获取本周的所有顶级新闻,并将您的电子邮件地址输入 changelog.com/news,还可以接收我们免费的配套电子邮件,其中包含更多值得您关注的开发者新闻。再次声明,这是 changelog.com/news。
哦
所以,加布里埃尔,我们谈到了与海滩人口和拥挤相关的第一个项目,但你做了更多的事情。您能否根据从这些航拍调查中能够识别或跟踪的其他内容来重点介绍其中一些内容?是的。我们在植被检测方面做了大量工作。
我不得不说,我们也只使用了监督学习,深度学习的这个分支,特别是使用不同的模型架构,如我之前提到的 UNET、MaskR-CNN 和一些其他架构。现在我们正在测试一些分段任何模型,但我们还没有使用零样本学习进行生产。
我要说的内容是使用社区几乎已经忘记的模型架构实现的。你知道,每个人都专注于 SOTA 架构,并且可以从人工智能的旧学派中提取很多东西。引用,它并不那么旧,对吧?是的,是的。我认为实际上这可能是
人们偶尔会在节目中尝试提到这一点的误解,大多数企业应用,不仅在 GIS 中,而且在制造业或营销中甚至是营销,人们都认为营销是用生成式 AI,但大多数应用仍然是传统的应用
引用,传统机器学习。你知道,仍然有很多 scikit-learn 模型,或者只是监督学习模型。是的,很高兴在这里强调这一点,因为我认为这是一个误解。是的,因为,你知道,当一篇论文出现时,他们通常不会用尽模型的可能性。
那些不是人工智能领域非常专业的专家,但在人工智能之外的特定领域拥有大量知识的人,在我这里,我们可以准备和整理更好的标签。我们可以理解我们试图建模的过程。
我们有很多东西可以提供和建议给社区。这就是有些人说您的模型相当不错的原因之一。你是怎么做到的?是……
全新的架构是你自己创建的东西,总是说,不,不是。只是以一种巧妙的方式使用 2015 年、2016 年提出的模型架构,但使用了大量数据,创建得非常好。我还必须说,我们可用的计算能力相当适中。我们没有
从那一点开始,一些大型或非常广泛的东西。关键在于你如何创建数据。是的。您在录制前提到的其中一件事是将自动制图视为您一直在研究的许多不同模型的集成。我想知道您是否可以……
首先描述您所说的自动制图的意思,甚至对于不熟悉的人来说,什么是制图?而且,你知道,我假设现代制图不像
你知道,麦哲伦拿着他的纸,在羊皮纸上画地图之类的东西。但是,如今制图是什么样的?然后,您所说的使用这些模型进行自动制图是什么意思?制图是艺术和科学的结合,你知道的,试图模拟现实,抽象现实,并将其绘制在平面上。
是一门发展了几个世纪的科学,从很多世纪以来。直到现在,它还高度依赖于人类追踪和绘制地球表面的能力。
随着技术的进步,从 90 年代开始,我们开始非常迅速地转向数字技术。制图的自动化不仅发生在人工智能出现之后,而且在几十年前就开始了。然而,这是一场革命,因为我们从未能够用这么少的人员来生产如此高质量的产品。
还有一些类似的技术,如遥感,这是负责分析卫星图像并生成制图的技术的一部分。它回忆起人工智能的许多方面,但它可以在许多其他领域匹配结果。
所以革命仍在继续。正如我之前所说,它始于 80 年代和 90 年代,但现在它是一场彻底的革命。我认为
第一次,我们能够,我们有一个例子,您可以在播客的描述中查看,但我们能够制作一张具有基本覆盖范围的地图,其中有树木、灌木、没有植被的地方、建筑物或道路或铁路完全由人工智能生成。当然,它有一些错误,但我们
故意留下这些错误,因为我们希望社区的其他成员能够评估模型单独工作的容量和能力。在你谈到这些模型时,一个问题突然出现在我的脑海里,什么是可能的。而且,你知道,它并不完美,对吧?没有哪个 AI 系统是完美的。所以会有错误。
我想知道,作为一个在 GIS 领域工作了,我想你说了,30 年的人,我也想像到基于人工的过程容易出错,或者至少很慢,对吧?所以当人工处理某个地图或其他东西时,事情已经更新了,对吧?而且可能不再是当前的了。您对……您认为……
对于我们转向未来的制图或 GIS,AI 系统可能能够更及时地完成工作,但会有一些错误,但它们是最新的,并且可能真正突出显示某些不完整区域或其他内容,结合人工努力来纠正这些错误并保持……您如何看待这种在
尝试使用基于 AI 的技术自动化
以及随着这些系统扩展到越来越多的地点,人类制图师或 GIS 专业人员所扮演的角色之间的平衡?- 是的,这是一个非常有趣的问题,因为我们面临的一个大问题是维护我们发布到市场或为利益相关者发布的每个数据库的最新状态。这是一个非常大的问题,因为它总是很困难
而人工智能的主要优势之一是您可以拥有一个模型,并且您知道。它可能无法与下一个区域调查完美配合,因为它在颜色、阴影或其他方面会有一些差异,但您可以微调,您可以,或者您可以从头开始训练模型
从训练开始从头开始,您可以在合理的时间范围内更新某些内容。所以这是我最感兴趣的事情之一,更新事物的能力。
正如我之前所说,这是一个改变游戏规则的东西。没有其他人工智能提供其他技术真正无法提供的东西。是的,当然也有局限性。你知道,人工智能永远不会……期望永远不应该认为它能解决我们所有的问题,但它也应该能解决我们的一些问题,或者解决我们的一些问题,但不是全部。从你的角度来看……
您如何看待 AI 在 GIS 和制图中的当前局限性?关于这一点,您有什么想法?是的,我认为,当然,您必须记住我们有局限性。发生在我身上的事情也发生在印度或美国的团队身上,我总是关注他们在做什么。我想指出两个限制。一个是计算能力和技术。
另一件事是 CNS 的局限性,这是我们现在正在使用的技术,卷积神经网络。我们可以稍微讨论一下模型架构和一些事情。在计算能力方面,我认为值得深入研究 GPU 的作用,因为在地理空间领域,人们并不十分了解为什么我们需要 GPU。
我不知道这是否发生在其他市场,但在我们的行业中,当您与某人谈论 GPU 时,通常我的同事和伙伴们,我不知道,他们试图说,这与 IT 部门有关。我不想负责这件事,但事实并非如此。您必须了解您有哪些计算技术。硬件非常重要。
并且您必须与数据科学家说同样的语言,而其他社区也说同样的语言。了解这与您笔记本电脑中的 GPU 不同,如果您谈论的是 NVIDIA 硬件,那么 DGX 或 HC100 也不同,这一点非常非常重要。不一样。
这与您想要放入火车的数据量有关。你知道,你的训练质量,如果你要停留在收敛的局部最小值,或者你要达到并评估你正在摄入模型的标签的可能性,那么你将获得的收敛水平。一切与硬件有关。我认为 Bill Daly、Anima 和 Kumar 在他们的许多演讲中
我总是谈论人工智能的三位一体。其中一个是数据。另一个是软件,许多算法已经与我们共存了一段时间。传播,其中许多算法来自 80 年代,如果不是更早的话。但硬件是第三部分。
比尔·戴利总是说这是启动人工智能创造力引擎的尖峰。我认为这是真的。您必须非常注意计算能力。还有一个局限性是刻在 CNN 的 DNA 中的。据我所知,从我的经验来看,
您不能指望它像人类一样精确地执行,有时,尽管您创建了非常好的标签、提示和数据,但模型的学习效果并不像您预期的那样好。但在两者之间,您可以在其中取得合理的成功。
我们克服的方法是结合不同的模型架构。这是地理空间行业中非常有用且广泛使用的方法。例如,我们在两个不同的级别组合模型。从架构级别来看,很常见的是
将 ResNet 与例如 UNET 结合使用。在 ResNet 中,您删除最后一部分,即全连接层,并将剩余部分连接到 UNET。因此,您使用 ResNet 作为特征限制,用于特征限制,然后解码器的其余部分发生在 UNET 架构的其余部分。
它也发生在 mask R-CNN 中。我们不断使用 ResNet 作为骨干。
但是模型的其余部分会继续运行。还有一点,那就是结合结果或推理。当您有两个不同的模型架构的推理时,例如谈论植被,假设您有一个模型可以很好地检测到大的植被区域,但在小斑点上会失败。而你还有另一个模型
对于小斑点效果很好,但无法检测大区域,因为大区域会产生人工孔洞和错误。您可以将这些模型架构的结果与传统的 GIS 技术结合起来,将所有结果组合在一起,从而获得
您想要推断的图层的更大、更好的质量。这对我有效,这是我们试图克服的一种方法
人工智能的局限性。太好了。非常实用。我知道许多听众想听到的是他们可以探索这些技术的一些实用方法。加布里埃尔,与你交谈真是荣幸。在我们结束这里的时候,我们有很多事情可以谈论。我知道我们有一些没有谈到,我们会在节目说明中链接。但当你展望未来时,你能在最后简短地……
一分钟左右,简要地与我们分享一下,作为一名展望未来的 GIS 专业人员,您接下来想要深入研究什么,或者您对您自己的工作以及 AI 如何影响它的未来感到鼓舞或乐观吗?好吧,我
- 好吧,我必须说,在我 30 多年的美国空间产业工作中,过去两年左右是我职业生涯中最激动人心的部分,因为它非常有创意。我们只是触及了人工智能的表面
伟大的事情即将到来。我认为随着 Zero Shot 的出现,我们从 4 月的第一周就开始关注 SAM(Segment Anything Model)可以做什么。我相信 SAM 的未来版本将会有新的版本。
当我们将其与大型语言模型(LLM)结合起来,并且我们可以通过语音进行交互并说,“嘿,画出图像中的所有树木”,或者使用这套技术会容易得多。无论如何,最后,我想向观众发送一条消息,对于那些不是像我一样的人工智能研究人员的人来说,
即使你不是该特定领域的专家,也可以应用这套技术。也可以动手操作其中一种自我模型,并开始尝试使用它们。我知道未来将完全专注于人工智能。未来几十年,地理环境将有所不同。太棒了。是的,这太鼓舞人心了。感谢您的工作,加布里埃尔。很高兴邀请您参加节目。非常感谢。谢谢。
再次感谢 Fastly 和 Fly 与我们合作,为您带来所有 Change Talk 播客。查看他们在 fastly.com 和 fly.io 上的工作。感谢我们最棒的驻场乐队 Breakmaster Cylinder 不断创作出业内最佳节拍。现在就到这里。我们下次再聊。♪