We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Harnessing AI: safeguarding high-integrity data for climate action

2025/6/24

LSE: Public lectures and events

AI Deep Dive AI Chapters Transcript

People

Amy Fisher

Carmen Nuzzo

David McNeil

Melissa Chapman

Sylvan Lutz

Topics

Carmen Nuzzo: 作为TPI中心执行董事，我认为人工智能在气候行动中扮演着关键角色。我们中心致力于提供独立、严谨的数据，以评估公司、银行和国家在向低碳经济转型方面的进展。然而，在利用人工智能进行数据收集和分析时，必须高度关注数据完整性。我们正在进行一个试点项目，旨在自动化数据收集过程，但同时也强调区分好坏数据的重要性，确保为投资者提供可靠的信息，以便他们能够做出明智的投资决策并与投资实体进行有效互动。人工智能的应用必须审慎，以避免绿色清洗和信息误导，确保数据的质量和可靠性。 Sylvan Lutz: 作为LSE数据科学研究所的成员，我认为人工智能在气候变化领域既带来了机遇，也带来了挑战。一方面，人工智能可以帮助我们更快速、更高效地处理大量数据，从而加速净零转型。另一方面，我们也必须警惕人工智能可能带来的风险，如绿色清洗和环境成本。我们需要构建强大的AI管道，并确保在整个过程中进行严格的分析师验证，以保证数据的质量和可靠性。此外，我们还应该关注人工智能的能源消耗问题，并努力开发更节能的模型。重要的是，我们要认识到人工智能只是一种工具，其最终结果取决于我们如何使用它。我们有责任与人工智能合作，引导我们走向可持续的未来，而不是被市场激励所驱动。

Deep Dive

Chapters

This chapter introduces the LSE event, "Harnessing AI: Safeguarding High-Integrity Data for Climate Action," organized by the Transition Pathway Initiative Centre (TPI Centre) and the LSE Data Science Institute. It sets the stage by highlighting the event's focus on using AI to improve data collection for net-zero transition assessments while addressing concerns about data integrity and potential biases.

Event title: "Harnessing AI: Safeguarding High-Integrity Data for Climate Action"
Organizers: TPI Centre and LSE Data Science Institute
Event is part of London Climate Action Week
Focus on AI's role in accelerating decarbonization and addressing socioeconomic issues while mitigating risks of misinformation and greenwashing

Shownotes Transcript

贡献者：Melissa Chapman 博士、Amy Fisher、Sylvan Lutz、David McNeil、Carmen Nuzzo 教授 | 人工智能 (AI) 和机器学习 (ML) 是用途广泛的技术，它们极大地降低了数据生产和分析的成本，有可能加速全球脱碳并解决社会经济问题。尽管如此，人们仍然担心它们对环境的影响以及传播低质量信息（尤其是在大型语言模型 (LLM) 中）的风险。像任何工具一样，人工智能既可以产生积极的结果，也可以产生消极的结果。随着对净零过渡实时数据需求的增加，伦敦政治经济学院 (LSE) 的转型路径倡议中心 (TPI 中心) 正在应对这一挑战。虽然人工智能可以帮助处理净零一致性所需的数据，但对自动化的无节制依赖可能会导致虚假信息和漂绿行为，从而危及合理的决策。本次活动将探讨 TPI 中心旨在自动化数据收集以评估公司、银行和国家净零进展的试点项目。通过汇聚学术界、研究人员、投资者和企业，我们希望促进关于推进净零过渡所需信息的讨论。特色图片（在添加水印的源代码中使用）：Unsplash 上通过 Getty Images 的照片：https://unsplash.com/photos/3d-rendering-of-earth-futuristic-technology-abstract-background-illustration-60_6d24hGTg</context> <raw_text>0 欢迎收听伦敦政治经济学院的 LSE 活动播客。准备好聆听一些社会科学领域最具影响力的国际人物的演讲。

我想我们准备开始了。欢迎，欢迎各位来到现场，来到礼堂或在线参加今天的会议，会议主题是：“驾驭人工智能：保护用于气候行动的高完整性数据”。今天的活动由转型路径倡议中心（简称 TPI 中心）主办。

它位于伦敦政治经济学院，与伦敦政治经济学院数据科学研究所（简称 DSI）合作，是伦敦气候行动周活动的一部分。我的名字是 Carmen Nuzzo，我是转型路径倡议中心的执行主任

该中心对公司、银行和主权国家在向低碳经济过渡方面取得的进展进行独立、严格和前瞻性的研究和数据分析。今天，我们正与 DSI（数据科学研究所）联手，

它与学校各学术部门和研究中心合作，通过社会科学视角促进数据科学和人工智能 (AI) 研究、教育和参与，因此

我将快速浏览一下今天的议程。因此，在自我介绍之后，我将把话筒交给我的同事 Sylvain Lutz，他将解释一下我们为什么举办今天的活动。人工智能的使用可以通过不同的视角来考察。

不同的维度，数据质量、伦理、偏差、隐私、劳动力市场的变化以及对新技能的需求。也有一些人非常反对人工智能，一些人害怕，一些人担心人工智能。

我们今天有一个很棒的小组来讨论所有这些方面，尽管我们将主要关注我们正在 TPI 中心努力解决的核心问题。事实上，今天会议的想法源于 TPI 中心的一项试点项目，该项目旨在自动化收集评估我们分析的实体在向净零过渡方面取得的进展所需的数据。

因此，TPI 的使命是产出所有这些研究和数据，使投资者能够跟踪和监测这些实体取得的进展。因此，它必须对投资决策有用。事实上，我们是 TPI 的学术合作伙伴，TPI 是一项由投资者主导的倡议

由资产所有者领导，并得到资产管理人的支持。我们也是 ASCORE 的学术专家。ASCORE 代表评估主权气候相关机遇和风险，这是我们 2023 年新近承担的一个项目，而 TPI 始于 2017 年。它更侧重于国家分析。很高兴看到一些 TPI 和 ASCORE 的支持者以及一些新面孔。到今年年底，

我们将评估超过 4000 家公司的管理质量实践及其脱碳速度，以及 35 家银行和 85 个国家。因此，您可以想象我们必须处理和评估的信息量之大

在我们制作的研究中。非常重要的是，我们制作的研究基于公开信息。因此，直到最近，我们所有敬业的专家分析师团队一直在手动搜索公司、银行报告和网站制作的所有研究报告和可持续性报告。

最近，我们实际上开始尝试研究探索一些自动化搜索和训练大型语言模型的可能性。因此，大约一年前，我联系了 John Cardozo 博士，只是为了自我介绍。从那时起，他就再也摆脱不了我了，因为我们一直在寻求数据科学研究所的帮助，以便以更快、更高效的方式进行这些评估。

从那时起，我很自豪地说，TPI 的工作已经融入到 John 领导的一些工作中。事实上，他在 DS205 高级数据处理课程中的学生实际上从事 TPI 中心评估工作，他们收集非结构化数据和信息，这些数据和信息会输入到 TPI 的问题集、形成性评估和总结性评估中。

因此，今天的会议真正关注的是数据完整性。我们如何真正地，我们如何才能对通过这些自动化搜索获得的结果进行明智的判断，区分好坏数据，并真正为我们的关键利益相关者（即投资者）提供他们评估并最重要的是与他们投资的实体进行互动所需的信息。因此，我将把话筒交给我的同事 Sylvain。

我们将做一个简短的介绍。在此之前，我将简要向大家介绍一下小组成员，John 将更深入地介绍，我们所有尊敬的小组成员将自我介绍，并告诉大家更多关于他们角色的信息。因此，我们有 Melissa Chapman，她是苏黎世联邦理工学院环境政策助理教授，现在在台上。

她还与 Amy Fisher 在线加入我们。她一直在耐心地等待我们开始。谢谢你，Amy。她是 Mooir AI 的合作伙伴总监，负责领导客户和合作伙伴的互动。最后但并非最不重要的是，我们还有 David McNeil，他是 PGIM 的全球气候研究和战略副总裁。对于那些不了解的人来说，PGIM 是普鲁申金融的管理部门，也是资产所有者，并且

他也是 TPI 的研究资金合作伙伴之一。我需要向大家介绍一些家务事规则，正如我所讨论的那样。首先，如果发生火灾（这种情况不太可能发生），请通过您进入此房间所使用的两个出口撤离大楼。会有同事引导您，但您可以在屏幕上看到集合点。

此外，本次活动正在录制，如果技术没有让我们失望，更不用说人工智能了，它将在我们的网站上提供。房间里可能有媒体代表，所以请注意这一点。请将您的手机调至静音。您可以发推文，也可以不发推文，但可以在社交媒体上发布关于此活动的帖子，但不要

分心，请与我们在一起。在活动结束时，您将有机会提问。对于在线的各位，我知道有很多，所以感谢你们的参与。您应该能够在屏幕底部看到一个功能来发布问题。就这样，我把话筒交给我的同事 Sylvain。非常感谢你们今天与我们在一起。我希望当你们离开房间时，你们将成为 TPI 中心和 DSI 所做工作的优秀大使。谢谢。

非常感谢，Carmen，晚上好，各位。感谢你们的到来，尤其感谢各位小组成员无论从多远的地方赶来，以及感谢 Amy 在北美西海岸早起加入我们。我将简要概述 TPI 中心正在开展的一些工作，这些工作着眼于自动化其评估，在这里我们将主要讨论大型语言模型管道，但我希望首先指出大型语言模型和 Chet GPT 并非人工智能的全部，因此我认为小组将在之后讨论这个问题。然后，我将简要介绍一下由 John（我们今晚可爱的协调人）领导的 DS205 课程中的学生以及他们所做的一些工作。但在深入探讨这些细节之前，我想先退一步。

在伦敦政治经济学院，我们很幸运能成为世界上最著名的社会科学研究机构之一。通过这一角色，在过去几年中，我们邀请了许多杰出的演讲者来讨论人工智能的话题。去年，我们邀请了杰弗里·辛顿，他经常被称为人工智能的教父。

他表达了他对人工智能存在的风险以及特别是一些生成式人工智能工具的激增带来的短期社会风险的悲观情绪。我们还邀请了加里·马库斯，同样由 John 协调，所以 John 显然是伦敦政治经济学院在理解社会科学领域人工智能方面的关键人物。他谈到如何

围绕通用人工智能的炒作可能有点过分，鉴于当前模型所处的位置。大型语言模型，它们并没有真正进行实际推理。Andy 最近对苹果公司关于推理的论文发表了评论，你们中的一些人可能熟悉。

在人工智能乐观主义者方面，我们看到 Anthropic 与伦敦政治经济学院建立了合作伙伴关系，他们来介绍了他们在人工智能教育方面所做的一些工作。同样，我们对人工智能可能具有的变革性本质非常乐观，这使得……

也许让房间里的一些学者感到不安，但我接受这一点。上周，我们很幸运地听取了 DeepMind 的 Lila Ibrahim 的演讲，她的论点更多的是开发人工智能确实是每个人的责任。它是一个关键工具，可以很好地使用，也可以被滥用。而且，在该技术的社会、政治和经济影响方面，我们正处于发展的初期阶段

这确实取决于我们与之合作并理解它，以便我们可以引导我们想要看到的未来，而不是更原始的市场激励机制可能导致我们的未来。因此，今晚我们将遵循这一思路，讨论……

我们在工作中做了什么，小组成员在工作中做了什么，并从中希望讨论我们可以构建的未来，而不是我们可能最终陷入的未来。因此，尽管我的第一张幻灯片的标题是，

危险。如果我们看看如果我们做错了会怎样，如果我们做对了会怎样，它们实际上都是我认为应该放在负责任到不负责任发展规模上的用例。因此，在您屏幕的左侧，我们正在关注人工智能带来的漂绿风险。

在 TPI 中心的环境中，我们使用人工智能来分析公司报告，我们只是要求一个简单的模型来分析该公司报告。我们很可能会得到公司在报告中所写的内容以及它认为自己所做的所有伟大的工作。因此，您必须对所提问题类型有所谨慎。

在左下方，我们可以看到一些关于人工智能的环境成本。当然，在谈论人工智能和气候变化时，这经常被讨论，我不希望在此赘述，但只是要注意，来自格兰瑟姆研究所的一篇论文（由尼古拉斯·斯特恩领导）的一些最新数据强调，他们的估计认为 2035 年所有数据中心的使用将产生 0.4 到 1.6 吉吨的二氧化碳

二氧化碳排放量，这大致相当于日本全国目前的排放量。所以这不是一个无关紧要的问题，但如果负责任地发展，这也是一个可以管理的问题，因为

人工智能数据中心不需要化石燃料，它们需要能源。因此，关键在于建立正确的激励机制，以鼓励开发人员建设这些数据中心，而不是化石燃料密集型途径。在屏幕的右侧，如果我们考虑一下如果我们负责任地建设，世界可能是什么样子，斯特恩的论文再次

在交通、电力和农业部门中强调。他们预计到 2035 年，每年将减少 3.2 到 5.4 吉吨的二氧化碳排放量

效率、更好地利用资源以及人工智能在替代蛋白质开发等各种应用中的许多应用。作者非常容易地指出，并且正确地指出，如果他们走这条路，这几乎是或超过他们估计的数据中心排放量的两倍。所以这实际上可能是一种权衡，但关键在于努力走我们想要走的道路，而不是最终走上

悲观的道路，最后我想在幻灯片上强调一下人们正在做的一些工作，例如谷歌洪水，以帮助世界了解气候变化的风险或更好地追踪自然损失或

各种其他创新应用，这些应用不一定是大型语言模型生成的，但可以带来更准确的实时信息。因此，当我们回顾我们在 TPI 中心所做的工作时，这要感谢数据科学研究所的一些支持，请记住，我们不仅仅是在谈论 ChatGPT 或通用人工智能。

人工智能实际上是一套工具和算法，可以增强研究人员和社会的实力，或者可以被社会利益用于商业或政治目的。我们最终所处的未来部分是我们创造的责任。

更具体地谈谈气候变化的压力。我们都知道，《巴黎协定》中 1.5 度的目标正在从我们手中溜走，没有有限的超调。我们正走向一个可能超过 1.5 摄氏度的世界。生物多样性危机正在加速。因此，从我们所接触的金融领域的利益相关者到政治家和其他关键决策者，对更多数据的需求都在增加，

在 TPI 的背景下，这是更多被评估的实体和更及时的数据。因此，在 TPI 的背景下，这将是从公司或国家制作文件到我们将其整合到评估中的时间之间更频繁的更新。但与此同时，好的数据不仅仅是

大量且快速。它必须具有上下文和知识特异性。必须定期检查数据中内置的偏差。理想情况下，它是开放的、可理解的和可重复的。因此，我认为人工智能可以很明显地帮助我们解决前两个问题。但它存在一种经济问题。

如果我们观察蓝线，一个人在进行评估时会随着时间的推移而学习。因此，如果我们观察这张说明性图表，这仅用于说明目的，左侧是产生信息量的边际成本，以及

在 x 轴上，我们得到了产生的信息量，一个人会随着时间的推移而学习一些东西，最后的评估可能比之前的评估效率更高，但如果我们观察人工智能生成的内容，边际成本不会下降得那么快，我认为你们很多人对人工智能垃圾很熟悉，这可以是任何东西，从在推特或……上流行的逼真的猫咪视频

或 TikTok 到一般生成的內容。芝加哥时报（我认为是）最近为 2024 年发布了一份充满虚假书籍的书评清单。因此，生成信息非常容易，但这些信息有多少质量？因此，为了应对这种信息泛滥，人工智能很可能仅仅通过纯粹的市场激励机制就能创造出这种信息的时间性和规模，我们

我们需要努力构建强大的 AI 管道。在这里，我将其作为 AI 加分析师。您可以根据需要对其进行分类。但我在这里要强调的关键点是，这些管道建立起来要昂贵得多。开发您要输入的正确信息源需要大量工作。

以及您想要获得的正确输出结构。它们需要成本才能维护，因为您必须主动验证很多数据。您必须与受这些数据影响的人员保持利益相关者的参与。因此，您不希望将其留给完全即插即用的 AI 生成数据生产系统。因此，为了将此纳入 TPI 中心的职权范围，

屏幕上显示的此框架大致代表了我们如何进行评估。您可以将其视为人工评估，也可以将其视为近似于我们所说的检索增强生成。我将简要介绍一下它是如何发挥作用的，但这本质上是一个专门的管道，它利用特定来源，并包含一个大型语言模型来将这些特定来源重新格式化为更扎实的

真相和信息。因此，在 TPI 中心，我们的输入将是一个问题，我们有四项项目，公司、银行、主权国家，然后对于公司，我们也进行更定量的评估。因此，我们将有一个问题，我们必须出去寻找信息来回答这个问题。

然后，我们必须确定我们在找到的文件中找到了哪些信息，运用我们的判断来提出一个分数，然后记录我们是如何提出这个分数的，记住我们需要非常仔细地来源这些信息，以便将来可以重现它们。

为了更详细地介绍第一步，如果我要进行评估，询问德国 2030 年的排放量相对于 2019 年基线的比例，我首先必须做的是找到可以找到答案的文件，找到 2030 年的目标。因此，对于分析师来说，这看起来像是网络搜索或转到他们已经知道信息存在的地方。对于人工智能来说，这更像是网络抓取。

对不起，不是对于人工智能，对于自动化管道来说，这更像是网络抓取。然后，我们需要找到这些文档中相关信息的位置。因此，在本例中，这些文档是欧洲 NDC 和德国联邦气候法。在这些文件中，我们可以找到几种 2030 年来源的框架。我们不会详细介绍这一点，但只想强调可能存在多种相互竞争的证据来源，并且您需要能够评估

最佳证据来自何处。然后我们还有接下来的两个步骤，即专家判断和起草评估。这将产生您可以在我们的网站上找到的结构化输出，我们在那里进行评估。但是，这里有一些计算需要进行，包括重新调整排放量。

弄清楚涵盖的范围，即有多少，经济的哪个部分被该减排目标所涵盖等等。对不起，我想我忘记在这个幻灯片上提到，在一个自动化管道中，这将是嵌入模型和向量相似性搜索，然后当您在判断阶段调用大型语言模型时，

将有一个明确指定的提示，然后参考您创建的数据库，并将您问题中的关键词与已保存在该数据库中的关键词进行匹配，简单地说。并且

在与 John 学生一起上的课程中，我们基本上要求他们使用他们在课堂上学到的工具来重新创建这个管道。因此，他们的任务是构建模块化框架，这些框架可以在各个学生项目之间混合和匹配，具体取决于哪个学生小组构建了管道中最强大的部分。我们还要求他们构建灵活的框架，以便您可以更改提示并仍然获得

有效的结果，只要您的提示仍然有效。在冬季学期，他们在本课程中处理了四个关键问题，或者至少有三个小组将其作为期末项目处理。他们致力于从网站和数据库中收集信息。他们致力于高效地提取信息。他们使用多语言工作流程，这在

主权评估（国家级评估）中经常出现，他们还构建了一些工具来检查他们大型语言模型结果的置信度。执行此操作的主要方法是调用多个模型来进行相同的评估，然后检查两个答案之间的相似性，以便当人工分析师去验证结果时，可以对结果是否在各种模型中可重复进行一些判断。

当然，这将转到，在我们建立这项工作的方式中，我们的分析师之一，去验证这些数据并允许他们进行更多和更快的评估。该项目部分的一些关键经验教训是，真正高质量的来源很重要。

如果一些人只是在 ChatGPT 中键入问题，那么出去搜索网络并不是很有用，如果您没有明确说明您想要信息来自哪里。因此，我们使用了 UNFCCC NDC，并对其进行了抓取以创建一个文档存储库。我们使用了一个专家策划的气候信息来源，气候行动追踪器，以及来自气候政策雷达的预结构化数据库，其中包含许多气候政策和法律。

学生们还发现，在嵌入和召回任务中，较小的特定上下文模型通常比较大的通用模型表现更好。这就是说，并非总是最大、最好、最花哨的模型将是您的最佳结果。这些也是更耗电的模型。使用针对特定任务设计的缩小规模的模型，您可能会获得更好的结果。

这也有助于解决与人工智能相关的能源问题。一个非常关键的点是，问题的清晰度很重要。您需要知道您在问什么，因为您所问的问题会影响您构建的工具以及您如何衡量成功。因此，认真思考为什么你想问问题非常重要

创建自动化管道。您实际上将从这项工作中获得什么？为什么这会改进气候数据或其他形式的数据？这将帮助您构建您的方法。最后，与以往一样，结构化输出是关键，因为非结构化输出对于人们来说更难将其纳入他们自己的决策过程。

因此，关键的总体结论是，模型可以为您提供准确的输出，但前提是有可信的来源、内置的细微差别和仔细的验证。我将引导您了解人工分析师评估和自动化管道之间三种粗略的比较。因此，在 Q1 中，我们与人工评估的差异率为 29%，

我们询问的是，该国的净零二氧化碳目标是在哪一年设定的？这是一个非常简单的问题。答案应该是类似 2050 年、2070 年这样的内容，应该非常清楚。在本例中，该模型可以访问 NDC 存储库，而没有其他内容。

我们可以清楚地看到，该模型过度应用了欧盟的共享框架以及其他类似内容，即使这在欧盟 NDC 中没有明确说明。因此，虽然欧盟可能有一个 2050 年的目标，但这并不一定适用于该国子集。

因此，你知道，这可能与人工评估的比较不是最有用的。然后，我们对该子集进行了更细致的划分，以查看不包括欧盟的国家，其中人工和模型使用了相同的来源，即该国的 NDC，人工在其中找不到目标。在这个子集中，我们得到了更高的与人工相同的結果。在这里我们可以发现错误……

模型所犯的“错误”是 SEPHCR 特定的目标或目标是

或者听起来像目标的短语，例如我们打算实现净零，但我们不承诺实现净零，模型经常接受这些短语。这突出表明，即使模型提供的结果和解释是有道理的，也要仔细批判性地评估您如何看待它提供的内容，最后，我们根据 ASKER 框架提出了一个

问题，该国是否有气候框架法或等效法律？这有许多子标准，因此我们在结构化提示中向模型提供了这些子标准，这次我们打开了来源。我们要求它搜索互联网，寻找政府来源，我们发现，当它得到正确答案时，大约 66% 的时间，它有适当的解释，找到了与我们在评估中使用的相同的来源。它所做的是在分析事物时组合来源。因此，它查看了该国的 NDC，这不是法律文件。

以及气候变化方面没有任何说明的环境保护法等法律文件，并将两者结合起来。只是想说，这些并不总是您在每个管道设置中都会遇到的错误，但这些是我们遇到的一些问题，我们发现将源存储桶限制在您知道可以在其中找到有效信息的地方对于高准确率很重要，但是

但是，根据您要查找的内容，是节省时间还是准确性，您可能需要更改设置方式。

因此，我想总结一下并交给 John，我们所构建的内容很重要。我们使用的工具以及我们发布到世界上的信息，如果我们要采用我们从试点研究中获得的一些结果，那将是稍微不负责任的，我们需要在目前的基础上保持分析师的验证。我认为如果我们共同努力，朝着……

对这些管道进行更全面的监督，那么我们可以构建可问责和透明的数据，而不是大量的噪音、人工智能垃圾、漂绿和未经批判性分析的重复信息。所以，轮到你了，John。非常感谢你的演讲，Sylvain。感谢 Carmen 之前的介绍，Sylvain 也提到了我，我是 John。

我在数据科学研究所工作。我将主持我们其余的谈话，进行，你知道，调解，主持我们的小组讨论，然后邀请你们提问，无论你们是在现场还是在线。我将首先跟进 Sylvain 并问你一些问题。因此，在这个我们与学生一起进行的项目中，以及作为你目前角色的一部分，你说了非常重要的一点，那就是

你可能想要，你可能想要，比如你的愿望可能是获得更多输出、更多分析、更多你已经做得好的事情。人工智能作为一个机会出现，作为在那里可能非常有价值的东西。然而，你多次提出的缺点是，有一种倾向，一种像大型语言模型这种内置功能的倾向，那就是编造东西。

我们需要解决这个问题。那么你如何找到这种平衡呢？你如何保持数据的质量？你如何保持你正在做的事情的质量？人工智能在哪些方面有用，在哪些方面没用？人在其中扮演什么角色？打包在这个非常长、很大的问题中。感谢你的问题，John。大家都能听到我说话吗？太棒了。是的，所以我想……

贡献者：Melissa Chapman 博士、Amy Fisher、Sylvan Lutz、David McNeil、Carmen Nuzzo 教授 | 人工智能 (AI) 和机器学习 (ML) 是用途广泛的技术，它们极大地降低了数据生产和分析的成本，有可能加速全球脱碳并解决社会经济问题。尽管如此，人们仍然担心它们对环境的影响以及传播低质量信息（尤其是在大型语言模型 (LLM) 中）的风险。像任何工具一样，人工智能既可以产生积极的结果，也可以产生消极的结果。随着对净零过渡实时数据需求的增加，伦敦政治经济学院 (LSE) 的转型路径倡议中心 (TPI 中心) 正在应对这一挑战。虽然人工智能可以帮助处理实现净零目标所需的数据，但对自动化的无节制依赖可能会导致虚假信息和漂绿行为，从而危及合理的决策。本次活动将探讨 TPI 中心旨在自动化数据收集以评估公司、银行和国家净零进展的试点项目。通过汇聚学术界、研究人员、投资者和企业，我们希望促进关于推进净零过渡所需信息的讨论。特色图片（在添加水印的源代码中使用）：通过 Unsplash 获取的 Getty Images 照片：https://unsplash.com/photos/3d-rendering-of-earth-futuristic-technology-abstract-background-illustration-60_6d24hGTg</context> <raw_text>0 回答这个问题的一个很大一部分是，你问的是什么问题，这将决定人的作用是什么。如果你试图加快一些基本信息的查找，那么大型语言模型在这方面可能做得不错。在我谈到的那些气候法评估中，我们很难审查如此大量的文件，如果在验证步骤上花费更多时间，我们实际上可能可以接受一些误报并将其剔除，但是

但是，在这个过程中，人的作用是确保他们思考自己提出的问题以及在创建模型、创建系统、创建管道来回答这个问题之后需要做什么。因此，这是一个贯穿整个过程的关键性思维角色，以确保你对通过管道处理后发布到世界上的任何内容负责。

已经过验证，达到最初提出的问题所需程度。我认为在 TBI 中心案例中，声誉风险是我们工作的重要组成部分。我们为对各种实体进行详细评估而感到自豪。

因此，验证作用非常强大，这在我的管道每个步骤中都有体现。了解你输入的来源，了解嵌入是如何完成的，以便当搜索进行时，你可以验证实际用于回答问题时使用的来源，了解这些来源是如何被提取到模型中的，元数据结构是什么样的，

然后最终了解输出，我认为这对人类来说都是关键。因此，这不仅仅是设置管道然后让它运行，而是与管道的每个阶段进行交互，并了解正在发生的事情，以便如果出现错误，A，你可以回溯并了解错误的来源，而且你也不太可能仅仅假设它是正确的。你可以更清晰地发现……

哪里出了问题。而且，仅仅提示工程可能无法解决所有这些问题，对吧？你可能仍然需要有人在每个步骤进行验证。是的，我认为是这样。仅仅提示工程是……

更大的模型并不能解决这些问题。我认为仅仅是更好的提示并不能解决大型语言模型或其他形式的自动化评估带来的数据质量问题。必须始终真正了解过程中每个步骤发生的事情，而不仅仅是一个更高级的提示。

尽管它们有时会有所帮助。——这就是我们在一些学生身上看到的，有时在引入语言模型之前使用传统技术的某些基本自然语言处理技术会产生更好的结果。所以有一些这样的情况。

所以，我想在这里与米莉的工作建立联系。米莉，请利用这个机会向我们的听众介绍一下你自己。但我想把这与你前段时间合写的一篇论文联系起来

这篇论文的标题是《在大型语言模型时代开启关于负责任的环境数据科学的对话》。那么，你能告诉我们什么是负责任的环境数据科学吗？它如何与我们正在讨论的数据质量相关？是的。

一个很好的问题。我认为责任可以意味着很多不同的东西。哦，我想你首先让我介绍一下自己。我是米莉。我是苏黎世联邦理工学院的助理教授。我的工作主要集中在环境政策以及人工智能如何帮助

或阻碍我们实施政策和设计政策。是的，那么责任意味着什么？我认为它真的是一个不断变化的目标和事物。因此，气候领域中许多人工智能应用

并非大型语言模型。迄今为止，许多应用都更像是传统的机器学习，例如计算机视觉或其他预测建模方法。因此，西尔万提出的一些例子，例如洪水预报、森林砍伐检测，人工智能在气候相关决策或政策或

数据管理等方面有很多应用。是的，但对于责任，我认为在这篇论文中，我们特别关注责任在研究过程的不同部分或问题过程的不同部分中的含义，这再次我认为与你谈论的一些主题非常一致。那么，使用大型语言模型进行问题生成、决定我们正在进行哪些类型的研究，与使用大型语言模型帮助我们设计分析或编写代码相比，这意味着什么？这些可能是两件非常不同的事情，并且有非常不同的

责任问题。因此，在我自己的工作中，我试图思考的一些事情是，使用这些工具的成本和效益是什么？再次回到排放点，与这些技术相关的排放量并非微不足道。但同样，许多正在应用并实际上对气候领域产生影响的最佳用例

都是小型模型。并非所有人工智能都是平等的。有很多例子表明，实际上非常节能的模型被用于真正有影响力的工作。

另一件事是，我认为在演讲中已经出现的一个主题是透明度和问责制问题。因此，模型本身以及我们与模型交互的方式中嵌入的过程有多透明。所以是的，我们能否理解结果，以及当

结果错误或以某种不好的方式影响社区的子集时，谁应该负责。你不能仅仅责怪人工智能传感器，你也不能这样做。是的，在这种情况下，问责制甚至意味着什么？我认为我们对谁应对损害负责的传统观念可能会被彻底颠覆。因此，作为一个群体，我们需要认真思考，是的，关于我们把

也许是责备，但也包括我们如何解释自己对决定的责任。是的，然后我认为你的观点是将这个问题框架在偏差以及这些模型可能对不同社区产生非常不同的影响，尤其是在气候领域。因此，这部分是因为

输入这些模型并用于训练它们的数据存在相当大的偏差。因此，你可以想象，这可能会通过我们对这些模型的使用及其下游影响而传播。然后我认为我们在本文中提出的一个观点是，这不仅仅是

是的，这不仅仅是偏差，而且还可能是遗漏偏差。我们经常谈论的是，哦，你知道，答案是错误的。这是来自人工智能模型的结果。

或大型语言模型。这是真的。这绝对会发生。你知道，是的，你可以想出尽可能多的例子。但我认为，同样数量的例子是，例如，仅仅是遗漏偏差。因此，它不一定是，例如，它给了你错误的答案，但它给你的答案可能是某种框架，例如，

全球多数派，并反映了社会几个世纪以来存在的各种不平等，以及我们是否希望这些偏见继续存在，我认为这可能是我们作为一个群体需要思考的问题。因此，关于你首先提出的关于区分人工智能和大型语言模型的观点，因为我认为重复这一点很重要

即使是在大型语言模型之前就存在的机器学习模型，它们也会传播这种偏见。即使是在气候领域之外，你也有信用，在信用领域。因此，为这些信用模型提供数据的模型不是由语言模型创建的，而是由机器学习算法创建的，它们也带有这些偏见。

所以这是关于人工智能的一般性问题。是的，是的，是的。我认为这些偏见普遍存在。我喜欢你关于遗漏和透明度、问责制的观点。因此，关于负责任的人工智能的所有这些观点都是我们在学术领域进行评估时需要考虑的事情。但我也想邀请我们的同事艾米，她正在网上与我们一起，你可以在屏幕上看到她，来反思

同样的主题，但应用于公司领域。艾米，告诉我们你在 Muir AI 的工作，以及你如何帮助公司开展可持续发展倡议、风险管理，以及负责任的人工智能是否也是你日常工作的一部分。

是的，当然。大家好，很抱歉以虚拟方式加入你们，但我非常高兴来到这里。我可以做一个非常简短的概述。因此，我负责我公司 Muir 的合作伙伴关系和客户参与。我非常热衷于将可持续性融入业务运营。

这是我们 Muir 工作的基础。为了快速了解 Muir 的工作，我们有一个 AI 解决方案，可以大规模创建产品碳足迹。因此，我们的系统会从公司的 ERP 系统中提取常用数据，例如产品名称、来源位置、产品质量。从那里，我们可以创建一个产品碳足迹。

而我们合作的公司，他们试图解决的是一个根本性的挑战，即如何更准确地测量和管理与其产品和供应链相关的排放。管理供应链数据非常复杂。

我认为这对于在座的各位来说并不是什么惊喜。这一挑战绝对延伸到可持续性领域，甚至可能更加严重。每天从你最有可能与之建立直接关系的一级供应商那里收集数据都很难，更不用说从三级或四级供应商那里获取数据了。

很难获得用于业务运营的数据。如果你开始询问有关碳排放的问题，这可能是一个非常细致的领域，需要大量的专业知识，那么获取这些数据就变得更加困难。

如果你使用传统方法，如果你有一个顾问团队或其他提供商外出手动计算和创建你产品组合中每种产品的足迹，坦率地说，这将花费所有的时间和所有资源来简单地计算产品排放。最终，他们将没有时间实际处理这些数据，这就是

最终我们想要数据的原因，我们想要利用数据并根据数据做出明智的决策和行动，坦率地说，对于任何公司来说，将所有时间都集中在这个方面都是不现实的，从我们的角度来看，我们在 Muir 做的事情，我们看到市场上其他人正在做的事情是，这就是人工智能真正发挥作用的地方

因为我们可以使用 AI 解决方案以几分钟或几小时的时间快速评估和估计数百或数千种产品的内含排放量，这比使用人力资源来完成这项工作要可扩展得多。这就是我们的客户使用 Muir 的原因。它是为了大规模了解其产品的排放量。

我合作的许多公司都设定了非常雄心勃勃的净零目标。最终，这需要对他们的供应链排放有全面的了解。因此，借助人工智能，我们可以使用他们拥有的数据来估计他们购买或制造的所有产品的产品碳足迹。

这意味着可持续发展团队和那些真正细致的专业人员就可以腾出时间来制定脱碳战略，无论是寻找替代采购决策、制造流程，还是与他们的供应商或他们自己实施可再生能源战略。

但这些团队首先需要这些数据才能制定这些战略。因此，我们使用人工智能来解决的根本性挑战之一就是推进数据驱动的见解，以实现有效的决策。因此，我认为负责任的人工智能，最终要回答这个问题，我们绝对认为人工智能可以成为……

一种可以负责任且有效地用于可持续发展的工具，供采购团队告知优先事项并制定真正有效的脱碳战略。对此的一个快速后续问题，艾米。公司如何平衡规模之间的张力，就像你提到的那样，我们可以大规模地做事情并专注于运营。

以及我想做更多这样的事情而不投入大量资源的张力，同时我该如何保证这项工作的质量，以及我该如何保证这种人工智能创建的数据、人工智能创建的评估是高质量的？最好的做法是什么？

是的，当然。因此，根据我们的经验，一些最佳实践是开放我们为客户查看而估算的数据。因此，这不仅仅是围绕着创建，这是一个数字，你必须接受并继续使用它。但这是一个数字，这是计算结果，这是我们的模型为创建你

作为客户，作为公司，有机会根据你可能拥有的信息进行审查、评估和改进，这些信息最初并未包含在计算中。因此，我们真正努力的是创造这种可扩展性，同时在我们生成和共享这些见解时也具有透明度。谢谢，艾米。我们很快就会回到你这里。

我想请大卫也加入我们的专家小组。你是一位投资者，你专注于投资领域，专注于 ESG，你可能也必须努力平衡决定是否投资公司，做出基于数据的决策，这些数据也可以用于人工智能来帮助你。

人工智能在投资或你所进行的任何相关过程中扮演什么角色？

是的，对于……介绍一下自己。是的。我是德莫特·尼尔，我是 PGIM 的副总裁。我们是普鲁申金融的资产管理部门。我坐在我们的 ESG 中心研究和战略团队中。因此，我们支持我们的七个不同的投资管理业务，所有这些业务都大致按照资产类别进行组织。因此，固定收益、私人信贷、房地产、量化股票，所有这些对 ESG 数据收集和报告都有不同的需求，客户群也大相径庭。所以……

我们所做的是寻找研究需求、工具和分析方面的共同点。正如卡门提到的那样，我们是 TPI 的支持者，但我们也是数据的使用者。听到这里试点项目的一些工作真是令人兴奋。因此，就用例而言，我可能会将其归纳为两个。

两个广泛的用例。一个是数据聚合，即提高报告质量，试图解决覆盖范围方面的差距，尤其是在我们管理的资产中某些资产类别内。第二个用例是数据集成，即将数据集成到投资决策中。根据这些用例，你可以实际应用不同的模型，应用不同的规则。

在聚合方面，资产管理公司熟悉使用各种不同的数据来源来进行 ESG 集成报告。从历史上看，人们非常关注试图提高排放数据的覆盖率，以此作为公司如何管理其转型风险、如何随着时间的推移改善其碳绩效的指标。

但我认为，业界也越来越认识到，碳只是一个指标，你需要更广泛地了解公司如何转变其前瞻性资本支出计划、投资战略以及其产品组合如何随着时间的推移而发展。我认为 TPI 的工作确实证明了并非所有高排放者都是平等的。因此，仅仅查看行业敞口并不能告诉你转型风险敞口的全部规模。

而且，我们越来越希望将对公司的定性评估纳入其中，更多关于其产品战略、公共政策目标、他们设定的目标以及他们是否正在实现这些目标的信息。因此，生成式人工智能和大型语言模型在整合这些定量和定性数据方面特别相关。因此，我们认为，在这里有特别的机会以更结构化的方式整合这些数据。

例如，考虑我们持有的公司中关于净零一致性的问题，我们可以捕捉到更多定性信息，更多公共信息，类似于 TPI 团队正在使用的一些工具所做的事情，尽管它需要强大的分析师监督和人为判断来验证这些结果。我们需要以相当战略性的方式应用它。

我提到的另一个方面是，现有披露严重偏向于发达市场的大型上市公司。我们是一家全球性管理公司。我们投资的不仅仅是大型上市公司，我们还相当大量地投资于私人信贷。因此，存在着大量的中型公司，其中许多实际上位于那些大型上市公司的范围三之内。而且，我们的客户、资产所有者越来越希望我们做额外的工作来收集这些数据

即使披露将大大落后，也要尝试获得更好的代理，更好的方法来估计这些公司的实际排放量、实际转型，并在适当的时候与他们进行接触。因此，我认为在聚合方面，使用这些工具来获得更好的质量估计、试图解决数据覆盖范围方面的差距方面存在真正的机会。然后在集成方面，

这显然还不太发达，但业界仍在进行讨论。我们谈到了这里可能规模较小的其他模型。因此，机器学习、预测性人工智能在投资过程中有更多的应用，我们可以开始考虑

我们如何模拟宏观和国家层面的转型风险、物理风险，以及这如何转化为市场重新定价或某些行业的重新定价的潜在风险。例如，在过去几年中，我们已经看到了美国公用事业公司野火风险的一些例子，在那里，情绪发生了变化，你开始看到它随着时间的推移反映在信用评级和市场中，然后反映到公司基本面中。

然后要包括的另一点是，提高资产级别数据的质量是整个行业的一个关键优先事项。同样，我们认为预测性人工智能在这里有真正的应用。

再次，了解公司资产的所有权模式，不仅仅是关注对物理风险或转型风险的整体敞口，而是实际了解这些资产的脆弱性，这些资产的任何特定特征可以减轻这种风险，任何将在现场进行的转型规划，公司对这些资产采取的任何物理风险缓解措施。

然后在房地产业务中，我们还在考虑房地产资产的价值如何受到排放标准收紧、过度攀升、对节能建筑需求下降的影响。

对物理气候风险的敏感性越来越高，以及抗灾措施（例如洪水风险管理）的价值是多少？这是否仅适用于那些单独的房地产资产，或者他们是否需要与当地市政当局就洪水风险管理等问题进行合作？因此，这是另一个预测性人工智能可以发挥作用的案例，其规模可以更小，资源消耗更少，更具针对性，可以帮助我们检查我们是否提出了正确的问题。

然后回到我的私人公司的例子，当我们与私人公司接触时，我们确实会收集很多非常有用的材料和信息。资产管理行业中私人信贷的大量扩张正在

从银行贷款转向资产管理公司的直接贷款。因此，资产管理公司通常与这些公司的高层管理人员有非常密切的联系。因为它们是中型公司，因为它们在许多情况下严重偏向于工业和公用事业，可以说物理风险和转型风险在许多情况下可能更为严重。所以要

将我们通过直接接触获得的信息与公开信息相结合，例如我们谈到的一些谷歌资源、WRI，其中许多。这种数据非常非常有价值，因为它对持有该数据的人来说是独一无二的，对吧？因此，在你的情况下，因为它不像其他上市公司那样公开可用，所以你可以使用更多的数据，无论你对所做的决策有多少细微差别。

这是一个结构化数据的问题，确保我们提出正确的问题，通过接触向公司证明这些因素的财务重要性，以便接触最终取得成功。非常好。是的，再次强调高质量数据的重要性，这

对于预测性人工智能来说尤其重要，就像你说的那样，因为你确实需要以非常数字化的格式、非常结构化的格式来获取数据。但正如我们所有人之间讨论的那样，对于大型语言模型来说也很重要，因为你确实需要对数据进行某种组织才能理解它。感谢各位专家小组成员的参与。

稍微改变一下我们关于人工智能机会的讨论，考虑一下负责任的数据使用方式，如何整理和分析高质量数据，以考虑该技术本身的风险，以及使用人工智能的方式，以及……

这将如何影响社会的各个角落。所以我要请米莉谈谈她的想法。因此，关于人工智能系统使用的气候数据完整性或人工智能系统本身是否存在任何重要的当前研究差距，更不用说这些大型语言模型的环境足迹等等了。你希望看到什么样的风险

你希望看到学术界在不久的将来解决的问题？是的，这是一个很好的问题。我的意思是，我认为主要风险确实来自输入数据的偏差以及这些偏差的传播。例如，我们是否真的只是

巩固了过去存在的环境不平等？例如，我的许多工作都集中在基于自然的应对气候变化的解决方案以及了解气候变化对生态系统的影响，例如对生物多样性的影响等等。

然后，当我们查看进入我们对这些事情的许多评估的基础数据以及进入优先考虑区域（因为这通常是基于土地或海洋的干预措施）的决策的数据时。

这些数据存在令人难以置信的偏差。例如，在地域上绝对如此。因此，如果我展示一张关于生物多样性所有数据的图，我们可以看到高收入国家的情况，你将看到一张实际上是宏观经济的地图。

所以这真的很引人注目。即使我们查看这些高收入国家，例如美国，你也会看到城市和道路，当然，这并不一定是自然存在的地方。我认为这不仅仅是一个地理问题，也是一个时间问题。因此，当我们查看城市的地图时，我们可以看到……

基础数据中的偏差，这些偏差反映了种族主义政策的遗留影响。因此，你可以看到诸如红线划分之类的事情，这是一种在美国将城市有效隔离的政策，你知道，在……是的，在 20 世纪中期。因此，是的，所有这些事情。

在数据中可见。因此，你可以想象，当我们获取这些数据并对其建模时——然后根据它做出决策——是的，我们从数据中获得所有这些见解，这很好。然后我们根据这些见解做出决策。因此，当你实际做出决定时，你可能会与导致我们拥有数据的实际

偏差或观察过程相去甚远。因此，我认为这又回到了关于理解从原始数据到决策的过程的一些观点，因为你想了解这些观察过程，数据中的这些偏差或差异可能会或可能不会通过你的决策而传播。在很多情况下，实际上，我们有

考虑偏差的方法，这并不是说……就像没有希望一样，但你确实需要非常认真和谨慎，然后我认为……我只是想触及上一个评论中提到的几个要点，其中一个要点是，这再次回到了希望，即许多这些偏差不仅是地理上的，而且也是……

以及在社会中哪些东西很容易被数据化。有些事情更容易考虑或转化为单一指标。我认为大型语言模型可能允许我们实际整合某种非传统或其他认知模式和信息

大概可以进入我们的分析和决策过程。因此，虽然这些技术实际上可以传播偏差，并且在很多情况下确实会传播偏差，但我确实认为它们也提供了一些机制，我们可以利用定性数据

与我们一些更传统的定量数据一起使用。因此，一个解决方案可能是增加覆盖范围以解决这种社会经济差距，但也对数据采取不同的看法，并思考数据还能捕捉到什么，也许它并不完全是可量化的，但应该以定性的方式存在，但它应该在许可证中作为数据被捕获。非常好。谢谢，米米。所以

在个人层面，西尔万，研究人员或分析人员能做什么？你可以采取哪些步骤来增强透明度？或者换句话说，我正在关注透明度和偏差以及所有这些事情，但如果你在这个领域看到任何其他你想减轻的风险，那么个体研究人员/分析人员的作用是什么？

是的，谢谢，约翰。我认为一些观点已经非常清楚地表达出来了，所以我只会重复其中的一些。我认为艾米已经非常清楚地表明，关键的一点是了解你正在使用的数据。就像，如果你是一个领域的专家，并且知道源数据应该是什么样子，

并且你有一种感觉，与米莉在那里的观点相同，你可以更容易地发现某些东西看起来不对劲或看起来不对劲。因此，作为一名研究人员，能够访问越来越大的数据集是很好的，但你确实需要首先深入研究源数据，了解该源数据是什么，然后你可以使用这些提取工具来获取越来越多的结构化数据。但如果你从仅仅使用提取工具开始，

然后尝试查看已提取的数据，你将不清楚它是否获得了有决策意义的信息，或者它是否只是拾取了存在于错误指定的源文档、过多的源文档等中的某些噪声。我认为

否则，我们已经讨论了大型语言模型如何返回误导性内容或不相关内容。我认为这也是……

只要你意识到你在做什么。所以作为一个研究人员，你只需要意识到，如果你进行非常广泛的搜索，并且试图从很多地方获取大量信息并获得简洁的摘要，那么你可能不仅会获得完全准确的信息。你可以用它来开始。即使不邀请增强到战争中，不邀请任何形式的人工智能，这也是正确的。对来源的了解甚至可能与……

作为一项仅由人类完成的工作，对吧？——绝对的，我认为这在所有情况下都是相关的。意识非常重要，但我认为当你使用这类工具时，它变得越来越重要。举个简单的例子，如果你用……

我从那里得到了一些非常好的结果，并找到了很多关于米利的论文。但我也得到了一些来自不同领域的结果，或者它没有意义，也不符合。并且意识到我应该检查每个来源，然后事后阅读论文。这是一个信息收集练习，而不是我的输出。它不是我最终工作中使用的文献综述。

在这个过程中也要注意和尽职调查。所以，艾米，公司和企业的流程是什么样的？那里的风险是什么？有哪些方法可以减轻这些风险以及对小组的任何反应？

是的，你知道，我认为我想补充西尔万的观点，那就是意识是关键，因为它不仅与学术界的研究人员和专业人士产生共鸣，也与商业界产生共鸣。根据我的经验，以及我们从公司听到的很多内容，人工智能通常感觉像一个黑匣子，它通常就是一个黑匣子。你输入数据，输出数据，并不总是清楚……

建模了什么，人工智能系统是如何得出这个结果的？因此，我们真正处理它的方式以及我们如何建立信任以减轻风险并建立一些这种意识，实际上是将透明度扩展到我们的模型以及我们的 AI 解决方案如何得出结果。然后还有该过程背后的实际方法。

这个过程。因此，你知道，我们会与公司进行大量的讨论和发现，以在此过程中建立信任。但首先，透明度确实是最初的出发点。我们特别做的事情，我之前也提到了，我们不仅仅为笔记本电脑的碳排放提供一个数字，因为我现在正在看我的笔记本电脑。我们不会说，这是数字，你必须相信它。

相反，我们所做的是，我们将该产品供应链图及其系统建模方式的完整透明度提供出来。那么，所有构成这台笔记本电脑的元素和组件是什么？我们……

用来制造笔记本电脑的制造工艺是什么？组件最有可能来自哪里？然后，供应链中所有这些节点和链接的排放量是多少？因此，客户实际上可以调查和审查我们的系统所做的事情以及它采取的步骤来创建该数字，以便他们最终可以信任我们提供的结果。

对我们来说，这种透明度水平在我们引导公司信任人工智能系统方面非常重要。然后我们个人做的另一件事是，我们不仅要揭开盖子……

消除一些黑匣子的感觉。但我们也有我们的产品碳足迹方法，经过 ISO 标准的第三方认证。坦率地说，这只是一个对话的开场白，公司可以开始说，根据你共享的数据，根据你每年审查并根据 ISO 标准进行审查的方法，这确实留下了很多信任，并且……

允许公司开始得出这些见解，并使用我们从 AI 解决方案提供的数据来为他们的决策提供信息。很好。谢谢，艾米。

大卫，这听起来耳熟吗？例如关于信任、透明度、尽职调查和偏见缓解的讨论，这在考虑人工智能中的数据时也是你世界的一部分吗？是的，这绝对引起了共鸣，因为我们实际上是艾米合作的公司和我们作为资产管理者以及最终作为这些数据消费者的资产所有者之间的链条中的环节。所以我觉得……

在未来几年，随着欧洲CSRD的出现，随着相当多的司法管辖区实施ISSB以强制执行气候和ESG报告，我们可能会看到大量的信息披露。实际上，将会有更多依赖人工智能生成的指标的企业披露。因此，作为链条中的一个环节，特别是考虑到即将出台的一些关于人工智能的规定以及欧盟人工智能法案，

实际上，责任在于我们制定使用这些数据的方法，以我们对待从供应商那里获得的其他ESG数据的方式来审查这些数据。因此，我想无论人工智能如何，我们都会花很多时间验证我们从第三方供应商那里获得的数据，修改这些数据，进行合理性检查，以确保这是我们向客户报告的公司影响的准确体现。

人工智能可以帮助解决其中的一些方面。因此，我们的数据质量检查，生成式人工智能显然非常擅长模式识别。我们可以检测公司影响逐年变化的情况。

但实际上，我认为当我们查看这些数据并考虑人工智能的使用时，我们需要意识到三个核心原则，这既包括我们投资的公司，也包括我们在将这些工具用作我们报告的一部分时内部使用这些工具的情况。首先，再次是关于数据和信息来源的观点，因此要了解模型的训练对象、数据的准确性以及联合国气候变化框架公约与较小的非政府组织（你可能对数据不太有信心）之间的区别，了解它是如何使用的。

第二点是模型透明度，因此要了解这是否是生成式人工智能还是较小的预测性人工智能模型，这些算法背后的假设是什么，该模型是否适合此用例，如果是报告，如果是集成，则了解我们正在使用正确的模型，它在输出方面是合适的。

而且它在负责任的人工智能的资源使用方面也是合适的。然后最后一点实际上是再次检查这些输出，进行分析师监督。所以，再次查看……

逐年变化的数据，将不同行业和领域的公司与同行进行比较，并真正进行额外级别的动物审查，以确保这些输出看起来准确。我认为最后一点确实暗示了这里存在权衡，这与TPI团队所经历的类似，即使用这些工具快速扩展……

披露和覆盖范围的机会以及数据的准确性和可靠性之间的权衡。所以我真的认为你需要对如何应用这些工具有相当的策略。你需要考虑重要的部门，还要考虑目前服务不足的资产类别以及如何在这些领域更策略地使用这些工具，而不仅仅是试图全面增加覆盖范围。并且考虑到你随后在检查、验证数据方面将面临的挑战。很好。

在我看来，未来将会有很多气候数据分析师的工作。因此，人工智能不会接管这些工作。我们已经从小组中的每个人那里听到了让“人”参与其中以及让人类检查和验证信息的重要性。因为从这次谈话中，在我看来，信任和透明度是非常人性化的价值观，我们不能将其归因于机器。或者从我们的谈话中我这样理解。

让我们打开会场，提出问题——请提问——如果你有任何问题，请举手。我们将——有人会把麦克风递给你。如果你正在网上观看我们，你也可以在那里输入你的问题，我将在我的平板电脑上收到它。

当你发言时，请说明你的姓名、你的隶属关系并直接提出你的问题。如果你在演讲中继续下去，我将不得不打断你。所以是的，中间先来第一个。我先提两个问题，然后让小组对此做出反应，然后我再回来回答更多问题。谢谢。嗨，我是来自气候治理倡议的夏琳。

我对数据、政策、投资和金融之间的相互作用很感兴趣。我想我实际上是向整个小组提出的问题是，我们有多担心欧盟综合法案？

以及他们就ESG报告提出的范围大幅缩减的问题。你认为人工智能能否填补这一空白？如果可以，如果没有公司自己报告，特别是涉及到中小企业时，将使用哪些来源？

所以差距在于，你对数据政策、投资金融以及中小企业和其他私营公司可能报告的差距感兴趣，这可能没有在那里体现出来。相对于一些最近的监管变化。最近的法规。好的，很好。完美，完美。好的。还有其他问题吗，是的，我们这里还有一个。嗨，我正在打断这次活动，告诉你另一个我们认为你会喜欢的很棒的LSE播客。

LSE IQ邀请社会科学家和其他专家来回答一个聪明的问题，例如为什么人们相信阴谋论，或者我们能否负担得起超级富豪？来看看我们吧。只需在你获取播客的任何地方搜索LSE IQ即可。现在回到活动。

精彩的小组，伙计们。每个人都能听到我说话。梅丽莎，我发现关于历史不平等被嵌入数据中，以及这如何导致未来出现不良结果的主题非常引人入胜。我认为获得你对这些数据集的一些实际挑战的看法，以及你今天甚至在使用人工智能时看到负面影响的地方，将是非常好的。

非常感谢。所以第一个问题是关于最近的法规，我们如何看待这一点，然后是历史数据，那里的实际挑战。任何人都想对任何特定内容做出反应吗？我可以处理监管要点。所以是的，我的意思是，我想说综合法案仍然是提案。它们仍在评估中，仍在通过欧盟结构。如果它们采取目前提出的形式，

它们目前提出的形式。你可能会看到从公司到投资者的实际经济数据减少了很多，因此公司直接披露的数据减少了。话虽如此，我认为在ISSB方面，在投资者对公司尝试披露这些数据的要求方面，前进的方向非常明确。标准化确实降低了投资者和公司收集这些数据以及……

为投资者提供可比方式的成本。因此，我认为无论综合法案发生什么，特别是那些可能在范围内的中小企业，

我认为仍然会有很大的压力来收集这些数据进行披露，我认为人工智能不可避免地会在填补空白方面发挥作用。这对于范围三排放尤其重要，因为在历史上，我们非常依赖投入产出模型来估算公司的范围三排放。对于大多数公司来说，这占其碳足迹的80%。因此，我们可以做任何事情来获得更准确的产品级和商品及服务级的碳足迹，我认为这会有很大帮助，而人工智能可以发挥作用。

我最近参加了路透社欧洲报道会议，基本上与英国和欧洲的几家汽车制造商的首席可持续发展官讨论了这个确切的主题。

电子产品制造商。我认为我从他们那里真正得到的启示是，这份综合法案实际上是让他们喘口气并收集良好数据，然后报告他们可以应用人工智能系统来获得战略见解、帮助塑造公司战略、寻找效率的良好数据的机会。在CSOD第一波或CS三倍D第一波下发生的事情是，

公司只是在四处寻找数据，而这并不是真正好的投入。他们只是努力工作以获得一些东西来满足法规。因此，对于第二波，公司有两年的宽限期，我认为至少领先的公司现在正在退后一步思考，好吧，我们非常努力地为合规做好了准备。现在我们已经拥有了一些数据基础。我们如何改进这个基础？然后我们如何应用人工智能工具来获得战略见解？

从那件事中。所以我从公司那里听到的是，他们中很少有人实际上已经开始使用人工智能来做除了文档摘要之类的事情。这些大多是实体经济公司。但他们对拥有更好的某种ESG数据湖的单一事实来源感到兴奋，他们必须在合规之前创建这种来源。现在他们有了短暂的休息，他们实际上也许能够重新排列数据集并用它做些什么。所以我认为我对……

这将如何影响长尾并不那么悲观。我认为在最初的两年里，是的，我们将获得的数据会少一些。但我认为，当我们获得这些数据时，它将是更好的数据。很遗憾，一些公司正在退出范围。但同样，主要公司仍在范围内，以及他们的一些一级供应商，这将涵盖许多其他公司。然后也许人工智能可以帮助弥补我们将拥有的更好事实来源的差距，这与我们今年拥有的差距相比，

公司为遵守规定而做出的匆忙准备。当然。我认为艾米说得对。是的，谢谢。是的，对不起。如果我也可以插一句，你知道，尽管目前的综合法案提案看起来是什么样子，但我们从公司听到的是，特别是那些，你知道，财富10强、财富50强，他们已经公开设定了，引用，

净零目标。他们并没有，你知道，调转汽车方向。正如大卫所说，前进的方向是明确的。这些公司不仅仍在推进其净零目标，而且它们现在正在发展到开始……

要求其一级供应商提供数据以融入他们自己的战略的地步。因此，虽然中小企业可能不再受综合法案和法规的影响，但这并不意味着公司没有仍在推动针头前进，以请求和……

这种类型的数据。当然在美国，这确实是我们在私营公司中看到最大变革的地方，这些公司一直在带头，而联邦法规却滞后。我认为这可能也会反映在欧盟，但这当然并不意味着公司正在全面放弃他们的承诺。相反，他们专注于自己的优先事项，并与他们的供应商合作以实现他们自己的净零目标。

优秀。谢谢，艾米。米莉，你想对第二个问题做出回应吗？或者第一个问题，对监管环境做出反应，如果你愿意的话。不，我会跳到第二个问题。我觉得对第一个问题的回答都很好。

是的，我的意思是，这是一个很棒的问题，而且是一个非常复杂的问题，我认为原因有几个。首先，其中一些，例如，偏见或明显的偏见或数据差异实际上是，例如，反映了社会、人们、我们的历史、我们的经济变化的方式。

例如，影响生态系统，影响我们世界运作的方式。因此，我们并不总是想仅仅消除任何存在偏见的地方。有时，例如，

偏见实际上是让我们洞察不同过程影响的模式。所以我举的例子是美国的分区或住宅隔离，以及这如何影响我们关于生物多样性及其在气候变化背景下变化的信息。在某些方面，例如，

分区影响了社区的绿地，从而影响了生物多样性，因此这些社区的生物多样性可能实际上较少，因此数据也较少。所以这是一个有点复杂的情况。对此的一种实际回应，也许是一个明显的回应是，好吧，我们在数据缺口的地方收集更多数据。

当然，这将解决这个问题。这方面有几个挑战。其中之一是，在我们存在数据缺口的地方，很多地方是因为收集数据很困难，或者这些社区中的一些是世界上受到最严格监控和管制的社区。因此，考虑收集环境数据也是收集人类数据以及确保在数据收集过程中以及在填补数据缺口过程中获得社区同意非常重要。

我认为这回到了我的最后一点，那就是不仅数据中存在地理上的历史偏见，而且在谁拥有和管理数据方面也存在偏见。因此，你可以看到殖民主义在谁拥有、管理、处理来自世界不同地区的数据方面的许多模式。因此，我认为关于收集更多数据的这一点，但这也是关于转移所有权和管理以及数据使用以及分散这些过程的一些问题，这样……

你知道，更广泛的人群可以参与其中，是的，所有这些过程，并对事物如何通过决策和政策传播拥有代理权。是的。

很好。我将从在线观众那里提一个问题，然后我将回到会场。所以，安·陈给我们发来了这个。为了加快基准测试和提高数据质量的完整性，从而创建最佳实践建议，个体企业披露比所需更多数据的最大挑战是什么？

如果存在隐私问题，能否克服这些问题以鼓励合作和为更大的利益共同努力？任何人都想解决这个问题吗？我认为这里的假设是，在这种情况下，它是被管理的。

我认为正如问题所暗示的那样，显然存在推动越来越多的ESG影响、ESG风险披露的压力。我认为ISSB做得相当有帮助的一点是，它确实让公司开始考虑特定ESG因素对其商业模式的重要性，并披露对其特别重要的因素。这对于投资者来说也是一个有用的视角，既是从财务重要性角度，也是从双重重要性角度来考虑他们正在寻找的公司数据。所以

我认为更多的数据显然对基准测试很有用，但正如我们在TPI的图表中看到的那样，随着时间的推移，这些数据会产生递减的回报，特别是如果它是人工智能生成的，那么在质量方面就会存在权衡。如果我们使用数据进行基准测试，我们希望它能够真实准确地反映公司在实地开展的工作，而不仅仅是为了报告而报告。

是的，当然。我可以补充一点。我认为这绝对取决于他们报告的数据比必要的数据多多少。强制性披露要求是有原因的，公司应该专注于遵守这些要求。

法律法规。在TPI，我们很高兴看到公司披露额外信息，无论是通过SPTI、基于科学的目标倡议，并获得这些信息的验证。我认为机会在于，当他们收集之前可能在信息中某个地方但尚未整合在一起的额外信息时，然后可以使用它来推动战略、寻找效率，以及

并优化流程，无论是能源使用还是水浪费，我最近从几家公司那里听说，由于法规的强制，他们必须披露他们在泰晤士河水域的水使用情况，他们没有意识到他们在水使用上浪费了多少钱，因为过去没有人费心去检查，他们建立了一个闭环系统，节省了一大笔钱，也减少了灰水的浪费，所以我认为无论是强制性要求还是非强制性要求，无论是……

由人工智能还是传统技术分析，收集以前未收集的数据，然后考虑如何使用它来推动战略，这就是机会所在，而不仅仅是成本。会场还有其他问题吗？我认为我们那里有几只手。那边穿西装的人。然后我们在中间穿绿色衬衫的人。请过来。

嗨，我的名字是普兰贾尔。我来自奥斯本·克拉克。非常感谢你们的演讲。这真的很令人感兴趣，很高兴听到这么多人都在思考这里的交叉点。我的问题实际上相当自私。考虑到我的角色，我与可持续性数据打交道很多。

我的公司报告范围一和范围二排放。我们做了15个范围三类别中的11个。在我的工作中，我发现相当具有挑战性的是收集数据，使其准备就绪，足以进行保证流程。

而且我意识到人工智能有机会帮助解决这个问题。但我也在退缩，思考这是否可能创造一个家庭产业，我们必须考虑人工智能的使用不同来源，不同的LLM，以及这如何从验证的角度来看可能造成更多复杂性。

所以这是一个向小组提出的开放性问题，人工智能是否也存在造成数据更多复杂性，从而导致更多验证挑战的风险？谢谢。也许是更多不必要的复杂性。所以中间穿绿色T恤的人，那里有一只手。你能再次举手，让观众看到吗？是的。后面还有更多的手。是的，那边穿蓝色衬衫的人。

嗨，谢谢。我是斯嘉丽，我在这里攻读MSC环境与发展硕士学位。在MSC，对不起。我有一个问题。

角度略有不同，但从不同的角度来看，那就是，你是否发现关于人工智能伦理的讨论实际上鼓励人们更深入地思考数据的完整性，并评估他们在决策过程中的立场？因为在我看来，

人工智能正在加剧，但也突出了现有问题，而不是仅仅制造新问题。所以我想知道这些论述是否存在，或者你是否觉得它们仍然被忽视了。让我们从后面提最后一个问题。

嗨，你好，我叫罗伯托，我是一名气候技术专家。根据我的经验，我注意到，为了使数据具有可比性，最好的方法是如果行业可以交叉合作并计算和共享数据

用于相同的流程和相同的供应链。例如，航运业、采矿业。我认为这是最有效的方法，基本上，你可以进行基准测试，并且你可以更有信心将苹果与苹果进行比较。

到目前为止，在过去的两年里，我只看到汽车行业为制定如何计算碳足迹、数字产品护照以及如何在不同供应商之间共享数据做出了巨大努力，但我没有看到其他行业有任何类似的事情。我只看到大公司在这里做自己的事情，在那里做自己的事情。

你的看法是什么？你认为是否应该加强跨行业关注和合作，以鼓励这种准确和高质量的基准？非常感谢，罗伯托。所以我们这里有非常非常有趣和互补的问题。所以第一个问题是关于人工智能是否引入了更多复杂性。第二个问题是关于……

关于人工智能伦理的对话，这是否导致人们更认真地考虑数据的完整性，以及最后一个问题是关于我们是否需要更多跨行业合作。我们小组对这些问题的任何想法？我认为所有这些问题实际上都很好地结合在一起，因为你提出了第一个问题，第二个问题指出了某些解决方案，然后第三个问题也指出了某些解决方案，其中……

我认为人工智能及其带来的复杂性，尤其是在信息验证方面，欧盟人工智能法案中可能出现的一些审计要求实际上确实促使投资管理行业对底层数据完整性、模型治理、我们如何摄取数据、我们如何检查这些数据进行更多思考。所以我认为这将有望导致行业内部围绕共同原则（如果不是共同标准的话）进行更多对话。

投资管理行业、负责任投资行业非常擅长在法规出台之前在市场上合作建立共同原则。我们在金融排放方面这样做，我们在所有方面都这样做……

关于净零投资框架，关于财政风险评估越来越多，通过IAGCC开展大量工作。这实际上是昨天IAGCC峰会上提出的讨论点之一。我们是否应该对如何将人工智能衍生的数据整合到报告中、整合中制定共同原则？所以我认为这将促使更多此类讨论。我希望这将导致……

行业内对原则的共同协议，我认为按行业进行可能是一种方法，因为很多事情都关注价值链。正如你提到的那样，汽车行业在促进标准化、试图避免双重计算、在整个价值链中追踪数据方面确实带头。所以我认为在其他行业中看到这种做法的复制可以帮助报告者降低收集和报告这些数据的成本，并可能降低审计成本。- 你有什么反应吗？

是的，我认为关于人工智能是否会增加报告复杂性的问题绝对是有效的。而且确实如此。我的意思是，归根结底，我们正在将更多数据引入论坛和公共领域。话虽如此，我认为我们不应该回避使用人工智能来增加……

创建更多数据并创建更多分析，人工智能可以成为这样做的工具。因此，你知道，我们应该继续推动审计师和保证公司前进，以便他们能够有效地评估和查看人工智能生成的数据，我认为这正是我们需要看到该行业发展的地方。跨行业合作和系统化……

系统化数据非常重要。我们遵循PACT（碳透明度伙伴关系），它真正专注于标准化范围三价值链排放数据共享。

而这最终是为了以系统化和标准化的方式推动更多数据、更多开放数据，以便其他人可以使用它。所以我们正在引入更多复杂性，但我认为这是为了让我们超越我们所处的阶段，开始收集更好、更有影响力的数据。米莉，有什么反应吗？

是的，我的回应主要针对第二个问题，但也包括第一个问题。只是批判性地思考何时何地更多的数据实际上是有价值的。我认为这也可以追溯到西尔万关于数据如何转化为决策过程的观点，以及我们是否只是在创造比人类启发式或决策过程所能整合的更多的数据。我认为这是人工智能在将数据转化为决策策略方面具有很大价值，同时也存在很大风险的地方。这赋予算法很大的权力来做出决定，或者

真正推动决策，而不仅仅是创造一堆扔给人类做决定数据。这是一个细微的差别，但我认为这是一个重要的差别。是的，批判性地思考何时需要更多数据，以及何时使用算法对数据进行第二阶段的处理以做出决策。

是的，对于第一个问题，我完全同意，来自人工智能的更多处理层可能会增加您需要经历的验证过程的复杂性，以确保其可靠性。我认为，真正批判性地思考，这在这里有用吗？例如，我是否需要使用人工智能来处理这些数据？我能否使用更简单的过程？

模型，一些R代码，或者我根本不需要这些数据？因此，在应用之前不要考虑您想要回答的问题

将工具应用于您拥有的任何数据源，我认为这正成为比以往任何时候都更重要的理解数据的重要过程，但我认为它比过去更重要。我认为这也可以回答第二个问题。数据一直存在挑战。理解数据一直存在挑战。数据中一直存在偏差。我认为，当我们考虑将越来越多的决策控制权或越来越多的控制权

从问题形成到最终决定生成模型或任何其他形式的模型的思维和决策过程的部分，这些讨论只会变得越来越重要。因此，我同意这些讨论并非新讨论，但它们现在可能比过去更重要。非常感谢。顺便说一句，我想说的是，我们现在正在讨论的主题

渗透到我们进行的试点项目和课程中。西尔万在那里是一位非常重要的合作者。我要非常感谢您参与我们的试点项目，还要感谢TPI中心主办此次活动。我们可能会——我们很可能会对此进行总结。其中将包含一些这些线索以及一些关于高质量数据背后的思考，关于效率的思考，负责任的人工智能肯定也会在其中某个地方出现。

我要感谢各位的光临。我要感谢我们的演讲嘉宾。我们已经接近尾声了。随意与我们互动，与我们交流。如果您想了解更多关于TPI中心的工作，请访问他们的网站transitionpathwayinitiative.org，并查看他们的评估工具和数据发布。并查看数据科学研究所的网站。伦敦政治经济学院数据科学研究所也是如此。我们是好朋友。

非常感谢大家。祝大家晚上好。感谢您的收听。您可以在您最喜欢的播客应用程序上订阅LSE Events播客，并通过留下评论来帮助其他听众发现我们。访问lse.ac.uk/events以了解接下来有什么活动。我们希望您很快能再次加入LSE Events。

Harnessing AI: safeguarding high-integrity data for climate action 01:31:14 Share

LSE: Public lectures and events

Deep Dive

Shownotes Transcript

Harnessing AI: safeguarding high-integrity data for climate action