We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Graphs for Causal AI

Graphs for Causal AI

2025/5/24
logo of podcast Data Skeptic

Data Skeptic

AI Deep Dive AI Chapters Transcript
Topics
Utkarshni Jaimini: 我致力于研究因果神经符号AI,旨在提升人工智能系统的可解释性,使其能够像人类一样理解因果关系,而不仅仅是依赖统计相关性。统计学在处理安全关键型应用时存在局限性,例如医疗保健,仅仅依赖相关性可能会导致错误的结论,危及人类生命。因此,我们需要在AI系统中引入因果推理,以确保其决策的可靠性和安全性。我通过知识图谱来表示因果关系,并使用神经符号方法将知识图谱转换为向量空间,从而实现链接预测等任务。同时,我也关注知识图谱中可能存在的虚假相关关系,并提出了因果LP back等方法来减轻这些关系的影响。我的最终目标是创建一个整体框架,将贝叶斯网络和领域知识整合到一个空间中,从而实现更可靠、更可解释的AI系统。 Utkarshni Jaimini: 为了更深入地理解因果关系,我研究了后门路径问题。后门路径是指连接因果变量和效应变量的非因果路径,它会导致虚假的相关性。例如,吸烟和肺癌之间存在后门路径,即吸烟基因。吸烟基因会导致人们吸烟,也会导致人们患癌症,因此不能简单地说吸烟会导致癌症。在研究吸烟导致癌症的关系时,必须考虑吸烟基因这个后门路径。为了解决后门路径问题,我开发了因果LP back方法,该方法通过考虑后门路径来进行链接预测,并在评估空间中删除后门路径,从而提高链接预测的准确性。此外,我还研究了中介者在因果关系中的作用,并提出了使用超关系图来表示中介者的方法。通过这些研究,我希望能够更全面、更准确地表示因果关系,并将其应用于实际问题中。

Deep Dive

Chapters
The episode begins with a discussion on how network science predicted the election of the new Pope, using data from who ordained whom, official co-membership, and informal relationships among cardinals.
  • Network science was used to predict the election of the new Pope.
  • A research team from Italy used three main sources: who ordained whom, official co-membership, and informal relationships among cardinals.
  • Robert Brevost (Leo XIV) had the highest eigenvector centrality in the network.

Shownotes Transcript

如何构建理解因果关系的人工智能系统,超越简单的相关性?众所周知,相关性并不等于因果关系。“虚假相关性”可以显示,例如,不断上升的冰淇淋销量可能与更多溺水事件在统计上相关,但这并非因为两者之间存在因果关系,而是由于存在诸如温暖天气之类的未观察到的共同原因。我们的嘉宾,南卡罗来纳大学人工智能研究所的研究员Utkarshani Jaimini试图通过使用包含领域专业知识的知识图来解决这个问题。知识图(信息的结构化表示)与神经符号AI领域的 神经网络相结合,以表示和推理复杂的关系。这涉及创建因果本体,包含因果关系和超关系的“权重”或强度。该领域有许多实际应用,例如AI可解释性、医疗保健和自动驾驶。关注我们的嘉宾Utkarshani Jaimini的网页LinkedIn论文重点CausalLP:使用加权知识图链接预测学习因果关系,2024HyperCausalLP:使用超关系知识图进行因果链接预测,2024</context> <raw_text>0 您正在收听Data Skeptic,图与网络播客,该播客探讨了图数据结构如何影响科学、工业以及其他领域。对不起,你知道的,我想我们有一些重要的事情要谈,我们忘记提了。是的。我认为你应该说Habemus Papam。我们有新教皇了。啊。

我之所以提到它,是因为这里有一个基于网络科学对下一任教皇是谁的预测。太吸引人了。告诉我更多。在教皇当选的前一天,来自意大利巴科尼大学的一个研究团队发表了一篇红衣主教网络或梵蒂冈网络的文章。他们使用了三个主要来源。他们使用了谁任命了谁。

好的,因为那里有一种庇护制度,以及在教会机构中的正式共同成员资格和非正式关系,例如两者都曾在文章中被提及等等。所以……

他们为红衣主教定义了三个突出标准,例如他们使用特征向量中心性来衡量的使用状态。我认为我们提到过,但特征向量中心性是你获得高分的中心性,如果你与具有高度的节点相关或在该节点的邻域内。

他们使用信息控制,为此他们使用介数中心性来衡量节点在网络两侧之间架桥的程度。他们使用红衣主教的能力,他们试图通过使用局部聚类系数来衡量红衣主教建立联盟的能力。所以节点邻域中有多少个三元组是封闭的,对吧?

所以他们使用了这三种方法,这篇文章是在前一天,他们发现罗伯特·布雷沃斯特,或者我应该说利奥十四世,在网络中具有最高的特征向量中心性。

我希望我之前就知道这个。我会在他身上押一些钱的。是的。但令人着迷。他们是否探讨过这种技术能否预测之前的教皇?好问题。但我之所以知道他们没有这样做,或者我猜它之所以引起关注,是因为它成功了,对吧?如果它

当然。如果它没有成功,我们不会——还有10篇其他论文用其他方法预测它,但没有成功,我们不知道。我相信有。我相信有。好吧,很高兴知道他们对伟大的教皇算法进行了反向工程,对吧?红衣主教们不会进入房间并运行一些软件,这就是他们做出决定的方式吗?是的。

机器过热,黑烟冒出来了。白烟。好吧,一旦它成功了,是的。是的,没错。好吧,我很高兴这个问题解决了。他们有了一个新的领导者。网络科学预测到了这一点。因此,关注下一轮的预测,看看相同的技术能否产生富有成效的预测将会很有趣。我希望利奥十四世长寿。

健康长寿。人们指出他像我一样是芝加哥人,这很有趣。无论如何,今天我们将讨论一个我们之前讨论过的话题,那就是知识图,但我认为是在新的背景下。并与因果关系和贝叶斯推理等问题联系起来。Asaf,你对我们今天要讨论的论文有什么看法?实际上,这非常有趣。

但是,你知道的,你不必说服我网络有助于解释事情,对吧?所以将我们的数据建模为网络的整个想法是为了简化、理解和解释数据,对吧?当然。但是当我想到知识图时,好吧,实际上,除了我的笔记之外,她分享的一个有趣的见解是知识图本质上是不完整的。总缺少一个链接,对吧?我们不知道全部……

确实。确实。

我的名字是Utkarshni Jemini,我目前是南卡罗来纳大学人工智能研究所的研究生。这是我最后一个学期。我将在夏天毕业,我希望很快在秋季成为大学的助理教授。你能分享一些你正在学习的细节吗?你在研究生院做些什么研究?

我从事因果神经符号AI的研究,它位于因果关系和神经符号AI的交叉点。我在研究和其他领域的目标是:如何让人工智能更容易让人们理解?我们可以做因果关系,以便我们人类理解因果关系吗?

但是这些AI系统并没有这样做。它们主要基于相关性或统计关系进行学习。所以我想让AI系统学习类似人类的因果理解或类似人类的因果推理。这就是我对AGI的目标。为什么统计数据不足?我们知道软件非常擅长做统计,统计可以找到相关性。我们还需要什么?它不需要因果关系。

我相信人们听说过虚假相关性,我们看到冰淇淋销量上升,而且更有可能有人死亡。所以在那个阶段,统计会导致这种类型的分析或关系,即更高的冰淇淋销量会导致更高的人数,更多的人在游泳池或让我们说海洋中溺水。但我们需要深入了解其背后的原因。

AI有一些安全关键的应用,例如医疗保健。我们不想仅仅依赖相关性。假设有一种疾病与症状高度相关。你不想说这是原因。

但这不仅仅是,它不是原因。这只是你学到的一个统计关系。这只是相关性。如果我们考虑在医疗保健、工业制造或自动驾驶等安全关键应用中使用AI,我们希望进一步深入到因果关系中。因为如果我们做出了错误的主张,就会危及人的生命。

在统计学领域,我们有标准方法。每个人都知道t检验和卡方检验以及这些东西。是否有检查因果关系的既定方法?所以t检验、独立性检验,它们是预测某事物可能是可能原因的良好预测指标。我们在因果关系中也有类似的标准。所以我遵循Udapil的

哲学做微积分。所以在这些领域中,我们有一些叫做干预的东西,为了衡量干预的效果,有三个参数,例如总因果效应,它计算或估计对处理变量的干预,并查看它如何影响结果变量。

同样,如果涉及中介者,那么将其视为串行链。所以A导致B导致C,B是一个中介者。所以现在你想估计这个中介者的影响如何影响从A到C的因果关系。为此,我们有两种不同类型的效应估计,因果直接效应和因果间接效应。所以我会说那将是三个变量或估计值。

我对某些符号技术非常熟悉,例如历史技术,也许是一阶逻辑以及这类东西。但你特别提到了神经符号。它有什么不同?所以基本上,神经符号处理的是,是的,我们确实有逻辑。当我谈到神经符号时,我指的是具体的知识图。所以一切都是三元组的形式。

从A到B的链接是知识图中使用RDF或描述逻辑表示的三元组,如果你想使用的话。有不同类型的知识图。所以人们使用了标记属性图。我的研究处理基于RDF和RDF星知识图的三元组知识图。所以在这种意义上,一切都是,所以它将是三元组的形式,A导致B。这是神经符号的符号部分,是的,这是知识图。

我们将这个知识图转换为向量空间或嵌入空间。所以每个节点或每个关系都将表示为一个向量。

这成为它的神经部分,将两者结合起来就成为神经符号。所以一旦你将这个知识图转换为向量空间,现在你可以做某些AI应用程序或下游任务,例如链接预测。所以给定这个链接或A导致的部分链接,我想预测A导致什么,A导致B,A导致其他节点C或D,例如。

然后可以完成的其他任务是聚类。将知识图中相似的节点聚类在一起或将知识图中的节点分类在一起。我希望大多数听众都熟悉文本嵌入,例如大型语言模型幕后发生的事情。你给它一些文本,你会得到一个类似的向量,这个向量表示,你知道,具有这些令人毛骨悚然的属性,你知道,国王减去男人加上女人等于女王之类的东西。它有上下文。

你在你做的嵌入中是否发现了等价物,或者为了获得正确的知识图嵌入,这个过程中是否存在细微差别?♪

在当今数据驱动的世界中,能够从数据中提取价值不仅仅是一种优势,它至关重要。掌握分析可以改变你的职业生涯和你工作的组织。轮到你去通过分析改变你的职业生涯并推动组织成功。让我告诉你佐治亚理工学院谢勒商学院的商业分析研究生证书。

它是100%在线的。谢勒学院在美国排名前10的商学院中为忙碌的商业分析专业人士提供服务。他们拥有一流的教师,可以帮助你在一年的时间内毕业,但是

但也许你像我一样忙碌,你想慢一点。你可以将灵活性与严格的教育相结合。谢勒的研究生证书项目适应你的生活,而不是相反。他们的项目是为像我们这样的专业人士设计的,他们希望利用数据并解决现实世界的业务挑战,但需要灵活的时间和安排。

这就是为什么你可以按照对你来说有意义的方式安排你的课程。最重要的是,你不仅仅是在获得证书。你可能会打开佐治亚理工学院享有盛誉的MBA项目的大门。现在是时候成为佐治亚理工学院商业分析研究生证书的数据精通领导者了。2026年春季的申请现已开放。

访问techgradcertificates.com了解更多信息并在8月1日的截止日期之前申请,网址为techgradcertificates.com。

Delete.me使在线删除你的个人数据变得轻松、快捷和安全,在一个监控和数据泄露普遍到足以使每个人都变得脆弱的时代。你的数据是一种商品。网络上的任何人都可以购买你的私人详细信息。这可能导致身份盗窃、网络钓鱼企图或骚扰。但现在你可以保护你的隐私。这就是我一直使用Delete.me的原因。该服务最好的方面之一是,当你第一次注册时,他们会让你灵活地从基本信息开始。你选择你希望他们保护哪些细节。

我一开始比较保守,但在看到他们详细的移除报告并亲身体验了他们的服务后,我更有信心扩展我的保护范围。Delete.me服务带来的安心感是无价的。知道一个专门的人类隐私专家团队正在积极努力保护你的个人信息,让你能够专注于生活中最重要的事情。

有些移除会在24小时内完成,而另一些则可能需要几周时间。但Delete.me会管理所有这些。他们在整个过程中都会让你了解情况,他们的季度报告会准确地向你展示他们正在做什么来保护你的隐私。通过立即注册Delete.me,以我们听众的特别折扣来控制你的数据并保持你的私人生活私密。今天,通过短信发送DATA到64000,即可获得Delete.me计划20%的折扣。获得20%折扣的唯一方法是发送短信DATA

到64,000,即日期为64,000,短信和数据费率可能适用。

我希望大多数听众都熟悉文本嵌入。你在你做的嵌入中是否发现了等价物,或者为了获得正确的知识图嵌入,这个过程中是否存在细微差别?有。所以你可以使用不同的知识图嵌入技术。正如你明确提到的,国王和王后。所以我们有类似的基于距离的嵌入空间。

有基于矩阵的损失函数。所以嵌入空间可能与文本嵌入非常相似。并且在那里要做很多工作,决定嵌入的大小或定制和调整它,还是它是一种现成的?

现在它是现成的,但我肯定正在研究如何改进这个嵌入空间,就另一个我们正在研究的参数而言,称为因果效应。正如我所说,我们有这三种不同类型的因果效应,并且

以及如何将这些效应直接融入嵌入空间。所以目前,我正在使用该领域已经完成的一项工作,开创性的工作,他们称这篇论文为Focus E,他们在其中将权重纳入了损失函数。

但是我目前正在研究的是,我能否直接将权重纳入嵌入空间并将其用于下游任务?这对我个人来说是一个开放的研究领域。知识图的一些常见应用是什么?

所以我看过的一个常见应用是,正如我所说,例如链接预测。然后知识图也用于解释,因为它们被认为是领域知识。所以一切必须,例如,存在生物医学知识图,存在基因知识图,这基本上意味着关于基因或任何特定疾病或症状的所有已知信息都在该知识图中。

所以它们可以进一步用于解释。所以假设神经网络给你一个你拥有的结果。我举一个医疗保健的例子,你患有这种特定疾病。你可以将该疾病映射到知识图中的一个节点,并追踪路径,看看该疾病如何与你可能在数据集中观察到的症状或特定基因相关联。

链接预测的问题,我们为什么进行链接预测,是基于知识图本质上是不完整的假设。我们确实说它具有领域知识,但我们也做出了这样的假设,即仍然存在我们尚未合并的信息或知识,或者知识图中仍然不存在的关系。这就是我们有链接预测这个应用的原因。

所以知识图不完整是有道理的。是否担心它也有一些误报,即某种程度上是虚假的边?这是一个有趣的问题。所以这基本上归结于我的工作。那是后门路径,它谈论的是可能存在的虚假关系。所以本质上,它不应该。这取决于你是否正在创建知识图。假设你使用LLM来创建知识图。

并且这些虚假关系很可能存在于其中。但另一方面,由领域专家创建的知识图,假设是由于他们是领域专家,并且这些知识图是基于本体的,因此不太可能存在这些虚假关系。但在存在这些虚假关系的情况下,这就是我的工作发挥作用的地方,即我们如何使用因果LP back

或知识图本身的后门路径来减轻这些虚假关系,这些虚假关系在下游任务中的影响。什么是后门路径?所以,后门路径基本上是非因果路径,它连接如果因果变量与其效应变量。

以一种影响程度的方式,它们都是混杂因素,以及影响原因变量如何影响效应变量的方式。所以如果我举一个A导致B的例子,可能有一些共同的变量。假设有一个变量D,它同时影响A和B。

所以,为了仅仅分离A到B的关系,我们必须确保我们正在考虑变量D。你只是从上下文或现有的网络中知道这一点,还是可以学习的东西?这可以学习。此外,我们确实可以通过上下文了解这一点。所以,我又回到了医疗保健的例子,因为它很容易让每个人都理解。所以可能有一种疾病会导致症状。

可能存在这种疾病会导致症状的上下文。所以医疗专家或临床医生在治疗特定患者时会考虑到这一点。他们可能不会对他们看到的每个其他患者做出相同的决定或相同的诊断。所以举个例子,比如年龄影响血压,正常血压水平。

所以对我来说正常的可能与对60岁或80岁的人来说正常的不同。所以你必须考虑上下文。它可以学习。所以从某种程度上来说,我们有因果网络学习算法,称为因果结构学习算法。

所以一旦你学习了因果贝叶斯网络的结构,就存在现有的方法会告诉我们,考虑到这两个节点,这些是这两个节点之间可能存在的后门路径。

是否可以举一个现实世界的例子,或者是一个含糊其辞的例子,说明后门路径,例如在医疗案例中,或者可能是其他什么?一个会是什么样的?所以后门可以被认为是共同原因或混杂因素。我们有这个共同的因果贝叶斯网络,其中我们有吸烟和肺癌之间的关系。

有一个共同的基因导致,所以有一个吸烟。吸烟并不总是导致肺癌。存在来自基因的关系,所以存在一个吸烟基因导致人们吸烟,并且存在来自吸烟基因的关系,导致人们患癌。

这就是后门路径。所以一旦你考虑吸烟的影响并导致癌症,你就错过了吸烟基因的这个上下文。所以你不能说吸烟会导致癌症。它必须是在吸烟基因的背景下。所以考虑一下,我们必须考虑这个后门路径。

在实际查看这种吸烟导致癌症的关系时,要考虑在内。为什么后门通道成为一个问题?它会导致虚假相关性。正如我所说,如果有人吸烟,我们会说,哦,这个人会得癌症吗?

那并不完全正确。他们可能也可能不会。吸烟不一定是某人患癌的原因。不一定,对吧?不一定,是的。在我们做出这一说法之前,我们可能需要考虑其他参数。有了这个概念,我们就可以开始讨论因果LP back。这种架构的目的是什么?目标是什么?

所以目标是人们已经开始研究,我将稍微谈谈,在我真正深入因果LP back之前,我为什么要开始研究因果神经符号AI?我希望当我谈到因果LP back时,这会有意义。我开始我的博士学位是在一个医疗保健项目中工作的。所以我正在协调我在IHR01中的顾问,我们正在处理儿童哮喘患者。

我们想开发一个个性化的贝叶斯推理模型,这将是由于。所以哮喘患者受户外参数的影响很大。所以现在,波兰在大多数城市都非常高。这往往会加剧人们的哮喘。你可以看到存在相关性。所以那里有一个预测器。所以你可以有一个高条件概率。但我可以说波兰是唯一的原因吗?

可能还有其他户外环境参数正在发生。所以我们有臭氧,我们有AQI。它们可能同时都在上升。所以我感兴趣的是查明可能的原因。

为了实际做到这一点,你必须带走那个病人,将他们放在波兰环境中,只是AQI环境中,或者只是臭氧环境中。这实际上是不可行的。这就是我们进行随机对照试验的原因。我无法对这些儿童患者进行随机对照试验。所以这激励我去研究因果关系。我该如何做到这一点?

我觉得另一方面,知识图给了我很多领域知识,如果你去看医生并告诉他们,嘿,我有所有这些数据,帮我分析一下,给我你所有的领域专业知识,这实际上是不可能的。他们没有时间这样做。但是如果你有一个你正在研究的疾病或任何领域的知识图,你

你可以从某种程度上补充或补充实际的领域专业知识,在那里使用知识图。所以我想,为什么我不将这两个领域结合起来呢?所以因果,这就是因果神经符号被考虑在内的原因。然后我开始研究人们如何表示因果关系。因果关系在因果领域中使用结构因果模型或因果贝叶斯网络表示。

我想看看人们如何在知识图中表示因果关系,这是一个简单的基于三元组的。所以A导致B,然后B导致C,如果这是一个串行关系。我发现那里存在差距,所以我想,好吧,人们正在表示因果关系,这很好,这是一个好的开始。但是如果这是一个串行关系,即A导致B,B导致C会发生什么?他们会将它们分成两个不同的三元组,它们将是A导致B,然后B导致C。

然后可能还有一个三元组说A导致C。但是当你表示这个三元组A导致C时,你错过了非常重要的上下文B。

我的目标首先是用因果贝叶斯网络中存在的因果关系表示来丰富神经符号AI空间。所以我想把因果贝叶斯网络中存在的一切都放到神经符号AI空间中。这就是我们创建因果本体的原因,它是一对一的映射,从贝叶斯网络到神经符号AI空间或知识图空间。

所以这不仅仅是映射结构,而且还包括将因果贝叶斯网络空间中的概念映射到神经符号AI空间中。所以我映射了权重。我可以做到。我可以将它们合并到嵌入空间中。我可以使用它们在损失函数中执行我的下游任务。因果贝叶斯网络中存在的第二个概念是马尔可夫条件。

或因果马尔可夫假设,这基本上意味着,给定一个关系或任何特定节点,它只受其直接原因的影响,并且独立于其父节点。所以我还想确保我们在一个空间中拥有所有这些,这将是神经符号AI空间。

当我们评估这种情况时,我使用了这种称为马尔可夫贝叶斯分裂的方法。

然后是后门路径。所以有一些混杂因素。所以我们在知识图中有一些链接。如果你进行正常的链接预测,由于这些混杂因素,我们看到我们的结果往往显示出膨胀的性能,这对我们来说很好。但是实际上,如果你从因果关系的角度来看,这些结果是不正确的。我的基本目标是拥有一个整体框架,其中

我不需要仅仅使用贝叶斯网络来执行我执行的所有特定任务。所以我有这个框架,除了贝叶斯网络之外,我还拥有领域知识,所有这些都合并到一个空间中。

这就是促使我去研究因果LP back的原因,我们称之为。所以现在进行链接预测,但要考虑后门路径。所以在我们进行链接预测任务时,在评估空间中删除后门路径。

你能提醒听众权重代表什么吗?权重基本上告诉你多少。所以给定这个关系,A导致B。我们有一些叫做干预的东西。假设我有多么这种关系,服用阿司匹林

导致我的头痛消失。现在我想干预并说,不,我没有服用阿司匹林。现在告诉我,我的头痛是如何消失或没有消失的?这如何影响我的头痛治愈?这个数字就是我们所说的这种关系的因果权重。所以服用Advil或服用阿司匹林实际上治愈我的头痛的程度是多少?

所以我认为传统的方法是直接在损失函数中使用这些权重。你想让一些东西作为一个小权重,这不是一个糟糕的错误,但如果它有一个大权重,你想让它正确。没错。为什么这还不够?这取决于你正在执行的任务。就链接预测而言,这不是人们使用的一种众所周知的策略。

它通常只是考虑因果关系。但是可能存在不同的关系。所以可能存在从A到B、A到C的关系。所以如果你正在进行链接预测,你所做的只是考虑关系,即A导致和A导致B、A导致C。但是,让我们说A导致B的权重可能是,让我们说,

5% 与A到C的权重相比,让我们说,10%。所以你希望你的算法给你A导致什么的结果更有可能是C而不是B。这就是权重在链接预测任务中发挥作用的地方。

你能更多地谈谈你如何将它包含到嵌入本身中吗?你的技术有何不同?我们正在使用一些关于将权重用于嵌入空间的现有工作,这是由一篇名为“将权重纳入链接预测任务”的论文完成的,他们将这种嵌入技术称为FOCUS-E。

并且他们已经包含在损失函数中。你可以将它与你正在使用的任何嵌入算法一起使用。目前,他们已经实现了四个。所以有一个transy、distmult、conv,我想,holy。所以这些是人们使用过的四种不同的常用嵌入方法或嵌入空间。他们这样做的方法是,假设某些东西有

损失函数,让我们考虑基于距离的损失函数。所以当你在计算节点A到节点C或节点B之间的距离时,你想考虑这个数字。我们可以重新审视基于马尔可夫的分裂吗?如果你不这样做,你会犯什么错误?

所以如果你不包含马尔可夫贝叶斯分裂,你最终会犯的一些错误是,你已经训练了一些链接,并且你正在测试这些链接。所以你正在使你的测试集产生偏差。

这类似于数据泄露吗?实际上就是数据泄露。因此,当您分割因果网络时,您会选择一个节点,如果进行随机分割,则测试集中包含的一些节点很可能已经包含在训练集中,或者已经与训练集中的父节点存在链接。因此,当您进行链接预测时,

会以一种包含偏差的方式进行,因为您已经从训练集中学习了这些链接。因此,现在您进行链接预测,显然,您的性能会更好。我们看到

如果我们不包含基于马尔可夫的分割,我们看到平均倒数排名(这是知识图谱嵌入空间中链接预测的常用指标)提高了 42.3%。这充分证明了它需要存在。特别是如果您正在进行因果关系研究,因为我们希望将因果关系融入神经符号 AI 空间。因此,我们必须考虑知识图谱和因果贝叶斯网络空间中存在的这些现象。

因此,我们已经完成了一些步骤,从因果关系到网络,去除那些后门路径。我想这一切都归结于预测知识图谱中的新因果链接。

这是使用传统方法还是您也做了一些创新?这是一种人们倾向于使用的传统方法。我所采用的创新方法之一是在进行因果链接预测时使用权重。我们研究的另一项工作是结合中介变量。

这是贝叶斯网络的另一个属性,即您具有中介变量。因此,A 导致 B,B 导致 C 的串行关系。在这种情况下,B 是一个中介变量。在这种情况下,我们使用了超关系图。

因此,这些不是简单的基于三元组的。我们有 A 导致 B 的三元组,它与另一个超关系相关联,例如,具有中介另一个节点 B。

这是我们在因果神经符号 AI 或将因果关系融入神经符号 AI 方面研究的另一项创新工作。当您在进行链接预测任务时考虑中介变量时,我们看到了良好的结果,取得了显著的改进。您使用什么指标或评估来查看输出的质量?

我们通常使用两个指标。一个是平均倒数排名,即 MRR 分数。另一个是命中率 K。因此,我们通常使用命中率 1、3 和 5,有时是 10,这基本上告诉您,在第一次进行链接预测任务时,告诉我您获得 K 处正确结果的可能性有多大。

那么,您获得第一个结果(即正确结果)的可能性有多大?您获得前三个结果(k 等于 3)是正确结果的可能性有多大?您是否可以使用任何标准数据集作为基准?当然。我们正在使用一个因果推理基准数据集。该数据集在知识图谱空间中并不常见。

但是我们将该数据集转换成了知识图谱,这是一个名为 Clever Humans 的视觉因果推理基准数据集。我们将该数据集转换成了知识图谱。该数据集本身包含视频。因此,有 700 多个不同形状、大小和材质的物体进入画面并相互碰撞的视频。

他们定义了至少 27 种不同类型的碰撞事件。因此,每次碰撞事件都不同。因此,撞击与推动具有不同的语义,尽管它们都是碰撞。我们将此数据集转换成了因果 Clever Humans 知识图谱。

我们将其用作测试的基准。但是,如果您考虑是否有可能在现有因果基准或基于知识图谱的基准中,那么该领域仍有工作要做。这就是我们正在努力的方向。

人们使用的另一个常见的知识图谱,因果知识图谱,是一个基于维基百科的因果知识图谱,称为 wiki-causal。但是,我们正在积极研究创建基准来测试我们的数据集或测试我们的方法论的一个领域。对于您拥有的那个,您可以将您的方法与其他方法进行比较吗?这在某种程度上是苹果与苹果的比较吗?我们从因果网络的角度开始。

其他因果知识图谱,例如 wiki-causal 知识图谱,还有一个名为 causnet 的图谱。他们从文本的角度看待因果关系。因此,他们从文本数据中学习因果关系。因此,那里并非完全是苹果与苹果的比较,但我们肯定可以制定一些方法,也许能够比较 wiki-causal 或 causnet 和其他因果或因果 KG 的工作方式。

各种图谱在我们已实现的方法论上的性能如何。但我们是从基线开始的。正如您所说,我们的目标是学习新的因果关系。因果空间中存在的另一个问题是因果发现,即给定观察数据,您希望学习因果网络。

我们的假设是,根据我们看到的一些研究,观察数据往往是不完整的。实际上不可能观察世界上的所有事物。如果您使用传统的结构学习算法和观察数据,由于观察数据或收集数据的完整性问题,您将学习到的网络将是不完整的。我们从这个角度出发。

我们的目标是,或者说我的目标是,现在一旦我有了这些不完整的数据,是的,我有了这个不完整的知识或因果网络,我已经学习了,或者我有一个领域专家告诉我,好的,这是根据这些观察数据,这可能是您可能学习到的网络,或者这是一个快照或一个小网络,是的,我们可以提供给您。

结构算法发生的另一个问题是,有时,尤其是在谈论现实世界示例时,它们会学习不正确的关系,因为它们只是在研究变量之间的条件概率或某些统计关系。

因此,您肯定需要一个领域专家来告诉您这些关系是否真的有意义?这就是知识图谱发挥作用的地方。因此,在某种程度上,我们将因果发现的问题转化为因果链接预测技术或神经符号 AI 空间中的链接预测问题。

这是一个很好的描述。是的,这确实使它成为可能。没错。因此,现在您可以从简单的因果网络开始,或者首先从您已经使用现有算法学习到的因果网络或领域专家提供的因果网络开始。现在,我们将此映射到知识图谱空间,并使用知识图谱技术来学习它。我们自下而上地进行。

从网络开始,然后丰富它。但是,其他因果知识图谱,即现有的因果知识图谱,我认为它们更处于第二步水平。它不是关于因果网络。而是如果给您一段文本,他们会从中学习因果三元组,然后他们会进行因果链接预测。

您认为因果 LP 反向架构可以在哪些特定问题或行业等方面产生重大影响?

哦,当然。由于我一直回到医疗保健的例子,因此一个行业,我认为安全关键型行业或应用是目前应该直接实施因果关系的地方。医疗保健是一个我们可以考虑的领域,那么某种疾病或某种状况的原因是什么?我们简要研究的另一个领域是

我们正在合作的是智能制造。在南卡罗来纳大学,我们有一个 Mechner 航空航天中心,我们有一个 NEXT 团队,致力于创建一个智能装配流水线,我们在那里组装玩具火箭。装配流水线中发生异常情况。因此,异常意味着组装好的玩具火箭会缺少火箭头或顶部、缺少底部或缺少火箭的一个部件。

因此,在那里进行因果关系研究,在制造环境中进行根本原因分析。这绝对是我看到的应用领域之一。另一个领域是我们也简要研究过的自动驾驶。我们能否真正推断出汽车(自动驾驶汽车)采取的行动?这些是我希望看到因果关系应用的一些主要领域。

这些技术如何使可解释 AI 受益?由于在这种情况下我们使用知识图谱,因此可解释性是知识图谱的优点之一。因此,知识图谱本身对于人类来说是可解释的。我们肯定可以解释连接,追溯信息。

我们的结果与知识图谱中的其他节点和部分相连接,以解释为什么链接预测算法或为什么神经网络给我们提供了一定的结果。您接下来有什么计划?

我获得了几份助理教授职位的录取通知书。这是我的下一步,我对此非常兴奋。我们讨论过的一些未来工作将成为我提案的一部分,也许我指导的博士生在我的旅程中将致力于这些令人兴奋的话题。

我喜欢跨学科的工作。因此,我的未来工作主要将涉及扩展或我目前正在做的事情,但在不同的和令人兴奋的领域,并与一些令人兴奋的领域专家合作。听众可以在网上关注您吗?因此,他们总是可以在我的 LinkedIn 页面上关注我。

如果有人有兴趣合作或从事相同的项目或类似的领域,他们总是可以给我发送 LinkedIn 消息。他们可以查看我的网站。我的 LinkedIn 页面上提到了我的网站。因此,这是他们始终可以查找我或给我发送消息或发送电子邮件的另一种方式。听起来不错。我们将为听众在节目说明中提供链接以供后续跟进。

非常感谢您抽出时间来分享您的工作。哦,非常感谢您邀请我。很高兴与您交谈。