陈培颖
精选综述 | 宾夕法尼亚州立大学等: 图反事实学习研究综述
2025-7-16 08:58
阅读:75

新新标签.jpg

图结构数据在现实世界中广泛存在,如社交网络、分子图和交易网络等。图神经网络(GNN)在图表征学习领域取得了显著成功,为各类下游任务提供了便利。然而,GNN仍存在诸多局限,包括缺乏可解释性、易继承数据偏差以及无法对因果关系进行建模等。近年来,图反事实学习为解决这些问题提供了新思路,在反事实公平性、可解释性、链路预测等图应用方向展现出了巨大潜力。为了推动这一有前景的研究方向,来自宾夕法尼亚州立大学的研究者们对图反事实学习领域的研究成果进行了系统梳理与分类。根据研究问题的不同,文章将现有方法划分为四大类别,针对每类研究提供背景和激励示例、概括现有工作的通用框架,并进行了详细回顾。同时,文章在图结构数据、反事实学习与现实应用的交叉领域中指出了有待探索的研究方向。为给后续研究提供全面资源支持,文章汇总整理了相关开源实现、公开数据集和常用评估指标。该文旨在构建对图反事实学习分类体系与现有资源的统一认知框架,为相关研究提供"一站式"参考指南。

题目.jpg

图片来自Springer

全文下载:

Counterfactual Learning on Graphs: A Survey

Zhimeng Guo, Zongyu Wu, Teng Xiao, Charu Aggarwal, Hui Liu, Suhang Wang

https://link.springer.com/article/10.1007/s11633-024-1519-z

https://www.mi-research.net/article/doi/10.1007/s11633-024-1519-z

全文导读

图是一种无处不在的数据结构,也是表征对象与复杂交互的通用语言。图能够对现实世界中的各类系统进行建模,包括社交网络、化学分子结构、知识图谱以及推荐系统等。例如,在社交网络中,节点代表个体,边表示个体间的社交关联;在分子图中,节点对应原子,边表示原子间的化学键,这种结构化的表征形式可应用于药物发现或材料设计等任务。图结构数据的普遍性引发了研究人员对图分析与挖掘的广泛关注,相关领域已涌现出多种研究方法。

网络表征学习是图挖掘的核心任务之一,其目标是通过学习节点或图的低维向量表征,有效捕获节点或图的内在特征与结构信息。习得的表征能够有效支撑各类下游任务,如节点分类、链路预测、社区检测及图分类等。神经网络在计算机视觉、自然语言处理等领域的表征学习中展现出了强大能力。基于神经网络的方法也激发了图神经网络(GNNs)的兴起与繁荣。自图卷积网络出世后,各类GNN变体不断涌现,极大推动了图学习方法的发展,并在节点分类、链路预测、图分类等诸多图挖掘任务中取得了最先进的性能。得益于图学习方法的强大功能,各类GNN变体已成功应用于药物研发、虚假新闻检测、金融分析等高风险决策场景。

尽管现实应用前景广阔,但近期研究表明,现有图学习方法存在三大局限:易继承带偏数据集的偏置模式、缺乏可解释性、以及无法充分利用图数据中存储的大量信息。例如,在带有偏差的数据集下,GNN容易习得不公平的分类器,如根据申请人的种族等敏感信息给予不同决策。这些问题严重影响了模型可信度,制约了图学习方法在现实场景中的应用。而反事实学习为解决上述问题提供了新契机,能够减少内在偏差、增强模型可解释性并充分挖掘数据中存储的信息。反事实概念源于因果推理研究领域。反事实推理致力于回答"在已知事实发生的情况下,若采取不同行动将导致何种结果"。这种基于反事实的学习能力与对未知环境的泛化能力,被视为通用人工智能的重要组成要素。因果学习在经济学、教育学、医学等多个学科领域已得到深入研究。要评估某项干预行为的因果效应,需要同时获取实际执行干预产生的观测结果(事实结果)与未执行该干预时的潜在结果(反事实结果)。理想情况下,可通过随机对照试验获取反事实结果。然而在现实场景中,人们仅能获取观测性事实数据,即已执行的干预及其对应的事实结果,这是因果学习的一个重要挑战。而值得庆幸的是,信息技术的发展提供了海量数据资源,让人们能够从中挖掘隐含信息。因此,关键问题在于如何从观测数据中获取反事实,以及如何利用反事实提升机器学习模型性能。

图反事实学习是一个新兴研究方向,其发展历程尚短。然而,近期图反事实学习研究工作已展现出该技术在解决公平性、可解释性等挑战中的巨大潜力。如图1所示,本文通过几个案例展示了图反事实学习的动机。具体而言,借助反事实学习,人们能够突破群体层面的公平性定义,实现个体在事实世界与反事实世界(即个体所属不同人口群体)中的公平性保障。以图1(a)为例,反事实公平性要求确保申请人与其反事对象(性别属性改变)获得相同的信用卡审批结果。对于图反事实解释任务,其目标不仅在于发现与预测高度相关的紧凑子图,更在于找到能够改变预测结果的合理干预方案。这种解释方式不仅能回答"模型为何做出特定预测",还能指导"如何调整以获得期望结果"。如图1(b)所示,当信用卡申请被拒时,传统解释可能仅说明其"信用评分不足",而反事实解释则可建议客户通过最小化调整(如改善交易关系)来扭转决策结果并最终获得批准。除提升公平性与可解释性外,研究界还通过反事实学习获取反事实世界的补充信息。例如,同时利用事实边与反事实边构建更强大的GNN。如图1(c)所示,两位同社区居住的友人,通过将两人置于不同社区的反事实情境,GNN可推断其潜在关联。这种方式让GNN能深入理解塑造社交关系的因果要素,同时削弱社区环境因素的影响。随着图反事实学习研究日趋活跃且相关前置任务呈现多样性,亟需建立系统性分类框架以梳理方法论体系与应用场景。

图1.jpg

 图反事实学习示意图

为填补这一空白,本综述对快速发展的图反事实学习领域进行了首次全面的最新概述,提出了一些见解和潜在的未来研究方向,并构建了集开源实现、公开数据集与常用评估指标于一体的"一站式资源平台"。本文的目标读者包括:希望了解图反事实学习的机器学习研究人员、想了解图神经网络最新进展的图学习研究人员,以及想将图反事实学习拓展至新应用场景的跨领域专家。

本综述的核心贡献体现在以下四方面:

1.首次系统性综述。据我们所知,本文是首篇系统梳理图反事实学习技术的综述论文。现有相关综述多聚焦于因果推理与因果机器学习领域。截至本文完成时,尚未出现针对图领域因果学习的专门性、系统性综述。

2.全面性与时效性。本文系统梳理了深度学习、数据挖掘、计算机视觉、自然语言处理及人工智能领域顶级国际会议与期刊的最新图反事实学习研究成果,涵盖ACM TOISICLRNeurIPSICMLSIGKDDWSDMCIKMWWWICDMNAACLIJCAIAAAI等权威会议期刊。本文同时纳入化学科学等交叉领域的相关研究。

3.系统分类与统一框架。本文建立四级分类体系,将现有研究划分为反事实公平性、反事实可解释性、反事实链路预测与推荐、应用场景四大类。针对多数类别,本文提出了统一的理论框架,以数学形式化表达各类方法的核心思想。分类体系概述如图2所示。

4.未来方向与一站式资源整合。基于调研结果,本文提出了具有重要价值的前沿研究方向。同时,本文构建了开源工具包(包含算法实现、数据集与评估指标),并持续维护图反事实学习论文资源库,为学界提供持续更新的研究支持。

图反事实学习论文资源库访问地址:

https://github.com/TimeLovercc/Awesome-Graph-Causal-Learning

与相关综述文献对比分析。表1详细对比了本综述与现有相关综述的核心差异。现有综述多聚焦于通用因果推理、反事实公平性、反事实解释等方向,鲜少涉及图数据场景下的研究进展。而部分图领域综述虽关注公平性与可解释性,但尚未从因果或反事实学习视角系统梳理现有研究工作。本文首次全面综述图反事实学习领域,涵盖因果理论基础、梳理公平性模型、可解释模型、链路预测与推荐系统应用、现实场景实践以及前沿研究方向的反事实学习技术。因此,本综述与现有研究形成显著差异,可有力支撑这一新兴领域的发展。

图2.jpg

 图反事实学习概述

表1.jpg现有因果推理与图学习相关综述与本研究的对比分析("统一"指是否提出统一理论框架)

本文概述如图2所示。第2节明确定义相关概念及其在后续章节的表示方法;第3节与第4节分别阐述图数据反事实公平性与反事实可解释性的统一理论框架,并总结相关评估指标与数据集等资源;第5节系统综述反事实链路预测与推荐领域的研究进展;第6节梳理图反事实学习在跨领域现实场景中的应用实践;第7节剖析未解难题并展望前沿研究方向;第8节总结全文。

· 本文作者 ·

作者.jpg

全文下载:

Counterfactual Learning on Graphs: A Survey

Zhimeng Guo, Zongyu Wu, Teng Xiao, Charu Aggarwal, Hui Liu, Suhang Wang

https://link.springer.com/article/10.1007/s11633-024-1519-z

https://www.mi-research.net/article/doi/10.1007/s11633-024-1519-z

BibTex:

@Article {MIR-2024-04-095,

author={Zhimeng Guo, Zongyu Wu, Teng Xiao, Charu Aggarwal, Hui Liu, Suhang Wang },

journal={Machine Intelligence Research},

title={Counterfactual Learning on Graphs: A Survey},

year={2025},

volume={22},

issue={1},

pages={17-59},

doi={10.1007/s11633-024-1519-z}}

特别感谢本文第二作者、宾夕法尼亚州立大学Wu Zongyu博士对以上内容的审阅和修改!

纸刊免费寄送Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接填写收件地址,编辑部将尽快为您免费寄送纸版全文!

说明:如遇特殊原因无法寄达的,将推迟邮寄时间,咨询电话010-82544737

收件信息登记:

https://www.wjx.cn‍/vm/eIyI‍AAI.aspx#  

关于Machine Intelligence Research

Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区;2025年发布的最新影响因子达8.7,继续跻身JCR Q1区,最佳排名进入全球第6名;2025年一举进入中国科学院期刊分区表计算机科学二区。

往期目录

2025年第2期 | 常识知识获取、图因子分解机、横向联邦学习、分层强化学习...

2025年第1期 | 机器视觉、机器人、神经网络、反事实学习、小样本信息网络...

2024年第6期 | 图神经网络,卷积神经网络,生物识别技术...

2024年第5期 | 大语言模型,无人系统,统一分类与拒识...

2024年第4期 | 特约专题: 多模态表征学习

2024年第3期 | 分布式深度强化学习,知识图谱,推荐系统,3D视觉,联邦学习...

2024年第2期 | 大语言模型、零信任架构、常识知识推理、肿瘤自动检测和定位...

2024年第1期 | 特约专题: AI for Art

2023年第6期 | 影像组学、机器学习、图像盲去噪、深度估计...

2023年第5期 | 生成式人工智能系统、智能网联汽车、毫秒级人脸检测器、个性化联邦学习框架... (机器智能研究MIR)

2023年第4期 | 大规模多模态预训练模型、机器翻译、联邦学习......

2023年第3期 | 人机对抗智能、边缘智能、掩码图像重建、强化学习... 

2023年第2期 · 特约专题 | 大规模预训练: 数据、模型和微调

2023年第1期 | 类脑智能机器人、联邦学习、视觉-语言预训练、伪装目标检测... 

好文推荐

清华大学朱军团队 | DPM-Solver++:用于扩散概率模型引导采样的快速求解器

南航张道强团队 | 综述:基于脑电信号与机器学习的注意力检测研究

可信图神经网络的全面综述:隐私性、鲁棒性、公平性和可解释性

哈工大江俊君团队 | SCNet:利用全1X1卷积实现轻量图像超分辨率

下载量TOP好文 | 人工智能领域高下载文章集锦(2023-2024年)

自动化所刘成林团队 | 统一分类与拒识: 一种一对多框架

上海交大张拳石团队 | 综述: 基于博弈交互理论的神经网络可解释性研究

专题好文 | 再思考人群计数中的全局上下文

专题好文 | Luc Van Gool团队: 基于分层注意力的视觉Transformer

浙江大学孔祥维团队 | 综述: 迈向真正以人为本的XAI

澳大利亚国立大学Nick Barnes团队 | 对息肉分割的再思考: 从分布外视角展开

前沿观点 | Segment Anything并非一直完美: SAM模型在不同真实场景中的应用调查

精选好文 | 推荐系统的波纹知识图谱卷积网络

复旦邱锡鹏团队 | MOSS: 一个开源的对话式大语言模型

自动化所黄凯奇团队 | 分布式深度强化学习:综述与多玩家多智能体学习工具箱

约翰霍普金斯大学Alan Yuille团队 | 从时序和高维数据中定位肿瘤的弱标注方法

专题综述 | 大语言模型中的知识生命周期

精选综述 | 零信任架构的自动化和编排: 潜在解决方案与挑战

欧洲科学院院士蒋田仔团队 | 脑成像数据的多模态融合: 方法与应用

金耀初团队&郑锋团队 | 综述: 深度工业图像异常检测

专题好文 | 创新视听内容的联合创作: 计算机艺术面临的新挑战

综述 | 清华张学工教授: 肺癌影像组学中的机器学习

哈工大江俊君团队 | DepthFormer: 利用长程关联和局部信息进行精确的单目深度估计

Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪

贺威团队&王耀南院士团队 | 基于动态运动基元的机器人技能学习

乔红院士团队 | 类脑智能机器人:理论分析与系统应用 (机器智能研究MIR)

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

上海交大严骏驰团队 | 综述: 求解布尔可满足性问题(SAT)的机器学习方法

西电公茂果团队 | 综述: 多模态数据的联邦学习

高文院士团队 | 综述: 大规模多模态预训练模型

前沿观点 | 谷歌BARD的视觉理解能力如何?对开放挑战的实证研究

港中文黄锦辉团队 | 综述: 任务型对话对话策略学习的强化学习方法

南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法

ETHZ团队 | 一种基于深度梯度学习的高效伪装目标检测方法 (机器智能研究MIR)

MIR资讯

挺进Q1区前10名!MIR首个影响因子发布

喜报 | MIR 首次入选中国科学院期刊分区表计算机科学类二区

2025年 AI领域国际学术会议参考列表

致谢审稿人 | Machine Intelligence Research

MIR 2024年度优秀编委名单

喜报!MIR入选中国科技期刊卓越行动计划二期项目

专题征稿 | 生成式人工智能的安全与伦理

专题征稿 | Special Issue on Subtle Visual Computing

特别提醒!请认准MIR官方渠道,谨防受骗

前进20名!MIR再度跻身国际影响力TOP期刊榜单

喜报 | MIR入选图像图形领域 T2级 “知名期刊”!

喜报 | MIR被 ESCI 收录!

喜报 | MIR 被 EI 与 Scopus 数据库收录

截图.png

转载本文请联系原作者获取授权,同时请注明本文来自陈培颖科学网博客。

链接地址:https://wap.sciencenet.cn/blog-749317-1493860.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?