于剑
“因果关系”学习摘录
2025-9-26 15:55
阅读:532

    因果关系严格区分“原因”变量与“结果”变量,在揭示事物发生机制、指导干预行为等方面具有相干关系不能替代的作用。作为因果关系表示的数学框架,因果模型不仅可以深化数据中的因果关系,还能揭示因果与概率间的内在联系。因果模型涉及反事实逻辑、决策理论、实际因果分析等议题。传统的因果模型主要处理结构化数据,如二维表中的行数据,无法直接应对机器学习中常见的高维、低层次的原始数据,例如图像。因果表征学习旨在将原始数据转化为适合因果模型的结构化变量,为连接因果科学与机器学习提供桥梁。目前,因果关系发现方法包括:

  •  基于约束的方法:主要是PC(Peter-Clark)算法和IC(Inductive Causality)算法,核心原理是基于独立性和条件独立性判断变量之间的独立性,获得因果图,并利用V-结构和定向规则对变量间的无向边进行定向。该方法的缺点是无法区分马尔可夫等价类结构。

  • 基于因果函数模型的方法:主要是加性噪声模型(ANM)和后非线性模型(PNL),核心原理是假设结果Y和原因X具有函数关系,如果X对Y做正向回归,噪声项与X独立,Y对X做反向回归,噪声项与Y不独立,则推断X是Y的原因。

  • 混合型方法:基于约束的方法无法识别马尔可夫等价类问题,而基于因果函数模型的方法只能判断一个变量对结果变量的影响,两类方法在现实中均存在局限性。混合型方法的核心原理是将似然度框架嵌入因果函数模型、发现数据间的因果结构。

    现实场景中,经常有许多存在隐变量的情况,如果数据是线性非高斯的,可将独立噪声条件扩展到广义独立噪声条件,通过找到隐变量的代理变量做回归,恢复数据的因果结构。这种方法的局限性在于无法推断变量间完整的因果关系,还需要在此基础上利用面向不完全观察数据的因果结构学习算法(FRITL算法)进一步优化。

 

    现实应用中,许多问题可以归结为out-of-distribution问题。因为统计学习模型需要独立同分布假设,若测试数据与训练数据来自不同的分布,统计学习模型常常出错。在很多情况下,独立同分布假设是不成立的,因果推断所研究的正是这种情形:如何学习一个可以在不同分布下工作、蕴含因果机制的模型,使用因果模型进行干预或者反事实推断。

 

    微分方程是对物理系统全面的详尽描述,可以预测物理系统的未来行为、推断干预的效果以及预测变量间的相关性,还可以提供物理本质、解读因果结构。而统计模型是一种粗糙描述,无法预测干预的效果,优点在于可以从数据中进行学习。因果建模期望能够像物理模型那样预测干预的效果,同时又可以通过数据驱动的方法找到这样的模型、来取代专家知识。因果发现算法的目标是识别变量之间的直接或者间接因果关系,通过构建因果图模型来实现。然而,目前阶段很难让机器学习从观测数据中正确发现因果图,因果图还主要来自专家知识。

转载本文请联系原作者获取授权,同时请注明本文来自于剑科学网博客。

链接地址:https://wap.sciencenet.cn/blog-32670-1503652.html?mobile=1

收藏

下一篇
当前推荐数:4
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?