剑的空间分享 http://blog.sciencenet.cn/u/shark 山水从心观动静 鸢鱼随境显知能

博文

“因果关系”学习摘录

已有 530 次阅读 2025-9-26 15:55 |个人分类:科学研究|系统分类:科研笔记

    因果关系严格区分“原因”变量与“结果”变量,在揭示事物发生机制、指导干预行为等方面具有相干关系不能替代的作用。作为因果关系表示的数学框架,因果模型不仅可以深化数据中的因果关系,还能揭示因果与概率间的内在联系。因果模型涉及反事实逻辑、决策理论、实际因果分析等议题。传统的因果模型主要处理结构化数据,如二维表中的行数据,无法直接应对机器学习中常见的高维、低层次的原始数据,例如图像。因果表征学习旨在将原始数据转化为适合因果模型的结构化变量,为连接因果科学与机器学习提供桥梁。目前,因果关系发现方法包括:

  •  基于约束的方法:主要是PC(Peter-Clark)算法和IC(Inductive Causality)算法,核心原理是基于独立性和条件独立性判断变量之间的独立性,获得因果图,并利用V-结构和定向规则对变量间的无向边进行定向。该方法的缺点是无法区分马尔可夫等价类结构。

  • 基于因果函数模型的方法:主要是加性噪声模型(ANM)和后非线性模型(PNL),核心原理是假设结果Y和原因X具有函数关系,如果X对Y做正向回归,噪声项与X独立,Y对X做反向回归,噪声项与Y不独立,则推断X是Y的原因。

  • 混合型方法:基于约束的方法无法识别马尔可夫等价类问题,而基于因果函数模型的方法只能判断一个变量对结果变量的影响,两类方法在现实中均存在局限性。混合型方法的核心原理是将似然度框架嵌入因果函数模型、发现数据间的因果结构。

    现实场景中,经常有许多存在隐变量的情况,如果数据是线性非高斯的,可将独立噪声条件扩展到广义独立噪声条件,通过找到隐变量的代理变量做回归,恢复数据的因果结构。这种方法的局限性在于无法推断变量间完整的因果关系,还需要在此基础上利用面向不完全观察数据的因果结构学习算法(FRITL算法)进一步优化。

 

    现实应用中,许多问题可以归结为out-of-distribution问题。因为统计学习模型需要独立同分布假设,若测试数据与训练数据来自不同的分布,统计学习模型常常出错。在很多情况下,独立同分布假设是不成立的,因果推断所研究的正是这种情形:如何学习一个可以在不同分布下工作、蕴含因果机制的模型,使用因果模型进行干预或者反事实推断。

 

    微分方程是对物理系统全面的详尽描述,可以预测物理系统的未来行为、推断干预的效果以及预测变量间的相关性,还可以提供物理本质、解读因果结构。而统计模型是一种粗糙描述,无法预测干预的效果,优点在于可以从数据中进行学习。因果建模期望能够像物理模型那样预测干预的效果,同时又可以通过数据驱动的方法找到这样的模型、来取代专家知识。因果发现算法的目标是识别变量之间的直接或者间接因果关系,通过构建因果图模型来实现。然而,目前阶段很难让机器学习从观测数据中正确发现因果图,因果图还主要来自专家知识。



https://wap.sciencenet.cn/blog-32670-1503652.html

上一篇:[转载]知识数据协同驱动AI(学习笔记)
收藏 IP: 122.224.179.*| 热度|

4 杨正瓴 王涛 汪运山 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-9-29 02:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部