博文

“因果关系”学习摘录

已有 1536 次阅读 2025-9-26 15:55 |个人分类:科学研究|系统分类:科研笔记

因果关系严格区分“原因”变量与“结果”变量，在揭示事物发生机制、指导干预行为等方面具有相干关系不能替代的作用。作为因果关系表示的数学框架，因果模型不仅可以深化数据中的因果关系，还能揭示因果与概率间的内在联系。因果模型涉及反事实逻辑、决策理论、实际因果分析等议题。传统的因果模型主要处理结构化数据，如二维表中的行数据，无法直接应对机器学习中常见的高维、低层次的原始数据，例如图像。因果表征学习旨在将原始数据转化为适合因果模型的结构化变量，为连接因果科学与机器学习提供桥梁。目前，因果关系发现方法包括：

基于约束的方法：主要是PC（Peter-Clark）算法和IC（Inductive Causality）算法，核心原理是基于独立性和条件独立性判断变量之间的独立性，获得因果图，并利用V-结构和定向规则对变量间的无向边进行定向。该方法的缺点是无法区分马尔可夫等价类结构。
基于因果函数模型的方法：主要是加性噪声模型（ANM）和后非线性模型（PNL），核心原理是假设结果Y和原因X具有函数关系，如果X对Y做正向回归，噪声项与X独立，Y对X做反向回归，噪声项与Y不独立，则推断X是Y的原因。
混合型方法：基于约束的方法无法识别马尔可夫等价类问题，而基于因果函数模型的方法只能判断一个变量对结果变量的影响，两类方法在现实中均存在局限性。混合型方法的核心原理是将似然度框架嵌入因果函数模型、发现数据间的因果结构。

现实场景中，经常有许多存在隐变量的情况，如果数据是线性非高斯的，可将独立噪声条件扩展到广义独立噪声条件，通过找到隐变量的代理变量做回归，恢复数据的因果结构。这种方法的局限性在于无法推断变量间完整的因果关系，还需要在此基础上利用面向不完全观察数据的因果结构学习算法（FRITL算法）进一步优化。

现实应用中，许多问题可以归结为out-of-distribution问题。因为统计学习模型需要独立同分布假设，若测试数据与训练数据来自不同的分布，统计学习模型常常出错。在很多情况下，独立同分布假设是不成立的，因果推断所研究的正是这种情形：如何学习一个可以在不同分布下工作、蕴含因果机制的模型，使用因果模型进行干预或者反事实推断。

微分方程是对物理系统全面的详尽描述，可以预测物理系统的未来行为、推断干预的效果以及预测变量间的相关性，还可以提供物理本质、解读因果结构。而统计模型是一种粗糙描述，无法预测干预的效果，优点在于可以从数据中进行学习。因果建模期望能够像物理模型那样预测干预的效果，同时又可以通过数据驱动的方法找到这样的模型、来取代专家知识。因果发现算法的目标是识别变量之间的直接或者间接因果关系，通过构建因果图模型来实现。然而，目前阶段很难让机器学习从观测数据中正确发现因果图，因果图还主要来自专家知识。

转载本文请联系原作者获取授权，同时请注明本文来自于剑科学网博客。
链接地址：https://wap.sciencenet.cn/blog-32670-1503652.html

上一篇：[转载]知识数据协同驱动AI(学习笔记)
下一篇：知识与数据协同面向材料科学研究的人工智能

收藏 IP: 122.224.179.*| 热度|

当前推荐数：4 推荐人：杨正瓴 王涛 汪运山 郑永军

该博文允许注册用户评论请点击登录评论 (1 个评论)

数据加载中...

返回顶部

于剑

扫一扫，分享此博文

剑的空间分享 http://blog.sciencenet.cn/u/shark 山水从心观动静鸢鱼随境显知能

博文

“因果关系”学习摘录

当前推荐数：4 推荐人：杨正瓴 王涛 汪运山 郑永军

该博文允许注册用户评论请点击登录评论 (1 个评论)

于剑

全部作者的其他最新博文

全部精选博文导读

剑的空间分享 http://blog.sciencenet.cn/u/shark 山水从心观动静 鸢鱼随境显知能

博文

“因果关系”学习摘录

当前推荐数：4 推荐人： 杨正瓴 王涛 汪运山 郑永军

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

于剑

全部作者的其他最新博文

全部精选博文导读

剑的空间分享 http://blog.sciencenet.cn/u/shark 山水从心观动静鸢鱼随境显知能

当前推荐数：4 推荐人：杨正瓴王涛汪运山郑永军

该博文允许注册用户评论请点击登录评论 (1 个评论)