zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

因果涌现2.0:量化涌现复杂性

已有 283 次阅读 2025-6-23 16:23 |个人分类:科普|系统分类:科普集锦

因果涌现2.0:量化涌现复杂性 

复杂的系统跨尺度运行,因此证明了大量可能的描述。这导致了一种说法,即在复杂的系统中,如生物学中,“没有特权层次的因果关系”。但是,所有可能的尺度集合(即使在低维度形式)很大,即使对于小型系统,大多数是对系统因果关系工作的低级描述(例如,计算机的随机粗粒化逻辑门)。 

这种多重性的尴尬需要正式的数学涌现理论。这样的理论应该解释并量化宏观(基于某种低维度系统的高级描述)如何有助于系统的因果起作用,哪些宏观具有因果关系。涌现理论甚至可以解释科学本身的时空层次结构,而不是仅仅有用的压缩功能。 

可能会抗议科学中没有出现的余地,因为大概可以通过完全了解其显微镜来预测任何给定系统的未来,并且大概可以将任何给定的系统缩小到其微观层次。但是,预测与因果关系不同。简单的例子是恒温器和房间系统。从理论上讲,房间中所有单个颗粒的微观可以用于预测恒温器的读数,但就因果理解而言,它代表了对什么导致恒温器读取20°C问题的低级答案。实际上,对于读书而言,所有颗粒的精确微观不是因果关系所必需的,因为许多其他配置可能会导致它。同时,宏观(房间的温度)与恒温器的读数有直接的因果关系,因为对于任何给定的值都是必要的。 

在另一个示例中,可以使用对神经元树突的传入信号来预测会发生下游动作电位。然而,在因果分析中,传入信号不足以触发(效果)某些确切的离子交换,因为这会由于噪声而无法预测的,例如来自布朗运动或量子效应。同时,传入信号仍然可以决定性地触发(效果)下游宏观神经元,而不论其基本的微观细节。 

遵循这些直觉,在2013年,Hoel等人介绍了因果涌现理论。该理论利用了离散因果模型(在逻辑门网络、DAG和马尔可夫链的类别中),以及有效信息(EI)的因果关系。该理论提供了一个工具包,以搜索此类系统的所有可能的低维度,以找到最大化EI的系统(其中通过将系统通过do(x)运算将系统扰动到所有可能的状态来评估EI,然后计算干预措施的概率分布与其效果的概率分布之间的相互信息)。识别随着EI的最大增加的宏观而定量化了系统中因果涌现程度。 

因果涌现揭示了为什么系统的宏观具有更牢固的因果关系,尽管它们的基础宏观可降维:由于宏观是可多重的,因此它们可以最大程度地减少因果关系的不确定性,而这种因果关系的不确定性是EI敏感的。这在数学上类似于信息通道上的编码如何最大程度地减少通信的噪声。 

此后,因果涌现理论产生了大量研究,例如测量从细胞自动机到fMRI数据到基因调控网络数据内的因果出现,以及启发式,例如检测训练有素的人工人工神经网络。它与网络理论中的无标度和鲁棒性等现象有关,已在融合信息理论中进行了调整,并且已经提出了替代方法的建议,以量化哪种方法来量化因果关系,例如使用系统的动态可逆性来近似EI 

但是,由于两个悬而未决的问题,因果出现的初始版本(以下简称CE 1.0)仍然不完整。首先是对EI(及其近似)检测因果涌现的依赖。尽管EI是一个相对良好的因果关系量度,但它在其计算中做出了背景假设(例如需要统一的扰动分布,有些人批评了这一点)。此外,EI的使用实际上低估了因果涌现。 

第二个问题是CE 1.0仅确定了一个与因果关系相关的量表(EI的最大值),忽略了所有多尺度结构。然而,许多系统似乎跨尺度运行。一个突出的例子是大脑的不同功能尺度,从神经元到皮质小圆形到整个大脑区域不等。另一个例子是如何在其硬件电路,其机器代码软件的中尺度或其操作系统和应用程序的宏观上描述计算机。实际上,即使发生的计算也可能会根据描述的规模而变化。 

为了开发一种解决这些问题的普遍且良好的因果涌现理论,Erik Hoel最近介绍了因果出现2.0CE 2.0的基本直觉是,系统不局限于一个特定的描述尺度;更确切地说,它是由一组有助于系统因果运作的尺度来描述的。任何一个尺度(甚至是微观)都像取3D对象的2D切片,因此无法完全捕获系统的因果关系。 CE 2.0在范围内提出了一个因果分配模式,该模式检测其因果贡献(如果有的话)。这是通过定义一条遍历系统量表从自顶向下的路径来完成的,而理论则将系统沿此路径的起因划分。 

CE 2.0基于因果关系的公理概念,而不是独立的措施(例如CE 1.0中的EI),该措施使理论可以捕获宏观因果关系的所有案例,并以先前不可能的方式展开并量化系统的多阶段因果结构。这种关于系统如何跨尺度运行的新分类学导致了一种新颖的措施,即新的复杂性:分布系统的因果关系在其尺度上如何广泛分布,其中拥有许多贡献量表的系统更为复杂。 

在《Causal Emergence 2.0: Quantifying emergent complexity》文章中,Erik Hoel首先定义一个在背景假设之间具有公理性和健壮性的因果关系概念,然后使用它来计算模型马尔可夫链的粗粒度中的宏观因果关系程度,从而量化其因果涌现程度,并详细介绍如何通过遍历一组量表的路径分配因果贡献,从而探索如何自然到达涌现的复杂性概念。最后,CE 2.0直接与其他相关的涌现理论进行了比较,证明了其优势并概述了其概念上的含义。 

参考文献

[1]Erik Hoel. Causal Emergence 2.0: Quantifying emergent complexity. arXiv:2503.13395, https://doi.org/10.48550/arXiv.2503.13395 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

                                  



https://wap.sciencenet.cn/blog-571917-1490938.html

上一篇:借助因果差异网络识别生物扰动靶标
下一篇:跨人类细胞TF驱动基因程序图谱
收藏 IP: 39.128.49.*| 热度|

1 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-6-24 02:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部