||
引 言
因果关系确立,需要从科学哲学和实证研究两个维度展开。休谟的恒常联结理论是认识论基础,但现代科学已经发展出更精细的工具。如何突破相关性的局限,这仍然是当前科学界的核心难题。
穆勒五法作为经典方法,其局限性比较明显,如无法处理多变量交互作用。现代因果推断的的三大支柱是:鲁宾的潜在结果模型(反事实框架)、珀尔的因果图模型(do算子)、计量经济学的工具变量法。这些内容有些艰深,要用火星探测、药物试验等实例来具象化。
确立因果关系本质上是排除竞争性解释的过程,“霍乱传播途径发现”是一个经典案例。但因果关系存在语境依赖性,没有绝对普适的因果关系,只有特定条件下的因果机制。
作为黄金标准的随机对照试验,也存在伦理和实施限制。观察性研究的各种偏倚(混杂偏倚、选择偏倚)容易忽略,吸烟致癌的争议史来警示相关不等于因果的陷阱。
最后要上升到科学哲学层面:因果关系确立是渐进过程,从相关性假设到机制验证,需要多重证据链收敛。它和归纳推理一样,本质上是最佳解释的推理。
在科学研究中确立因果关系是极其复杂且严谨的过程,远不止于观察到两个变量相关(X 和 Y 一起变化)。相关性只是因果关系的必要非充分条件。确立因果关系需要系统性地排除其他解释,并提供强有力的证据链。以下是科学研究中确立因果关系的关键策略和方法:
一、核心挑战:区分相关性与因果性
1. 相关性:X 和 Y 以某种可预测的方式共同变化(正相关、负相关)。
2. 因果关系:X 的变化直接导致了 Y 的变化(X→Y)。
3. 主要混淆
混杂变量:存在第三个变量 Z,它同时影响 X 和 Y,造成了 X 和 Y 相关的假象。例如冰淇淋销量(X)和溺水人数(Y)高度正相关,但真正的“因”是天气炎热(Z),它既导致人们买更多冰淇淋,也导致更多人游泳从而增加溺水风险。
反向因果:Y 的变化导致了 X 的变化(Y → X),而非 X 导致 Y。例如,健康状况(Y)差可能导致失业(X),而非失业导致健康变差(虽然也可能)。
巧合:纯粹的偶然性导致 X 和 Y 表现出相关模式。
二、确立因果关系的核心方法与证据
1. 实验法:随机对照试验 - 黄金标准
原理:研究者主动操纵自变量(X),并随机将参与者/对象分配到实验组(接受 X 干预)和对照组(不接受干预或接受安慰剂/标准处理),然后在控制其他条件的情况下观察因变量(Y)的变化。
方法:一是主动改变 X,明确时间顺序(X 在前,Y 在后);二是随机分配,将参与者已知和未知的混杂变量(Z)在组间平均分配,使得实验组和对照组在干预前在所有方面(平均而言)都可比,可以极大地削弱了 Z 导致 Y 差异的可能性;三是控制变量,尽量保持除 X 以外的其他条件相同(环境、测量方式等);四是结果比较,如果实验组的 Y 发生了显著且可归因于干预的变化,而对照组没有(或变化不同),则强有力地支持 X 导致 Y。
优势:能最有效地控制混杂,提供最强的因果证据。
局限:伦理限制,不能故意让人暴露于有害因素(如吸烟致癌);可行性限制,成本高昂、耗时长,某些现象无法操纵(如地震、社会经济地位);外部效度限制,需要严格控制的环境可能无法完全反映现实世界的复杂性;随机化不完美,小样本时随机化可能无法完全平衡所有混杂因素。
2. 准实验法与自然实验:利用“天然”的干预或变化
(1)原理:当无法进行随机分配时,利用现实中发生的、类似干预的事件(政策变化、自然灾害、地理边界、制度差异等)或特定的设计(如断点回归、双重差分),试图模拟实验条件。
(2)常见类型
双重差分法:比较干预组和对照组在干预前后的 Y 变化之差。要求干预组和对照组在干预前有平行趋势(变化模式相似)。
断点回归设计:利用一个明确的阈值(如分数线、年龄界限)将参与者分为“干预组”和“对照组”,比较阈值附近两侧个体的 Y 差异。假设阈值附近的个体在其他方面高度相似。
工具变量法:寻找一个变量 (IV),它只通过影响 X 来影响 Y,且与混杂因素 Z 无关。用 IV 来“净化” X 对 Y 的估计效应。关键在于找到真正有效的 IV 非常困难。
自然实验:利用自然界或社会中发生的、研究者无法控制的、但将个体“随机”或近似随机地分配到不同暴露水平的事件(如抽签决定是否服兵役、特定地区突发的环境灾难)。
(3)方法:通过巧妙的识别策略和统计方法,利用这些“天然”的变异或设计,尽可能地控制混杂,推断 X 对 Y 的因果效应。依赖于对数据生成过程和背景信息的深刻理解以及严格的统计假设。
(4)优势:能在无法进行 RCT 的领域(如经济学、流行病学、社会学)研究重要的因果问题;研究场景更接近现实。
(5)局限:因果效力通常弱于 RCT;对识别策略和统计假设的依赖性极高;假设(如平行趋势、IV 的有效性)可能不成立或难以验证;结果可能被未观测到的混杂因素影响。
3. 观察性研究:相关性是起点,需更强证据链
(1)原理:不主动干预,仅观察和测量自然状态下存在的 X 和 Y(及相关变量)。包括队列研究、病例对照研究、横断面研究等。
(2)如何为因果提供证据(无法像实验法那样“确立”):观察性研究本身通常不能确证因果关系,但精心设计的大型观察性研究可以积累支持性证据,并与其他证据结合构建因果链条:
关联强度:关联性越强(如极高的相对风险 RR 或比值比 OR),由混杂导致的可能性相对降低(但不绝对)。
一致性:不同研究(不同人群、地点、时间、方法)都得出类似结果。
时间顺序:必须明确 X 发生在 Y 之前(前瞻性队列研究能较好保证)。
剂量-反应关系:X 的暴露水平越高(或时间越长),Y 的发生风险或严重程度越高。
合理性:发现的关联与现有的生物学、社会学或心理学知识/理论相符(有合理的机制解释)。
特异性:X 主要只与特定的 Y 相关(非必需条件,很多病因会导致多种结果)。
实验证据:有相关的动物实验、体外实验或临床试验结果支持(即使不完全匹配)。
类比:与其他已知的因果关系类似。
控制混杂:在设计和分析阶段(如分层分析、多变量回归模型)尽可能测量和调整已知的主要混杂变量 (Z)。
(3)优势:适用于研究罕见病、远期效应、无法干预的因素;成本相对较低。
(4)局限:无法完全排除未测量或未知混杂因素的影响;难以确证时间顺序(尤其回顾性研究);易受各种偏倚(选择偏倚、信息偏倚)影响。
4. 机制研究:解释“如何”和“为什么”
(1)原理:即使观察到 X 导致 Y,仍需理解其中介导的生物学、心理学或社会过程(M)。研究 X → M → Y 的路径。
(2)如何支持因果:
中介分析:统计上检验 M 是否在 X 对 Y 的影响中起中介作用。
实验扰动:在实验中操纵或阻断 M,观察其对 X → Y 关系的影响(如使用特定抑制剂、基因敲除)。
(3)作用:发现机制能极大地增强因果关系的可信度和理解深度,提供生物学/社会学的合理性。理解机制有助于发现干预靶点和预测副作用。
三、确立因果关系的综合过程
1. 提出假设:基于理论、观察或先前研究,提出X可能导致Y的因果假设。
2. 研究设计:根据研究问题、伦理和可行性,选择最合适的设计(RCT、准实验、观察性研究)。
3. 严谨执行
精确测量:可靠、有效地测量 X, Y 以及所有重要的潜在混杂变量(Z)和中介变量(M)。
控制混杂:在设计(随机化、匹配、限制入组标准)和分析(统计调整)层面尽最大努力控制已知混杂。
减少偏倚:采用盲法(受试者、研究者、评估者)、标准化流程等减少信息偏倚和选择偏倚。
4. 数据分析:评估 X 与 Y 的关联强度;检验时间顺序;寻找剂量-反应关系;进行中介分析(如果可能);使用适当的统计方法(如 RCT 中的 ITT 分析,观察性研究中的多变量模型)估计 X 对 Y 的效应,并报告置信区间和统计显著性。
5. 解释结果:结果是否支持假设?关键问题是,观察到的关联是否能用混杂、反向因果或偶然性解释?研究设计和方法在多大程度上排除了这些替代解释?还要评估证据强度,如研究设计类型(RCT > 准实验 > 观察性)、样本量、效应大小、偏倚控制程度、混杂排除程度。
6. 复制与整合:不同团队、不同样本、不同方法重复研究并得到一致结果,是确立因果关系的基石;系统综述与 Meta 分析:综合所有高质量研究证据,提供更全面、更精确的效应估计和更强的因果推断。
7. 机制探索:深入研究 X 如何导致 Y 的中间过程和原理。
8. 结论的谨慎性:科学研究中的因果结论通常是概率性的和基于当前最佳证据的。即使是 RCT,结论也依赖于研究的质量和假设。新的证据或更好的方法可能修正甚至推翻现有结论。
总 结
在科学研究中确立因果关系是一个多步骤、多证据类型的严谨过程:
1. 随机对照试验(RCT):通过操纵 X 和随机分配,提供了最直接、最强的因果证据,是黄金标准。
2. 准实验和自然实验:利用现实中的“类随机”变异或巧妙设计,在无法进行 RCT 时提供次优但有力的因果证据,高度依赖识别策略和假设。
3. 观察性研究:主要提供相关性和支持性证据。要推断因果,必须严格满足一系列标准(时间顺序、关联强度、一致性、剂量反应、合理性、控制混杂等),并认识到其无法排除未测量混杂的根本局限。
4. 机制研究:揭示因果链条中的“黑箱”,为因果关系提供生物学/社会学的解释和合理性,增强可信度。
5. 复制和整合证据(系统综述/Meta分析)是确证因果关系的最终环节。
核心始终在于:能否设计研究或整合证据来尽可能排除混杂因素等替代性解释,证明 X 的变化确实是导致 Y 变化的原因。没有单一的研究是完美的,因果关系的建立依赖于证据的强度、一致性和累积性,以及对研究局限性的清醒认识。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-8-11 11:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社