前言
Judea Pearl是图灵奖得主,因果推断的奠基人之一。由于阅读的论文中涉及到反事实推断中Total Effect(TE), Natural Direct Effect(NDE), Total Indirect Effect(TIE)等概念,涉及到反事实推断方法的核心,因此前来拜读一下Pearl老爷子二十年前发表的这篇论文。
这篇文章比较硬核,挺难读的,有需求的同学可以先收藏一波,高能预警~~
1. Introduction
一个变量对另一个变量的直接效应(direct effect)可以通过控制其他变量(中介变量、其他因变量等)的值来确定,但是在非线性模型中,间接效应(indirect effect)是不能用这种方式得到的,在这种条件下,间接效应甚至还没有明确定义。
2. 概念性分析
2.1 直接效应 VS. 总体效应
直接效应(direct effect):直接效应是指,如果保持其他所有变量都不变,只改变X的值(例如从X=x∗
到X=x
,则Y的值发生多少变化。
和x∗剂量的药品A带来的总体治疗效果为 P(Yx=y)−P(Yx∗=y)
当考察一个线性系统时,直接效应可以直接通过变量前面的系数得到,中介变量的具体取值没有影响。但是当考察非线性系统时,中介变量的取值也会影响到直接效应的观测结果,因此需要仔细考虑。
2.2 描述性效应和规定性效应
(这个概念我还是第一次听说,主要是关于干预控制变量时,中介变量的取值问题。之前没有理解到,非线性系统中,其他变量的取值对因果效应的影响。)
描述性效应(Descriptive effect)指的是,不对中介变量的值做干预,保持其在自然状态下的取值,此时实施干预带来的因果效应。又称为自然效应(natural effect)
规定性效应(Prescriptive effect)指的是,用预定义的值来替换中介变量的值,改变其在自然状态下的取值,此时实施干预带来的因果效应。又称为控制效应(controlled effect)
这两个概念的区别在实际人群中观测平均因果效应的时候是很重要的。
2.3 自然效应对策略制定的意义
在估计自然直接因果效应的时候,需要使病人维持服药前的阿司匹林服用量,这种限制并不是do算子可以描述的,而是在不干预阿司匹林用量的情况下,断开了服药和阿司匹林服用量之间的因果路径。
后文会介绍如何用一种标准的方法处理这种情况。
2.4 自然间接效应
自然直接效应的概念可以被泛化到自然间接效应,但是规定直接效应无法这样泛化,因为规定效应已经把中介路径阻断了,无法衡量间接效应。
3. 正式分析
3.1 符号
表示干预之前的取值,x
3.2 控制直接效应
【Definition 1】(Controlled unit-level direct-effect; qualitative 个体控制直接效应,存在性定义) 在因果模型M中,如果在U=u的情况下,存在一组模型中其他变量的取值Z=z和X的两个取值x,x∗
,使得
Yx∗z(u)≠Yxz(u)(1)
则称X=x
这个事件(以X=x∗
为参考点)对Y有控制直接效应。
【Definition 2】(Controlled unit-level direct-effect; quantitative 个体控制直接效应,定量)给定一个因果模型M和一个因果图G,在U=u和Z=z的条件设置下,X=x
对Y的因果效应为:
CDEz(x,x∗;Y,u)=Yxz(u)−Yx∗z(u)(2)
其中Z代表在G中,除X外,Y的所有父节点。
【Definition 3】(Average contrilled direct effect,平均控制直接效应)给定一个概率因果模型<M,P(u)>
,X=x
对Y的控制直接效应被定义为:
CDEz(x,x∗;Y)=Eu(Yxz−Yx∗z)(3)
3.3 自然直接效应:定义
正如第二部分已经分析过的,自然效应和控制效应最大的区别,就是没有给Z人为赋值,而是使Z保持干预之前的值,相当于删去X到Z的因果路径,但是不对Z的值做干预,这是do算子无法表达的。
【Definition 4】(Unit-level natural direct effect; qualitative 个体自然直接效应;存在性定义)在U=u的条件下,如果
Yx∗(u)≠Yx,Zx∗(u)(u)(4)
则称事件X=x对Y有自然直接效应。也就是说,X
从x∗变成x,同时保持Z还是X=x∗
时的取值,如果此时Y的值发生了变化,则有自然直接效应。
【Definition 4.5】(unit-level natural direct effect; quantitative 个体自然直接效应;定量定义)在U=u的条件下,事件X=x对Y的自然直接效应大小为:
NDE(x,x∗;Y,u)=Yx,Zx∗(u)(u)−Yx∗(u)(5)
【Definition 5】(Average natural direct effect,平均自然直接效应)事件X=x对Y的平均自然直接效应为:
NDE(x,x∗;Y)=Eu(Yx,Zx∗)−Eu(Yx∗)(6)
3.4 自然直接效应:识别
从观测数据中,无法直接估计自然直接效应,换句话说,自然直接效应无法被直接转化为统计量。
文中给出了识别自然直接效应所需的条件,还没看懂。。orzzzz
3.5 自然间接效应:定义
控制效应只有直接效应,没有间接效应。因此间接效应就只有自然间接效应。
【Definition 6】(Unit-level indirect effect; qualitative,个体间接效应,存在性定义)如果在U=u的条件下,
Yx∗(u)≠Yx∗,Zx(u)(u)(7)
则认为一个事件X=x对Y有间接效应。间接效应大小为:
NIE(x,x∗;Y,u)=Yx∗,Zx(u)(u)−Yx∗(u)(8)
不变的条件下,Z从自然值变为Zx(u)
【Definition 7】(Average indirect effect,平均间接效应)事件X=x对Y的平均间接效应为:
NIE(x,x∗;Y)=Eu(Yx∗,Zx)−Eu(Yx∗)(9)
【Theorem 3】综合以下等式:
TE(x,x∗;Y)=E(Yx)−E(Yx∗)NDE(x,x∗;Y)=Eu(Yx,Zx∗)−Eu(Yx∗)NIE(x,x∗;Y)=Eu(Yx∗,Zx)−Eu(Yx∗)(10)(11)(12)
可知,无论是线性还是非线性模型中,总体、直接和间接效应都遵循如下关系:
TE(x,x∗;Y)=NIE(x,x∗;Y)−NDE(x∗,x;Y)TE(x,x∗;Y)=NDE(x,x∗;Y)−NIE(x∗,x;Y)(13)(14)
在线性系统中,有:
TE(x,x∗;Y)=NDE(x,x∗;Y)+NIE(x,x∗;Y)(15)
3.6 自然间接效应:识别
容我过段时间来补上3.4和3.6两部分 TAT
3.7 General Path-specific Effects
(emmm这个标题没翻译出来)
例如我们要得到X→Z→W→Y
这条路径的因果效应,方法就是通过去除其他X→Y
的因果路径,如Figure 3(b)。
4. 结论
这篇文章提出了一种新的路径相关因果效应的定义,通过对路径进行操作,达到了do算子无法表达的效果,将直接效应和间接效应的定义范围扩展到了非线性模型。本文还给出了通过实验数据和非实验数据来识别直接和间接因果效应的条件。通过定义和计算直接和间接效应,可以回答传统方法无法回答的政策问题,为更好的决策提供理论工具支撑。