因果推断 - 中介
目錄
- 基礎知識
- 中介公式
版權:轉載前請聯系作者獲得授權。
參考書籍:《The Book of Why》——Judea Pearl、論文
基礎知識
對于下面的因果圖,MMM是XXX和YYY之間的中介。
直接效應:擾動XXX而保持MMM恒定時,對YYY的影響即為直接效應。
間接效應:保持XXX恒定,并將MMM增加到XXX增加1個單位的情況下MMM所能達到的量,此時YYY的增量即為XXX對YYY的間接效應。
受控直接效應:CDE(0)=P(Y=1∣do(X=1),do(M=0))?P(Y=1∣do(X=0),do(M=0))CDE(0) = P(Y=1 | do(X=1), do(M=0)) - P(Y=1 | do(X=0),do(M=0))CDE(0)=P(Y=1∣do(X=1),do(M=0))?P(Y=1∣do(X=0),do(M=0))
其中,“受控”指的是受中介物MMM的控制,CDE(0)CDE(0)CDE(0)即為強迫中介物M=0M=0M=0。通過控制中介物M=0M=0M=0可以關閉間接路徑,從而得到直接效應。
但是,通過受控直接效應去估計直接效應會陷入“過度對照實驗”陷阱。由于中介物的取值并不是只有0,所以,存在多個受控直接效應:CDE(0),CDE(1),...,CDE(N)CDE(0), CDE(1), ... , CDE(N)CDE(0),CDE(1),...,CDE(N),使用哪一個受控直接效應更合適呢?對于這個問題,可以使用自然直接效應解決。
自然直接效應:NDE=P(YM=M0=1∣do(X=1))?P(YM=M0=1∣do(X=0))NDE = P(Y_{M=M_0}=1 | do(X=1)) - P(Y_{M=M_0}=1 | do(X=0))NDE=P(YM=M0??=1∣do(X=1))?P(YM=M0??=1∣do(X=0))
從公式中可以看出,自然直接效應中不以中介物MMM為條件,而是通過反事實進行定義。
受控間接效應:由于無法通過控制某些變量恒定來關閉直接路徑,故不存在受控間接效應。
自然間接效應:NIE=P(YM=M1=1∣do(X=0))?P(YM=M0=1∣do(X=0))NIE = P(Y_{M=M_1}=1|do(X=0)) - P(Y_{M=M_0}=1|do(X=0))NIE=P(YM=M1??=1∣do(X=0))?P(YM=M0??=1∣do(X=0))
總效應:TE(X=0→X=1)=NDE(X=0→X=1)?NIE(X=1→X=0)TE(X=0 \rightarrow X=1) = NDE(X=0 \rightarrow X=1) - NIE(X=1 \rightarrow X=0)TE(X=0→X=1)=NDE(X=0→X=1)?NIE(X=1→X=0)
中介公式
共分為兩條,可直接通過數據中的統計信息計算NDENDENDE和NIENIENIE。NDENDENDE的公式出自論文,EEE代表數學期望。NIENIENIE的公式出自《為什么》一書。
NDE=∑m[E(Y∣X=1,M=m)?E(Y∣X=0,M=m)]×P(M=m∣X=0)NDE = \sum_m [E(Y|X=1, M=m) - E(Y|X=0, M=m)] \times P(M=m|X=0)NDE=∑m?[E(Y∣X=1,M=m)?E(Y∣X=0,M=m)]×P(M=m∣X=0)
NIE=∑m[P(M=m∣X=1)?P(M=m∣X=0)]×P(Y=1∣X=0,M=m)NIE=\sum_m[P(M=m|X=1) - P(M=m|X=0)] \times P(Y=1|X=0,M=m)NIE=∑m?[P(M=m∣X=1)?P(M=m∣X=0)]×P(Y=1∣X=0,M=m)
總結
- 上一篇: 因果推断 - 反事实
- 下一篇: CVPR 2021 《Causal At