工具变量原理
在做回歸時,很多時候會有 E ( x t ε t ) ≠ 0 \text{E}(x_t \varepsilon_t)\neq 0 E(xt?εt?)?=0的情況,這也意味著不滿足外生性條件 E ( ε ∣ X ) = 0 \text{E}(\varepsilon|X)=0 E(ε∣X)=0,此時的OLS估計量 β ^ \hat\beta β^?就不再滿足無偏性,并且隨著 n n n的變大,它的bias也無法變小。若對此無法理解,請先掌握《小樣本OLS回歸梳理》中的內容。
此時該怎么辦?一種解決方法是利用一些與 ε \varepsilon ε無關的變量,這就是工具變量(instrumental variables,下文統稱IV)。我們假設找到的IV是一些 l × 1 l\times 1 l×1的向量 z t z_t zt?,再將它排成 n × l n\times l n×l的矩陣 Z = [ z 1 , ? , z n ] ′ Z=[z_1,\cdots,z_n]' Z=[z1?,?,zn?]′。
IV需要與原來的 x t x_t xt?足夠接近,因此 Z ′ X Z'X Z′X( X X X為 n × k n\times k n×k矩陣)必須滿列秩。而我們尋找IV的目的,就是要讓IV滿足 E ( z t ε t ) = 0 \text{E}(z_t\varepsilon_t)=0 E(zt?εt?)=0,由數據生成過程 ε t = y t ? x t ′ β o \varepsilon_t=y_t-x'_t\beta_o εt?=yt??xt′?βo?可知,我們要求解的就是滿足 E ( z t ( y t ? x t ′ β o ) ) = 0 \text{E}(z_t(y_t-x'_t\beta_o))=0 E(zt?(yt??xt′?βo?))=0的 β o \beta_o βo?。
我們無法知道 E ( z t y t ) \text{E}(z_t y_t) E(zt?yt?)和 E ( z t x t ′ ) \text{E}(z_t x'_t) E(zt?xt′?),但可以用樣本矩代替,即
n ? 1 ∑ t = 1 n z t ( y t ? x t ′ β o ) = Z ′ ( y ? X β o ) / n = 0 n^{-1}\sum_{t=1}^{n}z_t(y_t-x'_t \beta_o)=Z'(y-X\beta_o)/n=0 n?1t=1∑n?zt?(yt??xt′?βo?)=Z′(y?Xβo?)/n=0
上面的方程,若 l < k l \lt k l<k,則有多個解,若 l = k l=k l=k且 Z ′ X Z'X Z′X非奇異,則有唯一解 β ~ n = ( Z ′ X ) ? 1 Z ′ y \tilde \beta_n=(Z'X)^{-1}Z'y β~?n?=(Z′X)?1Z′y,若 l > k l \gt k l>k,無解。在經濟學理論中,往往會出現 l > k l \gt k l>k的情形,此時盡管方程無解,但我們依舊可以尋找 β o \beta_o βo?,使 Z ′ ( y ? X β o ) Z'(y-X\beta_o) Z′(y?Xβo?)盡可能接近 0 0 0。
我們可以定義一個 Z ′ ( y ? X β o ) Z'(y-X\beta_o) Z′(y?Xβo?)和 0 0 0之間的二次距離:
d n ( β ) = ( Y ? X β ) ′ Z P ^ n Z ′ ( y ? X β ) d_n(\beta)=(Y-X\beta)'Z \hat{P}_n Z'(y-X\beta) dn?(β)=(Y?Xβ)′ZP^n?Z′(y?Xβ)
其中 P ^ n \hat{P}_n P^n?是一個 l × l l\times l l×l的正定范數矩陣(positive definite norming matrix),它可以是隨機矩陣。這里之所以選擇二次距離,是因為這樣在求解最優化問題時比較方便,可以直接寫出一階條件:
? d n ( β ) ? β = ? 2 X ′ Z P ^ n Z ′ ( y ? X β ) = 0 \dfrac{\partial d_n(\beta)}{\partial \beta} = -2X'Z\hat{P}_n Z'(y-X\beta)=0 ?β?dn?(β)?=?2X′ZP^n?Z′(y?Xβ)=0
假設 X ′ Z P ^ n Z ′ X X'Z\hat{P}_nZ'X X′ZP^n?Z′X非奇異,就可以得到IV估計量
β ~ n = ( X ′ Z P ^ n Z ′ X ) ? 1 X ′ Z P ^ n Z ′ y \tilde \beta_n=(X'Z\hat{P}_nZ'X)^{-1}X'Z \hat{P}_nZ'y β~?n?=(X′ZP^n?Z′X)?1X′ZP^n?Z′y
只要選擇 Z Z Z和 P ^ n \hat P_n P^n?,就可以得到各種計量經濟學中的估計量。比如選擇 Z = X Z=X Z=X和 P ^ n = ( X ′ X / n ) ? 1 \hat P_n=(X'X/n)^{-1} P^n?=(X′X/n)?1,那么 β ~ n \tilde \beta_n β~?n?就變成了OLS估計量 β ^ n \hat \beta_n β^?n?。而選擇 P ^ n = ( Z ′ Z / n ) ? 1 \hat P_n=(Z'Z/n)^{-1} P^n?=(Z′Z/n)?1,就得到了2SLS(two-stage least squares)估計量。
IV估計量是無偏的嗎?在數據生成過程 y = X β o + ε y=X\beta_o+\varepsilon y=Xβo?+ε下,有
β ~ n = ( X ′ Z P ^ n Z ′ X ) ? 1 X ′ Z P ^ n Z ′ y = ( X ′ Z P ^ n Z ′ X ) ? 1 X ′ Z P ^ n Z ′ ( X β o + ε ) = β o + ( X ′ Z P ^ n Z ′ X ) ? 1 X ′ Z P ^ n Z ′ ε \begin{aligned} \tilde \beta_n=&(X'Z\hat{P}_nZ'X)^{-1}X'Z \hat{P}_nZ'y\\ =&(X'Z\hat{P}_nZ'X)^{-1}X'Z \hat{P}_nZ'(X\beta_o+\varepsilon)\\ =& \beta_o+(X'Z\hat{P}_nZ'X)^{-1}X'Z \hat{P}_nZ'\varepsilon \end{aligned} β~?n?===?(X′ZP^n?Z′X)?1X′ZP^n?Z′y(X′ZP^n?Z′X)?1X′ZP^n?Z′(Xβo?+ε)βo?+(X′ZP^n?Z′X)?1X′ZP^n?Z′ε?
事實上,上式的第二項我們沒有理由保證它為 0 0 0,哪怕有 E ( ε ∣ Z ) = 0 \text{E}(\varepsilon|Z)=0 E(ε∣Z)=0也無法保證。但在假設 Z ′ ε / n ? a . s . 0 Z'\varepsilon /n \stackrel{a. s. }{\longrightarrow}0 Z′ε/n?a.s.?0、 Z ′ X / n ? a . s . Q Z'X/n \stackrel{a. s. }{\longrightarrow} Q Z′X/n?a.s.?Q( Q Q Q為有限滿列秩矩陣)以及 P ^ n ? a . s . P \hat P_n\stackrel{a. s. }{\longrightarrow}P P^n??a.s.?P( P P P為有限正定矩陣)之后,可以得到比無偏性更弱的一致性: β ~ n ? a . s . β o \tilde\beta_n \stackrel{a. s. }{\longrightarrow} \beta_o β~?n??a.s.?βo?。
總結
- 上一篇: 一鸣心所向线下课程是真的吗?有用吗?
- 下一篇: 如何实现坐标系转换