国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多時(shí)點(diǎn)雙重差分法的潛在問(wèn)題與解決措施

2023-05-30 13:29王鵬超韓立彬

王鵬超 韓立彬

〔摘要〕多時(shí)點(diǎn)雙重差分法具有準(zhǔn)自然試驗(yàn)特征,可以相對(duì)干凈地識(shí)別因果效應(yīng),廣泛應(yīng)用于與政策評(píng)估相關(guān)的研究中,但必須重視其可能存在的估計(jì)偏差問(wèn)題。本文總結(jié)了多時(shí)點(diǎn)雙重差分法存在的問(wèn)題和相應(yīng)的解決措施。通過(guò)梳理最新文獻(xiàn)發(fā)現(xiàn),多時(shí)點(diǎn)雙重差分法回歸系數(shù)識(shí)別的是組別—時(shí)間處理效應(yīng)的加權(quán)平均,而非受處理個(gè)體的平均處理效應(yīng)。在異質(zhì)性處理效應(yīng)下,多時(shí)點(diǎn)雙重差分法估計(jì)系數(shù)有偏,嚴(yán)重時(shí)估計(jì)系數(shù)符號(hào)會(huì)與真實(shí)系數(shù)符號(hào)相反。目前文獻(xiàn)上提出的解決措施可以歸結(jié)為一個(gè)診斷方法和三類解決方法。其中,診斷方法為Goodman-Bacon的系數(shù)分解定理,三類解決方法分別是加總方法、兩步回歸法和堆疊型雙重差分法。

〔關(guān)鍵詞〕雙重差分法(DID);多時(shí)點(diǎn)雙重差分法;異質(zhì)性處理效應(yīng);組別—時(shí)間處理效應(yīng)

中圖分類號(hào):F064.1 ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ?文章編號(hào):1008-4096(2023)02-0027-13

一、問(wèn)題的提出

計(jì)量經(jīng)濟(jì)學(xué)可信性革命推動(dòng)了實(shí)證經(jīng)濟(jì)學(xué)進(jìn)展,因果推斷成為實(shí)證經(jīng)濟(jì)學(xué)研究的顯學(xué)。2021年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予Card、Angrist和Imbens三位學(xué)者,表彰Card對(duì)勞動(dòng)經(jīng)濟(jì)學(xué)領(lǐng)域的實(shí)證貢獻(xiàn),以及Angrist和Imbens對(duì)因果推斷方法的貢獻(xiàn)。這充分肯定了因果推斷方法在經(jīng)濟(jì)學(xué)中的應(yīng)用與發(fā)展。雙重差分法(Difference-In-Difference,DID)作為應(yīng)用最廣的因果推斷方法之一,可以相對(duì)干凈地識(shí)別因果效應(yīng),在政策評(píng)估中受到國(guó)內(nèi)外學(xué)者青睞。本文統(tǒng)計(jì)了2005—2020年使用DID方法的中文期刊文章數(shù)量。DID已成為國(guó)內(nèi)實(shí)證研究者進(jìn)行學(xué)術(shù)研究的重要工具。

根據(jù)政策實(shí)施時(shí)點(diǎn)的不同,DID一般可分為單時(shí)點(diǎn)DID(Staggered DID)和多時(shí)點(diǎn)DID(Multiple DID)。然而學(xué)界對(duì)多時(shí)點(diǎn)DID識(shí)別的系數(shù)含義與正確性卻較少討論。單時(shí)點(diǎn)DID識(shí)別的是受處理個(gè)體的平均處理效應(yīng)(Average Treatment Effect on the Treated,ATT),多時(shí)點(diǎn)DID識(shí)別的是否也是受處理個(gè)體的平均處理效應(yīng)?多時(shí)點(diǎn)DID估計(jì)系數(shù)是否有偏?現(xiàn)有文獻(xiàn)并未過(guò)多討論?!禔merican Economic Review》2020年第9期,Chaisemartin和D'Haultfoeuille[1]探討了多時(shí)點(diǎn)DID存在的問(wèn)題,《Journal of Econometrics》在2021年第2期發(fā)布了“處理效應(yīng)”專題,其中3篇文章與多時(shí)點(diǎn)DID識(shí)別直接相關(guān)。表明學(xué)術(shù)界對(duì)這一方法存在問(wèn)題的高度關(guān)注。

最新研究發(fā)現(xiàn),多時(shí)點(diǎn)DID估計(jì)系數(shù)識(shí)別的并不是受處理個(gè)體的平均處理效應(yīng),而是組別—時(shí)間處理效應(yīng)的加權(quán)平均。當(dāng)存在異質(zhì)性處理效應(yīng)時(shí),估計(jì)系數(shù)有偏[1-5]。Goodman-Bacon[2]認(rèn)為,多時(shí)點(diǎn)DID估計(jì)系數(shù)可分解為多個(gè)單時(shí)點(diǎn)DID系數(shù)的加權(quán)平均,權(quán)重與每個(gè)單時(shí)點(diǎn)DID的樣本份額和解釋變量方差相關(guān),且都為正值。然而,部分單時(shí)點(diǎn)DID把早接受處理組作為晚接受處理組的對(duì)照組,在異質(zhì)性處理效應(yīng)下,這部分系數(shù)可能為負(fù),從而總體估計(jì)系數(shù)會(huì)存在較大偏差。Chaisemartin和D'Haultfoeuille[1]、Borusyak和Jaravel[3]以及Borusyak等[4]認(rèn)為,組別—時(shí)間處理效應(yīng)為正,但部分權(quán)重為負(fù),導(dǎo)致最終估計(jì)結(jié)果有偏。雖然事件研究法可以將不同處理時(shí)點(diǎn)轉(zhuǎn)化為處理時(shí)點(diǎn)一致的相對(duì)時(shí)點(diǎn),但Sun和Abraham[6]證明,事件研究法設(shè)定中的每一相對(duì)時(shí)點(diǎn)系數(shù)不僅與該相對(duì)時(shí)點(diǎn)系數(shù)相關(guān),還與回歸方程中其他相對(duì)時(shí)點(diǎn)系數(shù)及被剔除在方程之外的相對(duì)時(shí)點(diǎn)系數(shù)相關(guān)。在異質(zhì)性處理效應(yīng)下,利用相對(duì)時(shí)點(diǎn)系數(shù)大小檢驗(yàn)平行趨勢(shì)假定是否滿足也會(huì)存在問(wèn)題。

針對(duì)多時(shí)點(diǎn)DID存在的問(wèn)題,學(xué)者們提出了不同的解決方法,本文將其歸結(jié)為一個(gè)診斷方法和三類解決方法。其中,診斷方法為Goodman-Bacon[2]的系數(shù)分解定理,該方法用于診斷估計(jì)系數(shù)的偏差程度。第一類解決方法為Sun和Abraham[6]、Callaway和Sant'Anna[7]提出的加總方法,即分別估計(jì)每個(gè)時(shí)期每個(gè)組別平均處理效應(yīng),再將其加總得到所有受處理個(gè)體的平均處理效應(yīng);第二類解決方法為Gardner[8]和Borusyak和Jaravel等[3]提出的兩步回歸法;第三類解決方法為堆疊型DID(stacked DID)[9],將每一政策時(shí)點(diǎn)前后一段時(shí)期內(nèi)的處理組和干凈的對(duì)照組形成一個(gè)數(shù)據(jù)集,之后把所有的數(shù)據(jù)集堆疊并進(jìn)行回歸。

二、DID方法的基本原理

為闡明DID的基本原理,考慮包含2個(gè)組別和2個(gè)時(shí)期的2×2 DID情形。組別包括一個(gè)處理組(treat_i=1)和一個(gè)對(duì)照組(treat_i=0),時(shí)期包括政策前(post_t=0)和政策后(post_t=1)。政策效果通過(guò)式(1)進(jìn)行估計(jì):

Y_it=β_0 treat_i×post_t+β_1 treat_i+β_2 post_t+ε_(tái)it (1)

其中,β_0為政策評(píng)估所關(guān)注系數(shù),識(shí)別的是受處理個(gè)體的平均處理效應(yīng)。這一系數(shù)可以用式(2)和式(3)加以分解說(shuō)明:

β ?_0 ?=[E(Y_it (1)|treat_i=1,post_t=1)-E(Y_it (0)|treat_i=1,post_t=0)]-[E(Y_it (0)|treat_i=0,post_t=1)-E(Y_it (0)|treat_i=0,post_t=0)] (2)

(=[E(Y_it (1)|treat_i=1,post_t=1)-E(Y_it (0)|treat_i=1,post_t=1)]+[E(Y_it (0)|treat_i=1,post_t=1)@ ? -E(Y_it (0)|treat_i=1,post_t=0)]-[E(Y_it (0)|treat_i=0,post_t=1)-E(Y_it (0)|treat_i=0,post_t=0)]) (3)

其中,Y_it (1)和Y_it (0)是潛在結(jié)果。式(2)是處理組事后與事前均值的差異減去對(duì)照組事后與事前均值的差異,式(3)在式(2)上各加減一項(xiàng)E(Y_it (0)|treat_i=1,post_t=1)。式(3)中第一項(xiàng)表示事后所有受處理個(gè)體處理效應(yīng)的均值,第二項(xiàng)是處理組事后假若未經(jīng)處理的結(jié)果均值減去處理組事前的結(jié)果均值,第三項(xiàng)同理第二項(xiàng)。若滿足平行趨勢(shì)假定(第二項(xiàng)與第三項(xiàng)相減為0),得到β ?_0={E(Y_it (1)-Y_it (0)|treat_i=1,post_t=1)},β ?_0識(shí)別的是受處理個(gè)體的平均處理效應(yīng)。

單個(gè)政策時(shí)點(diǎn)情形下,為靈活地估計(jì)回歸系數(shù),常用個(gè)體固定效應(yīng)λ_i和時(shí)間固定效應(yīng)η_t代替式(1)中的treat_i和post_t。在多個(gè)政策時(shí)點(diǎn)情形下,若將D_it表示為處理狀態(tài),處理組在政策后受到影響為1,否則為0,由于post_t與個(gè)體i和時(shí)間t同時(shí)相關(guān),多時(shí)點(diǎn)DID的回歸方程如式(4)所示:

Y_it=β_0 D_it+λ_i+η_t+ε_(tái)it (4)

在多時(shí)點(diǎn)DID實(shí)際應(yīng)用中,由于存在多個(gè)處理組,無(wú)法直接通過(guò)對(duì)比處理組和對(duì)照組結(jié)果均值的時(shí)間變化,以此檢驗(yàn)是否滿足平行趨勢(shì)假定,因而事件研究法通常被當(dāng)作替代方法。這一方法不僅可以檢驗(yàn)事前是否滿足平行趨勢(shì)假定,還可以觀察事后政策效果的動(dòng)態(tài)變化。事件研究法的模型設(shè)定為式(5):

Y_(i,t)=∑_(l=-k)^(-2)β_l^0 ?D_(i,t)^l+∑_(l=0)^Lβ_l^1 ?D_(i,t)^l+λ_i+η_t+ε_(tái)(i,t) (5)

其中,(-k,L)是相對(duì)時(shí)點(diǎn)l的范圍,D_(i,t)^l是每一相對(duì)時(shí)點(diǎn)l是否接受處理,接受處理為1,未接受處理為0。實(shí)證中常剔除-1期這一相對(duì)時(shí)點(diǎn)作為基準(zhǔn),每一相對(duì)時(shí)點(diǎn)系數(shù)都表示為相對(duì)-1期這一時(shí)點(diǎn)系數(shù)的大小。假若政策前每一相對(duì)時(shí)點(diǎn)系數(shù)β_l^0都無(wú)法拒絕系數(shù)為零的假設(shè),則滿足平行趨勢(shì)假定,政策后每一相對(duì)時(shí)點(diǎn)系數(shù)β_l^1反映的是政策效果隨時(shí)間的變化。式(4)和式(5)的識(shí)別策略被廣泛用于漸進(jìn)性試點(diǎn)和多期試點(diǎn)政策研究中。

三、多時(shí)點(diǎn)DID存在的問(wèn)題

最新研究指出在異質(zhì)性處理效應(yīng)下多時(shí)點(diǎn)DID估計(jì)結(jié)果有偏。Baker等[10]利用蒙特卡羅方法,分析了不同處理效應(yīng)下多時(shí)點(diǎn)DID估計(jì)系數(shù)存在偏差的六種情況,并分別進(jìn)行了模擬。 圖1和圖2為模擬1—模擬3的結(jié)果。由圖1可知,模擬1和模擬2得到的估計(jì)系數(shù)圍繞真實(shí)系數(shù)呈正態(tài)分布,表明在單時(shí)點(diǎn)DID情況下,無(wú)論處理效應(yīng)是否隨時(shí)間變化,估計(jì)系數(shù)都是無(wú)偏的。在存在多個(gè)處理時(shí)點(diǎn),處理效應(yīng)不隨時(shí)間和處理組組別變化時(shí),模擬3得到的估計(jì)系數(shù)依然無(wú)偏。

圖3和圖4為模擬4—模擬6的結(jié)果。由圖3可知,在模擬4—模擬6中,多時(shí)點(diǎn)DID估計(jì)系數(shù)與真實(shí)系數(shù)存在偏差,偏差不斷增大,并且在模擬6中估計(jì)系數(shù)符號(hào)與真實(shí)系數(shù)符號(hào)相反。

圖3 模擬4—模擬6處理組和控制組結(jié)果均值的時(shí)間路徑

異質(zhì)性處理效應(yīng)既包括處理效應(yīng)隨不同處理組組別發(fā)生變化,也包括同一個(gè)處理組在時(shí)間維度發(fā)生變化。無(wú)論處理效應(yīng)是否隨時(shí)間變化,單時(shí)點(diǎn)DID都不存在估計(jì)系數(shù)有偏問(wèn)題。然而,由于早接受處理組在回歸中被作為晚接受處理組的對(duì)照組,導(dǎo)致多時(shí)點(diǎn)DID估計(jì)系數(shù)有偏,尤其在異質(zhì)性處理效應(yīng)下,偏差會(huì)更大。不僅如此,估計(jì)系數(shù)識(shí)別的也不是受處理個(gè)體的平均處理效應(yīng),而是組別—時(shí)間處理效應(yīng)的加權(quán)平均[1-5]。關(guān)于加權(quán)處理,Goodman-Bacon[2]對(duì)多時(shí)點(diǎn)DID系數(shù)的加權(quán)給出了直觀解釋。 考慮個(gè)體為N時(shí)期為T的平衡面板數(shù)據(jù),假設(shè)存在2個(gè)政策時(shí)點(diǎn):k和l,假設(shè)存在3個(gè)組別:早接受處理組k、晚接受處理組l和未受處理組U。

(0,k)時(shí)期為PRE(k),(k,l)時(shí)期為MID(k,l),(l,T)時(shí)期為POST(l)。在不考慮控制變量時(shí),DID回歸方程為式(6):

y_it=β^DD D_it+λ_i+η_t+ε_(tái)it (6)

通過(guò)分解β ?^DD,證明該系數(shù)可表示為4個(gè)2×2 DID系數(shù)的加權(quán)平均[2],如式(7)所示:

β ?^DD=s_ku β ?_ku^(2×2)+s_lu β ?_lu^(2×2)+s_kl^k β ?_kl^(2×2,k)+s_kl^l β ?_kl^(2×2,l) (7)

其中,s_ku=((n_k+n_U )^2 V ?_kU^D)/V ?^D ,s_lu=((n_l+n_U )^2 V ?_lU^D)/V ?^D , s_kl^k=(((n_k+n_l)(1-D ?_l))^2 V ?_kl^(D,k))/V ?^D ,s_kl^l=(((n_k+n_l)D ?_k )^2 V ?_kl^(D,l))/V ?^D 表示每個(gè)系數(shù)的權(quán)重,n_(j,j∈{k,l,U})是組別j樣本量占總體樣本量比重,D ?_(i,i∈{k,l})是(i,T)該時(shí)期占總時(shí)期T的比重,V ?^D是總體方差,V ?_kU^D,V ?_lU^D,V ?_kl^(D,k),V ?_kl^(D,l)是每個(gè)2×2 DID中D_it的方差。每一權(quán)重都由每組樣本份額的平方和每組方差與總體方差之比兩部分構(gòu)成,4個(gè)權(quán)重之和為1。β ?_ku^(2×2),β ?_lu^(2×2),β ?_kl^(2×2,k),β ?_kl^(2×2,l)分別是早接受處理組k和未受處理組U在(0,T)的系數(shù)、晚接受處理組l和未受處理組U在(0,T)的系數(shù)、早接受處理組k和晚接受處理組l在(0,l)的系數(shù)、晚接受處理組l和早接受處理組k在(k,T)的系數(shù)。 其中,β ?_ku^(2×2),β ?_lu^(2×2),β ?_kl^(2×2,k)含義是處理組事后與事前y均值的差異減去對(duì)照組事后與事前y均值的差異。β ?_kl^(2×2,l)是將早接受處理組k作為對(duì)照組,含義為晚接受處理組l事后和事前y均值的差異減去早接受處理組k作為對(duì)照組事后與事前y均值的差異。

由式(2)至(3)可知,β ?_ku^(2×2),β ?_lu^(2×2),β ?_kl^(2×2,k)分別是受處理個(gè)體平均處理效應(yīng)+(處理組的時(shí)間趨勢(shì)-對(duì)照組的時(shí)間趨勢(shì)),在滿足平行趨勢(shì)假定條件下,系數(shù)識(shí)別的是受處理個(gè)體的平均處理效應(yīng)。但β ?_kl^(2×2,l)不同,β ?_kl^(2×2,l)是受處理個(gè)體平均處理效應(yīng)+(晚接受處理組l的時(shí)間趨勢(shì)-早接受處理組k作為對(duì)照組的時(shí)間趨勢(shì))-早接受處理組k處理效應(yīng)的時(shí)間趨勢(shì)。若早接受處理組的處理效應(yīng)隨時(shí)間變化較大,β ?_kl^(2×2,l)可能為負(fù)值并最終影響總體系數(shù)β ?^DD的估計(jì)。 因此,當(dāng)N趨于無(wú)窮時(shí),式(7)可以進(jìn)一步表示為式(8):

plim_(N→∞) β ?^DD=β^DD=VWATT+VWCT-ΔATT (8)

其中,VWATT(Variance-Weighted Average Treatment Effect on the Treated)是方差加權(quán)ATT,VWCT(Variance-Weighted Common Trends)是方差加權(quán)的平行趨勢(shì),ΔATT是早接受處理組處理效應(yīng)的時(shí)間趨勢(shì)。在滿足平行趨勢(shì)假定和處理效應(yīng)恒定(即ΔATT=0)條件下,多時(shí)點(diǎn)DID的估計(jì)系數(shù)為VWATT。當(dāng)存在異質(zhì)性處理效應(yīng)時(shí),多時(shí)點(diǎn)DID估計(jì)系數(shù)就會(huì)產(chǎn)生偏差。

更具體地,若將每個(gè)2×2 DID表述為是每個(gè)組,當(dāng)每個(gè)組組內(nèi)處理效應(yīng)恒定,組間各自的處理效應(yīng)也相同時(shí),如圖1模擬3所示,由于權(quán)重之和為1,VWATT就是ATT;當(dāng)每個(gè)組組內(nèi)處理效應(yīng)恒定,組間各自的處理效應(yīng)不同時(shí),如圖3的模擬4所示,估計(jì)系數(shù)不再是ATT,而是表現(xiàn)為VWATT,權(quán)重與每個(gè)組的樣本份額和處理變量方差相關(guān);當(dāng)處理效應(yīng)隨時(shí)間和組別變化時(shí),如圖3的模擬5和模擬6所示,由于式(8)中還需減去ΔATT,因而估計(jì)系數(shù)會(huì)存在較大偏差。更為嚴(yán)重時(shí),估計(jì)系數(shù)符號(hào)會(huì)與真實(shí)系數(shù)符號(hào)相反,無(wú)法準(zhǔn)確識(shí)別政策效果。

學(xué)者們對(duì)多時(shí)點(diǎn)DID估計(jì)系數(shù)有偏的解釋存在差別。Goodman-Bacon[2]認(rèn)為,所有2×2 DID系數(shù)的權(quán)重為正,但部分系數(shù)符號(hào)為負(fù),導(dǎo)致多時(shí)點(diǎn)DID估計(jì)系數(shù)存在偏差。Chaisemartin和D'Haultfoeuille[1]、Borusyak和Jaravel[3]以及Borusyak等[4]卻認(rèn)為,多時(shí)點(diǎn)DID系數(shù)是組別—時(shí)間處理效應(yīng)的加權(quán)平均,組別—時(shí)間處理效應(yīng)為正,但部分權(quán)重為負(fù),導(dǎo)致最終估計(jì)結(jié)果有偏。本文以Chaisemartin和D'Haultfoeuille[1]的研究來(lái)解釋這類觀點(diǎn)??紤]城市g(shù)-年份t-企業(yè)i層面的數(shù)據(jù)結(jié)構(gòu)。假定每個(gè)城市每年至少有一家企業(yè),處理發(fā)生在城市層面,城市受處理后所有企業(yè)也同樣受到處理。令Y_(i,c,t) (1)和Y_(i,c,t) (0)是企業(yè)的潛在結(jié)果,D_(c,t)是城市的受處理狀態(tài),D_(c,t)為1表示城市c在年份t受到處理,否則為0,D_(i,c,t)為企業(yè)受處理狀態(tài)。N_1=∑_(i,c,t)D_(i,c,t) 是所有受處理企業(yè)的觀測(cè)值數(shù)量,所有受處理企業(yè)的平均處理效應(yīng)為:Δ^TR=1/N_1 ?∑_((i, c, t): D_(c, t)=1)[Y_(i,c,t) (1)-Y_(i,c,t) (0)] 。令δ^TR=E(Δ^TR),δ^TR是回歸估計(jì)所要識(shí)別的ATT。將N_(c,t)是城市—時(shí)間組cell(c,t)的觀測(cè)值數(shù)量,每個(gè)城市—時(shí)間組的平均處理效應(yīng)定義為:Δ_(c,t)=1/N_(c,t) ?∑_(i=1)^(N_(c,t))[Y_(i,c,t) (1)-Y_(i,c,t) (0)] 。

δ^TR等價(jià)于所有受處理城市—時(shí)間組平均處理效應(yīng)Δ_(c,t)的加權(quán)平均,權(quán)重為每個(gè)城市—時(shí)間組樣本與所有受處理企業(yè)樣本之比,即式(9):

Δ^TR=E[∑_((c, t): D_(c,t)=1)N_(c,t)/N_1 ?Δ_(c,t) ] (9)

但是在滿足平行趨勢(shì)假定的雙向固定效應(yīng)模型下,實(shí)際得到的估計(jì)系數(shù)為式(10):

β_fe=E[∑_((c,t): D_(c,t)=1)N_(c,t)/N_1 ?w_(c,t) Δ_(c,t) ] ,

w_(c,t)=ε_(tái)(c,t)/(∑_((c, t): D_(c,t)=1)N_(c,t)/N_1 ?ε_(tái)(c,t) ) (10)

其中,w_(c,t)等式中的ε_(tái)(c,t)由D_(c,t)=α+γ_c+λ_t+ε_(tái)(c,t)得到。 N_(c,t)/N_1 ?w_(c,t)是每個(gè)受處理城市—時(shí)間組平均處理效應(yīng)的權(quán)重,由城市—時(shí)間組的樣本份額,以及ε_(tái)(c,t)與ε_(tái)(c,t)均值之比兩部分構(gòu)成。式(9)和式(10)表明,β_fe與Δ^TR并不相等,估計(jì)系數(shù)識(shí)別的不是ATT,而是組別—時(shí)間處理效應(yīng)的加權(quán)平均。部分組別—時(shí)間處理效應(yīng)權(quán)重為負(fù)時(shí),多時(shí)點(diǎn)DID的估計(jì)系數(shù)有偏。

考慮2個(gè)組別和3個(gè)時(shí)點(diǎn)的DID,第1組在第3時(shí)點(diǎn)受到處理,第2組在第2時(shí)點(diǎn)受到處理。ε_(tái)(c,t)可由式ε_(tái)(c,t)=D_(c,t)-D ?_c-D ?_t+D ? ??得到,其中D ?_g是g城市企業(yè)受處理狀態(tài)變量的均值,D ?_t是t年企業(yè)受處理狀態(tài)變量的均值,D ? ??是所有企業(yè)在所有年份受處理狀態(tài)變量的均值。不同組別和不同時(shí)間的ε_(tái)(c,t)分別是ε_(tái)1,3=1/6,ε_(tái)2,2=1/3,ε_(tái)2,3=-1/6。ε_(tái)(c,t)均值為(ε_(tái)1,3+ε_(tái)2,2+ε_(tái)2,3)×1/3=1/9,w_(c,t)分別是w_1,3=3/2, w_2,2=3,w_2,3=-3/2,β_fe是β_fe=1/2 E(Δ_1,3)+E(Δ_2,2)-1/2 E(Δ_2,3),如圖5所示。

由圖5可知,第2組在第3時(shí)點(diǎn)處理效應(yīng)的權(quán)重為負(fù),導(dǎo)致多時(shí)點(diǎn)DID估計(jì)系數(shù)有偏。負(fù)權(quán)重的來(lái)源可以通過(guò)Goodman-Bacon[2]的分解定理進(jìn)一步解釋。β_fe可分解為2個(gè)2×2 DID系數(shù)的加權(quán)平均,即β_fe=(DID_1+DID_2)/2。在滿足平行趨勢(shì)假定前提下,DID_1和DID_2分別為{(DID_1=[E(Y_2,2)-E(Y_2,1)]-[E(Y_1,2)-E(Y_1,1)]@DID_2=[E(Y_1,3)-E(Y_1,2)]-[E(Y_2,3)-E(Y_2,2)] )},DID_1識(shí)別的是ATT,因而DID_1=E(Δ_2,2),DID_2表示為DID_2=E(Δ_1,3)-[E(Δ_2,3)-E(Δ_2,2)],即ATT減去早接受處理組處理效應(yīng)的時(shí)間趨勢(shì),最終可得系數(shù)為β_fe=1/2 E(Δ_1,3)+E(Δ_2,2)-1/2 E(Δ_2,3),表明負(fù)的權(quán)重也是源于早接受處理組被作為晚接受處理組的對(duì)照組。在相同時(shí)間點(diǎn)上,受處理時(shí)間越長(zhǎng)的城市,其處理效應(yīng)的權(quán)重也越有可能為負(fù)[1]。當(dāng)負(fù)權(quán)重非常大時(shí),會(huì)導(dǎo)致估計(jì)結(jié)果產(chǎn)生大的偏差。

Sun和Abraham[6]研究表明,事件研究法可以解決圖3中模擬4和模擬5存在的問(wèn)題,但無(wú)法解決模擬6存在的問(wèn)題,原因在于每一相對(duì)時(shí)點(diǎn)上的處理效應(yīng)不僅與自身時(shí)點(diǎn)處理效應(yīng)相關(guān),還與回歸中其他相對(duì)時(shí)點(diǎn)及被剔除在等式之外的其他相對(duì)時(shí)點(diǎn)處理效應(yīng)相關(guān)??紤]個(gè)體為N,時(shí)期為T+1的樣本。Y_(i,t)為結(jié)果變量,Y_(i,e+l)和Y_(i,e+l)^∞分別為個(gè)體i在時(shí)點(diǎn)t的可觀測(cè)結(jié)果和未接受處理的反事實(shí)結(jié)果。D_(i,t)為二值變量,表示個(gè)體受處理狀態(tài)。將受處理個(gè)體i首次受到處理的時(shí)點(diǎn)表示為E_i=min{t |D_(i,t)=1},個(gè)體未接受處理的時(shí)點(diǎn)表示為E_i=∞,隊(duì)列(cohort)e為首次接受處理時(shí)點(diǎn)E_i相同的所有個(gè)體集合。相對(duì)時(shí)點(diǎn)為l,l=t-e。Sun和Abraham[6]將受處理隊(duì)列e在相對(duì)時(shí)點(diǎn)l的平均處理效應(yīng)(Cohort-Specific Average Treatment Effect on the Treated,CATT)定義為式(11):

CATT_(e,l)=E[Y_(i,e+l)-Y_(i,e+l)^∞ |E_i=e] (11)

Sun和Abraham[6]基于這一定義得出了主要結(jié)論。假設(shè)T=3,存在3個(gè)隊(duì)列。 相對(duì)時(shí)點(diǎn)l,l∈{-3,-2,-1,0,1,2}?;貧w中常剔除第-1期作為基期,在該例中,由于沒(méi)有未受處理隊(duì)列,還需額外再剔除1期,最終剔除第-3期和第-1期。 以μ_(-2)表示第-2期系數(shù),在滿足平行趨勢(shì)假定條件下,經(jīng)證明μ_(-2)可分解為式(12)至式(14):

μ_(-2)=∑_(e∈{2,3})ω_(e,-2) ?CATT_(e,-2) (12)

+∑_(e∈{1,2,3})ω_(e,0) ?CATT_(e,0)+∑_(e∈{1,2})ω_(e,1) ?CATT_(e,1)+∑_(e∈{1})ω_(e,2) ?CATT_(e,2) (13)

+∑_(e∈{1,2,3})ω_(e,-1) ?CATT_(e,-1)+∑_(e∈{3})ω_(e,-3) ?CATT_(e,-3) (14)

其中,ω是CATT權(quán)重,式(12)是只和第-2期相關(guān)CATT的加權(quán)平均,所有權(quán)重之和為1;式(13)是回歸等式中除第-2期之外其他時(shí)期CATT的加權(quán)平均,所有權(quán)重之和為0;式(14)是被剔除在回歸等式之外其他時(shí)期CATT的加權(quán)平均,所有權(quán)重之和為-1。

若處理前不存在預(yù)期性行為,即個(gè)體不會(huì)在處理前受到影響,當(dāng)l<0時(shí),對(duì)于任意隊(duì)列e,CATT_(e,l)=0,式(12)和式(14)都為0。在滿足無(wú)預(yù)期性行為假設(shè)下,存在兩類情形:(1)假設(shè)不同隊(duì)列處理效應(yīng)的時(shí)間趨勢(shì)相同,如圖3的模擬5所示,對(duì)于相對(duì)時(shí)點(diǎn)l的任意隊(duì)列e,CATT_(e,l)=CATT_l,由于權(quán)重之和為0,所以式(13)為0,最終第-2期系數(shù)為0;(2)假設(shè)不同隊(duì)列處理效應(yīng)的時(shí)間趨勢(shì)不同,如圖3的模擬6所示,第-2期系數(shù)非0,表明這一相對(duì)時(shí)點(diǎn)的系數(shù)有偏。同理,分解事前其他相對(duì)時(shí)點(diǎn)和事后相對(duì)時(shí)點(diǎn)系數(shù)也會(huì)存在偏誤。在現(xiàn)實(shí)案例中,不同隊(duì)列更多表現(xiàn)為異質(zhì)性處理效應(yīng)。這種情況下利用相對(duì)時(shí)點(diǎn)系數(shù)大小判別是否滿足平行趨勢(shì)假定,以及檢驗(yàn)處理效應(yīng)的動(dòng)態(tài)變化是存在問(wèn)題的。

四、多時(shí)點(diǎn)DID估計(jì)有偏的解決方法

針對(duì)在異質(zhì)性處理效應(yīng)下多時(shí)點(diǎn)DID存在的問(wèn)題,本文將解決方法總結(jié)為:診斷方法,也就是系數(shù)分解定理,三類解決方法分別為加總方法、兩步回歸法及堆疊型DID。

(一)系數(shù)分解定理

由Goodman-Bacon[2]的DID系數(shù)分解可知,當(dāng)存在2個(gè)處理時(shí)點(diǎn)加一個(gè)對(duì)照組時(shí),多時(shí)點(diǎn)DID的估計(jì)系數(shù)表示為4個(gè)2×2 DID系數(shù)的加權(quán)平均。當(dāng)存在K個(gè)不同的政策時(shí)點(diǎn)加一個(gè)對(duì)照組時(shí),多時(shí)點(diǎn)DID的估計(jì)系數(shù)可表示為K×K個(gè)系數(shù)的加權(quán)平均。通過(guò)觀察分解的不同系數(shù)大小和系數(shù)權(quán)重,即可診斷多時(shí)點(diǎn)DID存在的偏誤多大程度會(huì)影響最終估計(jì)結(jié)果。

關(guān)于系數(shù)分解定理。Stevenson和Wolfers[11]研究了1969—1985年美國(guó)部分州推行的無(wú)過(guò)錯(cuò)離婚法案對(duì)婦女自殺率的影響,結(jié)果表明無(wú)過(guò)錯(cuò)離婚法案實(shí)行后女性的自殺率有所降低。在不考慮任何控制變量情形下,多時(shí)點(diǎn)DID估計(jì)系數(shù)可以分解為156個(gè)2×2 DID系數(shù)的加權(quán)平均。

圖中所有三角和叉號(hào)表示的系數(shù)符號(hào)為負(fù),且系數(shù)無(wú)偏,與整體估計(jì)系數(shù)的符號(hào)一致。菱形和圓圈表示的系數(shù)會(huì)令整體估計(jì)有偏,因?yàn)檫@部分樣本把早接受處理組作為晚接受處理組的對(duì)照組,并且所有菱形表示的系數(shù)符號(hào)為正,與整體估計(jì)系數(shù)的符號(hào)相反。菱形和圓圈兩部分所占比重較高,最終會(huì)嚴(yán)重低估法案實(shí)施后對(duì)女性自殺率的影響。因此,通過(guò)分解系數(shù)大小與系數(shù)所占權(quán)重可以診斷多時(shí)點(diǎn)DID的估計(jì)偏差。無(wú)過(guò)錯(cuò)離婚法案對(duì)女性自殺率回歸系數(shù)的分解如圖6所示。

圖6 無(wú)過(guò)錯(cuò)離婚法案對(duì)女性自殺率回歸系數(shù)的分解

Goodman-Bacon[2]的系數(shù)分解定理并非解決方法,回歸中加入控制變量后得到的圖形也無(wú)法區(qū)分早接受處理組和晚接受處理組和晚處理組和早處理組的分解,但由于實(shí)證文章中通常匯報(bào)不加控制變量的回歸結(jié)果,Baker等[10]認(rèn)為此方法具有一般適用性,可以用于診斷只包括雙向固定效應(yīng)的回歸結(jié)果偏差。

(二)加總方法

Sun和Abraham[6]對(duì)事件研究法處理多時(shí)點(diǎn)DID時(shí)存在的問(wèn)題提出了相應(yīng)解決方法,即求得每一相對(duì)時(shí)點(diǎn)下所有隊(duì)列的CATT_(e,l),用樣本份額對(duì)這一時(shí)點(diǎn)下所有CATT_(e,l)加權(quán)平均。Sun和Abraham[6]將其提出的估計(jì)量稱之為交互加權(quán)估計(jì)量(Interaction-Weighted Estimator,IW Estimator),分三步求得。第一步,利用雙向固定效應(yīng)回歸估計(jì)CATT_(e,l),回歸等式為式(15):

Y_(i,t)=λ_i+η_t+∑_(e?C)∑_(l≠-1)δ_(e,l) ?(1{E_i=e}?D_(i,t)^l )+ε_(tái)(i,t) (15)

其中,C表示對(duì)照組,D_(i,t)^l表示是否為相對(duì)時(shí)點(diǎn)l,1{E_i=e}表示是否為隊(duì)列e。與每一相對(duì)時(shí)點(diǎn)l作對(duì)比的是相對(duì)時(shí)點(diǎn)-1,與每一組隊(duì)列e作對(duì)比的是對(duì)照組C.因此δ_(e,l)識(shí)別的是每一相對(duì)時(shí)點(diǎn)l下每一隊(duì)列e的平均處理效應(yīng)CATT_(e,l)。 第二步,估計(jì)每個(gè)隊(duì)列e在相對(duì)時(shí)點(diǎn)l的權(quán)重Pr{E_i=e|E_i∈[-l,T-l]},該權(quán)重含義為:每個(gè)隊(duì)列e在相對(duì)時(shí)點(diǎn)l下的樣本占相對(duì)時(shí)點(diǎn)l里所有隊(duì)列樣本的比重。 第三步,每一相對(duì)時(shí)點(diǎn)的交互加權(quán)估計(jì)量表示為v ?_l=∑_eδ ?_(e,l) ?(Pr) ?{E_i=e|E_i∈[-l,T-l]}。這一方法可以得到每一相對(duì)時(shí)點(diǎn)l準(zhǔn)確的估計(jì)系數(shù)。

類似地,Callaway和Sant'Anna[7]提出的解決方法依賴于定義的組別—時(shí)點(diǎn)平均處理效應(yīng)(Group-time Average Treatment Effect),將組別—時(shí)點(diǎn)平均處理效應(yīng)加總,即可得到總的處理效應(yīng)。組別—時(shí)點(diǎn)平均處理效應(yīng)定義為式(16):

ATT(g,t)=E[Y_t (g)-Y_t (0)|G_g=1] (16)

其中,g是個(gè)體首次受到處理的時(shí)點(diǎn),G是首次接受處理時(shí)點(diǎn)為g的個(gè)體集合。G_g表示是否是首次接受處理時(shí)點(diǎn)為g的組別G。Y_t (g)是首次接受處理時(shí)點(diǎn)為g的組別在時(shí)點(diǎn)t的結(jié)果,Y_t (0)是這一組別在t這一時(shí)點(diǎn)假若未經(jīng)處理的潛在結(jié)果。Callaway和Sant'Anna[7]考慮了兩類對(duì)照組,一類是將從未接受處理個(gè)體作為對(duì)照組,另一類是將從未接受處理個(gè)體以及尚未接受處理個(gè)體作為對(duì)照組。在滿足無(wú)預(yù)期性行為假設(shè)和平行趨勢(shì)假設(shè)條件下,若其他變量都不影響個(gè)體受處理狀態(tài), 則可以利用兩個(gè)不同的對(duì)照組分別求得組別—時(shí)點(diǎn)平均處理效應(yīng),如式(17):

(ATT〖(g,t)〗_unc^nev=E[Y_t-Y_(g-1) |G_g=1]-E[Y_t-Y_(g-1) |C=1]@ATT〖(g,t)〗_unc^ny=E[Y_t-Y_(g-1) |G_g=1]-E[Y_t-Y_(g-1) |D_t=0] ) (17)

其中,nev表示將未接受處理個(gè)體作為對(duì)照組(C=1),ny表示將從未接受處理個(gè)體以及未接受處理個(gè)體作為對(duì)照組(D_t=0)。unc表示不考慮控制變量,g-1是首次接受處理時(shí)點(diǎn)g的前一時(shí)點(diǎn)。如表1所示,假設(shè)存在4個(gè)個(gè)體,6個(gè)時(shí)期,個(gè)體1和個(gè)體2未接受處理,個(gè)體3在t=3接受處理,個(gè)體4在t=4接受處理,表中數(shù)字表示個(gè)體的結(jié)果Y。根據(jù)上式可得:{ATT〖(3,4)〗_unc^nev=(8-4)-((5-3)+(4-2))/2=2@ATT〖(3,4)〗_unc^ny=(8-4)-((5-3)+(4-2)+(7-5))/3=2)}。

然而,個(gè)體受處理狀態(tài)通常是非隨機(jī)的,在考慮控制變量情形下,三種方法可以獲得ATT(g,t):結(jié)果回歸方法(Outcome Regression,OR)、逆概率加權(quán)方法(Inverse Probability Weighting,IPW)、雙重穩(wěn)健方法(Doubly Robust,DR)。三種方法得到的ATT(g,t)在識(shí)別上相同,若需要進(jìn)一步做統(tǒng)計(jì)推斷,雙重穩(wěn)健方法會(huì)更加穩(wěn)健[7]。

依靠求得的ATT(g,t),通過(guò)不同形式加總,可以得到總體的平均處理效應(yīng)、處理效應(yīng)的動(dòng)態(tài)變化、不同處理組組間處理效應(yīng)、累積的平均處理效應(yīng)。 相應(yīng)表達(dá)式如式(18)至式(21):

θ_es (e)=∑_(g∈G)1{g+e≤T}P(G=g|G+e≤T)ATT(g,g+e) (18)

式(18)為每一相對(duì)時(shí)點(diǎn)e的系數(shù)。其中,1{g+e≤T}是指示函數(shù),G是所有個(gè)體首次接受處理的時(shí)點(diǎn)集合。以相對(duì)時(shí)點(diǎn)e=-2為例,θ_es (-2)表示為θ_es (-2)=1{1≤6}P{G=3|G-2≤6}ATT(3,3-2)+1{3≤6}P{G=5|G-2≤6}ATT(5,3-2)=P{G=3|G≤8}ATT(3,1)+P{G=5|G≤8}ATT(5,3)。因此,每一相對(duì)時(shí)點(diǎn)e的系數(shù)為所有不同組別G=g在相對(duì)時(shí)點(diǎn)ATT(g,t)的加權(quán)平均,權(quán)重為每個(gè)組別的樣本份額。

在[e,e^']數(shù)據(jù)結(jié)構(gòu)平衡的相對(duì)時(shí)期里,每個(gè)相對(duì)時(shí)點(diǎn)e的系數(shù)為式(19):

θ_es^bal (e;e^')=∑_(g∈G)1{g+e^'≤T}P(G=g|G+e^'≤T)ATT(g,g+e) (19)

其中,θ_es^bal (e;e^')表示為在e到e^'范圍內(nèi)相對(duì)時(shí)點(diǎn)e的系數(shù)。相對(duì)時(shí)點(diǎn)e在受處理時(shí)點(diǎn)附近范圍內(nèi),會(huì)包含所有受處理隊(duì)列。當(dāng)相對(duì)時(shí)點(diǎn)e^'距離受處理時(shí)點(diǎn)較遠(yuǎn)時(shí),可能只包含部分受處理隊(duì)列。由于所含隊(duì)列數(shù)量不同,其系數(shù)大小難以解釋,因而可以保留包含所有受處理隊(duì)列的相對(duì)時(shí)期。

每個(gè)組別G=g┴?的處理效應(yīng)為組別內(nèi)所有受處理時(shí)點(diǎn)ATT(g┴?,t)的均值,如式(20)所示:

θ_sel (g┴?)=1/(T-g┴?+1) ∑_(t=g┴?)^TA TT(g┴?,t) (20)

總體系數(shù)為每個(gè)組別G=g┴?處理效應(yīng)θ_sel (g┴?)的加權(quán)平均,權(quán)重為每個(gè)組別的樣本份額,如式(21)所示:

θ_sel^O=∑_(g∈G)θ_sel (g┴?)P(G=g|G≤T) (21)

上述兩種方法均是先獲得組別—時(shí)點(diǎn)平均處理效應(yīng),然后加總得到總的處理效應(yīng)。兩者的不同之處在于:第一,Sun和Abraham[6]定義的是相對(duì)時(shí)點(diǎn)上不同隊(duì)列的平均處理效應(yīng),可以加總得到每一相對(duì)時(shí)點(diǎn)系數(shù),但Callaway和Sant'Anna[7]定義的是正常時(shí)點(diǎn)上不同隊(duì)列的平均處理效應(yīng),將其加總可得相對(duì)時(shí)點(diǎn)的平均處理效應(yīng)、不同組別的平均處理效應(yīng)、總體的平均處理效應(yīng),適用更多情形;第二,Sun和Abraham[6]的解決方法沒(méi)有考慮控制變量對(duì)結(jié)果的影響,反觀Callaway和Sant'Anna[7]提出的獲得ATT(g,t)的三種方法都依賴于控制變量,因而更具有一般性。

(三)兩步回歸法

Gardner[8]開發(fā)了兩階段回歸法(Two-Stage Regression Approach),與Borusyak等[4]開發(fā)的方法類似,這是因?yàn)锽orusyak等[4]認(rèn)為Gardner[8]構(gòu)造的估計(jì)量采取了“插補(bǔ)”形式(Imputation Form),且通過(guò)兩步可以獲得無(wú)偏的估計(jì)系數(shù)。本文將這兩種方法統(tǒng)稱為兩步回歸法。

Gardner[8]首先對(duì)多時(shí)點(diǎn)DID存在的問(wèn)題給出直觀解釋,然后在此基礎(chǔ)上提出通過(guò)兩步法解決多時(shí)點(diǎn)DID存在的問(wèn)題。考慮個(gè)體i和時(shí)間t層面的數(shù)據(jù)結(jié)構(gòu),將受處理時(shí)點(diǎn)相同的個(gè)體歸為g組,g∈{0,1,...,G},g=0是對(duì)照組,若g=2,是處理時(shí)點(diǎn)發(fā)生在t=2時(shí)的個(gè)體集合。g組受處理后的時(shí)期為p,p∈{0,1,...,P},p=0是受處理之前,若p=2,是組別g=2接受處理后的時(shí)期為2。Y_gpit、Y_1gpit和Y_0gpit分別是個(gè)體可觀測(cè)結(jié)果、處理組潛在結(jié)果和對(duì)照組潛在結(jié)果。D_(g,p)表示組別g在時(shí)期p是否接受處理。

當(dāng)存在兩個(gè)時(shí)期和兩個(gè)組別(包括一個(gè)處理組和一個(gè)對(duì)照組)時(shí),2×2 DID回歸等式為Y_gpit=λ_g+γ_p+β_gp D_gp+ε_(tái)gpit,系數(shù)β_gp識(shí)別的是受處理個(gè)體的平均處理效應(yīng),即β_gp=β_11=E(Y_1gpit-Y_0gpit |D_gp=1),回歸等式用均值形式表示為式(22):

E(Y_gpit |g,p,D_gp)=λ_g+γ_p+β_gp D_gp (22)

當(dāng)存在多個(gè)處理組時(shí),受處理個(gè)體的平均處理效應(yīng)為E(β_gp |D_gp=1)=E(Y_1gpit-Y_0gpit |D_gp=1),即多個(gè)處理組平均處理效應(yīng)的均值。多時(shí)點(diǎn)DID回歸等式用均值形式表示,如式(23)所示:

E(Y_gpit |g,p,D_gp)=λ_g+γ_p+E(β_gp |D_gp=1)D_gp+[β_gp-E(β_gp |D_gp=1)] D_gp (23)

其中,E(β_gp |D_gp=1)是需要識(shí)別的受處理個(gè)體的平均處理效應(yīng),β_gp是回歸得到的估計(jì)系數(shù)。由前文可知,β_gp估計(jì)的是多個(gè)處理組處理效應(yīng)的加權(quán)平均,β_gp與E(β_gp |D_gp=1)并不相等。當(dāng)僅有一個(gè)處理組時(shí),兩項(xiàng)相減為0。當(dāng)處理效應(yīng)為同質(zhì)時(shí),β_gp等于受處理個(gè)體平均處理效應(yīng),兩項(xiàng)相減也為0。因此,最后一項(xiàng)可看作擾動(dòng)項(xiàng),其會(huì)影響多時(shí)點(diǎn)DID的最終估計(jì)結(jié)果。

Gardner[8]提出通過(guò)兩階段回歸法解決多時(shí)點(diǎn)DID存在的問(wèn)題。第一階段,保留D_gp=0的樣本,用Y_gpit對(duì)λ_g和γ_p進(jìn)行回歸;第二階段,在全樣本里將Y_gpit-λ ?_g-γ ?_t對(duì)D_gp回歸,最終估計(jì)系數(shù)識(shí)別的是受處理個(gè)體的平均處理效應(yīng)。該方法的優(yōu)點(diǎn)在于易于操作,并且第一階段回歸中也可加入控制變量。此外,該方法還可以拓展到事件研究法的應(yīng)用中,在第二階段將D_gp變?yōu)槿缡剑?)中的相對(duì)時(shí)點(diǎn)虛擬變量即可。雖然這一方法通過(guò)回歸得到無(wú)偏的估計(jì)系數(shù),但在統(tǒng)計(jì)推斷時(shí)還需對(duì)標(biāo)準(zhǔn)誤進(jìn)行調(diào)整,為此原文作者提供了Stata命令包did2s供實(shí)證研究者使用。

相比于Gardner[8]的兩階段回歸法,Borusyak等[4]提出的方法更為直觀。若處理組和對(duì)照組事前的差異可以完全由個(gè)體固定效應(yīng)和時(shí)間固定效應(yīng)捕捉,在控制雙向固定效應(yīng)后,對(duì)照組可以看作是處理組的反事實(shí)狀態(tài)。政策后某一時(shí)點(diǎn)t上,處理組個(gè)體結(jié)果減去對(duì)照組個(gè)體結(jié)果,兩者的差值便是受處理個(gè)體i在時(shí)間t的處理效應(yīng),通過(guò)對(duì)這一處理效應(yīng)加權(quán)平均,即可得到所有受處理個(gè)體的平均處理效應(yīng)。類似地,若處理組和對(duì)照組事前的差異還受其他變量影響,通過(guò)控制這些變量也可得到所有受處理個(gè)體的平均處理效應(yīng)。

該方法可以通過(guò)兩步得到多時(shí)點(diǎn)DID的無(wú)偏估計(jì)系數(shù),本文以只考慮固定效應(yīng)情形加以說(shuō)明。第一步,保留沒(méi)有受到處理的樣本,回歸估計(jì)處理組個(gè)體未接受處理的潛在結(jié)果Y_it (0),Y_it (0)=λ_i+η_t+ε_(tái)it。第二步,對(duì)于處理組樣本,令Y ?_it (0)=λ ?_i+η ?_t,個(gè)體i在時(shí)間t的處理效應(yīng)表示為τ ?_it=Y_it-Y ?_it (0)。最終的總體估計(jì)系數(shù)為所有受處理個(gè)體處理效應(yīng)的加權(quán)平均,權(quán)重為樣本份額。

(四)堆疊型DID

Cengiz等[9]在研究最低工資對(duì)就業(yè)的影響時(shí),使用了堆疊型DID。堆疊型DID是指在受處理時(shí)點(diǎn)前后(-j,k)范圍內(nèi),為受處理時(shí)點(diǎn)相同的隊(duì)列尋找干凈的對(duì)照組并形成一個(gè)數(shù)據(jù)集,數(shù)據(jù)集中包括這段時(shí)期內(nèi)受處理個(gè)體的樣本、從未接受處理個(gè)體的樣本和尚未接受處理個(gè)體的樣本,之后將所有數(shù)據(jù)集堆疊并進(jìn)行回歸?;貧w方程設(shè)定為式(24):

Y_mit=∑_(l=-j)^k〖β_l D_mit^l 〗+λ_mi+η_mt+ε_(tái)mit (24)

其中,m是數(shù)據(jù)集,i是個(gè)體固定效應(yīng),t是時(shí)間固定效應(yīng),D_mit^l表示是否為相對(duì)時(shí)點(diǎn)l,λ_mi為數(shù)據(jù)集—個(gè)體聯(lián)合固定效應(yīng),η_mt是數(shù)據(jù)集—時(shí)間聯(lián)合固定效應(yīng)?;貧w系數(shù)β_l的大小可以觀測(cè)處理效應(yīng)的動(dòng)態(tài)變化。雖然這一方法較為直觀,但并沒(méi)有相應(yīng)的理論證明。

總結(jié)而言,Goodman-Bacon[2]的分解定理應(yīng)用于診斷多時(shí)點(diǎn)DID系數(shù)的偏差。本文比較了不考慮控制變量時(shí)的不同解決方法。 在這一數(shù)據(jù)生成設(shè)定下,這幾類方法分別得到的相對(duì)時(shí)點(diǎn)估計(jì)系數(shù)相近,與真實(shí)系數(shù)也較為接近,然而不同解決方法仍存在差異。雖然堆疊型DID在實(shí)證研究中得到了應(yīng)用,但缺乏理論證明,且該方法需要手工合成數(shù)據(jù),較為繁瑣。Sun和Abraham[6]提出的方法只在事件研究法下適用,也沒(méi)有考慮加入控制變量的情形。Callaway和Sant'Anna[7]、Gardner[8]、Borusyak等[4]提出的方法既可以估計(jì)多時(shí)點(diǎn)DID系數(shù),也可以應(yīng)用于事件研究法,回歸中還可以加入控制變量,因而更具有一般性。

五、結(jié)論與建議

多時(shí)點(diǎn)DID識(shí)別的不是受處理個(gè)體的平均處理效應(yīng),而是組別—時(shí)間處理效應(yīng)的加權(quán)平均。特別是,如果存在異質(zhì)性處理效應(yīng),多時(shí)點(diǎn)DID的估計(jì)系數(shù)與真實(shí)系數(shù)會(huì)存在偏差。依據(jù)文獻(xiàn)給出的解決思路,本文將解決方法歸納為一個(gè)診斷方法和三類解決方法。

隨著DID在經(jīng)濟(jì)學(xué)實(shí)證研究中的廣泛應(yīng)用,學(xué)者有必要了解多時(shí)點(diǎn)DID問(wèn)題的應(yīng)對(duì)方式,以保證實(shí)證中估計(jì)系數(shù)的一致性?;诖?,本文給出以下四點(diǎn)建議:第一,重視對(duì)政策背景和研究設(shè)計(jì)的討論,清晰地闡述不同組別受政策影響的可能方向;第二,在處理組較少時(shí),可以通過(guò)觀察不同處理組和對(duì)照組的時(shí)間趨勢(shì),以此檢驗(yàn)異質(zhì)性處理效應(yīng)對(duì)結(jié)果的影響及平行趨勢(shì)假定是否滿足;第三,如果是面板數(shù)據(jù)結(jié)構(gòu),可利用系數(shù)分解定理評(píng)估系數(shù)偏差大??;第四,從實(shí)踐角度出發(fā),在利用多時(shí)點(diǎn)DID作為識(shí)別策略時(shí),研究者應(yīng)至少在以上三類解決方法中選擇其一,加強(qiáng)實(shí)證結(jié)果的可靠性和穩(wěn)健性。

參考文獻(xiàn):

[1] ?CHAISEMARTIN C D, D'HAULTFOEUILLE X. Two-way fixed effects estimators with heterogeneous treatment effects [J]. American economic review, 2020, 110(9): 2964-2996.

[2] ?GOODMAN-BACON A. Difference-in-differences with variation in treatment timing [J]. Journal of econometrics, 2021, 225(2): 254-277.

[3] ?BORUSYAK K, JARAVEL X. Revisiting event study designs [R]. SSRN working paper, 2017.

[4] ?BORUSYAK K, JARAVEL X, SPIESS J. Revisiting event study designs: robust and efficient estimation [R].CEPR

discussion papers, 17247.

[5] ?ATHEY S, IMBENS G W. Design-based analysis in difference-in-differences settings with staggered adoption [J]. Journal of econometrics, 2022, 226(1): 62-79.

[6] ?SUN L, ABRAHAM S. Estimating dynamic treatment effects in event studies with heterogeneous treatment effects [J]. Journal of econometrics, 2021, 225(2): 175-199.

[7] ?CALLAWAY B, SANT'ANNA P H C. Difference-in-differences with multiple time periods [J]. Journal of econometrics, 2021, 225(2): 200-230.

[8] ?GARDNER J. Two-stage differences in differences [R]. Working paper, 2021.

[9] ?CENGIZ D, DUBE A, LINDNER A, et al. The effect of minimum wages on low-wage jobs [J]. The quarterly journal of economics, 2021, 134(3): 1405-1454.

[10] ?BAKER A C, LARCKER D F, WANG C C Y. How much should we trust staggered difference-in-differences estimates? [J]. Journal of financial economics, 2022, 144(2): 370-395.

[11] ?STEVENSON B, WOLFERS J. Bargaining in the shadow of the law: divorce laws and family distress [J]. The quarterly journal of economics, 2006, 121(1): 267-288.

[12] ?SANT'ANNA P H C, ZHAO J. Doubly robust difference-in-differences estimators [J]. Journal of econometrics, 2020, 219(1): 101-122.

Potential Problems and Solutions of Staggered Difference-in-Difference Approach

WANG Peng-chao,HAN Li-bin

(Economic and Social Development Research Institute, Dongbei University of Finance and Economics,

Dalian 116025, China)

Summary:As one of the mainstream causal inference methods, difference-in-difference approach has the characteristics of quasi-natural experiment and can relatively exogenously identify the causal effect, so it is favored by scholars at home and abroad. The interpretation of treatment effect estimated by difference-in-difference approach with a single treatment period is well known, but there are only a few studies discussing the interpretation and accuracy of treatment effect estimated ?by staggered difference-in-difference approach. Recently, some latest studies discuss these problems in detail. This paper, ?by means of sorting such literature, summarizes ?the interpretation of treatment effect,potential problems, and corresponding ?solutions of staggered difference-in-difference approach.

The latest literature shows that the coefficient estimated by difference-in-difference approach with a single treatment period is unbiased regardless of the heterogeneity ?effect. ?Staggered difference-in-difference approach identifies ?the weighted average of ?different ?group-time treatment effects. ?The estimated ?coefficient ?is unbiased ?with ?homogeneity ?treatment effect but biased with heterogeneous treatment effect. Because some early-treated groups are taken as the control groups of the late-treatment groups, the estimated coefficients of this part are negative and finally result in the bias of the ?aggregated coefficient. In severe cases, the symbols of both estimated coefficient and real coefficient are opposite. According to the solutions given by the latest literature, the methods to solve the bias of estimated coefficient can be divided into ?'a ?diagnosis method' and 'three kinds of solutions'. The diagnosis method is Goodman-Bacon decomposition theorem. It is used to diagnose the degree of bias by estimating the sizes and weights of different group-time treatment effect. The first is the aggregation method including two ways, all of which are to find comparable control groups for each treatment group and estimate each group-time treatment effect. Then the unbiased estimated coefficient can be obtained by averaging all the group-period effects weighted ?by the sample share. The second ?is ?two-step regression method involving two ways. ?The reason ?for ?uniformly ?terming the two ways ?as ?this ?name lies ?in that they are similar in the solutions and ?the ?unbiased coefficient ?can ?be ?gained ?by ?two ?steps. ?The ?third ?is ?the ?stacked difference-in-difference approach. It aims to find comparable control group for cohorts with the same treatment period and form a data set. This dataset includes the samples of ?treated group, never-treated ?group, ?and not-yet-treated ?group. Then it is to stack all ?the data sets ?and regress ?an ?augmented difference-in-difference specification.

With the wide application of staggered difference-in-difference approach in empirical research of economics, it ?is necessary for empirical researchers to know how to deal with the problems of this method.

Key words: difference-in-difference; staggered difference-in-difference; heterogeneous treatment effect; group-time treatment effect

(責(zé)任編輯:李明齊)

收稿日期:2022-11-12

基金項(xiàng)目:國(guó)家自然科學(xué)基金青年項(xiàng)目“土地資源配置對(duì)人力資本空間分布的影響研究:理論、機(jī)制與對(duì)策”(72003020)

作者簡(jiǎn)介:王鵬超(1996—),男,山西晉城人,博士研究生,主要從事區(qū)域和城市經(jīng)濟(jì)研究。E-mail:pengchaowang1996@163.com

韓立彬(1988—),男,山東臨沂人,副教授,博士,主要從事區(qū)域和城市經(jīng)濟(jì)研究。E-mail:hanlibin@dufe.edu.cn