張杉杉 陳 楠 劉紅云
(1首都經濟貿易大學勞動經濟學院,北京 100070)(2北京師范大學心理學院應用實驗心理北京市重點實驗室,北京 100875)(3艾美仕市場調研咨詢(上海)有限公司,北京 100005)
追蹤研究(Longitudinal Study)通過在一段時間內,對個體的某種或某些特征進行有系統(tǒng)的、定期的觀測,來探討特質發(fā)生、發(fā)展以及變化的特點。在追蹤研究中,研究者雖盡量使得前后觀測樣本相同,但是由于追蹤研究耗時較長,被試常常會因為個體特質或者其他外部影響因素而退出實驗,造成大量的缺失情況。追蹤研究中數據的缺失是研究者普遍會面臨的問題,但是如何選取合適的處理方法并不容易。
缺失數據處理方法的選擇依賴于缺失數據產生的機制以及缺失模式。缺失數據機制描述了缺失數據與該數據集中變量的真實值之間,以及與協(xié)變量之間的關系,主要有完全隨機缺失(Missing Completely at Random,MCAR)、隨機缺失(Missing at Random,MAR)和非隨機缺失(Missing Not at Random,MNAR)三種。前兩種情況下缺失值被視為可忽略的(Little &Rubin,2002),而非隨機缺失機制常被視為是不可忽略的(Power et al.,2012),所謂“不可忽略”,指的是非隨機缺失的數據不能夠作為其來源完整數據的有效代表,因此如果僅用非隨機缺失后的完整數據進行統(tǒng)計分析,將得到有偏的參數估計結果,甚至可能得到無效的結論 (Schafer &Graham,2002;Little &Rubin,2002)。
關于缺失數據處理方法的研究頗受重視,大量的研究表明,研究者常用的一些簡單的缺失數據處理方法,如列刪除(Listwise Deletion)和對刪除(Pairwise Deletion),單一插補的方法,由于其得到的參數估計結果有偏,檢驗力下降等種種局限性,并不推薦使用(Enders,2010)。近年來,關于缺失數據處理方法的研究主要集中在MAR缺失機制下的探討,其中多重插補法和極大似然估計法是應用最廣泛的兩種方法(Rotnitzky,2009)。對于MNAR缺失機制的數據,研究者也提出了一系列的處理方法(Albert &Follmann,2009;Enders,2011a,2011b )。
對于非隨機缺失數據的處理,由于需要描述缺失機制與目標變量的關系,其處理方法大多是采用基于模型的方法 (Little &Rubin,2002)。對于有非隨機缺失的追蹤數據的分析過程,則是在增長模型的基礎上加入一個描述缺失特征的模型來矯正偏差(葉素靜,唐文清,張敏強,曹魏聰,2014)。Heckman (1976)首先將選擇模型作為處理追蹤數據中MNAR缺失的方法,此后引起研究者廣泛關注。Little 和 Rubin (2002)、Schafer和 Graham (2002)推薦使用選擇模型(Selection Modeling)和模式混合模型(Pattern-Mixture Modeling)來處理MNAR缺失數據?;跐撟兞吭鲩L模型衍生出不同的處理非隨機缺失數據的模型,如Wu和Carroll (1988)模型、Diggle和Kenward (1994)選擇模型(以下簡稱D-K選擇模型)等,進一步在這些模型的基礎上添加潛類別變量,可以更加完善地處理帶有 MNAR缺失數據的增長模型,如Beunckens,Molenberghs,Verbeke和Mallinckrodt (2008)潛類別選擇模型、D-K潛類別選擇模型(Muthén,Asparouhov,Hunter,&Leuchter,2011)、Roy(2003)潛類別模式混合模型和 Muthén-Roy潛類別模式混合模型模型(Muthén et al.,2011)等。這些基于模型的 NMAR處理方法也逐漸用于應用研究中。但在實際應用中,由于選擇模型和模式混合模型基于不同的缺失機制的假設,且這些假設本身無法檢驗,因此很難對兩類方法進行比較。本研究主要考慮選擇模型非隨機缺失機制的假設條件下,探討D-K模型在處理缺失數據時的表現。
雖然目前已有許多 MNAR數據的處理方法,在實際研究中也得以應用,但 MNAR數據處理方法的選擇對研究者來說仍存在困難。首先,在MNAR機制下各類處理方法都需要滿足一定的前提假設,有研究者指出基于 MNAR機制下的處理方法可能會對缺失機制和正態(tài)分布的假設比較敏感(Enders,2011a,2011b)。但這一結論尚缺乏實證研究的證據。另外,對于MNAR缺失數據,如果正態(tài)性假設不滿足,這些基于模型的處理方法是否具有穩(wěn)健性仍需要進一步研究。同時,實際中MNAR缺失下方法選擇的問題,仍存在爭論。有研究者指出,如果忽略MNAR缺失機制而使用MAR假設下的模型會帶來估計上的偏差;但也有觀點認為,即使在違背假設的情況下,一個好的 MAR模型仍然要優(yōu)于差的MNAR模型(Schafer,2003)。因此,在MNAR機制下,如果采用了基于MAR的穩(wěn)健極大似然估計,其結果與基于 MNAR的模型分析方法相比,其表現是否也不遜色?另一方面,在 MAR機制下,如果采用基于MNAR的模型處理方法,其結果與 MAR下的穩(wěn)健極大似然估計是否存在差異。在目前尚無明確的檢驗數據MAR和MNAR缺失機制的方法下,對這些問題的探討,無疑對實際追蹤研究中,缺失數據處理方法的選擇很有價值。
基于上述問題,本文主要通過模擬研究的方法探討以下幾個問題:(1)在 MNAR缺失數據下,當目標變量不服從正態(tài)分布時,D-K選擇模型的參數估計是否具有穩(wěn)健性;(2)追蹤數據中含有不同缺失機制的數據,且目標變量不滿足正態(tài)分布時,基于增長模型的穩(wěn)健極大似然(MLR)方法與 D-K選擇模型相比兩者是否存在差異。同時,考慮數據偏離正態(tài)的程度、數據缺失比例、樣本量對不同方法的影響,并據此提供一些方法選擇和使用上的建議。
潛變量增長模型(Latent Growth Curve Model,LGM)是處理追蹤數據的一種常用方法。該模型在結構方程模型(Structural Equation Modeling,SEM)的視角下定義發(fā)展趨勢(McArdle &Epstein,1987;Meredith &Tisak,1990),通過潛變量(截距和斜率)來描述重復測量變量的發(fā)展特征。潛變量增長模型中不僅關注潛變量的均值,同時關注其方差;前者描述了整體的增長趨勢,后者則代表增長趨勢存在的個體差異。
圖1 潛變量增長模型
由于在MAR機制下,ML方法得到的參數估計是無偏的,而且與其他傳統(tǒng)的處理方法(如列刪除、對刪除和單一插補等)相比更加有效,方法學家們認為其是一種先進的處理缺失數據的技術(“a stateof-art missing data technique”.Schafer &Graham,2002)。甚至在MCAR機制下,ML方法也會比其他處理方法產生更優(yōu)良的統(tǒng)計量,因為它通過從觀測數據中“借取”信息而使得統(tǒng)計檢驗力最大化(Enders &Bandalos,2001)。雖然理想的極大似然估計假設數據服從正態(tài)分布,但是大量的研究結果表明,非正態(tài)校正的穩(wěn)健極大似然估計(robust ML;Yuan &Bentler,2000)即使在非正態(tài)的情況下,也可以得到近似無偏的結果。
選擇模型(Selection Modeling)(Glynn,Laird,&Rubin,1986;Little,1993,1995)將數據和缺失概率的聯(lián)合分布分解為邊緣分布和條件分布的乘積:
以Probit回歸模型定義的MNAR缺失機制可以用公式表示為:
圖2 Diggle-Kenward選擇模型
為了便于考察影響模型參數估計的因素,參考于以往研究者(Soullier,de La Rochebrochard,&Bouyer,2010;Yuan,Yang-Wallentin,&Bentler,2012)在模擬研究中考慮的影響因素,模擬設計如下:
(1)樣本量,根據前人研究(Zhang &Willson,2006)的建議,增長模型的最小樣本量不低于 50,因此取100、300、500、1000四個水平,依次代表從小到大的樣本量。
(2)數據永久缺失比例,取5%、10%、20%、40%四個水平,依次代表由少至多的永久缺失數量。設定在某時間點永久缺失的個體在隨后時間點均保持缺失,則該比例代表在此時間點剔除此前已退出的個體后,剩余的個體中發(fā)生永久缺失的比例。
(3)目標變量分布的偏態(tài)程度,取正態(tài)、輕微偏態(tài)、中度偏態(tài)和嚴重偏態(tài)四個水平。設定輕微偏態(tài)分布的偏度為0.5,峰度為3;中度偏態(tài)的偏度為2,峰度為12;嚴重偏態(tài)的偏度為3,峰度為30。
(4)考慮MNAR和MAR兩種缺失機制。
研究共包括4×4×4×2=128種實驗處理,每種實驗處理重復 500次。應用 Mplus軟件(Muthén,&Muthén,2007)進行分析。分析所用的語句見附錄1和附錄2。
本研究采用 R語言生成符合不同模型假設并帶有不同缺失模式的縱向數據集。數據生成過程如下:
第一步:生成完整的縱向數據集。
模擬的數據集代表對n
個被試重復測量t
(t
=5)次的追蹤研究,每次測量得到一個觀測值。采用潛變量增長模型來生成滿足目標變量分布特點的每個被試在各個時間點的觀測值y
,其中,j
=1,…,t
。對增長模型中的參數設定如下:截距i
服從正態(tài)分布,其均值為?1,方差為 0.50;斜率 s服從正態(tài)分布,其均值為0.5,方差為0.02;殘差之間相互獨立,且服從正態(tài)分布,其均值為0,5次測量殘差的方差分別為:0.50,0.48,0.42,0.32,0.18。其中非正態(tài)數據的生成借助于廣義Lambda分布生成(Headrick &Mugdadi,2006)。第二步:生成永久缺失模式的數據集。
對于永久缺失模式為 MNAR的情況,考查其符合D-K選擇模型假設下的缺失機制,即目標變量在某一時間點的缺失概率同時受當次觀測值和前一次觀測值的影響。對于永久缺失模式為MAR的情況,考查符合 ML方法假設下的缺失機制,即目標變量在某一時間點的缺失概率與上一時間點的觀測值有關,而與當次觀測值無關。具體來說,在D-K選擇模型的 MNAR機制假設下,使得目標變量在某一時間點的缺失概率與當次觀測值的大小成正比例關系,與上一時間點的觀測值成反比例關系;在 ML方法的 MAR機制假設下,使得目標變量在某一時間點的缺失概率與上一時間點的觀測值大小成反比例關系,而與當次觀測值無關。
對于不同的處理方法的評價標準,主要從參數估計精度和 95%置信區(qū)間對真值的覆蓋比率兩個方面來進行比較和評價。
(1)誤差均方根(Root Mean Square Error,RMSE)。RMSE描述了參數估計值與真值之間的差異大小,其值越小表示得到的參數估計值與真值的偏差越小。RMSE的計算公式為:
(2)95%置信區(qū)間對真值的覆蓋比率(Coverage Probability,CP)。該指標體現了估計的準確性,能在一定程度上反映參數估計精度和對應的標準誤估計值的情況。其計算公式為:
在缺失機制為 MAR的情況下,基于 MAR的ML方法得到的參數估計的精度都略好于D-K選擇模型;而在缺失機制為 MNAR的情況下,基于MNAR的D-K選擇模型都優(yōu)于ML方法。這主要是由于MAR的缺失機制更符合ML方法對缺失機制的假設,而MNAR的機制更符合D-K選擇模型對數據缺失機制的假設。
(1)截距均值的估計精度及影響因素
從圖3的結果可以看出,兩種缺失模式下,對于兩種處理缺失數據的方法,隨著樣本量的增大,參數估計的精度越來越高。從圖3(a)和圖3(b)可以看出,在MAR缺失模式下,D-K選擇模型和ML方法不存在差異,截距均值的估計精度不受缺失比例大小的影響;而在MNAR的缺失模式下,D-K選擇模型和ML方法存在差異,且隨著缺失比例的增加,兩種方法之間的差異越來越大。從圖3(c)和圖3(d)可以看出,在 MAR缺失模式下,截距均值的估計精度方法間不存在差異,也不受目標變量偏態(tài)程度的影響;而在MNAR的缺失模式下,兩種方法存在差異,但差異程度的大小不受目標變量偏態(tài)程度影響。綜合圖3的結果,對于截距均值的估計,D-K選擇模型的參數估計精度即使在MAR缺失機制下仍具有穩(wěn)健性,而對于ML方法,在MNAR缺失機制下,只有缺失比例較小(低于 10%)時,參數估計具有穩(wěn)健性。兩種方法對截距均值的估計精度均不受目標變量偏態(tài)程度的影響。
(2)斜率均值的估計精度及影響因素
圖3 截距均值估計精度及其影響因素
圖4結果表明,對于斜率均值的估計,兩種方法間存在差異,MAR缺失機制下,ML方法優(yōu)于D-K選擇模型,MNAR缺失機制下,D-K選擇模型優(yōu)于ML方法。
從圖4(a)和圖4(b)可以看出,無論那種缺失機制,隨著缺失比例的增加,兩種方法的差異增大。但在 MAR缺失機制下,隨著樣本量的增大,兩種方法的差異有減小的趨勢,MAR缺失比例較大時,隨著樣本量的增加兩種方法估計的精度均越來越高,且兩種方法之間的差異越來越小。在MNAR缺失機制下,隨著樣本量的增加D-K選擇模型估計的精度越來越高,而隨著樣本量的增大ML方法估計的精度并沒有明顯的改變,且兩種方法之間的差異隨著樣本量的增大越來越大。這說明在 MNAR缺失機制下對于斜率均值的估計,當缺失比例較大時即使增大樣本量ML方法的估計精度依然很低。
從圖4(c)和圖4(d)可以看出,無論那種缺失機制,ML方法估計的精度幾乎不受目標變量偏態(tài)程度的影響,而D-K選擇模型隨著目標變量偏態(tài)程度的增加,估計精度有下降的趨勢。在 MAR缺失機制下,隨著目標變量偏離正態(tài)分布程度的增加兩種方法之間的差異增大;同時,隨著樣本量的增加,D-K選擇模型估計精度增加,兩種方法之間的差異減小。在MNAR缺失機制下,不論樣本量大小ML方法的估計精度都較低;D-K選擇模型對斜率均值估計精度受到目標變量分布偏態(tài)程度的影響,當分布偏態(tài)程度增加時,D-K選擇模型估計精度變差??傮w來講在 MNAR缺失機制下,無論目標變量偏離正態(tài)分布的程度大小,即使增大樣本量也不能有效提高ML方法的精度;D-K選擇模型對斜率均值的估計精度受目標變量分布偏態(tài)程度的影響。
(3)截距方差的估計精度及影響因素
(4)斜率方差的估計精度及影響因素
使用正態(tài)分布的方法構建各增長參數的均值和方差估計的95%置信區(qū)間。表1分別給出不同模擬條件下兩種方法得到的95%置信區(qū)間對真值的覆蓋比率。
圖4 斜率均值估計精度及其影響因素
圖5 截距方差估計精度及其影響因素
圖6 斜率方差估計精度及其影響因素
表1 95% 置信區(qū)間覆蓋比率
對于截距均值的估計,在 MAR缺失機制下,兩種方法得到的 95%置信區(qū)間覆蓋比率差異很小;在MNAR缺失機制下,95%置信區(qū)間覆蓋比率ML方法遠低于D-K選擇模型。在MAR下,ML方法和D-K選擇模型幾乎不受樣本量、目標變量偏態(tài)程度和缺失比例的影響。而在MNAR下,隨著分布偏態(tài)程度的增大,各方法得到的95%置信區(qū)間對真值的覆蓋比率均有下降的趨勢,但下降幅度不大。D-K選擇模型幾乎不受樣本量和缺失比例的影響,但是ML方法隨著樣本量增大和缺失比例的增加,置信區(qū)間覆蓋比率顯著下降。
對于斜率均值的估計,在 MAR缺失機制下,ML方法優(yōu)于D-K選擇模型;在MNAR缺失機制下,ML方法得到的 95%置信區(qū)間覆蓋比率遠遠低于MAR缺失機制下D-K選擇模型。隨著偏態(tài)程度增大,D-K選擇模型和ML方法得到的95%置信區(qū)間覆蓋比率有所降低,D-K選擇模型的下降速度較明顯,而ML方法下降不明顯。在MNAR缺失機制下,隨著偏態(tài)程度增大,D-K選擇模型得到的95%置信區(qū)間覆蓋比率有明顯的降低,ML方法得到的結果雖有下降趨勢但相對很小。隨著樣本量增大和缺失比例的增加,兩種方法得到的95%置信區(qū)間覆蓋比率均有下降的趨勢。但是在MAR缺失模式下D-K選擇模型受樣本量和缺失比例的影響更大;而在MNAR缺失模式下,ML方法受樣本量和缺失比例的影響更大。
對于斜率方差的估計,兩種缺失機制下,兩種方法得到的置信區(qū)間覆蓋比率幾乎沒有差異。兩種方法得到的 95%置信區(qū)間覆蓋比率幾乎不受目標變量分布偏態(tài)程度、樣本量和缺失比例的影響。
本文重點解決了三個方面的問題,一是在MAR缺失機制下,基于MNAR的D-K選擇模型是否可以得到與ML方法近似的結果;二是在MNAR缺失機制下,基于MAR的ML方法是否可以得到與 D-K選擇模型近似的結果;三是在目標變量正態(tài)分布的假設不滿足時,不同缺失機制下兩種方法是否具有穩(wěn)健性。
(1)基于MAR的ML方法與基于MNAR的D-K選擇模型的比較
無論是從參數估計的精度還是從 95%置信區(qū)間對真值的覆蓋比率,在 MAR的缺失機制下基于MAR的ML方法得到了比D-K選擇模型更優(yōu)的結果,而在MNAR的缺失機制下基于MNAR的D-K選擇模型的結果優(yōu)于ML方法。
在 MAR的缺失機制下,對于潛變量增長模型關心的參數截距均值、截距方差和斜率方差這3個參數,兩種方法得到的差異很小,尤其是在大樣本量的情況下。這就說明即使數據是MAR的缺失機制,采用D-K選擇模型對截距均值、截距方差和斜率方差的估計也不會帶來非常嚴重的偏差,95%置信區(qū)間的覆蓋比率的結果也說明了兩種方法的差異不大;對于斜率的均值,兩種方法存在差異,但是當樣本量較大時,兩種方法的差異逐漸減小,也就是說,在大樣本的情況下,D-K選擇模型相對于MAR機制的缺失數據,對斜率均值的估計具有一定的穩(wěn)健性,不過值得注意的是此時得到的95%置信區(qū)間的覆蓋比率略低于 ML方法。ML方法在MAR下得到較好的參數估計結果的結論與以往這一領域的研究所得到的結論一致,樣本量和缺失比例的影響也得到了相似的結論(Enders &Bandalos,2001,2011a;Yuan,Yang-Wallentin,&Benter,2012;Lu,Zhang,&Cohen,2013)。
在 MNAR的缺失機制下,對于潛變量增長模型關心的截距方差和斜率方差這兩個參數,兩種方法得到的差異很小。這就說明即使數據是 MNAR的缺失機制,采用ML方法對截距方差和斜率方差的估計也不會帶來非常嚴重的偏差,95%置信區(qū)間的覆蓋比率的結果也說明了兩種方法的差異不大;但是對于截距均值和斜率均值的估計,兩種方法存在明顯差異,且隨著樣本量增大,兩種方法的差異越來越大。這就說明,即使在大樣本的情況下,ML方法相對于 MNAR機制的缺失數據,對截距均值和斜率均值的估計仍存在較大偏差,95%置信區(qū)間的覆蓋比率也可以得到類似的結論,尤其是對于斜率均值的估計;值得注意的是,當缺失比例很小時(如5%),兩種方法的差異很小。綜合來看,MNAR下的D-K選擇模型較小受到缺失機制的影響,但是在實際應用中應結合樣本量、目標變量的偏態(tài)程度和缺失比例的高低選擇分析方法。Lu等(2013)和Lu和 Zhang (2014)分別基于潛變量增長模性和潛變量混合增長模型也發(fā)現缺失機制錯誤的定義可能會導致錯誤的結論,與本得到的結果一致。進一步證實了在缺失數據處理過程中選擇正確模型的重要性。
(2)不同方法對目標變量分布形態(tài)的穩(wěn)健性
考慮在違背模型對目標變量分布形態(tài)的假設時,各模型的估計表現如何。對于截距均值偏態(tài)程度對兩種方法參數估計精度的影響均很小,對95%置信區(qū)間的覆蓋比率的影響也很小。對于斜率均值,D-K選擇模型在ML方法的假設下受到偏態(tài)程度的影響更大,且此時永久缺失比例與偏態(tài)程度之間存在明顯的交互作用,在永久缺失比例大的情況下,其參數估計精度受偏態(tài)程度影響更敏感;與以往研究結果相同(Yuan &Lu,2008;Yuan,Yang-Wallentin,&Benter,2012;Enders &Bandalos,2001;Shin,Davison,&Long,2009),ML方法不受目標變量分布偏態(tài)程度的影響;95%置信區(qū)間的覆蓋比率的結果也表明,其結果受偏態(tài)程度的影響,偏態(tài)程度越大,真值置信區(qū)間覆蓋比率越低。對于截距方差的估計,各方法受到偏態(tài)程度的影響都較大,且樣本量與偏態(tài)程度之間均存在顯著的交互作用,在樣本量小的情況下,得到的參數估計精度受偏態(tài)程度的影響更敏感。對于斜率方差的估計,MAR缺失機制下,D-K選擇模型受偏態(tài)程度的影響最明顯,且樣本量與偏態(tài)程度之間存在明顯的交互作用,當樣本量小的時候,其參數估計精度受偏態(tài)程度的影響更敏感。而ML方法僅在 MNAR缺失機制下輕微受偏態(tài)程度的影響??傮w來講,D-K選擇模型更容易受到目標變量分布偏態(tài)程度的影響,在樣本量較大時,偏態(tài)程度的影響會減弱,尤其是對于截距均值、截距方差和斜率方差的估計結果。正如 Muthén等(2011)指出的對于非隨機缺失的數據,由于缺失機制依賴于變量的分布,參數估計結果就會更多的依賴正態(tài)性的條件。
對于缺失數據處理模型的選擇,應該綜合考慮多種情況。其一,如果不能保證缺失數據的機制為MAR,則應注意到,非隨機缺失的處理方法會依賴于目標變量的分布的這一結論,可以通過一系列的轉換將其盡量轉換為正態(tài)分布。其二應盡量讓數據的缺失機制接近于 MAR,主要是因為 ML方法在MAR缺失機制下,即使對于非正態(tài)的數據也可以得到一致的參數估計結果Yuan和Lu (2008)。但是在實際應用中,往往很難驗證數據的缺失機制是MAR,以往研究者建議在研究中盡量包含較多的變量個數,以便使得缺失數據的機制接近 MAR,二階段的ML方法也是常用的方法(Graham,2003)。Yuan和Lu (2008)的研究表明,如果目標變量服從的分布未知或非正態(tài),兩階段的ML方法是一個明智的選擇。同時,也可以采用多個模型對數據進行分析,采用一系列模型擬合的指標,如 AIC,BIC,CAIC,BIC和DIC幫助選擇合適的模型,具體內容可以參考Lu等(2013)以及Lu和Zhang (2014)的研究。
由于MNAR缺失機制的理論假設較MCAR和MAR而言更為復雜,因此在實際應用中對 MNAR機制缺失數據處理方法的選擇更要慎重。對于含有缺失值的研究數據,在數據處理過程中要充分了解可能造成數據缺失的各種原因,遵循一定的分析過程對數據做全面的分析和了解。結合模擬研究的結果,本文建議在進行敏感性分析時應同步注意考慮目標變量分布的偏態(tài)程度、缺失比例及樣本量的大小可能對參數估計造成的影響,基于此建議處理含有缺失的追蹤數據時,采用以下的處理步驟:
(1)首先檢驗目標變量是否服從正態(tài)分布,如果不服從正態(tài)分布,且偏離正態(tài)分布的程度為中等或較嚴重,則需要通過一些轉換將其轉換為正態(tài)分布,常用的轉換方法有對數轉換、指數冪轉換等。
(2)檢查數據的缺失模式。目前僅有完全隨機缺失(MCAR)機制可以通過檢驗確定,方法包括進行一系列獨立的t檢驗(Dixon,1988)、Little的MCAR檢驗(Little,1988)等。如果確信數據的缺失機制為MCAR,則可以采用基于完全隨機缺失的傳統(tǒng)處理方法,可參考Little和Rubin (2002)、Enders (2010,2011a)等人的介紹。
(3)如果不確定數據的缺失機制為 MCAR,檢驗缺失比例的高低,如果缺失比例不超過 10%,根據模型省簡的原則,則可以采用基于 MAR的 ML方法。
(4)如果不確定數據的缺失機制為 MCAR,根據已有的研究或經驗判斷可能會存在非隨機缺失,且數據缺失的比例較高,則需要對數據進行敏感性分析(sensitivity analysis)(Carpenter,Kenward,&White,2007;Graham,Hofer,Donaldson,MacKinnon,&Schafer,1997;Jamshidian &Yuan,2013;Moreno-Betancur &Chavance,2016)。眾多方法學家建議研究者應用不同的模型或方法對可能含有 MNAR機制缺失的數據進行分析,檢查不同方法下結果的差異(Muthén et al.,2011)。結合本研究結果,建議對帶有缺失的數據分別采用MAR假設下方法(如ML方法)和 MNAR假設下的基于模型的方法(如 D-K選擇模型,模式混合模型等)進行分析。
(5)將不同方法得到的結果進行比較,結合模型擬合指標(AIC,BIC,CAIC,BIC和DIC)選擇一個最合理的假設對其數據的分析結果進行解釋說明:如果結論在兩類方法間一致,則認為選擇MAR下的分析結果進行呈現也是可靠的;如果 MNAR假設下得到的結論與 MAR假設下的結論不一致,那么認為MNAR下的結果更可信。
(6)即使是基于 MNAR機制的分析,也存在不同的模型,不同模型的假設和分析結果若存在較大差異,則需要根據理論的進一步分析做出判斷。
本研究主要探討了MAR缺失機制假設下ML方法與MNAR缺失機制假設下D-K選擇模型的比較,對于追蹤研究中非隨機缺失數據假設下的處理模型有多個(如模式混合模型),并且這些模型也有不同程度的拓展。本研究未能就更多的 MNAR缺失機制下的處理方法進行比較,在未來的研究中,可以進一步比較用于處理 MNAR缺失機制的不同模型間的比較。另外,本研究基于簡單的 LGM 模型,在后續(xù)研究中可以考慮更復雜的基本模型,如存在潛類別的混合增長模型情境下,不同缺失值處理方法的比較。同時,在估計方法上,也應進一步考慮更多的方法,如二階段ML方法和貝葉斯方法。
(3)永久缺失比例是影響模型參數估計精度的主要因素;樣本量增大會提高參數估計精度;偏態(tài)程度與永久缺失比例、偏態(tài)程度與樣本量之間存在一定的交互作用。
Albert,P.S.,&Follman,D.A.(2009).Shared-parameter models.In G.Fitzmaurice,M.Davidian,G.Verbeke,&G.Molenberghs (Eds.),Longitudinal data analysis
(pp.433?452).Boca Raton:Chapman &Hall/CRC Press.Beunckens,C.,Molenberghs,G.,Verbeke,G.,&Mallinckrodt,C.(2008).A latent-class mixture model for incomplete longitudinal Gaussian data.Biometrics,64
(1),96?105.Carpenter,J.R.,Kenward,M.G.,&White,I.R.(2007).Sensitivity analysis after multiple imputation under missing at random:A weighting approach.Statistical Methods in Medical Research,16
(3),259?275.Diggle,P.,&Kenward,M.G.(1994).Informative drop-out in longitudinal data analysis.Applied Statistics-Journal of the Royal Statistical Society Series C,43
(1),49?93.Dixon,W.J.(1988).BMDP statistical software manual:To accompany the 1988 software release
.California:University of California Press.Enders,C.K.(2011a).Analyzing longitudinal data with missing values.Rehabilitation Psychology,56
(4),267?288.Enders,C.K.(2011b).Missing not at random models for latent growth curve analyses.Psychological Methods,16
(1),1?16.Enders,C.K.(2010).Applied missing data analysis
.New York:The Guilford Press.Enders,C.K.,&Bandalos,D.L.(2001).The relative performance of full information maximum likelihood estimation for missing data in structural equation models.Structural Equation Modeling,8
(3),430?457.Glynn,R.J.,Laird,N.M.,&Rubin,D.B.(1986).Selection modeling versus mixture modeling with nonignorable nonresponse.In H.Wainer (Ed.),Drawing inferences from self-selected samples
(pp.115?142).New York:Springer.Graham,J.W.(2003).Adding missing-data-relevant variables to FIML-basedstructural equation models.Structural Equation Modeling,10
,80–100.Graham,J.W.,Hofer,S.M.,Donaldson,S.I.,MacKinnon,D.P.,&Schafer,J.L.(1997).Analysis with missing data in prevention research.In K.J.Bryant,M.Windle,&S.G.West (Eds.),The science of prevention:Methodological advances from alcohol and substance abuse research
(pp.325?366).Washington,DC,US:American Psychological Association.Headrick,T.C.,&Mugdadi,A.(2006).On simulating multivariate non-normal distributions from the generalized lambda distribution.Computational Statistics &Data Analysis,50
(11),3343?3353.Heckman,J.J.(1976).The common structure of statistical models of truncation,sample selection and limited dependent variables and a simple estimator for such models.Annals of Economic and Social Measurement,5
(4),475?492.Jamshidian,M.,&Yuan,K.H.(2013).Data-driven sensitivity analysis to detect missing data mechanism with applications to structural equation modelling.Journal of Statistical Computation and Simulation,83
,1344?1362.Little,R.J.A.(1988).A test of missing completely at random for multivariate data with missing values.Journal of the American Statistical Association,83
(404),1198?1202.Little,R.J.A.(1993).Pattern-mixture models for multivariate incomplete data.Journal of the American Statistical Association,88
(421),125?134.Little,R.J.A.(1995).Modeling the drop-out mechanism in repeated-measures studies.Journal of the American Statistical Association,90
(431),1112?1121.Little,R.J.A.,&Rubin,D.B.(2002).Statistical analysis with missing data
(2nd ed.).Hoboken,NJ:Wiley.Lu,Z.Q.,Zhang,Z.Y.,&Cohen A.(2013).Bayesian methods and model selection for latent growth curve models with missing data.In R.E.Millsap,L.A.van der Ark,D.M.Bolt,&C.M.Woods (Eds.),New developments in quantitative psychology
(pp.275?304).New York:Springer.Lu,Z.Q.,&Zhang,Z.Y.(2014).Robust growth mixture models with non-ignorable missingness:Models,estimation,selection,and application.Computational Statistics &Data Analysis,71
,220?240.McArdle,J.J.,&Epstein,D.(1987).Latent growth curves within developmental structural equation models.Child Development,58
,110?133.Meredith,W.,&Tisak,J.(1990).Latent curve analysis.Psychometrika,
55(1),107?122.Moreno-Betancur,M.,&Chavance,M.(2016).Sensitivity analysis of incomplete longitudinal data departing from the missing at random assumption:Methodology and application in a clinical trial with drop-outs.Statistical Methods in Medical Research,25
(4),1471–1489.Muthén,B.,&Masyn,K.(2005).Discrete-time survival mixture analysis.Journal of Educational and Behavioral Statistics,30
(1),27?58.Muthén,B.,Asparouhov,T.,Hunter,A.,&Leuchter,A.(2011).Growth modeling with non-ignorable dropout:Alternative analyses of the STAR*D antidepressant trial.Psychological
Methods,16
(1),17?33.Muthén,L.K.,&Muthén,B.O.(2007).Mplus user’s guide
(5th ed.).Los Angeles,CA:Muthén &Muthén.Power,R.A.,Muthén,B.,Henigsberg,N.,Mors,O.,Placentino,A.,Mendlewicz,J.,… Uher,R.(2012).Nonrandom dropout and the relative efficacy of escitalopram and nortriptyline in treating major depressive disorder.Journal of Psychiatric Research,46
(10),1333?1338.Rotnitzky,A.(2009).Inverse probability weighted methods.In G.Fitzmaurice,M.Davidian,G.Verbeke,&G.Molenberghs(Eds.),Longitudinal data analysis
(pp.453–476).Boca Raton,FL:Chapman &Hall.Roy,J.(2003).Modeling longitudinal data with nonignorable dropouts using a latent dropout class model.Biometrics,59
(4),829?836.Schafer,J.L.(2003).Multiple imputation in multivariate problems when the imputation and analysis models differ.Statistica Neerlandica,57
(1),19–35.Schafer,J.L.,&Graham,J.W.(2002).Missing data:Our view of the state of the art.Psychological Methods,7
(2),147?177.Shin,T.,Davison,M.L.,&Long,J.D.(2009).Effects of missing data methods in structural equation modeling with nonnormal longitudinal data.Structural Equation Modeling:A Multidisciplinary Journal,16
,70?98.Soullier,N.,de La Rochebrochard,E.,&Bouyer,J.(2010).Multiple imputation for estimation of an occurrence rate in cohorts with attrition and discrete follow-up time points:A simulation study.BMC Medical Research Methodology,10
,79.Wu,M.C.,&Carroll,R.J.(1988).Estimation and comparison of changes in the presence of informative right censoring by modeling the censoring process.Biometrics,44
(1),175?188.Ye,S.J.,Tang,W.Q.,Zhang,M.Q.,&Cao,W.C.(2014).Techniques for missing data in longitudinal studies and its application.Advances in Psychological Science,22
(12),1985?1994.[葉素靜,唐文清,張敏強,曹魏聰.(2014).追蹤研究中缺失數據處理方法及應用現狀分析.心理科學進展,22
(12),1985?1994.]Yuan,K.H.,&Bentler,P.M.(2000).Three likelihood-based methods for mean and covariance structure analysis with nonnormal missing data.Sociological Methodology,30
(1),165?200.Yuan,K.H.,&Lu,L.(2008).SEM with missing data and unknown population distributions using two-stage ML:Theory and its application.Multivariate Behavioral Research,43
,621?652.Yuan,K.H.,Yang-Wallentin,F.,&Bentler,P.M.(2012).ML versus MI for missing data with violation of distribution conditions.Sociological Methods &Research,41
(4),598?629.Zhang,D.,&Willson,V.L.(2006).Comparing empirical power of multilevel structural equation models and hierarchical linear models:Understanding cross-level interactions.Structural Equation Modeling,13
(4),615?630.附錄1:ML方法的Monte Carlo 模擬的語句
TITLE:
ML-mnar-mar-n-40001000
DATA:
FILE=mnarmar40001000replist.dat; !指定每種模擬條件下的500個數據集文件名列表;
TYPE=MONTECARLO;!指定了分析類型為Monte Carlo模擬研究;
VARIABLE:
NAMES=m1-m5 y1-y5;
USEVARIABLES=y1-y5;
MISSING=ALL (999);
ANALYSIS:
ESTIMATOR=ML;
MODEL:
i s|y1@0 y2@1 y3@2 y4@3 y5@4;
i WITH s*0;
i*0.5 s*.02;
[i*-1 s*0.5];
y1*.5 y2*.48 y3*.42 y4*.32 y5*0.18;
SAVEDATA:
RESULTS are ml40201000results.dat;
附錄2: D-K 選擇模型的Monte Carlo 模擬的語句
TITLE:
DK-mnar-mar-n-40201000
DATA:
FILE=mnarmar40201000replist.dat;
TYPE=MONTECARLO;
VARIABLE:
NAMES=m1-m5 y1-y5;
USEVARIABLES=y1-y5 d2-d5;
MISSING=ALL (999);
CATEGORICAL=d2-d5;
DATA MISSING:
NAMES=y1-y5;
TYPE=SDROPOUT;
BINARY=d2-d5;
ANALYSIS:
ESTIMATOR=ML;
LINK=PROBIT;
ALGORITHM=INTEGRATION;
INTEGRATION=MONTECARLO;
PROCESSORS=2;
MODEL:
i s|y1@0 y2@1 y3@2 y4@3 y5@4;
i WITH s*0;
i*0.5 s*.02;
[i*-1 s*0.5];
y1*.5 y2*.48 y3*.42 y4*.32 y5*0.18;
[d2$1*1.1134 d3$1*1.3506 d4$1*1.5745 d5$1*1.7842 ];
d2 on y1*-0.5 (11)
y2*1 (12);
d3 on y2*-0.5 (11)
y3*1 (12);
d4 on y3*-0.5 (11)
y4*1 (12);
d5 on y4*-0.5 (11)
y5*1 (12);
SAVEDATA:
RESULTS are dk40201000results.dat;