唐文清 張敏強(qiáng) 黃憲 張嘉志 王旭
摘要:加速追蹤設(shè)計(jì)(ALD)是一種選擇相鄰多個群組同時進(jìn)行短期追蹤研究,獲得在測量上有重疊的多個群組追蹤數(shù)據(jù),對多個群組數(shù)據(jù)進(jìn)行合并建構(gòu)一條在時間跨度上較長的發(fā)展趨勢或增長曲線的方法。ALD結(jié)合真追蹤和橫斷設(shè)計(jì)的特征,既保持真追蹤設(shè)計(jì)的大部分優(yōu)點(diǎn),克服真追蹤研究中由于重測效應(yīng)和被試缺失導(dǎo)致的問題,又嘗試分離年齡、群組和歷史時間效應(yīng),在發(fā)展心理研究有重要應(yīng)用。已有研究探討ALD的數(shù)據(jù)分析方法、ALD的有效性及設(shè)計(jì)特征。未來研究應(yīng)關(guān)注拓展設(shè)計(jì)條件下ALD的適應(yīng)性,探索非線性假設(shè)或群組效應(yīng)顯著時的數(shù)據(jù)分析方法和ALD中缺失數(shù)據(jù)處理問題。
關(guān)鍵詞:追蹤研究:加速追蹤設(shè)計(jì);數(shù)據(jù)分析方法;設(shè)計(jì)特征
分類號:B841
1、問題提出
心理學(xué)研究中常采用橫斷設(shè)計(jì)和追蹤設(shè)計(jì)方法研究心理與行為發(fā)展變化過程及影響因素。橫斷設(shè)計(jì)(cross,sectional design,CSD)同時收集不同年齡群組(cohort)被試的數(shù)據(jù),通過比較不同群組的差異,鑒別個體心理發(fā)展的某些方面是否與年齡有關(guān)。橫斷研究可快速得到研究結(jié)果,有較高時效性,但面臨群組效應(yīng)(cohort effect,也叫朋輩效應(yīng))與年齡效應(yīng)(aging effect)的混淆,不能真正提供關(guān)于個體發(fā)展過程的信息,通過橫斷研究描述個體的心理發(fā)展過程有很大局限(Bell,1953;Hofer,Thorvaldsson,&Piccinin,2012;Stanger&Verhulst,1995)。
追蹤設(shè)計(jì)是在一段時間內(nèi)對研究對象進(jìn)行多次測量,描述心理與行為發(fā)展變化的方法。廣義的追蹤設(shè)計(jì)(10ngitudinal design)包含多種類型,但“真正的追蹤研究”是指“預(yù)期的追蹤研究”(劉紅云,張雷,2005),也叫固定樣本追蹤設(shè)計(jì)或真追蹤設(shè)計(jì)(trile longitudinal design,TLD)(Moerbeek,2011)。TLD在一段時間內(nèi)對同一組被試的心理特質(zhì)進(jìn)行反復(fù)觀測,獲得長時追蹤數(shù)據(jù),相比CSD,TLD可直接研究心理與行為的變化過程,分析個體隨時間變化在發(fā)展水平、變化速度的差異,鑒別導(dǎo)致不同結(jié)果的影響因素(Bell,1953;Duncan&Duncan,2012;Hofer et al.,2012),在發(fā)展心理研究中有越來越廣泛應(yīng)用。但TLD要求長時間對一組被試進(jìn)行追蹤研究,經(jīng)濟(jì)消耗大,面臨嚴(yán)重的被試缺失、重測效應(yīng)及研究結(jié)果過時等問題,影響研究結(jié)果的有效性。TLD只對一組被試進(jìn)行追蹤研究,難以確定心理與行為的變化是由自身發(fā)展成熟引起,還是由不同測量時間下的歷史、文化因素引起,即年齡和歷史時間效應(yīng)(period effect)的混淆(Duncan&Duncan,2012;Duncan,Duncan,&Hops,1996;Duncan,Duncan,&Strycker,2006a)。TLD在實(shí)際應(yīng)用中也常受到被試和時間等研究條件的限制而不能順利實(shí)施(Bell,1953,1954)。
由于CSD和TLD在發(fā)展心理研究應(yīng)用的局限,在很長一段時間內(nèi),研究者都在尋找一種既可保持CSD和TLD的優(yōu)點(diǎn),又可減少CSD和TLD局限的方法。針對此問題,Bell(1953)最早提出結(jié)合了CSD和TLD特點(diǎn)的收斂設(shè)計(jì)(convergence design),認(rèn)為同時對多個橫斷群組進(jìn)行追蹤研究,連接多個群組數(shù)據(jù)獲得近似TLD的研究結(jié)果,可很大程度克服CSD和TLD在發(fā)展心理研究應(yīng)用的局限,并在研究中初步證實(shí)通過收斂設(shè)計(jì)獲得近似TLD結(jié)果的有效性。加速追蹤設(shè)計(jì)(accelerated longitudinal design,ALD)是在收斂設(shè)計(jì)思想的基礎(chǔ)上發(fā)展起來。
文章將在闡述ALD的概念及優(yōu)點(diǎn)的基礎(chǔ)上,重點(diǎn)闡述ALD的數(shù)據(jù)分析方法、ALD的方法研究和應(yīng)用現(xiàn)狀,討論ALD方法及相關(guān)研究存在的問題,提出進(jìn)一步的研究方向。
2、ALD方法的概述
收斂設(shè)計(jì)思想提出后,許多研究者對這種方法的特征、有效性及應(yīng)用作了充分論述(Nesselroade&BaRes,1979;Schaie,1965),并在數(shù)據(jù)分析方法研究方面取得重要成果,促進(jìn)了這種研究設(shè)計(jì)的發(fā)展(Duncan et al.,1996;Duncan,Duncan,&Hops,1 994;Raudenbush&Chan,1992,1993)。為體現(xiàn)收斂設(shè)計(jì)對CSD和TLD特點(diǎn)的結(jié)合,并與TLD相區(qū)別,把這種方法稱作加速追蹤設(shè)計(jì)(ALD)(Tonry,Ohlin,&Farrington,1991;Duncan et al.,1996),或群組序列設(shè)計(jì)(cohort-sequential design)(Nesselroade&Baltes,1979;Schaie,1965),也叫混合縱向設(shè)計(jì)(mixedlongitudinal design)(Berger,1986;Jang,2011),把TLD稱作真追蹤研究(true longitudinal study)(Duncan et al.,1996)或純追蹤研究(purelongitudinal study)(Jang,2011)。綜上所述,ALD是選擇相鄰多個群組同時進(jìn)行短期的追蹤研究,獲得在測量上有重疊的多個群組追蹤數(shù)據(jù),對多個數(shù)據(jù)的連接和合并建構(gòu)一條時間跨度較長的發(fā)展趨勢或增長曲線的方法。
ALD同時納入群組變量、年齡相關(guān)變量、測量次數(shù)和測量重疊度變量,有3個重要特征(如圖1是一個對3個年齡群組同時進(jìn)行6次測量,測量重疊為3次的ALD研究)。首先,ALD納入一個橫向的群組變量作為較高級的分組變量,群組間依次相鄰,每個群組包含一定樣本量被試,群組間樣本量可不同,同一時間測量可獲得橫斷數(shù)據(jù)(見圖1中群組和被試欄)。第二,納入縱向的年齡相關(guān)變量(如年齡、年級)和測量次數(shù)變量(如圖1中橫軸表示年齡,每行的實(shí)線單元格數(shù)表示測量次數(shù),方格中的數(shù)據(jù)表示測量時間點(diǎn),虛線單元格表示該群組被試未被測量的時間點(diǎn)),對多個群組同時追蹤研究,可獲得多個群組追蹤數(shù)據(jù)。第三,納入測量重疊度變量,相鄰群組的相同年齡在測量上有一定程度重疊(圖l中,群組1的第4、5、6次測量與群組2的第l、2、3次測量重疊,即被試年齡相同),使不同群組追蹤數(shù)據(jù)可連接。ALD結(jié)合橫斷研究(選擇多個年齡群組)和縱向研究(每個群組都進(jìn)行追蹤研究)的特點(diǎn),具有單獨(dú)實(shí)施CSD和TLD研究所無法比擬的優(yōu)點(diǎn)。
首先,與TLD相比,ALD對多個群組同時進(jìn)行追蹤研究顯著縮短數(shù)據(jù)收集持續(xù)時間,較快獲得研究結(jié)果,提高研究的時效性和有效性。TLD選取單一樣本進(jìn)行長時追蹤研究,面臨選擇特殊群體的危險(xiǎn),容易導(dǎo)致嚴(yán)重的被試缺失和研究結(jié)果不具時代性,導(dǎo)致無效的研究結(jié)果(Watt,2008)。而ALD同時對多個群組進(jìn)行追蹤研究,通過較短的時間追蹤就可獲得較長時問跨度的追蹤數(shù)據(jù)(如圖1中,6次測量的ALD研究可獲得12次測量的追蹤數(shù)據(jù)),顯著縮短時間,減少經(jīng)濟(jì)支出和被試缺失,保證研究過程的組織和控制(Baer&Schmitz,2000;Duncan et al.,1 996;Raudenbush&Chan,1993),降低學(xué)習(xí)、疲勞、測量材料解釋變化等重測效應(yīng)(Hertzog&Nesselroade,2003)。當(dāng)要進(jìn)行長時間追蹤研究時(如10年),運(yùn)用ALD具有更好的時效性和有效性。
其次,ALD在發(fā)展心理研究中可相對獨(dú)立地分析群組效應(yīng)、年齡效應(yīng)和歷史時間效應(yīng),部分解決了CSD和TLD研究中的效應(yīng)混淆問題。發(fā)展心理研究中,基于CSD的研究混淆了年齡效應(yīng)和群組效應(yīng),基于TLD的研究混淆了年齡效應(yīng)和歷史時間效應(yīng)(Duncan&Duncan,2012;Schaie,1986),要從研究中推論關(guān)于個體發(fā)展的有效結(jié)論,必須對三種效應(yīng)進(jìn)行分離。ALD同時納入群組、年齡、測量時間和測量重疊度變量,研究過程既可分析橫向特征和縱向發(fā)展,也可比較不同群組的相同年齡被試的差異來評估群組效應(yīng),通過橫向比較和縱向比較確定年齡效應(yīng),從而相對獨(dú)立地評估年齡效應(yīng)、群組效應(yīng)和歷史時間效應(yīng),得出關(guān)于個體發(fā)展的有效結(jié)論(Baltes,Baltes,&Reinert,1970;Baltes&Nesselroade,1970,1972)。
最后,ALD同時選擇多個年齡群組進(jìn)行短期追蹤研究,可獲得更多的關(guān)于各年齡群組的心理與行為的發(fā)展信息,提高研究結(jié)果的一般信度(Hertzog&Nesselroade,2003),在大型發(fā)展心理研究中尤其重要。
3、加速追蹤數(shù)據(jù)分析方法
ALD優(yōu)點(diǎn)之一是克服TLD的局限,通過ALD研究獲得近似TLD的結(jié)果。對ALD的數(shù)據(jù)進(jìn)行TLD推論的前提是不同群組的數(shù)據(jù)是收斂的(convergent),即不同群組的相同年齡被試的發(fā)展具有相同的水平和相似形態(tài),用一條共同的線型就可表達(dá)多個群組的發(fā)展過程。因此,對加速追蹤數(shù)據(jù)分析時要檢驗(yàn)群組間追蹤數(shù)據(jù)是否收斂(Anderson,1993,1995;Duncan et al.,1996;Miyazaki&Raudenbush,2000;Tildesley&Andrews,2008)。Bell(1953,1954)通過分析重疊測量年齡組的均值和變化的速度差異來檢驗(yàn)加速追蹤數(shù)據(jù)是否收斂,運(yùn)用方差分析對加速追蹤數(shù)據(jù)進(jìn)行分析。回歸分析也被用于分析加速追蹤數(shù)據(jù)(Harezlak,Ryan,Giedd,&Lange,2005;Tang&Orwin,20091,但未考慮到加速追蹤數(shù)據(jù)的特征。統(tǒng)計(jì)方法的發(fā)展使基于結(jié)構(gòu)方程的潛變量增長曲線模型(latent growth curve model,LGM)(Duncan,Duncan,&Strycker,2006b;McArdle&Anderson,1990;McArdle&Hamagami,1992)和階層線性模型(hierarchical linear model,HLM)(Bryk&Raudenbush,1992;Miyazaki&Raudenbush,2000)用于分析加速追蹤數(shù)據(jù),在檢驗(yàn)群組數(shù)據(jù)收斂性的同時分析發(fā)展過程的整體水平和個體差異。
3.1 LGM對加速追蹤數(shù)據(jù)的分析
LGM結(jié)合多變量方差分析和結(jié)構(gòu)方程的特點(diǎn),用類似驗(yàn)證性因素分析的方法定義潛變量,用時間函數(shù)確定因子載荷,通過兩個潛變量來描述增長趨勢和變化特征(劉紅云,張雷,2005;Baer&Schmitz,2000;McArdle&Anderson,1990)。其中,截距因子是測量時間WO時,因變量的取值,截距的均值和方差分別描述個體在t=0時的整體均值及個體差異;斜率因子表示個體的變化速度,斜率的均值和方差分別描述整體變化速度和個體差異?;灸P偷臄?shù)學(xué)表達(dá)式:
yti=βoi+βIiTti+εti(1)
t為重復(fù)測量次數(shù),t=1,2,3……T;i=1,2,3……n,yti表示第i個被試第t個時間點(diǎn)的測量結(jié)果,βoi、βIi分別表示截距和斜率,Tti為時間變量相關(guān)的函數(shù),εti為誤差。
McArdle和Anderson(1 990)較早運(yùn)用LGM分析加速追蹤數(shù)據(jù),Anderson,Baer和Duncan等通過一系列研究證實(shí)LGM分析加速追蹤數(shù)據(jù)的適宜性(Anderson,1993,1995;Baer&Schmitz,2000;Duncan et al.,1994,1996,2006b)。LGM對加速追蹤數(shù)據(jù)的分析是對不同群組分別定義增長模型,通過限定不同群組發(fā)展趨勢相同來解決群組間發(fā)展是否存在差異及個體隨時間的發(fā)展趨勢問題。如Duncan等(2006a)運(yùn)用LGM對9、11、13歲群組的青少年酒精使用的加速追蹤數(shù)據(jù)進(jìn)行分析,研究9-16歲青少年酒精使用的發(fā)展特征(見圖2)。圖2中截距因子載荷限定為1,不同群組的相同年齡在斜率因子的時間載荷定義為相等,限定不同群組發(fā)展趨勢相同,并隨年齡呈線性增長。數(shù)學(xué)表達(dá)式:
Y(t,n=Mi(n)+L(t)Ms(n)+E(t,n) (2)
其中Y(t,n)表示第n個被試第t個時間點(diǎn)的測量值;Mi(n)是截距,Ms(n)是斜率,E(t,n)為誤差,L(t)是把變量Y與時間T聯(lián)系起來的數(shù)學(xué)函數(shù),若假設(shè)變化為線性函數(shù),則每個群組在四個時間點(diǎn)的測量值表達(dá)式分別為(以第一、第二群組為例):
第一群組:
y(1)=Mi+0Ms+E(t)
y(2)=Mi+1Ms+E(t)
y(3)=Mi+2Ms+E(t)
y(4)=Mi+3Ms+E(t)
第二群組:
y(2)=Mi+1Ms+E(t)
y(3)=Mi+2Ms+E(t)
y(4)=Mi+3Ms+E(t)
y(5)=Mi+4Ms+E(t)……
上述模型只簡單定義了線性增長模型,在實(shí)際研究中,可不固定斜率因子的載荷,運(yùn)用不定義LGM對數(shù)據(jù)進(jìn)行擬合,估計(jì)各時間點(diǎn)觀測變量對斜率因子的載荷,描述發(fā)展趨勢(如Duncanet al.,1996)。
根據(jù)已有研究(Anderson,1993;Baer&Schmitz,2000;Duncan&Duncan,20 12;Duncan etal.,1994,1996,2006a,2006b;劉紅云,張雷,2005),LGM分析加速追蹤數(shù)據(jù)時(以定義LGM為例),首先對不同群組分別建立和定義模型,限定不同群組發(fā)展趨勢相同來驗(yàn)證數(shù)據(jù)的收斂性;釋放限制模型中的某些限制條件(如群組條件),采用拉格朗日乘數(shù)(1agrange multipliers,LM)檢驗(yàn)釋放限制條件是否可顯著提高模型的擬合度(Duncan et al.,2006b);根據(jù)模型擬合度及LM檢驗(yàn)值選擇模型;最后考察斜率、截距及其均值和方差,分析發(fā)展趨勢及個體差異等特點(diǎn)。
LGM運(yùn)用潛變量描述和解釋發(fā)展趨勢和變化的個體差異,通過建模定義和探討變量之間的關(guān)系,在模型上具有很大的靈活性,廣泛應(yīng)用于加速追蹤研究的數(shù)據(jù)分析(De Haan,Prinzie,&Dekovi6,2010;Duncan,Duncan,StryckeL&Chaumeton,2007;King,Molina,&Chassin,2009;Kofler et al.,2011)。但LGM分析加速追蹤數(shù)據(jù)的適應(yīng)性是基于平衡設(shè)計(jì)的假設(shè),若ALD在研究應(yīng)用中的測量間隔或測量次數(shù)不等,或研究中要考驗(yàn)時間變化變量(time-vary variable)對發(fā)展的影響時,LGM不適用(Duncan&Duncan,1995;Miyazaki&Raudenbush,2000)。
3.2 HLM對加速追蹤數(shù)據(jù)的分析
HLM把追蹤數(shù)據(jù)看成具有嵌套結(jié)構(gòu)的數(shù)據(jù),即重復(fù)測量嵌套于個體,個體嵌套于群體。HLM可同時分析個體發(fā)展趨勢和變化的個體差異,直接處理測量間隔或測量次數(shù)不等的追蹤數(shù)據(jù),靈活處理追蹤數(shù)據(jù)中的缺失問題,適用于分析加速追蹤數(shù)據(jù)。當(dāng)加速追蹤研究中納入時間變化變量,HLM比LGM可更好地分析發(fā)展變化的問題(Miyazaki&Raudenbush,2000;Raudenbush,Brennan,&Barnett,1995)。Raudenbush和Chan(1992)首先運(yùn)用HLM分析加速追蹤數(shù)據(jù);Miyazaki和Raudenbush(2000)詳細(xì)闡述了HLM分析加速追蹤數(shù)據(jù)的原理和過程;Watt(2004,2008)及Gerstorf,Ram,Hoppmann,Willis和Schaie(2011)在加速追蹤研究中采用HLM分析數(shù)據(jù)。Moerbeek(2011)系統(tǒng)探討HLM框架下加速追蹤研究的統(tǒng)計(jì)功效問題,進(jìn)一步證實(shí)HLM分析加速追蹤數(shù)據(jù)的適宜性。
根據(jù)相關(guān)研究fMiyazaki&Raudenbush,2000;Moerbeek,2011;Raudenbush&Chan,1992,1993:Watt,2004,2008),HLM分析加速追蹤數(shù)據(jù)的基本假設(shè)是簡化模型(不納人群組效應(yīng))嵌套于全模型(納入群組效應(yīng))。以2HLM下極大似然(maximumlikelihood)方法為例說明具體步驟。首先,建立全模型并估計(jì)參數(shù),其中第二水平包含群組變量(見公式3-5)。第二步,建立簡化模型并估計(jì)參數(shù)(見公式6-8)。第三步,建構(gòu)似然比檢驗(yàn)(likelihoodratio test,LR檢驗(yàn)),通過比較兩個模型擬合差異統(tǒng)計(jì)量選擇模型,判斷數(shù)據(jù)是否收斂(LR檢驗(yàn):S=D1-D0,D1為全模型的擬合差異統(tǒng)計(jì)量,D0為簡化模型的擬合差異統(tǒng)計(jì)量)。其中S服從自由度為單獨(dú)施于簡化模型的限制參數(shù)個數(shù)的卡方分布(n為大樣本),若S大于臨界值,拒絕原假設(shè)關(guān)于簡化模型可較好表達(dá)加速追蹤數(shù)據(jù)的特征,反之,接受原假設(shè),加速追蹤數(shù)據(jù)收斂,可用一條共同的線型表述多個群組的發(fā)展趨勢。
全模型:
第一水平:yti=π0i+π1iTti+εti(3)
第二水平:π0i=β00+β01zi+μ0i(4)
π1i=β10+β11zi+μ1i(5)
其中zi為群組效應(yīng)的變量。
簡化模型:
第一水平:yti=π0i+π1iTti+εti(6)