陸軍軍醫(yī)大學(xué)軍事預(yù)防醫(yī)學(xué)系軍隊(duì)衛(wèi)生統(tǒng)計(jì)學(xué)教研室 (400038)
湯 寧 宋秋月 易 東 伍亞舟△
縱向數(shù)據(jù)是每個(gè)研究個(gè)體在不同時(shí)間點(diǎn)上的觀測(cè)值集合,它廣泛產(chǎn)生于教育、經(jīng)濟(jì)、醫(yī)藥、社會(huì)學(xué)等領(lǐng)域。在醫(yī)學(xué)領(lǐng)域,主要應(yīng)用于心理學(xué)、公共衛(wèi)生、藥物動(dòng)力學(xué)、臨床試驗(yàn)等方面。但是如何處理和分析這些數(shù)據(jù)一直是一個(gè)重難點(diǎn),醫(yī)學(xué)研究者在處理和分析過(guò)程中常常忽略掉縱向數(shù)據(jù)的一些特點(diǎn)以及特定方法的適用條件,從而導(dǎo)致研究結(jié)果產(chǎn)生一定的偏性,有時(shí)甚至得出相反的結(jié)論,這對(duì)醫(yī)學(xué)研究的可靠性有很大影響。因此,如何基于研究目的和資料類(lèi)型,并結(jié)合模型適用條件和特點(diǎn)來(lái)選取適當(dāng)?shù)慕7椒ㄊ潜疚膶⒁U述的內(nèi)容。
醫(yī)學(xué)縱向數(shù)據(jù)具有以下幾個(gè)特征:(1)時(shí)間序列性:在沒(méi)有任何外部干預(yù)的情況下,重復(fù)測(cè)量的反應(yīng)變量可能會(huì)隨時(shí)間的推移發(fā)生變化;(2)時(shí)間間隔非均衡性:不同單位測(cè)量的時(shí)間點(diǎn)可能不同,同一單位測(cè)量的時(shí)間間隔可能也不同;(3)自相關(guān)性:同一觀測(cè)單位的各測(cè)量之間存在自相關(guān)性,不同測(cè)量之間的相關(guān)系數(shù)不同,從而可以定義不同的相關(guān)矩陣;(4)變量類(lèi)型復(fù)雜性:反應(yīng)變量類(lèi)型多樣,可以是連續(xù)型變量,也可以是離散型變量;(5)線性與非線性:反應(yīng)變量隨自變量的變化趨勢(shì)可能是線性的,也可能是非線性的;(6)數(shù)據(jù)不完整性:實(shí)際調(diào)查研究中,各種原因造成的失訪,使得縱向數(shù)據(jù)完整性難以保證,故常常存在缺失;(7)非正態(tài)性:縱向數(shù)據(jù)變量多,維度高,數(shù)據(jù)分布較難呈正態(tài)性。
根據(jù)縱向數(shù)據(jù)的特點(diǎn)和分析目的,常見(jiàn)的縱向數(shù)據(jù)建模方法有:(1)研究總體平均水平差異,比較組間或不同時(shí)間點(diǎn)差異性的方法,如:重復(fù)測(cè)量方差分析、協(xié)方差分析等;(2)研究總體平均發(fā)展趨勢(shì)和個(gè)體平均發(fā)展趨勢(shì)的差異,處理非正態(tài)且自相關(guān)縱向數(shù)據(jù)的方法,如:廣義估計(jì)方程、廣義線性混合效應(yīng)模型;(3)研究非線性增長(zhǎng)趨勢(shì)差異分析的方法,如:非線性混合效應(yīng)模型;(4)研究時(shí)間發(fā)展軌跡差異分析的方法,如:多層線性模型、潛變量增長(zhǎng)曲線模型。
1.重復(fù)測(cè)量方差分析
重復(fù)測(cè)量方差分析(repeated measures analysis of variance,RM-ANOVA)是在方差分析基礎(chǔ)上將總方差分解為組內(nèi)、組間的變異以及因子的交互作用和隨機(jī)誤差造成的變異。組內(nèi)變異可理解為各測(cè)量時(shí)間點(diǎn)的變異,組間變異即是處理因素的作用[1]。
RM-ANOVA的優(yōu)點(diǎn)是簡(jiǎn)單易理解,是早期用于縱向數(shù)據(jù)分析的重要方法,但統(tǒng)計(jì)學(xué)家也深知其存在諸多的缺點(diǎn):(1)該方法對(duì)資料要求嚴(yán)格,它不僅要求數(shù)據(jù)具有獨(dú)立性、正態(tài)性和方差齊性等條件,還要求滿足“球形”(sphericity)假設(shè);(2)此外,它還要求各觀測(cè)單位的測(cè)量時(shí)點(diǎn)相同且間隔相等;(3)RM-ANOVA忽略了相同單位各次測(cè)量之間存在的相關(guān)性,而不能揭示其內(nèi)在特點(diǎn);(4)它主要描述總體的平均增長(zhǎng)趨勢(shì)而不關(guān)注個(gè)體增長(zhǎng)曲線存在的差異以及原因[2];(5)對(duì)缺失值一般作刪除處理,這往往造成較大的信息損失。以上眾多的缺點(diǎn)都限制了RM-ANOVA在縱向數(shù)據(jù)分析中的廣泛應(yīng)用。
RM-ANOVA的應(yīng)用主要是比較測(cè)量指標(biāo)總體平均水平在各處理因素之間和各時(shí)間點(diǎn)之間的差異。謝洋[3]等用其比較了三種不同治療方案在慢性阻塞性肺中的療效;任寧[4]等人利用該方法分析了農(nóng)藥對(duì)大鼠體重的影響。
2.廣義線性混合模型
1972年,Nelder和Wedderburn[5]對(duì)正態(tài)線性模型進(jìn)行了推廣,建立了廣義線性模型(generalized linear model,GLM)。GLM通過(guò)非線性連接函數(shù)連接反應(yīng)變量和線性預(yù)測(cè)變量,只要響應(yīng)變量的概率分布是指數(shù)分布族的一員,就可由此來(lái)處理等級(jí)資料、計(jì)數(shù)資料。指數(shù)分布族包括高斯分布、多項(xiàng)式分布、泊松分布、伽馬分布、貝塔分布和 Dirichlet 分布等,線性模型只是廣義線性模型的特例。
雖然廣義線性模型(general linear model,GLM)解決了反應(yīng)變量非正態(tài)的問(wèn)題,但是要求其獨(dú)立性[6],忽略了相關(guān)性。1982年,Laird和Ware提出線性混合模型(linear mixed model,LMM),它運(yùn)用方差-協(xié)方差矩陣來(lái)反映反應(yīng)變量的異方差性和相關(guān)性。廣義線性混合模型(generalized linear mixed model,GLMM)則是廣義線性模型(GLM)和線性混合模型(LMM)的擴(kuò)展[7-8],它通過(guò)在模型中納入隨機(jī)效應(yīng)來(lái)解釋數(shù)據(jù)間的相關(guān)、過(guò)度離散、異質(zhì)性等問(wèn)題[9]。GLMM 的基本模型為[10]:
Y=μ+ε
(1)
μ=g-1(η)=g-1(Xβ+Zγ)
(2)
其中,Y是n×1維觀測(cè)向量;μ是觀測(cè)的預(yù)測(cè)向量;g-1(·)是單調(diào)可微連接函數(shù)g(·)的逆函數(shù);X為協(xié)變量矩陣;Z為隨機(jī)效應(yīng)變量矩陣;β和γ分別是模型的固定效應(yīng)和隨機(jī)效應(yīng)參數(shù)向量,隨機(jī)效應(yīng)γ假設(shè)服從均數(shù)為0和方差矩陣為G的正態(tài)分布[6]。GLMM通過(guò)多種R矩陣和G矩陣的方差-協(xié)方差結(jié)構(gòu),解釋同一觀察單位不同時(shí)間重復(fù)測(cè)量結(jié)果的相關(guān)性,擬合各種反應(yīng)變量的縱向數(shù)據(jù)[11-12]。
LMM是通過(guò)在均值中加入隨機(jī)效應(yīng),實(shí)現(xiàn)了對(duì)一般線性模型的推廣,而GLMM則是通過(guò)在線性預(yù)測(cè)部分引入隨機(jī)效應(yīng)推廣了廣義線性模型[13],隨機(jī)效應(yīng)的引入反映了不同對(duì)象之間的異質(zhì)性以及同一對(duì)象不同觀測(cè)之間的相關(guān)性。當(dāng)隨機(jī)效應(yīng)滿足正態(tài)分布時(shí),反應(yīng)變量可以是指數(shù)家族中的任意分布。
GLMM能夠很好地處理離散型和具有相關(guān)性的資料[9]。GLMM包含了隨機(jī)效應(yīng),研究結(jié)論能夠推廣到整個(gè)人群,該模型比較適用于藥物的臨床評(píng)價(jià)。羅天娥[14]等人利用GLMM分析了某臨床試驗(yàn)中乳腺治療儀合用乳塊康貼治療乳腺增生的療效;王玲[9]還介紹了其在多中心中藥臨床試驗(yàn)中的應(yīng)用。
3.廣義估計(jì)方程
1986年,Liang和Zeger首次介紹廣義估計(jì)方程(generalized estimating equations,GEE),它是在廣義線性模型和擬似然方法的基礎(chǔ)上提出的一種專(zhuān)門(mén)分析非獨(dú)立縱向數(shù)據(jù)的方法。
GEE與GLM的框架結(jié)構(gòu)類(lèi)似,通過(guò)一個(gè)非線性連接函數(shù)來(lái)連接反應(yīng)變量和預(yù)測(cè)變量,進(jìn)而處理離散型資料;并且,其要求對(duì)受試者的重復(fù)測(cè)量值提供一個(gè)“作業(yè)相關(guān)矩陣”,由此來(lái)表達(dá)縱向數(shù)據(jù)的組內(nèi)相關(guān)性[15]。“作業(yè)相關(guān)矩陣”是廣義估計(jì)方程中的一個(gè)重要概念,表示因變量的各次重復(fù)測(cè)量值兩兩之間相關(guān)性的大小,盡管個(gè)體之間的相關(guān)性可能不盡相同,但其近似地表示個(gè)體之間平均的相關(guān)。針對(duì)不同的數(shù)據(jù)特點(diǎn)可定義不同的協(xié)方差結(jié)構(gòu),常用的協(xié)方差結(jié)構(gòu)包括獨(dú)立結(jié)構(gòu)(independence)、無(wú)結(jié)構(gòu)相關(guān)(unstructured)、復(fù)合對(duì)稱(chēng)結(jié)構(gòu)(compound symmetry)、一階自相關(guān)結(jié)構(gòu)(autoregressive order 1)、Toeplitz相關(guān)結(jié)構(gòu)等[16]。GEE的具體構(gòu)造可參閱文獻(xiàn)[17]。
GEE的一個(gè)特性是只要連接函數(shù)正確,總觀測(cè)次數(shù)足夠大,即使“作業(yè)相關(guān)矩陣”指定不完全正確,參數(shù)的可信區(qū)間和模型的其他統(tǒng)計(jì)量仍然漸近正確[17]。因而“作業(yè)相關(guān)矩陣”的選擇對(duì)參數(shù)估計(jì)的影響不大。GEE主要的優(yōu)勢(shì):①能有效處理縱向數(shù)據(jù)中結(jié)局變量的相關(guān)性,也能處理離散型資料;②它放寬了分布假設(shè),只要求正確指定邊際均值、方差以及連接函數(shù);③當(dāng)相關(guān)矩陣結(jié)構(gòu)選擇不當(dāng)時(shí)也能得到參數(shù)及其方差的一致性估計(jì)值[18]。其缺點(diǎn)在于:①由于其沒(méi)有完全指定聯(lián)合分布,不存在似然函數(shù),因此基于似然的方法不適用于測(cè)試擬合、比較模型和進(jìn)行參數(shù)推斷;②在樣本量較小時(shí),基于經(jīng)驗(yàn)的標(biāo)準(zhǔn)誤差會(huì)低估真實(shí)的誤差。
GEE通常用于流行病學(xué)研究,特別是多點(diǎn)隊(duì)列研究,因?yàn)樗鼈兛梢蕴幚矶囝?lèi)結(jié)果之間無(wú)法測(cè)量的相關(guān)性。如Lyman[19]等人將GEE應(yīng)用于棒球手投擲傷影響因素的隊(duì)列研究;GEE也可用于臨床試驗(yàn)研究,如夏彥[20]探討了其在某抑吐藥物的多中心隨機(jī)對(duì)照臨床試驗(yàn)中的應(yīng)用。
4.非線性混合效應(yīng)模型
傳統(tǒng)的統(tǒng)計(jì)分析方法一般要求數(shù)據(jù)滿足線性條件,即變量間參數(shù)呈線性關(guān)系,然而實(shí)際研究工作中常常存在著不滿足線性條件的重復(fù)測(cè)量數(shù)據(jù),如藥物在人體內(nèi)吸收、分布、代謝和排出過(guò)程中的濃度變化。Sheiner于1977年提出了非線性混合效應(yīng)模型(nonlinear mixed effects models,NONMEM),亦稱(chēng)為多水平非線性模型或非線性分層模型[21]。非線性混合效應(yīng)模型可作如下表述[22]:
yij=f(xij,φi)+eij
(3)
φi=Aiβi+Bibi
(4)
其中,yij為第i個(gè)個(gè)體第j次測(cè)量預(yù)測(cè)值;f(·)為非線性函數(shù),如果其為線性,則退化為線性混合效應(yīng)模型[22];xij為P維預(yù)測(cè)變量向量;eij為獨(dú)立正態(tài)分布隨機(jī)誤差向量;β為P維固定效應(yīng)參數(shù);bi為隨機(jī)效應(yīng)因子;Ai、Bi為已知的設(shè)計(jì)矩陣。
非線性混合效應(yīng)模型考慮了不同層次上的變異,同時(shí)也考慮了參數(shù)間的非線性關(guān)系,允許固定效應(yīng)和隨機(jī)效應(yīng)進(jìn)入模型的非線性部分[23]。模型引入隨機(jī)效應(yīng)來(lái)解釋反應(yīng)變量間的相關(guān)性,通過(guò)建立具有隨機(jī)截距或隨機(jī)斜率的混合效應(yīng)模型處理反應(yīng)變量是分類(lèi)變量的重復(fù)測(cè)量資料[16]。相對(duì)于線性模型的正態(tài)性假設(shè),非線性模型對(duì)資料的分布無(wú)特殊要求,資料可以是正態(tài)資料,也可以是服從二項(xiàng)分布、泊松分布等指數(shù)分布的資料[23]。
非線性資料是醫(yī)學(xué)研究中常見(jiàn)的一種資料形式,常用于藥代動(dòng)力學(xué)和非線性生長(zhǎng)曲線研究。陸基宗[24]等人通過(guò)建立非線性混合效應(yīng)模型研究了肝癌患者5-氟尿嘧啶血藥濃度檢測(cè)與測(cè)定的改進(jìn)方法;T Lu[25]探討了其在HIV病毒人體動(dòng)力學(xué)中的應(yīng)用;J Almquist[26]則將其應(yīng)用于酵母轉(zhuǎn)錄抑制因子Mig1動(dòng)力學(xué)行為的研究。
5.多層線性模型
多層線性模型(hierarchical linear modeling,HLM),也稱(chēng)多水平線性模型(multilevel linear model)、混合效應(yīng)模型(mixed-effects model)、隨機(jī)效應(yīng)模型(random-effect model)等,在不同應(yīng)用領(lǐng)域中名稱(chēng)不同[27]。HLM主要是用于分析具有層次結(jié)構(gòu)(嵌套結(jié)構(gòu))數(shù)據(jù)的一種統(tǒng)計(jì)技術(shù)。嵌套數(shù)據(jù)結(jié)構(gòu),如學(xué)生嵌套于班級(jí),班級(jí)嵌套于學(xué)校這樣的分層結(jié)構(gòu),每層結(jié)構(gòu)中的個(gè)體具有一定的相似性。其模型構(gòu)造如下[28]:
Yij=β0i+β1iXij+εij
(5)
β0i表示截距,其含義是第i個(gè)觀測(cè)對(duì)象的平均數(shù);β1i是斜率,表示第i個(gè)觀測(cè)對(duì)象的變化速率;Xij代表第i個(gè)觀測(cè)對(duì)象在第j個(gè)觀測(cè)點(diǎn)時(shí)自變量X的取值;εij代表殘差[28]。它的截距和斜率是隨機(jī)的,還受到某些其他變量的影響,將其作為因變量,建立兩個(gè)第二層回歸方程:
β0i=γ00+γ01W1i+μ0i
(6)
β1i=γ00+γ11W1i+μ1i
(7)
γ00表示截距,γ01和γ11分別表示預(yù)測(cè)變量W1i和W1i的斜率,μ0i和μ1i通過(guò)這個(gè)過(guò)程分別模擬了1級(jí)變量對(duì)結(jié)果的影響以及2級(jí)變量對(duì)結(jié)果的影響。為簡(jiǎn)化模型,第二層方程中只包含了一個(gè)預(yù)測(cè)變量,如果存在多個(gè)自變量,也可以加入模型。
HLM主要的優(yōu)點(diǎn):能對(duì)個(gè)體在時(shí)間上的變化進(jìn)行估計(jì),不僅考慮了不同測(cè)量水平之間的差異,還考慮了不同個(gè)體水平之間的差異,并探索造成這些差異的原因。HLM的局限:它仍然是研究由幾個(gè)變量預(yù)測(cè)一個(gè)變量的相對(duì)簡(jiǎn)單的回歸結(jié)構(gòu),必須以正態(tài)性和線性為基礎(chǔ),不能處理變量之間間接的影響關(guān)系以及復(fù)雜的觀測(cè)變量和潛變量之間的關(guān)系[29];其次,HLM需要大量的樣本量才能獲得足夠的檢驗(yàn)效力。
HLM在醫(yī)學(xué)上主要運(yùn)用于心理學(xué)方面的追蹤研究,如胡寧[30]等人將其用于家庭功能與青少年問(wèn)題行為關(guān)系的追蹤研究;Raudenbush[31]等將其用于已婚夫婦心理變化的研究。HLM其實(shí)在醫(yī)學(xué)上也有更廣泛的應(yīng)用,如Halkitis[32]用其分析HIV藥物依從性與患者及治療特性的關(guān)系;Gazdzinski[33]用其研究酒精依賴者清醒時(shí)腦結(jié)構(gòu)和認(rèn)知的變化。
6.潛變量增長(zhǎng)模型
潛變量增長(zhǎng)模型(latent growth modeling,LGM)是以結(jié)構(gòu)方程模型(SEM)為基礎(chǔ)的一種對(duì)個(gè)體隨時(shí)間的變化進(jìn)行建模,并評(píng)估共變量的影響和多個(gè)結(jié)果之間的關(guān)系的方法[34-35]。它通過(guò)定義截距和斜率作為潛在因子的驗(yàn)證性因素分析模型來(lái)描述追蹤數(shù)據(jù)的變化特征[36-37]。LGM基本結(jié)構(gòu)如下[38]:
如圖1所示,以三個(gè)時(shí)間點(diǎn)(結(jié)局變量的三次測(cè)量)為例介紹LGM,V1、V2、V3分別為三次重復(fù)測(cè)量值,E1、E2、E3為三個(gè)時(shí)間點(diǎn)的測(cè)量誤差,潛變量增長(zhǎng)曲線模型中有兩個(gè)潛在變量,第一個(gè)為截距因子(intercept),第二個(gè)為斜率因子(slope)[38]。截距因子表示個(gè)體的基線狀態(tài),描述了第一次測(cè)量時(shí)總體均值(Mi)的估計(jì)和變異(Di);斜率因子描述了個(gè)體軌跡增長(zhǎng)速率的均值(Ms)和變異(Ds)[38]。
Vt=intercept+(t-1)slope+Et,t=1,2,3
(8)
intercept=μintercept+ζ0
(9)
slope=μslope+ζ1
(10)
本例中V1=intercept+E1,V2=intercept+slope+E2,V3=intercept+2slope+E3。兩個(gè)因子為隨機(jī)變量,每個(gè)個(gè)體都有各自的截距和斜率,有各自的均數(shù)和方差。ζ0和ζ1為增長(zhǎng)因子與其各自總體均數(shù)的偏差。
圖1 兩因子的潛變量增長(zhǎng)曲線模型圖示
由于LGM是使用SEM方法進(jìn)行的,因此它們?cè)诮y(tǒng)計(jì)方法方面有許多相同的優(yōu)點(diǎn)和缺點(diǎn)。LGM的優(yōu)點(diǎn)主要是描述了單個(gè)個(gè)體的發(fā)展軌跡,并分析了這些軌跡中的個(gè)體差異,它能夠研究這些個(gè)體差異的預(yù)測(cè)因素,回答哪些變量對(duì)發(fā)展速度有重要影響的問(wèn)題。其他優(yōu)勢(shì)包括:能夠檢驗(yàn)假設(shè)增長(zhǎng)形式的充分性,納入固定和時(shí)變協(xié)變量,糾正觀測(cè)指標(biāo)中的測(cè)量誤差,同時(shí)納入幾個(gè)結(jié)構(gòu)的增長(zhǎng),并從數(shù)據(jù)中發(fā)展出一個(gè)共同的發(fā)展軌跡,從而排除隊(duì)列效應(yīng)等。盡管LGM有眾多優(yōu)點(diǎn),但并不是適用于所有的情況,如不等的觀測(cè)間隔、隨機(jī)數(shù)據(jù)缺失、聚類(lèi)設(shè)計(jì)合并等情況[39]。
LGM在醫(yī)學(xué)上主要運(yùn)用于心理學(xué)研究,如劉俊升[40]等人用于研究童年中晚期孤獨(dú)感的發(fā)展軌跡等。近年來(lái)該方法也被應(yīng)用于其他領(lǐng)域,Brecht[41]等人將其應(yīng)用于海洛因、可卡因、大麻等多藥物使用時(shí)間軌跡的研究。
縱向數(shù)據(jù)的統(tǒng)計(jì)分析策略可以從反應(yīng)變量類(lèi)型、主要分析目的和模型方法特點(diǎn)等方面進(jìn)行考慮。從變量類(lèi)型來(lái)看,可以分為連續(xù)型變量(定量變量)和離散型變量(類(lèi)別變量)。當(dāng)反應(yīng)變量為連續(xù)型變量,服從正態(tài)分布又滿足線性條件時(shí),理論上以上方法都可使用,但如果研究目的僅僅是想比較各組別總體平均水平的差異則建議采用重復(fù)測(cè)量方差分析,簡(jiǎn)單方便。而廣義估計(jì)方程和廣義線性混合模型主要用于分析類(lèi)別變量資料,他們都考慮了資料的相關(guān)性,并能較好的處理缺失值和非平衡數(shù)據(jù)。非線性混合模型則主要用于定量非線性資料的處理,多見(jiàn)于藥物動(dòng)力學(xué)研究。多層線性模型和潛變量增長(zhǎng)模型則多用于描述個(gè)體發(fā)展軌跡的差異及其影響因素,多應(yīng)用于心理學(xué)和流行病學(xué)研究。
表1 常用縱向數(shù)據(jù)分析模型方法的特點(diǎn)
本文從醫(yī)學(xué)縱向研究的角度出發(fā),列舉了重復(fù)測(cè)量方差分析、廣義估計(jì)方程、廣義線性混合模型、非線性混合模型、多層線性模型、潛變量增長(zhǎng)模型等幾種常用的統(tǒng)計(jì)分析方法,分析其各自的優(yōu)點(diǎn)以及缺點(diǎn),并針對(duì)不同資料類(lèi)型和研究目的提出了統(tǒng)計(jì)分析的策略。
近年來(lái),縱向數(shù)據(jù)統(tǒng)計(jì)分析方法得到了長(zhǎng)足的發(fā)展,其部分原因要得益于計(jì)算機(jī)統(tǒng)計(jì)軟件的發(fā)展,統(tǒng)計(jì)軟件的出現(xiàn)也使得數(shù)據(jù)的分析變得更為便捷簡(jiǎn)單,但就是這種照葫蘆畫(huà)瓢的方式使得研究者們往往忽略了統(tǒng)計(jì)分析其背后的原理和假設(shè)條件,帶來(lái)的后果則是直接降低了研究結(jié)論的可靠性。因此,研究者應(yīng)充分了解各類(lèi)方法的優(yōu)缺點(diǎn)和適用條件,這是為研究數(shù)據(jù)選擇適當(dāng)統(tǒng)計(jì)分析模型的必要條件。
中國(guó)衛(wèi)生統(tǒng)計(jì)2019年3期