縱向數(shù)據(jù)與生存數(shù)據(jù)聯(lián)合模型中多變點(diǎn)識(shí)別問(wèn)題

2016-10-12 02:17沈佳坤，宋立新，孫秀峰，馮寶軍

大連理工大學(xué)學(xué)報(bào) 2016年5期

關(guān)鍵詞：變點(diǎn)膽紅素觀測(cè)

沈佳坤，　宋立新，　孫秀峰，　馮寶軍

( 1.大連理工大學(xué) 管理與經(jīng)濟(jì)學(xué)部, 遼寧大連　116024；2.大連理工大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 遼寧大連　116024 )

縱向數(shù)據(jù)與生存數(shù)據(jù)聯(lián)合模型中多變點(diǎn)識(shí)別問(wèn)題

沈佳坤1,2，宋立新*2，孫秀峰1，馮寶軍1

( 1.大連理工大學(xué) 管理與經(jīng)濟(jì)學(xué)部, 遼寧大連116024；2.大連理工大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 遼寧大連116024 )

提出了共享協(xié)變量和隨機(jī)效應(yīng)的縱向響應(yīng)中含有多個(gè)變點(diǎn)識(shí)別的線性混合效應(yīng)(LME)模型和加速失效時(shí)間(AFT)模型的聯(lián)合模型，并通過(guò)Gauss-Hermite近似解決極大似然函數(shù)中的復(fù)雜積分以得到參數(shù)的估計(jì)．通過(guò)模擬研究驗(yàn)證了該方法的有效性，并將其應(yīng)用于原發(fā)性膽汁性肝硬化(PBC)病變過(guò)程，研究發(fā)現(xiàn)：PBC患者的血清膽紅素只在初期治療階段有所降低，兩個(gè)月之后迅速開(kāi)始反彈，直到3.5 a后增速才有所放緩，說(shuō)明治療方法仍需改進(jìn)．

多變點(diǎn)；線性混合效應(yīng)模型；加速失效時(shí)間模型；聯(lián)合推斷；極大似然

0　引　言

縱向數(shù)據(jù)既包含橫截面數(shù)據(jù)中多個(gè)體間的對(duì)比差異，又包含時(shí)間序列數(shù)據(jù)中對(duì)個(gè)體重復(fù)測(cè)量的變化趨勢(shì)，能較好地反映研究對(duì)象的動(dòng)態(tài)變化特征，常被用來(lái)評(píng)定誘導(dǎo)危害人們身體健康的風(fēng)險(xiǎn)因素的影響、描述患者的生活改善以及評(píng)估治療的效率．此外，生存分析揭示了患者從開(kāi)始治療到疾病復(fù)發(fā)或患者死亡等重要臨床事件的時(shí)間變化規(guī)律，是醫(yī)學(xué)統(tǒng)計(jì)研究中的另一個(gè)重要內(nèi)容，已取得了很多成果．然而，當(dāng)縱向響應(yīng)回歸模型與失效時(shí)間回歸模型之間存在某種相關(guān)關(guān)系時(shí)，如體現(xiàn)在一些共同的潛在過(guò)程或協(xié)變量上，分別獨(dú)立地進(jìn)行縱向數(shù)據(jù)和生存分析研究會(huì)導(dǎo)致結(jié)果產(chǎn)生偏差．綜上，為了將所有影響研究結(jié)果的信息都利用起來(lái)得到無(wú)偏估計(jì)結(jié)果，建立縱向響應(yīng)和生存時(shí)間的聯(lián)合模型勢(shì)在必行，并已得到學(xué)界的普遍認(rèn)同[1-2]．

在實(shí)際研究中，患者的病情隨時(shí)間的發(fā)展往往不是單純的線性關(guān)系，而是呈現(xiàn)出階段性的變化特點(diǎn)．為此，學(xué)者們一直在努力尋找更簡(jiǎn)潔、合理的非線性模型來(lái)描述患者病情變化，其中變點(diǎn)回歸以其簡(jiǎn)潔的形式、較好的擬合度且具有在變點(diǎn)處連續(xù)的良好性質(zhì)而深受學(xué)者們的喜愛(ài)，被較多地應(yīng)用于病情變化波動(dòng)大的流行病學(xué)和癌癥研究中，來(lái)識(shí)別疾病發(fā)展過(guò)程中醫(yī)學(xué)指標(biāo)變化規(guī)律發(fā)生改變的時(shí)間點(diǎn)[3-6]．最近，Huang等[7]提出了兩個(gè)變點(diǎn)的分段線性模型，并通過(guò)貝葉斯的方法得到變點(diǎn)的分布，來(lái)描述HIV病毒載量隨時(shí)間的變化情況．但由于貝葉斯方法過(guò)于依賴給定的先驗(yàn)分布，不能準(zhǔn)確反映新情況下響應(yīng)變量的自然變化規(guī)律，導(dǎo)致了研究結(jié)果的局限性．

本研究將極大似然估計(jì)法引入分段線性模型，以克服貝葉斯推斷固有的缺點(diǎn)，服務(wù)于臨床管理中病人用藥的指導(dǎo)服務(wù)及醫(yī)療決策中肝移植時(shí)機(jī)的選擇等．

1　模型和方法

1.1聯(lián)合模型

考慮一個(gè)樣本量為N的樣本，個(gè)體間相互獨(dú)立．令Yij為個(gè)體i在時(shí)間tij的響應(yīng)變量，j=1,…,ni且i=1,…,N．本文建立關(guān)于縱向數(shù)據(jù)的含有k個(gè)變點(diǎn)的線性混合效應(yīng)(LME)模型(1)，其中k為任意正整數(shù)，并將k個(gè)變點(diǎn)在時(shí)間軸上的位置作為未知參數(shù)：τ=(τ1τ2…τk)．

Δi1(tij-τ1)++Δi2(tij-τ2)++…+

Δik(tij-τk)++eij

(1)

其中Δi1=(μ3+ui3)-(μ2+ui2)，Δi2=(μ4+ui4)-(μ3+ui3)，…，Δik=(μk+2+uik+2)-(μk+1+uik+1)；τ1<τ2，…，<τk，j=1，…，ni，i=1，…，N，k≥1．

令Ti是個(gè)體i的生存時(shí)間，在臨床實(shí)際中，它往往與個(gè)體i的縱向數(shù)據(jù)模型(1)有關(guān)．為體現(xiàn)這種關(guān)聯(lián)性，研究中假設(shè)生存數(shù)據(jù)模型與縱向數(shù)據(jù)模型(1)共享協(xié)變量向量Zi和隨機(jī)效應(yīng)向量ui．特別的，建立混合效應(yīng)加速失效時(shí)間(AFT)模型(2)：

(2)

1.2變點(diǎn)識(shí)別

在確定縱向數(shù)據(jù)模型變點(diǎn)個(gè)數(shù)階段，本文提出一系列模型的假設(shè)檢驗(yàn)，利用似然比檢驗(yàn)(LRT)的方法確定LME模型(1)中的變點(diǎn)個(gè)數(shù)，使得聯(lián)合模型對(duì)樣本的擬合度達(dá)到相對(duì)最優(yōu)．

然后，本文通過(guò)LRT方法確定變點(diǎn)個(gè)數(shù)，尋找使聯(lián)合模型具有最優(yōu)擬合度的相應(yīng)縱向數(shù)據(jù)分段LME模型．第k組LRT方法中檢驗(yàn)統(tǒng)計(jì)量LR(k)的定義如下式所示：

LR(k)=

-2[l(k)0(θ^(k)0)-l(k)1(θ^1(k))]～·

(3)

θ^(k)0

θ^(k)1

1.3聯(lián)合似然推斷

(4)

fTi，δi|Zi，ui(ti，δi|Zi，ui;γ，σ2)fui(ui;G)]dui=

fTi，δi|Zi，ui(ti，δi|Zi，ui;γ，σ2)fui(ui;G)dui=

(5)

式中：K為正交節(jié)點(diǎn)的個(gè)數(shù)；us=(us1…us4)T，是節(jié)點(diǎn)值，相應(yīng)的權(quán)重為ws=(ws1…ws4)T．當(dāng)被積函數(shù)可以被寫(xiě)作exp(-uTu)l(u)的形式時(shí)，合理設(shè)置節(jié)點(diǎn)值和相應(yīng)權(quán)重可以得到積分較為準(zhǔn)確的估計(jì)，其中l(wèi)(u)為階數(shù)小于等于K-1的關(guān)于u的多項(xiàng)式，即當(dāng)節(jié)點(diǎn)數(shù)K足夠大時(shí)，近似方程(5)可以無(wú)限接近積分的準(zhǔn)確值．從而，本文建立的聯(lián)合模型的似然推斷在積分近似意義下是可解的．

2　數(shù)值模擬

2.1模擬方案

不失一般性，本文考慮含有一個(gè)隨機(jī)效應(yīng)項(xiàng)和兩個(gè)變點(diǎn)的LME模型：

Yij=(μ0+ui)+μ1Zi+μ2tij+(μ3-μ2)×

(tij-τ1)++(μ4-μ3)(tij-τ2)++eij

(6)

其中τ1<τ2，j=1，…，ni，i=1，…，N．

相應(yīng)的生存分析，建立混合效應(yīng)AFT模型(7)．生存時(shí)間Ti滿足1．3節(jié)中的右刪失假設(shè)．

logTi=γ0+γ1Zi+γ2ui+i，

(7)

下面通過(guò)一系列數(shù)值模擬研究來(lái)驗(yàn)證上一章中提出的聯(lián)合模型及估計(jì)方法的有效性．本節(jié)的數(shù)值模擬基于共享的Z和u的聯(lián)合模型(6)和(7)．假設(shè)樣本容量為N=150或N=300，個(gè)體間相互獨(dú)立，每個(gè)個(gè)體的重復(fù)觀測(cè)次數(shù)為ni=6或ni=10．令υ2=σ2=0.12，μ=(0.2-0.3-0.80.90.2)T，且G=0.452．

當(dāng)ni=6時(shí)，為獲得個(gè)體i的重復(fù)觀測(cè)時(shí)間，本研究從均勻分布U(0，6)無(wú)放回隨機(jī)抽取的6個(gè)時(shí)間點(diǎn)得到次序統(tǒng)計(jì)量ti，并建立生存時(shí)間的右刪失示性函數(shù)δi=I(Ti≤ti6)，其中ti6是上述抽取均勻分布時(shí)間點(diǎn)的最大次序統(tǒng)計(jì)量，假設(shè)變點(diǎn)τ=(13)，且參數(shù)γ=(1.20.50.2)T；當(dāng)ni=10時(shí)，同理，本文從均勻分布U(0，10)無(wú)放回隨機(jī)抽取的10個(gè)時(shí)間點(diǎn)得到次序統(tǒng)計(jì)量ti，并建立生存時(shí)間的右刪失示性函數(shù)δi=I(Ti≤ti10)，其中ti10是上述抽取均勻分布時(shí)間點(diǎn)的最大次序統(tǒng)計(jì)量，假設(shè)變點(diǎn)τ=(48)，參數(shù)γ=(1．80.50.2)T．同時(shí)，假設(shè)Zi服從二項(xiàng)分布B(1，0.5)．

從而形成4組縱向數(shù)據(jù)和生存數(shù)據(jù)的數(shù)值模擬方案：

(a)個(gè)體數(shù)為150，每個(gè)個(gè)體重復(fù)觀測(cè)次數(shù)為6；

(b)個(gè)體數(shù)為150，每個(gè)個(gè)體重復(fù)觀測(cè)次數(shù)為10；

(c)個(gè)體數(shù)為300，每個(gè)個(gè)體重復(fù)觀測(cè)次數(shù)為6；

(d)個(gè)體數(shù)為300，每個(gè)個(gè)體重復(fù)觀測(cè)次數(shù)為10．

2.2數(shù)值結(jié)果

一般的，本研究選擇最大觀測(cè)時(shí)間的1/3以及2/3分位數(shù)作為極大似然方法估計(jì)兩個(gè)變點(diǎn)位置的初值，以上4組縱向數(shù)據(jù)和生存數(shù)據(jù)分別作100次數(shù)值模擬．將4種模擬方案下變點(diǎn)(τ1τ2)的估計(jì)結(jié)果列示于表1．

表1中的偏差和均方誤差都比原值小4個(gè)數(shù)量級(jí)以上，表明在該4種數(shù)值模擬方案情形下，極大似然方法可以幾乎準(zhǔn)確估計(jì)到變點(diǎn)的位置．

表2列示了4種數(shù)值模擬情形下聯(lián)合模型的參數(shù)估計(jì)優(yōu)度相關(guān)結(jié)果．

通過(guò)表2中的普遍低于參數(shù)值本身1～3個(gè)數(shù)量級(jí)不等的偏差和均方誤差可以驗(yàn)證參數(shù)估計(jì)的無(wú)偏性和有效性．此外，注意到偏差和均方誤差隨著重復(fù)測(cè)量次數(shù)ni由6到10或樣本量N由150到300的增加而降低．

圖1更直觀地呈現(xiàn)了4種方案的數(shù)值模擬，各100次實(shí)驗(yàn)的估計(jì)曲線結(jié)果，其中實(shí)線表示真實(shí)曲線，虛線表示估計(jì)曲線．

由圖1中的曲線可以明顯看出重復(fù)測(cè)量次數(shù)ni由6(圖(a)和(c))到10(圖(b)和(d))，估計(jì)曲線與真實(shí)曲線之間的差異減?。粯颖玖縉由150(圖(a)和(b))到300(圖(c)和(d))，估計(jì)曲線與真實(shí)曲線之間的差異明顯減小．

表1　兩個(gè)變點(diǎn)位置的數(shù)值模擬結(jié)果

表2　聯(lián)合模型數(shù)值模擬的參數(shù)估計(jì)結(jié)果

　　(a)方案(a)

(b) 方案(b)

(d) 方案(d)

圖14種方案模擬研究曲線

Fig.1The simulation curves of four strategies

3　原發(fā)性膽汁性肝硬化(PBC)實(shí)例分析

本文使用的PBC數(shù)據(jù)集來(lái)自于美國(guó)梅約(Mayo)醫(yī)學(xué)研究中心1974年到1984年采集的患者資料[9]，包括312名隨機(jī)選取的獨(dú)立患者，其中158名患者使用D-青霉胺(D-penicillamine)治療(占51%)，其他154名使用安慰劑(placebo)治療(占49%)．該數(shù)據(jù)集包括患者的基本信息，如年齡、性別等及一些跟蹤測(cè)量的生物病理指標(biāo)，如血清膽紅素(serum bilirubin)、皮膚血管畸形、肝臟腫大等[10]．本文研究的興趣在于反映PBC癥進(jìn)程的血清膽紅素在不同治療方式下的變化情況，以及相應(yīng)的生存時(shí)間(即從開(kāi)始治療到死亡或肝移植的時(shí)間)的變化特征．

上述美國(guó)梅約醫(yī)學(xué)研究中心PBC數(shù)據(jù)組，跟蹤記錄的312名隨機(jī)選取的患者的情況，包含20個(gè)變量，各1 945個(gè)觀測(cè)值，可以在R語(yǔ)言的JM包中直接獲得．本研究主要關(guān)注如下觀測(cè)變量：Y代表血清膽紅素serBilir(mg/dL)，是檢測(cè)原發(fā)性膽汁性肝硬化程度的指標(biāo)；t定義為登記日到每次觀測(cè)年數(shù)year；Z是用藥情況drug，用藥選擇為D-青霉胺或安慰劑；T定義為登記日到換肝、死亡或研究分析時(shí)間的年數(shù)years；δ是生存時(shí)間的右刪失示性函數(shù)status2，取值為1時(shí)表示患者換肝或死亡，取值為0時(shí)表示患者治愈．

本文對(duì)這組實(shí)例數(shù)據(jù)的分析將分三步進(jìn)行：(1)確定縱向數(shù)據(jù)模型的變點(diǎn)個(gè)數(shù)；(2)估計(jì)變點(diǎn)在時(shí)間軸上的位置；(3)選擇建立聯(lián)合模型得到相應(yīng)的參數(shù)估計(jì)．

首先，確定縱向數(shù)據(jù)多變點(diǎn)LME模型中變點(diǎn)的個(gè)數(shù)．對(duì)于樣本量為N的患者間相互獨(dú)立的樣本，令Yij為患者i在時(shí)間tij的血清膽紅素的測(cè)量值．通過(guò)1．2節(jié)中假設(shè)檢驗(yàn)規(guī)則，通過(guò)原假設(shè)和備擇假設(shè)中的縱向數(shù)據(jù)模型，建立一系列關(guān)于PBC數(shù)據(jù)組的聯(lián)合模型JM0，JM1，…，JMk，檢驗(yàn)結(jié)果如表3所示．

由表3知，在超過(guò)99.99%的置信度水平上含有1個(gè)變點(diǎn)的聯(lián)合模型JM1對(duì)PBC 數(shù)據(jù)的擬合度優(yōu)于沒(méi)有變點(diǎn)的聯(lián)合模型JM0；在超過(guò)99.99% 的置信度水平上含有2個(gè)變點(diǎn)的聯(lián)合模型JM2對(duì)數(shù)據(jù)的擬合度優(yōu)于含有1個(gè)變點(diǎn)的聯(lián)合模型JM1；含有3個(gè)變點(diǎn)的聯(lián)合模型JM3對(duì)數(shù)據(jù)的擬合度不顯著優(yōu)于含有2個(gè)變點(diǎn)的聯(lián)合模型JM2．從而含有2個(gè)變點(diǎn)的LME模型和相應(yīng)混合效應(yīng)AFT模型構(gòu)成的聯(lián)合模型JM2在本研究中對(duì)PBC數(shù)據(jù)擬合最優(yōu)，且AIC和BIC結(jié)果也都支持了該結(jié)論．

表3　PBC聯(lián)合模型似然比檢驗(yàn)結(jié)果

然后，本文選用如下縱向數(shù)據(jù)模型(8)和生存時(shí)間模型(9)通過(guò)共享協(xié)變量Zi和隨機(jī)效應(yīng)向量ui構(gòu)成聯(lián)合模型描述PBC數(shù)據(jù)．

logYij=(μ0+ui1)+μ1Zi+(μ2+ui2)tij+Δi1(tij-τ1)++Δi2(tij-τ2)++eij

(8)

(9)

其中Zi是有兩個(gè)取值的等級(jí)協(xié)變量，Ti是患者i從登記日到死亡、肝移植或研究分析時(shí)間的年數(shù)，相應(yīng)的生存時(shí)間的右刪失示性函數(shù)為δi，參數(shù)向量γ2與隨機(jī)效應(yīng)向量ui的維數(shù)一致．

同上一章模擬研究一樣，本研究選觀測(cè)時(shí)間變量t最大值的1/3和2/3分位數(shù)即0.988 4和3.983 7，作為極大似然優(yōu)化方法估計(jì)兩個(gè)變點(diǎn)位置的初值．通過(guò)計(jì)算可以得到兩個(gè)變點(diǎn)在時(shí)間軸上的位置(τ1τ2)為(0.141 53.542 2)，即為登記日起的第2個(gè)月和第3.5 a．

最后，通過(guò)Gauss-Hermite近似意義下的極大似然方法得到聯(lián)合模型中其他參數(shù)的估計(jì)值及標(biāo)準(zhǔn)誤，如表4所示．

表4　PBC聯(lián)合模型參數(shù)估計(jì)

由表4可知，用藥Z的系數(shù)為-0.306 9，說(shuō)明D-青霉胺確實(shí)對(duì)血清膽紅素的升高有抑制作用．通過(guò)時(shí)間進(jìn)程的參數(shù)估計(jì)及上述兩個(gè)變點(diǎn)的估計(jì)值可知，從開(kāi)始用藥到第2個(gè)月為第一階段，該階段的血清膽紅素有一個(gè)短暫而明顯的降低，增長(zhǎng)率為-0.694 7，標(biāo)準(zhǔn)誤較大為0.212 4，并且相應(yīng)隨機(jī)效應(yīng)的方差估計(jì)值也較大為4.416 4，說(shuō)明由于用藥的不同，這一階段不同個(gè)體的血清膽紅素變化差異加大；接著很快開(kāi)始反彈，血清膽紅素呈現(xiàn)正向增長(zhǎng)，增長(zhǎng)率為0.172 8，標(biāo)準(zhǔn)誤較小為0.019 0，并且相應(yīng)隨機(jī)效應(yīng)的方差估計(jì)值也較小為0.078 9；直到第3.5 a的時(shí)候，血清膽紅素增速變緩，增長(zhǎng)率變?yōu)?.130 5直到觀測(cè)結(jié)束，標(biāo)準(zhǔn)誤進(jìn)一步減小為0.013 3，相應(yīng)隨機(jī)效應(yīng)的方差估計(jì)值進(jìn)一步減小為0.021 6，說(shuō)明隨著時(shí)間的增加，患者抗藥性的增強(qiáng)，個(gè)體間的差異逐漸減?。?/p>

圖2顯示了12個(gè)隨機(jī)選擇的PBC患者血清膽紅素觀測(cè)值及擬合曲線．

圖212個(gè)隨機(jī)選擇的PBC患者血清膽紅素觀測(cè)值及擬合曲線

Fig.2TheobservedvaluesandsimulationcurvesofserBilirfor12randomlyselectedPBCpatients

圖2直觀地顯示了治療對(duì)降低患者的血清膽紅素只有一開(kāi)始產(chǎn)生了較好的效果，持續(xù)大概兩個(gè)月的時(shí)間之后開(kāi)始反彈，直到3.5 a的時(shí)候血清膽紅素的增速開(kāi)始放緩，但仍保持增長(zhǎng)趨勢(shì)，說(shuō)明治療方法需要改進(jìn)．

4　結(jié)　語(yǔ)

本研究首先對(duì)分段LME模型中合適的變點(diǎn)個(gè)數(shù)進(jìn)行選擇，使得聯(lián)合模型對(duì)縱向及生存數(shù)據(jù)具有最優(yōu)擬合度，進(jìn)而建立了共享協(xié)變量和隨機(jī)效應(yīng)的含有多個(gè)變點(diǎn)的縱向數(shù)據(jù)LME模型和生存數(shù)據(jù)AFT模型的聯(lián)合模型．在此基礎(chǔ)上，本研究得到了變點(diǎn)在時(shí)間軸上的位置估計(jì)值，并通過(guò)Gauss-Hermite近似解決了聯(lián)合似然函數(shù)中的復(fù)雜積分以得到模型中其他參數(shù)的估計(jì)，較好地解釋了協(xié)變量及隨機(jī)效應(yīng)對(duì)縱向響應(yīng)變量和生存時(shí)間的影響．最后將該模型運(yùn)用到PBC數(shù)據(jù)中，研究發(fā)現(xiàn)：PBC患者的血清膽紅素只在初期治療階段有所降低，兩個(gè)月后迅速開(kāi)始反彈，直到3.5 a后增速才有所放緩，說(shuō)明治療方法仍需改進(jìn)．

[1]Tsiatis A A, Degruttola V, Wulfsohn M S. Modeling the relationship of survival to longitudinal data measured with error. Applications to survival and CD4 counts in patients with AIDS [J]. Journal of the American Statistical Association, 1995, 90(429):27-37.

[2]Wulfsohn M S, Tsiatis A A. A joint model for survival and longitudinal data measured with error[J]. Biometrics, 1997, 53(1):330-339.

[3]Hinkley D V. Inference about the change-point in a sequence of random variables[J]. Biometrika, 1970, 57(1):1-17.

[4]Smith A F M, Cook D G. Straight lines with a change-point:a Bayesian analysis of some renal transplant data [J]. Applied Statistics, 1980, 29(2):180-189.

[5]Kim H M, Lagakos S W. Assessing drug compliance using longitudinal marker data, with application to AIDS[J]. Statistics in Medicine, 1995, 13(19-20):2141-2153.

[6]Kim H J, Fay M P, Feuer E J,etal. Permutation tests for joinpoint regression with applications to cancer rates[J]. Statistics in Medicine, 2000, 19(3):335-351.

[7]Huang Y, Dagne G A, Park J G. Segmental modeling of changing immunologic response for CD4 data with skewness, missingness and dropout [J]. Journal of Applied Statistics, 2013, 40(10):2244-2258.

[8]Evans M, Swartz T. Approximating Integrals via Monte Carlo and Deterministic Methods [M]. Oxford:Oxford University Press, 2000.

[9]Murtaugh P A, Dickson E R, van Dam G M,etal. Primary biliary cirrhosis:Prediction of short-term survival based on repeated patient visits [J]. Hepatology, 1994, 20(1):126-134.

[10]Shapiro J M, Smith H, Schaffner F. Serum bilirubin:a prognostic factor in primary biliary cirrhosis[J]. Gut, 1979, 20(2):137-140.

Multiple change points identification in joint modeling of longitudinal and survival data

SHENJia-kun1,2,SONGLi-xin*2,SUNXiu-feng1,FENGBao-jun1

( 1.Faculty of Management and Economics, Dalian University of Technology, Dalian 116024, China；2.School of Mathematical Sciences, Dalian University of Technology, Dalian 116024, China )

A joint model with multiple change points identifying in longitudinal response process is proposed, which combines a linear mixed-effect (LME) model and an accelerated failure time (AFT) model with respect to shared covariates and random effects. All the parameters are estimated by the maximum likelihood function through the Gauss-Hermite approximation to deal with the intractable integrals in it. The effect of the method is elucidated through simulation studies and a real data application about primary biliary cirrhosis (PBC). It is shown that serum bilirubin level declines only at the beginning of treatment and lasts two months, then quickly rebounds and doesn′t slow down until 3.5 years later, which indicates that the treatment methods still need to be improved.

multiple change points; linear mixed-effect (LME) model; accelerated failure time (AFT) model; joint inference; maximum likelihood

1000-8608(2016)05-0539-07

2016-01-15；

2016-07-08．

國(guó)家社會(huì)科學(xué)基金資助項(xiàng)目(16BGL060)；國(guó)家自然科學(xué)基金資助項(xiàng)目(11371077).

沈佳坤(1991-)，女，博士生，E-mail:shenjiakun@mail.dlut.edu.cn；宋立新*(1966-)，男，教授，博士生導(dǎo)師，E-mail:lxsong@dlut.edu.cn；馮寶軍(1966-)，男，教授，博士生導(dǎo)師，E-mail:fbj066@sina.com.

O212

10.7511/dllgxb201605015

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

縱向數(shù)據(jù)與生存數(shù)據(jù)聯(lián)合模型中多變點(diǎn)識(shí)別問(wèn)題

0 引 言

1 模型和方法

2 數(shù)值模擬

3 原發(fā)性膽汁性肝硬化(PBC)實(shí)例分析

4 結(jié) 語(yǔ)

0　引　言

1　模型和方法

2　數(shù)值模擬

3　原發(fā)性膽汁性肝硬化(PBC)實(shí)例分析

4　結(jié)　語(yǔ)