張晉昕, 溫興煊
(1.中山大學(xué)公共衛(wèi)生學(xué)院, 廣州 510080; 2.東莞市疾病預(yù)防控制中心, 廣東 東莞 523125)
?專家述評?
生存資料分析中腫瘤發(fā)生時間的修正*
張晉昕1, 溫興煊2
(1.中山大學(xué)公共衛(wèi)生學(xué)院, 廣州 510080; 2.東莞市疾病預(yù)防控制中心, 廣東 東莞 523125)
據(jù)2011年世界衛(wèi)生組織(WHO)統(tǒng)計(jì),全球每年因患癌癥死亡的人數(shù)約為600余萬。目前,包括中國在內(nèi)的世界大部分國家居民的生命健康均面臨著高發(fā)病率、高病死率惡性腫瘤的嚴(yán)重威脅[1-2]。預(yù)計(jì)到2020年,中國每年新發(fā)惡性腫瘤病例將達(dá)388萬,年癌癥死亡總數(shù)也將增至276萬[3]。如何做到更加有效地預(yù)防和治療惡性腫瘤,仍將是整個社會面臨的亟需解決的重大課題之一。由于目前尚無完全根治惡性腫瘤的有效方法,因此做好預(yù)防仍是惡性腫瘤防治的關(guān)鍵[4]。要想針對性地采取預(yù)防措施,前提是能夠獲悉影響惡性腫瘤發(fā)生發(fā)展的各種因素,并能準(zhǔn)確地把握關(guān)鍵因素。為此,相關(guān)研究者進(jìn)行了大量的惡性腫瘤發(fā)生發(fā)展的影響因素探索及相應(yīng)的病因流行病學(xué)研究[5]。此類研究中包含生存資料的分析,通常都會用到時間信息(如,Cox比例風(fēng)險回歸分析),此時必然涉及到腫瘤發(fā)生時間的確定。盡可能準(zhǔn)確地獲取腫瘤發(fā)生的時間,才能使后續(xù)分析結(jié)果更加可靠。
目前,在腫瘤的影響因素探索和病因流行病學(xué)的研究中被廣泛應(yīng)用的研究方法主要包括隊(duì)列研究、生存分析等[6-8],而此類研究中包含了大量的生存資料分析處理工作,在這類資料分析中有時會用到隨訪和陽性事件發(fā)生的時間信息,這必然會涉及到腫瘤發(fā)生時間確定的問題[6]。在被廣泛應(yīng)用的生存資料分析方法中,腫瘤發(fā)生時間的確定方法包括:在進(jìn)行Kaplan-Meier法生存分析及Cox比例風(fēng)險回歸分析時,研究者通常把觀察到腫瘤發(fā)生(如,確診發(fā)生腫瘤、發(fā)現(xiàn)腫瘤發(fā)生轉(zhuǎn)移等)時對應(yīng)的隨訪時間點(diǎn)記作腫瘤發(fā)生的時間;而從臨床的角度來看,醫(yī)務(wù)人員通常把出現(xiàn)相關(guān)癥狀的時間[9]或把隨診過程中腫瘤確診的時間當(dāng)作腫瘤發(fā)生時間[10]。目前腫瘤隨訪研究者均默認(rèn)采用這些傳統(tǒng)的結(jié)局事件發(fā)生時間確定方法,但是這種確定腫瘤發(fā)生時間的方法存在問題:在用此方法確定的時間點(diǎn)上腫瘤已具有一定的大小,即研究資料中記錄的時刻之前腫瘤已經(jīng)生長了一段時間,這個時間點(diǎn)并不是腫瘤真正的發(fā)生時間。腫瘤真正的發(fā)生時間應(yīng)該要早于記錄的時間,即用這種方法確定的時間信息實(shí)際是左刪失的。
時間信息存在的偏差,必然會影響利用了時間信息的后續(xù)相關(guān)統(tǒng)計(jì)分析方法的結(jié)果,如生存分析中位時間、Cox比例風(fēng)險回歸中篩選到的危險因素的類別和風(fēng)險(HR)大小的估計(jì)等。當(dāng)時間偏差較小時,中位時間的估計(jì)和影響因素的篩選結(jié)果不會受到嚴(yán)重影響;而當(dāng)時間偏差大到一定程度時,與真實(shí)情況相比中位時間估計(jì)結(jié)果會有嚴(yán)重改變,而篩選出的危險因素的種類及各因素相對危險度大小排序也會不同,致使有關(guān)腫瘤病因?qū)W研究中相應(yīng)分析結(jié)果發(fā)生偏差,導(dǎo)致在對腫瘤進(jìn)行干預(yù)和采取預(yù)防措施時,無法準(zhǔn)確地考量輕重緩急。因此,為獲取更準(zhǔn)確的分析結(jié)果,在腫瘤生存資料分析中對腫瘤發(fā)生時間信息修正是有必要的。
已有研究闡明腫瘤細(xì)胞的增殖不受機(jī)體內(nèi)部機(jī)制的調(diào)控,同時,腫瘤生長也非一種無組織的行為。作為一種特殊生命體,腫瘤可被看作一個擁有自組織能力的復(fù)雜動態(tài)系統(tǒng)。雖然其復(fù)雜的行為模式很難用體外模型(in vitro)、活體模型(in vivo)或一般的數(shù)學(xué)模型來描述和模擬,但各相關(guān)領(lǐng)域的學(xué)者們依然做了大量的努力,旨在對腫瘤生長過程建立一套理想的模型以達(dá)到模擬腫瘤生長的目的[11],構(gòu)建了能準(zhǔn)確刻畫多種腫瘤生長的數(shù)學(xué)模型[12-14]。自19世紀(jì)20年代起,很多著名的腫瘤生長曲線模型先后被建立,主要包括:Mottram 指數(shù)模型[15]、Logistic 模型[16]、Gompertz模型[21]和Gompertz-Laird模型[17]、多細(xì)胞腫瘤球體(Multicell Tumor Spheroid)[18-19]模型以及West’s一般生長(West’s General Growth)模型[9]。
在這些模型中除了West’s一般生長模型僅適用于包括女性乳腺癌和前列腺癌在內(nèi)的幾種特定的腫瘤外,其它的幾個模型在一定條件下是對所有腫瘤普遍適用的。
West’s一般生長(West’s General Growth)模型,首先是由美國洛斯阿拉莫斯國家實(shí)驗(yàn)室(Los Alamos National Laboratory)在研究一般生物體生長的共同規(guī)律時提出(《Nature》,第413卷,第 628頁,2001年)。該研究發(fā)現(xiàn),包括3種腫瘤細(xì)胞體外培養(yǎng)(in vitro)、8種大鼠腫瘤(in vivo, rodents)和2種人體腫瘤(in vivo, patients)在內(nèi)的13種惡性實(shí)體腫瘤沿循同樣的法則在生長。這2種人體腫瘤分別是前列腺癌和女性乳腺癌[9]。雖然West’s一般生長模型的應(yīng)用范圍僅局限于幾種腫瘤,但是與其它模型相比,該模型對其適用的幾種腫瘤的實(shí)際生長情況有更優(yōu)的擬合效果[9, 15-19]。
目前,腫瘤生長數(shù)學(xué)模型相關(guān)研究已相對比較成熟,多種能夠很好地模擬腫瘤生長的模型被建立。其中Mottram指數(shù)模型主要被應(yīng)用于腫瘤早期生長曲線的模擬研究中,而經(jīng)典Gompertz模型和Gompertz-Laird模型因其能用于模擬在特定條件下腫瘤的完整生長過程,使這些模型得到了更廣泛的應(yīng)用[17, 20]。
某些特定的腫瘤,如乳腺癌具有發(fā)病部位局限、多為單發(fā)和原發(fā)等特征,且目前包括CT、鉬靶、B超在內(nèi)的影像學(xué)檢查技術(shù)能夠準(zhǔn)確檢測乳腺癌的大小。這就為乳腺癌發(fā)生時間信息的修正提供了可能,即可借助測量獲得足夠充分的參數(shù)估計(jì)值代入腫瘤生長曲線數(shù)學(xué)模型,實(shí)現(xiàn)女性乳腺癌生存資料分析中腫瘤發(fā)生時間的修正。
West’s一般生長模型對于在沒有外來干預(yù)的前提下歐洲女性乳腺癌生長有很好的擬合效果(R2= 0.97)[9]。在獲取適用的模型參數(shù)后結(jié)合準(zhǔn)確測量的腫瘤大小信息,其不僅可以用來估計(jì)女性乳腺癌發(fā)生的具體時間,還能夠在乳腺癌生存資料分析時對腫瘤發(fā)生時間的確定方法加以調(diào)整和完善。使得此類生存資料中的時間信息得以修正,從而使進(jìn)一步利用了時間信息的統(tǒng)計(jì)分析結(jié)果更切合實(shí)際。
有研究通過收集和分析乳腺癌大鼠模型和乳腺癌患者腫瘤生長數(shù)據(jù),進(jìn)一步證實(shí)了West’s一般生長模型適用于人體乳腺癌生長軌跡和模式的刻畫,能反映無藥物干預(yù)的女性乳腺癌的生長情況[25-30],利用可準(zhǔn)確測量的腫瘤大小信息,West’s一般生長曲線模型可運(yùn)用于沒有藥物干預(yù)時女性乳腺癌實(shí)際生長時間的估計(jì)。
利用成功建立的West’s一般生長模型,根據(jù)乳腺癌生存資料中記錄的原始腫瘤大小信息推算出對應(yīng)的生長時間,從而修正腫瘤的發(fā)生時間。具體的修正流程如圖1:
→根據(jù)模型函數(shù)式,獲得乳腺癌生長相對時間τ:τ=-ln(1-r)
圖1 利用West’s一般生長模型修正乳腺癌發(fā)生時間流程圖
先利用West’s腫瘤生長曲線模型以及生存資料腫瘤大小的信息對資料中記錄的女性乳腺癌發(fā)生時間加以修正后,再用Kaplan-Meier生存分析、Cox回歸分析等統(tǒng)計(jì)分析方法對修正時間信息后的資料進(jìn)行分析。特別指出,由于實(shí)際研究中收集的資料可能具有層次結(jié)構(gòu),各觀測間有組內(nèi)聚集性或相似性而不獨(dú)立,此時傳統(tǒng)模型和統(tǒng)計(jì)分析方法將不適用。因此在探討自變量和因變量的相互關(guān)系時,無論是自變量還是因變量的層次結(jié)構(gòu)都不能被忽略。為解決此類問題,應(yīng)采用混合效應(yīng)模型即多水平模型回歸分析方法。根據(jù)因變量的分布特征(正態(tài)分布、二項(xiàng)分布等)合理選擇多水平線性回歸模型、多水平logistic回歸模型、多水平Cox回歸模型等;根據(jù)數(shù)據(jù)的層次特征合理選擇二水平、三水平甚至包含更多水平的模型(均可在SPSS、SAS等分析軟件中實(shí)現(xiàn))。綜上,腫瘤生存資料Cox回歸分析前不僅要考慮時間信息的修正,必要時需考慮資料存在的層次結(jié)構(gòu)。
雖然目前尚無可以反映所有腫瘤的生長模式的數(shù)學(xué)模型,但是已有研究者提出了能夠適用于人體特定腫瘤的生長曲線模型——West’sgeneralgrowth模型。這樣的數(shù)學(xué)模型能夠很好地反映出人體女性乳腺癌和前列腺癌在沒有藥物干預(yù)下的生長模型,不僅可以用來估計(jì)腫瘤發(fā)生的具體的時間,還能夠在腫瘤隨訪研究資料分析時,針對腫瘤發(fā)生終點(diǎn)事件的時間定義在傳統(tǒng)方法的基礎(chǔ)上加以調(diào)整和完善。需要指出的是,惡性腫瘤種類繁多,而針對這些腫瘤生長模式的前瞻性研究尚在逐步完善,時間信息偏差的問題依然存在,如何歸納出腫瘤生長的一般規(guī)律,針對性地修正生存資料中的發(fā)生時間,這是實(shí)現(xiàn)精準(zhǔn)化評價腫瘤發(fā)生發(fā)展的基礎(chǔ)。
[1]MilneR,VesseyM.Theassociationoforalcontraceptionwithkidneycancer,coloncancer,gallbladdercancer(includingextrahepaticbileductcancer)andpituitarytumours[J].Contraception,1991,43(6):667-693.
[2]ThompsonS,TonelliM.Generalhealthchecksinadultsforreducingmorbidityandmortalityfromdisease[J].CochraneDatabaseSystRev,2012,11(1):ED000047.
[3] 陳萬青,鄭榮壽,張思維,等. 2003~2007年中國癌癥發(fā)病分析[J].中國腫瘤,2012,21(3):161-170.
[4]ForsytheLP,GadallaSM,HamiltonJG,etal.Enhancingacancerpreventionandcontrolcurriculumthroughinteractivegroupdiscussions[J].JCancerEduc,2012,27(3):428-435.
[5] 黃靈瀟, 姚文秀. 乳腺癌篩查和預(yù)防措施研究進(jìn)展[J]. 腫瘤治療與預(yù)防,2013,26(1):38-44.
[6]HogstedtC,JanssonC,HugossonM,etal.CancerincidenceinacohortofSwedishchimneysweeps, 1958-2006[J].AmJPublicHealth,2013,103(9):1708-1714.
[7]FahyBN.Follow-upaftercurativeresectionofcolorectalcancer[J].AnnSurgOncol,2014,21(3):738-746.
[8]HopuleleD,Zugun-EloaeF,CozmaGL,etal.Vascularmolecularmarkersfordeterminationofdiseasefreesurvival(DFS)ofbreastcancer[J].RevMedChirSocMedNatIasi,2006,110(4):950-954.
[9]GuiotC,DegiorgisPG,DelsantoPP,etal.Doestumorgrowthfollowa"universallaw"?[J].JTheorBiol,2003,225(2):147-151.
[10]LiCI,UribeDJ,DalingJR.Clinicalcharacteristicsofdifferenthistologictypesofbreastcancer[J].BrJCancer,2005,93(9):1046-1052.
[11]吳金. 腫瘤生長過程的仿真分析[D]. 華中科技大學(xué),2004.
[12]WestGB,BrownJH,EnquistBJ.Ageneralmodelforontogeneticgrowth[J].nature,2001,413(6856):628-631.
[13]RochaJL,AleixoSM.AnextensionofGompertziangrowthdynamics:weibullandfrechetmodels[J].MathBiosciEng, 2013,10(2):379-398.
[14]YorkeED,FuksZ,NortonL,etal.Modelingthedevelopmentofmetastasesfromprimaryandlocallyrecurrenttumors:comparisonwithaclinicaldatabaseforprostaticcancer[J].CancerRes,1993,53(13):2987-2993.
[15]青義學(xué). 生物醫(yī)學(xué)數(shù)學(xué)模型[M]. 長沙:湖南科學(xué)技術(shù)出版社,1990.
[16]CramerJS.TheOriginsofLogisicRegression[R].2002.
[17]NahashonSN,AggreySE,AdefopeNA,etal.Gompertz-LairdmodelpredictionofoptimumutilizationofcrudeproteinandmetabolizableenergybyFrenchguineafowlbroilers[J].PoultSci,2010,89(1):52-57.
[18]DurandRE.Cellcyclekineticsinaninvitrotumormodel[J].CellTissueKinet,1976,9(5):403-412.
[19]SutherlandRM,DurandRE.Radiationresponseofmulticellspheroids-aninvitrotumourmodel[J].CurrTopRadiatResQ,1976,11(1):87-139.
[20]Mignon-GrasteauS,BeaumontC,LeBihan-DuvalE,etal.Geneticparametersofgrowthcurveparametersinmaleandfemalechickens[J].BrPoultSci,1999,40(1):44-51.
[21]NortonL.AGompertzianmodelofhumanbreastcancergrowth[J].CancerRes,1988,48(24):7067-7071.
[22]BaadePD,YouldenDR,CrambetSM.EpidemiologyofprostatecancerintheAsia-Pacificregion[J].ProstateInt,2013,1(2):47-58.
[23]HorevoetsJ,SmetB,PattynetP.Desmoidtumourofthebreast:casereportandreviewoftheliterature[J].ActaChirBelg,2013,113(4):304-307.
[24]Riihimaki M,Thomsen H, Brandtet A. Death causes in breast cancer patients[J]. Ann Oncol,2012,23(3):604-610.
[25]崔尚斌, 艾軍. 關(guān)于抑制物對腫瘤生長直接效果模型的數(shù)學(xué)分析[J]. 應(yīng)用數(shù)學(xué)學(xué)報(bào),2002,25(0):617-625.
[26]Wang ZH, Deisboeck TS. Mathematical modeling in cancer drug discovery[J]. Drug Discov Today,2014,19(2):145-150.
[27]Xu J, Vilanova G, Gomez H. A mathematical model coupling tumor growth and angiogenesis [J]. PLoS One, 2016,11(2): e0149422.
[28]Castorina P, Carco D, Guiot C, et al. Tumor growth instability and its implications for chemotherapy[J]. Cancer Research,2009,69(21):8507-8515.
[29]Antipov AV, Bratus AS. Mathematical model of optimal chemotherapy strategy with allowance for cell population dynamics in a heterogeneous tumor[J]. Computational Matheatics and Mathematical Physics,2009,49(11):1825-1836.
[30]Bratus AS, Chumerina ES. Optimal control synthesis in therapy of solid tumor growth[J]. Computational Matheatics and Mathematical Physics,2008,48(6):892-911.
2017- 03- 06
*廣東省科技計(jì)劃項(xiàng)目(編號:2014A020212713)
張晉昕,男,醫(yī)學(xué)博士,副教授,中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系主任。1989年本科畢業(yè)于天津大學(xué),1997年、2000年先后在山西醫(yī)科大學(xué)、第四軍醫(yī)大學(xué)獲流行病與衛(wèi)生統(tǒng)計(jì)學(xué)專業(yè)碩士、博士學(xué)位,2003年在中山大學(xué)公共衛(wèi)生學(xué)院完成博士后研究,留校任教至今?,F(xiàn)為中山大學(xué)臨床試驗(yàn)中心建設(shè)領(lǐng)導(dǎo)小組成員,廣東省抗癌協(xié)會腫瘤流行病學(xué)專業(yè)委員會常務(wù)委員,廣東省醫(yī)學(xué)會循證醫(yī)學(xué)分會委員,廣東省突發(fā)事件應(yīng)急管理專家,廣東省生產(chǎn)安全事故應(yīng)急預(yù)案評審專家,中國衛(wèi)生信息學(xué)會醫(yī)學(xué)統(tǒng)計(jì)教育專業(yè)委員會委員,中國中西醫(yī)結(jié)合委員會時間醫(yī)學(xué)分會委員,國際生存質(zhì)量研究學(xué)會會員。參編教材、專著20余本,發(fā)表學(xué)術(shù)論文200余篇,主持或參與30余項(xiàng)各級各類課題,獲省部級科研或教學(xué)獎勵5次。國家精品課程、國家雙語示范課程、教育部來華留學(xué)生品牌課程、國家級資源共享課、愛課程網(wǎng)MOOCs課程、廣東省遠(yuǎn)程教育精品課程、廣東省精品視頻公開課《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》主講教師之一;廣東省優(yōu)秀教學(xué)團(tuán)隊(duì)成員。國家自然科學(xué)基金、廣東省自然科學(xué)基金函審專家,《中國衛(wèi)生統(tǒng)計(jì)》、《中華預(yù)防醫(yī)學(xué)雜志》、《中國醫(yī)院統(tǒng)計(jì)》等10余本學(xué)術(shù)期刊的編委或?qū)徃鍖<?。研究方向?yàn)榻y(tǒng)計(jì)學(xué)方法及其醫(yī)學(xué)應(yīng)用,主要在醫(yī)學(xué)科研設(shè)計(jì)、疾病流行預(yù)測建模、多因素統(tǒng)計(jì)方法等領(lǐng)域開展系列研究。已培養(yǎng)碩士研究生55名。
R730.1
A
10.3969/j.issn.1674- 0904.2017.02.001