李皇保,周俊,吳曉俊,趙鳳慶,閔捷
(嘉興市第一醫(yī)院 肝膽外科,浙江 嘉興 314000)
膽囊癌起病隱匿,發(fā)現(xiàn)時超過一半的患者已發(fā)展至TNM IV期[1],因此預(yù)后差。即使是手術(shù)后的患者,5年生存率僅有20%左右[2]。對預(yù)后的準(zhǔn)確判斷是制定術(shù)后后續(xù)治療方案的重要條件,因此患者預(yù)后情況評估方法的可靠度和準(zhǔn)確性至關(guān)重要。TNM分期雖然可以對治療進(jìn)行指導(dǎo),但是它納入的危險因素僅有腫瘤侵犯范圍、淋巴結(jié)轉(zhuǎn)移、遠(yuǎn)處轉(zhuǎn)移等,對預(yù)后預(yù)測的準(zhǔn)確性不足,且無法實現(xiàn)可視化及個體化應(yīng)用[3]。
列線圖是一個能綜合分析預(yù)后危險因素從而進(jìn)行可視化、個體化評估的方法[3]。但是在膽囊方面,目前僅發(fā)現(xiàn)少量的相關(guān)研究[4-6],而且由于數(shù)據(jù)結(jié)構(gòu)及適用范圍的原因,這些研究的局限性均較大。本研究提取SEER(Surveillance,Epidemiology,and End Results Program)數(shù)據(jù)庫中膽囊癌患者的臨床病理數(shù)據(jù),評估影響預(yù)后的危險因素,并在此基礎(chǔ)上建立列線圖,從而為臨床醫(yī)師對膽囊癌預(yù)后判斷及治療提供參考。
使用SEER*stat軟件從數(shù)據(jù)庫提取數(shù)據(jù),提取條件為“發(fā)病部位:膽囊;診斷年份:2004至2014年;既往無腫瘤病史,膽囊癌為首發(fā)原發(fā)腫瘤”,提取變量為“病案號、登記地址(州)、性別、年齡、種族、婚姻、診斷年份、分化等級、手術(shù)方式、區(qū)域淋巴結(jié)檢出數(shù)、區(qū)域淋巴結(jié)陽性數(shù)、腫瘤直徑、侵襲范圍、轉(zhuǎn)移情況、病理類型、TNM分期(因第六版TNM分期在數(shù)據(jù)庫中數(shù)據(jù)完整性較好,故本文TNM分期參照第六版)、疾病相關(guān)生存狀態(tài)、生存時間”。
納入標(biāo)準(zhǔn):手術(shù)方式根據(jù)數(shù)據(jù)庫手冊選擇行膽囊根治性切除術(shù)[RX Summ-Surg Prim Site(1998+):40,50,60];既往無腫瘤病史,且膽囊癌為首發(fā)原發(fā)惡性腫瘤。診斷年份為2004至2014年。
排除標(biāo)準(zhǔn):SEER數(shù)據(jù)庫目前更新至2014年12月,共獲得7 943例膽囊癌患者數(shù)據(jù)。為使所有患者獲得至少1年以上隨訪,排除診斷年份為2014年者;同時剔除30 d內(nèi)死亡者、各變量中有缺失值者及隨訪信息不完整者的數(shù)據(jù),獲得2004年1月至2013年12月具有完整信息的有效數(shù)據(jù)832例。
SEER數(shù)據(jù)庫記錄了美國18個州的腫瘤患者信息及隨訪信息,通過整群隨機抽樣法,選取11個州的608例患者作為訓(xùn)練集,另外7個州(Connecticut,Hawaii, Iowa, New Jersey, New Mexico, Rural Georgia, San Jose-Monterey)的224例患者作為驗證集,訓(xùn)練集與驗證集的特征對比詳見表1。
數(shù)據(jù)庫數(shù)據(jù)每年連續(xù)隨訪,隨訪內(nèi)容包括死亡時間(精確到月)、生存狀態(tài),其中死亡類型包括總死因死亡與疾病相關(guān)死亡,本研究采用疾病相關(guān)死亡為終止事件,隨訪時間截止為2014年12月。
統(tǒng)計分析應(yīng)用SPSS 22.0(IBM Corporation,Armonk,NY,USA)軟件包實現(xiàn)。在患者基線資料中,非正態(tài)分布變量采用Mann-Whitney U檢驗,分類變量采用χ2檢驗。為使變量可納入列線圖分析,連續(xù)性變量采用X-tile軟件(Rimm Laboratory,Yale School of Medicine,New Haven,CT,USA)獲取最佳截取值轉(zhuǎn)換為分類變量[7]。壽命表法計算1、3、5年生存率,Cox比例風(fēng)險回歸模型篩選影響預(yù)后的獨立危險因素。列線圖的繪制使用R語言(The R Project for Statistical Computing,Vienna,Austria)的survival包及rms包實現(xiàn),變量得分使用nomogramEx包計算。列線圖的準(zhǔn)確性通過一致性指數(shù)(C-index)及校正曲線判斷[8]。內(nèi)部驗證通過Bootstrap法重復(fù)取樣1 000次自檢完成,外部驗證通過驗證集進(jìn)行驗證。本研究與AJCC分期的預(yù)測能力比較采用R語言的rcorrp.cens函數(shù)實現(xiàn)。P< 0.05為差異有統(tǒng)計學(xué)意義。
通過提取SEER數(shù)據(jù)庫2004年1月至2014年12月的膽囊癌數(shù)據(jù),42.6%(3 387/7 943)的膽囊癌診斷時為TNM IV期,接受根治手術(shù)者占49.0%(3 894/7 943)。剔除各個變量中含有缺失值的數(shù)據(jù)后共有832例患者納入研究,根據(jù)整群隨機抽樣法,608例患者進(jìn)入訓(xùn)練集,224例患者納入驗證集。各組的臨床病理資料詳見表1。訓(xùn)練集與驗證集的基本資料差異不明顯,只有種族及遠(yuǎn)處轉(zhuǎn)移兩個變量有統(tǒng)計學(xué)差異(P<0.05)。在對變量進(jìn)行分組時,根據(jù)侵襲范圍繪制的Kaplan-Meier生存曲線中侵犯至膽囊肌層外結(jié)締組織以內(nèi)的各組(黏膜層、肌肉固有層、膽囊肌層外結(jié)締組織)的曲線有較多重合及交叉,故將以上3組合并成“肌肉層外結(jié)締組織”組。
表1 訓(xùn)練集及驗證集患者臨床病理基線資料
訓(xùn)練集患者的中位疾病相關(guān)生存(disease-specific survival,DSS)期為22.07個月,術(shù)后1、3、5年DSS率為67.6%、36.8%、29.2%。多因素回歸分析提示性別、年齡、分化程度、淋巴結(jié)轉(zhuǎn)移、腫瘤直徑、侵襲范圍、遠(yuǎn)處轉(zhuǎn)移是影響預(yù)后的獨立危險因素(P<0.05),病理類型、婚姻狀態(tài)、種族、區(qū)域淋巴結(jié)檢出數(shù)等因素與預(yù)后無統(tǒng)計學(xué)相關(guān)性(P> 0.05)。Cox多因素回歸分析見表2。
表2 DDS Cox多因素回歸分析
列線圖基于上述獨立危險因素繪制,見圖1,內(nèi)部驗證的C-index為0.76(95%CI0.74~0.78),術(shù)后5年DSS校正曲線提示在觀察值與預(yù)測值之間有良好的一致性(圖2A)。AJCC分期的C-index為0.70(95%CI0.67~0.73),本列線圖的預(yù)測能力優(yōu)于AJCC分期,兩組之間比較有統(tǒng)計學(xué)意義(P< 0.001)。根據(jù)各變量的相應(yīng)回歸系數(shù),由R語言nomogramEx包計算各變量相應(yīng)得分,見表2,每個患者可基于列線圖或根據(jù)表2中單個變量的得分計算總分,然后根據(jù)總分在列線圖上獲取對應(yīng)的1、3、5年預(yù)測生存率。例如某患者男,65歲,病理分級中分化,伴淋巴結(jié)轉(zhuǎn)移,腫瘤直徑2 cm,侵犯漿膜層,無遠(yuǎn)處轉(zhuǎn)移,則可以通過以上各變量在列線圖“評分”線上尋找對應(yīng)的得分,或直接從表2中獲取變量的對應(yīng)得分,這兩種方法是等效的。根據(jù)各變量的得分計算總分為31.5+0+0+80+0+50+0=161.5,然后在“總分”線上找到161.5,做一條向下垂直線,得到該患者1、3、5年的生存率約為72%、36%、27%,該預(yù)測值的準(zhǔn)確性為76%(C-index值)。
驗證集的中位DSS生存期為25.14個月,術(shù)后1、3、5年DSS相關(guān)生存率為71.0%、38.7%、30.5%。外部驗證C-index為0.73(95%CI0.68~0.78),以5年生存率為例,外部驗證與訓(xùn)練集的一致性較好(圖2B)。
圖1 DSS列線圖(pDSS:預(yù)測疾病相關(guān)生存率)
圖2 列線圖校正曲線
在本研究中,我們從SEER數(shù)據(jù)庫中提取信息完整的膽囊癌根治手術(shù)后的患者資料共832例,其中608例患者作為訓(xùn)練集,224例患者作為外部驗證集。經(jīng)過Cox回歸分析,我們納入7個影響預(yù)后的獨立危險因素作為列線圖的變量,經(jīng)過驗證,本列線圖顯示出較高的準(zhǔn)確度,與既往的預(yù)后評估方法(AJCC分期)相比,其優(yōu)勢體現(xiàn)在可視化、個體化,可為個體的膽囊癌患者預(yù)后評估提供指導(dǎo)。
根據(jù)Cox回歸分析,我們發(fā)現(xiàn)性別、年齡、分化程度、淋巴結(jié)轉(zhuǎn)移、腫瘤直徑、侵襲范圍、轉(zhuǎn)移情況等是影響根治性切除術(shù)預(yù)后的獨立危險因素。其中分化程度、淋巴結(jié)轉(zhuǎn)移、腫瘤直徑、侵襲范圍、遠(yuǎn)處轉(zhuǎn)移等因素對預(yù)后的影響已獲得廣泛認(rèn)同[9-10]。在既往的研究中,性別及年齡對預(yù)后的影響存在爭議,國內(nèi)的研究普遍認(rèn)為性別、年齡對預(yù)后無影響[11-13],而部分國外的文獻(xiàn)則提示男性、高齡為危險因素[14-15],本研究提示女性的發(fā)病率雖然高于男性,但是預(yù)后好于男性,與國外的研究結(jié)論相符。另外隨著分組年齡的增加,患者預(yù)后變差,年齡對預(yù)后的影響可能來源于高齡導(dǎo)致的全身機能減退及其他合并癥對壽命的影響[16]。國內(nèi)研究結(jié)果的差異可能與納入的病例數(shù)較少有關(guān)。
基于以上預(yù)后獨立危險因素,本研究建立了預(yù)測膽囊癌術(shù)后DSS生存率的列線圖。建立的列線圖在預(yù)測準(zhǔn)確性上表現(xiàn)出色,訓(xùn)練組的內(nèi)部驗證和驗證組的外部驗證C-index分別是0.76和0.73,5年生存率的校正曲線也顯示列線圖預(yù)測的疾病相關(guān)生存率與實際觀察的生存率一致性較好。目前國內(nèi)有一篇基于淋巴結(jié)轉(zhuǎn)移率的膽囊癌列線圖文獻(xiàn),但是該文過于強調(diào)淋巴結(jié)轉(zhuǎn)移率的作用,忽略了其他影響預(yù)后的變量,而且并未進(jìn)行驗證,存在較多不足[17]。通過檢索PubMed數(shù)據(jù)庫,也僅發(fā)現(xiàn)少量相關(guān)研究,其中兩篇研究用于評價術(shù)后放化療效果,而且第一作者為同一個研究者[5-6],一篇用于預(yù)測磁化膽囊患者中早期膽囊癌的發(fā)生情況[4]。我們根據(jù)臨床工作中易于獲取的臨床病理因素建立的列線圖彌補了以上文獻(xiàn)的不足,可在預(yù)后評估時發(fā)揮重要作用。
本列線圖對膽囊癌術(shù)后患者預(yù)后的預(yù)測準(zhǔn)確性(C-index 0.76)優(yōu)于傳統(tǒng)的AJCC分期(C-index 0.70)。傳統(tǒng)的AJCC分期主要基于膽囊癌侵襲深度、淋巴結(jié)轉(zhuǎn)移情況及遠(yuǎn)處轉(zhuǎn)移情況,雖然能夠?qū)︻A(yù)后及后續(xù)治療提供給指導(dǎo),但是影響預(yù)后的因素還包括性別、年齡、分化程度及腫瘤直徑等,在對患者的預(yù)后評估中,應(yīng)充分考慮以上因素。我們的研究也證明,在納入以上因素后,列線圖的預(yù)測準(zhǔn)確性有所提高。而且以上因素在根治性手術(shù)患者中易于獲取,在臨床工作中具有很好的實用性。
盡管我們提供了一個準(zhǔn)確性較高的列線圖模型,但是該模型還有以下不足。首先,其他影響預(yù)后的因素如放化療情況、靶向治療、炎癥狀態(tài)等由于數(shù)據(jù)庫本身的缺陷未納入。其次,雖然該列線圖進(jìn)行了外部驗證且驗證證明一致性較好,但數(shù)據(jù)均來源于美國,如果有東方人種的數(shù)據(jù)進(jìn)行進(jìn)一步的驗證,可能效果更好。
綜上所述,性別、年齡、分化程度、淋巴結(jié)轉(zhuǎn)移、腫瘤直徑、侵襲范圍、轉(zhuǎn)移情況等是影響預(yù)后的獨立危險因素?;谝陨弦蛩亟⒌牧芯€圖能較準(zhǔn)確、直觀地個體化預(yù)測膽囊癌術(shù)后患者的疾病相關(guān)生存率。
感謝美國國立腫瘤研究所SEER數(shù)據(jù)庫提供的開放獲取數(shù)據(jù)。