羅文卿,李源奇,葉飛,李強明,張國慶,李向楠
肺癌是世界上常見的惡性腫瘤,發(fā)病率和死亡率分別位居世界第二和第一[1]。肺癌的兩種主要類型是小細胞肺癌和非小細胞肺癌,分別約占所有病例的15%和85%[2]。肺腺癌是非小細胞肺癌的主要組織學亞型,近年來,肺腺癌的發(fā)病率增長明顯快于肺鱗癌,約占肺癌發(fā)病率的40%[3]。由于肺腺癌在早期容易發(fā)生轉(zhuǎn)移,并且在確診時三分之二的肺腺癌患者已經(jīng)處于晚期(ⅢB/Ⅳ期),因此肺腺癌患者的預后較差,平均5年生存率不足20%[4]。盡管目前肺腺癌在免疫治療和靶向治療上研究進展迅速,但5年生存率仍然相對較低[5]。列線圖是一種通過給出特定臨床事件概率的數(shù)值估計,同時結(jié)合腫瘤學結(jié)果的關鍵因素來直觀評估風險的可靠工具[6]。而且,列線圖比傳統(tǒng)的TNM分期標準具有更精確的生存預測能力[7]。本研究旨在基于SEER數(shù)據(jù)庫[8],通過大數(shù)據(jù)隊列構(gòu)建肺腺癌患者生存預后的列線圖預測模型。
回顧性收集SEER數(shù)據(jù)庫中2010年至2015年診斷為肺腺癌患者的臨床數(shù)據(jù)。按照第7版美國癌癥聯(lián)合委員會(American Joint Committee on Cancer,AJCC)標準對TNM分期進行分類。
納入標準:(1)患者在2010—2015年間明確診斷;(2)組織學類型(ICD-O-3)為腺癌;(3)經(jīng)過明確病理學確診;(4)所有患者均只有一種原發(fā)性腫瘤;(5)死因限定為肺癌;(6)隨訪信息完整。排除標準:(1)組織學類型(ICD-O-3)為非腺癌者;(2)有多種原發(fā)性腫瘤;(3)臨床資料缺失;(4)治療信息和隨訪信息缺失;(5)年齡<18歲;(6)生存時間小于1月或未知。
淋巴結(jié)陽性比率(lymph node ratio,LNR)是指陽性淋巴結(jié)數(shù)與總淋巴結(jié)數(shù)之比。有學者發(fā)現(xiàn),LNR會影響非小細胞肺癌患者的生存預后[9],因此本研究納入LNR。最終確定的分析變量為:年齡、種族、性別、婚姻狀況、腫瘤原發(fā)部位、腫瘤分級、肺葉分側(cè)、腫瘤分期、T分期、N分期、M分期、手術、放療、化療、LNR、骨轉(zhuǎn)移、腦轉(zhuǎn)移、肝轉(zhuǎn)移、肺轉(zhuǎn)移、腫瘤大小。
隨機將70%的患者分為建模組,30%的患者分為驗證組。建模組使用Lasso Cox回歸分析篩選出獨立危險因素,確定每個獨立危險因素的風險比(hazard ratio,HR),并計算相關95%置信區(qū)間(95%CI)。
利用篩選出的獨立危險因素作為變量,建立一個預測肺腺癌患者1、3和5年特異生存率的列線圖模型,并進行內(nèi)部驗證。通過C指數(shù)(Cindex)和校準曲線對列線圖的判別和校準能力進行評估,使用NRI(net reclassification index,NRI)和DCA曲線(decision curve analysis,DCA)對列線圖的預測能力和凈收益進行評估。為了縮小偏差,上述分析均經(jīng)過Bootstrap重復進行1 000次。
根據(jù)預測模型計算每例患者的總風險得分,并按照總風險得分的四分位數(shù)對建模組患者進行分層。采用Kaplan-Meier法和Log rank檢驗對各風險組生存差異進行顯著性評價。使用R4.0.3軟件和SPSS25軟件進行數(shù)據(jù)分析。P<0.05為差異有統(tǒng)計學意義。
根據(jù)納入和排除標準,在SEER數(shù)據(jù)庫中確定了16 558例肺腺癌患者(建模組11 592例,驗證組4 966例)?;颊咛卣饕姳?。
表1 建模組和驗證組患者的特征 (n(%))Table 1 Characteristics of patients in training cohort and validation cohort (n(%))
經(jīng)過Lasso回歸分析20個可能影響肺腺癌患者預后的變量,最終篩選出15個與預后密切相關的變量,即年齡、種族、性別、婚姻狀況、腫瘤分級、腫瘤分期、T分期、N分期、手術、化療、LNR、骨轉(zhuǎn)移、腦轉(zhuǎn)移、肝轉(zhuǎn)移、腫瘤大小。
單因素Cox回歸分析顯示,Lasso回歸分析篩選的15個變量均與特異性生存率顯著相關。多因素分析顯示,15個變量均是獨立的生存預后影響因素,見表2。
表2 建模組單因素和多因素Cox回歸分析Table 2 Univariate and multivariate Cox regression analyses of training cohort
根據(jù)上述篩選出的獨立預后因素,構(gòu)建預測肺腺癌患者生存概率的預測模型,見圖1。預測模型判別力檢驗結(jié)果顯示出了良好的預后準確性和臨床適用性,建模組的C指數(shù)為0.819,驗證組的C指數(shù)為0.810。預測模型建模組的1、3和5年特異性生存率有較高的AUC(area under ROC curve,AUC),分別為0.846、0.869和0.875,驗證組的AUC分別為0.838、0.866和0.865。預測模型校準度評估結(jié)果顯示,建模組和驗證組校準曲線預測的1、3和5年特異性生存率與實際特異性生存率吻合較好,見圖2。
根據(jù)第7版AJCC TNM分期系統(tǒng),構(gòu)建了預測肺腺癌患者生存概率的預測模型,見圖3。NRI評估發(fā)現(xiàn),本研究構(gòu)建的預測模型比第7版AJCC TNM分期系統(tǒng)有更強的預測能力,見表3。DCA分析表明,該預測模型比第7版AJCC TNM分期系統(tǒng)有更高的凈收益和臨床有效性,見圖4。
表3 預測模型的NRITable 3 NRI of prediction model
在建模組中,本研究以總風險得分的四分位數(shù)為截斷值,將建模組的11 592例患者分為低風險組(0~138分)、中風險組(139~154分)、中高風險組(155~199分)和高風險組(≥200分)。Kaplan-Meier生存分析表明,四組特異性生存率有顯著差異(P<0.001),見圖5A。在驗證組使用該截斷值,依然能有效區(qū)分不同風險組患者的預后(P<0.001),見圖5B。
近年來,腺癌在非小細胞肺癌中占比越來越高,并且已經(jīng)超過鱗癌成為最常見的肺癌組織學類型[10]。肺腺癌患者早期一般無明顯癥狀,容易發(fā)生轉(zhuǎn)移,侵犯神經(jīng)、淋巴管和血管等,因此肺腺癌患者的預后較差[11]。準確識別影響肺腺癌預后的獨立因素對于個體化治療的選擇具有重要的臨床指導意義。與傳統(tǒng)的TNM分期相比,列線圖更加直觀簡便,有利于臨床醫(yī)生安排個體化治療和應對患者咨詢。因此,本研究的目的是通過分析肺腺癌患者預后相關因素,構(gòu)建并驗證列線圖預后模型。
目前,Lasso回歸分析已經(jīng)廣泛應用于Cox回歸模型中變量的篩選和預后模型的構(gòu)建[12-13]。因此,本研究采用Lasso回歸分析初步篩選影響肺腺癌生存預后的因素,其優(yōu)點是可以同時分析所有的變量,避免過度擬合,減少共線性的影響。Lasso Cox回歸分析發(fā)現(xiàn),年齡、種族、性別、婚姻狀況、腫瘤分級、腫瘤分期、T分期、N分期、手術、化療、LNR、骨轉(zhuǎn)移、腦轉(zhuǎn)移、肝轉(zhuǎn)移和腫瘤大小是肺腺癌的獨立預后因素,與以往研究的結(jié)果一致。
此前有報道稱,肺腺癌患者的預后與年齡有關,且年齡越大,生存期越短[14]。心腦血管疾病并發(fā)癥和肝腎功能差可能是老年患者預后差于年輕患者的原因。已有研究發(fā)現(xiàn),不同種族的肺癌患者有不同的生存預后[15]。Zhou等[16]發(fā)現(xiàn),除了原發(fā)性肺癌,41.78%的患者死亡是由其他原因引起的,而種族是其中一個競爭性危險因素。Pitz等[17]研究發(fā)現(xiàn),男性肺腺癌患者的生存率遠低于女性患者。女性肺腺癌患者的預后優(yōu)于男性,這可能與女性EGFR突變率高、對于治療的敏感度高有關。Varlotto等[18]發(fā)現(xiàn),未婚肺腺癌患者的預后比已婚的預后差。這可能與已婚患者可以和伴侶共擔風險、獲得伴侶足夠的情感支持和經(jīng)濟支持有關。
腫瘤分級代表了腫瘤的分化程度,影響肺腺癌患者的生存和預后。有學者認為,腫瘤分級低是導致肺腺癌患者不良預后的一個重要原因[19]。有研究表明,TNM分期會影響肺腺癌患者的預后,且TNM分期越早,患者生存期越長,這與我們的結(jié)果一致[20-21]。外科手術通常被認為是治療肺癌的最佳選擇。有學者認為,手術治療是影響肺腺癌患者預后的獨立因素,而且手術患者的生存率比非手術患者的生存率高[22]。Shi等[23]發(fā)現(xiàn),化療能明顯延長肺腺癌患者的生存期,是影響肺腺癌患者生存預后的一個重要的保護因素。Shin等認為,LNR越高的非小細胞肺癌患者,預后往往越差[9]。LNR與肺癌的病理類型有關,肺腺癌更容易發(fā)生淋巴結(jié)轉(zhuǎn)移,這可能使肺癌復發(fā)風險增加,從而影響患者的預后。研究表明,有骨轉(zhuǎn)移、腦轉(zhuǎn)移或肝轉(zhuǎn)移的肺癌患者生存期普遍短于沒有器官轉(zhuǎn)移的肺癌患者[14,23]?;颊甙l(fā)生器官轉(zhuǎn)移多提示腫瘤侵襲性較強,TNM分期較晚,預后比較差。研究發(fā)現(xiàn),腫瘤直徑越大,肺腺癌患者的生存期越短,這表明腫瘤大小會影響肺腺癌預后[15,24]。
本研究有以下優(yōu)點:首先,基于SEER數(shù)據(jù)庫應用大樣本量肺腺癌患者臨床數(shù)據(jù);其次,C指數(shù)表明預測模型判別準確性較高,校準曲線表明預測模型的預測值與真實值具有很好的一致性。NRI指數(shù)和DCA曲線表明,模型的預測能力和獲得的凈收益優(yōu)于第7版AJCC TNM分期系統(tǒng);最后,預測模型可以根據(jù)評分系統(tǒng)把患者分為不同的風險亞組,用于預測肺腺癌患者的個體化生存。
本研究同時也有一些局限性:首先,沒有對預測模型進行外部隊列的驗證,只進行了內(nèi)部隊列的驗證;其次,SEER數(shù)據(jù)庫缺乏一些重要的變量,如吸煙史、腫瘤標志物、靶向治療等,這些變量可能會影響肺腺癌患者的預后;最后,回顧性研究結(jié)果可能有固有的偏倚和誤差。
綜上,我們通過Lasso回歸分析篩選出影響肺腺癌患者預后的變量,Lasso回歸分析中不要求變量符合正態(tài)分布,減少共線性的影響,避免了過度擬合。使用Cox比例風險回歸分析得到獨立預后因素,建立并驗證了列線圖預測模型,為肺腺癌患者的生存預測提供了一個簡便可靠的工具。同時,預測模型構(gòu)建的風險分層模型可以便捷地篩選出不同風險的患者,這對肺腺癌患者的個體化治療具有重要意義。