張娟,劉娟,于紅
(連云港市贛榆區(qū)人民醫(yī)院,江蘇 連云港 222000)
肺癌是最常見的呼吸系統(tǒng)腫瘤,可以分為非小細(xì)胞肺癌(Non-Small Cell Lung Cancer,NSCLC)和小細(xì)胞肺癌(Small Cell Lung Cancer,SCLC)[1]。SCLC 在肺癌病理分型中占比較少,約15%[2]。目前,SCLC 患者預(yù)后不太理想,5 年生存率不足7%[3]。SCLC 的疾病特征是癌細(xì)胞增殖快,侵襲能力強(qiáng),大部分癌細(xì)胞分化程度低,轉(zhuǎn)移范圍廣[4]。肝臟是SCLC 最常見的轉(zhuǎn)移部位,肝轉(zhuǎn)移是SCLC 患者的主要致死原因[5]。因此,醫(yī)生早期評(píng)估SCLC患者發(fā)生肝轉(zhuǎn)移的風(fēng)險(xiǎn)概率,以選擇最佳的治療方案是很有必要的。以往研究顯示,SCLC 患者發(fā)生肝轉(zhuǎn)移與臨床特征相關(guān)[6],但缺乏依據(jù)治療信息預(yù)測(cè)肝轉(zhuǎn)移發(fā)生傾向的模型。因此,本研究利用SEER 數(shù)據(jù)庫(kù)中患者臨床基本特征和治療信息,探究影響SCLC 肝轉(zhuǎn)移的獨(dú)立風(fēng)險(xiǎn)特征,并開發(fā)一個(gè)簡(jiǎn)便、直觀及精準(zhǔn)的可視化諾模圖預(yù)測(cè)模型,方便臨床醫(yī)生早期識(shí)別高危肝轉(zhuǎn)移患者,進(jìn)一步完善治療決策。
通過(guò)使用SEER*Stat 8.3.9.1 軟件,從SEER 數(shù)據(jù)庫(kù)中提取2010—2015 年間SCLC 患者的臨床特征。選取標(biāo)準(zhǔn):(1)2010—2015 年病理診斷為SCLC 的患者;(2)TN 分期采用第七版肺癌分期手冊(cè)劃分;(3)隨訪信息齊全。排除標(biāo)準(zhǔn):(1)初診時(shí)為多原發(fā)腫瘤;(2)患者生存時(shí)間及生存情況不詳;(3)數(shù)據(jù)由醫(yī)院住院部及門診部提供;(4)臨床信息不詳。
利用SEER 數(shù)據(jù)庫(kù)收集SCLC 病例,根據(jù)選取和排除標(biāo)準(zhǔn)獲取信息,最終獲取了11 837 例病例。提取的臨床信息包括:年齡、種族、性別、腫瘤大小、T 分期、N 分期、清除淋巴結(jié)數(shù)目、腫瘤部位、化療、手術(shù)、放療、腦轉(zhuǎn)移、骨轉(zhuǎn)移、生存時(shí)間。
根據(jù)R 4.1.1 軟件進(jìn)行統(tǒng)計(jì)學(xué)分析及繪圖。運(yùn)用R 語(yǔ)言包“survminer”“survival”對(duì)SCLC 患者肝轉(zhuǎn)移、非肝轉(zhuǎn)移組的總生存期(Overall Surviva,OS)進(jìn)行生存分析;運(yùn)用R 語(yǔ)言包“caret”按6∶4 將數(shù)據(jù)隨機(jī)分為訓(xùn)練組和驗(yàn)證組,應(yīng)用訓(xùn)練組數(shù)據(jù)建立模型、應(yīng)用驗(yàn)證組數(shù)據(jù)驗(yàn)證模型的可靠性;運(yùn)用R 語(yǔ)言包“tableone” 對(duì)訓(xùn)練組與驗(yàn)證組的定性資料分布差異進(jìn)行χ2檢驗(yàn);運(yùn)用R 語(yǔ)言包“glmnet”進(jìn)行Lasso 回歸分析;運(yùn)用R 語(yǔ)言包“rms”進(jìn)行多因素Logistic 回歸分析,并繪制預(yù)測(cè)SCLC 患者肝轉(zhuǎn)移風(fēng)險(xiǎn)的可視化諾模圖模型;運(yùn)用R 語(yǔ)言包“pROC”計(jì)算曲線下面積(Area Under Curve,AUC),評(píng)價(jià)預(yù)測(cè)模型辨別高危肝轉(zhuǎn)移患者的能力;運(yùn)用R 語(yǔ)言包“rms”繪制校正圖,評(píng)價(jià)實(shí)際發(fā)生概率與模型預(yù)測(cè)概率的一致性。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
SCLC 患者中,肝轉(zhuǎn)移組3 211 例,非肝轉(zhuǎn)移組8 626 例。Log Rank 檢驗(yàn)結(jié)果顯示,兩組患者預(yù)后差異有統(tǒng)計(jì)學(xué)意義(χ2=1 337.185,P<0.001),非肝轉(zhuǎn)移組患者比肝轉(zhuǎn)移組患者生存時(shí)間顯著延長(zhǎng),見圖1。
圖1 SCLC 肝轉(zhuǎn)移組與非肝轉(zhuǎn)移組的生存曲線Figure 1 Survival curves of SCLC's liver metastasis group and non liver metastasis group
本研究共提取11 837 例患者,將其隨機(jī)劃分訓(xùn)練組(n=7 103)和驗(yàn)證組(n=4 734)。兩組患者的年齡、種族、性別、腫瘤大小、T分期、N 分期、清除淋巴結(jié)數(shù)目、腫瘤部位、化療、手術(shù)、放療、腦轉(zhuǎn)移及骨轉(zhuǎn)移的差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見表1,兩組數(shù)據(jù)具有可比性。
表1 SCLC 患者一般臨床資料[n(%)]Table 1 General clinical data of patients with SCLC[n(%)]
將人口學(xué)特征與臨床特征納入Lasso 回歸分析,最佳值λ為0.012 397 62 時(shí),得到8 個(gè)回歸系數(shù)非零的重要特征(見圖2),即種族、N 分期、清除淋巴結(jié)數(shù)目、化療、手術(shù)、放療、腦轉(zhuǎn)移以及骨轉(zhuǎn)移,此時(shí)預(yù)測(cè)模型最簡(jiǎn)便且性能最好。
圖2 應(yīng)用Lasso 回歸篩選SCLC 發(fā)生肝轉(zhuǎn)移的相關(guān)重要特征Figure 2 Application of Lasso regression to screen important features related to liver metastasis in SCLC
考慮到臨床醫(yī)生認(rèn)為年齡可能也是肝轉(zhuǎn)移發(fā)生的危險(xiǎn)特征,因此在多因素Logistic 回歸分析中,納入的自變量為年齡、種族、N 分期、清除淋巴結(jié)數(shù)目、化療、手術(shù)、放療、腦轉(zhuǎn)移與骨轉(zhuǎn)移。結(jié)果顯示,種族、清除淋巴結(jié)數(shù)目、N 分期、手術(shù)、放療、化療、骨轉(zhuǎn)移、腦轉(zhuǎn)移均是影響SCLC 患者發(fā)生肝轉(zhuǎn)移的獨(dú)立風(fēng)險(xiǎn)特征(見圖3)。其中種族、清除淋巴結(jié)數(shù)目、手術(shù)、放療是SCLC患者發(fā)生肝轉(zhuǎn)移的保護(hù)特征,N 分期、化療、骨轉(zhuǎn)移、腦轉(zhuǎn)移是SCLC 患者發(fā)生肝轉(zhuǎn)移的危險(xiǎn)特征。
圖3 多因素Logistic 回歸分析SCLC 肝轉(zhuǎn)移獨(dú)立風(fēng)險(xiǎn)特征Figure 3 Independent risk characteristics of SCLC's liver metastasis using multivariate logistic regression analysis
通過(guò)多因素Logistic 回歸分析,我們將化療、種族、腦轉(zhuǎn)移、手術(shù)、N 分期、放療、骨轉(zhuǎn)移、清除淋巴結(jié)數(shù)目納入諾模圖模型,諾模圖可應(yīng)用于臨床預(yù)測(cè)個(gè)體發(fā)生肝轉(zhuǎn)移風(fēng)險(xiǎn)率中(見圖4)。結(jié)果表明,清除淋巴結(jié)數(shù)目是最強(qiáng)的預(yù)后特征,其次是骨轉(zhuǎn)移、放療。
圖4 預(yù)測(cè)SCLC 患者肝轉(zhuǎn)移發(fā)生風(fēng)險(xiǎn)的諾模圖Figure 4 Nomogram for predicting the risk of liver metastasis in patients with SCLC
應(yīng)用AUC 評(píng)估預(yù)測(cè)模型辨別高危患者的能力,結(jié)果顯示,訓(xùn)練組和驗(yàn)證組的AUC 以及對(duì)應(yīng)的95%CI 分別為0.779(0.768~0.791)和0.776(0.762~0.792),表明預(yù)測(cè)模型識(shí)別高危肝轉(zhuǎn)移的能力較強(qiáng)(見圖5A、圖5B);繪制校正圖評(píng)估實(shí)際發(fā)生概率與預(yù)測(cè)概率的一致性,結(jié)果顯示,訓(xùn)練組和驗(yàn)證組預(yù)測(cè)曲線均貼近45℃斜線(見圖6A、圖6B),表明模型校準(zhǔn)度較好。
圖5 諾模圖預(yù)測(cè)模型的ROC 曲線Figure 5 ROC curve of Nomograph prediction model
圖6 諾模圖預(yù)測(cè)模型的校正曲線Figure 6 Correction curve of Nomogram prediction model
本研究從SEER 數(shù)據(jù)庫(kù)中共獲取了11 837 例SCLC 患者,超過(guò)27%的患者發(fā)生肝轉(zhuǎn)移。通過(guò)Lasso 回歸分析以及多因素Logistic 回歸分析,將化療、種族、腦轉(zhuǎn)移、手術(shù)、N 分期、放療、骨轉(zhuǎn)移、清除淋巴結(jié)數(shù)目作為SCLC 患者肝轉(zhuǎn)移的獨(dú)立預(yù)測(cè)特征并用于建立諾模圖。本研究利用ROC、校正圖等方法對(duì)模型進(jìn)行了驗(yàn)證,證明該模型具有良好的預(yù)測(cè)能力,易于辨別SCLC 肝轉(zhuǎn)移高危患者。
本研究通過(guò)多因素Logistic 回歸分析發(fā)現(xiàn),白人患者發(fā)生肝轉(zhuǎn)移的風(fēng)險(xiǎn)概率比黑人和美國(guó)印第安/阿拉斯加患者發(fā)生肝轉(zhuǎn)移的風(fēng)險(xiǎn)概率高,與Reddy S P 等[7]的研究結(jié)果一致。在我們的回顧性研究中,N 分期在N2(P<0.001)、N3(P<0.001)期時(shí),諾模圖上量化的分?jǐn)?shù)較高,對(duì)應(yīng)的預(yù)測(cè)肝轉(zhuǎn)移風(fēng)險(xiǎn)較高。以往研究顯示,癌細(xì)胞轉(zhuǎn)移順序由淋巴結(jié)向遠(yuǎn)處轉(zhuǎn)移[8-9]。因此,早期擴(kuò)大肺部淋巴結(jié)清掃區(qū)域,能夠抑制癌細(xì)胞向遠(yuǎn)處轉(zhuǎn)移。本研究對(duì)治療情況的分析顯示,手術(shù)(P=0.022)、放療(P<0.001)是SCLC 患者的保護(hù)因素,接受手術(shù)和放療的患者肝轉(zhuǎn)移發(fā)生率低。孫基峰等[10]的研究發(fā)現(xiàn),接受治療的SCLC 肝轉(zhuǎn)移患者生存期明顯比未接受治療的患者延長(zhǎng)。以往研究[11]表明,化療抑制癌細(xì)胞向身體其他部位轉(zhuǎn)移,這一結(jié)果與本研結(jié)果不一致。原因可能是化療會(huì)刺激機(jī)體產(chǎn)生更多的外泌體,外泌體使腫瘤微環(huán)境更利于癌細(xì)胞活躍,促進(jìn)癌細(xì)胞通過(guò)血液循環(huán)抵達(dá)肝臟[12]。研究報(bào)道,SCLC 患者遠(yuǎn)處轉(zhuǎn)移率極高,癌細(xì)胞往往向多個(gè)部位同步轉(zhuǎn)移[13]。這些表明,當(dāng)檢查到遠(yuǎn)處轉(zhuǎn)移時(shí),SCLC 細(xì)胞可能已轉(zhuǎn)移到多個(gè)器官,并且發(fā)生骨、腦轉(zhuǎn)移的患者更可能發(fā)生肝轉(zhuǎn)移。
本研究尚存在局限性。(1)作為一項(xiàng)具有潛在選擇偏倚風(fēng)險(xiǎn)的回顧性研究,本研究結(jié)果需要從前瞻性多中心臨床試驗(yàn)中得到證實(shí)。(2)由于SEER 數(shù)據(jù)庫(kù)的限制,無(wú)法獲得吸煙史、飲酒史、靶向治療和免疫治療的數(shù)據(jù)。(3)盡管在本研究中討論了化療、手術(shù)以及放療情況,但SEER 數(shù)據(jù)庫(kù)中沒(méi)有具體的治療方案,如化療周期、化療劑量、手術(shù)方法以及放療區(qū)域等詳細(xì)信息。(4)本研究中病例來(lái)自國(guó)外,建立的模型是否可應(yīng)用于中國(guó)病例還需要更多的研究。
綜上所述,本研究基于化療、種族、腦轉(zhuǎn)移、手術(shù)、N 分期、放療、骨轉(zhuǎn)移、清除淋巴結(jié)數(shù)目開發(fā)了諾模圖模型來(lái)預(yù)測(cè)SCLC患者發(fā)生肝轉(zhuǎn)移的風(fēng)險(xiǎn)概率。通過(guò)對(duì)模型的評(píng)估,證明該模型具有良好的辨別能力。該模型可以幫助臨床醫(yī)生對(duì)高危肝轉(zhuǎn)移SCLC 患者選擇最佳治療策略。當(dāng)然,該模型在SCLC 肝轉(zhuǎn)移患者中的應(yīng)用還需要進(jìn)一步的研究來(lái)證實(shí)。