国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

免疫細胞浸潤在非小細胞肺癌診斷與預后中的應(yīng)用

2020-05-07 12:30:46萬輝輝劉振浩澹小秀王廣志徐勇謝鷺林勇
生物工程學報 2020年4期
關(guān)鍵詞:肺癌分類特征

萬輝輝,劉振浩,澹小秀,王廣志,徐勇,謝鷺,林勇

·醫(yī)藥生物技術(shù)·

免疫細胞浸潤在非小細胞肺癌診斷與預后中的應(yīng)用

萬輝輝1,劉振浩2,3,澹小秀1,王廣志4,徐勇1,謝鷺2,林勇1

1上海理工大學 醫(yī)療器械與食品學院,上海 200093 2 上海生物信息技術(shù)研究中心,上海 201203 3 中南大學湘雅醫(yī)院,湖南 長沙 410008 4 上海海洋大學 食品科學與技術(shù)學院,上海 201306

免疫細胞浸潤對癌癥的診斷與預后有著重要意義。文中收集TCGA數(shù)據(jù)庫已收錄的非小細胞肺癌腫瘤與正常組織基因表達數(shù)據(jù),利用CIBERSORT工具得到22種免疫細胞占比來評估免疫細胞浸潤情況。以22種免疫細胞占比為特征,用機器學習方法構(gòu)建了非小細胞肺癌腫瘤與正常組織的分類模型,其中隨機森林方法構(gòu)建的模型分類效果AUC=0.987、敏感性0.98及特異性0.84。并且用隨機森林方法構(gòu)建的肺腺癌和肺鱗癌腫瘤組織分類模型效果AUC=0.827、敏感性0.75及特異性0.77。用LASSO回歸篩選22種免疫細胞特征,保留8種強相關(guān)特征組成的免疫細胞評分結(jié)合臨床特征構(gòu)建了非小細胞肺癌預后模型。經(jīng)評估及驗證,預后模型C-index=0.71并且3年和5年的校準曲線擬合良好,可以對預后風險度進行準確預測。本研究基于免疫細胞浸潤所構(gòu)建的分類模型與預后模型,旨在對非小細胞肺癌的診斷與預后研究提供新的策略。

非小細胞肺癌,免疫細胞浸潤,機器學習,隨機森林,分類模型,LASSO回歸,預后模型

肺癌是一種常見的惡性腫瘤,具有極高的發(fā)病率與死亡率[1]。據(jù)美國癌癥協(xié)會和癌癥統(tǒng)計中心統(tǒng)計,每年有超過15萬肺癌患者死亡,同時每年新增確診病例數(shù)約20萬。肺癌主要有小細胞肺癌(Small cell lung cancer,SCLC) 和非小細胞肺癌(Non-small cell lung cancer,NSCLC) 兩種組織學表型,NSCLC占所有肺癌病例85%左右[2]。而NSCLC主要分為肺腺癌(Lung adenocarcinoma,LUAD) 和肺鱗癌(Lung squamous carcinoma,LUSC)[3]。

組織病理學切片圖像的目視檢查是病理學家評估肺癌腫瘤分期、類型和亞型的主要方法之一。NSCLC的診斷是一個關(guān)鍵的過程,因為傳統(tǒng)的化療以及最近的靶向治療對LUAD和LUSC的治療方案是不同的[4]。并且在缺乏明確的組織學特征的情況下,這一重要的診斷可能是具有挑戰(zhàn)性和耗時性的。面對這樣的挑戰(zhàn),許多研究人員對NSCLC診斷作出了不同的研究方案,如Yu等[5]將傳統(tǒng)的閾值和圖像處理技術(shù)與隨機森林、支持向量機或樸素貝葉斯分類器等機器學習方法相結(jié)合,區(qū)分NSCLC腫瘤和正常組織AUC達到0.85,區(qū)分LUAD和LUSC組織AUC達到0.75。在區(qū)分NSCLC腫瘤和正常組織時,Girard等[6]以62種基因為特征采用最近距離法分類準確率達到86%,Du等[7]以STC1 mRNA為特征通過計算約登指數(shù)得到最佳截斷點作分類AUC達到0.969。這些研究對NSCLC的診斷提供了新的方法,但是其診斷的效果還有較大的提升空間。

盡管近年來微創(chuàng)手術(shù)、化療和靶向治療等方法在NSCLC治療中取得了進步,但患者的5年生存率遠遠不能令人滿意,大多數(shù)地區(qū)的生存率在10%到20%之間[8]。而NSCLC的治療決策和預后在很大程度上取決于TNM分期系統(tǒng)的評估[9]。目前有許多通過引入臨床病理或其他特征來優(yōu)化分期系統(tǒng)的方案被提出,如年齡、性別、腫瘤位置等[10],甚至包括基因表達信息[11-12]。最近,也有證據(jù)表明免疫細胞浸潤對NSCLC的臨床和預后的重要性,將免疫細胞浸潤作為特征納入預后模型有助于臨床醫(yī)生對患者的預后進行更可靠和準確的預測[13]。

Newman等開發(fā)出一種稱為CIBERSORT的工具[14],它可以利用多種組織類型(包括實體腫瘤) 的基因表達數(shù)據(jù)得到22種免疫細胞占比來評估免疫細胞浸潤情況,同時在處理噪聲、未知混合物含量和密切相關(guān)的細胞類型等方面都優(yōu)于其他方法且通過流式細胞術(shù)得到很好的驗證[15]。由于CIBERSORT優(yōu)越的性能,研究人員使用CIBERSORT對各種癌癥的免疫細胞浸潤情況的研究越來越多[16-18]。本研究用CIBERSORT工具計算得到22種免疫細胞浸潤情況,采用機器學習方法構(gòu)建了以22種免疫細胞占比為特征的NSCLC腫瘤與正常組織的分類模型。同時采用LASSO回歸建立了由8種免疫細胞組成的免疫細胞評分,免疫細胞評分結(jié)合臨床特征構(gòu)建了NSCLC預后模型。

1 材料與方法

1.1 實驗數(shù)據(jù)

2018年12月,從腫瘤基因組圖譜數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA,https://cancergenome. nih.gov/) 檢索下載了1 007例NSCLC腫瘤組織基因表達數(shù)據(jù)和104例正常組織基因表達數(shù)據(jù)及對應(yīng)樣本的臨床數(shù)據(jù)。

從TCGA下載的基因表達數(shù)據(jù),使用David工具[19]將ENSEMBL號轉(zhuǎn)化為基因名(Gene Symbol),并且將相同基因號的表達數(shù)據(jù)取均值作為最終基因表達數(shù)據(jù)。下載的臨床數(shù)據(jù)特征包括年齡、病理分期、T分期、N分期、M分期、性別、化療情況、煙齡、隨訪日期、生存狀況。對于生存資料缺失、隨訪日期缺失或小于一個月的臨床數(shù)據(jù)進行剔 除,然后與基因表達數(shù)據(jù)進行匹配,最后總共獲得 812例基因表達與臨床資料都有的患者數(shù)據(jù)。

在研究中,使用1 007例NSCLC腫瘤組織基因表達數(shù)據(jù)(510例LUAD、497例LUSC) 與104例正常組織基因表達數(shù)據(jù)構(gòu)建NSCLC腫瘤與正常組織分類模型;使用812例基因表達與臨床資料都有的NSCLC患者數(shù)據(jù)構(gòu)建NSCLC預后模型。此外從基因表達綜合數(shù)據(jù)庫(Gene Expression Omnibus,GEO) 下載了編號為GSE10245[20]非小細胞肺癌基因表達數(shù)據(jù),用于對分類模型進行驗證,其中40例LUAD、18例LUSC。

1.2 分析方法

本研究中涉及所有分析均使用R軟件(版本3.5.1) 進行,NSCLC分類模型與預后模型構(gòu)建的方法流程如圖1所示。首先用CIBERSORT工具評估NSCLC腫瘤組織與正常組織的免疫細胞浸潤水平,然后用機器學習方法構(gòu)建NSCLC分類模型,用LASSO回歸構(gòu)建由8種免疫細胞組成的免疫細胞評分結(jié)合臨床特征用COX回歸構(gòu)建NSCLC預后模型。

(1) 評估免疫細胞浸潤水平方法

CIBERSORT工具提供了線下用R語言編寫的腳本,通過加載提供的包即可使用。CIBERSORT采用了線性支持向量回歸方法,這是一種對噪聲具有高度魯棒性的機器學習方法[21],可對包括B細胞、T細胞、自然殺傷細胞、巨噬細胞、樹突狀細胞和骨髓亞群細胞等在內(nèi)的22種免疫細胞表型進行高度敏感性和特異性識別,22種免疫細胞類型名稱詳細信息如表1所示。在每個樣本中,22種免疫細胞占比分數(shù)之和等于1,用這22種免疫細胞的占比分數(shù)來評估浸潤水平。

(2) 機器學習與LASSO回歸方法

分類模型采用的機器學習方法用R包‘caret’實現(xiàn),其中‘train’函數(shù)設(shè)置參數(shù)可以選擇所使用的方法,本研究中用到4種機器學習方法:神經(jīng)網(wǎng)絡(luò)、隨機森林、貝葉斯廣義線性模型和最小二乘回歸。對于隨機森林,它會為每個特征計算出準確度平均降低量(Mean Decrease Accuracy)和基尼指數(shù)平均降低量(Mean Decrease Gini),這兩個值都是對特征評估的重要性指標,同時隨機森林對于其他機器學習方法的優(yōu)勢在于可以評估所有特征的重要性從而對特征進行篩選[22]。

LASSO回歸通過構(gòu)造一個懲罰函數(shù)得到一個較為精練的模型,從而壓縮一些回歸系數(shù),同時設(shè)定一些回歸系數(shù)為零[23]。本研究使用R包‘glmnet’通過十折交叉驗證選取誤差最小的懲罰參數(shù)λ,來選擇22種免疫細胞中最為有效的預后標記免疫細胞子集及其對應(yīng)的回歸系數(shù)構(gòu)建免疫細胞評分。

(3) 模型性能評估方法

分類模型中均用隨機抽樣將數(shù)據(jù)7︰3劃分為訓練集與測試集,采用十折交叉進行驗證且重復3次。用分類準確率(Accuracy) 和ROC曲線下面積(AUC) 等來評估分類模型性能。Accuracy和AUC越大,表示分類模型性能越好。準確率是分類結(jié)果正確的樣本數(shù)與總樣本數(shù)的比值,公式為:

其中,TP=true positive;TN=true negative;FP=false positive;FN=false negative;

表1 22種免疫細胞類型名稱

預后模型中用分層隨機抽樣將數(shù)據(jù)6︰4劃分為訓練集和測試集。COX單因素分析用于計算變量的風險比。篩選COX單因素分析中<0.05的變量納入COX多因素分析。采用Kaplan-Meier曲線分析變量與總體生存率的關(guān)系,并且用log-rank檢驗顯著性水平。用COX多因素分析并采用后退法篩選變量建立NSCLC預后模型。用C-index (Harrell’s concordance index) 來評估預后模型性能,并采用1 000次bootstrap抽樣方法進行驗證。C-index大于0.7表示預后模型穩(wěn)定,值越高性能越好。同時,用3年和5年校準曲線對預后模型性能進行評估,校準曲線越趨近對角線表示性能越好。

2 結(jié)果與分析

2.1 NSCLC分類模型分類結(jié)果

基于機器學習的4種方法,以22種免疫細胞占比為特征,構(gòu)建了NSCLC腫瘤組織與正常組織分類的模型。四種方法構(gòu)建的模型均顯示了良好的分類效果(圖2A),從表2的分類結(jié)果中可以看出隨機森林方法效果最好,AUC=0.987、敏感性0.98及特異性0.84。同樣以22種免疫細胞占比為特征,基于機器學習的4種方法,我們構(gòu)建了LUAD、LUSC腫瘤組織的二分類模型 (圖2B)。模型分類結(jié)果如表3所示,隨機森林方法構(gòu)建的模型整體效果最好,AUC=0.827、敏感性0.75及特異性0.77。此外,我們用GEO數(shù)據(jù)庫中編號為GSE10245的數(shù)據(jù)對隨機森林方法建立的分類模型進行驗證,58例數(shù)據(jù)在NSCLC腫瘤與正常組織分類模型中驗證準確率為100%,在LUAD和LUSC腫瘤組織分類模型中驗證AUC=0.753、敏感性0.68及特異性0.78 (圖2C)。

2.2 NSCLC預后模型預測結(jié)果

研究中訓練集采用LASSO回歸分析選擇22種免疫細胞中最為有效的預后標記免疫細胞子集及其對應(yīng)的回歸系數(shù)構(gòu)建免疫細胞評分(Immunocyte score,ICS),通過十折交叉驗證后,當懲罰參數(shù)λ=0.022時,誤差達到最小,由此得到8個特征構(gòu)建的免疫細胞評分(圖3)。這8種免疫細胞分別為:活化的肥大細胞,活化的樹突狀細胞,M1巨噬細胞,M2巨噬細胞,靜止期肥大細胞,靜止期樹突狀細胞,初始B細胞,單核細胞。用免疫細胞評分做cutoff,將免疫細胞評分劃分為高低兩個組進行生存分析,結(jié)果顯示高免疫細胞評分的NSCLC患者預后生存時間較短(HR=1.84;-value<0.000 1;中位生存時間35.77個月比57.5個月;95% CI:1.36–2.48) (圖4)。然后,免疫細胞評分結(jié)合臨床特征做COX單因素與多因素分析,使用退火法篩選特征后,最后保留4個特征:病理分期(Pathological stage),T分期(T stage),放療(Radiation therapy) 和ICS,以這4個特征構(gòu)建了NSCLC預后模型列線圖,如圖5所示。經(jīng) 1 000次bootstrap抽樣方法進行驗證后,C-index為0.71。

表2 基于4種機器學習的NSCLC腫瘤組織與正常組織分類模型

表3 基于4種機器學習的LUAD和LUSC組織分類模型

在訓練集中,以所有病人的風險值做cutoff,將病人分為兩組,根據(jù)兩組病人的log-rank檢驗統(tǒng)計量來篩選病人分組閾值。如圖6所示,當選取2.43作為cutoff時,兩組病人log-rank檢驗統(tǒng)計量達到最大,因此選取2.43第一個閾值對患者進行分組。對剩下的患者繼續(xù)進行分組,選取cutoff=1.7為閾值,這樣將患者分成高、中、低風險3個組。相對低風險組,中風險組HR=2.69,95% CI:1.9–3.79,高風險組HR=6.36,95% CI:4.24–9.55,經(jīng)log-rank檢驗-value=1.45e–23。中位生存時間:低風險組61.0個月,中風險組31.7個月,高風險組20.8個月。然后,對模型預測NSCLC患者3年和5年的存活率做了校準曲線(圖7A,7B),校準曲線均擬合良好。用訓練集中的免疫細胞評分公式代入測試集中,圖4B結(jié)果驗證了高免疫細胞評分的NSCLC患者預后生存時間較短(HR=1.66;-value=0.0016;中位生存時間35.57個月比66.13個月;95% CI:1.21–2.29)。測試集中,模型預測NSCLC患者3年和5年的存活率校準曲線也都擬合良好 (圖7C和圖7D)。經(jīng)1 000次bootstrap抽樣方法進行驗證后,C-index為0.702。綜上,經(jīng)過訓練集模型的評估及測試集的驗證,表明構(gòu)建的預后模型可以實現(xiàn)準確的預測NSCLC患者的3年和5年存活率。

圖3 LASSO回歸構(gòu)建免疫細胞評分

圖4 免疫細胞評分生存分析

圖5 NSCLC預后模型列線圖

圖6 訓練集中NSCLC預后模型高中低風險分組生存分析比較

圖7 NSCLC預后模型3年和5年校準曲線圖

3 討論

此次研究以22種免疫細胞占比為特征用機器學習方法構(gòu)建了NSCLC分類模型。與Yu等將傳統(tǒng)的閾值和圖像處理技術(shù)與機器學習方法相結(jié)合、Girard等以62種基因為特征采用最近距離法及Du等以STC1 mRNA為特征通過計算約登指數(shù)得到最佳截斷點將NSCLC腫瘤與正常組織分類相比,我們用隨機森林方法,構(gòu)建的NSCLC腫瘤組織與正常組織分類模型、LUAD和LUSC腫瘤組織分類模型結(jié)果顯示出更高的準確度。

通過應(yīng)用新開發(fā)的CIBERSORT工具和LASSO回歸構(gòu)建了由8種免疫細胞組成的免疫細胞評分。免疫細胞評分結(jié)合臨床特征構(gòu)建了NSCLC預后模型,經(jīng)1 000次bootstrap抽樣方法進行驗證后C-index為0.71。預后模型的風險度高中低分組后做生存分析,經(jīng)log-rank檢驗-value=1.45e-23。預后模型中訓練集與測試集的3年與5年校準曲線都擬合良好,且測試集中經(jīng) 1 000次bootstrap抽樣方法進行驗證后C-index為0.702。模型評估與驗證表明了該預后模型對NSCLC的預后具有良好的預測能力。

基于免疫細胞浸潤構(gòu)建的NSCLC分類模型和預后模型說明了免疫細胞浸潤與其發(fā)生和發(fā)展存在的關(guān)聯(lián)。分類模型能夠有效地從NSCLC患者和健康對照人群中識別NSCLC患者(包括LUAD與LUSC患者),預后模型能夠有效地對NSCLC病人3年和5年存活率進行預測,提示不同免疫細胞類型在NSCLC發(fā)生發(fā)展過程中的作用。這一發(fā)現(xiàn)為從免疫細胞浸潤的角度對NSCLC診斷與預后研究提供新的策略。此外,基于本研究建立的模型,我們構(gòu)建了網(wǎng)頁工具(http://www. biostatistics.online/NSCLC/home.php),供研究者實際應(yīng)用于NSCLC診斷和預后的預測。

本研究方案雖然在NSCLC診斷與預后中取得進展,但也存在不足之處。研究中用的是公開的數(shù)據(jù)集,不可能獲得每個病人所需的所有信息。這表明,一些患有急性感染、患有免疫系統(tǒng)疾病或服用抗炎藥的患者,有可能被納入了這項研究。理想情況下,這些患者應(yīng)該被排除在外。另外對于目前公開可用的腫瘤基因組圖譜數(shù)據(jù)庫中,正常肺組織基因表達數(shù)據(jù)較腫瘤組織基因表達數(shù)據(jù)少,這就導致了收集數(shù)據(jù)時樣本的不平衡。但是,伴隨著目前高通量基因表達檢測技術(shù)的發(fā)展,會有越來越多的基因表達數(shù)據(jù)可供研究。在未來的研究中,我們將收集更多的NSCLC患者數(shù)據(jù)及正常組織數(shù)據(jù),繼續(xù)對NSCLC的診斷與預后進行進一步研究。

[1] Siegel RL, Miller KD, Jemal A. Cancer statistics, 2017. CA Cancer J Clin, 2017, 67(1): 7–30.

[2] Mitchell PL, John T. Lung cancer in 2016: immunotherapy comes of age. Lancet Respir Med, 2016, 4(12): 947–949.

[3] Hirsch FR, Scagliotti GV, Mulshine JL, et alLung cancer: current therapies and new targeted treatments. Lancet, 2017, 389(10066): 299–311.

[4] Hanna N, Johnson D, Temin S, et alSystemic therapy for stage IV non-small-cell lung cancer: American society of clinical oncology clinical practice guideline update. J Clin Oncol, 2017, 35(30): 3484–3515.

[5] Yu KH, Zhang C, Berry GJ, et alPredicting non-small cell lung cancer prognosis by fully automated microscopic pathology image features. Nat Commun, 2016, 7: 12474.

[6] Girard L, Rodriguez-Canales J, Behrens C, et alAn expression signature as an aid to the histologic classification of non-small cell lung cancer. Clin Cancer Res, 2016, 22(19): 4880–4889.

[7] Du YZ, Gu X H, LiL, et alThe diagnostic value of circulating stanniocalcin-1 mRNA in non-small cell lung cancer. J Surg Oncol, 2011, 104(7): 836–840.

[8] Siegel R, Desantis C, Virgo K, et alCancer treatment and survivorship statistics, 2012. CA Cancer J Clin, 2012, 62(4): 220–241.

[9] Ettinger DS, Wood DE, Akerley W, et alNCCN guidelines insights: non-small cell lung cancer, Version 4.2016. J Natl Compr Canc Netw, 2016, 14(3): 255–264.

[10] Ouyang J, Sun Y, Li W, et aldbPHCC: a database of prognostic biomarkers for hepatocellular carcinoma that provides online prognostic modeling. Biochim Biophys Acta, 2016, 1860 (11 Pt B): 2688–2695.

[11] Wu J, Zhou L, Huang L, et alNomogram integrating gene expression signatures with clinicopathological features to predict survival in operable NSCLC: a pooled analysis of 2164 patients. J Exp Clin Cancer Res, 2017, 36(1): 4.

[12] Sun HC, Xie L, Yang XR, et alShanghai score: A prognostic and adjuvant treatment-evaluating system constructed for Chinese patients with hepatocellular carcinoma after curative resection. Chin Med J (Engl), 2017, 130(22): 2650–2660.

[13] Liu X, Wu S, Yang Y, et alThe prognostic landscape of tumor-infiltrating immune cell and immunomodulators in lung cancer. Biomed Pharmacother, 2017, 95: 55–61.

[14] Newman AM, Liu CL, Green MR, et alRobust enumeration of cell subsets from tissue expression profiles. Nat Methods, 2015, 12(5): 453–457.

[15] Bindea G, Mlecnik B, Tosolini M, et alSpatiotemporal dynamics of intratumoral immune cells reveal the immune landscape in human cancer. Immunity, 2013, 39(4): 782–795.

[16] Ali HR, Chlon L, Pharoah PD, et alPatterns of immune infiltration in breast cancer and their clinical implications: A gene-expression-based retrospective study. PLoS Med, 2016, 13(12): e1002194.

[17] Xiong Y, Wang K, Zhou H, et alProfiles of immune infiltration in colorectal cancer and their clinical significant: A gene expression-based study. Cancer Med, 2018, 7(9): 4496–4508.

[18] Zeng D, Zhou R, Yu Y, et alGene expression profiles for a prognostic immunoscore in gastric cancer. Br J Surg, 2018, 105(10): 1338–1348.

[19] Huang DW, Sherman BT, Tan Q, et alThe DAVID gene functional classification tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biol, 2007, 8(9): R183.

[20] Kuner R, Muley T, Meister M, et alGlobal gene expression analysis reveals specific patterns of cell junctions in non-small cell lung cancer subtypes. Lung Cancer, 2009, 63(1): 32–38.

[21] Scholkopf B, Smola AJ, Williamson RC, et alNew support vector algorithms. Neural Comput, 2000, 12(5): 1207–1245.

[22] Zhang YQ, Lin Y. Research of prediction of the response to tumor immunotherapy based on machine learning. Comp Eng Software, 2019, 40(1): 97–102 (in Chinese).張雨琦, 林勇. 基于機器學習的腫瘤免疫治療應(yīng)答預測研究. 軟件, 2019, 40(1): 97–102.

[23] Tibshirani R. Regression Shrinkage and Selection via the Lasso. J Royal Statist Soc, 1996, 58(1): 267–288.

Application of immune cell infiltration in the diagnosis and prognosis of non-small cell lung cancer

Huihui Wan1, Zhenhao Liu2,3, Xiaoxiu Tan1, Guangzhi Wang4, Yong Xu1, Lu Xie2, and Yong Lin1

1 School of Medical Instrument and Food Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China 2 Shanghai Center for Bioinformation Technology, Shanghai 201203, China 3 Xiangya Hospital, Central South University, Changsha 410008, Hunan, China 4 College of Food Science and Technology, Shanghai Ocean University, Shanghai 201306, China

Immune cell infiltration is of great significance for the diagnosis and prognosis of cancer. In this study, we collected gene expression data of non-small cell lung cancer (NSCLC) and normal tissues included in TCGA database, obtained the proportion of 22 immune cells by CIBERSORT tool, and then evaluated the infiltration of immune cells. Subsequently, based on the proportion of 22 immune cells, a classification model of NSCLC tissues and normal tissues was constructed using machine learning methods. The AUC, sensitivity and specificity of classification model built by random forest algorithm reached 0.987, 0.98 and 0.84, respectively. In addition, the AUC, sensitivity and specificity of classification model of lung adenocarcinoma and lung squamous carcinoma tissues constructed by random forest method 0.827, 0.75 and 0.77, respectively. Finally, we constructed a prognosis model of NSCLC by combining the immunocyte score composed of 8 strongly correlated features of 22 immunocyte features screened by LASSO regression with clinical features. After evaluation and verification, C-index reached 0.71 and the calibration curves of three years and five years were well fitted in the prognosis model, which could accurately predict the degree of prognostic risk. This study aims to provide a new strategy for the diagnosis and prognosis of NSCLC based on the classification model and prognosis model established by immune cell infiltration.

NSCLC, immune cell infiltration, machine learning, random forest, classification model, LASSO regression, prognosis model

June 4, 2019;

September 9, 2019

Yong Lin. Tel: +86-21-55271119; E-mail: yong_lynn@163.com

Lu Xie. Tel: +86-21-20283705; E-mail: luxiex2017@outlook.com

10.13345/j.cjb.190232

萬輝輝, 劉振浩, 澹小秀, 等. 免疫細胞浸潤在非小細胞肺癌診斷與預后中的應(yīng)用. 生物工程學報, 2020, 36(4): 740–749.

Wan HH, Liu ZH, Tan XX, et al. Application of immune cell infiltration in the diagnosis and prognosis of non-small cell lung cancer. Chin J Biotech, 2020, 36(4): 740–749.

(本文責編 郝麗芳)

猜你喜歡
肺癌分類特征
中醫(yī)防治肺癌術(shù)后并發(fā)癥
對比增強磁敏感加權(quán)成像對肺癌腦轉(zhuǎn)移瘤檢出的研究
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
microRNA-205在人非小細胞肺癌中的表達及臨床意義
临邑县| 惠东县| 成都市| 三原县| 潼南县| 琼海市| 锡林郭勒盟| 东台市| 仁布县| 黑河市| 罗平县| 伊金霍洛旗| 府谷县| 克什克腾旗| 龙州县| 井研县| 乐山市| 桐梓县| 泸溪县| 潍坊市| 齐齐哈尔市| 海林市| 宣武区| 云南省| 类乌齐县| 兴山县| 法库县| 德保县| 南通市| 牟定县| 黑龙江省| 丰镇市| 长沙县| 永清县| 双牌县| 宁强县| 河北区| 朝阳县| 磴口县| 邯郸市| 伽师县|