劉 基,孫振綱,鄧 巖,唐子揚
(1.長江大學(xué)醫(yī)學(xué)部,湖北 荊州 434000;2.長江大學(xué)附屬荊州醫(yī)院,湖北 荊州 434000)
胰腺癌(pancreatic adenocarcinoma,PAAD)是發(fā)生于胰腺組織的惡性腫瘤,早期癥狀隱匿,惡性度高,進展迅速,預(yù)后差,5 年生存率僅為2%~9%[1,2]。PAAD 風(fēng)險因素包括吸煙、慢性胰腺炎家族史、糖尿病、肥胖等[3,4],在眾多風(fēng)險因素中炎癥過程已成為PAAD 發(fā)生和發(fā)展的關(guān)鍵介質(zhì)[5]。炎癥和癌癥之間的功能關(guān)系是當(dāng)前臨床研究的熱點之一,多項研究表明[6-8],腫瘤微環(huán)境在很大程度是由炎性細(xì)胞協(xié)調(diào),炎癥是腫瘤過程不可缺少的參與者,可促進其增殖、存活與轉(zhuǎn)移。本研究基于炎癥相關(guān)的PAAD 預(yù)后模型,以期為PAAD 分子機制以及預(yù)后情況提供新的思路。
1.1 數(shù)據(jù)收集 從GTEx 數(shù)據(jù)庫(https://xena.ucsc.edu/)中下載167 例正常胰腺樣本的RNA 測序數(shù)據(jù),從TCGA 數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)中下載4例正常胰腺樣本和178 例PAAD 樣本的RNA 測序數(shù)據(jù)和隨訪信息,以及從GEO(https://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫GSE57495 和GSE62452 共下載132 例PAAD 樣本的RNA 測序數(shù)據(jù)和隨訪信息,使用制造商提供的注釋文件將探針與基因匹配,如果有多個探針與單個基因匹配,則取RNA 基因測序數(shù)據(jù)的中值,根據(jù)GTEx、TCGA 和GEO 的數(shù)據(jù)訪問政策和發(fā)行的指南(數(shù)據(jù)均為公開數(shù)據(jù)),在Molecular Signatures 數(shù)據(jù)庫(https://www.gsea-msigdb.org/gsea/msigdb/)[9]中下載炎癥反應(yīng)相關(guān)基因。
1.2 炎癥反應(yīng)相關(guān)基因的預(yù)后模型構(gòu)建 腫瘤樣本和正常樣本之間差異表達基因(DGEs)通過R 語言的“l(fā)imma”包以logFC 大于2 和P值小于0.05 進行差異分析和篩選,單變量Cox 分析用于篩選具有預(yù)后價值的炎癥反應(yīng)相關(guān)基因,并通過Benjamini&Hochberg(BH)校正方法調(diào)整P值。Lasso Cox 分析用于構(gòu)建預(yù)后模型,同時縮小過度擬合的風(fēng)險,使用R語言“glmnet”包用于去收縮變量,使得回歸系數(shù)相當(dāng)于零,建立預(yù)后模型。用于預(yù)后分析的表達差異基因的標(biāo)準(zhǔn)化表達矩陣是自變量,在TCGA 中患者的生存期和生存狀態(tài)是因變量,根據(jù)每個炎癥反應(yīng)相關(guān)基因的表達水平及其相應(yīng)的回歸系數(shù)計算患者的風(fēng)險評分。公式如下:分?jǐn)?shù)=sum(每個基因的表達量×對應(yīng)系數(shù))。根據(jù)風(fēng)險分?jǐn)?shù)的中間Cut-off 值,將患者分為高風(fēng)險組和低風(fēng)險組。采用R 語言“scatterplot”包進行PCA 分析探討不同風(fēng)險組的分布情況,采R 語言“survminer”包進行生存分析,采用“survival”R 包和“timeROC”R 包進行時間依賴性ROC 曲線分析,以評估預(yù)后特征的預(yù)測價值。此外,行單變量和多變量Cox 分析,以探討基因特征的獨立預(yù)后價值。
1.3 功能富集分析和基因富集分析 采R 語言對差異表達基因行京都基因與基因組分析(KEGG)和基因本體分析(GO)分析,使用R 語言“bioconductor”包行基因名和富集通路名稱的匹配,以差異基因表達譜為變量,以KEGG 和GO 分子特征和通路的表達譜為參考,同時計算logFC 值,P值根據(jù)BH 方法進行調(diào)整。使用“DOSE”“clusterProfiler”“pathview”“enrichplot”包進行KEGG 和GO 富集分析,使用R語言“digest”“GOplot”包進行基因和富集通路聯(lián)系分析,以logFC 值為表示兩者之間的關(guān)系度。
1.4 特征基因驗證 為了測試從TCGA 隊列構(gòu)建的模型穩(wěn)定性和胰腺癌生存狀態(tài)和時間的影響因素,GEO 數(shù)據(jù)庫中GDE57495 和GSE62452 的患者也根據(jù)TCGA 隊列的風(fēng)險系數(shù)取中間Cut-off 值分為高風(fēng)險組或低風(fēng)險組。
1.5 腫瘤微環(huán)境和免疫反應(yīng)分析 將200 個炎癥基因用R 語言“l(fā)imma”包進行數(shù)據(jù)矯正,使用R 語言“estimate”包給每個樣本行腫瘤環(huán)境、免疫環(huán)境、腫瘤純度進行評分,使用“pheatmap”繪制高、低風(fēng)險組在腫瘤免疫微環(huán)境的表達情況,使用R 語言“ggpubr”包分析高、低風(fēng)險組在不同腫瘤免疫微環(huán)境的表達差異。
1.6 生存預(yù)測列線圖的建立與評估 為了準(zhǔn)確預(yù)測1、2、3 年的總生存率(0S),通過整合年齡、性別、風(fēng)險分?jǐn)?shù)構(gòu)建預(yù)后列線圖,Harrell’s 一致性指數(shù)(C 指數(shù))評估預(yù)測準(zhǔn)確性,C 指數(shù)范圍從0.5(無預(yù)測能力)到1(完美預(yù)測)。校準(zhǔn)圖用于評估列線圖的性能特征。
1.7 數(shù)據(jù)分析 采用Wilcoxon 檢驗比較癌癥組織和正常組織之間的差異表達基因,采用Kaplan-Meier分析比較各組OS 差異。采用單變量和多變量Cox分析篩選OS 的獨立預(yù)測因子。使用estimate 包對各組腫瘤進行基質(zhì)細(xì)胞評分、免疫細(xì)胞評分、綜合評分(基質(zhì)細(xì)胞評分+免疫細(xì)胞評分)、腫瘤純度評分。R軟件(版本4.1.1)和軟件包ggplot2、igrph、pheatmap、ggpubr 和survminer 被用來創(chuàng)建平面圖。雙尾P值小于0.05 表示差異有統(tǒng)計學(xué)意義。
2.1 炎癥相關(guān)差異表達基因的識別 共得到29 個差異表達基因,見圖1A、1B。除HPN 基因在正常組織中表達高于腫瘤組織,其余基因在腫瘤組織表達均高于正常組織(P<0.05);單變量COX 分析顯示,17個基因與OS 相關(guān),MET 基因的風(fēng)險率為1.960(95%CI1.555~2.470,P<0.001),見圖1C、1D。
圖1 TCGA 和GTEx 數(shù)據(jù)序列中識別炎癥相關(guān)差異表達基因
2.2 炎癥相關(guān)基因預(yù)后模型的構(gòu)建 將差異基因用Lasso Cox 方法進行分析,構(gòu)建預(yù)后模型,根據(jù)最佳λ 值確定了6 個標(biāo)記基因(圖2A、2B),風(fēng)險分?jǐn)?shù)根據(jù)score=0.047×CXCL9 的基因表達量+0.028×LY6E的基因表達量+0.038×HBEGF 的基因表達量+0.524×MET 的基因表達量+0.096×CXCL10 的基因表達量+0.051×RTP4 的基因表達量進行計算,根據(jù)中間Cut-off 值劃分為高、低風(fēng)險組(圖2C);散點圖顯示,高風(fēng)險組患者比低風(fēng)險的患者預(yù)后差(圖2D);PCA 分析顯示,患者在高、低風(fēng)險組中可以被分為兩個不同方向(圖2E);Kaplan-Meier 曲線顯示,高風(fēng)險組總體生存率OS 低于低風(fēng)險組(P<0.05,圖2F);ROC 曲線分析顯示,曲線下面積(AUC)等于0.774,表明預(yù)后模型準(zhǔn)確性較高(圖2G)。使用GEO數(shù)據(jù)庫測試在TCGA 數(shù)據(jù)庫中構(gòu)建模型的穩(wěn)定性,從GEO數(shù)據(jù)庫抽取GSE57495、GSE62452 根據(jù)TCGA 數(shù)據(jù)風(fēng)險分?jǐn)?shù)的計算方法和中間值將患者劃分為高風(fēng)險組和低風(fēng)險組,得到的結(jié)果和TCGA 相類似(圖2I),PCA 將患者劃分為兩個方向的分布(圖2H),患者在高風(fēng)險組較低風(fēng)險組提前死亡(圖2J),并且相對低風(fēng)險組生存期更短(圖2K);此外,6個基因AUC 曲線是0.632(圖2L)。
圖2 6 個預(yù)后基因在GEO 和TCGA 預(yù)后模型的分析
2.3 胰腺癌的預(yù)后因素 單因素Cox 分析顯示,風(fēng)險評分和OS 相關(guān)(HR=3.19,95%CI=2.077~4.911,P<0.001);在糾正其它混合因素后,多因素Cox 分析顯示,風(fēng)險評分也和OS 相關(guān)(HR=3.302,95%CI=2.074~5.260,P<0.001);ROC 曲線分析顯示,風(fēng)險分?jǐn)?shù)具有良好預(yù)后預(yù)測準(zhǔn)確度,且PAAD 具有良好的預(yù)后價值,見圖3。
圖3 胰腺癌的預(yù)后因素
2.4 生物功能和通路富集分析 通過GO 富集分析顯示,29 個差異表達基因在PAAD 患者的生物進程(BP)主要在細(xì)胞趨化作用、細(xì)胞對脂多糖的反應(yīng)、細(xì)胞對細(xì)菌起源分子的反應(yīng)、細(xì)胞對生物刺激的反應(yīng)、骨髓白細(xì)胞游走等5 個進程占主導(dǎo)作用,癌癥細(xì)胞主要有膜錨定構(gòu)件、分泌顆粒膜、膜筏、膜微區(qū)等主要細(xì)胞組分(CC),分子功能(MF)主要是受體配體活動、信號受體激活物活性、細(xì)胞因子活性、G 蛋白偶聯(lián)受體結(jié)合等分子功能參與活動(圖4A)。通過KEGG 富集分析顯示,29 個差異表達基因主要參與細(xì)胞因子受體相互作用、病毒蛋白與細(xì)胞因子及細(xì)胞因子受體的相互作用生物功能及腫瘤壞死因子信號通路、趨化因子信號通路、Toll 樣受體信號通路(圖4B);同時,建立這些通路和基因之間的聯(lián)系(圖4C~圖4F)。
圖4 生物功能和富集通路分析
圖4 生物功能和富集通路分析(續(xù))
2.5 免疫活性和腫瘤微環(huán)境分析 低風(fēng)險組免疫通路較高風(fēng)險組更加活躍(圖5A),另低風(fēng)險組免疫評分、腫瘤評分和免疫及腫瘤微環(huán)境綜合評分高于高風(fēng)險組,相反腫瘤純度呈現(xiàn)相反趨勢,腫瘤純度從低風(fēng)險到高風(fēng)險組呈上升趨勢(Kruskal-Wallis test,P<0.01,圖5B~圖5E)。
圖5 免疫活性和腫瘤微環(huán)境
圖5 免疫活性和腫瘤微環(huán)境(續(xù))
2.6 建立列線圖對總生存率進行預(yù)測 在TCGA 數(shù)據(jù)中,基于年齡、性別、風(fēng)險分?jǐn)?shù)預(yù)后因素建立關(guān)于PAAD 患者總生存率的列線圖(圖6A),校準(zhǔn)圖進一步證實列線圖能夠較好的預(yù)測患者2、3 年的總體生存率,是一個較好的預(yù)測模型(圖6B、圖6C)。
圖6 列線圖的構(gòu)建
隨著精準(zhǔn)醫(yī)學(xué)和公共衛(wèi)生的發(fā)展,PAAD 得到了較好的治療以及控制,然而因為實用標(biāo)記物較少,現(xiàn)在仍然無法有效的進行早期診斷以及PAAD 患者治療評估。CA199 作為PAAD 中的一種診斷性腫瘤標(biāo)志物的作用已被證實,由于受到宿主炎癥反應(yīng)和梗阻性黃疸的干擾,從良性疾病中準(zhǔn)確診斷PAAD 的個體能力較低[10,11]。然而,作為PAAD 預(yù)后因子的炎癥反應(yīng)相關(guān)基因標(biāo)記物極少報導(dǎo)。既往研究表明[12-14],鐵死亡相關(guān)基因、免疫相關(guān)基因、m6A相關(guān)基因顯著影響PAAD 預(yù)后。本研究中構(gòu)建的炎癥反應(yīng)相關(guān)基因與上述基因相比具有更多優(yōu)勢,如本研究結(jié)合了GTEx 數(shù)據(jù)庫中更多的正常樣本,使得差異基因更加具有差異性,同時探索了免疫活性和腫瘤微環(huán)境在高、低風(fēng)險組的表達狀態(tài),并且構(gòu)建列線圖對2、3 年P(guān)AAD 總體生存率進行預(yù)測。
本研究建立的預(yù)后模型由6 個炎癥反應(yīng)相關(guān)差異表達基因組成(CXCL9、LY6E、HBEGF、MET、CXCL10、RTP4),這些基因在PAAD 中均上調(diào)。CXCL9、CXCL10 屬于趨化因子,與腫瘤微環(huán)境中免疫環(huán)境變化有關(guān),其中CXCL9 可以通過STAT3 信號通路影響CD8+T 細(xì)胞,CXCL9 表達量的提升會抑制CD8+T 細(xì)胞的抗腫瘤細(xì)胞因子的增殖、活化、分泌[15-17],而CXCL10 可以通過其受體CCR7 和CXCR3 促進PAAD 細(xì)胞的遷移[18],HBEGF 可以誘導(dǎo)EGFR 核轉(zhuǎn)位和組蛋白H4 甲基化,進而介導(dǎo)EGFR 的代謝激活,而EGFR 配體的轉(zhuǎn)錄上調(diào)引起EGFR 信號的傳導(dǎo),導(dǎo)致谷氨酰胺饑餓,從而促進體外胰腺腺泡細(xì)胞DNA 損傷的消退。在刺激YES 相關(guān)蛋白(YAP)的活性時,則影響PAAD 的生存預(yù)后[19-21]。RTP4 由Ⅰ型IFN(IFN-Ⅰ)誘導(dǎo),并與TANK 結(jié)合激酶(TBK1)復(fù)合物結(jié)合,通過干擾TBK1 和IFN 調(diào)節(jié)因子3 的表達和磷酸化來負(fù)調(diào)節(jié)TBK1 信號傳導(dǎo)[22]。本研究中通過對PAAD 預(yù)后模型的構(gòu)建,進一步驗證此6 個PAAD 相關(guān)炎癥基因可以作為PAAD 預(yù)測分子。
已有研究表明[23],Toll 樣受體(TLR)在炎癥和免疫反應(yīng)中起關(guān)鍵作用,其主要參與病原體相關(guān)分子模式(PAMP)和危險相關(guān)分子模式(DAMP)。本研究在免疫微環(huán)境分析中,高風(fēng)險組患者的免疫細(xì)胞浸潤、抗腫瘤免疫活動及兩者綜合活動均較多,表明高風(fēng)險組患者的免疫功能整體受損,免疫活動的增加可以解釋低風(fēng)險組患者具有良好的臨床結(jié)果,然而高風(fēng)險組的腫瘤純度高于低風(fēng)險組,這表明不良預(yù)后與腫瘤微環(huán)境無關(guān)。同時,有研究表明先天免疫系統(tǒng)由已經(jīng)存在于體內(nèi)的免疫細(xì)胞組成,這些細(xì)胞可以立即被招募到感染部位。天然免疫細(xì)胞包括粒細(xì)胞、巨噬細(xì)胞、肥大細(xì)胞、自然殺傷細(xì)胞(NK)和樹突狀細(xì)胞(DC)。中性粒細(xì)胞通常會觸發(fā)對炎癥的快速反應(yīng)并分泌細(xì)胞因子,而成熟后,巨噬細(xì)胞可以分化為M1 和M2 極化細(xì)胞,進而抑制炎癥反應(yīng)和促進腫瘤的生長[24],這同本研究中低風(fēng)險人群在免疫浸潤活動是一致的。
綜上所述,炎癥反應(yīng)相關(guān)基因的預(yù)后特征是預(yù)測PAAD 患者預(yù)后的良好工具,但仍需要進一步的研究證實。