王俊軼 魯璐 何翔 馬麗娟 陳濤 李國平 于海杰
特發(fā)性肺纖維化(idiopathic pulmonary fibrosis, IPF)是一種原因不明的慢性、進行性間質(zhì)性肺疾病。在特發(fā)性間質(zhì)性肺炎中,IPF發(fā)病率最高,且仍在攀升[1]。IPF患者的生活質(zhì)量顯著下降,預(yù)后差,中位生存時間為3-5年[2,3]。IPF的典型臨床病理特征為肺成纖維細胞活化,細胞外基質(zhì)(extracellular matrix, ECM)過度積累,進而導(dǎo)致肺結(jié)構(gòu)的不可逆損傷,最終因氣體交換障礙而引起呼吸衰竭。
更令人擔(dān)憂的是,IPF與患肺癌的風(fēng)險增加相關(guān)。IPF患者肺癌風(fēng)險相較正常人群增高5倍[4]。流行病學(xué)數(shù)據(jù)[5]顯示IPF患者肺癌的發(fā)病率介于3%-22%,極端情況下甚至超過50%。值得注意的是,IPF患者的肺腫瘤往往首先出現(xiàn)在纖維化區(qū)域,推測這兩種疾病之間可能存在共同的致病機制和分子通路。同時,與非IPF相關(guān)的肺癌相比,IPF相關(guān)肺癌在組織學(xué)分布和免疫組化特征上均表現(xiàn)出明顯不同[4],引發(fā)了關(guān)于如何更有效地治療和管理IPF合并肺癌患者的思考。因此,揭示IPF和肺腫瘤之間的共同致病機制,并由此探索潛在靶向分子,可使我們更好地理解IPF增加肺癌風(fēng)險的分子機制,掌握IPF的演進和轉(zhuǎn)歸,對IPF基礎(chǔ)上肺腫瘤新治療手段的開發(fā)和個性化精準(zhǔn)治療策略的制定具有重要意義。
1.1 數(shù)據(jù)收集和處理 IPF(GSE150910、GSE53845和GSE32537)和肺腺癌(lung adenocarcinoma, LUAD)(GSE32863和GSE68465)數(shù)據(jù)集從基因表達綜合(Gene Expression Omnibus, GEO)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)獲取。其中,GSE150910數(shù)據(jù)集包括103例IPF和103例對照肺組織的RNA測序數(shù)據(jù)。GSE53845數(shù)據(jù)集包含40例IPF患者和8例對照組織的基因表達芯片數(shù)據(jù)。GSE32537包括119例IPF和50例對照肺組織的基因表達芯片數(shù)據(jù)。GSE32863數(shù)據(jù)集包括58例LUAD樣本和58例正常鄰近組織樣本的RNA測序數(shù)據(jù)。GSE68465數(shù)據(jù)集包含433例LUAD樣本和19例對照組織的基因表達芯片數(shù)據(jù)。此外,我們從Code Ocean平臺(https://codeocean.com/capsule/8321305/tree)下載了6例LAUD初治手術(shù)患者腫瘤組織及其配對正常肺實質(zhì)組織共12個樣本的單細胞RNA測序數(shù)據(jù)[6]。
1.2 加權(quán)基因共表達網(wǎng)絡(luò)分析(weighted gene co-expression network analysis, WGCNA) WGCNA是一種廣泛應(yīng)用于分析大規(guī)模數(shù)據(jù)集的方法,可以識別與疾病進展密切相關(guān)的一組基因。本研究使用R包“WGCNA”(1.72-1)通過hclust()聚類,轉(zhuǎn)換鄰接矩陣(softPower=4),TOM矩陣TOMsimilarity()、cutreeDynamic()識別動態(tài)剪切模塊、mergeCloseModules()合并相似模塊等構(gòu)建基因共表達網(wǎng)絡(luò)[7]。
1.3 鑒定IPF和LUAD之間共享的基因 本研究使用Venny 2.1.0獲得模組間的交集基因。隨后使用STRING數(shù)據(jù)庫(https://string-db.org/)構(gòu)建了蛋白質(zhì)相互作用(proteinprotein interaction, PPI)網(wǎng)絡(luò)。
1.4 功能富集分析 PPI網(wǎng)絡(luò)的功能富集使用Cytoscape軟件ClueGO插件進行,余下差異基因使用R包“clusterProfiler(4.8.3)”[8]進行富集分析。
1.5 差異表達基因分析 主成分分析(principal component analysis, PCA)質(zhì)控樣本后,使用R中的“l(fā)imma(3.56.2)”包[9]進行標(biāo)準(zhǔn)化校正和差異表達基因分析。GSE68465中,閾值為|log2 fold change|≥2和P<0.05。而在GSE53845中,為|log2 fold change|≥1和P<0.05。最后利用Venny 2.1.0進行交集分析。
1.6 基于基因表達水平值的交互式分析(gene expression profiling interactive Analysis, GEPIA)數(shù)據(jù)庫 GEPIA數(shù)據(jù)庫收集了來自癌癥基因組圖譜計劃(The Cancer Genome Atlas,TCGA)和基因型-組織表達(Genotype-Tissue Expression,GTEx)數(shù)據(jù)集的9736個腫瘤組織和8587個正常組織的RNA測序數(shù)據(jù),本研究使用GEPIA數(shù)據(jù)庫1.0版本(http://gepia.cancer-pku.cn/index.html)[10]中Expression DIY功能模塊評估TCGA-LUAD數(shù)據(jù)集SULF1的表達。
1.7 阿拉巴馬大學(xué)癌癥數(shù)據(jù)分析(The University of ALabama at Birmingham CANcer data analysis Portal, UALCAN)數(shù)據(jù)庫 本研究使用UALCAN數(shù)據(jù)庫(http://ualcan.path.uab.edu/)[11](更新于2022-08-16),使用TCGA功能模塊分析TCGA轉(zhuǎn)錄組學(xué)數(shù)據(jù)集中LUAD的SULF1表達及其與組織類型、性別、年齡、腫瘤分期、淋巴結(jié)轉(zhuǎn)移狀態(tài)、TP53突變狀態(tài)和啟動子甲基化水平等多種臨床病理參數(shù)的關(guān)聯(lián)。使用Proteomics功能模塊分析臨床蛋白質(zhì)組腫瘤分析協(xié)作組(Clinical Proteomic Tumor Analysis Consortium, CPTAC)數(shù)據(jù)集中LUAD的SULF1蛋白表達。
1.8Kaplan-Meier生存分析 使用KM Plotter(http://kmplot.com)[12](更新于2023-04-18)的Start KM Plotter for lung cancer功能模塊通過患者SULF1表達中位數(shù)分層評估在LUAD中的預(yù)后價值。
1.9 受試者工作特征曲線分析 受試者工作特征(receiver operator characteristic, ROC)曲線分析使用R包“pROC(1.18.4)”完成。
1.10 腫瘤免疫治療多組學(xué)綜合分析(Comprehensive Analysis on Multi-Omics of Immunotherapy in Pan-cancer,CAMOIP)數(shù)據(jù)庫 使用CAMOIP數(shù)據(jù)庫(http://camoip.net/)[13](更新于2022-04-11)中的TCGA-LUAD數(shù)據(jù),以患者SULF1表達高低分組,通過Mutational Landscape功能模塊進行基因突變譜分析,Immune Infiltration功能模塊進行免疫浸潤分析,Immunogenicity功能模塊進行免疫原性分析,Pathway Enrichment功能模塊進行基因集富集分析。
1.11 單細胞RNA測序數(shù)據(jù)分析 使用R包“Seurat(4.0)”篩選高質(zhì)量細胞(500 to 7500 genes, 1000 to 50,000 UMIs, mitochondria content less than 30%, and HB less than 5%)[14]?!癗ormalizeData”函數(shù)進行數(shù)據(jù)歸一化,并通過“FindVariableFeatures”函數(shù)識別高變基因。“FindIntegrationAnchors”和“IntegrateData”函數(shù)整合數(shù)據(jù),“FindClusters”進行主成分分析和聚類(30 PCs/resolution: 0.8)。使用“RunTSNE”或“RunUMAP”函數(shù)降維。使用“FindMarkers”和“FindAllMarkers”函數(shù)分析細胞亞群之間的差異表達基因(min.pct=0.3, logfc.threshold=0.25)[15]。
1.12 藥物敏感性分析 從CellMiner(https://discover.nci.nih.gov/cellminer/home.do)數(shù)據(jù)庫中獲取基因表達譜數(shù)據(jù)和美國國家癌癥研究所60個人類腫瘤細胞系抗癌藥物篩選化合物數(shù)據(jù)。本研究納入了CellMiner數(shù)據(jù)庫中75種經(jīng)過臨床試驗和188種經(jīng)過美國食品藥品監(jiān)督管理局(Food and Drug Administration, FDA)批準(zhǔn)的共263個藥物,使用“impute(1.74.1)”“l(fā)imma”“ggplot2(3.4.3)”和“ggpubr(0.6.0)”等R包,通過Pearson算法,以P<0.05和|cor|>0.3為閾值,分析SULF1基因?qū)λ幬锩舾行缘挠绊慬16]。
1.13 免疫治療反應(yīng)的預(yù)測 使用腫瘤免疫功能障礙和排除(tumor immune dysfunction and exclusion, TIDE)算法[17]預(yù)測高/低SULF1表達的LUAD患者的潛在免疫治療反應(yīng)。
1.14 候選靶向化合物的篩選 基于單細胞RNA測序分析中SULF1高表達成纖維細胞的差異表達基因,通過Enrichr平臺(https://amp.pharm.mssm.edu/Enrichr/)Disease/Drug功能模塊中的DSigDB數(shù)據(jù)庫篩選藥物分子[18]?;衔锖Y選閾值為P<0.05,并使用Appyters功能模塊繪制火山圖。
1.15 統(tǒng)計學(xué)處理 使用R軟件進行統(tǒng)計數(shù)據(jù)分析,使用Wilcoxon檢驗分析方法,P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 IPF和LUAD中加權(quán)基因共表達模組的鑒定 本研究鑒定出25個與IPF發(fā)生密切相關(guān)的基因模組,其中9個模組與IPF發(fā)生顯著相關(guān)[black (cor=0.41,P=1e-09), light green(cor=0.41,P=2e-09), saddle brown (cor=0.28,P=5e-05), dark gray (cor=0.63,P=8e-24), dark turquoise (cor=0.58,P=1e-19),dark orange (cor=0.4,P=3e-09), salmon (cor=0.28,P=5e-05),blue (cor=0.24,P=6e-04), and turquoise (cor=0.47,P=2e-12)](圖1A,圖1B)。同時,鑒定出20個與LUAD密切相關(guān)的基因模組,其中8個模組與LUAD發(fā)生顯著相關(guān)[dark green (cor=0.24,P=0.009), tan (cor=0.33,P=3e-04), magenta(cor=0.56,P=2e-10), midnight blue (cor=0.6,P=3e-12), blue(cor=0.68,P=1e-16), green (cor=0.95,P=7e-60), royal blue(cor=0.26,P=0.005), and green yellow (cor=0.41,P=6e-06)](圖1C,圖1D)。在考慮基因數(shù)量和相關(guān)程度后,我們最終選擇了IPF相關(guān)的dark gray模組(圖1E)和dark turquoise模組(圖1F),以及LUAD相關(guān)的green模組(圖1G)和blue模組(圖1H)進一步研究。
圖1 IPF和LUAD中加權(quán)基因共表達模組的鑒定。A:IPF中共表達基因的聚類樹狀圖;B:IPF中模組-特征關(guān)系的熱圖;C:LUAD中共表達基因的聚類樹狀圖;D:LUAD中模組-特征關(guān)系的熱圖;E-H:選定模組中基因的顯著性和模組成員的散點圖。Fig 1 Identification of weighted gene coexpression modules in IPF and LUAD. A:Cluster dendrogram of co-expressed genes in IPF; B: Heatmap of module-trait relationships in IPF; C:Cluster dendrogram of co-expressed genes in LUAD; D: Heatmap of module-trait relationships in LUAD;E-H: Dot plots showing gene significance and module membership in selected modules.Ctrl: control; IPF:idiopathic pulmonary fibrosis; LUAD: lung enocarcinoma.
2.2 IPF和LUAD中共同致病基因的鑒定和功能分析 通過對4個目標(biāo)模組基因取交集,獲得529個共同基因(圖2A)。隨后,為了探索這些共同基因參與的調(diào)控通路,我們構(gòu)建PPI網(wǎng)絡(luò)(圖2B),并進行功能富集分析。GO分析顯示出肺部重塑相關(guān)進程的顯著富集,包括膠原纖維組織過程、ECM組織、上皮間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition, EMT)調(diào)控、血管運輸和肌肉收縮等(圖2C)。同時還觀察到了與炎細胞相關(guān)的調(diào)節(jié)通路,如白細胞滾動、細胞間黏附和磷酸肌醇-3激酶(phosphoinositide 3-kinases, PI3K)信號傳導(dǎo)。此外,京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析(圖2D)顯示出與ECM組織、傷口愈合、肌肉收縮、Wnt信號以及血小板激活/信號傳導(dǎo)/聚集有關(guān)的通路富集。
圖2 IPF和LUAD中共同基因的鑒定和功能分析。A:四個選定模組之間交集基因的Venn圖;B:共同基因的蛋白相互作用網(wǎng)絡(luò);C:GO富集途徑的網(wǎng)絡(luò)圖(Cytoscape/ClueGO);D:KEGG富集途徑的網(wǎng)絡(luò)圖(Cytoscape/ClueGO)。Fig 2 Identification and functional analysis of shared genes in IPF and LUAD. A: Venn diagram of the shared genes between the four selected modules; B: PPI network of the shared genes; C: Network plot showing the GO enrichment pathways; D: Network plot showing the KEGG enrichment pathways. PPI: protein-protein interaction; GO: Gene Ontology; KEGG: Kyoto Encyclopedia of Genes and Genomes.
2.3 核心共同致病基因SULF1通過對額外的IPF和LUAD數(shù)據(jù)集進行差異表達基因(differential expressed genes,DEGs)分析(圖3A,圖3B),我們將DEGs與上一步得到的共同基因取交集獲得的基因定義為核心共同致病基因,共14個(CDH2、CFH、COL10A1、COL1A1、COL3A1、COMP、CPA3、CXCL14、IGF1、PDLIM3、POSTN、SFRP4、SRPX、SULF1)(圖3C)。我們對上述14個基因進行了生存分析,發(fā)現(xiàn)高表達COL1A1(圖3D,圖3E)、COL3A1(圖3F,圖3G)或SULF1(圖3H,圖3I)的LAUD患者總生存期(overall survival, OS)和無進展生存期(progression-free survival, PFS)均顯著縮短??紤]到SULF1在LAUD中的作用尚不十分清晰,我們將SULF1作為進一步研究目標(biāo)。使用GEPIA和UALCAN數(shù)據(jù)庫分析發(fā)現(xiàn)LUAD中SULF1的mRNA表達水平顯著高于正常肺組織(圖3J,圖3K)。進一步分析顯示,與對照組相比,無論是男性還是女性,腫瘤樣本中SULF1的表達均顯著上調(diào)(圖3L)。SULF1的表達在40歲以上LUAD患者(41-60歲組、61-80歲組和81-100歲組)均顯著上調(diào),而在21-40歲組中變化沒有統(tǒng)計學(xué)意義(圖3M)。我們還觀察到在LUAD的所有分期(I、II、III和IV期)和淋巴結(jié)轉(zhuǎn)移程度(N0、N1、N2或N3)中,SULF1表達均顯著增加(圖3N,圖3O)。此外,TP53突變型和野生型LUAD患者的SULF1表達均高于對照組,并且TP53突變型患者SULF1水平顯著高于野生型患者(圖3P)。而SULF1的啟動子甲基化水平在LUAD患者中出現(xiàn)顯著下降(圖3Q)。為了驗證SULF1的蛋白表達,我們進一步對CPTAC數(shù)據(jù)庫中的蛋白組學(xué)數(shù)據(jù)進行了分析。同樣地,與對照組相比,LUAD組織中SULF1蛋白表達顯著升高(圖3R)。有趣的是,男性患者的SULF1蛋白表達明顯高于女性(圖3S)。對于IPF,通過另一個數(shù)據(jù)集(GSE32537)進行驗證,同樣發(fā)現(xiàn)SULF1的表達在IPF患者中相比對照組顯著上調(diào)(圖3T)。為了評估SULF1對IPF的診斷效能,我們構(gòu)建了ROC曲線并計算了曲線下面積(area under the curve,AUC)。結(jié)果顯示SULF1具有較好的(AUC值=0.948)診斷潛力(圖3U)。
圖3 SULF1作為核心共同基因的鑒定。A:IPF數(shù)據(jù)集中差異表達基因的火山圖;B:LUAD數(shù)據(jù)集中差異表達基因的火山圖;C:在WGCNA共同基因和額外數(shù)據(jù)集DEGs中鑒別核心共同基因的Venn圖;D-I:利用Kaplan-Meier繪圖描繪OS和PFS的生存曲線;J:在GEPIA數(shù)據(jù)庫中比較LUAD與正常組織中的SULF1表達;K-P:利用UALCAN數(shù)據(jù)庫根據(jù)臨床參數(shù)將不同組別的患者的SULF1表達進行比較;Q:基于UALCAN數(shù)據(jù)庫的SULF1啟動子甲基化情況;R,S:利用UALCAN數(shù)據(jù)庫根據(jù)臨床參數(shù)將不同組別的患者的SULF1蛋白表達進行比較;T:在GSE32537數(shù)據(jù)集中比較IPF與對照組織中SULF1表達;U:IPF中SULF1表達的ROC曲線分析。*P<0.05;**P<0.01;***P<0.001;****P<0.0001。Fig 3 Identification of SULF1 as a core shared gene. A: Volcano map of the DEGs in IPF dataset;B: Volcano map of the DEGs in LUAD dataset; C: Venn diagram of the core shared genes between the shared genes identified in WGCNA and DEGS of the additional datasets; D-I: Survival curves using the Kaplan-Meier plotter are shown for OS and PFS; J: Expression of SULF1 in LUAD compared to normal tissues in the GEPIA database;K-P: SULF1 expression among different groups of patients based on clinical parameters using the UALCAN database; Q: Promoter methylation of SULF1 based on the UALCAN database; R, S: SULF1 protein expression among different groups of patients based on clinical parameters using the UALCAN database; T: Expression of SULF1 in IPF lungs compared to control tissues in GSE32537 dataset; U: ROC curve analysis of SULF1 expression in IPF. DEGs: differentially expressed genes; OS: overall survival; PFS: progression-free survival; ROC: receiver operator characteristic. *P<0.05; **P<0.01;***P<0.001; ****P<0.0001.
2.4SULF1表達與LUAD遺傳特征分析 為了探究SULF1表達對LUAD遺傳特征的影響,我們比較了高和低SULF1表達LUAD患者之間的基因突變譜(圖4A)。高SULF1表達組在TP53、TTN、CSMD3、LRP1B、COL11A1、PCLO、ADAMTS12和KEAP1基因中的突變頻率顯著升高。此外,高SULF1表達組還顯示出更高的非整倍體水平(圖4B)和腫瘤突變負荷(tumor mutational burden, TMB)評分(圖4C)。DNA損傷修復(fù)分析顯示高SULF1表達的樣本具有更高的同源重組修復(fù)缺陷(homologous recombination deficiency, HRD)(圖4D)和腫瘤內(nèi)異質(zhì)性(圖4E)評分,而在腫瘤微衛(wèi)星不穩(wěn)定性評分(圖4F)方面,高和低SULF1表達組之間沒有發(fā)現(xiàn)顯著差異。
圖4 基于SULF1表達水平分層的LUAD的遺傳特征。A:展示LUAD高表達和低表達SULF1組之間基因突變的瀑布圖;B-F:比較LUAD高表達和低表達SULF1組之間的評分。*P<0.05;**P<0.01;****P<0.0001。Fig 4 Genetic profiles of LUAD stratified by SULF1 expression levels. A: Waterfall plot showing the gene mutation profiles between high and low SULF1 expression groups of LUAD; B-F: Comparison of selected scores between SULF1-high and SULF1-low groups of LUAD. *P<0.05; **P<0.01;****P<0.0001. ns: not significant.
2.5SULF1與LUAD腫瘤微環(huán)境分析 MCPcounter算法顯示高SULF1表達患者具有多種免疫細胞的浸潤,包括總T細胞、CD8+T細胞、細胞毒性淋巴細胞、B細胞系、自然殺傷(natural killer, NK)細胞、單核細胞系,尤其是成纖維細胞顯著增加,然而其中性粒細胞浸潤減少(圖5A)。抑制性免疫檢查點表達分析中(圖5B),高SULF1表達的LUAD患者多種抑制性免疫檢查點顯著上調(diào),包括HAVCR2、TIGIT、LAG3、IDO、ADORA2A、CD276、CD274、PDCD1、PDCD1LG2、CD28、CTLA4和BTLA。此外,通過GSEA分析,我們發(fā)現(xiàn)高SULF1表達組在多個與免疫相關(guān)的通路中富集(圖5C),如趨化因子信號傳導(dǎo)、白細胞遷移以及B細胞和NK細胞等免疫細胞介導(dǎo)的免疫,這與我們從免疫浸潤分析中觀察到的結(jié)果一致。有趣的是,高SULF1表達組還富集于T細胞免疫負調(diào)節(jié)、耐受誘導(dǎo)和抑制性細胞因子信號(白介素-10)以及M2細胞因子(白介素-4和白介素-13)信號,這與我們關(guān)于抑制性免疫檢查點的分析結(jié)果一致。此外,高SULF1表達組在與ECM組織和血管生成相關(guān)的通路中也顯著富集,表明其在腫瘤生長和轉(zhuǎn)移中的潛在作用。
圖5 SULF1與LUAD中的腫瘤微環(huán)境。A:高表達組與低表達組之間免疫細胞浸潤模式的箱線圖;B:高SULF1和低SULF1組LUAD中免疫檢查點抑制劑的表達;C:高表達和低表達SULF1組LUAD中差異通路的氣泡圖。**P<0.01;***P<0.001;****P<0.0001。Fig 5 SULF1 and the tumor microenvironment in LUAD. A: Box plots showing the immune cell infiltration patterns between high and low expression groups; B: Expression of immune checkpoint inhibitors between SULF1-high and SULF1-low groups of LUAD; C: Bubble plot showing the differential pathway profiles between the high and low SULF1 expression groups of LUAD. **P<0.01; ***P<0.001; ****P<0.0001.
2.6 在單細胞水平上分析LUAD中的SULF1表達 質(zhì)控后共65,722個細胞(36,597個細胞來自LUAD樣本和29,125個細胞來自對照組)納入分析,聚類為24個細胞亞群(圖6A)?;诮?jīng)典標(biāo)記物(圖6B),我們鑒定出15種主要細胞類型,包括T細胞(CD3E、IL7R)、巨噬細胞(MARCO、APOC1)、肺泡上皮細胞(EPCAM、SFTPB)、B細胞(MS4A1、CD19)、NK細胞(NKG7、KLRD1)、髓樣樹突狀細胞(CD1C、FCER1A)、中性粒細胞(S100A12、S100A9)、纖毛細胞(FOXJ1、CAPS)、內(nèi)皮細胞(VWF、PECAM1)、細支氣管外分泌細胞(SCGB1A1、MUC5B)、肥大細胞(GATA2、CPA3)、成纖維細胞(PDGFRA、LUM)、漿細胞(IGKC、IGHG1)、單核細胞(FCN1、CSF1R)和漿細胞樣樹突狀細胞(LILRA4、IL3RA)(圖6C)。LUAD樣本中SULF1表達顯著上調(diào)(圖6D),驗證了前述的研究結(jié)果。隨后的分析發(fā)現(xiàn)SULF1主要由成纖維細胞表達,且來自LUAD的成纖維細胞的表達水平高于對照組(圖6E、圖6F)。我們進一步提取了成纖維細胞進行亞群分析,并以1為表達量閾值將其分類為SULF1高表達成纖維細胞或SULF1低表達成纖維細胞。在LUAD中,SULF1高表達成纖維細胞數(shù)量顯著多于對照組(圖6G)。此外,在SULF1高和低表達的成纖維細胞之間進行的差異基因分析鑒定出118個DEGs。這些DEGs的富集分析顯示它們參與了與B細胞分化調(diào)節(jié)、白細胞遷移和黏附、趨化因子信號傳導(dǎo)、T細胞受體信號傳導(dǎo)調(diào)控、ECM組織、傷口愈合和血管生成有關(guān)的通路(圖6H)。這些發(fā)現(xiàn)與我們從TCGA數(shù)據(jù)集中高SULF1表達樣本獲得的富集結(jié)果相符。
2.7SULF1表達的藥物敏感性分析 通過CellMiner數(shù)據(jù)庫分析,我們觀察到SULF1表達與LY-2606368、MPC-3100、Pelitrexol isomer A、B-7100、Pelitrexol isomer B、Malacid、Karenitecin、Methotrexate、Amonafide和Luminespib等藥物的敏感性呈負相關(guān)(圖7A)。與之相反地,SULF1表達與Caffeic acid、Zoledronate、HPI-1、Motesanib、IDH-C227、BMS-911543、PRN-1371、ZSTK-474、P-529和SAR-245409等藥物的敏感性呈正相關(guān)(圖7A)。此外, LUAD患者中高SULF1表達與更高的TIDE得分有關(guān)(圖7B),表明其可能對免疫治療的敏感性降低。最后,為了進一步篩查可能靶向SULF1高表達成纖維細胞的潛在化合物,我們使用在單細胞分析中鑒定出的118個DEGs在DSigDB數(shù)據(jù)庫進行了富集分析(圖7C),結(jié)果顯示出Laminin、Clonidine、Loxapine、Vanadium pentoxide、Lomustine、Deptropine、N-Acetyl-L-cysteine、Acetaldehyde、Arsenenous acid和ACMC-20mvek等的化合物有潛力成為靶向SULF1高表達成纖維細胞的小分子藥物。
圖7 與SULF1相關(guān)的藥物敏感性分析。A:利用CellMiner數(shù)據(jù)庫對SULF1的藥物敏感性分析;B:LUAD中高SULF1組和低SULF1組之間的TIDE評分的箱線圖;C:基于Enrichr中DSigDB庫的潛在小分子候選藥物的火山圖。****P<0.0001。Fig 7 Analysis of drug sensitivity associated with SULF1. A: Drug sensitivity analysis of SULF1 using the CellMine database; B: Box plow displaying the TIDE score between SULF1-high and SULF1-low groups of LUAD; C: Volcano map of potential small molecule candidates for SULF1-high fibroblasts based on DSigDB library in Enrichr. ****P<0.0001.
揭示IPF和LUAD之間的共同致病機制,找出肺纖維化增加肺癌風(fēng)險的分子基礎(chǔ)線索,并在此基礎(chǔ)上探索潛在干預(yù)靶點,對于IPF合并肺癌的新藥開發(fā)和個體化治療具有重要意義?,F(xiàn)有的研究[4]發(fā)現(xiàn)IPF和肺癌都表現(xiàn)出一些主要信號轉(zhuǎn)導(dǎo)途徑的異常激活。Wnt通路在IPF患者肺組織中過度激活,下游轉(zhuǎn)化生長因子-β(transforming growth factor-β, TGF-β)信號失調(diào)[1]。Wnt途徑的失調(diào)促進腫瘤進程中上皮化生、ECM沉積和EMT過程[19]。TGF-β1可激活細胞外信號調(diào)節(jié)蛋白激酶1和2,進而激活PI3K通路[20]。研究[21]顯示PI3K信號通路的失調(diào)與纖維增生性疾病和腫瘤侵襲均密切相關(guān)。此外,酪氨酸激酶信號傳導(dǎo)參與的細胞生長、分化、黏附和血管生成等關(guān)鍵調(diào)節(jié)途徑,已被證實與纖維化和腫瘤的發(fā)生發(fā)展有關(guān)[22]。本研究通過對公共轉(zhuǎn)錄組學(xué)數(shù)據(jù)集進行WGCNA分析,鑒定出529個基因可能共同參與IPF和LUAD的發(fā)病。進一步的PPI和功能富集分析揭示了這些共同致病基因參與的生物學(xué)進程和信號通路,包括ECM組織、EMT、血管運輸、肌肉收縮、傷口愈合、Wnt信號傳導(dǎo)和PI3K信號轉(zhuǎn)導(dǎo),與之前的研究相符。同時,我們的分析還顯示白細胞滾動和細胞黏附通路的富集,均是免疫應(yīng)答和腫瘤進展的關(guān)鍵病理過程。這一發(fā)現(xiàn)與之前的研究[23,24]一致,反映這些通路在促進白細胞遷移到腫瘤微環(huán)境中,進而影響腫瘤生長、侵襲和轉(zhuǎn)移方面的重要性。有趣的是,我們還發(fā)現(xiàn)共同致病基因在血小板激活、信號傳導(dǎo)和聚集相關(guān)通路富集。IPF中血小板源性因子失調(diào)可引起纖維化進展[25]。同時這條通路在腫瘤發(fā)生發(fā)展的各個方面也發(fā)揮重要作用,如腫瘤細胞增殖、血管生成、免疫抑制,以及形成圍繞腫瘤細胞的血小板“保護傘”,從而保護腫瘤躲避免疫識別,促進其轉(zhuǎn)移[26]。此外,我們將529個共同基因與GSE53845和GSE68465中的差異表達基因進行了交集,篩選出IPF和LUAD之間的核心共同致病基因,包括CDH2、CFH、COL10A1、COL1A1、COL3A1、COMP、CPA3、CXCL14、IGF1、PDLIM3、POSTN、SFRP4、SRPX。與我們的結(jié)果部分類似的是,近期一項研究[27]也發(fā)現(xiàn)出7個IPF和LUAD共同基因,包括COL1A2、COL5A1、POSTN、CXCL13、CXCL14、CYP24A1和BMP2,并且具有良好的診斷價值。14個核心共同致病基因進一步生存分析[28]顯示,高表達COL1A1、COL3A1或SULF1的LAUD患者OS和PFS均顯著縮短。與之相符的是,Geng等[19]的分析發(fā)現(xiàn)COL1A1與肺癌免疫細胞浸潤和更短的OS和PFS高度相關(guān)。另一項研究[29]證實上調(diào)的COL3A1與更差的肺癌預(yù)后和順鉑抵抗相關(guān)??紤]到SULF1在LAUD中的作用尚不十分清楚,本研究將SULF1作為進一步研究目標(biāo)。
SULF1在ECM與細胞表面的相互作用中扮演重要角色[30]。早期研究[31]發(fā)現(xiàn),TGF-β1可以上調(diào)SULF1的表達,并成為TGF-β1誘導(dǎo)纖維化的負調(diào)節(jié)因子。然而,新近的研究[32]發(fā)現(xiàn),雖然SULF1起初可以保護細胞免受二氧化硅的損傷,但二氧化硅的長期暴露會通過SULF1上調(diào)增殖基因表達、增加膠原蛋白的產(chǎn)生和加劇纖維化。另一項近期研究[33]也支持SULF1促進纖維化,該研究發(fā)現(xiàn)敲減SULF1抑制了肌成纖維細胞激活并減少了膠原沉積,而過表達SULF1顯著促進了TGF-β誘導(dǎo)的肌成纖維細胞激活,并在一定程度上抵消了常山酮的抗纖維化作用。本研究也發(fā)現(xiàn)SULF1在IPF患者肺組織上調(diào),并對IPF具有較好的診斷價值。在腫瘤方面,早期的研究[34]觀察到各種癌細胞系中SULF1轉(zhuǎn)錄本普遍低表達,因此認為其在如卵巢癌、乳腺癌和肝癌等的腫瘤中具有抑癌功能。然后,后來的研究[35]在多種腫瘤組織中均證實了SULF1表達的增加。在膀胱上皮癌中,高SULF1表達與更高的原發(fā)腫瘤狀態(tài)與組織學(xué)分級以及更差的生存結(jié)果相關(guān)[36]。同樣地,在胃癌中高SULF1表達與更差的OS和免疫抑制性的M2巨噬細胞浸潤相關(guān)[37]。此外,近期的轉(zhuǎn)基因小鼠和體外實驗[38]進一步證實了SULF1促進肝癌進展和浸潤的能力。本研究中,我們發(fā)現(xiàn)LUAD患者中SULF1的轉(zhuǎn)錄水平和蛋白水平均顯著高于正常肺組織。進一步的分析揭示了SULF1表達與包括腫瘤分期、淋巴結(jié)轉(zhuǎn)移、TP53突變狀態(tài)和啟動子甲基化水平等臨床參數(shù)有關(guān)聯(lián)。此外,我們的研究還顯示了SULF1表達水平增加與較高的突變頻率以及TMB和HRD等基因組異質(zhì)性評分之間的正相關(guān)關(guān)系,這些異質(zhì)性被認為是影響腫瘤發(fā)生和進展的重要因素[39]。一項研究[40]發(fā)現(xiàn)敲減SULF1不僅抑制了非小細胞肺癌細胞的增殖、遷移和侵襲,還促進了細胞凋亡,這和我們的結(jié)果都支持SULF1在促進肺癌進展方面的作用。尤為重要的是,我們還發(fā)現(xiàn)高SULF1表達的LUAD患者的OS和PFS更短,顯示出SULF1在該疾病中的預(yù)后價值。
LAUD復(fù)雜的腫瘤微環(huán)境極大地影響著其預(yù)后。我們的分析發(fā)現(xiàn)SULF1高表達樣本中各種免疫細胞的富集明顯增加,包括B細胞、NK細胞、單核細胞和T細胞,尤其是CD8+細胞毒性T細胞。盡管存在顯著的免疫細胞浸潤,但更差的預(yù)后暗示了免疫功能抑制或受損的出現(xiàn),推測這可能是由于抑制性分子的表達及免疫耐受機制的激活。符合這一推斷的是,我們發(fā)現(xiàn)在高SULF1表達樣本中,抑制性免疫檢查點的表達顯著增加,例如HAVCR2、TIGHIT、LAG3、IDO、ADORA2A、CD276、CD274、PDCD1、PDCD1LG2、CD28、CTLA4和BTLA。并且,通過GSEA分析我們觀察到高SULF1腫瘤富集于T細胞免疫的負調(diào)節(jié)、耐受誘導(dǎo)、抑制性細胞因子信號傳導(dǎo)以及免疫抑制性M2細胞因子信號傳導(dǎo)等通路。這些結(jié)果進一步支持高表達SULF1的LUAD與抑制性微環(huán)境相關(guān),這可能阻礙了LUAD的抗腫瘤免疫反應(yīng)。此外,腫瘤相關(guān)成纖維細胞為腫瘤細胞的惡性擴張創(chuàng)造了有利的微環(huán)境[41]。與之相符的是,我們觀察到在高SULF1表達水平的樣本中,成纖維細胞浸潤評分顯著升高,同時與ECM組織和血管生成相關(guān)的通路顯著富集。這表明成纖維細胞可能通過這些通路促進腫瘤的生長和轉(zhuǎn)移。這些發(fā)現(xiàn)與一項頭頸鱗癌研究[42]一致,該研究顯示了SULF1在腫瘤組織的表達升高,并且主要來源于腫瘤相關(guān)成纖維細胞。我們的單細胞測序分析檢測到LUAD樣本中SULF1的表達較正常組織高,成纖維細胞為其主要表達來源,并且腫瘤相關(guān)的成纖維細胞中的SULF1水平顯著高于對照組織,進一步支持了以上結(jié)果。進一步對SULF1高表達和低表達成纖維細胞的分析顯示了與免疫調(diào)節(jié)、白細胞遷移、趨化因子信號傳導(dǎo)、ECM組織和血管生成途徑相關(guān)的通路富集,更加支持SULF1高表達成纖維細胞在塑造腫瘤微環(huán)境、促進免疫失調(diào)以及推動LUAD腫瘤進展方面的潛在作用。
尼達尼布已經(jīng)獲批非小細胞肺癌的二線治療,而吡非尼酮在非小細胞肺癌的臨床前研究中也表現(xiàn)出抗腫瘤活性[43,44]。因此,肺癌和IPF之間的共存性和部分機制的相似性為潛在藥物的進一步發(fā)現(xiàn)提供了線索。研究[45]已經(jīng)揭示了SULF1與卵巢癌細胞鉑類耐藥之間的相關(guān)性。下調(diào)SULF1降低順鉑誘導(dǎo)的細胞毒性,而CRISPR/Cas9篩選顯示ZNF587B和SULF1的缺乏促進了卵巢癌細胞系對順鉑耐藥[46]。本研究中,通過對CellMiner數(shù)據(jù)庫的分析表明,SULF1可能與LY-2606368、MPC-3100、Pelitrexol isomer A、B-7100、Pelitrexol isomer B、Malacid、Karenitecin、Methotrexate、Amonafide和Luminespib的藥物耐藥性相關(guān),同時可能增強Caffeic acid、Zoledronate、HPI-1、Motesanib、IDH-C227、BMS-911543、PRN-1371、ZSTK-474、P-529和SAR-245409在癌癥治療中的療效,這為IPF合并LUAD患者提供了新的治療可能性。此外,我們的研究還發(fā)現(xiàn),高SULF1表達的LUAD患者可能與對免疫治療失敗相關(guān),顯示出SULF1作為LUAD中預(yù)測免疫治療反應(yīng)的生物標(biāo)志物的潛力。最后,利用DSigDB庫,我們對具有靶向SULF1高表達成纖維細胞能力的多種化合物進行了篩選,有助于LUAD和IPF新精準(zhǔn)治療策略的發(fā)現(xiàn)。
本研究基于生物信息學(xué)分析,其結(jié)果有待進一步利用基礎(chǔ)和臨床實驗進行驗證。未來SULF1的機制研究有助于闡明其如何影響LUAD和IPF疾病進展,為SULF1作為潛在的生物標(biāo)志物及治療靶點提供理論基礎(chǔ)。
Competing interests
The authors declare that they have no competing interests.
Author contributions
Yu HJ, Li GP and Chen T conceived and designed the study.Wang JY, Lu L and He X analyzed the data. Ma LJ provided critical inputs on interpretation of the study. All authors had access to the data. All authors read and approved the final manuscript as submitted.