摘 要 目的:運(yùn)用生物信息學(xué)方法挖掘兒童呼吸道合胞病毒(RSV)的診斷標(biāo)志物,為RSV的靶向治療提供依據(jù)。方法:從GEO中獲得RSV的基因表達(dá)數(shù)據(jù)集。運(yùn)用差異表達(dá)分析、免疫浸潤分析、WGCNA和LASSO確定RSV的關(guān)鍵生物標(biāo)志物。同時(shí),繪制ROC曲線對關(guān)鍵基因的診斷性能進(jìn)行評估。結(jié)果:共識(shí)別出592個(gè)差異基因和10種差異浸潤的免疫細(xì)胞,例如中性粒細(xì)胞。WGCNA和LASSO分析篩選出7個(gè)關(guān)鍵的生物標(biāo)志物,包括ADM、LTF、UBE2J1、PDK4、S100A4、BST1、CAMP。此外,ROC曲線分析發(fā)現(xiàn)這些基因具有較高的診斷價(jià)值。結(jié)論:篩選的7個(gè)基因可作為RSV的診斷生物標(biāo)志物。
關(guān)鍵詞 呼吸道合胞病毒 診斷基因 中性粒細(xì)胞 加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
中圖分類號:R446.9; R725.1 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-1533(2024)19-0063-09
引用本文 董海麗, 王國勝, 谷雙龍, 等. 通過加權(quán)基因共表達(dá)網(wǎng)絡(luò)和LASSO分析識(shí)別兒童呼吸道合胞病毒的診斷基因[J]. 上海醫(yī)藥, 2024, 45(19): 63-71.
Identification of diagnostic genes related to respiratory syncytial virus in children based on WGCNA and LASSO algorithms
DONG Haili, WANG Guosheng, GU Shuanglong, SONG Nanping
(Department of Pediatrics, Zhengzhou 460 Hospital, Zhengzhou 450000, China)
ABSTRACT Objective: The diagnostic biomarkers of respiratory syncytial virus (RSV) in children were explored by bioinformatics analysis to provide basis for targeted therapy of RSV. Methods: Gene expression profiles of RSV were obtained from the GEO database. Differential expression analysis, immune infiltration analysis, WGCNA and LASSO were applied to identify the key biomarkers of RSV. Meanwhile, ROC curve was utilized to evaluate the diagnostic performance of key genes. Results: A total of 592 differentially expressed genes and 10 differential immune cells (such as neutrophils) were identified between RSV and healthy samples. Further, WGCNA and LASSO analysis screened out seven key biomarkers, including ADM, LTF, UBE2J1, PDK4, S100A4, BST1, and CAMP. In addition, ROC curve showed that these genes had high diagnostic value. Conclusion: The identified seven biomarkers may serve as diagnostic biomarkers for RSV.
KEY WORDS respiratory syncytial virus; diagnostic genes; neutrophils; weighted gene co-expression network analysis
呼吸道合胞病毒(respiratory syncytial virus,RSV)是全球兒童呼吸道感染的主要原因[1]。據(jù)統(tǒng)計(jì),每年有210萬5歲以下的兒童因RSV感染需要門診治療或住院,并且在全世界28 d至6個(gè)月的嬰兒中,RSV疾病的總死亡率負(fù)擔(dān)為1/28[2-3]。因此,迫切需要有效的RSV預(yù)防策略來解決這一重大公共衛(wèi)生問題和負(fù)擔(dān)。帕利珠單抗廣泛的用于預(yù)防嬰兒RSV疾病[4]。盡管其藥效已經(jīng)得到證實(shí),但是尚未引進(jìn)國內(nèi)臨床應(yīng)用[5]。迄今為止,RSV疫苗仍然處于開發(fā)階段。此外,診斷RSV感染的有效方法也十分有限。所以,了解RSV感染的分子發(fā)病機(jī)制對于指導(dǎo)未來的診斷和治療至關(guān)重要。目前,已有研究旨在尋找RSV的診斷標(biāo)志物,揭示其潛在的分子機(jī)制[6-7]。但是,識(shí)別RSV診斷生物標(biāo)志物的相關(guān)研究仍然缺乏。本研究利用一系列生物信息學(xué)分析旨在探討與RSV中免疫浸潤細(xì)胞相關(guān)的關(guān)鍵生物標(biāo)志物。本工作將有望為提高RSV患者的診斷以及治療靶點(diǎn)的開發(fā)提供幫助。
1 材料和方法
1.1 表達(dá)譜數(shù)據(jù)的收集和預(yù)處理
從NCBI GEO數(shù)據(jù)庫中下載6個(gè)兒童RSV芯片數(shù)據(jù)集,包括GSE188427、GSE105450、GSE103842、GSE103119、GSE80179、GSE77087。其中,GSE188427包括353個(gè)樣本,來自于51個(gè)健康志愿者和302個(gè)RSV患者的全血樣本,在本研究中作為訓(xùn)練集。其余數(shù)據(jù)集作為模型驗(yàn)證數(shù)據(jù)集。另外,使用R語言中的affy包對下載的數(shù)據(jù)進(jìn)行預(yù)處理,并使用rma函數(shù)進(jìn)行歸一化處理。
1.2 基因差異表達(dá)分析
通過limma包對健康和RSV患者中的基因進(jìn)行差異表達(dá)分析,計(jì)算基因相應(yīng)的P值和logFC值。同時(shí),利用FDR方法對P值進(jìn)行多重檢驗(yàn)校正,得到P-adjust(Benjamini-Hochberg校正)。差異表達(dá)基因(differential expressed genes,DEGs)的閾值為:P-adjust<0.05和|logFC|>1.2。
1.3 GSEA功能分析
為了探索疾病組和正常組之間的差異調(diào)節(jié)通路,使用GSEA(V4.3.2)對DEGs進(jìn)行功能富集分析,包括GO-BP、KEGG和Reactome。顯著富集的閾值為P-adjust<0.05。
1.4 免疫微環(huán)境分析
基于患者和對照樣本的基因表達(dá)數(shù)據(jù),利用CIBERSORT對樣本中22種免疫細(xì)胞的比例進(jìn)行計(jì)算。隨后,運(yùn)用Wilcox檢驗(yàn)比較了兩組間免疫細(xì)胞浸潤水平的差異。
1.5 WGCNA分析
使用WGCNA篩選與RSV有關(guān)的關(guān)鍵基因。通過篩選中位數(shù)絕對偏差(median absolute deviation,MAD)排名前75%且MAD值>0.01的基因進(jìn)行共表達(dá)分析(13 963個(gè)基因)。隨后,計(jì)算每個(gè)模塊與差異的免疫細(xì)胞浸潤程度之間的相關(guān)性。獲得與免疫細(xì)胞最相關(guān)的模塊后(又稱為hub模塊),將模塊基因與DEGs取交集,從而得到與免疫細(xì)胞浸潤相關(guān)的關(guān)鍵基因用于后續(xù)分析。
1.6 關(guān)鍵基因的功能富集分析
利用DAVID 2021對這些基因進(jìn)行GO功能和KEGG通路富集分析。選取P-adjust<0.05作為顯著富集的閾值。
1.7 診斷基因篩選
運(yùn)用R4.3.1語言中的glmnet包(V4.1-7)從關(guān)鍵基因中篩選診斷基因。首先,進(jìn)行單因素logistic回歸分析,選取P<0.05的基因進(jìn)行后續(xù)分析。接下來,利用LASSO分析來篩選RSV的診斷基因。LASSO回歸分析在R軟件中運(yùn)行10次K交叉驗(yàn)證,用于對包含的變量進(jìn)行居中和歸一化處理,然后選擇最佳的l值。
1.8 列線圖的構(gòu)建
通過rms包繪制包括診斷基因的列線圖來判斷RSV患病的風(fēng)險(xiǎn)率,并且繪制校正曲線來驗(yàn)證模型的準(zhǔn)確性。
1.9 外部數(shù)據(jù)集驗(yàn)證
在5個(gè)驗(yàn)證隊(duì)列中,對診斷基因在健康對照和RSV樣本中的表達(dá)水平進(jìn)行比較。隨后,利用pROC包繪制診斷基因的ROC曲線,通過計(jì)算AUC值評估基因的預(yù)測性能。
2 結(jié)果
2.1 DEGs篩選和GSEA富集分析
在RSV和對照中共篩選到592個(gè)DEGs,包括453個(gè)上調(diào)和139個(gè)下調(diào)基因。GSEA結(jié)果揭示這些基因主要富集在380個(gè)GO-BP類目,57個(gè)KEGG通路和149個(gè)Reactome通路。圖1展示了NES排名前5的結(jié)果。
2.2 RSV和健康對照患者呈現(xiàn)不同的免疫景觀
10種免疫細(xì)胞的浸潤水平在兩組中有顯著差異(圖2A和2B)。在RSV樣本中,活化樹突狀細(xì)胞(activated dendritic cells)、M0型巨噬細(xì)胞(M0 macrophages)、活化肥大細(xì)胞(activated mast cells)、中性粒細(xì)胞(neutrophils)、活化CD4記憶T細(xì)胞(activated T cells CD4 memory)的豐度遠(yuǎn)高于對照樣本,而native B細(xì)胞(native B cells)、嗜酸性粒細(xì)胞(eosinophils)、靜息肥大細(xì)胞(resting mast cells)、靜息自然殺傷細(xì)胞(resting NK cells)、天然CD4 T細(xì)胞(native T CD4 cells)的豐度低于對照樣本。
2.3 利用WGCNA識(shí)別關(guān)鍵模塊
如圖3A所示,當(dāng)軟閾值為6時(shí)(對應(yīng)的R2為0.75),滿足網(wǎng)絡(luò)的無標(biāo)度拓?fù)?,且平均連通性高。通過基因相關(guān)性構(gòu)建層次聚類樹狀圖,共識(shí)別出20個(gè)相似的基因模塊(圖3B)。隨后,以免疫浸潤程度作為表型,分析模塊特征值與10種差異免疫細(xì)胞之間的相關(guān)性。包含991個(gè)基因的“MEYellow”模塊與中性粒細(xì)胞具有較強(qiáng)的相關(guān)性,皮爾森相關(guān)系數(shù)為0.84(圖3C)。因此認(rèn)為“MEYellow”模塊為hub模塊,其中包含的基因用于后續(xù)分析。
2.4 RSV中關(guān)鍵差異基因的篩選和功能富集分析
將DEGs和“MEYellow”模塊基因整合,得到232個(gè)重疊的基因(圖4A)。對這些關(guān)鍵基因進(jìn)行功能富集分析。GO富集分析結(jié)果顯示,基因主要影響細(xì)胞因子產(chǎn)生的正向調(diào)節(jié)(positive regulation of cytokine production)(GO-BP)、分泌顆粒腔(secretory granule lumen)(GO-CC)、模式識(shí)別受體活性(pattern recognition receptor activity)(GO-MF)(圖4B~D)。KEGG通路分析發(fā)現(xiàn)基因在中性粒細(xì)胞胞外陷阱的形成(neutrophil extracellular trap formation)等通路中顯著富集(圖4E)。
2.5 RSV中診斷基因的鑒定
為了進(jìn)一步識(shí)別核心的診斷基因,基于lambda值進(jìn)行了LASSO回歸分析。共識(shí)別出7個(gè)RSV中最具代表性的診斷基因,包括ADM、LTF、UBE2J1、PDK4、S100A4、 BST1、CAMP(圖5A~C)。隨后,基于這7個(gè)診斷生物標(biāo)志物,建立了預(yù)測RSV的列線圖模型(圖5D)。校準(zhǔn)曲線顯示疾病的預(yù)測概率和實(shí)際發(fā)生概率之間的誤差很小,表明列線圖對RSV患者的預(yù)測準(zhǔn)確性較高(圖5E)。
2.6 生物標(biāo)志物的驗(yàn)證
利用5個(gè)外部驗(yàn)證數(shù)據(jù)集對7個(gè)特征基因的表達(dá)和診斷效能進(jìn)行驗(yàn)證(圖6)。與對照組相比,RSV組中7個(gè)基因的mRNA水平呈現(xiàn)上調(diào)趨勢,尤其是S100A4、CAMP、ADM、BST1(均P<0.05)。在5個(gè)數(shù)據(jù)集中,診斷基因聯(lián)合模型的AUC值均大于0.9,表明模型具有較高的分類性能。此外,還對每個(gè)基因進(jìn)行了ROC分析。在5個(gè)驗(yàn)證集中,ADM、UBE2J1、S100A4、BST1、CAMP的AUC值均大于0.7。這些結(jié)果表明篩選的特征標(biāo)志物在RSV中顯示出良好的診斷效能。
3 討論
有證據(jù)表明天然免疫應(yīng)答的不同組成部分參與RSV感染的控制,且適當(dāng)?shù)墓逃忻庖邞?yīng)答在RSV感染的消退中具有重要的作用[8-9]。所以,RSV的免疫病理學(xué)機(jī)制的研究有助于疫苗的研發(fā)。
本研究發(fā)現(xiàn)中性粒細(xì)胞在RSV中的浸潤水平顯著增加。已有研究報(bào)道了RSV感染與中性粒細(xì)胞之間的相關(guān)性。臨床研究發(fā)現(xiàn),RSV感染后,約80%浸潤的細(xì)胞是中性粒細(xì)胞,并且其強(qiáng)烈的內(nèi)流是RSV誘導(dǎo)的急性下呼吸道感染的氣道炎癥的常見特征[10-11]。另外,RSV感染中的中性粒細(xì)胞氣道炎癥會(huì)導(dǎo)致黏液生成過多、上皮損傷和氣道重塑,進(jìn)而引起肺功能損傷和肺部疾病[12]。因此,在RSV感染期間靶向中性粒細(xì)胞可能是改善患兒的不良肺部預(yù)后的潛在治療方法。后續(xù)的分析中,本研究重點(diǎn)關(guān)注了中性粒細(xì)胞相關(guān)的關(guān)鍵基因。
結(jié)合WGCNA和LASSO回歸分析,最終確定了7個(gè)具有診斷性能的生物標(biāo)志物,包括ADM、LTF、UBE2J1、PDK4、S100A4、BST1、CAMP。ROC分析發(fā)現(xiàn)這些基因均具有良好的診斷性能。氣道ADM的異常表達(dá)可能導(dǎo)致上皮和黏膜功能失調(diào),與哮喘的發(fā)生和發(fā)展有關(guān),并可能是預(yù)測社區(qū)獲得性肺炎死亡率的一個(gè)關(guān)鍵的生物標(biāo)志物[13-14]。UBE2J1在內(nèi)質(zhì)網(wǎng)上可降解錯(cuò)誤折疊的蛋白質(zhì),其過表達(dá)可增強(qiáng)登革熱病毒感染,并且該基因可通過影響泛素化過程在重癥COVID-19患者中起關(guān)鍵作用[15-16]。S100A4在炎癥過程中發(fā)揮重要作用。已有證據(jù)表明其與淋巴細(xì)胞計(jì)數(shù)呈正相關(guān),因此該基因參與哮喘氣道炎癥的發(fā)病機(jī)制[17]。BST1可抑制中性粒細(xì)胞通過內(nèi)皮層的浸潤,發(fā)揮抗炎特性[18]。CAMP(又稱為LL-37)具有抗菌、細(xì)胞趨化和炎癥反應(yīng)調(diào)節(jié)功能[19]。RSV感染后可誘導(dǎo)氣道上皮細(xì)胞表達(dá)LL-37,并且該基因可能是先天性宿主抵抗RSV感染的重要靶點(diǎn)[20]。LTF編碼的蛋白在中性粒細(xì)胞的次級顆粒中發(fā)現(xiàn),具有已知的抗病毒活性,包括RSV[21]。兒童膿毒癥心肌病患者的血清中PDK4水平顯著升高,并且與疾病的嚴(yán)重程度和器官損傷密切相關(guān)[22]??偠灾?,這些研究證實(shí)篩選出來的基因均與炎癥相關(guān)的疾病有關(guān),可間接或直接地參與RVS的發(fā)生。
本研究還發(fā)現(xiàn)基因主要富集在“中性粒細(xì)胞胞外陷阱的形成”通路中。在RSV患兒的氣道中觀察到大量的中性粒細(xì)胞募集,而激活的中性粒細(xì)胞可釋放中性粒細(xì)胞胞外誘捕網(wǎng)(neutrophil extracellular trap,NETs)[23]。研究發(fā)現(xiàn)NETs能夠捕獲RSV,從而阻止病毒顆粒與靶細(xì)胞結(jié)合,防止感染。然而,NETs的大量產(chǎn)生會(huì)阻塞氣道并損害肺功能,從而加重嬰幼兒感染的炎癥癥狀[24]。因此,必須嚴(yán)格調(diào)控NETs的形成[25]。然而,NETs在RVS感染下的有益和有害影響之間的界限仍未揭示,所以尋找一種靶向NETs及其相關(guān)蛋白的理想療法是亟待解決的一個(gè)挑戰(zhàn)。
我們的工作首次利用WGCNA結(jié)合LASSO方法識(shí)別了RSV的特異性診斷生物標(biāo)志物,加深了對其發(fā)病機(jī)制的認(rèn)識(shí)。然而,這些發(fā)現(xiàn)均是通過生物信息學(xué)分析得到的,還需要通過體內(nèi)和體外實(shí)驗(yàn)來探索這些基因在RSV中的具體作用。
參考文獻(xiàn)
[1] Weinberg GA. Respiratory syncytial virus mortality among young children[J]. Lancet Glob Health, 2017, 5(10): e951-e952.
[2] Li Y, Wang X, Blau DM, et al. Global, regional, and national disease burden estimates of acute lower respiratory infections due to respiratory syncytial virus in children younger than 5 years in 2019: a systematic analysis[J]. Lancet, 2022, 399(10340): 2047-2064.
[3] Hall CB, Weinberg GA, Blumkin AK, et al. Respiratory syncytial virus-associated hospitalizations among children less than 24 months of age[J]. Pediatrics, 2013, 132(2): e341-e348.
[4] Garegnani L, Styrmisdóttir L, Roson Rodriguez P, et al. Palivizumab for preventing severe respiratory syncytial virus(RSV) infection in children[J]. Cochrane Database Syst Rev, 2021, 11(11): CD013757.
[5] 李秀東. 小兒呼吸道合胞病毒感染性肺炎防治研究進(jìn)展[J]. 齊齊哈爾醫(yī)學(xué)院學(xué)報(bào), 2015, 36(26): 3990-3991.
[6] Dapat C, Kumaki S, Sakurai H, et al. Gene signature of children with severe respiratory syncytial virus infection[J]. Pediatr Res, 2021, 89(7): 1664-1672.
[7] Li L, Ni YA, Song Z, et al. Identification of pathogenic genes and transcription factors in respiratory syncytial virus[J]. BMC Pediatr, 2021, 21(1): 27.
[8] Kim HY, Yun KW, Cheong HJ, et al. Respiratory syncytial virus infection and the need for immunization in Korea[J]. Expert Rev Vaccines, 2023, 22(1): 327-340.
[9] Luo J, Qin H, Lei L, et al. Virus-like particles containing a prefusion-stabilized F protein induce a balanced immune response and confer protection against respiratory syncytial virus infection in mice[J]. Front Immunol, 2022, 13: 1054005.
[10] Jones AC, Anderson D, Galbraith S, et al. Personalized transcriptomics reveals heterogeneous immunophenotypes in children with viral bronchiolitis[J]. Am J Respir Crit Care Med, 2019, 199(12): 1537-1549.
[11] 劉金玲, 陳志敏. 呼吸道合胞病毒毛細(xì)支氣管炎患兒中性粒細(xì)胞活化及蛋白酶平衡的研究[J]. 中華醫(yī)學(xué)雜志, 2009, 89(6): 397-399.
[12] Tahamtan A, Besteman S, Samadizadeh S, et al. Neutrophils in respiratory syncytial virus infection: from harmful effects to therapeutic opportunities[J]. Br J Pharmacol, 2021, 178(3): 515-530.
[13] Hagner S, Welz H, Kicic A, et al. Suppression of adrenomedullin contributes to vascular leakage and altered epithelial repair during asthma[J]. Allergy, 2012, 67(8): 998-1006.
[14] Torres A, Ramirez P, Montull B, et al. Biomarkers and community-acquired pneumonia: tailoring management with biological data[J]. Semin Respir Crit Care Med, 2012, 33(3): 266-271.
[15] Feng T, Deng L, Lu X, et al. Ubiquitin-conjugating enzyme UBE2J1 negatively modulates interferon pathway and promotes RNA virus infection[J]. Virol J, 2018, 15(1): 132.
[16] Huang J, Li R, Cheng J, et al. Transcriptome analysis of peripheral blood mononuclear cells response in patients with severe COVID-19 reveals crucial genes regulating protein ubiquitination[J]. Med Sci Monit, 2022, 28: e937532.
[17] Huang X, Qu D, Liang Y, et al. Elevated S100A4 in asthmatics and an allergen-induced mouse asthma model[J]. J Cell Biochem, 2019, 120(6): 9667-9676.
[18] Wang LJ, Huang YC, Lin PY, et al. BST-1 as a serum protein biomarker involved in neutrophil infiltration in schizophrenia[J]. World J Biol Psychiatry, 2022, 23(7): 537-547.
[19] Zhang L, Wu WKK, Gallo RL, et al. Critical role of antimicrobial peptide cathelicidin for controlling Helicobacter pylori survival and infection[J]. J Immunol, 2016, 196(4): 1799-1809.
[20] Currie SM, Findlay EG, Mchugh BJ, et al. The human cathelicidin LL-37 has antiviral activity against respiratory syncytial virus[J]. PLoS One, 2013, 8(8): e73659.
[21] Van Der Strate BW, Beljaars L, Molema G, et al. Antiviral activities of lactoferrin[J]. Antiviral Res, 2001, 52(3): 225-239.
[22] Chen T, Ye L, Zhu J, et al. Inhibition of pyruvate dehydrogenase kinase 4 attenuates myocardial and mitochondrial injury in sepsis-induced cardiomyopathy[J]. J Infect Dis, 2023, 25: jiad365.
[23] Funchal GA, Jaeger N, Czepielewski RS, et al. Respiratory syncytial virus fusion protein promotes TLR-4-dependent neutrophil extracellular trap formation by human neutrophils[J]. PLoS One, 2015, 10(4): e0124082.
[24] Cortjens B, De Boer OJ, De Jong R, et al. Neutrophil extracellular traps cause airway obstruction during respiratory syncytial virus disease[J]. J Pathol, 2015, 238(3): 401-411.
[25] Porto BN, Stein RT. Neutrophil extracellular traps in pulmonary diseases: too much of a good thing?[J]. Front Immunol, 2016, 7: 311.