嚴光燦 田 偉 劉美娜
哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計教研室,150081 黑龍江 哈爾濱
腦膠質(zhì)瘤是神經(jīng)系統(tǒng)最常見的惡性腫瘤,按惡性程度可將其分為I~IV級[1]。由于患者異質(zhì)性高,預(yù)后差異大,2016年新的分類標(biāo)準增加了形態(tài)學(xué)和分子特征;2021年進一步增加了甲基化等特征[2-3]。臨床上II~III期的膠質(zhì)瘤患者被統(tǒng)稱為低級別膠質(zhì)瘤(lower grade glioma,LGG),相對于I期和IV期膠質(zhì)瘤,LGG患者的腫瘤異質(zhì)性更高,如腫瘤微環(huán)境中的細胞成分及含量不同、預(yù)后差異大等[4-5];即使病理類型相同的患者在接受相同治療后,治療結(jié)局仍有很大差異[6],精準的分型有助于臨床醫(yī)生選擇更合理的治療方案。免疫相關(guān)基因(immune related genes, IRGs)異常與免疫浸潤、腫瘤發(fā)生發(fā)展、治療抵抗等過程息息相關(guān),增強子對IRGs的表達有重要的調(diào)控作用。增強子是DNA序列上重要的遠端調(diào)控元件,其轉(zhuǎn)錄本稱為增強子RNA(enhancr RNA,eRNA),eRNA含量可代表增強子的功能活性。增強子在各類腫瘤/正常組織中廣泛表達,而不同組織、癌癥間,其表達有明顯的特異性[7]。因此,研究特異性增強子調(diào)控的靶基因,有助于LGG患者精細、合理地分型;分析各型患者間的特征差異,對促進精準醫(yī)療實施、改善患者預(yù)后及相關(guān)機制研究具有重要意義。
從癌癥基因組圖譜數(shù)據(jù)庫(the cancer genome atlas, TCGA;www.xena.ucsc.edu/)獲取LGG患者的基因表達數(shù)據(jù)、臨床表型數(shù)據(jù)及預(yù)后生存數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集;從中國膠質(zhì)瘤基因組圖譜數(shù)據(jù)庫(chinese glioma genome atlas, CGGA;www.cgga.org.cn/)獲取相同類型數(shù)據(jù)作為驗證集。由于CGGA數(shù)據(jù)包括2個批次的數(shù)據(jù),因此需要進行批次校正。增強子與靶基因的調(diào)控關(guān)系數(shù)據(jù)從eRNA數(shù)據(jù)庫(eRic;www.hanlab.uth.edu/eRic/)中獲取。并從ImmPort 數(shù)據(jù)庫(www.immport.org)和InnateDB數(shù)據(jù)庫(www.innatedb.com)中獲取IRGs,從MSigDB數(shù)據(jù)庫中獲取免疫相關(guān)通路基因集。樣本納入標(biāo)準:(1)原發(fā)性腫瘤;(2)腫瘤分期為II~III期;(3)樣本含有基因表達數(shù)據(jù)、臨床表型數(shù)據(jù)及預(yù)后生存數(shù)據(jù)。
獲取LGG特異性eRNA,確定其調(diào)控的IRGs;利用IRGs對LGG樣本進行K-means聚類分析;聚類數(shù)設(shè)置為2~8,分析聚類熱圖的相關(guān)性,聯(lián)合手肘法,選取拐點處的值為最佳聚類數(shù),確定LGG分型;利用CGGA數(shù)據(jù)進行相同分析,驗證聚類結(jié)果的穩(wěn)健性。聚類分析通過R包“ConsensusClusterPlus”實現(xiàn)。
腫瘤微環(huán)境中免疫細胞浸潤對腫瘤進展、藥物敏感性及患者預(yù)后有重要影響。利用“CIBERSORT”算法對做LGG患者進行免疫浸潤分析,比較各亞型間免疫細胞浸潤模式的差異[8]。富集分析探索特異性增強子調(diào)控的IRGs所參與的生物學(xué)過程,包括KEGG富集分析、GO富集分析。分析結(jié)果利用R包“clusterProfiler”實現(xiàn)。
生存分析比較各亞型間患者生存時間差異, log-rank檢驗對差異進行統(tǒng)計推斷,并繪制生存曲線。檢驗分析各型間腫瘤分期、TERTp突變、MGMTp甲基化、IDH突變、染色體1p/19q共缺失的構(gòu)成差異。秩和檢驗分析各亞型間基因突變數(shù)、TERT基因表達量的差異。
基于免疫相關(guān)通路基因集的基因集差異分析(gene set variation analysis,GSVA):計算每個樣本的通路富集得分(得分大于0表示通路活性上調(diào),小于0表示通路活性下調(diào)),比較各型間的通路活性差異,定義|logFC| > 0.5且校正P<0.05的通路為亞型間的差異通路。GSVA利用R包“GSVA”完成。
納入排除標(biāo)準選擇得到訓(xùn)練集495個樣本、驗證集426個樣本。篩選出227個LGG特異性增強子,50個特異性增強子調(diào)控的免疫相關(guān)性靶基因,包括AKT2、HIF1AN、LRSAM1、PTCH1等。
TCGA樣本聚類發(fā)現(xiàn)聚類數(shù)為5時效果最好,組內(nèi)相關(guān)性高,組間相關(guān)性低(圖1A);手肘法結(jié)果顯示,拐點處值的為5(圖1B),確定最佳聚類數(shù)為5類。驗證集CGGA樣本聚類分析后得到相同結(jié)果,表明聚類結(jié)果穩(wěn)定。LGG分為5型,分別記為A1~A5亞型,其構(gòu)成比分別為 22.6%、21.6%、13.7%、26.3%和15.8%。
A:K-means聚類熱圖;B:手肘法結(jié)果
免疫浸潤分析結(jié)果顯示:不同亞型患者間免疫細胞浸潤模式不同;22種免疫細胞中有18種在各亞型間存在明顯差異(P<0.05)。見圖2。其中,A1亞型患者主要富集M2型巨噬細胞、活化型肥大細胞及單核細胞;A2型富集M2型巨噬細胞;A3型富集嗜酸性粒細胞、活化型NK細胞,M2型巨噬細胞含量最低;A4型富集單核細胞和M2型巨噬細胞;A5型富集M1、M2型巨噬細胞,靜息型CD4記憶T細胞和CD8+T細胞,單核細胞和NK細胞含量最低。
注:*P<0.05;**P <0.01;***P<0.001。
GO富集分析發(fā)現(xiàn)IRGs主要參與c-Jun-氮末端激酶(JNK)活性調(diào)節(jié)、多種細胞分化(如脂肪細胞、白細胞)、造血功能調(diào)節(jié)以及多種酶活性調(diào)節(jié)(如內(nèi)切酶、蛋白酶)、受體配體活性、蛋白/組蛋白脫乙?;富钚缘榷鄺l信號通路(圖3A)。KEGG結(jié)果顯示IRGs主要參與酒精性肝病、多種病原體感染(如沙門氏菌、志賀桿菌、人免疫缺陷病毒)以及cAMP等多種生物學(xué)過程(圖3B)。
A:GO富集分析結(jié)果;B:KEGG富集分析結(jié)果
生存分析結(jié)果顯示A5亞型預(yù)后最差,中位生存期約為2年,其余亞型間預(yù)后生存無統(tǒng)計學(xué)差異。見圖4A。A3和A4組療效最好,超過60%的患者治療有效;A5組療效最差,超過30%的患者出現(xiàn)病情進展。見圖4B。A5組III期患者比例最高,其次是A2,A3組最低。見圖4C。IDH基因突變、MGMTp甲基化均表現(xiàn)為在A5組比例最低,其余各組較高;TERTp突變在A5組最高,A2組次之,最低是A1組;染色體1p/19q共缺失在A2最高,A5最低。見圖4D~4G??偼蛔償?shù)在A5組最高,平均突變數(shù)約為40,A3組最低,平均突變數(shù)不到20;TERT基因表達在A2和A5組最高,A1和A4組最低。見圖4H、圖4I。
A:生存分析結(jié)果;B:療效構(gòu)成比;C:分期構(gòu)成;D:1p/19q共缺失構(gòu)成;E:IDH突變構(gòu)成;F: MGMTp甲基化構(gòu)成;
GSVA結(jié)果發(fā)現(xiàn)115條差異通路,選擇|logFC|最大的前20條通路進行可視化后發(fā)現(xiàn),這些通路在A5組患者中均過度激活,在A3組患者中活性則均受到抑制,其余3組活性無明顯差別。見圖5。
隨著醫(yī)療技術(shù)發(fā)展,許多疾病的療效均顯著提升,但由于LGG患者腫瘤異質(zhì)性高、個體差異大,療效提升有限。對LGG患者進行精準的分型,針對不同亞型患者選擇不同的治療方案,有利于提升治療效果、改善患者預(yù)后。以往的LGG分型研究由于缺乏特異性的標(biāo)志物,分型效果不理想。增強子有高特異性,且可直接影響腫瘤的發(fā)生發(fā)展,對LGG患者精準分型有重要意義。本研究通過篩選特異性增強子調(diào)控的IRGs獲得5個LGG亞型,各型間生存、臨床特征、基因通路活性及免疫浸潤模式等存在顯著差異。但增強子對基因的調(diào)控作用能多大程度影響患者預(yù)后仍需進一步探索,后續(xù)研究需在本研究的基礎(chǔ)上深入探索,并利用實驗驗證機制假設(shè)。
在腫瘤微環(huán)境中,除腫瘤細胞外,還存在大量的免疫細胞、基質(zhì)等非腫瘤細胞成分。免疫細胞浸潤模式的不同對腫瘤發(fā)生進展、藥物敏感性及患者預(yù)后有重要影響。M2型巨噬細胞可促進腫瘤細胞免疫逃逸、加快腫瘤進展和轉(zhuǎn)移[9];本研究顯示A5組M2型巨噬細胞浸潤程度最高,這表明A5的不良預(yù)后可能與M2型巨噬細胞引起的免疫逃逸有關(guān)。單核細胞可分化為巨噬細胞,主要包括M0、M1、M2 3個亞型,其中M0對免疫逃逸有抑制作用,M1和M2則可促進腫瘤細胞的免疫逃逸[10]。預(yù)后最差的A5組單核細胞含量最低,說明單核細胞可能更多地分化為抑制免疫逃逸的M0型巨噬細胞;免疫細胞的分化可能對LGG患者的生存結(jié)局有重要影響。本研究發(fā)現(xiàn)免疫細胞成分和含量不同,會導(dǎo)致患者間預(yù)后差異很大,這與各免疫細胞的功能不同有關(guān),但具體的機制有待后續(xù)的實驗加以佐證。
圖5 GSVA差異活性通路
GSVA結(jié)果顯示各型間多條信號通路活性有顯著差異,表明各組間預(yù)后及療效差異可能與這些通路活性不同有關(guān)。c-Jun-氮末端激酶(JNKs)是一類蛋白激酶家族,在細胞增殖分化、衰老凋亡等生物學(xué)過程中發(fā)揮重要作用[11]。本研究篩選的靶基因富集在多條與JNKs活性調(diào)節(jié)相關(guān)的通路,這提示JNKs相關(guān)通路可能是影響LGG患者療效與生存的重要通路;A5亞型預(yù)后差可能與JNKs相關(guān)通路失調(diào)導(dǎo)致細胞增殖分化紊亂、癌細胞異常增殖有關(guān)。此外,這些靶基因還參與多種細胞分化、造血功能調(diào)節(jié)等生物學(xué)過程,均是與癌細胞增殖、癌組織生長相關(guān)的關(guān)鍵通路。
各型間臨床分期存在顯著差異,A5亞型III期患者比例最高,與其預(yù)后最差相一致;其余亞型間分期也存在明顯差異,生存結(jié)局卻無顯著差異,說明除腫瘤分期外,還有其他因素影響LGG患者生存,也說明進行LGG分型十分必要。結(jié)果顯示:TERTp突變比例高,IDH突變、1p/19q聯(lián)合缺失、MGMTp甲基化比例低的患者預(yù)后差,這與以往的研究結(jié)果相一致[2,12-13]。A2組III期患者占比及TERTp突變比例都僅次于A5,但生存卻與其余各組無差異,很可能與A2組患者1p/19q共缺失比例最高有關(guān)。
綜上,本研究獲得多個特異性增強子和其參與調(diào)控IRGs;共獲得5個LGG亞型且分型結(jié)果穩(wěn)定,可為臨床治療提供參考;不同亞型患者間預(yù)后生存、免疫浸潤模式、通路活性、臨床及分子特征存在統(tǒng)計學(xué)差異,可為相關(guān)機制研究提供參考。