張弘揚(yáng),李思嘉,李巍
(中國醫(yī)科大學(xué)附屬第一醫(yī)院耳鼻咽喉科,沈陽 110001)
甲狀腺癌是一種常見的腫瘤,可發(fā)生于所有年齡段[1]。目前,針對(duì)甲狀腺癌的診斷主要依靠超聲和經(jīng)皮細(xì)針穿刺,治療手段上則以手術(shù)和I131放射治療為主。雖然,這種成熟的診斷和治療方案得到了廣泛的認(rèn)可,但是,關(guān)于甲狀腺癌的預(yù)后分析仍然是學(xué)者們探討的熱點(diǎn)。
眾所周知,腫瘤細(xì)胞內(nèi)微環(huán)境的紊亂多由供氧不足導(dǎo)致。缺氧可使基因和蛋白質(zhì)的表達(dá)發(fā)生異常,也可能在遺傳不穩(wěn)定性、腫瘤發(fā)生和進(jìn)展中發(fā)揮作用。已有研究[2]表明,缺氧引起腫瘤微環(huán)境的變化,促進(jìn)炎癥發(fā)生、免疫抑制和治療抵抗,從而誘發(fā)肺癌。
近年來,研究者們致力于利用缺氧相關(guān)標(biāo)志物評(píng)估腫瘤的預(yù)后。例如,3個(gè)缺氧相關(guān)基因(PDSS1、CDCA8和SLC7A11)被用于構(gòu)建肝細(xì)胞癌的預(yù)后、復(fù)發(fā)和診斷模型[3]。基于缺氧相關(guān)基因,開發(fā)了缺氧風(fēng)險(xiǎn)模型來評(píng)估膠質(zhì)瘤患者的預(yù)后[4]。這些缺氧相關(guān)預(yù)后獨(dú)立模型的建立對(duì)癌癥患者的綜合治療做出了重大貢獻(xiàn)。本研究旨在為甲狀腺癌患者的綜合治療提供新的、可靠的預(yù)后標(biāo)志物。
甲狀腺癌樣本的轉(zhuǎn)錄組數(shù)據(jù)和臨床數(shù)據(jù)從腫瘤與癌癥基因組圖譜(the cancer genome atlas,TCGA)網(wǎng)站下載,其中,包括510份甲狀腺癌樣本數(shù)據(jù)和58份癌旁樣本數(shù)據(jù),以供進(jìn)一步分析。根據(jù)錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.05和| log2FC |>1,獲得2 215個(gè)差異表達(dá)基因,結(jié)合從hypoxiaDB數(shù)據(jù)庫(此數(shù)據(jù)庫為人類缺氧相關(guān)調(diào)節(jié)蛋白的研究提供了一個(gè)完整的最新數(shù)據(jù)庫)下載的差異表達(dá)基因,共獲得了373個(gè)差異表達(dá)的缺氧相關(guān)基因。
為進(jìn)一步了解基因本身的功能,以及基因可能參與的通路,采用clusterProfiler進(jìn)行基因本體(gene ontology,GO)分析及京都基因和基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)分析,以研究差異表達(dá)的缺氧相關(guān)基因之間的功能相關(guān)性。
將缺氧相關(guān)基因映射至STRING數(shù)據(jù)庫,以創(chuàng)建一個(gè)交互網(wǎng)絡(luò)來闡明差異表達(dá)基因之間的關(guān)聯(lián)。隨后,采用Cytoscape軟件對(duì)蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)進(jìn)行了可視化處理。
用Cox單因素回歸分析鑒定與總生存時(shí)間相關(guān)的差異表達(dá)缺氧相關(guān)基因,并結(jié)合每個(gè)基因特定回歸系數(shù)(β),構(gòu)建患者的風(fēng)險(xiǎn)評(píng)分公式。風(fēng)險(xiǎn)評(píng)分=β(基因1)×表達(dá)量(基因1)+β(基因2)×表達(dá)量(基因2)+……+β(基因n)×表達(dá)量(基因n)。
從整個(gè)甲狀腺癌TCGA數(shù)據(jù)庫中隨機(jī)選擇50%甲狀腺癌樣本(n=255)作為實(shí)驗(yàn)組,其余50%甲狀腺癌樣本(n=255)作為驗(yàn)證組,在2組根據(jù)風(fēng)險(xiǎn)評(píng)分公式,以中位風(fēng)險(xiǎn)評(píng)分為臨界點(diǎn),將患者分為低危組和高危組。用Kaplan-Meier分析評(píng)估2組的生存差異,并用log-rank統(tǒng)計(jì)方法進(jìn)行比較。受試者操作特 征(receiver operating characteristic,ROC)曲線和Harrell一致性指數(shù)用于評(píng)估模型預(yù)測(cè)的準(zhǔn)確性。最后,采用單變量Cox回歸分析來確定風(fēng)險(xiǎn)評(píng)分、年齡、腫瘤TNM分期以及性別之間的獨(dú)立預(yù)后功能。
為了進(jìn)一步驗(yàn)證該模型的預(yù)測(cè)能力,從整個(gè)甲狀腺癌TCGA數(shù)據(jù)庫中隨機(jī)選擇了50%甲狀腺癌樣本作為內(nèi)部驗(yàn)證數(shù)據(jù)集(n=255)。采用C指數(shù)評(píng)估所建立模型的性能。
采用R語言分析TCGA數(shù)據(jù)庫。繪制Kaplan-Meier生存曲線,并通過log-rank檢驗(yàn)進(jìn)行比較。多因素Cox回歸分析用于建立缺氧相關(guān)基因的預(yù)后預(yù)測(cè)模型。所有統(tǒng)計(jì)分析均使用R語言進(jìn)行。所有統(tǒng)計(jì)檢驗(yàn)均為雙側(cè)檢驗(yàn),P< 0.05為差異有統(tǒng)計(jì)學(xué)意義。
從TCGA數(shù)據(jù)庫中獲得2 215個(gè)差異表達(dá)的甲狀腺癌基因,結(jié)合hypoxiaDB數(shù)據(jù)庫,共獲得373個(gè)差異表達(dá)的缺氧相關(guān)基因。圖1A、1B所示為373個(gè)差異表達(dá)的缺氧相關(guān)基因中的前30個(gè)基因。其中,只有1個(gè)上調(diào)基因(CCND1),而下調(diào)基因有29個(gè)。采用箱氏圖來總結(jié)甲狀腺癌和癌旁組織之間30個(gè)差異表達(dá)的缺氧相關(guān)基因的表達(dá)模式,見圖1C。
圖1 缺氧相關(guān)基因的差異表達(dá)Fig.1 Differentially expressed hypoxia-related genes
對(duì)差異表達(dá)的缺氧相關(guān)基因進(jìn)行功能富集分析有助于理解其生物學(xué)作用。GO富集分析的前10個(gè)生物學(xué)過程和KEGG富集分析的前10個(gè)通路分析如圖2所示。差異基因的生物學(xué)過程主要涉及“細(xì)胞外結(jié)構(gòu)組織”“含有膠原的細(xì)胞外基質(zhì)”和“細(xì)胞外基質(zhì)結(jié)構(gòu)成分”(圖2A)。而差異基因的通路分析主要涉及“PI3K-Akt信號(hào)通路”“細(xì)胞因子-細(xì)胞因子-受體相互作用”和“MAPK信號(hào)通路”(圖2B)。
圖2 差異表達(dá)的缺氧相關(guān)基因的功能富集分析Fig.2 Functional enrichment of differentially expressed hypoxia-related genes
為了充分了解缺氧相關(guān)基因的差異表達(dá),利用Cytoscape軟件構(gòu)建了一個(gè)交互式蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)。采用Cytoscape軟件中的分子復(fù)合物檢測(cè)(MCODE)工具來識(shí)別重要的基因模塊(hub genes),并篩選出3個(gè)重要的基因模塊。
采用單變量Cox回歸分析確定與甲狀腺癌患者預(yù)后相關(guān)的缺氧相關(guān)基因。森林圖顯示有23個(gè)基因在甲狀腺癌患者中具有顯著的預(yù)后價(jià)值(P< 0.05,圖3A)。進(jìn)一步的多變量Cox回歸分析共鑒定出11個(gè)基因(P< 0.05,圖3B)。
圖3 差異表達(dá)基因的單因素和多因素分析Fig.3 Univariate and multivariate analysis of differentially expressed genes
根據(jù)以下公式建立基因風(fēng)險(xiǎn)評(píng)分:遺傳風(fēng)險(xiǎn)評(píng)分=0.792 6×SLC6A8+0.806 4×STC1+0.7867×PTGIS-1.057×SLC24A3-0.349 2×DPP4-0.749 2×ANK2-1.204 0×APOE+0.521 1×PIM1+3.085 0×PHKG1+0.547 3×AKR1C3+1.171 4×NDRG1。根據(jù)缺氧相關(guān)基因的預(yù)后公式,在實(shí)驗(yàn)組和驗(yàn)證組中分別確定了這些基因在不同風(fēng)險(xiǎn)人群中的分布以及患者的生存率。為了確定11個(gè)缺氧相關(guān)基因在預(yù)測(cè)甲狀腺癌患者臨床預(yù)后中的作用,進(jìn)一步繪制了Kaplan-Meier生存曲線,以分析實(shí)驗(yàn)組和對(duì)照組中高危組和低危組的不同生存時(shí)間。Kaplan-Meier 分析結(jié)果顯示,高危組患者的生存率明顯低于低危組,見圖4。
圖4 基于缺氧相關(guān)基因的甲狀腺癌預(yù)后指標(biāo)驗(yàn)證Fig.4 Verification of prognostic indicators for thyroid cancer based on hypoxia-related genes
采用11個(gè)與缺氧相關(guān)的基因構(gòu)建了2組甲狀腺癌患者1年、3年和5年生存率的ROC曲線,來評(píng)估模型的預(yù)測(cè)性能(圖5)。在實(shí)驗(yàn)組中,ROC曲線下面積(area under curve,AUC)分別為0.943(1年)、0.897(3年)和0.831(5年)。而在驗(yàn)證組中,AUC分別為0.944(1年)、0.964(3年)和0.992(5年)。
圖5 基于缺氧相關(guān)基因的預(yù)后指標(biāo)顯示出良好的預(yù)測(cè)性能Fig.5 Prognostic indicators based on hypoxia-related genes showed good predictive performance
對(duì)甲狀腺癌患者的臨床數(shù)據(jù)(包括風(fēng)險(xiǎn)評(píng)分)的預(yù)后價(jià)值進(jìn)行單因素Cox回歸分析(表1),結(jié)果顯示,構(gòu)建的風(fēng)險(xiǎn)評(píng)分在預(yù)后評(píng)估中具有較高的預(yù)測(cè)價(jià)值。
表1 甲狀腺癌患者潛在標(biāo)志物的單變量分析Tab.1 Univariate analyses of potential markers for thyroid cancer patients
近年來,甲狀腺癌的發(fā)病率呈上升趨勢(shì),對(duì)人類健康構(gòu)成了重大威脅。在美國,男性和女性甲狀腺癌的檢出率均有所上升,從1975年的每10萬人中可檢出4.9例上升至2014年的每10萬人中14.3例[4]。同時(shí),由于5年特異性生存率差的低分化甲狀腺癌的存在[5],對(duì)甲狀腺癌的預(yù)后研究更為關(guān)鍵。
隨著對(duì)缺氧引起的腫瘤微環(huán)境變化的深入了解以及TCGA和hypoxiaDB數(shù)據(jù)庫的完善,學(xué)者們將更多的目光放在了通過缺氧相關(guān)基因來預(yù)測(cè)腫瘤的預(yù)后[6-7],近來新興的證據(jù)都在強(qiáng)調(diào)免疫及炎癥微環(huán)境在甲狀腺癌中的重要性[8-9]。然而,還沒有一項(xiàng)研究致力于通過缺氧相關(guān)基因來對(duì)甲狀腺癌患者進(jìn)行預(yù)后分析。
目前,對(duì)甲狀腺癌缺氧微環(huán)境的研究大多集中在單個(gè)基因上[10-12]。本研究中鑒定的11個(gè)缺氧相關(guān)基因中,部分基因已被證實(shí)與腫瘤的預(yù)后密切相關(guān)。研究[13]顯示,CrT(SLC6A8)基因的敲除導(dǎo)致肌酸攝取不足,同時(shí)損害抗腫瘤T細(xì)胞的免疫功能。補(bǔ)充肌酸可顯著抑制腫瘤生長,并與PD-1/PD-L1阻滯劑協(xié)同抑制腫瘤生長[14]。載脂蛋白E作為高脂血癥的主要病因,被證明在高脂血癥模型中,可通過運(yùn)動(dòng)改善腫瘤的缺氧微環(huán)境,同時(shí)減緩原發(fā)性和繼發(fā)性EO771乳腺腫瘤的形成[15]。
此外,PTGIS和DPP4在生物信息學(xué)研究中也得到了證實(shí)。在先前與肝細(xì)胞肝癌相關(guān)的新生物標(biāo)志物研究中,PTGIS是通過mRNA表達(dá)網(wǎng)絡(luò)分析確定的21個(gè)核心基因之一,可能是抑制肝細(xì)胞肝癌的潛在治療靶點(diǎn)[16],而DPP4也被證明是NF-κB 15的靶基因[17]。
STC1、PIM1和NDRG1這3種基因在癌癥中的研究更加成熟。由于STC1可能通過Bcl-2的失調(diào)在缺氧性胃癌中發(fā)揮致癌作用,因此被視為可能的胃癌潛在治療靶點(diǎn)[18]。在缺氧微環(huán)境下,miR-124和miR-144的下調(diào)可通過減弱PIM1的抑制作用使細(xì)胞發(fā)生缺氧,而增加患前列腺癌的風(fēng)險(xiǎn)[19]。NDRG1作為調(diào)節(jié)脂質(zhì)代謝的關(guān)鍵基因可促進(jìn)乳腺癌的侵襲性。因NDRG1與乳腺癌預(yù)后不良之間的關(guān)系密切,故NDRG1成為了乳腺癌中一種有前途的治療靶點(diǎn)[20]。
總之,本研究基于對(duì)差異表達(dá)的缺氧相關(guān)基因表達(dá)譜和相應(yīng)臨床特征的綜合分析,確定了多種甲狀腺癌的預(yù)后標(biāo)志物。并通過構(gòu)建一個(gè)新的風(fēng)險(xiǎn)評(píng)分模型,以有效地評(píng)估甲狀腺癌患者的預(yù)后。本研究的局限性在于其為回顧性研究,今后應(yīng)該進(jìn)行更多的前瞻性研究,以驗(yàn)證缺氧相關(guān)基因的預(yù)后功能。當(dāng)然,這也需要多中心數(shù)據(jù)來證實(shí)本研究的發(fā)現(xiàn)。
中國醫(yī)科大學(xué)學(xué)報(bào)2022年4期