王穎,趙玉哲,韓青青,李思佳,張靜
1河北醫(yī)科大學(xué)研究生學(xué)院,石家莊 050000;2河北省人民醫(yī)院腺體外科
甲狀腺癌是內(nèi)分泌系統(tǒng)中常見(jiàn)的惡性腫瘤,近年來(lái)發(fā)病人數(shù)持續(xù)增長(zhǎng)[1]。2019年國(guó)家癌癥中心的統(tǒng)計(jì)數(shù)據(jù)顯示,甲狀腺癌在全人群中發(fā)病率已位居第七位,甲狀腺癌逐漸引起關(guān)注,但其發(fā)病機(jī)制還不明確[2]。甲狀腺癌中乳頭狀癌最為常見(jiàn),高分辨率超聲結(jié)合細(xì)針穿刺活檢一度被認(rèn)為是術(shù)前診斷甲狀腺癌的黃金搭檔,但部分患者的甲狀腺腫瘤相對(duì)較小,從而影響腫瘤性質(zhì)的精準(zhǔn)判斷。
基因芯片又稱DNA微陣列,是一種生物芯片,已成為大規(guī)模高效獲取癌癥基因表達(dá)譜信息的重要手段。微陣列分析是研究腫瘤基因、尋找腫瘤藥物治療的分子靶點(diǎn)、監(jiān)測(cè)預(yù)后的一種新方法。然而,由于實(shí)驗(yàn)樣本的異質(zhì)性,使用不同的檢測(cè)平臺(tái)和數(shù)據(jù)處理方法會(huì)導(dǎo)致結(jié)果不一致。基于此,本研究以基因芯片研究為基礎(chǔ),應(yīng)用整合的生物信息學(xué)技術(shù)進(jìn)行生物信息數(shù)據(jù)挖掘,對(duì)PTC進(jìn)行全面系統(tǒng)的生物信息分析,以期探索與PTC發(fā)生發(fā)展相關(guān)的關(guān)鍵基因。
1.1 臨床資料 從GEO數(shù)據(jù)庫(kù)(Https://www.ncbi.nlm.nih.gov/geo/)下載GSE3678、GSE60542、GSE6004和GSE53157數(shù)據(jù)集。這4個(gè)數(shù)據(jù)集均屬于GPL 570平臺(tái),共包含53個(gè)組織樣本,其中包括24個(gè)正常甲狀腺組織樣本和29個(gè)甲狀腺乳頭狀癌樣本。
1.2 差異基因的篩選 使用R語(yǔ)言Limma R軟件包篩選每個(gè)數(shù)據(jù)集的DEGs。以|logFC|≥1和P<0.05為差異有統(tǒng)計(jì)學(xué)意義,并將各數(shù)據(jù)集中的基因按logFC排序,使用RoburRankAggreg(RRA)R包(Https://cran.rstudio.com/bin/windows/contrib/3.5/RobustRankAggreg_1.1.zip)對(duì)4組基因文件進(jìn)行集成,并將上調(diào)和下調(diào)的DEGs列表保存起來(lái),供后續(xù)分析。
1.3 功能注釋和通路富集分析 應(yīng)用David 6.8數(shù)據(jù)庫(kù)(Https://david.ncifcrf.gov/)對(duì)整合的DEGs進(jìn)行GO注釋和KEGG途徑富集分析,以了解基因參與的生物過(guò)程和信號(hào)傳導(dǎo)途徑。所有GO富集分析和KEGG途徑分析的數(shù)據(jù)以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.4 蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建 應(yīng)用String在線數(shù)據(jù)庫(kù)(http://string-db.org)對(duì)412個(gè)整合DEGs進(jìn)行分析,下載分析結(jié)果,使用Cytoscape3.8.0軟件構(gòu)建可視化的PPI關(guān)系網(wǎng)絡(luò),并用CytoHubba插件篩選樞紐基因。
1.5 模塊分析 在Cytoscape3.8.0軟件構(gòu)建的PPI網(wǎng)絡(luò)中,使用默認(rèn)參數(shù)為“Degree Cutoff = 2”“Node Score Cutoff = 0.2”“K-Core=2”和“Max.Depth=100”的MCODE插件對(duì)PPI網(wǎng)絡(luò)中的模塊進(jìn)行分析。
2.1 差異表達(dá)基因 數(shù)據(jù)集GSE3678、GSE60542、GSE6004及GSE53157分別篩選出700、887、772、1 088個(gè)DEGs,通過(guò)等級(jí)分析,鑒定了412個(gè)整合的DEGs,包括209個(gè)表達(dá)上調(diào)基因和203個(gè)表達(dá)下調(diào)基因。
2.2 DEGs的功能注釋及富集 GO功能注釋分為三部分:生物過(guò)程、分子功能和細(xì)胞成分。上調(diào)基因主要富集于基因表達(dá)的正調(diào)控、細(xì)胞外外泌體和鈣離子結(jié)合,下調(diào)基因主要富集于信號(hào)轉(zhuǎn)導(dǎo)、膜的組成部分和鈣離子結(jié)合。
2.3 DEGs的KEGG通路 利用DAVID數(shù)據(jù)庫(kù)對(duì)集成的DEGs進(jìn)行了KEGG路徑分析,整合后的DEGs主要富集于5種途徑,即癌癥的途徑、PI3K-Akt信號(hào)轉(zhuǎn)導(dǎo)通路、癌癥中的蛋白多糖、黏著斑,ECM受體相互作用。
2.4 蛋白質(zhì)—蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò) 為了確定這些DEGs在PTC中的相互作用,我們利用String在線數(shù)據(jù)庫(kù)對(duì)412個(gè)整合DEGs進(jìn)行了分析,并構(gòu)建了一個(gè)PPI網(wǎng)絡(luò)。在此基礎(chǔ)上利用Cytoscape軟件中的CytoHubba插件根據(jù)其程度值篩選出前10位核心基因:FN1、CDH2、APOE、TIMP1、CCND1、SERPINA1、MET、LPL、RUNX2、ITGA2,見(jiàn)表1。
表1 前10位樞紐基因的相關(guān)信息
2.5 功能模塊 利用Cytoscape軟件中的MCODE模塊從PPI網(wǎng)絡(luò)中篩選了14個(gè)功能模塊,并選擇了三個(gè)最重要的模塊(如圖1)。利用David數(shù)據(jù)庫(kù)對(duì)這三個(gè)模塊中的所有基因進(jìn)行了KEGG途徑富集分析(表2)。結(jié)果表明,模塊1的基因主要富集于ECM受體相互作用,模塊2的基因主要富集于礦物質(zhì)吸收,模塊3的基因主要富集于鈣信號(hào)通路、癌癥中的中心碳代謝、癌癥的途徑。
表2 前三個(gè)模塊中基因的KEGG富集
注:圓圈代表基因;線條代表基因編碼蛋白質(zhì)之間的相互作用;線條顏色代表蛋白質(zhì)相互作用的類(lèi)型。
甲狀腺癌是目前全球增長(zhǎng)速度最快的癌癥,其中PTC占比逐漸上升,已成為甲狀腺癌診治的焦點(diǎn)。當(dāng)甲狀腺結(jié)節(jié)經(jīng)過(guò)細(xì)針穿刺活檢(FNA)確診或可疑癌腫時(shí),推薦首選手術(shù)切除。但術(shù)前仍有部分患者無(wú)法通過(guò)超聲及細(xì)針穿刺活檢確定腫瘤性質(zhì),導(dǎo)致一部分不必要的手術(shù)。
本研究共篩選出412個(gè)整合DEGs,其中209個(gè)上調(diào)基因和203個(gè)下調(diào)基因。對(duì)差異基因進(jìn)行GO功能及KEGG通路富集分析發(fā)現(xiàn),上調(diào)基因在基因表達(dá)的正調(diào)控、細(xì)胞外外泌體和鈣離子結(jié)合等方面存在顯著富集,下調(diào)基因在信號(hào)轉(zhuǎn)導(dǎo)、膜的組成部分和鈣離子結(jié)合等方面存在顯著富集。這些基因主要參與癌癥的途徑、PI3K-Akt信號(hào)轉(zhuǎn)導(dǎo)通路、癌癥中的蛋白多糖、黏著斑、ECM受體相互作用等與腫瘤發(fā)生相關(guān)的信號(hào)通路。模塊中所涉及基因的KEGG通路分析再次驗(yàn)證了ECM受體相互作用及癌癥的途徑通路與PTC的發(fā)生發(fā)展密切相關(guān)。我們還構(gòu)建了包含412個(gè)整合DEG的PPI網(wǎng)絡(luò),并鑒定出以下10個(gè)樞紐基因:FN1、CDH2、APOE、TIMP1、CCND1、SERPINA1、MET、LPL、RUNX2、ITGA2。FN1是一種細(xì)胞外基質(zhì)高分子糖蛋白,參與協(xié)調(diào)復(fù)雜的細(xì)胞黏附和遷移[3]。最新研究發(fā)現(xiàn),F(xiàn)N1促進(jìn)PTC的遷移和侵襲并預(yù)測(cè)PTC的淋巴結(jié)轉(zhuǎn)移[4]。
本研究結(jié)果顯示,PTC標(biāo)本中FN1基因均上調(diào),提示高水平的纖維連接蛋白表達(dá)可能是腫瘤轉(zhuǎn)移的促進(jìn)因子。與楊春偉等[5]研究結(jié)論一致。CDH2是經(jīng)典鈣黏蛋白家族的成員,在多種癌癥中過(guò)度表達(dá)。體外實(shí)驗(yàn)結(jié)果顯示,PTC組織中CDH2含量高于非癌性甲狀腺組織,并通過(guò)激活MAPK/ERK、PI3K/Akt和p16/Rb信號(hào)通路促進(jìn)甲狀腺腫瘤的發(fā)生[6],與本研究結(jié)果一致。APOE和LPL在脂質(zhì)代謝中起重要作用,并被認(rèn)為參與了惡性腫瘤的代謝途徑,為腫瘤細(xì)胞提供額外的能量來(lái)源[7]。TIMP-1是一種多功能的天然基質(zhì)蛋白抑制劑,被認(rèn)為是腫瘤轉(zhuǎn)移的負(fù)調(diào)節(jié)因子。通過(guò)保護(hù)細(xì)胞外基質(zhì)的完整性來(lái)防止腫瘤細(xì)胞的侵襲和轉(zhuǎn)移[8],CCND 1/CyclinD 1是細(xì)胞周期G1/S期的調(diào)節(jié)因子[9]。TESHIMA等[10]發(fā)現(xiàn),PTC區(qū)域淋巴結(jié)轉(zhuǎn)移率、甲狀腺外擴(kuò)張率和腺內(nèi)轉(zhuǎn)移率與CyclinD 1免疫染色陽(yáng)性率相關(guān)。本研究結(jié)果中PTC細(xì)胞中CCND1基因上調(diào),CyclinD 1過(guò)表達(dá)可能是判斷甲狀腺惡性腫瘤生長(zhǎng)和轉(zhuǎn)移潛能的重要指標(biāo)。
SERPINA1是一種蛋白酶抑制劑,已被認(rèn)為是多種癌癥的生物標(biāo)志物。有實(shí)驗(yàn)表明SERPINA1在甲狀腺良惡性結(jié)節(jié)的鑒別中起重要作用[11]。研究發(fā)現(xiàn),MET在HGF/c-MET通路中起重要作用,與甲狀腺癌亞臨床中心淋巴結(jié)轉(zhuǎn)移密切相關(guān),MET可能是PTC的危險(xiǎn)基因[12]。Runx 2是胚胎發(fā)生過(guò)程中一種重要的轉(zhuǎn)錄因子,可通過(guò)激活一組參與基質(zhì)降解和細(xì)胞侵襲的基因,來(lái)調(diào)控甲狀腺腫瘤細(xì)胞的增殖、遷移和侵襲能力[13]。ITGA2在多種腫瘤中的過(guò)度表達(dá),被認(rèn)為參與了細(xì)胞黏附和細(xì)胞表面介導(dǎo)的信號(hào)傳遞[14]。CHARNAYA等[15]研究發(fā)現(xiàn),BRAF突變的PTC細(xì)胞改變了RAS-RAF-MEK通路,導(dǎo)致細(xì)胞膜整合素受體及其配體—細(xì)胞外基質(zhì)蛋白骨橋蛋白表達(dá)的改變,從而增加腫瘤細(xì)胞的轉(zhuǎn)移潛能。因此,ITGA2可作為腫瘤進(jìn)展和侵襲性腫瘤表型的潛在生物標(biāo)志物。
綜上所述,本研究篩選所得的10個(gè)關(guān)鍵基因可能在PTC發(fā)生發(fā)展中發(fā)揮重要作用,抑制ECM受體相互作用、癌癥的途徑通路可能是治療PTC的有效方法。