陳 帥,羅錦琳,羅 霽,張超杰,鄒聯(lián)洪,3,范培芝
(1.湖南師范大學(xué)第一附屬醫(yī)院/湖南省人民醫(yī)院,長沙 410002;2.湘雅常德醫(yī)院,常德 415003;3.急危重癥代謝組學(xué)湖南省重點實驗室,長沙 410002)
甲狀腺癌是內(nèi)分泌器官最常見的惡性腫瘤,其發(fā)病率在過去三十年間增加了三倍多[1][2],雖然甲狀腺乳頭狀癌(thyroid papillary carcinoma,PTC)患者可獲得良好的預(yù)后[3],但仍有一部分的甲狀腺乳頭狀癌的患者會發(fā)生復(fù)發(fā)和遠(yuǎn)處轉(zhuǎn)移[4]。目前有許多關(guān)于疾病的生物信息學(xué)研究,但有關(guān)PTC 的生物信息學(xué)研究卻不多見,固在本研究中,我們期望通過生信的方法來初步探索PTC 在分子水平的機制研究。
臨床資料:在2016 年9 月~2018 年9 月就診于湖南省人民醫(yī)院診斷為PTC 的患者中隨機選取3 位患者,在術(shù)中收集PTC 患者的甲狀腺乳頭狀癌組織及相對應(yīng)的癌旁組織標(biāo)本(距腫瘤大于2cm),我們將其收取的標(biāo)本用于轉(zhuǎn)錄組芯片的相關(guān)研究。本研究收集相關(guān)標(biāo)本均得到湖南省人民醫(yī)院倫理委員會的批準(zhǔn)同意,患者或其法定監(jiān)護人對本次研究方法及內(nèi)容均知情同意,并簽字認(rèn)可。所有的患者病理和臨床相關(guān)資料均齊全。
表1 甲狀腺乳頭狀癌患者一般臨床資料
1.1 轉(zhuǎn)錄組芯片檢測 用Trizol 試劑組織RNA 試劑盒分別從冷凍組織中提取總RNA。采用基因芯片技術(shù)對基因化學(xué)進行LncRNA、mRNA 分析。簡單地說,將rRNA 去除后,制備生物素化Arna(CrNA)。得到原始視圖人類基因表達陣列(CAT)。再進行雜交和掃描。所有樣品均經(jīng)技術(shù)復(fù)制件處理?;蛐酒瑨呙鑳xGeneChip Scanner 3000 7G 用于掃描完成的陣列。圖像用基因芯片命令控制臺(AGACC)提取,用表達式控制臺軟件進行分析。
1.2 LncRNAs 和差異基因篩選 將獲取的基因芯片數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,使用差異倍數(shù)法篩選出相關(guān)差異表達的lncRNAs 和mRNAs,以Fold-chang ≥2,P 值≤0.05,作為篩選符合差異表達的入組條件。
1.3 差異基因的GO 功能富集分析及KEGG 通路富集分析 通過DAVID 在線分析工具對甲狀腺乳頭狀腺癌差異表達基因進行基因本體論(Gene Ontology,GO)功能富集分析識別基因譜的分子功能和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析探討這些基因在這些路徑中的潛在功能。P<0.05 為差異有統(tǒng)計學(xué)意義。
1.4 差異基因蛋白互作網(wǎng)絡(luò)分析 通過STRING 數(shù)據(jù)庫(http://string-db.org/)對差異基因進行蛋白互作網(wǎng)絡(luò)分析(protein protein interaction network,PPI),找出在PTC 中作用的關(guān)鍵基因及關(guān)鍵通路,初步探討PTC的相關(guān)分子機制,為PTC 的治療和預(yù)后評估提供理論依據(jù)。
1.5 TGCA 數(shù)據(jù)采集及處理 采用癌癥基因組圖譜(TGCA)數(shù)據(jù)庫中檢索了具有臨床信息和基因表達譜的PTC 病例。使用R 包“OIsurv”將基因的表達水平定義為為高表達值(表達值>中值)或低表達值(表達值<中值)。采用Kaplan-Meier 法進行生存曲線分析。采用對數(shù)秩檢驗進行單因素生存分析。
1.6 統(tǒng)計學(xué)分析 統(tǒng)計學(xué)處理采用SPSS 19.0 軟件,采用雙面對數(shù)秩檢驗(Kaplan-Meier)來分析15 個基因在TGCA 數(shù)據(jù)庫中PTC 臨床數(shù)據(jù)樣本中的總體生存率(OS)及無名生存期(DFS)差異的統(tǒng)計學(xué)意義。P 值<0.05 具有統(tǒng)計學(xué)意義.
2.1 甲狀腺乳頭狀癌中差異表達的基因 為了分析PTC 中差異表達的LncRNAs,我們對3 例PTC 和與之相匹配的癌旁正常甲狀腺組織中篩選出的差異mRNA和Lnc RNA 進行了基因組分析。根據(jù)篩選出的差異表達基因芯片數(shù)據(jù),我們發(fā)現(xiàn)228 個Lnc RNA 在PTC和配對非癌組織之間有差異表達(差異倍數(shù)≥2.0,P<0.05)。其中207 個LncRNAs 下調(diào),21 個LncRNAs上調(diào)。n336302 所對應(yīng)的lncRNA(差異倍數(shù):26.32)是上調(diào)最大的LncRNA,n407932 所對應(yīng)的lncRNA 是下調(diào)最大的lncRNAs(差異倍數(shù):263.1579),結(jié)果如圖1A、B。
同樣,我們采用差異倍數(shù)≥2.0,P<0.05 的標(biāo)準(zhǔn)篩選甲狀腺乳頭狀癌的差異表達基因,發(fā)現(xiàn)共有364 個mRNA 在PTC 和成對癌旁非癌組織中差異表達。其中,有82 個mRNA 表達上調(diào),282 個mRNA 表達下調(diào)。上調(diào)的差異基因有FN1、MXRA5、DUSP6、TGFβR1、CTGF,其中纖維連接蛋白1(Fibronectin1,F(xiàn)N1)是上調(diào)差異基因中差異倍數(shù)最大的基因(FC=94.12)。下調(diào)的差異基因有TPO、GOLGA8Q、FCGBP、KIT、PLA2R1等,TPO(甲狀腺過氧化物酶)是其中下調(diào)最明顯的基因(FC=400),結(jié)果如圖1C、D。
2.2 差異基因的GO 功能富集分析及KEGG 通路分析 差異基因在GO 分析中分為三個功能群:生物過程、分子功能及細(xì)胞成分。根據(jù)KFGG 通路分析,在篩選的差異表達基因中共有13 條通路富集,分別是“小細(xì)胞肺癌”、 “甲狀腺激素合成”、胰液分泌”、“TGF-β信號通路”、“補體和凝血級聯(lián)”、“色氨酸代謝”、“蛋白多糖在癌癥中的作用”、“胃酸分泌”、“胰高血糖素信號”、“ECM-受體相互作用”、“礦物吸收”、“焦點粘連”和“金葡菌感染”(圖1E)。差異基因在生物過程中主要富集于“負(fù)增長調(diào)節(jié)”?!暗鞍酌附Y(jié)合”在分子功能中顯著富集。在細(xì)胞組成中,差異基因主要富集在“細(xì)胞外小體”(圖1F)。
圖1 甲狀腺乳頭狀癌中差異表達的基因A表示差異LncRNAs的火山圖,B為差異LncRNAs的熱圖,C表示篩選出的差異基因的火山圖,D表示差異基因的熱圖,火山圖顯示差異基因的表達,log 2值(折疊變化)>1.5,P<0.05。E表示KEGG通路排名前十的富集圖,F(xiàn)表示上調(diào)差異基因GO功能分析各條目前5位
2.3 差異基因蛋白互作網(wǎng)絡(luò)分析 我們使用STRING在線分析軟件進一步分析差異表達基因中的關(guān)鍵基因,將364 個差異表達基因進行在線分析,得出如下差異基因的蛋白共表達網(wǎng)絡(luò)圖。篩選條件:score ≥0.4。并且score 得分越高表明兩基因間的相互作用越強(圖3A)。為進一步篩選出作用的關(guān)鍵基因,我們選取了score 得分最高,即相互作用最強基因,ATP6V1A、TGFβR1、BCL2、SPARC、CFH、ATP6V1F、ITGβ1、FN1、ITGA8、KCNQ1、CFI、SMAD9、BID、ITGAV 及KCNJ2 等15 個關(guān)鍵基因(圖2 B)。TGCA 數(shù)據(jù)庫中進行生存分析顯示,對DFS 有差異的是FN1(圖3 A)、SPARC(圖3 B);與OS相關(guān)的是TGFβR1(圖3 4C)、SMAD9(圖3 D)。
PTC 是世界上最常見的內(nèi)分泌相關(guān)癌癥之一,其發(fā)病率在過去的近30 年里幾乎增加兩倍[5]。有研究表明,TERT 突變、BRAF V600E 突變和RET/PTC 重排等遺傳變異都是腫瘤增殖和轉(zhuǎn)移的原因之一[6-8]。PTC 的確切發(fā)病機制仍不清楚。因此,識別和鑒定與PTC 相關(guān)的關(guān)鍵基因具有十分重要的意義。在目前的研究中,我們的結(jié)果提供了一個全面的生物信息學(xué)分析的基因和途徑,可能參與了PTC 的進展,我們將篩選出的4 個基因進行簡要介紹。
纖維連接蛋白1(FN1)參與細(xì)胞的粘附和遷移過程,包括胚胎發(fā)生、傷口愈合、凝血、宿主防御、轉(zhuǎn)移,并參與各種生化過程[9]。FN1 在多種腫瘤中表達,既是促癌基因又是抑癌基因。同時研究顯示,在甲狀腺乳頭狀癌中,F(xiàn)N1 促進甲狀腺乳頭狀癌的增殖、粘附、遷移和侵襲[7];FN1 的過表達是甲狀腺癌侵襲性的重要因素,我們研究同樣顯示,F(xiàn)N1 在甲狀腺乳頭狀癌組織中表達是上調(diào)的,生存分析提示,高表達的FN1 與甲狀腺乳頭狀癌的預(yù)后正相關(guān),提示FN1 在甲狀腺乳頭狀癌中發(fā)揮致癌基因的作用,F(xiàn)N1 是甲狀腺乳頭狀癌的一個潛在靶點。
圖2 A圖為PTC患者中相關(guān)差異表達基因蛋白共表達的網(wǎng)絡(luò)圖,B圖為STRING在線軟件篩選的15個關(guān)鍵基因的蛋白共表達網(wǎng)絡(luò)圖
圖3 根據(jù)Kaplan-Meier估計的TCGA數(shù)據(jù)
基質(zhì)細(xì)胞蛋白SPARC(分泌蛋白酸性,富含半胱氨酸,又稱骨連接蛋白或BM-40)是一種膠原結(jié)合蛋白,具有誘導(dǎo)細(xì)胞聚集和影響細(xì)胞增殖的功能[10]。SPARC在腫瘤細(xì)胞的轉(zhuǎn)移和侵襲中發(fā)揮著重要作用,是一種多面蛋白。SPARC 在甲狀腺癌中的報道較少,本研究生存分析顯示高表達SPARC 的甲狀腺乳頭狀癌患者具有更長的生存預(yù)后,提示SPARC 在甲狀腺乳頭狀癌中發(fā)揮抑癌基因的作用,但其具體機制仍有待進一步驗證。
轉(zhuǎn)化生長因子β(Transforming Growth Factor-β,TGF-β)信號通路在調(diào)節(jié)細(xì)胞生長、分化、發(fā)育中具有重要的作用,與腫瘤的侵襲和轉(zhuǎn)移密切相關(guān)。TGFβR1 在TGFβ信號通路傳導(dǎo)中起著關(guān)鍵的作用。在甲狀腺癌中,TGF-β1 誘導(dǎo)高遷移率組A(HMGA 1)使得促進甲狀腺癌的增殖及侵襲。通過顯微解剖中央和浸潤區(qū)腫瘤組織的寡核苷酸芯片分析發(fā)現(xiàn)人乳頭狀甲狀腺癌組織中TGF-β1 的表達高于正常甲狀腺組織[11]。
我們對甲狀腺乳頭狀癌差異基因的信號通路富集分析結(jié)果同樣提示TGF-β信號通路參與了甲狀腺腺癌的發(fā)生發(fā)展。TGF-β1、SMAD9 在甲狀腺乳頭狀癌中表達上調(diào),生存分析提示與SMAD9 與TGF-β1 甲狀腺乳頭狀癌的總生存(OS)相關(guān)。