劉皓,曲一丹,周昊,趙俊江,鄭自文,張堅(jiān)
(1 青島大學(xué)醫(yī)學(xué)部,山東 青島 266071;2 青島大學(xué)附屬醫(yī)院普外科)
乳癌是常見(jiàn)的惡性腫瘤之一,在女性中其發(fā)病率高居全球首位[1]。目前,臨床上對(duì)乳癌確診依靠組織活檢,根據(jù)組織中的腫瘤標(biāo)記物對(duì)疾病進(jìn)行診治。但這種方法侵入性強(qiáng),動(dòng)態(tài)性檢查效果差。隨著乳癌病人對(duì)常規(guī)療法的耐藥性逐漸增加,需進(jìn)一步尋找有效的分子靶標(biāo)進(jìn)行靶向治療。外周血單個(gè)核細(xì)胞(PBMC)主要由包括淋巴細(xì)胞和單核細(xì)胞在內(nèi)的機(jī)體免疫細(xì)胞組成,在人體的免疫防御系統(tǒng)中發(fā)揮至關(guān)重要作用。癌組織可能將癌細(xì)胞釋放到血液中,被PBMC 吞噬并表達(dá)癌細(xì)胞含有的標(biāo)志物,這種變化可能比存在于外周血中的腫瘤細(xì)胞更早被檢測(cè)到。通過(guò)發(fā)現(xiàn)PBMC基因的變化,有助于對(duì)浸潤(rùn)性乳癌進(jìn)行早期的診斷與治療。生物信息學(xué)與微陣列技術(shù)可為深度研究腫瘤在基因組水平上的發(fā)展進(jìn)程提供幫助。本文研究應(yīng)用生物信息學(xué)方法,通過(guò)微陣列數(shù)據(jù)的挖掘與分析,確定浸潤(rùn)性乳癌病人PBMC中的核心(HUB)基因,預(yù)測(cè)并構(gòu)建與其對(duì)應(yīng)的調(diào)控網(wǎng)絡(luò),為探討浸潤(rùn)性乳癌的生物學(xué)過(guò)程及臨床診療提供理論依據(jù)。
從基因表達(dá)綜合數(shù)據(jù)庫(kù)(GEO)(http://www.ncbi.nlm.nih.gov/geo/)中獲取所需基因表達(dá)數(shù)據(jù)GSE27562(截止日期2019-05-25)。篩選條件:①樣本總量>30;②樣本資料來(lái)源于臨床病人;③原始芯片數(shù)據(jù)提取,實(shí)驗(yàn)類(lèi)型為Expression profiling by array。共采集了162例樣本,選取其中的57 例經(jīng)活檢證實(shí)為浸潤(rùn)性乳癌病人的術(shù)前外周血樣本,31例經(jīng)乳房X 線攝影檢查結(jié)果為陰性的健康人外周血樣本。
應(yīng)用GEO 中GEO2R 在線分析工具(http://www.ncbi.nlm.nih.gov/geo/geo2r/)對(duì)差異基因進(jìn)行分析。篩選標(biāo)準(zhǔn):P<0.05,校正P值(adjustedP-value)<0.05,基因表達(dá)值倍數(shù)變化(FC)≥0.8。應(yīng)用Metascape數(shù)據(jù)庫(kù)將不同基因的名稱(chēng)轉(zhuǎn)換成統(tǒng)一的標(biāo)準(zhǔn)縮寫(xiě)。
應(yīng)用DAVID6.8(https://david.ncifcrf.gov/home.jsp)富集分析差異表達(dá)的基因,揭示其生物學(xué)功能。分別進(jìn)行GO 功能注釋分析和KEGG 信號(hào)通路分析,獲得差異表達(dá)基因的基因功能和信號(hào)通路的功能。GO 富集標(biāo)準(zhǔn):最小交集≥5、P≤0.05。KEGG 富集標(biāo)準(zhǔn):最小交集≥3、P≤0.05。
應(yīng)用STRING 數(shù)據(jù)庫(kù)(https://string-db.org)構(gòu)建PPI網(wǎng)絡(luò)。存在互作的閾值條件為:minimum required interaction score>0.4。使用CytoScape軟件可視化PPI數(shù)據(jù)。
應(yīng)用CytoScape軟件中的cytohubba插件,選取MCC、Degree、Bottleneck方法分別篩選出前10個(gè)差異表達(dá)基因。將上述3種方法篩選到的基因提交至Veen(http://bioinformatics.psb.ugent.be/webtools/Venn/)在線工具,獲取三者交集,交集的節(jié)點(diǎn)對(duì)應(yīng)的基因?yàn)榫哂兄匾碚{(diào)節(jié)功能的HUB基因。
應(yīng)用mir DIP在線工具進(jìn)行分析、預(yù)測(cè)HUB基因上游互作miRNA。獲得m RNA-miRNA 相互關(guān)系文件并導(dǎo)入CytoScape軟件進(jìn)行網(wǎng)絡(luò)可視化。篩選標(biāo)準(zhǔn):Score class:top 1%,Integrated Score≥0.6,miRNA 至少與兩個(gè)及兩個(gè)以上HUB 基因互相關(guān)聯(lián)。將符合標(biāo)準(zhǔn)的miRNA 提交至star Base在線工具,獲得lncRNA 關(guān)系對(duì)。將miRNA-lnc RNA相互關(guān)系文件導(dǎo)入CytoScape軟件進(jìn)行網(wǎng)絡(luò)可視化。篩選標(biāo)準(zhǔn):CLIP-Data≥5,miRNA 至少與兩個(gè)及兩個(gè)以上的lncRNA 相互關(guān)聯(lián)。
匯總lnc RNA、miRNA、m RNA 的相應(yīng)結(jié)果,建立相互關(guān)系文件。使用CytoScape軟件構(gòu)建可視化m RNA-miRNA-lncRNA 的三元關(guān)系調(diào)控網(wǎng)絡(luò)。
共獲得差異基因87個(gè),其中上調(diào)基因59個(gè),下調(diào)基因28個(gè)。其火山圖見(jiàn)圖1A。依據(jù)log FC 絕對(duì)值大小排序,排名前10 的上調(diào)差異基因分別為FOS、NR4A2、DDX6、USP9X、CXCL8、CTSZ、DUSP1、INO80D、EGR1及ARHGEF7,排名前10的下調(diào)差異基因則分別為PRKD2、HBD、PSPH、HBM、SLC25A37、HBG2、MS4A3、HINT3、CLC、ALAS2。
GO 分析結(jié)果顯示,細(xì)胞組成(CC)主要涉及血紅蛋白復(fù)合物、胞漿、血液微粒、胞外外體、膜、細(xì)胞間黏附連接等。生物過(guò)程(BP)主要涉及細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)、血管生成正調(diào)節(jié)、RNA 聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄的正調(diào)控、血凝、細(xì)胞間黏附等進(jìn)程。分子功能(MF)則主要包含蛋白結(jié)合、鈣黏蛋白結(jié)合參與細(xì)胞間黏附、血紅素結(jié)合等(圖1B)。KEGG 富集結(jié)果顯示,差異基因主要與甲型流感病毒感染、單純皰疹病毒感染、破骨細(xì)胞分化、炎癥性腸病(IBD)、利什曼病、類(lèi)風(fēng)濕性關(guān)節(jié)炎等信號(hào)通路相關(guān)(圖1C)。
圖1 差異基因火山圖及GO與KEGG分析結(jié)果
PPI網(wǎng)絡(luò)共涉及67個(gè)節(jié)點(diǎn)和88個(gè)邊緣。PPI富集P-value:<4.69e-14。PPI網(wǎng)絡(luò)文件導(dǎo)入CytoScape軟件中進(jìn)行可視化(圖2A),使用MCC、Bottleneck、Degree分析方法分別篩選出前10個(gè)候選基因(圖2B),使用Venn在線工具獲取3種算法的交集基因,將這些基因定義為HUB基因,分別為ALAS2、EGR1、FOS、DUSP1。見(jiàn)圖2C、表1。
圖2 PPI網(wǎng)絡(luò)與HUB基因
表1 診斷候選基因篩選結(jié)果
將4 個(gè)診斷候選基因提交至mir DIP 進(jìn)行分析,結(jié)果顯示62個(gè)上游互作miRNA 符合標(biāo)準(zhǔn)。利用CytoScape軟件構(gòu)建miRNA-lncRNA 相互關(guān)系網(wǎng)絡(luò)(圖3A)。ALAS2基因無(wú)符合后續(xù)篩選條件的miRNA。其他3個(gè)HUB基因與7個(gè)miRNA 符合后續(xù)篩選條件,并提交至star Base進(jìn)行分析,結(jié)果顯示共有119 個(gè)miRNA-lncRNA 關(guān)系對(duì),符合篩選條件的lncRNA 基因?yàn)?0個(gè)。見(jiàn)圖3B、表2。
表2 符合條件的診斷候選基因與上游互作miRNA、lncRNA
匯總分析符合篩選條件的miRNA 及l(fā)ncRNA和HUB 基因之間的關(guān)系,使用CytoScape軟件展現(xiàn)的lncRNA、miRNA、m RNA 相互作用關(guān)系網(wǎng)絡(luò)見(jiàn)圖3C。
圖3 lncRNA/circRNA-miRNA-mRNA網(wǎng)絡(luò)結(jié)構(gòu)及其通路調(diào)控
對(duì)浸潤(rùn)性乳癌的診斷治療研究一直是近年來(lái)的熱點(diǎn),但乳癌起病隱匿,早期臨床癥狀不顯著,容易錯(cuò)過(guò)最佳診療時(shí)機(jī)[2]。我國(guó)乳癌發(fā)病率和死亡率近年來(lái)有增高趨勢(shì)。尋找乳癌非侵入性診療的新靶點(diǎn)對(duì)乳癌早期診治至關(guān)重要。
癌細(xì)胞在一定情況下會(huì)進(jìn)入到外周血中,被外周循環(huán)中的PBMC所吞噬,在PBMC中表達(dá)腫瘤細(xì)胞的標(biāo)志物;同時(shí),PBMC 自身就擁有部分循環(huán)腫瘤細(xì)胞和腫瘤干細(xì)胞。所以,理論上來(lái)講可以通過(guò)PBMC對(duì)癌癥進(jìn)行檢測(cè)。本研究尋找PBMC 差異基因并進(jìn)行分析,有助于了解乳癌疾病進(jìn)程以及發(fā)生發(fā)展機(jī)制,為乳癌的診治提供理論支持。
微陣列技術(shù)和生物信息學(xué)分析已廣泛用于基因組水平上篩選遺傳變異,是明確人類(lèi)腫瘤發(fā)生機(jī)制、確定潛在診治靶向的有力工具?;跀?shù)據(jù)庫(kù)的生物信息學(xué)技術(shù)有助于人們?nèi)娣治鲆阎蛐碌幕蚪M、蛋白質(zhì)數(shù)據(jù)等。本文對(duì)比了GSE27562芯片數(shù)據(jù)集內(nèi)經(jīng)組織活檢確診的浸潤(rùn)性乳癌與非腫瘤病人的PBMC,兩者基因表達(dá)存在差異,表明腫瘤組織的存在影響PBMC 中基因的表達(dá)。GO 分析結(jié)果表明,顯著富集的模塊在MF中的血紅蛋白復(fù)合物上,其次是CC 的胞漿組分上,BP主要富集于RNA 聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄的正調(diào)控、細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)方面。表明乳房腫瘤病人的PBMC影響細(xì)胞增殖、轉(zhuǎn)錄活性,使其增強(qiáng)。KEGG 通路富集分析顯示,差異基因主要與類(lèi)風(fēng)濕性關(guān)節(jié)炎、單純皰疹病毒感染、破骨細(xì)胞分化、甲型流感病毒感染等發(fā)生發(fā)展有關(guān)。相關(guān)研究顯示,乳癌可誘導(dǎo)破骨細(xì)胞的活化,延長(zhǎng)破骨細(xì)胞的存活[3-4],推測(cè)這也與乳癌病人骨轉(zhuǎn)移、骨溶解、骨質(zhì)破壞相關(guān)。ANDTBACKA 等[5]研究顯示,溶瘤病毒可以通過(guò)不斷增殖與增強(qiáng)免疫應(yīng)答的方式,使癌細(xì)胞裂解,發(fā)揮抗腫瘤的作用。溶瘤性單純皰疹病毒能夠感染腫瘤細(xì)胞并大量復(fù)制,腫瘤細(xì)胞受到其直接細(xì)胞毒的作用而死亡[6],這種方式不僅可以高效抗腫瘤并對(duì)人體影響較小。目前有研究顯示,單純皰疹病毒中的G47能通過(guò)HER-2磷酸化抑制HER-2陽(yáng)性乳癌細(xì)胞的生長(zhǎng)、增殖,并促進(jìn)癌細(xì)胞凋亡[7],這種基于病毒的生物免疫療法對(duì)前列腺癌[8]、神經(jīng)內(nèi)分泌腫瘤[9]的診治有幫助。流感病毒基因能夠攜帶外來(lái)DNA,使機(jī)體產(chǎn)生明顯的細(xì)胞、體液免疫應(yīng)答。流感病毒可以作為基因治療載體,擁有潛在靶向攻擊腫瘤細(xì)胞的能力。盡管類(lèi)風(fēng)濕性關(guān)節(jié)炎與乳癌的關(guān)系鮮有研究,但我們推測(cè)乳癌可能有影響人體發(fā)生類(lèi)風(fēng)濕性關(guān)節(jié)炎等免疫性疾病的風(fēng)險(xiǎn),需實(shí)驗(yàn)進(jìn)一步驗(yàn)證。本研究結(jié)果表明,浸潤(rùn)性乳癌病人的某些感染通路可以被活化,通過(guò)對(duì)這些通路進(jìn)行免疫治療可能減緩乳房腫瘤的發(fā)生發(fā)展。這些與通路相關(guān)的基因是治療的新靶點(diǎn)。這些信號(hào)通路可能涉及乳癌的產(chǎn)生及發(fā)展過(guò)程中的各個(gè)環(huán)節(jié)與步驟,不同的環(huán)節(jié)相互作用對(duì)乳癌發(fā)生發(fā)展產(chǎn)生影響。應(yīng)用病原感染激活免疫系統(tǒng)消滅腫瘤細(xì)胞,其基礎(chǔ)理論與臨床治療均可行。
本文研究通過(guò)構(gòu)建PPI網(wǎng)絡(luò),采用3種不同的方法篩選獲得了HUB基因ALAS2、EGR1、DUSP1、FOS。ALAS2基因的產(chǎn)物是一種紅系特異性線粒體定位酶,其編碼的蛋白質(zhì)催化血紅素生物合成途徑的第一步,但該基因與癌癥的關(guān)系目前鮮有文獻(xiàn)報(bào)道。EGR1基因編碼的蛋白質(zhì)具有轉(zhuǎn)錄調(diào)節(jié)功能,影響著細(xì)胞分化與有絲分裂的進(jìn)程;還有研究表明,EGR1是一個(gè)抑癌基因,EGR1影響了乳癌、前列腺癌、胃癌的發(fā)生發(fā)展[10-12]。乳癌EGR1過(guò)表達(dá)病人經(jīng)過(guò)內(nèi)分泌治療后往往預(yù)后良好[13]。FOS是一種原癌基因,其所屬的基因家族能夠編碼亮氨酸拉鏈蛋白,其在信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞增殖和分化中占據(jù)重要位置。國(guó)外研究顯示,乳癌活檢組織中FOS表達(dá)較正常組織明顯增高,FOS的胞質(zhì)活性為控制乳癌生長(zhǎng)的潛在靶標(biāo)[14]。DUSP1可以使MAP激酶MAPK1/ERK2去磷酸化,進(jìn)而參與多個(gè)細(xì)胞過(guò)程。BOULDING 等[15]研究結(jié)果顯示,DUSP1可以參與到上皮-間質(zhì)轉(zhuǎn)化(EMT)和乳癌干細(xì)胞調(diào)節(jié)的過(guò)程,從而干預(yù)乳癌的發(fā)生和進(jìn)展。這些HUB 基因在PBMC中的表達(dá)影響著乳癌的生物進(jìn)程。多個(gè)HUB基因在組織同時(shí)表達(dá)表明腫瘤或腫瘤基質(zhì)與外周血PBMC之間存在關(guān)聯(lián);腫瘤基質(zhì)分泌的蛋白與PBMC中的受體結(jié)合,影響著PBMC在外周血中表達(dá)的改變。這些基因的發(fā)現(xiàn)有助于促進(jìn)乳房腫瘤非侵入性診療的發(fā)展。
miRNA 可以參與基因表達(dá)調(diào)控的重要進(jìn)程中。本研究顯示,miR-144-3p表達(dá)與乳癌的分期分級(jí)相關(guān)[16]。miR-181c-5p、miR-181d-5p、miR-181b-5p、miR-181a-5p均已經(jīng)被證明參與乳癌的發(fā)生及轉(zhuǎn)移的相關(guān)進(jìn)程[17-19]。miR-543過(guò)表達(dá)可抑制細(xì)胞增殖和細(xì)胞周期,上調(diào)細(xì)胞凋亡,并通過(guò)直接靶向ERK/MAPK 抑制乳癌細(xì)胞的增殖[20]。miR-101-3p的表達(dá)上調(diào)及下調(diào)與乳房腫瘤細(xì)胞的侵襲性相關(guān)[21];同時(shí),miR-101-3p可與多種靶基因結(jié)合,對(duì)乳癌發(fā)展、轉(zhuǎn)移以及癌細(xì)胞的增殖過(guò)程產(chǎn)生抑制作用,并促進(jìn)腫瘤細(xì)胞凋亡[22-24]。這些miRNA 影響著乳癌的發(fā)生、發(fā)展,可能成為診治靶標(biāo)。
Lnc RNA 被認(rèn)為是多種癌癥(包括浸潤(rùn)性乳癌)發(fā)生發(fā)展的生物標(biāo)記物。本文研究共發(fā)現(xiàn)20個(gè)符合條件的上游lncRNA,其中XIST、SN HG7、SN HG5、SNHG1、OIP5-AS1、NORAD、NEAT1、MIR4458 HG、MALAT1、KCNQ1OT1等涉及乳癌的發(fā)生發(fā)展。其作用機(jī)制主要包括兩個(gè)方面:①通過(guò)對(duì)miRNA 的調(diào)控,上調(diào)或下調(diào)靶向基因的表達(dá),間接對(duì)癌癥的發(fā)展發(fā)揮促進(jìn)或者抑制的作用,這些Lnc RNA 包括SN HG7、SN HG5、SN HG1、XIST、OIP5-AS1和KCNQ1OT1[25-30];②通過(guò)直接對(duì)乳癌細(xì)胞信號(hào)通路進(jìn)行調(diào)控影響其生物學(xué)進(jìn)程,這些Lnc RNA 包 括NEAT1、NORAD、MALAT1[31-33]。本文研究發(fā)現(xiàn)的20個(gè)上游lncRNA 影響浸潤(rùn)性乳癌的發(fā)展、轉(zhuǎn)移、增殖和侵襲等進(jìn)程。目前,有關(guān)浸潤(rùn)性乳癌病人PBMC中l(wèi)nc RNA 的生物信息數(shù)據(jù)、文獻(xiàn)較少,相關(guān)m RNA、lncRNA 的研究有待進(jìn)一步深入。
綜上所述,本文使用綜合的生物信息學(xué)分析方法,獲得浸潤(rùn)性乳癌病人的PBMC 差異基因,并尋找到其中的HUB 基因。然后通過(guò)預(yù)測(cè)HUB 基因上游的miRNA、lncRNA,構(gòu)建了m RNA-miRNAlncRNA 可視化網(wǎng)絡(luò)以顯示基因分子間的相互作用關(guān)系。本文結(jié)果為通過(guò)外周血PBMC 對(duì)浸潤(rùn)性乳癌進(jìn)行早期診斷及臨床精準(zhǔn)治療、靶向治療提供可靠的理論基礎(chǔ)與方向。