朱小青,羅楓
廣州醫(yī)科大學(xué)附屬第六醫(yī)院 清遠(yuǎn)市人民醫(yī)院,廣東清遠(yuǎn)511500
宮頸鱗狀細(xì)胞癌是女性最常見(jiàn)的惡性腫瘤之一,近年來(lái)發(fā)病呈年輕化趨勢(shì)[1]。高危型HPV(HR-HPV)感染是宮頸鱗狀細(xì)胞癌的主要病因[2],然而并不是所有HR-HPV均導(dǎo)致宮頸癌的發(fā)生,仍有一部分為非依賴HPV的宮頸鱗狀細(xì)胞癌,其具體機(jī)制尚未完全闡明。環(huán)狀RNA(circRNA)是最早在仙臺(tái)病毒中被發(fā)現(xiàn)的一類(lèi)非編碼RNA(ncRNA)[3],普遍存在于真核細(xì)胞基因組中。最近研究顯示,circRNA異常表達(dá)參與了宮頸鱗狀細(xì)胞癌的發(fā)生、發(fā)展[4,5]。本研究利用生物信息學(xué)方法對(duì)GEO數(shù)據(jù)庫(kù)中宮頸鱗狀細(xì)胞癌circRNA表達(dá)譜芯片進(jìn)行分析,篩選宮頸鱗狀細(xì)胞癌組織與正常宮頸組織中差異表達(dá)的circRNA,并預(yù)測(cè)明顯差異表達(dá)circRNA下游的miRNA及mRNA,為尋找宮頸鱗狀細(xì)胞癌circRNA調(diào)控路徑及治療靶點(diǎn)提供一定的研究基礎(chǔ)。
1.1 數(shù)據(jù)來(lái)源 宮頸鱗狀細(xì)胞癌芯片數(shù)據(jù)GSE102686來(lái)源于美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)的GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)。本數(shù)據(jù)集來(lái)自Agilent-069978 Arraystar Human circRNA microarray V1芯片數(shù)據(jù)共10例,其中宮頸鱗狀細(xì)胞癌組織5例、配對(duì)的癌旁組織5例。
1.2 差異表達(dá)circRNA的篩選 通過(guò)GEO自帶在線分析工具GEO2R進(jìn)行分析,設(shè)定篩選條件為癌組織相對(duì)正常組織表達(dá)量變化≥2倍且P<0.05,得到差異表達(dá)的circRNA。
1.3 差異表達(dá)circRNA結(jié)合的miRNA及靶基因預(yù)測(cè) 選取表達(dá)上調(diào)或下調(diào)circRNA中|logFC|排前5的circRNA,定義為差異表達(dá)最顯著的circRNA。通過(guò)CSCD網(wǎng)站(http://gb.whu.edu.cn/CSCD/)[6]預(yù)測(cè)這些circRNA結(jié)合的miRNA。再通過(guò)三個(gè)生物信息學(xué)網(wǎng)站miRDB(http://mirdb.org/)[7]、TargetScan(http://www.targetscan.org/vert_72/)[8]及RNAInter(http://www.rna-society.org/rnainter/)[9]預(yù)測(cè)每個(gè)miRNA的靶基因(mRNA)。為減少假陽(yáng)性,選取三個(gè)網(wǎng)站都能預(yù)測(cè)到且得分較高的mRNA。
1.4 靶基因功能分析 通過(guò)在線生物信息注釋數(shù)據(jù)庫(kù)DAVID(Database for Annotation ,Visualization and Integrated Discovery)[10]對(duì)“1.3”所得mRNA進(jìn)行基因本體(GO)和京都基因與基因組百科全書(shū)(KEGG)分析。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.5 靶基因蛋白相互作用(PPI)網(wǎng)絡(luò)分析及宮頸癌關(guān)鍵基因篩選 應(yīng)用STRING在線工具分析預(yù)測(cè)出的靶基因的PPI網(wǎng)絡(luò),將數(shù)據(jù)輸出并導(dǎo)入Cytoscape軟件,通過(guò)MCODE插件篩選關(guān)鍵基因。MCODE的標(biāo)準(zhǔn)設(shè)置:度值截止=2,節(jié)點(diǎn)得分截止值=0.2,K核心值=2。以MCODE≥2者作為宮頸癌關(guān)鍵基因。
1.6 關(guān)鍵基因表達(dá)與患者預(yù)后的關(guān)系分析 利用Kaplan-Meier Plotter在線數(shù)據(jù)庫(kù)[11](http://www.kmplot.com/),在pan-cancer里選中包含304例宮頸鱗狀細(xì)胞癌患者的數(shù)據(jù)庫(kù)。輸入關(guān)鍵基因,分析關(guān)鍵基因表達(dá)水平與宮頸鱗狀細(xì)胞癌患者預(yù)后的關(guān)系。
2.1 宮頸鱗狀細(xì)胞癌組織與正常組織中差異表達(dá)的circRNA 共篩選出199個(gè)差異表達(dá)的circRNA,其中在宮頸鱗狀細(xì)胞癌中表達(dá)上調(diào)91個(gè)、表達(dá)下調(diào)108個(gè)。選取其中表達(dá)變化最顯著的5個(gè)circRNA(見(jiàn)表1)進(jìn)行后續(xù)分析。
2.2 差異表達(dá)circRNA結(jié)合的miRNA及靶基因 通過(guò)CSCD網(wǎng)站預(yù)測(cè)上述顯著差異表達(dá)的circRNA結(jié)合的miRNA共390個(gè),其中表達(dá)上調(diào)circRNA結(jié)合的miRNA為227個(gè)、表達(dá)下調(diào)circRNA結(jié)合的miRNA為163個(gè)。通過(guò)三個(gè)生物信息學(xué)網(wǎng)站均能預(yù)測(cè)到且得分高的miRNA下游靶基因共415個(gè)。
表1 宮頸鱗狀細(xì)胞癌組織和正常對(duì)照組織中表達(dá)顯著上調(diào)或下調(diào)的circRNA
2.3 靶基因GO及KEGG分析結(jié)果 DAVID在線數(shù)據(jù)庫(kù)分析上述415個(gè)靶基因,進(jìn)行GO及KEGG分析。這些基因主要參與的生物過(guò)程包括轉(zhuǎn)錄調(diào)控、DNA模板、凋亡過(guò)程、RNA聚合酶Ⅱ啟動(dòng)子的轉(zhuǎn)錄;參與細(xì)胞成分包括細(xì)胞核、細(xì)胞內(nèi)成分、細(xì)胞連接、神經(jīng)元投射;相關(guān)分子功能包括蛋白質(zhì)結(jié)合、金屬離子結(jié)合、DNA結(jié)合、核酸結(jié)合、轉(zhuǎn)錄因子活性、序列特異性DNA結(jié)合。詳見(jiàn)表2。靶基因涉及的信號(hào)通路主要富集在p53信號(hào)通路、縫隙連接、趨化因子信號(hào)通路。
表2 宮頸鱗狀細(xì)胞癌差異表達(dá)circRNA下游預(yù)測(cè)靶基因的GO分析
2.4 靶基因PPI網(wǎng)絡(luò)分析及關(guān)鍵基因篩選結(jié)果 將上述415個(gè)靶基因輸入STRING在線工具,再將所得數(shù)據(jù)導(dǎo)入Cytoscape軟件,得到PPI網(wǎng)絡(luò),并通過(guò)MCODE插件共篩選出6個(gè)關(guān)鍵基因(KLHL11、NMU、PARP11、CPLX2、RTKN2、LY6G6C)。
2.5 關(guān)鍵基因表達(dá)與宮頸鱗狀細(xì)胞癌患者預(yù)后的關(guān)系 將關(guān)鍵基因KLHL11、NMU、PARP11、CPLX2、RTKN2、LY6G6C輸入Kaplan-Meier Plotter在線數(shù)據(jù)庫(kù),發(fā)現(xiàn)KLHL11高表達(dá)、LY6G6C低表達(dá)與宮頸鱗狀細(xì)胞癌患者總生存率不良有關(guān)。KLHL11對(duì)應(yīng)的上游miRNA及circRNA分別是hsa-miR-132-3p、hsa_circ_0031027;LY6G6C對(duì)應(yīng)的上游miRNA及circRNA分別是hsa-miR-4747-5p、hsa_circ_0075341。
circRNA是1976年由Sanger等[12]在病毒中首次發(fā)現(xiàn)的。隨著高通量測(cè)序及生物信息學(xué)的發(fā)展,大量?jī)?nèi)源性的circRNA被證實(shí)存在于各類(lèi)細(xì)胞中,并發(fā)現(xiàn)其有相當(dāng)復(fù)雜的功能,不但參與基因的一系列調(diào)控,有的circRNA還能編碼蛋白質(zhì)。最近也有越來(lái)越多的研究報(bào)道,在多種惡性腫瘤[4,13~15]中均能檢測(cè)到異常表達(dá)的circRNA。
既往的研究認(rèn)為宮頸鱗狀細(xì)胞癌的發(fā)生與HPV密切相關(guān),但仍存在少部分HPV非依賴的宮頸鱗狀細(xì)胞癌。近期有研究發(fā)現(xiàn),circRNA在宮頸鱗狀細(xì)胞癌的發(fā)生發(fā)展過(guò)程中同樣起著調(diào)控作用。競(jìng)爭(zhēng)性內(nèi)源RNA假說(shuō)指出,通過(guò)競(jìng)爭(zhēng)性結(jié)合共同的miRNA可以實(shí)現(xiàn)RNA之間的相互調(diào)節(jié)[16]。circRNA作為一種內(nèi)源性ncRNA,可調(diào)控基因表達(dá),通過(guò)多種機(jī)制參與腫瘤的進(jìn)展,其中“miRNA海綿”是最重要的機(jī)制[17]。有研究發(fā)現(xiàn),circSMARCA5在宮頸癌細(xì)胞中表達(dá)降低,其過(guò)表達(dá)可誘導(dǎo)腫瘤細(xì)胞周期阻滯,抑制細(xì)胞增殖、遷移和侵襲[18],并進(jìn)一步證實(shí)circSMARCA5與miRNA-620相互作用導(dǎo)致其表達(dá)被抑制。最近的一項(xiàng)研究結(jié)果表明,has_circ_0000263可與miRNA-150-5p結(jié)合,影響宮頸癌細(xì)胞的生長(zhǎng)和遷移[19]。有學(xué)者認(rèn)為,circRNA在腫瘤細(xì)胞中發(fā)揮重要作用,可能成為一種新的生物標(biāo)志物和治療靶點(diǎn)[5,15]。
本研究通過(guò)分析GEO數(shù)據(jù)庫(kù)中宮頸鱗狀細(xì)胞癌circRNA表達(dá)譜芯片數(shù)據(jù)(GSE102686),發(fā)現(xiàn)了199個(gè)差異表達(dá)circRNA,其中表達(dá)上調(diào)circRNA 91個(gè)、表達(dá)下調(diào)circRNA 108個(gè)。這些差異表達(dá)最為明顯的circRNA以及它們調(diào)控的下游miRNA在宮頸鱗狀細(xì)胞癌中報(bào)道較少,但最近有研究發(fā)現(xiàn)hsa_circ_0000745通過(guò)下調(diào)E-cadherin的表達(dá)來(lái)增強(qiáng)腫瘤細(xì)胞的增殖、遷移和侵襲能力,認(rèn)為其可能是臨床治療宮頸鱗狀細(xì)胞癌的候選靶點(diǎn)[4]。有學(xué)者發(fā)現(xiàn),hsa_circ_0075341通過(guò)調(diào)控miR-149-5p/AURKA軸從而促進(jìn)宮頸癌細(xì)胞的增殖和侵襲[5]。相比于其他線性RNA,circRNA分子更穩(wěn)定,這些差異表達(dá)的circRNA有望成為今后研究宮頸鱗狀細(xì)胞癌新的分子標(biāo)志物。接下來(lái)本研究通過(guò)CSCD網(wǎng)站分別預(yù)測(cè)出表達(dá)上、下調(diào)最明顯的5個(gè)circRNA潛在調(diào)控的miRNA,進(jìn)一步通過(guò)三個(gè)生物信息學(xué)網(wǎng)站聯(lián)合預(yù)測(cè)miRNA下游的mRNA。對(duì)這些mRNA進(jìn)行GO及KEGG分析、PPI網(wǎng)絡(luò)分析后,得到了這些mRNA的功能、通路富集情況以及6個(gè)關(guān)鍵基因(KLHL11、NMU、PARP11、CPLX2、RTKN2、LY6G6C)。一些功能及通路已被證實(shí)在宮頸鱗狀細(xì)胞癌中起著重要作用[20]。將關(guān)鍵基因輸入Kaplan-Meier Plotter在線數(shù)據(jù)庫(kù),結(jié)果顯示KLHL11高表達(dá)、LY6G6C低表達(dá)與宮頸鱗狀細(xì)胞癌患者總生存率不佳有關(guān)。上述結(jié)果提示,差異表達(dá)的circRNA可能通過(guò)一系列circRNA-miRNA-mRNA調(diào)控模式,影響宮頸鱗狀細(xì)胞癌的發(fā)生、發(fā)展。本研究分析得出了hsa_circ_0031027-hsa-miR-132-3p-KLHL11及hsa_circ_0075341-hsa-miR-4747-5p-LY6G6C兩條可能的調(diào)控途徑。該結(jié)果有待更深入的研究去證實(shí)。
總之,本研究采用生物信息學(xué)方法對(duì)宮頸鱗狀細(xì)胞癌circRNA表達(dá)譜芯片進(jìn)行分析,預(yù)測(cè)circRNA下游的miRNA及mRNA,并找到兩條可能的調(diào)控途徑,通過(guò)今后進(jìn)一步的功能驗(yàn)證,有望為宮頸鱗狀細(xì)胞癌的研究提供新的思路,為宮頸鱗狀細(xì)胞癌治療及預(yù)后評(píng)估探索新的靶點(diǎn)。