国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

利用生物信息學(xué)分析方法識(shí)別子宮頸癌患者預(yù)后相關(guān)長(zhǎng)鏈非編碼RNA

2020-12-02 01:12齊麗榮何洪敏
關(guān)鍵詞:子宮頸癌測(cè)序通路

張 妍,李 娟,齊麗榮,何洪敏

子宮頸癌是女性常見(jiàn)的三大腫瘤之一。WHO提供的數(shù)據(jù)顯示全球范圍內(nèi)每年可以確診的子宮頸癌病例達(dá)50萬(wàn),而中國(guó)是子宮頸癌高發(fā)國(guó)家,每年確診的子宮頸癌患者達(dá)13.5萬(wàn)人,占全球確診人數(shù)的25%。近年來(lái),年輕婦女子宮頸癌的發(fā)病率呈上升趨勢(shì)[1-2]。積極探索子宮頸癌發(fā)生、發(fā)展機(jī)制及篩選預(yù)后相關(guān)分子標(biāo)志物對(duì)攻克子宮頸癌具有積極的意義。lncRNA是一類長(zhǎng)度大于200 nt的非編碼RNA,廣泛存在于真核細(xì)胞,隨著高通量測(cè)序技術(shù)的發(fā)展,人們逐漸發(fā)現(xiàn)lncRNA在各種類型腫瘤的發(fā)生、發(fā)展過(guò)程中起重要作用,但lncRNA與子宮頸癌的相關(guān)性研究目前仍處于初始階段。本實(shí)驗(yàn)主要基于腫瘤數(shù)據(jù)庫(kù)數(shù)據(jù),利用生物信息學(xué)分析方法,識(shí)別子宮頸癌預(yù)后相關(guān)的lncRNA。

1 材料與方法

1.1 數(shù)據(jù)獲取及差異lncRNA的篩選子宮頸癌轉(zhuǎn)錄組測(cè)序數(shù)據(jù)和臨床數(shù)據(jù)矩陣文件從TCGA數(shù)據(jù)庫(kù)官網(wǎng)直接下載,測(cè)序數(shù)據(jù)類型為原始數(shù)據(jù),數(shù)據(jù)下載后整理出具有完整臨床信息的306例子宮頸癌樣本及3例配對(duì)癌旁樣本信息,本實(shí)驗(yàn)數(shù)據(jù)基于數(shù)據(jù)庫(kù)不需倫理委員會(huì)批準(zhǔn),使用R軟件中的limma包篩選差異的lncRNA。

1.2 生存分析首先利用R軟件進(jìn)行Kaplan-Meier生存分析和單因素Cox分析,獲取具有統(tǒng)計(jì)學(xué)意義(P<0.05)的lncRNA,隨后將篩選出的預(yù)后相關(guān)基因進(jìn)行多因素回歸分析,以風(fēng)險(xiǎn)值=∑(基因系數(shù)×基因表達(dá)量)構(gòu)建風(fēng)險(xiǎn)模型,并分析模型的可靠性,最終確定出與子宮頸癌預(yù)后相關(guān)的lncRNA。

1.3 lncRNA靶基因的確定本實(shí)驗(yàn)采用R軟件中的Cor函數(shù)通過(guò)共表達(dá)方式進(jìn)行預(yù)后lncRNA靶基因的篩選。

1.4 lncRNA靶基因功能注釋和通路分析分別加載R軟件包“clusterProfiler”、“org.Hs.eg.db”、“enrichplot”和“ggplot2”進(jìn)行對(duì)lncRNA靶基因的GO和KEGG富集分析,GO與KEGG富集結(jié)果以氣泡圖和列表形式呈現(xiàn)。

1.5 統(tǒng)計(jì)學(xué)分析所有統(tǒng)計(jì)分析均使用R(v.3.4.3)進(jìn)行,初步篩選差異lncRNA條件為FDR<0.05且差異倍數(shù)變化>2(|logFC|>1),生存相關(guān)的預(yù)后分析涉及統(tǒng)計(jì)學(xué)意義的均選擇P<0.05,在尋找子宮頸癌預(yù)后相關(guān)lncRNA靶基因過(guò)程中實(shí)驗(yàn)選用的共表達(dá)Pearsson相關(guān)系數(shù)絕對(duì)值>0.4且P<0.05,最后在進(jìn)行GO與KEGG統(tǒng)計(jì)學(xué)分析過(guò)程中FDR<0.05為差異有統(tǒng)計(jì)學(xué)意義。

2 結(jié)果

2.1 子宮頸癌與癌旁組織差異lncRNA初步篩選對(duì)TCGA數(shù)據(jù)庫(kù)中306例子宮頸癌樣本和3例癌旁樣本進(jìn)行差異分析,以foldchange(差異倍數(shù))絕對(duì)值>2倍且FDR值<0.05為界限,初步篩選共發(fā)現(xiàn)差異lncRNA 292個(gè),其中上調(diào)的lncRNA有179個(gè),下調(diào)的lncRNA有113個(gè)(圖1)。

圖1 差異lncRNA火山圖:紅色表示上調(diào)的lncRNA,綠色表示下調(diào)的lncRNA

2.2 差異lncRNA預(yù)后相關(guān)分析分別對(duì)上述292個(gè)差異lncRNA進(jìn)行Kaplan-Meier生存分析與單因素Cox分析,然后取兩者交集,最終篩選出8個(gè)顯著差異的lncRNA,結(jié)果詳見(jiàn)表1和圖2。

圖2 8個(gè)顯著差異lncRNA的Kaplan-Meier生存分析及其與單因素Cox分析交集韋恩圖:A~H.lncRNA的Kaplan-Meier生存分析結(jié)果;I.lncRNA的Kaplan-Meier生存分析與單因素Cox分析交集韋恩圖

表1 Kaplan-Meier與單因素Cox生存分析篩選出的8個(gè)顯著差異的lncRNA

2.3 構(gòu)建7個(gè)lncRNA的多因素Cox模型對(duì)上述篩選的8個(gè)lncRNA進(jìn)行多因素Cox分析,構(gòu)建生存模型(圖3A),模型可靠性采用繪制ROC曲線形式呈現(xiàn)(圖3B)。根據(jù)風(fēng)險(xiǎn)值將樣本分為高風(fēng)險(xiǎn)與低風(fēng)險(xiǎn)兩組,進(jìn)行生存相關(guān)分析(圖3C)。

圖3 7個(gè)lncRNA構(gòu)建的預(yù)后模型:A.7個(gè)lncRNA構(gòu)建的預(yù)測(cè)模型以森林圖形式呈現(xiàn),*P<0.05,**P<0.01;B.評(píng)估模型可靠性的ROC曲線圖;C.風(fēng)險(xiǎn)值相關(guān)預(yù)后生存分析

2.4 lncRNA靶基因功能注釋利用生物信息學(xué)分析方法首先篩選多因素Cox分析構(gòu)建的基因模型中差異有顯著性的4個(gè)lncRNA,即LINC00908、LINC01305、CASC15和DLEU1的共表達(dá)靶基因,篩選條件為Pearsson相關(guān)系數(shù)絕對(duì)值>0.4,且P<0.05,最后篩選出符合條件的編碼基因1 187個(gè),最后對(duì)共表達(dá)靶基因進(jìn)行功能注釋,包括GO和KEGG,最顯著富集分析結(jié)果見(jiàn)圖4與表2(只包括GO分析中顯著的生物學(xué)過(guò)程部分,表3)。

圖4 lncRNA靶基因功能注釋圖:A.靶基因的GO分析結(jié)果;GO包括BP(生物學(xué)過(guò)程)、CC(細(xì)胞成分)和MF(分子功能)三部分,圖中顯示每部分最顯著的前10個(gè)分析;B.靶基因KEGG分析結(jié)果,紅色越紅表示顯著性強(qiáng),藍(lán)色顯示結(jié)果相反,黑色圓表示基因集中富集到該功能或者通路上的基因的數(shù)目,數(shù)目越大,表示富集的基因數(shù)目越多

表2 lncRNA靶基因的生物學(xué)過(guò)程富集

表3 lncRNA靶基因的通路富集

3 討論

TCGA數(shù)據(jù)庫(kù)是目前全球范圍內(nèi)最大的腫瘤公共數(shù)據(jù)庫(kù),為當(dāng)前腫瘤相關(guān)研究提供寶貴的數(shù)據(jù)資源[3]。作者首先根據(jù)基因轉(zhuǎn)錄水平數(shù)據(jù)對(duì)子宮頸癌與癌旁組織中的差異lncRNA進(jìn)行篩選,然后對(duì)初步篩選出的全部差異lncRNA進(jìn)行Kaplan-Meier生存分析和單因素Cox分析,選擇兩種分析結(jié)果差異均具有顯著性的lncRNA基因集,最后共篩選出8個(gè)與患者預(yù)后相關(guān)的lncRNA,分別為:DLEU1、LINC00908、LINC00702、LINC01337、CASC15、LINC00484、UNQ6494和LINC01305。隨后采用多因素Cox回歸分析法構(gòu)建與患者預(yù)后相關(guān)的基因模型,結(jié)果顯示構(gòu)建的多基因模型其C統(tǒng)計(jì)量為0.7,ROC曲線面積為0.714,根據(jù)構(gòu)建模型的多基因riskscore(riskscore中位值為1.085 6)將樣本分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,結(jié)果顯示差異有顯著性(P=2.834E-06),說(shuō)明作者構(gòu)建的基于lncRNA分子預(yù)測(cè)模型具有較為良好的效能,可以實(shí)現(xiàn)對(duì)子宮頸癌患者預(yù)后狀況的有效預(yù)測(cè)。

對(duì)于模型中7個(gè)lncRNA在腫瘤研究領(lǐng)域尤其子宮頸癌相關(guān)的研究情況,LINC00702在腦膠質(zhì)瘤中可以通過(guò)激活Wnt/β-catenin通路促進(jìn)其進(jìn)展[4],在非小細(xì)胞肺癌中,LINC00702通過(guò)調(diào)節(jié)miR-510/pten軸抑制非小細(xì)胞肺癌的增殖和侵襲[5],而其在子宮頸癌中研究還未涉及,模型構(gòu)建結(jié)果提示其可能是子宮頸癌的一個(gè)促癌因子。LINC01305可以通過(guò)抑制TNXB介導(dǎo)的PI3K/Akt信號(hào)通路抑制子宮頸癌細(xì)胞上皮間充質(zhì)轉(zhuǎn)移[6]。DLEU1作為促癌因子在卵巢癌、子宮內(nèi)膜癌等多種腫瘤中均有參與[7-8],在子宮頸癌中,研究發(fā)現(xiàn)DLEU1通過(guò)與miR-381相互作用促進(jìn)子宮頸癌中HOXA13的表達(dá),從而促進(jìn)子宮頸癌的增殖和侵襲[9]。CASC15在腫瘤中研究也較多,在子宮頸癌中發(fā)現(xiàn)lncRNA CASC15與其腫瘤生長(zhǎng)密切相關(guān),是子宮頸癌預(yù)后較差的診斷因子[10],這與本實(shí)驗(yàn)結(jié)果一致。目前,LINC00908、LINC01337與LINC00484在腫瘤領(lǐng)域中的相關(guān)研究還未涉及,這為以后相關(guān)研究提供了新的分子靶標(biāo)。

為實(shí)現(xiàn)對(duì)子宮頸癌預(yù)后相關(guān)lncRNA功能的解讀,通過(guò)對(duì)其共表達(dá)基因功能的注釋。靶基因的生物學(xué)功能注釋結(jié)果顯示,子宮頸癌預(yù)后相關(guān)的lncRNA生物學(xué)過(guò)程主要富集細(xì)胞膜黏附分子對(duì)細(xì)胞的黏附作用、膠原原纖維組織、角質(zhì)化、內(nèi)胚層細(xì)胞分化等幾個(gè)方面,這些生物學(xué)過(guò)程均參與了子宮頸癌的發(fā)生、發(fā)展過(guò)程。在通路方面,其富集的通路主要集中在胞外基質(zhì)受體相互作用、焦點(diǎn)粘連、PI3K/Akt信通路號(hào)、蛋白消化與吸收、細(xì)胞黏附分子、鈣離子信號(hào)通路等腫瘤相關(guān)通路,鑒于本實(shí)驗(yàn)基于生物信息學(xué)方法,深層次機(jī)制研究還要基于濕實(shí)驗(yàn)進(jìn)行驗(yàn)證。

綜上所述,本實(shí)驗(yàn)利用生物信息學(xué)的方法分析了TCGA數(shù)據(jù)庫(kù)中子宮頸癌測(cè)序數(shù)據(jù),同時(shí)構(gòu)建與子宮頸癌預(yù)后相關(guān)的7個(gè)lncRNA基因集模型,并對(duì)其功能進(jìn)行注釋,該實(shí)驗(yàn)豐富了和創(chuàng)新了子宮頸癌lncRNA研究?jī)?nèi)容,也為今后子宮頸癌非編碼RNA的研究提供新思路。

猜你喜歡
子宮頸癌測(cè)序通路
肽基脯氨酰同分異構(gòu)酶(Pin1)對(duì)子宮頸癌細(xì)胞脂質(zhì)代謝的作用
外顯子組測(cè)序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
如何早期發(fā)現(xiàn)子宮頸癌
得了子宮頸癌怎么辦?
HPV疫苗和篩查:人類癌癥防治的典范
中草藥DNA條形碼高通量基因測(cè)序一體機(jī)驗(yàn)收會(huì)在京召開
基因測(cè)序技術(shù)研究進(jìn)展
外顯子組測(cè)序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
Kisspeptin/GPR54信號(hào)通路促使性早熟形成的作用觀察
proBDNF-p75NTR通路抑制C6細(xì)胞增殖