張俊鵬,張 武
(1.大理大學工程學院,云南大理 671003;2.大理大學農(nóng)學與生物科學學院,云南大理 671003)
微小RNA(MicroRNA,簡稱miRNA)是一類長約23個核苷酸的內(nèi)源性非編碼小RNA分子。成熟miRNA通過與信使RNA(Messenger RNA,簡稱mRNA)的特定位點結合,根據(jù)堿基互補配對程度直接誘導mRNA降解或抑制mRNA翻譯蛋白質〔1〕。我們已了解到miRNA在細胞分化、細胞生長、細胞調亡和癌癥發(fā)生發(fā)展等生物學過程中起著關鍵作用〔2〕。
miRNA與靶基因mRNA之間的調控關系就構成了miRNA-mRNA調控網(wǎng)絡。它是一種復雜的生物網(wǎng)絡,并且在該網(wǎng)絡中往往存在許多相同的拓撲結構。Milo等〔3〕將這些拓撲結構單元定義為網(wǎng)絡模體。具體來說,網(wǎng)絡模體是具有特定結構的小規(guī)模子圖或子網(wǎng)絡,較之隨機網(wǎng)絡,它在復雜網(wǎng)絡中出現(xiàn)的頻率更高。因此,挖掘miRNA-mRNA調控網(wǎng)絡中的子網(wǎng)絡,有利于揭示復雜網(wǎng)絡的核心功能單元,進一步深入理解miRNA的調控作用機制。
1.1 miRNA-mRNA調控網(wǎng)絡數(shù)據(jù)源miRNA-mRNA調控網(wǎng)絡指miRNA通過序列堿基互補配對原則調控靶基因mRNA表達所組成的網(wǎng)絡,屬于基因轉錄調控網(wǎng)絡。它能進一步了解miRNA和mRNA之間的調控機制,在治療疾病,篩選藥物靶標和設計治療藥物方面上有很大幫助。
目前,miRNA-mRNA調控網(wǎng)絡數(shù)據(jù)庫主要分為計算機預測型和實驗驗證型。計算機預測型數(shù)據(jù)庫主要依靠miRNA和mRNA序列信息來識別miRNA靶標,因此假陽性率高。實驗驗證型數(shù)據(jù)庫雖然耗材、耗時以及效率低,但miRNA靶標識別準確率高。為了研究更加真實的miRNA-mRNA調控網(wǎng)絡,本文選取 miRTarBase v6.1〔4〕、TarBase v7.0〔5〕和miRWalk v2.0〔6〕3個普遍使用的實驗驗證型數(shù)據(jù)庫作為miRNA-mRNA調控網(wǎng)絡數(shù)據(jù)源。3個數(shù)據(jù)庫之間的miRNA-mRNA調控關系重合數(shù)只有24 967,如圖1所示。該結果表明:不同數(shù)據(jù)庫中,miRNA-mRNA調控網(wǎng)絡數(shù)據(jù)差異性很大。為了收集更全面的miRNA-mRNA調控網(wǎng)絡,本文整合這3種實驗驗證型數(shù)據(jù)庫作為miRNA-mRNA調控網(wǎng)絡數(shù)據(jù)源,其miRNA-mRNA調控對數(shù)為466 496。
1.2 NetMatchStar方法NetMatchStar〔8〕是一種基于Cytoscape〔9〕平臺的網(wǎng)絡模體挖掘方法。給定n個節(jié)點,它可以自定義任何類型的n-點網(wǎng)絡模體,其圖匹配計算復雜度在最好的情況下為Θ(n2),然而最壞情況是Θ(n!n)。由于涉及到許多參數(shù)設置(節(jié)點個數(shù),邊個數(shù),模體出現(xiàn)頻次等),普通圖匹配方法很難有效進行n-點網(wǎng)絡模體挖掘。然而,Net?MatchStar仍然能夠高效的挖掘任意n-點網(wǎng)絡模體。因此,從計算復雜度角度考慮,NetMatchStar解決了圖匹配中的一個非多項式完全問題(NP-com?plete)。
圖1 miRTarBase、TarBase和miRWalk 3種數(shù)據(jù)庫之間的UpSet圖〔7〕
由于miRNA-mRNA調控網(wǎng)絡是一類有向生物網(wǎng)絡,因此自定義網(wǎng)絡模體時,需要考慮節(jié)點之間的方向性。為了研究miRNA-mRNA調控網(wǎng)絡中的協(xié)同調控子網(wǎng)絡,本文專注于單靶標miRNA協(xié)同調控網(wǎng)絡模體,見圖2。
圖2 單靶標miRNA協(xié)同調控網(wǎng)絡模體
2.1 人類miRNA家族協(xié)同調控子網(wǎng)絡為了研究人類miRNA家族協(xié)同調控子網(wǎng)絡,本文選取9種miRNA家族:miR-200,miR-302,miR-320,miR-374,miR-376,miR-513,miR-517,miR-519和miR-520。miR-200家族有 5個成員:miR-141,miR-200a∕b∕c 和 miR-429。miR-302 家族有 6 個成員:miR-302a∕b∕c∕d∕e∕f。 miR-320 家 族 有 5 個 成 員 :miR-320a∕b∕c∕d∕e。miR-374家族有3個成員:miR-374a∕b∕c。miR-376家族有3個成員:miR-376a∕b∕c。miR-513家族有3個成員:miR-513a∕b∕c。miR-517家族有3個成員:miR-517a∕b∕c。miR-519家族有5個成員:miR-519a∕b∕c∕d∕e∕f。miR-520家族有8個成員:miR-520a∕b∕c∕d∕e∕f∕g∕h。
使用單靶標miRNA協(xié)同調控網(wǎng)絡模體分別對9種miRNA家族調控網(wǎng)絡進行挖掘,n為miRNA家族的成員個數(shù)。9種miRNA家族協(xié)同調控子網(wǎng)絡大小具有差異性,見圖3。具有相同成員個數(shù)的miRNA家族(例如miR-374,miR-376,miR-513和miR-517)所協(xié)同調控的靶基因個數(shù)也具有差異性。另外,9種miRNA家族協(xié)同調控的靶基因也不同。該結果預示著,每個miRNA家族通過協(xié)同調控不同靶基因來實現(xiàn)特定的生物學功能。
2.2 靶基因信號通道富集分析為了研究靶基因與哪些信號通道顯著性相關,功能分析軟件pathDIP〔10〕用來對miRNA家族協(xié)同調控子網(wǎng)絡中的靶基因進行富集分析。pathDIP整合了20種信號通道數(shù)據(jù)庫資源,有助于全面了解靶基因所富集的信號通道。不同miRNA家族靶基因顯著性相關的信號通道如表1所示。
根據(jù)靶基因富集分析,miR-200家族與miRNA癌癥通道顯著性相關,miR-302與細胞凋零通道緊密相關,miR-320參與AMPK信號通道,miR-374參與非典型Wnt信號通道,miR-519家族參與FoxO和TGF-β信號通道。這些信號通道都與癌癥的發(fā)生和發(fā)展緊密相關,從而間接反映這些miRNA家族與癌癥的發(fā)生發(fā)展密切相關。
圖3 單靶標網(wǎng)絡模體所組成的家族協(xié)同調控子網(wǎng)絡
NetMatchStar能夠自定義網(wǎng)絡模體,因此可以根據(jù)需要設置miRNA協(xié)同調控網(wǎng)絡模體來研究miRNA-mRNA調控網(wǎng)絡。這將大大增加miRNA-mRNA調控網(wǎng)絡分析的靈活性,便于多角度研究miRNA之間的協(xié)同調控關系。在線軟件pathDIP對網(wǎng)絡模體組成的子網(wǎng)絡進行信號通道富集分析,能夠挖掘出與靶基因顯著性相關的信號通道,從而間接了解miRNA參與的信號通道??傊?,miRNA-mRNA調控網(wǎng)絡屬于大型的復雜網(wǎng)絡,從大量的miRNA-mRNA調控網(wǎng)絡數(shù)據(jù)中挖掘出更多具有生物學意義的信息,有利于更好的了解miRNA調控作用機制,以及潛在的生物學功能。
表1 不同miRNA家族靶基因顯著性相關的信號通道
〔1〕BARTEL D P.MicroRNAs:genomics,biogenesis,mecha?nism,and function〔J〕.Cell,2004,116(2):281-297.
〔2〕 LIN S,GREGORY R I.MicroRNA biogenesis path?ways in cancer〔J〕.Nature Reviews Cancer,2015,15(6):321-333.
〔3〕 MILO R,SHEN-ORR S S,ITZKOVITZ S,et al.Net?work motifs:simple building blocks of complex net?works〔J〕.Science,2002,298(5594):824-827.
〔4〕CHOU C H,CHANG N W,SHRESTHA S,et al.miR?TarBase 2016:updates to the experimentally validated miRNA-target interactions database〔J〕.Nucleic Acids Research,2015,44(D1):D239-D247.
〔5〕 VLACHOS IS,PARASKEVOPOULOU M D,KARAGKOUNI D,et al.DIANA-TarBase v7.0:index?ing more than half a million experimentally supported miRNA:mRNA interactions〔J〕.Nucleic Acids Research,2014,43(D1):D153-D159.
〔6〕DWEEP H,GRETZ N.miRWalk2.0:a comprehensive atlas of microRNA-target interactions〔J〕.Nature Meth?ods,2015,12(8):697.
〔7〕 LEX A,GEHLENBORG N,STROBELT H,et al.Up?Set:visualization of intersecting sets〔J〕.IEEE Transac?tions on Visualization and Computer Graphics,2014,20(12):1983-1992.
〔8〕RINNONE F,MICALE G,BONNICI V,et al.NetMatch?Star:an enhanced Cytoscape network querying app〔J〕.F1000Research,2015,4:479.
〔9〕 SHANNON P,MARKIEL A,OZIER O,et al.Cyto?scape:a software environment for integrated models of biomolecular interaction networks〔J〕.Genome Re?search,2003,13(11):2498-2504.
〔10〕 RAHMATI S,ABOVSKY M,PASTRELLO C,et al.pathDIP:an annotated resource for known and predict?ed human gene-pathway associations and pathway en?