許睿,張利偉
(河南科技學(xué)院,河南新鄉(xiāng)453003)
基于節(jié)點(diǎn)失效的關(guān)鍵蛋白質(zhì)識(shí)別算法研究
許睿,張利偉
(河南科技學(xué)院,河南新鄉(xiāng)453003)
蛋白質(zhì)參與了生命活動(dòng)中大部分的生物過程,是生物體生長(zhǎng)過程中重要的物質(zhì)基礎(chǔ).由于蛋白質(zhì)數(shù)量巨大,所承擔(dān)的作用也各不相同,如何在蛋白質(zhì)網(wǎng)絡(luò)中準(zhǔn)確地識(shí)別出的具有重要作用的關(guān)鍵蛋白質(zhì),是蛋白質(zhì)組學(xué)中亟待解決的重要問題之一.針對(duì)目前蛋白質(zhì)節(jié)點(diǎn)刪除策略存在破壞蛋白質(zhì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)這一問題,提出基于節(jié)點(diǎn)失效的關(guān)鍵蛋白質(zhì)識(shí)別算法.用蛋白質(zhì)節(jié)點(diǎn)對(duì)之間的最短距離,來描述兩個(gè)節(jié)點(diǎn)之間的潛在的影響能力,在衡量某個(gè)蛋白質(zhì)節(jié)點(diǎn)是否為關(guān)鍵蛋白質(zhì)的時(shí)候,將該節(jié)點(diǎn)失效處理,通過統(tǒng)計(jì)節(jié)點(diǎn)失效對(duì)于整個(gè)網(wǎng)絡(luò)的影響程度,從而識(shí)別出相應(yīng)的關(guān)鍵蛋白質(zhì).
節(jié)點(diǎn)刪除法;節(jié)點(diǎn)失效法;蛋白質(zhì)網(wǎng)絡(luò);關(guān)鍵蛋白質(zhì)
在識(shí)別關(guān)鍵節(jié)點(diǎn)的算法中,基于節(jié)點(diǎn)刪除的關(guān)鍵節(jié)點(diǎn)識(shí)別算法是一種比較簡(jiǎn)單、有效的方法.通過度量刪除每一個(gè)節(jié)點(diǎn)后,整個(gè)網(wǎng)絡(luò)遭到破壞的程度,區(qū)分節(jié)點(diǎn)的重要性程度[1].該算法利用了網(wǎng)絡(luò)中節(jié)點(diǎn)對(duì)于網(wǎng)絡(luò)的連通性的影響,以及節(jié)點(diǎn)對(duì)于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的影響,從網(wǎng)絡(luò)被攻擊的角度考慮節(jié)點(diǎn)重要性.但是該算法也存在著不足,首先,基于節(jié)點(diǎn)刪除的方法會(huì)刪除重要性高的節(jié)點(diǎn),這樣會(huì)破壞整個(gè)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),原本連通的節(jié)點(diǎn)會(huì)失去聯(lián)系,從而影響后續(xù)節(jié)點(diǎn)的評(píng)估結(jié)果;其次,在蛋白質(zhì)網(wǎng)絡(luò)中,關(guān)鍵蛋白質(zhì)挖掘的方法大部分都是局限在對(duì)蛋白質(zhì)網(wǎng)絡(luò)中單個(gè)關(guān)鍵蛋白質(zhì)節(jié)點(diǎn)的挖掘,但有時(shí)網(wǎng)絡(luò)中的關(guān)鍵蛋白質(zhì)節(jié)點(diǎn)不止一個(gè),而是多個(gè).
針對(duì)這些不足,本文提出基于節(jié)點(diǎn)失效的關(guān)鍵蛋白質(zhì)識(shí)別算法,用基于節(jié)點(diǎn)失效的方法,替代傳統(tǒng)方法中將節(jié)點(diǎn)直接刪除的做法,在保證網(wǎng)絡(luò)連通性不變和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)不變的基礎(chǔ)上,將該蛋白質(zhì)節(jié)點(diǎn)“失效”處理,從而可以動(dòng)態(tài)的識(shí)別蛋白質(zhì)網(wǎng)絡(luò)中一系列的關(guān)鍵蛋白質(zhì)節(jié)點(diǎn).
1.1 蛋白質(zhì)網(wǎng)絡(luò)
蛋白質(zhì)網(wǎng)絡(luò)通常可以抽象為由多個(gè)蛋白質(zhì)節(jié)點(diǎn)和節(jié)點(diǎn)間的相互作用關(guān)系所形成的網(wǎng)絡(luò)圖G=(V,E),V為蛋白質(zhì)節(jié)點(diǎn)的集合,E為蛋白質(zhì)節(jié)點(diǎn)間相互作用的邊的集合.這里,為了方便描述,用n表示網(wǎng)絡(luò)中所有節(jié)點(diǎn)數(shù),m表示網(wǎng)絡(luò)中所有的邊數(shù).通常,網(wǎng)絡(luò)圖可以用鄰接矩陣表示,如果節(jié)點(diǎn)間沒有連接,那么就用0表示,否則為相應(yīng)的數(shù)值.
對(duì)于網(wǎng)絡(luò)圖G的鄰接矩陣A,對(duì)于任意有連接的節(jié)點(diǎn)對(duì),如果它們之間的權(quán)重均為1,那么就稱圖G為無權(quán)圖,否則圖G為加權(quán)圖.如果它們之間的權(quán)重忽略方向性,那么圖G為無向圖,否則圖G為有向圖.一般情況下,無特殊說明,所研究的蛋白質(zhì)網(wǎng)絡(luò)圖為無向無權(quán)圖.本文采用的也是無向無權(quán)圖.
1.2 網(wǎng)絡(luò)資本值
本文在蛋白質(zhì)網(wǎng)絡(luò)中,用節(jié)點(diǎn)對(duì)之間最短路徑來描述某個(gè)節(jié)點(diǎn)潛在的相互影響力,它從局部的角度描述該節(jié)點(diǎn)對(duì)網(wǎng)絡(luò)中其余節(jié)點(diǎn),尤其是周邊蛋白質(zhì)節(jié)點(diǎn)的影響力,反映了該蛋白質(zhì)節(jié)點(diǎn)與網(wǎng)絡(luò)內(nèi)其余節(jié)點(diǎn)之間相互作用的強(qiáng)弱.對(duì)整個(gè)蛋白質(zhì)網(wǎng)絡(luò)而言,還需要分析該蛋白質(zhì)節(jié)點(diǎn)對(duì)整個(gè)蛋白質(zhì)網(wǎng)絡(luò)的全局影響力,因?yàn)橐粋€(gè)蛋白質(zhì)節(jié)點(diǎn)的失效,影響的不僅是其周邊與其直接相連的蛋白質(zhì)節(jié)點(diǎn),還可能會(huì)造成其它蛋白質(zhì)節(jié)點(diǎn)之間的連鎖反應(yīng),進(jìn)而影響整個(gè)蛋白質(zhì)網(wǎng)絡(luò)的功能.為此,本文定義了蛋白質(zhì)網(wǎng)絡(luò)資本NC (Network Cost),用以描述整個(gè)蛋白質(zhì)網(wǎng)絡(luò)內(nèi)蛋白質(zhì)節(jié)點(diǎn)相互作用的強(qiáng)弱.網(wǎng)絡(luò)資本NC公式如下
1.3 關(guān)鍵蛋白質(zhì)節(jié)點(diǎn)集合
在蛋白質(zhì)網(wǎng)絡(luò)中,蛋白質(zhì)節(jié)點(diǎn)和蛋白質(zhì)復(fù)合物之間是相互影響的,有時(shí)一個(gè)單獨(dú)的關(guān)鍵蛋白質(zhì)改變只能對(duì)該蛋白質(zhì)所在的蛋白質(zhì)復(fù)合物產(chǎn)生較大影響,但對(duì)其他蛋白質(zhì)復(fù)合物和整個(gè)蛋白質(zhì)網(wǎng)絡(luò)影響較小.如果多個(gè)關(guān)鍵蛋白質(zhì)協(xié)同作用,則會(huì)對(duì)整個(gè)蛋白質(zhì)網(wǎng)絡(luò)的功能產(chǎn)生很大的影響.如同現(xiàn)實(shí)中的交通網(wǎng)絡(luò)堵塞,有時(shí)候是單一關(guān)鍵節(jié)點(diǎn)造成網(wǎng)絡(luò)堵塞,有時(shí)是多個(gè)關(guān)鍵節(jié)點(diǎn)相互影響,造成一片區(qū)域堵塞.因此,關(guān)鍵蛋白質(zhì)識(shí)別不僅要考慮每一個(gè)關(guān)鍵蛋白質(zhì)的影響,而且要考慮到多個(gè)關(guān)鍵蛋白質(zhì)所形成的關(guān)鍵蛋白質(zhì)集合的協(xié)同影響[2-3].
本文定義一個(gè)關(guān)鍵蛋白質(zhì)集合的概念.關(guān)鍵蛋白質(zhì)集合是指使蛋白質(zhì)網(wǎng)絡(luò)的網(wǎng)絡(luò)資本值下降到一定程度(閾值Tmin)時(shí)失效節(jié)點(diǎn)的集合.f(G)為蛋白質(zhì)網(wǎng)絡(luò)資本值下降函數(shù),Gc為G去掉節(jié)點(diǎn)集合c后的子網(wǎng),△fNC(Gc)為G變成Gc后網(wǎng)絡(luò)資本的改變值,使△fNC(Gc)→Tmin的網(wǎng)絡(luò)元素集合L=C.對(duì)于不同的蛋白質(zhì)網(wǎng)絡(luò),它們的拓?fù)浣Y(jié)構(gòu)有很大的差異,因此閾值Tmin必須根據(jù)具體的蛋白質(zhì)網(wǎng)絡(luò)來進(jìn)行確定,本文將閾值Tmin設(shè)置為0.3.
1.4 蛋白質(zhì)節(jié)點(diǎn)刪除法
復(fù)雜網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)識(shí)別大多采用節(jié)點(diǎn)刪除法[4-5].節(jié)點(diǎn)刪除法首先統(tǒng)計(jì)網(wǎng)絡(luò)中所有節(jié)點(diǎn)的度,然后按序選取一定比例的、度數(shù)較高的節(jié)點(diǎn),依次進(jìn)行刪除.每刪除一個(gè)節(jié)點(diǎn),就評(píng)估該節(jié)點(diǎn)刪除后對(duì)于蛋白質(zhì)網(wǎng)絡(luò)造成的破壞程度,破壞程度越大,表明該節(jié)點(diǎn)越重要,說明該節(jié)點(diǎn)就是關(guān)鍵節(jié)點(diǎn).在蛋白質(zhì)網(wǎng)絡(luò)中,蛋白質(zhì)節(jié)點(diǎn)刪除法對(duì)蛋白質(zhì)網(wǎng)絡(luò)的整體連通狀況存在三個(gè)方面破壞.首先,被刪除的蛋白質(zhì)節(jié)點(diǎn)與剩余蛋白質(zhì)節(jié)點(diǎn)不再連通;其次,被刪除的蛋白質(zhì)節(jié)點(diǎn)相互之間不再連通;第3,剩余蛋白質(zhì)節(jié)點(diǎn)中部分蛋白質(zhì)節(jié)點(diǎn)之間的路徑可能由于該蛋白質(zhì)節(jié)點(diǎn)的刪除而增長(zhǎng)甚至不再連通.用這3種損失之和表示蛋白質(zhì)節(jié)點(diǎn)刪除后對(duì)整個(gè)網(wǎng)絡(luò)連通狀況的總破壞程度,也就是被刪除的蛋白質(zhì)節(jié)點(diǎn)的重要性指標(biāo).
如果節(jié)點(diǎn)的刪除會(huì)使得原本互聯(lián)互通的網(wǎng)絡(luò)不再連通,將嚴(yán)重影響對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)重要性的正確評(píng)估,如圖1所示.
圖1由8個(gè)節(jié)點(diǎn)組成一個(gè)無向連通圖,節(jié)點(diǎn)之間重要性測(cè)度都為1,其中節(jié)點(diǎn)3和節(jié)點(diǎn)6的度數(shù)最高,在刪除節(jié)點(diǎn)6之后,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)發(fā)生變化,原來的連通圖變?yōu)榉沁B通圖,形成3個(gè)非連通分量,對(duì)于孤立的節(jié)點(diǎn)7和節(jié)點(diǎn)8而言,兩個(gè)節(jié)點(diǎn)的重要性的測(cè)度都將變?yōu)?,沒有辦法對(duì)二者的重要性進(jìn)行比較.
圖1 節(jié)點(diǎn)刪除法對(duì)比Fig.1 Comparison ofeliminatingnode“6”
鑒于節(jié)點(diǎn)刪除法存在的弊端,本文對(duì)蛋白質(zhì)網(wǎng)絡(luò)中關(guān)鍵蛋白質(zhì)的識(shí)別采用蛋白質(zhì)節(jié)點(diǎn)失效法.節(jié)點(diǎn)動(dòng)態(tài)失效是指在評(píng)估蛋白質(zhì)節(jié)點(diǎn)重要性時(shí),并不刪除該蛋白質(zhì)節(jié)點(diǎn),而是保持該蛋白質(zhì)節(jié)點(diǎn)在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中的相對(duì)位置不變,但認(rèn)為該蛋白質(zhì)節(jié)點(diǎn)已經(jīng)“失效”.實(shí)際上,對(duì)于一個(gè)蛋白質(zhì)網(wǎng)絡(luò)來說,當(dāng)采用最短路徑算法計(jì)算節(jié)點(diǎn)對(duì)之間聯(lián)系程度時(shí),任意兩個(gè)蛋白質(zhì)節(jié)點(diǎn)之間相互影響(或作用)值的最小值是網(wǎng)絡(luò)直徑的倒數(shù).網(wǎng)絡(luò)直徑(Network diameter)是指圖G中所有蛋白質(zhì)節(jié)點(diǎn)對(duì)之間最短路徑長(zhǎng)度的最大值,可記為D.當(dāng)評(píng)估蛋白質(zhì)節(jié)點(diǎn)j重要性時(shí),將所有到節(jié)點(diǎn)j的節(jié)點(diǎn)的最短路徑長(zhǎng)度dij重新定義為
由于網(wǎng)絡(luò)直徑是蛋白質(zhì)網(wǎng)絡(luò)中所有蛋白質(zhì)節(jié)點(diǎn)對(duì)之間最短路徑的最大值,經(jīng)過重新定義后,蛋白質(zhì)網(wǎng)絡(luò)中所有到蛋白質(zhì)節(jié)點(diǎn)j的蛋白質(zhì)節(jié)點(diǎn)最短路徑長(zhǎng)度已經(jīng)超過了網(wǎng)絡(luò)直徑,而蛋白質(zhì)節(jié)點(diǎn)j的可達(dá)性為dij的倒數(shù),這些蛋白質(zhì)節(jié)點(diǎn)對(duì)蛋白質(zhì)節(jié)點(diǎn)j的影響力將大幅下降,因而可將蛋白質(zhì)節(jié)點(diǎn)j認(rèn)為是處于失效狀態(tài),但在蛋白質(zhì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖中,蛋白質(zhì)節(jié)點(diǎn)j仍然存在,并不影響網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),不會(huì)導(dǎo)致其他關(guān)鍵蛋白質(zhì)的重要性喪失,也不會(huì)出現(xiàn)前述的蛋白質(zhì)網(wǎng)絡(luò)解體現(xiàn)象的發(fā)生,從而避免了蛋白質(zhì)節(jié)點(diǎn)刪除法的弊端.
當(dāng)某一個(gè)蛋白質(zhì)節(jié)點(diǎn)j失效時(shí),將與蛋白質(zhì)節(jié)點(diǎn)j直接連接的最短路徑值d(i,j)和d(j,i)增加D,即d(i,j)→d(i,j)+D,j≠i∈V,d(j,i)→d(j,i)+D,j≠i∈V.在圖2中,網(wǎng)絡(luò)直徑D等于4,度數(shù)最高的節(jié)點(diǎn)是節(jié)點(diǎn)3和節(jié)點(diǎn)6,節(jié)點(diǎn)6的度數(shù)為4.當(dāng)節(jié)點(diǎn)6失效后,與節(jié)點(diǎn)6直接相連的節(jié)點(diǎn)4、節(jié)點(diǎn)5、節(jié)點(diǎn)7和節(jié)點(diǎn)8,它們到節(jié)點(diǎn)5的最短路徑長(zhǎng)度都將增加為1+4=5.如此,某個(gè)節(jié)點(diǎn)失效前后,蛋白質(zhì)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)并未發(fā)生改變.
采用的蛋白質(zhì)節(jié)點(diǎn)動(dòng)態(tài)失效策略,當(dāng)?shù)鞍踪|(zhì)網(wǎng)絡(luò)中重要性高的蛋白質(zhì)節(jié)點(diǎn)失效后,會(huì)導(dǎo)致整個(gè)蛋白質(zhì)網(wǎng)絡(luò)資本值減少,通過計(jì)算蛋白質(zhì)節(jié)點(diǎn)失效前后的網(wǎng)絡(luò)資本值之間差值,與失效前該蛋白質(zhì)節(jié)點(diǎn)的網(wǎng)絡(luò)資本值的比值,可以作為衡量該蛋白質(zhì)節(jié)點(diǎn)是否是蛋白質(zhì)網(wǎng)絡(luò)中關(guān)鍵蛋白質(zhì)的評(píng)價(jià)指標(biāo).
圖2 節(jié)點(diǎn)6失效對(duì)比Fig.2 Comparison ofinvalidingnode“6”
為了驗(yàn)證蛋白質(zhì)節(jié)點(diǎn)失效法和蛋白質(zhì)節(jié)點(diǎn)刪除法在識(shí)別關(guān)鍵蛋白質(zhì)時(shí)的效率,本文以Yeast數(shù)據(jù)集[6]為測(cè)試對(duì)象進(jìn)行實(shí)驗(yàn),Yeast數(shù)據(jù)集包含2 361個(gè)節(jié)點(diǎn),7 182條邊,其構(gòu)建的網(wǎng)絡(luò)中平均度值為6,大部分節(jié)點(diǎn)的度值為1.首先,蛋白質(zhì)節(jié)點(diǎn)失效法和蛋白質(zhì)節(jié)點(diǎn)刪除法同時(shí)對(duì)于Yeast數(shù)據(jù)集進(jìn)行處理,觀察兩種算法中各個(gè)節(jié)點(diǎn)失效或者刪除后網(wǎng)絡(luò)資本值的變化情況.其結(jié)果如圖3所示.
圖3 Yeast蛋白質(zhì)網(wǎng)絡(luò)資本值下降圖Fig.3 The decline ofthe network capital in Yeast PPI network
在圖3中,實(shí)線表示節(jié)點(diǎn)失效法,虛線表示節(jié)點(diǎn)刪除法,橫坐標(biāo)表示刪除或者失效的蛋白質(zhì)節(jié)點(diǎn)的數(shù)量,縱坐標(biāo)表示網(wǎng)絡(luò)資本值.在相同的網(wǎng)絡(luò)資本水平上,節(jié)點(diǎn)失效法得到的節(jié)點(diǎn)數(shù)量均小于節(jié)點(diǎn)刪除法得到的蛋白質(zhì)節(jié)點(diǎn)數(shù)量,說明節(jié)點(diǎn)失效法在識(shí)別關(guān)鍵節(jié)點(diǎn)時(shí),得到的關(guān)鍵蛋白質(zhì)節(jié)點(diǎn)的集合更小,從而可以更加準(zhǔn)確的找到關(guān)鍵蛋白質(zhì)節(jié)點(diǎn).在失效節(jié)點(diǎn)數(shù)量達(dá)到480左右時(shí),節(jié)點(diǎn)失效法對(duì)應(yīng)的網(wǎng)絡(luò)資本已經(jīng)趨近于0,基于網(wǎng)絡(luò)資本評(píng)估的節(jié)點(diǎn)失效算法終止,而對(duì)于節(jié)點(diǎn)刪除法需要在失效節(jié)點(diǎn)數(shù)量達(dá)到700左右時(shí),基于網(wǎng)絡(luò)資本評(píng)估的節(jié)點(diǎn)刪除算法才會(huì)終止,節(jié)點(diǎn)失效法在識(shí)別關(guān)鍵蛋白質(zhì)節(jié)點(diǎn)時(shí)比節(jié)點(diǎn)刪除法收斂效率提高了45%;由于二者都是采用網(wǎng)絡(luò)資本評(píng)價(jià)識(shí)別關(guān)鍵蛋白質(zhì),因此兩種方法得到關(guān)鍵蛋白質(zhì)數(shù)量基本一致,但顯然節(jié)點(diǎn)失效法比節(jié)點(diǎn)刪除法的網(wǎng)絡(luò)資本下降更快,因而算法收斂的速度更快.由此可見,在相同實(shí)驗(yàn)條件下,節(jié)點(diǎn)失效法在識(shí)別關(guān)鍵蛋白質(zhì)時(shí)比節(jié)點(diǎn)刪除法更加準(zhǔn)確,效率更高.
本文提出了基于節(jié)點(diǎn)失效的關(guān)鍵蛋白質(zhì)識(shí)別算法,在保存蛋白質(zhì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)完整性的前提下,通過評(píng)價(jià)節(jié)點(diǎn)失效前后蛋白質(zhì)網(wǎng)絡(luò)的受損程度識(shí)別蛋白質(zhì)網(wǎng)絡(luò)中的關(guān)鍵蛋白質(zhì)節(jié)點(diǎn),避免了節(jié)點(diǎn)刪除法的缺陷.實(shí)驗(yàn)結(jié)果表明:采用蛋白質(zhì)節(jié)點(diǎn)失效法不僅可以避免破壞蛋白質(zhì)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),而且蛋白質(zhì)網(wǎng)絡(luò)資本收斂速度更快,能夠比蛋白質(zhì)節(jié)點(diǎn)刪除法更快的識(shí)別關(guān)鍵蛋白質(zhì).
[1]許進(jìn).一種研究系統(tǒng)的新方法:核與核度法[J].系統(tǒng)工程與電子技術(shù),1994,17(6):1-10.
[3]Spirin V,Mirny L A.Protein complexes and functional modules in molecular networks[J].Proc Natl Acad Sci.,2003,100(21): 12123-12128.
[4]陳勇,胡愛群,胡俊,等.通信網(wǎng)中最重要節(jié)點(diǎn)的確定方法[J].高技術(shù)通訊,2004,14(1):21-24.
[5]李鵬翔,任玉晴,席酉民.網(wǎng)絡(luò)節(jié)點(diǎn)(集)重要性的一種度量指標(biāo)[J].系統(tǒng)工程,2004,22(4):13-20.
[6]Pajek.Protein-protein interaction network in budding yeast[DB/OL].(2003-07-25)[2015-05-12].http://vlado.fmf.uni-lj. si/pub/networks/data/bio/Yeast/Yeast.htm.
(責(zé)任編輯:盧奇)
Node importance ranking of proteins based on network capital assessment
XU Rui,ZHANG Liwei
(Henan Institute ofScience and Technology,Xinxiang453003,China)
Proteins are involved in most of biological processes of living life activities,which are the core material basis during the growth of organism.In protein network,there are huge quantities of proteins,which assume different roles.This is one of the important issues to be solved in proteomics,which is how to accurately identify essential proteins in the protein network.The traditional elimination of protein node method has the problem of destroying network topology.A new algorithm based on the invalidation of protein node method was developed and the shortest distance between a pair of protein nodes was used to describe potential influence of protein nodes in this paper.Finally,the essential proteins in protein network identified by analyzing the declining extent of influence degree before and after invalidating protein node.
elimination of protein node method;invalidation of protein node method;protein networks;essential protein
TP301.6
A
1008-7516(2015)06-0053-04
10.3969/j.issn.1008-7516.2015.06.010
2015-08-06
許睿(1987―),男,河南新鄉(xiāng)人,碩士,助教.主要從事數(shù)據(jù)挖掘和生物信息學(xué)研究.