国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

蛋白質界面網絡中模體和模塊的探測

2014-11-19 09:26:08胡尊勝林錦賢呂暾
華僑大學學報(自然科學版) 2014年1期
關鍵詞:肽鏈派系模體

胡尊勝,林錦賢,呂暾

(1.福州大學 數(shù)學與計算機科學學院,福建 福州350108;2.福州大學 生物科學與工程學院,福建 福州350108)

自從Duncan等[1]和Barabási等[2]提出了小世界網絡模型和無標度網絡模型等概念以來,復雜網絡已經有了很大的發(fā)展.Albert等[3]研究了復雜網絡的統(tǒng)計動力學,Ernesto[4]研究了蛋白質殘基網絡的拓撲特征.Andrea[5]分析了信息網絡、科技網絡、社會網絡和生物網絡,發(fā)現(xiàn)同一類網絡具有相似的結構特征.由Milo等[6]首次提出的網絡模體是一種重要的結構性質,Shen-Orr等[7]研究了基因調控網絡,發(fā)現(xiàn)一些網絡模體是基本的信息處理模塊.模塊是網絡中的社團結構,模塊內部聯(lián)系緊密,模塊間聯(lián)系稀疏,不同的網絡有不同的模塊特征[8].模體和模塊的研究是分析網絡結構和性質之間關系的重要方法.為了對不同網絡中的模體和模塊加以分析,根據(jù)Milo提出的網絡模體的定義,Kashtan等[9]提出了ESA子圖抽樣算法,Wernicke等[10]提出了ESU算法來發(fā)現(xiàn)網絡中的模體;對于加權網絡,Sarvenaz等[11]提出了一種考慮邊權的模體挖掘方法.對于模塊,主要有圖形分割方法和分級聚類算法,如Kernighan-Lin算法和派系過濾算法等[12-13].在生物網絡中,模體和模塊被用來理解一些功能機制.Billur等[14]提出了一種基于蛋白質-蛋白質界面模體的策略來幫助識別藥物靶標;Zhang等[15]分析蛋白質-蛋白質網絡中的功能模塊,促進對脊柱炎發(fā)病機理的理解.在蛋白質界面網絡中也存在這樣的模體和模塊,但是這些模體和模塊的功能以及與網絡的拓撲性質的關系還不清楚.因此,本文在構建蛋白質網絡的基礎上,研究蛋白質界面殘基網絡中的模體和模塊.

1 材料和方法

1.1 數(shù)據(jù)集

蛋白質數(shù)據(jù)取自PDB數(shù)據(jù)庫中非同源的蛋白質復合物,每個復合物中至少有一條鏈的氨基酸序列長度大于85個.數(shù)據(jù)集中選取了11個蛋白質復合物的20條肽鏈,分別是1buw_A,1buw_B,1agr_A,1agr_E,1e96_B,1cgi_E,1avw_A,1avw_B,1ycs_A,1ycs_B,1a4y_B,1cse_I,1d09_B,1stf_E,1stf_I,1a4y_A,1cse_E,1d09_A,1e96_B,1fss_A.這些肽鏈分α,β,α+β,α/β共4種結構類型,每種類型包括5條肽鏈.

1.2 構建蛋白質網絡

對數(shù)據(jù)集中的20條肽鏈構建無向網絡模型.將蛋白質肽鏈中每個殘基的CA 原子定義為一個節(jié)點,節(jié)點集合為V,且|V|=N.計算各個CA原子之間的歐氏距離,定義一個截斷距離R,當原子之間的距離小于R時則這兩個原子間有邊連接;否則,沒有邊連接.另定義邊的集合為E,且|E|=M,得到一個鄰接矩陣A.

1.3 構建蛋白質界面網絡

蛋白質復合物中肽鏈之間的相互作用,使蛋白質表現(xiàn)出不同的結構和功能,因此研究肽鏈之間相互作用的界面特征尤為重要.對于數(shù)據(jù)集中蛋白質,首先確定兩條相互作用的肽鏈,然后定義一個截斷距離S,當分別來自兩條肽鏈間的殘基的CA原子之間的距離小于S時,定義這個兩個殘基之間有邊相連,稱為界面殘基,并對每條肽鏈的界面殘基構建網絡.這里定義S為0.7nm時得到的界面殘基較合理.以1buw_A鏈為例,使用RasMol軟件顯示的界面殘基如圖1所示.藍色絲帶鏈為A鏈,藍色骨架模式的鏈為B鏈.A鏈中紅色球體包括30,31,34和35號殘基(右),黃色球體包括106,107,110,111,112和114號殘基(中),綠色球體包括119,120,122和123號殘基(左).

圖1 RasMol軟件顯示的1buw_A的界面殘基Fig.1 Interface residues of 1buw_A in RasMol

1.4 網絡的模體和模塊的定義

按照Milo提出的精確網絡模體的定義來識別模體[6],Palla等的模塊定義是基于模塊內部節(jié)點連接很多,但又不必與模塊內部其他所有節(jié)點都連接的思想.稱一個完全子圖為一個k-派系,k是子圖的節(jié)點數(shù),如果一個k-派系可以通過一系列相鄰的k-派系到達另一個k-派系,則它們是連通的,定義k-派系-模塊為一系列連通的k-派系的集合.

采用Wernicke提出的ESU和Rand-ESU算法來搜索蛋白質界面網絡中的模體.這個算法首先產生一組與真實蛋白質界面網絡具有相同度序列的隨機網絡,再用ESU和Rand-ESU算法搜索子圖;然后基于這些子圖計算模體的統(tǒng)計意義,可以使用FANMOD軟件搜索蛋白質界面網絡的模體[16].文中產生1 000個與真實網絡有相同度序列的隨機網絡,令U=5,|Z-score|>2,P=0.05.

采用Palla提出的派系過濾(CPM)算法分析蛋白質界面網絡中的模塊.在CPM算法中,采用由大到小、迭代回歸的算法來尋找網絡中的派系,文中使用Cfinder軟件搜索蛋白質界面網絡中的派系-模塊[17].

2 討論

2.1 蛋白質肽鏈網絡與其界面網絡的拓撲性質

首先計算蛋白質肽鏈網絡及其界面網絡的度K、聚類系數(shù)C、特征路徑長度L、介數(shù)中心度Bet和接近中心度Clo等拓撲參數(shù)[18].當截斷距離R=0.7nm時,數(shù)據(jù)集中蛋白質肽鏈網絡及界面網絡的統(tǒng)計性質,如表1所示.表1中:差異比r表示兩類網絡的參數(shù)值之差與肽鏈網絡參數(shù)值的比.

從表1可知:界面網絡中節(jié)點的平均度要小于肽鏈網絡的平均度,而界面網絡的平均聚類系數(shù)要比肽鏈網絡的大,且網絡的特征路徑長度差別最明顯.這是因為肽鏈網絡中殘基要遠遠多于界面網絡中的殘基,而邊數(shù)也要遠多于界面網絡中的邊數(shù),但界面網絡中的平均邊密度為0.32,要遠大于整個肽鏈網絡中的平均邊密度0.05.此外,肽鏈網絡中節(jié)點的介數(shù)中心度都較小,而界面網絡中除其中4個外,其他界面網絡中節(jié)點的介數(shù)中心度都小于相應的肽鏈網絡.這是因為界面網絡中的節(jié)點大部分都在蛋白質界面上.蛋白質肽鏈網絡與其界面網絡的接近度中心性差別較小,可知殘基是否在界面上對其影響不大.

表1 蛋白質肽鏈網絡及界面殘基網絡的統(tǒng)計性質Tab.1 Statistical properties of protein peptide networks and protein interface networks

2.2 蛋白質界面網絡的模體

對于蛋白質界面網絡,數(shù)據(jù)集中蛋白質界面殘基數(shù)范圍為4~18,可見界面殘基數(shù)目較少,故模體的階數(shù)取3,4,5,6階(階數(shù)即模體中的節(jié)點數(shù)).當不同截斷距離R的界面網絡中的模體分布,如圖2所示.圖2中:nM,nN分別為模體和網絡數(shù).圖3為使用FANMOD軟件顯示的模體圖,其中“?”表示無向邊.

圖2 不同截斷距離的界面網絡模體分布Fig.2 Distributions of motifs in interface networks

圖3 使用FANMOD軟件顯示的模體圖Fig.3 Motifs shown by FANMOD

當R=0.5nm時,只有1buw_B,1avw_A,1cse_I,1cse_E,1d09_A界面網絡中可以探測到模體.其中:1buw_B,1avw_A,1cse_I,1d09_A界面網絡的模體均為3階模體,如圖3(a);而1cse_E界面網絡的模體是6階的,如圖3(b)所示.

當R=0.7nm時,有14個蛋白質界面網絡中存在模體,其中3階模體均是3-派系,如圖3(c)所示.4階模體中出現(xiàn)了3種類型(圖3(d)),它們出現(xiàn)的頻數(shù)依次為2,10,4,可見第二種類型的4階模體出現(xiàn)最多,在界面網絡結構中較重要.9個界面網絡中存在5階模體,且它們有一個共同模體(圖3(e)),表明這種模體在幾個界面網絡中較普遍.8個界面網絡中存在6階模體,但它們沒有共同模體.

當R=1.2nm時,有15個蛋白質界面網絡中存在模體,且每個界面網絡中都包含一個4-派系模體(圖3(f)),表明4-派系模體普遍存在于界面網絡中.此時,界面網絡中3階模體均是3-派系,1cgi_E,1avw_A,1stf_E,1stf_I,1cse_E,1d09_A,1buw_A和1fss_A界面網絡中都有3個4階模體且前6個網絡的4階模體相同,最后兩個的4階模體相同;而1buw_B,1agr_A和1agr_E界面網絡中都有4個4階模體且3個界面網絡的4階模體相同.有13個界面網絡中存在5階模體,且它們有2個共同的模體(圖3(g));有14個界面網絡中存在6階模體,且模體個數(shù)相對較多,但它們沒有共同模體.

當R=2.4nm時,1agr_E,1e96_B,1avw_A,1avw_B,1cse_I,1d09_B,1e96_A鏈界面網絡的各階模體數(shù)均為1,且各階模體為各階的k-派系(圖3(h));而1d09_A的界面網絡中只有一個6階模體且為6-派系.這是因為這些界面網絡中邊密度很大,傾向于形成規(guī)則網絡,只有1buw_B的界面網絡中模體較多,其他蛋白質界面網絡均無模體.

從上面分析可知,蛋白質界面網絡中的模體受截斷距離R影響較大,R值不同,則網絡中的模體類型和數(shù)量都有較大差別.

2.3 蛋白質界面網絡的模塊

為了給蛋白質界面網絡合理的模塊劃分,要找出合理的截斷距離R,并用Cfinder探測蛋白質界面網絡里的模塊.當R=0.5nm時,只有1stf_I和1cse_E的界面網絡中各存在一個3-派系-模塊.對比發(fā)現(xiàn)這不符合其真實界面,而其他蛋白質界面網絡中都沒有模塊,顯然不符合實際.當R=0.7nm時,除1a4y_B外,其他蛋白質界面網絡中都可以發(fā)現(xiàn)3-派系-模塊.

以1buw_A界面網絡為例,使用CFinder軟件測得其3-派系-模塊如圖4所示.圖4中:1,2,3,4號節(jié)點模塊對應圖1中的紅色球體即30,31,34和35號殘基;5,6,7,8,9,10號節(jié)點模塊對應圖1中的黃色球體即106,107,110,111,112和114號殘基;11,12,13,14號節(jié)點模塊對應圖1中的綠色球體即119,120,122和123號殘基.顯然,從圖4可知此模塊劃分與實際界面網絡中的模塊一致.

圖4 1buw_A界面網絡中的模塊劃分Fig.4 Modules partition in the interface network of 1buw_A

圖5 20個蛋白質界面網絡的3-派系-模塊分布Fig.5 Distribution of 3-clique-modules in 20protein interface networks

此時,20個蛋白質界面網絡的3-派系-模塊分布,如圖5所示.從圖5可知:除1a4y_B的界面網絡無模塊外,其他蛋白質界面網絡中均有3-派系-模塊.與蛋白質界面對比發(fā)現(xiàn)這個劃分較合理.

當R=1.2nm時,除1a4y_B的界面網絡無模塊及1buw_B界面網絡有2個3-派系-模塊外,其他蛋白質界面網絡中只有1個3-派系-模塊.這是因為此時的R較大,界面網絡中的邊密度較大,3-派系均是連通的,故只有1個模塊.當R=2.4nm時,所有蛋白質界面網絡中都只有一個3-派系-模塊,這是因為R較大,網絡中的節(jié)點傾向于形成規(guī)則網絡.

由上面的分析可知,當R=0.7nm時的蛋白質界面網絡模塊劃分比較符合實際.

2.4 界面網絡模塊與其拓撲性質的關系

當R=0.7nm時,分析此時界面網絡中的模塊與其拓撲性質的關系.蛋白質界面網絡中的殘基數(shù)與3-派系-模塊數(shù)的關系,如圖6所示.由圖6可知:二者呈線性關系,擬合直線為y=0.2x-0.15,其中,x為殘基數(shù)量,y為模塊數(shù).顯然,界面網絡中殘基越多,模塊越多.

圖6 R為0.7nm的蛋白質界面網絡殘基數(shù)(節(jié)點數(shù))與3-派系-模塊數(shù)的關系圖Fig.6 Relationship between the number of residues(nodes)and 3-clique-modules(R=0.7nm)

2.5 結果比較分析

基于復雜網絡理論研究了20條蛋白質肽鏈相互作用界面網絡與蛋白質肽鏈網絡的拓撲性質的差異,發(fā)現(xiàn)網絡的平均路徑長度和介數(shù)中心度差別明顯,而二者的介數(shù)中心度則差別較小.當截斷距離R為0.7,1.2nm時,存在模體的界面網絡較多,且多個網絡中包含共同的模體.這與韓華等[19]使用FANMOD軟件對8個不同規(guī)模網絡進行模體檢測分析所得結論,即驗證了網絡中模體的存在性相一致.文獻[19]重點分析了Karate網絡和Dophin網絡,得到編號為78和238的3階模體和編號為13278,8598,4958,31710的模體,而這些模體與本文蛋白質界面網絡中部分模體相同,分別為圖3的(a),(c),(d)和(f),這證明了本文方法的有效性以及蛋白質界面網絡中模體的存在性.

以往的研究多側重于對蛋白質相互作用網絡統(tǒng)計研究,一些算法并未應用到蛋白質界面網絡這一層次.梅娟等[20]采用基于模塊度優(yōu)化的圖聚類算法,從具有2 617個節(jié)點,11 855個相互作用的酵母蛋白相互作用網絡中探測出68個模塊,但其并未從更深層次分析其作用特征.本文對蛋白質界面網絡模塊的分析恰好是更深層次的細化,同時,對拓撲性質與模塊關系的分析也有利于進一步研究蛋白質界面網絡的形成機制等問題.

3 結束語

文中基于復雜網絡研究了蛋白質復合物中肽鏈相互作用界面網絡的拓撲性質,討論了其與蛋白質肽鏈網絡的拓撲性質的差異.對蛋白質界面網絡中的模體和模塊特征研究發(fā)現(xiàn),蛋白質界面網絡中的模體類型和數(shù)量受截斷距離R影響較大.這些特征分析有利于進一步理解界面網絡的結構特征,有助于研究蛋白質分子相互結合的機制,促進蛋白質結合界面預測理論的發(fā)展.

然而,如何將蛋白質界面網絡中的模體和模塊特征應用到蛋白質單體的結合界面殘基預測中,即把蛋白質界面網絡中的模體和模塊特征與打分函數(shù)相結合,從而提高預測的準確率,將是今后研究的一個重要課題.

[1]DUNCAN J W,STEVEN H S.Collective dynamics of“small-world”networks[J].Nature,1998,393(6684):440-442.

[2]BARABáSI A L,ALBERT R.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.

[3]ALBERT R,BARABáSI A L.Statistical mechanics of complex networks[J].Review of Modern Physics,2002,74(1):47-97.

[4]ESTRADA E.Universality in protein residue networks[J].Biophysical Journal,2010,98(5):890-900.

[5]LANCICHINETTI A,KIVELA M,SARAM?KI J,et al.Charaterizing the community structure of complex networks[J].PLOS ONE,2010,5(8):e11976.

[6]MILO R,SHEN-ORR S S,ITZKOVITZ S.Network motifs:Simple building blocks of complex networks[J].Science,2002,298(5594):824-827.

[7]SHEN-ORR S S,MILO R,MANGAN S,et al.Network motifs in the transcriptional regulation network ofEscherichiancoli[J].Nature Genetics,2002,31(1):64-68.

[8]KELLER I,VIENNET E.A characterization of the modular structure of complex networks based on consensual communities[C]∥Eighth International Conference on Signal Image Technology and Internet Based Systems.Naples:IEEE Press,2012:717-724.

[9]KASHTAN N,ITZKOVITZ S,MILO R,et al.Efficient sampling algorithm for estimating subgraph concentrations and detecting network motifs[J].Bioinformatics,2004,20(11):1746-1758.

[10]WERNICKE S.A faster algorithm for detecting network motifs[C]∥Proceedings of the 5th Workshop on Algorithms in Bioinformatics.Spain:Springer Verlag,2005:165-177.

[11]CHOOBDAR S,RIBEIRO P,SILVA F.Motif mining in weighted networks[C]∥IEEE 12th International Conference on Data Mining Workshops.Brussels:IEEE Press,2012:210-217.

[12]KERNIGHAN B W,LIN S.A efficient heuristic procedure for partitioning graphs[J].Bell System Technical Journal,1970,49(2):292-307.

[13]PALLA G,DERéNYI I,F(xiàn)ARKAS I,et al.Uncovering the overlapping community structure of complex networks in nature and society[J].Nature,2005,435(7043):814-818.

[14]ENGIN H B,KESKIN O,NUSSINOV R,et al.A strategy based on protein-protein interface motifs may help in identifying drug off-targets[J].Journal of Chemical Information and Modeling,2012,52(8):2273-2286.

[15]ZHANG C,SHEN L.Functional modules analysis based on protein-protein network analysis in ankylosing spondylitis[J].European Review for Medical and Pharmacological Sciences,2012,16(13):1821-1827.

[16]WERNICKE S,RASCHE F.FANMOD:A tool for fast network motif detection[J].Bioinformatics,2006,22(9):1152-1153.

[17]ADAMCSEK B,PALLA G,F(xiàn)ARKAS I,et al.CFinder:Locating cliques and overlapping modules in biological networks[J].Bioinformatics,2006,22(8):1021-1023.

[18]de NOOY W,MRVAR A,BATAGELJ V.Exploratory social network analysis with Pajek[M].Cambridge:Cambridge University Press,2005:1-362.

[19]韓華,劉婉璐,吳翎燕.基于模體的復雜網絡測度量研究[J].物理學報,2013,62(16):168904(1-9).

[20]梅娟,紀志成.基于模塊度優(yōu)化的蛋白質網絡集團探測與分析[J].計算機與應用化學,2012,29(5):591-596.

猜你喜歡
肽鏈派系模體
基于Matrix Profile的時間序列變長模體挖掘
鄉(xiāng)籍、派系與黨政:抗戰(zhàn)時期吉安縣商會選舉之爭
近代史學刊(2020年2期)2020-11-18 09:15:58
例談基因表達過程中多種肽鏈的合成
中學生物學(2019年2期)2019-04-16 00:54:00
植入(l, d)模體發(fā)現(xiàn)若干算法的實現(xiàn)與比較
基于網絡模體特征攻擊的網絡抗毀性研究
“派系撕裂校園”:暨南大學驅長風潮研究(1933—1934)
近代史學刊(2017年2期)2017-06-06 02:25:25
派系政治與農民上訪的邏輯
學院派系
風采童裝(2016年10期)2016-11-12 09:27:17
基于模體演化的時序鏈路預測方法
自動化學報(2016年5期)2016-04-16 03:38:40
烷基鏈長及肽鏈電荷分布對脂肽雙親分子自組裝及水凝膠化的影響
岚皋县| 泾阳县| 文登市| 盘锦市| 康保县| 华池县| 祁东县| 新沂市| 共和县| 全南县| 名山县| 读书| 兰西县| 乐安县| 漯河市| 六盘水市| 东光县| 抚顺县| 文昌市| 淄博市| 建平县| 天镇县| 南岸区| 来凤县| 浦东新区| 巴马| 马山县| 郎溪县| 突泉县| 安康市| 侯马市| 乐山市| 交口县| 平武县| 静乐县| 鹿泉市| 长岭县| 仙游县| 合肥市| 喀喇沁旗| 拉孜县|