摘要:以擬南芥蛋白質作“種子”在蓖麻(Riciuns communis L.)的蛋白質數據庫中搜索,結合關鍵字搜索方法,獲得10個蓖麻油體固醇蛋白質,通過生物信息方法對這些蛋白質進行分析。結果表明,10個蓖麻油體固醇蛋白質外顯子的數目和內含子的位點較保守;氨基酸殘基數、分子量和等電點相差不大;疏水性/親水性和跨膜結構分析表明,成員間在N-末端第25個氨基酸位點有一個跨膜結構;主要由α螺旋、β折疊和無規(guī)則卷曲組成;三維結構符合SDR超家族特點;NADPH結合區(qū)域、活性位點較保守,膜錨定區(qū)域和固醇結合區(qū)域差異較大。
關鍵詞:蓖麻(Riciuns communis L.);油體固醇蛋白質;生物信息學
中圖分類號:S565.6 文獻標識碼:A 文章編號:0439-8114(2016)11-2930-04
DOI:10.14088/j.cnki.issn0439-8114.2016.11.056
蓖麻(Riciuns communis L.)是大戟科(Euphorbiaceae)蓖麻屬(Ricicuns)一年或多年生雙子葉植物,廣泛生長在熱帶、亞熱帶和溫帶地區(qū),是世界十大重要油料作物之一[1]。植物種子中有一種儲存營養(yǎng)物質的細胞器——油體[2-4],其內部主要成分為三酰甘油,外部則為磷脂單分子層及嵌入其內的油體結合蛋白質組成的半單位膜[5]。油體結合蛋白質主要有三種——油脂蛋白質、油體鈣蛋白質和油體固醇蛋白質。油脂蛋白質由N-和C-末端兩個親水區(qū)域及中間疏水錨定區(qū)域組成。N-和C-末端暴露在油體表面,能夠提供空間位阻和負電斥力來維持油體的穩(wěn)定[5]。Chen等[6]在油體中發(fā)現了3種微量蛋白質分別稱為Sop1、Sop2、Sop3。Sop1稱為油體鈣蛋白質。油體鈣蛋白質由N-端親水鈣結合區(qū)域、C-端親水性磷酸化區(qū)域和中間疏水錨定區(qū)域組成,可能在油體成熟、脂肪動員和提高油體穩(wěn)定性方面發(fā)揮作用[5]。Sop2、Sop3被稱為油體固醇蛋白質-A和油體固醇蛋白質-B[7]。油體固醇蛋白質是一種羥基固醇脫氫酶,屬于SDR家族[8,9]。N-端的疏水區(qū)域由兩個親性α螺旋夾著一個疏水錨定結構組成,在此疏水區(qū)域中部有Pro knob結構[10],其余部位分為NADPH、固醇結合區(qū)域和兩者之間的活性位點S-(12X)-Y-(3X)-K[10]。Sop3和Sop2蛋白質的固醇結合區(qū)域不同[7]。近來發(fā)現油體蛋白質也存在于根尖和芽等胚后組織中,推測在植物體內還存在未被發(fā)現的信號轉導通路[8]。本試驗以擬南芥蛋白質作“種子”在蓖麻的蛋白質數據庫中搜索,結合關鍵字搜索方法對蓖麻油體固醇蛋白質進行生物信息學分析,以期為該蛋白質的鑒定提供參考。
1 材料與方法
1.1 蓖麻基因組數據庫搜索
以“Steroid dehydrogenase”為關鍵字在蓖麻基因組數據庫(http://www.phytozome.net/search.php)中搜索,下載基因、cDNA和蛋白質序列;以6條擬南芥油體固醇蛋白質[11]作為“種子”,分別在蓖麻數據庫(http://www.phytozome.net/search.php)中進行Blastp搜索,E設為1×10-30,獲得同源的油體固醇蛋白質的基因、cDNA和蛋白質序列,去除重復后,再利用NCBI保守結構域分析工具(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi?)對所獲得的蛋白質家族進行鑒定,檢測是否有SDR(短鏈脫氫/還原酶超家族)的保守結構域。
1.2 蓖麻油體固醇蛋白質生物信息學分析
蓖麻油體固醇蛋白質的理化性質采用Protparam軟件進行預測;內含子、外顯子組成采用Spidey軟件進行分析;疏水性/親水性采用ProtScal軟件進行分析;蛋白質二級結構分析采用GOR4軟件進行分析;蛋白跨膜結構域采用TMHMM 2.0 Server軟件;信號肽結構采用SignalP4.1 Server軟件進行預測;蛋白質三維結構分析與同源建模采用CPHmodels軟件和RasMol-Raindy軟件;進化樹的構建采用軟件ClustalW2軟件和MEGA 4.1軟件,所有軟件使用的都是其默認值,部分分析軟件的網址見表1。
2 結果與分析
2.1 蛋白質的一級結構分析
2.1.1 氨基酸序列的理化性質分析 通過綜合分析,最終獲得11條完整的蓖麻油體固醇蛋白質基因,見表2。利用在線分析軟件Protparam對10種油體固醇蛋白質進行分析,得到其對應的氨基酸序列的理化性質,結果見表2。大部分蛋白質成員外顯子數為3或6,氨基酸殘基數為317~352,分子量為35.286 0~39.918 9 kDa,等電點PI為5.35~9.57。不穩(wěn)定系數表明,有8種成員在植物內可能階段性出現。親水性大部分都為正值,大部分成員都為親水蛋白質。信號肽預測表明,這11個蛋白質不存在信號肽。由于Slo11蛋白質基因不完整,所以后續(xù)分析中只選擇其他10個蓖麻油體固醇蛋白質。
2.1.2 疏水性/親水性的預測和分析 采用ProtScale軟件對10個蓖麻油體固醇蛋白質進行分析,結果(圖1)表明,以Slo1、Slo9為例,1~40區(qū)域有強烈的疏水性,可能為跨膜區(qū)域與油體內部疏水的三酰甘油相接合處,其他區(qū)域無明顯規(guī)律。
2.1.3 跨膜結構的預測和分析 利用在線軟件TMHMM 2.0 Server對10個蓖麻油體固醇蛋白質進行跨膜結構預測,圖2結果表明,除了Slo5蛋白質在氨基酸25、200位點各有一個跨膜區(qū),其他9個蛋白質(如Slo9)均只在25位點處有一個跨膜結構。
2.2 蛋白質二級結構的預測和分析
采用GOR4軟件分析蓖麻油體固醇蛋白質,結果如圖3所示,65~80、125~130、190~210、240~260范圍內主要為α螺旋,45~55、170~180、220~230、285~290范圍內主要為β折疊,其他部位沒有明顯的規(guī)律,從二級結構的相似性推測他們可能有相似的空間結構。
2.3 蛋白質三維結構分析與同源建模
利用CPHmodels軟件對10個蓖麻油體固醇蛋白質進行同源建模,并用RasMol-Raindy軟件將結果進行處理,結果見圖4。10個蛋白質成員主體都為α螺旋夾著6~7個β片層的結構,符合SDR超家族的特點,推測結構包含了NADPH和固醇的結合區(qū)域以及活性位點,全部成員中在C-端都預測到了一個卷曲組成的長鏈,可能與油脂固醇蛋白質的功能有關。
2.4 系統(tǒng)進化樹的構建
采用了ClustX 1.83軟件對篩選到的10個蛋白質進行比對,采用MEGA 4.1中的Neighbor-Joining算法,自檢舉1 000次,構建了10個成員的系統(tǒng)進化樹,結果如圖5所示。這10個成員可以分為2大類群,類群Ⅰ由6個成員組成,分別為Slo1、Slo2、Slo3、Slo4、Slo5、Slo6,類群Ⅱ由4個成員組成,分別為Slo7、Slo8、Slo9、Slo10。
2.5 相似性比對分析及保守區(qū)的獲得
利用在線程序ClustalW2進行序列比對,找到10個蓖麻油體固醇蛋白質成員的保守區(qū)域。如圖6所示,活性位點和內含子位置已在圖中標出。預測1~40位為跨膜結構,40~190位為NADPH結合區(qū)域,190~210位為活性位點區(qū)域,210位以后為固醇結合區(qū)域。NADPH結合區(qū)域保守性較好。固醇結構區(qū)域保守性不高,預測這些蛋白質成員和不同的固醇結合從而發(fā)揮多種生物學功能。位于NADPH和固醇結合區(qū)域之間的序列包含了活性位點S-(12X)-Y-(3X)-K,其中Y和K兩個位點高度保守,而S位點不是很保守。其中在Slo1、Slo2、Slo3、Slo7、Slo10中S被A取代,在Slo8中S被Q取代,在Sol9中S被L取代。內含子位點顯示了Slo1、Slo2、Slo3、Slo4、Slo5、Slo6剪接位點保守,Slo8、Slo9、Slo10剪切位點保守,而Slo7內含子位點最復雜,與其他9個成員不同。
3 小結
本試驗通過系統(tǒng)地分析蓖麻基因組數據,共鑒定11個蓖麻油體固醇基因,其中10個具有完整的ORF,1個序列缺失。對10個蓖麻油體固醇蛋白質的理化性質、疏水性/親水性、跨膜結構、二級結構、三維結構、進化關系和相似性進行了分析,發(fā)現蓖麻油體固醇蛋白質外顯子的數目和內含子的位點較保守;氨基酸殘基數、分子量和等電點相差不大;疏水性/親水性和跨膜結構分析表明,成員間在N-末端第25個氨基酸位點有一個跨膜結構;主要由α螺旋、β折疊和無規(guī)則卷曲組成;三維結構符合SDR超家族特點;NADPH結合區(qū)域、活性位點較保守,膜錨定區(qū)域和固醇結合區(qū)域差異較大。
參考文獻:
[1] DA SILVA N D L,MACIEL M R W,BATISTELLA C B,et al. Optimization of biodiesel production from castor oil[J]. Appl Biotechnol,2006,130(1-3):405-414.
[2] HUANG A H. Oleosin and oil bodies in seeds and other organs[J]. Plant Physiol,1996,110(4):1055-1061.
[3] MURPHY D J. The biogenesis and functions of lipid bodies in animals, plants and microorganisms[J]. Prog Lipid Res, 2001, 40(5): 325-438.
[4] NAPIER J A, STOBART A K, SHEWRY P R. The structure and biogenesis of plant oil bodies:The role of the ER membrane and the oleosin class of proteins[J]. Plant Mol Biol,1996, 31(5):945-956.
[5] 丁 勇,徐春雷,甘 莉.植物油體及其相關蛋白的研究進展[J].華中農業(yè)大學學報,2008,27(4):558-563.
[6] CHEN E C,TAI S S,PENG C C,et al. Identification of three novel unique proteins in seed oil bodies of sesame[J]. Plant Cell Physiol,1998,39(9):935-941.
[7] LIN L J, TZEN J T C. Two distinct steroleosins are present in seed oil bodies[J]. Plant Physiol Biochem,2004,42(7-8):601-608.
[8] VAN DER SCHOOT C, PAUL L K, PAUL S B, et al. Plant lipid bodies and cell-cell signaling: A new role for an old organelle[J]. Plant Signal Behav,2011,6(11):1732-1738.
[9] KAVANAGH K L,J?魻RNVALL H,PERSSON B,et al. The SDR superfamily:Functional and strural diversity within a family of metabolic and regulatory enzymes[J]. Cell Mol Life Sci,2008, 65(24):3895-3906.
[10] LIN L J, TAI S S, PENG C C, et al. Steroleosin, a sterol-binding dehydrogenase in seed oil bodies[J]. Plant Physilo, 2002,128(4):1200-1211.
[11] UMATE P. Comparative genomics of the lipid-body-membrane proteins oleosin, caleosin and steroleosin in magnoliophyte, lycophyte and bryophyte[J]. Genomics Proteomics Bioinformatics,2012,10(6):345-353.