任偉超 李相全 董上 王淥 高金輝 馬偉
摘要:? 以栓皮櫟醇脫氫酶基因序列為探針,運(yùn)用電子克隆技術(shù)進(jìn)行蒙古櫟醇脫氫酶基因預(yù)測(cè)和生物學(xué)分析。研究結(jié)果表明:蒙古櫟醇脫氫酶基因全長(zhǎng)594 bp,包含516 bp的開放閱讀框,編碼171個(gè)氨基酸;蛋白為親水性的非分泌蛋白,不存在跨膜區(qū);二級(jí)結(jié)構(gòu)主要為無規(guī)則卷曲、延伸鏈和α螺旋;存在4個(gè)絲氨酸、10個(gè)蘇氨酸、1個(gè)酪氨酸,可能成為蛋白激酶磷酸化位點(diǎn)。
關(guān)鍵詞:? 蒙古櫟;? 醇脫氫酶;? 電子克隆;? 生物信息學(xué)
中圖分類號(hào):? ?S 792. 186? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:? ?A
蒙古櫟(Quercus mongolica),又稱柞木、柞樹,在我國(guó)主要分布于東北和華北地區(qū),是我國(guó)溫帶地區(qū)落葉闊葉林及針闊混交林的主要樹種[ 1 ],對(duì)維持地域生態(tài)平衡和生態(tài)系統(tǒng)恢復(fù)重建有重要作用[ 2 , 3 ]。醇脫氫酶(ADH)是生物體內(nèi)一類非常重要的對(duì)醇或醛有解毒作用的酶,可有效抵御外源或內(nèi)源有毒化合物的攻擊。研究表明,醇脫氫酶是改善植物對(duì)缺氧反應(yīng)適應(yīng)性的關(guān)鍵酶,是植物提高水淹耐受性的重要基因調(diào)控手段之一[ 4 ]。當(dāng)前,國(guó)內(nèi)針對(duì)醇脫氫酶的研究主要集中于大豆、玉米、水稻等農(nóng)作物,對(duì)森林植物研究較少,對(duì)于蒙古櫟醇脫氫酶的研究更未見報(bào)道。本研究運(yùn)用電子克隆及生物信息學(xué)方法,開展蒙古櫟醇脫氫酶基因研究,有助于探明蒙古櫟的抗逆機(jī)理,進(jìn)而改善蒙古櫟在極端環(huán)境下的生長(zhǎng)狀況。
1 試驗(yàn)材料與方法
1. 1 試驗(yàn)材料
本次試驗(yàn)的探針材料為栓皮櫟(Quercus suber)醇脫氫酶基因(來源:GenBank;序列號(hào):KF704745),以及多款電子克隆及生物信息學(xué)在線分析軟件,具體如下:
(1)Blastn(http://blast.ncbi.nlm.nih.gov/);
(2)CAP3(http://doua.prabi.fr/software/cap3);
(3)ORF finder(http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi);
(4)ProtParam(http://web.expasy.org/protparam/);
(5)SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/);
(6)ProtScale(http://web.expasy.org/protscale/);
(7)TMpred(http://www.ch.embnet.org/software/TMPRED_form.html);
(8)Psort(http://www.genscript.com/psort.html);
(9)SOPM(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html);
(10)NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)
1. 2 試驗(yàn)方法
電子克?。↖n silico cloning)是利用計(jì)算機(jī)技術(shù),依托EST數(shù)據(jù)庫(kù)、基因數(shù)據(jù)庫(kù)等網(wǎng)絡(luò)資源,采用生物信息學(xué)方法延伸已知EST序列,以期獲得部分或全部cDNA的方法 [ 5 - 7 ]本試驗(yàn)主要圍繞電子克隆和生物信息學(xué)分析技術(shù)開展。
1. 2. 1 基因序列獲取
在GenBank中選取序列號(hào)為KF704745的栓皮櫟醇脫氫酶基因,作為本次試驗(yàn)的基因探針。使用Blastn在蒙古櫟EST數(shù)據(jù)庫(kù)中進(jìn)行同源檢索,得到與探針序列同源性較高的蒙古櫟EST序列。使用在線工具CAP3[ 8 ]進(jìn)行拼接,以拼接好的重疊群Contig為探針,再次進(jìn)行Blastn檢索,直至不出現(xiàn)新EST序列且Contig不延續(xù)時(shí),獲取到蒙古櫟醇脫氫酶的基因序列。
1. 2. 2 基因結(jié)構(gòu)和蛋白特征分析
對(duì)基因序列結(jié)構(gòu)和蛋白特征進(jìn)行分析,具體步驟如下:(1)采用ORF finder對(duì)蒙古櫟醇脫氫酶預(yù)測(cè)基因進(jìn)行開放閱讀框分析;(2)采用ProtParam分析蒙古櫟醇脫氫酶一級(jí)結(jié)構(gòu);(3)采用SignalP 4.1對(duì)蒙古櫟醇脫氫酶的信號(hào)肽進(jìn)行預(yù)測(cè);(4)采用ProtScale分析蒙古櫟醇脫氫酶的親/疏水性;(5)采用TMpred分析蒙古櫟醇脫氫酶的跨膜結(jié)構(gòu);(6)采用Psort對(duì)蒙古櫟醇脫氫酶在細(xì)胞中可能存在的位置進(jìn)行定位;(7)采用SOPMA預(yù)測(cè)蒙古櫟醇脫氫酶的二級(jí)結(jié)構(gòu);(8)采用NetPhos對(duì)預(yù)測(cè)的蒙古櫟醇脫氫酶的磷酸化位點(diǎn)進(jìn)行分析。
2 結(jié)果與分析
2. 1 蒙古櫟醇脫氫酶基因序列預(yù)測(cè)
經(jīng)過同源檢索、序列拼接等電子克隆過程,獲取到全長(zhǎng)為594 bp的蒙古櫟醇脫氫酶基因序列(圖1)。開放閱讀框是DNA序列中具有編碼蛋白質(zhì)潛能的堿基序列,采用ORF Finder對(duì)該基因進(jìn)行分析,發(fā)現(xiàn)其開放閱讀框長(zhǎng)度為516 bp,據(jù)此編碼171個(gè)氨基酸。
2. 2 蛋白質(zhì)一級(jí)結(jié)構(gòu)預(yù)測(cè)
蛋白質(zhì)是結(jié)構(gòu)復(fù)雜的有機(jī)大分子物質(zhì),蛋白質(zhì)一級(jí)結(jié)構(gòu)是氨基酸殘基在蛋白質(zhì)肽鏈中的排列順序,對(duì)其進(jìn)行分析可以探明蛋白質(zhì)的理化性質(zhì)。基于蛋白質(zhì)數(shù)據(jù)庫(kù)和在線軟件ProtParam[ 9 ],對(duì)蒙古櫟醇脫氫酶基因編碼的蛋白質(zhì)一級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè),結(jié)果表明:氨基酸171個(gè),等電點(diǎn)6.15,相對(duì)分子質(zhì)量18 852.47,正電荷殘基(Arg+Lys)17,負(fù)電荷殘基(Asp+Glu)20,分子式為C821H1289N235O249S13,不穩(wěn)定系數(shù)34.24,平均疏水性-0.27,脂肪系數(shù)71.75。一般而言,當(dāng)?shù)鞍撞环€(wěn)定系數(shù)(II)< 40時(shí),可能是穩(wěn)定蛋白。由此可見,蒙古櫟醇脫氫酶基因編碼的蛋白質(zhì)可能是穩(wěn)定蛋白。
2. 3 信號(hào)肽預(yù)測(cè)及親/疏水性分析
采用SignaIP4.1Server[ 10 ]在線軟件,對(duì)蒙古櫟醇脫氫酶基因所編碼蛋白質(zhì)信號(hào)肽進(jìn)行預(yù)測(cè)的結(jié)果(圖2)表明,蒙古櫟醇脫氫酶不存在信號(hào)肽,為非分泌蛋白,不參與蛋白質(zhì)在細(xì)胞內(nèi)轉(zhuǎn)運(yùn)。采用ProScale[ 11 ]對(duì)蒙古櫟醇脫氫酶編碼的氨基酸進(jìn)行親/疏水性分析,從分析結(jié)果(圖3)可以看出,最小值為-2.211,最大值為1.767。按照氨基酸位點(diǎn)判定規(guī)律,正值越大,蛋白質(zhì)疏水性越強(qiáng);負(fù)值越大,蛋白質(zhì)親水性越強(qiáng);介于-0.5~0.5之間的主要為兩性氨基酸。據(jù)此推測(cè),蒙古櫟醇脫氫酶編碼的蛋白質(zhì)為親水性蛋白,此結(jié)果與一級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果一致。
2. 4 跨膜結(jié)構(gòu)預(yù)測(cè)及亞細(xì)胞定位
膜蛋白不溶于水,分離純化困難,不容易生長(zhǎng)晶體,很難明確其結(jié)構(gòu)。因此,如何對(duì)膜蛋白的跨膜螺旋進(jìn)行預(yù)測(cè)是生物信息學(xué)的重要問題。采用在線跨膜蛋白結(jié)構(gòu)預(yù)測(cè)軟件Tmpred[ 12 ],對(duì)該蛋白質(zhì)的跨膜結(jié)構(gòu)域進(jìn)行預(yù)測(cè)。一般認(rèn)為,當(dāng)縱坐標(biāo)分值大于500時(shí),會(huì)存在跨膜結(jié)構(gòu)域。由預(yù)測(cè)結(jié)果(圖4)可以看出,蒙古櫟醇脫氫酶不存在跨膜結(jié)構(gòu)。亞細(xì)胞定位與蛋白質(zhì)功能存在著非常緊密的聯(lián)系,由于各細(xì)胞器中理化性質(zhì)存在差異,因此其對(duì)內(nèi)部所容納的蛋白也具有選擇性。采用Psort[ 13 ]在線軟件,基于蛋白質(zhì)數(shù)據(jù)庫(kù),對(duì)蒙古櫟醇脫氫酶進(jìn)行亞細(xì)胞定位,結(jié)果顯示:細(xì)胞質(zhì)占43.5%,線粒體占30.4%,細(xì)胞核占21.7%,囊泡分泌系統(tǒng)占4.3%,這表明蒙古櫟醇脫氫酶主要分布于細(xì)胞質(zhì)、線粒體和細(xì)胞核中,少量分布于囊泡分泌系統(tǒng)。
2. 5 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
采用SOPMA[ 14 ]對(duì)蒙古櫟醇脫氫酶進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè),由預(yù)測(cè)結(jié)果(圖5)可以看出,該蛋白質(zhì)的二級(jí)結(jié)構(gòu)主要由四種折疊方式構(gòu)成,無規(guī)則卷曲結(jié)構(gòu)占比52.05%,延伸鏈占比28.07%,α螺旋占比14%,β轉(zhuǎn)角占比5.85%。據(jù)此推測(cè),無卷曲結(jié)構(gòu)、延伸鏈、α螺旋三種結(jié)構(gòu)是蒙古櫟醇脫氫酶二級(jí)結(jié)構(gòu)的主體。
2. 6 蛋白質(zhì)磷酸化位點(diǎn)分析
蛋白質(zhì)磷酸化是蛋白質(zhì)翻譯后修飾的重要方式之一,蛋白質(zhì)發(fā)生磷酸化后會(huì)改變蛋白質(zhì)活力或形成蛋白復(fù)合體,從而促進(jìn)信號(hào)在細(xì)胞內(nèi)的傳遞。采用NetPhos3.1Server[ 15 ]進(jìn)行蛋白磷酸化位點(diǎn)分析(閾值為0.5)的結(jié)果(圖6)表明,該蛋白有4個(gè)絲氨酸(Ser)、10個(gè)蘇氨酸(Thr)、1個(gè)酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點(diǎn)。
3 結(jié) 論
本研究運(yùn)用電子克隆技術(shù)對(duì)蒙古櫟醇脫氫酶基因序列進(jìn)行預(yù)測(cè),采用生物信息學(xué)軟件分析其基因結(jié)構(gòu)和蛋白特征,得到以下結(jié)論:(1)蒙古櫟醇脫氫酶基因序列全長(zhǎng)為594 bp, 開放閱讀框長(zhǎng)度為516 bp,編碼171個(gè)氨基酸。(2)蒙古櫟醇脫氫酶基因不穩(wěn)定系數(shù)為34.24,可能是穩(wěn)定蛋白。(3)蛋白為親水性的非分泌蛋白,且不存在跨膜區(qū)。(4)蛋白二級(jí)結(jié)構(gòu)主要由無卷曲結(jié)構(gòu)、延伸鏈、α螺旋構(gòu)成,在細(xì)胞質(zhì)、線粒體和細(xì)胞核中分布的可能性較大。(5)有4個(gè)絲氨酸(Ser)、10個(gè)蘇氨酸(Thr)、
1個(gè)酪氨酸(Tyr),可能成為蛋白激酶磷酸化位點(diǎn)。通過本次試驗(yàn),基本探明了蒙古櫟醇脫氫酶基因結(jié)構(gòu)和性狀,這有助于提高蒙古櫟在極端生境中尤其是水淹環(huán)境中的抗逆性,并為下一步開展基因克隆、表達(dá)、結(jié)構(gòu)、分布及生理功能等方面的研究提供有益參考。
參考文獻(xiàn)
[1] 殷曉潔,? 周廣勝,? 隋興華,? 等.? 蒙古櫟地理分布的主導(dǎo)氣候因子及其閾值[J].? 生態(tài)學(xué)報(bào),? 2013,? 33(1):? 103 - 109.
[2] 張桂芹,? 劉德江,? 姚盛智,? 等.? ?蒙古櫟林經(jīng)營(yíng)技術(shù)綜述[J]. 林業(yè)勘查設(shè)計(jì),? 2017(3):? 92 - 94.
[3] 李文英,? 顧萬春.? 蒙古櫟天然群體表型多樣性研究[J].? 林業(yè)科學(xué),? 2005,? 41(1):? 49 - 56.
[4] 劉威,? 陳昊,? 靳亞忠,? 等.? 高等植物醇脫氫酶及其基因家族研究進(jìn)展[J].? 植物生理學(xué)報(bào),? 2014(10):? 1 479-1 493.
[5] 胡皝,? 蕭浪濤.? 生物信息學(xué)在新基因全長(zhǎng) cDNA 電子克隆中的應(yīng)用[J].? 生物技術(shù)通報(bào),? 2007,? 2007(4):? 93 - 96.
[6] Gill R W, Sanseau P. Rapid in silico cloning of genes using expressed sequence tags (ESTs)[J]. Biotechnology annual review, 2000, 5: 25 - 44.
[7] 王冬冬,? 朱延明,? 李勇,? 等.? 電子克隆技術(shù)及其在植物基因工程中的應(yīng)用[J].? 東北農(nóng)業(yè)大學(xué)學(xué)報(bào),? 2006,? 37(3):? 403 - 408.
[8] PHuang X, Madan A. CAP3: A DNA sequence assembly?program[J]. Genome research, 1999, 9(9): 868 - 877.
[9] Gasteiger E, Hoogland C, Gattiker A, et al. Protein identification and analysis tools on the ExPASy server[M]. Humana Press, 2005.
[10] Petersen T N, Brunak S, von Heijne G, et al. SignalP 4.0:discriminating signal peptides from transmembrane regions[J]. Nature methods, 2011, 8(10): 785 - 786.
[11] Kyte J, Doolittle R F. A simple method for displaying the? ?hydropathic character of a protein[J]. Journal of molecular biology, 1982, 157(1): 105 - 132.
[12] Hofmann K, Stoffel W. TMbase-A database of membrane spanning protein segments[J]. 1993.
[13] PSORT I I. PSORT: a program for detecting sorting signals in? proteins and predicting their subcellular localization[J]. J. Mol. Biol, 1997, 266: 594 - 600.
[14] Geourjon C, Deleage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer applications in the biosciences: CABIOS, 1995, 11(6): 681 - 684.
[15] Blom N, Gammeltoft S, Brunak S. Sequence and structure-based prediction of eukaryotic protein phosphorylation sites[J]. Journal of molecular biology, 1999, 294(5): 1 351 - 1 362.
In Silico Cloning and Bioinformatics Analysis of Alcohol
Dehydrogenase Gene from Quercus mongolica
REN Weichao
(Yichun Academy of Forestry,? Heilongjiang Yichun 153000)
Abstract In Quercus suber alcohol dehydrogenase sequence as the probe sequenc,using in silico cloning technology to prediction alcohol dehydrogenase gene of Quercus mongolica and Protein analysis. The results showed that the full length of alcohol dehydrogenase gene obtained 594 bp and contained a 516 bp ORF with 171 amino acid. The protein was predicted a hydrophilic non-secretory protein and no transmembrane region. Random coil, Extended strand and Alpha helix were the main secondary structure. There were 4 serine, 10 threonine and 1 tyrosine kinase phosphorylation site.
Key words Quercus mongolica;? Alcohol dehydrogenase;? In silico cloning;? Bioinformatics