信小娟+馬偉+李玉成
摘要 [目的]通過電子克隆技術(shù)對高叢越桔UFGT基因進(jìn)行預(yù)測。[方法]以篤斯越橘UFGT序列為探針,基于NCBI中高叢越桔的EST數(shù)據(jù)庫和CAP3在線軟件進(jìn)行序列拼接,利用生物信息學(xué)數(shù)據(jù)庫及相關(guān)軟件對其結(jié)構(gòu)和功能進(jìn)行預(yù)測分析。[結(jié)果]高叢越桔UFGT基因全長1 789 bp,包含1 161 bp的開放閱讀框,編碼386個(gè)氨基酸,該蛋白為親水性蛋白。[結(jié)論]本研究為進(jìn)一步解釋基因的分子功能奠定理論及實(shí)驗(yàn)基礎(chǔ)。
關(guān)鍵詞 高叢越桔;UFGT;電子克?。簧镄畔W(xué)
中圖分類號 S662.2 文獻(xiàn)標(biāo)識碼 A 文章編號 1007-5739(2017)06-0081-04
Analysis on Insilico Cloning and Bioinformatics of Vaccinium corymbosum UFGT Gene
XIN Xiao-juan 1 MA Wei 2 * LI Yu-cheng 3
(1 Daxing′ anling Academy of Agriculture and Forestry in Heilongjiang Province,Daxing′ anling Heilongjiang 165000; 2 Heilongjiang University of Chinese Medicine; 3 Daxing′ anling Forestry Administration)
Abstract [Objective]Using electronic cloning technology to predict UFGT gene of Vaccinium corymbosum.[Methods]Taking Vaccinium uliginosum UFGT sequence as the probe sequence,based on EST sequence from NCBI and assembled by CAP3 sequence assembly programme,using bioinformatics database and related software to predict the structure and function analysis.[Results]The full length of UFGT gene was 1 789 bp and it contained a 1 161 bp ORF,encoding 386 amino acid and the protein is a hydrophilic protein.[Conclusion]The study can provide theoretical and experi-mental basis for further explain of molecular genetic function.
Key words Vaccinium corymbosum;UFGT;insilico cloning;bioinformatics
高叢越桔(Vaccinium corymbosum)原產(chǎn)地為北美,是杜鵑花科(Ericaceae)越桔屬(Vaccinium)木本植物,比較適合在中國北方地區(qū)栽培,是經(jīng)濟(jì)價(jià)值最高的優(yōu)良品種,因其果實(shí)大、品質(zhì)佳、口感好深受人們青睞[1]。
類酮類化合物在高等植物界分布廣泛,可以參與花、葉片及果實(shí)等顏色的形成,還具有抗炎、抗癌、抗氧化和保護(hù)心腦血管系統(tǒng)等多種藥理作用[2]。植物中的類黃酮-3-O-葡萄糖基轉(zhuǎn)移酶(UFGT)處于類黃酮合成途徑中,形成各種花色苷[3]。目前,科研人員已在葡萄、玉米、水稻、草莓、荔枝等植物上對UFGT基因進(jìn)行了分析研究[4-5]。
電子克隆是一種基因克隆方法,具有高效、快速、投入低,并可以為實(shí)驗(yàn)克隆提供精準(zhǔn)的參考序列等優(yōu)點(diǎn)[6-8]。
本研究基于電子克隆技術(shù),對預(yù)測的高叢越桔的UFGT基因進(jìn)行序列分析,從理化性質(zhì)、亞細(xì)胞定位、氨基酸組成、信號肽、跨膜結(jié)構(gòu)域等方面對該基因編碼的蛋白進(jìn)行了預(yù)測,以期為進(jìn)一步解釋基因的分子功能奠定理論及實(shí)驗(yàn)基礎(chǔ)。
1 材料與方法
1.1 電子克隆獲得新基因序列
以篤斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)作為探針,使用Blastn工具檢索NCBI中與探針序列同源性較高的高叢越桔EST序列,使用在線工具CAP3[9]進(jìn)行拼接,以拼接好的重疊群(Contig)為探針,再次Blast檢索,如此反復(fù)。
1.2 生物信息學(xué)分析
對預(yù)測的高叢越桔UFGT基因序列進(jìn)行分析,具體在線生物信息學(xué)軟件如表1所示。
2 結(jié)果與分析
2.1 新基因的識別
以篤斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)為探針,獲得全長為1 789 bp的Contig 1條,其開放閱讀框長度為1 161 bp,編碼386個(gè)氨基酸,具體見圖1。
2.2 高叢越桔UFGT基因編碼氨基酸一級結(jié)構(gòu)預(yù)測
蛋白質(zhì)是生命功能的執(zhí)行者,分析蛋白質(zhì)的氨基酸序列,是蛋白質(zhì)研究的重要組成部分?;诘鞍踪|(zhì)數(shù)據(jù)庫,通過在線軟件ProtParam[10],對高叢越桔UFGT基因編碼的氨基酸的一級結(jié)構(gòu)預(yù)測見表2。
2.3 高叢越桔UFGT信號肽預(yù)測和分析
蛋白質(zhì)的跨膜轉(zhuǎn)運(yùn)主要依靠信號肽指導(dǎo)。采用SignaIP-4.1 Server[11],預(yù)測高叢越桔UFGT的信號肽,結(jié)果如圖2所示??梢钥闯觯邊苍浇踀FGT基因所編碼的蛋白質(zhì)不存在信號肽,該蛋白不進(jìn)行轉(zhuǎn)運(yùn)。
2.4 高叢越桔UFGT蛋白疏水性/親水性分析
對高叢越桔UFGT編碼的氨基酸用ProScale在線軟件[12]進(jìn)行親疏水性預(yù)測,一般負(fù)值越大表示蛋白親水性越強(qiáng),正值越大疏水性越強(qiáng),結(jié)果如圖3所示??梢钥闯觯邊苍浇踀FGT編碼的蛋白為親水性蛋白質(zhì),最小值-1.476,最大值1.205,這與一級結(jié)構(gòu)預(yù)測的結(jié)果一致。
2.5 高叢越桔UFGT蛋白質(zhì)跨膜結(jié)構(gòu)預(yù)測
生物膜功能的主要承擔(dān)者為膜蛋白。通過在線跨膜蛋白結(jié)構(gòu)預(yù)測TMpred軟件預(yù)測其蛋白質(zhì)跨膜區(qū)和跨膜方向,結(jié)果如圖4所示??梢钥闯觯摰鞍字写嬖?個(gè)跨膜區(qū),即32-51、86-104、249-270氨基酸位置。
2.6 高叢越桔UFGT蛋白的亞細(xì)胞定位
蛋白質(zhì)由位于細(xì)胞質(zhì)中的核糖體合成之后,需要轉(zhuǎn)運(yùn)到合適的位置才能正常行使其功能?;诘鞍踪|(zhì)數(shù)據(jù)庫,使用Psort在線軟件[13]對高叢越桔UFGT蛋白進(jìn)行亞細(xì)胞定位,具體結(jié)果見圖5??梢钥闯觯摰鞍自诩?xì)胞質(zhì)和線粒體的概率是39.1%,在細(xì)胞核的概率是13.0%,在細(xì)胞液中有8.7%的概率,可能主要分布于細(xì)胞質(zhì)和線粒體中。
2.7 高叢越桔UFGT蛋白的二級結(jié)構(gòu)預(yù)測
蛋白質(zhì)中約85%的殘基處于3種穩(wěn)定二級結(jié)構(gòu),即α-螺旋、β-折疊和β-轉(zhuǎn)角。二級結(jié)構(gòu)預(yù)測的目的是根據(jù)一級結(jié)構(gòu)判斷殘基是否處于特定二級結(jié)構(gòu)?;诘鞍讛?shù)據(jù)庫,通過在線軟件SOPMA[14] 對高叢越桔UFGT蛋白進(jìn)行二級結(jié)構(gòu)預(yù)測,具體結(jié)果見圖6??梢钥闯?,該蛋白質(zhì)的二級結(jié)構(gòu)主要由4種形式組成,即由α-螺旋占41.97%,無規(guī)卷曲占30.57%,延伸鏈占17.88%,β-轉(zhuǎn)角占9.59%。據(jù)此推測,α-螺旋是高叢越桔UFGT蛋白二級結(jié)構(gòu)中數(shù)量最多的結(jié)構(gòu)元件。
2.8 高叢越桔UFGT蛋白的三級結(jié)構(gòu)預(yù)測
采用同源建模法,利用SWISS-MODEL在線軟件[15]對高叢越桔UFGT蛋白的三級結(jié)構(gòu)進(jìn)行預(yù)測,具體結(jié)果見圖7??梢钥闯?,該蛋白主要有無規(guī)則卷曲、α-螺旋2種結(jié)構(gòu),同時(shí)還伴隨著延伸鏈、β-轉(zhuǎn)角2種結(jié)構(gòu),基本與二級結(jié)構(gòu)預(yù)測結(jié)果一致。
2.9 蛋白質(zhì)磷酸化位點(diǎn)分析
蛋白質(zhì)翻譯后有精氨酸甲基化、磷酸化、ADP核糖基化、糖基化等多種修飾形式,其中,磷酸化是一種重要的共價(jià)修飾方式。利用NetPhos 3.1 Server在線軟件分析[16]的具體結(jié)果見圖8??梢钥闯觯?5個(gè)絲氨酸(Ser)、10個(gè)蘇氨酸(Thr)、1個(gè)酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點(diǎn)。
3 結(jié)論與討論
目前,越桔具有較高的營養(yǎng)價(jià)值,且藥理作用正逐漸被人們認(rèn)識[17]。越桔含有豐富的多酚類物質(zhì),如黃酮醇、酚酸和花青素。其中黃酮醇具有降低心血管和退化性疾病的風(fēng)險(xiǎn)能力[18]?;ㄇ嗨乇蛔C明具有減輕炎癥、降低血糖、影響脂質(zhì)代謝和脂肪沉積、減少大分子的氧化損傷[19]等作用。
通過電子克隆技術(shù)預(yù)測高叢越桔UFGT基因,全長為1 789 bp,開放閱讀框長度為1 161 bp,編碼386個(gè)氨基酸。該蛋白為親水性的非分泌蛋白,且其中存在一處跨膜區(qū)。該蛋白主要由α-螺旋、無規(guī)則卷曲構(gòu)成的二級結(jié)構(gòu),在細(xì)胞質(zhì)和線粒體中分布的可能性最大,有15個(gè)絲氨酸(Ser)、10個(gè)蘇氨酸(Thr)、1個(gè)酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點(diǎn)[20-21]。通過本研究預(yù)測的結(jié)果,為未來UFGT基因在高叢越桔中提取、克隆及基因功能方面的研究奠定基礎(chǔ),同時(shí)也為電子克隆技術(shù)的廣泛應(yīng)用提供參考。
4 參考文獻(xiàn)
[1] 趙建萍,柏新富,蔣小滿,等.北高叢越桔芽器官離體培養(yǎng)與快繁體系的建立[J].林業(yè)科學(xué),2007,43(5):111-115.
[2] 周軍,姚泉洪,彭日荷,等.巨峰葡萄查爾酮異構(gòu)酶基因克隆及表達(dá)分析[J].西北植物學(xué)報(bào),2009,29(9):1723-1729.
[3] KOBAYASHI S,ISHIMARU M,DING C K,et al.Comparison of UDP-glucose:flavonoid 3-O-glucosyltransferase (UFGT) gene sequences be-tween white grapes(Vitis vinifera) and their sports with red skin[J].Plant Science,2001,160(3):543-550.
[4] 付海輝,辛培堯,許玉蘭,等.幾種經(jīng)濟(jì)植物 UFGT 基因的生物信息學(xué)分析[J].基因組學(xué)與應(yīng)用生物學(xué),2010,30(1):92-102.
[5] 趙志常,胡福初,胡桂兵,等.荔枝類黃酮糖基轉(zhuǎn)移酶 (UFGT) 基因的克隆及其原核表達(dá)研究[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,29(4):104-110.
[6] HUMINIECKI L,BICKNELL R.In silico cloning of novel endothelial-specific genes[J].Genome Research,2000,10(11):1796-1806.
[7] GILL R W,SANSEAU P.Rapid in silico cloning of genes using expressed sequence tags (ESTs)[J].Biotechnology annual review,2000,5:25-44.
[8] 王冬冬,朱延明,李勇,等.電子克隆技術(shù)及其在植物基因工程中的應(yīng)用[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2006,37(3):403-408.
[9] PHUANG X,MADAN A.CAP3:A DNA sequence assembly program[J].Genome research,1999,9(9):868-877.
[10] GASTEIGER E,HOOGLAND C,GATTIKER A,et al.Protein identifi-cation and analysis tools on the ExPASy server[M].Humana Press,2005.
[11] PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:disc-riminating signal peptides from transmembrane regions[J].Nature met-hods,2011,8(10):785-786.
[12] KYTE J,DOOLITTLE R F.A simple method for displaying the hydr-opathic character of a protein[J].Journal of molecular biology,1982,157(1):105-132.
[13] PSORT I I.PSORT:a program for detecting sorting signals in proteins and predicting their subcellular localization[J].J.Mol.Biol,1997,266:594-600.
[14] GEOURJON C,DELEAGE G.SOPMA:significant improvements in pr-otein secondary structure prediction by consensus prediction from mul-tiple alignments[J].Computer applications in the biosciences:CABIOS,1995,11(6):681-684.
[15] BIASINI M,BIENERT S,WATERHOUSE A,et al.SWISS-MODEL:m-odelling protein tertiary and quaternary structure using evolutionary in-formation[J].Nucleic acids research,2014:340.
[16] BLOM N,GAMMELTOFT S,BRUNAK S.Sequence and structure-ba-sed prediction of eukaryotic protein phosphorylation sites[J].Journal of molecular biology,1999,294(5):1351-1362.
[17] 李丹,林琳.越桔食品資源的開發(fā)與利用[J].食品與發(fā)酵工業(yè),2000,26(4):76-81.
[18] 劉淑蘭,呂秀蓮,王曉軍,等.越橘的化學(xué)成分與藥理活性研究進(jìn)展[J].中醫(yī)藥學(xué)報(bào),2006,34(6):53-54.
[19] RISO P,KLIMIS-ZACAS D,DEL BO C,et al.Effect of a wild blueberry (Vaccinium angustifolium)drink intervention on markers of oxidative stress,inflammation and endothelial function in humans with cardiova-scular risk factors[J].European journal of nutrition,2013,52(3):949.
[20] 李旭娟,劉洪博,林秀琴,等.甘蔗KNOX基因(Sckn1)的電子克隆及生物信息學(xué)分析[J].基因組學(xué)與應(yīng)用生物學(xué),2015(1):136-142.
[21] 王冬冬,朱延明,李勇,等.電子克隆技術(shù)及其在植物基因工程中的應(yīng)用[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2006(3):403-408.