齊小瓊,葛亞飛,李大衛(wèi)
(1.湖北第二師范學(xué)院化學(xué)與生命科學(xué)學(xué)院/植物抗癌活性物質(zhì)提純與應(yīng)用湖北省重點(diǎn)實(shí)驗(yàn)室,武漢430205;2.中國科學(xué)院武漢植物園植物種質(zhì)創(chuàng)新與特色農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室,武漢430074)
水蕨血紅蛋白基因的分子克隆和序列分析
齊小瓊1,葛亞飛1,李大衛(wèi)2?
(1.湖北第二師范學(xué)院化學(xué)與生命科學(xué)學(xué)院/植物抗癌活性物質(zhì)提純與應(yīng)用湖北省重點(diǎn)實(shí)驗(yàn)室,武漢430205;2.中國科學(xué)院武漢植物園植物種質(zhì)創(chuàng)新與特色農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室,武漢430074)
植物血紅蛋白(Hemoglobin)是一類由珠蛋白(Globin)和血紅素(Ferroheme)組成的結(jié)合蛋白,在植物中廣泛分布,迄今已在苔蘚植物、裸子植物和被子植物中克隆到血紅蛋白基因序列,但在蕨類植物中相關(guān)研究還未見報(bào)道。該研究采用熱不對稱交錯PCR(TAIL-PCR)方法克隆了水蕨血紅蛋白基因的全長序列。該基因的序列總長為949 bp,包含4個(gè)外顯子和3個(gè)內(nèi)含子,編碼189個(gè)氨基酸。預(yù)測的蛋白質(zhì)(命名為CtHb)的分子量為21.14 kDa,等電點(diǎn)(pI)為7.81。三維結(jié)構(gòu)模擬表明CtHb具有植物血紅蛋白典型的三級結(jié)構(gòu):即含有A、B、C、E、F、G和H螺旋,形成了3-on-3的“三明治”結(jié)構(gòu)。和水稻血紅蛋白的三級結(jié)構(gòu)相比,CtHb的大部分結(jié)構(gòu)(包括具有遠(yuǎn)端和近端組氨酸定位的E螺旋和F螺旋的位置等)同水稻的結(jié)構(gòu)極為相似。兩者的不同之處主要表現(xiàn)在:(1)CtHb含有較長的N-端區(qū)域;(2)兩者CD-loop的折疊方式不同;(3)兩者螺旋B和螺旋C的連接方式不同,CtHb是通過卷曲連接的,而水稻中借助的是螺旋。結(jié)構(gòu)進(jìn)化分析揭示了植物血紅蛋白從非共生到共生進(jìn)化過程中的一些關(guān)鍵改變,這些改變可能有助于非共生血紅蛋白向共生血紅蛋白結(jié)構(gòu)的轉(zhuǎn)變,特別是有助于豆血紅蛋白共生功能的實(shí)現(xiàn)。
植物血紅蛋白,序列分析,三級結(jié)構(gòu)模擬,結(jié)構(gòu)進(jìn)化,水蕨
?通訊作者:李大衛(wèi),博士,副研究員,主要從事果樹遺傳育種方向,(E-mail)david.lee1983@163.com。
植物血紅蛋白(Hemoglobin)是一類由珠蛋白(Globin)和血紅素(Ferroheme)組成的結(jié)合蛋白,廣泛存在于植物界,在植物固氮及抵御脅迫中具有重要作用。隨著研究的不斷深入,根據(jù)血紅蛋白的序列、表達(dá)方式以及配體結(jié)合性質(zhì)把植物中的血紅蛋白分為三類:共生的血紅蛋白(Symbiotic hemoglobin,sHb)、非共生的血紅蛋白(Nonsymbiotic hemoglobin,NsHb)和截短的血紅蛋白(Truncated he-moglobin,tHb)。共生的血紅蛋白主要存在于豆類和一些非豆類植物(主要是放線菌結(jié)瘤植物和榆科植物某些屬)固氮根瘤菌侵染的根瘤細(xì)胞中。非共生的血紅蛋白比共生的血紅蛋白分布更廣泛,不僅存在于含有共生血紅蛋白的植物中,而且也存在于其他植物中;并可在多種器官中表達(dá),如正常生長條件和脅迫條件下植物的根、莖、葉、花和種子中(An-derson et al,1996;Lira-Ruan et al,2001;Ross et al,2004;Taylor et al,1994;Trevaskis et al,1997)。截短的血紅蛋白首先在原核生物、原生動物和真核藻類中發(fā)現(xiàn),后來在一些植物中也發(fā)現(xiàn)了該蛋白(Watts et al,2001)。其序列比其他血紅蛋白短(Pesce et al,2000),三維結(jié)構(gòu)是由α-螺旋通過2-on-2的方式排列而成,不同于3-on-3標(biāo)準(zhǔn)的血紅蛋白折疊。通過系統(tǒng)發(fā)育分析表明,植物中的tHb與sHb、NsHb形成了不同的譜系(Lineages),tHb是通過基因水平轉(zhuǎn)移從細(xì)菌中獲得(Vinogradov et al,2006),具體的功能還不是很清楚。
血紅蛋白基因在植物中普遍存在,就目前積累的數(shù)據(jù)來看,大部分序列來自于被子植物,在裸子植物和苔蘚植物中有幾條代表序列,但蕨類和石松類植物中尚未見有相關(guān)報(bào)道,不完全的序列數(shù)據(jù)影響了該基因家族的分子進(jìn)化研究。本研究通過分子克隆手段獲得蕨類植物水蕨的血紅蛋白基因的完整編碼區(qū)序列,并進(jìn)行生物信息學(xué)分析、三級結(jié)構(gòu)模擬及進(jìn)化分析,試圖闡明該基因在序列組成、基因結(jié)構(gòu)、三級結(jié)構(gòu)等方面的特征,并推斷其可能的功能;通過與其他分類群中的血紅蛋白基因進(jìn)行比較分析,探討其在不同分類群中較獨(dú)特的進(jìn)化樣式。
1.1 植物材料
蕨類植物水蕨的健康幼嫩葉片采自中國科學(xué)院武漢植物園。
1.2 主要分子生物學(xué)試劑
普通Taq DNA聚合酶、高保真LA Taq酶、dNTP等試劑購自TaKaRa;DNA凝膠純化回收試劑盒購于Axygen生物技術(shù)有限公司。
1.3 試驗(yàn)方法
1.3.1 水蕨血紅蛋白基因部分片段的擴(kuò)增 分別用擬南芥(Arabidopsis thaliana)AHB1和AHB2基因(登錄號:AAD26949,AAB82770)的蛋白序列作為查詢序列,通過對數(shù)據(jù)庫中已報(bào)道的蕨類序列進(jìn)行相似性搜索,在Ceratopteris richardii中得到一條同目標(biāo)序列相似性較高的EST序列(登錄號: BQ087262)。根據(jù)這條序列設(shè)計(jì)一對特異引物,進(jìn)行PCR擴(kuò)增。引物序列為F-cera:5′-TCACCGAGC-ATCTGCGTCAAT-3′;R-cera:5′-TCAATAGGCAGTA-CCTGACGA-3′。
PCR反應(yīng)體系為20 μL,引物各40 pmol,dNTP 各1 pmol,10×PCR反應(yīng)緩沖液2.0 μL,Taq酶0.2 μL(5 U/μL)。反應(yīng)條件為95℃預(yù)變性5 min;接著94℃變性50 s,53℃退火50 s,72℃延伸60 s,共36個(gè)循環(huán);最后72℃延伸8 min。
1.3.2 水蕨血紅蛋白基因3′側(cè)翼序列的擴(kuò)增 以提取的總DNA為模板,用3個(gè)巢式單引物進(jìn)行3輪TAIL-PCR擴(kuò)增,引物序列為3′TAIL-1:5′-TCTTAAT-GTGAGTTCGCCTCTGTGA-3′;3′TAIL-2:5′-CTTTGAG-CAGCACAGGAATGGTCTC-3′;3′TAIL-3:5′-CGGTG-TAGTGGATGAGCATTATGAG-3′。
TAIL-PCR的反應(yīng)體系為50 μl,簡并引物AD (5′-TC(G/C)TICGNACIT(A/T)GGA-3′) (Liu and Whittier,1995)。各成分及用量如下:LA buffer (Mg2+plus)5.0 μL;dNTP Mix(2.5 mmol/L)8.0 μL;AD引物(20 μmol/L)5.0 μL;基因特異性引物(5 μmol/L)2.0 μL;LA Taq酶(5 U/μL)0.5 μL;DNA (50 ng/μL)5.0 μL;H2O 24.5 μL。
第一輪反應(yīng)引物采用3′TAIL-1和AD,條件為94℃預(yù)變性1 min,98℃預(yù)變性1 min;接著94℃變性30 s,65℃退火1 min,72℃延伸2 min,共5個(gè)循環(huán);緊接著94℃變性30 s,25℃退火3 min,在3 min內(nèi)攀升到72℃,72℃延伸2 min,進(jìn)行一個(gè)循環(huán);接著94℃變性30 s,65℃退火1 min,72℃延伸2 min,94℃變性30 s,65℃退火1 min,72℃延伸2 min,94℃變性30 s,44℃退火1 min,72℃延伸2 min,共15個(gè)循環(huán);最后72℃延伸10 min。TAIL-PCR第二輪反應(yīng)引物采用3′TAIL-2和AD,將第一輪反應(yīng)產(chǎn)物稀釋50倍,取1 μL作為第二輪反應(yīng)的模板,其它成分與第一輪反應(yīng)相同。反應(yīng)條件為94℃預(yù)變性1 min;接著94℃變性30 s,65℃退火1 min,72℃延伸2 min,94℃變性30 s,65℃退火1 min,72℃延伸2 min,94℃變性30 s,44℃退火1 min,72℃延伸2 min,共15個(gè)循環(huán);最后72℃延伸10 min。第三輪反應(yīng)引物采用3′TAIL-3和AD,將第二輪反應(yīng)產(chǎn)物稀釋50倍,取1 μL作為第三輪反應(yīng)的模板,其它成分與第二輪反應(yīng)相同。反應(yīng)條件也同第二輪相同。
1.3.3 產(chǎn)物回收、連接、轉(zhuǎn)化、克隆、測序 擴(kuò)增片段凝膠回收采用凝膠回收試劑盒,參照說明書進(jìn)行;產(chǎn)物連接采用TaKaRa公司pMD19-T simple Vector,參考說明書,反應(yīng)體系稍作優(yōu)化。大腸桿菌感受態(tài)細(xì)胞制備采用CaCl2法,將目的基因通過熱激法轉(zhuǎn)化到大腸桿菌感受態(tài)細(xì)胞中,陽性克隆采用藍(lán)白斑篩選方法并進(jìn)一步采用PCR方法,擴(kuò)增產(chǎn)物長度與目的片段相當(dāng)者為陽性克隆。每個(gè)目的片段,隨機(jī)選取至少3個(gè)陽性克隆,送華大基因測序。序列測定采用ABI PRISM 3730 DNA測序儀用BigDye Termi-nator Kit(Applied Biosystems)進(jìn)行雙向克隆測序。
1.4 數(shù)據(jù)分析
采用BioEdit軟件(http://www.mbio.ncsu.edu/BioEdit/bioedit.html) (North Carolina State University)對克隆測序得到的片段進(jìn)行拼接。采用FGENESH和NCBI(http://linux1.softberry.com/berry.phtml)的ORF finder進(jìn)行開放閱讀框確定。運(yùn)用DNAstar軟件推測氨基酸序列,分析蛋白質(zhì)的分子量、等電點(diǎn)和氨基酸組成。使用SignalP 3.0 Server(http://www.cbs.dtu.dk/services/SignalP/)分析蛋白N-端氨基酸序列,根據(jù)SignalP分析得到的Cmax值(the cleavage site score)、Smean(the signal peptide score)和HMM值(Hidden Markov Model)判別信號肽序列,確定是否存在信號肽。使用TargetP Server v1.01(http://www.cbs.dtu.dk/services/Tar-getP/)確定分泌蛋白的分泌途徑和亞細(xì)胞定位。蛋白質(zhì)保守結(jié)構(gòu)功能域用PROSITE、SMART軟件和PFAM數(shù)據(jù)庫(http://pfam.wustl.edu/)進(jìn)行預(yù)測。多條序列的一致性分析用Bioedit軟件sequence i-dentity matrix進(jìn)行。使用在線軟件SOPMA預(yù)測蛋白二級結(jié)構(gòu)并計(jì)算各種二級結(jié)構(gòu)所占的百分比。將推導(dǎo)的氨基酸序列提交瑞士生物信息研究所的Swiss-model(http://www.isb-sib.ch/)(Arnold et al,2006;Schwede et al,2003),基于同源建模的原理,用水稻的NsHb1作為模板(PDB code:1D8UA)進(jìn)行水蕨血紅蛋白三級結(jié)構(gòu)的預(yù)測。預(yù)測結(jié)果用Py-MOL軟件展示和編輯。
運(yùn)用Blast工具(http//blast.ncbi.nlm.nih.gov/Blast.cgi),以水蕨血紅蛋白作為查詢序列,進(jìn)行序列相似性搜索,并選取相似性較高的序列用MEGA6軟件(Tamura et al,2013)中的鄰接算法進(jìn)行進(jìn)化樹的構(gòu)建,其中多重序列比對采取Clustalx軟件進(jìn)行。
2.1 水蕨血紅蛋白基因的克隆
以水蕨的總DNA為模板,用一對特異引物(F-cera和R-cera)擴(kuò)增得到一段約820 bp的片段(圖 1:a)。經(jīng)過分析,該序列的5′端是完整的,因此只需通過染色體步移技術(shù)獲得3′側(cè)翼序列?;讷@得的序列片段,進(jìn)一步設(shè)計(jì)了一組巢式引物通過TAIL-PCR來獲得3′側(cè)翼序列。在TAIL-PCR的第二輪和第三輪分別獲得了幾條清晰的條帶,根據(jù)巢式引物設(shè)計(jì)的相對位置,選取這兩輪反應(yīng)的產(chǎn)物大小相差大約100 bp的條帶(圖1:b)作為目的條帶。將第三輪的目的條帶回收、克隆測序,經(jīng)分析,得到的序列含有同已知序列完全一致的重疊區(qū)。將上述實(shí)驗(yàn)獲得的序列拼接最終得到水蕨血紅蛋白基因的完整編碼區(qū)序列。
圖1 特異PCR(a)、TAIL-PCR(b)瓊脂糖電泳檢測M.2000 bp分子量標(biāo)記;a 1.特異引物F-cera和R-cera擴(kuò)增得到的大約820 bp的產(chǎn)物;b II.引物3′TAIL-2通過TAIL-PCR第二輪反應(yīng)得到的條帶;b III.引物3′TAIL-3通過TAIL-PCR第三輪反應(yīng)得到的條帶。Fig.1 Agarose gel electrophoresis of the specific PCR(a),TAIL-PCR(b)products M.Molecular weight marker(DL2000);a 1.About 820 bp fragment generated by specific PCR with primer F-cera and R-cera;b II.Several bands produced by the secondary reaction of TAIL-PCR with primer 3′TAIL-2;b III.Two clear bands produced by the tertiary reaction of TAIL-PCR with primer 3′TAIL-3.
將得到的序列同C.richardii的EST(登錄號: BQ087262)序列進(jìn)行比對,發(fā)現(xiàn)本研究獲得的序列比數(shù)據(jù)庫中的序列多了三段區(qū)域,其它部分都完全匹配,推測這三部分是基因的內(nèi)含子區(qū)域。由此獲知該基因含有4個(gè)外顯子,3個(gè)內(nèi)含子,這與其他植物血紅蛋白的基因結(jié)構(gòu)相同。說明血紅蛋白基因的外顯子-內(nèi)含子結(jié)構(gòu)在植物進(jìn)化中是保守的。
表1 序列一致性分析Table 1 Analysis of percent sequence identify
2.2 全長基因序列及編碼蛋白的基本性質(zhì)分析
對已獲得的克隆基因進(jìn)行分析研究后,得到水蕨血紅蛋白(命名為CtHb)基因序列全長(圖2)為949 bp,該基因包括4個(gè)外顯子和3個(gè)內(nèi)含子,編碼189個(gè)氨基酸。氨基酸組成中含量最高的為丙氨酸(Ala,11.6 ),其次纈氨酸(Val,9.0 )、絲氨酸(Ser,8.5 )、亮氨酸(Leu,7.9 )和賴氨酸(Lys,7.9 )。堿性氨基酸(Arg,Lys)24個(gè),強(qiáng)酸性氨基酸(Asp,Glu)23個(gè),疏水氨基酸(Ala,Ile,Leu,Phe,Trp,Val)71個(gè),不帶電荷的極性氨基酸(Asn,Cys, Gln,Ser,Thr,Tyr)41個(gè)。預(yù)測的蛋白質(zhì)分子量為21.14 kDa,理論等電點(diǎn)(pI)為7.81。
圖2 水蕨血紅蛋白基因的核酸序列和推導(dǎo)的氨基酸序列 推導(dǎo)的氨基酸序列標(biāo)注在開放閱讀框下面,小寫字母示內(nèi)含子部分。Fig.2 Nucleotide and deduced amino acid sequences of hemoglobin gene from Ceratopteris thalictroides The predicted amino acid sequence is shown below its open reading frame,and the introns are present in lowercase letters.
2.3 蛋白質(zhì)的信號肽預(yù)測及亞細(xì)胞定位分析
采用SignalP對該蛋白序列及其他分類群的代表序列(包括苔蘚植物2條(Physcomitrella patens和Ceratodon purpureus)、石松類1條(Selaginellae moel-lendorfii)和被子植物11條(具體的物種和序列名稱見表1)進(jìn)行在線搜索,發(fā)現(xiàn)這些蛋白存在信號肽的概率都極低,不存在信號肽酶切位點(diǎn),說明這些血紅蛋白很可能為非分泌蛋白。進(jìn)一步分析這些蛋白的亞細(xì)胞定位,發(fā)現(xiàn)大部分蛋白是細(xì)胞質(zhì)蛋白,只有小立碗蘚和江南卷柏的血紅蛋白具有較高分值的葉綠體定位信號,可能會定位于葉綠體中。
2.4 序列一致性分析
表1給出的是15條植物血紅蛋白序列兩兩之間的一致性指數(shù),其中包括2條苔蘚植物序列(Phy- scomitrella patens和Ceratordon purpureus),1條石松類植物序列(Selaginellae moellendorfii),1條蕨類植物序列(Ceratopteris thalictroides)及11條被子植物序列。本研究發(fā)現(xiàn)CtHb與被子植物NsHb1的序列一致性偏高,與豆科植物sHb的序列一致性偏低,說明CtHb屬于NsHb1;同時(shí)比較CtHb和其他分類群NsHb的一致性發(fā)現(xiàn),與古老的苔蘚、石松類植物的NsHb序列相比,CtHb在進(jìn)化上更類似于被子植物NsHb。
2.5 水蕨血紅蛋白高級結(jié)構(gòu)預(yù)測
在二級結(jié)構(gòu)預(yù)測中,CtHb主要由61.38 的α-螺旋,6.35 的延伸片層,5.82 的β-轉(zhuǎn)角和26? 46 無規(guī)卷曲組成。其中α-螺旋和卷曲是CtHb二級結(jié)構(gòu)的主要構(gòu)成成分。
了解水蕨血紅蛋白的結(jié)構(gòu)性質(zhì)對于闡明植物血紅蛋白的進(jìn)化多樣性及其在植物中發(fā)揮的作用都有
著重要的意義。通過計(jì)算機(jī)模擬可以從模板預(yù)測出高質(zhì)量的蛋白質(zhì)三級結(jié)構(gòu),通過預(yù)測出的結(jié)構(gòu)可以考察血紅蛋白的進(jìn)化模式,在結(jié)構(gòu)和功能方面理解進(jìn)化問題。由于CtHb和水稻NsHb1具有接近50的相似性,所以可以用水稻NsHb1(1D8UA)作為預(yù)測CtHb三級結(jié)構(gòu)的模板。
圖3 a.預(yù)測的CtHb三級結(jié)構(gòu);b.選取的CtHb血紅素口袋中的氨基酸三級結(jié)構(gòu) 每個(gè)螺旋分別用字母A,B,C,E,F和H表示。Fig.3 a.Predicted tertiary structure of CtHb;b.Tertiary structure of selected amino acids in heme pocket of CtHb Helices(in-cluding to prehelix A)are indicated with letters A,B,C,E,F and H.
圖4 A.CtHb(灰色表示)和水稻NsHb1(黑色表示)三級結(jié)構(gòu)比對圖;B.選取在CtHb(灰色表示)和水稻NsHb1(黑色表示)血紅素口袋中的氨基酸位點(diǎn)的三級結(jié)構(gòu)比對圖 每個(gè)螺旋分別用A,B,C,E,F和H表示,其中(a)為正面,(b)為背面。Fig.4 A.Overlay of predicted tertiary structure of CtHb(gray)and native rice NsHb1(black)tertiary structures;B.Tertiary struc-ture overlay of selected amino acids in heme pocket of CtHb(gray)and native rice NsHb1(black) Helices(including to prehelix A)are indicated with letters A,B,C,E,F and H. (a)is a front view,while(b)is a back view.
圖3給出了CtHb三維結(jié)構(gòu)模擬結(jié)果。圖中顯示,CtHb具有植物血紅蛋白典型的三級結(jié)構(gòu)模式,即含有A、B、C、E、F、G和H螺旋,形成了3-on-3的“三明治”結(jié)構(gòu)。將CtHb和水稻NsHb1的三級結(jié)構(gòu)進(jìn)行overlay比較,結(jié)果如圖4:A所示:預(yù)測得到的CtHb三級結(jié)構(gòu)具有典型球蛋白的折疊方式,它的大部分結(jié)構(gòu)(包括具有遠(yuǎn)端和近端組氨酸定位的E和F螺旋的位置等)同水稻的結(jié)構(gòu)非常相似;不同之處主要表現(xiàn)在:(1)CtHb含有較長的N-端區(qū)域;(2)兩者CD-loop的折疊方式不同;(3)兩者螺旋B和螺旋C的連接方式不同,CtHb是通過卷曲連接的,而水稻NsHb1借助的是螺旋。
在比對圖5中,發(fā)現(xiàn)苔蘚植物、石松類和蕨類植物NsHb中都含有一段延長的N-端序列,Ross et al (2002)在苔蘚植物NsHb中檢測到了類似于前導(dǎo)肽的蛋白位點(diǎn),推測植物NsHb的祖先可能是定位于細(xì)胞器中的,這同軟件預(yù)測的小立碗蘚NsHb的亞細(xì)胞定位結(jié)果一致。推測這段延長的N-端氨基酸可能有助于蛋白的轉(zhuǎn)運(yùn)(Garrocho-villegas&Arre-dondo-peter,2008)。在CtHb中,A螺旋之前存在較長的一段序列,可能與苔蘚植物延長的N-端氨基酸有著相似的作用,即與蛋白的轉(zhuǎn)運(yùn)有關(guān),但信號肽和亞細(xì)胞定位預(yù)測都沒有支持這一推斷。這可能與采用的生物信息學(xué)的預(yù)測方法有關(guān),需要進(jìn)一步的實(shí)驗(yàn)證據(jù)來證明。如果這些都被驗(yàn)證是正確的,那么從進(jìn)化的角度講,NsHb可能從細(xì)胞器的蛋白進(jìn)化成了細(xì)胞質(zhì)的蛋白(Ross et al,2002)。
圖5 植物血紅蛋白的多序列比對 序列的保守性通過ESPript化學(xué)等價(jià)策略進(jìn)行可視化,設(shè)置相似性閾值來強(qiáng)調(diào)嚴(yán)格保守的位置;不變殘基添加黑色背景,理化性質(zhì)相同的殘基用灰色矩形框標(biāo)注;預(yù)測的CtHb二級結(jié)構(gòu)元件標(biāo)注在序列比對的最上面。Fig.5 Multiple alignment of plant hemoglobins Sequence conservation is visualized according to the ESPript chemical equivalence measure,with a similarity threshold set to emphasize strictly conserved positions;Invariant residues are boxed in black,physico-chemical equivalent residues are boxed in gray;The deduced secondary structure of CtHb is shown above the alignment.
本研究也檢測了參與配基結(jié)合的一些重要位點(diǎn)的氨基酸組成和相對位置(圖4:B),結(jié)果表明近端組氨酸(His),遠(yuǎn)端組氨酸,螺旋B第10位的苯丙氨酸(Phe),CD-loop第1位的苯丙氨酸及172/150的酪氨酸(Tyr)在水蕨和水稻NsHb1中都非常一致,位置完全吻合。這表明CtHb具有水稻NsHb1類似的配基結(jié)合動力學(xué)性質(zhì),即具有很低的O2解離常數(shù),很高的O2親和力。
4.6 血紅蛋白的序列和結(jié)構(gòu)進(jìn)化
通過將CtHb與其他分類群的代表序列比較發(fā)現(xiàn)(圖5):CtHb包含非常保守的近端組氨酸(H95),遠(yuǎn)端組氨酸(H130)和位于B螺旋第10位的苯丙氨酸(F62);同時(shí)也發(fā)現(xiàn),在CD-loop的第1位上只有苔蘚植物是酪氨酸(Tyr)而其他物種都是苯丙氨酸(Phe)。這說明CD1在非共生血紅蛋白的祖先序列中是被酪氨酸占據(jù)的,而在進(jìn)化過程中被苯丙氨酸所取代。
圖6不同物種GGPPS蛋白序列的同源比較采用Neighbor-joining算法,在MEGA6軟件平臺上構(gòu)建了植物血紅蛋白的分子系統(tǒng)進(jìn)化樹(圖6)。根據(jù)序列的差異分為兩大分支—非共生血紅蛋白1 (Ns1)、古老的血紅蛋白(Ns)組成的分支和非共生血紅蛋白2(Ns2)、共生血紅蛋白(sHb)組成的分支;CtHb位于非共生血紅蛋白1的基部,說明其可能是非共生血紅蛋白1的共同祖先,并且其進(jìn)化地位比古老的苔蘚植物血紅蛋白稍微高等一點(diǎn),這跟物種的進(jìn)化關(guān)系是吻合的。
圖6 不同物種的系統(tǒng)進(jìn)化樹Fig.6 Phylogenetic tree of different species
圖7 角齒蘚、水蕨、水稻非共生血紅蛋白和大豆豆血紅蛋白三級結(jié)構(gòu)和表面電荷分布比較 帶有正電荷和負(fù)電荷的氨基酸分別用藍(lán)色和紅色表示;小立碗蘚的三級結(jié)構(gòu)坐標(biāo)數(shù)據(jù)(ID number:PM0075013)從蛋白質(zhì)模型數(shù)據(jù)庫(Protein Model Database)(http://mi. caspur.it/PMDB/)下載,水稻和大豆的三級結(jié)構(gòu)坐標(biāo)數(shù)據(jù)(ID numbers:1D8U和1BIN)從RCSB蛋白質(zhì)數(shù)據(jù)庫(RCSB Protein Data Bank)下載。Fig.7 Comparison of the predicted nonsymbiotic hemoglobin from Ceratodon purpureus,Ceratopteris thalictroides,native rice NsHb1 and soybean Lba tertiary structures and surface charge distribution Blue and red colors represent positively and negatively charged amino acid residues,respectively;Coordinates for nonsymbiotic hemoglobin from Ceratodon purpureus was obtained from Protein Model Database(http://mi.caspur.it/PMDB/)under the ID number PM0075013.Coordinates for the rice NsHb1 and soybean Lba structures were obtained from RCSB Protein Data Bank with the ID numbers 1D8U and 1BIN,respectively.
本研究也比較了角齒蘚、水蕨、水稻非共生血紅蛋白及大豆的豆血紅蛋白三維結(jié)構(gòu)的差異,揭示了植物血紅蛋白從非共生到共生進(jìn)化過程中的一些關(guān)鍵改變(圖7)。這些改變包括:(1)血紅素輔基從六配位體(Hexacoordinate)到五配位體(Pentacoordi-nate)的轉(zhuǎn)變(Gopalasubramaniam et al,2008);(2) CD-loop,N-端和C-端區(qū)域長度的縮短;(3)蛋白結(jié)構(gòu)更加緊湊,形成球狀結(jié)構(gòu)。這些改變可能有助于非共生血紅蛋白向共生血紅蛋白結(jié)構(gòu)的轉(zhuǎn)變,特別是有助于豆血紅蛋白共生功能的實(shí)現(xiàn)(Gopalasubra-maniam et al,2008)。
(Continue on page 161)(Continue from page 223)
ARNOLD K,BORDOLI L,KOPP J,et al,2006.The SWISS-MODEL workspace:a web-based environment for protein structure homology modelling[J].Bioinformatics,22(2):195-201.
ANDERSON CR,JENSEN EO,LLEWELLYN DJ,et al,1996.A new hemoglobin gene from soybean:a role for hemoglobin in all plants[J].Proc Natl Acad Sci USA,93(12):5 682-5 687.
GARROCHO-VILLEGAS V,ARREDONDO-PETER R,2008.Mo-lecular cloning and characterization of a Moss(Ceratodon purpu-reus)nonsymbiotic hemoglobin provides insight into the early evo-lution of plant nonsymbiotic hemoglobins[J].Mol Biol Evol,25 (7):1 482-1 487.
GOPALASUBRAMANIAM SK,KOVACS F,VIOLANTE-MOTA F,et al,2008.Cloning and characterization of a caesalpinoid (Chamaecrista fasciculata)hemoglobin:the structural transition from a nonsymbiotic hemoglobin to a leghemoglobin[J]. Proteins,72(1):252-260.
LIRA-RUAN V,SARATH G,KLUCAS RV,et al,2001.Synthesis of hemoglobins in rice(Oryza sativa var.Jackson)plants growing in normal and stress conditions[J].Plant Sci,161(2):279-287.
LIU YG,WHITTIER RF,1995.Thermal asymmetric interlaced PCR:automatable amplification and sequencing of insert end fragments from P1 and YAC clones for chromosome walking [J].Genomics,25(3):674-681.
PESCE A,COUTURE M,DEWILDE S,et al,2000.A novel two-over-two α-helical sandwich fold is characteristic of the truncated hemoglobin family[J].EMBO J,19(11):2 424-2 434.
ROSS EJH,LIRA-RUAN V,ARREDONDO-PETER R,et al,2002.Recent insights into plant hemoglobins[J].Rev Plant Bio-chem Biotechnol,1:173-189.
ROSS EJH,STONE JM,ELOWSKY CG,et al,2004.Activation of the Oryza sativa non-symbiotic haemoglobin-2 promoter by the cytokinin-regulated transcription factor,ARR1[J].J Exp Bot,55(403):1 721-1 731.
SCHWEDE T,KOPP J,GUEX N,et al,2003.SWISS-MODEL: An automated protein homology-modeling server[J].Nucleic Acids Res,31(13):3 381-3 385.
TAMURA K,STECHER G,PETERSON D,et al,2013.MEGA6: molecular evolutionary genetics analysis version 6.0[J].Mol Biol Evol,30(12):2 725-2 729.
TAYLOR ER,NIE XZ,MACGREGOR AW,et al,1994.A cereal haemoglobin gene is expressed in seed and root tissues under anae robic conditions[J].Plant Mol Biol,24(6):853-862.
TREVASKIS B,WATTS RA,ANDERSSON CR,et al,1997.Two hemoglobin genes in Arabidopsis thaliana:the evolutionary origins of leghemoglobins[J].Proc Natl Acad Sci USA,94 (22):12 230-12 234.
VINOGRADOV S,HOOGEWIJS D,BAILLY X,et al,2006.A phylogenomic profile of globins[J].BMC Evol Biol,6(1):31.
WATTS RA,HUNT PW,HVITVED AN,et al,2001.A hemoglobin from plants homologous to truncated hemoglobins of microorganisms [J].Proc Natl Acad Sci USA,98(18):10 119-10 124.
Molecular clone and sequence analysis of hemoglobin gene in Ceratopteris thalictroides
QI Xiao-Qiong1,GE Ya-Fei1,LI Da-Wei2?
(1.School of Chemistry and Life Sciences,Hubei University of Education/Hubei Key Laboratory of Purification and Application of
Plant Anticancer Active Ingredients,Wuhan 430205,China;2.Key Laboratory of Plant Germplasm Enhancement and
Specialty Agriculture,Wuhan Botanical Garden,Chinese Academy of Sciences,Wuhan 430074,China)
Plants,like humans,contain hemoglobins(Hbs),which consist mostly of protein subunits(the“globin”molecules)and heme groups.Phylogenomic analysis shows that Hbs are widely distributed in higher plants,and by com-paring sequences,expression patterns,and ligand-binding properties,it is evident that three distinct types of Hb exist in plants:symbiotic,non-symbiotic,and truncated Hbs.In the recent years,the genes of Hb have been cloned and identi-fied in various species of bryophytes,gymnosperms and angiosperms,but no study has been reported in the ferns until
now.In the present study,a full-length Hb gene from Ceratopteris thalictroides was cloned by Thermal Asymmetric Inter-laced(TAIL)PCR,and sequence analysis was conducted by bioinformatics.The results revealed that the gene was 949 bp long,containing 4 exons interrupted by 3 introns.The deduced protein(named CtHb)with 189 amino acid residues had a predicted isoelectric point(PI)of 7.81 and a calculated molecular mass 21.14 kDa.Modeling of the tertiary struc-ture indicated that CtHb possesses the typical tertiary structure as plant Hbs(including helices A,B,C,E,F,G and H,these together forms a“sandwich”structure of 3-on-3).Comparative structure analysis of CtHb with rice native NsHb1 revealed that most of the CtHb structure was quite similar to that of rice NsHb1,including the positions of helices E and F,where distal and proximal His were located,respectively.However,the structure differences were as follows: (1)The N-terminus region was longer in CtHb than in rice NsHb1;(2)The CD-loop folded differently;(3)Helices to coils transition at the connect regions of helices B and C were different.Structural comparison revealed major evolutionary changes during plant Hbs evolution.Some of these structural changes would be helpful for the transition from nonsymbiot-ic Hb to symbiotic Hb and for the specialization of a symbiotic function for symbiotic Hb.
plant hemoglobin,sequence analysis,tertiary structure modeling,structural evolution,Ceratopteris thalic-troides
Q943.2,Q75
A
1000-3142(2016)02-0216-08
10.11931/guihaia.gxzw201506023
齊小瓊,葛亞飛,李大衛(wèi).水蕨血紅蛋白基因的分子克隆和序列分析[J].廣西植物,2016,36(2):216-223
QI XQ,GE YF,Li DW.Molecular clone and sequence analysis of hemoglobin gene in Ceratopteris thalictroides[J].Guihaia,2016,36(2):216-223
2015-06-24
2015-12-04
國家自然科學(xué)基金(31201242,C130405);湖北省科學(xué)研究計(jì)劃項(xiàng)目(Q20143004);湖北省自然科學(xué)基金(2015CFB508);植物抗癌活性物質(zhì)提純與應(yīng)用湖北省重點(diǎn)實(shí)驗(yàn)室開放課題(HLPAI 2014004) [Supported by the National Natural Science Foundation of China(31201242,C130405);Scientific Research Project of Educational Commission of Hubei Province(Q20143004);Natural Science Foundation of Hubei Province (2015CFB508);Open Research Fund of Hubei Key Laboratory of Purification and Application of Plant Anticancer Active Ingredients(HLPAI 2014004)]。作者簡介:齊小瓊(1981-),女,山東昌邑人,博士,講師,主要從事進(jìn)化遺傳學(xué)研究,(E-mail)108816564@qq.com。