肖小虎 隋金蕾 戚繼艷 方永軍 周斌輝 唐朝榮
摘 要 PEP羧化酶激酶相關(guān)激酶(PEP carboxylase kinase-related kinases,PEPRKs)是CDPK-SnRK超家族的一員,目前對(duì)其生理功能尚不清楚。本研究以擬南芥和楊樹的PEPRK序列作為探針,對(duì)橡膠樹和其他5種植物(木薯、水稻、楊樹、蓖麻和擬南芥)的基因組和轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行全面搜索,共鑒定得到25個(gè)PEPRK基因家族成員,其中包括5個(gè)橡膠樹PEPRK基因,命名為HbPEPRK1-5。序列分析發(fā)現(xiàn)橡膠樹PEPRK和其他植物類似,在序列中部含有一個(gè)相對(duì)比較保守的激酶結(jié)構(gòu)域,而兩端的同源性相對(duì)較低。在基因結(jié)構(gòu)和進(jìn)化方面,PEPRK主要分為2個(gè)大的分支,相同分支的成員在結(jié)構(gòu)域和內(nèi)含子分布上更為相似,其中橡膠樹和木薯PEPRK在進(jìn)化上具有較近的親緣關(guān)系。在基因的表達(dá)方面,HbPEPRK1主要在穩(wěn)定期的葉片中表達(dá),HbPEPRK2和HbPEPRK5在樹葉、樹皮和膠乳中均有表達(dá),HbPEPRK4主要在種子中表達(dá);另外,研究發(fā)現(xiàn)橡膠樹PEPRK家族成員的表達(dá)還與葉片發(fā)育、乙烯利刺激、真菌侵染和低溫脅迫具有一定的相關(guān)性。
關(guān)鍵詞 巴西橡膠樹;PEPRK;基因家族;結(jié)構(gòu)與進(jìn)化;表達(dá)分析
中圖分類號(hào) S794.1 文獻(xiàn)標(biāo)識(shí)碼 A
Identification and Expression of PEPRK Genes
from Hevea brasliensis
XIAO Xiaohu1, SUI Jinlei1,2, QI Jiyan1, FANG Yongjun1,
ZHOU Binhui1,2, TANG Chaorong1*
1 Rubber Research Institute, CATAS, Danzhou, Hainan 571737, China
2 College of Agronomy, Hainan University, Haikou, Hainan 570228, China
Abstract Phosphoenolpyruvate carboxylase kinase-related kinase is a member of CDPK-SnRK superfamily. Little is known about its functions. By searching the transcriptome and genome databases, we have identified 25 PEPRK genes from Hevea brasliensis and five other plant species, including five members from H. brasliensis, which were named HbPEPRK1 to 5. Sequence analysis revealed that all PEPRK genes comprised one protein kinase domain. The plant PEPRK clustered into two major groups in phylogenetic tree, the members in the same group shared a similar introns and domains distribution. H. brasliensis PEPRKs were more closely related to PEPRKs of Manihot esculenta. The results of expression analysis indicated that HbPEPRK1 was mainly expressed in mature leaves, HbPEPRK2 and HbPEPRK5 were expressed in leaves, bark and latex, HbPEPRK4 was mainly expressed in seeds. In addition, the expression of H. brasliensis PEPRK genes was related to leaf development, ethephon stimulation, C. cassiicola infection and low temperature.
Key words Hevea brasiliensis; PEPRK; gene family; structure and evolution; expression analysis
doi 10.3969/j.issn.1000-2561.2017.01.013
在植物中,CDPK-SnRK超家族包含7種絲氨酸-蘇氨酸蛋白蛋白激酶:鈣依賴蛋白激酶(Ca2+-dependent protein kinases,CDPKs),CDPK相關(guān)蛋白激酶(CDPK-related kinases,CRKs),磷酸烯醇式丙酮酸羧激酶(phosphoenolpyruvate carboxylase kinases,PPCKs),PEP羧化酶激酶相關(guān)激酶(PEP carboxylase kinase-related kinases,PEPRKs),鈣調(diào)素依賴性蛋白激酶(calmodulin-dependent protein kinases,CaMKs),鈣/鈣調(diào)素依賴型蛋白激酶(calcium and calmodulin-dependent protein kinases,CCaMKs)和SnRKs蛋白激酶[1]。PEPRKs是與CDPK高度同源和密切相關(guān)的一類絲/蘇蛋白激酶,僅存在于植物體內(nèi),關(guān)于其功能研究報(bào)道較少[1-3]。在橡膠樹中,李超燕等[4]根據(jù)EST序列利用RACE從橡膠樹中克隆得到一個(gè)PEPRK基因,命名為HbPEPRK1,并利用熒光定量PCR技術(shù)對(duì)其表達(dá)進(jìn)行了初步分析。本研究以已發(fā)表[1,3]PEPRK蛋白氨基酸序列為探針,對(duì)橡膠樹、木薯、蓖麻、擬南芥、楊樹和水稻6種植物的全基因組數(shù)據(jù)進(jìn)行全面搜索,鑒定得到25個(gè)PEPRK基因家族成員,其中橡膠樹中有5個(gè)。筆者們利用相關(guān)軟件和數(shù)據(jù)庫(kù),對(duì)橡膠樹PEPRK基因家族成員的基因結(jié)構(gòu)、進(jìn)化和表達(dá)水平進(jìn)行了系統(tǒng)分析。研究結(jié)果將有助于本課題組深入了解橡膠樹PEPRK的生物學(xué)功能。
1 材料與方法
1.1 材料
本實(shí)驗(yàn)室Solexa測(cè)序所用的巴西橡膠樹(Hevea brasiliensis)熱研7-33-97材料,除了根來(lái)自于組培苗外,其他組織(包括膠乳、樹皮、樹葉、種子、雌花和雄花)均來(lái)自中國(guó)熱帶農(nóng)業(yè)科學(xué)院試驗(yàn)場(chǎng)3隊(duì)的正常割膠橡膠樹(開割2 a以上),根來(lái)自于中國(guó)熱帶農(nóng)業(yè)科學(xué)院橡膠研究所種質(zhì)資源圃華玉偉老師贈(zèng)送的熱研7-33-9組培苗;不同發(fā)育時(shí)期的橡膠樹葉片來(lái)自于中國(guó)熱帶農(nóng)業(yè)科學(xué)院橡膠所種質(zhì)資源圃,為一年生的熱研7-33-97嫁接苗;乙烯利處理的材料主要來(lái)自于海南省儋州市中國(guó)熱帶農(nóng)業(yè)科學(xué)院試驗(yàn)場(chǎng)3隊(duì),品系為熱研7-33-9,正常開割樹(3天一刀,不涂乙烯利刺激),用1.5%乙烯利在不同時(shí)間處理橡膠樹,相應(yīng)4個(gè)時(shí)間點(diǎn)處理為0、3、12、24 h。
網(wǎng)上測(cè)序數(shù)據(jù)來(lái)自NCBI SRA數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/sra),包括不同組織(PRJNA201084),真菌侵染(Corynespora cassiicola tolerance,PRJNA179126)、高低溫干旱脅迫(PRJNA182078)和乙烯利處理(PRJNA182079),詳細(xì)信息參見數(shù)據(jù)庫(kù)中實(shí)驗(yàn)說(shuō)明。
1.2 方法
1.2.1 基因家族成員的鑒定與序列分析 為了全面鑒定橡膠樹、擬南芥、楊樹、水稻、木薯和蓖麻的PEPRK基因家族成員,本課題組從NCBI(http://www.ncbi.nlm.nih.gov/)和phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)數(shù)據(jù)庫(kù)下載了5種植物的基因組和轉(zhuǎn)錄組數(shù)據(jù)。以擬南芥和楊樹的PEPRK序列為探針,對(duì)6種植物的基因組和轉(zhuǎn)錄組進(jìn)行搜索,得到候選PEPRK基因家族成員,利用InterProScan(http://www.ebi.ac.uk/Tools/pfa/iprscan/)對(duì)候選基因的結(jié)構(gòu)域進(jìn)行分析。再利用EMBOSS數(shù)據(jù)庫(kù)的在線軟件Pepstats(http://www.ebi.ac.uk/Tools/seqstats/emboss_ pepstats/)對(duì)基因的等電點(diǎn)和分子量進(jìn)行批量分析。
1.2.2 基因結(jié)構(gòu)與進(jìn)化分析 利用在線軟件GSDS2.0(http://gsds.cbi.pku.edu.cn/)對(duì)橡膠樹和其他5種植物PEPRK基因家族成員的外顯子/內(nèi)含子組織結(jié)構(gòu)進(jìn)行分析。利用MEGA 6.0軟件對(duì)橡膠樹和其他5種植物的PEPRK氨基酸序列一起構(gòu)建系統(tǒng)發(fā)育樹,采用Neighbor-Joining方法進(jìn)行分子系統(tǒng)學(xué)分析,進(jìn)行1 000次bootstrap統(tǒng)計(jì)學(xué)檢驗(yàn)。
1.2.3 基因的表達(dá)模式分析 利用本實(shí)驗(yàn)室和NCBI的solexa轉(zhuǎn)錄組數(shù)據(jù)對(duì)橡膠樹PEPRK基因家族成員的表達(dá)模式進(jìn)行分析[5]。首先,將NCBI的SRA數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/sra/)中橡膠樹相關(guān)的solexa轉(zhuǎn)錄組數(shù)據(jù)下載到本地服務(wù)器,去除低質(zhì)量序列,利用程序RSEM進(jìn)行表達(dá)分析[6]。
2 結(jié)果與分析
2.1 PEPRK基因的鑒定與序列分析
通過(guò)本地BLAST搜索各植物轉(zhuǎn)錄組和基因組數(shù)據(jù),從橡膠樹、木薯、蓖麻、擬南芥、楊樹和水稻6種植物中共鑒定得到25個(gè)PEPRK(表1),其中橡膠樹5個(gè),命名為HbPEPRK1-5。通過(guò)序列分析發(fā)現(xiàn),橡膠樹PEPRK蛋白為371~522個(gè)氨基酸,分子量為42~57 ku,等電點(diǎn)在5.0~8.8之間,內(nèi)含子數(shù)目為2~3個(gè)。氨基酸序列多序列比對(duì)發(fā)現(xiàn),橡膠樹PEPRK蛋白都含有蛋白激酶保守結(jié)構(gòu)域(圖1)。
2.2 基因結(jié)構(gòu)和進(jìn)化分析
基因外顯子/內(nèi)含子組織結(jié)構(gòu)和進(jìn)化分析發(fā)現(xiàn)(圖2),6種植物PPCK家族成員在進(jìn)化上分為2個(gè)較大的分支。在第一個(gè)分支,除了RcPEPRK1含有4個(gè)內(nèi)含子,OsPEPRK1、PtPEPRK2和PtPEPRK3含有2個(gè)內(nèi)含子,其他成員均只含有3個(gè)內(nèi)含子;第二個(gè)分支中,除了RcPEPRK3含有4個(gè)內(nèi)含子,其他成員均只含有2個(gè)內(nèi)含子,與第一個(gè)分支相比第二個(gè)分支各成員第一個(gè)外顯子要長(zhǎng),蛋白激酶結(jié)構(gòu)域的位置更居中一些。在進(jìn)化上,橡膠樹和木薯、蓖麻的PEPRK聚在一起,具有較近的親緣關(guān)系。另外,部分家族成員成對(duì)聚在一起,如HbPEPRK2和HbPEPRK3、PtPEPRK2和PtPEPRK3、PtPEPRK5和PtPEPRK6,說(shuō)明這些成員之間具有更高的同源性,但部分基因?qū)Φ谋磉_(dá)卻存在明顯差異,如HbPEPRK2和HbPEPRK3(圖3和圖4)。
2.3 橡膠樹PEPRK基因家族成員的表達(dá)分析
本實(shí)驗(yàn)室Solexa轉(zhuǎn)錄組數(shù)據(jù)的分析結(jié)果表明(圖3),HbPEPRK1主要在葉片和膠乳中表達(dá),并且在葉片發(fā)育過(guò)程中表達(dá)豐度明顯上升,穩(wěn)定期達(dá)到最高;HbPEPRK2主要在樹葉、樹皮和膠乳中均有表達(dá),在其他組織中的表達(dá)豐度偏低,乙烯利刺激后表達(dá)豐度明顯升高,24 h后達(dá)到最高;HbPEPRK5主要在葉片和膠乳中表達(dá),在樹皮和花中也有表達(dá),但表達(dá)豐度相對(duì)較低,乙烯利刺激后表達(dá)豐度明顯升高;另外HbPEPRK4主要在種子中表達(dá),在穩(wěn)定期葉片中也有表達(dá);HbPEPRK3在各組織中表達(dá)都較低或不表達(dá)。
本課題組還利用NCBI的SRA數(shù)據(jù)庫(kù)中的轉(zhuǎn)錄組數(shù)據(jù)對(duì)橡膠樹PEPRK的表達(dá)進(jìn)行了分析(圖4)。分析結(jié)果表明,HbPEPRK1主要在膠乳和葉片中表達(dá),干旱和乙烯利刺激都會(huì)不同程度的誘導(dǎo)HbPEPRK1表達(dá);HbPEPRK2主要在膠乳中表達(dá),C. cassiicola侵染會(huì)一定程度上誘導(dǎo)其表達(dá);HbPEPRK5主要在膠乳中表達(dá),C. cassiicola侵染和低溫處理會(huì)降低其表達(dá),而乙烯利刺激會(huì)誘導(dǎo)其表達(dá);另外HbPEPRK3在各組織中表達(dá)都比較低,低溫處理會(huì)降低其表達(dá);HbPEPRK4同樣在各組織中表達(dá)都較低,而低溫和乙烯利處理會(huì)誘導(dǎo)其表達(dá)。
從以上2部分實(shí)驗(yàn)數(shù)據(jù)的結(jié)果來(lái)看,部分家族成員的表達(dá)具有普遍性,如HbPEPRK2在各組織都表達(dá);有些成員在個(gè)各組織中表達(dá)都很低或不表達(dá),如HbPEPRK3;還有一些成員組織特異性表達(dá),如HbPEPRK4主要在種子中表達(dá),在其他組織的表達(dá)都很低。另外,通過(guò)2部分?jǐn)?shù)據(jù)的比較來(lái)看,大部分?jǐn)?shù)據(jù)結(jié)果是一致的,這說(shuō)明本實(shí)驗(yàn)結(jié)果的可靠性,也有些結(jié)果有些差異,如HbPEPRK1在樹葉和膠乳中的表達(dá),2部分?jǐn)?shù)據(jù)結(jié)果存在一定的差異,這可能和材料的種類或采集時(shí)間有一定的關(guān)系,需要后續(xù)實(shí)驗(yàn)進(jìn)一步驗(yàn)證。
3 討論
PEPRK是CDPK-SnRK超家族的一員,與CDPK有較高的同源性,但對(duì)其功能的研究相對(duì)CDPK來(lái)說(shuō)要少很多。已有研究表明,CDPK在植物生長(zhǎng)發(fā)育和逆境脅迫應(yīng)答等方面起著重要作用[7-10],PEPRK是否具有類似功能目前尚不清楚。在橡膠樹中,李超燕等[4]利用RACE克隆得到一個(gè)PEPRK基因,通過(guò)比對(duì)發(fā)現(xiàn)該基因和本研究的HbPEPRK5為同一基因。本研究利用高通量測(cè)序數(shù)據(jù)表達(dá)分析的結(jié)果和李超燕等[4]的結(jié)果基本一致,均為在膠乳中表達(dá)豐度較高,但乙烯利刺激的結(jié)果卻稍有不同,本研究中在0~24 h HbPEPRK5的表達(dá)有明顯的遞增趨勢(shì),而李超燕等[4]的結(jié)果是在3 h上升到最高然后下降。在本研究中,HbPEPRK1主要在穩(wěn)定期的葉片中表達(dá),HbPEPRK2和HbPEPRK5在樹葉、樹皮和膠乳中均有表達(dá),HbPEPRK4主要在種子中表達(dá);乙烯利刺激刺激后所有家族成員的表達(dá)都表現(xiàn)出一定的上升趨勢(shì),說(shuō)明橡膠樹PEPRK基因可能參與橡膠樹乙烯信號(hào)傳導(dǎo)相關(guān)反應(yīng)。另外,研究發(fā)現(xiàn)橡膠樹PEPRK還與葉片發(fā)育、真菌侵染和低溫脅迫具有一定的相關(guān)性。本實(shí)驗(yàn)室的高通量數(shù)據(jù)已成功應(yīng)用于橡膠樹基因組數(shù)據(jù)分析以及橡膠樹蔗糖合成酶基因家族相關(guān)分析,相關(guān)結(jié)果發(fā)表在Nature Plants[11]和Febs Journal[5],這進(jìn)一步證實(shí)了本文數(shù)據(jù)結(jié)果的可靠性。本研究首次從橡膠樹、木薯和蓖麻全基因組中鑒定出PEPRK所有基因家族成員,并利用相關(guān)軟件和數(shù)據(jù)庫(kù)對(duì)橡膠樹PEPRK各家族成員的基因結(jié)構(gòu)、進(jìn)化和表達(dá)模式進(jìn)行了全面系統(tǒng)的分析,研究結(jié)果將為進(jìn)一步研究PEPRK在橡膠樹生長(zhǎng)發(fā)育和逆境脅迫應(yīng)答等方面的功能打下基礎(chǔ)。
參考文獻(xiàn)
[1] Hrabak E M, Chan C W M, Michael G, et al. The Arabidopsis CDPK-SnRK superfamily of protein kinases[J]. Plant Physiology, 2003, 132(2): 666-680.
[2] Singh U M, Chandra M, Shankhdhar S C, et al. Transcriptome wide identification and validation of calcium sensor gene family in the developing spikes of finger millet genotypes for elucidating its role in grain calcium accumulation[J]. Plos One, 2014, 9(8): e103 963-103 963.
[3] Zuo R, Hu R B, Chai G H, et al. Genome-wide identification, classification, and expression analysis of CDPK and its closely related gene families in poplar(Populus trichocarpa)[J]. Molecular Biology Reports, 2012, 40(3): 2 645-2 662.
[4] 李超燕, 朱家紅, 徐 靖, 等. 巴西橡膠樹HbPEPRK1的克隆和表達(dá)分析[J]. 基因組學(xué)與應(yīng)用生物學(xué), 2015, 34(10): 2 181-2 186.
[5] Xiao X H, Tang C R, Fang Y J, et al. Structure and expression profile of the sucrose synthase gene family in the rubber tree: indicative of roles in stress response and sucrose utilization in the laticifers[J]. Febs Journal, 2014, 281(1): 291-305.
[6] Li B, Dewey C N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome[J]. BMC Bioinformatics, 2011, 12(1): 93-99.
[7] Kong X P, Lv W, Jiang S S, et al. Genome-wide identification and expression analysis of calcium-dependent protein kinase in maize[J]. Bmc Genomics, 2013, 14(1): 447-450.
[8] Ray S, Agarwal P, Arora R, et al. Expression analysis of calcium-dependent protein kinase gene family during reproductive development and abiotic stress conditions in rice (Oryza sativa L. ssp. indica)[J]. Molecular Genetics & Genomics, 2007, 278(5): 493-505.
[9] Zhang H F, Liu W Z, Zhang Y P, et al. Identification, expression and interaction analyses of calcium-dependent protein kinase (CPK)genes in canola(Brassica napus L.)[J]. Bmc Genomics, 2014, 15(1): 211.
[10] Zuo R, Hu R B, Chai G H, et al. Genome-wide identification, classification, and expression analysis of CDPK and its closely related gene families in poplar(Populus trichocarpa)[J]. Molecular Biology Reports, 2012, 40(3): 2 645-2 662.
[11] Tang C R, Meng Y, Fang Y J, et al. The rubber tree genome reveals new insights into rubber production and species adaptation[J]. Nature Plants, 2016, 2(6): 16 073.