陳 恒,劉迎春,劉育秀,田仁美,周新穎,于利偉,謝彥周,高 欣
(西北農(nóng)林科技大學(xué)農(nóng)學(xué)院,陜西楊凌 712100)
在植物體內(nèi),羥基化氨基酸可用來(lái)治療抑郁癥、糖尿病、癌癥等疾病[1-5]。目前主要有三種途徑獲?。簭暮辛u基化氨基酸的物種中提取、化學(xué)合成和生物催化法。其中,提取和化學(xué)合成過(guò)程繁瑣、效率低下[6]。與之相比,生物催化法不僅高效快速,而且具有高對(duì)映選擇性,因此,發(fā)掘和利用高效穩(wěn)定的羥基化酶尤為重要[4]。
Clavaminate Synthase-Like(CSL)家族是一類非血紅素鐵和α-酮戊二酸依賴的氧化還原酶家族,可催化氨基酸羥基化[7]。該家族的VioC、MppO和AsoN酶在抗生素紫霉素、甘露霉素、達(dá)托霉素的合成中,可催化L-精氨酸、L-天冬酰胺的羥基化[8-10]。CSL家族酶類在輔因子Fe2+、α-酮戊二酸和O2的共同作用下,經(jīng)過(guò)復(fù)雜的特異位點(diǎn)配位鍵結(jié)合、代換和釋放過(guò)程,可將氨基酸底物羥基化并釋放出CO2和琥鉑酸[7]。Bastard等[7]研究發(fā)現(xiàn),CSL酶具有高度的區(qū)域和立體結(jié)構(gòu)選擇性,以及嚴(yán)格的底物特異性。
CSL家族相關(guān)基因的研究大多局限于微生物中,在模式植物擬南芥中也僅有初步研究。Bitto等[11]通過(guò)研究擬南芥At3g21360基因編碼蛋白的晶體結(jié)構(gòu),證實(shí)該蛋白屬于CSL家族,這是植物中首個(gè)被研究報(bào)道的CSL基因。異源六倍體小麥由于基因組龐大、基因拷貝數(shù)多等問(wèn)題,基因克隆和功能解析研究工作在很長(zhǎng)一段時(shí)間內(nèi)受到制約[12-13]。近幾年來(lái),基因組測(cè)序技術(shù)的快速發(fā)展、小麥全基因組參考序列的發(fā)布以及基因組重測(cè)序項(xiàng)目的推進(jìn),促進(jìn)了小麥重要功能基因的克隆和重要性狀的分子機(jī)制研究等工作[14]。羥基化氨基酸早已被人們認(rèn)識(shí)和使用,但是小麥CSL基因的發(fā)掘以及該基因表達(dá)特性和生物學(xué)功能的研究還未見報(bào)道。因此,本研究以中國(guó)春為材料,以擬南芥基因At3g21360(GenBank Accession:NC_003074.8)序列為探針,比對(duì)小麥全基因組數(shù)據(jù)庫(kù),對(duì)TaCSL1基因進(jìn)行同源克隆,利用生物信息學(xué)分析該基因及其編碼蛋白序列,采用實(shí)時(shí)定量PCR技術(shù)分析該基因的時(shí)空表達(dá)模式,以期明確該基因的基本結(jié)構(gòu)和表達(dá)特征,為進(jìn)一步研究其生物學(xué)功能提供科學(xué)依據(jù)。
本研究所用小麥材料為中國(guó)春,于2018-2019年種植于西北農(nóng)林科技大學(xué)農(nóng)學(xué)院作物標(biāo)本區(qū)試驗(yàn)地(108°4′E,34°16′N),株距5 cm,行距25 cm,行長(zhǎng)1 m,正常肥水管理。在小麥幼苗期取葉片,用于提取DNA。在小麥苗期、拔節(jié)期、孕穗期、抽穗期以及開花后9 d和25 d,分別取小麥根、葉片、節(jié)間、旗葉鞘、穗下莖、幼穗、穎殼、雌蕊、雄蕊、籽粒等組織樣品,液氮速凍后,保存于 -80 ℃冰箱,用于提取RNA。
采用CTAB法[15]提取小麥葉片全基因組DNA,并用核酸蛋白分析儀(Nano Drop 2000)檢測(cè)DNA濃度,根據(jù)所測(cè)濃度稀釋至100 ng·μL-1作為工作液,-20 ℃保存。使用RNA提取試劑盒Tissue RNA Isolation Kit(諾唯贊,南京)提取小麥不同生長(zhǎng)發(fā)育階段和不同組織部位的總RNA,-80 ℃保存。使用反轉(zhuǎn)錄酶試劑盒Hiscrip@Q Select RT SuperMix for qPCR(+gDNA wiper)(諾唯贊,南京)合成cDNA第一鏈,-20 ℃保存。
以擬南芥At3g21360基因的cDNA序列為探針?biāo)阉鱁nsembl Plants小麥基因組數(shù)據(jù)庫(kù)(http://plants.ensembl.org/Triticum_aestivum/Tools/Blast?db=core),得到位于小麥A、B、D三個(gè)亞基因組上的三個(gè)部分同源基因:TraesCS3A02G108700、TraesCS3B02G127700和TraesCS3D02G110500。這三個(gè)基因長(zhǎng)度分別為2 310、2 437和2 472 bp,均包含一個(gè)長(zhǎng)度為 1 005 bp的編碼區(qū)。比對(duì)這三個(gè)同源基因的序列,使用Primer Premier 5在這三條序列的兩端差異部分分別設(shè)計(jì)用于克隆基因全長(zhǎng)和基因編碼區(qū)的引物(表1)。引物由生工生物工程(上海)股份有限公司合成。
使用La Taq DNA聚合酶試劑盒(TaKaRa,日本)擴(kuò)增基因全長(zhǎng)和和基因編碼區(qū)。PCR擴(kuò)增體系為50 μL,包含100 ng·μL-1的模板1 μL(擴(kuò)增基因全長(zhǎng)模板為全基因組DNA,擴(kuò)增基因編碼區(qū)模板為cDNA),10×Buffer 5 μL,200 μmol·L-1的dNTPs 8 μL,5 U·μL-1的La Taq DNA聚合酶1 μL,10 μmol·L-1的上、下游引物各1 μL,ddH2O補(bǔ)齊至50 μL。PCR擴(kuò)增程序:94 ℃預(yù)變性5 min;94 ℃變性30 s,58 ℃退火30 s,擴(kuò)增基因全長(zhǎng)72 ℃延伸3 min、擴(kuò)增基因編碼區(qū)72 ℃延伸1 min,共35個(gè)循環(huán);72 ℃再延伸5 min。
使用1%瓊脂糖凝膠電泳分離PCR擴(kuò)增產(chǎn)物,使用DNA凝膠回收試劑盒(TaKaRa,日本)純化目的基因。將目的基因連接到pMD18-T載體(TaKaRa,日本)上,然后轉(zhuǎn)化大腸桿菌DH5α感受態(tài)細(xì)胞(諾唯贊,南京)。過(guò)夜培養(yǎng)后挑取單菌落,使用2×Taq Master Mix DNA聚合酶(諾唯贊,南京)對(duì)陽(yáng)性單克隆進(jìn)行PCR鑒定,由生工生物工程(上海)股份有限公司進(jìn)行測(cè)序,每個(gè)基因測(cè)序三個(gè)陽(yáng)性單克隆。使用DNAstar Megalign 5.01進(jìn)行基因編碼區(qū)序列比對(duì)。
以TaCSL1-3A蛋白序列為探針,在NCBI(https://www.ncbi.nlm.nih.gov/)搜索不同物種的同源蛋白,使用DNAstar Megalign 5.01進(jìn)行TaCSL1-3A、TaCSL1-3B、TaCSL1-3D和擬南芥At3g21360(XP_002883301.1)蛋白序列的多重比對(duì)。使用MEGA 7.0構(gòu)建基于neighbor-joining的系統(tǒng)發(fā)育樹。運(yùn)用在線工具ExPASy-ProtParam(https://web.expasy.org/protparam/)和InterPro Scan(http://www.ebi.ac.uk/interpro/search/sequence/)分別預(yù)測(cè)TaCSL1基因編碼蛋白的理化性質(zhì)和保守結(jié)構(gòu)域。
使用Primer Premier 5在TaCSL1-3A、TaCSL1-3B和TaCSL1-3D基因編碼區(qū)內(nèi)設(shè)計(jì)特異性引物(表1)。引物由生工生物工程(上海)股份有限公司合成。使用2×RealStar Green Power Mixture試劑盒(GenStar BioSolution,北京)和StepOnePlus實(shí)時(shí)熒光定量PCR系統(tǒng)(ABI,美國(guó))進(jìn)行三個(gè)部分同源基因的表達(dá)量分析。qRT-PCR擴(kuò)增體系為20 μL,包含20 ng·μL-1的cDNA模板1 μL,10 μmol·L-1的上、下游引物各0.5 μL,2×RealStar Green Power Mixture 10 μL,ROX Reference Dye 0.4 μL,ddH2O補(bǔ)齊至20 μL。PCR反應(yīng)程序:95 ℃預(yù)變性10 min; 95 ℃變性15 s,60 ℃退火/延伸1 min,共40個(gè)循環(huán)。每個(gè)樣品設(shè)置3個(gè)生物學(xué)重復(fù)。目的基因相對(duì)表達(dá)量的計(jì)算采用2-△△Ct法[16],用Excel 2010分析數(shù)據(jù)并作圖。
表1 本研究所用的引物
以中國(guó)春全基因組DNA為模板,用三對(duì)引物TaCSL1-3A-gF/R、TaCSL1-3B-gF/R和TaCSL1-3D-gF/R分別進(jìn)行PCR擴(kuò)增,得到全基因組目的產(chǎn)物(圖1A);以中國(guó)春總cDNA第一鏈為模板,用三對(duì)引物TaCSL1-3A-cF/R、TaCSL1-3B-cF/R和TaCSL1-3D-cF/R分別進(jìn)行PCR擴(kuò)增,得到編碼區(qū)單一產(chǎn)物(圖1B)。命名該基因?yàn)門aCSL1,來(lái)自A、B、D三個(gè)亞基因組的部分同源基因分別命名為TaCSL1-3A、TaCSL1-3B和TaCSL1-3D。經(jīng)測(cè)序與序列比對(duì),發(fā)現(xiàn)TaCSL1-3A、TaCSL1-3B、TaCSL1-3D與TraesCS3A02G108700、TraesCS3B02G127700、TraesCS3D02G110500的編碼區(qū)序列一致。三個(gè)部分同源基因均包含3個(gè)外顯子和2個(gè)內(nèi)含子,3個(gè)外顯子長(zhǎng)度分別為392 bp、250 bp和363 bp,但內(nèi)含子長(zhǎng)度不同。TaCSL1-3A基因的2個(gè)內(nèi)含子長(zhǎng)度分別為338 bp和683 bp;TaCSL1-3B基因的2個(gè)內(nèi)含子長(zhǎng)度分別為252 bp和788 bp;TaCSL1-3D基因的2個(gè)內(nèi)含子長(zhǎng)度分別為314 bp和812 bp。編碼區(qū)序列比對(duì)結(jié)果表明,三個(gè)部分同源基因之間存在43個(gè)單核苷酸突變位點(diǎn),其中有義突變11個(gè),沉默突變32個(gè)(圖2)。TaCSL1-3A和TaCSL1-3B基因的核酸序列相似性為95.7%,TaCSL1-3A和TaCSL1-3D基因的核酸序列相似性為96.3%,TaCSL1-3B和TaCSL1-3D基因的核酸序列相似性為96.4%。TaCSL1-3A和TaCSL1-3B蛋白序列相似性為97.3%,TaCSL1-3A和TaCSL1-3D蛋白序列相似性為97.6%,TaCSL1-3B和TaCSL1-3D蛋白序列相似性為97.9%,說(shuō)明該基因在小麥進(jìn)化過(guò)程中十分保守。
A:基因全長(zhǎng)電泳圖;B:基因編碼區(qū)電泳圖;M1:Maker DL5000;M2:Maker DL2000。箭頭所指為目的條帶。
黃色陰影表示三個(gè)部分同源基因 TaCSL1-3A(GenBank Accession: MW725303)、 TaCSL1-3B(GenBank Accession: MW755354)和 TaCSL1-3D(GenBank Accession: MW755355)之間存在的序列多態(tài)性。
對(duì)TaCSL1基因編碼蛋白的理化性質(zhì)進(jìn)行分析,結(jié)果表明,TaCSL1-3A、TaCSL1-3B和TaCSL1-3D蛋白氨基酸長(zhǎng)度均為334 aa,分子量為36 695.88~36 780.99,理論等電點(diǎn)為 5.48~ 5.59,說(shuō)明該蛋白屬于中性蛋白;帶負(fù)電荷的氨基酸殘基數(shù)均為46,帶正電荷的氨基酸殘基數(shù)為 39~40,總平均親水性為-0.237~-0.217,表明該蛋白為親水蛋白;穩(wěn)定性系數(shù)為48.33~50.17,表明該蛋白不穩(wěn)定。因其序列差異很小, 三個(gè)部分同源基因所編碼的蛋白理化性質(zhì)差異也很小。利用在線工具InterProScan預(yù)測(cè)TaCSL1-3A蛋白的保守結(jié)構(gòu)域,結(jié)果(圖3)表明,該蛋白第10~331位氨基酸為典型的CSL家族保守結(jié)構(gòu)域,與該家族的其他蛋白具有相似的結(jié)構(gòu)特征。
圖3 TaCSL1-3A蛋白的保守結(jié)構(gòu)域分析
TaCSL1蛋白與擬南芥CSL蛋白的氨基酸序列比對(duì)結(jié)果表明,TaCSL1-3A、TaCSL1-3B和TaCSL1-3D蛋白與擬南芥CSL蛋白的相似性分別為69.6%、69.6%和69.0%,蛋白序列C端較N端相對(duì)更保守(圖4)。小麥與其他物種CSL蛋白的進(jìn)化分析結(jié)果表明,CSL蛋白被分為兩大類,即單子葉類和雙子葉類。TaCSL1-3D蛋白與粗山羊草CSL蛋白進(jìn)化關(guān)系最近,TaCSL1-3A、TaCSL1-3B與TaCSL1-3D蛋白進(jìn)化關(guān)系也較近,三個(gè)蛋白在進(jìn)化樹上處于同一大分支上(圖5)。
XP_002883301.1為擬南芥CLS蛋白的GenBank登錄號(hào)。黃色陰影表示TaCSL1蛋白與擬南芥CSL同源蛋白的序列多態(tài)性。
圖5 小麥TaCSL1蛋白與其他物種CSL蛋白的進(jìn)化分析
在小麥的籽粒、穎殼、雌蕊、雄蕊、穗下莖、旗葉、倒二葉、旗葉鞘、節(jié)間、根等組織中均檢測(cè)到TaCSL1-3A、TaCSL1-3B、TaCSL1-3D基因的表達(dá),除開花后第9 d的旗葉鞘中TaCSL1-B的表達(dá)量較高外,三個(gè)基因在各個(gè)時(shí)期葉中的相對(duì)表達(dá)量均高于其他組織。比較不同生長(zhǎng)發(fā)育時(shí)期的葉/旗葉組織可知,該基因在幼苗期至孕穗期,相對(duì)表達(dá)量總體提高,抽穗期明顯降低,開花后再次提高,生育末期降低(表2)。
三個(gè)部分同源基因的相對(duì)表達(dá)量在部分組織中存在顯著差異??偟膩?lái)說(shuō),TaCSL1-3A相對(duì)表達(dá)量一直處于較低狀態(tài),TaCSL1-3D的相對(duì)表達(dá)量在孕穗期之前較高,TaCSL1-3B的相對(duì)表達(dá)量在孕穗期之后較高(表2)。
表2 小麥 TaCSL1在不同發(fā)育時(shí)期的組織器官中的相對(duì)表達(dá)量
本研究根據(jù)擬南芥CSL基因At3g21360序列,利用同源克隆的方法,首次在小麥中克隆了TaCSL1基因,并獲得了三個(gè)部分同源基因TaCSL1-3A、TaCSL1-3B、TaCSL1-3D的全長(zhǎng)序列和編碼區(qū)序列。與參考序列比對(duì),TaCSL1-3A、TaCSL1-3B和TaCSL1-3D序列與參考序列一致。編碼區(qū)序列比對(duì)結(jié)果表明,三個(gè)部分同源基因之間存在43個(gè)單核苷酸突變位點(diǎn),其中有義突變11個(gè),沉默突變32個(gè)。說(shuō)明該基因在小麥進(jìn)化過(guò)程中十分保守。通過(guò)與擬南芥的同源基因進(jìn)行序列比對(duì),發(fā)現(xiàn)TaCSL1-3A蛋白序列與擬南芥At3g21360蛋白序列相似度為69.6%,說(shuō)明該蛋白序列在植物中相對(duì)保守[18]。根據(jù)進(jìn)化樹分析可知,小麥TaCSL1基因編碼的蛋白與其祖先粗山羊草進(jìn)化關(guān)系較近,其次是其他單子葉草本植物,而與雙子葉植物進(jìn)化關(guān)系較遠(yuǎn)。這說(shuō)明該基因可能在單、雙子葉分化之前就已經(jīng)產(chǎn)生[19]。TaCSL1蛋白理化性質(zhì)分析表明,該蛋白屬于中性、親水、不穩(wěn)定蛋白,說(shuō)明該蛋白作為一種酶,參與酶促反應(yīng)之后容易分解[20]。
實(shí)時(shí)熒光定量PCR分析表明,TaCSL1-3A、TaCSL1-3B、TaCSL1-3D在小麥各個(gè)生長(zhǎng)發(fā)育時(shí)期和組織部位都有表達(dá),說(shuō)明三個(gè)基因在小麥生長(zhǎng)過(guò)程中都發(fā)揮作用,三者的功能也可能存在冗余[21]。TaCSL1基因在小麥葉片組織中相對(duì)表達(dá)水平較高,表明該基因主要在小麥葉片中發(fā)揮功能。開花后第9 d旗葉鞘中TaCSL1-3B的表達(dá)量相對(duì)較高,原因可能是異常環(huán)境誘導(dǎo)的結(jié)果。TaCSL1-3D在小麥孕穗期之前相對(duì)表達(dá)量較高,而TaCSL1-3B在小麥孕穗期之后相對(duì)表達(dá)量較高,表明三者的功能存在分化。
Bastard等[7]研究表明,CSL家族酶類具有嚴(yán)格的底物特異性,而江 倩[22]研究表明,一種CSL酶可以催化氧化多種底物,并且除了催化產(chǎn)生羥基化產(chǎn)物外,還能產(chǎn)生?;a(chǎn)物。實(shí)時(shí)熒光定量PCR分析結(jié)果表明,TaCSL1基因在小麥全生育期和所有檢測(cè)組織部位中均有表達(dá),說(shuō)明該基因是一個(gè)組成型表達(dá)基因[21],可預(yù)測(cè)該基因參與植物體內(nèi)重要的生化過(guò)程。富含羥脯氨酸糖蛋白是細(xì)胞壁的構(gòu)成部分,脯氨酸羥基化酶基因是一種組成型表達(dá)基因[23],TaCSL1基因是否是脯氨酸羥基化酶基因還有待進(jìn)一步考證。
植物保衛(wèi)素是植物受到生物或非生物因子侵襲時(shí)在體內(nèi)合成并積累的低分子量抗菌性物質(zhì),其種類繁多、結(jié)構(gòu)各異、代謝途徑復(fù)雜[23]。(S)-4-羥基苯甘氨酸、(2S,3R)-3-羥基-亮氨酸和(2S,3R)-3-羥基-苯丙氨酸是植物保衛(wèi)素的構(gòu)成部分[24-25],因而,推測(cè)羥基化氨基酸可能是未被分離出來(lái)的植保素或其構(gòu)成部分。后期可將該基因在小麥體內(nèi)進(jìn)行過(guò)表達(dá)或沉默,通過(guò)人工接種病菌,進(jìn)一步研究該基因是否與植物抗病過(guò)程相關(guān)。