武雄雄,楊成蘭,祁存英,熊輝巖,段瑞君
(1.青海大學(xué)生態(tài)環(huán)境工程學(xué)院,青海西寧 810016;2.青海大學(xué)農(nóng)牧學(xué)院,青海西寧 810016)
在高等植物中,長(zhǎng)鏈脂酰輔酶A合成酶(LACS)是酰基激活酶(acyl-activating enzyme,AAE)超家族的成員,具有AMP-結(jié)合結(jié)構(gòu)域。LACS可活化游離脂肪酸,維持細(xì)胞內(nèi)?;o酶A的含量,是植物生長(zhǎng)發(fā)育必不可少的一類酶[1]。
目前,已經(jīng)從多種高等植物中分離到LACS基因,其中,擬南芥LACS基因家族有9個(gè)基因成員,并且大部分LACS基因在花以及萌發(fā)的種子中大量表達(dá),表明這些基因不僅參與花組織的油脂代謝,而且在種子甘油酯的合成中起關(guān)鍵作用[2]。近年來(lái),研究者在棉花[3]、蓖麻[4]、山羊草[5]、水稻[6]、向日葵[7]、牡丹[8]、蘋(píng)果[9]、甘藍(lán)型油菜[10]等植物中也相繼分離到LACS基因家族成員,并對(duì)其進(jìn)行了初步研究。
小麥(TriticumaestivumL.)是一種在全世界廣泛種植的農(nóng)作物之一,我國(guó)是小麥主產(chǎn)區(qū)之一,隨人口的不斷擴(kuò)大,對(duì)小麥的需求量也不斷增加[11]。研究發(fā)現(xiàn),LACS基因家族在脂質(zhì)的合成代謝和分解代謝中有著不可代替的作用,對(duì)提高植物中脂質(zhì)產(chǎn)量具有重要意義[12]。但迄今為止,小麥LACS基因家族成員尚未被鑒定。因此,本研究基于小麥全基因組測(cè)序數(shù)據(jù),利用生物信息學(xué)方法對(duì)LACS基因家族進(jìn)行了全基因組鑒定,并進(jìn)一步對(duì)其理化性質(zhì)、染色體定位、基因結(jié)構(gòu)、保守基序分布、系統(tǒng)進(jìn)化以及組織和脅迫表達(dá)圖譜進(jìn)行分析,以期為后續(xù)小麥LACS基因的功能研究提供參考。
用EMBL-Pfam數(shù)據(jù)庫(kù)(http://pfam.xfam.org/)下載AMP結(jié)構(gòu)域的隱馬爾可夫模型(HMM)文件(AMP-結(jié)合結(jié)構(gòu)域:PF00501)[13];用HMMER 3.1軟件搜索EnsemblPlants數(shù)據(jù)庫(kù)(http://plants.ensembl.org/index.html)下載的小麥基因組文件[14];從擬南芥信息資源(TAIR,http://www.Arabidopsis.org/index.jsp)下載9個(gè)擬南芥LACS蛋白[15],從The Rice Annotation Project(RAP,https://rapdb.dna.affrc.go.jp/)下載4個(gè)水稻LACS蛋白[16]作為種子序列;用BLASTP搜索小麥LACS蛋白。使用EMBL-Pfam、SMART(http://smart.embl-heidelberg.de/)和 CD Search(Conserved Domain Search Service,https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)來(lái)驗(yàn)證AMP結(jié)合結(jié)構(gòu)域,以確定小麥LACS基因家族成員,命名為T(mén)aLACS;用ExPASy數(shù)據(jù)庫(kù)(https://www.expasy.org/)中對(duì)小麥所有LACS蛋白的氨基酸長(zhǎng)度、分子量、等電點(diǎn)、不穩(wěn)定指數(shù)進(jìn)行預(yù)測(cè)分析。
從Ensembl Plants數(shù)據(jù)庫(kù)下載小麥的染色體定位數(shù)據(jù),用MapChart 2.32軟件分析TaLACS基因在染色體上的定位。
利用MEME Version 5.1.1(http://meme-suite.org/tools/meme)進(jìn)行蛋白質(zhì)保守基序的鑒定。重復(fù)次數(shù)的為任意次數(shù),最大基序數(shù)量為20,以及最佳基序?qū)挾认拗圃?~200殘基之間。使用TBtools軟件[17]進(jìn)行可視化。從Ensembl Plants數(shù)據(jù)庫(kù)下載小麥的蛋白和基因結(jié)構(gòu)信息,利用基因結(jié)構(gòu)顯示服務(wù)器GSDS 2.0(http://gsds.cbi.pku.edu.cn)繪制TaLACS基因結(jié)構(gòu)。
用小麥、擬南芥和水稻LACS基因家族蛋白序列構(gòu)建進(jìn)化樹(shù)。用Clustal W進(jìn)行多序列比對(duì),用MEGAX軟件構(gòu)建系統(tǒng)發(fā)育樹(shù),進(jìn)化樹(shù)算法為最大似然法(ML)法,校檢參數(shù):重復(fù)1 000次。生成的圖形使用Evolview v3[18](https://www.evolgenius.info/evolview/#login)進(jìn)行美化。
從Wheat Exp數(shù)據(jù)庫(kù)(http://www.wheat-expression.com/)檢索小麥RNA-Seq數(shù)據(jù),用Tpm(transcripts per million reads)值評(píng)估小麥LACS基因的轉(zhuǎn)錄本豐度值。用HEML軟件繪制小麥LACS基因表達(dá)熱圖。
從Ensembl Plants數(shù)據(jù)庫(kù)下載小麥基因組序列數(shù)據(jù),并截取小麥條TaLACS基因起始密碼子上游1.5 kb的DNA序列。用Plant CARE軟件[19](http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析與脅迫響應(yīng)和植物激素有關(guān)的順式作用元件。
根據(jù)擬南芥9個(gè)LACS基因和水稻4個(gè)LACS基因的蛋白序列,利用HMM和BLASP搜索小麥LACS蛋白序列,之后進(jìn)行比對(duì),去除冗余序列后合并,利用Pfam和SMART結(jié)構(gòu)域搜索檢驗(yàn)LACS候選基因是否含有AMP-bing結(jié)構(gòu)域,最終在小麥基因組中共鑒定出148個(gè)LACS候選基因,根據(jù)結(jié)構(gòu)域信息以及在基因組的位置,將其命名為T(mén)aLACS1~TaLACS148。在ExPASy數(shù)據(jù)庫(kù)中對(duì)小麥所有LACS蛋白序列進(jìn)行理化性質(zhì)預(yù)測(cè)分析,結(jié)果表明,小麥LACS基因家族蛋白氨基酸長(zhǎng)度為134~1 593 aa,分子量為 3 654.70~264 379.85 Da,蛋白質(zhì)等電點(diǎn)為5.23~10.06,均值為7.23,推測(cè)大部分蛋白為中性蛋白;不穩(wěn)定指數(shù)中,有48個(gè)蛋白的數(shù)值大于40,為不穩(wěn)定蛋白,其余均小于40,為穩(wěn)定蛋白;總平均疏水指數(shù)中,正值的疏水性蛋白和負(fù)值的親水性蛋白各有57和91個(gè);脂溶系數(shù)為 78.19~104.94,說(shuō)明大部分TaLACS蛋白質(zhì)性質(zhì)穩(wěn)定,為親水脂溶性蛋白。
染色體物理定位結(jié)果(圖1)顯示,除TaLACS147和TaLACS148兩個(gè)基因未獲得位置信息外,其余146個(gè)TaLACS基因不均勻分布在21條染色體上,其中,在5號(hào)染色體組上分布最多(36個(gè)),1號(hào)染色體組上分布最少(9個(gè))。在2D、4A、4B、5A、5B、5D染色體上基因分布比較集中,且有成簇分布現(xiàn)象。
圖1 小麥LACS基因在染色體上的定位
進(jìn)化樹(shù)分析結(jié)果(圖2a)顯示,TaLACS蛋白家族分為6個(gè)亞家族,且每個(gè)亞家族的保守基序個(gè)數(shù)與類別基本一致。保守基序分布結(jié)果(圖2b)顯示,TaLACS蛋白保守性較高,共包含5個(gè)保守元件,motif1和motif7構(gòu)成了AMP保守結(jié)構(gòu)域??偟膩?lái)說(shuō),每個(gè)TaLACS蛋白的motif為2~15個(gè)。TaLACS13、TaLACS20和TaLACS27比較特異,motif長(zhǎng)且分散。同時(shí)還發(fā)現(xiàn)motif1和motif5、motif1和motif16、motif8和motif10經(jīng)常會(huì)一起出現(xiàn)。在基因結(jié)構(gòu)中,大部分小麥TaLACS基因的基因結(jié)構(gòu)基本相似,由編碼區(qū)和非編碼區(qū)組成。其外顯子子數(shù)目為1~23個(gè),內(nèi)含子數(shù)目為0~23個(gè),存在內(nèi)含子缺失現(xiàn)象。其中,TaLACS3和TaLACS114基因不含內(nèi)含子。個(gè)別TaLACS基因結(jié)構(gòu)只有編碼區(qū),無(wú)非編區(qū),如TaLACS3、TaLACS19、TaLACS20等25個(gè)基因無(wú)非編碼區(qū),占總基因的16.8%。
a:小麥LACS蛋白的進(jìn)化樹(shù)分析;b:小麥LACS蛋白的保守基序分布。
同時(shí),在148個(gè)編碼小麥蛋白的TaLACS基因之中檢測(cè)到55個(gè)旁系同源基因?qū)?,如TaLACS129的同源基因?yàn)門(mén)aLACS122,TaLACS79的同源基因?yàn)門(mén)aLACS5,這些同源基因在TaLACS基因中占到74.3%。為了進(jìn)一步探究TaLACS基因家族系統(tǒng)發(fā)育關(guān)系以及該基因家族的進(jìn)化過(guò)程,結(jié)合9個(gè)擬南芥和4個(gè)水稻LACS蛋白序列,利用MEGAX對(duì)161個(gè)LACS蛋白序列進(jìn)行系統(tǒng)發(fā)育分析。聚類分析結(jié)果(圖3)表明,148個(gè)TaLACS基因家族成員編碼的蛋白可分為三大組,分別為GroupI、GroupII和GroupIII。其中,GroupI中有73個(gè)成員,GroupII有38個(gè)成員,GroupIII有37個(gè)成員,GroupIII成員又被細(xì)分為GroupIIIa、GroupIIIb、GroupIIIc和GroupIIId 4個(gè)亞組,成員數(shù)量分別為9、6、6和16。
圖3 小麥、擬南芥和水稻LACS蛋白的系統(tǒng)發(fā)育樹(shù)
利用Wheat Exp數(shù)據(jù)庫(kù)中TaLACS基因在種子、葉、根和穗的RNA-Seq數(shù)據(jù)進(jìn)行分析,結(jié)果(圖4a)發(fā)現(xiàn),TaLACS基因的表達(dá)模式在不同組織或發(fā)育階段差異明顯,總體來(lái)說(shuō),在營(yíng)養(yǎng)生長(zhǎng)階段的表達(dá)量低于生殖生長(zhǎng)階段。其中,有10個(gè)TaLACS基因在種子中表達(dá)量較高,有15個(gè)TaLACS基因在根中表達(dá)量較高,有12個(gè)TaLACS基因在葉中表達(dá)量較高,有18個(gè)TaLACS基因在穗中表達(dá)量較高。表明TaLACS基因家族中,在穗和根中高表達(dá)的TaLACS基因數(shù)目多于在種子和葉中的表達(dá)數(shù)目。進(jìn)一步研究發(fā)現(xiàn),TaLACS122和TaLACS129在各個(gè)時(shí)期和組織中表達(dá)量均較高,表明這些基因可能參與調(diào)控小麥種子、根、葉和穗的生長(zhǎng)發(fā)育過(guò)程;部分基因在某一組織中表達(dá)量較高,而在其他組織中不表達(dá)或低表達(dá),如TaLACS1、TaLACS18、TaLACS25等,說(shuō)明這些基因具有組織特異性表達(dá)特點(diǎn),可能在植物形態(tài)建成中起著重要作用。
a:TaLACS基因在不同組織中的表達(dá)熱圖;b:TaLACS基因在低溫、干旱和赤霉病脅迫下的表達(dá)熱圖。
用Wheat Exp庫(kù)中TaLACS基因在低溫、干旱脅迫和赤霉病誘導(dǎo)的RNA-Seq數(shù)據(jù)進(jìn)行分析。結(jié)果(圖4b)顯示,不同脅迫處理后部分TaLACS基因上調(diào)表達(dá),響應(yīng)赤霉病脅迫后TaLACS基因的表達(dá)量高于低溫和干旱脅迫。其中,TaLACS16、TaLACS23、TaLACS26、TaLACS33、TaLACS39、TaLACS45、TaLACS85、TaLACS88等49個(gè)基因在幼苗冷脅迫處理兩周后,表達(dá)量均明顯上升,表明這些基因可能在響應(yīng)低溫脅迫過(guò)程中發(fā)揮重要作用;在對(duì)幼苗進(jìn)行干旱脅迫后,TaLACS8、TaLACS16、TaLACS51、TaLACS82、TaLACS123、TaLACS139等34個(gè)基因上調(diào)表達(dá),說(shuō)明這些基因可能在干旱脅迫響應(yīng)過(guò)程中起關(guān)鍵作用;此外,TaLACS10、TaLACS16、TaLACS24、TaLACS33、TaLACS83、TaLACS139等37個(gè)基因在感染赤霉病后上調(diào)表達(dá),推測(cè)這些基因可能在抗赤霉病感染中起一定作用。
利用Plant CARE軟件分析小麥TaLACS基因啟動(dòng)子序列的順式作用元件,共鑒定到15種與脅迫響應(yīng)和植物激素有關(guān)的順式作用元件。其中,與脅迫響應(yīng)相關(guān)的元件有5種,分別為厭氧誘導(dǎo)元件(ARE)、真菌引誘應(yīng)答元件(BOX-W1)、參與防御和應(yīng)激反應(yīng)的順式作用元件(TC-rich repeat)、低溫誘導(dǎo)元件(LTR)和干旱誘導(dǎo)響應(yīng)元件(MBS),其中,含有低溫誘導(dǎo)元件和干旱誘導(dǎo)響應(yīng)元件的TaLACS基因分別占34.9%和 46.0%;與植物激素相關(guān)的元件有10種,分別為脫落酸反應(yīng)元件(ABRE)、生長(zhǎng)素響應(yīng)元件(TGA-element、AuxRR-core)、茉莉酸甲酯響應(yīng)元件(TGACG-motif、CGTCA-motif)、乙烯應(yīng)答元件(ERE)、赤霉素響應(yīng)元件(TATC-box、P-box、GARE-motif)和水楊酸應(yīng)答元件(TCA-element),其中,含有脫落酸反應(yīng)元件的TaLACS基因占85.8%。
近年來(lái),從擬南芥、水稻、蘋(píng)果、甘藍(lán)型油菜等植物中獲得LACS基因[20],并且對(duì)其結(jié)構(gòu)和功能作用進(jìn)行了初步研究,雖然LACS基因在植物蠟質(zhì)合成和抗脅迫性中發(fā)揮著重要作用,但迄今為止,在小麥中還沒(méi)有對(duì)該家族基因進(jìn)行詳細(xì)鑒定和功能研究的報(bào)道。本研究首次對(duì)小麥LACS基因家族進(jìn)行鑒定分析,依據(jù)基因組的注釋信息,共獲得148個(gè)小麥LACS基因,遠(yuǎn)遠(yuǎn)多于擬南芥(9個(gè))和蘋(píng)果(11個(gè))LACS基因家族的成員數(shù)目。原因可能是小麥?zhǔn)翘厥獾牧扼w結(jié)構(gòu),在染色體組A、B、D上存在同源基因[21-22]。Zhang等[9]研究發(fā)現(xiàn),蘋(píng)果的LACS蛋白長(zhǎng)度為596~730 aa,分子量為64.96~79.44 Da,理論等電點(diǎn)為5.56~8.12。Xiao等[10]研究發(fā)現(xiàn),甘藍(lán)型油菜中LACS蛋白長(zhǎng)度為129~960 aa,理論等電點(diǎn)為5.11~9.51。本研究發(fā)現(xiàn),TaLACS蛋白長(zhǎng)度為134~1 593 aa,分子量為3 654.70~ 264 379.85 Da,理論等電點(diǎn)為5.23~10.06。與蘋(píng)果和甘藍(lán)型油菜LACS相比,TaLACS蛋白長(zhǎng)度較長(zhǎng),分子量較大,且呈中性。蛋白長(zhǎng)度和分子量存在差異,推測(cè)原因可能是對(duì)蘋(píng)果中LACS蛋白鑒定時(shí)只取長(zhǎng)度為300~ 1 000 aa的氨基酸序列,而小麥和甘藍(lán)型油菜未作處理;另外小麥較復(fù)雜的基因組也可能是原因之一。
將小麥LACS蛋白與擬南芥、水稻LACS蛋白進(jìn)行系統(tǒng)進(jìn)化分析,從聚類結(jié)果發(fā)現(xiàn),LACS蛋白可分為GroupI、GroupII和GroupIII三大組,其中,GroupIII包含擬南芥和水稻的LACS蛋白,GroupI和GroupII均只有小麥LACS蛋白。GroupIII中TaLACS蛋白有37個(gè),占全部蛋白的四分之一,與AtLACS1和AtLACS2聚在GroupIIIa亞組,與AtLACS3、AtLACS4和AtLACS5聚在GroupIIIb亞組,與AtLACS6和AtLACS7聚在GroupIIIc亞組,與AtLACS8和AtLACS9聚在GroupIIId亞組,這與擬南芥9個(gè)LACS蛋白的聚類一致[1];在不同物種中,LACS的分類存在差異。LACS是?;罨?AAE)家族中的成員,根據(jù)其聚類結(jié)果發(fā)現(xiàn),LACS基因與AAE基因相似性高[23],所以GroupI和GroupII的TaLACS蛋白可能與AAE家族有一定的聯(lián)系,LACS的進(jìn)化關(guān)系還需要進(jìn)一步細(xì)分。Xu等[24]研究也發(fā)現(xiàn),擬南芥、水稻和小麥LACS基因同時(shí)聚類在一個(gè)小支上[24],因此,推測(cè)TaLACS可能與其他物種LACS基因有相似的功能。Pulsifer等[25]研究發(fā)現(xiàn),AtLACS2和TaLACS115相似性高,AtLACS2可提高脂肪酸含量,推測(cè)TaLACS115在小麥中也有類似的功能;Jessen等[26]發(fā)現(xiàn),AtLACS4有形成脂質(zhì)花粉外壁的功能,與其相似度高的TaLACS100和TaLACS87可能也有類似功能;Fulda等[27]發(fā)現(xiàn),AtLACS6在脂肪酸β-氧化起作用,在種子及幼苗的生長(zhǎng)發(fā)育階段中上調(diào)表達(dá),推測(cè)TaLACS110在小麥種子的萌發(fā)過(guò)程中也發(fā)揮作用。
Fan等[28]研究表明,LACS蛋白可激活長(zhǎng)鏈脂肪酸,然后通過(guò)β-氧化作用進(jìn)行降解、合成細(xì)胞脂質(zhì),在植物生長(zhǎng)發(fā)育過(guò)程中發(fā)揮重要作用。前人研究發(fā)現(xiàn),擬南芥中AtLACS1、AtLACS2和AtLACS4參與蠟的生物合成[29-31],蠟的積累有助于增強(qiáng)植物對(duì)ABA和干旱脅迫的耐受性[31-33]。Wang等[34]研究發(fā)現(xiàn),蠟主要在小麥葉片和穗部組織中合成。本研究結(jié)果發(fā)現(xiàn),大部分TaLACS基因家族成員在穗和根中上調(diào)表達(dá),在葉片和種子中也有上調(diào)表達(dá)的TaLACS基因,說(shuō)明大部分TaLACS基因家族成員與蠟合成有關(guān);本研究還發(fā)現(xiàn),TaLACS16、TaLACS39等基因在兩種或以上不同脅迫單獨(dú)處理下均上調(diào)表達(dá),其中,TaLACS16在受到冷脅迫、干旱脅迫和赤霉病誘導(dǎo)時(shí)均上調(diào)表達(dá),響應(yīng)較為明顯。表明小麥TaLACS基因在響應(yīng)生物脅迫或非生物脅迫中發(fā)揮了關(guān)鍵作用,這為L(zhǎng)ACS基因的功能解析奠定了基礎(chǔ),為進(jìn)一步研究TaLACS基因在抗生物脅迫和非生物脅迫功能和品種選育提供一定理論指導(dǎo)和實(shí)踐意義。