陳 瑩,李 騰,高 宇,劉寶玲,薛金愛,李潤(rùn)植
(山西農(nóng)業(yè)大學(xué)分子農(nóng)業(yè)與生物能源研究所,山西太谷030801)
煙草是我國(guó)乃至世界的主要經(jīng)濟(jì)作物之一,綜合利用潛力極大。淀粉是煙葉中重要的碳水化合物,也是煙葉干物質(zhì)的主要成分,其組成和性質(zhì)直接影響著煙葉的經(jīng)濟(jì)價(jià)值[1]。研究煙草淀粉合成機(jī)制可為煙草定向改良和優(yōu)良品種選育提供一定的科學(xué)基礎(chǔ)。
已有研究顯示,在植物體內(nèi),淀粉的生物合成過程主要受ADP- 葡萄糖焦磷酸化酶(ADP-glucose pyrophosphorylase,AGPase)、淀粉合成酶(Starch synthase,SS)、淀粉分支酶(Starch branching enzyme,SBE)和淀粉去分支酶(Starch debranching enzyme,SDBE)的調(diào)控[2]。其中,AGPase 催化葡萄糖 -1- 磷酸(Glu-1-P)與三磷酸腺苷(ATP)作用生成ADPG 和焦磷酸(PPi),是淀粉合成過程中的關(guān)鍵性限速酶[3]。
在細(xì)菌內(nèi),AGPase 是由glgC 基因編碼的同源四聚體,由同一種亞基構(gòu)成;在高等植物中,AGPase是一個(gè)異源四聚體,由2 個(gè)大亞基和2 個(gè)小亞基組成[4-5],其中,小亞基行使催化功能,大亞基調(diào)控小亞基的活性[6]。不同作物AGPase 大小亞基的分子質(zhì)量不同,大亞基分子質(zhì)量多為55~60 ku,小亞基的分子質(zhì)量則是50~55 ku[6]。根據(jù)在植物細(xì)胞內(nèi)的分布位置,AGPase 可分為質(zhì)體型和胞質(zhì)型[7],大多數(shù)植物的AGPase 屬于質(zhì)體型,催化反應(yīng)主要在質(zhì)體中進(jìn)行;然而,在部分禾木科植物中,AGPase 屬于胞質(zhì)型,例如小麥、玉米等[8-9]。此外,不同植物體內(nèi)AGPase大小亞基基因數(shù)目也有差異。例如,在擬南芥中,AGPase 由 4 個(gè)大亞基(ApL1~ApL4)和 2 個(gè)小亞基(ApS1 和 ApS2)基因組成[10]。馬鈴薯 StAGPase 基因含有3 個(gè)大亞基和1 個(gè)小亞基基因[11]。木薯中共鑒定出9 個(gè)AGPase 基因家族成員,包含6 個(gè)大亞基(LS)和 3 個(gè)小亞基(SS)基因[12]。
為了深入研究煙葉碳水化合物生物合成及調(diào)控機(jī)制,本研究以AGPase 為靶標(biāo),從全基因組水平鑒定煙草NtAGPase 基因家族成員,利用生物信息學(xué)工具分析各成員的基因結(jié)構(gòu)、系統(tǒng)進(jìn)化、基因順式調(diào)控元件,以及編碼酶蛋白的理化特性、高級(jí)結(jié)構(gòu)、亞細(xì)胞定位和功能活性域等,研究結(jié)果將為利用基因工程進(jìn)行煙草遺傳改良提供理論依據(jù)和分子修飾靶標(biāo)。
從擬南芥數(shù)據(jù)庫 Tair(https://www.arabidopsis.org/)獲得AtAGPase 蛋白序列(包括4 條大亞基序列和2 條小亞基序列)。以AtAGPase 大小亞基氨基酸序列為索引序列,在煙草數(shù)據(jù)庫(https://solgenomics.net/)進(jìn)行Blast P 分析,對(duì)獲得的多條NtAGPase大小亞基氨基酸序列進(jìn)行甄別,去除冗余序列;然后,用 CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 和 SMART(http://smart.embl-heidelberg.de/)在線軟件對(duì)候選NtAGPase 序列進(jìn)行蛋白結(jié)構(gòu)域分析,篩選鑒定出煙草NtAGPase 家族成員。
利用ProtParam(http://web.expasy.org/protparam/)分析NtAGPase 編碼蛋白的氨基酸組成、蛋白質(zhì)分子質(zhì)量、理論等電點(diǎn)、不穩(wěn)定指數(shù)、疏水指數(shù)等理化性質(zhì);通過 DTU(https://services.healthtech.dtu.dk/)中的在線工具 TMHMM、NetPhos、SignalP 分別預(yù)測(cè)NtAGPase 的跨膜結(jié)構(gòu)域、磷酸化位點(diǎn)、信號(hào)肽位點(diǎn);利用 Plant-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)預(yù)測(cè)其亞細(xì)胞定位;利用Expasy中 ProtScale 工 具(https://web.expasy.org/protscale/)分析其疏水區(qū)域。
利用 SOPMA(http://metadatabase.org/wiki/SOPMA)預(yù)測(cè)NtAGPase 蛋白的二級(jí)結(jié)構(gòu);通過Phyer2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page)對(duì) NtAGPase 酶蛋白的三級(jí)結(jié)構(gòu)進(jìn)行同源建模。
利用在線軟件 GSDS 2.0(http://gsds.cbi.pku.edu.cn/)分析NtAGPase 基因序列內(nèi)含子、外顯子數(shù)量,并繪制基因結(jié)構(gòu)圖;利用MEME(http://meme-suite.org/tools/meme)分析NtAGPase 基因保守元件,設(shè)置最大元件數(shù)量為13 個(gè),元件的最佳寬度為6~50。
在煙草數(shù)據(jù)庫中獲得煙草NtAGPase 家族成員的啟動(dòng)子序列(轉(zhuǎn)錄起始位點(diǎn)上游1.5 kb),通過PlantCARE(http://bioinformatics.psb.ugent.be/webtool s/plantcare/html/)預(yù)測(cè)它們的啟動(dòng)子區(qū)域順式作用元件,并通過GSDS 2.0 在線軟件進(jìn)行作圖。
表1 煙草、擬南芥和馬鈴薯AGPase 家族成員信息
利用Clustal W 軟件對(duì)擬南芥和煙草AGPase蛋白序列進(jìn)行多序列比對(duì),參數(shù)選為默認(rèn)值;利用MEGA 6.0 軟件,采用鄰接法(Neighbor-Joining,N-J)對(duì)煙草NtAGPase 和其他已知物種的AGPase構(gòu)建系統(tǒng)發(fā)育樹(表1),其中,校驗(yàn)參數(shù)BootStrap設(shè)為1 000 次,其他參數(shù)均為默認(rèn)值。
以AtAGPase 大小亞基蛋白序列為探針,通過在煙草數(shù)據(jù)庫中進(jìn)行Blast P 分析,得到多條煙草NtAGPase 大小亞基蛋白序列;通過CDD 和SMART分析,將同時(shí)含有NTP-transferase 和PbH1 結(jié)構(gòu)域的氨基酸序列篩選出來,去除冗余后,共獲得3 條NtAGPase 大亞基蛋白序列和1 條NtAGPase 小亞基蛋白序列,分別命名為NtLSU1(XP_016509038.1)、NtLSU2(XP_016491048.1)、NtLSU3(XP_016497751.1)和 NtSSU(NP_001312588.1)。
ProtParam 分析結(jié)果顯示(表 2),NtLSUs 編碼蛋白的長(zhǎng)度范圍在519(NtLSU3)~529 個(gè)氨基酸(NtLSU2),分子質(zhì)量介于 57.03(NtLSU3)~58.43 ku(NtLSU2)。SSU 編碼蛋白的長(zhǎng)度為520 個(gè)氨基酸,分子質(zhì)量為57.38 ku。NtLSUs 的等電點(diǎn)均大于7,呈弱堿性;而NtSSU 等電點(diǎn)略小于7,呈弱酸性。NtLSUs 蛋白的不穩(wěn)定性指數(shù)均小于40,屬于穩(wěn)定蛋白;而NtSSU 蛋白的不穩(wěn)定指數(shù)為43.67(大于40),屬于不穩(wěn)定蛋白。NtLSUs 和 NtSSU 的平均親水值介于 -0.246(NtLSU1)~-0.122(NtLSU3),均屬于親水性蛋白。
分別利用 Plant-mPLoc、ProtScale、DTU 在線軟件對(duì)NtAGPase 大小亞基蛋白進(jìn)行亞細(xì)胞定位、疏水區(qū)域、跨膜結(jié)構(gòu)、磷酸化位點(diǎn)及信號(hào)肽的預(yù)測(cè),結(jié)果表明,NtLSUs 和NtSSU 蛋白均定位于葉綠體上,說明NtLSUs 和NtSSU 分別屬于質(zhì)體型大亞基和質(zhì)體型小亞基。NtLSUs 和NtSSU 蛋白均無跨膜區(qū),屬于親水性蛋白,這與Protparam 軟件預(yù)測(cè)結(jié)果一致。3 個(gè)NtLSUs 之間的理化性質(zhì)基本一致,但是與NtSSU 理化性質(zhì)不同。
表2 煙草NtAGPase 家族成員蛋白理化特性
SOPMA 軟件預(yù)測(cè)結(jié)果顯示,NtLSUs 和NtSSU蛋白的二級(jí)結(jié)構(gòu)都只含有3 種結(jié)構(gòu),分別是α- 螺旋、延伸鏈和無規(guī)則卷曲,不包括β- 轉(zhuǎn)角;其中,無規(guī)則卷曲的比例最高,范圍在46.24%(NtLSU3)~54.25%(NtLSU2);其次是α- 螺旋,比例范圍在25.15%(NtLSU2)~33.33%(NtLSU3);延伸鏈占比最少,比例在 17.31%(NtSSU)~21.97%(NtLSU1)(圖 1)。
利用Phyer2 在線工具對(duì)煙草NtAGPase 酶蛋白進(jìn)行了三級(jí)結(jié)構(gòu)預(yù)測(cè),結(jié)果以c1yp3C 膜結(jié)構(gòu)蛋白為模板建模(圖2)。
從圖2 可以看出,煙草NtAGPase 酶蛋白是一個(gè)由不同亞基組成的異源四聚體,其與模板的相似性為84%,而擬南芥AtAGPase 酶蛋白與模板的相似性為82%。也就是說,NtAGPase 酶蛋白結(jié)構(gòu)與AtAGPase 酶蛋白結(jié)構(gòu)極為相似,推測(cè)它們?cè)谥参矬w內(nèi)發(fā)揮著類似功能。
從NtLSUs 和NtSSU 的基因結(jié)構(gòu)來看(圖3),NtAGPase 大小亞基均由外顯子、內(nèi)含子和UTR 組成。NtLSU1 和 NtLSU2 均含有 14 個(gè)外顯子和 13 個(gè)內(nèi)含子;NtLSU3 含有15 個(gè)外顯子和14 個(gè)內(nèi)含子。然而,NtSSU 僅含有9 個(gè)外顯子和8 個(gè)內(nèi)含子,明顯少于NtLSUs。
通過MEME 軟件預(yù)測(cè)出煙草NtAGPase 蛋白含有13 個(gè)蛋白保守元件(圖4)。
表3 煙草NtAGPase 基因啟動(dòng)子順式作用元件
NtLSUs 和NtSSU 啟動(dòng)子中均富含TATA-box、CAAT-box和多種光響應(yīng)元件。其中,NtLSU1 中特有干旱脅迫響應(yīng)元件(MBS),其在干旱條件下可能發(fā)揮一定的作用;NtLSU2 和NtLSU3 中均含有脫落酸響應(yīng)元件(ABRE)和抗氧化響應(yīng)元件(ARE)。NtSSU中含有較多與激素相關(guān)的反應(yīng)元件,如乙烯響應(yīng)元件(ERE)和茉莉酸響應(yīng)元件(CGTCA-motif)。除NtLSU3 外,其他亞基基因都含有低溫脅迫響應(yīng)元件(LTR),推測(cè)煙草NtAGPase 基因在響應(yīng)低溫脅迫過程中行使功能。此外,NtLSUs 和NtSSU 啟動(dòng)子中還含有多種與激素反應(yīng)相關(guān)、逆境反應(yīng)相關(guān)的響應(yīng)元件,如生長(zhǎng)素響應(yīng)元件(TGA)、赤霉素響應(yīng)元件(GARE-motif)、水楊酸響應(yīng)元件(TCA)以及機(jī)械表示傷害響應(yīng)元件(WUN-motif)、脅迫防御響應(yīng)元件(TC-rich repeats)(表 3)。說明 NtAGPase 催化的酶反應(yīng)可能參與煙草多種生理活動(dòng)以及對(duì)環(huán)境的響應(yīng)等。
利用 Clustal W 軟件對(duì) NtLSUs 和 NtSSU 分別進(jìn)行多序列比對(duì)分析。選取擬南芥AtAPL 蛋白作為對(duì)照,在煙草NtLSUs 蛋白中發(fā)現(xiàn)4 個(gè)功能結(jié)構(gòu)域(圖 5),分別是 AGPase signature 1、AGPase signature 2、AGPase signature 3 和葡萄糖腺苷轉(zhuǎn)移酶功能區(qū)(Glucose-1-phosphate adenylytransferase region)。煙草NtSSU 蛋白也按照同樣的方法進(jìn)行分析,結(jié)果顯示,煙草NtSSU 蛋白序列與擬南芥AtAPS1 蛋白序列同源性高達(dá)87.50%,并且煙草NtSSU 蛋白保守結(jié)構(gòu)域與擬南芥AtAPS1 類似,均包括5 個(gè)功能結(jié)構(gòu)域,分別是AGPase signature 1、AGPase signature 2、AGPase signature 3、Glyco-tranf-GTA-type 超家族區(qū)域和葡萄糖腺苷轉(zhuǎn)移酶功能區(qū)(Glucose-1-phosphate adenylytransferase region)(圖 6)。
為了研究AGPase 蛋白家族之間的進(jìn)化關(guān)系,本研究使用MEGA 6.0 軟件對(duì)來自擬南芥、煙草、馬鈴薯AGPase 蛋白進(jìn)行了進(jìn)化分析,生成了一個(gè)鄰聯(lián)進(jìn)化樹如圖7 所示,根據(jù)不同亞基類型,NtAGPase酶蛋白家族明顯被分為2 組(大亞基組和小亞基組),其中,NtLSUs(NtLSU1、NtLSU2 和 NtLSU3)、AtAPLs(AtAPL1、AtAPL2、AtAPL3 和 AtAPL4) 和 StLSUs(StLSU1、StLSU2 和StLSU3)被歸為大亞基組;NtSSU、AtAPSs(AtAPS1、AtAPS2)和 StSSUs(StSSU1、StSSU2)一起歸為小亞基組。
有研究發(fā)現(xiàn),淀粉是煙草中主要的碳水化合物,在成熟的煙葉中淀粉含量高達(dá)40%[14],但過多的淀粉會(huì)嚴(yán)重影響煙葉的外觀和煙草制成品的品質(zhì)[1]。已有大量研究表明,AGPase 活性大小決定著淀粉的合成速率及合成量。例如,在木薯(Manihot esculenta Crantz)中異位表達(dá)大腸桿菌glgC 基因,可使木薯塊莖中淀粉含量明顯增加[15]。而在馬鈴薯(Solanum tuberosum)中反義表達(dá)StAGPase 會(huì)導(dǎo)致馬鈴薯塊莖中淀粉水平顯著降低,同時(shí)降低直鏈淀粉與支鏈淀粉的比率[16]。因此,深入探究煙草NtAGPase基因的調(diào)控機(jī)制,并通過基因工程手段調(diào)節(jié)煙葉淀粉含量,對(duì)提高煙葉品質(zhì)具有重要意義。
在高等植物中,AGPase 是一個(gè)由大亞基和小亞基構(gòu)成的異源四聚體,并且在不同的植物中編碼AGPase 大小亞基的基因數(shù)目不同[10-13]。本研究以擬南芥AtAGPase 蛋白為探針,通過Blast P 和SMART分析得到了編碼煙草NtAGPase 酶蛋白的基因序列;通過功能結(jié)構(gòu)域分析,篩選出含有NTP-transferase 和PbH1 結(jié)構(gòu)域的3 個(gè)大亞基的編碼基因(NtLSU1、NtLSU2、NtLSU3)和 1 個(gè)小亞基的編碼基因(NtSSU)。
NtAGPase 大小亞基編碼蛋白長(zhǎng)度和分子質(zhì)量相近,但在部分理化性質(zhì)上有所差異。NtLSUs 的理論等電點(diǎn)值均大于7,偏堿性,其不穩(wěn)定系數(shù)均小于40,屬于穩(wěn)定蛋白;而NtSSU 的理論等電點(diǎn)值小于7,偏酸性,其不穩(wěn)定系數(shù)大于40,屬于不穩(wěn)定蛋白。其中,NtAGPase 大小亞基基因的外顯子數(shù)目差異較大,其中,NtLSUs 含有 14~15 個(gè)外顯子,NtSSU僅含有9 個(gè)外顯子,明顯少于NtLSUs。這與已有研究結(jié)果一致[17]。
本研究對(duì)煙草NtAGPase 基因啟動(dòng)子順式作用元件分析發(fā)現(xiàn),NtAGPase 基因中含有大量的光響應(yīng) 元 件 , 如 G-Box、AE-Box、GT1-motif、GA-motif等,推測(cè)其在光合作用中發(fā)揮作用或者受到光信號(hào)因子的調(diào)控。此外,NtAGPase 基因還含有多種與激素反應(yīng)、逆境反應(yīng)相關(guān)的響應(yīng)元件,推測(cè)該基因不僅參與植物的生長(zhǎng)發(fā)育過程,還在多種逆境反應(yīng)中發(fā)揮作用,例如低溫脅迫、干旱脅迫等。
本研究對(duì)煙草和擬南芥AGPase 大小亞基分別進(jìn)行多序列比對(duì),結(jié)果表明,煙草NtAGPase 家族成員之間同源性為69.48%;而煙草NtLSUs 和NtSSU序列與擬南芥AtAPLs 和AtAPSs 蛋白序列同源性分別為75.54%和87.50%。說明同一物種大小亞基的同源性低于不同物種同一亞基之間的同源性;不同物種同一亞基之間小亞基更加保守,大亞基趨于歧化[18]。此外,本研究還發(fā)現(xiàn),NtAGPase 和AtAGPase大小亞基蛋白序列的差異性主要表現(xiàn)在N 端,推測(cè)N 端序列很可能影響著NtAGPase 酶蛋白的功能。系統(tǒng)進(jìn)化分析結(jié)果顯示,NtLSUs 和NtSSU 蛋白分別歸為大亞基組和小亞基組,這與其他高等植物中AGPase 的分類一致[19-20]。有研究推測(cè),植物體內(nèi)AGPase 大小亞基基因來源于同一基因,但該基因在進(jìn)化過程中,由于選擇壓力或最適活性需求不同而出現(xiàn)分離,從而產(chǎn)生了2 種不同的亞基[13]。此外,煙草NtAGPase 與馬鈴薯StAGPase 的親緣關(guān)系明顯高于其與擬南芥AtAGPase 的親緣關(guān)系,這是因?yàn)闊煵菖c馬鈴薯同屬于茄科植物,進(jìn)化上比較一致。
本研究鑒定獲得了4 個(gè)煙草NtAGPase 家族成員,包括3 個(gè)大亞基和1 個(gè)小亞基基因;通過生物信息學(xué)技術(shù)對(duì)其基因結(jié)構(gòu)和編碼蛋白結(jié)構(gòu)及理化特性等進(jìn)行了詳細(xì)分析,為后續(xù)探索煙草NtAGPase 基因功能及煙草淀粉生物合成調(diào)控機(jī)制等提供了相應(yīng)的理論基礎(chǔ)。