李敬蕊,解紫薇,盧 銀,李 娜,劉紫俊,趙建軍
(河北農(nóng)業(yè)大學 園藝學院/省部共建華北作物改良與調控國家重點實驗室/河北省蔬菜種質創(chuàng)新與利用重點實驗室/河北省蔬菜產(chǎn)業(yè)協(xié)同創(chuàng)新中心,河北 保定 071000)
GH3(GRETCHEN HAGEN 3)基因為植物中廣泛存在的生長素(IAA)酰胺合成酶基因,該基因與AUX/IAA(auxin/indole-3-acetic acids)、SAUR(small auxin up regulated RNAs)均受生長素快速誘導,且該過程中不需新的蛋白質合成,因此將這3 類基因稱為生長素早期響應基因[1]。生長素是1 種最基本的植物激素,作用于植物從胚胎發(fā)育到器官衰老的各個階段,既可以直接影響植物細胞反應,也可以間接調控基因表達,進而影響植物生長發(fā)育[2]。植物對生長素的響應非常復雜,在識別生長素信號、啟動下游相關基因表達,最終調控植物生長或產(chǎn)生生理生化反應的過程中,生長素早期響應基因具有重要作用。生長素在植物體內以自由態(tài)和束縛態(tài)2種形式存在,自由態(tài)具有活性,束縛態(tài)無活性,兩者可在一定條件下相互轉化。當植物體具有較高濃度的自由態(tài)IAA 時,GH3 催化自由態(tài)IAA 與氨基酸形成氨基軛合物IAA-amino,使IAA 形成束縛態(tài);當植物需要IAA 時,IAA 酰胺水解酶水解IAAamino 釋放出IAA,進而調節(jié)植株細胞內IAA 動態(tài)平衡,調控其生長發(fā)育[3]。 因此,GH3 可通過調節(jié)植物體內IAA 自由態(tài)和束縛態(tài)的比例,進而調控植物生長發(fā)育。
Hagen 和Guilfoyle,從大豆中克隆了第1 個GH3基因[4]。近年來,隨著基因組測序以及生物技術的發(fā)展,越來越多不同植物特異的GH3基因被鑒定出來。在模式植物擬南芥中鑒定出20 個GH3基因[5],水稻中鑒定出13 個[6],番茄中17 個[7]。隨著功能基因組學研究的深入,不同植物中GH3家族成員的具體功能被逐漸解析出來。如過量表達擬南芥GH3.15基因,擬南芥根長和側根數(shù)增加[8];在柑橘中過表達GH3.1和GH3.1L基因,植株分枝增加,葉片變小、變薄且向上卷曲[9];與野生型相比,棉花GH3.5基因沉默植株對干旱和鹽脅迫耐受能力顯著降低[10]。多項研究均證實,GH3基因在調控植株生長發(fā)育、響應脅迫等方面具有重要作用。
目前,大白菜(Brassica rapaL. ssp.pekinensis)中的GH3家族成員基本信息尚不完善,不同文獻中大白菜GH3家族成員命名不一致[11-12]。2011 年白菜基因組測序完成[13],為在全基因組水平上對白菜GH3基因家族進行挖掘和功能研究提供了可能。為充分挖掘大白菜GH3基因,研究GH3基因家族成員在大白菜葉球發(fā)育中的作用,本研究在大白菜全基因組水平對GH3基因家族成員進行鑒定,系統(tǒng)分析其基本特征、系統(tǒng)進化、基因結構、保守基序組成、染色體分布、共線性和啟動子順式作用元件,同時結合以實驗室創(chuàng)制的大白菜不結球平塌突變體(fg-1)和其結球親本(WT)結球前期球葉不同部位轉錄組數(shù)據(jù),明確BrGH3基因家族成員在大白菜球葉不同部位的表達差異,為進一步研究該基因家族在大白菜葉球發(fā)育中的功能奠定基礎。
從Pfam 數(shù)據(jù)庫(http://pfam.xfam.org/)下載結構域文件Pfam-A.hmm,采用TBtools 軟件中的Simple HMM Search 功能,導入大白菜全部蛋白序列(http://brassicadb.org/brad/index.php) 和GH3家族結構域登錄號(PF03321,Auxin-responsive promoter),E-value 設置為le-10, 鑒定大白菜GH3家族。為進一步驗證大白菜GH3家族鑒定的準確性,從擬南芥數(shù)據(jù)庫(http://www.arabidopsis.org/)下載GH3 蛋白家族序列,以擬南芥的GH3 蛋白序列作為查詢序列,在初步篩選的BrGH3序列進行Blast 搜索,尋找最佳匹配序列,鑒定的GH3家族序列用于下一步分析。
在大白菜數(shù)據(jù)庫(http://brassicadb.cn/)中查詢GH3家族成員的染色體位置信息。利用在線網(wǎng)站ExPASY(http://www.expasy.org/tools)中的ProtParam(http://web.expasy.org/protparam/) 分 析GH3 家族成員的氨基酸個數(shù)、分子量、理論等電點、不穩(wěn)定系數(shù)等理化信息。利用在線工具PSORT(http://www.psort.org/)預測大白菜GH3家族成員的亞細胞定位。
利用軟件MEGA(http://www.megasoftware.net),采用鄰接法(neighbor-joining,NJ)構建擬南芥GH3家族和大白菜GH3家族的系統(tǒng)進化樹,Bootstrap重復設置為1 000,其它參數(shù)為系統(tǒng)默認值。使用iTOL(https://itol.embl.de/)工具對進化樹進行美化。以擬南芥GH3 家族成員分組為依據(jù),對大白菜GH3家族成員進行進化樹分組。
在白菜數(shù)據(jù)庫下載GH3家族成員CDS 序列及Genomic 序列,通過TBtools 軟件對大白菜GH3成員的基因結構進行分析,并進行可視化繪圖。
利用TBtools 中的Simple MEME Wrapper 功能分析大白菜GH3基因家族成員的蛋白保守基序(Motif),將Motif 個數(shù)最大值設為10,任意重復次數(shù)。利用TBtools 軟件進行可視化作圖。
利用從大白菜數(shù)據(jù)庫下載的基因組注釋文件(gff 1.5)和GH3家族成員的ID,在TBtools 的Gene Location Visualize from GTF/GFF 功能下繪制染色體位置示意圖。
從大白菜數(shù)據(jù)庫下載GH3家族成員的全基因組注釋文件(gff 1.5)和基因組序列文件,提取大白菜染色體位置信息以及大白菜GH3家族基因在染色體上的位置信息,在PlantDGD 網(wǎng)站(http://pdgd.njau.edu.cn:8080/)下載大白菜GH3家族基因間的共線性關系,得到共線性分析結果文件。利用上面3 個文件在TBtools 進行大白菜內共線圈圖繪制。
利用Tbtools 軟件在大白菜全基因組數(shù)據(jù)庫中提取BrGH3家族成員起始密碼子ATG 上游的2 000 bp 序列,通過在線網(wǎng)站PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測大白菜BrGH3成員啟動子的順式作用元件,并進行統(tǒng)計。
為了研究BrGH3基因家族成員在不同結球大白菜葉片不同部位的表達模式,利用課題組野生型(WT)結球大白菜和不結球平塌型突變體(fg-1)在結球初期的葉片不同部位(a、b、c、d)轉錄組數(shù)據(jù),分析BrGH3基因家族成員表達模式。將BrGH3基因家族成員的FPKM 值進行均一化處理,利用Tbtools 軟件繪制BrGH3基因家族表達量熱圖。
圖1 大白菜野生型(A)、平塌突變體(B)和葉片不同部位示意圖(C)Fig.1 Wild type (A), flat-growth mutant (B) and different parts (C) of Chinese cabbage leaves
在全基因組水平上對BrGH3家族成員進行鑒定,共獲得45 個基因,根據(jù)在染色體上的位置,將其編號為BrGH3.1-BrGH3.45(表1)。GH3基因家族成員編碼氨基酸數(shù)在286~826 之間,相對分子量在32.06~90.77 KD 之間,等電點在4.85~7.81 之間,其中BrGH3.2 和BrGH3.20 等電點大于7,偏堿性,其他BrGH3 蛋白均小于7,偏酸性;BrGH3 的不穩(wěn)定系數(shù)范圍為31.27~53.20,不穩(wěn)定系數(shù)小于40 的穩(wěn)定蛋白有17 個,大于40 的不穩(wěn)定蛋白有28 個;亞細胞定位預測表明,21 個BrGH3 成員定位于細胞核;12 個位于細胞質;9 個定位于葉綠體;1 個定位于液泡膜,1 個定位于過氧化物酶體,1 個定位于細胞核或細胞質(表1)。
表 1 大白菜GH3 家族成員基本信息Table 1 Basic information of Chinese cabbage GH3 family members
從phytozome 數(shù)據(jù)庫下載擬南芥(Arabidopsis thalian)的GH3 蛋白序列。利用在線MEGA 軟件構建擬南芥19 個AtGH3 和大白菜45 個BrGH3蛋白的進化樹,利用在線軟件Evolview 進行進化樹美化(圖2)。根據(jù)進化關系,45 個GH3 成員可分為4 類(Group Ⅰ、Group Ⅱ、Group Ⅲ和Group Ⅳ),Group Ⅰ中包含5 個BrGH3,2 個AtGH3;Group Ⅱ有10 個BrGH3,8 個AtGH3;Group Ⅲ中GH3 成員數(shù)最多,有29 個BrGH3,9個AtGH3;Group Ⅳ中只有1 個BrGH3(BrGH3.2)。
圖 2 大白菜和擬南芥GH3 家族成員系統(tǒng)發(fā)育樹Fig.2 Phylogenetic tree of Arabidopsis and Chinese cabbage GH3 family members
對BrGH3 家族成員的基因結構進行分析,并進行可視化作圖(圖3A)。BrGH3 家族成員由2~10個外顯子組成,其中含有4 個外顯子的成員最多為25 個,其次含有3 個外顯子的基因為12 個,含有5個外顯子的基因有4 個,含有2 個外顯子的基因有2 個,含有6 個外顯子和10 個外顯子的基因各1 個。
為探究BrGH3 家族成員的蛋白保守Motif,利用在線軟件MEME 預測了大白菜BrGH3 家族成員的保守Motif,設定最多檢測10 個Motif(圖3 B)。結果顯示,43 個BrGH3 均含有10個保守Motif,且在N 端均為Motif 8,在C 端為Motif 4。BrGH3.18 只含有3 個Motif,分別為Motif 3、Motif 7 和Motif 4;BrGH3.2 只含有Motif 3和Motif 7。
圖3 BrGH3 家族成員基因結構(A)和保守基序分析(B)Fig.3 Gene structure (A) and conserve motif (B) analysis of BrGH3 family members
從圖4 中可以看出,41 個BrGH3基因分布在大白菜10 條染色體上,有4 個基因未定位到染色體上。3 號染色體上分布有11 個基因,數(shù)量最多,9 號染色體上有7 個基因,2 號和6 號染色體上各有5 個基因,10 號染色體上有3 個基因,4 號、5 號、7 號染色體上有2 個基因,1 號、8 號染色體上有1 個基因,數(shù)量最少。而BrGH3.42、BrGH3.43、BrGH3.44和BrGH3.45沒有定位到染色體。41 個BrGH3基因中,17 個屬于大白菜LF亞基因組,12 個屬于MF1亞基因組,13 個屬于MF2亞基因組。
圖4 BrGH3 家族成員染色體定位Fig.4 Localization of BrGH3 family members on chromosome
由圖5 可以看出,BrGH3家族成員存在片段重復和串聯(lián)重復。共鑒定出29 個基因參與22 個片段性復制事件。6 號染色體片段性復制事件最多有9段,1 號染色體上的基因與其它基因不存在共線性。在45 個BrGH3家族成員中,BrGH3.31基因中存在的片段復制事件最多,為5 個片段存在復制事件,分別與3 號染色體上的BrGH3.8,6 號染色體上的BrGH3.23,BrGH3.24,BrGH3.25,10 號染色體BrGH3.41具有片段重復。進一步分析發(fā)現(xiàn),BrGH3片段復制事件主要發(fā)生在組內,不存在組間復制事件。Group Ⅰ中3 個基因參與2 個片段復制事件,Group Ⅱ中2 個基因參與1 個片段復制事件,其它片段復制事件均發(fā)生在Group Ⅲ中。在2 號染色體上BrGH3.3,BrGH3.4和BrGH3.5為串聯(lián)重復;在3 號染色體上BrGH3.16,BrGH3.17和BrGH3.18為串聯(lián)重復;在6 號染色體上BrGH3.16,BrGH3.17和BrGH3.18為串聯(lián)重復,BrGH3.23,BrGH3.24和BrGH3.25為串聯(lián)重復,BrGH3.26,BrGH3.27和BrGH3.28為串聯(lián)重復; 在9號染色體上,BrGH3.36,BrGH3.37和BrGH3.38為串聯(lián)重復。
圖 5 BrGH3 家族成員共線性分析Fig.5 Synteny analysis of the BrGH3 family members
提取BrGH3基因上游2 000 bp 的基因組序列為假定啟動子序列進行順式作用元件分析,結果表明45 個成員中含有4 類順式作用元件,分別為光、植物生長發(fā)育、激素和脅迫響應元件(圖6)。其中,光響應元件數(shù)量最多,在光響應元件中,86.77%的BrGH3基因均含有Box4 元件,88.89% 的BrGH3含有G-box 元件;在激素響應元件中,含有ABRE元件的BrGH3基因最多,占91.11%;在脅迫響應元件中,含有ARE 元件的BrGH3基因占93.33%。
圖 6 BrGH3 家族成員啟動子順式作用元件分析Fig.6 Cis-acting element analysis of BrGH3 family members promoter
對大白菜野生型和平塌突變體轉錄組數(shù)據(jù)中提取到的BrGH3基因FPKM 值進行分析。
45 個BrGH3基因家族成員中,8 個BrGH3基因在大白菜野生型和fg-1 突變體中差異表達,其它BrGH3基因在野生型和fg-1突變體不同部位無顯著差異。將該8 個BrGH3基因在不同葉球大白菜葉片不同部位的FPKM 值進行均一化處理,利用TBtools 軟件做成熱圖(圖7)。其中BrGH3.28和BrGH3.41基因在大白菜突變體葉片不同部位的FPKM 值均高于野生型,為野生型的1.22 ~4.83倍。8 個BrGH3基因中,4 個屬于大白菜LF 亞基因組,2 個屬于MF1 亞基因組,2 個屬于MF2 亞基因組,表明BrGH3基因在大白菜LF 亞基因組中優(yōu)勢表達?!?/p>
圖7 BrGH3 基因家族成員在野生型和平塌突變體葉片不同部位中的FPKM 值Fig.7 Analysis of FPKM value of BrGH3 gene family of different part of leaf in wild type and fg-1 mutant
GH3作為生長素早期響應基因,在植物中廣泛存在。但是不同植物種類中GH3家族成員數(shù)量不同,模式植物擬南芥中有20 個GH3基因,其中包含1 個不完整基因[5]、小麥中有36 個[14]、甜櫻桃中只有8 個GH3基因[15]。本研究采用生物信息學方法在全基因組水平對大白菜GH3基因家族成員進行鑒定分析,鑒定到45 個BrGH3家族成員。對這45 個BrGH3成員進行特征分析,表明,BrGH3家族成員編碼氨基酸數(shù)在286~826 之間,分子量在32.06~90.77 KD 之間。45 個BrGH3在大白菜的10 條染色體上呈不均勻分布,其中3 號染色體上的GH3基因數(shù)量最多。系統(tǒng)進化分析表明,GH3家族成員可分為2~4 類。大多數(shù)物種如擬南芥、小麥等物種的GH3家族成員均分為3 類[14]。水稻GH3家族成員雖然也分為3 類,但Group Ⅲ中沒有水稻GH3成員,OsGH3-7單獨為1 類[16];玉米GH3家族成員分為2 類,其中Group Ⅲ中沒有玉米GH3成員[17];蒺藜苜蓿中的17 個GH3家族成員分為4 類,其中Group Ⅳ有3 個GH3家族成員[18]。植物GH3基因家族成員的主要功能是催化自由態(tài)IAA 與氨基酸形成束縛態(tài)的IAA,進一步研究發(fā)現(xiàn)GH3 也具有催化茉莉酸和水楊酸等植物激素與氨基酸結合從而調控其活性的功能。根據(jù)其功能和序列相似性,將擬南芥GH3 蛋白分為3 個亞族,其中Group Ⅰ蛋白催化異亮氨酸和茉莉酸,形成茉莉酸-異亮氨酸耦合物,從而激活茉莉酸信號傳導途徑[19];Group Ⅱ蛋白調控生長素活性,維持生長素穩(wěn)態(tài)[5];Group Ⅲ蛋白調控水楊酸信號轉導,GH3 可能是通過直接催化水楊酸與氨基酸結合、催化水楊酸競爭性抑制劑與氨基酸結合,或是通過與水楊酸合成上游基因作用,進而調控水楊酸信號轉導[20]。其它成員的功能不確定。本研究通過進化分析表明,大白菜BrGH3家族成員分為4類,Group Ⅰ中包含5 個BrGH3,Group Ⅱ有10 個BrGH3,Group Ⅲ中有29 個BrGH3,BraGH3.2單獨為一類?;蛑貜停ㄆ沃貜秃痛?lián)重復)是植物基因組中基因家族擴增的關鍵力量,且復制事件一般發(fā)生在組內[21-22]。本研究表明,大白菜的29個BrGH3參與22 個片段復制事件,存在5 個串聯(lián)重復。進一步分析發(fā)現(xiàn),BrGH3片段復制事件主要發(fā)生在組內,不存在組間復制事件。Group Ⅰ中3個基因參與2 個片段復制事件,Group Ⅱ中2 個基因參與1 個片段復制事件,其它片段復制事件均發(fā)生在Group Ⅲ中,這可能與Group Ⅲ中BrGH3 家族成員數(shù)最多有關。
GH3基因表達具有組織特異性。研究表明,GH3基因表達變化影響植物激素含量,從而影響植物生長發(fā)育和形態(tài)建成。過表達蘋果MsGH3.5基因,游離IAA 含量降低,蘋果全株的細胞分裂素含量顯著增加,植株株高降低、分枝增加、不定根減少[23];SIGH3-15基因過量表達,番茄植株體內自由態(tài)IAA含量降低,番茄生長緩慢、葉片皺縮[24];水稻GH3s表達水平提高,IAA 含量降低,葉夾角增加[25],表明該基因可能與株型形成有關。進一步研究表明,GH3基因表達受激素調控。擬南芥GH3基因在生長素處理0.25~0.5 h 后顯著上調表達,且在處理2~4 h 表達量達到最高值[4];棉花11 個GH3基因在不同激素(油菜素內酯、水楊酸、赤霉素和生長素)處理、不同組織(根和莖)中表達差異顯著[26];利用外源細胞分裂素處理蘋果組培苗,根系和莖中的MsGH3.5均顯著上調,在根系中是對照的 4.5 倍,在莖中是對照的5.5 倍[23];利用茉莉酸甲酯處理丹參,丹參11 個GH3中的SmGH3.2、SmGH3.6和SmGH3.10在根系和葉片中均上調表達,SmGH3.1在葉片中上調表達,而在根系中沒有顯著差異,SmGH3.3在根系中上調表達,而在葉片中沒有顯著差異[27]。這些研究表明GH3基因的表達具有組織特異性,為BrGH3基因在大白菜葉球發(fā)育中的作用提供參考。在本研究中,結合大白菜轉錄組數(shù)據(jù)結果分析發(fā)現(xiàn),45 個BrGH3基因家族成員中,只有15 個BrGH3基因在大白菜葉片中表達。且BrGH3.41,BrGH3.27和BrGH3.28基因在大白菜突變體葉片不同部位的FPKM 值均高于野生型,為野生型的1.02 ~4.43 倍。通過啟動子順式元件的預測分析發(fā)現(xiàn)BrGH3家族成員含有大量植物激素響應相關元件,結合課題組前期研究結果,平塌突變體葉片IAA 含量顯著低于野生型[28],推測該家族成員通過激素響應元件接受激素信號,在平塌突變體葉片不同部位高表達導致平塌突變體葉夾角(葉片近軸面與中心生長點的角度)增加,葉片頂部平展。BoGH3.5在結球甘藍卷曲程度更高的結球期葉片中的表達量比蓮座期葉片高,表明該基因可能與結球甘藍葉片卷曲有關[29]。本試驗結果為進一步研究大白菜GH3基因家族的生物學功能提供了數(shù)據(jù)參考和理論依據(jù)。