張松雨,王敬敬,劉正文,張艷,楊君,馬峙英,王省芬
(河北農(nóng)業(yè)大學(xué)/ 教育部華北作物種質(zhì)資源重點(diǎn)實(shí)驗(yàn)室/ 河北省作物種質(zhì)資源重點(diǎn)實(shí)驗(yàn)室,河北 保定 071001)
棉花是第一大天然纖維作物,是最重要的紡織原料之一。我國主要種植陸地棉(Gossypium hirsutum)和海島棉(G.barbadense)兩個(gè)栽培種,其中陸地棉栽培面積和產(chǎn)量在棉花總產(chǎn)中占主導(dǎo)地位;海島棉又稱“長絨棉”,其纖維長度、比強(qiáng)度、細(xì)度等表現(xiàn)優(yōu)良,是高檔棉紡織品的必要原材料[1-3]。
植物細(xì)胞壁由纖維素、半纖維素、木質(zhì)素、果膠和少量蛋白質(zhì)等組成[4],是由多糖、結(jié)構(gòu)蛋白和各種酶組成的高度復(fù)雜的結(jié)構(gòu)。果膠中約60%以上為多聚同型半乳糖醛酸,同聚半乳糖醛酸是由半乳糖醛酸聚合而成的復(fù)合體,半乳糖醛酸是合成果膠所必需的前體物質(zhì)[5];而葡糖醛酸異構(gòu)酶(UDP-D-glucuronate 4-epimerase,GAE,EC:5.1.3.6)是催化 UDP- 葡萄糖醛酸(UDP-α-D-glucuronic acid,UDP-GlcA)向 UDP- 半乳糖醛酸(UDP-α-D-galacturonic acid,UDP-GalA)轉(zhuǎn)化的關(guān)鍵酶。因此,在植物中含有大量的葡糖醛酸異構(gòu)酶[6-8]。GAE 屬于短鏈脫氫酶/ 還原酶家族(Short-chain dehydrogenases/reductases,SDR),催化各種依賴于氧化型輔酶I 或輔酶II (Nicotinamide Adenine Dinucleotide Phosphate,NAD(P)+)的反應(yīng),包括許多核苷酸糖的相互轉(zhuǎn)換[9-10]。早在1958年,Neufeld 等[11]第一次分離出UDP- 葡糖醛酸差向異構(gòu)酶。后來從肺炎鏈球菌中克隆了編碼UDP-葡糖醛酸4- 異構(gòu)酶的基因caplJ[12]。直到2004年,3個(gè)課題組幾乎同時(shí)鑒定出擬南芥GAE 酶并進(jìn)行了表達(dá)水平分析[5,10,13]。擬南芥AtGAEs家族含有6個(gè)成員,屬于短鏈脫氫酶/還原酶家族的II 型膜蛋白,被預(yù)測均無內(nèi)含子。該家族所有成員均含有與NAD(P)+結(jié)合相關(guān)的保守基序GxxGxG[10,14]。AtGAE01 特異性地催化 UDP-GlcA與UDP-GalA 間的轉(zhuǎn)化,且在pH 7.6 時(shí)酶活性最高,酶活性受UDP-D-Xyl 強(qiáng)烈抑制。AtGAE01 和AtGAE06 在擬南芥根、葉、花和角果中高效表達(dá),AtGAE05 在葉和角果中適度表達(dá),但是在花或根中不表達(dá)[5]。有趣的是,所有AtGAE家族成員均在擬南芥花粉中表達(dá),推測AtGAEs為果膠的合成提供前體物質(zhì)[10,15]。將AtGAE04 反義基因分別轉(zhuǎn)化擬南芥和煙草,轉(zhuǎn)基因擬南芥形成的愈傷組織較小且時(shí)間較晚;轉(zhuǎn)基因煙草多數(shù)生長明顯受限,表現(xiàn)為植株矮小,生長緩慢,葉片長而細(xì),難以形成完整的植株并最終死亡,只有極少數(shù)轉(zhuǎn)基因煙草生長正常,說明反義AtGAE04 基因的確能夠干擾GAE家族基因的正常表達(dá),減少了果膠含量,影響了煙草細(xì)胞的正常粘連[8,16]。Pang 等[17]證明GhGAE1 在棉花纖維的伸長期表達(dá)量顯著增高,GhGAE3 在棉纖維快速伸長期高效表達(dá),說明GhGAE對棉纖維的長度有重要影響。
目前,已經(jīng)公布的陸地棉與海島棉基因組測序結(jié)果為挖掘重要的候選基因提供了可能[18]。本研究基于陸地棉與海島棉基因組測序數(shù)據(jù)庫,從全基因組水平鑒定GAE基因家族成員,分析其基因結(jié)構(gòu)、蛋白序列保守性及保守位點(diǎn)、理化性質(zhì)、系統(tǒng)進(jìn)化等[19]。結(jié)合河北農(nóng)業(yè)大學(xué)棉花遺傳育種課題組已有的棉纖維發(fā)育轉(zhuǎn)錄組數(shù)據(jù),分析GAE基因家族成員在棉纖維發(fā)育中的表達(dá)規(guī)律,這將為今后研究GAE基因家族成員的功能提供理論依據(jù)。
從 TAIR(http://www.arabidopsis.org/)網(wǎng)站搜索擬南芥GAE基因,得到6個(gè)基因,再分別在NCBI (https://www.ncbi.nlm.nih.gov/) 中下載其DNA 序列、氨基酸序列。利用已知海島棉GAE基因的 DNA 序列,在 CottonFGD(https://cottonfgd.org/)搜索并下載其 DNA、氨基酸序列[18],在Pfam(http://pfam.xfam.org/search)網(wǎng)站分析其保守域,得到2個(gè)保守域,其ID 分別為 PF16363 和PF0137。借助NCBI 網(wǎng)站分別鑒定篩選出的陸地棉GhGAEs和海島棉GbGAEs中是否包含完整的 SDR 保守域,再利用 Smart(http://smart.embl-heidelberg.de/)和 NCBI 中 Conserved Domains程序(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)對家族成員進(jìn)行進(jìn)一步確認(rèn)。
根據(jù)GAE家族成員的染色體和位置信息,利用Mapchart 軟件繪制基因定位圖。將鑒定出的 21個(gè)陸地棉GhGAEs基因和 22個(gè)海島棉GbGAEs基因序列通過MEGA 中的Clustal W 進(jìn)行比對,采用鄰近連接法(Neighbor-joining,NJ)構(gòu)建系統(tǒng)發(fā)育樹[20]?;蚪Y(jié)構(gòu)圖的繪制利用在線網(wǎng)站 GSDS(http://gsds.cbi.pku.edu.cn/)完成。
利用 Web Logo (http://weblogo.berkeley.edu/logo.cgi)繪制陸地棉和海島棉GAE家族氨基酸序列 LOGO[21]圖。借助 MEME(http://memesuite.org/tools/meme)分析氨基酸序列,獲得保守基序[22]。
利用MEGA6 的 Clustal W對21個(gè)陸地棉GhGAEs 氨基酸序列、22個(gè)海島棉 GbGAEs 氨基酸序列以及6個(gè)擬南芥AtGAEs 氨基酸序列進(jìn)行比對,采用鄰接法構(gòu)建系統(tǒng)發(fā)育樹[20]。
GAE基因家族成員編碼產(chǎn)物的氨基酸數(shù)量、分子量、等電點(diǎn)等理化性質(zhì)分析由Prot-Param(http://web.expasy.org/protparam/)進(jìn)行[23]。通過 Prot Comp9.0(http://www.softberry.com/berry.phtml?topic=protcom ppl&group=programs&subgroup=proloc)、CELLO v.2.5(http://cello.life.nctu.edu.tw/)對蛋白質(zhì)進(jìn)行亞細(xì)胞定位預(yù)測[24]。借助蛋白跨膜分析軟件TMHMM(http://www.cbs.dut.dk/services/TMHMM-2.0)檢測肽段的跨膜區(qū)。
本實(shí)驗(yàn)室前期完成了陸地棉品種邯優(yōu)405、農(nóng)大棉13 號、中棉所8 號、農(nóng)大601 以及海島棉品種Pima 90-53 和海7124 纖維發(fā)育7個(gè)時(shí)間點(diǎn)0、5、10、15、20、25、30 DPA (開花后天數(shù),Days post-anthesis)的轉(zhuǎn)錄組測序,得到不同時(shí)間點(diǎn)的RPKM(Reads per kilo bases per million reads)。由于GAEs基因在優(yōu)質(zhì)陸地棉品種邯優(yōu)405 和農(nóng)大棉13 號、品質(zhì)一般陸地棉品種中棉所8 號和農(nóng)大601、優(yōu)質(zhì)海島棉Pima90-53 和海7124 中的表達(dá)規(guī)律一致,因此本研究在進(jìn)行基因表達(dá)分析時(shí),先分別計(jì)算優(yōu)質(zhì)陸地棉品種邯優(yōu)405 和農(nóng)大棉13 號、品質(zhì)一般陸地棉品種中棉所8 號和農(nóng)大 601、優(yōu)質(zhì)海島棉 Pima90-53 和海 7124 的RPKM 平均值,在三類平均值的基礎(chǔ)上再進(jìn)行l(wèi)og2(1+RPKM)處理。表達(dá)量熱圖的繪制借助GPS(http://hemi.biocuckoo.org/)完成。根據(jù)纖維發(fā)育各時(shí)期表達(dá)量的不同,將GAE家族進(jìn)行分類,探究GAE家族成員在不同棉花品種中纖維發(fā)育不同時(shí)期的表達(dá)規(guī)律。
為了挖掘GAE家族成員中的優(yōu)勢表達(dá)基因,本研究將優(yōu)質(zhì)陸地棉與品質(zhì)一般陸地棉、優(yōu)質(zhì)海島棉與優(yōu)質(zhì)陸地棉的RPKM 值分別進(jìn)行比較,探究不同棉花品種在各個(gè)時(shí)間點(diǎn)GAE表達(dá)量的差異。將優(yōu)勢表達(dá)基因的閾值定為1.5,即表達(dá)量差異在1.5 倍以上,并將優(yōu)勢表達(dá)基因標(biāo)注在進(jìn)化樹中。
借助 Smart和NCBI 中 Conserved Domains程序剔除不含SDR 保守結(jié)構(gòu)域的序列,在CottonFGD 數(shù)據(jù)庫中,從陸地棉和海島棉最終分別鑒定出21個(gè)和22個(gè)GAE家族成員,按照它們在染色體上的位置順序,分別命名為Gh-GAE01-21、GbGAE01-22(表1),其中GhGAE02、GhGAE14、GbGAE11和GbGAE20位于沒有組裝到染色體的大片段上。從基因在染色體上的分布來看,GAE基因家族成員在8 號染色體上分布最多,在陸地棉中A08和D08 均有 4個(gè)GhGAE基因; 在海島棉中A08 和D08 分別有4個(gè)和6個(gè)GbGAE基因(圖1)。
表1 四倍體棉花GAE 基因家族信息Table 1 Information of GAE gene family in tetraploid cotton
表1 (續(xù))Table 1 (Continued)
圖1 四倍體棉花GAE 基因家族的染色體定位Fig.1 Chromosome location of GAE gene family in tetraploid cotton
將鑒定出的 21個(gè)陸地棉GhGAEs和22個(gè)海島棉GbGAEs基因序列構(gòu)建系統(tǒng)進(jìn)化樹 (圖2),可以分為3個(gè)亞組,Ⅰ、Ⅱ、Ⅲ亞組分別包含17、8和18個(gè)基因。Ⅰ亞組包含 8個(gè)GhGAEs和9個(gè)GbGAEs,Ⅱ亞組與Ⅲ亞組相同,GhGAEs和GbGAEs各占一半。基因結(jié)構(gòu)分析顯示(圖2),陸地棉和海島棉中同一基因位于相鄰分支,親緣關(guān)系較近。72%的GAEs基因沒有內(nèi)含子,這與擬南芥GAE 家族成員均不含內(nèi)含子的情況相似。
圖2 四倍體棉花GAE 基因家族進(jìn)化樹和基因結(jié)構(gòu)Fig.2 Phylogenic tree and gene structure of GAE gene family in tetraploid cotton
保守結(jié)構(gòu)域分析表明,GAE家族結(jié)構(gòu)域含有多個(gè)保守性的氨基酸殘基,如T200、W318、W380、C425 等,部分保守性氨基酸殘基組成GAE家族特有的保守基序(圖3)。GAE家族存在4個(gè)保守基序(表2),第1個(gè)是 TDQPASLYAATKKAGEEIAHTYNHIYGLSLTGLRFFTVYGPWGRPDMAYF,整體表示為 TDQPASLYAATKKAGEEI[AT]HTYNHIYGLS[LI]TGLRFFTVYGPWGRPDMAYF(圖3 中用細(xì)實(shí)線標(biāo)出)。第2個(gè)保守基序是 FTHVMHLAAQAGVRYAMZNPGSYVHSNIAGFVNLLEVCKSANPQPAIVWA,整體表示為FTHV[ML]HLAAQAGVRYAM[EQ]NP[GQ]SYV HSNIAG[FL]V[NST]LLEV[CA]K[SA]ANPQPAIVWA(圖3 中用粗實(shí)線標(biāo)出)。第3個(gè)保守基序是MKLPRNGDVPFTHANISLAQRELGYKPTTDLQTGLKKFVRW,整體表示為[MV]K[LM]P[RG]NGDV[PQ]FTHAN[IV][ST]LAQ[RK][ED][LF]GYKP[TS]TDLQ[TA]GL[KR]KFV[RK]W(圖3中用細(xì)虛線標(biāo)出)。第4個(gè)保守基序是KGCL GALDTAEKSTGSGGKKKGPAQLRVYNLG,整體表示為KGCL [GA][AS]LDT [AS][EKG]KSTGSGGKK[KR]GPA[QP][LY]R[VI][YF]NLG(圖3中用粗虛線標(biāo)出)。21個(gè)GhGAEs和22個(gè)Gb-GAEs基因有4個(gè)相同的保守基序,存在共同的氨基酸殘基,保守性較強(qiáng);但基因間又存在一定的差異,這些差異可能是導(dǎo)致基因功能發(fā)生分化的主要原因。
表2 四倍體棉花GAE 基因家族保守基序Table 2 Conservative motifs of GAE gene family in tetraploid cotton
圖3 四倍體棉花GAE 家族氨基酸序列保守性分析Fig.3 Conservation analysis of amino acid sequences of 43 GAE genes in tetraploid cotton
陸地棉、海島棉、擬南芥的GAEs構(gòu)建系統(tǒng)進(jìn)化樹 (圖 4),結(jié)果顯示,AtGAE02、AtGAE03、AtGAE04、AtGAE05 位于同一亞組,而AtGAE01和AtGAE06 分別聚類到不同的亞組。前人研究證實(shí),AtGAE01 和AtGAE06 在擬南芥花和角果中均高效表達(dá)[9],它們可能為果膠的合成提供前體物質(zhì)[10,15]。棉纖維原始細(xì)胞突起始于開花當(dāng)天,然后迅速進(jìn)入伸長,伸長持續(xù)時(shí)間一般有24~28 d,此階段決定了纖維細(xì)度[25],因此,我們推測與AtGAE01 和AtGAE06 聚類關(guān)系較近的陸地棉和海島棉GAEs可能在棉纖維發(fā)育過程中發(fā)揮重要作用。
圖4 擬南芥和四倍體棉花GAEs 基因家族進(jìn)化樹分析Fig.4 Phylogenic tree of the GAE gene family in Arabidopsis and tetraploid cotton
蛋白理化性質(zhì)分析表明(表3),陸地棉Gh-GAE家族成員編碼的肽鏈平均由414個(gè)氨基酸組成,分子量介于24.87~50.32 kDa,平均45.93 kDa; 海島棉GbGAEs編碼的肽鏈平均為426個(gè)氨基酸,分子量介于22.55~62.53 kDa,平均為47.29 kDa,平均分子量較陸地棉偏大,且分子量分布范圍較寬。GhGAEs家族成員理論等電點(diǎn)介于 9.02~10.34,平均值為 9.79;GbGAEs家族成員理論等電點(diǎn)為9.01~9.98,平均值為9.67。
陸地棉GhGAEs蛋白不穩(wěn)定指數(shù)平均值為40.65,其中有 9個(gè)GhGAE成員為穩(wěn)定蛋白(蛋白不穩(wěn)定指數(shù)<40),其余的12個(gè)基因?yàn)椴环€(wěn)定蛋白(蛋白不穩(wěn)定指數(shù)>40)。GhGAE基因家族成員的脂溶指數(shù)AI 都小于100,平均值為83.98,具有較高的脂溶性。在海島棉中,蛋白不穩(wěn)定指數(shù)平均值為39.60,有10個(gè)GbGAE成員為穩(wěn)定蛋白,其余的12個(gè)基因?yàn)椴环€(wěn)定蛋白。GbGAEs平均脂溶指數(shù)為83.38,與陸地棉GhGAEs家族成員相同,均具有較高的脂溶性; 所有的Gh-GAEs和GbGAEs蛋白序列總平均親水性(Grandaverage of hydropathy,GRAVY)都是負(fù)數(shù),均表現(xiàn)為親水性。
表3 四倍體棉花GAE 基因家族理化性質(zhì)及亞細(xì)胞定位Table 3 Physicochemical properties and subcellular location of GAE proteins in tetraploid cotton
表3 (續(xù))Table 3 (Continued)
對21個(gè)陸地棉GhGAEs、22個(gè)海島棉Gb-GAEs家族成員蛋白進(jìn)行亞細(xì)胞定位預(yù)測 (表3),顯示所有GhGAEs和GbGAEs蛋白均定位在高爾基體膜(Golgi membrane)。蛋白跨膜區(qū)分析結(jié)果表明,除GhGAE12、GbGAE05、GbGAE06、GbGAE17、GbGAE18、GbGAE22沒有檢測到跨膜區(qū)外,GhGAE01、GhGAE11、GbGAE11 包含 3個(gè)跨膜區(qū),其余家族成員均含有1~2個(gè)跨膜區(qū)。
根據(jù)本實(shí)驗(yàn)室提供的棉纖維發(fā)育轉(zhuǎn)錄組數(shù)據(jù),對優(yōu)質(zhì)陸地棉品種邯優(yōu)405 和農(nóng)大棉13 號、品質(zhì)一般的陸地棉品種中棉所8 號和農(nóng)大601、優(yōu)質(zhì)海島棉Pima90-53 和海7124 的RPKM 的平均值進(jìn)行 log2(1+RPKM)處理,可以將GAE家族成員的表達(dá)分為:纖維發(fā)育起始期高表達(dá)、纖維伸長期高表達(dá)、次生壁增厚期高表達(dá)、全時(shí)期低表達(dá) 4 類表達(dá)模式。在陸地棉中,GhGAE02、Gh GAE03、GhGAE08、GhGAE09 等 8個(gè)GhGAEs在纖維起始期(0 DPA)高效表達(dá),推測這些基因主要在纖維發(fā)育起始期發(fā)揮作用。其中,GhGAE02在纖維發(fā)育的整個(gè)時(shí)期表達(dá)量均較高,可能對棉纖維品質(zhì)有重要影響 (圖5 左-A)。在纖維伸長期,GhGAE01、GhGAE05、GhGAE06、GhGAE11等8個(gè)基因的表達(dá)峰值出現(xiàn)在 5、10、15、20 DPA 的某一時(shí)間點(diǎn),且GhGAE01、GhGAE11 為優(yōu)勢表達(dá)基因,推測這類基因可能影響著纖維長度(圖5左 -B)。在次生壁增厚期,GhGAE04、GhGAE14的表達(dá)峰值出現(xiàn)在25 DPA 或30 DPA,這兩個(gè)基因可能影響棉纖維的強(qiáng)度(圖5 左-C)。全時(shí)期低表達(dá)模式基因包括GhGAE07、GhGAE16、Gh-GAE17,這3個(gè)基因在各個(gè)時(shí)期的表達(dá)量都很低,推測這些基因在棉纖維發(fā)育過程中可能作用較?。▓D5 左 -D)??傮w來看,GhGAEs在優(yōu)質(zhì)陸地棉與品質(zhì)一般的陸地棉品種中的表達(dá)趨勢一致。
在海島棉中,GbGAE02、GbGAE03、GbGAE08等7個(gè)GbGAEs表達(dá)峰值出現(xiàn)在0 DPA,隨著纖維發(fā)育表達(dá)量逐漸降低,其中GbGAE02 為優(yōu)勢表達(dá)基因,在纖維發(fā)育的整個(gè)時(shí)期表達(dá)量均較高,GbGAE02 可能對棉纖維品質(zhì)的影響更大(圖5 右 -A)。在纖維伸長期,GbGAE01、GbGAE06、GbGAE11 等8個(gè)基因表達(dá)量最高,推測這類基因可能影響著纖維長度,其中GbGAE01、Gb-GAE11 為優(yōu)勢表達(dá)基因,這兩個(gè)基因可能對纖維的伸長作用更大(圖5 右-B)。在次生壁增厚期,GbGAE04、GbGAE05、GbGAE19、GbGAE22 的表達(dá)峰值出現(xiàn)在25 DPA 或30 DPA,這3個(gè)基因可能影響棉纖維的強(qiáng)度 (圖5 右 -C)。GbGAE07、GbGAE16、GbGAE17 在各個(gè)時(shí)期的表達(dá)量都很低,推測這些基因在棉纖維發(fā)育過程中可能作用較?。▓D5 右 -D)。
圖5 GAE 基因家族表達(dá)量熱圖(左圖為陸地棉,右圖為海島棉)Fig.5 The expression heatmaps of GAE gene family (The left is upland cotton,the right is sea island cotton)
GAE家族多數(shù)成員如GAE01、GAE02、GAE04 等在陸地棉和海島棉中表達(dá)趨勢一致,且在進(jìn)化樹中位于相鄰分支,親緣關(guān)系較近。
將優(yōu)質(zhì)陸地棉與品質(zhì)一般的陸地棉、優(yōu)質(zhì)海島棉與優(yōu)質(zhì)陸地棉分別進(jìn)行比較,在進(jìn)化樹中把GAE家族成員中優(yōu)勢表達(dá)的基因用不同顏色的點(diǎn)進(jìn)行標(biāo)注(圖6 左)。分析優(yōu)質(zhì)陸地棉(邯優(yōu)405和農(nóng)大棉13 號)與品質(zhì)一般的陸地棉(中棉所8號和農(nóng)大601)在纖維發(fā)育相同時(shí)間點(diǎn)GAE的表達(dá)差異 (圖6 右),GhGAE10 在纖維伸長期優(yōu)勢表達(dá);GhGAE11、GhGAE19 在次生壁增厚期優(yōu)勢表達(dá);GhGAE08 在纖維伸長和次生壁增厚期均優(yōu)勢表達(dá),推測這些基因在優(yōu)質(zhì)陸地棉中的優(yōu)勢表達(dá),可能是引起優(yōu)質(zhì)陸地棉品種比品質(zhì)一般的陸地棉品種纖維更長的重要基因。
分析優(yōu)質(zhì)海島棉 (Pima90-53 和海 7124)與優(yōu)質(zhì)陸地棉(邯優(yōu)405 和農(nóng)大棉13 號)在纖維發(fā)育相同時(shí)間點(diǎn)GAE的表達(dá)差異,結(jié)果顯示,GbGAE08、GbGAE10 在 5 DPA、10 DPA、20 DPA 優(yōu)勢表達(dá);GbGAE06 在纖維伸長和次生壁增厚期均優(yōu)勢表達(dá);GbGAE07 在纖維起始和次生壁增厚階段優(yōu)勢表達(dá),這些基因在海島棉中表達(dá)量顯著高于陸地棉,推測可能是引起海島棉比陸地棉纖維長度、比強(qiáng)度、細(xì)度等優(yōu)良的重要基因。
圖6 GAE 家族成員優(yōu)勢表達(dá)基因Fig.6 The preferentially expressed genes of GAE family
本研究通過對陸地棉及海島棉進(jìn)行全基因組分析,從陸地棉和海島棉中分別鑒定出21個(gè)GhGAE和22個(gè)GbGAE基因,均含有 SDR 保守結(jié)構(gòu)域,所有GAE蛋白均定位于高爾基體膜。約72%的GAE家族成員不含有內(nèi)含子,這與擬南芥AtGAE的結(jié)果相似。
本研究根據(jù)GAE基因家族的表達(dá)模式將其分為4 類,其中,GhGAEs在優(yōu)質(zhì)陸地棉與品質(zhì)一般的陸地棉品種中的表達(dá)趨勢一致。將優(yōu)質(zhì)陸地棉與品質(zhì)一般的陸地棉、優(yōu)質(zhì)海島棉與優(yōu)質(zhì)陸地棉分別進(jìn)行比較,發(fā)現(xiàn)GhGAE08、GhGAE10、GbGAE06、GbGAE08、GbGAE10 在 纖 維 伸 長 期優(yōu)勢表達(dá),伸長期主要進(jìn)行纖維的極性伸長,推測可能影響棉纖維的長度;GhGAE08、Gh-GAE11、GhGAE19 在次生壁增厚期優(yōu)勢表達(dá),該時(shí)期主要是纖維素的沉積,次生壁中的微原纖通過葡萄糖殘基在纖維素側(cè)鏈上的聯(lián)結(jié)使纖維素聚合度增加,導(dǎo)致纖維胞壁加厚[26]。推測這Gh-GAE08、GhGAE11、GhGAE19 在優(yōu)質(zhì)陸地棉中的高效表達(dá)可能導(dǎo)致優(yōu)質(zhì)陸地棉更早地對細(xì)胞壁多糖網(wǎng)絡(luò)進(jìn)行調(diào)整,從而引起棉纖維品質(zhì)的不同[27-28]。系統(tǒng)進(jìn)化樹結(jié)果顯示,這些高效表達(dá)基因多數(shù)與AtGAE01 和AtGAE06 聚類關(guān)系較近,而AtGAE01 和AtGAE06 在擬南芥主要器官中均高效表達(dá),它們可能為果膠的合成提供前體物質(zhì)[10,15],暗示這些基因可能在棉纖維發(fā)育過程中發(fā)揮重要作用。目前對GAE基因家族在棉纖維發(fā)育過程中功能的了解還十分有限。因此,系統(tǒng)研究GAE基因家族可為棉纖維品質(zhì)分子改良提供重要的候選基因。
通過對陸地棉及海島棉進(jìn)行全基因組分析,鑒定出21個(gè)陸地棉GhGAE基因和22個(gè)海島棉GbGAE基因,分為3個(gè)亞組,分布在 12 條染色體上。所有GAE蛋白均定位于高爾基體膜,約72%的GAE家族成員不含有內(nèi)含子,根據(jù)GAEs在陸地棉、海島棉纖維發(fā)育不同時(shí)期的表達(dá)變化,將其分為起始期高表達(dá)、纖維伸長期高表達(dá)、次生壁增厚期高表達(dá)、全時(shí)期低表達(dá)4 類模 式 。其中GhGAE01、GhGAE02、GhGAE11、GhGAE12 在陸地棉中高效表達(dá),GbGAE01、Gb-GAE02、GbGAE11、GbGAE12在海島棉中為高表達(dá)基因,推測可能在纖維發(fā)育過程中發(fā)揮著重要作用。通過對GAE基因進(jìn)行全基因組的分析,為研究GAE基因家族在棉纖維發(fā)育中的功能提供了參考依據(jù)。