孟亞軒, 孫穎琦, 趙心月, 王鳳霞, 甕巧云, 劉穎慧
( 河北北方學院 農(nóng)林科技學院, 河北 張家口 075000 )
苯丙氨酸解氫酶(phenylalanine ammonia-lyase,PAL)是苯丙烷代謝途徑中的關(guān)鍵酶,參與木質(zhì)素及酚類化合物的合成過程,廣泛存在于各種植物中(Fraser & Chapple, 2011;蓋江濤等,2016)。Koukol和Comm(1961)在大麥()中首次提取出PAL蛋白,后續(xù)馬鈴薯()(Joos & Hahl, 1992)、煙草()(Reichert et al., 2009)等高等植物也相繼分離純化得到PAL蛋白。楊郁文等(2017)研究發(fā)現(xiàn)PAL多以同源四聚體形式存在于細胞質(zhì)和葉綠體中,通過轉(zhuǎn)錄水平等多層次調(diào)控方式,在植物防御系統(tǒng)中發(fā)揮重要作用。啟動子缺失實驗表明,MYB轉(zhuǎn)錄因子可通過結(jié)合啟動子區(qū)段,進行轉(zhuǎn)錄水平調(diào)控(楊郁文等,2017)??赏ㄟ^調(diào)控HCA類酚類、類黃酮等產(chǎn)物的合成影響果實品質(zhì)(張麗之等,2018)。此外,廣泛參與植物響應(yīng)病原菌侵染過程。楊會曉等(2019)研究表明與香蕉抗病性密切相關(guān),在枯萎病菌侵染過程中高豐度表達?;钚栽黾优c苯丙烷類產(chǎn)物的產(chǎn)量提高密切相關(guān),其活性水平隨發(fā)育階段、細胞和組織的分化、不同應(yīng)激刺激而改變。Lister等(1996)首次發(fā)現(xiàn)活性與蘋果()果實類黃酮含量存在顯著正相關(guān)。楊會曉等(2019)研究發(fā)現(xiàn)在香蕉()果實發(fā)育成熟過程高豐度表達,次級代謝物質(zhì)在這一階段具有較高的表達效率。Olsen等(2008)研究發(fā)現(xiàn)擬南芥()1、2基因在氮脅迫和溫度變化過程中高豐度表達,并伴隨類黃酮化合物的積累。
隨著基因組學的發(fā)展,多種植物基因組測序相繼完成,植物中基因的功能陸續(xù)得到研究。大豆()1-1、2-1、2-3在木質(zhì)素合成過程中發(fā)揮重要作用(候鵬等,2016);10強烈響應(yīng)紋枯病菌侵染玉米()過程(鄧路長等,2019);參與山葡萄()花色苷的積累(陳蒙等,2018)。基因組學的迅速發(fā)展,標志著在分子水平上進行系統(tǒng)分析已成為當下生物學研究的主流趨勢(王燦等,2020)。谷子()為一年生禾本科作物,基因組小且為二倍體,具有抗旱性強、生育期短、產(chǎn)量高等特點,是挖掘作物抗旱基因和解讀抗逆分子機制的重要作物(宋健等,2020)。谷子生育期內(nèi)需水量較少,屬環(huán)境友好型作物(宋健等,2019),抗逆育種靶向基因資源的研究已成為谷子增收工作的重要環(huán)節(jié)(Nadeem et al., 2020)。谷子基因組測序的完成為谷子研究搭建了數(shù)據(jù)基礎(chǔ),標志著谷子遺傳研究已進入后基因組學時代(Bennetzen et al., 2012;Zhang et al., 2012)?;蚣易鍙V泛存在于植物中,但關(guān)于谷子基因家族的研究卻鮮有報道。為明確谷子基因家族在逆境脅迫過程中的作用機理,本研究利用生物信息學方法對谷子基因家族進行鑒定,分析其結(jié)構(gòu)特點及進化方式,并構(gòu)建家族基因在非生物脅迫下的表達模式,以期為谷子基因家族的生物學功能研究提供參考。
供試谷子()品種為一年生‘張雜谷8號’,盆栽于河北北方學院農(nóng)場,分別置于自然光、黑暗、紅光、藍光、遠紅光條件下照射24 h,取幼嫩葉片,液氮速凍后,-80 ℃保存?zhèn)溆谩?/p>
利用Pfam數(shù)據(jù)庫查找并下載PAL蛋白結(jié)構(gòu)域的隱馬爾可夫模型文件(Pfam號碼:00221)(Finn et al., 2008),利用plant Genes 基因組獲取Gene stable ID及Transcript stable ID,通過CDD和InterProScan對Gramene網(wǎng)站獲取的序列進行篩選鑒定,去除冗余,得到PAL蛋白序列、染色體定位等基因信息(Marchler et al., 2009; Hunter et al., 2009)。利用ProtParam數(shù)據(jù)庫通過序列信息得到氨基酸數(shù)量、等電點等用于推測蛋白質(zhì)的相關(guān)因子(宋健等,2020)。
通過MG2C在線工具,利用谷子基因位置信息以及從Ensemble Plants查詢到的谷子染色體長度,繪制基因的染色體定位。
使用ProSite和Clustal X在線軟件對谷子PAL蛋白結(jié)構(gòu)域位置進行序列對齊。通過MEGA 6.0軟件中的銜接法(neighbor-joining, NJ),采用泊松模型繪制蛋白進化樹(bootstrap為1 000)(Larkin et al., 2007;Sigrist et al., 2010)。通過上述方法對二穗短柄草()、高粱()、狗尾草()等54個PAL家族成員繪制蛋白進化樹(bootstrap為默認值)。
在MEME網(wǎng)站得到谷子PAL的motif模式(最小寬度設(shè)置為60,最大寬度設(shè)置為200)(Bailey et al., 2009);利用Weblogo分析得出PAL結(jié)構(gòu)域motif(Stacks per Line設(shè)置為100);在SWISS-MODEL網(wǎng)站中利用其各基因位點出現(xiàn)頻率最高基因組成的保守序列預(yù)測其三維結(jié)構(gòu)并得到螺旋模式(Kiefer et al., 2009),并根據(jù)上述方法對二穗短柄草、水稻等物種的PAL蛋白進行預(yù)測,分析對比各物種的蛋白結(jié)構(gòu)差異。
在PAL系統(tǒng)發(fā)育的基礎(chǔ)上,谷子和水稻()的直系同源片段已得到鑒定。利用Ensembl Plants網(wǎng)站的基因組比較功能得到谷子和水稻同源物的同源共線圖(Wang et al., 2012)。通過其染色體定位及基因位置,在Adobe Illustrator CS4軟件繪制谷子和水稻同系物的同源共線圖,分析其共線性。
通過Phytozome數(shù)據(jù)庫獲得谷子基因的序列信息,使用GSDS 2.0在線數(shù)據(jù)庫分析其編碼序列,得到內(nèi)含子-外顯子結(jié)構(gòu)模型(Hu et al., 2015)。在谷子基因組數(shù)據(jù)庫得到起始密碼子上游1 500 bp區(qū)域序列,利用plantCARE分析其順式作用元件,通過GSDS 2.0將其可視化(Lescot et al., 2002)。
在Phytozome數(shù)據(jù)庫獲得11個基因在不同誘導(dǎo)處理下的表達模式,包括強光誘導(dǎo)2周的葉片、強光誘導(dǎo)1周的芽、黑暗誘導(dǎo)的地上組織、紅光誘導(dǎo)的地上組織、正常光誘導(dǎo)的根、干旱誘導(dǎo)的根、尿素誘導(dǎo)的根、強光誘導(dǎo)的穗,利用TBtools繪制熱圖(Chen et al., 2020)。
利用DNAMAN設(shè)計引物,選擇為內(nèi)參基因。使用植物總RNA試劑盒提取RNA(天根生化科技有限公司),F(xiàn)astQuant RT Kit合成cDNA,使用Agilent 3000P熒光定量PCR儀進行PCR擴增。反應(yīng)條件:95 ℃預(yù)變性2 min,95 ℃變性15 s;60 ℃退火30 s,40個擴增循環(huán),每個樣品進行3次重復(fù);采用2進行數(shù)據(jù)處理。
谷子中共鑒定11個家族基因,分別命名為1~11(表1)。11個PAL蛋白序列差異較?。喊被衢L度為698 aa(SiPAL1、SiPAL8)~891 aa(SiPAL7),開放閱讀框長度2 142 bp(3)~4 610 bp(2),分子質(zhì)量為74.99 kD(SiPAL8)~95.01 kD(SiPAL7),等電點為5.82(5)~6.52(6),含有1個(3、4、5)~6個(7)外顯子。從表1可以看出,位于1號染色體的5個基因(1~5)具有相似的編碼蛋白特征,且基因位置緊密排列在一起,位于7號染色體的3個基因(9~11)雖然緊密排列,但其編碼蛋白的特征卻相差較大。所有PAL蛋白的等電點均在5.82~6.52之間,說明苯丙氨酸解氫酶具有酸性特征,PAL蛋白可能在弱酸性的環(huán)境中發(fā)揮作用。家族基因除7(6)外,外顯子數(shù)量較小,推測10個家族基因具有相似的功能。
從基因的染色體分布發(fā)現(xiàn),1號染色體有5個緊密排列的基因,分布的基因數(shù)量最多;7號染色體具有3個基因且緊密排列,其他染色體上沒有成簇基因分布(表1,圖1);此外,基因不均勻分布在染色體各個部位,其中1號染色體和7號染色體基因形成簇狀分布。利用Phytozome數(shù)據(jù)庫的Gbrowse功能比對成簇分布的基因家族成員與側(cè)翼編碼蛋白質(zhì)基因位置關(guān)系,參考Holub(2001)對基因簇的界定,暗示谷子家族基因可通過串聯(lián)復(fù)制實現(xiàn)家族擴增。
表 1 谷子PAL基因家族的信息Table 1 Information of millet PAL gene family
圖 1 谷子PAL基因家族的染色體分布Fig. 1 Chromosome distribution of millet PAL gene family
利用蛋白序列對齊文件,通過銜接法繪制出谷子PAL的進化樹(圖2)。由圖2可知,根據(jù)進化樹拓撲結(jié)構(gòu)可分為3組蛋白,第1組和第2組蛋白數(shù)量相同且分支分布情況相似,此外小部分PAL蛋白的臨界值達到100。進化樹的拓撲情況表明,這兩組基因可能經(jīng)過復(fù)制的方式得到或者執(zhí)行相似基因功能。由進化樹聚類分析得出,相同PAL蛋白結(jié)構(gòu)域與同一基因擴增或復(fù)制的蛋白聚合在一起,如SiPAL6和SiPAL9分散復(fù)制聚在一起,相同結(jié)構(gòu)域聚合為一組。另外,SiPAL7獨自分支為一組,說明SiPAL7可能具有不同的進化軌跡。
圖 2 PAL蛋白系統(tǒng)發(fā)育進化樹Fig. 2 Phylogenetic tree of PAL protein
利用MEGA 6.0軟件將單、雙子葉共6個物種的54個PAL蛋白利用銜接法構(gòu)建系統(tǒng)發(fā)育進化樹(圖3)。由圖3可知,基因家族演化分析中選用二穗短柄草9個,高粱8個、狗尾草11個、水稻10個、擬南芥5個PAL蛋白發(fā)現(xiàn),7個親緣關(guān)系組中部分物種PAL蛋白呈家族性聚集,不同綱目物種之間的PAL蛋白也具有較高的同源性。
黑色為谷子,青色為二穗短柄草,黃色為高粱,藍色為狗尾草,紫色為擬南芥,紅色為水稻。Black is Setaria italica, cyan is Brachypodium distachyon, yellow is Sorghum bicolor, blue is Setaria viridis, purple is Arabidopsis thaliana, red is Oryza sativa.圖 3 不同物種PAL蛋白進化樹Fig. 3 Phylogenetic tree of PAL protein in different species
通過ProSite軟件對谷子PAL蛋白的結(jié)構(gòu)域分析結(jié)果發(fā)現(xiàn),所有PAL蛋白均具有保守的PAL 結(jié)構(gòu)域。由圖4可知,SiPAL7蛋白除含有PAL結(jié)構(gòu)域外還具有HtRna 結(jié)構(gòu)域、HGTP 結(jié)構(gòu)域,其中HtRNA 結(jié)構(gòu)域可能調(diào)控氨酰腺苷酸的合成,HGTP 結(jié)構(gòu)域可能與相關(guān)蛋白質(zhì)的合成有關(guān),SiPAL7的氨基酸長度最長,擁有蛋白結(jié)構(gòu)域最多,可能與其具有最多的外顯子(6個)有關(guān),意味著擁有更多的遺傳信息;SiPAL11雖同樣具有較長的氨基酸序列,但只含有PAL蛋白結(jié)構(gòu)域,暗示SiPAL11可能擁有一些低復(fù)雜度的蛋白結(jié)構(gòu)域。通過MEME軟件對谷子PAL蛋白結(jié)構(gòu)域分析發(fā)現(xiàn),PAL結(jié)合結(jié)構(gòu)域的氨基酸組成較為穩(wěn)定。
圖 4 谷子PAL蛋白結(jié)構(gòu)域示意圖Fig. 4 Schematic diagram of PAL protein domain of millet
利用SWISS-MODEL軟件分析各基因位點出現(xiàn)頻率最高的保守基序,預(yù)測谷子PAL蛋白的3D結(jié)構(gòu)發(fā)現(xiàn),谷子PAL蛋白的PAL 3D 結(jié)構(gòu)在對稱基礎(chǔ)上具有較多的螺旋、折疊方式(圖5:A)。通過Superpose Version 1.0將各物種間的PAL蛋白3D結(jié)構(gòu)對比,比值越小證明物種間PAL蛋白結(jié)構(gòu)越相似。由表2可知,狗尾草與谷子3D結(jié)構(gòu)相差最小(0.38),與進化樹分支聚類情況一致,證明兩者具有最近的親緣關(guān)系,相差最大的是谷子與二穗短柄草(3.93),這與谷子和二穗短柄草為不同綱目的物種相對應(yīng)。通過蛋白3D結(jié)構(gòu)發(fā)現(xiàn)PAL蛋白的三級結(jié)構(gòu)大多具有對稱性,說明其蛋白質(zhì)的結(jié)構(gòu)單元具有一定的相似性,從基因進化來看,這種對稱性代表著基因存在復(fù)制融合。
A. PAL氨基酸序列; B. PAL蛋白3D結(jié)構(gòu)示意圖。A. PAL amino acid sequence; B. PAL protein 3D structure schematic diagram.圖 5 PAL蛋白的3D結(jié)構(gòu)及序列Fig. 5 3D structure and sequence of PAL protein
利用Ensembl Plants網(wǎng)站synteny功能得到谷子和水稻同源物的同源共線圖。通過染色體定位及基因位置,繪制谷子和水稻同源物的同源共線圖(圖6僅展示代表成員)。圖6結(jié)果表明,谷子11個家族成員均可在水稻中找到共線基因,如含有020626100、020626400等的水稻2號染色體基因組區(qū)域與谷子1號染色體的基因組塊具有共線性,含有050150900的水稻5號染色體基因組區(qū)域與谷子3號染色體的基因組塊具有共線性;同樣含有040518100、040518400的水稻4號染色體基因組區(qū)域與谷子7號染色體組塊具有共線性。
圖 6 谷子和水稻PAL基因共線性分析Fig. 6 Collinearity analysis of PAL gene in millet and rice
利用GSDS 2.0對谷子序列信息分析并可視化,得到基因內(nèi)含子-外顯子結(jié)構(gòu)模型圖(圖7:A)發(fā)現(xiàn),基因大多數(shù)只具有1個內(nèi)含子(1、2、6、8、9、10、11),且這些基因的外顯子結(jié)構(gòu)及大小具有一定的相似性,這種結(jié)構(gòu)間的相似性說明他們可能在植物的生化過程中執(zhí)行相同的作用。3、4、5同樣具有相同的外顯子結(jié)構(gòu),但均不含有內(nèi)含子。7擁有最多的內(nèi)含子數(shù)量(5)。
將plantCARE分析得到的順式作用元件區(qū)域可視化,得到順式作用元件分布圖,圖7:B結(jié)果顯示,家族中含有多種激素信號響應(yīng)元件和環(huán)境信號響應(yīng)元件。其中,分布最廣的為茉莉酸響應(yīng)元件,存在于所有基因中,暗示基因通過響應(yīng)植物內(nèi)源激素參與植物抗病過程;分布最少的元件為胚乳表達元件,只存在于9中;其他不同類型順式作用元件如脅迫元件、光響應(yīng)等不均勻分布在各個位置??梢姡易寤蛟诠茸影l(fā)育、抗病及脅迫過程中發(fā)揮重要作用。
A. 防御與應(yīng)激響應(yīng); B. 赤霉素響應(yīng); C. 脫落酸響應(yīng); D. 生長素響應(yīng); E. 光響應(yīng); F. 茉莉酸響應(yīng); G. 玉米醇溶蛋白調(diào)控元件; H. 分生組織誘導(dǎo); I. MYB結(jié)合位點; J. 缺氧誘導(dǎo); K. 胚乳表達; L. 低溫脅迫。A. Defense and stress responsiveness; B. Gibberellin responsiveness; C. Abscisic acid responsiveness; D. Auxin responsiveness; E. Light responsiveness; F. MeJA responsiveness; G. Zein metabolism regulatory elements; H. Meristem induction; I. MYB binding site; J. Hypoxia induction; K. Endosperm expression; L. Low temperature stress.圖 7 PAL基因內(nèi)含子-外顯子結(jié)構(gòu)及順式作用元件Fig. 7 PAL gene intron-exon structure and cis-acting elements
從Phytozome數(shù)據(jù)庫獲得的11個基因在谷子不同組織中面對不同非生物脅迫的表達量數(shù)據(jù),利用TBtools將結(jié)果可視化,繪制熱圖,如圖8所示,所有基因均檢測到表達量,其中1、2、8、10在強光誘導(dǎo)1周的芽、黑暗誘導(dǎo)的地上組織、紅光誘導(dǎo)的地上組織、正常光誘導(dǎo)的根、干旱誘導(dǎo)的根、尿素誘導(dǎo)的根、強光誘導(dǎo)的穗中均具有明顯高于其他基因的表達量; 在強光誘導(dǎo)生長2周葉片的表達量中只有2具有微弱表達,其他基因幾乎不表達。3、6、9在谷子不同組織中的表達量均明顯低于其他基因;家族基因為誘導(dǎo)型表達,即在干旱或強光等誘導(dǎo)條件下,表達量為增強或抑制,存在著不同基因的差異性。
A. 強光誘導(dǎo)葉片2周; B. 強光誘導(dǎo)芽1周; C. 黑暗誘導(dǎo)的地上組織; D. 紅光誘導(dǎo)的地上組織; E. 尿素誘導(dǎo)的根; F. 強光誘導(dǎo)的穗; G. 正常光誘導(dǎo)的根; H.干旱誘導(dǎo)的根。A. Strong light induced leaves for two weeks; B. Strong light for one week; C. Dark induced above-ground tissue; D. Red light induced above-ground tissue; E. Urea induced roots; F. Bright light-induced spikes; G. Normal light-induced roots; H. Drought-induced roots.圖 8 谷子PAL基因在不同誘導(dǎo)下各組織的表達量Fig. 8 Expression of millet PAL gene in various tissues under different induction
由圖9可知,紅光照射下,1、8、5上調(diào)表達,其余基因與對照組相比,表現(xiàn)出不同程度的下降。藍光照射下1、8、10等上調(diào)表達,7與對照組相比無明顯變化。黑暗處理下,1、8、2等上調(diào)表達,其他基因表現(xiàn)為下調(diào),其中6表達量極低。遠紅光照射下,1、8、2、10、5、11等上調(diào)表達。家族基因在不同光質(zhì)照射下表達量變化明顯,說明基因在谷子光形態(tài)建成中發(fā)揮重要作用,1、8為主要成員。
Control. 正常光誘導(dǎo); RL. 紅光誘導(dǎo); BL. 藍光誘導(dǎo); DL. 黑暗誘導(dǎo); FRL. 遠紅光誘導(dǎo)。Control. Normal light induction; RL. Red light induction; BL. Blue light inducation; DL. Dark induction; FEL. Far-red light induction.圖 9 谷子PAL基因在不同光質(zhì)下的表達量Fig. 9 Expression of PAL gene in millet under different light qualities
表 2 PAL蛋白疊加比對Table 2 PAL protein stacking ratio
PAL是與植物抗性相關(guān)的關(guān)鍵酶(孫宇蛟等,2018),對其研究備受關(guān)注,前人已對多物種的基因家族進行了分析,如玉米(鄧路長等,2019)、蘋果(張麗之等,2018)和陸地棉()(楊郁文等,2017)。其中,玉米和陸地棉均含有13個基因,蘋果含有8個家族成員,與本研究中谷子鑒定出11個基因結(jié)果相差不大,說明基因以小基因家族形式存在,在物種分化過程中沒有出現(xiàn)大幅度擴增現(xiàn)象。谷子基因編碼的蛋白中有部分蛋白具有相近的分子量、等電點等,與香蕉(楊會曉等,2019)和青天葵()(黃瓊林等,2016)的研究較一致,說明其編碼的蛋白具有相似的功能。
基因復(fù)制事件是基因家族擴張的主要動力。本研究發(fā)現(xiàn),谷子基因呈簇狀分布,在蘋果(張麗之等,2018)、大豆(候鵬等,2016)、西瓜()(Dong & Shang, 2013)中PAL染色體定位同樣存在簇狀分布現(xiàn)象,其中西瓜12個基因中有7個串聯(lián)排列在4號染色體,2個串聯(lián)排列在7號染色體上,其余單獨排列在染色體2號、3號、8號上,與谷子染色體分布有著高度的相似性,說明在基因家族的擴增中存在串聯(lián)復(fù)制、分散復(fù)制、片段復(fù)制(郭棟等,2019)。共線性分析發(fā)現(xiàn),11個谷子基因家族成員在水稻染色體組中均存在共線性關(guān)系,說明基因在進化過程中保守性較高。
根據(jù)進化樹的拓撲結(jié)構(gòu),谷子PAL蛋白進化樹分為3組,SiPAL7獨自進化為一支,說明SiPAL7與其他成員同源性較低,可能具有不同起源或進化軌跡,本研究結(jié)果與陸地棉(楊郁文等,2017)具有一致性。系譜樹內(nèi)同一進化枝成員基因結(jié)構(gòu)較為一致,具有較高的保守性。但是,Ⅲ組成員7與其他家族成員相比基因結(jié)構(gòu)差異較大,擁有更多的內(nèi)含子數(shù)量,這暗示基因家族具有多樣化的轉(zhuǎn)錄調(diào)控過程?;蚣易宄蓡T結(jié)構(gòu)的差異性可能會影響其功能活性。
啟動子分析發(fā)現(xiàn),基因家族不僅含有大量非生物脅迫元件,而且存在光響應(yīng)、激素響應(yīng)等多種類型元件,不同家族成員所含元件數(shù)量和種類不同,說明基因家族廣泛參與不同生物學調(diào)控過程,不同基因具有其特異調(diào)控模式。
植物在遭受干旱、高溫等脅迫時,會迅速產(chǎn)生大量活性氧(ROS)造成細胞結(jié)構(gòu)損傷。苯丙烷代謝途徑中產(chǎn)生的類黃酮等次生代謝產(chǎn)物,具有清除ROS的抗氧化活性(楊會曉等,2019)。本研究發(fā)現(xiàn),基因家族多為誘導(dǎo)型表達,在受到不同脅迫刺激時,表達量迅速提升,說明基因家族廣泛響應(yīng)不同非生物脅迫,類黃酮等次級代謝產(chǎn)物在非生物脅迫過程中可能具有較高的合成活性。本研究還發(fā)現(xiàn),部分基因具有相似的響應(yīng)模式,說明可能存在功能冗余。光質(zhì)在植株建成、生長發(fā)育過程中具有重要作用。熒光定量分析結(jié)果表明,在不同光照條件下,基因家族差異表達。5在紅光、紅遠光高表達,11在紅遠光高表達等,這些變化說明基因家族在谷子光調(diào)節(jié)途徑中存在復(fù)雜的調(diào)控機制,不同基因存在功能分化。