李 彤 楊晶晶
(1 蘭州財經(jīng)大學農(nóng)林經(jīng)濟管理學院,甘肅蘭州 730101;2 甘肅農(nóng)業(yè)大學園藝學院,甘肅蘭州 730070)
阿拉伯半乳糖蛋白(arabinogalactan proteins,AGPs)是高等植物中重要的一類糖蛋白,廣泛存在于細胞壁、質(zhì)膜和細胞外基質(zhì)中,在細胞增殖與生長、細胞分化、細胞程序性死亡、體細胞胚胎發(fā)生、花藥發(fā)育與花粉管生長、合子分裂和胚胎發(fā)育等過程中發(fā)揮重要作用(Gaspar et al.,2001;馬浩力 等,2015)。類成束阿拉伯半乳糖蛋白(fasciclinlike arabinogalactan proteins,F(xiàn)LAs)家族是AGPs家族的一個亞家族,除了含有類AGP 的糖基化區(qū)域,還含有1~2 個具有粘附作用的類成束蛋白(fasciclin-like,F(xiàn)AS)結(jié)構(gòu)域(Johnson et al.,2003;鐘靜 等,2017)。
FLA 基因家族成員參與植物多種生命活動,在植物的生長發(fā)育過程中發(fā)揮著重要的調(diào)控作用(卞坤 等,2017)。在擬南芥中,突變體植株表現(xiàn)出側(cè)根數(shù)目增加,根和葉片的再生能力減弱,表明在根的發(fā)育和細胞分化過程起重要作用(Johnson et al.,2011);基因在小孢子發(fā)育過程中,尤其是在花粉細胞壁發(fā)育過程中起重要作用(Li et al.,2010);具有FLA4 H2 區(qū)氨基酸替換的鹽過度敏感突變體植株在一定鹽離子濃度下表現(xiàn)出根表皮細胞異常膨脹,根長變短,表明與鹽離子耐受性和細胞膨脹有關,并且能與ABA 協(xié)同作用參與ABA 信號通路調(diào)控,從而影響根的發(fā)育(Johnson et al.,2003);與與次生細胞壁發(fā)育有關,與的雙突變體莖機械強度下降,具體表現(xiàn)為:細胞壁中纖維素、阿拉伯糖和半乳糖含量減少(MacMillan et al.,2010)。在棉花的纖維細胞中,基因大量表達,參與棉纖維的發(fā)生和伸長,且過量表達可導致棉花纖維的長度增加(Huang et al.,2008,2013)。
FLA基因家族廣泛分布在植物組織和細胞中,目前已在擬南芥()(Johnson et al.,2003)、水稻()(Ma &Zhao,2010)、小 麥()(Faik et al.,2006)等植物中鑒定出基因?,F(xiàn)已發(fā)現(xiàn)擬南芥中有21 個基因,水稻中有27 個基因,棉花中有19 個基因,小麥中有34 個基因。植物中FLA 基因家族的挖掘,對深入了解基因的生物學功能及促進植物生產(chǎn)具有重要意義,但在辣椒(L.)中還鮮見關于FLA 基因家族成員的報道。因此,本試驗采用生物信息學分析的方法,對辣椒基因組中FLA 基因家族成員進行全面鑒定,包括對其蛋白質(zhì)理化性質(zhì)、系統(tǒng)進化樹、保守基序、基因結(jié)構(gòu)、染色體定位及啟動子順式作用元件等進行分析,旨在揭示辣椒FLA 基因家族成員的數(shù)量、結(jié)構(gòu)和進化特點,進一步為該家族成員的功能研究提供理論依據(jù)。
根據(jù)已報道的擬南芥FLA 基因家族的序列號,在擬南芥基因組數(shù)據(jù)庫TAIR(http://www.arabidopsis.org)下載得到21 條FLAs 蛋白序列作為探針序列,并在茄科植物基因組數(shù)據(jù)庫(sol genomics network,SGN)中的辣椒品種遵辣1 號基因組(Qin et al.,2014)數(shù)據(jù)庫進行BLASTP(evalue <l),獲得同源的辣椒候選基因(Schultz et al.,2002;Fernandez-Pozo et al.,2015)。然后利用Pfam〔Pfam:Home page(xfam.org)〕 和SMART〔SMART:Main page(emblheidelberg.de)〕數(shù)據(jù)庫鑒定候選基因是否含有FAS結(jié)構(gòu)域,刪除冗余的基因,進而確定辣椒FLA 基因家族成員(El-Gebali et al.,2019;Letunic et al.,2021)。最后利用在線網(wǎng)站ProtParam(http://web.expasy.org/protparam/)分析辣椒FLA 基因家族成員編碼的蛋白質(zhì)序列長度、分子量及等電點等理化性質(zhì)(Wilkins et al.,1999),利用Euk-mPLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/)進行亞細胞定位預測(Chou &Shen,2010)。
利用MEGA-X 構(gòu)建辣椒和擬南芥FLAs 蛋白序列的系統(tǒng)進化樹,序列比對方法為MUSCLE,構(gòu)建方法為鄰接法(neighbor-joining,NJ),Bootstrap的重復次數(shù)設置為1 000,剩余設置選擇默認選項,然后利用在線網(wǎng)站Evolview(https://evolgenius.info/evolview-v2)對進化樹進行可視化(Saitou &Nei,1987;He et al.,2016;Kumar et al.,2018)。利用MEME 5.2.0〔MEME-Submission form(memesuite.org)〕軟件分析辣椒FLAs 蛋白保守基序,參數(shù)設置模體基序長度最小為15 aa,最大為150 aa,保守序列數(shù)目最大為10(Bailey et al.,2015)。于在 線 網(wǎng) 站GSDS 2.0(http://gsds.gao-lab.org/index.php)中輸入辣椒FLAs 蛋白的基因序列和編碼序列(coding sequence,CDS),獲得辣椒的基因結(jié)構(gòu)(Hu et al.,2015)。通過TBtools 提取辣椒各條染色的總長,再依據(jù)辣椒FLA 基因家族的起始位置,利用Mapchart 2.3 進行染色體定位分析及作圖(Voorrips,2002;Chen et al.,2020)。
利用TBtools v1.082 工具提取辣椒編碼序列的起始密碼子上游2 000 bp 序列,利用PlantCARE 預測辣椒順式作用元件,結(jié)果用TBtools v1.082進行可視化(Rombauts et al.,1999;Chen et al.,2020)。
通過BLASTP 從辣椒全基因組中獲得25 個辣椒FLAs基因家族成員,命名為~。理化性質(zhì)分析結(jié)果表明(表1),25 個都含有1~2 個FLA 基因家族特有的FAS 結(jié)構(gòu)域,其中、、、、、、包含2 個FAS 結(jié)構(gòu)域,表明25 個基因均為辣椒的FLA 基因家族成員;CaFLAs 的蛋白長度在201~449 aa 之間,平均長度為328 aa;CaFLAs 蛋白分子量在20.73~49.14 kDa 之間;蛋白理論等電點在4.44~8.74 之間,大多數(shù)為酸性蛋白。亞細胞定位分析結(jié)果顯示,辣椒FLA 基因家族中除編碼的蛋白既定位在質(zhì)膜又定位在細胞核外,其余均定位于質(zhì)膜。
表1 辣椒FLA 基因家族成員基本特征
如圖1 所示,辣椒和擬南芥的FLAs 蛋白在蛋白序列上相對保守,且大多數(shù)Boostrap 大于70,表明FLAs 在辣椒和擬南芥進化過程中相對保守。25 個CaFLAs 蛋白被分為3 個亞家族,其中CaFLA4、CaFLA6、CaFLA7、CaFLA8、CaFLA9、CaFLA10、CaFLA12、CaFLA15、CaFLA16 和CaFLA19 進化關系較近,聚為第一亞族(Group1);CaFLA2、CaFLA11、CaFLA13、CaFLA14、CaFLA17、CaFLA18、CaFLA20、CaFLA21、CaFLA22、CaFLA23 和CaFLA24 聚為第二亞族(Group2);CaFLA1、CaFLA3、CaFLA5和CaFLA25 聚為第三亞族(Group3)。CaFLA3/CaFLA5、AtFLA3/AtFLA7、AtFLA5/AtFLA14、CaFLA2/CaFLA13、CaFLA8/CaFLA10、CaFLA12/CaFLA16、CaFLA15/CaFLA19、AtFLA4/CaFLA4、AtFLA2/AtFLA11、CaFLA6/CaFLA7是直系同源對,且Boostrap 為100,表明兩者在蛋白結(jié)構(gòu)方面相似。
圖1 辣椒和擬南芥FLAs 蛋白的系統(tǒng)進化樹
利用MEME 5.2.0 在線軟件對辣椒25 個CaFLAs 蛋白進行保守基序分析,結(jié)果如圖2 所示。位于同一亞族的CaFLAs 蛋白具有相同的保守基序,如位于第一亞族的CaFLA4、CaFLA6、CaFLA7、CaFLA12、CaFLA15、CaFLA16、CaFLA19 都 含 有motif3、motif4、motif7、motif9基序,位于第二亞族的CaFLA2、CaFLA11、CaFLA13、CaFLA14、CaFLA17、CaFLA18、CaFLA20、CaFLA21、CaFLA22、CaFLA23 都含有motif1、motif2、motif3、motif5、motif10 基序,位于第三亞族的CaFLA1、CaFLA3、CaFLA5 都含有motif5 基序。經(jīng)Pfam 比對可知,motif1、motif2、motif3、motif4、motif5、motif7、motif8、motif9、motif10 是FAS 結(jié)構(gòu)域的一部分。同一亞族包含相同的保守基序,表明辣椒FLA 基因家族在遺傳進化上是相對保守的。
圖2 辣椒FLAs 蛋白的保守基序分析
利用GSDS 2.0 在線網(wǎng)站對25 個基因進行基因結(jié)構(gòu)分析,結(jié)果如圖3 所示。有20 個辣椒FLA 基因家族成員不含內(nèi)含子,其余成員(、、、和)只含有1 個內(nèi)含子,表明位于同一亞族的基因具有相似的基因結(jié)構(gòu)。
圖3 辣椒FLA 基因家族成員基因結(jié)構(gòu)分析
利用Mapchart 2.3 對25 個基因進行染色體定位,結(jié)果如圖4 所示。25 個基因分別定位在0、1、3、6、7、9、10、11 號和12 號染色體上,在9 條染色體上不均勻分布,其中10 號染色體分布密度最高,分布了5 個基因;11 號和12 號染色體分布密度最低,僅存在1 個基因,其他染色體分布了2~4 個基因。
圖4 辣椒FLA 基因家族成員染色體定位
辣椒啟動子區(qū)域的順式作用元件分析結(jié)果如圖5 所示,25 個均擁有響應逆境脅迫的順式作用元件,共含有17 種,其中分布最廣的是光響應元件(light responsiveness),在25個中均有發(fā)現(xiàn);分布較廣的是厭氧脅迫響應元件(anaerobic induction),在20 個中被發(fā)現(xiàn);其次是赤霉素響應元件(gibberellin responsiveness),在14 個中被發(fā)現(xiàn)。脫落酸響應元件(abscisic acid responsiveness)、生長素響應元件(auxin responsiveness)、防御與脅迫響應元件(defense and stress responsiveness)、低溫響應元件(low temperature responsiveness)、茉莉酸甲酯響應元件(MeJA responsiveness)、分生組織表達元件(meristem expression)、干旱誘導的MYB 結(jié)合位點元件(MYB in drought)、水楊酸響應元件(salicylic acid responsiveness)、玉米醇溶蛋白代謝調(diào)節(jié)元件(zein metabolism regulation)、晝夜節(jié)律元件(circadian control)、缺氧特異性誘導元件(anoxic specific inducibility)、損傷響應元件(wound responsiveess)、胚乳表達元件(endosperm expression)、類黃酮生物合成的MYB 結(jié)合位點元件(MYB in flavonoid biosynthesis)不均一地分布在各個亞族的少數(shù)啟動子上。表明辣椒基因參與辣椒的激素應答、脅迫響應(干旱、低溫)、光響應等生物學過程。
圖5 辣椒FLAs 基因啟動子順式作用元件分析結(jié)果
本試驗在辣椒中共鑒定出25 個基因,與擬南芥(21 個)(Johnson et al.,2003)、水稻(27個)(Ma &Zhao,2010)相比,F(xiàn)LA 基因家族成員相差不大,表明在物種進化過程中是相對保守的。對其理化性質(zhì)的分析結(jié)果顯示,辣椒FLA基因家族成員都含有1~2 個FLA 基因家族特有的FAS 結(jié)構(gòu)域;CaFLAs 蛋白等電點在4.44~8.74 之間,多數(shù)為酸性蛋白;絕大多數(shù)CaFLAs 蛋白定位在質(zhì)膜上,這可能與FLAs 參與細胞間信號轉(zhuǎn)導有關(Wang et al.,2015;鐘靜 等,2017)。系統(tǒng)進化分析結(jié)果顯示,辣椒和擬南芥FLAs 蛋白被聚類在3 個獨立的進化分支中,每個進化分支中都有辣椒和擬南芥FLAs 的分布,表明該家族成員可能擁有共同的祖先。
利用MEME 5.2.0 在線軟件分析得出,辣椒FLA 基因家族共有10 個保守基序,各基因中都有分布,屬于高保守基序;研究發(fā)現(xiàn)不同亞族之間保守基序的相似性與亞族間的系譜進化密切相關,辣椒FLA 基因家族各亞族保守基序基本相同,表明辣椒FLA 基因家族在進化過程中具有高度保守性(黎幫勇 等,2015)。通過啟動子順式作用元件分析可知,辣椒啟動子含有多種激素響應、逆境脅迫響應、光響應和植物生長發(fā)育相關的順式作用元件,表明其可能具有較為廣泛的生物學功能,可能參與多種生物代謝過程(郝小聰 等,2019)。值得注意的是,與激素響應有關的順式作用元件幾乎分布在所有的辣椒基因啟動子中,表明辣椒FLA 基因家族可能參與辣椒生長和發(fā)育的許多過程,類似于其在擬南芥中的作用(馬浩力 等,2015)。