李朝睿
馬鈴薯基因家族的鑒定與分析
李朝睿
上海交通大學(xué)農(nóng)業(yè)與生物學(xué)院, 上海 200240
為了進一步研究基因家族在馬鈴薯中作用,本研究利用各類基因家族分析軟件對馬鈴薯家族成員進行全基因組鑒定與分析。結(jié)果表明,馬鈴薯家族共包含20個成員,大部分基因都只含有2個內(nèi)含子。19個馬鈴薯成員分布于6條染色體上,有三對重復(fù)基因,其中兩對為重復(fù)串聯(lián)基因,另一對為片段重復(fù)基因。根據(jù)進化關(guān)系和保守結(jié)構(gòu)域分布可以分為ZHD和MIF和UN三個亞家族,同一亞家族成員之間motifs特征相似。組織差異表達表明,幾乎所有的在馬鈴薯中都在葉片中表達。在非生物脅迫中,在干旱(利用甘露醇模擬)和高鹽脅迫下馬鈴薯基因均高表達。本研究進一步揭示了-在馬鈴薯中的保守性和參與馬鈴薯生長與抗逆的潛在功能,為后續(xù)研究奠定基礎(chǔ)。
馬鈴薯; ZF-HD; 基因家族; 生物信息學(xué)
ZF-HD轉(zhuǎn)錄因子(zinc finger homeodomain)是廣泛存在于植物中,進化上相對保守的轉(zhuǎn)錄調(diào)控因子,其命名是因其氨基酸序列中有C2H2型鋅指結(jié)構(gòu)(C2H2-type zinc finger motif)和保守的HD結(jié)構(gòu)域(Homeodomain)[1]。大量研究表明,ZF-HD轉(zhuǎn)錄因子主要參與了植物生長發(fā)育過程以及響應(yīng)非生物脅迫,比如擬南芥AtZHD1蛋白能特異性結(jié)合ERD1啟動子,對鹽和干旱脅迫產(chǎn)生反應(yīng)[2]。大多數(shù)番茄基因在花芽部位表達,其中多個對如高鹽、高溫等非生物脅迫響應(yīng)[3]。值得注意的是,有一類蛋白MIF (mini zinc finger)擁有與ZF-HD蛋白高度相似的ZF結(jié)構(gòu)域序列但缺乏HD結(jié)構(gòu)域,有研究推測MIF蛋白由ZF-HD蛋白丟失HD結(jié)構(gòu)域而形成的[4]。國內(nèi)外有對馬鈴薯的研究都較為深入,但對馬鈴薯基因家族的研究目前還沒有相關(guān)文獻報道。馬鈴薯基因組測序完成于2011年,為馬鈴薯的遺傳學(xué)研究及分子育種提供了非常有價值的資源[5]。本研究利用生物信息學(xué)方法,對馬鈴薯基因家族進行鑒定,對其基因結(jié)構(gòu)、蛋白基本理化特征、與其他植物基因共線性和自身差異表達等進行分析,揭示了馬鈴薯基因家族潛在的生物學(xué)功能。
擬南芥(L.),番茄(L.)和馬鈴薯基因組序列、蛋白質(zhì)序列、CDS序列及其注釋信息均來自Ensamble plant數(shù)據(jù)庫?;虻碾[馬爾科夫模型PF04770下載自Pfam[6]。使用Hmmsearch工具分別搜索馬鈴薯的蛋白質(zhì)數(shù)據(jù)庫獲得候選基因。在線網(wǎng)站ExPasy估計得到蛋白基本信息[7]。使用geneDoc繪制蛋白序列比對圖以確定保守結(jié)構(gòu)域。
利用在線軟件MEME對馬鈴薯ZF-HD蛋白的motif進行預(yù)測和分析[8],用TBtools軟件展示motif的分布[9]。最后通過GSDS工具分析的基因內(nèi)含子與外顯子結(jié)構(gòu)[10]
基因在染色體上的分布圖繪制于Mapchart。利用BLAST序列比對后找到串聯(lián)重復(fù)的基因(相似度>70%的基因)。MEGA 7.0用于擬南芥和馬鈴薯的系統(tǒng)進化分析,MCScanX軟件對馬鈴薯、擬南芥和馬鈴薯、番茄進行物種間的共線性分析。
通過馬鈴薯數(shù)據(jù)庫PGSC上下載馬鈴薯轉(zhuǎn)錄組數(shù)據(jù)(單位為TPM)。篩選出10個馬鈴薯基因在各個組織表達量數(shù)據(jù)并標準化,以及脅迫下表達數(shù)據(jù),利用R語言進行繪制圖。
通過上述方法搜索與鑒定最終在馬鈴薯基因組中鑒定到20個基因。根據(jù)其搜索順序依次命名為-~-。蛋白多序列比對圖顯示所有的ST-ZHD蛋白都有ZF結(jié)構(gòu)(C2H2型)[11],而鑒定出-,-,-缺少HD結(jié)構(gòu)域當屬于MIF亞家族,剩余的-均擁有HD結(jié)構(gòu)域?qū)儆赯HD亞家族[11](圖1)。
圖1 馬鈴薯ZF-HD家族ZF結(jié)構(gòu)域與HD結(jié)構(gòu)域
研究顯示所有成員都有motif3,對比后得到motif3為ZF結(jié)構(gòu)域(圖2D);而MIF亞家族缺少motif5,對比得到motid5為MIF亞家族中所沒有的HD結(jié)構(gòu)域(圖2E);UN亞家族有獨特的motif4。總之,相同亞家族的motif分布模式基本相似,不同亞家族成員之間存在差異,可能與亞家族功能趨異有關(guān)(圖2B)。從基因結(jié)構(gòu)的角度進一步分析基因家族發(fā)現(xiàn),-基因家族中有8個不含有內(nèi)含子,剩余的只含有2個內(nèi)含子(圖2C)。
圖2 馬鈴薯ZF-HD基因家族保守原件與基因結(jié)構(gòu)分析圖
圖3 ZF-HD基因染色體分布和染色體間關(guān)系
注:紅色和黃色分別表示兩對串聯(lián)重復(fù)基因,藍線一對片段重復(fù)基因。Red and yellow represent two pairs of repeatgene, and blue lines repeat thegene.
染色體定位顯示,只有位于細胞器中,其余的位置明確(圖3)?;驈?fù)制在新功能的發(fā)生和基因擴增中起著重要的作用?;蛴腥龑κ侵貜?fù)基因,其中有兩對是來源于串聯(lián)重復(fù),它們均來自ZHD亞家族,而剩下的一對來源于片段重復(fù)且屬于MIF亞家族。
系統(tǒng)發(fā)育分布表明,基因家族可分為3個亞家族,分別為ZHD、MIF和UN。其中大部分的屬于ZHD亞家族和MIF亞家族,它們在進化樹中與擬南芥ZF-HD蛋白交叉分布,說明之間進化關(guān)系緊密。但是有3個被歸為UN亞家族中,它們沒有與擬南芥聚類,說明這是馬鈴薯所特有的,需要進一步研究(圖4)。
圖4 馬鈴薯、擬南芥系統(tǒng)進化樹
圖5 馬鈴薯、擬南芥、番茄共線性分析
為了進一步推斷馬鈴薯與同科的番茄和模式植物擬南芥的系統(tǒng)發(fā)育關(guān)系,建立共線性分析圖。
矩形長條表示染色體,其中綠色為擬南芥,紅色為馬鈴薯,藍色為番茄,紅色線條強調(diào)基因。結(jié)果表明,6個基因與擬南芥基因共線,14個基因與番茄共線。一些基因與擬南芥的兩對同源基因相關(guān)。所有的基因與同科的番茄共線基因均為1:1同源,它們之間可能具有相似功能(圖5)。
為了研究基因的生理功能,通過對10個在馬鈴薯根、莖、葉、花、塊莖等組織中特異性表達分析發(fā)現(xiàn)(圖6),在除在塊莖中,根、莖、葉、花均有表達,而且大多數(shù)基因在葉中高度表達,表明家族成員在控制馬鈴薯葉片生長發(fā)育方面可能具有獨特的功能。
圖6 組織間差異表達圖
圖7 高鹽或干旱處理表達量柱狀圖
利用甘露醇260 μmol·L-1處理24 h模擬干旱脅迫處理后,除了有所下降外,其它所有馬鈴薯基因在高鹽脅迫下表達量上調(diào),特別是表達量顯著(圖7)。濃度為150 mmol·L-1的NaCl溶液處理24 h模擬的高鹽脅迫處理的轉(zhuǎn)錄產(chǎn)物的積累結(jié)果柱狀圖顯示,除、和外其余的表達量上調(diào),且表達量顯著(圖7)。
廣泛的研究表明,基因已經(jīng)在許多陸生植物中被發(fā)現(xiàn),但在藻類中沒有被發(fā)現(xiàn)[12],這類基因可能在在陸生植物間相對保守。本研究在馬鈴薯中鑒定到20個基因進行了分類,蛋白結(jié)構(gòu)域、基因結(jié)構(gòu)、位置分布等進行了分析,驗證了馬鈴薯種內(nèi)-相對保守且存在重要功能。
通過與模式植物擬南芥和同科植物番茄進行共線性分析發(fā)現(xiàn)之間存在同源基因說明了-的種間保守性,推測具有相似功能?;騾⒓又参锷L發(fā)育,例如擬南芥家族成員均主要在擬南芥花卉組織中表達,表明在花發(fā)育期間可能起到調(diào)控作用[13]。而在本研究中,而且大多數(shù)基因在葉中高度表達,這是與擬南芥不相同的,需要進一步研究。在研究的10個中,基因在鹽或干旱脅迫下顯示出相對較高的表達水平,它與的同源性較高。而的過度表達可以增強耐旱性[2],該結(jié)果說明了在植物間功能保守,均有調(diào)節(jié)生長發(fā)育與抗逆的重要作用。
本研究對馬鈴薯中進行了全面分析,為未來馬鈴薯抗脅迫性研究提供了基礎(chǔ)。
[1] Windh?vel A, Hein I, Dabrowa RCharacterization of a novel class of plant homeodomain proteins that bind to the C4 phosphoenolpyruvate carboxylase gene of Flaveria trinervia [J]. Plant Molecular Biology, 2001,45(2):201-14
[2] Tran L, Nakashima K, Sakuma YCo‐expression of the stress‐inducible zinc finger homeodomain ZFHD1 and NAC transcription factors enhances expression of the ERD1 gene in Arabidopsis [J]. The Plant Journal, 2007,49(1):46-63
[3] Khatun K, Nath UK, Robin AHKGenome-wide analysis and expression profiling of zinc finger homeodomain ( ZHD ) family genes reveal likely roles in organ development and stress responses in tomato [J]. BMC Genomics, 2017,18(1):1-16
[4] Wei H, Depamphilis CW, Hong MPhylogenetic Analysis of the Plant-specific Zinc Finger-Homeobox and Mini Zinc Finger Gene Families [J]. Journal of Integrative Plant Biology, 2008,50(8):1031-1045
[5] Xu X, Pan S, Cheng SGenome sequence and analysis of the tuber crop potato [J]. Nature, 2011,475(7355):189-195
[6] Finn RD, Penelope C, Eberhardt RYThe Pfam protein families database: towards a more sustainable future [J]. Nucleic Acids Research, 2016(D1):D279-D85
[7] Appel RD,Bairoch A, Hochstrasser DF,A new generation of information retrieval tools for biologists: the example of the ExPASy WWW server [J]. Trends in Biochemical Sciences, 1994,19(6):258-260
[8] Bailey TL, Boden M, Buske FAMEME Suite: tools for motif discovery and searching [J]. Nucleic Acids Research, 2009, 37(Web Server issue):W202-W208.
[9] Chen CJ, Xia R, Chen HTBtools, a Toolkit for Biologists integrating various HTS-data handling tools with a user-friendly interface [J/OL]. Molecular Plant. doi:10.1016/j.molp.2020.06.009
[10] Hu B, Jin J, Guo AYGSDS 2.0: an upgraded gene feature visualization server [J]. Bioinformatics, 2015,31(8):1296-1297
[11] Krishna SS, Majumdar I, Grishin NVStructural classification of zinc fingers: survey and summary [J]. Nucleic Acids Research, 2003,31(2):532-550
[12] Wang WL, Wu P, Li Y,Genome-wide analysis and expression patterns of ZF-HD transcription factors under different developmental tissues and abiotic stresses in Chinese cabbage [J/OL]. Molecular Genetics & Genomics. doi:10.1007/s00438-015-0036-1
[13] Tan QKG, Irish VF. The Arabidopsis zinc finger-homeodomain genes encode proteins with unique biochemical properties that are coordinately expressed during floral development [J]. Plant Physiology, 2006,140(3):1095-1108
Identification and Analysis ofGene Family in Potato
LI Chao-rui
200240,
For further investigation ofgene family in potato, genome-wide identification and analysis of potatofamily members were done by all kinds of gene family analysis software. It turns that there are 20 members of the potatofamily, in which most of genes contain only two introns. 19 members of the potatogene are found on 6 chromosomes and there are three pairs of repeat genes. Two of them are repeat tandem genes and the other is fragment repeat genes. Three subfamilies can be divided into ZHD, MIF and UN according to evolutionary relationship and conserved domain distribution and the members among the same subfamily have similar motifs. Organizational difference expression indicates that most of the potatoesgenes are expressed in leafs. In abiotic stress, High expression ofgenes under drought (mannitol simulation) and high salt stress. This study further reveals the conservatism of-in potatoes and the potential function of participating in potato growth and inversion resistance, laying the foundation for subsequent research.
Potato; ZF-HD; gene family; bioinformatics
S662.1
A
1000-2324(2021)03-0384-04
2020-10-14
2020-11-23
李朝睿(2000-),男,本科,主要研究方向為植物科學(xué)與技術(shù). E-mail:lichaorui30@163.com