国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

二倍體棉花熱激轉(zhuǎn)錄因子HSFs家族全基因組生物信息學(xué)分析

2017-11-30 08:17:30張華崇閆振華趙樹琪黃曉莉戴寶生李蔚
江蘇農(nóng)業(yè)科學(xué) 2017年20期
關(guān)鍵詞:生物信息學(xué)

張華崇+閆振華+趙樹琪+黃曉莉+戴寶生+李蔚

摘要:熱激因子(heat shock factors,HSFs)是生物體內(nèi)調(diào)節(jié)熱激應(yīng)答的一類轉(zhuǎn)錄因子,在熱脅迫信號轉(zhuǎn)導(dǎo)和耐熱性的產(chǎn)生過程中發(fā)揮了重要的作用。從已釋放的二倍體亞洲棉和雷蒙德氏棉全基因組測序結(jié)果中分別鑒定到42個和40個HSFs蛋白家族成員,運用生物信息學(xué)分析其序列特征、亞細(xì)胞定位、聚類分析和保守基序等。結(jié)果表明,亞洲棉HSFs蛋白長度116~526個氨基酸,分子量13 748.4~60 028.2 u,等電點4.40~8.75;雷蒙德氏棉HSFs蛋白長度為190~528個氨基酸,分子量21 993.0~60 413.6 u,等電點4.36~9.50。染色體定位顯示二倍體棉花中的HSFs基因不均勻分布在13條染色體上;聚類分析表明,HSFs蛋白序列分為A、B、C 3類,每一亞類中二倍體棉花與擬南芥的蛋白具有較高的同源性,趨向于聚集在一起,且每個亞組具有相同或相似的保守基序類型及排列順序。

關(guān)鍵詞:二倍體棉花;熱激轉(zhuǎn)錄因子;全基因組;生物信息學(xué)

中圖分類號: Q755 文獻(xiàn)標(biāo)志碼: A 文章編號:1002-1302(2017)20-0035-08

熱激因子(heat shock factors,HSFs)是生物體內(nèi)調(diào)節(jié)熱激應(yīng)答的一類轉(zhuǎn)錄因子,在熱脅迫信號轉(zhuǎn)導(dǎo)和耐熱性的產(chǎn)生過程中發(fā)揮了重要的作用[1-2]。1988年,HSFs基因首先在酵母中發(fā)現(xiàn)[3],植物中的HSFs基因最先在番茄中克隆獲得[4]。典型的熱激轉(zhuǎn)錄因子一般包括4個部分:N端的DNA結(jié)合域(DNA binding domain,DBD)、寡聚化結(jié)構(gòu)域(HR-A/B)、細(xì)胞核定位信號(Nuclear localization signal,NLS)、細(xì)胞核輸出信號(Nuclear export signal,NES),少數(shù)還具有一個C端激活域(Cterminal activation domain,CTAD)[5]。位于HSFs基因N端的DBD中含有一個螺旋-轉(zhuǎn)角-螺旋的疏水結(jié)構(gòu),能特異地結(jié)合熱激元件(heat stress element,HSE),誘導(dǎo)下游熱激蛋白表達(dá)[6-7]。HR-A/B含有2個疏水七肽重復(fù)區(qū)域A和B,通過形成卷曲螺旋結(jié)構(gòu)促使HSFs形成同源三聚體,根據(jù)保守DBD和HR-A/B區(qū)的結(jié)構(gòu)特點,熱激轉(zhuǎn)錄因子又可以分為A、B、C 3類[8-9],在A 類、C類基因中,HR-A/B中A、B結(jié)構(gòu)域之間分別有21個和7個氨基酸插入;在B類基因中,無氨基酸殘基插入[6,10]。NLS和NES含有一簇堿性氨基酸殘基,與HSFs蛋白家族的亞細(xì)胞定位相關(guān)[11-12]。CTAD以芳族的、大的疏水的及酸性的氨基酸(AHA)基元為特征,在A類基因中含特有激活HSFs功能的AHA基元[6]。

棉花是喜溫植物,適當(dāng)高溫可加快棉株生長發(fā)育,但長時間的高溫嚴(yán)重影響花粉發(fā)育、授粉和受精,對棉花產(chǎn)量和品質(zhì)產(chǎn)生不利的影響。隨著全球氣候的變暖,棉花的耐高溫育種顯得尤其重要。本研究利用已釋放的二倍體亞洲棉和雷蒙德氏棉全基因組測序結(jié)果[13-14],通過生物信息學(xué)技術(shù)掃描全基因組HSFs,進(jìn)一步分析其進(jìn)化關(guān)系、亞細(xì)胞定位、理化性質(zhì)預(yù)測和保守基序等,為下一步的選育耐高溫新品種提供理論基礎(chǔ)。

1 材料與方法

1.1 全基因組檢索HSF基因

HSF基因的結(jié)構(gòu)域信息(PF00447)下載自Pfam數(shù)據(jù)庫[15],利用軟件HMMER3.1b2[16]在Cottongen(https://www.cottongen.org/)數(shù)據(jù)庫中檢索二倍體亞洲棉和雷蒙德氏棉HSFs基因家族氨基酸序列,經(jīng)Smart網(wǎng)站[17](http://smart.embl-heidelberg.de/smart/set_mode.cgi?NORMAL=1)進(jìn)一步結(jié)構(gòu)域預(yù)測確認(rèn)。

擬南芥HSF基因家族氨基酸序列來自PlantTFDB(http://planttfdb.cbi.pku.edu.cn/)數(shù)據(jù)庫[18]。

1.2 理化性質(zhì)預(yù)測

通過ExPASy網(wǎng)站中的程序Protparam(http://web.expasy.org/protparam/)對HSFs蛋白家族蛋白分子量、等電點等基本理化性質(zhì)進(jìn)行預(yù)測分析。

1.3 亞細(xì)胞定位

利用在線軟件WOLF PSORT(http://www.genscript.com/wolf-psort.html),以及在線網(wǎng)站Soft Berry(http://linux1.softberry.com/berry.phtml)中的PROTCOMP 程序共同對HSFs蛋白家族進(jìn)行亞細(xì)胞定位預(yù)測分析。

1.4 聚類分析

利用生物信息學(xué)軟件MEGA5.2對鑒定的二倍體棉花中的HSFs蛋白家族和擬南芥中的HSFs蛋白家族進(jìn)行多重序列比對,采用鄰接法構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)行1 000次重復(fù)。

1.5 基序分析

利用MEME軟件分析HSFs蛋白家族的motif類型和順序。具體參數(shù)設(shè)置如下:預(yù)測數(shù)10,其他參數(shù)為默認(rèn)。

2 結(jié)果與分析

2.1 棉花HSF基因家族鑒定

利用結(jié)構(gòu)域預(yù)測得到的結(jié)構(gòu)域信息(PF00447),通過對二倍體棉花全基因組搜索,發(fā)現(xiàn)亞洲棉和雷蒙德氏棉分別有42條和40條具有典型HSF結(jié)構(gòu)域蛋白,并統(tǒng)計了其蛋白號、蛋白長度及對應(yīng)基因所在的染色體(表1),結(jié)果顯示,亞洲棉HSFs蛋白長度為116~526個氨基酸不等;雷蒙德氏棉HSFs蛋白長度為190~528個氨基酸不等。亞洲棉基因組中的42個HSFs基因家族成員不均勻分布在13條染色體上,其中,A11號染色體分布最多,為8個;A6號染色體分布最少,為1個。雷蒙德氏棉基因組中的40個HSFs基因家族成員也不均勻分布在13條染色體上,其中,D3、D4和D6號染色體分布最多,均為5個;D1、D2和D12號染色體分布最少,均為1個。endprint

2.2 棉花HSFs蛋白家族理化性質(zhì)預(yù)測

利用在線網(wǎng)站對二倍體棉花HSFs蛋白家族理化性質(zhì)進(jìn)行了預(yù)測(表1),預(yù)測結(jié)果,二倍體棉花中HSFs蛋白分子量存在較大差異。其中,亞洲棉中分子量最大的是Cotton_A_14557,達(dá)到了60 028.2 u,分子量最小的是Cotton_A_24993,為13 748.4 u;雷蒙德氏棉中分子量最大的是Gorai.004G284200,為60 413.6 u,分子量最小的是Gorai.006G087100,為21 993.0 u。等電點變化范圍也比較大,其中,亞洲棉中Cotton_A_01784等電點最大,為8.75,Cotton_A_00864最小,為4.40;雷蒙德氏棉中Gorai.006G125000等電點最大,為9.50,Gorai.008G170800最小,為4.36,表明HSFs蛋白家族從酸性到堿性都有分布。

2.3 棉花HSFs蛋白家族亞細(xì)胞定位

為了了解HSFs蛋白家族發(fā)揮功能的區(qū)域,利用2種亞細(xì)胞定位軟件預(yù)測了二倍體棉花HSFs蛋白家族亞細(xì)胞定位(表2),結(jié)果表明,2種軟件WoLF PSORT和Protcomp預(yù)測結(jié)果類似,大部分HSFs蛋白家族定位于細(xì)胞核。根據(jù)軟件WoLF PSORT預(yù)測發(fā)現(xiàn),HSFs蛋白家族定位于1~4個位置不等,但除亞洲棉中Cotton_A_24993和除了雷蒙德氏棉中Gorai.006G087100分別定位于葉綠體和細(xì)胞質(zhì)外,其余HSFs蛋白家族定位于細(xì)胞核分值最高;根據(jù)Protcomp預(yù)測發(fā)現(xiàn),除了雷蒙德氏棉中Gorai.004G284200定位于細(xì)胞質(zhì)中,其余HSFs蛋白家族均定位于細(xì)胞核。綜上所述,二倍體棉花的HSFs蛋白家族中至少有一種預(yù)測定位于細(xì)胞核,這符合轉(zhuǎn)錄因子在細(xì)胞核中調(diào)控基因表達(dá)的作用特點。

2.4 棉花HSFs蛋白家族聚類分析

為了揭示二倍體棉花HSFs蛋白家族的進(jìn)化關(guān)系,將亞洲棉和雷蒙德氏棉的42條和40條HSFs蛋白,與下載的21條擬南芥HSFs蛋白家族進(jìn)行聚類分析(圖1)。結(jié)果顯示,103條HSFs蛋白序列分為了A、B、C 3類,其中A類含有9個亞類(A1、A2、A3、A4、A5、A6、A7、A8、A9),二倍體棉花都不含有A7亞類,每一亞類中二倍體棉花與擬南芥的蛋白具有較高的同源性,趨向于聚集在一起,例如,雷蒙德氏棉 Gorai.008G170800、Gorai.N013300和亞洲棉Cotton_A_25561、Cotton_A_00864、Cotton_A_24993與擬南芥中的HSF蛋白AT1G67970(AtHsfA8a)互為同源蛋白而聚集在一起。B類含有5個亞類(B1、B2、B3、B4、B5),且二倍體棉花中完整地含有5個亞類,而擬南芥不含有亞類B5。C類中只有1個亞類C1,且二倍體棉花和擬南芥中都存在。此外,不同亞類HSF蛋白雖聚集在一起,但二倍體棉花與擬南芥卻趨向于形成不同的分枝,且亞洲棉中存在與雷蒙德氏棉同源的HSF蛋白(除Cotton_A_24993和Cotton_A_22025)。

2.5 棉花HSFs蛋白家族基序分析

對二倍體棉花82個HSFs蛋白家族保守基序的分析結(jié)果見圖2,82個HSFs蛋白家族含有10個保守基序,長度為11~50個氨基酸。進(jìn)一步分析10個保守基序在不同亞組HSFs蛋白中的分布(圖3), 結(jié)果表明, HSFs蛋白家族含有保守基序個數(shù)從2~8個不等,每個亞組具有相同或相似的保守基序類型及排列順序。例如,A1亞類Gorai.003G053300、Gorai.003G183900、Gorai.007G033300、Gorai.004G257000、Gorai.008G225200、Gorai.013G183500、Cotton_A_02851、Cotton_A_05732、Cotton_A_23520、Cotton_A_07921、Cotton_A_33386和Cotton_A_09182具有相似的基序(7~8個),也具有相似的排列順序。

3 討論

在全球氣候變暖的環(huán)境下, 高溫對棉花的正常生長發(fā)育產(chǎn)生了不利的影響,常常誘使棉葉凋萎,花粉失水干縮,蕾鈴大量脫落[19]。HSFs是植物響應(yīng)熱激脅迫保護(hù)自身免受高溫傷害的一類轉(zhuǎn)錄因子,研究發(fā)現(xiàn)擬南芥、水稻、大豆中分別有21、25、52個HSFs[20-22]。本研究基于二倍體棉花雷蒙德氏棉和亞洲棉測序的完成,通過全基因組進(jìn)行搜索分析,亞洲棉和雷蒙德氏棉分別鑒定出42個和40個具有典型HSF結(jié)構(gòu)域蛋白,Wang等利用表達(dá)序列標(biāo)簽組裝和全基因組分析技術(shù)在陸地棉D(zhuǎn)亞組中也鑒定得到40個HSFs基因[9]。本研究中HSFs蛋白家族分為A、B、C 3類,每類含有的HSF數(shù)目不同,理化性質(zhì)也存在較大差異,且不均勻地分布在不同染色體上,表明二倍體棉花HSFs蛋白家族存在廣泛的多樣性,這也為功能的多樣性奠定了基礎(chǔ)。

HSFs作為一類轉(zhuǎn)錄因子,要通過調(diào)控相關(guān)基因的表達(dá)行使功能,其表達(dá)模式有組成型表達(dá)和誘導(dǎo)型表達(dá)2類,廣泛參與植物響應(yīng)高溫、干旱和氧化等多種逆境脅迫[23-25]。雖然在模式植物擬南芥和番茄中的研究較為詳盡,擬南芥AtHSFA2基因過表達(dá)顯著提高了轉(zhuǎn)基因擬南芥耐熱性[26-27],而敲除AtHSFA2基因抑制了下游熱激蛋白基因的表達(dá),明顯提高了擬南芥對高溫敏感性[28-29]。棉花中關(guān)于HSFs研究的報道還很少,相關(guān)研究表明,陸地棉中HSFs基因在響應(yīng)高溫和纖維發(fā)育過程中發(fā)揮重要作用[9]。但HSFs表達(dá)調(diào)控機制尤其是上游調(diào)控機制,不同HSFs基因在響應(yīng)同一外界刺激和同一HSFs基因在不同逆境脅迫中是否存在保守的信號轉(zhuǎn)導(dǎo)途徑等等,還有待進(jìn)一步研究闡明。

參考文獻(xiàn):

[1]Morimoto R I. Regulation of the heat shock transcriptional response:cross talk between a family of heat shock factors,molecular chaperones,and negative regulators[J]. Genes & Development,1998,12(24):3788-3796.endprint

[2]Baniwal S K,Bharti K,Chan K Y,et al. Heat stress response in plants:a complex game with chaperones and more than twenty heat stress transcription factors[J]. Journal of Biosciences,2004,29(4):471-487.

[3]Wiederrecht G,Seto D,Parker C S. Isolation of the gene encoding the S. cerevisiae heat shock transcription factor[J]. Cell,1988,54(6):841-853.

[4]Scharf K D,Rose S,Zott W,et al. Three tomato genes code for heat stress transcription factors with a region of remarkable homology to the DNA-binding domain of the yeast HSF[J]. Embo Journal,1990,9(13):4495-4501.

[5]Hübel A,Schffl F. Arabidopsis heat shock factor:isolation and characterization of the gene and the recombinant protein[J]. Plant Molecular Biology,1994,26(1):353-362.

[6]Scharf K D,Berberich T,Ebersberger I,et al. The plant heat stress transcription factor (Hsf) family:structure,function and evolution[J]. Biochimica Et Biophysica Acta,2012,1819(2):104-119.

[7]Sakurai H,Enoki Y. Novel aspects of heat shock factors:DNA recognition,chromatin modulation and gene expression[J]. FEBS Journal,2010,277(20):4140-4149.

[8]Kotak S,Port M,Ganguli A,et al. Characterization of C-terminal domains of Arabidopsis heat stress transcription factors (Hsfs) and identification of a new signature combination of plant class A Hsfs with AHA and NES motifs essential for activator function and intracellular localization[J]. The Plant Journal,2004,39(1):98-112.

[9]Wang J,Sun N,Deng T,et al. Genome-wide cloning,identification,classification and functional analysis of cotton heat shock transcription factors in cotton (Gossypium hirsutum)[J]. BMC Genomics,2014,15(1):961.

[10]Harrison C J,Bohm A A,Nelson H C. Crystal structure of the DNA binding domain of the heat shock transcription factor[J]. Science,1994,263(5144):224-227.

[11]Grlich D,Kutay U. Transport between the cell nucleus and the cytoplasm[J]. Annual Review of Cell and Developmental Biology,1999,15:607-660.

[12]Heerklotz D,Dring P,Bonzelius F,et al. The balance of nuclear import and export determines the intracellular distribution and function of tomato heat stress transcription factor HsfA2[J]. Molecular and Cellular Biology,2001,21(5):1759-1768.

[13]Li F,F(xiàn)an G,Wang K,et al. Genome sequence of the cultivated cotton Gossypium arboreum[J]. Nature Genetics,2014,46(6):567-572.

[14]Wang K,Wang Z,Li F,et al. The draft genome of a diploid cotton Gossypium raimondii[J]. Nature Genetics,2012,44(10):1098-1103.endprint

[15]Finn R D,Coggill P,Eberhardt R Y,et al. The Pfam protein families database:towards a more sustainable future[J]. Nucleic Acids Research,2016,44(D1):279-285.

[16]Finn R D,Clements J,Eddy S R. HMMER web server:interactive sequence similarity searching[J]. Nucleic Acids Research,2011,39:29-37.

[17]Schultz J,Milpetz F,Bork P,et al. SMART,a simple modular architecture research tool:identification of signaling domains[J]. Proceedings of the National Academy of Sciences of the United States of America,1998,95(11):5857-5864.

[18]Jin J,He K,Tang X,et al. An Arabidopsis transcriptional regulatory map reveals distinct functional and evolutionary features of novel transcription factors[J]. Molecular Biology and Evolution,2015,32(7):1767-1773.

[19]阿布力孜,開賽爾,阿吉古麗,等. 干熱風(fēng)對棉花生長發(fā)育的危害及對策建議[J]. 農(nóng)業(yè)科技通訊,2009(10):68-69.

[20]Nover L,Bharti K,Dring P,et al. Arabidopsis and the heat stress transcription factor world:how many heat stress transcription factors do we need?[J]. Cell Stress & Chaperones,2001,6(3):177-189.

[21]Guo J,Wu J,Ji Q,et al. Genome-wide analysis of heat shock transcription factor families in rice and Arabidopsis[J]. Journal of Genetics and Genomics,2008,35(2):105-118.

[22]Chung E,Kim K M,Lee J H. Genome-wide analysis and molecular characterization of heat shock transcription factor family in Glycine max[J]. Journal of Genetics and Genomics,2013,40(3):127-135.

[23]Storozhenko S,De Pauw P,Van Montagu M,et al. The heat-shock element is a functional component of the Arabidopsis APX1 gene promoter[J]. Plant Physiology,1998,118(3):1005-1014.

[24]Panchuk I I,Volkov R A,Schffl F. Heat stress-and heat shock transcription factor-dependent expression and activity of ascorbate peroxidase in Arabidopsis[J]. Plant Physiology,2002,129(2):838-853.

[25]Panikulangara T J,Eggers-Schumacher G,Wunderlich M,et al. Galactinol synthase 1. A novel heat shock factor target gene responsible for heat-induced synthesis of raffinose family oligosaccharides in Arabidopsis[J]. Plant Physiology,2004,136(2):3148-3158.

[26]Nishizawa A,Yabuta Y,Yoshida E,et al. Arabidopsis heat shock transcription factor A2 as a key regulator in response to several types of environmental stress[J]. The Plant Journal,2006,48(4):535-547.

[27]Ogawa D,Yamaguchi K,Nishiuchi T. High-level overexpression of the Arabidopsis HsfA2 gene confers not only increased themotolerance but also salt/osmotic stress tolerance and enhanced callus growth[J]. Journal of Experimental Botany,2007,58(12):3373-3383.

[28]Schramm F,Ganguli A,Kiehlmann E,et al. The heat stress transcription factor HsfA2 serves as a regulatory amplifier of a subset of genes in the heat stress response in Arabidopsis[J]. Plant Molecular Biology,2006,60(5):759-772.

[29]Charng Y Y,Liu H C,Liu N Y,et al. A heat-inducible transcription factor,HsfA2,is required for extension of acquired thermotolerance in Arabidopsis[J]. Plant Physiology,2007,143(1):251-262.endprint

猜你喜歡
生物信息學(xué)
中藥蛋白質(zhì)組學(xué)研究策略
淺談醫(yī)學(xué)院校生物信息學(xué)專業(yè)青年教師規(guī)范培訓(xùn)模式的建立
“PBL+E—learning”教學(xué)模式探索
移動教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
今傳媒(2016年11期)2016-12-19 11:35:50
中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析
數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
生物信息學(xué)課堂危機及對策研究
科技視界(2016年23期)2016-11-04 10:07:53
案例教學(xué)法在《生物信息學(xué)》本科教學(xué)中的應(yīng)用
考試周刊(2016年78期)2016-10-12 11:45:31
論生物信息學(xué)研究進(jìn)展及在蛋白質(zhì)組學(xué)研究中的應(yīng)用
農(nóng)學(xué)類專業(yè)《生物信息學(xué)》課程教學(xué)改革探討
丹巴县| 沙田区| 平利县| 康保县| 江都市| 连平县| 团风县| 西乌珠穆沁旗| 霍林郭勒市| 巩留县| 中牟县| 南木林县| 运城市| 临颍县| 望谟县| 铜梁县| 印江| 金秀| 罗甸县| 河源市| 苍山县| 闽清县| 娄烦县| 乐都县| 巴青县| 宜春市| 延边| 宁阳县| 太仆寺旗| 华亭县| 安宁市| 阜宁县| 泾源县| 新巴尔虎右旗| 从江县| 宜川县| 岳普湖县| 友谊县| 普洱| 阿勒泰市| 五原县|