任瑞芳 張紹鵬 蔣 鵬 張 瑞 張 祚 鄭涵予 史夢(mèng)華 馬曉龍
羊肚菌轉(zhuǎn)錄因子分類和生物信息學(xué)分析
任瑞芳1張紹鵬2蔣 鵬1張 瑞1張 祚1鄭涵予1史夢(mèng)華1馬曉龍3*
(1. 武漢輕工大學(xué) 生命科學(xué)與技術(shù)學(xué)院,湖北 武漢 430023;2. 武漢輕工大學(xué)硒科學(xué)與工程現(xiàn)代產(chǎn)業(yè)學(xué)院,湖北 武漢 430023;3. 武漢市農(nóng)業(yè)科學(xué)院蔬菜研究所,湖北 武漢 430345)
首次根據(jù)Genbank中已知的7237條羊肚菌序列,對(duì)所有編碼轉(zhuǎn)錄因子的序列進(jìn)行了功能分類,并重點(diǎn)對(duì)羊肚菌中的鋅指蛋白(ZFP)編碼序列進(jìn)行了生物信息學(xué)分析。結(jié)果表明,Genbank中所有7237條羊肚菌來源的核苷酸序列,有167條是編碼轉(zhuǎn)錄因子的序列,其中88條序列編碼了鋅指蛋白。這些序列都含有相應(yīng)的保守基序,編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)以α-螺旋為主,三級(jí)結(jié)構(gòu)極為相似,功能上以親水性蛋白為主。
羊肚菌;轉(zhuǎn)錄因子;鋅指蛋白;生物信息學(xué)
羊肚菌()又名美味羊肚菌,俗稱羊雀菌、包谷菌,是子囊菌中有名的食用真菌,屬于子囊菌亞門()、盤菌綱()、盤菌目(),馬鞍菌科()、羊肚菌屬()[1]。因其菌蓋表面生有許多小凹坑,外觀極似羊肚而得名。羊肚菌性平,味甘寒,無毒;有益腸胃、助消化、化痰理氣、壯腎補(bǔ)陽(yáng)、補(bǔ)腦提神、強(qiáng)身健體、預(yù)防感冒和增強(qiáng)人體免疫力等功效[2]。羊肚菌在全世界都有自然分布,以在法國(guó)、德國(guó)、美國(guó)、印度及中國(guó)分布較為廣泛。在我國(guó),羊肚菌分布北至東北三省,南至廣東、福建、臺(tái)灣,東至山東,西至新疆、西藏、寧夏、貴州,共28個(gè)省、市、自治區(qū),但每個(gè)地區(qū)羊肚菌種類資源豐富度不同且有很大差異,其中以甘肅和四川地區(qū)的種類資源較為豐富[3]。
據(jù)報(bào)道,羊肚菌的營(yíng)養(yǎng)成分很豐富,含有多糖、酶類、氨基酸、吡喃酮抗生素、脂肪酸等。羊肚菌的菌絲體含有豐富的氨基酸及其他營(yíng)養(yǎng)元素,總氨基酸含量大大高于一般食用菌,必需氨基酸含量占比較高,占氨基酸總量的49%。其中決定鮮味的谷氨酸、賴氨酸、天冬氨酸含量尤為突出,是優(yōu)質(zhì)的蛋白源。羊肚菌含有20種以上無機(jī)元素,其中微量元素有Zn、Mn、Cu、Co、Cr、Fe、Ni、B、Sr、V等10種,并含有人體必需的Ca、Mg、P等3種常量元素[1]。
轉(zhuǎn)錄因子(Transcription Factor,TF)是一組獨(dú)特的DNA結(jié)合蛋白,也稱反式作用因子,其可直接或間接與基因啟動(dòng)子區(qū)域中順式作用元件特異性結(jié)合,對(duì)基因轉(zhuǎn)錄進(jìn)行調(diào)控。其主要功能是激活或抑制基因的轉(zhuǎn)錄效應(yīng)。轉(zhuǎn)錄因子在基因表達(dá)調(diào)控中起著核心作用,能夠協(xié)調(diào)很多生物過程,包括分化、發(fā)育、新陳代謝、凋亡、自噬等。在真菌響應(yīng)外界氮源、生長(zhǎng)發(fā)育、次級(jí)代謝和抗逆過程中發(fā)揮了重要作用。根據(jù)不同的DNA結(jié)合基序,轉(zhuǎn)錄因子主要分為經(jīng)典的鋅指結(jié)構(gòu)、同源結(jié)構(gòu)域和基本螺旋-環(huán)-螺旋三大類。其中,鋅指蛋白(ZFP)是最大的具有序列特異性的DNA結(jié)合蛋白家族[4]。鋅指在結(jié)構(gòu)上是多樣的,并且存在于在各種細(xì)胞活動(dòng)中執(zhí)行多種功能的蛋白質(zhì)中,例如復(fù)制和修復(fù),轉(zhuǎn)錄和翻譯,代謝和信號(hào)傳導(dǎo),細(xì)胞增殖和凋亡[5]。
羊肚菌目前在Genbank數(shù)據(jù)庫(kù)中已知的7237條核酸序列條目中找出所有能編碼具有轉(zhuǎn)錄因子活性的序列。將這些序列下載下來進(jìn)行結(jié)構(gòu)域分析,并鑒定候選序列的結(jié)構(gòu)域[6]。
利用NCBI提供的在線軟件Conserved Domain Search進(jìn)行結(jié)構(gòu)域分析,然后以結(jié)構(gòu)域類型為依據(jù)將轉(zhuǎn)錄因子進(jìn)行分類[7]。
運(yùn)用MEGA X內(nèi)本身具有的Clustal W對(duì)羊肚菌ZFP序列進(jìn)行多序列比對(duì)。將比對(duì)結(jié)果保存,然后基于多序列比對(duì)結(jié)果,利用MEGA X軟件中ML(maximum likelihood)方法構(gòu)建生物進(jìn)化樹。
運(yùn)用Meme在線平臺(tái)對(duì)羊肚菌鋅指結(jié)構(gòu)蛋白中的保守基序(motif)進(jìn)行在線分析,將最大的motif檢索數(shù)值定為12[8]。
(1)一級(jí)結(jié)構(gòu)預(yù)測(cè)。采用ExPASy提供的在線軟件Protparam對(duì)鋅指蛋白進(jìn)行一級(jí)結(jié)構(gòu)特性分析。主要包括氨基酸的種類和含量、理化性質(zhì)及相對(duì)分子質(zhì)量等。
(2)二級(jí)結(jié)構(gòu)預(yù)測(cè)。利用SOPMA程序?qū)ρ蚨蔷\指結(jié)構(gòu)轉(zhuǎn)錄因子的蛋白質(zhì)二級(jí)結(jié)構(gòu)進(jìn)行在線預(yù)測(cè),預(yù)測(cè)分析二級(jí)結(jié)構(gòu)的組成和含量。
(3)三級(jí)結(jié)構(gòu)預(yù)測(cè)。采用Phyre2.0對(duì)三級(jí)結(jié)構(gòu)進(jìn)行建模。也可以采用SWISS-MODEL進(jìn)行三級(jí)結(jié)構(gòu)預(yù)測(cè)[9]。
在Genbank數(shù)據(jù)庫(kù)中,屬于羊肚菌的核酸序列共有7237條,有72條scafford長(zhǎng)序列(大于1000 bp)中包含有能夠編碼羊肚菌轉(zhuǎn)錄因子的編碼序列,這72條scafford長(zhǎng)序列中,70條序列來自于尖頂羊肚菌(),另外2條來自于梯棱羊肚菌()。在這些scafford序列中,能夠編碼具有轉(zhuǎn)錄因子活性的編碼序列(CDS)共有169條。
將169條蛋白候選序列進(jìn)行結(jié)構(gòu)域分析,有2條沒有找到結(jié)構(gòu)域,其余167條轉(zhuǎn)錄因子按照結(jié)構(gòu)域可以分為28類:①Zn2Cys6,②GATA,③HLH,④Homeobox,⑤HMG-box,⑥ZIP,⑦Forkhead,⑧HSF,⑨Copperfirst,⑩RFX,TAF,?TFⅡ,?zf,?RING-finger,?MADS,?TEA,?SH2,?WD40,?YL1,?PC4,?CCAAT-binding,?Zn ribbon,?p53,?Tfb,?kila-N,?TBP,?spt,?Elongin_A,?Fungal_trans_2(編輯注:受版面限制,詳表未予刊載)。最大的一組轉(zhuǎn)錄因子是Zn2Cys6占40%,第二大類是基本轉(zhuǎn)錄因子(TFⅡ)占11%(圖1)。廣義上來說,含Zn2Cys6,Zn ribbon,zf,RING-finger,GATA[10]的蛋白均屬于鋅指蛋白,共88條[4,5,11]。
為了評(píng)估羊肚菌中的鋅指蛋白之間的進(jìn)化關(guān)系,利用MEGA對(duì)羊肚菌88條含鋅指結(jié)構(gòu)的轉(zhuǎn)錄因子編碼序列做進(jìn)化分析,構(gòu)建蛋白系統(tǒng)發(fā)育樹(圖2)。將系統(tǒng)發(fā)育樹分為11類,第7類最多。以第1類為例,除RPB15307.1、RPB14569.1、RPB11370.1外,均為含有Zn2Cys6的鋅指蛋白,其中RPB14569.1、RPB11370.1含有GATA且屬于同一小分支。含有Zn2Cys6的鋅指蛋白大多同屬一個(gè)分支且分支較短,說明它們的親緣關(guān)系較近,如RPB14600.1和RPB07552.1,RPB13300.1和RPB15722.1;而它們又屬于不同的大分支,因此在進(jìn)化過程中可能發(fā)生了變異,變異的程度也存在差別。而含ZIP的鋅指蛋白R(shí)PB15307.1與含Zn2Cys6的鋅指蛋白R(shí)PB17815.1同屬一個(gè)分支,它們之間的親緣關(guān)系較近,同源性高。結(jié)果表明,羊肚菌鋅指結(jié)構(gòu)轉(zhuǎn)錄因子在進(jìn)化上具有不同程度的分化。
圖1 羊肚菌各類型轉(zhuǎn)錄因子的分布
通過MEME在線分析得出,羊肚菌鋅指蛋白具有11個(gè)保守基序?;?為RACDRCRRRK IKCDG;基序2為PVERELRRRVFWALYVLD;基序3為L(zhǎng)VDLYFQNIHPLFPILHRPTF;基序4為KPPCSRCVKLGLECV;基序5為L(zhǎng)GLAVRMAQD LGLHRE;基序6為QQQQQQQQQQQQQQH;基序7為L(zhǎng)GRPVLINDEDIDVELP;基序8為VPRGY VEELEARLKALEKLL;基序9為QQLHPHQQQQ QQHQQHQQQQQQAQHQQ;基序11為WLLLHY LFNAGLVLL;基序12為L(zhǎng)HLSYYATLILLHRP?;?、基序4比較保守,大部分鋅指包合蛋白N端都有分布。基序2,基序5,基序6,基序7也比較保守,大部分蛋白都有分布。這些保守基序是重要的結(jié)構(gòu)單位,可以用來分析進(jìn)化關(guān)系,擁有的相同序列越多,表明親緣關(guān)系越近。RPB15301.1,RPB14688.1,RPB08201.1和RPB11254.1只含有一個(gè)基序,與其他蛋白的進(jìn)化關(guān)系較遠(yuǎn)。剩余的鋅指蛋白所含基序較多,進(jìn)化關(guān)系較近[12](圖3)。
蛋白質(zhì)一級(jí)結(jié)構(gòu)是指肽鏈中氨基酸排列順序和連接方式,是氨基酸分子結(jié)構(gòu)的基礎(chǔ),包含了決定蛋白質(zhì)分子所有結(jié)構(gòu)層次構(gòu)象的全部信息。分析結(jié)果顯示:不同的羊肚菌鋅指蛋白在氨基酸的組成、等電點(diǎn)、蛋白質(zhì)分子量和理化性質(zhì)等方面存在著一定的差異。共含有20種基本氨基酸,以絲氨酸、脯氨酸、甘氨酸和亮氨酸為主。pH在5.5~10之間,蛋白質(zhì)分子量為3.1~11.5 kDa,氨基酸數(shù)目最少為259個(gè),最多為1339個(gè)。
圖2 羊肚菌鋅指蛋白序列的系統(tǒng)發(fā)育樹(部分圖)
疏水性是決定蛋白質(zhì)三級(jí)結(jié)構(gòu)構(gòu)象的重要因素之一,許多轉(zhuǎn)錄因子都是利用其疏水性區(qū)域與其他蛋白質(zhì)相互作用。疏水性負(fù)值越大表示越親水,正值越大表示越疏水,兩性蛋白的疏水性值在0.5~?0.5之間。羊肚菌鋅指蛋白疏水性值均為負(fù)值,在?0.06~? 1.3之間,說明它們主要是以親水性蛋白為主[13]。
圖3 羊肚菌鋅指結(jié)構(gòu)轉(zhuǎn)錄因子保守基序(部分圖)
蛋白質(zhì)二級(jí)結(jié)構(gòu)的形成,主要是其多肽鏈的主鏈骨架上所含有的羰基和亞氨基,在主鏈骨架盤曲折疊時(shí)可以形成氫鍵,依靠這種氫鍵的維持固定,多肽鏈主鏈上的若干肽段可以形成有規(guī)律的空間排布,與R側(cè)鏈構(gòu)象無關(guān)。因此,對(duì)于羊肚菌鋅指結(jié)合蛋白的二級(jí)結(jié)構(gòu)預(yù)測(cè)很有必要,利用SOPMA程序進(jìn)行預(yù)測(cè)和分析,結(jié)果表明羊肚菌鋅指蛋白家族二級(jí)結(jié)構(gòu)是以α-螺旋、延伸鏈、β-折疊、β-轉(zhuǎn)角、無規(guī)卷曲為構(gòu)成原件,以α-螺旋、無規(guī)卷曲為主。二級(jí)結(jié)構(gòu)聚集在一起就能形成超二級(jí)結(jié)構(gòu),參與三級(jí)結(jié)構(gòu)的形成,是蛋白質(zhì)發(fā)揮作用的單位[14]。
蛋白質(zhì)的三級(jí)結(jié)構(gòu)是建立在二級(jí)結(jié)構(gòu)、超二級(jí)結(jié)構(gòu),乃至結(jié)構(gòu)域的基礎(chǔ)上的,與側(cè)鏈的相互作用有關(guān)。蛋白質(zhì)的三級(jí)結(jié)構(gòu)即一個(gè)蛋白質(zhì)的立體結(jié)構(gòu),或稱三維結(jié)構(gòu),包括多肽鏈中的一切原子的空間排列方式。三級(jí)結(jié)構(gòu)穩(wěn)定的主要作用力是非共價(jià)鍵,是疏水相互作用、氫鍵、范德華力和靜電作用來維持的特定空間結(jié)構(gòu)。蛋白質(zhì)只有在折疊成特定的結(jié)構(gòu)之后方能行使特定的生物學(xué)功能,因此了解蛋白質(zhì)結(jié)構(gòu)對(duì)于認(rèn)識(shí)其功能有著重要意義。
利用Swiss-model對(duì)88條羊肚菌鋅指包合蛋白的三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。結(jié)果表明,大部分鋅指蛋白三級(jí)結(jié)構(gòu)組成相似,但又存在差異。圖4是16個(gè)有代表性的羊肚菌鋅指蛋白的的三級(jí)結(jié)構(gòu)預(yù)測(cè)圖。它們都是以α-螺旋為主要構(gòu)件,但α-螺旋的數(shù)目存在差異。雖然有些鋅指蛋白的α-螺旋數(shù)目相等,但是蛋白質(zhì)的三級(jí)結(jié)構(gòu)是由α-螺旋、β-轉(zhuǎn)角、β折疊,延伸鏈和無規(guī)卷曲共同組成的,氨基酸數(shù)目存在差異,肽鏈長(zhǎng)度存在差異,導(dǎo)致三級(jí)結(jié)構(gòu)必然存在著差異。包含鋅指結(jié)構(gòu)的蛋白,它們能結(jié)合的鋅離子,根據(jù)結(jié)構(gòu)域數(shù)目和種類的不同,結(jié)合1到4個(gè)鋅離子不等,以維持依賴鋅離子的蛋白質(zhì)三級(jí)結(jié)構(gòu)的穩(wěn)定[15]。
圖4 16個(gè)典型的羊肚菌鋅指蛋白質(zhì)三級(jí)結(jié)構(gòu)
羊肚菌鋅指蛋白作為羊肚菌轉(zhuǎn)錄因子中最大的一類,對(duì)其研究具有重要意義。本實(shí)驗(yàn)對(duì)羊肚菌轉(zhuǎn)錄因子蛋白家族進(jìn)行分類,將167條編碼的具有轉(zhuǎn)錄因子活性的蛋白分成了28類。對(duì)羊肚菌編碼鋅指蛋白基因家族進(jìn)行分析得出,編碼的88個(gè)羊肚菌鋅指蛋白以親水性蛋白為主,其二級(jí)結(jié)構(gòu)以α-螺旋為主。它們朝著不同方向進(jìn)行著不同程度的進(jìn)化,能夠結(jié)合不同數(shù)目的鋅離子,維持結(jié)構(gòu)的穩(wěn)定。
鋅在植物生長(zhǎng)過程中發(fā)揮著不可或缺的作用。如果使用鋅離子螯合劑脫鋅或用Fe、Al、Cu、Ag、Mn等其他金屬離子代替鋅離子,鋅指蛋白與DNA或RNA等結(jié)合特異性就會(huì)被明顯抑制,不能形成折疊結(jié)構(gòu),同時(shí)穩(wěn)定的蛋白也會(huì)失去支撐力,影響基因表達(dá)及脅迫響應(yīng),使其喪失大部分功能[16]。鋅指序列主要存在于轉(zhuǎn)錄因子中,越來越多的鋅指蛋白已被證實(shí)與生物體內(nèi)的各種RNA代謝有關(guān),能夠提高植物遭受鹽、冷凍、干旱、熱、滲透的耐受性以及病菌感染的生物抗性[17]。
羊肚菌編碼鋅指蛋白基因的研究基礎(chǔ)薄弱,功能研究幾乎是空白,本實(shí)驗(yàn)對(duì)羊肚菌中所有編碼鋅指結(jié)構(gòu)的轉(zhuǎn)錄因子序列做了分類和生物信息學(xué)分析,為羊肚菌轉(zhuǎn)錄因子的挖掘和功能調(diào)控研究提供了理論依據(jù)。
[1] 辛青霞, 蘆永昌, 趙英, 等. 羊肚菌多糖的提取及含量測(cè)定[J]. 四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, 43(5):671-676.
[2] 任廷遠(yuǎn), 安玉紅. 羊肚菌活性成分及營(yíng)養(yǎng)保健功能的研究現(xiàn)狀(綜述)[J]. 浙江食用菌, 2010, 18(1): 21-23.
[3] 任怡蓮, 馮銳, 朱金霞, 等. 羊肚菌國(guó)內(nèi)外研究現(xiàn)狀及產(chǎn)業(yè)發(fā)展建議[J]. 寧夏農(nóng)林科技, 2020, 61(8): 50-53.
[4] Jen J, Wang Y C. Zinc finger proteins in cancer progression[J]. Journal of Biomedical Science. 2016, 23(1): 53.
[5] Krishna S S, Majumdar I, Grishin N V. Structural classification of zinc fingers: survey and summary[J]. Nucleic Acids Research. 2003, 31(2): 532-550.
[6] 方亦圓, 嚴(yán)維, 吳建新, 等. 花生MYB轉(zhuǎn)錄因子的鑒定與生物信息學(xué)分析[J]. 生物信息學(xué), 2021, 19(2): 1-15.
[7] 安秀紅, 徐鍇, 厲恩茂, 等. 蘋果抗性相關(guān)的谷胱甘肽轉(zhuǎn)移酶基因MdGSTU1的生物信息學(xué)和表達(dá)分析[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2014, 47(24): 4868-4877.
[8] 谷彥冰, 冀志蕊, 遲福梅, 等. 蘋果WRKY基因家族生物信息學(xué)及表達(dá)分析[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2015, 48(16):3221-3238.
[9] 孫雪婧, 杜曉華, 楊孝樸, 等. 牦牛CYGB基因CDS區(qū)克隆與生物信息學(xué)分析[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2014, 47(13): 2690-2698.
[10] Gao J, Chen Y H, Peterson L C. GATA family transcriptional factors: emerging suspects in hematologic disorders[J]. Experimental Hematology and Oncology. 2015, 4(1): 28.
[11] Carrillo A J, Schacht P, Cabrera I E, et al. Functional profiling of transcription factor Genes in[J]. G3: Genes, Genomes, Genetics. 2017, 7(9): 2945-2956.
[12] 何欣, 葉偉, 高曉霞, 等. 白木香倍半萜合成酶As-SesTPS1基因的克隆、生物信息學(xué)和表達(dá)分析[J]. 中草藥,2015, 46(5): 733-739.
[13] 董慶龍, 冀志蕊, 遲福梅, 等. 蘋果MADS-box轉(zhuǎn)錄因子的生物信息學(xué)及其在不同組織中的表達(dá)[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2014, 47(6): 1151-1161.
[14] 李思楠, 蘇安玉, 于以成, 等. 大豆再生相關(guān)基因GmARF的生物信息學(xué)及表達(dá)分析[J]. 基因組學(xué)與應(yīng)用生物學(xué), 2015, 34(10): 2187-2193.
[15] 黎幫勇, 胡尚連, 曹穎, 等. 毛竹NAC轉(zhuǎn)錄因子家族生物信息學(xué)分析[J]. 基因組學(xué)與應(yīng)用生物學(xué), 2015, 34(8): 1769-1777.
[16] 李琳, 丁峰, 潘介春, 等. 植物鋅指蛋白轉(zhuǎn)錄因子家族研究進(jìn)展[J]. 熱帶農(nóng)業(yè)科學(xué), 2020, 40(2): 65-75.
[17] 趙麗娟, 易小婭, 曾幼玲. 植物逆境相關(guān)C2H2型鋅指蛋白的研究進(jìn)展[J]. 分子植物育種, 2016, 14(3): 578-585.
Classification of transcription factors inand bioinformatics analysis
Ren Ruifang1Zhang Shaopeng2Jiang Peng1Zhang Rui1Zhang Zuo1Zheng Hanyu1Shi Menghua1Ma Xiaolong3*
(1. School of life Science and Techonogy, Wuhan Polytechnic University, Wuhan, Hubei 430023, China; 2. School of Modern Industry for Selenium Science and Engineering, Wuhan Polytechnic University, Wuhan, Hubei 430023, China; 3. Vegetable Research Institute of Wuhan Academy of Agricultural Sciences, Wuhan, Hubei 430345, China)
In this study, all sequences encoding transcription factors were functionally classified according to 7237sequences known in Genbank for the first time, and the coding sequence of zinc finger protein (ZNF) fromwas analyzed by bioinformatics. The results showed that 167 of the 7237 nucleotide sequences fromin GenBank were sequences encoding transcription factors, of which 88 sequences encoded zinc finger proteins, these sequences contain corresponding conserved motifs. Encoding the secondary structure of proteins is mainly α-helix, its tertiary structure is very similar. It is mainly hydrophilic protein in function. The results of this study will lay a theoretical foundation for further study of the regulatory role of transcription factors in the growth and development of.
; transcription factors; Zinc finger protein; bioinformatics
S646
A
2095-0934(2022)02-127-06
武漢市應(yīng)用基礎(chǔ)前沿專項(xiàng)(2020020601012297);財(cái)政部和農(nóng)業(yè)農(nóng)村部國(guó)家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系(CARS-20)
任瑞芳(1997—),女,碩士,主要從事中藥材的分子生物學(xué)研究。E-mail:2893468536@qq.com。
馬曉龍(1982—),男,高級(jí)農(nóng)藝師,博士,主要從事食藥用菌的栽培育種及生理藥理學(xué)研究。E-mail:22843560@qq.com。