吉克伍合,武澤峰,范三紅,2,奚緒光
?
真核生物FANCJ-like蛋白的結(jié)構(gòu)與進(jìn)化
吉克伍合1,武澤峰1,范三紅1,2,奚緒光1
1. 西北農(nóng)林科技大學(xué)生命科學(xué)學(xué)院,楊凌 712100;2. 旱區(qū)作物逆境生物學(xué)國家重點實驗室,楊凌 712100
FANCJ-like蛋白是一類ATP依賴的5′-3′DNA解旋酶,參與DNA損傷修復(fù)、同源重組及G4-DNA拆解,在基因組穩(wěn)定性維持過程中發(fā)揮重要功能。文章系統(tǒng)分析了47種真核生物的FANCJ-like蛋白,對其序列結(jié)構(gòu)特征及起源進(jìn)化進(jìn)行了深入探討。真核生物FANCJ-like蛋白包含4類成員——XPD、CHL1、RTEL1和FANCJ,但在真菌的一些世系及昆蟲中存在嚴(yán)重缺失現(xiàn)象,如接合菌門(Zygomycota)缺失了RTEL1,擔(dān)子菌門(Basidiomycota)和子囊菌門(Ascomycota)缺失了RTEL1和FANCJ,雙翅目昆蟲缺失了FANCJ。FANCJ-like蛋白不僅包含經(jīng)典解旋酶共有HD1和HD2結(jié)構(gòu)域,而且在HD1結(jié)構(gòu)域中插入了自身特有的Fe-S、Arch和Extra-D結(jié)構(gòu)域。Fe-S和Arch結(jié)構(gòu)域在4類成員中較保守,Extra-D結(jié)構(gòu)域在XPD中不存在,在其他3類成員中也各不相同。在FANCJ-like蛋白的Fe-S、Arch和Extra-D結(jié)構(gòu)域中分別發(fā)現(xiàn)了7個、10個和2個特有模體;除了已報道的保守模體外,HD1和HD2中分別發(fā)現(xiàn)了5個和12個特有模體。從這些特有模體的組成和排布來看,RTEL1和FANCJ最為相近,它們在HD2區(qū)包含兩個獨有模體Vb2和Vc,可能與其G4-DNA解旋活性相關(guān)。進(jìn)化方面的證據(jù)表明,F(xiàn)ANCJ-like蛋白起源于一種HD1區(qū)插入了Fe-S和Arch結(jié)構(gòu)域的DNA解旋酶,在多細(xì)胞真核生物出現(xiàn)之前,該蛋白通過3次復(fù)制事件和隨后的特異化過程,依次形成了目前真核生物所包含的4類FANCJ-like蛋白。
FANCJ-like蛋白;解旋酶;系統(tǒng)發(fā)育;保守模體;空間結(jié)構(gòu)
FANCJ(Fanconi anemia complementation group J)是一種ATP依賴的5′-3′DNA解旋酶,其突變體最初是從范可尼貧血癥[1~3]和早發(fā)性乳腺癌患者[4]中鑒定出來,暗示FANCJ蛋白可能作為腫瘤抑制因子維持基因組的穩(wěn)定性。FANCJ-like蛋白屬于解旋酶超家族2(Superfamily 2,SF2)中的Rad3/XPD亞家族,該家族成員具有解旋酶共有的7個保守模體I、Ia、II、III、IV、V和VI,構(gòu)成了解旋酶核心的ATP酶/解旋酶結(jié)構(gòu)域。有別于其他亞家族成員,F(xiàn)ANCJ-like蛋白在模體Ia和II之間插入一個Fe-S結(jié)構(gòu)域,在模體II和III之間插入一個Arch結(jié)構(gòu)域。已有研究顯示,該亞家族至少包含F(xiàn)ANCJ、XPD、CHL1和RTEL1 4類成員。
人類()基因位于17號染色體長臂的17q23.2,該基因編碼一種長為1249個氨基酸殘基的5′→3′DNA解旋酶。其中N-端(1-888)包含了核心的ATP酶/解旋酶結(jié)構(gòu)域,其C-端(888- 1063)為腫瘤抑制因子BRCA1(Breast cancer type 1 susceptibility protein)結(jié)合結(jié)構(gòu)域[4]。Cantor等最先證實FANCJ是一種解旋酶,優(yōu)先結(jié)合并解旋叉狀和雙鏈底物,并需要一段5′單鏈DNA[5,6]。研究表明,F(xiàn)ANCJ蛋白在DNA鏈間交聯(lián)(Interstrand cross-link,ICL)修復(fù)、復(fù)制脅迫響應(yīng)及G4-DNA結(jié)構(gòu)拆解過程中發(fā)揮重要功能[3,7,8]。雞()突變體對DNA交聯(lián)劑高度敏感,其表型可被人類所互補(bǔ)[9]。線蟲()直系同源基因突變不僅導(dǎo)致個體對DNA交聯(lián)劑敏感,同時導(dǎo)致基因組中富G/C簇及其旁側(cè)序列的缺失[10]。
XPD(Xeroderma pigmentosum D)是通用轉(zhuǎn)錄因子TFIIH組分之一,參與核苷酸切除修復(fù)、轉(zhuǎn)錄調(diào)控和細(xì)胞凋亡調(diào)節(jié)[11,12],突變會導(dǎo)致人類著色性干皮病的發(fā)生[13]。近年來古細(xì)菌XPD晶體結(jié)構(gòu)研究取得了重大進(jìn)展,為FANCJ-like蛋白結(jié)構(gòu)和功能關(guān)系的研究提供了重要信息[14~16]。CHL1是另一種FANCJ-like蛋白,酵母()基因?qū)τ诮忝萌旧珕误w粘附和正確分離是必需的[17],其突變會導(dǎo)致染色體丟失或不正確分離。人類CHL1同源蛋白hChlR1和hChlR2在增殖細(xì)胞系中表達(dá),與染色單體的正確粘著有關(guān),可與粘著復(fù)合體緊密結(jié)合。此外,hChlR1也參與人類端粒長度的決定[18]。小鼠()中編碼ChlR1蛋白的基因突變導(dǎo)致姐妹染色體不能正確粘著和分配,產(chǎn)生非整倍體細(xì)胞,從而引起胚胎致死[19]。RTEL1 (Regulator of telomere length)是 FANCJ-like蛋白的另一個重要成員。最初研究發(fā)現(xiàn)敲除該蛋白對應(yīng)基因后,小鼠胚胎干細(xì)胞表現(xiàn)出端粒缺失和染色體斷裂與融合現(xiàn)象[20]。Wu[21]等研究表明,RTEL1以端粒富含G的3′尾巴為靶標(biāo),能拆解可能形成的G4-DNA結(jié)構(gòu),從而保證端粒的正確復(fù)制或修復(fù)。Barber[22]等用遺傳學(xué)和生物化學(xué)方法證明線蟲RTEL1是酵母RTEL1同源蛋白Srs2功能類似物,突變后表現(xiàn)出基因重組率升高、DNA損傷敏感,在突變背景下導(dǎo)致組成型致死。人類RTEL1可以拆解具有D環(huán)結(jié)構(gòu)的重組中間物,但是不能拆解Rad51-ssDNA形成的纖絲,暗示RTEL1作為抗重組酶以一種獨特的方式確保基因組穩(wěn)定性[22]。
迄今為止,國內(nèi)外學(xué)者已對FANCJ-like蛋白家族成員進(jìn)行了大量的研究,主要集中在其生物學(xué)功能及作用機(jī)制的闡明。本研究系統(tǒng)分析了47個真核生物的FANCJ-like蛋白,對其序列多樣性、起源進(jìn)化、模體組織模式及空間結(jié)構(gòu)差異進(jìn)行了深入探討,以闡明各種FANCJ-like蛋白的起源關(guān)系及序列和結(jié)構(gòu)特征,為FANCJ-like解旋酶功能的研究奠定基礎(chǔ),同時為相關(guān)疾病的治療提供參考。
FANCJ-like蛋白包含兩個特征結(jié)構(gòu)域:DEAD_2和Helicase_C_2,分別對應(yīng)于Pfam(v27.0)數(shù)據(jù)庫中的兩個蛋白家族PF06733和PF13307[23]。利用Pfam數(shù)據(jù)庫提供的隱馬爾科夫模型,使用HMMER 3.0搜索NCBI非冗余蛋白數(shù)據(jù)庫,將兩結(jié)構(gòu)域搜索結(jié)果E-value均小于e-10的序列認(rèn)定為候選序列。異水霉羅茲壺菌()、孢霉菌()、大雌異水霉()和德氏根霉()的蛋白序列下載自Broad institute的Fungal Genome Initiative及JGI的Fungal Genomes Project項目網(wǎng)站。挑選出4種古細(xì)菌和47種真核生物的候選FANCJ-like蛋白,去除冗余和不完整序列,最后獲得非冗余序列160條。依據(jù)物種進(jìn)化關(guān)系及基因組測序的完整度,選取37個代表性物種的100條完整序列用于真核生物FANCJ-like蛋白系統(tǒng)發(fā)育樹的構(gòu)建及保守模體分析。在分析真菌FANCJ-like蛋白缺失現(xiàn)象過程中使用了11種真菌的32條序列,分析昆蟲FANCJ-like蛋白缺失現(xiàn)象時使用了13種昆蟲的46條序列(附表1)。
利用MAFFT[24](v7.023b)軟件的L-INS-i算法對37個物種的候選FANCJ-like蛋白進(jìn)行多序列比對分析。以多序列比對結(jié)果為依據(jù),用PHYML 3.0[25]構(gòu)建跨物種FANCJ-like蛋白系統(tǒng)發(fā)育樹。進(jìn)化樹生成采用極大似然法(ML method),使用ProtTest 3.2分析獲得最優(yōu)氨基酸替代模型LG+I+G+F[26],并使用1000次的 Bootstrap對節(jié)點的可靠性進(jìn)行評估。同時使用Mega 5.0構(gòu)建基于鄰接法的系統(tǒng)發(fā)育樹,綜合兩種方法獲得最終的系統(tǒng)樹。根據(jù)每種蛋白所在枝的不同對其進(jìn)行基于類別的重命名(附表1)。
利用MEME[27](v4.9.1)對37個物種的100條FANCJ-like蛋白中的保守模體進(jìn)行識別,并對各亞類中共有和特有的模體開展進(jìn)一步分析。保守模體識別時,最長模體含有的氨基酸數(shù)、最短模體含有的氨基酸數(shù)及不同模體數(shù)分別設(shè)置為50、 3和 50,其他參數(shù)均采用默認(rèn)值。蛋白質(zhì)三維結(jié)構(gòu)預(yù)測采用EXPaSy提供的在線分析軟件Swiss-Model[28],分子模型使用Accelrys公司的Discovery Studio 2.5進(jìn)行可視化分析。
提取100條FANCJ-like蛋白完整的ARCH區(qū),用CLANS[29]軟件的Convex方法進(jìn)行聚類(e-value:1e-40),用Jacknife方法對分類結(jié)果的可靠度進(jìn)行評價。
利用HMMER3.0軟件搜索NCBI非冗余蛋白數(shù)據(jù)庫和真菌基因組計劃數(shù)據(jù)庫,從搜索到的51個物種(4種古細(xì)菌、8種原生生物、16種真菌、4種植物和19種動物)中共鑒定出候選FANCJ-like蛋白序列232條。人工逐條對序列進(jìn)行分析,去除冗余和不完整序列并重新命名,最后獲得非冗余完整FANCJ-like蛋白序列160條。除嗜酸熱硫化葉菌()外,其他3種古細(xì)菌均只包含1個FANCJ-like蛋白,絕大多數(shù)真菌包含2個FANCJ-like蛋白,原生生物和無脊椎動物通常包含3~4個FANCJ-like蛋白,植物和脊椎動物則通常包含4~5個FANCJ-like蛋白。
圖1 真核生物FANCJ-like蛋白系統(tǒng)發(fā)育樹
以4種古細(xì)菌嗜酸熱硫化葉菌()、極端嗜熱古菌()、嗜酸熱原體()和熱原體屬古菌()為外群,通過構(gòu)建系統(tǒng)發(fā)育樹可知,不同來源的真核FANCJ-like蛋白主要聚為4個進(jìn)化枝(圖1),根據(jù)已有的功能研究表明,這4個分枝分別對應(yīng)于已知功能的4種FANCJ-like蛋白XPD、CHL1、RTEL1和FANCJ。同時,也可以利用該進(jìn)化樹對那些功能尚不清楚FANCJ-like蛋白的功能進(jìn)行初步界定。此外,我們發(fā)現(xiàn)大部分真菌只包含XPD和CHL1兩類FANCJ-like蛋白,而缺少RTEL1和FANCJ的對應(yīng)物。通常情況下,每一個物種中每一類FANCJ-like蛋白只存在一個拷貝,也有少數(shù)物種中同一類FANCJ-like蛋白存在兩個拷貝,如人類基因組編碼兩個CHL1同源蛋白,擬南芥中存在兩個FANCJ同源蛋白,大雌異水霉()包含兩個CHL1和兩個FANCJ同源蛋白。在單細(xì)胞真核生物牛焦蟲()、膠球藻()和藍(lán)隱藻()中均存在4類FANCJ-like蛋白,而且4類蛋白在動物、植物、原生生物以及真菌中均出現(xiàn),因而推測這4類FANCJ-like蛋白產(chǎn)生于真核生物形成早期,其出現(xiàn)先于多細(xì)胞生物的形成。
在鑒定真核生物FANCJ-like蛋白時,最引人關(guān)注的現(xiàn)象是大部分真菌缺失了FANCJ和RTEL1。為了闡明這一現(xiàn)象,本文參考已有的真菌系統(tǒng)發(fā)育關(guān)系[30],對真菌中FANCJ-like蛋白的進(jìn)化歷程進(jìn)行了仔細(xì)梳理。圖2展現(xiàn)了真菌主要類別的分歧時間,以及各個主要類別代表物種中FANCJ-like蛋白的數(shù)目和種類。壺菌門(chytridomycota,大約出現(xiàn)在5.5億年前)是目前公認(rèn)起源最早的真菌,有全基因組序列支持的兩種壺菌綱真菌大雌異水霉和蛙壺菌()中均出現(xiàn)了4類FANCJ-like蛋白。同時被認(rèn)為是真菌過度祖先的隱真菌門()生物異水霉羅茲壺菌()也存在4類FANCJ-like蛋白成員,因而可以確定真菌的祖先中存在4類FANCJ-like蛋白。接合菌門(Zygomycot,大約出現(xiàn)在4.6億年以前)是另一類出現(xiàn)較早的真菌,有全基因序列支持的兩個物種德氏根霉()和被孢霉黑藻()中均缺失了RTEL1的直系同源蛋白,而3.9億年前出現(xiàn)的擔(dān)子菌門(Basidiomycota)和3.3億年前出現(xiàn)的子囊菌門(Ascomycota)真菌同時缺失了RTEL1和FANCJ蛋白的對應(yīng)物。因而在真菌進(jìn)化過程中出現(xiàn)過兩次FANCJ-like蛋白丟失現(xiàn)象,一次發(fā)生在接合菌門形成時期,一次發(fā)生擔(dān)子菌門形成時期。為驗證上述推論的正確性,本文進(jìn)一步分析了140種真菌的FANCJ-like蛋白的分布(附表2),分析結(jié)果完全支持上述結(jié)論。
圖2 FANCJ-like蛋白在真菌中的進(jìn)化歷程
合成單源樹表示真菌主要群組之間的系統(tǒng)發(fā)育關(guān)系。左邊的時間尺度和細(xì)虛線表示不同組群的大概分化時間(百萬年),右邊標(biāo)注的是真菌的5個門和相對應(yīng)的物種名。“*”表示序列不完整。
昆蟲綱生物與高等動物的FANCJ-like蛋白存在差異,如果蠅()和蚊子()均缺失了FANCJ蛋白的直系同源蛋白。圖3呈現(xiàn)了昆蟲主要類別的進(jìn)化關(guān)系以及各類別昆蟲的代表物種中FANCJ-like蛋白的數(shù)目[31]。以甲殼綱生物水蚤()為外群,昆蟲主要類別的進(jìn)化早晚依次為虱目(Phthiraptera)—膜翅目(Hymenoptera)—鞘翅目(Coleoptera)—鱗翅目(Lepi->doptera)和雙翅目(Diptera)。除雙翅目昆蟲外,其它昆蟲中并沒有明顯的證據(jù)顯示缺失FANCJ蛋白。因此,昆蟲的祖先中存在4類FANCJ-like蛋白,但雙翅目昆蟲在進(jìn)化過程中丟失了其中的FANCJ蛋白。
圖3 節(jié)肢動物門中的FANCJ-like蛋白的分布
左側(cè)合成單源樹代表了昆蟲綱中主要群組之間的系統(tǒng)發(fā)育關(guān)系,右側(cè)數(shù)據(jù)統(tǒng)計了每個子類各個物種中所含有的FANCJ-like蛋白數(shù)?!??”表示該類FANCJ-like蛋白在該物種中未發(fā)現(xiàn),但該物種是該類群中唯一全基因組測序完成的物種。
FANCJ-like蛋白包含經(jīng)典解旋酶所共有的兩個保守結(jié)構(gòu)域HD1和HD2,但其HD1結(jié)構(gòu)域中插入了另外3個結(jié)構(gòu)域:Fe-S、Arch和Extra-D,其中Fe-S和Arch區(qū)相對保守,Extra-D區(qū)在不同類的FANCJ-like蛋白間差異極大(圖4A)。在HD1和HD2結(jié)構(gòu)域?qū)?yīng)區(qū),4類FANCJ蛋白均包含先前報道的保守模體Q、I、Ia、Ib、Ic、II、III、IV、IVa、V、Va、VI和VII[15,32],但XPD的Q、Ib和V模體(Q1、Ib1和V1)與其他3類蛋白明顯不同(Q2、Ib2和V2)。此外,本研究還在HD1和HD2區(qū)新發(fā)現(xiàn)了一些FANCJ-like蛋白特有保守模體:IIIa1、IIIb1 VIIa1為XPD特有,IIIa2、IIIb2、Ivb和VIIa2為CHL1、RTEL1和FANCJ1共有,Vb2和Vc為RTEL1和FANCJ共有。Extra-D區(qū)位于模體I和Ia之間,其長度和保守性在4類FANCJ-like蛋白兩兩間差異顯著(圖4B)。XPD中Extra-D區(qū)長約9~11個氨基酸殘基,長度最短且變化幅度最小;CHL1中Extra-D區(qū)長約123~150,包含保守模體Ea和Eb;RTEL1中該區(qū)段長約42~52,變化幅度相對較小;而FANCJ中該區(qū)段長約30~123,變化幅度最大。不同物種FANCJ蛋白在Extra-D區(qū)段的低相似度暗示:該區(qū)段在不同物種中可能發(fā)揮著不同的作用。如脊椎動物FANCJ蛋白的Extra-D區(qū)段包含MLH1蛋白互作模體,線蟲和植物FANCJ蛋白則不包含該模體。
在Fe-S區(qū)共發(fā)現(xiàn)了7種保守模體Fa~Fe,其中Fa和Fe為4類成員共有,它們分別包含一個半胱氨酸殘基,可能參與鐵硫簇的形成,而鐵硫簇參與了雙鏈和單鏈DNA結(jié)合點的識別并且直接參與雙鏈的解旋。除XPD外,其他3類蛋白的Fe-S區(qū)均包含模體Fd2,其核心為DxE(D/E),包含3個連續(xù)的酸性氨基酸殘基,其功能還有待研究。
在FANCJ-like蛋白的Arch區(qū)共發(fā)現(xiàn)了10種保守模體Aa~Ag,其中保守模體Ag為4類蛋白共有。XPD中該區(qū)包含的保守模體最多,CHL1次之,這種保守性反映出XPD和CHL1這兩種蛋白的Arch區(qū)對其功能的重要性。圖4C是利用CLANS 軟件對4類蛋白Arch結(jié)構(gòu)域序列進(jìn)行聚類分析的結(jié)果,4類FANCJ-like蛋白的Arch區(qū)分別聚類在一起,其中XPD的Arch區(qū)最為收斂,其次是CHL1,而FANCJ和RTEL1較為分散。已有研究表明,XPD的Arch結(jié)構(gòu)域能夠募集活化激酶,作為分子開關(guān),調(diào)控TFIIH的DNA修復(fù)和轉(zhuǎn)錄活性,其序列的保守性則說明該機(jī)制在進(jìn)化中極其重要。
圖4 FANCJ-like蛋白保守模體排布及Extra-D和Arch結(jié)構(gòu)域變異度分析
A:FANCJ-like蛋白保守模體排布,灰色框代表了在一種蛋白中獨有的模體,藍(lán)綠色代表兩類FANCJ-like蛋白共有的模體,黃色代表三類FANCJ-like蛋白共有的模體(詳細(xì)信息見附表3和附表4);B:FANCJ-like蛋白Extra-D結(jié)構(gòu)域長度統(tǒng)計,“*”表示兩組數(shù)據(jù)間差異顯著,“**”表示兩組數(shù)據(jù)間差異極顯著;C:FANCJ-like蛋白Arch 結(jié)構(gòu)域聚類。
分別選取人類XPD、FANCJ和小鼠的CHL1、RTEL1作為代表,以古細(xì)菌嗜酸熱菌體()XPD空間結(jié)構(gòu)4a15為模板,利用在線分析軟件Swiss-Model對4類FANCJ-like蛋白進(jìn)行同源建模,結(jié)果如圖5所示。從結(jié)構(gòu)域組成和堆疊方式來看,4類FANCJ-like蛋白的三維結(jié)構(gòu)非常類似,均包含經(jīng)典解旋酶所必須的HD1和HD2結(jié)構(gòu)域,同時包含獨有Fe-S和Arch結(jié)構(gòu)域。這4個結(jié)構(gòu)域在4種蛋白中雖然有細(xì)微差異,但整體的排布方式完全一致,即兩個馬達(dá)結(jié)構(gòu)域HD1和HD2被拱狀A(yù)rch結(jié)構(gòu)域所連接,F(xiàn)e-S結(jié)構(gòu)域從HD1結(jié)構(gòu)域一側(cè)伸出并與Arch結(jié)構(gòu)域形成一個封閉通道。4類蛋白最大的差異在于Extra-D結(jié)構(gòu)域,Extra-D在XPD中并不存在,而在其他3類蛋白質(zhì)中也各不相同。從保守模體在三維結(jié)構(gòu)中的位置來看,XPD包含的獨有模體最多,其中一半以上都位于Arch區(qū),這表明Arch結(jié)構(gòu)域在XPD進(jìn)化中比較保守,功能比較重要。Fd2模體僅出現(xiàn)在XPD以外的3種FANCJ-like蛋白中,該模體形成了兩段短α-螺旋,中間被一段β-折疊間隔,位于Fe-S和HD1結(jié)構(gòu)之間,其序列中保守的3個酸性氨基酸殘基可能參與了兩個結(jié)構(gòu)域間的互作。Vb2和Vc是FANCJ和RTEL共有的兩個模體,Vb2、Vc核心序列分別為Dx2VxLKx4D和Gx3WY,形成兩段相連的α-螺旋,在HD2表面形成一個凸起。由于FANCJ和RTEL1具有G4-DNA解旋活性,而XPD和CHL1不具備該功能,因而Vb2和Vc的模體可能與G4-DNA解旋相關(guān)。
圖5 FANCJ-like蛋白三維結(jié)構(gòu)
本研究以基因組序列為參考,對真核生物FANCJ-like蛋白的系統(tǒng)發(fā)育和結(jié)構(gòu)差異進(jìn)行了全面分析。以古細(xì)菌XPD為外群,真核FANCJ-like蛋白主要集中于4個進(jìn)化枝,分別對應(yīng)于XPD、CHL1、RTEL1和FANCJ蛋白。結(jié)合系統(tǒng)發(fā)育樹、保守模體、空間結(jié)構(gòu)及前人研究結(jié)果[33],本文提出了如圖6所示的FANCJ-like蛋白進(jìn)化歷程。在原始的原核生物中首先進(jìn)化出一種在HD1結(jié)構(gòu)域中同時插入Fe-S和Arch結(jié)構(gòu)域的DNA解旋酶,這種解旋酶隨細(xì)菌和古細(xì)菌的分化而產(chǎn)生差異,并且一個物種中僅包含一個這樣的蛋白。原始真核細(xì)胞繼承了類古細(xì)菌XPD蛋白,并在多細(xì)胞真核生物分化之前發(fā)生了3次復(fù)制事件,依次演化形成目前真核生物擁有的XPD、CHL1、RTEL1和FANCJ蛋白。之所以說真核的4類FANCJ-like蛋白在多細(xì)胞真核生物形成之前就已形成,是因為牛焦蟲()、膠球藻()和藍(lán)隱藻()等單細(xì)胞真核生物基因組中已存在編碼4種FANCJ- like蛋白的對應(yīng)基因。細(xì)菌包含兩類FANCJ-like蛋白,一種稱為DinG一種稱為DinG-Exo,后者比前者在N端多出了一個外切酶結(jié)構(gòu)域。
在鑒定不同真核生物FANCJ-like蛋白時發(fā)現(xiàn),大部分真菌缺失了FANCJ和RTEL1,而雙翅目昆蟲缺失了FANCJ。通過分析FANCJ-like蛋白在不同昆蟲和真菌中的分布,我們證明兩者祖先中均存在4類FANCJ-like蛋白,只是在進(jìn)化過程中某些世系丟失了一類或兩類成員。從另外一個角度而言,相較于XPD和CHL1,F(xiàn)ANCJ和RTEL和功能并不是必不可少的,或者說它們的功能和其他蛋白的功能是重疊的,或者在缺失它們的世系中出現(xiàn)了其他蛋白可以互補(bǔ)它們的功能。FANCJ和RTEL1具有G4-DNA解旋活性,本研究對缺失FANCJ和RTEL1的節(jié)肢動物和真菌基因組中的G4-DNA進(jìn)行分析(附表5),結(jié)果發(fā)現(xiàn),G4-DNA含量和是否缺失FANCJ和RTEL1沒有相關(guān)性。這暗示FANCJ和RTEL1的G4-DNA解旋、復(fù)制脅迫響應(yīng)等功能可能被其他功能同源蛋白所行使。
圖6 FANCJ-like蛋白起源與進(jìn)化模式圖
紅色的短斜線代表了復(fù)制事件。
4類真核生物FANCJ-like蛋白具有相似的空間結(jié)構(gòu),均包含解旋酶超家族II成員共有的HD1和HD2結(jié)構(gòu)域,但其HD1結(jié)構(gòu)域中插入了兩個特異結(jié)構(gòu)域Fe-S和Arch。同時CHL1、RTEL1和FANCJ中HD1結(jié)構(gòu)域的模體I和Ia之間插入了一個Extra-D結(jié)構(gòu)域,該結(jié)構(gòu)在XPD蛋白中不存在,在其他3類蛋白中也各不相同,甚至在同一類蛋白中也有顯著差異。4類蛋白的HD1、HD2、Fe-S和Arch結(jié)構(gòu)域雖然在排布和折疊方式上非常相似,但每類各有自己保守的模體,這些保守模體應(yīng)該是各類蛋白功能差異的基礎(chǔ)。XPD除了包含F(xiàn)ANCJ-like蛋白共有的13個模體外,還包含15個特有模體,這說明XPD的結(jié)構(gòu)、功能、互作蛋白及參與的生物學(xué)過程在進(jìn)化中非常保守。這些特有模體突變會導(dǎo)致遺傳疾病的發(fā)生。如人類XPD特有模體IIIa1中的R487突變?yōu)镚,或VIIa1中的R722突變?yōu)閃均會導(dǎo)致人類毛發(fā)低硫營養(yǎng)不良癥(Trichothiodystrophy,TTD)的發(fā)生[14]。在CHL1、RTEL1和FANCJ中存在多種共有模體, 如Q2、Ib2、IIIa2、IIIb2、Ivb、V2和VIIa2,這反映出三者親緣較近,也暗示三者存在一些相同的功能位點和調(diào)控模式。如XPD的Ib模體(Ib1)的核心保守序列為EL(K/R)(K/R)L,而CHL1、RTEL1和FANCJ中對應(yīng)的Ib2模體核心保守序列為EL(K/R)(K/R)T,新出現(xiàn)的蘇氨酸殘基(T)為潛在的磷酸化位點,暗示后三者的活性可能通過該位點可逆磷酸化調(diào)節(jié)。具有G4-DNA解旋活性的RTEL1和FANCJ蛋白中發(fā)現(xiàn)了特有保守模體Vb2和Vc,它們的存在可能與G4解旋活性直接相關(guān)。本研究系統(tǒng)呈現(xiàn)了FANCJ-like蛋白進(jìn)化歷程及4類成員的序列和結(jié)構(gòu)差異,為該家族蛋白功能的闡明及相關(guān)遺傳疾病的診斷與治療提供了重要參考。
www.Chinagene.cn
[1] Levitus M, Waisfisz Q, Godthelp BC, de Vries Y, Hussain S, Wiegant WW, Elghalbzouri-Maghrani E, Steltenpool J, Rooimans MA, Pals G, Arwert F, Mathew CG, Zdzienicka MZ, Hiom K, De Winter JP, Joenje H. The DNA helicase BRIP1 is defective in Fanconi anemia complementation group J, 2005, 37(9): 934–935.
[2] Levran O, Attwooll C, Henry RT, Milton KL, Neveling K, Rio P, Batish SD, Kalb R, Velleuer E, Barral S, Ott J, Petrini J, Schindler D, Hanenberg H, Auerbach AD. The BRCA1-interacting helicase BRIP1 is deficient in Fanconi anemia., 2005, 37(9): 931–933.
[3] Litman R, Peng M, Jin Z, Zhang F, Zhang J, Powell S, Andreassen PR, Cantor SB. BACH1 is critical for homologous recombination and appears to be the Fanconi anemia gene product FANCJ., 2005, 8(3): 255–265.
[4] Cantor SB, Bell DW, Ganesan S, Kass EM, Drapkin R, Grossman S, Wahrer DC, Sgroi DC, Lane WS, Haber DA, Livingston DM. BACH1, a novel helicase-like protein, interacts directly with BRCA1 and contributes to its DNA repair function., 2001, 105(1): 149–160.
[5] Cantor SB, Drapkin R, Zhang F, Lin YF, Han J, Pamidi S, Livingston DM. The BRCA1-associated protein BACH1 is a DNA helicase targeted by clinically relevant inactivating mutations., 2004, 101(8): 2357–2362.
[6] Gupta R, Sharma S, Sommers JA, Jin Z, Cantor SB, Brosh RM Jr. Analysis of the DNA substrate specificity of the human BACH1 helicase associated with breast cancer., 2005, 280(27): 25450–25460.
[7] Kumaraswamy E, Shiekhattar R. Activation of BRCA1/ BRCA2-associated helicase BACH1 is required for timely progression through S phase., 2007, 27(19): 6733–6741.
[8] Wu YL, Shin-ya K, Brosh R M Jr. FANCJ helicase defective in Fanconia anemia and breast cancer unwinds G-quadruplex DNA to defend genomic stability., 2008, 28(12): 4116–4128.
[9] Bridge WL, Vandenberg CJ, Franklin RJ, Hiom K. The BRIP1 helicase functions independently of BRCA1 in the Fanconi anemia pathway for DNA crosslink repair., 2005, 37(9): 953–957.
[10] Cheung I, Schertzer M, Rose A, Lansdorp PM. Disruption of dog-1 in Caenorhabditis elegans triggers deletions upstream of guanine-rich DNA., 2002, 31(4): 405–409.
[11] Friedberg EC, Bardwell AJ, Bardwell L, Feaver WJ, Kornberg RD, Svejstrup JQ, Tomkinson AE, Wang ZG. Nucleotide excision repair in the yeast Saccharomyces cerevisiae: its relationship to specialized mitotic recombination and RNA polymerase II basal transcription., 1995, 347(1319): 63–68.
[12] Hoeijmakers JH, Egly JM, Vermeulen W. TFIIH: a key component in multiple DNA transactions., 1996, 6(1): 26–33.
[13] Lehmann AR. The xeroderma pigmentosum group D (XPD) gene: one gene, two functions, three diseases., 2001, 15(1): 15–23.
[14] Fan L, Fuss JO, Cheng QJ, Arvai AS, Hammel M, Roberts VA, Cooper PK, Tainer JA. XPD helicase structures and activities: insights into the cancer and aging phenotypes from XPD mutations., 2008, 133(5): 789–800.
[15] Liu HT, Rudolf J, Johnson KA, McMahon SA, Oke M, Carter L, McRobbie AM, Brown SE, Naismith JH, White MF. Structure of the DNA repair helicase XPD., 2008, 133(5): 801–812.
[16] Wolski SC, Kuper J, H?nzelmann P, Truglio JJ, Croteau DL, Van Houten B, Kisker C. Crystal structure of the FeS cluster–containing nucleotide excision repair helicase XPD., 2008, 6(6): e149.
[17] Skibbens RV. Chl1p, a DNA helicase-like protein in budding yeast, functions in sister-chromatid cohesion., 2004, 166(1): 33–42.
[18] Vasa-Nicotera M, Brouilette S, Mangino M, Thompson JR, Braund P, Clemitson JR, Mason A, Bodycote CL, Raleigh SM, Louis E, Samani NJ. Mapping of a major locus that determines telomere length in humans., 2005, 76(1): 147–151.
[19] Inoue A, Li T, Roby SK, Valentine MB, Inoue M, Boyd K, Kidd VJ, Lahti JM. Loss of ChlR1 helicase in mouse causes lethality due to the accumulation of aneuploid cells generated by cohesion defects and placental malformation., 2007, 6(13): 1646–1654.
[20] Ding H, Schertzer M, Wu XL, Gertsenstein M, Selig S, Kammori M, Pourvali R, Poon S, Vulto I, Chavez E, Tam PPL, Nagy A, Lansdorp PM. Regulation of murine telomere length by: an essential gene encoding a helicase-like protein., 2004, 117(7): 873–886.
[21] Wu XL, Sandhu S, Ding H. Establishment of conditional knockout alleles for the gene encoding the regulator of telomere length (RTEL)., 2007, 45(12): 788–792.
[22] Barber LJ, Youds JL, Ward JD, McIlwraith MJ, O’Neil NJ, Petalcorin MIR, Martin JS, Collis SJ, Cantor SB, Auclair M, Tissenbaum H, West SC, Rose AM, Boulton SJ. RTEL1 maintains genomic stability by suppressing homologous recombination., 2008, 135(2): 261–271.
[23] Punta M, Coggill PC, Eberhardt RY, Mistry J, Tate J, Boursnell C, Pang N, Forslund K, Ceric G, Clements J, Heger A, Holm L, Sonnhammer ELL, Eddy SR, Bateman A, Finn RD. The Pfam protein families database., 2012, 40(Database issue): D290–D301.
[24] Katoh K, Standley DM. MAFFT multiple sequence alignment software version 7: improvements in performance and usability., 2013, 30(4): 772–780.
[25] Guindon S, Dufayard JF, Lefort V, Anisimova M, Hordijk W, Gascuel O. New algorithms and methods to estimate maximum-likelihood phylogenies: assessing the performance of PhyML 3.0., 2010, 59(3): 307–321.
[26] Darriba D, Taboada GL, Doallo R, Posada D. ProtTest 3: fast selection of best-fit models of protein evolution., 2011, 27(8): 1164–1165.
[27] Bailey TL, Williams N, Misleh C and Li W W. MEME: discovering and analyzing DNA and protein sequence motifs., 2006, 34(Web Server issue): W369- W373.
[28] Arnold K, Bordoli L, Kopp J, Schwede T. The SWISS- MODEL workspace: a web-based environment for protein structure homology modelling., 2006, 22(2): 195–201.
[29] Frickey T, Lupas A. CLANS: a Java application for visualizing protein families based on pairwise similarity., 2004, 20(18): 3702–3704.
[30] Berbee ML, Taylor JW. Dating the evolutionary radiations of the true fungi., 1993, 71(8): 1114–1127.
[31] Trautwein MD, Wiegmann BM, Beutel R, Kjer KM, Yeates DK. Advances in insect phylogeny at the dawn of the postgenomic era., 2012, 57: 449–468.
[32] Fairman-Williams ME, Guenther UP, Jankowsky E. SF1 and SF2 helicases: family matters., 2010, 20(3): 313–324.
[33] White M F. Structure, function and evolution of the XPD family of iron-sulfur-containing 5′→3′ DNA helicases., 2009, 37(Pt 3): 547–551.
(責(zé)任編委: 黃原)
Structure and evolution of the eukaryotic FANCJ-like proteins
Wuhe Jike1, Zefeng Wu1, Sanhong Fan1,2, Xuguang Xi1
The FANCJ-like protein family is a class of ATP-dependent helicases that can catalytically unwind duplex DNA along the 5′-3′ direction. It is involved in the processes of DNA damage repair, homologous recombination and G-quadruplex DNA unwinding, and plays a critical role in maintaining genome integrity. In this study, we systemically analyzed FNACJ-like proteins from 47 eukaryotic species and discussed their sequences diversity, origin and evolution, motif organization patterns and spatial structure differences. Four members of FNACJ-like proteins, including XPD, CHL1, RTEL1 and FANCJ, were found in eukaryotes, but some of them were seriously deficient in most fungi and some insects. For example, the Zygomycota fungi lost RTEL1, Basidiomycota and Ascomycota fungi lost RTEL1 and FANCJ, and Diptera insect lost FANCJ. FANCJ-like proteins contain canonical motor domains HD1 and HD2, and the HD1 domain further integrates with three unique domains Fe-S, Arch and Extra-D. Fe-S and Arch domains are relatively conservative in all members of the family, but the Extra-D domain is lost in XPD and differs from one another in rest members. There are 7, 10 and 2 specific motifs found from the three unique domains respectively, while 5 and 12 specific motifs are found from HD1 and HD2 domains except the conserved motifs reported previously. By analyzing the arrangement pattern of these specific motifs, we found that RTEL1 and FANCJ are more closer and share two specific motifs Vb2 and Vc in HD2 domain, which are likely related with their G-quadruplex DNA unwinding activity. The evidence of evolution showed that FACNJ-like proteins were originated from a helicase, which has a HD1 domain inserted by extra Fe-S domain and Arch domain. By three continuous gene duplication events and followed specialization, eukaryotes finally possessed the current four members of FANCJ-like proteins.
FANCJ-like proteins; helicase; phylogeny; conserved motifs; spatial structure
2014-04-05;
2014-05-09
國家自然科學(xué)基金項目(編號:31370798, 11304252)資助
吉克伍合,碩士研究生,專業(yè)方向:分子進(jìn)化與系統(tǒng)發(fā)育分析。E-mail:wuhe@nwsuaf.edu.cn
范三紅,博士,副教授,研究方向:生化與分子生物學(xué),生物信息學(xué)。E-mail:shfan@nwsuaf.edu.cn奚緒光,博士,教授,研究方向:生物大分子的結(jié)構(gòu)與功能。E-mail:xxi01@ens-cachan.fr
10.16288/j.yczz.14-115
網(wǎng)絡(luò)出版時間: 2014-11-19 16:46:08
URL: http://www.cnki.net/kcms/detail/11.1913.R.20141119.1646.001.html