国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

植物活性長末端重復(fù)序列反轉(zhuǎn)錄轉(zhuǎn)座子研究進(jìn)展

2016-07-04 07:06梁琳琳周明兵
生物工程學(xué)報 2016年4期
關(guān)鍵詞:轉(zhuǎn)座子結(jié)構(gòu)域基因組

梁琳琳,周明兵

浙江農(nóng)林大學(xué) 亞熱帶森林培育國家重點(diǎn)實(shí)驗(yàn)室培育基地,浙江 臨安 311300

?

植物活性長末端重復(fù)序列反轉(zhuǎn)錄轉(zhuǎn)座子研究進(jìn)展

梁琳琳,周明兵

浙江農(nóng)林大學(xué) 亞熱帶森林培育國家重點(diǎn)實(shí)驗(yàn)室培育基地,浙江 臨安311300

梁琳琳, 周明兵. 植物活性長末端重復(fù)序列反轉(zhuǎn)錄轉(zhuǎn)座子研究進(jìn)展. 生物工程學(xué)報, 2016, 32(4): 409–429.

Liang LL, Zhou MB. Plant active LTR retrotransposons: a review. Chin J Biotech, 2016, 32(4): 409–429.

摘要:長末端重復(fù)序列 (Long terminal repeat,LTR) 反轉(zhuǎn)錄轉(zhuǎn)座子是真核生物基因組中普遍存在的一類可移動的DNA序列,它們以RNA為媒介,通過“復(fù)制粘貼”機(jī)制在基因組中不斷自我復(fù)制。在高等植物中,許多活性的LTR反轉(zhuǎn)錄轉(zhuǎn)座子已被詳盡研究并應(yīng)用于分子標(biāo)記技術(shù)、基因標(biāo)簽、插入型突變及基因功能等分析。本文對植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)行全面的調(diào)查,并對其結(jié)構(gòu)、拷貝數(shù)和分布以及轉(zhuǎn)座特性進(jìn)行系統(tǒng)的歸納,分析了植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的gag (種屬特異抗原) 和pol (聚合酶) 序列特征,以及LTR序列中順式調(diào)控元件的分布。研究發(fā)現(xiàn)自主有活性的LTR反轉(zhuǎn)錄轉(zhuǎn)座子必須具備LTR區(qū)域以及編碼Gag、Pr、Int、Rt 和Rh蛋白的基因區(qū)。其中兩端LTR區(qū)域具有高度同源性且富含順式調(diào)控元件;Rt蛋白必備RVT結(jié)構(gòu)域;Rh蛋白必備RNase_H1_RT結(jié)構(gòu)域。這些結(jié)果為后續(xù)植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的鑒定和功能分析奠定了重要基礎(chǔ)。

關(guān)鍵詞:長末端重復(fù)序列反轉(zhuǎn)錄轉(zhuǎn)座子,轉(zhuǎn)座,LTR,gag,pol

Received: June17, 2015; Accepted: August 19, 2015

Supported b y: Natural Science Foundation of Zhejiang (No. LR12C16001), National Natural Science Foundation of China (Nos. 31270645, 31470615).

浙江省自然科學(xué)基金 (No. LR12C16001),國家自然科學(xué)基金 (Nos. 31270645, 31470615) 資助。

轉(zhuǎn)座子 (Transposable elements,TEs或transposons) 是指在基因組上能從同一條染色體的一個位置轉(zhuǎn)移到另一個位置或者從一條染色體轉(zhuǎn)移到另一條染色體上的一段DNA序列[1-2],最早的轉(zhuǎn)座子是20世紀(jì)40年代末Barbara McClintock在玉米中發(fā)現(xiàn)的 (Ac/Ds轉(zhuǎn)座子)[3]。

轉(zhuǎn)座子分為DNA轉(zhuǎn)座子和反轉(zhuǎn)錄轉(zhuǎn)座子兩大類。DNA轉(zhuǎn)座子在DNA介導(dǎo)下,通過“剪切粘貼”的方式進(jìn)行轉(zhuǎn)座。目前發(fā)現(xiàn)DNA轉(zhuǎn)座子有Tc1-Mariner、hAT、Mutator、Merlin、Transib、P、PiggyBac、PIF-Harbinger和CACTA類型。反轉(zhuǎn)錄轉(zhuǎn)座子在RNA介導(dǎo)下,通過“復(fù)制粘貼”的方式進(jìn)行轉(zhuǎn)座,根據(jù)是否含有長末端重復(fù)序列 (LTR) 又可進(jìn)一步分為含有LTR的長末端重復(fù)序列(Long-terminal repeat,LTR) 和不含有LTR的非長末端重復(fù)序列(Non-long terminal repeat,non-LTR)[4]。LTR具有Ty3/Gypsy、Ty1/Copia、Bel/Pao、花椰菜花葉病毒(Caulimoviridae)、反轉(zhuǎn)錄病毒 (Retroviridae)、反轉(zhuǎn)錄轉(zhuǎn)座子大片段 (Large retrotransposons derivatives,LARD) 和微型末端重復(fù)反轉(zhuǎn)錄轉(zhuǎn)座子 (Terminal-repeat retrotransposons in miniature,TRIM) 七類。根據(jù)轉(zhuǎn)座子的長度、LTR的長度和物種分布,植物中的Ty1/Copia可分為Tork、Retrofit、Oryco和Sire 4種類型;Ty3/Gypsy可分為Tat、Athila、CRM、Reina、Del和Galadriel六種類型[5]。LTR反轉(zhuǎn)錄轉(zhuǎn)座子有自主轉(zhuǎn)座子和非自主轉(zhuǎn)座子兩種。自主轉(zhuǎn)座子結(jié)構(gòu)完整,具有自主轉(zhuǎn)座功能;而非自主轉(zhuǎn)座子結(jié)構(gòu)不完整,所以單獨(dú)存在時是不能轉(zhuǎn)座的,只有在自主轉(zhuǎn)座子的協(xié)助下才能發(fā)生轉(zhuǎn)座。

植物L(fēng)TR反轉(zhuǎn)錄轉(zhuǎn)座子長度通常在2?18 kb之間,兩端各有一個長度約100?5 000 bp正向重復(fù)的長末端重復(fù)序列 (LTRs)。LTR末端為反向重復(fù)序列,通常為5′-TG…CA-3′。在5′和3′末端兩側(cè)通常具有4?6 bp的錨定重復(fù)位點(diǎn)(TSR)[6]。反轉(zhuǎn)錄轉(zhuǎn)座子LTRs不編碼蛋白質(zhì),但包含轉(zhuǎn)錄的起始信號和終止信號,內(nèi)部有1?3個開放閱讀框 (ORF) 編碼轉(zhuǎn)座所需的酶類,結(jié)構(gòu)與反轉(zhuǎn)錄病毒十分相似。內(nèi)部的編碼區(qū)主要包括2個與轉(zhuǎn)座有關(guān)的基因,即gag基因、pol基因。gag基因編碼的蛋白質(zhì)參與反轉(zhuǎn)錄轉(zhuǎn)座子RNA的成熟與包裝,使反轉(zhuǎn)錄轉(zhuǎn)座子的RNA整合到基因組。pol基因是反轉(zhuǎn)錄轉(zhuǎn)座子復(fù)制和轉(zhuǎn)座所必需的基因,編碼蛋白酶 (pr)、整合酶(int)、反轉(zhuǎn)錄酶 (rt) 和RNA酶 (rh)[6]。

LTR反轉(zhuǎn)錄轉(zhuǎn)座子轉(zhuǎn)座非常復(fù)雜。首先在細(xì)胞核內(nèi)轉(zhuǎn)錄形成mRNA分子,從5′端LTR的R區(qū)起始轉(zhuǎn)錄,到3′端LTR的R區(qū)終止,轉(zhuǎn)錄本末端為poly(A)結(jié)構(gòu)。該mRNA分子既需作為復(fù)制所需的模板,又要翻譯為復(fù)制相關(guān)的蛋白質(zhì)。反轉(zhuǎn)錄反應(yīng)發(fā)生在細(xì)胞質(zhì)中,一部分mRNA編碼復(fù)制所需的蛋白質(zhì);另一部分包裹在gag編碼的結(jié)構(gòu)蛋白里面,形成病毒樣顆粒 (Virus like particles,VLPs),作為反轉(zhuǎn)錄的模板,通過rt合成第1條cDNA負(fù)鏈,再以此為模板合成第2條正鏈。cDNA負(fù)鏈以宿主細(xì)胞內(nèi)對應(yīng)的tRNA作引物,mRNA5′端LTR下游的PBS位點(diǎn)與tRNA起始甲硫氨酸 (tRNAiMet) 的3′端序列互補(bǔ)形成短的RNA雙鏈,rt利用tRNA3′端自由羥基為引物,合成互補(bǔ)的DNA雜交鏈。編碼的rh水解雜交鏈上的RNA,釋放cDNA負(fù)鏈,以位于3′端LTR上游的PPT作為引物,引導(dǎo)第2 條DNA的合成。最后,核酸內(nèi)切酶使染色體上靶位點(diǎn)的DNA雙鏈斷開,具有反轉(zhuǎn)錄轉(zhuǎn)座子完整結(jié)構(gòu)的雙鏈DNA被轉(zhuǎn)移至細(xì)胞核內(nèi),插入靶位點(diǎn),完成轉(zhuǎn)座過程[7]。

LTR反轉(zhuǎn)錄轉(zhuǎn)座子通常情況下是以靜止?fàn)顟B(tài)存在的,其大量存在極大地影響植物基因組的穩(wěn)定性,因此植物在進(jìn)化過程中逐漸形成了甲基化、重組、突變以及小RNA介導(dǎo)的基因沉默等措施,從而抑制了反轉(zhuǎn)錄轉(zhuǎn)座子的轉(zhuǎn)座活性,起到維持基因組穩(wěn)定性的作用[8-10]。即使有活性的反轉(zhuǎn)錄轉(zhuǎn)座子也受到嚴(yán)格調(diào)節(jié),還有一些轉(zhuǎn)座子只轉(zhuǎn)錄不整合,可能轉(zhuǎn)錄后的修飾阻止了其發(fā)生轉(zhuǎn)座。轉(zhuǎn)座過程中轉(zhuǎn)錄、RNA加工、mRNA的輸出、翻譯后的修飾、插入核酸、反轉(zhuǎn)錄和整合[11]任何一步出錯都可能限制反轉(zhuǎn)錄轉(zhuǎn)座子的轉(zhuǎn)座活性,因此轉(zhuǎn)座的發(fā)生非常少。當(dāng)植物受到外界條件影響,尤其是逆境時,反轉(zhuǎn)錄轉(zhuǎn)座子會被激活并插入到靶基因中,同時,周邊基因的表達(dá)也會受到影響[12]。本文對植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)行全面的調(diào)查,并對活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的結(jié)構(gòu)、拷貝數(shù)和分布以及轉(zhuǎn)座特性進(jìn)行系統(tǒng)的歸納,而后進(jìn)一步分析不同植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子gag和pol的序列特征及LTR序列的順式作用元件分布。該研究為后續(xù)植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的功能和轉(zhuǎn)座特性分析奠定了基礎(chǔ)。

1 植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

目前在不同的植物中發(fā)現(xiàn)了活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子,達(dá)10余種以上,其中廣泛應(yīng)用的有水稻中的Tos17、RIRE7,煙草中的Tnt 1、Tto1,小麥屬中的BARE-1、OARE-1和Ttd1a,玉米中的PREM-2、Zeon-1,擬南芥中的EVD,百脈根中的LORE1,甜橙中的CIRE1和番茄中的TLC1-1。其中Tos17和Zeon-1是非自主活性反轉(zhuǎn)錄轉(zhuǎn)座子。各活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的結(jié)構(gòu)信息歸納在表1。

1.1水稻中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

目前在水稻基因組中發(fā)現(xiàn)了2個活性反轉(zhuǎn)錄轉(zhuǎn)座子Tos17、RIRE7,分別屬于Ty1-copia類和Ty3-gypsy類。

Tos17是來源于水稻Oryza sativa L.基因組的活性反轉(zhuǎn)錄轉(zhuǎn)座子。Tos17長3 986 bp,LTR 長138 bp。編碼區(qū)的結(jié)構(gòu)為pr-int-rt-rh,缺乏gag,故屬于非自主轉(zhuǎn)座子[13]。PBS序列為TGGTATCAGAGC,PPT序列為GAAGGGGGG。末端為5′-TG…CA-3′的反向重復(fù)序列。

Tos17在組織培養(yǎng)誘導(dǎo)下,拷貝數(shù)增加至5?30個,插入位點(diǎn)偏好于基因富集區(qū)域,可識別回文序列ANGTT-TSD-AACNT,在宿主基因組中側(cè)翼為5 bp的重復(fù)[N(A/T)(A/T)(A/T)N]。水稻轉(zhuǎn)座子Tos17和甲基化程度有關(guān),在組織培養(yǎng)過程中位于日本晴Nipponbare第7染色體上的1個Tos17拷貝 (Tos17chr.7) 甲基化程度降低,其轉(zhuǎn)座活性增加;而在再生植株的生長過程中,隨著Tos17的甲基化程度逐漸增加,轉(zhuǎn)座子的轉(zhuǎn)座活性也降低或失活,證明Tos17的轉(zhuǎn)座是受甲基化控制的。另外,大多數(shù)水稻材料基因組中Tos17可以被組織培養(yǎng)激活,但粳稻Moritawase基因組中的Tos17卻不能,但是對粳稻種子用去甲基化試劑5-azaC進(jìn)行處理后,Moritawase中的Tos17也可以被激活[14]。此外,在SDG714RNAi轉(zhuǎn)化株或DNA糖基酶/裂解酶DNG701過表達(dá)時,H3K9me2表達(dá)降低會誘發(fā)低甲基化和Tos17的轉(zhuǎn)座激活[15-16]。

表1 活性LTR 反轉(zhuǎn)錄轉(zhuǎn)座子結(jié)構(gòu)Table 1The structure of active LTR retrotransposons

利用Tos17插入到染色體的不同位點(diǎn)[17],產(chǎn)生了Osaba1 和Ostatc突變體,成功地用作基因標(biāo)簽克隆了脫落酸生物合成途徑中的Osaba1 和Ostatc基因[18]。另外,該轉(zhuǎn)座子已經(jīng)應(yīng)用于鑒定水稻功能基因的研究,獲得了很多的插入系,在不同的染色體上鑒定到了大量的突變體,其中發(fā)芽率相關(guān)表型3 489個、生長率相關(guān)表型5 024個、葉色相關(guān)表型6 439個、葉形相關(guān)表型3 727個、稈形相關(guān)表型8 772個、抗性相關(guān)表型1 102個、分蘗期相關(guān)表型376個、抽穗期相關(guān)表型3 137個、花期相關(guān)表型719個、花序相關(guān)表型2 864個、育性相關(guān)表型16 367個、種子相關(guān)表型4 192個 (https://tos.nias.affrc. go.jp/);并分離到了OSH15[19]、MSP1[20]、GAMYB[21]、PAIR2[22]和淀粉合成酶[23]基因。其中OSH15在水稻節(jié)間發(fā)育過程中起作用[19]。

RIRE7[24]是水稻基因組中的另一個活性反轉(zhuǎn)錄轉(zhuǎn)座子。RIRE7長7 391 bp,LTR長858 bp。編碼區(qū)的結(jié)構(gòu)為gag-pr-rt-rh-int。PBS序列為TGGTATCAGAGC,PPT序列為AAGAAG GGGAGGA。末端為5′-TG…CA-3′的反向重復(fù)序列。

該轉(zhuǎn)座子偏好插入到染色體近著絲粒區(qū)域155 bp的串聯(lián)重復(fù)序列 (Tandem repeat sequence,TrsD) 內(nèi)。熒光原位雜交技術(shù)表明RIRE 7和TrsD都位于染色體的著絲粒區(qū)域,屬于水稻染色體近著絲粒異染色質(zhì)的保守組分[24]。

1.2煙草中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

目前在煙草基因組發(fā)現(xiàn)了2個活性反轉(zhuǎn)錄轉(zhuǎn)座子Tnt1、Tto1,均屬于Ty1-copia類。

Tnt1[25]是來源于煙草Nicotiana tabacum基因組中的活性反轉(zhuǎn)錄轉(zhuǎn)座子。Tnt1長5 334 bp,LTR長610 bp。只有一個ORF,編碼1 328個氨基酸,編碼區(qū)的結(jié)構(gòu)為gag-pr-int-rt-rh。PBS序列為TGGTATCAGAGC,PPT序列為GGAGGGGGAG。末端為5′ -TG…CA- 3′的反向重復(fù)序列。

Tnt1在單倍體中拷貝數(shù)>100,插入位點(diǎn)偏好于基因富集區(qū)域,在宿主基因組中側(cè)翼為5 bp的重復(fù)。Tnt1在正常情況下也有轉(zhuǎn)錄活性,轉(zhuǎn)座活性具有組織特異性,只在根中表達(dá)[26];而煙草葉組織分離的原生質(zhì)體中 Tnt1高誘導(dǎo)表達(dá)[26]。同時,在原生質(zhì)體誘導(dǎo)的細(xì)胞培養(yǎng)再生體系中檢測到 Tnt1轉(zhuǎn)座到煙草的nia (Nitrate reductase) 基因內(nèi)部[25]。在LTR的U3區(qū)域含有順式調(diào)控元件控制Tnt1表達(dá)[26-27]。

將Tnt1導(dǎo)入擬南芥后發(fā)現(xiàn)了轉(zhuǎn)座,之后又相繼將其導(dǎo)入番茄和水稻中,均在新的宿主中進(jìn)行了表達(dá),并且發(fā)現(xiàn)宿主的內(nèi)源轉(zhuǎn)座子不影響異源轉(zhuǎn)座子的轉(zhuǎn)座,說明Tnt1反轉(zhuǎn)錄轉(zhuǎn)座子不受植物種類差異的限制,利用該特性Tnt1可作為載體系統(tǒng)應(yīng)用于植物進(jìn)化分析[28]。另外,利用Tnt1的插入突變可作為基因標(biāo)簽應(yīng)用于馬鈴薯[29]和豆類植物[30]功能基因的研究。

Tto1[31]是煙草基因組中的另一個活躍的反轉(zhuǎn)錄轉(zhuǎn)座子。Tto1長5 300 bp,LTR長574 bp。只有一個ORF,編碼1 338個氨基酸,編碼區(qū)的結(jié)構(gòu)為gag-pr-int-rt-rh。PBS序列為TGGTATC AGAGC,PPT序列為GGAAGGGGGAGAG。末端為5′-TG…CA-3′的反向重復(fù)序列。

Tto1拷貝數(shù)為30[27,32]。在組織培養(yǎng)的細(xì)胞內(nèi)有轉(zhuǎn)錄活性,在原生質(zhì)體細(xì)胞內(nèi)轉(zhuǎn)錄增加。Tto1[33]能夠通過生物因素 (如Crown rust fungus) 或非生物因素 (如機(jī)械作用、水楊酸、茉莉酮酸等) 刺激而激活轉(zhuǎn)座。一個13 bp的重復(fù)區(qū)域作為順式調(diào)控元件調(diào)控Tto1表達(dá)[33]。

Ttol在正常情況下具有轉(zhuǎn)錄活性[26],且其能在水稻中通過反轉(zhuǎn)錄進(jìn)行自主轉(zhuǎn)座[32],因此可以用作植物轉(zhuǎn)基因的基因轉(zhuǎn)移載體[31]。

1.3小麥屬中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

在小麥屬基因組中發(fā)現(xiàn)了3個活性反轉(zhuǎn)錄轉(zhuǎn)座子BARE-1、OARE-1和Ttd1a,均屬于Ty1-copia類。

BARE-1[34](Barley retroelement 1) 是來源于大麥Hordeum vulgare L. 基因組中的活性反轉(zhuǎn)錄轉(zhuǎn)座子。BARE-1長13 271 bp,5′LTR長1 829 bp,3′LTR長4 986 bp。BARE-1只有一個ORF區(qū),依賴于TATA 1和TATA 2盒,有3個不同的轉(zhuǎn)錄類別[35]。編碼區(qū)的結(jié)構(gòu)為gag-print-rt-rh。PBS序列為TGGCATCGTGAGC TAGGTT,PPT序列為AGTGCAAGTGGGAG,末端為5′-TG…CA-3′的反向重復(fù)序列。

在單倍體基因組中拷貝數(shù)1.4×104[34,36],在宿主基因組中側(cè)翼為4 bp的重復(fù) (5′-GAAC-3′)。BARE-1的插入位點(diǎn)是染色體的遠(yuǎn)端[37]。BARE-1轉(zhuǎn)座子具有組織特異性,在愈傷組織和葉誘導(dǎo)的原生質(zhì)體中表達(dá)[11];在正常組織中無活性,在脫落酸脅迫下可被激活。

Kalendar等[38]應(yīng)用反轉(zhuǎn)錄轉(zhuǎn)座子位點(diǎn)間擴(kuò)增多態(tài)性 (IRAP) 和反轉(zhuǎn)錄轉(zhuǎn)座子微衛(wèi)星擴(kuò)增多態(tài)性 (REMAP) 標(biāo)記技術(shù)檢測大麥屬BARE-1的多態(tài)性,均獲得了所測各個種及大麥品種的DNA印跡,證明野生大麥Hordeam spontaneum種群的基因組多樣性是BARE-1家族轉(zhuǎn)座活性表達(dá)或缺失的結(jié)果。并運(yùn)用所獲得的BARE-1多態(tài)性數(shù)據(jù),建立了能良好反映大麥屬親緣關(guān)系的進(jìn)化圖。

OARE-1[39](Oat retroelement 1) 是來源于燕麥Avena sativa L. 基因組中的活性反轉(zhuǎn)錄轉(zhuǎn)座子,是BARE-1亞家族的一個成員。OARE-1長8 665 bp,5′LTR長1 714 bp,3′LTR長1 717 bp。編碼區(qū)的結(jié)構(gòu)為gag-pr-int-rt-rh。PBS序列為TGGTATCAGAGCTAGATCTAT,PPT序列為AAGTGGGAGA。末端為5′-TG…CA-3′的反向重復(fù)序列。

在六倍體的燕麥基因組中具有多拷貝,拷貝數(shù)在10 000以上。在宿主基因組中側(cè)翼為5 bp的重復(fù) (5′-GGGAC-3′)[39]。OARE-1表達(dá)可通過物理作用 (如機(jī)械作用,紫外光) 和化學(xué)作用(如茉莉酮酸和水楊酸) 脅迫誘導(dǎo),模式與基因PAL (Phenylalanin ammonialyase) 相類似;此外,OARE-1 在冠銹病侵染時具有高活性。OARE-1 在非生物誘導(dǎo)因素 (水楊酸、茉莉酮酸)和生物 (如Crown rust fungus) 因素作用下,可誘導(dǎo)葉肉細(xì)胞合成植物抗毒素,導(dǎo)致植物的防御反應(yīng)[40]。

Ttd1a是來源于硬質(zhì)小麥Triticum durum L.基因組中的活性反轉(zhuǎn)錄轉(zhuǎn)座子。Ttd1a長5 275 bp,LTR長304 bp。具有兩個int區(qū)域,編碼區(qū)的結(jié)構(gòu)為gag-pr-int-int-rt-rh。PBS序列為TGAGGTTTAGATTGAGGGGGAG。末端為5′-TG…CA-3′的反向重復(fù)序列。插入位點(diǎn)位于抗性基因附近[41],轉(zhuǎn)座只發(fā)生在脅迫條件生長的植株中,當(dāng)轉(zhuǎn)座發(fā)生在L2層細(xì)胞時,幼葉新的插入可傳遞給后代。在光照和鹽脅迫條件下,Ttd1a可以與啟動子結(jié)合進(jìn)行轉(zhuǎn)錄。在LTR的U3區(qū)域Ttd1a啟動子含有順式調(diào)控元件,它們的序列與轉(zhuǎn)錄因子結(jié)合位點(diǎn)高度相似,控制著轉(zhuǎn)座子的轉(zhuǎn)錄活性。

1.4玉米中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

在玉米基因組發(fā)現(xiàn)了2個活性反轉(zhuǎn)錄轉(zhuǎn)座子PREM-2、Zeon-1,分別屬于Ty1-copia類和Ty3-gypsy類。

PREM (Pollen retroelement maize) 是來源于玉米Zea mays L. 基因組中的活性反轉(zhuǎn)錄轉(zhuǎn)座子。PREM-2長9 439 bp,LTR長1 307 bp。具有兩個gag區(qū)域,編碼區(qū)的結(jié)構(gòu)為gag-gag-print-rt-rh。PBS序列為TGGTATCAGAGC,PPT序列為AAAAGGGGGAGA。末端為5′-TG…CA-3′的反向重復(fù)序列。

PREM-2拷貝數(shù)大約30 000[42],在宿主基因組中側(cè)翼為5 bp的重復(fù) (5′-ATTAT-3′)。PREM-2反轉(zhuǎn)錄轉(zhuǎn)座子定向插入到PREM-1LTR中,與PREM-1序列相反[43]。其整合到宿主基因組位于附近基因的上游。PREM-2在正常情況下具有轉(zhuǎn)錄活性,并具有組織特異性,主要在單核的小孢子中表達(dá)[42]。

Zeon-1[44](Zein retrotransposon) 是來源于玉米基因組中的另一個活性反轉(zhuǎn)錄轉(zhuǎn)座子。Zeon-1長7 313 bp,5′LTR長649 bp,3′LTR長663 bp,該轉(zhuǎn)座子只含一個gag基因相關(guān)的ORF,編碼375個氨基酸,故為非自主反轉(zhuǎn)錄轉(zhuǎn)座子。Zeon-1轉(zhuǎn)座需要轉(zhuǎn)錄酶、核糖核酸酶H和整合酶的參與,存在PBS和PPT序列。PBS序列為TGGCGCCCA,PPT序列為AGGGGCT AC。末端為5′-TG…CA-3′的反向重復(fù)序列。

在宿主基因組中側(cè)翼具有5 bp (5′-CCAAT-3′) 的重復(fù)。Zeon-1轉(zhuǎn)座子插入到27 kDa的玉米蛋白基因的S等位基因位置上,在自交系A(chǔ)188未成熟的胚乳中檢測到轉(zhuǎn)錄產(chǎn)物。

1.5擬南芥中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

在擬南芥Arabidopsis thaliana基因組發(fā)現(xiàn)了活性反轉(zhuǎn)錄轉(zhuǎn)座子EVD,屬于Ty1-copia類。EVD (Evadé, French for ‘fugitive’) 長5 326 bp,LTR長403 bp。編碼區(qū)的結(jié)構(gòu)為gag-pr-int-rt-rh。末端為5′-TG…CA-3′的反向重復(fù)序列。

在擬南芥Col-0基因組中,EVD僅保留2個插入位點(diǎn):一個是EVD本身的常染色質(zhì)位點(diǎn)AT5G17125,另一個是近著絲粒的異染色質(zhì)位點(diǎn)AT1G34967,被稱為Attrapé (ATR)。擬南芥野生型和met1或ddm純合子之間的雜交獲得的表觀重組近交系 (epiRILs) 群體中[45-46],EVD重新激活,插入到3個不相關(guān)的位點(diǎn),分別是5號染色體上的LFY基因,4號染色體的BRI1 (Brassinosteriod insensitive 1) 基因和VAR2 (Variegated 2) 基因,且與5′端LTR非甲基化狀態(tài)有關(guān)。EVD通過RDR6合成dsRNA,dsRNA產(chǎn)生siRNA誘導(dǎo)3′gagDNA從頭甲基化,3′gag甲基化啟動反轉(zhuǎn)錄,調(diào)節(jié)LTR的甲基化導(dǎo)致EVD的表觀沉默。當(dāng)RNA介導(dǎo)的DNA甲基化與H3K9me2都不存在時發(fā)生轉(zhuǎn)座[47-48]。該反轉(zhuǎn)錄轉(zhuǎn)座子能影響鄰近基因的染色質(zhì)狀態(tài),以發(fā)育或脅迫應(yīng)答的方式通過細(xì)胞通路促進(jìn)DNA甲基化和轉(zhuǎn)錄水平基因沉默限制基因活性。

由于該轉(zhuǎn)座子具有單一拷貝、內(nèi)源可逆性和靈活性等特性,因此可用于篩選穩(wěn)定的和潛在的適應(yīng)性性狀[48]。 1.6百脈根中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

LORE1 (Lotus retrotransposon 1)[49]是來源于豆科植物百脈根Lotus japonicus的Ty3-gypsy類活性反轉(zhuǎn)錄轉(zhuǎn)座子。LORE1長5 041 bp,LTR 長225 bp。只有一個ORF,編碼1 508個氨基酸,編碼區(qū)的結(jié)構(gòu)為gag-pr-rt-rh-int-chr。PBS序列為TTGGTATCTAGAGCCCTAAGAT T,PPT序列為AAGGGGAGGG。末端為5′-TG…CA-3′的反向重復(fù)序列。

LORE1為低拷貝轉(zhuǎn)座子,拷貝數(shù)為9?10,插入無特異性,偏好于著絲粒異染色質(zhì)的基因富集區(qū)域。LORE1 在完整植株中活躍,在雜交后代中可檢測到新的插入位點(diǎn);此外,在愈傷組織再生的植株中具有活性,認(rèn)為可能其在體外組織培養(yǎng)極端環(huán)境條件下被激活[49]。

LORE1是插入均一、低拷貝和配子特異性[50]的反轉(zhuǎn)錄轉(zhuǎn)座子,可誘導(dǎo)獲得突變體[51],利用LORE1插入偏好于基因外顯子區(qū)域和后代穩(wěn)定性等特性用作側(cè)翼序列標(biāo)簽,成功篩選到Pir1[52]、Nup133[53]、Castor、Nfr5[54]、Nin[49]以及Nin的兩個等位基因共7個基因。其中Nup133、Castor、Nfr5 、Nin以及Nin的兩個等位基因都與根瘤菌和根菌共生的信號轉(zhuǎn)導(dǎo)通路有關(guān)。

1.7甜橙中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

CIRE1[55]是來源于甜橙Citrus sinensis基因組的Ty1-copia類活性反轉(zhuǎn)錄轉(zhuǎn)座子。CIRE 1長5 044 bp,LTR長461 bp。一個ORF為4 002 bp,編碼區(qū)的結(jié)構(gòu)為gag-pr-int-rt-rh。PBS序列為TTGGTATCTAGAGCCCTAAGATTC。末端為5′-TG…CA-3′的反向重復(fù)序列。CIRE1在單倍體基因組拷貝數(shù)平均為2 200。CIRE1轉(zhuǎn)座子具有組織特異性,正常情況下僅在根中表達(dá)。經(jīng)機(jī)械作用和植物激素 (萘乙酸或茉莉酸甲酯) 處理后,在葉中的轉(zhuǎn)錄增加,且轉(zhuǎn)錄產(chǎn)物具有同源性,認(rèn)為CIRE1具有潛在活性。CIRE1的5′LTR在異源宿主中可啟動報告基因的轉(zhuǎn)錄和瞬時表達(dá)。

1.8番茄中的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子

TLC1-1[56]是來源于智利番茄Lycopersicon chilense基因組的Ty1-copia類活性反轉(zhuǎn)錄轉(zhuǎn)座子。TLC1-1長5 248 bp,5′LTR長578 bp,3′LTR 長562 bp。只有單一的ORF為3 987 bp,編碼區(qū)的結(jié)構(gòu)為gag-pr-int-rt-rh。末端為5′-TG…CA-3′的反向重復(fù)序列。在單倍體基因組中拷貝數(shù)為900。該轉(zhuǎn)座子具有組織特異性,只在葉誘導(dǎo)的原生質(zhì)體[57]和根中表達(dá)。在機(jī)械損傷、原生質(zhì)體培養(yǎng)和脅迫條件下,TLC1-1具有轉(zhuǎn)錄活性并進(jìn)行表達(dá)。在LTR的U3區(qū)域有2個57 bp的串聯(lián)重復(fù)序列 (TSR1、TSR2) 和8 bp的ERE (Ethylene-responsive element,ATTTCAAA) 區(qū)域,后者位于啟動子區(qū)域,為乙烯誘導(dǎo)的順式調(diào)控元件[56]。

2 活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子特征分析

為了獲得活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的LTR序列和各個蛋白結(jié)構(gòu)域的結(jié)構(gòu)特性,在NCBI上下載上述活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的序列,根據(jù)各個LTR反轉(zhuǎn)錄轉(zhuǎn)座子結(jié)構(gòu)注釋,分別獲得各個活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的LTR區(qū)域、gag基因區(qū)、pr基因區(qū)、int基因區(qū)、rt基因區(qū)和rh基因區(qū)。利用這些序列信息分析這些活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的進(jìn)化關(guān)系和結(jié)構(gòu)特征,歸納出植物活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的結(jié)構(gòu)特點(diǎn)。

2.1活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子結(jié)構(gòu)和進(jìn)化分析

根據(jù)獲得的各個活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子結(jié)構(gòu)區(qū)域 (LTR區(qū)域、gag基因區(qū)、pr基因區(qū)、int基因區(qū)、rt基因區(qū)和rh基因區(qū)) 的長度 (堿基數(shù)),利用EXCEL條形圖展示各個LTR反轉(zhuǎn)錄轉(zhuǎn)座子的結(jié)構(gòu) (圖1,右)。利用各個自主活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的rt基因序列通過MEGA6軟件中Neighbor-Joining方法構(gòu)建進(jìn)化樹 (重復(fù)1 000次,圖1,左)。

圖1 活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子聚類分析圖Fig. 1 Active LTR retrotransposons phylogenic analysis. Left: the evolutionary tree of active LTR retrotransposons. Right: the structure of corresponding active LTR retrotransposons. Orange represents LTR region, white represents the interval, purple represents gag gene region, gray represents pr gene region, blue represents int gene region, yellow represents rt gene region, black represents rh gene region. The line length represents the base number of each active LTR retrotransposons.

進(jìn)化樹結(jié)果表明,活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子主要集中于Tork類,包括有TLC1-1、Tnt1、Tto1、CIRE1、BARE-1和OARE-1,這可能與Tork類反轉(zhuǎn)錄轉(zhuǎn)座子在植物基因組分布廣泛和數(shù)量眾多有關(guān)[58-59];其次是Retrofit類,包括有EVD、Ttd1a;而PREM-2為Sire類;RIRE7為CRM類。另外,Tos17、LORE1被單獨(dú)分成一類。據(jù)此可知,Tos17、TLC1-1、Tnt1、Tto1、CIRE1、BARE-1、OARE-1、EVD、Ttd1a和PREM-2屬于Ty1-copia類反轉(zhuǎn)錄轉(zhuǎn)座子,而LORE1、RIRE7屬于Ty3-gypsy類反轉(zhuǎn)錄轉(zhuǎn)座子。

圖中各個活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的長度差異較大,但是結(jié)構(gòu)類似,均含有兩個LTR區(qū)域、gag基因區(qū)、pr基因區(qū)、int基因區(qū)、rt基因區(qū)和rh基因區(qū)。其中Ty1-copia類反轉(zhuǎn)錄轉(zhuǎn)座子的int基因區(qū)位于rt基因區(qū)和rh基因區(qū)之前,而Ty3-gypsy類反轉(zhuǎn)錄轉(zhuǎn)座子的int基因區(qū)位于rt基因區(qū)和rh基因區(qū)之后。各活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的LTR區(qū)域差異很大,從138 bp到1 829 bp不等;pr基因區(qū)從222 bp到522 bp不等。Ty1-copia類反轉(zhuǎn)錄轉(zhuǎn)座子各int基因區(qū)、rt基因區(qū)和rh基因區(qū)差異不大,Ty3-gypsy類反轉(zhuǎn)錄轉(zhuǎn)座子各int基因區(qū)、rt基因區(qū)和rh基因區(qū)相差也不大。其中Tos17沒有g(shù)ag基因區(qū),PREM-2具有兩個gag基因區(qū),Ttd1a具有兩個int基因區(qū)。這些結(jié)果表明,活性自主反轉(zhuǎn)錄轉(zhuǎn)座子必須具備編碼Gag、Pr、Int、Rt、Rh蛋白的能力。

2.2活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的結(jié)構(gòu)域分析

為了進(jìn)一步分析活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子gag、pr、int、rt和rh的氨基酸序列特征,利用DNAMAN軟件翻譯出各個自主活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子上述各基因區(qū)的氨基酸序列。利用NCBI在線Blast分析各氨基酸序列,將保守結(jié)構(gòu)域利用DNAMAN進(jìn)行比對,并利用WebLogo在線軟件 (http://weblogo.berkeley.edu/logo.cgi)作圖,分析活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子編碼蛋白的特征性結(jié)構(gòu)域 (圖2?6)。

2.2.1Gag蛋白結(jié)構(gòu)特征

Gag蛋白具有4個保守結(jié)構(gòu)域 (gag-BOX1、gag-BOX2、gag-BOX3和gag-BOX4)。在Ty1-copia類反轉(zhuǎn)錄轉(zhuǎn)座子中,gag-BOX1、 gag-BOX2和gag-BOX3結(jié)構(gòu)域?qū)儆赨BN2結(jié)構(gòu)域,在Ty3-gypsy類反轉(zhuǎn)錄轉(zhuǎn)座子中,屬于Retrotrans_gag結(jié)構(gòu)域;gag-BOX4序列是zf-CCHC結(jié)構(gòu)域。UBN2結(jié)構(gòu)域是LTR反轉(zhuǎn)錄轉(zhuǎn)座子copia類gag常見的結(jié)構(gòu)域,該家族存在于植物和真菌copia類gag中[60]。Retrotrans_gag結(jié)構(gòu)域不但是反轉(zhuǎn)錄轉(zhuǎn)座子gag常見的結(jié)構(gòu)域,也是逆轉(zhuǎn)錄病毒Gag蛋白的中央結(jié)構(gòu)域,但其保守性較差,與Ty1轉(zhuǎn)座子的UBN2結(jié)構(gòu)域相類似[61]。zf-CCHC結(jié)構(gòu)域是一個由18個氨基酸殘基組成的鋅指結(jié)構(gòu),組成了gag蛋白殼[60-61]。圖2比對結(jié)果表明gag-BOX1、gag-BOX2、gag-BOX3和gag-BOX4這4個保守結(jié)構(gòu)域是活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子Gag蛋白常見結(jié)構(gòu)域。其中g(shù)ag-BOX1結(jié)構(gòu)域由AXXXWXXL (X為任意氨基酸) 組成,第一個位置的A (丙氨酸) 是保守氨基酸;gag-BOX2結(jié)構(gòu)域有4個L (亮氨酸),絕大部分活性反轉(zhuǎn)錄轉(zhuǎn)座子相應(yīng)位置還含有R(精氨酸)、M (甲硫氨酸)、E (谷氨酸)、G (甘氨酸)、F (苯丙氨酸) 和H (組氨酸);gag-BOX3結(jié)構(gòu)域含有保守氨基酸L (亮氨酸);gag-BOX4結(jié)構(gòu)域由CXXCXXXGHXXXXC組成,C (半胱氨酸)、G (甘氨酸) 和H (組氨酸) 是保守氨基酸。在保守結(jié)構(gòu)域中,有7個位置的氨基酸在活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子中都是高度同源的 (第1個結(jié)構(gòu)域中A1,第3個結(jié)構(gòu)域中L8,第4個結(jié)構(gòu)域中C1、C4、G8、H9和C14),暗示這些氨基酸在Gag蛋白參與的反轉(zhuǎn)錄轉(zhuǎn)座子RNA的成熟與包裝過程中具有關(guān)鍵作用[58,62]。

2.2.2Pr蛋白的結(jié)構(gòu)特征

圖2 Gag蛋白保守域分析圖Fig. 2 The conserved domains of Gag protein. The height of the amino acid letters represents the frequency of occurrence of the amino acid. Red box represents conserved domain 1, green boxes represents the conserved domains 2, purple boxes represents conserved domains 3, and blue boxes represents conserved domains 4.

Pr蛋白具有3個保守結(jié)構(gòu)域 (pr-BOX1、pr-BOX2和pr-BOX3),都屬于RVP結(jié)構(gòu)域。RVP結(jié)構(gòu)域是反轉(zhuǎn)錄天冬氨酸蛋白酶,該蛋白酶來源于逆轉(zhuǎn)錄病毒、反轉(zhuǎn)錄轉(zhuǎn)座子和Badnaviruses(植物雙鏈DNA病毒)[63]。圖3比對結(jié)果表明pr-BOX1、pr-BOX2和pr-BOX3這3個保守結(jié)構(gòu)域是活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子Pr蛋白常見結(jié)構(gòu)域。其中pr-BOX1結(jié)構(gòu)域是WVXDT/SGXXXH結(jié)構(gòu),相應(yīng)位置的D (天冬氨酸) 是保守氨基酸;pr-BOX2結(jié)構(gòu)域含有5個G (甘氨酸);pr-BOX3結(jié)構(gòu)域相應(yīng)位置含有非極性氨基酸包括L (亮氨酸)、P (脯氨酸)、V (纈氨酸) 和I (異亮氨酸),以及極性氨基酸包括D (天冬氨酸)、G (甘氨酸)、Y (酪氨酸) 和S (絲氨酸)。在保守結(jié)構(gòu)域中,pr-BOX1中D4在活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子中是高度同源的,暗示天冬氨酸對維持Pr蛋白活性具有重要作用[62]。

圖3 Pr蛋白保守域分析圖Fig. 3 The conserved domains of Pr protein. The height of the amino acid letters represents the frequency of occurrence of the amino acid. Red box represents conserved domain 1, green boxes represents the conserved domains 2, and purple boxes represents conserved domains 3.

2.2.3Int蛋白結(jié)構(gòu)特征

Int蛋白有4個保守結(jié)構(gòu)域 (int-BOX1、int-BOX2、int-BOX3和int-BOX4)。int-BOX1結(jié)構(gòu)域?qū)儆趃ag_pre-integrs結(jié)構(gòu)域;int-BOX2、int-BOX3和int-BOX4結(jié)構(gòu)域?qū)儆趓ve結(jié)構(gòu)域。gag_pre-integrs結(jié)構(gòu)域是gag預(yù)整合結(jié)構(gòu)域,該結(jié)構(gòu)域與反轉(zhuǎn)錄轉(zhuǎn)座子插入元件有關(guān),位于整合酶的上游[64]。rve結(jié)構(gòu)域是整合酶核心結(jié)構(gòu)域,整合酶介導(dǎo)反轉(zhuǎn)錄轉(zhuǎn)座子拷貝整合到宿主染色體中[64]。圖4比對結(jié)果表明int-BOX1、int-BOX2、int-BOX3和int-BOX4這4個保守結(jié)構(gòu)域是活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子Int蛋白常見結(jié)構(gòu)域。int-BOX1結(jié)構(gòu)域富含L (亮氨酸),相應(yīng)位置的H (組氨酸) 是保守氨基酸;int-BOX2結(jié)構(gòu)域由CXXCLXGKXXRVXF組成,相應(yīng)位置的氨基酸C (半胱氨酸) 和K (賴氨酸) 是保守氨基酸;int-BOX3結(jié)構(gòu)域含保守氨基酸D (天冬氨酸)、G (甘氨酸)、S (絲氨酸)、K (賴氨酸) 和F(苯丙氨酸);int-BOX4結(jié)構(gòu)域含有D (天冬氨酸)、G (甘氨酸)、Q (谷氨酰胺)、I (異亮氨酸)、P (脯氨酸)、E (谷氨酸)、N (天冬酰胺) 和R (精氨酸)。在保守結(jié)構(gòu)域中,有19個位置的氨基酸在活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子中都是高度同源的(第1個結(jié)構(gòu)域中H6,第2個結(jié)構(gòu)域中C1、C4和K8,第3個結(jié)構(gòu)域中D7、G19、D28、S31、K42和F52,第4個結(jié)構(gòu)域中D14、G32、I33、P43、Q44、G47、E50、N53和R54),暗示這些氨基酸對Int蛋白的整合作用具有重要意義[62]。

2.2.4Rt蛋白結(jié)構(gòu)特征

圖4 Int蛋白保守域分析圖Fig. 4 The conserved domains of Int protein. The height of the amino acid letters represents the frequency of occurrence of the amino acid. Red box represents conserved domain 1, green boxes represents the conserved domains 2, purple boxes represents conserved domains 3, and blue boxes represents conserved domains 4.

Rt蛋白具有4個保守結(jié)構(gòu)域 (rt-BOX1、rt-BOX2、rt-BOX3和rt-BOX4),都屬于RVT結(jié)構(gòu)域。RVT結(jié)構(gòu)域是反轉(zhuǎn)錄酶 (依賴RNA的DNA聚合酶),存在于反轉(zhuǎn)錄轉(zhuǎn)座子、逆轉(zhuǎn)錄病毒、Ⅱ類內(nèi)含子、細(xì)菌msDNAs、嗜肝DNA病毒和Caulimoviruses各種移動元件中[65]。圖5比對結(jié)果表明rt-BOX1、rt-BOX2、rt-BOX3和 rt-BOX4這4個保守結(jié)構(gòu)域是活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子Rt蛋白的必備結(jié)構(gòu)域。rt-BOX1結(jié)構(gòu)域由KWVFKXK組成,保守氨基酸是K (賴氨酸);rt-BOX2結(jié)構(gòu)域由DVKXAFLXG組成;rt-BOX3結(jié)構(gòu)域由YGLKQAPRXW組成,相應(yīng)位置的G(甘氨酸)和L (亮氨酸) 是保守氨基酸;rt-BOX4結(jié)構(gòu)域由LLLYVDDIL組成,富含L (亮氨酸),相應(yīng)位置的D (天冬氨酸) 是保守氨基酸。在保守結(jié)構(gòu)域中,有19個位置的氨基酸在活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子中都是高度同源的 (第1個結(jié)構(gòu)域中K7,第2個結(jié)構(gòu)域中D1、V2、K3、A5、F6、L7和G9,第3個結(jié)構(gòu)域中Y1、G2、L3、Q5、A6、R8和W10,第4個結(jié)構(gòu)域中Y4、D6、D7和L9),暗示這些氨基酸對維持Rt蛋白的反轉(zhuǎn)錄活性具有重要作用[65]。

圖5 Rt蛋白保守域分析圖Fig. 5 The conserved domains of Rt protein. The height of the amino acid letters represents the frequency of occurrence of the amino acid. Red box represents conserved domain 1, green boxes represents the conserved domains 2, purple boxes represents conserved domains 3, and blue boxes represents conserved domains 4.

圖6 Rh蛋白保守域分析圖Fig. 6 The conserved domains of Rh protein. The height of the amino acid letters represents the frequency of occurrence of the amino acid. Red box represents conserved domain 1, green boxes represents the conserved domains 2, purple boxes represents conserved domains 3, and blue boxes represents conserved domains 4.

2.2.5Rh蛋白結(jié)構(gòu)特征

Rh蛋白具有4個保守結(jié)構(gòu)域 (rh-BOX1、rh-BOX2、rh-BOX3和rh-BOX4),都屬于RNase_H1_RT結(jié)構(gòu)域。RNase_H1_RT結(jié)構(gòu)域是LTR反轉(zhuǎn)錄轉(zhuǎn)座子的核糖核酸酶H1,根據(jù)氨基酸序列的相似性和生化特性,核糖核酸酶H (RNA酶H) 分為1型和2型。RNA酶H是非特異性序列內(nèi)切核酸酶,切割以二價陽離子形式存在于RNA / DNA雜合鏈中的RNA鏈。RNA酶H廣泛存在于細(xì)菌、古細(xì)菌和真核生物各種生物體中[66]。在LTR反轉(zhuǎn)錄轉(zhuǎn)座子中核糖核酸酶H1可降解原始的RNA模板,產(chǎn)生多聚嘌呤區(qū) (作為正鏈DNA合成的引物),并從新合成的正負(fù)鏈上最終去除RNA引物[7]。圖6比對結(jié)果表明rh-BOX1、rh-BOX2、rh-BOX3和rh-BOX4 這4個保守結(jié)構(gòu)域是活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子Rh蛋白必備結(jié)構(gòu)域。r h - B O X 1結(jié)構(gòu)域由GYXDADXAGDXDXRKSTXGY組成,含有4個D (天冬氨酸);rh-BOX2結(jié)構(gòu)域富含E (谷氨酸) 和S (絲氨酸);rh-BOX3結(jié)構(gòu)域由CDXXXAIXLXXXXXXH組成,相應(yīng)位置的 C(半胱氨酸)、D (天冬氨酸) 和H (組氨酸) 為保守氨基酸;rh-BOX4結(jié)構(gòu)域富含T (蘇氨酸)。在保守結(jié)構(gòu)域中,有17個位置的氨基酸在活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子中都是高度同源的 (第1個結(jié)構(gòu)域中D12、S16和G19,第2個結(jié)構(gòu)域中V6、S8、Q11、S17、E20、A25和W35,第3個結(jié)構(gòu)域中C1、D2和H16,第4個結(jié)構(gòu)域中I5、R13、A33和D34),暗示這些氨基酸對維持Rh蛋白的活性具有關(guān)鍵性作用[67]。

各活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的保守結(jié)構(gòu)域分析結(jié)果表明:Gag蛋白相應(yīng)位置含有保守氨基酸丙氨酸、亮氨酸和半胱氨酸;Pr蛋白相應(yīng)位置含有保守氨基酸天冬氨酸;Int蛋白相應(yīng)位置含有保守氨基酸天冬氨酸;Rt蛋白相應(yīng)位置含有保守氨基酸甘氨酸、亮氨酸和天冬氨酸;Rh蛋白相應(yīng)位置含有保守氨基酸色氨酸。這些保守氨基酸可能對維持各個蛋白的功能具有重要作用,對催化反轉(zhuǎn)錄轉(zhuǎn)座子轉(zhuǎn)座和再插入起了重要的作用[62-63,67]。

2.3活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子LTR結(jié)構(gòu)

由于反轉(zhuǎn)錄轉(zhuǎn)座子在反轉(zhuǎn)錄過程中,LTRs序列是由同一條DNA模板合成,因此在整合進(jìn)基因組時,它們在DNA序列上是相同的。但是隨著時間的推移,植物基因組在進(jìn)化過程中會發(fā)生適當(dāng)頻率的突變使得兩端LTRs序列不一致[58,68]。各活性反轉(zhuǎn)錄轉(zhuǎn)座子中Tos17、Tnt1、Tto1、EVD、LORE1和RIRE7兩端LTR同源性都為100%。而其他轉(zhuǎn)座子由于兩端LTR的長度不同,因此同源性降低,但絕大多數(shù)轉(zhuǎn)座子(PREM-2、Ttd1a、CIRE1、OARE-1、Zeon-1和 BARE-1) 同源性仍在90%以上,同源性最低的為TLC1-1,兩端LTR同源性為86.38%。所有活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子兩端LTR同源性平均值為97.56%,說明活性LTR轉(zhuǎn)座子的LTR同源性均很高,反映了該類轉(zhuǎn)座子插入事件較近,因而具有較低的積累突變頻率和較高的轉(zhuǎn)座活性。隨著插入時間的延長,轉(zhuǎn)座子在進(jìn)化的過程中會逐漸丟失一些序列,導(dǎo)致不同區(qū)域不同程度的缺失,直至失去轉(zhuǎn)座活性[36,68]。

轉(zhuǎn)座子轉(zhuǎn)座誘導(dǎo)與啟動子有關(guān),有活性的轉(zhuǎn)座子LTR的U3區(qū)域都有順式調(diào)控元件。為了系統(tǒng)的解析活性的LTR反轉(zhuǎn)錄轉(zhuǎn)座子LTR區(qū)域中順式調(diào)控元件的情況,利用PlantCARE在線軟件分析了各活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子LTR區(qū)域的啟動子結(jié)構(gòu) (圖7)。

圖7結(jié)果表明所有的活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的LTR均含有至少一個順式調(diào)控元件(Tos17、Ttd1a和LORE1),最多含有5個調(diào)控元件 (OARE-1),其中TCA (Tos17、Tnt1、BARE-1、OARE-1、Ttd1a、PREM-2、CIRE1、RIRE7和Zeon-1) 最豐富 (占69.2%),其次是TC-rich (Tnt1、EVD、OARE-1、PREM-2、CIRE1 和RIRE7) 占46.2%,ABRE、ARE占38.5%。這些結(jié)果表明水楊酸和脫落酸誘導(dǎo)可使轉(zhuǎn)座子激活,脅迫或厭氧環(huán)境也可使轉(zhuǎn)座子激活。

反轉(zhuǎn)錄轉(zhuǎn)座子在植物生長發(fā)育的某些階段或在處于壓力等特定條件下可以激活。某些反轉(zhuǎn)錄轉(zhuǎn)座子在正常情況下也具有轉(zhuǎn)錄活性,如煙草的反轉(zhuǎn)錄轉(zhuǎn)座子Tnt1[26]、Tto1[26],玉米的反轉(zhuǎn)錄轉(zhuǎn)座子PREM-2[42]。有些反轉(zhuǎn)錄轉(zhuǎn)座子的轉(zhuǎn)座活性具有組織特異性,如煙草Tntl、大麥BARE-1、玉米PREM-2、番茄TLC1-1和甜橙CIRE1主要在根部[26,55,57]、葉片[34,55]或單核小孢子中表達(dá)[42]。許多轉(zhuǎn)座元件可以被多種生物和非生物的脅迫激活表達(dá)。非生物因素包括原生質(zhì)體分離、組織細(xì)胞培養(yǎng)、機(jī)械作用、茉莉酮酸、水楊酸等;生物因素包括各種細(xì)菌、病原物侵染以及真菌、病原物提取物等[27]。反轉(zhuǎn)錄轉(zhuǎn)座子的轉(zhuǎn)座活性被激活是對寄主基因組的一種適應(yīng),通過重組獲得類似于寄主相關(guān)逆境誘導(dǎo)基因的啟動子,從而能夠在逆境條件下誘導(dǎo)轉(zhuǎn)座[69]。

圖7 LTR區(qū)域啟動子順式作用元件分布圖Fig. 7 The cis-acting elements in LTR sequences. Boxes indicate the different cis-acting elements, lines indicate LTR sequences.

3 總結(jié)與展望

反轉(zhuǎn)錄轉(zhuǎn)座子激活后會導(dǎo)致基因突變,可用于篩選突變體和鑒定基因,如Tos17[18]、 EVD[48]和LORE1[51];也可用于植物轉(zhuǎn)基因的基因轉(zhuǎn)移載體,如Tto1[31]。反轉(zhuǎn)錄轉(zhuǎn)座子廣泛分布于植物的基因組中,利用此特性可開發(fā)插入標(biāo)記。該標(biāo)記的優(yōu)勢在于拷貝數(shù)豐富、高度異質(zhì)性、插入多態(tài)性好[70]、插入突變穩(wěn)定[71],如BARE-1[38]。然而,轉(zhuǎn)座頻率相對較低限制了它們在這方面的應(yīng)用。

經(jīng)分析,自主有活性的LTR反轉(zhuǎn)錄轉(zhuǎn)座子必須具備LTR區(qū)域以及編碼Gag、Pr、Int、Rt 和Rh蛋白的基因區(qū)。其中LTR區(qū)域具有高同源性且含有順式調(diào)控元件;Gag蛋白含有UBN2結(jié)構(gòu)域、zf-CCHC結(jié)構(gòu)域 (Ty1-copia轉(zhuǎn)座子) 或Retrotrans_gag結(jié)構(gòu)域 (Ty3-gypsy轉(zhuǎn)座子);Pr蛋白含有RVP結(jié)構(gòu)域,Int蛋白含有g(shù)ag_pre-integrs結(jié)構(gòu)域和rve結(jié)構(gòu)域;Rt蛋白含有RVT結(jié)構(gòu)域;Rh蛋白含有RNase_H1_RT結(jié)構(gòu)域。

本課題組致力于竹亞科LTR反轉(zhuǎn)錄轉(zhuǎn)座子的研究,利用生物信息學(xué)方法目前已獲得3個全長的LTR反轉(zhuǎn)錄轉(zhuǎn)座子 (Ph-LTR1,PHRE1 和PHRE2),均屬于Ty3-gypsy類反轉(zhuǎn)錄轉(zhuǎn)座子,具備LTR區(qū)域以及編碼Gag、Pr、Int、Rt和Rh蛋白的基因區(qū)。其中Ph-LTR1的LTR同源性為98.79%;Rt蛋白含有RVT結(jié)構(gòu)域;Rh蛋白含有RNase_H1_RT結(jié)構(gòu)域[72]。PHRE1的LTR區(qū)域含有順式調(diào)控元件TCA和ABRE;Rt蛋白含有RVT結(jié)構(gòu)域;Rh蛋白含有RNase_H1_RT結(jié)構(gòu)域。而PHRE2的LTR同源性為98.39%,含有順式調(diào)控元件TCA和P-box;Rt蛋白含有RVT結(jié)構(gòu)域;Rh蛋白含有RNase_H1_RT結(jié)構(gòu)域 (部分?jǐn)?shù)據(jù)未發(fā)表)。根據(jù)以上特性,這3個全長的LTR反轉(zhuǎn)錄轉(zhuǎn)座子可能是活性反轉(zhuǎn)錄轉(zhuǎn)座子。這些結(jié)果為后續(xù)竹子活性LTR反轉(zhuǎn)錄轉(zhuǎn)座子的鑒定和功能分析奠定了重要基礎(chǔ)。

REFERENCES

[1] McClintock B. Chromosome organization and genic expression. Cold Spring Harb Symp Quant Biol, 1951, 16: 13–47.

[2] McClintock B. The significance of responses of the genome to challenge. Science, 1984, 226(4676): 792–801.

[3] McClintock B. The origin and behavior of mutable loci in maize. Proc Natl Acad Sci USA, 1950, 36(6): 344–355.

[4] Wicker T, Keller B. Genome-wide comparative analysis of copia retrotransposons in Triticeae, rice, and Arabidopsis reveals conserved ancient evolutionary lineages and distinct dynamics of individual copia families. Genome Res, 2007, 17(7): 1072–1081.

[5] Llorens C, Futami R, Covelli L, et al. The Gypsy Database (GyDB) of mobile genetic elements: release 2.0. Nucleic Acids Res, 2011, 39: D70–D74.

[6] Bowen NJ, McDonald JF. Drosophila euchromatic LTR retrotransposons are much younger than the host species in which they reside. Genome Res, 2001, 11(9): 1527–1540.

[7] Boeke JD. Transposable elements in Saccharomyces cerevisiae//: Berg DE, Howe MM, Eds. Mobile DNA. Washington D.C.: American Society for Microbiology, 1989: 335–374.

[8] Wessler SR. Plant retrotransposons: turned on by stress. Curr Biol, 1996, 6(8): 959–961.

[9] Liu B, Wendel JF. Retrotransposon activation followed by rapid repression in introgressed rice plants. Genome, 2000, 43(5): 874–880.

[10] Okamoto H, Hiroehika H. Silencing of transposable element in plants. Trends Plant Sci, 2001, 6(11): 527–534.

[11] Grandbastien MA. Activation of plant retrotransposons under stress conditions. Trends Plant Sci, 1998, 3(5): 181–187.

[12] Domingues DS, Cruz GMQ, Metcalfe CJ, et al. Analysis of plant LTR-retrotransposons at the fine-scale family level reveals individual molecular patterns. BMC Genomics, 2012, 13: 137.

[13] Sabot F. Tos17 rice element: incomplete but effective. Mob DNA, 2014, 5(1): 10.

[14] Cheng CY, Daigen M, Hirochika H. Epigenetic regulation of the rice retrotransposon Tos17. Mol Genet Genomics, 2006, 276(4): 378–390.

[15] Ding Y, Wang X, Su L, et al. SDG714, a histone H3K9 methyltransferase, is involved in Tos17 DNA methylation and transposition in rice. Plant Cell, 2007, 19(1): 9–22.

[16] La HG, Ding B, Mishra GP, et al. A 5-methylcytosine DNA glycosylase/lyase demethylates the retrotransposon Tos17 and promotes its transposition in rice. Proc Natl Acad Sci USA, 2011, 108(37): 15498–15503.

[17] Yamazaki M, Tsugawa H, Miyao A, et al. The rice retrotransposon Tos17 prefers low-copy-number sequences as integration targets. Mol Genet Genomics, 2001, 265(2): 336–344.

[18] Agrawal GK, Yamazaki M, Kobayashi M, et al. Screening of the rice viviparous mutants generated by endogenous retrotransposon Tos17 insertion. Tagging of a zeaxanthin epoxidase gene and a novel OsTATC gene. Plant Physiol, 2001, 125(3): 1248–1257.

[19] Sato Y, Swntoku N, Miura Y, et al. Loss of function mutations in the rice homeobox gene OSH15 affect the architecture of internodes resulting in dwarf plants. EMBO J, 1999, 18(4): 992–1002.

[20] Nonomura KI, Miyoshi K, Eiguchi M, et al. The MSP1 gene is necessary to restrict the number of cells entering into male and female sporogenesis and to initiate anther wall formation in rice. Plant Cell, 2003, 15(8): 1728–1739.

[21] Kazazian HH. Mobile elements: drivers of genome evolution. Science, 2004, 303(5664): 1626–1632. [22] Nonomura KI, Nakano M, Murata K, et al. An insertional mutation in the rice PAIR2 gene, the ortholog of Arabidopsis ASY1, results in a defect in homologous chromosome pairing during meiosis. Mol Genet Genomics, 2004, 271(2): 121–129.

[23] Fujita N, Yoshida M, Asakura N, et al. Function and characterization of starch synthase I using mutants in rice. Plant Physiol, 2006, 140(3): 1070–1084.

[24] Kumekawa N, Ohmido N, Fukui K, et al. A new gypsy-type retrotransposon, RIRE7: preferential insertion into the tandem repeat sequence TrsD in pericentromeric heterochromatin regions of rice chromosomes. Mol Genet Genomics, 2001, 265(3): 480–488.

[25] Grandbastien MA, Spielmann A, Caboche M. Tnt1, a mobile retroviral-like transposable element of tobacco isolated by plant cell genetics. Nature, 1989, 337(6205): 376–380.

[26] Pouteau S, Huttner E, Grandbastien MA, et al. Specific expression of the tobacco Tnt1 retrotransposon in protoplasts. EMBO J, 1991, 10(7): 1911–1918.

[27] Grandbastien MA, Lucas H, Morel JB, et al. The expression of the tobacco Tnt1 retrotransposon is linked to the plant defense responses. Genetica, 1997, 100(1/3): 241–252.

[28] Hou Y, Rajagopol J, Irwin PA, et al. Retrotransposon vectors for gene delivery in plants. Mob DNA, 2010, 1(1): 19.

[29] Duangpan S, Zhang WL, Wu YF, et al. Insertional mutagenesis using Tnt1 retrotransposon in potato. Plant Physiol, 2013, 163(1): 21–29.

[30] Cui YY, Barampuram S, Stacey MG, et al. Tnt1 retrotransposon mutagenesis: a tool for soybean functional genomics. Plant Physiol, 2013, 161(1): 36–47.

[31] Hirochika H, Otsuki H, Yoshikawa M, et al. Autonomous transposition of the tobacco retrotransposon Ttol in rice. Plant Cell, 1996, 8(4): 725–734.

[32] Hirochika H. Activation of tobacco retrotransposons during tissue culture. EMBO J, 1993, 12(6): 2521–2528.

[33] Takeda S, Sugimoto K, Otsuki H, et al. A 13-bp cis-regulatory element in the LTR promoter of the tobacco retrotransposon Tto1 is involved in responsiveness to tissue culture, wounding, methyl jasmonate and fungal eliecitors. Plant J, 1999, 18(4): 383–393.

[34] Manninen I, Schulman AH. BARE-l, a copia-like retroelement in barley (Hordeurn vulgare L.). Plant Mol Biol, 1993, 22(5): 829–846.

[35] Chang W, J??skel?inen M, Li SP, et al. BARE retrotransposons are translated and replicated via distinct RNA pools. PLoS ONE, 2013, 8(8): e72270.

[36] Kalendar R, Tanskanen J, Immonen S, et al. Genome evolution of wild barley (Hordeum spontaneum) by BARE-1 retrotransposon dynamics in response to sharp microclimatic divergence. Proc Natl Acad Sci USA, 2000, 97(12): 6603–6607.

[37] Suoniemi A, Anamthawat-Jónsson K, Ama T, et al. Retrotransposon BARE-1 is a major, dispersed component of the barley (Hordeurn vulgare L.) genome. Plant Mol Biol, 1996, 30(6): 1321–1329.

[38] Kalendar R, Grob T, Regina M, et al. IRAP and REMAP: two new retrotransposon-based DNA fingerprinting techniques. Theor Appl Genet, 1999, 98(5): 704–711.

[39] Linares C, Serna A, Fominaya A. Chromosomal organization of a sequence related to LTR-like elements of Ty1-copia retrotransposons in Avena species. Genome, 1999, 42(4): 706–713.

[40] Kimura Y, Shimada S, Sogo R, et al. OARE-1, a Tyl-copia retrotransposon in oat activated by abiotic and biotic stresses. Plant Cell Physiol, 2001, 42(12): 1345–1354.

[41] Woodrow P, Pontecorvo G, Fantaccione S, et al. Polymorphism of a new Ty1-copia retrotransposon in durum wheat under salt and light stresses. Theor Appl Genet, 2010, 121(2): 311–322.

[42] Turcich MP, Bokhari-Riza A, Hamilton DA, et al. PREM-2, a copia-type retroelement in maize is expressed preferentially in early microspores. Sex Plant Reprod, 1996, 9(2): 65–74.

[43] Turcich MP, Mascarenhas JP. PREM-1, a putative maize retroelement has LTR (long terminal repeat) sequences that are preferentially transcribed in pollen. Sex Plant Reprod, 1994, 7(1): 2–11.

[44] Hu WM, Das OP, Messing J. Zeon-1, a member of a new maize retrotransposon family. Mol Genet Genomics, 1995, 248(4): 471–480.

[45] Reinders J, Wulff BBH, Mirouze M, et al. Compromised stability of DNA methylation and transposon immobilization in mosaic Arabidopsis epigenomes. Gene Dev, 2009, 23(8): 939–950.

[46] Johannes F, Porcher E, Teixeira FK, et al. Assessing the impact of transgenerational epigenetic variation on complex traits. PLoS Genet, 2009, 5(6): e1000530.

[47] Mirouze M, Reinders J, Bucheret E, et al. Selective epigenetic control of retrotransposition in Arabidopsis. Nature, 2009, 461(7262): 427–430.

[48] Marí-Ordó?ez A, Marchais A, Etcheverry M, et al. Reconstructing de novo silencing of an active plant retrotransposon. Nat Genet, 2013, 45(9): 1029–1039.

[49] Madsen LH, Fukai E, Radutoiu S, et al. LORE1, an active low-copy-number TY3-gypsy retrotransposon family in the model legume Lotus japonicus. Plant J, 2005, 44(3): 372–381.

[50] Fukai E, Umehara Y, Sato S, et al. Derepression of the plant chromovirus LORE1 induces germline transposition in regenerated plants. PLoS Genet, 2010, 6(3): e1000868.

[51] Urbański DF, Ma?olepszy A, Stougaard J, et al. Genome-wide LORE1 retrotransposon mutagenesis and high-throughput insertion detection in Lotus japonicus. Plant J, 2012, 69(4): 731–741.

[52] Yano K, Shibata S, Chen WL, et al. CERBERUS, a novel U-box protein containing WD-40 repeats, is required for formation of the infection thread and nodule development in the legume-Rhizobium symbiosis. Plant J, 2009, 60(1): 168–180.

[53] Kanamori N, Madsen LH, Radutoiu S, et al. A nucleoporin is required for induction of Ca2+spiking in legume nodule development and essential for rhizobial and fungal symbiosis. Proc Natl Acad Sci USA, 2006, 103(2): 359–364.

[54] Fukai E, Soyano T, Umehara Y, et al. Establishment of a Lotus japonicus gene tagging population using the exon-targeting endogenous retrotransposon LORE1. Plant J, 2012, 69(4): 720–730.

[55] Rico-Cabanas L, Martínez-Izquierdo JA. CIRE1, a novel transcriptionally active Ty1-copia retrotransposon from Citrus sinensis. Mol Genet Genomics, 2007, 277(4): 365–377.

[56] Tapia G, Verdugo I, Ya?ez M, et al. Involvement of ethylene in stress-induced expression of the TLC1.1 retrotransposon from Lycopersicon chilense Dun. Plant Physiol, 2005, 138(4): 2075–2086.

[57] Ya?ez M, Verdugo I, Rodríguez M, et al. Highly heterogeneous families of Ty1/copia retrotransposons in the Lycopersicon chilense genome. Gene, 1998, 222(2): 223–228.

[58] Kumar A, Bennetzen JL. Plant retrotransposons. Annu Rev Genet, 1999, 33(1): 479–532.

[59] Llorens C, Mu?oz-Pomer A, Bernad L, et al. Network dynamics of eukaryotic LTR retroelements beyond phylogenetic trees. Biol Direct, 2009, 4(1): 41.

[60] Chaparro C, Gayraud G, de Souza RF, et al. Terminal-repeat retrotransposons with GAG domain in plant genomes: a new testimony on the complex world of transposable elements. Genome Biol Evol, 2015, 7(2): 493–504.

[61] Nakayashiki H, Matsuo H, Chuma I, et al. Pyret, a Ty3/Gypsy retrotransposon in Magnaporthe grisea contains an extra domain between the nucleocapsid and protease domains. Nucleic Acids Res, 2001, 29(20): 4106–4113.

[62] Llorens C, Fares MA, Moya A. Relationships of gag-pol diversity between Ty3/Gypsy and Retroviridae LTR retroelements and the three kings hypothesis. BMC Evol Biol, 2008, 8: 276.

[63] Llorens C, Futami R, Renaud G, et al. Bioinformatic flowchart and database to investigate the origins and diversity of Clan AA peptidases. Biol Direct, 2009, 4(1): 3.

[64] Dyda F, Hickman AB, Jenkins TM, et al. Crystal structure of the catalytic domain of HIV-1 integrase: similarity to other polynucleotidyl transferases. Science, 1994, 266(5193): 1981–1986.

[65] Xiong Y, Eickbush TH. Origin and evolution of retroelements based upon their reverse transcriptase sequences. EMBO J, 1990, 9(10): 3353–3362.

[66] Cerritelli SM, Crouch RJ. Ribonuclease H: the enzymes in eukaryotes. FEBS J, 2009, 276(6): 1494–1505.

[67] Malik HS, Eickbush TH. Phylogenetic analysis of ribonuclease H domains suggests a late, chimeric origin of LTR retrotransposable elements and retroviruses. Genome Res, 2001, 11(7): 1187–1197.

[68] Vitte C, Panaud O, Quesneville H. LTR retransposons in rice (Oryza sativa L.): recent burst amplifications followed by rapid DNA loss. BMC Genomics, 2007, 8: 218.

[69] Flavell AJ, Dunbar E, Anderson R, et al. Ty1-copia group retrotransposons are ubiquitous and heterogeneous in higher plants. Nucleic Acids Res, 1992, 20(14): 3639–3644.

[70] Zhao HY, Zhao FK. Plants retrotransposon molecular markers and application. Bull Agric Sci Technol, 2009, (4): 95–97 (in Chinese).趙海艷, 趙福寬. 植物反轉(zhuǎn)錄轉(zhuǎn)座子分子標(biāo)記及其應(yīng)用. 農(nóng)業(yè)科技通訊, 2009, (4): 95–97.

[71] Lei JL, Xu ZH. Application of transposons in the plant functional genomics. Acta Agric Zhejiang, 2002, 14(5): 291–296 (in Chinese).雷娟利, 徐志豪. 轉(zhuǎn)座子在植物功能基因組學(xué)中的應(yīng)用. 浙江農(nóng)業(yè)學(xué)報, 2002, 14(5): 291–296.

[72] Zhou M, Tang DQ, Zhou MB. Cloning, characterization and phylogenetic analysis of a typical long terminal repeat retrotransposon in Phyllostachys heterocycla cv. pubescens. J Bamb Res, 2014, 33(3): 1–10, 21 (in Chinese).周敏, 湯定欽, 周明兵. 一個毛竹典型LTR轉(zhuǎn)座子的克隆、鑒定及進(jìn)化分析. 竹子研究匯刊, 2014, 33(3): 1–10, 21.

(本文責(zé)編陳宏宇)

Plant active LTR retrotransposons: a review

Linlin Liang, and Mingbing Zhou
The Nurturing Station for the State Key Laboratory of Subtropical Sil-viculture, Zhejiang A & F University, Lin’an 311300, Zhejiang, China

Abstract:Long terminal repeat (LTR) retrotransposons are mobile DNA sequences that ubiquitously exist in eukaryotic genomes. They replicate themselves in the genome by copy-paste mechanism with RNA as medium. In higher plants, manyactive LTR retrotransposons have been applied to analyze molecular marker technology, genetic tagging, insertion mutation and gene function. Here, we systematically review the characteristics of plant active LTR retrotransposons, including their structures, copy numbers and distributions. We further analyzed the gag (group-specific antigen) and pol (polymerase) sequence features of different plants active LTR retrotransposons and the distribution patterns of the cis-acting elements in LTR regions. The results show that autonomous active LTR retrotransposons must contain LTR regions and code Gag, Pr, Int, Rt, Rh proteins. Both LTR regions are highly homologous with each other and contain many cis-regulatory elements; RVT and RNase_H1_RT domain are essential for Rt and Rh protein respectively. These results provide the basis for subsequent identification of plant active LTR retrotransposons and their functional analysis.

Keywords:LTR retrotransposons, transposition, LTR, gag, pol

DOI:10.13345/j.cjb.150279

Corresponding author:Mingbing Zhou. Tel: +86-571-63731263; E-mail: zmbin@163.com

猜你喜歡
轉(zhuǎn)座子結(jié)構(gòu)域基因組
毛竹Mariner-like element自主轉(zhuǎn)座子的鑒定與生物信息學(xué)分析*
牛參考基因組中發(fā)現(xiàn)被忽視基因
地熊蜂基因組中具有潛在活性的轉(zhuǎn)座子鑒定
血清HBV前基因組RNA的研究進(jìn)展
蛋白質(zhì)結(jié)構(gòu)域劃分方法及在線服務(wù)綜述
紫花白及基因組DNA提取方法的比較
花葉矢竹轉(zhuǎn)錄組中的轉(zhuǎn)座子表達(dá)分析
重組綠豆BBI(6-33)結(jié)構(gòu)域的抗腫瘤作用分析
組蛋白甲基化酶Set2片段調(diào)控SET結(jié)構(gòu)域催化活性的探討
泛素結(jié)合結(jié)構(gòu)域與泛素化信號的識別