劉俊仙,劉 菁,陽太億,高軼靜,段維興,雷敬超,劉麗敏,劉紅堅,張榮華,何為中,李 松,熊發(fā)前 *
(1.廣西壯族自治區(qū)農(nóng)業(yè)科學(xué)院甘蔗研究所,廣西 南寧530007;2.廣西壯族自治區(qū)農(nóng)業(yè)科學(xué)院經(jīng)濟作物研究所,廣西 南寧530007)
【研究意義】甘蔗廣泛生長于熱帶和亞熱帶地區(qū),不僅是世界上重要的糖料作物,也是我國重要的糖料作物、能源作物和經(jīng)濟作物,甘蔗產(chǎn)業(yè)對于保障國家蔗糖供給安全有著舉足輕重的作用。LTR逆轉(zhuǎn)座子具有普遍性、拷貝數(shù)豐富、高度異質(zhì)性和插入位點多態(tài)性,非常適合用來開發(fā)分子標(biāo)記。LTR逆轉(zhuǎn)座子常被用來開發(fā)S-SAP(特異擴增多態(tài)性)[1]、IRAP(逆轉(zhuǎn)座子位點間擴增多態(tài)性)[2]、REMAP(逆轉(zhuǎn)座子-微衛(wèi)星擴增多態(tài)性)[2]和RBIP(基于逆轉(zhuǎn)座子插入多態(tài)性)分子標(biāo)記技術(shù)[3]。而分離和鑒定LTR逆轉(zhuǎn)座子是開發(fā)分子標(biāo)記的前提。因此,克隆甘蔗Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列具有重要意義。【前人研究進展】吳子鶯等[4]使用簡并引物成功分離了甘蔗屬大莖野生種60條Ty1-copia類逆轉(zhuǎn)座子逆轉(zhuǎn)錄酶序列。Raza等[5]根據(jù)文獻中報道的簡并引物以及跟Mutator(Mu)和Activator(Ac)有同源性甘蔗的EST設(shè)計的引物,利用PCR技術(shù)從當(dāng)?shù)馗收嵩耘喾NBL4中擴增并分離出甘蔗的Ty1-copia類LTR逆轉(zhuǎn)座子以及Mutator(Mu)和Activator(Ac)轉(zhuǎn)座子,表明這3類轉(zhuǎn)座子元件存在于甘蔗栽培種(BL4)基 因 組 中。Rossi等[6]利 用“transposable element”“transposase”“transposon”和“retrotransposon”為關(guān)鍵詞,以期望值低于e?50為搜索標(biāo)準(zhǔn),搜索甘蔗EST數(shù)據(jù)庫,結(jié)果鑒定出276條跟轉(zhuǎn)座元件同源的序列,其中,DNA轉(zhuǎn)座子148條(54%)、逆轉(zhuǎn)座子128條(46%),逆轉(zhuǎn)座子中的Ty1-copia明顯多于Ty3-gypsy,沒有發(fā)現(xiàn)SINE、LINE和M ITE序列。Rossi等[7]經(jīng)過測序和比對從甘蔗EST數(shù)據(jù)庫中鑒定出34條類mudrA序列,序列系統(tǒng)進化分析揭示出在單子葉和雙子葉植物分化前植物界已經(jīng)存在著4大類類mudrA序列,且至少有3類存在于甘蔗的祖先種中,且每一大類中具有轉(zhuǎn)座活性的類mudrA序列成員的數(shù)目是變化的,所有結(jié)果表明甘蔗屬中存在著活性的Mu轉(zhuǎn)座子系統(tǒng)。De A raujo等[8]從甘蔗EST數(shù)據(jù)庫中鑒定出276條跟植物轉(zhuǎn)座元件同源的EST序列,經(jīng)過cDNA全測序,68條甘蔗轉(zhuǎn)座子序列被指定為11個家族,表達分析顯示在同一個家族中的轉(zhuǎn)座子不同成員呈現(xiàn)不同的表達模式,沒有發(fā)現(xiàn)組織特異轉(zhuǎn)座子家族,愈傷組織是轉(zhuǎn)座子表達數(shù)量最大的組織,表明組織培養(yǎng)顯著影響了不同轉(zhuǎn)座元件的表達水平;De Jesus等[9]利用甘蔗EST數(shù)據(jù)庫鑒定出轉(zhuǎn)座子超家族hAT,并研究了它在甘蔗基因組中存在的多樣性。Nakayama[10]從甘蔗野生種Saccharum robustum中分離出一個新的tourist類M ITE轉(zhuǎn)座子,序列兩端有TIR和TSD,該序列在甘蔗屬基因組中呈現(xiàn)高拷貝數(shù),在此基礎(chǔ)上開發(fā)出的IMP分子標(biāo)記技術(shù)可以厘清甘蔗屬6個野生種的親緣關(guān)系。Zhang等[11]綜合運用多種生物信息學(xué)分析軟件和分析策略鑒定了甘蔗屬96個BAC克隆序列中的各類轉(zhuǎn)座元件。Zhang等[12]發(fā)表了單倍體割手密AP85-441的基因組,長末端重復(fù)逆轉(zhuǎn)座子在基因組中占45.62%,其中,Ty1-copia和Ty3-gypsy分別占14.19%和26.04%?!颈狙芯壳腥朦c】目前,有關(guān)甘蔗LTR反轉(zhuǎn)錄轉(zhuǎn)座子的研究鮮見報道。在國內(nèi),尚未見甘蔗Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列的克隆報道?!緮M解決的關(guān)鍵問題】克隆糖蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列,并進行序列特征分析,調(diào)查RT基因序列的組成和變異模式,分析與其他物種之間的系統(tǒng)進化關(guān)系,以期為下一步開發(fā)甘蔗LTR逆轉(zhuǎn)座子的分子標(biāo)記奠定基礎(chǔ)。
供試材料甘蔗品種為國內(nèi)種植面積最大的糖蔗品種新臺糖22。
甘蔗基因組DNA的高質(zhì)量提取采用筆者先前建立的改良CTAB法[13]進行。
甘蔗Ty3-gypsy類逆轉(zhuǎn)座子RT基因的PCR擴增參照前人設(shè)計的簡并引物進行,上下游引物分別為:Gyrt1:5′-AGMGRTATGTGYGTSGAYTAT-3′和Gyrt2:5′-CAMCCMRAAMWCACAM TT-3′,其中,R=A/G,Y=C/T,M=A/C,S=C/G,W=A/T,N=A/T/C/G[14]。PCR擴增體系、擴增程序以及PCR產(chǎn)物的分離檢測參考文獻[15]的方法進行。
目的片段的克隆和測序參考文獻[15]的方法進行。
序列同源性檢索、序列統(tǒng)計分析、序列圖及Logo圖生成、蛋白質(zhì)的二級結(jié)構(gòu)和三級結(jié)構(gòu)預(yù)測、蛋白質(zhì)三級結(jié)構(gòu)的轉(zhuǎn)角數(shù)和氫鍵數(shù)統(tǒng)計、保守基序預(yù)測等參考文獻[16]的方法進行;運用MEGA6.0軟件的鄰接法(No.of differences模型)構(gòu)建系統(tǒng)進化樹,自展值設(shè)置為1 000;與甘蔗EST數(shù)據(jù)庫比對,鑒定具有轉(zhuǎn)錄活性的Ty3-gypsy類逆轉(zhuǎn)座子。
根據(jù)Ty3-gypsy類逆轉(zhuǎn)座子RT基因的保守區(qū)域設(shè)計簡并引物對,擴增結(jié)果顯示,在新臺糖22中檢測到了Ty3-gypsy類逆轉(zhuǎn)座子RT基因,長度約為430 bp(圖1),表明Ty3-gypsy類逆轉(zhuǎn)座子存在于甘蔗品種新臺糖22的基因組DNA中。對擴增得到的目的片段進行克隆和測序,共獲得42條序列,利用DNAMAN軟件去除其中的相同序列,利用NCBI中的blastx和blastn與已報道的其他植物的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列進行比對,去除非RT基因序列,總共獲得36條RT基因序列,對每條序列進行命名(SoRT3-X),GenBank登錄號對應(yīng)MK830281~MK830316(表1)。對36條序列進行多重比對并生成Logo圖,以展示堿基在每個位置上的保守性(圖2~3)。
圖1 Ty3-gypsy類逆轉(zhuǎn)座子RT基因的PCR擴增Fig.1 PCR am p lification of RT of Ty3-gypsy-like retrotransposons
圖2 Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列多重比對Fig.2 M ultip lealignm ent of RT of Ty3-gypsy-like retrotransposons
分析發(fā)現(xiàn),只有SoRT3-26的序列長度為430 bp,其余序列長度均為432 bp。SoRT3-26相較于其他序列在第212、213、281個位點處各缺失了1個堿基,但在第253個位點處多出了1個堿基C。36條序列的A、T、C、G變化范圍分別為111~135、114~155、49~93和87~110,AT所占比為56.71%~64.81%,AT與GC比值為1.31~1.84(表1)。核苷酸序列間相似性為46.2%~99.3%,其中,SoRT3-26與SoRT3-31的相似性最低,為46.3%,SoRT3-11與SoRT3-44的相似性最高,達99.3%;氨基酸序列間相似性為10.1%~100.0%(表略)。
表1 Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列的基本信息Table 1 Basic inform ation on RT geneof Ty3-gypsy-like retrotransposons
遺傳進化樹結(jié)果顯示,36條甘蔗RT基因序列被分為5個家族(Ⅰ~Ⅴ),其中,家族Ⅰ、Ⅱ、Ⅲ和Ⅳ分別包含11、5、3、16條序列,家族Ⅴ只包含SoRT3-26,家族Ⅴ與其他家族遺傳距離最大,親緣關(guān)系最遠,單獨聚為一類(圖4)。
圖4 Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列遺傳進化樹Fig.4 Phylogenetic tree of RT of Ty3-gypsy-like retrotransposons
將36條RT基因序列翻譯成氨基酸序列后,序列多重比對結(jié)果顯示,所克隆序列符合Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列特征(圖5)。36條序列中有6條發(fā)生了1~6個無義突變,其中,SoRT3-9(第48個氨基酸處)、SoRT3-22(第50個氨基酸處)、SoRT3-31(第65個氨基酸處)和SoRT3-47(第126個氨基酸處)各發(fā)生了1個無義突變,SoRT3-28分別在第13、31、49、77個氨基酸處發(fā)生了4個無義突變,且這4個無義突變都集中在序列的上游部分,SoRT3-26發(fā)生了6個無義突變,分別在第23、80、93、97、105、125個氨基酸處,造成無義突變的原因是SoRT3-26在第212、213、281這3個位點各丟失了1個堿基,但在第253個位點多出了1個堿基C。剩余30條序列沒有發(fā)生無義突變,這些序列可能仍具有轉(zhuǎn)錄活性。
圖5 Ty3-gypsy類逆轉(zhuǎn)座子RT基因氨基酸序列的多重比對Fig. 5 M ultip le alignment of am ino acid sequencesof RT of Ty3-gypsy-like retrotransposons
圖3 Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列比對logoFig.3 A lignm ent logo of RT of Ty3-gypsy-like retrotransposons
根據(jù)核苷酸聚類分析結(jié)果,選擇各家族中的代表序列,利用Phyre2預(yù)測其蛋白質(zhì)的二級結(jié)構(gòu)和三級結(jié)構(gòu),圖6為家族Ⅰ中代表序列SoRT3-21的蛋白質(zhì)二級結(jié)構(gòu)和三級結(jié)構(gòu),代表序列蛋白三級結(jié)構(gòu)匹配覆蓋度最高的模板為c2opqA和c3kk1B,置信度均為100,屬于逆轉(zhuǎn)錄酶家族。二級結(jié)構(gòu)包含5~6個α-螺旋和8~9個β折疊;三級結(jié)構(gòu)包含12~19個轉(zhuǎn)角和76~94個氫鍵,還包含5個明顯的螺旋結(jié)構(gòu)和5個明顯的折疊結(jié)構(gòu)(表2),說明螺旋結(jié)構(gòu)和折疊結(jié)構(gòu)存在大量結(jié)構(gòu)元件(藍色端是C端,紅色端是N端)。
表2 Ty3-gypsy類逆轉(zhuǎn)座子RT基因蛋白質(zhì)結(jié)構(gòu)信息Table2 RT protein structure of Ty3-gypsy-like retrotransposons
圖6 Ty3-gypsy類逆轉(zhuǎn)座子RT基因蛋白質(zhì)的二級結(jié)構(gòu)(A)與三級結(jié)構(gòu)(B)Fig.6 Secondary (A)and tertiary (B)protein structuresof RT of Ty3-gypsy-like retrotransposon
RT基因序列保守基序預(yù)測結(jié)果顯示,36條序列共存在8種保守基序,其中,34條序列同時包含4種保守基序(motif 1、motif 2、motif 3和motif 4),SoRT3-28和SoRT3-26與上述34條序列差異明顯(圖7)。
圖7 Ty3-gypsy類逆轉(zhuǎn)座子RT基因保守基序預(yù)測Fig.7 Predicted conservative motifs of RT of Ty3-gypsy-like retrotransposons
為了解甘蔗與其他植物Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列間的進化關(guān)系,將甘蔗品種新臺糖22與其他植物的RT基因氨基酸序列進行多重比對,進而構(gòu)建系統(tǒng)進化樹(表3、圖8)。從系統(tǒng)進化樹上可以看出,所有甘蔗RT基因序列被分為7類(Ⅰ~Ⅶ),其中,Ⅰ類中的18條甘蔗RT基因序列與擬南芥的BAB40828.1具有較高同源性,Ⅱ類只含有16條甘蔗RT基因序列,Ⅰ和Ⅱ兩大類中共分布著34條甘蔗RT基因序列(94.44%),表明甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列具有相當(dāng)高的保守性與相似性。Ⅲ類只有1條來自列當(dāng)(ABD43042.1)的RT基因序列,Ⅳ類和Ⅴ類中都是來自其他物種植物的RT基因序列,SoRT3-28單獨聚為Ⅵ類,SoRT3-26與大豆的BAB40834.1、菠菜的BAB40833.1、粳稻的BAB40824.1一起聚為Ⅶ類。
圖8 甘蔗與部分其他物種植物Ty3-gypsy類逆轉(zhuǎn)座子RT基因的氨基酸序列系統(tǒng)進化樹Fig.8 Phylogenetic tree of am ino acid sequences of RT of Ty3-gypsy-like retrotransposons from sugarcane and some other plant species
表3 部分其他物種植物的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列信息Table 3 Am ino acid sequences of RT of Ty3-gypsy-like retrotransposons from som eother p lant species
將36條甘蔗品種新臺糖22中Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列提交到NCBI與甘蔗EST數(shù)據(jù)庫進行比對,以檢測甘蔗Ty3-gypsy類逆轉(zhuǎn)座子的轉(zhuǎn)錄活性。結(jié)果顯示,當(dāng)查詢覆蓋度分別為87%、87%、87%、85%、86%、86%時,SoRT3-9、SoRT3-21、SoRT3-22、SoRT3-27、SoRT3-29、SoRT3-34與甘蔗EST數(shù)據(jù)庫中的GE325024.1和GE325034.1之間的一致性分別為91.25%、94.96%、92.84%、93.53%、93.33%、84.27%;當(dāng)查詢覆蓋度分別為99%、99%、97%、99%時,SoRT3-23、SoRT3-35、SoRT3-36、SoRT3-41與甘蔗EST數(shù)據(jù)庫中的CA177106.1之間的一致性分別為90.26%、89.10%、88.57%、89.10%;當(dāng)查詢覆蓋度均為97%時,SoRT3-23、SoRT3-35、SoRT3-41與甘蔗EST數(shù)據(jù)庫中的CA203336.1之間的一致性分別為88.15%、86.76%、86.49%(表4)。以上結(jié)果說明GE325024.1、GE325034.1、CA177106.1、CA203336.1這4條EST序列為甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子的部分轉(zhuǎn)錄序列。
表4 Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列與EST數(shù)據(jù)庫比對結(jié)果Tab le 4 Sequence alignm ent w ith EST database on RT of Ty3-gypsy-like retrotransposons
本研究首次從甘蔗品種新臺糖22中擴增出約430 bp大小的Ty3-gypsy類逆轉(zhuǎn)座子RT基因目的條帶,與前人研究結(jié)果一致[14,17?21]。目的條帶經(jīng)回收、克隆和測序后,得到了42條序列,去除非RT基因序列和相同序列后,總共獲得了36條甘蔗RT基因序列。以上說明Ty3-gypsy類逆轉(zhuǎn)座子存在于甘蔗品種新臺糖22中,當(dāng)然也證實了采用簡并引物從甘蔗品種新臺糖22中擴增和克隆Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列的策略是行之有效的。
在36條甘蔗RT基因序列中,除SoRT3-26的序列長度為430 bp外,其余序列長度均為432 bp,表明甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列在長度變化上高度保守,這與前人研究結(jié)果不太一致[19,21];所有序列均富含AT,A/T堿基含量的增加使序列呈現(xiàn)一定異質(zhì)性;核苷酸序列間相似性呈現(xiàn)較高異質(zhì)性;氨基酸序列間相似性呈現(xiàn)高度異質(zhì)性;相比核苷酸序列,氨基酸序列表現(xiàn)出更高異質(zhì)性;除SoRT3-28和SoRT3-26外,各序列間保守基序完全一致,呈現(xiàn)高度保守性;在36條甘蔗RT基因序列當(dāng)中,有6條發(fā)生了無義突變,最多的1條出現(xiàn)了6個終止密碼子,無義突變會使得基因功能改變或喪失,無義突變是甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子產(chǎn)生一定異質(zhì)性和多拷貝的重要原因。
聚類分析將36條RT基因序列分為5個家族,家族Ⅰ和家族Ⅳ是構(gòu)成新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子的主要成分,表明新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列具有相當(dāng)高的保守性與相似性。各家族內(nèi)部成員數(shù)量越多,序列相似性越高,存在有轉(zhuǎn)錄活性的逆轉(zhuǎn)座子的可能性也越大,其轉(zhuǎn)座發(fā)生時間也可能越近[22]。家族Ⅰ和家族Ⅳ中很有可能存在著具有轉(zhuǎn)錄活性的Ty3-gypsy類逆轉(zhuǎn)座子,這兩個家族存在的歷史也更為久遠。
各家族中代表序列的蛋白質(zhì)三級結(jié)構(gòu)整體構(gòu)型基本類似,但在氫鍵數(shù)和轉(zhuǎn)角數(shù)上存在著較大差別,家族Ⅴ中的SoRT3-26,其存在6個終止密碼子突變,可能已經(jīng)失去活性,核苷酸聚類分析中顯示其與其他家族遺傳距離最遠,在蛋白質(zhì)結(jié)構(gòu)上的表現(xiàn)也與其他代表序列存在明顯差異,其氫鍵數(shù)和轉(zhuǎn)角數(shù)要明顯少于其他代表序列,這也表明甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子存在一定異質(zhì)性和多態(tài)性,這些差異可能會影響到甘蔗Ty3-gypsy類逆轉(zhuǎn)座子的轉(zhuǎn)錄活性、轉(zhuǎn)座效率以及拷貝數(shù)等。
36條中的34條同時包含motif 1、motif 2、motif 3和motif 4,占克隆序列總數(shù)的94.44%,說明這4種保守基序是構(gòu)成甘蔗品種新臺糖22中Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列的主要成分,也從保守基序角度表明甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列具有高度保守性與相似性。只有2條甘蔗RT基因序列的保守基序在種類及長度上與上述34條甘蔗RT基因序列存在明顯差異,SoRT3-28存在5種保守基序,其下游的motif 2與上述34條甘蔗RT基因序列的motif 2一致,SoRT3-26也存在5種保守基序,其上游的motif 3與上述34條甘蔗RT基因序列的motif 3一致,推測這兩個保守基序是決定這2條序列為甘蔗RT基因序列的重要原因,這兩條甘蔗RT基因序列在系統(tǒng)進化樹中也是被劃分為與其他家族親緣關(guān)系最遠的家族Ⅵ和Ⅶ,也從側(cè)面驗證了這兩條甘蔗RT基因序列含有不同保守基序的準(zhǔn)確性。
系統(tǒng)進化樹顯示,Ⅰ類中的18條甘蔗RT基因序列與擬南芥的BAB40828.1具有較高相似性,親緣關(guān)系較近;SoRT3-26由于發(fā)生了多個終止密碼子突變而導(dǎo)致其在核苷酸聚類分析中與其他序列遺傳距離最大而單獨為一家族,但在系統(tǒng)進化樹中發(fā)現(xiàn)其與大豆的BAB40834.1、菠菜的BAB40833.1和粳稻的BAB40824.1之間的遺傳距離最小而聚為Ⅶ類。以上可能是甘蔗Ty3-gypsy類逆轉(zhuǎn)座子在進化過程中與這些物種植物發(fā)生過橫向傳遞。除SoRT3-26外,SoRT3-28也與其他甘蔗RT基因序列遺傳距離較大,親緣關(guān)系較遠,說明這兩條序列特異性比較強,在起源和進化上較為古老,可能是甘蔗所特有的。
通過比對甘蔗EST數(shù)據(jù)庫,發(fā)現(xiàn)10條甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列與4條甘蔗EST序列相似性高,且1條甘蔗RT基因序列有時同時與幾條甘蔗EST序列相似性高,表明甘蔗中存在可轉(zhuǎn)錄的Ty3-gypsy類逆轉(zhuǎn)座子,下一步可以對這些有轉(zhuǎn)錄活性的Ty3-gypsy逆轉(zhuǎn)座子的轉(zhuǎn)錄特性和功能進行深入詳細研究。
本研究首次分離出36條甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子RT基因序列,并對其序列特征及多樣性進行詳細分析,進行聚類分析和系統(tǒng)進化樹構(gòu)建,進一步發(fā)現(xiàn)了10條具有轉(zhuǎn)錄活性的甘蔗品種新臺糖22的Ty3-gypsy類逆轉(zhuǎn)座子,這些為基于LTR逆轉(zhuǎn)座子的甘蔗分子標(biāo)記開發(fā)和應(yīng)用奠定基礎(chǔ)。