趙志新,李浩
(商洛學院生物醫(yī)藥與食品工程學院,陜西商洛726000)
比較串聯(lián)重復序列在玉米及高粱染色體上的差異
趙志新,李浩
(商洛學院生物醫(yī)藥與食品工程學院,陜西商洛726000)
串聯(lián)重復序列廣泛分布于真核生物,特別是植物中,為了比較其在禾本科植物染色體中的分布及差異,使用Phobos軟件分析了玉米和高粱全基因組數(shù)據(jù)。結果顯示,重復序列主要為短序列重復(<=6 bp),其中尤以二核苷酸和三核苷酸重復序列密度最高。玉米和高粱的二核苷酸重復單元都以AT重復為主,而其三核苷酸重復單元不盡相同;玉米主要以CCG極其互補序列CGG重復居多,而高粱以ATT極其互補序列AAT重復為主。并且玉米及高粱串聯(lián)重復序列主要分布于染色體兩端。對于理解串聯(lián)重復序列在玉米及高粱染色體上的分布做了初步分析,研究揭示串聯(lián)重復序列主要特征及分布位置,對重復序列在禾本科植物基因組中的研究具有借鑒作用。
串聯(lián)重復序列;染色體;玉米;高粱
以各自的核心序列(重復單元)首尾相連多次重復稱之為串聯(lián)重復序列(Tandem repeats,TRs)。TRs廣泛存在于真核生物和部分原核生物基因中,植物基因組的重復序列一般占80%左右,它們在基因組中表現(xiàn)出種屬、堿基組成等特異性,同時在基因組中的存在亦有很大差異[1]。研究表明,重復序列在維持染色體的空間結構、基因表達以及遺傳重組中都具有重要作用[2]。這些重復序列的類型和各重復拷貝類別在同一物種不同染色體間以及基因的編碼區(qū)和非編碼區(qū)也有種屬和堿基組成的差異。這些差異顯示了重復序列起源和進化的復雜性,它可能涉及到多種因素,并與生物功能密切相關[3]。對重復序列的深入研究能進一步了解重復序列在基因組進化中的作用,及其在基因組中的生物學功能等[4]。目前,重復序列的研究主要集中在染色體和基因這兩大方面,本研究首先探查TRs在基因組中的密度含量及主要的重復模體,然后檢測TRs在染色體上的分布,以期推測其在生物體及進化中的作用。
1.1 玉米及高粱全基因組數(shù)據(jù)收集
玉米(Zea mays)和高粱(Sorghum bicolor)的全基因組數(shù)據(jù)下載于Phytozome(http://www.phytozome.net)數(shù)據(jù)庫,使用目前最新的Phytozome v10版本的數(shù)據(jù)。
1.2 研究方法
使用重復序列掃描軟件Phobos version 3.3.12[4];掃描1-50 bp的重復單元(repeat unit),要求最短重復長度為12 bp;如有mismatch/ indel,則要求序列至少具有95%的保真度;然后將獲得的數(shù)據(jù)使用Perl編寫的程序處理。
對于循環(huán)的串聯(lián)重復序列,依據(jù)字母順序選定重復模體(repeat motif),如AAG,AGA和GAA為(AAG)n的重復模體。由于玉米高粱的基因組很大,因此羅列出其串聯(lián)重復序列的具體數(shù)值是不現(xiàn)實的,因此引進一個比較適宜的統(tǒng)計方法,即通過比較兩者的串聯(lián)重復序列密度(TR density)來實現(xiàn),就是每兆序列中含有的串聯(lián)重復序列的長度(bp·Mbp-1)。
為了方便統(tǒng)計出TRs在玉米及高粱每條染色體中的具體分布,將玉米和高粱每條染色體分為1-100個單位(即百分化),然后據(jù)此分為10等份(1-10,11-20,…,91-100)來比較在每一位置中含有TRs的數(shù)量。
2.1 玉米基因組中1-50 bp TRs的密度分布
在玉米的基因組中,高密度的TRs(>400 bp·Mbp-1)全部為短重復單元(1-6 bp,如圖1),其中尤其以二核苷酸以及三核苷酸重復單元為主,占總密度的24.3%??傮w來看,隨著重復單元的增大,密度逐漸降低,但某些重復單元(譬如6 bp,12 bp以及50 bp)雖然較長,卻比其相近重復單元密度要高。由此可見,重復單元密度分布并非隨機出現(xiàn),而應該是基因組進化選擇的結果。
圖1 玉米基因組中TRs密度分布
對于占總密度近1/4的二核苷酸以及三核苷酸重復單元,其具體重復模體見圖2。研究結果顯示,二核苷酸重復單元主要以AT重復為主,占總重復模體的35.9%;而三核苷酸重復單元主要為CCG及其互補模體CGG為主,占總重復模體的34.4%。
圖2 重復模體在玉米基因組中密度分布
2.2 高粱基因組中1-50 bp TRs的密度分布
在高粱的基因組中,高密度的TRs(>250 bp·Mbp-1)主要為短序列重復單元(1-6 bp,除了21bp,如圖3),類似于玉米,二核苷酸和三核苷酸重復單元密度為第一、第二高,占總體密度的32.2%。雖然隨著重復單元變長,密度逐漸下降;但在高粱基因組中,部分長重復單元(例如21 bp和38 bp)仍然有較高密度(為510 bp·Mbp-1和123 bp·Mbp-1)。這些具有高密度的長重復單元可能是基因組進化選擇的結果,而不太可能是隨機產(chǎn)生的。
圖3 高粱基因組中TRs密度分布
對于具有高密度的二核苷酸和三核苷酸重復單元,如圖4顯示,其重復模體的密度。分析結果顯示高粱的二核苷酸重復模體與玉米相類似,主要為AT重復,占總重復模體的66.5%;而三核苷酸重復模體則不同于玉米,主要為ATT及其互補序列AAT重復,占總重復模體的21.6%。
2.3 TRs在玉米和高粱染色體組的分布
玉米和高粱各有10條染色體,將每條染色體分為10個等分區(qū)間,通過TRs在每個區(qū)間所占的百分比含量來比較染色體上的分布差異。結果如圖5所示,TRs在玉米和高粱的10條染色體上的分布趨勢相一致,主要存在于染色體兩端(>10%),而染色體中間含量較低(~5%)。
圖5 TRs在玉米和高粱染色體中的分布
TRs在玉米和高粱基因組中密度分布總體趨勢是一致的,主要富集區(qū)域都集中于1-6 bp·Mbp-1重復單元,并且玉米及高粱的二核苷酸重復序列的重復模體都是以AT重復為主,雖然它們的三核苷酸重復模體不盡相同,玉米主要以CCG及其互補序列CGG為主,而高粱則以ATT以及其互補序列AAT居多。并且有些長的重復單元具有較高的密度,特別是在高粱中,顯示重復序列具有生物學功能,而不是“垃圾DNA”,是進化選擇的結果[5]。Mayer等[4]研究顯示,長重復單元(7-50 bp)在有較高的密度值和特定的生物學功能。
富含TRs的區(qū)域大多集中在染色體的兩端,而染色體兩端是端粒所在位點,端粒本身的結構組成也是串聯(lián)重復序列。因此,串聯(lián)重復序列可能與端粒的形成有密切聯(lián)系,亦可能影響端粒的結構、長度,從而影響整個染色體的穩(wěn)定性。以玉米為例,其核糖體DNA中的45S rDNA存在于第6染色體前臂上,而5S rDNA位于第2染色體長臂近末端[6];顯示存在于染色體兩端的部分串聯(lián)重復序列可能像核糖體DNA一般,可能是組成影響生物一系列生理活動的蛋白或結構。重復序列在參與染色體重組及端粒末端復制等過程中起到一些關鍵作用[7-8],由此可推測玉米、高粱產(chǎn)生的生理差異可能跟在染色體兩端富集的串聯(lián)重復序列含量有關聯(lián)。
[1]Gemayel R,Vinces M D,Legendre M,et al.Variable tandem repeats accelerate evolution of coding and regulatory sequences[J].Annu Rev Genet,2010,44: 445-477.
[2]艾對元.基因組中重復序列的意義[J].生命的化學,2008,28(3):343-345.
[3]高煥,孔杰.串聯(lián)重復序列的物種差異及其生物功能[J].動物學研究,2005,26(5):555-564.
[4]Mayer C,Lease F,Tellurian R.Genome-wide analysis of tandem repeats in Daphnia poleax-a comparative approach[J].BMC Genomics,2010,1:277-304.
[5]Zhao Z X,Guo C,Sutharzan S,et al.Genome-wide analysis of tandem repeats in plants and green algae[J].G3:Genes Genomes Genetics,2014,4(1):67-78.
[6]韓永華,宋運淳,金危危.玉米基因組重復序列的研究進展[J].玉米科學,2007,15(4):37-40.
[7]高武軍,謝璐,盧靖雯,等.重復序列及染色質(zhì)化在植物性染色體重組抑制中的作用[J].遺傳,2010,32(1): 25-30.
[8]湯繼華,馬西青,滕文濤,等.玉米簡單重復序列不對等交換的熱點區(qū)域定位[J].科學作報,2009,35(5):958-961.
(責任編輯:李堆淑)
Com parison of Differences of Tandem Repeats in Chromosomes of M aize and Sorghum
ZHAO Zhi-xin,LI Hao
(College of Biopharmaceutical and Food Engineering,Shangluo University,Shangluo 726000,Shaanxi)
Tandem repeats(TRs)are detected widely in eukaryotes,especially in plants,the research is designed to investigate TRs in maize and sorghum genome by Phobos in order to compare and analyze the distribution and differences of TRs in Gramineae.Results showed that the TRs are mainly short repeat unit (<=6 bp),especially for the dinucleotide and trinucleotide.For repeat motifs,both maize and sorghum utilize AT motif in the dinucleotide repeat unit,yet in the trinucleotide repeat unit maize mainly employs CCG and its complementary CGG motifs,sorghum has ATT and its complementary AAT.In addition,the distribution of TRs in maize and sorghum demonstrates that TRs are mainly located in the both ends of chromosomes.The research analyzed the distribution of TRs in chromosomes in maize and sorghum primarily,and revealed the main features and distribution position in chromosomes,which is beneficial to the understanding of the TRs in Gramineae genome.
tandem repeats;chromosomes;maize;sorghum
S51
A
1674-0033(2015)06-0059-04
10.13440/j.slxy.1674-0033.2015.06.014
2015-10-13
商洛學院科研基金項目(14SKY028)
趙志新,男,河南滑縣人,博士,講師