武曉陽(yáng),楊亞洲,隆文杰,陳 丹,周?chē)?guó)雁,杜 娟,伍少云,蔡 青*,黃興奇
(1.云南大學(xué)生命科學(xué)學(xué)院,云南昆明 650091;2.云南省農(nóng)業(yè)科學(xué)院生物技術(shù)與種質(zhì)資源研究所,云南昆明 650223;3.中國(guó)種子集團(tuán)有限公司生命科學(xué)技術(shù)中心,湖北武漢 430206)
糯玉米(L.var.Kulesh)是一類主要的鮮食玉米。糯玉米籽粒胚乳中的淀粉全部為支鏈淀粉,使得籽粒具有糯性口感。糯性受隱性的單基因控制。普通玉米基因能正常表達(dá)GBSSⅠ(Granule-Bound Starch Synthase Ⅰ)蛋白,用于直鏈淀粉的合成。的突變?cè)斐蒅BSSⅠ蛋白失去活性,直鏈淀粉的合成受阻,使玉米籽粒中的淀粉幾乎全為支鏈淀粉,產(chǎn)生出籽粒的糯性。玉米基因位于第9號(hào)染色體上,全長(zhǎng)約4.5 kb,包含有14個(gè)外顯子。
糯玉米起源于我國(guó),我國(guó)擁有豐富的糯玉米地方品種,大量的等位變異也存在其中,主要等位基因類型包括-7、-10、-4、-124、-、-、-、-和-2等類型。-7、-10是序列缺失造成的突變;-4、-124、-、-、-、-和-2是玉米基因組中轉(zhuǎn)座子活動(dòng)造成的突變。其中-124是由MITE類轉(zhuǎn)座子“124”插入基因的第六外顯子造成的突變。
轉(zhuǎn)座子插入是造成基因突變的主要原因之一。轉(zhuǎn)座子是基因組中一段可移動(dòng)的DNA序列,可以通過(guò)切割、重新整合等一系列過(guò)程從基因組的一個(gè)位置“跳躍”到另一個(gè)位置。根據(jù)轉(zhuǎn)座子在基因組內(nèi)跳躍媒介的不同,可以將轉(zhuǎn)座子分為DNA轉(zhuǎn)座子和RNA轉(zhuǎn)座子,RNA轉(zhuǎn)座子又叫反轉(zhuǎn)錄轉(zhuǎn)座子。RNA轉(zhuǎn)座子通過(guò)“復(fù)制—粘貼”的方式轉(zhuǎn)座,DNA轉(zhuǎn)座子通過(guò)“剪切—粘貼”的方式轉(zhuǎn)座。微型反向重復(fù)轉(zhuǎn)座元件(miniature inverted-repeat transposable element,MITE)是一類主要的DNA轉(zhuǎn)座子,TITE轉(zhuǎn)座子通常具有靶位點(diǎn)重復(fù)(target site duplications,TSDs)和末端反向重復(fù)(Terminal Inverted Repeats,TIRs)的序列結(jié)構(gòu),根據(jù)這些特征其進(jìn)一步可以劃分成1、、、、、和等家族類型?!?24”是在基因突變研究中,鑒定出的一個(gè)新的MITE類轉(zhuǎn)座子家族。
云南及其周邊地區(qū)是我國(guó)少數(shù)民族的聚集地,自古以來(lái)就有食用糯性食物的習(xí)慣。很多特殊類型的糯性玉米就是在這一地區(qū)發(fā)現(xiàn)?!八穆放础本褪瞧渲兄?,最早在云南勐海的傣族居民區(qū)發(fā)現(xiàn),其果穗具有四路籽粒,形態(tài)具有許多玉米原始特征,即分蘗多、果穗多、穗行數(shù)少等,并具有獨(dú)特的口感?!佰潞K穆贰庇衩滓呀?jīng)用于許多科學(xué)研究中。通過(guò)對(duì)基因的鑒定,發(fā)現(xiàn)勐海四路是-10類型的突變;通過(guò)“四路糯”玉米穗行數(shù)QTL的定位,鑒定出多個(gè)控制穗行數(shù)的主效QTL位點(diǎn);“勐海四路”基因組重測(cè)序的完成,為“四路糯”的研究提供了基礎(chǔ)數(shù)據(jù)。由此可見(jiàn),“四路糯”已成為玉米遺傳育種及相關(guān)基礎(chǔ)學(xué)科的特異研究材料,收集保護(hù)好這一珍貴的我國(guó)古老地方品種具有重要意義。云南省農(nóng)業(yè)科學(xué)院作物種質(zhì)資源庫(kù)經(jīng)過(guò)多年的考察收集,保存了云南不同地區(qū)的四路糯玉米資源。筆者對(duì)來(lái)自中緬邊境地區(qū)的四路糯進(jìn)行了基因組的重測(cè)序,通過(guò)與普通玉米B73基因組中“124”轉(zhuǎn)座子進(jìn)行比較,探討了四路糯與普通玉米之間的親緣關(guān)系。
以糯玉米地方品種四路糯為研究材料,用于其基因組的重測(cè)序。試驗(yàn)材料由云南省農(nóng)業(yè)科學(xué)院種質(zhì)資源庫(kù)收集保存。
對(duì)四路糯中隨機(jī)選取的3個(gè)單株分別進(jìn)行了基因組的重測(cè)序。樣品DNA提取參考文獻(xiàn)[23],檢驗(yàn)合格的DNA樣品通過(guò)Covaris破碎機(jī)隨機(jī)打斷成長(zhǎng)度為350 bp的片段。采用TruSeq Library Construction Kit 試劑盒進(jìn)行建庫(kù)。文庫(kù)構(gòu)建完成后,先使用Qubit 2.0進(jìn)行初步定量,稀釋文庫(kù)至1 ng/μL,隨后使用Agilent 2100對(duì)文庫(kù)的insert size進(jìn)行檢測(cè),insert size符合預(yù)期后,使用Q-PCR方法對(duì)文庫(kù)的有效濃度進(jìn)行準(zhǔn)確定量,使文庫(kù)有效濃度大于2 nmol/L,以保證文庫(kù)質(zhì)量。庫(kù)檢合格,根據(jù)文庫(kù)的有效濃度及數(shù)據(jù)產(chǎn)出需求進(jìn)行 illumina HiSeq 雙向測(cè)序。獲得原始測(cè)序序列(sequenced reads)后,進(jìn)行接頭序列及polyN,polyA 等序列的過(guò)濾,將過(guò)濾后的valid reads測(cè)序數(shù)據(jù)用于進(jìn)一步分析。
使用玉米自交系B73的基因組序列(http://ftp.maizesequence.org/current/assembly/),建立本地Blast數(shù)據(jù)庫(kù)。使用-124中的“124”序列比對(duì)B73基因組,采用Blastn程度確定“124”的插入位點(diǎn),提取插入位點(diǎn)上下游150 bp的序列,用于分析“124”的結(jié)構(gòu)。
根據(jù)“124”的結(jié)構(gòu)特征編寫(xiě)Perl代碼(圖1),提取測(cè)序結(jié)果中具有“124”結(jié)構(gòu)的Read序列;使用獲得的Read序列建立本地Blast數(shù)據(jù)庫(kù);利用Blastn程序進(jìn)一步確定含有“124”轉(zhuǎn)座子的Read序列;利用這些Read序列分析其中的“124”結(jié)構(gòu);根據(jù)“124”序列插入位點(diǎn)信息和剔除其中的重復(fù)。
使用RNAstructure 6.2軟件預(yù)測(cè)轉(zhuǎn)座子“124”的二級(jí)結(jié)構(gòu);使用軟件CLUSTAL W和Genedoc進(jìn)行序列比對(duì);使用MEGA 5軟件構(gòu)建最大似然樹(shù)(Maximum Likelihood Tree)。植物MITE數(shù)據(jù)庫(kù)(Plant MITE Database,http:∥pmite.hzau.edu.cn/)用于 “124”轉(zhuǎn)座子家族的劃分。
“124”家族的轉(zhuǎn)座子最早在基因中鑒定出。通過(guò)與數(shù)據(jù)庫(kù)中已知的MITE比對(duì),未發(fā)現(xiàn)相似轉(zhuǎn)座子,由此可知“124”為新鑒定出的轉(zhuǎn)座子家族。該研究使用這一序列與B73基因組進(jìn)行比對(duì),進(jìn)一步鑒定出13個(gè)“124”家族轉(zhuǎn)座子的插入位點(diǎn),利用轉(zhuǎn)座子上下游150 bp的序列進(jìn)一步分析出每個(gè)轉(zhuǎn)座子的結(jié)構(gòu),將這些序列命名為73-124-1~73-124-13(表1)?!?24”在玉米基因組中是一類低拷貝數(shù)的轉(zhuǎn)座子家族。典型的“124”轉(zhuǎn)座子全長(zhǎng)116 bp;具有9 bp靶位點(diǎn)的重復(fù)序列(TSDs),但這一結(jié)構(gòu)的序列并不保守;具有保守的3 bp末端反向互補(bǔ)重復(fù)序列(TIRs)5′-GGA-3′和5′-TCC-3′;轉(zhuǎn)座子序列內(nèi)部存在多處5′-GGA-3′和5′-TCC-3′序列,存在進(jìn)一步截短的趨勢(shì),最短的“124”序列僅73 bp;“124”轉(zhuǎn)座子可形成明顯的二級(jí)結(jié)構(gòu)(圖2),“124”家族成員的序列存在一定的相似性,但相似程度不高。值得注意的是,-124中的“124”序列與73-124-1的序列完全一致,但二者的靶位點(diǎn)TSDs結(jié)構(gòu)并不相同。
表1 B73基因組中的“124”轉(zhuǎn)座子Table 1 The “124” transposon in B73 genome
該研究對(duì)四路糯進(jìn)行了基因組的重測(cè)序,序列信息見(jiàn)表2。數(shù)據(jù)總量121.98 Gb。每個(gè)“124”的插入位點(diǎn)包括轉(zhuǎn)座子序列長(zhǎng)度為116 bp,TSDs長(zhǎng)度為18 bp,小于重測(cè)序的Read序列長(zhǎng)度為150 bp,因此可以根據(jù)“124”的結(jié)構(gòu)從測(cè)序結(jié)果中直接提取包含“124”的Read。該研究利用Perl代碼中的正則表達(dá)式描述“124”的結(jié)構(gòu),5~10 bp的TSD,加5′-GGA-3′序列,加70~120 bp的序列,加5′-TCC-3′,加TSD重復(fù)(圖1),共計(jì)得到了1 101 959個(gè)含有類似“124”結(jié)構(gòu)的Read序列,進(jìn)一步將所得到的Read建立本地Blast數(shù)據(jù)庫(kù),通過(guò)鑒定得到60個(gè)含有“124”轉(zhuǎn)座子的Read,-evalue 值設(shè)置為1e-010;剔除重復(fù)后共計(jì)得到17個(gè)“124”序列,并分析出其TSDs結(jié)構(gòu)。這17個(gè)“124”序列分別命名為-124-1~-124-17(圖3)。
圖1 從測(cè)序結(jié)果中提取“124”結(jié)構(gòu)Read的Perl代碼Fig.1 The Perl code of extracting “124” structure Read from the sequencing results
圖2 部分“124”轉(zhuǎn)座子展現(xiàn)出的二級(jí)結(jié)構(gòu)Fig.2 The secondary structure of some “124” transposons
四路糯基因組中的“124”較B73基因組中的分布數(shù)目稍多;通過(guò)序列比對(duì)發(fā)現(xiàn),“124”轉(zhuǎn)座子成員間序列具有相似性,但序列間并不具有一致性(圖3);通過(guò)構(gòu)建“124”的系統(tǒng)進(jìn)化樹(shù),可以將“124”轉(zhuǎn)座子大體分為4類不存在獨(dú)立基因組來(lái)源的類型;基因中的“124”可在二者基因組中找到完全一致的序列,歸為第一類“124”轉(zhuǎn)座子,但插入位點(diǎn)存在差異;二者基因組中存在3個(gè)完全一致的插入位點(diǎn),圖4中箭頭所示分布在Ⅱ、Ⅲ、Ⅳ類型轉(zhuǎn)座子中,展現(xiàn)出一致的“124”序列和一致的TSDs序列。
表2 四路糯基因組重測(cè)序的序列信息Table 2 Information of myanmar four-row wax genome resequencing
圖3 “124”轉(zhuǎn)座子間的序列比對(duì)Fig.3 Sequence alignment of “124” transposons
圖4 利用“124”轉(zhuǎn)座子序列構(gòu)建的系統(tǒng)進(jìn)化樹(shù)Fig.4 Phylogenetic tree constructed by transposon “124”
糯玉米的中國(guó)起源目前已經(jīng)受到了比較廣泛的認(rèn)可。然而,對(duì)于的起源存在不同的觀點(diǎn),一種觀點(diǎn)認(rèn)為玉米起源于美洲,引入我國(guó)后經(jīng)過(guò)單基因突變而產(chǎn)生不同類型的基因;另一種觀點(diǎn)認(rèn)為基因是由本土玉米近源物種形成,在玉米中國(guó)本土化過(guò)程中轉(zhuǎn)播到引進(jìn)的玉米中,形成了不同類型的糯玉米地方品種。第二種觀點(diǎn)的依據(jù)是四路糯可能是我國(guó)本土物種,可能是基因的主要來(lái)源。究其原因在于四路糯本身存在大量玉米的原始特征,并且在云南以外地區(qū)并未發(fā)現(xiàn)其分布,目前已知“四路糯”的基因類型是-10,也是我國(guó)糯玉米地方品種中廣泛分布的等位基因類型。然而,目前尚缺乏明顯的證據(jù)說(shuō)明四路糯的起源。因此,四路糯基因組與普通玉米間的比較,對(duì)四路糯的起源與演化的研究具有重要意義。-124是在我國(guó)糯玉米地方品種中鑒定出的一類等位基因。該研究探索使用“124”轉(zhuǎn)座子的分布差異,研究四路糯基因組與普通玉米基因組間的分化,從“124”轉(zhuǎn)座子的構(gòu)成來(lái)看,更傾向與四路糯與B73的基因組差異是玉米種內(nèi)的差異?;蛑胁迦氲摹?24”序列在普通玉米B73和四路糯中均發(fā)現(xiàn)了與其一致的序列,由此推斷-124的形成于四路糯無(wú)必然的關(guān)系。這一結(jié)果傾向于玉米在引入我國(guó)后基因的突變產(chǎn)生了糯質(zhì)性基因的觀點(diǎn)。