玉米以杰出的細(xì)胞學(xué)和轉(zhuǎn)座子研究而被作為遺傳研究的經(jīng)典模式作物,玉米基因組中含有大量的轉(zhuǎn)座子和串聯(lián)重復(fù)序列存在,這對(duì)于研究玉米中大片段基因組結(jié)構(gòu)變異以及功能基因組都會(huì)造成一定的阻礙。而發(fā)展無縫基因組拼接方法在一定程度上可以促進(jìn)玉米和其它作物的基因組研究。
近日,Genome Biology在線發(fā)表了喬治亞大學(xué)R.Kelly Dawe教授以題為“Gapless assembly of maize chromosomes using long-read technologies”的研究論文,該研究通過整合PacBio和Nanopore兩套拼接數(shù)據(jù)并利用Bionano光學(xué)圖譜進(jìn)行整合,得到了高質(zhì)量的無縫染色體拼接序列(拼接流程如圖1)。
該研究以玉米自交系B73-Ab10自交系(BC6F5代)為研究對(duì)象,B73-Ab10是以B73為遺傳背景,在10號(hào)染色體末端攜帶了Ab10材料的特異單倍型;該研究通過整合兩套拼接數(shù)據(jù)和一套光學(xué)圖譜數(shù)據(jù)創(chuàng)造了B73-Ab10材料的基因組物理圖譜,3號(hào)染色體和9號(hào)染色體實(shí)現(xiàn)了無縫拼接,該基因組圖譜包含63條Contig,而N50達(dá)到162.0Mb;該物理圖譜清晰描繪了10條染色體中7條染色體的著絲粒結(jié)構(gòu),5個(gè)異染色體旋鈕結(jié)構(gòu)和大多數(shù)的高度重復(fù)序列區(qū)域;同時(shí)該研究鑒定了53Mb關(guān)于Ab10減數(shù)分裂驅(qū)動(dòng)相關(guān)的單倍型區(qū)域(圖2)。
無縫基因組拼接技術(shù)可以消除基因和調(diào)控元件在順序、間隔和方向上的不確定性,該研究通過利用長(zhǎng)讀長(zhǎng)測(cè)序數(shù)據(jù)和已知拼接算法,通過光學(xué)圖譜整合獨(dú)立的拼接數(shù)據(jù),極大提高了基因組拼接的連續(xù)性;該研究提供了玉米完整的基因和相關(guān)調(diào)控序列信息,揭示了序列重復(fù)區(qū)域的內(nèi)部結(jié)構(gòu),可以更好地對(duì)重復(fù)序列區(qū)域進(jìn)行注釋和表觀基因組研究;同時(shí)該研究可以為復(fù)雜基因組拼接提供參考,對(duì)于多倍體或者雜合度較高物種可能需要更深測(cè)序深度,更長(zhǎng)讀長(zhǎng)和豐富的架構(gòu)信息來進(jìn)行無縫基因組拼接。
該研究得到美國國家科學(xué)基金會(huì)資助(MCB-1412063和IOS-1744001)。