2020年8月1日,山東省果樹研究所劉慶忠研究員團(tuán)隊(duì)完成的題為“Chromosome-scale genome assembly of sweet cherry (PrunusaviumL.) cv. Tieton obtained using long-read and Hi-C sequencing”的重要成果在Horticulture Research在線發(fā)表。
該期刊是由南京農(nóng)業(yè)大學(xué)與Nature出版集團(tuán)(現(xiàn)Springer Nature)合作創(chuàng)辦的英文期刊,是Nature旗下唯一的園藝領(lǐng)域?qū)??,也是目前園藝領(lǐng)域唯一的一區(qū)中國SCI期刊。2019年JCR影響因子5.404,園藝一區(qū)TOP期刊(第1/36名),植物科學(xué)一區(qū)(第16/234名),遺傳學(xué)一區(qū)(第24/177名)。
劉慶忠研究員櫻桃團(tuán)隊(duì)研究利用Oxford Nanopore、Illumina和Hi-C技術(shù),獲得了一個(gè)中國主栽甜櫻桃品種美早的高質(zhì)量染色體版本的甜櫻桃參考基因組,該基因組具有更高的連續(xù)性和完整性,將更有助于李屬物種比較基因組的研究,并為甜櫻桃的分子育種研究提供了高質(zhì)量的參考基因組。
該研究獲得了相當(dāng)于甜櫻桃基因組190X的Oxford Nanopore測序數(shù)據(jù)和136X的Illumina測序數(shù)據(jù),通過MaSuRCA,Canu,wtdbg2和NECAT等組裝軟件組裝,再利用三代和二代測序數(shù)據(jù)進(jìn)行校正,最后利用Purge Haplotigs去除冗余序列。通過比較不同組裝的BUSC評(píng)估結(jié)果,選取Complete BUSCOs為(97.4%)NECAT-medaka-NextPolish-Purge_Haplotigs的組裝結(jié)果進(jìn)行后續(xù)分析,組裝總長度為344.29Mb,Contig N50=3.25Mb。該研究獲得了40.19Gb的Hi-C測序數(shù)據(jù),利用Hi-C測序結(jié)果,通過ALLHiC軟件將99.59%(342.88Mb)的contig定位到8條染色體上,獲得了高質(zhì)量染色體版本的甜櫻桃參考基因組。
通過同源分析、從頭預(yù)測和轉(zhuǎn)錄組輔助預(yù)測等方法對(duì)美早的基因組進(jìn)行了注釋,共預(yù)測得到38275個(gè)基因,編碼了40338個(gè)蛋白序列,對(duì)其中的30416個(gè)蛋白序列進(jìn)行了功能注釋。重復(fù)序列分析發(fā)現(xiàn),美早的基因組共含有204.55Mb的重復(fù)序列,占到基因組序列的59.40%,這是已發(fā)表的李屬植物基因組中重復(fù)序列比例最高的,這也是甜櫻桃基因組組裝的難點(diǎn)之一。
這項(xiàng)成果充實(shí)了中國甜櫻桃分子育種領(lǐng)域研究內(nèi)容,有助于櫻桃人了解甜櫻桃基因序列,也為分子育種和抗性相關(guān)研究提供了研究基礎(chǔ)。只有對(duì)甜櫻桃基因組了解越透徹,才能選育出更多更優(yōu)質(zhì)的品種,希望更多的櫻桃專家為中國櫻桃育種事業(yè)開創(chuàng)新局面,促進(jìn)櫻桃產(chǎn)業(yè)蓬勃發(fā)展。
《落葉果樹》微信公眾號(hào)獨(dú)家發(fā)布了“【重磅】山東省農(nóng)業(yè)科學(xué)院果樹研究所甜櫻桃基因組測序研究獲得重大突破!”,詳細(xì)內(nèi)容敬請關(guān)注《落葉果樹》公眾平臺(tái)(lygsbj)。