国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于33個遺傳多樣性水稻材料的泛基因組分析揭示“隱藏”的基因組變異

2021-07-02 14:48陳薇蘭李仕貴
關(guān)鍵詞:基因組變異測序

欽 鵬,陳薇蘭,王 淏,李仕貴

(四川農(nóng)業(yè)大學(xué)水稻研究所,成都 611130)

基因組結(jié)構(gòu)變異(SVs)和基因拷貝數(shù)變異(gCNVs)作為重要的遺傳變異來源,越來越多的證據(jù)表明SV和gCNV在調(diào)控動植物表型多樣性方面具有重要作用[1-2]。但基于短片段測序數(shù)據(jù)的SV和gCNV鑒定困難且不可靠[3]。即使利用長片段測序數(shù)據(jù),仍然很難解決位于重復(fù)區(qū)域附近或非常大的SV[4]。近年來,由于高質(zhì)量基因組組裝方法的快速發(fā)展,越來越多研究利用高質(zhì)量組來鑒定和分析SV[5-10]。但目前相關(guān)研究僅限于少數(shù)材料,少有利用群體水平的高質(zhì)量基因組來研究SV,因此植物基因組的SV和gCNV變異情況仍不清楚。水稻作為世界上最重要的糧食作物和植物研究的模式生物,到目前為止,僅有利用短片段測序數(shù)據(jù)鑒定的SV結(jié)果[11-15],還未有群體水平上對水稻SV和gCNV全面準(zhǔn)確的研究報道。

研究人員選取了遺傳背景具有高度代表性的33個水稻材料,包括亞洲栽培稻各亞群代表性材料和非洲栽培稻材料,以及水稻生產(chǎn)和育種上廣泛使用的優(yōu)良品種和核心親本材料。利用長片段測序和NCBI數(shù)據(jù)庫,獲得了31份材料平均深度~60倍的長片段序列數(shù)據(jù)。利用高質(zhì)量基因組組裝和注釋流程,獲得了31個均達(dá)到參考基因組水平的高質(zhì)量基因組和基因注釋。結(jié)合已發(fā)表的兩個高質(zhì)量基因組(日本晴和蜀恢498)和注釋結(jié)果,構(gòu)建了一個含66 636個基因的泛基因組。通過32個材料與日本晴基因組序列的比較分析,發(fā)現(xiàn)平均每個材料相對日本晴存在24 469個SVs,通過去冗余,共獲得171 072個相對于日本晴基因組的非冗余SVs,并應(yīng)用多種方法證明了鑒定到的SV具有較高的準(zhǔn)確性。通過與已報道的SV比較分析,發(fā)現(xiàn)其中82.8%的SV未在先前基于短序列測序數(shù)據(jù)得到的SV中鑒定到。進(jìn)一步對SV在基因組上分布的分析發(fā)現(xiàn),SV在染色體上非均勻分布,存在140個SV熱點(diǎn)區(qū)域。

研究人員進(jìn)一步利用非洲栽培稻CG14作為外群,對亞洲栽培稻群體中SV序列的祖先型進(jìn)行了推斷,共對130 862個SV祖先型進(jìn)行了推斷,并將明確發(fā)生在亞洲栽培稻中的SVs定義為dSVs(derivedstate SVs)。對dSV相對基因位置的分析發(fā)現(xiàn),53.2%的dSV位于基因附近(包括基因上下游2 kbp區(qū)域),其中大多數(shù)位于基因的非編碼區(qū)且發(fā)生在較少材料中?;诨虻姆夯蚪M中~50%(32 668)的基因上下游2 kbp區(qū)域在32個亞洲栽培稻種至少有一個dSV,其中包括1 406個已經(jīng)報道的基因。這些dSVs對揭示亞洲栽培稻中自然選擇和人工馴化過程導(dǎo)致基因組結(jié)構(gòu)性變異的方向和生物學(xué)意義具有重要作用。例如先前報道的兩個與獨(dú)腳金內(nèi)酯合成相關(guān)基因SLB1和SLB2被認(rèn)為是在秈稻群體中缺失與優(yōu)良性狀(分蘗增加和獨(dú)腳金萌發(fā)降低)相關(guān)而被人工選擇到[16],本研究結(jié)合該SV的分化狀態(tài)和群體分布等分析發(fā)現(xiàn),很可能是在粳稻中進(jìn)化或馴化過程中被插入含有SLB1和SLB2基因的基因組序列,因為其可能幫助磷的吸收提高產(chǎn)量從而被保留在粳稻中。

因為筆者發(fā)現(xiàn)大多數(shù)SV位于非編碼區(qū),研究人員進(jìn)一步利用蜀恢527材料中存在與不存在SV的基因,分析了SV對基因表達(dá)量的影響。通過分析多份不同脅迫處理和不同發(fā)育時期的蜀恢527轉(zhuǎn)錄組數(shù)據(jù)發(fā)現(xiàn),在整體表達(dá)水平上,附近存在SV的基因的表達(dá)量低于不存在SV的基因的表達(dá)量,且附近存在SV的基因的表達(dá)量對環(huán)境脅迫更敏感。利用33份材料苗期地上和地下轉(zhuǎn)錄組數(shù)據(jù)分析發(fā)現(xiàn)3 340個SV在地上或地下組織中與基因表達(dá)量顯著相關(guān),表明SVs在水稻進(jìn)化和馴化過程中對基因表達(dá)模式有著廣泛的影響。研究人員進(jìn)一步分析了dSVs在亞洲栽培稻各個亞群中的分布,發(fā)現(xiàn)在可用于分析群體分布的20 965個dSV中,25.7%的dSVs被特異性地固定在一個或多個亞群中,暗示大量dSVs可能受到自然或人工選擇并保留在相應(yīng)的群體中。

研究人員利用泛基因組中基因的蛋白序列比對到33個基因組序列的策略鑒定分析gCNV,發(fā)現(xiàn)大量(25 549)基因在33個材料間存在基因序列拷貝數(shù)變異(gCNV),包括2 945個非洲栽培稻CG14特異的gCNVs,22 604個栽培稻中特異的gCNVs。結(jié)合33份材料苗期的地上和地下組織轉(zhuǎn)錄組數(shù)據(jù)分析發(fā)現(xiàn),296和361個基因的拷貝數(shù)變異和表達(dá)量在之間存在顯著地相關(guān)性。這些之前研究未發(fā)現(xiàn)大量具有g(shù)CNV的基因?qū)⒓铀賰?yōu)異自然等位變異的挖掘,比如OsVIL1在N22等7個材料中存在2個拷貝,且與表達(dá)量顯著正相關(guān)。結(jié)合OsVIL1過表達(dá)能提高穗粒數(shù)[17],因此該2個拷貝很可能具有增加水稻穗粒數(shù)的功能。大量具有g(shù)CNV基因的鑒定也將有利于加快挖掘復(fù)雜區(qū)域中控制農(nóng)藝性狀多態(tài)性的基因組變異和應(yīng)用,如之前報道的越光中早花QTL(qDTH7-3)[18],我們發(fā)現(xiàn)OsMADS18兩個拷貝位于該區(qū)段,結(jié)合OsMADS18過表達(dá)的早花表型[19-20]推斷OsMADS18兩個拷貝很可能是控制該早花QTL的目標(biāo)變異。

結(jié)合人類分析SV形成機(jī)制的流程,研究人員系統(tǒng)地分析了水稻中SV形成機(jī)制。發(fā)現(xiàn)水稻SV主要由TEI(轉(zhuǎn)座子插入)和NHEJ(非同源末端連接)兩種機(jī)制形成。但對于不同類型的SV,主要的形成機(jī)制有所不同,比如缺失和插入分別主要由NHEJ和TEI形成。結(jié)合SV邊界序列與TE注釋,研究人員發(fā)現(xiàn)73.2%的由NHEJ和NAHR(非等位同源重組)機(jī)制形成的SV的邊界都具有TE序列。同時相比全基因組LTR的比例,NHEJ和NAHR產(chǎn)生的SV斷點(diǎn)兩端具有更高比例的LTR。這些結(jié)果表明TE,特別是LTR能更高頻率產(chǎn)生DNA斷裂為NHEJ形成SV提供可能,以及LTR能更高頻率提供同源序列為NAHR產(chǎn)生SV提供可能。

研究人員進(jìn)一步利用所鑒定到的PAV(presence and absence variation)和 variation graph toolkit流程,首次構(gòu)建了水稻圖形基因組。結(jié)合674份水稻材料的二代短序列測序數(shù)據(jù)和圖形基因組共鑒定到47 952個PAV。與674份材料的SNP數(shù)據(jù)連鎖分析發(fā)現(xiàn),17.5%的SV表現(xiàn)出與其附近SNP非常低的連鎖度,表明這些基因組變異不能被SNP代表。利用674份材料的葉片早衰表型和SNP、SV數(shù)據(jù)進(jìn)行GWAS分析發(fā)現(xiàn),最顯著相關(guān)的位點(diǎn)只能被SV檢測到。該SV位于Os06g13470基因啟動子區(qū)域,表達(dá)量分析結(jié)果表明該SV可能特異性在灌漿期激活Os06g13470的表達(dá),暗示該SV很可能是控制葉片早衰的候選變異位點(diǎn)。這些結(jié)果表明:在研究自然變異調(diào)控農(nóng)藝性狀多態(tài)性方面,圖形基因組和SV具有SNP與線性參考基因組難以代替的作用。研究人員進(jìn)一步搭建了包含基因組序列和基因組變異的數(shù)據(jù)庫RiceRC.Com。本研究內(nèi)容(圖1)為水稻及其他作物功能基因組研究、優(yōu)良等位基因挖掘和功能解析、分子設(shè)計育種奠定了堅實基礎(chǔ)。

圖1 本研究相關(guān)的主要內(nèi)容Figure 1 This topic research primary coverage

猜你喜歡
基因組變異測序
兩種高通量測序平臺應(yīng)用于不同SARS-CoV-2變異株的對比研究
“植物界大熊貓”完整基因組圖譜首次發(fā)布
我國小麥基因組編輯抗病育種取得突破
第一代基因組設(shè)計的雜交馬鈴薯問世
牛參考基因組中發(fā)現(xiàn)被忽視基因
生物測序走在前
變異
基因測序技術(shù)研究進(jìn)展
高通量測序技術(shù)及其發(fā)展
變異的蚊子