施肖壟 蔡志欣 郭仲杰 盧園萍 陳美元 廖劍華
摘要:【目的】通過(guò)對(duì)雙孢蘑菇不同類型核心種質(zhì)的基因組重測(cè)序分析,探討雙孢蘑菇不同類型菌株間基因組存在的差異及開(kāi)發(fā)相關(guān)分子標(biāo)記?!痉椒ā繉?duì)雙孢蘑菇國(guó)內(nèi)外雜交菌株、野生菌株、高產(chǎn)型或優(yōu)質(zhì)型傳統(tǒng)菌株、棕色菌株、不育菌株等共18株核心種質(zhì)進(jìn)行基因組重測(cè)序,應(yīng)用不同的生物信息學(xué)處理軟件,對(duì)測(cè)序得到的原始reads序列與雙孢蘑菇參考基因組H97序列進(jìn)行比對(duì),同時(shí)基于比對(duì)結(jié)果進(jìn)行SNP、SV檢測(cè),通過(guò)檢測(cè)結(jié)果對(duì)多態(tài)性標(biāo)記分布進(jìn)行統(tǒng)計(jì)并實(shí)現(xiàn)DNA水平差異基因挖掘和差異基因功能注釋等?!窘Y(jié)果】樣品測(cè)序共獲得21.63G數(shù)據(jù)量,Q30平均達(dá)到89.10%。樣品的reads與參考基因組H97的比對(duì)效率平均為82.50%,基因組覆蓋度為96.32%,平均深度分別在33X左右?;跍y(cè)序數(shù)據(jù)與參考基因組的比對(duì)結(jié)果,共檢測(cè)獲得約813768個(gè)SNP,53840個(gè)InDel,平均每個(gè)個(gè)體獲得924個(gè)SV變異。【結(jié)論】國(guó)內(nèi)外菌株的親緣關(guān)系表明As2796系列與ul系列是世界上并列的兩大雙孢蘑菇雜交品系。
關(guān)鍵詞:食用菌;基因組;SNP;InDel;結(jié)構(gòu)變異
中圖分類號(hào):S646.11文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1008-0384(2019)10-1167-06
0引言
【研究意義】目前,多種食用菌已經(jīng)完成了全基因組測(cè)序,包括雙孢蘑菇(Agaricus bisporus)、草菇(Volvariellavolvacea)、香菇(Lentinusedodes)、黑木耳(AuricuLARIA Heimuer)等。在基因組測(cè)序完成并共享之后,利用新一代測(cè)序技術(shù)對(duì)基因組進(jìn)行重測(cè)序變得簡(jiǎn)單易行且成本低廉。全基因組重測(cè)序是對(duì)已知基因組序列的物種進(jìn)行不同個(gè)體的基因組測(cè)序,并在此基礎(chǔ)上對(duì)個(gè)體或群體進(jìn)行差異性分析。全基因組重測(cè)序的個(gè)體,通過(guò)序列比對(duì),可以找到大量的單核苷酸多態(tài)性位點(diǎn)(Single NucleotidePolymorphisms,SNP)、插入缺失位點(diǎn)(Insertion/Dele.tion,InDel)、結(jié)構(gòu)變異位點(diǎn)(structureVariation,SV)位點(diǎn)等。通過(guò)生物信息學(xué)手段,可以分析不同個(gè)體基因組間的結(jié)構(gòu)差異,同時(shí)完成注釋?!厩叭搜芯窟M(jìn)展】通過(guò)全基因組測(cè)序及重測(cè)序,許多作物重要的農(nóng)藝性狀,如產(chǎn)量、抗逆性等基因被鑒定、克隆,這對(duì)改良主要農(nóng)作物、提高產(chǎn)量、研究遺傳變異、開(kāi)發(fā)新的分子標(biāo)記用以輔助育種等具有深遠(yuǎn)的意義。我國(guó)科學(xué)家對(duì)家蠶和水稻的重測(cè)序研究已經(jīng)獲得了重要的成果。福建農(nóng)林大學(xué)通過(guò)草菇基因組的測(cè)序及重測(cè)序,獲得基于SV位點(diǎn)的系列SCAR標(biāo)記并用于構(gòu)建遺傳連鎖圖等?!颈狙芯壳腥朦c(diǎn)】本研究從課題組所在單位保藏的400多個(gè)雙孢蘑菇栽培與野生菌株中挑選了18個(gè)不同類型的代表性核心種質(zhì)開(kāi)展基因組重測(cè)序工作?!緮M解決的關(guān)鍵問(wèn)題】結(jié)合生物信息學(xué)分析,以期發(fā)現(xiàn)它們?cè)诨蚪M水平上存在的差異,開(kāi)發(fā)SNP、SV等分子標(biāo)記,并發(fā)掘相關(guān)基因,為進(jìn)一步的雙孢蘑菇遺傳育種工作提供相關(guān)的理論依據(jù)與分子工具。
1材料與方法
1.1供試菌株
雙孢蘑菇18個(gè)核心種質(zhì)由福建省農(nóng)業(yè)科學(xué)院食用菌研究所種質(zhì)資源與遺傳育種研究室保藏并提供,詳見(jiàn)表1。
1.2試驗(yàn)方法
1.2.1菌株的培養(yǎng)將供試菌株從試管接入液體PDB培養(yǎng)基中,恒溫24℃、轉(zhuǎn)速220r·min振蕩培養(yǎng)2~3周。
1.2.2基因組DNA提取與檢測(cè)按OMEGA公司真菌基因組DNA提取試劑盒操作手冊(cè)進(jìn)行。提取的基因組DNA樣品用0.8%瓊脂糖凝膠電泳(電壓5V·cm)檢測(cè)其帶型,用Nanodrop微量檢測(cè)設(shè)備檢測(cè)其濃度和雜質(zhì)污染程度。
1.2.3基因組DNA重測(cè)序在北京百邁客(Biomarker)公司進(jìn)行。提取檢測(cè)合格的樣品基因組DNA,用機(jī)械打斷的方法(超聲波)將DNA片段化,QIAquickPCR試劑盒純化,末端修復(fù)、3’端加A、連接測(cè)序接頭,再用瓊脂糖凝膠電泳進(jìn)行片段大小選擇,最后進(jìn)行PCR擴(kuò)增,建好的文庫(kù)用IlluminaHiSeqTM 2500進(jìn)行測(cè)序。
1.2.4重測(cè)序數(shù)據(jù)分析應(yīng)用不同的生物信息學(xué)處理軟件,對(duì)測(cè)序得到的原始reads(雙端序列)進(jìn)行數(shù)據(jù)評(píng)估,然后將reads序列與雙孢蘑菇參考基因組H97序列(https://genomejgi.doe.gov/Agabi_varbisH97_2/Agabi varbisH972.home.html)進(jìn)行比對(duì),并基于比對(duì)結(jié)果進(jìn)行SNP、SV檢測(cè),通過(guò)檢測(cè)結(jié)果對(duì)多態(tài)標(biāo)記分布進(jìn)行統(tǒng)計(jì)并實(shí)現(xiàn)DNA水平差異基因挖掘和差異基因功能注釋等。使用samtools進(jìn)行去重復(fù)(Mark Duplicates),GATK進(jìn)行局部重比對(duì)(LocalRealignment),堿基質(zhì)量值校正fBase Recalibration)等處理,再使用GATK進(jìn)行SNP的檢測(cè),過(guò)濾,并得到最終的SNP位點(diǎn)集。使用GATK檢測(cè)長(zhǎng)度小于50bp的小片段InDel,使用snpEff軟件對(duì)SNP和InDel變異位點(diǎn)進(jìn)行注釋。通過(guò)BreakDancer軟件檢測(cè)SV數(shù)據(jù)集,主要包含刪除(Deletion,DEL)、插入(Insertion,INS)、倒位(Inversion,INV)、染色體內(nèi)易位(Intra-chromosomal Translocation,ITX)、染色體間易位(Inter-chromosomal Translocation,CTX)。
2結(jié)果與分析
2.118個(gè)雙孢蘑菇菌株重測(cè)序數(shù)據(jù)分析
提取的基因組DNA質(zhì)量好,Nanodrop檢測(cè)主峰清晰,OD260/280及OD260/230數(shù)值顯示雜質(zhì)較少,符合重測(cè)序要求。對(duì)18個(gè)樣品進(jìn)行重測(cè)序分析,共獲得21.63G數(shù)據(jù)量,Q30平均達(dá)到89.10%。通過(guò)bwa軟件對(duì)二代基因組測(cè)序得到的短序列與參考基因組進(jìn)行比對(duì),定位測(cè)序reads在參考基因組上的位置,統(tǒng)計(jì)得到樣品的測(cè)序深度、基因組覆蓋度等信息。結(jié)果表明,樣品的reads與參考基因組H97的比對(duì)效率平均為82.50%,基因組覆蓋度為96.32%,平均覆蓋深度約33X(表2)。染色體的覆蓋深度分布圖反映出樣品的測(cè)序隨機(jī)性較好。
2.2 18個(gè)雙孢蘑菇菌株與參考基因組的SNP和SV分析
基于測(cè)序數(shù)據(jù)與參考基因組H97的比對(duì)結(jié)果,共檢測(cè)獲得約813768個(gè)SNP,53840個(gè)InDel,平均每個(gè)個(gè)體獲得924個(gè)SV變異(表3)。從統(tǒng)計(jì)數(shù)據(jù)可以看出,國(guó)內(nèi)雜交菌株如As2796、W192、國(guó)內(nèi)野生菌株Ag78331、AgLH830等與H97比較的SNP、SV數(shù)量分別比國(guó)外雜交菌株如A15、u1、國(guó)外野生菌株ARPl59等大得多,表明國(guó)內(nèi)野生菌株與H97的親緣關(guān)系比國(guó)外野生菌株更遠(yuǎn),而國(guó)內(nèi)栽培菌株也與國(guó)外栽培菌株具有很大的差異。對(duì)這些變異進(jìn)行了注釋,發(fā)現(xiàn)存在于同義編碼突變的SNP數(shù)量最多,其次是非同義編碼突變和內(nèi)含子區(qū)域。而InDel則主要存在于內(nèi)含子區(qū)域,其次是基因的上游和下游區(qū)。
2.318個(gè)雙孢蘑菇菌株DNA水平的差異基因挖掘
基因中堿基的差異就有可能造成其密碼子的不同,此項(xiàng)分析用于尋找測(cè)序單株與參考基因組之間在基因?qū)用娴牟町?,包括SNP、InDel、SV等。較為典型的差異基因有如下3種:基因中存在非同義突變而產(chǎn)生蛋白差異、基因中存在小的InDel而導(dǎo)致基因功能改變或者喪失、基因中發(fā)生了結(jié)構(gòu)變異而導(dǎo)致結(jié)構(gòu)和功能的改變。在本研究的18個(gè)樣品中,和參考基因組H97相比發(fā)生了以上3種變異的基因數(shù),統(tǒng)計(jì)如表4所示。相比國(guó)外栽培菌株u1、A15系列,國(guó)內(nèi)栽培菌株As2796、W192系列和參考基因組的差異基因數(shù)目較大,這與SNP、SV數(shù)量分析結(jié)果相似。從02分離的不育菌株02-$5與參考基因組有著明顯較少的差異基因,這與它和H97同樣是源自荷蘭的高產(chǎn)類型菌株的單核體有關(guān)。使用BLAST將差異基因與NR、Swiss-Prot、GO、COG、KEGG等數(shù)據(jù)庫(kù)比對(duì),獲得了這些基因的注釋,可用于對(duì)差異基因功能作進(jìn)一步的分析。
2.42個(gè)菌株之間比較的SNP和InDel數(shù)目
對(duì)部分菌株進(jìn)行兩兩之間的SNP與InDel比較分析(表5),發(fā)現(xiàn)來(lái)源接近或農(nóng)藝性狀相近的菌株,其SNP和InDel數(shù)目就較少,比如As2796與其回交菌株W192、W192與其子代192-38、U1與其子代A15等。反過(guò)來(lái)說(shuō)結(jié)果也是一致的,不同菌株間SNP和InDel數(shù)目較大的,其生物學(xué)特性和農(nóng)藝性狀差異就大,如國(guó)內(nèi)雜交菌株As2796和國(guó)外雜交菌株U1、U3、A15,國(guó)內(nèi)野生菌株AgLH830與國(guó)外野生菌株ARPl59,02,8213與其不育菌株等,其SNP和Indel的數(shù)目是相近菌株的數(shù)倍以上,其中SNP相差4~26倍,Indel相差4~24倍。
3討論與結(jié)論
以As2796為代表的國(guó)內(nèi)雜交菌株表現(xiàn)為較高產(chǎn),質(zhì)量?jī)?yōu),耐粗放,適合農(nóng)業(yè)與中國(guó)式工廠化栽培模式,適合鮮銷(xiāo)與制罐,而以u(píng)1為代表的國(guó)外雜交菌株表現(xiàn)為高產(chǎn),產(chǎn)量集中,質(zhì)量一般,不耐粗放,適合歐美工廠化栽培模式,較適合鮮銷(xiāo)。從SNP、SV及差異基因數(shù)目可以看出,國(guó)內(nèi)外雜交菌株基因組差異很大。由于As2796的高產(chǎn)親本02與u1的高產(chǎn)親本Somycel9.2(其同核體H97即為參考基因組測(cè)序菌株)都是源自歐洲的高產(chǎn)傳統(tǒng)菌株,SNP、SV及差異基因數(shù)目比較也說(shuō)明它們之間的親緣關(guān)系較為接近,所以可以推斷國(guó)內(nèi)外雜交菌株的差異主要源于另一個(gè)親本的不同。As2796的優(yōu)質(zhì)親本是老法國(guó)種8213,As2796很好地結(jié)合了02的高產(chǎn)與8213的優(yōu)質(zhì)特性,而u1的另一親本為偏高產(chǎn)的米色菌株Somycel53,U1仍主要表現(xiàn)高產(chǎn)的特性,質(zhì)量上不如As2796。因此,As2796系列與U1系列是世界上并列的兩大雙孢蘑菇雜交品系。
國(guó)內(nèi)外野生菌株與H97比較的SNP、SV數(shù)量相差也較大,表明它們可能源自較遠(yuǎn)的分支,這對(duì)創(chuàng)新利用國(guó)內(nèi)野生種質(zhì)、育成具有自主知識(shí)產(chǎn)權(quán)的新品種意義重大。2個(gè)關(guān)系較近的菌株如As2796與W192、W192與192-38,它們之間的SNP、InDel標(biāo)記可以開(kāi)發(fā)成鑒別2個(gè)菌株的DNA標(biāo)記,在菌株鑒別或菌種鑒定中比普通的DNA指紋標(biāo)記更為適用。
本文對(duì)18個(gè)雙孢蘑菇核心種質(zhì)重測(cè)序數(shù)據(jù)進(jìn)行了初步的統(tǒng)計(jì)和分析,獲得了與參考基因組間大量的SNP、InDel和SV位點(diǎn),提取了18個(gè)菌株的一致性序列,并進(jìn)行了不同菌株之間的分組差異比較,為這些菌株的進(jìn)一步分析奠定了基礎(chǔ)。接下來(lái)將對(duì)部分感興趣的差異和標(biāo)記進(jìn)行篩選和驗(yàn)證,以期為菌株鑒別、遺傳分析、雜交育種等篩選一批有用的基因和分子標(biāo)記。