湯紫榮 李曉娟 姜棋予 李興杰 孫慧偉 李瑞生
(1.中國(guó)人民解放軍總醫(yī)院第五醫(yī)學(xué)中心住院與病案管理科,北京 100039) (2.中國(guó)人民解放軍總醫(yī)院第五醫(yī)學(xué)中心感染病醫(yī)學(xué)部研究所,北京 100039)
全基因組測(cè)序是指應(yīng)用新型測(cè)序儀器測(cè)量不同機(jī)體基因組間的差異,并通過(guò)生物信息手段對(duì)與性狀關(guān)聯(lián)的遺傳變異信息及基因組結(jié)構(gòu)進(jìn)行分析與注釋[1]。測(cè)序技術(shù)已經(jīng)由基于雙脫氧末端終止法的 Sanger測(cè)序技術(shù)[2]發(fā)展到現(xiàn)在的第二代、第三代測(cè)序技術(shù)[3],實(shí)現(xiàn)了從低讀長(zhǎng)到超高讀長(zhǎng)、從光學(xué)檢測(cè)到電子傳導(dǎo)檢測(cè)的雙重跨越測(cè)序技術(shù),在動(dòng)物基因組測(cè)序發(fā)展中起了非常重要的作用[4]。BALB/c突變卷毛鼠是本實(shí)驗(yàn)室發(fā)現(xiàn)的突變小鼠,經(jīng)近交培育已成為較為成熟、遺傳穩(wěn)定的近交系突變卷毛小鼠品系[5]。前期對(duì)其外觀特征以及血液學(xué)指標(biāo)進(jìn)行了基礎(chǔ)性探討研究[6-7],尤其應(yīng)用微衛(wèi)星位點(diǎn)標(biāo)記對(duì)BALB/c突變卷毛鼠進(jìn)行檢測(cè)分析,發(fā)現(xiàn)該小鼠存在較高的突變率,且與無(wú)毛小鼠突變是兩個(gè)完全不同的突變系[8]。因此本實(shí)驗(yàn)利用Illumina PE 150對(duì)BALB/c突變卷毛鼠與BALB/c小鼠進(jìn)行測(cè)序,并進(jìn)行生物信息學(xué)分析,以期全面了解突變鼠與BALB/c小鼠之間的基因組差異性,為今后更好地開發(fā)和利用該鼠作為優(yōu)良的動(dòng)物模型提供可靠的生物學(xué)信息基礎(chǔ)。
正常BALB/c小鼠和BALB/c突變卷毛鼠各1只,SPF級(jí),雌性,6周齡。正常BALB/c小鼠來(lái)自突變?nèi)后w中的正常小鼠,BALB/c卷毛鼠來(lái)自于本實(shí)驗(yàn)室近交培育,生產(chǎn)許可證號(hào)【SCXK(軍)2012-0004】。動(dòng)物飼養(yǎng)在中國(guó)人民解放軍總醫(yī)院第五醫(yī)學(xué)中心動(dòng)物實(shí)驗(yàn)中心,使用許可證號(hào)【SYXK(軍)2017-0016】。本實(shí)驗(yàn)通過(guò)了動(dòng)物倫理委員會(huì)審查,倫理審批號(hào):IACUC-2017-006。
1.2.1動(dòng)物組織采集和DNA提取:從BALB/c小鼠和BALB/c突變卷毛鼠后肢分別取一小塊肌肉,立即用PBS或0.9%氯化鈉溶液漂洗,去除血漬,并剔除結(jié)締組織和脂肪組織,吸干水分;將肌肉塊修剪成長(zhǎng)寬高均≤0.5 cm的小塊(組織塊越小,保存效果越好);將處理好的組織樣品置于2 mL的旋蓋凍存管中,立即液氮速凍,送去北京美吉桑格生物醫(yī)藥科技有限公司。而后對(duì)2個(gè)樣本進(jìn)行基因組DNA的提取、質(zhì)檢和定量檢測(cè),以及后續(xù)的建庫(kù)測(cè)序。
1.2.2文庫(kù)構(gòu)建及測(cè)序:2個(gè)樣品分別構(gòu)建1個(gè)Illumina PE測(cè)序文庫(kù),共計(jì)2個(gè)Illumina 測(cè)序文庫(kù);插入片段400 bp。Illumina PE 150每個(gè)樣品提供84 G clean data,Q30值≥80%。
1.2.3信息分析
1.2.3.1原始數(shù)據(jù)質(zhì)控和過(guò)濾:測(cè)序結(jié)果得出的原始測(cè)序序列(Raw Reads)由于含有帶接頭的、低質(zhì)量的Reads,因此為了提高信息分析的質(zhì)量,必須對(duì)Raw Reads過(guò)濾,得到Clean Reads,后續(xù)分析都在Clean Reads的基礎(chǔ)上進(jìn)行。對(duì)下機(jī)得到的Raw Data進(jìn)行質(zhì)控得到Clean Data。
1.2.3.2數(shù)據(jù)比對(duì):進(jìn)行單堿基突變(SNP)和 插入缺失(Indel)的檢測(cè)及注釋;Indel是指基因組中小片段的插入和缺失序列。利用SAMTOOLs檢測(cè)長(zhǎng)度小于50 bp的小片段插入與缺失(Indel)。對(duì)結(jié)構(gòu)變異(SV)和拷貝數(shù)變異(CNV)進(jìn)行檢測(cè)和注釋。
本次測(cè)序正常小鼠與卷毛小鼠產(chǎn)生的Raw Data分別為122.85 Gb和118.04 Gb,過(guò)濾后的Clean Data 分別為119.82 Gb和112.18 Gb,GC含量分別為40.63%和40.48%,表明測(cè)序質(zhì)量合格。GC分布也正常,說(shuō)明建庫(kù)測(cè)序成功(表1)。正常小鼠與卷毛小鼠的基因組覆蓋深度統(tǒng)計(jì)(表2)。
表1 測(cè)序質(zhì)量統(tǒng)計(jì)表Table 1 Sequencing quality statistics
表2 樣品覆蓋深度和覆蓋度統(tǒng)計(jì)Table 2 Sample coverage depth and coverage statistics
卷毛小鼠的雜合分型SNPs總數(shù)顯著高于正常小鼠,而其他數(shù)值卻沒(méi)有顯著差異(表3),同時(shí)正常小鼠與卷毛小鼠之間的累計(jì)SNPs深度分布也存在顯著的差異(圖1)。卷毛小鼠與正常小鼠插入缺失(Indels)以及累計(jì)Indels深度分布均存在差異(圖2,3)。卷毛小鼠與正常小鼠的SV類型中大片段的插入卷毛小鼠大于正常小鼠,而其他類型則小于正常小鼠(表4)。而拷貝數(shù)變異(CNVs)結(jié)果顯示,正常小鼠和卷毛小鼠的拷貝數(shù)增加的個(gè)數(shù)分別為1 270和967個(gè);而拷貝數(shù)減少的個(gè)數(shù)分別為5 027和3 505個(gè)。
注:紅線為卷毛小鼠;藍(lán)線為正常小鼠。Note:The red line is curly mice; The blue line is normal mice.圖1 累積SNP深度分布Fig.1 Cumulative SNP depth distribution
注:A.卷毛小鼠 ;B.正常小鼠。Note:A. Curly mouse; B. Normal mouse.圖2 插入缺失(Indel)分布情況Fig.2 Distribution of insertion and deletion
注:紅線為卷毛小鼠;藍(lán)線為正常小鼠。Note. The red line is curly mice; The blue line is normal mice.圖3 累積Indel深度分布Fig.3 Cumulative Indel depth distribution
表3 SNP數(shù)據(jù)統(tǒng)計(jì)表(個(gè))Table 3 SNP data statistics(個(gè))
表4 SV預(yù)測(cè)結(jié)果統(tǒng)計(jì)表Table 4 Statistical table of SV prediction results
全基因組重測(cè)序的特點(diǎn)是具有分析結(jié)果快速、準(zhǔn)確、靈敏度高和自動(dòng)化,指在參考已知基因組序列的物種信息基礎(chǔ)上,對(duì)不同個(gè)體整個(gè)基因組進(jìn)行測(cè)序,再通過(guò)生物信息學(xué)分析及在個(gè)體或群體水平進(jìn)行序列差異性分析[9]。那么在測(cè)序過(guò)程中可以檢測(cè)到大量與性狀關(guān)聯(lián)的遺傳變異信息(包括SNP、Indel、SV和CNV甚至新基因等)。研究人員利用全基因組測(cè)序方法比較近交系小鼠C57BL/10和C57BL/6的基因組差異,篩選出 4 個(gè)小鼠免疫應(yīng)答差異基因[10]。研究人員完成了美洲大蠊的全基因組測(cè)序,也是大蠊屬Periplaneta 昆蟲的第一個(gè)基因組,為美洲大蠊遺傳進(jìn)化分析和藥用基因資源挖掘打下了重要基礎(chǔ)[11]。但目前對(duì)突變小鼠與正常小鼠之間進(jìn)行對(duì)比分析的基因組測(cè)序報(bào)道甚少。
因此本實(shí)驗(yàn)對(duì)實(shí)驗(yàn)室單獨(dú)發(fā)現(xiàn)的BALB/c突變卷毛鼠與群體中未發(fā)生突變的正常BALB/c小鼠進(jìn)行測(cè)序,并進(jìn)行了生物信息學(xué)分析,結(jié)果顯示:正常小鼠與卷毛小鼠產(chǎn)生的Raw Data分別為122.85 Gb和118.04 Gb,過(guò)濾后的Clean Data分別為119.82 Gb和112.18 Gb,GC含量分別為40.63%和40.48%,GC分布正常,測(cè)序建庫(kù)成功。自人類基因組計(jì)劃完成以來(lái),獲得高質(zhì)量的序列圖譜成為了不同物種進(jìn)行功能基因研究的基礎(chǔ)[12]。而遺傳變異統(tǒng)計(jì)結(jié)果顯示:卷毛小鼠的雜合分型SNPs總數(shù)顯著高于正常小鼠,同時(shí)正常小鼠與卷毛小鼠之間累計(jì)SNPs深度分布也存在顯著的差異。卷毛小鼠與正常小鼠插入缺失(Indels)以及累計(jì)Indels深度分布均存在差異。卷毛小鼠與正常小鼠的SV類型中大片段的插入卷毛小鼠大于正常小鼠,而其他類型則小于正常小鼠。而拷貝數(shù)變異(CNVs)結(jié)果顯示,正常小鼠和卷毛小鼠的拷貝數(shù)增加的個(gè)數(shù)分別為1 270和967個(gè);而拷貝數(shù)減少的個(gè)數(shù)分別為5 027和3 505個(gè),卷毛小鼠均小于正常小鼠。遺傳變異檢測(cè)分析結(jié)果顯示SNPs、Indels、SV和CNVs在兩種小鼠之間均存在差異,不僅證明了兩種小鼠存在遺傳差異,且也極大的豐富了遺傳資源多樣性的研究?jī)?nèi)容[13]。那么在全基因組水平上,利用SNPs等分子遺傳標(biāo)記存在的差異,也能夠較全面解析物種受到的自然選擇和人工選擇導(dǎo)致的遺傳變化[14]。本實(shí)驗(yàn)對(duì)兩種小鼠進(jìn)行了初步的基因差異對(duì)比,但又考慮到即使正常繁育SNP等位點(diǎn)也會(huì)發(fā)生變異,因此下一步我們將借助一些基因分析軟件[15]對(duì)新發(fā)現(xiàn)的遺傳變異差異進(jìn)行詳細(xì)的注釋,對(duì)差異表達(dá)基因的功能進(jìn)行分類,期待能夠挖掘這些變異對(duì)某些分子和細(xì)胞事件有所指示。
綜上所述,本研究對(duì)BALB/c突變卷毛鼠與同種群中正常BALB/c小鼠進(jìn)行了全基因組測(cè)序,并且發(fā)現(xiàn)二者之間存在遺傳變異差異,進(jìn)一步驗(yàn)證了前期實(shí)驗(yàn)中兩種小鼠各項(xiàng)指標(biāo)的差異存在。眾所周知,全基因組測(cè)序可以全面、快速、準(zhǔn)確地解析不同品種的分子遺傳特征,為品種的不斷選育提高及開發(fā)利用奠定堅(jiān)實(shí)的基礎(chǔ)[16]。我們將對(duì)其基因的變異情況進(jìn)行深入分析,以期更好地開發(fā)和應(yīng)用該突變小鼠。