程鳳,張慶霞,陳成建,李萬婷,張家榕,張更謙,嚴江偉
1.山西醫(yī)科大學(xué)法醫(yī)學(xué)院,山西 太原030001;2.北京市公安司法鑒定中心,北京100192
線粒體DNA(mitochondrial DNA,mtDNA)與核DNA 相比,由于較高的拷貝數(shù)量,檢測樣本的需求量低,對降解的現(xiàn)場生物檢材,如毛發(fā)、陳舊尸骨、指甲等樣本的檢測具有優(yōu)勢[1]。但目前絕大多數(shù)情況下僅對mtDNA 高變區(qū)Ⅰ和mtDNA 高變區(qū)Ⅱ進行雙脫氧鏈終止法(dideoxy chain-termination method)檢測,由于所檢測突變位點的數(shù)量有限,使其難以準確將無關(guān)個體進行區(qū)分[2]。隨著測序技術(shù)的不斷發(fā)展,以規(guī)?;叫袦y序為主的二代測序技術(shù)逐漸應(yīng)用于法庭科學(xué)領(lǐng)域[3]。
由于二代測序技術(shù)具有可對mtDNA 進行多樣本多位點同時檢測的優(yōu)勢[4],使mtDNA 個體識別能力得到一定的提高[5]。本研究使用Precision ID mtDNA Whole Genome Panel試劑盒(美國Thermo Fisher Scientific 公司)[6]對線粒體全基因組進行擴增,應(yīng)用HID Ion GeneStudioTMS5 測序系統(tǒng)(美國Thermo Fisher Scientific 公司)對線粒體全基因組分析檢測,并對其分型結(jié)果進行探討,為法庭科學(xué)的應(yīng)用提供參考。
按照“知情同意”原則,分別采集8 名漢族無關(guān)個體的口腔拭子,靜脈血及額、頂、顳部、會陰部毛發(fā)樣本各1 份,每份毛發(fā)樣本包含2 根毛發(fā)。樣本總共為48 份。
將口腔拭子和靜脈血涂卡后室溫放置,晾干后常溫儲存。對毛發(fā)樣本使用以下步驟進行處理[7]。首先,剪取距離毛根2 cm 處長度為2 cm 毛干樣本,使用200 μL 1%十二烷基硫酸鈉(sodium dodecyl sulfate,SDS)溶液浸泡,以離心半徑10 cm,1 000 r/min,離心5 min,棄去上清液。加入200 μL 純水浸泡,以離心半徑10 cm,1 000 r/min,離心5 min,棄去上清液。再使用400 μL 無水乙醇浸泡10 min 后棄去所有上清液,晾干后常溫儲存。在實驗操作過程中,為避免交叉污染,需將不同個體的檢材樣本分批次處理。
使用QIAamp DNA Investigator 試劑盒(美國QIANEN 公司)[8],遵照實驗步驟分別提取口腔拭子、血卡和毛干全基因組DNA。為了評估樣本中所含mtDNA的情況并保證后續(xù)文庫的成功構(gòu)建,本研究使用自行設(shè)計的擴增片段分別為364 bp 的線粒體特異性引物(正向:5′-CACCTACACCCCTTATCCCC-3′;反向:5′-CATTAGGAGGGCTGAGAGGG-3′)和682 bp 的線粒體特異性引物(正向:5′-TCGGAGGACAACCAGTA AGC-3′;反向:5′-GCACTCTTGTGCGGGATATT-3′)對所有樣本進行擴增檢測。
采用Precision ID mtDNA Whole Genome Panel(美國Thermo Fisher Scientific 公司)對線粒體全基因組進行目的片段DNA 擴增,將已知線粒體基因組分型DNA 樣本作為陽性對照,滅菌去離子水作為陰性對照。為減少測序后所產(chǎn)生冗余序列的影響,應(yīng)用FuPa 試劑(美國Thermo Fisher Scientific 公司)對多余引物進行消化。分別采用Ion TorrentTMPrecision ID Library 試劑盒(美國Thermo Fisher Scientific公司)和Applied BiosystemsTMPrecision ID IonCodeTMBarcode Adapters 1-96 Kit in 96-Well PCR Plate(美國Thermo Fisher Scientific 公司)進行標簽序列和測序接頭的連接。最后使用AgencourtTMAMPure XP磁珠(美國Beckman Coulter 公司)和70%乙醇溶液進行純化。
對構(gòu)建完成的線粒體全基因組文庫使用7500 Real-Time PCR 系統(tǒng)(美國Thermo Fisher Scientific公司)和Ion TorrentTMIon Library TaqManTMQuantitation 試劑盒(美國Thermo Fisher Scientific 公司)進行定量。
將定量后的文庫稀釋至40 pm/μL,使用Ion TorrentTMHID Ion ChefTM系統(tǒng)(美國Thermo Fisher Scientific公司)進行測序模板制備。將制備的測序模板使用Ion S5TMPrecision ID Chef & Sequencing 試劑盒(美國Thermo Fisher Scientific 公司)在HID Ion GeneStudioTMS5 測序系統(tǒng)進行測序,每次初始化運行2 次。共使用3 張芯片Ion 530TMChip(美國Thermo Fisher Scientific 公司)。使用快速質(zhì)量控制軟件FastQC-0.11.7(Simon Andrews 開發(fā))[9]對數(shù)據(jù)進行質(zhì)量控制。以修正劍橋序列為參考序列,使用ConvergeTM軟件v2.1(美國Thermo Fisher Scientific 公司)對測序數(shù)據(jù)初步分析。此外,使用SAM tools 1.0[10]對測序結(jié)果中的BAM(binary map format)文件進行詳細分析,同時使用Morpheus 在線軟件(https://software.broadinstitute.org/morpheus)對不同樣本的線粒體全基因組不同區(qū)段的測序深度進行對比。根據(jù)ZHOU 等[11]的報道,將次要等位基因頻率定為大于15%,測序覆蓋度大于100×作為本次實驗異質(zhì)性位點的篩選條件,同時使用整合基因組學(xué)查看器IGV-2.3(James T. Robinson 開發(fā))[12]進行測序結(jié)果的可視化展示,并對異質(zhì)性位點進行雙脫氧鏈終止法驗證。
使用擴增片段分別為364 bp 和682 bp 的線粒體特異性引物對48 份樣本進行擴增檢測,均檢測出特異性擴增產(chǎn)物。48 份樣本測序文庫的定量范圍為3.26~5.32 ng/μL,均符合測序檢測要求。3 張芯片產(chǎn)生原始測序數(shù)據(jù)總量1.44 G,平均有效測序量達40%,其中文庫平均連接率為98.6%,多克隆文庫為39.5%,低質(zhì)量文庫為15.5%,有效文庫為52.3%,共11 011 759 個讀取片段,片段平均讀長為129 bp??谇皇米拥钠骄鶞y序深度為(1 970±690)×,血卡的平均測序深度為(2 062±1 118)×,毛干樣本平均測序深度為(1 159±743)×(各個樣本的詳細測序深度見附表1)并且陽性對照結(jié)果正確,陰性對照中未發(fā)現(xiàn)污染存在。
使用ConvergeTM軟件v2.1 將測序數(shù)據(jù)與參考序列進行比對分析,共獲得119 個變異位點,其中6 個位點位于高變區(qū)Ⅰ,15 個位點位于高變區(qū)Ⅱ,98 個位點位于其他區(qū)域,各個樣本變異位點的詳細分型見附表2。8 名個體的變異位點數(shù)目分別為29、40、38、35、13、36、40 和35。48 份樣本測序覆蓋度為(102~3 898)×,其中毛干樣本的測序覆蓋度較低,每個樣本的測序覆蓋度見圖1。通過查看樣本所有位點的測序覆蓋度情況,發(fā)現(xiàn)在所有樣本中nt8674~nt8762 區(qū)段的測序覆蓋度均小于500×。當(dāng)次要等位基因的篩選頻率大于15%時,在個體1 中顳部毛干樣本的nt9756 位點(T/C)和個體3 中顳部毛干樣本的nt16354 位點(T/C)出現(xiàn)異質(zhì)性,并與雙脫氧鏈終止法驗證結(jié)果一致(圖2A~B),其余6 名無關(guān)個體的口腔拭子、血液及不同部位毛干樣本的線粒體全基因組分型結(jié)果相同。當(dāng)次要等位基因的篩選頻率降至10%時,在多名個體的nt16390、nt9540、nt8020 等位點出現(xiàn)異質(zhì)性。然而對其進行雙脫氧鏈終止法驗證,結(jié)果均為假陽性。例如,在個體8 顳部毛干樣本的nt16390 位點次要等位基因A 頻率為13%,雙脫氧鏈終止法驗證結(jié)果中只有G 的基因分型(圖2C)。
圖1 樣本的測序覆蓋度Fig. 1 Sequencing coverage of samples
圖2 3名個體顳部毛干樣本的二代測序IGV圖(上)與雙脫氧鏈終止法結(jié)果圖(下)Fig. 2 Second-generation sequencing IGV maps of three individual temporal hair shaft samples(upper)and the diagrams of the dideoxy chain-termination method(lower)
mtDNA 多態(tài)性的研究主要集中在非編碼區(qū)和部分編碼區(qū),其中位于非編碼區(qū)的高變區(qū)Ⅰ(nt57~nt372)和高變區(qū)Ⅱ(nt16024~nt16383),目前為法醫(yī)學(xué)線粒體檢測最主要的區(qū)域。張幼芳[13]對100 名浙江漢族無關(guān)個體的高變區(qū)Ⅰ進行分析,僅發(fā)現(xiàn)71 種單倍型,84 個變異位點,平均每個個體僅出現(xiàn)0.84 個堿基變異。張明陽等[14]通過對150 名隨機個體的高變區(qū)Ⅱ進行分析,僅發(fā)現(xiàn)9 個單倍型。這意味著高變區(qū)mtDNA遺傳多態(tài)性有限,無法用于個體同一性認定,而使用二代測序技術(shù)對線粒體全基因組進行檢測,可以同時對多位點樣本進行檢測,從而獲得更多的mtDNA 信息。本研究使用Precision ID mtDNA Whole Genome Panel(主要采用疊瓦式的擴增方法對全線粒體基因組進行擴增,包含平均擴增片段長度為163bp的162對引物)對8 名無關(guān)個體進行全線粒體基因組測序,共發(fā)現(xiàn)119 個變異位點,額外獲得除高變區(qū)以外的98 個堿基變異信息。
KING 等[15]使用二代測序技術(shù)對線粒體全基因組進行檢測后認為,當(dāng)位點的測序覆蓋度大于40×?xí)r,其分型結(jié)果具有參考價值。本研究使用線粒體特異性引物對所有樣本進行擴增檢測,均檢測出特異性擴增產(chǎn)物,提示成功提取到線粒體基因組DNA,并且滿足全線粒體基因組短片段擴增的需求,可用于后續(xù)文庫的構(gòu)建和測序。在本研究中,所有樣本的平均測序深度均大于100×,證明此次測序結(jié)果較為可靠。相對于口腔拭子和血卡,毛干樣本屬于微量降解樣本,構(gòu)建文庫濃度較低,在進行文庫定量或純化等操作步驟時導(dǎo)致部分文庫的損失,使其測序覆蓋度相對其他種類樣本較低。同種類樣本之間的測序覆蓋度標準差大于500×,可能是由于不同個體檢材樣本之間的擴增效率差異,從而造成樣本間平均測序覆蓋度差異較大。由于在文庫的構(gòu)建過程中,可能會因為擴增引物結(jié)合位點發(fā)生突變或者由于擴增區(qū)域中含有較多的單堿基重復(fù)[16-18]等原因,導(dǎo)致擴增效率不均一,從而形成各個測序位點覆蓋度之間的差異,例如,在本研究所有樣本中nt8674~nt8762 區(qū)段,線粒體測序覆蓋度均相對較低。本研究將次要等位基因頻率定為大于15%時,篩選出2 個異質(zhì)性位點,并與雙脫氧鏈終止法檢測結(jié)果一致。但當(dāng)將次要等位基因頻率降至10%時,若干位點的二代測序結(jié)果均為異質(zhì)性結(jié)果,卻未能通過雙脫氧鏈終止法檢測進行驗證。出現(xiàn)這種結(jié)果的原因可能為:(1)由于二代測序中擴增錯誤或測序錯誤等原因所產(chǎn)生的堿基變異;(2)相對于二代測序技術(shù),雙脫氧鏈終止法檢測的靈敏度較低,未能檢測出低比例的堿基變異。
mtDNA 的異質(zhì)性是影響法醫(yī)線粒體基因分析的重要因素之一,在案件檢測中應(yīng)引起重視。在同一個體中存在2 種及以上的線粒體基因序列,稱為mtDNA的異質(zhì)性,主要分為2 種情況:(1)同一組織含有2 種及以上的線粒體基因序列;(2)同一個體不同組織中存在2 種及以上的線粒體基因序列。目前對于異質(zhì)性的出現(xiàn)及其機理尚不明確,但對與線粒體基因相關(guān)疾病的研究具有重大意義[19]。使用二代測序技術(shù)對線粒體全基因組進行檢測,在增加其檢測范圍及測序覆蓋度的同時,也增加其異質(zhì)性檢出的可能。二代測序技術(shù)的靈敏度較高[20],導(dǎo)致由于污染、擴增錯誤以及測序錯誤帶來的堿基差異更容易被檢測,另外復(fù)合擴增體系中的簡并引物設(shè)計以及短片段擴增所引起同源部分的核DNA 片段的擴增,也會對檢測結(jié)果產(chǎn)生一定的影響[21]。因此在使用二代測序技術(shù)對法醫(yī)mtDNA 進行分析時,應(yīng)謹慎對待出現(xiàn)的異質(zhì)性,為避免假陽性對檢測結(jié)果的影響,需注意以下幾點:(1)嚴格實驗操作,避免污染;(2)采用高保真聚合酶,降低擴增錯誤;(3)應(yīng)盡量增加測序覆蓋度,減少簡并引物對結(jié)果產(chǎn)生干擾;(4)假如出現(xiàn)疑似異質(zhì)性分型位點,使用雙脫氧鏈終止法檢測進一步驗證;(5)應(yīng)根據(jù)樣本的測序情況設(shè)置相應(yīng)的次要等位基因頻率分析閾值,避免閾值過低而出現(xiàn)較多假陽性結(jié)果。