程 鳳,嚴(yán)江偉,2,3*
(1.山西醫(yī)科大學(xué)法醫(yī)學(xué)院,中國山西太原030001;2.中國科學(xué)院北京基因組研究所,中國北京100029;3.中國科學(xué)院大學(xué),中國北京100049)
目前,基于毛細管電泳的復(fù)合熒光短串聯(lián)重復(fù)序列(short tandem repeat,STR)檢測已經(jīng)成為法醫(yī)DNA分析的常規(guī)方法,并且發(fā)揮了顯著的作用。然而,在法醫(yī)實際案件中經(jīng)常會需要對衣物和作案工具上的脫落細胞、陳舊骨骸、混合精斑等微量、降解以及混合樣本進行DNA分析。由于上述檢材的復(fù)雜性,使用常規(guī)的檢驗技術(shù)常會遇到一些問題,例如位點缺失、分型不完整和stutter峰干擾以及未能提取到核DNA等,往往難以獲得滿意的實驗結(jié)果。與傳統(tǒng)的毛細管電泳STR方法相比,二代測序技術(shù)(next-generation sequencing)采用了全新的測序方法,具有測序片段短、可深度測序、檢測長度差異的同時還可準(zhǔn)確區(qū)分序列差異、可同時進行更多位點的檢測等諸多優(yōu)點,為疑難生物檢材的法醫(yī)DNA分析提供了新的思路和方法。
二代測序技術(shù)又稱為高通量測序技術(shù),是對傳統(tǒng)Sanger測序(稱為一代測序技術(shù))革命性的改變。二代測序技術(shù)的核心思想是邊合成邊測序,可以一次并行對幾十萬到幾百萬條DNA分子進行序列測定,所以又被稱為深度測序。由于二代測序技術(shù)具有多樣本、多位點同時進行測序并且具有較高的覆蓋率等優(yōu)勢,在生命科學(xué)領(lǐng)域已經(jīng)被廣泛應(yīng)用。目前在法醫(yī)領(lǐng)域應(yīng)用的二代測序技術(shù)系統(tǒng)主要為美國Thermo Fisher公司的Ion系列測序系統(tǒng)和Illumina公司的MiSeq FGx測序系統(tǒng)。
Ion系列測序系統(tǒng)[1]將微體系機械設(shè)計和半導(dǎo)體技術(shù)相組合,避免使用復(fù)雜的光學(xué)元件或帶標(biāo)記的核苷酸,通過檢測電流強度的變化獲得DNA序列信息。針對法醫(yī)學(xué)疑難樣本,Thermo Fisher公司已經(jīng)相繼推出了包含90個常染色體單核苷酸多態(tài)性(single-nucleotide polymorphisms,SNPs)位點和34個Y-SNP位點的測序試劑盒、采用疊瓦式短片段擴增子設(shè)計的全線粒體測序試劑盒以及包含35個STR位點的測序試劑盒等商品化試劑盒。
MiSeq FGx系統(tǒng)主要使用熒光測序的方法,在每個測序循環(huán)中,4種帶熒光的與可逆終止子結(jié)合的dNTP同模板結(jié)合,通過直接測定熒光信號強度來進行堿基序列判讀。目前,Illumina公司推出的ForenSeq DNA Signature Prep試劑盒[2]可用于對法醫(yī)疑難檢材的檢驗,該試劑盒一次實驗可得到230個位點的分型,包括58個STR位點(27個常染色體STR、24個Y染色體STR和7個X染色體STR)和172個SNP位點(94個用于個體識別,22個和56個分別用于表型和祖先推斷)。
隨著人們自我保護意識的逐漸增強,犯罪分子在案件現(xiàn)場中遺留下的痕跡越來越少,工作人員往往只能提取到衣物、作案工具以及日常用品上的脫落細胞等微量DNA檢材,這為法醫(yī)DNA的檢驗帶來了巨大挑戰(zhàn)[3]。目前大多數(shù)常染色體復(fù)合熒光STR檢測試劑盒推薦的模板量約為1 ng,所檢測的位點通常為15~24個[4]。然而在實際案件中,微量生物檢材所提取到的DNA量往往較低,達不到最佳檢驗要求,經(jīng)常會出現(xiàn)只有部分位點的分型或者沒有分型結(jié)果[5]的情況,并且如果還需要獲得性染色體和線粒體上更多類型位點的分型,通常需要多次檢測。而采用二代測序技術(shù)進行微量檢材的DNA檢驗則具有一定優(yōu)勢,例如:二代測序技術(shù)可以對不同類型的多位點同時進行檢測,在避免多次檢測導(dǎo)致消耗珍貴樣本的同時,也可彌補常規(guī)檢驗由于模板量低導(dǎo)致最終能有效用于鑒定結(jié)論的位點不足的缺點;可檢測序列差異,減少了污染等非擴增特異性產(chǎn)物對結(jié)果的影響;可進行深度測序,使得靈敏度相對較高。
B?rsting等[6]使用Ion PGM二代測序平臺對一個包含136個常染色體SNP位點和33個Y染色體SNP位點的復(fù)合體系進行檢測,結(jié)果表明當(dāng)模板量僅為0.5 ng時,其位點的檢出成功率仍為100%。Zeng等[7]分別使用毛細管電泳和二代測序平臺對24個無關(guān)個體的17個常染色體的STR位點進行分析,結(jié)果表明當(dāng)模板量為500 pg時,兩種方法得到的分型結(jié)果完全一致,而當(dāng)模板DNA的量僅為62 pg時二代測序平臺檢測仍可成功獲得完整的分型。Churchill等[8]通過對包含58個STR位點和172個SNP位點的ForenSeq DNA Signature Prep試劑盒進行靈敏度測試,發(fā)現(xiàn)當(dāng)DNA模板量僅為100 pg時,其位點檢出量仍可保持在94%以上。
另外,由于二代測序技術(shù)不但可準(zhǔn)確區(qū)分片段長度差異而且可同時得到詳細的序列信息,因此可對非特異性擴增產(chǎn)物進行有效的識別,從而增加分型結(jié)果的可信度及準(zhǔn)確率。Sharma等[9]的研究顯示,通過對二代測序數(shù)據(jù)進行分析,可對stutter峰的來源進行區(qū)分,并且通過對序列的進一步分析,可準(zhǔn)確排除由單堿基替換而引起的位點檢測錯誤,判斷其正確的等位基因分型。Kwon等[10]在250個男性樣本中對Y染色體上的23個STR位點進行測序,通過對stutter峰出現(xiàn)概率的計算和背景雜音的分析,得出二代測序技術(shù)對微量檢材中等位基因位點的識別具有重要意義。
對于殘存的骨骸、腐爛的組織、保存不理想的DNA樣本或檢驗中出現(xiàn)的各種降解樣本,由于DNA模板高度碎片化或經(jīng)過化學(xué)修飾,常導(dǎo)致目標(biāo)位點的聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reac-tion,PCR)擴增缺失或錯誤擴增[11],因此往往無法獲得相關(guān)物證的完整DNA分型結(jié)果或者造成結(jié)果不可靠,為案件的順利偵破和審理帶來極大的困難。傳統(tǒng)的毛細管電泳檢測技術(shù)受檢測熒光種類和檢測范圍的限制,需要人為地將所檢測的位點設(shè)計成標(biāo)記不同熒光并且長度大小不一的擴增片段,使得在同一個電泳體系中僅可檢測20個左右的位點,并且部分位點的擴增片段長度較長,這導(dǎo)致對于降解DNA的檢測成功率較低。與毛細管電泳檢測技術(shù)不同,二代測序技術(shù)是對每一個擴增片段分別進行規(guī)模化平行測序,彼此之間并不產(chǎn)生影響,檢測位點的擴增片段長度相對較短,使其對降解檢材的DNA檢測成功率較高。
目前對于降解生物檢材的檢測,雖然使用毛細管電泳對擴增片段較短的miniSTR進行檢測,可在一定程度上提高檢測成功率,如Tsukada等[12]使用4對擴增片段長度為74~143 bp的miniSTR引物對保存17~26年的1 ng骨骼DNA進行毛細管電泳檢測,結(jié)果顯示其位點檢出成功率為100%。但其仍受到毛細管電泳檢測原理的限制,即還需要人為地設(shè)計長度大小不一的擴增片段,不能完全實現(xiàn)每一個miniSTR位點擴增片段的最小化設(shè)計。Kim等[13]分別使用毛細管電泳和二代測序技術(shù),對片段長度為200~300 bp人工降解的200 pg DNA進行17個常染色體STR位點檢測,結(jié)果顯示使用毛細管電泳對STR位點進行檢測時有4個等位基因位點的缺失和兩個位點檢出不完整,而二代測序的檢測結(jié)果相對理想,位點檢出成功率為100%。Wang等[14]通過使用毛細管電泳AGCU 21+1 STR kit和二代測序技術(shù)Precision ID GlobalFilerTMNGS STR Panel,對核酸酶不同作用時間的DNA樣本進行STR檢測分析,結(jié)果發(fā)現(xiàn)在酶消化的不同時間段內(nèi)二代測序技術(shù)中位點的檢出成功率遠大于毛細管電泳檢測技術(shù)。與STR位點相比,SNP擴增片段更短,對于降解生物檢材的檢測成功率相對更高[15]。但是由于單個SNP位點多態(tài)性較差,因此需要聯(lián)合使用較多SNP位點才能達到法醫(yī)學(xué)個體識別目的[16]。SNaPshot技術(shù)是一種基于熒光標(biāo)記單堿基延伸原理的分型技術(shù),它使用毛細管電泳對SNP位點進行檢測,一般可檢測10~30個SNP位點。Lou等[17]使用包含44個SNP位點的兩個SNaPshot體系對保存20年的陳舊血痕和自然放置20周的抗凝血中的DNA進行檢測,結(jié)果顯示位點檢出率在82%~100%。而二代測序技術(shù)可同時對多個SNP位點進行檢測,Fei等[18]使用包含124個SNP位點的HID-Ion AmpliSeq Identity Panel對降解指數(shù)為3.44的血斑進行檢測,發(fā)現(xiàn)位點檢出率為100%。Shih等[19]使用二代測序技術(shù)對人工降解片段長度約為150 bp的DNA模板的426個SNP位點進行擴增,結(jié)果顯示SNP位點覆蓋度可達到96%。同時,他們對兩根自然脫落的毛發(fā)的毛囊進行檢測,其位點平均檢出率也達到了80%以上。
二代測序技術(shù)不僅可對常規(guī)核DNA遺傳位點進行檢測,對于線粒體DNA及RNA的檢測也具有一定優(yōu)勢[20]。線粒體DNA具有較高的拷貝數(shù)和突變率,適用于對毛干、指甲等嚴(yán)重角化的組織以及陳舊骨骸等無法提取到核DNA的降解樣本進行法醫(yī)DNA分析[21]。目前,采用Sanger測序技術(shù)的法醫(yī)線粒體DNA分析通常只是對線粒體高變區(qū)1和高變區(qū)2進行分析。但是作為單倍型遺傳標(biāo)記,如果僅僅檢測線粒體高變區(qū),很難對兩個樣本進行同一認定,只能得出不排除具有相同來源的判斷。Irwin等[22]提出僅對600 bp的線粒體DNA突變區(qū)進行檢測,這限制了法醫(yī)線粒體DNA的檢測力度,不能為非母系親屬的個人識別提供充足的證據(jù)。二代測序技術(shù)可通過對全線粒體DNA進行測序,增加檢測范圍,使結(jié)果更具有說服力。Wang等[23]使用Illumina HiSeq 2000 system對10對單卵雙胞胎進行全線粒體DNA測序,發(fā)現(xiàn)在8對雙胞胎中有16個單堿基出現(xiàn)多態(tài)性,其中有6個堿基出現(xiàn)在高變區(qū)1和高變區(qū)2,10個堿基出現(xiàn)在編碼區(qū)。Parson等[24]使用高通量測序技術(shù)可在2 cm的發(fā)干中得到完整的線粒體DNA分型結(jié)果。Gouveia等[25]使用包含162對引物的雙復(fù)合體系A(chǔ)pplied BiosystemsTMPrecision ID mtDNA Whole Genome Panel,實現(xiàn)了整個線粒體DNA的擴增檢測。King等[26]使用二代測序技術(shù)對埋藏約300年的查理三世骨骼樣本進行全線粒體DNA測序,發(fā)現(xiàn)分別與現(xiàn)存19級和21級母系親屬的線粒體DNA序列產(chǎn)生匹配,這進一步為查理三世身份的證實提供了證據(jù)。微RNA(microRNA,miRNA)由于其片段較短(約22 bp)且具有組織表達特異性,因此可以作為法醫(yī)學(xué)降解檢材分析及鑒定組織來源的生物標(biāo)記[27]。Wang等[28]首先對5份血液樣本和5份唾液樣本中2 588個miRNA進行高通量測序,再對測序結(jié)果進行生物信息學(xué)分析,結(jié)果顯示挖掘出6~19個可以鑒別血液和唾液的miRNA生物學(xué)位點。Hanson等[29]使用包含34對信使RNA(messenger RNA,mRNA)及miRNA擴增引物的復(fù)合體系,成功識別了血液、精液、唾液等法醫(yī)常見樣本的體液及組織來源。
混合生物檢材是指來源兩個或以上不同人的混合樣本。法醫(yī)案件中的混合生物檢材主要包括:1)不同人的相同組織樣本的混合;2)不同人的不同組織樣本的混合[30]。例如:犯罪現(xiàn)場受害人與嫌疑人的混合血斑,強奸案中的陰道拭子等。目前,毛細管電泳的檢測原理在針對混合樣本的檢測中存在較多局限,如:只能對等位基因的片段長度進行區(qū)分,核苷酸數(shù)量相等的所有等位基因分型被認為是同一個等位基因,無法準(zhǔn)確區(qū)分混合樣本中長度一致的等位基因[31];不能準(zhǔn)確地分辨stutter峰和混合樣本中低比例樣本的等位基因分型。而二代測序技術(shù)不僅可以分辨位點的擴增長度,還可對其內(nèi)在的堿基序列進行詳細的分析[32]。例如:通過對核心檢測位點及其側(cè)翼的堿基序列進行分析,可增加位點的多態(tài)性信息;通過對stutter峰進行分析,可排除雜峰干擾,得到更加準(zhǔn)確的等位基因分型。
Gelardi等[33]使用二代測序技術(shù)對丹麥人群D3S1358基因座進行了等位基因頻率調(diào)查,檢測到17種等位基因分型,而使用毛細管電泳進行檢測時,只獲得8種等位基因分型。Gettings等[34]使用千人基因組計劃中的數(shù)據(jù)將法醫(yī)學(xué)中常用的24個STR位點分別進行毛細管電泳及二代測序技術(shù)檢測,結(jié)果發(fā)現(xiàn)通過二代測序技術(shù)對核心的等位基因序列進行測序后,其中有9個STR位點的多態(tài)性較使用毛細管電泳檢測時增加了30%。通過二代測序技術(shù)對核心檢測位點進行分析,可得到等位基因詳細的堿基序列,有助于對長度相同但重復(fù)序列有所差異的等位基因進行分辨。此外,還可以根據(jù)其側(cè)翼序列的多態(tài)性對位點進行進一步的區(qū)分,增加檢測位點的多態(tài)性和識別能力。Zhao等[35]使用二代測序技術(shù)對165個中國人的10個常染色體STR進行分析,發(fā)現(xiàn)在引物結(jié)合區(qū)域與核心位點之間的側(cè)翼序列有11個多態(tài)性變化。Clayton等[36]使用毛細管電泳對混合DNA樣本中的STR進行分析時發(fā)現(xiàn),STR位點復(fù)制滑脫而導(dǎo)致的stutter峰,通常位于主峰旁且峰面積約為主峰的15%,若混合樣本中比重較少DNA的等位基因的峰高小于或接近stutter峰,將無法區(qū)分此峰是樣本中真實存在的還是stutter峰。Guo等[37]同時使用毛細管電泳檢測技術(shù)和二代測序技術(shù)對人工混合的DNA樣本進行檢測,并對D2S1338和vWA進行分析,結(jié)果在毛細管電泳峰圖上僅顯示片段長度的差異,而且無法對stutter峰的信息進行相關(guān)分析,但在二代測序數(shù)據(jù)中不僅可以顯示片段長度、序列的差異及位點的貢獻情況,還可以有效識別stutter峰并確定其來源,使混合樣本的檢測結(jié)果更加準(zhǔn)確可靠。Gettings等[38]使用MiSeq就22個常染色體STR位點對183個不同種族的DNA樣本進行檢測,由于側(cè)翼序列的缺失導(dǎo)致其位點的擴增長度縮短,使毛細管電泳檢測結(jié)果出現(xiàn)誤差;但是,二代測序檢測技術(shù)可對擴增片段長度與序列同時進行識別,清晰判定核心檢測位點分型,得到準(zhǔn)確的結(jié)果。
利用二代測序技術(shù)多位點同時檢測的優(yōu)勢,也可將核DNA、線粒體DNA以及RNA的位點檢測相結(jié)合,綜合考慮多種信息以進行混合樣本的分析[39]。Hwa等[40]使用具有1 204個遺傳標(biāo)記的復(fù)合體系(包括1 075個核DNA的SNP位點和129個線粒體DNA的SNP位點),對含有兩個無關(guān)個體DNA的混合樣本進行檢測,最高可檢測出其中DNA含量僅為1%的樣本的基因分型。Zubakov等[41]使用Ion Torrent PGM對9個常染色體STR位點和14個mRNA位點進行擴增檢測,結(jié)果顯示:利用4個mRNA位點可準(zhǔn)確對血液、精子、唾液等不同組織來源的DNA樣本進行識別,利用STR位點可對不同組織樣本進行同一認定。將DNA上的遺傳標(biāo)記與RNA上的遺傳標(biāo)記進行合并檢測,有助于對個體識別的鑒定結(jié)果與組織來源認定的結(jié)果進行綜合分析,使混合樣本的分析更加全面,更利于案件的調(diào)查與偵破。
由于法醫(yī)疑難生物檢材的復(fù)雜性,目前并沒有較為成熟的檢測體系。二代測序技術(shù)所具有的能同時進行多樣本、多位點檢測;可對長度、序列多態(tài)性同時鑒別;可深度測序等優(yōu)勢,為疑難檢材的法醫(yī)DNA分析提供了新的思路。例如:通過二代測序技術(shù)可挖掘受核小體保護或具有多拷貝數(shù)的INNULs序列的遺傳位點,并利用這些位點提高微量降解檢材的法醫(yī)DNA檢出成功率;通過二代測序技術(shù)可同時進行眾多微單倍型位點的分析,在具有高個體識別率的同時又能排除stutter峰的干擾,使混合樣本的分型結(jié)果更加真實可靠。另外,二代測序技術(shù)對疑難生物檢材的檢測,不僅僅局限于對物證檢材本身所含有的DNA或RNA等成分的檢測,還可對其所附著的微生物、植物等進行檢測,增加檢測范圍,以便更全面地了解作案時間、地點等信息,這將在對嫌疑人進行主動查找、認定等方面發(fā)揮巨大作用。未來隨著測序技術(shù)的不斷快速發(fā)展,尤其是不經(jīng)過PCR擴增即可直接進行測序的單分子測序技術(shù)的成熟應(yīng)用,必將會對疑難生物檢材的法醫(yī)DNA分析帶來全新的技術(shù)手段和方法。
然而與傳統(tǒng)毛細管電泳相比較,二代測序技術(shù)還存在檢測前期所需實驗步驟繁瑣、消耗時間較長并且單個樣本的測序成本高等缺點,使其在法庭科學(xué)方面的應(yīng)用受到一定限制。相信隨著測序技術(shù)的持續(xù)發(fā)展及法醫(yī)科學(xué)家的努力,這一情況也會很快得到改善。而且,二代測序的法醫(yī)生物信息分析方法尚不完善,無法滿足對案件中疑難檢材DNA檢測的實際需求。未來期望隨著生物信息技術(shù)的發(fā)展以及相關(guān)數(shù)據(jù)的不斷積累,二代測序的數(shù)據(jù)分析會更加準(zhǔn)確、快速,更適用于法醫(yī)實際工作需求。另外,二代測序技術(shù)在能夠檢測較多位點的同時,也會得到核心檢測位點周圍的堿基序列,導(dǎo)致可能包含疾病或其他遺傳性狀的遺傳信息的泄露,未來應(yīng)設(shè)定相應(yīng)的法律法規(guī)為可能涉及的個人隱私泄露提供保護。