張博源 王穎希 趙 蕾 江 麗 萬(wàn) 群 莊 斌趙麗健 楊瑞琴** 韓俊萍
(1)中國(guó)人民公安大學(xué)偵查學(xué)院,北京 100038;2)北京市公安局刑事偵查總隊(duì),北京 100007;3)公安部物證鑒定中心法醫(yī)遺傳學(xué)公安部重點(diǎn)實(shí)驗(yàn)室,北京市現(xiàn)場(chǎng)物證檢驗(yàn)工程技術(shù)研究中心,現(xiàn)場(chǎng)物證溯源技術(shù)國(guó)家工程實(shí)驗(yàn)室,北京 100038;4)山東第一醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院,濟(jì)南 250000;5)北京博奧晶典生物技術(shù)有限公司,北京 101111;6)北京市公安局朝陽(yáng)分局刑事偵查支隊(duì),北京 100025)
法醫(yī)DNA檢驗(yàn)中常用的短串聯(lián)重復(fù)序列(short tandem repeat,STR)遺傳標(biāo)記可實(shí)現(xiàn)精準(zhǔn)個(gè)體識(shí)別,但對(duì)于STR分型入庫(kù)無(wú)比中,無(wú)目標(biāo)嫌疑人,也沒有其他線索的某些案件,STR分型無(wú)法發(fā)揮作用。祖先信息標(biāo)記(ancestry informative markers,AIMs)是指在不同族群間具有等位基因頻率分布差異的標(biāo)記位點(diǎn)[1]。插入/缺失多態(tài)性(insertion/deletion polymorphism,InDel)作為一種常見的祖先信息標(biāo)記,能對(duì)現(xiàn)場(chǎng)生物物證的族群、地域來(lái)源等特征進(jìn)行預(yù)測(cè),在個(gè)體識(shí)別無(wú)法發(fā)揮作用時(shí),獲取更多有關(guān)種族、地域信息,進(jìn)一步縮小偵查范圍[2]。傳統(tǒng)DNA檢驗(yàn)技術(shù)包括DNA提取、DNA定量、PCR擴(kuò)增、毛細(xì)管電泳檢測(cè),整個(gè)過程耗時(shí)費(fèi)力,且對(duì)人員技能和設(shè)備要求較高。基于微流控芯片技術(shù)的法醫(yī)DNA現(xiàn)場(chǎng)快速檢驗(yàn)系統(tǒng)將上述步驟集成于一體,可實(shí)現(xiàn)“樣本進(jìn)-結(jié)果出”,能夠滿足公安實(shí)戰(zhàn)對(duì)DNA現(xiàn)場(chǎng)化和快速化檢驗(yàn)的迫切需求。近年來(lái),已有RapidHIT?200、RapidHIT?ID、ANDETM6C 3款儀器相繼推向市場(chǎng),國(guó)內(nèi)外學(xué)者針對(duì)這3款儀器開展了大量驗(yàn)證研究[3-5]。
QuickTargSeq全集成法醫(yī)DNA現(xiàn)場(chǎng)快速檢測(cè)系統(tǒng)是國(guó)內(nèi)首臺(tái)自主研發(fā)的DNA快速檢驗(yàn)儀,2 h可完成法醫(yī)DNA檢驗(yàn)全部流程,可用于STR個(gè)體識(shí)別,并且首次實(shí)現(xiàn)了InDel族群推斷。本研究基于前期建立的InDel族群推斷微流控芯片檢測(cè)體系,根據(jù)SWGDAM指南[6]對(duì)建立的InDel族群推斷微流控芯片檢測(cè)體系進(jìn)行驗(yàn)證評(píng)估,以期為實(shí)踐應(yīng)用提供參考。
本研究的檢測(cè)樣本包括口腔拭子、血卡、唾液卡及煙蒂樣本。其中口腔拭子樣本來(lái)源于實(shí)驗(yàn)室人員,共107份;血卡樣本來(lái)源于國(guó)家科技資源共享服務(wù)平臺(tái)計(jì)劃項(xiàng)目(YCZYPT[2017]01-3),共31份,已通過公安部物證鑒定中心倫理委員會(huì)的倫理審查(編號(hào):2017-001);唾液卡樣本取實(shí)驗(yàn)室人員,共5份;煙蒂樣本取自實(shí)驗(yàn)室人員,共1份;人類基因組DNA標(biāo)準(zhǔn)品9947A購(gòu)自蘇州新海生物科技股份有限公司。另有36份口腔拭子樣本為實(shí)驗(yàn)室人員飲食后采集,用于干擾物耐受性研究。
107份口腔拭子樣本采集時(shí),實(shí)驗(yàn)室人員漱口后使用取樣拭子在口腔內(nèi)壁左右兩側(cè)刮擦,陰干備用;5份唾液卡樣本取實(shí)驗(yàn)室人員左右兩頰黏膜擦拭物,轉(zhuǎn)移至唾液卡上,陰干備用。36份用于干擾物耐受性研究的口腔拭子,實(shí)驗(yàn)室人員在飲食后使用取樣拭子在口腔內(nèi)壁左右兩側(cè)刮擦,陰涼處晾干備用。
采用QIAamp?DNA Mini M48試劑盒(QIAGEN公司,德國(guó))提取煙蒂檢材DNA,用NanoDrop 2000C分光光度計(jì)(Thermo Scientific公司,美國(guó))進(jìn)行DNA定量。將人類基因組DNA標(biāo)準(zhǔn)品9947A(初始濃度10 mg/L)進(jìn)行梯度稀釋,使用QuantifilerTM人類DAN定量試劑盒(Life Technologies公司,美國(guó))進(jìn)行定量,用于靈敏度驗(yàn)證。
取全集成芯片卡盒備用,卡盒中已預(yù)先存儲(chǔ)凍干擴(kuò)增試劑、電泳試劑及緩沖液(圖1a)。在1.5 ml離心管中加入200μl直擴(kuò)處理液Ⅰ和Ⅱ混合液(含80μl處理液Ⅰ和120μl處理液Ⅱ,蘇州新海生物科技股份有限公司),放入1根口腔拭子,或血卡/唾液卡6片(Φ=2 mm),震蕩5~10次,然后取60μl上述混合液加樣至擴(kuò)增芯片樣本處理池復(fù)溶擴(kuò)增凍干試劑。提取的煙蒂DNA樣本(初始濃度為10 mg/L)直接吸取2μl與去離子無(wú)菌水混合至60μl,加樣至擴(kuò)增芯片樣本處理池復(fù)溶擴(kuò)增凍干試劑。
將全集成芯片卡盒插入Quick TargSeq DNA現(xiàn)場(chǎng)快速檢驗(yàn)儀(圖1b)進(jìn)樣倉(cāng),輸入樣本信息,選擇預(yù)先設(shè)定的程序,點(diǎn)擊運(yùn)行鍵后,儀器自動(dòng)完成樣本裂解、PCR擴(kuò)增、電泳分離全部流程。收集數(shù)據(jù),使用配套軟件BioStrGenotyping v2.0對(duì)結(jié)果進(jìn)行分析。
Fig.1 The fully automated and integrated chip cartridge(a)and the Quick TargSeq Rapid DNA Integrated System(b)
采用人類基因組DNA標(biāo)準(zhǔn)品9947A、口腔拭子、血卡3種樣本進(jìn)行靈敏度測(cè)試。將DNA標(biāo)準(zhǔn)品9947A梯度稀釋:50、25、15、10、5、2.5 ng;采集3名實(shí)驗(yàn)室人員口腔拭子,每名測(cè)試人員使用取樣拭子在口腔內(nèi)壁左右兩側(cè)各刮擦1、2、3、4、5、6、7、8、9、10次;取3份血卡,使用直徑2 mm打孔器在待測(cè)血卡上取樣2、3、4、5、6、7、8片;使用全集成芯片卡盒檢測(cè),以上每種濃度或取樣方式平行重復(fù)檢測(cè)3次。
針對(duì)口腔拭子樣本種可能存在干擾PCR擴(kuò)增的物質(zhì),如附著在口腔內(nèi)壁的食物殘?jiān)?、飲料、煙草,采?名實(shí)驗(yàn)室人員在飲食、飲咖啡、飲茶、吸煙后的口腔拭子作為檢測(cè)樣本,每種取樣方式各采集3份(n=36),同時(shí)采集漱口后的口腔拭子作為陽(yáng)性對(duì)照。所有樣本使用全集成芯片卡盒檢測(cè)。
對(duì)107份口腔拭子和31份血卡進(jìn)行全集成檢測(cè),統(tǒng)計(jì)成功率和分型準(zhǔn)確率。成功率是指等位基因檢出率≥80%的樣本占全部測(cè)試樣本的比率;分型準(zhǔn)確率是指分型成功的結(jié)果,軟件準(zhǔn)確分型的等位基因占全部等位基因的比率[7-9]。
同時(shí)以常規(guī)PCR-CE平臺(tái)的檢測(cè)結(jié)果作為參考樣本分型,擴(kuò)增體系、熱循環(huán)參數(shù)、電泳參數(shù)、數(shù)據(jù)分析方法均參考文獻(xiàn)設(shè)置[10]。
將38-plex InDels復(fù)合擴(kuò)增體系的等位基因分型標(biāo)準(zhǔn)物(allelic ladder)在微流控芯片檢測(cè)平臺(tái)重復(fù)電泳檢測(cè)10次,計(jì)算等位基因分型標(biāo)準(zhǔn)物中各等位基因片段大小的平均值和標(biāo)準(zhǔn)差,驗(yàn)證該體系的精確度。隨機(jī)選取1.7中20份分型成功的全集成檢測(cè)結(jié)果,計(jì)算等位基因片段大小與相應(yīng)的等位基因標(biāo)準(zhǔn)物的差異,驗(yàn)證該體系的準(zhǔn)確性。
選取1.7中分型成功的全集成檢測(cè)結(jié)果,統(tǒng)計(jì)每個(gè)基因座的等位基因峰高值,計(jì)算每個(gè)基因座的雜合子峰高比值(peak height ratio,PHR),計(jì)算方法參照文獻(xiàn)[4];評(píng)估不同熒光通道之間平衡性,評(píng)估方法參照文獻(xiàn)[11]。
對(duì)4類不同檢材進(jìn)行全集成檢測(cè),包括口腔拭子、血卡、唾液卡、煙蒂(其中口腔拭子、血卡和唾液卡采取直擴(kuò)方式,煙蒂采取先提取DNA后檢測(cè)的方式),以測(cè)試該體系的檢材適應(yīng)性。
選取1.7中40份分型成功的全集成檢測(cè)結(jié)果,經(jīng)BioStrGenotyping v2.0軟件導(dǎo)出分型數(shù)據(jù),使用族群推斷軟件DAA v1.0軟件計(jì)算樣本的人群匹配概率(assignment match probability,AMP)和似然比(likelihood ratio,LR),運(yùn)行參數(shù)為K=3,n=15。自動(dòng)獲得待測(cè)樣本的人群匹配概率、似然比、祖先成分,結(jié)合祖先成分比例,當(dāng)LR>100時(shí),AMP值排序第一位的族群為測(cè)試個(gè)體的來(lái)源族群,當(dāng)LR≤100時(shí),AMP排序前兩位的族群均不排除[12]。
分別使用50、25、15、10、5、2.5 ng DNA標(biāo)準(zhǔn)品9947A作為模板進(jìn)行全集成檢測(cè),統(tǒng)計(jì)不同DNA模板量檢測(cè)結(jié)果的等位基因峰高(相對(duì)熒光強(qiáng)度,RFU)和等位基因檢出率(圖2)。其中峰高值隨著DNA模板量的增加而依次增加,DNA模板量為5~50 ng均可獲得完整分型,當(dāng)DNA模板量低于2.5 ng出現(xiàn)等位基因丟失。因此,該體系的最低DNA檢測(cè)限為5 ng。
Fig.2 Sensitivity study for different input DNA template
Fig.3 Sensitivity study for different wipes of buccal swabs
在口腔內(nèi)壁左右兩側(cè)各刮擦1、2、3、4、5、6、7、8、9、10次,使用全集成芯片卡盒檢測(cè)。統(tǒng)計(jì)不同刮擦次數(shù)口腔拭子檢測(cè)結(jié)果的等位基因峰高和等位基因檢出率(圖3)。當(dāng)刮擦次數(shù)為1~4次時(shí),峰高值較低,等位基因檢出率從78.33%增加到92.06%;隨著刮擦次數(shù)的增加,峰高值和等位基因檢出率均依次增加,刮擦次數(shù)為8次時(shí),等位基因檢出率達(dá)到100%,即所有樣本均能獲得完整分型;刮取次數(shù)增加至9次、10次時(shí),等位基因檢出率分別為97.50%、96.67%,各有1份樣本在rs16416位點(diǎn)熒光信號(hào)過強(qiáng),產(chǎn)生滲透現(xiàn)象,造成相鄰?fù)ǖ榔渌稽c(diǎn)等位基因錯(cuò)判,影響分型結(jié)果。綜上,口腔拭子最佳刮擦次數(shù)為8次。
取Φ=2 mm血卡2、3、4、5、6、7、8片進(jìn)行全集成檢測(cè),統(tǒng)計(jì)不同血卡片數(shù)檢測(cè)結(jié)果的等位基因峰高值和等位基因檢出率(圖4)。血卡片數(shù)從2片增加到6片,等位基因峰高值依次增加,等位基因檢出率從94.15%增加至100%,6片時(shí)所有樣本均得到完整分型,7片和8片時(shí),出現(xiàn)了不同程度的等位基因丟失現(xiàn)象。因此,本體系對(duì)血卡的最佳檢測(cè)方式為6片(Φ=2 mm)。
36份不同取樣方式口腔拭子均可獲得有效分型,其中9份飲食后和9份飲咖啡后樣本的分型準(zhǔn)確率為100%;9份飲茶后的樣本中,有1份樣本rs2308067位點(diǎn)分型錯(cuò)誤,分型準(zhǔn)確率為95.83%;9份吸煙后的樣本中,有1份樣本rs5789229位點(diǎn)分型錯(cuò)誤,分型準(zhǔn)確率為95.65%。
應(yīng)用配對(duì)t檢驗(yàn)檢測(cè)含有干擾物和不含干擾物的口腔拭子樣本分型準(zhǔn)確率之間是否存在差異性。結(jié)果顯示,二者之間沒有呈現(xiàn)出顯著性差異(P>0.05)(表1)。
Fig.4 Sensitivity study for different pieces of dried blood spot samples
Table 1 The effect of inhibitors on concordance rate
由于部分全集成芯片卡盒出現(xiàn)斷膠現(xiàn)象,6份樣本未獲得成功分型,132份樣本(102份口腔拭子和30份血卡)分型成功。本體系的全集成檢測(cè)成功率和分型成功率統(tǒng)計(jì)結(jié)果如表2所示。
Table 2 The result of success rate and concordance rate
使用等位基因分型標(biāo)準(zhǔn)物在微流控芯片檢測(cè)平臺(tái)重復(fù)電泳檢測(cè)10次,計(jì)算allelic ladder中各等位基因片段大小的平均值和標(biāo)準(zhǔn)差,統(tǒng)計(jì)結(jié)果(圖5)顯示,10次電泳檢測(cè)所得各等位基因片段大小標(biāo)準(zhǔn)差均在0.3 bp以內(nèi)。隨機(jī)選取2.3中20份樣本的全集成檢測(cè)結(jié)果,所有等位基因與位基因分型標(biāo)準(zhǔn)物中相對(duì)應(yīng)的等位基因片段差異均不超過0.5 bp(圖6)。以上結(jié)果說(shuō)明,該微流控芯片檢測(cè)體系具有較高得精確性和準(zhǔn)確性,分型時(shí)未出現(xiàn)等位基因偏差。
選取2.3中分型成功的132份全集成檢測(cè)結(jié)果,統(tǒng)計(jì)每個(gè)基因座的雜合子峰高比值,計(jì)算平均值和標(biāo)準(zhǔn)差,其中rs1160852、rs35633537兩位點(diǎn)在所檢樣本中未出現(xiàn)雜合子分型,故只統(tǒng)計(jì)37個(gè)位點(diǎn)。由圖7可知,最大PHR值為rs3054057位點(diǎn)(0.965 2±0.013 6),最小PHR值為rs145415095位點(diǎn)(0.742 4±0.185 1),所有基因座的平均雜合子峰高比值為0.86。
Fig.5 Standard deviation of sizing precision for each locus in the allelic ladder calculated for 10 runs on Quick TargSeq systems
Fig.6 Size differences between allele and corresponding allele in allelic ladder for 20 testing samples on Quick TargSeq systems
Fig.7 Heterozygote peak height ratios(PHR)calculated from 132 testing samples in the concordance study
同時(shí)對(duì)該132份全集成檢測(cè)結(jié)果的不同熒光通道之間平衡性進(jìn)行比較(表3)。藍(lán)色熒光通道(FAM標(biāo)記)平衡性最好,峰高比值均值達(dá)89.65%,其余三色熒光通道分別為75.73%、72.98%和77.58%,不同熒光通道之間的峰高比值為61.96%。上述結(jié)果說(shuō)明該微流控芯片檢測(cè)體系具有良好的峰高平衡性。
Table 3 Balance within one dye and among different dyes for 132 testing samples
對(duì)口腔拭子、血卡、唾液卡、煙蒂等4類不同模擬檢材進(jìn)行全集成檢測(cè),所有樣本均成功獲得分型,并與常規(guī)PCR-CE平臺(tái)檢測(cè)結(jié)果一致,整個(gè)檢測(cè)時(shí)間為2 h,部分樣本的檢測(cè)結(jié)果如圖8所示。
Fig.8 The InDel profiles of mock case samples
使用25個(gè)參考族群,對(duì)40份測(cè)試樣本結(jié)果進(jìn)行個(gè)體族群來(lái)源推斷,計(jì)算得到樣本的AMP及LR值,AMP排序第一位均為東亞人群,與AMP排序第二位的人群相比LR值遠(yuǎn)大于100,群體水平的祖先成分中的東亞成分為96.98%。主成分分析如圖9所示,其中PC1與PC2分別表示主成分1與主成分2,二者共解釋了總方差的37.34%。所有樣本與東亞人群聚為一類,與已知樣本來(lái)源信息一致。
Fig.9 The principal component analysis of 40 testing samples
基于微流控芯片技術(shù)的法醫(yī)DNA現(xiàn)場(chǎng)快速檢驗(yàn)系統(tǒng)提升了法醫(yī)DNA檢驗(yàn)現(xiàn)場(chǎng)化和快速化的能力,滿足了公安實(shí)戰(zhàn)的迫切需求。目前,國(guó)外推出的RapidHIT?200、RapidHIT?ID、ANDETM6C 3款商業(yè)化DNA快速檢驗(yàn)儀,均是配套使用STR試劑盒進(jìn)行個(gè)體識(shí)別[3-5],尚未見將快檢系統(tǒng)應(yīng)用于族群推斷領(lǐng)域。Quick TargSeq全集成法醫(yī)DNA現(xiàn)場(chǎng)快速檢測(cè)系統(tǒng),作為中國(guó)國(guó)內(nèi)首臺(tái)自主研發(fā)的DNA快速檢驗(yàn)儀,可配套使用38-plex InDels復(fù)合擴(kuò)增體系,首次實(shí)現(xiàn)了DNA快速檢驗(yàn)儀器在族群推斷領(lǐng)域的應(yīng)用。本研究使用InDel族群推斷微流控芯片檢測(cè)體系,參考SWGDAM指南,對(duì)該體系進(jìn)行了系統(tǒng)研究。
靈敏度研究結(jié)果顯示該芯片檢測(cè)體系在DNA模板量≥5 ng時(shí),可獲得完整InDel分型,可以滿足大多數(shù)犯罪現(xiàn)場(chǎng)生物物證檢材的最低檢測(cè)限[4]。對(duì)于口腔拭子樣本,刮擦次數(shù)較少時(shí)由于DNA模板量不足會(huì)出現(xiàn)等位基因缺失,當(dāng)刮擦次數(shù)較多時(shí)也出現(xiàn)等位基因缺失,原因可能是刮擦次數(shù)較多時(shí)口腔中黏蛋白或蛋白酶也會(huì)相應(yīng)增多,而這些物質(zhì)可能會(huì)抑制PCR擴(kuò)增[13],并且刮擦次數(shù)較多時(shí)出現(xiàn)滲透峰而影響分型,因此最佳采集次數(shù)為口腔內(nèi)壁左右各刮擦8次。對(duì)于血卡樣本(Φ=2 mm血片),使用片數(shù)較少時(shí)同樣會(huì)由于DNA模板量不足會(huì)出現(xiàn)等位基因丟失,而使用片數(shù)較多時(shí)(7~8片)也會(huì)出現(xiàn)等位基因丟失,其原因可能是隨著血卡用量的增多,樣本所含血紅素也隨之增多,而血紅素是潛在的PCR擴(kuò)增抑制劑[14]??谇粌?nèi)壁附著的食物殘?jiān)?、飲料、煙草等物質(zhì)可能成為PCR擴(kuò)增的潛在干擾物,干擾物耐受性研究結(jié)果顯示,含有干擾物和不含干擾物的口腔拭子樣本分型準(zhǔn)確率之間并未呈現(xiàn)出顯著性差異,這說(shuō)明食物、咖啡、茶葉、煙草在檢測(cè)過程中的干擾效應(yīng)并不明顯。
InDel族群推斷微流控芯片檢測(cè)體系對(duì)138份樣本的全集成檢測(cè)成功率為95.65%(132/138),分型準(zhǔn)確率為 98.85% (6 954/7 035),與RapidHIT?200、RapidHIT?ID和ANDETM6C檢 測(cè)STR的成功率(分別為85.45%、84.5%和99.98%)相當(dāng),而分型準(zhǔn)確率與RapidHIT?200(100%)和ANDETM6C(99.98%)相當(dāng)[7-9],可以實(shí)現(xiàn)對(duì)口腔拭子和血卡的準(zhǔn)確有效分型。該體系的精確度和準(zhǔn)確度較高,分型時(shí)不會(huì)出現(xiàn)等位基因偏差。對(duì)于分型成功的全集成檢測(cè)結(jié)果,所有基因座的平均PHR值為0.86,高于配套使用FlexPlexTM27試劑盒的ANDETM6C快檢儀的PHR值(0.81)[15]。
與常規(guī)PCR-CE平臺(tái)相比,微流控芯片檢測(cè)體系具有集成、快速、操作簡(jiǎn)便等優(yōu)點(diǎn),集成化一體檢測(cè)實(shí)現(xiàn)了“樣本進(jìn)-結(jié)果出”,降低常規(guī)方法由于需要多種儀器且步驟繁瑣導(dǎo)致的樣本污染等風(fēng)險(xiǎn)。本研究將InDel族群推斷體系與中國(guó)國(guó)內(nèi)首臺(tái)自主研發(fā)的DNA快速檢驗(yàn)儀結(jié)合,2 h左右即獲得樣本的準(zhǔn)確分型,能夠準(zhǔn)確推斷樣本族群來(lái)源,能滿足現(xiàn)場(chǎng)檢測(cè)的要求,可供實(shí)際辦案選用。但也存在檢測(cè)通量較低、目前只能對(duì)口腔拭子、血卡等常規(guī)樣本檢驗(yàn)等不足,未來(lái)研發(fā)人員需對(duì)系統(tǒng)進(jìn)行優(yōu)化升級(jí),提高樣本檢測(cè)通量,同時(shí)優(yōu)化提取模塊以適應(yīng)更多樣本類型的檢測(cè)。