高林林,王科文,李佑英,羅 俊,徐紅偉,周志全,王 琴,豐 蕾,*
(1. 杭州市公安局刑事科學技術研究所,杭州 310006;2. 公安部鑒定中心,北京 100038;3. 杭州華碩司法鑒定中心,杭州 310006;4. 建德市公安局,浙江 建德 311600)
個體的年齡推斷一直是法醫(yī)學領域的研究熱點,通過骨骼、牙齒等推斷個體年齡的方法[1-2],無法用于實際案件中遇到的各種組織及體液供者的年齡推斷;通過端粒長度變化來推斷年齡的定量研究尚在摸索階段[3];通過DNA甲基化水平來推斷個體年齡的研究在國內(nèi)外均已有廣泛開展[4-7]。本研究組前期通過不同年齡段的北方男性血液樣本建立了DNA甲基化水平的年齡推斷模型,通過質(zhì)譜方法可檢測9個CpG位點的甲基化值,該9-CpG年齡推斷模型與同類研究相比,不僅誤差值較小,且已有實戰(zhàn)應用案例[8-9]。但由于原計算模型針對的是河北、北京、河南等北方漢族男性,對于如浙江等我國南部地區(qū)的人群,其生活習性和遺傳背景與北方漢族個體有顯著的差異,能否使用該模型推斷年齡尚需驗證。隨著全國Y染色體STR數(shù)據(jù)庫的不斷建設,在龐大復雜的家系排查中,若能推斷出現(xiàn)場遺留生物檢材所屬個體的年齡,則可大幅提升排查工作效率。因此本研究通過檢測血斑樣本,采用上述模型推斷浙江漢族個體的年齡,希冀驗證并拓展9-CpG年齡推斷模型的適用性及范圍。儀、Quantif iler?Trio DNA定 量 試 劑 盒、NanoDrop 2000c分光光度計均購自美國Thermo Scientif ic公司;Eppendorf Pro S PCR擴增儀(Eppendorf公司,德國);蝦堿性磷酸酶(Shrimp Alkaline Phosphatase,SAP)、 MassARRAY?Clean Resin、MassARRAY質(zhì)譜儀及EpiTYPER v1.3軟件均購自美國Agena Bioscience公司。
根據(jù)知情同意原則,采集浙江漢族男性及女性無關個體新鮮外周血樣本共196份(男100份,女96份),采樣經(jīng)公安部鑒定中心科研倫理委員會審核批準。每份取約600 μL血液滴于三層折疊的白紗布上制成血斑紗布,陰干后室溫保存3~6個月。實戰(zhàn)中涉案人員的年齡分布大多集中在16~65歲,故采樣選取此年齡段個體且盡量每個年齡選取2人份,各年齡段樣本保持均等。樣本年齡段分組具體見圖1。
圖1 樣本年齡分布Fig.1 Age distribution of sampled individuals (male/female:indicated with blue/mauve bar)
MagAttract?M48 DNA Manual 試 劑 盒(Qiagen公司,德國);EZ DNA MethylationTM試劑盒(Zymo Research公司,美國);QuantStudio5熒光定量PCR
剪取三層折疊血紗布上血斑約2.0 cm×2.0 cm,采 用MagAttract?M48 DNA Manual試 劑 盒 按 照 說明書提取基因組DNA,洗脫體積為60 μL。采用NanoDrop 2000c分光光度計測定DNA濃度及純度,所有DNA模板保存至-20 ℃?zhèn)溆谩?/p>
剪取男性及女性各13份樣本血紗布上血斑約1.0 cm×1.0 cm,采用1.3所述方法進行DNA提取。取1 μL DNA模板采用NanoDrop 2000c分光光度計測定DNA質(zhì)量;取2 μL DNA模板采用Quantif iler?Trio DNA定量試劑盒以QuantStudio5實時熒光定量PCR儀按照試劑盒說明書進行DNA質(zhì)量測定。
取1 μg DNA樣本,若總量不足1 μg,則取45 μL DNA樣本,按照EZ DNA MethylationTM試劑盒說明書進行重亞硫酸鹽處理,轉(zhuǎn)化后的DNA采用30 μL純水洗脫,并再次采用NanoDrop 2000c分光光度計測定轉(zhuǎn)化后的DNA質(zhì)量。
9對擴增引物均按照文獻[8]進行合成。擴增體系為5 μL,其中10×PCR 緩沖液0.5 μL,dNTP 0.04 μL,5U PCR 聚合酶0.1 μL, 2 μmol/L 引物2.0 μL,轉(zhuǎn)化后DNA(bisulfite converted DNA,BS-DNA)2.36 μL。與文獻方法[10]相比,引物濃度由1 μmol/L增加到2 μmol/L,PCR 聚合物從0.09 μL增加到0.1 μL。擴增程序及SAP純化均 按照文獻[10]進行。
轉(zhuǎn)錄及T裂解體系為5 μL,按文獻[10]配比混勻, 加入SAP純化后產(chǎn)物4 μL,37 ℃孵育3 h。4 ℃存儲。
96孔PCR板的每孔內(nèi)加入36 μL不含RNA酶的水以及T裂解產(chǎn)物9 μL,混勻后離心15 min,質(zhì)譜儀的樹脂盒內(nèi)加入適量純化樹脂,并將芯片放置于相應位置,采用MassARRAY系統(tǒng)進行檢測。
轉(zhuǎn)化回收率計算方法: 轉(zhuǎn)化后得到的單鏈DNA總量與轉(zhuǎn)化前加入的雙鏈基因組DNA總量的百分比值。
所有甲基化值采用EpiTYPER v1.3軟件進行數(shù)據(jù)處理,并按照已建立的線性回歸方程[8]進行個體年齡預測計算。將預測結果與人員實際年齡進行比對,計算個體預測年齡與實際年齡差值絕對值的平均值即平均絕對偏差(mean absolute deviation, MAD)值;計算個體預測年齡與實際年齡差值的平均值即平均誤差(mean error,ME),正值表示高估、負值表示低估,評估已建模型[8]對本研究樣本的適用性。采用R軟件 “l(fā)m”函數(shù)建立多元線性回歸模型,采用IBM SPSS Statistics 23對所有處理數(shù)據(jù)作t檢驗、單因素方差分析等。
26份樣本同時用兩種不同的定量方法進行DNA質(zhì)量測定后發(fā)現(xiàn),NanoDrop 2000c分光光度計所測定的DNA質(zhì)量均值為(9.15±4.45)ng/μL,而實時熒光PCR定量法獲得的DNA質(zhì)量均值為(3.79±2.80)ng/μL,兩者之間具有顯著性差異(P<0.05)。前者所測定的DNA量均值是后者均值的2.4倍。
所有樣本提取及轉(zhuǎn)化后的DNA定量結果(NanoDrop 2000c分光光度計測定)、轉(zhuǎn)化回收率見表1。不同樣本提取得到的DNA及轉(zhuǎn)化后得到的DNA總量存在顯著性差異,樣本間的甲基化轉(zhuǎn)化回收率也有明顯差異。血斑提取得到的DNA濃度最低為11.90 ng/μL,最高可達205.70 ng/μL,平均OD值(按A260/A280測算)為1.69±0.16;進行重亞硫酸鹽轉(zhuǎn)化的DNA總量最低為535.50 ng(11.90 ng/μL×45 μL),重亞硫酸鹽轉(zhuǎn)化后DNA(bisulf iteconverted DNA,BS-DNA)總量最低為153.00 ng(5.10 ng/μL×30 μL)。
表1 不同樣本提取與轉(zhuǎn)化后DNA定量以及轉(zhuǎn)化回收率的比較Table 1 Quantity range of extracted genome DNA, bisulf ite-converted DNA and recovery rates
為進一步分析最低的基因組DNA用量,以最終PCR擴增所需的BS-DNA量結合轉(zhuǎn)化回收率進行計算。BS-DNA最低濃度為5.10 ng/μL,每個PCR反應加入2.36 μL,共7個PCR反應,因此最低需要BS-DNA 84.00 ng。按照平均轉(zhuǎn)化回收率43%計算,最低的基因組DNA用量為195.00 ng,如果按照最高轉(zhuǎn)化回收率計算,則為112.00 ng。如果使用熒光定量PCR方法定量,最低基因組DNA用量可降為46.00 ng。
100份浙江漢族男性血斑樣本作為驗證集,對已建立的9-CpG年齡推斷模型[8]進行年齡驗證,其驗證結果見圖2。對于100份男性樣本來說,總體MAD值為2.95歲。按照年齡段分為5個組(A-E組),分 別 為16~25、26~35、36~45、46~55、56~65歲,分別統(tǒng)計MAD最小為2.70歲,最大為3.21歲,對于前4組(16~55歲),ME均為正值,第5組(56~65歲)為負值(見補充材料表S1)。從圖2可以看出,每組高估與低估的樣本個數(shù)基本相同。
圖2 9-CpG年齡推斷原模型在男性樣本中實際年齡與預測年齡的散點圖Fig.2 Scattering dot plot obtained from actual age against the predicted with male samples by the 9-CpG age prediction model
96份浙江漢族女性血斑樣本在9個CpG位點測得的甲基化值采用已建立的9-CpG年齡推斷模型[8]進行年齡計算,并與實際年齡進行對比,總體MAD值為3.18歲(見圖3)。從補充材料表S2可以看出A—D組的個體推斷年齡均為高估,且每個組都只有個別樣本推斷年齡比實際年齡?。籈組的預測年齡基本為低估,且ME值與前面四組比較,差異具有統(tǒng)計學意義(P=1.0×10-3)。為明確男性及女性樣本在模型驗證中的差異,對男性及女性樣本各個位點的甲基化值進行t檢驗,結果顯示CpG6、CpG7位點有顯著性差異(見補充材料表S3)。為進一步優(yōu)化模型,在96份樣本中選取70%的樣本作為訓練集,30%的樣本作為驗證集,使用R軟件“l(fā)m”函數(shù)對原模型進行調(diào)整優(yōu)化,優(yōu)化后的模型為:
圖3 年齡推斷原模型在女性樣本中實際年齡與預測年齡的散點圖Fig.3 Scattering dot plot from actual age against the predicted with female samples by the 9-CpG age prediction model
訓練集和驗證集的R2分別為0.94和0.93,MAD值分別為2.59歲和2.78歲(圖4)。對新模型與原模型的所有樣本預測年齡與實際年齡差值的絕對值進行配對t檢驗,結果具有統(tǒng)計學差異(P=0.03),所有樣本采用新模型進行年齡推斷計算所得總體MAD為2.65歲,其預測誤差值比原模型小0.53歲,新模型的預測準確性更高。
圖4 新建立的年齡推斷模型中實際年齡與預測年齡的散點圖Fig.4 Scattering dot plot from actual age against the predicted with the modif ied 9-CpG age prediction model
在新模型中,96份女性樣本在上述的分組中,各組之間的MAD值較為均一,與原預測模型相比,其預測準確度均有提升,且通過配對t檢驗,顯示MAD值在兩種預測模型中存在顯著性差異(見表2)。
表2 兩種預測模型MAD的比較Table 2 Comparison of MAD between two prediction approaches
本文采用EpiTYPER技術平臺對浙江漢族個體的血斑樣本進行供者年齡推斷研究,驗證以前建立的多元線性回歸模型的檢材適應性與適用人群范圍?;贒NA甲基化的年齡推斷在法醫(yī)學領域的研究已有很多報道,在不同的研究中,CpG位點的選擇與組合不盡相同,而且采用的預測模型也各有不同。有學者專門比較了基于血液樣本的6種預測模型,發(fā)現(xiàn)不同的預測模型,其預測準確度存在差異。多元線性回歸模型可最大程度保留原始數(shù)據(jù),且應用最為廣泛,適于低樣本量數(shù)據(jù)建模[11]。EpiTYPER技術平臺也是DNA甲基化研究中定量檢測常用的方法,通過交叉驗證比較發(fā)現(xiàn)其所獲得的數(shù)據(jù)準確性及重復性均較高[8]。
血斑DNA樣本的甲基化檢測具有挑戰(zhàn)性。Suchiman等認為采用EpiTYPER技術平臺檢測DNA甲基化時,要想獲得較好的檢測結果,提取高純度及高分子量的基因組DNA非常重要,OD值比(A260/A280)應在1.7~2.0之間[12]。由于附有紗布載體,本文中血斑DNA的OD值比平均為1.69±0.16,因此在進行PCR擴增時,為了提高擴增效率, 增加了0.05U聚合酶以及引物濃度調(diào)整為2.0 μmol/L。重亞硫酸鹽處理是甲基化檢測非常重要的一步,與常規(guī)血液樣本DNA相比,由于血斑提取到的DNA質(zhì)量較差,轉(zhuǎn)化回收率對于后續(xù)檢測更為重要。針對血液樣本DNA來說,Sam等學者比較了6種不同的重亞硫酸鹽轉(zhuǎn)化商業(yè)試劑盒,發(fā)現(xiàn)不同的試劑盒轉(zhuǎn)化回收率差異較大[13],但是對于血斑樣本DNA尚無相關報道。本文采用EZ DNA MethylationTM轉(zhuǎn)化試劑盒發(fā)現(xiàn)不同樣本間的DNA轉(zhuǎn)化回收率差異明顯,最高可達75.35%,最低僅為11.05%。
本研究中100份浙江漢族男性血斑樣本推斷年齡MAD值為2.95歲,與基于血液樣本建立的北方地區(qū)男性個體年齡的預測準確性(MAD=2.89歲)基本一致,而且不同年齡組間的MAD值無顯著性差異,顯示9-CpG年齡推斷適用于浙江地域的男性血斑樣本的年齡推斷。前期建立的9-CpG年齡推斷模型針對的是男性漢族個體,本研究發(fā)現(xiàn)直接使用該模型計算女性漢族個體的年齡普遍存在高估,因此性別會影響年齡推斷結果。盡管有一些研究結果與本文不一致,如:Bekaert通過4個年齡相關位點檢測了105份男性樣本和101份女性樣本發(fā)現(xiàn)所建立的年齡推斷模型無性別差異[14];Correia Dias等通過對51份葡萄牙人血液樣本(男性18份,女性35份)的檢驗,也未發(fā)現(xiàn)男女樣本間的MAD值有明顯差異[15];國內(nèi)孫曉萌等通過男女樣本各40例在年齡偏差上的對比,同樣顯示無統(tǒng)計學差異[16],但筆者分析認為可能與上述研究選取的樣本量小、CpG位點選取差異有關。有學者通過Illumina 450K陣列進行全基因組甲基化測序,發(fā)現(xiàn)男性和女性個體與年齡相關的CpG位點不同,即使相同的CpG位點,其相關系數(shù)也存在差異[17]。
本研究中發(fā)現(xiàn)CpG6、CpG7這兩個位點的甲基化值在男性樣本與女性樣本間存在著顯著性差異,導致原模型不適用于女性樣本。使用96份女性樣本重建線性回歸模型,總體MAD下降了0.53歲,且不同年齡組間的MAD值較為均衡,最小為2.24歲,最大為2.90歲。
本文采用分光光度計測定的單管PCR擴增的BS-DNA量最低為12.0 ng,這個用量比LEE等[18]報道的采用SNaPshot技術進行甲基化DNA檢測所需的BS-DNA量(>5.0 ng)稍高。但如果是采用實時熒光定量PCR法進行測定,其BS-DNA的量也能降為5.0 ng。分光光度計測定DNA質(zhì)量不僅快速且不需任何實驗試劑耗材,在大批量樣本的研究中具有優(yōu)勢,但其準確度易受到RNA、蛋白質(zhì)的影響。而實時熒光定量PCR儀在一線法醫(yī)DNA實驗室中的使用更為普遍,其測量精度也較高,但是必須使用專門的定量試劑盒,定量成本較為昂貴。
本文在研究大批量樣本中采用了分光光度計,通過兩種不同定量方法的比較,能為一線DNA技術人員利用血斑樣本進行DNA甲基化年齡推斷提供參考數(shù)據(jù)與借鑒。有效提高DNA轉(zhuǎn)化回收率將是我們下一步研究的內(nèi)容,期望可進一步拓展9-CpG年齡推斷模型在現(xiàn)場血斑檢材和樣本中的應用。
補充材料
與本文相關的補充數(shù)據(jù)見:http://www.xsjs-cifs.com/CN/abstract/abstract6981.shtml。