宋正陽,王小娟,錢恩芳,師 源,董 薇,陳 飛,李彩霞,黃 江,江 麗*
1貴州醫(yī)科大學法醫(yī)學院,貴州 貴陽550004;2公安部物證鑒定中心,法醫(yī)遺傳學公安部重點實驗室,北京市現(xiàn)場物證檢驗工程技術研究中心,現(xiàn)場物證溯源技術國家工程實驗室,北京100038;3貴州省人民醫(yī)院法醫(yī)司法鑒定所,貴州 貴陽550002;4泰安市公安局刑事科學技術研究所,山東 泰安271000;5黔東南州公安局,貴州 凱里556000
人類Y染色體呈父系遺傳,其中非重組區(qū)約占95%,以單倍型形式傳遞給男性后代[1]。常用遺傳標記有Y染色體短串聯(lián)重復序列(Y chromosome short tandem repeat,Y-STR)、Y染色體單核苷酸多態(tài)性位點(Y chromosome single nucleotide polymorphism,Y-SNP)等。Y-STR基因座組成的單倍型在不同家系間具有較高多態(tài)性,廣泛用于家系排查[2-4],為案件偵查提供線索。此外,高突變率的快速突變YSTR(rapid-mutating Y-STR,RM Y-STR)基因座[5]和高遺傳多態(tài)性的多拷貝Y-STR(multi-copy Y-STR,MC Y-STR)基因座[6]可進一步提高對同一家系中親緣關系較近的男性個體的區(qū)分能力。一般來說,兩男性個體間單倍型容差≥3,可排除來自于同一生物學家系,但研究發(fā)現(xiàn)在排查親緣關系較遠的個體時,26個Y-STR基因座容差可低至1,增加6個RM Y-STR及MC Y-STR基因座后總容差>3[7]。因此,在實際應用時應綜合考慮比對樣本間存在容差的基因座數(shù)目及其步長、突變率等,適當調整閾值標準[8]。
Y-SNP在家系調查研究中也有重要應用,其具有突變率低、隨父系遺傳等特征,突變可穩(wěn)定遺傳給男性后代,后代在祖先突變基礎上累積新突變[9-10]。Y染色體單倍群是指具有共同祖先來源的一組Y-SNP單倍型,其分布具有群體和地理特異性,可用于未知男性生物樣本的父系溯源[11]。國際Y染色體命名委員會(the Y chromosome consortium,YCC)將世界男性分為20個主干單倍群(A-T)[12],其中單倍群OM175、C-M130、D-M174、N-M231約占東亞所有男性的93%,單倍群O-M175約占東亞男性的60%[13]。已有國內外學者將Y-STR和Y-SNP聯(lián)合應用于家系相關的研究,如Lkhagvasuren等[14]利用Y-STR和YSNP調查蒙古皇室金氏家族5具遺體之間的關系;Claerhout等[15]建立了Y-STR和Y-SNP遺傳標記與姓氏相關的預測模型;Wang等[16]通過分析曹操同姓后代家族中Y-SNP單倍群及其分布頻率,可反推該歷史人物最可能的單倍群;錢恩芳等[17]將Y-SNP和Y-STR兩種遺傳標記相結合應用于家系調查,顯著提高家系認定的可信度等。
本研究通過調研相關數(shù)據(jù)庫及文獻,篩選東亞地區(qū)典型分布的Y-SNP位點,基于微測序技術構建復合體系,并評估該體系在家系排查中的應用效能。
1.1.1 位點篩選及引物設計
參照2019版Y染色體譜系樹(International Society of Genetic Genealogy,ISOGG)(https://isogg.org/tree/index.html),結合文獻調研篩選Y染色體主干單倍群及高頻分布于東亞地區(qū)的O-M122單倍群下游SNP位點。共篩選74個Y-SNP位點,分為兩組:①核心體系,包含主干單倍群的37個SNP位點(圖1A);②O體系,包含O-M122單倍群下游分支的37個SNP位點(圖1B)。利用軟件Primer Premier V5.0設計PCR及延伸引物(表略,可掃OSID碼查看附表1),并由生工生物工程(上海)股份有限公司合成。
圖1 74個Y-SNP位點譜系樹Figure 1 Phylogenetic tree of 74 Y-SNP
1.1.2 復合擴增、純化及分型檢測
PCR反應體系為5 μL,包括去離子水1.05 μL,10×PCR Buffer(含Mg2+15 mmol/L)0.5 μL,25 mmol/L MgCl20.7 μL,引物混合物0.5 μL,5 U/μL Hotstar Taq Plus DNA聚合酶(Qiagen公司,德國)0.2 μL,10 mmol/L dNTP 0.05 μL,5 ng/μL模板DNA 2 μL。PCR反應條件:95℃5 min后,94℃30 s,55℃30 s,72℃1 min,循環(huán)40次,延伸72℃10 min。向PCR產物中加入去離子水1.3 μL,ExoⅠ(10 U/μL)0.4 μL,SAP(1 U/μL)1 μL,10×SAP Buffer 0.3 μL進行純化,37℃30 min,96℃10 min。
單堿基延伸反應體系為5 μL,包含純化后PCR產物1.5 μL,延伸引物0.3 μL,SNaPshot Multiplex Ready Reaction Mix 2.5 μL,ddH2O 0.7 μL。循環(huán)參數(shù):96℃10 s后,50℃5 s,60℃30 s,循環(huán)25次。向延伸產物中加入0.5 μL SAP(1 U/μL)進行純化,37℃孵育1 h,75℃15 min。
利用3130xl遺傳分析儀(Thermo Fisher Scientific公司,美國)進行電泳檢測,GeneMapper v3.2軟件(Thermo Fisher Scientific公司,美國)分析結果。
1.1.3 Y染色體單倍群判別
根據(jù)樣本在74個Y-SNP位點上的分型結果,依據(jù)在譜系樹中突變情況遞推判別其所屬的單倍群類型。
1.1.4性能驗證
①準確性:取男性標準品DNA 2800(Promega公司,美國)、DNA 9948(Promega公司,美國)及10份無親緣關系的男性樣本DNA,對74個Y-SNP位點進行Sanger直接測序(生工生物工程股份有限公司),用于驗證體系分型結果的準確性。②靈敏度:利用Y-SNP體系分別檢測模板量為10.00、6.00、2.00、1.60、1.20、0.80、0.40、0.20、0.16、0.12、0.08、0.06、0.018 ng的男性標準品DNA 2800重復檢測3次,測試體系的靈敏度。③重復性:以檢測最優(yōu)量對男性標準品DNA 2800重復檢測3次,比較3次檢測結果的分型與出峰位置的一致性。④檢材適應性:檢測男性FTA血卡、口腔拭子、指甲、毛發(fā)(帶毛囊)等常見檢材各8份,分別取10 ng進行檢測,統(tǒng)計不同類型檢材的出峰率。⑤抗女性成分干擾:取男性標準品DNA 2800和女性標準品DNA 9947按1∶1、1∶10、1∶100的比例進行混合,確保每管內男性DNA 2800的濃度均為0.5 ng/μL,分別取2 μL進行檢測并與僅存在男性成分時的檢測結果進行比對。⑥種屬特異性:取恒河猴、黑猩猩、雞、牛、蛇、鼠、魚、豬等非人源樣本各10 ng進行檢測,統(tǒng)計各種屬的出峰數(shù)目。
1.2.1 樣本及DNA提取與定量
本研究收集來自4個社會學家系(分別命名為P1~P4家系)共20份男性血卡樣本,其中P1家系3例,P2家系6例,P3家系6例,P4家系5例。采用QIAamp?DNA Blood Mini M48試劑盒(QIAGEN公司,德國)提取DNA,使用NanoDrop 2000c分光光度計(Thermo Fisher Scientific公司,美國)進行定量,用去離子滅菌水稀釋至5 ng/μL待檢。本實驗室樣本均來源于國家科技資源共享服務平臺計劃項目(編號:YCZYPT[2017]01-3),所有樣本對象均簽署知情同意書,本研究已通過公安部物證鑒定中心倫理委員會的倫理審查(批準號:2017LLSC-005)。
1.2.2 分型檢測
所有樣本采用本研究構建的體系按照1.1.2方法進行Y-SNP分型檢測;采用DNA TyperTMY29試劑盒(公安部物證鑒定中心,北京)進行Y-STR檢測,包括26個Y-STR基因座(DYS19、DYS385、DYS389Ⅰ/Ⅱ、DYS390、DYS391、DYS392、DYS393、DYS437、DYS438、DYS439、DYS448、DYS456、DYS458、DYS635、GATA-H4、DYS444、DYS447、DYS460、DYS481、DYS508、DYS533、DYS643、DYF387S1、DYS518、DYS449、DYS576),其中3個基因座(DYS449、DYS518、DYS576)為RM Y-STR,2個基因座(DYS385、DYS389Ⅰ/Ⅱ)為MC Y-STR,1個基因座(DYF387S1)既是RM Y-STR也是MC YSTR。
根據(jù)Y-SNP分型結果判別樣本Y-SNP單倍群類型,統(tǒng)計家系內Y-SNP單倍群分布情況。以家系內成員中共享人數(shù)最多的單倍型為參考,統(tǒng)計家系內Y-STR單倍型分布情況及不同單倍型之間的容差和累計突變步長?;?3個單拷貝Y-STR基因座分型,根據(jù)Median-Joining方法,使用Network v10.0和Network Publisher軟件分別對4個家系中YSTR單倍型變異情況進行網(wǎng)絡圖可視化分析。
男性標準品DNA 2800用本研究構建的Y-SNP體系檢測的分型圖譜如圖2所示。其中核心體系SNP位點延伸片段長度在37~116 bp之間(圖2A),O體系SNP位點延伸片段長度在31~115 bp之間(圖2B)。在DNA模板量為10 ng時(濃度5 ng/μL,體積2 μL),各位點均有分型峰,且峰高均超過200 RFU。
①準確性:12份DNA樣本的分型結果與Sanger直接測序結果的基因分型完全一致,構建的復合體系對74個Y-SNP位點的基因分型結果準確性可達100%,DNA2800核心體系檢測結果可掃OSID碼查看附圖1,O體系檢測結果可掃OSID碼查看附圖2,余11份DNA結果可掃OSID碼查看附表2。②靈敏度:對不同模板量的樣本進行Y-SNP體系檢測,以等位基因峰高低于100 RFU視為位點丟失為標準。結果顯示,在DNA檢測量最低為0.14 ng(核心體系0.06 ng,O體系0.08 ng)時,74個Y-SNP位點均可正確判型,檢測結果可掃OSID碼查看附圖3。③重復性:74個Y-SNP位點在3次重復實驗中的分型結果一致,相同位點之間的出峰位置差距平均為0.087 bp(核心體系0.025 bp,O體系0.061 bp),均≤1 bp(可掃OSID碼查看附表3)。說明Y-SNP體系重復檢測相同的DNA樣本時,均能獲得相同的分型結果。④檢材適應性:利用Y-SNP體系檢測的FTA血卡、口腔拭子、指甲、毛發(fā)(帶毛囊)DNA樣本,均能獲得完整分型,且同一樣本不同類型檢材分型結果一致,說明該體系可以用于常用檢材的檢測(可掃OSID碼查看附圖4)。⑤抗女性成分干擾:在男性與女性成分比例為1∶1、1∶10、1∶100時,核心體系及O體系的出峰率均為100%。所出分型峰均與男性成分單獨檢測結果相同(可掃OSID碼查看附圖5)。⑥種屬特異性:所檢測的靈長類動物黑猩猩檢出52個位點峰,恒河猴檢出30個位點峰,其余樣本均未檢出特異性峰(可掃OSID碼查看附圖6)。
圖2 男性標準品DNA 2800分型圖譜Figure 2 The typing profile of male standard DNA 2800
來自4個社會學家系的20例男性樣本均獲得完整的Y-SNP與Y-STR分型,Y-SNP單倍群和YSTR單倍型分型結果可掃OSID碼查看附表4。家系內各樣本間網(wǎng)絡圖以及結合家系調研信息繪制的家譜圖見圖3,網(wǎng)絡圖對家系內Y-STR以及YSNP的變異情況進行可視化。Y-STR單倍型編號對應的分型可掃OSID碼查看附表4。
P1家系3例男性樣本Y-STR單倍型完全一致,其Y-SNP單倍群均屬于N1b-F2930。在圖3A中3例樣本聚在一起。
P2家系6例男性樣本共檢出4種Y-STR單倍型,其中單倍型H2共3例,H3共1例,H4共1例,H5共1例。以單倍型H2為參考,其與H3之間的容差為1,與H4之間的容差為4,與H5之間的容差為5,累計突變步長分別為1、4、5步。所有樣本之間有5個Y-STR基因座(DYS439、GATA-H4、DYS518、DYS576、DYS385)的突變步長均為1步,其余21個基 因 座(DYS19、DYS389I/II、DYS390、DYS391、DYS392、DYS393、DYS437、DYS438、DYS448、DYS456、DYS458、DYS635、DYS444、DYS447、DYS460、DYS481、DYS508、DYS533、DYS643、DYF387S1、DYS449)分型一致。6例樣本Y-SNP單倍群均屬于N1b-F2930。在圖3B中,3例H2單倍型的個體聚在一起,與H3單倍型個體之間容差相差1,與H4單倍型個體之間容差相差3,與H5單倍型個體之間容差相差4。
P3家系6例男性樣本共檢出3種Y-STR單倍型,其中單倍型H6共4例,H7共1例,H8共1例。以單倍型H6為參考,其與H7以及H8之間的容差均為18。所有樣本之間僅3個Y-STR基因座(DYS391、DYS438、GATA-H4)分 型 一 致,在DYS458基因座中檢出分型14.1(H6)、18(H7)、17(H8),其余基因座之間的突變步長在1~8步不等,其中DYS385基因座突變步長最高為8步。6例樣本分別屬于3種Y-SNP單倍群,其中單倍型為H6的所有個體均屬于N1b-F2930單倍群;H7和H8單倍型的個體分別歸屬于單倍群C1-F3393和O2a1c1-F18。在圖3C中3種Y-STR單倍型各自聚在一起,且分別屬于不同的Y-SNP單倍群。
P4家系5例男性樣本共檢出2種Y-STR單倍型,其中單倍型H9共3例,H10共2例。2種單倍型之間的容差為10。所有樣本之間有8個Y-STR基因座(DYS391、DYS439、DYS447、DYS456、DYS533、DYS576、DYS385、DYS389I/II)的突變步長為1步,1個基因座(DYF387S1)的突變步長為2步,DYS449基因座檢出分型32(H9)、30.2(H10),其余16個基因座(DYS19、DYS390、DYS392、DYS393、DYS437、DYS438、DYS444、DYS448、DYS458、DYS460、DYS481、DYS508、DYS635、DYS643、GATA-H4、DYS518)分型一致。5例樣本Y-SNP單倍群均屬于O1a1a-M307.1。在圖3D中,分別屬于2種單倍型的個體聚在一起,容差為7。
本研究構建的Y-SNP體系共篩選74個Y-SNP位點,包含核心體系及O體系兩組子體系。該體系準確性達100%,重復性好,最低DNA檢出量為0.14 ng;適用于常用檢材的檢測;在男女組分混合比例為1∶100時仍可檢出男性的完整分型,可用于混合斑的檢測;在非人源DNA中,由于黑猩猩與人類的Y染色體非重組區(qū)域相似性達98.3%[18],恒河猴與人類基因組有93%同源性[19],所以僅在兩者DNA中檢出少許位點峰,但難以判別其單倍群,無實際意義。Y-SNP體系可用于男性樣本Y-SNP單倍群的檢測。
來自同一父系的樣本Y單倍群類型相同,不同單倍群類型的樣本可排除來自同一父系。本研究篩選的Y-SNP位點其突變發(fā)生時間最近可追溯至2000年前(https://www.yfull.com/chart/tree/),以本體系所選位點判斷的單倍群可回溯至80代(按照25年/代計算)。目前通常在家系調查或排查大家系時,Y-STR可追溯至2~10余代共同祖先[8],本體系在應用時可完全覆蓋。當兩個體間Y-STR單倍型與Y-SNP單倍群均相同時,不排除來自同一父系,如本文中的P1家系;反之,當Y-STR單倍型與Y-SNP單倍群均不同時則可排除來自同一家系,如本文中的P3家系中的H7、H8個體。Lkhagvasuren等[14]同樣通過2個個體間Y-STR單倍型與Y-SNP單倍群均不同,排除了2個個體源自同一父系。由于兩個體間親緣關系較遠,減數(shù)分裂次數(shù)較多導致其YSTR單倍型容差可能稍大,采用常用標準閾值可能導致錯誤排除,如本文中P2家系的H2單倍型個體與H4、H5單倍型個體之間分別為9級親緣關系和5級親緣關系,容差分別為4和5,但該家系成員均屬于同一Y-SNP單倍群,因此不能簡單地依據(jù)常用標準閾值排除該家系成員來自同一父系。有研究表明,在考慮遠親關系時,用于家系排查的標準應適當上調,如兩個體間25個Y-STR基因座的容差閾值3可調整為4[20]。Y-SNP單倍群在Y-STR發(fā)生突變難以判斷時起到重要的輔助判斷作用。同時,在家系排查時,需注意家系成員中是否存在收養(yǎng)、抱養(yǎng)、入贅、非婚生子女等情況,避免家系排查的結果與家系調研的成員所屬親緣關系不符。
然而值得注意的是,由于Y-SNP單倍群在不同人群中頻率分布不同,兩個體之間可能出現(xiàn)Y-STR單倍型相差較大,但因抽樣隨機性而同屬相同YSNP單倍群的情況。在實際應用中若樣本所屬單倍群在人群中分布頻率較高,則可能會出現(xiàn)不排除的結論,這就要求在應用時需了解單倍群分布頻率數(shù)據(jù)。如本文中的P4家系,在排查時應謹慎。在20個Y-SNP主干單倍群中,約75%的中國人可歸為單倍群O-M175[21],該單倍群的3個主要下游:單倍群O1a-M119主要分布在中國東南沿海、侗傣族群以及臺灣原住民[22-24];單倍群O1b-M268在中國的東部、南部以及北部的漢族[13]中均有分布;單倍群O2-M122主要分布在中國的漢族(南方漢族約占53.72%,北方漢族約占52.06%),其下游3個主要支系O2a1b-002611、O2a2b1-M134、O2a2b1a1-M117各占漢族的16.9%、11.4%、16.3%[13,25]。P4家系成員所屬的Y-SNP單倍群O1a1a-M307.1為單倍群O1a-M119的下游分支,單倍群O1a1a在中國東部(22.2%)、南部(12.3%)、北部(1.6%)的漢族均有分布[13]。因此,相同Y-SNP單倍群的男性個體可能來自于不同父系。Y-SNP單倍群分支越精細,分布越局限,則越可能區(qū)分親緣關系較近的人群。如單倍群O1a-M119的下游O1a2-M110分布于中國臺灣(34.1%)、菲律賓(12.8%)、東南亞群島的中部和東部(2.5%和9.7%),而在東亞和東南亞的大陸以及東南亞群島的西部未見分布[24,26]。
同時,在本文中的4個家系中,在DYS458和DYS449基因座上檢出了微變異等位基因(14.1、30.2)。非整數(shù)與整數(shù)(例如31→30.2)STR等位基因之間的突變機制不同于滑動鏈錯配模式,其通常是因堿基缺失導致。這類突變的概率低于STR平均突變率,而高于SNP突變率[27-28]。因此,屬于同一父系的成員發(fā)生此類突變的幾率較低。
綜上所述,本文構建的Y-SNP體系可用于實際案件樣本檢測以及家系排查。在家系排查中,由于Y-STR的高突變率,Y-STR難以用于相隔三代以上的父系親緣關系判定[29],而Y-SNP單倍群可起到對Y-STR單倍型結果的補充和驗證的作用,Y-SNP與Y-STR遺傳標記和網(wǎng)絡圖的聯(lián)用,可提高家系排查的準確率,為案件的偵查提供相應線索。