徐沖沖 ,王 上 ,魏 巍 ,張 檸 ,黎 寬 ,連心情 ,王詩旭 ,周雪梅 ,盧曉筱 ,鐘樹榮
(1)昆明醫(yī)科大學(xué)法醫(yī)學(xué)院,云南 昆明 650500;2)北京市公安局法醫(yī)中心,北京 100192;3)北京通達(dá)首誠司法鑒定,北京 100089;4)昆明醫(yī)科大學(xué)司法鑒定中心,云南 昆明 650500)
短串聯(lián)重復(fù)序列(short tandem repeat,STR)也稱微衛(wèi)星DNA 或簡單串聯(lián)重復(fù)序列,是由2~6 bp 串聯(lián)重復(fù)單位組成的DNA 片段,約占人類基因組的5%,其中大部分位于非編碼區(qū)[1]。STR 基因座具有遺傳多態(tài)性高等特點,是法醫(yī)DNA 分型的主流遺傳標(biāo)記。目前已開發(fā)了多種包含不同STR 基因座的復(fù)合擴增體系,極大地促進(jìn)了STR 遺傳標(biāo)記在法醫(yī)學(xué)中的應(yīng)用[2-3]。
苗族是云南省少數(shù)民族中人口較多的民族之一。根據(jù)《2021 年云南統(tǒng)計年鑒》[4],2020 年云南省苗族總?cè)丝跒?25.36 萬人,占云南少數(shù)民族總?cè)丝诘?.02%,主要分布在文山、紅河等地區(qū)(http://stats.yn.gov.cn)。文山紅河地區(qū)位于我國西南邊陲云南省東南部,其東鄰廣西壯族自治區(qū)百色市,西臨玉溪和普洱地區(qū),北接昆明和曲靖市,南部與越南接壤。文山紅河地區(qū)苗族人群極具跨境民族特色,有著獨特的群體遺傳結(jié)構(gòu)特征,與其他群體間存在復(fù)雜的關(guān)聯(lián),因此研究其遺傳多態(tài)性對該地區(qū)苗族人群的法醫(yī)學(xué)應(yīng)用和群體遺傳學(xué)研究具有重要意義。本研究采用PowerPlex?21試劑盒對文山紅河地區(qū)苗族人群2 209 例無關(guān)個體20 個常染色體STR 基因座的遺傳多態(tài)性進(jìn)行調(diào)查,旨在了解該地區(qū)苗族群體的遺傳背景和遺傳結(jié)構(gòu),為法醫(yī)DNA 分析和群體遺傳研究提供基礎(chǔ)數(shù)據(jù)。
根據(jù)知情同意原則,收集云南省文山壯族苗族自治州和紅河哈尼族彝族自治州2 209 例無關(guān)健康苗族個體的口腔拭子或血樣。
采用Chelex-100 法提取樣本DNA,并置于-20 ℃冰箱保存。采用PowerPlex?21 System 試劑盒(Promega 公司,美國),并使用ABIVeriti?PCR 儀(AB 公司,美國)對20 個常染色體STR 基因座(D3S1358、D1S1656、D6S1043、D13S317、Penta E、D16S539、D18S51、D2S1338、CSF1PO、Penta D、TH01、vWA、D21S11、D7S820、D5S818、TPOX、D8S1179、D12S391、D19S433和FGA)進(jìn)行復(fù)合擴增。每批次待測樣本以標(biāo)準(zhǔn)品2800M 作為質(zhì)控的陽性對照,ddH2O 作為陰性對照。用Applied Biosystems?3130 遺傳分析儀(AB 公司,美國)對PCR 擴增產(chǎn)物進(jìn)行毛細(xì)管電泳分離,采用GeneMapper? ID v3.2 軟件(AB 公司,美國)進(jìn)行基因分型。STR 分型和命名遵循國際法庭科學(xué)遺傳學(xué)會(ISFG)的命名原則。
使用Modified-Powerstats 軟件計算20 個常染色體STR 基因座的等位基因頻率(allele frequency,AF)、隨機匹配概率(matching probability,Pm)、觀測值雜合度(observed heterozygosity,Ho)、多態(tài)性信息含量(polymorphism information content,PIC)、個體識別概率(discrimination power,DP)、非父排除概率(probability of exclusion,PE)、親權(quán)指數(shù)(paternity index,PI)等法醫(yī)學(xué)參數(shù),并對各基因座進(jìn)行 Hardy-Weinberg 平衡檢驗,采用Bonferroni 多重校正,以P< 0.002 5 為差異有統(tǒng)計學(xué)意義。計算累積個人識別概率(cumulative discrimination power,CDP)和累積非父排除率(cumulative probability of exclusion,CPE)。使用Arlequin v3.5 軟件[5]計算文山紅河地區(qū)苗族與24個已發(fā)表群體[6-29]的遺傳分化指數(shù)(Fst)和P值,經(jīng)Bonferroni 多重校正,P< 0.003 3 為差異有統(tǒng)計學(xué)意義。使用Phylip 3.69 軟件包計算Nei's 標(biāo)準(zhǔn)遺傳距離(http://evolution.genetics.washington.edu/phylip.html)。基于Nei's 遺傳距離,使用Mega 7.0 軟件[29]構(gòu)建25 個群體的相鄰連接(neighboringjoining,N-J)系統(tǒng)發(fā)育樹,并采用SPSS v24.0 統(tǒng)計軟件(IBM 公司,美國)進(jìn)行多維尺度(multidimensional scaling,MDS)分析。
文山紅河地區(qū)苗族2 209 例無關(guān)個體20 個常染色體STR 基因座的等位基因頻率及法醫(yī)學(xué)參數(shù)見表1 和表2。共檢出265 個等位基因和1 080 種基因型,等位基因頻率分布范圍為0.000 2~ 0.571 8(D13S317),各基因座等位基因數(shù)目為7(D3S1358)~25(FGA)。對20 個STR 基因座進(jìn)行Hardy-Weinberg 平衡檢驗,經(jīng)Bonferroni 校正,各基因座等位基因頻率和基因型頻率分布均符合Hardy-Weinberg 平衡定律(P> 0.05/20=0.002 5)。20 個STR 基因座的法醫(yī)學(xué)參數(shù)如下:Pm 和Ho值的范圍分別為0.013 2(Penta E)~0.232 2(TPOX)和0.571 1(TPOX)~0.903 1(Penta E),PIC 值的范圍為0.521 1(TPOX)~0.910 8(Penta E)。DP 值的范圍為0.767 8(TPOX)~0.986 8(Penta E),CDP值為0.999 999 999 999 999 999 999 932 674 151。PE 值的范圍為0.257 6(TPOX)~0.801 8(Penta E),計算該分型系統(tǒng)的CPE 值達(dá)0.999 999 935 545 335。
表1 文山紅河地區(qū)苗族群體20 個STR 等位基因頻率分布(n=2 209)(1)Tab.1 Allele frequency distribution of 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)(1)
表1 文山紅河地區(qū)苗族群體20 個STR 等位基因頻率分布(n=2 209)(2)Tab.1 Allele frequency distribution of 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)(2)
表2 文山紅河地區(qū)苗族人群20 個STR 基因座法醫(yī)學(xué)參數(shù)(n=2 209)Tab.2 Forensic parameters for 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)
文山紅河苗族和24 個其他群體的Fst 值和P值見表3。經(jīng)Bonferroni 校正(P< 0.05/15≈0.003 3),文山紅河苗族與新疆喀什維吾爾族、云南佤族、越南京族、印度安得拉人、廣西侗族、西藏昌都藏族、長春漢族、廣東梅州客家人、云南哈尼族、新疆阿勒泰漢族、山東濟寧漢族、重慶漢族和新疆伊犁維吾爾族之間有統(tǒng)計學(xué)差異的基因座數(shù)目最多,有15 個;其次為海南黎族、廣東漢族、愛沙尼亞人、云南漢族和四川漢族,有14 個;與新疆維吾爾族、貴州仡佬族、重慶萬州漢族和云南布朗族在13 個基因座上存在差異;與北意大利人和云南越南人群的差異基因座數(shù)目分別為5 個和4 個。
表3 文山紅河苗族與24 個參考群體的Fst 值和P 值(1)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(1)
表3 文山紅河苗族與24 個參考群體的Fst 值和P 值(2)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(2)
表3 文山紅河苗族與24 個參考群體的Fst 值和P 值(3)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(3)
根據(jù)本研究群體與24 個已報道人群的群體數(shù)據(jù)計算得到Nei's 標(biāo)準(zhǔn)遺傳距離矩陣,見表4。其中,文山紅河苗族與云南越南人群的遺傳距離最小(0.026 537),與愛沙尼亞人群的遺傳距離最大(0.904 458)。通過構(gòu)建NJ 系統(tǒng)發(fā)育樹進(jìn)一步剖析這些群體的遺傳關(guān)系,結(jié)果顯示文山紅河苗族與云南越南人群聚為一支,見圖1。基于Nei's 遺傳距離進(jìn)行MDS 分析,同樣觀察到文山紅河苗族與云南越南人群相距較近,而與愛沙尼亞人群相距較遠(yuǎn)。此外,不同地區(qū)的漢族和維吾爾族分別聚為一簇,見圖2。
圖1 基于Nei’s 遺傳距離構(gòu)建的文山紅河苗族與24 個參考群體的NJ 系統(tǒng)發(fā)育樹Fig.1 The phylogenetic tree based on Nei’ s genetic distances between Wenshan and Honghe Miao and 24 reference populations
圖2 基于Nei’s 遺傳距離對文山紅河苗族與24 個參考群體的MDS 分析Fig.2 Multidimensional Scaling(MDS)analysis based on Nei’ s genetic distances between Wenshan and Honghe Miao and 24 reference populations
表4 文山紅河苗族與24 個參考群體的Nei's 遺傳距離Tab.4 Nei’s standard genetic distances between Wenshan and Honghe Miao and 24 reference populations
本研究報告了文山紅河地區(qū)苗族人群20 個常染色體STR 基因座的等位基因頻率和相關(guān)法醫(yī)學(xué)參數(shù),評估了PowerPlex?21 系統(tǒng)在該人群中的法醫(yī)學(xué)應(yīng)用價值。PowerPlex?21 分型系統(tǒng)是一種廣泛使用的商業(yè)試劑盒,該試劑盒包含DNA 聯(lián)合索引系統(tǒng)(CODIS)推薦的17 個位點,還增加了Penta E,D6S1043和Penta D基因座。DP 和PE 值反映STR 分型系統(tǒng)在個體識別和親權(quán)鑒定中的能力,一般認(rèn)為DP > 0.80、PE > 0.50 的基因座具有高鑒別能力。本研究中,Penta E,D6S1043和Penta D3 個基因座的DP 和PE 值分別為0.986 8,0.971 1,0.932 7 和0.801 8,0.715 7,0.585 5,可見這些基因座屬于高度多態(tài)性。在所有20 個基因座中,Penta E的Pm 值最小,DP、PIC、PE、Ho 值最大。分析國內(nèi)外其他群體發(fā)現(xiàn),該基因座具有極高的鑒別力和多態(tài)性,法醫(yī)學(xué)應(yīng)用價值較高[6-11]。本研究群體在20 個STR 基因座的CDP和CPE 分別高達(dá)0.999 999 999 999 999 999 999 932 674 151 和0.999 999 935 545 335,這表明PowerPlex?21 復(fù)合擴增體系在文山紅河苗族人群中具有極高的系統(tǒng)效能,可用于該地區(qū)苗族人群的個體識別和親權(quán)鑒定。
遺傳距離是表征群體間遺傳異質(zhì)性或遺傳分化的重要指標(biāo),本研究通過計算群體間遺傳分化指數(shù)Fst 值和Nei's 遺傳距離,構(gòu)建N-J 系統(tǒng)發(fā)育樹和MDS 分析,探索了文山紅河苗族人群與其他24 個群體之間的遺傳關(guān)系。結(jié)果表明文山紅河地區(qū)苗族與云南越南人群的親緣關(guān)系較近。文山紅河地區(qū)的馬關(guān)、金平、屏邊、河口等縣與越南北部的河江、老街、萊州等?。ㄊ校┙尤?。在邊境線上跨界而居的民族很多,包括文山紅河地區(qū)的苗、彝、壯等民族,以及越南北部的越(京)、赫蒙(苗)等民族[29]。由于長期跨界而居,中越邊境民族互相通婚,彼此形成了“民族共宗,文化同源,江河同流”等特點[29]。這可能是文山紅河苗族與云南越南人群親緣關(guān)系較近的原因之一。方玲等[30]分析了不同民族線粒體DNA 中9 bp 重復(fù)序列的缺失頻率,結(jié)果表明中國南方苗族人群與越南人群在遺傳上有較為密切的關(guān)系,本研究從常染色體STR 的角度驗證了前人的研究結(jié)果。此外,不同地區(qū)的漢族群體(云南漢族、重慶漢族、四川漢族、廣東漢族、山東漢族、新疆漢族和長春漢族)以及3 個維吾爾族群體(新疆伊犁維吾爾族、新疆維吾爾族和新疆喀什維吾爾族)分別聚為一簇,彼此間遺傳關(guān)系較為密切,證明了不同地區(qū)同一民族在共同起源上的潛在關(guān)聯(lián),說明常染色體STR 遺傳標(biāo)記在評價群體遺傳結(jié)構(gòu)和族源推斷方面具有一定作用[31-33]。
本研究報告了文山紅河地區(qū)苗族人群2 209例無關(guān)個體20 個常染色體STR 基因座的等位基因頻率及法醫(yī)學(xué)參數(shù)。結(jié)果表明,20 個常染色體STR 基因座在文山紅河苗族人群中具有較高的遺傳多態(tài)性和較好的系統(tǒng)效能,可滿足法醫(yī)學(xué)個體識別和親權(quán)鑒定,亦可為群體遺傳學(xué)研究提供基礎(chǔ)數(shù)據(jù)。