趙佩翔,陳鵬宇,余麗梅
(1.遵義醫(yī)科大學(xué)附屬醫(yī)院 貴州省細(xì)胞工程重點(diǎn)實(shí)驗(yàn)室,貴州 遵義 563099;2.遵義醫(yī)科大學(xué)附屬醫(yī)院 司法鑒定中心,貴州 遵義 563099)
短串聯(lián)重復(fù)序列(Short tandem repeat,STR)分型技術(shù)具有高靈敏度、高鑒別能力、高種屬特異性、結(jié)果高度準(zhǔn)確性、易于標(biāo)準(zhǔn)化等特點(diǎn),如今已作為個(gè)人識(shí)別以及親權(quán)案件中的鑒定金標(biāo)準(zhǔn)。自1997年美國(guó)FBI設(shè)立聯(lián)合檢索系統(tǒng)(Combined DNA Index System,CODIS)以來(lái),STR就作為第二代遺傳標(biāo)記并沿用至今。近年以來(lái),CODIS核心基因工作組(CODIS core Loci Working Group)對(duì)核心基因座進(jìn)行了補(bǔ)充,增加了7個(gè)核心基因座(包括D2S1338、D19S433、D1S1656、D12S391、D2S441、D10S1248以及DYS391),并且剔除了TPOX基因座形成了19個(gè)新的CODIS核心基因座[1]。
與性染色體相比,23對(duì)常染色體中已經(jīng)發(fā)現(xiàn)并應(yīng)用的STR位點(diǎn)數(shù)量十分龐大,聯(lián)合PCR-STR技術(shù)能夠提供大量基因座的等位基因信息,在這樣的復(fù)合擴(kuò)增系統(tǒng)中累計(jì)個(gè)人識(shí)別力(the combined power of discrimination,CPD)及累計(jì)非父排除率(the combined power of exclusion,CPE)都能滿足司法鑒定的系統(tǒng)效能要求,從而為法醫(yī)物證檢案提供可靠豐富的數(shù)據(jù)來(lái)源[2]。同時(shí),在親權(quán)案件中,性染色體STR主要作為輔助指標(biāo),選擇性染色體也會(huì)受到被鑒定人的性別的影響,常常較局限,而常染色體STR適用大部分親權(quán)鑒定案件類(lèi)型,是公安、司法鑒定中心以及第三方檢測(cè)機(jī)構(gòu)在刑事偵查、親權(quán)鑒定、個(gè)人識(shí)別等法醫(yī)物證領(lǐng)域首選的遺傳標(biāo)記。
實(shí)際工作中發(fā)現(xiàn),貴州漢族人群中STR等位基因是具有良好的多態(tài)性[3],同時(shí)STR的突變也時(shí)有發(fā)生,其實(shí)質(zhì)是STR的等位基因在親代與子代之間不符合遺傳規(guī)律的現(xiàn)象。理論上,親權(quán)鑒定案件當(dāng)中選用的STR基因座突變率較低,這是因?yàn)榛诤⒆优c親代的等位基因在遺傳過(guò)程中能夠保持穩(wěn)定遺傳的假設(shè),通常每1 000減數(shù)分裂發(fā)生1~4次突變[4](突變率為0.1%~0.4%)。然而在計(jì)算累計(jì)親權(quán)指數(shù)(Combined paternity index,CPI)時(shí)必須考慮STR突變的影響,因?yàn)榈任换虻耐蛔兛赡軙?huì)使CPI達(dá)不到行業(yè)認(rèn)定標(biāo)準(zhǔn),鑒定人員將無(wú)法給出肯定的判定意見(jiàn),甚至在13個(gè)CODIS基因座基礎(chǔ)上,不斷增加到15、19、23個(gè)常染色體STR基因座,也不能完全得到支持或不支持的親權(quán)關(guān)系鑒定意見(jiàn),對(duì)日常工作造成了不能回避的風(fēng)險(xiǎn)[5-7],應(yīng)該引起司法鑒定科研人員的重視。此外后天環(huán)境或疾病因素導(dǎo)致STR分型結(jié)果發(fā)生改變已經(jīng)為研究所證實(shí),這些原因?qū)?duì)法醫(yī)學(xué)判斷突變?cè)斐梢欢ǖ挠绊?。因此,在親權(quán)鑒定中,必須了解STR突變的國(guó)內(nèi)外研究進(jìn)展,本文從突變機(jī)制與模式、突變特征、主要影響因素以及最大連續(xù)同一重復(fù)次數(shù)(longest run of perfect repeats,LRPR)、雜合性丟失等綜述了常染色體STR突變的研究進(jìn)展,為法醫(yī)物證的準(zhǔn)確判斷和科學(xué)研究提供理論參考。
目前廣大學(xué)者普遍接受的STR突變機(jī)制最適宜的解釋是DNA復(fù)制滑動(dòng)(replication slippage)或稱滑動(dòng)錯(cuò)配,即若雙鏈DNA的堿基構(gòu)成近似的情況下,在DNA復(fù)制過(guò)程中雙鏈分離時(shí),STR的重復(fù)區(qū)域內(nèi)容易出現(xiàn)一個(gè)或數(shù)個(gè)堿基錯(cuò)配的重復(fù)區(qū)域的環(huán)狀結(jié)構(gòu),這種因?yàn)殄e(cuò)配形成的堿基環(huán)可能導(dǎo)致新生鏈堿基數(shù)目的增加或減少,表現(xiàn)為重復(fù)單位的插入或缺失,這與重復(fù)單位的側(cè)翼序列、重復(fù)單位及待擴(kuò)增等位基因的長(zhǎng)度有關(guān)。另外發(fā)生在染色體聯(lián)會(huì)時(shí)期的不等交換(unequal crossing over)也可能在STR突變中產(chǎn)生一定作用,但就STR突變而言DNA滑動(dòng)錯(cuò)配比不等交換更常見(jiàn)[8]。
逐步突變模式(Stepwise mutation model,SMM)是STR突變模式中的重要支持理論,即認(rèn)為STR的突變是以一步突變?yōu)橹?,多步突變是在一步突變的基礎(chǔ)上逐步形成,突變的步數(shù)越多,相對(duì)發(fā)生的機(jī)會(huì)也就越小,每次STR突變按照一定的突變幾率增加或者減少一個(gè)重復(fù)單位[1,4]。事實(shí)上逐步突變理論存在一定缺陷,根據(jù)該理論假說(shuō),在一定的突變幾率下STR可以無(wú)限增減重復(fù)單位,但在實(shí)際研究點(diǎn)突變與復(fù)制滑動(dòng)機(jī)制關(guān)系中發(fā)現(xiàn),在低于復(fù)制滑動(dòng)閾值(5 ~9個(gè)重復(fù)單位)時(shí),點(diǎn)突變?yōu)橹鲗?dǎo)突變機(jī)制,而在較長(zhǎng)的重復(fù)序列長(zhǎng)度(大于10個(gè)重復(fù)單位)中,復(fù)制滑動(dòng)機(jī)制占主導(dǎo)地位。因此,在STR的突變中以滑動(dòng)錯(cuò)配和逐步突變?yōu)橹饕獧C(jī)制。
3.1 突變率是研究突變的首要指標(biāo) 突變率是突變案件中親權(quán)判定的重要指標(biāo),對(duì)鑒定結(jié)果的判定有著重要的意義。目前國(guó)內(nèi)外關(guān)于STR突變分析研究中都首先報(bào)道各基因座突變率,民族不同,基因座突變率也不同,甚至在某些基因座中突變率相差較大[2]。比較中國(guó)西南、南、北方三個(gè)地區(qū)漢族突變率,發(fā)現(xiàn)這些地區(qū)突變率最高的基因座依次是FGA、D18S51和Penta E,突變率較低都是TPOX和TH01基因座[9]??梢?jiàn),突變率較直觀反應(yīng)被研究群體的突變特征的指標(biāo)。但是突變率的計(jì)算與觀察依然與樣本量的選擇有著直接的關(guān)系,關(guān)于突變的研究已有不少報(bào)道,但是對(duì)總樣本量的選擇上卻有很大出入,這使得通過(guò)減數(shù)分裂次數(shù)計(jì)算的突變率差異會(huì)較大,不排除存在假陽(yáng)性和假陰性的計(jì)算結(jié)果。
3.2 核心序列特征 STR突變的另一個(gè)主要特征表現(xiàn)在核心序列上,即基序(Motif)的變化特征,基序是指重復(fù)序列堿基組成的形式,STR突變通常表現(xiàn)為基序的插入或缺失。研究發(fā)現(xiàn),常染色體STR的突變,主要以一步突變?yōu)橹鳎嗖酵蛔儙茁氏鄬?duì)較小,同時(shí)需值得一提的是即便是單基因座三步以上突變的案例在鑒定意見(jiàn)的撰寫(xiě)時(shí)需考慮回避風(fēng)險(xiǎn)。另外在一步突變中插入/缺失突變比例在不同人群中差異卻較大,如廣州中山漢族人群該比例為1.2∶1(n=376)[10],而浙江杭州漢族人群則為1.7∶1(n=195)[11],同樣在云南昆明漢族人群插入/缺失比例沒(méi)有顯著差異[12]。也有研究觀察到突變次數(shù)最大的FGA基因座發(fā)生突變高達(dá)25次,較小的等位基因表現(xiàn)為基序的插入突變,較大的等位基因傾向于基序的缺失突變,這種現(xiàn)象在Y-STR中也有類(lèi)似研究報(bào)道[7]。因此,STR突變?cè)谕蛔儾綌?shù)、插入/缺失比例、突變趨勢(shì)有著自己獨(dú)特的特征,而這些特征在不同的人群中有著一定的差異,一定程度上可以間接地反應(yīng)的群體多態(tài)性的特征。
在突變研究中,除了對(duì)群體的突變率、突變特征之外,還需要進(jìn)一步考慮影響STR突變的主要影響因素,如民族、地理環(huán)境、雜合度、等位基因長(zhǎng)度及親代的年齡、性別,甚至需要考慮細(xì)胞的分裂活躍程度與腫瘤等疾病狀態(tài)等許多因素的作用[13]。
4.1 民族與地域不同會(huì)導(dǎo)致突變存在差異 人類(lèi)走出非洲大陸,經(jīng)過(guò)了數(shù)次大規(guī)模的遷移活動(dòng),隨著時(shí)間的變遷,如今人類(lèi)已經(jīng)遍布了全世界的每一個(gè)角落。然而相同地區(qū)不同民族,不同地區(qū)同一民族或者不同地區(qū)不同民族的人群會(huì)因?yàn)槠涞乩憝h(huán)境、民族風(fēng)俗的差異而被相對(duì)隔離在相對(duì)穩(wěn)定的區(qū)域內(nèi),與其它地域內(nèi)人群相比,既可能存在因祖輩累計(jì)遺傳的某些特定基因的差異,也可能存在民族之外的地域?qū)z傳及突變所造成的突變率、STR核心序列、重復(fù)次數(shù)等特征的改變。國(guó)內(nèi)外研究發(fā)現(xiàn)多維標(biāo)度(Multidimensional scaling)圖能夠?qū)⒌乩砦恢孟鄬?duì)靠近的人群與其它相對(duì)較遠(yuǎn)的人群區(qū)分開(kāi),反應(yīng)出地理位置遠(yuǎn)近與人群STR基因特征存在的差異[14-15]。同時(shí)需要注意的是,現(xiàn)階段的突變分析僅是針對(duì)某一時(shí)段內(nèi)某一地區(qū)的某一人群內(nèi)進(jìn)行研究,隨著人口的遷移,交通日趨發(fā)達(dá),城市規(guī)模逐漸擴(kuò)大乃至國(guó)際通婚率的提高,STR突變分析也應(yīng)是一個(gè)隨著時(shí)間推移不斷更新的復(fù)雜動(dòng)態(tài)過(guò)程。
4.2 雜合度與突變率的相關(guān)關(guān)系 雜合度(Heterozygosity)是指在群體中某個(gè)遺傳標(biāo)記的全部基因型中雜合子所占的比例,除了用于群體多態(tài)性研究,同樣也用于等位基因突變的相關(guān)分析,雜合度越大表明該基因座在法醫(yī)應(yīng)用中的價(jià)值越大。研究發(fā)現(xiàn),各個(gè)基因座的期望雜合度(Expected heterozygosity,He)與該基因座突變率存在一定正相關(guān)關(guān)系[16],即期望雜合度越大的基因座,突變率也就越高,我們知道期望雜合度的計(jì)算公式為(n為樣本中等位基因或單倍型的總數(shù),k為等位基因或單倍型的數(shù)目,pi為樣本中等位基因或者單倍型的頻率)。通過(guò)公式就能直觀的反應(yīng),等位基因pi值應(yīng)該符合該地區(qū)等位基因分布理論頻率,而研究總?cè)后w的等位基因總數(shù)n的大小也對(duì)雜合度有重要影響。但在研究過(guò)程中,有不少研究人員僅統(tǒng)計(jì)了一個(gè)商品化STR試劑盒的突變案例,在樣品量不夠大的情況下,會(huì)發(fā)現(xiàn)很多基因座的突變率計(jì)算結(jié)果相等,而加上各個(gè)基因座雜合度差異不是很大,因而很難得出二者相關(guān)關(guān)系的有效證據(jù)。
4.3 LRPR與突變率的相關(guān)關(guān)系 LRPR實(shí)質(zhì)是指計(jì)算基因座核心序列能完整或完全重復(fù)的次數(shù),如某基因座的等位基因有9、10、10.1、12.3,則LRPR記為9、10、10、12。在法醫(yī)學(xué)中,由于樣本來(lái)源不同或樣本例數(shù)的限制,所得到的STR某基因座的等位基因也會(huì)不盡相同,那么LRPR取值也將不同,研究中通常取某基因座全部LRPR的幾何均數(shù)(geometric mean of the longest run of perfect repeats,GEO),發(fā)現(xiàn)該幾何均數(shù)與對(duì)應(yīng)基因座的突變率存在一定相關(guān)關(guān)系[17]。LRPR的幾何均數(shù)值越大,可以理解為核心序列完整重復(fù)次數(shù)越多,對(duì)應(yīng)基因座的突變率越高。
4.4 父源性突變顯著大于母源性突變 親代性別作為影響因素的實(shí)質(zhì)是判斷STR突變來(lái)源,根據(jù)《親權(quán)鑒定技術(shù)規(guī)范》(SF/Z JD0105001-2016)規(guī)定,在累計(jì)親權(quán)指數(shù)大于10 000的情況下,可給予支持符合親權(quán)關(guān)系的結(jié)論,則案件中不符合遺傳規(guī)律的基因座可視為STR發(fā)生突變,隨即需要判斷突變來(lái)源,在三聯(lián)體案件中,通常根據(jù)新產(chǎn)生的等位基因與父親、母親的等位基因比較,將距突變等位基因差異最小的一方基因定為子代等位基因的突變來(lái)源,若差異相同,則無(wú)法確定來(lái)源,所以STR突變來(lái)源可以分為“來(lái)自父親”“來(lái)自母親”和“無(wú)法確定”3種情況。大量研究已經(jīng)明確“來(lái)自父親”的突變顯著高于“來(lái)自母親”的突變[18]。這是因?yàn)槁?精)原細(xì)胞在形成卵母細(xì)胞和精細(xì)胞之前都會(huì)有DNA的復(fù)制以及細(xì)胞有絲分裂過(guò)程,再經(jīng)過(guò)減數(shù)分裂形成配子,成年男性精子有絲分裂的次數(shù)顯著高于性成熟的女性個(gè)體,使得男性生殖細(xì)胞DNA復(fù)制量最高可比女性生殖細(xì)胞的DNA復(fù)制量高出數(shù)十倍,意味著男性在配子形成過(guò)程中STR基因座發(fā)生突變的機(jī)會(huì)顯著高于女性。同時(shí),也有研究報(bào)道,精細(xì)胞上的PEDM9基因控制基因重組的過(guò)程,并與減數(shù)分裂不穩(wěn)定性有關(guān)[19-20],這種潛在的機(jī)制很可能是父源突變率高的根本原因之一。
4.5 親代年齡與突變 親代年齡主要指孩子出生時(shí)父母的實(shí)際年齡,也是STR突變中的重要影響因素,在精細(xì)胞形成過(guò)程中年齡較大的被檢父會(huì)經(jīng)歷更多的細(xì)胞分裂,DNA復(fù)制次數(shù)也更多,相對(duì)發(fā)生突變的幾率也會(huì)增大,在實(shí)際親子鑒定案例中,統(tǒng)計(jì)發(fā)現(xiàn)隨著被檢父年齡的增大,突變率也在不斷增加,二者呈現(xiàn)高度相關(guān)關(guān)系(︱r︱=0.99)[12]。而在母源性突變中很難見(jiàn)到隨著年齡增長(zhǎng)突變率遞增的趨勢(shì)。
沉默基因(silent allele)的產(chǎn)生可能會(huì)導(dǎo)致雜合性丟失(loss of heterozygosity,LOH)的發(fā)生,即基因組正常的一對(duì)等位基因發(fā)生了某種變化,使得其中一條等位基因在擴(kuò)增時(shí)丟失。Akiko Tsuji等人在研究D19S433基因座中發(fā)現(xiàn)[21],測(cè)序結(jié)果顯示孩子D19S433基因座為重復(fù)序列下游第32個(gè)核苷酸發(fā)生了G→A點(diǎn)突變,而STR分型結(jié)果為15的純合子,與父親13,13、母親14,15的STR分型結(jié)果的遺傳規(guī)律不符合,可能被誤判為STR的突變,而導(dǎo)致錯(cuò)誤的PI計(jì)算。有研究對(duì)類(lèi)似情況的STR基因座峰高進(jìn)行了仔細(xì)比較后發(fā)現(xiàn),由于D19S433的等位基因大小101~148bp,vWA等位基因大小為151~203bp,兩者大小較接近,故而D19S433的總峰高與vWA的總峰高接近(樣本為雜合子,峰高取兩峰高總和),當(dāng)D19S433出現(xiàn)沉默基因,導(dǎo)致LOH時(shí),D19S433的峰高明顯低于vWA基因座[22]。除了早期在TH01、FGA、vWA基因座上發(fā)現(xiàn)LOH[23-25],近年來(lái)在D5S818、D13S31基因座上相繼發(fā)現(xiàn)因?yàn)槌聊騕26-27],LOH導(dǎo)致單個(gè)基因座不符合遺傳規(guī)律的報(bào)道。這種因?yàn)槌聊蛩翷OH,使得雜合子的基因型在分型中變成純合子參與親權(quán)指數(shù)的計(jì)算,勢(shì)必對(duì)鑒定意見(jiàn)產(chǎn)生影響,因此鑒定人日常工作檢案中發(fā)現(xiàn)基因座不符合遺傳規(guī)律時(shí),需警惕樣本中基因型為純合子,且峰高明顯低于同批樣本同基因座峰高,或出現(xiàn)純合子多步突變的情況時(shí)也需謹(jǐn)慎分析,避免將LOH誤判為突變。
另外,在實(shí)際檢案中很難在取材時(shí)就已明確檢材是否來(lái)源于早期實(shí)體腫瘤患者,或者其他早期惡性血液病患者,F(xiàn)iloglu G等[28]人在針對(duì)急、慢性白血病患者的STR分型研究中,經(jīng)血液和口腔分別取材,在100名患者中發(fā)現(xiàn)了2名患者存在LOH和基因不穩(wěn)定的現(xiàn)象。另一項(xiàng)在胃癌、結(jié)直腸癌、乳腺癌患者的STR分型研究中[29],采用冰凍保存和甲醛固定石蠟包埋的組織得到相同的STR分型結(jié)果,同樣發(fā)現(xiàn)了LOH的現(xiàn)象。這些研究揭示了LOH直接原因并不是STR發(fā)生了傳統(tǒng)意義的重復(fù)序列的增加或減少的突變,經(jīng)過(guò)測(cè)序技證實(shí)為單核苷酸點(diǎn)突變導(dǎo)致。
因此,在接受復(fù)雜檢案時(shí),鑒定人無(wú)法判斷檢材是否來(lái)源于健康個(gè)體,或者檢材是否經(jīng)過(guò)復(fù)雜處理,這些因素都有可能導(dǎo)致STR分型出現(xiàn)偏差,這提醒司法鑒定人在處理復(fù)雜檢材的時(shí)候需要綜合SNP、Indel及測(cè)序技術(shù)等新技術(shù)判斷,否則在親權(quán)鑒定中將LOH誤判為STR發(fā)生遺傳突變,這極有可能對(duì)案件的結(jié)論造成不能避免的錯(cuò)誤判斷。
STR基因座突變是普遍存在的現(xiàn)象,影響STR突變的因素多樣且復(fù)雜,為了確保檢案鑒定結(jié)果的準(zhǔn)確性,在親子及親緣關(guān)系鑒定中,必須全面考慮所有符合與不符合孟德?tīng)栠z傳規(guī)律的等位基因,正確分析突變,計(jì)算CPI,最終給出“支持”或者“排除”的鑒定意見(jiàn),若達(dá)不到認(rèn)定標(biāo)準(zhǔn),則需要額外增加常染色體STR基金座進(jìn)行檢測(cè),甚至將Y-STR或X-STR作為補(bǔ)充;同時(shí)也需綜合考慮檢材身源者的民族、性別、年齡和基因座的LOH及突變頻率等,尤其是特殊疾病患者或經(jīng)過(guò)特殊處理的檢材,更需謹(jǐn)慎分析STR分型結(jié)果。復(fù)雜檢案中,還可以聯(lián)合應(yīng)用SNP、Indel等遺傳標(biāo)記系統(tǒng)或二代測(cè)序技術(shù)等檢測(cè)手段,排除復(fù)雜因素的干擾,以確保鑒定結(jié)果的準(zhǔn)確性,降低誤判風(fēng)險(xiǎn)。
隨著STR突變數(shù)據(jù)的不斷積累,研究STR的突變也是對(duì)DNA數(shù)據(jù)庫(kù)的重要補(bǔ)充,有利于完善法醫(yī)物證學(xué)領(lǐng)域的理論體系,對(duì)復(fù)雜、疑難檢案的準(zhǔn)確判定具有重要指導(dǎo)意義。