摘要:探討模擬群體數(shù)和STR對(duì)同胞似然比(LR)的影響,為法醫(yī)遺傳學(xué)中LR臨界值的確定提供依據(jù),可作為參考。用家庭S3軟件模擬100~100萬(wàn)對(duì)全同胞,分別有15、19、29和39個(gè)STR,觀察似然比(LR)的分布及陽(yáng)性率、陰性率、假陽(yáng)性率、假陰性率的變化。事實(shí)證明當(dāng)模擬種群數(shù)量超過(guò)105個(gè)時(shí),LR值分別為99%、95%、5%和1%,當(dāng)模擬種群數(shù)量低于104個(gè)時(shí),LR值波動(dòng)較大,并且范圍很大。當(dāng)似然比為1時(shí),15個(gè)STR系統(tǒng)的靈敏度為98.01%~99.0%;對(duì)19個(gè)STR系統(tǒng)進(jìn)行了分析,結(jié)果為99.0% - 99.3%;29個(gè)STR系統(tǒng)占99%~99.85%;39個(gè)STR系統(tǒng)占99.93%~100%。當(dāng)似然比為1時(shí),所有被試實(shí)驗(yàn)題的假陽(yáng)性率為:15個(gè)STR系統(tǒng)的假陽(yáng)性率為1.7225,19個(gè)STR系統(tǒng)的假陽(yáng)性率為0.7370,29個(gè)STR系統(tǒng)的假陽(yáng)性率為0.1311,39個(gè)STR系統(tǒng)的假陽(yáng)性率為0.0593。當(dāng)STR基因座數(shù)變化時(shí),LR值也在變化,主要變現(xiàn)為:由15個(gè)增加到39個(gè)時(shí),LR值的中位數(shù)、均值、最大值、最小值、99%、95%、5%、5%,1%,標(biāo)準(zhǔn)差也相應(yīng)增加。從而得出模擬種群規(guī)模是影響LR分布的重要因素;在一定數(shù)量的人群中,識(shí)別系統(tǒng)在檢測(cè)系統(tǒng)中增加STR的數(shù)目,可以獲得更好更高的LR值。
關(guān)鍵詞:模擬數(shù)量變化;全同細(xì)胞;似然比
除了傳統(tǒng)的親子鑒定,他們提供的基因信息較少和被鑒定人的特殊性,對(duì)復(fù)雜的親屬關(guān)系進(jìn)行識(shí)別細(xì)胞總數(shù)有一定差距,由于能力有限,一般無(wú)法完成更多的仿真數(shù)據(jù)。因?yàn)槟壳霸诜ㄡt(yī)遺傳學(xué)領(lǐng)域沒(méi)有系統(tǒng)的公式和觀點(diǎn),所以需要更嚴(yán)謹(jǐn)、更科學(xué)的統(tǒng)計(jì)數(shù)字來(lái)確定全體同胞之間的關(guān)系。
本研究的目的是,在大樣本數(shù)據(jù)的基礎(chǔ)上進(jìn)行模擬和親合方法遺傳學(xué)中,評(píng)價(jià)不同STR系親緣關(guān)系概率的計(jì)算,總模擬量對(duì)全民辨識(shí)似然比的影響。家族3是根據(jù)DNA數(shù)據(jù)推斷親子鑒定概率計(jì)算的自由軟件,利用傳統(tǒng)的似然比可以計(jì)算和模擬最大項(xiàng)數(shù),可以模擬106對(duì)數(shù)據(jù)。本文采用家族3軟件模塊,共提出100至100萬(wàn)對(duì)全同胞,分別為15人、19人、29人和39人STR系統(tǒng)識(shí)別同胞時(shí),不同模擬數(shù)的似然比的差異。
1.材料及方法
1.1建立假設(shè)實(shí)驗(yàn)
本研究采用家庭3軟件對(duì)四種不同的STR,進(jìn)行分析模擬了100到100萬(wàn)對(duì)全同胞數(shù)據(jù),它們是:15個(gè)STR系統(tǒng)(ABI標(biāo)識(shí)符),19個(gè)STR系統(tǒng);29 STR系統(tǒng);39 個(gè)STR系統(tǒng),這些系統(tǒng)全部是商用的. 在模擬試驗(yàn)中,設(shè)置相應(yīng)的全參數(shù)同胞個(gè)體和無(wú)關(guān)個(gè)體。到目前為止,可以建立以下兩個(gè)測(cè)試假設(shè):
原始假設(shè)H0:個(gè)體1和2是同胞(在生物學(xué)方面,他們有同一個(gè)生父和同一個(gè)生母。)
備選假設(shè):個(gè)體1和個(gè)體2沒(méi)有任何關(guān)系,就是兩者之間不會(huì)同一個(gè)生父。
1.2、參數(shù)設(shè)置
模擬實(shí)驗(yàn)前,在軟件家族3中設(shè)定以下這幾個(gè)參數(shù):①忽略系統(tǒng)中等位基因的檢測(cè)突變;②群體遺傳指數(shù)設(shè)為0;③在軟件中,將先驗(yàn)參數(shù)設(shè)置為默認(rèn)值;④設(shè)定可能性比值(LR)的范圍為0.1到1×108.模擬次數(shù)為100,1×103,1×104,1×105和1×106。收集統(tǒng)計(jì)所有的模擬數(shù)據(jù),結(jié)果包括單個(gè)1和2的輸入數(shù),根據(jù)數(shù)據(jù)和模擬數(shù)據(jù)得到的平均值、中值、最大值、最小值,99%、95%、5%、1%,以及%,STEDV的LR值。當(dāng)設(shè)置在LR閾值時(shí),家族3將產(chǎn)生相應(yīng)的陽(yáng)性(敏感性)結(jié)果和假陽(yáng)性(1-特異性)結(jié)果。對(duì)于每個(gè)系統(tǒng),當(dāng)LR閾值在1到106之間時(shí)(表5-8),我們記錄了和比較了該方法的靈敏度和假陽(yáng)性率。
1.3、結(jié)果分析
為了分析似然比的分布情況,對(duì)得到的LR值進(jìn)行分類,LR的擬合線圖生成,主要由IBM SPSS 22.0.R.和Graphpad 5.0生成。K-S是用來(lái)檢測(cè)研究LR的分布情況。
2.結(jié)果
2.1、LR值的統(tǒng)計(jì)學(xué)參數(shù)和STR數(shù)量的關(guān)系
能夠看到個(gè)體1和個(gè)體2的全同胞指數(shù)(全同胞指數(shù)、FSD和LR值)。發(fā)現(xiàn)當(dāng)STR基因座數(shù)從15個(gè)增加到39個(gè)時(shí),LR值增加,包括中位數(shù)、平均值、最大值、最小值、99%,95%、5%、1%和標(biāo)準(zhǔn)偏差相應(yīng)增加(見(jiàn)圖1)。
結(jié)果表明,增加檢測(cè)系統(tǒng)中STR的數(shù)目,可以提高檢測(cè)效率,可以得到更高的LR均值和一個(gè)更大的極點(diǎn)。STDEV值隨LR的增加而增加。(表1-4)
2.2、LR值和模擬人群數(shù)量之間的關(guān)系
在一定的情況下時(shí),并且模擬種群的數(shù)量都超過(guò)1×106時(shí)(表1-4),LR的中位數(shù)、平均值和標(biāo)準(zhǔn)差增加。隨著模擬種群數(shù)量的增加,LR的最大值和最小值都會(huì)增加或減少。當(dāng)模擬總體數(shù)較少時(shí)(100到10000),盡管LR中值的差異很?。ㄔ谙嗤臄?shù)量級(jí)上),然而,LR的平均差異非常顯著,見(jiàn)圖2。但當(dāng)模擬人口超過(guò)105,99%,95%和,5%和1%的LR值保持相同的數(shù)量級(jí)。除此之外,LR最大值和最小值的分布表明,隨著模擬種群規(guī)模的增大和模擬量的膨脹,LR將有一個(gè)極值(圖2)??紤]到這個(gè)世界真正的人口,極值問(wèn)題就會(huì)出現(xiàn)在真正的人口中,并且可能大于表1-4中的數(shù)據(jù)。
3.討論
由于軟件和計(jì)算機(jī)仿真能力的限制,我們無(wú)法進(jìn)行仿真超過(guò)106數(shù)據(jù)。STDEV值隨時(shí)間的增加而增加,模擬次數(shù)增加了10-1000倍,這反映了LR值和極值的很大變化。同時(shí),平均數(shù)和平均數(shù)字變異沒(méi)有太大的變化,約為10倍。這反映了當(dāng)模擬次數(shù)超過(guò)104時(shí),系統(tǒng)被認(rèn)為是穩(wěn)定的。此外,系統(tǒng)中STR的數(shù)量越多,靈敏度和假陽(yáng)性率也越高。
3.1、STR數(shù)量的影響
閾值的靈敏度是在設(shè)定一定的閾值時(shí)能夠被檢測(cè)到兩組的假陽(yáng)性率均為0。根據(jù)LR的定義,當(dāng)LR大于1時(shí),支持H0,反之支持H1。實(shí)際上,例如當(dāng)LR大于100時(shí),更可能選擇更高的LR閾值來(lái)降低誤判率。因此,在一定的閾值情況下,真陽(yáng)性率和假陰性率就會(huì)產(chǎn)生。其中,誤判率是假陽(yáng)性率和假陰性率之和。隨著閾值的增大,系統(tǒng)的靈敏度降低,假陽(yáng)性率會(huì)隨著假陰性率的增加而降低。根據(jù)本文得到的數(shù)據(jù),統(tǒng)計(jì)分析得出,設(shè)定適當(dāng)?shù)腖R閾值可以檢測(cè)出系統(tǒng)的判斷能力,遺傳標(biāo)記的數(shù)目可以提高系統(tǒng)的靈敏度,同樣的人口規(guī)模,總體趨勢(shì)是,隨著遺傳標(biāo)記數(shù)量的增加以及隨著閾值的增大,會(huì)降低假陽(yáng)性出現(xiàn)的概率。
3.2、模擬全同細(xì)胞數(shù)量的影響
通過(guò)模擬103-104個(gè)系譜,法醫(yī)科學(xué)家找到了10個(gè)親屬的LR在體內(nèi)的分布。我們發(fā)現(xiàn)這種模擬會(huì)降低LR閾值和存在一定程度的假陽(yáng)性。本文由39哥STR組成檢測(cè)過(guò)程中,LR閾值設(shè)置為1-108,模擬量為1000對(duì)全同細(xì)胞,未在所有兄弟姐妹中發(fā)現(xiàn)假陽(yáng)性。值得注意的是,模擬數(shù)量是1× 104時(shí)或者LR閾值0.1時(shí)假陽(yáng)性率也會(huì)出現(xiàn)。
在實(shí)際情況中,如果兩個(gè)人在識(shí)別過(guò)程中得到L當(dāng)數(shù)據(jù)值超過(guò)100000時(shí),可以100%確定整個(gè)同級(jí)關(guān)系。當(dāng)LR大于105時(shí),假陽(yáng)性率變?yōu)?。但是,我們應(yīng)該警惕假陽(yáng)性的出現(xiàn)。根據(jù)現(xiàn)實(shí)世界中,對(duì)于大量的兄弟姐妹來(lái)說(shuō),假陽(yáng)性的概率應(yīng)該很低。因?yàn)楝F(xiàn)在還沒(méi)出現(xiàn)具有更大的模擬功能的軟件,因此,我們只能根據(jù)實(shí)驗(yàn)得到的數(shù)據(jù)進(jìn)一步計(jì)算了同胞的數(shù)量,并由此進(jìn)行推斷。
結(jié)語(yǔ):
在本文中,我們模擬了大量的全同胞數(shù)據(jù),找到了其LR分布存在的一定規(guī)律,然而,并沒(méi)有被考慮基因和基因座之間的聯(lián)系,并且還會(huì)出現(xiàn)STR基因座突變的存在。雖然建立了5種突變模型,但本研究未進(jìn)行突變模擬。這種突變確實(shí)存在,而且在LR值分布中起著重要作用。另外,有報(bào)道稱我們的模擬基因vWA-D12S391、D5S818-CSFIP0、D21S11之間的聯(lián)系較弱,但由于其在法醫(yī)遺傳學(xué)中的作用,它廣泛應(yīng)用于免疫分析試劑盒中,他們之間的聯(lián)系可以不作為參考。本研究的模擬結(jié)果可為法醫(yī)遺傳學(xué)和辨識(shí)似然率臨界值的確定提供了參考,更為準(zhǔn)確的分析親屬關(guān)系準(zhǔn)備了做出了一定的貢獻(xiàn),能起到一定的作用。
參考文獻(xiàn):
陳子翔,王福振,陸惠玲,等,判別函數(shù)在同胞鑒定中的應(yīng)用[J],中國(guó)法醫(yī)學(xué)雜志,2012,27(2):129—132
個(gè)人簡(jiǎn)介
宋翠芹,出生年月日:1992年4月21日,女,漢,江蘇徐州人,本科,助理,目前在南京鑒云技術(shù)咨詢有限公司從事DNA實(shí)驗(yàn)室相關(guān)工作
南京鑒云技術(shù)咨詢有限公司 210000