模擬數(shù)量變化對(duì)全同胞似然比的影響

2021-09-10 12:24:46宋翠芹

科學(xué)與生活 2021年7期

摘要：探討模擬群體數(shù)和STR對(duì)同胞似然比（LR）的影響，為法醫(yī)遺傳學(xué)中LR臨界值的確定提供依據(jù)，可作為參考。用家庭S3軟件模擬100～100萬(wàn)對(duì)全同胞，分別有15、19、29和39個(gè)STR，觀察似然比（LR）的分布及陽(yáng)性率、陰性率、假陽(yáng)性率、假陰性率的變化。事實(shí)證明當(dāng)模擬種群數(shù)量超過(guò)105個(gè)時(shí)，LR值分別為99%、95%、5%和1%，當(dāng)模擬種群數(shù)量低于104個(gè)時(shí)，LR值波動(dòng)較大，并且范圍很大。當(dāng)似然比為1時(shí)，15個(gè)STR系統(tǒng)的靈敏度為98.01%～99.0%;對(duì)19個(gè)STR系統(tǒng)進(jìn)行了分析，結(jié)果為99.0% - 99.3%;29個(gè)STR系統(tǒng)占99%～99.85%;39個(gè)STR系統(tǒng)占99.93%～100%。當(dāng)似然比為1時(shí)，所有被試實(shí)驗(yàn)題的假陽(yáng)性率為：15個(gè)STR系統(tǒng)的假陽(yáng)性率為1.7225，19個(gè)STR系統(tǒng)的假陽(yáng)性率為0.7370，29個(gè)STR系統(tǒng)的假陽(yáng)性率為0.1311，39個(gè)STR系統(tǒng)的假陽(yáng)性率為0.0593。當(dāng)STR基因座數(shù)變化時(shí)，LR值也在變化，主要變現(xiàn)為：由15個(gè)增加到39個(gè)時(shí)，LR值的中位數(shù)、均值、最大值、最小值、99%、95%、5%、5%，1%，標(biāo)準(zhǔn)差也相應(yīng)增加。從而得出模擬種群規(guī)模是影響LR分布的重要因素;在一定數(shù)量的人群中，識(shí)別系統(tǒng)在檢測(cè)系統(tǒng)中增加STR的數(shù)目，可以獲得更好更高的LR值。

關(guān)鍵詞：模擬數(shù)量變化;全同細(xì)胞;似然比

除了傳統(tǒng)的親子鑒定，他們提供的基因信息較少和被鑒定人的特殊性，對(duì)復(fù)雜的親屬關(guān)系進(jìn)行識(shí)別細(xì)胞總數(shù)有一定差距，由于能力有限，一般無(wú)法完成更多的仿真數(shù)據(jù)。因?yàn)槟壳霸诜ㄡt(yī)遺傳學(xué)領(lǐng)域沒(méi)有系統(tǒng)的公式和觀點(diǎn)，所以需要更嚴(yán)謹(jǐn)、更科學(xué)的統(tǒng)計(jì)數(shù)字來(lái)確定全體同胞之間的關(guān)系。

本研究的目的是，在大樣本數(shù)據(jù)的基礎(chǔ)上進(jìn)行模擬和親合方法遺傳學(xué)中，評(píng)價(jià)不同STR系親緣關(guān)系概率的計(jì)算，總模擬量對(duì)全民辨識(shí)似然比的影響。家族3是根據(jù)DNA數(shù)據(jù)推斷親子鑒定概率計(jì)算的自由軟件，利用傳統(tǒng)的似然比可以計(jì)算和模擬最大項(xiàng)數(shù)，可以模擬106對(duì)數(shù)據(jù)。本文采用家族3軟件模塊，共提出100至100萬(wàn)對(duì)全同胞，分別為15人、19人、29人和39人STR系統(tǒng)識(shí)別同胞時(shí)，不同模擬數(shù)的似然比的差異。

1.材料及方法

1.1建立假設(shè)實(shí)驗(yàn)

本研究采用家庭3軟件對(duì)四種不同的STR，進(jìn)行分析模擬了100到100萬(wàn)對(duì)全同胞數(shù)據(jù)，它們是：15個(gè)STR系統(tǒng)（ABI標(biāo)識(shí)符），19個(gè)STR系統(tǒng);29 STR系統(tǒng);39 個(gè)STR系統(tǒng)，這些系統(tǒng)全部是商用的. 在模擬試驗(yàn)中，設(shè)置相應(yīng)的全參數(shù)同胞個(gè)體和無(wú)關(guān)個(gè)體。到目前為止，可以建立以下兩個(gè)測(cè)試假設(shè)：

原始假設(shè)H0：個(gè)體1和2是同胞（在生物學(xué)方面，他們有同一個(gè)生父和同一個(gè)生母。）

備選假設(shè)：個(gè)體1和個(gè)體2沒(méi)有任何關(guān)系，就是兩者之間不會(huì)同一個(gè)生父。

1.2、參數(shù)設(shè)置

模擬實(shí)驗(yàn)前，在軟件家族3中設(shè)定以下這幾個(gè)參數(shù)：①忽略系統(tǒng)中等位基因的檢測(cè)突變;②群體遺傳指數(shù)設(shè)為0;③在軟件中，將先驗(yàn)參數(shù)設(shè)置為默認(rèn)值;④設(shè)定可能性比值（LR）的范圍為0.1到1×108.模擬次數(shù)為100，1×103，1×104，1×105和1×106。收集統(tǒng)計(jì)所有的模擬數(shù)據(jù)，結(jié)果包括單個(gè)1和2的輸入數(shù)，根據(jù)數(shù)據(jù)和模擬數(shù)據(jù)得到的平均值、中值、最大值、最小值，99%、95%、5%、1%，以及%，STEDV的LR值。當(dāng)設(shè)置在LR閾值時(shí)，家族3將產(chǎn)生相應(yīng)的陽(yáng)性（敏感性）結(jié)果和假陽(yáng)性（1-特異性）結(jié)果。對(duì)于每個(gè)系統(tǒng)，當(dāng)LR閾值在1到106之間時(shí)（表5-8），我們記錄了和比較了該方法的靈敏度和假陽(yáng)性率。

1.3、結(jié)果分析

為了分析似然比的分布情況，對(duì)得到的LR值進(jìn)行分類，LR的擬合線圖生成，主要由IBM SPSS 22.0.R.和Graphpad 5.0生成。K-S是用來(lái)檢測(cè)研究LR的分布情況。

2.結(jié)果

2.1、LR值的統(tǒng)計(jì)學(xué)參數(shù)和STR數(shù)量的關(guān)系

能夠看到個(gè)體1和個(gè)體2的全同胞指數(shù)（全同胞指數(shù)、FSD和LR值）。發(fā)現(xiàn)當(dāng)STR基因座數(shù)從15個(gè)增加到39個(gè)時(shí)，LR值增加，包括中位數(shù)、平均值、最大值、最小值、99%，95%、5%、1%和標(biāo)準(zhǔn)偏差相應(yīng)增加（見(jiàn)圖1）。

結(jié)果表明，增加檢測(cè)系統(tǒng)中STR的數(shù)目，可以提高檢測(cè)效率，可以得到更高的LR均值和一個(gè)更大的極點(diǎn)。STDEV值隨LR的增加而增加。（表1-4）

2.2、LR值和模擬人群數(shù)量之間的關(guān)系

在一定的情況下時(shí)，并且模擬種群的數(shù)量都超過(guò)1×106時(shí)（表1-4），LR的中位數(shù)、平均值和標(biāo)準(zhǔn)差增加。隨著模擬種群數(shù)量的增加，LR的最大值和最小值都會(huì)增加或減少。當(dāng)模擬總體數(shù)較少時(shí)（100到10000），盡管LR中值的差異很?。ㄔ谙嗤臄?shù)量級(jí)上），然而，LR的平均差異非常顯著，見(jiàn)圖2。但當(dāng)模擬人口超過(guò)105，99%，95%和，5%和1%的LR值保持相同的數(shù)量級(jí)。除此之外，LR最大值和最小值的分布表明，隨著模擬種群規(guī)模的增大和模擬量的膨脹，LR將有一個(gè)極值（圖2）?？紤]到這個(gè)世界真正的人口，極值問(wèn)題就會(huì)出現(xiàn)在真正的人口中，并且可能大于表1-4中的數(shù)據(jù)。

3.討論

由于軟件和計(jì)算機(jī)仿真能力的限制，我們無(wú)法進(jìn)行仿真超過(guò)106數(shù)據(jù)。STDEV值隨時(shí)間的增加而增加，模擬次數(shù)增加了10-1000倍，這反映了LR值和極值的很大變化。同時(shí)，平均數(shù)和平均數(shù)字變異沒(méi)有太大的變化，約為10倍。這反映了當(dāng)模擬次數(shù)超過(guò)104時(shí)，系統(tǒng)被認(rèn)為是穩(wěn)定的。此外，系統(tǒng)中STR的數(shù)量越多，靈敏度和假陽(yáng)性率也越高。

3.1、STR數(shù)量的影響

閾值的靈敏度是在設(shè)定一定的閾值時(shí)能夠被檢測(cè)到兩組的假陽(yáng)性率均為0。根據(jù)LR的定義，當(dāng)LR大于1時(shí)，支持H0，反之支持H1。實(shí)際上，例如當(dāng)LR大于100時(shí)，更可能選擇更高的LR閾值來(lái)降低誤判率。因此，在一定的閾值情況下，真陽(yáng)性率和假陰性率就會(huì)產(chǎn)生。其中，誤判率是假陽(yáng)性率和假陰性率之和。隨著閾值的增大，系統(tǒng)的靈敏度降低，假陽(yáng)性率會(huì)隨著假陰性率的增加而降低。根據(jù)本文得到的數(shù)據(jù)，統(tǒng)計(jì)分析得出，設(shè)定適當(dāng)?shù)腖R閾值可以檢測(cè)出系統(tǒng)的判斷能力，遺傳標(biāo)記的數(shù)目可以提高系統(tǒng)的靈敏度，同樣的人口規(guī)模，總體趨勢(shì)是，隨著遺傳標(biāo)記數(shù)量的增加以及隨著閾值的增大，會(huì)降低假陽(yáng)性出現(xiàn)的概率。

3.2、模擬全同細(xì)胞數(shù)量的影響

通過(guò)模擬103-104個(gè)系譜，法醫(yī)科學(xué)家找到了10個(gè)親屬的LR在體內(nèi)的分布。我們發(fā)現(xiàn)這種模擬會(huì)降低LR閾值和存在一定程度的假陽(yáng)性。本文由39哥STR組成檢測(cè)過(guò)程中，LR閾值設(shè)置為1-108，模擬量為1000對(duì)全同細(xì)胞，未在所有兄弟姐妹中發(fā)現(xiàn)假陽(yáng)性。值得注意的是，模擬數(shù)量是1× 104時(shí)或者LR閾值0.1時(shí)假陽(yáng)性率也會(huì)出現(xiàn)。

在實(shí)際情況中，如果兩個(gè)人在識(shí)別過(guò)程中得到L當(dāng)數(shù)據(jù)值超過(guò)100000時(shí)，可以100%確定整個(gè)同級(jí)關(guān)系。當(dāng)LR大于105時(shí)，假陽(yáng)性率變?yōu)?。但是，我們應(yīng)該警惕假陽(yáng)性的出現(xiàn)。根據(jù)現(xiàn)實(shí)世界中，對(duì)于大量的兄弟姐妹來(lái)說(shuō)，假陽(yáng)性的概率應(yīng)該很低。因?yàn)楝F(xiàn)在還沒(méi)出現(xiàn)具有更大的模擬功能的軟件，因此，我們只能根據(jù)實(shí)驗(yàn)得到的數(shù)據(jù)進(jìn)一步計(jì)算了同胞的數(shù)量，并由此進(jìn)行推斷。

結(jié)語(yǔ)：

在本文中，我們模擬了大量的全同胞數(shù)據(jù)，找到了其LR分布存在的一定規(guī)律，然而，并沒(méi)有被考慮基因和基因座之間的聯(lián)系，并且還會(huì)出現(xiàn)STR基因座突變的存在。雖然建立了5種突變模型，但本研究未進(jìn)行突變模擬。這種突變確實(shí)存在，而且在LR值分布中起著重要作用。另外，有報(bào)道稱我們的模擬基因vWA-D12S391、D5S818-CSFIP0、D21S11之間的聯(lián)系較弱，但由于其在法醫(yī)遺傳學(xué)中的作用，它廣泛應(yīng)用于免疫分析試劑盒中，他們之間的聯(lián)系可以不作為參考。本研究的模擬結(jié)果可為法醫(yī)遺傳學(xué)和辨識(shí)似然率臨界值的確定提供了參考，更為準(zhǔn)確的分析親屬關(guān)系準(zhǔn)備了做出了一定的貢獻(xiàn)，能起到一定的作用。

參考文獻(xiàn)：

陳子翔，王福振，陸惠玲，等，判別函數(shù)在同胞鑒定中的應(yīng)用[J]，中國(guó)法醫(yī)學(xué)雜志，2012，27（2）：129—132

個(gè)人簡(jiǎn)介

宋翠芹，出生年月日：1992年4月21日，女，漢，江蘇徐州人，本科，助理，目前在南京鑒云技術(shù)咨詢有限公司從事DNA實(shí)驗(yàn)室相關(guān)工作

南京鑒云技術(shù)咨詢有限公司 210000

科學(xué)與生活2021年7期

科學(xué)與生活的其它文章: 科舉制的政治邏輯; 社會(huì)互動(dòng)理論視域下的內(nèi)蒙古社區(qū)類型與人際關(guān)系描述性研究; 論監(jiān)察權(quán)監(jiān)督機(jī)制的完善; 民間體育游戲：跑城; 《洛麗塔》中第一人稱敘事角度作用芻議; 試析如何激發(fā)醫(yī)院基層工會(huì)組織的活力

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

模擬數(shù)量變化對(duì)全同胞似然比的影響