国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

運(yùn)用多元回歸分析法估算殘缺赤足跡的身高

2018-10-15 08:04:14毅,彪,
關(guān)鍵詞:因變量回歸方程足跡

高 毅, 王 彪, 馬 越

(1.中國(guó)刑警學(xué)院痕跡檢驗(yàn)技術(shù)系, 遼寧沈陽 100035; 2.痕跡檢驗(yàn)鑒定技術(shù)公安部重點(diǎn)實(shí)驗(yàn)室, 遼寧沈陽 110035)

0 引言

在案發(fā)現(xiàn)場(chǎng)中出現(xiàn)的足跡多為遺留模糊、重疊或者不完整的殘缺足跡,血足跡由于血液的流動(dòng)性強(qiáng)會(huì)使得足跡的尺寸變形,不易利用足跡整體全長(zhǎng)準(zhǔn)確的進(jìn)行人身分析。而當(dāng)前偵查辦案中,利用現(xiàn)場(chǎng)的足跡來推測(cè)犯罪嫌疑人的身高是刑事技術(shù)工作的主要任務(wù)之一。根據(jù)法醫(yī)人類學(xué)可以了解到身高和身體的一些特殊部位具有一定的關(guān)聯(lián)性,如手和腳、上肢和下肢,利用解剖學(xué)和數(shù)學(xué)的思想可為足跡分析身高提供理論基礎(chǔ)。足部同人體其他器官一樣,構(gòu)成一個(gè)協(xié)調(diào)的統(tǒng)一體,各個(gè)部位的尺寸與足跡長(zhǎng)度存在一定的相關(guān)關(guān)系?;谏鲜隼碚?,不同于以往,本文利用赤足跡局部特征測(cè)量值來實(shí)現(xiàn)對(duì)嫌疑人身高的推測(cè),運(yùn)用多元回歸分析的方法,多變量約束身高信息,因此計(jì)算的結(jié)果也更為準(zhǔn)確,以期為殘缺赤足足跡的身高推算提供了可靠依據(jù)。

1 多元回歸分析法

回歸分析是運(yùn)用統(tǒng)計(jì)學(xué)的方法找出因變量與自變量之間的關(guān)系,建立數(shù)學(xué)模型,通過已知的自變量來估算或推測(cè)出因變量的值,而多元回歸分析就是指建立的數(shù)學(xué)模型中包涵有兩個(gè)或者兩個(gè)以上的自變量。多元回歸的方程式為:

Y=b0+b1X1+b2X2+…+biXi

其主要目的是通過統(tǒng)計(jì)、回歸分析的方法來研究足跡各個(gè)測(cè)量值(自變量)與人的身高(因變量)的關(guān)系,以及得出運(yùn)用哪些特征測(cè)量來分析身高最為準(zhǔn)確。實(shí)驗(yàn)中主要選取足底的一些骨骼節(jié)點(diǎn)作為特征點(diǎn)。對(duì)赤足和穿襪足跡均進(jìn)行分析,以避免穿襪足跡測(cè)量值比實(shí)際赤足跡大而導(dǎo)致結(jié)果誤差。

2 材料與方法

2.1 樣本選取

由于成年后人身高基本不會(huì)再有大的變化,加之刑事案件中作案人為男性的比例遠(yuǎn)高于女性,筆者采集200名男性的赤足足跡和穿襪足跡捺印樣本,身高在165~190 cm之間,除此之外,這200名受試者的出生地、居住地均較分散,從而提高了實(shí)驗(yàn)結(jié)果的普遍性。要求測(cè)試者在正常行走的狀態(tài)下進(jìn)行赤足捺印,隨機(jī)選取每名測(cè)試者20枚赤足跡。

2.2 測(cè)量方法

考慮到在現(xiàn)場(chǎng)出現(xiàn)率較為穩(wěn)定的足跖區(qū)和足跟區(qū),因此在這兩個(gè)部位選擇6個(gè)特征點(diǎn)進(jìn)行測(cè)量。測(cè)量方法:足跖前緣最突點(diǎn)到足跟后緣最突點(diǎn)距離L1;足跖內(nèi)緣最突點(diǎn)到足跟距離L2;足跖外緣最突點(diǎn)到足跟后緣最突點(diǎn)的距離L3;足跖后緣最突點(diǎn)到足跟后緣最突點(diǎn)的距離L4;跖內(nèi)緣與跖前緣交點(diǎn)到足跟后緣突點(diǎn)的距離L5;第一跖區(qū)中心到跟中心的距離L6,特征選取如圖1所示。

圖1 特征選取測(cè)量示意圖

2.3 數(shù)據(jù)預(yù)處理

本次研究,利用SPSS19.0統(tǒng)計(jì)分析軟件,對(duì)數(shù)據(jù)進(jìn)行回歸分析,得出上述6個(gè)特征測(cè)量值與身高及特征相互之間的相關(guān)性。數(shù)據(jù)在測(cè)量和記錄過程中會(huì)出現(xiàn)不可避免的誤差,從而導(dǎo)致個(gè)別數(shù)據(jù)出現(xiàn)異常,往往導(dǎo)致結(jié)果出現(xiàn)較大的偏差,而異常數(shù)據(jù)的出現(xiàn)會(huì)掩蓋實(shí)驗(yàn)數(shù)據(jù)變化的規(guī)律,得出錯(cuò)誤結(jié)論。因此需要糾偏,將數(shù)據(jù)進(jìn)行預(yù)處理,剔除異常值,這樣才有利于提高實(shí)驗(yàn)的精確度。根據(jù)統(tǒng)計(jì)學(xué)可知,T檢驗(yàn)準(zhǔn)則適合數(shù)據(jù)庫(kù)較小的異常值剔除,將數(shù)據(jù)整理好之后輸入excel表格,然后運(yùn)用t檢驗(yàn)準(zhǔn)則(又稱羅曼諾夫斯基準(zhǔn)則)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理?;舅枷耄菏紫忍蕹粋€(gè)可疑值,然后按照t分布來檢驗(yàn)被剔除值是否為異常值,重復(fù)此運(yùn)算直到數(shù)據(jù)內(nèi)沒有異常值出現(xiàn)。

設(shè)樣本數(shù)據(jù)為X1,X2,……,Xn,若認(rèn)為Xj為可疑值,計(jì)算n-1個(gè)數(shù)據(jù)的平均值Xn-1標(biāo)準(zhǔn)差Sn-1,即:

表1 實(shí)驗(yàn)對(duì)象1樣本特征測(cè)量數(shù)據(jù)單位:mm

本次實(shí)驗(yàn)利用SPSS(Statistical Program for Social Sciences)19.0統(tǒng)計(jì)分析軟件進(jìn)行數(shù)據(jù)預(yù)處理。根據(jù)統(tǒng)計(jì)學(xué)知識(shí)可知異常值通常出現(xiàn)在極大值或極小值之間,用SPSS軟件中的“分析”計(jì)算出6個(gè)特征的極值。由于數(shù)據(jù)量不大,然后根據(jù)t檢驗(yàn)準(zhǔn)則進(jìn)行檢驗(yàn),如表2所示。

表2 實(shí)驗(yàn)對(duì)象1特征極值描述統(tǒng)計(jì)量N:樣本數(shù)量

計(jì)算較為復(fù)雜,文中不做過多闡述,以特征L3的極值151和155為例,將極小值151和極大值155分別進(jìn)行t檢驗(yàn)。將151和155剔除之后再分別進(jìn)行計(jì)算余下數(shù)據(jù)的平均值和標(biāo)準(zhǔn)差。

表3 剔除極小值151后的樣本均值和標(biāo)準(zhǔn)差描述統(tǒng)計(jì)表

表4 剔除極大值155后的樣本均值和標(biāo)準(zhǔn)差描述統(tǒng)計(jì)表

2.4 數(shù)據(jù)分析

2.4.1 相關(guān)性分析

將數(shù)據(jù)統(tǒng)計(jì)好后進(jìn)行回歸分析。然后根據(jù)表5可以觀察因變量身高和自變量之間的相關(guān)性,以及各特征之間的相關(guān)性。從表里可以發(fā)現(xiàn)身高與特征L2、L5、L6的相關(guān)性較高 ,相關(guān)系數(shù)在0.542~0.651(p<0.01)之間,而身高與特征L1、L3、L4的相關(guān)性較低,相關(guān)性系數(shù)在0.215~0.491(p<0.01)之間,其中與身高與L3的相關(guān)性最低,相關(guān)系數(shù)為0.215。觀察表5可以看到L1、L2、L3、L4、L5、L6這些特征之間的相關(guān)性總體上是較高的,相關(guān)系數(shù)在0.425~0.924(p<0.01)之間。這說明這6個(gè)特征之間的相關(guān)性較好。根據(jù)特征之間的相關(guān)系數(shù)可知這些特征之間存在共線性問題,如果不對(duì)這些情況加以考慮,將這些特征全部進(jìn)行回歸分析計(jì)算回歸模型,結(jié)果就可能會(huì)出現(xiàn)錯(cuò)誤。因此只考慮相關(guān)性較高的情況并進(jìn)行逐步回歸分析計(jì)算出來的回歸模型才會(huì)是準(zhǔn)確的(如表5所示)。

2.4.2 模型分析

本實(shí)驗(yàn)中由于自變量之間相關(guān)性較高,存在共線性問題,驗(yàn)證了法醫(yī)人類學(xué)中身體的一些特殊部位具有一定的關(guān)聯(lián)性的觀點(diǎn)。正是基于這些觀點(diǎn)才能為殘缺赤足跡推算身高提供可靠依據(jù)。于是在使用回歸分析法時(shí),應(yīng)該利用逐步回歸分析對(duì)數(shù)據(jù)進(jìn)行分析,回歸模型會(huì)根據(jù)各自變量對(duì)因變量預(yù)測(cè)能力的高低,而依次將自變量逐個(gè)地選入到回歸模型中。當(dāng)自變量的回歸系數(shù)沒有達(dá)到顯著水平時(shí),該自變量就會(huì)被排除在回歸模型之外,從而得到了表6的模型匯總。如表6所示,其中的r表示相關(guān)系數(shù),r越接近于1,表明自變量與因變量之間的相關(guān)性越強(qiáng);也就是說模型與樣本之間的擬合度越好,模型越能代表樣本的觀測(cè)趨勢(shì);而相關(guān)指數(shù)r2越接近于1,同樣說明自變量與因變量之間的相關(guān)性越強(qiáng),如果自變量過多或者樣本個(gè)數(shù)較少,這樣得出來的相關(guān)系數(shù)會(huì)高估總體的相關(guān)系數(shù),這種情況下,需要采用調(diào)整后的相關(guān)系數(shù)來代替原始相關(guān)系數(shù),這樣就不用考慮樣本個(gè)數(shù)和自變量個(gè)數(shù)的變化對(duì)方程的影響。因此這次我們可以選擇調(diào)整r2作為回歸模型,F(xiàn)改變的值表示的是回歸方程的顯著性檢驗(yàn),即對(duì)模型中被解釋變量與所有解釋變量之間線性關(guān)系在總體上是否顯著做出判斷。

表5 身高與各特征指標(biāo)相關(guān)性統(tǒng)計(jì)表

**在 .01 水平(雙側(cè))上顯著相關(guān)。

表6 身高與特征回歸分析方程模型匯總表

a.預(yù)測(cè)變量: (常量),L6;b.預(yù)測(cè)變量: (常量),L6,L3;c.預(yù)測(cè)變量: (常量),L6,L3,L5;d.預(yù)測(cè)變量: (常量),L6,L3,L5,L4;e.因變量: 身高。

在表6中所呈現(xiàn)的模型1、模型2和模型4自變量的回歸系數(shù)均達(dá)到了顯著水平。如表6所示,自變量L6建立的模型1與因變量身高的擬合度為46.6%,達(dá)到了統(tǒng)計(jì)上的顯著水平(F改變=253.299,p=0.00<0.01);模型2中加入了自變量L3,這兩個(gè)自變量L6、L3建立的模型與因變量身高的擬合度為57.3%,排除自變量L6的影響,單獨(dú)自變量L3建立的模型與對(duì)因變量身高的擬合度為10.8%,達(dá)到了統(tǒng)計(jì)上的顯著水平(F改變=72.809,p=0.000.01);模型3中加入自變量L5,3個(gè)自變量L6、L3、L5建立的模型與因變量身高的擬合度為59.8%,排除自變量L6、L3的影響,自變量L5對(duì)因變量的擬合度為1.3%,沒有達(dá)到了統(tǒng)計(jì)上的顯著水平(F改變=9.537,p=0.020.01)。模型4中加入自變量L4,這4個(gè)自變量L6、L3、L5、L4對(duì)因變量身高的擬合度為62%,排除L6、L3、L5的影響,單獨(dú)自變量L4與因變量身高的擬合度為0.7%。達(dá)到了統(tǒng)計(jì)學(xué)上的顯著水平(F改變=5.271,p=0.220.01),但是這4個(gè)模型的F值分別是253.299(p=0.00<0.01)、194.633(p=0.00<0.01)、144.222(p=0.00<0.01)、93.442(p=0.00<0.01)均達(dá)到了顯著水平,所以模型3和4中并不影響自變量L4和L5的加入。表中Durbin-Watson檢驗(yàn)的值為0.431,當(dāng)DW統(tǒng)計(jì)量數(shù)值接近0時(shí),自相關(guān)越強(qiáng)。說明該回歸模型中自變量存在共線性問題。證實(shí)了人體各個(gè)部分尺寸是具有關(guān)聯(lián)性的,也就是說腳的各部位的尺寸與整個(gè)腳的尺寸或身高是有聯(lián)系的,也正是根據(jù)這一點(diǎn)才能依據(jù)足跡中各個(gè)部位的尺寸進(jìn)行身高的估算。這一點(diǎn)在法醫(yī)解剖學(xué)和人類體質(zhì)學(xué)上是共同承認(rèn)的,因此DW的值對(duì)本次實(shí)驗(yàn)的影響不大,所以這4個(gè)模型都可以用來對(duì)身高的分析。

2.4.3 選取模型

通過對(duì)因變量和選入模型的自變量的回歸分析,得出了表7所示的回歸模型的回歸系數(shù)及回歸系數(shù)的顯著性。如表6所示,模型1為一元回歸方程,模型2、模型3和模型4都是多元回歸方程,多元回歸方程標(biāo)準(zhǔn)估計(jì)的誤差值比線性回歸方程更小,這說明多元回歸方程計(jì)算出來的結(jié)果比線性回歸方程更準(zhǔn)確,誤差更小。由表6可知與樣本擬合度最低的是模型1為46.6%;模型2和模型3與樣本的擬合度位于中間分別是57.3%和59.8%,在模型4與樣本的擬合度最強(qiáng)為62.0%。這說明自變量越多對(duì)因變量的描述信息就越多,因變量的結(jié)果也更準(zhǔn)確。這4個(gè)模型的顯著性雖然都達(dá)到了統(tǒng)計(jì)學(xué)上的顯著水平(a=0.01),但在適用上應(yīng)優(yōu)先選用模型4(如表6所示)。

表7 回歸方程系數(shù)表

a.因變量: 身高

由表7內(nèi)的數(shù)據(jù),可以得出兩個(gè)模型所建立的回歸方程:

模型1:身高=87.603+0.603*L6

模型2:身高=101.735+0.942*L6-0.43*L3

模型3:身高=112.494+0.677*L6-0.543*L3+0.221*L5

模型4:身高=122.618+0.668*L6-0.521*L3+0.334*L5-0.208*L4(如表7所示)

3 結(jié)語

本次實(shí)驗(yàn)的特征選取不再是選取足跡趾區(qū)前緣最突點(diǎn)到跟后緣最突點(diǎn)的距離,經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn)這種足跡前邊緣特征容易受作用力、承痕客體和中介質(zhì)的影響而發(fā)生很大的改變,使得現(xiàn)場(chǎng)足跡的尺寸與實(shí)際足跡尺寸不符,從而導(dǎo)致在分析身高時(shí)誤差較大。文中選取的特征是根據(jù)法醫(yī)人類學(xué)的理論知識(shí)來選取并加以測(cè)量。這些特征大部分是骨骼的節(jié)點(diǎn),不易受現(xiàn)場(chǎng)條件的影響而發(fā)生改變。所以根據(jù)這些足跡特征進(jìn)行多元回歸分析會(huì)得到最準(zhǔn)確的身高數(shù)值。

同時(shí),根據(jù)文中推導(dǎo)出來的多元回歸方程在計(jì)算作案人身高時(shí),不用再考慮現(xiàn)場(chǎng)足跡是否為穿襪或者赤足足跡,只要在現(xiàn)場(chǎng)上能找到相應(yīng)的特征時(shí)就可以帶入公式進(jìn)行分析。避免了傳統(tǒng)足跡分析時(shí)容易把穿襪足跡當(dāng)做赤足足跡使得足跡尺寸偏大,而導(dǎo)致在分析身高時(shí)得出的結(jié)果比實(shí)際身高相差太多的情況。由于人體的結(jié)構(gòu)基本上是對(duì)稱的,所以在現(xiàn)場(chǎng)不管是左足還是右足,只要具有這些特征就可以直接帶入公式進(jìn)行分析。

本次實(shí)驗(yàn)主要是對(duì)赤足殘缺足跡進(jìn)行統(tǒng)計(jì)和分析,因此,在對(duì)穿鞋足跡進(jìn)行此方法檢驗(yàn)時(shí)應(yīng)準(zhǔn)確確定特征點(diǎn)的位置,避免特征出現(xiàn)較大誤差,導(dǎo)致出現(xiàn)錯(cuò)誤結(jié)果。本實(shí)驗(yàn)對(duì)象來自于全國(guó)各地的男性,雖然消除了地區(qū)不同導(dǎo)致的差異,但是在性別上還需要注意,應(yīng)充分考慮現(xiàn)場(chǎng)足跡其他因素的綜合應(yīng)用。

猜你喜歡
因變量回歸方程足跡
調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運(yùn)用
采用直線回歸方程預(yù)測(cè)桑癭蚊防治適期
線性回歸方程的求解與應(yīng)用
線性回歸方程要點(diǎn)導(dǎo)學(xué)
走進(jìn)回歸分析,讓回歸方程不再是你高考的絆腳石
適應(yīng)性回歸分析(Ⅳ)
——與非適應(yīng)性回歸分析的比較
成長(zhǎng)足跡
足跡
心聲歌刊(2018年6期)2018-01-24 00:56:12
偏最小二乘回歸方法
足跡
乐昌市| 临沧市| 法库县| 潞西市| 昌乐县| 吉安县| 利辛县| 当雄县| 洞头县| 腾冲县| 遂平县| 和硕县| 安达市| 卫辉市| 瑞丽市| 清徐县| 瑞昌市| 乐安县| 鹤山市| 澄江县| 嘉义市| 金昌市| 宾川县| 新田县| 海口市| 辰溪县| 屯昌县| 麻城市| 延庆县| 东安县| 庄河市| 武鸣县| 康保县| 富宁县| 永济市| 皮山县| 会理县| 郎溪县| 西吉县| 海阳市| 阳谷县|