喬勝男,朱玉婷
(中國刑事警察學院,遼寧 沈陽 110035)
運用赤足跡多元回歸分析同質(zhì)人群身高
喬勝男,朱玉婷
(中國刑事警察學院,遼寧 沈陽 110035)
通過選取相同地區(qū)、不同年齡、不同性別的120份赤足跡樣本,分別對跟壓后緣凸點到五趾前緣凸點的距離、跟壓后緣凸點到前掌內(nèi)外側(cè)凸點的距離進行測量,使用SPSS統(tǒng)計分析軟件對數(shù)據(jù)進行多元回歸分析和逐步回歸分析,發(fā)現(xiàn)七個距離與身高之間存在線性相關(guān)關(guān)系,建立相應的數(shù)學模型并得出回歸方程,比較模型之間的誤判率和準確度,為利用足跡分析同質(zhì)人群身高提供更可靠有力的方法。
赤足跡;同質(zhì)人群;身高分析;多元回歸
傳統(tǒng)分析身高的方法基于足長[1]這一單一元素分析,該方法簡單但是也存在自身的局限性,不能涵蓋不同種族、不同地域、不同生活環(huán)境等客觀差異對身高的影響。本文通過對同一地區(qū)人群的足跡進行采集并掃描入庫,使用數(shù)碼分規(guī)測量統(tǒng)計跟壓后緣凸點到五趾前緣凸點的距離、跟壓后緣凸點到前掌內(nèi)外側(cè)凸點的距離七個長度,分析同一地區(qū)這七個距離與身高之間的相關(guān)性,得出相應的回歸方程,為根據(jù)足跡推算身高提供新方法。
(一)實驗數(shù)據(jù)的收集
通過測量來自同一省份、不同性別、不同年齡的健康人群140名,且足部健康無任何疾病。借助油墨捺印盒,遵循羅賓斯采集足跡步驟[2]對實驗者左右足都進行采集。并將這些樣本掃描入庫,剔除采集質(zhì)量較差的足跡樣本,最終選取較好的足跡樣本共計120份。在身高測量時實驗者光腳靠墻站立且手懸空下垂,是頭部定點(在法蘭克福水平面[3])與地板的垂直距離,用標準計量方式標記測量。
(二)實驗數(shù)據(jù)的選取
為了使得測量的數(shù)據(jù)更加準確,基于易于發(fā)現(xiàn)便于測量的原則,對捺印的足跡樣本選擇了跟壓后緣凸點到五趾前緣凸點的距離、前掌寬、后跟寬、跟壓后緣凸點到前掌內(nèi)外側(cè)凸點的距離??紤]到現(xiàn)場出現(xiàn)的足跡,不論清晰的或模糊的,跟壓后緣和五趾壓前緣出現(xiàn)率比較高,提出后跟的寬度較難測定,本實驗最終選取的足跡特征點是五趾前緣凸點分別為A、B、C、D、E;跟壓后緣凸點為O點,前掌內(nèi)外側(cè)凸點為M、N點;(見圖1),分析足長測量使用的數(shù)據(jù)分別是:
1.跟壓后緣凸點到拇趾前緣凸點的距離為LOA;
2.跟壓后緣凸點到第二趾前緣凸點的距離為LOB;
3.跟壓后緣凸點到第三趾前緣凸點的距離為LOC;
圖1 足跡測量圖
4.跟壓后緣凸點到第四趾前緣凸點的距離為LOD;
5.跟壓后緣凸點到第五趾前緣凸點的距離為LOE
6.跟壓后緣凸點到前掌內(nèi)外側(cè)凸點的距離為LOM;
7.跟壓后緣凸點到前掌內(nèi)外側(cè)凸點的距離為LON;
使用數(shù)碼分規(guī)將以上七個長度一一進行測量并記錄下來,由數(shù)據(jù)可以看出足長與身高之間的大致關(guān)系。
(一)數(shù)據(jù)錄入EXCEL表格并進行預處理
使用EXCEL表格對數(shù)據(jù)進行預處理分析并畫出散點圖,(見圖2-1、圖2-2),目的是為了查看輸入錯誤,對分析結(jié)果造成影響,及時對數(shù)據(jù)進行分析與修正,快速排除特異點。
從散點圖可以看出左右腳的七個距離長度與身高具有很高的相關(guān)性,并且這七個變量與身高之間可能存在線性相關(guān),使用SPSS軟件對數(shù)據(jù)進行進一步的分析驗證。
圖2-1 左腳各測量值與身高之間的散點圖
(二)利用SPSS數(shù)理統(tǒng)計軟件對數(shù)據(jù)進行顯著性檢驗分析
在使用SPSS軟件對數(shù)據(jù)進行分析時,為了便于觀察將使用x1表示OA,x2表示OB,x3表示OC,x4表示OD,x5表示OE,x6表示OM,X7表示ON。
表1 多個測量值與身高之間的相關(guān)性分析
從表格1中可以看出x1與x2、x3、x4、x5、x6、x7的相關(guān)性系數(shù)分別為0.930、0.904、0.824、0.743、0.142、0.585;x2 與 x3、x4、x5、x6、x7的相關(guān)性系數(shù)分別為0.974、0.924、0.871、-0.103、0.568;;x3 與 x4、x5、x6、x7的相關(guān)性系數(shù)分別為0.964、0.905、-0.190、0.557;x4與x5、x6、x7的相關(guān)性系數(shù)分別為0.949、-0.358、0.511;x5與x6、x7的相關(guān)性系數(shù)分別為-0.487、0.445;x6與x7的相關(guān)性系數(shù)為0.111;Pearson相關(guān)系數(shù)反映相關(guān)性的強弱,該表格反映的數(shù)據(jù)可以說明足長與X1、x2、x3、x4、x5、x7是具有較高的相關(guān)性,與x6的相關(guān)性較弱。在以下的試驗中需要去除前掌內(nèi)緣凸點到跟后緣凸點的距離這一變量,其他的變量之間具有較高相關(guān)性。
(三)多元回歸模型分析
在相關(guān)性較高的變量和身高之間,使用多元回歸模型分析身高。在建立模型的時候,應該對變量進行篩選,這就需要根據(jù)某個變量t值大小來確定,將不顯著的變量剔除。本實驗過程中使用多元逐步回歸分析的方法對變量進行選擇,見表2。
表2 左腳模型匯總
在模型1中,進入模型的自變量是X1,多元相關(guān)系數(shù)為0.639;在模型2中,進入模型的自變量是x1和x7,在系數(shù)上標注a和b代表的是進入模型相關(guān)系數(shù)對應的自變量,調(diào)整的系數(shù)R2數(shù)據(jù)較大代表模型效果比較好,在模型1和模型2之間的比較后發(fā)現(xiàn)模型1的效果較好于模型,標準估計的誤差約為5.03。
表3 兩個回歸模型的整體顯著性檢驗
表格3為兩個回歸模型的整體顯著性檢驗。由表3可知兩個模型的標準差均為0.000<0.01,兩個模型的F值分別為78.608和32.468,模型整體顯著性檢驗F值均已達到顯著性水平,每個模型模型中的變量解釋能力均達到顯著性水平,即兩個模型的變量系數(shù)不為零,兩個模型中各個變量來解釋身高是有意義的。
表4 模型參數(shù)及檢驗結(jié)果
表格4給出了身高與變量之間關(guān)系的系數(shù),結(jié)合模型檢驗結(jié)果可以得出最佳的模型應該是模型1,即身高S=100.627+3.06*x1,轉(zhuǎn)化到測量的變量上就是身高S=100.627+3.06*(足跟后緣凸點到拇趾前緣凸點的距離)。在逐步回歸分析過程中,剔除了其他六個對模型的貢獻率不高的變量。
(四)線性回歸模型分析
使用SPSS統(tǒng)計分析軟件中的回歸分析功能,建立各變量與足長之間的系數(shù)方程并進行系數(shù)評價與比較,見表格5。從表格5可以看出,最佳的線性回歸模型就是S=101.578+3.019*x1,相比較其他公式,該公式的標準誤差最小。
表5 線性回歸模型建立表
將上述的實驗結(jié)果進行驗證,左腳的變量所得的模型均與X1有關(guān),根據(jù)回歸
分析中的逐步回歸模型建立的方程式是身高S=100.627+3.06*(足跟后緣凸點到拇趾前緣凸點的距離),標準誤差較低;而使用線性回歸分析模型建立的方程式是身高S=101.578+3.019*(足跟后緣凸點到拇趾前緣凸點的距離),二者使用的原理不同,得出的實驗結(jié)論有一定的差異性,接下來將從庫中抽樣100余份驗證二者的身高估計值與實際身高的誤差,以及誤差在一定區(qū)間的數(shù)據(jù)占樣本總數(shù)的百分比。見表格6。
表格6 不同誤差范圍與百分比的統(tǒng)計結(jié)果
經(jīng)上述分析比較發(fā)現(xiàn),使用第一個模型即使用逐步回歸方法得出的效果較好一些,出錯率相比較低,說明使用逐步回歸得出的回歸模型:身高=100.627+3.06*(足跟后緣凸點到拇趾前緣凸點的距離)推算身高的效果較好一些。在結(jié)果評價過程中將同一地區(qū)的足跡抽樣檢測發(fā)現(xiàn),逐步回歸模型建立的回歸方程效果接近于真實身高值。
在實驗過程中考慮到人的生活環(huán)境、種族、地域等條件的影響因素,本實驗基于120份樣本研究同質(zhì)人群、同省份、不同年齡、不同性別的油墨捺印足跡作為研究對象,通過統(tǒng)計軟件分析各個測量值與身高之間的關(guān)系并建立回歸方程,在一定程度上可以為分析推算身高提供較為量化的依據(jù)。根據(jù)結(jié)果統(tǒng)計評價的結(jié)果顯示,使用該方法測量足長推算身高在小范圍的有比較高的準確度。
該實驗存在的誤差來源分析主要是提取的都是警校大學生的足跡,取樣范圍相對較狹窄。雖提取的樣本是不同年齡,但是年齡的分布均集中在17歲至30歲之間,對于中老年人的同質(zhì)人群足跡還并未進行統(tǒng)計測量,所以目前系統(tǒng)誤差會受到一定的客觀制約。
[1]史力民.足跡學[M].北京:中國人民公安大學出版社,2007.
[2]Robbins LM.Footprints collection,analysis and interpretation.Springfield,IL: Charles C. Thomas,1985.
[3]Irene Atef Fawzy,Nashwa Nabil Kamal. Stature and Body Weight Estimation from Various F ootprint Measurements Among Egyptian Population [J]. Forensic Sic,2010,55(4):884-888.
[4]賈俊平,何曉群,金勇進.統(tǒng)計學[M].北京:中國人民公安大學出版社,20014.
Measure the Bare Footprint Though Using Multiple Regression Method to Analyze Homogeneous Population Height
QIAN Sheng-nan
(National Police University of China,Liaoning,Shenyang,110035)
By selecting 120 bare footprint samples the same areas,different ages and gender,measured respectively the distance of trailing edge pressure bumps to five toe front convex point and the distance of trailing edge pressure bumps into the ball inside and outside convex point.Using SPSS statistical analysis software for data to carry on the multiple regression analysis and stepwise regression analysis,finding there are linear relationship between the seven distance and height,set up corresponding mathematical model and obtained the regression equation,and compared the difference between misjudgment rate and accuracy rate.This is a more reliable and powerful method for using footprint analysis homogeneous population height.
bare footprint; homogeneous groups; analysis height; multiple regression
天下溪)
D918.91
A
2095-1140(2017)05-0033-04
2017-06-21
公安部2016年科技強警基礎(chǔ)工作專項項目“足跡步態(tài)特征的生物力學基礎(chǔ)研究”(2016GABJCD)
喬勝男(1992- ),女,河南靈寶人,中國刑事警察學院2015級痕跡檢驗專業(yè)碩士研究生,主要從事痕跡檢驗足跡研究;朱玉婷(1991- ),女,重慶人,中國刑事警察學院2015級痕跡檢驗專業(yè)碩士研究生,主要從事痕跡檢驗足跡研究。