杜明坤 王茜儀 朱瑞
摘要:為減少利用足跡人工計(jì)算身高的誤差,提高身高分析的效率和準(zhǔn)確性,探索利用赤足跡多個(gè)長(zhǎng)寬特征和BP神經(jīng)網(wǎng)絡(luò)自動(dòng)分析身高的新方法。通過(guò)測(cè)量赤足跡獲得多個(gè)長(zhǎng)寬測(cè)量值,將多個(gè)測(cè)量值及其不同組合作為特征向量,以人的身高作為訓(xùn)練樣本和測(cè)試樣本的標(biāo)簽,并利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和分類,實(shí)現(xiàn)對(duì)身高的自動(dòng)分析。實(shí)驗(yàn)結(jié)果表明,該方法可以有效對(duì)身高進(jìn)行自動(dòng)分析,比傳統(tǒng)方法具有更高的準(zhǔn)確率,為利用完整赤足跡甚至殘缺赤足跡分析身高提供了新思路。
關(guān)鍵詞:赤足跡;BP神經(jīng)網(wǎng)絡(luò);長(zhǎng)寬特征;身高;自動(dòng)分析
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)31-0203-03
1引言
在實(shí)際工作中,通常根據(jù)現(xiàn)場(chǎng)勘查提取的足跡推算身高,以提供偵查線索,縮小偵查范圍,對(duì)案件的偵破具有重要作用。傳統(tǒng)分析身高的公式是“身高=赤足跡長(zhǎng)×7”,其操作簡(jiǎn)單易于計(jì)算,然而其推算身高的誤差較大,且赤足跡全長(zhǎng)的系數(shù)過(guò)大,在測(cè)量其長(zhǎng)度時(shí),稍有誤差就可能導(dǎo)致推測(cè)的身高與實(shí)際身高相差較大。本文對(duì)赤足跡各長(zhǎng)寬特征進(jìn)行研究,對(duì)其進(jìn)行測(cè)量獲得多個(gè)長(zhǎng)寬測(cè)量值,將相應(yīng)的測(cè)量值組合成不同的特征向量,再根據(jù)設(shè)置的誤差值將身高等分為多個(gè)區(qū)間,對(duì)每個(gè)區(qū)間進(jìn)行賦值作為不同類別的標(biāo)識(shí),利用BP神級(jí)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本特征向量和其相應(yīng)的類別標(biāo)識(shí)進(jìn)行訓(xùn)練,得到身高分類器,通過(guò)分類器對(duì)測(cè)試樣本特征向量進(jìn)行分類,推算其相應(yīng)的身高,并比較不同特征向量在設(shè)置不同誤差值時(shí)的準(zhǔn)確率,為利用完整赤足跡甚至殘缺赤足跡分析身高提供了更有效的新方法。
2特征提取
根據(jù)赤足跡的形態(tài)結(jié)構(gòu)特點(diǎn),本文主要利用赤足跡的多個(gè)長(zhǎng)寬值來(lái)進(jìn)行特征提取,獲得不同的特征向量,并用測(cè)量人的身高作為相應(yīng)特征向量的初始標(biāo)簽。測(cè)量的身高值由頭頂部與地板的垂直距離確定(在弗蘭克福水平面上頭的最高點(diǎn)),同時(shí)用于測(cè)量的赤足跡樣本通過(guò)油墨捺印獲取,即讓占有油墨的赤足通過(guò)行走將赤足跡遺留在紙張上。
2.1測(cè)量長(zhǎng)寬值
在測(cè)量多個(gè)長(zhǎng)寬值之前,需要先標(biāo)記出赤足跡的多個(gè)特征點(diǎn):跖內(nèi)緣最突點(diǎn);跖外緣最突點(diǎn);跟內(nèi)緣最突點(diǎn);跟外緣最突點(diǎn);跟后緣最突點(diǎn);最長(zhǎng)趾前緣最突點(diǎn);第二趾中心點(diǎn)。在此基礎(chǔ)上確定足跡中心線,然后測(cè)量相應(yīng)的長(zhǎng)寬值。
如圖1所示,A點(diǎn)為跖內(nèi)緣最突點(diǎn),B點(diǎn)為跖外緣最突點(diǎn),c點(diǎn)為跟內(nèi)緣最突點(diǎn),D點(diǎn)為跟外緣最突點(diǎn),E點(diǎn)為跟后緣最突點(diǎn),F(xiàn)點(diǎn)為最長(zhǎng)趾前緣最突點(diǎn),G點(diǎn)為第二趾中心點(diǎn),H點(diǎn)為過(guò)F點(diǎn)作EG延長(zhǎng)線的垂線的交點(diǎn),I點(diǎn)為EG延長(zhǎng)線與第二趾前緣的交點(diǎn),J點(diǎn)為EG與足趾前緣的交點(diǎn),其中足跡中心線為E和G兩點(diǎn)的連線。每個(gè)赤足跡的長(zhǎng)寬特征需要測(cè)量以下4個(gè)值:AB
3BP神經(jīng)網(wǎng)絡(luò)
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是Rumelhart、Williams、Hin-ton和McCelland等人的科學(xué)小組于1986年提出的概念,是一種按照誤差反向傳播算法訓(xùn)練的多層前饋神級(jí)網(wǎng)絡(luò),是一種有監(jiān)督的導(dǎo)師指導(dǎo)的學(xué)習(xí)方法。BP神經(jīng)網(wǎng)絡(luò)模型主要由三層組成,分別為輸入層、隱含層和輸出層,隱含層可為一層或者多層,每層網(wǎng)絡(luò)都由多個(gè)能夠進(jìn)行并行計(jì)算的神經(jīng)元構(gòu)成,其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
BP神級(jí)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程由信號(hào)的正向傳播和誤差的反向傳播兩個(gè)過(guò)程組成M,如圖2所示,實(shí)線表示信號(hào)的正向傳播,虛線表示誤差的反向傳播。
其中Ei為第i個(gè)訓(xùn)練樣本的誤差,tji為第i個(gè)樣本的第j個(gè)輸出層神經(jīng)元的的期望輸出。在正向傳播過(guò)程中,預(yù)設(shè)e為期望誤差精度,當(dāng)符合全局誤差E≤e時(shí),則終止當(dāng)前運(yùn)算,否則進(jìn)行誤差反向傳播過(guò)程。
誤差反向傳播誤差是指通過(guò)正向傳播得到的實(shí)際輸出與期望輸出之間的差值由輸出層輸入,經(jīng)過(guò)隱含層變換,最后傳到輸入層,在這一過(guò)程中,網(wǎng)絡(luò)的連接權(quán)值不斷被調(diào)節(jié)修正。為使誤差逐漸縮小,需要沿連接權(quán)值的負(fù)梯度方向進(jìn)行修正,隱含層和輸出層的連接權(quán)值修正量△Mjt與誤差的負(fù)梯度方向成正比,如公式(4)所示。
BP神經(jīng)網(wǎng)絡(luò)算法也可以說(shuō)是對(duì)誤差函數(shù)求極小值的算法,在正反兩個(gè)過(guò)程反復(fù)運(yùn)算中,不斷調(diào)整修正每層的連接權(quán)值和閾值,并比較全局誤差E與期望誤差精度e的大小,當(dāng)滿足全局誤差E≤e時(shí),則訓(xùn)練完成,并保存相應(yīng)的權(quán)值和閾值,否則繼續(xù)進(jìn)行迭代訓(xùn)練。
4基于赤足跡長(zhǎng)寬特征的身高自動(dòng)分析方法
在身高自動(dòng)分析方法中,本文有效利用赤足跡的多個(gè)長(zhǎng)寬特征信息,提取樣本不同的特征向量,再通過(guò)預(yù)設(shè)的誤差值將身高等分為多個(gè)區(qū)間,對(duì)每個(gè)區(qū)間進(jìn)行賦值作為不同類別的標(biāo)簽,根據(jù)每個(gè)樣本的身高所對(duì)應(yīng)的身高區(qū)間為其賦值新的類別標(biāo)簽數(shù)據(jù),最后結(jié)合BP神經(jīng)網(wǎng)絡(luò)算法對(duì)樣本進(jìn)行訓(xùn)練和分類,以提高身高分析準(zhǔn)確率。
對(duì)于w個(gè)樣本(xi,yi),將其按照一定的比例劃分成訓(xùn)練樣本集P和測(cè)試樣本集Q,分別記為(pxi,Pyi)和(Qxi,Qyi)。利用BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本集P上進(jìn)行訓(xùn)練,獲得分類器,再將分類器在測(cè)試樣本集Q上進(jìn)行分類測(cè)試,獲得身高分析的識(shí)別結(jié)果,具體步驟如下:
(1)構(gòu)建初始網(wǎng)絡(luò),將各個(gè)連接權(quán)值、閾值、期望誤差精度和學(xué)習(xí)率進(jìn)行初始化,并對(duì)訓(xùn)練樣本集進(jìn)行歸一化處理,使其轉(zhuǎn)化為直接用于計(jì)算的訓(xùn)練樣本數(shù)據(jù)和期望輸出。
(2)將標(biāo)準(zhǔn)化后的訓(xùn)練樣本輸入BP神經(jīng)網(wǎng)絡(luò),通過(guò)各層神經(jīng)元進(jìn)行正向傳播運(yùn)算,得到網(wǎng)絡(luò)的實(shí)際輸出。
(3)根據(jù)網(wǎng)絡(luò)運(yùn)算的實(shí)際輸出與給定的期望輸出計(jì)算得到網(wǎng)絡(luò)誤差,然后對(duì)網(wǎng)絡(luò)誤差是否滿足期望誤差精度的要求進(jìn)行判斷,如果滿足要求執(zhí)行(5);否則執(zhí)行(4)。
(4)進(jìn)行反向傳播運(yùn)算,計(jì)算出每層各個(gè)神經(jīng)元的連接權(quán)值修正量和每層神經(jīng)元的閾值修正量,然后對(duì)相應(yīng)的連接權(quán)值和閾值進(jìn)行修正,再返回(2)。
(5)訓(xùn)練完成,得到分類器。
(6)對(duì)測(cè)試樣本集進(jìn)行歸一化處理,利用分類器對(duì)其進(jìn)行測(cè)試,得到輸出結(jié)果,再對(duì)輸出結(jié)果進(jìn)行反歸一化,得到身高分析結(jié)果。
5實(shí)驗(yàn)結(jié)果與分析
為檢驗(yàn)本方法的有效性,將不同特征向量結(jié)合BP神經(jīng)網(wǎng)絡(luò)算法與傳統(tǒng)分析身高方法“身高=赤足跡長(zhǎng)×7”在身高誤差=1△1=1分析身高-實(shí)際身高1≤ri時(shí)分別進(jìn)行比對(duì)分析。按照訓(xùn)練樣本數(shù)量與測(cè)試樣本數(shù)量比值為8:1的原則,在樣本集中隨機(jī)選取訓(xùn)練樣本和測(cè)試樣本,進(jìn)行多次實(shí)驗(yàn)取均值作為實(shí)驗(yàn)結(jié)果。
由表1可以看出,用特征向量結(jié)合BP神經(jīng)網(wǎng)絡(luò)的方法均比傳統(tǒng)方法分析身高精確度更高。在身高誤差小于1cm時(shí),利用赤足長(zhǎng)(X1)+BP神經(jīng)網(wǎng)絡(luò)分析身高的準(zhǔn)確率最高(33.4%),傳統(tǒng)方法僅為8.3%。在身高誤差小于2cm時(shí),利用赤足長(zhǎng)和足跖寬(X6)+BP神經(jīng)網(wǎng)絡(luò)分析身高的準(zhǔn)確率最高(49.5%),其次為赤足長(zhǎng)(X1)+BP神經(jīng)網(wǎng)絡(luò)的方法(48.5%),傳統(tǒng)方法僅為15.6%。在身高誤差小于3cm時(shí),利用赤足長(zhǎng)和足跖寬(X6)+BP神經(jīng)網(wǎng)絡(luò)分析身高的準(zhǔn)確率最高(65.4%),其次為赤足長(zhǎng)(X1)+BP神經(jīng)網(wǎng)絡(luò)的方法(64.5%),傳統(tǒng)方法僅為24.4%。在身高誤差小于4cm時(shí),利用赤足長(zhǎng)(X1)+BP神經(jīng)網(wǎng)絡(luò)的方法分析身高的準(zhǔn)確率最高(71.8%),傳統(tǒng)方法僅為38.3%。在身高誤差小于5cm時(shí),利用赤足長(zhǎng)(X1)+BP神經(jīng)網(wǎng)絡(luò)的方法分析身高的準(zhǔn)確率最高(83.2%),傳統(tǒng)方法僅為44.9%。在各個(gè)誤差范圍內(nèi),本文方法均比傳統(tǒng)方法表現(xiàn)出了更高的分析準(zhǔn)確率,在身高誤差分別小于1cm、4cm和5cm時(shí),利用赤足長(zhǎng)(X1)+BP神經(jīng)網(wǎng)絡(luò)分析身高的準(zhǔn)確率最高;在身高誤差分別小于2cm和3cm時(shí),利用赤足長(zhǎng)和足跖寬(X6)+BP神經(jīng)網(wǎng)絡(luò)分析身高的準(zhǔn)確率最高,其次為赤足長(zhǎng)(X1)+BP神經(jīng)網(wǎng)絡(luò)的方法。
對(duì)于殘缺赤足跡,在無(wú)法測(cè)量赤足足跡全長(zhǎng)時(shí),可根據(jù)本文方法采用赤足跡局部部位的長(zhǎng)寬測(cè)量值提取特征向量,然后結(jié)合BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分析。例如,當(dāng)赤足跡缺少足跟部位時(shí),可以采用第二趾長(zhǎng)和足跖寬(X8)+BP神經(jīng)網(wǎng)絡(luò)的方法;當(dāng)赤足跡缺少足趾部位時(shí),可以采用足跖寬和足跟寬(X8)+BP神經(jīng)網(wǎng)絡(luò)的方法。不論采用何種特征組合的特征向量,其分析準(zhǔn)確率在不同身高誤差范圍內(nèi)均高于傳統(tǒng)方法,表現(xiàn)出較好的分析性能。
6結(jié)論
本文提出了一種基于赤足跡長(zhǎng)寬特征的身高自動(dòng)分析方法,根據(jù)赤足跡各長(zhǎng)寬測(cè)量值與身高存在關(guān)聯(lián)的特點(diǎn),利用赤足足跡全長(zhǎng)、第二趾長(zhǎng)、足跖寬和足跟寬的測(cè)量值提取不同的特征向量,然后通過(guò)預(yù)設(shè)的誤差值將身高等分為多個(gè)區(qū)間,為每個(gè)樣本重新賦值新的類別標(biāo)簽數(shù)據(jù),再結(jié)合BP神經(jīng)網(wǎng)絡(luò)算法對(duì)樣本進(jìn)行訓(xùn)練和分類,實(shí)現(xiàn)身高的自動(dòng)分析。實(shí)驗(yàn)結(jié)果表明,本文方法在選擇赤足長(zhǎng)(X1)或赤足長(zhǎng)和足跖寬(X6)特征向量時(shí),其分析性能最好,且不管利用何種特征向量均比傳統(tǒng)方法的分析準(zhǔn)確率高得多,同時(shí)為利用殘缺赤足跡分析身高提供了新方法。