鄔文蔚 周啟茹
上海市公安局浦東分局刑偵支隊(duì)刑事科學(xué)技術(shù)研究所,上海 200125
在鞋印識別中,鞋印幾何特征的有效提取變得非常關(guān)鍵。一般而言,對于鞋印圖像,描述其特征可以有不同的方式,比如:顏色特征、紋理特征、形狀特征、位置特征等。當(dāng)然,要實(shí)現(xiàn)圖像的匹配,提取到的特征,要具備獨(dú)特性、魯棒性、獨(dú)立性,為了便于處理和分析,這些特征點(diǎn)還具備數(shù)量少的要求,這就需要深入研究相關(guān)的提取技術(shù)和方法,在提取過程中能夠綜合應(yīng)用。
在刑事偵查中,工作人員會根據(jù)案發(fā)現(xiàn)場情況采集相應(yīng)的痕跡數(shù)據(jù),比如指紋、腳印、臉紋以及使用過的工具痕跡,這些痕跡對偵破案件提供了有力的幫助。但是,與其他痕跡相比,腳印痕跡具有獨(dú)特的優(yōu)勢,比如不容易被消除干凈,與人身特征具有非常緊密的關(guān)系,以此就可以推測出犯罪嫌疑人的年齡特征,以及其他相關(guān)的特點(diǎn),從而圈定嫌疑人的范圍,通過進(jìn)一步的處理,為案件的偵破提供有力的證據(jù),因此,鞋印識別在刑偵領(lǐng)域應(yīng)用非常廣泛。
鞋印圖像的預(yù)處理,是鞋印識別中的重要環(huán)節(jié),其處理結(jié)果直接關(guān)系到后續(xù)的各項(xiàng)分析。而預(yù)處理過程又包含多個(gè)流程,最終處理使得圖像輪廓變得凸顯、鞋印圖像變得清晰。
一般情況下,從現(xiàn)場采集到的圖像都是彩色的,從視覺效果來看,呈現(xiàn)的信息非常豐富。但是,在鞋印的幾何特征提取中,信息越豐富,意味著待處理的信息量很大,而且顏色在鞋印識別中意義不是很大,因此,需要將其灰度化處理,最終形成黑、白化的二值圖像。
具體處理可以使用像素的分量,也可以使用亮度等級進(jìn)行轉(zhuǎn)化,后者的處理,有一個(gè)很著名的心理學(xué)公式,其表達(dá)式為:gray=0.299R+0.587G+0.114B。在二值圖像上,提取有價(jià)值的點(diǎn)和線,是非常容易的,而且對于計(jì)算機(jī)而言,運(yùn)行速度也很快。
在鞋印的圖像處理過程中,會出現(xiàn)一些噪聲數(shù)據(jù),這些噪聲數(shù)據(jù)會成為特征提取的障礙。因此濾波主要是對噪聲數(shù)據(jù)進(jìn)行削減,對圖像質(zhì)量起到保護(hù)。當(dāng)然,在去噪和圖像質(zhì)量之間需要根據(jù)實(shí)際需求進(jìn)行平衡。從目前的技術(shù)來看,主要有均值濾波、線性濾波、中值濾波和高斯濾波。均值濾波可以利用圖像周圍的像素點(diǎn)的均值對此噪聲點(diǎn)進(jìn)行替換;線性濾波的主要功能是消除和模糊噪聲;中值濾波通過排序篩選出中間位置的點(diǎn)并以此點(diǎn)作為對噪聲點(diǎn)的替換;與前面方法相比,高斯濾波可以起到很好的濾波效果。
圖像銳化屬于圖像增強(qiáng)技術(shù),使圖像的質(zhì)量有所改善,物體的邊緣更加鮮明,其主要方法有微分法和高通濾波法。在算法實(shí)現(xiàn)上,主要有梯度算法、羅伯茨梯度算法、索伯爾(Sobel)算法、普瑞維特算法、拉普拉斯算法(二階差分)、LoG算法等。
當(dāng)然,每一種算法有其自身的應(yīng)用場景,但是,從實(shí)驗(yàn)效果來看,Roberts算法提取信息較弱;而Sobel算法和Priwitt算法處理效果基本相同;Laplacian算法可以脫離微分的計(jì)算原理,在模板系數(shù)的基礎(chǔ)上產(chǎn)生Laplacian變形算子,對噪聲比較敏感;Log邊緣算法也稱為拉普拉斯高斯算法,是效果較好的邊沿檢測器,具體工作過程是先平化掉噪聲,再進(jìn)行邊緣檢測,這樣在減少計(jì)算量的同時(shí),提高了算法的效率。
通過前面一系列的處理,獲取到的鞋印已經(jīng)是得到了去噪并得到強(qiáng)化的二值圖像,在此基礎(chǔ)上,就可以提取外紋輪廓特征和內(nèi)部紋理特征。當(dāng)然,為了使得提取的特征有效,并符合處理要求,就需要對其進(jìn)行降噪和矯正等處理。在一副圖像中,可以有很多描述圖像信息的特征,這些特征對圖像信息的貢獻(xiàn)大小不一,因此需要特定的方法進(jìn)行降維處理,其中最經(jīng)常使用的就是主成分分析,將貢獻(xiàn)大的篩選出來。
在此過程中,涉及到鞋印的二次定位,第一次定位是將鞋印邊緣輪廓上的點(diǎn)通過像素坐標(biāo)的方式生成一個(gè)2*n的矩陣,然后通過特定運(yùn)行抽取出構(gòu)造生成的協(xié)方差的特征值和特征向量,運(yùn)用主成分分析方法,在保證信息量丟失很少的前提下,得到較大的特征值和特征向量,再進(jìn)行圖像的旋轉(zhuǎn),從而完成第一次定位。然后,在提取出鞋印上、下、左、右四個(gè)點(diǎn),需要執(zhí)行從上到下、從下到上、從左到右和從右到左的搜索,得到這四個(gè)點(diǎn)后,左右、上下相連形成交點(diǎn),以該點(diǎn)為中心進(jìn)行鞋印的旋轉(zhuǎn)和變換,從而完成鞋印的第二次定位。這里所產(chǎn)生的上下左右四個(gè)點(diǎn),通過連接會形成一個(gè)四邊形,其作用主要是基于其邊長比及角度特征,簡化鞋印的外紋輪廓處理。
需要說明的是,通過上述過程得到的四個(gè)點(diǎn)形成的四邊形是一個(gè)不規(guī)則的四邊形,也就是說其變長極有可能都是不相同的,但是這對描述鞋印沒有任何影響,同樣在描述鞋印外紋輪廓上具有很強(qiáng)的魯棒性。
鞋印圖像經(jīng)過二次定位后,繼續(xù)對其做灰度化、四點(diǎn)搜索等處理,從而最終得到所需要的四邊形,對其求取四個(gè)角的角度,從而形成鞋印的外部輪廓特征。
獲取到鞋印的特征點(diǎn)后,就可以按照特定的方法計(jì)算特征點(diǎn)的相似度,以此度量鞋印的相似性,具體由多個(gè)數(shù)據(jù)屬性描述,通過距離的計(jì)算來刻畫。常用的度量方法有:歐式距離、馬氏距離、明氏距離、巴氏距離等。歐氏距離可以計(jì)算出相同維數(shù)上的不同點(diǎn)的空間距離,然而這些點(diǎn)必須處于維度相同的空間;馬氏距離是一種對協(xié)方差距離的計(jì)算,具有尺度無關(guān)性,但前提是需要已知類別樣本,從而限制了其使用的場景;明氏距離融合了歐氏距離和曼哈頓距離的優(yōu)勢,在度量上有一定的靈活性;巴氏距離消除了量綱對樣本測量的影響,用于測量兩離散概率分布,比較適合歸一化后的直方圖和模板向量相似度的計(jì)算。
這里根據(jù)鞋印識別的實(shí)際,在匹配過程中采用巴氏距離作為衡量標(biāo)準(zhǔn)。通過多次試驗(yàn),得到鞋印的相似度變化圖,見圖1。
在圖1中,橫軸表示鞋印圖像的個(gè)數(shù),縱軸表示相似度。從總體來看,相似度集中于兩個(gè)區(qū)間上,一個(gè)是0.4到0.5之間,一個(gè)是0.7到0.8之間,這說明了特征點(diǎn)與同一只鞋的相似度可以高達(dá)0.7以上,而與不同的鞋的相似度僅僅停留在0.4上下。從而可以說明,采用巴氏距離度量鞋印特征點(diǎn)的相似度,能很好地對鞋印進(jìn)行區(qū)分。
本文詳細(xì)闡述了鞋印幾何特征的提取過程,主要的環(huán)節(jié)有:鞋印的預(yù)處理、鞋印的第一次定位和第二次定位、外部輪廓特征提取、相似度匹配。事實(shí)上,在整個(gè)處理過程中,圖像的預(yù)處理非常的重要,一方面過濾掉不重要的數(shù)據(jù)點(diǎn),另一方面使得重要的信息凸顯出來,從而為后續(xù)的特征提取做好準(zhǔn)備。
[1]管燕,李元金.外輪廓與花紋特征相結(jié)合的平面鞋印圖像識別的研究[J].長江大學(xué)學(xué)報(bào)(自科版),2010,07(2):74-76.
[2]王紅星,張燕.基于整體特征的鞋印匹配算法[J].科學(xué)技術(shù)與工程,2017,17(15):268-272.
[3]管燕,李存華,仲兆滿.基于輪廓特征的平面鞋印自動(dòng)識別算法的研究和實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用研究,2008,25(8):2413-2415.