祁國(guó)平,吳朝潤(rùn)
(中北大學(xué),山西太原 030051)
近年來(lái)國(guó)內(nèi)外對(duì)人臉識(shí)別、指紋識(shí)別方面的技術(shù)研究取得了一定的進(jìn)展,然而在人體行為識(shí)別與理解方面進(jìn)展不大,使得人體行為識(shí)別算法的研究仍然是當(dāng)前國(guó)內(nèi)外研究的熱點(diǎn)之一。研究人體行為識(shí)別的重點(diǎn)是特征提取和理解。人體行為識(shí)別要對(duì)人的某一行為進(jìn)行特征提取,然后根據(jù)肢體的位置以及其之間的角度等與模板進(jìn)行匹配。
本文采用傅里葉變換及其逆變換實(shí)現(xiàn)特征提取和選擇;sobel算子來(lái)實(shí)現(xiàn)圖像的處理——圖像銳化;最大最小距離算法實(shí)現(xiàn)分類(lèi)識(shí)別。并用Matlab7.0編寫(xiě)程序來(lái)實(shí)現(xiàn)。在Matlab7.0中實(shí)現(xiàn)對(duì)彎腰這一動(dòng)作的識(shí)別,主要用到傅里葉變換及逆變換,sobel算子,對(duì)從彩色圖像的十字和矩陣以及最大最小距離算法實(shí)現(xiàn)分類(lèi)識(shí)別[1]。
本文采用傅里葉變換及其逆變換實(shí)現(xiàn)特征提取和選擇,sobel算子來(lái)實(shí)現(xiàn)圖像的處理——圖像銳化,最大最小距離算法實(shí)現(xiàn)分類(lèi)識(shí)別。具體原理如圖1:
圖1 分類(lèi)識(shí)別原理
圖像去噪就是抑制圖像的噪音部分,圖像增強(qiáng)是增強(qiáng)圖像的邊緣,以獲得更好的顯示效果,這就需要增加圖像的高頻分量[2]。常見(jiàn)的圖像增強(qiáng)方法有對(duì)比度拉伸,直方圖均衡化,圖像銳化等。本文采用sobel算子進(jìn)行圖像銳化。
Sobel算子是濾波算子的形式,用于提取邊緣,可以利用快速卷積函數(shù),圖像的每一個(gè)像素的橫向及縱向梯度近似值可用以下的公式結(jié)合,來(lái)計(jì)算梯度的大小。
特征提取與選擇是對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類(lèi)本質(zhì)的特征,是由維數(shù)較高的測(cè)量空間到維數(shù)較低的特征空間[3]。本文中采用的是二維到一維的傅里葉變換以及三維到一維的傅里葉變換。二維到一維傅里葉計(jì)算Matlab實(shí)現(xiàn)如下:
把彩色十字:從圖像中提取RGB水平線條和垂直線的部分疊加到圖像的RGB彩色十字區(qū)Matlab中的函數(shù)及解釋:
chWidth:十字寬;
chHeight:十字高度;
lineWidth:十字的線條寬度;
chWidth,chHeight和lineWidth必須是單數(shù)!
chColor:3元向量[RGB]定義的十字線顏色的R,G和B分量;
R,G&B元素可以有任何值范圍[0,255];輸出圖像的類(lèi)型是RGB。
把彩色矩陣:繪制頂線,左線,底線,右線。matlab函數(shù)及解釋如下:
rgbImg=putColorRectangle(img,TLi,TLj,BRi,BRj,lineWidth,color)
IMG:給定的圖像
lineWidth:十字的線條寬度
chColor:3元向量[RGB]定義的R,G和B組成部分
矩形的R,G,&B元素的顏色可以有任何值范圍[0,255];輸出圖像的類(lèi)型是RGB。
本文采用最大最小距離算法來(lái)實(shí)現(xiàn)分類(lèi)判別,具體算法步驟:(1)選任意一個(gè)模式樣本作為第一個(gè)聚類(lèi)中心 Z1;(2)選距離Z1最遠(yuǎn)的樣本作為第二個(gè)聚類(lèi)中心Z2;(3)逐個(gè)計(jì)算各模式樣本{xi,i=1,2,…,N}與{Z1,Z2}之間的距離,并選出其中的最小距離min(Di1,Di2);(4)在所有模式樣本的最小值中選出最大距離,若該值達(dá)到‖Z1-Z2‖的一定比例以上,則相應(yīng)的樣本點(diǎn)取為第三聚類(lèi)中心 Z3;(5)重復(fù)以上步驟直到所有模式樣本都分類(lèi)[4]。
本文中的一些關(guān)于視頻操作的函數(shù)及其用法如下:aviinfo函數(shù)返回有關(guān)音頻/視頻交錯(cuò)(AVI)文件的信息。file info=aviinfo(filename);Aviread函數(shù)讀取音頻/視頻交錯(cuò)(AVI)文件。mov=aviread(filename,index);
Avifile函數(shù)創(chuàng)建一個(gè)新的音頻/視頻交錯(cuò)(AVI)文件。
avifile(filename,'PropertyName',value,'PropertyName',value,...);
Imwrite函數(shù)寫(xiě)入圖像圖形文件。imwrite(A,filename,fmt)
本文僅就彎腰這一動(dòng)作進(jìn)行視頻采集以及識(shí)別,并用matlab7.0實(shí)現(xiàn)。
圖2 行為采取結(jié)果
圖3 骨架提取結(jié)果
圖4 行為匹配結(jié)果
matlab7.0在圖像銳化,特征提取分類(lèi)匹配上基本實(shí)現(xiàn)了對(duì)彎腰這一動(dòng)作的識(shí)別。
本文對(duì)視頻中的行為圖像進(jìn)行特征提取,sobel算子圖像銳化,并對(duì)視頻進(jìn)行了行為提取和骨架提取及匹配,基本實(shí)現(xiàn)了行為的識(shí)別,Matlab在智能的實(shí)現(xiàn)上不太理想,以后在這方面進(jìn)行改進(jìn),希望能實(shí)現(xiàn)模式識(shí)別、Matlab、人工智能的良好結(jié)合。對(duì)人體的行為識(shí)別可以應(yīng)用于智能游戲機(jī),玩家可以站在屏幕前,機(jī)器對(duì)玩家的動(dòng)作進(jìn)行識(shí)別,從而讓玩家身臨其境進(jìn)入游戲場(chǎng)景。還可以對(duì)存在安全隱患的地方通過(guò)對(duì)攝像頭里人物行為識(shí)別提前提出警報(bào)。
[1]許志影,李晉平.MATLAB及其在圖像處理中的應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,2003(4):32-36.
[2]仇成群.MATLAB在汽車(chē)牌照?qǐng)D像處理識(shí)別系統(tǒng)中的應(yīng)用[J].儀器儀表用戶(hù),2008(6):57-59.
[3]張艷群,孟凡榮.MATLAB在圖像邊緣檢測(cè)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2004(6):23-26.
[4]潘仲明.MATLAB環(huán)境下目標(biāo)圖像的實(shí)時(shí)辨識(shí)方法[J].國(guó)防科技大學(xué)學(xué)報(bào),2002(1):102-106.