余問(wèn)鼎,劉 春,邵雄凱
(湖北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,湖北 武漢 430068)
?
基于手指幾何特征的移動(dòng)設(shè)備視覺(jué)手勢(shì)識(shí)別研究
余問(wèn)鼎,劉春,邵雄凱
(湖北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,湖北 武漢 430068)
摘要在以往的視覺(jué)手勢(shì)識(shí)別技術(shù)的基礎(chǔ)上,具體研究手勢(shì)的幾何特征,提出了一種能在移動(dòng)設(shè)備上流暢運(yùn)行的視覺(jué)手勢(shì)識(shí)別方法。通過(guò)移動(dòng)設(shè)備的攝像頭提取手勢(shì)原始圖像,進(jìn)而利用膚色識(shí)別得到手勢(shì)的二值化圖像。通過(guò)對(duì)手勢(shì)的二值化圖像進(jìn)行幾何特征分析,選取有價(jià)值的幾何特征值,通過(guò)特征匹配得到手勢(shì)含義。將手勢(shì)信息作為控制移動(dòng)設(shè)備的指令,操縱移動(dòng)設(shè)備。本文選取Android作為試驗(yàn)平臺(tái),經(jīng)測(cè)試表明,該方法在Android設(shè)備上的運(yùn)行周期約為120ms,正確率接近90%,保證了手勢(shì)識(shí)別的實(shí)時(shí)性和準(zhǔn)確性。
關(guān)鍵詞手勢(shì)識(shí)別;Android;膚色識(shí)別;特征匹配
移動(dòng)設(shè)備的主要操作流程是觸控,但是在特殊應(yīng)用場(chǎng)景下,如油田、礦山等場(chǎng)所,由于高粉塵、油污和噪音的存在,觸控、聲控制操作并不方便使用,而手勢(shì)作為一種自然直觀的人機(jī)交互方式更適合于這些地方,因此在移動(dòng)設(shè)備上手勢(shì)識(shí)別的開(kāi)發(fā)具有十分重要的意義。早在1993年托馬斯就提出了用手套的方式來(lái)進(jìn)行手勢(shì)的人工交互[1]。雖然識(shí)別準(zhǔn)確但是由于手套外設(shè)的存在對(duì)于用戶來(lái)說(shuō)仍然不夠友好。之后提出用視覺(jué)方式來(lái)識(shí)別手勢(shì)含義,其中包含模板匹配法和數(shù)學(xué)統(tǒng)計(jì)法。手勢(shì)識(shí)別的發(fā)展也日進(jìn)完善。但是上述方法大多是基于圖像在PC端的手勢(shì)識(shí)別。但基于移動(dòng)設(shè)備端的手勢(shì)識(shí)別仍然存在些許空白。畢竟移動(dòng)設(shè)備與傳統(tǒng)計(jì)算機(jī)相比性能方面還存在較大的差異,在傳統(tǒng)計(jì)算機(jī)上適用的方法移植到移動(dòng)設(shè)備上很可能無(wú)法使用。若要保證較高的識(shí)別準(zhǔn)確度,則必須設(shè)計(jì)更精密的識(shí)別流程,從而提高算法復(fù)雜度。然而,由于移動(dòng)設(shè)備性能較低,高準(zhǔn)確度的設(shè)計(jì)會(huì)嚴(yán)重影響到識(shí)別的實(shí)時(shí)性。反之,若過(guò)分要求實(shí)時(shí)性,則算法的準(zhǔn)確性便無(wú)法保證。如何取舍是需要克服的一個(gè)難點(diǎn)。本文著重研究手勢(shì)的幾何特征,找到最能體現(xiàn)手勢(shì)特征的特征值,提出一種實(shí)時(shí)模板匹配算法,能夠在手機(jī)等設(shè)備上流暢運(yùn)行,對(duì)復(fù)雜圖像背景有一定的適應(yīng)性,在經(jīng)過(guò)訓(xùn)練后識(shí)別準(zhǔn)確率可達(dá)到90%。
1手勢(shì)分析與特征值選取
文獻(xiàn)[2]利用hausdorff距離匹配的方法實(shí)現(xiàn)了手語(yǔ)字母的識(shí)別,計(jì)算量小,適應(yīng)性強(qiáng),很適合移植到移動(dòng)設(shè)備之上。但是文中未考慮手勢(shì)旋轉(zhuǎn)、縮放等問(wèn)題,實(shí)用性較低。文獻(xiàn)[3]利用小波矩來(lái)描述手勢(shì)輪廓,從而實(shí)現(xiàn)利用手勢(shì)來(lái)輸入字母。小波矩具有良好的旋轉(zhuǎn)、平移、縮放不變性[4],但計(jì)算量大,運(yùn)算較為緩慢,并不適用于移動(dòng)設(shè)備。文獻(xiàn)[5]以手勢(shì)重心為基準(zhǔn),提取手勢(shì)密度分布特征從而判斷手勢(shì)含義,計(jì)算量小,有良好的旋轉(zhuǎn)不變性。但選取特征值較少并有一定的局限性,實(shí)際測(cè)量準(zhǔn)確性較低。
為了保證認(rèn)別的準(zhǔn)確性、實(shí)用性和實(shí)時(shí)性,本文在選取特征值需要考慮其全局性特征。在經(jīng)典的圖像特征描繪算子的研究中,全局的幾何特征如面積、周長(zhǎng)、長(zhǎng)軸、短軸、方向,凹凸面積、緊密性和偏心率都得到了廣泛的應(yīng)用,在手勢(shì)特征值的選取時(shí)可以起到一定的參考作用。
A(長(zhǎng)軸/短軸);一個(gè)幾何圖形給我們最直接的第一印象可能就是它的“高、矮、胖、瘦”。而在手勢(shì)識(shí)別的過(guò)程中,這些特點(diǎn)也是非常直觀和清晰的特征。如圖1所示,數(shù)值1的手勢(shì)和數(shù)值7的手勢(shì)相比較而言要顯得“高瘦”,相反手勢(shì)7則顯得更加“矮胖”。本文選取特征值A(chǔ)(長(zhǎng)軸/短軸)來(lái)表示手勢(shì)的這一特征。長(zhǎng)軸與短軸的比能粗略的區(qū)分手勢(shì)的外形,同時(shí)容易獲取,也不受縮放影響。
凸性C和緊性T;凸性C定義為外輪廓面積/外輪廓凸包面積,分母凸包為手勢(shì)外輪廓外接矩形的面積,而分子則是手勢(shì)的真實(shí)面積,若手勢(shì)凸出部分越多,則兩者的差距就越大,從而c值就越小。在手勢(shì)識(shí)別中可以有效的區(qū)分某些手勢(shì),如圖2所示,手勢(shì)5和手勢(shì)9,在凸性上就有明顯的差別。緊性T定義為手勢(shì)輪廓的平方/手勢(shì)輪廓面積,從定義上來(lái)看,其輪廓越是“緊密”的圖形,緊性就越大,能比較直觀的描述出手勢(shì)輪廓的基本狀態(tài)。這兩個(gè)特征值均是幾何學(xué)上經(jīng)典的全局性特征。由于兩者的值都是由兩個(gè)面積的比而得出,因此這兩個(gè)特征都具有縮放不變性和旋轉(zhuǎn)不變性。
重心的相對(duì)行數(shù)G;重心也是一個(gè)比較直觀的手勢(shì)特征,不同的手勢(shì)可能存在較大的重心差異。選取重心的相對(duì)行數(shù)G(重心的y坐標(biāo)/長(zhǎng)軸)作為特征值。認(rèn)為手勢(shì)二值圖最寬的一行(白色像素最多)最為重心所在的行數(shù),與長(zhǎng)軸相除保證的特征值的縮放不變性。如圖3所示,手勢(shì)5與手勢(shì)7的相對(duì)重心行數(shù)存在明顯的差異。
這些特征值選取后的優(yōu)點(diǎn)是:便于計(jì)算、抗干擾能力較強(qiáng)。但是,由于個(gè)體的差異及動(dòng)作的差異,即使表達(dá)同一含義的手指組合,其形狀變化也比較大,如圖4所示。同一含義的手指組合,其形狀變化也比較大,如圖5所示。
若只是考慮全局性變量,會(huì)很容易對(duì)手勢(shì)進(jìn)行誤判。試驗(yàn)過(guò)程中發(fā)現(xiàn),手勢(shì)所表達(dá)的信息絕大多數(shù)來(lái)自于手指,而手掌表達(dá)的信息量極其有限。因此若能掌握手勢(shì)手指特征,那么對(duì)識(shí)別的準(zhǔn)確率將會(huì)有很大的幫助手指的伸出,是最為直觀的手勢(shì)特征,可以說(shuō),如果可以確定手勢(shì)中那些手指是伸出狀態(tài),那些手指是收起狀態(tài),那么就可以基本確定大部分手勢(shì)的表達(dá)含義。由前文對(duì)比得知,雖然手指組合有些許不同,但是表示上依然是伸出三個(gè)手指,手指?jìng)€(gè)數(shù)并沒(méi)有改變。因此本文選取手指伸出個(gè)數(shù)(除拇指外)F作為特征值之一,同時(shí)考慮到拇指有別于其他四個(gè)手指,故單獨(dú)作一個(gè)特征值U表示拇指的狀態(tài)。
圖1 特征值A(chǔ)實(shí)例對(duì)比
圖2 凸性實(shí)例對(duì)比
圖3 重心相對(duì)行數(shù)實(shí)例對(duì)比
圖4 相同動(dòng)作的手勢(shì)差異性
圖5 相同含義的手勢(shì)組合差異性
2手勢(shì)識(shí)別基本流程
本文采用Android設(shè)備作為試驗(yàn)平臺(tái),目的在于在平臺(tái)上實(shí)現(xiàn)快速準(zhǔn)確的識(shí)別代表數(shù)值1~9的九個(gè)手勢(shì)。圖6展示手勢(shì)識(shí)別的基本流程。首先調(diào)用攝像頭,控制曝光時(shí)間對(duì)手勢(shì)進(jìn)行拍攝,提取手勢(shì)圖像。然后利用色彩空間對(duì)手勢(shì)圖像進(jìn)行膚色提取,得到膚色二值圖像。根據(jù)膚色圖像和連續(xù)邊界對(duì)圖像進(jìn)行淡化然后對(duì)二值圖像進(jìn)行切割,濾波等預(yù)處理。接下來(lái)使用特定算法提取手勢(shì)的多個(gè)特征值。最后通過(guò)多個(gè)特征值的數(shù)據(jù)來(lái)分析出手勢(shì)所表達(dá)的具體含義。
圖6 手勢(shì)識(shí)別基本流程圖
膚色識(shí)別的方法基本都采用閾值法。但是由于不同的色彩空間的存在,所以膚色提取的方法也就多種多樣。不同的色彩空間下的膚色提取會(huì)有不同的效果。YCrCb空間膚色提取是一種很經(jīng)典的膚色提取方法。Y表示亮度,Cr表示色度,Cb表示飽和度。由于把亮度Y單獨(dú)分離出來(lái),是由于膚色提取的過(guò)程中,效果受亮度的影響較小,膚色的聚類性更好,所以常常作為膚色提取的方法。一般認(rèn)為133 Y=16+(0.0257R+0.504G+0.098B) Cb=128+(-0.148R-0.291G+0.439B) Cr=128+(0.439R-0.368G-0.071B) 通過(guò)具體測(cè)試,發(fā)現(xiàn)這兩種方法在復(fù)雜背景下效果最佳,但是多少還是會(huì)存在噪點(diǎn)。而如果手勢(shì)區(qū)域內(nèi)的噪點(diǎn)過(guò)多,會(huì)導(dǎo)致手勢(shì)走形,而讓后續(xù)特征提取變得非常困難。為了解決這個(gè)問(wèn)題,本文將兩種方法做與運(yùn)算,使其相互填補(bǔ)空缺,使得手勢(shì)二值圖像變得“豐滿”[7],保證手勢(shì)的完整性。最后用腐蝕膨脹等方法對(duì)圖像進(jìn)行濾波出來(lái),得到相對(duì)清晰的手勢(shì)二值圖像。 值得一提的是,當(dāng)今移動(dòng)設(shè)備攝像頭動(dòng)輒上百萬(wàn)甚至上千萬(wàn)像素。圖像包含如此大的信息量會(huì)對(duì)圖像的分析速度造成處理時(shí)間的延遲。而對(duì)于手勢(shì)識(shí)別來(lái)說(shuō),高清晰并不一定會(huì)帶來(lái)高準(zhǔn)確率,設(shè)備只要得到手勢(shì)的輪廓就即可。因此,利用compress函數(shù)對(duì)原始圖像進(jìn)行一定的壓縮,可以大大提升程序的運(yùn)行速度。 對(duì)于移動(dòng)設(shè)備來(lái)說(shuō),膚色會(huì)因場(chǎng)景的光照變換而產(chǎn)生較大的幅度波動(dòng),并且復(fù)雜背景下類膚色的異物會(huì)嚴(yán)重影響手勢(shì)的提取和判斷。 當(dāng)前運(yùn)動(dòng)目標(biāo)的檢測(cè)方法主要有三類:光流法、幀間差分法和背景差分法[8]。光流法能夠在預(yù)先不知道場(chǎng)景任何信息的條件下,檢測(cè)出獨(dú)立運(yùn)動(dòng)的對(duì)象,但計(jì)算復(fù)雜耗時(shí),難以滿足實(shí)時(shí)檢測(cè)的要求;幀間差分法有很強(qiáng)的自適應(yīng)性,但對(duì)進(jìn)行差分的幀的選擇時(shí)機(jī)要求較高,而且有賴于運(yùn)動(dòng)物體的運(yùn)動(dòng)速度和幀選取時(shí)機(jī)。背景差分法實(shí)現(xiàn)最簡(jiǎn)單,并且能夠完整地分割出運(yùn)動(dòng)目標(biāo),然而這種方法需要解決運(yùn)動(dòng)物體對(duì)應(yīng)象素點(diǎn)的更新問(wèn)題。 對(duì)于移動(dòng)設(shè)備而言,若應(yīng)用廠家變化較少,則可以用改進(jìn)的背景差值法來(lái)減少背景對(duì)手勢(shì)提取的干擾。即在啟動(dòng)攝像頭拍攝手勢(shì)圖像之前,先用設(shè)備攝像頭拍攝一張當(dāng)前的背景圖片。后將背景圖像像素與當(dāng)前圖像像素進(jìn)行異或運(yùn)算。在背景為靜止的場(chǎng)合,設(shè)置適當(dāng)?shù)拈撝悼梢缘玫捷^為理想的目標(biāo)手勢(shì)提取圖片。不過(guò)對(duì)于移動(dòng)設(shè)備而言,要求背景完全靜止的要求常常無(wú)法達(dá)到,而本文中手勢(shì)的運(yùn)動(dòng)速度相對(duì)較慢,因此可采用幀間差分法來(lái)獲取目標(biāo)手勢(shì),即將攝像頭拍攝的多張圖片兩兩進(jìn)行差分運(yùn)算,把各圖片幀中屬于背景的象素點(diǎn)先檢測(cè)出來(lái),重組出背景幀。然后用幀差法檢測(cè)當(dāng)前圖像和重組出的背景圖像中對(duì)應(yīng)像素點(diǎn)的差異,如果差值大于一定的閾值,則判斷為目標(biāo)手勢(shì)。在提取背景幀的過(guò)程中由于用幀間差分法消除了運(yùn)動(dòng)背景物體對(duì)應(yīng)像素點(diǎn)的影響,因而能夠得到較為干凈的目標(biāo)手勢(shì)圖(圖7)。 原始圖像 本文采取的方法 YCrCb閾值法 RGB閾值法 在實(shí)際檢測(cè)的過(guò)程中,得到的手勢(shì)圖像不可能如同模板一般標(biāo)準(zhǔn)。因此需要對(duì)圖像進(jìn)行角度變換和分割。最小面積外接矩形(Minimum Area Bounding Rectangle, 簡(jiǎn)稱MBR)在手勢(shì)研究中能夠比較清楚的表達(dá)手勢(shì)的分部情況。因此,本文選擇將手勢(shì)以最小外接矩形進(jìn)行切割,之后再對(duì)分割出的矩形矯正,進(jìn)而與模板進(jìn)行匹配。此方法能有效的剔除原圖像中的無(wú)用信息,減少算法復(fù)雜度,同時(shí)能夠解決在實(shí)際檢測(cè)中手勢(shì)偏轉(zhuǎn)的問(wèn)題。 在數(shù)字圖像中,曲線可以被看作是若干個(gè)線段收尾相接。因此求手勢(shì)輪廓的最小面積外接矩形,可以相當(dāng)于是求一個(gè)復(fù)雜多邊形的最小外接矩形。文獻(xiàn)[9]證明了任意一個(gè)多邊形的最小面積外接矩形及為該多邊形凸包的最小面積外接矩形,因此只要找到了凸包的最小外接矩形,也就找到了手勢(shì)的最小外接矩形。 本文選取使用Canndy算子來(lái)提取手輪廓。在得到手勢(shì)輪廓之后,將輪廓上點(diǎn)的坐標(biāo)集合記做P,求最小坐標(biāo)集S,使得S構(gòu)成的多邊形能夠包含P。而S構(gòu)成的多邊形就是手勢(shì)的凸包。計(jì)算圖形凸包的算法已經(jīng)非常成熟了,這里考慮到算法復(fù)雜度,選取Barber提出的快速凸包生成算法[10]求得坐標(biāo)集S。 對(duì)于平面多邊形來(lái)說(shuō),總存在一條最佳擬合直線,平面多邊形的定點(diǎn)到該直線的平方和為最小[11]。對(duì)于一般的封閉輪廓的多邊形,最佳擬合直線即是它的長(zhǎng)軸。當(dāng)圖形為鏡像對(duì)稱圖形時(shí)候,該直線則為圖像的對(duì)稱軸。顯然,手勢(shì)的凸包不是鏡像對(duì)稱圖形,因此,手勢(shì)凸包的最佳擬合直線就是手勢(shì)的長(zhǎng)軸(圖8)。 利用坐標(biāo)集合S即可求出最佳擬合直線: (1) 凸包定點(diǎn)Si(xi,yi)到直線的距離為: (2) 進(jìn)一步推導(dǎo),得到關(guān)于k的方程為: k2(n∑xiyi-∑xi∑yi) (3) 解出k為最佳擬合直線的斜率。當(dāng)方程的二次項(xiàng)系數(shù)趨近于0的時(shí)候,k取無(wú)窮大,此時(shí),直線與y坐標(biāo)軸垂直。同時(shí)根據(jù)k值得大小,可以求取坐標(biāo)軸夾角。以圖像重心旋轉(zhuǎn)圖像,使最長(zhǎng)軸與y軸垂直。若長(zhǎng)軸與y軸的夾角大于45°,則旋轉(zhuǎn)圖像時(shí)使長(zhǎng)軸與x軸平行。最后求取最小綁定矩形即可。 手勢(shì)凸包與頂點(diǎn) 最佳擬合直線與偏轉(zhuǎn)角度 檢測(cè)出手指的伸展情況能有效的辨別手勢(shì)含義。首先對(duì)分割的圖像進(jìn)行簡(jiǎn)單的分割。從上至下掃描手勢(shì)二值圖像,取白色像素最多的行作線段cd,并記錄所在行數(shù)l1與像素個(gè)數(shù)i。再次從上至下掃描得到首次滿足像素個(gè)數(shù)為2/3i的行數(shù),記作ab,記錄ab的行數(shù)l2;如圖9所示,ab認(rèn)為是手指與手掌分割線。得到手指特征只需要掃描ab之上的區(qū)域即可。具體方法如下:從上之下掃描圖像,到2/3 l2即止。記錄每一行穿過(guò)一定寬度白色區(qū)域的個(gè)數(shù)kn。n為行數(shù)。得到集合{k1,k2,k3,……kn},取集合中大小相同個(gè)數(shù)最多的k值作為除拇指外手指伸出的個(gè)數(shù)。 圖9 手指掃描 如圖10所示,掃描ab和cd之間的位置來(lái)確認(rèn)拇指是否張開(kāi)。具體方法是,從ab端向cd端掃描。掃描過(guò)程中,若存在某行,掃描線穿過(guò)兩個(gè)白色,并且白色區(qū)域均大于某個(gè)特定值,即認(rèn)為此行為拇指和手掌分開(kāi)的部分。此類行數(shù)用i從0開(kāi)始計(jì)數(shù),當(dāng)掃描線穿過(guò)白色像素區(qū)域變成1或者掃描線達(dá)到cd時(shí),掃描停止。若i大于一定的數(shù)值時(shí),認(rèn)為拇指為張開(kāi)狀態(tài),否則拇指為閉合狀態(tài)。 圖10 拇指掃描 3手勢(shì)匹配與試驗(yàn)結(jié)果 本文以多個(gè)手勢(shì)特征值作為參數(shù),判斷手勢(shì)表達(dá)的含義。前文介紹了手勢(shì)的預(yù)處理和多個(gè)特征值的提取方法。在具體實(shí)驗(yàn)過(guò)程中,需要對(duì)大量的模板做訓(xùn)練工作。得到各個(gè)模板的特征參數(shù)的閾值用作匹配的模板。而在實(shí)際測(cè)量的過(guò)程中,本文采用測(cè)量與判斷同時(shí)進(jìn)行的方法進(jìn)行匹配。 特征A(長(zhǎng)軸/短軸)和U(拇指是否伸出)是一個(gè)非常直觀的手勢(shì)特征。當(dāng)A>1時(shí),被認(rèn)為手掌呈豎直狀態(tài)。而當(dāng)A<1時(shí),手勢(shì)呈水平狀態(tài)。此時(shí),上述的F和U的測(cè)量不利于手勢(shì)的判斷。因此,在實(shí)際識(shí)別的過(guò)程中,先檢測(cè)特征值A(chǔ)。再分三種方式判斷手勢(shì)含義: (1)若A≥1。則檢測(cè)剩下特征值,利用其判斷手勢(shì); (2)若A<1則不檢測(cè)F和U,利用T,C,G來(lái)判斷手勢(shì),減少算法復(fù)雜度。 表1為手勢(shì)模板各個(gè)特征參數(shù)??梢钥闯霾煌氖謩?shì)之間特征參數(shù)有明顯的差異。當(dāng)A≥1,拇指未伸出時(shí),手指?jìng)€(gè)數(shù)即代表手勢(shì)含義,而當(dāng)A<1時(shí),兩手勢(shì)的重心位置有明顯的差異,手勢(shì)7的重心在手勢(shì)圖像的上半?yún)^(qū)域,而手勢(shì)8的重心在手勢(shì)圖像的下半個(gè)區(qū)域。由此證明,本文方法可以有效識(shí)別模板手勢(shì)。 表1 特征參數(shù)表 對(duì)每個(gè)手勢(shì)進(jìn)行500次具體識(shí)別實(shí)驗(yàn),驗(yàn)證其識(shí)別成功率。測(cè)量設(shè)備為Android4.0系統(tǒng), Snapdragon MSM8260雙核處理器,512RAM手機(jī)。如表2所示,測(cè)得各個(gè)手勢(shì)的正確率大多在90%以上,程序平均運(yùn)行時(shí)間為120ms。說(shuō)明了該本文提出的方法在Android設(shè)備上有一定的實(shí)時(shí)性和準(zhǔn)確性。 表2 實(shí)驗(yàn)結(jié)果表 相較于經(jīng)典繪子描述法,本文選取的特征值提取簡(jiǎn)單,計(jì)算量少,系統(tǒng)的實(shí)時(shí)性高。而對(duì)比普通的模板匹配,本文詳細(xì)分析了手指特征,抓住了手勢(shì)變化中的關(guān)鍵性特征,使得系統(tǒng)同時(shí)保證了實(shí)時(shí)性和準(zhǔn)確性。由于算法簡(jiǎn)潔,計(jì)算量小,可以預(yù)見(jiàn)該系統(tǒng)具有良好的移植性。 手勢(shì)識(shí)別作為一個(gè)自然的交互方式,在特定應(yīng)用場(chǎng)景下具有重要作用。本文利用了全局性特征作為判斷手勢(shì)的依據(jù)。對(duì)縮放、平移和旋轉(zhuǎn)都具有一定的魯棒性。同時(shí)在手勢(shì)識(shí)別的過(guò)程中采用優(yōu)化算法,保證了移動(dòng)智能設(shè)備上的運(yùn)算實(shí)時(shí)性。但是運(yùn)算正確率還有進(jìn)一步的提升空間,未來(lái)將嘗試多特征的不同組合來(lái)提高判別率。 參考文獻(xiàn): [1]許艷旭,張崎,武霞.基于OpenCV的實(shí)時(shí)手勢(shì)識(shí)別算法研究[J].信息技術(shù),2013,(4):99-102. [2]Zhang L G, Wu J Q, Gao W,etal. Hand gesture recognition based on hausdorff distance[J]. Journal of Image and Graphics,2002,7(7):1144-1150. [3]陳昆偉,郭星,吳建國(guó).基于手勢(shì)識(shí)別的文字輸入系統(tǒng)[J].計(jì)算機(jī)工程與應(yīng)用,2015,(3):66-68. [4]孫曉麗.基于小波矩特征的小波神經(jīng)網(wǎng)絡(luò)目標(biāo)識(shí)別研究[D].東南大學(xué),2006. [5]楊波,宋曉娜,馮志全,等.復(fù)雜背景下基于空間分布特征的手勢(shì)識(shí)別算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010,22(10):1841-1848. [7]張爭(zhēng)珍,石躍祥.YCgCr與YCgCb顏色空間的膚色檢測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2010,46, 34, 167-170. [8]許敬,張合,張祥金.基于幀間差分和光流法的紅外圖像運(yùn)動(dòng)檢測(cè)[J].計(jì)算機(jī)仿真,2012,(6):248-252. [9]程鵬飛,閆浩文,韓振輝.一個(gè)求解多邊形最小面積外接矩形的算法[J].圖學(xué)學(xué)報(bào),2008,29(1):122-126. [10]余翔宇,孫洪,余志雄.改進(jìn)的二維點(diǎn)集凸包快速求取方法[J].武漢理工大學(xué)學(xué)報(bào),2005,27(10):81-83. [11]田懷文,李濤.反求建模中的形狀特征分析[C].中國(guó)計(jì)算機(jī)圖形學(xué)大會(huì),2004. 編輯喻曉敏 Study on visual gesture recognition by mobile devices based on finger geometry characteristics YU Wen-ding, LIU Chun, SHAO Xiong-kai (School of Computer, Hubei University of Technology, Wuhan 430068, Hubei, China) AbstractThis study, drawing on prior visual gesture recognition technologies, particularly focuses on the geometrical characteristics of gestures and there is proposed a visual gesture recognition method being able to run smoothly on mobile devices. The original gesture images are captured using a mobile device camera, the binarized gesture images being obtained by means of skin color recognition. Geometrical characterization analysis of binarized gesture images helps to determine useful geometrical characteristic values so that the gesture meanings are found by characteristics matching. The gesture information is then interpreted as instructions that control and operate the device. The test platform used by this paper was Android and the testing made clear that with an Android device this method has an operation cycle of about 120ms and a correct rate close to 90%, guaranteeing the real-timeliness and accuracy of gesture recognition. Key wordsgesture recognition; Android; skin recognition; feature matching 作者簡(jiǎn)介余問(wèn)鼎,男,湖北武漢人,碩士,主要研究方向?yàn)榍度胧介_(kāi)發(fā)與設(shè)計(jì)。 收稿日期2015-09-22 doi10.3969/j.issn.1003-8078.2015.06.20 中圖分類號(hào)TP3 文獻(xiàn)標(biāo)志碼A 文章編號(hào)1003-8078(2015)06-0074-062.2 手勢(shì)分割與偏轉(zhuǎn)矯正
2.3 手指?jìng)€(gè)數(shù)特征值的提取
2.4 拇指動(dòng)作特征值的提取