李穎 張曉雪等
摘 要:人機(jī)交換技術(shù)已成為日常生活中一個(gè)重要部分。比如,汽車(chē)導(dǎo)航技術(shù),醫(yī)療器械的設(shè)計(jì),游戲娛樂(lè),人臉識(shí)別,指紋識(shí)別等等技術(shù)都體現(xiàn)了人機(jī)交換的重要性。又由于手勢(shì)是包含信息量最多的人體語(yǔ)言。因此,本文主要研究手勢(shì)的識(shí)別,尤其是應(yīng)用在無(wú)線遙控車(chē)中的手勢(shì)識(shí)別技術(shù)。系統(tǒng)實(shí)現(xiàn)的重點(diǎn)和難點(diǎn)在于PC機(jī)的手勢(shì)識(shí)別部分。基于遙控車(chē)的設(shè)計(jì),本文對(duì)手勢(shì)識(shí)別技術(shù)方案設(shè)計(jì)如下:在手勢(shì)建模方面,采用基于表觀的手勢(shì)模型;在手勢(shì)分析方面,從原始圖像中抽取的輪廓、邊界、圖像矩確定采用的手勢(shì)特征;在手勢(shì)識(shí)別方面,采用模板匹配的方法進(jìn)行識(shí)別。
關(guān)鍵詞:手勢(shì)建模 手勢(shì)特征 模板匹配
中圖分類(lèi)號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2013)03(b)-0018-01
1 總體設(shè)計(jì)
本項(xiàng)目分為PC機(jī)端的手勢(shì)識(shí)別部分和遙控小車(chē)部分,系統(tǒng)功能是PC機(jī)安裝攝像頭,實(shí)時(shí)采集手勢(shì)圖像,根據(jù)手勢(shì)識(shí)別結(jié)果通過(guò)無(wú)線模塊對(duì)小車(chē)發(fā)送控制命令,使小車(chē)完成不同的動(dòng)作。本系統(tǒng)的總體結(jié)構(gòu)圖(如圖1)。
本系統(tǒng)手勢(shì)識(shí)別部分設(shè)計(jì)的結(jié)構(gòu)框圖(如圖2)。
2 手勢(shì)識(shí)別技術(shù)
手勢(shì)識(shí)別的技術(shù)方案如以下幾點(diǎn)。
2.1 手勢(shì)建模
在手勢(shì)識(shí)別框架中,手勢(shì)模型是一個(gè)最基本的部分。手勢(shì)建模主要分為基于表現(xiàn)的手勢(shì)模型與基于3 d的手勢(shì)模型?;诒碛^的手勢(shì)建模是一種二維建模,從二維平面觀察得到的平面圖像信息描述于的特征?;诒碛^的手勢(shì)模型主要包括基于顏色的模型與基于輪廓的模型兩種?;陬伾氖謩?shì)模型是把手勢(shì)圖像看作像素顏色的集合,通過(guò)提取手部的顏色的特征來(lái)描述手勢(shì)。對(duì)于一幅彩色圖像而言,顏色更利于將手勢(shì)識(shí)別出來(lái)。因此本文使用的是基于表現(xiàn)的手勢(shì)模型,主要是基于膚色的手勢(shì)識(shí)別。
(1)膚色分割,基于膚色彩色信息的檢測(cè),主要是根據(jù)膚色在空間分布的特點(diǎn),快速地找到手可能的候選區(qū)域,縮小后續(xù)細(xì)檢測(cè)的范圍,其檢測(cè)過(guò)程為。
彩色空間的轉(zhuǎn)換在計(jì)算機(jī)視覺(jué)中,彩色空間主要有RGB,HSV,HSI,YIQ,YUV等。由于RGB是最為常見(jiàn)的彩色空間,所以可以通過(guò)RGB不同的參數(shù)值將膚色從圖像中檢測(cè)出來(lái)。通過(guò)對(duì)圖像的RGB參數(shù)值進(jìn)行結(jié)果分析,R>30,G>15,B>2時(shí)手勢(shì)可以被模糊的識(shí)別出來(lái),但是達(dá)不到預(yù)期效果,所以本文采用了聚類(lèi)的方法來(lái)較為精準(zhǔn)的確定人手的候選區(qū)域,方法如下:需要從手勢(shì)取出50~80個(gè)能代表膚色的像素,統(tǒng)計(jì)手勢(shì)與該像素顏色相近的像素的數(shù)目。同時(shí),改變符合條件的像素的顏色,以確認(rèn)這些像素是否位于手勢(shì)上。得到手勢(shì)候選區(qū)域后進(jìn)行邊緣識(shí)別,除去自然界中存在著類(lèi)似膚色的信息。本文采用拉普拉斯算子實(shí)現(xiàn)邊緣跟蹤(如圖3)。
(2)手勢(shì)分析,手勢(shì)不變矩的定義:對(duì)于手勢(shì)圖像函數(shù)f(x,y),如果它分段連續(xù)且只在XOY平面上的有限個(gè)點(diǎn)不為0,則可以證明它的各階矩存在。手勢(shì)圖像的矩是用所有屬于手勢(shì)區(qū)域內(nèi)的點(diǎn)計(jì)算出來(lái)的,因而不太受噪聲的影響。所以可以用不變距的特性區(qū)分手勢(shì)[5]。
手勢(shì)有七個(gè)不變矩參數(shù),計(jì)算手勢(shì)輪廓的不變矩作為手勢(shì)的特征,首先根據(jù)八鄰域法所得到的輪廓矩,來(lái)確定手勢(shì)的輪廓函數(shù)f(x,y),f(x,y)中x和y分別為矩陣的標(biāo)號(hào),而函數(shù)值就是輪廓距中相應(yīng)標(biāo)號(hào)存儲(chǔ)的數(shù)值[4]。在確定手勢(shì)的輪廓函數(shù)f(x,y)之后,可計(jì)算兩個(gè)不變矩作為手勢(shì)的特征[1]。這個(gè)兩個(gè)不變矩特征都是具有旋轉(zhuǎn)平移和尺度不變性,同時(shí)具有很好的區(qū)分性能。
2.2 手勢(shì)識(shí)別
手勢(shì)識(shí)別有3種方法:模板匹配法、神經(jīng)網(wǎng)絡(luò)法、HMM。模板匹配方法是一種最簡(jiǎn)單的識(shí)別技術(shù),具有計(jì)算簡(jiǎn)單、速度快的特點(diǎn)。其核心的思想就是將輸入的原始數(shù)據(jù)與預(yù)先存儲(chǔ)的模板進(jìn)行匹配,通過(guò)測(cè)量?jī)蓚€(gè)模板之間的相似度來(lái)完成識(shí)別任務(wù)。所以本文采用模板匹配方法進(jìn)行手勢(shì)識(shí)別。
3 結(jié)語(yǔ)
目前,基于計(jì)算機(jī)視覺(jué)的靜態(tài)手勢(shì)識(shí)別技術(shù)研究很多,有基于幾何特征的手勢(shì)識(shí)別、基于人工神經(jīng)網(wǎng)絡(luò)的手勢(shì)識(shí)別等技術(shù),但仍然存在手勢(shì)目標(biāo)檢測(cè)困難、手勢(shì)目標(biāo)識(shí)別困難等技術(shù)難點(diǎn),所以,如何準(zhǔn)確、迅速地對(duì)實(shí)時(shí)手勢(shì)圖像進(jìn)行識(shí)別具有重要的研究意義。本文對(duì)手勢(shì)識(shí)別技術(shù)進(jìn)行研究,根據(jù)手勢(shì)識(shí)別結(jié)果對(duì)遙控車(chē)進(jìn)行控制,其研究成果為手勢(shì)識(shí)別的發(fā)展提供理論依據(jù)和實(shí)踐基礎(chǔ),為基于手勢(shì)識(shí)別技術(shù)的人機(jī)交互開(kāi)辟更廣泛的應(yīng)用領(lǐng)域。
參考文獻(xiàn)
[1]任海兵,祝遠(yuǎn)新,徐光祐,等.復(fù)雜背景下的手勢(shì)分割與識(shí)別[J].自動(dòng)化學(xué)報(bào),2002,28(2):256-261.
[2]Stokoe W C.Sign Language Structure:An Outline of the Visual Communication System of the American Deaf, 1960,Buffalo,NY:Linstok.
[3] 朱繼玉,王西穎,王威信,等.基于結(jié)構(gòu)分析的手勢(shì)識(shí)別[J].計(jì)算機(jī)學(xué)報(bào),2006,29(12):2130-2137.
[4]周航,阮秋琦.基于表現(xiàn)特征的手勢(shì)識(shí)別[J].廣西師范大學(xué)學(xué)報(bào),2003,21(1):25-30.
[5]葛元,郭興偉,王林泉.傅立葉描述子在手勢(shì)識(shí)別中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2005,22(6):12-13.