羅國強 李家華 左文濤 方斌
摘? ?要:計算機視覺技術在現(xiàn)代社會中獲得了非常廣泛的應用,加強對手勢識別技術的研究有助于促進社會智能化的快速發(fā)展。目前,手勢識別技術的實現(xiàn)需要完成圖形預處理、手勢檢測以及場景劃分以及手勢識別3個步驟。此外,手勢特征可以分為動態(tài)手勢以及靜態(tài)手勢,在選用手勢識別方法時要明確兩者之間的區(qū)別,通常情況下選用的主要手勢識別技術有運用模板匹配的方法、運用SVM的動態(tài)手勢識別方法以及運用DTW的動態(tài)手勢識別方法等。文章對此展開研究。
關鍵詞:計算機視覺;手勢識別;方法
隨著現(xiàn)代科學技術水平的不斷發(fā)展,計算機硬件與軟件部分都獲得了較大的突破,由此促進了以計算機軟硬件為載體的計算機視覺技術的進步,使得計算機視覺技術廣泛地應用到多個行業(yè)領域中。手勢識別技術就是其中非常典型的一項應用,該技術建立在計算機視覺技術基礎上來實現(xiàn)人類與機器的信息交互,具有良好的應用前景和市場價值,吸引了越來越多的專家與學者加入到手勢識別技術的研發(fā)中。手勢識別技術是以計算機為載體,利用計算機外接檢測部件(如傳感器、攝像頭等)對用戶某些特定手勢進行精準檢測及識別,同時將獲取的信息進行整合并將分析結果輸出的檢測技術[1]。這樣的人機交互方法與傳統(tǒng)通過文字輸入進行信息交互相比較具有非常多的優(yōu)點,通過特定的手勢就可以控制機器作出相應的反饋。
1? ? 基于計算機視覺技術的手勢識別主要步驟
通常情況下,要順利的實現(xiàn)手勢識別需要經(jīng)過以下幾個步驟:
第一,圖形預處理。該環(huán)節(jié)首先需要將連續(xù)的視頻資源分割成許多靜態(tài)的圖片,方便系統(tǒng)對內(nèi)容的分析和提取;其次,分析手勢識別對圖片的具體要求,并以此為根據(jù)將分割完成的圖片中的冗余信息排除掉,最后,利用平滑以及濾波等手段對圖片進行處理[2]。
第二,手勢檢測以及場景劃分。計算機系統(tǒng)對待檢測區(qū)域進行掃描,查看其中有無手勢信息,當檢測到手勢后需要將手勢圖像和周圍的背景分離開來,并鎖定需要進行手勢識別的確切區(qū)域,為接下來的手勢識別做好準備[3]。
第三,手勢識別。在將手勢圖像與周圍環(huán)境分離開來后,需要對手勢特征進行分析和收集,并且依照系統(tǒng)中設定的手勢信息識別出手勢指令。
2? ? 基于計算機視覺的手勢識別基本方法
在進行手勢識別之前必須要完成手勢檢測工作,手勢檢測的主要任務是查看目標區(qū)域中是否存在手勢、手勢的數(shù)量以及各個手勢的方位,并將檢測到的手勢與周圍環(huán)境分離開來?,F(xiàn)階段實現(xiàn)手勢檢測的算法種類相對較多,而將手勢與周圍環(huán)境進行分離通常運用圖像二值化的辦法,換言之,就是將檢測到手勢的區(qū)域標記為黑色,而周邊其余區(qū)域標記為白色,以灰度圖的方式將手勢圖形顯現(xiàn)出來[4],圖像二值法分離出的常見手勢圖形如圖1所示。
在完成手勢與周圍環(huán)境的分割后,就需要進行手勢識別,該環(huán)節(jié)對處理好的手勢特征進行提取和分析,并將獲得的信息資源代入到不同的算法中進行計算,同時將處理后的信息與系統(tǒng)認證的手勢特征進行比對,從而將目標轉(zhuǎn)化為系統(tǒng)已知的手勢。目前,對手勢進行識別主要通過以下幾種方法進行。
2.1? 運用模板匹配的方法
眾所周知,被檢測的手勢不會一直處于靜止狀態(tài),也會存在非靜止狀態(tài)下的手勢檢測,相對來說動態(tài)手勢檢測難度較大,與靜態(tài)手勢檢測的方式也有一定的區(qū)別,而模板匹配的方法通常運用在靜止狀態(tài)下的手勢檢測。這種辦法需要將常用的手勢收錄到系統(tǒng)中,然后對目標手勢進行檢測,將檢測信息進行處理后得到檢測的結果,最后將檢測結果與數(shù)據(jù)庫中的手勢進行比對,匹配到相似度最高的手勢,從而識別出目標手勢指令[5]。常見的輪廓邊緣匹配以及距離匹配等都是基于這個方法進行的。這些辦法都是模板匹配的細分,具有處理速度快、操作方式簡單的優(yōu)點,然而在分類精確性上比較欠缺,在進行不同類型手勢進行區(qū)分時往往受限于手勢特征,并且能夠識別出的手勢數(shù)量也比較有限。
2.2? 運用SVM的動態(tài)手勢識別方法
在21世紀初期,支持向量機(Support Vector Machine,SVM)方法被發(fā)明出來并獲得了較好的發(fā)展與應用,在學習以及分類功能上都十分優(yōu)秀。支持向量機方法是將被檢測的物體投影到高維空間,同時在此區(qū)域內(nèi)設定最大間隔超平面,以此來實現(xiàn)對目標特征的精確區(qū)分。在運用支持向量機的方法來進行動態(tài)手勢識別時,其關鍵點是選取適宜的特征向量。為了逐步解決這樣的問題,相關研發(fā)人員提出了利用尺度恒定特征為基礎來獲得待檢測目標樣本的特征點,再將獲得的信息數(shù)據(jù)進行向量化,最后,利用支持向量機方法來完成對動態(tài)手勢的識別。
2.3? 運用DTW的動態(tài)手勢識別方法
動態(tài)時間歸整(Dynamic Time Warping,DTW)方法,最開始是運用在智能語音識別領域,并獲得了較好的應用效果,具有非常高的市場應用價值。動態(tài)時間歸整方法的工作原理是以建立可以進行調(diào)整的非線性歸一函數(shù)或者選用多種形式不同的彎曲時間軸來處理各個時間節(jié)點上產(chǎn)生的非線性變化。在使用動態(tài)時間歸整方法進行目標信息區(qū)分時,通常是創(chuàng)建各種類型的時間軸,并利用各個時間軸的最大程度重疊來完成區(qū)分工作。為了保證動態(tài)時間歸整方法能夠在手勢識別中取得較好的效果,研究人員已經(jīng)開展的大量的研發(fā)工作,并實現(xiàn)了5種手勢的成功識別,且準確率達到了89.1%左右。
3? ? 結語
通常情況下許多手勢檢測方法都借鑒人們?nèi)粘I钪杏^察目標與識別目標的思路,人類在確認目標事物時是依據(jù)物體色彩、外形以及運動情況等進行區(qū)分,計算機視覺技術也是基于此,所以在進行手勢識別時也要加強人類識別方法的應用,促使基于計算機視覺技術的手勢識別能夠更快速、更精準。
[參考文獻]
[1]童欣.一種基于OpenCV的手勢輪廓識別與指尖定位跟蹤方法[J].福建電腦,2018(12):96-97,109.
[2]張忠軍.基于膚色橢圓邊界模型和改進幀差分算法的手勢分割方法[J].福建電腦,2018(5):8-10.
[3]張春燕.基于計算機視覺的可變形手勢跟蹤算法改進研究[J].計算機測量與控制,2016(11):219-221,225.
[4]季越.基于計算機視覺的手勢識別人機交互技術探討[J].電腦迷,2016(9):39.
[5]張毅,劉鈺然,羅元.基于視覺的手勢識別方法及其在數(shù)字信號處理器上的實現(xiàn)[J].計算機應用,2014(3):833-836,856.