国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

手勢識別中手分割算法

2015-06-19 12:24郭雷
軟件 2015年4期
關(guān)鍵詞:手勢

郭雷

摘要:首先分析了手勢分割存在的技術(shù)難點及人進行手勢分割過程中可能使用的特征,然后分析比較了現(xiàn)有手勢分割算法的基本思想和特點,最后介紹了深度學(xué)習(xí)技術(shù)并總結(jié)了手勢分割未來的研究方向。

關(guān)鍵詞:RGBD;手分割;手勢

中圖分類號:TP317.4 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2015.04.019

0.引言

手勢是一種不需要中間媒介的,非常人性化的人機交互方式。手勢識別已經(jīng)成為人機交互的重要內(nèi)容和研究熱點?;谝曈X的手勢識別系統(tǒng)通常包含手勢分割、手勢建模、手勢形狀特征提取、手勢識別幾個過程。其中,手勢分割就是將感興趣的有意義區(qū)域,即手勢從傳感器獲取數(shù)據(jù)中劃分出來。這是基于視覺的手勢識別過程中的第一個步驟,也是關(guān)鍵的一步。分割的準確度和實時性能直接影響到后期的識別效果以及整個交互系統(tǒng)的性能。

傳統(tǒng)的基于視覺的手勢識別系統(tǒng)利用攝像頭作為傳感器。單目或雙目視覺系統(tǒng)手勢圖像數(shù)據(jù),通過圖像處理進行手部分割,算法復(fù)雜且需要巨大的計算量。Kinect是微軟推出的一款傳感輸入設(shè)備,不僅可以獲取場景的彩色紋理信息,也可以獲取場景的深度信息。利用這些信息可以更加快速有效的進行手勢分割。

本文首先分析了手勢分割存在的技術(shù)難點及進行手勢分割過程中可能使用的特征,然后分析比較了現(xiàn)有手勢分割算法的基本思想和特點,最后介紹了深度學(xué)習(xí)技術(shù)并總結(jié)了手勢分割未來的研究方向。

1.手勢分割的技術(shù)難點

由于圖像背景和手勢本身的復(fù)雜性,實際生活中,光照的顏色、亮度都會產(chǎn)生各種變化,而背景物體的移動、攝像頭的移動、手勢運動產(chǎn)生的高光和陰影、類膚色區(qū)域的干擾等,都給手勢的穩(wěn)定和準確分割帶來了困難。

人類的視覺系統(tǒng)在任何條件下都能夠較為準確的認出感興趣的區(qū)域。人類視覺系統(tǒng)機理的認識仍有待提,還沒有統(tǒng)一的理論可以指導(dǎo)傳統(tǒng)的圖像分割方法進行改進。同時在復(fù)雜的手勢特征的先驗知識獲取方面,還沒有既滿足實時性又滿足準確性的方案。

2.手勢分割的特征

手分割問題,可以看作是一個在Kinect傳感器獲得的RGB圖像和深度圖像中的手像素或非手像素標記問題。這里,我們將RGB圖像和對應(yīng)的深度圖像數(shù)據(jù)定義為:

其中,color為位置(i,j)對應(yīng)的顏色信息,按照某種顏色空間定義,depth為該位置的深度信息,

進行手分割時,必須對Data加以處理,提煉特征。通過調(diào)查以往的研究文獻,總結(jié)出以下特征:

(1)人體的拓撲結(jié)構(gòu):和人體某一局部圖像相比,人們更容易從人體的整體圖像中確定手的位置。這是因為人類所具有的人體的整體拓撲結(jié)構(gòu)知識。這個知識只提供給手部區(qū)域的大致方位。

(2)距手心距離:通過手的形態(tài)學(xué)知識,人類可以推斷當距離手心距離小于某個值,肯定屬于手部區(qū)域,如果大于某個值,肯定不屬于手部區(qū)域;

(3)膚色和深度:雖然膚色易受到人種,光照等的影響,手部區(qū)域在深度圖像或者彩色圖像上雖然其整體上有可能并不均勻一致,但是其在較小的局部范圍內(nèi)應(yīng)當保持一定的連續(xù)性,而非手部區(qū)域的邊界像素與相鄰背景區(qū)域像素具有較大的變化;

在進行手區(qū)域判斷的時候,人類往往不是僅基于某種單一特征,而是多種特征的融合的決策。每個特征在決策過程中起到不同的作用,對一個手的不同位置起到的效用有可能也不一樣。

3.手勢分割算法

手勢的檢測分割包括兩部分:一是檢測定位,指從圖像中確定有沒有手勢出現(xiàn),找到手勢所在區(qū)域;二是手勢分割,將手勢區(qū)域從畫面中提取出來,去除背景的干擾。這兩部分一般都是同時進行的。傳統(tǒng)的基于視覺的手勢分割方法主要有基于膚色的手勢分割方法、基于運動的手勢分割方法、基于輪廓的手勢分割方法等。

膚色是手勢最為明顯的特征之一,然而,在實際應(yīng)用中由于手勢和背景環(huán)境的復(fù)雜多變,光源亮度和位置的變化、有色光源產(chǎn)生的色彩偏移等,都會引起膚色的變化,手部彎曲和反轉(zhuǎn)等形變,也會使得光源角度和陰影發(fā)生變化。這使得整個手部區(qū)域的膚色可能并不一致,甚至有較大的差異。針對這些問題當前研究者們在傳統(tǒng)膚色分割方法的基礎(chǔ)上,采取了很多改進方法,主要有三種:在分割前對圖像顏色進行校正;提出新的顏色空間;結(jié)合其他運動差分、輪廓、幾何特征等其他分割方法。

基于輪廓的手勢分割存在兩個棘手問題:一是由于手部旋轉(zhuǎn)或彎曲等因素使得初始輪廓的獲取較難;二是由于手勢的形狀本身存在深度凹陷區(qū)域,而輪廓對此類區(qū)域往往無法收斂到。改進模型所增加的迭代次數(shù)和計算量的代價使得實時性能下降。

基于運動的分割方法主要分為是幀差法和背景差分法。幀差法利用相鄰圖像幀之間的差分來判斷前景中是否有運動對象產(chǎn)生;而背景差分法首先對背景圖像建模,通過比較背景圖像和含有手勢的圖像分割出前景。眾多實驗發(fā)現(xiàn),在運動中產(chǎn)生的光影變化,以及背景的動態(tài)變化都會對分割結(jié)果產(chǎn)生影響。

Kinect傳感器不僅可以獲取場景的彩色紋理信息,也可以獲取場景的深度信息。研究者利用RGB—D數(shù)據(jù)進行手勢分割時,可以只深度圖像或者融合RGB和深度信息。前者瞄準快速算法,后者目標是一個精確系統(tǒng)。

文獻將手分割看成一個深度聚類問題,像素分組于不同的深度水平。通過分析人姿勢維度確定一個閾值,該深度水平對應(yīng)的是手。文獻利用k-means聚類算法和預(yù)定義閾值進行手檢測,并對手型進行凸包分析定位手指。這兩種方法都是假設(shè)手部距離傳感器最近,此外算法的效果受到kinect深度數(shù)據(jù)的準確性影響非常大。文獻,利用kinect SDK提供的關(guān)于手的位置信息,在深度圖像的三個軸方向上設(shè)定閾值,小于該閾值的被看成是可能的手的區(qū)域。然后利用OPEN VC中的相關(guān)函數(shù)cvErode(腐蝕)、cvMorphologyEx、cvFindContours(找到邊界)對手數(shù)據(jù)進行處理,計算邊界和手中心。文獻建立三個模型:深度模型(深度加上形態(tài)學(xué)),皮膚模型(膚色),背景模型(codebook算法),利用三層神經(jīng)網(wǎng)絡(luò),輸入是三個模型的兩兩重疊率,其反映了兩個模型分割結(jié)果的一致性。文獻直接在深度圖中尋找管狀或指間形狀的物體,作為手掌和手指的候選對象,通過空間位置檢測確認,因為手掌和手指是一起的。文獻利用kinect產(chǎn)生的骨骼數(shù)據(jù),確定手的位置,查找表存放了標準人類手在不同深度層的大小,給定手的3D位置,算法從查找表中找到對應(yīng)手的大小,從而粗略定位手的區(qū)域。文獻集成彩色信息進行手檢測。將手檢測問題看成是一個手像素或非手像素標記問題。RGB圖像的皮膚檢測算子和深度圖像的聚類算子作為兩個條件確認手像素。手區(qū)域是二者的交集。文獻將不同的特征處理為不同算子,利用手部/非手部區(qū)域的相鄰像素點的深度信息和顏色信息具有一定連續(xù)性的原理,從手心作為起始點進行搜索,保證了所有像素形成一個聯(lián)通的有效區(qū)域。避免了傳統(tǒng)簡單基于深度算法中存在的手必須在最前方限制,或多物體匹配區(qū)分的問題,有效的處理了手部顏色和深度數(shù)據(jù)不均勻的問題。

4.深度學(xué)習(xí)技術(shù)

在已有的手勢分割方法中,良好的特征表達,對最終算法的準確性起了非常關(guān)鍵的作用。上述方法中,特征的設(shè)計靠人工選取完成。手工選取特征需要復(fù)雜的手勢特征的先驗知識,能不能選取好很大程度上靠經(jīng)驗,而且它的調(diào)節(jié)需要大量的時間。

深度學(xué)習(xí)是機器學(xué)習(xí)研究中的一個新的領(lǐng)域,其動機在于建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦的機制來解釋數(shù)據(jù)。深度學(xué)習(xí)構(gòu)建具有很多隱層的機器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),通過逐層特征變換,將樣本在原空間的特征表示變換到一個新特征空間,來學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測的準確性。與人工規(guī)則構(gòu)造特征的方法相比,利用大數(shù)據(jù)來學(xué)習(xí)特征,更能夠刻畫數(shù)據(jù)的豐富內(nèi)在信息。

5.總結(jié)

手勢目標的檢測是手勢識別中重要的一步,它為后面手勢識別做好預(yù)處理,手勢目標檢測的好壞直接影響到手勢識別的效果。目前還不存在任何一種方法在所有應(yīng)用系統(tǒng)和背景條件下都能取得良好的分割效果。深度學(xué)習(xí)技術(shù)為手勢分割問題提供了一種新的解決思路,其更加接近于人類視覺系統(tǒng)機理??梢詫⑹謩葑R別過程看成是一個從海量的手勢數(shù)據(jù)中深度學(xué)習(xí)過程,無需手勢特征的先驗知識,通過學(xué)習(xí)產(chǎn)生對于手勢檢測分割具有指導(dǎo)意義的特征,在此基礎(chǔ)上進行手勢分割將會取得較為理想的結(jié)果。

猜你喜歡
手勢
追蹤手勢對視空間學(xué)習(xí)的增強作用*
基于神經(jīng)網(wǎng)絡(luò)的靜態(tài)手勢識別算法實現(xiàn)
V字手勢的由來
基于B型超聲的在線手勢識別
基于AT89S52的手勢可控LED滾動顯示屏設(shè)計
柯爾文手勢在視唱教學(xué)中的運用
打招呼
認手勢說數(shù)字
酉阳| 柞水县| 驻马店市| 丰县| 西和县| 新平| 通海县| 塔河县| 炉霍县| 阜新市| 洛隆县| 吉安市| 陆良县| 黔南| 调兵山市| 简阳市| 通江县| 桐梓县| 泸水县| 来宾市| 崇义县| 阜新市| 图木舒克市| 莱阳市| 锦州市| 塔城市| 瑞金市| 吉木乃县| 仁寿县| 铁力市| 新闻| 萍乡市| 台北县| 陈巴尔虎旗| 合水县| 黑山县| 嘉兴市| 建平县| 阳城县| 铜陵市| 哈尔滨市|