蒙鑫+楊凡+崔羽
摘 要 伴隨網絡技術、多媒體技術以及信息數字化處理的高新技術的快速普及和發(fā)展,計算機所能處理的信息媒體范圍和處理速度都在不斷提高。圖像信息作為一種表現直觀、內容豐富的媒體,在眾多的圖像編碼標準中,圖像處理在線識別標準和機器視覺在線識別標準在數字人眼識別領域得到了廣泛應用。本文探討了這人眼識別算法,并指出這算法各自的優(yōu)勢,通過設計實驗對這算法進行比較,為人眼識別領域的發(fā)展前景做出展望。
【關鍵詞】圖像 人眼識別 圖像處理 機器視覺
在數據大量流通的今天,在線識別所扮演的角色也日益重要。由于在線識別使數據量減少,進而使數據傳輸時間降低,讓傳輸的效率更為重要。在傳輸帶寬有限,擴充不易以及增加傳輸設備將提高成本的考慮下,在線識別提供了另外一種解決方法,為灰度人眼識別提供了參考。
1 國內研究現狀
相對于其他特征,提取描述人眼美感的全局與局部幾何特征,幾何特征有其優(yōu)勢,一是可以精確獨立。幾何特征是通過人眼特征點計算得到的,而人眼特征點則是描述人眼輪廓與五官形狀的重要的一系列點。二是魯棒性好。人眼特征點能在不同的光照情況下、臉被部分遮擋的情況下被檢測到。幾何特征可分為三種形式:特征點坐標、特征點距離比例和特征點距離。
根據五官是否協(xié)調這個影響人眼眼睛水平的重要標準,研究人員多從臉部比例幾何特征入手。臉部比例指的是臉部特征點距離之間的比例,其中最著名的是黃金分割法和三庭法;臉部特征點指的是臉部五官的位置坐標,如鼻尖,左眼中心、右眼中心、兩嘴角等。在基于幾何特征的人眼眼睛分析領域,不少研究者基于黃金比例、近古典規(guī)則及特征點距離等提出了影響人眼眼睛的多種不同的幾何特征。Tommer等人以特征點距離作為幾何特征;Hatice等人使用特征點距離與特征點距離比例作為幾何特征;Fu等人使用距離分量、比例分量和離散值分量作為影響人眼眼睛的幾何特征;Kendra等人使用特征矢量作為幾何特征;Eisenthal等人使用特征點距離、比例和五官的長度與寬度作為幾何特征。Miriam等人使用歸一化的特征點坐標作為人眼眼睛的幾何特征。
基于幾何特征的方法也存在不足的地方:對人眼圖像的研究不只是特征點距離比例與特征點距離的測量,還需做更細致的紋理研究,比如反映眼睛的皮膚的質感、皮膚顏色的均勻過渡、肌肉的起伏,表情、臉部裝飾等。
2 對人眼識別的具體分類
從圖像處理的角度出發(fā),研究了圖像中的面部識別,人眼定位,人眼灰度狀態(tài)識別,基于已測人眼狀態(tài)進行疲勞檢測,對以下幾個方面進行研究。
2.1 圖像中的面部識別
首先通過攝像頭獲取一幅帶人臉的圖像,對圖像進行處理,利用中值濾波的方法對獲取的圖像去噪,在對濾波后的圖像灰度化,利用圖像網絡處理識別出人臉區(qū)域,圖像網絡處理識別人臉是一種常見的人臉識別方法是對人臉圖像中的一些像素值進行分析得出圖像中人臉區(qū)域。
2.2 人眼灰度狀態(tài)識別
判斷一個人是否處于疲勞狀態(tài),計算檢測到的人眼的在橫向和縱向上的實際所占像素值,計算眼睛的縱橫比,這個比值對同一個人的睜眼或閉眼狀態(tài)來說是相對固定的。但不同的人在這個值上都有一個共同點即眼睛閉合時值偏?。ㄐ∮?.3),由此做出的判斷適用于大多數的人。
2.3 疲勞的判斷
由于攝像頭獲取的圖像是一幀一幀獲取的,對獲取的圖像的所有幀進行相同的處理之后,判斷眼睛的開閉狀態(tài)在所有的圖像之中所占的百分比,與在眼睛疲勞情況下眼睛開閉狀態(tài)的百分比進行比較判斷是否處于疲勞狀態(tài)。
3 對灰度圖像的人眼識別
人眼的多姿態(tài)對人眼相似度計算具有一定的影響,兩張屬于同一個人的人眼圖像由于姿態(tài)的影響可能會被判斷為不同的人,因此本文采用人眼圖像對齊技術來提升人眼相似度計算性能。人眼圖像對齊采用的方法為先檢測人眼的特征點,再根據人眼的特征點對圖像進行仿射變化得到對齊后的人眼。人眼特征點檢測是人眼圖像處理領域中的一個重要研究方向,現有的人眼特征點檢測方法大致可以分為基于優(yōu)化的方法和基于回歸的方法。
基于優(yōu)化的方法主要有AAM和ASM方法,但是AAM和ASM只使用了人眼圖像的局部信息,并沒有考慮到人眼各個位置的相互關系,在人眼姿態(tài)與光照變化下效果不好。最近,人們提出了基于回歸的人眼對齊算法,利用條件隨機森林逐漸逼近人眼形狀的方法。本文采用的是基于集成回歸樹的人眼特征點檢測算法,檢測出的人眼進行ERT人眼特征點檢測算法的結果圖,特征點一共包含83個坐標,坐標位于臉頰、嘴巴、鼻子、眼睛、眉毛處。人眼關鍵點檢測需要事先檢測出人眼區(qū)域,人眼區(qū)域的檢測算法為Viola提出的算法。
4 結語
人眼的局部五官的特征會影響人眼相似性計算,本文使用了人眼圖像多區(qū)域特征提取技術,提取多個人眼圖像區(qū)域的灰度圖像特征并串聯在一起,達到冗余的效果。人眼圖像區(qū)域分為局部區(qū)域與全局區(qū)域。所以,基于灰度圖像特征與人眼相似度檢索策略的眼睛分類性能,依賴于人眼相似度檢索數據庫中樣本的質量,機器視覺在線圖像處理的在線識別級別為最大,調整機器視覺的參數使得人眼識別比例,得到技術的解在線識別圖像以及對應的解在線識別性能參數。
參考文獻
[1]張兆禮等.現代圖像處理技術[M].北京:人民郵電出版樸,2001,12-132.
[2]鄭永果.圖像增強方法的研究與實現[D]. 碩士,山東科技大學計算機軟件與理論,2005.
[3]夏良正.數字圖象處理[M]南京:東南大學出版社,1999,05-124
[4]安曉東,陳靜.人眼識別方法綜述 [J].電腦開發(fā)與應用,2006(12):132-137.
[5]吳達軍,李曄.幾種無損人眼識別方法的比較與研究[OL],2001.
[6]王升哲,馬義德.基于圖像處理和機器視覺的思考[OL].中國科技論文在線,2001-7.