金麗麗
摘 要:隨著計算機技術和信息技術的發(fā)展,人臉檢測與識別技術的研究已經(jīng)越來越成熟,但目前人臉識別的應用還是集中在門禁系統(tǒng)和防盜系統(tǒng)方面,在人們生活中的應用還不夠廣泛。文章綜述國內(nèi)外研究現(xiàn)狀,基于深度學習的人臉識別方法表現(xiàn)最為優(yōu)異,設計了一種基于深度學習人臉識別的圖像分類系統(tǒng)方案,旨在解決人們電腦或手機中存儲的大量圖片分類不方便的問題。
關鍵詞:人臉識別;深度學習;圖像分類
0 引言
隨著人們生活水平的提高和信息技術的不斷發(fā)展,拍照已經(jīng)成為人們工作、學習以及日常生活中必不可少的一部分,但隨著照片越拍越多,手機或電腦中存儲了大量的照片,當人們想要使用或查找某一類照片時就非常不方便,而圖像分類系統(tǒng)正是一個很好的解決方案。圖像分類在日常生活中的應用非常廣泛,例如各類購物軟件上的拍照購服務,各種搜索引擎中的圖片搜索服務,停車場使用的車牌識別技術以及智能門鎖、火車站閘機等使用的人臉識別技術等,都與圖像分類有著密切聯(lián)系。隨著人工智能技術的崛起,作為人工智能領域重要的一環(huán),圖像分類在未來必將有著更廣闊的發(fā)展前景。
目前,人臉識別技術的研究與發(fā)展已經(jīng)較為成熟,人臉識別也成了近30年來模式識別和圖像處理中最為熱門的研究課題之一。但目前人臉識別的應用大多是在門禁系統(tǒng)和防盜系統(tǒng)等領域,在人們貼身生活中的應用還不多[1]。本文所研究的課題旨在解決生活中最常見的問題,提出一種基于人臉識別的圖像分類系統(tǒng)方案,將手機或電腦中大量的照片高效率地分類管理。
1? ? 圖像分類方法
傳統(tǒng)的圖像分類方法大多數(shù)是基于圖像特征的分類,就是利用圖像處理算法來提取經(jīng)過人工設計的一些定量或定性表達的特征,然后對這些圖像特征進行數(shù)學統(tǒng)計分析或通過分類器運算得出分類結果。所提取的圖像特征主要有圖像的顏色、形狀和紋理等底層視覺特征,以及方向梯度直方圖、局部二值模式和尺度不變特征變換等局部不變性特征,而這些人工設計特征的泛化性能并不好,且過于依賴設計者的先進知識和對分類任務的理解[2]。目前,海量、高維度的數(shù)據(jù)也使得人工設計特征的難度大大增加。
目前,新興的圖像分類方法是基于深度學習的圖像分類,與傳統(tǒng)圖像分類方法相比,基于深度學習的圖像分類方法不需要去人工設計圖像特征,而是通過神經(jīng)網(wǎng)絡自主地從訓練樣本中學習圖像特征,從而提取出抽象的、高維度的特征,且這些特征和分類器緊密相連,很好地解決了傳統(tǒng)圖像分類中關于人工提取特征和分類器選擇的問題[3]。由于深度學習的圖像分類方法可以通過深層架構自主學習更多高維、抽象層次的數(shù)據(jù)特征,因此,基于深度學習的圖像分類比傳統(tǒng)圖像分類方法的分類效果要好很多。
2? ? 人臉識別技術
傳統(tǒng)的人臉識別方法中早期采用的是基于幾何特征的識別方法,這種方法主要是使用專用儀器來找出一組人臉圖像的面部特征點,然后去測量這些特征點之間的相對位置和歐氏距離,從而得到人臉特征的矢量,這種方法比較簡單,但識別精度較低[4]。后來,基于特征臉的識別方法和基于特征方法的識別方法相繼問世。
基于特征臉的識別方法是一種基于主成分分析的方法。所謂特征臉就是將人臉圖像的統(tǒng)計特性進行正交變換,消除原有向量分量之間的相關性,得出一組特征向量,這組特征向量就叫特征臉。這是一種基于變換系數(shù)特征的算法,這種方法比較簡單實用,識別速度也比較快,但容易受到圖像拍攝角度、光照以及面部表情的影響,識別效果也跟訓練集和測試集之間的相關性有很大的關系,因此局限性非常大。
基于特征方法的識別方法是將人臉圖像劃分成不同的區(qū)域來提取人臉局部特征的方法,這種方法比提取人臉整體特征的方法魯棒性更好,也不容易受到圖像拍攝角度、光照、面部遮擋、面部表情等的影響,但這種方法由于將人臉圖像劃分了多個分區(qū),每個分區(qū)都需要進行特征提取,因此需要檢測的人臉圖像數(shù)據(jù)的存儲量和算法的計算量都比較大,識別速度較慢,消耗的資源也較多[5]。
目前,新興的人臉識別檢測方法是基于深度學習的識別方法,這種方法利用大量的人臉圖像數(shù)據(jù)來進行訓練,通過在訓練集中的自主學習來得到不同類型的類內(nèi)差異,如光照、面部遮擋、面部表情等,數(shù)據(jù)集越豐富,如果能包含人臉識別中遇到的各種情況,那么系統(tǒng)通過自主學習就能克服各種困難所帶來的影響,識別的效果就更好。基于深度學習的人臉識別中方法中最常用的是卷積神經(jīng)網(wǎng)絡,這種方法不像傳統(tǒng)的人臉識別一樣需要去設計針對圖像的特定特征,且提取到的人臉特征對光照、面部表情和局部遮擋等都具有很好的魯棒性,因此基于深度學習的人臉識別比傳統(tǒng)的人臉識別方法效果更突出。
3? ? 圖像分類系統(tǒng)設計方案
3.1? 系統(tǒng)結構
本系統(tǒng)由用戶操作模塊、人臉識別檢測模塊和圖片分類歸檔模塊3個部分組成。其中用戶操作模塊為系統(tǒng)的人機交互部分,用戶可進行添加樣本、刪除樣本、選擇目標路徑及選擇輸出路徑等操作。而人臉識別檢測模塊和圖片分類歸檔模塊為系統(tǒng)的數(shù)據(jù)處理部分,根據(jù)用戶提供的樣本對一個目錄下的多張圖片通過人臉識別技術進行分類歸檔,分類方式為根據(jù)人臉識別結果,將圖片分為單人照、2人照、3人照、多人照及其他照片,并另存到相對應的路徑下,其中單人照、2人照、3人照、多人照這4個路徑存儲的都是與樣本相關的照片,而其他照片路徑存儲的是與樣本無關的照片。
3.2? 系統(tǒng)設計
添加樣本:用戶選擇一張圖片作為分類樣本,系統(tǒng)將根據(jù)樣本中的人臉數(shù)據(jù)對目標圖片進行分類。
刪除樣本:刪除用戶已選擇的樣本圖片,等待用戶重新選擇樣本。
選擇目標路徑:用戶選擇待分類的圖片路徑,系統(tǒng)會將該路徑下所有圖片進行分類歸檔。
選擇輸出路徑:用戶選擇圖片分類歸檔的路徑,系統(tǒng)會在該路徑下新建單人照、2人照、3人照、多人照及其他圖片等文件夾,然后將分類后的圖片存入各自對應的文件夾。
人臉識別檢測模塊:識別樣本和目標圖片中的人臉,然后進行判斷,并對目標圖片進行標記。
圖片分類歸檔模塊:根據(jù)目標圖片的標記值將目標圖片進行分類歸檔,將標記值為1的圖片存入單人照路徑下,標記值為2的圖片存入2人照路徑下,標記值為3的圖片存入3人照路徑下,標記值為4的圖片存入多人照路徑下,標記值為5的圖片存入其他照片路徑下。系統(tǒng)設計流程如圖1所示。
4? ? 結語
本文主要針對人們電腦和手機中存儲的大量圖片自動分類管理困難的問題,探討一種基于人臉識別的圖像分類系統(tǒng)方案,利用基于深度學習的人臉識別技術,提取圖像中的人臉特征,通過與樣本圖片的人臉特征數(shù)據(jù)對比,得出目標圖片與樣本圖片之間的相似度,從而實現(xiàn)圖片的自動分類管理。
[參考文獻]
[1]賈寧,高楠,力貴才,等.基于OpenCV的圖像分類軟件的設計與實現(xiàn)[J].計算機科學,2014(S2):150-153.
[2]蘇賦,呂沁,羅仁澤.基于深度學習的圖像分類研究綜述[J].電信科學,2019(11):58-74.
[3]劉洋.從圖片驗證看圖像分類的研究現(xiàn)狀[J].通訊世界,2019(1):186-187.
[4]蔣阿娟,張文娟.人臉識別綜述[J].電腦知識與技術,2019(2):173-174,190.
[5]李霖潮.淺析人臉識別技術的發(fā)展[J].新型工業(yè)化,2020(3):129-133.
(編輯 姚 鑫)