鄧熠 畢磊 薛甜 范亞江 侯丹
摘 要:人臉識別是一項(xiàng)熱門的計(jì)算機(jī)技術(shù)研究領(lǐng)域,同時(shí)也奠定了生物特征識別的研究方向。隨著技術(shù)的進(jìn)一步成熟和社會(huì)認(rèn)同度的提高,越來越多的學(xué)者將基于神經(jīng)網(wǎng)絡(luò)的多種深度學(xué)習(xí)方法結(jié)合起來,但在人臉標(biāo)志檢測方面還存在精度問題,由此提出一種深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法加以解決。深度學(xué)習(xí)以多層自編碼神經(jīng)網(wǎng)絡(luò)的方式進(jìn)行預(yù)訓(xùn)練,進(jìn)而結(jié)合人臉面部信息進(jìn)一步優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值的深度置信網(wǎng)絡(luò)(DBN)。文章基于深度學(xué)習(xí)人臉識別發(fā)展現(xiàn)狀進(jìn)行分析,目的是進(jìn)一步提高人臉識別精度。
關(guān)鍵詞:人臉識別;深度學(xué)習(xí);深度算法;發(fā)展現(xiàn)狀
1 背景介紹
大數(shù)據(jù)時(shí)代信息冗雜,爆炸式增長的數(shù)據(jù)產(chǎn)生了信息泄露等嚴(yán)峻問題,保密機(jī)制形同虛設(shè),信息時(shí)代面臨著前所未有的巨大挑戰(zhàn)。生物特征識別技術(shù)的出現(xiàn)恰好可以有效解決此問題,這項(xiàng)技術(shù)具有不易偽造和唯一性,可以稱之為“信息技術(shù)安全守護(hù)者”。人臉識別技術(shù)作為生物特征識別技術(shù)的核心技術(shù)之一,繼承了其唯一性的特點(diǎn),而且包含人臉的光學(xué)表示。目前人臉識別技術(shù)被廣泛用于政府、軍隊(duì)、銀行、社會(huì)福利保障、電子商務(wù)、安全防務(wù)等領(lǐng)域[1]。
2?深度學(xué)習(xí)
深度學(xué)習(xí)(Deep Learning,DL)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)研究方向,是一個(gè)復(fù)雜的機(jī)器學(xué)習(xí)算法,在語音和圖像識別方面取得的效果,遠(yuǎn)遠(yuǎn)超過先前的相關(guān)技術(shù)。它可以經(jīng)過層間的輪班訓(xùn)練和一般的微調(diào)迫使計(jì)算機(jī)進(jìn)行自我學(xué)習(xí),并且隨著網(wǎng)絡(luò)層的增加,學(xué)習(xí)能力逐漸被委托深入的學(xué)習(xí)理論,如對比度分集算法、背乘算法、時(shí)延神經(jīng)網(wǎng)絡(luò)等專家混合系統(tǒng),對于人工智能的發(fā)展具有重要意義[2-3]。
深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,這些學(xué)習(xí)過程中獲得的信息對諸如文字,圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。隨著深度學(xué)習(xí)的發(fā)展,人臉識別技術(shù)更加成熟。
在人臉識別領(lǐng)域中,深度學(xué)習(xí)一共有以下幾種典型應(yīng)用[4-5]:
(1)基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法;
(2)深度非線性人臉形狀提取方法;
(3)基于深度學(xué)習(xí)的人臉姿態(tài)魯棒性建模;
(4)約束環(huán)境下的全自動(dòng)人臉識別;
(5)基于深度學(xué)習(xí)的視頻監(jiān)控下的人臉識別;
(6)基于深度學(xué)習(xí)的低分辨率人臉識別和其他基于深度學(xué)習(xí)的人臉相關(guān)信息的識別。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一?;诰矸e神經(jīng)網(wǎng)絡(luò)的人臉識別方法,是深度監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,它可以挖掘數(shù)據(jù)的局部特征,并提取全局特征,然后進(jìn)行分類,其權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)更類似于生物神經(jīng)網(wǎng)絡(luò),被應(yīng)用于模式識別的各個(gè)領(lǐng)域。
2.1 ?深度學(xué)習(xí)概述及發(fā)展
深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的重要組成部分,有時(shí)也被稱為深度神經(jīng)學(xué)習(xí)或深度神經(jīng)網(wǎng)絡(luò)。
深度學(xué)習(xí)是由Hinton等人于2006年基于深度信網(wǎng)(DBN)提出的非監(jiān)督貪心逐層訓(xùn)練算法。隨著目標(biāo)的正確識別逐漸成為人工智能的重要組成部分,基于深度學(xué)習(xí)的人臉識別目前也成了特征識別領(lǐng)域的研究熱點(diǎn)。
2.2 ?人臉識別細(xì)分類的深度學(xué)習(xí)算法
臉部表達(dá)模型分為二維臉部和三維臉部,即2D和3D臉部。二維人臉識別的研究時(shí)間比較長,方法流程也比較成熟,應(yīng)用于許多領(lǐng)域,但由于二維人臉識別信息存在深度數(shù)據(jù)丟失的缺陷,無法完全表達(dá)真實(shí)的人臉,因此在實(shí)際應(yīng)用中存在著識別準(zhǔn)確率低、活體檢測率低等問題。
現(xiàn)在市場上的3D人臉識別根據(jù)使用相機(jī)成像原理主要分為:3D結(jié)構(gòu)光、TOF、雙目立體視覺。
2.3 ?人臉識別算法
最近的幾年來,隨著相關(guān)領(lǐng)域人員對人臉識別的研究不斷深入,現(xiàn)有的人臉識別技術(shù)主要針對現(xiàn)實(shí)環(huán)境和現(xiàn)實(shí)應(yīng)用場景進(jìn)行識別,具體包括以下3個(gè)方面:
(1)人臉模型的設(shè)計(jì),包括線性鑒別分析、線性建模方法、非線性建模方法和三維人臉識別[4]。
(2)新特征表征,包括局部描述和深入研究,部分說明和深度學(xué)習(xí)方法。
(3)新的數(shù)據(jù)源,包括視頻人臉識別以及草圖和近紅外圖像。
以下是較為經(jīng)典的三大人臉識別的經(jīng)典算法:
(1)Deep Face采用了一種基于監(jiān)測點(diǎn)的人臉檢測方法。臉部檢測部分將首先選取6個(gè)基準(zhǔn)點(diǎn),2個(gè)眼心,1個(gè)鼻點(diǎn),3個(gè)口點(diǎn),然后利用SVR對LBP特征進(jìn)行特征學(xué)習(xí),獲得標(biāo)記點(diǎn)。
(2)Face Net是谷歌提議的網(wǎng)絡(luò)結(jié)構(gòu),它可以靈活地使用22層 Zelier& Fergus的網(wǎng)絡(luò),也可以使用 inception網(wǎng)絡(luò),后者目前在物體識別方面比較有效。它的主要特點(diǎn)是利用3個(gè)單元之間的距離來構(gòu)造損失函數(shù)。
(3)Center Loss不同于三元損失,中心損失并不直接優(yōu)化距離,它保留了原來的分類模型,但是為每一類分別指定了一個(gè)分類中心。同一類圖像對應(yīng)的特征都應(yīng)盡可能接近其各自類別的中心,不同類別的中心應(yīng)盡可能遠(yuǎn)離。
3 人臉識別技術(shù)在深度學(xué)習(xí)中的廣泛應(yīng)用
在不久的將來,全國主流的人臉識別技術(shù)將以識別13億人像為重點(diǎn)??梢灶A(yù)見的是,建立一個(gè)全國統(tǒng)一的人臉圖像數(shù)據(jù)庫,使存儲(chǔ)在這個(gè)數(shù)據(jù)庫中的數(shù)十億張人臉圖像的容量達(dá)到幾十億甚至幾千億張。此時(shí),可以出現(xiàn)大量性能和關(guān)鍵功能相似的人臉。如果沒有基于深度學(xué)習(xí)的人臉識別技術(shù),就沒有辦法建立更加復(fù)雜多樣的人臉模型,這就是為什么要實(shí)現(xiàn)準(zhǔn)確快速的人臉識別會(huì)更加困難的原因。
4 未來的發(fā)展與問題
如今,基于深度學(xué)習(xí)的人臉識別技術(shù)已經(jīng)取得了很大的階段性成功;而且有著非常廣闊和光明的前景和未來,它的發(fā)展空間非常的大,但隨之而來也會(huì)產(chǎn)生相關(guān)如下的幾個(gè)問題。
4.1 重心應(yīng)該偏移至數(shù)據(jù)方面
基于深度學(xué)習(xí)的人臉識別技術(shù)的三要素—算法、硬件、數(shù)據(jù),隨著相關(guān)科技的不斷發(fā)展和經(jīng)濟(jì)水平的提高,算法與硬件的技術(shù)障礙越來越小,但是數(shù)據(jù)之間的差異則顯得越來越突出。對于人臉識別來說,把握數(shù)據(jù)入口,形成算法—產(chǎn)品—數(shù)據(jù)的閉環(huán)生態(tài)是算法在未來取勝的關(guān)鍵。與此同時(shí),對海量數(shù)據(jù)的分析處理也將成為研究的重點(diǎn)。
4.2 發(fā)展終端和云端
目前,隨著 GPU和各種深度學(xué)習(xí)芯片等人臉識別技術(shù)的發(fā)展,使設(shè)備的運(yùn)算能力得到了很大的提高,同時(shí)隨著手機(jī)、智能家居等設(shè)備的普及,前端和云端將更加智能化。
4.3 安全和隱私權(quán)
如今,數(shù)據(jù)正呈指數(shù)增長,數(shù)據(jù)安全和隱私問題也變得十分重要。而且臉部識別技術(shù)正好處在容易被不法分子利用的情況下,將面臨照片、視頻、面具等各種欺詐攻擊,臉部特征在傳輸、存儲(chǔ)過程中會(huì)受到黑客和其他犯罪嫌疑人的威脅,用戶在享受深度學(xué)習(xí)帶來的便利的同時(shí),也非常關(guān)心自己的數(shù)據(jù)是否被盜用、傳播等。對活體探測、隱私加密等問題應(yīng)加強(qiáng)研究,防止不法分子利用漏洞來侵犯用戶的權(quán)益以及隱私[6]。
4.4 兼容性
當(dāng)前,隨著深度學(xué)習(xí)相關(guān)人臉識別技術(shù)的不斷發(fā)展,相關(guān)廠商也在不斷增加,但用戶往往需要根據(jù)自己的實(shí)際情況和需求來定制所需的人臉識別系統(tǒng),但該系統(tǒng)所涉及的技術(shù)層面很多,從硬件到軟件,都需要各大廠商的支持,因此需要考慮從底層到上層的界面開發(fā)及兼容性問題,以推動(dòng)其發(fā)展。
5 結(jié)語
伴隨著人工智能時(shí)代的不斷發(fā)展,深度學(xué)習(xí)在模式識別中的應(yīng)用不斷深化,在網(wǎng)絡(luò)復(fù)雜性方面,深度學(xué)習(xí)網(wǎng)絡(luò)也需要簡化算法以提高其效率。因此在網(wǎng)絡(luò)功能方面,應(yīng)探索深度學(xué)習(xí)與其他模式識別模型的結(jié)合,以不斷擴(kuò)展網(wǎng)絡(luò)接口和功能??傊?,深度學(xué)習(xí)將為包括人臉識別在內(nèi)的模式識別應(yīng)用打開新的局面。
[參考文獻(xiàn)]
[1]劉衛(wèi)凱,郝雅倩,鄭晗,等.人臉識別綜述[J].信息記錄材料,2018(7):13-14.
[2]夏志強(qiáng).人臉識別綜述[J].電子世界,2017(23):44.
[3]徐曉艷.人臉識別技術(shù)綜述[J].電子測試,2015(10):885-894.
[4]黨永成.人臉識別技術(shù)綜述及分析[J].電子技術(shù)與軟件工程,2018(3):158.
[5]金連文,鐘卓耀,楊釗,等.深度學(xué)習(xí)在手寫漢字識別中的應(yīng)用綜述[J].自動(dòng)化學(xué)報(bào),2016(8):1125-1141.
[6]趙鵬,王斐,劉慧婷,等.基于深度學(xué)習(xí)的手繪草圖識別[J].工程科學(xué)與技術(shù),2016(3):94-99.
(編輯 傅金睿)