基于深度學(xué)習(xí)的人臉識別技術(shù)發(fā)展現(xiàn)狀分析

2021-12-08 13:14:04鄧熠畢磊薛甜范亞江侯丹

無線互聯(lián)科技 2021年19期

關(guān)鍵詞：人臉識別發(fā)展現(xiàn)狀深度學(xué)習(xí)

鄧熠畢磊薛甜范亞江侯丹

摘要：人臉識別是一項(xiàng)熱門的計(jì)算機(jī)技術(shù)研究領(lǐng)域，同時(shí)也奠定了生物特征識別的研究方向。隨著技術(shù)的進(jìn)一步成熟和社會(huì)認(rèn)同度的提高，越來越多的學(xué)者將基于神經(jīng)網(wǎng)絡(luò)的多種深度學(xué)習(xí)方法結(jié)合起來，但在人臉標(biāo)志檢測方面還存在精度問題，由此提出一種深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法加以解決。深度學(xué)習(xí)以多層自編碼神經(jīng)網(wǎng)絡(luò)的方式進(jìn)行預(yù)訓(xùn)練，進(jìn)而結(jié)合人臉面部信息進(jìn)一步優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值的深度置信網(wǎng)絡(luò)（DBN）。文章基于深度學(xué)習(xí)人臉識別發(fā)展現(xiàn)狀進(jìn)行分析，目的是進(jìn)一步提高人臉識別精度。

關(guān)鍵詞：人臉識別;深度學(xué)習(xí);深度算法;發(fā)展現(xiàn)狀

1 背景介紹

大數(shù)據(jù)時(shí)代信息冗雜，爆炸式增長的數(shù)據(jù)產(chǎn)生了信息泄露等嚴(yán)峻問題，保密機(jī)制形同虛設(shè)，信息時(shí)代面臨著前所未有的巨大挑戰(zhàn)。生物特征識別技術(shù)的出現(xiàn)恰好可以有效解決此問題，這項(xiàng)技術(shù)具有不易偽造和唯一性，可以稱之為“信息技術(shù)安全守護(hù)者”。人臉識別技術(shù)作為生物特征識別技術(shù)的核心技術(shù)之一，繼承了其唯一性的特點(diǎn)，而且包含人臉的光學(xué)表示。目前人臉識別技術(shù)被廣泛用于政府、軍隊(duì)、銀行、社會(huì)福利保障、電子商務(wù)、安全防務(wù)等領(lǐng)域[1]。

2?深度學(xué)習(xí)

深度學(xué)習(xí)（Deep Learning，DL）是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)研究方向，是一個(gè)復(fù)雜的機(jī)器學(xué)習(xí)算法，在語音和圖像識別方面取得的效果，遠(yuǎn)遠(yuǎn)超過先前的相關(guān)技術(shù)。它可以經(jīng)過層間的輪班訓(xùn)練和一般的微調(diào)迫使計(jì)算機(jī)進(jìn)行自我學(xué)習(xí)，并且隨著網(wǎng)絡(luò)層的增加，學(xué)習(xí)能力逐漸被委托深入的學(xué)習(xí)理論，如對比度分集算法、背乘算法、時(shí)延神經(jīng)網(wǎng)絡(luò)等專家混合系統(tǒng)，對于人工智能的發(fā)展具有重要意義[2-3]。

深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次，這些學(xué)習(xí)過程中獲得的信息對諸如文字，圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。隨著深度學(xué)習(xí)的發(fā)展，人臉識別技術(shù)更加成熟。

在人臉識別領(lǐng)域中，深度學(xué)習(xí)一共有以下幾種典型應(yīng)用[4-5]：

（1）基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法;

（2）深度非線性人臉形狀提取方法;

（3）基于深度學(xué)習(xí)的人臉姿態(tài)魯棒性建模;

（4）約束環(huán)境下的全自動(dòng)人臉識別;

（5）基于深度學(xué)習(xí)的視頻監(jiān)控下的人臉識別;

（6）基于深度學(xué)習(xí)的低分辨率人臉識別和其他基于深度學(xué)習(xí)的人臉相關(guān)信息的識別。

卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks，CNN）是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)，是深度學(xué)習(xí)的代表算法之一?；诰矸e神經(jīng)網(wǎng)絡(luò)的人臉識別方法，是深度監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型，它可以挖掘數(shù)據(jù)的局部特征，并提取全局特征，然后進(jìn)行分類，其權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)更類似于生物神經(jīng)網(wǎng)絡(luò)，被應(yīng)用于模式識別的各個(gè)領(lǐng)域。

2.1 ?深度學(xué)習(xí)概述及發(fā)展

深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的重要組成部分，有時(shí)也被稱為深度神經(jīng)學(xué)習(xí)或深度神經(jīng)網(wǎng)絡(luò)。

深度學(xué)習(xí)是由Hinton等人于2006年基于深度信網(wǎng)（DBN）提出的非監(jiān)督貪心逐層訓(xùn)練算法。隨著目標(biāo)的正確識別逐漸成為人工智能的重要組成部分，基于深度學(xué)習(xí)的人臉識別目前也成了特征識別領(lǐng)域的研究熱點(diǎn)。

2.2 ?人臉識別細(xì)分類的深度學(xué)習(xí)算法

臉部表達(dá)模型分為二維臉部和三維臉部，即2D和3D臉部。二維人臉識別的研究時(shí)間比較長，方法流程也比較成熟，應(yīng)用于許多領(lǐng)域，但由于二維人臉識別信息存在深度數(shù)據(jù)丟失的缺陷，無法完全表達(dá)真實(shí)的人臉，因此在實(shí)際應(yīng)用中存在著識別準(zhǔn)確率低、活體檢測率低等問題。

現(xiàn)在市場上的3D人臉識別根據(jù)使用相機(jī)成像原理主要分為：3D結(jié)構(gòu)光、TOF、雙目立體視覺。

2.3 ?人臉識別算法

最近的幾年來，隨著相關(guān)領(lǐng)域人員對人臉識別的研究不斷深入，現(xiàn)有的人臉識別技術(shù)主要針對現(xiàn)實(shí)環(huán)境和現(xiàn)實(shí)應(yīng)用場景進(jìn)行識別，具體包括以下3個(gè)方面：

（1）人臉模型的設(shè)計(jì)，包括線性鑒別分析、線性建模方法、非線性建模方法和三維人臉識別[4]。

（2）新特征表征，包括局部描述和深入研究，部分說明和深度學(xué)習(xí)方法。

（3）新的數(shù)據(jù)源，包括視頻人臉識別以及草圖和近紅外圖像。

以下是較為經(jīng)典的三大人臉識別的經(jīng)典算法：

（1）Deep Face采用了一種基于監(jiān)測點(diǎn)的人臉檢測方法。臉部檢測部分將首先選取6個(gè)基準(zhǔn)點(diǎn)，2個(gè)眼心，1個(gè)鼻點(diǎn)，3個(gè)口點(diǎn)，然后利用SVR對LBP特征進(jìn)行特征學(xué)習(xí)，獲得標(biāo)記點(diǎn)。

（2）Face Net是谷歌提議的網(wǎng)絡(luò)結(jié)構(gòu)，它可以靈活地使用22層 Zelier& Fergus的網(wǎng)絡(luò)，也可以使用 inception網(wǎng)絡(luò)，后者目前在物體識別方面比較有效。它的主要特點(diǎn)是利用3個(gè)單元之間的距離來構(gòu)造損失函數(shù)。

（3）Center Loss不同于三元損失，中心損失并不直接優(yōu)化距離，它保留了原來的分類模型，但是為每一類分別指定了一個(gè)分類中心。同一類圖像對應(yīng)的特征都應(yīng)盡可能接近其各自類別的中心，不同類別的中心應(yīng)盡可能遠(yuǎn)離。

3 人臉識別技術(shù)在深度學(xué)習(xí)中的廣泛應(yīng)用

在不久的將來，全國主流的人臉識別技術(shù)將以識別13億人像為重點(diǎn)?？梢灶A(yù)見的是，建立一個(gè)全國統(tǒng)一的人臉圖像數(shù)據(jù)庫，使存儲(chǔ)在這個(gè)數(shù)據(jù)庫中的數(shù)十億張人臉圖像的容量達(dá)到幾十億甚至幾千億張。此時(shí)，可以出現(xiàn)大量性能和關(guān)鍵功能相似的人臉。如果沒有基于深度學(xué)習(xí)的人臉識別技術(shù)，就沒有辦法建立更加復(fù)雜多樣的人臉模型，這就是為什么要實(shí)現(xiàn)準(zhǔn)確快速的人臉識別會(huì)更加困難的原因。

4 未來的發(fā)展與問題

如今，基于深度學(xué)習(xí)的人臉識別技術(shù)已經(jīng)取得了很大的階段性成功;而且有著非常廣闊和光明的前景和未來，它的發(fā)展空間非常的大，但隨之而來也會(huì)產(chǎn)生相關(guān)如下的幾個(gè)問題。

4.1 重心應(yīng)該偏移至數(shù)據(jù)方面

基于深度學(xué)習(xí)的人臉識別技術(shù)的三要素—算法、硬件、數(shù)據(jù)，隨著相關(guān)科技的不斷發(fā)展和經(jīng)濟(jì)水平的提高，算法與硬件的技術(shù)障礙越來越小，但是數(shù)據(jù)之間的差異則顯得越來越突出。對于人臉識別來說，把握數(shù)據(jù)入口，形成算法—產(chǎn)品—數(shù)據(jù)的閉環(huán)生態(tài)是算法在未來取勝的關(guān)鍵。與此同時(shí)，對海量數(shù)據(jù)的分析處理也將成為研究的重點(diǎn)。

4.2 發(fā)展終端和云端

目前，隨著 GPU和各種深度學(xué)習(xí)芯片等人臉識別技術(shù)的發(fā)展，使設(shè)備的運(yùn)算能力得到了很大的提高，同時(shí)隨著手機(jī)、智能家居等設(shè)備的普及，前端和云端將更加智能化。

4.3 安全和隱私權(quán)

如今，數(shù)據(jù)正呈指數(shù)增長，數(shù)據(jù)安全和隱私問題也變得十分重要。而且臉部識別技術(shù)正好處在容易被不法分子利用的情況下，將面臨照片、視頻、面具等各種欺詐攻擊，臉部特征在傳輸、存儲(chǔ)過程中會(huì)受到黑客和其他犯罪嫌疑人的威脅，用戶在享受深度學(xué)習(xí)帶來的便利的同時(shí)，也非常關(guān)心自己的數(shù)據(jù)是否被盜用、傳播等。對活體探測、隱私加密等問題應(yīng)加強(qiáng)研究，防止不法分子利用漏洞來侵犯用戶的權(quán)益以及隱私[6]。

4.4 兼容性

當(dāng)前，隨著深度學(xué)習(xí)相關(guān)人臉識別技術(shù)的不斷發(fā)展，相關(guān)廠商也在不斷增加，但用戶往往需要根據(jù)自己的實(shí)際情況和需求來定制所需的人臉識別系統(tǒng)，但該系統(tǒng)所涉及的技術(shù)層面很多，從硬件到軟件，都需要各大廠商的支持，因此需要考慮從底層到上層的界面開發(fā)及兼容性問題，以推動(dòng)其發(fā)展。

5 結(jié)語

伴隨著人工智能時(shí)代的不斷發(fā)展，深度學(xué)習(xí)在模式識別中的應(yīng)用不斷深化，在網(wǎng)絡(luò)復(fù)雜性方面，深度學(xué)習(xí)網(wǎng)絡(luò)也需要簡化算法以提高其效率。因此在網(wǎng)絡(luò)功能方面，應(yīng)探索深度學(xué)習(xí)與其他模式識別模型的結(jié)合，以不斷擴(kuò)展網(wǎng)絡(luò)接口和功能?？傊?，深度學(xué)習(xí)將為包括人臉識別在內(nèi)的模式識別應(yīng)用打開新的局面。

[參考文獻(xiàn)]

[1]劉衛(wèi)凱，郝雅倩，鄭晗，等.人臉識別綜述[J].信息記錄材料，2018（7）：13-14.

[2]夏志強(qiáng).人臉識別綜述[J].電子世界，2017（23）：44.

[3]徐曉艷.人臉識別技術(shù)綜述[J].電子測試，2015（10）：885-894.

[4]黨永成.人臉識別技術(shù)綜述及分析[J].電子技術(shù)與軟件工程，2018（3）：158.

[5]金連文，鐘卓耀，楊釗，等.深度學(xué)習(xí)在手寫漢字識別中的應(yīng)用綜述[J].自動(dòng)化學(xué)報(bào)，2016（8）：1125-1141.

[6]趙鵬，王斐，劉慧婷，等.基于深度學(xué)習(xí)的手繪草圖識別[J].工程科學(xué)與技術(shù)，2016（3）：94-99.

（編輯傅金睿）

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于深度學(xué)習(xí)的人臉識別技術(shù)發(fā)展現(xiàn)狀分析