国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

樣本增強(qiáng)的人臉識(shí)別算法研究

2018-07-12 06:38:18章東平
關(guān)鍵詞:戴眼鏡人臉識(shí)別人臉

張 坤,章東平,楊 力

(中國(guó)計(jì)量大學(xué) 信息工程學(xué)院,浙江 杭州 310018)

基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別算法的性能在最近幾年已經(jīng)得到了很大的提高.這些提高一方面來(lái)源于新的以及改進(jìn)的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),而另一方面則來(lái)源于規(guī)模越來(lái)越大的人臉數(shù)據(jù)集.

當(dāng)研究者認(rèn)識(shí)到通過(guò)增加訓(xùn)練數(shù)據(jù)可以為卷積神經(jīng)網(wǎng)絡(luò)帶來(lái)性能的提升后,很多研究者和研究機(jī)構(gòu)開始收集和標(biāo)注大量的人臉圖像作為訓(xùn)練數(shù)據(jù).Facebook的研究人員[1]標(biāo)注了4.4百萬(wàn)的人臉去訓(xùn)練他們的人臉識(shí)別模型,牛津大學(xué)的研究團(tuán)隊(duì)[2]使用了2.6百萬(wàn)的人臉圖像,Face++[3]在5百萬(wàn)標(biāo)注好的人臉數(shù)據(jù)上訓(xùn)練他們的模型.值得注意的是,谷歌的FaceNet[4]人臉識(shí)別模型則使用了200百萬(wàn)的有標(biāo)注人臉圖像.

然而收集并且標(biāo)注大量的用于訓(xùn)練的人臉數(shù)據(jù)并不是一件輕松的事情,它需要花費(fèi)大量的人力物力去下載、處理和標(biāo)注數(shù)以百萬(wàn)計(jì)的人臉圖像,并且要求在標(biāo)注時(shí)保證很高的可信度.因此,只有較大的商業(yè)公司才有能力收集標(biāo)注百萬(wàn)量級(jí)的人臉數(shù)據(jù),并且,這些商業(yè)公司標(biāo)注好的人臉數(shù)據(jù)并不會(huì)公開給其他研究團(tuán)隊(duì)使用.就目前的情況來(lái)看,CASIA-WebFace[5]是當(dāng)前公開的最大的免費(fèi)人臉識(shí)別數(shù)據(jù)集.CASIA-WebFace數(shù)據(jù)集包含10 575個(gè)人的共約49.5萬(wàn)的人臉圖像,然而和上文提到的幾個(gè)人臉識(shí)別數(shù)據(jù)集相比,在規(guī)模上還是有很大差距.并且,對(duì)于基于深度學(xué)習(xí)的人臉識(shí)別算法,需要的訓(xùn)練人臉數(shù)據(jù),不僅要求其類別數(shù)達(dá)到一定規(guī)模,而且還要其每個(gè)類別中人臉圖片具有多樣性,這對(duì)數(shù)據(jù)收集來(lái)說(shuō)又是一個(gè)很棘手的問(wèn)題.

為充分利用有限的人臉識(shí)別數(shù)據(jù)資源,本文嘗試通過(guò)兩種樣本增強(qiáng)的方式來(lái)解決上述提到的樣本不足的問(wèn)題.一是根據(jù)單張人臉圖像生成該人不同姿態(tài)的人臉圖像,二是為每張人臉圖像戴上不同的眼鏡.

1 多姿態(tài)人臉圖像生成

1.1 多姿態(tài)人臉圖像生成原理

為了通過(guò)單張人臉圖像生成其對(duì)應(yīng)的各個(gè)姿態(tài)人臉圖像,本文借助Patrik Huber等人[6]在2016年提出的三維可形變?nèi)四樐P?3DMM)來(lái)實(shí)現(xiàn).三維可形變?nèi)四樐P突谌四樀娜S網(wǎng)格,一張人臉由一個(gè)包含形狀的x,y和z分量的向量SεR?N和一個(gè)包含每個(gè)頂點(diǎn)RGB顏色信息的向量表示TεR?N,N是網(wǎng)格頂點(diǎn)的數(shù)量.三維可形變模型由兩個(gè)PCA模型組成,一個(gè)用于形狀,另一個(gè)用于顏色信息.

構(gòu)建該三維可形變?nèi)四樐P凸彩褂昧?69個(gè)人的三維人臉掃描圖像,其中19歲以下的有9個(gè)人,20~29歲的有106個(gè)人,30~44歲的有33個(gè)人,45~59歲的有13個(gè)人,大于60歲的只有8個(gè)人.

通過(guò)單張人臉圖像重建其三維人臉模型有以下幾個(gè)關(guān)鍵步驟:1)姿態(tài)估計(jì);2)形狀擬合;3)紋理重建.

1)姿態(tài)估計(jì).這里的姿態(tài)估計(jì)也是指求解攝像機(jī)矩陣(camera matrix),獲得二維圖像與三維圖像間的對(duì)應(yīng)關(guān)系.根據(jù)在二維人臉圖像上檢測(cè)到的關(guān)鍵點(diǎn)與三維人臉圖像上與其對(duì)應(yīng)的關(guān)鍵點(diǎn)的坐標(biāo)信息,求得攝像機(jī)矩陣.求解方法使用Hartley和Zisserman在2004年提出的Gold Standard算法.

2)形狀擬合.為找到PCA形狀模型中最合適的系數(shù),通過(guò)最小化E來(lái)求解得到

(1)

3)紋理重建.通過(guò)1)、2)得到攝像機(jī)矩陣和形狀系數(shù)后,則輸入人臉圖像和三維網(wǎng)格間的對(duì)應(yīng)關(guān)系可以得到.之后,可將二維人臉圖像重映射到三維人臉模型上,最終得到完整的三維人臉.

1.2 多姿態(tài)人臉圖像生成結(jié)果

應(yīng)用上節(jié)所述方法,我們對(duì)CASIA-WebFace數(shù)據(jù)集進(jìn)行了姿態(tài)方面的數(shù)據(jù)增強(qiáng).對(duì)于單張人臉圖像,我們分別生成了其偏航角±30°,±45°,俯仰角±30°,±45°的人臉圖像.效果如圖1.

在圖1中,(a)為原始人臉圖像;(b)為與(a)對(duì)應(yīng)偏航角為+30°的人臉圖像;(c)為與(a)對(duì)應(yīng)偏航角為+45°的人臉圖像;(d)為與(a)對(duì)應(yīng)偏航角為-30°的人臉圖像;(e)為與(a)對(duì)應(yīng)偏航角為-45°的人臉圖像;(f)為與(a)對(duì)應(yīng)俯仰角為-30°的人臉圖像;(g)為與(a)對(duì)應(yīng)俯仰角為-45°的人臉圖像;(h)為與(a)對(duì)應(yīng)俯仰角為+30°的人臉圖像;(i)為與(a)對(duì)應(yīng)俯仰角為+45°的人臉圖像原始CASIA-WebFace數(shù)據(jù)集包含494 414張人臉圖像,其中有一些人臉圖像因無(wú)法檢測(cè)到人臉和人臉關(guān)鍵點(diǎn),無(wú)法完成多姿態(tài)人臉的生成.最終,原始數(shù)據(jù)與進(jìn)行姿態(tài)增強(qiáng)后的數(shù)據(jù)共有1 281 005張人臉圖像.

圖1 多姿態(tài)人臉生成效果圖Figure 1 Multi-pose face generation

2 戴眼鏡人臉圖像生成

2.1 戴眼鏡人臉圖像生成方法

根據(jù)原始人臉圖像,生成其對(duì)應(yīng)的“戴眼鏡”人臉圖像,需要使用到人臉檢測(cè),人臉關(guān)鍵點(diǎn)定位技術(shù).本文使用開源的MTCNN[7]算法進(jìn)行人臉檢測(cè)和人臉關(guān)鍵點(diǎn)定位.下面給出具體的操作步驟.

1)使用MTCNN算法檢測(cè)目標(biāo)人臉在原始圖像中的位置.

2)使用MTCNN算法定位目標(biāo)人臉的五個(gè)關(guān)鍵點(diǎn).這五個(gè)關(guān)鍵點(diǎn)分別為(左眼中心,右眼中心,鼻尖,左嘴角,右嘴角),設(shè)其對(duì)應(yīng)坐標(biāo)分別為(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).

5)將4)得到的經(jīng)過(guò)縮放旋轉(zhuǎn)后的眼鏡圖片與原始人臉圖片進(jìn)行疊加(對(duì)齊眼鏡中心位置),即可得到“戴眼鏡”后的人臉圖像.

2.2 戴眼鏡人臉圖像生成結(jié)果

本文收集了四種眼鏡樣本,對(duì)CASIA-WebFace數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng).效果如圖2.在圖2中,(a)為原始人臉圖像,(b)、(c)、(d)、(e)分別為戴不同眼鏡生成的人臉圖像.

3 實(shí)驗(yàn)驗(yàn)證

3.1 實(shí)驗(yàn)數(shù)據(jù)集

CASIA-WebFace數(shù)據(jù)集[5].CASIA-WebFace數(shù)據(jù)集是由中科院自動(dòng)化研究所的李子青團(tuán)隊(duì)在2014年收集整理完成的,它包含10 575個(gè)人的494 414張人臉圖像.

圖2 戴眼鏡人臉圖像生成效果Figure 2 Face generation with glasses

LFW數(shù)據(jù)集[8].LFW為英文Labeled Faces in the Wild的縮寫,該數(shù)據(jù)集包含5 749個(gè)人的13 233張人臉圖像.為了方便公正的在LFW數(shù)據(jù)集上比較不同人臉識(shí)別算法的優(yōu)劣,有兩種較為常用的評(píng)比規(guī)則.1)標(biāo)準(zhǔn)規(guī)則.5 749個(gè)人的13 233張人臉圖像被隨機(jī)組成了6 000對(duì)人臉圖像對(duì),其中3 000對(duì)由相同人組成,剩余3 000對(duì)為不同人組成.評(píng)測(cè)時(shí),計(jì)算準(zhǔn)確率.2)BLUFR規(guī)則[9],BLUFR為英文Benchmark of Large-scale Unconstrained Face Recognition的縮寫.BLUFR評(píng)測(cè)準(zhǔn)則充分利用了LFW數(shù)據(jù)集的13 233張人臉圖像,將其劃分為了十個(gè)部分,每一部分包含156 915對(duì)相同人樣本對(duì),46 960 863對(duì)不同人樣本對(duì).另外,BLUFR規(guī)則,可以同時(shí)提供驗(yàn)證和開集識(shí)別測(cè)試指標(biāo).為后文行文方便,記標(biāo)準(zhǔn)規(guī)則為準(zhǔn)則一,記BLUFR規(guī)則為準(zhǔn)則二.

YTF數(shù)據(jù)集[10].YTF為英文YouTube Faces的縮寫.YTF數(shù)據(jù)集包含1 595個(gè)人的3 425段視頻,這些視頻全部來(lái)自國(guó)外視頻網(wǎng)站YouTube,平均每個(gè)人有兩段視頻.在這些視頻片段中,最短的只有48幀,最長(zhǎng)的為6 070幀,平均每段視頻為181.3幀.為了方便測(cè)試,YTF數(shù)據(jù)集將所有數(shù)據(jù)有重疊的劃分為十個(gè)部分.每部分由250個(gè)正樣本對(duì),250個(gè)負(fù)樣本對(duì)組成.因?yàn)榇嬖谶\(yùn)動(dòng)模糊以及高壓縮率的原因,YTF數(shù)據(jù)中的人臉質(zhì)量低于上述兩個(gè)人臉數(shù)據(jù)集中的人臉質(zhì)量.

3.2 網(wǎng)絡(luò)模型與數(shù)據(jù)預(yù)處理

本文實(shí)驗(yàn)所采用的網(wǎng)絡(luò)模型為開源的Face-ResNet[11],其包含27個(gè)卷積層,兩個(gè)全連接層,使用PReLU[12]作為激活函數(shù).為了檢測(cè)到圖像中的人臉以及準(zhǔn)確定位到人臉中的關(guān)鍵點(diǎn),本文使用上MTCNN算法.在一些圖片中,MTCNN算法可能無(wú)法成功檢測(cè)到人臉.對(duì)于這些人臉圖像,我們丟棄不用,但是這種處理方法,僅限于在訓(xùn)練集中的圖片.如果在LFW或者YTF數(shù)據(jù)集中出現(xiàn)這樣的圖片,則進(jìn)行人工標(biāo)定處理.之后,根據(jù)成功定位到的人臉關(guān)鍵點(diǎn),我們使用上文提到的人臉對(duì)齊方法將其矯正為144×144大小的灰度圖.最后,在送入網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),每個(gè)像素值先減去127.5,再除以127.5.

3.3 生成多姿態(tài)人臉圖像對(duì)人臉識(shí)別模型性能的影響

我們使用Face-ResNet網(wǎng)絡(luò)模型訓(xùn)練兩個(gè)人臉識(shí)別模型,分別為Model-Aw,Model-Awp.其區(qū)別在于Model-Aw使用原始CASAI-WebFace數(shù)據(jù)集,Model-Awp使用CASIA-WebFace-pose數(shù)據(jù)集.

表1使用原始CASIA-WebFace數(shù)據(jù)集以及經(jīng)過(guò)姿態(tài)增強(qiáng)的CASIA-WebFace數(shù)據(jù)集訓(xùn)練的Face-ResNet模型在LFW數(shù)據(jù)集上使用測(cè)試準(zhǔn)則一得到的結(jié)果.表2顯示了它們使用測(cè)試準(zhǔn)則二得到的結(jié)果.從表1和表2可以看出,經(jīng)過(guò)使用經(jīng)過(guò)姿態(tài)增強(qiáng)的訓(xùn)練數(shù)據(jù)得到的人臉識(shí)別模型在LFW數(shù)據(jù)集上的測(cè)試結(jié)果均高于使用原始CASIA-WebFace訓(xùn)練的人臉識(shí)別模型.

表1 Model-Aw與Model-Awp在LFW上的測(cè)試結(jié)果(準(zhǔn)則一)Table 1 the performance of Model-Aw and Model-Awp on LFW(protocol 1)

表2 Model-Aw與Model-Awp在LFW上的測(cè)試結(jié)果(準(zhǔn)則二)Table 2 the performance of Model-Aw and Model-Awp on LFW(protocol 2) %

表3 Model-Aw與Model-Awp在YTF上的測(cè)試結(jié)果Table 3 the performance of Model-Aw and Model-Awp on YTF

表3給出了使用不同訓(xùn)練數(shù)據(jù)訓(xùn)練的人臉識(shí)別模型在YTF數(shù)據(jù)集上的測(cè)試結(jié)果,可以看出模型Model-Awp在YTF數(shù)據(jù)集上的準(zhǔn)確率較Model-Aw高0.48%.

3.4 戴眼鏡人臉圖像對(duì)人臉識(shí)別模型性能的影響

本節(jié)為驗(yàn)證生成的戴眼鏡人臉圖像對(duì)人臉識(shí)別模型性能的影響,分別使用不同數(shù)據(jù)集使用Face-ResNet網(wǎng)絡(luò)模型訓(xùn)練出得到不同的人臉識(shí)別模型.使用原始CASIA-WebFace訓(xùn)練得到的人臉識(shí)別模型記為Model-Aw,使用經(jīng)過(guò)“戴眼鏡”的人臉識(shí)別數(shù)據(jù)集訓(xùn)練得到的人臉識(shí)別模型記為Model-Awg.為驗(yàn)證生成的戴眼鏡人臉圖像對(duì)人臉識(shí)別模型性能的影響,我們?cè)诠_的LFW數(shù)據(jù)集、YTF數(shù)據(jù)集上進(jìn)行評(píng)測(cè).

表4給出了Model-Aw和Model-Awg在LFW測(cè)試準(zhǔn)則一下的測(cè)試結(jié)果,表5給出了Model-Aw和Model-Awg在LFW測(cè)試準(zhǔn)則二下的測(cè)試結(jié).表6給出了Model-Aw和Model-Awg在YTF數(shù)據(jù)集上的表現(xiàn).

表4 Model-Aw與Model-Awg在LFW上的測(cè)試結(jié)果(準(zhǔn)則一)Table 4 the performance of Model-Aw and Model-Awg on LFW(protocol 1)

表5 Model-Aw與Model-Awg在LFW上的測(cè)試結(jié)果(準(zhǔn)則二)Table 5 the performance of Model-Aw and Model-Awg on LFW(protocol 2) %

從表4和表5可以看出,對(duì)于LFW數(shù)據(jù)集,無(wú)論是測(cè)試準(zhǔn)則一還是測(cè)試準(zhǔn)則二,使用CASIA-WebFace-glass數(shù)據(jù)集訓(xùn)練得到的模型均可得到一定程度上性能的提升.

表6 Model-Aw與Model-Awg在YTF上的測(cè)試結(jié)果Table 6 the performance of Model-Aw and Model-Awg on YTF

從表6中可以看出,使用經(jīng)過(guò)姿態(tài)增強(qiáng)的到的CASIA-WebFace-glass數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù),Model-Awg在YTF上的準(zhǔn)確率有1.33%的提高.

4 結(jié) 語(yǔ)

本文通過(guò)兩種不同的樣本生成方式,擴(kuò)充了原始CASIA-WebFace數(shù)據(jù)集.通過(guò)公開人臉測(cè)試集驗(yàn)證了樣本增強(qiáng)的效果.實(shí)驗(yàn)結(jié)果表明,不同的人臉樣本增強(qiáng)方式均會(huì)對(duì)人臉識(shí)別模型的效果有所提升.

猜你喜歡
戴眼鏡人臉識(shí)別人臉
人臉識(shí)別 等
有特點(diǎn)的人臉
揭開人臉識(shí)別的神秘面紗
戴眼鏡的女孩
文苑(2019年20期)2019-11-16 08:52:22
戴眼鏡的人到底有多慘
三國(guó)漫——人臉解鎖
小猴戴眼鏡
基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
馬面部與人臉相似度驚人
近視眼戴眼鏡后變“鼓眼”?
龙里县| 宁海县| 贡嘎县| 永康市| 万全县| 建水县| 龙川县| 邵武市| 连南| 宁陵县| 黄龙县| 密山市| 西充县| 洱源县| 和政县| 久治县| 香河县| 上犹县| 临湘市| 钦州市| 宣威市| 荥经县| 平江县| 卢氏县| 东丰县| 丰城市| 翼城县| 盐亭县| 灵石县| 山东| 章丘市| 两当县| 徐汇区| 和政县| 南岸区| 石景山区| 泸西县| 女性| 涞源县| 隆化县| 河东区|