高見(jiàn)
(揚(yáng)州市職業(yè)大學(xué) 江蘇省揚(yáng)州市 225000)
伴隨著當(dāng)前公眾環(huán)保意識(shí)的提高和信息技術(shù)的發(fā)展,人臉識(shí)別技術(shù)在我們?nèi)粘I钇鸬降淖饔迷絹?lái)越多樣化。但是隨著人臉識(shí)別的普及,各種各樣的問(wèn)題也隨著出現(xiàn),常見(jiàn)的就有人臉角度問(wèn)題、光照問(wèn)題、面部多余問(wèn)題等等,這一方面對(duì)人臉識(shí)別技術(shù)的進(jìn)一步應(yīng)用做出了考驗(yàn),另一方面也是對(duì)相關(guān)企業(yè)的技術(shù)創(chuàng)新進(jìn)行了檢查。本文正是以當(dāng)前人臉識(shí)別的需求識(shí)別出發(fā),以YOLOV2 神經(jīng)算法為基礎(chǔ),進(jìn)而構(gòu)建起完整的識(shí)別模型,為當(dāng)前環(huán)節(jié)人臉識(shí)別的需求現(xiàn)狀提供了參考依據(jù)。
人臉識(shí)別的需求在各個(gè)時(shí)間段呈現(xiàn)不同的狀態(tài),所以在進(jìn)行相關(guān)算法的選擇時(shí)要注意對(duì)識(shí)別方法選擇,常用的識(shí)別方法包括德?tīng)柗品?、神?jīng)網(wǎng)絡(luò)、時(shí)間序列發(fā)、機(jī)器學(xué)習(xí)、回歸分析法、彈性系數(shù)法和灰色識(shí)別法等等,在對(duì)各種方法進(jìn)行分析和討論之后,最終決定使用神經(jīng)網(wǎng)絡(luò)中的YOLOV2 算法來(lái)構(gòu)建相關(guān)的模型。
YOLOV2 算法起源于上世紀(jì)末的YOLOV1 算法,經(jīng)過(guò)幾十年的發(fā)展在各個(gè)領(lǐng)域之中均有著廣泛的應(yīng)用,是當(dāng)前神經(jīng)網(wǎng)絡(luò)模型的代表。YOLOV2 算法的本質(zhì)是一種多層前饋神經(jīng)網(wǎng)絡(luò),特點(diǎn)是能夠依照誤差逆向傳播法對(duì)相關(guān)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,最終得到與期望向量最大程度接近的輸出向量。本次實(shí)驗(yàn)的所應(yīng)用的神經(jīng)網(wǎng)絡(luò)算法模型的基本流程可以分為以下幾個(gè)步驟:
首先,將相關(guān)的學(xué)習(xí)參數(shù)和權(quán)初始化為績(jī)效的隨機(jī)數(shù),設(shè)置相關(guān)的偏置;第二,是設(shè)置期望輸入和加輸入;第三,是對(duì)相關(guān)輸出層和隱層的輸出進(jìn)行計(jì)算;第四,是對(duì)相關(guān)輸出層和隱層的連接權(quán)值進(jìn)行調(diào)節(jié)后改變訓(xùn)練樣板;第五是確定是否訓(xùn)練終止,如果不終止訓(xùn)練,就重復(fù)第二到第四步驟,如果終止訓(xùn)練則進(jìn)行第六步;第六,相關(guān)實(shí)驗(yàn)的迭代次數(shù)+1,直到迭代終止,如果選擇繼續(xù)迭代,重復(fù)第二到第六步驟,如果選擇終止迭代,則輸出相應(yīng)的輸出向量。
本次數(shù)據(jù)來(lái)源基于某人臉識(shí)別企業(yè)的內(nèi)部數(shù)據(jù),某門(mén)禁企業(yè)的使用人數(shù)為7.664 人,選取樣本的時(shí)間為2020年4月25日,當(dāng)天某人臉識(shí)別系統(tǒng)的回饋整體數(shù)據(jù)樣本為9000 條。本實(shí)驗(yàn)將這些參數(shù)統(tǒng)共劃分為記錄編號(hào)(id)、1 小時(shí)內(nèi)某企業(yè)人臉識(shí)別的整體需求量(y)、某人臉識(shí)別企業(yè)投放業(yè)務(wù)的正臉人臉(face)、30°人臉(30°face)、60°人臉(60°face)、90°人臉(90°face)、人臉小片陰影(Small shadow)、人臉中片陰影(Medium shadow)、所人臉大片陰影(Big shadow),共9 個(gè)特征變量。
圖1:YOLOV2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識(shí)別模型的拓?fù)浣Y(jié)構(gòu)示意圖
本次設(shè)計(jì)的YOLOV2 算法人臉識(shí)別數(shù)據(jù)庫(kù)采用YOLOV2 網(wǎng)絡(luò)為基礎(chǔ),作為一種面向?qū)ο蟮年P(guān)系型數(shù)據(jù)庫(kù),YOLOV2 網(wǎng)絡(luò)支持在標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)系統(tǒng)中管理相關(guān)數(shù)據(jù),一方面能夠?qū)崿F(xiàn)數(shù)據(jù)的完整性,另一方面能夠保證使用過(guò)程的安全。基于本次試驗(yàn)實(shí)際情況,筆者將YOLOV2 算法人臉識(shí)別數(shù)據(jù)庫(kù)系統(tǒng)的構(gòu)建分為如下幾步:
首先是針對(duì)該本次試驗(yàn)的人臉識(shí)別系統(tǒng)信息數(shù)據(jù)進(jìn)行搜集和整理,針對(duì)不同的分類(lèi)完成格式、單位和尺度的統(tǒng)一,最終將該本次試驗(yàn)的YOLOV2 算法人臉識(shí)別編程有效的字段名和表頭;其次是完成Geodatabase 的構(gòu)建,依照流域的實(shí)際情況將不同的圖層進(jìn)行分類(lèi)和儲(chǔ)存;第三是把剩下的數(shù)據(jù)儲(chǔ)存到access 屬性的二維表數(shù)據(jù)庫(kù)中,同時(shí)完成分類(lèi)和編碼;最后是完善YOLOV2 網(wǎng)絡(luò)各版塊的構(gòu)建和相應(yīng)的管理系統(tǒng)。本次采樣的信息可以分為正臉人臉(face)、30°人臉(30°face)、60°人臉(60°face)、90°人臉(90°face)、人臉小片陰影(Small shadow)、人臉中片陰影(Medium shadow)、所人臉大片陰影(Big shadow)。YOLOV2 網(wǎng)絡(luò)的構(gòu)建主要是為了服務(wù)本次試驗(yàn)的長(zhǎng)江流域水系統(tǒng),所以需要依靠圖像頻譜來(lái)獲取相關(guān)的人臉知識(shí)并進(jìn)行存儲(chǔ)?;谏鲜鰣D像處理的人臉識(shí)別方式很容易受到相應(yīng)的干擾,在將數(shù)據(jù)錄入Geodatabase 數(shù)據(jù)庫(kù)之前需要對(duì)人臉識(shí)別的方式進(jìn)行相應(yīng)的優(yōu)化,來(lái)幫助數(shù)據(jù)庫(kù)更好的甄別檢測(cè)數(shù)據(jù)的準(zhǔn)確性。這一方面需要針對(duì)外界干擾信號(hào)或者偽造信號(hào)的原理進(jìn)行分析,另一方面需要針對(duì)Geodatabase 數(shù)據(jù)庫(kù)的缺陷來(lái)制定相應(yīng)的優(yōu)化方案,從根本上對(duì)這個(gè)問(wèn)題進(jìn)行解決就需要針對(duì)Geodatabase 數(shù)據(jù)庫(kù)的特性設(shè)置相應(yīng)的識(shí)別和糾錯(cuò)能力。
表1:檢測(cè)測(cè)試數(shù)據(jù)訓(xùn)練結(jié)果
表2:檢測(cè)訓(xùn)練數(shù)據(jù)評(píng)價(jià)結(jié)果
基于上述9 個(gè)特征變量,本次試驗(yàn)YOLOV2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識(shí)別模型的構(gòu)建步驟如下所示:首先在構(gòu)建模型之間需要對(duì)YOLOV2神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識(shí)別模型的拓?fù)浣Y(jié)構(gòu)進(jìn)行分析和設(shè)置,其拓?fù)浣Y(jié)構(gòu)如圖1所示,YOLOV2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識(shí)別模型的結(jié)構(gòu)特點(diǎn)為其輸入層、隱層和輸出層三層都可以完成由n 維到m 維的映射,進(jìn)而可以將60°人臉(60°face)、90°人臉(90°face)、人臉小片陰影(Small shadow)、人臉中片陰影(Medium shadow)、所人臉大片陰影(Big shadow)、30°人臉(30°face)作為本次識(shí)別模型的特征變量,將1 小時(shí)內(nèi)某企業(yè)人臉識(shí)別的整體需求量(y)作為本次實(shí)驗(yàn)識(shí)別模型的目標(biāo)變量;其次是對(duì)隱含層內(nèi)的神經(jīng)元數(shù)量和最大迭代次數(shù)進(jìn)行設(shè)置,根據(jù)本次人臉識(shí)別模型的需求,本實(shí)驗(yàn)將最大迭代次數(shù)設(shè)置為300,將隱層神經(jīng)元的數(shù)量設(shè)置為150,在對(duì)數(shù)值的計(jì)算方面選擇了相關(guān)大規(guī)模數(shù)值計(jì)算表現(xiàn)較好的L-BFGS 算法進(jìn)行計(jì)算;最后根據(jù)圖1 的相關(guān)拓?fù)浣Y(jié)構(gòu)代入相關(guān)的參數(shù),其中Xn 代表相應(yīng)的特征變量,Y 代表1 小時(shí)內(nèi)某企業(yè)人臉識(shí)別的整體需求量,Wn 則代表了相關(guān)的閾值。
基于上述人臉識(shí)別企業(yè)的數(shù)據(jù),將其引入相關(guān)實(shí)驗(yàn)平臺(tái)后,本次試驗(yàn)可以分為三個(gè)步驟:
首先引入超參數(shù)k 作為網(wǎng)絡(luò)的增長(zhǎng)率。網(wǎng)絡(luò)的增長(zhǎng)率表示每一個(gè)系統(tǒng)輸出的特征圖的個(gè)數(shù)為k 個(gè),為了防止網(wǎng)絡(luò)變得太寬,并且提升網(wǎng)絡(luò)的計(jì)算效率,將k 值限制成一個(gè)較小的整數(shù)。在YOLOV2中將每一個(gè)系統(tǒng)輸出的特征圖的個(gè)數(shù)設(shè)置為32,即k=32。實(shí)驗(yàn)證明,當(dāng)k 值是一個(gè)較小的正整數(shù)時(shí),網(wǎng)絡(luò)的表現(xiàn)性能也更好;然后引入瓶頸層。YOLOV2 采取密集連接的方式,雖然每一層產(chǎn)生k個(gè)特征圖,但是整個(gè)網(wǎng)絡(luò)產(chǎn)生的特征圖的數(shù)量是巨大的。為了控制YOLOV2 網(wǎng)絡(luò)中特征圖的數(shù)量,在網(wǎng)絡(luò)的構(gòu)建中引入了瓶頸層;最后對(duì)網(wǎng)絡(luò)進(jìn)行壓縮。通過(guò)壓縮過(guò)渡層中的特征圖,增強(qiáng)模型的緊湊性。在YOLOV2 中,當(dāng)系統(tǒng)包含m 個(gè)特征圖時(shí),網(wǎng)絡(luò)中隨后的過(guò)渡層產(chǎn)生的特征圖的個(gè)數(shù)為θm。同時(shí)將θ 的值設(shè)置為0.5,即過(guò)渡層將前一個(gè)系統(tǒng)產(chǎn)生的特征圖的數(shù)量減半。
在采用了四種激活函數(shù)的情況下,對(duì)模型進(jìn)行評(píng)估,檢測(cè)訓(xùn)練數(shù)據(jù)評(píng)價(jià)結(jié)果如表1所示,檢測(cè)測(cè)試數(shù)據(jù)訓(xùn)練結(jié)果如表2所示。因此,YOLOV2 神經(jīng)網(wǎng)絡(luò)的激活函數(shù)為T(mén)anh 函數(shù)基于已經(jīng)找到的人臉識(shí)別模型,選擇正臉人臉1 的數(shù)據(jù)集,以face、60°face、Medium shadow、Small shadow、Big shadow、30°face、90°face 為特征變量,id 作為編號(hào),過(guò)濾掉其他的無(wú)關(guān)變量。結(jié)果表明,基于YOLOV2算法的密集連接的網(wǎng)絡(luò)結(jié)構(gòu)相比于YOLOV1 網(wǎng)絡(luò),不僅能夠提取到更為細(xì)粒度、更為抽象的人臉特征,而且使得網(wǎng)絡(luò)提取到的人臉特征在整個(gè)任務(wù)中最大化地被網(wǎng)絡(luò)利用,并學(xué)習(xí)到新的人臉特征,提升人臉檢測(cè)算法的性能。
總而言之,YOLOV2 網(wǎng)絡(luò)是當(dāng)前人臉識(shí)別系統(tǒng)構(gòu)建領(lǐng)域的重要工具,將之組合不僅能夠挖掘傳輸識(shí)別過(guò)程中各個(gè)已有數(shù)據(jù)之間的潛在關(guān)系,更能快速地構(gòu)建起相關(guān)的預(yù)測(cè)模型。當(dāng)然本次研究也存在著許多的不足,雖然對(duì)YOLOV2 網(wǎng)絡(luò)在當(dāng)前人臉識(shí)別系統(tǒng)構(gòu)建應(yīng)用中存在的問(wèn)題進(jìn)行了分析,但仍不夠深入,希望將來(lái)能有機(jī)會(huì)繼續(xù)對(duì)人臉識(shí)別系統(tǒng)構(gòu)建的問(wèn)題進(jìn)行研究,進(jìn)而為我國(guó)相關(guān)領(lǐng)域的發(fā)展做出貢獻(xiàn)。