呂鑫+李月軍
摘 要: 針對國內SNS網站進行調研,分析用戶群體特征及社會心理,剖析SNS網站流行的原因,在此基礎上提出了在SNS網站上運營好一款人氣高、粘性強的應用組件。實驗研究并分析了主動形狀模型(ASM)和受限局部模型(CLM)的優(yōu)缺點,提出將兩者優(yōu)點結合的人臉面部特征定位提取方法,設計開發(fā)了一款應用組件產品。通過用戶上傳照片或在線拍攝,捕捉出人臉頭像及面部特征,并按照用戶在圖像庫中選擇的照片進行合成,生成一張具有兩張人臉特征的新頭像。將組件接入SNS網站,通過一段時間的運營數據分析,結合互聯(lián)網的實際應用,提出對組件進行優(yōu)化的方案。
關鍵詞: 人臉檢測; 特征定位; SNS網站; 應用組件
中圖分類號: TN911.7?34; TM417 文獻標識碼: A 文章編號: 1004?373X(2016)23?0170?04
Research and design of SNS website application component based on face feature location
L? Xin, LI Yuejun
(College of Optical and Electronical Information Changchun University of Science and Technology, Changchun 130000, China)
Abstract: The SNS website in China is investigated to analyze the user group characteristics and social psychology, and dissect the popular reasons for the SNS website. On this basis, how to better operate a high?popularity and strong?stickiness application component on SNS website is proposed. The advantages and disadvantages of the active shape model (ASM) and CLM are studied and analyzed by the experiments. The face feature location extraction method combining with the advantages of the models is proposed. An application component product was designed and developed. The head portrait and face feature are captured by means of the user photos upload and online shoot. The photos selected in the image library by users are synthesized to generate a new head portrait with two face features. The component is accessed into the SNS website. On the basis of analyzing the a period of operation data and combining with the practical application of the Internet, the optimization scheme of the component is proposed.
Keywords: face detection; feature location; SNS website; application component
0 引 言
人臉識別是當前人工智能和模式識別的研究熱點,就其技術本質而言,是通過圖像采集設備獲取用戶的面部圖像,再對其臉部的特征進行計算分析,進而和自身數據庫里已有的樣本進行比對,最后判斷出用戶的真實身份。人臉識別是當前人工智能和模式識別的研究熱點,在家庭娛樂、互聯(lián)網等領域已經有了一些有趣的應用,比如有一些智能玩具、機器人能夠識別家人的身份;某些游戲具備玩家真實面像等[1]。但目前人臉識別的廣泛應用性較弱,尤其是針對當今流行的SNS社交網絡平臺。
1 基于SNS網站用戶的需求調研
1.1 用戶基本特征分析
目前國內主要的SNS網站用戶中,男性用戶數量顯著高于女性用戶,其在男性網民中的滲透率也高于女性網民。當前國內SNS網站用戶中,男女用戶比例約為0.621[∶]0.379。與整體網民年齡分布相比,SNS網站用戶更具低齡化特征,其中30歲以下用戶占九成以上。目前21~25歲這一年齡組為SNS網站用戶的主力軍,占整體的四成以上(42.7%);其次為16~20歲年齡組,約為三成(30.6%);30歲以下的用戶占SNS網站用戶的90%以上。
1.2 用戶行為分析
1.2.1 功能應用概況
SNS網站的主要功能有隱私設置、日志功能、相冊功能、參與群組、分享功能、組建游戲,各功能的使用情況如圖1所示。
1.2.2 每周登陸SNS的情況
超過50%以上的用戶每天都有登陸,近一半的用戶每次登陸SNS停留的時間在半小時。如圖2,圖3所示。
2 算法實現(xiàn)與系統(tǒng)開發(fā)
2.1 基于Haar小波變換的人臉檢測算法
Haar是小波函數的一種,在圖像處理中采用小波變換提取特征應用非常廣泛[2]。使用小波模板的好處是:它可以利用圖像小波系數的子集來定義和描述對象的形狀;它對于顏色和紋理的改變保持不變性:能夠定義復雜的對象實體;基于小波模板的模型可以從實例中學習得到,不需要運動信息和顯式的圖像分割信息。
如果選擇所有包含人臉的窗口的某個特征的平均值與背景噪聲的平均值有一定差距,那么就可以利用這種特征作為人臉特征。后來積分圖像的概念又被引入,實驗發(fā)現(xiàn)不同方向上的小波系數(水平、垂直、對角線)可以組合成具有很好區(qū)分度的特征向量[3]。因此可以快速計算人臉類Haar特征。
基于Haar小波算法的人臉檢測方法主要通過Adaboost算法學習訓練出基于Haar小波變換的人臉檢測器,對膚色區(qū)域進行檢測確定人臉區(qū)域,對人臉區(qū)域利用人眼和嘴的顏色特征提取出眼、嘴的候選區(qū)域,最后根據面部器官的幾何結構關系利用模板匹配的方法確定眼睛和嘴部的位置。
2.2 構造Adaboost的分類器
Adaboost算法是利用大量分類能力一般的弱分類器通過一定的方法疊加,構成分類能力很強的強分類器[4]。理論上,只要弱分類器的分類效果比隨機分類好就可以構造出強分類器,其分類錯誤率趨于零,并具有很好的泛化能力。采用Adaboost算法做特征選擇的一個原因是其得到的特征集可以一一對應到原始特征中,具有明確的物理意義[5]。在進行特征提取時,只需在指定的采樣位置、尺度和方向上計算出濾波結果,可以大幅減少計算量和存儲量。
首先,建設一個人臉頭像數據庫,從互聯(lián)網和照相館收集了上千張帶人臉的圖像和上千張非人臉的圖像作為樣本,并將每個圖像的尺寸像素歸一化,統(tǒng)一為400×500像素。接著通過Adaboost算法訓練出輪廓、眉毛、眼睛、鼻子、嘴各項特征值,得到多個弱分類器。
另外,保證單個弱分類器也能達到理想的訓練結果,采用局部Haar特征的AdaBoost學習方法,對每個樣本都賦予一個權值,然后進行迭代訓練,每次訓練后篩選出正確率最高的分類器,最終將多個弱分類器合稱為一個強分類器。該方法的優(yōu)點在于計算簡單,不足之處在于包含的信息量較少。
2.3 面部特征提取算法
2.3.1 基于主動形狀模型面部特征定位算法
(1) 建立主動形狀模型(ASM)
在每一個正面人臉頭像樣本上手工標注60個特征點,所有的特征點標注的位置主要是臉部輪廓區(qū)域、眉毛、眼睛、鼻子和嘴。定義方式如表1所示。
基于ASM提出了一種自動人臉臉型分類方法。首先利用各種臉形的樣本進行訓練以建立臉型形狀模型庫,然后運用ASM算法自動定位測試樣本的正面人臉形狀,比較其與各個臉型形狀模型的距離,最后應用最近鄰方法實現(xiàn)臉型的自動分類。仿真實驗表明,該方法優(yōu)于利用人臉輪廓曲率或下頜曲率的方法,能夠充分挖掘人臉形狀信息,分類結果穩(wěn)定準確,可以有效提高大庫人臉識別的速度和準確率。
(2) ASM迭代步驟
對于一幅給定的新圖像,ASM迭代過程如下:
① 預處理:對輸入圖像與訓練集的人臉圖像進行三層金字塔采樣,初始形狀估計;
② 針對60個特征點進行局部尋優(yōu);
③ 更新相似變換參數和形狀參數[p,]并對其進行約束;
④ 判斷是否進入下一層進行搜索;
⑤ 是否滿足收斂條件[Δp≤ε]或達到最大迭代次數。
(3) ASM定位結果及分析
ASM定位實驗結果如圖4所示。
圖4 ASM定位結果
ASM定位的優(yōu)點:建模方便快捷;算法收斂速度快,運算效率高;對初始位置要求不高,搜索范圍大;對光照變化的適應性較強。
ASM定位的缺陷:特征點定位精度較低;局部搜索采用固定模板向量,搜索方向單一。
2.3.2 基于受限局部模型面部特征定位算法
利用Haar小波算法檢測出人臉位置以及眼睛、嘴的大概區(qū)域,接著,利用受限的局部模型算法可快速收斂得到人臉的輪廓、眉毛、眼睛、鼻子及嘴邊緣。
基于受限局部模型(CLM)和凸二次匹配(CQF)的面部特征點[6]定位實例如圖5所示。
CLM定位的優(yōu)點:算法收斂速度快,運算效率較高;收斂成功時,特征點定位精度很高;對光照變化和未知紋理變化適應性很強。
CLM定位的缺點:建模復雜,每片分類器需要單獨訓練;對初始位置要求較高,搜索范圍小。
2.3.3 基于主動表觀模型的特征點定位
主動表觀模型(AAM)是對ASM的直接擴展。與ASM相似,AAM同樣需要采用統(tǒng)計分析的方法建立先驗模型,然后利用先驗模型對圖像中的目標物體進行匹配運算。其優(yōu)點在于該模型不僅包含目標物體的形狀信息,而且還包含目標物體的內部紋理信息。紋理信息一般是組成目標物體像素的灰度值。同時選擇合理的匹配參數以提高匹配速度,使得AAM的定位能力更加健壯,定位效果更加準確。
(1) 統(tǒng)計并建立形狀模型。統(tǒng)計模型的建立需要分三個步驟:
首先是獲取樣本圖像中的信息;其次是樣本圖像集的歸一化處理;最后是對歸一化處理的數據進行統(tǒng)計分析,建立統(tǒng)計模型。
(2) 紋理參數化模型的建立。獲取人臉庫中人臉形狀輪廓區(qū)域內所有像素的灰度值,也就是提取形狀無關的紋理值向量。然后利用主成分分析法對形狀無關的紋理進行分析建模。
(3) 獲得形狀圖像。將訓練樣本的人臉圖像形變到平均人臉形狀中,使向量的維數統(tǒng)一起來并具有相同的對應關系。
2.3.4 ASM與CLM,AAM算法的比較
從圖6中對三者的對比實驗可以看出,每一種方法都不完美。為結合ASM與CLM的優(yōu)點,提出了一種優(yōu)化的人臉面部五官特征定位算法[7],該方法先基于主動形狀模型的算法搜索出人臉輪廓及眉毛、眼睛、鼻子、嘴的基本區(qū)域,再通過CLM的局部精度搜索確保識別的準確性。
圖6 ASM,AAM和CLM算法性能比較實驗
2.4 實驗驗證結果分析
(1) 選取人臉樣本
實驗從Google以及照相館收集了500張人臉免冠照片作為圖像樣本,其中100張為背景單一的證件照片,100張為背景單一、側臉不超過15°的照片,100張為平面旋轉角度不超過90°的照片,100張為背景復雜或光線較暗的照片,另外100張背景單一的正面照片作為變臉庫模板。圖片統(tǒng)一裁剪為400[×]500像素。
(2) 測試環(huán)境
在局域網環(huán)境下,使用Intel奔騰雙核E5400,2GB內存,Windows XP profession SP3的DELL Vostro V220商用臺式機,對人臉樣本進行測試。測試項分為:人臉檢測、臉部輪廓區(qū)域定位,眉毛眼睛鼻子嘴巴的五官定位,如圖7所示,測試結果如表2所示。
由表2可以看出,基于Haar小波算法的人臉檢測技術對于圖像的人臉檢測正確率很高。在五官特征點定位方面,采用ASM與CLM融合的特征定位算法對“證件照”和“旋轉照片”的識別效果較理想,對于“側臉照片”和“背光照片”的識別率稍低??傮w來說,本文提出的基于主動形狀模型與受限局部模型相結合的特征定位算法能夠運用于產品的開發(fā)。
根據系統(tǒng)的最終目標,是要得到兩張照片的合成效果。接著,選取100張證件照片與變臉庫模板進行合成。在同樣的測試環(huán)境下,輸出一幅400[×]500像素的新人臉的時間為50 ms。
2.5 系統(tǒng)實現(xiàn)和架構
2.5.1 系統(tǒng)流程設計
考慮到SNS網站應用組件的特性,即操作簡便,有趣味性,組件的流程設計步驟如下:
(1) 用戶登陸SNS后在應用頁面可以選擇添加組件,添加組件后可進入首頁。
(2) 用戶根據自己的需求,既可以從本地上傳一張符合要求的照片,如果條件可以,也能選擇在線拍攝一張頭像。
(3) 進入人臉檢測、五官定位識別流程,該步驟由程序自動完成。
(4) 選擇想要變成的明星模樣。
(5) 變臉完成,輸出結果。
2.5.2 服務器軟件架構
本系統(tǒng)主要采用三層體系架構的方式,即數據層(DAL)、邏輯層(BLL)、表示層(UI) [8]。所謂三層體系結構是在客戶端與數據庫之間加入了一個“中間層”,也叫組件層。這里所說的三層體系,不是指物理上的三層,不是簡單地放置三臺機器就是三層體系結構,也不僅僅有B/S應用才是三層體系結構,三層是指邏輯上的三層,即使這三個層放置到一臺機器上。
分層式結構的優(yōu)勢如下:
(1) 開發(fā)人員可以只關注整個結構中的某一層;
(2) 可以很容易用新的實現(xiàn)來替換原有層次的實現(xiàn);
(3) 可以降低層與層之間的依賴;
(4) 有利于標準化;
(5) 利于各層邏輯的復用。概括來說,分層式設計可以達到如下目的:分散關注、松散耦合、邏輯復用、標準定義。
2.5.3 服務器硬件架構
整個硬件架構系統(tǒng)包含數據庫服務器、Web服務器、負載均衡器、備份服務器、監(jiān)控系統(tǒng)??紤]到系統(tǒng)包含了大量用戶信息及圖片信息,且數據量日益增長,需要的存儲空間較大,一旦受到破壞或是數據庫服務器硬盤存滿,就會對用戶產生負面影響,因此在硬件架構中提出一套簡單易用的備份方案。
(1) 備份方法:增量備份和實時備份。對用戶上傳的照片以及完成變臉的照片實行增量備份,增量數據備份只備份新創(chuàng)建的文件,所以可以加快備份的過程;而對數據庫的增刪情況實行實時備份。
(2) 備份設備:主要從經濟性和易用性的角度出發(fā),選用DELL刀片式服務器,購買了多塊較大較快的硬盤,并做了RAID0,保證數據存儲傳輸的性能。
2.5.4 系統(tǒng)的界面設計與功能實現(xiàn)
本系統(tǒng)屬于娛樂工具類的應用軟件,在滿足SNS網站設計規(guī)范的前提下,頁面的整體風格主要追求簡潔,加上運營平臺是人人網,學生用戶、年輕白領用戶居多,因此頁面設計中加入了少許可愛的圖標。系統(tǒng)首頁的上傳功能頁包含用戶上傳照片、人臉檢測、五官定位識別等功能。首先從本地選擇上傳一張照片,然后通過網頁提示進行操作。完成之后,頁面跳轉至組件首頁,此時可根據自己的喜好選擇右邊區(qū)域內的明星模板,完成之后,點擊中部區(qū)域內“我變”,即完成了變臉操作。
3 結 論
本文對人臉檢測方法和五官特征點定位算法進行了詳細地介紹和深入研究。重點分析了人臉檢測方法,并對傳統(tǒng)的主動形狀模型、主動表觀模型、受限局部模型算法進行了對比實驗分析,提出一種結合ASM和CLM兩者優(yōu)點的優(yōu)化算法。然后對人臉識別技術在SNS網站中的應用進行深入地探討,結合SNS網站特點及應用組件規(guī)范,開發(fā)了一款應用于SNS網站的娛樂組件,并在運營過程中對該組件提出了相關優(yōu)化方案,最后用數據論證了其可行性。
參考文獻
[1] 付煒,孔祥棟.基于膚色和Adaboost算法的人臉檢測[J].現(xiàn)代電子技術,2010,33(6):131?134.
[2] 茂林,戚飛虎.自組織隱馬爾可夫模型的人臉檢測研究[J].計算機學報,2012,25(11):1165?1169.
[3] 張九龍,張毅均.人臉檢測的貝葉斯特征判別方法[J].計算機工程與應用,2014,40(29):164?165.
[4] XIAO R, LI M J, ZHANG H J. Robust multipose face detection in images [J]. IEEE transactions on circuits and systems for video technology, 2004, 14(1): 31?41.
[5] 張寧,李娜.基于Adaboost算法的人臉檢測技術的研究與實現(xiàn)[J].現(xiàn)代電子技術,2011,34(14):4?6.
[6] LI S Z, ZHANG Z Q. FloatBoost learning and statistical face detection [J]. IEEE transactions on pattern analysis and machine intelligence, 2004, 26(9): 1112?1123.
[7] 王亮.SNS社交網絡發(fā)展現(xiàn)狀及其趨勢[J].現(xiàn)代電信科技,2009(6):9?12.
[8] 張書真,宋海龍,向曉燕.基于膚色分割及特征定位的人臉檢測算法研究[J].現(xiàn)代電子技術,2008,31(14):82?84.