宋 強,張 穎
(遼寧科技大學 電子與信息工程學院,遼寧 鞍山 114051)
視頻壓縮感知的目標跟蹤技術是計算機視覺領域的重要研究方向之一,廣泛應用于人員定位、智能交通、智慧城市等人工智能領域[1]。將視頻壓縮感知的目標跟蹤技術應用到動態(tài)人臉識別上,能夠提高人臉識別的自動化、信息化、智能化水平,分析目標行程軌跡,確定目標信息[2]。視頻監(jiān)控下環(huán)境因素多變,如光照不均、人臉圖像存在遮擋、目標運動速度過快等,直接應用目標跟蹤方法無法捕獲目標,軌跡分析效果也不夠理想。
視頻目標跟蹤算法根據(jù)網(wǎng)絡結構將任務分解成跟蹤、檢測和學習3個部分[3]。跟蹤部分根據(jù)提取到的目標人臉特征,建立幀之間的數(shù)據(jù)模型,用于在視頻中跟蹤目標;檢測部分通過訓練分類器,用于檢測視頻中目標出現(xiàn)的下一幀圖像位置;學習部分進行評估更新。目標跟蹤算法中,特征越多準確率越高,但過多的特征提取運算會增加復雜度。視頻壓縮感知方法以低通帶限實現(xiàn)數(shù)據(jù)采樣,并從采樣數(shù)據(jù)中精準恢復原始信號,提高運算效率。視覺目標跟蹤算法主要分為生成式跟蹤算法和判別式跟蹤算法。生成式跟蹤算法以當前幀為基礎建立目標匹配模型,在下一幀圖像的相關范圍內尋找與目標模型匹配效果最優(yōu)的區(qū)域;判別式跟蹤算法提取的圖像特征具有判別性,根據(jù)特征尋找目標區(qū)域的邊緣,將其從背景中分離出來,反映異類數(shù)據(jù)間的差異。在監(jiān)控視頻環(huán)境中,判別式跟蹤算法利用人臉圖像信息與背景信息進行圖像跟蹤。Bewley等[4]提出SORT算法,利用卡爾曼濾波[5]進行目標的運動信息預測。周平平等[6]采用粒子濾波算法進行跟蹤,融合人臉膚色和邊緣特征,具有自適應性。已有的跟蹤算法雖針對人臉識別視頻跟蹤具有較好的效果,但對監(jiān)控視頻的數(shù)據(jù)處理時間較長,分析較慢,跟蹤不穩(wěn)定。本文針對視頻監(jiān)控下的目標跟蹤問題,為了加快視頻數(shù)據(jù)處理的速度,提升目標圖像跟蹤的穩(wěn)定性和精確性,提出一種人臉識別視頻壓縮感知跟蹤算法,依據(jù)動態(tài)壓縮感知(Dynamic compressive sensing,DCS)理論,采用貝葉斯壓縮感知(Bayesian compressive sensing,BCS)算法,根據(jù)人臉信息的特征實現(xiàn)對目標圖像信息的動態(tài)跟蹤。
壓縮感知理論是一種新的數(shù)據(jù)處理模式,在采樣過程中實現(xiàn)數(shù)據(jù)壓縮,并使用低秩隨機測量矩陣壓縮稀疏信號。傳統(tǒng)的壓縮感知理論通過分割的手段將動態(tài)信號轉化為靜態(tài)信號,忽略視頻信號在時間維度上的特性,缺乏實時性。為此,本文選用動態(tài)壓縮感知理論框架。動態(tài)壓縮感知理論主要包括動態(tài)信號的稀疏表示、隨機測量矩陣的選取以及信號重構。采用Ji等[7]提出的貝葉斯壓縮感知(Bayesian compressive sensing,BCS)算法,利用統(tǒng)計學中的稀疏樸素貝葉斯分類學習方法進行信號重構,實現(xiàn)動態(tài)壓縮感知的建模過程。
動態(tài)信號具有時變性,設Xt為經過稀疏矩陣投影的稀疏信號,則動態(tài)壓縮感知模型的狀態(tài)空間方程為
式中:Yt表示觀測方程;ft表示狀態(tài)空間方程中的狀態(tài)轉移函數(shù);At為觀測矩陣;vt為過程噪聲;ωt為觀測噪聲,通常默認成均值為0的高斯白噪聲。
動態(tài)視頻壓縮感知采用少量采樣觀測信號表示原始信號所包含的所有信息,實現(xiàn)對信號的降維處理,減少計算量。利用隨機測量矩陣P對高維原始信號的特征空間向量X向低維空間進行壓縮投影,獲取低維壓縮特征空間向量。動態(tài)壓縮感知跟蹤算法模型如圖1所示。
圖1 動態(tài)壓縮感知跟蹤算法模型圖Fig.1 Model diagram of dynamic compressed sensing tracking algorithm
為了更易提取目標圖像,采用圖像尖銳化處理,提升人臉圖像邊緣及紋理對比度,使亮度增加,突出更多細節(jié)[8]。事實上,由于環(huán)境因素影響,圖像可能不清楚,識別效果不明顯,但圖像細節(jié)在經過尖銳化處理后更突出,便于后續(xù)的人臉識別。圖像尖銳化計算式
式中:?2f為二元圖像函數(shù)的拉普拉斯變換。
因此
為了避免顆粒擴散導致的模糊問題,將圖像降解。把圖像邊緣線和突出點堆疊處理,生成銳化圖像。將處理前和處理后的圖像疊加,突出銳化效果,同時又能恢復背景信息。降解函數(shù)為
將原圖像轉化成灰度二值化圖像,再對四鄰域和八鄰域的二值圖像銳化處理,使邊界特征突出,效果如圖2所示。
圖2 四鄰域與八鄰域銳化效果圖Fig.2 Sharpening renderings of 4 neighborhoods and 8 neighborhoods
光照強度不均勻對人臉識別準確率的影響較大,需要對銳化處理后的圖像歸一化處理,消除光照強度的影響,即光照修正處理方法。歸一化處理修正式為
式中:(m,n)為圖像像素坐標;S為原始圖像;S′為歸一化處理后的圖像;μ為圖像均值;σ為圖像標準差;c為常數(shù),一般取為1。
提取圖像的距離不同,識別準確率也存在差異。為了減小差異,選取一組尺寸不同的矩形濾波器,對歸一化后的樣本圖像分別進行卷積運算,提取樣本特征,獲取處理后的圖像
式中:Ld,h(m,n)為濾波器形式;(m,n)為圖像像素坐標;d,h分別為濾波器的寬度和高度。歸一化矩形濾波器形式為
將通過矩形濾波器處理后的樣本圖像依次展開成一個M·N維的列向量X(m,n),其中X=(X1,X2,…,XM)T是樣本歸一化后的特征向量。
濾波器銳化歸一化可以讓圖像更光滑,效果如圖3所示。
Haar-like特征又稱矩形特征,在特定范圍內,利用小塊區(qū)域表示圖像特征。Haar-like特征根據(jù)目標區(qū)域的圖像顏色深淺不同來描述人臉特征,對圖像的邊緣和線條比較敏感。Haar-like特征值數(shù)學表達式為
圖3 圖像預處理過程效果圖Fig.3 Effect images of image preprocessing
式中:ωi表示權值矩陣;N表示矩形特征值的個數(shù);RectSum(γi)表示樣本圖像所有矩形特征值之和。
通過掃描大量的樣本窗口,計算所有樣本窗口的子圖像特征值,其特征值為所檢測圖像中的矩形灰度像素差。該過程會產生大量的運算。與此同時,為了保持圖像尺度不變性,會進一步增加計算量,使人臉檢測速度及分類器訓練效率降低。為了在壓縮投影中提高特征向量值的運算效率,采用積分圖算法快速計算矩形區(qū)域之和及其平方和,降低運算量,提高運算速率[9]。積分圖運算式為
式中:J(m,n)表示圖像在像素為(m,n)處的積分值;H(m′,n′)表示圖像在像素為(m′,n′)處的灰度值。
積分圖為每一幅圖像建立專屬查找表,在積分計算階段可直接查找并完成卷積線性時間運算,使卷積運算的時間與矩形區(qū)域窗口大小沒有關聯(lián)。
計算初始圖像積分,并在后續(xù)的跟蹤過程中,通過行的累積求和的形式完成積分運算。積分運算公式為
其中,初始圖像積分中,S(0,-1)=0,J(-1,0)=0。先計算S(m,n),再計算J(m,n)。
在視頻監(jiān)控下目標跟蹤過程中,動態(tài)目標跟蹤具有比靜態(tài)目標跟蹤更穩(wěn)定、更精準定位的優(yōu)點。本文以正負樣本的數(shù)據(jù)特征構建目標模型,通過及時更新圖像識別分類器,實現(xiàn)動態(tài)目標跟蹤過程,并對目標實現(xiàn)軌跡分析。
通過監(jiān)控視頻的幀截取,選用第i幀圖像中目標人臉作為樣本圖像,采集目標人臉圖像區(qū)域內和區(qū)域外的圖像作為正負樣本并進行特征提取,構建多維度圖像特征向量,并通過稀疏隨機矩陣降維。再利用降維后的向量構建目標模型,實現(xiàn)分類器的構建,并對分類器進行學習訓練。在i+1幀圖像中,對跟蹤到的目標圖像采樣,并通過若干矩形窗口提取目標區(qū)域特征,將高維多尺度特征向量通過稀疏隨機矩陣降維處理,最后利用訓練好的分類器對特征向量分類,將最符合的矩形掃描窗口作為跟蹤目標圖像的具體位置,并更新分類器。重復操作,實現(xiàn)分類器的構建及更新。
貝葉斯分類是一種歸納推理的理論,樸素貝葉斯模型是基于貝葉斯理論且應用最為廣泛的分類模型之一[10]。在概率圖模型中,樸素貝葉斯模型被劃分為判別模型,具有堅實的數(shù)學基礎和穩(wěn)定的分類效率。該分類器模型的估計參數(shù)少,針對缺失數(shù)據(jù)具有良好的魯棒性。本文采用目標樣本與背景樣本的特征作為分類器模型構建訓練的數(shù)據(jù)向量,屬性相關性小,使樸素貝葉斯模型的算法簡單,降低分類誤差率,提升總體性能。樸素貝葉斯分類器模型的數(shù)學表達式為
式中:Ci為數(shù)據(jù)屬性類別;XA為測試樣本。
高維隨機向量的投影服從高斯分布[11],設樣本XA中的低維特征向量為μ,且各個元素都獨立分布。假定正負樣本的先驗概率相等,通過樸素貝葉斯對特征向量分類。設a為樣本標簽,正樣本用a=1表示,負樣本用a=0表示。獲取貝葉斯分類器響應為
式中:H(u)表示低維特征向量為μ時的貝葉斯分類器響應;a為樣本標簽,且a∈{0,1};P(a=1)和P(a=0)分別表示正負樣本先驗概率;μj為樣本圖像XA中的第j個特征。
在樸素貝葉斯分類器模型的基礎上,引入Boosting技術[12]中的Adaboost算法,組合若干個樸素貝葉斯分類器模型。Adaboost算法自適應能力強,把強分類器分解成若干個弱分類器的線性組合,并通過不同的訓練集樣本對每個貝葉斯弱分類器學習訓練,提高Adaboost算法貝葉斯級聯(lián)分類器的識別精度。
Adaboost算法中,弱分類器表達式為
式中:h(x,f,p,θ)表示弱分類器;x表示為子窗口圖像;f(x)為子窗口的特征函數(shù);θ表示為f(x)函數(shù)的闕值,弱分類過程就是得出該函數(shù)闕值的過程。
由弱分類器構建強分類器的步驟如下。
圖像樣本為XA,則n個訓練集樣本表示為,則Xi為樣本圖像,ai表示為正或負樣本,且ai∈{0,1}。初始化操作,令t=1,對每個樣本權重ωt,i初始化,再將權重歸一化處理,數(shù)學表達式為
式中:ωt,i表示第t次迭代中第i個樣本的權重。
對弱分類器訓練,計算弱分類器上對應特征的加權錯誤率,數(shù)學表達式為
式中:εt為弱分類器錯誤率;Xi為圖像樣本;yi∈(-1,1)。
經過對比,εt為錯誤率最小的弱分類器,即為最佳弱分類器。通過弱分類器εt更新樣本的分布,數(shù)學表達式為
式中:ωt+1表示t+1時刻權重;βt是一個迭代系數(shù)。
若測試樣本Xi分類正確,則有εt=0;若分類錯誤,則有
結合上述運算,得到級聯(lián)強分類器數(shù)學表達式
其中α
采用級聯(lián)Adaboost算法的樸素貝葉斯分類器根據(jù)各個強分類器的復雜程度由低到高進行排序。若窗口判定圖像信息為非人臉圖像,則將其排除,提高檢測效率。運算流程如圖4表示。
圖4 樸素貝葉斯級聯(lián)分類器結構圖Fig.4 Structure diagram of Naive Bayesian cascade classifier
分類器響應H(u)中的條件概率為
在i+1幀圖像中的目標周圍采樣若干個正負樣本,并進行特征提取,根據(jù)運算獲取所有正負樣本的均值u1和方差σ1。利用分類更新對目標模型更新,實現(xiàn)目標動態(tài)跟蹤。分類更新數(shù)學表達式為
式中:λ為學習因子,λ>0;M為正負樣本總數(shù);uj(i)表示為第i幀樣本圖像的第j個特征。
采用MATLAB調用OpenCV中的模塊進行系統(tǒng)仿真。根據(jù)監(jiān)控視頻中的人物目標圖像,通過圖像處理模仿不同環(huán)境下的目標人物圖像狀態(tài),再將若干張圖片組合成監(jiān)控小視頻。然后采用軟件中的GUI功能模塊設計視頻壓縮感知目標跟蹤系統(tǒng),對視頻幀截取。最后通過人臉圖像識別,實現(xiàn)目標跟蹤,并進行目標運動軌跡分析。
為了測試該算法針對視頻中目標移動、遮擋、光照不均等狀態(tài)下的處理效果,選用某車站視頻監(jiān)控下的人物目標圖像的某一幀圖像具體分析,如圖5所示。在光照較亮、較暗、人臉有口罩遮擋和人臉圖像信息移動到邊界這四種條件下,本文算法都可以捕捉人臉信息,并對目標人物進行軌跡分析,如圖6所示。
圖5 不同環(huán)境下目標跟蹤分析Fig.5 Target tracking analysis in different environments
圖6 目標軌跡分析Fig.6 Target trajectory analysis
針對上述處理后的監(jiān)控小視頻,將本文算法與現(xiàn)有的人臉識別視頻目標跟蹤算法進行對比,跟蹤漏檢率如表1所示。本文算法在這四種環(huán)境下的跟蹤漏檢率均為最低,表明該算法的目標跟蹤穩(wěn)定性和準確性較好。
本文提出人臉識別視頻壓縮感知跟蹤算法,用以處理視頻監(jiān)控中光照強度不同、遮擋、快速移動的人臉圖像。將動態(tài)壓縮感知算法應用在人臉識別監(jiān)控視頻中,根據(jù)提取的人臉Haar-like特征構建級聯(lián)分類器進行人臉識別,進而實現(xiàn)動態(tài)的目標人臉跟蹤。與現(xiàn)有的人臉識別視頻目標跟蹤算法相比,本文算法跟蹤漏檢率較低,對視頻中人臉圖像移動、遮擋及光照強度度不均勻、快速變化等情況具有一定的魯棒性,可以實現(xiàn)有效的目標軌跡分析。適合應用在刑偵以及疫情防控等領域。
表1 不同環(huán)境下目標人臉跟蹤算法的跟蹤漏檢率,%Tab.1 Omission ratio of target face tracking algorithm in different environments,%