唐開悅,王思涵
(廣西師范大學,廣西 桂林 541006)
計算機技術和多媒體技術在近年來飛速發(fā)展,提高了圖像目標檢測技術在各個領域中的應用性能[1]。在計算機視覺領域中圖像目標檢測方法成為重要研究內(nèi)容,在工程和科學中具有重要的研究價值,被廣泛地應用在視頻壓縮、智能監(jiān)控、醫(yī)學診斷、智能機器人、虛擬現(xiàn)實和人機交互等領域中[2-3]。人體的運動過程包含了大量的視覺信息,研究人體運動動態(tài)圖像目標的檢測具有較大的應用價值和現(xiàn)實意義[4]。
程全[5]等人提出基于分塊投影匹配的人體運動動態(tài)目標檢測方法,該方法通過分塊投影匹配方法估計全局運動參數(shù),利用估計參數(shù)對圖像背景進行補償處理,根據(jù)背景減除法提取圖像中存在的運動目標,實現(xiàn)運動目標檢測,該方法無法消除圖像中存在的陰影,存在圖像清晰度低的問題。左軍輝[6]等人提出基于改進背景減法的人體運動動態(tài)目標檢測方法,該方法采用GMM圖像塊均值方法在背景建模階段重構背景模型,結(jié)合小波半軟閾值函數(shù)和數(shù)學形態(tài)學在目標檢測階段對運動目標進行去噪處理,通過自適應背景更新方法更新背景,實現(xiàn)人體運動動態(tài)目標的檢測,該方法在背景建模階段無法消除陰影區(qū)域和非陰影區(qū)域之間存在的邊界線,導致檢測過程的位置誤差較大。王思明[7]等人提出基于BRISK算法的人體運動動態(tài)目標檢測方法,該方法結(jié)合歐式距離和k近鄰算法進行特征匹配,對順序抽樣一致性算法進行改進,提純特征點,實現(xiàn)背景運動補償,采用形態(tài)學對運動目標進行分割,利用BRISK算法實現(xiàn)目標檢測,由于運動目標附近存在陰影,增加了該方法提取特征點所用的時間,存在檢測效率低的問題。
為了解決上述方法中存在的問題,提出多自由度人體運動動態(tài)圖像目標檢測方法。
多自由度人體運動動態(tài)圖像目標檢測方法通過高斯背景模型分離圖像背景區(qū)域和目標區(qū)域。
1)背景初始化
采用K個高斯分布對圖像中的像素顏色信息進行描述,利用高斯密度函數(shù)對各個分布進行描述,每個分布之間都是獨立的[8]。設Xt代表的是像素點在t時刻的觀測值;η(Xt,μi,t,∑i,t)代表的是第i個高斯分布對應的概率密度函數(shù),其表達式如下
η(Xt,μi,t,∑i,t)=
(1)
式中,μi,t代表的是第i個高斯分布在t時刻對應的均值;∑i,t代表的是第i個高斯分布在t時刻對應的協(xié)方差。
設P(Xt)描述的是t時刻目標圖像觀測點對應的概率密度函數(shù),其值可通過下述公式計算得到
(2)
式中,wi,t代表的是第i個高斯分布在t時刻對應的權值。
多自由度人體運動動態(tài)圖像目標檢測方法采用基于統(tǒng)計的方法在背景建模初期對模型進行初始化處理。將前N幀不含檢測目標的圖像像素對應的平均值作為初始化圖像的觀測值,減少背景建模過程中受其它因素的干擾。
設μ0代表的是在初始背景估計過程中某點對應的均值,其計算公式如下
(3)
式中,N描述的是圖像幀數(shù)。
(4)
2)高斯分布模型匹配
讀取新的人體運動圖像后,逐一匹配K個高斯分布模型和每個像素點Xt,判定依據(jù)為
|Xt-μi.t-1|≤2.5σi
(5)
式中,2.5σi代表的是匹配閾值。如果滿足上式表明該點為背景;如果不滿足為運動目標。
3)高斯分布模型更新
通過對方差、均值和權值的更新實現(xiàn)高斯分布模型的更新。
利用下式更新權值
(6)
式中,α代表的是學習率。
通過下述公式對均值和方差進行更新
(7)
其中,參數(shù)ρ的計算公式如下
(8)
4)背景生成
(9)
假設多自由度人體運動動態(tài)圖像為局部平穩(wěn)的,統(tǒng)計信息在圖像非陰影區(qū)域和陰影區(qū)域中的相似度較高,匹配I分量圖中非陰影區(qū)域與陰影區(qū)域的灰度,補償陰影區(qū)域的亮度。
結(jié)合陰影投射方向和陰影區(qū)域獲得鄰近非陰影區(qū)域,設Qn代表的是非陰影區(qū)域集合,其表達式如下
Qn={p|0 (10) 式中,p代表的是陰影投射方向中存在的點;Ωs代表的是圖像中的陰影區(qū)域;d(p,Ωs)代表的是陰影區(qū)域Ωs與點p之間存在的距離;dist代表的是距離閾值。 獲得圖像非陰影區(qū)域和陰影區(qū)域后,根據(jù)映射策略利用下式補償陰影區(qū)域的灰度值 (11) 式中,I代表的是陰影區(qū)域補償前對應的灰度值;I′代表的是陰影區(qū)域補償后對應的灰度值;A代表的是亮度補償強度系數(shù);σs代表的是陰影區(qū)域?qū)姆讲?;ms代表的是陰影區(qū)域?qū)木?;σn代表的是非陰影區(qū)域?qū)姆讲?;mn代表的是非陰影區(qū)域?qū)木怠?/p> 陰影對圖像產(chǎn)生影響,改變了其飽和度、色調(diào)和亮度,因此陰影區(qū)域的真實色彩不能只通過亮度得到補償,多自由度人體運動動態(tài)圖像目標檢測方法采用下述補償策略對S分量圖和H分量圖中存在的非陰影區(qū)域和陰影區(qū)域進行匹配 (12) (13) 式中,S(i,j)、H(i,j)分別代表的是陰影區(qū)域在補償前和補償后對應的飽和度;mn、ms分別代表的是非陰影區(qū)域在補償前和補償后對應的色調(diào)值;B、C分別代表的是圖像色調(diào)和圖像飽和度在補償過程中的強度系數(shù)。 在上述過程的基礎上補償圖像陰影區(qū)域中的各個分量,將HSI(Hue Saturation Intensity ,色調(diào)飽和度)空間中存在的H、S、I分量轉(zhuǎn)換到RGB空間中,實現(xiàn)圖像陰影區(qū)域的消除。灰度突變現(xiàn)象經(jīng)常存在于圖像的陰影和非陰影區(qū)域中,消除陰影后兩個區(qū)域之間在圖像中仍然呈現(xiàn)一條明顯的邊界線[9],多自由度人體運動動態(tài)圖像目標檢測方法完成陰影補償后,通過中值濾波處理消除陰影邊界處存在的邊緣效應,使陰影區(qū)域經(jīng)過補償后可以平滑的過渡到非陰影區(qū)域。 在二階自回歸模型的基礎上建立運動模型 Xt-Xt-1=Xt-1-Xt-2+Ut (14) 式中,Xt代表的多自由度人體運動目標,其表達式如下 (15) 多自由度人體運動動態(tài)圖像目標檢測方法選擇灰度分布對多自由度人體運動目標進行描述,對參考目標與目標樣本進行對比,根據(jù)對比結(jié)果建立觀測模型。 (16) 式中,C代表的是歸一化常數(shù);l代表的是人體運動目標對應的中心(x,y);h代表的是目前區(qū)域的大??;k(·)代表的是核函數(shù);δ(·)代表的是Kronecker Delta函數(shù)。 在目標中心與區(qū)域中心重合的基礎上選取固定區(qū)域,最大限度地使固定區(qū)域與目標吻合,因此在不同方向的固定區(qū)域中,距離中心較近的像素越有可能屬于目標[10]。通過上述分析可知,當區(qū)域中的像素位置高于設定的范圍時,多自由度人體運動動態(tài)圖像目標檢測方法選擇負指數(shù)分布對像素屬于目標的概率進行描述 (17) 式中,參數(shù)θ的取值為1;|·‖代表的是距離范數(shù);Td代表的是閾值。 (18) (19) 在上式的基礎上構建觀測概率模型 (20) 式中,λ為控制參數(shù)。設t代表的是目標在圖像中的平均狀態(tài);為觀測概率,可在觀測概率模型的基礎上計算得到,構建人體運動目標的目標更新模型,利用目標更新函數(shù)實現(xiàn)多自由度人體運動動態(tài)圖像目標的檢測 (21) 為了驗證多自由度人體運動動態(tài)目標檢測方法的整體有效性,需要對多自由度人體運動動態(tài)目標檢測方法進行測試。本次測試的實驗平臺為CPU2.1GHz,2GB RAM計算機?;贛ATLAB7.11平臺實現(xiàn)圖像顯示,在Visual Studio 2010 MFC平臺中通過攝像頭獲取圖像。分別采用多自由度人體運動動態(tài)圖像目標檢測方法(方法1)、基于分塊投影匹配的人體運動動態(tài)目標檢測方法(方法2)和基于改進背景減法的人體運動動態(tài)目標檢測方法(方法3)進行測試,對人體運動動態(tài)目標進行檢測之前,需要對圖像進行預處理,不同方法的圖像處理結(jié)果如圖1所示。 圖1 不同方法的圖像預處理結(jié)果 圖1(a)為方法1對人體運動動態(tài)圖像處理后的結(jié)果,可以看出處理后的圖像清晰度較高,不存在模糊區(qū)域和陰影區(qū)域。圖1(b)為方法2對人體運動動態(tài)圖像處理后的結(jié)果,該方法對圖像進行處理后圖像中還存在大面積的模糊區(qū)域。圖1(c)為方法3對人體運動動態(tài)圖像處理后的結(jié)果,采用該方法對圖像進行預處理時無法消除圖像中存在的陰影部分。對比方法1、方法2和方法3的測試結(jié)果可知,方法1預處理后的人體運動動態(tài)圖像的清晰度較高,因為該方法通過高斯模型進行背景建模,在目標區(qū)域中結(jié)合數(shù)學形態(tài)處理和小區(qū)域去除方法根據(jù)陰影區(qū)域飽和度高和亮度值低的特性確定陰影區(qū)域,并通過匹配補償去除圖像中存在的陰影,提高了人體運動動態(tài)圖像的清晰度。 將位置誤差作為測試指標對方法1、方法2和方法3進行測試,測試結(jié)果如圖2所示。 圖2 不同方法的位置誤差 分析圖2中的數(shù)據(jù)可知,方法2對人體運動動態(tài)圖像目標進行檢測時,當圖像幀數(shù)為40frames時位置誤差飛速增加,因為該方法無法消除圖像中的模糊區(qū)域,導致在目標跟蹤過程中的位置誤差較大。方法3對人體運動動態(tài)圖像目標進行檢測時,隨著圖像幀數(shù)的增加位置誤差不斷增加,因為該方法在目標跟蹤過程中將陰影區(qū)域誤當做目標,增大了位置誤差。采用方法1對人體運動動態(tài)圖像目標進行檢測時的位置誤差較小,因為該方法通過降低陰影區(qū)域的飽和度,提高陰影區(qū)域的亮度值,消除圖像中存在的陰影,降低了目標跟蹤過程中產(chǎn)生的位置誤差。 為了進一步驗證方法1、方法2和方法3的整體有效性,通過運行時間測試不同方法的檢測效率,結(jié)果如3所示。 圖3 不同方法的運行時間 分析圖3中的數(shù)據(jù)可知,隨著圖像幀數(shù)的增加,方法1、方法2和方法3檢測多自由度人體運動動態(tài)圖像目標所用的時間不斷增加,但方法1所用的時間仍少于方法2和方法3所用的時間,因為方法1完成陰影補償后,為了減弱邊緣效應,對陰影邊界進行中值濾波處理,使陰影區(qū)域經(jīng)過補償后可以平滑的過渡到非陰影區(qū)域,提高了圖像的清晰度,更好的體現(xiàn)了目標在圖像中的細節(jié)信息,縮短了檢測所用的時間,提高了方法1的檢測效率。 在人體運動視覺分析中人體運動目標檢測是重要內(nèi)容,在計算機視覺領域中成為人們研究的熱點。人體運動目標檢測具有極大的經(jīng)濟價值和廣泛的應用前景,被應用在人體運動細節(jié)分析、高級人機交互和智能安全監(jiān)控等領域中。目前人體運動動態(tài)圖像目標檢測方法存在圖像清晰度低、位置誤差大和檢測效率低的問題,提出多自由度人體運動動態(tài)圖像目標檢測方法,在圖像預處理過程中結(jié)合數(shù)學形態(tài)處理和小區(qū)域去除方法消除目標周圍存在的陰影,根據(jù)像素在圖像中的灰度分布實現(xiàn)人體運動動態(tài)圖像的目標檢測,解決了當前方法中存在的問題和難點,為人體運動視覺分析技術的發(fā)展奠定了基礎。3.2 目標檢測
4 實驗結(jié)果與分析
5 結(jié)束語