楊彩霖
(西安廣播電視大學(xué) 理工教學(xué)部, 陜西 西安 710002)
伴隨圖像、圖形處理技術(shù)、計算機視覺技術(shù)的不斷發(fā)展,會產(chǎn)生大量運動視頻數(shù)據(jù),對這些運動視頻數(shù)據(jù)進(jìn)行充分利用,具有十分重要的實際應(yīng)用價值,如:目標(biāo)檢測、運動圖像關(guān)鍵幀跟蹤等[1-2]。運動圖像關(guān)鍵幀跟蹤可以幫助人們對運動軌跡進(jìn)行描述,可以對運動目標(biāo)行為進(jìn)行理解,因此運動圖像關(guān)鍵幀跟蹤成為當(dāng)前計算機視覺研究領(lǐng)域的一個熱點問題[3-5]。
針對運動圖像關(guān)鍵幀跟蹤問題,人們投入了大量的時間進(jìn)行了深入、廣泛的研究,當(dāng)前存在許多運動圖像關(guān)鍵幀跟蹤方法[6]。當(dāng)前運動圖像關(guān)鍵幀跟蹤技術(shù)可以劃分為兩類,一類基于硬件的運動圖像關(guān)鍵幀跟蹤方法,如基于嵌入系統(tǒng),該類方法的運動圖像關(guān)鍵幀不但跟蹤速度快,而且精度比較高,但是運動圖像關(guān)鍵幀跟蹤成本高,且通用性差,因此實際應(yīng)用價值不高[7-9];另一類基于軟件的運動圖像關(guān)鍵幀跟蹤技術(shù),主要有:語義模型的運動圖像關(guān)鍵幀跟蹤方法,高斯混合模型的運動圖像關(guān)鍵幀跟蹤方法,該類方法的運動圖像關(guān)鍵幀跟蹤成本低,對環(huán)境要求高,通用性好,成為當(dāng)前運動圖像關(guān)鍵幀跟蹤的主要研究方向[10-12]。在實際應(yīng)用中,這些運動圖像關(guān)鍵幀跟蹤的方法還存在各種不足,主要體現(xiàn)在運動圖像關(guān)鍵幀跟蹤的錯誤率高、運動圖像關(guān)鍵幀跟蹤速度慢,無法對運動圖像關(guān)鍵幀進(jìn)行在線、實時跟蹤。
針對當(dāng)前運動圖像關(guān)鍵幀跟蹤中存在的問題,以獲得更加理想的運動圖像關(guān)鍵幀跟蹤結(jié)果為目標(biāo),提出了一種基于自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤方法,采用聚類算法根據(jù)特征對運動圖像關(guān)鍵幀進(jìn)行分類,采用自適應(yīng)無監(jiān)督學(xué)習(xí)算法對運動圖像關(guān)鍵幀進(jìn)行跟蹤,仿真對比結(jié)果表明,本文方法獲得了理想的運動圖像關(guān)鍵幀跟蹤效果,運動圖像關(guān)鍵幀跟蹤誤差要遠(yuǎn)遠(yuǎn)小于其它運動圖像關(guān)鍵幀跟蹤方法,改善了運動圖像關(guān)鍵幀跟蹤效率,對比結(jié)果驗證了自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤有效性和優(yōu)越性。
運動視頻圖像采集是自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤的第一步,本文采用高清數(shù)字機芯作為視頻信號源,然后采用視頻信號處理模塊對運動視頻圖像進(jìn)行采集和存儲,最后將運動視頻圖像輸出到終端。由于運動視頻由許多幀圖像組成,使得運動視頻圖像之間有大量的信息冗余,因此本文通過對運動視頻圖像進(jìn)行分幀處理,提取運動圖像關(guān)鍵幀,將其它運動圖像幀去除,以加快運動圖像關(guān)鍵幀跟蹤速度。
1.2.1 運動圖像關(guān)鍵幀的矢量場特征
對于一個運動圖像關(guān)鍵幀,將其劃為多個子塊,如圖1所示。
圖1 運動圖像關(guān)鍵幀的分塊
設(shè)第C個子塊的運動圖像關(guān)鍵幀強度為ρ,其x和y方向的分量分別為Cx和Cy,θ表示運動圖像關(guān)鍵幀矢量的方向,如式(1)。
(1)
運動視頻圖像的關(guān)鍵幀根據(jù)時間前后進(jìn)行排列,那么可以得到直方圖計算公式,如式(2)。
(2)
對x和y方向上的期望和方差進(jìn)行評估,如式(3)。
(3)
1.2.2 提取運動圖像關(guān)鍵幀的顏色特征
pij表示運動圖像關(guān)鍵幀中第j個像素、第i個顏色分量,那么顏色分量1~3階矩陣重計算公式,如式(4)—式(6)。
(4)
(5)
(6)
模糊C均值聚類分析算法通過隸屬度劃分每個數(shù)據(jù)點的歸屬類型,共有c類,第i類的聚類中心為ci,uij表示第i個數(shù)據(jù)點(xi)屬于第j類的隸屬度值,U表示隸屬度矩陣,所有數(shù)據(jù)的隸屬度的和應(yīng)該為1,如式(7)。
(7)
模糊C均值聚類分析算法標(biāo)函數(shù),如式(8)。
(8)
式中,dij表示ci與xj間的距離;m表示模糊加權(quán)指數(shù)。
引入拉格朗日乘子λi,i=1,2,…,n,建立新的目標(biāo)函數(shù),如式(9)。
J(U,c1,…,cc,λ1,…,λn)=
(9)
對聚類中心和隸屬度值進(jìn)行求解,如式(10)、式(11)。
(10)
(11)
模糊C均值聚類分析算法根據(jù)運動圖像關(guān)鍵幀特征,對分幀后的運動圖像進(jìn)行分析,將運動圖像關(guān)鍵幀劃分為不同類別,便于對后續(xù)的運動圖像關(guān)鍵幀跟蹤操作,如圖2所示。
圖2 運動圖像關(guān)鍵幀的聚類分析流程
RBF神經(jīng)網(wǎng)絡(luò)是一種自適應(yīng)無監(jiān)督算法,其具有良好的擬合能力,因此本文選擇其對運動圖像關(guān)鍵幀跟蹤進(jìn)行建模研究。RBF網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示。
圖3 RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
輸入向量即為運動圖像關(guān)鍵幀特征向量集合:x=(x1,x2,…,xn);y=(y1,y2, …,yp)為運動圖像關(guān)鍵幀變化值;RBF神經(jīng)網(wǎng)絡(luò)采用高斯函數(shù)擬合運動圖像關(guān)鍵幀變化軌跡,高斯函數(shù)定義,如式(12)。
(12)
RBF神經(jīng)網(wǎng)絡(luò)的輸出值,如式(13)。
(13)
RBF神經(jīng)網(wǎng)絡(luò)根據(jù)運動圖像關(guān)鍵幀特征向量集合對運動圖像關(guān)鍵幀變化特點進(jìn)行分析,得到運動圖像關(guān)鍵幀變化值,從而根據(jù)運動圖像關(guān)鍵幀值實現(xiàn)運動圖像關(guān)鍵幀的跟蹤。
為了測試自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤性能,對其進(jìn)行仿真測試實驗,仿真測試的實驗環(huán)境,如表1所示。
表1 運動圖像關(guān)鍵幀跟蹤的實驗環(huán)境
為了使自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤結(jié)果更具說服力,選擇5類運動圖像作為實驗對象,每一類運動圖像的數(shù)量,如表2所示。
表2 運動圖像關(guān)鍵幀跟蹤的實驗對象
為了使自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤結(jié)果具有可比性,選擇語義模型的運動圖像關(guān)鍵幀跟蹤方法,高斯混合模型的運動圖像關(guān)鍵幀跟蹤方法進(jìn)行比實驗,統(tǒng)計它們對5類運動圖像關(guān)鍵幀的跟蹤精度,如圖4所示。
圖4 不同方法的運動圖像關(guān)鍵幀跟蹤精度對比
對圖4的運動圖像關(guān)鍵幀跟蹤精度進(jìn)行對比分析可以發(fā)現(xiàn),自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤精度最高,其次為高斯混合模型的運動圖像關(guān)鍵幀跟蹤方法,運動圖像關(guān)鍵幀跟蹤精度最低者為語義模型,對比結(jié)果證明了自適應(yīng)無監(jiān)督聚類算法可以對運動圖像關(guān)鍵幀進(jìn)行準(zhǔn)確跟蹤,獲得了理想的運動圖像關(guān)鍵幀跟蹤結(jié)果。
統(tǒng)計3種方法對5類運動圖像關(guān)鍵幀跟蹤時間,如圖5所示。
圖5 不同方法的運動圖像關(guān)鍵幀跟蹤時間對比
對圖5的運動圖像關(guān)鍵幀跟蹤時間進(jìn)行對比分析可知,自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤時間要少于高斯混合模型和語義模型,對比結(jié)果證明了自適應(yīng)無監(jiān)督聚類算法加快了運動圖像關(guān)鍵幀跟蹤速度,可以對運動圖像關(guān)鍵幀進(jìn)行實時跟蹤,具有更高的實際應(yīng)用值。
針對當(dāng)前運動圖像關(guān)鍵幀跟蹤方法存在的不足,以提高運動圖像關(guān)鍵幀跟蹤精度為目標(biāo),提出自適應(yīng)無監(jiān)督聚類算法的運動圖像關(guān)鍵幀跟蹤方法,并與其它運動圖像關(guān)鍵幀跟蹤方法進(jìn)行了對比測試,結(jié)果表明,本文方法的運動圖像關(guān)鍵幀跟蹤精度明顯高于對比方法,且運動圖像關(guān)鍵幀跟蹤速度更快,具有十分廣泛的應(yīng)用前景。