趙 凌
(鐵道警察學(xué)院 軌道交通安全保衛(wèi)系, 鄭州 450053)
地鐵站視頻監(jiān)控?cái)z像機(jī)是地鐵交通安全維護(hù)的重要手段,公安機(jī)關(guān)利用視頻監(jiān)控系統(tǒng)可以實(shí)現(xiàn)網(wǎng)上巡查、移動(dòng)目標(biāo)跟蹤抓拍、回放搜索、大客流預(yù)警與警力部署等工作。傳統(tǒng)的工作流程是先錄制視頻,再人工調(diào)取、分析視頻段。該方法對于單一攝像機(jī)視域尚可應(yīng)用,但面對地鐵車站多攝像機(jī)視域時(shí)很可能耗時(shí)較多,從而影響后續(xù)工作部署。因此,在多攝像機(jī)視域下實(shí)現(xiàn)移動(dòng)目標(biāo)軌跡的自動(dòng)跟蹤對于高效預(yù)警、控制可疑人員具有重要意義。
地鐵站出入通道是可疑人員進(jìn)站乘車的必經(jīng)之路,其間安裝的視頻監(jiān)控?cái)z像機(jī)具有以下視域特點(diǎn):① 視域固定;② 出入通道光照亮度均勻;③ 移動(dòng)目標(biāo)會(huì)在相鄰攝像機(jī)視域內(nèi)交替出現(xiàn);④ 不同攝像機(jī)視域可能無重疊,也可能有重疊;⑤ 當(dāng)多個(gè)移動(dòng)目標(biāo)同時(shí)出現(xiàn)在同一視域中時(shí),可能相互遮擋,跟蹤難度加大。據(jù)此,多臺(tái)攝像機(jī)交替識(shí)別并跟蹤同一移動(dòng)目標(biāo)的關(guān)鍵是相鄰攝像機(jī)之間的目標(biāo)傳遞。當(dāng)前的相關(guān)研究主要集中在兩個(gè)方面:無重疊區(qū)域和有重疊區(qū)域的多視域移動(dòng)目標(biāo)跟蹤。
在無重疊區(qū)域跟蹤方面,文獻(xiàn)[1]通過提取兩個(gè)視域下有價(jià)值的特征點(diǎn),設(shè)置匹配閾值,從而實(shí)現(xiàn)移動(dòng)目標(biāo)的傳遞和跟蹤。文獻(xiàn)[2-4]以移動(dòng)目標(biāo)所在的坐標(biāo)和進(jìn)出兩個(gè)視域邊界線的時(shí)間差閾值為約束條件,利用圖像的空間分塊和顏色直方圖匹配的方法實(shí)現(xiàn)移動(dòng)目標(biāo)的傳遞和跟蹤。文獻(xiàn)[5-7]利用分層結(jié)構(gòu)的單詞樹直方圖和全局顏色直方圖獲取前景圖像的外觀特征,建立支持向量機(jī)增量學(xué)習(xí)在線訓(xùn)練外觀特征的外觀識(shí)別模型,并對該模型進(jìn)行在線自適應(yīng)融合實(shí)現(xiàn)移動(dòng)目標(biāo)的傳遞和跟蹤。文獻(xiàn)[8-9]利用累加直方圖轉(zhuǎn)換函數(shù)對圖像的R、G、B分量進(jìn)行亮度轉(zhuǎn)換,定義了顏色向量距離,在主顏色聚類的基礎(chǔ)上提取目標(biāo)的主顏色直方圖,最后通過設(shè)置閾值對兩個(gè)目標(biāo)的主顏色直方圖進(jìn)行匹配,從而確定傳遞的目標(biāo)。
有重疊跟蹤方面,文獻(xiàn)[10]利用尺度不變特征轉(zhuǎn)換(scale-invariant feature transform,SIFT)算法[11-12]自動(dòng)提取移動(dòng)目標(biāo)特征點(diǎn),生成視野分界線,通過顏色直方圖完成目標(biāo)傳遞,利用Mean Shift算法[13-14]完成目標(biāo)跟蹤。文獻(xiàn)[15]提出改進(jìn)的投影不變量目標(biāo)交換算法,將目標(biāo)在兩個(gè)視域內(nèi)的距離差與設(shè)置的閾值進(jìn)行比較,若小于該閾值的目標(biāo)只有1個(gè),則完成目標(biāo)傳遞;若類似目標(biāo)有多個(gè)則啟動(dòng)直方圖匹配算法進(jìn)行匹配運(yùn)算,匹配度最好的目標(biāo)即傳遞的目標(biāo)。考慮到地鐵站出入通道中移動(dòng)目標(biāo)的出現(xiàn)有其隨機(jī)性,接下來將重點(diǎn)研究無重疊區(qū)域相鄰兩臺(tái)攝像機(jī)的移動(dòng)目標(biāo)傳遞問題[16],這對于多攝像機(jī)無重疊區(qū)域的移動(dòng)目標(biāo)跟蹤研究更具普遍意義。
地鐵站出入通道是指地鐵站的步梯、直梯或自動(dòng)扶梯與地鐵站廳層之間的人行通道。通常情況下,行人會(huì)由步梯、自動(dòng)扶梯或直梯進(jìn)入地鐵站出入通道,之后進(jìn)入地鐵站廳層,憑票進(jìn)入地鐵站臺(tái)層乘車出行。行人下車后由站臺(tái)層憑票途經(jīng)站廳層,再經(jīng)過地鐵站出入通道由步梯、自動(dòng)扶梯或直梯出站。據(jù)此可知,行人乘坐地鐵勢必經(jīng)過地鐵站出入通道,從而留下個(gè)人的移動(dòng)軌跡,而地鐵站出入通道上通常會(huì)設(shè)置拐角,在拐角的顯著位置附近安裝有固定視域的視頻監(jiān)控?cái)z像機(jī),這就使得相鄰攝像機(jī)對同一行人在不同視域內(nèi)的軌跡跟蹤成為可能。本文主要研究行人經(jīng)過“L形”地鐵站出入通道進(jìn)站乘車的情況。如圖1所示,其中,F(xiàn)1、F2為相鄰攝像機(jī)C1、C2的無重疊區(qū)域的視域。
圖1 “L形”地鐵站出入通道相鄰攝像機(jī)監(jiān)控模型示意圖
目標(biāo)傳遞是多攝像機(jī)移動(dòng)目標(biāo)跟蹤的基礎(chǔ)。在圖1中,行人要進(jìn)站乘車,必定按進(jìn)站方向途經(jīng)F1后,沿“L形”地鐵站出入通道繼續(xù)前行,之后必將出現(xiàn)在F2中。若C1、C2認(rèn)定該行人為同一目標(biāo),則完成該行人圖像在兩臺(tái)相鄰攝像機(jī)之間的傳遞。
乘車進(jìn)站時(shí),行人正面出現(xiàn)在地鐵站出入通道攝像機(jī)中,成像大小為正比例逐漸放大,直到離開攝像機(jī)視域,如圖2所示。
圖2 行人經(jīng)過視域時(shí)成像變化示意圖
F1、F2為相鄰兩臺(tái)攝像機(jī)的有效檢測視域,行人沿進(jìn)站方向移動(dòng),成像逐漸變大。當(dāng)行人進(jìn)入攝像機(jī)視域時(shí),可能會(huì)出現(xiàn)兩種情況:
情況1行人已經(jīng)在此前地鐵站出入通道的攝像機(jī)視域中出現(xiàn)過,如圖1中的F2;
情況2行人第1次出現(xiàn)在地鐵站出入通道的攝像機(jī)視域中,如圖1中的F1。
一般情況下,行人在較短時(shí)間內(nèi)途經(jīng)F1、F2時(shí)的外觀、行為不會(huì)發(fā)生較大變化。本文選取行人的移動(dòng)方向、身高寬度比、行走速度、著裝特征作為C1、C2目標(biāo)傳遞時(shí)的特征匹配要素。
由于攝像機(jī)安裝位置、視域范圍固定,因此可將攝像機(jī)在地面的投影點(diǎn)設(shè)為坐標(biāo)原點(diǎn)C,以通過該點(diǎn)垂直于兩側(cè)墻體的直線為橫坐標(biāo)x,以通過該點(diǎn)垂直于橫坐標(biāo)的直線為縱坐標(biāo)y,建立單有效視域二維平面坐標(biāo)系,如圖3所示。
圖3 單有效視域二維坐標(biāo)系
由圖3可知,在單視域環(huán)境下,攝像機(jī)的有效視域范圍為D1、D2與兩側(cè)墻體所構(gòu)成的空間環(huán)境。一旦攝像機(jī)安裝位置確定,可認(rèn)為在該空間環(huán)境對應(yīng)的地面x、y坐標(biāo)是確定的,即有效視域范圍內(nèi)的行人腳下的坐標(biāo)值(x,y)是確定的,且會(huì)隨著行人的移動(dòng)不斷變化。假設(shè)行人在地鐵站出入通道行走時(shí),行走路線近似直行,且通常有面向攝像機(jī)和反向攝像機(jī)兩種相對的行走方向。比較行人腳下坐標(biāo)與坐標(biāo)原點(diǎn)C(X,Y)之間歐氏距離的變化趨勢,歐氏距離減小則判斷為面向攝像機(jī)方向行走,歐氏距離增大則判斷為反向攝像機(jī)方向行走。本文只研究跟蹤面向攝像機(jī)移動(dòng)的行人,從而排除反向攝像機(jī)方向行人的干擾。Ti和Tj分別是同一行人在途徑單有效視域下的任意兩點(diǎn),其坐標(biāo)分別為(xi,yi)和(xj,yj),若兩點(diǎn)和原點(diǎn)C(X,Y)之間的歐氏距離為DTij,則:
(1)
那么,當(dāng)DTij>0時(shí),行人面向攝像機(jī)移動(dòng);當(dāng)DTij<0時(shí),行人背向攝像機(jī)移動(dòng);當(dāng)DTij=0時(shí),行人沒有移動(dòng)或沿垂直墻面方向移動(dòng)。
行人正面出現(xiàn)在攝像機(jī)視域中,其身高H和體寬W的輪廓數(shù)值是比較穩(wěn)定的。但由于相鄰攝像機(jī)的參數(shù)不同,行人在不同視域中成像放大倍數(shù)也不同,H、W的數(shù)值會(huì)隨著行人的移動(dòng)而不斷變化,因此只單獨(dú)考慮H、W的數(shù)值作為目標(biāo)傳遞的參數(shù)是行不通的[17]。設(shè)身高寬度比為η,即行人作為移動(dòng)整體成像時(shí)垂直高度與水平寬度之間的比值:
(2)
顯然,η不會(huì)因是否被放大而發(fā)生變化。當(dāng)相鄰攝像機(jī)參數(shù)設(shè)置均相同時(shí),η可以作為實(shí)時(shí)采樣比較的約束條件??紤]到檢測誤差和現(xiàn)場客觀因素的限制,取行人途徑F1、F2的身高寬度比分別為η1和η2,那么兩者差值為
Dfη=|η2-η1|
(3)
比較得出最小值,完成身高寬度比的匹配,即:
minDfη
(4)
實(shí)際情況下,并不是所有行人在經(jīng)過F1或F2時(shí)都正對攝像機(jī),在經(jīng)過視域兩側(cè)時(shí)η值偏小,而正對著攝像機(jī)的η值接近真實(shí)值,因此同一行人在不同視域下η值可能相差較大。若單獨(dú)以η值作為目標(biāo)傳遞的特征進(jìn)行匹配可能無法完成目標(biāo)傳遞,因此本文引入行走速度匹配。
通常情況下,受攝像機(jī)安裝位置和有效視域范圍的限制,行人在地鐵站出入通道單攝像機(jī)中出現(xiàn)的時(shí)間一般在10 s以內(nèi),行走速度相對穩(wěn)定,這就為行走速度特征匹配創(chuàng)造了條件[18]。假設(shè)行人進(jìn)入和離開F1的時(shí)間點(diǎn)分別為T1和T2,F(xiàn)1的有效長度為L1,如圖4所示。
圖4 行走速度檢測示意圖
行人經(jīng)過F1的平均行走速度為
(5)
在途經(jīng)F2時(shí),利用同樣的方法可測算出行人經(jīng)過L2/2時(shí)的平均行走速度為
(6)
行人在途經(jīng)F2的T4與T5之間的后L2/2期間,通過計(jì)算相繼進(jìn)入F1、F2的不同行人v2與v1的絕對差值:
Dfv=|v2-v1|
(7)
比較得出最小值,完成行人速度匹配,即:
minDfv
(8)
2.4.1空間位置選擇
顏色直方圖只包含圖像中顏色值出現(xiàn)的頻數(shù),缺乏像素的空間位置信息,致使目標(biāo)傳遞所需的特征匹配因素缺乏有針對性的比較對象[19]。為進(jìn)一步提高目標(biāo)匹配的準(zhǔn)確性,以行人著裝特征為研究對象,同時(shí)兼顧行人提、拉箱包的情況,本文采用空間顏色二維直方圖匹配方法,先將行人圖像分割成2×4的方塊組合,然后統(tǒng)計(jì)每塊區(qū)域內(nèi)的顏色直方圖,從而獲取該圖像的空間顏色二維直方圖,如圖5(a)所示。由圖5(b)可知:行人整體所在的主要塊區(qū)分布在P1、P2、P3、P4、P5、P6塊區(qū),考慮到人體著裝顏色穩(wěn)定性特點(diǎn),根據(jù)經(jīng)驗(yàn)可以增加P1、P2塊區(qū)和P4、P5塊區(qū)的權(quán)重來提高圖像匹配的準(zhǔn)確度。
圖5 空間位置選擇實(shí)例
2.4.2直方圖匹配
為盡可能避免非理想狀態(tài)下產(chǎn)生的噪聲影響,基于單攝像機(jī)目標(biāo)跟蹤時(shí),先對要跟蹤的行人隨機(jī)抽取n-1幀m級(jí)目標(biāo)圖像直方圖作為比較樣本,記為:
sij=aij
(9)
其中i=1,…,n,j=1,…,m。那么最新一幀的直方圖與樣本直方圖的差的絕對值記為
Distn=|anj-aij|
(10)
當(dāng)Disti小于某個(gè)閾值時(shí),記為Threshold,對Disti進(jìn)行累加操作,記為
(11)
當(dāng)Sum值小于等于某一個(gè)經(jīng)驗(yàn)值(本文設(shè)Sum值為2)時(shí),完成目標(biāo)匹配。
本文首先利用ViBe算法[20-21]建立移動(dòng)目標(biāo)背景檢測模型,當(dāng)有行人出現(xiàn)時(shí),即可建立移動(dòng)目標(biāo)模板,通過提取行人的移動(dòng)方向、身高寬度、行走速度、空間顏色直方圖等特征信息構(gòu)建行人的樣本集合。當(dāng)滿足圖像匹配條件時(shí),即可認(rèn)為實(shí)現(xiàn)了移動(dòng)目標(biāo)在無重疊區(qū)域的相鄰兩臺(tái)攝像機(jī)視域下的軌跡跟蹤。算法具體流程如圖6所示。
圖6 算法流程
通常情況下,行人按照圖1的“進(jìn)站方向”進(jìn)站乘車。本文以國內(nèi)某城市真實(shí)地鐵站出入通道視頻監(jiān)控圖像為背景,構(gòu)建由2臺(tái)相鄰攝像機(jī)組成的無重疊區(qū)域的實(shí)驗(yàn)現(xiàn)場,對移動(dòng)行人進(jìn)行跟蹤,并建立特征跟蹤模板,如圖7所示。
圖8是2臺(tái)攝像機(jī)對行人目標(biāo)交接的結(jié)果。圖8(a)在C1的第7 672幀圖像中檢測到目標(biāo)1,用紅色方框跟蹤標(biāo)識(shí)。圖8(e)在C2的第8 044幀圖像中檢測到目標(biāo)1,該目標(biāo)是C2中第2個(gè)目標(biāo)。圖8(b)在C1的第7 754幀圖像中檢測到目標(biāo)2,用藍(lán)色方框跟蹤標(biāo)識(shí);圖8(f)在C2的第8 084幀圖像中檢測到目標(biāo)2,該目標(biāo)是C2中第3個(gè)目標(biāo)。由圖8(c)(d)(g)(h)可以看出:C1和C2實(shí)現(xiàn)了對目標(biāo)1、2的跟蹤和傳遞。
圖7 地鐵站出入通道無重疊區(qū)域的相鄰2臺(tái)攝像機(jī)檢測視域
圖8 兩個(gè)行人在相鄰攝像機(jī)視域?qū)崿F(xiàn)目標(biāo)傳遞
為進(jìn)一步明確移動(dòng)目標(biāo)在地鐵站通道內(nèi)的活動(dòng)軌跡,圖9(a)(b)給出了目標(biāo)1在攝像機(jī)C1和攝像機(jī)C2中的移動(dòng)軌跡,圖9(c)(d)給出了目標(biāo)2在攝像機(jī)C1和C2中的移動(dòng)軌跡。由此可知,在本文提出算法背景下,均可獲取任何進(jìn)出地鐵站行人的移動(dòng)軌跡圖,從而實(shí)現(xiàn)對其移動(dòng)規(guī)律、乘車習(xí)慣等方面的跟蹤監(jiān)控。
圖9 移動(dòng)目標(biāo)在C1和C2之間實(shí)現(xiàn)軌跡跟蹤
由于SIFT算法對移動(dòng)目標(biāo)的尺度縮放、旋轉(zhuǎn)、亮度變化保持不變性,同時(shí)對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性,為進(jìn)一步檢驗(yàn)本文算法對移動(dòng)目標(biāo)的跟蹤成效,以SIFT算法在單一攝像機(jī)視域內(nèi)對移動(dòng)目標(biāo)的跟蹤成效為比較對象,給出了行人數(shù)量由10增至90時(shí),本文算法與SIFT算法對移動(dòng)目標(biāo)跟蹤時(shí)的準(zhǔn)確率變化情況,見圖10。由此可知,本文提出的算法對移動(dòng)目標(biāo)跟蹤的準(zhǔn)確率明顯高于單一攝像機(jī)直接使用SIFT算法的目標(biāo)跟蹤效果。同時(shí)不難發(fā)現(xiàn),隨著移動(dòng)目標(biāo)數(shù)量的增多,移動(dòng)目標(biāo)之間相互遮擋現(xiàn)象明顯增多,跟蹤難度加大,2種算法的跟蹤準(zhǔn)確率均呈下降趨勢。
圖10 本文算法與單攝像機(jī)直接使用SIFT算法時(shí)跟蹤移動(dòng)目標(biāo)的效果比較
本文分析了地鐵站出入通道視頻監(jiān)控?cái)z像機(jī)的視域特點(diǎn),以行人經(jīng)過相鄰2臺(tái)攝像機(jī)為例,將其移動(dòng)方向、身高寬度比、行走速度、著裝特征作為匹配要素,有效實(shí)現(xiàn)了對同一移動(dòng)目標(biāo)的軌跡跟蹤,對地鐵站內(nèi)多攝像機(jī)自動(dòng)跟蹤可疑人員及其行為具有借鑒意義。但隨著地鐵站出入通道行人數(shù)量的增加,多攝像機(jī)協(xié)調(diào)跟蹤移動(dòng)目標(biāo)的難度進(jìn)一步加大,解決該問題成為下一步研究的工作重點(diǎn)。