花 超,王庚潤*,陳 雷
(1.信息工程大學(xué),鄭州 450001;2.解放軍31101部隊(duì))
(?通信作者電子郵箱wanggengrun@gmail.com)
隨著監(jiān)控設(shè)備的普及,大規(guī)模的攝像機(jī)網(wǎng)絡(luò)逐步在機(jī)場(chǎng)、地鐵站、校園以及商業(yè)辦公區(qū)等公共區(qū)域被廣泛部署,因此多攝像機(jī)跟蹤技術(shù)越來越被人們所重視。而如何在多攝像機(jī)中對(duì)同一個(gè)行人進(jìn)行關(guān)聯(lián),是多攝像機(jī)跟蹤分析的基礎(chǔ)。鑒于行人再識(shí)別廣闊的應(yīng)用前景,目前有許多學(xué)者對(duì)其進(jìn)行了深入的研究。
由于各個(gè)攝像機(jī)的光線、角度、遮擋和背景等所處的環(huán)境不同,同一行人在不同的攝像機(jī)圖像中存在較大的差異,導(dǎo)致行人再識(shí)別存在識(shí)別精度較低的難題。為了提高其識(shí)別精度,目前主要有兩種解決思路:一是從特征描述的層面致力于尋找更加有效描述目標(biāo)的特征。Zhang等[1]利用行人的衣服、姿態(tài)、步態(tài)等信息構(gòu)建行人模型;Wang 等[2]根據(jù)正樣本的特有特征和負(fù)樣本共有的全局特征,提出基于區(qū)域交互排序的算法;Satake 等[3]從各個(gè)方向采集行人圖像,利用尺度不變特征變換(Scale-Invariant Feature Transform,SIFT)特征構(gòu)建行人外觀模型,以此解決行人姿態(tài)變化的問題;Liu 等[4]對(duì)每一個(gè)模板的行人圖像提取特征,并根據(jù)它們自身和相互間的顯著性給予不同的權(quán)重;曾明勇等[5]根據(jù)人體的結(jié)構(gòu)信息,提取行人圖像的空間直方圖和區(qū)域協(xié)方差特征,再融合這些外觀特征對(duì)目標(biāo)進(jìn)行建模。由于行人的整體特征易受遮擋和背景的干擾,目前大多數(shù)學(xué)者都傾向于將行人圖像進(jìn)行部件分割或者分塊再進(jìn)行特征提取。Bhuiyuan 等[6]將行人圖像進(jìn)行分割,再提取不同部位的特征,然后再根據(jù)識(shí)別能力強(qiáng)弱,對(duì)身體各部位進(jìn)行排序和選擇。文獻(xiàn)[7]中的SDALF(Symmetry-Driven Accumulation of Local Features)方法對(duì)圖像進(jìn)行分割和檢測(cè)等預(yù)處理,從中提取出最大穩(wěn)定顏色區(qū)域、重復(fù)紋理塊和色調(diào)飽和值(Hue,Saturation,Value,HSV)顏色直方圖特征后再對(duì)行人圖像進(jìn)行識(shí)別。范彩霞等[8]利用行人外觀模型對(duì)行人圖像進(jìn)行預(yù)識(shí)別,通過k-means 方法將行人圖像分為軀干、腿和頭,忽略頭部特征,再提取各部分主色區(qū)域的局部顏色和形狀特征。Huang等[9]對(duì)行人圖像進(jìn)行分塊,利用稀疏模型對(duì)每一個(gè)行人圖像進(jìn)行描述,并采用自適應(yīng)的方式賦予不同圖像不同的權(quán)重。
二是采用度量學(xué)習(xí)的方法,尋找能夠度量同一行人不同外觀空間的變換矩陣,使變換后同一行人圖像間的距離盡可能小,同時(shí)最大化不同行人圖像之間的距離。杜宇寧等[10]不僅利用了行人圖像的特征差分空間,還關(guān)注了圖像中每個(gè)個(gè)體的外貌特征,通過學(xué)習(xí)二次相似度函數(shù)來估計(jì)行人間的相似度;Liong 等[11]同時(shí)利用正樣本信息和負(fù)樣本信息,以解決訓(xùn)練圖像不足的問題,然后再用標(biāo)準(zhǔn)貝葉斯學(xué)習(xí)度量矩陣;杜宇寧等[12]利用統(tǒng)計(jì)推斷學(xué)習(xí)行人圖像間的度量函數(shù),根據(jù)此函數(shù)度量圖像間的相似度;齊美彬等[13]利用不同子空間中的行人特征學(xué)習(xí)度量矩陣和相似度矩陣,并給予不同權(quán)重,構(gòu)造出最終的相似度函數(shù);Guillaumin 等[14]從度量估計(jì)的可能性角度提出LDML(Logistic Discriminant Metric Learnin)算法,該算法將每一對(duì)圖像在梯度方向的影響控制在可能性之內(nèi);Davis 等[15]提出ITML(Information-Theoretic Metric Learning)算法,通過信息論的方法規(guī)范估計(jì)度量,從而最小化預(yù)先定義的度量間的距離。
特征能增加行人的辨識(shí)度,而度量學(xué)習(xí)方法則可以使辨識(shí)度得到進(jìn)一步的提升。當(dāng)提取行人特征時(shí),常見的行人再識(shí)別算法將先對(duì)行人圖像進(jìn)行部件分割,以獲取更精細(xì)的特征。但行人部件檢測(cè)和分割準(zhǔn)確率是難以保證的,針對(duì)這一問題,Zhao 等[16]提出基于塊匹配的行人再識(shí)別算法,通過行人圖像分成若干個(gè)小塊,再在小塊圖像上提取顯著度特征。由于利用了更為精細(xì)的粒度,因此該算法可以取得較好的識(shí)別效果;但該算法假定每一個(gè)小塊都是行人的特征小塊,而實(shí)際上因?yàn)檎趽鹾捅尘暗母蓴_,有一些小塊并非某個(gè)行人的獨(dú)有特征,而多數(shù)行人圖像中都具有的相似小塊在行人間相似度計(jì)算上是無意義的,在數(shù)據(jù)稀疏時(shí)反而會(huì)影響正常的行人再識(shí)別。
針對(duì)上述多數(shù)行人圖像中所共有的相似小塊問題,本文利用通信系統(tǒng)中的低通濾波器原理,通過低通濾波系統(tǒng)對(duì)行人圖像進(jìn)行處理。計(jì)算時(shí),先將行人圖像進(jìn)行分塊,通過計(jì)算各個(gè)小塊的相似性,得到相似小塊的個(gè)數(shù),個(gè)數(shù)較多的被認(rèn)為是高頻噪聲特征,個(gè)數(shù)較少的則被認(rèn)為是有益特征;通過設(shè)置低頻截止頻率對(duì)高頻的噪聲特征進(jìn)行抑制,同時(shí)對(duì)低頻有益特征進(jìn)行適當(dāng)增益;最后利用濾波后的行人圖像進(jìn)行行人間相似度計(jì)算。實(shí)驗(yàn)結(jié)果表明,本文算法可以取得較高的識(shí)別精度。
本文中的噪聲特征、噪聲頻率和截止頻率等概念具體定義如下:
噪聲特征 將行人圖像分成若干個(gè)小塊。不同行人圖像中都具有的相似特征小塊是不具有代表性的,對(duì)于行人間相似度的計(jì)算沒有太大幫助;而在數(shù)據(jù)稀疏的情況下,甚至?xí)绊懽罱K的識(shí)別結(jié)果。這些特征小塊被定義為噪聲特征,記為nos。
噪聲頻率 計(jì)算各小塊與圖像中其他小塊的歐氏距離,若小于一定值,則認(rèn)為它們是相似的。統(tǒng)計(jì)各小塊在其他行人圖像中的相似小塊數(shù)目,定義為噪聲頻率,記為f(nos)。因?yàn)樵肼曁卣髦辽倬哂? 個(gè)相似小塊,所以f(nos) ≥2,否則不認(rèn)為其為噪聲特征。f(nos)越大,該特征小塊具有越多的相似小塊,其越有可能為遮擋物或背景,在計(jì)算行人間的相似度時(shí)干擾越大、越有害;而f(nos)越小,則說明該小塊是某個(gè)行人的特有特征,具有較強(qiáng)的區(qū)分性。
截止頻率 低通濾波器中設(shè)置的低頻頻率值,稱為截止頻率,記為fq。
小塊權(quán)重 特征塊Pij經(jīng)過低通濾波器時(shí)進(jìn)行衰減或者增益的數(shù)值,記為
小塊相似度閾值 小塊間的相似度數(shù)值,小于等于這個(gè)值則認(rèn)為它們是相似的,記為dq。
常見的行人再識(shí)別方法不能很好解決遮擋和背景干擾問題,而實(shí)際上因?yàn)檎趽鹾捅尘暗母蓴_,有一些小塊并非某個(gè)行人的獨(dú)有特征。大多行人圖像都具有的相似小塊在行人間相似度計(jì)算上是無意義的,在數(shù)據(jù)稀疏時(shí),甚至?xí)绊懽罱K識(shí)別結(jié)果。本文針對(duì)這一問題提出一種低通濾波行人再識(shí)別系統(tǒng),該系統(tǒng)的組成框圖及圖像處理流程如圖1所示。
圖1 基于低通濾波的行人再識(shí)別系統(tǒng)Fig.1 Person re-identification system based on low-pass filtering
該系統(tǒng)中各模塊的作用如下:
行人圖像塊特征 對(duì)行人圖像進(jìn)行分塊,再對(duì)小塊提取特征向量。
小塊間相似度 用L1 范數(shù)距離計(jì)算目標(biāo)行人圖像P 中的小塊與其他行人圖像中小塊的相似度。
查找小塊 對(duì)目標(biāo)行人圖像P 中的所有小塊查找在其他行人圖像中的相似小塊,服務(wù)于后面的噪聲提取和權(quán)重評(píng)分模塊。
噪聲提取 根據(jù)小塊與其他行人圖像中相似小塊的個(gè)數(shù),提取該小塊的噪聲頻率。
低通濾波 對(duì)噪聲進(jìn)行低通濾波,使得頻率高于截止頻率的高頻噪聲特征小塊迅速衰減,同時(shí)使低于截止頻率的有益特征小塊得到適當(dāng)增益。
權(quán)重評(píng)分 低通濾波后得到的各個(gè)小塊的權(quán)重值。
小塊權(quán)重 經(jīng)過權(quán)重評(píng)分后得到的目標(biāo)圖像P 中各個(gè)小塊權(quán)重值矩陣。
乘法器 低通濾波得到的各個(gè)小塊的權(quán)重值與行人圖像中對(duì)應(yīng)特征小塊相乘。
行人間相似度 計(jì)算出行人間相似度大小。
行人圖像分塊及特征提取 在行人圖像的垂直和水平方向上,分別用分辨率為v × h 的固定窗口進(jìn)行滑動(dòng)操作,滑動(dòng)步長相應(yīng)為v/2和h/2。因此,將得到m × n個(gè)小塊,其中m和n分別為水平和豎直方向上的小塊個(gè)數(shù)。該步長的設(shè)計(jì),使小塊可以完整覆蓋行人圖像。本文將圖像分辨率統(tǒng)一標(biāo)準(zhǔn)化為128×48,窗口大小為8×24,滑動(dòng)步長在垂直方向?yàn)?2、水平方向?yàn)?。通過對(duì)分塊后的小塊進(jìn)行提取特征,行人圖像P可以表示為:
其中Pij是圖像P中第i行、第j列的小塊所對(duì)應(yīng)的特征向量。
小塊間相似度 利用L1 范數(shù)計(jì)算不同小塊間的相似度,例如行人圖像P中小塊Pij和行人圖像Q中小塊Qab,二者的相似度計(jì)算如下:
噪聲提取 Zhao 等[16]證明行人圖像在垂直方向上變化不大,而在水平方向上變化比較顯著。因此在計(jì)算圖像小塊間的相似度時(shí),考慮到計(jì)算的復(fù)雜度,可以不用計(jì)算目標(biāo)小塊與圖像中所有小塊間的距離,只需計(jì)算與該小塊在同一水平及上下位置小塊的相似度,即計(jì)算Pij與Qab(a=i -1,i,i +1;b=1,2,…,m)的相似度。若d(Pij,Qab)≤dq,則認(rèn)為小塊Pij和Qab相似,其中dq是相似度閾值。
假設(shè)有l(wèi) 張行人圖像,則圖像P 中小塊Pij的噪聲頻率f(nos)ij計(jì)算如下:
其中,噪聲基數(shù)fαPij定義為:
小塊相似度閾值 dq是小塊相似度閾值,小于等于這個(gè)值,則認(rèn)為兩個(gè)小塊相似。dq值是預(yù)先定義的,找一個(gè)行人的2 張不同圖像,計(jì)算小塊間的相似度,取小塊間的相似度的均值 記作在ETHZ(Eidgen?ssische Technische Hochschule Zürich)[17]、VIPeR (Viewpoint Invariant Pedestrian Recognition)[18]和 i-LIDS(imagery Library for Intelligent Detection Systems)[19]數(shù)據(jù)集中各提取個(gè)行人的不同圖像,共β個(gè)行人的圖像來計(jì)算初始閾值dq′,計(jì)算如下:
低通濾波處理 低通濾波是本文的核心,是根據(jù)通信原理中的低通濾波器設(shè)計(jì)的。利用截止頻率,使得高于截止頻率的噪聲特征迅速衰減,低于截止頻率的有益特征得到適當(dāng)增益。低通濾波的核心是設(shè)計(jì)濾波函數(shù)f和設(shè)置截止頻率fq,使得上述條件能夠得到滿足。
本文利用改進(jìn)的Logistic 函數(shù)進(jìn)行低通濾波。Logistic 函數(shù)常用于機(jī)器學(xué)習(xí)中,可以很好地表征人類學(xué)習(xí)和種群發(fā)展等過程。標(biāo)準(zhǔn)的Logistic函數(shù)定義如下:
其定義域?yàn)?-∞,+∞),值域?yàn)椋?,1)。Logistic 函數(shù)圖像如圖2所示。
取flogistic關(guān)于y=0.5對(duì)稱的函數(shù),其在x ≥0時(shí)的圖像如圖3所示。
其中:γ 是常數(shù),用來調(diào)節(jié)衰減增益幅度的大??;f(nos)Pij∈[1,β]為小塊Pij的噪聲頻率,β 是行人圖像個(gè)數(shù);fq為截止頻率。f函數(shù)是以f(nos)Pij為自變量的單調(diào)遞減函數(shù)。
圖2 Logistic函數(shù)的圖像Fig.2 Figure of Logistic function
圖3 在x ≥0時(shí)的圖像Fig.3 Figure of when x ≥0
改進(jìn)的低通濾波函數(shù)f需要滿足以下3個(gè)條件:
1)f(nos)Pij<fq時(shí),特征小塊Pij的權(quán)重得到適當(dāng)增益,且隨著f(nos)Pij的增大增益逐漸減少。為防止過度增益和自激,設(shè)定最大增益為1.1,即f(nos)Pij=1 時(shí),f=1.1。該設(shè)定可滿足對(duì)行人特有特征進(jìn)行適當(dāng)增益的要求;
2)f(nos)Pij=fq時(shí),f=1;
3)f(nos)Pij>fq時(shí),f會(huì)快速衰減,且隨著f(nos)Pij的增大,f趨近于0。這樣可滿足對(duì)于共有的無用高頻噪聲特征小塊進(jìn)行快速衰減的要求。
要滿足以上3 個(gè)條件,關(guān)鍵是選擇合適的γ 和fq。經(jīng)計(jì)算當(dāng)γ=5 時(shí),f 可得到較好的效果。下面將推導(dǎo)以獲取合適的fq。
系統(tǒng)中需要一個(gè)合適的fq,使得不同頻率下的衰減和增益數(shù)值適當(dāng)。令fq=0.5% × β、1% × β、2% × β(β 為所有行人圖像個(gè)數(shù)),即fq的選擇與圖像的個(gè)數(shù)有關(guān),圖像越多則fq取值越大,這是符合實(shí)際的??紤]到ETHZ 數(shù)據(jù)集共有8 000 多張圖像、VIPeR 數(shù)據(jù)集共有1 264 張圖像、i-LIDS 數(shù)據(jù)集共有479 張圖像,為提高系統(tǒng)的普適性本文選取β=1000 進(jìn)行實(shí)驗(yàn),即 fq=5、10、20。定義函數(shù) g(fq),使得g(fq)=max(f(f(nos)Pij),則有:
g(fq)是以fq為自變量的函數(shù),其含義是在噪聲頻率最低時(shí)的小塊可得到的最大增益。當(dāng)fq=5 時(shí),g(5) ≈1.124 3,即最大增益值為1.124 3;此時(shí)門限過低,在一些單個(gè)行人圖像數(shù)目較多情況下,會(huì)將一些行人有益特征小塊當(dāng)成噪聲特征小塊。當(dāng)fq=10 時(shí),g(5) ≈1.11,即最大增益值為1.11,此時(shí)衰減合適,能較好滿足系統(tǒng)要求;當(dāng)fq=20 時(shí),g(5) ≈1.104,即最大增益值為1.104,此時(shí)衰減過于緩慢,當(dāng)噪聲頻率較大時(shí),不能有效抑制噪聲特征小塊。因此本文選擇fq=10,此時(shí)函數(shù)f設(shè)定為:
當(dāng)fq=5、10、20 時(shí),函數(shù)f隨自變量f(nos)Pij變化如圖4 所示??梢钥闯?,本文提出的低通函數(shù)f 在定義域是單調(diào)遞減,且迅速衰減趨于0 的。在噪聲頻率低于截止頻率時(shí),特征小塊得到適當(dāng)增益;而在噪聲頻率高于截止頻率時(shí),特征小塊又得到快速衰減,這說明本文的函數(shù)符合低通濾波處理要求。
圖4 濾波函數(shù)f隨自變量f(nos)Pij變化Fig.4 Filtering function f varying with f(nos)Pij
小塊權(quán)重處理 行人圖像的小塊Pij經(jīng)過低通濾波處理后得到的該小塊的權(quán)重為:
經(jīng)過計(jì)算得到行人圖像中小塊權(quán)重WP為:
行人間相似度 經(jīng)過前面的步驟計(jì)算出行人圖像P各個(gè)小塊的權(quán)重值,利用Zhao 等[16]的方法查找行人圖像Q 中與圖像P中對(duì)應(yīng)的小塊,并計(jì)算小塊間的相似度,再乘以該小塊的權(quán)重,累計(jì)小塊間的距離即為2行人圖像間的相似度。
其中:D(P,Q)為圖像P 和Q 間的相似度,Qab為利用Zhao 等[16]的方法查找出的圖像P中小塊Pij在圖像Q中的對(duì)應(yīng)小塊。
Schwartz 等[17]首先將ETHZ 數(shù)據(jù)集用于行人再識(shí)別研究。在ETHZ 數(shù)據(jù)集中,共有ETHZ1、ETHZ2 和ETHZ3 三個(gè)數(shù)據(jù)庫,這三個(gè)數(shù)據(jù)庫中分別有83、35 和28 個(gè)行人以及4 875、1 936 和1 762 張圖片。ETHZ 數(shù)據(jù)集中的行人圖像大小不一,實(shí)驗(yàn)時(shí)需要先將所有圖像標(biāo)準(zhǔn)化為128×64像素。
VIPeR 數(shù)據(jù)集[18]是在學(xué)校中采集的,包含632 個(gè)行人,每個(gè)行人有2 張圖像。每個(gè)行人的圖像都來自2 個(gè)不同的攝像頭,因此該數(shù)據(jù)集的視角變化比較明顯。此外,該數(shù)據(jù)集的行人圖像姿態(tài)和光照變化比較顯著。同樣地,也需將所有圖像標(biāo)準(zhǔn)化為128×64像素。
I-LIDS 數(shù)據(jù)集是由Zheng 等[19]在i-LIDS 視頻數(shù)據(jù)集基礎(chǔ)上發(fā)布的。該數(shù)據(jù)集在機(jī)場(chǎng)大廳采集,其中的行人圖像由多個(gè)不同角度的攝像頭所拍攝,共有119 個(gè)行人479 張圖像,每張圖像也將被標(biāo)準(zhǔn)化為128×64 像素。該數(shù)據(jù)集的大部分行人圖像都存在遮擋的情況。
評(píng)價(jià)行人再識(shí)別算法的性能通常采用累計(jì)匹配特性曲線(Cumulative Match Characteristic,CMC)衡量。在CMC 中,曲線值表示前k個(gè)可能匹配行人結(jié)果里包含目標(biāo)行人的概率。
在實(shí)驗(yàn)中,利用文獻(xiàn)[16]中提到的顯著性特征和顏色直方圖來表示行人圖像的特征,對(duì)應(yīng)的算法稱為顯著性特征的低通濾波方法和顏色特征的低通濾波方法。其中顏色直方圖用RGB(Red,Green,Blue)和HSV顏色空間表征,每個(gè)顏色通道都單獨(dú)提取一個(gè)8間隔(bin)的直方圖特征。
選取β 個(gè)行人的圖像來進(jìn)行實(shí)驗(yàn),取β=90,150。當(dāng)β=90 時(shí),結(jié)果如圖5(a)所示。從圖中可以看出,當(dāng)dq=dq′時(shí),大多數(shù)小塊的噪聲頻率都很高,即大多數(shù)小塊都會(huì)被認(rèn)為是噪聲特征,說明此時(shí)小塊相似度閾值設(shè)置過大;當(dāng)dq=dq′/2時(shí),噪聲頻率大于10 的特征塊數(shù)與小于10 的數(shù)近似相等,而實(shí)際中噪聲特征只是占很少一部分,因此說明此時(shí)小塊相似度閾值還是過大;當(dāng)dq=dq′/3 時(shí),特征塊的噪聲頻率大多在10 以下,同時(shí)有少部分噪聲特征的頻率在10 以上,這是符合實(shí)際噪聲分布的;而當(dāng)dq=dq′/4 時(shí),特征塊的噪聲頻率只有極少數(shù)是大于等于10 的,這與實(shí)際噪聲分布不符。因此,當(dāng)β=90時(shí)可以選取dq=dq′/3作為小塊相似度閾值。
當(dāng)β=150 時(shí),噪聲頻率和行人特征塊數(shù)目關(guān)系如圖5(b)所示。從圖可以看出,噪聲頻率和特征塊數(shù)目的關(guān)系和β=90時(shí)二者的關(guān)系基本相似。
綜上,本文選取dq=dq′/3作為小塊相似度閾值。
圖5 β為90或150時(shí),噪聲頻率和特征塊數(shù)的關(guān)系Fig.5 Relationship between noise frequency and the number of feature blocks when β is 90 or 150
下面對(duì)本文算法與常見行人再識(shí)別算法在數(shù)據(jù)集上的識(shí)別效果進(jìn)行比較。其中,SDALF 方法[7]、曾明勇方法[5]、范彩霞方法[8]分別如前所述,而eSDC_knn 和eSDC_ocsvm 為Zhao等[16]根據(jù)不同的訓(xùn)練方法提出的兩種不同的方法。為減少偶然性,每次實(shí)驗(yàn)進(jìn)行10次取均值作為最終結(jié)果。
首先,為了驗(yàn)證前文選取的截止頻率fq和小塊相似度閾值dq的有效性,本文在ETHZ 數(shù)據(jù)集上對(duì)不同選值所能達(dá)到的識(shí)別精度分別進(jìn)行了測(cè)試。實(shí)驗(yàn)中,將ETHZ數(shù)據(jù)集3個(gè)子庫融合為一個(gè),在其他參數(shù)不變的情況下,本算法所得到的實(shí)驗(yàn)結(jié)果如圖6 和圖7 所示,結(jié)果表明,前述的fq和dq取值是符合預(yù)期的。
圖6 不同fq取值下的識(shí)別精度Fig.6 Identification accuracy with different fq
圖7 不同dq取值下的識(shí)別精度Fig.7 Identification accuracy with different dq
幾種常見算法在ETHZ 數(shù)據(jù)集上的累積匹配特性曲線如圖8 所示。從圖中可以看出本文算法的識(shí)別結(jié)果好于常見的算法。在排名等級(jí)為1(k=1)時(shí),在幾種方法中顯著性特征的低通濾波算法識(shí)別率最高,達(dá)到了84%,高于eSDC_knn 的82%和eSDC_ocsvm 的81%,同時(shí)顯著性特征的低通濾波器比經(jīng)典的SDALF 方法提高了近20%,而簡(jiǎn)單的顏色直方圖特征低通濾波方法相比SDALF 方法也有近15% 的提高,與eSDC_ocsvm 相當(dāng)。這對(duì)于實(shí)際應(yīng)用是十分重要的,因?yàn)樾腥嗽僮R(shí)別就是在多個(gè)行人中查詢出目標(biāo)行人。由于ETHZ 數(shù)據(jù)集比較簡(jiǎn)單,遮擋和背景干擾較少,不能很好地體現(xiàn)本文算法的優(yōu)越性,而接下來存在遮擋和背景干擾較多的VIPeR 和i-LIDS數(shù)據(jù)集,可以進(jìn)一步展現(xiàn)本文算法的優(yōu)勢(shì)。
圖8 幾種算法在ETHZ數(shù)據(jù)集上的累積匹配特性曲線Fig.8 Cumulative matching characteristic curves of several algorithms on ETHZ dataset
VIPeR數(shù)據(jù)集比ETHZ數(shù)據(jù)集復(fù)雜得多,因?yàn)樵摂?shù)據(jù)集中的行人圖像視角、姿態(tài)和光照變化比較明顯。實(shí)驗(yàn)結(jié)果如圖9 所示,從圖中可以看出本文算法在該數(shù)據(jù)上的優(yōu)勢(shì)比較明顯。在排序等級(jí)為1 時(shí),本文的2 種算法識(shí)別率是最高的,其中顯著性特征的低通濾波方法比SDALF 方法有了近22%的提升,比其他幾種方法也有近15%的提升。排名等級(jí)為5 的識(shí)別率也是很重的,因?yàn)樵诂F(xiàn)實(shí)應(yīng)用中,為了提高最終識(shí)別精度,通常要令機(jī)器先給出排名靠前的幾張行人圖像,然后再人工選取出目標(biāo)圖像。而在排名等級(jí)為5 時(shí),本文的算法對(duì)幾種經(jīng)典算法性能也有著顯著的提升,顯著性特征的低通濾波算法對(duì)SDALF 方法有著近25%的提升;對(duì)范彩霞和曾明勇的方法也有著近5% 和13% 的提升;與本文方法相近的eSDC_knn和eSDC_ocsvm相比,更有近15%和10%的提升。
圖9 幾種算法在VIPeR數(shù)據(jù)集上的累積匹配特性曲線Fig.9 Cumulative matching characteristic curves of several algorithms on VIPeR dataset
i-LIDS 數(shù)據(jù)集中遮擋物較多,這是其他數(shù)據(jù)集中所沒有的,雖然這更加符合實(shí)際情況,但也增加了識(shí)別難度。本文的算法主要解決的是遮擋和背景的干擾問題,因此在該數(shù)據(jù)集可以明顯體現(xiàn)出本文算法的優(yōu)勢(shì)。該數(shù)據(jù)集上的識(shí)別結(jié)果如圖10 所示,圖中清晰地展示了本文算法比其他算法的優(yōu)勢(shì),特別是本文提出的顯著性特征的低通濾波方法。排序等級(jí)為1 時(shí),顯著性特征低通濾波算法優(yōu)勢(shì)明顯,比eSDC_knn 提高了近20%,比eSDC_ocsvn 提高了近15%;而顏色直方圖特征低通濾波算法識(shí)別率也明顯高于其他算法。當(dāng)排序等級(jí)大于8時(shí),本文的2種算法識(shí)別率均高于其他算法。
圖10 幾種算法在i-LIDS數(shù)據(jù)集上的累積匹配特性曲線Fig.10 Cumulative matching characteristic curves of several algorithms on i-LIDS dataset
為了進(jìn)一步驗(yàn)證本文算法在遮擋和背景干擾下的效果,研究中把i-LIDS 數(shù)據(jù)集上由于行人視角、姿態(tài)和光照方面的變化,存在大的光照變化和遮擋影響的95 個(gè)人的348 張圖像單獨(dú)制作成一個(gè)數(shù)據(jù)集,并在該數(shù)據(jù)集上對(duì)本文算法進(jìn)行了測(cè)試。此時(shí)的測(cè)試結(jié)果如圖11 所示。可以看出,雖然由于圖像變差導(dǎo)致幾種算法的識(shí)別精度均有所下降,但本文算法仍取得了相對(duì)較高的識(shí)別率。
上述3 個(gè)數(shù)據(jù)集是行人再識(shí)別中比較常用的,如果某個(gè)算法能對(duì)這3 個(gè)數(shù)據(jù)集都能取得較好的識(shí)別結(jié)果,則可以說明該算法能較好地解決行人再識(shí)別問題。本文的行人再識(shí)別算法在上述3 個(gè)數(shù)據(jù)集中都取得了較好的識(shí)別結(jié)果,這在一定程度上說明了本文算法的優(yōu)越性和實(shí)用價(jià)值性。實(shí)驗(yàn)結(jié)果還證明本文算法比其他經(jīng)典算法識(shí)別率更高,更能適應(yīng)實(shí)際應(yīng)用的需求。
圖11 幾種算法在修剪的i-LIDS數(shù)據(jù)集上的累積匹配特性曲線Fig.11 Cumulative matching characteristic curves of several algorithms on modified i-LIDS dataset
行人再識(shí)別技術(shù)在實(shí)際生活中的重要作用,已經(jīng)引起了廣泛的關(guān)注。理想中的行人再識(shí)別可以實(shí)現(xiàn)類似《速度與激情》中的“天眼”系統(tǒng)、《碟中諜》中根據(jù)行人圖像查詢特定的目標(biāo)那樣的功能。然而現(xiàn)階段遮擋和背景的干擾是行人再識(shí)別研究的難點(diǎn)和熱點(diǎn)之一,針對(duì)這一問題,本文提出了基于低通濾波的行人再識(shí)別方法。通過利用背景和噪聲出現(xiàn)在行人圖像中的頻率較高這一特征,結(jié)合改進(jìn)的低通濾波算法,可以有效降低遮擋和背景的干擾。通過在常見的行人再識(shí)別數(shù)據(jù)集上進(jìn)行驗(yàn)證,本文算法達(dá)到了比現(xiàn)有算法更好的識(shí)別效果。在接下來的研究中,可以考慮在大數(shù)據(jù)背景下提升行人再識(shí)別技術(shù)的實(shí)時(shí)性,這將是該技術(shù)真正應(yīng)用于實(shí)際的重要因素。