鄭天宇, 王 年, 唐 俊
(安徽大學(xué) 電子與信息工程學(xué)院,安徽 合肥 230601)
基于ICF和多級(jí)分類器的交通標(biāo)志檢測(cè)*
鄭天宇, 王 年, 唐 俊
(安徽大學(xué) 電子與信息工程學(xué)院,安徽 合肥 230601)
針對(duì)傳統(tǒng)的基于積分通道特征(ICF)和Adaboost交通標(biāo)志檢測(cè)算法,召回率過低和誤檢率過高的問題,提出了一種兩階段交通標(biāo)志檢測(cè)方法。第一階段對(duì)ICF進(jìn)行譜聚類并結(jié)合Adaboost算法學(xué)習(xí)得到目標(biāo)感興趣區(qū)域(ROI);第二階段對(duì)所獲得的感興趣區(qū)域進(jìn)行直方圖均衡化,利用尺度不變特征變換(SIFT)描述子與支持向量機(jī)(SVM)分類器相結(jié)合,提高了目標(biāo)區(qū)域檢測(cè)的準(zhǔn)確性。通過德國(guó)交通標(biāo)志數(shù)據(jù)集(GTSDB)的驗(yàn)證,結(jié)果表明:采用SICF-Adaboost +SIFT-SVM構(gòu)建的交通標(biāo)志級(jí)聯(lián)分類器檢測(cè)算法相對(duì)于傳統(tǒng)的ICF-Adaboost算法召回率高且誤檢率低,適用于真實(shí)場(chǎng)景下的交通標(biāo)志檢測(cè)。
交通標(biāo)志檢測(cè); 形狀分類器; 譜聚類; 積分通道特征; 感興趣區(qū)域
作為輔助駕駛系統(tǒng)中重要組成部分,交通標(biāo)志識(shí)別能夠給司機(jī)提供關(guān)于道路安全的預(yù)警信息。道路交通標(biāo)志識(shí)別主要涉及兩個(gè)問題:交通標(biāo)志檢測(cè)和交通標(biāo)志分類。標(biāo)志檢測(cè)意味著在輸入圖像空間中準(zhǔn)確定位交通標(biāo)志,而標(biāo)志分類是將其劃分到特定的交通標(biāo)志子類型中。因此,標(biāo)志檢測(cè)是標(biāo)志識(shí)別的前提和基礎(chǔ)。
交通標(biāo)志由于具有顏色和形狀信息便于人們?cè)诘缆方煌ōh(huán)境中將其與周圍的背景區(qū)分開。在顏色特征識(shí)別,主要指基于不同顏色空間的閾值分割方法將感興趣的顏色分割出來,包括RGB空間,HSV空間,HSI空間等?;谛螤畹姆椒ò℉ough變換和Zernike不變矩。文獻(xiàn)[1]采用由粗到精的滑動(dòng)窗口方案,即先通過小尺度窗口粗略地檢測(cè)交通標(biāo)志圖像得到感興趣區(qū)域(region of interest,ROI),然后再通過大尺度窗口對(duì)目標(biāo)ROI進(jìn)行精檢。文獻(xiàn)[2]利用顏色概率模型將源圖像轉(zhuǎn)換成概率圖,并在概率圖上運(yùn)用區(qū)域特征提取(MSER)算法得到ROI,最后結(jié)合積分通道特征檢測(cè)器進(jìn)行精檢以提高檢測(cè)準(zhǔn)確率。文獻(xiàn)[3]結(jié)合聚類特征和Adaboost算法對(duì)車輛進(jìn)行檢測(cè),并通過采用多分辨率模型提升檢測(cè)率。基于此,本文提出了一種兩階段的交通標(biāo)志譜檢測(cè)方法,包括SICF檢測(cè)器階段和SVM形狀分類器階段。
1.1 ICF
ICF由Dollar P等人在2009年提出[4],從特征描述的角度來探討解決問題的可能性。ICF是通過積分圖對(duì)輸入圖像的各種通道特征進(jìn)行快速計(jì)算。典型通道類型包括強(qiáng)度、顏色、積分直方圖、梯度直方圖、線性濾波和非線性濾波。本文只考慮一階特征,即對(duì)給定通道上矩形框內(nèi)所有像素的像素值進(jìn)行求和運(yùn)算。首先通過隨機(jī)選取通道類型和矩形框的大小產(chǎn)生一個(gè)候選特征池,然后結(jié)合Boosting算法和軟級(jí)聯(lián)分類器學(xué)習(xí)選擇這些特征。采用LUV顏色空間、梯度直方圖、梯度大小的組合作為通道特征。GTSDB數(shù)據(jù)庫(kù)上“限速20”的通道類型選擇如圖1所示。交通標(biāo)志的ICF計(jì)算流程如下:
1)對(duì)輸入圖像創(chuàng)建10個(gè)和源圖像相同大小的浮點(diǎn)矩陣,即通道類型。
2)對(duì)源圖像進(jìn)行灰度轉(zhuǎn)換,并分別計(jì)算灰度圖像的梯度方向和梯度幅值。
3)將梯度方向分別離散化到6個(gè)區(qū)間,通過梯度幅值分別向6個(gè)方向通道進(jìn)行投票。
4)對(duì)梯度幅值進(jìn)行復(fù)制并創(chuàng)建幅值通道特征,同時(shí)計(jì)算LUV通道特征。
5)分別對(duì)這10個(gè)通道進(jìn)行積分操作,并輸出最終的ICF。
圖1 交通標(biāo)志圖像的通道類型選擇示例
1.2 特征聚類
交通標(biāo)志本身一般都含有大量的類內(nèi)變化,這給交通標(biāo)志檢測(cè)帶來了挑戰(zhàn)。本文對(duì)訓(xùn)練數(shù)據(jù)的顏色和梯度特征進(jìn)行聚類,通過聚類學(xué)習(xí)得到一個(gè)整體的模型[5],可以有效地處理物體遮擋以及方向變化等造成的問題。采用的譜聚類算法具體過程描述如下:
輸入:數(shù)據(jù)樣本集,尺度參數(shù)集, 聚類個(gè)數(shù)K;
輸出:聚類結(jié)果。
1)獲取給定訓(xùn)練樣本的ICF特征描述子,然后選取高斯核函數(shù)計(jì)算任意樣本數(shù)據(jù)xi和xj之間的相似度并得到相似度矩陣W∈Rm×n,Wij=exp(-‖xi-xj‖2/2σ2)為相似度矩陣中的元素,其中,σ為尺度參數(shù)。
2)根據(jù)度矩陣D來構(gòu)建標(biāo)準(zhǔn)化圖拉普拉斯矩陣L=D-1/2WD-1/2,其中度矩陣D是由相似性矩陣Wij計(jì)算得到,即將Wij的每一列元素相加得到的數(shù)作為度矩陣主對(duì)角線元素(其他位置上的元素均等于0)。
3)對(duì)矩陣L進(jìn)行特征值分解,并計(jì)算前k個(gè)特征值對(duì)應(yīng)的特征向量,得到矩陣X=[x1,x2,x3,…,xk]。
5)將矩陣Y中的每一行看作為k維空間中的一個(gè)向量,并應(yīng)用c-means經(jīng)典聚類算法對(duì)訓(xùn)練樣本的ICF向量進(jìn)行聚類,并輸出聚類結(jié)果。
1.3 基于譜聚類特征的SICF檢測(cè)器實(shí)現(xiàn)
針對(duì)自適應(yīng)譜聚類后的ICF,本文運(yùn)用Adaboost算法[6]學(xué)習(xí)一個(gè)2層決策樹進(jìn)行分類判別,其中每個(gè)節(jié)點(diǎn)是一個(gè)簡(jiǎn)單的樹樁分類器。樹樁分類器由矩形區(qū)域,通道類型和閾值共同決定。通過不斷增加弱分類器的數(shù)量來執(zhí)行4個(gè)回合(32,128 ,512 ,2 048)的訓(xùn)練,訓(xùn)練完成后將若干個(gè)不同的弱分類器進(jìn)行線性加權(quán)組合得到最終的強(qiáng)分類器。訓(xùn)練開始時(shí),有5 000個(gè)正樣本和5 000個(gè)負(fù)樣本,在每個(gè)回合中將較難分類的負(fù)樣本再加入到負(fù)樣本訓(xùn)練集中重新進(jìn)行訓(xùn)練。由于樹樁的數(shù)目比較大,采用隨機(jī)抽樣子集訓(xùn)練分類器,最后該特征池隨機(jī)抽樣總共產(chǎn)生30 000個(gè)候選矩陣。
為了達(dá)到較高的檢測(cè)準(zhǔn)確率,需要在第一階段提取目標(biāo)ROI中保持較高的召回率。這使得提取后的ROI中包含大量的假陽(yáng)性區(qū)域。為了濾除這些假陽(yáng)性區(qū)域,結(jié)合交通標(biāo)志規(guī)則的形狀信息并運(yùn)用SVM訓(xùn)練形狀分類器,在第二階段將形狀不規(guī)則的干擾區(qū)域排除,以進(jìn)一步去除誤檢標(biāo)志。
2.1 直方圖均衡化處理
在自然環(huán)境中,由于存在光照強(qiáng)度不同、霧霾天氣等因素的影響,導(dǎo)致第一階段提取的ROI存在亮度過低或者背景與前景對(duì)比不明顯的交通標(biāo)志圖像,所以,需要對(duì)候選ROI進(jìn)行直方圖均衡化的預(yù)處理操作[7],通過擴(kuò)大圖像中背景與前景灰度值的差別以提高圖像對(duì)比度,從而獲得更清晰的圖像輪廓,其結(jié)果如圖2所示。
2.2SIFT-SVM去除誤檢
基于尺度空間的SIFT[8],對(duì)圖像尺度縮放,空間旋轉(zhuǎn),光照強(qiáng)度變化以及仿射變換都具有很強(qiáng)的魯棒性。SIFT已經(jīng)被證明是目前匹配性能最好的方法之一。通過檢測(cè)尺度空間極值準(zhǔn)確定位關(guān)鍵點(diǎn)的位置,這些關(guān)鍵點(diǎn)通常包含進(jìn)行特征匹配的重要信息。本文選取SVM作為分類器,通過非線性映射將輸入空間向量x映射到高維空間中,在高維空間中確定能夠正確劃分?jǐn)?shù)據(jù)集的最優(yōu)決策函數(shù)。在第二階段使用SVM形狀分類器的目的是有效地去除在第一階段被錯(cuò)誤地認(rèn)為是交通標(biāo)志的區(qū)域。SIFT局部描述子與SVM分類器的結(jié)合可以有效地去除誤檢[9]。訓(xùn)練階段,從正負(fù)樣本中提取128維的SIFT局部特征描述子,然后將提取后的SIFT局部特征送入線性SVM分類器中進(jìn)行訓(xùn)練。檢測(cè)階段,提取待檢測(cè)樣本的SIFT特征,然后將其傳遞到訓(xùn)練好的SVM二分類器中。如果輸入為正樣本,則輸出為+1;反之,則輸出為-1。
2.3 形狀分類器設(shè)計(jì)
本文建立4個(gè)形狀(三角形、倒三角形、圓形、菱形)分類器。4個(gè)分類器訓(xùn)練結(jié)束后,每一個(gè)輸入ROI的局部特征描述子在這4個(gè)分類器上都有一個(gè)輸出結(jié)果。如果待輸入的區(qū)域?yàn)榻煌?biāo)志,則輸出為1;否則,為-1。然后,對(duì)這4個(gè)輸出結(jié)果進(jìn)行投票選擇,即將輸出結(jié)果相加。只有當(dāng)投票結(jié)果為-2時(shí),表示4個(gè)分類器中有一個(gè)輸出為1,即輸入的ROI屬于這個(gè)分類器的形狀,而其他3個(gè)形狀分類器的輸出結(jié)果都為-1,不屬于其余3個(gè)分類器時(shí),才判定為交通標(biāo)志;其它的情況將判定為噪聲區(qū)域,并將其濾除。
3.1 實(shí) 驗(yàn)
本文采用的是GTSDB。在第一階段ICF檢測(cè)器的訓(xùn)練中,正樣本選取的是GTSDB中的600張交通標(biāo)志圖像,每張圖像為1 360像素×800像素;負(fù)樣本選取Inria行人數(shù)據(jù)庫(kù)中1 300張圖像。在第二階段4種形狀分類器的訓(xùn)練中,正樣本選取來自GTSRB中4×500張交通標(biāo)志圖像,其中每個(gè)形狀的樣本數(shù)為500;負(fù)樣本選取Inria行人數(shù)據(jù)庫(kù)中500張圖像。本文采用有監(jiān)督學(xué)習(xí),將正樣本標(biāo)簽置為1,負(fù)樣本標(biāo)簽置為-1。 這樣對(duì)于每一個(gè)分類器都有2 500張訓(xùn)練樣本(正樣本500張、負(fù)樣本2 000張)。訓(xùn)練前需要對(duì)每張圖像進(jìn)行歸一化處理,每張圖像被調(diào)整為64像素×64像素。測(cè)試圖像選取GTSDB測(cè)試集,均為自然環(huán)境下高速公路和城市道路上采集的圖像,共300幅。訓(xùn)練測(cè)試流程圖如圖3所示。
圖3 訓(xùn)練測(cè)試流程
用于交通標(biāo)志檢測(cè)器性能評(píng)價(jià)的實(shí)驗(yàn)平臺(tái)為戴爾工作站,其主要配置為:Intel(R)Core(TM) i7-3770 CPU @ 3.40 GHz的處理器,8 G內(nèi)存,操作系統(tǒng)為Windows 7,編程軟件為Matlab 2015a。
3.2 實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證本文提出算法的有效性,在采用相同的訓(xùn)練樣本和測(cè)試樣本情況下,分別采用ICF-Adaboost[4],SICF-Adaboost[3],SICF-Adaboost+SIFT-SVM(下面分別稱為算法一、算法二和本文算法)3種不同的算法,進(jìn)行對(duì)比實(shí)驗(yàn)。選取分類器檢測(cè)率RD和誤檢率RF作為評(píng)價(jià)指標(biāo),其中RD=Tp/Ap,RF=Fp/As,Tp為正確識(shí)別交通標(biāo)志數(shù);Ap為總交通標(biāo)志數(shù);Fp為錯(cuò)誤識(shí)別交通標(biāo)志數(shù);As為總樣本數(shù)。
3種不同算法在GTSDB測(cè)試數(shù)據(jù)集上的標(biāo)志檢測(cè)結(jié)果分別如表1所示??梢钥闯?在檢測(cè)率方面算法二低于算法一。因?yàn)镾ICF-Adaboost算法在訓(xùn)練之前對(duì)訓(xùn)練數(shù)據(jù)的ICF特征進(jìn)行譜聚類能夠有效提高檢測(cè)率。將本文算法與算法二進(jìn)行比較可知,檢測(cè)率相同,但是本文算法誤檢率小于算法二。這是由于本文算法增加了基于SVM的形狀分類器設(shè)計(jì)階段,對(duì)第一階段的候選目標(biāo)區(qū)域進(jìn)行了精檢,有效地降低了誤檢率。測(cè)試所用的圖像分辨率為1 360像素×800像素。圖4分別給出了3種不同算法的ROC曲線圖,從中可以看出:基于SICF-Adaboost+SIFT-SVM檢測(cè)算法有著最佳的交通標(biāo)志檢測(cè)效果。圖5為本文算法在復(fù)雜場(chǎng)景下的檢測(cè)結(jié)果,其中正確檢測(cè)到的交通標(biāo)志用矩形框框出。
表1 交通標(biāo)志檢測(cè)結(jié)果
圖4 3種算法的ROC曲線
圖5 不同實(shí)景下的交通標(biāo)志檢測(cè)結(jié)果示例
為了解決傳統(tǒng)基于ICF-Adaboost交通標(biāo)志檢測(cè)算法檢測(cè)率過低的問題,提出了SICF-Adaboost+SIFT-SVM兩階段的級(jí)聯(lián)分類器。實(shí)驗(yàn)結(jié)果表明:本文算法能夠正確確定標(biāo)志位置并將其切割出來,同時(shí),對(duì)光照、天氣變化等因素帶來的影響有較好的抑制作用。另外,對(duì)比4種形狀類別的檢測(cè)結(jié)果,發(fā)現(xiàn)倒三角形的檢測(cè)率較低,如何提高倒三角形交通標(biāo)志的檢測(cè)率,將是下一步研究工作的重點(diǎn)。
[1] Wang G,Ren G,Wu Z,et al.A robust,coarse-to-fine traffic sign detection method[C]∥International Joint Conference on Neural Networks,IEEE,2013:1-5.
[2] Yang Y,Wu F.Real-time traffic sign detection via color probabi-lity model and integral channel features[C]∥Pattern Recogni-tion,2014:545-554.
[3] Ohn-Bar E,Trivedi M M.Learning to detect vehicles by cluste-ring appearance patterns[J].IEEE Transactions on Intelligent Transportation Systems,2015,16(5):2511-2521.
[4] Dollár Piotr,Tu Zhuowen,Perona Pietro,et al.Integral channel features[C]∥Proceedings of 2009 British Machine Vision Conference,BMVC 2009,London,UK,2009.
[5] 李文杰,廖曉緯,束仁義,等.基于ZigBee和模糊C均值聚類方法在火警中的應(yīng)用[J].傳感器與微系統(tǒng),2012,31(10):143-145.
[6] Fleyeh H,Biswas R,Davami E.Traffic sign detection based on AdaBoost color segmentation and SVM classification[C]∥Eurocon,IEEE,2013:2005-2010.
[7] Pizer S M,Amburn E P,et al.Adaptive histogram equalization and its variations [J].Computer Vision Graphics & Image Processing,1987,39(3):355 -368.
[8] 王程冬,程筱勝,崔海華,等.SIFT算法在點(diǎn)云配準(zhǔn)中的應(yīng)用[J].傳感器與微系統(tǒng),2012,31(2):149-152.
[9] Moranduzzo T,Melgani F.A SIFT-SVM method for detecting cars in UAV images[C]∥Geoscience and Remote Sensing Symposium,IEEE,2012:6868 -6871.
Traffic signs detection based on ICF and multi-class classifier*
ZHENG Tian-yu, WANG Nian, TANG Jun
(School of Electronics & Information Engineering,Anhui University,Hefei 230601,China)
Aiming at problem of low recall rate and high error rate of traditional traffic sign detection algorithm based on integral channel feature(ICF) and Adaboost,propose a two-stage traffic sign detection method.In the first stage,using spectral clustered integral channel features obtained by spectral clustering are combined with Adaboost to learn the overall detection model,which is applied to the input image to obtain region of interest(ROI).In the second stage,histogram equalization is imposed on ROI,and then a shape classifier using support vector machine(SVM) is employed to filter candidate object regions obtained in the former stage to remove the false positives.Experimental results show that the proposed SICF-Adaboost +SIFT-SVM detection algorithm method built upon a cascade classifier framework possesses higher detection rate compared with the traditional ICF Adaboost detect algorithm in dealing with high light intensity,motion blur,fog,and noisy similar object,which is suitable for traffic sign detection in real-world scenes.
traffic sign detection; shape classifier; spectral clustering ; integral channel feature(ICF); region of interest(ROI)
2017—01—19
國(guó)家自然科學(xué)基金資助項(xiàng)目(61172127); 安徽省自然科學(xué)基金資助項(xiàng)目(1508085MF120)
10.13873/J.1000—9787(2017)06—0134—04
TP 391
A
1000—9787(2017)06—0134—04
鄭天宇(1992-),男,碩士研究生,研究方向?yàn)闄C(jī)器學(xué)習(xí)與模式識(shí)別,E—mail:780876068@qq.com。
王 年(1966-),男,教授,博士生導(dǎo)師,主要從事數(shù)字信號(hào)處理工作。