陳 都,王 雷,方天宇
(南京理工大學(xué) 電子工程與光電技術(shù)學(xué)院,南京 210094)
為解決盲人出行安全問題,我國在大部分城鎮(zhèn)均鋪設(shè)了盲道,但由于非法占用及盲道本身設(shè)計不合理等諸多因素,導(dǎo)致電子導(dǎo)盲設(shè)備識別率低、大部分盲道沒有實現(xiàn)對應(yīng)功能。本文利用現(xiàn)有盲道特征和盲道導(dǎo)航系統(tǒng),提出了一種基于顏色紋理和SVM的盲道分割算法。目前,盲道分割算法主要分為基于顏色、基于紋理兩類。以閾值分割和區(qū)域生長等為代表的基于顏色的分割方法[1]效率高,能相對較好地實現(xiàn)盲道分割,但該方法對顏色及光照強度十分敏感,很多時候由于盲道與背景區(qū)域顏色相近而無法正確分割;基于紋理的分割方法[2]通過提取紋理特征再對其進行聚類,基本不受顏色和光照影響,能夠相對較好地實現(xiàn)盲道分割,但由于針對不同類型盲道得到不同效果圖,所以普遍性不足,且由于采用聚類方法對紋理特征進行分類,在一定程度上增加了處理時間。此外,現(xiàn)有盲道分割算法針對的盲道背景相對單一,雖然極大降低了盲道檢測難度,但與實際盲道背景相差較大,使算法無法很好地應(yīng)用于實際盲道分割。
近年來眾多學(xué)者對盲道分割算法進行了深入研究。如文獻[3]利用基于顏色聚類的分割算法,在盲道與周圍環(huán)境顏色區(qū)別不大、或受光照和陰影等干擾時,其盲道分割效果很差;文獻[4]、[5]利用的是基于紋理的分割算法,雖然基本不受光照和陰影影響,但是對不同類型的盲道很難得到理想的分割效果,普適性差。因此本文設(shè)計了一種基于顏色紋理和SVM的盲道分割算法(CT-SVM),其具有良好的普適性和抗噪性,盲道分割效果較好。
首先通過對多組盲道小塊和非盲道小塊樣本進行分析,提取其中紋理特征,并通過分析其在顏色空間中樣本特征差異,再選取樣本在HSV色彩空間下的特征進行分類訓(xùn)練。最終利用SVN訓(xùn)練模型對輸入圖像進行特征判斷,將盲道從輸入圖像中提取出來。實驗結(jié)果證明,本算法可以準確提取出盲道,具有良好的普適性和抗噪性。
支持向量機(Support Vector Machine,SVM)是由Vapnik等[6]基于結(jié)構(gòu)風(fēng)險最小化原理提出的一種有監(jiān)督的統(tǒng)計學(xué)習(xí)方法。該方法通過尋求結(jié)構(gòu)化最小風(fēng)險,提高學(xué)習(xí)機泛化能力,實現(xiàn)經(jīng)驗風(fēng)險和置信范圍最小化,從而達到在樣本量較少的情況下,亦能獲得良好的統(tǒng)計規(guī)律,其分類原理分為線性可分與線性不可分兩種情況。
假設(shè)有n個線性可分的訓(xùn)練樣本(x1,y1),(x2,y2),…,(xn,yn),yi∈{1,+1},均存在權(quán)向量ω和偏置b,如圖1所示,其滿足:
yi(ωT·xi+b)≥1,i=1,2,…,n
(1)
針對組別相同的訓(xùn)練樣本,能夠使用不同的超平面(Hyperplane)進行劃分。利用SVM進行分類,找到最佳權(quán)重值ω0以及最佳偏置值b0,ω0和b0能對兩類數(shù)據(jù)進行最佳分割,且對測試樣本具備最優(yōu)泛化能力[7]。
實際生活與自然界中很多問題并不是線性的,如圖1(a)所示,故需要通過一種非線性變換(x→z=?(x))把輸入空間X內(nèi)的輸入向量x映射到另一個高維的特征空間F中,令其變成線性可分樣本[8],如圖2(b)所示。
圖1 SVM非線性分類原理圖
在F空間內(nèi),z=?(x)屬于線性可分的情況,故式(1)能夠應(yīng)用于此處,僅需要把x替換為z,即:
(2)
其中,K表示一個非負定對稱函數(shù),即核函數(shù)(Kernelfunction)[9]。K通常能夠取不同的函數(shù)形式,如多項式函數(shù)、高斯函數(shù)、徑向基函數(shù)等。經(jīng)過非線性變換后,二次規(guī)劃[10]則變成對L(α)求解極值,
(3)
與此同時,分類決策函數(shù)變換為:
(4)
其中,
(5)
在使用SVM算法時參照如下步驟:
(1)初始化αi,λ。
(2)Fork= 1,…,itemax執(zhí)行步驟(3)到步驟(7)。
(3)Fori= 1,…,n執(zhí)行步驟(4)到步驟(5)。
(4)假設(shè)一個變量qi:
(6)
(6)對γ,λ進行計算。
(7)
(8)
(7)若滿足k=itemax亦或是γ=γmax,則循環(huán)停止,否則跳轉(zhuǎn)到步驟(2),開始執(zhí)行下個k值。
(8)執(zhí)行后續(xù)計算。
根據(jù)以上SVM原理和分類算法[11],構(gòu)建一個通用二類分類器,并應(yīng)用于在復(fù)雜環(huán)境中的盲道分割。
若使用SVM分類器對盲道進行分割,則需采集盲道區(qū)域的正樣本和非盲道區(qū)域的負樣本。實驗拍攝了100幅現(xiàn)實生活中盲人在盲道上行走的場景圖像,包含了不同類型盲道。如圖2(a)所示,由于圖像上方的盲道特征極不明顯,且干擾項眾多,故綜合考慮后,對拍攝圖像進行預(yù)處理,即將其上方30%舍去,如圖2(b)所示。隨后將50幅圖像作為訓(xùn)練樣本,另外50幅圖像作為測試樣本。從50幅訓(xùn)練圖像中隨機截取大小20*20的盲道小塊以及非盲道小塊各100張作為SVM分類器的正負樣本,其中部分樣本如圖4、圖5所示。在截取正樣本時,盡量保證每種類型的盲道小塊數(shù)量均勻;在截取負樣本時,使非盲道小塊的種類盡可能多樣化。
圖2 圖像示例
圖3 部分盲道小塊(正樣本)
圖4 部分非盲道小塊(負樣本)
在圖像處理中,經(jīng)常使用的顏色空間有RGB空間、Lab空間以及HSV空間。
分別計算盲道小塊和非盲道小塊顏色空間的平均值,對比發(fā)現(xiàn),在各個顏色空間中盲道小塊和非盲道小塊樣本差異較大的是HSV顏色空間[12],故顏色特征選取HSV顏色空間。HSV顏色空間由色調(diào)(Hue)、飽和度(Saturation)、亮度(Value)3個通道構(gòu)成。色調(diào)H代表不同類型的顏色;飽和度S代表顏色深淺;亮度V代表顏色明暗,如圖5所示。
圖5 HSV顏色空間對比
圖6 Gabor濾波器三維結(jié)構(gòu)
現(xiàn)階段紋理特征提取主要分為以下4種[4]:基于統(tǒng)計的方法、基于信號處理的方法、基于結(jié)構(gòu)的方法以及基于模型的方法。本文采用的Gabor變換[13-15]屬于基于信號處理的方法。
通常情況下,實Gabor濾波器[16-17]有兩種類型:正弦型Gabor濾波器以及余弦型Gabor濾波器,分別由正弦函數(shù)及余弦函數(shù)通過調(diào)制二維高斯函數(shù)獲得,其中正弦Gabor濾波器在空域中是奇對稱函數(shù),而余弦Gabor濾波器則為偶對稱函數(shù)。正弦Gabor濾波器與余弦Gabor濾波器的三維示意結(jié)構(gòu)[18]如圖6所示,由圖6可知,Gabor濾波器與簡單細胞的響應(yīng)相似,此外Gabor濾波器的空間域及頻率域局部化性質(zhì)相對較好。
Gabor濾波器組的參數(shù)難以確定。Tan[19]利用譜峰檢測技術(shù)對Gabor濾波器組中心頻率進行自動確定。Li[20]利用免疫遺傳算法確定Gabor濾波器參數(shù)。Jain等[5]提出Gabor濾波器組中心頻率依次是:√2,2√2,4√2,…,(Nc/4)√2周期/圖像寬度,其中Nc表示圖像數(shù)組列寬。本文從生物視覺的角度確定Gabor濾波器參數(shù),更加貼近人的視覺感知系統(tǒng)。通過參考以上Gabor濾波器參數(shù)設(shè)計方法,選取Gabor濾波器組波長為:2.82、5.65、11.31、22.62及45.25,方向角為0°、45°、90°、135°。在Gabor濾波之后進行非線性處理,即將圖像經(jīng)過正弦Gabor及余弦Gabor濾波之后的結(jié)果均取平方,然后進行相加,再對其進行開方運算得到Gabor能量。
分別計算盲道小塊與非盲道小塊樣本的Gabor能量平均值,并對其進行對比。發(fā)現(xiàn)在Gabor濾波器組中,盲道小塊與非盲道小塊樣本差異較大的是波長為2.82,方向角為0°、45°的Gabor濾波器、波長為5.65,方向角為0°、45°的Gabor濾波器以及波長為11.31,方向角為0°、45°的Gabor濾波器。故紋理特征選取波長分別為2.82、5.65、11.31,方向角分別為0°、45°,即總共3個頻率和2個方向角的Gabor濾波器組,如圖7所示。
圖7 波長為2.82的Gabor能量對比
利用SVM分類器訓(xùn)練樣本。首先,分別計算盲道小塊與非盲道小塊樣本特征向量x、y,其特征向量為第二節(jié)中選取的顏色特征和紋理特征的組合,分別是HSV顏色空間的3個特征與波長,分別為2.82、5.65、11.31,方向角分別為0°、45°的Gabor濾波器組的6個特征;然后,將盲道小塊樣本的特征向量x組成正樣本訓(xùn)練集X= [x1,x2,…,xN]T,將非盲道小塊樣本的特征向量y組成負樣本訓(xùn)練集Y= [y1,y2,…,yN]T,其中N表示樣本數(shù);最后,將正樣本集X與負樣本集Y輸入SVM分類器中進行訓(xùn)練,得到SVM訓(xùn)練模型,其中SVM分類器采用的核函數(shù)為多項式函數(shù)。
計算測試圖像的特征向量,即HSV顏色空間的3個特征與波長分別為2.82、5.65、11.31,方向角分別為0°、45°的Gabor濾波器組的6個特征,共9個特征;再將測試圖像每一個像素點的特征向量導(dǎo)入SVM訓(xùn)練模型,對該像素進行分類;最后對分類后的圖像進行二值化,輸出分割后的盲道圖像。
CT-SVM算法步驟如下:
Step1:采集100張盲道正樣本與非盲道負樣本。
Step2:計算盲道正樣本訓(xùn)練集X與非盲道負樣本訓(xùn)練集Y,將其輸入SVM分類器中訓(xùn)練,得到SVM訓(xùn)練模型。
Step3:計算測試圖像的特征向量,將每個像素點的特征向量輸入SVM訓(xùn)練模型中進行分類。
Step4:將分類后的圖像進行二值化,即得到分割后的盲道圖像。
對實際拍攝的盲道圖像進行測試,將文獻[3]、[4]和[5]的測試結(jié)果圖進行對比,其中文獻[3]利用基于顏色的分割算法,文獻[4]、[5]利用基于紋理的分割算法。本實驗的硬件環(huán)境是:Inter Core i3-2310M CPU 2.10GHz,4G內(nèi)存,軟件環(huán)境是Windows 7 + VS2012。實驗結(jié)果如圖8所示。
圖8 各算法的盲道分割結(jié)果
表1列出了各種方法對測試圖像進行計算得到與之對應(yīng)的盲道分割圖消耗的平均運算時間,其中CT-SVM消耗時間相對較少,能夠滿足導(dǎo)盲系統(tǒng)實時性需求。
表1 各算法盲道分割平均時間
本文提出了一種基于顏色紋理和SVM的盲道分割算法(CT-SVM)。通過對SVM理論的研究,在此基礎(chǔ)上,選取了盲道小塊和非盲道小塊的HSV色彩空間顏色特征,將Gabor紋理特征與SVM結(jié)合,對樣本進行訓(xùn)練,隨后利用SVM訓(xùn)練模型對輸入圖像進行特征判斷,最終將盲道從目標區(qū)域中分割出來。從實驗結(jié)果和分析可以看出CT-SVM克服了現(xiàn)有盲道分割算法僅依賴于某一特性的不足,能較準確、快速地將盲道分割出來,具有良好的普適性和抗噪性,可應(yīng)用在電子導(dǎo)盲設(shè)備上,提高盲道利用率。