張麗艷 張偉 龍美芳
摘要:本文針對(duì)三種不同的交通標(biāo)識(shí)(直行、右拐和直行左拐)給出了一種基于SVM識(shí)別方法。該方法首先在分析訓(xùn)練集交通標(biāo)識(shí)圖片特點(diǎn)的基礎(chǔ)上,提取它們的PHOG特征向量并形成矩陣形式;然后提取測(cè)試集交通標(biāo)識(shí)的PHOG特征向量,最后對(duì)測(cè)試集利用SVM根據(jù)PHOG特征對(duì)圖像進(jìn)行識(shí)別;仿真結(jié)果驗(yàn)證了算法的有效性。
關(guān)鍵詞:交通標(biāo)識(shí);塔式梯度直方圖; 支持向量機(jī); 圖像分類(lèi)
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)27-0230-02
1 概述
交通標(biāo)識(shí)識(shí)別技術(shù)是智能交通系統(tǒng)一個(gè)重要方面,而且對(duì)無(wú)人駕駛以及智能車(chē)輛的輔助駕駛系統(tǒng)發(fā)展有積極推動(dòng)作用[1]。常用的交通標(biāo)識(shí)識(shí)別方法主要有兩類(lèi):基于顏色方法和基于模板匹配的方法[2]。基于顏色的方法對(duì)交通標(biāo)志所處的外部環(huán)境要求高,且容易受噪聲影響;基于模板匹配的方法對(duì)惡劣環(huán)境下的識(shí)別有較好的效果,但是其魯棒性差[2]。機(jī)器學(xué)習(xí)則是利用從已知的數(shù)據(jù)樣本學(xué)習(xí),根據(jù)某些特征通過(guò)某些特定的方法,來(lái)對(duì)未知的樣本數(shù)據(jù)進(jìn)行識(shí)別,做出正確判斷[3]。基于塔式梯度直方圖(Pyramid Histogram of Oriented Gradients, PHOG)特征及支持向量機(jī)(Support Vector Machine,SVM)的交通標(biāo)識(shí)自動(dòng)識(shí)別方法就是一種機(jī)器學(xué)習(xí)方法,不同于基于顏色和模板匹配的方法,此方法[4]只需對(duì)圖像進(jìn)行特征提取,然后利用支持向量機(jī)對(duì)提取的特征進(jìn)行學(xué)習(xí)形成分類(lèi)模型,再利用該模型對(duì)交通標(biāo)識(shí)圖像進(jìn)行識(shí)別判斷。
2 PHOG特征的SVM分類(lèi)原理
本文的交通標(biāo)志識(shí)別分類(lèi)算法主要包括訓(xùn)練和測(cè)試兩個(gè)過(guò)程。首先,根據(jù)要分類(lèi)的交通標(biāo)識(shí),建立訓(xùn)練圖像集合,然后對(duì)訓(xùn)練圖像集合的PHOG特征進(jìn)行提取。接著使用SVM對(duì)提取到訓(xùn)練圖像的PHOG特征做訓(xùn)練,構(gòu)成分類(lèi)模型。最后輸入測(cè)試交通標(biāo)識(shí)圖像進(jìn)行測(cè)試,對(duì)測(cè)試圖像集合提取圖像的PHOG特征,使用訓(xùn)練過(guò)程中得到的分類(lèi)模型提取得到的測(cè)試圖像PHOG特征對(duì)交通標(biāo)志圖像來(lái)去識(shí)別分類(lèi)。
2.1 PHOG特征提取
對(duì)于PHOG來(lái)說(shuō),它其實(shí)是一個(gè)向量,這個(gè)向量是用來(lái)空間形狀的,使用PHOG的第一步就是要把圖像的邊緣輪廓提取出來(lái),接下來(lái)就是把提取的圖像輪廓處理分層,在分層時(shí),各個(gè)層都會(huì)把上一層的每一個(gè)小塊依照高和寬再等分成更小的塊,然后分別提取每一塊輪廓點(diǎn)的梯度方向直方圖,其圖像的形狀特征為金子塔[5-6]。正是因?yàn)镻HOG的分層提取和金字塔形狀特征的這些特點(diǎn)使得它抵抗旋轉(zhuǎn)和抵抗噪聲的性能都很強(qiáng),基于PHOG的這些優(yōu)良的特性,現(xiàn)在已經(jīng)廣泛應(yīng)用于圖像的查詢(xún)檢索還有模式識(shí)別等[7],而且效果比較優(yōu)秀和穩(wěn)固。當(dāng)圖像尺寸固定時(shí),PHOG要計(jì)算的是不一樣尺度情況下的特征,然后把這些特征給拼連在一塊就得到了PHOG特征。
2.2 支持向量機(jī)
Vapnik等人在20世紀(jì)60年代提出了支持向量機(jī)的方法[8],該方法能夠在樣本的數(shù)目不是很多的情況下達(dá)到比較滿(mǎn)意的分類(lèi)效果。支持向量機(jī)方法是已經(jīng)知道了訓(xùn)練點(diǎn)的類(lèi)別,進(jìn)而來(lái)求訓(xùn)練點(diǎn)和類(lèi)別它們兩個(gè)之間相應(yīng)的聯(lián)系,可以把訓(xùn)練集按照類(lèi)別區(qū)別開(kāi)來(lái),或者是預(yù)先估計(jì)新的訓(xùn)練點(diǎn)的相對(duì)應(yīng)類(lèi)別[9]。總體上說(shuō)可以把訓(xùn)練集區(qū)別為線(xiàn)性可分和非線(xiàn)性可分兩種。而支持向量機(jī)的主要作用,就是解決這些分類(lèi)問(wèn)題。
若支持向量機(jī)要解決的問(wèn)題為非線(xiàn)性問(wèn)題,可以把非線(xiàn)性問(wèn)題簡(jiǎn)化成線(xiàn)性問(wèn)題,該方法分兩步實(shí)現(xiàn):第一步選用合適的函數(shù)把訓(xùn)練集進(jìn)行某種非線(xiàn)性變換,把非線(xiàn)性問(wèn)題映射到高維的特征空間中去。第二步,對(duì)于高維特征空間,要在其中找出最優(yōu)的分類(lèi)超平面,這個(gè)分類(lèi)超平面其實(shí)是和最初的模式空間中的非線(xiàn)性分類(lèi)面是相對(duì)應(yīng)的。
支持向量機(jī)在處理非線(xiàn)性問(wèn)題時(shí)的非線(xiàn)性空間的映射步驟如下。假設(shè)該非線(xiàn)性映射如式(1)所示。
公式(2)的作用就是把問(wèn)題從高維的非線(xiàn)性轉(zhuǎn)化為低維的線(xiàn)性。而這個(gè)轉(zhuǎn)化是經(jīng)過(guò)原來(lái)空間的函數(shù)內(nèi)積的運(yùn)算完成。所以依據(jù)泛函數(shù)的相關(guān)性理論來(lái)說(shuō),若要有某一空間的內(nèi)積與內(nèi)積函數(shù)相對(duì)應(yīng),我們只需找出一種內(nèi)積函數(shù)[Kxi,xj]滿(mǎn)足Mercer定理就能夠在不增加計(jì)算難度的基礎(chǔ)上來(lái)實(shí)現(xiàn)。
總結(jié)來(lái)說(shuō),支持向量機(jī)其實(shí)就是一種求最優(yōu)分類(lèi)面的算法,只不過(guò)是在經(jīng)過(guò)非線(xiàn)性空間變換之后,在變換之后的空間中去求這個(gè)最優(yōu)分類(lèi)面。
3 本文算法仿真及結(jié)果分析
3.1 算法實(shí)現(xiàn)步驟
(1) 首先第一步要讀入交通標(biāo)識(shí)圖像樣本庫(kù)中用來(lái)訓(xùn)練的交通標(biāo)識(shí)圖像,即讀入每種交通標(biāo)識(shí)前5個(gè)圖像,接下來(lái)對(duì)讀入的交通標(biāo)識(shí)訓(xùn)練圖像進(jìn)行處理,也即提取訓(xùn)練圖像的PHOG特征。
(2) 接下來(lái)在上一步提取交通標(biāo)識(shí)訓(xùn)練圖像的PHOG特征后,要對(duì)這些訓(xùn)練圖像進(jìn)行設(shè)置圖像訓(xùn)練標(biāo)簽,設(shè)置完訓(xùn)練標(biāo)簽后,再對(duì)訓(xùn)練集圖像進(jìn)行訓(xùn)練。
(3) 在對(duì)訓(xùn)練集訓(xùn)練完之后,就要讀入交通標(biāo)識(shí)圖像樣本庫(kù)中用來(lái)測(cè)試的交通標(biāo)識(shí)圖像,即讀入每種交通標(biāo)識(shí)后10個(gè)圖像,接下來(lái)對(duì)讀入的交通標(biāo)識(shí)測(cè)試圖像進(jìn)行處理,也即提取測(cè)試圖像的PHOG特征。
(4) 這一步要對(duì)讀入的交通標(biāo)識(shí)測(cè)試圖像進(jìn)行設(shè)置圖像標(biāo)簽,設(shè)置完標(biāo)簽后再對(duì)測(cè)試圖像進(jìn)行測(cè)試。
(5) 在完成了測(cè)試圖像測(cè)試之后就可以得到分類(lèi)準(zhǔn)確率。
3.2 仿真和結(jié)果分析
本文采用MATLAB對(duì)算法進(jìn)行仿真,同時(shí)要使用MATLAB的libsvm工具,實(shí)現(xiàn)圖像的分類(lèi),因此,首先要對(duì)MATLAB進(jìn)行l(wèi)ibsvm工具的配置。采用mex —setup語(yǔ)句實(shí)現(xiàn)配置操作。在MATLAB命令窗口鍵入mex —setup 命令后選擇合適的編譯環(huán)境后就可以對(duì)算法進(jìn)行仿真。
本文主要以直行左拐,直行和右拐的交通標(biāo)識(shí)圖像進(jìn)行仿真,使用的樣本庫(kù)如圖1所示。本文方法利提取phog特征向量,并利用SVM進(jìn)行分類(lèi)實(shí)現(xiàn)不同交通標(biāo)識(shí)類(lèi)別的區(qū)分。仿真結(jié)果如圖2所示。觀(guān)察仿真結(jié)果可以看出,所有的圖片全部分類(lèi)準(zhǔn)確。
在仿真過(guò)程中,分別改變其中直方圖塊數(shù),金字塔級(jí)數(shù),感興趣區(qū)域,來(lái)測(cè)試參數(shù)對(duì)本文方法分類(lèi)準(zhǔn)確性的影響。(1)只改變直方圖塊數(shù)。金字塔級(jí)數(shù)為1圖像像素為100*100。結(jié)果如表1所示。(2)只改變金字塔級(jí)數(shù)。直方圖塊數(shù)為20圖像像素為100*100。結(jié)果如表1所示。(3)只改變感興趣區(qū)域大小。直方圖塊數(shù)為20,金字塔級(jí)數(shù)為1。結(jié)果如表1所示。從表1可以看出,仿真條件直方圖塊數(shù)對(duì)分類(lèi)影響不大。但總體來(lái)說(shuō)直方圖的方向個(gè)數(shù)越多,分類(lèi)越準(zhǔn)確。從金字塔級(jí)數(shù)的變化能夠發(fā)現(xiàn),在對(duì)圖像特征提取的時(shí)候,進(jìn)行提取的圖像層數(shù)越多,其分類(lèi)準(zhǔn)確率并不是越高。由圖像像素的改變可以看出,當(dāng)以中心部分圖像做特征提取時(shí),分類(lèi)準(zhǔn)確度更高一些。
4 總結(jié)
本文方法成功對(duì)直行左拐、直行和右拐三種交通標(biāo)識(shí)進(jìn)行了分類(lèi),同時(shí)也給出了不同仿真條件對(duì)圖像分類(lèi)準(zhǔn)確性的影響。仿真結(jié)果驗(yàn)證了本文算法的有效性。
參考文獻(xiàn):
[1] 常盧峰.車(chē)載輔助系統(tǒng)中交通標(biāo)志檢測(cè)與識(shí)別技術(shù)研究[D].湖南:中南大學(xué),2010.
[2] 李海峰.交通標(biāo)志檢測(cè)與識(shí)別算法研究[D].上海:應(yīng)用技術(shù)大學(xué),2016.
[3] 敬斌.基于機(jī)器視覺(jué)的交通標(biāo)志檢測(cè)與識(shí)別算法研究[D].浙江:電子科技大學(xué),2015.
[4] 劉華煜.基于支持向量機(jī)的機(jī)器學(xué)習(xí)研究[D].黑龍:大慶石油學(xué)院,2005.
[5] 魯寒凝.基于HOG特征的交通標(biāo)志檢測(cè)與識(shí)別算法研究[D].陜西:長(zhǎng)安大學(xué),2015.
[6] 賈世杰,郜瑞芹.基于PHOG特征及支持向量機(jī)的彎道自動(dòng)檢測(cè)[J].計(jì)算機(jī)工程與設(shè)計(jì).2014(7):2531-2535.
[7] 劉芳宇.自主車(chē)交通標(biāo)志檢測(cè)與識(shí)別方法研究[D].北京:北京理工大學(xué),2015.
[8] Vapnik V, Chervonenkis A. The Necessary and Sufficient Conditions for Consistency in the Empirical Risk Minimization Methon[J].Pattern Recognition and Image Analysis,1991,1(3):283-305.
[9] 黃翠.交通標(biāo)志檢測(cè)與識(shí)別算法研究[D].山東:山東大學(xué),2014. [通聯(lián)編輯:光文玲]