黃有望 白新國
摘 要: 針對(duì)當(dāng)前警示標(biāo)志識(shí)別正確率低、識(shí)別速度慢等不足,提出基于視覺傳達(dá)的警示標(biāo)志識(shí)別方法。首先提取警示標(biāo)志識(shí)別的一些特征,然后結(jié)合人的視覺傳達(dá)感知設(shè)計(jì)一些規(guī)則,最后采用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)警示標(biāo)志識(shí)別,并通過具體實(shí)驗(yàn)測(cè)試該方法的有效性和優(yōu)越性。測(cè)試結(jié)果表明,所提方法提高了警示標(biāo)志識(shí)別的正確率,有效改善了警示標(biāo)志識(shí)別的速度,而且警示標(biāo)志識(shí)別效果明顯優(yōu)于當(dāng)前其他警示標(biāo)志識(shí)別方法。
關(guān)鍵詞: 視覺傳達(dá); 警示標(biāo)志; 識(shí)別方法; 識(shí)別正確率; 識(shí)別速度; 神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào): TN911.73?34; TP181 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)11?0129?04
Warning signs recognition method based on visual communication
HUANG Youwang1, BAI Xinguo2
(1. College of Apparel & Design, Xian Polytechnic University, Xian 710048, China;
2. College of Computer Science, Xian Polytechnic University, Xian 710048, China)
Abstract: Aiming at the shortcomings of low recognition accuracy and slow recognition speed of warning signs, a warning signs identification method based on visual communication is proposed. The characteristics of warning signs recognition are extracted, and combined with the human′s visual perception to design some rules. And then the neural network is used to realize the warning signs identification. The effectiveness and superiority of the method were verified with specific test. The test results show that the method can improve the recognition accuracy and recognition speed of the warning signs, and its recognition effect is better than that of other warning signs recognition methods.
Keywords: visual communication; warning sign; identification method; recognition accuracy; recognition speed; neural network
隨著經(jīng)濟(jì)的迅速發(fā)展,城市化進(jìn)程速度不斷加快,城市道路和建筑越來越復(fù)雜,出現(xiàn)了許多警示標(biāo)記,這些警示標(biāo)記可以幫助人們迅速離開危險(xiǎn)環(huán)境,以便更好地保護(hù)人身安全與財(cái)產(chǎn)安全。因此,對(duì)警示標(biāo)記進(jìn)行準(zhǔn)確識(shí)別具有十分重要的意義[1?3]。
針對(duì)警示標(biāo)記識(shí)別問題,學(xué)者們提出了許多有效的警示標(biāo)記方法,在警示標(biāo)記識(shí)別的研究中,首先要提取警示標(biāo)記識(shí)別特征,然后采用相應(yīng)的方法對(duì)警示標(biāo)記進(jìn)行分類和識(shí)別[4?6]。當(dāng)前警示標(biāo)記特征很多,如形狀特征、顏色特征等,單一特征一般無法獲得性能較優(yōu)的警示標(biāo)記識(shí)別結(jié)果,因此當(dāng)前主要采用多個(gè)特征實(shí)現(xiàn)警示標(biāo)記。警示標(biāo)記識(shí)別常用神經(jīng)網(wǎng)絡(luò)或者支持向量機(jī)進(jìn)行,其中支持向量機(jī)的學(xué)習(xí)速度比較慢,導(dǎo)致警示標(biāo)記識(shí)別的效率低,而神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度雖然快于支持向量機(jī),但是識(shí)別效果有待進(jìn)一步提升[7?9]。但是以上的警示標(biāo)記識(shí)別方法忽略了人的視覺特點(diǎn),導(dǎo)致警示標(biāo)記識(shí)別不穩(wěn)定,而且誤識(shí)率比較高。視覺傳達(dá)是一種新型技術(shù),可以根據(jù)人的視覺對(duì)警示標(biāo)志進(jìn)行設(shè)計(jì),有助于改善警示標(biāo)志識(shí)別效果[10]。
針對(duì)當(dāng)前警示標(biāo)志識(shí)別正確率低、識(shí)別速度慢等不足,提出一種基于視覺傳達(dá)的警示標(biāo)志識(shí)別方法。測(cè)試結(jié)果表明,本文方法提高了警示標(biāo)志識(shí)別的正確率,有效改善了警示標(biāo)志識(shí)別的速度,而且警示標(biāo)志識(shí)別效果要明顯優(yōu)于當(dāng)前其他警示標(biāo)志識(shí)別方法,具有更高的實(shí)際應(yīng)用價(jià)值。
人們?cè)谏钪?,通常通過視覺感知90%的信息,不同人感知方式、視覺效果差異很大,因此可以通過視覺傳達(dá)技術(shù)幫助警示標(biāo)志識(shí)別。色彩從情緒以及機(jī)能干擾人們的心理狀態(tài),使得人們?cè)谛袨樯献龀霾煌姆磻?yīng),同人們的生活環(huán)境以及文化素質(zhì)等相關(guān)。不同人對(duì)差異色彩間的關(guān)聯(lián)性,形成差異的冷暖、硬柔等體驗(yàn),進(jìn)而影響人們對(duì)警示標(biāo)志的感受狀態(tài)。差異色彩環(huán)境中人的情緒存在較大的波動(dòng),如紅、橙、黃是暖色,其可刺激人們的視覺,調(diào)度人的興奮點(diǎn),則在交通導(dǎo)向標(biāo)識(shí)以及警示標(biāo)志中通常采用這些暖色。青、藍(lán)、紫是冷色,能夠使得人們的情緒保持穩(wěn)定,這類顏色大都應(yīng)用到醫(yī)院、工程和辦公領(lǐng)域。在警示標(biāo)志識(shí)別過程中,人們對(duì)不同色彩以及形態(tài)產(chǎn)生不同的心理反應(yīng),基于心理反應(yīng)內(nèi)的相似性設(shè)計(jì)合理的警示導(dǎo)向符號(hào)以及視覺效果,對(duì)于提高警示標(biāo)志的識(shí)別效果具有重要作用。
強(qiáng)弱光照作用會(huì)干擾人眼視覺,對(duì)比度低于3[∶]1的物體是反射光的最佳環(huán)境。正常光照環(huán)境下,距離55 cm是觀測(cè)目標(biāo)事物的最佳距離。如表1所示,研究的水平分割性能從中心到四周大幅度降低。融合光照和導(dǎo)向設(shè)計(jì)規(guī)劃警示標(biāo)志,能夠?qū)崿F(xiàn)視覺傳達(dá)的審美性能。分析人們視覺感知領(lǐng)域獲取的詳細(xì)數(shù)據(jù),可對(duì)基于城市視覺傳達(dá)的警示標(biāo)志進(jìn)行科學(xué)的設(shè)計(jì),對(duì)警示標(biāo)志的大小、高度以及部署位置實(shí)施合理規(guī)劃,對(duì)警示標(biāo)志的高度、視距以及字體大小和顏色等元素實(shí)施控制,可以提高用戶對(duì)不同警示標(biāo)志的識(shí)別效率和準(zhǔn)確度。
由于警示標(biāo)志是一種圖像,圖像的采集受到外界因素的影響,導(dǎo)致圖像質(zhì)量不高,警示標(biāo)志有時(shí)不清楚,需要對(duì)警示標(biāo)志進(jìn)行預(yù)處理,具體步驟如下:
背景建模是指從圖像中提取警示標(biāo)志的目標(biāo)區(qū)域,采用視頻幀差方法實(shí)現(xiàn)警示標(biāo)志的提取。設(shè)警示標(biāo)志圖像序列為[{Ii(x,y)},i=1,2,…,N,][(x,y)]表示警示標(biāo)志的像素位置,[i]表示警示標(biāo)志的幀序,[N]為警示標(biāo)志的幀總數(shù),那么警示標(biāo)志圖像之間的幀計(jì)算公式為:
[CDMi(x,y)=d, d≥T0, d 式中:[d=Ii+1(x,y)-Ii(x,y);][T]表示警示標(biāo)志的差分閾值。 在提取警示標(biāo)志的區(qū)域后,將有用的警示標(biāo)志分割出來,采用時(shí)域差分法對(duì)警示標(biāo)志進(jìn)行標(biāo)分割,即: [F(I,B)=1-2×(I+1)×(B+1)(I+1)+(B+1)× 2×(256-I)×(256-B)(256-I)+(256-B),] [0≤f(I,B)<1, 0≤I(x,y)≤255, 0≤B(x,y)≤255] (2) 式中:[B]表示警示標(biāo)志的像素值;[I]為當(dāng)前警示標(biāo)志幀的像素值。 采用二值化方法對(duì)分割后的警示標(biāo)志進(jìn)行處理,消除警示標(biāo)志噪聲,即: [Mx,y=1,f(Ixy,Bxy)≥T0,otherwise] (3)2.2 提取警示標(biāo)志的特征
2.2.1 提取警示標(biāo)志的LBP特征
LBP算子常為一個(gè)矩形區(qū)域,包括1個(gè)中心和8個(gè)鄰域像素,它們都有自己的灰度值。首先比較全部鄰域像素與中心點(diǎn)的灰度值,根據(jù)比較結(jié)果標(biāo)記為“1”或者“0”,所有的“1”和“0”組成一個(gè)矩陣,該矩陣刻畫灰度變化,具體工作過程如圖1所示。
擴(kuò)展LBP算子為:
[LBPP,R=P=0P-1sgP-gc2P] (4)
式中:[gc,][gP]為中心和鄰域像素的灰度值;[P]表示鄰域的像素個(gè)數(shù);[R]表示半徑。
同時(shí)可以得到:
[sgP-gc=1,gP-gc≥00,otherwise] (5)
對(duì)LBP特征值做如下處理:
[LBPriP,R=minROR(LBPP,R,i) i=0,1,2,…,P-1] (6)
式中ROR為移位操作符。
對(duì)于一幅警示標(biāo)志圖像,提取其紋理特征,對(duì)它們的直方圖進(jìn)行歸一化操作,結(jié)果如圖2所示。
灰度共生矩陣可以描述警示標(biāo)志的紋理特征,[Oxyz]表示一個(gè)三維坐標(biāo),其中,[z]軸表示警示標(biāo)志圖像的灰度標(biāo),[Nx]表示警示標(biāo)志的圖像總像素?cái)?shù)值,具體如圖3所示。
從一個(gè)像素點(diǎn)[i]開始,其相鄰像素?cái)?shù)為[j,]它們之間的距離為[d,]角度為[θ,]那么它們?cè)诰緲?biāo)志中同時(shí)存在的概率為:
[P(i,j,d,θ)=(x,y)f(x,y)=i,f(x+dcosθ,y+dsinθ)] (7)
采用同質(zhì)區(qū)(HOM)、角二階矩(ASM)、熵(ENT)和非相似性(DIS)構(gòu)建警示標(biāo)志的灰度共生矩陣,具體為:
[HOM=ijp(i,j)1+(i-j)2ASM=ijp(i,j)2ENT=ijp(i,j)log p(i,j)DIS=iji-jp(i,j)] (8)
BP神經(jīng)網(wǎng)絡(luò)的工作步驟為:
1) 輸入神經(jīng)元節(jié)點(diǎn)[i]的輸入與輸出一樣,即有:
[Oi=Xi] (9)
2) 隱含層神經(jīng)元節(jié)點(diǎn)[j]的輸入和輸出為:
[netj=iωjiOi+θjOj=f(netj)=11+exp(-netj)] (10)
式中:[ωji]表示隱含層連接權(quán)值;[θj]為隱含層的閾值。
3) 輸出層神經(jīng)元節(jié)點(diǎn)[l]的輸入和輸出為:
[netl=jωljOj+θlOl=f(netl)=11+exp(-netl)] (11)
式中:[ωlj]表示輸出層的連接權(quán)值;[θl]為輸出層的閾值。
設(shè)采集到的數(shù)據(jù)為:[(XP1,XP2,…,XPN)→][(TP1,TP2,…,TPN)],[P]為樣本總數(shù),那么輸出結(jié)果的均方誤差和可以描述為:
[W=1PP12l(TPl-OPl)2] (12)
權(quán)值[ωlj]與[ωji]滿足的變化方式為:
[ωlj(K+1)=ωlj(K)+ηδlOjδl=f(netl)(Tl-Ol)] (13)
[ωji(K+1)=ωji(K)+ηδjOiδj=f(netj)lωljδl] (14)
式中:[K]為迭代次數(shù);[η]為學(xué)習(xí)速率。
基于神經(jīng)網(wǎng)絡(luò)的警示標(biāo)志識(shí)別原理:首先采集警示標(biāo)志識(shí)別圖像,并進(jìn)行一些預(yù)處理;然后結(jié)合人的視覺傳達(dá)感知特點(diǎn),提取警示標(biāo)志識(shí)別的相關(guān)特征,最后采用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)警示標(biāo)志識(shí)別,具體如圖4所示。
為了分析本文所提的警示標(biāo)志識(shí)別方法的有效性和優(yōu)越性,選擇沒有引入視覺傳達(dá)的警示標(biāo)志識(shí)別方法進(jìn)行對(duì)比實(shí)驗(yàn),每一種方法均運(yùn)行10次實(shí)驗(yàn),統(tǒng)計(jì)它們的警示標(biāo)志平均識(shí)別率,結(jié)果如表2所示。
從表2可知:
1) 沒有引入視覺傳達(dá)的警示標(biāo)志識(shí)別方法的實(shí)驗(yàn)結(jié)果較本文方法要低,獲得了比較低的警示標(biāo)志識(shí)別率,表明其警示標(biāo)志識(shí)別的誤識(shí)率比較高。這是因?yàn)樵摲椒o法正確描述警示標(biāo)志的類型,無法準(zhǔn)確區(qū)分出不同類型的警示標(biāo)志,因此實(shí)際應(yīng)用價(jià)值受限。
2) 相對(duì)于對(duì)比方法,本文方法的警示標(biāo)志識(shí)別結(jié)果得到了明顯改善,大幅度提高了警示標(biāo)志識(shí)別率,這表明本文方法的警示標(biāo)志誤識(shí)率得到了有效的控制。這是因?yàn)楸疚囊肓艘曈X傳達(dá)方法,提取的警示標(biāo)志特征可以更好地描述警示標(biāo)志的類型,從而建立理想的警示標(biāo)志識(shí)別分類器,可以全面描述警示標(biāo)志的類型,獲得了更加理想的警示標(biāo)志識(shí)別結(jié)果,對(duì)比結(jié)果表明引入視覺傳達(dá)有助于提高警示標(biāo)志的識(shí)別效果。
統(tǒng)計(jì)對(duì)比方法和本文方法的警示標(biāo)志平均識(shí)別時(shí)間,結(jié)果見圖5。對(duì)圖5的警示標(biāo)志識(shí)別時(shí)間進(jìn)行對(duì)比和分析,可以發(fā)現(xiàn)本文方法的警示標(biāo)志識(shí)別時(shí)間明顯縮短,這表明本文方法的警示標(biāo)志識(shí)別速度更快,提高了警示標(biāo)志識(shí)別的效率,可以應(yīng)用于處理速度比較快的警示標(biāo)志識(shí)別環(huán)境中,實(shí)際應(yīng)用價(jià)值更高。
警示標(biāo)志識(shí)別是當(dāng)前研究的熱點(diǎn),為了解決當(dāng)前警示標(biāo)志識(shí)別正確率低、識(shí)別速度慢等缺陷,提出基于視覺傳達(dá)的警示標(biāo)志識(shí)別方法。采用具體實(shí)驗(yàn)測(cè)試了本文方法的有效性和優(yōu)越性,結(jié)果表明,本文方法提高了警示標(biāo)志識(shí)別的正確率,有效改善了警示標(biāo)志識(shí)別的速度,而且警示標(biāo)志識(shí)別效果要明顯優(yōu)于當(dāng)前其他警示標(biāo)志識(shí)別方法,具有更高的實(shí)際應(yīng)用價(jià)值。
參考文獻(xiàn)
[1] MALDONADO?BASCON S, LAFUENTE?ARROYO S, GIL?JIMENEZ P, et al. Road sign detection and recognition based on support vector machines [J]. IEEE transactions on intelligent transportation systems, 2007, 8(2): 264?278.
[2] GAO X, PODLADCHIKOVA L, SHAPOSHNIKOV D, et al. Recognition of traffic signs based on their colour and shape features extracted using human vision models [J]. Journal of visual communication and image representation, 2006, 17(4): 675?685.
[3] 谷明琴,蔡自興,何芬芬.基于形狀標(biāo)記圖和Gabor小波的交通標(biāo)志識(shí)別[J].智能系統(tǒng)學(xué)報(bào),2011,6(6):526?530.
GU Mingqin, CAI Zixing, HE Fenfen. Traffic sign recognition based on shape labeled graph and Gabor wavelet [J]. Journal of intelligent system, 2011, 6(6): 526?530.
[4] 秦香英,黃亞飛,劉偉銘.基于不變矩和小波神經(jīng)網(wǎng)絡(luò)的標(biāo)志識(shí)別方法[J].長(zhǎng)沙交通學(xué)院學(xué)報(bào),2005,21(2):84?88.
QIN X Y, HUANG Y F, LIU W M. A method of signs recognition based on invariant moments and wavelet neural network [J]. Journal of Changsha Jiaotong University, 2005, 21(2): 84?88.
[5] 王進(jìn),熊虎.ALPSO?SVM道路限速標(biāo)志識(shí)別[J].計(jì)算機(jī)科學(xué),2012,39(11):226?229.
WANG Jin, XIONG Hu. Road speed limit identification based on ALPSO?SVM [J]. Computer science, 2012, 39(11): 226?229.
[6] 何耀平,徐麗珍.自然場(chǎng)景下交通標(biāo)志的自動(dòng)識(shí)別算法[J].微計(jì)算機(jī)信息,2010,26(4):161?163.
HE Yaoping, XU Lizhen. Automatic recognition algorithm for traffic signs in natural scene [J]. Microcomputer information, 2010, 26(4): 161?163.
[7] BUI?MINH T, GHITA O, WHELAN P F, et al. A robust algorithm for detection and classification of traffic signs in video data [C]// Proceedings of 2012 International Conference on Control, Automation and Information Sciences. [S.l.]: IEEE, 2012: 108?113.
[8] 谷明琴,蔡自興.基于無參數(shù)形狀檢測(cè)子和DT?CWT的交通標(biāo)志識(shí)別[J].計(jì)算機(jī)研究與發(fā)展,2013,50(9):1893?1901.
GU Mingqin, CAI Zixing. Traffic sign recognition based on nonparametric shape detector and DT?CWT [J]. Computer research and development, 2013, 50(9): 1893?1901.
[9] HE K, SUN J, TANG X. Single image haze removal using dark channel prior [J]. Pattern analysis and machine intelligence, 2011, 33(12): 2341?2353.
[10] 張靜,何明一,戴玉超,等.綜合顏色和形狀的圓形交通標(biāo)志檢測(cè)方法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(2):233?236.
ZHANG Jing, HE Mingyi, DAI Yuchao, et al. Circular traffic sign detection method of integrated color and shape [J]. Computer engineering and application, 2011, 47(2): 233?236.