基于LeNet5算法的交通標(biāo)志識(shí)別

2018-05-02 07:56吳宗燃

智富時(shí)代 2018年2期

吳宗燃

【摘要】交通標(biāo)志的識(shí)別是輔助駕駛系統(tǒng)和無(wú)人駕駛系統(tǒng)中非常關(guān)鍵的步驟，是指將包含交通標(biāo)志的待識(shí)別區(qū)域作為輸入（我們?cè)跈z測(cè)步驟中所得到的一組感興趣區(qū)域），輸出其交通標(biāo)志的小類(lèi)（如限速60公里/小時(shí)，禁止停車(chē)等），以得到人們所知道的具體含義。

【關(guān)鍵詞】LeNet5；卷積神經(jīng)網(wǎng)絡(luò)；交通標(biāo)志識(shí)別

一、交通標(biāo)識(shí)識(shí)別方案的設(shè)計(jì)

卷積神經(jīng)網(wǎng)絡(luò)（convolutional neural network， CNN）[126]由LeCun等人提出，最早應(yīng)用于手寫(xiě)數(shù)字的識(shí)別，且于2012年在ImageNet分類(lèi)任務(wù)上取得了突破性的進(jìn)展[127]。目前，卷積神經(jīng)網(wǎng)絡(luò)已成功應(yīng)用于簡(jiǎn)單筆劃識(shí)別[128]、交通標(biāo)志識(shí)別[58，129]、以及相機(jī)定位[130]等多個(gè)領(lǐng)域。

卷積神經(jīng)網(wǎng)絡(luò)最顯著的特點(diǎn)在于可以直接采用圖像進(jìn)行輸入，能同時(shí)進(jìn)行特征和分類(lèi)器的學(xué)習(xí)，避免了傳統(tǒng)識(shí)別算法中顯式的、復(fù)雜的特征提取過(guò)程，隱式的從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí)。Giresan等人贏得GTSRB第二輪比賽采用的多列深度卷積神經(jīng)網(wǎng)絡(luò)（multi-column deep neural network， MCDNN）[53]包含了三個(gè)卷積層，三個(gè)最大池化層以及兩個(gè)全連接層。鑒于卷積神經(jīng)網(wǎng)絡(luò)如此優(yōu)秀的圖像識(shí)別性能，本文采取LeNet5卷積神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行交通標(biāo)志識(shí)別。

二、LeNet5卷積神經(jīng)網(wǎng)絡(luò)的算法流程

（一）交通標(biāo)志識(shí)別算法的流程

交通標(biāo)志識(shí)別算法流程：輸入圖像、預(yù)處理、特征提取、分類(lèi)、輸出圖像等幾個(gè)關(guān)鍵步驟。在實(shí)際的交通環(huán)境中，交通標(biāo)志可能收到各種不利的外部因素影響而難以分辨，如：光線變化，位置的傾斜，風(fēng)吹雨淋之后的褪色，路邊樹(shù)木的遮擋，這對(duì)計(jì)算機(jī)來(lái)說(shuō)是十分致命的。同時(shí)在檢測(cè)中，也會(huì)因算法的不理想而產(chǎn)生的誤檢、漏檢、檢測(cè)區(qū)域偏差等情況，難以實(shí)現(xiàn)百分之百的檢測(cè)和完美的定位，因此我們首先需要對(duì)我們檢測(cè)所得到的一組感興趣區(qū)域做圖像的預(yù)處理，來(lái)提高識(shí)別與分類(lèi)的準(zhǔn)確性。

經(jīng)過(guò)圖像預(yù)處理之后，我們?nèi)绻苯舆M(jìn)行分類(lèi)識(shí)別，會(huì)發(fā)現(xiàn)通常結(jié)果都不會(huì)很好，這是因?yàn)槲覀兯臄z的圖像中會(huì)有很多噪聲，這些噪聲人眼可以控制忽略，而計(jì)算機(jī)卻不能，所以通過(guò)特征映射使得同類(lèi)型的數(shù)據(jù)在新的特征空間更加相近，也加大了不同類(lèi)型數(shù)據(jù)的區(qū)分度，讓計(jì)算機(jī)可以更加準(zhǔn)確的判斷，排除一些圖像平移，形變，縮放的適應(yīng)性。

這之后我們就將已完成的訓(xùn)練和測(cè)試數(shù)據(jù)按路徑輸入，同時(shí)改變輸出種類(lèi)為43。得到的損失圖像如4.1所示。

三、實(shí)現(xiàn)與分析

（一）GTSRB數(shù)據(jù)集

在2011年IJCNN組織了一次交通標(biāo)志識(shí)別競(jìng)賽，并與同時(shí)公布了GTSRB數(shù)據(jù)集。該數(shù)據(jù)集是從德國(guó)真實(shí)的交通環(huán)境中拍攝采集，一共包含4大類(lèi)（禁令標(biāo)志、警告標(biāo)志、指示標(biāo)志、其他標(biāo)志）43小類(lèi)。整個(gè)數(shù)據(jù)集包含了51839幅交通標(biāo)志圖像，其中訓(xùn)練集39209幅，測(cè)試集12630幅圖像，識(shí)別數(shù)據(jù)集GTSRB每張圖像上只有一個(gè)交通標(biāo)志，相當(dāng)于我們檢測(cè)部分提取出的每一個(gè)感興趣區(qū)域。

（二）運(yùn)用LeNet5進(jìn)行交通標(biāo)志識(shí)別

在本文中，主要目的是運(yùn)用LeNet5實(shí)現(xiàn)對(duì)GTSRB數(shù)據(jù)集的交通標(biāo)志分類(lèi)，同時(shí)了解卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及性能，獨(dú)立訓(xùn)練了一個(gè)CNN。

GTSRB數(shù)據(jù)集中的標(biāo)志通過(guò)顏色特征和形狀特征我們將其分為了6大類(lèi)，統(tǒng)計(jì)見(jiàn)表3.1，其中每一類(lèi)都有自己的特點(diǎn)，例如：限速標(biāo)志為圓形，紅色邊框，白色背景，中間為數(shù)字；解除禁止為圓形，黑色邊框，白色背景，畫(huà)有黑色斜線等。所以在大類(lèi)之間的特點(diǎn)差異較大，具有較好的分辨性，但是難點(diǎn)在于每個(gè)小類(lèi)的細(xì)分，他們的差別非常小，例如限速60公里/小時(shí)和限速80公里/小時(shí)，只差了一個(gè)數(shù)字而6和8又只差了一筆，如圖3.1所示。卷積神經(jīng)網(wǎng)絡(luò)需要能夠分辨這些微小的差別，才能夠得到我們所需要的準(zhǔn)確率。

（三）圖像預(yù)處理

根據(jù)網(wǎng)絡(luò)的要求，我們將數(shù)據(jù)集中的圖像大小首先統(tǒng)一縮放到32×32。因?yàn)閺脑紙D像中提取的感興趣區(qū)域可能會(huì)受到各種不利因素的影響，所以現(xiàn)如今人們都采用了以下幾種預(yù)處理算法，結(jié)果如圖3.2所示。圖中第1列為原始圖像，第2列為灰度圖，第3列到第6列分別為采用CLAHE、直方圖均衡化、對(duì)比度調(diào)整以及圖像銳化算法處理后的結(jié)果。

本文主要目的為實(shí)現(xiàn)LeNet5網(wǎng)絡(luò)在交通標(biāo)志牌中的運(yùn)用，為了盡可能減少實(shí)驗(yàn)所需要的時(shí)間，所以采用了未經(jīng)處理的原圖像作為輸入，僅將圖像縮放為網(wǎng)絡(luò)所需大小32×32，以此來(lái)判斷是否需要做其他預(yù)處理來(lái)提高準(zhǔn)確率。

四、實(shí)驗(yàn)結(jié)果與分析

首先編寫(xiě)了一套Python代碼，用來(lái)隨機(jī)選取訓(xùn)練集的20%進(jìn)行測(cè)試（7841張），另外80%用于訓(xùn)練（31368）。這樣做的好處是我們每次的訓(xùn)練和測(cè)試都不相同，提高了隨機(jī)性。訓(xùn)練過(guò)程中采用了批量驗(yàn)證的方法，即在一次迭代過(guò)程中，將整個(gè)數(shù)據(jù)集分為若干個(gè)batch，每個(gè)batch包含64張圖像，即我們每次訓(xùn)練時(shí)，輸入到神經(jīng)網(wǎng)絡(luò)的圖像數(shù)量為64。通過(guò)神經(jīng)網(wǎng)絡(luò)的向前傳播過(guò)程得出這批圖像的誤差率，然后根據(jù)誤差率對(duì)網(wǎng)絡(luò)的權(quán)值和偏置求導(dǎo)，并更新網(wǎng)絡(luò)中的學(xué)習(xí)參數(shù)。如圖4.1所示，是我們?cè)诰W(wǎng)絡(luò)中訓(xùn)練一萬(wàn)次的loss曲線和在測(cè)試集中訓(xùn)練一萬(wàn)次的loss曲線。

在訓(xùn)練中所使用的LeNet5卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，一共八層，其中包括為1個(gè)輸入層，3個(gè)卷積層，2個(gè)池化層，1個(gè)全連接層和1個(gè)輸出層。

最后訓(xùn)練的結(jié)果如表4.1所示：

從表中我們可以看出，分類(lèi)的正確率較高，在7841個(gè)測(cè)試樣本中，錯(cuò)誤圖片僅為84張，正確率為98.92%。每幅圖像的處理速度為1.863毫秒。

如圖4.2是部分被錯(cuò)分的圖像，由于LeNet5是一個(gè)只具有的單個(gè)CNN的簡(jiǎn)單網(wǎng)絡(luò)，所以其分類(lèi)正確率還可以通過(guò)多種方式進(jìn)行提升，比如加大網(wǎng)絡(luò)深度，調(diào)整超參，訓(xùn)練多個(gè)DNN進(jìn)行分類(lèi)等。從樣本中我們不難發(fā)現(xiàn)，識(shí)別錯(cuò)誤的主要原因包括：分辨率過(guò)低，遮擋部分較多，運(yùn)動(dòng)模糊等。

五、總結(jié)

本文采用了一種簡(jiǎn)單的卷積神經(jīng)網(wǎng)絡(luò)LeNet5進(jìn)行交通標(biāo)志的識(shí)別。該網(wǎng)絡(luò)包括三個(gè)卷積層，兩個(gè)最大池化層和一個(gè)全連接層。輸入圖像這次為了實(shí)驗(yàn)采用了沒(méi)有經(jīng)過(guò)處理的原圖，經(jīng)過(guò)卷積層和池化層對(duì)圖像特征的提取和壓縮，進(jìn)入全連接層分類(lèi)，最終得到識(shí)別結(jié)果。通過(guò)在GTSRB數(shù)據(jù)集上的驗(yàn)證，正確率為98.92%，因此說(shuō)明LeNet5卷積神經(jīng)網(wǎng)絡(luò)對(duì)于交通標(biāo)志識(shí)別有較高的識(shí)別率（分類(lèi)正確率），且在計(jì)算機(jī)上的運(yùn)行速度僅為1.8毫秒，可以保證實(shí)時(shí)性。

【參考文獻(xiàn)】

[1]基于融合卷積神經(jīng)網(wǎng)絡(luò)模型的手寫(xiě)數(shù)字識(shí)別[J]. 陳玄，朱榮，王中元. 計(jì)算機(jī)工程. 2017（11）

[2]深度學(xué)習(xí)研究綜述[J]. 孫志軍，薛磊，許陽(yáng)明，王正. 計(jì)算機(jī)應(yīng)用研究. 2012（08）

[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉年齡分類(lèi)[J]. 李超琪，王紹宇. 智能計(jì)算機(jī)與應(yīng)用. 2017（03）.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于LeNet5算法的交通標(biāo)志識(shí)別