国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于LeNet5算法的交通標(biāo)志識(shí)別

2018-05-02 07:56吳宗燃
智富時(shí)代 2018年2期
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò)

吳宗燃

【摘 要】交通標(biāo)志的識(shí)別是輔助駕駛系統(tǒng)和無(wú)人駕駛系統(tǒng)中非常關(guān)鍵的步驟,是指將包含交通標(biāo)志的待識(shí)別區(qū)域作為輸入(我們?cè)跈z測(cè)步驟中所得到的一組感興趣區(qū)域),輸出其交通標(biāo)志的小類(lèi)(如限速60公里/小時(shí),禁止停車(chē)等),以得到人們所知道的具體含義。

【關(guān)鍵詞】LeNet5;卷積神經(jīng)網(wǎng)絡(luò);交通標(biāo)志識(shí)別

一、交通標(biāo)識(shí)識(shí)別方案的設(shè)計(jì)

卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)[126]由LeCun等人提出,最早應(yīng)用于手寫(xiě)數(shù)字的識(shí)別,且于2012年在ImageNet分類(lèi)任務(wù)上取得了突破性的進(jìn)展[127]。目前,卷積神經(jīng)網(wǎng)絡(luò)已成功應(yīng)用于簡(jiǎn)單筆劃識(shí)別[128]、交通標(biāo)志識(shí)別[58,129]、以及相機(jī)定位[130]等多個(gè)領(lǐng)域。

卷積神經(jīng)網(wǎng)絡(luò)最顯著的特點(diǎn)在于可以直接采用圖像進(jìn)行輸入,能同時(shí)進(jìn)行特征和分類(lèi)器的學(xué)習(xí),避免了傳統(tǒng)識(shí)別算法中顯式的、復(fù)雜的特征提取過(guò)程,隱式的從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí)。Giresan等人贏得GTSRB第二輪比賽采用的多列深度卷積神經(jīng)網(wǎng)絡(luò)(multi-column deep neural network, MCDNN)[53]包含了三個(gè)卷積層,三個(gè)最大池化層以及兩個(gè)全連接層。鑒于卷積神經(jīng)網(wǎng)絡(luò)如此優(yōu)秀的圖像識(shí)別性能,本文采取LeNet5卷積神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行交通標(biāo)志識(shí)別。

二、LeNet5卷積神經(jīng)網(wǎng)絡(luò)的算法流程

(一)交通標(biāo)志識(shí)別算法的流程

交通標(biāo)志識(shí)別算法流程:輸入圖像、預(yù)處理、特征提取、分類(lèi)、輸出圖像等幾個(gè)關(guān)鍵步驟。在實(shí)際的交通環(huán)境中,交通標(biāo)志可能收到各種不利的外部因素影響而難以分辨,如:光線變化,位置的傾斜,風(fēng)吹雨淋之后的褪色,路邊樹(shù)木的遮擋,這對(duì)計(jì)算機(jī)來(lái)說(shuō)是十分致命的。同時(shí)在檢測(cè)中,也會(huì)因算法的不理想而產(chǎn)生的誤檢、漏檢、檢測(cè)區(qū)域偏差等情況,難以實(shí)現(xiàn)百分之百的檢測(cè)和完美的定位,因此我們首先需要對(duì)我們檢測(cè)所得到的一組感興趣區(qū)域做圖像的預(yù)處理,來(lái)提高識(shí)別與分類(lèi)的準(zhǔn)確性。

經(jīng)過(guò)圖像預(yù)處理之后,我們?nèi)绻苯舆M(jìn)行分類(lèi)識(shí)別,會(huì)發(fā)現(xiàn)通常結(jié)果都不會(huì)很好,這是因?yàn)槲覀兯臄z的圖像中會(huì)有很多噪聲,這些噪聲人眼可以控制忽略,而計(jì)算機(jī)卻不能,所以通過(guò)特征映射使得同類(lèi)型的數(shù)據(jù)在新的特征空間更加相近,也加大了不同類(lèi)型數(shù)據(jù)的區(qū)分度,讓計(jì)算機(jī)可以更加準(zhǔn)確的判斷,排除一些圖像平移,形變,縮放的適應(yīng)性。

這之后我們就將已完成的訓(xùn)練和測(cè)試數(shù)據(jù)按路徑輸入,同時(shí)改變輸出種類(lèi)為43。得到的損失圖像如4.1所示。

三、實(shí)現(xiàn)與分析

(一)GTSRB數(shù)據(jù)集

在2011年IJCNN組織了一次交通標(biāo)志識(shí)別競(jìng)賽,并與同時(shí)公布了GTSRB數(shù)據(jù)集。該數(shù)據(jù)集是從德國(guó)真實(shí)的交通環(huán)境中拍攝采集,一共包含4大類(lèi)(禁令標(biāo)志、警告標(biāo)志、指示標(biāo)志、其他標(biāo)志)43小類(lèi)。整個(gè)數(shù)據(jù)集包含了51839幅交通標(biāo)志圖像,其中訓(xùn)練集39209幅,測(cè)試集12630幅圖像,識(shí)別數(shù)據(jù)集GTSRB每張圖像上只有一個(gè)交通標(biāo)志,相當(dāng)于我們檢測(cè)部分提取出的每一個(gè)感興趣區(qū)域。

(二)運(yùn)用LeNet5進(jìn)行交通標(biāo)志識(shí)別

在本文中,主要目的是運(yùn)用LeNet5實(shí)現(xiàn)對(duì)GTSRB數(shù)據(jù)集的交通標(biāo)志分類(lèi),同時(shí)了解卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及性能,獨(dú)立訓(xùn)練了一個(gè)CNN。

GTSRB數(shù)據(jù)集中的標(biāo)志通過(guò)顏色特征和形狀特征我們將其分為了6大類(lèi),統(tǒng)計(jì)見(jiàn)表3.1,其中每一類(lèi)都有自己的特點(diǎn),例如:限速標(biāo)志為圓形,紅色邊框,白色背景,中間為數(shù)字;解除禁止為圓形,黑色邊框,白色背景,畫(huà)有黑色斜線等。所以在大類(lèi)之間的特點(diǎn)差異較大,具有較好的分辨性,但是難點(diǎn)在于每個(gè)小類(lèi)的細(xì)分,他們的差別非常小,例如限速60公里/小時(shí)和限速80公里/小時(shí),只差了一個(gè)數(shù)字而6和8又只差了一筆,如圖3.1所示。卷積神經(jīng)網(wǎng)絡(luò)需要能夠分辨這些微小的差別,才能夠得到我們所需要的準(zhǔn)確率。

(三)圖像預(yù)處理

根據(jù)網(wǎng)絡(luò)的要求,我們將數(shù)據(jù)集中的圖像大小首先統(tǒng)一縮放到32×32。因?yàn)閺脑紙D像中提取的感興趣區(qū)域可能會(huì)受到各種不利因素的影響,所以現(xiàn)如今人們都采用了以下幾種預(yù)處理算法,結(jié)果如圖3.2所示。圖中第1列為原始圖像,第2列為灰度圖,第3列到第6列分別為采用CLAHE、直方圖均衡化、對(duì)比度調(diào)整以及圖像銳化算法處理后的結(jié)果。

本文主要目的為實(shí)現(xiàn)LeNet5網(wǎng)絡(luò)在交通標(biāo)志牌中的運(yùn)用,為了盡可能減少實(shí)驗(yàn)所需要的時(shí)間,所以采用了未經(jīng)處理的原圖像作為輸入,僅將圖像縮放為網(wǎng)絡(luò)所需大小32×32,以此來(lái)判斷是否需要做其他預(yù)處理來(lái)提高準(zhǔn)確率。

四、實(shí)驗(yàn)結(jié)果與分析

首先編寫(xiě)了一套Python代碼,用來(lái)隨機(jī)選取訓(xùn)練集的20%進(jìn)行測(cè)試(7841張),另外80%用于訓(xùn)練(31368)。這樣做的好處是我們每次的訓(xùn)練和測(cè)試都不相同,提高了隨機(jī)性。訓(xùn)練過(guò)程中采用了批量驗(yàn)證的方法,即在一次迭代過(guò)程中,將整個(gè)數(shù)據(jù)集分為若干個(gè)batch,每個(gè)batch包含64張圖像,即我們每次訓(xùn)練時(shí),輸入到神經(jīng)網(wǎng)絡(luò)的圖像數(shù)量為64。通過(guò)神經(jīng)網(wǎng)絡(luò)的向前傳播過(guò)程得出這批圖像的誤差率,然后根據(jù)誤差率對(duì)網(wǎng)絡(luò)的權(quán)值和偏置求導(dǎo),并更新網(wǎng)絡(luò)中的學(xué)習(xí)參數(shù)。如圖4.1所示,是我們?cè)诰W(wǎng)絡(luò)中訓(xùn)練一萬(wàn)次的loss曲線和在測(cè)試集中訓(xùn)練一萬(wàn)次的loss曲線。

在訓(xùn)練中所使用的LeNet5卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),一共八層,其中包括為1個(gè)輸入層,3個(gè)卷積層,2個(gè)池化層,1個(gè)全連接層和1個(gè)輸出層。

最后訓(xùn)練的結(jié)果如表4.1所示:

從表中我們可以看出,分類(lèi)的正確率較高,在7841個(gè)測(cè)試樣本中,錯(cuò)誤圖片僅為84張,正確率為98.92%。每幅圖像的處理速度為1.863毫秒。

如圖4.2是部分被錯(cuò)分的圖像,由于LeNet5是一個(gè)只具有的單個(gè)CNN的簡(jiǎn)單網(wǎng)絡(luò),所以其分類(lèi)正確率還可以通過(guò)多種方式進(jìn)行提升,比如加大網(wǎng)絡(luò)深度,調(diào)整超參,訓(xùn)練多個(gè)DNN進(jìn)行分類(lèi)等。從樣本中我們不難發(fā)現(xiàn),識(shí)別錯(cuò)誤的主要原因包括:分辨率過(guò)低,遮擋部分較多,運(yùn)動(dòng)模糊等。

五、總結(jié)

本文采用了一種簡(jiǎn)單的卷積神經(jīng)網(wǎng)絡(luò)LeNet5進(jìn)行交通標(biāo)志的識(shí)別。該網(wǎng)絡(luò)包括三個(gè)卷積層,兩個(gè)最大池化層和一個(gè)全連接層。輸入圖像這次為了實(shí)驗(yàn)采用了沒(méi)有經(jīng)過(guò)處理的原圖,經(jīng)過(guò)卷積層和池化層對(duì)圖像特征的提取和壓縮,進(jìn)入全連接層分類(lèi),最終得到識(shí)別結(jié)果。通過(guò)在GTSRB數(shù)據(jù)集上的驗(yàn)證,正確率為98.92%,因此說(shuō)明LeNet5卷積神經(jīng)網(wǎng)絡(luò)對(duì)于交通標(biāo)志識(shí)別有較高的識(shí)別率(分類(lèi)正確率),且在計(jì)算機(jī)上的運(yùn)行速度僅為1.8毫秒,可以保證實(shí)時(shí)性。

【參考文獻(xiàn)】

[1]基于融合卷積神經(jīng)網(wǎng)絡(luò)模型的手寫(xiě)數(shù)字識(shí)別[J]. 陳玄,朱榮,王中元. 計(jì)算機(jī)工程. 2017(11)

[2]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)

[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉年齡分類(lèi)[J]. 李超琪,王紹宇. 智能計(jì)算機(jī)與應(yīng)用. 2017(03).

猜你喜歡
卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型研究
基于卷積神經(jīng)網(wǎng)絡(luò)溫室智能大棚監(jiān)控系統(tǒng)的研究
基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
纳雍县| 海原县| 兴宁市| 普洱| 辰溪县| 洞头县| 伽师县| 宜州市| 马鞍山市| 开鲁县| 饶平县| 油尖旺区| 井研县| 鸡泽县| 上虞市| 贺州市| 邛崃市| 峨眉山市| 尼勒克县| 肥东县| 灌南县| 锡林郭勒盟| 宣恩县| 普格县| 宝鸡市| 松潘县| 建阳市| 阿拉善盟| 霍林郭勒市| 新疆| 渝中区| 兰西县| 西乌珠穆沁旗| 澳门| 马尔康县| 南雄市| 邵武市| 乌鲁木齐市| 中阳县| 赤峰市| 宜川县|