王孟濤
目前基于LeNet5網(wǎng)絡(luò)結(jié)構(gòu)的車牌圖形識別算法存在識別誤差大、效率低等缺點。本文對原算法進(jìn)行了改進(jìn),具體做法是轉(zhuǎn)化車牌圖像大小、刪除LeNet5網(wǎng)絡(luò)中的C5層、修改輸出層的神經(jīng)元數(shù)量等。經(jīng)驗證,算法在識別率和時間效率上均得到有效提高。
LeNet-5卷積神經(jīng)網(wǎng)絡(luò)原理
改進(jìn)的LeNet5網(wǎng)絡(luò)結(jié)構(gòu)
對原LeNet5網(wǎng)絡(luò)提出以下幾點改進(jìn):
①輸入圖片歸一化為32×16像素:中國車牌字符長度和寬度為90 mm×45mm。減小輸入圖像尺寸能夠減少模型訓(xùn)練參數(shù),提高網(wǎng)絡(luò)運(yùn)算效率。
②使用ReLU激活函數(shù):有利于緩和模型的梯度消失。
③取消C5層:將LeNet5網(wǎng)絡(luò)原C5層改為F6層,減少模型總體的訓(xùn)練參數(shù)數(shù)量。
④加入Dropout。將失活率設(shè)置為0.5,減少參數(shù)更新的個數(shù),防止模型過擬合。
⑤將車牌字符漢字與數(shù)字/字母分開識別。
改進(jìn)后的LeNet5網(wǎng)絡(luò)結(jié)構(gòu)與傳統(tǒng)LeNet5網(wǎng)絡(luò)結(jié)構(gòu)的對比如表1所示。
車牌識別策略
①圖片預(yù)處理:增強(qiáng)原始車牌圖片對比度,消除圖片的噪聲。
②車牌定位:使用基于二值圖像的形態(tài)學(xué)區(qū)域填充進(jìn)行車牌定位。
③字符分割:采用垂直投影法對車牌字符進(jìn)行分割。通過對二值化的車牌圖像進(jìn)行垂直投影,分析圖像像素的分布情況,再根據(jù)閾值切割車牌字符。
④字符識別:將分割后的車牌字符圖像輸入到網(wǎng)絡(luò)模型中。
實驗與結(jié)論
通過網(wǎng)絡(luò)收集不同環(huán)境條件的國內(nèi)車牌圖像作為數(shù)據(jù)集。進(jìn)一步進(jìn)行圖像處理得到7 877張車牌字符圖像作為改進(jìn)后網(wǎng)絡(luò)的訓(xùn)練樣本。訓(xùn)練集中4 285張為數(shù)字和字母圖片,3 232張為漢字圖片;測試集包含360張圖片,200張數(shù)字和字母圖片,160張漢字圖片。
實驗表明,改進(jìn)后的LeNet5網(wǎng)絡(luò)對于車牌中漢字識別率達(dá)到99 %,數(shù)字和字母識別率達(dá)到99.5 %,算法對于單張圖片識讀時間為2.748 ms。綜上,改進(jìn)后算法有效提高了車牌字符識別的準(zhǔn)確率,同時提高了算法運(yùn)算效率。