錢江 張桂榮 姚江 季建中 何平 顧宋華
摘 要:為實現(xiàn)晝夜間船名精準(zhǔn)檢測,本文提出一種基于計算機視覺的船名檢測方法。該方法使用Retinex算法對船舶圖像預(yù)處理,隨后基于MSER獲取文字候選區(qū)域,根據(jù)先驗知識和筆畫寬度變換特征得到最終候選區(qū)域,最后使用級聯(lián)分類器確定單字符區(qū)域,進而得到船名位置完成船名檢測。實驗結(jié)果表明,該方法在晝間和夜間均能實現(xiàn)船名精準(zhǔn)檢測,晝間船名檢測準(zhǔn)確率高達90.4%。
關(guān)鍵詞:計算機視覺 船名檢測 最穩(wěn)定極值區(qū)域 筆畫寬度 級聯(lián)分類器
1.引言
近年來內(nèi)河航運發(fā)展迅速,運輸船舶數(shù)量顯著增加,人工審核船名信息工作逐漸繁重,一種有效的船名檢測方法亟待提出。
崔晶等人基于無線局域網(wǎng),結(jié)合AIS系統(tǒng)實現(xiàn)了船舶識別;何春燕[]利用雷達進行船舶目標(biāo)檢測,通過抗干擾算法提高船舶檢測率;鄭艷[]基于RFID技術(shù)提出有效的防碰撞算法實現(xiàn)船舶識別;潘美蓮在AIS系統(tǒng)中基于計算機視覺實現(xiàn)船舶銘牌識別和船舶跟蹤。上述四種方法存在著人為干擾大、部署成本高等問題,本文提出的方法基于現(xiàn)有視頻監(jiān)控設(shè)備改造,可自動識別船舶信息,滿足監(jiān)管監(jiān)控要求。
在水運領(lǐng)域,計算機視覺技術(shù)多應(yīng)用于船舶監(jiān)控、船舶跟蹤和船舶流量統(tǒng)計?;谝曈X的船名檢測技術(shù)尚處于起步階段,較少研究學(xué)者對其進行研究。因此本文對于船名字符檢測的研究在一定程度上彌補了船名檢測在計算機視覺方面的空白。
2.船名檢測方法
基于計算機視覺的船名字符檢測流程如圖1所示。第一步,將船舶圖像轉(zhuǎn)化為灰度圖像并使用 Ret i nex算法進行預(yù)處理;第二步,搜索圖像的最穩(wěn)定極值區(qū)域(MSER),將MSER區(qū)域作為船名字符候選區(qū)域;第三步,利用幾何形狀、尺寸等先驗知識對候選區(qū)域進行篩選過濾,得到符合先驗知識的字符候選區(qū);第四步,對符合先驗知識的文字候選區(qū)域做筆畫寬度變換,設(shè)定筆畫寬度均值方差閾值,得到符合筆畫寬度特征的字符候選區(qū)域;第五步,訓(xùn)練一個文字非文字分類器,用二分類器對字符候選區(qū)域進行分類得到最終文字區(qū)域。
2.1船舶圖像預(yù)處理
由于室外拍攝船舶圖像易受光照、天氣等環(huán)境因素影響,應(yīng)對所得船舶圖像預(yù)處理以提高字符檢測精度。隨后對彩色船舶圖像灰度化,減少后續(xù)處理計算量,之后采用 Retinex算法進行對船舶圖像進行對比度增強處理。
R e t i n e x理論由L a n d和McCann提出,該理論認為原始圖像S(x,y)可以看成是光照圖像L(x,y)和反射率圖像R (x,y)的乘積,即S(x,y)=R(x,y)* L(x,y)?;赗etinex的圖像增強的核心即從原始圖像S(x,y)中估計出光照L(x,y),從而分解出R(x,y),消除光照不均的影響。
Retinex理論假設(shè)圖像的噪聲來源于圖像各個位置反射率不同,因此去除反射圖像的噪聲便可還原圖像。首先將圖像變換到對數(shù)域,圖像變換過程如式;反射分量噪聲通過歸一化去除,歸一化過程如式;對去噪后的反射分量求指數(shù),反變換到實數(shù)域得增強后圖像。
圖2左圖為灰度化圖像,右圖為使用Retinex算法預(yù)處理后的圖像。從圖中可以看出,預(yù)處理后圖像對比度得到提高,船名特征得到增強。
2.2連通域分析
本文采用基于連通域的方法進行文字檢測,提取最穩(wěn)定極值區(qū)域作為文字候選區(qū)域,該算法對圖像具有較強的仿射變換不變性。
2.3筆畫寬度變換與級聯(lián)分類
筆畫寬度變換(Stroke Width Transform, SWT)由微軟提出,用于自然場景文字檢測。筆畫寬度特征屬于文字的獨有特征,一般而言統(tǒng)一的文本都具有統(tǒng)一的筆畫寬度,如圖4所示。
最終的文字區(qū)域由一個級聯(lián)分類器確定,因此需要訓(xùn)練一個級聯(lián)文字非文字二分類器對字符候選區(qū)域進行分類得到最終文字區(qū)域。本文采用的文字非文字二分類器基于局部二值特征和Adaboost算法進行級聯(lián),級聯(lián)分類器如圖5所示。
弱分類器的訓(xùn)練過程如下:計算所有訓(xùn)練樣本的特征值并排序;對順序排列的每個元素計算四個指標(biāo),全部文字樣本的權(quán)重和T0、全部非文字樣本的權(quán)重和最小T0、在此元素前文字樣本的權(quán)重和S0、在此元素前非文字樣本的權(quán)重和S1;選取當(dāng)前元素特征值和前一個特征值的均值作為閾值,閾值的分類誤差為e =min (S1+(T0-S0),S0+(T1-S1));將誤差最小的閾值作為最優(yōu)閾值,得到弱分類器。
將若干個弱分類器級聯(lián)成強分類器過程如下:訓(xùn)練庫樣本數(shù)為N,其中文字樣本為N0,非文字樣本數(shù)為N1,最大迭代次數(shù)為T,初始化樣本權(quán)重為1/N;第一次迭代訓(xùn)練所有樣本得第一個弱分類器;提高上一步中被誤識別的樣本權(quán)重,將錯分類樣本和新樣本作為下一個弱分類器的訓(xùn)練樣本;重復(fù)訓(xùn)練新的弱分類器,T輪迭代后得到T個最優(yōu)弱分類器;最后將弱分類器組合成強分類器,組合方式如式(3)
使用級聯(lián)分類器對字符候選區(qū)域分類,得到每個區(qū)域的類別和得分,對得分設(shè)定一定閾值,大于閾值則視為合格文字區(qū)域,組合文字區(qū)域得到船名區(qū)域。圖6左圖為分類器對字符候選區(qū)域的分類結(jié)果,右圖紅框為最終船名檢測區(qū)域。
3.實驗及分析
在級聯(lián)分類器的訓(xùn)練過程中,船名字符為正樣本,正樣本包括數(shù)字字符和漢字字符,圖像中除船名以外的圖像作為負樣本。其中正樣本5000張,負樣本8000張。船名檢測測試實驗中,測試圖像共計500張,其中晝間圖像300張,夜間圖像200張,共計4000個船名字符,其中漢字字符1525個,數(shù)字2457個。
經(jīng)測試得出,本方法正確檢測的晝間圖片282張,準(zhǔn)確率高達93.6%;正確檢測的夜間圖片170張,準(zhǔn)確率達85.5%,總準(zhǔn)確率為90.4%。經(jīng)分析發(fā)現(xiàn),被測船舶中數(shù)字字符識別率較高,漢字字符檢測準(zhǔn)確率較低,這導(dǎo)致了船名中很多漢字漏檢測,因此出現(xiàn)10%左右的船名僅能正確檢測部分字符。
4.結(jié)論
本研究提出一種基于計算機視覺的船名檢測方法,結(jié)合連通域分析和筆畫寬度變換,通過級聯(lián)分類器確定最終文字區(qū)域。通過實驗和分析,驗證了該方法的可行性。實驗結(jié)果表明,該方法在晝間和夜間均能實現(xiàn)船名精準(zhǔn)檢測。本文對于船名字符檢測的研究在一定程度上彌補了船名檢測在計算機視覺方面的空白,同時本研究也節(jié)省了人工查看視頻獲取船名所花費的大量人力成本。
參考文獻:
[1]崔晶,賈冬青,陳玉芳.基于無線局域網(wǎng)中船舶自動識別通信平臺設(shè)計[J].艦船科學(xué)技術(shù),2016(10):100-102.
[2]何春燕,余曉玫,高飛.面向識別的船舶目標(biāo)雷達回波技術(shù)研究[J].艦船科學(xué)技術(shù),2017(22):103-105.
[3]鄭艷.基于有源RFID技術(shù)的船舶識別與控制終端系統(tǒng)研究[J].艦船科學(xué)技術(shù),2017(16): 142-144.
[4]潘美蓮.船舶自動識別系統(tǒng)中的計算機視覺技術(shù)應(yīng)用[J].艦船科學(xué)技術(shù),2017(6):99-101.
[5]周勇.基于計算機視覺技術(shù)的內(nèi)河船舶智能監(jiān)控系統(tǒng)研究與實現(xiàn)[D].上海交通大學(xué),2016.
[6]楊高星.基于計算機視覺的船舶跟蹤及類型識別研究[D].大連海事大學(xué),2017.
[7]李蕓.視頻監(jiān)測在船舶流量檢測中的應(yīng)用[J].中國航海,2012,35(3):35-39.
[8]Aldenize Xavier,Carlos Eduardo Guerra,André Andrade .Fracture analysis in borehole acoustic images using mathematical morphology[J].Journal of Geophysics and Engineering,2015(3).