国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

車(chē)載遙感高速公路廣告影像的文本信息次過(guò)濾算法剔除了提取研究與應(yīng)用

2022-08-18 08:53:10朱建偉李朝奎黃云濤王佳欣鐘森
遙感信息 2022年2期
關(guān)鍵詞:廣告牌字符車(chē)載

朱建偉,李朝奎,黃云濤,王佳欣,鐘森

(1.湖南科技大學(xué) 地理空間信息技術(shù)國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室,湖南 湘潭 411201;2.湖南科技大學(xué) 測(cè)繪遙感信息工程湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 湘潭 411201;3.北京航天自動(dòng)控制研究所,北京 100085)

0 引言

截至2021年四月,我國(guó)高速公路總里程已達(dá)160 000 km,高速公路廣告牌沿線設(shè)立,普通路段設(shè)立間隔約1 km,高速收費(fèi)站、線路密集區(qū)域以及城市周?chē)鷦t更為密集。單塊廣告牌造價(jià)(以常見(jiàn)雙面廣告牌為例)為8萬(wàn)至12萬(wàn)元,租賃費(fèi)用則因地段因素差異較大。全國(guó)各省高速沿線廣告管理政策逐步完善,例如2014年湖南省人民政府辦公廳印發(fā)了《湖南省高速公路沿線廣告專(zhuān)項(xiàng)整治工作方案》?,F(xiàn)階段高速公路的廣告牌管理主要采用沿線驅(qū)車(chē),對(duì)高速沿線廣告牌逐一下車(chē)檢查的方式?,F(xiàn)行方式不僅信息反饋遲緩、成本高昂,且作業(yè)人員存在安全隱患,因此,建立一個(gè)實(shí)現(xiàn)自動(dòng)巡檢和信息管理的高速公路廣告牌智能管理系統(tǒng)已經(jīng)成為當(dāng)下迫切的需求。目前,在無(wú)人駕駛技術(shù)研究熱潮的推動(dòng)下,車(chē)載平臺(tái)與遙感技術(shù)應(yīng)用的結(jié)合被更加廣泛地鋪開(kāi)??梢圆捎密?chē)載遙感技術(shù)采集高速公路廣告牌影像數(shù)據(jù),并基于計(jì)算機(jī)技術(shù)解譯車(chē)載遙感獲取的影像數(shù)據(jù)中包含的文本信息和圖像信息,如空置的廣告牌、破損的廣告牌和非法占用的廣告牌等,實(shí)現(xiàn)類(lèi)似人腦的問(wèn)題甄別。

車(chē)載遙感影像數(shù)據(jù)隸屬于自然場(chǎng)景圖像,參照目前自然場(chǎng)景文本提取的方法來(lái)看,自然場(chǎng)景中的文字由于其相關(guān)屬性隨機(jī)性較大,相對(duì)文檔文本來(lái)說(shuō)更加難于識(shí)別和提取。目前國(guó)內(nèi)外諸多學(xué)者對(duì)自然場(chǎng)景靜態(tài)圖像中的文本信息識(shí)別與提取技術(shù)進(jìn)行了挖掘。Veit等[1]設(shè)計(jì)了基于神經(jīng)網(wǎng)絡(luò)的自然場(chǎng)景靜態(tài)圖像文本信息識(shí)別算法,使用從原始RGB圖像計(jì)算得到的復(fù)數(shù)值邊緣方向圖作為特征,通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)對(duì)文本和非文本的區(qū)域進(jìn)行分類(lèi)。Frost等[2]提取邊緣部分相對(duì)應(yīng)的主導(dǎo)像素的梯度矢量流(gradient vectorflow,GVF)鑒定方法,將Sobel邊緣圖作為候選文本區(qū)域。這些方法主要針對(duì)提取英文文本。肖珂等[3]提出一種ISODATA聚類(lèi)和支持向量機(jī)結(jié)合的自然場(chǎng)景靜態(tài)圖像文本識(shí)別方法,該方法對(duì)中文字符的提取是魯棒的;楊宏志等[4]設(shè)計(jì)了基于改進(jìn)Faster R-CNN的自然場(chǎng)景文本檢測(cè)算法,但上述方法對(duì)本文應(yīng)用需求中文本提取效果均較差。參考現(xiàn)有的文字提取方法,依托廣告牌數(shù)據(jù)特性,本文提出了一種融合高精度MSER獲取與基于像素點(diǎn)的筆畫(huà)寬度變換字符識(shí)別優(yōu)化算法,為實(shí)現(xiàn)高速公路廣告牌智能化管理提供了一種原創(chuàng)性的技術(shù)支持。

1 研究方法

首先,對(duì)無(wú)人機(jī)數(shù)據(jù)進(jìn)行MSER(最大穩(wěn)定極值區(qū)域)檢測(cè)得到所有可能包含文本信息的MSER區(qū)域;然后,根據(jù)廣告文本特征對(duì)MSER區(qū)域進(jìn)行篩選,得到高精度MSER包圍盒;接著,利用MSER包圍盒進(jìn)行基于像素點(diǎn)的SWT文字檢測(cè),得到文本檢測(cè)結(jié)果;最后,以經(jīng)典的圖像增強(qiáng)方法對(duì)結(jié)果進(jìn)行降噪和整飾,得到影像中的文本信息,本文算法流程如圖1所示。

1.1 高精度的MSER圖像分割與篩選

1)MSER區(qū)域檢測(cè)。以車(chē)載遙感影像數(shù)據(jù)來(lái)建立候選文本區(qū)域的問(wèn)題在于,如何在類(lèi)文本區(qū)域冗雜和廣告牌文本信息形式多樣的條件下檢測(cè)出有效的文本區(qū)域。結(jié)合車(chē)載遙感廣告牌數(shù)據(jù)與當(dāng)下主流區(qū)域檢測(cè)器各自的特點(diǎn),本文選擇了MSER(最大穩(wěn)定極值區(qū)域)方法用于無(wú)人機(jī)數(shù)據(jù)的文本區(qū)域檢測(cè)。該方法具備穩(wěn)定性良好、可同時(shí)檢測(cè)不同精細(xì)程度的區(qū)域,并且對(duì)灰度圖像仿射變化具有不變性的優(yōu)勢(shì)。

MSER檢測(cè)首先對(duì)影像數(shù)據(jù)進(jìn)行灰度轉(zhuǎn)化處理,再將其各個(gè)像素量化,設(shè)立量化灰度級(jí)數(shù)為G=256,灰度取值范圍為0~255。對(duì)量化后的圖像二值化,生成二值圖像。在預(yù)設(shè)的灰度取值范圍內(nèi),生成的灰度圖像閾值每發(fā)生一次改變都會(huì)生成一幅與之對(duì)應(yīng)的二值圖。當(dāng)閾值取極小時(shí)圖像為全白,當(dāng)閾值取極大時(shí)圖像為全黑,如圖2所示。在閾值不斷由極小向極大變化的過(guò)程中,會(huì)存在著一些與其周?chē)幕叶茸兓啾容^變化非常小的連通域,這些連通域便是初步檢測(cè)到的MSER,即初步的文本候選區(qū)域。該方法提取的MSER,背景對(duì)比度較大,自身的灰度值較為穩(wěn)定,并且該區(qū)域在梯度閾值變化下灰度值保持得較好。由于靜態(tài)場(chǎng)景圖像中,同等灰度變化條件下文字區(qū)域背景波動(dòng)較強(qiáng),而文字區(qū)域則在灰度變化時(shí)較穩(wěn)定,因而應(yīng)用該算法能夠提取常規(guī)方法例如顏色聚類(lèi)等不能提取的一些連通域。

圖2 梯度閾值下的MSER

2)文本特征分析。本文結(jié)合最大穩(wěn)定極值區(qū)域的提取結(jié)果和原始數(shù)據(jù)中的文本特征,制定了一些針對(duì)性較強(qiáng)的先驗(yàn)知識(shí),以此為約束條件過(guò)濾類(lèi)文本區(qū)域,可以提高M(jìn)SER的獲取精度。

(1)基于字符長(zhǎng)短軸長(zhǎng)度比的約束條件。中文字符的構(gòu)成以筆畫(huà)為基礎(chǔ),字符的構(gòu)成特征鮮明,又被稱(chēng)為方塊字。結(jié)合此特點(diǎn),以字符中心為原點(diǎn),穿過(guò)原點(diǎn)到達(dá)字符邊界的橫軸和縱軸比例是被約束在一定范圍內(nèi)的。經(jīng)過(guò)大量統(tǒng)計(jì),可見(jiàn)MSER區(qū)域中兩軸比例(該比例不區(qū)分橫縱軸先后順序)大于4∶1的區(qū)域?yàn)轭?lèi)文本區(qū)域,不存在中文字符。除此之外,一些特殊結(jié)構(gòu)的字符不能滿足先前的約束條件,如“1”和“一”等。經(jīng)過(guò)研究發(fā)現(xiàn),“1”和“一”等結(jié)構(gòu)的擬合橢圓較易獲取且方向都靠近豎直或水平,當(dāng)擬合橢圓長(zhǎng)短軸大于8∶1時(shí),候選區(qū)域不存在中文字符。

(2)基于字符孔洞數(shù)的約束條件。候選區(qū)域中的單個(gè)中文字符孔洞數(shù)目容易把控。候選區(qū)域中的單個(gè)字符的孔洞數(shù)目通常不會(huì)過(guò)多。對(duì)無(wú)人機(jī)高速公路廣告牌數(shù)據(jù)進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),區(qū)域內(nèi)單個(gè)字符的孔洞數(shù)目最多不超過(guò)五個(gè)。

(3)基于字符占空比的約束條件。中文字符的構(gòu)成區(qū)別于英文的構(gòu)成方式,由筆畫(huà)“堆積”而成,所以字符本身的像素面積與其擬合橢圓面積的比例是約束在一定范圍內(nèi)的,即占空比。由于字符偏旁部首的像素都散布松散,因此候選文本的擬合橢圓面積往往比候選的文本區(qū)域包圍盒大。實(shí)驗(yàn)表明,候選文本區(qū)域中字符占空比小于0.15且大于0.8的文本包圍盒不存在中文字符。

3) MSER二次過(guò)濾。高速公路廣告牌數(shù)據(jù)中可識(shí)別出大量MSER,而其中還包含部分的類(lèi)文本區(qū)域,如部分欄桿、廣告牌邊緣和鐵架等區(qū)域,如圖3、圖4所示。為保證提取進(jìn)度,濾除類(lèi)文本區(qū)域是必要的一步。

圖3 包含文本信息的MSER

圖4 類(lèi)文本區(qū)域

MSER是目前檢測(cè)器中性能最優(yōu)越的一種。但是其對(duì)模糊的高度敏感也使得它的應(yīng)用產(chǎn)生了明顯的弊端。本實(shí)驗(yàn)中高速公路廣告牌影像受光線變換、圖像迷糊和航拍姿態(tài)角度等因素的影響,將提取出的MSER直接納入文字算法檢測(cè),不僅加大了計(jì)算量,而且大大降低了精度。

針對(duì)上述問(wèn)題,對(duì)結(jié)果進(jìn)行過(guò)濾:①濾除長(zhǎng)短軸長(zhǎng)度比大于8∶1的候選區(qū)域;②濾除孔洞數(shù)目大于5的候選區(qū)域;③濾除占空比小于0.2而大于0.85的候選區(qū)域。實(shí)驗(yàn)結(jié)果表明,通過(guò)該方法,可以過(guò)濾一定數(shù)目為包含文本信息的MSER包圍盒。

1.2 SWT文字檢測(cè)

筆劃寬度變換(stroke width transform,SWT)字符識(shí)別算法是基于文字邊緣像素的向量字符識(shí)別算法。廣告牌包含的文本信息具有易辨識(shí)、邊緣對(duì)比度大等特性。針對(duì)該特點(diǎn),本文對(duì)原有的SWT算法進(jìn)行了優(yōu)化,具體步驟如下。

步驟1:初始化SWT[5]圖像。

步驟2:計(jì)算原圖像的Canny邊緣和梯度方向。Canny能夠準(zhǔn)確地識(shí)別圖像的實(shí)際邊緣并且還具備響應(yīng)最小的優(yōu)勢(shì),故選用Canny檢測(cè)算子對(duì)MSER中的字符像素區(qū)域進(jìn)行邊緣檢測(cè),并生成邊緣圖。Sobel算子計(jì)算MSER中各字符實(shí)際邊緣的梯度,并在邊緣精細(xì)定位的基礎(chǔ)上生成梯度方向圖。將二者結(jié)合便得到了筆畫(huà)寬度變換。

邊緣檢測(cè)保障精度的前提是圖像噪聲需控制在合理范圍。采用高斯濾波可以保證原圖像的邊緣走向不變,且能較好地保留特征點(diǎn)及邊緣特性。字符筆畫(huà)的兩邊是否具有相反方向的Canny邊緣檢測(cè)點(diǎn)很大程度上決定了實(shí)驗(yàn)結(jié)果的精度。字符邊界灰度值的變化是包含大小和方向的向量,用梯度表示。使用點(diǎn)與Sobel算子相乘等方式得到不同的梯度向量。

步驟3:濾除非邊緣點(diǎn)。字符邊緣在通過(guò)高斯濾波后部分邊緣的像素點(diǎn)存在被放大的問(wèn)題,需要通過(guò)某種約束來(lái)濾除高斯濾波后才出現(xiàn)的非邊緣點(diǎn),使邊緣盡可能平滑。某個(gè)像素點(diǎn)的位置處于圖像的實(shí)際邊緣上,則該邊緣像素點(diǎn)的梯度向量值應(yīng)該是最大的,否則濾除該非最大值。具體方法為通過(guò)設(shè)置上下閾值提高邊緣檢測(cè)精度,只用單閾值檢測(cè)邊緣的精度并不是很理想。這里采用啟發(fā)式的方法便可以得到一個(gè)上閾值和一個(gè)下閾值,而處于下閾值之下的一定為非邊緣像素。首先選用兩個(gè)指標(biāo)閾值,設(shè)置為上閾值(maxT)和下閾值(minT)。檢測(cè)過(guò)程中大于maxT的即判定為邊緣像素,低于minT的被判定為非邊緣,而位于上閾值和下閾值中間的部分看其是否與已確定的邊緣像素為鄰接關(guān)系,若與邊緣像素為鄰接關(guān)系的判斷為邊緣。

步驟4:邊緣檢測(cè)完成并生成邊緣的梯度方向圖后,沿邊緣尋找方向相反的一對(duì)梯度點(diǎn),并且以?xún)商荻赛c(diǎn)間的像素?cái)?shù)量作為其寬度大小為這對(duì)方向相反的梯度點(diǎn)賦值。求出所有一一對(duì)應(yīng)的邊緣點(diǎn),并將其相連后輸出,得到一幅由筆畫(huà)寬度組成的與原字符方向和大小一致的輸出圖,如圖5所示。

圖5 筆畫(huà)寬度計(jì)算

步驟5:二次過(guò)濾,得到SWT Map。

1.3 圖像增強(qiáng)

得到SWT Map以后,結(jié)果中字符的邊界存在模糊、裂隙、尖刺和小橋等問(wèn)題。利用圖像增強(qiáng)的方法進(jìn)行降噪處理,即進(jìn)行開(kāi)運(yùn)算和閉運(yùn)算處理,二者均可在保持原圖像面積不變或細(xì)微改動(dòng)的基礎(chǔ)上處理SWT MAP中的邊界噪聲。

2 實(shí)驗(yàn)及分析

本文以湖南省湘潭市長(zhǎng)潭西高速公路勘測(cè)項(xiàng)目為依托。研究區(qū)域位于湖南省長(zhǎng)株潭城市群長(zhǎng)潭西高速路段,長(zhǎng)度約24 km,沿線兩側(cè)廣告牌總計(jì)58個(gè)。

全部實(shí)驗(yàn)及數(shù)據(jù)采集均在相同條件下進(jìn)行。實(shí)驗(yàn)平臺(tái)為惠普筆記本電腦Envy15,CPU為Intel core i5處理器。實(shí)驗(yàn)開(kāi)發(fā)工具為MATLAB2016a。車(chē)載相機(jī)型DSC-RX1RM2,像素為4 020萬(wàn),焦距為35 mm。

根據(jù)實(shí)際情況和實(shí)驗(yàn)數(shù)據(jù)特點(diǎn)等條件,隨機(jī)抽取部分?jǐn)?shù)據(jù)并對(duì)提取的實(shí)際結(jié)果進(jìn)行前后對(duì)比。影像中由人工目視數(shù)得的字符數(shù)量為實(shí)際字符數(shù),記為T(mén),由本文算法識(shí)別并提取出的字符數(shù)量為算法提取數(shù),記為E,如表1所示。

表1 算法提取結(jié)果對(duì)比

目前該領(lǐng)域內(nèi)普遍采用國(guó)際會(huì)議ICDAR所提出對(duì)于場(chǎng)景文本提取算法優(yōu)劣的評(píng)價(jià)模型。該模型包含召回率(r)和準(zhǔn)確率(ρ)兩個(gè)評(píng)價(jià)因子。其中,召回率針對(duì)的是車(chē)載遙感影像數(shù)據(jù)中原有的文本連通域,準(zhǔn)確率則表示預(yù)測(cè)的提取結(jié)果中符合要求的正樣本有多少,表達(dá)如式(1)、式(2)所示。

(1)

(2)

式中:C表示E和T的交集。為了更加直觀地評(píng)估該算法,通過(guò)式(3)所示的方法計(jì)算其綜合性能。

(3)

式中:f表示綜合性能,上限為1,越逼近極限則表示算法性能越好;α為準(zhǔn)確率和召回率的權(quán)重因子。本文算法結(jié)果與其他方法的性能比較如表2所示。

表2 六種自然場(chǎng)景文本提取方法性能比較

實(shí)驗(yàn)結(jié)果表明,本文基于車(chē)載遙感數(shù)據(jù)的文本識(shí)別方法是魯棒的,該方法對(duì)廣告牌問(wèn)題甄別提供了有力支持。其中,文本信息提取結(jié)果為0的廣告牌為空置廣告牌;文本信息提取結(jié)果中字符數(shù)量未達(dá)要求的廣告牌為破損、污損、褶皺廣告牌;文本提取內(nèi)容存在非原廣告牌字跡的為非法廣告牌等。選取部分較為具有代表性的實(shí)驗(yàn)結(jié)果如圖6所示。

圖6 算法實(shí)驗(yàn)結(jié)果展示

3 結(jié)束語(yǔ)

本文設(shè)計(jì)的MSER檢測(cè)與二次過(guò)濾算法剔除了大量類(lèi)文本信息的干擾,減少了計(jì)算量,且對(duì)于車(chē)載遙感廣告牌數(shù)據(jù)中包含多樣性的文本區(qū)域識(shí)別表現(xiàn)是魯棒和高效的。本文落足當(dāng)下高速公路廣告牌巡檢中的應(yīng)用需求,以車(chē)載遙感廣告牌影像數(shù)據(jù)為研究對(duì)象,將現(xiàn)有自然場(chǎng)景文本算法針對(duì)車(chē)載遙感數(shù)據(jù)的特點(diǎn)進(jìn)行了改進(jìn)和優(yōu)化,實(shí)現(xiàn)了車(chē)載遙感廣告牌數(shù)據(jù)中文本信息的高精度提取,為智能廣告牌巡檢中的自動(dòng)化問(wèn)題甄別提供了新的技術(shù)支持。

首次提出了一種車(chē)載遙感高速公路廣告牌影像文本信息提取算法,并成功應(yīng)用于高速公路廣告牌巡檢中,解決了現(xiàn)有方法效率低、危險(xiǎn)性較高等難題。該技術(shù)支持了實(shí)現(xiàn)建立完善的智能化高速公路廣告牌巡檢管理系統(tǒng),同時(shí)一定程度上解決了當(dāng)下自然場(chǎng)景文本信息識(shí)別與提取方法只對(duì)英文文本信息的提取較為成熟的問(wèn)題,克服了既有方法對(duì)該應(yīng)用需求中文本提取效果欠佳的問(wèn)題。研究結(jié)論如下。

1)以長(zhǎng)潭西高速路段為實(shí)驗(yàn)載體,驗(yàn)證了車(chē)載遙感高速公路廣告牌巡檢的應(yīng)用前景。

2)提出的廣告牌文本信息提取方法的精度足以滿足搭建計(jì)算機(jī)高速公路廣告牌智能巡檢管理系統(tǒng)的需求。

本文局限性在于該方法對(duì)極少數(shù)包含藝術(shù)字、手寫(xiě)體等較復(fù)雜情況下的廣告牌文本識(shí)別效果欠佳,后續(xù)將作為研究重點(diǎn)。廣告牌中的圖像信息的檢測(cè)與提取也是進(jìn)一步研究的重點(diǎn),是開(kāi)發(fā)廣告牌智能巡檢管理系統(tǒng)的重要組成部分。

猜你喜歡
廣告牌字符車(chē)載
尋找更強(qiáng)的字符映射管理器
吹不倒的廣告牌
高速磁浮車(chē)載運(yùn)行控制系統(tǒng)綜述
字符代表幾
一種USB接口字符液晶控制器設(shè)計(jì)
電子制作(2019年19期)2019-11-23 08:41:50
網(wǎng)絡(luò)廣告商的創(chuàng)新正被應(yīng)用到戶(hù)外廣告牌上
消失的殖民村莊和神秘字符
智能互聯(lián)勢(shì)不可擋 車(chē)載存儲(chǔ)需求爆發(fā)
高層樓頂廣告牌鋼結(jié)構(gòu)探討
基于ZVS-PWM的車(chē)載隔離DC-DC的研究
肥乡县| 衡东县| 西乌| 永兴县| 尼玛县| 兴海县| 河北区| 丰镇市| 湘西| 通化县| 广东省| 望都县| 夏津县| 宝兴县| 葫芦岛市| 江北区| 宁安市| 尚志市| 马山县| 宝兴县| 环江| 清苑县| 肥西县| 长宁县| 钦州市| 阳东县| 黎川县| 江都市| 乾安县| 平果县| 邳州市| 玉龙| 江门市| 天津市| 治县。| 农安县| 天门市| 台江县| 荥经县| 桂阳县| 寿宁县|