劉明興 劉澤平 李斌 符朝興 孟含
摘要:為解決不均勻光照下圖像二值化問題,提出一種基于最大類間方差法(OTSU算法)的改進(jìn)二值化算法,將圖片分為明亮區(qū)域和陰暗區(qū)域兩部分,分別計(jì)算兩部分最大類間方差對(duì)應(yīng)的閾值,通過分析陰暗區(qū)域特征,判斷每一像素點(diǎn)位于明亮區(qū)域還是陰暗區(qū)域,從而確定每一點(diǎn)的閾值。實(shí)驗(yàn)結(jié)果表明,該算法可以解決OTSU算法處理光照不均勻圖像丟失信息問題,可廣泛應(yīng)用于光照不均勻條件下的文本圖像二值化處理,針對(duì)特殊情況較好,相對(duì)于其他算法適用性更強(qiáng),本算法可通過提高OTSU算法的運(yùn)算速度,縮減算法的運(yùn)行時(shí)間。該研究提取信息較為完整,可以作為字符識(shí)別及缺陷檢測(cè)等工作的預(yù)處理方法,提高識(shí)別精度。
關(guān)鍵詞:二值化; OTSU; 不均勻光照; 閾值分割; 最大類間方差; 全局閾值
中圖分類號(hào): TP391.413??文獻(xiàn)標(biāo)識(shí)碼: A
近年來,數(shù)字化圖像技術(shù)在許多學(xué)科都得到了廣泛應(yīng)用[1]。例如可以結(jié)合邊緣檢測(cè)對(duì)采煤沉陷、耕地作物絕產(chǎn)邊界識(shí)別,結(jié)合快速行進(jìn)方法完成風(fēng)洞試驗(yàn)缺陷修復(fù)等[23]。在對(duì)數(shù)字化圖像進(jìn)行二值化處理時(shí),通過選取適當(dāng)?shù)拈撝担瑢D像分為背景與目標(biāo),提取其中的特征和有效信息[45]。作為圖像處理的預(yù)處理手段,當(dāng)背景光照均勻時(shí),可以有效地過濾圖像背景信息,不均勻光照的二值化算法可以有效提高自然光照下的文本識(shí)別和QR碼識(shí)別等[67]工作的速度和準(zhǔn)確度。對(duì)光照均勻的圖片進(jìn)行二值化處理時(shí),使用全局閾值方法可以將圖片中的信息提取出來,并取得較好的效果。全局閾值方法主要有灰度平均值法、基于谷底最小值的閾值、迭代法、OTSU法等[89]。其中,OTSU算法計(jì)算簡(jiǎn)單快速,受亮度和對(duì)比度影響較小,應(yīng)用較為廣泛。例如基于OTSU算法和HU不變矩進(jìn)行信號(hào)燈識(shí)別、生物組織損傷辨識(shí)等[1011]。目前,改進(jìn)OTSU算法多針對(duì)OTSU算法時(shí)間復(fù)雜度高、實(shí)時(shí)性差的問題,對(duì)OTSU算法運(yùn)行速度進(jìn)行改進(jìn),王玉銀等人[1214]基于狼群優(yōu)化或粒子群算法,提高了OTSU算法的運(yùn)行效率。但當(dāng)背景光照不均勻時(shí),OTSU算法不能很好的提取圖片中的信息。為了解決光照不均勻條件下的圖像二值化問題,一般采用局部閾值算法,例如Bernsen算法、Niblack算法、Sauvola算法等,局部閾值化算法經(jīng)常會(huì)出現(xiàn)大量噪點(diǎn),而且運(yùn)行時(shí)間也較長(zhǎng)[1516],或者基于Retinex或Gamma矯正直接對(duì)圖片進(jìn)行圖像增強(qiáng)、光照平衡后在進(jìn)行二值化處理,該方法需要在增強(qiáng)圖像后再一次對(duì)圖像進(jìn)行二值化處理,無法直接得到二值化圖像[1719]。在缺陷檢測(cè)、邊緣檢測(cè)等方面,OTSU算法經(jīng)常無法達(dá)到預(yù)期效果,羅鈞等人[2025]基于小波變換等理論,對(duì)OTSU算法在速度或適用范圍方面進(jìn)行了改進(jìn)?;诖?,本文提出了一種利用OTSU算法,分別計(jì)算圖像明亮處與陰暗處的最大類間方差,通過分析光照不均勻圖像,判斷每一像素點(diǎn)位于圖片明亮處還是陰暗處,確定每一點(diǎn)的閾值,對(duì)圖片明亮處和陰暗處分別確定兩區(qū)域的閾值。實(shí)驗(yàn)結(jié)果表明,在不均勻光照條件下,該方法可以有效提取圖像的特征和信息。該研究具有廣泛的應(yīng)用前景。
1?OTSU算法
1.1?全局二值化算法
全局二值化算法進(jìn)行二值化處理時(shí),計(jì)算一個(gè)全局閾值,逐點(diǎn)計(jì)算圖像灰度值與閾值的大小關(guān)系。將圖像中坐標(biāo)為(x,y)點(diǎn)的像素灰度值記為f(x,y),二值化處理后的圖像中坐標(biāo)為(x,y)點(diǎn)的像素值記為g(x,y),閾值記為T,則可將常規(guī)二值化方法表示為
g(x,y)=0,f(x,y) 1.2?OTSU算法 OTSU算法又名最大類間方差法,是由日本學(xué)者大津展之于1979年提出,利用整副圖像的直方圖特性,選擇全局閾值T。文字圖片和背景通常會(huì)出現(xiàn)兩個(gè)駝峰,確定一個(gè)灰度值作為閾值,將灰度值小于閾值的點(diǎn)作為目標(biāo),大于等于閾值的點(diǎn)作為背景。遍歷整副圖像灰度值,選擇類間方差最大時(shí)對(duì)應(yīng)的灰度值作為閾值,OTSU算法為目前比較好的確定閾值的算法[2630]。 采用OTSU算法計(jì)算閾值,首先選取一個(gè)灰度值作為閾值T,將圖像分成前景C0和背景C1兩類,記μ為圖像整體期望,μf為前景C0的期望,μb為背景C1的期望?;叶葹閕的像素出現(xiàn)的概率為Pi,μb為背景C1的期望,Pf為前景C0的概率,Pb為背景C1的概率,σ2B為類間方差,則有 μ=∑2550iPi, Sumf=∑Ti=0iPi, Pf=∑Ti=0Pi(2) μf=SumfPf, Sumb=∑255i=TiPi, Pb=1-Pf(3) Eb=SumbPb, σ2B=Pfμ-μf2+Pbμ-μb2(4) 當(dāng)T使類間方差σ2B為最大時(shí),這個(gè)灰度值T即為最大類間方差法所得的閾值。不均勻光照下的原圖像如圖1所示,采用OTSU算法,對(duì)不均勻光照的圖像進(jìn)行二值化處理,OTSU算法二值化處理結(jié)果如圖2所示。 根據(jù)光照強(qiáng)度的不同,將不均勻光照下的圖像分為明亮區(qū)域和陰暗區(qū)域。由圖2可以看出,對(duì)于光照不均勻的圖像,OTSU算法求得的閾值對(duì)于圖像明亮處二值化效果較好,但是對(duì)于圖像陰暗處未能提取出有效的信息。 2?改進(jìn)OTSU算法處理光照不均勻圖像 2.1?利用OTSU算法計(jì)算照片明亮處的最大類間方差 設(shè)圖像分辨率為nWidth×nHeight,每一點(diǎn)的灰度值為g(x,y),其中,0≤x≤(nWidth-1),0≤y≤(nHeight-1),0≤g(x,y)≤255。整副圖像最大類間方差對(duì)應(yīng)的閾值為T1,在計(jì)算時(shí),雖然考慮了陰暗處像素的灰度值,但對(duì)明亮處二值化效果影響不大,為減少輸入?yún)?shù),把T1作為圖像明亮處的閾值。 2.2?利用OTSU算法計(jì)算照片陰暗處的最大類間方差 [5]?徐晶晶. 低質(zhì)量文檔圖像的二值化算法研究[D]. 武漢: 湖北工業(yè)大學(xué), 2017. [6]?路陽, 高慧敏. 光照不均QR碼圖像二值化研究[J]. 太原科技大學(xué)學(xué)報(bào), 2012, 33(5): 396400. [7]?何鎏一, 楊國(guó)為. 基于深度學(xué)習(xí)的光照不均勻文本圖像的識(shí)別系統(tǒng)[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2020, 37(6): 184190, 217. [8]?楊馥溢, 何嘉. 基于深度學(xué)習(xí)的圖像檢索研究[J]. 計(jì)算機(jī)與數(shù)字工程, 2019, 47(9): 22762280, 2285. [9]?趙世峰, 何皙健. 基于OpenCV的復(fù)雜環(huán)境下圖像二值化方法[J]. 電子測(cè)量技術(shù), 2018, 41(6): 5559. [10]?余澤東. 基于otsu算法和Hu不變矩的交通信號(hào)燈識(shí)別[J]. 武漢大學(xué)學(xué)報(bào): 工學(xué)版, 2020, 53(4): 371376. [11]?李曦, 黃榮慧, 劉備, 等. 基于Otsu聚類的生物組織損傷辨識(shí)方法[J/OL]. 湖南師范大學(xué)自然科學(xué)學(xué)報(bào), 2020, (43): 8287. [12]?王玉銀. 狼群優(yōu)化的二維Otsu快速圖像分割算法[J]. 信息系統(tǒng)工程, 2020(3): 7273. [13]?張舉世. 改進(jìn)的狼群優(yōu)化二維Otsu閾值分割算法[J]. 電力學(xué)報(bào), 2020, 35(1): 4045. [14]?白元明, 孔令成, 張志華, 等. 基于改進(jìn)OTSU算法的快速作物圖像分割[J]. 江蘇農(nóng)業(yè)科學(xué), 2019, 47(24): 231236. [15]?賈坤昊, 夾尚豐, 楊栩, 等. 改進(jìn)Niblack算法及其在不均勻光照條件下的應(yīng)用[J]. 軟件導(dǎo)刊, 2019, 18(4): 8286. [16]?王鑫睿. 歷史文檔圖像二值化算法研究[D]. 武漢: 湖北工業(yè)大學(xué), 2019. [17]?曾凡鋒, 劉樹鵬. Retinex在光照不均文本圖像中的研究[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2017, 38(11): 30723079. [18]?梁琳, 何衛(wèi)平, 雷蕾, 等. 光照不均圖像增強(qiáng)方法綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2010, 27(5): 16251628. [19]?李治江, 叢林. 基于樸素貝葉斯理論的彩色圖像二值化方法研究[J]. 數(shù)字印刷, 2020(1): 1721. [20]?羅鈞, 楊永松, 侍寶玉. 基于改進(jìn)的自適應(yīng)差分演化算法的二維Otsu多閾值圖像分割[J]. 電子與信息學(xué)報(bào), 2019, 41(8): 20172024. [21]?吳延海, 潘晨, 吳楠. 改進(jìn)的Otsu遞歸分割單幅圖像去霧算法研究[J]. 西安科技大學(xué)學(xué)報(bào), 2017, 37(3): 438444. [22]?何志勇. 基于改進(jìn)OTSU法和顯著性分析的表面缺陷高效視覺檢測(cè)方法研究[D]. 江蘇: 蘇州大學(xué), 2015. [23]?李世文, 李立聰. 自適應(yīng)OTSU算法在艦船邊緣檢測(cè)中的應(yīng)用及其FPGA實(shí)現(xiàn)[J]. 軟件導(dǎo)刊, 2019(6): 176180. [24]?魏晉, 郜澤霖. 基于OTSU二值化的航天器在軌環(huán)境預(yù)測(cè)方法[J]. 計(jì)算機(jī)測(cè)量與控制, 2020, 28(4): 7579. [25]?吳佳鵬, 楊兆選, 韓東, 等. 基于小波和Otsu法的二維條碼圖像二值化[J]. 計(jì)算機(jī)工程, 2010, 36(10): 190192. [26]?郭佳. 基于光照不均勻圖像的自適應(yīng)二值化方法研究[D]. 武漢: 武漢科技大學(xué), 2013. [27]?郭佳, 劉曉玉, 吳冰, 等. 一種光照不均勻圖像的二值化方法[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2014(3): 189192, 208. [28]?Otsu N. A threshold selection method from graylevel histograms[J]. IEEE Transactions on Systems Man & Cybernetics, 2007, 9(1): 6266. [29]?Sezgin M, Sankur B. Survey over image thresholding techniques and quantitative performance evaluation[J]. Journal of Electronic Imaging, 2004, 13(1): 146165. [30]?Sahoo P K, Soltani S, Wong A K C. A survey of thresholding techniques[J]. Computer Vision, Graphics, and Image Processing, 1988, 41(2): 233260. Research on the Improved Algorithm of Processing Uneven Illumination Image Based on OTSU LIU Mingxing, LIU Zeping, LI Bin, FU Chaoxing, MENG Han (School of Electromechanic Engineering, Qingdao University, Qingdao 266071, China) Abstract: ??In order to solve the problem of image binarization under uneven illumination, an improved binary algorithm based on OTSU algorithm is proposed. The image is divided into two parts: bright region and dark region. The threshold corresponding to the maximum variance between the two parts is calculated respectively. By analyzing the characteristics of dark region, each pixel is judged to be in the bright region or dark region, and the threshold of each point is determined. The experimental results show that the algorithm can solve the problem of information loss in OTSU algorithm, and can be widely used in the binary processing of text image under the condition of uneven illumination. It is better for special cases, and more universal than other algorithms. The algorithm in this paper can reduce the running time of the algorithm by improving the operation speed of OTSU algorithm. This research can be used as a preprocessing method for character recognition and defect detection to improve the recognition accuracy. Key words: binarization; OTSU; uneven illumination; threshold segmentation; maximum inter class variance; global threshold