李 可, 陳洪亮, 張生偉, 萬錦錦
(1.光電控制技術重點實驗室,河南 洛陽 471000;2.中國航空工業(yè)集團公司洛陽電光設備研究所,河南 洛陽 471000)
霧霾天氣中氣溶膠粒子對成像光線的吸收和散射會導致圖像“透光”強度減弱,能見度嚴重降低,許多特征被覆蓋或模糊,直接限制和影響了戶外數(shù)字成像系統(tǒng)效用的發(fā)揮。通過圖像去霧技術去除霧霾的影響,恢復物體原有的顏色和細節(jié)信息,得到高質量的圖像對提高戶外數(shù)字成像系統(tǒng)工作的可靠性與穩(wěn)定性具有重大的應用價值[1-2]。然而,現(xiàn)有的圖像去霧算法存在自適應能力不足的問題,對不同霧氣濃度的圖像進行處理時需要手動調整參數(shù),不能滿足數(shù)字成像系統(tǒng)自適應去霧的需求。因此對圖像霧氣濃度進行識別與分類,進而根據(jù)識別結果自適應地選擇圖像去霧算法以及參數(shù),對提高去霧算法的自適應能力將具有重要的意義。
目前,霧天圖像分類技術研究相對較少,對于霧天圖像的描述多是圍繞去霧后圖像質量評價展開。例如:文獻[3]從去霧增強后圖像的細節(jié)清晰度、色彩還原度和場景結構信息3個方面對去霧后圖像的質量進行無參考客觀評價;文獻[4]提出了一種利用絕對差值和人工合成霧天圖像的全參考評價算法和一種利用圖像的對比度、色彩的自然度和豐富度的無參考評價算法;文獻[5]將去霧后圖像質量評價問題轉換為分類問題,利用基于圖像增強、圖像復原、統(tǒng)計先驗以及人類視覺系統(tǒng)等的特征和支持向量機分類器對去霧后圖像進行分類和質量評價;文獻[6]提出了一種基于碼書的利用自然場景統(tǒng)計與對比度、梯度、亮度混合特征的無參考霧天圖像質量評價算法;文獻[7]利用圖像功率譜斜率、對比度、噪聲和飽和度等特征對圖像天氣進行分類,區(qū)分晴、陰、雨、霧等天氣;文獻[8]提取圖像飽和度的均值、方差為特征,利用K-均值聚類的方法實現(xiàn)對霧天圖像的識別;文獻[9]提取圖像能見度、暗通道強度和對比度為特征實現(xiàn)對霧天圖像的識別。
現(xiàn)有的去霧圖像質量評價算法從去霧后的細節(jié)還原度、色彩還原度等方面對圖像質量進行評價,評價的是去霧后圖像的視覺效果;天氣識別算法只能識別出圖像是否是霧天圖像,上述算法均不能對原始圖像中霧氣的濃度進行區(qū)分。由于戶外數(shù)字成像系統(tǒng)工作環(huán)境不固定,場景多變,而且許多是移動成像系統(tǒng),無法使用預設標記物對圖像進行距離標定的方法得到能見距離。基于上述研究背景,本文提出了一種基于SVM和混合特征的霧天圖像分類算法。通過對訓練圖像的特征向量集進行有監(jiān)督學習來形成分類器,最終實現(xiàn)霧天圖像的自動識別與分類,其實現(xiàn)流程如圖1所示。首先提取訓練集中圖像的特征向量形成特征數(shù)據(jù)集,之后人工對訓練集中圖像進行標記,合并特征數(shù)據(jù)集形成完整的霧天圖像訓練數(shù)據(jù)集,最后使用有監(jiān)督學習的方法,利用數(shù)據(jù)集對分類器進行訓練,得到霧天圖像分類器。對于測試圖像,提取其特征向量,輸入訓練好的霧天圖像分類器,利用分類器輸出結果確定霧天圖像的類別。
圖1 霧天圖像分類算法流程Fig.1 Flow chart of haze image classification algorithm
文獻[10]提出在無霧圖像的非天空區(qū)域里,若把圖像分為多個子塊,則每個子塊中都會有某些像素點的一個顏色通道的亮度接近于0,即暗通道先驗規(guī)律。對于任意的輸入圖像J,其暗通道可以表示為
(1)
式中:Jc表示彩色圖像的每個通道,暗通道圖像即求出每個像素RGB分量中的最小值的圖像。同一個場景,有霧和無霧時原始圖像及其暗通道圖如圖2所示。
圖2 原始圖像及其暗通道圖Fig.2 The original images and their dark channel images
對比圖2a和圖2b可以看出,無霧圖像的暗通道圖相比有霧圖像的暗通道圖,其低像素值所占比例更高。本文使用直方圖來定量描述有霧和無霧圖像暗通道圖中像素值的分布,如圖3所示。
圖3 暗通道直方圖Fig.3 Dark channel histogram
由圖3可見,有霧圖像暗通道像素值主要分布在100~200的區(qū)間中,而無霧圖像暗通道像素值主要集中分布在0~100的區(qū)間中。如果將暗通道直方圖直接作為特征向量來對霧天圖像進行分類,特征向量為256維,則維數(shù)過高,因此本文提出將256維的暗通道直方圖簡化得到8維的暗通道直方圖(DCH)作為霧天圖像的特征向量,即
(2)
圖4所示分別是有霧和無霧圖像的8維暗通道直方圖。
圖4 圖像暗通道直方圖Fig.4 Image DCHs
霧霾天氣中,由于大氣散射的影響,有霧圖像與無霧圖像相比,高頻信息減少,細節(jié)豐富度降低,因此利用圖像的小波變換將圖像從時域變換至頻域,進而描述圖像中細節(jié)的豐富程度。圖像的小波變換中二維尺度函數(shù)和平移基函數(shù)分別為[11-12]
φj,m,n(x,y)=2j/2φ(2jx-m,2jy-n)
(3)
(4)
式中:ψH表示沿列方向的變化;ψV表示沿行方向的變化;ψD表示對應對角線方向的變化。大小為M×N的圖像f(x,y)的離散小波變換是
(5)
(6)
式中:j0是一個任意的開始尺度;Wφ(j0,m,n)系數(shù)定義f(x,y)在尺度J0處的近似;Wiψ(j,m,n)系數(shù)對尺度j≥j0附加了水平、垂直和對角方向的細節(jié)。圖2中原始有霧和無霧圖像的三尺度小波變換如圖5所示。
圖5 圖像小波變換Fig.5 Image wavelet transforms
由圖5可見,無霧圖像小波變換后水平、垂直和對角3個方向上圖像的細節(jié)豐富度比有霧圖像的高,而有霧圖像第三尺度近似圖像的亮度比無霧圖像的高。本文提出一種小波變換均值特征(WLM),使用圖像小波變換后的小波系數(shù)絕對值的均值和尺度近似系數(shù)絕對值的均值作為圖像的特征向量來表征圖像的細節(jié)豐富程度,即
(7)
(8)
對于三尺度小波變換,有9個小波系數(shù)均值特征,加上1個尺度近似系數(shù)均值特征,共同組成一個10維的特征向量。有霧及無霧圖像的小波系數(shù)均值特征及尺度近似系數(shù)均值特征如圖6所示。
圖6 圖像小波分解均值特征Fig.6 Image WLM
MITTAL等在2012 年提出的BRISQUE算法中使用了去均值歸一化系數(shù)(Mean Subtracted Contrast Normalized,MSCN)來表示圖像的特征[13-14],即
(9)
(10)
(11)
如圖7所示,隨機選取4幅自然場景的圖像,其MSCN系數(shù)歸一化分布如圖8a所示。
圖7 4幅自然圖像Fig.7 4 natural images
圖2中有霧及無霧圖像的MSCN系數(shù)歸一化分布如圖8b所示。
圖8 MSCN系數(shù)歸一化分布Fig.8 MSCN normalized distribution
由圖8可見,自然場景圖像MSCN系數(shù)的分布具有明顯的規(guī)律,對于同一個場景,有霧圖像的MSCN系數(shù)分布比無霧圖像的更集中。先前對自然場景統(tǒng)計的研究表明廣義高斯分布(General Gaussian Distribution,GGD)可以表示圖像的系數(shù)變化,即
(12)
(13)
式(12)中的系數(shù)相對來說是一種有規(guī)律的分布,但是圖像失真等原因會使系數(shù)的分布有一定變化,這種變化可以使用不對稱的廣義高斯分布(Asymmetric Generalized Gaussian Distribution,AGGD)來進行擬合,即
(14)
分布的均值也是參數(shù)之一
(15)
通過提取GGD的2個參數(shù)α,β以及AGGD的上、下、左、右4個方向上的系數(shù)γ,βl,βr,η,共得到18個參數(shù),不同尺度下圖像的特征有一定差別,因此在兩個尺度下分別提取其去均值歸一化系數(shù)特征,得到一個36維的特征向量。
支持向量機(SVM)是常用的有監(jiān)督學習分類器,SVM在解決小樣本非線性及高維模式分類識別中表現(xiàn)出許多特有的優(yōu)勢。SVM算法的目的就是要尋找一個最優(yōu)超平面H,使得H不僅能把不同類樣本正確分開,而且不同類樣本中每個點到H的距離最小值之和達到最大,稱為最大間隔,其中,能取到距離最小值的那些樣本稱為支持向量(SVs)[15]。
以兩類數(shù)據(jù)分類為例, 給定訓練樣本集(xi,yi),i=1,2,…,l,x∈Rn,y∈{±1},超平面記為(w·x)+b=0,為使分類面對所有樣本正確分類并且具備分類間隔,要求滿足約束
yi[(w·xi)+b]≥1i=1,2,…,l。
(16)
可以計算出分類間隔為2/‖w‖,因此構造最優(yōu)超平面的問題就轉化為在約束式下求
(17)
(18)
(19)
從而得到最優(yōu)分類超平面(w*·x)+b*=0,最優(yōu)分類函數(shù)為
f(x)=sgn[(w*·x)+b*]=
(20)
對于線性不可分情況,SVM的主要思想是將輸入向量映射到一個高維的特征向量空間,并在該特征空間中構造最優(yōu)分類面。
采用有監(jiān)督學習的方法時需要首先對圖像集進行標定,由于事先沒有使用標準能見度測量儀器對圖像能見度進行定量標定,所以使用人工對圖像進行標記的方法,通過人眼對圖像中有霧與否以及對圖像中場景距離的判斷得到大致的能見距離,將圖像分為無霧、輕霧、濃霧3類,對應的氣象能見距離分別為10 km以上、0.5 km~10 km和0.5 km以下。
通過搜集和拍攝得到了一個包含657幅圖像的圖像集,并經過人工對于無霧、輕霧及濃霧的標記。對每張圖像分別計算其DCH特征、WLM特征以及MSCN系數(shù)分布特征,經過歸一化得到一個54維的特征向量,合并得到了特征向量集。
從657幅圖像中隨機選取438幅圖像作為訓練集,另外219幅圖像作為測試集,利用訓練集的特征向量集及其標記對SVM分類器進行訓練,測試集的特征向量集輸入訓練好的SVM分類器,利用分類結果同人工標記的對比計算分類正確率。
本文使用Intel?CoreTMi3-4170CPU和3.4 GB內存的計算機,在Windows XP和Matlab2012a環(huán)境下進行仿真實驗。
為了驗證混合特征對于不同霧氣濃度的線性可分性,對比使用了線性SVM分類器和非線性SVM分類器。其中,非線性SVM分類器的核函數(shù)分別使用了:1) 多項式型(γ*u′*v+ccoef0)ddeg;2) RBF函數(shù)exp(-γ|u-v|2);3) Sigmoid函數(shù)tanh(γ*u′*v+ccoef0)。其中,γ=1/k,ddeg=3,ccoef0=0。
實驗結果如表1所示。
表1 不同SVM分類器實驗結果
由表1可見,線性SVM分類器分類結果正確率最高,因此選取線性SVM分類器作為霧天圖像分類的分類器。
改變權重系數(shù)可以改變不同特征在分類器中影響能力的大小,因此經過大量的實驗優(yōu)化了權重系數(shù)搭配。219幅測試圖片中人工標記結果為無霧54幅,輕霧151幅,濃霧14幅,實驗結果如表2所示。
表2 不同特征權值實驗結果
由表2可見,單獨使用1種特征或2種特征得到的分類正確率小于使用3種特征組合的混合特征得到的分類正確率,并且通過調整各個特征的權重系數(shù)可以得到更優(yōu)的分類正確率,分類正確率最高可以達到95.89%,并且各類別的分類正確率也均高于其他權重系數(shù)時的正確率。
文獻[8]中對于霧天圖像的識別正確率達到90%,文獻[9]中霧天圖像的識別正確率為95.6%,但是上述文獻只是對圖像是否為霧天圖像進行判斷,不能對圖像中霧氣濃度進行區(qū)分,所以難度和正確率均較本文結果偏低。
最后,對算法各部分運算所用時間進行統(tǒng)計,處理一幅像素大小為1024×768的圖像所用時間見表3。
表3 算法各部分運算時間
本文提出了一種基于線性SVM和混合特征的霧天圖像分類算法,為自適應去霧系統(tǒng)提供參考。首先,采用由暗通道直方圖特征、小波變換均值特征及去均值歸一化系數(shù)特征組合而成的混合特征向量對圖像能見距離進行描述;其次,利用特征向量集對SVM分類器進行訓練;最后,利用訓練好的SVM分類器對圖像進行分類,并調整各個特征的權重系數(shù)對分類器進行優(yōu)化。
實驗結果證明,本算法能夠有效區(qū)分無霧、輕霧、濃霧的圖像,同人工主觀分類結果對比,分類正確率達到95.89%。下階段的工作是擴大圖像集,對類別進一步細化,使算法能夠更準確地分辨更多等級的霧氣濃度,為自適應去霧系統(tǒng)提供更精確的參考依據(jù),并對算法計算量進行優(yōu)化,減少運算時間,以滿足對視頻圖像實時處理的要求。
[1] 王燕,伍博,谷金宏.一種單幅圖像去霧方法[J].電光與控制,2011,18(4):65-67,92.
[2] 陳劍鵬,畢篤彥,熊磊,等.基于雙重域的圖像去霧新算法[J].電光與控制,2015,22(6):17-20.
[3] 李大鵬,禹晶,肖創(chuàng)柏.圖像去霧的無參考客觀質量評測方法[J].中國圖象圖形學報,2011,16(9):1753-1757.
[4] 郭璠,蔡自興.圖像去霧算法清晰化效果客觀評價方法[J].自動化學報,2012,38(9):1410-1419.
[5] 南棟,畢篤彥,馬時平,等.基于分類學習的去霧后圖像質量評價算法[J].自動化學報,2016,42(2):270-278.
[6] 李從利,陸文駿,石永昌,等.基于碼書的霧天圖像質量評價方法研究[J].圖學學報,2014,35(6):876-882.
[7] 李騫,范茵,張璟,等.基于室外圖像的天氣現(xiàn)象識別方法[J].計算機應用,2011,31(6):1624-1627.
[8] 孟凡軍,李天偉,徐冠雷,等.基于K均值聚類算法的霧天識別方法研究[J].現(xiàn)代電子技術,2015,38(22):80-83.
[9] YU X L,XIAO C B,DENG M K,et al.A classification algorithm to distinguish image as haze or non-haze[C]//The 6th International Conference on Image and Graphics, IEEE,2011:286-289.
[10] HE K M,SUN J,TANG X O.Single image haze removal using dark channel prior[C]//IEEE Conference on Com-puter Vision and Pattern Recognition,2009:1956-1963.
[11] MALLT S A.Theory for multi-resolution signal decomposition:the wavelet representation [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1989,7(11):674-693.
[12] 孫洪飛.基于小波變換的圖像特征提取方法研究[D].南京:南京郵電大學,2012.
[13] MITTAL A,MOORTHY A K,BOVIK A C.No-reference image quality assessment in the spatial domain[J].IEEE Transactions on Image Processing,2012,21(12):4695-4708.
[14] 李俊峰.基于RGB色彩空間自然場景統(tǒng)計的無參考圖像質量評價[J].自動化學報,2015,41(9):1601-1615.
[15] 姜斌,和湘,孫月光,等.一種改進的支持向量機模式分類方法[J].電光與控制,2007,14(4):23-26.