尹曠 王紅斌 胡帆 莫文雄 潘東東
摘要:傳統(tǒng)的Retinex算法沒有區(qū)分圖像的亮區(qū)域和暗區(qū)域,采用固定尺度對(duì)不均勻光照?qǐng)D像整體進(jìn)行增強(qiáng),自適應(yīng)性較差,且增強(qiáng)后可能會(huì)出現(xiàn)暗區(qū)域增強(qiáng)不足、亮區(qū)域增強(qiáng)過度的問題。針對(duì)此問題,提出了一種基于K-means和Retinex理論的自適應(yīng)圖像增強(qiáng)算法。該算法利用K-means算法分割圖像的亮區(qū)域和暗區(qū)域,以原始亮度和濾波函數(shù)尺度的相關(guān)性為依據(jù),自適應(yīng)地獲得各子圖的濾波尺度并進(jìn)行增強(qiáng)。驗(yàn)證結(jié)果表明,與傳統(tǒng)的圖像增強(qiáng)方法相比,該自適應(yīng)增強(qiáng)方法在圖像光照補(bǔ)償和顏色保持上表現(xiàn)良好。
關(guān)鍵詞:圖像處理;圖像增強(qiáng);Retinex; K-means;非均勻光照
中圖分類號(hào):TP391.4文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2022)16-65-6
隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,圖像數(shù)據(jù)量以驚人的速度增長(zhǎng),由于采集環(huán)境影響,不均勻光照?qǐng)D像占據(jù)了很大比例,嚴(yán)重影響了圖像的應(yīng)用價(jià)值。目前,低光照?qǐng)D像增強(qiáng)算法大多是基于Land提出的Retinex理論的改進(jìn),改進(jìn)的最終目標(biāo)是估計(jì)出準(zhǔn)確的光照?qǐng)D。經(jīng)典的單尺度Retinex(Single-Scale Retinex, SSR)[1]算法采用高斯核函數(shù)作為卷積核,通過設(shè)置適當(dāng)?shù)某叨瓤梢缘玫綄?duì)圖像光照的估計(jì)。多尺度Retinex(Multi-Scales Retinex, MSR)[2]算法由多個(gè)尺度的高斯濾波結(jié)果加權(quán)平均組成,可有效減少SSR算法中的光暈現(xiàn)象。帶色彩恢復(fù)的多尺度視網(wǎng)膜增強(qiáng)(Multi-Scale Retinex with Color Restoration,MSRCR)[3]算法在MSR算法的基礎(chǔ)上保持增強(qiáng)圖像三通道的比例,避免了色彩失真。為了更有效地保留光照突變邊緣的細(xì)節(jié)信息,Guo等[4]提出了LIME算法,該算法利用RGB三通道的最大像素值優(yōu)先估計(jì)初始光照?qǐng)D,再使用一個(gè)結(jié)構(gòu)保留的光滑模型來增強(qiáng)光照?qǐng)D。常戩等[5]提出了一種基于Retinex的改進(jìn)雙邊濾波的多聚焦融合算法,圖像細(xì)節(jié)增強(qiáng)效果特別顯著。Yang等[6]提出了基于Retinex分解和自適應(yīng)伽瑪校正的低光圖像增強(qiáng),有效增強(qiáng)了光照?qǐng)D的細(xì)節(jié)。
近年來,基于學(xué)習(xí)的圖像增強(qiáng)方法發(fā)展迅速[7],Shen等[8]將MSR算法與深度學(xué)習(xí)相結(jié)合,提出了MSR-Net網(wǎng)絡(luò)。Lv等[9]根據(jù)增強(qiáng)過程設(shè)計(jì)了分解網(wǎng)絡(luò)、照明調(diào)整網(wǎng)絡(luò)和融合細(xì)化網(wǎng)絡(luò),減少了圖像退化。但基于深度學(xué)習(xí)的方法,在增強(qiáng)效果上非常依賴于訓(xùn)練的數(shù)據(jù)集,不僅在數(shù)據(jù)收集上產(chǎn)生一定的工作量,訓(xùn)練結(jié)果也可能出現(xiàn)意想不到的效果,現(xiàn)階段很難用在工業(yè)生產(chǎn)上[10]。
本文提出了一種基于K-means的自適應(yīng)Retinex圖像增強(qiáng)算法,該算法以圖像亮度與高斯濾波函數(shù)尺度的映射關(guān)系為基礎(chǔ),在HSV空間下利用K-means聚類算法將V分量分割為若干子圖,根據(jù)子圖質(zhì)心與Retinex尺度的映射關(guān)系求解出各子圖高斯濾波尺度,再結(jié)合SSR算法完成對(duì)亮度V的整體增強(qiáng)。對(duì)比試驗(yàn)表明,本文方法更適用于不均勻光照?qǐng)鼍跋碌膱D像增強(qiáng)。
1.1非均勻光照增強(qiáng)的尺度效應(yīng)分析
由于拍攝面積大,相機(jī)的動(dòng)態(tài)范圍有限,采集到的圖像經(jīng)常會(huì)出現(xiàn)光照不均勻的情況,如圖1所示,金屬表面圖像中間區(qū)域光照較強(qiáng),相對(duì)清晰,邊緣部分較暗,無法顯示出零件細(xì)節(jié)信息。
目前,基于Retinex理論的圖像增強(qiáng)算法通常用高斯低通濾波器提取入射亮度,該方法需要根據(jù)實(shí)際處理的圖像特點(diǎn)設(shè)置合適的高斯尺度,不同尺度下的高斯濾波對(duì)入射光照的估計(jì)效果如圖2所示,對(duì)應(yīng)的增強(qiáng)效果如圖3所示。
由圖2和圖3可以看出,當(dāng)較小時(shí),光照估計(jì)圖像的細(xì)節(jié)保留效果較好,低光照區(qū)域圖像的細(xì)節(jié)能得到較好地增強(qiáng)。但對(duì)光照的估計(jì)精度較差,光照去除后容易造成顏色失真。反光金屬表面圖像的邊緣區(qū)域亮度較低,對(duì)光照估計(jì)的精度要求不高,可以用較小尺度的高斯濾波器估計(jì)光照,以最大程度地恢復(fù)極暗區(qū)域的細(xì)節(jié)信息。
當(dāng)尺度較大時(shí),圖像模糊程度提高,對(duì)光照的估計(jì)也就更準(zhǔn)確,增強(qiáng)后圖像顏色保真性較好。但無法有效地保留光照?qǐng)D像邊緣突變區(qū)域的信息,因此增強(qiáng)圖像紋理邊緣會(huì)產(chǎn)生明顯的偽影現(xiàn)象。金屬表面圖像的中間區(qū)域亮度較高,通常含有復(fù)雜的光照,因此更適合用大尺度的高斯濾波器準(zhǔn)確地估計(jì)出光照分量,以提高增強(qiáng)圖像的顏色保真性。
另外,隨著尺度的增大,運(yùn)行時(shí)間也會(huì)變得更長(zhǎng)。綜上所述,對(duì)不同亮度區(qū)域做不同尺度的Retinex增強(qiáng)可以達(dá)到既保留圖像邊緣細(xì)節(jié)又最大程度地恢復(fù)圖像顏色的目的。
1.2基于K-means的亮度聚類算法
HSV顏色空間用色調(diào)(Hue)、飽和度(Saturation)和明度(Value)三個(gè)屬性表示色彩,更符合人眼對(duì)色彩描述的直觀感受,并且三通道互不影響,可以單獨(dú)處理,非常適用于圖像增強(qiáng)任務(wù)。因此,本文算法結(jié)合這一特點(diǎn),首先將RGB空間圖像轉(zhuǎn)換到HSV空間;然后利用K-means算法單獨(dú)對(duì)V分量進(jìn)行聚類,以此將V分量劃分為若干區(qū)域,來表示圖像的亮區(qū)域和暗區(qū)域;最后以局部處理的方式,做不同的圖像增強(qiáng)處理。亮度劃分流程如圖4所示。
K-means聚類算法原理簡(jiǎn)單且易于實(shí)現(xiàn),首先,在圖像像素范圍內(nèi)隨機(jī)選取個(gè)值作為初始聚類中心,計(jì)算所有像素到聚類中心的距離,并按照最小距離原則將其分配到各類中;然后,將聚類中心值更新為各聚類區(qū)域像素的平均值,并進(jìn)行迭代更新,直到中心值不再改變。因此,初始聚類中心和距離度量方法的選擇直接影響著算法的效率和聚類效果。
由于大部分算法的初始聚類中心是隨機(jī)生成的,不可避免地會(huì)增加算法的迭代次數(shù)、降低效率。在實(shí)際應(yīng)用中,根據(jù)圖像的特點(diǎn)選取初始中心點(diǎn)至關(guān)重要,本文考慮到反光金屬表面圖像的亮度分布相對(duì)均勻,因此在0~255均勻選取個(gè)值作為初始中心,以加快收斂速度。傳統(tǒng)的K-means聚類算法與改進(jìn)后算法在運(yùn)行時(shí)間和迭代次數(shù)的對(duì)比如表1所示。
傳統(tǒng)的Retinex算法對(duì)全圖做相同的增強(qiáng)處理,并不適合于部分區(qū)域高光,部分低光的不均勻光照?qǐng)D像增強(qiáng)。因此,基于SSR算法中濾波尺度和圖像亮度的相關(guān)性,本文在HSV空間下提出一種基于K-means聚類算法的自適應(yīng)Retinex圖像增強(qiáng)算法,根據(jù)聚類質(zhì)心亮度值自動(dòng)選擇需要的尺度,不需要人工參與調(diào)節(jié)尺度參數(shù)。首先,將RGB空間的圖像轉(zhuǎn)換到HSV空間。其次,利用K-means算法把亮度分量V分割成若干子圖,并根據(jù)質(zhì)心亮度值與高斯濾波器尺度的映射關(guān)系求解出自適應(yīng)濾波尺度。再次,融合各尺度濾波后的子圖得到對(duì)入射亮度的整體估計(jì)。然后,只對(duì)V分量利用SSR算法得到增強(qiáng)后的V分量。最后,合并HSV通道并轉(zhuǎn)換到RGB空間,得到增強(qiáng)后的圖像,具體流程如圖6所示。
為驗(yàn)證本文所提算法的有效性,本文采用了4種非均勻光照?qǐng)D像增強(qiáng)算法進(jìn)行對(duì)比實(shí)驗(yàn),所采用的4種算法分別為:直方圖均衡化(Histogram Equalization,HE),SSR,MSR,MSRCR。所有算法在Microsoft Visual Studio 2017軟件下編程實(shí)現(xiàn),實(shí)驗(yàn)運(yùn)行環(huán)境為Intel(R) Core(TM) i5-7200U CPU @ 2.50 GHz 2.70 GHz,4 GB內(nèi)存的PC機(jī)。
3.1主觀評(píng)價(jià)
文中提出的算法與其他算法的圖像處理結(jié)果如圖8所示??梢钥闯觯琀E算法的細(xì)節(jié)保持效果較好,增強(qiáng)效果自然,但亮度增強(qiáng)效果差,尤其在邊緣的偏暗區(qū)域沒有得到有效的光照補(bǔ)償;SSR和MSR算法的增強(qiáng)效果整體上顏色不飽和,視覺效果較差,并且在零件周圍出現(xiàn)明顯的光暈現(xiàn)象;MSRCR算法光照補(bǔ)償效果比較好,但增強(qiáng)效果最差,顏色失真嚴(yán)重,并且參數(shù)過多,不利于自動(dòng)化實(shí)現(xiàn),不適合本文圖像場(chǎng)景;本文所提算法在色彩重建上表現(xiàn)得較為出色,圖像增強(qiáng)后飽和度更佳,產(chǎn)生了更好的視覺效果,既能有效抑制高光又沒有顏色的損失,并且在邊緣暗光區(qū)域光照補(bǔ)償效果更佳,在局部和整體上都有很好的效果。
3.2客觀評(píng)價(jià)
為了從數(shù)據(jù)上客觀地驗(yàn)證本文算法的有效性,引入了2種普適的無參考圖像質(zhì)量評(píng)價(jià)指標(biāo):自然圖像質(zhì)量評(píng)價(jià)指標(biāo)(Natural Image Quality Evaluator,NIQE)[11]和基于感知的圖像質(zhì)量評(píng)價(jià)指標(biāo)(Perception-based Image Quality Evaluator,PIQE)[12]。這2種指標(biāo)均從人類如何感知圖像質(zhì)量為出發(fā)點(diǎn),綜合了圖像局部質(zhì)量和整體質(zhì)量的評(píng)價(jià)結(jié)果。其計(jì)算的指標(biāo)能夠比較全面地解釋圖像的感知質(zhì)量,2個(gè)指標(biāo)與圖像的感知質(zhì)量均成反比,低分值表示高感知質(zhì)量,高分值表示低感知質(zhì)量。
NIQE,PIQE的評(píng)價(jià)結(jié)果如表2所示。
從對(duì)比結(jié)果可以看出,HE算法的NIQE指標(biāo)較低,雖然接近自然圖像效果,但整體較暗,不適合做圖像處理操作; SSR和MSR算法處理效果的2項(xiàng)指標(biāo)相差不大,MSRCR算法在2種指標(biāo)下均表現(xiàn)最差,和主觀評(píng)價(jià)結(jié)果保持一致。本文算法在2種指標(biāo)中均比SSR,MSR,MSRCR數(shù)值低,表明圖像增強(qiáng)效果較好,整體表現(xiàn)自然,更加符合人眼主觀視覺感受。
本文中不均勻光照?qǐng)D像增強(qiáng)算法利用K-means算法來計(jì)算V分量的最佳分割閾值,根據(jù)分割閾值自適應(yīng)選擇濾波尺度進(jìn)行增強(qiáng),很好地彌補(bǔ)了傳統(tǒng)Retinex算法需要根據(jù)圖像特點(diǎn)和處理效果手動(dòng)調(diào)節(jié)尺度的缺點(diǎn),并且基于本文提出的分割閾值與尺度的映射關(guān)系,在補(bǔ)償圖像亮度的同時(shí),也兼顧了色彩的增強(qiáng)。與其他算法相比,本文算法處理后的圖像細(xì)節(jié)較好,具有良好的顏色恢復(fù)性,主觀評(píng)價(jià)和客觀評(píng)價(jià)都有明顯的優(yōu)勢(shì)。同時(shí),由于本文算法采取了自適應(yīng)尺度算法,參數(shù)較少,可有效提高大型金屬表面的零件缺陷識(shí)別和缺陷檢測(cè)的準(zhǔn)確率,利于缺陷檢測(cè)自動(dòng)化的實(shí)現(xiàn)。
本文算法對(duì)圖像高光中心區(qū)域的色彩增強(qiáng)效果不佳,后續(xù)可針對(duì)金屬高反光圖像的特點(diǎn),加入高光抑制算法,并結(jié)合周圍像素信息來恢復(fù)高光區(qū)域的色彩。除此之外,為了保持圖像色彩一致性,還需繼續(xù)研究亮度分量V與飽和度S的關(guān)系,使圖像的S分量隨著增強(qiáng)后的V分量也進(jìn)行自適應(yīng)的調(diào)整,以保證圖像亮度與飽和度的相對(duì)關(guān)系不變,使圖像全局色彩更加自然。
[1] BINDHU A, DR U M O.Color Corrected Single Scale Retinex Based Haze Removal and Color Correction for Underwater Images[J].Color Research & Application,2020,45(6): 1084-1093.
[2] SUN L,TANG C, XU M, et al.Non-uniform Illumination Correction Based on Multi-scale Retinex in Digital Image Correlation[J].Appl. Opt,2021,60(19):5599-5609.
[3] BO J, GLENN A.WOODELL D J..Novel Multi-scale Retinex with Color Restoration on Graphics Processing Unit[J]. Journal of Real-Time Image Processing,2015,10(2):239-253.
[4] GUO X J, LI Y, LING H B.Lime: Low-light Image Enhancement via Illumination Map Estimation[J].IEEE Trans. Image Process,2016,26(2):982-993.
[5]常戩,任營,賀春澤.改進(jìn)雙邊濾波Retinex的多聚焦圖像融合[J].中國圖象圖形學(xué)報(bào), 2020, 25(3): 432-441.
[6] YANG J Y, XU Y W, YUE H J, et al. Low -light Image Enhancement Based on Retinex Decomposition and Adaptive Gamma Correction[J].IET Image Processing,2020,15(5): 1189-1202.
[7]葉魯建.基于深度學(xué)習(xí)和Retinex理論的低照度圖像增強(qiáng)算法研究[D].合肥:中國科學(xué)技術(shù)大學(xué), 2021.
[8] SHEN L, YUE Z H, FENG F, et al. MSR-net:Low-light Image Enhancement Using Deep Convolutional Network[J].[2022-04-40]. https://arxiv.org/abs/1711.02488.
[9] LV X Q, SUN Y J, ZHANG J J, et al. Low-light Image Enhancement via Deep Retinex Decomposition and Bilateral Learning[J]. Signal Processing: Image Communication, 2021,99:125-130.
[10] LI P Y, TIAN J D, TANG Y D, et al. Deep Retinex Network for Single Image Dehazing[J]. IEEE Transactions on Image Processing: A Publication of the IEEE Signal Processing Society, 2020,30:1100-1115.
[11] VENKATANATH N , PRANEETH D , CHANDRASEKHAR B , et al. Blind Image Quality Evaluation Using Perception Based Features[C]// 2015 Twenty First National Conference on Communications. Mumbai:IEEE, 2015:1-6.
[12] MITTAL A ,SOUNDARARAJAN R, BOVIK A C. Making a Completely Blind Image Quality Analyzer[J]. IEEE Signal Processing Letters, 2013, 20(3):209-212.