孟凡軍+李天偉++徐冠雷+韓云東
摘 要: 為實(shí)現(xiàn)視頻監(jiān)控設(shè)備對(duì)霧天天氣現(xiàn)象的自動(dòng)識(shí)別,提出了基于K均值聚類算法的霧天天氣現(xiàn)象自動(dòng)識(shí)別方法。該方法通過分析霧天天氣現(xiàn)象對(duì)視頻圖像采集的影響,提取圖像飽和度的均值、方差為特征參數(shù),并利用K均值聚類算法對(duì)訓(xùn)練圖像進(jìn)行分類,得到不同圖像類別的聚類中心,測試階段計(jì)算不同圖像與聚類中心的相異度即可完成分類。實(shí)驗(yàn)結(jié)果表明,該方法簡潔高效,易于實(shí)現(xiàn)對(duì)大規(guī)模圖像數(shù)據(jù)的處理,并能實(shí)現(xiàn)圖像分類后類別的標(biāo)注,對(duì)霧天的識(shí)別率高于90%。
關(guān)鍵詞:霧天; 自動(dòng)識(shí)別; K均值聚類算法; 圖像飽和度
中圖分類號(hào): TN958?34; TP391.4 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)22?0080?04
0 引 言
現(xiàn)代海戰(zhàn)往往是多軍、兵種的協(xié)同作戰(zhàn)。在影響戰(zhàn)斗力的諸多因素中,天氣是惟一無法加以控制但又具有決定意義的因素。當(dāng)艦船在霧中(包括霧、雨、雪等能見度不良天氣條件)航行時(shí),其定位、導(dǎo)航、規(guī)避等都會(huì)受到相當(dāng)大的影響。同時(shí),在城市生活中,霧也是一種常見的視程障礙類天氣現(xiàn)象,對(duì)當(dāng)?shù)厣a(chǎn)、生活和交通都產(chǎn)生著極大影響。而目前在氣象領(lǐng)域,我國氣象臺(tái)站的天氣現(xiàn)象業(yè)務(wù)仍以人工觀測為主,未完全實(shí)現(xiàn)自動(dòng)化,天氣現(xiàn)象信息的采集耗費(fèi)了大量的人力和物力。因此近年來,在智能視頻和圖像理解技術(shù)的不斷發(fā)展下,基于視頻圖像數(shù)據(jù)的天氣現(xiàn)象自動(dòng)識(shí)別研究也受到了較為廣泛的關(guān)注[1?3]。
1 研究現(xiàn)狀
近年來,人們已從不同角度對(duì)霧天天氣現(xiàn)象識(shí)別進(jìn)行了研究,并取得了一定的成果。文獻(xiàn)[1]主要針對(duì)室外圖像,著重分析了天氣現(xiàn)象對(duì)圖像采集的影響,并提取圖像各項(xiàng)特征進(jìn)行訓(xùn)練分類,對(duì)霧天的識(shí)別率[1]高于85%;文獻(xiàn)[3]對(duì)原有的雙色模型算法進(jìn)行改進(jìn),用于識(shí)別包括霧天在內(nèi)的視程障礙類天氣現(xiàn)象[3]。文獻(xiàn)[4]對(duì)同一場景采集不同天氣條件下的視頻圖像,采用了一種多垂線檢測方法,提高了霧天天氣識(shí)別的正確率[4]。文獻(xiàn)[5]提取差分圖像的紋理特征識(shí)別出當(dāng)前天氣,并實(shí)現(xiàn)了對(duì)霧天交通圖像的快速去霧[5]。
以上這些方法所提取圖像特征較為固定,對(duì)大規(guī)模數(shù)據(jù)的處理不夠高效,對(duì)霧天識(shí)別的針對(duì)性不強(qiáng),不能充分滿足當(dāng)前應(yīng)用需求。
為更快速高效地實(shí)現(xiàn)霧天的識(shí)別與分類,本文針對(duì)霧天視頻圖像進(jìn)行分析,提取圖像飽和度特征,并計(jì)算飽和度均值與方差,最后利用K均值聚類算法進(jìn)行分類識(shí)別。其基本流程如圖1所示。
2 圖像特征提取
2.1 霧天對(duì)圖像采集的影響
霧天天氣條件下,大氣中的氣溶膠含量很高,此時(shí)在可見光波段,由于氣溶膠對(duì)光波的散射作用,通過視頻成像系統(tǒng)獲得的圖像都會(huì)有一定程度的降質(zhì)[4]。
霧氣形成后,大氣粒子會(huì)形成許多反射面,并且部分大粒徑粒子會(huì)遮擋光線,這時(shí)自然光線無法穿透,而是被反射出來,各種顏色的光線被反射掉的同時(shí)也會(huì)產(chǎn)生衰減,霧就變成“白茫茫”的了。
這時(shí)候在所采集視頻圖像上的直觀反映就是飽和度的降低?;诖?,提取圖像飽和度的均值與方差作為識(shí)別霧天天氣現(xiàn)象的特征。
2.2 霧天圖像特征提取
本文首先進(jìn)行圖像由RGB模式到HSV模式的空間轉(zhuǎn)換,并從采集圖像集中隨機(jī)選100副圖像(50副霧天圖像,50副非霧天圖像)作為訓(xùn)練圖像,提取圖像的飽和度特征,并計(jì)算圖像飽和度的均值與方差,最后利用K均值聚類算法進(jìn)行分類。
RGB(物理三基色)模式是色光的彩色模式,R,G,B分別代表紅、綠、藍(lán)3種不同的顏色,3種色彩疊加形成了其他的色彩。HSV是一種主觀彩色模型,不是將某種特定的顏色分解為三原色,而是描述顏色的三種屬性,分別為色調(diào)(Hue)、飽和度(Saturation)和純度(Value)。其中,飽和度值表示顏色中摻入白光的比例,純光譜的含量越多,其飽和度值也就越高[6]。
對(duì)于任何3個(gè)在[0,1]范圍內(nèi)的R,G,B值,其對(duì)應(yīng)的HSV模式中的S(飽和度)分量可以由下面給出的公式[6]計(jì)算:
[S=1-3R+G+Bmin(R,G,B)] (1)
本文在該部分提取圖像飽和度為特征,計(jì)算其均值與方差,并形成二維數(shù)據(jù)集。
3 K均值聚類算法在霧天識(shí)別中應(yīng)用
3.1 算法概述
聚類描述的是一個(gè)無監(jiān)督統(tǒng)計(jì)過程,該過程將物理或抽象對(duì)象的集合,按照一定的計(jì)算方法,分成多個(gè)類。聚類后所生成的類是一組具有相似特征的數(shù)據(jù)對(duì)象的集合,同一類中的對(duì)象彼此相似,不同類中的對(duì)象彼此相異[7]。常用的聚類方法主要有劃分法、層次法、密度法、網(wǎng)格法以及模型法五種[7?9]。
K均值聚類是最著名的劃分聚類算法,因簡潔和高效而被廣泛使用。通常,給定一個(gè)數(shù)據(jù)點(diǎn)集合以及需要的聚類數(shù)目K(K由用戶指定),K均值聚類算法便會(huì)根據(jù)某個(gè)距離函數(shù)(本文采用歐式距離)把對(duì)象分為K個(gè)聚類。這個(gè)過程中,首先要隨機(jī)選取K個(gè)初始聚類中心,然后計(jì)算每個(gè)數(shù)據(jù)對(duì)象與各個(gè)聚類中心之間的距離(本文計(jì)算歐式距離),根據(jù)所得值將每個(gè)對(duì)象分配給距離它最近的子聚類。
聚類中心以及分配給它們的對(duì)象所形成的簇集就代表一個(gè)聚類。全部對(duì)象都被分配后,會(huì)根據(jù)聚類中現(xiàn)有的對(duì)象重新計(jì)算每個(gè)聚類的聚類中心。這個(gè)過程將不斷重復(fù),直到數(shù)據(jù)集中的任何一個(gè)對(duì)象不再被分配給不同聚類,或者所得到的聚類中心不再發(fā)生變化[9?10]。
3.2 算法流程
Step1:預(yù)處理,數(shù)據(jù)規(guī)格化
提取訓(xùn)練圖像的特征值,并對(duì)特征值進(jìn)行規(guī)格化。也就是按照一定比例,完成所提取圖像特征值到相同取值空間的映射,從而平衡各個(gè)特征值對(duì)距離的影響。本文將各個(gè)特征值映射到[0,1]區(qū)間,映射公式如下:
[ai′=ai-min(ai)max(ai)-min(ai)] (2)
式中[ai]代表選擇的圖像特征值。本文提取圖像飽和度的均值和方差形成數(shù)據(jù)集D,作為特征參數(shù)。
Step2:選取初始聚類中心
本文將圖像分為兩類(霧天與非霧天),則從數(shù)據(jù)集D中隨機(jī)選取兩個(gè)元素,作為兩個(gè)簇的初始聚類中心。
Step3:計(jì)算相異度
相異度即每個(gè)元素到聚類中心的距離。本文分別計(jì)算比較剩余元素到兩個(gè)初始聚類中心的歐式距離,將元素劃歸到距離較小的一簇。
Step4:重新計(jì)算聚類中心
根據(jù)聚類結(jié)果,取每個(gè)簇集中所有元素各自維度的算術(shù)平均值,計(jì)算得出新的聚類中心。按照新的聚類中心,將數(shù)據(jù)集中所有元素進(jìn)行重新聚類。
Step5:循環(huán)迭代
循環(huán)以上步驟(Step4),直到所得聚類中心以及聚類結(jié)果收斂到不再變化。
Step6:輸出結(jié)果[8?9]。
本文在訓(xùn)練階段提取圖像飽和度特征,計(jì)算其飽和度與方差,并運(yùn)用K均值聚類算法得到霧天圖像與非霧天圖像的聚類中心。測試階段,提取測試圖像特征并計(jì)算測試對(duì)象與聚類中心的距離,并根據(jù)最小距離對(duì)相應(yīng)圖像進(jìn)行劃分。
4 實(shí)驗(yàn)結(jié)果與分析
為測試本文所運(yùn)用的K均值聚類算法對(duì)視頻圖像中霧天識(shí)別的有效性,本文使用Intel[?]CoreTMi3?2310M CPU@2.10 GHz、RAM 4.00 GB的機(jī)器,在Matlab 7.1平臺(tái)下編程設(shè)計(jì)了相關(guān)實(shí)驗(yàn)。
實(shí)驗(yàn)數(shù)據(jù)采用的是本文采集的圖像數(shù)據(jù)1 000幅,每幅圖像均手工標(biāo)記有晴、陰、雨、霧、沙塵等天氣現(xiàn)象。由于夜間的各種天氣現(xiàn)象在圖像中反映不夠明顯,因此本文隨機(jī)抽取采集圖像數(shù)據(jù)集中100幅白天圖像(50幅霧天圖像,50幅非霧天圖像)作為訓(xùn)練樣本,樣本圖像如圖2所示。
4.1 圖像特征提取
本文首先對(duì)所選取的100幅樣本圖像進(jìn)行分析,將圖像模式進(jìn)行由RGB空間到HSV空間的轉(zhuǎn)換,經(jīng)計(jì)算得到圖像飽和度的均值與方差,得到數(shù)據(jù)集D,結(jié)果如表1所示。
4.2 聚類結(jié)果
根據(jù)3.2節(jié)所講到的K均值聚類算法流程,本文首先從數(shù)據(jù)集D中隨機(jī)選取兩個(gè)元素,作為兩個(gè)簇的聚類中心,為了計(jì)算更有說服力,分類前兩簇圖像中均包含部分霧天圖像并作以記錄。分組前的圖像特征數(shù)據(jù)分布如圖2所示。其中符號(hào)“+”和“○”代表分類前的兩簇?cái)?shù)據(jù)。
在對(duì)樣本圖像數(shù)據(jù)進(jìn)行聚類分析之后,結(jié)果如圖4所示。其中符號(hào)“+”代表K均值聚類分析后的第一類圖像(霧天圖像),“○”分別代表K均值聚類分析后的第二類圖像(非霧天圖像)。符號(hào)“☆”代表計(jì)算得到的兩個(gè)聚類中心:[0.131 3,0.021 5],[0.536 5,0.025 6]。
測試階段本文又選取采集圖像集中具有代表性的100幅圖像進(jìn)行測試,計(jì)算測試對(duì)象與聚類中心的歐式距離,并根據(jù)最小距離對(duì)相應(yīng)對(duì)象進(jìn)行劃分。
實(shí)驗(yàn)結(jié)果表明,該算法能有效地實(shí)現(xiàn)視頻圖像數(shù)據(jù)中的霧天識(shí)別,識(shí)別正確率高達(dá)90%。但對(duì)雨天圖像與霧天圖像的區(qū)分不明顯。
5 結(jié) 語
本文運(yùn)用K 均值聚類算法實(shí)現(xiàn)了視頻圖像數(shù)據(jù)中的霧天識(shí)別。實(shí)驗(yàn)證明,該算法思想簡便,并能高效地完成大規(guī)模數(shù)據(jù)的處理,達(dá)到了預(yù)期的效果。實(shí)驗(yàn)結(jié)果證明識(shí)別正確率達(dá)到90%以上。但是,本文僅限于區(qū)別霧天和非霧天兩種天氣現(xiàn)象,針對(duì)更為復(fù)雜的其他天氣現(xiàn)象識(shí)別需要基于更為復(fù)雜的算法[10]進(jìn)行進(jìn)一步研究。因此,在未來的工作中,重點(diǎn)將在如下幾個(gè)方面進(jìn)行改善和拓展:視頻圖像中雨天與霧天的區(qū)分;霧天中輕霧、中霧、濃霧的分類;其他天氣現(xiàn)象的分類。
參考文獻(xiàn)
[1] 李騫,范茵,張璟,等.基于室外圖像的天氣現(xiàn)象識(shí)別方法[J].計(jì)算機(jī)應(yīng)用,2011(6):1624?1627.
[2] ROSER M, MOOSMANN F. Classification of weather situations on single color images [C]// Proceedings of 2008 IEEE Intelligent Vehicles Symposium. Eindhoven: IEEE, 2008: 798?803.
[3] 郭佳,楊玲,吳可軍,等.基于改進(jìn)雙色模型的視程障礙類天氣現(xiàn)象識(shí)別[J].氣象科技,2013(2):236?241.
[4] 宋曉建,楊玲.基于圖像退化模型的天氣現(xiàn)象識(shí)別[J].成都信息工程學(xué)院學(xué)報(bào),2011(2):132?136.
[5] 宋洪軍,陳陽舟,郜園園.基于交通視頻的霧天檢測與去霧方法研究[J].控制工程,2013(6):1156?1160.
[6] 秦襄培,鄭賢中.Matlab圖像處理寶典[M].北京:電子工業(yè)出版社,2011.
[7] 羅可,蔡碧野,吳一帆,等.數(shù)據(jù)挖掘中聚類的研究[J].計(jì)算機(jī)工程與應(yīng)用,2003(20):182?184.
[8] MACQUEEN J B. Some methods for classification and analysis of multivariate observations [C]// Proceedings of 1967 the 5th Berkeley Symposium on Mathematical Statistics and Probability. Berkeley: [s.n.], 1967: 283?297.
[9] 徐義峰,陸春明,徐云青.一種改進(jìn)的K均值聚類算法[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(3):275?277.
[10] 謝娟英,蔣帥,王春霞,等.一種改進(jìn)的全局K?均值聚類算法[J].陜西師范大學(xué)學(xué)報(bào),2010(2):18?22.
[11] NARASIMHAM S G, NAYAR S K. Contrast restoration of weather degraded images [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, 25(6): 713?724.
[12] XU Guanlei, WANG Xiaotong, XU Xiaogang. Improved bi?dimensional empirical mode decomposition based on 2D assisted signals analysis and application [J]. IET Image Processing, 2011, 5(3): 205?221.
[13] 張馭龍,張健.基于數(shù)值天氣預(yù)報(bào)預(yù)測電波雨衰的關(guān)鍵問題分析[J].現(xiàn)代電子技術(shù),2014,37(1):27?30.