劉揚(yáng),王彬,韓雷
(1.中國海洋大學(xué)信息科學(xué)與工程學(xué)院,山東青島266100;2.國家氣象信息中心計(jì)算機(jī)室,北京100081)
各種類型云的輻射特性以及其分布情況,很大程度上影響著天氣預(yù)報(bào)的準(zhǔn)確性、氣候監(jiān)測的有效性和全球氣候變化等。但由于云的復(fù)雜多樣性,如何準(zhǔn)確地對衛(wèi)星云圖進(jìn)行自動(dòng)分類,仍是目前研究的熱點(diǎn)問題。
利用衛(wèi)星提供的圖像數(shù)據(jù)進(jìn)行云分類一般都要經(jīng)過3個(gè)步驟:數(shù)據(jù)預(yù)處理、特征提取和選擇、分類。早期簡單的云分類方法是基于圖像的閾值方法[1],而隨著衛(wèi)星相關(guān)技術(shù)以及云圖質(zhì)量的提高,采用聚類的分類方法得以廣泛研究和應(yīng)用,到80年代中后期結(jié)合神經(jīng)網(wǎng)絡(luò)方法[2-3]進(jìn)行云分類的研究也開始興起。近些年的云分類研究則是在現(xiàn)有成熟理論基礎(chǔ)上加以改進(jìn),針對具體衛(wèi)星云圖,將多種方法的優(yōu)點(diǎn)相結(jié)合[4],使分類的結(jié)果更準(zhǔn)確合理。
本文結(jié)合近幾十年國內(nèi)外的衛(wèi)星云圖云分類研究的發(fā)展情況,主要關(guān)注兩個(gè)方面:一是特征提取和選擇的方法;二是分類的方法。并簡要介紹了對分類結(jié)果的評價(jià)方法。
最常用的特征是光譜特征和紋理特征。光譜特征提取的是云在不同波段的輻射信息,如云頂亮溫、可見光反照率等。這對區(qū)分不同高度的云至關(guān)重要,在可見光圖像上亮度低的為低薄云,亮度高的是高冷云,而紅外圖像則相反。但是只用光譜特征的分類結(jié)果正確率并不高,因此也要結(jié)合云圖的紋理特征進(jìn)行分析。紋理特征是指圖像某個(gè)區(qū)域相關(guān)的灰度級空間分布特征。一般通過灰度共生矩陣、灰度級差矩陣以及和差直方圖得到的統(tǒng)計(jì)數(shù)據(jù)組成紋理特征。
衛(wèi)星資料所含的數(shù)據(jù)相當(dāng)龐大,且含有一定冗余信息。采用適當(dāng)?shù)奶卣魈崛『瓦x擇的方法可以從復(fù)雜的云系統(tǒng)特征空間中選擇出最有效的幾個(gè)特征,從而可以提高分類的運(yùn)算速度。常用的統(tǒng)計(jì)特征提取選擇算法有奇異值分解(Singular Value Decomposition,SVD)、小波包、獨(dú)立成分分析(Independent Component Analysis,ICA)等等。
SVD提供圖像的能量信息,并且提供圖像子空間上能量分布的信息Tian等人在中使用奇異值分解進(jìn)行云類的特征提取[3]。如圖1所示,分別對四種類型的云截取8×8像素的塊圖(左),各自進(jìn)行奇異值分解(右)。最大奇異值表示圖像均值,其基本體現(xiàn)圖像的光譜特征,其余的奇異值表示圖像的細(xì)節(jié)信息。Rashpal等人利用SVD方法[5]提取可見光和紅外圖像雪與云數(shù)據(jù)引起的顯著光譜和紋理特征。而Azimi-Sadjadi則介紹了一種運(yùn)動(dòng)奇異值分解(MSVD)方法[6],用來確保時(shí)域更新算法分類的準(zhǔn)確性。
圖1 一些典型8×8像素云塊圖(左)以及各自SVD取對數(shù)后的值分布(右)Fig.1Some typical 8×8 blocks(left)and their corresponding SDV values in log domain(right)
二維小波分解能很好地反應(yīng)圖像的時(shí)頻特征,分解的子圖像能提供原圖像在不同頻帶信息。分解的層數(shù)越高,頻率分辨率越高,相應(yīng)時(shí)間分辨率降低。Tian等人同樣也采用二維Haar小波包對衛(wèi)星云圖進(jìn)行3層分解來提取特征[3]。在都使用概率神經(jīng)網(wǎng)絡(luò)分類方法的條件下,對比了SVD和小波包(Wavelet Packets,WP)2種特征提取方法。使用WP進(jìn)行特征提取在整體分類準(zhǔn)確率上不如奇異值分解,而從具體類別來看,特征值分解對于提取高層云、卷層云、層積云和非云區(qū)的特征較好,而WP對提取卷云特征較好。
常用的無監(jiān)督云分類方法可分為閾值法、直方圖法、聚類法等。聚類方法是目前最常用的無監(jiān)督云分類方法,具有以下3個(gè)特點(diǎn):1)選定某種距離度量作為樣本間的相似性度量。2)確定某個(gè)評價(jià)聚類結(jié)果質(zhì)量的準(zhǔn)則函數(shù)。3)給定某個(gè)初始分類,然后用迭代算法找出使準(zhǔn)則函數(shù)取極值的最好分類結(jié)果。Z.Ameur等人使用C-均值聚類方法進(jìn)行云分類[7],分別從Meteosat衛(wèi)星圖像的0°、45°、90°、135°4個(gè)方向獲得紋理特征,利用K-均值聚類進(jìn)行圖像分割。Ameur等人則采用所謂的標(biāo)準(zhǔn)差限的適應(yīng)聚類(Standard Deviation Limited Adaptive Clustering,SDLAC)算法[8],對GOES-12、MSG-SEVIRI和MODIS衛(wèi)星圖像進(jìn)行分類。SDLAC是在迭代過程中對標(biāo)準(zhǔn)差閾值和聚類中心的調(diào)節(jié),當(dāng)聚類中心和閾值滿足要求時(shí),就產(chǎn)生新的類別。王繼光等人則是對傳統(tǒng)單一分類方法的改進(jìn),該方法綜合了遺傳算法(Genetic Algorithm,GA)、模糊C-均值聚類和模糊減法聚類[4]。GA最大的特點(diǎn)是基于全局的隨機(jī)搜索,迭代過程能避免陷入局部最優(yōu),因此和聚類方法優(yōu)缺點(diǎn)互補(bǔ)。
常用的有監(jiān)督云分類方法有近鄰法、最大似然估計(jì)法(Maximum Likelihood Estimate,MLE)、支持向量機(jī)(Support Vector Machines,SVM)等。Azimi-Sadjadi等人運(yùn)用一種等級結(jié)構(gòu)的SVM云分類方法,對GOES8衛(wèi)星的紅外通道數(shù)據(jù)用SVD方法提取特征,將圖像劃分為10類[9]。整個(gè)分類系統(tǒng)由9個(gè)兩類SVM分類器構(gòu)成,分類結(jié)構(gòu)圖如圖2所示。其中對暖陸地、冷陸地和暖水域分類準(zhǔn)確率達(dá)90%以上;對于高云如密卷云和卷層云以及低云中的層積云分類結(jié)果較為理想,整個(gè)系統(tǒng)的分類準(zhǔn)確率在78.5%左右,如果更好地利用可見光信息,準(zhǔn)確率會(huì)有所提高。
圖2 衛(wèi)星云圖分類結(jié)構(gòu)圖Fig.2Structure chart of cloud classification
隨著人工神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,使用神經(jīng)網(wǎng)絡(luò)對衛(wèi)星圖像云分類的研究也有不少進(jìn)展。常用于云分類的神經(jīng)網(wǎng)絡(luò)主要有BP神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)和自組織映射(Self Organizing Feature Maps,SOM)網(wǎng)絡(luò)。
2.3.1 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)即反饋神經(jīng)網(wǎng)絡(luò),一般由輸入層、隱含層和輸出層構(gòu)成。輸入層輸入的是樣本特征矩陣,輸出層輸出的是樣本分類類別。網(wǎng)絡(luò)訓(xùn)練經(jīng)過兩個(gè)過程。前向傳播是信號由輸入層單元傳到隱層單元,經(jīng)隱層單元逐層處理后再送到輸出層單元,由輸出層單元處理后產(chǎn)生一個(gè)輸出模式,這是一個(gè)逐層狀態(tài)更新的過程。若輸出與期望輸出模式有誤差且誤差不滿足要求時(shí),誤差轉(zhuǎn)入后向傳播過程,將誤差值沿連接通路逐層傳送并修正各層連接權(quán)值。
Welch等人用BP神經(jīng)網(wǎng)絡(luò)將AVHRR-LAC數(shù)據(jù)圖像分成10類[2]。網(wǎng)絡(luò)結(jié)果是20-55-55-10,其中20表示輸入的特征空間的維數(shù)。采用bootstrap方法獲得分類的整體正確率為87.6%。師春香等人介紹了利用BP神經(jīng)網(wǎng)絡(luò)對NOAAAVHRR衛(wèi)星圖像進(jìn)行云分類[10]。網(wǎng)絡(luò)采用20-40-15-4結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò),其中輸入層神經(jīng)元個(gè)數(shù)是特征空間的維數(shù),輸出層神經(jīng)元個(gè)數(shù)表示看了8種類別。對大量樣本進(jìn)行訓(xùn)練和驗(yàn)證后,分類的整體正確率有78%以上。
2.3.2 概率神經(jīng)網(wǎng)絡(luò)(PNN)
PNN網(wǎng)絡(luò)也是由3層組成,其中輸入層也是輸入樣本特征空間矩陣,隱含層主要有兩個(gè)作用,一個(gè)是根據(jù)樣本構(gòu)成概率密度函數(shù)p(cj|x|)估計(jì),二是根據(jù)概率密度函數(shù)構(gòu)成貝葉斯風(fēng)險(xiǎn)函數(shù),輸出層根據(jù)貝葉斯估計(jì)準(zhǔn)側(cè),做出判別。
Tian等人也利用PNN網(wǎng)絡(luò)對GOES-8數(shù)據(jù)進(jìn)行分類[3],分類整體準(zhǔn)確率有83.4%—83.8%,但是對于中層云與底層云的分類準(zhǔn)確率不高。Bankert等人采用PNN網(wǎng)絡(luò)對AVHRR數(shù)據(jù)按16×16像素的塊處理[11],將圖像劃分為10類,分別采用hold-one-out和bootstrap方法來獲得分類器理論準(zhǔn)確率分別是79.8%和77.1%。
2.3.3 SOM網(wǎng)絡(luò)
SOM網(wǎng)絡(luò)主要算法是一種無監(jiān)督的聚類方法,將任意輸入模式在輸入層映射成一維或二維離散圖形,并保持其拓?fù)浣Y(jié)構(gòu)不變。在競爭層對輸入模式的反復(fù)自組織學(xué)習(xí),得到分類結(jié)果表示出來。
LIU Yu等人認(rèn)為相比FY-2C目前使用的窗口聚類算法,SOM方法用于分類效果更好[12]。FY-2C現(xiàn)有的云分類產(chǎn)品是利用紅外通道的數(shù)據(jù)檢測云,使用水汽通道的亮溫梯度區(qū)分出高層云,使用32×32像素塊作為分類基本單元并使用聚類方法分類。分類結(jié)果表明,SOM方法不僅從像素級別上極大地改進(jìn)分類結(jié)果,也能夠準(zhǔn)確的將云團(tuán)分類成積雨云、卷云和高層云。
云分類研究因應(yīng)用目的的不同而有很大差異,對于各種分類結(jié)果的評判主要有兩種手段:一種是根據(jù)氣象專家人工評判分類結(jié)果;另一種則是根據(jù)統(tǒng)計(jì)的方法來計(jì)算分類的理論準(zhǔn)確率,如交叉驗(yàn)證hold-one-out[11]和bootstrap[2,11]方法。前者是通過對比專家標(biāo)記過的云圖來進(jìn)行評判,后者則是通過對訓(xùn)練樣本采用一定的方法重采樣構(gòu)成樣本子集,對形成的分類器再次進(jìn)行測試,得出最優(yōu)結(jié)果的分類準(zhǔn)確率。這種方法由于不能包括所有云類型情況并且計(jì)算量大,所以存在一定誤差,因此對分類結(jié)果的評價(jià)目前仍多以人工評價(jià)為主[13-14]。由于運(yùn)用不同的衛(wèi)星數(shù)據(jù)、不同的特征、不同種類和數(shù)量的類型原因等,很難定量比較分類方法的優(yōu)劣,但是對各種分類方法進(jìn)行定性比較不僅有利于方法的改進(jìn),還有助于在遙感業(yè)務(wù)上的應(yīng)用?,F(xiàn)有的云分類研究中,有對一些分類方法進(jìn)行比較的工作,得出了各方法的特點(diǎn)。文獻(xiàn)[3]是通過驗(yàn)證GOES-8數(shù)據(jù),比較了PNN和SOM這兩種神經(jīng)網(wǎng)絡(luò)的分類方法。如圖3所示,(a)是作為分類結(jié)果的參照標(biāo)準(zhǔn),(b)是同一場景使用PNN訓(xùn)練樣本所得的分類結(jié)果,(c)是使用SOM網(wǎng)絡(luò)訓(xùn)練得到的分類結(jié)果,文獻(xiàn)中指出使用PNN分類的統(tǒng)計(jì)正確率相對使用SOM網(wǎng)絡(luò)分類的正確率要高,但是SOM的網(wǎng)絡(luò)訓(xùn)練時(shí)間相對要短很多,而且分類后的云團(tuán)邊界要比使用PNN分類的云邊緣更光滑。
圖3 使用PNN和SOM分類結(jié)果圖Fig.3Classification comparison chart using PNN and SOM
綜上所述,使用衛(wèi)星圖像進(jìn)行云分類識別,是遙感圖像領(lǐng)域的熱點(diǎn)和難點(diǎn)。對衛(wèi)星云圖進(jìn)行分類核心問題是特征提取和選擇,以及分類器的設(shè)計(jì)。前者是影響分類結(jié)果的關(guān)鍵因素,后者是決定最終分類性能的重要環(huán)節(jié)。
現(xiàn)有的云分類研究,是針對某個(gè)地區(qū)或一些特定的云型設(shè)計(jì)的,由于各方法所用的衛(wèi)星數(shù)據(jù)、提取和選擇的特征、涉及云的類型不同等原因,各分類器有各自的特點(diǎn)。而今后多種分類方法的結(jié)合、多種衛(wèi)星資料的結(jié)合也是這一研究領(lǐng)域的發(fā)展方向。
[1]Desbois M,Seze G,Szejwach G.Automatic classification of cloudsonMETEOSATimagery[J].JournalofApplied Meteorology,1981,3(21):401-412.
[2]WelchRM,Sengupta SK,GorochAK.Polarcloud and surface classification using AVHRR imagery:an intercomparison of methods[J].Journal of Applied Meteorology,1992,5(31):405-421.
[3]Tian B,Shaikh M A,Azimi-Sadjadi M R,et al.A study of cloud classi cation with neural networks using spectral and textural features[J].IEEE transactions on neural networks,1999,1(10):138-151.
[4]王繼光,張韌,洪梅,等.衛(wèi)星云圖云分類的一種綜合優(yōu)化聚類方法[J].解放軍理工大學(xué)學(xué)報(bào):自然科學(xué)版,2005,6(6):585-590.WANG Ji-guang,ZHANG Ren,HONG Mei,et al.Synthetical optimization clustering method for classifying cloud from satellite images[J].Journal of PLA University of Science and Technology:natural science edition,2005,6(6):585-590.
[5]Rashpal K,Ganju A.Cloud classification in NOAA/AVHRR imageries using spectral and textural features[J].Journal of The Indian Society of Remote Sensing,2008,36(2):167-174.
[6]Azimi-Sadjadi M R,GAO Wen-feng,Haar T V,etc.Temporal updating scheme for PNN with application to satellite cloud classification-further results[J].IEEE transactions on neural networks,2001(12):1196-1203.
[7]Ameur Z,Ameur S,Adane A,et al.Cloud classi cation using the textural features of Meteosat images[J].Remote Sensing,2004,25(4):4491-4503.
[8]Berendes T A,Mecikalski J R,MacKenzie Jr.W M,et al.Convective cloud identification and classification in daytime satellite imagery using standard deviation limited adaptive clustering[J].Journal of Geophysical Research,2008,113(20):1-9.
[9]Azimi-Sadjadi M R,Zekavat S R.Cloud Classification Using Support Vector Machines[C]//Geosicience and Remote Sensing Symposium,USA:IEEE,2000(2):669-671.
[10]師春香,瞿建華.用神經(jīng)網(wǎng)絡(luò)方法對NOAA-AVHRR資料進(jìn)行云客觀分類[J].氣象學(xué)報(bào),2002,60(2):250-255.SHI Chun-xiang,QU Jian-hua.Cloud classification for NOAA-AVHRR data by using a neural network[J].Acta Meteorologica Sinica,2002,60(2):250-255.
[11]Bankert R L.Cloud classification of AVHRR imagery in maritime regions using a probabilistic neural network[J].Journal of Applied Meteorology,1994,33(8):909-918.
[12]LIU Yu,XIA Jun,SHI Chun-xiang,et al.An improved cloudclassificationalgorithmforchinaFY-2Cmultichannel images using artificial neural network[J].Sensors,2009,9(7):5558-5579.
[13]Berendes T A,Kuo K S,Logar A M,et al.A comparison of paired histogram,maximum likelihood,class elimination,and neural network approaches for daylight global cloud classificationusingAVHRR imagery[J].Journal of Geophysical Research,1999,104(6):6199-6213.
[14]師春香,吳蓉璋,項(xiàng)續(xù)康.多閾值和神經(jīng)網(wǎng)絡(luò)衛(wèi)星云圖云系自動(dòng)分割試驗(yàn)[J].應(yīng)用氣象學(xué)報(bào),2001,12(1):70-78.SHI Chun-xiang,WU Rong-zhang,XIANG Xu-kang.Automatic segmentation of satellite image using hierarchical threshold and beural network[J].Quarterly Journal of Applied Meteorology,2001,12(1):70-78.