朱藝洵,張 晰*,孟俊敏
(1.山東科技大學(xué) 測(cè)繪與空間信息學(xué)院,山東 青島 266590;2.自然資源部第一海洋研究所,山東 青島 266061)
海冰影響著全球的氣候變化,并通過與大氣的相互作用反饋于全球環(huán)境系統(tǒng)[1]。隨著全球氣候變暖,北極海冰的劇烈變化對(duì)全球影響已不容忽視。海冰類型是描述海冰狀態(tài)的重要參數(shù),因此海冰類型的研究分析對(duì)全球氣候、極地環(huán)境與安全監(jiān)測(cè)均有著重要意義[2]。
早期海冰類型只能通過實(shí)地調(diào)查測(cè)得,耗費(fèi)大量人力物力[3-4]。隨著遙感技術(shù)的發(fā)展,基于光學(xué)和SAR遙感影像的分類方法得到了應(yīng)用[5],但該方法受限于遙感影像成本且空間覆蓋范圍較小,難以實(shí)現(xiàn)大尺度的海冰分類。與SAR相比,微波輻射計(jì)和微波散射計(jì)雖然空間分辨率低,但覆蓋范圍廣,能滿足極地海冰類型大尺度觀測(cè)需求[6-7]。與微波散射計(jì)和輻射計(jì)類似,高度計(jì)因其具備大范圍觀測(cè)的優(yōu)勢(shì),近年來逐漸得到了人們的重視,已成功應(yīng)用于海冰類型識(shí)別方面[8]。同時(shí),人們研究發(fā)現(xiàn),利用衛(wèi)星高度計(jì)進(jìn)行海冰分類能更準(zhǔn)確地估算海冰厚度。這是因?yàn)樵诶酶叨扔?jì)反演海冰干舷和估算海冰厚度時(shí),均需要提供海冰類型信息。以往的海冰類型信息取自于其他傳感器,在時(shí)間上與高度計(jì)并不同步,從而引入反演誤差[9]。所以為獲取更高精度的海冰厚度數(shù)據(jù),當(dāng)前的高度計(jì)衛(wèi)星均需具備海冰類型分類能力。
傳統(tǒng)的衛(wèi)星高度計(jì)數(shù)據(jù)的獲取主要依賴于國(guó)外衛(wèi)星,如ERS-1/2、ENVISAT、CryoSat-2(CS-2)和Sentinel-3A等。隨著我國(guó)航天技術(shù)的進(jìn)步,截至2020年,我國(guó)已發(fā)射了HY-2A/B/C3顆衛(wèi)星高度計(jì),未來還將發(fā)射HY-2D衛(wèi)星高度計(jì),形成四星組網(wǎng)觀測(cè),以實(shí)現(xiàn)對(duì)北極地區(qū)的全覆蓋、高精度監(jiān)測(cè)。HY-2高度計(jì)的出現(xiàn)不僅為北極海冰監(jiān)測(cè)提供了新的數(shù)據(jù)源,也使我國(guó)利用自主生產(chǎn)的高度計(jì)監(jiān)測(cè)極地成為了可能,同時(shí)緩解了對(duì)國(guó)外高度計(jì)衛(wèi)星數(shù)據(jù)的依賴。
在衛(wèi)星高度計(jì)海冰類型識(shí)別算法研究方面,可分為三大類,一是區(qū)分海冰和開闊水域(Open Water,OW),二是區(qū)分海冰類型,三是對(duì)海冰與冰間水道(LEAD)進(jìn)行區(qū)分。
在區(qū)分海冰和OW方面,Jiang C等[10]使用閾值分割、K最近鄰法(K-Nearest Neighbor,KNN)和支持向量機(jī)(Support Vector Machine,SVM)3種算法對(duì)雙波段HY-2A/B數(shù)據(jù)的自動(dòng)增益控制(Automatic Gain Control,AGC)和脈沖峰值(Pulse Peakiness,PP)2個(gè)波形特征進(jìn)行處理,用來區(qū)分海冰和OW區(qū)域,OW分類精度最多可以達(dá)到98.36%,海冰的分類精度最高為92.84%,但文章未對(duì)海冰類型進(jìn)行進(jìn)一步地細(xì)分。在對(duì)海冰類型進(jìn)行識(shí)別方面,Zygmuntowska M等[11]在格陵蘭島和加拿大北部海域利用CS-2高度計(jì)數(shù)據(jù),采用貝葉斯分類器和波形功率最大值(Maximum Power,MAX)、后緣寬度(Trailing Edge Width,TEW)和PP3個(gè)波形特征對(duì)一年冰(First-year ice,F(xiàn)YI)與多年冰(Multi-year ice,MYI)進(jìn)行了識(shí)別。Rinne E等[12]利用CS-2高度計(jì)數(shù)據(jù),采用KNN算法和前緣寬度(Leading Edge Width,LEW)、PP、棧標(biāo)準(zhǔn)差(Stack Standard Deviation,SSD)和后緣比(Late Tail to Peak Power Ratio,LTPP)4個(gè)波形特征,對(duì)北極區(qū)域的OW、薄一年冰(Thin First-year ice,TFYI)、FYI和 MYI進(jìn) 行 了 識(shí)別,與同期冰況圖相比,該算法的識(shí)別精度約為82%。Shen X等[13]提出了基于LEW、TEW、后向散射系數(shù)(Sigma0)、MAX和PP6種波形參數(shù)的組合進(jìn)行對(duì)北極區(qū)域FYI、MYI和OW的分類,平均分類精度達(dá)到了91.45%。Aldenhoff W等[14]結(jié)合SAR與CS-2數(shù)據(jù),選取PP、SSD與比例逆平均功率(Scaled Inverse Mean Power,IMP)識(shí)別MYI、FYI與LEAD,進(jìn)而對(duì)各參數(shù)進(jìn)行敏感性分析實(shí)驗(yàn)。在檢測(cè)LEAD方面,Laxon S W等[15]利用PP和SSD兩種波形特征進(jìn)行LEAD和海冰的識(shí)別。Lee S等[16]提出了一種波形混合算法來檢測(cè)來自CS-2數(shù)據(jù)中的LEAD。王立偉等[17]結(jié)合PP、SSD等3個(gè)波形特征參數(shù)和海冰密集度,基于CS-2高度計(jì)完成了對(duì)海冰和LEAD的有效識(shí)別。焦慧等[18]結(jié)合波形SKEW、KURT特征與SSD、PP、左脈沖峰值(Left Pulse Peakiness,PPL)等5個(gè)波形參數(shù)對(duì)CS-2進(jìn)行LEAD識(shí)別。
綜合國(guó)內(nèi)外學(xué)者的研究可知,目前海冰分類研究主要是圍繞國(guó)外衛(wèi)星高度計(jì)數(shù)據(jù)開展的,鮮有學(xué)者基于我國(guó)國(guó)產(chǎn)HY-2高度計(jì)進(jìn)行研究。目前僅有Jiang C等[10]使用HY-2A/B數(shù)據(jù)的PP與AGC特征進(jìn)行海冰和OW的區(qū)分,但仍未實(shí)現(xiàn)對(duì)海冰類型的精確識(shí)別,且僅分析了PP和AGC兩個(gè)特征在冰水區(qū)分中的作用,未對(duì)更多的波形特征進(jìn)行對(duì)比分析[10]。因此與國(guó)外高度計(jì)海冰類型識(shí)別的工作相比,利用國(guó)產(chǎn)HY-2衛(wèi)星高度計(jì)進(jìn)行海冰分類還需克服以下幾方面的問題:(1)目前基于HY-2進(jìn)行海冰分類研究使用的波形特征參數(shù)比較單一,較少的波形特征無法對(duì)波形信息進(jìn)行全面的表征,并且缺少對(duì)單個(gè)波形特征進(jìn)行定量分析的工作;(2)目前已有的研究并未對(duì)海冰類型進(jìn)行精確的分類,僅完成了冰和水間的區(qū)分,缺少了對(duì)不同的海冰類型間的劃分;(3)目前的工作僅使用了單個(gè)的波形特征進(jìn)行分類實(shí)驗(yàn),未嘗試結(jié)合多波形特征進(jìn)行海冰類型識(shí)別。
探索國(guó)產(chǎn)衛(wèi)星高度計(jì)在海冰類型識(shí)別中的可用性,有利于緩解對(duì)國(guó)外數(shù)據(jù)源的依賴。同時(shí)基于以上3個(gè)問題,本文利用HY-2B衛(wèi)星高度計(jì)數(shù)據(jù),通過提取PP、LEW、Sigma0及MAX共4種典型的波形特征,開展對(duì)TFYI、FYI、MYI、LEAD和OW共5類地物的識(shí)別研究。進(jìn)而詳細(xì)分析和評(píng)估HY-2B衛(wèi)星的海冰類型識(shí)別能力。
HY-2B高度計(jì)是我國(guó)發(fā)射的脈沖有限型雷達(dá)高度計(jì),于2018年10月25日6時(shí)57分在太原衛(wèi)星發(fā)射中心順利升空。HY-2B為雙頻雷達(dá)高度計(jì),工作在Ku和C波段,中心頻率分別為13.58 GHz和5.25 GHz。空間覆蓋范圍達(dá)到南北緯80.69°,軌道傾角為9.34°,運(yùn)行重復(fù)子周期為14 d,脈沖有限足跡優(yōu)于2 km。因此,HY-2B覆蓋整個(gè)北極地區(qū)大約需要14 d。表1記錄了HY-2B高度計(jì)的幾個(gè)重要參數(shù)[10]。HY-2B高度計(jì)可公開提供L1B、L2和L33種級(jí)別的產(chǎn)品。其中L2級(jí)產(chǎn)品又分為臨時(shí)地球物理數(shù)據(jù)產(chǎn)品(Interim Geophysical Data Records,IGDR)、遙感地球物理數(shù)據(jù)產(chǎn)品(Sensor Geophysical Data Records,SGDR)和地球物理數(shù)據(jù)產(chǎn)品(Geophysical Data Records,GDR)。三種產(chǎn)品中僅有SGDR數(shù)據(jù)包含有波形信息。在本研究中,使用的是L2 SGDR產(chǎn)品中的20 Hz Ku波段數(shù)據(jù),數(shù)據(jù)獲取自國(guó)家衛(wèi)星海洋應(yīng)用中心(https://osdds.nsoas.org.cn)。
表1 HY-2B高度計(jì)部分參數(shù)
本文使用的數(shù)據(jù)為2019年12月和2020年3月北極地區(qū)的HY-2B雷達(dá)數(shù)據(jù),分別代表了北極冬季和初春的冰情,每月約可提供約500萬左右的點(diǎn)元數(shù)據(jù)進(jìn)行研究。為控制數(shù)據(jù)質(zhì)量,避免錯(cuò)誤的波形信息對(duì)分類算法產(chǎn)生負(fù)面影響,本文對(duì)HY-2B數(shù)據(jù)進(jìn)行了預(yù)處理:首先選擇大于60° N的北極地區(qū),并使用SGDR文件自帶的標(biāo)志位對(duì)陸地進(jìn)行去除;然后去掉了所有波形信息為空的錯(cuò)誤波形;最后去掉所有Sigma0值為NAN的數(shù)據(jù)。其余數(shù)據(jù)篩選步驟參照HY-2B高度計(jì)用戶手冊(cè)[19]。圖1為預(yù)處理后的2019年12月的HY-2B數(shù)據(jù)覆蓋范圍,值得說明的是,拉普捷夫海、東西伯利亞海附近海域在預(yù)處理后存在數(shù)據(jù)缺失現(xiàn)象,絕大多數(shù)是由于波形數(shù)據(jù)缺失導(dǎo)致的。其它月份的數(shù)據(jù)也存在相似情況。
圖1 2019年12月北極HY-2B覆蓋范圍
本文在海冰類型識(shí)別時(shí)使用的訓(xùn)練和檢驗(yàn)輔助數(shù)據(jù)為俄羅斯北極和南極研究所(Arctic and Antarctic Research Institute,AARI)提供的北極冰況圖數(shù)據(jù)。除北半球夏季外,該數(shù)據(jù)每周提供一次全北極的海冰類型產(chǎn)品。該海冰類型產(chǎn)品是通過綜合光學(xué)、近紅外、SAR等衛(wèi)星數(shù)據(jù)以及船舶走航觀測(cè)得到的[20]。AARI提供的冰況圖產(chǎn)品為Shapefile格式,包含有6種冰類型:尼羅冰、初生冰、FYI、MYI、固定冰和OW,空間分辨率為12.5 km。
在選用與HY-2B數(shù)據(jù)時(shí)間相對(duì)應(yīng)的北極區(qū)域2019年12月和2020年3月的AARI數(shù)據(jù)進(jìn)行訓(xùn)練和檢驗(yàn)樣本提取時(shí),參考了世界氣象組織(World Meteorological Organization,WMO)制定的海冰分類標(biāo)準(zhǔn),主要開展TFYI,F(xiàn)YI,MYI和OW4種類型的識(shí)別,其中TFYI為厚度<70 cm的海冰(對(duì)應(yīng)AARI中的尼羅冰和初期冰)。
需要說明的是,AARI冰況圖無法提供尺度較小的LEAD樣本,因此本文將另外選用冰間水道產(chǎn)品對(duì)LEAD信息進(jìn)行提取。
本文在進(jìn)行LEAD識(shí)別時(shí)使用的訓(xùn)練和檢驗(yàn)輔助數(shù)據(jù)來自Hoffman等利用MODIS數(shù)據(jù)公開發(fā)布的冰間水道檢測(cè)結(jié)果[21],該產(chǎn)品目前提供了從2002—2020年的北極地區(qū)最小時(shí)間間隔為1 d的LEAD分布,產(chǎn)品分辨率為1 km。
本文采用的MODIS冰間水道產(chǎn)品中包含兩大類數(shù)據(jù),其一是每日的LEAD信息,以NC格式存儲(chǔ),其二是標(biāo)準(zhǔn)的經(jīng)緯度對(duì)照表。為此,將冰間水道產(chǎn)品的NC文件與其自帶的標(biāo)準(zhǔn)經(jīng)緯度文件進(jìn)行匹配,得到北極LEAD分布信息。
為 成 功 識(shí) 別 出 OW、MYI、FYI、TFYI及LEAD 5類地物,本文方法可分為如下幾步:(1)進(jìn)行訓(xùn)練樣本的提取,通過輸入AARI北極冰況圖和MODIS冰間水道產(chǎn)品提取相對(duì)應(yīng)的5種地物類型,并以向量的形式對(duì)樣本進(jìn)行存儲(chǔ);(2)是提取HY-2B的波形特性,選取了4種經(jīng)典的波形特征對(duì)波形進(jìn)行描述;(3)使用柯爾莫哥洛夫—斯米爾諾夫檢驗(yàn)(Kolmogorov-Smirnov test,K-S test),即KS檢驗(yàn)對(duì)以上4個(gè)波形特征進(jìn)行可分離性測(cè)試,并得出波形特征重要性初步的結(jié)論;(4)選取經(jīng)典的KNN分類器對(duì)各波形特征組合進(jìn)行分類,同時(shí)對(duì)分類器最優(yōu)參數(shù)設(shè)置進(jìn)行分析;(5)最終與AARI冰況圖和MODIS冰間水道產(chǎn)品相比,得到分類精度,進(jìn)而確定最優(yōu)的波形參數(shù)組合。圖2為本文算法流程。
圖2 本文算法流程圖
第一步,進(jìn)行LEAD樣本的提取。MODIS冰間水道產(chǎn)品提供時(shí)間間隔為1 d的LEAD產(chǎn)品,選取對(duì)應(yīng)日期的HY-2B數(shù)據(jù)與其進(jìn)行匹配,提取經(jīng)緯度相同的數(shù)據(jù)為本文的LEAD訓(xùn)練樣本。但由于LEAD的數(shù)量較少,在這里每月選用了3 000樣本,其中訓(xùn)練樣本2 100個(gè),驗(yàn)證樣本900個(gè),訓(xùn)練樣本與驗(yàn)證樣本相互獨(dú)立。
第二步,進(jìn)行MYI、FYI、TFYI和 OW 4種類型的海冰樣本提取。選擇這段時(shí)間內(nèi)與AARI冰況圖時(shí)間間隔小于1 d的HY-2B數(shù)據(jù),通過完成HY-2B與AARI冰況圖的位置匹配,提取海冰類型的樣本。需要說明的是,上述的樣本選擇都是隨機(jī)選取且在空間上均勻分布。
另外,當(dāng)LEAD樣本與海冰類型樣本在空間上重疊時(shí)(這種概率非常?。捎玫臑楸g水道樣本,因?yàn)镸ODIS冰間水道產(chǎn)品與HY-2數(shù)據(jù)的時(shí)間間隔最小。MYI、FYI、TFYI和OW 4類樣本每月各10 000個(gè),其中訓(xùn)練樣本7 000個(gè),驗(yàn)證樣本3 000個(gè),兩者相互獨(dú)立。
第三步,以向量的形式對(duì)5類樣本進(jìn)行存儲(chǔ),形式為某地物及與之相對(duì)應(yīng)的波形特征。
來自HY-2B雷達(dá)高度計(jì)的返回信號(hào)被采樣到128個(gè)bin的范圍窗口中,該信號(hào)通常稱為回波波形。利用高度計(jì)回波波形進(jìn)行海冰類型識(shí)別重要的任務(wù)之一就是提取波形的特征參數(shù)。為了能夠定量地描述波形的形狀并考慮信號(hào)強(qiáng)度和寬度的差異,結(jié)合前人研究結(jié)果,本文選擇了MAX、PP、LEW和Sigma0共4個(gè)經(jīng)典的波形特征進(jìn)行海冰分類實(shí)驗(yàn)。PP、LEW與Sigma0可實(shí)現(xiàn)對(duì)ENVISAT與CS-2高度計(jì)波形的較好分類[23]。MAX 是 Zygmuntowska M 等[11]、Rinne E等[12]、Shen X等[13]均使用過的波形特征。因此以上4個(gè)經(jīng)典的波形特征被選用于本文實(shí)驗(yàn)。其中,LEW、PP和MAX需要從波形中計(jì)算得到,Sigma0可以從HY-2B數(shù)據(jù)中直接讀取。圖3展示了歸一化后五類地物的典型波形。
MAX:特征1(F1),它是波形功率的最大值。式中,Pi為波形在第i個(gè)距離門處的功率,Pmax為波形的最大功率,下同。
PP:特征2(F2),它是雷達(dá)波形最大峰值功率與同一采樣波形里的所有波形總功率的比[22]。
LEW:特征3(F3),它是回波波形在波形前緣處最大功率值的5%和95%點(diǎn)位間的距離門數(shù)(從第一個(gè)大于最大功率5%的距離門開始到第一個(gè)大于最大功率95%的距離門結(jié)束)[23]。A1為波形前緣處最大功率的5%,A2為波形前緣處最大功率值的95%。
Sigma0:特征4(F4),它是HY-2高度計(jì)接收到的地物的表面后向反射系數(shù),在HY-2B中,該值已校正了大氣衰減和儀器誤差。
圖3 歸一化后5類地物典型波形
結(jié)合圖3可以看出,通常LEAD的表面較平緩,雷達(dá)信號(hào)多為鏡面反射,PP值較高,且LEW較小;對(duì)于OW和海冰則以發(fā)生漫反射為主,PP值低于LEAD。5類地物的PP從高到低排序分別是LEAD、FYI、TFYI、MYI和OW。對(duì)于MAX來說,LEAD要遠(yuǎn)高于其余地物,5類地物的MAX值由高到低排序?yàn)長(zhǎng)EAD、FYI、MYI、TFYI及OW。對(duì)于LEW來說,OW的LEW要大于其他4類地物。毫無疑問,通過HY-2B的波形特征的差異,可以初步實(shí)現(xiàn)對(duì)各地物的分類。
KNN是機(jī)器學(xué)習(xí)算法之一,常被用于分類處理。該方法的思路是:在測(cè)試實(shí)例中,基于某種距離度量找出訓(xùn)練集中與其最靠近的k個(gè)實(shí)例點(diǎn),然后基于這k個(gè)最近鄰的信息來進(jìn)行預(yù)測(cè)。在分類任務(wù)中可選用“投票法”,即選擇這k個(gè)實(shí)例中出現(xiàn)最多的標(biāo)記類別作為預(yù)測(cè)結(jié)果。因此,KNN分類器效率的關(guān)鍵要求如下:(1)訓(xùn)練集必須很好地代表要分類的數(shù)據(jù);(2)必須確定k值;(3)測(cè)量之間的距離必須是適當(dāng)?shù)亩攘俊?/p>
KNN目前已被應(yīng)用于高度計(jì)海冰分類實(shí)驗(yàn)中[10,12],并有著較好分類精度,因此本文也選擇此分類器進(jìn)行試驗(yàn)。另外,針對(duì)KNN分類器參數(shù)設(shè)置不同產(chǎn)生的分類精度不同,本文將通過實(shí)驗(yàn)確定最優(yōu)的分類器參數(shù)設(shè)置,并在文章最后給予推薦。
A Summary of the Research Achievements of Mongolian Folk Songs Published
本文應(yīng)用KS檢驗(yàn)定量評(píng)估單個(gè)波形特征對(duì)海冰類型的區(qū)別能力,KS檢驗(yàn)的統(tǒng)計(jì)量(KS距離)D的計(jì)算方法如下:
式中:F(x)為波形特征1的累計(jì)概率,S(x)為波形特征2的累計(jì)概率,KS距離D于兩者間距離最大時(shí)取得。
在統(tǒng)計(jì)學(xué)中,KS檢驗(yàn)可以通過量化兩個(gè)樣本的經(jīng)驗(yàn)累積分布函數(shù)之間的距離來判斷兩個(gè)數(shù)據(jù)集是否存在顯著差異。KS距離是重要的可分離性標(biāo)準(zhǔn),用于測(cè)量?jī)蓚€(gè)累積分布函數(shù)之間的最大絕對(duì)差。它可以取0至1之間的值。一般來說,KS距離大于0.5證明可以將地物進(jìn)行分類。KS距離處于0.5~0.7時(shí),說明具有部分可分離性;KS距離處于0.7~0.9之間說明有較好的分離性;KS距離大于0.9時(shí),說明具體極好的分離性。選定的0.7和0.9值是定義上述3個(gè)組的合理閾值[24]。
結(jié)合2019年12月和2020年3月的HY-2B數(shù)據(jù),對(duì)各地物類型中的4個(gè)參數(shù)進(jìn)行KS距離計(jì)算,表2定量表示了KS檢驗(yàn)后的定量結(jié)果。由表2可知,MAX值對(duì)OW和LEAD的區(qū)分度較好,OW與3種海冰間的KS距離均大于0.5,但難以區(qū)別OW與LEAD。同時(shí)還發(fā)現(xiàn)MAX對(duì)海冰和LEAD之間有著較好的區(qū)分度,在LEAD與TFYI和MYI間的KS距離均為0.5以上。但MAX對(duì)于海冰類型間的區(qū)分度較低,KS距離基本處于0.5以下。
表2 4種特征參數(shù)間的KS距離
PP對(duì)OW的區(qū)分度最好,KS距離均達(dá)到了0.7以上,充分證明了PP對(duì)OW有著較好的可分離性。同時(shí)可以看出,PP能對(duì)FYI與LEAD進(jìn)行較好的區(qū)分,KS距離達(dá)到了0.812。但是也可以發(fā)現(xiàn),僅使用PP難以對(duì)海冰類型進(jìn)行精確的區(qū)分,PP在識(shí)別其余地物類型之時(shí)的區(qū)分度就遠(yuǎn)低于OW。
LEW對(duì)OW與FYI的區(qū)分較好,也能區(qū)分FYI與TFYI,KS距離均達(dá)到了0.7以上。除FYI外,僅使用LEW無法對(duì)OW和其他海冰進(jìn)行分離,KS距離均在0.5以下。還可以看出,LEW對(duì)LEAD具有一定的區(qū)分能力,除難以對(duì)OW與LEAD進(jìn)行識(shí)別外,KS距離均達(dá)到了0.5以上。
Sigma0對(duì)于OW的區(qū)分度較高,尤其可將OW與TFYI進(jìn)行較好的分離,KS距離達(dá)到了0.7以上,但對(duì)海冰間的區(qū)分能力較低。在對(duì)MYI與LEAD的區(qū)分時(shí),其KS距離達(dá)到了0.758,為4個(gè)參數(shù)中最優(yōu)。但也可以看出,僅使用Sigma0對(duì)海冰間的區(qū)分效果不佳,MYI、FYI及TFYI間的KS距離均處于0.5以下。
3.2.1 最優(yōu)波形組合分類結(jié)果 文中使用了4個(gè)特征對(duì)Ku波段HY-2進(jìn)行分類,這意味著KNN分類器需對(duì)應(yīng)處理(24-1)個(gè)即15種特征組合,表3列舉了全部特征的15種排列組合。為定量的比較分類效果,本文使用KNN分類器對(duì)不同的特征組合的分類性能進(jìn)行了測(cè)試,設(shè)KNN采用歐氏距離衡量地物間的距離且k=3,這部分將在3.2.2節(jié)進(jìn)行描述。最后,將分類結(jié)果與AARI北極冰況圖和MODIS冰間水道產(chǎn)品進(jìn)行對(duì)比,最終求得分類精度。為盡量削弱季節(jié)及氣候變化對(duì)本文實(shí)驗(yàn)造成的誤差,本文選用了2019年12月(冬季)和2020年3月(初春)兩個(gè)季節(jié)開展實(shí)驗(yàn)。
圖4為上述兩個(gè)月數(shù)據(jù)的分類結(jié)果對(duì)比??v坐標(biāo)為15組波形特征組合,橫坐標(biāo)為平均分類精度。圖5展示了使用本文算法的最終海冰分類結(jié)果。表4至表5是15組數(shù)據(jù)中分類精度為前三的波形特征組合對(duì)應(yīng)的海冰分類精度。
結(jié)合圖4與表4可知,對(duì)于2019年12月數(shù)據(jù)來說,最好分類結(jié)果的波形組合分別為組合15、組合14及組合9。組合15為MAX、PP、LEW及Sigma0的組合,組合14為PP、LEW及Sigma0的組合,組合9為PP與LEW的組合。
結(jié)合圖4與表5可知,對(duì)于2020年3月數(shù)據(jù)來說,最好分類結(jié)果的波形組合分別為組合14、組合9及組合11,組合11為MAX、PP及LEW3個(gè)波形特征參數(shù)的組合。
對(duì)比表4和表5可知,對(duì)于2019年12月和2020年3月,組合14和組合9均能得到較高的海冰分類精度。只是2019年12月,組合14的平均分類精度較組合15略低(僅相差0.52%)。但組合14也有其自身的優(yōu)勢(shì),例如對(duì)于FYI的檢測(cè),組合14的探測(cè)精度為89.21%,高于組合15的88.45%。因此從冬季(2019年12月)和初春(2020年3月)兩個(gè)月份的結(jié)果上看,組合14(即PP、LEW及Sigma0的特征組合)可能更為普適。值得一提的是,組合14也是Paul等的實(shí)驗(yàn)中所選擇的[23]。
在2019年12月中,組合15的平均海冰分類精度略高于組合14的原因,可能在于組合15引入了MAX這一波形特征。由表2和3.1節(jié)的論述可知,MAX對(duì)OW和LEAD有較好的區(qū)分度。相比于3月,北極12月份處于初冬季節(jié),存在較多的開闊水和冰間水道,所以在這個(gè)月份MAX的引入能夠幫助提高OW和LEAD的識(shí)別精度。從表4中也能看出相較于組合14,組合15對(duì)OW和LEAD的識(shí)別精度確實(shí)有一定的提高。
圖4 2019年12月與2020年3月海冰平均分類精度
圖5 2019年12月和2020年3月海冰分類結(jié)果圖
表4 2019年12月海冰分類結(jié)果
表5 2020年3月海冰分類結(jié)果
綜合圖4與表4、表5可知,對(duì)于2019年12月和2020年3月,本文算法的最高平均精度均可以達(dá)到90%以上,尤其是對(duì)于OW來說,最高分類精度可以達(dá)到93%以上。組合1至組合4為僅使用單個(gè)波形特征進(jìn)行海冰分類實(shí)驗(yàn),若將其設(shè)為對(duì)照組,可以發(fā)現(xiàn)其分類精度均低于結(jié)合眾參數(shù)進(jìn)行實(shí)驗(yàn)的其他組合,證明多特征識(shí)別海冰的優(yōu)越性,這里的結(jié)論也與3.1節(jié)的結(jié)論是一致的。圖6統(tǒng)計(jì)了表4、表5中4項(xiàng)波形參數(shù)出現(xiàn)的頻次,由高到低對(duì)其進(jìn)行排列,分別是PP、LEW、Sigma0以及MAX。
圖6 4項(xiàng)波形參數(shù)出現(xiàn)的頻次
3.2.2 最優(yōu)分類器參數(shù)設(shè)置 為確定最優(yōu)的KNN分類器參數(shù)設(shè)置,進(jìn)一步提升海冰分類算法的準(zhǔn)確率,本文擬采用經(jīng)典的歐式距離和曼哈頓距離來衡量各目標(biāo)間的距離,同時(shí)取用k=1, 2, 3, 4, 5進(jìn)行實(shí)驗(yàn)(這也是較為常見的k值選擇)[12]。使用表3中波形組合14進(jìn)行分類實(shí)驗(yàn)。對(duì)分類器參數(shù)設(shè)置的評(píng)價(jià)標(biāo)準(zhǔn)是,五項(xiàng)地物的平均分類精度越高,則認(rèn)為分類器的參數(shù)設(shè)置最優(yōu)。表6展示了使用歐氏距離與不同k值組合的海冰分類精度,表7展示了基于曼哈頓距離的海冰分類精度。
統(tǒng)計(jì)表中結(jié)果可知,使用歐氏距離進(jìn)行海冰分類計(jì)算時(shí)的精度均略高于曼哈頓距離,平均分類精度約提高了1.3%。在k值的測(cè)試中可以看出,經(jīng)測(cè)試,當(dāng)k=3時(shí)分類效果最佳,當(dāng)k<3或k>3時(shí),分類精度均呈現(xiàn)下降趨勢(shì)。最終,根據(jù)本文實(shí)驗(yàn),推薦選用歐氏距離作為KNN分類器的度量,且k值設(shè)置為3。
表6 歐式距離與不同k值組合下的海冰分類結(jié)果
表7 曼哈頓距離與不同k值組合下的海冰分類結(jié)果
利用高度計(jì)數(shù)據(jù)監(jiān)測(cè)極地海冰是當(dāng)前研究的熱點(diǎn),本文選用國(guó)產(chǎn)HY-2B高度計(jì)進(jìn)行極地海冰分類實(shí)驗(yàn),通過結(jié)合KNN分類器與MAX、PP、LEW與Sigma04個(gè)波形特征,實(shí)現(xiàn)了對(duì)MYI、FYI、TFYI、LEAD及OW5類海冰類型的識(shí)別分類,這也是國(guó)內(nèi)外基于HY-2B進(jìn)行精確的海冰分類工作的首次嘗試,本文研究結(jié)論如下:
(1)本文通過使用KS檢測(cè)定量評(píng)估單波形特征在海冰分類中的能力。MAX對(duì)海冰和OW之間有著一定的區(qū)分能力,PP對(duì)OW的區(qū)分度最好,LEW對(duì)FYI有著較強(qiáng)的識(shí)別能力,Sigma0可用于MYI與LEAD的區(qū)分;
(2)使用不同波形特征的組合可實(shí)現(xiàn)對(duì)海冰的精確分類。通過使用AARI冰況圖產(chǎn)品及MODIS冰間水道產(chǎn)品對(duì)分類結(jié)果進(jìn)行精度檢驗(yàn),對(duì)2019年12月的數(shù)據(jù)來說,最優(yōu)波形特征組合為PP、LEW、Sigma0及MAX,對(duì)于2020年3月的數(shù)據(jù)來說,最優(yōu)的波形特征組合為PP、LEW及Sigma0。兩個(gè)月份的海冰分類的最高平均精度均可以達(dá)到90%以上,尤其對(duì)OW的分類效果最佳,達(dá)到了93%以上;
(3)綜合KS檢驗(yàn)與海冰分類結(jié)果對(duì)波形特征的重要性進(jìn)行評(píng)估,特征的重要的排序從高到低,分別是PP、LEW、Sigma0與MAX;
(4)本文對(duì)分類器的參數(shù)設(shè)置進(jìn)行了實(shí)驗(yàn),對(duì)于本文數(shù)據(jù)來說,推薦選用歐氏距離作為KNN分類器的度量,k值設(shè)置為3,此時(shí)海冰的分類精度最高。
本文研究目的是評(píng)估HY-2衛(wèi)星在海冰分類應(yīng)用中的可行性,因此采用了4個(gè)波形特征PP、LEW、Sigma0及MAX進(jìn)行分析,4者均為已在其他國(guó)外高度計(jì)衛(wèi)星中成功應(yīng)用過的波形特征[11-13,23]。后續(xù)研究將引入TEW、SSD和LTPP等其他波形特征,開展對(duì)波形特征在海冰分類中應(yīng)用的全面分析,以進(jìn)一步完善波形分類算法。受限于目前可獲取的數(shù)據(jù),本文的研究?jī)H使用了2019年12月和2020年3月冬季和初春共兩個(gè)月的HY-2B數(shù)據(jù)。為進(jìn)一步提高算法的普適性,未來將會(huì)利用大量的北極HY-2B數(shù)據(jù)繼續(xù)開展海冰分類分析,以求得適用于不同季節(jié)的海冰分類需求的普適性組合方式。對(duì)海冰分類產(chǎn)品的精度評(píng)價(jià)同樣是后續(xù)研究方向,例如不僅可開展HY-2與CS-2、Sentinel-3等其它衛(wèi)星海冰分類對(duì)比。還可開展高度計(jì)衛(wèi)星與微波輻射計(jì)或散射計(jì)等海冰類型產(chǎn)品的對(duì)比。