崔兆韻,張承明,楊曉霞,鞏雯雯,周 虎
(1.泰安市氣象局,山東 泰安271000;2.山東農(nóng)業(yè)大學(xué)信息科學(xué)與工程學(xué)院,山東 泰安271018;3.山東省數(shù)字農(nóng)業(yè)工程技術(shù)中心,山東 泰安271018)
近年來,隨著遙感技術(shù)的進(jìn)步以及多種遙感系統(tǒng)的應(yīng)用,遙感圖像分辨率不斷增加,同時地物的光譜信息也越來越豐富,充分合理地利用這些特征可有效提高分類效果[1]。影像分類的核心是遙感圖像特征學(xué)習(xí)與特征提取[2]。傳統(tǒng)的基于光譜統(tǒng)計特性的分類方法如最大熵方法、K 最近鄰域等,僅利用圖像的光譜、形狀等低層信息,未能充分利用影像中豐富的細(xì)節(jié)信息而導(dǎo)致分類準(zhǔn)確性較低,對于復(fù)雜的高分辨率遙感影像表現(xiàn)出許多不足[3-5]。因此,為進(jìn)一步提取分類精度,在高分辨率遙感影像的分類過程中融入了大量的空間幾何分布規(guī)律等信息,并引入機器學(xué)習(xí)(Machine Learning,ML)相關(guān)算法如支持向量機(Support vector machine,SVM)[6]、隨機森林(Random forest,RF)[7]、神經(jīng)網(wǎng)絡(luò)(Neural networks,NN)[8]等進(jìn)一步提高分類精度。
當(dāng)前,深度學(xué)習(xí)(DeepLearning,DL)[9]作為機器學(xué)習(xí)范疇內(nèi)最富有生命力的新領(lǐng)域,由底層(輸入層)輸入數(shù)據(jù),由低到高逐層提取特征,從而挖掘數(shù)據(jù)在時間與空間上的規(guī)律,建立起低層次特征到高級語義之間復(fù)雜的映射關(guān)系,從而提升分類的準(zhǔn)確性[10]。當(dāng)前,使用由深度學(xué)習(xí)相關(guān)算法訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)模型在計算機視覺等領(lǐng)域已經(jīng)得到顯著成果。然而,運用其開展針對高分辨率遙感影像分類中的研究工作還相對較少,相關(guān)技術(shù)仍不夠成熟。
選用深度學(xué)習(xí)的典型模型-卷積神經(jīng)網(wǎng)絡(luò)模型(Convolutional Neural Networks,CNN)[11],綜合利用了影像更深層次的特征進(jìn)行分類,編程實現(xiàn)一種快速高效的分類模型,并應(yīng)用到高分一號遙感影像的地物分類中。
CNN,將人工神經(jīng)網(wǎng)絡(luò)技術(shù)和深度學(xué)習(xí)方法相結(jié)合,使用一種基于梯度的改進(jìn)反向傳播算法來訓(xùn)練網(wǎng)絡(luò)中的權(quán)重,實現(xiàn)了深度學(xué)習(xí)的多層過濾器網(wǎng)絡(luò)結(jié)構(gòu)以及過濾器和分類器結(jié)合的全局訓(xùn)練算法[12]。其降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量,在視覺圖像處理領(lǐng)域進(jìn)行的實驗,得到了很好的效果,目前已成為當(dāng)前語音分析和圖像識別領(lǐng)域的研究熱點[13]。作為一種采用共享權(quán)值和局部連接的前饋式多層感知機神經(jīng)網(wǎng)絡(luò),主要包括兩大部分,分別為預(yù)測模型和訓(xùn)練模型,其對大量的數(shù)據(jù)采用有監(jiān)督訓(xùn)練的方式進(jìn)行訓(xùn)練,進(jìn)而建立起一種輸入到輸出的映射關(guān)系[14]。該網(wǎng)絡(luò)主要由卷積層(特征提?。⑾虏蓸訉樱ǔ鼗僮鳎?、全連接層三種類型的神經(jīng)網(wǎng)絡(luò)層和一個輸出層組成,其中卷積層與下采樣層交替出現(xiàn),如圖1 所示。每一個神經(jīng)網(wǎng)絡(luò)層都包含多個二維平面,同時每個二維平面都包括任意多個獨立的神經(jīng)元。每一個二維平面中的單個神經(jīng)元只同前一層局部感受野范圍內(nèi)的神經(jīng)單元相連接,并由卷積運算操作而提取局部特征。
以黑龍江省某試驗區(qū)為實驗研究區(qū),黑龍江省占地面積為46 萬多平方千米,處于中緯度歐亞大陸東沿;北面臨近寒冷的西伯利亞,跨中溫帶與寒溫帶,屬于高緯度大陸性季風(fēng)氣候??偟臍夂蛱卣鳛樗募痉置?,冬季漫長而寒冷,夏季短暫而炎熱,而春、秋季氣溫升降變化快,時間較短。受地理環(huán)境、海陸氣團(tuán)和季風(fēng)的交替影響,各季氣候差異顯著,變化很大。冬季在極地大陸氣團(tuán)控制下,氣候寒冷干燥;夏季受副熱帶海洋氣團(tuán)影響,降水充沛,氣候溫?zé)幔煌瑫r其地形、地貌較為復(fù)雜。選用采集時間為2016-08-25,位于北緯43.264 3°~53.330 9°、東經(jīng)121.110 2°~135.053 2°的高分一號全色和多光譜遙感影像進(jìn)行研究。該影像覆蓋多種地物類型,主要有建筑物、道路、水域、林地、草地等5 種,原始圖像如圖2 所示。
圖1 CNN 示意圖
圖2 原始影像
在進(jìn)行分類前,需要對原始數(shù)據(jù)進(jìn)行輻射定標(biāo)、大氣校正、幾何校正等預(yù)處理操作,其中最主要的操作是幾何校正;然后對預(yù)處理后的影像,進(jìn)行全色和多光譜數(shù)據(jù)的融合,以提高分類的準(zhǔn)確度。借助ENVI 軟件,對全色和多光譜數(shù)據(jù)的三波段彩色合成,采用多項式插值法進(jìn)行幾何校正、三次卷積法進(jìn)行重采樣,然后進(jìn)行大氣校正、植被增強和圖像融合。融合后的影像如圖3 所示。
圖3 融合后的影像
將融合后的影像,結(jié)合使用面向?qū)ο蟮姆诸惣夹g(shù),選用“對象個數(shù)最多法”進(jìn)行影像分割,得到適合每一種地物的最優(yōu)分割尺度。在分類樣本的選取過程中,考慮到地物的光譜、紋理等特征,每一類地物類型大約均勻地選取1 000 個有代表性的樣本。并且將每一類樣本輸入圖像的大小統(tǒng)一歸一化為(200×200 像素)×3 通道,并將彩色圖像轉(zhuǎn)為灰度圖像,使用灰度圖像作為CNN 的輸入。
在實驗過程中,隨機抽取其中的2/3 作為訓(xùn)練樣本進(jìn)行特征學(xué)習(xí)監(jiān)督訓(xùn)練;剩余的1/3 作為測試數(shù)據(jù)。研究設(shè)定網(wǎng)絡(luò)為1 個輸入層、2 個卷積層和下采樣層,3 個全連接層,學(xué)習(xí)速率為[0.1,3],慣性系數(shù)為[0,0.95],迭代次數(shù)為[30,45],實驗輸出每次迭代的誤差和總的判斷誤差,通過多次試驗結(jié)果驗證,最終確定網(wǎng)絡(luò)的學(xué)習(xí)速率為1,慣性系數(shù)為0.5,迭代次數(shù)為40,進(jìn)行模型的評價與分析。圖4 給出了部分地物的樣本圖像。
圖4 樣本集示意圖
在高分辨率遙感影像的分類過程中,由于數(shù)據(jù)的多樣性和復(fù)雜性,本文采用卷積神經(jīng)網(wǎng)絡(luò)對圖像特征進(jìn)行學(xué)習(xí)與提取,在網(wǎng)絡(luò)的輸出層結(jié)合標(biāo)簽數(shù)據(jù)訓(xùn)練一個多類別的分類器。如圖5 所示,隨著實驗迭代次數(shù)的增加,網(wǎng)絡(luò)訓(xùn)練的錯誤率隨著迭代次數(shù)逐漸收斂至0.002。
在網(wǎng)絡(luò)訓(xùn)練完成后經(jīng)過對比分析,得到網(wǎng)絡(luò)最優(yōu)參數(shù)。同時根據(jù)上述實驗分析所得模型參數(shù),進(jìn)行遙感影像的識別與分類,并與其他兩種不同分類算法進(jìn)行對比,不同分類算法的識別分類結(jié)果如表1 所示。
考慮到現(xiàn)有分類方法大多采用淺層學(xué)習(xí)結(jié)構(gòu),在表達(dá)復(fù)雜函數(shù)問題時會具有一定的局限性,導(dǎo)致分類精度相對較低。針對該問題,重點探討了如何應(yīng)用在包含大量數(shù)據(jù)細(xì)節(jié)信息的高分辨率遙感影像的分類中。本文基于深度學(xué)習(xí)算法和Matlab 環(huán)境下的Deep learning toolbox 工具箱,構(gòu)建能夠?qū)Χ喾N復(fù)雜智能問題有效建模的深層次模型——CNN 模型;并且對模型中的參數(shù)進(jìn)行反復(fù)試驗對比分析,同時結(jié)合面向?qū)ο蠓诸惣夹g(shù)充分考慮各地物、像元之間的關(guān)系,得到適合高分遙感影像分類的最優(yōu)參數(shù)。實驗證明,該模型可有效提高分類精度。
圖5 CNN 訓(xùn)練錯誤率收斂曲線
表1 不同算法實驗對比