楊麗萍,侯成磊,蘇志強(qiáng),白宇興,王 彤,馮 瑞
基于機(jī)器學(xué)習(xí)和全極化雷達(dá)數(shù)據(jù)的干旱區(qū)土壤濕度反演
楊麗萍1,侯成磊2,3,蘇志強(qiáng)2,白宇興2,王 彤1,馮 瑞2
(1. 長(zhǎng)安大學(xué)地質(zhì)工程與測(cè)繪學(xué)院,西安 710054;2. 長(zhǎng)安大學(xué)地球科學(xué)與資源學(xué)院,西安 710054;3. 山東農(nóng)業(yè)工程學(xué)院國(guó)土資源與測(cè)繪工程學(xué)院,濟(jì)南 250100)
雷達(dá)遙感是區(qū)域土壤濕度監(jiān)測(cè)最為有效的技術(shù)手段之一,為深入探討全極化雷達(dá)特征參數(shù)和不同機(jī)器學(xué)習(xí)算法對(duì)干旱區(qū)土壤濕度反演的潛力,該研究以黑河下游的居延澤為研究區(qū),基于全極化Radarsat-2數(shù)據(jù),通過標(biāo)準(zhǔn)強(qiáng)度和相位處理提取后向散射系數(shù)(Backscattering Coefficients,BC),并通過Cloude-Pottier分解(Cloude-Pottier Decomposition,CPD)與Yamaguchi分解(Yamaguchi Decomposition,YD)提取多個(gè)極化參數(shù)作為雷達(dá)影響因子,對(duì)其進(jìn)行相關(guān)性及重要性分析。采用隨機(jī)森林(Random Forest,RF)、支持向量機(jī)(Support Vector Machine,SVM)和BP人工神經(jīng)網(wǎng)絡(luò)(Back Propagation Artificial Neural Network,BP-ANN)3種不同的機(jī)器學(xué)習(xí)算法,構(gòu)建土壤濕度反演的多種模型,并使用10折交叉驗(yàn)證的方法綜合評(píng)價(jià)各模型的性能,最后使用最佳模型反演研究區(qū)土壤濕度,分析其空間分布格局與影響因素。結(jié)果表明:1)平均散射角對(duì)反演精度至關(guān)重要,熵與反熵的影響次之。交叉極化相較于同極化后向散射系數(shù)有更高貢獻(xiàn),偶次散射與體散射的重要性明顯高于表面散射和螺旋體散射。2)不同類型因子組合建模的模型,其性能表現(xiàn)均明顯優(yōu)于僅采用單種因子類型的模型。3)相較于SVM和BP-ANN模型,RF模型在干旱區(qū)土壤濕度反演中具有更好的適用性。其中,BC+CPD組合訓(xùn)練的RF模型性能最優(yōu),其驗(yàn)證集決定系數(shù)2和均方根誤差分別為0.78和6.60%,對(duì)應(yīng)的標(biāo)準(zhǔn)偏差分別為0.15和1.95%,該模型可解釋土壤濕度變化的89%。4)研究區(qū)土壤濕度平均值約為8.83%,整體呈現(xiàn)極端干旱的態(tài)勢(shì)。其中,天鵝湖附近和古湖心區(qū)的土壤濕度高于其他區(qū)域,反演結(jié)果能綜合反映區(qū)域土壤濕度空間分布的總體格局。
土壤濕度;模型;算法;RF;SVM;BP-ANN;Radarsat-2;干旱區(qū)
土壤濕度是控制陸地-大氣界面的水分、能量和碳交換等生物物理過程的基本狀態(tài)變量,是水文學(xué)、氣象學(xué)、生態(tài)學(xué)和農(nóng)業(yè)環(huán)境研究的重要參數(shù)[1]。中國(guó)西北干旱區(qū)降水稀少,水資源極其匱乏,生態(tài)環(huán)境問題突出,土壤濕度在干旱區(qū)水循環(huán)和能量平衡中扮演著十分重要的角色,對(duì)干旱區(qū)生態(tài)系統(tǒng)演變具有明顯的控制作用[2]。干旱區(qū)土壤濕度的準(zhǔn)確監(jiān)測(cè)對(duì)于區(qū)域陸地表面過程的科學(xué)研究及生態(tài)環(huán)境的可持續(xù)發(fā)展具有重要意義[3]。
土壤濕度時(shí)空異質(zhì)性特征明顯,傳統(tǒng)的監(jiān)測(cè)方法無法及時(shí)、連續(xù)、準(zhǔn)確地獲取大面積的土壤濕度信息。雷達(dá)遙感由于具有全天候、全天時(shí)以及對(duì)土壤濕度高度敏感的特點(diǎn),已成為區(qū)域尺度土壤濕度監(jiān)測(cè)的重要技術(shù)手段。其中,全極化合成孔徑雷達(dá)(Fully Polarimetric Synthetic Aperture Radar,PolSAR)技術(shù)不僅能夠獲取目標(biāo)地物的后向散射信息和幾何結(jié)構(gòu)信息,更為重要的是,它能夠同時(shí)獲取目標(biāo)地物的極化信息,為土壤濕度和地表粗糙度等相關(guān)參數(shù)的精確反演提供了可靠的信息來源。因此,關(guān)于極化特征參數(shù)與土壤濕度之間相互關(guān)系的探討備受國(guó)內(nèi)外學(xué)者關(guān)注,簡(jiǎn)單線性統(tǒng)計(jì)回歸的方法是最為常用的方法之一。Bourgeau-Chavez等[4]基于干濕季時(shí)間序列全極化Radarsat-2數(shù)據(jù)反演了美國(guó)阿拉斯加北方黑云杉林地區(qū)的土壤濕度,認(rèn)為極化特征參數(shù)在一定程度上能夠提高土壤濕度的反演精度。Xie等[5]基于多種極化參數(shù)反演了不同時(shí)期玉米地的土壤濕度,取得了較好效果,認(rèn)為PolSAR數(shù)據(jù)在土壤濕度反演中具有較大應(yīng)用潛力。然而,土壤濕度與極化特征參數(shù)之間關(guān)系復(fù)雜,線性統(tǒng)計(jì)回歸模型雖然可以從一定程度模擬這一關(guān)系,但由于模型相對(duì)簡(jiǎn)單,適用范圍有限,模擬精度有待進(jìn)一步提升,二者之間非線性關(guān)系模型的研究亟待深入。因此,建立多種極化特征參數(shù)與土壤濕度之間更為有效和精確的遙感反演模型,是充分挖掘PolSAR影像中所蘊(yùn)含的極化信息,促進(jìn)區(qū)域土壤濕度雷達(dá)遙感反演走向?qū)嵱没年P(guān)鍵問題,機(jī)器學(xué)習(xí)技術(shù)為解決這一問題提供了可能。
大量研究表明,在多參數(shù)、多類型、非線性、復(fù)雜映射關(guān)系的定量模擬中,相對(duì)于傳統(tǒng)的統(tǒng)計(jì)回歸模型而言,以隨機(jī)森林(Random Forest,RF)、支持向量機(jī)(Support Vector Machine,SVM)和BP人工神經(jīng)網(wǎng)絡(luò)(Back Propagation Artificial Neural Network,BP-ANN)等為代表的機(jī)器學(xué)習(xí)模型性能更為優(yōu)越[6-7],在土壤濕度遙感定量反演中已得到廣泛應(yīng)用[8-13]。為克服被動(dòng)微波地表土壤濕度產(chǎn)品空間分辨率較低的不足,Zhao等[7]在伊比利亞半島基于RF模型研究了土壤濕度主被動(dòng)探測(cè)衛(wèi)星(Soil Moisture Active and Passive,SMAP)土壤濕度產(chǎn)品的空間降尺度方法。研究發(fā)現(xiàn),基于RF模型的降尺度方法能夠較好地反映土壤濕度的變化,有利于提高被動(dòng)微波土壤濕度產(chǎn)品的分辨率并促進(jìn)其在小尺度范圍的應(yīng)用。曾旭婧等[8]基于小興安嶺西北的北安-黑河高速公路沿線地區(qū)的Sentinel-1 A影像,利用SVM模型,針對(duì)草地、牧場(chǎng)和冬小麥等不同植被覆蓋地表,對(duì)比了單極化、雙極化等不同極化組合方案的土壤濕度估算效果。認(rèn)為單極化中,VV極化優(yōu)于VH極化,雙極化去極化比率適用于低植被區(qū),VV極化與歸一化植被指數(shù)組合可綜合反映復(fù)雜地表環(huán)境下的土壤濕度。王雅婷等[9]協(xié)同利用全極化Radarsat-2和高分1號(hào)數(shù)據(jù),以內(nèi)蒙烏審旗毛烏素沙漠腹地的風(fēng)沙灘地區(qū)為研究區(qū),采用水云模型剔除稀疏植被對(duì)濕度反演的干擾,開展了干旱區(qū)稀疏植被覆蓋條件下土壤濕度的SVM遙感建模研究。針對(duì)組合粗糙度的不同情況,探討了不同極化方式下后向散射系數(shù)對(duì)反演精度的影響。研究發(fā)現(xiàn),僅采用后向散射系數(shù)的單數(shù)據(jù)源模型中,同極化后向散射系數(shù)模型精度更高。加入組合粗糙度參數(shù)的多數(shù)據(jù)源模型,各極化方式的模型精度均有所提升,而VV極化表現(xiàn)最佳。Alexakis等[10]結(jié)合多時(shí)相Sentinel-1和Landsat-8影像,基于后向散射系數(shù)、歸一化植被指數(shù)、熱紅外溫度和入射角等參數(shù),構(gòu)建了希臘克利特島西部0~5 cm表層土壤濕度反演的BP-ANN模型,該模型反演精度高,對(duì)流域水文模擬研究意義重大。前人研究表明,RF模型能夠減少偏差并防止過擬合,SVM模型外推能力突出,而BP-ANN模型具備良好的網(wǎng)絡(luò)柔性。由于各具特色,因此,很多學(xué)者就土壤濕度反演中不同機(jī)器學(xué)習(xí)模型及其與傳統(tǒng)模型的反演效果進(jìn)行了對(duì)比。李平湘等[11]針對(duì)冬小麥返青、拔節(jié)和乳熟3個(gè)物候期,基于全極化Radarsat-2影像的多種后向散射系數(shù)和極化特征參數(shù),構(gòu)建了河北省保定市定興縣不同植被覆蓋下土壤濕度反演的RF模型,與SVM和ANN模型的對(duì)比表明,RF模型性能更佳。王浩等[12]基于谷歌地球引擎(Google Earth Engine,GEE)平臺(tái)中的Sentinel-1 SAR數(shù)據(jù)、MODIS地表生物物理參量產(chǎn)品和SRTM DEM數(shù)據(jù),以中亞錫爾河流域中下游4個(gè)農(nóng)田子區(qū)域?yàn)檠芯繀^(qū),對(duì)比分析了上述3種機(jī)器學(xué)習(xí)模型在干旱區(qū)土壤濕度反演中的效果及適用性,認(rèn)為基于與土壤濕度顯著相關(guān)的27個(gè)因子所構(gòu)建的RF模型具有最高反演精度。郭交等[13]基于陜西楊凌示范區(qū)冬小麥生長(zhǎng)初期的Sentinel-1和Sentinel-2影像,對(duì)比了Oh模型以及SVM和ANN模型對(duì)農(nóng)田地表土壤濕度估算的效果,認(rèn)為水云模型的加入可消除植被影響,提高Oh模型的精度,但考慮植被指數(shù)的2種機(jī)器學(xué)習(xí)模型精度更高,在綜合考慮后向散射系數(shù)、植被指數(shù)、海拔和局部入射角的情況下,SVM模型表現(xiàn)最佳,其測(cè)試集的2和均方根誤差分別為0.903和0.015%。
綜上可見,協(xié)同利用機(jī)器學(xué)習(xí)和PolSAR數(shù)據(jù)的土壤濕度遙感反演研究發(fā)展迅速,然而,干旱區(qū)類似工作有限,亟需開展相關(guān)研究及廣泛驗(yàn)證。本文以中國(guó)干旱區(qū)的典型代表居延澤為研究區(qū),基于全極化Radarsat-2數(shù)據(jù)提取土壤濕度雷達(dá)影響因子,結(jié)合實(shí)測(cè)數(shù)據(jù),探討RF、SVM和BP-ANN模型在干旱區(qū)土壤濕度遙感反演中的效果和適用性。研究成果有望促進(jìn)土壤濕度遙感建模研究及區(qū)域旱情監(jiān)測(cè)和生態(tài)環(huán)境的可持續(xù)發(fā)展。
居延澤位于內(nèi)蒙古西部,是中國(guó)第二大內(nèi)陸河黑河的尾閭湖之一,地理坐標(biāo)介于41°45′N~42°10′N、101°31′E~102°00′E之間(圖1),東居延澤、西居延澤共同構(gòu)成居延澤古湖盆。湖盆東為茫茫戈壁,南抵巴丹吉林沙漠,西接額濟(jì)納綠洲,北隔阿爾泰山脈與蒙古國(guó)接壤,天鵝湖位于湖盆西北角。全區(qū)多年平均降雨量不足40 mm,多年平均蒸發(fā)量為降雨量的100倍之多。由于身居內(nèi)陸,氣候極端干旱,植被稀少,荒漠、戈壁和鹽堿地廣布,自然條件極端惡劣,水資源是影響區(qū)域可持續(xù)發(fā)展的關(guān)鍵限制因子。
2.1.1 實(shí)測(cè)數(shù)據(jù)
受區(qū)域極其嚴(yán)酷的環(huán)境條件所限,在考慮可通達(dá)性的情況下,衛(wèi)星過境期間,共采集50個(gè)土壤采樣點(diǎn)(圖1)。其中,西居延澤南部20個(gè)樣點(diǎn)、東居延澤北部6個(gè)樣點(diǎn)、西居延澤南北向13個(gè)樣點(diǎn)、天鵝湖附近11個(gè)樣點(diǎn),樣點(diǎn)設(shè)計(jì)涵蓋區(qū)域所有地物類型。通過人工開挖探坑的方法分層采集土壤樣品,探坑長(zhǎng)、寬、深均約為50 cm。本文利用表層0~10cm的土壤樣品,通過烘干法[14]測(cè)量得到土壤體積含水率以表征土壤濕度,其范圍為0.23%~38.07%。
2.1.2 遙感數(shù)據(jù)
采用居延澤地區(qū)2017年8月17日C波段Radarsat-2精細(xì)全極化模式影像,幅寬為25 km×25 km,分辨率為8 m,入射角為32.13°,影像處理級(jí)別為單視復(fù)數(shù)圖像(Single Look Complex,SLC)。利用ENVI SARScape插件進(jìn)行多視和幾何校正等預(yù)處理后,為減少斑點(diǎn)噪聲,選擇5×5像素窗口,利用PolSARpro軟件進(jìn)行Lee濾波處理。隨后,經(jīng)矩陣變換,將圖像轉(zhuǎn)換為對(duì)稱協(xié)方差矩陣。最后,提取各采樣點(diǎn)的后向散射系數(shù)和極化特征參數(shù),各樣點(diǎn)值以5×5像素窗口內(nèi)像元值的平均值表示。
首先,根據(jù)標(biāo)準(zhǔn)強(qiáng)度和相位處理、Cloude-Pottier分解(Cloude-Pottier Decomposition,CPD)[15]和Yamaguchi分解(Yamaguchi Decomposition,YD)[16]對(duì)Radarsat-2影像進(jìn)行處理,獲取雷達(dá)圖像的后向散射系數(shù)與多個(gè)極化參數(shù)作為雷達(dá)影響因子;其次,討論各因子與實(shí)測(cè)土壤濕度之間的相關(guān)性,并對(duì)雷達(dá)影響因子進(jìn)行重要性評(píng)分;第三,對(duì)BC、CPD和YD相關(guān)因子進(jìn)行組合,形成單種類型和不同類型因子組合的多種方案,作為輸入因子,構(gòu)建多種方案下的機(jī)器學(xué)習(xí)模型;第四,采用k折交叉驗(yàn)證的方法,基于決定系數(shù)2、均方根誤差(Root Mean Square Error,RMSE),以及二者相應(yīng)的標(biāo)準(zhǔn)偏差(Standard Deviation,SD),即SDR2與SDRMSE,從精確性、準(zhǔn)確性與穩(wěn)定性3個(gè)方面,定量評(píng)價(jià)各模型的綜合性能;最后,基于最佳模型開展區(qū)域土壤濕度的遙感反演,并就其空間分布格局與主要影響因素進(jìn)行探討。本文技術(shù)流程如圖2所示。
2.2.1 雷達(dá)影響因子提取
利用標(biāo)準(zhǔn)強(qiáng)度和相位處理、CPD和YD這2種極化分解方法,對(duì)Radarsat-2影像進(jìn)行處理,提取相關(guān)參數(shù),作為機(jī)器學(xué)習(xí)模型輸入因子。
1)標(biāo)準(zhǔn)強(qiáng)度和相位處理
PolSAR可以發(fā)射并接收水平(H)或垂直(V)極化的電磁波,并利用一個(gè)復(fù)二維矩陣,即極化散射矩陣完整地記錄電磁波與地物作用時(shí),在4種不同極化狀態(tài)下的信息。該矩陣表達(dá)式如下[17]:
式中下標(biāo)HH、HV、VH和VV表示4種不同的極化方式,散射單元HH代表水平發(fā)射和水平接收,VH代表垂直發(fā)射與水平接收,HV和VV定義類似。由于散射矩陣單元以復(fù)散射振幅表示,且其具有強(qiáng)度差異和相位延遲[18],因此,通過標(biāo)準(zhǔn)強(qiáng)度和相位處理,提取4種極化方式下的后向散射系數(shù),即σ、σ、σ和σ。
注:RF為隨機(jī)森林,SVM為支持向量機(jī),BP-ANN為BP人工神經(jīng)網(wǎng)絡(luò)。下同。
Note: RF is random forest, SVM is support vector machine,BP-ANNis back propagation artificial neural network. Same as below.
圖2 技術(shù)流程圖
Fig.2 Technology flowchart
2)極化目標(biāo)分解
極化目標(biāo)分解是為了充分利用雷達(dá)極化信息而發(fā)展起來的一種全極化SAR數(shù)據(jù)處理技術(shù)。通過對(duì)散射矩陣或協(xié)方差和相干矩陣的分解,將具有復(fù)雜散射方式的目標(biāo)地物表示為簡(jiǎn)單目標(biāo)的矩陣之和,以獲取更為詳盡的地物幾何形態(tài)與物理參數(shù)信息[19]。極化目標(biāo)分解包括針對(duì)純目標(biāo)的相干分解和針對(duì)分布式目標(biāo)的非相干分解兩大類,非相干分解以協(xié)方差或相干矩陣為基礎(chǔ),更適用于隨機(jī)特性明顯、極化特征多變的自然地表,其中,CPD和YD是常用的非相干分解技術(shù)。
① Cloude-Pottier分解
19世紀(jì)90年代,Cloude和Pottier提出了一種基于特征向量/特征值的極化分解方案CPD,其將相干矩陣分解為3個(gè)正交酉矩陣的加權(quán)和,表達(dá)式如下[15]:
式中λ代表特征值,為非負(fù)實(shí)數(shù);V代表特征向量,*代表復(fù)共軛轉(zhuǎn)置。
基于CPD得到特征值和特征向量,然后得到以下參數(shù)[15,20-22]:
式中′代表熵;代表平均散射角,(°);代表反熵;RVI代表雷達(dá)植被指數(shù);α代表特征向量所表示的散射機(jī)制,λ代表目標(biāo)相干矩陣的3個(gè)特征值,P為由特征值λ得到的概率。
② Yamaguchi分解
YD是在Freeman分解基礎(chǔ)上發(fā)展的一種四元極化非相干分解模型,除考慮表面散射f、偶次散射f和體散射f之外,還考慮了螺旋體散射f,模型框架如下[16-17]:
式中f、f、f和f代表4種散射分量系數(shù),odd、dbl、vol和hlx代表相應(yīng)的協(xié)方差矩陣。
2.2.2相關(guān)性與重要性分析
為了理解不同影響因子對(duì)模型反演結(jié)果的貢獻(xiàn)并分析不同組合方案下機(jī)器學(xué)習(xí)模型性能表現(xiàn)的差異,需要計(jì)算各影響因子與土壤濕度的相關(guān)性及其重要性分?jǐn)?shù)。重要性分?jǐn)?shù)由平均精度減少(Mean Decrease Accuracy,MDA)表示,其表示當(dāng)該因子被隨機(jī)置換時(shí)精度的平均減少量。
2.3.1 隨機(jī)森林
RF模型由一系列二叉分類決策樹所構(gòu)成,為獲得較高的預(yù)測(cè)精度,模型利用訓(xùn)練數(shù)據(jù)集隨機(jī)生成大量單一的決策樹形成森林,將各棵決策樹回歸預(yù)測(cè)的結(jié)果進(jìn)行聚合,以其平均值作為模型的最終結(jié)果進(jìn)行輸出[23]。RF模型可用式(8)表示[24]:
式中代表預(yù)測(cè)因子,φ代表隨機(jī)因子序列,代表決策樹中的森林總數(shù)。本文RF模型的優(yōu)化基于循環(huán)迭代的參數(shù)優(yōu)選策略,通過調(diào)整決策樹的數(shù)量和決策樹允許使用特征的最大數(shù)量實(shí)現(xiàn)。參考前人經(jīng)驗(yàn)[25],對(duì)于決策樹數(shù)量,本文以10棵樹為步長(zhǎng),將初始數(shù)量值設(shè)置為10棵,依次遞增至300棵,在每一折交叉驗(yàn)證結(jié)果中存入2最大的模型。對(duì)決策樹允許使用特征的最大數(shù)量,通過在以上循環(huán)下嵌套新循環(huán)的方式不斷嘗試,從而確定當(dāng)次所對(duì)應(yīng)決策樹數(shù)量的最佳模型。
2.3.2 支持向量機(jī)
SVM是一種以結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論為基礎(chǔ)的有監(jiān)非參數(shù)統(tǒng)計(jì)學(xué)習(xí)技術(shù),基于泛化誤差上限最小化的原則構(gòu)建函數(shù)[26]。為有效解決非線性分類問題,通過核函數(shù)將低維空間向量集映射到高維空間,實(shí)現(xiàn)研究樣本非線性關(guān)系到線性可分的轉(zhuǎn)換,其基本模型如下[24,27]:
2.3.3 BP人工神經(jīng)網(wǎng)絡(luò)
BP-ANN模型是基于大量神經(jīng)元的交互作用,對(duì)輸入信息進(jìn)行運(yùn)算處理,并建立輸入和輸出因子之間相互關(guān)系的一種機(jī)器學(xué)習(xí)模型[29],由輸入層、隱含層和輸出層組成。本文通過更改隱含層和每層神經(jīng)元的數(shù)量實(shí)現(xiàn)激活函數(shù)和網(wǎng)絡(luò)結(jié)構(gòu)的調(diào)整,進(jìn)而實(shí)現(xiàn)模型非線性擬合能力的優(yōu)化。該模型可表示為[24,30]:
式中x和у分別代表輸入和輸出因子,w、b和分別代表權(quán)重因子、偏差項(xiàng)和激活函數(shù)。本文采用單個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和雙曲正切S形激活函數(shù),對(duì)輸入變量與輸出變量進(jìn)行標(biāo)準(zhǔn)化之后,將其輸入BP-ANN模型進(jìn)行訓(xùn)練。經(jīng)過大量重復(fù)試驗(yàn),模型中最大訓(xùn)練次數(shù)、訓(xùn)練要求精度以及學(xué)習(xí)率等關(guān)鍵參數(shù)分別設(shè)置為1 000、0.001和0.01。
采用k折交叉驗(yàn)證進(jìn)行模型驗(yàn)證與性能評(píng)估。Kohavi等[31]研究表明,k折交叉驗(yàn)證中,對(duì)估計(jì)模型預(yù)測(cè)誤差而言,采用10倍的變異系數(shù)具有最佳效果。故本文在確保模型外推能力良好的情況下,為避免一定程度的過擬合,采取十折交叉驗(yàn)證的方法,基于以下4個(gè)評(píng)定指標(biāo),從精確性、準(zhǔn)確性以及穩(wěn)定性3個(gè)方面對(duì)模型性能進(jìn)行評(píng)估。主要指標(biāo)包括訓(xùn)練集和驗(yàn)證集的決定系數(shù)2、均方根誤差(Root Mean Square Error,RMSE),以及二者相應(yīng)的標(biāo)準(zhǔn)偏差SDR2與SDRMSE。通常情況下,2越高,RMSE越低,且SD越接近于0,建模效果越好。
通過標(biāo)準(zhǔn)強(qiáng)度和相位處理、CPD以及YD處理,共得到12個(gè)雷達(dá)影響因子,包括4種極化方式的后向散射系數(shù)、4個(gè)CPD產(chǎn)物和4個(gè)YD產(chǎn)物(圖3)。
表1為土壤濕度()和各影響因子之間的相關(guān)系數(shù)矩陣。由表可見,相對(duì)于其他因子,、′和這3個(gè)因子與土壤濕度之間具有較高的相關(guān)性,其中的相關(guān)性最高,為0.68,′和與濕度的相關(guān)性均在0.50以上,這些因子均為CPD產(chǎn)物,說明CPD產(chǎn)物在土壤濕度反演中潛力巨大;后向散射系數(shù)與土壤濕度的相關(guān)性與極化方式有關(guān),交叉極化的相關(guān)性高于同極化。交叉極化中,σ與土壤濕度的相關(guān)系數(shù)最高,同極化中,σ與土壤濕度的相關(guān)系數(shù)最低;YD獲取的4個(gè)分量中,f與土壤濕度間具有較高的相關(guān)性,f與土壤濕度的相關(guān)系數(shù)最低,為?0.06,且f和f與土壤濕度呈現(xiàn)負(fù)相關(guān)關(guān)系。進(jìn)一步研究發(fā)現(xiàn),上述因子之間也存在一定的相關(guān)性。CPD產(chǎn)物中的和之間以及RVI和之間,同極化后向散射系數(shù)σ和σ之間以及交叉極化的σ和σ之間,均存在強(qiáng)烈的正相關(guān)關(guān)系,而YD產(chǎn)物f與CPD產(chǎn)物之間則存在較高的負(fù)相關(guān)性。
表1 土壤濕度與12個(gè)因子的相關(guān)系數(shù)矩陣
為了理解不同影響因子對(duì)模型反演結(jié)果的貢獻(xiàn),計(jì)算了各因子的MDA,結(jié)果如圖4所示。由圖可見,作為CPD產(chǎn)物,、′與對(duì)反演結(jié)果有突出貢獻(xiàn),而RVI的重要性相對(duì)較低。4種后向散射系數(shù)中,交叉極化的σ與σ的重要性明顯高于同極化的σ與σ。在f、f、f和f中,f偶次散射的重要性明顯高于其余三者。綜上可見,相對(duì)于后向散射系數(shù)與YD產(chǎn)物,CPD產(chǎn)物擁有更高的重要性評(píng)分。
基于研究區(qū)50個(gè)樣本獲取的σ、σ、σ、σRVI、f、f、f和f與對(duì)應(yīng)樣本點(diǎn)的土壤濕度實(shí)測(cè)值,構(gòu)建了單種類型因子和不同類型因子組合方案土壤濕度反演的RF、SVM和BP-ANN模型共21個(gè),每類模型7個(gè),模型性能的對(duì)比結(jié)果如表2所示。
由表2可見,針對(duì)所有構(gòu)建模型,從2來看,訓(xùn)練集的最大值為0.95,最小值為0.31,平均值為0.71;驗(yàn)證集的最大值為0.79,最小值為0.15,平均值為0.50;訓(xùn)練集2總體高于驗(yàn)證集2。從RMSE來看,訓(xùn)練集的最大值為9.17%,最小值為2.36%,平均值為5.64%;驗(yàn)證集的最大值為10.65%,最小值為6.20%,平均值為8.47%;訓(xùn)練集RMSE總體低于驗(yàn)證集RMSE。綜上可見,21個(gè)模型在訓(xùn)練集取得了優(yōu)于驗(yàn)證集的綜合表現(xiàn)。
針對(duì)RF、SVM以及BP-ANN機(jī)器學(xué)習(xí)模型,由表2可見,RF模型的2在訓(xùn)練集與驗(yàn)證集中均高于其他兩大類模型,同時(shí),RF模型的大多數(shù)RMSE在3大類模型中也是最低,說明與SVM和BP-ANN模型相比,RF模型在土壤濕度估算中效果更佳,具有良好的適用性。
針對(duì)不同的因子組合方案,對(duì)于單一類型因子組合的各反演模型,如僅基于BC、CPD或YD產(chǎn)物的模型,RF模型驗(yàn)證集的平均2和平均RMSE分別為0.65和8.16%,SVM模型驗(yàn)證集的平均2和平均RMSE分別為0.32和8.62%,而BP-ANN模型的平均2為0.38,其平均RMSE達(dá)到10.13%。對(duì)于不同類型因子組合建模的各機(jī)器學(xué)習(xí)模型,RF模型驗(yàn)證集平均2為0.76,平均RMSE為6.75%;SVM模型驗(yàn)證集平均2和RMSE分別為0.39和8.63%,BP-ANN模型則分別為0.48和8.91%。綜上,相較于使用單一類型因子的模型,不同類型因子組合的各類模型中,RF模型2提高了16.92%,RMSE降低了17.28%,SVM模型2提高了21.88%,RMSE上升了0.12%,BP-ANN模型2提高了26.32%,RMSE降低了11.22%。綜合考慮2與RMSE,隨著建模因子的增多,模型的2與RMSE分別表現(xiàn)出逐步提高與降低的總體趨勢(shì),與單一類型因子構(gòu)建的模型相比,不同類型因子組合構(gòu)建的模型性能更佳,其2更高,RMSE更低。由此說明,通過采用不同類型因子的組合方案,可以較為有效地提高土壤濕度的反演精度。
表2 基于10折交叉驗(yàn)證法評(píng)估不同模型性能
注:SDR2為決定系數(shù)2的標(biāo)準(zhǔn)偏差;SDRMSE為均方根誤差(RMSE)的標(biāo)準(zhǔn)偏差。
Note: SDR2indicates the standard deviation of determination coefficient2; SDRMSEindicates the standard deviation of Root Mean Square Error (RMSE).
.
從訓(xùn)練集來看,大部分模型在訓(xùn)練集具有較為優(yōu)秀的表現(xiàn),除僅有后向散射系數(shù)參與的建模方式外,其余因子組合方案的RF模型訓(xùn)練集2均較高,在0.87到0.90間;結(jié)合驗(yàn)證集看,BC+CPD組合訓(xùn)練的RF模型性能表現(xiàn)更加突出,其驗(yàn)證集2和RMSE分別為0.78和6.60%,驗(yàn)證集SDR2與SDRMSE分別為0.15和1.95%,該模型可解釋土壤濕度變化的89%。該模型輸入的影響因子包括σ、σ、σ和σ這4種后向散射系數(shù),以及和RVI這4種CPD產(chǎn)物。后向散射系數(shù)是目前最為常用的土壤濕度反演模型的輸入因子,已得到前人的廣泛認(rèn)可和應(yīng)用[13,32]。CPD產(chǎn)物中,表征全局散射的隨機(jī)行為,表示次要機(jī)制的相對(duì)重要性,表征地表由表面散射到二面角散射的變化過程,當(dāng)其值較低時(shí),將顯示更多土壤貢獻(xiàn)的成分。本文研究區(qū)植被稀少,散射主要源于土壤的貢獻(xiàn)。經(jīng)相關(guān)性與重要性分析同樣發(fā)現(xiàn),CPD產(chǎn)物對(duì)于土壤濕度反演有突出的表現(xiàn)。由于在土壤濕度反演模型中后向散射系數(shù)的應(yīng)用廣泛性及CPD產(chǎn)物的相對(duì)重要性,因此使得BC + CPD組合訓(xùn)練的RF模型具有最佳性能。
將對(duì)應(yīng)影響因子輸入BC+CPD組合訓(xùn)練的RF模型,得到居延澤土壤濕度空間分布圖(圖5)。
由圖5可見,居延澤大部分區(qū)域土壤濕度均小于10%,與野外同步實(shí)測(cè)50個(gè)樣本點(diǎn)的土壤濕度范圍基本一致,整體呈現(xiàn)極端干旱的態(tài)勢(shì)。全區(qū)平均土壤濕度僅8.83%,與實(shí)測(cè)濕度平均值(9.57%)較為接近。西北角的天鵝湖附近、南部以古湖岸堤為界分隔形成的東、西居延澤2個(gè)子盆地中心區(qū)域,土壤濕度相對(duì)較高,其余地區(qū)濕度普遍偏低。天鵝湖周圍灘涂面積較廣,旱蘆葦?shù)戎脖患猩L(zhǎng),具有一定的蓄水能力,因而土壤濕度較高。在西居延澤野外采樣過程中發(fā)現(xiàn),古湖區(qū)內(nèi)以鹽堿地、沙地為主,生長(zhǎng)稀疏、低矮的旱蘆葦、白刺和泡泡刺等旱生植被,因而在反演圖中可見點(diǎn)狀或斑塊狀分布的濕度高值區(qū)。由于地處歐亞大陸腹地,降雨稀少,氣候極端干旱,受強(qiáng)烈的蒸發(fā)濃縮作用影響,地下水中的鹽分隨毛管水上升并不斷向地表遷移聚集,形成大范圍的鹽堿地、鹽殼和結(jié)晶鹽殼。氣候條件奠定了鹽堿地形成的物質(zhì)基礎(chǔ)。在干旱氣候條件下,研究區(qū)地層中鹽分含量高,受物理、化學(xué)和生物風(fēng)化作用,成土母質(zhì)發(fā)生鹽化,所釋放的鹽基離子隨水分在地勢(shì)低洼的古湖盆中心聚集。同時(shí),受多種因素影響,區(qū)域內(nèi)地下水位下降,部分沼澤進(jìn)一步蛻變?yōu)辂}堿地,因而具有較高的土壤濕度,東居延澤古湖區(qū)表現(xiàn)更為明顯。
土壤類型、熱量狀況以及地表覆蓋等因素控制著區(qū)域土壤濕度的空間分布格局。研究區(qū)內(nèi)以灰棕漠土、風(fēng)沙土、鹽堿土、潮土和草甸土等土壤類型為主,光照充足,植被稀疏,風(fēng)蝕強(qiáng)烈,沙地、裸地和鹽堿地廣布。沙地區(qū)域地勢(shì)平坦,無植被生長(zhǎng),由于質(zhì)地松散,持水能力差,土壤濕度極低。相對(duì)而言,裸地質(zhì)地較為黏重,利于蓄水保墑,土壤濕度有所提高。植被覆蓋區(qū)和灘涂區(qū),受植被遮擋,地面溫度降低,水分蒸發(fā)減少,由于植被對(duì)水分的涵養(yǎng)作用以及灘涂區(qū)的水源補(bǔ)給,土壤濕度相對(duì)較高。此外,湖盆中心區(qū)由于干旱少雨,地勢(shì)低洼,部分鹽堿地分布區(qū)土壤濕度較高。反演結(jié)果與實(shí)際相符,能夠綜合反映區(qū)域土壤濕度空間分布的總體格局。
本文利用C波段Radarsat-2全極化雷達(dá)數(shù)據(jù)和實(shí)測(cè)土壤濕度數(shù)據(jù),基于標(biāo)準(zhǔn)強(qiáng)度和相位處理以及2種極化目標(biāo)分解方法,提取了多個(gè)雷達(dá)影響因子,評(píng)價(jià)了不同影響因子的相關(guān)性及重要性?;陔S機(jī)森林(Random Forest,RF)、支持向量機(jī)(Support Vector Machine,SVM)和BP人工神經(jīng)網(wǎng)絡(luò)(Back Propagation Artificial Neural Network,BP-ANN)3種機(jī)器學(xué)習(xí)算法,構(gòu)建了土壤濕度反演的多種模型,并對(duì)各算法在干旱區(qū)土壤濕度遙感反演中的有效性進(jìn)行了深入探討,結(jié)果表明:
1)平均散射角對(duì)反演精度至關(guān)重要,熵與反熵的影響次之。4個(gè)后向散射系數(shù)中,交叉極化的后向散射系數(shù)σ和σ比同極化的后向散射系數(shù)σ和σ重要性評(píng)分更高,與土壤濕度具有更高的相關(guān)性。Yamaguchi分解(Yamaguchi Decomposition,YD)的4個(gè)產(chǎn)物中,偶次散射f與體散射f擁有更高的重要性。相較于后向散射系數(shù)(Backscattering Coefficients,BC)與YD產(chǎn)物,Cloude-Pottier分解(Cloude-Pottier Decomposition,CPD)產(chǎn)物對(duì)反演結(jié)果貢獻(xiàn)顯著,重要性評(píng)分與相關(guān)系數(shù)明顯高于前兩種。
2)對(duì)于3種機(jī)器學(xué)習(xí)模型,不同類型因子組合建模的模型性能表現(xiàn)均明顯優(yōu)于僅使用單種因子類型的模型。從驗(yàn)證集的對(duì)比看,RF模型2提高了16.92%,RMSE降低了17.28%,SVM模型2提高了21.88%,RMSE上升了0.12%,BP-ANN模型2提高了26.32%,RMSE降低了11.22%。不同類型因子的組合建??梢杂行У靥岣咄寥罎穸确囱菽P偷男阅堋?/p>
3)綜合考慮2與RMSE,相較于SVM和BP-ANN模型,RF模型在干旱區(qū)土壤濕度反演中具有更好的適用性,并表現(xiàn)出更為出色的應(yīng)用潛力。所有模型中,BC+CPD組合訓(xùn)練的RF模型性能最佳,其驗(yàn)證集2和RMSE分別為0.78和6.60%,驗(yàn)證集SD2與SDRMSE分別為0.15和1.95%,該模型可解釋土壤濕度變化的89%。
4)研究區(qū)土壤濕度平均值僅為8.83%,整體呈現(xiàn)極端干旱的態(tài)勢(shì)。其中,天鵝湖附近和古湖心區(qū)相對(duì)于其他區(qū)域具有較高的土壤濕度。土壤濕度的空間異質(zhì)性受土壤類型、熱量狀況以及地表覆蓋等多因素綜合影響,模型反演結(jié)果能綜合反映區(qū)域土壤濕度空間分布的總體格局。
本文在利用機(jī)器學(xué)習(xí)算法和全極化SAR數(shù)據(jù)進(jìn)行干旱區(qū)土壤濕度監(jiān)測(cè)方面進(jìn)行了有益的嘗試。值得注意的是,在利用全極化SAR數(shù)據(jù)進(jìn)行土壤濕度反演時(shí),無論是傳統(tǒng)模型還是基于機(jī)器學(xué)習(xí)的模型中,后向散射系數(shù)一直都是廣為采用的輸入?yún)?shù)。本研究發(fā)現(xiàn)交叉極化比同極化后向散射系數(shù)擁有更高的重要性評(píng)分,這可能是由于不同下墊面的情況下,交叉極化與同極化后向散射系數(shù)的重要性存在差異。為了充分挖掘全極化雷達(dá)數(shù)據(jù)中隱含的各種信息,積極開展不同下墊面狀況的差異性研究以及全極化雷達(dá)成像機(jī)理的研究,是今后需要進(jìn)一步深入的工作。
[1] Santi E, Paloscia S, Pettinato S, et al. Application of artificial neural networks for the soil moisture retrieval from active and passive microwave spaceborne sensors[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 48: 61-73.
[2] Brocca L, Moramarco T, Melone F, et al. Assimilation of surface- and root-zone ASCAT soil moisture products into rainfall-runoff modeling[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(7): 2542-2555.
[3] Dorigo W, Wagner W, Albergel C, et al. ESA CCI soil moisture for improved earth system understanding: State-of-the art and future directions[J]. Remote Sensing of Environment, 2017, 203: 185-215.
[4] Bourgeau-Chavez L L, Leblon B, Charbonneau F, et al. Evaluation of polarimetric Radarsat-2 SAR data for development of soil moisture retrieval algorithms over a chronosequence of black spruce boreal forests[J]. Remote Sensing of Environment, 2013, 132: 71-85.
[5] Xie Q X, Meng Q Y, Zhang L L, et al. Combining of the H/A/Alpha and Freeman-Durden polarization decomposition methods for soil moisture retrieval from full-polarization Radarsat-2 data[J]. Advances in Meteorology, 2018, 2018: 1-17.
[6] Powell S L, Cohen W B, Healey S P, et al. Quantification of live aboveground forest biomass dynamics with Landsat time-series and field inventory data: A comparison of empirical modeling approaches[J]. Remote Sensing of Environment, 2010, 114(5): 1053-1068.
[7] Zhao W, Sánchez N, Lu H, et al. A spatial downscaling approach for the SMAP passive surface soil moisture product using random forest regression[J]. Journal of Hydrology, 2018, 563: 1009-1024.
[8] 曾旭靖,邢艷秋,單煒,等. 基于Sentinel-1A與Landsat 8數(shù)據(jù)的北黑高速沿線地表土壤水分遙感反演方法研究[J]. 中國(guó)生態(tài)農(nóng)業(yè)學(xué)報(bào),2017,25(1):118-126.
Zeng Xujing, Xing Yanqiu, Shan Wei, et al. Soil water content retrieval based on Sentinel-1A and Landsat 8 image for Bei'an-Heihe Expressway[J]. Chinese Journal of Eco-Agriculture, 2017, 25(1): 118-126. (in Chinese with English abstract)
[9] 王雅婷,孔金玲,楊亮彥,等. 基于SVR的旱區(qū)稀疏植被覆蓋下土壤水分遙感反演[J]. 地球信息科學(xué)學(xué)報(bào),2019,21(8):1275-1283.
Wang Yating, Kong Jinling, Yang Liangyan, et al. Remote sensing inversion of soil moisture in vegetation-sparse arid areas based on SVR[J]. Journal of Geo-information Science, 2019, 21(8): 1275-1283. (in Chinese with English abstract)
[10] Alexakis D D, Mexis F K, Vozinaki A K, et al. Soil moisture content estimation based on Sentinel-1 and auxiliary earth observation products. A hydrological approach[J]. Sensors (Basel), 2017, 17(6): 1455.
[11] 李平湘,劉致曲,楊杰,等. 利用隨機(jī)森林回歸進(jìn)行極化SAR土壤水分反演[J]. 武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2019,44(3):405-412.
Li Pingxiang, Liu Zhiqu, Yang Jie, et al. Soil moisture retrieval of winter wheat fields based on random forest regression using quad-polarimetric SAR images[J]. Journal of Wuhan University: Information Science Edition, 2019, 44(3): 405-412. (in Chinese with English abstract)
[12] 王浩,羅格平,王偉勝,等. 基于多源遙感數(shù)據(jù)的錫爾河中下游農(nóng)田土壤水分反演[J]. 自然資源學(xué)報(bào),2019,34(12):2717-2731.
Wang Hao, Luo Geping, Wang Weisheng. et al. Inversion of soil moisture content in the farmland in middle and lower reaches of Syr Darya River Basin based on multi-source remotely sensed data[J]. Journal of Natural Resources, 2019, 34(12): 2717-2731. (in Chinese with English abstract)
[13] 郭交,劉健,寧紀(jì)鋒,等. 基于Sentinel多源數(shù)據(jù)的農(nóng)田地表土壤水分反演模型構(gòu)建與驗(yàn)證[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(14):71-78.
Guo Jiao, Liu Jian, Ning Jifeng, et al. Construction and validation of soil moisture retrieval model in farmland based on Sentinel multi-source data[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2019, 35(14): 71-78. (in Chinese with English abstract)
[14] 張甘霖,龔子同. 土壤調(diào)查實(shí)驗(yàn)室分析方法[M]. 北京:科學(xué)出版社,2012.
[15] Cloude S R, Pottier E. An entropy based classification scheme for land applications of polarimetric SAR[J]. IEEE Transactions on Geoscience and Remote Sensing, 1997, 35(1): 68-78.
[16] Yamaguchi Y, Moriyama T, Ishido M, et al. Four-component scattering model for polarimetric SAR image decomposition[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(8): 1699-1706.
[17] Chen S W, Li Y Z, Wang X S, et al. Modeling and interpretation of scattering mechanisms in polarimetric synthetic aperture radar: Advances and perspectives[J]. IEEE Signal Processing Magazine, 2014, 31(4): 79-89.
[18] Zhang B, Perrie W, Vachon P W, et al. Ocean vector winds retrieval from C-band fully polarimetric SAR measurements[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(11): 4252-4261.
[19] 張臘梅,段寶龍,鄒斌. 極化SAR圖像目標(biāo)分解方法的研究進(jìn)展[J]. 電子與信息學(xué)報(bào),2016,38(12):3289-3297.
Zhang Lamei, Duan Baolong, Zou Bin. Research development on target decomposition method of polarimetric SAR image[J]. Journal of Electronics & Information Technology, 2016, 38(12): 3289-3297. (in Chinese with English abstract)
[20] Lee J S, Ainsworth T L, Kelly J P, et al. Evaluation and bias removal of multilook effect on entropy/alpha/anisotropy in polarimetric SAR decomposition[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(10): 3039-3052.
[21] Cloude S R, Pottier E. A review of target decomposition theorems in radar polarimetry[J]. IEEE Transactions on Geoscience and Remote Sensing, 1996, 34(2): 498-518.
[22] van Zyl J J. An overview of the analysis of multi-frequency polarimetric SAR data[C]//6thEuropean Conference on Synthetic Aperture Radar (EUSAR 2006). Dresden, Germany, 2006: 16-18.
[23] Breiman L, Cutler A. Random forests-classification manual [EB/OL]. [2020-12-25]. https://www.stat.berkeley.edu/~breiman/ RandomForests/ cc_manual.htm.
[24] 雷明. 機(jī)器學(xué)習(xí)-原理、算法與應(yīng)用[M]. 北京:清華大學(xué)出版社,2019.
[25] Min M, Bai C, Guo J P, et al. Estimating summertime precipitation from Himawari-8 and Global Forecast System based on machine learning[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(5): 2557-2570.
[26] Mountrakis G, Im J, Ogole C. Support vector machines in remote sensing: A review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(3): 247-259.
[27] Min M, Li J, Wang F, et al. Retrieval of cloud top properties from advanced geostationary satellite imager measurements based on machine learning algorithms[J]. Remote Sensing of Environment, 2020, 239: 111616.
[28] Chang C C, Lin C J. LIBSVM: A library for support vector machines[EB/OL]. [2021-01-20]. https://ishare.iask.sina.com.cn/ f/11274228.html.
[29] Saha S, Gu F, Luo X, et al. Use of an artificial neural network approach for the prediction of resilient modulus for unbound granular material[J]. Transportation Research Record, 2018, 2672(52): 23-33.
[30] 陳明. MATLAB神經(jīng)網(wǎng)絡(luò)原理與實(shí)例精解[M]. 北京:清華大學(xué)出版社,2013.
[31] Kohavi R. A study of cross-validation and bootstrap for accuracy estimation and model selection[C]//14thInternational Joint Conference on Artificial Intelligence (IJCAI 1995). CA, USA: Morgan Kaufmann Publishers Inc, 1995: 1137-1143.
[32] 蔡慶空,李二俊,陶亮亮,等. PROSAIL模型和水云模型耦合反演農(nóng)田土壤水分[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(20):117-123.
Cai Qingkong, Li Erjun, Tao Liangliang, et al. Farmland soil moisture retrieval using PROSAIL and water cloud model[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2018, 34(20): 117-123. (in Chinese with English abstract)
Soil moisture inversion in arid areas by using machine learning and fully polarimetric SAR imagery
Yang Liping1, Hou Chenglei2,3, Su Zhiqiang2, Bai Yuxing2, Wang Tong1, Feng Rui2
(1.,’,710054,; 2.,’710054,; 3.,,250100,)
Soil moisture is one of the most important variablesto affect the water cycle and energy balanceduring theevolution of regional ecosystem in arid areas. However, accurate monitoring of soil moisture is still a challenging task, due to the spatial and temporal heterogeneity. Radar remote sensing has widely been expected to be one of the most effective technologies in regional soil moisture monitoring. Fully polarimetric SAR (PolSAR) can also provide abundant polarized information for different machine learning algorithms to retrieve soil moisture in various regions. However, such research is still lacking in most arid areas, together with the specific evaluation on the performance of different machine learning algorithms. This study aims to retrieve the soil moisture in arid areas using the PolSAR parameters and various machine learning algorithms. The study area was selected as Juyanze region located in the southeast of Ejina banner of Inner Mongolia in western China. Basedon Radarsat-2 imagery, radar variables were set as the extractedbackscattering coefficients (BC) using the standard intensity and phase processing, while the multiple polarimetric parameters that derived from Cloude-Pottier decomposition (CPD) and Yamaguchi decomposition (YD). The parameter correlation and importance were also analyzed after that. Then, 21 soil moisture inversion models were established using three machine learning algorithms, namely Random Forest (RF), Support Vector Machine (SVM), and Back Propagation Artificial Neural Network (BP-ANN). Model performance was further evaluated using 10-fold cross-validation. Finally, the optimal model was achieved to inverse soil moisture in the study area, where the spatial distribution pattern was analyzed. The results show that: 1) The average scattering angle presented the most prominent influence on the inversion accuracy, followed by entropy and anti-entropy among all the variables. Moreover, cross-polarized backscattering coefficients made much more contribution to the model accuracy, compared with the co-polarized backscattering coefficients. The importance of even scattering and volume scattering was remarkably higher than that of surface scattering and spiral scattering. Parameters derived from CPD made outstanding contributions to the retrieval,where the importance scores and correlation coefficients were much higher than those of backscattering coefficients and parameters derived from YD. 2) The developed models of soil moisture inversion under the combined scheme of various variable types performed better than those built solely on single variable type in all three machine learning algorithms, indicating that the combined scheme greatly improved the accuracy of models.3) RF model was more suitable for soil moisture inversion in arid areas,compared with SVM and BP-ANN, according to the determination coefficient2and the root mean square error (RMSE). The model performed best using BC + CPD scheme as input variables. The validation set2and RMSE were 0.78 and 6.60%, respectively, with the standard deviation of2and RMSE of 0.15 and 1.95%, respectively. Consequently, 89% moisture variation can be explained by this optimal model. 4) Generally speaking, soil moisture in the study area maintained at a low level, and the average soil moisture content was 8.83%. Moisture content around the Swan Lake and the center of Paleolake was obviously higher than other areas. The inversion data conformed greatly to the actual situation, indicating a great potential to soil moisture inversion in arid areas.
soil moisture; models; algorithms; RF; SVM; BP-ANN; Radarsat-2; arid areas
楊麗萍,侯成磊,蘇志強(qiáng),等. 基于機(jī)器學(xué)習(xí)和全極化雷達(dá)數(shù)據(jù)的干旱區(qū)土壤濕度反演[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(13):74-82. doi:10.11975/j.issn.1002-6819.2021.13.009 http://www.tcsae.org
Yang Liping, Hou Chenglei, Su Zhiqiang, et al. Soil moisture inversion in arid areas by using machine learning and fully polarimetric SAR imagery[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(13): 74-82. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.13.009 http://www.tcsae.org
2021-01-18
2021-03-16
國(guó)家自然科學(xué)基金資助項(xiàng)目(41371220、42071345)
楊麗萍,博士,副教授,研究方向?yàn)槎窟b感及3S應(yīng)用。Email:zylpyang@chd.edu.cn
10.11975/j.issn.1002-6819.2021.13.009
S152.7; TP79
A
1002-6819(2021)-13-0074-09