国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于變量?jī)?yōu)選與機(jī)器學(xué)習(xí)的干旱區(qū)濕地土壤鹽漬化數(shù)字制圖

2020-12-25 00:56馬國(guó)林丁建麗韓禮敬張子鵬
關(guān)鍵詞:鹽漬化植被指數(shù)鹽分

馬國(guó)林,丁建麗,韓禮敬,張子鵬

基于變量?jī)?yōu)選與機(jī)器學(xué)習(xí)的干旱區(qū)濕地土壤鹽漬化數(shù)字制圖

馬國(guó)林,丁建麗※,韓禮敬,張子鵬

(1.新疆大學(xué)資源與環(huán)境科學(xué)學(xué)院 智慧城市與環(huán)境建模自治區(qū)普通高校重點(diǎn)實(shí)驗(yàn)室,烏魯木齊 830046;2. 新疆大學(xué)綠洲生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室,烏魯木齊 830046)

土壤鹽漬化是導(dǎo)致土壤退化和生態(tài)系統(tǒng)惡化的主要原因之一,對(duì)干旱區(qū)的可持續(xù)發(fā)展構(gòu)成主要威脅。為了盡可能精確地監(jiān)測(cè)土壤鹽漬化的空間變異性,該研究收集新疆艾比湖濕地78個(gè)典型樣點(diǎn),其中選取54個(gè)樣本作為訓(xùn)練集,24個(gè)樣本作為獨(dú)立驗(yàn)證集。基于Sientinel-2 多光譜傳感器(Multi-Spectral Instrument,MSI)、數(shù)字高程模型(Digital Elevation Model,DEM)數(shù)據(jù)提取3類(lèi)指數(shù)(紅邊光譜指數(shù)、植被指數(shù)和地形指數(shù)),經(jīng)過(guò)極端梯度提升(Extreme Gradient Boosting,XGBoost)算法篩選有效特征變量,構(gòu)建了關(guān)于土壤電導(dǎo)率(Electrical Conductivity,EC)的隨機(jī)森林(Random Forest,RF)、極限學(xué)習(xí)機(jī)(Extra Learning Machine,ELM)和偏最小二乘回歸(Partial Least Squares Regression,PLSR)預(yù)測(cè)模型,并選擇最優(yōu)模型繪制了艾比湖濕地鹽漬化分布圖。結(jié)果表明:優(yōu)選的紅邊光譜指數(shù)基本能夠預(yù)測(cè)EC的空間變化;紅邊光譜指數(shù)與植被指數(shù)組合建模效果總體上優(yōu)于其與地形指數(shù)的組合,3類(lèi)指數(shù)組合的建模取得了較為理想的預(yù)測(cè)精度,其中RF模型表現(xiàn)最優(yōu)(驗(yàn)證集2=0.83,RMSE=4.81 dS/m,RPD=3.11);在整個(gè)研究區(qū)內(nèi),中部和東部地區(qū)土壤鹽漬化程度尤為嚴(yán)重。因此,XGBoost所篩選出的環(huán)境因子結(jié)合機(jī)器學(xué)習(xí)算法可以實(shí)現(xiàn)干旱區(qū)土壤鹽漬化的監(jiān)測(cè)。

土壤;鹽分;數(shù)字制圖;機(jī)器學(xué)習(xí);變量?jī)?yōu)選;Sentinel-2A

0 引 言

土壤鹽漬化作為當(dāng)前的全球性問(wèn)題,對(duì)生態(tài)系統(tǒng)的安全與穩(wěn)定產(chǎn)生嚴(yán)重威脅[1]。在干旱和半干旱地區(qū),除了巖石、礦物、風(fēng)化產(chǎn)物和土壤中含有較多的可溶性鹽外,土壤資源也受到次生鹽漬化的威脅[2]。土壤鹽分是土壤鹽堿化的有效評(píng)價(jià)指標(biāo),其時(shí)空范圍存在很大差異[3]。這表明只有通過(guò)動(dòng)態(tài)監(jiān)測(cè)才能充分了解當(dāng)前土壤鹽堿化的狀況,從而為進(jìn)行有效的土壤修復(fù)和土地復(fù)墾提供更多的定量信息。

傳統(tǒng)的實(shí)驗(yàn)室分析費(fèi)時(shí)費(fèi)力,此外由于時(shí)間和空間的巨大差異,很難揭示土壤鹽漬化的演變過(guò)程和趨勢(shì)[4]。與傳統(tǒng)方法相比,衛(wèi)星遙感技術(shù)在大空間尺度和高時(shí)間分辨率下監(jiān)測(cè)土壤鹽漬化具有巨大優(yōu)勢(shì)。作為新一代的星載多光譜儀(Multi-Spectral Instrument,MSI),Sentinel-2A(S2)衛(wèi)星可測(cè)量443~2 190 nm的13個(gè)波譜帶,覆蓋可見(jiàn)光和近紅外波段,最高分辨率為10 m,其新穎的光譜功能(即3個(gè)紅邊帶和2個(gè)近紅外波段)為各種土壤信息的監(jiān)測(cè)提供了廣闊的應(yīng)用前景[5]。目前已有相關(guān)學(xué)者使用S2數(shù)據(jù)構(gòu)建相關(guān)的鹽度指數(shù)進(jìn)行土壤鹽分的建模預(yù)測(cè)[6],取得了良好的預(yù)測(cè)精度,但尚未充分挖掘紅邊波段與其他環(huán)境因子(植被覆蓋、地形)在土壤鹽分預(yù)測(cè)中的作用。

土壤是具有高度變異的時(shí)空連續(xù)體,在發(fā)育成土過(guò)程中成土因子對(duì)其的作用是非線性的,在較大區(qū)域中對(duì)土壤屬性的非線性作用更加明顯,而機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘技術(shù)能夠有效解決土壤與環(huán)境因子之間非線性的問(wèn)題[7]?;跇?shù)的模型是最常見(jiàn)的機(jī)器學(xué)習(xí)算法,主要包括分類(lèi)回歸樹(shù)(Classification And Regression Tress,CART)[8]、隨機(jī)森林(Random Forest,RF)[9]和增強(qiáng)回歸樹(shù)(Boosted Regression Tress,BRT)[10]。已用于土壤數(shù)字制圖的其他機(jī)器學(xué)習(xí)算法還包括人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)[11]、支持向量機(jī)(Support Vector Machines,SVM)[12]和極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)[13]等。但是為特定的景觀選擇最佳的建模技術(shù)一直是數(shù)字土壤制圖的挑戰(zhàn)。

已有研究表明,鹽分指數(shù)、植被指數(shù)、地形因素等環(huán)境變量能夠?yàn)橥寥利}漬化監(jiān)測(cè)提供有效的輔助信息[14]。不同類(lèi)型的環(huán)境變量雖能從不同的角度表征土壤鹽分的變化,但這些輔助信息大都可以通過(guò)波段運(yùn)算得到,存在不同程度的信息冗余[15]。目前在進(jìn)行建模特征變量?jī)?yōu)選時(shí),部分學(xué)者采用Pearson相關(guān)分析篩選與土壤鹽分(Soil Salt Content,SSC)或土壤電導(dǎo)率(Electric Conductivity,EC)顯著相關(guān)的因子用于土壤鹽漬化的制圖研究[2,9]。Pearson相關(guān)性分析的本質(zhì)是一種線性關(guān)系,忽略了預(yù)測(cè)變量與目標(biāo)變量之間的非線性關(guān)系[16]。王飛等[17]使用循環(huán)迭代的方法對(duì)變量進(jìn)行優(yōu)選,相較于全變量,優(yōu)選之后的模型精度和穩(wěn)定性得到顯著提升,但這種方法進(jìn)行變量?jī)?yōu)選時(shí)會(huì)耗費(fèi)大量的時(shí)間。相較于上述變量?jī)?yōu)選方法,極端梯度提升(Extreme Gradient Boosting,XGBoost)可以有效的構(gòu)造增強(qiáng)樹(shù)并運(yùn)行、并行計(jì)算、近似建樹(shù)以及對(duì)稀疏數(shù)據(jù)進(jìn)行有效處理[18]。同時(shí),該算法也借鑒了隨機(jī)森林的特征采樣做法,在對(duì)弱學(xué)習(xí)器進(jìn)行訓(xùn)練時(shí),只考慮隨機(jī)抽樣特征的子數(shù)據(jù)集,增加了模型的多樣性,避免過(guò)擬合,也減少了模型的計(jì)算量,有效提高了對(duì)輸入特征變量重要性最優(yōu)解的效率[19]。XGBoost因其強(qiáng)大的優(yōu)化能力,已被廣泛應(yīng)用于各領(lǐng)域,卻鮮見(jiàn)于土壤鹽漬化建模特征變量?jī)?yōu)選中,其適用性有待驗(yàn)證。

基于此,本文擬以新疆艾比湖濕地為研究區(qū),使用Sentinel-2A、高程數(shù)據(jù)提取3類(lèi)(紅邊光譜指數(shù)、植被指數(shù)、地形因子)共61個(gè)與鹽漬化相關(guān)的因子作為環(huán)境變量,并結(jié)合EC采樣數(shù)據(jù),采用XGBoost算法優(yōu)選環(huán)境變量,利用優(yōu)選之后的紅邊光譜指數(shù)、紅邊光指數(shù)與植被指數(shù)、紅邊光譜指數(shù)與地形指數(shù)以及3類(lèi)指數(shù)的組合構(gòu)建RF、PLSR和ELM 3種鹽漬化預(yù)測(cè)模型,優(yōu)選出艾比湖保護(hù)區(qū)最佳土壤鹽漬化制圖方案,以期實(shí)現(xiàn)對(duì)旱區(qū)濕地土壤鹽漬化分布特征更為精細(xì)的刻畫(huà),為干旱區(qū)濕地的土地可持續(xù)利用和生態(tài)保護(hù)提供科學(xué)依據(jù)。

1 試驗(yàn)數(shù)據(jù)與方法流程

1.1 研究區(qū)概況

艾比湖濕地自然保護(hù)區(qū)位于新疆維吾爾自治區(qū)博爾塔蒙古自治州境內(nèi),地理位置43°38′~45°52′N(xiāo),79°53′~85°02′E之間(圖1)。研究區(qū)主要土地利用類(lèi)型包括水體、濕地、荒漠和其他類(lèi)型。受低平的地形(海拔189 m)、特定的氣候特征和淺層地下水位的影響,研究區(qū)的土壤鹽漬化問(wèn)題嚴(yán)重。近年來(lái),由于艾比湖人口的激增、土地的大規(guī)模開(kāi)發(fā)利用,致使湖面縮小,土壤鹽漬化不斷惡化,嚴(yán)重威脅著當(dāng)?shù)厣鷳B(tài)系統(tǒng)的安全與社會(huì)經(jīng)濟(jì)的可持續(xù)發(fā)展。

圖1 研究區(qū)及采樣點(diǎn)分布

1.2 土壤樣品采集及預(yù)處理

野外土壤調(diào)查于2019年5月25日至5月29日進(jìn)行,采樣過(guò)程的調(diào)查路線是依據(jù)車(chē)輛對(duì)潛在樣點(diǎn)的可達(dá)性而設(shè)計(jì)的。根據(jù)之前的實(shí)地調(diào)查經(jīng)驗(yàn),結(jié)合現(xiàn)有的數(shù)字土壤圖(土壤類(lèi)型、質(zhì)地等特征)和當(dāng)?shù)刂饕耐恋乩?覆蓋類(lèi)型,總共選擇了78個(gè)具有代表性的采樣點(diǎn)(圖1)。研究區(qū)的主要農(nóng)作物為棉花,其他植被主要有胡楊、檉柳、鹽節(jié)木、堿蓬、蘆葦?shù)?,其中裸地設(shè)計(jì)采樣點(diǎn)23個(gè),草地22個(gè),林地18個(gè)、耕地15個(gè)。在各采樣點(diǎn)10 m×10 m樣方內(nèi)使用木鏟采集4個(gè)樣本,采樣深度為10 cm,并在現(xiàn)場(chǎng)進(jìn)行混合以創(chuàng)建代表性的復(fù)合樣本,使用便攜式GPS(UniStrong G120,誤差小于5 m)記錄每個(gè)采樣點(diǎn)的位置。盡管GPS定位精度水平不理想,但可以在四邊形采樣樣方和遙感影像像素之間提供合理的位置對(duì)準(zhǔn)[5]。將土壤放入密封的防水袋中并貼上標(biāo)貼,以備進(jìn)行近一步的化學(xué)分析。將所有樣品風(fēng)干、研磨(瑪瑙體)、均質(zhì)并過(guò)0.15 mm篩。每20 g土壤樣品中加入100 ml蒸餾水,并充分震蕩30 min后,靜置24 h,然后通過(guò)配備有復(fù)合電極(TetraCon 925)的數(shù)字多參數(shù)測(cè)量設(shè)備(Multi 3420 Set B,WTW GmbH,德國(guó))在室溫25℃下提取滲濾液以測(cè)量土壤電導(dǎo)率[5]。

1.3 遙感影像獲取及預(yù)處理

Sentinel-2A衛(wèi)星于2015年發(fā)射,承擔(dān)著全球環(huán)境與安全監(jiān)測(cè)的重要任務(wù),其幅寬達(dá)290 km,重訪周期為10 d,影像的最高分辨率為10 m,相關(guān)參數(shù)請(qǐng)見(jiàn)官網(wǎng)。本次研究中從歐洲航天局哥白尼開(kāi)放訪問(wèn)中心(https://scihub.copernicus.eu/)獲取到兩張以UTM/WGS84投影的無(wú)云Sentinel-2多光譜衛(wèi)星的Level-1C級(jí)影像數(shù)據(jù),成像時(shí)間為2019年5月28日。遙感影像數(shù)據(jù)已經(jīng)過(guò)輻射校正和幾何處理的Level-1C大氣上層表觀反射率。利用配套處理軟件SNAP和Sen2Cor插件進(jìn)行大氣校正,將大氣上層表觀反射率轉(zhuǎn)換為大氣層底部反射率值。在此步驟中,分辨率為60 m的波段(波段1、波段9和10)主要用于監(jiān)測(cè)大氣特征,因此不包括在后續(xù)研究中。為了盡可能多的保留信息,每個(gè)預(yù)處理光譜帶的鑲嵌圖以10 m的空間分辨率進(jìn)行創(chuàng)建。

1.4 環(huán)境協(xié)變量

地形數(shù)據(jù)是數(shù)字土壤制圖研究中最常用的地表參數(shù),地形條件在鹽分布和重新分布中起著重要作用,坡陡的地形有利于鹽分的淋移,而低洼的地形卻有利于鹽分的積累[20]。本研究從地理空間數(shù)據(jù)云(http://www.gscloud.cn/)獲取了空間分辨率為30 m的研究區(qū)DEM數(shù)據(jù),并重采樣成10 m的分辨率,使用SAGA GIS軟件計(jì)算了15種地形指數(shù),見(jiàn)表1。在土壤鹽漬化監(jiān)測(cè)中,植被是影響預(yù)測(cè)精度的關(guān)鍵因素之一,雖然植被會(huì)遮蔽土壤信息,但是在高植被覆蓋下,植被指數(shù)對(duì)土壤鹽分的變化更加敏感[21]。已通過(guò)遙感影像計(jì)算了部分植被指數(shù),見(jiàn)表2。在遙感影像上,由于鹽漬化土壤的藍(lán)、綠、紅和近紅外的光譜特性不同,因此相關(guān)學(xué)者開(kāi)發(fā)了各種鹽度指數(shù)用于土壤鹽漬化的監(jiān)測(cè)與制圖[22]。然而目前構(gòu)建的指數(shù)大都集中于可見(jiàn)光與近紅外波段,在短波近紅外和紅邊光譜帶中研究較少,Sentinel-2特有的3個(gè)紅邊光譜帶為改善土壤鹽分監(jiān)測(cè)提供了新的機(jī)遇。本研究計(jì)算了33個(gè)紅邊光譜指數(shù),見(jiàn)表3。

表1 地形指數(shù)

表2 植被指數(shù)及其計(jì)算公式

注:為Sentinel-2A波段反射率,下標(biāo)數(shù)字為各波段編號(hào),下同。

Note:is reflectivity of Sentinel-2A waveband, and the subscript number is the number of each band, same as below.

表3 紅邊光譜指數(shù)及其計(jì)算公式[5]

1.5 環(huán)境變量?jī)?yōu)選

在土壤鹽漬化制圖中,并不是所有的環(huán)境因子都是參與建模的重要變量,其對(duì)EC預(yù)測(cè)的貢獻(xiàn)也存在差異[32]。XGBoost模型是高級(jí)的樹(shù)增強(qiáng)系統(tǒng),它是Friedman[33]開(kāi)發(fā)的梯度增強(qiáng)方法的改進(jìn),與梯度提升回歸樹(shù)算法相比,它不再使用一階導(dǎo)數(shù),而是基于二階泰勒公式展開(kāi),其通過(guò)許多加法函數(shù)進(jìn)行預(yù)測(cè):

式中為第棵樹(shù)的葉子樹(shù),為葉子權(quán)值,從1到,是控制樹(shù)結(jié)構(gòu)的簡(jiǎn)單性以避免過(guò)擬合的正則化參數(shù)。參數(shù)GH分別是損失函數(shù)的第一和第二梯度的第個(gè)葉相關(guān)樣本的總和。

式(4)中GH與左葉相關(guān),GH在分裂后與右葉相關(guān)。如果增益參數(shù)優(yōu)于0,則接受分裂。因此,增加正則化參數(shù)和降低增益參數(shù),從而避免葉分裂的復(fù)雜性,即保持樹(shù)結(jié)構(gòu)的簡(jiǎn)單性,但同時(shí)也會(huì)降低模型對(duì)訓(xùn)練數(shù)據(jù)的擬合能力。

1.6 預(yù)測(cè)模型及評(píng)價(jià)

隨機(jī)森林(RF)是一種包含多棵決策樹(shù),輸出類(lèi)別由個(gè)別樹(shù)輸出的類(lèi)別眾數(shù)而決定的分類(lèi)回歸模型。RF不需要關(guān)于響應(yīng)協(xié)變量關(guān)系的分布假設(shè),Bagging算法確保了模型的性能,該過(guò)程允許對(duì)模型泛化能力進(jìn)行統(tǒng)計(jì)上的可靠估算,并不存在過(guò)度擬合的風(fēng)險(xiǎn)[19]。在Python3.7語(yǔ)言中,RF通過(guò)Sklearn機(jī)器學(xué)習(xí)庫(kù)實(shí)現(xiàn)(決策樹(shù)數(shù)量n_estimators = 41)。極限學(xué)習(xí)機(jī)(ELM)模型是發(fā)展于單隱含層前饋神經(jīng)網(wǎng)絡(luò)的新型算法,是為快速訓(xùn)練而設(shè)計(jì)的單層前饋神經(jīng)網(wǎng)絡(luò)算法[34]。ELM以學(xué)習(xí)力迅速、泛化性突出、參數(shù)設(shè)置便捷等優(yōu)點(diǎn)彌補(bǔ)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中出現(xiàn)時(shí)間訓(xùn)練時(shí)間過(guò)長(zhǎng)、學(xué)習(xí)率敏感等不足的缺點(diǎn)(本文中隱含層Hidden nodes=16)。偏最小二乘回歸(PLSR)結(jié)合了主成分分析、多元線性回歸分析和典型相關(guān)分析方法的特點(diǎn),是一種新型的數(shù)據(jù)分析方法。PLSR建立的模型具有更好的魯棒性,避免過(guò)擬合,為多元統(tǒng)計(jì)分析提供了極大便利[35]。

利用Python3.7編程語(yǔ)言中機(jī)器學(xué)習(xí)庫(kù)Sklearn模塊中train_test_split函數(shù)隨機(jī)劃分出70%(=54)的建模集和30%(=24)的驗(yàn)證集,并用random_state函數(shù)固定選中的數(shù)據(jù)集。為了評(píng)估基于 RF、ELM 和 PLSR 3種預(yù)測(cè)模型的性能,本文選取決定系數(shù)(2)、均方根誤差(Root Mean Square Error,RMSE)和相對(duì)分析誤差(Ratio of Performance to Deviation,RPD)來(lái)客觀評(píng)價(jià)預(yù)測(cè)建模的效果和性能。其中,2值越大,模型的精度越高;RMSE 表示預(yù)測(cè)能力,其大小與2成反比。RPD作為一種預(yù)測(cè)指標(biāo)也已廣泛應(yīng)用于評(píng)估預(yù)測(cè)模型的準(zhǔn)確性中。當(dāng)RPD≥2.5表示模型具有極佳預(yù)測(cè)能力,2.0≤RPD<2.5之間表示模型預(yù)測(cè)效果較好,1.7≤RPD<2.0表示模型預(yù)測(cè)能力一般,1.4≤RPD<1.7表示預(yù)測(cè)結(jié)果較差,RPD<1.4表示預(yù)測(cè)模型不可信[36]。

2 結(jié)果與分析

2.1 土壤EC統(tǒng)計(jì)特征分析

在整個(gè)研究區(qū)內(nèi)EC的變化很大,整個(gè)數(shù)據(jù)集的EC在0.25~39.8 dS/m 之間變化。建模集和驗(yàn)證集的均值分別為10.27和11.97 dS/m,變異系數(shù)分別為0.96和0.81,全樣本的均值為10.79 dS/m,變異系數(shù)為0.91,為中等變異。全樣本的均值和變異系數(shù)均介于驗(yàn)證集和建模集之間,表明樣本劃分合理。

2.2 不同土壤EC的光譜反射率

為了可視化不同鹽度的土壤樣品與Sentinel-2A各波段反射率之間的關(guān)系,根據(jù)土壤鹽漬化程度劃分標(biāo)準(zhǔn),繪制了不同鹽度水平區(qū)間和光譜反射率均值的光譜曲線(圖2)。

圖2 研究區(qū)不同電導(dǎo)率土壤的反射光譜曲線

如圖2所示,從非鹽土(0.73 dS/m,最低反射率)到鹽土(24.58 dS/m,最高反射率),土壤樣品的反射率隨著土壤鹽分的增加而增加。不同土壤樣品的電導(dǎo)率光譜反射率曲線非常相似,從可見(jiàn)光到近紅外波段,尤其是從藍(lán)光到近紅外波段(B2-B8a)急劇增加,并在短波近紅外波段1(B11)處達(dá)到最大值,從短波近紅外波段1到短波近紅外波段2(B12)反射率降低。但值得注意的是在短波近紅外波段2中,不同EC水平和相應(yīng)光譜特征之間的規(guī)律不太明顯(圖2),這與El Harti等[37]的發(fā)現(xiàn)是一致的。

2.3 環(huán)境變量?jī)?yōu)選

使用五折交叉驗(yàn)證方法訓(xùn)練XGBoost算法計(jì)算特征屬性重要性,采用默認(rèn)參數(shù),以盡可能減少人為因素的影響,特征值小于0.01時(shí)無(wú)統(tǒng)計(jì)學(xué)意義,在本次研究中將重要性小于0.01的環(huán)境變量全部予以剔除[38]。本文在Python3.7 中通過(guò)XGBoost庫(kù)進(jìn)行環(huán)境變量進(jìn)行篩選。在15個(gè)地形指數(shù)中,LSF的重要性為38.38%,其次是CA(重要性27.27%),而CI、VD、RSP、AS、DEM、PC、PrC的重要性小于0.01,因此不參與建模。在13個(gè)植被指數(shù)中, MAVI的重要性為32.7%,RVI和IPVI的重要性小于0.01,因此剔除這2個(gè)植被指數(shù)。在33個(gè)紅邊光譜指數(shù)中,RESI62、RESI61、RESI13、RESI12、RESI36、RESI34、REII16、REII13、RESI14的重要性都為小于0.01,全部剔除,重要性最大的指數(shù)是RENDSI2。至此,在3種指數(shù)中,共篩選出了8個(gè)地形指數(shù)、11個(gè)植被指數(shù)、24個(gè)紅邊光譜指數(shù)參與本次建模。圖3為篩選后指數(shù)及其重要性。

圖3 優(yōu)選變量及其重要性

2.4 建模評(píng)價(jià)

利用紅邊光譜指數(shù)、紅邊光譜指數(shù)與地形指數(shù)、紅邊光譜與植被指數(shù)以及三者的組合分別作為輸入變量,以土壤電導(dǎo)率為目標(biāo)變量,建立了RF、ELM和PLSR 3種模型,利用獨(dú)立的驗(yàn)證數(shù)據(jù)集來(lái)驗(yàn)證模型的預(yù)測(cè)能力。結(jié)果表明,僅利用紅邊光譜指數(shù)所建立的估算模型中,RF模型的效果最好(驗(yàn)證集2=0.63, RMSE=7.14 dS/m, RPD =2.09),根據(jù)驗(yàn)證標(biāo)準(zhǔn),具有較好的預(yù)測(cè)能力,而ELM預(yù)測(cè)效果較差。在紅邊光譜指數(shù)分別與地形指數(shù)、植被指數(shù)組合所建立的預(yù)測(cè)模型中,紅邊光譜指數(shù)與植被指數(shù)組合所建立模型的效果優(yōu)于其分別與地形指數(shù)的組合,在其與植被指數(shù)組合所建立的模型中,RF模型的驗(yàn)證集2為0.76,RMSE為5.36 dS/m,RPD 為2.79。此外,3種指數(shù)的組合建立的模型預(yù)測(cè)效果都優(yōu)于其與地形指數(shù)和植被指數(shù)的組合。對(duì)比3種模型驗(yàn)證集2、RMSE和RPD 可知,RF的預(yù)測(cè)效果最佳,2為0.83,RMSE為4.81 dS/m,RPD 為3.11,ELM次之,2為0.78,RMSE為5.19 dS/m,RPD 為2.88,PLSR的效果最差。此外,隨著輸入特征變量的增加,不同模型的預(yù)測(cè)精度都有不同程度的增加(表4)??傊?,在3種建模方法中,RF的預(yù)測(cè)性能和效果都優(yōu)于其他2個(gè)模型(表4)。

表4 3種建模方法預(yù)測(cè)結(jié)果比較

2.5 土壤鹽分空間分布特征

利用選取的最優(yōu)變量組合(Spectral index+ Topographic index + Vegetation Index)和最佳模型(RF)繪制了艾比湖濕地土壤鹽漬化空間分布圖(圖4)。依據(jù)土壤鹽漬化等級(jí)劃分標(biāo)準(zhǔn),將研究區(qū)土壤樣本劃分為5類(lèi):EC<2 dS/m 為非鹽漬土,2≤EC<4 dS/m 為輕度鹽漬化,4≤EC<8 dS/m 為中度鹽漬化,8≤EC<16 dS/m為重度鹽漬化,EC≥16 dS/m為鹽漬土[39]。從圖中(圖4)可以看出,土壤鹽分從研究區(qū)的中心到邊緣逐漸降低。受地形影響,鹽堿化程度最低的區(qū)域大部分位于研究區(qū)北部,而鹽漬化程度最高的地區(qū)位于艾比湖的中部和東部地區(qū)。

圖4 土壤鹽漬化分布圖

3 討 論

本研究中預(yù)測(cè)準(zhǔn)確性的比較表明,機(jī)器學(xué)習(xí)算法的選擇以及環(huán)境變量的類(lèi)型和組合對(duì)EC的預(yù)測(cè)性能有很大的影響(表4)。總體而言,RF模型的表型優(yōu)于其他2個(gè)預(yù)測(cè)模型,這與Wang等[40]的研究結(jié)果相似。在3個(gè)研究地點(diǎn)(德國(guó),比利時(shí),盧森堡),Castaldi等[41]利用不同類(lèi)型的遙感影像進(jìn)行土壤性質(zhì)的預(yù)測(cè),發(fā)現(xiàn)遙感數(shù)據(jù)的類(lèi)型、預(yù)測(cè)模型的選擇以及研究區(qū)域?qū)︻A(yù)測(cè)精度有影響。此外,以前的研究中也存在不一致之處,厲彥玲等[42]使用環(huán)境一號(hào)衛(wèi)星(HSI)高光譜衛(wèi)星和Lansat8多光譜衛(wèi)星2種不同傳感器的影像進(jìn)行融合,構(gòu)建了多元線性回歸(MLR)、PLSR、RF、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVM)5種模型對(duì)黃河三角洲的土壤鹽分進(jìn)行反演,結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果要優(yōu)于其他模型。基于此,沒(méi)有一個(gè)模型在所有情況下都能達(dá)到最佳效果,因此,我們建議使用特定的實(shí)驗(yàn)數(shù)據(jù)集來(lái)校準(zhǔn)模型。

各種光譜傳感器使用地面目標(biāo)反射的光譜信息來(lái)監(jiān)測(cè)目標(biāo)信息,與不同鹽度的目標(biāo)土壤相關(guān)的不同光譜特征也為表土鹽度監(jiān)測(cè)奠定了基礎(chǔ)[40]。鹽漬化程度最高的區(qū)域通常覆蓋著白色鹽殼,這解釋了幾乎在每個(gè)波段中土壤鹽分增加時(shí)土壤樣品的光譜反射率增加(圖2)。這使得可以將光譜指數(shù)用于土壤鹽度監(jiān)測(cè)和制圖,在大范圍遠(yuǎn)程監(jiān)測(cè)土壤鹽漬化過(guò)程中具有重要作用[2]。地形是土壤形成中最重要的因素之一,基于DEM的地形變量通常被用作數(shù)字化土壤制圖的關(guān)鍵因子。地形控制著溶質(zhì)、水和沉積物的流動(dòng),進(jìn)而影響土壤的發(fā)育和土壤特性的空間分布[43]。在本次研究中,VD、RSP、PrC、PC、DEM、CI、AS重要性小于0.01,未參與建模,這可能主要是由于研究區(qū)地形相對(duì)平坦。此外,該地區(qū)降雨產(chǎn)生的地表徑流有限,大大削弱了地形因素對(duì)鹽分再分配的影響[40]。土壤性質(zhì)與植被覆蓋之間有著密切的關(guān)系,而植被指數(shù)可以捕捉到土壤性質(zhì)的變化。蒙莉娜等[9]的研究表明,植被指數(shù)和遙感反射率是預(yù)測(cè)土壤性質(zhì)的重要指標(biāo)。在33個(gè)紅邊光譜指數(shù)中,有將近73%的指數(shù)參與了建模。建模結(jié)果也表明,在加入了植被指數(shù)之后,3種建模方法效果和穩(wěn)定性都優(yōu)于其與地形指數(shù)參與的建模效果。值得注意的是,植被指數(shù)和鹽度光譜指數(shù)在全世界范圍內(nèi)的鹽度監(jiān)測(cè)中均顯示出較高的預(yù)測(cè)精度[5]。此外,植被指數(shù)和鹽度光譜指數(shù)對(duì)土壤鹽分的響應(yīng)受許多因素影響,并沒(méi)有通用的光譜指數(shù)在任何環(huán)境條件下都能顯示出良好的預(yù)測(cè)精度[2]。

利用RS技術(shù)實(shí)現(xiàn)對(duì)土壤鹽漬化的監(jiān)測(cè),鹽度不是影響土壤光譜特征的唯一因素,土壤水分、土壤質(zhì)地和植被是影響監(jiān)測(cè)精度的關(guān)鍵因素,由于植被覆蓋率、土壤水分和土壤質(zhì)地會(huì)發(fā)生可變誤差,對(duì)土壤鹽分制圖將會(huì)產(chǎn)生一定的影響[5]。在未來(lái)的研究中,將嘗試通過(guò)增加采樣點(diǎn)和先進(jìn)的采樣策略增加樣本量,同時(shí)也適當(dāng)?shù)脑黾迎h(huán)境協(xié)變量,以減少不確定性并做出更可靠地預(yù)測(cè),制作更為精細(xì)的土壤鹽漬化監(jiān)測(cè)圖。

4 結(jié) 論

本研究利用Sentinel-2A影像構(gòu)建了紅邊光譜指數(shù)和植被指數(shù),并輔以地形指數(shù),使用XGBoost模型剔除無(wú)效變量,建立了RF、ELM和PLSR 3種土壤鹽漬化預(yù)測(cè)模型,并利用最佳模型進(jìn)行了土壤鹽漬化制圖,為進(jìn)一步監(jiān)測(cè)干旱、半干旱地區(qū)土壤鹽漬化選擇有效環(huán)境變量,提高土壤鹽漬化制圖精度提供了一定基礎(chǔ)。主要結(jié)論如下:

1)在不同水平的土壤電導(dǎo)率下相應(yīng)光譜反射特征的變化表明,土壤含鹽量越高,光譜反射越強(qiáng)烈,并在短波近紅外波段1(B11)處達(dá)到最大值。

2)優(yōu)選的紅邊光譜指數(shù)基本可以實(shí)現(xiàn)對(duì)土壤鹽分的預(yù)測(cè),僅用優(yōu)選的紅邊光譜指數(shù)建立的RF模型預(yù)測(cè)精度(驗(yàn)證集2=0.63,RMSE=7.14 dS/m,RPD=2.09)優(yōu)于其他2個(gè)模型。此外,隨著特征變量(地形指數(shù)和植被指數(shù))的加入,3個(gè)模型的預(yù)測(cè)精度和穩(wěn)定性都有不同程度的增加和改善。

3)3類(lèi)變量組合建模取得了良好的預(yù)測(cè)精度,其中RF的預(yù)測(cè)精度和穩(wěn)定性最佳(驗(yàn)證集2=0.83,RMSE=4.81 dS/m,RPD=3.11),并利用其進(jìn)行了土壤鹽漬化制圖。鹽漬化嚴(yán)重的地區(qū)主要分布在艾比湖東部和中部地區(qū),北部地區(qū)鹽漬化程度較低。

[1] Dehaan R, Taylor G R. Image-derived spectral endmembers as indicators of salinisation[J]. International Journal of Remote Sensing, 2003, 24(4): 775-794.

[2] Peng Jie, Biswas A, Qing Songjiang, et al. Estimating soil salinity from remote sensing and terrain data in southern Xinjiang Province, China[J]. Geoderma, 2019, 337: 1309-1319.

[3] Ma Ziqiang, Xu Yaping, Peng Jie, et al. Spatial and temporal precipitation patterns characterized by TRMM TMPA over the Qinghai-Tibetan plateau and surroundings[J]. International Journal of Remote Sensing, 2018, 39(11/12): 3891-3907.

[4] Ding Jianli, Yu Danlin. Monitoring and evaluating spatial variability of soil salinity in dry and wet seasons in the Werigan-Kuqa Oasis, China, using remote sensing and electromagnetic induction instruments[J]. Geoderma, 2014, 235: 316-322.

[5] Wang Jingzhe, Ding Jianli, Yu Danlin, et al. Capability of Sentinel-2 MSI data for monitoring and mapping of soil salinity in dry and wet seasons in the Ebinur Lake region, Xinjiang, China[J]. Geoderma, 2019, 353: 172-187.

[6] Nesa Farahmand, Vahid Sadeghi. Estimating soil salinity in the dried lake bed of Urmia lake using optical Sentinel-2 images and nonlinear regression models[J]. Journal of the Indian Society of Remote Sensing, 2020, 48(4): 675-687.

[7] 朱阿興,楊琳,樊乃卿,等. 數(shù)字土壤制圖研究綜述與展望[J]. 地理科學(xué)進(jìn)展,2018,37(1):66-78.

Zhu Axing, Yang Lin, Fan Naiqing, et al. The review and outlook of digital soil mapping[J]. Progress in Geography, 2018, 37(1): 66-78. (in Chinese with English abstract)

[8] 張?zhí)熘?,張鳳榮,黃敬文,等. 工業(yè)化區(qū)域撂荒耕地空間格局演變及影響因素分析[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(15):246-255.

Zhang Tianzhu, Zhang Fenrong, Huang Jinwen, et al. Spatial pattern evolution of abandoned arable land and its influencing factor in industrialized region[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(15): 246-255. (in Chinese with English abstract)

[9] 蒙莉娜,丁建麗,王敬哲,等. 基于環(huán)境變量的渭干河-庫(kù)車(chē)河綠洲土壤鹽分空間分布[J]. 農(nóng)業(yè)工程學(xué)報(bào),2020,36(1):175-181.

Meng Lina, Ding Jianli, Wang Jingzhe, et al. Spatial distribution of soil salinity in Ugan-Kuqa River delta oasis based on environmental variables[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 36(1): 175-181. (in Chinese with English abstract)

[10] 韓逸,江葉楓,郭熙,等. 基于增強(qiáng)回歸樹(shù)的鄱陽(yáng)湖平原區(qū)耕地土壤鉀素空間變異影響因素研究[J]. 植物營(yíng)養(yǎng)與肥料學(xué)報(bào),2020,26(4):622-634.

Han Yi, Jiang Yefeng, Guo Xi, et al. Study on the factors influencing the spatial variability of soil potassium in cultivated land in Poyang Lake Plain based on boosted regression tree[J]. Journal of Plant Nutrition and Fertilizers, 2020, 26(4): 622-634. (in Chinese with English abstract)

[11] 劉全明,成秋明,王學(xué),等. 河套灌區(qū)土壤鹽漬化微波雷達(dá)反演[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(16):109-114.

Liu Quanming, Cheng Qiuming, Wang Xue, et al. Soil salinity inversion in Hetao Irrigation district using microwave radar[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(16): 109-114. (in Chinese with English abstract)

[12] 陳紅艷,趙庚星,陳敬春,等. 基于改進(jìn)植被指數(shù)的黃河口區(qū)鹽漬土鹽分遙感反演[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(5):107-114.

Chen Hongyan, Zhao Gengxing, Chen Jingchun, et al. Remote sensing inversion of saline soil salinity based on modified vegetation index in estuary area of Yellow River[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(5): 107-114. (in Chinese with English abstract)

[13] 姚志華,陳俊英,張智韜,等. 覆膜對(duì)無(wú)人機(jī)多光譜遙感反演土壤含鹽量精度的影響[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(19):89-97.

Yao Zhihua, Chen Junying, Zhang Zhitao, et al. Effect of plastic film mulching on soil salinity inversion by using UAV multispectral remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(19): 89-97. (in Chinese with English abstract)

[14] Allbed A, Kumar L, Aldakheel Y Y. Assessing soil salinity using soil salinity and vegetation indices derived from IKONOS high-spatial resolution imageries: Applications in a date palm dominated region[J]. Geoderma, 2014(230/231): 1-8.

[15] Zhou Tao, Lu Huiling, Wang Wenwen, et al. GA-SVM based feature selection and parameter optimization in hospitalization expense modeling[J]. Applied Soft Computing, 2019, 75: 323-332.

[16] 徐紅濤,陳春波,鄭宏偉,等. 基于相關(guān)分析和自適應(yīng)遺傳算法的鹽漬化建模變量和參數(shù)優(yōu)選[J]. 地球信息科學(xué)學(xué)報(bào),2020,22(7):1497-1509.

Xu Hongtao, Chen Chunbo, Zheng Hongwei, et al. Correlation analysis and adaptive genetic algorithm based feature subset and model parameter optimization in salinization monitoring[J]. Journal of Geo-information Science, 2020, 22(7): 1497-1509. (in Chinese with English abstract)

[17] 王飛,楊勝天,丁建麗,等. 環(huán)境敏感變量?jī)?yōu)選及機(jī)器學(xué)習(xí)算法預(yù)測(cè)綠洲土壤鹽分[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(22):102-110.

Wang Fei, Yang Shengtian, Ding Jianli, et al. Environmental sensitive variable optimization and machine learning algorithm using in soil salt prediction at oasis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(22): 102-110. (in Chinese with English abstract)

[18] 田美玲,葛翔宇,丁建麗,等. 耦合機(jī)器學(xué)習(xí)和機(jī)載高光譜數(shù)據(jù)的土壤含水量估算[J]. 激光與光電子學(xué)進(jìn)展,2020,57(9):093002.

Tian Meiling, Ge Xiangyu, Ding Jianli, et al. Coupled machine Learning and UAV-based hyperspectral imagery for soil water content estimation[J]. Laser & Optoelectronics Progress, 2020, 57(9): 093002. (in Chinese with English abstract)

[19] 鄒玉江. 基于機(jī)器學(xué)習(xí)的滬深300指數(shù)走勢(shì)預(yù)測(cè)研究[D].濟(jì)南:山東大學(xué),2018.

Zou Yujiang. The Study of HS300 Index Predition Based Machine Learning[D]. Jinan: Shandong Uiniversity, 2018. (in Chinese with English abstract)

[20] Taghizadeh-Mehrjardi R, Minasny B, Sarmadian F, et al. Digital mapping of soil salinity in Ardakan region, central Iran[J]. Geoderma, 2014, 213: 15-28.

[21] Zhang Tingting, Zeng Shenglan, Gao Yu, et al. Using hyperspectral vegetation indices as a proxy to monitor soil salinity[J]. Ecological Indicators, 2011, 11(6): 1552-1562.

[22] Meng Ling, Zhou Shiwei, Zhang Hua, et al. Estimating soil salinity in different landscapes of the Yellow River Delta through Landsat OLI/TIRS and ETM+ Data[J]. Journal of Coastal Conservation, 2016, 20(4): 271-279.

[23] Tucker C J. Red and photographic infrared linear combinations for monitoring vegetation[J]. Remote Sensing of Environment, 1979, 8(2): 127-150.

[24] Frampton W J, Dash J, Watmough G, et al. Evaluating the capabilities of Sentinel-2 for quantitative estimation of biophysical variables in vegetation[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 82: 83-92.

[25] 易秋香. 基于 Sentinel-2 多光譜數(shù)據(jù)的棉花葉面積指數(shù)估算[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(16):189-197.

Yi Qiuxiang. Remote estimation of cotton LAI using Sentinel-2 multispectral data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(16): 189-197. (in Chinese with English abstract)

[26] Qi J, Chehbouni A, Huete A R, et al. A modified soil adjusted vegetation index[J]. Remote Sensing of Environment, 1994, 48(2): 119-126.

[27] Jordan C F. Derivation of leaf-area index from quality of light on the forest floor[J]. Ecology, 1969, 50(4): 663-666.

[28] Huete A R. A soil-adjusted vegetation index (SAVI)[J]. Remote Sensing of Environment, 1988, 25(3): 295-309.

[29] Gitelson A A, Kaufman Y J, Merzlyak M N. Use of a green channel in remote sensing of global vegetation from EOS-MODIS[J]. Remote Sensing of Environment, 1996, 58(3): 289-298.

[30] Huete A, Didan K, Miura T, et al. Overview of the radiometric and biophysical performance of the MODIS vegetation indices[J]. Remote Sensing of Environment, 2002, 83(1/2): 195-213.

[31] Daughtry C, Walthall C, Kim M, et al. Estimating corn leaf chlorophyll concentration from leaf and canopy reflectance[J]. Remote Sensing of Environment, 2000, 74(2): 229-239.

[32] 張振華,丁建麗,王敬哲,等. 集成土壤-環(huán)境關(guān)系與機(jī)器學(xué)習(xí)的干旱區(qū)土壤屬性數(shù)字制圖[J]. 中國(guó)農(nóng)業(yè)科學(xué),2020,53(3):563-573.

Zhang Zhenghua, Ding Jianli, Wang Jingzhe, et al. Digital soil properties mapping by ensembling Soil-Environment Relationship and Machine Learning in Arid Regions[J]. Scientia Agricultura Sinica, 2020, 53(3): 563-573. (in Chinese with English abstract)

[33] Friedman J H. Greedy function approximation: A gradient boosting machine[J]. Annals of Statistics, 2001, 29(5): 1189-1232.

[34] Huang Gao, Huang Guangbin, Song Shiji, et al. Trends in extreme learning machines: A review[J]. Neural Networks, 2015, 61: 32-48.

[35] 薛利紅,周鼎浩,李穎,等. 不同利用方式下土壤有機(jī)質(zhì)和全磷的可見(jiàn)近紅外高光譜反演[J]. 土壤學(xué)報(bào),2014,51(5):993-1002.

Xue Lihong, Zhou Dinghao, Li Yin, et al. Prediction of soil organic matter and total phosphorus with Vis-NIR hyperspectral inversion relative to land use[J]. Acta Pedologica Sinica, 2014, 51(5): 993-1002. (in Chinese with English abstract)

[36] Chang C W, Laird D A, Mausbach M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J]. Soil Science Society of America Journal, 2001, 65(2): 480-490.

[37] El Harti Abderrazak, Lhissou Rachid, Chokmani Karem, et al, Spatiotemporal monitoring of soil salinization in irrigated Tadla Plain (Morocco) using satellite spectral indices[J]. International Journal of Applied Earth Observations and Geoinformation, 2016, 50: 64-73.

[38] Zamani M. PM2.5 Prediction based on random forest, XGBoost, and deep learning using multisource remote sensing data[J]. Atmosphere, 2019, 10(7), 373.

[39] Wang Jingzhe, Ding Jianli, Yu Danlin, et al. Machine learning-based detection of soil salinity in an arid desert region, Northwest China: A comparison between Landsat-8 OLI and Sentinel-2 MSI.[J]. The Science of the Total Environment, 2020, 707: 136092.

[40] Wang Sijia, Chen Yunhao, Wang Mingguo, et al. Performance comparison of machine learning algorithms for

Estimating the soil salinity of salt-affected soil using field spectral data[J]. Remote Sensing, 2019, 11(22): 2605.

[41] Castaldi F, Hueni A, Chabrillat S, et al. Evaluating the capability of the Sentinel 2 data for soil organic carbon prediction in croplands[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2019, 147: 267-282.

[42] 厲彥玲,趙庚星,常春艷,等. OLI 與 HSI 影像融合的土壤鹽分反演模型[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(21):173-180.

Li Yanling, Zhao Gengxing, Chang Chunyan, et al, Soil salinity retrieval model based on OLI and HSI image fusion[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(21): 173-180. (in Chinese with English abstract)

[43] Ibrahim Yahiaoui, Abdelkader Douaoui, Zhang Qiang, et al. Soil salinity prediction in the Lower Cheliff plain (Algeria) based on remote sensing and topographic feature analysis[J]. Journal of Arid Land, 2015, 7(6): 794-805.

Digital mapping of soil salinization in arid area wetland based on variable optimized selection and machine learning

Ma Guolin, Ding Jianli※, Han Lijing, Zhang Zipeng

(1.830046,; 2.,830046,)

As a global problem, soil salinization poses a serious threat to the limited soil resources and ecosystem health in arid and semi-arid areas, and is one of the most important causes of land desertification and land degradation. Soil salinity is an effective evaluation index of soil salinization, and there is temporal and spatial difference. Dynamic monitoring can fully understand the status of soil salinization and effectively provide more quantitative information for soil restoration and land reclamation. Compared with traditional laboratory analysis, satellite remote sensing technology has major advantages in observing the ground at large spatial scales and high temporal resolution. As a new generation of spaceborne multi-spectral instrument (MSI), Sentinel-2A has novel spectral functions (namely, three red-edge bands and two near-infrared bands), which provides a broad prospect for quantitative evaluation of soil properties. At present, only a few studies were associated with red edge spectral index, vegetation index and topographic index in soil salinization mapping, and it has become a great challenge to choose the best modeling technology in soil mapping for a specific landscape area, although many algorithm have been successfully applied in the prediction of soil properties. Therefore, in this study, we used Sentinel-2A red-edge bands, vegetation indexes and digital elevation model (DEM) derived variables to conduct soil salt analysis based on machine learning methods in the Ebinur Lake wetland in the northwestern Xinjiang of China. 24 red edge spectral indices, 11 vegetation indices and 8 topographic indices were selected to participate in the modeling by the XGBoost algorithm, and the Random Forest (RF), Extreme Learning Machine (ELM) and Partial Least Squares Regression (PLSR) three machine learning models based on 78 sampling sites were applied to extract soil Electrical Conductivity (EC). The coefficient of determination (2), root mean square error (RMSE) and ratio of performance to deviation (RPD) were used to evaluate the prediction accuracy of the above models. The results showed that the optimal red edge spectral index combined with RF could basically predict EC. The verification set2, RMSE, and RPD were 0.63, 7.14 dS/m, and 2.09, respectively. The prediction accuracy of the combined modeling of the red edge spectral index and the vegetation index is better than that of the combination with the terrain index, and the prediction effect of the RF model was better than that of ELM and PLSR, and its training set (2=0.83, RMSE=4.84 dS/m), validation set (2=0.76, RMSE=5.36 dS/m, RPD=2.79). The prediction accuracy of the combined modeling of the red edge spectral index, vegetation index and terrain index combined with RF reached the best. The2, RMSE and RPD of the verification set were 0.83, 4.81 dS/m and 3.11, respectively. In addition, with the continuous increase of input feature variables, the prediction effect of each model were improved to varying degrees. Soil salinization mapping based on the optimal variable combination (red edge spectral index + terrain index + vegetation index) and the best prediction model (RF), showed that the degree of soil salinization in the central and eastern regions was particularly serious in the study area.

soils; salts;digital mapping; machine learning; variable selection; Sentinel-2A

馬國(guó)林,丁建麗,韓禮敬,等. 基于變量?jī)?yōu)選與機(jī)器學(xué)習(xí)的干旱區(qū)濕地土壤鹽漬化數(shù)字制圖[J]. 農(nóng)業(yè)工程學(xué)報(bào),2020,36(19):124-131.doi:10.11975/j.issn.1002-6819.2020.19.014 http://www.tcsae.org

Ma Guolin, Ding Jianli, Han Lijing, et al. Digital mapping of soil salinization in arid area wetland based on variable optimized selection and machine learning[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(19): 124-131. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.19.014 http://www.tcsae.org

2020-06-14

2020-09-20

國(guó)家自然科學(xué)基金項(xiàng)目(41961059,41771470)

馬國(guó)林,主要從事陸地遙感研究。Email:15894636407@163.com

丁建麗,教授,博士生導(dǎo)師,主要從事干旱區(qū)環(huán)境演變與遙感應(yīng)用方面的研究。Email:watarid@xju.edu.cn

10.11975/j.issn.1002-6819.2020.19.014

S153

A

1002-6819(2020)-19-0124-08

猜你喜歡
鹽漬化植被指數(shù)鹽分
蔬菜大棚土壤鹽漬化成因及防治措施
基于無(wú)人機(jī)圖像的草地植被蓋度估算方法比較
土地質(zhì)量地球化學(xué)調(diào)查成果在判定土壤鹽漬化、沙化中的應(yīng)用
寧夏中部壓砂區(qū)表層土壤離子分布及鹽分類(lèi)型預(yù)測(cè)
冬小麥SPAD值無(wú)人機(jī)可見(jiàn)光和多光譜植被指數(shù)結(jié)合估算
近10年新疆不同程度鹽漬化耕地的時(shí)空變化特征*
滴灌條件下鹽漬土鹽分淡化區(qū)形成過(guò)程中離子運(yùn)移特征
1989—2019 年寧夏銀北灌區(qū)土壤鹽漬化時(shí)空變化分析
海水這么咸的原因
攝影欣賞
霍州市| 团风县| 韶关市| 措勤县| 尼木县| 栖霞市| 武乡县| 英山县| 松桃| 黄浦区| 新疆| 晋城| 仁化县| 宾阳县| 贡嘎县| 疏附县| 酒泉市| 新营市| 金平| 两当县| 尉犁县| 利津县| 霍邱县| 木里| 铜鼓县| 治多县| 安徽省| 泸水县| 滨州市| 英吉沙县| 井研县| 海城市| 沙湾县| 邢台县| 驻马店市| 丰原市| 南昌县| 泗水县| 射阳县| 泌阳县| 金寨县|