邱元霖,陳 策,韓 佳,2,王新濤,2,魏世玉,張智韜,2
(1.西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院,陜西 楊凌 712100;2.西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,陜西 楊凌 712100)
河套灌區(qū)是我國(guó)三大灌區(qū)之一,由于干旱半干旱的特殊氣候,加之長(zhǎng)期的大水漫灌,造成土壤鹽漬化[1]。解放閘灌域作為河套灌區(qū)第二大灌域,土壤鹽漬化一直對(duì)農(nóng)業(yè)生產(chǎn)造成負(fù)面影響。因此利用準(zhǔn)確、有效和快速的技術(shù)手段對(duì)鹽漬化土壤進(jìn)行大面積監(jiān)測(cè)具有重要意義,是灌域農(nóng)業(yè)生產(chǎn)健康發(fā)展的關(guān)鍵[2-4]。
傳統(tǒng)的鹽漬化監(jiān)測(cè)手段雖然精度較高,但難以快速獲取大范圍的土壤鹽漬化信息,且需要耗費(fèi)大量的人力物力[5]。衛(wèi)星遙感技術(shù)快速、動(dòng)態(tài)、宏觀、綜合的特點(diǎn),決定了其在土壤鹽漬化監(jiān)測(cè)中的巨大潛力[6]。在利用光譜指數(shù)進(jìn)行土壤鹽漬化監(jiān)測(cè)方面,國(guó)內(nèi)外學(xué)者進(jìn)行了大量的研究[7-10],曹雷等[4]將GF-1號(hào)衛(wèi)星作為數(shù)據(jù)源,基于表層實(shí)測(cè)電導(dǎo)率與光譜指數(shù)構(gòu)建了PLSR模型,提高了高分辨率衛(wèi)星土壤鹽漬化監(jiān)測(cè)的精度。羅沖等[10]利用偏最小二乘法構(gòu)建了瑪納斯河流域土壤鹽分定量反演模型,對(duì)單一時(shí)刻的土壤鹽分含量進(jìn)行了反演,方法經(jīng)濟(jì)、便捷,較好的反映了研究區(qū)域的鹽分分布特征。黃權(quán)中等[11]基于SI鹽分光譜指數(shù)構(gòu)建了河套灌區(qū)鹽分遙感反演模型,在裸土條件下擬合精度較高,驗(yàn)證精度R2達(dá)到0.75。王飛等[9]基于歸一化差值植被指數(shù)(NDVI)、鹽分指數(shù)(SI)構(gòu)成了NDVI-SI特征空間,構(gòu)建了能夠精確反演有植被覆蓋區(qū)域土壤鹽分的SDI指數(shù)監(jiān)測(cè)模型,研究表明在考慮植被信息后,能夠更好的反應(yīng)鹽漬化程度。目前土壤鹽分反演的研究多集中于裸土方面,在植被覆蓋條件下的反演研究較少。
因此本文以河套灌區(qū)解放閘灌域?yàn)檠芯繀^(qū)域,GF-1號(hào)衛(wèi)星影像為數(shù)據(jù)源,根據(jù)植被受鹽分脅迫時(shí)的光譜信息,間接反演土壤鹽分。通過(guò)BP神經(jīng)網(wǎng)絡(luò)、分位數(shù)回歸、多元線性回歸三種方法建模,確定高分一號(hào)衛(wèi)星數(shù)據(jù)與不同土壤鹽漬化程度之間的定量關(guān)系,并對(duì)研究區(qū)域土壤鹽漬化分布進(jìn)行評(píng)估,以期提高植被覆蓋條件下的土壤鹽分反演精度,彌補(bǔ)裸土反演連續(xù)性上的不足,為土壤鹽漬化監(jiān)測(cè)提供一定的技術(shù)支持。
研究區(qū)域?yàn)閮?nèi)蒙古河套灌區(qū)解放閘灌域,灌域位于河套灌區(qū)西北部地區(qū),位于北緯40°26′~41°13′、東經(jīng)106°34′~107°34′,是一個(gè)東西長(zhǎng)81 km,南北長(zhǎng)86 km的斜三角形區(qū)域[12],為河套灌區(qū)第二大灌域。灌域?qū)儆诟咴貐^(qū),海拔在1 030~1 046 m之間,地形較為平坦。年降雨量66.3~200 mm,年蒸發(fā)量1 920~3 450 mm,為干旱半干旱地區(qū)[13,14]。灌域南鄰黃河,年引水量約為12 億m3,有夏灌期和秋澆期兩個(gè)階段,10月份引水量約占全年的30%,灌域控制面積21.57 萬(wàn)hm2,灌溉面積12.4 萬(wàn)hm2[15],農(nóng)田作物種植結(jié)構(gòu)復(fù)雜,主要包括玉米、小麥 、葵花等作物。圖1為研究區(qū)地理位置及采樣點(diǎn)分布圖。
圖1 內(nèi)蒙古河套灌區(qū)解放閘灌域地理位置及采樣點(diǎn)分布圖Fig.1 Geographical location and sampling point distribution map of Jiefangzha irrigation area in Inner Mongolia Hetao Irrigation District
解放閘灌域的主要作物中,葵花、玉米、西葫蘆均于9月20日左右或之后收獲。因此我們選擇作物生長(zhǎng)旺盛、植被信息豐富的8月份為研究時(shí)段。本文選擇0~60 cm的主根系土壤為研究對(duì)象[11,16,17]。研究區(qū)域土壤樣本采集時(shí)間為2018年8月13-17日,采樣點(diǎn)80個(gè),均為有植被覆蓋的0~60 cm土壤,采樣方法為五點(diǎn)取樣法,即以定位點(diǎn)為中心抽樣點(diǎn),對(duì)角線上與中心樣點(diǎn)等距的4個(gè)點(diǎn)為樣點(diǎn)。五點(diǎn)土樣充分混合后,經(jīng)土水比1∶5配置成水溶鹽溶液。電導(dǎo)率(EC1∶5,μS/m)使用上海佑科儀器公司的DDS-307A電導(dǎo)率儀進(jìn)行測(cè)定,土壤含鹽量(SSC,%)根據(jù)經(jīng)驗(yàn)公式SSC=(0.288 2EC1∶5+0.018 3)[11]得到。通過(guò)隨機(jī)選取的方式確定建模集與驗(yàn)證集,其中2/3的樣本點(diǎn)用于建模(n=53),1/3的樣本點(diǎn)用于驗(yàn)證(n=27),土壤鹽分統(tǒng)計(jì)特征見(jiàn)表1。
表1 土壤鹽分統(tǒng)計(jì)特征
Tab.1 Statistical characteristics of soil salinity
樣本類(lèi)型樣本點(diǎn)數(shù)最大值/%最小值/%均值/%標(biāo)準(zhǔn)差/%變異系數(shù)/%總體樣本802.870.080.530.54101.62建模樣本532.870.080.520.5299.87驗(yàn)證樣本272.820.120.550.57104.35
本文采用GF-1 WFV影像為數(shù)據(jù)源,衛(wèi)星空間分辨率16 m,具有藍(lán)波段b1(0.45~0.52 μm)、綠波段b2 (0.52~0.59 μm)、紅波段b3(0.63~0.69 μm)、近紅外波段b4(0.77~0.89 μm)4個(gè)波段,時(shí)間分辨率為4 d。影像獲取時(shí)間為2018年8月8日,與采樣時(shí)間基本同步,研究區(qū)域無(wú)云層遮擋。通過(guò)ENVI5.3.1軟件進(jìn)行影像預(yù)處理,包括幾何精校正、輻射定標(biāo)、大氣校正。其中幾何精校正對(duì)數(shù)據(jù)精度影像較大,采用同時(shí)期、同區(qū)域經(jīng)過(guò)幾何精校正的landsat8影像作為標(biāo)準(zhǔn),精度為10.59 m,誤差小于1個(gè)像元,基本滿(mǎn)足精度要求。
本文通過(guò)分位數(shù)回歸(QR)、多元線性回歸(MLR)、BP神經(jīng)網(wǎng)絡(luò)(BP)3種方法分別建立鹽分反演模型,并進(jìn)行精度驗(yàn)證。
1.4.1 多元線性回歸
多元線性回歸(multivariable linear regression)又名多重回歸,是利用兩個(gè)及以上自變量(x1,x2,x3,x4,…,xn)對(duì)因變量y進(jìn)行解釋的方法,本文利用SPSS 23軟件進(jìn)行MLR建模。數(shù)學(xué)模型如下[18]:
式中:β0為隨機(jī)誤差;βi為回歸系數(shù);k為自變量個(gè)數(shù)。
1.4.2 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network)是由Rumelhart和McClelland為首的科學(xué)家在1986年提出的[19],是目前應(yīng)用領(lǐng)域較廣、較為易懂的神經(jīng)網(wǎng)絡(luò)模型。該模型在非線性映射方面具有很大的優(yōu)勢(shì),能夠根據(jù)輸出結(jié)果與期望值之間的誤差調(diào)節(jié)系統(tǒng)內(nèi)部的參數(shù)值,并依據(jù)精度要求反復(fù)進(jìn)行信號(hào)向前傳播誤差反向傳播的操作,最終得到輸出結(jié)果。BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)由輸入層、隱含層、輸出層3部分組成[18,20,21]。本文BP神經(jīng)網(wǎng)絡(luò)模型以NIR、SI2、S2、S3、EVI為輸入層,土壤鹽分為輸出層。利用SPSS23軟件進(jìn)行BP神經(jīng)網(wǎng)絡(luò)建模。
1.4.3 分位數(shù)回歸
分位數(shù)回歸(Quantile regression)是在自變量與因變量的條件分位數(shù)之間建立關(guān)系的回歸方法,最早由Roger Koenker和Gilbert Bassett提出,此方法對(duì)異常點(diǎn)具有較高的耐抗性,且模型不需要對(duì)分布進(jìn)行假設(shè),使其較為穩(wěn)健[22,23]。本文利用SPSS 23軟件進(jìn)行QR建模。
對(duì)于模型的評(píng)價(jià)主要采用R2、RMSE、MAE三個(gè)指標(biāo)。其中R2為決定系數(shù)(coefficient of determination),用于衡量模型的擬合精度。RMSE為均方根誤差(root mean square error)、MAE為平均絕對(duì)誤差(mean absolute error),二者通過(guò)檢驗(yàn)?zāi)P皖A(yù)測(cè)值與實(shí)測(cè)值之間的誤差來(lái)衡量模型的準(zhǔn)確性。R2越大、RMSE與MAE越小,模型的精度越高。相關(guān)公式如下:
本文數(shù)據(jù)提取采用ENVI5.3.1軟件完成,數(shù)據(jù)處理及分析采用Microsoft Office 2016軟件完成,模型擬合采用SPSS 23軟件完成,繪圖采用Origin 2017軟件完成。
為能更全面的反應(yīng)植被覆蓋時(shí)的土壤鹽分信息,考慮到不同光譜指數(shù)反饋信息不同的特點(diǎn),本文依據(jù)前人經(jīng)驗(yàn)[4,24,25]選取鹽分指數(shù)(SI2、S2、S3)、增強(qiáng)植被指數(shù)(EVI)、近紅外NIR波段作為輸入因子,并進(jìn)行敏感性分析(圖2)。模型輸出因子為采樣點(diǎn)0~60 cm處的土壤含鹽量(SSC,%)。指數(shù)均由ENVI5.3.1平臺(tái)提取80個(gè)采樣點(diǎn)的各波段反射率計(jì)算得到,計(jì)算公式如表2所示。
圖2 光譜指數(shù)及波段相關(guān)系數(shù)折線圖Fig.2 Spectral index and band correlation coefficient line chart
表2 光譜指數(shù)
Tab.2 Spectral Index
光譜指數(shù)計(jì)算公式參考文獻(xiàn)SI2G2+R2+NIR2[24]S2(B-R)/(B+R)[4]S3(G×R)/B[4]EVI2.5×NIR-RNIR+6R-7.5B+1()[25]
注:B為藍(lán)波段b1;G為綠波段b2;R為紅波段b3;NIR為近紅外波段b4。
五個(gè)指數(shù)均通過(guò)了P=0.01的顯著性檢驗(yàn)。其中只有S3與土壤鹽分成正相關(guān),且相關(guān)系數(shù)達(dá)到0.555,對(duì)土壤鹽分的敏感性最好。EVI作為唯一的植被指數(shù)對(duì)土壤的敏感性?xún)H次于S3,相關(guān)系數(shù)為-0.506。鹽分指數(shù)S2與SI2相關(guān)系數(shù)分別為-0.470、-0.366,對(duì)土壤鹽分較為敏感。近紅外NIR波段相關(guān)系數(shù)為-0.409。選取以上五個(gè)指數(shù)作為因變量建立土壤鹽分反演模型。
基于SPSS 23軟件分別利用多元線性回歸(MLR)、分位數(shù)回歸(QR)、BP神經(jīng)網(wǎng)絡(luò)(BP)建立土壤鹽分反演模型,模型擬合精度數(shù)據(jù)如表3所示。
表3 基于光譜指數(shù)的多元線性回歸、神經(jīng)網(wǎng)絡(luò)、分位數(shù)回歸模型擬合精度對(duì)比
Tab.3 Comparison of fitting precision of MLR, BP and QRmodels based on spectral index
模型建模集(n=53)R2RMSEMLR0.6330.313BP0.6050.353QR0.6270.327
由表3得3個(gè)模型擬合精度都較好,決定系數(shù)均在0.6以上;BP神經(jīng)網(wǎng)絡(luò)模型擬合精度相對(duì)其他兩個(gè)模型較差,決定系數(shù)最低為0.605,RMSE也高于其他兩個(gè)模型,為0.353,預(yù)測(cè)值的偏差相對(duì)較大;多元線性回歸模型與分位數(shù)回歸模型的擬合精度較高,二者決定系數(shù)均優(yōu)于0.62,其中多元線性回歸模型決定系數(shù)相對(duì)較高,為0.633,分位數(shù)回歸模型決定系數(shù)略低,為0.627,且多元線性回歸模型與分位數(shù)回歸模型的RMSE效果也相對(duì)較好,多元線性回歸模型的RMSE為0.313,相對(duì)于實(shí)測(cè)值誤差較小,優(yōu)于分位數(shù)回歸模型的RMSE=0.327。綜合比較上述模型,多元線性回歸模型的擬合精度最好,決定系數(shù)和RMSE均為最優(yōu),但分位數(shù)回歸模型與之相差不大,決定系數(shù)近似相等,RMSE僅比多元線性回歸模型高4.47%,因此兩個(gè)模型在擬合精度上無(wú)明顯的優(yōu)劣之分,均能較好的在植被覆蓋條件下反演土壤鹽分。
將驗(yàn)證集的樣本點(diǎn)代入到已經(jīng)建立的3個(gè)土壤鹽分反演模型當(dāng)中,通過(guò)計(jì)算決定系數(shù)R2、均方根誤差RMSE和平均絕對(duì)誤差MAE,檢驗(yàn)3個(gè)模型的預(yù)測(cè)效果并進(jìn)行精度分析。相關(guān)計(jì)算結(jié)果如表4所示。
表4 基于光譜指數(shù)的多元線性回歸、神經(jīng)網(wǎng)絡(luò)、分位數(shù)回歸模型預(yù)測(cè)精度對(duì)比
Tab.4 Comparison of prediction accuracy of MLR, BP and QRmodels based on spectral index
模型驗(yàn)證集(n=27)R2RMSEMAEMLR0.6360.2540.244BP0.5580.3040.255QR0.6360.2490.235
多元線性回歸模型與分位數(shù)回歸模型的預(yù)測(cè)精度依然相對(duì)較好,與建模集情況相同,決定系數(shù)均達(dá)到0.636。其中分位數(shù)回歸模型RMSE相對(duì)較低,為0.249,略小于多元線性回歸模型,就MAE而言分位數(shù)回歸模型比多元線性回歸模型低3.68%,效果相對(duì)較好,這說(shuō)明分位數(shù)回歸模型預(yù)測(cè)值與實(shí)測(cè)值誤差整體較小。BP神經(jīng)網(wǎng)絡(luò)模型決定系數(shù)明顯低于其他兩個(gè)模型,僅為0.558,同時(shí)RMSE與MAE數(shù)值相較其他兩個(gè)模型偏大,整體預(yù)測(cè)精度偏低。因此分位數(shù)回歸模型在滿(mǎn)足擬合優(yōu)度的基礎(chǔ)上,對(duì)土壤鹽分的預(yù)測(cè)相對(duì)誤差較低,反演精度更高。
如圖3所示,當(dāng)SSC<0.5時(shí),BP模型的整體預(yù)測(cè)精度最低,MLR模型次之,QR模型預(yù)測(cè)值更接近實(shí)測(cè)值;0.5
圖3 多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)、分位數(shù)回歸模型土壤鹽分預(yù)測(cè)值與實(shí)測(cè)值折線圖Fig.3 Line diagram of predicted and measured values of soil salinity in MLR, BP and QR models
選取預(yù)測(cè)精度最高的QR模型對(duì)土壤鹽分進(jìn)行反演,得到內(nèi)蒙古河套灌區(qū)解放閘灌域的0~60 cm土壤鹽分分布圖(圖4)。根據(jù)QR模型反演結(jié)果,解放閘灌域非鹽土(<0.2%)、輕度鹽漬化(0.2%~0.5%)、重度鹽漬化(0.5%~1.0%)與鹽土(>1.0%)面積分別占灌域總面積的27%、38%、12%、7%,城市用地約占16%。灌域南部地區(qū)的土壤含鹽量普遍較低,多數(shù)為非鹽土(<0.2%),輕度鹽漬化區(qū)域穿插分布其間。從灌域中部地區(qū)開(kāi)始到灌域北部地區(qū)結(jié)束,非鹽土較少,多為輕度鹽漬化。灌域西側(cè)集中分布有大面積的鹽土,且多為裸土區(qū)域,其他重度鹽漬化區(qū)域及鹽土則零散的分布在整個(gè)灌域,其中杭錦后旗西北與東南兩側(cè)和灌域北部區(qū)域分布相對(duì)較多;這與灌域南部地區(qū)地下水位較深,中部地區(qū)水位較淺有一定關(guān)系。
圖4 解放閘灌域0~60 cm土壤鹽分空間分布圖Fig.4 Spatial distribution of soil salinity in 0~60 cm of Jiefang irrigation area
(1)經(jīng)過(guò)對(duì)比3個(gè)不同的鹽分反演模型,發(fā)現(xiàn)多元線性回歸模型與分位數(shù)回歸模型均能較好的反演植被覆蓋條件下0~60 cm層土壤鹽分,二者建模與驗(yàn)證決定系數(shù)均在0.6以上,其中分位數(shù)回歸預(yù)測(cè)精度最高,是本次土壤鹽分估算的最優(yōu)模型。
(2)通過(guò)分析河套灌區(qū)解放閘灌域鹽分反演圖,就0~60 cm土壤而言,研究區(qū)整體鹽分分布情況為灌域南部地區(qū)土壤鹽漬化程度較輕。重度鹽漬化及鹽土區(qū)域呈零散狀分布在整個(gè)灌域,占灌域總面積的19%左右。
(3)通過(guò)衛(wèi)星遙感手段提取作物光譜信息進(jìn)而間接反演土壤鹽分受到天氣諸多因素的影響,本文的研究方法僅適用于作物生長(zhǎng)茂盛的時(shí)期,其他生育期的鹽分反演還需進(jìn)一步探究。