任申萍, 呂成文, 陳東來(lái), 鄧浩然
(安徽師范大學(xué) 地理與旅游學(xué)院,安徽 蕪湖 241003)
土壤水分是農(nóng)作物生長(zhǎng)發(fā)育的必要條件,也是土壤墑情評(píng)價(jià)的重要指標(biāo),快速準(zhǔn)確地預(yù)測(cè)土壤水分對(duì)精準(zhǔn)農(nóng)業(yè)的發(fā)展具有十分重要的意義[1]。高光譜技術(shù)作為近年來(lái)土壤地理學(xué)的研究熱點(diǎn)之一,廣泛應(yīng)用于土壤水分的預(yù)測(cè)研究中[2]。熊靜玲等采用多元散射校正結(jié)合對(duì)數(shù)一階微分變換對(duì)樣本光譜數(shù)據(jù)進(jìn)行預(yù)處理,篩選敏感波長(zhǎng),構(gòu)建基于支持向量機(jī)的土壤含水率高光譜估測(cè)模型[3]。于雷等在經(jīng)Savitzky-Golay平滑和連續(xù)統(tǒng)去除對(duì)原始光譜數(shù)據(jù)預(yù)處理后,優(yōu)選水分敏感波長(zhǎng),采用偏最小二乘回歸方法建立模型[4]。其他相關(guān)文獻(xiàn)還有很多[5-8]。從這些文獻(xiàn)討論的問(wèn)題看,多關(guān)注到模型算法,從光譜數(shù)據(jù)預(yù)處理到模型構(gòu)建,期望通過(guò)不斷改進(jìn)模型算法來(lái)提高預(yù)測(cè)效果。
土壤高光譜是土壤屬性特征的綜合反映,包含了豐富的土壤信息[9-10]。在土壤屬性光譜預(yù)測(cè)建模中,僅僅關(guān)注模型算法,忽視其他相關(guān)屬性對(duì)被預(yù)測(cè)屬性光譜特征的影響是不夠的。尚璇等在研究中發(fā)現(xiàn),預(yù)測(cè)土壤有機(jī)質(zhì)時(shí)應(yīng)剔除水對(duì)反射率的影響[11]。Kuang等研究認(rèn)為含水量、粉粒和砂粒對(duì)土壤總氮和有機(jī)碳光譜預(yù)測(cè)時(shí)起負(fù)向影響,土壤粘粒起正向作用[12]。宋海燕等運(yùn)用正交信號(hào)處理(orthogonal signal correction,OSC)方法對(duì)光譜數(shù)據(jù)處理,以減少質(zhì)地對(duì)土壤有機(jī)質(zhì)光譜預(yù)測(cè)的影響[13]。質(zhì)地是土壤的重要物理屬性之一,質(zhì)地對(duì)土壤含水量高光譜預(yù)測(cè)建模影響如何,目前相關(guān)報(bào)道還不多見(jiàn)。本文以巢湖流域土壤樣本為例就上述問(wèn)題進(jìn)行討論,以期為相關(guān)研究工作提供參考。
巢湖流域位于安徽省江淮地區(qū)中部,在116°24′18″E~117°55′38″E,30°58′58″N~32°04′48″N之間,流域面積約為9196 km2。流域地形西南高東北低,總體漸向巢湖傾斜,高海拔區(qū)主要分布在西南部,最高峰海拔高度近1400 m。土地利用類型以水田、旱地、林地為主,土壤類型有馬肝田、黃白田、馬肝土、黃白土、砂礫土等。
土壤樣本源于課題組在巢湖流域的相關(guān)工作。根據(jù)土樣質(zhì)地組成差異,選取了3組,每組20個(gè),共60個(gè)土樣作為研究樣本。樣本組Ⅰ的砂粒含量<10%,粉粒含量65%~80%,粘粒含量20%~30%;樣本組Ⅱ的砂粒含量均<10%,粉粒含量75%~90%,粘粒含量10%~20%;樣本組Ⅲ的砂粒含量20%~35%,粉粒含量50%~65%,粘粒含量10%~20%。每個(gè)土壤樣本在采集時(shí)均記錄有詳細(xì)的經(jīng)緯度位置、地形地貌及土地利用方式等信息。
圖1 實(shí)驗(yàn)流程Fig.1 Experiment flow
取60個(gè)直徑8cm、深2cm的鋁盒,對(duì)鋁盒編號(hào)并用天平稱得原始盒重,將過(guò)20目篩的土樣依次置于相應(yīng)編號(hào)鋁盒內(nèi),裝滿后刮平表面。從鋁盒邊緩緩注入純水,在注入過(guò)程中盡量保證土壤表面全部均勻濕潤(rùn),直至土壤達(dá)過(guò)飽和狀態(tài),靜置土樣,待鋁盒土表自由水消失后(約注水之后24h)備測(cè)。隨土樣水分逐日蒸發(fā),形成水分梯度。用光譜儀測(cè)量土樣光譜反射率,同時(shí)用天平稱量相應(yīng)土樣土重,備求土壤含水率。測(cè)量頻率為每隔24h對(duì)全部土樣測(cè)量1遍,共持續(xù)7天,獲得不同含水率土樣光譜數(shù)據(jù)420條。最后將所有土樣放入105℃烘箱中烘12h,取出后稱量相應(yīng)土重。實(shí)驗(yàn)基本流程如圖1所示。
用烘干法獲取土壤水分?jǐn)?shù)據(jù),準(zhǔn)確度高,也是目前國(guó)際上最常用測(cè)定土壤水分的標(biāo)準(zhǔn)方法[14]。土樣含水率是指土樣在烘干至恒重時(shí)所失去的水分質(zhì)量與烘干土質(zhì)量的比值,用百分?jǐn)?shù)表示。計(jì)算公式如下:
土壤含水率=(mi-md)/(md-m0) ×100%
式中:m0為空鋁盒重量(g);md為烘干后土樣加鋁盒的重量(g);mi為每天測(cè)完光譜后土樣加鋁盒的重量(g)。
光譜測(cè)量采用美國(guó)ASD公司生產(chǎn)的FieldSpec 4型地物光譜儀。光譜測(cè)量在暗室內(nèi)進(jìn)行,光源使用入射角度為45°的鹵素?zé)?,采?°視場(chǎng)角的光纖探頭垂直放置于土壤樣品的正上方,并距離土樣表面15cm。每個(gè)樣品從5個(gè)方向進(jìn)行共計(jì)10次光譜測(cè)量,并將光譜曲線進(jìn)行算術(shù)平均。
參照相關(guān)文獻(xiàn)[15],剔除含水率高于50%的土樣光譜數(shù)據(jù),每個(gè)土樣包括不同含水率光譜數(shù)據(jù)5~7條,60個(gè)土樣最終保留有效光譜數(shù)據(jù)共計(jì)382條。去除土樣高光譜數(shù)據(jù)中噪聲較大、信噪比低的兩端波段,保留400~2400nm光譜數(shù)據(jù)用于研究,并運(yùn)用Savitzky-Golay卷積平滑法進(jìn)行平滑去噪處理[16]。
根據(jù)土壤質(zhì)地組成變量(砂粒、粉粒及粘粒含量)構(gòu)建三維特征空間,用平均重心距離表示樣本組土樣質(zhì)地分異度。參照有關(guān)文獻(xiàn)[17],平均重心距離定義為樣本組各樣點(diǎn)到樣本組重心的平均距離。計(jì)算方法如下:
(1)
按以下兩種方式,設(shè)計(jì)了6個(gè)樣本組。①根據(jù)土樣質(zhì)地組成差異將全部土樣分為3個(gè)樣本組:樣本組Ⅰ、組Ⅱ、組Ⅲ,每組20個(gè)土樣,包括不同含水率土樣光譜數(shù)據(jù)依次為128條、125條、129條。②在樣本組Ⅰ、組Ⅱ、組Ⅲ的基礎(chǔ)上,通過(guò)抽樣重組構(gòu)成3個(gè)新樣本組,以擴(kuò)大樣本組土樣質(zhì)地分異度。重組方法:在樣本組Ⅰ、組Ⅱ、組Ⅲ中各隨機(jī)抽出10個(gè)土樣,然后兩兩組合,構(gòu)成樣本組A(源于樣本組Ⅰ、組Ⅱ)、樣本組B(源于樣本組Ⅱ、組Ⅲ),樣本組C(源于樣本組Ⅰ、組Ⅲ)。重組后,樣本組A、組B、組C各有20個(gè)土樣,包括不同含水率土樣光譜數(shù)據(jù)依次為125條、124條、127條。
采用偏最小二乘回歸方法(PLSR)建模。按照土壤含水量高低對(duì)土樣進(jìn)行升序排列,每3個(gè)土樣中選擇1個(gè)土樣作為預(yù)測(cè)樣本集,其余土樣作為建模樣本集。相關(guān)建模工作在The Unscrambler 9.7軟件中完成。
模型的預(yù)測(cè)精度評(píng)價(jià)指標(biāo)主要有:決定系數(shù)(R2)、均方根誤差(RMSE)和相對(duì)分析誤差(RPD)。R2反映模型建立和驗(yàn)證的穩(wěn)定性,R2越接近1,說(shuō)明模型的穩(wěn)定性越好、擬合程度越高。RMSE用來(lái)檢驗(yàn)?zāi)P偷念A(yù)測(cè)能力,RMSE越小則模型預(yù)測(cè)能力越好。模型評(píng)價(jià)參數(shù)RPD是標(biāo)準(zhǔn)差與均方根誤差的比值,當(dāng)RPD<1.4時(shí),說(shuō)明模型無(wú)法對(duì)樣品進(jìn)行預(yù)測(cè);當(dāng)1.4≤RPD<2時(shí),說(shuō)明模型可對(duì)樣品做粗略的估測(cè);當(dāng)RPD≥2時(shí),說(shuō)明模型具有極好的預(yù)測(cè)能力[18]。
圖2 不同含水量下土樣光譜反射率曲線(52號(hào)土樣)Fig.2 Reflection spectrum under different soil moisture level (NO.52)
各土樣光譜曲線隨含水量變化趨勢(shì)類似,以52號(hào)土樣為例,分析不同含水量下土壤反射光譜曲線(圖2)。各光譜曲線特征總體相近,在可見(jiàn)光波段土壤光譜曲線表現(xiàn)為“陡坎式”上升,至近紅外波段曲線變化趨于平緩,在1400nm和1900nm附近分別存在強(qiáng)吸收峰,在2200nm附近存在弱吸收峰。隨著土樣含水量的減少,其光譜曲線整體上趨于抬升。在含水量較高時(shí),相鄰光譜曲線間隔相對(duì)較小,并且隨著含水量的增加,光譜曲線逐漸接近,水分變化對(duì)光譜曲線的影響相對(duì)較小;當(dāng)含水量處于低值時(shí),相鄰光譜曲線間隔相對(duì)增大,反射光譜曲線會(huì)因水分的變化而發(fā)生顯著抬升或下降。該現(xiàn)象在前人研究中也得到驗(yàn)證[15]。
基于公式(1)計(jì)算了樣本組Ⅰ、組Ⅱ、組Ⅲ及樣本組A、組B、組C在三維特征空間的平均重心距離,結(jié)果依次為4.27、4.17、4.01、7.97、16.33和15.41。樣本組Ⅰ、組Ⅱ、組Ⅲ土樣質(zhì)地分異度相近且相對(duì)較小,樣本組A、組B、組C土樣質(zhì)地分異度相對(duì)較大。
運(yùn)用偏最小二乘回歸方法(PLSR)分別構(gòu)建樣本組Ⅰ、組Ⅱ、組Ⅲ以及樣本組A、組B、組C土壤含水量高光譜預(yù)測(cè)模型,采用交叉驗(yàn)證方法來(lái)確定最佳主分量,建模結(jié)果見(jiàn)表1。
表1 不同樣本組土壤含水量PLSR建模結(jié)果Table 1 PLSR modeling results of soil moisture content in different sample groups
由表1可知,6個(gè)樣本組建模集R2在 0.872~0.944間,預(yù)測(cè)集R2在 0.823~0.927間,RPD均高于2.0,模型穩(wěn)定性好、擬合程度高,都具有極好的預(yù)測(cè)能力,表明質(zhì)地差異對(duì)樣本組土壤含水量光譜預(yù)測(cè)模型穩(wěn)定性及預(yù)測(cè)力影響不大,但在模型預(yù)測(cè)精度上,不同樣本組間有一定差異。
比較樣本組Ⅰ、組Ⅱ、組Ⅲ模型預(yù)測(cè)精度,考察土樣質(zhì)地組成的影響。表1顯示,樣本組Ⅱ模型預(yù)測(cè)精度優(yōu)于樣本組Ⅰ、組Ⅲ,表明樣本組土樣質(zhì)地組成對(duì)模型預(yù)測(cè)結(jié)果有影響,樣本組土樣粉粒含量高可能更有益于提高模型預(yù)測(cè)精度。
對(duì)重組前后樣本組模型預(yù)測(cè)精度進(jìn)行比較,考察土樣質(zhì)地分異度的影響。樣本組A源于樣本組Ⅰ、組Ⅱ,其模型預(yù)測(cè)精度均低于其來(lái)源樣本組Ⅰ、組Ⅱ,與樣本組A質(zhì)地分異度更大有關(guān);樣本組B源于樣本組Ⅱ、組Ⅲ,樣本組C源于樣本組Ⅰ、組Ⅲ,樣本組B和樣本組C模型預(yù)測(cè)精度也均低于其來(lái)源樣本組,其原因與樣本組A相同??梢?jiàn),質(zhì)地分異度對(duì)樣本組模型預(yù)測(cè)結(jié)果有影響,質(zhì)地分異度小,有益于提高模型預(yù)測(cè)精度。
上述分析表明,不同質(zhì)地分組土壤含水量光譜預(yù)測(cè)模型均有較好的穩(wěn)定性和預(yù)測(cè)力,但在模型預(yù)測(cè)精度上不同樣本組間有一定的差異。由圖3可見(jiàn),土樣粘粒含量與光譜反射率在可見(jiàn)光段呈正相關(guān)性,粉粒含量與光譜反射率在全波段呈正相關(guān)性,砂粒含量與光譜反射率在全波段呈顯著負(fù)相關(guān)性,但整體上質(zhì)地與光譜反射率的相關(guān)性較低,其系數(shù)絕對(duì)值在0~0.25之間波動(dòng),土樣含水量與光譜反射率相關(guān)系數(shù)絕對(duì)值在 0.6~0.9之間。一方面,質(zhì)地對(duì)土壤含水量光譜預(yù)測(cè)建模的影響是客觀存在的,另一方面,土壤含水量與土壤光譜反射率高相關(guān)性相對(duì)削弱了質(zhì)地的影響,使模型保持較高的穩(wěn)定性和預(yù)測(cè)力。
圖3 土壤含水量、質(zhì)地與光譜反射率的相關(guān)性曲線Fig.3 Correlation of soil moisture,texture and spectral reflectance
選取巢湖流域60個(gè)土壤樣本,通過(guò)水分梯度實(shí)驗(yàn)與光譜測(cè)量,獲得有效土樣高光譜數(shù)據(jù)382條,在此基礎(chǔ)上,討論了質(zhì)地差異對(duì)土壤含水量PLSR高光譜預(yù)測(cè)模型的影響,主要結(jié)論如下:
(1)不同質(zhì)地分組的土壤含水量高光譜預(yù)測(cè)模型均具有較好穩(wěn)定性和預(yù)測(cè)力,但在模型預(yù)測(cè)精度上有一定差異。
(2)質(zhì)地組成、質(zhì)地分異度對(duì)樣本組模型預(yù)測(cè)精度有一定的影響,樣本組土樣質(zhì)地分異度小、土樣粉粒含量比例高有益于提高土壤含水量模型預(yù)測(cè)精度。
(3)土壤含水量與土壤光譜反射率相關(guān)系數(shù)絕對(duì)值在0.6~0.9間,質(zhì)地與土壤光譜反射率相關(guān)系數(shù)絕對(duì)值在0~0.25之間,土壤含水量與土壤光譜反射率高相關(guān)性相對(duì)削弱了質(zhì)地對(duì)土壤含水量高光譜預(yù)測(cè)建模的影響,使模型保持較高的穩(wěn)定性和預(yù)測(cè)力。