孫瑞鵬,丁皓希,畢如田,鄧永鵬,朱洪芬
(山西農(nóng)業(yè)大學(xué) 資源環(huán)境學(xué)院,山西 太谷 030801)
土壤黏粒含量是土壤最基本的物理性質(zhì)之一, 對土壤的水肥氣熱等各種性質(zhì)均有影響,土壤質(zhì)地的實驗室測定方法主要有沉降法和激光粒度儀法,其中,激光粒度儀法出現(xiàn)時間短,相比沉降法所測定的黏粒含量偏低,測定過程比較費時且成本較高[1-5]。目前,已有學(xué)者采用高光譜技術(shù)預(yù)測土壤黏粒含量,常用光譜變換來提高土壤黏粒含量的預(yù)測能力。王德彩等[6]引入正交信號校正(Orthogonal signal correction,OSC)處理后的光譜對土壤黏粒含量進(jìn)行預(yù)測,結(jié)果表明,預(yù)測結(jié)果OSC處理高于原始光譜和微分處理,且OSC處理能消除不相關(guān)因素的影響。張雅梅等[7]選用7種光譜變換形式對土壤黏粒含量進(jìn)行預(yù)測,結(jié)果表明,原始光譜的對數(shù)為最佳的光譜變換形式,且對土壤黏粒含量的預(yù)測能力最佳。雖然使用預(yù)處理光譜能夠預(yù)測土壤黏粒含量,但這樣只是通過多波段信息來建立預(yù)測模型,預(yù)測所用光譜信息比較單一,并未結(jié)合較多的光譜特征信息。
在基于高光譜的預(yù)測模型方面,近年來較多采用非線性模型用于土壤屬性的預(yù)測研究。張娜等[8]采用一元線性回歸、逐步多元回歸和神經(jīng)網(wǎng)絡(luò)預(yù)測土壤砂粒和粉粒含量,結(jié)果表明,神經(jīng)網(wǎng)絡(luò)的預(yù)測效果更好。相比線性模型,采用非線性模型會提高土壤質(zhì)地的預(yù)測精度,由于非線性模型的容錯性強且有較強的魯棒性,對預(yù)測模型起到了顯著的優(yōu)化效果。另外,還有不少研究者通過構(gòu)建光譜指數(shù)以提高其預(yù)測能力,并篩選出各種土壤光譜特征指數(shù)解釋其對光譜曲線的影響。例如,張娟娟等[9]構(gòu)建差值光譜指數(shù)DI(CR1883,CR2065)較好地估測了土壤有機質(zhì)、全氮和速效氮3種土壤養(yǎng)分。趙明松等[10]構(gòu)建差值指數(shù)、比值指數(shù)和歸一化指數(shù),結(jié)合弓曲差較好地實現(xiàn)了土壤有機質(zhì)的預(yù)測。尼加提·卡斯木等[11]對光譜指數(shù)進(jìn)一步優(yōu)化處理,結(jié)果表明,土壤光譜指數(shù)能更好地預(yù)測土壤有機質(zhì)。還有相關(guān)學(xué)者采用不同光譜指數(shù)對土壤鹽分、土壤電導(dǎo)率等土壤屬性進(jìn)行預(yù)測研究得出,模型預(yù)測良好[12-13]。以上研究表明,土壤光譜指數(shù)可以較好地預(yù)測土壤的基本屬性。
黃土高原土壤顆粒組成主要以粉粒和砂粒為主,二者含量占顆??偭康?0%以上[14],土壤黏粒含量較低,抗蝕性較弱[15-16]。而晉西黃土區(qū)是水土侵蝕較嚴(yán)重的區(qū)域,土壤黏粒含量是評價水土侵蝕的重要因子,較低的土壤黏粒含量為其光譜預(yù)測帶來了挑戰(zhàn)。
本試驗以位于晉西黃土區(qū)的臨汾市大寧縣為研究區(qū),基于土壤高光譜預(yù)處理數(shù)據(jù)構(gòu)建光譜指數(shù)模型,通過相關(guān)性分析篩選出最優(yōu)土壤黏粒光譜指數(shù),并采用多種預(yù)測模型構(gòu)建土壤黏粒含量預(yù)測的最優(yōu)組合形式,旨在為晉西黃土區(qū)土壤黏粒含量的快速預(yù)測提供方法。
山西省臨汾市大寧縣位于黃河中游,晉西呂梁山南端,位置36°16′~36°36′N,110°28′~111°01′E。地形南北高、中間低,東部高、西部低,海拔最低481 m,最高1 740 m,屬暖溫帶大陸性氣候,年均氣溫11.1℃,年均降水量536.9 mm。根據(jù)國家土壤信息服務(wù)平臺(http://www.soilinfo.cn/map/)中國1∶400萬土壤類型圖可知,區(qū)域內(nèi)土壤類型主要有黃綿土和褐土兩大類。
土樣采集時間為2020年11月,采樣深度為20 cm,所采土樣質(zhì)量約1 kg,記錄采樣點的位置信息,共采集土樣192個(圖1)。土樣帶回實驗室內(nèi)自然風(fēng)干后,將土樣分成2份,一份原土過2 mm篩用于土壤質(zhì)地測定;另一份研磨后過2 mm篩用于土壤高光譜測定。
土壤粒徑數(shù)據(jù)使用激光粒度儀Mastersizer 3000進(jìn)行測定,測定粒徑范圍為0.02~2 000μm,測定前采用H2O2-HCl-(NaPO3)6法對土樣進(jìn)行預(yù)處理:首先將2~5 g小于2 mm的土樣放入高型燒杯中,緩慢少量逐次加入30%的H2O2,直至沒有氣泡產(chǎn)生;然后多次滴入10%的HCl,直至碳酸鹽完全去除;最后多次使用蒸餾水洗至中性后,移除上清液并加入濃度為0.1 mol/L的(NaPO3)6分散劑,將樣品放到超聲波振蕩器中10 min,待樣品分散后用于測定[4,17-19]。根據(jù)美國農(nóng)部制土壤質(zhì)地分類法將測定所得土壤粒徑劃分為:黏粒(<0.002 mm)、粉粒(0.002~0.050 mm)、砂粒(0.05~2.00 mm)。本研究選用土壤黏粒含量進(jìn)行分析。
土壤光譜使用ASD Field Spec 4 Std-Res地物光譜儀進(jìn)行測定,波長范圍為300~2 500 nm,在黑暗的實驗室環(huán)境下進(jìn)行。將土樣裝入深2 cm的培養(yǎng)皿中并壓實,光纖探頭采用10°鏡頭,保持與土樣垂直距離15 cm,光源天頂角為30°,距離土樣50 cm;每個土樣旋轉(zhuǎn)重復(fù)測定5次,以這5條光譜曲線的平均值作為土樣的光譜數(shù)據(jù)。由于數(shù)據(jù)在350~400 nm和2 450~2 500 nm這2段光譜波段的信噪比大,在計算分析中剔除,然后對400~2 450 nm光譜數(shù)據(jù)進(jìn)行Savitzky-Golay濾波9點平滑處理后并按5 nm間隔進(jìn)行重新采樣,共得到411個波段作為光譜分析數(shù)據(jù)。
首先將原光譜反射率(Reflectance,R)進(jìn)行3種變換:倒數(shù)變換(Inverse of R,IR)、倒數(shù)的對數(shù)變換(Logarithm of 1/R,LGIR)、倒數(shù)的一階微分變換(First derivative of 1/R,F(xiàn)DIR);然后將以上4種形式的光譜曲線通過光譜指數(shù)兩兩組合,主要有差值光譜指數(shù)(Difference spectral index,DSI)、比值光譜指數(shù)(Ratio spectral index,RSI)和歸一化光譜指數(shù)(Normalized difference spectral index,NDSI);最后計算土壤黏粒含量,并將其與各個光譜指數(shù)進(jìn)行相關(guān)性分析,在相關(guān)性等勢圖中用區(qū)域極值的方法,選擇區(qū)域內(nèi)相關(guān)性較高的光譜指數(shù)建立模型。
式中,Rm和Rn分別代表m和n波段的土壤光譜反射率(m>n)。
采用土壤黏粒含量和選取的土壤光譜指數(shù)建立模型,模型包括多元線性回歸(Multivariable linear regression,MLR)、偏最小二乘回歸(Partial least squares regression,PLSR)、反向傳播神經(jīng)網(wǎng)絡(luò)(Back propagation neural networks,BPNN);對土壤黏粒含量依次排序,按照3∶1將全部樣本分為建模集和驗證集,分別為144個和48個樣本;采用決定系數(shù)(Coefficients of determination,R2)、均方根誤差(Root mean squares error,RMSE)、相對分析誤差(Relative prediction deviation,RPD)3個參數(shù)對模型精度進(jìn)行評價。
式中,yi為樣本i實測值,y^i為樣本i預(yù)測值,yˉ為樣本實測平均值,n為樣本數(shù),SD為樣本實測值的標(biāo)準(zhǔn)差。
R2值越大、RMSE值越小,表示模型精度越高。本研究將RPD值分為6類:RPD<1.0表示模型預(yù)測非常差,不推薦使用;RPD在1.0~1.4表示模型預(yù)測比較差,只能用于區(qū)分高值和低值;RPD在1.4~1.8表示模型可用于預(yù)測;RPD在1.8~2.0表示模型預(yù)測良好;RPD在2.0~2.5表示定量模型預(yù)測非常好;RPD>2.5表示模型預(yù)測極好[20-21]。
光譜數(shù)據(jù)預(yù)處理使用View Spec Pro 6.2軟件完成;光譜變換、光譜指數(shù)、相關(guān)性計算和模型計算均使用Matlab 2019b軟件完成。
根據(jù)美國農(nóng)部制土壤質(zhì)地分類法[22],192個土壤樣本中有188個為粉壤土,3個為粉土,1個為砂壤土,其中,土壤黏粒含量最小值為4.03%,最大值為17.83%,平均為8.00%;按照土壤黏粒含量從小到 大 排 序 為1~17、18~64、65~120、121~165、166~184、185~192個 土 樣 的 平 均 值 分 別 是5.00%、6.32%、7.50%、8.89%、10.85%、16.02%,共6組,計算每一組土樣的光譜平均值如圖2-A所示。土壤黏粒含量對土壤光譜的影響主要體現(xiàn)在近紅外波段;隨著土壤黏粒含量的增加,1 450 nm和1 950 nm處的水分吸收明顯,即光譜吸收谷越深(圖2-B、C),土壤黏粒含量越高,光譜曲線在近紅外波段反射率越低,且光譜差異較大,反之,光譜曲線在可見光波段差異較小。AL-ABBAS等[23]在對土壤質(zhì)地與光譜的研究中指出,土壤黏粒含量與其光譜反射率呈負(fù)相關(guān),土壤黏粒含量越高反射率越低,與本研究結(jié)果一致。
通過分析土壤黏粒含量與原始光譜(R)、倒數(shù)(IR)、倒數(shù)的對數(shù)(LGIR)及倒數(shù)的一階微分(FDIR)的相關(guān)性可知(圖3),相關(guān)系數(shù)較高值分別為-0.28、0.27、0.28、-0.61,經(jīng)IR和LGIR變換后的相關(guān)系數(shù)并未提升,而經(jīng)FDIR變換后其相關(guān)性明顯提升,相關(guān)性較高的波段主要位于1 450、1 950、2 200 nm光譜吸收谷兩側(cè)。
圖4為光譜變換對應(yīng)的差值(DSI)、比值(RSI)及歸一化(NDSI)光譜指數(shù)與土壤黏粒含量的相關(guān)關(guān)系情況。從圖4可以看出,在同一種光譜變換形式下,DSI、RSI和NDSI這3種指數(shù)的正負(fù)相關(guān)性區(qū)域相近,其中,DSI相關(guān)性圖與RSI和NDSI存在較大差異,而RSI和NDSI相關(guān)性區(qū)域基本保持一致;在同一種光譜指數(shù)下,IR和LGIR這2種變換正負(fù)相關(guān)性區(qū)域比較吻合,且二者與原始光譜的正負(fù)相關(guān)性區(qū)域正好相反??傮w來看,相關(guān)性區(qū)域相對集中,相關(guān)性最高的區(qū)域分布在波段1 450、1 950、2 200 nm吸收谷的兩側(cè),波段組合為(2 245,1 515)、(2 425,1 155)、(2 440,1 155)、(1 900,1 460)、(2 240,1 515),相關(guān)系數(shù)絕對值在0.66~0.70;反之,F(xiàn)DIR變換對應(yīng)的相關(guān)性區(qū)域比較分散,DSI、RSI、NDSI對應(yīng)的顯著相關(guān)性最高波段組合分別為(1 930,1 420)、(2 420,1 570)、(1 940,400),相關(guān)系數(shù)分別為-0.67、-0.70、0.69;相較于單波段,波段兩兩組合與土壤黏粒含量的相關(guān)性均有提升。從土壤黏粒含量與光譜指數(shù)的相關(guān)性來看,光譜指數(shù)RSI最優(yōu),NDSI和DSI表現(xiàn)次之(表1)。
由于相關(guān)系數(shù)區(qū)域比較集中,為減少構(gòu)建模型時自變量之間共線性的影響,對相關(guān)系數(shù)圖進(jìn)行求極值,然后在每種光譜指數(shù)中篩選出相關(guān)系數(shù)極值絕對值最大的5個土壤光譜指數(shù)?;谝陨献顑?yōu)土壤光譜指數(shù),采用多元線性回歸方法構(gòu)建土壤黏粒含量的預(yù)測模型,建模結(jié)果如表1所示,12種形式的建模集R2在0.47~0.57,RMSE在1.42~1.59,對應(yīng)大小與每一類型相關(guān)系數(shù)絕對值大小有關(guān),波段組合與土壤黏粒含量相關(guān)性越高,建模精度越高;驗證集R2在0.45~0.61,RMSE在1.42~1.71,RPD在1.30~1.57,除FDIR-DSI和FDIR-NDSI之外,其余10種形式的RPD均大于1.4,能夠粗略地估測土壤黏粒含量;其中預(yù)測精度最高的是FDIR-RSI,建模集的R2和RMSE分別為0.57、1.42,驗證集的R2、RMSE和RPD分別為0.61、1.42、1.57,其 次 分 別 為R-DSI、R-NDSI、IRNDSI、LGIR-DSI。
表1 各光譜指數(shù)與土壤黏粒含量的關(guān)系Tab.1 Relationship between each spectral index and soil clay contents
與MLR采取同樣的光譜指數(shù)選取方法,通過極值結(jié)果選取相關(guān)系數(shù)絕對值最大的47個光譜指數(shù),用于PLSR和BPNN預(yù)測,模型結(jié)果如表2所示,PLSR模型建模集R2和RMSE分別在0.60~0.67、1.25~1.38,驗證集R2、RMSE和RPD分別在0.50~0.57、1.46~1.56、1.42~1.52,其中,RPD均大于1.4,預(yù)測精度高的是FDIR-RSI,建模集的R2和RMSE分別為0.63、1.32,驗證集的R2、RMSE和RPD分別為0.57、1.54、1.52,預(yù)測精度其次依次為R-DSI和LGIR-RSI;BPNN模型建模集R2和RMSE分別在0.64~0.70、1.21~1.32,驗證集R2、RMSE和RPD分別在0.55~0.74、1.13~1.49、1.50~1.96,同樣RPD均大于1.4,預(yù)測精度高的是LGIRNDSI,建模集的R2和RMSE分別為0.64、1.32,驗證集的R2、RMSE和RPD分別為0.74、1.13、1.96,預(yù)測精度其次為LGIR-RSI、LGIR-DSI和FDIRRSI??傮w來看,在LGIR變換下3種光譜指數(shù)構(gòu)建的BPNN模型精度都比較好,整體比較DSI、RSI和NDSI對應(yīng)的模型精度,RSI和NDSI優(yōu)于DSI。比較PLSR、BPNN模型建模集和驗證集的R2和RMSE可知,BPNN表現(xiàn)最優(yōu),其次為PLSR。
表2 基于光譜指數(shù)的土壤黏粒含量估測結(jié)果Tab.2 Estimation of soil clay contents based on spectral indexes
圖5是模型預(yù)測效果,對比實測值與預(yù)測值分布,存在低值高估和高值低估的現(xiàn)象;BPNN預(yù)測結(jié)果更接近1∶1線,預(yù)測結(jié)果有所改善,非線性模型BPNN用于預(yù)測土壤黏粒含量比傳統(tǒng)線性模型表現(xiàn)更好。
已有研究采用光譜指數(shù)預(yù)測其土壤屬性,模型預(yù)測使用光譜范圍主要為近紅外光譜區(qū)域。同樣,本研究結(jié)果表明,土壤黏粒含量與光譜指數(shù)顯著相關(guān)性的區(qū)域主要分布在近紅外區(qū)域,主要為(2 245,1 515)、(2 425,1 155)、(2 440,1 155)、(1 900,1 460)、(2 240,1 515)等相鄰區(qū)域,這與已有光譜指數(shù)預(yù)測土壤屬性結(jié)果一致。郭鵬等[13]通過構(gòu)建光譜指數(shù)預(yù)測土壤鹽分,發(fā)現(xiàn)相關(guān)系數(shù)高的光譜范圍為1 430~1 862、1 934~2 150 nm,篩選出敏感亮度指數(shù)(1 750,1 620),并采用隨機森林(Random forest,RF)建立預(yù)測模型,且模型精度較高。張娟娟等[9]構(gòu)建差值光譜指數(shù)DI(CR1883,CR2065)用于估測土壤有機質(zhì)、全氮和速效氮3種土壤養(yǎng)分,結(jié)果發(fā)現(xiàn)均有較好的效果。
在光譜變量選取方面,本研究采用光譜指數(shù)結(jié)構(gòu)固定、光譜波段隨機組合的方式構(gòu)建光譜指數(shù),并使用與土壤黏粒含量的相關(guān)性篩選局部區(qū)域的最優(yōu)光譜指數(shù),以提升土壤黏粒含量的預(yù)測精度。已有研究常采用相關(guān)性、主成分變換等方法減少輸入變量,例如,楊莎等[24]使用相關(guān)性分析篩選敏感波段用于預(yù)測土壤有機質(zhì)。白燕英等[25]通過土壤黏粒含量與光譜的相關(guān)性選擇波段用于建立預(yù)測模型,精度超過85%。喬天等[26]采用遺傳算法選擇變量并結(jié)合偏最小二乘回歸建立土壤質(zhì)地模型,結(jié)果減少了光譜變量,也提高了預(yù)測精度。王德彩等[27]采用光譜主成分為變量使用BP神經(jīng)網(wǎng)絡(luò)預(yù)測土壤黏粒含量,實現(xiàn)了高效預(yù)測。而本研究使用光譜指數(shù)一方面避免了篩選出相鄰光譜存在的光譜互相關(guān),提高了預(yù)測模型的穩(wěn)健性;另一方面光譜指數(shù)能夠更多選取到不同的光譜波段,涉及的光譜信息更多。
在土壤光譜預(yù)測方面,較多使用PLSR模型預(yù)測土壤屬性。本研究同時使用PLSR和BPNN對土壤黏粒含量進(jìn)行預(yù)測,結(jié)果表明,BPNN預(yù)測能力更強更穩(wěn)定。同樣,郭云開等[28]使用BPNN預(yù)測土壤Cu含量,結(jié)果表明,相比單元線性回歸模型,BPNN具有良好的擬合優(yōu)度和預(yù)測能力。雖然本研究使用光譜指數(shù)預(yù)測了晉西黃土區(qū)的土壤黏粒含量,可以為遙感估測土壤黏粒含量提供技術(shù)支持,但相比較大尺度范圍遙感估測,研究區(qū)域還較小,土壤類型較單一,導(dǎo)致光譜指數(shù)預(yù)測土壤黏粒含量模型適用性較差,所以該方法用于不同區(qū)域還有待進(jìn)一步探究。
本試驗基于光譜指數(shù)的晉西黃土區(qū)的土壤黏粒含量估測研究結(jié)果顯示,土壤黏粒含量對光譜曲線的影響主要為近紅外波段,原始光譜與土壤黏粒含量呈負(fù)相關(guān),土壤黏粒含量越高,土壤光譜反射率越低;通過構(gòu)建光譜指數(shù)可以提高與土壤黏粒含量之間的相關(guān)性,是提高預(yù)測土壤黏粒含量的方法之一;基于LGIR-NDSI-BPNN的預(yù)測效果最好,驗證集R2和RPD分別為0.74和1.96,能夠有效地預(yù)測晉西黃土區(qū)的土壤黏粒含量。為了提高光譜指數(shù)預(yù)測土壤黏粒含量的精度,將針對不同土壤類型、多種光譜指數(shù)探究最佳的光譜預(yù)測指數(shù)和方法。