楊棟膗 李亞強 刀劍 王建雄
摘要:耕地土壤作為農(nóng)業(yè)資源的重要組成部分,是我國農(nóng)業(yè)生產(chǎn)的基本資源與保障條件。山原紅壤作為云南典型的土壤類型,在云南的農(nóng)業(yè)生產(chǎn)與經(jīng)濟發(fā)展中發(fā)揮著重要作用。通過多光譜與高光譜遙感結(jié)合技術,對山原紅壤主要養(yǎng)分含量的高光譜特性進行了研究分析,研究了土壤主要養(yǎng)分含量的多高光譜特性、篩選出了各養(yǎng)分含量的特征波段。而后,通過多光譜波段變換、植被指數(shù)合成、構建高光譜土壤指數(shù),與山原紅壤主要養(yǎng)分含量進行了相關分析。通過分析得出,多光譜擬合模型效果整體不佳,僅鉀元素與合成光譜存在相關性,擬合模型R2大于0.5,有良好的擬合意義。高光譜指數(shù)相關性及擬合模型效果較多光譜都有所提升。其中,支持向量機擬合模型效果最佳,R2均在0.75以上,適合用于土壤養(yǎng)分含量估測。
關鍵詞:土壤養(yǎng)分;多光譜;植被指數(shù);高光譜;支持向量機
中圖分類號:P237;S127? 文獻標志碼: A
文章編號:1002-1302(2022)02-0178-08
收稿日期:2021-04-16
基金項目:云南省教育廳科學研究基金(編號:2019Y0080、2020Y0177、2020Y186)。
作者簡介:楊棟淏(1997—),男,云南曲靖人,碩士研究生,主要從事資源與環(huán)境遙感專業(yè)研究。E-mail:843765886@qq.com。
通信作者:王建雄,博士,教授,碩士生導師,主要研究方向為資源與環(huán)境遙感。E-mail:jianxiongw@126.com。
云南省地處高原山區(qū),耕地資源有限,且山原紅壤作為云南典型的土壤類型,研究山原紅壤的土壤肥力對云南的農(nóng)業(yè)生產(chǎn)具有重要的作用。近年來,遙感技術快速發(fā)展,對土壤調(diào)查、土地利用變化及土壤肥力監(jiān)測起到了獨特作用[1]。目前,針對土壤多光譜方面的研究大多針對土壤含鹽量、含水量與重金屬的反演模型建立,少有針對土壤主要養(yǎng)分含量的分析以及估測研究[2-4],并且國內(nèi)的研究多以土壤有機質(zhì)的反演估算為主[5-9],而且取得了較高的反演精度。例如,南鋒等以土壤有機質(zhì)含量為研究對象,研究分析后發(fā)現(xiàn),基于顯著波段構建的偏最小二乘回歸(PLSR)模型預測精度高于基于全波段的PLSR模型[10]。在高光譜方面,欒福明等使用全波段地物光譜儀針對速效鉀養(yǎng)分含量進行了模型估測研究,發(fā)現(xiàn)小波分析處理能顯著提高模型精度[11]。蔣璐璐等分別采用偏最小二乘支持向量機和偏最小二乘-人工神經(jīng)網(wǎng)絡2種方法進行土壤磷、鉀元素含量預測建模,結(jié)果表明,中紅外波段對磷和鉀的預測效果更好[12]。盡管已有不少學者針對土壤養(yǎng)分含量的定量估測進行了研究,但不同土壤類型反射光譜存在差異,使得各土壤類型的養(yǎng)分估測模型不具備普遍適宜性。而目前針對山原紅壤光譜反射特性的研究不多,且針對其主要養(yǎng)分含量的估測更為少見。因此,本研究結(jié)合上述學者的研究方法,分析山原紅壤速效氮、磷、鉀含量的光譜反射特性,以期為今后云南的農(nóng)業(yè)生產(chǎn)提供幫助。
1 數(shù)據(jù)獲取與預處理
1.1 數(shù)據(jù)獲取
1.1.1 土壤采集 綜合地理位置、無人機影像采集可行性等多方面因素,本研究以昆明市云南農(nóng)業(yè)大學后山試驗田為研究對象。試驗田為山原紅壤地塊,位于25°8′N、102°45′E,地勢走向為北高南低,海拔為1 959.17 m和1 923.05 m。試驗地塊為 2.33 hm2 的長方形區(qū)域。經(jīng)土壤區(qū)分后,選取符合山原紅壤特征的區(qū)域地塊進行密集采樣,選取20個采樣點采集土壤樣本,采樣時間為2019年11月16日。土樣采集分布示意圖見圖1。土壤樣本經(jīng)風干、研磨并通過 2 mm 孔篩,采用四分法分成2份,分別供化學分析和光譜測試用。
1.1.2 多光譜數(shù)據(jù)采集 使用掛載派諾特鏡頭的
大疆M100無人機飛行器,進行灰板校正后在晴朗少云天氣對實驗地塊進行多光譜影像采集。飛行高度為60 m,飛行航向重疊率為70%,旁向重疊率為75%,飛行速度在12 m/s以下,拍照間隔時間為 2 s。手持無人機多光譜相機對白板上放置好的20個土樣進行多光譜影像的室內(nèi)采集。
1.1.3 高光譜數(shù)據(jù)采集 利用FieldSpec4 NG全波段地物光譜儀對所有土樣進行采集,光譜儀波長范圍350~2 500、350~1 000 nm波段樣本間隔 1.4 nm,1 001~2 500 nm波段樣本間隔1.1 nm,數(shù)據(jù)輸出通道數(shù)2 151個。測試前進行白板矯正,每個土樣樣本均采集10條光譜反射曲線,對各樣本的光譜反射值取平均值得到各土樣實際光譜反射值。
1.2 數(shù)據(jù)預處理
1.2.1 影像拼接 對無人機采集的照片進行剔除和篩選后利用Pix4D mapper軟件對照片進行拼接獲取實驗地的各波段影像、數(shù)字正射影像(DOM)、數(shù)字表面模型(DSM)、試驗區(qū)四波段多光譜影像。
1.2.2 土壤養(yǎng)分測定 通過化學和物理方法結(jié)合對土樣的有機質(zhì)、速效氮磷鉀、全氮共5種土壤主要養(yǎng)分的含量檢測。
1.2.3 光譜反射曲線優(yōu)化處理 由于地物光譜儀在低波段與高波段采用了不同傳感器,在光譜反射曲線中會存在斷點,因而用Viewspec Pro軟件對原始光譜反射率進行斷點修正,消除斷點陡變。同時使用Origin軟件中的Savitizky-Golay平滑處理,消除光譜曲線中的噪聲影響,處理后的光譜曲線仍然保持原土壤光譜曲線特征。
2 結(jié)果與分析
2.1 山原紅壤多光譜反演研究
2.1.1 單波段土壤光譜反演研究
2.1.1.1 土壤主要養(yǎng)分含量敏感波段分析 利用多光譜四波段土壤反射率與測定的土壤養(yǎng)分含量進行正態(tài)分布檢驗后,分別對土壤主要養(yǎng)分與各波段光譜進行Pearson相關分析,結(jié)果見表1。
由表1可知,除速效磷和有機質(zhì)外,其余養(yǎng)分含量與光譜之間存在顯著或極顯著相關性。因此,對速效氮、磷和全氮3個指標進行回歸分析,對主要養(yǎng)分含量進行多光譜模型估測。
2.1.1.2 回歸模型分析 分別使用單變量和雙變量回歸模型對土壤養(yǎng)分進行分析。經(jīng)試驗檢驗,建立的單變量回歸模型效果差,改進使用雙相關變量波段組合的方式對山原紅壤養(yǎng)分反射率進行研究。通過研究分析發(fā)現(xiàn),僅有速效鉀的養(yǎng)分含量與近紅外和綠波存在相關性,因此選取兩波段為自變量,速效鉀含量為因變量建立回歸模型。分別構建土壤養(yǎng)分含量的線性回歸和非線性回歸方程(表2)。
由表2可知,通過雙變量波段組合能夠有效提高土壤養(yǎng)分速效鉀擬合模型的R2,使得土壤反射率能夠更好地反映土壤養(yǎng)分。但整體的R2仍然較低,無法選定速效鉀的土壤反射率為回歸模型。
2.1.2 合成指數(shù)土壤光譜反演研究 研究引入9種植被指數(shù):歸一化植被指數(shù)(NDVI)、比值植被指數(shù)(RVI)、差值植被指數(shù)(DVI)、紅邊歸一化植被指數(shù)(NDVI705)、紅綠比值指數(shù)(RG)、綠通道植被指數(shù)(GNDVI)、葉面葉綠素指數(shù)(LCI)、歸一化差異紅邊指數(shù)(NDRE)、土壤調(diào)節(jié)植被指數(shù)(OSAVI)對山原紅壤的養(yǎng)分進行相關性分析。經(jīng)檢驗,僅有速效鉀元素含量與較多的土壤指數(shù)(NDVI、RVI、DVI、RG、OSAVI)存在顯著相關性。
2.1.2.1 單變量回歸分析 選取速效鉀元素為因變量,與其具有較好相關性的5種植被指數(shù)作物自變量,利用SPSS軟件進行單變量模型估測。通過分析得出,NDVI、DVI和OSAVI這3種土壤指數(shù)擬合模型的R2均大于0.5,但整體模型的擬合誤差都比較大,須要對養(yǎng)分含量進行更優(yōu)的模型擬合。
2.1.2.2 多元回歸分析 選取單變量中R2最高的3種植被指數(shù),將模型兩兩組合構建模型表達式,最終擬合3類曲線回歸模型如表3所示。
由表3可知,多元變量曲線回歸的擬合程度更高,且選入變量越多,擬合程度越高,選擇三元變量三次擬合模型能較好地反演鉀元素養(yǎng)分含量。
2.1.3 二維土壤光譜反演研究
進行一維分析后,再通過多光譜二維光譜合成進行土壤養(yǎng)分含量分析,分別對波段進行加減乘除和歸一化進行二維處理。經(jīng)上述分析可知,養(yǎng)分含量反演中,鉀元素與波段和各合成指數(shù)的相關性較好。因此,利用合成波段分別與鉀元素進行相關性分析,結(jié)果如圖2所示。通過熱力圖(圖2)可以看出,K元素在不同模型中,相關性較高的波段組合如表4所示。將以上相關性較好的組合提出,構建新的模型,在構建模型中乘法擬合模型與歸一化擬合的模型R2低于0.5,因此不使用這2種方法擬合模型,通過對最優(yōu)合成波段進行再次組合和篩選,最終擬合模型詳見表5。由表5分析可得,進行組合后的三元模型擬合程度更好,除法擬合模型中的組合2和組合10構成的反演模型能更好地反演鉀元素養(yǎng)分含量。
2.2 山原紅壤高光譜反演研究
2.2.1 單相關分析的養(yǎng)分模型估測
在上面的多光譜遙感中,利用合成植被指數(shù)和波段組合模型能較好地反演鉀元素含量。在構建高光譜指數(shù)時,利用對原始光譜反射率(R)進行不同形式的變換,最終選取包含原始反射率、反射率倒數(shù)、反射率對數(shù)、反射率平方根、反射率倒數(shù)的對數(shù)、反射率對數(shù)的倒數(shù)以及以上指數(shù)的一階導數(shù)共12種變換光譜作為此次研究的輸入光譜。
通過對土壤速效氮含量與光譜指數(shù)的相關分析得到,研究中構建的反射率、平方根、倒數(shù)、對數(shù)等幾種光譜指數(shù)對土壤主要養(yǎng)分含量相關性均不明顯,而經(jīng)過一階導數(shù)處理后的光譜指數(shù)相關性顯著提升(表6)。通過相同方法對其他主要養(yǎng)分含量進行相關分析后發(fā)現(xiàn)均存在此類現(xiàn)象,因此僅挑選具有特征波段研究特性的土壤合成指數(shù)進行研究。
提取土壤各主要養(yǎng)分含量的特征波段后,選取與各主要養(yǎng)分含量相關系數(shù)最優(yōu)的波段及合成土壤指數(shù)波段組合進行擬合分析。分別進行一元回歸分析和多元回歸分析,一元回歸分析中除速效磷元素的曲線擬合模型R2大于0.7外,其他養(yǎng)分含量擬合模型的R2均不高,一元回歸模型無法完全表述變量信息。通過改進后使用多元回歸分析,除全氮元素的擬合模型R2有所提升外,其余土壤養(yǎng)分含量擬合模型沒有改善,也無法較好地表達變量貢獻率。因此,結(jié)合曲線擬合和多元回歸結(jié)果,再次構建非線性回歸模型對土壤養(yǎng)分含量進行估測。
綜合一元回歸模型和多元回歸模型,選取一元回歸分析中擬合值最優(yōu)的兩模型構建土壤二元回歸曲線回歸方程,計算出各養(yǎng)分含量擬合曲線方程如表7所示。
經(jīng)二元曲線擬合后的土壤養(yǎng)分模型整體較多元線性逐步回歸分析的擬合模型R2均有所提升,但RMSE檢驗值也相對上升。相對于一元回歸分析的擬合極值,除速效氮養(yǎng)分含量擬合值有所上升外,其他養(yǎng)分含量擬合值并未上升。
利用相關分析法進行分析,一定程度上可以提取土壤主要養(yǎng)分含量的的特征波段范圍,為回歸分析提供依據(jù)。但選取相關系數(shù)極值點的敏感波段進行擬合的方法難以體現(xiàn)波段間的相關影響,僅靠相關系數(shù)極值選定變量構建模型進行養(yǎng)分回歸估測這一方法存在一定片面性,取得的建模效果并不理想。
經(jīng)研究發(fā)現(xiàn),機器學習算法在土壤有機質(zhì)等主要養(yǎng)分含量的估測研究中,能夠較好地預測精度[15]。結(jié)合前人的研究[16-17],本研究選取了偏最小二乘(PLSR)回歸與支持向量機(SVM)2種方法對山原紅壤主要養(yǎng)分含量進行估測研究。
通過以上相關性分析發(fā)現(xiàn),除一階微分變換能較好地提升光譜反射曲線與養(yǎng)分含量的相關性外,其余光譜變換均無很好效果。因此,在PLSR回歸和SVM回歸分析中,只使用原始反射率和平方根一階導光譜指數(shù)進行分析。
2.2.2 PLSR回歸養(yǎng)分含量反演研究
通過The Unscrambler X多變量數(shù)據(jù)分析軟件對目標數(shù)據(jù)進行處理。以20個山原紅壤土壤樣本的原始光譜率及平方根一階導光譜指數(shù)為自變量,速效氮磷鉀及其余養(yǎng)分含量為因變量。各主要養(yǎng)分含量回歸分析結(jié)果如圖3至圖7所示。由表8和圖3至圖7可知,利用PLSR回歸分析得到的結(jié)果中,速效氮磷鉀元素一階微分變換指數(shù)的R2較原始反射率有所提高,但有機質(zhì)和全氮一階微分變換指數(shù)的R2降低,并且PLSR擬合的模型整體效果提升很小,不適用于山原紅壤養(yǎng)分含量估測。
2.2.3 SVM回歸養(yǎng)分含量反演研究
與PLSR回歸相同,選擇20個山原紅壤土壤原始反射率和平方根一階微分作為自變量,各土壤養(yǎng)分含量作為因變量,分別對5種養(yǎng)分含量進行建模分析,各主要養(yǎng)分含量回歸分析結(jié)果如圖8至圖12所示。通過對山原紅壤速效氮磷鉀及其他主要養(yǎng)分含量的SVM回歸分析可以看出,各主要養(yǎng)分含量在與光譜反射率平方根一階微分的回歸模型中,均獲得了較好的擬合度。R2依舊呈現(xiàn)一階微分變換指數(shù)高于原始光譜反射率這一現(xiàn)象,且一階微分變換光譜指數(shù)的R2較原始光譜反射率有明顯提升,RMSE檢驗值也相對降低??傊褂肧VM回歸分析方法進行擬合的模型,整體效果均有所提升,比較其他方法更適合用于進行養(yǎng)分含量的估測。
3 結(jié)論與討論
3.1 結(jié)論
分別使用多光譜和高光譜結(jié)合對山原紅壤主要養(yǎng)分含量進行估測。在多光譜養(yǎng)分含量估測中,山原紅壤在紅外波段較為敏感,其土壤反射率值高于其他波段。利用合成植被指數(shù)對比,除比值植被指數(shù)與差值植被指數(shù)波段較為明顯外,其他植被指數(shù)波動范圍較小,通過原始反射率、合成植被指數(shù)與土壤各養(yǎng)分含量的相關分析表明,合成波段的相關性高于單波段。應用多種回歸分析方法對與土壤養(yǎng)分含量相關性較好的多光譜植被指數(shù)進行分析,整體R2系數(shù)較低,無法較好地擬合土壤指數(shù)與土壤養(yǎng)分的關系,造成這一結(jié)果的原因初步估測為分析土壤養(yǎng)分樣本量較少或多光譜探測波段分辨率不夠高導致。在多光譜養(yǎng)分估測中,利用多種方式擬合了鉀元素的合成光譜回歸模型,其R2大于0.5,有良好的擬合意義。
由于多光譜進行養(yǎng)分估測效果不理想,再利用高光譜對其進行分析。對特征波段與山原紅壤進行多種回歸模型擬合,單相關分析擬合的模型效果不好,無法較好地反映土壤養(yǎng)分含量。而后使用機器學習法進行分析,分別使用最小二乘法回歸模型和支持向量機回歸模型對不同高光譜反射曲線進行擬合分析,擬合結(jié)果更好,使用支持向量機擬合模型的R2較高,RMSE均方根誤差相對較好,比較適用于山原紅壤養(yǎng)分含量的估測,實現(xiàn)了土壤主要養(yǎng)分含量的高光譜估測。
3.2 討論
基于高光譜多變量的土壤養(yǎng)分含量回歸分析由于變量眾多因而分析較為復雜,基于機器學習的回歸算法能夠較好地解決多變量擬合回歸的過擬合現(xiàn)象,但需要大量的樣本數(shù)據(jù)。本研究相對其他研究而言樣本變量相對較少,因而未采用獨立樣本檢驗的方法對模型精度進行驗證。同時,由于樣本變量較少,在進行BP(back propagation)神經(jīng)網(wǎng)絡與隨機森林回歸分析時,未能獲得較好的擬合效果。因此在今后的多變量估測研究中,為保證擬合模型的擬合精度與獨立樣本檢驗的實現(xiàn),應盡可能提升樣本數(shù)量,提升樣本檢測的可能性。
參考文獻:
[1]邱 壑. 耕地土壤有機質(zhì)與速效氮磷鉀含量高光譜遙感反演研究[D]. 福州:福建農(nóng)林大學,2017.
[2]王騰軍,趙明海,楊 耘,等. 多光譜影像的陜西大西溝礦區(qū)土壤重金屬含量反演[J]. 光譜學與光譜分析,2019,39(12):3880-3887.
[3]張智韜,魏廣飛,姚志華,等. 基于無人機多光譜遙感的土壤含鹽量反演模型研究[J]. 農(nóng)業(yè)機械學報,2019,50(12):151-160.
[4]張智韜,譚丞軒,許崇豪,等. 基于無人機多光譜遙感的玉米根域土壤含水率研究[J]. 農(nóng)業(yè)機械學報,2019,50(7):246-257.
[5]趙 瑞,崔希民,劉 超. GF-5高光譜遙感影像的土壤有機質(zhì)含量反演估算研究[J]. 中國環(huán)境科學,2020,40(8):3539-3545.
[6]劉煥軍,張美薇,楊昊軒,等. 多光譜遙感結(jié)合隨機森林算法反演耕作土壤有機質(zhì)含量[J]. 農(nóng)業(yè)工程學報,2020,36(10):134-140.
[7]姜雪芹,葉 勤,林 怡,等. 基于諧波分析和高光譜遙感的土壤含水量反演研究[J]. 光學學報,2017,37(10):292-302.
[8]馬 馳. 基于Landsat 8遙感圖像的長春中北部地區(qū)土壤有機質(zhì)含量反演[J]. 江蘇農(nóng)業(yè)科學,2016,44(12):415-419.
[9]楊建鋒,馬軍成,王令超. 基于地貌類型的土壤有機質(zhì)多光譜遙感反演[J]. 地理空間信息,2015,13(2):48-50.
[10]南 鋒,朱洪芬,畢如田.黃土高原煤礦區(qū)復墾農(nóng)田土壤有機質(zhì)含量的高光譜預測[J]. 中國農(nóng)業(yè)科學,2016,49(11):2126-2135.
[11]欒福明,熊黑鋼,王 芳,等. 基于小波分析的土壤速效K含量高光譜反演[J]. 干旱區(qū)地理,2015,38(2):320-326.
[12]蔣璐璐,張 瑜,王艷艷,等. 基于光譜技術的土壤養(yǎng)分快速測試方法研究[J]. 浙江大學學報(農(nóng)業(yè)與生命科學版),2010,36(4):445-450.
[13]石萌萌. 全譜段成像儀的地表場景模擬[D]. 西安:西安科技大學,2017.
[14]秦倩如. 基于高光譜的陜西省土壤游離鐵與碳酸鈣含量預測研究[D]. 楊凌:西北農(nóng)林科技大學,2019.
[15]葉元元. 多金屬礦區(qū)土壤重金屬的高光譜定量估算研究[D]. 徐州:中國礦業(yè)大學,2014.
[16]紀文君,李 曦,李成學,等. 基于全譜數(shù)據(jù)挖掘技術的土壤有機質(zhì)高光譜預測建模研究[J]. 光譜學與光譜分析,2012,32(9):2393-2398.
[17]沈蘭芝,高懋芳,閆敬文,等. 基于SVR和PLSR的土壤有機質(zhì)高光譜估測模型研究[J]. 中國農(nóng)業(yè)信息,2019,31(1):58-71.