摘 要:【目的】研究土壤高光譜數(shù)據(jù)經(jīng)不同形式變換后與不同建模方法構(gòu)建土壤有機質(zhì)與全氮估測模型的精度,建立快速、穩(wěn)定的估測模型,為現(xiàn)代化農(nóng)業(yè)生產(chǎn)的精準施肥提供科學(xué)依據(jù)?!痉椒ā恳孕陆査晒抛灾沃荩ê喎Q博州)耕地土壤為研究對象,在暗室中使用ASD Field4地物光譜儀測量處理后的土壤樣品光譜。將原始光譜進行斷點擬合與Savitzky-Golay(S-G)平滑濾波校正處理,對校正后光譜(R)進行一階導(dǎo)數(shù)(First Derivative,F(xiàn)D)、對數(shù)的一階導(dǎo)數(shù)(First derivative of logarithmic,(lgR)’)、倒數(shù)的一階導(dǎo)數(shù)(First derivative of reciprocal,(1/R)’)、多元散射校正(Multipication scatter correction,MSC)4種變換,分析5種光譜數(shù)據(jù)與土壤有機質(zhì)和全氮含量,篩選特征波段,基于特征波段運用偏最小二乘回歸(PLSR)、BP神經(jīng)網(wǎng)絡(luò)(BP)和隨機森林(RF)3種方法,分別建立土壤有機質(zhì)、全氮的估測模型并評價模型的精度與穩(wěn)定性。【結(jié)果】光譜經(jīng)不同變換后,與土壤有機質(zhì)和全氮的相關(guān)系數(shù)有所提高,且特征波段更為明顯,一階導(dǎo)數(shù)與倒數(shù)的一階導(dǎo)數(shù)變換優(yōu)于其他變換,F(xiàn)D-PLSR模型預(yù)測有機質(zhì)精度最高,Rv2、RPD分別為0.89、2.63;(1/R)’-PLSR模型預(yù)測土壤全氮精度最高,Rv2、RPD分別為0.83、2.42?!窘Y(jié)論】基于高光譜技術(shù)與機器學(xué)習(xí)模型可以估測博州耕地土壤的有機質(zhì)與全氮含量。
關(guān)鍵詞:高光譜;土壤有機質(zhì);土壤全氮;光譜估測;偏最小二乘回歸;隨機森林
中圖分類號:S15 文獻標志碼:A 文章編號:1001-4330(2024)10-2491-09
收稿日期(Received):2024-04-15
基金項目:農(nóng)業(yè)科技創(chuàng)新穩(wěn)定支持專項(xjnkyywdzc-2022002)
作者簡介:李嘉琦(1995-),男,河南鶴壁人,碩士研究生,研究方向為土壤肥料與農(nóng)業(yè)信息技術(shù)應(yīng)用,(E-mail)515815502@qq.com
通訊作者:耿慶龍(1982-),男,山東人,副研究員,碩士,研究方向為土壤肥料與農(nóng)業(yè)信息技術(shù)應(yīng)用,(E-mail)564819139@qq.com
0 引 言
【研究意義】近年來土壤質(zhì)量的評估和監(jiān)測成為農(nóng)業(yè)可持續(xù)發(fā)展和生態(tài)環(huán)境保護的研究領(lǐng)域之一。土壤有機質(zhì)(Soil Organic Matter,SOM)和全氮(Total Nitrogen,TN)是土壤肥力和生態(tài)系統(tǒng)功能的關(guān)鍵指標,在土壤質(zhì)量評價和土壤管理中具有重要意義。傳統(tǒng)的土壤有機質(zhì)和全氮測定方法通常需要耗費大量時間和精力,并且在實際應(yīng)用中存在一定的局限性。因此,開發(fā)一種快速、準確的土壤有機質(zhì)和全氮估測方法顯得尤為重要[1-3]?!厩叭搜芯窟M展】基于高光譜技術(shù)的土壤有機質(zhì)和全氮估測方法逐漸受到關(guān)注[4-7],對光譜的不同預(yù)處理可影響預(yù)測模型的精度。Liu等[8]通過偏最小二乘方法,建立了土壤反射率和吸光度與土壤有機質(zhì)含量之間的估測模型。王一丁等[9]通過對光譜數(shù)據(jù)SG濾波平滑處理結(jié)合偏最小二乘回歸,建立了豫中煙區(qū)潮褐土有機質(zhì)和全氮含量的高光譜估測模型。杜軍等[10]研究發(fā)現(xiàn),以二階微分光譜變換結(jié)合徑向基函數(shù)為核函數(shù)的支持向量機模型反演土壤全氮效果最佳。Chang等[11]利用原始光譜的一階微分結(jié)合偏最小二乘法構(gòu)建了土壤全氮含量的預(yù)測模型,模型R2為0.87,RPD為2.79,此模型可精確地估測土壤全氮含量。王海江等[12]以新疆北疆棉田土壤為研究對象,基于偏最小二乘和支持向量機構(gòu)建的模型均較好地估測氮素含量。高光譜技術(shù)利用從可見光至近紅外波段的連續(xù)光譜信息,捕捉土壤中有機物和氮元素的光譜反射特征。通過建立高光譜與土壤樣品中有機質(zhì)和全氮含量之間的關(guān)系模型,實現(xiàn)對土壤有機質(zhì)和全氮含量的快速測定?!颈狙芯壳腥朦c】高光譜估測技術(shù)具有較多的局限性,如不同土壤樣品的復(fù)雜性,人為操作光譜儀器誤差等均影響所構(gòu)建估測模型的精度。因此,需進一步優(yōu)化和改進基于高光譜的土壤有機質(zhì)和全氮估測方法,提高其預(yù)測精度和實際應(yīng)用能力?!緮M解決的關(guān)鍵問題】以博州耕地土壤為研究對象,通過對土壤光譜數(shù)據(jù)的多種形式變換,結(jié)合土壤養(yǎng)分數(shù)據(jù)篩選特征波段,并建立偏最小二乘回歸(PLSR)、BP神經(jīng)網(wǎng)絡(luò)(BP)和隨機森林(RF)三種估測模型,為博州土壤質(zhì)量的改善和農(nóng)業(yè)生產(chǎn)與發(fā)展工作提供技術(shù)支撐。
1 材料與方法
1.1 材 料
新疆博州位于新疆西北部,準噶爾盆地西端(79 53′~83 53′E,44 02′~45 23′N)。地勢西高東低,地形由南、北、西逐漸向中、東部傾斜,并似喇叭狀逐漸開闊。耕地土壤主要以潮土、棕鈣土、灰漠土、和草甸土為主。主要種植小麥、玉米、棉花和油料等作物。博州屬北溫帶大陸性干旱氣候,春季氣溫回升快且不穩(wěn)定,夏季炎熱,秋季降溫迅速,冬季寒冷,日照充足,太陽總輻射年均5 390~5 700MJ/m2,年均降水量為90~500 mm。
1.2 方 法
1.2.1 土壤樣品采集與制備
2021年于博州采集土壤樣品,采樣點選取基于2021年博州耕地質(zhì)量調(diào)查評價監(jiān)測樣點,監(jiān)測樣點按667 hm2(1×104畝)耕地布設(shè)一個點位。使用梅花采樣法,共采集294個土壤樣品,采樣深度為0~20 cm,取1 kg左右土樣裝于土樣袋,記錄采樣點位信息。采回樣品進行晾干、磨細并通過60目(0.25 mm)孔篩,每份樣品采用四分法分成兩份,一份用于實驗室測定土壤有機質(zhì)、全氮含量,另一份用于土壤高光譜數(shù)據(jù)的采集。土壤采樣點分布圖利用AcrGIS10.7制作。
1.2.2 土壤樣品處理
在室內(nèi)實驗室測定土壤養(yǎng)分信息,土壤有機質(zhì)含量測定采用重鉻酸鉀氧化-外加熱法(LY/T1237—1999),土壤全氮含量測定采用凱氏定氮法(LY/T1228—2015)。
在室內(nèi)利用ASD Field4地物光譜儀采集土壤光譜,該地物光譜儀的波長范圍是350~2 500 nm,共輸出2 151個波段,在350~2 500 nm區(qū)間范圍的重采樣間隔為1 nm。土壤樣品的光譜測量在干燥的暗室中進行,將土樣過60目孔篩后,置于直徑90 mm、深20 mm的培養(yǎng)皿中,裝滿后將土樣表面刮平。每次光譜測量之前將儀器提前打開預(yù)熱30 min并進行白板校正,使用儀器配套的手持接觸式探頭垂直置于土壤表面測量。選擇培養(yǎng)皿中3個平均分布的點位,每個點位分別測量10條光譜反射率數(shù)據(jù),單個樣本共采集30條反射率數(shù)據(jù)。在測量過程中,每測量10份土壤樣品進行1次標準白板校正。
1.2.3 建模與模型評價
基于特征波段建模的模型精度和穩(wěn)定性優(yōu)于全波段建模的結(jié)果[13-18],僅分析特征波段的模型效果。對272個樣本按照采樣編號排序,在MATLAB中按照7∶3比例隨機劃分建模集與驗證集參與后續(xù)模型分析,以5種光譜形式分別與偏最小二乘回歸(PLSR)、BP神經(jīng)網(wǎng)絡(luò)(BP)和隨機森林(RF)三種建模方法分別建立土壤有機質(zhì)、全氮的估測模型,每類組合建模9次,選取驗證集決定系數(shù)(Rv2)中值對應(yīng)的建模結(jié)果作為該類組合最終結(jié)果進行分析評價。三種模型的建立在Matlab2022a中完成。
土壤有機質(zhì)和全氮估測模型的評價指標采用決定系數(shù)(coefficient ofdetermination, R2)、均方根誤差(root mean square error, RMSE)、相對分析誤差(the ratio of prediction todeviation, RPD)。決定系數(shù)R2越接近于1,模型的預(yù)測能力越強。均方根誤差RMSE用來衡量數(shù)據(jù)的離散程度,RMSE越小模型的精度越高。當(dāng)RPD≥2時模型具有較好的預(yù)測能力;當(dāng)1.4≤RPD<2時,模型可對樣品作粗略估測;當(dāng)RPDlt;1.4時模型無法對樣品進行預(yù)測[19-20]。
1.3 數(shù)據(jù)處理
利用ViewspecPro軟件對所測得的光譜數(shù)據(jù)進行斷點擬合。從ViewspecPro中計算每個樣本的30條反射率數(shù)據(jù)的算術(shù)平均值作為該樣本的實際反射率數(shù)據(jù),導(dǎo)出實際反射率數(shù)據(jù)至Excel中,為消除儀器噪聲影響,去除350~399 nm和2 451~2 500 nm波段的數(shù)據(jù)。利用Matlab2022a軟件對反射率數(shù)據(jù)進行Savitzky-Golay(S-G)平滑濾波處理得到土壤光譜(R),對土壤光譜進行一階導(dǎo)數(shù)(First Derivative,F(xiàn)D)、對數(shù)的一階導(dǎo)數(shù)(First derivative of logarithmic,(lgR)’)、倒數(shù)的一階導(dǎo)數(shù)(First derivative of reciprocal,(1/R)’)、多元散射校正(Multipication scatter correction,MSC)4種變換,并將5種光譜數(shù)據(jù)分別與實驗室所土壤有機質(zhì)與全氮數(shù)據(jù)進行相關(guān)性分析篩選特征波段,相關(guān)性分析在SPSS24中進行,光譜曲線圖在Origin2021中繪制。對所獲得的養(yǎng)分數(shù)據(jù),采用箱線圖法剔除22個養(yǎng)分值異常的樣本,得到272個樣本用于建模分析。
2 結(jié)果與分析
2.1 有機質(zhì)和全氮含量變異系數(shù)梯度分布
研究表明,有機質(zhì)含量最小值為5.66 g/kg,最大值為31.7 g/kg,均值為18.09 g/kg,總體含量處于中等偏低水平。全氮含量最小值為0.29 g/kg,最大值為5.66 g/kg,均值為1 g/kg,總體含量處于中等水平。有機質(zhì)和全氮含量變異系數(shù)大,具有較大的梯度分布,樣本離散程度高,此類數(shù)據(jù)構(gòu)建模型具有良好的代表性。表1
2.2 土壤光譜曲線變化趨勢
研究表明,所有土壤光譜曲線變化趨勢相同,波長與反射率呈正相關(guān)狀態(tài),其中在400~760 nm波段光譜反射率增加較快,在760~2 400 nm波段光譜反射率增加變緩,土壤有機質(zhì)及全氮含量與光譜反射率呈負相關(guān),此外還受多種因素影響。MSC變換土壤光譜曲線在1 400、1 900和2 200 nm處有明顯的波谷。圖1
2.3 土壤有機質(zhì)含量與變換后的相關(guān)性比較
研究表明,不同變換后的相關(guān)系數(shù)具有明顯差異。土壤有機質(zhì)與全氮的特征波段范圍大致相同,土壤有機質(zhì)與全氮呈正相關(guān)。
土壤有機質(zhì)及全氮含量與R相關(guān)性曲線整體呈負相關(guān),在600 nm波段達到峰值;與FD變換相關(guān)性曲線波動較大,存在多處波峰波谷,可凸顯土壤光譜特征信息;與(lgR)’和(1/R)’變換的相關(guān)性曲線較FD變換同樣存在多處波峰波谷,并且更加明顯,體現(xiàn)了特征波段主要集中在424~529、637~892、1 383~1 496和2 187~2 316 nm。采用P<0.01顯著性檢驗篩選特征波段參與后續(xù)建模。土壤有機質(zhì)及全氮含量與MSC變換在可見光波段的相關(guān)性達到峰值,然而在1 400和1 900 nm波段的吸收峰。圖2~3
2.4 不同預(yù)測模型建模預(yù)測效果評估
研究表明,基于PLSR的預(yù)測模型中,不同光譜處理形式下土壤全氮的Rc2的最大值與最小值為0.82、0.34,RMSEc的最大值與最小值為0.29、0.15 g/kg,Rv2的最大值與最小值為0.83、0.44,RMSEv的最大值與最小值為0.23、0.13 g/kg,RPD介于1.01~2.42;土壤有機質(zhì)的Rc2的最大值與最小值為0.89、0.66,RMSEc的最大值與最小值為5.91、2.01 g/kg,Rv2的最大值與最小值為0.89、0.42,RMSEv的最大值與最小值為6.24、1.92 g/kg,RPD介于1.21~2.63。
基于SVR的預(yù)測模型中,不同光譜處理形式下土壤全氮的Rc2的最大值與最小值為0.64、0.58,RMSEc的最大值與最小值為0.31、0.22 g/kg,Rv2的最大值與最小值為0.64、0.42,RMSEv的最大值與最小值為0.34、0.21 g/kg,RPD介于1.09~1.23;土壤有機質(zhì)的Rc2最大值與最小值為0.65、0.52,RMSEc最大值與最小值為6.11、2.98 g/kg,Rv2的最大值與最小值為0.62、0.39,RMSEv的最大值與最小值為4.82、3.07 g/kg,RPD介于1.14~1.51。
基于RF的預(yù)測模型中,不同光譜處理形式下土壤全氮的Rc2的最大值與最小值為0.72、0.35,RMSEc的最大值與最小值為0.27、0.1 7 g/kg,Rv2的最大值與最小值為0.73、0.17,RMSEv的最大值與最小值為0.25、0.17 g/kg,RPD介于1.12~1.84;土壤有機質(zhì)的Rc2的最大值與最小值為0.86、0.56,RMSEc的最大值與最小值為3.70、1.31 g/kg,Rv2的最大值與最小值為0.85、0.41,RMSEv的最大值與最小值為4.21、1.16 g/kg,RPD介于1.18~2.31。
除MSC變換外,其他光譜變換均可提高模型的預(yù)測性與穩(wěn)定性。PLSR模型的R2與RPD均高于SVR和RF模型,且RMSEc與RMSEv較小,其中使用倒數(shù)的一階導(dǎo)數(shù)光譜變換構(gòu)建的PLSR模型預(yù)測土壤全氮效果最佳,Rv2與RPD達到0.83、2.42;使用一階導(dǎo)數(shù)光譜變換構(gòu)建的PLSR模型預(yù)測有機質(zhì)效果最佳,Rv2與RPD達到0.89、2.63。SVR模型的效果不佳,只能粗略估算全氮與有機質(zhì)的含量。RF模型效果良好,其中使用一階導(dǎo)數(shù)變換構(gòu)建的全氮估測模型Rv2與RPD達到0.73、1.84;一階導(dǎo)數(shù)變換構(gòu)建的有機質(zhì)估測模型Rv2與RPD達到0.85、2.31。表2~4,圖4~5
對全氮預(yù)測效果最好的光譜變換及模型是(1/R)’-PLSR,對有機質(zhì)預(yù)測效果最好的光譜變換及模型是FD-PLSR。圖5
3 討 論
3.1 為提高對土壤光譜的分析速度與精準度,采用相關(guān)分析法篩選特征波段[21-22],相較于謝文等[23]采用土壤光譜全波段信息段構(gòu)建模型,試驗研究方法減少了全波段中的冗余信息,利于多種模型的構(gòu)建。多個研究也采用相關(guān)分析法選取特征波段構(gòu)建模型,并取得了較好的估測效果[24-25]。
3.2 相較于張娟娟等[26]對原始光譜進行單一形式變換,試驗研究進行了更多種類的數(shù)學(xué)變換,其中原始光譜經(jīng)一階導(dǎo)數(shù)變換后,光譜吸收特征顯現(xiàn)出來,土壤有機質(zhì)及全氮含量與光譜反射率的相關(guān)性均被提高。試驗研究發(fā)現(xiàn)對數(shù)的導(dǎo)數(shù)與倒數(shù)的導(dǎo)數(shù)變換后的光譜進一步凸顯了土壤養(yǎng)分的特征波段,多種數(shù)學(xué)變換組合下處理的土壤光譜也可以提取出不同的光譜特征,與于錦濤等[27]的研究結(jié)果一致。多元散射校正后的光譜數(shù)據(jù)與土壤養(yǎng)分的相關(guān)系數(shù)曲線更清晰地顯示了水分吸收影響的波段。
相較于劉杰亞等[28]只構(gòu)建單一估測模型,構(gòu)建了3種估測模型,PLSR和RF模型能夠有效預(yù)測土壤有機質(zhì)及全氮的含量,而SVR模型僅能粗略估測,相較于原始光譜構(gòu)建的模型,三種數(shù)學(xué)變換后的光譜構(gòu)建的模型預(yù)測精度均有明顯提升,說明合適的光譜變換可以提高模型的預(yù)測精度和穩(wěn)定性[29],而MSC光譜變換后預(yù)測效果不佳,可能是該變換弱化了與土壤養(yǎng)分有關(guān)的光譜波段[30]。
4 結(jié) 論
以博州272個土樣為研究對象,以土壤有機質(zhì)與全氮含量結(jié)合土壤光譜反射率及其四種變換形式進行相關(guān)分析篩選特征波段,并利用兩種土壤養(yǎng)分的不同特征波段分別建立基于PLSR、SVR、RF的預(yù)測模型。不同光譜變換構(gòu)建的預(yù)測模型精度不同,(1/R)’-PLSR模型預(yù)測土壤全氮精度最高,Rv2、RPD分別為0.83、2.42。FD-PLSR模型預(yù)測有機質(zhì)精度最高,Rv2、RPD分別為0.89、2.63。高光譜技術(shù)與機器學(xué)習(xí)模型相結(jié)合能夠構(gòu)建估測博州耕地土壤有機質(zhì)與全氮的模型,采用篩選后的光譜波段建模是可行的。
參考文獻(References)
[1]沈潤平, 丁國香, 魏國栓, 等. 基于人工神經(jīng)網(wǎng)絡(luò)的土壤有機質(zhì)含量高光譜反演[J].土壤學(xué)報, 2009, 46(3): 391-397.
SHEN Runping, DING Guoxiang, WEI Guoshuan, et al. Retrieval of soil organic matter content from hyper-spectrum based on ann[J].Acta Pedologica Sinica, 2009, 46(3): 391-397.
[2] 葉勤, 姜雪芹, 李西燦, 等. 基于高光譜數(shù)據(jù)的土壤有機質(zhì)含量反演模型比較[J].農(nóng)業(yè)機械學(xué)報, 2017, 48(3): 164-172.
YE Qin, JIANG Xueqin, LI Xican, et al. Comparison on inversion model of soil organic matter content based on hyperspectral data[J].Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(3): 164-172.
[3] 張娟娟, 田永超, 朱艷, 等. 不同類型土壤的光譜特征及其有機質(zhì)含量預(yù)測[J].中國農(nóng)業(yè)科學(xué), 2009, 42(9): 3154-3163.
ZHANG Juanjuan, TIAN Yongchao, ZHU Yan, et al. Spectral characteristics and estimation of organic matter contents of different soil types[J].Scientia Agricultura Sinica, 2009, 42(9): 3154-3163.
[4] 洪永勝, 于雷, 耿雷, 等. 應(yīng)用DS算法消除室內(nèi)幾何測試條件對土壤高光譜數(shù)據(jù)波動性的影響[J].華中師范大學(xué)學(xué)報(自然科學(xué)版), 2016, 50(2): 303-308.
HONG Yongsheng, YU Lei, GENG Lei, et al. Using Direct Standardization algorithm to eliminate the effect of laboratory geometric parameters on soil hyperspectral data fluctuate characteristic[J].Journal of Central China Normal University (Natural Sciences), 2016, 50(2): 303-308.
[5] 欒福明, 熊黑鋼, 王芳, 等. 基于小波分析的土壤堿解氮含量高光譜反演[J].光譜學(xué)與光譜分析, 2013, 33(10): 2828.
LUAN Fuming, XIONG Heigang, WANG Fang, et al. The inversion of soil alkaline hydrolysis nutrient content with hyperspectral reflectance based on wavelet analysis[J].Spectroscopy and Spectral Analysis, 2013, 33(10): 2828.
[6] 林楠, 劉海琪, 楊佳佳, 等. BA-Adaboost模型的黑土區(qū)土壤養(yǎng)分含量高光譜估測[J].光譜學(xué)與光譜分析, 2020, 40(12): 3825-3831.
LIN Nan, LIU Haiqi, YANG Jiajia, et al. Hyperspectral estimation of soil nutrient content in the black soil region based on BA-adaboost[J].Spectroscopy and Spectral Analysis, 2020, 40(12): 3825-3831.
[7] 陳奕云, 齊天賜, 黃穎菁, 等. 土壤有機質(zhì)含量可見-近紅外光譜反演模型校正集優(yōu)選方法[J].農(nóng)業(yè)工程學(xué)報, 2017, 33(6): 107-114.
CHEN Yiyun, QI Tianci, HUANG Yingjing, et al. Optimization method of calibration dataset for VIS-NIR spectral inversion model of soil organ ic matter content[J].Transactions of the Chinese Society of Agricultural Engineering, 2017, 33(6): 107-114.
[8] Liu Y L, Jiang Q H, Fei T, et al. Transferability of a visible and near-infrared model for soil organic matter estimation in riparian landscapes[J].Remote Sensing, 2014, 6(5): 4305-4322.
[9] 王一丁, 趙銘欽, 劉鵬飛, 等. 基于高光譜分析的植煙土壤有機質(zhì)和全氮含量預(yù)測研究[J].中國煙草學(xué)報, 2016, 22(3): 44-51.
WANG Yiding, ZHAO Mingqin, LIU Pengfei, et al. Prediction of organic matter and total nitrogen contents in tobacco-growing soil based on hyper-spectral analysis[J].Acta Tabacaria Sinica, 2016, 22(3): 44-51.
[10] 杜軍, 古軍偉, 邱士可, 等. 基于支持向量回歸的土壤全氮含量高光譜估測研究[J].河南科學(xué), 2020, 38(10): 1585-1590.
DU Jun, GU Junwei, QIU Shike, et al. Prediction of total nitrogen by using hyperspectral data based on support vector regression[J].Henan Science, 2020, 38(10): 1585-1590.
[11] Chang C W, Laird D A, Mausbach M J, et al. Near-infrared reflectance spectroscopy–principal components regression analyses of soil properties[J].Soil Science Society of America Journal, 2001, 65(2): 480-490.
[12] 王海江, 劉凡, YUNGER John A, 等. 不同粒徑處理的土壤全氮含量高光譜特征擬合模型[J].農(nóng)業(yè)機械學(xué)報, 2019, 50(2): 195-204.
WANG Haijiang, LIU Fan, YUNGER J A, et al. Fitting model of soil total nitrogen content in different soil particle sizes using hyperspectral analysis[J].Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(2): 195-204.
[13] 南鋒, 朱洪芬, 畢如田. 黃土高原煤礦區(qū)復(fù)墾農(nóng)田土壤有機質(zhì)含量的高光譜預(yù)測[J].中國農(nóng)業(yè)科學(xué), 2016, 49(11): 2126-2135.
NAN Feng, ZHU Hongfen, BI Rutian. Hyperspectral prediction of soil organic matter content in the reclamation cropland of coal mining areas in the Loess Plateau[J].Scientia Agricultura Sinica, 2016, 49(11): 2126-2135.
[14] 朱亞星, 于雷, 洪永勝, 等. 土壤有機質(zhì)高光譜特征與波長變量優(yōu)選方法[J].中國農(nóng)業(yè)科學(xué), 2017, 50(22): 4325-4337.
ZHU Yaxing, YU Lei, HONG Yongsheng, et al. Hyperspectral features and wavelength variables selection methods of soil organic matter[J].Scientia Agricultura Sinica, 2017, 50(22): 4325-4337.
[15] 楊玉軍. 基于機器學(xué)習(xí)的時間序列模型研究及其應(yīng)用[D].成都: 電子科技大學(xué), 2018.
YANG Yujun. Research and Application of Time Series Model Based on Machine Learning[D].Chengdu: University of Electronic Science and Technology of China, 2018.
[16] 姚登舉, 楊靜, 詹曉娟. 基于隨機森林的特征選擇算法[J].吉林大學(xué)學(xué)報(工學(xué)版), 2014, 44(1): 137-141.
YAO Dengju, YANG Jing, ZHAN Xiaojuan. Feature selection algorithm based on random forest[J].Journal of Jilin University (Engineering and Technology Edition), 2014, 44(1): 137-141.
[17] 趙寧博, 秦凱, 趙英俊, 等. 土壤鉻的航空高光譜間接反演模型及可遷移性研究[J].光譜學(xué)與光譜分析, 2021, 41(5): 1617-1624.
ZHAO Ningbo, QIN Kai, ZHAO Yingjun, et al. Study on indirect inversion model and migration ability of chromium in soil by aerial hyperspectral method[J].Spectroscopy and Spectral Analysis, 2021, 41(5): 1617-1624.
[18] 郭云開, 謝曉峰, 謝瓊, 等. 基于小波變換的土壤重金屬鉻含量定量反演[J].測繪工程, 2021, 30(3): 66-71.
GUO Yunkai, XIE Xiaofeng, XIE Qiong, et al. Quantitative inversion of heavy metal chromium content in soil based on wavelet transform[J].Engineering of Surveying and Mapping, 2021, 30(3): 66-71.
[19] Chang C W, Laird D A. Near-infrared reflectance spectroscopic analysis of soil C and N[J].Soil Science, 2002, 167(2): 110-116.
[20] 侯化剛, 王丹陽, 馬斯琦, 等. 黃河三角洲不同鹽漬度土壤有機質(zhì)含量的高光譜預(yù)測研究[J].中國農(nóng)業(yè)科學(xué), 2023, 56(10): 1905-1919.
HOU Huagang, WANG Danyang, MA Siqi, et al. Hyperspectral prediction of organic matter in soils of different salinity levels in the Yellow River Delta[J].Scientia Agricultura Sinica, 2023, 56(10): 1905-1919.
[21] Viscarra Rossel R A, Behrens T. Using data mining to model and interpret soil diffuse reflectance spectra[J].Geoderma, 2010, 158(1/2): 46-54.
[22] 玉米提·買明, 王雪梅. 連續(xù)小波變換的土壤有機質(zhì)含量高光譜估測[J].光譜學(xué)與光譜分析, 2022, 42(4): 1278-1284.
Yumiti Maiming, WANG Xuemei. Hyperspectral estimation of soil organic matter content based on continuous wavelet transformation[J].Spectroscopy and Spectral Analysis, 2022, 42(4): 1278-1284.
[23] 謝文, 趙小敏, 郭熙, 等. 基于RBF組合模型的山地紅壤有機質(zhì)含量光譜估測[J].林業(yè)科學(xué), 2018, 54(6): 16-23.
XIE Wen, ZHAO Xiaomin, GUO Xi, et al. Spectrum based estimation of the content of soil organic matters in mountain red soil using RBF combination model[J].Scientia Silvae Sinicae, 2018, 54(6): 16-23.
[24] 王婷, 劉振華, 彭一平, 等. 華南地區(qū)土壤有機質(zhì)含量高光譜反演[J].江蘇農(nóng)業(yè)學(xué)報, 2020, 36(2): 350-357.
WANG Ting, LIU Zhenhua, PENG Yiping, et al. Predicting soil organic matter content in South China based on hyperspectral reflectance[J].Jiangsu Journal of Agricultural Sciences, 2020, 36(2): 350-357.
[25]張恒, 梁太波, 江鴻, 等. 基于高光譜成像的區(qū)域尺度植煙土壤有機質(zhì)含量和pH值估測[J].煙草科技, 2023, 11(17): 1-15.
ZHANG Heng, LIANG Taibo, Jiang Hong, et al. Estimation of organic matter content and pH of regional-scale tobacco-growing soils using hyperspectral imaging [J].Tobacco Science amp; Technology, 2023, 11(17): 1-15.
[26] 張娟娟, 牛圳, 馬新明, 等. 基于離散小波的土壤全氮高光譜特征提取與反演[J].光譜學(xué)與光譜分析, 2023, 43(10): 3223-3229.
ZHANG Juanjuan, NIU Zhen, MA Xinming, et al. Hyperspectral feature extraction and estimation of soil total nitrogen based on discrete wavelet transform[J].Spectroscopy and Spectral Analysis, 2023, 43(10): 3223-3229.
[27] 于錦濤, 李西燦, 曹雙, 等. 土壤有機質(zhì)高光譜自反饋灰色模糊估測模型[J].山東農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版), 2023, 54(4): 495-499.
YU Jintao, LI Xican, CAO Shuang, et al. Self-feedback grey fuzzy estimation model of soil organic matter using Hyper-spectral data[J].Journal of Shandong Agricultural University (Natural Science Edition), 2023, 54(4): 495-499.
[28] 劉杰亞, 李西燦, 任文靜, 等. 利用卷積神經(jīng)網(wǎng)絡(luò)的土壤有機質(zhì)含量高光譜估測[J].河北農(nóng)業(yè)大學(xué)學(xué)報, 2023, 46(4): 118-124.
LIU Jieya, LI Xican, REN Wenjing, et al. Hyperspectral estimation of soil organic matter content using convolutional neural network[J].Journal of Hebei Agricultural University, 2023, 46(4): 118-124.
[29] 趙明松, 謝毅, 陸龍妹, 等. 基于高光譜特征指數(shù)的土壤有機質(zhì)含量建模[J].土壤學(xué)報, 2021, 58(1): 42-54.
ZHAO Mingsong, XIE Yi, LU Longmei, et al. Modeling for soil organic matter content based on hyperspectral feature indices[J].Acta Pedologica Sinica, 2021, 58(1): 42-54.
[30] 王動民, 紀俊敏, 高洪智. 多元散射校正預(yù)處理波段對近紅外光譜定標模型的影響[J].光譜學(xué)與光譜分析, 2014, 34(9): 2387-2390.
WANG Dongmin, JI Junmin, GAO Hongzhi. The effect of MSC spectral pretreatment regions on near infrared spectroscopy calibration results[J].Spectroscopy and Spectral Analysis, 2014, 34(9): 2387-2390.
Estimation of soil organic matter and total nitrogen based on hyperspectral technology
LI Jiaqi1, FENG Yuhua1, CHEN Shuhuang2, WANG Ziao1, LIU Peng1,
LIANG Zhiyong1, SUN Fafu1, CHEN Rong1,GENG Qinglong2
(1. College of Resources and Environment, Xinjiang Agricultural University, Urumqi 830052, China;2.Institute of Soil, Fertilizer and Agricultural Water Conservation, Xinjiang Academy of Agricultural Sciences/Agricultural Remote Sensing Center, Xinjang Academy of Agricultural Sciences, Urumqi 830091 , China)
Abstract:【Objective】 To explore the accuracy of soil organic matter and total nitrogen estimation model with different modeling methods and to establish a fast and stable estimation model, so as to provide scientific basis for precision fertilization of modern agricultural production. 【Methods】 Taking the cultivated soil from Bortala Mongolia Autonomous Prefecture as the research object, the ASD Field4 ground object spectrometer was used to measure the spectrum of the treated soil samples in the dark room. The original spectrum was processed by breakpoint fitting and Savitzky-Golay (S-G) smoothing filtering correction. First derivative (FD), first derivative of logarithm ((lgR)′), first derivative of reciprocal ((1/R)′) and multipication scatter correction (MSC) were performed on the corrected spectrum (R). The correlation analysis of the above five forms of spectra with soil organic matter and total nitrogen content was carried out to screen the characteristic bands. Based on the characteristic bands, partial least squares regression (PLSR), BP neural network (BP) and random forest (RF) were used to establish the estimation models of soil organic matter and total nitrogen, and the accuracy and stability of the models were evaluated. 【Results】 After different transformations, the correlation coefficients between the spectra and soil organic matter and total nitrogen increased, and the characteristic bands were more obvious. The first derivative transformation of the first derivative and the reciprocal was better than those of other transformations. The FD-PLSR model had the highest accuracy in predicting organic matter, with Rv2 and RPD of 0.89 and 2.63, respectively. The (1/R)′-PLSR model had the highest accuracy in predicting soil total nitrogen, with Rv2 and RPD of 0.83 and 2.42, respectively. 【Conclusion】 Based on hyperspectral technology and machine learning model, the estimation of soil organic matter and total nitrogen in cultivated land of Bozhou can be realized.
Key words:hyperspectral; soil organic matter; soil total nitrogen; spectral estimation; partial least squares regression; random forest
Fund projects:Agricultural Science and Technology Innovation and Stability Support Special Project (xjnkyywdzc-2022002)
Correspondence author:GENG Qinglong(1982-), male, from Shandong, associate researcher, research direction: research direction: soil fertilizer and application of intelligence agricultural information technology, (E-mail) 564819139@qq.com