朱建偉,劉玉學(xué),吳超凡,靳 佳,呂豪豪,楊生茂,*
1 浙江師范大學(xué)地理與環(huán)境科學(xué)學(xué)院, 金華 321000 2 浙江省農(nóng)業(yè)科學(xué)院環(huán)境資源與土壤肥料研究所, 杭州 310021 3 浙江省生物炭工程技術(shù)研究中心, 杭州 310021
土壤是農(nóng)業(yè)生產(chǎn)活動(dòng)進(jìn)行的基礎(chǔ),是極為珍貴的自然資源,而土壤質(zhì)量的好壞影響著農(nóng)作物的生長(zhǎng)。土壤有機(jī)碳(Soil Organic Carbon, SOC)是生態(tài)系統(tǒng)中主要的碳源,可以改善土壤團(tuán)聚體結(jié)構(gòu)、滲透性、微生物活性[1-2],是評(píng)價(jià)土壤質(zhì)量的最重要的指標(biāo)之一。SOC是碳庫(kù)的重要組成部分,其變化影響著土壤碳排放,因此,準(zhǔn)確評(píng)估SOC含量是當(dāng)前全球碳循環(huán)研究的重點(diǎn)內(nèi)容。生物炭(Biochar)是農(nóng)作物秸稈、生活廢棄物以及動(dòng)物糞便等生物質(zhì)在缺氧或低氧條件下,高溫裂解后產(chǎn)生的富碳黑色固態(tài)物質(zhì)[3- 5]。生物炭由于其碳組分高度芳香化而表現(xiàn)出很強(qiáng)的熱穩(wěn)定性和生物化學(xué)抗分解性。此外,生物炭孔隙結(jié)構(gòu)發(fā)達(dá),比表面積大,表明含氧官能團(tuán)豐富,具有較強(qiáng)的吸附性能,因而常被用作土壤改良劑添加到土壤中,起到增加SOC含量、改善土壤物理結(jié)構(gòu)、持留土壤養(yǎng)分等作用,進(jìn)而提升作物產(chǎn)量。Backer[6]在加拿大魁北克南部?jī)煞N類型土壤中施加生物炭,發(fā)現(xiàn)施炭3年后兩種土壤的養(yǎng)分和作物產(chǎn)量對(duì)生物炭的響應(yīng)不同,砂質(zhì)粘壤土的SOC濃度比對(duì)照高67%。另有研究發(fā)現(xiàn),施加生物炭增加了我國(guó)南部熱帶和亞熱帶地區(qū)紅壤SOC和土壤團(tuán)聚體的碳氮比[7]。由此可見,SOC含量通常隨著生物炭的添加而提高,且隨著時(shí)間的延長(zhǎng)而發(fā)生動(dòng)態(tài)變化。SOC含量測(cè)定方法的快速、高效和準(zhǔn)確是開展生物炭對(duì)SOC影響研究的關(guān)鍵。但是相關(guān)研究對(duì)SOC的定量檢測(cè)主要基于傳統(tǒng)的化學(xué)分析方法,該分析方法存在著測(cè)定時(shí)間長(zhǎng)、過程繁瑣、樣品氧化不完全引起結(jié)果存在偏差、污染環(huán)境等缺點(diǎn)[8-9],因此,探索快速、準(zhǔn)確、成本低且無污染的SOC測(cè)定方法十分必要[10-11]。
近紅外光譜技術(shù)具有快速準(zhǔn)確獲取待測(cè)樣品屬性數(shù)據(jù)等優(yōu)點(diǎn),被廣泛應(yīng)用于土壤理化性質(zhì)的科學(xué)預(yù)測(cè)[12- 14]。目前國(guó)內(nèi)外學(xué)者對(duì)不同類型、不同區(qū)域土壤的SOC預(yù)測(cè)進(jìn)行了大量研究[11, 15]。崔霞等[16]以甘南藏族自治州高寒草地土壤為研究對(duì)象,通過比較多種光譜變化形式以及3種多元線性回歸方法,建立了針對(duì)高寒草地土壤的SOC預(yù)測(cè)模型。Marijn等[17]評(píng)估了PLSR模型在潮沼地土壤中SOC預(yù)測(cè)性能,表明中紅外PLSR模型可以很好地預(yù)測(cè)該類型土壤的SOC含量。Liu等[18]比較了不同母質(zhì)土壤的光譜曲線特征以及對(duì)預(yù)測(cè)模型建立的影響。而在模型的建立中,建模方法的選擇、光譜的預(yù)處理以及建模集驗(yàn)證集的選擇影響著模型的預(yù)測(cè)性能。劉彥姝等[19]通過對(duì)杉木林土壤氮含量的光譜預(yù)測(cè)研究,比較了不同種光譜預(yù)處理的方法,并對(duì)最小二乘-支持向量機(jī)回歸模型(LS-SVR)和PLSR模型進(jìn)行評(píng)價(jià),結(jié)果表明LS-SVR比PLSR具有更好的預(yù)測(cè)能力。Bushang等[20]結(jié)合偏最小二乘法預(yù)測(cè)土壤中SOC含量,研究結(jié)果發(fā)現(xiàn),光譜經(jīng)過一階導(dǎo)數(shù)處理后,模型性能明顯優(yōu)于原始反射率預(yù)測(cè)模型。Nawar和Mouazen[21]比較了不同的土壤樣本選擇方法,并且在此基礎(chǔ)上建立PLSR模型來驗(yàn)證樣本選擇方法的優(yōu)缺點(diǎn)。
然而,在眾多研究中,對(duì)施加生物炭后的土壤SOC模型預(yù)測(cè)的研究還很少。因此,本文在室內(nèi)條件測(cè)定不同處理后的生物炭土壤光譜,采用3種樣本選擇方法(KS算法、RS算法和SPXY算法)、6種光譜預(yù)處理方法及3種建模方法(siPLS模型、GA-SVM模型和RF模型)分別建立含生物炭土壤的SOC預(yù)測(cè)模型,并對(duì)各模型的預(yù)測(cè)效果進(jìn)行對(duì)比分析,探究生物炭施入土壤后SOC的最適模型,以期為適合含生物炭土壤SOC含量的科學(xué)預(yù)測(cè)提供參考依據(jù)。
研究區(qū)位于浙江省農(nóng)業(yè)科學(xué)院海寧市許村鎮(zhèn)楊渡科研基地(120°24′23″E, 30°26′07″N),屬于亞熱帶季風(fēng)氣候區(qū)。其特征是暖季氣候濕潤(rùn),降水較多;冷季氣候干燥,降水較少。平均年降水量1187 mm,平均氣溫15.9℃。供試土壤為水稻土。
試驗(yàn)設(shè)置5個(gè)處理:CK(無施肥)、BC0(常規(guī)施肥)、BC1(常規(guī)施肥+7.5 t/hm2生物炭)、BC2(常規(guī)施肥+15 t/hm2生物炭)、BC3(常規(guī)施肥+22.5 t/hm2生物炭)。每個(gè)處理重復(fù)3次,采用隨機(jī)區(qū)組設(shè)計(jì)。常規(guī)施肥用量N:P:K(尿素:過磷酸鈣:氯化鉀)的比例為2∶1∶1.4,供試作物為油菜-水稻輪作。生物炭于2011年油菜季一次性施加,與0—20 cm表層土壤混合均勻。本研究樣品采集時(shí)間為:2014年6月6日、2015年12月25日、2016年5月24日、2017年3月1日、2017年11月20日、2018年11月20日。采用“五點(diǎn)采樣法”采集0—20 cm表層土壤樣品,每個(gè)樣品混勻后放入保鮮袋帶回實(shí)驗(yàn)室進(jìn)行自然風(fēng)干,挑除草根石塊等雜質(zhì)后進(jìn)行研磨后過100目篩。然后將每個(gè)土壤樣品分為兩份,一份用于傳統(tǒng)化學(xué)分析方法,即重鉻酸鉀加熱法,對(duì)土壤有機(jī)碳含量進(jìn)行測(cè)定;另一部分用于光譜采集。
光譜測(cè)定采用美國(guó)ASD公司生產(chǎn)的FieldSpec 4 Hi-Res NG光譜儀,光譜儀的波長(zhǎng)范圍為350—2500 nm,光譜分辨率在700 nm為3 nm,在1400 nm/2500 nm為6 nm。光譜掃描時(shí)間為100 ms。將土壤樣品放置于培養(yǎng)皿內(nèi),并用玻璃片將土壤表面壓平,光譜測(cè)定時(shí)培養(yǎng)皿內(nèi)土壤厚度為1.7 cm。光譜測(cè)量在暗室環(huán)境中進(jìn)行,視角探頭為25°,每個(gè)土壤樣品測(cè)定前進(jìn)行白板校正。每個(gè)土壤樣品測(cè)定30次(每測(cè)量10次將土壤樣品旋轉(zhuǎn)90°),取30次反射率平均值得到該土壤樣品反射率[22]。
由于在土壤光譜采集過程中,受到周圍環(huán)境的影響,測(cè)得的光譜常常存在隨機(jī)噪聲,從而影響重要信息的提取,進(jìn)一步影響預(yù)測(cè)模型的準(zhǔn)確性,所以需對(duì)采集的土壤光譜進(jìn)行預(yù)處理。本文采用Savitaky-Golay對(duì)原始光譜數(shù)據(jù)進(jìn)行平滑處理,再通過不同方法進(jìn)行預(yù)處理,包括log(1/R)、Der1、Der2、SNV和MSC。
校正集和驗(yàn)證集的劃分,對(duì)模型的建立有著重要意義[23]。本研究采用3種算法劃分校正集和驗(yàn)證集:KS算法,RS算法和SPXY算法。3種算法劃分校正集和驗(yàn)證集數(shù)目比為2:1,校正集樣本數(shù)量為56個(gè),用于建立模型;驗(yàn)證集樣本為28個(gè),用于檢驗(yàn)?zāi)P皖A(yù)測(cè)效果。KS算法是通過各樣本值之間的歐式距離,選擇與其他所有樣本中最大距離的樣本,并在此基礎(chǔ)上,選擇離此樣本最遠(yuǎn)距離的樣本,重復(fù)以上步驟達(dá)到初始設(shè)定的樣本數(shù)后停止[24]。RS算法是隨機(jī)選擇所設(shè)定數(shù)量的樣本組成校正集和驗(yàn)證集。SPXY方法是KS方法基礎(chǔ)上提出的基于聯(lián)合X-Y距離的樣本劃分方法,充分考慮了X和Y的空間可變性[25]。
1.5.1siPLS模型
偏最小二乘模型(Partial Least Squares, PLS)是最常用的一種多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它是結(jié)合了多元線性回歸分析、相關(guān)性分析和主成分分析的優(yōu)勢(shì)而成的一種統(tǒng)計(jì)學(xué)方法。組合間隔偏最小二乘(siPLS)是將整個(gè)光譜波段平均分成n個(gè)等間隔區(qū)間,然后計(jì)算所有的兩個(gè)、三個(gè)或四個(gè)區(qū)間模型組合,根據(jù)每個(gè)可能的模型組合進(jìn)行PLS建模,當(dāng)交互驗(yàn)證均方根誤差值最小時(shí),該組合被認(rèn)定為最優(yōu)波段進(jìn)行建模[26-27]。siPLS模型通過選擇合適的區(qū)間來消除無關(guān)噪聲,可以提高模型的精度。
1.5.2GA-SVM模型
支持向量機(jī)(Support vector machine, SVM)是Vapnik在1992年發(fā)明的一種基于統(tǒng)計(jì)學(xué)理論的機(jī)器學(xué)習(xí)算法,它是一種二分類模型,基本原理是尋找一個(gè)最優(yōu)超平面,使其分開的兩類型具有最大間隔。遺傳算法(Genetic Algorithm, GA)是模擬達(dá)爾文生物進(jìn)化論的一種計(jì)算方法,通過模擬自然選擇過程來搜索最優(yōu)解[28-29]。在SVM模型中,SVM模型性能的好壞取決于懲罰參數(shù)c和核函數(shù)半徑g的取值,通過使用GA算法進(jìn)行最優(yōu)參數(shù)搜索,進(jìn)而提高SVM模型的預(yù)測(cè)精度[30]。
1.5.3RF模型
隨機(jī)森林(Random Forest, RF)模型是一種從分類回歸樹(Classification and Regression Tree, CART)算法發(fā)展而來的機(jī)器學(xué)習(xí)方法。RF模型原理是隨機(jī)有放回地選取樣本并對(duì)其構(gòu)建多棵決策樹,隨后將多棵決策樹生成森林,然后通過計(jì)算各個(gè)決策樹預(yù)測(cè)值求平均作為最終結(jié)果[31]。RF模型解決了CART算法的過度擬合問題,提高了模型的預(yù)測(cè)精度。與大多數(shù)的機(jī)器學(xué)習(xí)方法不同,RF只需要設(shè)置決策樹數(shù)目(Ntree)和節(jié)點(diǎn)特征數(shù)(Mtry)就可以生成預(yù)測(cè)模型。
1.5.4模型驗(yàn)證
本文采用決定系數(shù)(Correlation coefficient,R2),校正集均方根誤差(Root Mean Square Error of Cross Validation, RMSECV),驗(yàn)證集均方根誤差(Root Mean Square Error of Prediction, RMSEP)和相對(duì)分析誤差(Residual Predictive Deviation, RPD),對(duì)建立的模型進(jìn)行性能評(píng)價(jià)。其計(jì)算公式如下:
(1)
(2)
(3)
(4)
模型的建立以及驗(yàn)證等計(jì)算程序在MATLAB R2018a中進(jìn)行,圖標(biāo)制作與數(shù)據(jù)統(tǒng)計(jì)在Origin和Excel中完成。
2結(jié)果與分析
2.1生物炭對(duì)土壤有機(jī)碳的影響
許多研究表明,農(nóng)田中施加生物炭可以提高SOC的含量。不同生物炭添加量處理的土壤有機(jī)碳含量如圖1所示。與未施加生物炭BC0相比,BC2和BC3顯著地增加了SOC含量,且BC3處理顯著高于BC2處理(2018年11月20日樣品除外)。BC1在各個(gè)時(shí)間段與BC0并無顯著性差異,這是因?yàn)樯锾刻砑恿勘容^低,不足以引起SOC含量的顯著變化。本研究結(jié)果表明,添加生物炭促進(jìn)土壤中SOC含量的增加,并隨其添加量的增加而增加,可能因?yàn)樯锾勘旧砗泻芨叩奶己?且具有高度穩(wěn)定的芳香化結(jié)構(gòu),施入土壤多年后仍然保持一定的理化和生物穩(wěn)定性。這與許多研究結(jié)果相一致[32-33]。
圖1 不同生物炭添加量處理土壤有機(jī)碳含量Fig.1 Soil organic carbon content with different amounts of biocharCK:無施肥,No fertilizer;BC0:施肥,Chemical fertilizer;BC1:施肥+7.5 t/hm2生物炭,Chemical fertilizer+7.5 t/hm2 Biochar;BC2:施肥+15 t/hm2生物炭,Chemical fertilizer+15 t/hm2 Biochar;BC3:施肥+22.5 t/hm2生物炭,Chemical fertilizer+22.5 t/hm2 Biochar
圖2 不同處理下土壤光譜曲線Fig.2 Soil spectra at different biochar amounts treatment
通過計(jì)算各處理的土壤光譜反射率的平均值,比較各處理下土壤反射率變化。由圖2可知,SOC含量越大,反射率越小,但土壤反射率總體趨勢(shì)相似,基本呈上升拋物線型。在400—780 nm的斜率較陡,土壤反射率增加較快;而在780—2120 nm的斜率較緩,土壤反射率增加較慢。2120 nm之后,土壤反射率有略微下降的趨勢(shì)。在1410、1920、2200 nm附近存在明顯的吸收谷,這是由于在1410 nm波段和1920 nm波段主要為水分吸收帶,通常認(rèn)為這與OH—基團(tuán)和水分子振動(dòng)有關(guān);2200 nm波段附近存在Al—OH礦物吸收帶,表明高嶺石和其他硅酸鹽存在[34-35]。
表1 siPLS模型精度評(píng)價(jià)
表2 GA-SVM模型精度評(píng)價(jià)
表3 RF模型精度評(píng)價(jià)
圖3 siPLS最優(yōu)模型精度評(píng)價(jià)Fig.3 Accuracy evaluation of optimal siPLS model
圖4 GA-SVM最優(yōu)模型精度評(píng)價(jià)Fig.4 Accuracy evaluation of optimal GA-SVM model
圖5 RF最優(yōu)模型精度評(píng)價(jià)Fig.5 Accuracy evaluation of optimal RF model
表4 不同樣本選擇方法的SG+MSC方法模型精度評(píng)價(jià)
不同光譜預(yù)理方法的選擇影響著模型的預(yù)測(cè)性能,選擇合適的預(yù)處理方法可以消除噪聲、提取有效信息并且提高模型的性能[37],而不合適的方法則會(huì)放大噪聲并且使模型性能惡化。本文不同種預(yù)測(cè)模型的結(jié)果中顯示,未經(jīng)過預(yù)處理的光譜模型預(yù)測(cè)效果普遍較好,可能由于測(cè)定土壤光譜時(shí),測(cè)定的土壤粒度較小(100目)。前期研究表明土壤粒度對(duì)反射率的影響較大,并且對(duì)土壤模型的預(yù)測(cè)精度也有很大影響,土壤粒度較大的模型其預(yù)測(cè)標(biāo)準(zhǔn)誤差遠(yuǎn)高于粒度較小的模型[38]。Kooistra等[39]通過研究萊茵河漫灘土壤預(yù)測(cè)鋅和鎘濃度,也得到了未經(jīng)過預(yù)處理的模型對(duì)鋅和鎘的預(yù)測(cè)效果最好。而二階導(dǎo)數(shù)處理過的光譜模型效果不好的原因可能是二階導(dǎo)數(shù)對(duì)光譜進(jìn)行預(yù)處理時(shí),放大了噪聲,未能提取較為有效的信息[40]。但也有許多研究表明,二階導(dǎo)數(shù)處理改進(jìn)了SOC預(yù)測(cè)模型[41-42]。因此,對(duì)于含生物炭土壤的SOC模型構(gòu)建還仍需進(jìn)一步的研究。
然而,無論使用何種預(yù)處理方法,選擇具有代表性的樣本集對(duì)于模型構(gòu)建起著重要作用[43],代表性樣本可以提高模型的預(yù)測(cè)精度,加快模型的模擬預(yù)測(cè)并且有助于后期的改進(jìn)[44]。陳亦云等[45]研究發(fā)現(xiàn),在有機(jī)碳的預(yù)測(cè)過程中,不同的樣本集構(gòu)建方法對(duì)模型的精度有著不同的影響。SPXY方法是對(duì)KS方法的改進(jìn)[25],但是在本研究結(jié)果中模型性能并沒有得到提升,可能是由于土壤中影響因素過多,使SOC光譜信息被掩蓋[46]。彭杰等[46]對(duì)不同氧化鐵和有機(jī)質(zhì)含量的土壤進(jìn)行研究時(shí),發(fā)現(xiàn)當(dāng)氧化鐵與有機(jī)質(zhì)的比例大于2.21時(shí),土壤中的氧化鐵會(huì)完全遮蓋有機(jī)質(zhì)光譜特征。而由于RS方法選取的樣本具有隨機(jī)性,并不能代表整個(gè)樣本集,所以構(gòu)建的模型并不準(zhǔn)確。也有學(xué)者認(rèn)為樣本集的大小也起著至關(guān)重要的作用——當(dāng)樣本量較少時(shí),樣本選擇方法起著主要作用;當(dāng)樣本量較大時(shí),樣本集的大小相較于方法更為關(guān)鍵[47]。未來可以對(duì)不同比例樣本集進(jìn)行研究,提升模型的預(yù)測(cè)精度。
在本研究表明,土壤光譜最優(yōu)模型能夠較好地預(yù)測(cè)施用生物炭后土壤SOC含量,但土壤光譜數(shù)據(jù)是基于實(shí)驗(yàn)室暗室環(huán)境中測(cè)量獲得的,而在實(shí)際野外應(yīng)用中,影響土壤光譜的環(huán)境因素復(fù)雜繁多,因此需要考慮各種環(huán)境因素對(duì)土壤光譜及預(yù)測(cè)模型的綜合影響。