楊 超,邢艷秋,李俊明
(東北林業(yè)大學(xué)森林作業(yè)與環(huán)境研究中心,哈爾濱 150040)
土壤氮素是植物生長所必須的營養(yǎng)元素,直接影響著植物的生產(chǎn)發(fā)育,是土壤肥力的重要指標(biāo)之一。傳統(tǒng)的土壤全氮含量測定由于耗時、低效、成本高并且時效性差等缺點,難以滿足當(dāng)前大區(qū)域快速監(jiān)測的需求。而近紅外光譜分析技術(shù)的出現(xiàn)和發(fā)展,被證明可以在土壤全氮含量實時快速測定方面具有巨大潛力[1-2]。于飛建[3]等采用一階導(dǎo)數(shù)結(jié)合偏最小二乘法估測土壤全氮含量,模型精度達到0.88。張娟娟[4]等研究了我國不同地區(qū)主要類型土壤全氮含量與近紅外光譜之間的關(guān)系,結(jié)果表明,采用Norris濾波平滑后的一階導(dǎo)數(shù)光譜建立估算模型能有效估算土壤全氮含量。黃明祥[5]等對不同濾波器去噪效果進行定量評價,通過對比發(fā)現(xiàn)小波去噪既能達到曲線平滑又能較好地保證波段特征。以上研究表明,采用近紅外光譜技術(shù)估測土壤全氮含量是可行的,但是上述研究在進行光譜預(yù)處理的時候,并沒有考慮到濃度對光譜的影響,在濾澡過程中同時會損失部分與待測品質(zhì)相關(guān)的光譜信息[6]。而正交信號校正 (Orthogonal Signal Correc-tion,OSC)方法在進行光譜與處理時,卻能很好地消除光譜矩陣中一些與待測品質(zhì)無關(guān)的噪聲信號,從而達到提高預(yù)測模型的需求。
本研究以松嫩平原不同類型土壤全氮含量為研究對象,采用近紅外光譜技術(shù),結(jié)合正交信號校正預(yù)處理方法,對土壤全氮進行估測,從而為提高近紅外光譜反演土壤全氮含量精度提供方法支持。
本研究試驗區(qū)為松嫩平原齊齊哈爾和綏化地區(qū),共采集鹽堿地、農(nóng)田以及林地樣本228個,采樣深度0~20 cm。土壤樣品經(jīng)過風(fēng)干、研磨后,分別過20目和100目篩,20目篩樣品進行光譜分析,100目篩樣品采用半微量凱氏定氮法進行土壤全氮含量測定。
本研究使用美國ASD公司生產(chǎn)的FieldSpec3系列野外便攜式地物波譜儀進行光譜測定。光譜范圍為350~2 500 nm,在350 nm到1 050 nm處采樣間隔是1.4 nm,1 000 nm到2 500 nm區(qū)間采樣間隔為2 nm,重采樣間隔1 nm。測定光譜時,光源使用鎢燈,鎢燈與法線成15度角照射土壤樣本,光學(xué)纖維探頭以距樣品表面10 cm高處垂直于樣品進行光譜采集。采集時,盡量使土壤樣本表面平整,并旋轉(zhuǎn)樣本,共采集10次,求其平均值。每采集3個樣本光譜,進行反射白板校正1次。
在采集近紅外光譜信息的過程中,除了樣品本身的光譜性質(zhì)的影響外,導(dǎo)致近紅外光譜基線漂移和光譜不重復(fù)的因素中往往還包含一些與待測樣品性質(zhì)無關(guān)的因素。為盡可能獲得準(zhǔn)確的光譜信息,在進行光譜分析前,對原始光譜進行預(yù)處理分析,消除與樣品本身信息無關(guān)的噪聲非常必要。本研究擬采用平滑、多元散射校正 (MSC)以及OSC方法對原始光譜進行預(yù)處理。其中平滑可以很好的降低隨機噪聲,而MSC可以有效的消除由于樣本表面不均勻等引起的散射影響。基于正交投影的政教信號校正由S.Wold1998年作為一種光譜過濾方法提出[7]。該方法的基本思想是濾除原始光譜矩陣X中與待測品質(zhì)Y不相關(guān)的部分信號。以上數(shù)據(jù)分析均在Unscrambler V9.5和matlab7.0中實現(xiàn)。
OSC具體算法如下:
(1)將原始光譜矩陣X與濃度矩陣Y進行標(biāo)準(zhǔn)化。
(2)對于Y正交的主成分t賦值。
(3)計算tnew=(1 -Y(Y′Y) -1Y′)t,特征向量ω=X-tnew。
(4)根據(jù)新計算得到的X、ω計算正交主成分t,t=Xω。
(5)檢驗收斂性,如果‖t-told‖/‖t‖<10-6,收斂轉(zhuǎn)到 (6),否則返回 (3)。
(6)計算載荷向量,p′=t′X/(t tnew)。
(7)從X中減去與Y正交的部分,E=X-t p′。
(8)將E作為新的X,計算新的與X正交的主成分,直到合適為止,通常只需兩個正交主成分便可達到良好的精度。
(9)將經(jīng)過正交信號校正的光譜矩陣X作為新矩陣,建立模型。
(10)未知樣品的預(yù)測,同樣要經(jīng)過正交信號校正,利用最后得到的殘差向量e,根據(jù)校正模型即可對未知樣品進行預(yù)測。
本研究采用偏最小二乘法建立土壤全氮含量反演模型,利用交叉驗證和外部驗證相結(jié)合對模型進行評價,評價指標(biāo)為決定系數(shù)R2和均方根誤差RMSEV。其中,228個樣本中隨機抽取150個樣本作為校正集,用于反演模型建立和交叉驗證;其余78個樣本作為外部驗證集對反演模型進行評價。模型的建立與評價研究在matlab7.0中實現(xiàn)。
表1為不同類型土壤樣本全氮含量統(tǒng)計值。由表1可以看出,土壤全氮含量在農(nóng)田、林地及鹽堿地中有較大差異,變化幅度較大,有利于模型的建立。其中林地土壤含氮量最好,農(nóng)田次之,鹽堿地土壤全氮含量最低。圖1為不同類型土壤樣本光譜數(shù)據(jù),可以看出,所有樣本在1 900 nm處均有一個大的水分吸收峰,樣本反射率大小順序依次為鹽堿地>農(nóng)田>林地,這主要因為林地土壤含有豐富的腐殖質(zhì)顏色較深,吸光度較大,從而反射率較低,而鹽堿地土壤顏色較淺反射率高。同時,在1 000 nm處產(chǎn)生一個小的階躍,主要是由于光譜儀器自身350~1 000 nm段所使用的探測器與1 000~2 500 nm段使用的探測器類型不同造成的。
表1 土壤全氮測定結(jié)果Tab.1 Measurements of the soil total nitrogen g·kg-1
圖1 不同類型土壤樣本光譜Fig.1 Original near infrared spectra of the different types of soil
為了比較不同預(yù)處理方法的建模效果,本研究對原始光譜分別采用平滑、平滑+MSC、平滑+MSC+OSC等方法進行建模前降噪處理,結(jié)合偏最小二乘法進行建模。結(jié)果見表2。其中以采用平滑+MSC+OSC方法對原始光譜進行預(yù)處理,主因子個數(shù)為4時,建模精度最高,決定系數(shù)R2為0.990 1,均方根誤差為0.297 5;直接采用原始光譜進行建模,效果不理想,決定系數(shù)R2為0.672 0,均方根誤差為0.421 5。說明OSC可以有效的去除與濃度陣無關(guān)的光譜信息,提高了預(yù)測模型的精度。因此,可以看出選擇合適的預(yù)處理方法對提高土壤全氮近紅外光譜預(yù)測模型的精度非常必要,平滑+MSC+OSC預(yù)處理方法可以滿足預(yù)測模型的要求。
表2 不同光譜預(yù)處理方法的PLS模型內(nèi)部交叉驗證結(jié)果Tab.2 Internal cross-validation results of different pretreatment methods
表3為不同OSC因子個數(shù)結(jié)合PLS建模結(jié)果??梢钥闯?,原始光譜建立的PLS模型交叉驗證決定系數(shù)為0.672 0,均方根誤差為0.421 5,外部驗證決定系數(shù)為0.712 6,均方根誤差為0.398 2,建立PLS模型時主因子個數(shù)為13,不僅模型比較復(fù)雜精度較低,并且模型不是很穩(wěn)定。當(dāng)OSC因子個數(shù)為6時建立的PLS模型,模型主因子個數(shù)為4,模型精練,內(nèi)部交叉驗證決定系數(shù)和均方根誤差分別為0.990 1和0.297 5,外部驗證決定系數(shù)和均方根誤差分別為0.926 1和0.283 6,模型精度很高,并具有很高的穩(wěn)定性。對原始光譜進行OSC校正時,隨著OSC因子個數(shù)的增加,預(yù)測模型的精度有所提高。
表3 不同OSC因子個數(shù)建模結(jié)果Tab.3 Modeling results for different number of OSC factors
偏最小二乘法PLS是進行光譜多元定量校正時最常用的一種方法,在建模過程中集中了典型相關(guān)分析、主成分分析和線性回歸分析的工作特點[8-10]。本研究采用偏最小二乘法建立土壤全氮近紅外光譜預(yù)測模型。圖2(a)和圖2(b)分別為預(yù)測模型內(nèi)部交叉驗證和外部驗證結(jié)果,采用平滑+MSC+OSC方法對光譜進行預(yù)處理,OSC因子個數(shù)和PLS主因子個數(shù)分別為6和4,相關(guān)系數(shù)R2較大分別為0.990 1和0.926 1,說明光譜陣與濃度陣相關(guān)性強,均方根誤差較小分別為0.297 5和0.283 6。這表明通過結(jié)合OSC和PLS法建立土壤全氮近紅外光譜預(yù)測模型預(yù)測精度較高,穩(wěn)定性強。
圖2 模型交叉驗證結(jié)果Fig.2 Model validation results
土壤的反射光譜包含了極其豐富的土壤信息,是土壤性狀的綜合體現(xiàn),常用的預(yù)處理方法都有一定的局限性,可能導(dǎo)致土壤反射光譜信息冗余或者缺失。本研究采集了松嫩平原不同類型土壤樣本,采用OSC法對土壤近紅外光譜進行預(yù)處理,結(jié)合偏最小二乘法建立了土壤全氮含量的估測模型,利用交叉驗證和外部驗證相結(jié)合的方法對模型進行評價分析。結(jié)果顯示,不同的預(yù)處理方法對建模結(jié)果影響較大,其中采用平滑+MSC+OSC對光譜進行預(yù)處理,建模結(jié)果最優(yōu),內(nèi)部交叉驗證決定系數(shù)和均方根誤差分別為0.990 1和0.297 5,外部驗證決定系數(shù)和均方根誤差分別為0.926 1和0.283 6??傮w看來,OSC可以很好的去除光譜陣中與濃度陣無關(guān)的噪聲信號,并且隨著OSC因子個數(shù)的增加,PLS模型的精度有所提高,當(dāng)OSC因子和PLS主因子個數(shù)分別為6和4時,模型精度最高,穩(wěn)定性最強。因此,不同預(yù)處理方法近紅外估測模型的建立影響較大,采用正交信號校正結(jié)合偏最小二乘方法建立土壤全氮近紅外光譜預(yù)測模型時可行的,可以簡化PLS模型,并且精度穩(wěn)定性較高。
【參 考 文 獻】
[1]Bendor E,Banin A.Near-infrared analysis as a rapid method to simultaneously evaluate several soil properties[J].Soil Science Society of America Journal,1995,59:364-372.
[2]徐永明,藺啟忠,黃秀華,等.利用可見光/近紅外反射光譜估算土壤總氮含量的實驗研究[J].地理與地理信息科學(xué),2005,21(1):19-22.
[3]于飛健,閔順耕,巨曉棠,等.近紅外光譜法分析土壤中的有機質(zhì)和氮素[J].分析實驗室,2002,1(3):49 -51.
[4]張娟娟,田永超,姚 霞,等.基于高光譜的土壤全氮含量測定[J].自然資源學(xué)報,2011,26(5):881 -890.
[5]黃明祥,王 珂.土壤高光譜噪聲過濾評價研究[J].光譜學(xué)與光譜分析,2009,29(3):722 -755.
[6]趙杰文,張海東,劉木華.簡化蘋果糖度預(yù)測模型的近紅外光譜預(yù)處理方法[J].光學(xué)學(xué)報,2006,26(1):136 -140.
[7]Wold S,Antti H,Lindgren F,et al.Orthogonal signal correction of near-infrared spectra[J].Chemometrics and Intelligent Laboratory Systems,1998,44(1-2):175-185.
[8]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國防工業(yè)出版社,1999.
[9]高祥斌.森林土壤化學(xué)性質(zhì)與土壤酶活性典型相關(guān)分析[J].林業(yè)科技,2007,17(1):11 -13.
[10]周桂香,張文元,胡冬南,等.土壤有機碳影響因素及測定方法探討[J].江西林業(yè)科技,2011,21(6):31 -34.