王 璐,李偉凱,關(guān)海鷗,于 崧,侯玉龍
(1.黑龍江八一農(nóng)墾大學(xué) 電氣與信息學(xué)院,黑龍江 大慶 163319;2.東北農(nóng)業(yè)大學(xué) 電氣與信息學(xué)院,黑龍江 哈爾濱 150030;3.黑龍江八一農(nóng)墾大學(xué) 農(nóng)學(xué)院,黑龍江 大慶 163319)
葉綠素是植物營養(yǎng)脅迫、光合能力和衰老進(jìn)程階段的良好指示器[1].因此,通過獲取大豆葉片葉綠素含量對(duì)掌握大豆全育生長狀況的實(shí)時(shí)監(jiān)測(cè)具有重要指導(dǎo)意義.傳統(tǒng)檢測(cè)葉綠素主要使用化學(xué)試劑方法,其檢測(cè)方法不僅對(duì)農(nóng)作物有損,且存在操作過程復(fù)雜和操作時(shí)間長等缺點(diǎn)[2].目前實(shí)際研究和應(yīng)用中,常以葉片葉綠素相對(duì)含量(SPAD值)表征葉綠素含量.以往大多采用葉綠素測(cè)定儀來獲取農(nóng)作物SPAD值,但檢測(cè)方式普遍存在繁瑣、費(fèi)時(shí)等問題[3].近紅外光譜分析技術(shù)具有無損、簡(jiǎn)便和快速等優(yōu)勢(shì)[4-6],可為檢測(cè)農(nóng)作物葉片SPAD值提供一種新的手段.高明[7]利用近紅外光譜分析技術(shù)研究了冬小麥葉片葉綠素含量.周衍華[8]利用近紅外光譜技術(shù)對(duì)臍橙葉片的含氮量、含水量和葉綠素含量等3個(gè)生化參數(shù)指標(biāo)進(jìn)行定量模型研究.任配培[9]利用近紅外光譜技術(shù),檢測(cè)蘋果表皮葉綠素含量,對(duì)果實(shí)成熟度進(jìn)行快速無損檢測(cè).上述基于近紅外光譜技術(shù)對(duì)農(nóng)作物葉綠素含量進(jìn)行了檢測(cè)研究,但是大多數(shù)研究是以南方農(nóng)作物為研究對(duì)象,而以北方寒地農(nóng)作物為例,基于多維度光譜特征波長提取農(nóng)作物SPAD值估算模型的研究鮮有報(bào)道.
為此,通過以北方寒地農(nóng)作物中的大豆為例,應(yīng)用多種光譜特征波長段提取技術(shù),掌握全生育期大豆冠層近紅外光譜曲線特性,提出基于多維度光譜特征波長提取大豆冠層SPAD值估算模型.
試驗(yàn)設(shè)備為德國布魯克制造的近紅外光譜儀,波數(shù)范圍為11 542~3 946 cm-1,分辨率為8 cm-1,掃描次數(shù)為32次.試驗(yàn)樣本為采自黑龍江八一農(nóng)墾大學(xué)盆栽基地的270個(gè)健康大豆葉片樣本.大豆樣本近紅外光譜如圖1所示.按2 ∶1的比例劃分大豆冠層樣本集,選擇180個(gè)大豆樣本作為校正樣本和90個(gè)大豆樣本作為預(yù)測(cè)樣本[10].由圖1可知,由于光譜儀在測(cè)量范圍的兩端包含了較大的噪音,因此選擇全部樣本光譜的波長范圍為 990~2 452 nm(波數(shù)為10 105~4 078 cm-1),并進(jìn)行分析,采用多元散射校正方法(MSC)對(duì)近紅外光譜預(yù)處理,結(jié)果如圖2所示.
圖1 270個(gè)大豆樣本近紅外光譜波數(shù)-吸光度曲線
圖2 MSC預(yù)處理近紅外光譜波數(shù)-吸光度曲線
大豆樣本的SPAD值測(cè)定與近紅外光譜數(shù)據(jù)采集同步進(jìn)行,使用TYS-A型手持農(nóng)作物葉綠素測(cè)定儀.為了減小誤差,在大豆冠層每片葉子的中部選取均勻分布的3個(gè)點(diǎn)(避開葉脈),測(cè)量其SPAD值[11],然后計(jì)算平均值,并以此作為該樣本的SPAD值.每個(gè)大豆葉片測(cè)量的SPAD值與其近紅外光譜曲線相對(duì)應(yīng).
1.3.1競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法
采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法(CARS),通過計(jì)算交互驗(yàn)證均方根誤差(RMSECV),并選擇RMSECV最小值所對(duì)應(yīng)的波長變量子集,作為提取的大豆冠層光譜曲線的特征波長.
1.3.2主成分分析算法
采用主成分分析算法(PCA)提取大豆冠層光譜曲線的特征波長,選取能代表光譜特征的主成分用來代替多維大豆冠層光譜數(shù)據(jù)和提取SPAD值相關(guān)的權(quán)重較大的特征波長.
1.3.3連續(xù)投影算法
利用連續(xù)投影算法(SPA)對(duì)大豆冠層SPAD值進(jìn)行光譜波長最優(yōu)值的選擇,以投影向量最大的波長作為大豆冠層光譜曲線的待選波長,然后通過預(yù)測(cè)均方根誤差(RMSEP)提取最優(yōu)的特征波長數(shù)量,即檢測(cè)大豆冠層SPAD值最佳特征波長.
大豆冠層樣本的SPAD值的平均值、最大值、最小值和標(biāo)準(zhǔn)偏差見表1.
表1 大豆樣本SPAD值的描述性統(tǒng)計(jì)
針對(duì)大豆冠層多維光譜特性,對(duì)波長為990~2 452 nm的原始光譜波長-吸光度曲線進(jìn)行卷積平滑和多元散射校正預(yù)處理,并選擇偏最小二乘回歸(PLSR)和主成分回歸(PCR)作為建模方法.預(yù)處理方法結(jié)果如表2所示,其中RMSEC為校正均方根誤差,RMSEP為預(yù)測(cè)均方根誤差,rp為預(yù)測(cè)相關(guān)系數(shù).通過分析得到優(yōu)選的預(yù)處理和建模方法.
表2 SPAD值預(yù)測(cè)模型的預(yù)處理方法結(jié)果
由表2可知,采用PLSR建模檢測(cè)大豆冠層SPAD值的精度明顯優(yōu)于PCR建模;對(duì)原始光譜進(jìn)行卷積平滑處理后,再進(jìn)行建模,與未處理前的光譜建模效果相差較小;基于多元散射校正預(yù)處理后的PLSR建模效果較佳,該模型校正樣本和預(yù)測(cè)樣本均方根誤差分別為5.96和6.89,平均值約為6.43,預(yù)測(cè)相關(guān)系數(shù)較高.因此,對(duì)原始光譜優(yōu)選多元散射校正預(yù)處理和PLSR建模方法.
2.3.1競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法
選擇競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法(CARS)提取大豆冠層特征波長的變化過程如圖3 所示.圖3為波長數(shù)、交互驗(yàn)證均方根誤差(RMSECV)及回歸系數(shù)路徑r′與運(yùn)行次數(shù)關(guān)系曲線.由圖3波長數(shù)曲線可知,在采樣前期,大豆冠層光譜波長數(shù)量快速減少,隨著運(yùn)行次數(shù)增加,曲線逐漸平穩(wěn).
圖3 波長數(shù)、均方根誤差及回歸系數(shù)路徑與運(yùn)行次數(shù)關(guān)系曲線
由圖3的RMSECV曲線還可知,隨著運(yùn)行次數(shù)增加,曲線呈先緩慢下降、再快速上升的趨勢(shì),運(yùn)行次數(shù)為32次時(shí)RMSECV值達(dá)到最小,此時(shí)檢測(cè)SPAD值的模型精度較好.圖3中回歸系數(shù)路徑曲線為波長提取過程中各波長變量在每次采樣中的回歸系數(shù)路徑.因此,根據(jù)RMSECV值最小的原則,基于第32次采樣中獲得的子集定為與檢測(cè)大豆冠層SPAD值含量相關(guān)的重要變量子集,提取的22個(gè)特征波長見表3.
表3 通過CARS算法選擇的特征波長
2.3.2主成分分析算法
由于近紅外多維度光譜波長較多,可應(yīng)用主成分分析法計(jì)算主成分特征值、貢獻(xiàn)率及累積貢獻(xiàn)率,從而提取與SPAD值相關(guān)的權(quán)重較高的特征波長,其結(jié)果如表4所示.第1主成分的累積貢獻(xiàn)率為81.296%,小于85%;第2主成分的累積貢獻(xiàn)率為90.709%,因?yàn)榇笥?5%,且前兩個(gè)特征值均大于1,可看作基本包含了全部光譜的主要信息,所以選取前兩個(gè)主成分代替多維大豆冠層光譜,最后通過主成分分析法得到51個(gè)特征波長.
表4 主成分因子分析表
2.3.3連續(xù)投影算法
利用連續(xù)投影算法對(duì)檢測(cè)大豆冠層SPAD值的光譜波長進(jìn)行選擇,然后基于RMSEP值來確定最優(yōu)的特征波長數(shù)量,即檢測(cè)大豆冠層SPAD值的特征波長.
經(jīng)過分析,根據(jù)最小均方根誤差RMSEP=4.128 9,從1 464個(gè)波長點(diǎn)中提取大豆冠層光譜中的12個(gè)特征波長,如圖4所示.
圖4 SPA提取特征波長
為了構(gòu)建自動(dòng)檢測(cè)大豆葉片SPAD值的智能估算模型,并根據(jù)前面獲得的原始光譜經(jīng)多元散射校正預(yù)處理,利用PLSR建??梢垣@得較好結(jié)果前提下,在建模過程中選擇利用CARS,PCA和SPA等3種算法,將和SPAD值相關(guān)的權(quán)重比較大的光譜曲線特征波長提取出來,并和多元散射校正預(yù)處理后的光譜波長進(jìn)行比較.
由于多元線性回歸(MLR)具有分析特征波長光譜信息的特點(diǎn),因此后續(xù)可選取MLR和上一階段效果最好的PLSR建模方法,進(jìn)行基于多維度光譜特征波長提取大豆冠層SPAD值模型對(duì)比分析,從而選取檢測(cè)SPAD值效果最好的模型,結(jié)果如表5所示,其中r為相關(guān)系數(shù).
表5 檢測(cè)大豆SPAD值的各模型參數(shù)
分析表5中基于不同特征波長的PLSR建模方法的模型結(jié)果可知,CARS算法提取特征波長的數(shù)量較少,且相較于多元散射校正預(yù)處理后的光譜波長及采用PCA算法和SPA算法建立模型顯示的均方根誤差和相關(guān)系數(shù)都較好.還可看出CARS-PLSR模型中其預(yù)測(cè)相關(guān)系數(shù)從0.731 3增大到0.857 2,校正均方根誤差(RMSEC)從5.96減小到5.85,預(yù)測(cè)均方根誤差(RMSEP)從6.89減小到4.45,且選擇的特征波長數(shù)量從1 464個(gè)減少到22個(gè),可見CARS-PLSR模型效果較好.
分析基于不同特征波長的MLR建模方法的模型結(jié)果可知:其PCA算法提取的特征波長數(shù)量較多,校正集和預(yù)測(cè)集的均方根誤差和相關(guān)系數(shù)差異較大,且預(yù)測(cè)集的相關(guān)系數(shù)較小,預(yù)測(cè)均方根誤差(RMSEP)較大;用CARS算法和SPA算法提取特征波長數(shù)量較少,選用CARS算法構(gòu)建的模型中校正集和預(yù)測(cè)集的均方根誤差和相關(guān)系數(shù)差異較小;比較CARS-PLSR和CARS-MLR兩個(gè)模型可看出,CARS-MLR模型建立的校正集和預(yù)測(cè)集的相關(guān)參數(shù)差異較小,整體模型較穩(wěn)定.
因此,選擇CARS-MLR作為估算大豆冠層SPAD值的特征波長模型,在保證精度的前提下,大大簡(jiǎn)化了模型,提高了SPAD值的檢測(cè)效率.
CARS-MLR估算模型表述為
(1)
式中:y為大豆冠層SPAD值向量;x為提取的特征波長下對(duì)應(yīng)的吸光度值;β為回歸系數(shù);ζ為SPAD值智能估算模型的誤差;c為大豆冠層樣本個(gè)數(shù),個(gè);k為通過CARS算法提取的大豆冠層特征波長光譜的維度,維.
采用CARS-MLR,PCA-MLR和SPA-MLR模型,分別對(duì)估算的SPAD值預(yù)測(cè)效果進(jìn)行驗(yàn)證.圖5為3種模型估算SPAD值預(yù)測(cè)值與實(shí)測(cè)值的散點(diǎn)圖.
由圖5可知:采用CARS-MLR構(gòu)建SPAD值的智能估算模型的校正樣本和預(yù)測(cè)樣本均方根誤差分別為5.67和5.94,平均值約為5.81,模型效果較穩(wěn)定.因此,基于CARS-MLR模型能較好地檢測(cè)SPAD值,驗(yàn)證發(fā)現(xiàn)該模型檢測(cè)大豆冠層SPAD值是可行的.
圖5 3種模型估算SPAD值預(yù)測(cè)值與實(shí)測(cè)值的散點(diǎn)圖
1) 在采集大豆冠層光譜數(shù)據(jù)的基礎(chǔ)上,提出檢測(cè)大豆冠層SPAD值時(shí),優(yōu)選的多元散射校正預(yù)處理和偏最小二乘回歸建模方法,可為快速檢測(cè)大豆冠層SPAD值提供有效方法.
2) 采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法、主成分分析法和連續(xù)投影算法,分別得到能較準(zhǔn)確檢測(cè)大豆冠層SPAD值的最佳特征波長數(shù)量分別為22,51和12個(gè).
3) 將提取的特征波長作為新的輸入變量,通過對(duì)模型效果進(jìn)行綜合分析,提出了基于多維度光譜特征波長提取大豆冠層SPAD值的估算模型,該模型旨在為今后農(nóng)業(yè)生產(chǎn)中快速檢測(cè)葉片SPAD值提供參考方法.