張黎黎 呂霞
摘要:葉綠素含量是反映作物生長(zhǎng)狀態(tài)及產(chǎn)量的重要指標(biāo)。高光譜技術(shù)是近年來(lái)較為常見(jiàn)的檢測(cè)作物生物量的方法之一,但高光譜數(shù)據(jù)直接建模分析復(fù)雜度增大。提出一種基于Gram-Schmidt的降維方法,對(duì)以PROSPECT模型模擬數(shù)據(jù)作為建模集的光譜進(jìn)行Gram-Schmidt變換,找到投影空間構(gòu)造主基底,實(shí)現(xiàn)高光譜降維,建立光譜與葉綠素含量之間的模型,將實(shí)際測(cè)量的數(shù)據(jù)作為驗(yàn)證集?;贕ram-Schmidt的降維方法可降低維度到5維,交叉驗(yàn)證結(jié)果R2為0.775,MSE為0.062,通過(guò)與主成分分析法進(jìn)行對(duì)比證明了該方法的有效性。研究結(jié)果對(duì)植物葉片的葉綠素含量估測(cè)與高光譜降維具有重要意義。
關(guān)鍵詞:葉綠素;Gram-Schmidt算法;PROSPECT模型;光譜分析
中圖分類號(hào):S127? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? 文章編號(hào):1674-1161(2021)05-0023-03
高光譜技術(shù)通過(guò)光學(xué)傳感器采集作物光譜反射率高光譜數(shù)據(jù)進(jìn)行各參量的反演,能夠?qū)崿F(xiàn)作物快速、高效、經(jīng)濟(jì)的長(zhǎng)勢(shì)監(jiān)測(cè)和營(yíng)養(yǎng)診斷。但高光譜數(shù)據(jù)為高維矢量,直接建模分析會(huì)加大復(fù)雜度。Gram-Schmidt正交算法能夠降低高光譜維度,為敏感診斷參數(shù)提供支持。葉綠素是植物進(jìn)行光合作用時(shí)所需的主要色素,利用遙感手段快速及時(shí)地監(jiān)測(cè)作物的葉綠素含量對(duì)于作物的長(zhǎng)勢(shì)及產(chǎn)量估算起到重要作用。本課題以遼寧地區(qū)粳稻為研究對(duì)象,基于正交變換理論探索高光譜數(shù)據(jù)降維方法,構(gòu)建水稻葉片葉綠素含量估測(cè)模型,為水稻長(zhǎng)勢(shì)狀態(tài)監(jiān)測(cè)提供依據(jù)。
1 材料與方法
1.1 PROSPECT模擬數(shù)據(jù)設(shè)置
PROSPECT模型是能夠基本模擬植物葉片光譜反射情況的有效模型,在遙感研究中得到廣泛應(yīng)用。將遼寧地區(qū)水稻生化參數(shù)帶入該模型,模擬葉片光譜反射率,作為試驗(yàn)對(duì)象。數(shù)據(jù)集中各參量在取值范圍內(nèi)產(chǎn)生600個(gè)服從均勻分布的隨機(jī)數(shù),通過(guò)PROSPECT模型得到600條400~2 500 nm葉片模擬反射率。根據(jù)遼寧地區(qū)2010—2020年不同品種水稻葉片生化參量含量的統(tǒng)計(jì)數(shù)據(jù),設(shè)置PROSPECT模型關(guān)鍵參數(shù)取值范圍為:葉綠素含量33.45~75.61 μg/cm2、類胡蘿卜素含量6.88~17.44 μg/cm2、葉片結(jié)構(gòu)參數(shù)1.5~3.0、等效水厚度0.006 4~0.011 9 cm、干物質(zhì)含量0.003 7~0.072 0 g/cm2、褐色素含量0 μg/cm2。
1.2 水稻葉片光譜測(cè)定及葉綠素含量測(cè)定
在模擬水稻光譜反射率數(shù)據(jù)的同時(shí),也需要實(shí)際采集水稻葉片數(shù)據(jù)。試驗(yàn)地點(diǎn)位于遼寧盤錦興隆臺(tái)地區(qū),水稻品種為龍稻20,樣本數(shù)為240個(gè),采樣時(shí)間為2020年8月16日10∶00—14∶00。葉片光譜測(cè)定使用ASD FieldSpec Handheld 2便攜式光譜儀,測(cè)定時(shí)夾取每株樣本2個(gè)葉片的葉脈兩側(cè)部分,共測(cè)4次,取平均值獲取數(shù)據(jù)。然后立即將測(cè)定光譜部分剪下,稱取0.2 g葉肉組織作為樣品進(jìn)行葉綠素含量測(cè)定。樣品中加入95%乙醇及少量石英砂研磨成勻漿,倒入50 mL錐形瓶中滴定,置于避光環(huán)境下靜置沉淀48 h,直至葉片組織發(fā)白,使用UV2450型紫外可見(jiàn)光分光光度計(jì)測(cè)量665,649和470 nm波長(zhǎng)處的消光度D值,代入公式,計(jì)算葉綠素a和葉綠素b的含量。
Ca=13.95×D665-6.88×D649? ? ? ? ? ? ? ? (1)
Cb=24.99×D649-6.88×D665? ? ? ? ? ? ? ? (2)
色素含量= ? ? ? ? ? ? ? ? (3)
式中:C為色素濃度,mg/L;V為色素提取液體積,mL;F為葉片樣本鮮質(zhì)量,g。
1.3 Gram-Schimidt正交變換算法原理及改進(jìn)
Gram-Schmidt正交變換算法能夠?qū)⑷我饩€性無(wú)關(guān)向量組變換成為正交向量集合。算法原理步驟如下:
設(shè)自變量X和因變量Y,
1) 自變量X=[x1,x2,…,xn]經(jīng)過(guò)Gram-Schmidt正交變換,轉(zhuǎn)換成為正交集合,即
Xp×n=H×C? ? ? ? ? ? ? ? ? ? ? (4)
2) 構(gòu)造H,即
hs=xs-(s=2,…,q,q 選擇h1= xk,使得r2(xk,xj)= r2(xi,xj);為了方便起見(jiàn),這里設(shè)k=1,即h1= x1;q為降維后的維數(shù);H=[h1,h2,…,hq]。 應(yīng)用正交投影變換后,Schmidt變量h1,h2,…,hq的方差是按照遞減順序排列的,即Var(h1)≥Var(h2)≥…≥Var(hq)>0,當(dāng)出現(xiàn)Var(hq+1)小于某個(gè)閾值時(shí),其所提供的降維影響力的凈信息較少,停止計(jì)算。此時(shí)得到的h1,h2,…,hq均為基向量,其所對(duì)應(yīng)的關(guān)聯(lián)變量即為篩選出來(lái)的最簡(jiǎn)變量集合(即基向量矩陣H)。 3) 求C,即 C= (6) rjk=(j=2,3,…,s;k=1,2,…s-1)? ? ? ?(7) X為可逆矩陣,則可得 C′(n×q)=X′(n×q)×H(p×q)? ? ? ? ? ? ? ? ? (8) 4) 假設(shè)Y與Gram-Schmidt變量C具有線性關(guān)系,則線性回歸方程為 Y′(n×1)=C′(n×q)×β(q×1)? ? ? (9) 式中:β為回歸系數(shù)。 將該方法應(yīng)用于綠色植物光譜數(shù)據(jù)分析并加以改進(jìn):1) 為減少綠色植物光譜特殊情況的影響,構(gòu)建基向量時(shí)將建模樣本的平均值作為H的h1,相應(yīng)地閾值需要根據(jù)情況進(jìn)行改變;2) 由于大部分情況下光譜數(shù)據(jù)X中p(光譜波段數(shù))遠(yuǎn)大于n(樣本數(shù)),因此需要將X進(jìn)行分組,將p分為若干部分,這樣不僅可以避免因p值明顯小于n值而無(wú)法使用算法,還可以在每個(gè)部分選出“最重要變量”(即該范圍內(nèi)最具代表性的綠色植被光譜)作為基向量,而不是直接利用某一樣本的譜線。 2 結(jié)果與分析 2.1 光譜數(shù)據(jù)獲取預(yù)處理 葉片光譜反射率(PROSPECT模擬值和實(shí)測(cè)值)如圖1所示。 由圖1可以看出:PROSPECT模型模擬得到的曲線和實(shí)際測(cè)定得到的光譜曲線趨勢(shì)變化一致。PROSPECT模型在各參數(shù)范圍內(nèi)隨機(jī)模擬600個(gè)樣本(建模集),實(shí)際測(cè)量情況下采集240個(gè)樣本(驗(yàn)證集),剔除傳感器邊界數(shù)據(jù)后均獲取各葉片樣本400~800 nm波段光譜反射率(分辨率為1 nm)及對(duì)應(yīng)的葉綠素含量,作為構(gòu)建和驗(yàn)證基向量矩陣、建立估測(cè)葉綠素含量的建模集和驗(yàn)證集數(shù)據(jù)。觀察反射率情況可知:400~500 nm波段、600~700 nm波段對(duì)應(yīng)的強(qiáng)吸收帶和550 nm對(duì)應(yīng)的強(qiáng)反射帶,以及700~750 nm波段反射率急劇上升情況表明模擬后的水稻葉片光譜曲線符合典型植被光譜曲線特征。 2.2 Gram-Schmidt算法降低數(shù)據(jù)維度 2.2.1 觀測(cè)窗寬度設(shè)置 以光譜波段為分割對(duì)象,分割后的每個(gè)部分視為“觀測(cè)窗”。在“窗”中隨機(jī)將一個(gè)樣本作為貢獻(xiàn)最大的基向量,然后將所有向量向這個(gè)基向量投影,去掉共性構(gòu)成基向量矩陣。利用不同觀測(cè)窗長(zhǎng)度分割方法處理建模集的400~800 nm葉片光譜反射率數(shù)據(jù)(見(jiàn)表1),與各自葉綠素含量建立線性回歸模型,得到不同基向量長(zhǎng)度條件下的建模精度,設(shè)置選擇基向量閾值為0.02。利用決定系數(shù)R2和均方誤差MSE來(lái)判定模型精度,并采用五折交叉驗(yàn)證法(5-Cross-validation)計(jì)算驗(yàn)證集誤差。 2.2.2 影響葉片葉綠素含量的重要波段 p值是判斷假設(shè)檢驗(yàn)結(jié)果的參數(shù),p<0.05表示提取信息對(duì)結(jié)果影響顯著。當(dāng)對(duì)建模集數(shù)據(jù)設(shè)置觀測(cè)窗長(zhǎng)度為320 nm時(shí),共得到6個(gè)基向量,其中基向量1,3,5的p值較小,說(shuō)明這3個(gè)基向量對(duì)結(jié)果準(zhǔn)確程度的影響占據(jù)較大比例,對(duì)應(yīng)的基向量光譜信息如圖2所示,優(yōu)選出4個(gè)葉綠素含量敏感波段分別為427,539,721和749 nm。以篩選的4個(gè)敏感波段為輸入,構(gòu)建葉綠素線性回歸模型,得到反演精度CV-R2為0.775,CV-MSE為0.062。 3 結(jié)論 利用高光譜數(shù)據(jù)對(duì)水稻葉綠素含量進(jìn)行估測(cè),基于Gram-Schmidt的降維方法有效降低高光譜數(shù)據(jù)維度,且同時(shí)保留原始波段的信息,得到敏感波段。該方法改進(jìn)了傳統(tǒng)降維方法的不足之處,所建立的模型具有較高的預(yù)測(cè)精度,為植物葉片的葉綠素含量估測(cè)提供了新的路徑。 參考文獻(xiàn) [1] 黃文江,師越,董瑩瑩,等.作物病蟲害遙感監(jiān)測(cè)研究進(jìn)展與展望[J].智慧農(nóng)業(yè),2019(4):1-11. [2] 馮帥,許童羽,于豐華,等.基于無(wú)人機(jī)高光譜遙感的東北粳稻冠層葉片氮素含量反演方法研究[J].光譜學(xué)與光譜分析,2019,39(10):3 281-3 287. [3] 王浩云,曹雪蓮,孫云曉,等.基于光學(xué)特性參數(shù)反演的綠蘿葉綠素含量估測(cè)研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2021,52(3):202-209. [4] 曹英麗,肖文,江凱倫,等.基于分窗Gram-Schmidt高光譜降維的水稻紋枯病檢測(cè)[J].沈陽(yáng)農(nóng)業(yè)大學(xué)學(xué)報(bào),2019,50(6):713-721. Study on the Chlorophyll Content Estimation Method of Rice Leaves based on the PROSPECT Model ZHANG Lili1, L? Xia2 Abstract: Chlorophyll content is an important indicator to reflect the crop growth status and yield. Hyperspectral technology is one of the common methods to detect crop biomass in recent years, but the complexity of direct modeling and analysis of hyperspectral data increases. In this paper, a dimensionality reduction method based on Gram-Schmidt was proposed. The spectrums simulated by PROSPECT model were transformed by Gram-Schmidt, and the main basis was constructed in the projection space to achieve hyperspectral dimensionality reduction. The model between spectrum and chlorophyll content was established, and the measured data were used as the verification set. The dimensionality reduction method based on Gram-Schmidt can reduce the dimensionality to 5 dimensions, and the cross validation result R2 is 0.775 and MSE is 0.062. The effectiveness of this method is verified by comparing with principal component analysis method. The results are of great significance for estimating chlorophyll content and hyperspectral dimension reduction in plant leaves. Key words: chlorophyll; Gram-Schmidt algorithms; PROSPECT model; spectrum analysi