朱玉晨, 王延倉, 李笑芳, 劉星宇, 顧曉鶴, 趙起超
1. 中國地質科學院水文地質環(huán)境地質研究所, 河北 石家莊 050061
2. 福建省水循環(huán)與生態(tài)地質過程重點實驗室, 福建 廈門 361000
3. 北華航天工業(yè)學院, 河北 廊坊 065000
4. 北京市農(nóng)林科學院信息技術研究中心, 北京 100097
5. 河北省航天遙感信息處理與應用協(xié)同創(chuàng)新中心, 河北 廊坊 065000
6. 廊坊師范學院, 河北 廊坊 065000
作為我國北方重要的糧食作物, 冬小麥能否正常生長發(fā)育直接關系到我國國家糧食安全[1], 而水分的正常供給是冬小麥健康生長發(fā)育的重要物質基礎。 實時、 快速、 準確獲取區(qū)域冬小麥植株水分供給信息具有重要的現(xiàn)實需求與理論價值[2-3]。 華北平原在3月至6月時段內, 地表溫度持續(xù)升高, 作物蒸騰作用不斷增強, 土壤-作物-大氣內的水汽交換速率加快, 冬小麥冠層頂部與大氣的水汽含量持續(xù)增高, 而水汽是野外光譜噪聲的重要來源, 這加劇了水汽對冬小麥冠層光譜信息的干擾作用, 進而增加了獲取冬小麥水分供給信息的難度。 故, 抑制噪聲干擾, 分離可用光譜信息對于提升冬小麥水分供給信息的檢測精度具有重要意義。
葉片是冬小麥植株進行光能吸收、 轉化、 固定的重要器官, 其含水量是評估冬小麥植株水分供給狀態(tài)的重要指標[4-5], 也是大田灌溉措施決策的基礎數(shù)據(jù)。 通過田間地面實驗監(jiān)測與輻射傳輸模型的定量分析確認了葉片含水量與其冠層光譜間具有較強的響應特征[6], 二者間存在較強的內在關聯(lián), 與冬小麥葉片含水量相關性較強的敏感波段多位于近紅外區(qū)域[7-8]; 基于模擬寬波段數(shù)據(jù)構建的植被指數(shù)可應用于冬小麥葉片含水量的估測[9-11]; 基于光譜技術冬小麥水分供給信息的估測正由適用于單一物候期冬小麥供給信息的估測向多生育期、 多年限的方向發(fā)展[12]; 針對冬小麥葉片含水量監(jiān)測的應用研究趨勢明顯, 然而, 由于外界不可控因素較多且復雜, 致使大田內采集的光譜數(shù)據(jù)內含大量無關噪聲, 而無關噪聲信息的增加會降低光譜的信噪比, 減弱光譜對冬小麥含水量的估測能力, 制約了遙感技術在檢測區(qū)域冬小麥水分供給信息中的應用, 無法及時為農(nóng)田的生產(chǎn)管理提供支撐。 因此, 可用光譜信息與噪聲信息的分離是提升光譜對冬小麥含水量估測能力的重要途徑; 然而當前少見針對野外光譜數(shù)據(jù)內可用光譜信息與噪聲信息分離的研究。
目前已有大量研究表明: 在離散小波算法下, 高頻信息在增強光譜數(shù)據(jù)信息信噪比、 敏感性、 模型精度與穩(wěn)定性等方面的優(yōu)勢明顯高于低頻信息, 且低頻信息的分離規(guī)律穩(wěn)定[13-14]; 因此, 為研究分析小波基的選用對光譜信息分離規(guī)律的影響, 明確小波基在抑制或削弱噪聲影響方面的作用, 以野外采集的冬小麥冠層光譜數(shù)據(jù)為數(shù)據(jù)源, 選用Coif2、 db5、 meyer、 rbio3.7、 sym2等5類小波基分別處理冬小麥冠層光譜數(shù)據(jù), 并通過對比分析各小波基對冬小麥冠層光譜信息分離的影響特征, 分析各小波基在處理分析光譜數(shù)據(jù)中存在的共性與差異, 研究小波基對可用光譜信息與噪聲信息的分離規(guī)律, 以期為野外光譜數(shù)據(jù)的處理分析提供一定參考。
以河北省安平縣為研究區(qū), 該研究區(qū)地處華北平原中部, 主要作物為冬小麥、 夏玉米; 本研究實驗對象為冬小麥, 品種為濟麥22, 田間實驗分別于2018年5月5日至6日、 5月23日—25日開展, 此時冬小麥分別處于揚花期、 灌漿期。 為開展冬小麥葉片含水量精準監(jiān)測的研究提供豐富的實驗材料, 在大田內進行野外實驗, 采集冬小麥植株樣品與冬小麥冠層光譜數(shù)據(jù)。 冬小麥樣品采集時, 首先將葉片與植株進行分離, 并立刻采用英時精密電子秤測定葉片含水量, 然后將葉片置于樣品袋內; 待完成野外樣品采集試驗后, 將樣本置于烘箱內進行烘干處理; 待冬小麥葉片樣本烘至恒重時, 再利用電子秤測定葉片干重, 并采用常規(guī)公式計算各冬小麥樣本的葉片含水量數(shù)據(jù)。
選在光照強度穩(wěn)定的時間段10:00—15:00進行冬小麥冠層光譜的采集, 光譜測定儀器選用美國ASD公司生產(chǎn)的便攜式地物光譜儀; 該光譜儀可測定冬小麥冠層350~2 500 nm區(qū)間光譜數(shù)據(jù), 其光譜分辨率為1 nm。 冬小麥冠層光譜采集時, 將光譜探頭置于冠層垂直上方50 cm處, 且探頭方向為垂直向下; 光譜采集前, 先利用白板對光譜儀進行優(yōu)化, 每個實驗點測量10條光譜, 取其均值作為該試驗點的光譜數(shù)據(jù)。
在大田內測定的冬小麥冠層光譜數(shù)據(jù)易受外界不可控因子的影響, 而使光譜內含大量噪聲信息, 該噪聲信息會對光譜內的可用信息產(chǎn)生干擾, 甚至掩蓋, 降低了野外光譜數(shù)據(jù)的信噪比, 因而須對冬小麥冠層光譜數(shù)據(jù)進行平滑處理, 并刪除無效光譜數(shù)據(jù); 選用海明窗低通濾波器對冬小麥冠層光譜進行去噪處理, 并刪除1 500~2 500 nm區(qū)間的數(shù)據(jù)。
離散小波算法是小波變換中的一種, 是重要的光譜信號處理方法之一, 其可借助高通濾波器、 低通濾波器與降采樣濾波器將光譜信息分離為高頻信息、 低頻信息, 且每分解1尺度, 光譜的分辨率降低1倍[14]; 為避免光譜分辨率的降低對可用光譜信息與噪聲信息分離規(guī)律的影響, 本研究利用重構函數(shù)將各尺度小波系數(shù)逐尺度進行重構。 為探尋離散小波算法在處理分析野外光譜數(shù)據(jù)中的作用, 探明離散小波算法及各小波基在分離可用信息與噪聲信息的作用與規(guī)律, 選用Coif2、 db5、 meyer、 rbio3.7、 sym2等5類小波作為小波基, 分解尺度為10。
圖1 離散小波算法處理光譜數(shù)據(jù)的流程
其中,S為野外冬小麥冠層光譜數(shù)據(jù);Di是基于離散小波算法分離的i分解尺度的高頻信息;Ai是基于離散小波變換分離的i分解尺度的低頻信息。
為客觀、 公正、 科學評價在離散小波算法下, 可用光譜信息、 噪聲信息的分布規(guī)律及估測模型的變化規(guī)律, 采用決定系數(shù)(R2)、 均方根誤差(RMSE)對估測模型進行評價, 二者具體計算公式如式(1)和式(2)
(1)
(2)
冬小麥冠層光譜經(jīng)離散小波變換算法處理后, 冬小麥冠層光譜被依頻率高低逐尺度分離為高頻與低頻信息, 然而冬小麥冠層光譜的分離受小波基影響較大, 小波基的選擇對光譜信息分離的影響較大, 因此選用已有且可用于離散小波變換算法的小波基作為研究對象, 采用的小波基分別為Coif2、 db5、 meyer、 rbio3.7、 sym2等5類小波基對冬小麥冠層光譜進行處理。
圖2為冬小麥冠層光譜經(jīng)5類小波基分離后的1—10尺度高頻信息圖。 由圖2可知, 從各小波基分離的高頻信息對比分析可知, 在1—10尺度內, 隨分解尺度的增加高頻信息曲線的振幅呈增加趨勢, 曲線的頻率呈降低趨勢, 這表明小波基對1—10尺度高頻信息曲線的變化趨勢的影響相對一致; 小波基的選擇可直接影響1—10尺度高頻信息的曲線特征, 其中, 基于coif2或Sym2分離的高頻信息以折線形式呈現(xiàn), 而利用Db5、 Meyer、 rbio3.7分離的高頻信息則多為光滑曲線。 綜上可知, 小波基對1—10尺度高頻信息曲線的變化趨勢的影響相對一致, 而對高頻信息曲線的形狀特征的影響卻存在較大差異。
圖2 基于5類小波基分離的高頻信息圖
截止目前已有大量研究表明: 基于離散小波提取的高頻信息在提升光譜信息信噪比、 敏感性、 模型精度與穩(wěn)定性等方面具有獨特優(yōu)勢, 而低頻信息則相對較差且穩(wěn)定; 因此, 為研究分析小波基對光譜信息分離規(guī)律的影響, 明確小波基在抑制或削弱噪聲影響方面的作用, 以基于各小波基分離的高頻信息為研究對象, 通過對比分析Coif2、 db5、 meyer、 rbio3.7、 sym2小波基對冬小麥冠層光譜信息分離的影響, 分析各小波基在處理分析光譜數(shù)據(jù)中存在的共性與差異, 研究小波基對可用光譜信息與噪聲信息的分離規(guī)律, 從而為野外光譜數(shù)據(jù)的處理分析提供基礎理論與方法參考。
圖3為基于各小波基分離的高頻信息與葉片含水量的決定系數(shù)(R2)矩陣圖, 橫軸為波段(350~2 500 nm), 縱軸為分解尺度(D1—D10)。 從對比分析圖3內高頻信息與冬小麥葉片含水量的決定系數(shù)矩陣可知: (1)與冬小麥葉片含水量相關性較強的敏感波段在各小波基內的分布區(qū)間相對穩(wěn)定, 但區(qū)間內的敏感波段與冬小麥含水量的相關強度與波段位置卻存在一定差異, 究其原因主要是離散小波算法是依頻率將光譜信息逐尺度分離, 從光譜信息中分離的高頻信息已非光譜反射率, 進而導致敏感波段的波段位置產(chǎn)生差異。 (2)與冬小麥葉片含水量敏感的波段多位于D1—D5分解尺度內, 且敏感波段在D1—D5分解尺度的分布較為離散化, 而位于D6—D10分解尺度內的敏感波段的分布則較為集中且決定系數(shù)的變化較為平緩, 這主要是因為隨著分解尺度的增加, 被分離的高頻信息曲線頻率持續(xù)降低, 而振幅則持續(xù)升高, 曲線更為平緩、 光滑(見圖2), 高頻信息內涵的信息量持續(xù)減少。 (3)位于各小波基內的敏感波段與冬小麥含水量的相關強度在D6—D10分解尺度內均隨尺度的增加而呈先升后降的趨勢, 究其原因主要是水分在光譜中響應特征較強, 而D6—D10的高頻信息包涵的光譜信息主要為中、 強吸收特征[15], 但高頻信息內涵的信息量卻在持續(xù)減少, 故而位于D6—D10的決定系數(shù)呈現(xiàn)先升后降的現(xiàn)象。 (4)各小波基對敏感波段的波段位置與相關強度均具有較大影響, 且在提升光譜與冬小麥葉片含水量間敏感性方面存在較大差異。 綜上可知, 與冬小麥含水量敏感的波段多分布于D1—D5尺度, 且敏感波段在各小波基內的分布區(qū)間相對一致, 但波段位置與相關強度均存在一定差異, 這表明小波基的選擇能影響高頻信息與冬小麥葉片含水量的相關強度與波段位置。
圖3 高頻信息與冬小麥葉片含水量的決定系數(shù)(R2)矩陣圖
為更好提取、 篩選特征波段, 構建最優(yōu)特征子集, 提升光譜對冬小麥葉片含水量的估測精度, 研究先采用相關性分析算法定量分析高頻信息與冬小麥葉片含水量的敏感性, 并提取與冬小麥含水量敏感的特征波段, 同時為避免特征波段間的共線問題, 特征波段間的間隔至少50 nm。 然后, 利用最優(yōu)特征子集算法構建最佳特征波段集, 其中波段數(shù)量均控制在2個以內, 以更客觀、 評估小波基對離散小波處理分析光譜的影響。 最后, 采用偏最小二乘算法構建冬小麥葉片含水量估測模型。
表1為基于各小波基構建的冬小麥葉片含水量診斷模型。 從表2進行對比分析可知: (1)在各小波基構建的估測模型內, 基于D1、 D2分解尺度分別構建的模型的驗證精度均較差, 而模型的建模精度卻較高, 究其原因主要是D1、 D2分解尺度內的可用信息與高頻隨機噪聲信息均較多, 進而導致模型的建模精度與驗證精度存在較大差異, 因此該分解尺度無法用于區(qū)域大田內冬小麥含水量的監(jiān)測, 為無效分解; (2)基于D5或附近尺度構建的模型的建模精度與驗證精度均較高且穩(wěn)定性較強, 這表明經(jīng)離散小波算法分解后, 可用光譜信息與噪聲信息在D5尺度或附近的分布較最為合理, 即信噪比較高; (3)從各小波基建模精度隨分解尺度的變化分析可知, 基于小波基估測模型的建模精度整體隨分解尺度的增加而呈先升后降趨勢, 建模精度R2的變化區(qū)間為[0.146, 0.825]; (4)基于各小波基構建的模型的驗證精度整體隨分解尺度的增加而呈先升后降的規(guī)律, 其R2的變化區(qū)間為[0, 0.767]; 基于各小波基構建的模型的穩(wěn)定性整體隨分解尺度的增加而呈先升后降的規(guī)律。 綜上可知: 受噪聲信息影響, D1—D2尺度構建的模型為無效模型; 基于D5或附近尺度構建的模型的建模精度與驗證精度均較高且穩(wěn)定性較強; 基于小波基估測模型的建模精度、 驗證精度與穩(wěn)定性整體均隨分解尺度的增加而呈先升后降趨勢。
表1 基于小波基構建冬小麥葉片含水量預測模型
為更好評估原光譜內可用信息與噪聲在各分解尺度內的分布與相互作用規(guī)律, 并著重分析噪聲信息在各尺度的分布規(guī)律及其對光譜估測能力的干擾作用, 利用模型的建模精度、 驗證精度及二者差值的絕對值綜合對離散小波分解后各尺度信息的進行評價。
圖4為基于5類小波基構建的冬小麥葉片含水量估測模型的建模精度(R2)矩陣圖。 從圖4可知, (1)從建模精度的對比分析可知: ①隨分解尺度的增加, 基于各小波基分別構建的模型的建模精度整體呈先升后降的規(guī)律, 這表明可用光譜信息的分布隨分解尺度的增加而減少, 高頻信息對冬小麥葉片含水量的估測能力隨尺度的增加而降低; ②各小波基構建的模型的建模精度間隨分解尺度的變化存在差異, 建模精度較高區(qū)域主要分布于D1—D5分解尺度內, 而位于D5—D10分解尺度內的建模精度均明顯偏低, 這表明可用信息的分布主要分布于D1—D5分解尺度內。 (2)從驗證精度的分析可知: ①模型的驗證精度整體隨分解尺度的增加而呈先升后降的規(guī)律, 這表明噪聲信息對模型的干擾作用隨分解尺度的增加呈先降后升的規(guī)律; ②位于D1—D2尺度內的模型的驗證精度均明顯偏低, 而位于D3—D10區(qū)間內的模型的驗證精度整體較高。 (3)從模型的建模精度與驗證精度差值的絕對值進行分析可知: 建模精度與驗證精度的差異隨分解尺度的增加而呈降低的趨勢; (4)從驗證精度、 建模精度與驗證精度差值的絕對值進行綜合分析可知: 高頻信息對冬小麥葉片含水量的估測能力隨分解尺度的增加而降低, 噪聲信息對高頻信估測能力的干擾作用隨分解尺度的增加而降低, 從而導致基于D5或附近尺度構建的模型的建模精度與驗證精度均相對較好, 其中基于meyer小波基的D5尺度構建的估測模型為最優(yōu)模型, 其建模精度的R2=0.625、 RMSE=1.562, 驗證精度的R2=0.767、 RMSE=1.828; 綜上可知: 可用的光譜信息隨分解尺度的增加而呈先升后降低的規(guī)律, 高頻信息對冬小麥葉片含水量的估測能力隨尺度的增加而降低; 噪聲在各尺度的分布整體呈降低的趨勢, 噪聲信息對高頻信息估測能力的干擾強度隨尺度的增加而降低; 模型的精度與穩(wěn)定性是可用光譜信息與噪聲信息綜合作用的結果, 其中基于meyer小波基的D5尺度構建的估測模型為最優(yōu)模型, 其建模精度的R2=0.625、 RMSE=1.562, 驗證精度的R2=0.767、 RMSE=1.828。
圖4 1—10分解尺度各小波函數(shù)估測模型的建模精度的決定系數(shù)(R2)矩陣
野外采集的光譜數(shù)據(jù)易受外界不可控因素的影響, 使野外光譜內含有大量噪聲信息; 噪聲信息的加入嚴重干擾了光譜信息對冬小麥葉片含水量的估測能力, 削弱了估測模型的穩(wěn)定性, 因此抑制或消除噪聲信息的影響是將光譜技術應用于冬小麥葉片含水量信息檢測的重要基礎。 與前人研究相比[1, 16-17], 本研究通過研究分析基于各小波基分離的高頻信息及高頻信息對冬小麥葉片含水量的敏感性與估測能力, 研究了離散小波算法在分離光譜信息與噪聲信息的普適規(guī)律, 明確了可用于冬小麥葉片含水量估測的分解尺度區(qū)間([D4, D6]), 探尋了各小波基在光譜信息處理分析中的差異, 并得出如下結論: (1)與冬小麥含水量敏感的波段多分布于D1—D5尺度, 且敏感波段在各小波基內的分布區(qū)間相對一致, 但波段位置與相關強度均存在一定差異, 這表明小波基的選擇能影響高頻信息與冬小麥葉片含水量的相關強度與波段位置。 (2)模型的精度與穩(wěn)定性是可用光譜信息與噪聲信息綜合作用的結果, 可用的光譜信息與噪聲信息均隨分解尺度的增加而呈先升后降低的規(guī)律, 噪聲信息對高頻信息估測能力的干擾強度隨尺度的增加而降低, 高頻信息對冬小麥葉片含水量的估測能力隨尺度的增加而降低。 研究結論可為受噪聲影響較重的光譜信息的處理與分析提供一定參考, 也可為我國西南、 南部等水汽含量較高區(qū)域內或北方夏季作物葉片含水量的檢測提供基礎支撐。
與其他相關研究相比, 本研究構建的冬小麥葉片含水量估測模型的精度相對較低, 究其原因主要是夏季大氣內的水汽含量的時空分布差異較大, 而水汽是野外光譜噪聲的主要來源之一, 在進行光譜采集時外界空氣的含水量偏高, 進而導致采集的冬小麥冠層光譜的信噪比較低, 這一制約了光譜對冬小麥葉片含水量的估測精度, 然而本研究的相關結論具有較強的可靠性, 可為相關研究提供參考。 盡管本研究進一步明確了離散小波在處理分析光譜數(shù)據(jù)中的規(guī)律, 但仍需開展如下研究:
(1)如何實現(xiàn)D1—D3尺度內可用光譜信息與噪聲信息的分離, 提高可用光譜信息的信噪比, 進一步提升光譜對冬小麥葉片含水量估測能力仍需進一步深入研究。
(2)3月—6月外界不可控因子對野外光譜的影響規(guī)律, 及噪聲信息對光譜信息干擾作用隨時間的變化規(guī)律均尚未明確, 須進一步研究確認。
受外界不可控因子對野外光譜數(shù)據(jù)的干擾是影響光譜技術對地表信息觀測的重要因素, 為探尋離散小波變換在處理分析野外光譜數(shù)據(jù)時, 可用光譜信息與噪聲信息在高頻信息中的分布規(guī)律及二者相互作用規(guī)律, 研究選用Coif2、 db5、 meyer、 rbio3.7、 sym2等5類小波基, 結合相關性分析算法與偏最小二乘算法構建冬小麥葉片含水量估測模型, 結論如下:
(1)與冬小麥含水量敏感的波段多分布于D1—D5尺度, 且敏感波段在各小波基內的分布區(qū)間相對一致, 但波段位置與相關強度均存在一定差異, 這表明小波基的選擇能影響高頻信息與冬小麥葉片含水量的相關強度與波段位置。
(2)可用的光譜信息與噪聲信息均隨分解尺度的增加而呈先升后降低的規(guī)律, 噪聲信息對高頻信息估測能力的干擾強度隨尺度的增加而降低, 高頻信息對冬小麥葉片含水量的估測能力隨尺度的增加而降低。
(3)模型的精度與穩(wěn)定性是可用光譜信息與噪聲信息綜合作用的結果, 其中基于meyer小波基的D5尺度構建的估測模型為最優(yōu)模型, 其建模精度的R2=0.625、 RMSE=1.562, 驗證精度的R2=0.767、 RMSE=1.828。