桑佳茂, 陳豐農(nóng)
杭州電子科技大學(xué)自動(dòng)化學(xué)院, 浙江 杭州 310018
水稻是中國重要的糧食作物, 全國以水稻為主食的人口數(shù)量超過50%。 在水稻病害中, 稻曲病號(hào)稱水稻的癌癥, 目前該病有擴(kuò)大趨勢。 稻曲病不僅影響水稻產(chǎn)量, 而且病原菌含有色毒素, 對(duì)人有毒害作用。 目前對(duì)稻曲病沒有好的根治方法, 主要依賴于噴灑農(nóng)藥進(jìn)行預(yù)防, 但農(nóng)藥對(duì)環(huán)境和人們的身體健康又會(huì)帶來隱患。
近年來, 隨著遙感技術(shù)的不斷發(fā)展和普及, 植物病蟲害領(lǐng)域的遙感監(jiān)測研究不斷增多并迅速發(fā)展。 Tobias B. Hank等[1]用衛(wèi)星獲取的高光譜數(shù)據(jù)分析了稻曲病的光譜特征。 馬德貴等[2]用高光譜成像技術(shù)對(duì)稻曲病的發(fā)病等級(jí)劃分方法建立了分類模型。 吳曙文等[3]用遙感衛(wèi)星技術(shù), 在紅外光譜波段研究了患有不同程度稻曲病的葉片和冠層反射光譜光譜特征變化。 在水稻的類似病癥上也有不少學(xué)者做了相關(guān)的研究, 有報(bào)道利用紅外遙感技術(shù)確定了水稻黑條矮縮病的發(fā)病等級(jí)判定依據(jù), 最后選取了五個(gè)有效波段的光譜信息, 用支持向量機(jī)分類方法建立了預(yù)測模型。 有研究將不同植被指數(shù)引入到植物病蟲害的監(jiān)測[4-5]。 不同形式的植被指數(shù)都有一定的適用環(huán)境和針對(duì)性, 是植物光譜信息的一種重要應(yīng)用方式。
目前植物病蟲害檢測主要借助衛(wèi)星遙感、 無人機(jī)遙感、 彩色圖像算法和高光譜圖像處理等技術(shù)。 由于大部分衛(wèi)星遙感技術(shù)采集的圖片質(zhì)量不是很高, 造成關(guān)鍵像素信息的丟失, 渾濁, 大部分病蟲害檢測系統(tǒng)不能發(fā)揮很好的作用, 主流的圖像病蟲害算法有主成分分析法(principal component analysis, PCA)和聚類方法等, 以及這些方法的結(jié)合所產(chǎn)生的方法。 但是這些傳統(tǒng)算法都是針對(duì)清晰圖像像素本身的操作, 一旦圖像不清晰, 就會(huì)造成病蟲害檢測效果不好、 不夠準(zhǔn)確。
本研究提出一種利用高光譜圖像獲取水稻歸一化植被指數(shù)(normalized vegetation index, NDVI), 并將其結(jié)合秩和檢驗(yàn)[6]應(yīng)用在水稻稻曲病的發(fā)病程度檢測。 研究中對(duì)多種管理方式試驗(yàn)稻田的水稻生長狀況進(jìn)行監(jiān)測, 用無人機(jī)航拍獲得試驗(yàn)田的高光譜圖像, 得到每個(gè)試驗(yàn)水稻種植區(qū)域的歸一化植被指數(shù), 對(duì)不同稻區(qū)的NDVI值進(jìn)行秩和檢驗(yàn), 結(jié)果p值遠(yuǎn)<0.01, 表明對(duì)稻曲病的發(fā)病程度檢測有顯著性。
本研究的試驗(yàn)地點(diǎn)在中國水稻研究所, 位于浙江省杭州市富陽區(qū)(30°05′N, 119°95′E), 亞熱帶季風(fēng)氣候, 氣候溫和, 日照充足。 試驗(yàn)材料為甬優(yōu)12號(hào)水稻, 該品種生長整齊, 植株較高, 株型較緊湊, 劍葉挺直而內(nèi)卷, 葉色濃綠, 莖稈粗壯; 分蘗力中等, 穗大粒多, 著粒密, 穗基部枝梗散生。 在研究區(qū)選取28個(gè)面積相同的相鄰水稻試驗(yàn)區(qū), 區(qū)域內(nèi)采用4種水稻管理方式, 分別為自然生長和通過植保無人機(jī)噴灑3種不同農(nóng)藥, 每種管理方式有7個(gè)不同播種日期, 前后播種日期相差1周, 依次遞減, 每個(gè)區(qū)域有水稻500株左右。 試驗(yàn)時(shí)先調(diào)查水稻的發(fā)病狀況, 并用無人機(jī)載高光譜相機(jī)距地30 m高空拍攝試驗(yàn)田。 28個(gè)地塊田間分布如表1所示。
表1 2019年度水稻試驗(yàn)田的種植分布
高光譜相機(jī)為德國Cuber公司的UHD185, 可畫幅式采集數(shù)據(jù), 采集速度可達(dá)5幀·s-1, 光譜范圍 450~1 000 nm, 光譜波段分辨率為8 nm, 圖像分辨率為1 000×1 000像素; 在采集數(shù)據(jù)之前對(duì)高光譜相機(jī)進(jìn)行白板和黑板校正, 同時(shí)采用幅照度計(jì)校正, 以避免因?yàn)楣庹兆兓鸬臄?shù)據(jù)不一致現(xiàn)象。 該高光譜相機(jī)的無人機(jī)掛載平臺(tái)為大疆經(jīng)緯M600 PRO(圖1)。 航拍高度30m, 橫向重疊度為0.7, 縱向重疊度為0.8[7]。 高光譜圖像拼接采用傾斜攝影三維建模軟件PhotoScan, 根據(jù)航片坐標(biāo)、 高程信息和相似度對(duì)多個(gè)高光譜樣本排序, 進(jìn)行高質(zhì)量拼接[10], 最后得到一個(gè)較完整的覆蓋整個(gè)試驗(yàn)區(qū)域的高光譜圖像(圖2)。 數(shù)據(jù)分析平臺(tái)ENVI(Vision 5.3, Exelis Inc, Boulder, CO, USA)是一個(gè)強(qiáng)大的遙感影像處理平臺(tái), 可在集成開發(fā)環(huán)境(integrated development environment, IDL)的輔助下根據(jù)算法二次開發(fā), 而數(shù)據(jù)分析平臺(tái)Cube-Pilot(Cubert GmbH, Ulm, Germany)則用于光譜的重采樣, 該軟件的交互性較強(qiáng), 方便光譜數(shù)據(jù)的管理。 在28個(gè)地塊中, 每個(gè)地塊隨機(jī)選擇10 000個(gè)點(diǎn), 最終獲得28萬個(gè)光譜數(shù)據(jù)。 光譜數(shù)據(jù)處理與分析使用MATLAB (Version 2019, The Mathworks Inc., Natick, MA), 對(duì)光譜數(shù)據(jù)進(jìn)行了平滑和光散射校正, 以增強(qiáng)樣本的可靠性。
圖1 大疆經(jīng)緯M600 PRO
圖2 試驗(yàn)田無人機(jī)(UAV)航拍高光譜圖
施辰子等[9]將稻曲病分級(jí)標(biāo)準(zhǔn)分為5級(jí), 其中0級(jí)表示沒有病害、 1級(jí)表示發(fā)病最輕、 5級(jí)表示發(fā)病最嚴(yán)重, 以單位面積內(nèi)的植株發(fā)病率作為病害等級(jí)的分類標(biāo)準(zhǔn), 具體的描述如下:
0級(jí): 植株稻穗患病率為0;
1級(jí): 植株稻穗患病率為0~5%(含5%);
2級(jí): 植株稻穗患病率為5%~10%(含10%);
3級(jí): 植株稻穗患病率為10%~20%(含20%);
4級(jí): 植株稻穗患病率為20%~50%(含50%);
5級(jí): 植株稻穗患病率為50%以上。
按此標(biāo)準(zhǔn), 根據(jù)田間病情調(diào)查結(jié)果, 計(jì)算病情指數(shù)(disease index, DI)如式(1)
(1)
式(1)中, DI為病情指數(shù);xi為各級(jí)發(fā)病穗數(shù)(單位/株);ni(1~5)為各級(jí)代表值;N為調(diào)查總穗數(shù)(單位/株);k(k=5)最高級(jí)代表值。 為了計(jì)算方便, 最后將28個(gè)試驗(yàn)田按病情指數(shù)的大小分為相應(yīng)的等級(jí)。
顯著性檢驗(yàn)要先對(duì)總體樣本提出一個(gè)假設(shè), 然后通過各種檢驗(yàn)方法的計(jì)量分析處理樣本數(shù)據(jù), 依據(jù)處理結(jié)果判斷這個(gè)假設(shè)是否合理。 根據(jù)檢驗(yàn)樣本總體的分布情況, 可分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。 參數(shù)檢驗(yàn)要求樣本服從正態(tài)性分布, 并具有相同的方差。 當(dāng)數(shù)據(jù)不滿足正態(tài)性假設(shè)和方差齊次性假定時(shí), 不適用參數(shù)檢驗(yàn)[10]。
在實(shí)際工作中, 由于假定統(tǒng)計(jì)數(shù)據(jù)的不可知性, 在一個(gè)完整的統(tǒng)計(jì)工程中, 必須先檢驗(yàn)數(shù)據(jù)的正態(tài)性和方差齊性。 使用MATLAB的lillietest正態(tài)檢驗(yàn)函數(shù)和vartestn方差齊性檢驗(yàn)得知本試驗(yàn)樣本集不符合正態(tài)性假設(shè)。 考慮到試驗(yàn)數(shù)據(jù)集需要滿足的要求和本次檢驗(yàn)屬于單因素一元方差分析, 本研究采用基于秩和的非參數(shù)檢驗(yàn)。 因?yàn)橹群蜋z測不依賴于總體分布的具體形式, 應(yīng)用時(shí)可以不考慮被研究對(duì)象為何種分布以及分布是否已知。
水稻光譜和發(fā)病等級(jí)之間的關(guān)系屬于非確定問題。 高光譜圖像具有波段數(shù)目多、 光譜數(shù)據(jù)量大和分辨率高等特點(diǎn), 導(dǎo)致數(shù)據(jù)維數(shù)較高, 如果計(jì)算全光譜波段, 將會(huì)產(chǎn)生較多冗余數(shù)據(jù), 降低結(jié)果的準(zhǔn)確性。 本研究用歸一化植被指數(shù)建立水稻光譜和水稻發(fā)病等級(jí)之間的關(guān)系, 用顯著性檢驗(yàn)驗(yàn)證分類的合理性。
歸一化植被指數(shù)(NDVI)是植物生長狀況以及植被空間分布密度的指示因子, 能反映植物冠層的背景影響, 且與植被覆蓋有關(guān), 與植被分布密度呈線性相關(guān), 在使用遙感圖像進(jìn)行植被研究中得到廣泛應(yīng)用。 另外NDVI值在植物葉綠素吸收較強(qiáng)的波譜區(qū)間紅藍(lán)波段計(jì)算得到, 選取適當(dāng)?shù)牟ǘ斡?jì)算可以將植被的地物特征加強(qiáng), 突出植被的冠狀特征。 本研究通過植被指數(shù)確定特征波段, 再選擇對(duì)應(yīng)的光譜點(diǎn)作為反映稻曲病等級(jí)識(shí)別的特征。
NDVI的值由近紅外波段(RNir)和紅光波段(RRed)的反射率決定。 NDVI值范圍在[-1, 1]之間, 負(fù)值表示地面覆蓋為云、 水、 雪等; 0表示有巖石或裸土等覆蓋; 正值表示有植被覆蓋, 且隨覆蓋度增大而增大。 其計(jì)算如式(2)所示
(2)
式(2)中,RNir為近紅外波段的反射值;RRed為紅光波段的反射值。
本研究采集光譜數(shù)據(jù)波段范圍為450~946 nm。 對(duì)于近紅外波段和紅光波段的取值問題, 國內(nèi)外專家和學(xué)者也有研究, 王福民等[11]研究表明, 紅光波段的反射率對(duì)NDVI的影響更大, 而在波段寬度<50 nm時(shí), 近紅外波段基本不受波段位置和寬度的影響; 張競成等[12]研究表明, 歸一化植被指數(shù)NDVI中的紅光波段影響較大, 紅光波段的反射值如果在660~680 nm為中心的窄波段范圍內(nèi)選取, 可以更好地反應(yīng)植物的實(shí)際生長狀況, 近紅外波段的反射值在740~980 nm范圍內(nèi)選取。
根據(jù)羅紅霞等[13]綜合分析, 紅光波段的位置對(duì)NDVI結(jié)果的影響較大, 且紅光波段位置接近紅谷極值, 即670 nm附近時(shí)影響尤為顯著。 本研究所選的光譜波段間隔4 nm, 查閱文獻(xiàn)綜合考慮將670 nm處的取值作為紅光波段的數(shù)值, 對(duì)比多組患病水稻和健康水稻的光譜圖(如圖3), 通過區(qū)分度比較, 將834 nm處的取值作為近紅外波段數(shù)值。
圖3 未患稻曲病水稻和患稻曲病水稻光譜
本研究具體實(shí)施過程: (1)無人機(jī)載高光譜拍攝28個(gè)水稻試驗(yàn)區(qū)的高光譜圖像, 提取各區(qū)域指定波段的光譜數(shù)據(jù),每個(gè)試驗(yàn)區(qū)各選擇10 000個(gè)采樣光譜; (2)光譜數(shù)據(jù)預(yù)處理, 增強(qiáng)光譜特征; (3)計(jì)算每個(gè)試驗(yàn)區(qū)的NDVI值; (4)用得到的NDVI值做秩和檢驗(yàn), 根據(jù)輸出結(jié)果p值決定分類的顯著性; (5)將檢驗(yàn)結(jié)果與實(shí)際大田情況作對(duì)比, 驗(yàn)證結(jié)論可靠性。
稻曲病和檢驗(yàn)技術(shù)路線如圖4所示。
圖4 稻曲病秩和檢驗(yàn)技術(shù)路線
作為對(duì)照組, 水稻的病害等級(jí)通過實(shí)地的大田調(diào)查得到。 本研究統(tǒng)計(jì)了試驗(yàn)地塊的發(fā)病稻穗數(shù)量, 并參照1.3節(jié)中的方法對(duì)不同患病程度水稻進(jìn)行區(qū)分和統(tǒng)計(jì), 計(jì)算了每塊區(qū)域的發(fā)病指數(shù)(表2)。 通過病情指數(shù)對(duì)發(fā)病等級(jí)分為1, 3,5和7四個(gè)等級(jí), 分別對(duì)應(yīng)于病情指數(shù)的條件為DI<1, 1
表2 不同試驗(yàn)區(qū)的稻曲病發(fā)病情況
對(duì)不同試驗(yàn)區(qū)的NDVI值進(jìn)行秩和檢驗(yàn), 驗(yàn)證各組樣本中是否有顯著差異, 如果有差異再兩兩比較, 確定差異性來源于何組樣本。 結(jié)果輸出如表3所示, 由表3的數(shù)據(jù)可知,p<0.01, 該值極為顯著。
表3 等級(jí)秩和檢驗(yàn)輸出表
表3的結(jié)果僅表明在這幾組數(shù)據(jù)之間存在顯著性差異, 需要對(duì)數(shù)據(jù)進(jìn)行兩兩檢驗(yàn), 確定各組之間的顯著性。 多組數(shù)據(jù)秩和檢驗(yàn)后兩兩比較就要把各組混合排秩, 對(duì)秩次進(jìn)行方差分析, 得出兩兩比較的結(jié)果[14-15]。
為了顯示各組之間檢驗(yàn)的異常值, 本研究引入了箱型圖(圖2), 箱型圖最大的優(yōu)點(diǎn)是不受異常值的影響, 能夠準(zhǔn)確穩(wěn)定地描繪出數(shù)據(jù)的離散分布情況, 同時(shí)也利于數(shù)據(jù)的清洗。 鑒于數(shù)據(jù)組合形式較多, 本研究選擇等級(jí)3和5作為代表組。 從5的箱型圖中可看出兩組數(shù)據(jù)都呈現(xiàn)對(duì)稱分布, 等級(jí)3的數(shù)據(jù)有5個(gè)異常點(diǎn), 等級(jí)5的數(shù)據(jù)有3個(gè)異常點(diǎn), 在對(duì)異常點(diǎn)定位后就需在秩和檢驗(yàn)分析時(shí)過濾掉異常值。
圖5 箱型圖及注釋
表4 顯著性秩和檢驗(yàn)結(jié)果
與其他假設(shè)檢驗(yàn)的條件相似, 秩和檢驗(yàn)的顯著性水平分α=0.05和0.01兩種臨界值, 0.05
根據(jù)表4中所顯示的結(jié)果, 不同樣本間秩和檢驗(yàn)的p值都遠(yuǎn)<0.01, 說明不同組間的樣本數(shù)據(jù)存在極為顯著差異, 也反映出此方法用于分類的合理性。 圖6是試驗(yàn)田水稻發(fā)病等級(jí)劃分結(jié)果圖, 本結(jié)果和大田實(shí)際調(diào)查的結(jié)果一致。 圖6中深綠色表示發(fā)病少, 紅色表示發(fā)病嚴(yán)重, 淺綠色和淺紅色則介于二者之間。
圖6 試驗(yàn)田稻曲病發(fā)病等級(jí)劃分圖
嘗試根據(jù)歸一化植被指數(shù)確定光譜特征點(diǎn), 并建立與稻曲病發(fā)病程度的相關(guān)性。 首先, 實(shí)地調(diào)查水稻發(fā)病植株情況, 計(jì)算出發(fā)病指數(shù)并劃分發(fā)病等級(jí), 再用無人機(jī)搭載高光譜相機(jī)航拍試驗(yàn)區(qū)域。 為了去除冗余數(shù)據(jù), 將歸一化植被指數(shù)NDVI引入稻曲病監(jiān)測, 選取合理波段計(jì)算得到NDVI值, 并由此確定光譜中對(duì)應(yīng)的特征點(diǎn)。 最后, 對(duì)不同試驗(yàn)田的特征點(diǎn)進(jìn)行秩和檢驗(yàn), 分析結(jié)果通過大田調(diào)查的結(jié)果驗(yàn)證了本研究方法的合理性。 為通過高光譜和遙感技術(shù)對(duì)大面積稻曲病監(jiān)測提供了一定的理論基礎(chǔ), 對(duì)稻曲病病情程度劃分以及早期識(shí)別提供了新的思路。