王卓卓 何英彬 羅善軍 段丁丁 張遠濤 朱婭秋 于金寬 張勝利 徐飛 孫靜
摘要:為豐富高光譜數(shù)據(jù)在精細農(nóng)業(yè)中的應(yīng)用,本研究基于冠層光譜數(shù)據(jù)進行不同馬鈴薯品種區(qū)分研究。利用田間實測的6-8月的馬鈴薯原始光譜數(shù)據(jù)以及經(jīng)過一階微分、對數(shù)一階微分、包絡(luò)線去除處理后的光譜,采用馬氏距離法選擇3種馬鈴薯光譜差異顯著波段,再利用逐步判別法檢驗波段識別精度。結(jié)果表明,7月份經(jīng)過對數(shù)一階微分變換選取的特征波段識別精度最高,達87.7%。不同生育期內(nèi),多種預(yù)處理方法下的光譜識別能力有差異。6月份包絡(luò)線去除法的識別精度最高,7月份對數(shù)一階微分處理下的識別精度最高,而8月份原始光譜的識別精度最高。提取的特征波段多位于紅光及近紅外波段。研究結(jié)果表明基于高光譜數(shù)據(jù),借助馬氏距離與逐步判別法可以區(qū)分馬鈴薯品種。
關(guān)鍵字:高光譜;馬氏距離;馬鈴薯;品種識別
中圖分類號:TP79
文獻標識碼:A
文章編號: 1000-4440(2018) 05-1036-06
高光譜遙感具有波段連續(xù)、光譜分辨率高的特點,在分析植被的反射光譜差異性方面有較大的潛力,能夠更加準確地探測到植被的精細光譜信息,從而能更準確地識別作物,為作物的科學(xué)管理和高產(chǎn)高效提供技術(shù)保障。目前,高光譜數(shù)據(jù)相關(guān)研究主要是通過構(gòu)建植被指數(shù)與提取光譜特征參數(shù)(包括光譜反射率、吸收谷、紅邊參數(shù)、面積參數(shù)等),借助BP神經(jīng)網(wǎng)絡(luò)、判別分析法、歐氏距離等方法對具有較強相似性的草地種、樹種以及農(nóng)作物種類進行精細分類。如王崠等基于光譜數(shù)據(jù)變換以及高光譜特征參數(shù)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型對8種常見農(nóng)作物進行分類,張豐等的研究深入到作物品種層面,基于高光譜成像光譜儀獲取的數(shù)據(jù),采用混合決策樹分類算法(分類節(jié)點上綜合了最大似然法、光譜角匹配、馬氏距離分類以及二值編碼等方法)成功對6種水稻進行識別分類。
馬鈴薯是中國繼玉米、水稻、小麥之后的第四大糧食作物,對于保障國家糧食安全意義重大。目前,有關(guān)馬鈴薯高光譜研究多集中于成熟收獲后塊莖的品質(zhì)鑒別與品種分類,而關(guān)于馬鈴薯早期植株生長方面的研究較少。利用冠層高光譜進行馬鈴薯品種識別的研究鮮有報道。同種作物不同品種之間的光譜特征極為相似,它們之間的細微差別很難通過分辨率較低的常規(guī)遙感手段探測,本研究基于3種馬鈴薯關(guān)鍵生育期內(nèi)的高光譜數(shù)據(jù),通過微分及包絡(luò)線去除等預(yù)處理,借助馬氏距離選取特征波段,利用逐步判別分析法分析不同預(yù)處理方法下的馬鈴薯品種識別精度。研究區(qū)分不同品種健康的馬鈴薯植株在其關(guān)鍵生育期內(nèi)的光譜變化特征,可以豐富作物精細分類的相關(guān)研究,為馬鈴薯精準田間管理提供科學(xué)依據(jù)。
1 材料與方法
1.1 試驗設(shè)計
試驗于2017年6-8月在吉林省長春市農(nóng)業(yè)科技示范園區(qū)(124°99'E,43°66'N)進行。選取吉林地區(qū)廣泛種植的早熟品種費烏瑞它以及中晚熟品種延薯4號、吉薯l號作為研究對象,為了研究方便分別記為:FW、JS、YS。3種馬鈴薯均在5月12日播種,每個品種種植2組,每組8壟,壟寬75~80cm,株距30—35cm,小區(qū)面積1.2mx6.5m。其他管理措施同大田。
1.2 數(shù)據(jù)采集
反射率光譜測量采用USB2000+便攜式光譜儀測得。光譜范圍為350—1050nm,光譜分辨率1.7~2.1nm,采樣間隔0.44nm,信噪比250∶l。選取晴朗,無風(fēng)無云的天氣進行數(shù)據(jù)采集。光譜采集時間10∶00-14∶00(減小太陽高度角的影響),采集時傳感器探頭使用25。視場角,探頭垂直向下。為了保證數(shù)據(jù)準確性,測量前采取標準白板進行校正。處理時,剔除每組中的異常光譜,取平均值作為每種作物的光譜。共計得到有效數(shù)據(jù)251條。
1.3 光譜數(shù)據(jù)預(yù)處理
由于受光譜儀自身以及溫度、雜散光等外界因素的影響,所測光譜數(shù)據(jù)存在各種噪聲。為了得到真實的結(jié)果,消除基線漂移等影響,需要對實測光譜數(shù)據(jù)進行預(yù)處理。預(yù)處理包括數(shù)據(jù)平滑與數(shù)據(jù)變換。
數(shù)據(jù)平滑方法選取S-G濾波法,它是一種在時域內(nèi)基于局域多項式最小二乘法擬合的濾波方法。這種濾波器最大的特點在于濾除噪聲的同時可以確保信號的形狀、寬度不變。S-G濾波采用Origin8.0實現(xiàn)。
采用包絡(luò)線去除與微分進行數(shù)據(jù)變換。包絡(luò)線去除法可以有效突出光譜曲線的吸收和反射特征,并將反射率歸一化為0~1.0,將光譜的吸收特征歸一化到一致的光譜背景上,有利于與其他光譜曲線進行特征數(shù)值的比較,從而提取特征波段以供分類識別。包絡(luò)線變化公式如下:
上式中,λ是波長j;RCj是波長j去除包絡(luò)線后的值;Rj是波長i的原始光譜反射率;Rend與Rstart是在吸收曲線里的起始點和末端點的原始光譜反射率;λend與λstart是在吸收曲線里的起始點波長和末端點波長;K是在吸收曲線里起始點波段與末端點波段之間的斜率。
光譜反射值經(jīng)對數(shù)變換后,不僅趨向于增強可見光區(qū)的光譜差異,而且趨向于減少因光照條件變換引起的乘性因素的影響。為了取得更好的效果,光譜數(shù)據(jù)經(jīng)過對數(shù)變換后進行微分處理得到對數(shù)一階微分數(shù)據(jù)。公式如下:
式中,(lgRAλi)為波長i與波長i+1之間的對數(shù)一階微分光譜;lgRλi與lgRλ(i+1)分別為波長i與波長i+1求對數(shù)后的光譜反射率,△λ為波長i+1與波長i之間的波長差值。
1.4 逐步判別分析法
采用SPSS軟件進行逐步判別分析,判別函數(shù)的系數(shù)選Fisher判別方程的系數(shù),采用Mahalanobis距離方法(即馬氏距離)逐步選擇變量。計算公式如下:
式中,MDk為不同光譜曲線波段的馬氏距離;X為不同光譜曲線在k波段的差值矩陣;k為均值向量:∑-1為協(xié)方差矩陣。
選取差異顯著波段時,為剔除差異不顯著的波段,規(guī)定馬氏距離值要高于各波段的平均值。同時,為便于地物光譜儀實測光譜數(shù)據(jù)與高光譜遙感數(shù)據(jù)相結(jié)合,規(guī)定馬氏距離值高的波段必須連續(xù)出現(xiàn)10nm以上方可入選。
2 結(jié)果與分析
2.1 光譜數(shù)據(jù)處理分析
本研究以2017年7月光譜數(shù)據(jù)為例進行具體的描述分析。原始光譜數(shù)據(jù)(圖la)中,晚熟品種延薯4號7月份光譜與其他2種馬鈴薯的光譜差異較大。延薯4號的反射率光譜曲線總體上高于其他2種馬鈴薯,在750~850 nm附近,費烏瑞它反射率稍高于吉薯l號。一階微分處理(圖lb)對于區(qū)分3種馬鈴薯曲線作用不大??傮w上,相對于費烏瑞它與吉薯1號,延薯4號的紅邊位置更加靠近藍色波段。對數(shù)一階微分處理(圖lc)后3種馬鈴薯光譜曲線差異比較明顯。400~500 nm處,延薯4號光譜曲線明顯低于其他2種馬鈴薯,而在550~670nm.光譜曲線較高。3種馬鈴薯光譜曲線均在700nm左右達到峰值,此處3種馬鈴薯的光譜曲線差異明顯。由圖ld可知,包絡(luò)線去除能夠進一步增加400~700nm內(nèi)延薯4號與其他2種馬鈴薯之間的光譜差異。
2.2 利用馬氏距離法選取特征波段
特征變量的選擇是農(nóng)作物遙感分類的重要步驟,有效地使用多種特征變量是提高農(nóng)作物遙感分類精度的關(guān)鍵。本研究借助馬氏距離得到初步的光譜數(shù)據(jù)差異波段。馬氏距離越大,說明3種馬鈴薯在此波段的差異性越大,越容易區(qū)分。4種光譜數(shù)據(jù)處理方法下的馬氏距離由SPSS計算得到,以2017年7月數(shù)據(jù)為例進行分析,結(jié)果如圖2所示。原始光譜數(shù)據(jù)中,大于平均值的波段范圍大致在715—738nm、760~840 nm以及873nm之后。一階微分處理后大于均值的波段范圍在696~ 770nm.770 nm后的數(shù)據(jù)存在噪聲,波動較大,因此不考慮在內(nèi)。對數(shù)一階微分處理后的光譜,在425~447nm波動較大,但存在連續(xù)大于平均值的波段,520nm處超過平均值的波段范圍小于10 nm,忽略不計。其他波段馬氏距離大于均值的波段范圍處于660—678 nm以及687—736 nm。包絡(luò)線去除后,400~446nm馬氏距離大于均值,大于均值的2個波段分別位于655~695 nm以及731—748 nm。
2.3 判別結(jié)果及精度分析
采用逐步判別法對所選取的波段進行進一步選擇,得到能夠成功區(qū)分3種馬鈴薯光譜的特征波段,具體如表l所示。逐步判別分析法選取的有效特征波段范圍多集中于紅光波段與近紅外波段。同時,6月份數(shù)據(jù)經(jīng)過對數(shù)一階微分及包絡(luò)線去除處理后,也得到了一些位于綠光波段550 nm左右的特征波段,這與其他領(lǐng)域已有的研究結(jié)果一致。選取的特征波段的判別精度如表2所示。3種馬鈴薯光譜之間的差異程度隨生育期不斷變化。6月份,4種預(yù)處理方法下的判別精度較低。包絡(luò)線去除法處理后的數(shù)據(jù)判別精度最高,為75.9%,而一階微分變換后的數(shù)據(jù)判別精度僅為46.2%;7月份,3種馬鈴薯的光譜數(shù)據(jù)差異開始擴大,多種方法下的判別精度均升高,其中對數(shù)一階微分處理后的識別精度達87.7%,原始光譜識別精度次之,為76.3%,一階微分及包絡(luò)線去除后的識別精度約68.0%;8月份原始光譜處理下的識別精度為81.8%,一階微分及對數(shù)一階微分等其他3種方法的識別精度為60.0%左右。
總體上,不同預(yù)處理方法表現(xiàn)最佳時所對應(yīng)的時間不同。包絡(luò)線去除識別精度最高出現(xiàn)在6月份,一階微分與對數(shù)一階微分處理結(jié)果最佳識別時間為7月份,而8月份時原始光譜識別精度最高。通過計算得到4種預(yù)處理方法對應(yīng)的平均識別精度,對數(shù)一階微分處理與原始光譜的平均識別精度最高,分別為71.73%和71.67%,其次是包絡(luò)線去除法,其平均識別精度為70.07%,一階微分的判別精度最低僅為59.33%。微分處理能夠降低土壤等背景的影響,同時也會進一步放大光譜噪聲。導(dǎo)致所選取特征波段不準確,判別精度降低。
3 討論
馬鈴薯屬于茄科作物,受塊莖生長影響,在生長前期地下養(yǎng)分向上供應(yīng)促進莖葉生長為馬鈴薯塊莖形成做準備,而中后期(開花期后)主要轉(zhuǎn)入供給地下莖促進果實膨大,因此不能將現(xiàn)有的水稻、玉米等禾本科作物的相關(guān)研究成果簡單地套用在馬鈴薯上。本研究通過研究3種馬鈴薯關(guān)鍵生育期內(nèi)的高光譜數(shù)據(jù),得到以下結(jié)論:(1)經(jīng)過微分、包絡(luò)線去除等處理后的光譜數(shù)據(jù)選取的特征波段能夠提高馬鈴薯品種間的識別精度;(2)選取的3種馬鈴薯光譜差異顯著,波段大多位于紅光及近紅外波段,也存在少數(shù)波段位于綠峰附近,這些可作為作物識別的重點波段;(3)3種馬鈴薯光譜之間的差異程度隨生育期不斷變化。6月份,4種預(yù)處理方法下的判別精度較低。7月份光譜數(shù)據(jù)差異開始擴大,多種方法下的判別精度均升高;(4)不同預(yù)處理方法表現(xiàn)最佳時所對應(yīng)的時間不同。包絡(luò)線去除識別精度最高出現(xiàn)在6月份,一階微分與對數(shù)一階微分處理結(jié)果最佳識別時間為7月份,而8月份時原始光譜識別精度最高。研究結(jié)果表明,借助高光譜數(shù)據(jù)中的特征波段可以識別不同品種的馬鈴薯,將作物識別研究深入到同種作物不同品種之間,進一步豐富高光譜數(shù)據(jù)在作物識別的研究成果。
農(nóng)作物遙感識別特征具有時間效應(yīng),不同作物的遙感識別特征隨時間呈現(xiàn)動態(tài)變化的規(guī)律。根據(jù)作物之間的物候差異進行特征提取,是農(nóng)業(yè)遙感中常用的方法。本研究通過分析比較多時期連續(xù)的光譜數(shù)據(jù),找到目標作物之間差異最大的時期,對于確定最佳分類時相的遙感數(shù)據(jù)以及選擇合適的數(shù)據(jù)更有實際指導(dǎo)意義。
不同光譜變換方法在一定程度上能消除外界擾動因素的影響,能夠提高植物光譜分類識別精度。林海軍等將經(jīng)過微分、包絡(luò)線去除處理后的4種樹種的高光譜數(shù)據(jù)用于樹種識別,發(fā)現(xiàn)光譜變換處理可有效提高樹種的識別精度。其中光譜二階微分處理后的識別精度最高,達95.5%;劉秀英等研究發(fā)現(xiàn),對數(shù)變換后取一階微分的光譜及植被指數(shù)對杉木和馬尾松的識別精度最高。本研究借鑒已有研究成果,選取表現(xiàn)最優(yōu)的數(shù)據(jù)變換方法,即對數(shù)一階微分與包絡(luò)線去除法進行研究,得到的結(jié)果較為理想。
提取差異顯著的特征波段的算法多種多樣,況潤元等基于數(shù)據(jù)誤差范圍和植被光譜均值差提取湖泊濕地植被光譜差異波段;陳永剛等基于均值置信區(qū)間帶選擇區(qū)分不同樹種的特征波段,并通過VBA宏和C#開發(fā)程序篩選出最佳區(qū)分波段;胡遠寧等用光譜特征參量法、光譜指數(shù)法和光譜重排法提取光譜特征;王志輝等利用光譜微分、相關(guān)性分析、主成分分析提取光譜特征參數(shù)。由于馬氏距離在樹種識別及草地分類等領(lǐng)域的廣泛運用,同時,逐步判別分析法能夠篩選出對不同作物識別能力最大的波段,并顯示識別精度。因此本研究采用馬氏距離法進行提取,并用逐步分析法檢驗識別精度。馬氏距離法屬于基于類間可分性選取最優(yōu)區(qū)分波段的方法,這是高光譜最佳波段選擇的一個方向。
張富華等對草地種類進行識別,分類精度達80%;劉秀英等針對不同樹種之間的識別精度均大于81%;張豐等對6種水稻進行識別分類,識別精度達80%以上。這主要是由于所研究的對象本身的光譜差異以及采用的數(shù)據(jù)變換方法、差異波段提取算法以及分類算法不同所引起的。
由于馬鈴薯的品種繁多,種植區(qū)域廣泛以及地區(qū)之間氣候條件的差異,不同地區(qū)種植的品種不同。因此,今后的研究可以擴展到南方冬作區(qū)、中原二作區(qū)等區(qū)域。對于分類算法,相關(guān)研究結(jié)果表明,在訓(xùn)練樣本小的情況下,神經(jīng)網(wǎng)絡(luò)法算法(NN)優(yōu)于判別分析法(DA)。后續(xù)的研究也可以對比分析神經(jīng)網(wǎng)絡(luò)法算法與判別分析法波段的識別精度的差異。