王冬利,張安兵,趙安周,李 靜
(1. 河北工程大學礦業(yè)與測繪工程學院,河北 邯鄲 056038; 2. 河北工程大學河北省煤炭資源綜合開發(fā)與利用協(xié)同創(chuàng)新中心,河北 邯鄲 056038)
冬小麥是全球各國重要的糧食作物,掌握其時空分布可為農(nóng)業(yè)監(jiān)測、水資源調(diào)控、糧食安全等提供基礎信息[1- 2]。衛(wèi)星遙感技術具有大區(qū)域、多源、多時空尺度的數(shù)據(jù)獲取能力[3],能夠相對精確地提取冬小麥。因此,高中低空間分辨率衛(wèi)星影像數(shù)據(jù)在冬小麥種植信息提取方面得到了廣泛應用,如基于MODIS、陸地衛(wèi)星數(shù)據(jù)、Aster、環(huán)境與災害監(jiān)測小衛(wèi)星、WorldView- 3等衛(wèi)星影像[4- 8],采用監(jiān)督分類、決策樹分類、支持向量機、面向?qū)ο蠓诸悺⒉ㄗV庫匹配等方法[9- 11],結合線性混合像元模型、模糊數(shù)學、抽樣方法和時間序列等技術[12- 15],能夠提取不同區(qū)域內(nèi)的冬小麥種植信息[16]。
綜上所述,冬小麥種植信息遙感提取方法主要集中在應用監(jiān)督學習的算法,該系列方法顧及農(nóng)作物的物候特征、光譜特征及紋理特征等,在農(nóng)作物精細化分類上取得了一定效果,但是也存在一些問題,如較嚴重地依賴地面采樣數(shù)據(jù)、人為干擾因素大、自動化程度低、普適性差等。本文對應用非監(jiān)督分類技術提取冬小麥種植信息的方法進行深入研究,提出一種新的非監(jiān)督分類冬小麥種植信息提取模型,并以河北省辛集市為例進行試驗研究。
研究區(qū)域選取河北省辛集市,該區(qū)域位于華北平原,地勢平坦,總面積約為950 km2,其中耕地面積約650 km2。主要農(nóng)作物為冬小麥、玉米及果樹。
本文以空間分辨率為16 m的國產(chǎn)衛(wèi)星高分一號(GF- 1)多光譜數(shù)據(jù)為數(shù)據(jù)源;辛集市行政邊界來自于全國1∶400萬縣矢量邊界數(shù)據(jù)。驗證樣本點數(shù)據(jù)通過隨機撒點方法,結合Google Earth地圖和多期高分一號影像數(shù)據(jù)獲取。
本文提出的模型原理是以歸一化植被指數(shù)(NDVI)作為冬小麥信息提取的判別指標,以非監(jiān)督分類為核心,結合多尺度技術,即空間尺度由大到小、分辨率由粗到細,逐層剔除非冬小麥地物,從而達到由概略到具體、逐步精細、準確提取冬小麥種植信息的目的。
1.2.1 多尺度表達
多尺度影像處理技術是指對同一區(qū)域采用多個尺度的影像來表達,并且在不同尺度影像上分別進行處理。在不同尺度上,遙感影像的某些特征信息不同,這樣某些影像處理的效果也會不同。多尺度技術中的尺度可以是空間分辨率,也可以是時間分辨率。本文采用的是基于空間分辨率的多尺度技術,并通過重采樣方法實現(xiàn)對同一區(qū)域多空間尺度的表達,如圖1所示。
1.2.2 非監(jiān)督分類
非監(jiān)督分類是一種聚類統(tǒng)計分析方法。本文采用經(jīng)典聚類方法——K- means算法進行試驗。K- means算法需要提前輸入類別數(shù)目(聚類中心個數(shù)),并且類別數(shù)目對分類精度影響非常大,而一個區(qū)域的類別數(shù)通常情況下是很難準確獲得的。例如,本文的研究區(qū)辛集市內(nèi)地物具體種類不確定,但是本文提取的目標地物為冬小麥,若將研究區(qū)內(nèi)的地物粗略地劃分為兩種類別:一種是冬小麥,另一種是非冬小麥。試驗發(fā)現(xiàn),這樣粗略劃分類別并應用K- means算法提取冬小麥的效果不好,分類結果偏大。經(jīng)分析,主要原因在于:根據(jù)NDVI原理,研究區(qū)中道路、水體、裸地及建筑物等主要非冬小麥地物位于NDVI低值區(qū)域,冬小麥處于NDVI高值區(qū)域,NDVI值中間部分同時包含冬小麥和非冬小麥信息(如圖1中左數(shù)第一個方框所示)。當應用K- means算法時,無論輸入類別為2類還是3類,NDVI值中間范圍內(nèi)的地物分類誤差較大,從而影響了整體分類精度。
1.2.3 非監(jiān)督分類與多尺度結合
針對上述問題,本文結合多空間尺度分析技術,提出試驗改進流程(如圖2所示),試驗結果證實該方法可以解決由于類別數(shù)目不能準確確定所帶來的非監(jiān)督分類精度不理想的問題。具體流程如下:①基于原始影像數(shù)據(jù),通過重采樣技術,獲取更大尺度(更低分辨率)數(shù)據(jù),構建多尺度表達。②由于在大尺度(低空間分辨率)遙感影像上地物綜合特征更明顯,同時研究區(qū)內(nèi)冬小麥主要呈大面積或細長狀分布形態(tài),因此當研究區(qū)遙感影像通過重采樣方法生成大尺度影像數(shù)據(jù)時,絕大部分冬小麥能夠被綜合為NDVI高值區(qū)域的冬小麥,當然其中很少部分冬小麥會被誤綜合為NDVI中值區(qū)域的干擾地物。此時,當輸入類別數(shù)目為兩類(冬小麥和非冬小麥)時,基于升尺度后的NDVI數(shù)據(jù),K- means算法提取的冬小麥信息包括NDVI高值區(qū)域和部分中值區(qū)域。③應用大尺度下提取的冬小麥種植范圍掩膜下一個較小尺度NDVI數(shù)據(jù),掩膜后利用非監(jiān)督分類進行分類,類別數(shù)目依然設為兩類(冬小麥和非冬小麥)。④重復以上步驟,直到最小的尺度數(shù)據(jù)(原始數(shù)據(jù))為止,當最小尺度NDVI數(shù)據(jù)經(jīng)過掩膜后,NDVI數(shù)據(jù)只剩下兩類地物:冬小麥和干擾地物。其中,絕大部分冬小麥位于NDVI高值區(qū)域,少量冬小麥位于中值區(qū)域,絕大部分的干擾地物位于NDVI低值區(qū)域。此時,當輸入類別數(shù)目為2,應用K- means算法提取冬小麥時,類別數(shù)目不準確對提取結果的影響會很小,從而使得提取精度得到極大提高。
1.2.4 流程步驟
首先選取3月初至4月上旬的遙感數(shù)據(jù),因為該時期正處于冬小麥返青和拔節(jié)期,其他綠色植被正處于枯黃狀態(tài),冬小麥的NDVI值相對較大,而其他非冬小麥地物的NDVI值較小。然后,結合圖2流程提取冬小麥種植信息。具體而言:①先將所選擇的GF- 1 NDVI數(shù)據(jù)升尺度為原始數(shù)據(jù)尺度的2倍、3倍,即升尺度后數(shù)據(jù)的空間分辨率分別為32和48 m;②基于最大尺度、最粗分辨率的遙感數(shù)據(jù)(空間分辨率為48 m的NDVI遙感數(shù)據(jù)),應用非監(jiān)督分類將研究區(qū)分為兩大類,一類為冬小麥候選區(qū)域,另一類為非冬小麥區(qū)域;③以②提取結果中的冬小麥候選區(qū)域掩膜下一級尺度遙感數(shù)據(jù)(空間分辨率為32 m的NDVI數(shù)據(jù)),然后進行非監(jiān)督分類。同樣輸入類別數(shù)目為兩類:一類為冬小麥候選區(qū)域,另一類為非冬小麥區(qū)域。同理,最后再對空間分辨率為16 m的原始NDVI數(shù)據(jù)進行掩膜和非監(jiān)督分類,從而得到最終冬小麥種植區(qū)域,并對提取結果進行精度驗證。
由于研究區(qū)內(nèi)野草、樹木等其他綠色干擾地物在4月初時基本還處于枯黃狀態(tài),因此本次試驗采用2014年4月3日GF- 1遙感影像數(shù)據(jù),以NDVI作為冬小麥信息提取判別指標,應用本文提出的非監(jiān)督分類模型提取2014年辛集市冬小麥種植信息,提取的結果如圖3和表1所示。
表1 辛集市冬小麥面積
基于驗證樣本點數(shù)據(jù),應用混淆矩陣方法對非監(jiān)督分類模型進行精度驗證,驗證精度見表2。
表2 冬小麥非監(jiān)督分類模型精度驗證
基于2014年4月3日GF- 1影像,應用最大似然監(jiān)督分類法提取冬小麥358.00 km2(見表1),其空間分布如圖3(b)所示。將非監(jiān)督分類模型和監(jiān)督分類兩種提取結果作混淆矩陣,Kappa系數(shù)為0.87,整體精度為95.04%。這證明:對于研究區(qū)內(nèi)的冬小麥,本文提出的非監(jiān)督分類模型的提取結果與監(jiān)督分類方法高度相似。此外,表1和表2證明:該模型是一種逐層剔除非冬小麥地物信息、逐層精確冬小麥種植面積的過程,即由419.09 km2到373.24 km2,再到最終的352.44 km2,結果符合該模型中逐層精細、準確地提取冬小麥種植信息的原理和目的;同時該模型的制圖精度和用戶精度都在92%以上,具有較高的精度。
該模型也存在需要進一步完善的地方:①該模型只對GF- 1數(shù)據(jù)進行了試驗,后續(xù)有待開展其他數(shù)據(jù)源的試驗;②該模型在數(shù)據(jù)預處理中未考慮去除地物干擾和增強目標地物信息,后續(xù)工作中會開展相關工作研究;③該模型的研究區(qū)域范圍是縣域尺度,后續(xù)可以嘗試更多尺度的應用。
本文以河北省辛集市為研究區(qū),應用本文提出的非監(jiān)督分類模型提取了2014年辛集市冬小麥種植信息,主要研究結果為:①分析了由于非監(jiān)督分類初始輸入的分類數(shù)目難以準確確定,從而導致冬小麥種植信息提取精度不高的問題,并通過多尺度技術對其加以改進,最終構建了一種新的冬小麥非監(jiān)督分類提取模型,該模型的提取精度較高,是一種新的、行之有效的冬小麥種植信息提取方法。②對于研究區(qū)內(nèi)的冬小麥,與監(jiān)督分類相比,本文提出的非監(jiān)督分類模型具有與監(jiān)督分類相似的精度,同時又具有無需訓練樣本、人為主觀因素少、自動化程度高等特點。