羅 明,陸 洲※,徐飛飛,梁 爽,褚煜琴,郭 晗
(1.中國科學院地理科學與資源研究所,北京 100101;2.蘇州科技大學,江蘇蘇州 215009 )
大面積作物信息的獲取,對于我國優(yōu)化糧食生產(chǎn)布局、調(diào)整種植結(jié)構(gòu)都具有重要的戰(zhàn)略意義[1]。特別是作物的快速識別是作物面積獲取、長勢監(jiān)測及產(chǎn)量評估的基礎(chǔ)。
遙感技術(shù)以其信息感測的大尺度、高效率和多譜段,為當前作物監(jiān)測提供了重要手段和極其豐富的數(shù)據(jù)支持[2,3]。在作物的遙感識別方面,眾多的學者利用不同的圖像分類方法做了大量的研究,主要有基于像元的監(jiān)督分類、基于像元的非監(jiān)督分類和面向?qū)ο蟮姆诸惙椒ǖ萚4]。但是,受影像時相限制,大尺度下,特別是在種植條件復雜的地區(qū),分類精度有待進一步提升[5,6]。多時相的遙感分析[7,8]手段,即借助作物的季相生長特征,利用多時相影像疊加判別的方法,構(gòu)建多時相特征閾值判別模型,彌補了圖像分類法在地物復雜地區(qū)作物識別精度低的不足,成為目前區(qū)域尺度提高作物識別精度的重要途徑之一[9]。
如何快速地確定多時相閾值或?qū)崿F(xiàn)閾值的自動化計算,是當前實現(xiàn)遙感快速識別作物的關(guān)鍵。黃青等[10]構(gòu)建NDVI時序曲線,利用野外實測數(shù)據(jù)的迭代修正來確定閾值,取得了不錯的效果; 同樣,許玉萍等[11]利用傅立葉形狀描述子計算NDVI時序曲線與標準的水稻時序曲線形狀相似性距離,通過樣例數(shù)據(jù)探測未知像元與樣本的相似性距離閾值,從而判別雙季水稻種植區(qū)域,識別效果較理想。于子凡等[12]提出一種二叉決策樹的自動生成方法,并引入特征數(shù)組完成閾值的設(shè)定。程彬等[13]基于ASTER數(shù)據(jù)上地物范履職大小關(guān)系設(shè)定決策樹模型閾值,實現(xiàn)了對不同地物類型的分類。孫宇翼等[14]選用WEKA J48算法篩選最優(yōu)參數(shù)建立模型分類規(guī)則,分類精度明顯提升。此外,有學者通過多時相遙感影像上光譜標準差取值差異[15]的方法確定分割閾值提取作物的分布,同樣取得了不錯的分類精度。還有借助異源數(shù)據(jù)的融合分析[16,17]提取閾值,效果顯著?;诋斍暗拈撝翟O(shè)定方法的多時相判別手段,能夠?qū)崿F(xiàn)水稻、小麥、玉米和棉花等大宗作物分布的遙感識別,但是閾值提取的方法過于復雜,在具體分析過程中農(nóng)學人員難以參與其中,專業(yè)要求較高,閾值的提取通常使用SPSS 或者Excel等軟件進行半自動化計算,大范圍尺度上的定量化分析難以推廣; 反復迭代閾值參數(shù),從而獲得相對滿意的結(jié)果,耗時較長,難以適應(yīng)農(nóng)業(yè)生產(chǎn)上快速應(yīng)用的需求。
文章在總結(jié)前人工作的基礎(chǔ)上,以江蘇省水稻、小麥和玉米為研究對象,并以行政區(qū)縣為基礎(chǔ)的作業(yè)單元進行區(qū)域劃分及閾值設(shè)定,提出了一種基于少量樣本投射的閾值快速設(shè)定的方法,較好地提取多時相判別模型的閾值參數(shù),提高了模型閾值的區(qū)域適用性,實現(xiàn)大范圍作物分布的快速識別。
該研究借助多時相的GF1遙感影像,以行政區(qū)縣為基礎(chǔ)的作業(yè)單元進行影像的預處理,按作業(yè)單元進行NDVI特征的轉(zhuǎn)換,并獲取NDVI特征影像的值域; 然后通過野外采樣或目視解譯選取少量作物的樣點,獲取對應(yīng)時期監(jiān)測影像該樣點的NDVI值。并提出一種多期閾值快速設(shè)定的方法,將少量樣點投射到影像值域上獲取閾值區(qū)間,完成每一個作業(yè)單元一種作物的閾值設(shè)定。在多期閾值確定的基礎(chǔ)上,構(gòu)建多時相決策模型,進行多期閾值的疊加決策判別識別作物,最后進行精度評價。研究技術(shù)路線見圖1。
圖1 研究技術(shù)路線 圖2 研究區(qū)區(qū)位
江蘇省地處于中國東部沿海地區(qū),位于長江、淮河下游,經(jīng)緯度介于東經(jīng)116°18′~121°57′,北緯30°45′~35°20′,地理上跨越南北,屬于溫帶向亞熱帶的過渡性氣候。全省氣候溫和,四季分明,氣候資源豐富。多年平均氣溫13~16℃,雨量適中,年均降水量800~1 200mm。地形以平原為主,是我國水稻的優(yōu)勢產(chǎn)區(qū),常年種植水稻、小麥和玉米等糧食作物。
該研究選用國產(chǎn)GF1衛(wèi)星影像數(shù)據(jù),其所搭載的4個16m分辨率多光譜傳感器(WFV,Wide Field of View),重訪周期為4d,每個傳感器包含藍(0.45~0.52μm)、綠(0.52~0.59μm)、紅(0.63~0.69μm)和近紅外(0.77~0.89μm)4個波段。
由中國資源衛(wèi)星應(yīng)用中心(http://www.cresda.com/CN/)獲取16m分辨率遙感影像,并采用影像處理機(Image Process Machine,IPM)[18]技術(shù)批量完成影像的幾何精校正、輻射定標、以行政區(qū)縣為單元的裁剪等預處理。
不同作物因季相生長特征的不同,在遙感影像上呈現(xiàn)不同的光譜特征值。利用多光譜遙感影像不同通道光譜值組合成新的指數(shù),是遙感影像上識別作物的重要依據(jù)。NDVI(Normalized difference vegetation index,歸一化差值植被指數(shù))是應(yīng)用最廣泛的植被指數(shù),多時相NDVI的特征限定是不同植被提取的有效方法之一,其計算公式為:
NDVI=(Nir-Red)/(Nir+Red)
(1)
式(1)中,Nir、Red分別表示近紅外波段和紅波段。
該文提出一種基于少量樣本投射的閾值快速設(shè)定的方法,即利用少量實地采樣或目視解譯的作物樣點(20~30個)獲取該時相作物NDVI的范圍,并對該時相的遙感特征影像按照NDVI值域以一定的步長均分,由樣點獲取的NDVI范圍“投射”對應(yīng)影像NDVI值域上最鄰近的步長區(qū)間,即為作物單一時相的NDVI閾值,以此獲取多時相的NDVI閾值。
(2)
式(2)中,μi為樣本NDVI值的平均數(shù),δi2為樣本NDVI值的方差。
圖3 “投射”獲取閾值區(qū)間示意
利用關(guān)鍵時相NDVI特征影像,獲取影像的NDVI值域Di的最小值(min),并以步長(s)遞增(以最小值為起始值,最后一級可能不滿足步長要求,因不影響閾值故不討論),直至min+sc×s≥max(sc為步數(shù),max為影像的NDVI值域Di的最大值)。將Xi投射到分級區(qū)間Di上,尋找Xi落入Di分級重疊最多且相鄰最近的區(qū)間Ti,則Xi∈Ti,Xi∈Di,Ti∈Di,
(3)
式(3)中,a=μi-1.96δi2,b=μi+1.96δi2,k=s×fix((a-min)/s),f=s×fix((b-min)/s),fix為取整函數(shù)。
確定了每一時相的相閾值區(qū)間,即Ci左≤Ti≤Ci右,見表1。構(gòu)建多期閾值區(qū)間的決策提取計算模型,模型計算是基于空間疊加決策的方式,以影像的像元為基本單位,疊加同一位置相交的像元,排除不相交的像元。各期閾值條件是并的關(guān)系,綜合各期生長特征影像的閾值界定范圍,并將符合條件重新賦值給已經(jīng)創(chuàng)建新的影像N,初始N(j,c)=1,即:
表1 多期閾值區(qū)間
(4)
式(4)中,c為影像的行號,j為影像的列號。
江蘇省主要種植水稻、小麥和玉米三大糧食作物,其中水稻和玉米處于同一個生長季。選取典型植被的樣點繪制一年內(nèi)NDVI變化曲線圖,見圖3。水稻播種或移栽后,將處于相當長一段時間的泡田期,這也是水稻區(qū)別于其他作物的典型特征。隨著分蘗的增多,特別是完全封行后,生長量的擴大,NDVI值逐漸增大,到抽穗期時達到峰值,明顯高于其他植被,且高于同期生長的玉米; 之后隨著籽粒的成熟,葉綠素含量下降,NDVI值逐漸降低。玉米于6月中下旬播種出苗,從拔節(jié)開始,NDVI值逐漸上升,到抽穗期生長最旺盛,NDVI值最大,且峰值出現(xiàn)略早于水稻,之后伴隨葉子的枯萎,NDVI值逐漸下降。小麥于10月底播種,次年6月初收獲。拔節(jié)期前未封行,受裸露土壤的影響,NDVI一直處于低值; 拔節(jié)后,小麥生物量逐漸增加,抽穗時葉面積指數(shù)達到最大值,NDVI處于峰值階段,高于生育期接近的油菜等植被,之后伴隨成熟的推進,物質(zhì)向籽粒運輸,NDVI值隨之降低。根據(jù)三大作物及其他植被的生長特征,選取監(jiān)測時相,見表2。
表2 江蘇省水稻、小麥和玉米監(jiān)測影像數(shù)據(jù)表所用閾值數(shù)量
以江蘇省行政區(qū)縣為基礎(chǔ),對少量有作物種植且面積較小的區(qū)縣合并為一個作業(yè)單元,共有64個作業(yè)單元,如圖4。根據(jù)監(jiān)測時相及作業(yè)單元,選取2016年3—11月遙感影像,保證覆蓋提取單元作物關(guān)鍵生育期的3~4個時相,共使用96景無云遙感影像。按照一個作業(yè)單元,一種作物,一套閾值,利用少量樣本投射快速設(shè)定閾值的方法共產(chǎn)生150套閾值。江蘇省水稻、小麥和玉米監(jiān)測所用影像如表2。
圖3 江蘇省典型值被NDVI變化 圖4 作業(yè)單元及統(tǒng)計種植情況
對水稻、小麥和玉米按照作業(yè)單元分別提取,提取結(jié)果如圖5。從提取結(jié)果看,水稻和小麥種植在全省都有分布,主要集中在長江以北的江蘇中部及北部地區(qū); 玉米種植主要集中在蘇北灌溉總渠以北以及鹽城和南通部分地區(qū)。采用面積對比驗證和定位驗證的方式對提取結(jié)果進行精度評價。利用與統(tǒng)計年鑒的對比驗證表明,提取結(jié)果面積與統(tǒng)計面積誤差在10%以內(nèi),如圖6和表3; 利用樣點的空間定位驗證精度優(yōu)于0.88,如圖7和表3。
圖5 江蘇省三大作物提取結(jié)果
圖6 面積驗證 圖7 空間定位驗證
表3 隨機抽樣驗證和統(tǒng)計年鑒對比結(jié)果
該研究的主要數(shù)據(jù)源為GF1衛(wèi)星的WFV影像,該影像的空間分辨率16m,重訪周期4d,平衡了空間分辨率和時間分辨率的問題。相較以往的遙感影像源如MODIS、NOAA/AVHRR、ALOS、IKONOS、SPOT和HJ-1 CCD等,能夠更好地滿足作物生產(chǎn)的需求。因為定位驗證選用大范圍種植的地塊樣點,所以小麥的定位精度高; 但小麥的面積對比上相對誤差超過10%,經(jīng)實地查驗,是受小麥地塊附近少量種植的油菜影響。玉米的種植較分散,其定位精度較低,但面積對比誤差相對較小,可能存在錯分的情況。為進一步提升精度,對生育期相近的兩種作物,如冬小麥和油菜,冬小麥和大蒜的識別區(qū)分上效果不理想,下一步將引入同一尺度的GF6衛(wèi)星的紅邊波段數(shù)據(jù),提升作物區(qū)分的精度。該研究利用作物樣本數(shù)據(jù)服從正態(tài)分布的特征,將少量樣本的范圍“投射”到特征影像的值域上,來獲取閾值區(qū)間。這種簡單的閾值設(shè)定方法能夠快速響應(yīng)農(nóng)業(yè)生產(chǎn)的要求,且在實例應(yīng)用中效果理想。相較利用迭代方法的閾值提取方法[10],更容易為農(nóng)業(yè)從業(yè)人員所接受。在大范圍區(qū)域的處理上,以行政區(qū)縣為基礎(chǔ)的作業(yè)單元的區(qū)域劃分及閾值設(shè)定,保證了模型閾值的區(qū)域適用性。但對于大范圍作物的監(jiān)測按作業(yè)單元分區(qū)作業(yè)仍有一定的工作量,如何利用已有數(shù)據(jù)進行訓練樣點的自動選取確定閾值,有待進一步研究。
該研究以江蘇省水稻、小麥和玉米為研究對象,通過基于少量樣本投射的閾值快速設(shè)定方法,構(gòu)建遙感時相判別決策提取模型,并以行政區(qū)縣為基礎(chǔ)的作業(yè)單元,實現(xiàn)了大范圍作物種植分布的快速遙感監(jiān)測,所得如下結(jié)論。
(1)所選用的16m分辨率影像數(shù)據(jù),能夠適用于區(qū)縣尺度及大范圍的遙感監(jiān)測的應(yīng)用需求。
(2)以區(qū)縣為基礎(chǔ)的作業(yè)單元的閾值具有較強的區(qū)域代表性。一個作業(yè)單元、一種作物適用一套閾值,可有效提升作物種植分布遙感監(jiān)測的精度。
(3)江蘇省水稻、小麥和玉米種植分布的面積相對誤差在11%以內(nèi),定位精度優(yōu)于88%,均滿足應(yīng)用化需求,證明利用基于少量樣本數(shù)據(jù)確定模型閾值的方法,具備一定的可操作性和實用性。