尹華鋒,蘇 程,馮存均,李玉琴,黃智才,章孝燦*
(1.浙江大學(xué)地球科學(xué)學(xué)院空間信息技術(shù)研究所,杭州310027;2.浙江省地理信息中心,杭州310012)
糧食是人類生存的必需品,糧食安全是維系社會穩(wěn)定的前提,是全世界許多國家共同面臨的重大問題[1]。及時準(zhǔn)確地獲取糧食種植信息對糧食價格預(yù)測、糧食生產(chǎn)指導(dǎo)、糧食安全保障等具有重要意義[2]。
水稻是世界主要糧食作物之一[3],及時掌握水稻種植信息是一項十分必要的工作。由于遙感技術(shù)具有覆蓋范圍廣、探測速度快、現(xiàn)勢性強、判斷客觀等優(yōu)勢,目前已成為獲取水稻種植信息的一種重要手段[4-5]。近年來,隨著高分遙感對地觀測技術(shù)的發(fā)展,國內(nèi)外不少學(xué)者對利用高分辨率遙感圖像提取水稻種植信息展開了研究,提出了許多水稻種植信息提取方法,主要可分為基于像元的分類提取方法[6-7]、面向?qū)ο蟮姆诸愄崛》椒╗8-12]和基于地塊的分類提取方法[13-14]。但基于像元的分類提取方法僅利用了圖像的光譜信息,由于高分辨率遙感圖像上的地物細(xì)節(jié)信息十分豐富,地物內(nèi)部異質(zhì)性增強,干擾了類間光譜差異的認(rèn)知,單純依靠水稻光譜特征難以取得良好的提取效果;面向?qū)ο蟮姆诸愄崛》椒ǖ乃咎崛【葍?yōu)于基于像元的分類提取方法,但其難點在于分割尺度的確定和對象特征參數(shù)的選擇;基于地塊的分類提取方法需要有與分類圖像時相對應(yīng)的地塊矢量數(shù)據(jù)作為支撐,應(yīng)用成本較高。也有學(xué)者通過對高空間和高時間分辨率遙感數(shù)據(jù)的協(xié)同利用,從米級分辨率圖像上提取農(nóng)田地塊結(jié)構(gòu)信息,結(jié)合多時相中分辨率圖像的光譜及其變化特征,構(gòu)建反映水稻生長過程的時間序列與水稻識別模型,實現(xiàn)農(nóng)田地塊尺度的水稻識別;但由于中分辨率圖像的空間分辨率的限制,對零碎地塊及多作物地塊的處理效果仍有待提高[15-16]。
實際上,受天氣條件制約,一些水稻種植地區(qū)在水稻生長周期內(nèi)難以獲取多期高質(zhì)量圖像,因此,充分利用單期高質(zhì)量、高分辨率圖像實現(xiàn)水稻種植信息的準(zhǔn)確提取,具有重要的現(xiàn)實意義。本文針對高分辨率遙感圖像上水稻種植區(qū)域細(xì)節(jié)信息十分豐富、光譜組成多種多樣的特點,提出了一種基于水稻樣本知識挖掘的水稻種植信息提取方法。該方法以構(gòu)成水稻種植信息的水稻、泥土、水、雜草、浮萍等各種地物信息為分析的基本單元,依據(jù)空間自相關(guān)性理論,挖掘基于各種基本單元的水稻種植信息的組合特征,進(jìn)而提出一種水稻種植信息提取策略:首先,分割圖像得到各類混合地物信息的基本單元;其次,通過分析水稻樣本圖斑所包含的基本單元種類確定構(gòu)成水稻的基本單元類型,并將相應(yīng)類型的基本單元都?xì)w入初始水稻種植區(qū);最后,通過分析矢量化的初始水稻種植區(qū)圖斑內(nèi)的基本單元的組合特征與水稻樣本圖斑內(nèi)的基本單元的組合特征的相似性,將不符合水稻種植信息基本單元組合規(guī)律的初始水稻種植區(qū)圖斑予以排除,實現(xiàn)水稻種植信息的準(zhǔn)確提取。
1.1.1 高分辨率遙感圖像水稻特征分析
水稻種植信息實際是水稻、泥土、水、雜草、浮萍等地物的混合信息,水稻種植信息的混合性在高分辨率遙感圖像上表現(xiàn)得尤為明顯。水稻種植信息的提取實質(zhì)上是一種混合信息的提取,這種混合信息在高分辨率圖像上表現(xiàn)出如下特征。
1)光譜多樣性
在高分辨率圖像上,復(fù)雜的地表通過豐富的細(xì)節(jié)信息呈現(xiàn)。水稻種植地塊作為一種混合地物,在高分辨率遙感圖像上顯現(xiàn)出豐富多樣的光譜信息,且由于播種時間、播種方式、播種環(huán)境等的差異,不同水稻種植地塊的光譜組合也多種多樣。如圖1所示,水稻種植地塊包含了聚類分析結(jié)果中的多種聚類,且不同水稻種植地塊的聚類組成存在著差異,反映了水稻種植信息在高分辨率遙感圖像上的光譜多樣性。
2)空間自相關(guān)性
TOLBER[17]在1970年提出了著名的地理學(xué)第一定律:任何地物都與其他地物相聯(lián)系,但鄰近的地物之間的聯(lián)系更為緊密(Everything is related to everything else,but near things are more related than distant things)。李小文等[18]在2007年提出了地理學(xué)第一定律與時空鄰近度的關(guān)系。該定律描述了地理空間實物的基本規(guī)律。
圖1 高分辨率遙感圖像水稻種植信息聚類結(jié)果示意Fig.1 Schematic diagram of cluster results of rice fields in high resolution remote sensing images
表1 水稻種植地塊內(nèi)各聚類面積占比Table1 Proportions of different clusters in rice fields %
以各地塊為統(tǒng)計單元,忽略占比小于1%的聚類以減弱噪聲影響,對圖1中水稻種植地塊內(nèi)各種聚類的面積占比情況進(jìn)行統(tǒng)計發(fā)現(xiàn),不同水稻種植地塊覆蓋的聚類類型相似(表1)。通過計算不同水稻種植地塊聚類組合比例的相關(guān)系數(shù)(表2)發(fā)現(xiàn),不同水稻種植地塊內(nèi)聚類的組合比例相關(guān)性較高,說明水稻種植地塊光譜組合情況類似,某些光譜總是以一定比例組合出現(xiàn)在水稻種植地塊中,這符合地理學(xué)第一定律,反映了水稻種植信息在高分辨率遙感圖像上的空間自相關(guān)性。
表2 水稻種植地塊聚類組合比例相關(guān)系數(shù)Table2 Correlation coefficients of the proportions of different clusters in rice fields
1.1.2 高分辨率遙感圖像水稻樣本知識挖掘
針對水稻種植信息在高分辨率遙感圖像上表現(xiàn)出的光譜多樣性特征和空間自相關(guān)性特征,進(jìn)行了以下水稻種植信息光譜組合規(guī)律挖掘。
1)水稻基元與水稻種植圖斑
遙感圖像由像元組成,然而單個像元的光譜不具有統(tǒng)計意義,也無法體現(xiàn)圖像光譜在空間上的分布特征。因此,為便于研究水稻種植信息的光譜組合規(guī)律,本文以光譜相近的鄰接像元組成的連通區(qū)域為基本單元(以下簡稱為基元)對圖像光譜信息進(jìn)行概括?;瓤梢悦枋銎浯淼膱D像區(qū)域的光譜特征,又能夠體現(xiàn)其代表的圖像區(qū)域的空間分布特征。本文將構(gòu)成水稻種植信息的基元稱為水稻基元,鄰接水稻基元組合形成的連通區(qū)域稱為水稻種植圖斑。水稻種植圖斑基元組合規(guī)律能夠代表圖像上對應(yīng)區(qū)域水稻種植信息的光譜組合規(guī)律。
2)水稻種植圖斑基元組合特征
從水稻種植圖斑的基元組成、基元組合比和基元聚集程度3方面對水稻種植圖斑的基元組合規(guī)律進(jìn)行特征描述。
水稻種植圖斑基元組成特征:由1.1.1節(jié)分析可知,水稻種植信息在高分辨率遙感圖像上表現(xiàn)出光譜多樣性,因此水稻種植圖斑所包含的基元類別多樣。本文通過水稻基元光譜特征向量[式(1)]對基元的光譜特征進(jìn)行描述。水稻基元光譜特征向量概化了水稻基元對應(yīng)圖像區(qū)域在圖像各波段上的光譜信息,把水稻種植圖斑內(nèi)各類水稻基元光譜特征向量集合成水稻種植圖斑基元組成特征,能反映出水稻種植圖斑對應(yīng)水稻種植信息的光譜成分。
水稻種植圖斑基元組合比特征:經(jīng)1.1.1節(jié)分析發(fā)現(xiàn),在高分辨率遙感圖像上水稻種植地塊的聚類組成比例相似,因此水稻種植圖斑的基元組合比例應(yīng)是相似的。本文通過基元優(yōu)勢度[式(2)]對水稻種植圖斑內(nèi)基元的面積占比進(jìn)行描述。水稻基元優(yōu)勢度越高,說明水稻基元對應(yīng)的光譜特征在該區(qū)域中的主導(dǎo)性越高。因此,把水稻種植圖斑內(nèi)各類水稻基元的優(yōu)勢度集合成水稻種植圖斑基元組合比特征,能描述水稻種植圖斑內(nèi)基元的組合比例關(guān)系,可反映出水稻種植圖斑對應(yīng)水稻種植信息光譜空間的基本分布情況。
水稻種植圖斑基元聚集度特征:由于水稻種植往往較為規(guī)整、連續(xù),在高分辨率遙感圖像上水稻紋理較為平滑,因此水稻種植圖斑內(nèi)的基元往往較為規(guī)則、聚集。本文通過水稻基元聚集度[式(3)]描述水稻種植圖斑內(nèi)基元的聚集程度。不同水稻基元代表不同的光譜特征,把水稻種植圖斑內(nèi)各類水稻基元的基元聚集度集合成水稻種植圖斑基元聚集度特征,可在一定程度上反映出水稻種植圖斑對應(yīng)水稻種植信息的光譜組成紋理情況。
圖2 基元聚集度示意Fig.2 Schematic diagram of aggregation indices of base-unit
3)水稻種植圖斑特征分布
把水稻種植圖斑F內(nèi)i類水稻基元的光譜特征向量和聚集度組合成i類水稻基元特征向量,計算公式如下:
本文通過下式描述水稻種植圖斑F的基元組合特征:
式中:F為水稻種植圖斑;n為F內(nèi)水稻基元類別數(shù)。
XF描述了水稻種植圖斑F的基元成分、各基元的光譜特征和空間特征及成分基元的組合比例關(guān)系,能反映對應(yīng)水稻種植信息的光譜組合規(guī)律。
基于水稻樣本知識挖掘,本文提出了一種水稻種植信息提取策略:對高分辨率遙感圖像進(jìn)行光譜分割得到對應(yīng)的基元圖像;通過水稻樣本圖斑與基元圖像的疊置,分析確定哪些類型的基元是水稻基元,并將對應(yīng)類型歸入水稻基元類型集。依據(jù)水稻基元類型集,將圖像基元分為水稻基元和非水稻基元2大類,從而將圖像初步劃分為水稻種植區(qū)與非水稻種植區(qū);矢量化水稻種植區(qū)得到初始水稻種植圖斑,計算所有水稻樣本圖斑的特征分布并歸入水稻樣本圖斑特征分布庫以量化描述水稻種植信息光譜組合規(guī)律;通過計算初始水稻種植圖斑特征分布與庫中特征分布的相似性,將不符合水稻種植信息光譜組合規(guī)律的初始水稻種植圖斑認(rèn)為是混淆圖斑,予以排除。整體技術(shù)流程如圖3所示。
1)基元獲取
高分辨率遙感圖像水稻種植信息提取的基礎(chǔ)工作是獲取基元?;菆D像上光譜相近的鄰接像元組成的連通區(qū)域,不同基元代表了不同的光譜特征。本文基于K-均值(K-means)聚類算法對高分辨率遙感圖像進(jìn)行光譜分割,將由像元組成的高分辨率遙感圖像概化為由內(nèi)部光譜均質(zhì)的基元組成的基元圖像,實現(xiàn)基元獲取。
2)初始水稻種植圖斑提取
水稻基元分析。將水稻樣本圖斑與基元圖像進(jìn)行疊置,通過分析水稻樣本圖斑主要包含的基元種類確定哪些類型的基元是水稻基元。設(shè)定閾值α(α≤1,α一般取0.9以剔除噪聲基元),對水稻樣本圖斑內(nèi)基元的優(yōu)勢度按由高到低的順序進(jìn)行累加,直到累加值超過α,其中未參與累加的基元認(rèn)為是非水稻基元,參與累加的基元認(rèn)為是水稻基元,并將對應(yīng)的基元類型歸入水稻基元類型集。例如,對圖4中的水稻樣本圖斑①~④進(jìn)行水稻基元分析,對其內(nèi)的基元優(yōu)勢度進(jìn)行排序并累加,水稻樣本圖斑①中基元類型為35、29、38、36的基元優(yōu)勢度和為0.94,水稻樣本圖斑②中基元類型為35、38、29、36的基元優(yōu)勢度和為0.92,水稻樣本圖斑③中基元類型為35、29、38、36、40的基元優(yōu)勢度和為0.92,水稻樣本圖斑④中基元類型為35、38、29、36、44、40的基元優(yōu)勢度和為0.94,因此基元類型35、29、38、36、40、44均被認(rèn)為是水稻基元類型,歸入水稻基元類型集。
初分類。依據(jù)經(jīng)水稻基元分析得到的水稻基元類型集,對基元圖像進(jìn)行初分類:將基元圖像上基元類型屬于水稻基元類型集的基元的值都標(biāo)為1,其余基元的值都標(biāo)為0,得到一幅初步區(qū)分水稻種植區(qū)與非水稻種植區(qū)的二值圖像。圖4中區(qū)域基元圖像的初分類結(jié)果如圖5所示。
初始水稻種植圖斑獲取。矢量化上一步得到的二值圖像(0視為背景值,不參與矢量化),得到一組初始圖斑(圖4區(qū)域二值圖像矢量化得到的初始圖斑如圖6A所示)。再對初始圖斑進(jìn)行濾波處理,濾除面積較小的細(xì)碎圖斑及圖斑中面積較小的孤島,得到較為規(guī)整的初始水稻種植圖斑(圖4區(qū)域初始圖斑經(jīng)濾波處理后得到的初始水稻種植圖斑結(jié)果如圖6B所示)。
圖3 基于樣本知識挖掘的水稻種植信息提取流程Fig.3 Flow diagram for rice cropping information extraction based on sample knowledge mining
圖4 水稻樣本圖斑基元類別組成Fig.4 Base-unit types in four rice field sample polygons
只要水稻樣本具有代表性,利用這種提取方法就能把所有與水稻樣本圖斑光譜成分相似的圖像區(qū)域都提取出來。
3)混淆圖斑剔除
初始水稻種植圖斑只是基元成分與水稻樣本圖斑相似,由于遙感圖像存在異物同譜現(xiàn)象,某些初始水稻種植圖斑對應(yīng)的圖像區(qū)域有可能不是水稻,即為混淆圖斑。為了獲取準(zhǔn)確的水稻種植信息,需將混淆圖斑剔除。
由1.1節(jié)分析可知,水稻種植信息的光譜存在一定的組合規(guī)律,因此可根據(jù)初始水稻種植圖斑的光譜是否符合這種規(guī)律判別其是否為混淆圖斑。水稻種植圖斑特征分布[式(5)]能反映對應(yīng)水稻種植信息的光譜組合規(guī)律,而水稻樣本圖斑特征分布符合水稻種植信息光譜組合規(guī)律,因此通過比較初始水稻種植圖斑特征分布是否與水稻樣本圖斑特征分布相似就可以判斷初始水稻種植圖斑的光譜是否符合水稻種植信息光譜組合規(guī)律。要度量特征分布的相似性,需要構(gòu)建相似性度量函數(shù)。常用的統(tǒng)計距離計算方法如Bhattacharyya距離、Kolmogorov-Smirnov距離、Jensen-Shannon散度、總變分(total variation)等無法對離散化定義域不同(不同水稻種植圖斑基元成分不完全相同)的特征分布進(jìn)行比較計算。因此,本文提出了一種基于陸地移動距離(earth mover’s distance,EMD)的特征分布相似性度量方法。EMD是一種直方圖的相似度量值,可度量2個分布之間的距離[19-20]。通過計算每個水稻樣本圖斑的基元組合特征得到每個水稻樣本圖斑的特征分布,并將所有水稻樣本圖斑的特征分布集合成水稻樣本圖斑特征分布庫以量化描述水稻種植信息光譜組合規(guī)律。通過計算初始水稻種植圖斑的基元組合特征得到其特征分布,計算初始水稻種植圖斑特征分布與水稻樣本圖斑特征分布庫中每個分布的EMD,取最小值作為初始水稻種植圖斑與水稻樣本圖斑的差異距離,若差異距離過大,則認(rèn)為初始水稻種植圖斑是混淆圖斑,將其剔除。圖4中區(qū)域混淆圖斑剔除結(jié)果如圖7所示,其中:圖7A為初始水稻種植圖斑結(jié)果圖;圖7B為剔除混淆圖斑后的水稻種植圖斑結(jié)果圖,本圖中差異距離閾值為3(不同圖像需根據(jù)實際情況確定)。
圖5 基元圖像初分類結(jié)果Fig.5 Preliminary classification result of base-unit image
圖6 初始圖斑(A)和初始水稻種植圖斑(B)Fig.6 Initial polygons(A)and initial rice cropping polygons(B)
圖7 混淆圖斑剔除Fig.7 Elimination of confusion polygons
本文以浙江省為研究區(qū),其地處長江三角洲南翼,陸域面積中丘陵山地占74.63%,平原和盆地占20.32%,河流和湖泊占5.05%,有“七山一水兩分田”一說。水稻是浙江省的主要糧食作物,其播種面積和產(chǎn)量常年分別約占糧食作物總播種面積和總產(chǎn)量的70%和80%。浙江省耕地地塊破碎,種植結(jié)構(gòu)復(fù)雜,插花、套種現(xiàn)象較多,水稻種植多以家庭為單位進(jìn)行,同一地區(qū)的水稻種植方式、種植時間存在差異。為體現(xiàn)本文水稻種植信息提取方法的適用性,本研究選取了浙江省境內(nèi)位于海鹽縣南部平原地區(qū)和位于諸暨市南部丘陵地區(qū)的2個水稻種植典型區(qū)域作為實驗區(qū)。
本研究選取兩景能完全覆蓋這2個實驗區(qū)的高分辨率遙感圖像作為基礎(chǔ)圖像,具體圖像信息如表3所示。本研究的基礎(chǔ)數(shù)據(jù)還包括國家統(tǒng)計局浙江省調(diào)查總隊提供的位于實驗區(qū)內(nèi)的2016年浙江省第3次全國農(nóng)業(yè)普查夏播樣方地塊數(shù)據(jù),其中3/5用于樣本繪制參考,2/5用于精度評價。
表3 實驗區(qū)所用圖像信息Table3 Information of two images for experimental zone
應(yīng)用1.2節(jié)所述的水稻種植信息提取策略得到實驗區(qū)水稻種植信息,如圖8所示,提取結(jié)果與水稻種植的實際情況較為吻合。由于本研究的提取對象是水稻,因此將分類評價體系中的分類類型分為水稻和其他2大類,考慮到驗證樣方數(shù)量有限且需驗證提取結(jié)果的位置精度,本文利用驗證樣方內(nèi)距離樣方地塊邊緣距離大于2像素的所有像元對提取結(jié)果進(jìn)行精度評價,評價結(jié)果如表4、表5所示。海鹽實驗區(qū)水稻種植信息提取總體精度達(dá)96.77%,Kappa系數(shù)為0.94;諸暨實驗區(qū)水稻種植信息提取總體精度達(dá)96%,Kappa系數(shù)為0.89。上述結(jié)果驗證了用本文方法提取水稻種植信息的有效性。
圖8 實驗區(qū)水稻種植信息提取結(jié)果Fig.8 Rice cropping information extraction’s mapping results in experimental zones
針對水稻在高分辨率遙感圖像上的特點,提出了一種基于樣本知識挖掘的水稻種植信息提取方法,該方法已應(yīng)用于浙江省第3次全國農(nóng)業(yè)普查水稻種植空間分布遙感測量工作中,實際的水稻種植信息提取結(jié)果表明本文所描述的方法具有較好的提取效果。該方法有如下特點:
表4 海鹽實驗區(qū)水稻提取結(jié)果精度評價Table4 Confusion matrix for rice cropping information extraction’s mapping results in Haiyan experimental zone
表5 諸暨實驗區(qū)水稻提取結(jié)果精度評價Table5 Confusion matrix for rice cropping information extraction’s mapping results in Zhuji experimental zone
1)通過分析高分辨率遙感圖像上的水稻特征,發(fā)現(xiàn)水稻種植信息的混合光譜存在一定的組合規(guī)律,符合地理學(xué)第一定律;并據(jù)此將水稻種植信息表示成代表不同光譜的基元組合,以便于分析水稻種植信息混合光譜的組合規(guī)律。
2)提出了一種水稻種植信息提取策略:根據(jù)水稻樣本圖斑的基元成分確定水稻基元類型,分別合并水稻基元和非水稻基元,從而將圖像初步劃分成水稻種植區(qū)和非水稻種植區(qū);矢量化初始水稻種植區(qū)得到初始水稻種植圖斑,通過比較初始水稻種植圖斑與水稻樣本圖斑特征分布的相似性,篩選出符合水稻樣本光譜組合規(guī)律的水稻種植圖斑,得到最終的提取結(jié)果。
浙江大學(xué)學(xué)報(農(nóng)業(yè)與生命科學(xué)版)2018年6期