汪荃,陳軍軍
(1.中南勘察基礎(chǔ)工程有限公司,武漢 430081;2.湖北正紐地理信息有限公司,湖北 黃石 435006)
近年來(lái),中國(guó)水稻種植面積逐年減少,因此需要利用遙感技術(shù)實(shí)時(shí)精確獲取水稻空間分布及種植面積信息為各級(jí)政府指導(dǎo)水稻生產(chǎn)、平衡區(qū)域供需提供參考。目前,多數(shù)遙感傳感器具有高光譜、高分辨率、長(zhǎng)時(shí)間觀測(cè)等特點(diǎn),能夠在遙感監(jiān)測(cè)農(nóng)作物生長(zhǎng)信息方面發(fā)揮很大的作用,從而大大提升農(nóng)業(yè)生產(chǎn)效率[1-5]。農(nóng)作物生長(zhǎng)信息大多均由中分辨率遙感衛(wèi)星SPOT、Landsat等遙感監(jiān)測(cè),苗翠翠等[6]利用MODIS遙感影像對(duì)江蘇省水稻種植面積進(jìn)行監(jiān)測(cè)分析,Chen等[7]利用MODIS時(shí)間序列影像對(duì)湄公河三角洲上游的水稻種植強(qiáng)度進(jìn)行監(jiān)測(cè)。而Sentinel-2衛(wèi)星影像數(shù)據(jù)雖然較少使用在農(nóng)作物遙感監(jiān)測(cè)上,但是其分辨率高、覆蓋范圍廣,適用于對(duì)農(nóng)作物進(jìn)行監(jiān)測(cè)。
因此,本研究采用Sentinel-2衛(wèi)星影像數(shù)據(jù)作為數(shù)據(jù)源,采用基于像素分類(lèi)的最大似然法、支持向量機(jī)法對(duì)研究區(qū)水稻信息進(jìn)行提取,3種植被指數(shù)NDVI、NDGI、RVI及其組合并結(jié)合多時(shí)間序列影像數(shù)據(jù)提取研究區(qū)水稻種植信息,并采用混淆矩陣對(duì)分類(lèi)結(jié)果進(jìn)行精度評(píng)價(jià)和結(jié)果分析,旨在得到適合于此研究區(qū)的最優(yōu)提取方案。
研究區(qū)域?yàn)槭徍惺徍h南部面積為118.8 km2的水稻種植區(qū),其位于長(zhǎng)江下游,東經(jīng)117°40′—118°44′、北緯30°19′—31°34′,屬亞熱帶濕潤(rùn)季風(fēng)氣候,雨量充沛,光照充足。年平均氣溫在15~16℃,年均日照時(shí)長(zhǎng)約2 000 h,年降雨量約為1 200 mm,該區(qū)域主要種植水稻、玉米、高粱、小麥、豆類(lèi)等糧食作物[8]。
歐州航天局發(fā)射的Sentinel-2衛(wèi)星,是一枚具有多光譜成像儀的遙感衛(wèi)星。Sentinel-2衛(wèi)星在光學(xué)數(shù)據(jù)方面的性能十分優(yōu)異,Sentinel-2遙感數(shù)據(jù)在紅邊范圍擁有3個(gè)波段和10、20、60 m 3種分辨率。研究表明,Sentinel-2衛(wèi)星遙感數(shù)據(jù)可以在農(nóng)作物信息提取和農(nóng)作物分類(lèi)研究等方面發(fā)揮較大的作用,而在農(nóng)作物產(chǎn)量監(jiān)測(cè)中,其經(jīng)濟(jì)實(shí)用性和性能優(yōu)異性會(huì)有更優(yōu)的體現(xiàn)[9-13]。
本研究按蕪湖縣水稻種植收獲周期的時(shí)間序列(表1)(早稻一般3月上中旬播種,7月下旬收獲;晚稻6月上中旬播種,10月下旬收獲)[14]獲取3月至10月共8個(gè)月的覆蓋蕪湖縣地區(qū)的16景坐標(biāo)系統(tǒng)為WGS84,投影方式為UTM的Sentinel-2 Level-1C產(chǎn)品圖像。對(duì)獲取的研究區(qū)影像進(jìn)行目視解譯,將目視解譯的結(jié)果中3/4作為解譯標(biāo)志,1/4用作精度驗(yàn)證,在目視解譯結(jié)果中,按照樣本在研究區(qū)域均勻分布的原則選取20個(gè)樣方,并用轉(zhuǎn)換分離度與Jeffries-Matusita距離對(duì)樣方進(jìn)行可分離性判斷,當(dāng)結(jié)果處于0到2之間時(shí),值越大代表可分離性越好。如表2所示,兩種指數(shù)的檢驗(yàn)結(jié)果均大于1.85,選取樣本可分離性很好,可用于水稻分離提取研究。
表1 蕪湖縣水稻物候期
表2 訓(xùn)練樣本的可分離性檢驗(yàn)結(jié)果
采用最大似然法和支持向量機(jī)法分別對(duì)2019年單一時(shí)相研究區(qū)Sentinel-2遙感圖像進(jìn)行水稻分布信息提取。在分類(lèi)完成后用聚類(lèi)方法對(duì)2種分類(lèi)方法所得到的結(jié)果進(jìn)行處理,以提高分類(lèi)精度。最后對(duì)分類(lèi)結(jié)果的Kappa系數(shù)、總體度等分類(lèi)結(jié)果進(jìn)行比較,得出較適合于水稻信息提取的監(jiān)督分類(lèi)方法。
支持向量機(jī)分類(lèi)法作為一種基于像素的分類(lèi)方法,其理論基礎(chǔ)是統(tǒng)計(jì)學(xué)。使用非線性函數(shù)將輸入的空間特征數(shù)據(jù)由低維變換至高維,然后在高維的特征空間上再次利用數(shù)學(xué)統(tǒng)計(jì)方法得到數(shù)據(jù)的最佳線性分類(lèi)面,從而實(shí)現(xiàn)分類(lèi)結(jié)果的精度最大化,解決了低維空間數(shù)據(jù)不易被分類(lèi)的難點(diǎn)。該分類(lèi)方法是以一定數(shù)量的樣本作為依據(jù)建立模型,使建立的模型既有很高的分類(lèi)精度又有可以識(shí)別的樣本類(lèi)別廣度,以獲得最佳的分類(lèi)效果。如圖2所示,分類(lèi)超平面wTx+b=0不僅可以把所有樣本分開(kāi),而且還和最近的樣本點(diǎn)(支持向量)保持一定的函數(shù)距離,該分類(lèi)超平面比感知機(jī)的分類(lèi)超平面表現(xiàn)更優(yōu),該超平面只有1個(gè)[15]。采用支持向量機(jī)法結(jié)合單時(shí)相影像對(duì)樣方進(jìn)行水稻信息提取,結(jié)果見(jiàn)圖3。
圖2 支持向量機(jī)模型
圖3 基于單時(shí)相的支持向量機(jī)法水稻信息提取
最大似然分類(lèi)法是一種基于像素的分類(lèi)方法。它的分類(lèi)器是一種魯棒性、穩(wěn)定性表現(xiàn)突出的分類(lèi)器。如圖4所示,它是使遙感影像各個(gè)波段數(shù)據(jù)形成正態(tài)分布從而來(lái)構(gòu)造出判別分類(lèi)函數(shù),其基本思想是根據(jù)所選取的訓(xùn)練樣本將樣本中的所有像元以點(diǎn)集的方式在二維或者三維空間中表現(xiàn)出來(lái),然后再將點(diǎn)集當(dāng)中的所有像元數(shù)據(jù)在每個(gè)維度空間上以數(shù)軸正態(tài)分布的形式進(jìn)行表達(dá),最終每一個(gè)點(diǎn)集上的每一個(gè)維度的像元數(shù)據(jù)都以為正態(tài)分布的形式存在;但是每個(gè)以多維正態(tài)分布形式存在的點(diǎn)集都存在各種差異,例如空間大小、空間位置、集約程度等。而最大似然法根據(jù)這種差異通過(guò)貝葉斯公式計(jì)算得出每一個(gè)像元數(shù)據(jù)歸依到各個(gè)類(lèi)別中的概率大小,構(gòu)造一個(gè)概率分布模型,再將像元數(shù)據(jù)分類(lèi)到概率最大的類(lèi)別中,以此完成分類(lèi)[16]。采用最大似然法結(jié)合單時(shí)相影像對(duì)樣方進(jìn)行水稻信息提取,結(jié)果見(jiàn)圖5。
圖4 最大似然法模型
圖5 基于單時(shí)相的最大似然法水稻信息提取
采用最大似然法結(jié)合目視解譯并利用多時(shí)相影像(6月11日和9月9日的Sentine-2遙感影像)將訓(xùn)練樣本分為水域、綠地、耕地及建筑用地,如圖6所示,再根據(jù)相關(guān)農(nóng)作知識(shí)提取研究區(qū)水稻面積。由于6月11日時(shí)晚稻還未插秧,部分水稻用地在遙感圖像上顯示為水域,結(jié)合6月11日和9月19日時(shí)序影像分析,6月11日遙感影像分類(lèi)為水域,同時(shí)9月19日分類(lèi)為綠地的樣本最終分類(lèi)為水稻用地;6月11日遙感影像分類(lèi)為水域,同時(shí)9月19日分類(lèi)為水域的樣本最終分類(lèi)為非水稻用地(魚(yú)塘、水渠等);6月11日遙感影像分類(lèi)為綠地,同時(shí)9月19日分類(lèi)為水域的樣本最終分類(lèi)為水稻用地。為增加非水稻用地水域與水稻用地水域的對(duì)比效果,特選取研究區(qū)2的水域(經(jīng)實(shí)地觀察多為魚(yú)塘)與研究區(qū)1的水域(多為水稻用地)作對(duì)比分類(lèi)試驗(yàn)。
圖6 2019年6月11日(上)至9月19日(下)研究區(qū)土地類(lèi)型變化
NDVI值又稱(chēng)歸一化植被指數(shù),該植被指數(shù)的特征是具有周期變化性,本研究選取研究區(qū)的歸一化植被指數(shù)變化序列,利用該研究區(qū)的多時(shí)相遙感影像數(shù)據(jù)處理,然后利用水稻的周期演變同其他作物的周期演變之間差異作為區(qū)分指標(biāo)將水稻信息進(jìn)行提取,公式如下所示:
式中,IR是紅外波段像素值,R是紅光波段像素值。
利用NDVI對(duì)選取好的樣方進(jìn)行提取處理,提取出水稻、玉米、小麥在其發(fā)育過(guò)程中NDVI值,然后繪制3種農(nóng)作物的月平均值隨月份變化而變化的折線圖。如圖7所示,3月至6月小麥的NDVI值遞增曲線斜率最大,而水稻次之,玉米的斜率最?。煌瑫r(shí)小麥的斜率轉(zhuǎn)折點(diǎn)出現(xiàn)在6月,水稻的斜率轉(zhuǎn)折點(diǎn)出現(xiàn)在7月,玉米的斜率轉(zhuǎn)折點(diǎn)出現(xiàn)在8月,通過(guò)轉(zhuǎn)折點(diǎn)出現(xiàn)的時(shí)間將3者區(qū)分。
NDVI對(duì)于照明與觀測(cè)非常敏感,在水稻生長(zhǎng)過(guò)程的前期,會(huì)過(guò)高估算水稻所占百分比;在水稻生長(zhǎng)過(guò)程的后期,會(huì)過(guò)低估算水稻所占百分比。
為了提高提取水稻分布信息的精度,本研究使用RVI和NDGI輔助NDVI進(jìn)行組合對(duì)水稻分布信息進(jìn)行提取。
RVI又稱(chēng)比值植被指數(shù),對(duì)于含葉綠素較多的農(nóng)作物的變化十分靈敏,可用作綠色植被提取分類(lèi)的參考指數(shù),其公式如下所示:
式中,R是紅色帶反射率數(shù)據(jù),NIR是近紅外帶反射率數(shù)據(jù)。
NDGI又稱(chēng)歸一化差異綠度指數(shù),可以用于檢驗(yàn)各種農(nóng)作物的不同時(shí)期的生長(zhǎng)狀態(tài),其公式如下所示:
式中,G是綠色帶反射率數(shù)據(jù)。
通過(guò)對(duì)選取好的樣方遙感數(shù)據(jù)進(jìn)行處理,得到在水稻的隨時(shí)間序列變化過(guò)程中RVI與NDVI3月到10月的每半個(gè)月份的平均值,將該值用來(lái)代表水稻在各個(gè)月份的植被指數(shù)值,獲得植被指數(shù)在3月到10月間變化指數(shù)大小。該指數(shù)變化折線圖如圖8所示。
圖8 水稻的3種植被指數(shù)時(shí)序變化
由圖8可以看出,在3月到10月水稻生長(zhǎng)周期內(nèi),6月時(shí)水稻NDVI和NDGI的斜率轉(zhuǎn)折點(diǎn)都由正轉(zhuǎn)負(fù),數(shù)值變化特征結(jié)合決策樹(shù)分類(lèi)可以提升水稻的分布信息提取精度。水稻RVI值的曲線斜率出現(xiàn)在6月,6月之前為負(fù),之后為正。如果NDVI和NDGI曲線斜率轉(zhuǎn)折點(diǎn)出現(xiàn)在6月,6月之前曲線斜率為正,6月之后曲線斜率為負(fù),且NDVI的曲線斜率絕對(duì)值大于NDGI的曲線斜率;并且RVI的曲線斜率轉(zhuǎn)折點(diǎn)也出現(xiàn)在6月,且6月之前為負(fù),之后為正。將3種指數(shù)特征的作物作為水稻進(jìn)行提取,具體分類(lèi)流程如圖9所示。通過(guò)對(duì)水稻的植被指數(shù)曲線斜率變化分析,得出符合要求的作物大多分布在研究區(qū)的西部,符合實(shí)地調(diào)研結(jié)果。
圖9 基于3種植被指數(shù)時(shí)序影像的分類(lèi)流程
在運(yùn)用不同的分類(lèi)方法進(jìn)行分類(lèi)后,需要對(duì)基于分類(lèi)方法建立分類(lèi)模型的分類(lèi)結(jié)果進(jìn)行比較,評(píng)價(jià)出分類(lèi)結(jié)果較好的方法,從而研究出高精度提取水稻種植信息的分類(lèi)模型。本研究采用基于像素的混淆矩陣進(jìn)行分類(lèi)精度評(píng)價(jià),該方法是目前普遍使用的分類(lèi)精度檢驗(yàn)方法。混淆矩陣在圖像精度評(píng)價(jià)中,主要用于對(duì)分類(lèi)結(jié)果和實(shí)際值進(jìn)行比較分析,在一個(gè)混淆矩陣?yán)锩姘逊诸?lèi)結(jié)果的精度顯示出來(lái)[17,18]。在混淆矩陣中,Kappa系數(shù)與總體分類(lèi)精度可以對(duì)分類(lèi)結(jié)果的整體分類(lèi)效果進(jìn)行評(píng)價(jià),而生產(chǎn)者精度與用戶精度可以對(duì)單個(gè)類(lèi)別的分類(lèi)結(jié)果進(jìn)行評(píng)價(jià)??傮w分類(lèi)精度表示的是在所選的所有樣本最終分類(lèi)結(jié)果中分類(lèi)無(wú)誤的類(lèi)別總數(shù)與所選的全部樣點(diǎn)總數(shù)的比值,反映最終分類(lèi)結(jié)果的總體精確度。Kappa系數(shù)表示的是最終提取地物的類(lèi)別與實(shí)際類(lèi)別的相互匹配準(zhǔn)確度,最后結(jié)果值在0到1之間,當(dāng)最終數(shù)值大于0.8時(shí)表明結(jié)果與實(shí)際一致性較高[19]。
基于單時(shí)相遙感影像的情況下支持向量機(jī)法和最大似然法對(duì)水稻種植區(qū)域提取的精度如表3所示。由表3可知,最大似然法分類(lèi)結(jié)果的總體分類(lèi)精度達(dá)到89.73%,其Kappa系數(shù)達(dá)到0.797。分類(lèi)總精度比支持向量機(jī)法的分類(lèi)總精度83.67%,增加6.06個(gè)百分點(diǎn),Kappa系數(shù)比支持向量機(jī)法的Kappa系數(shù)0.640增加0.157,采用最大似然法提取水稻精度更高。
表3 基于像素方法的水稻面積提取精度
對(duì)研究區(qū)進(jìn)行基于像素的2種不同分類(lèi)方法的水稻面積提取,得出以下結(jié)論:①最大似然法和支持向量機(jī)法結(jié)合單時(shí)相影像提取水稻的結(jié)果總體精度都低于90.00%,其主要原因是蕪湖市屬亞熱帶濕潤(rùn)季風(fēng)氣候,7—9月研究區(qū)降雨量較大,影響遙感影像質(zhì)量進(jìn)而影響了提取精度;②通過(guò)實(shí)地考察得知,6月上旬和9月上旬,研究區(qū)域早稻和晚稻都分布陸續(xù)開(kāi)始被收割,研究區(qū)南部的水稻種植區(qū)域中有大面積的旱地?fù)诫s其中,所以導(dǎo)致最終的分類(lèi)提取結(jié)果多為分離度較高的水稻種植地塊,使得水稻提取的精度有所降低;③對(duì)中低緯度雙季稻地區(qū)進(jìn)行水稻面積提取時(shí),由于該研究區(qū)域旱地與水稻交錯(cuò)在一起,水稻種植區(qū)域分散度較高[20]。而最大似然法比起支持向量機(jī)法可以識(shí)別單獨(dú)像元,更適合提取破碎地塊信息[21],在該研究區(qū),最大似然法分類(lèi)效果優(yōu)于支持向量機(jī)法。
利用最大似然法分別結(jié)合單時(shí)相影像數(shù)據(jù)和多時(shí)相影像數(shù)據(jù)對(duì)研究區(qū)的水稻面積信息進(jìn)行提取,2種分類(lèi)方法下各自分類(lèi)的相關(guān)精度如表4所示。由表4可知,多時(shí)相分類(lèi)結(jié)果的總體分類(lèi)精度達(dá)到91.23%,Kappa系數(shù)達(dá)到0.817。分類(lèi)總精度比單時(shí)相分類(lèi)的總體分類(lèi)精度89.73%,增加1.50個(gè)百分點(diǎn),Kappa系數(shù)比單時(shí)相分類(lèi)的Kappa系數(shù)0.796,增加0.021,基于多時(shí)相影像的分類(lèi)方法提取水稻精度更佳。
表4 基于多時(shí)相影像的水稻面積提取精度
基于多時(shí)相影像數(shù)據(jù)的分類(lèi)提取方法總體分類(lèi)精度為91.23%,Kappa系數(shù)為0.817,均高于基于單時(shí)相影像數(shù)據(jù)的分類(lèi)提取方法,是因?yàn)榛诙鄷r(shí)相影像數(shù)據(jù)的分類(lèi)方法所處理的影像數(shù)量更多且具有時(shí)間序列特性、地物情況具有復(fù)雜性(變化和未變化的地物相互混雜)、數(shù)據(jù)異質(zhì)性更強(qiáng)(成像條件不同所帶來(lái)的數(shù)據(jù)差異)。對(duì)地物和相關(guān)現(xiàn)象進(jìn)行長(zhǎng)期跟蹤觀測(cè)從而更加精確地識(shí)別研究區(qū)土地利用類(lèi)型的狀態(tài)變化,進(jìn)而降低單一時(shí)相影像數(shù)據(jù)導(dǎo)致分類(lèi)提取時(shí)的錯(cuò)分誤差和漏分誤差,提高分類(lèi)提取水稻的精度。
將根據(jù)影像計(jì)算出6類(lèi)植被指數(shù)及其組合作為分類(lèi)指標(biāo),結(jié)合多時(shí)相影像分別采用2類(lèi)分類(lèi)方法對(duì)研究區(qū)水稻信息進(jìn)行提取,得出每種植被指數(shù)在2類(lèi)分類(lèi)方法下各自的分類(lèi)精度,如圖10、圖11所示。
圖1 研究區(qū)區(qū)位
圖10 6種植被指數(shù)及其組合在2種分類(lèi)方法下的總精度
圖11 6種植被指數(shù)及其組合在2種分類(lèi)方法下的Kappa系數(shù)
NDVI、RVI2個(gè)植被指數(shù)在2個(gè)分類(lèi)方法中總精度和Kappa系數(shù)最高的都是采用最大似然法,分類(lèi)的總體精度都超過(guò)90.0%,其中分類(lèi)精度最高的為NDVI,分類(lèi)總精度達(dá)到94.0%,Kappa系數(shù)為0.870。NDGI分類(lèi)的總精度和Kappa系數(shù)在采用支持向量機(jī)分類(lèi)方法時(shí)最高,分類(lèi)的總精度為91.9%,Kappa系數(shù)是0.852。在采用單一植被指數(shù)作為分類(lèi)特征時(shí),最大似然法在以NDVI、RVI2個(gè)植被指數(shù)為分類(lèi)指標(biāo)時(shí)比使用支持向量機(jī)法有較好的分類(lèi)效果,而支持向量機(jī)法在以NDGI為分類(lèi)指標(biāo)時(shí)比使用最大似然法的分類(lèi)精度更高。NDVI分類(lèi)的總精度為最高,分類(lèi)效果較好的是采用RVI進(jìn)行分類(lèi)。而NDGI整體分類(lèi)精度較差,無(wú)法較有效地分類(lèi)出水稻。
另外對(duì)NDVI、RVI、NDGI3種植被指數(shù)的不同組合形式進(jìn)行精度評(píng)價(jià)得到以下結(jié)果:3種植被指數(shù)組合都是采用最大似然法時(shí)總體分類(lèi)精度和Kappa系數(shù)更高;當(dāng)NDVI和RVI或NDGI任意一種植被指數(shù)進(jìn)行組合時(shí),總體分類(lèi)精度都會(huì)隨之提升,其中NDVI和RVI的組合要優(yōu)于NDVI和NDGI的組合;當(dāng)3種植被指數(shù)組合使用時(shí),總體分類(lèi)精度和Kappa系數(shù)都達(dá)到最高。
該組合方式結(jié)合NDVI明顯的時(shí)間規(guī)律性,RVI對(duì)綠色植被的敏感度和NDGI對(duì)不同植被活力的檢驗(yàn)等植被指數(shù)特性,利用植被指數(shù)值隨時(shí)間變化的曲線斜率和值域提高水稻信息提取的精度[22,23]。如圖12所示為利用NDVI、RVI、NDGI并結(jié)合最大似然法對(duì)水稻進(jìn)行提取的結(jié)果。蕪湖縣農(nóng)作物種植區(qū)的水稻分布分散度較高,在農(nóng)作物種植區(qū)的西部有大量水稻種植,而種植區(qū)東北部主要為魚(yú)塘,南部為旱田,為蕪湖縣谷業(yè)和漁業(yè)分布區(qū)。
圖12 研究區(qū)水稻種植區(qū)域分布
本研究對(duì)蕪湖市蕪湖縣南部面積約為118.8 km2的水稻種植區(qū)水稻信息進(jìn)行提取。使用Sentinel-2衛(wèi)星為數(shù)據(jù)源,利用基于像素分類(lèi)的最大似然法、支持向量機(jī)法和3種植被指數(shù)NDVI、NDGI、RVI及其組合并結(jié)合多時(shí)間序列影像數(shù)據(jù)提取研究區(qū)水稻種植信息,然后采用混淆矩陣對(duì)分類(lèi)結(jié)果進(jìn)行精度評(píng)價(jià),得到適合于此研究區(qū)的最優(yōu)提取方案。①在對(duì)中低緯度雙季稻地區(qū)進(jìn)行水稻面積提取時(shí),基于像素的分類(lèi)方法當(dāng)中,最大似然法優(yōu)于支持向量機(jī)法。②在對(duì)水稻信息進(jìn)行提取時(shí),利用多時(shí)相影像數(shù)據(jù)通過(guò)對(duì)地物和相關(guān)現(xiàn)象進(jìn)行長(zhǎng)期跟蹤觀測(cè)從而更加精確識(shí)別研究區(qū)土地利用類(lèi)型的狀態(tài)變化,進(jìn)而降低單一時(shí)相影像數(shù)據(jù)導(dǎo)致的分類(lèi)提取時(shí)的錯(cuò)分誤差和漏分誤差,提高分類(lèi)提取水稻的精度。③在相同情況下,NDVI較RVI,DGI更適合于進(jìn)行水稻信息提取。同時(shí),不同植被指數(shù)相結(jié)合使用時(shí),精度更優(yōu)。