郭玉超,李榮平,任鴻瑞*
基于GF-6WFV影像提取玉米水稻種植信息
郭玉超1,李榮平2,任鴻瑞1*
1. 太原理工大學(xué)測繪科學(xué)與技術(shù)系, 山西 太原 030024 中國氣象局沈陽大氣環(huán)境研究所, 遼寧 沈陽 110166
玉米、水稻是我國重要的糧食作物,利用遙感技術(shù)高效獲取其種植分布信息具有重要作用。GF-6 WFV遙感數(shù)據(jù)光譜波段較為豐富,空間分辨率較高,能夠為作物遙感分類提供多種類型特征。然而多特征參與分類容易產(chǎn)生數(shù)據(jù)冗余、降低處理效率。如何優(yōu)選GF-6 WFV數(shù)據(jù)豐富的特征信息對于提高分類精度具有重要意義。本文利用GF-6 WFV影像提取光譜特征、無紅邊指數(shù)、紅邊指數(shù)及紋理特征共26個特征變量,基于所有特征進(jìn)行優(yōu)選并采用不同分類方法及不同特征組合識別黑山縣及北鎮(zhèn)市玉米、水稻分布信息。結(jié)果表明:采用平均不純度減少與相關(guān)系數(shù)雙重指標(biāo)共優(yōu)選出14個特征,其中紅邊信息占比最大?;趦?yōu)選特征采用隨機(jī)森林法識別玉米、水稻精度最高,其總體精度為94.01%、Kappa系數(shù)為0.90,相比優(yōu)選前分別提高1.14%、0.02。多源特征相對于單一特征能夠改善作物分類效果,提高分類精度。該研究能夠剔除非農(nóng)田像元影響以高效高精度地提取玉米、水稻,具有可行性、有效性,能夠為國產(chǎn)高分?jǐn)?shù)據(jù)在作物遙感識別應(yīng)用方面提供參考。
高分六號; 農(nóng)作物; 影像提取
玉米、水稻以其重要的食用價值、飼用價值以及工業(yè)用途,在世界上廣泛分布。我國玉米、水稻種植范圍廣、規(guī)模大,是國內(nèi)種植面積分列第一、第二的糧食作物,其生產(chǎn)布局對農(nóng)業(yè)發(fā)展及經(jīng)濟(jì)運(yùn)行具有重要影響。利用遙感資料有效、及時監(jiān)測玉米、水稻種植分布信息有助于進(jìn)行產(chǎn)量預(yù)測、農(nóng)業(yè)決策,對優(yōu)化國家作物綜合管理與確保糧食安全具有重大意義。
在遙感影像數(shù)據(jù)源方面,目前作物提取研究中多采用MODIS[1]、Landsat[2]等中低分辨率數(shù)據(jù),中低分辨率的遙感數(shù)據(jù)覆蓋范圍廣,獲取來源較多,但易存在混合像元以及“同譜異物”或“異物同譜”現(xiàn)象。GF-1 WFV影像數(shù)據(jù)空間分辨率為16 m,相對于Landsat等數(shù)據(jù)更適合作物精細(xì)分類[3],然而該數(shù)據(jù)僅包含傳統(tǒng)可見光以及近紅外波段,波段信息具有一定局限性。GF-6衛(wèi)星于2018年6月發(fā)射,是我國首顆具備紅邊波段用于農(nóng)業(yè)觀測的高分衛(wèi)星,且打破了對國外衛(wèi)星紅邊遙感影像依賴的局面,在農(nóng)作物分類方面應(yīng)用前景廣闊[4]。劉佳等通過對比紅邊與無紅邊條件下玉米、大豆及其他作物分類效果,發(fā)現(xiàn)引入紅邊波段能夠改善農(nóng)作物分類效果[5]。濮毅涵等基于Sentinel-2A紅邊斜率對植被群落進(jìn)行分類,研究結(jié)果表明,光譜紅邊斜率對植被分類應(yīng)用能力較佳[6]。梁繼等通過提取松嫩平原玉米、大豆、水稻,發(fā)現(xiàn)在作物識別中紅邊特征表現(xiàn)優(yōu)越[7]。已有研究表明,紅邊信息能夠增加不同作物可分性,提高農(nóng)作物分類精度[5,7]。目前遙感識別研究中,特征類型較為單一,多采用可見光等傳統(tǒng)波段及以NDVI為代表的傳統(tǒng)植被指數(shù),紅邊信息相對較少。
豐富的遙感特征能夠改善地物識別效果,對于提高地物分類精度具有重要應(yīng)用[8]。然而不同特征間存在相關(guān)性,若所有特征參與分類容易產(chǎn)生數(shù)據(jù)冗余、降低處理效率,故數(shù)據(jù)降維具有重要意義。但若僅考慮到特征間相關(guān)性篩選特征,容易遺漏對農(nóng)作物分類重要程度高的特征。隨機(jī)森林法具有特征重要性評估能力,其自帶的平均不純度減少法能夠計算得到特征重要性[9]。鑒于此本研究擬用一種平均不純度減少與相關(guān)系數(shù)雙重指標(biāo)進(jìn)行特征優(yōu)選的方法,以優(yōu)先選擇重要程度較高且冗余信息較少的特征。
為驗證該特征優(yōu)選法的有效性,本研究基于GF-6 WFV影像構(gòu)建光譜特征、無紅邊指數(shù)、紅邊指數(shù)及紋理特征,并對所有剔除非農(nóng)田像元后的特征進(jìn)行優(yōu)選,采用隨機(jī)森林法對比優(yōu)選前與優(yōu)選后玉米、水稻分類精度。同時為挖掘不同分類方法及不同特征組合對玉米、水稻提取精度影響,基于優(yōu)選特征共采用3種分類方法及8種特征組合進(jìn)行對比分析。
本文選擇遼寧省黑山縣及北鎮(zhèn)市作為研究區(qū),該區(qū)屬暖溫帶半濕潤氣候,地物復(fù)雜多樣,地勢西北高,東南低,自西北向東南依次形成丘陵區(qū)、平原區(qū)及低洼區(qū)。黑山縣耕地面積13.7萬hm2,是全國重點產(chǎn)糧縣;北鎮(zhèn)市耕地面積7.3萬hm2,是全國著名糧食生產(chǎn)基地,玉米、水稻為研究區(qū)內(nèi)主要糧食作物。
圖1 研究區(qū)位置示意圖
GF-6 WFV空間分辨率為16 m,共含有8個波段,除藍(lán)波段(B1)、綠波段(B2)、紅波段(B3)、近紅外波段(B4)4個傳統(tǒng)波段外,還添加紅邊Ⅰ(B5)、紅邊Ⅱ(B6)兩個紅邊波段及紫波段(B7)、黃波段(B8)。參考研究區(qū)作物物候信息及影像質(zhì)量,選取2020年8月14日2景影像,該時期植被生長旺盛,與非植被光譜差異明顯,各類作物生長穩(wěn)定、光譜信息豐富,利于不同作物類型提取。對獲取的遙感影像依次進(jìn)行預(yù)處理,包括輻射定標(biāo)、大氣校正、正射校正、拼接裁剪。
樣本選取參考2017~2019年東北10 m農(nóng)作物分布產(chǎn)品[10],結(jié)合研究區(qū)作物物候期與類別特征,分為玉米、水稻、其他作物3類,所需樣本通過借助此產(chǎn)品與Google earth高分辨率影像對遙感影像進(jìn)行目視解譯,采集樣點時須使選取像元與周圍像元特征一致,以此確保樣本點準(zhǔn)確性。經(jīng)過反復(fù)目視糾正最終得到樣本點玉米1249個,水稻431個、其他作物1829個,各類以7:3分別作為訓(xùn)練與驗證樣本點。
本研究提取8個光譜特征、5個無紅邊指數(shù)、5個紅邊指數(shù)及8個紋理特征共26個特征(表1)。為提高數(shù)據(jù)利用率,對所有波段進(jìn)行主成分變換(PCA),對第一主成分通過灰度共生矩陣法(GLCM)提取紋理特征[11]。為清晰反映地物紋理信息,將窗口大小設(shè)置為3×3,步長為1,同時為消除不同角度影響,取0°、45°、90°和 135°共4個方向特征平均值作為紋理特征。
表1 特征變量
對所有特征采用隨機(jī)森林算法自帶的平均不純度減少(MDI)指標(biāo)進(jìn)行評估[9],在訓(xùn)練決策樹時能夠得到每個特征基尼不純度減少量,隨機(jī)森林通過計算每棵決策樹不純度減少量的平均值作為特征重要性得分。
若樣本集合為,共含有個類別,則基尼指數(shù)公式如下:
式中:P為中隨機(jī)選擇的樣本屬于第類的概率。
若根據(jù)某特征結(jié)點分裂后,被劃分為1和2,在該特征條件下,結(jié)點劃分后基尼指數(shù)公式:
平均不純度減少公式為:
上式中,是決策樹個數(shù),Gini()代表第棵決策樹結(jié)點劃分前的基尼指數(shù),Gini()則代表結(jié)點劃分后的基尼指數(shù)。某特征劃分后平均不純度減少程度越大,則該特征重要性程度越高,在分類時此特征發(fā)揮作用越強(qiáng)。
對所有特征進(jìn)行相關(guān)性分析,特征之間相關(guān)系數(shù)越高,則重復(fù)信息越多。通過統(tǒng)計特征間相關(guān)系數(shù),以選擇相關(guān)性低的特征變量。
結(jié)合特征重要性得分及相關(guān)系數(shù)篩選特征集參與后續(xù)農(nóng)作物分類,分類方法有隨機(jī)森林法[9]、支持向量機(jī)法[12]、最大似然法。其中隨機(jī)森林法設(shè)置決策樹個數(shù)為100,特征數(shù)量為總特征個數(shù)的算術(shù)平方根。支持向量機(jī)法設(shè)置核函數(shù)為徑向基核函數(shù),Gamma為輸入影像波段數(shù)的倒數(shù),懲罰參數(shù)為100。
基于驗證樣本對分類結(jié)果進(jìn)行精度評價得到混淆矩陣,根據(jù)混淆矩陣計算總體精度、Kappa系數(shù)、制圖精度、用戶精度4個指標(biāo)用以精度分析,確定分類結(jié)果準(zhǔn)確性。
本研究采用分層提取策略,首先借助2020年10 m全球土地覆蓋數(shù)據(jù)(ESA WorldCover)構(gòu)造決策樹規(guī)則,該數(shù)據(jù)耕地編碼為40。另外利用黃波段(B8)篩除部分道路像元以進(jìn)一步確保農(nóng)田區(qū)域準(zhǔn)確性,具體規(guī)則如圖2。
圖2 農(nóng)田像元提取
對所有基于農(nóng)田區(qū)掩膜后的特征變量進(jìn)行重要性評估(圖3),發(fā)現(xiàn)4種特征類型中,紅邊指數(shù)重要程度最高,依次為無紅邊指數(shù)、光譜特征、紋理特征。
圖3 特征重要性得分
由于影像選取時間位于植被生長中后期,此時玉米與水稻處于穗期,生長旺盛,具有葉片寬厚濃綠、莖桿粗壯等特點。紅邊波段是指示植被生長狀況的敏感波段,與葉綠素含量、葉面積指數(shù)等生長參數(shù)具有很好的相關(guān)性[13,14],故紅邊波段重要程度高。該期植被葉綠素濃度較高,紅波段吸收易飽和,歸一化植被指數(shù)差異主要取決于近紅外波段反射率。相對于近紅外波段,紅邊波段完全處于植被反射率急劇變化的區(qū)域,對葉綠素含量更為敏感,因而更能反映出不同植被間光譜細(xì)微差別,故基于紅邊波段構(gòu)建的NDVI750、NDVI710重要性得分更高。該期NDVI等指數(shù)易發(fā)生飽和,而WDRVI波段構(gòu)造能夠改善飽和現(xiàn)象,故WDRVI得分較高。研究區(qū)內(nèi)不同作物植被覆蓋分布不均,RVI適用于不同程度植被覆蓋情況[15],且與作物生長參數(shù)相關(guān)性緊密,故該指數(shù)重要性排名靠前。此時各作物生長較為穩(wěn)定,在空間分布上表現(xiàn)出一定規(guī)則性與密集性,相同類內(nèi)紋理特征較為均勻,不同類別間紋理則表現(xiàn)出一定差異性,故紋理特征中能夠體現(xiàn)圖像差異性的CON重要性得分較高。
通過相關(guān)性分析得到相關(guān)系數(shù)圖(圖4),結(jié)合重要性得分依次從高到低篩選特征。B5、NDVI750、NDVI710得分占比前27.15%,且相關(guān)系數(shù)均低于0.9,故保留。WDRVI、NDVI、NDVIre1、NDWI、NDVI705與NDVI750相關(guān)系數(shù)均大于0.9,故均剔除。RVI、NDGI、NDVIre2、B6在重要性排序中位列前10,且與其它特征相關(guān)性偏低,故均保留。其余紋理特征中,MEA與B6相關(guān)系數(shù)高達(dá)0.98,故舍棄MEA;DIS與HOM相關(guān)性偏高,而DIS重要性得分高于HOM,故僅保留DIS;ENT與ASM相關(guān)性偏高,而ASM重要性得分偏低,故剔除ASM;CON、VAR、COR與其它特征相關(guān)系數(shù)均低于0.9,故全部保留。剩余光譜特征中,B4與B6相關(guān)系數(shù)高達(dá)0.97,故剔除B4;B2重要性得分高于B3、B7、B8、B1,而B3、B8、B1與B2相關(guān)系數(shù)均在0.9以上,故保留B2、B7。最終優(yōu)選特征為:B5、NDVI750、NDVI710、RVI、NDGI、NDVIre2、B6、CON、DIS、B2、B7、ENT、VAR、COR。
圖4 特征相關(guān)系數(shù)圖
利用14個優(yōu)選特征采用不同分類法進(jìn)行作物提取,并采用驗證樣本進(jìn)行精度檢驗(表2)。由表2可知,隨機(jī)森林法提取作物總體精度與Kappa系數(shù)最高,分別達(dá)到94.01%、0.90。相較于支持向量機(jī)與最大似然法,其總體精度分別提高1.34%、2.69%,Kappa系數(shù)分別提高0.02、0.05。同時利用隨機(jī)森林法基于優(yōu)選前特征進(jìn)行分類,發(fā)現(xiàn)優(yōu)選后較未優(yōu)選總體精度提高1.14%,Kappa系數(shù)提高0.02。
對比優(yōu)選特征下不同方法分類結(jié)果(圖5),可以看出,隨機(jī)森林法提取玉米、水稻效果最好,該法玉米圖斑椒鹽現(xiàn)象較少,水稻圖斑更為規(guī)則、完整,作物錯分漏分現(xiàn)象少。支持向量機(jī)提取的水稻地塊完整度低,且存在將其他作物錯分為玉米現(xiàn)象。最大似然法作物圖斑更為破碎,錯分現(xiàn)象嚴(yán)重。不同算法識別作物原理不同,導(dǎo)致提取精度存在一定差異。隨機(jī)森林法采用多決策樹的投票結(jié)果作為最終結(jié)果,能夠保證較高精度;支持向量機(jī)利用有限的樣本信息進(jìn)行分類,在部分作物光譜混淆區(qū)域存在錯分現(xiàn)象;最大似然法需假定樣本數(shù)據(jù)符合正態(tài)分布,然而實際應(yīng)用中數(shù)據(jù)不一定服從正態(tài)分布,從而導(dǎo)致分類結(jié)果有所偏差,不能滿足作圖精細(xì)化需求。由圖5可知,黑山縣玉米種植范圍較廣,主要分布于無梁殿鎮(zhèn)、薛屯鄉(xiāng)等中部區(qū),水稻種植集中分布于二道鄉(xiāng),另外新興鎮(zhèn)等地區(qū)也有少量種植;北鎮(zhèn)市玉米種植較少,主要分布于柳家鄉(xiāng)等東部地區(qū),水稻則主要分布于新立鄉(xiāng)、青堆子鎮(zhèn)、窟窿臺鎮(zhèn)等東南部地區(qū)。
表2 不同分類方法精度評價表
圖5 不同分類方法作物局部識別效果對比圖
為深入挖掘各特征對作物分類精度影響,基于14個優(yōu)選特征共構(gòu)建8種組合并使用隨機(jī)森林法進(jìn)行分類,根據(jù)精度評定表(表3)可知,僅使用光譜特征作物分類總體精度與Kappa系數(shù)在所有方案中最低。當(dāng)在光譜特征上單獨或同時添加無紅邊指數(shù)、紅邊指數(shù)、紋理特征時,發(fā)現(xiàn)總體精度均在91%以上,Kappa系數(shù)均達(dá)到0.86。這表明GF-6 WFV多源特征相對于單特征能夠提供更為豐富的特征信息,極大程度地改善作物分類精度。
根據(jù)不同特征組合分類結(jié)果圖(圖6),發(fā)現(xiàn)僅利用光譜特征提取玉米、水稻椒鹽現(xiàn)象較為明顯,且不能很好地識別田塊,識別作物結(jié)果多為大片連續(xù)區(qū)域。添加紋理特征后,對作物田塊間田埂的識別能力提高,但接近田埂的田塊作物像元易產(chǎn)生錯分。指數(shù)特征引入能夠有效減少作物錯分漏分現(xiàn)象,使得田塊更為規(guī)則、完整,且紅邊指數(shù)區(qū)分各作物能力相比于無紅邊指數(shù)更強(qiáng),能夠更為準(zhǔn)確地識別出玉米、水稻。故所有特征組合提取玉米、水稻精度達(dá)到最高,既能區(qū)分出田埂,又可保證作物田塊較為完整。
表3 不同特征組合分類精度表
圖6 不同特征組合分類結(jié)果圖
本文以黑山縣及北鎮(zhèn)市作為研究區(qū),基于GF-6 WFV遙感影像提取黑山縣與北鎮(zhèn)市玉米、水稻種植區(qū),結(jié)論如下:
(1)構(gòu)建決策樹規(guī)則提取農(nóng)田像元時,新增黃波段在區(qū)分植被與建設(shè)用地方面表現(xiàn)良好,2020年ESA WorldCover數(shù)據(jù)有助于非農(nóng)田像元剔除且能夠保證農(nóng)田區(qū)域完整性;
(2)對于玉米、水稻提取,特征貢獻(xiàn)程度從高到低依次為紅邊指數(shù)、無紅邊指數(shù)、光譜特征、紋理特征,其中B5、NDVI750、NDVI710位列前3;
(3)相對于無紅邊指數(shù)與紅邊指數(shù),光譜、紋理特征間冗余信息較少,而紋理特征MEA與光譜特征B4、RE2相關(guān)性較高;
(4)采用平均不純度減少與相關(guān)系數(shù)雙重指標(biāo)共篩選出14個特征:B5、NDVI750、NDVI710、RVI、NDGI、NDVIre2、B6、CON、DIS、B2、B7、ENT、VAR、COR,發(fā)現(xiàn)紅邊信息占比最大;
(5)基于優(yōu)選特征采用隨機(jī)森林法的作物分類精度最高,總體精度為94.01%,相對于優(yōu)選前總體精度提高1.14%。相較于支持向量機(jī)、最大似然法,其總體精度分別提高1.34%、2.69%;
(6)GF-6 WFV紋理特征在一定程度上有助于區(qū)分田埂與田塊。紅邊指數(shù)則在保證作物田塊完整性,有效識別玉米、水稻方面突出。光譜特征、紅邊指數(shù)、無紅邊指數(shù)、紋理特征結(jié)合相對于單特征能夠有效減少作物錯分漏分現(xiàn)象,提高分類精度。
[1] 朱彤,張學(xué)霞,王士遠(yuǎn),等.基于物候特征和混合光譜信息的春玉米種植面積提取[J].沈陽農(nóng)業(yè)大學(xué)學(xué)報,2017,48(3):328-337
[2] 李曉慧,王宏,李曉兵,等.基于多時相Landsat 8 OLI影像的農(nóng)作物遙感分類研究[J].遙感技術(shù)與應(yīng)用,2019,34(2):389-397
[3] 黃健熙,侯矞焯,蘇偉,等.基于GF-1 WFV數(shù)據(jù)的玉米與大豆種植面積提取方法[J].農(nóng)業(yè)工程學(xué)報,2017,33(7):164-170
[4] 張悅琦,李榮平,穆西晗,等.基于多時相GF-6遙感影像的水稻種植面積提取[J].農(nóng)業(yè)工程學(xué)報,2021,37(17):189-196
[5] 劉佳,王利民,滕飛,等.RapidEye衛(wèi)星紅邊波段對農(nóng)作物面積提取精度的影響[J].農(nóng)業(yè)工程學(xué)報,2016,32(13):140-148
[6] 濮毅涵,張棟,徐丹丹,等.Sentinel-2A紅邊波段對湖濱帶植被分類能力的評估[J].林業(yè)資源管理,2021(2):131-139
[7] 梁繼,鄭鎮(zhèn)煒,夏詩婷,等.高分六號紅邊特征的農(nóng)作物識別與評估[J].遙感學(xué)報,2020,24(10):1168-1179
[8] 劉通,任鴻瑞.GEE平臺下利用物候特征進(jìn)行面向?qū)ο蟮乃痉N植分布提取[J].農(nóng)業(yè)工程學(xué)報,2022,38(12):189-196
[9] Breiman L. Random Forests [J]. Machine Learning, 2001,45(1):5-32
[10] You NS, Dong JW, Huang JX,The 10-m crop type maps in Northeast China during 2017–2019 [J]. Scientific Data, 2021,8:41
[11] Haralick RM, Shanmugam K, Dinstein IH. Textural features for image classification [J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973,3(6):610-621
[12] Vapnik V. The Nature of Statistical Learning Theory [M]. Springer, 1999
[13] Ren HR, Zhou GS. Estimating above ground green biomass in desert steppe using band depth indices [J]. Biosystems Engineering, 2014,127:67-78
[14] 蘇偉,侯寧,李琪,等.基于Sentinel-2遙感影像的玉米冠層葉面積指數(shù)反演[J].農(nóng)業(yè)機(jī)械學(xué)報,2018,49(1):151-156
[15] 王李娟,孔鈺如,楊小冬,等.基于特征優(yōu)選隨機(jī)森林算法的農(nóng)耕區(qū)土地利用分類[J].農(nóng)業(yè)工程學(xué)報,2020,36(4):244-250
Extraction Planting Information of Corn and Rice Based on GF-6 WFV Image
GUO Yu-chao1, LI Rong-ping2, REN Hong-rui1*
1.0300242.110166
Corn and rice are important grain crops in China, and it is important to use remote sensing technology to obtain planting distribution information efficiently. The spectral bands of GF-6 WFV data are relatively abundant and have high spatial resolution, which can provide multiple types of features for crop remote sensing classification. However, multi-feature classification tends to produce data redundancy and reduce processing efficiency. How to optimize the feature information of GF-6 WFV data is of great significance to improve the classification accuracy. In this study, GF-6 WFV data were used to extract 26 features, including spectral features, non-red edge index, red edge index and texture features. Based on all features, different classification methods and feature combinations were used to identify the distribution information of corn and rice in heishan County and Beizhen city. The results showed that: 14 features were optimized by using the double metrics of mean decrease impurity and correlation coefficient, among which the red edge information accounted for the largest proportion. Based on the optimized features, the random forest method had the highest accuracy in identifying corn and rice, the overall accuracy was 94.01% and kappa coefficient was 0.90, which were 1.14% and 0.02 higher than before optimization, respectively. Compared with single feature, multi-source features can improve the accuracy of crop classification. This study can eliminate the influence of non-farmland pixels to efficiently and accurately extract corn and rice, which is feasible and effective, and can provide a reference for Chinese satellite in the application of crop remote sensing recognition.
GF-6; crop; image extraction
TP79/S127
A
1000-2324(2022)05-0685-08
2022-03-10
2022-04-02
山西省省籌資金資助回國留學(xué)人員科研項目(2022-055);中國氣象局沈陽大氣環(huán)境研究所聯(lián)合開放基金課題資助(2021SYIAEKFMS39)
郭玉超(1999-),女,碩士研究生,主要研究方向為植被遙感. E-mail:guoyc98@163.com
通訊作者:Author for correspondence. E-mail:renhongrui@tyut.edu.cn