陳 印,剛成誠,劉歡歡,劉 悅,范蒙恩,陳 宇,張 曼,于子涵
(1.西北農(nóng)林科技大學(xué) 草業(yè)與草原學(xué)院,陜西 楊陵 712100;2.西北農(nóng)林科技大學(xué) 水土保持研究所,陜西 楊陵 712100;3.中國科學(xué)院水利部 水土保持研究所,陜西 楊陵 712100;4.西北農(nóng)林科技大學(xué) 資源環(huán)境學(xué)院,陜西 楊陵 712100)
蘋果(Maluspumila)屬于落葉喬木,富含礦物質(zhì)和維生素,是人們最常食用的水果之一。蘋果在全世界溫帶地區(qū)均有種植,我國是世界上蘋果種植總面積最大、總產(chǎn)量最高的國家[1]。蘋果種植區(qū)在我國多個省份均有分布。2020年我國蘋果種植面積為208.85萬hm2,總產(chǎn)量高達(dá)4 406.61萬t,占全球蘋果產(chǎn)量的54.07%[2],其中,陜西省的蘋果產(chǎn)量為1 185萬t,是我國蘋果種植面積最大、產(chǎn)量最高的蘋果大省,產(chǎn)量和出口量均為全國第一。陜西省具有生產(chǎn)優(yōu)質(zhì)蘋果的自然條件,是全球最佳的蘋果生產(chǎn)區(qū),同時也是世界上連片種植蘋果最大的地區(qū)[3]。蘋果產(chǎn)業(yè)已經(jīng)成為陜西部分地區(qū)鄉(xiāng)村振興的經(jīng)濟(jì)支柱型產(chǎn)業(yè)[4],對于當(dāng)?shù)剞r(nóng)業(yè)的整體發(fā)展具有重要意義。
隨著退耕還林還草等生態(tài)工程的不斷深入以及“北擴西進(jìn)”戰(zhàn)略的實施,陜西省蘋果種植面積和產(chǎn)量一直保持上升的趨勢[5-6]。因此,準(zhǔn)確掌握蘋果園分布格局及變化趨勢是蘋果產(chǎn)業(yè)發(fā)展和科學(xué)研究不可忽視的一環(huán)。傳統(tǒng)實地調(diào)研方法存在工作量大、成本高等問題,難以掌握區(qū)域大面積果園空間信息[7]。遙感監(jiān)測技術(shù)由于具有快速、低成本、大面積、長時間序列探測地表的特點,已被廣泛運用于農(nóng)業(yè)管理和作物監(jiān)測[8-9]。例如,根據(jù)作物的光譜特征和其他輔助信息,對飼草[10]、玉米[11]、花生[12]、冬小麥[13]等農(nóng)作物進(jìn)行空間信息提取,對農(nóng)業(yè)生產(chǎn)具有重要意義。同時,經(jīng)濟(jì)林的遙感信息提取方面也取得了重要的研究進(jìn)展,如葡萄[14]、橡膠林[15]、竹林[16]和棕櫚[17]等。相比之下,針對果園遙感信息提取的研究相對薄弱。徐晗澤宇等[18]利用GEE平臺使用2 140景Landsat影像繪制了贛南柑橘果園的分布圖;宋榮杰等[19]構(gòu)建了一種結(jié)合高分影像光譜信息和紋理信息以及隨機森林算法的集成分類模型,對高分影像中獼猴桃果園進(jìn)行了有效識別和自動提取。目前,蘋果園地遙感信息提取的研究仍十分缺乏,僅局限于縣域或鄉(xiāng)鎮(zhèn)尺度[20-23],區(qū)域尺度蘋果園地空間分布特征亟待開展深入的研究。
中高分辨率遙感影像,如SPOT-5[24]、GF-2[25]、Landsat[26]和Sentinel-2[27-29],已被廣泛應(yīng)用于作物分類制圖中。其中,Sentinel-2具有更多的光譜波段和更短的重訪周期,在作物信息提取中被作為重要的遙感數(shù)據(jù)源[30]。在分類方法方面,隨機森林(random forest,RF)算法和支持向量機(supporting vector machine,SVM)等機器學(xué)習(xí)算法已經(jīng)逐漸取代傳統(tǒng)的監(jiān)督分類方法。隨機森林算法是由多個決策樹組成,可以解決決策樹算法過擬合的出現(xiàn),并能提高分類精度,在地物分類和識別領(lǐng)域具有良好的表現(xiàn)[31]。王德軍等[32]分析了隨機森林、支持向量機、最大似然分類3種分類方法對于農(nóng)耕土地提取效果,結(jié)果表明隨機森林算法的分類精度最佳;馬戰(zhàn)林等[33]融合了多時相Sentinel-1SAR數(shù)據(jù)和Sentinel-2光學(xué)數(shù)據(jù),發(fā)現(xiàn)基于RF算法的總體精度和Kappa系數(shù)分別為95.78%和0.92;Blickensdorfer等[34]使用RF算法,基于Sentinel-1、Sentinel-2和Landsat 8繪制了德國2017-2019年農(nóng)業(yè)土地覆蓋圖。
Google Earth Engine(GEE)云計算平臺具有海量多源遙感數(shù)據(jù)、支持云端計算的特點,極大地增強了遙感數(shù)據(jù)處理和數(shù)據(jù)挖掘能力,為大面積區(qū)域尺度遙感信息提取及空間格局動態(tài)監(jiān)測提供了技術(shù)平臺[35]。本研究以陜西省蘋果主要種植區(qū)——渭北旱塬區(qū)為對象,基于GEE云平臺獲取2020年Sentinel-2影像數(shù)據(jù),構(gòu)建包含光譜特征、遙感植被指數(shù)、紋理特征和地形特征的多維分類特征集,應(yīng)用RF算法提取研究區(qū)蘋果園空間格局信息,探究不同分類特征組合下蘋果園地遙感提取效果。
渭北旱塬區(qū)包括千陽縣、鳳翔縣、麟游縣、永壽縣、彬州市、長武縣、旬邑縣、淳化縣、耀州區(qū)、印臺區(qū)、黃陵縣、宜君縣、白水縣、洛川縣,共計14個縣(區(qū))(圖1),地理位置34.35°N-36.07°N,106.94°E-109.77°E,海拔高度458~1 841 m,總面積約1.82萬km2。該區(qū)屬于溫帶大陸性季風(fēng)型氣候,年均氣溫6~13 ℃,無霜期180~200 d,年降水量500~800 mm,降雨集中在6-9月,多為短時暴雨,冬春降水較少,屬于典型的半干旱區(qū),適宜蘋果生長。
圖1 研究區(qū)概況
通過野外實地調(diào)查的方法,采集研究區(qū)461個蘋果園樣本點。根據(jù)研究區(qū)具體情況和分類目標(biāo),將研究區(qū)內(nèi)的土地覆蓋類型分為蘋果園、水域、城鎮(zhèn)用地和其他用地。利用谷歌衛(wèi)星地圖和Sentinel-2影像進(jìn)行目視法取樣,獲得2020年的樣本數(shù)據(jù),將樣本數(shù)據(jù)按照4∶1的比例進(jìn)行隨機分配,80%用于分類器訓(xùn)練,20%用于精度評價(表1)。
表1 分類樣本數(shù)量
哨兵系列衛(wèi)星(Sentinel)是歐洲航天局哥白尼計劃(GMES)中的地球觀測衛(wèi)星,GEE目前可以使用4個系列的哨兵影像數(shù)據(jù)集,其中,Sentinel-2是高分辨率多光譜成像衛(wèi)星,攜帶一枚多光譜成像儀(MSI),用于陸地監(jiān)測,分為2A和2B 2顆衛(wèi)星,2A衛(wèi)星于2015年發(fā)射升空,2B衛(wèi)星于2017年發(fā)射升空,一顆衛(wèi)星的重訪周期為10 d,2顆互補,重訪周期為5 d,本研究使用B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12共計10個波段(表2)。
表2 波段詳細(xì)信息
Sentinel-2數(shù)據(jù)的Level-1C(L1C)級產(chǎn)品是經(jīng)過正射校正和亞像元級幾何精矯正后的大氣表觀反射率產(chǎn)品。本研究選擇的Level-2A(L2A)數(shù)據(jù)是在L1C級數(shù)據(jù)的基礎(chǔ)上經(jīng)過大氣校正后的產(chǎn)品,從GEE平臺獲取,影像時間2020年4-5月[36],共獲取了覆蓋研究區(qū)域的無云影像63景,影像分布及數(shù)量見圖2。
圖2 2020年4-5月使用的Sentinel-2影像數(shù)量
根據(jù)蘋果花期光譜特征與其他樹種差異最大的特性[21-23,36],在GEE平臺獲取2020年4-5月L2A級遙感影像數(shù)據(jù),篩選云量<20的影像,并進(jìn)行裁剪和融合處理。選取光譜特征(spectral features)、遙感植被指數(shù)(remote sensing vegetation index)、紋理特征(texture features)和地形特征(topographic features)作為分類特征,通過隨機森林算法提取研究區(qū)蘋果園地空間格局。
紅邊波段和短紅外波段在地物分類中具有重要的作用,因此,本研究提取了蘋果開花期間蘋果園、水域、城鎮(zhèn)用地和其他用地的10個光譜波段反射率。由圖3可見,水域在10個波段下均表現(xiàn)為較低的反射率,且較為平穩(wěn);城鎮(zhèn)用地的反射率均高于水域;蘋果園和其他用地在B7、B8、B8A波段下反射率幾乎一致,僅在部分波段下差異較大。因此,本研究加入遙感植被指數(shù)、紋理特征和地形特征作為蘋果園地的分類特征,以提高蘋果園地分類遙感信息提取精度。
圖3 2020年4-5月不同波段不同地物的平均反射光譜
遙感植被指數(shù)包括歸一化植被指數(shù)(normalized difference vegetation index,NDVI,式中記為NDVI)、土壤調(diào)整植被指數(shù)(soil-adjusted vegetation index,SAVI,式中記為SAVI)、裸土指數(shù)(bare soil index,BSI,式中記為BSI)、增強植被指數(shù)(enhanced vegetation index,EVI,式中記為EVI);紋理特征由通過灰度共生矩陣(gray level co-occurrence matrix,GLCM,式中記為GLCM)提取得到,紋理窗口大小為3×3,包括均值(Mean)、方差(variance,Var)、角二階矩(angular second moment,Asm)、熵(entropy,Ent)、對比度(constrast,Con)和相關(guān)性(correlation,Corr);地形特征使用高程(DEM)數(shù)據(jù)(表3)。
表3 特征說明
本研究根據(jù)不同的分類特征組合共涉及5種分類方案(表4)。
表4 特征組合
RF通過隨機采樣并放回地抽取(Bootstrap)的方式對樣本進(jìn)行重采樣,其中約2/3的樣本數(shù)據(jù)作為袋內(nèi)數(shù)據(jù)創(chuàng)建決策樹,約1/3的樣本數(shù)據(jù)作為袋外數(shù)據(jù)(out of bag,OOB)進(jìn)而驗證模型[37-38]。與其他分類算法相比,隨機森林具有更好的穩(wěn)定性[39]。本研究通過GEE平臺的隨機森林分類器建立RF模型,進(jìn)而提取研究區(qū)蘋果園地遙感信息。
混淆矩陣是對經(jīng)過實地驗證的像元位置與類型與遙感影像分類結(jié)果中相對應(yīng)的像元屬性進(jìn)行比較,得出該類別的分類精度,它可以有效反映分類結(jié)果像元歸類的準(zhǔn)確性。采用混淆矩陣方法分別得到總體精度(overall accuracy,OA)和Kappa系數(shù)等,以此作為衡量標(biāo)準(zhǔn),評價研究區(qū)域蘋果園地提取的精度。計算公式如下
1)總體精度(OA,用pc表示)
(1)
式中:p為樣本總數(shù),pkk表示正確分類的像元數(shù)目;n表示類別的數(shù)量。
2)Kappa系數(shù)(Khat)
(2)
式中:r為誤差矩陣中總列數(shù)(即總的類別數(shù));xii為混淆矩陣中第i行、第i列上像元數(shù)量(即正確分類的數(shù)目);xi+和x+i分別為第i行和第i列的像元數(shù)量;N為用于精度評估的總像元數(shù)量。
特征重要性是指特征對于目標(biāo)變量的影響程度,能夠判斷輸入特征對于結(jié)果的貢獻(xiàn)。特征得分越高,表明對結(jié)果的貢獻(xiàn)值和重要性越大。本研究采用RF計算特征重要性,根據(jù)特征得分進(jìn)行重要性排序?;赗F計算特征重要性的優(yōu)勢在于其考慮特征之間的相互作用,而且可對不同分類特征排序進(jìn)行可視化。
基于不同分類特征組合的蘋果園地遙感信息提取結(jié)果見圖4。方案1的結(jié)果中多個地區(qū)蘋果園地面積與統(tǒng)計值差異較大,主要在鳳翔區(qū)、旬邑縣、宜君縣、永壽縣和長武縣(圖4A)。方案2結(jié)果較優(yōu)于方案1,但蘋果園地提取效果仍較差(圖4B),說明光譜特征和遙感植被指數(shù)組合并不能對蘋果園地遙感信息進(jìn)行有效提取。
A.方案1(S);B.方案2(S+R);C.方案3(S+T);D.方案4(S+D);E.方案5(S+R+T+D)
方案3與方案4分別增加了紋理特征和地形特征,顯示部分地區(qū)蘋果園地提取效果有一定程度的提高,但在其他地區(qū)表現(xiàn)更差。例如,方案3在彬州市、淳化縣、宜君縣和長武縣蘋果園地提取結(jié)果與統(tǒng)計值更為接近,但黃陵縣和洛川縣蘋果園地提取效果較差(圖4C);方案4增強了淳化縣、鳳翔區(qū)和永壽縣蘋果園地提取效果,但對千陽縣和耀州區(qū)的提取效果變差(圖4D)。由方案3和方案4分類結(jié)果可知,不同源的分類特征結(jié)合可以彌補單一分類特征的缺陷,提高蘋果園信息提取的可靠性,但區(qū)域蘋果園地提取效果仍待進(jìn)一步加強。
方案5結(jié)合了光譜特征、遙感植被指數(shù)、紋理特征和地形特征,其提取的蘋果園地面積為23.03萬hm2,與統(tǒng)計數(shù)據(jù)(23.25萬hm2)最為接近(圖4E)。蘋果種植面積較大的縣(區(qū))主要為延安市洛川縣、渭南市白水縣、咸陽市淳化縣和咸陽市彬州市,種植蘋果面積分別為3.54、3.21、2.90萬hm2和2.51萬hm2??傮w而言,相比于前4個方案,方案5的蘋果園地遙感信息整體提取結(jié)果更接近于真實情況,說明不同分類特征結(jié)合可以彌補單一分類特征的不足,能夠有效提高蘋果園地遙感信息提取的可靠性。
由表5可知,所有分類特征組合的OA均>89%,Kappa系數(shù)均>0.78。分類特征組合為方案1的總體精度最低,其分類特征僅包含10個波段信息的光譜特征,OA和Kappa系數(shù)分別為89%和0.78;方案2~4分別在方案1的基礎(chǔ)上加入了遙感植被指數(shù)、紋理特征、地形特征,OA和Kappa均有一定程度的增加;OA和Kappa系數(shù)最高的為方案5,其加入了遙感植被指數(shù)、紋理特征和地形特征。相比于方案1,OA和Kappa系數(shù)分別提升了5%和0.08。
表5 基于不同分類方案的蘋果園地提取精度評價
基于最優(yōu)分類方案5,利用RF對其21個分類特征計算特征重要性,并根據(jù)特征得分進(jìn)行排序,結(jié)果見圖5。光譜特征中短紅外波段B11和B12均具有較高得分,分別為1.82%和1.80%。由圖3可知,4類地物在B11和B12波段的反射率差異較大,表明2個短紅外波段在蘋果園地識別中可以提供較
圖5 基于方案5的分類特征重要性排序
大的貢獻(xiàn);可見光波段B2、B3和B4的重要性得分分別為1.90%、1.71%和1.49%,在蘋果園地信息提取中起到重要作用;紅邊波段B5、B6、B7、B8A和近紅外波段B8的重要性分別為1.51%、1.57%、1.60%、1.60%和1.59%。除B5外,其他4個波段的蘋果園地和其他用地光譜反射率較為相近。
在其他分類特征中,地形特征對于蘋果園地信息提取的貢獻(xiàn)最大,為2.45%,說明地形特征對蘋果園地識別具有較高價值。遙感植被指數(shù)中BSI、NDVI、EVI和SAVI的重要性分別為1.67%、1.59%、1.55%和1.43%,與大多數(shù)光譜波段的貢獻(xiàn)率相差不大;紋理特征Mean、Con、Var、Corr能夠有效增強蘋果園地識別能力,其重要性分別為1.79%、1.66%、1.66%和1.58%,而Asm和Ent的重要性分別為0.97%和0.87%,遠(yuǎn)低于其他分類特征。
集合不同分類特征可以有效排除單一分類特征中的“同譜異物”現(xiàn)象,有效提高蘋果園地遙感信息提取效果。本研究結(jié)果顯示紋理特征對于蘋果園地信息提取的重要性差異較大,例如Mean、Con、Var和Corr與其他分類特征的重要性差異不大,均>1.43%,Asm和Ent卻均<0.97%,遠(yuǎn)低于其他分類特征,這說明紋理特征的熵(Ent)和二階矩(Asm)不適宜用于蘋果園地遙感信息提取。劉羽[7]基于洛川縣蘋果園地信息提取的重要性排序,得到23個優(yōu)選特征中僅包含1個紋理特征(均值),其他紋理特征均表現(xiàn)較差;代佳佳[22]在寧縣對蘋果信息提取的研究結(jié)果顯示,紋理特征的均值貢獻(xiàn)最大,其次為相關(guān)性、熵和方差。表明紋理特征在不同情境下的效益可能相差較大,這可能與蘋果樹的品種及種植方式有關(guān)。因此,在提取目標(biāo)地物信息時,應(yīng)對紋理特征進(jìn)一步篩選。
以往研究表明,花期是蘋果園地遙感信息提取的最佳時期[21-23,36]。董芳[21]對比了不同時期的蘋果園地提取精度,發(fā)現(xiàn)最佳的蘋果園地識別時間為蘋果花期,即4月底至5月底。然而,部分研究表明,花期并不是蘋果園地信息提取的最佳時期。劉佳岐[20]認(rèn)為在扶風(fēng)縣地區(qū)最佳的蘋果園地信息提取時期為夏玉米收割之后、冬小麥發(fā)芽之前(2014年10月25日的Landsat8影像),輔助影像可使用冬小麥返青期前的遙感影像(2014年3月15日的Landsat8影像);劉羽[7]證明了在果實膨大期蘋果園地信息提取效果最好,其次為開花期。最佳影像選取時間不僅與目標(biāo)地物類型有關(guān),而且受當(dāng)?shù)貧夂驐l件、地形特征及研究區(qū)耕種制度等因素的共同影響。由于本研究區(qū)包含14個縣(區(qū)),地形復(fù)雜,因此,在前期工作的基礎(chǔ)上,明確蘋果花期作為蘋果園地信息提取的時間范圍。
選擇了光譜特征、遙感植被指數(shù)、紋理特征和地形特征作為分類特征,但冗余特征和無關(guān)特征在一定程度上會降低分類精度,未來應(yīng)結(jié)合區(qū)域自然條件篩選更適宜蘋果園地分類特征及特征變量數(shù)量,以提高蘋果園地空間信息提取精度。此外,在野外樣本點采集過程中僅收集了蘋果園的樣本信息,并未考慮其他果樹,如梨樹、桃樹等。因此,可能會對蘋果園地的空間信息提取結(jié)果產(chǎn)生一定影響。未來研究中應(yīng)同時收集其他果樹的樣本信息,增加地物類別,提高蘋果園的分類精度。
基于GEE平臺,篩選并融合了2020年4-5月Sentinel-2影像數(shù)據(jù),采用隨機森林算法提取了陜西省渭北旱塬區(qū)14個縣(區(qū))的蘋果園地空間分布信息,得出以下主要結(jié)論。
基于包含光譜特征、遙感植被指數(shù)、紋理特征和地形特征的分類特征集提取的渭北旱塬區(qū)蘋果種植總面積為23.03萬hm2,與年鑒統(tǒng)計值最為接近,且總體精度和Kappa系數(shù)最高。
地形特征、光譜特征中的藍(lán)波段、短波紅外波段,以及紋理特征均值對研究區(qū)內(nèi)蘋果園地遙感信息提取的貢獻(xiàn)值最大;而紋理特征的熵和二階矩的重要性最低。
單一分類特征在蘋果園地遙感識別中均具有一定的局限性,集合多種分類特征結(jié)合的方式可有效提高對蘋果園地的識別和提取效果,是有效提高蘋果園地遙感信息提取精度最佳方法。