楊文博,劉春秀
(山東科技大學(xué),山東 青島 266000)
目前的農(nóng)業(yè)灌溉面積提取的主要方法為人工統(tǒng)計(jì)和通過(guò)遙感技術(shù)提取。人工統(tǒng)計(jì)灌溉面積雖然可以獲得較為完整的灌溉面積以及農(nóng)作物信息,且擁有較高的精度。但是,人工統(tǒng)計(jì)需要耗費(fèi)大量人力物力,且獲取信息的時(shí)間長(zhǎng),受到外界影響比較大,不利于之后對(duì)獲取信息的處理及運(yùn)用[1]。
遙感技術(shù)于20世紀(jì)70年代開(kāi)始在我國(guó)各個(gè)領(lǐng)域進(jìn)行應(yīng)用。80年代獲得了較大的發(fā)展,并廣泛應(yīng)用[2]。在各種環(huán)境條件下,遙感成為監(jiān)測(cè)世界許多地方灌溉土地的有效工具。通過(guò)遙感技術(shù)可以不用接觸目標(biāo)就能獲取灌溉區(qū)的農(nóng)作物種類及其分布情況,提取灌溉面積并合理的分配不同地區(qū)不同農(nóng)作物種類所需的灌溉量,真正做到科學(xué)分配、合理使用水資源[3]。
目前的遙感技術(shù)提取灌溉面積的研究中,可分為以下幾種類型:①基于熱紅外遙感的灌溉面積提取。此研究的基礎(chǔ)在于通過(guò)熱紅外波段來(lái)對(duì)地表溫度或者土壤熱慣量進(jìn)行反演[4]。土壤經(jīng)過(guò)灌溉后,地表溫度以及土壤熱慣量都會(huì)降低,通過(guò)多時(shí)相的影像數(shù)據(jù)來(lái)判斷研究區(qū)域是否發(fā)生灌溉行為。但是熱紅外衛(wèi)星遙感分辨率較低,對(duì)于較小區(qū)域的灌溉面積提取精度較差。②基于可見(jiàn)光-近紅外遙感的灌溉面積提取[5-8]?;诳梢?jiàn)光-近紅外遙感的灌溉面積提取一般都是通過(guò)各種植被指數(shù)的閾值法進(jìn)行灌溉探測(cè),其中植被供水指數(shù)(VSWI)、溫度植被干旱指數(shù)(TVDI)、垂直干旱指數(shù)(PDI)應(yīng)用較為廣泛?;诳梢?jiàn)光-近紅外遙感的灌溉面積提取受到天氣、地表植被覆蓋、種植作物類型等各種因素的制約。并且單一的遙感指數(shù)對(duì)土壤水分的敏感性較差,此類方法的不確定性較大。③基于微波遙感的灌溉面積提取[9,10]。微波遙感具有堅(jiān)實(shí)的物理基礎(chǔ),它不受云層和黑夜的影響,并且對(duì)土壤和植被都有一定的穿透作用。此研究在土壤含水量反演中應(yīng)用較為廣泛。但雷達(dá)信號(hào)對(duì)地表的幾何結(jié)構(gòu)高度敏感,受到地表粗糙程度的影響,并且受到植被的影響[20,21]。近些年在灌溉面積提取研究中還有一種技術(shù)就是結(jié)合光學(xué)遙感和微波遙感來(lái)進(jìn)行灌溉事件的探測(cè)[11-16]。但基于多種傳感器的研究方法所受的影響也會(huì)增多,所以光學(xué)遙感和微波遙感聯(lián)合反演對(duì)于灌溉面積提取精度的提高有限。并且由于不同衛(wèi)星的重訪周期不同,衛(wèi)星數(shù)據(jù)極難獲取,效率較低,難以進(jìn)行長(zhǎng)時(shí)間序列的灌溉面積空間分布信息獲取。所以想要在實(shí)際應(yīng)用中準(zhǔn)確高效的獲取灌溉信息,則需要以單傳感器研究方法為主,多傳感器聯(lián)合為輔。以單傳感器獲取長(zhǎng)時(shí)間的灌溉面積和分布,以多傳感器聯(lián)合作為檢驗(yàn)修正手段。在基于單一的傳感器數(shù)據(jù)研究中,可分為微波遙感和光學(xué)遙感兩類,微波遙感受到的地形制約嚴(yán)重,不確定性較大[17,18],只使用微波數(shù)據(jù)無(wú)法使用在具體實(shí)際應(yīng)用中。光學(xué)遙感雖然受到天氣等因素影響,但在適合的條件下反演精度高。符合遙感技術(shù)的高效性和準(zhǔn)確性,易實(shí)現(xiàn)在實(shí)際應(yīng)用中獲取灌溉面積空間分布信息[19]。
為此,本研究以山東省淄博市桓臺(tái)縣為研究區(qū)域,探討基于Sentinel-2 提取農(nóng)田灌溉面積的最佳波段及其組合,主要利用隨機(jī)森林模型對(duì)Sentinel-2 各個(gè)波段的遙感觀測(cè)數(shù)據(jù)以及多個(gè)植被指數(shù)和土壤含水量指數(shù)進(jìn)行重要性排序,選取重要性較高的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)模型的輸入層,對(duì)研究區(qū)內(nèi)所有作物類型的灌區(qū)進(jìn)行灌溉面積提取。通過(guò)對(duì)研究區(qū)進(jìn)行植被覆蓋度分級(jí),并針對(duì)在不同植被覆蓋度的農(nóng)田的灌溉面積提取結(jié)果進(jìn)行分析,最后結(jié)合實(shí)地?cái)?shù)據(jù)對(duì)提取結(jié)果進(jìn)行驗(yàn)證。
研究區(qū)為山東省淄博市桓臺(tái)縣,介于北緯36°51′50″-37°06′00″,東經(jīng)117°50′00″-118°10′40″,位于魯中山區(qū)和魯北平原的結(jié)合地帶,位于山東省中部偏北,淄博市北部(圖1),屬溫帶大陸性季風(fēng)性氣候。研究區(qū)大部分為農(nóng)業(yè)地區(qū),農(nóng)業(yè)植被面積占可利用面積的93.1%,且農(nóng)田比較規(guī)整,地情簡(jiǎn)單,較為適合進(jìn)行灌溉面積提取研究。該地區(qū)的農(nóng)作物以冬小麥和夏玉米為主。
圖1 桓臺(tái)縣 Sentinel -2 RGB合成影像Fig.1 Sentinel-2 RGB composite image of Huantai
Sentinel-2 是高分辨率多光譜成像衛(wèi)星,搭載一枚多光譜成像儀(MSI),可用于陸地監(jiān)測(cè),可提供植被、土壤和水覆蓋、內(nèi)陸水路及海岸區(qū)域等圖像,還可用于緊急救援服務(wù)。Sentinel-2 分為2A 和2B 兩顆衛(wèi)星。分別于2015年6月23日、2017年3月7日以“織女星”運(yùn)載火箭發(fā)射升空。單顆衛(wèi)星重訪周期為10 d,兩顆衛(wèi)星同時(shí)運(yùn)行可使得重訪周期為5 d。數(shù)據(jù)于歐空局哥白尼數(shù)據(jù)中心下載(https://scihub.copernicus.eu/dhus/#/home)。
由于研究中所用的波段分辨率不相同,所以還需要對(duì)20 m 分辨率的幾個(gè)波段進(jìn)行重采樣為10 m 分辨率。研究所需波段信息如表1所示。
表1 研究所用波段及其參數(shù)Tab.1 Bands used in the study and their parameters
用研究區(qū)內(nèi)樣本田上傳的實(shí)際灌溉區(qū)域(圖2)作為樣本,共計(jì)43 塊樣本田(其中已灌溉樣本田16 塊,未灌溉樣本田27塊)。
圖2 研究區(qū)樣本田分布Fig.2 Sample field distribution in the study area
研究中使用的數(shù)據(jù)為Sentinel-2 衛(wèi)星2022年3月份數(shù)據(jù)。3月份為灌溉高峰期,并且3月份具有較多的植被覆蓋度類型,有利于對(duì)不同植被覆蓋度下的農(nóng)田灌溉面積提取結(jié)果進(jìn)行研究分析。本文收集了3月2日和3月5日、3月15日和3月17日、3月27日和4月1日3 組衛(wèi)星影像作為研究數(shù)據(jù)。產(chǎn)品級(jí)別主要是L1C級(jí)以及少部分的L2A級(jí)。其中L1C級(jí)數(shù)據(jù)是只經(jīng)過(guò)正射校正和幾何精校正的大氣表觀反射率產(chǎn)品,并沒(méi)有進(jìn)行大氣校正。L2A級(jí)數(shù)據(jù)則為經(jīng)過(guò)大氣校正的大氣底層反射率數(shù)據(jù)。為保證影像光譜數(shù)據(jù)的原始性,只對(duì)L1C 級(jí)數(shù)據(jù)進(jìn)行必要的大氣校正。
(1) 歸一化植被指數(shù)(NDVI)。歸一化植被指數(shù)(Normalized Difference Vegetation Index)是反應(yīng)農(nóng)作物長(zhǎng)勢(shì)以及植被覆蓋情況的重要指標(biāo)。定義為:
式中:NIR為近紅外波段的反射率;Red為紅光波段反射率。植被的生長(zhǎng)中水分不足將影響作物正常生長(zhǎng)并進(jìn)而表現(xiàn)出植被指數(shù)的變化。因此,通過(guò)植被指數(shù)可以間接顯示灌溉情況。
(2)歸一化水指數(shù)(NDWI)。歸一化水指數(shù)(Normalized Difference Water Index)可以提取灌溉前后明顯的農(nóng)田的灌溉面積信息。其表達(dá)式為:
式中:Green為綠光段反射率。
(3)土壤調(diào)整植被指數(shù)(MSAVI)。土壤調(diào)整植被指數(shù)(Modified Soil Adjusted Vegetation Index)可以減少土壤水分對(duì)灌溉面積提取的影響,從而更好的反應(yīng)在研究區(qū)域植被狀況對(duì)灌溉面積提取的影響。其表達(dá)式:
(4)垂直干旱指數(shù)(PDI)。垂直干旱指數(shù)(Perpendicular Dry ness Index)可以反應(yīng)土壤中的水分情況,尤其是適用于裸露地表的研究區(qū)域。對(duì)于植被覆蓋度較小農(nóng)田的灌溉面積提取具有較大的影響。其模型表達(dá)式為:
式中:M為土壤線斜率。
(5)表層水分含量指數(shù)(SWCI)。表層水分含量指數(shù)(SWCI)是杜曉等發(fā)現(xiàn)短波紅外對(duì)葉片水含量變化較為敏感,并利用植被冠層和裸地在高光譜區(qū)域的反射和吸收光譜特征,提出的一種新的地表含水量指數(shù)模型,間接提取灌溉面積。表達(dá)式為:
式中:SWIR1、SWIR2是兩個(gè)短波紅外的反射率。
本文的灌溉面積提取算法是根據(jù)Sentinel-2 衛(wèi)星分辨率為10 m 和20 m 的10 個(gè)波段地表反射率以及多種土壤濕度的指數(shù)所構(gòu)建的。首先利用隨機(jī)森林對(duì)Sentinel-2 衛(wèi)星數(shù)據(jù)的所有波段以及一些與土壤水含量相關(guān)的指數(shù)進(jìn)行重要性排序,然后選取重要性排序較高的波段或指數(shù)差值作為神經(jīng)網(wǎng)絡(luò)模型輸入層進(jìn)行神經(jīng)網(wǎng)絡(luò)提取。此外,對(duì)研究區(qū)域進(jìn)行植被覆蓋度分級(jí),并分析在不同植被覆蓋度下的灌溉面積提取結(jié)果精度變化。
隨機(jī)森林模型(Random Forest)[18]是一種比較新的機(jī)器學(xué)習(xí)模型(非線性基于樹(shù)的模型)集成學(xué)習(xí)方法。而隨機(jī)森林模型相較于其他模型有一個(gè)非常重要的優(yōu)點(diǎn),那就是重要性排序。在隨機(jī)森林中某個(gè)特征X的重要性的計(jì)算方法如下:
(1)對(duì)于隨機(jī)森林中的每一顆決策樹(shù),使用相應(yīng)的OOB(袋外數(shù)據(jù))數(shù)據(jù)來(lái)計(jì)算它的袋外數(shù)據(jù)誤差,記為errOOB1。
(2)隨機(jī)地對(duì)袋外數(shù)據(jù)OOB 所有樣本的特征X加入噪聲干擾(就可以隨機(jī)的改變樣本在特征X 處的值),再次計(jì)算它的袋外數(shù)據(jù)誤差,記為errOOB2。
(3)假設(shè)隨機(jī)森林中有Ntree棵樹(shù),那么對(duì)于特征X的重要性VIX為:
之所以可以用這個(gè)表達(dá)式來(lái)作為相應(yīng)特征的重要性的度量值是因?yàn)椋喝艚o某個(gè)特征隨機(jī)加入噪聲之后,袋外的準(zhǔn)確率大幅度降低,則說(shuō)明這個(gè)特征對(duì)于樣本的分類結(jié)果影響很大,也就是說(shuō)它的重要程度比較高。
本研究以10 個(gè)波段以及指數(shù)為自變量,是否灌溉為因變量,利用隨機(jī)森林模型的重要性排序獲取每一個(gè)自變量的顯著性。選取排序的較大重要性自變量作為之后神經(jīng)網(wǎng)絡(luò)模型的灌溉面積提取的輸入層,對(duì)研究區(qū)域進(jìn)行灌溉面積提取預(yù)測(cè)。
本文使用了BP 神經(jīng)網(wǎng)絡(luò)模型作為此次研究的訓(xùn)練模型。BP (Back Propagation) 神經(jīng)網(wǎng)絡(luò)是1986年由Rumelhart 和McClelland 為首的科學(xué)家提出的概念,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一 。
BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程由信號(hào)的正向傳播和誤差的反向傳播兩個(gè)過(guò)程組成。正向傳播時(shí),把樣本的特征從輸入層進(jìn)行輸入,信號(hào)經(jīng)過(guò)各個(gè)隱藏層的處理后,最后從輸出層傳出。對(duì)于網(wǎng)絡(luò)的實(shí)際的輸出與期望輸出之間的誤差,把誤差信號(hào)從最后一層逐層反傳,從而獲得各個(gè)層的誤差學(xué)習(xí)信號(hào),然后再根據(jù)誤差學(xué)習(xí)信號(hào)來(lái)修正各層神經(jīng)元的權(quán)值。這種信號(hào)正向傳播與誤差反向傳播,然后各層調(diào)整權(quán)值的過(guò)程是周而復(fù)始地進(jìn)行的。權(quán)值不斷調(diào)整的過(guò)程,也就是網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過(guò)程。進(jìn)行此過(guò)程直到網(wǎng)絡(luò)輸出誤差減小到預(yù)先設(shè)置的閾值以下,或者超過(guò)預(yù)先設(shè)置的最大訓(xùn)練次數(shù)。
植被覆蓋度(Fraction Vegetation Coverage,F(xiàn)VC)通常被定義為植被(包括葉、莖、枝)在地面的垂直投影面積占統(tǒng)計(jì)區(qū)總面積的百分比,是刻畫(huà)地表植被覆蓋的重要參數(shù),在植被變化、生態(tài)環(huán)境研究、水土保持、城市宜居等方面問(wèn)題研究中起到重要作用。植被覆蓋度能夠直觀的反映一個(gè)地區(qū)綠的程度,是反應(yīng)植被生長(zhǎng)狀態(tài)的重要指標(biāo)。其表達(dá)式為:
式中:NDVIsoil為純土壤像元的最小值,理論上接近于0;NDVIveg為純植被像元的最大值,理論上接近于1。實(shí)際上由于氣象、環(huán)境等各種外界條件的影響,不同影響的NDVIsoil和NDVIveg也會(huì)受到一定程度上的影響。
根據(jù)不同的植被覆蓋度劃分為5 個(gè)級(jí)別,分別記為Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ,依次表示低覆蓋度、較低覆蓋度、中等覆蓋度、較高覆蓋度和高覆蓋度,如表2所示。
表2 植被覆蓋度分級(jí)標(biāo)準(zhǔn)Tab.2 Classification standard of vegetation coverage
Sentinel-2 衛(wèi)星數(shù)據(jù)可分為分辨率為10、20、60 m 的波段,粗分辨率的遙感數(shù)據(jù)并不適用在區(qū)域性的灌溉面積提取研究中。所有本研究選取了Sentinel-2衛(wèi)星數(shù)據(jù)的所有10 m 和20 m 分辨率波段數(shù)據(jù)作為特征參數(shù)。此外,考慮研究區(qū)內(nèi)多種植被覆蓋類型,本研究還選取了一些植被以及土壤指數(shù)作為特征參數(shù)。選取NDVI、NDWI、MSAVI、PDI、SWCI這些指數(shù)較好的涵蓋了大部分的植被覆蓋類型,保證了在不同植被覆蓋度下的灌溉面積提取。通過(guò)將16 個(gè)特征參數(shù)放入隨機(jī)森林模型中進(jìn)行重要性排序,獲得了不同特征參數(shù)對(duì)灌溉面積提取結(jié)果的重要性值。得到對(duì)灌溉面積提取影響較大的特征參數(shù),并使用這些特征參數(shù)作為后續(xù)神經(jīng)網(wǎng)絡(luò)的輸入層進(jìn)行灌溉面積提取研究。
隨機(jī)森林的重要性排序結(jié)果圖如圖3所示,其中綠光和紅光波段以及近紅外波段和兩個(gè)短波紅外波段對(duì)灌溉面積提取影響較大。另外,本研究所選取的土壤濕度及植被含水量指數(shù)中,灌溉所用時(shí)間較短,短期內(nèi)植被生長(zhǎng)狀況并沒(méi)有顯著的變化,NDVI對(duì)灌溉面積提取影響很小,重要性低。NDWI對(duì)水體較為敏感,多用在淹沒(méi)灌溉提取研究,而研究區(qū)內(nèi)灌溉量不能滿足淹沒(méi)灌溉,所以其對(duì)本研究的影響較小,在隨機(jī)森林中的重要性也很低。PDI指數(shù)對(duì)灌溉事件較為敏感。結(jié)合各波段光譜灌溉前后差值(圖4)對(duì)比進(jìn)行驗(yàn)證,重要性排序結(jié)果具有較高的可靠性。最終選取B3、B4、B8、B8a、B11波段以及PDI指數(shù)做為本次研究的參數(shù)。
圖3 重要性排序Fig.3 Importance order
圖4 各波段灌溉前后光譜變化Fig.4 Spectral changes before and after irrigation in each band
將隨機(jī)森林重要性排序選擇出來(lái)的影響因子較高的特征參數(shù)放入神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行灌溉面積提取,得到灌溉面積提取的結(jié)果圖(見(jiàn)圖5)。
圖5 灌溉面積提取結(jié)果圖Fig.5 Extraction result of irrigation area
4.2.1 灌溉面積結(jié)果驗(yàn)證
對(duì)神經(jīng)網(wǎng)絡(luò)模型提取的灌溉面積進(jìn)行統(tǒng)計(jì),結(jié)果如表3所示。
表3 灌溉面積精度評(píng)估表Tab.3 Irrigation area accuracy evaluation
使用實(shí)際調(diào)查采集的樣本點(diǎn)數(shù)據(jù)進(jìn)行驗(yàn)證(表3),灌溉地區(qū)提取精度為75%,非灌溉地區(qū)提取精度為77.8%,總體灌溉精度為76.7%,Kappa系數(shù)為0.74。
4.2.2 不同植被覆蓋度灌溉面積提取結(jié)果分析
對(duì)研究區(qū)進(jìn)行植被覆蓋度分級(jí),分級(jí)后的灌溉面積提取結(jié)果如圖6所示。
圖6 不同植被覆蓋度的灌溉面積提取結(jié)果圖Fig.6 Irrigation area extraction result map of different vegetation coverage
從表4 和表5 可以看出,在中等和較高植被覆蓋度地區(qū)的灌溉樣本點(diǎn)共有30 個(gè),正確提取26 個(gè)樣本點(diǎn),準(zhǔn)確率達(dá)到86.7%,灌溉面積提取點(diǎn)準(zhǔn)確率較高,提取效果較好。這是由于研究區(qū)大部分地區(qū)為農(nóng)業(yè)地區(qū),作物以冬小麥和夏玉米為主,使用數(shù)據(jù)為3月中下旬衛(wèi)星影像,此時(shí)期研究區(qū)大部分地區(qū)為中等和較高植被覆蓋度,隨機(jī)森林重要性排序選取的波段和指數(shù)適合在此植被覆蓋度所得出的結(jié)果。所以符合在此地情下進(jìn)行灌溉面積提取在中等和較高植被覆蓋度地區(qū)具有更高精度的結(jié)果。
表4 已灌溉樣本點(diǎn)精度評(píng)估表Tab.4 Accuracy evaluation table of irrigated sample points
表5 未灌溉樣本點(diǎn)精度評(píng)估表Tab.5 Accuracy evaluation table for unirrigated sample points
區(qū)域的實(shí)際灌溉面積是對(duì)水資源合理利用的關(guān)鍵指標(biāo),灌溉面積監(jiān)測(cè)是農(nóng)業(yè)水資源利用和流域水資源管理等應(yīng)用的基礎(chǔ)?;谀壳肮鈱W(xué)衛(wèi)星在區(qū)域灌溉探測(cè)識(shí)別研究中的方法,本文使用光學(xué)衛(wèi)星數(shù)據(jù)構(gòu)建了神經(jīng)網(wǎng)絡(luò)模型進(jìn)行灌溉面積提取研究。利用隨機(jī)森林模型對(duì)哨兵2 號(hào)衛(wèi)星20 m 分辨率波段以及植被、土壤含水量相關(guān)系數(shù)進(jìn)行重要性排序,構(gòu)建與灌溉面積高相關(guān)度的神經(jīng)網(wǎng)絡(luò)模型。并在山東省淄博市桓臺(tái)縣灌區(qū)進(jìn)行灌溉面積提取,結(jié)合灌溉區(qū)域?qū)嵉卣{(diào)查資料對(duì)提取結(jié)果進(jìn)行驗(yàn)證。本文結(jié)論如下:
(1)在基于光學(xué)衛(wèi)星的灌溉面積提取研究中,可見(jiàn)光波段以及近紅外波段對(duì)于土壤灌溉事件具有更高的敏感度。使用機(jī)器學(xué)習(xí)的方法可以更加容易方便的得到這些與研究具有較強(qiáng)相關(guān)性的因子。
(2)根據(jù)灌溉面積結(jié)果可以看出,在研究區(qū)內(nèi)的地情下重要性排序所選擇出的波段以及植被指數(shù)對(duì)較高植被覆蓋地區(qū)的灌溉面積提取結(jié)果更加準(zhǔn)確。
(3)提出一種基于光學(xué)遙感衛(wèi)星數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)提取灌區(qū)實(shí)際灌溉面積方法,構(gòu)建與灌溉事件高相關(guān)度的神經(jīng)網(wǎng)絡(luò)模型對(duì)灌區(qū)進(jìn)行探測(cè)。本文所提出的方法具有較好的適用性。依據(jù)灌區(qū)作物類型和植被覆蓋度選取植被以及土壤指數(shù)作為特征參數(shù),對(duì)所有選取的特征進(jìn)行重要性排序,使得此方法在不同地區(qū)地情下都可以較好的提取灌溉面積。且此方法只依賴單傳感器衛(wèi)星,數(shù)據(jù)的獲取簡(jiǎn)單快捷,可以更高效的提取灌區(qū)的灌溉面積。為灌區(qū)的現(xiàn)代化管理和水資源的合理分配等應(yīng)用提供了可靠的技術(shù)支撐。但此方法依舊是基于光學(xué)遙感衛(wèi)星,受到天氣等因素的干擾,難以獲取長(zhǎng)時(shí)間序列的灌區(qū)灌溉面積信息,且精度稍低于光學(xué)和微波衛(wèi)星聯(lián)合的研究方法。要實(shí)現(xiàn)大范圍的灌溉面積提取并提高精度,還需要進(jìn)一步研究。