李 艷,張成才,恒衛(wèi)東
(1.河口生態(tài)安全與環(huán)境健康福建省高校重點實驗室,福建 漳州 363000;2.廈門大學嘉庚學院 環(huán)境科學與工程學院,福建 漳州 363000;3.鄭州大學水利科學與工程學院,鄭州 450001)
準確獲取土壤墑情,特別是糧食主產(chǎn)區(qū)的土壤墑情信息,對于保障農(nóng)作物健康生長發(fā)育,估算農(nóng)作物需水情況,制定農(nóng)作物生長灌溉用水計劃,指導農(nóng)業(yè)建設、防旱抗旱以及農(nóng)田生態(tài)環(huán)境修復都具有重要的科學意義和現(xiàn)實意義[1,2]。
遙感技術能夠快速、準確、可持續(xù)地獲取大面積地表信息,是目前監(jiān)測和反演土壤墑情的主要手段之一。根據(jù)傳感器的不同,遙感可大致分為光學遙感和微波遙感。光學遙感是目前發(fā)展較為成熟的遙感手段,基于光學遙感發(fā)展了一大批土壤墑情反演方法[3-5]。但是,光學遙感受云層、太陽照射以及天氣條件的影響較大[6]。微波遙感不僅能夠全天時、全天候的對地物進行探測,還能夠穿透云霧和一定厚度的植被而直接獲取地表信息,有效彌補了光學遙感的不足[7,8]。以合成孔徑雷達(Synthetic Aperture Radar, SAR)為代表的主動微波,其后向散射系數(shù)對地物的幾何特征如地表粗糙度、介電特性等非常敏感,為反演土壤墑情提供了可靠的數(shù)據(jù)支持[9]。受地表粗糙度、植被的衰減等因素影響,微波信號與土壤水分之間的關系很難用數(shù)學解析式精確表達[10]。
與傳統(tǒng)統(tǒng)計回歸方法相比,機器學習方法具有很強的自學習、自組織和自適應等能力,非常適合解決這種非線性的復雜問題。因此,機器學習方法在土壤墑情反演研究中得到了廣泛的應用。Paloscia 等[11]利用模擬的Sentinel-1 SAR 數(shù)據(jù),采用人工神經(jīng)網(wǎng)絡(Artificial Neural Network, ANN)配置不同的訓練數(shù)據(jù),在意大利、澳大利亞和西班牙等6個試驗區(qū)對土壤墑情進行反演。結果表明,在6 個實驗區(qū)域中采用ANN得到的土壤墑情與實測值的均方根誤差(RMSE)介于1.67%和6.68%之間,且大部分區(qū)域小于4%。 Greifeneder 等[12]將Sentinel-1 SAR數(shù)據(jù)與Landsat-8的光學數(shù)據(jù)相結合,采用漸進梯度決策樹(Gradient Boosting Decision Tree , GBDT)的機器學習方法,對全球的地表土壤墑情進行了反演。結果顯示:不同的土壤類型反演結果略有差異,總體的RMSE和R2分別為0.04 m3/m3和0.81。蔣金豹等[13]首先利用MIMICS (Michigan Microwave Canopy Scattering) 模型和高級積分方程模型(Advanced Integral Equation Model, AIEM)模型建立后向散射系數(shù)數(shù)據(jù)庫,然后分別采用BP 神經(jīng)網(wǎng)絡、支持向量機(Support Vector Machine, SVM)、 思維進化算法(Mind Evolutionary Algorithm, MEA) 與BP 神經(jīng)網(wǎng)絡結合(MEABP)、最小二乘支持向量機(Least Squares Support Vector Machine,LS-SVM)等方法建立模型,實現(xiàn)研究區(qū)麥田土壤墑情的反演。結果發(fā)現(xiàn),采用LS-SVM 模型反演結果精度最高,BP 神經(jīng)網(wǎng)絡的擬合結果精度最低?;谌斯ど窠?jīng)網(wǎng)絡,2006年由多倫多大學的Hinton 研究組提出“深度學習”的概念[14]。深度神經(jīng)網(wǎng)絡通過模擬生物神經(jīng)元對刺激的非線性響應來對數(shù)據(jù)進行學習,能夠表征更加抽象的數(shù)據(jù)特征和模式[15]。由多個層次或多個非線性信息處理模塊組成的深度學習不僅具備從大數(shù)據(jù)中學習的能力,并且能夠更好的表達變量與結果之間復雜的非線性關系,在計算機視覺、語音及圖像識別、信息檢索、圖像特征編碼等眾多領域都有出色的表現(xiàn)[16]。近幾年,利用深度學習的方法反演土壤墑情的研究也在不斷增加。Babaeian 等[17]基于高空間分辨率光學反射率無人機系統(tǒng)(UAS)和自動機器學習(AutoML),反演地表、近地表和根區(qū)土壤墑情。Fang 等[18]利用SMAP 衛(wèi)星結合LSTM 架構的深層遞歸神經(jīng)網(wǎng)絡,對美國大陸的土壤含水量進行了反演研究。
本研究選取河南省鶴壁市的麥田為研究對象,綜合光學和微波遙感的各自優(yōu)勢,提取雷達后向散射系數(shù),計算植被含水量以及植被覆蓋度等信息,全連接深度學習的方法對研究區(qū)麥田土壤墑情進行反演研究,以期為監(jiān)測麥田旱情提供決策信息。
鶴壁市位于河南省北部(113°59'E~114°45'E,35°26'N~36°02'N),南北長67 km,東西寬69 km,總面積約2 182 km2,屬暖溫帶半濕潤型季風氣候,四季分明,冬春兩季降雨少,夏秋兩季降雨多,年平均氣溫14.2~15.5 ℃,年降水349.2~970.1 mm。 鶴壁市在2012年被農(nóng)業(yè)部確定為全國5 個整建制推進高產(chǎn)創(chuàng)建試點市之一,農(nóng)業(yè)機械化、信息化和標準化水平位于全國前列,是河南省唯一基本實現(xiàn)農(nóng)業(yè)現(xiàn)代化的地區(qū)。截至2019年7月,優(yōu)質專用小麥種植面積183.33 km2,較2018年增長64.7%(https://www.hebi.gov.cn)。圖1 是研究區(qū)及試驗點位置示意圖。
圖1 研究區(qū)地理位置及采樣點分布圖
1.2.1 Sentinel-1及預處理
Sentinel-1 衛(wèi)星是C 波段合成孔徑雷達(SAR),由Sentinel-1A 和 Sentinel-1B 兩顆衛(wèi)星組成。單個衛(wèi)星每12 天映射全球一次,雙星座重訪周期縮短至6 天。Sentinel-1 衛(wèi)星具有4 種成像模式(干涉寬幅模式(Interferometric Wide Swath,IW)、條帶模式(Strip Map,SM)、超幅寬模式(Extra Wide Swath,EW)和波模式(Wave Mode,WV))實現(xiàn)對地觀測,具有全天時、全天候、大范圍、多模式、短重返周期等特點。Sentinel-1 數(shù)據(jù)產(chǎn)品分為Level-0,Level-1 和Level-2 三個級別,其中,Level-1 級數(shù)據(jù)產(chǎn)品包括:單視復數(shù)影像(Single Look Complex,SLC) 和地距影像(Ground Range Detected,GRD)。
本研究從哥白尼開放獲取中心(https://scihub.copernicus.eu)獲取了2018年10月至2019年5月Sentinel-1A SAR IW 模式下Level-1 級別的SLC 產(chǎn)品共17 景,極化方式為VV 和VH。Sentinel-1A SAR 遙感數(shù)據(jù)采用歐空局提供的SNAP軟件對其進行輻射定標、去噪處理、圖像拼接以及地理編碼等處理,得出雷達影像圖。圖2 為經(jīng)過預處理得到VV 和VH 極化后向散射系數(shù),并采用Arcgis 軟件對后向散射系數(shù)進行了色彩上的調整。
圖2 研究區(qū) VH/VV 極化的后向散射系數(shù)(2019年5月3日)
1.2.2 Sentinel-2及預處理
Sentinel-2 是一組高分辨率多光譜成像衛(wèi)星,由Sentinel-2A 和Sentinel-2B 兩顆衛(wèi)星組成。衛(wèi)星攜帶高分辨率多光譜成像裝置(Multi Spectral Imager,MSI),擁有從可見光到短波紅外的13 個光譜波段,其中,有4 個波段(Band2,Band3,Band4,Band8)的空間分辨率達到10 m。在多光譜遙感衛(wèi)星中,Sentinel-2 是唯一在紅邊范圍攜帶有3 個波段(Band5,Band6,Band7)的多光譜衛(wèi)星,其獨特的“紅邊”波段為區(qū)域植被生態(tài)環(huán)境特征信息的提取分析提供了全新的解決方案[19,20]。
與Sentinel-1 數(shù)據(jù)下載地址相同,本研究從哥白尼開放訪問中心下載了2018年10月-2019年5月的Sentinel-2 影像,取與雷達Sentinel-1 基本同步,且無云或少云干擾的Sentinel-2數(shù)據(jù)產(chǎn)品。Sentinel-2 MSI 產(chǎn)品級別分為Level-0、Level-1A/B/C 和Level-2。本研究使用的Sentinel-2 數(shù)據(jù)產(chǎn)品有兩種級別,分別為Level-1C級和Level-2級數(shù)據(jù)。Level-1級數(shù)據(jù)需要進行輻射定標和大氣校正;Level-2 級數(shù)據(jù)無需此過程,直接對數(shù)據(jù)進行重采樣并轉換格式即可。本研究采用SNAP 軟件對Level-1C 級產(chǎn)品先進行輻射定標和大氣校正,然后將處理過的Level-1C級產(chǎn)品與Level-2級產(chǎn)品數(shù)據(jù)重采樣至10 m的分辨率,并裁剪出研究區(qū)域。圖3 為經(jīng)預處理后的Sentinel-2 影像圖。
圖3 Sentinel-2影像合成結果(8,4,3波段合成)
本研究基于全連接深度神經(jīng)網(wǎng)絡(Fully Connected Neural Network,F(xiàn)CNN)對研究區(qū)麥田土壤墑情進行反演研究。深度學習網(wǎng)絡的輸入特征變量為提取的Sentinel-1 SAR 數(shù)據(jù)的VV和VH 極化雷達后向散射系數(shù)和根據(jù)Sentinel-2 數(shù)據(jù)計算植被參量(植被含水量和植被覆蓋度)。在試驗過程中,首先把輸入樣本進行分組,即訓練樣本和檢驗樣本;然后對輸入?yún)?shù)進行歸一化預處理,并預設和格網(wǎng)搜索深度學習神經(jīng)網(wǎng)絡隱含層的層數(shù)(H),隱含層節(jié)點數(shù)(N)和隱含層迭代次數(shù)(E),以期獲得高精度和高性能結果。在隱含層中,通過數(shù)據(jù)標準化、防數(shù)據(jù)過擬合處理以及優(yōu)化神經(jīng)網(wǎng)絡權重和偏置,最后采用決定系數(shù)(Coefficient of Determination,R2)和均方誤差(Mean Squared Error,MSE)評估,使得代價函數(shù)收斂到最小。
Li[21]利用Sentinel-2 數(shù)據(jù),分別計算歸一化植被指數(shù)[22](NDVI)、兩種歸一化水分指數(shù)[23](Normalized Difference Water Index,NDWI),即NDWI1610、NDWI2190和歸一化紅邊指數(shù)[24](Normalized Difference Red Index,NDRI),并采用歸一化方法對多植被指數(shù)進行耦合,得到植被含水量公式,即:
式中:mveg為植被含水量,x1,x2,x3和x4分別為NDVI,NDWI1610,NDWI2190和NDRI。
植被覆蓋度(Vegetation Fraction,VF)是一階離散植被模型的重要參數(shù)之一?;旌舷裨纸饽P蚚25]是計算植被覆蓋度常用的方法,該方法假設遙感影像的每個像元包含植被和土壤兩部分,即每個像元都包含植被覆蓋區(qū)域和裸土區(qū)域。通常采用歸一化植被指數(shù)NDVI表示像元內這兩個區(qū)域的信息[26],即:
式中:NDVI為像元的歸一化植被指數(shù)值;NDVIveg為完全植被像元的植被指數(shù)值;NDVIsoil為完全土壤像元的植被指數(shù)值。
則植被覆蓋度的計算公式為:
式中:NDVI是從Sentinel-2 影像中提取并預處理得到的值;NDVIsoil理論上接近于0;NDVIveg理論上接近于1。本文以0.95和0.05 置信度截取NDVI的上下閾值來分別表示NDVIveg和NDVIsoil。
全連接深度神經(jīng)網(wǎng)絡(FCNN)是一種典型的前饋深度學習網(wǎng)絡,含有一個輸入層,若干個非線性隱含層以及一個輸出層。在全連接神經(jīng)網(wǎng)絡中,每相鄰兩層之間的節(jié)點都有邊相連,因此會將每一層的全連接層中的節(jié)點組織成一列,這樣方便顯示連接結構。輸入層由d個神經(jīng)元組成,用于輸入樣本的各個特征值;每層隱含層包含不同的隱藏神經(jīng)元,且每個隱含層的神經(jīng)元個數(shù)n也是不確定的;輸出層由l個神經(jīng)元組成,即需要分類的類別數(shù)。
對于多層的深度神經(jīng)網(wǎng)絡,神經(jīng)網(wǎng)絡從輸入層開始,上一層的輸出作為下一層的輸入,直到輸出最終的結果。即下一層的每個節(jié)點在進行計算的時候,激活函數(shù)的輸入是上一層所有節(jié)點的加權,不同的層激活函數(shù)可以不一樣,采用g[i](Z[i])表示第i層的激活函數(shù)。
在前向傳播中,前一層的輸出作為后一層的輸入,一層一層的計算直至輸出A[L],如圖4所示。
圖4 全連接深度神經(jīng)網(wǎng)絡前向傳播示意圖
在本研究中,深度學習隱含層訓練過程采用效率更高的ReLU 函數(shù),而輸出層選擇sigmoid 激活函數(shù)將輸出值控制在(0,1)范圍內,并使用均方誤差MSE表示損失函數(shù),即損失函數(shù)可表示為:
式中:L(i)為第i個訓練樣本的損失值;y(i)為第i個訓練樣本計算預測的輸出變量值;為樣本的觀測值。
FCNN 的反向傳播與BP 神經(jīng)網(wǎng)絡類似,在每次迭代優(yōu)化過程中,根據(jù)每層的殘差動態(tài)計算每層參數(shù)的梯度,直至模型收斂。
將VV 和VH 極化后向散射系數(shù),植被覆蓋度和植被含水量作為輸入自變量,實測土壤墑情作為輸入因變量構建深度學習神經(jīng)網(wǎng)絡,即深度學習神經(jīng)網(wǎng)絡的輸入變量設置為:
輸出變量為:
由于各參數(shù)之間量綱不同,因此在建立深度學習回歸模型之前,需要對輸入數(shù)據(jù)進行歸一化預處理,使得所有變量的數(shù)值范圍都比較均勻的分布在(0,1)區(qū)間內。
研究表明[27],深度學習的隱含層越多,其預測結果的精度也會越高,但是隱含層越多網(wǎng)絡越復雜,網(wǎng)絡的訓練時間增加,導致模型訓練效率降低,而且還會出現(xiàn)過擬合的情況。此外,隱含層中的神經(jīng)元個數(shù)和練訓樣本的迭代次數(shù)的選擇也影響到神經(jīng)網(wǎng)絡的預測精度。為構建模型的最優(yōu)參數(shù),本研究設置隱含層層數(shù)(H)為3 到8,神經(jīng)元個數(shù)(N)為20到100;隱含層層數(shù)增長為1,神經(jīng)元個數(shù)增長步長為20,迭代次數(shù)(E)增長步長為1,采用格網(wǎng)搜索算法使隱含層結構(H,N,E) 的決定系數(shù)(R2) 穩(wěn)定趨向最大,均方誤差(MSE)穩(wěn)定趨向最小,見圖5。
圖5 經(jīng)過多次迭代的收斂誤差
由于深度神經(jīng)網(wǎng)絡每一層輸入數(shù)據(jù)的分布一直在發(fā)生變化,當輸入特征值的范圍差異較大時,與權重進行矩陣相乘后,會產(chǎn)生一些偏離較大的差異值,這些差異值產(chǎn)生的微小變化都會影響到下一層,而且偏離越大表現(xiàn)越明顯,還會因此導致梯度發(fā)散[28]。為了降低特征值的范圍差異變化帶來的不確定性,采用Batch-Normalization(BN),通過計算每個minibatch的均值和方差,并將其拉回到均值為0方差為1的標準正態(tài)分布,可以有效改善模型的穩(wěn)定性和收斂速度。
BN 過程為:在隱含層的輸入先做標準化預處理,然后向整體數(shù)據(jù)的均值方差方向轉換,即:
(1)標準化:
式中:k為通道數(shù)。
(2)轉換式:
式中:?是為了防止方差為0 導致數(shù)值計算的不穩(wěn)定而添加的一個小數(shù)。
在深度學習網(wǎng)絡的訓練過程中,通過Dropout 忽略一部分的特征檢測器,使一部分的隱含層節(jié)點值為0,可以明顯減少過擬合現(xiàn)象[29]。使用Dropout 之后,深度學習網(wǎng)絡的訓練過程如下:
(1)隨機刪掉網(wǎng)絡中部分的隱藏神經(jīng)元,輸入輸出神經(jīng)元保持不變。
(2)把輸入x通過修改后的網(wǎng)絡前向傳播,然后把得到的損失結果通過修改的網(wǎng)絡反向傳播。一小批訓練樣本執(zhí)行完這個過程后,沒有被刪除的神經(jīng)元按照優(yōu)化算法更新對應的參數(shù)(W,b)。
(3)繼續(xù)重復這一過程。
本研究隱含層的Dropout 常數(shù)設置為0.3,即隱含層有30%的節(jié)點隨機失活。
通過實驗發(fā)現(xiàn),將隱含層最后兩層的BN 層改為dropout層,可以進一步提高模型的泛化性能。因此,在本研究中,隱含層的n-2層之前采用BN層,最后兩層采用dropout層。
本章采用Adam(Adaptive Moment Estimation)算法調整權重w和偏置b,使代價函數(shù)收斂到最小。Adam 算法[30]利用梯度的一階矩估計和二階矩估計動態(tài)調整每個參數(shù)的學習率,還有自己的動量,這樣在訓練的過程中,對于每個參數(shù)都更加具有獨立性,能夠提升了模型訓練速度和訓練的穩(wěn)定性。
為了驗證研究區(qū)土壤墑情反演方法并評價其精度,本研究在研究區(qū)布設了28個試驗點[見圖1(c)],在小麥全生育期(2018年10月-2019年5月)期間,Sentinel-1衛(wèi)星過境同期對研究區(qū)的地表及植被參數(shù)進行觀測和取樣。土壤含水量采用環(huán)刀法對每個實測點0~10 cm 的土樣進行取土,取得的土樣及部分作物樣本帶回實驗室,用烘干稱重法獲得土壤重量含水量和植被含水量數(shù)據(jù)。土壤重量含水量通過計算換算成體積含水量。共計576 組樣本數(shù)據(jù),去除異常數(shù)據(jù),選取561 個有效數(shù)據(jù)用于構建和檢驗深度學習神經(jīng)網(wǎng)絡模型。通過隨機樣本抽取法,選擇其中505組樣本數(shù)據(jù)作為訓練樣本,余下的56組樣本數(shù)據(jù)作為深度學習神經(jīng)網(wǎng)絡模型檢驗。經(jīng)過全連接深度神經(jīng)網(wǎng)絡的訓練,部分結果如表1所示。
表1 訓練參數(shù)與反演結果
從表1 可以看出,當模型隱含層為6,隱含層節(jié)點數(shù)為80,迭代次數(shù)為450時,模型訓練效果最佳。當繼續(xù)增加隱含層節(jié)點數(shù),R2和MSE基本不變,當繼續(xù)增加隱含層數(shù),R2降低,MSE增加。即當隱含層大于6時,訓練結果與實測土壤墑情相關性反而降低,即構建的6層隱含層已經(jīng)達到本研究深度神經(jīng)網(wǎng)絡上限。
采用余下的56 組樣本數(shù)據(jù)進行模型檢驗,根據(jù)深度神經(jīng)網(wǎng)絡模型的訓練結果,本文僅取其中(5,100,500),(6,60,450),(6,80,450)和(7,100,500)4 組模型的測試結果與實測數(shù)據(jù)驗證和分析。如圖6所示。
當隱含層為5,節(jié)點數(shù)為100,迭代次數(shù)為500 次時[圖6(a)],深度學習模型反演的土壤墑情與實測土壤墑情的相關關系較好,R2達到0.847 4,MSE為0.001 9。當隱含層為6,迭代次數(shù)為450,節(jié)點數(shù)分別為60 和80 時[圖6(b)和6(c)],兩組模型都表現(xiàn)出良好的相關性和精度,即R2分別為0.908 1 和0.925 2,MSE分別為0.001 1 與0.000 8。反演的土壤墑情整體與實測值在1∶1 線附近。當隱含層為7,節(jié)點數(shù)為100,迭代次數(shù)達到500 次時[圖6(d)],深度學習模型反演結果與實測值的相關性減弱(R2=0.785 2),反演精度也大幅度降低(MSE=0.002 5),即網(wǎng)絡的泛化能力降低。說明隱含層為6 時,構建的深度神經(jīng)網(wǎng)絡效果最佳。
圖6 深度學習模型估算土壤墑情與實測土壤墑情對比散點圖
值得注意的是,當土壤墑情實測值大于0.35 cm3/cm3時,即土壤相對濕潤時,反演的土壤墑情多低于實測值。張鐘軍等[31]通過研究發(fā)現(xiàn),隨著土壤水分的增加,植被的散射和吸收特性也增強,雷達后向散射系數(shù)變化不能完全表達土壤的水分信息。因此,消除植被對雷達后向散射的影響是非常必要的[32]。
本研究將深度學習的方法應用于研究區(qū)麥田土壤墑情的反演研究。利用Sentinel-1 和Sentinel-2 數(shù)據(jù),結合地表實測數(shù)據(jù)構建基于全連接深度神經(jīng)網(wǎng)絡的監(jiān)督學習模型。在模型訓練過程中,通過控制隱含層個數(shù),神經(jīng)元數(shù)和迭代次數(shù)等基本參數(shù)對模型不斷調整,采用Adam 算法調整權重和偏置,實現(xiàn)模型的最優(yōu)設置。使用未參與模型訓練的實測土壤墑情值對模型精度進行評定,實驗結果表明深度學習的方法不僅能夠高效地反演土壤墑情,而且對地表參數(shù)的依賴性較低,適合大規(guī)模的土壤墑情反演。
由于本研究訓練數(shù)據(jù)的數(shù)量并不是很大,采用深度學習反演得到的土壤墑情結果與實測值的相關性較好,但是誤差結果還有待提高,后續(xù)的研究中將通過補充足夠的地面同步高精度訓練數(shù)據(jù),進一步提高模型的反演精度。