孫京祿 張貝爾 王淑文 陸貝貝
[關(guān)鍵詞]BP神經(jīng)網(wǎng)絡(luò);溝壑密度;空間插值;輔助變量;陜北黃土高原
[摘要]溝壑密度是反映地表破碎度的重要因子,也是進(jìn)行水土保持綜合調(diào)查、制定流域綜合治理規(guī)劃的重要指標(biāo)依據(jù)。因缺乏高精度的大尺度DEM數(shù)據(jù),故選擇合適的插值方法實(shí)現(xiàn)溝壑密度在區(qū)域尺度上的空間插值是迫切需要解決的科學(xué)問題。BP神經(jīng)網(wǎng)絡(luò)插值在區(qū)域尺度地理要素空間變異研究中,特別是小樣本情況下,具有更高的精度?;陉儽秉S土高原80個(gè)試驗(yàn)樣區(qū)5 m分辨率DEM和將30 m分辨率DEM計(jì)算得到的研究區(qū)平均坡度作為輔助變量,利用BP神經(jīng)網(wǎng)絡(luò)插值方法進(jìn)行陜北黃土高原溝壑密度插值,并與不同插值方法結(jié)果進(jìn)行精度對比,結(jié)果表明:當(dāng)處理目標(biāo)變量與輔助變量之間存在相關(guān)關(guān)系卻不存在一個(gè)準(zhǔn)確關(guān)系式時(shí),BP神經(jīng)網(wǎng)絡(luò)插值具有優(yōu)越性,插值結(jié)果精度更高。此外,還對比了基于不同輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度,結(jié)果表明:對于樣本點(diǎn)稀疏、地形起伏較大的區(qū)域尺度空間插值,采用輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度明顯高于不采用輔助變量,且選取的輔助變量必須與目標(biāo)變量有較強(qiáng)的相關(guān)性,增加相關(guān)系數(shù)低的輔助變量反而會(huì)導(dǎo)致插值精度降低。
[中圖分類號(hào)] P208;S157[文獻(xiàn)標(biāo)識(shí)碼] A[文章編號(hào)] 1000-0941(2023)08-0024-04
溝壑密度是衡量黃土高原地區(qū)地貌發(fā)育階段、影響侵蝕產(chǎn)沙過程的重要地形參數(shù),也是進(jìn)行水土保持綜合調(diào)查、制定流域綜合治理規(guī)劃的重要指標(biāo)依據(jù)[1-2],因此準(zhǔn)確計(jì)算黃土高原地區(qū)溝壑密度具有重要現(xiàn)實(shí)意義。目前,溝壑密度的計(jì)算主要是基于數(shù)字高程模型(DEM)提取溝谷網(wǎng)絡(luò),然后統(tǒng)計(jì)研究區(qū)溝谷網(wǎng)絡(luò)總長度,研究區(qū)溝谷網(wǎng)絡(luò)總長度與研究區(qū)面積的比值即為溝壑密度[3]。然而,DEM分辨率對溝壑密度計(jì)算結(jié)果的準(zhǔn)確性有很大的影響,只有采用高分辨率DEM數(shù)據(jù)才可以得到比較準(zhǔn)確的溝壑密度結(jié)果[4-5]。由于缺乏符合要求的大尺度數(shù)據(jù),目前難以實(shí)現(xiàn)基于高分辨率DEM的黃土高原地區(qū)溝壑密度計(jì)算,因此在計(jì)算樣區(qū)溝壑密度的基礎(chǔ)上,選擇合適的插值方法實(shí)現(xiàn)溝壑密度在區(qū)域尺度上的空間插值是迫切需要解決的科學(xué)問題。
目前廣泛應(yīng)用的插值方法主要包括反距離加權(quán)插值、樣條函數(shù)插值、克里金插值等方法,這些方法有各自的優(yōu)缺點(diǎn)和適用條件,在樣本數(shù)目有限、插值區(qū)域較大時(shí),插值結(jié)果的精度難以保證[6]。以克里金插值法為基礎(chǔ),利用輔助變量衍生出的插值方法包括局部平均的簡單克里金法、具有外部漂移的克里金法、協(xié)同克里金法、回歸克里金法等[7-8],這些方法可以有效地提高估值精度,被廣泛應(yīng)用于中小尺度地理要素的空間估值中。但是,除協(xié)同克里金法外,這些插值方法的應(yīng)用前提是待估值變量與輔助變量之間存在一個(gè)明確的關(guān)系。
然而,大多數(shù)情況下二者之間存在較強(qiáng)的相關(guān)關(guān)系,卻不存在一個(gè)準(zhǔn)確的關(guān)系式[9-10]。人工神經(jīng)網(wǎng)絡(luò)作為一種用計(jì)算機(jī)模擬生物機(jī)制的方法,無須事先確定輸入、輸出量之間映射關(guān)系的數(shù)學(xué)方程,僅通過自身的訓(xùn)練,學(xué)習(xí)某種規(guī)則,在給定輸入值時(shí)可得到最接近期望輸出值的結(jié)果,其分析原理使得這種方法對解決機(jī)理尚不明確的問題十分有效[11]。其中BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)屬于多層前饋神經(jīng)網(wǎng)絡(luò),具有高度的非線性映射能力[12-13],許多研究表明在大尺度地理要素空間變異研究中,特別是在小樣本情況下,BP神經(jīng)網(wǎng)絡(luò)插值方法具有更高的精度[14]。因此,本研究以陜北黃土高原為例,采用BP神經(jīng)網(wǎng)絡(luò)方法進(jìn)行溝壑密度插值,并與其他插值方法進(jìn)行對比,分析BP神經(jīng)網(wǎng)絡(luò)插值結(jié)果精度,以期為獲取區(qū)域尺度溝壑密度結(jié)果提供借鑒和參考。
1研究區(qū)概況
陜北黃土高原是黃土高原的核心地區(qū)之一,主要包括陜西省榆林市和延安市。該區(qū)以黃土地貌為主,黃土塬、梁、峁及溝壑等地貌發(fā)育十分典型,基本涵蓋了黃土高原大部分的地貌組合及景觀形態(tài)。其中,北部主要為沙丘、草灘等風(fēng)沙地貌;中部主要為黃土梁、峁、丘陵、溝壑等地貌,并分布有石質(zhì)山嶺;西部為低山丘陵地貌;南部主要為黃土殘塬、黃土臺(tái)塬等地貌。屬溫帶半干旱和暖溫帶半干旱氣候區(qū),降水主要集中在夏季和秋季,易形成暴雨徑流侵蝕地面,造成嚴(yán)重水土流失。
2研究方法
2.1數(shù)據(jù)處理
在研究區(qū)選擇涵蓋不同地貌類型、均勻分布的80個(gè)試驗(yàn)樣區(qū)(見圖1),采用每個(gè)樣區(qū)5 m分辨率DEM計(jì)算溝壑密度,作為BP神經(jīng)網(wǎng)絡(luò)插值的基礎(chǔ)數(shù)據(jù),5 m分辨率DEM數(shù)據(jù)來源于陜西省測繪局;此外采用覆蓋研究區(qū)的30 m分辨率DEM計(jì)算研究區(qū)平均坡度,作為BP神經(jīng)網(wǎng)絡(luò)插值的輔助變量,30 m分辨率DEM數(shù)據(jù)來源于地理空間數(shù)據(jù)云網(wǎng)站(https://www.gscloud.cn/)。
2.2BP神經(jīng)網(wǎng)絡(luò)插值
2.2.1插值過程
BP神經(jīng)網(wǎng)絡(luò)包括輸入層、隱藏層、輸出層3層,理論上3層BP網(wǎng)絡(luò)可以逼近任何有理函數(shù)[15]。BP神經(jīng)網(wǎng)絡(luò)算法包括信號(hào)的正向傳播和誤差的反向傳播兩個(gè)過程,其中在正向傳播過程中,BP神經(jīng)網(wǎng)絡(luò)通過隱藏層神經(jīng)元對數(shù)據(jù)進(jìn)行處理,并輸出相應(yīng)結(jié)果;在反向傳播過程中,BP神經(jīng)網(wǎng)絡(luò)通過對比真實(shí)結(jié)果與預(yù)測結(jié)果之間的誤差來不斷調(diào)整各層神經(jīng)元的參數(shù)值,從而減小誤差,達(dá)到理想效果。本研究將80個(gè)試驗(yàn)樣區(qū)分為72個(gè)訓(xùn)練樣本和8個(gè)檢驗(yàn)樣本,通過Matlab軟件中神經(jīng)網(wǎng)絡(luò)工具箱完成BP神經(jīng)網(wǎng)絡(luò)插值計(jì)算,主要過程包括:數(shù)據(jù)導(dǎo)入→隨機(jī)產(chǎn)生訓(xùn)練集和測試集→創(chuàng)建BP神經(jīng)網(wǎng)絡(luò)→設(shè)置訓(xùn)練參數(shù)→訓(xùn)練網(wǎng)絡(luò)→仿真測試→數(shù)據(jù)反歸一化→性能評價(jià)。
2.2.2插值方法對比
為了對比分析BP神經(jīng)網(wǎng)絡(luò)插值的精度,通過ArcGIS軟件分別采用樣條函數(shù)、反距離加權(quán)、協(xié)同克里金、回歸克里金等方法進(jìn)行插值,其中協(xié)同克里金法的協(xié)同變量為研究區(qū)平均坡度,回歸克里金法的回歸模型采用試驗(yàn)樣區(qū)溝壑密度和平均坡度的線性擬合公式(見圖2)。此外,為了對比分析基于不同輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度,設(shè)置了研究模型和3個(gè)對比模型:①研究模型指輔助變量為研究區(qū)平均坡度;②對比模型Ⅰ指不采用輔助變量;③對比模型Ⅱ指輔助變量為3個(gè)鄰近點(diǎn)坐標(biāo)值;④對比模型Ⅲ指輔助變量為3個(gè)鄰近點(diǎn)坐標(biāo)值和研究區(qū)平均坡度。
插值結(jié)果的精度分析采用平均絕對誤差和均方根誤差2個(gè)誤差評價(jià)指標(biāo),其中平均絕對誤差反映了估值的誤差范圍,均方根誤差反映了估值的靈敏度和極值情況,平均絕對誤差和均方根誤差越小代表插值結(jié)果精度越高,計(jì)算公式分別為
式中:VMAE和VRMSE分別為平均絕對誤差值和均方根誤差值;n為檢驗(yàn)樣本數(shù)量,本研究中n=8;Pi和Ai分別為檢驗(yàn)樣本中的溝壑密度的插值結(jié)果和實(shí)際計(jì)算值。
3結(jié)果與分析
表1是不同插值方法的誤差評價(jià)結(jié)果,插值結(jié)果精度從高到低依次是:BP神經(jīng)網(wǎng)絡(luò)插值法、回歸克里金法、協(xié)同克里金法、反距離加權(quán)插值法、樣條函數(shù)插值法。有研究表明,對于小區(qū)域的地理要素估值,如目標(biāo)變量與輔助變量的相關(guān)系數(shù)在0.5以上,則采用協(xié)同克里金法插值時(shí)可以提高估值精度;如目標(biāo)變量與輔助變量的相關(guān)系數(shù)在0.7以上,則采用基于目標(biāo)變量與輔助變量的回歸模型的回歸克里金法插值時(shí)可以提高估值精度[16-17]。由表1可知,
回歸克里金法和協(xié)同克里金法的插值精度高于反距離加權(quán)插值法和樣條函數(shù)插值法,表明對于大區(qū)域的地理要素估值,回歸克里金法和協(xié)同克里金法在一定程度上可以提高插值精度。以區(qū)域平均坡度作為輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度高于回歸克里金法和協(xié)同克里金法,這是由于盡管平均坡度和溝壑密度之間存在相關(guān)關(guān)系,但是由圖2可知,樣區(qū)平均坡度和溝壑密度的線性擬合決定系數(shù)為0.499,數(shù)據(jù)點(diǎn)的分布相較于擬合直線較為分散,二者之間的回歸關(guān)系不夠顯著。因此,當(dāng)處理目標(biāo)變量與輔助變量之間存在相關(guān)關(guān)系,卻不存在一個(gè)準(zhǔn)確關(guān)系式時(shí),BP神經(jīng)網(wǎng)絡(luò)插值具有優(yōu)越性。
此外,本研究還對比了基于不同輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度,結(jié)果表明插值精度從高到低依次是:研究模型、對比模型Ⅲ、對比模型Ⅱ、對比模型Ⅰ(見表2)。不采用輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度最低,在采用3個(gè)鄰近點(diǎn)坐標(biāo)值作為輔助變量后,插值精度有一定程度的提升;在采用3個(gè)鄰近點(diǎn)坐標(biāo)值和研究區(qū)平均坡度作為輔助變量后,插值精度進(jìn)一步提升。然而,BP神經(jīng)網(wǎng)絡(luò)插值精度最高的是采用研究區(qū)平均坡度作為輔助變量,表明增加輔助變量并不能使插值精度保持增加。通過計(jì)算,得到試驗(yàn)樣本溝壑密度與平均坡度、第一鄰近點(diǎn)溝壑密度、第二鄰近點(diǎn)溝壑密度、第三鄰近點(diǎn)溝壑密度的相關(guān)系數(shù)分別為0.707、0.552、0.540、0.415(顯著性水平均為0.01)??梢钥闯?,對于樣本點(diǎn)稀疏、地形起伏較大的區(qū)域尺度空間插值,采用輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度明顯高于不采用輔助變量,然而選取的輔助變量必須與目標(biāo)變量有較強(qiáng)的相關(guān)性,由于試驗(yàn)樣區(qū)溝壑密度與鄰近點(diǎn)溝壑密度的相關(guān)系數(shù)并不高,因此當(dāng)已選擇研究區(qū)平均坡度作為輔助變量時(shí),再增加3個(gè)鄰近點(diǎn)坐標(biāo)值作為輔助變量(對比模型Ⅲ),其插值精度相比于研究模型反而下降,表明提升BP神經(jīng)網(wǎng)絡(luò)插值精度需要增加相關(guān)系數(shù)高的輔助變量,若增加相關(guān)系數(shù)低的輔助變量往往會(huì)造成多重共線性,導(dǎo)致插值精度降低[18]。
基于BP神經(jīng)網(wǎng)絡(luò)的陜北黃土高原溝壑密度插值結(jié)果見圖3,陜北黃土高原溝壑密度在空間分布上總體呈現(xiàn)中部和東北部高、西北部和南部低的特點(diǎn)。北部地區(qū)地勢相對平坦,溝壑密度較??;中部地區(qū)溝壑縱橫,溝壑密度相對較大,這也是陜北黃土高原水土流失最嚴(yán)重的地區(qū);南部地區(qū)主要是較平坦的塬面,侵蝕發(fā)育處于幼年期,溝壑密度相對較小。
4結(jié)論
溝壑密度是反映地表破碎度的重要因子,在土壤侵蝕、地貌演變等研究中具有重要作用,因此對于黃土高原等土壤侵蝕嚴(yán)重地區(qū),精準(zhǔn)估算區(qū)域尺度溝壑密度具有重要意義。BP神經(jīng)網(wǎng)絡(luò)插值在大尺度地理要素空間變異研究中,特別是在小樣本情況下,具有更高的精度。本研究基于陜北黃土高原80個(gè)試驗(yàn)樣區(qū)5 m分辨率DEM和將30 m分辨率DEM計(jì)算得到的研究區(qū)平均坡度作為輔助變量,利用BP神經(jīng)網(wǎng)絡(luò)插值方法進(jìn)行陜北黃土高原溝壑密度插值,并與樣條函數(shù)插值法、反距離加權(quán)插值法、協(xié)同克里金法、回歸克里金法的溝壑密度插值結(jié)果進(jìn)行對比,結(jié)果表明:插值結(jié)果精度從高到低依次是:BP神經(jīng)網(wǎng)絡(luò)插值法、回歸克里金法、協(xié)同克里金法、反距離加權(quán)插值法、樣條函數(shù)插值法。當(dāng)處理目標(biāo)變量與輔助變量之間存在相關(guān)關(guān)系,卻不存在一個(gè)準(zhǔn)確關(guān)系式時(shí),BP神經(jīng)網(wǎng)絡(luò)插值具有優(yōu)越性。此外,本研究還對比了基于不同輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度,結(jié)果表明對于樣本點(diǎn)稀疏、地形起伏較大的區(qū)域尺度空間插值,采用輔助變量的BP神經(jīng)網(wǎng)絡(luò)插值精度明顯高于不采用輔助變量,然而選取的輔助變量必須與目標(biāo)變量有較強(qiáng)的相關(guān)性,若增加相關(guān)系數(shù)低的輔助變量反而會(huì)導(dǎo)致插值精度降低。
[參考文獻(xiàn)]
[1] 趙文武,傅伯杰,陳利頂.陜北黃土丘陵溝壑區(qū)地形因子與水土流失的相關(guān)性分析[J].水土保持學(xué)報(bào),2003,17(3):66-69.
[2] 盧金發(fā).黃河中游流域地貌形態(tài)對流域產(chǎn)沙量的影響[J].地理研究,2002,21(2):171-178.
[3] 田劍,湯國安,周毅,等.黃土高原溝谷密度空間分異特征研究[J].地理科學(xué),2013,33(5):622-628.
[4] 李俊,湯國安,張婷,等.利用DEM提取陜北黃土高原溝谷網(wǎng)絡(luò)的匯流閾值研究[J].水土保持通報(bào),2007,27(2):75-78.
[5] 沈晶玉,史明昌,田玉柱,等.DEM網(wǎng)格尺寸與溝谷提取精度研究[J].中國水土保持,2007(2):56-60.
[6] 朱會(huì)義,劉述林,賈紹鳳.自然地理要素空間插值的幾個(gè)問題[J].地理研究,2004,23(4):425-432.
[7] 劉志華,常禹,賀紅士,等.基于輔助變量的森林半腐層厚度空間插值精度[J].應(yīng)用生態(tài)學(xué)報(bào),2009,20(1):77-83.
[8] 魯程鵬,束龍倉,張穎,等.稀疏數(shù)據(jù)插值問題的回歸克里格方法[J].水電能源科學(xué),2009,27(1):81-84.
[9] 姜勇,梁文舉,李琪.利用與回歸模型相結(jié)合的克里格方法對農(nóng)田土壤有機(jī)碳的估值及制圖[J].水土保持學(xué)報(bào),2005,19(5):97-100,126.
[10] 鄧羽,劉盛和,姚峰峰,等.基于協(xié)同克里格的基準(zhǔn)地價(jià)評估及空間結(jié)構(gòu)分析[J].地理科學(xué)進(jìn)展,2009,28(3):403-408.
[11] 尤淑撐,嚴(yán)泰來.基于人工神經(jīng)網(wǎng)絡(luò)面插值的方法研究[J].測繪學(xué)報(bào),2000,29(1):30-34.
[12] 鹿應(yīng)榮,楊印生,劉洪霞.基于BP神經(jīng)網(wǎng)絡(luò)的非線性組合預(yù)測模型在糧食物流需求預(yù)測中的應(yīng)用[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2008,38(增刊2):61-64.
[13] 林宇鋒,鄧洪敏,史興宇.基于新的改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)在擬合非線性函數(shù)中的應(yīng)用[J].計(jì)算機(jī)科學(xué),2017,44(增刊2):51-54.
[14] 王漢濤,張瀟瀟.仿生算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)在降雨空間插值中的應(yīng)用[J].水資源與水工程學(xué)報(bào),2019,30(3):106-112.
[15] 趙明偉,湯國安,李發(fā)源,等.基于BP神經(jīng)網(wǎng)絡(luò)的陜北黃土高原侵蝕產(chǎn)沙影響因子顯著性研究[J].水土保持通報(bào),2012,32(1):5-9,226.
[16] 劉艷芳,宋玉玲,郭龍,等.結(jié)合高光譜信息的土壤有機(jī)碳密度地統(tǒng)計(jì)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2017,33(2):183-191.
[17] 張歡,高小紅.復(fù)雜地形區(qū)土壤有機(jī)質(zhì)空間變異性分析及制圖[J].水土保持研究,2020,27(5):93-100.
[18] 秦雯怡,陳果,李小臻,等.基于機(jī)器語言的岷江上游流域表層土壤氫氧穩(wěn)定同位素空間分布模擬[J].應(yīng)用生態(tài)學(xué)報(bào),2021,32(12):4327-4338.
收稿日期: 2023-06-30
基金項(xiàng)目: 國家自然資源和地理空間基礎(chǔ)信息庫安徽省試點(diǎn)項(xiàng)目
第一作者: 孫京祿(1986—),男,安徽淮南人,助理研究員,碩士,主要從事地理信息系統(tǒng)工作。
E-mail: Jinglusun@126.com
(責(zé)任編輯李佳星)