劉敏,周健,胡月明,張林,趙清林,秦雅靜,陳瑗瑗
(1.湖南省國(guó)土資源規(guī)劃院,長(zhǎng)沙 410114;2.國(guó)土資源評(píng)價(jià)與利用湖南省重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)沙 410114;3.海南大學(xué)熱帶作物學(xué)院,???570228)
目前,耕地“非糧化”現(xiàn)象日趨嚴(yán)重,導(dǎo)致我國(guó)糧食安全不斷受到威脅[1-3]。耕地“非糧化”是指原本用于糧食作物種植的耕地被用于非糧食種植的農(nóng)業(yè)生產(chǎn)行為[4]。耕地“非糧化”生產(chǎn)仍然處于農(nóng)業(yè)范疇內(nèi),對(duì)于未破壞耕種層種植經(jīng)濟(jì)作物的耕地而言,其耕地的宜耕性基本不受影響,一定程度內(nèi)是可逆的[5]。但某些“非糧化”類(lèi)型會(huì)對(duì)耕地生產(chǎn)條件造成一定破壞,如長(zhǎng)期撂荒耕地,或在耕地上種樹(shù)、挖塘、種植草皮苗木等將直接破壞耕種層,這類(lèi)“非糧化”耕地則需要采用一定恢復(fù)措施才能恢復(fù)成耕地,稱(chēng)為可恢復(fù)耕地。為貫徹落實(shí)最嚴(yán)格的耕地保護(hù)制度,嚴(yán)格遏制耕地“非糧化”“非農(nóng)化”,確保耕地?cái)?shù)量不減少、質(zhì)量不降低,各地陸續(xù)開(kāi)展耕地補(bǔ)充整治工作。由于可恢復(fù)耕地具有規(guī)模大、恢復(fù)措施相對(duì)簡(jiǎn)單等優(yōu)勢(shì),對(duì)可恢復(fù)耕地進(jìn)行整治恢復(fù)已成為全國(guó)各地補(bǔ)充耕地的主要途徑??苫謴?fù)耕地的分布與國(guó)土空間格局有著密切的關(guān)聯(lián),大部分由棄耕或耕地綠化造林組成,多分布于坡度較陡、土層厚度有限、距離機(jī)耕路較遠(yuǎn)、遠(yuǎn)離居民點(diǎn)且耕種條件較差的地區(qū)[6-8]。在實(shí)施耕地恢復(fù)整治過(guò)程中,為降低耕地恢復(fù)難度、避免恢復(fù)后再次拋荒,亟需對(duì)可恢復(fù)耕地開(kāi)展宜耕性研究。
耕地的宜耕性評(píng)價(jià)研究方法較為普遍,而可恢復(fù)耕地的宜耕性評(píng)價(jià)研究鮮見(jiàn)報(bào)道。耕地的宜耕性評(píng)價(jià)常見(jiàn)的方法包括特爾菲法、層次分析法、極限條件法和綜合指數(shù)法等[9-11],這些方法的評(píng)價(jià)因子權(quán)重受人為因素影響較大,且評(píng)價(jià)因子不適合廣泛應(yīng)用??臻g兩維圖論聚類(lèi)方法[12]有效解決了涉及位置關(guān)系的聚類(lèi)問(wèn)題,但是對(duì)于非鄰接性地塊的宜耕性評(píng)價(jià)存在一定難度。決策灰色關(guān)聯(lián)度分析[13-14]可以實(shí)現(xiàn)各權(quán)重因子在空間上的疊加分析,但難以深入挖掘非線(xiàn)性影響因素?;陔S機(jī)前沿生產(chǎn)函數(shù)(SFA)[15]、數(shù)據(jù)包絡(luò)分析(DEA)[16]方法計(jì)算投入產(chǎn)出比的開(kāi)發(fā)時(shí)序模型從經(jīng)濟(jì)社會(huì)綜合效益角度分析了耕地后備資源的開(kāi)發(fā)時(shí)序[17-18],但不同地區(qū)的農(nóng)業(yè)投入、農(nóng)業(yè)科技水平、農(nóng)業(yè)機(jī)械化水平等開(kāi)發(fā)能力相關(guān)因素難以準(zhǔn)確獲取,評(píng)價(jià)結(jié)果可信度受限。
耕地的宜耕性評(píng)價(jià)是由自然條件、社會(huì)經(jīng)濟(jì)條件、工程條件以及區(qū)位條件等因素共同作用的巨大系統(tǒng),存在非線(xiàn)性、高維、數(shù)值缺失等難題。隨機(jī)森林算法作為一種非參數(shù)決策樹(shù)模型,在處理高維數(shù)據(jù)、非線(xiàn)性關(guān)系及權(quán)重動(dòng)態(tài)性方面具有明顯優(yōu)勢(shì)[19],不少學(xué)者應(yīng)用隨機(jī)森林算法開(kāi)展了耕地質(zhì)量評(píng)價(jià)[20-21]和區(qū)域性“非糧化”影響因素分析[22]。但是隨機(jī)森林算法在輸入數(shù)據(jù)變多時(shí),存在模型訓(xùn)練速度慢、泛化能力差的問(wèn)題;對(duì)于非標(biāo)準(zhǔn)化、缺失值和異常值的處理也存在困難。XGBoost 算法不需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,也無(wú)需對(duì)缺失值和異常值等進(jìn)行預(yù)處理,通過(guò)統(tǒng)計(jì)所有缺失值在當(dāng)前節(jié)點(diǎn)分布規(guī)律來(lái)決定缺失值的處理方式,對(duì)于可恢復(fù)耕地中部分地塊屬性缺失的情況,XGBoost算法仍能予以有效支持[23]。本研究擬通過(guò)對(duì)比現(xiàn)有耕種耕地與可恢復(fù)耕地之間的自然、區(qū)位及經(jīng)濟(jì)等條件差異,基于XGBoost 算法分析了各影響因素對(duì)耕地宜耕性評(píng)價(jià)的重要程度,在此基礎(chǔ)上對(duì)可恢復(fù)耕地進(jìn)行宜耕性評(píng)價(jià),以期為可恢復(fù)耕地資源的合理開(kāi)發(fā)利用,特別是為可恢復(fù)耕地優(yōu)先整治區(qū)域的確定提供科學(xué)依據(jù)。
湘陰縣屬于長(zhǎng)江經(jīng)濟(jì)帶、長(zhǎng)江中游城市群、洞庭湖生態(tài)經(jīng)濟(jì)區(qū)等國(guó)家和區(qū)域經(jīng)濟(jì)發(fā)展戰(zhàn)略的重要節(jié)點(diǎn)和支撐點(diǎn),同時(shí)也是湖南省重要的商品糧生產(chǎn)基地,地處湖南省東北部(112°30′20″~113°01′50″E,28°30′13″~29°03′02″N),瀕南洞庭湖,居湘、資兩水尾間。地貌以低山、崗地、平原為主,地勢(shì)總體呈現(xiàn)出東南高、西北低的特點(diǎn),最高處為青山庵,海拔552.4 m。從地貌特征來(lái)看,濱湖平原面積占比最大,呈塊狀分布。山崗地區(qū)水系發(fā)育不良,北部平原、湖州地區(qū)河湖交匯,主要河流包括湘江、資江和白水江等,湖泊包括鶴龍湖、洋沙湖、橫嶺湖等。湘陰縣位于中亞熱帶向北亞熱帶過(guò)渡的季風(fēng)氣候區(qū),四季分明,濕潤(rùn)多雨,具有春溫變幅大、初夏雨水多,伏秋天熱易旱、冬季嚴(yán)寒不多的特點(diǎn)。
近10 年來(lái)湘陰縣耕地凈流失量高達(dá)4 605.85 hm2,年均凈減少耕地460.6 hm2,年均減少幅度為0.91%,耕地流失較為嚴(yán)重。從人均耕地來(lái)看,全縣人均耕地面積僅0.059 hm2,遠(yuǎn)低于全國(guó)人均耕地面積0.09 hm2,略高于聯(lián)合國(guó)確定的人均耕地面積的警戒線(xiàn)(0.053 hm2),且人均耕地保有量存在進(jìn)一步減少的風(fēng)險(xiǎn),耕地保護(hù)任務(wù)艱巨。近10 年來(lái),湘陰縣耕地“非糧化”生產(chǎn)活動(dòng)普遍,耕地“非糧化”率達(dá)13.35%,“非糧化”耕地中可恢復(fù)耕地面積達(dá)4 577.36 hm2,占“非糧化”耕地面積的68.03%,是最主要的耕地流失類(lèi)型。全縣可恢復(fù)耕地主要分布于東部的丘陵山區(qū),其中金龍鎮(zhèn)、六塘鄉(xiāng)、石塘鎮(zhèn)以及洋沙湖鎮(zhèn)可恢復(fù)耕地占比最高。從可恢復(fù)耕地流入來(lái)源來(lái)看,東部丘陵山區(qū)主要流入源為林地,且大部分林地需采取工程措施才能恢復(fù)成耕地,而中西部平原或環(huán)洞庭湖區(qū)主要流入源為林地、坑塘或者養(yǎng)殖坑塘等,如湘濱鎮(zhèn)、新泉鎮(zhèn)、鶴龍湖鎮(zhèn)以及南湖州鎮(zhèn)等地區(qū)。未耕種的耕地分布規(guī)律與耕地流向?yàn)榱值氐囊?guī)律基本一致,即未耕的耕地主要分布于湘陰縣東部地勢(shì)較高、地形起伏較大的丘陵山區(qū)(圖1)。從湘陰縣可恢復(fù)耕地的空間分布、利用形式來(lái)看,不同地區(qū)可恢復(fù)耕地類(lèi)型不同,不同類(lèi)型的可恢復(fù)耕地形成過(guò)程中呈現(xiàn)出顯著的空間集聚效應(yīng)[24]。在湘陰縣東部丘陵山區(qū),局部形成了以果園、油茶等為特色產(chǎn)業(yè)協(xié)同發(fā)展的林果業(yè),但是更多的耕地由于種糧效益較低、農(nóng)業(yè)人口大量流失導(dǎo)致直接拋荒或轉(zhuǎn)為綠化造林等“非糧化”趨向。坑塘水產(chǎn)養(yǎng)殖也是湘陰縣耕地“非糧化”的重要傾向,主要發(fā)生在河流湖泊等水系發(fā)達(dá)的中西部平原地區(qū),這與全國(guó)其他地區(qū)的“非糧化”趨勢(shì)基本一致[3]。
本研究所使用的數(shù)據(jù)主要為湘陰縣第三次國(guó)土調(diào)查成果中的耕地利用現(xiàn)狀數(shù)據(jù)。耕地自然地理?xiàng)l件因素以及耕地土壤物理化學(xué)性狀因素等數(shù)據(jù),主要來(lái)源于湘陰縣2019 年耕地質(zhì)量等別數(shù)據(jù)成果。涉及的影響因素主要分為以下幾個(gè)方面[25-27]。①自然因素:指影響耕地種植的自然稟賦特征,包括海拔高程、坡度級(jí)別、自然等指數(shù)、有效土層厚度、土壤pH 值以及表層土壤質(zhì)地等因素;②區(qū)位因素:指影響耕地種植便利性的各類(lèi)因素,如路網(wǎng)密度、耕地與村鎮(zhèn)間距離、距路網(wǎng)距離(最小距離)等因素;③社會(huì)經(jīng)濟(jì)因素:指影響經(jīng)濟(jì)效益的不同的開(kāi)發(fā)利用模式及其影響因素,包括復(fù)種類(lèi)型、國(guó)家利用等指數(shù)、經(jīng)濟(jì)等指數(shù)等因素;④工程因素:指通過(guò)人為改造優(yōu)化開(kāi)發(fā)利用條件的影響因素,包括灌溉保證率、排水條件、地塊面積以及破碎度等因素(表1)。
表1 湘陰縣可恢復(fù)耕地宜耕性影響因素及其數(shù)據(jù)來(lái)源情況Table 1 Influencing factors and data sources of non-grain-oriented arable land in Xiangyin County
所選取的影響因素中,路網(wǎng)密度、與村鎮(zhèn)間距離、與路網(wǎng)距離、集塊面積、地塊破碎度、地塊形狀6 個(gè)因素主要是通過(guò)第三次國(guó)土調(diào)查數(shù)據(jù)、耕地質(zhì)量分等數(shù)據(jù)分析而來(lái)(圖2)。路網(wǎng)密度計(jì)算通過(guò)創(chuàng)建1 km×1 km 的漁網(wǎng)與第三次國(guó)土調(diào)查地類(lèi)圖斑中道路進(jìn)行疊加分析,得到每個(gè)網(wǎng)格中道路的占比,在計(jì)算路網(wǎng)密度時(shí),由于封閉運(yùn)行的鐵路、高速公路一般不服務(wù)于農(nóng)業(yè)生產(chǎn),在研究中未納入路網(wǎng)密度計(jì)算。與村鎮(zhèn)間距離是指與每個(gè)地塊距離最近的村鎮(zhèn)距離,由最近鄰分析[27-28]計(jì)算而來(lái)。集塊面積是指相鄰耕地地塊的連片總面積,由開(kāi)放的道路、溝渠等線(xiàn)狀地物所分割的耕地地塊視為連片。在計(jì)算耕地地塊與路網(wǎng)距離時(shí),由耕地地塊距離農(nóng)業(yè)機(jī)械通行道路(機(jī)耕道)的最小距離確定[29],選擇寬度3.5 m 以上的道路予以最近鄰分析。地塊破碎度是由單位面積的耕地中地塊的數(shù)量來(lái)表示。地塊形狀指標(biāo)反映耕地地塊形狀的復(fù)雜程度,由景觀(guān)生態(tài)學(xué)中分維數(shù)(FRAC)[30]計(jì)算地塊的規(guī)整度,其數(shù)值介于1.0~2.0 之間,數(shù)值越小則斑塊越規(guī)則,其計(jì)算方法如下:
圖2 湘陰縣可恢復(fù)耕地宜耕性影響因素Figure 2 Factors affecting non grain farmland in Xiangyin County
式中:p為斑塊周長(zhǎng),m;a為斑塊面積,m2。
1.3.1 XGBoost算法
XGBoost 算法在某種程度上是GBDT 算法的優(yōu)化,在本質(zhì)上是利用了Boosting 算法中擬合殘差的思想。XGBoost 算法又稱(chēng)為極限梯度提升算法,能夠準(zhǔn)確捕捉各種預(yù)測(cè)變量的非線(xiàn)性特征。作為GBDT 算法的高效實(shí)現(xiàn),XGBoost 算法具有四個(gè)方面的優(yōu)勢(shì)[31-32]:一是算法本身的優(yōu)化,除了本身的損失,還加上了正則化部分,有效防止過(guò)擬合,具有較強(qiáng)的泛化能力;二是損失函數(shù)對(duì)誤差部分做二階泰勒展開(kāi),更加準(zhǔn)確;三是通過(guò)引入并行運(yùn)算,提升運(yùn)行效率;四是無(wú)需對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)統(tǒng)計(jì)所有缺失值在當(dāng)前節(jié)點(diǎn)分布規(guī)律來(lái)決定缺失值的處理方式,特別是可恢復(fù)耕地資源中部分屬性缺失的地塊仍能有效支持。
XGBoost算法模型如下:
XGBoost模型的目標(biāo)函數(shù)式如下:
為了找到能夠最小化目標(biāo)函數(shù)的ft,XGBoost 利用其在ft=0 處的泰勒二階展開(kāi)近似值,將損失函數(shù)的泰勒級(jí)數(shù)推廣到二階。即目標(biāo)函數(shù)近似為:
對(duì)公式(4)進(jìn)一步表達(dá)為關(guān)于葉子節(jié)點(diǎn)j分?jǐn)?shù)ωj的一元二次函數(shù),求解所得的最優(yōu)ωj和目標(biāo)函數(shù)值分別如公式(5)和公式(6)所示:
在實(shí)際訓(xùn)練過(guò)程中,XGBoost 算法利用百分位法列舉最佳分割點(diǎn),若分裂后的目標(biāo)函數(shù)比分裂前增益,且超過(guò)設(shè)定閾值,即可分裂;當(dāng)葉子結(jié)點(diǎn)權(quán)重控制參數(shù)λ、最大深度γ超過(guò)設(shè)定閾值時(shí)停止分裂,防止過(guò)擬合[32]。
1.3.2 模型參數(shù)優(yōu)化
隨著模型結(jié)構(gòu)復(fù)雜化,模型的學(xué)習(xí)能力有所增強(qiáng),但是泛化性也在變?nèi)?,模型?huì)出現(xiàn)過(guò)擬合現(xiàn)象。為此通過(guò)簡(jiǎn)化參數(shù)搜索方法進(jìn)行參數(shù)優(yōu)化,即在維持其他參數(shù)不變的情況下,優(yōu)先優(yōu)化對(duì)XGBoost 模型性能影響較大的因素,采用網(wǎng)格搜索并結(jié)合五折交叉驗(yàn)證的方法優(yōu)選最優(yōu)參數(shù)。按照n_estimators、learning_rate、max_depth、subsample、min_child_weight、colsample_bytree 調(diào)參的順序進(jìn)行調(diào)整(圖3),最終得到模型最優(yōu)參數(shù)組合(表2)。
表2 XGBoost算法優(yōu)化后參數(shù)選取表Table 2 Parameter selection after optimization about XGBoost
1.3.3 共線(xiàn)性分析
對(duì)于上述影響因素之間可能存在的多重共線(xiàn)性問(wèn)題,采用常用皮爾遜相關(guān)系數(shù)分析去除多重共線(xiàn)性影響因素。在具體兩個(gè)顯著相關(guān)的影響因素之間的取舍上,皮爾遜相關(guān)性分析無(wú)法識(shí)別其中重要的解釋變量,因此在結(jié)合前述XGBoost 分析的影響因素權(quán)重大小的基礎(chǔ)上進(jìn)行影響因素的篩選,得到最終的影響因素集。
皮爾遜相關(guān)系數(shù)又稱(chēng)皮爾遜積矩相關(guān)系數(shù)、簡(jiǎn)單相關(guān)系數(shù),可解釋兩個(gè)定距變量間聯(lián)系的緊密程度,反映二者共線(xiàn)性特征[20,33]。對(duì)于容量為n的樣本,將n個(gè)原始數(shù)據(jù)轉(zhuǎn)換為等級(jí)數(shù)據(jù),相關(guān)系數(shù)為:
式中:相關(guān)系數(shù)rxy表示兩個(gè)變量x、y之間的線(xiàn)性相關(guān)程度,rxy的值介于-1~1 之間;xi表示第一個(gè)變量中第i條數(shù)據(jù)的值;yi表示第二個(gè)變量中第i條數(shù)據(jù)的值分別表示xi、yi的平均值。相關(guān)系數(shù)絕對(duì)值越大,相關(guān)性越強(qiáng);相關(guān)系數(shù)絕對(duì)值越接近0,相關(guān)性越弱,當(dāng)rxy=0時(shí),表示x和y不相關(guān)。
本研究以湘陰縣全縣53 395個(gè)耕地地塊(含耕種地塊和可恢復(fù)耕地地塊)為研究對(duì)象。由于耕地開(kāi)發(fā)成坑塘或養(yǎng)殖坑塘以及種植草皮苗木類(lèi)的耕地地塊與耕種地塊空間分布高度一致,多分布于交通便利、地勢(shì)相對(duì)較低、地形坡度較緩、灌溉條件較好、距離居民區(qū)較近的地區(qū),這類(lèi)地塊與其他類(lèi)型可恢復(fù)地塊的分布規(guī)律明顯存在差異,因此未納入評(píng)價(jià)模型構(gòu)建中,但不影響模型進(jìn)行宜耕性評(píng)價(jià)應(yīng)用。在XGBoost模型構(gòu)建上,以可恢復(fù)耕地(種植屬性為未耕、即可恢復(fù)、工程恢復(fù)等)和耕種(種植屬性為糧食作物、非糧食作物、糧與非糧輪作)為二分類(lèi)因變量進(jìn)行標(biāo)識(shí),選取36 項(xiàng)影響因素作為自變量。對(duì)全縣耕地地塊隨機(jī)抽取80%樣本訓(xùn)練,20%作為驗(yàn)證樣本對(duì)耕地耕種預(yù)測(cè)結(jié)果進(jìn)行5次交叉驗(yàn)證評(píng)價(jià)。
通過(guò)簡(jiǎn)化參數(shù)搜索方法得到優(yōu)化后的參數(shù)對(duì)湘陰縣耕地耕種情況與實(shí)際耕種情況進(jìn)行預(yù)測(cè)驗(yàn)證,結(jié)果表明模型預(yù)測(cè)的耕種情況與實(shí)際耕種情況的準(zhǔn)確率達(dá)到92.68%,具有良好的泛化能力和魯棒性,反映出模型良好的擬合度。XGBoost 模型預(yù)測(cè)輸出的影響因素權(quán)重P值,即公式(5)中葉子節(jié)點(diǎn)分?jǐn)?shù)ω值(表3)。其中:標(biāo)準(zhǔn)耕作制度、國(guó)家經(jīng)濟(jì)等指數(shù)這2 項(xiàng)影響因素的權(quán)重為0,主要原因是其指標(biāo)數(shù)據(jù)缺失嚴(yán)重且對(duì)耕地宜耕性影響有限,因此在模型優(yōu)化過(guò)程中去掉了這兩項(xiàng)影響因素;其余34 項(xiàng)影響因素的權(quán)重P值在0.50%~12.83%之間,其中海拔高程、坡度級(jí)別、地塊形狀、國(guó)家經(jīng)濟(jì)等的權(quán)重均高于5%,占總權(quán)重的31.08%,重要性較強(qiáng),其他影響因素均小于4%。
表3 XGBoost算法中可恢復(fù)耕地宜耕性的影響因素的權(quán)重P值分布Table 3 Weight P value of influencing factors of non-grain-oriented arable land in XGBoost
對(duì)于上述影響因素之間可能存在的多重共線(xiàn)性問(wèn)題,采用皮爾遜相關(guān)系數(shù)分析去除多重共線(xiàn)性影響因素。通過(guò)對(duì)表3 中的34 個(gè)影響因素進(jìn)行皮爾遜相關(guān)性分析,結(jié)果表明大部分影響因素間相關(guān)性不顯著,其中有13 個(gè)影響因素顯著相關(guān),復(fù)種類(lèi)型、自然等指數(shù)、自然等、經(jīng)濟(jì)等指數(shù)、經(jīng)濟(jì)等以及國(guó)家自然等指數(shù)之間兩兩高度相關(guān),其相關(guān)系數(shù)的絕對(duì)值高于0.8,如自然等指數(shù)和自然等之間的相關(guān)系數(shù)高達(dá)0.996(表4)。結(jié)果表明,在該研究區(qū)域,以上影響因素之間存在較強(qiáng)的相關(guān)性,會(huì)對(duì)評(píng)價(jià)結(jié)果造成多重共線(xiàn)性的問(wèn)題。在具體兩個(gè)顯著相關(guān)的影響因素的取舍上,皮爾遜相關(guān)性分析無(wú)法識(shí)別其中重要的影響因素,本研究結(jié)合指標(biāo)來(lái)源以及前述XGBoost分析的影響因素權(quán)重大小進(jìn)行了影響因素的篩選,初步得到影響因素集合。除上述指標(biāo)之外,耕地利用等、國(guó)家利用等指數(shù)、國(guó)家經(jīng)濟(jì)等這幾項(xiàng)指標(biāo)是其他基礎(chǔ)指標(biāo)逐級(jí)修正高度關(guān)聯(lián)的參數(shù),所以這幾項(xiàng)指標(biāo)未納入評(píng)價(jià)影響因素集。通過(guò)上述共線(xiàn)性分析和指標(biāo)關(guān)聯(lián)性分析,最終得到了由21項(xiàng)影響因素構(gòu)建的評(píng)價(jià)指標(biāo)體系。
表4 可恢復(fù)耕地宜耕性顯著相關(guān)影響因素的相關(guān)系數(shù)Table 4 Correlation coefficients of significantly correlated influencing factors
在上述21 項(xiàng)指標(biāo)的基礎(chǔ)上,重新隨機(jī)抽取80%樣本訓(xùn)練構(gòu)建XGBoost 模型,20%作為驗(yàn)證樣本對(duì)耕地耕種情況預(yù)測(cè)評(píng)價(jià),并對(duì)結(jié)果進(jìn)行5 次交叉驗(yàn)證,得到這21 項(xiàng)影響因素的權(quán)重P值(表5)。在預(yù)測(cè)結(jié)果上,該21 項(xiàng)影響因素的權(quán)重P值介于2.93%~13.62%之間,優(yōu)化后的影響因素的權(quán)重P值相對(duì)穩(wěn)定,預(yù)測(cè)的耕種情況與實(shí)際耕種情況準(zhǔn)確率高達(dá)91.87%,通過(guò)指標(biāo)簡(jiǎn)化優(yōu)化后,評(píng)價(jià)指標(biāo)顯著減少,但是準(zhǔn)確率保持穩(wěn)定。整體上來(lái)看,自然因素對(duì)耕地宜耕性的影響權(quán)重高達(dá)51.05%,區(qū)位因素和工程因素權(quán)重次之,社會(huì)經(jīng)濟(jì)因素的權(quán)重最小。在這些影響因素中海拔高程、坡度級(jí)別、地塊形狀以及集塊面積等影響因素權(quán)重進(jìn)一步增強(qiáng);從各影響因素來(lái)看,海拔高程是影響耕地是否耕種的最重要的影響因素,海拔越高耕地越難以耕種,同樣耕地坡度越陡越難以耕種。另外,地塊形狀、集塊面積的大小也是影響耕地耕種的重要因素,一般來(lái)說(shuō),地塊形狀越方正規(guī)整、越集中連片,耕地越適宜耕種。
表5 優(yōu)化后XGBoost算法中可恢復(fù)耕地宜耕性影響因素的權(quán)重P值Table 5 Weight P value of influencing factors of non-grain-oriented arable land in XGBoost after optimization
通過(guò)XGBoost 算法搭建的預(yù)測(cè)模型,結(jié)合優(yōu)化后XGBoost 算法輸出的影響因素權(quán)重P值,預(yù)測(cè)得到了湘陰縣可恢復(fù)耕地資源的宜耕潛力。宜耕潛力是指整治為耕地后能維持為耕地、不再拋荒的概率,即采用XGBoost 模型中對(duì)耕地資源分類(lèi)為耕種耕地和可恢復(fù)耕地二分類(lèi)的概率值。對(duì)應(yīng)XGBoost 的宜耕潛力超過(guò)50%時(shí),識(shí)別為可耕種地塊;宜耕潛力低于50%時(shí),則為難耕種地塊。
通過(guò)對(duì)比分析湘陰縣可恢復(fù)耕地中工程恢復(fù)、即可恢復(fù)以及未耕種耕地各自的宜耕潛力發(fā)現(xiàn),坑塘和養(yǎng)殖坑塘類(lèi)可恢復(fù)耕地(全部為即可恢復(fù))宜耕潛力最大,其可耕種地塊面積達(dá)1 455.59 hm2,占坑塘和養(yǎng)殖坑塘類(lèi)可恢復(fù)耕地面積的87.29%,坑塘和養(yǎng)殖坑塘類(lèi)可恢復(fù)耕地灌溉條件極好、地勢(shì)相對(duì)較低,其地形坡度較緩,放干內(nèi)部水體即可重新耕種。整體上未耕種和即可恢復(fù)地塊的宜耕潛力高于工程恢復(fù)類(lèi)地塊。未耕種地塊只需要簡(jiǎn)單地清理地表的灌叢、雜草即可重新耕種,復(fù)墾成本最低,且這類(lèi)地塊的宜耕潛力相對(duì)較大,可耕種地塊面積為18.47 hm2,占未耕種面積的4.56%,其中拋荒水田的可耕種地塊面積占比略高于旱地。即可恢復(fù)地塊(不含坑塘和養(yǎng)殖坑塘)的可耕種地塊面積為93.07 hm2,占即可恢復(fù)地塊面積的4.38%。從宜耕潛力上來(lái)看,即可恢復(fù)地塊和未耕種地塊中的可耕種地塊均屬于良好的整治地塊,可列為優(yōu)先整治恢復(fù)耕地的對(duì)象。從具體地類(lèi)上來(lái)看,坑塘和養(yǎng)殖坑塘的宜耕潛力最大;其次為其他林地,其可耕種地塊面積達(dá)到83.37 hm2;灌木林地、其他園地的宜耕潛力次之,其可耕種地塊面積分別為8.03、11.55 hm2(圖4)。
圖4 湘陰縣典型地區(qū)可恢復(fù)耕地宜耕潛力對(duì)比圖Figure 4 Comparison of suitable cultivation potential of recoverable cultivated land in typical areas of Xiangyin County
湘陰縣可恢復(fù)耕地中耕地流向?yàn)榭犹梁宛B(yǎng)殖坑塘類(lèi)的面積最大,且大部分坑塘和養(yǎng)殖坑塘類(lèi)可恢復(fù)耕地均可耕種。各地區(qū)其他林地類(lèi)可恢復(fù)耕地的地塊的宜耕潛力差異巨大,位于西部平原區(qū)的其他林地類(lèi)可恢復(fù)耕地的可耕種地塊面積占比達(dá)35.34%,對(duì)應(yīng)的東部丘陵山區(qū)的其他林地類(lèi)可恢復(fù)耕地的可耕種地塊面積占比僅為0.1%,宜耕潛力極低,大部分其他林地類(lèi)可恢復(fù)耕地即使整治也難以持續(xù)開(kāi)發(fā)利用。整體對(duì)比來(lái)看,中西部平原區(qū)可恢復(fù)耕地的宜耕潛力明顯優(yōu)于東部丘陵山區(qū)。東部丘陵山區(qū)多為沖溝中的條帶狀梯田,由于可恢復(fù)耕地海拔相對(duì)較高,坡度較陡且灌溉保障率較低,地塊碎片化嚴(yán)重,這類(lèi)地塊整治后再次拋荒的風(fēng)險(xiǎn)較高(圖5)。
圖5 湘陰縣可恢復(fù)耕地地塊宜耕潛力分布Figure 5 Distribution of suitable cultivation potential of recoverable cultivated land in Xiangyin County
本研究通過(guò)自然因素、區(qū)位因素、社會(huì)經(jīng)濟(jì)因素以及工程因素4 個(gè)方面對(duì)可恢復(fù)耕地的宜耕性進(jìn)行評(píng)價(jià),對(duì)不同類(lèi)型可恢復(fù)耕地提出了面向地塊層面的整治建議,為可恢復(fù)耕地的科學(xué)有序整治提供了理論依據(jù)。從可恢復(fù)耕地的宜耕性影響因素來(lái)看,海拔高程、坡度級(jí)別、地塊形狀以及集塊面積等是最重要的影響因素。實(shí)質(zhì)上,這幾個(gè)因素也是限制農(nóng)業(yè)機(jī)械化生產(chǎn)的重要因素,對(duì)于分布相對(duì)零散、破碎及高海拔陡坡地帶的可恢復(fù)耕地,土地流轉(zhuǎn)速度慢,即使流轉(zhuǎn),也存在因機(jī)械化生產(chǎn)受限而帶來(lái)的“非糧化”風(fēng)險(xiǎn)。因此,積極有序推動(dòng)丘陵山區(qū)坡度較小的梯田和細(xì)碎耕地的集中整治,大力推動(dòng)丘陵山區(qū)土地平整和高標(biāo)準(zhǔn)農(nóng)田建設(shè),能夠使耕地集中、大塊地進(jìn)行耕種,提升耕地的宜耕性。在可恢復(fù)耕地整治或高標(biāo)準(zhǔn)農(nóng)田建設(shè)過(guò)程中,應(yīng)優(yōu)先選擇宜耕潛力較高的可恢復(fù)耕地進(jìn)行整治。根據(jù)整治方案對(duì)可恢復(fù)耕地整治前后的宜耕潛力進(jìn)行對(duì)比研究,結(jié)合可恢復(fù)耕地的整治成本、宜耕潛力的變化情況,合理有序地開(kāi)展可恢復(fù)耕地的整治工作。通過(guò)土地整治工作實(shí)現(xiàn)對(duì)破碎、分散的可恢復(fù)耕地地塊集中連片化、規(guī)整化,不僅有利于優(yōu)化灌溉設(shè)施及機(jī)耕道的布局,而且有利于土地規(guī)模流轉(zhuǎn),推動(dòng)機(jī)械化生產(chǎn)。與此同時(shí),在耕地整治過(guò)程中,也要結(jié)合市場(chǎng)的流轉(zhuǎn)需求,結(jié)合宜耕性評(píng)價(jià)成果,合理有序整治耕地。提高機(jī)械化可應(yīng)用水平,也是遏制耕地“非糧化”的有效途徑。對(duì)于難以進(jìn)行集中整治的丘陵山區(qū)地帶的細(xì)碎或坡度較陡耕地,應(yīng)加大小微型農(nóng)業(yè)機(jī)械和農(nóng)業(yè)技術(shù)服務(wù)的創(chuàng)新與推廣,降低這類(lèi)耕地的耕種成本,從而有效遏制耕地“非糧化”。
雖然我國(guó)已建立農(nóng)業(yè)補(bǔ)貼和耕地保護(hù)補(bǔ)償政策,但現(xiàn)有的農(nóng)業(yè)補(bǔ)貼和耕地保護(hù)補(bǔ)償政策大多傾向簡(jiǎn)單的“一刀切”,難以科學(xué)合理地引導(dǎo)和管控耕地“非糧化”發(fā)展和減少耕地撂荒,需綜合考慮地區(qū)實(shí)際情況,細(xì)化補(bǔ)貼對(duì)象,建立分級(jí)分類(lèi)的補(bǔ)貼政策,進(jìn)一步調(diào)動(dòng)種糧的積極性,通過(guò)補(bǔ)貼標(biāo)準(zhǔn)和政策的進(jìn)一步完善,逐步建立起更具針對(duì)性的激勵(lì)制度。此外,應(yīng)重點(diǎn)開(kāi)展耕地的日常監(jiān)測(cè),開(kāi)展更加精細(xì)化的耕地“非糧化”監(jiān)測(cè),及時(shí)掌握耕地生產(chǎn)和保護(hù)情況,針對(duì)非農(nóng)化、耕地拋荒以及種植結(jié)構(gòu)的變化進(jìn)行差異化補(bǔ)貼政策,以引導(dǎo)農(nóng)民糧食種植。
本研究構(gòu)建的可恢復(fù)耕地的宜耕性影響因素評(píng)價(jià)體系不僅可以有效指導(dǎo)可恢復(fù)耕地的宜耕潛力評(píng)價(jià),也可以拓展到耕地后備資源和整治后耕地資源的宜耕性評(píng)價(jià)。但全國(guó)不同地區(qū)耕地類(lèi)型、社會(huì)經(jīng)濟(jì)類(lèi)型差異較大,單一的宜耕性評(píng)價(jià)模型和指標(biāo)體系難以適用于全國(guó)。未來(lái)研究可依據(jù)耕地種植類(lèi)型、社會(huì)人口經(jīng)濟(jì)等方面的差異,充分考慮可恢復(fù)耕地演變機(jī)理、土地流轉(zhuǎn)、農(nóng)戶(hù)自身行為因素等,因地制宜建立宜耕性指標(biāo)體系與評(píng)價(jià)模型。
(1)本研究提出了一種基于XGBoost 算法的可恢復(fù)耕地的宜耕性評(píng)價(jià)方法。選取自然因素、區(qū)位因素、社會(huì)經(jīng)濟(jì)因素以及工程因素4 個(gè)方面的指標(biāo)為自變量,以現(xiàn)狀可恢復(fù)耕地和耕種耕地二分類(lèi)為因變量搭建評(píng)價(jià)模型,通過(guò)模型分析了各項(xiàng)影響因素對(duì)耕地宜耕性評(píng)價(jià)的重要程度,并進(jìn)一步結(jié)合共線(xiàn)性分析和指標(biāo)關(guān)聯(lián)性分析,識(shí)別并篩選了其中共線(xiàn)性和關(guān)聯(lián)性影響因素,最終得到21 項(xiàng)影響因素及其權(quán)重P值。經(jīng)驗(yàn)證,預(yù)測(cè)的耕種情況與實(shí)際耕種情況的符合率高達(dá)91.87%,且具有良好的泛化能力和魯棒性,預(yù)測(cè)效果良好。
(2)本研究進(jìn)一步通過(guò)XGBoost 算法搭建的模型預(yù)測(cè)了湘陰縣可恢復(fù)耕地地塊的宜耕潛力。整體上,湘陰縣中西部平原區(qū)可恢復(fù)耕地宜耕潛力明顯優(yōu)于東部丘陵山區(qū),可恢復(fù)耕地中未耕種和即可恢復(fù)地塊的宜耕潛力高于工程恢復(fù)類(lèi)地塊。從可恢復(fù)耕地具體地類(lèi)來(lái)看,坑塘和養(yǎng)殖坑塘類(lèi)可恢復(fù)耕地的宜耕潛力最大,其次為其他林地類(lèi)可恢復(fù)耕地,灌木林地、其他園地類(lèi)可恢復(fù)耕地的宜耕潛力次之。
(3)在耕地整治過(guò)程中,應(yīng)以可恢復(fù)耕地宜耕性評(píng)價(jià)為前提,合理有序地開(kāi)展可恢復(fù)耕地的整治。另外,應(yīng)開(kāi)展更加精細(xì)化的耕地“非糧化”監(jiān)測(cè),及時(shí)掌握耕地生產(chǎn)和保護(hù)情況,針對(duì)非農(nóng)化、耕地拋荒以及種植結(jié)構(gòu)的變化進(jìn)行差異化補(bǔ)貼政策,通過(guò)差異化補(bǔ)貼或補(bǔ)償政策遏制耕地“非糧化”。