王春陽(yáng) 湯子夢(mèng) 吳喜芳 李長(zhǎng)春 張合兵
(1.河南理工大學(xué)測(cè)繪與國(guó)土信息工程學(xué)院, 焦作 454003; 2.河南理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 焦作 454003)
土地資源是人們賴以生存和發(fā)展的基礎(chǔ),隨著全球環(huán)境氣候不斷變化,溫室效應(yīng)日益加劇,人類發(fā)展過(guò)程中對(duì)土地的利用以及引起的土地覆蓋變化被認(rèn)為是全球環(huán)境變化的重要組成部分[1]。土地利用分類圖是研究土地變化的前提,為生態(tài)服務(wù)和制定土地政策提供了依據(jù)[2]。伴隨著計(jì)算機(jī)技術(shù)的發(fā)展,土地利用/覆蓋變化的研究方法日新月異,傳統(tǒng)分類方法成本高,工程量大,且效果不佳[3],機(jī)器學(xué)習(xí)如人工神經(jīng)網(wǎng)絡(luò)[4]、支持向量機(jī)[5]、決策樹(shù)[6]等是通過(guò)學(xué)習(xí)來(lái)獲取經(jīng)驗(yàn)并改進(jìn)自身性能的方法,受人為因素影響較小,分類精度較高,被廣泛應(yīng)用在遙感影像的分類中[7]。
機(jī)器學(xué)習(xí)的發(fā)展可以追溯到1990年,WARREN等[8]首次提出了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型,為機(jī)器學(xué)習(xí)的提出和發(fā)展奠定了基礎(chǔ),隨后MITCHELL等[9]提出了機(jī)器學(xué)習(xí)的概念。運(yùn)用機(jī)器學(xué)習(xí)算法對(duì)遙感影像進(jìn)行分類,既提高了分類精度,又節(jié)約了成本,因此成為學(xué)者們研究的熱點(diǎn)[10-13]。在許多數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的任務(wù)中,存在大量未標(biāo)記的樣本和有限的標(biāo)記樣本[14],馬永建等[15]將植被指數(shù)NDVI值和紋理特征灰度共生矩陣能量值作為特征波段,基于U-Net模型實(shí)現(xiàn)了對(duì)GF-1號(hào)遙感影像荒漠地區(qū)耕地的提取,相比于傳統(tǒng)方法,分類精度得到了提高;王笑影等[16]基于R語(yǔ)言和隨機(jī)森林對(duì)Landsat 8 OLI影像進(jìn)行土地覆蓋的監(jiān)督分類研究,該方法簡(jiǎn)單實(shí)用但僅用于中小區(qū)域土地的快速分類的情景;陳磊士等[17]以Landsat 8和Sentinel-1A融合后的數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),分別采用卷積神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)算法分類,結(jié)果發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)具有較好的分類結(jié)果;趙亞杰等[18]運(yùn)用隨機(jī)森林算法對(duì)Sentinel-2和Landsat影像進(jìn)行土地利用分類,實(shí)現(xiàn)了對(duì)地物的精細(xì)提?。魂惲x菁等[19]運(yùn)用支持向量機(jī)算法實(shí)現(xiàn)了對(duì)Landsat影像的分類,對(duì)探究影響土地利用分類的變化提供了依據(jù)。大多數(shù)學(xué)者提出的機(jī)器學(xué)習(xí)算法雖然有較好的分類精度,但樣本需求量大、成本高,受人為因素影響干擾較大。半監(jiān)督學(xué)習(xí)具有僅使用少量標(biāo)記樣本就可以達(dá)到分類效果的特點(diǎn),成為近年來(lái)研究的熱點(diǎn)話題。半監(jiān)督機(jī)器學(xué)習(xí)算法適用于小樣本類型,它是同時(shí)使用標(biāo)記和未標(biāo)記的樣本來(lái)擬合模型。在某些情況下,添加未標(biāo)記的數(shù)據(jù)可能使模型的準(zhǔn)確性提高,在其他情況下可能會(huì)使準(zhǔn)確率降低[20]。
為了最大化有限使用在半監(jiān)督機(jī)器學(xué)習(xí)算法中可用的監(jiān)督數(shù)據(jù),本文提出基于粒子群算法優(yōu)化的半監(jiān)督概率神經(jīng)網(wǎng)絡(luò)框架,將其運(yùn)用在中分辨率的Landsat影像中,獲得新鄉(xiāng)市土地利用分類圖。以新鄉(xiāng)市1996年、2004年、2013年、2020年4期遙感影像為例,解譯出不同時(shí)期的土地利用動(dòng)態(tài),通過(guò)監(jiān)測(cè)近14年內(nèi)的土地利用/覆蓋變化,分析新鄉(xiāng)市1996—2020年的土地利用轉(zhuǎn)移矩陣,為新鄉(xiāng)市人地關(guān)系研究和土地資源管理提供參考[21],以期實(shí)現(xiàn)新鄉(xiāng)市各種土地利用資源與經(jīng)濟(jì)增長(zhǎng)、社會(huì)穩(wěn)定、生態(tài)和諧共同發(fā)展。
新鄉(xiāng)市地理位置示意圖如圖1所示,新鄉(xiāng)市位于河南省的北部,地處北緯34°53′~35°50′,東經(jīng)113°23′~114°59′,南臨黃河,與鄭州市、開(kāi)封市隔河相望;北依太行山,與鶴壁市、安陽(yáng)市毗鄰;西連焦作市,與晉東南接壤;東接濮陽(yáng)市,與魯西相連,是國(guó)家重要的綜合交通樞紐,也是豫北的經(jīng)濟(jì)、交通、教育、商貿(mào)物流中心;年平均氣溫14℃[22],7月最熱,平均氣溫27.3℃;1月最冷,平均氣溫0.2℃,年平均降水量656.3 mm,6—9月降水量最大,且多暴雨。新鄉(xiāng)市自然條件和土地耕作條件好,是中國(guó)糧棉生產(chǎn)區(qū)、國(guó)家優(yōu)質(zhì)小麥生產(chǎn)基地和河南省畜牧生產(chǎn)加工基地,是農(nóng)業(yè)大市[23]。截至2020年11月,新鄉(xiāng)市的常住人口625.29萬(wàn)人,全市的農(nóng)林牧業(yè)產(chǎn)值、糧食產(chǎn)量、居民消費(fèi)水平大幅度提高。
圖1 新鄉(xiāng)市地理位置示意圖Fig.1 Geographical location map of Xinxiang City
根據(jù)新鄉(xiāng)市的地理位置特點(diǎn)及獲取遙感影像需滿足的實(shí)驗(yàn)需求,本研究所使用的4期影像數(shù)據(jù)均來(lái)源于美國(guó)地質(zhì)調(diào)查局(USGS)網(wǎng)站(https:∥earthexplorer.usgs.gov/),由于受到Landsat數(shù)據(jù)影像品質(zhì)的影響,無(wú)法下載到同一個(gè)月份的影像。為了保證實(shí)驗(yàn)結(jié)果的可靠性,選取了時(shí)間上相對(duì)較接近的影像數(shù)據(jù)(6、7、8月)。選取1996年、2004年、2013年、2020年的6月或7月或8月的影像,所選的影像云量均在5%以下,該時(shí)期的影像品質(zhì)較高便于土地利用/覆蓋變化的研究。新鄉(xiāng)市面積較大,覆蓋研究區(qū)需要由行列號(hào)為123-36、124-35、124-36的3景影像拼接而成,空間分辨率為30 m,本次研究使用的數(shù)據(jù)分別為:1996年7月獲取的Landsat TM數(shù)據(jù),2004年6月獲取的Landsat TM數(shù)據(jù),2013年7月獲取的Landsat OLI數(shù)據(jù)和2020年8月獲取的Landsat OLI數(shù)據(jù)。
首先結(jié)合《全國(guó)遙感監(jiān)測(cè)覆蓋分類體系》建立的參考框架,綜合考慮新鄉(xiāng)市土地利用類型的特點(diǎn),將研究區(qū)土地利用/覆蓋類型確定為耕地、林地、水體、建設(shè)用地、草地、其他用地6類[24],遙感影像的解譯如表1所示。具體的實(shí)驗(yàn)步驟為:首先使用ENVI 5.3軟件對(duì)遙感影像進(jìn)行輻射定標(biāo)、大氣校正、裁剪、拼接等預(yù)處理工作[25],使遙感影像的圖像更加清晰、更加突出物體的標(biāo)識(shí);其次基于預(yù)處理后的遙感影像使用ENVI 5.3軟件進(jìn)行6類樣本點(diǎn)的選取,將樣本點(diǎn)和原始影像均轉(zhuǎn)換為算法所需的.mat格式;然后基于Matlab 2019a平臺(tái)運(yùn)用粒子群優(yōu)化概率神經(jīng)網(wǎng)絡(luò)的半監(jiān)督算法、概率神經(jīng)網(wǎng)絡(luò)半監(jiān)督算法進(jìn)行分類,進(jìn)行對(duì)比的隨機(jī)森林法和最大似然法,則采用ENVI 5.3軟件完成分類,并用ArcGIS軟件制作新鄉(xiāng)市的土地利用分類圖;最后對(duì)新鄉(xiāng)市1996—2020年土地利用的時(shí)空變化進(jìn)行分析。實(shí)驗(yàn)流程如圖2所示。
表1 新鄉(xiāng)市土地利用分類及遙感解譯特征Tab.1 Land use classification and remote sensing interpretation signs in Xinxiang City
圖2 實(shí)驗(yàn)流程圖Fig.2 Experimental flow chart
針對(duì)遙感影像分類中需要大量標(biāo)記樣本和分類精度較低的問(wèn)題,提出了一種以半監(jiān)督為主體,將粒子群優(yōu)化與概率神經(jīng)網(wǎng)絡(luò)框架相融合的一種分類算法。首先,利用粒子群優(yōu)化算法生成最優(yōu)參數(shù);其次,利用上述最優(yōu)參數(shù)的概率神經(jīng)網(wǎng)絡(luò)分類器,根據(jù)標(biāo)注的訓(xùn)練樣本計(jì)算每個(gè)像素的類別概率,預(yù)測(cè)每個(gè)像素的類別;然后利用香農(nóng)熵篩選高置信度的無(wú)標(biāo)記樣本,并將其添加到原始訓(xùn)練集中進(jìn)行新一輪的預(yù)測(cè),自我訓(xùn)練使用模型自己對(duì)未標(biāo)記數(shù)據(jù)的預(yù)測(cè)結(jié)果,將其添加到已標(biāo)記的數(shù)據(jù)集中,選擇置信度高的預(yù)測(cè)樣本將其添加到已標(biāo)記的數(shù)據(jù)集中,不斷地重新訓(xùn)練這個(gè)模型,直到?jīng)]有更多可信的預(yù)測(cè)結(jié)果為止。這種算法可以滿足訓(xùn)練樣本較少的情況,將大量無(wú)標(biāo)記的樣本轉(zhuǎn)換為有標(biāo)記的樣本,同時(shí)使用標(biāo)記樣本和未標(biāo)記樣本數(shù)據(jù)來(lái)擬合出能夠真實(shí)反映類別信息的分類器,分類成本較低,分類精度不斷提高。本研究首先選取樣本總數(shù)的5%作為訓(xùn)練樣本加入到訓(xùn)練樣本集中,依次增加樣本數(shù)的10%進(jìn)行迭代,算法流程如圖3所示。
圖3 實(shí)驗(yàn)算法流程圖Fig.3 Flow chart of experimental algorithm
2.1.1概率神經(jīng)網(wǎng)絡(luò)分類器
概率神經(jīng)網(wǎng)絡(luò)(Probabilistic neural network, PNN)是SPECHT[26]在1988年提出的一種神經(jīng)網(wǎng)絡(luò)模型。這種模型是以指數(shù)替代神經(jīng)網(wǎng)絡(luò)常用的S型激活函數(shù),進(jìn)而構(gòu)造出能夠計(jì)算非線性判別邊界的概率神經(jīng)網(wǎng)絡(luò),該判定界面接近于貝葉斯的最佳判定面。概率神經(jīng)網(wǎng)絡(luò)主要用于分類和識(shí)別領(lǐng)域,其中在分類方面應(yīng)用最廣泛,這種網(wǎng)絡(luò)模型已經(jīng)被廣泛應(yīng)用在非線性濾波、模式分類、聯(lián)想記憶和概率密度估計(jì)中[27]。這種模型分類錯(cuò)誤率較低,風(fēng)險(xiǎn)比較小,但將其應(yīng)用到Landsat遙感影像方面的研究較少。本研究將概率神經(jīng)網(wǎng)絡(luò)模型應(yīng)用在遙感影像中,并對(duì)遙感影像數(shù)據(jù)中的地物信息進(jìn)行分類,運(yùn)用粒子群優(yōu)化算法選取最優(yōu)分類參數(shù),使分類精度達(dá)到理想的結(jié)果。
概率神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)模型大致分為輸入層、樣本層、求和層和競(jìng)爭(zhēng)層。在輸入層中,網(wǎng)絡(luò)計(jì)算輸入向量與所有訓(xùn)練樣本向量之間的距離;樣本層里神經(jīng)元的數(shù)量是訓(xùn)練樣本的數(shù)量;求和層是將樣本層的輸出按類相加,相當(dāng)于n個(gè)加法器;競(jìng)爭(zhēng)層的神經(jīng)元數(shù)量為1,最后的結(jié)果也是由競(jìng)爭(zhēng)層輸出,輸出的結(jié)果只有1個(gè)1,其他的結(jié)果都是0。
2.1.2粒子群優(yōu)化算法
粒子群優(yōu)化算法具有快捷、收斂速度較快等優(yōu)勢(shì)[28],但作為一種仿生算法,粒子群優(yōu)化算法數(shù)學(xué)理論基礎(chǔ)尚不完善,因而需要在理論基礎(chǔ)上進(jìn)一步研究和討論。
在粒子群算法中,每一個(gè)粒子群代表一個(gè)可能的解,整個(gè)種群通過(guò)競(jìng)爭(zhēng)和協(xié)作實(shí)現(xiàn)多維空間中對(duì)最優(yōu)解的探索[29]。在D維空間中,每個(gè)粒子被視作一個(gè)解,由當(dāng)前位置X=(xi1,xi2,…,xiD)和當(dāng)前速度Vi=(vi1,vi2,…,viD)組成,對(duì)于全局粒子群算法,粒子群Xi依據(jù)其歷史最優(yōu)值Pi=(pi1,pi2,…,piD)和全局最優(yōu)值Pg=(pg1,pg2,…,pgD)迭代更新。每個(gè)粒子更新位置和速度可以表示為
(1)
(2)
式中t——當(dāng)前進(jìn)化的次數(shù)
c1、c2——正加速度常數(shù)
r1、r2——[0,1]之間的隨機(jī)數(shù)
ω——慣性權(quán)重
2.1.3粒子群優(yōu)化概率神經(jīng)網(wǎng)絡(luò)過(guò)程
概率神經(jīng)網(wǎng)絡(luò)的相關(guān)結(jié)構(gòu)和對(duì)應(yīng)神經(jīng)元的數(shù)目由訓(xùn)練樣本數(shù)據(jù)的數(shù)量和類別確定,網(wǎng)絡(luò)模型的性能取決于網(wǎng)絡(luò)的參數(shù),而粒子群算法計(jì)算簡(jiǎn)單、收斂速度快,通過(guò)迭代獲得最優(yōu)解,可有效選取概率神經(jīng)網(wǎng)絡(luò)的最優(yōu)參數(shù)。首先隨機(jī)初始化粒子的位置和速度,構(gòu)建網(wǎng)絡(luò),通過(guò)適應(yīng)度函數(shù)f(xi)計(jì)算各個(gè)粒子的適應(yīng)度,從而選取出個(gè)體的局部最優(yōu)位置和全局最優(yōu)位置,然后進(jìn)行迭代,將得出的每個(gè)粒子的適應(yīng)度與局部最佳位置的適應(yīng)度相比,若當(dāng)前適應(yīng)度更大,則用當(dāng)前粒子的位置作為全局最佳位置,不斷進(jìn)行迭代,更新個(gè)體的極值和群體極值。若滿足條件則迭代終止,輸出最優(yōu)解;若未滿足條件,則不斷重復(fù)上述步驟直到滿足條件為止。本文使用粒子群優(yōu)化算法對(duì)概率神經(jīng)網(wǎng)絡(luò)的spread參數(shù)進(jìn)行優(yōu)化,利用粒子群的粒子間協(xié)同合作與知識(shí)共享對(duì)spread速度和位置進(jìn)行準(zhǔn)確定位,找到最佳的輸入值,有效提高了概率神經(jīng)網(wǎng)絡(luò)分類模型的性能,從而最終能夠得到最佳的土地分類結(jié)果,流程如圖4所示。
圖4 粒子群優(yōu)化概率神經(jīng)網(wǎng)絡(luò)流程圖Fig.4 Flow chart of probabilistic neural network for particle swarm optimization
YAROSKY首先提出了自訓(xùn)練半監(jiān)督算法[30],該算法是先用有標(biāo)記的樣本去訓(xùn)練一個(gè)分類器,本文所采用的分類器是概率神經(jīng)網(wǎng)絡(luò),然后利用分類器對(duì)無(wú)標(biāo)記的樣本進(jìn)行概率預(yù)測(cè),根據(jù)獲得的置信度,選擇一些高置信度且無(wú)標(biāo)記的樣本加入到原始訓(xùn)練集中作為新的訓(xùn)練樣本集,重復(fù)這個(gè)過(guò)程直到完成給定的迭代次數(shù)。本文算法在多次迭代的分類精度中選擇了一個(gè)最大精度,避免迭代次數(shù)過(guò)多出現(xiàn)過(guò)度擬合現(xiàn)象。若有原始已標(biāo)記樣本集L={(x1,y1),(x2,y2),…,(xm,ym)},無(wú)標(biāo)記樣本集U={(xm+1),(xm+2),…,(xn)},迭代的次數(shù)為K,算法流程為:
(1)利用已標(biāo)記樣本集L訓(xùn)練得到模型p。
(2)利用分類器p對(duì)無(wú)標(biāo)記樣本集U進(jìn)行標(biāo)記,選擇置信度較高的m個(gè)樣本,記作L′,并將其從無(wú)標(biāo)記樣本中刪除。
(3)利用L∪L′對(duì)選擇的分類器進(jìn)行反復(fù)訓(xùn)練。
(4)重復(fù)步驟(2)和步驟(3),直到迭代條件滿足時(shí)為止。
選取新鄉(xiāng)市1996年、2004年、2013年和2020年的Landsat影像作為實(shí)驗(yàn)數(shù)據(jù),運(yùn)用粒子群優(yōu)化概率神經(jīng)網(wǎng)絡(luò)的半監(jiān)督算法分類時(shí),選取5%的訓(xùn)練樣本,迭代3次每次增加總樣本的10%擴(kuò)充訓(xùn)練樣本集,最后訓(xùn)練樣本集總數(shù)為總樣本的35%,剩下的用來(lái)檢驗(yàn)分類精度。新鄉(xiāng)市各年份各類別輸入的樣本總數(shù)和訓(xùn)練樣本總數(shù)如表2~5所示。獲得各年份的土地利用分類圖,分類總體精度達(dá)到97%,Kappa系數(shù)均達(dá)到0.8。為了對(duì)比算法的分類精度,與隨機(jī)森林、最大似然法和概率神經(jīng)網(wǎng)絡(luò)半監(jiān)督算法進(jìn)行了對(duì)比實(shí)驗(yàn),各算法的分類結(jié)果如圖5所示。
表2 新鄉(xiāng)市1996年總樣本、訓(xùn)練樣本和驗(yàn)證樣本數(shù)Tab.2 Total samples, training samples and verified samples in Xinxiang City in 1996
表3 新鄉(xiāng)市2004年總樣本、訓(xùn)練樣本和驗(yàn)證樣本數(shù)Tab.3 Total samples, training samples and verified samples in Xinxiang City in 2004
由圖5可知,隨機(jī)森林法和最大似然法在進(jìn)行林地與其他用地的分類時(shí),錯(cuò)分、漏分現(xiàn)象較為嚴(yán)重,較為明顯的地方在圖中已用紅色區(qū)域圈出,概率神經(jīng)網(wǎng)絡(luò)算法分類效果較其他2種算法好。在較難區(qū)分的林地和草地中,本文算法可將2種地物區(qū)分出來(lái),而隨機(jī)森林法和最大似然法將2種地物歸為1種地物來(lái)劃分,概率神經(jīng)網(wǎng)絡(luò)算法將1996年的部分林地劃分為草地,如圖5b所示,最大似然法也未能將2020年林地準(zhǔn)確區(qū)分出來(lái),如圖5o所示;在進(jìn)行水體分類時(shí),最大似然法和概率神經(jīng)網(wǎng)絡(luò)算法未能將2004年的水體準(zhǔn)確區(qū)分出來(lái),如圖5f、5g所示;對(duì)于耕地和建筑物分類效果不能滿足要求;對(duì)其他用地進(jìn)行分類時(shí),2013年分類錯(cuò)分最為明顯,如圖5k、5l所示,2種算法將新鄉(xiāng)市西北部的區(qū)域幾乎都認(rèn)為是其他用地,分類效果較差。在精度評(píng)定方面本文選取總體精度和Kappa系數(shù)2個(gè)評(píng)價(jià)指標(biāo),從表6可以看出,和其他3種算法相比,本研究提出的半監(jiān)督算法精度提高了1.25~6.57個(gè)百分點(diǎn),Kappa系數(shù)也達(dá)到0.8以上,有效提高了分類總體精度,彌補(bǔ)了其他算法錯(cuò)分漏分的情況。
表4 新鄉(xiāng)市2013年總樣本、訓(xùn)練樣本和驗(yàn)證樣本數(shù)Tab.4 Total samples, training samples and verified samples in Xinxiang City in 2013
表5 新鄉(xiāng)市2020年總樣本、訓(xùn)練樣本和驗(yàn)證樣本數(shù)Tab.5 Total samples, training samples and verified samples in Xinxiang City in 2020
除此之外,本研究提出的算法因融合了半監(jiān)督,所以適應(yīng)訓(xùn)練樣本少的情況,為了使實(shí)驗(yàn)結(jié)果對(duì)比更清晰,選擇了一個(gè)小區(qū)域進(jìn)行對(duì)比實(shí)驗(yàn),各年份所選的區(qū)域如圖6所示。分別選取了樣本數(shù)的5%、10%,每次迭代過(guò)程中都會(huì)新加入5%的訓(xùn)練樣本到測(cè)試集中作為訓(xùn)練樣本集,在對(duì)比分析不同樣本數(shù)的分類精度時(shí)發(fā)現(xiàn),當(dāng)選取訓(xùn)練樣本數(shù)為總數(shù)的5%時(shí),1996年、2004年、2013年、2020年分類精度依次為95.15%、95.93%、98.13%、95.57%;當(dāng)選取樣本數(shù)為10%時(shí),分類精度依次為94.08%、95.45%、97.62%、95.97%。2種樣本數(shù)量的分類精度均保持在理想狀態(tài),對(duì)比可以發(fā)現(xiàn)當(dāng)選取的樣本數(shù)量為5%時(shí),各地物分類的精度也很高,和樣本數(shù)量為10%在分類效果和分類精度上幾乎沒(méi)有差別,在較難區(qū)分的草地和林地,分類效果也較好,因此當(dāng)訓(xùn)練樣本較少時(shí),本研究提出的算法仍然滿足精度要求,各年份的土地利用分類如圖7所示。
表6 新鄉(xiāng)市土地利用/覆蓋變化總體精度評(píng)價(jià)Tab.6 Overall accuracy evaluation of land use/coverage change in Xinxiang City
圖6 各年份研究區(qū)位置圖Fig.6 Location map of study area for each year
圖7 不同樣本數(shù)的土地利用分類圖Fig.7 Land use classification maps for different sample numbers
3.2.1土地利用時(shí)間變化特征
利用本文方法獲得新鄉(xiāng)市4年的土地利用分類圖,然后利用ArcGIS平臺(tái)的空間分析和統(tǒng)計(jì)功能,根據(jù)土地利用分類圖,獲得每一類的土地利用面積,分析土地利用變化的原因。新鄉(xiāng)市各土地利用類型面積如表7所示。
從表7可以看出,在1996—2020年期間,耕地面積總體呈增加趨勢(shì),從1996年的4 377.86 km2增加到4 810.95 km2,增加了9.9%;建設(shè)用地面積從1996年到2020年增加了近38%;其他用地的面積相對(duì)減少,由1996年的729.40 km2減少到354.16 km2,面積減少了52%;草地面積由1996年的974.30 km2減少到465.21 km2,減少了52%;水體的面積幾乎沒(méi)有大的波動(dòng)。由此看出,近14年來(lái)由于新鄉(xiāng)市經(jīng)濟(jì)飛速發(fā)展,社會(huì)基礎(chǔ)設(shè)施的不斷增加、生活水平的不斷改善、人口的不斷增多導(dǎo)致對(duì)住房和工業(yè)的需求增多,從而導(dǎo)致建筑面積的不斷擴(kuò)張,其他用地面積不斷減少。除此之外,由于人口數(shù)量的急劇增加,導(dǎo)致對(duì)糧食新的需求不斷增加,耕地面積不斷增加,草地面積急劇減少。
表7 新鄉(xiāng)市各年份土地利用類型面積Tab.7 Area statistics of various land use types in Xinxiang City km2
土地利用轉(zhuǎn)移矩陣是定量研究土地利用類型間相互轉(zhuǎn)換的數(shù)量和方向的主要方法,它能夠具體反映土地利用變化的結(jié)構(gòu)特征和各類型間的轉(zhuǎn)移方向。以新鄉(xiāng)市1996年和2020年的土地利用數(shù)據(jù)為基礎(chǔ),利用ArcGIS軟件進(jìn)行疊加分析,獲得土地利用轉(zhuǎn)移數(shù)據(jù),并利用Excel制作轉(zhuǎn)移矩陣,如表8所示。結(jié)果表明,新鄉(xiāng)市土地利用的主要變化趨勢(shì)為耕地和建設(shè)用地面積在增加,其中耕地轉(zhuǎn)換為建設(shè)用地的面積最大。具體的流向?yàn)椋翰莸刂饕鬓D(zhuǎn)為耕地和建設(shè)用地;耕地主要流轉(zhuǎn)為建設(shè)用地和其他用地;建設(shè)用地主要流轉(zhuǎn)為耕地;林地主要流轉(zhuǎn)為草地;水體部分被開(kāi)發(fā)為建設(shè)用地,部分作為耕地;其他用地轉(zhuǎn)換為耕地、草地和建設(shè)用地。
表8 1996—2020年新鄉(xiāng)市土地利用轉(zhuǎn)移矩陣Tab.8 Land use transfer matrix of Xinxiang City from 1996 to 2020 km2
3.2.2土地利用空間變化特征
由于耕地和建設(shè)用地是新鄉(xiāng)市主要的2種土地利用類型,所以選取這2種土地利用類型來(lái)分析新鄉(xiāng)市土地利用空間變化特征。1996—2020年間,新鄉(xiāng)市土地利用變化總體上表現(xiàn)為耕地的增加和建設(shè)用地的擴(kuò)張。新鄉(xiāng)市1996—2020年建設(shè)用地和耕地空間分布如圖8所示。
耕地是新鄉(xiāng)市占比較大的土地利用類型,主要分布在地勢(shì)比較平坦的東西部地區(qū)和南部的臨黃河地區(qū),西北部輝縣山地較多、中部地區(qū)人口較多建筑用地分布較為密集,因此這2個(gè)區(qū)域耕地面積較少??傮w來(lái)看,1996—2020年新鄉(xiāng)市耕地面積總體呈增加趨勢(shì),增加了433.21 km2。從不同時(shí)期來(lái)看,1996—2004年耕地面積減少,如新鄉(xiāng)市東南部地區(qū)長(zhǎng)垣市。2004—2020年耕地面積有所增加,因?yàn)?005年新鄉(xiāng)市進(jìn)行了行政區(qū)劃的調(diào)整,對(duì)農(nóng)田實(shí)施了保護(hù)措施,耕地面積減少的趨勢(shì)得到了改善。此外,國(guó)土資源部頒布的《國(guó)土資源部辦公廳關(guān)于印發(fā)市縣鄉(xiāng)及土地利用總體規(guī)劃編制指導(dǎo)意見(jiàn)的通知》和河南省頒布的《批轉(zhuǎn)省國(guó)土資源廳關(guān)于做好土地利用總體規(guī)劃修編工作指導(dǎo)意見(jiàn)的通知》這些政策,推進(jìn)新鄉(xiāng)市進(jìn)行復(fù)墾和開(kāi)發(fā),這也是新鄉(xiāng)市耕地面積不斷增加的原因之一。
新鄉(xiāng)市的建設(shè)用地主要集中在中心市區(qū)新鄉(xiāng)縣,并不斷向外擴(kuò)張。輝縣市西北部緊鄰太行山脈,山地丘陵面積較多,因此建設(shè)用地分布較少但卻是林地的主要分布區(qū)域;新鄉(xiāng)市南部的延津縣和封丘縣的建設(shè)用地變化不太明顯;新鄉(xiāng)市東南部的長(zhǎng)垣市是重要的工業(yè)區(qū),近年來(lái)建設(shè)用地面積也在不斷增加。此外,新鄉(xiāng)市是河南省中原地區(qū)的重要工業(yè)基地,工業(yè)生產(chǎn)總值較高,工業(yè)廠房的建設(shè)也在不斷加快,進(jìn)而導(dǎo)致建設(shè)用地增加。此外,人口的增長(zhǎng)、城市化進(jìn)程的加快、城市擴(kuò)張均成為新鄉(xiāng)市建設(shè)用地面積不斷增加的原因。
(1)提出了一種基于粒子群優(yōu)化概率神經(jīng)網(wǎng)絡(luò)的半監(jiān)督融合算法,該算法使用粒子群優(yōu)化概率神經(jīng)網(wǎng)絡(luò)分類器,使得分類器的性能更加優(yōu)越,還融合了半監(jiān)督適合小樣本的優(yōu)勢(shì)。該算法在分類時(shí)可以使用少量的標(biāo)記樣本,解決了傳統(tǒng)分類方法對(duì)標(biāo)記樣本數(shù)量要求高、分類精度低、成本高、錯(cuò)分漏分嚴(yán)重的問(wèn)題,相比于其他3種傳統(tǒng)算法,分類精度提高了1.25~6.57個(gè)百分點(diǎn)。由此得出,本研究提出的機(jī)器學(xué)習(xí)算法應(yīng)用在Landsat影像的復(fù)雜地形區(qū)土地利用/土地覆蓋分類中有速度快、準(zhǔn)確率高、外界因素影響較小等優(yōu)勢(shì),表現(xiàn)出了較強(qiáng)的適應(yīng)性,運(yùn)用機(jī)器學(xué)習(xí)算法獲得土地利用/覆蓋信息,并制定合理的政策成為未來(lái)研究的熱點(diǎn)。
(2)對(duì)新鄉(xiāng)市近年來(lái)土地利用現(xiàn)狀進(jìn)行分析,有利于解決新鄉(xiāng)市目前存在的土地問(wèn)題并為未來(lái)的土地利用決策提供依據(jù)。新鄉(xiāng)市1996—2020年間耕地面積和建設(shè)用地面積分別增加了433.21 km2和537.11 km2;其他用地面積和草地面積均呈現(xiàn)出減少的趨勢(shì),水體面積變化小,14年間僅減少了3.45 km2;在土地流轉(zhuǎn)方面,草地流轉(zhuǎn)為耕地和建設(shè)用地的面積最大,變化最明顯,水體的轉(zhuǎn)換情況不是很突出,其他用地多轉(zhuǎn)為草地和建設(shè)用地,耕地多轉(zhuǎn)為建設(shè)用地。1996—2020年新鄉(xiāng)市土地利用變化主要受到城市化水平的提高,經(jīng)濟(jì)的增長(zhǎng)以及國(guó)家的方針和地方的政策等多方面的共同影響。研究揭示了新鄉(xiāng)市的近14年的土地利用變化特征,為該地區(qū)進(jìn)一步合理開(kāi)發(fā)和利用土地提供理論依據(jù)。