吳彥澎
摘要:針對當(dāng)前基本農(nóng)田劃定過程中主觀干預(yù)過多的問題,在綜合考慮耕地質(zhì)量情況、交通區(qū)位條件和耕地連片性等因素的基礎(chǔ)上,提出一種基于網(wǎng)格的基本農(nóng)田保護(hù)規(guī)劃空間聚類算法。該算法以網(wǎng)格作為分析單元,首先以 K-Means 算法對網(wǎng)格的屬性進(jìn)行初步聚類;然后利用網(wǎng)格間的空間關(guān)系和相似性進(jìn)行最大相似區(qū)的確定;最后再以模糊聚類方法對細(xì)碎區(qū)聚合歸并,最終得到基本農(nóng)田保護(hù)區(qū)域,可用于指導(dǎo)基本農(nóng)田保護(hù)規(guī)劃的實(shí)施。并通過具體案例分析證明了該算法的可行性和實(shí)用性,且具有較高的計(jì)算效率。
關(guān)鍵詞:基本農(nóng)田保護(hù);網(wǎng)格;空間聚類;耕地質(zhì)量;交通區(qū)位;連片性
中圖分類號:S126
文獻(xiàn)標(biāo)志碼:A
文章編號:1002-1302(2020)16-0250-05
耕地入選基本農(nóng)田就是將總體規(guī)劃確定的耕地按一定的面積指標(biāo)有選擇地劃分為基本農(nóng)田的過程。目前,在實(shí)際劃定過程中主觀隨意性過強(qiáng),缺乏一定的科學(xué)決策,只從經(jīng)濟(jì)建設(shè)的需求考慮,而忽視耕地的質(zhì)量要求和耕地連片需求、忽視農(nóng)田保護(hù)的政策規(guī)定,使基本農(nóng)田保護(hù)流于形式,不能形成合理優(yōu)化的空間布局[1]。
鑒于基本農(nóng)田劃定中存在的問題,如何劃定基本農(nóng)田保護(hù)區(qū)成為學(xué)術(shù)研究的熱點(diǎn)。國內(nèi)已有學(xué)者進(jìn)行了大量的研究工作,獲得了豐富的基本農(nóng)田劃定的理論結(jié)果和經(jīng)驗(yàn)。宇向東等在耕地分等的基礎(chǔ)上,將綜合評價算法模型移植到基本農(nóng)田空間配置過程中[2];唐寬金等以糧食生產(chǎn)能力為基礎(chǔ)進(jìn)行了基本農(nóng)田保護(hù)區(qū)的劃定[3-4];金志豐利用GIS空間分析技術(shù)提出依據(jù)土地適宜性指數(shù)和土地等引入農(nóng)用地連片性的概念確定了基本農(nóng)田劃定的空間范圍[5]。在已有的基本農(nóng)田劃定研究中,主要依據(jù)單一的因素進(jìn)行劃定,同時涉及多個因素進(jìn)行綜合分析的研究很少,主要原因是缺乏一種有效的統(tǒng)計(jì)單元和綜合評價算法。
空間聚類分析可以對耕地地塊對象進(jìn)行聚類,將“屬性相似,空間臨近”的耕地地塊對象劃分在同一類別中,即把基本農(nóng)田的劃定看成是基于耕地地塊統(tǒng)計(jì)單元的空間聚類問題。聚類過程中可以選取多個與基本農(nóng)田劃定相關(guān)的因素進(jìn)行綜合評價,同時根據(jù)耕地地塊之間的空間位置關(guān)系進(jìn)行鄰接性調(diào)整,以達(dá)到優(yōu)質(zhì)的耕地連片的效果,最終確定基本農(nóng)田保護(hù)區(qū)域。由于空間數(shù)據(jù)庫中耕地?cái)?shù)據(jù)大多是面狀地理實(shí)體,最直接的方法就是采用面狀數(shù)據(jù)的聚類算法,而面狀數(shù)據(jù)的聚類過程又存在相似度評價難、不同尺度的面狀數(shù)據(jù)聚類結(jié)果必然不同等問題[6-7]。因此,以耕地地塊對象作為統(tǒng)計(jì)單元進(jìn)行聚類時,若將不同尺度的因素?cái)?shù)據(jù)統(tǒng)計(jì)到耕地地塊中,勢必造成無法解釋的空間聚類結(jié)果。為了彌補(bǔ)統(tǒng)計(jì)單元在尺度上存在的不足,本研究采用一種設(shè)計(jì)穩(wěn)定、標(biāo)準(zhǔn)化的空間統(tǒng)計(jì)單元——網(wǎng)格單元作為統(tǒng)計(jì)分析單元,并進(jìn)而設(shè)計(jì)了新的聚類算法。
1 基于網(wǎng)格的空間聚類算法實(shí)現(xiàn)
陳述彭等從網(wǎng)格地圖思想出發(fā),提出建立網(wǎng)格信息系統(tǒng),用不同精度的網(wǎng)格來劃分、存儲面狀的空間數(shù)據(jù)及其屬性數(shù)據(jù)[8-10]。用網(wǎng)格作為統(tǒng)計(jì)分析單元可以解決耕地地塊對象作為統(tǒng)計(jì)單元在尺度上的問題。
將面狀數(shù)據(jù)劃分成網(wǎng)格后,進(jìn)行分析時有很大方便,本研究提出的基于網(wǎng)格的空間聚類算法,從網(wǎng)格的數(shù)據(jù)結(jié)構(gòu)——網(wǎng)格單元出發(fā),統(tǒng)計(jì)基本農(nóng)田劃定因素的信息,采用K-Means聚類算法對網(wǎng)格屬性進(jìn)行初步聚類,利用網(wǎng)格單元之間隱藏的空間關(guān)系對網(wǎng)格屬性聚類結(jié)果進(jìn)行空間鄰接性的調(diào)整,能夠很方便地實(shí)現(xiàn)空間聚類。主要過程如下:
1.1 網(wǎng)格的建立
目前,統(tǒng)計(jì)數(shù)據(jù)的獲取主要來自于土地利用數(shù)據(jù)和耕地分等數(shù)據(jù),必須依照一定的條件,將現(xiàn)有的土地利用數(shù)據(jù)和耕地分等數(shù)據(jù)進(jìn)行網(wǎng)格劃分。本研究綜合考慮現(xiàn)有的各種網(wǎng)格劃分方法的優(yōu)劣并結(jié)合實(shí)際研究的需求,采用基于經(jīng)緯度坐標(biāo)的地理網(wǎng)格劃分方法[11]。主要步驟如下:
1.1.1 建立地理網(wǎng)格 根據(jù)研究區(qū)域的最小整經(jīng)緯度范圍、空間對象的尺度進(jìn)行等經(jīng)緯度(經(jīng)緯分)劃分。網(wǎng)格大小可根據(jù)實(shí)際需要的精度確定,例如15″×15″、30″×30″、1′×1′等。
1.1.2 網(wǎng)格屬性的獲取 地理網(wǎng)格建立后,與土地利用數(shù)據(jù)、耕地分等數(shù)據(jù)疊加,獲取基本農(nóng)田劃定因素的屬性值。部分因素的屬性需通過空間計(jì)算獲取,本研究針對一些基礎(chǔ)屬性和交通區(qū)位條件屬性提供了一些統(tǒng)計(jì)方法。
基礎(chǔ)屬性的獲取?;A(chǔ)屬性包括耕地地塊個數(shù)、地塊面積、平均地塊分維數(shù)等。針對地塊個數(shù),首先構(gòu)建每個耕地地塊的最小外接矩形;其次計(jì)算最小外接矩形的中心點(diǎn)坐標(biāo)及落入的網(wǎng)格編號;最后統(tǒng)計(jì)每個網(wǎng)格中落入的中心點(diǎn)個數(shù),即為網(wǎng)格中耕地地塊的數(shù)量。其他基礎(chǔ)屬性可根據(jù)各指標(biāo)的計(jì)算公式進(jìn)行獲取。
通達(dá)度屬性的獲取。通達(dá)度屬性是指耕地到主干線、城鎮(zhèn)、村莊的距離。在當(dāng)前計(jì)算的耕地地塊所在的網(wǎng)格內(nèi)可能不存在主干線等地物,本研究針對此情況采用8鄰域迭代檢索的方法獲取鄰接網(wǎng)格內(nèi)主干線等地物,并計(jì)算與其最短距離(圖1)。以主干線通達(dá)度計(jì)算為例,高亮顯示的耕地地塊所在的網(wǎng)格0中不存在主干線地物,因此需要在網(wǎng)格0周邊8個方向的網(wǎng)格內(nèi)尋找。檢索到網(wǎng)格6、7、8存在主干線地物,當(dāng)前計(jì)算的耕地地塊分別同3個網(wǎng)格內(nèi)的主干線進(jìn)行距離計(jì)算,選取最小距離進(jìn)行存儲。若網(wǎng)格0的8鄰域網(wǎng)格內(nèi)都不存在主干線地物,則向外擴(kuò)展檢索范圍,直至尋找到為止。
1.2 網(wǎng)格聚類步驟描述
本研究采用基于密度思想的K-Means算法作為基礎(chǔ)算法對網(wǎng)格屬性進(jìn)行聚類[12-13],通過相似網(wǎng)格的擴(kuò)張得到空間聚類結(jié)果,這種方法能夠充分利用網(wǎng)格的數(shù)據(jù)結(jié)構(gòu)。算法主要分為4個步驟:
1.2.1 確定K-Means算法的初始聚類中心 考慮到聚類結(jié)果受隨機(jī)選取的初始聚類中心的影響,本研究采用基于網(wǎng)格密度的初始聚類中心選取方法,確定最優(yōu)的初始聚類中心。網(wǎng)格密度為屬性中統(tǒng)計(jì)的耕地地塊的個數(shù),個數(shù)越多,網(wǎng)格密度越大。
1.2.2 屬性聚類 地理網(wǎng)格建立后,每個網(wǎng)格單元就是一個待分類對象,對所選屬性進(jìn)行歸一化處理。根據(jù)步驟1確定的初始聚類中心,應(yīng)用 K-Means 算法進(jìn)行屬性聚類,得到每一個網(wǎng)格的聚類類別。該步驟完成“屬性相似”的聚類過程。
1.2.3 最大相似區(qū)和核心區(qū)的確定 對網(wǎng)格數(shù)據(jù)進(jìn)行線性掃描,獲取當(dāng)前處理的網(wǎng)格聚類類別并判斷8鄰域內(nèi)的網(wǎng)格單元是否相似(即類別是否相同),若存在相似的網(wǎng)格單元則進(jìn)行擴(kuò)張獲取更多相似網(wǎng)格單元形成最大相似區(qū)。設(shè)定最大相似區(qū)域網(wǎng)格數(shù)閾值θ,將小于閾值θ的最大相似區(qū)標(biāo)記為“臨時噪聲區(qū)”,大于閾值θ的最大相似區(qū)標(biāo)記為核心區(qū)。
1.2.4 “臨時噪聲區(qū)”的處理 遍歷步驟3中的“臨時噪聲區(qū)”,判斷每個“臨時噪聲區(qū)”內(nèi)的網(wǎng)格是否為無效網(wǎng)格,若是,則標(biāo)記為噪聲區(qū);若否,同鄰接的核心區(qū)進(jìn)行相似度計(jì)算,合并到相似度最大的核心區(qū)中。該過程中的無效網(wǎng)格是指網(wǎng)格區(qū)域范圍內(nèi)無耕地存在的網(wǎng)格。
1.3 網(wǎng)格聚類算法過程
輸入?yún)?shù):網(wǎng)格劃分步長λ,K-Means聚類數(shù)目k,最大相似區(qū)網(wǎng)格數(shù)閾值θ。
1.3.1 建立地理網(wǎng)格 第一步,根據(jù)輸入網(wǎng)格劃分步長λ建立地理網(wǎng)格。
第三步,依次遍歷所有網(wǎng)格,重復(fù)第二步。
第四步,對網(wǎng)格屬性set={I1,I2,…,Im}進(jìn)行歸一化處理,形成網(wǎng)格單元聚類維度屬性set′={I1′,I2′,…,Im′}。
1.3.2 基于密度的K均值聚類 第一步,從網(wǎng)格屬性集set′中獲取網(wǎng)格密度,將密度最大的網(wǎng)格單元G[i]作為第一個初始聚類中心,存入初始聚類中心集合C。從set′中尋找下一個密度最大網(wǎng)格,該網(wǎng)格到C的歐氏距離最遠(yuǎn)。當(dāng)C中網(wǎng)格個數(shù)等于k時結(jié)束。
第二步,引用K-Means算法對參與聚類的因素屬性進(jìn)行聚類,得到每個網(wǎng)格單元的屬性聚類結(jié)果ClassID。聚類過程中采用加權(quán)的歐氏距離作為相似度判斷的依據(jù)。
1.3.3 最大相似區(qū)域獲取 第一步,所有網(wǎng)格單元初始遍歷標(biāo)志Visit=false,最終聚類結(jié)果FinalID=0,最大相似區(qū)AreaID=0。
第二步,創(chuàng)建一個隊(duì)GridArray,存放鄰域網(wǎng)格ID。
第三步,從G[0]開始對所有網(wǎng)格進(jìn)行線性掃描,檢索訪問標(biāo)識Visist=false的網(wǎng)格單元G[i],獲取其8鄰域內(nèi)網(wǎng)格單元集,設(shè)定該網(wǎng)格遍歷標(biāo)志Visit(G[i])=true,最終聚類結(jié)果FinalID(G[i])=ClassID(G[i]),相似區(qū)AreaID(G[i])=1。若8鄰域網(wǎng)格單元集中存在遍歷標(biāo)志Visist=false且FinalID(G[i])=ClassID的網(wǎng)格單元,將該網(wǎng)格ID加入GridArray。若不存在,訪問下一個遍歷標(biāo)志Visist=false的網(wǎng)格單元。
第四步,當(dāng)GridArray不為空時,讀取隊(duì)頭網(wǎng)格,轉(zhuǎn)下一步。當(dāng)GridArray為空時,重復(fù)第三步,AreaID加1。
第五步,取隊(duì)頭網(wǎng)格,設(shè)其遍歷標(biāo)志Visist=true,F(xiàn)inalID=FinalID(G[i]),AreaID=AreaID(G[i])刪除隊(duì)頭網(wǎng)格,重復(fù)Step3。
第六步,最大相似區(qū)獲取結(jié)束。
1.3.4 “臨時噪聲網(wǎng)格區(qū)”的處理 第一步,統(tǒng)計(jì)每個最大相似區(qū)內(nèi)網(wǎng)格個數(shù)Count。若Count>θ,則該最大相似區(qū)標(biāo)記為核心區(qū);若Count<θ,暫時標(biāo)記該相似區(qū)為“臨時噪聲區(qū)”。
第二步,若“臨時噪聲區(qū)”內(nèi)網(wǎng)格單元為無效網(wǎng)格單元,則標(biāo)記為“噪聲區(qū)”。否則將“臨時噪聲區(qū)”同鄰接的核心區(qū)做相似度計(jì)算,合并到相似度最大的核心區(qū)。相似度采用加權(quán)的歐氏距離作為判斷的依據(jù)
第三步,處理結(jié)束,將核心區(qū)結(jié)果作為最終聚類結(jié)果。
具體算法流程見圖2。
2 應(yīng)用案例分析
2.1 應(yīng)用區(qū)現(xiàn)狀與數(shù)據(jù)源
選擇江蘇省寶應(yīng)縣為研究區(qū),寶應(yīng)縣地處江蘇省中部,京杭運(yùn)河縱貫?zāi)媳保h域東西長55.7 km,南北寬47.4 km,全境總面積1 467.4 km2。該縣屬黃淮沖擊平原,分成東西2部分,西高東低;沿運(yùn)河兩岸高亢,東西邊緣低洼;運(yùn)東南北兩側(cè)略高,中間偏低。
本研究以2008年全國第二次土地調(diào)查的 1 ∶ 5 000 寶應(yīng)縣土地利用現(xiàn)狀數(shù)據(jù)作為基本分析圖件,以1 ∶ 25萬寶應(yīng)縣耕地分等數(shù)據(jù)、寶應(yīng)縣土地
利用總體規(guī)劃(2006—2020年)數(shù)據(jù)作為輔助分析資料。
2.2 結(jié)果與分析
依據(jù)高標(biāo)準(zhǔn)農(nóng)田、農(nóng)田保護(hù)的概念及內(nèi)涵以及基本農(nóng)田保護(hù)區(qū)規(guī)劃的影響因素,在確定基本農(nóng)田劃分區(qū)域時應(yīng)首先考慮耕地的質(zhì)量水平、耕地地塊所處區(qū)域的區(qū)位交通條件,優(yōu)先將利用程度高,耕作便利的耕地優(yōu)先確定為保護(hù)網(wǎng)格;還應(yīng)考慮耕地的集中連片條件、土地利用結(jié)構(gòu)等因素。本案例最終確定寶應(yīng)縣基本農(nóng)田劃定指標(biāo)和權(quán)重見表1。
(1)本研究網(wǎng)格采用經(jīng)緯差30″為網(wǎng)格間距,生成網(wǎng)格數(shù)=24×33的圖層,其中有效網(wǎng)格數(shù)為536。網(wǎng)格屬性的獲取主要來自寶應(yīng)縣土地利用現(xiàn)狀數(shù)據(jù),土地利用現(xiàn)狀數(shù)據(jù)中道路、城鎮(zhèn)、村莊圖斑參與通達(dá)度計(jì)算,耕地質(zhì)量等級指標(biāo)利用耕地分等數(shù)據(jù)獲取。寶應(yīng)縣建立后的地理網(wǎng)格和基本數(shù)據(jù)情況見圖3。
(2)設(shè)定K-Means算法的聚類數(shù)目k=3,在閾值參數(shù)θ=4的水平下,得到33個最大相似區(qū),其中細(xì)碎區(qū)占50%以上,但細(xì)碎區(qū)網(wǎng)格個數(shù)僅占總網(wǎng)格的5.03%。這些分區(qū)的具體統(tǒng)計(jì)信息見表2。
(3)細(xì)碎區(qū)的處理。根據(jù)“1.2”節(jié)中針對細(xì)碎區(qū)的處理流程對細(xì)碎區(qū)進(jìn)行合并,最終得到9個核心區(qū)。屬性聚類結(jié)果和細(xì)碎區(qū)調(diào)整后的最終聚類結(jié)果見圖4。為了清晰起見,給出了每個類別調(diào)整前后的統(tǒng)計(jì)信息(表3)。
本案例對3個類別中參與聚類的網(wǎng)格屬性進(jìn)行統(tǒng)計(jì)分析,最終劃定第一類網(wǎng)格區(qū)域作為寶應(yīng)縣基本農(nóng)田保護(hù)區(qū),主要集中在寶應(yīng)西北部、東部和南部地區(qū)。與寶應(yīng)現(xiàn)行基本農(nóng)田保護(hù)規(guī)劃對比,寶應(yīng)縣東北部的基本農(nóng)田保護(hù)區(qū)與規(guī)劃不一致,分析認(rèn)為,該地區(qū)耕地面積比例較低、連片性差,且自然等級相對較低,因此不適宜作為耕地保護(hù)區(qū)。寶應(yīng)縣南部耕地面積集中,耕地連片性指數(shù)、耕地的自然等和利用等指數(shù)相對較高,因此適宜作為基本農(nóng)田加以保護(hù)。由于案例中聚類算法得到的基本農(nóng)田保護(hù)區(qū)考慮的因素同規(guī)劃有所差別,雖能確定耕地保護(hù)區(qū)的空間位置,但并不能同規(guī)劃區(qū)域完全一致??傮w來說,利用本研究的空間聚類算法進(jìn)行基本農(nóng)田保護(hù)區(qū)的劃定能夠指導(dǎo)基本農(nóng)田保護(hù)規(guī)劃的實(shí)施。
3 結(jié)論與討論
以網(wǎng)格作為統(tǒng)計(jì)單元,可以獲取不同尺度的耕地入選基本農(nóng)田的指標(biāo)信息,進(jìn)行多因素綜合分析。同時可以利用網(wǎng)格間的空間位置關(guān)系完成空間聚類,確定基本農(nóng)田保護(hù)區(qū)域。在全面考慮基本農(nóng)田劃定影響因素的基礎(chǔ)上,以江蘇省寶應(yīng)縣基本農(nóng)田劃定為例,驗(yàn)證了算法的可行性和實(shí)用性。算法只需對網(wǎng)格進(jìn)行1次線性掃描即可完成整個聚類過程,具有較高的效率。
科學(xué)地劃定基本農(nóng)田并非一個簡單隨意的過程,它需要綜合考慮多方面的因素,既包括耕地自身的條件,如質(zhì)量狀況、區(qū)位條件等,還包括人為因素的影響,如行政干預(yù)、政策限制等,而這些因素之間又相互影響、相互交叉,有時甚至相互矛盾、相互沖突。因此,本研究空間聚類算法的應(yīng)用必須經(jīng)過一個綜合分析、評價和判斷的過程,才能作出科學(xué)的決策。
參考文獻(xiàn):
[1]展瑰琦,鄭偉元. 關(guān)于基本農(nóng)田保護(hù)區(qū)規(guī)劃與劃定的幾個問題[J]. 中國土地科學(xué),1997,11(1):12-14.
[2]宇向東,郝晉岷,鮑文東. 基于耕地分等的基本農(nóng)田空間配置的方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2008,24(增刊1):185-189.
[3]唐寬金,鄭新奇,姚金明,等. 基于糧食生產(chǎn)能力的基本農(nóng)田保護(hù)區(qū)規(guī)劃方法研究[J]. 地域研究與開發(fā),2008,27(6):105-109.
[4]金志豐. 基于GIS空間分析的基本農(nóng)田配置研究[J]. 水土保持通報(bào),2010,30(5):134-137,164.
[5]周尚意,朱阿興,邱維理,等. 基于GIS的農(nóng)用地連片性分析及其在基本農(nóng)田保護(hù)規(guī)劃中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào),2008,24(7):72-77,封3.
[6]楊 帆,米 紅. 一種基于網(wǎng)格的空間聚類方法在區(qū)域劃分中的應(yīng)用[J]. 測繪科學(xué),2007,32(增刊1):66-69.
[7]吳信才,劉少雄. 基于鄰接關(guān)系的空間數(shù)據(jù)挖掘[J]. 計(jì)算機(jī)工程,2002,28(7):89-91.
[8]陳述彭,陳秋曉,周成虎. 網(wǎng)格地圖與網(wǎng)格計(jì)算[J]. 測繪科學(xué),2002,27(4):1-6.
[9]周成虎,歐 陽,馬 廷. 地理格網(wǎng)模型研究進(jìn)展[J]. 地理科學(xué)進(jìn)展,2009,28(5):657-662.
[10]陳述彭,周成虎,陳秋曉. 格網(wǎng)地圖的新一代[J]. 測繪科學(xué),2004,29(4):1-4.
[11]國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,國家標(biāo)準(zhǔn)化管理委員會. 地理格網(wǎng):GB/T 12409—2009[S]. 北京:中國標(biāo)準(zhǔn)出版社,2009.
[12]劉智杭,于 鳴,任洪娥. 基于改進(jìn)K均值聚類的葡萄果穗圖像分割[J]. 江蘇農(nóng)業(yè)科學(xué),2018,46(24):239-244.
[13]Arthur D,Vassilvitskii S . K-Means+ +:the advantages of careful seeding[C]. Proceedings of the Eighteenth Annual ACM-SIAM Symposium on Discrete Algorithms,New Orleans,2007.