冷信風(fēng),賴(lài)祖龍
(1.修水縣國(guó)土資源局,江西 修水332400;2.中國(guó)地質(zhì)大學(xué)信息工程學(xué)院,湖北 武漢430074)
喀斯特石漠化是在脆弱的生態(tài)地質(zhì)環(huán)境基礎(chǔ)上,由于人為因素的影響而導(dǎo)致的以土地生產(chǎn)力退化為本質(zhì)的現(xiàn)象,是土地荒漠化的主要類(lèi)型之一,它對(duì)生態(tài)環(huán)境和人類(lèi)生存發(fā)展造成了嚴(yán)重的危害[1—2]。石漠化風(fēng)險(xiǎn)評(píng)估是非常重要的自然災(zāi)害風(fēng)險(xiǎn)分析,但由于其具有明顯的多目標(biāo)性、且受多因子和各個(gè)層次因素相互作用的影響,因此對(duì)石漠化進(jìn)行風(fēng)險(xiǎn)評(píng)估是一項(xiàng)復(fù)雜的系統(tǒng)工程[3]。目前針對(duì)石漠化風(fēng)險(xiǎn)評(píng)估主要考慮以下三大類(lèi)的評(píng)估指標(biāo):現(xiàn)狀指標(biāo)(基巖裸露率、植被覆蓋度、坡度、土壤裸露率、土壤類(lèi)型)、演變速率指標(biāo)(石漠化年增長(zhǎng)率、人均耕地面積)、脆弱性評(píng)價(jià)指標(biāo)(人口密度、人均 GDP、農(nóng)業(yè)利用價(jià)值)[4],這些指標(biāo)主要是通過(guò)遙感[5]和調(diào)查統(tǒng)計(jì)獲取,并運(yùn)用地理信息系統(tǒng)(Geographic Information System,GIS)對(duì)處理后的遙感影像進(jìn)行綜合分析。由于GIS具有數(shù)據(jù)組織和管理、空間分析、地理制圖和空間數(shù)據(jù)可視化等方面的優(yōu)勢(shì),因此已成為進(jìn)行地理空間信息綜合分析的有效工具[6]。
在進(jìn)行石漠化風(fēng)險(xiǎn)評(píng)估時(shí),面對(duì)大規(guī)模的指標(biāo)體系,必須要揭示變量之間的關(guān)系并簡(jiǎn)化數(shù)學(xué)建模的過(guò)程,使得評(píng)估模型變量的選取更加合理,風(fēng)險(xiǎn)評(píng)估結(jié)果精度更高,因此有必要先使用主成分分析(PCA)將原始指標(biāo)數(shù)據(jù)進(jìn)行壓縮以避免指標(biāo)間的多重共線(xiàn)性[7]。傳統(tǒng)評(píng)估模型大都存在權(quán)重系數(shù)難以確定、只考慮了各指標(biāo)間線(xiàn)性關(guān)系的缺點(diǎn),而支持向量機(jī)(Support Vector Machine,SVM)具有避免定權(quán)、充分考慮非線(xiàn)性關(guān)系和評(píng)估結(jié)果更加客觀可靠的優(yōu)點(diǎn),它是一種基于統(tǒng)計(jì)學(xué)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的模式識(shí)別方法[8],評(píng)估分類(lèi)效果較基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理的人工神經(jīng)網(wǎng)絡(luò)更優(yōu)。此外,考慮到SVM模型的評(píng)估性能很大程度上依賴(lài)于參數(shù)的選取,如文獻(xiàn)[9]中支持向量機(jī)參數(shù)選取均采用窮舉法等人工反復(fù)試驗(yàn)的方法,不僅效率低且得到的未必是全局最優(yōu)解,針對(duì)這一問(wèn)題,采用全局搜索能力強(qiáng)且實(shí)現(xiàn)簡(jiǎn)單的粒子群優(yōu)化(PSO)算法[10]來(lái)優(yōu)化選取SVM模型參數(shù)。
基于此,本文在利用GIS進(jìn)行空間數(shù)據(jù)管理和分析的基礎(chǔ)上,首先采用主成分分析進(jìn)行指標(biāo)篩選,再運(yùn)用PSO-SVM模型對(duì)云南省文山州喀斯特石漠化現(xiàn)象進(jìn)行風(fēng)險(xiǎn)評(píng)估,并將評(píng)估結(jié)果與單獨(dú)SVM模型和PSO-BP模型進(jìn)行對(duì)比分析,以期為石漠化風(fēng)險(xiǎn)評(píng)估提供一種新思路。
粒子群優(yōu)化(PSO)算法是由Eberhart和Kennedy等提出的基于群體智能的參數(shù)尋優(yōu)技術(shù),它通過(guò)群體中各個(gè)粒子間的競(jìng)爭(zhēng)和合作形成的群體智能來(lái)優(yōu)化搜索。PSO算法數(shù)學(xué)描述為:初始化D維向量空間中的K個(gè)隨機(jī)粒子,其中第k個(gè)粒子的位置向量為xk=(xk1,xk2,…,xkD),速度向量為vk=(vk1,vk2,…,vkD),(k=1,2,…,K),將xk代入目標(biāo)函數(shù),計(jì)算出每個(gè)粒子的適應(yīng)度值,確定每個(gè)粒子的當(dāng)前個(gè)體最優(yōu)解pbest記為Pk=(pk1,pk2,…,pkD)和當(dāng)前群體最優(yōu)解gbest記為Pg=(pg1,pg2,…,pgD)。在每一次迭代中,找到這兩個(gè)最優(yōu)值后,粒子根據(jù)下面公式更新本身的速度向量和位置向量:式中:t=1,2,…,tmax代表迭代次數(shù);ω為慣性權(quán)重;r1和r2為區(qū)間[0,1]上的隨機(jī)生成數(shù);c1和c2為學(xué)習(xí)因子。
Vapnik等1995年提出基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)模型(SVM模型),它是一種新型機(jī)器學(xué)習(xí)算法,其基本思想為:定義最優(yōu)線(xiàn)性超平面,并把尋找最優(yōu)線(xiàn)性超平面的算法歸結(jié)為求解一個(gè)凸規(guī)劃問(wèn)題;進(jìn)而基于Mercer核展開(kāi)定理,通過(guò)非線(xiàn)性映射把樣本空間映射到一個(gè)高維特征空間,使其在特征空間中可以應(yīng)用線(xiàn)性學(xué)習(xí)機(jī)的方法解決樣本空間中的高度非線(xiàn)性分類(lèi)和回歸等問(wèn)題。與傳統(tǒng)統(tǒng)計(jì)學(xué)相比,統(tǒng)計(jì)學(xué)理論專(zhuān)門(mén)研究有限樣本條件下的機(jī)器學(xué)習(xí)規(guī)律,而SVM模型既有嚴(yán)格的理論基礎(chǔ),又能較好地解決有限樣本、高維數(shù)、非線(xiàn)性和局部最值等問(wèn)題。
本文的三大類(lèi)評(píng)估指標(biāo)主要通過(guò)遙感影像解譯、地圖數(shù)字化和實(shí)地調(diào)查統(tǒng)計(jì)獲取,指標(biāo)數(shù)據(jù)量巨大,因此需要利用GIS軟件制作出反映各種信息的專(zhuān)題圖與專(zhuān)題數(shù)據(jù)庫(kù),以便高效地管理風(fēng)險(xiǎn)評(píng)估的空間數(shù)據(jù)與屬性數(shù)據(jù)。由于GIS具有優(yōu)越的空間數(shù)據(jù)顯示功能[11],因此可采用顏色的深淺和填充紋理的差異來(lái)反映不同地區(qū)的石漠化風(fēng)險(xiǎn),從而形象、直觀地表達(dá)石漠化風(fēng)險(xiǎn)評(píng)估的結(jié)果?;贕IS的石漠化風(fēng)險(xiǎn)評(píng)估類(lèi)似于一種柵格影像的疊加分析,如圖1所示。
依據(jù)基巖裸露率、植被覆蓋度等指標(biāo)數(shù)據(jù)進(jìn)行石漠化風(fēng)險(xiǎn)評(píng)估,其本質(zhì)是一個(gè)非線(xiàn)性映射的過(guò)程,而利用SVM模型解決這類(lèi)復(fù)雜的非線(xiàn)性映射問(wèn)題具有明顯的優(yōu)勢(shì),因此本文使用SVM模型進(jìn)行石漠化風(fēng)險(xiǎn)評(píng)估。使用SVM模型進(jìn)行評(píng)估之前,需先運(yùn)用主成分分析對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行預(yù)處理,具體流程如下:
(1)將原始指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理,主要是為了消除各指標(biāo)量綱不同和數(shù)量級(jí)差異過(guò)大對(duì)模型造成的影響。
圖1 各個(gè)指標(biāo)專(zhuān)題圖以柵格影像的方式進(jìn)行疊加分析Fig.1 All indexes thematic maps
(2)對(duì)歸一化后的指標(biāo)數(shù)據(jù)進(jìn)行主成分分析,獲得新的綜合指標(biāo),主要包括求取原始指標(biāo)數(shù)據(jù)相關(guān)系數(shù)矩陣的特征值、特征向量以及指標(biāo)主成分。
適合的溫度有利于釀酒酵母更好的生長(zhǎng)代謝,研究了溫度對(duì)Y17aM3生長(zhǎng)及生產(chǎn)RNA的影響,結(jié)果如圖 13。Y17aM3隨著培養(yǎng)溫度升高而生長(zhǎng)減慢及RNA產(chǎn)量減少,因此低溫更有利于Y17aM3生長(zhǎng)和積累RNA。最適溫度為26 ℃,此時(shí)Y17aM3生長(zhǎng)OD600最高為14.5,RNA含量最高為115 mg-RNA/g-DCW,比在30 ℃條件下提高了3 mg-RNA/g-DCW。
(3)將新的綜合指標(biāo)作為SVM模型的訓(xùn)練和測(cè)試數(shù)據(jù),并運(yùn)用PSO算法對(duì)SVM模型進(jìn)行參數(shù)尋優(yōu),得到SVM模型的最佳參數(shù),以便確定最終用于石漠化風(fēng)險(xiǎn)評(píng)估的SVM模型。
(4)使用石漠化風(fēng)險(xiǎn)評(píng)估的分類(lèi)精度作為模型訓(xùn)練和模型測(cè)試的效果檢驗(yàn),通過(guò)野外實(shí)地調(diào)查和專(zhuān)題圖采樣獲取樣本數(shù)據(jù),選取其中部分樣本數(shù)據(jù)用作模型訓(xùn)練,另外的樣本數(shù)據(jù)用作模型測(cè)試,并在試驗(yàn)分析的基礎(chǔ)上,對(duì)石漠化風(fēng)險(xiǎn)評(píng)估模型的性能進(jìn)行綜合評(píng)定。
本文以云南省文山州為研究區(qū)進(jìn)行石漠化風(fēng)險(xiǎn)評(píng)估。
文山州位于滇東南偏西,東經(jīng)103°43′~104°27′、北 緯 23°16′~23°44′之間,全州總面積2 972km2,總?cè)丝?19 018人。文山州地域?qū)俚釚|南巖溶山原區(qū),境內(nèi)山巒起伏,河谷溝壑縱橫,大部分地區(qū)屬西風(fēng)帶中亞熱帶季風(fēng)氣候,年均氣溫為12.8℃~18.1℃,降雨量較充沛,年均降雨量為992.7mm。圖2為文山州的州界輪廊圖。
本次喀斯特石漠化風(fēng)險(xiǎn)評(píng)估以柵格為計(jì)算單元,每個(gè)格網(wǎng)的大小為50m×50m,將研究區(qū)分割成372 311個(gè)格網(wǎng)。其中,基巖裸露率、植被覆蓋度、坡度和土壤裸露率的分布見(jiàn)圖3至圖6。
圖2 文山州的州界輪廓圖Fig.2 Boundary contour figure of Wenshan Prefecture
圖3 文山州基巖裸露率分布圖Fig.3 Bedrock exposed rate distribution of Wenshan Prefecture
圖4 文山州植被覆蓋度分布圖Fig.4 Vegetation coverage distribution of Wenshan Prefecture
圖5 文山州坡度分布圖Fig.5 Slope distribution of Wenshan Prefecture
本文選取200個(gè)樣本數(shù)據(jù),根據(jù)野外調(diào)查,將對(duì)應(yīng)的喀斯特石漠化風(fēng)險(xiǎn)程度分為4個(gè)等級(jí),形成訓(xùn)練樣本和測(cè)試樣本數(shù)據(jù),見(jiàn)表1。
圖6 文山州土壤裸露率分布圖Fig.6 Bare soil rate distribution of Wenshan Prefecture
為了便于對(duì)SVM機(jī)模型的參數(shù)進(jìn)行訓(xùn)練,將SVM模型的訓(xùn)練結(jié)果和石漠化風(fēng)險(xiǎn)程度評(píng)估等級(jí)相對(duì)應(yīng),即沒(méi)有石漠化風(fēng)險(xiǎn)時(shí)對(duì)應(yīng)等級(jí)為1,輕度石漠化時(shí)對(duì)應(yīng)等級(jí)為2,中度石漠化時(shí)對(duì)應(yīng)等級(jí)為3,重度石漠化時(shí)對(duì)應(yīng)等級(jí)為4。
表1 歸一化處理后的樣本數(shù)據(jù)Table 1 Sample data after normalization
表1中10個(gè)風(fēng)險(xiǎn)評(píng)估指標(biāo)中,某些指標(biāo)間可能存在一定的相關(guān)性,如植被覆蓋度與土壤裸露率之間、石漠化年增長(zhǎng)率與人均耕地面積之間均呈負(fù)相關(guān)性,而且過(guò)多的輸入變量容易造成數(shù)據(jù)冗余,增加評(píng)估模型的復(fù)雜度,因此有必要對(duì)200個(gè)樣本數(shù)據(jù)的10個(gè)變量指標(biāo)進(jìn)行主成分分析,剔除變量之間的相關(guān)性,提高模型風(fēng)險(xiǎn)評(píng)估的精度。本文使用SPSS軟件自動(dòng)計(jì)算主成分其具體計(jì)算過(guò)程如下:
表2 累計(jì)方差貢獻(xiàn)率Table 2 Cumulative variance contribution rate
(2)由前3個(gè)特征根求得相對(duì)應(yīng)的特征向量構(gòu)成正交矩陣,再用特征根平方根對(duì)角矩陣左乘正交矩陣,得到主成分載荷矩陣,見(jiàn)表3。
表3 主成分載荷矩陣Table 3 Principal component load matrix
(3)最后計(jì)算主成分與原始變量之間的關(guān)系,用轉(zhuǎn)置后的正交矩陣左乘原始數(shù)據(jù)矩陣,即可得到經(jīng)過(guò)主成分變換后的新指標(biāo),這3個(gè)新指標(biāo)反映了原始變量92.419%的信息。
從主成分分析后得到的新指標(biāo)樣本中,選取100個(gè)樣本作為訓(xùn)練樣本,另外100個(gè)樣本作為測(cè)試樣本,并采用PSO算法優(yōu)選SVM模型的參數(shù),具體過(guò)程如下(見(jiàn)圖7):
(1)用分類(lèi)預(yù)測(cè)誤差作為適應(yīng)度值,初始化PSO-SVM模型,主要是針對(duì)SVM模型的兩個(gè)參數(shù)(核函數(shù)參數(shù)g和懲罰因子C)進(jìn)行優(yōu)化選取,PSO算法需要設(shè)置的參數(shù)主要包括粒子維數(shù)d、粒子位置和速度隨機(jī)初始化、種群規(guī)模N、最大迭代次數(shù)tmax等。
(2)分別由每個(gè)粒子建立相應(yīng)的SVM模型,再根據(jù)計(jì)算適應(yīng)度值的函數(shù)對(duì)各個(gè)粒子的初始適應(yīng)度值進(jìn)行對(duì)比分析。
(3)由迭代后的粒子獲取新的SVM模型參數(shù),并建立新的預(yù)測(cè)模型,再對(duì)比分析目標(biāo)函數(shù)預(yù)測(cè)值,重新對(duì)每個(gè)個(gè)體進(jìn)行迭代更新。
(4)對(duì)區(qū)域中的所有個(gè)體,將當(dāng)前位置計(jì)算出的目標(biāo)函數(shù)適應(yīng)度值同該個(gè)體歷史最優(yōu)位置和群體最優(yōu)位置的目標(biāo)函數(shù)適應(yīng)度值進(jìn)行對(duì)比分析,假若當(dāng)前位置效果更好,則將該位置替代掉歷史最優(yōu)位置。
(5)給粒子群設(shè)定終止條件,通常設(shè)定為迭代次數(shù)達(dá)到了極限迭代次數(shù),若滿(mǎn)足該終止條件,搜索停止,否則算法會(huì)返回到第(3)步,繼續(xù)迭代。
(6)將滿(mǎn)足條件的全局最優(yōu)粒子所對(duì)應(yīng)的核函數(shù)參數(shù)g和懲罰因子C,代入SVM模型中對(duì)其進(jìn)行分類(lèi)評(píng)估。
圖7 PSO-SVM模型參數(shù)選取過(guò)程圖Fig.7 Process of parameter selection in PSO-SVM model
由圖7可知,粒子群優(yōu)化的SVM模型參數(shù)為核函數(shù)參數(shù)g=0.328 21,懲罰因子C=68.392 2。
對(duì)于PSO-BP模型,采用PSO算法優(yōu)化選取BP模型的參數(shù)值,BP網(wǎng)絡(luò)隱藏層神經(jīng)元個(gè)數(shù)為20,訓(xùn)練次數(shù)為500次。對(duì)于單獨(dú)SVM模型,采用交叉驗(yàn)證的方法來(lái)得到最優(yōu)參數(shù),并通過(guò)反復(fù)驗(yàn)證最終確定SVM模型的參數(shù)為:核函數(shù)參數(shù)g=0.15,懲罰因子C=50。
幾種模型對(duì)文山州石漠化風(fēng)險(xiǎn)最終評(píng)估精度見(jiàn)表4。由表4可見(jiàn):PSO-SVM模型對(duì)文山州石漠化風(fēng)險(xiǎn)的評(píng)估精度為90%,高于單獨(dú)SVM模型的86%和PSO-BP模型的87%,表明本文所提出的評(píng)估模型精度更高。
表4 三種模型的評(píng)估精度(%)Table 4 Assessment accuracies of three models
本文采用PSO-SVM模型對(duì)文山州石漠化風(fēng)險(xiǎn)進(jìn)行綜合評(píng)估,經(jīng)PSO算法優(yōu)化的SVM模型參數(shù)為:核函數(shù)參數(shù)g=0.328 21,懲罰因子C=68.392 2。首先將GIS數(shù)據(jù)庫(kù)中的經(jīng)主成分分析后得到3個(gè)主分量指標(biāo)導(dǎo)入MATLAB軟件中,在MATLAB軟件中運(yùn)用PSO-SVM模型進(jìn)行研究區(qū)石漠化風(fēng)險(xiǎn)評(píng)估;再將評(píng)估結(jié)果返回GIS數(shù)據(jù)庫(kù)中,使用專(zhuān)題圖的形式展示石漠化風(fēng)險(xiǎn)程度分布狀況。文山州喀斯特石漠化風(fēng)險(xiǎn)程度綜合評(píng)估結(jié)果見(jiàn)圖8。
圖8 文山州喀斯特石漠化風(fēng)險(xiǎn)程度綜合評(píng)估圖Fig.8 Comprehensive assessment of risk for karst rocky desertification in Wenshan Prefecture
由圖8可以看出:從整體上看,文山州石漠化風(fēng)險(xiǎn)比較嚴(yán)重,需要加大綜合治理的力度,遏制石漠化現(xiàn)象進(jìn)一步向北部擴(kuò)展;文山州南部的石漠化風(fēng)險(xiǎn)明顯較北部嚴(yán)重,東西方向變化趨勢(shì)不明顯,其原因在于北部植被覆蓋度較高,土壤裸露率和基巖裸露率較低。可見(jiàn),加強(qiáng)植樹(shù)造林、防止土壤流失對(duì)于遏制該地區(qū)石漠化擴(kuò)張具有重要的意義。
(1)石漠化風(fēng)險(xiǎn)評(píng)估的最大難點(diǎn)在于原始指標(biāo)數(shù)據(jù)的獲取,本文獲取的10個(gè)原始指標(biāo)數(shù)據(jù)主要來(lái)源于遙感影像和地形圖數(shù)字化,通過(guò)模型評(píng)估和野外實(shí)地調(diào)查,可以看出本文提出的評(píng)估模型可信度較高,評(píng)估結(jié)果從整體上反映了文山州喀斯特石漠化分布現(xiàn)狀,可為該地區(qū)石漠化治理提供依據(jù)。
(2)GIS在專(zhuān)題圖制作、空間分析和可視化方面運(yùn)用廣泛,而SVM在解決小樣本和非線(xiàn)性等模式識(shí)別問(wèn)題中表現(xiàn)出特有優(yōu)勢(shì)。本文將GIS技術(shù)與PSO-SVM模型有機(jī)結(jié)合起來(lái)進(jìn)行喀斯特石漠化風(fēng)險(xiǎn)評(píng)估,表明該模型具有良好的模式識(shí)別和泛化能力,也表現(xiàn)出了優(yōu)越的評(píng)價(jià)性能和空間信息展示能力,適用于對(duì)石漠化風(fēng)險(xiǎn)進(jìn)行有效的評(píng)估。但同時(shí)也存在諸如SVM模型參數(shù)選取困難、計(jì)算量大、判別效率有待進(jìn)一步提高等問(wèn)題。
[1]中國(guó)科學(xué)院地學(xué)部.關(guān)于推進(jìn)西南巖溶地區(qū)石漠化綜合治理的若干建議[J].中國(guó)科學(xué)院院刊,2003,18(4):165-169.
[2]王世杰.喀斯特石漠化概念演繹及其科學(xué)內(nèi)涵的探討[J].中國(guó)巖溶,2002,21(2):101-105.
[3]王世杰,李陽(yáng)兵,李瑞玲.喀斯特石漠化的形成背景、演化與治理[J].第四紀(jì)研究,2003,2(6):657-666.
[4]蘇維詞.中國(guó)西南巖溶山區(qū)石漠化的現(xiàn)狀成因及治理的優(yōu)化模式[J].水土保持學(xué)報(bào),2002,16(2):29-32.
[5]周忠發(fā).貴州高原喀斯特石漠化遙感調(diào)查研究——以貴州省清鎮(zhèn)市為例[J].貴州地質(zhì),2001,18(12):93-98.
[6]閆滿(mǎn)存,王光謙,劉家宏.基于GIS的瀾滄江下游區(qū)滑坡災(zāi)害危險(xiǎn)性分析[J].地理科學(xué),2007,27(3):365-369.
[7]伊元榮,海米提·依米提,王濤,等.主成分分析法在城市河流水質(zhì)評(píng)價(jià)中的應(yīng)用[J].干旱區(qū)研究,2008,25(4):497-501.
[8]鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機(jī)(第2版)[M].北京:科學(xué)出版社,2004:25-30.
[9]Shi,Y.,R.C.Eberhart.A modified particle Swarm optimizer[A].InProceedingsofIEEEInternationalConferenceonEvolutionaryComputation[C].Anchorage,Alaska,USA,1998:69-73.
[10]Wan,V.,W.M.Campbell.Support vector machines for speaker verification and identification[A].InNeuralNetworksforSignalProcessing-ProceedingsoftheIEEESignalProcessingSocietyWorkshop[C].Sydney,Australia,2000:775-784.
[11]唐川,朱大奎.基于GIS技術(shù)的泥石流風(fēng)險(xiǎn)評(píng)價(jià)研究[J].地理科學(xué),2002,22(3):300-304.