国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于集成學習和元胞自動機的城市地理模擬

2016-07-13 08:53張銳豪趙耀龍吳智剛羅文斐
關(guān)鍵詞:決策樹

張銳豪, 趙耀龍, 吳智剛, 羅文斐

(1.華南師范大學地理科學學院,廣州 510631;2.華南師范大學智慧國土與資源環(huán)境研究中心,廣州 510631;3.華南師范大學城市與區(qū)域發(fā)展研究中心,廣州 510631)

?

基于集成學習和元胞自動機的城市地理模擬

張銳豪1,2, 趙耀龍1,2*, 吳智剛3, 羅文斐1,2

(1.華南師范大學地理科學學院,廣州 510631;2.華南師范大學智慧國土與資源環(huán)境研究中心,廣州 510631;3.華南師范大學城市與區(qū)域發(fā)展研究中心,廣州 510631)

摘要:針對常用城市地理模擬系統(tǒng)中元胞自動機轉(zhuǎn)換規(guī)則獲取算法的局限性,提出基于集成學習的元胞自動機,并將其應用于城市建設用地的動態(tài)模擬.以決策樹作為弱分類器,應用集成學習和元胞自動機,模擬了東莞市2001—2005年的建設用地時空格局.精度評估的結(jié)果表明,經(jīng)集成學習后的決策樹比單個決策樹對城市建設用地動態(tài)的模擬精度更高,算法泛化能力更好.

關(guān)鍵詞:集成學習; 元胞自動機; 城市地理模擬; 決策樹

城市是一個典型的動態(tài)空間復雜系統(tǒng), 具有自組織性、自相似性、時空動態(tài)性和非線性等耗散結(jié)構(gòu)特征[1].元胞自動機在復雜動態(tài)系統(tǒng)模擬上具有較強的優(yōu)勢[2],廣泛應用于城市地理模擬[3-7],使用元胞自動機所面臨的核心問題是元胞轉(zhuǎn)換規(guī)則的獲取[8-9].國內(nèi)學者運用決策樹[10]、神經(jīng)網(wǎng)絡[11]、支持向量機[12]等單分類算法來確定元胞的轉(zhuǎn)換規(guī)則,但這種單分類算法在實際地理模擬中存在一定的局限性,主要表現(xiàn)在:(1)當所選取的訓練集中原始樣本數(shù)據(jù)存在噪聲且樣本容量較小時,通過這些數(shù)據(jù)所訓練出來的元胞類型分類器無疑是有缺陷的,會降低分類的精度[13].(2)單分類算法本身也具有一定的局限性.如神經(jīng)網(wǎng)絡算法,通常采用梯度下降法實現(xiàn)錯誤率的最小化,由于訓練方法的原因,算法容易陷入局部最優(yōu),同時算法的收斂速度較慢,需花費大量的時間[14];支持向量機算法則受參數(shù)設置的影響很大[12]845.

利用數(shù)據(jù)挖掘技術(shù)(如決策樹)來完成元胞轉(zhuǎn)換規(guī)則的獲取是一種比較有效的方法.決策樹是常用的數(shù)據(jù)挖掘算法,也是重要的機器學習算法,常用ID3、C4.5和CART等算法生成.決策樹較于傳統(tǒng)的啟發(fā)式算法或智能算法,省去了繁瑣的數(shù)學模型擬合與計算,大大提高了建模效率[10]872,但也存在局限性:(1)當參與決策的結(jié)點或變量增多時,決策樹的錯誤率將會隨之上升[15]10.(2)當用以訓練的數(shù)據(jù)帶有噪聲或缺乏代表性時,會導致決策樹過擬合,增加決策樹誤判率[15]10以及“樹”本身過于龐大,失去了規(guī)則明確、易于理解的優(yōu)點.此時要對決策樹進行剪枝的操作,但若對剪枝率控制不好則易增加誤判率.

針對元胞轉(zhuǎn)換規(guī)則獲取算法中存在的上述局限性,本文嘗試以決策樹算法作為弱分類器,引入集成學習(Ensemble Learning)的方法,突破決策樹獲取元胞轉(zhuǎn)換規(guī)則挖掘的局限性,提高城市地理模擬結(jié)果的精度.

1集成學習與弱分類器

集成學習是機器學習領(lǐng)域中一個重要的熱門研究方向,其核心思想是利用多個相同的學習器或弱分類器針對同一個問題進行學習,例如所有的學習器或弱分類器都是決策樹或神經(jīng)網(wǎng)絡等.因為集成學習采用多個弱分類器的組合,因此可以獲得比僅使用單一學習器更強的泛化能力[16].

根據(jù)對樣本數(shù)據(jù)集處理方式的不同,常用的集成學習算法有Bagging、Boostig和隨機森林等3種(圖1)[16].本文以這3種算法及其相應的弱分類器決策樹為基礎,對應用集成學習算法和單個弱分類器進行城市地理模擬的結(jié)果精度進行對比分析.

圖1 集成學習算法分類

1.1Bagging算法

Bagging 算法旨在通過對原數(shù)據(jù)進行多次Bootstrap抽樣,通過抽樣得到的多個訓練集對弱分類器進行訓練.然后,再將未知樣本代入已訓練好的弱分類器,得到相應的分類結(jié)果,取分類結(jié)果中頻數(shù)最高的類別作為執(zhí)行算法所得到的分類類別.與Boosting算法比較,由于Bagging算法的訓練集之間不存在強的依賴關(guān)系,所以其所集成的弱分類器也不具有相關(guān)關(guān)系,使Bagging算法并行生成,而Boosting算法需串行生成[17].本文的實驗采用經(jīng)典的Bagging算法進行城市地理模擬.

1.2Boosting算法

Boosting算法跟Bagging算法的差異主要體現(xiàn)在訓練集的獲取上.Bagging算法主要通過對原數(shù)據(jù)集進行反復的bootstrap抽樣,各訓練集之間不相關(guān),而Boosting算法抽樣則依賴于前一次訓練所帶來的樣本權(quán)重的調(diào)整,要求增加分類錯誤樣本的權(quán)重,以便再次執(zhí)行迭代這些分類錯誤的樣本被再次訓練,提高對其判別的正確率.因為原始Boosting算法要求在集成學習知道弱分類器的泛化下界,這就造成了原始的Boosting算法難以用于解決實際問題.AdaBoosting算法在Boosting算法家族中最具代表性,相較于原始的Boosting算法,其無需獲取所集成的弱分類器的先驗信息,因而可更好地應用于解決實際問題.近期,LI[18]將基于遷移學習的AdaBoosting算法與Logistic-CA模型結(jié)合用于土地利用模擬,取得了比傳統(tǒng)模擬方法更好的模擬效果.因此,本文將采用AdaBoosting算法來完成相關(guān)的訓練與模擬.

1.3隨機森林算法

隨機森林算法是一種新的機器學習算法,由Bagging集成學習理論與隨機子空間方法相結(jié)合[19].隨機森林算法與Bagging算法、Boosting算法的不同之處在于:使用訓練集完成子決策樹的創(chuàng)建時,需要先隨機在訓練集所包含的M個屬性中選出m個屬性,按照結(jié)點的不純潔度最小原則選出一個最佳屬性進行分裂,并以CART算法完成整棵樹的生長,一般不用進行剪枝過程.其中對于m值的選取,一般有2種方法[20]:

(1)直接取m=1;

(2)取m=int[((lnM)/(ln 2))+1].

這2種方法的取值絕對誤差不會大于1%.為了取值方便,在保證精度的前提下,本文取m=1.

影響隨機森林分類性能的主要因素有森林中各棵決策樹精度與森林中各棵決策樹的相關(guān)性.隨機森林中單棵決策樹的分類精度越高,則隨機森林的分類精度也就越高.而隨機森林中各棵決策樹之間的相關(guān)性越弱,隨機森林的分類效果越好.隨機森林對包含噪聲的數(shù)據(jù)有較好的魯棒性,也能較好地克服過擬合問題.同時,對于參與分類且包含很多變量或?qū)傩缘臄?shù)據(jù)也具有良好的可拓展性與并行性[21].

2基于集成學習的元胞自動機

2.1技術(shù)路線

應用地理模擬系統(tǒng)對城市動態(tài)進行模擬時,通常將研究區(qū)域內(nèi)下一階段元胞的變換狀態(tài)分為2類:轉(zhuǎn)變?yōu)榻ㄔO用地或保持原地類(不轉(zhuǎn)換).本集成模型將這2種變換狀態(tài)作為分類器的分類結(jié)果,各影響因子作為輸入?yún)?shù).輸入各影響因子的圖層到相應的分類器,以此獲得下一階段元胞轉(zhuǎn)換后的狀態(tài)圖,再進行元胞運算即可得到模擬結(jié)果(圖2).

圖2 技術(shù)路線圖

本文使用CART算法(也稱分類回歸樹算法)來生成決策樹,根據(jù)Gini指數(shù)對樹中的非葉子結(jié)點進行二叉分割,相比于ID3與C4.5有更好的抗噪聲性能[22].

基礎數(shù)據(jù)處理與采集以及模擬結(jié)果的可視化主要在ARCGIS軟件中完成,而集成學習與決策樹的訓練以及元胞自動機的模擬及其精度評估由MATLAB完成.各算法模擬結(jié)果的精度評估混淆矩陣以及泛化性能評價采用 Holdout 驗證方法來完成.Holdout 驗證方法的主要思路是將原始數(shù)據(jù)集劃分為兩部分,一部分作為分類器的訓練數(shù)據(jù)集,另一部分作為分類器的評估數(shù)據(jù)集.

2.2數(shù)據(jù)及數(shù)據(jù)處理

以廣東省東莞市作為地理模擬實驗區(qū)域,實驗數(shù)據(jù)見表1.

表1 原始數(shù)據(jù)及來源

引用如下變量作為模型輸入?yún)?shù):

(1)因變量:輸出特征變量作為訓練時分類器所輸出的類別.以東莞市2005年的建設用地圖與2001建設用地圖做柵格運算.當柵格值為1時,代表該柵格在模擬中轉(zhuǎn)化為建設用地;而當柵格值為0時,代表該柵格沒有發(fā)生轉(zhuǎn)化.

(2)區(qū)域空間變量[10]868,包括:與市中心的距離;與鎮(zhèn)中心的距離;與公路的距離;與高速公路的距離;與鐵路的距離.

(3)鄰域變量:各元胞Moore鄰域內(nèi)已城市化的元胞數(shù)量[10]868.

因為原始土地利用現(xiàn)狀圖的數(shù)據(jù)量較大,為了加快模擬速度,本文在處理輸入變量數(shù)據(jù)和因變量的數(shù)據(jù)時,都先用Matlab進行隨機抽樣選出一部分數(shù)據(jù)進行算法訓練.

應用ARCGIS中Raster Calculator工具對東莞市2001、2005年的建成區(qū)與非建成區(qū)的二值圖層進行計算,獲得建設用地的轉(zhuǎn)化圖層,以此作為真實分類結(jié)果.通過矢量化操作完成東莞市道路、鐵路、高速公路、城鎮(zhèn)中心、市行政中心要素圖層的數(shù)字化,借助ARCGIS中的空間分析工具(如Straight Line與Neighborhood Statistics)完成相關(guān)距離要素圖層的獲取與鄰域信息要素圖層的獲?。贛atlab完成訓練與模擬過程,而Matlab不支持直接對柵格圖層直接操作,所以將各要素圖層轉(zhuǎn)成浮點數(shù)的FLT文件,再在Matlab里轉(zhuǎn)化為相應的數(shù)值向量.

3結(jié)果及精度評價

隨機森林算法是集成學習的一個研究熱點,在實際中運用較多,因此本文將先以隨機森林算法代表集成學習與決策樹算法的模擬精度進行比較,對集成學習算法與決策樹算法的模擬精度作初步的判斷,再深入分析3種集成學習算法的模擬結(jié)果.實際應用中,對于分類器訓練樣本量的選取有一定要求.若訓練樣本過小,受所包含的噪聲數(shù)據(jù)影響,不利于比較算法模擬精度.若訓練樣本過大,由于決策樹有過擬合傾向,導致其對于訓練的樣本擬合精度很高,而被用來訓練的樣本在求總體模擬精度會再次被擬合,導致在求總體模擬精度時會出現(xiàn)決策樹模擬的總體精度虛高的現(xiàn)象.因此,在模擬時注意訓練樣本容量選擇,同時,為了檢驗各分類算法的泛化能力,在求模擬結(jié)果的精度評估混淆矩陣時對參與訓練的樣本予以剔除.在模擬東莞2005年的建設用地現(xiàn)狀圖時,將算法訓練樣本容量定為50 000,約為參加模擬所用元胞總數(shù)的20%[10]868.

對于弱分類器CART決策樹的訓練和模擬,為了防止過擬合所帶來的誤差,采用25%的剪枝率[10]868來簡化決策樹.集成學習算法的迭代次數(shù)取為100.分別應用CART算法和集成學習算法得到2005年建設用地模擬結(jié)果與實際情況對比(圖3). 2類算法模擬結(jié)果的精度評價見表2和表3(參考文獻[7]162和文獻[11]24,對表格中“實際”標注的位置進行了修改). 結(jié)合2個算法的城市建設用地模擬結(jié)果圖與現(xiàn)狀圖的可視化對比以及模擬的精度評價結(jié)果可以看出,隨機森林算法的模擬結(jié)果精度要優(yōu)于決策樹CART算法的模擬結(jié)果,表明集成學習后的模型優(yōu)于傳統(tǒng)決策樹模型.

土地利用類型模擬結(jié)果建設用地/個非建設用地/個用戶精度/%建設用地21499640977.04非建設用地4662414634175.84總體精度/%76.11

表3 2005年隨機森林算法模擬精度評估

4討論

4.1不同集成學習算法的模擬效果

由于不同集成學習算法在構(gòu)成原理上有差異,應用于實際模擬中的效果存在差異.將隨機森林算法所用的訓練樣本用以訓練Bagging 與Boosting算法,進行同樣的模擬,獲得這2種算法的2005年東莞市城市建成區(qū)模擬結(jié)果(圖4).

由表4和表5可見,3種集成學習算法獲得的模擬結(jié)果的總體精度均大于決策樹模擬的總體精度,整體集成學習算法的模擬效果要優(yōu)于單個弱分類器的模擬效果,其中隨機森林算法的總體精度最高.在建設用地數(shù)量方面,根據(jù)各算法模擬的精度評價結(jié)果,Bagging算法遠優(yōu)于其他3種算法.Boosting

圖4 Bagging和Boosting算法模擬結(jié)果可視化比較

算法的模擬效果則介于Bagging算法與隨機森林算法之間.集成學習算法在模擬中各有優(yōu)點,在實際應用中應該根據(jù)需要選擇合適的集成學習算法.

4.2集成學習算法中迭代次數(shù)對模擬結(jié)果的影響

3種集成學習算法在訓練中需要考慮迭代次數(shù)選擇,也是弱分類器數(shù)量的選擇.為了確定迭代次數(shù)問題,本文在不同的訓練樣本容量(設為N)下,以迭代次數(shù)為自變量、各集成學習算法的模擬精度為因變量,得到模擬精度與迭代次數(shù)的關(guān)系(圖5).

表4 2005年Bagging算法模擬精度評估

表5 2005年Boosting模擬精度評價

圖5 各集成學習算法模擬精度與迭代次數(shù)的關(guān)系

圖5表明,當訓練樣本容量較小且迭代次數(shù)也較小時,集成學習算法的模擬精度也較低;保持訓練樣本容量不變,增大迭代次數(shù),經(jīng)過約100次的迭代,模擬精度開始趨于穩(wěn)定,之后繼續(xù)增加迭代次數(shù),但模擬精度沒有顯著提高.在訓練樣本較大的情況下,模擬的總體精度趨于穩(wěn)定,與迭代次數(shù)并無顯著的相關(guān)關(guān)系.因此,當訓練樣本量足夠大時,可以通過減少迭代次數(shù)實現(xiàn)減少算法執(zhí)行時間開銷.

迭代次數(shù)是影響集成學習算法效率一個很重要的因素.由集成學習構(gòu)成的原理可知,其執(zhí)行訓練與模擬的過程需要多個弱分類器同時訓練與模擬,則決定了集成學習算法的執(zhí)行時間大大超出單個弱分類算法的時間.因此要優(yōu)化集成學習算法的效率,可以通過減少不必要的迭代次數(shù)來實現(xiàn).結(jié)合以上計算結(jié)果,考慮到要減少集成學習算法的時間開銷,本文取迭代次數(shù)為100.

4.3訓練樣本容量對模擬結(jié)果的影響

為了明確訓練樣本容量對模擬結(jié)果的影響規(guī)律,將3種算法在不同訓練樣本容量下進行訓練,各算法模擬的總體精度見圖6.分析發(fā)現(xiàn),當訓練樣本容量較小時,集成學習算法的模擬精度相較于決策樹算法有顯著的優(yōu)勢.隨著訓練樣本容量的增大,Bagging算法的模擬精度也超過了隨機森林算法,這是因為Bagging算法直接對弱分類器進行組合集成,不對訓練樣本的抽樣與弱分類器的生成進行干預,所以其模擬的特性與決策樹具有一定的相似性:對于原始的訓練樣本擬合效果較好.Boosting算法的模擬精度開始低于決策樹,同時模擬的精度與訓練所用的樣本容量并沒有顯著的相關(guān)關(guān)系,這說明Boosting算法的一個優(yōu)點是其對于算法訓練樣本容量的大小依賴性不強,可以通過采用減少樣本訓練容量來增強算法的執(zhí)行效率.隨著樣本增加,Boosting算法的模擬精度低于決策樹算法,原因可能出自決策樹的過擬合傾向.因為在計算總體精度時,算法訓練所用的樣本也被再次運用于模擬,而決策樹對于這部分的數(shù)據(jù)模擬較好導致了其模擬總體精度虛高;同時,Boosting算法著重于對模擬分類錯誤的對象進行反復訓練,噪聲樣本數(shù)據(jù)的存在以及在訓練中的累積也可能導致最終分類器的分類精度下降.隨著訓練樣本量的增加,Bagging算法與隨機森林算法相較于單棵決策樹模擬精度始終保持顯著的

圖6 不同訓練樣本容量的模擬精度比較

Figure 6Accuracy of simulation in terms of different training sample size

優(yōu)勢,但集成學習的原理決定了執(zhí)行Bagging算法與隨機森林算法的執(zhí)行時間開銷也會相當大,遠大于單棵決策樹.但考慮到Bagging算法與隨機森林算法的算法結(jié)構(gòu)可以并行化處理,所以算法執(zhí)行效率可以得到優(yōu)化,有助于算法應用的推廣.

5結(jié)論

本文以決策樹作為集成學習的弱分類器,將隨機森林、Bagging、Boosting (AdaBoosting)算法等3個常用的集成學習算法與元胞自動機相結(jié)合,以東莞市為例,模擬其2005年建設用地現(xiàn)狀.經(jīng)對模擬結(jié)果精度及其泛化能力進行評估、比較,結(jié)果表明,決策樹算法經(jīng)過集成學習后,模擬結(jié)果的總體精度有較顯著的改善,穩(wěn)定性和泛化能力也有了明顯的提升.其中,隨機森林算法的模擬總體精度最高,而Bagging 算法則在建設用地數(shù)量上的模擬效果最好.Boosting 算法對于訓練樣本容量的依賴性不強,故而有利于增強算法的執(zhí)行效率;同時也有不錯的泛化能力.在實際的應用中,應根據(jù)需要選擇合適的集成學習算法.

集成學習也面臨著算法執(zhí)行的時間開銷要遠大于單個弱分類器,以及如何提高集成學習的效果與如何提高集成學習解決問題的規(guī)模等問題.但隨著并行計算技術(shù)的引入以及相關(guān)技術(shù)的發(fā)展,相信集成學習算法在城市地理模擬領(lǐng)域?qū)鼜V泛地應用.另外,本文僅應用混淆矩陣方法對模擬結(jié)果進行評估,后續(xù)工作中應進一步考慮對建設用地模擬結(jié)果的形態(tài)進行評價.

參考文獻:

[1]劉小平,黎夏,張嘯虎,等.人工免疫系統(tǒng)與嵌入規(guī)劃目標的城市模擬及應用[J].地理學報,2008,63(8): 882-894.

LIU X P, LI X, ZHANG X H, et al. Embedding urban planning objective by integrated artificial immune system and cellular automata[J]. Acta Geographica Sinica, 2008, 63(8): 882-894.

[2]COUCLELIS H.Cellular worlds:a framework for modeling micro-macro dynamics[J].Environment and Planning B, 1985, 17: 585-596.

[3]WHITE R, ENGELEN G. Cellular automata and fractal urban form: a cellular modelling approach to the evolution of urban land-use patters[J]. Environment and Planning A, 1993, 25: 1175-1199.

[4]CLARKE K C, HOPPEN S, GAYDOS L. A self-modifying cellular automaton model of historical urbanization in the San Francisco Bay area[J]. Environment and Planning B, 1997, 24: 247-261.

[5]APOSTOLOS L. Urban sprawl simulation linking macro-scale processes to micro-dynamics through cellular automata, an application in Thessaloniki, Greece[J]. Applied Geography, 2012, 34: 146-160.

[6]龍瀛, 沈振江, 毛其智, 等.基于約束性CA方法的北京城市形態(tài)情景分析[J]. 地理學報,2010,65(6): 643-655.

LONG Y, SHEN Z J, MAO Q Z, et al. Form scenario analysis using constrained cellular automata[J]. Acta Geographica Sinica, 2010, 65(6): 643-655.

[7]黎夏, 葉嘉安. 基于神經(jīng)網(wǎng)絡的單元自動機CA及真實和優(yōu)化的城市模擬[J]. 地理學報,2002,57(2): 159-166.

LIE X,YEH A G-O. Neural-network-based cellular automata for realistic and idealized urban simulation[J]. Acta Geographica Sinica, 2002,57(2): 159-166.

[8]ZHAO Y, MURAYAMA Y. A new method to model neighborhood interaction in cellular automata-based urban geosimulation[J]. Lecture Notes in Computer Science, 2007, 4488: 550-557.

[9]LI X, YEH A G-O. Data mining of cellular automata’s transition rules[J]. International Journal of Geographical Information Science, 2004, 18(8): 723-744.

[10]黎夏, 葉嘉安. 知識發(fā)現(xiàn)及地理元胞自動機[J]. 中國科學:D輯, 2004, 34(9): 865-872.

[11]黎夏, 葉嘉安. 基于神經(jīng)網(wǎng)絡的元胞自動機及模擬復雜土地利用系統(tǒng)[J].地理研究, 2005, 24(1): 19-27.

LI X, YIE A G-O. Cellular automata for simulating complex land use systems using neural networks[J]. Geographical Research, 2005, 24(1): 19-27.

[12]楊青生, 黎夏. 基于支持向量機的元胞自動機及土地利用變化模擬[J].遙感學報, 2007, 10(6): 836-846.

YANG Q S, LI X. Cellular automata for simulating land use changes based on support vector machine[J]. Journal of Remote Sensing, 2006, 10(6): 836.

[13]陳沛玲, 決策樹分類算法優(yōu)化研究[D]. 長沙:中南大學, 2007:5.

[14]樊為民. 基于遺傳算法的神經(jīng)網(wǎng)絡算法研究[J]. 太原師范學院學報(自然科學版), 2005, 3(4): 14.

[15]季桂樹,陳沛玲,宋航.決策樹分類算法研究綜述[J].科技廣場,2007(1):9-12.

JI G S,CHEN P L,SONG H. Study the survey into the decision tree classification algorithms rule[J].Science Mosaic,2007(1):9-12.

[16]張春霞,張講社.選擇性集成學習算法綜述[J].計算機學報,2011,34(8):1400.

ZHANG C X,ZHANG J S. A survey of selective ensemble learning algorithms[J]. Chinese Journal of Computers,2011,34(8):1400.

[17]沈?qū)W華,周志華,吳建鑫,等.Boosting 和 Bagging 綜述[J].計算機工程與應用,2000,36(12):32.

SHEN X H, ZHOU Z H, WU J X, et al. Survey of boosting and bagging[J]. Computer Engineering and Application,2000,36(12):32.

[18]LI X, LIU Y, LIU X, et al. Knowledge transfer and adaptation for land-use simulation with a logistic cellular automaton[J]. International Journal of Geographical Information Science, 2013,27(10):1829-1848.

[19]HO T K. The random subspace method for constructing decision forests[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998,20(8):832-844.

[20]劉艷麗,隨機森林綜述[D].天津:南開大學,2008:15.

[21]方匡南,吳見彬,朱建平,等.隨機森林方法研究綜述[J].統(tǒng)計與信息論壇,2012,26(3):34.

[22]丁雍,李小霞.基于Adaboost和CART結(jié)合的優(yōu)化分類算法[J].微型機與應用,2011,30(23):46.

DING Y,LI X X. Optimization of classification based on combination of Adaboost and CART algorithm[J]. Microcomputer & Its Applications,2011,30(23):46.

【中文責編:莊曉瓊英文責編:肖菁】

Urban Geosimulation Based on Ensemble Learning and Cellular Automata

ZHANG Ruihao1,2, ZHAO Yaolong1,2*, WU Zhigang3, LUO Wenfei1,2

(1. School of Geography, South China Normal University, Guangzhou 510631, China;2. Center for Smart Land and Environmental Research, South China Normal University, Guangzhou 510631, China;3. Center for Regional and Urban Development Research, South China Normal University, Guangzhou 510631, China)

Abstract:In order to alleviate the limitation of obtaining transformation rules in GIS using cellular automata, a cellular automata based on ensemble learning is proposed for simulating urban dynamic geosimulation. Decision tree is used as weak classifier in the ensemble learning and cellular automata to simulate the urban spatio-temporal dynamics in Dongguan from 2001 to 2005. The accuracy results show that the simulation of ensemble learning is better than using decision tree alone for urban dynamic geosimulation. The new method can obtain better generalization ability.

Key words:ensemble learning; cellular automata; urban geosimulation; decision tree

收稿日期:2014-11-05《華南師范大學學報(自然科學版)》網(wǎng)址:http://journal.scnu.edu.cn/n

基金項目:“十二五”國家科技支撐計劃課題(2012BAJ22B06)

*通訊作者:趙耀龍,教授, Email: yaolong@scnu.edu.cn.

中圖分類號:P209;TU984

文獻標志碼:A

文章編號:1000-5463(2016)01-0101-07

猜你喜歡
決策樹
基于決策樹和神經(jīng)網(wǎng)絡的高血壓病危險因素研究
基于梯度提升決策樹的量子科學實驗衛(wèi)星光學實驗預測
基于節(jié)點匹配代價優(yōu)化的隨機森林算法
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
面向分布式數(shù)據(jù)流大數(shù)據(jù)分類的多變量決策樹
決策樹多元分類模型預測森林植被覆蓋
基于決策樹的出租車乘客出行目的識別
基于模糊關(guān)聯(lián)規(guī)則和決策樹的圖像自動標注
基于肺癌CT的決策樹模型在肺癌診斷中的應用