宋長江 孫旭東 藺雪瑩 劉兆剛
摘 要:通過調(diào)查和查閱資料收集帽兒山地區(qū)水曲柳、黃菠蘿、胡桃楸3大珍貴硬闊葉樹種的地理分布數(shù)據(jù),利用GIS技術(shù)和隨機(jī)森林模型,結(jié)合目標(biāo)樹種小班的地形和土壤數(shù)據(jù),開展帽兒山地區(qū)3大珍貴硬闊葉樹種適宜性分布研究。結(jié)果顯示,10組數(shù)據(jù)集的隨機(jī)森林模型準(zhǔn)確率均在70%以上,當(dāng)Ntree(森林中決策樹的數(shù)量)=500時(shí)隨機(jī)森林模型的平均準(zhǔn)確率為75.2%,當(dāng)Ntree=1 000時(shí)隨機(jī)森林模型的平均準(zhǔn)確率為75.4%,并且10組數(shù)據(jù)集的最佳臨界值(AUC)均在0.7以上,其平均AUC為0.746。在10組數(shù)據(jù)集中,海拔的平均降低精度和平均降低基尼系數(shù)最大,坡位的平均降低精度最小,地貌的平均降低基尼系數(shù)最小,目標(biāo)樹種在海拔200~300 m范圍內(nèi)生長適宜性最高,在海拔高于300 m之后隨著海拔的升高,目標(biāo)樹種生長的適宜性越低;在坡度為0°~10°與30°~35°2個(gè)范圍內(nèi)生長適宜性最高,隨著坡位由上到下的變化,目標(biāo)樹種生長適宜性越來越高;在西南、南、北這3個(gè)方位的生長適宜性最高;在平原地區(qū)的生長適宜性最高;在A層(淋溶層)厚度大于15 cm之后目標(biāo)樹種的生長適宜性越來越高;當(dāng)AB(淋溶層和淀積層)層厚度在10~25 cm范圍內(nèi)最適宜目標(biāo)樹種的生長。研究結(jié)果證明,影響帽兒山地區(qū)3大珍貴硬闊葉樹種適宜性分布的環(huán)境因子重要性排序,按照由高到低依次為海拔、AB層厚度、坡度、坡向、A層厚度、地貌和坡位。其主要適宜分布在帽兒山地區(qū)的南部和西北部區(qū)域,海拔200~300 m范圍內(nèi),坡度平緩,土層厚度在15~25 cm,坡向?yàn)槟媳狈较?,地貌為平原,坡位為下坡位的地區(qū)。
關(guān)鍵詞:隨機(jī)森林模型;硬闊葉樹種;適宜性評價(jià);重要性排序;機(jī)器學(xué)習(xí)
中圖分類號:S718 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-8023(2023)03-0064-09
Abstract:The geographic distribution data of the three precious hardwood broad-leaved tree species, Fraxinus mandshurica, Juglans mandshurica and Phellodendron amurense in the Maoershan area were collected through investigation and consulting data. And the suitability distribution of three precious hardwood broad-leaved tree species in Maoershan area was studied by using GIS technology and random forest model, combined with the topographic and soil data of the target tree species subcompartment. Results showed that, the accuracy rates of the random forest models in the ten datasets were all above 70%. When Ntree(number of trees grown)=500, the average accuracy of the random forest model was 75.2%; when Ntree=1 000, the average accuracy of the random forest model was 75.4%, and the AUC of the group datasets were all above 0.7, and the average AUC was 0.746. In the ten datasets, mean decrease accuracy and mean decrease Gini of altitude were the largest, mean decrease accuracy of slope position was the smallest, and mean decrease Gini of landform was the smallest. The target tree species had the highest growth suitability within the altitude range of 200-300 m. As the altitude increased above 300 m, the growth suitability of the target tree species was lower as the altitude increased. When the slope was 0°-10° and 30°-35°, the growth suitability was the highest in the range. As the slope position changed from top to bottom, the growth suitability of the target tree species was getting higher and higher. The growth suitability in the three directions of southwest, south and north was the highest. The growth suitability was highest in plain areas. When A layer (eluvial horizon) thickness was greater than 15 cm, the growth suitability of the target tree species became higher and higher. When AB layer (eluvial horizon and deposition layer) thickness was in the range of 10-25 cm, the growth of the target tree species was the most suitable. The order of affecting environmental factors importance sorting of the suitability distribution of the three precious hardwood broad-leaved tree species in the Maoershan area was altitude, AB layer thickness, slope, slope aspect, A layer thickness, landform and slope position in descending order. They were mainly suitable for distribution in the southern and northwestern areas of Maoer Mountain, with an altitude of 200-300 m, a gentle slope, a soil layer thickness of 15-25 cm, a north-south aspect, a plain landform, and a downhill position.
Keywords:Random forest model; hardwood broad-leaved tree species; suitability evaluation; importance ranking; machine learning
基金項(xiàng)目:中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目(2572021DT07)
第一作者簡介:宋長江,碩士研究生。研究方向?yàn)樯挚沙掷m(xù)經(jīng)營。E-mail: 2294256769@qq.com
*通信作者:劉兆剛,博士,教授。研究方向?yàn)樯挚沙掷m(xù)經(jīng)營。E-mail: lzg19700602@163.com
0 引言
水曲柳(Fraxinus mandshurica)、黃菠蘿(Phellodendron amurense)和胡桃楸(Juglans mandshurica)是中國東北地區(qū)珍貴的3大硬闊葉樹種,其木材堅(jiān)硬致密,紋理美觀,具有很高的經(jīng)濟(jì)價(jià)值和生態(tài)價(jià)值[1-2],本研究主要目標(biāo)是研究水曲柳、胡桃楸、黃菠蘿3大珍貴硬闊葉樹種的適宜性分布區(qū)域,其研究地區(qū)位于東北林業(yè)大學(xué)帽兒山實(shí)驗(yàn)林場,該地區(qū)平均海拔300 m,屬溫帶大陸性季風(fēng)氣候,地帶性土壤為暗棕壤,植被屬長白植物區(qū)系[3-5]。因?yàn)闃淠镜纳L是多種因素的綜合作用,所以如何科學(xué)地對3大珍貴硬闊葉樹種進(jìn)行適地適樹地種植非常重要。
樹種的生長首先在于與周邊環(huán)境的適宜程度,通過分析樹種與環(huán)境因子之間的關(guān)系來判斷該樹種的適宜性分布區(qū)域,目前在方法的選擇上,逐步從定性的經(jīng)驗(yàn)總結(jié)向定量的數(shù)學(xué)模型方法靠近,比如使用隨機(jī)森林模型來進(jìn)行擬合研究。在國外,Kumar等[6]研究美國不同地區(qū)不同樹種的發(fā)生和生長性能,完成了現(xiàn)有樹木范圍的適宜性地圖;Toledo-Aceves等[7]選取62塊樣地,研究了鳳梨科植物在墨西哥韋拉克地區(qū)的樹種適宜性;Murgante等[8]利用灰色關(guān)聯(lián)分析法確定評價(jià)因子權(quán)重,并通過GIS技術(shù)研究紅楓適宜性。在國內(nèi),陳艷瑞等[9]以新疆準(zhǔn)噶爾南緣為研究區(qū),采用指數(shù)和法評價(jià)水曲柳、夏橡等樹種適宜性;尚雪等[10]通過遙感技術(shù)并結(jié)合GIS技術(shù)對川產(chǎn)道地藥材羌活的適宜性空間分布進(jìn)行研究;趙文龍等[11]利用最大熵模型研究不同基原的中藥川貝母生境適宜性分布。
隨機(jī)森林模型本質(zhì)為集成學(xué)習(xí)的一種,可用于回歸和分類,是以決策樹為基礎(chǔ)的更高級的算法模型。隨機(jī)森林模型是以隨機(jī)的模式構(gòu)建一個(gè)由許多相互不關(guān)聯(lián)的決策樹組成的森林,通過建立n個(gè)模型的組合來解決單一問題。隨機(jī)森林模型從首次被提出至今,被許多學(xué)者在諸多領(lǐng)域展開應(yīng)用,并且有了優(yōu)秀的表現(xiàn)。Peters等[12]采用隨機(jī)森林模型,研究比利時(shí)地區(qū)11種水生植物的潛在地理分布格局;Maxwell等 [13]通過隨機(jī)森林模型,繪制了基于地形變量西弗吉尼亞州森林沼澤濕地產(chǎn)生的概率;Sahragard等[14]運(yùn)用隨機(jī)森林模型模擬預(yù)測牧區(qū)植物的生境適宜性;Cutler等[15]基于隨機(jī)森林模型研究罕見地衣植物入侵,得到了高精度的分類結(jié)果;沈師濛[16]基于隨機(jī)森林模型對杉木、桉樹和青岡3種國家儲備林樹種進(jìn)行了分布預(yù)測與適宜性評價(jià);蔣育昊[17]在全國范圍內(nèi)利用隨機(jī)森林模型預(yù)測紅松的潛在分布,并對遼寧省內(nèi)紅松進(jìn)行適宜性評價(jià)研究;汪康寧等[18]通過隨機(jī)森林算法,利用地面蓄積量采樣點(diǎn)數(shù)據(jù),建立涼水自然保護(hù)區(qū)蓄積量反演模型;姚雄等[19]使用隨機(jī)森林算法構(gòu)建了林地葉面積指數(shù)估算模型;高若楠等[20]利用隨機(jī)森林回歸算法,建立了闊葉、蒙古櫟混交林及針闊混交林的立地質(zhì)量評價(jià)模型,并且對不同立地條件下的造林地進(jìn)行了生產(chǎn)潛力預(yù)測。本研究以帽兒山地區(qū)3大硬闊葉樹種的空間分布數(shù)據(jù)、土壤數(shù)據(jù)和地形數(shù)據(jù)為基礎(chǔ),采用隨機(jī)森林模型和GIS空間分析技術(shù)開展該樹種(組)的適宜性分布研究,為3大硬闊葉樹種可持續(xù)經(jīng)營提供參考依據(jù)。
1 研究區(qū)域概況
東北林業(yè)大學(xué)帽兒山林場位于黑龍江省尚志市境內(nèi),距哈爾濱市主城區(qū)80 km,屬長白山系張廣才嶺西坡小嶺的余脈,地理坐標(biāo)范圍為127°29′~127°44′ E, 45°14′~45°29′ N,林場總面積26 496 hm2,有301國道和帽兒山火車站,交通非常便利。地貌屬低山丘陵區(qū),平均海拔300 m,地勢由南向北逐漸升高,最高山峰為帽兒山,海拔805 m。帽兒山地區(qū)為溫帶濕潤地區(qū),屬大陸性季風(fēng)氣候,年平均氣溫2.8 ℃,年降水量為723 mm,降雨主要集中于7-8月份。植被屬長白植物區(qū)系,原始地帶性頂級群落為紅松闊葉林,但經(jīng)多年無序采伐,原始植被發(fā)生了逆向演替,已退化為典型的闊葉次生林。森林覆蓋率約為80%,森林總蓄積量為3 500 000 m3。
2 研究方法
2.1 數(shù)據(jù)來源與處理
本研究數(shù)據(jù)來源于東北林業(yè)大學(xué)帽兒山林場二類調(diào)查數(shù)據(jù),共計(jì)2 510條數(shù)據(jù),包含林層、地類、權(quán)屬、面積、散生木、郁閉度、組成樹種、樹種結(jié)構(gòu)、優(yōu)勢樹種、地形地貌、土壤類型、植被類型、災(zāi)害類型、林層結(jié)構(gòu)和小班蓄積量等信息。提取的信息主要包括坡度、坡位、坡向、海拔、地貌、A層(淋溶層)厚度和AB層(淋溶層和淀積層)厚度。使用caret包,將數(shù)據(jù)分為10組,分別為A1—A10,其基本特征見表1。
從地形數(shù)據(jù)中獲取地形因子,主要包括經(jīng)緯度、海拔、坡度、坡位、坡向、坡形、坡長及地形起伏度等因子,本研究使用海拔、坡度、坡位、坡向和地貌共5種基本因子。地形因子通過改變土壤、水文和光照等自然條件間接作用于樹木,從而影響樹木的生長發(fā)育與空間分布。其中,海拔會影響降雨量、土壤pH和空氣濕度等因素;坡度會影響土壤侵蝕強(qiáng)度、土壤有機(jī)質(zhì)和土壤含水量等因素;并且坡度還會同坡向、坡位一起影響日照時(shí)數(shù)、輻射強(qiáng)度,從而間接作用于土壤理化性質(zhì)。從土壤數(shù)據(jù)中獲取土壤因子,土壤因子主要包括A層厚度、AB層厚度,這2個(gè)土壤因子會直接影響到泥土中水、氣的含量以及植被需要的養(yǎng)分含量,同時(shí)也會影響根系的成長以及樹木抗風(fēng)能力,對樹種組成、林木生長和林地生產(chǎn)力等都有一定的作用。帽兒山地區(qū)坡度、坡位、海拔和坡向的空間分布如圖1所示。
2.2 研究方法
2.2.1 模型建立
隨機(jī)森林算法是以決策樹為基學(xué)習(xí)器,將最初的許多弱學(xué)習(xí)機(jī)形成強(qiáng)學(xué)習(xí)機(jī)。算法的處理過程類似Bagging的擴(kuò)展變體,倘若存在n個(gè)特征數(shù)為m的樣本案例,需要運(yùn)用Bootstrap完成數(shù)據(jù)集的采樣工作,每次隨機(jī)抽取的n個(gè)樣本當(dāng)作每棵決策樹的訓(xùn)練數(shù)據(jù)集。在節(jié)點(diǎn)處隨機(jī)抽取m個(gè)變量,在此過程中尋找可以用于劃分的最優(yōu)預(yù)測屬性;隨后,在不進(jìn)行剪枝的情況下,形成單棵決策樹;最終,將從每棵決策樹中獲得分類預(yù)測結(jié)果。如果是回歸問題,最終的預(yù)測結(jié)果是全部預(yù)測結(jié)果的平均值或者加權(quán)平均數(shù)值;如果是分類問題,最后的預(yù)測結(jié)果是預(yù)測類別眾數(shù)。
1)環(huán)境因子的共線性診斷。雖然多重共線性并不影響隨機(jī)森林模型的預(yù)測能力,但是會影響數(shù)據(jù)的解釋性。隨機(jī)森林可以給出特征因子的重要性,但多重共線性會對其產(chǎn)生影響,具體來說就是具有多重共線性的特征因子的重要性會相互抵消。
2)劃分訓(xùn)練集與測試集。為了評估隨機(jī)森林算法的區(qū)分度、穩(wěn)定性和準(zhǔn)確性等模型效果,往往會將樣本拆分為訓(xùn)練集和測試集,本研究使用K折交叉驗(yàn)證法,K折交叉驗(yàn)證法主要是將訓(xùn)練集數(shù)據(jù)劃分為K份,利用其中的K-1份用來訓(xùn)練,1份用來測試,最后取平均測試誤差作為泛化誤差。這樣做的好處是,訓(xùn)練集的所有樣本都必然會成為訓(xùn)練數(shù)據(jù)同時(shí)也必然有機(jī)會成為一次測試集,可以更好地利用訓(xùn)練集數(shù)據(jù)。
利用從二類調(diào)查數(shù)據(jù)提取的目標(biāo)樹種小班地形數(shù)據(jù)中的坡度、坡位、坡向、海拔、地貌、目標(biāo)樹種小班土壤數(shù)據(jù)中的A層厚度和AB層厚度共7種環(huán)境因子,將這些環(huán)境因子作為建立隨機(jī)森林模型的自變量;利用水曲柳、黃菠蘿和胡桃楸3大目標(biāo)樹種分布數(shù)據(jù)以及非目標(biāo)樹種分布數(shù)據(jù)匯總成數(shù)據(jù)集,其中有目標(biāo)樹種分布的點(diǎn)標(biāo)記為1,沒有目標(biāo)樹種分布的點(diǎn)標(biāo)記為0,以此來作為建立隨機(jī)森林模型的因變量來建立隨機(jī)森林模型。主要建模過程通過R語言的randomForest包完成。
2.2.2 模型擬合與檢驗(yàn)
建立隨機(jī)森林模型時(shí),A1—A10每組數(shù)據(jù)分別做一次測試集,其余組數(shù)據(jù)即為訓(xùn)練集,例如將A1作為測試集時(shí),A2—A10即為訓(xùn)練集。建立隨機(jī)森林模型具體步驟如下:由于建立模型所需的試驗(yàn)數(shù)據(jù)中有7個(gè)環(huán)境因子和2 259條分布數(shù)據(jù),在2 259條分布數(shù)據(jù)中進(jìn)行隨機(jī)抽?。ㄓ蟹呕兀?,得到Ntree(森林中決策樹的數(shù)量)個(gè)樣本,作為樣本集,然后可以得到Ntree棵決策樹。通常情況下Ntree默認(rèn)為500,但Grimm等[21]研究發(fā)現(xiàn),當(dāng)Ntree=1 000時(shí),模型誤差曲線最小且穩(wěn)定,因此為了獲得更精確的模型結(jié)果,本研究首先選取Ntree=500與Ntree=1 000進(jìn)行建模。其次每棵決策樹在進(jìn)行節(jié)點(diǎn)分列時(shí)隨機(jī)選取Mtry(在每個(gè)節(jié)點(diǎn)上為分裂采樣的預(yù)測數(shù))個(gè)環(huán)境因子,由于本研究使用7個(gè)環(huán)境因子,所以將Mtry賦值為2進(jìn)行最合理的分解組合。最后,隨機(jī)森林模型由Ntree棵決策樹組成,Ntree棵決策樹獲得的分類結(jié)果中的眾數(shù)即為最后的試驗(yàn)結(jié)果。一些經(jīng)過Ntree次抽樣后依然沒有被抽到的數(shù)據(jù),就會自動(dòng)組成測試數(shù)據(jù),從而對隨機(jī)森林模型的樣本精度進(jìn)行測試,這些數(shù)據(jù)又被稱為袋外數(shù)據(jù)(Out of Bag, OOB),OOB展示了隨機(jī)森林模型的錯(cuò)誤率。模型建立成功后,利用測試集對訓(xùn)練集進(jìn)行預(yù)測檢驗(yàn),將預(yù)測結(jié)果數(shù)據(jù)與實(shí)際結(jié)果數(shù)據(jù)進(jìn)行比對,得出每個(gè)模型具體的準(zhǔn)確率。通過10組數(shù)據(jù)集的隨機(jī)森林模型來繪制受試者工作特征(ROC)曲線,ROC曲線是用來查出分類器在某個(gè)閾值時(shí)對樣本的識別能力,有利于對隨機(jī)森林模型的擬合程度進(jìn)行檢驗(yàn),在試驗(yàn)中使用ROC曲線,曲線越是靠近左上角,試驗(yàn)的偽陽性率(False Positive Rate,F(xiàn)PR)越高和越低,即靈敏度越高,誤判率越低,則診斷方法的性能越好。在ROC曲線最靠近左上角的點(diǎn),這個(gè)點(diǎn)為最佳臨界點(diǎn),點(diǎn)上有最佳臨界值即為AUC值,AUC值越大,分類正確率越高。
3 結(jié)果與分析
3.1 隨機(jī)森林模型
使用R語言中car包,計(jì)算膨脹因子法(VIF)對數(shù)據(jù)進(jìn)行共線性診斷,在7個(gè)自變量中VIF最大值為1.540 3,遠(yuǎn)小于10,因此因子間不存在多重共線性(表2)。十折交叉驗(yàn)證結(jié)果表明,10組數(shù)據(jù)集隨機(jī)森林模型的準(zhǔn)確率均大于70%(表3),且當(dāng)Ntree=500時(shí)隨機(jī)森林模型的平均準(zhǔn)確率為75.2%;當(dāng)Ntree=1 000時(shí)隨機(jī)森林模型的平均準(zhǔn)確率為75.4%,表明隨機(jī)森林模型預(yù)測準(zhǔn)確率良好。
經(jīng)過計(jì)算得出10組數(shù)據(jù)集所建立的隨機(jī)森林模型ROC曲線AUC均值為0.746,其中A1最大,為0.778;A4最小,為0.709(表4)。
3.2 環(huán)境因子重要性排序
通過10組數(shù)據(jù)集的隨機(jī)森林模型來輸出影響帽兒山地區(qū)3大珍貴硬闊葉樹種的環(huán)境因子重要性排序,見表5。平均降低精度(Mean Decrease Accuracy, MDA)與平均降低基尼系數(shù)(Mean Decrease Gini, MDG)是判斷因子重要性的重要指標(biāo),其中MDA代表隨機(jī)森林模型預(yù)測準(zhǔn)確性程度,數(shù)值大小與環(huán)境因子的重要性成正比關(guān)系;MDG則是代表分類樹上的節(jié)點(diǎn)觀測值與環(huán)境因子的異質(zhì)性影響,進(jìn)而比較環(huán)境因子的重要性,數(shù)值大小也與環(huán)境因子的重要性成正比關(guān)系。綜合10組試驗(yàn)結(jié)果得出影響目標(biāo)樹種適宜性生長的環(huán)境因子重要性排序由高到低依次為海拔、AB土層厚度、坡度、坡向、A層厚度、地貌和坡位。
3.3 環(huán)境因子的部分依賴圖
通過10組數(shù)據(jù)集的隨機(jī)森林模型,利用R語言中的rfUtilities包來輸出影響帽兒山地區(qū)3大珍貴硬闊葉樹種的環(huán)境因子部分依賴圖,如圖2所示。部分依賴圖會展示1個(gè)或2個(gè)特征對模型預(yù)測的邊際效應(yīng),本研究通過觀察特征和預(yù)測目標(biāo)之間的一維或二維關(guān)系圖確定特征與目標(biāo)的關(guān)系,即保持其他所有特征不變,哪個(gè)特征對留存的提升影響最大,通過對圖2的分析從而得出目標(biāo)樹種的適宜性分布環(huán)境。在海拔200 ~300 m范圍內(nèi)最適宜目標(biāo)樹種的生長,在海拔高于300 m之后隨著海拔的升高,目標(biāo)樹種生長的適宜性越低。在坡度為0°~10°與30°~35°這2個(gè)范圍內(nèi)最適宜目標(biāo)樹種的生長,在坡度為15°~25°范圍內(nèi)目標(biāo)樹種的生長適宜性很低。圖2(c)通過分析可得出目標(biāo)樹種隨著坡位由上到下的變化,生長適宜性越來越高。圖2(d)通過分析可得出目標(biāo)樹種在西南、南、北這3個(gè)方位的生長適宜性最高,在東北方位的生長適應(yīng)性最低。圖2(e)通過分析可得出在平原地區(qū)的生長適宜性最高,在丘陵和山地地區(qū)的生長適宜性適中,在低山地區(qū)的生長適宜性最低。在A層厚度大于15 cm之后目標(biāo)樹種的生長適宜性越來越高,在5~10 cm的厚度范圍內(nèi)生長的適宜性很低。當(dāng)AB層厚度在10~25 cm范圍內(nèi)最適宜目標(biāo)樹種的生長,在厚度超過25 cm后目標(biāo)樹種的適宜性迅速降低。綜合以上因素,在ArcGIS中繪制帽兒山地區(qū)珍貴硬闊葉樹種分布,如圖3所示。從圖3可以看出帽兒山地區(qū)不同區(qū)域下珍貴硬闊葉樹種分布適宜性,珍貴硬闊葉樹種適宜分布區(qū)總面積為10 421.31 hm2,占帽兒山實(shí)驗(yàn)林場總面積的39.39%,其中珍貴硬闊葉樹種分布最優(yōu)適宜區(qū)、次適宜區(qū)、一般適宜區(qū)面積分別為97.06、7 293.64和3 030.61 hm2。珍貴硬闊葉樹種適宜分布區(qū)呈鑲嵌分布,主要分布在帽兒山北部,并且適宜分布區(qū)從北至南面積逐漸減少,但最優(yōu)適宜區(qū)主要位于帽兒山中部區(qū)域,可能是由于海拔的影響。
4 結(jié)論
本研究以東北林業(yè)大學(xué)帽兒山林場作為研究區(qū),以水曲柳、胡桃楸和黃菠蘿3大珍貴硬闊葉樹種作為研究對象。利用二類調(diào)查數(shù)據(jù),以目標(biāo)樹種分布小班地形數(shù)據(jù)和目標(biāo)樹種分布小班土壤數(shù)據(jù)作為輸入因子,以目標(biāo)樹種分布數(shù)據(jù)作為輸出因子,建立基于隨機(jī)森林模型的目標(biāo)樹種適宜性評價(jià)體系。主要利用坡度、坡位、坡向、海拔、地貌、A層厚度和AB層厚度共7種環(huán)境因子構(gòu)建隨機(jī)森林模型,輸出影響目標(biāo)樹種適宜性生長的環(huán)境因子重要性排序,根據(jù)隨機(jī)森林模型輸出的局部依賴圖進(jìn)行分析,從而得出影響帽兒山地區(qū)珍貴硬闊葉樹種適宜性分布的影響機(jī)制。主要結(jié)論如下。
1)綜合隨機(jī)森林模型的結(jié)果,對于影響帽兒山地區(qū)的3大珍貴硬闊葉樹種適宜性分布的環(huán)境因子重要性排序由高到低依次為海拔、土層厚度、坡度、坡向、A層厚度、地貌和坡位。海拔、土層厚度和坡度3種環(huán)境因子對3大珍貴硬闊葉樹種的適宜性分布影響最大。
2)綜合具體環(huán)境因子的部分依賴圖,帽兒山地區(qū)的3大珍貴硬闊葉樹種適宜分布在海拔200~300 m、坡度平緩、土層厚度在15~25 cm、坡向?yàn)槟媳狈较?、地貌為平原、坡位為下坡位的地區(qū)。
3)根據(jù)東北林業(yè)大學(xué)帽兒山林場地圖,結(jié)合具體的環(huán)境影響因素,得出帽兒山地區(qū)3大珍貴硬闊葉樹種適宜生長的分布區(qū)域?yàn)槊眱荷降哪喜亢臀鞅辈康貐^(qū),不適宜樹種分布的區(qū)域?yàn)槊眱荷降貐^(qū)的東北部地區(qū)。
【參 考 文 獻(xiàn)】
[1]舒蘭,劉兆剛,董靈波.帽兒山天然次生林內(nèi)主要木本植物空間格局及更新特點(diǎn)[J].應(yīng)用生態(tài)學(xué)報(bào),2019,30(6):1945-1955.
SHU L, LIU Z G, DONG L B. Spatial pattern and regeneration characteristics of main woody species in natural secondary forest in Maoershan, Northeast China[J]. Chinese Journal of Applied Ecology, 2019, 30(6): 1945-1955.
[2]魏紅洋,張一帆,董靈波,等.帽兒山主要林分類型空間結(jié)構(gòu)狀態(tài)綜合評價(jià)[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2021,41(10):131-139.
WEI H Y, ZHANG Y F, DONG L B, et al. Comprehensive evaluation of spatial structure state for the main forest types in Maoershan Mountain[J]. Journal of Central South University of Forestry & Technology, 2021, 41(10): 131-139.
[3]袁志聰.人工智能:隨機(jī)森林技術(shù)分析[J].科技創(chuàng)新與應(yīng)用,2020(6):151-152.
YUAN Z C. Artificial intelligence: analysis of random forest technology[J]. Technology Innovation and Application, 2020(6): 151-152.
[4]方匡南,吳見彬,朱建平,等.隨機(jī)森林方法研究綜述[J].統(tǒng)計(jì)與信息論壇,2011,26(3):32-38.
FANG K N, WU J B, ZHU J P, et al. A review of technologies on random forests[J]. Statistics & Information Forum, 2011, 26(3): 32-38.
[5]董師師,黃哲學(xué).隨機(jī)森林理論淺析[J].集成技術(shù),2013,2(1):1-7.
DONG S S, HUANG Z X. A brief theoretical overview of random forests[J]. Journal of Integration Technology, 2013, 2(1): 1-7.
[6] KUMAR J, HARBROVE W, HOFFMAN F M, et al. Imputation of continuous tree suitability over the continental United States from sparse measurements using associative clustering[C]// 98th ESA Annual Convention 2013, 2013.
[7]TOLEDO-ACEVES T, GARCIA-FRANCO J G, FLORES-PALACIOS A. Do cloud forest tree species differ in their suitability as a substrate for epiphytic bromeliads?[J]. Plant Ecology, 2017, 218(5): 541-546.
[8]MURGANTE B, GUISEPPE L C. GIS and red maple for the land suitability analysis[J]. Lecture Note in Computer Science, 2001, 25(3): 536-545.
[9]陳艷瑞,劉康,陳啟民,等.準(zhǔn)噶爾盆地南緣防護(hù)林樹種適宜性評價(jià)[J].干旱區(qū)資源與環(huán)境,2011,25(11):152-156.
CHEN Y R, LIU K, CHEN Q M, et al. Suitability evaluation on trees species of shelter belt on the southern edge of Xinjiang Junggar Basin[J]. Journal of Arid Land Resources and Environment, 2011, 25(11): 152-156.
[10]尚雪,董麗君,文路軍,等.基于遙感與GIS技術(shù)的四川省羌活資源適宜性分布研究[J].中國中藥雜志,2015,40(13):2553-2558.
SHANG X, DONG L J, WEN L J, et al. Study on suitable distribution areas of Notopterygium incisum in Sichuan Province based on remote sensing and GIS[J]. China Journal of Chinese Materia Medica, 2015, 40(13): 2553-2558.
[11]趙文龍,陳紅剛,林麗,等.不同基原的中藥川貝母生境適宜性分布[J].生態(tài)學(xué)雜志,2018,37(4):1037-1042.
ZHAO W L, CHEN H G, LIN L, et al. Distribution of habitat suitability for different sources of Fritillariae cirrhosae Bulbus[J]. Chinese Journal of Ecology, 2018, 37(4): 1037-1042.
[12]PETERS J, DE BAETS B, VERHOEST N E C, et al. Random forests as a tool for ecohydrological distribution modelling[J]. Ecological Modelling, 2007, 207(2/3/4): 304-318.
[13]MAXWELL A E, WARNER T A, STRAGER M P. Predicting palustrine wetland probability using random forest machine learning and digital elevation data-derived terrain variables[J]. Photogrammetric Engineering & Remote Sensing, 2016, 82(6): 437-447.
[14]SAHRAGARD H P, AJORLO M, KARAMI P. Modeling habitat suitability of range plant species using random forest method in arid mountainous rangelands[J]. Journal of Mountain Science, 2018, 15(10): 2159-2171.
[15]CUTLER D R, EDWARDS T C JR, BEARD K H, et al. Random forests for classification in ecology[J]. Ecology, 2007, 88(11): 2783-2792.
[16]沈師濛.基于隨機(jī)森林模型的國家儲備林樹種分布預(yù)測與評價(jià):以貴州省冊亨縣為例[D].北京:北京林業(yè)大學(xué),2019.
SHEN S M. Prediction and evaluation of tree species distribution in national reserve forest based on stochastic forest model-a case study of Ceheng County, Guizhou Province[D]. Beijing: Beijing Forestry University, 2019.
[17]蔣育昊.基于隨機(jī)森林模型的紅松潛在分布預(yù)測及適宜性評價(jià)[D].北京:中國林業(yè)科學(xué)研究院,2017.
JIANG Y H. Potential distribution prediction and suitability evaluation of Korean pine based on random forest model[D]. Beijing: Chinese Academy of Forestry, 2017.
[18]汪康寧,馬婷,呂杰.基于隨機(jī)森林算法的涼水自然保護(hù)區(qū)蓄積量反演研究[J].西南林業(yè)大學(xué)學(xué)報(bào),2016,36(5):125-129,157.
WANG K N, MA T, LYU J. Stock volume estimation research based on random forest algorithm in Liangshui nature reserve[J]. Journal of Southwest Forestry University, 2016, 36(5): 125-129, 157.
[19]姚雄,余坤勇,楊玉潔,等.基于隨機(jī)森林模型的林地葉面積指數(shù)遙感估算[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(5):159-166.
YAO X, YU K Y, YANG Y J, et al. Estimation of forest leaf area index based on random forest model and remote sensing data[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(5): 159-166.
[20]高若楠,謝陽生,雷相東,等.基于隨機(jī)森林模型的天然林立地生產(chǎn)力預(yù)測研究[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2019,39(4):39-46.
GAO R N, XIE Y S, LEI X D, et al. Study on prediction of natural forest productivity based on random forest model[J]. Journal of Central South University of Forestry & Technology, 2019, 39(4): 39-46.
[21]GRIMM R, BEHRENS T, MARKER M, et al. Soil organic carbon concentrations and stocks on Barro Colorado Island - digital soil mapping using Random Forests analysis[J]. Geoderma, 2008, 146(1/2): 102-113. .