国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的馬尾松毛蟲(chóng)發(fā)生面積預(yù)測(cè)模型

2019-06-12 07:27龐永華冀小菊
關(guān)鍵詞:毛蟲(chóng)馬尾松線性

龐永華,冀小菊

(1.河南省上蔡縣森林病蟲(chóng)害防治檢疫站,河南 上蔡 463800;2.河南省上蔡縣林業(yè)技術(shù)推廣站,河南 上蔡 463800)

馬尾松毛蟲(chóng)(Dendrolimuspunctatus)屬鱗翅目(Lepidoptera)、枯葉蛾科(Lasiocampidae),為我國(guó)南方18個(gè)省區(qū)的重要害蟲(chóng),主要危害馬尾松,是我國(guó)常發(fā)性森林害蟲(chóng)[1]。該害以幼蟲(chóng)取食松針,暴發(fā)成災(zāi)時(shí),數(shù)日內(nèi)可將大面積連片的松林針葉吃光,遠(yuǎn)看焦黃、發(fā)黑,如同火燒一樣,嚴(yán)重影響樹(shù)木生長(zhǎng),造成松樹(shù)枯死[2]。因此,加強(qiáng)馬尾松毛蟲(chóng)發(fā)生趨勢(shì)預(yù)測(cè)預(yù)報(bào)研究,在其大發(fā)生之前進(jìn)行控制,可以把對(duì)松林的危害損失降低到最小程度。

馬尾松毛蟲(chóng)的發(fā)生及其種群數(shù)量變化與氣象因子和林分結(jié)構(gòu)有關(guān)[2-4],若不考慮林分因素,馬尾松毛蟲(chóng)的發(fā)生量和發(fā)生面積主要與氣象因子有關(guān)。為此,很多學(xué)者利用氣象因子,通過(guò)線性回歸[5]、判別分析[6]、馬爾科夫鏈[7]等方法對(duì)馬尾松毛蟲(chóng)的發(fā)生量和發(fā)生面積進(jìn)行了預(yù)測(cè),這些方法多屬于線性預(yù)測(cè)方法,實(shí)際上害蟲(chóng)的發(fā)生與氣象因子的關(guān)系為復(fù)雜的非線性關(guān)系[8,9],故探討預(yù)測(cè)精度更高的非線性預(yù)測(cè)方法非常重要。

近年來(lái),很多學(xué)者利用機(jī)器學(xué)習(xí)模型建立了害蟲(chóng)發(fā)生量與氣候因子的非線性模型,預(yù)測(cè)精度比傳統(tǒng)的線性預(yù)測(cè)模型高[10-17]。對(duì)于馬尾松毛蟲(chóng)發(fā)生面積的預(yù)測(cè),很多學(xué)者運(yùn)用人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè),預(yù)測(cè)精度優(yōu)于線性回歸模型[14-18]。但是運(yùn)用深度學(xué)習(xí)、隨機(jī)森林、支持向量機(jī)等機(jī)器學(xué)習(xí)模型對(duì)馬尾松毛蟲(chóng)的發(fā)生面積的預(yù)測(cè)并選擇最優(yōu)模型相關(guān)報(bào)道較少。

1 材料與方法

1.1 數(shù)據(jù)來(lái)源

本研究采用的20組馬尾松毛蟲(chóng)發(fā)生面積數(shù)據(jù)和氣象數(shù)據(jù)來(lái)自陳繪畫(huà)等學(xué)者的研究[2],其中馬尾松毛蟲(chóng)發(fā)生面積數(shù)據(jù)資料來(lái)自浙江省仙居縣森林病蟲(chóng)防治站,氣象資料來(lái)自浙江省仙居縣氣象局。

1.2 預(yù)報(bào)因子的選擇

對(duì)馬尾松毛蟲(chóng)發(fā)生面積的8個(gè)氣象預(yù)測(cè)因子:當(dāng)年2月下旬平均氣溫(x1)、當(dāng)年3月上旬平均氣溫(x2)、當(dāng)年2月中旬相對(duì)濕度(x3)、上年10月中旬降水量(x4)、上年9月中旬日照時(shí)數(shù)(x5)、上年6月上旬最低氣溫(x6)、上年8月中旬最低氣溫(x7)、上年12月中旬最低氣溫(x8)進(jìn)行逐步線性回歸分析[2],最終選擇3個(gè)進(jìn)入逐步回歸模型的氣象因子:x2、x5和x8作為線性模型、隨機(jī)森林、支持向量機(jī)和深度學(xué)習(xí)模型建模的自變量,預(yù)測(cè)馬尾松毛蟲(chóng)的發(fā)生面積。用前18個(gè)年份的數(shù)據(jù)作為訓(xùn)練集,構(gòu)建模型,后兩年的數(shù)據(jù)作為測(cè)試集,驗(yàn)證模型的精度。

1.3 選用的模型預(yù)測(cè)方法

1.3.1 多元線性回歸 多元線性回歸是利用氣象因子預(yù)測(cè)蟲(chóng)害的常用方法[3,5]。采用R軟件中的lm函數(shù)建立當(dāng)年3月上旬平均氣溫(x2)、上年9月中旬日照時(shí)數(shù)(x5)和上年12月中旬最低氣溫(x8)3個(gè)氣象因子與馬尾松毛蟲(chóng)發(fā)生面積(y)的多元回歸線性模型。

1.3.2 隨機(jī)森林模型 隨機(jī)森林(random forest)模型是一種基于分類(lèi)樹(shù)的機(jī)器學(xué)習(xí)算法[8-10],即在變量(列)的使用和數(shù)據(jù)(行)的使用上進(jìn)行隨機(jī)化,生成很多分類(lèi)樹(shù),再總分分類(lèi)樹(shù)的結(jié)果構(gòu)建模型。采用R軟件中的randomForest程序包構(gòu)建隨機(jī)森林模型,ntree=200。

1.3.3 支持向量機(jī)模型 支持向量機(jī)(support vector machine,SVM)的基本思想是通過(guò)非線性映射將數(shù)據(jù)映射到高維空間特征空間,然后在該空間進(jìn)行線性回歸,讓所有樣本點(diǎn)的總偏差達(dá)到最小,進(jìn)而提高模型的預(yù)測(cè)能力[8-9,10,12],在諸多機(jī)器學(xué)習(xí)模型中因其準(zhǔn)確高效而備受關(guān)注。采用R軟件中的e1071軟件包的SVM構(gòu)建支持向量機(jī)模型。

1.3.4 深度學(xué)習(xí)模型 深度學(xué)習(xí)(deep learning)是在神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上建立的預(yù)測(cè)精度更高的機(jī)器學(xué)習(xí)模型之一,該模型可以逼近任意的非線性函數(shù),能夠處理系統(tǒng)內(nèi)難以解析的規(guī)律型,具有良好的泛化能力[19]。采用R軟件中的h2o程序包建立深度學(xué)習(xí)模型,設(shè)置隱含層數(shù)為3,各層的節(jié)點(diǎn)數(shù)分別為10、8和8,,訓(xùn)練次數(shù)為500次,訓(xùn)練誤差為1×10-6。

1.4 模型評(píng)價(jià)方法

1.4.1 均方根誤差 用均方根誤差(Root mean square error, RMSE)作為指標(biāo)來(lái)衡量多元線性回歸、隨機(jī)森林、支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)4個(gè)模型的性能[11]。RMSE的計(jì)算公式如下:

(1)

公式(1)中:Xa,i為實(shí)測(cè)值,Xb,i為模型預(yù)測(cè)值,n為預(yù)測(cè)樣本數(shù)。

1.4.2 預(yù)測(cè)準(zhǔn)確率 預(yù)測(cè)準(zhǔn)確率(PA, %)[17,18]的計(jì)算公式如下,式中的參數(shù)含義如公式(1)所示。

(2)

2 結(jié)果與分析

2.1 模型擬合

選擇18組數(shù)據(jù),分別采用多元線性回歸、隨機(jī)森林、支持向量機(jī)和深度學(xué)習(xí)構(gòu)建模型,通過(guò)模型的決定系數(shù)、RMSE和殘差來(lái)比較所建的4個(gè)模型的性能。由圖1可知,4個(gè)模型的決定系數(shù)R2的大小順序?yàn)樯疃葘W(xué)習(xí)(0.9901)>支持向量機(jī)(0.9617)>隨機(jī)森林(0.9584)>多元線性回歸(0.8861);均方根誤差RSME的大小順序?yàn)槎嘣€性回歸(0.5493)>隨機(jī)森林(0.4269)>支持向量機(jī)(0.3275)> 深度學(xué)習(xí)(0.00453)。說(shuō)明多元線性回歸模型的擬合效果最差,3個(gè)機(jī)器學(xué)習(xí)模型的擬合效果均優(yōu)于多元線性模型,其中深度學(xué)習(xí)模型的擬合效果最好,其次為支持向量機(jī)模型。

圖2為4個(gè)模型預(yù)測(cè)值與實(shí)際值相比較的誤差,與3個(gè)機(jī)器學(xué)習(xí)模型相比,多元線性回歸模型的預(yù)測(cè)值誤差異常點(diǎn)較多;其次為隨機(jī)森林模型;支持向量機(jī)模型預(yù)測(cè)值誤差異常點(diǎn)較少,精度較高;深度學(xué)習(xí)模型預(yù)測(cè)值與實(shí)測(cè)值差異很小,誤差點(diǎn)幾乎均位于零值線上,說(shuō)明深度學(xué)習(xí)模型的擬合精度最高。

圖1 預(yù)測(cè)馬尾松毛蟲(chóng)發(fā)生面積

圖2 4種模型預(yù)測(cè)馬尾松毛蟲(chóng)發(fā)生面積誤差比較

2.2 模型預(yù)測(cè)與驗(yàn)證評(píng)估

把預(yù)留的2001和2002年數(shù)據(jù)代入4個(gè)模型中,對(duì)4個(gè)模型的預(yù)測(cè)精度進(jìn)行驗(yàn)證比較(表1)。由表1可知,多元線性回歸模型對(duì)2001和2002年馬尾松毛蟲(chóng)發(fā)生面積的預(yù)測(cè)值誤差均較大,兩年的平均預(yù)測(cè)準(zhǔn)確率最低,僅為45.61%;深度學(xué)習(xí)模型預(yù)測(cè)值誤差最小,兩年馬尾松毛蟲(chóng)發(fā)生面積平均預(yù)測(cè)準(zhǔn)確率最高,為99.27%;其次為支持向量機(jī)模型,平均預(yù)測(cè)準(zhǔn)確率為92.13%。

表1 4種機(jī)器學(xué)習(xí)模型對(duì)馬尾松毛蟲(chóng)發(fā)生面積的預(yù)測(cè)效果比較

3 結(jié)論與討論

本研究表明,傳統(tǒng)的多元線性模型對(duì)馬尾松毛蟲(chóng)發(fā)生面積的預(yù)測(cè)擬合度和預(yù)測(cè)誤差較大,3種機(jī)器學(xué)習(xí)模型對(duì)馬尾松毛蟲(chóng)發(fā)生面積的預(yù)測(cè)效果均優(yōu)于傳統(tǒng)的多元線性模型,這與很多學(xué)者的研究結(jié)果一致[2, 11, 14-17]。由此可見(jiàn),雖然所選擇的預(yù)報(bào)因子一樣, 但由于氣象因子與森林害蟲(chóng)的關(guān)系并非單純的線性關(guān)系[2, 11, 17],深度學(xué)習(xí)、支持向量機(jī)和隨機(jī)森林模型利用了各氣象因子相互之間及其與害蟲(chóng)發(fā)生面積之間的相互關(guān)系,進(jìn)行深度學(xué)習(xí)訓(xùn)練[11, 17],無(wú)論擬合精度和預(yù)測(cè)效果均比傳統(tǒng)的線性回歸模型好。

在3種機(jī)器學(xué)習(xí)模型中,深度學(xué)習(xí)對(duì)馬尾松毛蟲(chóng)發(fā)生面積的預(yù)測(cè)最為穩(wěn)健,擬合決定系數(shù)和預(yù)測(cè)準(zhǔn)確率最高(R2=0.9901,PA=99.27%),RSME最低,僅為0.1711。證明深度學(xué)習(xí)模型用于馬尾松毛蟲(chóng)發(fā)生面積預(yù)測(cè)更為科學(xué)可靠,原因是深度學(xué)習(xí)具有較強(qiáng)的自適應(yīng)、抗干擾和容錯(cuò)性等能力,個(gè)別學(xué)習(xí)樣本的分量偏差對(duì)網(wǎng)絡(luò)的學(xué)習(xí)效果影響較小,因此模型的穩(wěn)定性較好[19]。很多學(xué)者利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行馬尾松毛蟲(chóng)發(fā)生量和發(fā)生面積預(yù)測(cè),也取得了滿(mǎn)意的預(yù)測(cè)效果[14-16]。其次,支持向量機(jī)模型預(yù)測(cè)效果也較好(R2=0.9617,RSME=0.3275,PA=92.13%),隨機(jī)森林模型相對(duì)較差。支持向量機(jī)與隨機(jī)森林相比,支持向量機(jī)更適合處理小樣本問(wèn)題[8, 9, 17-18]。本研究的樣本量較小,可能是造成隨機(jī)森林模型預(yù)測(cè)誤差較大的原因。建議在今后的研究中,加強(qiáng)對(duì)馬尾松毛蟲(chóng)長(zhǎng)時(shí)間序列發(fā)生面積、發(fā)生量及其氣象因子的觀測(cè),增大樣本量,深入開(kāi)展機(jī)器學(xué)習(xí)模型在馬尾松毛蟲(chóng)發(fā)生面積和發(fā)生量預(yù)測(cè)預(yù)報(bào)中應(yīng)用的研究,提高馬尾松毛蟲(chóng)的預(yù)測(cè)預(yù)報(bào)準(zhǔn)確率。

猜你喜歡
毛蟲(chóng)馬尾松線性
馬尾松種植技術(shù)與栽培管理
The great monarch migrations
森防工作中的馬尾松毛蟲(chóng)防治技術(shù)探究
二階整線性遞歸數(shù)列的性質(zhì)及應(yīng)用
線性回歸方程的求解與應(yīng)用
馬尾松栽培技術(shù)與撫育管理措施
馬尾松栽培技術(shù)及撫育管理
非齊次線性微分方程的常數(shù)變易法
?N上帶Hardy項(xiàng)的擬線性橢圓方程兩個(gè)解的存在性
毛蟲(chóng)與蛾子