国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)間序列與橫截面數(shù)據(jù)的吉林省水稻產(chǎn)量預(yù)測對比分析*

2019-01-29 09:19:30祁偉彥袁福香李哲敏
中國農(nóng)業(yè)信息 2018年5期
關(guān)鍵詞:原始數(shù)據(jù)降維吉林省

陳 威,祁偉彥,袁福香,李哲敏※

(1. 中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京100081;2. 吉林省氣象科學(xué)研究所,長春130062)

0 引言

水稻是世界三大糧食作物之一,是我國最主要的糧食作物,全國65%以上的人口以稻米為主食。我國水稻播種面積占全國糧食播種面積的27%左右,產(chǎn)量占全國糧食總產(chǎn)量的37%左右[1]。因此,水稻的穩(wěn)產(chǎn)增產(chǎn)以及對水稻產(chǎn)量的準(zhǔn)確預(yù)測對我國農(nóng)業(yè)政策調(diào)整和保障我國糧食安全問題具有重要意義。

國內(nèi)學(xué)者在糧食產(chǎn)量預(yù)測方面做了大量研究,有的利用糧食產(chǎn)量的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測,有的利用與糧食生產(chǎn)密切相關(guān)的多重參數(shù)的橫截面數(shù)據(jù)進(jìn)行預(yù)測。時(shí)間序列數(shù)據(jù)預(yù)測常用的預(yù)測算法有自回歸滑動(dòng)平均、人工神經(jīng)網(wǎng)絡(luò)等。由于時(shí)間序列預(yù)測只需變量本身的歷史數(shù)據(jù),不需要其他參數(shù)的數(shù)據(jù),模型構(gòu)建較為簡單,因此在糧食產(chǎn)量預(yù)測中應(yīng)用十分廣泛。然而,時(shí)間序列預(yù)測假設(shè)糧食產(chǎn)量具有線性變化的規(guī)律,但糧食生產(chǎn)具有受多維度因素影響的復(fù)雜性,使其呈現(xiàn)非線性變化。因此,單純采用時(shí)間序列的方法進(jìn)行糧食產(chǎn)量預(yù)測,預(yù)測精度不高。橫截面數(shù)據(jù)預(yù)測常用的方法有支持向量回歸、神經(jīng)網(wǎng)絡(luò)等。在利用橫截面數(shù)據(jù)進(jìn)行糧食產(chǎn)量預(yù)測以及支持向量回歸構(gòu)建模型時(shí)參數(shù)一般依靠經(jīng)驗(yàn)來確定,而神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型對網(wǎng)絡(luò)初始權(quán)重高度敏感,且對訓(xùn)練集樣本的依賴性強(qiáng),因此預(yù)測結(jié)果有時(shí)并不理想。

水稻產(chǎn)量受自然因素、生產(chǎn)技術(shù)因素、社會(huì)經(jīng)濟(jì)因素和隨機(jī)因素等多因素影響,是線形關(guān)系和非線性關(guān)系并存的復(fù)雜性問題。使用單一模型進(jìn)行水稻產(chǎn)量預(yù)測,當(dāng)影響產(chǎn)量的重要因素發(fā)生變化時(shí)可能導(dǎo)致預(yù)測結(jié)果的不穩(wěn)定。為了對比不同模型預(yù)測效果,分析各模型預(yù)測水稻產(chǎn)量的特點(diǎn)、不足及適用條件,為糧食產(chǎn)量預(yù)測問題模型選擇提供依據(jù),該研究從時(shí)間序列預(yù)測和橫截面數(shù)據(jù)預(yù)測兩種角度,選取4種模型對水稻產(chǎn)量進(jìn)行預(yù)測。在時(shí)間序列預(yù)測方面,依據(jù)吉林省水稻產(chǎn)量的歷史數(shù)據(jù),基于自回歸滑動(dòng)平均(Autoregressive Integrated Moving Average Model,ARIMA)模型和長短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long-Short Term Memory,LSTM)模型進(jìn)行吉林省水稻產(chǎn)量預(yù)測。ARIMA模型在糧食產(chǎn)量預(yù)測中應(yīng)用廣泛[2-3],而LSTM模型屬于反饋神經(jīng)網(wǎng)絡(luò)的范疇,在時(shí)間序列的學(xué)習(xí)和處理上有獨(dú)特優(yōu)勢,在語音及圖像識別、機(jī)器翻譯等方面已有較多研究[4-6],但在糧食產(chǎn)量預(yù)測中應(yīng)用較少[7]。由于農(nóng)作物生長產(chǎn)生過程中動(dòng)物害蟲和病原體的侵害可引起顯著的產(chǎn)量潛在損失[8-9],競爭性作物品種種植面積對水稻的產(chǎn)量也有重要影響,因此選取吉林省重要病蟲害發(fā)生情況、玉米和大豆種植面積產(chǎn)量等歷史數(shù)據(jù)作為橫截面數(shù)據(jù)預(yù)測的原始數(shù)據(jù)。在橫截面數(shù)據(jù)預(yù)測模型選擇上,選取支持向量回歸模型和多層感知器模型進(jìn)行預(yù)測。支持向量回歸模型在解決小樣本問題中具有優(yōu)勢,已有學(xué)者采用此模型進(jìn)行農(nóng)作物產(chǎn)量的預(yù)測[10],而多層感知器模型作為最簡單的神經(jīng)網(wǎng)絡(luò)模型,具有良好的容錯(cuò)性和自適性,可有效處理非線性可分離問題,在語音識別、機(jī)器翻譯等方面已有大量研究[11-13],用于糧食產(chǎn)量預(yù)測的報(bào)道不多。

1 模型簡介

1.1 自回歸積分滑動(dòng)平均(ARIMA)模型

ARIMA模型全稱為自回歸積分滑動(dòng)平均模型,是指將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量僅對它的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型。ARIMA模型的3個(gè)參數(shù)為p、d、q,其中p代表預(yù)測模型中采用的時(shí)序數(shù)據(jù)本身的滯后數(shù),也叫做自回歸項(xiàng)數(shù),d代表時(shí)間序列成為平穩(wěn)時(shí)所作的差分次數(shù),q代表預(yù)測模型中采用的預(yù)測誤差的滯后數(shù),也叫做移動(dòng)平均項(xiàng)數(shù)[14]。

1.2 長短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)模型

長短期記憶人工神經(jīng)網(wǎng)絡(luò)是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),避免了傳統(tǒng)RNN隱含層層數(shù)過多計(jì)算量龐大而產(chǎn)生的梯度消失和梯度爆炸的問題。LSTM的經(jīng)典結(jié)構(gòu)如圖1所示,Cell是計(jì)算節(jié)點(diǎn)的核心,通過遺忘閥門(forget gate)、輸入閥門(input gate)和輸出閥門(output gate)的打開或者關(guān)閉來判斷模型網(wǎng)絡(luò)的記憶態(tài)(之前網(wǎng)絡(luò)的狀態(tài))在該層輸出的結(jié)果是否達(dá)到閾值,從而加入到當(dāng)前該層的計(jì)算中[15]。

圖1 長短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)模型結(jié)構(gòu)Fig.1 Model structure of LSTM(Long-Short Term Memory)

1.3 支持向量回歸(SVR)

支持向量機(jī)(Support Vector Machine,SVM)是機(jī)器學(xué)習(xí)領(lǐng)域中基于統(tǒng)計(jì)學(xué)習(xí)理論的分類回歸方法,由AT&T貝爾實(shí)驗(yàn)室的Vanpnik于20世紀(jì)90年代提出,通過構(gòu)造核函數(shù)將原空間非線性問題轉(zhuǎn)換成高維空間的線性問題,可以成功處理分離問題,辨別分析回歸問題等[16]。在處理分類問題時(shí),支持向量機(jī)相當(dāng)于找到一個(gè)高維特征平面,使兩個(gè)分類集合的支持向量或者所有數(shù)據(jù)離分類平面最遠(yuǎn),而支持向量回歸(Support Vector Regression,SVR)則是找到一個(gè)高維回歸平面,使一個(gè)集合中的所有數(shù)據(jù)到該平面的距離最近。

1.4 多層感知器MLP模型

MLP(Multilayer Perceptron,MLR),即多層感知器,是一種常見的神經(jīng)網(wǎng)絡(luò)模型,由輸入層、隱藏層和輸出層組成,其基本結(jié)構(gòu)如圖2所示。MLP是一種監(jiān)督學(xué)習(xí)模型,在模型訓(xùn)練過程中,不斷提供完整的輸入和輸出,模型基于一定長度的歷史數(shù)據(jù)不斷訓(xùn)練、學(xué)習(xí),從而構(gòu)建出輸入和期望的輸出之間的最優(yōu)模型,而后利用得出的最優(yōu)模型進(jìn)行預(yù)測[17]。

圖2 多層感知器(MLP)基本結(jié)構(gòu)Fig.2 Basic structure of MLP(Multilayer Perceptron)

2 水稻產(chǎn)量預(yù)測實(shí)證分析

2.1 數(shù)據(jù)來源

研究中所用到的實(shí)驗(yàn)數(shù)據(jù)為1949—2015年吉林省玉米、大豆及水稻的種植面積、單產(chǎn)及總產(chǎn)量數(shù)據(jù),以上數(shù)據(jù)來自吉林省統(tǒng)計(jì)局;吉林省稻瘟病發(fā)病頻率(1961—2009年)、玉米螟發(fā)生情況(1980—2007年)、地下害蟲及大豆蚜發(fā)生情況(1981—2006年)、食心蟲發(fā)病情況(1982—2006年)、黏蟲發(fā)生情況(1979—2006年),以上數(shù)據(jù)來自吉林省氣象局。

以1990年為基期,1990年之前的數(shù)據(jù)作為訓(xùn)練集數(shù)據(jù)用于模型訓(xùn)練,1990年之后的數(shù)據(jù)作為預(yù)測集數(shù)據(jù),用于檢測模型預(yù)測效果。

2.2 評價(jià)指標(biāo)

使用均方根誤差值(Root Mean Square Error,RMSE)作為評價(jià)指標(biāo)對各模型模擬效果進(jìn)行評價(jià)和比較。RMSE是觀測值與真值偏差的平方和觀測次數(shù)n比值的平方根,計(jì)算方法見公式(1)。RMSE值越小,表明預(yù)測值與擬合值之間偏差越小,預(yù)測性能越好,反之則預(yù)測性能越差。

2.3 從時(shí)間序列角度預(yù)測產(chǎn)量

(1)基于ARIMA的時(shí)間序列預(yù)測

①時(shí)間序列平穩(wěn)性檢驗(yàn)及平穩(wěn)化處理

導(dǎo)入吉林省1949—1990年歷年水稻總產(chǎn)量原始數(shù)據(jù),并檢驗(yàn)時(shí)間序列的穩(wěn)定性。若時(shí)間序列的統(tǒng)計(jì)學(xué)特性(例如均值、方差)隨時(shí)間保持不變,則認(rèn)為該序列是平穩(wěn)的。

圖3 1950—1990年吉林省水稻總產(chǎn)量Fig.3 Total rice yield in Jilin province from 1950 to 1990

如圖3所示,1949—1990年吉林省水稻總產(chǎn)量呈上升趨勢,年增長幅度不同。由移動(dòng)平均值和移動(dòng)標(biāo)準(zhǔn)方差曲線可以看出,移動(dòng)標(biāo)準(zhǔn)方差隨時(shí)間變化較小,但移動(dòng)平均值隨時(shí)間呈明顯的上升趨勢,因此該序列不是平穩(wěn)序列,需要進(jìn)行平穩(wěn)化處理。

由于原數(shù)據(jù)值域范圍比較大,為了縮小值域,同時(shí)保留其他信息,對原始數(shù)據(jù)進(jìn)行對數(shù)轉(zhuǎn)換,之后采用差分的方法,將每一年的數(shù)值與滯后10年的值作差,去除數(shù)據(jù)的趨勢性(圖4)。

圖4 原始數(shù)據(jù)平穩(wěn)化處理Fig.4 Stationary process of raw data

經(jīng)對數(shù)轉(zhuǎn)換和差分處理后,數(shù)據(jù)的移動(dòng)均值和移動(dòng)標(biāo)準(zhǔn)方差在時(shí)間軸上振幅明顯縮小,DFtest結(jié)果顯示Test Statistic的值小于Critical Value(1%)的值,表明在99%的置信度下,該時(shí)間序列數(shù)據(jù)是穩(wěn)定的,如圖5。

圖5 平穩(wěn)化處理后移動(dòng)均值與移動(dòng)標(biāo)準(zhǔn)方差曲線Fig.5 Rolling mean and standard deviation after stationary process

②構(gòu)建ARIMA模型

通過自相關(guān)函數(shù)(ACF)和部分自相關(guān)函數(shù)(PACF)進(jìn)行ARIMA(p,d,q)的p,q參數(shù)估計(jì)。由前文差分部分已知,原始數(shù)據(jù)經(jīng)一階差分后數(shù)據(jù)已經(jīng)穩(wěn)定,可得到d=1。所以用一階差分化的Y’t=Yt-Yt-1作為輸入。畫出ACF,PACF的圖像(圖6)。

圖6中,上下兩條灰線之間為置信區(qū)間,p的值為ACF第一次穿過上置信區(qū)間時(shí)的橫軸值。q的值為PACF第一次穿過上置信區(qū)間的橫軸值。所以從圖6可以得到p=2,q=2。由此,可生成模型ARIMA(2,1,2)。

取AR模 型(ARIMA(2,1,0))、MA模 型(ARIMA(0,1,2))、ARIMA模 型(ARIMA(2,1,2))這3種參數(shù)取值的3個(gè)模型與穩(wěn)定化處理后的輸入數(shù)據(jù)進(jìn)行擬合,比較RSS值得出,ARIMA模型(ARIMA(2,1,2))擬合度最好(圖7)。

③ARIMA模型預(yù)測

對ARIMA模型(ARIMA(2,1,2))擬合值進(jìn)行差分和對數(shù)處理的逆運(yùn)算(圖8a),使擬合值回到原始區(qū)間,并利用該模型對1991—2015年水稻產(chǎn)量進(jìn)行預(yù)測(圖8b)。

圖6 自相關(guān)函數(shù)(ACF)和部分自相關(guān)函數(shù)(PACF)曲線Fig.6 Curve graph of ACF and PACF

圖7 3種參數(shù)ARIMA模型與平穩(wěn)數(shù)據(jù)擬合度分析Fig.7 Fitting analysis of three parameters ARIMA model with stationary data

圖8 差分與對數(shù)的逆運(yùn)算(a)及水稻產(chǎn)量預(yù)測(b)Fig.8 Inverse operation of difference and logarithm(a)and yield prediction of rice(b)

1949—2015年吉林省水稻產(chǎn)量整體呈上升趨勢,期間由于氣候因素和政策導(dǎo)向等導(dǎo)致一些年份水稻產(chǎn)量出現(xiàn)較大波動(dòng),特別是2005—2015年。ARIMA模型預(yù)測結(jié)果較好地反映了水稻產(chǎn)量整體上升的趨勢,但對原始數(shù)序列的波動(dòng)沒有做出反應(yīng)。

(2)基于LSTM的時(shí)間序列預(yù)測

①建立模型

使用Keras深度學(xué)習(xí)庫在Python中構(gòu)建LSTM網(wǎng)絡(luò)模型。參數(shù)設(shè)置為默認(rèn)參數(shù),即輸入層有1個(gè)input,隱藏層4個(gè)神經(jīng)元,輸出層為預(yù)測一個(gè)值,激活函數(shù)用sigmoid,迭代100次,batch size 為1。利用上面得到的平穩(wěn)序列數(shù)據(jù)對模型進(jìn)行訓(xùn)練。

②模型預(yù)測

利用得到的LSTM模型對1991—2015年水稻總產(chǎn)量進(jìn)行預(yù)測,結(jié)果如圖9。

圖9 長短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)模型預(yù)測水稻產(chǎn)量Fig.9 Prediction of rice yield using LSTM model

可以看出,LSTM模型較預(yù)測曲線整體趨勢較為平緩,預(yù)測產(chǎn)量普遍低于實(shí)際產(chǎn)量,未能反應(yīng)水稻產(chǎn)量整體上升的總體趨勢,對于原始數(shù)序列的波動(dòng)反應(yīng)不明顯。

2.4 從橫截面數(shù)據(jù)角度預(yù)測產(chǎn)量

實(shí)驗(yàn)中用于預(yù)測水稻產(chǎn)量的病蟲害數(shù)據(jù)為吉林省歷年稻瘟病發(fā)病頻率(1961—2009年)、玉米螟發(fā)生情況(1980—2007年)、地下害蟲及大豆蚜發(fā)生情況(1981—2006年)、食心蟲發(fā)病情況(1982—2006年)、黏蟲發(fā)生情況(1979—2006年)。用于預(yù)測水稻產(chǎn)量的其他特征數(shù)據(jù)為水稻的競爭性作物種植面積與產(chǎn)量的歷年數(shù)據(jù),包括1949—2015年吉林省玉米、大豆種植面積、單產(chǎn)及總產(chǎn)量數(shù)據(jù)。

實(shí)驗(yàn)使用sklearn機(jī)器學(xué)習(xí)庫進(jìn)行數(shù)據(jù)的處理和SVR、MLP模型訓(xùn)練及預(yù)測。主要包括數(shù)據(jù)預(yù)處理、定義分類器、訓(xùn)練模型、模型預(yù)測等步驟。由于原始數(shù)據(jù)由多種特征數(shù)據(jù)組成,為高維數(shù)據(jù),為了更有效處理數(shù)據(jù),對原始數(shù)據(jù)進(jìn)行主成分分析(PCA)降維處理后,再次進(jìn)行上述分析流程,并與未經(jīng)降維處理的預(yù)測結(jié)果進(jìn)行對比。

采用每種方法建立預(yù)測模型時(shí),考慮兩種特征的組合:①考慮水稻生長受當(dāng)年病蟲害影響,采用病蟲害數(shù)據(jù)預(yù)測當(dāng)年水稻產(chǎn)量;②考慮競爭性作物種植面積及產(chǎn)量對農(nóng)戶種植意向的影響,采用競爭性作物種植面積及產(chǎn)量數(shù)據(jù)預(yù)測下一年水稻產(chǎn)量。兩種特征組合可分別應(yīng)用于當(dāng)年及下一年水稻產(chǎn)量的預(yù)測任務(wù)。

(1)基于SVR的機(jī)器學(xué)習(xí)預(yù)測

對原始數(shù)據(jù)進(jìn)行歸一化處理后,將1950—1990年的數(shù)據(jù)作為訓(xùn)練集用于預(yù)測模型的建立,1991—2015年的數(shù)據(jù)作為測試集用于檢驗(yàn)?zāi)P皖A(yù)測效果。

使用sklearn機(jī)器學(xué)習(xí)庫SVR模型對水稻產(chǎn)量進(jìn)行預(yù)測。主要步驟為:對原始數(shù)據(jù)中的缺失值進(jìn)行函數(shù)填充后,對數(shù)據(jù)進(jìn)行歸一化處理;選擇分類器為SVR,用訓(xùn)練集數(shù)據(jù)對模型進(jìn)行訓(xùn)練,并建立預(yù)測模型;將測試集數(shù)據(jù)于模型預(yù)測效果的檢驗(yàn)。對原始數(shù)據(jù)進(jìn)行主成分分析PCA降維處理后,再次進(jìn)行上述分析流程。

根據(jù)以上流程,利用病蟲害數(shù)據(jù)預(yù)測當(dāng)年水稻產(chǎn)量,得到預(yù)測曲線SVR1和SVR1(主成分分析降維)。利用競爭性作物種植面積及產(chǎn)量數(shù)據(jù)預(yù)測下一年水稻產(chǎn)量,得到預(yù)測曲線SVR2和SVR2(主成分分析降維)(圖10)。

圖10 利用支持向量機(jī)(SVR)模型預(yù)測水稻產(chǎn)量Fig.10 Prediction of rice yield using SVR model

SVR模型預(yù)測曲線呈波動(dòng)上升,預(yù)測產(chǎn)量普遍低于實(shí)際產(chǎn)量,在一定程度上反應(yīng)了原始數(shù)序列的波動(dòng)情況。由分析結(jié)果可知,采用PCA對影響因素進(jìn)行降維處理后,SVR模型預(yù)測準(zhǔn)確性均有所提高。

(2)基于MLP神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)預(yù)測

使用sklearn機(jī)器學(xué)習(xí)庫MLP模型對水稻產(chǎn)量進(jìn)行預(yù)測。主要步驟為:對原始數(shù)據(jù)中的缺失值進(jìn)行函數(shù)填充后,對數(shù)據(jù)進(jìn)行歸一化處理;選擇分類器為MLR,用訓(xùn)練集數(shù)據(jù)對模型進(jìn)行訓(xùn)練,并建立預(yù)測模型;將測試集數(shù)據(jù)于模型預(yù)測效果的檢驗(yàn)。對原始數(shù)據(jù)進(jìn)行主成分分析PCA降維處理后,再次進(jìn)行上述分析流程。

根據(jù)以上流程,利用病蟲害數(shù)據(jù)預(yù)測當(dāng)年水稻產(chǎn)量,得到預(yù)測曲線MLP1和MLP1(主成分分析降維)。利用競爭性作物種植面積及產(chǎn)量數(shù)據(jù)預(yù)測下一年水稻產(chǎn)量,得到預(yù)測曲線MLP2和MLP2(主成分分析降維)(圖11)。

圖11 利用多層感知器(MLP)模型預(yù)測水稻產(chǎn)量Fig.11 Prediction of rice yield using MLP model

MLP模型預(yù)測產(chǎn)量普遍低于實(shí)際產(chǎn)量,預(yù)測結(jié)果隨原始數(shù)序列的波動(dòng)出現(xiàn)劇烈波動(dòng)。采用PCA對影響因素進(jìn)行降維處理后,預(yù)測曲線波動(dòng)性減緩,MLP1模型預(yù)測準(zhǔn)確性提高,而MLP2模型預(yù)測準(zhǔn)確性降低。

3 結(jié)果與討論

利用吉林省病蟲害和玉米大豆產(chǎn)量等歷史數(shù)據(jù),基于4種模型對吉林省水稻產(chǎn)量進(jìn)行預(yù)測,預(yù)測值與實(shí)際值的RMSE見表1?;贏RIMA模型和LSTM模型的時(shí)間序列預(yù)測RMSE相對橫截面預(yù)測RMSE較小,但預(yù)測值與實(shí)際值之間仍存在差距。在橫截面數(shù)據(jù)預(yù)測中,原始數(shù)據(jù)經(jīng)主成分分析PCA降維處理后,SVR1、SVR2和MLP1模型預(yù)測的RMSE值相對未經(jīng)降維處理均有所下降,表明在數(shù)據(jù)維度過高、數(shù)據(jù)量較小情況下,降維處理在多數(shù)情況下可提升模型預(yù)測性能。

近年來我國對糧食生產(chǎn)實(shí)施了良種補(bǔ)貼、農(nóng)機(jī)購置補(bǔ)貼、農(nóng)民直補(bǔ)等一系列農(nóng)業(yè)支持政策,加之生物技術(shù)、農(nóng)業(yè)工程和管理技術(shù)的發(fā)展和農(nóng)田水利基礎(chǔ)設(shè)施的不斷完善,使糧食持續(xù)增產(chǎn)潛力大大提升。利用ARIMA和LSTM進(jìn)行時(shí)間序列預(yù)測時(shí),只考慮產(chǎn)量隨時(shí)間的變化趨勢,沒有考慮其他因素的變化對趨勢延續(xù)性的影響,導(dǎo)致對近年產(chǎn)量的預(yù)測與實(shí)際情況相比偏低。

表1 不同方法預(yù)測結(jié)果RMSE值Table 1 RMSE of predicting results with different methods

農(nóng)業(yè)生產(chǎn)是復(fù)雜的經(jīng)濟(jì)與自然再生產(chǎn)過程,糧食生產(chǎn)過程受到氣象條件、作物品種、農(nóng)資投入、田間管理、市場供需、國家政策等多方面的影響[18]。而利用SVR和MLP模型進(jìn)行橫截面數(shù)據(jù)預(yù)測時(shí),模型訓(xùn)練使用的原始數(shù)據(jù)為水稻重要病蟲害發(fā)生情況、大豆種植面積與產(chǎn)量、玉米種植面積與產(chǎn)量等數(shù)據(jù),致使模型主要反映水稻產(chǎn)量與病蟲害發(fā)生情況及競爭性作物種植情況的關(guān)系,沒有考慮其他影響產(chǎn)量的氣象因素、投入管理因素、社會(huì)經(jīng)濟(jì)因素,導(dǎo)致模型預(yù)測產(chǎn)量與實(shí)際產(chǎn)量相比偏低。

由時(shí)間序列模型與橫截面數(shù)據(jù)預(yù)測模型對比的實(shí)證分析結(jié)果可知,在進(jìn)行水稻產(chǎn)量預(yù)測時(shí),如缺乏影響產(chǎn)量的重要因素的數(shù)據(jù),則應(yīng)用時(shí)間序列模型分析結(jié)果較好。反之,如掌握影響產(chǎn)量的重要因素?cái)?shù)據(jù),則宜采用橫截面數(shù)據(jù)預(yù)測模型。在進(jìn)行橫截面數(shù)據(jù)預(yù)測時(shí),如分析影響因素較多,可采用PCA對影響因素進(jìn)行降維處理,通常能夠提高預(yù)測結(jié)果的準(zhǔn)確性。此外,在進(jìn)行橫截面數(shù)據(jù)預(yù)測中,如訓(xùn)練數(shù)據(jù)較少時(shí),采用回歸模型比神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果準(zhǔn)確性高,且神經(jīng)網(wǎng)絡(luò)模型中,在訓(xùn)練數(shù)據(jù)量較小時(shí),算法表現(xiàn)不夠穩(wěn)定。在進(jìn)行橫截面數(shù)據(jù)進(jìn)行水稻產(chǎn)量預(yù)測時(shí),利用競爭性作物種植面積及產(chǎn)量數(shù)據(jù)預(yù)測下一年水稻產(chǎn)量的結(jié)果優(yōu)于利用病蟲害數(shù)據(jù)預(yù)測當(dāng)年水稻產(chǎn)量。

在后續(xù)研究中,擬通過補(bǔ)充氣象數(shù)據(jù)、農(nóng)資投入等數(shù)據(jù),提高基于SVR和MLP模型的橫截面數(shù)據(jù)預(yù)測準(zhǔn)確性,并通過構(gòu)建時(shí)間序列預(yù)測和橫截面預(yù)測組合模型,進(jìn)一步提高水稻產(chǎn)量預(yù)測的精度。

猜你喜歡
原始數(shù)據(jù)降維吉林省
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
混動(dòng)成為降維打擊的實(shí)力 東風(fēng)風(fēng)神皓極
車主之友(2022年4期)2022-08-27 00:57:12
吉林省教育廳新年賀詞
吉林省“十四五”食品安全信息化建設(shè)的幾點(diǎn)思考
受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
吉林省梅河口老年大學(xué)之歌
降維打擊
海峽姐妹(2019年12期)2020-01-14 03:24:40
吉林省完成1.4萬公里農(nóng)村公路“暢返不暢”整治
石油瀝青(2019年6期)2019-02-13 04:24:34
全新Mentor DRS360 平臺(tái)借助集中式原始數(shù)據(jù)融合及直接實(shí)時(shí)傳感技術(shù)實(shí)現(xiàn)5 級自動(dòng)駕駛
汽車零部件(2017年4期)2017-07-12 17:05:53
拋物化Navier-Stokes方程的降維仿真模型
澄城县| 子洲县| 荥经县| 中西区| 常山县| 鹿邑县| 报价| 古田县| 高淳县| 洪雅县| 绵竹市| 儋州市| 襄垣县| 萍乡市| 盈江县| 漳浦县| 西和县| 建昌县| 上杭县| 连江县| 宁南县| 新竹市| 晋中市| 沧州市| 乌兰浩特市| 拉孜县| 沙雅县| 二连浩特市| 鸡泽县| 东安县| 安徽省| 乌拉特中旗| 无锡市| 宽甸| 蓬莱市| 榕江县| 长宁区| 合作市| 黔南| 惠安县| 六安市|