徐剛剛,阿麗米熱·蘇萊曼,謝佳洋
(新疆農(nóng)業(yè)大學(xué) 數(shù)理學(xué)院,新疆 烏魯木齊 830052)
小麥?zhǔn)切陆饕募Z食作物,為全疆糧食的供需提供安全保障.近年來隨著小麥、玉米等糧食作物的供給側(cè)結(jié)構(gòu)性改革,多項(xiàng)惠農(nóng)政策的扶持以及農(nóng)業(yè)部門的專業(yè)人員在育種、灌溉、施肥等方面的技術(shù)指導(dǎo),小麥產(chǎn)量、播種面積以及種植結(jié)構(gòu)等方面都有了較大的變化,達(dá)到了農(nóng)民增收、農(nóng)業(yè)增效的目的.
目前對有關(guān)小麥產(chǎn)量、播種面積以及種植結(jié)構(gòu)等方面的預(yù)測也有很多文獻(xiàn).李曄等[1]利用新維無偏灰色馬爾可夫模型預(yù)測小麥的產(chǎn)量,得出該模型適合中長期預(yù)測的結(jié)論;林瀅等[2]通過隨機(jī)森林算法預(yù)測河南冬小麥產(chǎn)量的最佳時(shí)間窗和影響因子,結(jié)果表明,隨機(jī)森林算法適用于河南省冬小麥產(chǎn)量預(yù)測,并且適用于短期預(yù)測;張明輝[3]利用層次分析法預(yù)測小麥產(chǎn)量,結(jié)果表明:組合模型能夠較好地監(jiān)測與預(yù)測小麥產(chǎn)量;舒服華[4]利用NAR神經(jīng)網(wǎng)絡(luò)算法對河南小麥產(chǎn)量進(jìn)行預(yù)測,結(jié)果表明,NAR神經(jīng)網(wǎng)絡(luò)算法適合于河南小麥產(chǎn)量的預(yù)測,并且誤差較??;王寧等[5]對2000~2019年河南省小麥播種面積與產(chǎn)量變化趨勢分析,結(jié)果表明,河南省的小麥播種面積和小麥產(chǎn)量將繼續(xù)增加.以上文獻(xiàn)都是基于一種模型進(jìn)行研究.對于新疆小麥的研究,主要集中在栽培技術(shù)、病蟲害等方面.而對新疆各地州小麥產(chǎn)量、播種面積等方面的預(yù)測較少.因此,本文通過建立ARIMAX-BP神經(jīng)網(wǎng)絡(luò)組合模型來擬合新疆小麥的產(chǎn)量、播種面積以及全國小麥的種植結(jié)構(gòu),進(jìn)一步預(yù)測新疆小麥在這些方面的發(fā)展趨勢,為決策者提供可靠的理論依據(jù).
基于此,為了更全面預(yù)測新疆小麥產(chǎn)量、播種面積及全國小麥種植結(jié)構(gòu),本文從《中國統(tǒng)計(jì)年鑒》選取1999~2020年新疆小麥產(chǎn)量、播種面積以及全國小麥種植結(jié)構(gòu)數(shù)據(jù)為預(yù)測對象,以耕地灌溉面積、農(nóng)用化肥施用量及農(nóng)業(yè)機(jī)械總動(dòng)力三組時(shí)間序列數(shù)據(jù)為解釋變量,建立多元時(shí)間序列ARIMAX模型、BP神經(jīng)網(wǎng)絡(luò)算法以及它們的組合模型進(jìn)行分析.經(jīng)檢驗(yàn)及比較,組合模型提高了預(yù)測的精度,避免了單一模型提取數(shù)據(jù)信息的不足,同時(shí)用多維數(shù)據(jù)建模更能反映新疆小麥的客觀現(xiàn)狀,更具有說服力.
其基本思想為[6]:假設(shè)輸出變量序列{Yt}和輸入變量序列{X1t},{X2t},…,{Xkt}均平穩(wěn),且兩組序列之間存在線性相關(guān)關(guān)系,為了討論輸入變量序列對輸出變量序列的影響,這里引入第i個(gè)輸入變量序列{Xit}對輸出變量序列{Yt}影響的延遲期數(shù)為li,有效作用期數(shù)為ni.Box和Jenkins通過引入輸出變量序列的自回歸結(jié)構(gòu),使模型的階數(shù)減少,模型的具體表達(dá)式為
(1)
Φi(B)=1-φi1B-φi2B2- …-φipiBpi,1≤i≤k.
Θi(B)是第i個(gè)自變量{Xit}的qi階移動(dòng)平均系數(shù)多項(xiàng)式
Θi(B)=θi0-θi1B-θi2B2- …-θiqiBqi,1≤i≤k.
且qi+pi遠(yuǎn)小于ni.
由于序列{Yt},{X1t},{X2t},…,{Xkt}均是平穩(wěn)序列,因此由式(1)可得殘差序列{εt}平穩(wěn).進(jìn)一步利用ARMA模型提取殘差序列{εt}中的相關(guān)信息,
其中:Θ(B)為殘差序列的移動(dòng)平均系數(shù)多項(xiàng)式;Φ(B)為殘差序列自回歸系數(shù)多項(xiàng)式;et是均值為零的白噪聲序列.最終得到輸出變量序列{Yt}和輸入變量序列{X1t},{X2t},…,{Xkt}的回歸模型稱為動(dòng)態(tài)回歸模型,記為ARIMAX,具體形式為
1.2.1 信號向前傳遞
當(dāng)輸入訓(xùn)練樣本為
Xs=(xs1,xs2,…,xsM)′,1≤s≤k,
M為樣本Xs的維數(shù),則根據(jù)向前傳播方式,可得以下表達(dá)式:
(1)隱含層中有n1個(gè)神經(jīng)元,第i個(gè)神經(jīng)元的輸出為
(2)輸出層中有n2個(gè)神經(jīng)元,第j個(gè)神經(jīng)元的輸出為
j=1,2,…,n2.
(3)誤差平方和函數(shù)為
1.2.2 權(quán)值的調(diào)整及誤差的反向傳播
在BP神經(jīng)網(wǎng)絡(luò)算法中,權(quán)值的調(diào)整量與輸出相對于期望響應(yīng)的誤差對權(quán)值的偏微分大小成正比,符號相反.首先通過偏微分方法計(jì)算輸出層的權(quán)值調(diào)整量,具體計(jì)算過程為
定義局部梯度為
則輸出層的權(quán)值變化,從第i個(gè)輸入到第j個(gè)輸出的權(quán)值調(diào)整量為
同理可得偏差權(quán)值調(diào)整量為
通過以上推導(dǎo),進(jìn)一步迭代算出下一次權(quán)值ω2ji.
與輸出層權(quán)值調(diào)整量類似,隱層中從第m個(gè)輸入到第i個(gè)輸出的權(quán)值調(diào)整量為
同理可得偏差為
其中,n為迭代次數(shù).
通常情況下,利用一種方法建模往往只能刻畫數(shù)據(jù)在某一方面的規(guī)律,容易忽略數(shù)據(jù)的綜合特征,導(dǎo)致預(yù)測精度不高.近年來隨著組合模型的出現(xiàn),彌補(bǔ)了這方面的不足,使模型的預(yù)測精度得到了有效提高.組合模型是將多種單一模型通過加權(quán)進(jìn)行組合,通過計(jì)算組合模型的誤差平方和并讓其達(dá)到最小時(shí)求出相應(yīng)的組合權(quán)重,進(jìn)而達(dá)到精準(zhǔn)預(yù)測的效果.結(jié)合本文所研究數(shù)據(jù)的特征,將ARIMAX模型與BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行組合,利用組合之后的ARIMAX-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果,預(yù)測流程如圖1所示.
用組合模型進(jìn)行預(yù)測,最關(guān)鍵的技術(shù)是如何確定一套合理的組合權(quán)重.許多學(xué)者在這方面也做出了相應(yīng)的研究,目前常用的權(quán)重確定方法有平均法、倒數(shù)法、熵權(quán)法等.例如Torbat等[8]用了一種混合概率ARIMA模型分析商品市場消費(fèi)需求趨勢;羅文劼等[9]基于熵權(quán)-離差客觀組合賦權(quán)方法確定指標(biāo)權(quán)重.
圖1 組合模型預(yù)測流程圖
設(shè)兩種預(yù)測方法的誤差矩陣e=(E1,E2)′,則組合預(yù)測的誤差信息陣為
記模型組合權(quán)重向量為
W=(ω1,ω2)′,ω1+ω2=0,ω1>0,ω2>0.
組合模型的預(yù)測值表示為
組合模型預(yù)測的誤差為
組合模型預(yù)測的誤差平方和為
通過計(jì)算得到各自的權(quán)重及組合預(yù)測的誤差平方和為
新疆小麥產(chǎn)量占據(jù)新疆糧食總產(chǎn)量的 41%以上,是新疆全區(qū)糧食安全發(fā)展的關(guān)鍵[11].為了研究新疆小麥發(fā)展現(xiàn)狀,從《中國統(tǒng)計(jì)年鑒》選取了1999~2020年新疆小麥產(chǎn)量(Y1t:萬噸)、新疆小麥播種面積(Y2t:千公頃)、全國小麥種植結(jié)構(gòu)(Y3t:%)3個(gè)主要指標(biāo)作為被解釋變量,以新疆耕地灌溉面積(X1t:千公頃)、新疆農(nóng)用化肥施用量(X2t:萬噸)、新疆農(nóng)業(yè)機(jī)械總動(dòng)力(X3t:萬千瓦)3個(gè)方面的時(shí)間序列數(shù)據(jù)分別作為它們的解釋變量進(jìn)行建模,分別表示為①、②、③.
在數(shù)據(jù)采集的過程中,2003年與2007年的個(gè)別數(shù)據(jù)缺失,為了便于分析,首先利用樣條插值法將原始數(shù)據(jù)中的缺失值進(jìn)行插補(bǔ),然后取對數(shù),處理之后的數(shù)據(jù)記作{lnYit}與{lnXit},i=1,2,3;t=1999年,2000年,…,2020年.處理之后的時(shí)間序列圖如圖2所示.
從圖2能夠看出,小麥產(chǎn)量增長時(shí)段為1999~2000年、2004~2006年、2008~2011年、2012~2017年,產(chǎn)量下降年分為2000~2004年、2006~2008年、2011~2012年、2017~2020年;小麥種植面積與小麥產(chǎn)量具有同方向的增減趨勢;全國小麥種植結(jié)構(gòu)在1999~2004年這段時(shí)間下降幅度較大,2004~2010年呈增長趨勢,2010~2020年大致呈緩慢下降趨勢;耕地灌溉面積、農(nóng)用化肥施用量與新疆農(nóng)業(yè)機(jī)械總動(dòng)力總體為增長趨勢,并且各序列均表現(xiàn)出明顯的非平穩(wěn)性,直接建??赡軙a(chǎn)生偽回歸問題,即擬合得到的殘差序列非平穩(wěn).在實(shí)際研究中,若響應(yīng)變量序列與解釋變量序列之間存在長期的均衡關(guān)系,即協(xié)整關(guān)系,說明殘差序列平穩(wěn),此時(shí)用非平穩(wěn)序列也可以直接建模.
圖2 對原始數(shù)據(jù)取處理之后的時(shí)序圖
建立動(dòng)態(tài)回歸ARIMAX模型之前,先對序列進(jìn)行預(yù)白噪聲處理.即首先對單一序列{lnXit}建立合適的ARIMA模型,得到相應(yīng)的殘差序列{εXit}.對序列{lnYit}實(shí)施同樣的變換,得到殘差序列{εYit};然后考查{εXit}與{εYit}的互相關(guān)系數(shù),判斷是否存在滯后效應(yīng),確定所要擬合的模型結(jié)構(gòu)[12];通過分析,初步建立響應(yīng)序列{lnYit}與輸入序列{lnXit}間的ARIMAX模型,判斷得到的殘差序列{εit}是否平穩(wěn),若平穩(wěn),則模型可行,否則進(jìn)一步用ARMA模型擬合殘差序列,直到最終的殘差序列為白噪聲序列.參數(shù)和模型均通過檢驗(yàn),此時(shí)認(rèn)為得到的模型為最優(yōu)模型,能充分提取數(shù)據(jù)的信息.殘差序列{εXit}與{εYit}的互相關(guān)系數(shù)如圖3所示.
圖3 殘差序列{εXit}與{εYit}的互相關(guān)系數(shù)圖
圖3中最上面一行的三個(gè)圖為殘差序列{εY1t}與殘差序列{εXit}的互相關(guān)系數(shù)圖;中間一行為殘差序列{εY2t}與殘差序列{εXit}的互相關(guān)系數(shù)圖;第三行為殘差序列{εY3t}與殘差序列{εXit}的互相關(guān)系數(shù)圖.
從圖中可以看出,{εY1t}、{εY2t}都是滯后于{εX3t}1階時(shí)互相關(guān)系數(shù)最大,{εX2t}滯后于{εY2t}4階時(shí)互相關(guān)系數(shù)最大.結(jié)合以上分析及反復(fù)調(diào)試,最終模型的擬合結(jié)果與殘差序列的平穩(wěn)性檢驗(yàn)結(jié)果如表1所列.
表1 模型檢驗(yàn)結(jié)果與殘差序列的白噪聲檢驗(yàn)結(jié)果
表1是三組數(shù)據(jù)在ARIMAX模型擬合下的檢驗(yàn)結(jié)果與相應(yīng)的殘差序列的白噪聲檢驗(yàn)結(jié)果,從檢驗(yàn)結(jié)果可以看出:模型的擬合優(yōu)度R2均大于0.8402,AIC值與誤差平方和(SSE1)都很小,即認(rèn)為ARIMAX擬合結(jié)果較理想,提取了數(shù)據(jù)的大部分信息.此外,各模型的殘差序列檢驗(yàn)的P值均大于顯著性水平0.05,不能拒絕原假設(shè),即認(rèn)為由ARIMAX模型擬合得到的各殘差序列均屬于白噪聲,且都達(dá)到平穩(wěn),因此所建模型合理.三個(gè)ARIMAX動(dòng)態(tài)回歸模型的顯著性檢驗(yàn)圖如圖4~圖6所示.
圖4 ARIMAX動(dòng)態(tài)回歸模型①的顯著性檢驗(yàn)圖
圖5 ARIMAX動(dòng)態(tài)回歸模型②的顯著性檢驗(yàn)圖
圖6 ARIMAX動(dòng)態(tài)回歸模型③的顯著性檢驗(yàn)圖
從圖4~6可看出:三個(gè)模型擬合得到的殘差序列均為白噪聲序列,與表4中的檢驗(yàn)結(jié)果吻合,說明擬合的協(xié)整動(dòng)態(tài)回歸模型顯著成立.
序列{lnYit}與自變量序列{lnXit}之間的長期均衡關(guān)系為
其中:at~N(0,0.011);ε2t~N(0,0.008);ε3t~N(0,0.0003).
神經(jīng)網(wǎng)絡(luò)的輸入層為{lnXit},輸出層為{lnYit}.在訓(xùn)練過程中設(shè)定學(xué)習(xí)率為0.001,學(xué)習(xí)次數(shù)為10000,擬合誤差為10-4.得到合理的BP神經(jīng)網(wǎng)絡(luò)模型后,再將原輸入層的序列數(shù)據(jù)回代預(yù)測,計(jì)算出相應(yīng)的誤差平方和SSE2、擬合優(yōu)度R2等檢驗(yàn)指標(biāo)值,結(jié)果如表2所列.
表2 BP神經(jīng)網(wǎng)絡(luò)算法擬合的檢驗(yàn)結(jié)果
表2為BP神經(jīng)網(wǎng)絡(luò)算法的擬合優(yōu)度R2與相應(yīng)的誤差平方和SSE2,從兩個(gè)評價(jià)指標(biāo)可以看出:擬合優(yōu)度R2均大于0.72,誤差平方和SSE2均小于0.4,因此認(rèn)為BP神經(jīng)網(wǎng)絡(luò)模型擬合數(shù)據(jù)的結(jié)果較好,基本提取了數(shù)據(jù)的大部分信息.
通過對ARIMAX模型與BP神經(jīng)網(wǎng)絡(luò)模型擬合結(jié)果的比較得知兩種模型的擬合優(yōu)度R2與誤差平方和SSE結(jié)果表現(xiàn)較好.總體來說,ARIMAX模型優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型,但是二者在預(yù)測結(jié)果方面存在一定的差異,因此考慮用二者的組合模型進(jìn)一步預(yù)測.根據(jù)本文組合預(yù)測權(quán)值與總誤差平方和的計(jì)算方法,計(jì)算得到三組數(shù)據(jù)的ARIMAX模型與BP神經(jīng)網(wǎng)絡(luò)算法的組合權(quán)重如表3所列.
表3 組合模型的權(quán)重與總誤差平方和
從表3中可以看出:三組數(shù)據(jù)的ARIMAX模型的權(quán)重大于BP神經(jīng)網(wǎng)絡(luò)算法的權(quán)重,說明數(shù)據(jù)更依賴于ARIMAX模型.從誤差平方和來看,組合模型
三種模型的擬合情況如圖7~圖9所示.由于組合模型具有ARIMAX模型與BP神經(jīng)網(wǎng)絡(luò)模型雙方面的特點(diǎn),因此從圖中也可以看出:組合模型的預(yù)測值更接近真實(shí)值,更能刻畫數(shù)據(jù)波動(dòng)的規(guī)律性.
圖7 三種模型對lnY1t的預(yù)測結(jié)果圖
圖8 三種模型對lnY2t的預(yù)測結(jié)果圖
圖9 三種模型對lnY3t的預(yù)測結(jié)果圖
本文建立多元時(shí)間序列回歸ARIMAX模型、BP神經(jīng)網(wǎng)絡(luò)算法及二者的組合模型,通過回代法預(yù)測1999~2020年新疆小麥產(chǎn)量、新疆小麥播種面積以及全國小麥種植結(jié)構(gòu)數(shù)據(jù)的波動(dòng)規(guī)律,并根據(jù)每種方法預(yù)測的誤差平方和、擬合優(yōu)度等指標(biāo)評價(jià)模型的優(yōu)劣,得到如下結(jié)論.
第一,經(jīng)過模型檢驗(yàn)與評價(jià),兩種單一模型在預(yù)測本文數(shù)據(jù)時(shí)表現(xiàn)較好,在刻畫本文數(shù)據(jù)上,多元時(shí)間序列回歸ARIMAX模型較BP神經(jīng)網(wǎng)絡(luò)算法更具說服力,但是由于單一模型本身的限制,仍然存在不能全面提取數(shù)據(jù)信息的可能性.通過組合預(yù)測權(quán)重法將兩種單一模型進(jìn)行組合,組合模型汲取了單一模型的優(yōu)點(diǎn),預(yù)測精度得到了明顯提高,相應(yīng)的擬合誤差也明顯比單一模型的誤差小.因此ARIMAX-BP神經(jīng)網(wǎng)絡(luò)組合模型在預(yù)測新疆小麥產(chǎn)量、新疆小麥播種面積以及全國小麥種植結(jié)構(gòu)上具有可行性.
第二,由組合模型的權(quán)重可知:ARIMAX模型的權(quán)重均大于BP神經(jīng)網(wǎng)絡(luò)算法的權(quán)重,即組合模型更依賴于ARIMAX模型,因此可依照ARIMAX模型對新疆小麥產(chǎn)量、新疆小麥種植面積以及全國小麥種植結(jié)構(gòu)波動(dòng)的規(guī)律進(jìn)一步解釋.首先對于新疆小麥產(chǎn)量來說,它主要受耕地灌溉面積與農(nóng)用化肥施用量兩個(gè)變量的影響,并且均與小麥產(chǎn)量呈正相關(guān)關(guān)系,而農(nóng)業(yè)機(jī)械總動(dòng)力對新疆小麥產(chǎn)量的影響較?。黄浯螌τ谛陆←湶シN面積來說,它受耕地灌溉面積的影響最大,農(nóng)用化肥施用量與農(nóng)業(yè)機(jī)械總動(dòng)力影響相對較?。蛔詈髮τ谌珖←湻N植化結(jié)構(gòu)來說,它與農(nóng)業(yè)機(jī)械總動(dòng)力呈現(xiàn)很強(qiáng)的負(fù)相關(guān)關(guān)系,可以認(rèn)為農(nóng)業(yè)機(jī)械總動(dòng)力在農(nóng)業(yè)的其他方面應(yīng)用較多,在小麥種植方面的投入較少,耕地灌溉面積與農(nóng)用化肥施用量兩個(gè)變量與小麥種植結(jié)構(gòu)呈正相關(guān)關(guān)系,這與小麥生產(chǎn)規(guī)律相符合.在本文研究過程中只用兩種模型進(jìn)行組合,并未考慮更多模型;此外,對變量的選取方面還需進(jìn)一步延伸,使預(yù)測結(jié)果更加準(zhǔn)確,這也是后續(xù)有待完善的方面.
蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版)2021年6期