文歡+陳華
摘要:為提高加工番茄產(chǎn)量預(yù)測(cè)精度,提出一種串聯(lián)型組合灰色神經(jīng)網(wǎng)絡(luò)模型(grey neutral net model,GNNM)的番茄產(chǎn)量預(yù)測(cè)方法。通過(guò)以新疆某加工番茄產(chǎn)業(yè)基地的歷史數(shù)據(jù)作為研究對(duì)象,利用灰色關(guān)聯(lián)分析法,獲取與加工番茄產(chǎn)量相關(guān)性較大的影響因素,剔除非主要影響因素。以主要影響因素和灰色模型(grey model,GM)預(yù)測(cè)值作為神經(jīng)網(wǎng)絡(luò)模型輸入,加工番茄產(chǎn)量作為輸出,構(gòu)建GNNM預(yù)測(cè)模型。仿真試驗(yàn)結(jié)果表明,新預(yù)測(cè)模型具有更好的逼近能力和預(yù)測(cè)精度,為加工番茄產(chǎn)量精準(zhǔn)預(yù)測(cè)提供了一種新的方法。
關(guān)鍵詞:加工番茄;灰色模型;神經(jīng)網(wǎng)絡(luò);產(chǎn)量預(yù)測(cè)
中圖分類(lèi)號(hào): S11文獻(xiàn)標(biāo)志碼: A
文章編號(hào):1002-1302(2017)11-0167-04[HS)][HT9.SS]
新疆獨(dú)特的光熱和水土條件成就了優(yōu)質(zhì)番茄的生長(zhǎng),為大規(guī)模的番茄醬加工創(chuàng)造了有利條件。加工番茄作為新疆的優(yōu)勢(shì)果蔬產(chǎn)業(yè),種植規(guī)模達(dá)7萬(wàn)hm2以上,已經(jīng)達(dá)到全國(guó)總產(chǎn)量的90%,番茄醬出口量接近全國(guó)貿(mào)易總量的1/4,被譽(yù)為新疆的紅色支柱產(chǎn)業(yè)[1]。因此研究加工番茄產(chǎn)量預(yù)測(cè)模型可以為本地區(qū)番茄種植規(guī)劃、番茄產(chǎn)業(yè)的宏觀(guān)調(diào)控、加工及儲(chǔ)藏等方面提供一定的參考價(jià)值。
然而國(guó)內(nèi)針對(duì)加工番茄產(chǎn)量預(yù)測(cè)的理論研究較少,已有的相關(guān)研究大都集中于線(xiàn)性回歸模型、移動(dòng)平均法、指數(shù)平滑法和誤差反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)等預(yù)測(cè)方法上。姜波等利用粒子濾波對(duì)番茄產(chǎn)量進(jìn)行短期預(yù)測(cè)[2];袁莉等運(yùn)用灰色系統(tǒng)理論建立了加工番茄產(chǎn)量預(yù)測(cè)灰色模型[3];尤坤鵬等采用馬爾科夫預(yù)測(cè)技術(shù)建立番茄產(chǎn)量預(yù)測(cè)模型[4];韓澤群等通過(guò)加權(quán)將3種統(tǒng)計(jì)分析方法加以組合建立了組合預(yù)測(cè)模型[5]。綜上所述,前人采用了不同的預(yù)測(cè)方法對(duì)加工番茄產(chǎn)量進(jìn)行預(yù)測(cè),并取得了一定的成果,但是在對(duì)加工番茄產(chǎn)量進(jìn)行建模預(yù)測(cè)時(shí),忽略了加工番茄產(chǎn)量與其影響因素之間存在著灰色性、不確定性和模糊性的關(guān)系,影響了預(yù)測(cè)精度和可靠性。
針對(duì)上述問(wèn)題,本研究提出串聯(lián)型組合灰色神經(jīng)網(wǎng)絡(luò)模型(grey neutral net model,GNNM),通過(guò)灰色關(guān)聯(lián)分析法對(duì)影響加工番茄產(chǎn)量的因素進(jìn)行全面定量分析,選擇關(guān)聯(lián)度較高的影響因素作為GNNM模型的輸入節(jié)點(diǎn),將GM(1,1)與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行組合應(yīng)用于加工番茄的產(chǎn)量預(yù)測(cè), 通過(guò)仿真結(jié)[LM]果分析,該預(yù)測(cè)模型可進(jìn)一步提高加工番茄產(chǎn)量的預(yù)測(cè)精度,為制定合理的種植規(guī)劃和管理決策提供科學(xué)依據(jù)。
1基本原理與方法
1.1灰色預(yù)測(cè)模型
灰色預(yù)測(cè)又稱(chēng)為灰色系統(tǒng)預(yù)測(cè),即通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行處理并分析其中的變化規(guī)律,生成具有較強(qiáng)規(guī)律性的數(shù)據(jù)序列,然后建立相應(yīng)的灰色系統(tǒng)模型,從而定量預(yù)測(cè)系統(tǒng)的未來(lái)狀態(tài)。灰色系統(tǒng)理論與方法的核心是灰色模型,而灰色模型是通過(guò)序列生成而建立的近似微分方程,是具有部分微分、部分差分性質(zhì)的模型[6]?;疑P蛻?yīng)用最廣泛的是灰色序列模型,它采用一階單變量灰微分型方程,即GM(1,1)。
設(shè)非負(fù)原始序列為
即得到原始數(shù)據(jù)序列的預(yù)測(cè)值。
1.2GNNM預(yù)測(cè)模型
灰色預(yù)測(cè)的優(yōu)點(diǎn)是所需樣本數(shù)據(jù)少,不需要考慮其分布規(guī)律及變化趨勢(shì),建模比較簡(jiǎn)單,而且運(yùn)算方便[7];但是缺乏自學(xué)習(xí)、自組織和自適應(yīng)能力,對(duì)非線(xiàn)性信息的處理能力較弱,不適合逼近復(fù)雜的非線(xiàn)性函數(shù)。而B(niǎo)P神經(jīng)網(wǎng)絡(luò)是由大量簡(jiǎn)單的神經(jīng)元相互連接構(gòu)成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),其非線(xiàn)性系統(tǒng)具有很強(qiáng)的模擬能力[8-9]和很強(qiáng)的學(xué)習(xí)、聯(lián)想、容錯(cuò)、逼近任意函數(shù)的能力,但會(huì)因?yàn)檫^(guò)分逼近數(shù)據(jù)變化曲線(xiàn)上的細(xì)節(jié)而影響泛化能力。
灰色預(yù)測(cè)的少信息、建模簡(jiǎn)單及非線(xiàn)性處理能力弱等特征與BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)大樣本、非線(xiàn)性處理能力及學(xué)習(xí)能力強(qiáng)等特點(diǎn)具有優(yōu)勢(shì)互補(bǔ)性,將灰色模型與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行組合應(yīng)用于產(chǎn)量預(yù)測(cè),能夠提高預(yù)測(cè)精度、可靠性和穩(wěn)定性[10-12]。因此,本研究提出一種串聯(lián)型灰色神經(jīng)網(wǎng)絡(luò)模型,其原理是將加工番茄產(chǎn)量歷史數(shù)據(jù)歸一化后作為灰色預(yù)測(cè)模型的輸入,通過(guò)計(jì)算得到歷史數(shù)據(jù)序列的預(yù)測(cè)值,將預(yù)測(cè)值與影響加工番茄產(chǎn)量的主要因素統(tǒng)一綜合到BP神經(jīng)網(wǎng)絡(luò)作為輸入樣本,實(shí)際值作為輸出樣本,采取一定的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,利用神經(jīng)網(wǎng)絡(luò)的非線(xiàn)性擬合能力和能夠逼近任意函數(shù)的特性,得到一系列相應(yīng)節(jié)點(diǎn)的權(quán)值和閾值,實(shí)現(xiàn)預(yù)測(cè)值與實(shí)際值的最佳擬合。
其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示,其中di為灰色預(yù)測(cè)模型預(yù)測(cè)值輸入?yún)?shù),f1、f2、f3為主要影響因素輸入?yún)?shù);ω21、ω22、…ω2n、ω31、ω32、…ω3n為BP神經(jīng)網(wǎng)絡(luò)權(quán)值,y為GNNM模型輸出預(yù)測(cè)值。
2加工番茄產(chǎn)量影響因素選擇
加工番茄產(chǎn)量涉及到諸多外部和內(nèi)部因素,為提高番茄產(chǎn)量的預(yù)測(cè)精度,需要對(duì)這些因素進(jìn)行分析。表1為2000—
[FL(2K2]2014年新疆某加工番茄基地番茄產(chǎn)量(N0)及其影響因素的歷史數(shù)據(jù),其中影響番茄產(chǎn)量的因素由第一產(chǎn)業(yè)勞動(dòng)力(N1)、農(nóng)業(yè)機(jī)械總動(dòng)力(N2)、有效灌溉面積(N3)、化肥施用量(N4)、受災(zāi)面積(N5)及成災(zāi)面積(N6)等6個(gè)因素組成。[JP2]考慮到各因素之間的相關(guān)性會(huì)使番茄產(chǎn)量預(yù)測(cè)結(jié)果不準(zhǔn)確,且不同的因素對(duì)其產(chǎn)量的影響程度不同,因此,為確定各因素對(duì)番茄產(chǎn)量的影響大小,本研究通過(guò)灰色關(guān)聯(lián)分析法對(duì)各因素進(jìn)行一定的主成分分析,從而得到影響加工番茄產(chǎn)量各因素所占的權(quán)重,對(duì)影響小的成分進(jìn)行剔除,保留影響較大的因子。[JP]
2.1參考數(shù)列與對(duì)比數(shù)列的確定
分別選取影響加工番茄產(chǎn)量的因素Ni(i=1,2,…,6)共6個(gè)變量作為參考數(shù)列,2000—2014年加工番茄產(chǎn)量N0作為對(duì)比數(shù)列,其中參考數(shù)列記為x0(k),對(duì)比數(shù)列記為xi(k)。
2.2數(shù)據(jù)無(wú)量綱化處理
數(shù)據(jù)量綱的不同會(huì)對(duì)分析結(jié)果產(chǎn)生一定的影響,為消除這種影響需要對(duì)數(shù)據(jù)進(jìn)行無(wú)量綱化處理。常用的有標(biāo)準(zhǔn)化、初始化、極差法和最大值化等[13],在此選用極差法進(jìn)行處理,其處理公式為
[JZ(]xij′=[SX(]xij-mjMj-mj[SX)](i=1,2,…,7;j=1,2,…,15)。[JZ)][JY](8)
其中,Mj=max[DD(]1≤i≤7[DD)]{xij},mj=min[DD(]1≤i≤7[DD)]{xij}(j=1,2,…,15),則x′ij∈[0,1]是無(wú)量綱的指標(biāo)觀(guān)測(cè)值。
2.3確定關(guān)聯(lián)系數(shù)與關(guān)聯(lián)度
參考數(shù)列x0(k)與對(duì)比數(shù)列xi(k)的關(guān)聯(lián)系數(shù)εi(k)為
εi(k)=[SX(]min[DD(]i[DD)] min[DD(]k[DD)]|xi(k)-x0(k)|+ρmax[DD(]i[DD)] max[DD(]k[DD)]|xi(k)-x0(k)||xi(k)-x0(k)|+ρmax[DD(]i[DD)] max[DD(]k[DD)]|xi(k)-x0(k)|[SX)],i=1,2,…,6;k=1,2,…,15。[JY](9)
其中,|xi(k)-x0(k)|為x0(k)和xi(k)第k個(gè)點(diǎn)的絕對(duì)誤差;min[DD(]i[DD)] min[DD(]k[DD)]|xi(k)-x0(k)|為兩級(jí)最小差;ρ為分辨系數(shù),ρ∈(0,1),一般取ρ=0.5,其作用一般在于提高關(guān)聯(lián)系數(shù)間的差異顯著性。對(duì)關(guān)聯(lián)系數(shù)進(jìn)一步處理后得到數(shù)列xi對(duì)x0的關(guān)聯(lián)度γi,其公式為
[JZ(]γi=[SX(]1n-1[SX)]∑[DD(]nk=1[DD)]εi(k)。[JZ)][JY](10)
計(jì)算得出番茄產(chǎn)量與影響因素之間的灰色關(guān)聯(lián)度,選取關(guān)聯(lián)度較高的第一產(chǎn)業(yè)勞動(dòng)力、有效灌溉面積和化肥施用量作為灰色神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)。
3GNNM模型實(shí)例驗(yàn)證
3.1GM(1,1)預(yù)測(cè)模型
利用MATLAB軟件編程建立GM(1,1),對(duì)表1中2000—2010年的番茄產(chǎn)量數(shù)據(jù)進(jìn)行預(yù)測(cè)。求得模型的系統(tǒng)發(fā)展系數(shù)a=-0.081 9,內(nèi)生控制變量b=174 101.8,則 GM(1,1) 的白化響應(yīng)式為
x[DD(-1*2][HT6]^[DD)](1)(k+1)=2 294 203.81e-0.081 9k-2 125 271.3(k=0,1,2,3…)。[JY](11)
通過(guò)MATLAB軟件求得最終預(yù)測(cè)值(表2)。
3.2建立GNNM
將表2中GM(1,1)預(yù)測(cè)的2000—2010年產(chǎn)量數(shù)據(jù)和表1中灰色關(guān)聯(lián)度較高的3個(gè)影響因素同時(shí)作為網(wǎng)絡(luò)訓(xùn)練樣本,2011—2014年的歷史產(chǎn)量數(shù)據(jù)作為測(cè)試樣本,使用 MATLAB 軟件建立GNNM,并與GM(1,1)、BP網(wǎng)絡(luò)進(jìn)行比較分析。
由于表1中數(shù)據(jù)間數(shù)量級(jí)存在差別,為避免因?yàn)檩敵鰯?shù)
據(jù)數(shù)量級(jí)差別而造成網(wǎng)絡(luò)預(yù)測(cè)誤差較大,故先對(duì)數(shù)據(jù)按照公式(12)進(jìn)行歸一化處理。
[JZ(]x′k=[SX(]xk-xminxmax-xmin[SX)](k=1,2,3,…)。[JZ)][JY](12)
其中,xmax為序列中的最大值,xmin為序列中的最小值,最終把所有數(shù)據(jù)轉(zhuǎn)化為[0,1]之間的數(shù)。
本研究選擇3層BP神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)多次訓(xùn)練,根據(jù)網(wǎng)絡(luò)預(yù)測(cè)輸出與期望輸出的誤差調(diào)整權(quán)值和閾值,得出誤差最小的隱含層節(jié)點(diǎn)數(shù)為10。由于本研究中輸入數(shù)據(jù)為4維,輸出為1維,故網(wǎng)絡(luò)結(jié)構(gòu)為4-10-1。輸入層與隱含層的傳輸函數(shù)為Sigmoid函數(shù)f(x)=[SX(]11+e-x[SX)],隱含層與輸出層傳遞函數(shù)為Purelin函數(shù)。設(shè)定訓(xùn)練精度為0.000 01,訓(xùn)練次數(shù)為 1 000,訓(xùn)練方法采用動(dòng)量法和學(xué)習(xí)率自適應(yīng)調(diào)整策略。
對(duì)設(shè)計(jì)好的GNNM進(jìn)行訓(xùn)練,訓(xùn)練穩(wěn)定后得到的均方誤差在迭代10次時(shí)達(dá)到9.9×10-6,網(wǎng)絡(luò)平滑地收斂于全局極小值(圖2)。
于實(shí)際數(shù)據(jù),2010—2014年番茄產(chǎn)量預(yù)測(cè)值與實(shí)際值擬合程度較好。
為了進(jìn)一步驗(yàn)證GNNM的預(yù)測(cè)效果,本研究用GM(1,1)、BP神經(jīng)網(wǎng)絡(luò)、GNNM對(duì)2011—2014年番茄產(chǎn)量預(yù)測(cè)結(jié)果進(jìn)行分析對(duì)比。從表3可知,采用GM(1,1)、BP神經(jīng)網(wǎng)絡(luò)和GNNM的預(yù)測(cè)結(jié)果與實(shí)測(cè)值的相對(duì)誤差絕對(duì)值均小于10%,其均方誤差分別為7.68%、1.98%、0.61%。用GM(1,1)進(jìn)行加工番茄產(chǎn)量預(yù)測(cè)時(shí),其方法雖然簡(jiǎn)單,但是預(yù)測(cè)精度并不高。對(duì)于BP神經(jīng)網(wǎng)絡(luò)模型來(lái)說(shuō),加工番茄產(chǎn)量預(yù)測(cè)精度有所提高,但個(gè)別年份預(yù)測(cè)精度并沒(méi)有改善。相比較而言,GNNM 的擬合精度、預(yù)測(cè)效果均優(yōu)于GM(1,1)和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,更符合準(zhǔn)確預(yù)測(cè)精度要求。因此,選擇GNNM模型進(jìn)行加工番茄產(chǎn)量預(yù)測(cè)是可行、高效的。
4結(jié)論
本研究利用GM(1,1)與BP神經(jīng)網(wǎng)絡(luò)各自的優(yōu)點(diǎn)組合進(jìn)行加工番茄產(chǎn)量預(yù)測(cè),同時(shí)考慮到影響加工番茄產(chǎn)量的6個(gè)因素,采用灰色關(guān)聯(lián)度分析法選取其中3個(gè)關(guān)聯(lián)度高的因素作為BP神經(jīng)網(wǎng)絡(luò)的輸入,構(gòu)建了以新疆某加工番茄基地為例的GNNM,預(yù)測(cè)加工番茄產(chǎn)量。仿真結(jié)果表明,與 GM(1,1) 和BP神經(jīng)網(wǎng)絡(luò)單一預(yù)測(cè)模型相比,GNNM的均方差更小、精度更高,更符合加工番茄產(chǎn)量預(yù)測(cè),對(duì)農(nóng)業(yè)生產(chǎn)實(shí)踐具有指導(dǎo)意義。
參考文獻(xiàn):
[1]唐世輝,霍彬,朱平. 新疆番茄產(chǎn)業(yè)發(fā)展現(xiàn)狀分析[J]. 合作經(jīng)濟(jì)與科技,2014(11):8-10.
[2]姜波,許競(jìng). 粒子濾波在農(nóng)作物產(chǎn)能短期預(yù)測(cè)中的應(yīng)用[J]. 江蘇農(nóng)業(yè)科學(xué),2012,40(3):357-358.
[3]袁莉,姜波. 基于灰色系統(tǒng)理論的加工番茄產(chǎn)量預(yù)測(cè)模型研究[J]. 農(nóng)業(yè)科學(xué)與技術(shù),2011,12(5):632-633,642.
[4]尤坤鵬,姜波. 馬爾科夫鏈在加工番茄產(chǎn)量預(yù)測(cè)中的應(yīng)用研究[J]. 安徽農(nóng)學(xué)通報(bào),2012,18(15):29-30,38.
[5]韓澤群,姜波. 加工番茄產(chǎn)量組合預(yù)測(cè)模型研究[J]. 中國(guó)農(nóng)學(xué)通報(bào),2013,29(3):161-165.[HJ1.7mm]
[6]郭秀英. 預(yù)測(cè)決策的理論與方法[M]. 北京:化學(xué)工業(yè)出版社,2010.
[7]Liu S F,Tao L Y,Xie N M,et al. On the new model system and framework of grey system theory[C]//Grey Systems and Intelligent Services (GSIS),IEEE International Conference,2015.
[8]Hsu C C,Chen C Y. Applications of improved grey prediction model for power demand forecasting[J]. Energy Conversion and Management,2003,44(14):2241-2249.
[9]李吉龍,劉新平. 基于BP神經(jīng)網(wǎng)絡(luò)的未利用地開(kāi)發(fā)生態(tài)風(fēng)險(xiǎn)預(yù)警研究——以新疆阜康市為例[J]. 江蘇農(nóng)業(yè)科學(xué),2015,43(10):500-503.[ZK)]
[10]劉靜,傅澤田,張小栓. 基于GM-RBF神經(jīng)網(wǎng)絡(luò)的冷鏈運(yùn)輸環(huán)境預(yù)測(cè)[J]. 江蘇農(nóng)業(yè)科學(xué),2015,43(10):498-500.
[11]張婷. 基于灰色神經(jīng)網(wǎng)絡(luò)組合模型的能源需求預(yù)測(cè)[D]. 天津:天津大學(xué),2007.
[12]史峰,王小川,郁磊,等. MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M]. 北京:北京航空航天出版社,2010:258-267.
[13]何乃強(qiáng),惠曉濱,周漩. 基于正態(tài)區(qū)間估計(jì)的改進(jìn)型無(wú)量綱化方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2012,48(5):236-238.[ZK)][HT][HJ][FL)]