劉合兵,韓晶晶,席 磊
(河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,鄭州450002)
物價(jià)可以直觀反映我國(guó)國(guó)民經(jīng)濟(jì)和發(fā)展?fàn)顩r,根據(jù)我國(guó)居民目前的收入水平及消費(fèi)結(jié)構(gòu)現(xiàn)狀,食品價(jià)格漲跌將直接影響我國(guó)物價(jià)總水平的變化,其中農(nóng)產(chǎn)品價(jià)格的變化影響更為顯著。農(nóng)產(chǎn)品價(jià)格下降會(huì)降低生產(chǎn)者及經(jīng)營(yíng)者的收益,而價(jià)格上漲會(huì)增加居民的生活成本。農(nóng)產(chǎn)品價(jià)格的劇烈波動(dòng)對(duì)人們?nèi)粘I钤斐芍苯佑绊?,不利于社?huì)的穩(wěn)定。農(nóng)產(chǎn)品價(jià)格的穩(wěn)定受到社會(huì)廣泛關(guān)注,對(duì)農(nóng)產(chǎn)品價(jià)格進(jìn)行準(zhǔn)確預(yù)測(cè)成為當(dāng)前研究重點(diǎn)。通過(guò)開(kāi)展農(nóng)產(chǎn)品價(jià)格的分析與預(yù)測(cè),為農(nóng)戶及生產(chǎn)經(jīng)營(yíng)者提供前瞻性信息,及時(shí)調(diào)整生產(chǎn)及銷售思路,防范農(nóng)產(chǎn)品價(jià)格異常波動(dòng)帶來(lái)的損失,提高農(nóng)業(yè)市場(chǎng)風(fēng)險(xiǎn)規(guī)避能力,為當(dāng)?shù)卣雠_(tái)穩(wěn)定農(nóng)產(chǎn)品市場(chǎng)供需和價(jià)格相關(guān)政策提供決策參考,同時(shí),也為消費(fèi)者進(jìn)行日常飲食消費(fèi)選擇提供參考。
農(nóng)產(chǎn)品種植受氣候限制和影響,農(nóng)產(chǎn)品生產(chǎn)大多具有明顯的周期特征。農(nóng)產(chǎn)品價(jià)格主要受市場(chǎng)供需影響,表現(xiàn)出季節(jié)性,趨勢(shì)性及隨機(jī)性等特點(diǎn),其時(shí)間序列呈現(xiàn)典型的非線性特征。國(guó)內(nèi)外對(duì)于價(jià)格的短期預(yù)測(cè)方法主要分為3種:傳統(tǒng)時(shí)間序列預(yù)測(cè)方法、智能預(yù)測(cè)方法和組合預(yù)測(cè)模型。傳統(tǒng)時(shí)間序列預(yù)測(cè)方法主要基于計(jì)量經(jīng)濟(jì)學(xué)方法進(jìn)行分析,包括季節(jié)指數(shù)法、移動(dòng)平均法、指數(shù)平滑法等。劉峰等[1]利用ARIMA(p,d,q)模型對(duì)白菜的月度價(jià)格走勢(shì)進(jìn)行預(yù)測(cè),結(jié)果證實(shí)ARIMA(0,1,1)模型對(duì)白菜價(jià)格進(jìn)行短期預(yù)測(cè)是可行的。苗開(kāi)超[2]選用指數(shù)平滑方法對(duì)番茄年度價(jià)格進(jìn)行預(yù)測(cè),結(jié)果表明該模型在分析預(yù)測(cè)線性度較好的情況下擬合度較高。李干瓊等[3]以番茄價(jià)格為研究對(duì)象,分別運(yùn)用ARIMA、ARCH和GARCH3種方法進(jìn)行預(yù)測(cè),結(jié)果證實(shí)GARCH模型在預(yù)測(cè)中具有更高的精度。張標(biāo)等[4]從蔬菜價(jià)格和上市量的波動(dòng)角度出發(fā),利用季節(jié)指數(shù)對(duì)蔬菜整體、果菜、葉菜和根莖菜分別構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)得知未來(lái)2年價(jià)格均繼續(xù)呈現(xiàn)出季節(jié)性變動(dòng)的緩慢上升趨勢(shì)。傳統(tǒng)時(shí)間序列預(yù)測(cè)方法在對(duì)具有線性特征的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)精度較高,但隨著市場(chǎng)逐漸向復(fù)雜化、非線性化、不規(guī)則化發(fā)展時(shí),該類方法在對(duì)價(jià)格進(jìn)行預(yù)測(cè)時(shí),為模型參數(shù)調(diào)整帶來(lái)較大困難,反映出一定的局限性。隨著人工智能的發(fā)展,智能預(yù)測(cè)方法如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、極限學(xué)習(xí)機(jī)等方法逐漸成為價(jià)格預(yù)測(cè)的熱點(diǎn)。其中BP神經(jīng)網(wǎng)絡(luò)方法在時(shí)間序列預(yù)測(cè)時(shí)具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu),同時(shí)又能使樣本預(yù)測(cè)誤差逼近最小的優(yōu)點(diǎn)。近年來(lái)一些學(xué)者針對(duì)農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)問(wèn)題探索了BP神經(jīng)網(wǎng)絡(luò)在此方面的應(yīng)用。解建強(qiáng)[5]通過(guò)對(duì)贛南臍橙的月度價(jià)格數(shù)據(jù)構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,預(yù)測(cè)結(jié)果表明基于改進(jìn)算法的BP神經(jīng)網(wǎng)絡(luò)價(jià)格預(yù)測(cè)模型的誤差低于ARIMA模型。任青山等[6]基于灰色關(guān)聯(lián)度和Stepwise回歸分析影響生豬價(jià)格波動(dòng)的主要影響因素,通過(guò)多元回歸分析和BP神經(jīng)網(wǎng)絡(luò)的交叉應(yīng)用建立了一種組合預(yù)測(cè)模型,結(jié)果證實(shí)組合預(yù)測(cè)模型比單一的預(yù)測(cè)模型精度高。然而B(niǎo)P神經(jīng)網(wǎng)絡(luò)的單獨(dú)應(yīng)用存在學(xué)習(xí)速度慢、容易陷入局部極小值的問(wèn)題?,F(xiàn)今基于小波變換的組合預(yù)測(cè)模型逐漸應(yīng)用在糧食產(chǎn)量、原油價(jià)格、增值稅預(yù)測(cè)方面,并驗(yàn)證了該方法的可行性和有效性[7-9]。
因此,文章研究了一種具有普適性且預(yù)測(cè)精度較好的農(nóng)產(chǎn)品價(jià)格組合預(yù)測(cè)模型,引入了小波變換對(duì)農(nóng)產(chǎn)品價(jià)格序列進(jìn)行分解,將這些分量作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量分別進(jìn)行預(yù)測(cè),并將預(yù)測(cè)結(jié)果進(jìn)行組合獲得最終農(nóng)產(chǎn)品的預(yù)測(cè)價(jià)格。選取2013—2018年河南省批發(fā)市場(chǎng)的5種蔬菜月均價(jià)格為例對(duì)小波變換和BP神經(jīng)網(wǎng)絡(luò)的組合模型進(jìn)行方法應(yīng)用,驗(yàn)證其可行性和精確性。
菠菜、大白菜、番茄、辣椒和馬鈴薯是居民日常消費(fèi)類蔬菜,也是葉菜類、果菜類和根莖菜類的代表,其價(jià)格的波動(dòng)直接影響消費(fèi)者的生活。該文以菠菜、大白菜、番茄、辣椒和馬鈴薯作為研究對(duì)象,從河南省農(nóng)產(chǎn)品信息監(jiān)測(cè)系統(tǒng)[10]下載5種農(nóng)產(chǎn)品的月均價(jià)格數(shù)據(jù),根據(jù)樣本的可獲得性和完整性原則,采集2013年1月至2018年12月共72組月均價(jià)格樣本數(shù)據(jù),將2013—2017年的樣本數(shù)據(jù)作為訓(xùn)練集,2018年的樣本數(shù)據(jù)作為測(cè)試集。
小波變換繼承和發(fā)展了傅里葉變換局部化的思想,能夠?qū)π盘?hào)進(jìn)行多尺度分析,在分解過(guò)程中能夠充分突出信號(hào)的細(xì)節(jié)特征,在信號(hào)高頻部分進(jìn)行時(shí)間細(xì)分,在低頻部分進(jìn)行頻率細(xì)分,從而達(dá)到聚焦信號(hào)細(xì)節(jié)特征的作用,實(shí)現(xiàn)對(duì)分析對(duì)象更為細(xì)致的逼近。
根據(jù)農(nóng)產(chǎn)品價(jià)格時(shí)間序列的分布特征,采用小波變換方法進(jìn)行去噪,提高時(shí)間序列信號(hào)的預(yù)測(cè)精度,主要是因?yàn)樾〔ㄗ儞Q可以同時(shí)觀察頻率和時(shí)間軸,可以分離信號(hào)的精細(xì)或粗糙部分,小波基的選擇具有多樣性等優(yōu)勢(shì)。不同的小波基對(duì)信號(hào)進(jìn)行小波變換得到不同的變換結(jié)果。在實(shí)際應(yīng)用中,并沒(méi)有統(tǒng)一的理論基礎(chǔ)和方法指導(dǎo)選擇。一般來(lái)說(shuō),農(nóng)產(chǎn)品價(jià)格屬于非平穩(wěn)的時(shí)間序列,而針對(duì)非平穩(wěn)的信號(hào)去噪應(yīng)用中應(yīng)該選擇正交的、中心頻率高且與原始信號(hào)形狀相匹配的小波基。因此,該文采用Daubechies小波基函數(shù),簡(jiǎn)稱dbN,N為小波的階數(shù),選擇階數(shù)為5,對(duì)選取的蔬菜價(jià)格時(shí)間序列進(jìn)行去噪處理。分解尺度過(guò)小會(huì)影響多因素條件下農(nóng)產(chǎn)品價(jià)格序列的細(xì)節(jié)特征信號(hào)突出,不利于預(yù)測(cè)精度的提高,而分解尺度過(guò)大則會(huì)加重實(shí)踐過(guò)程操作。該文選擇小波的分解尺度為3,可以避免分解尺度過(guò)大或過(guò)小產(chǎn)生的問(wèn)題。確定分解尺度后,對(duì)原始信號(hào)進(jìn)行db5的3尺度分解得到趨勢(shì)低頻部分a3及細(xì)節(jié)高頻部分d1、d2、d3,對(duì)農(nóng)產(chǎn)品價(jià)格波動(dòng)的頻率和幅度進(jìn)行更為細(xì)致的透視,如圖1所示。
人工神經(jīng)網(wǎng)絡(luò)通過(guò)模擬生物的神經(jīng)信號(hào)傳輸機(jī)制實(shí)現(xiàn)復(fù)雜的計(jì)算。BP神經(jīng)網(wǎng)絡(luò)是一種獨(dú)特的能夠?qū)⒂?jì)算誤差進(jìn)行反向傳播的多層前饋神經(jīng)網(wǎng)絡(luò)。它由輸入層、輸出層和隱含層構(gòu)成,其最簡(jiǎn)單的3層拓?fù)浣Y(jié)構(gòu)如圖2所示。
圖1 小波分解示意圖 Fig.1 Wavelet decomposition diagram
該文利用BP神經(jīng)網(wǎng)絡(luò)自主學(xué)習(xí)后能夠根據(jù)實(shí)際輸出的誤差反復(fù)調(diào)整權(quán)值和閾值直至達(dá)到指定精度的優(yōu)勢(shì)用于預(yù)測(cè)農(nóng)產(chǎn)品價(jià)格時(shí)間序列。其工作流程如下:(1)將輸入樣本提供給輸入層神經(jīng)元,逐層正向傳遞信號(hào),直到產(chǎn)生輸出結(jié)果;(2)計(jì)算輸出層的誤差,將誤差逆向傳輸至隱層神經(jīng)元;(3)根據(jù)誤差對(duì)連接權(quán)和閾值進(jìn)行調(diào)整;(4)回到步驟(2),循環(huán)進(jìn)行,直到達(dá)到停止條件。選取2013—2017年月均數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,2018年月均數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,傳遞函數(shù)選擇tansig函數(shù),訓(xùn)練函數(shù)選擇trainlm函數(shù),權(quán)值學(xué)習(xí)函數(shù)和性能函數(shù)都選擇默認(rèn)函數(shù)learngdm函數(shù)和mse函數(shù),迭代次數(shù)為1 000次。
該文運(yùn)用MATLAB R2014b軟件分別對(duì)選取的菠菜、大白菜、番茄、辣椒和馬鈴薯的月均價(jià)格數(shù)據(jù)運(yùn)用小波變換方法進(jìn)行db5的3尺度分解,分解出近似序列a3和細(xì)節(jié)序列d1、d2、d3。通過(guò)對(duì)原始時(shí)間序列的價(jià)格數(shù)據(jù)做細(xì)致分解,將不同的影響因素分離開(kāi),避免相互干擾,有利于后續(xù)模型預(yù)測(cè)精度的提升。然后對(duì)分解出來(lái)的4個(gè)序列分別采用BP神經(jīng)網(wǎng)絡(luò)方法進(jìn)行建模,通過(guò)不斷的調(diào)整參數(shù)使得預(yù)測(cè)值更為接近分解后的各序列值。最后對(duì)各個(gè)序列預(yù)測(cè)的結(jié)果進(jìn)行累加得出最終的農(nóng)產(chǎn)品預(yù)測(cè)價(jià)格,其流程如圖3所示。
圖3 數(shù)據(jù)預(yù)測(cè)流程圖Fig.3 Data prediction flow chart
為了實(shí)現(xiàn)較高的預(yù)測(cè)精度,該文分別對(duì)3個(gè)細(xì)節(jié)序列和1個(gè)近似序列進(jìn)行3層神經(jīng)網(wǎng)絡(luò)建模,4個(gè)序列的建模過(guò)程類似。以菠菜價(jià)格預(yù)測(cè)中的近似序列神經(jīng)網(wǎng)絡(luò)建模為例,首先對(duì)菠菜月均價(jià)格數(shù)據(jù)進(jìn)行歸一化處理,分解出2013—2017年菠菜月均價(jià)格的近似序列作為模型訓(xùn)練集,分解出2018年月均價(jià)格的近似序列作為測(cè)試集;設(shè)置神經(jīng)網(wǎng)絡(luò)各層節(jié)點(diǎn)的個(gè)數(shù)為7-5-1,當(dāng)前月份的前6個(gè)月的價(jià)格和上一年同月份的價(jià)格共7個(gè)數(shù)據(jù)作為輸入層數(shù)據(jù);對(duì)輸出數(shù)據(jù)進(jìn)行反歸一化處理,還原為價(jià)格數(shù)據(jù)。由于不同種類的農(nóng)產(chǎn)品原始價(jià)格不同,分解后的各序列波形不同,在進(jìn)行BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)時(shí)對(duì)應(yīng)的隱含層和輸入層的節(jié)點(diǎn)個(gè)數(shù)不同。BP神經(jīng)網(wǎng)絡(luò)建模實(shí)驗(yàn)由MATLAB編程實(shí)現(xiàn)。
為了評(píng)估組合預(yù)測(cè)模型的預(yù)測(cè)效果,選擇平均絕對(duì)誤差(MAE)、平均百分比誤差(MAPE)與均方根誤差(RMSE)指標(biāo)來(lái)度量預(yù)測(cè)結(jié)果的精度。各預(yù)測(cè)指標(biāo)的計(jì)算公式為:
式(1)~(3)中,n為價(jià)格樣本數(shù)量,yi為第i個(gè)樣本的月均價(jià)格。
農(nóng)產(chǎn)品價(jià)格序列通過(guò)小波變換后,被分解成1個(gè)近似序列a3和3個(gè)細(xì)節(jié)序列d3、d2、d1。該文通過(guò)小波變換對(duì)5種蔬菜月均價(jià)格進(jìn)行分解,分別得到5種蔬菜的4個(gè)序列數(shù)據(jù),為進(jìn)一步分析做準(zhǔn)備。如圖4為菠菜價(jià)格分解前后序列波形圖,其中s是菠菜價(jià)格的原始序列,直觀地反映了原始數(shù)據(jù)的波動(dòng)趨勢(shì)和幅度。圖4中a3是原始序列的近似序列曲線,其波動(dòng)狀態(tài)受主要因素的影響,反應(yīng)了原始數(shù)據(jù)的大趨勢(shì)。d1、d2和d3是原始序列的細(xì)節(jié)序列,代表著不同小權(quán)重因素影響下的細(xì)小波動(dòng)及振幅狀態(tài)。通過(guò)對(duì)比5種蔬菜分解后的各序列波形圖發(fā)現(xiàn),近似序列a3分解出來(lái)的數(shù)值均大于3個(gè)細(xì)節(jié)序列的數(shù)值,且a3序列的數(shù)值最接近于原始序列的值。3個(gè)細(xì)節(jié)序列的數(shù)值均處于0值上下波動(dòng)。而由于不同種類的蔬菜原始價(jià)格不同,分解后的各序列具體波動(dòng)形態(tài)不同。
圖4 菠菜價(jià)格各序列波形圖Fig.4 Waveform of each sequence of spinach price
該文采用統(tǒng)計(jì)分析方法對(duì)2013—2018年5種蔬菜月均價(jià)格進(jìn)行匯總,其價(jià)格變化趨勢(shì)如圖5所示。利用2013—2017年5種農(nóng)產(chǎn)品月均價(jià)格進(jìn)行訓(xùn)練,構(gòu)建的組合預(yù)測(cè)模型分別對(duì)5種農(nóng)產(chǎn)品2018年的月均價(jià)格進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如表1所示。采用評(píng)價(jià)指標(biāo)對(duì)組合模型的預(yù)測(cè)結(jié)果進(jìn)行精度評(píng)價(jià),其結(jié)果如表2所示。5種農(nóng)產(chǎn)品的預(yù)測(cè)價(jià)格與實(shí)際價(jià)格的偏差較小,其中馬鈴薯的平均絕對(duì)誤差值最小,為0.083元/kg;其次是大白菜,為0.085元/kg;菠菜則最高,為0.49元/kg。比較5種農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)結(jié)果的平均百分比誤差,辣椒的值最小,為3.95%;菠菜的值最大,為8.66%。比較均方根誤差,馬鈴薯最小,為 0.10元/kg,菠菜最大為0.61元/kg。從結(jié)果可知,5種蔬菜中菠菜的價(jià)格預(yù)測(cè)結(jié)果平均絕對(duì)誤差、平均百分比誤差和均方根誤差等評(píng)價(jià)指數(shù)均在最高值,比較5種蔬菜的價(jià)格變化規(guī)律可知,2013—2018年菠菜的月均價(jià)格波動(dòng)最劇烈,價(jià)格峰谷差值最大,達(dá)到12.73元/kg。而馬鈴薯和大白菜的峰谷差值分別為3.09和2.24元/kg。從價(jià)格走勢(shì)看,菠菜價(jià)格走勢(shì)呈現(xiàn)出較為明顯的“凸”型,年內(nèi)價(jià)格具有明顯的季節(jié)性,年間價(jià)格走勢(shì)趨于一致。而馬鈴薯和大白菜的價(jià)格走勢(shì)較為平滑,個(gè)別年份會(huì)出現(xiàn)較大波動(dòng),且不同年度價(jià)格的走勢(shì)存在差異。由此可知,價(jià)格波動(dòng)的頻率和幅度等特征會(huì)對(duì)小波變換—BP神經(jīng)網(wǎng)絡(luò)組合的價(jià)格預(yù)測(cè)模型預(yù)測(cè)結(jié)果產(chǎn)生影響,當(dāng)農(nóng)產(chǎn)品價(jià)格波動(dòng)幅度小、頻率低時(shí)預(yù)測(cè)結(jié)果更好。綜合分析可知,小波變換和BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型可以實(shí)現(xiàn)任意波動(dòng)形式的短期精準(zhǔn)預(yù)測(cè)。
圖5 價(jià)格變化時(shí)序圖Fig.5 Timing chart of price change
表1 小波變換—BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)結(jié)果Table 1 Combined prediction results of wavelet transform and BP neural network 元/kg
表2 小波變換—BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)結(jié)果評(píng)價(jià)Table 2 Evaluation of combined prediction results of wavelet transform and BP neural network
該文從蔬菜價(jià)格的綜合影響因素及具體波動(dòng)情況出發(fā),為減少價(jià)格數(shù)據(jù)中各序列在分析過(guò)程中的相互影響,采用先分解后集成的思想,構(gòu)建了小波變換和BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型對(duì)河南省5種蔬菜的月均價(jià)格進(jìn)行實(shí)證研究和預(yù)測(cè),研究表明組合模型的預(yù)測(cè)結(jié)果具有較高的預(yù)測(cè)精度,充分展示了小波變換和BP神經(jīng)網(wǎng)絡(luò)對(duì)非線性時(shí)間序列的處理能力及農(nóng)產(chǎn)品價(jià)格波動(dòng)幅度和強(qiáng)度會(huì)對(duì)該模型的預(yù)測(cè)精度產(chǎn)生影響。
因大多數(shù)預(yù)測(cè)模型的研究?jī)H針對(duì)單一種類的產(chǎn)品進(jìn)行實(shí)證分析,其預(yù)測(cè)方法及預(yù)測(cè)精度并不具有普適性。而該文提出的小波變換和BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型能對(duì)多種農(nóng)產(chǎn)品價(jià)格波動(dòng)進(jìn)行預(yù)測(cè),且對(duì)5種具有代表性的蔬菜進(jìn)行預(yù)測(cè)驗(yàn)證的結(jié)果說(shuō)明該模型具有較好的普適性。農(nóng)產(chǎn)品價(jià)格的短期精確預(yù)測(cè)能為未來(lái)價(jià)格走勢(shì)做出模擬,這對(duì)農(nóng)產(chǎn)品生產(chǎn)者、經(jīng)營(yíng)者、消費(fèi)者及相關(guān)政府部門(mén)具有重要的現(xiàn)實(shí)意義。因農(nóng)產(chǎn)品的種類較多,僅針對(duì)蔬菜產(chǎn)品進(jìn)行驗(yàn)證,不能代表其方法對(duì)肉類、水果類、糧油類及畜禽類具有同樣的效果,在今后還將應(yīng)用該模型對(duì)其他類型產(chǎn)品進(jìn)行分析,實(shí)現(xiàn)更多種類農(nóng)產(chǎn)品的價(jià)格預(yù)測(cè)。