鄭秀國,楊 娟,錢婷婷,許葉穎
(上海市農(nóng)業(yè)科學院農(nóng)業(yè)科技信息研究所,上海數(shù)字農(nóng)業(yè)工程技術(shù)研究中心,上海201403)
蔬菜是“菜籃子工程”的主要產(chǎn)品之一,蔬菜產(chǎn)業(yè)也是城市近郊農(nóng)業(yè)生產(chǎn)者的重要經(jīng)濟來源。 然而,蔬菜價格不僅受到市場供求、自然氣候、生產(chǎn)成本、市場流通等規(guī)律性因素的影響,還會受到突發(fā)的氣候變化、供求變化等影響,尤其是近年來大市場大流通下蔬菜供應(yīng)的季節(jié)性或種類性不均衡時有發(fā)生,導致蔬菜價格波動頻繁。
作為生物性產(chǎn)品,蔬菜的供應(yīng)受季節(jié)氣候的影響最大,其價格隨著供應(yīng)的周期性波動而波動,在時間序列上表現(xiàn)出明顯的季節(jié)性和周期性特征,時間序列模型可較好地反映這種變化特征。 常用于農(nóng)產(chǎn)品價格分析的時間序列模型有自回歸移動平均模型(ARIMA 模型)、季節(jié)自回歸移動平均模型(SARIMA 模型)和Holt-Winters 指數(shù)平滑模型(Holt-Winters 模型)等,其中SARIMA 模型、Holt-Winters 模型均考慮到季節(jié)性因素的影響[1]。 SARIMA 模型在農(nóng)產(chǎn)品價格分析預測中應(yīng)用十分廣泛,如陳燦煌等[2]、陳兆榮等[3]運用該模型預測了中國農(nóng)產(chǎn)品價格指數(shù),王云鵬[4]用其預測農(nóng)業(yè)生產(chǎn)資料價格指數(shù)。 應(yīng)用該模型預測農(nóng)產(chǎn)品價格、蔬菜價格和單種類蔬菜價格也都取得了較好的效果[5-7],也是雞蛋價格、肉雞價格、生豬價格、豬肉價格常用的分析預測方法[8-11]。 李干瓊等[12]采用5 種短期預測模型預測2009 年西紅柿價格,表明SARIMA 模型明顯優(yōu)于其他4 種模型。 王美鳳等[13]對4 種上海青菜價格預測模型進行了比較研究,表明SARIMA 模型的預測效果最好。 蔬菜價格是同期多種單種類菜價的匯總,開展蔬菜價格波動特征分析和預測研究,可為管理部門的政策調(diào)控和生產(chǎn)者的經(jīng)營決策提供參考,對于減少蔬菜價格大幅波動對市民生活和蔬菜生產(chǎn)者的影響具有重要意義,然而尚未見蔬菜總體價格的波動特征與預測分析研究的報道。 為此,本研究采用2010 年1 月—2019 年12 月上海蔬菜批發(fā)價數(shù)據(jù),建立上海蔬菜SARIMA 模型,進而對2020 年1—6 月上海蔬菜價格進行預測,通過模型預測效果分析進一步驗證模型效果,最后根據(jù)SARIMA 模型參數(shù)值分析上海蔬菜價格波動特征。
本研究所使用的數(shù)據(jù)序列為2010 年1 月至2020 年6 月上海蔬菜批發(fā)市場平均價格(元人民幣∕kg,下同),記為PR,來源于上海市農(nóng)產(chǎn)品價格監(jiān)測與分析預測系統(tǒng)。 其中2010 年1 月—2019 年12 月數(shù)據(jù)用于上海蔬菜SARIMA 模型建立,2020 年1—6 月數(shù)據(jù)用于進一步驗證分析模型預測效果。
SARIMA(p,d,q)(P,D,Q)模型結(jié)構(gòu)中,p 為自回歸項數(shù),q 為移動平均項數(shù),d 為差分次數(shù),P 是季節(jié)自回歸階數(shù),Q 是季節(jié)移動平均階數(shù),D 為季節(jié)差分次數(shù)。 具有季節(jié)性、趨勢性和周期性的平穩(wěn)數(shù)據(jù)序列{Bt,t=1,2,…},可以采用SARIMA(p,d,q)(P,D,Q)模型結(jié)構(gòu)建立模型。
首先對上海蔬菜批發(fā)價數(shù)據(jù)序列進行季節(jié)性、趨勢性檢驗。 季節(jié)性檢驗通常采用時間序列趨勢圖來判斷,若趨勢圖是以年為周期變動,則時間序列具有季節(jié)變動特征。 趨勢性檢驗是采用CensusX-12 乘法方法對數(shù)據(jù)序列進行季節(jié)調(diào)整分解,獲得季節(jié)調(diào)整后的趨勢循環(huán)序列,再運用H-P 濾波法對獲得的趨勢循環(huán)序列進行趨勢波動與循環(huán)波動序列分離,分離出的趨勢波動圖可觀察出序列的變化趨勢。
SARIMA 模型的建立與應(yīng)用可通過Eviews 軟件實現(xiàn),主要過程如下:
1)序列平穩(wěn)性檢驗。 可通過ADF 單位根檢驗來判斷,對于非平穩(wěn)時間序列,可以通過數(shù)據(jù)變換和差分實現(xiàn)序列的平穩(wěn)化,并采用時間序列的自相關(guān)函數(shù)(ACF)和偏相關(guān)函數(shù)(PACF)是否截尾來判定序列的平穩(wěn)性。
2)模型的識別。 主要通過觀察序列的自相關(guān)函數(shù)(ACF)和偏相關(guān)函數(shù)(PACF)對可能的p,d,q 和P,D,Q 的參數(shù)值進行估計,由此構(gòu)成不同的SARIMA 模型結(jié)構(gòu)形式。
3)模型的參數(shù)估計。 運用最小二乘法估計模型的系數(shù),并對其顯著性進行檢驗。 對于不同參數(shù)模型的選優(yōu)可采用BIC(貝葉斯信息)準則等綜合判斷。 最后,對選出的模型檢驗其殘差是否為白噪聲,一個適合的模型的殘差序列應(yīng)是白噪聲過程,其ACF 和PACF 不應(yīng)與0 有顯著性差異。
4)模型預測。 由上述過程確定模型的最終參數(shù)后,即可得到模型,使用模型進行預測。
從圖1 可以看出,上海蔬菜價格表現(xiàn)出較明顯的季節(jié)性,每年3 月至次年3 月蔬菜價格呈“W”型波動規(guī)律,價格高點多出現(xiàn)在3 月和9 月,價格低點多出現(xiàn)在6 月和11 月,數(shù)據(jù)在周期內(nèi)呈現(xiàn)整體遞增趨勢,為非平穩(wěn)序列。
首先,為消除序列可能存在的異方差,將原始序列進行對數(shù)化處理;其次,為消除趨勢性,對原始序列進行季節(jié)性差分和普通一階差分。 由圖2 可以看出,處理后序列ΔΔ12LnPR 的自相關(guān)函數(shù)ACF 和偏相關(guān)函數(shù)PACF 整體呈現(xiàn)截尾態(tài)勢,由此認為ΔΔ12LnPR 是平穩(wěn)的序列。
本研究選擇多種不同的模型進行擬合,如SARIMA(0,1,1) ×(1,1,1)12、SARIMA(2,1,1) ×(1,1,1)12、SARIMA(2,1,1) ×(1,1,2)12、SARIMA(2,1,2) ×(2,1,1)12、SARIMA(2,1,2) ×(2,1,2)12等p、q 和P、Q為3 以內(nèi)的各種取值組合,發(fā)現(xiàn)SARIMA(3,1,3) ×(2,1,0)12參數(shù)顯著性t檢驗結(jié)果最好。 從表1 可以看出,該模型結(jié)構(gòu)各參數(shù)的相伴概率均小于0.15,確定上海蔬菜模型結(jié)構(gòu)為SARIMA(3,1,3) ×(2,1,0)12。模型結(jié)構(gòu)為:(1 -φ1B-φ2B-φ3B)(1 -Φ1B12-Φ1B24)Δ1Δ112logPr=(1 -θ1B-θ2B-θ3B)εtεt-N(0,0.100)。
回歸方程的決定系統(tǒng)為0.71,誤差項的方差估計值為0.100,模型中各參數(shù)的取值見表1。 模型的殘差序列經(jīng)檢驗為平穩(wěn)的白噪聲序列。
表1 SARIMA 模型參數(shù)估計與相關(guān)檢驗結(jié)果Table 1 Model parameter estimation and test results based on SARIMA model
根據(jù)建立的SARIMA(3,1,3) ×(2,1,0)12模型對2020 年1—6 月的上海蔬菜價格進行靜態(tài)預測和動態(tài)預測,通過實際價格和預測價格的比較,判斷模型的預測精度。
市場調(diào)查發(fā)現(xiàn),假期對蔬菜價格有一定影響,進一步分析了春節(jié)假期對蔬菜價格的影響。 從2010—2019 年上海蔬菜價格數(shù)據(jù)來看,含春節(jié)期間價格的1 月蔬菜月平均價格比不含春節(jié)期間價格的1 月上海蔬菜月平均價格低2.0%,含春節(jié)期間價格的2 月蔬菜月平均價格比剔除春節(jié)期間價格的2 月上海蔬菜月平均價格高12.3%,可見,春節(jié)假期對蔬菜價格影響效果不定。 但是春節(jié)當月的蔬菜價格整體高于其前后月份,如春節(jié)在1 月,1 月蔬菜價格比其前一個月和后一個月的價格平均高2.9%;春節(jié)在2 月,2 月蔬菜價格比其前一個月和后一個月的價格平均高7.7%。
為此,本研究在進行預測時考慮了假期效應(yīng),如果春節(jié)所在月份預測值高于前一個月預測值和后一個月預測值的平均值歷史水平則不進行春節(jié)調(diào)整,反之則對春節(jié)所在月份的預測值進行相應(yīng)調(diào)整——若春節(jié)在1 月,則1 月下調(diào)2.0%;若春節(jié)在2 月,則2 月上調(diào)12.3%。 如表2 所示,靜態(tài)預測結(jié)果的平均誤差為7.3%,動態(tài)預測結(jié)果的平均誤差率為4.6%,上海蔬菜價格預測數(shù)據(jù)與實際數(shù)據(jù)基本一致。
表2 上海蔬菜價格靜態(tài)預測結(jié)果和動態(tài)預測結(jié)果Table 2 Static and dynamic prediction results of vegetable price in Shanghai
研究結(jié)果表明,上海蔬菜價格具有較為明顯的季節(jié)性和周期性特征,可用SARIMA 模型對上海蔬菜價格進行分析和預測。 根據(jù)模型的顯著性檢驗和模型參數(shù)的顯著性檢驗結(jié)果,SARIMA(3,1,3) ×(2,1,0)12模型效果最佳。 從模型參數(shù)值可以看出,上海蔬菜價格為非平穩(wěn)序列,一階差分序列為平穩(wěn)序列;根據(jù)參數(shù)取值,可看出上海當月蔬菜價格不僅與其前3 個月的價格密切相關(guān),而且受前2 年同月價格的影響。
上海蔬菜價格SARIMA(3,1,3) ×(2,1,0)12模型預測的上海蔬菜2020 年1—6 月批發(fā)價(經(jīng)春節(jié)調(diào)整后)與實際價格的對比分析結(jié)果表明,模型靜態(tài)預測的平均誤差為7.3%,動態(tài)預測的平均誤差為4.6%,實際應(yīng)用中可結(jié)合2 種預測方式,達到更好的預測效果。 SARIMA(3,1,3) ×(2,1,0)12模型能較好地表現(xiàn)上海蔬菜價格的波動特征,可用于分析和預測上海蔬菜價格未來走勢,指導產(chǎn)業(yè)發(fā)展。 但還要注意,時間序列模型建模主要依據(jù)歷史價格所包含的信息,而實際影響市場價格波動的還有一些突發(fā)性因素,如臺風暴雨、低溫、暖冬等惡劣天氣或者交通、疫情等突發(fā)事件,所以在實際價格的走勢分析預測中,可在模型分析預測出規(guī)律性影響因素結(jié)果的基礎(chǔ)上,再疊加考慮這些突發(fā)因素的影響,從而科學判斷出各種影響因素對蔬菜價格影響的程度。