喻勝華 龔尚花
摘 要 :首先利用Lasso方法在影響糧食價格波動的眾多因素中選出了糧食儲備、糧食生產(chǎn)成本、糧食產(chǎn)量、糧食政策、生產(chǎn)需求、貿(mào)易需求、心理預(yù)期等7個主要影響因素;然后在Lasso變量選擇的基礎(chǔ)上利用支持向量機進(jìn)行糧食價格的回歸與預(yù)測,同時,把Lasso、支持向量機、Lasso-支持向量機及ARIMA方法的擬合預(yù)測效果進(jìn)行比較,實證結(jié)果表明,Lasso-支持向量機組合方法的擬合預(yù)測效果要優(yōu)于另外三種方法。
關(guān)鍵詞:糧食價格預(yù)測;影響因素;Lasso;支持向量機
中圖分類號:F069
一、引言及文獻(xiàn)綜述
糧食作為一種基礎(chǔ)產(chǎn)品,其價格的波動會對我國糧食生產(chǎn)、糧食相關(guān)產(chǎn)品的進(jìn)出口以及國家宏觀經(jīng)濟調(diào)控產(chǎn)生深遠(yuǎn)影響,關(guān)系到消費者和生產(chǎn)者的切身利益。深刻了解和剖析影響糧食價格波動的各種因素,在此基礎(chǔ)上建立相關(guān)的預(yù)測模型分析和預(yù)測糧食價格的變化趨勢,有助于有關(guān)職能部門調(diào)控糧食價格并制定相應(yīng)的措施,從而正確引導(dǎo)糧食市場的健康運行、保障糧食產(chǎn)品的供求平衡。
目前,國內(nèi)外關(guān)于糧食價格預(yù)測研究的方法主要有定性和定量兩大類,在定性分析方面,朱險峰 [1]所做的系列價格預(yù)測研究比較有代表性,他通過分析庫存、產(chǎn)量、國際市場上糧食價格的變動等一些影響因素,研究我國糧食價格的波動趨勢,進(jìn)而預(yù)測糧食的現(xiàn)貨價格和期貨價格。在定量分析方面,主要采用的是普通時間序列分析方法,其中最具代表性的是ARIMA方法,姚霞等[2]利用ARIMA模型并以青椒價格為例預(yù)測了時鮮農(nóng)產(chǎn)品價格的動態(tài)變化;桂文林等[3]采用X-12-ARIMA模型分解我國糧食消費價格月度定基指數(shù),得到了趨勢循環(huán)、季節(jié)和不規(guī)則因素,進(jìn)而分析了糧食價格的季節(jié)特征及其深層成因;陳兆榮等[4]利用ARIMA-SVM組合模型并結(jié)合1999-2011年我國農(nóng)產(chǎn)品價格指數(shù)月度數(shù)據(jù)對我國農(nóng)產(chǎn)品價格進(jìn)行了預(yù)測。其他時間序列方法也有所應(yīng)用,如苗開超[5]運用指數(shù)平滑模型對農(nóng)產(chǎn)品價格進(jìn)行了預(yù)測;劉家富等[6]利用向量自回歸模型分析了國內(nèi)大豆以及豆油市場的價格傳導(dǎo)機制。除此之外,神經(jīng)網(wǎng)絡(luò)和支持向量機等方法也得到了不同程度的應(yīng)用,如彭琳[7]利用NARX神經(jīng)網(wǎng)絡(luò)方法對云南省的農(nóng)產(chǎn)品價格進(jìn)行了預(yù)測;孫超等[8]分析了我國糧食價格波動的主要影響因素,并利用支持向量機(SVM)方法建立了我國糧食價格的預(yù)測模型。支持向量機是基于結(jié)構(gòu)風(fēng)險最小化原則提出來的一種統(tǒng)計學(xué)習(xí)方法,該方法一改傳統(tǒng)方法的經(jīng)驗風(fēng)險最小化原則,從而使其有更好的泛化能力,尤其是較好地解決了小樣本、非線性、過擬合和局部極小等幾類常見的問題。我們知道,糧食價格數(shù)據(jù)是典型的小樣本數(shù)據(jù),而且,影響糧食價格的眾多因素之間也存在著不確定性和非線性的關(guān)系,所以可以采用支持向量機方法進(jìn)行預(yù)測,但是影響糧食價格的因素很多,各個影響因素之間可能會存在嚴(yán)重的多重共線性,如果不加選擇地引入眾多影響因素來進(jìn)行糧食價格的預(yù)測,往往不能取得良好的預(yù)測效果。一個理想的模型應(yīng)該是既不遺漏重要的自變量,也不包含沒有影響或影響很小的自變量,過多地引入變量不僅會大大增加計算量,也會降低估計和預(yù)測精度。
雖然支持向量機方法比較適合處理具有非線性關(guān)系的小樣本數(shù)據(jù),但是不能進(jìn)行變量選擇,而Lasso方法可以同時進(jìn)行參數(shù)估計和變量選擇,Lasso方法本質(zhì)上還是線性回歸方法,它不適合處理非線性問題,所以,本文提出了基于Lasso與支持向量機的糧食價格組合預(yù)測方法。首先利用Lasso方法對糧食價格波動的影響因素進(jìn)行選擇,剔除與糧食價格不相關(guān)或相關(guān)性很小的變量數(shù)據(jù),以達(dá)到降低數(shù)據(jù)維數(shù)的目的;然后利用支持向量機的非線性運算能力,逼近歷史數(shù)據(jù)所隱含的函數(shù)關(guān)系,完成對糧食價格的擬合和預(yù)測,同時,把Lasso、SVM、Lasso-SVM及ARIMA方法的擬合預(yù)測效果進(jìn)行比較。
二、Lasso及支持向量機方法
1. Lasso方法
Lasso方法(最小絕對值壓縮與選擇方法)是Tibshirani.R[9]在1996年提出來的一種的有偏估計方法,其本質(zhì)是通過添加約束條件對模型系數(shù)進(jìn)行壓縮,將沒有影響或影響較小的自變量的回歸系數(shù)自動壓縮到零,這不僅在一定程度上能消除多重共線性的影響,而且在對參數(shù)進(jìn)行估計的同時也實現(xiàn)了對變量的選擇。
三、建模與實證分析
1. 數(shù)據(jù)來源及變量選擇
根據(jù)經(jīng)濟學(xué)理論及已有的研究結(jié)論,我們從糧食儲備、糧食生產(chǎn)成本、糧食產(chǎn)量、糧食政策、生活需求、生產(chǎn)需求、貿(mào)易需求、心理預(yù)期以及外部沖擊等9個方面共選取了21個變量[13-16]。具體如下:用糧食類零售價格指數(shù)代表糧食價格;用糧食庫存量x1、期末庫存消費比x2反映糧食儲備;用糧食生產(chǎn)價格指數(shù)x3反映糧食生產(chǎn)成本;用總產(chǎn)量x4、 糧食作物播種面積x5、成災(zāi)面積x6反映糧食產(chǎn)量;用農(nóng)業(yè)支出x7、農(nóng)業(yè)支出占財政支出的比重x8反映糧食政策;用城鎮(zhèn)居民人均可支配收入x9、農(nóng)村居民家庭人均純收入x10、城鎮(zhèn)居民人均糧食消費x11、農(nóng)村居民人均糧食消費x12反映生活需求;用農(nóng)業(yè)生產(chǎn)資料價格指數(shù)x13、國內(nèi)生產(chǎn)總值指數(shù)x14、世界能源價格指數(shù)x15反映生產(chǎn)需求;用糧食凈進(jìn)口x16、人民幣對美元匯率x17反映貿(mào)易需求;用上一期真實糧價增長率x18、貨幣和準(zhǔn)貨幣(M2)供應(yīng)量x19反映心理預(yù)期;用同期通貨膨脹率x20、世界谷物價格指數(shù)x21反映外部沖擊。
本文選取的數(shù)據(jù)區(qū)間是1978-2013年,糧食庫存量、期末庫存消費比數(shù)據(jù)根據(jù)美國農(nóng)業(yè)部信息網(wǎng)數(shù)據(jù)計算得出;糧食生產(chǎn)成本數(shù)據(jù)來自《全國農(nóng)產(chǎn)品成本收益匯編》;世界谷物價格指數(shù)、世界能源價格指數(shù)數(shù)據(jù)來自世界銀行數(shù)據(jù)庫;農(nóng)業(yè)支出、農(nóng)業(yè)支出占財政支出的比重、城鎮(zhèn)居民人均糧食消費、農(nóng)村居民人均糧食消費數(shù)據(jù)來自中國農(nóng)村統(tǒng)計年鑒;其他數(shù)據(jù)均來自《中國統(tǒng)計年鑒》。
2. 基于Lasso回歸的變量選擇
首先把數(shù)據(jù)進(jìn)行中心標(biāo)準(zhǔn)化處理,以消除不同指標(biāo)量綱的影響,接下來運用lasso方法對選取的21個指標(biāo)進(jìn)行參數(shù)估計與變量選擇,只需要29步,就可以得到全部的lasso解。從圖1可以看出,當(dāng)參數(shù)s很小時,變量均未被選入模型中,隨著s的不斷增大,變量依次進(jìn)入模型,當(dāng)s=1時,變量全部進(jìn)入模型。