郭雪
摘要:本文綜合運(yùn)用ARIMA預(yù)測模型和LSSVR預(yù)測模型,提出了一種集成預(yù)測模型,并將該模型應(yīng)用于上海港的集裝箱吞吐量預(yù)測研究中。此外,采用不同的參數(shù)估計(jì)方法估計(jì)ARIMA模型的參數(shù),得到了兩種ARIMA預(yù)測模型。研究表明,集成預(yù)測模型可以提高預(yù)測模型的準(zhǔn)確性,不同的估計(jì)方法也會(huì)影響模型的預(yù)測表現(xiàn)。
關(guān)鍵詞:單整自回歸移動(dòng)平均模型(ARIMA);最小二乘支持向量回歸(LSSVR);LS估計(jì);ARCH估計(jì);集成預(yù)測
中圖分類號(hào):U169.6 文獻(xiàn)標(biāo)識(shí)碼:A
0引言
20世紀(jì)70年代,中國海上集裝箱運(yùn)輸正式啟動(dòng)。自20世紀(jì)80年代以來,中國集裝箱運(yùn)輸?shù)脑鲩L速度始終以遠(yuǎn)遠(yuǎn)超過世界平均增幅的水平發(fā)展,隨著經(jīng)濟(jì)全球化的深入和國際貿(mào)易的頻繁交換,集裝箱運(yùn)輸在減少運(yùn)輸時(shí)間和貿(mào)易成本方面發(fā)揮了重要作用。近年來,我國港口的集裝箱吞吐量快速增長,如何科學(xué)地預(yù)測吞吐量的數(shù)據(jù)成為港口運(yùn)營商管理的重要內(nèi)容。準(zhǔn)確預(yù)測港口的集裝箱吞吐量數(shù)據(jù),不僅可以為港口自身提供決策支持,而且對(duì)國家的可持續(xù)發(fā)展至關(guān)重要。因此,加強(qiáng)對(duì)我國港口集裝箱吞吐量預(yù)測的研究對(duì)我國港口的發(fā)展具有重要意義。
至今為止,國內(nèi)外學(xué)者已經(jīng)對(duì)港口集裝箱吞吐量預(yù)測做了大量研究并取得了豐碩的研究成果。但是,對(duì)于如何科學(xué)地捕獲集裝箱吞吐量的歷年變化規(guī)律和趨勢(shì),以及如何獲得比較精確的預(yù)測結(jié)果仍然沒能找到一個(gè)普遍適用于各種時(shí)間序列的方法。目前,用于集裝箱吞吐量預(yù)測的方法和模型主要涉及到兩大類:定性預(yù)測和定量預(yù)測。定性研究主要依賴于人的主觀意識(shí),預(yù)測結(jié)果具有很大的不確定性。學(xué)術(shù)研究一般更傾向于定量預(yù)測,其中定量預(yù)測可以分為單一模型預(yù)測和組合模型預(yù)測。在單一預(yù)測模型中,單整自回歸移動(dòng)模型(ARIMA)、最小二乘支持向量機(jī)(ISSVR)、灰色模型等得到了大量的運(yùn)用,如Mark和Yang、劉雷麗等、薛俊強(qiáng)、田雪等、朱念等、Peng和Chu,結(jié)果發(fā)現(xiàn)這些預(yù)測模型的預(yù)測精度具有不確定性。近年來,組合預(yù)測模型得到了越來越多的關(guān)注,其可以結(jié)合各單項(xiàng)預(yù)測模型的優(yōu)勢(shì),往往會(huì)在預(yù)測中展現(xiàn)出較大的優(yōu)勢(shì),如:魯博等、Xie、施澤軍和李凱、趙尚威和周建紅、許利枝汪壽陽、梁小珍舊等均采用集成預(yù)測模型進(jìn)行了研究,而且得到了更高預(yù)測精度的效果。
根據(jù)以往研究表明,LSSVR預(yù)測模型具有良好的數(shù)據(jù)特征提取效果,模型的預(yù)測精度比較高,本文將LSSVR模型作為集成預(yù)測模型法的單項(xiàng)模型。在ARIMA建模時(shí),難點(diǎn)是關(guān)于參數(shù)P、D、Q的確定,這三個(gè)參數(shù)直接關(guān)系到所建模型預(yù)測性能的好壞。建立ARIMA模型時(shí),大量的研究表明LS估計(jì)具有很好的作用,但是,本文提出用自回歸廣義異方差估計(jì)(ARCH)法建立的ARIMA模型對(duì)提高最終的預(yù)測結(jié)果起到了關(guān)鍵性作用。
本文首先詳細(xì)介紹了用到的模型和方法以及論文的研究思路、論文框架;然后進(jìn)行實(shí)例研究,將提出來的模型用于上海港集裝箱吞吐量的預(yù)測,并與ARIMA、LSSVR等單一模型以及運(yùn)用LS估計(jì)和ARCH估計(jì)等不同預(yù)測模型的預(yù)測結(jié)果進(jìn)行了對(duì)比;最后闡述了本文的研究結(jié)論。
第三,運(yùn)用LSSVR預(yù)測模型得到2018年1月至2018年11月的集裝箱吞吐量預(yù)測值;
第四,運(yùn)用SA集成方法將ARIMA模型和LSSVR模型的預(yù)測值進(jìn)行集成,得到最終的集裝箱吞吐量預(yù)測值。
2實(shí)證研究
2.1數(shù)據(jù)描述與評(píng)價(jià)準(zhǔn)則
選擇上海港集裝箱吞吐量為樣本數(shù)據(jù),以2001年2月至2018年11月為樣本區(qū)間,共計(jì)214個(gè)數(shù)據(jù),其趨勢(shì)圖如圖2所示(樣本來源于宏觀經(jīng)濟(jì)數(shù)據(jù)庫萬德數(shù)據(jù)庫)。為了驗(yàn)證本模型的有效性。將樣本數(shù)據(jù)分成訓(xùn)練樣本(2001年2月至2017年12月,共計(jì)203個(gè)數(shù)據(jù))和測試樣本(2018年1月至2018年11月,共計(jì)11個(gè)數(shù)據(jù))。從圖中可以發(fā)現(xiàn),該時(shí)間序列具有某種上升趨勢(shì),此外,還有很大的波動(dòng)性,即該時(shí)間序列不平穩(wěn)。
2.2預(yù)測結(jié)果及分析
2.2.1實(shí)驗(yàn)設(shè)計(jì)
數(shù)據(jù)具有平穩(wěn)性是運(yùn)用ARIMA模型的前提,故在運(yùn)用ARIMA模型進(jìn)行集裝箱吞吐量預(yù)測時(shí),首先檢驗(yàn)數(shù)據(jù)數(shù)列是否具有此特征。若原始時(shí)間序列不具有平穩(wěn)性,可以采用差分法將不平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)序列,通常情況下,進(jìn)行一次或者兩次差分就可以將不平穩(wěn)數(shù)據(jù)轉(zhuǎn)化成平穩(wěn)序列。數(shù)據(jù)平穩(wěn)性檢驗(yàn)可以通過單位根檢驗(yàn)來實(shí)現(xiàn),常用的單位根檢驗(yàn)是Augmented Dickey-Fuller(ADF)檢驗(yàn)。根據(jù)ADF檢驗(yàn)原理,可以得到上海港集裝箱吞吐量的單位根檢驗(yàn)結(jié)果,如表1所示:
由表1可知,該時(shí)間序列的T統(tǒng)計(jì)量值大于臨界值,顯然原始時(shí)間序列不具有穩(wěn)定性。故對(duì)原數(shù)據(jù)進(jìn)行一次差分,將其轉(zhuǎn)化成平穩(wěn)序列。同理得到其T統(tǒng)計(jì)量的值為-3.414611,小于臨界值-3.140847。所以,在90%的條件下可以認(rèn)為一節(jié)差分序列為平穩(wěn)數(shù)列,即符合運(yùn)用ARIMA模型的條件。
在運(yùn)用ARIMA模型時(shí),最關(guān)鍵的是確定p、d、g三個(gè)參數(shù)的值,根據(jù)自相關(guān)偏自相關(guān)圖以及差分次數(shù),運(yùn)用LS估計(jì)和ARCH估計(jì)分別建立了ARIMA(3,1,4)和ARIMA(2,1,4)兩種不同的模型。
運(yùn)用LSSVR模型時(shí),選擇嵌入維度為10,即用前十個(gè)數(shù)據(jù)預(yù)測第十一個(gè)數(shù)據(jù),以此類推。在預(yù)測時(shí)采用滾動(dòng)預(yù)測,即將每次的預(yù)測結(jié)果加入訓(xùn)練集,進(jìn)而得到下一個(gè)預(yù)測值。
2.2.2模型預(yù)測結(jié)果與評(píng)價(jià)
根據(jù)2.2.1中對(duì)各種預(yù)測模型的設(shè)計(jì),得到了最終的預(yù)測結(jié)果。為了驗(yàn)證本文提出的預(yù)測模型的有效性,本文也給出了單獨(dú)運(yùn)用ARIMA模型和LSSVR模型的預(yù)測結(jié)果。
圖3、圖4分別展示了用不同的估計(jì)方法估計(jì)ARIMA模型時(shí)得到的單項(xiàng)模型和集成預(yù)測模型煩人預(yù)測結(jié)果,除了2月和9月外,這些模型都能取得良好的效果,為了說明論文所建模型的優(yōu)越性,表2、表3展示了各種預(yù)測模型的MAE和MAPE。
由表2、表3可知,若以MAE作為評(píng)價(jià)預(yù)測模型的指標(biāo),(1)不管以哪種方式估計(jì)ARIMA模型的系數(shù),SA集成預(yù)測的預(yù)測效果都要高于單一預(yù)測模型的預(yù)測效果,表明了集成預(yù)測模型的優(yōu)勢(shì);(2)最小二成支持向量回歸LSSVR的預(yù)測效果要優(yōu)于單整自回歸移動(dòng)模型ARIMA的預(yù)測效果;(3)采用ARCH估計(jì)ARIMA模型的參數(shù)可以提高模型的預(yù)測精度,而且可以使得其對(duì)應(yīng)的集成預(yù)測模型的預(yù)測效果得到改善。而且以MAPE作為評(píng)價(jià)預(yù)測模型的指標(biāo),雖然LSSVR模型的預(yù)測誤差要小于LS估計(jì)ARIMA模型時(shí)對(duì)應(yīng)的集成預(yù)測模型的誤差,但是其誤差要大于ARCH估計(jì)ARIMA估計(jì)時(shí)對(duì)應(yīng)的集成預(yù)測模型的預(yù)測誤差,這就說明選擇合適的參數(shù)估計(jì)方法可以提高預(yù)測模型的表現(xiàn)。
3結(jié)論
本文以上海港2001年2月至2018年11月的集裝箱吞吐量數(shù)據(jù)為研究對(duì)象,綜合利用ARIMA和LSSVR模型,從LS估計(jì)和ARCH估計(jì)的角度,分別建立了一套適用于該港口集裝箱吞吐量預(yù)測的集成預(yù)測模型。研究發(fā)現(xiàn),LSSVR和ARIMA預(yù)測模型都具有良好的預(yù)測精度,但是集成預(yù)測方法保留了這兩種預(yù)測模型的優(yōu)勢(shì),得到的整體誤差比單一模型的預(yù)測誤差更小。而為ARIMA模型選擇合適的參數(shù)估計(jì)方法可以顯著提高模型的預(yù)測表現(xiàn)。
考慮到港口市場競爭激烈,提高集裝箱吞吐量的預(yù)測精度可以為港口運(yùn)營商提供決策支持,使得港口運(yùn)營商做出更利于自身發(fā)展的決定。基于此,本論文從提高預(yù)測模型的預(yù)測精度出發(fā),為建立預(yù)測港口集裝箱吞吐量的模型提供了新的思路。