孔琳琳,劉 瀾,許文秀,吳金卓*
(1.東北林業(yè)大學(xué) 工程技術(shù)學(xué)院 哈爾濱 150040;2.湖南工學(xué)院,湖南 衡陽 421002)
?
基于時間序列分析的港口集裝箱吞吐量預(yù)測分析
孔琳琳1,劉瀾2,許文秀1,吳金卓1*
(1.東北林業(yè)大學(xué) 工程技術(shù)學(xué)院 哈爾濱 150040;2.湖南工學(xué)院,湖南 衡陽 421002)
集裝箱運輸是現(xiàn)今國際運輸?shù)闹饕绞街?,長期監(jiān)測港口集裝箱吞吐量并對未來趨勢進行相關(guān)的預(yù)測研究,對于港口基礎(chǔ)設(shè)施建設(shè)、區(qū)域經(jīng)濟發(fā)展以及國家戰(zhàn)略發(fā)展方面都有著非常深遠的意義。本文針對影響港口集裝箱吞吐量復(fù)雜性因素的非線性特點,以中國某港口2001年1月至2014年12月共14 a的集裝箱吞吐量數(shù)據(jù)為例,利用統(tǒng)計分析軟件R對該港口集裝箱吞吐量數(shù)據(jù)進行時間序列分析,提出了一個合理的ARIMA模型來描述集裝箱吞吐量的變化,并對模型進行檢驗優(yōu)化,應(yīng)用該模型預(yù)測十個月后的集裝箱吞吐量數(shù)據(jù)。結(jié)果表明,利用統(tǒng)計分析軟件R對港口集裝箱吞吐量數(shù)據(jù)進行時間序列分析后得到的預(yù)測模型可以很好的描述港口集裝箱吞吐量變化情況,據(jù)此可以為港口在不同時期制定最優(yōu)措施提供參考。
集裝箱吞吐量;時間序列分析;預(yù)測;模型
港口作為一個重要的交通樞紐,是各種交通工具的轉(zhuǎn)換中心,大量貨物聚集在此,不僅能促進當(dāng)?shù)亟?jīng)濟的發(fā)展,而且也能拉動港口周邊地區(qū)的工業(yè)發(fā)展,在一個國家的經(jīng)濟發(fā)展中發(fā)揮著至關(guān)重要的作用[1-2]。港口吞吐量這一指標(biāo)就是反映一定時間內(nèi)(一般為1 a)港口生產(chǎn)經(jīng)營活動規(guī)模以及國家和地區(qū)經(jīng)濟發(fā)展?fàn)顩r的參考指標(biāo),對港口的建設(shè)和管理具有重大的影響。
港口吞吐量分為衡量旅客流動情況的旅客吞吐量和衡量貨物流動情況的集裝箱吞吐量兩種。長期監(jiān)測港口集裝箱吞吐量并對未來趨勢進行相關(guān)的預(yù)測研究,對于港口基礎(chǔ)設(shè)施建設(shè)、區(qū)域經(jīng)濟發(fā)展以及國家戰(zhàn)略發(fā)展方面都有著非常深遠的意義[3-4]。翟希東[5]采用灰色理論模型和改進的神經(jīng)網(wǎng)絡(luò)模型結(jié)合的方法建立港口集裝箱吞吐量預(yù)測模型,并以大連港集裝箱吞吐量的實際發(fā)生數(shù)據(jù)為實驗樣本,驗證了提出的集裝箱吞吐量預(yù)測模型的有效性和實用性。黃維忠[6]為避免以往研究中吞吐量的預(yù)測值與實測值之間差距較大的情況,突破性地提出了一種動態(tài)預(yù)測方法對吞吐量進行預(yù)測,并以上海港為實例驗證了此方法的可行性。江艦等[7]以大連港為例對集裝箱吞吐量的影響因素以及其產(chǎn)生的經(jīng)濟影響進行計量分析,并建立了港口城市GDP與進出口商品總值對集裝箱吞吐量影響的二元線性回歸模型,從而很好地解釋了其中的關(guān)系,也對國內(nèi)其他港口城市起到了很好的借鑒意義。
市場經(jīng)濟、自然條件、國家政策等因素都是影響集裝箱吞吐量的重要因素。由于這些因素具有極強的復(fù)雜性而不能用精確的語言來描述其作用機制,屬于非線性系統(tǒng)問題,因此這些因素最終都會反饋在其時間序列上[8-9]。由此可見,對港口集裝箱吞吐量建立時間序列進行分析不僅有利于了解集裝箱吞吐量隨季節(jié)變化的趨勢,而且對其建模和預(yù)測有一定的指導(dǎo)意義。
本文采用統(tǒng)計分析軟件R對國內(nèi)某港口2001年1月~2014年12月的集裝箱吞吐量進行時間序列分析,通過分析其季節(jié)性數(shù)據(jù),確定吞吐量與季節(jié)變化之間的關(guān)系。通過建立ARIMA模型預(yù)測該港口十個月后的集裝箱吞吐量數(shù)據(jù),結(jié)合預(yù)測結(jié)果分析未來一段時間內(nèi)港口吞吐量隨季節(jié)變化的規(guī)律,對港口在不同時期制定最優(yōu)措施提供參考。
1.1時間序列分析
時間序列是指將一組數(shù)據(jù)按照時間推移的順序進行排列。這些長時間的數(shù)據(jù)反映出來的整體向上或向下的趨勢、在一年內(nèi)隨季節(jié)變化的情況、一段時間內(nèi)呈現(xiàn)出的漲落相同的循環(huán)波動和無規(guī)律的隨機波動4種變化情況構(gòu)成了時間序列的4要素[10-12]。應(yīng)用數(shù)理統(tǒng)計方法可以對具有時序性和相關(guān)性的時間序列進行分析,通過建模還可以預(yù)測事件未來的發(fā)展趨勢及走向[13-15]。
本文利用R軟件中的時間序列分析對某港口集裝箱吞吐量進行分析。R軟件是一個具有相關(guān)統(tǒng)計分析和作圖功能的綜合軟件,其編程語言簡單實用,作圖功能強大,統(tǒng)計分析能力突出,可移植性強,同時還具有強大的數(shù)據(jù)存儲和處理系統(tǒng)以及數(shù)組運算工具。其完整而連貫的統(tǒng)計分析工具非常適合用來做時間序列圖來分析。根據(jù)R軟件作出的時間序列圖,分析數(shù)據(jù)的周期性變化,并對時間序列進行分解。對數(shù)據(jù)進行季節(jié)性修正,把季節(jié)性部分從原始時間序列中去除,可以得到僅包含趨勢部分和不規(guī)則部分的季節(jié)性修正時間序列圖。
1.2時間序列建模與預(yù)測
本文選用自回歸積分滑動平均模型ARIMA(p,d,q)來建立港口集裝箱吞吐量的時間序列模型,通過時間序列的差分,得到一個合適的ARIMA的模型,以此來預(yù)測2015年前十個月的港口集裝箱吞吐量[16]。ARIMA(p,d,q)模型是為平穩(wěn)的時間序列定義的,對于非平穩(wěn)時間序列,需要進行差分,變?yōu)椴罘制椒€(wěn)序列后才能應(yīng)用該模型。差分平穩(wěn)序列可以用ARIMA(p,d,q)模型進行擬合。該模型的結(jié)構(gòu)表示為:
(1)
對d階齊次非平穩(wěn)序列{Xt}而言,{▽dXt}是一個平穩(wěn)序列,設(shè)其適合ARIMA(p,d,q)模型,即
φ(B)▽dXt=θ(B)εt。
(2)
或者
φ(B)(1-B)dXt=θ(B)εt。
(3)
其中
φ(B)=1-φ1B-φ2B2-…-φpBp。
(4)
為消除季節(jié)性影響和長期趨勢影響,對該序列作一階12步差分,檢驗序列是否平穩(wěn)。如果時間序列平穩(wěn),就可以使用ARIMA(p,d,q)模型,其中d=1。
2.1某港口集裝箱吞吐量的時間序列分析
本文收集并整理了中國十大港口之一的某港口2001年1月至2014年12月集裝箱吐吞量的數(shù)據(jù),利用統(tǒng)計分析軟件R對數(shù)據(jù)進行統(tǒng)計分析。首先,將數(shù)據(jù)讀入到R中,繪制時間序列圖,得到該港集裝箱吞吐量時間序列圖如圖1所示。
由圖1可知,該港口集裝箱吞吐量時間序列總體呈現(xiàn)上升趨勢,并且存在著一定的周期性變化。這個季節(jié)性時間序列由趨勢部分、季節(jié)性部分和不規(guī)則部分3部分組成。
圖1 某港口集裝箱吞吐量時間序列圖Fig.1 Time sequence chart of the handling capacity in a port
通過對時間序列的趨勢的、季節(jié)性和不規(guī)則部分進行分析,得到了每年 1~12 月的季節(jié)性因素。季節(jié)性因素最大值在十月,最小值在二月,一、二、三、四、五、十二月集裝箱吞吐量較少,標(biāo)志著每年的峰值在十月,低谷在二月份。繪制出時間序列中估計的趨勢、季節(jié)性和不規(guī)則的部分,時間序列的分解結(jié)果如圖2所示。圖2共分為4個部分,由上至下分別為:原始的時間序列圖以及估計的趨勢圖、季節(jié)性圖和不規(guī)則圖。由圖2可知,估計出的趨勢部分從2001年開始逐年穩(wěn)步上升,在2009年前后有下降的趨勢,但隨后又持續(xù)穩(wěn)步上升。圖2估計出的季節(jié)性部分圖像穩(wěn)定,說明該港口集裝箱吞吐量存在一定的季節(jié)性規(guī)律,與前文分析相符。
圖2 時間序列的分解Fig.2 Decomposition of time sequence
對數(shù)據(jù)進行季節(jié)性修正,把季節(jié)性部分從原始時間序列中去除,得到僅包含趨勢部分和不規(guī)則部分的季節(jié)性修正時間序列圖如圖3所示。由于剔除了季節(jié)性因素的影響,因此根據(jù)圖3可知:2001年~2006年,該港口集裝箱吞吐量呈現(xiàn)緩慢上升趨勢,但吞吐量的增長情況并不穩(wěn)定。2006年至2008年集裝箱吞吐量增長速度呈直線上升,在2009年集裝箱吞吐量下降,隨后至2014年又呈現(xiàn)出緩慢上升的趨勢,這主要是由于2008年全球金融危機全面爆發(fā),沿海港口吞吐量下降所致[17]。
圖3 季節(jié)性修正時間序列圖Fig.3 Time sequence after seasonal adjustment
2.2港口集裝箱吞吐量時間序列建模與預(yù)測
為消除季節(jié)性和長期趨勢的影響,對時間序列作一階12步差分,最終得到的時間序列如圖4所示。差分后序列基本平穩(wěn)。由于對原始時間序列數(shù)據(jù)做1階差分獲得了一個平穩(wěn)時間序列,所以可以對時間序列使用ARIMA(p,d,q)模型,其中:p為自回歸模型的階數(shù);d為差分階數(shù),由上述內(nèi)容可知,本文中d=1;q為滑動平均模型的階數(shù)。
圖4 差分后的時間序列圖Fig.4 Time sequence after differential treatment
利用R軟件的程輯包‘forecast’中的arima函數(shù),自動對非平穩(wěn)時間序列進行適當(dāng)差分,分析求解出適合時間序列分析的模型。輸入auto.arima()進行自動求解,最終輸出結(jié)果說明該模型適合采用ARIMA(2,1,1)模型,通過分析得出模型為:
(1-1.1559B+0.4945B2)(1-B)Xt=(1+0.8978B)εt。
(5)
應(yīng)用該模型來預(yù)測未來十個月該港口集裝箱吞吐量的數(shù)據(jù),得到結(jié)果見表1。表1反映了2015年1月~10月該港口集裝箱吞吐量預(yù)測值,并顯示了置信度為80%和95%時的置信區(qū)間。根據(jù)預(yù)測,2015年前十個月的吞吐量預(yù)計分別為:1月份44.087萬箱,2月份45.301萬箱,3月份53.267萬箱,4月份61.875萬箱,5月份67.885萬箱,6月份70.575萬箱,7月份70.713萬箱,8月份69.542萬箱,9月份68.120萬箱,10月份67.056萬箱。
表1 2015年1月~10月預(yù)測值(萬箱)以及置信區(qū)間
預(yù)測值圖像如圖5所示,淺灰色陰影部分為80%預(yù)測區(qū)間,深灰色陰影部分為95%預(yù)測區(qū)間,陰影部分的線條表示預(yù)測值。
圖5 港口集裝箱吞吐量預(yù)測值圖像Fig.5 Predicted handling capacity of the port
對該港口吞吐量數(shù)據(jù)使用ARIMA(2,1,1)模型后所產(chǎn)生的預(yù)測誤差做自相關(guān)圖如圖6所示。由圖6可以看出,相關(guān)圖顯示出之后1~20階(lag1-20)中樣本自相關(guān)值都沒有超出置信邊界,而且Ljung-Box檢驗p-value < 2.2e-16,所以得到的模型可以提供非常合適的預(yù)測。
圖6 某港口集裝箱吞吐量預(yù)測誤差相關(guān)圖Fig.6 Correlation diagram of prediction error
2015年1月~10月該港口集裝箱吞吐量分別為46.721、47.014、56.335、60.982、68.452、73.146、75.178、70.015、69.574、68.739萬箱,與預(yù)測結(jié)果44.087、45.301、53.267、61.875、67.885、70.575、70.713、69.542、68.120、67.056萬箱相差甚微,在5%左右浮動,說明本模型對港口集裝箱吞吐量可以提供較準(zhǔn)確的預(yù)測。
本文分析了2001~2014年某港口集裝箱吞吐量數(shù)據(jù),通過時間序列分析,建立了集裝箱吞吐量的ARIMA預(yù)測模型,并且預(yù)測分析了2015年該港口前十個月集裝箱吞吐量,得到了以下結(jié)論:
(1)該港口集裝箱吞吐量總體呈現(xiàn)上升趨勢,2001~2003年這種趨勢不明顯,2003年以后隨著中國加入世貿(mào)組織,上升趨勢較為明顯。2009年前后該港口集裝箱吞吐量受金融危機的影響有下降趨勢,一段時間后隨著經(jīng)濟的回暖逐漸恢復(fù)正常,至2014年又呈現(xiàn)出上升趨勢。
(2)該港口集裝箱吞吐量呈現(xiàn)一定的季節(jié)性變化,季節(jié)性因素最大值在十月,最小值在二月,一、二、三、四、五、十二月集裝箱吞吐量較少,標(biāo)志著每年集裝箱吞吐量的峰值在十月,低谷在二月份。
(3)利用R軟件得到預(yù)測該港口2001年至2014年集裝箱吞吐量的預(yù)測模型ARIMA(2,1,1)模型為(1-1.1559b+0.4945b2)(1-B)Xt=(1+0.8978B)εt,并對模型進行檢驗,結(jié)果證明得到的模型可以很好的描述港口集裝箱吞吐量,從理論上證明了該港口集裝箱吞吐量的增長趨勢。
[1]葉峰,吳迎學(xué).基于實現(xiàn)我國港口物流聯(lián)盟的探索[J].森林工程,2009,25(5):89-91.
[2]Huang A,Qiao H,Wang S.Forecasting container throughputs with domain knowledge[J].Procedia Computer Science,2014,31:648-655.
[3]Huang A,Lai K K,Qiao H,et.al.An interval knowledge based forecasting paradigm for container throughput prediction[J].Procedia Computer Science,2015,55:1381-1389.
[4]Chen S H,Chen J.Forecasting container throughputs at ports using genetic programming[J].Expert Systems with Applications,2010,37(3):2054-2058.
[5]翟希東.港口集裝箱吞吐量預(yù)測模型研究[D].大連:大連理工大學(xué),2006.
[6]黃維忠.集裝箱吞吐量的動態(tài)預(yù)測研究[J].上海海運學(xué)院學(xué)報,2001,22(1):45-48.
[7]江艦,王海燕,楊贊.集裝箱吞吐量及主要影響因素的計量經(jīng)濟分析[J].大連海事大學(xué)學(xué)報,2007,33(1):83-86.
[8]陳濤燾,高琴.港口集裝箱吞吐量影響因素研究[J].武漢理工大學(xué)學(xué)報,2008,30(6):991-994.
[9]劉志杰,季令,葉玉玲,等.基于徑向基神經(jīng)網(wǎng)絡(luò)的集裝箱吞吐量的組合預(yù)測[J].同濟大學(xué)學(xué)報,2007,35(6):739-744.
[10]侯成琪,徐緒松.計量經(jīng)濟學(xué)方法之時間序列分析[J].技術(shù)經(jīng)濟,2010,29(8):51-57.
[11]潘迪夫,劉輝,李燕飛.基于時間序列分析和卡爾曼濾波算法的風(fēng)電場風(fēng)速預(yù)測優(yōu)化模型[J].電網(wǎng)技術(shù),2008,32(7):82-86.
[12]羅芳瓊,吳春梅.時間序列分析的理論與應(yīng)用綜述[J].柳州師專學(xué)報,2009,24(3):113-117.
[13]韓忠明,陳妮,樂嘉錦,等.面向熱點話題時間序列的有效聚類算法研究[J].計算機學(xué)報,2012,35(11):2337-2347.
[14]錢愛玲,瞿彬彬,盧炎生,等.多時間序列關(guān)聯(lián)規(guī)則分析的論壇輿情趨勢預(yù)測[J].南京航空航天大學(xué)學(xué)報,2012,44(6):904-910.
[15]楊娟麗,徐梅,王福林,等.基于BP神經(jīng)網(wǎng)絡(luò)的時間序列預(yù)測問題研究[J].數(shù)學(xué)的實踐與認識,2013,43(4):158-164.
[16]Aslanargun A,Mammadov M,Yazici B,et.al.Comparison of ARIMA,neural networks and hybrid models in time series:tourist arrival forecasting[J].Journal of Statistical Computation and Simulation,2006,77(1):29-53.
[17]賈大山.金融危機對港口集裝箱發(fā)展的影響[A].全球經(jīng)濟形勢變化與我國集裝箱運輸發(fā)展對策研討會論文集[C],北京,2009:39-42.
Prediction of the Container Throughput in a PortBased on Time Sequence Analysis
Kong Linlin1,Liu Lan2,Xu Wenxiu1,Wu Jinzhuo1*
(1.College of Engineering and Technology,Northeast Forestry University,Harbin 150040;2.Hunan Institute of Technology,Hengyang 421002,Hunan Province)
Container transportation is one of the main modes of international transportation.Long-term monitoring port container throughput and predicting future trends are of importance to the port infrastructure construction,regional economic development and national strategy development.In this paper,aiming at the nonlinear characteristics of the factors affecting the complexity of port container throughput,the container throughput data in a port in China between January 2001 and December 2014 were investigated and statistical analysis software R was used to conduct time series analysis on the data.A reasonable model was put forward to describe the change of container throughput data,which was tested and optimized.The container throughput data after ten months was forecasted by using the model.Results showed that the prediction model after time series analysis can well describe the change of the port container throughput,therefore can provide reference for the optimal measures in different periods.
container throughput;time series analysis;forecast;model
2016-03-31
國家留學(xué)回國人員科技活動資助項目(人社廳函[2012]258號)
孔琳琳,碩士研究生。研究方向:森林工程。
吳金卓,博士,副教授。研究方向:森林工程,物流工程。E-mail:wujinzhuo1980@163.com
孔琳琳,劉瀾,許文秀,等.基于時間序列分析的港口集裝箱吞吐量預(yù)測分析[J].森林工程,2016,32(5):106-110.
F 552
A
1001-005X(2016)05-0106-05