湯斯敏, 蘭培真, 朱經(jīng)君
(1.集美大學(xué)海上交通安全研究所,福建 廈門 361021;2.交通安全應(yīng)急信息技術(shù)國家工程實(shí)驗(yàn)室集美大學(xué)分實(shí)驗(yàn)室,福建 廈門 361021;3.安徽中澳科技職業(yè)學(xué)院國際商務(wù)系,合肥 230000)
近年來我國港口發(fā)展迅猛,隨著國家政策和戰(zhàn)略計(jì)劃的進(jìn)一步推進(jìn),影響港口吞吐量發(fā)展的因素越來越多。[1]為進(jìn)一步支持港口發(fā)展規(guī)劃與決策制定,很有必要研究一種既能充分考慮眾多因素的影響又能適當(dāng)簡化預(yù)測模型的港口吞吐量預(yù)測方法。為此,迫切需要研究合適的港口吞吐量影響因素分析方法,以建立科學(xué)有效的港口吞吐量預(yù)測模型。
現(xiàn)今常用的港口吞吐量預(yù)測方法主要有時間序列法、趨勢外推法、回歸分析法、灰色預(yù)測法、神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)法、馬爾科夫法等。程文忠等[2]提出了基于支持向量機(jī)理論的港口吞吐量預(yù)測模型;戴霖等[3]應(yīng)用馬爾科夫模型對港口吞吐量進(jìn)行了預(yù)測;范瑩瑩等[4]將由主成分分析法得到的GDP作為參數(shù)引進(jìn)帶外加輸入的非線性自回歸模型(nonlinear autoregressive exogenous model,NARX 模型),建立了上海港集裝箱吞吐量預(yù)測模型;朱小檬等[5]提出了時間序列-因果關(guān)系組合法預(yù)測國內(nèi)海港中長期集裝箱吞吐量;XIE等[6]在最小二乘支持向量回歸(least square support vector regression,LSSVR)模型的基礎(chǔ)上提出了3種組合預(yù)測方法;GENG等[7]提出了一種港口吞吐量預(yù)測模型,該模型應(yīng)用混沌有效遺傳算法(chaotic efficient genetic algorithm,CEGA)優(yōu)化參數(shù),克服了參數(shù)投影尋蹤回歸(parameter projection pursuit regression,PPPR)中參數(shù)測定的難題;HUANG等[8]提出了投影尋蹤回歸-遺傳編程(projection pursuit regression - genetic programming,PPR-GP)方法對青島港集裝箱吞吐量進(jìn)行預(yù)測。
針對港口吞吐量影響因素越來越多的實(shí)際情況,目前對港口吞吐量預(yù)測的研究成果中還沒有既能綜合考慮眾多因素的影響又能控制預(yù)測模型中自變量個數(shù)的有效預(yù)測方法。為此本文應(yīng)用系統(tǒng)聚類法確定影響港口吞吐量的典型因素,再應(yīng)用多元線性回歸分析法,以典型因素作為自變量,建立港口吞吐量的典型因素預(yù)測模型。這樣既能綜合考慮眾多因素的影響,又能結(jié)合實(shí)際情況和預(yù)測需求對影響因素類別進(jìn)行調(diào)整,以控制預(yù)測模型的自變量個數(shù),使預(yù)測模型難度適中可控。通過對廈門港集裝箱吞吐量的實(shí)例分析,驗(yàn)證模型的有效性,為港口未來吞吐量預(yù)測和規(guī)劃提供參考。
港口吞吐量的預(yù)測受眾多因素的影響,這些影響因素的特征有些相近,有些卻完全不相關(guān)。在進(jìn)行港口吞吐量預(yù)測時,如何兼顧眾多因素的影響又不因影響因素過多而增加預(yù)測難度從而影響預(yù)測精度,一直是港口吞吐量預(yù)測的難點(diǎn)。系統(tǒng)聚類法正適用于解決這類型難題。根據(jù)港口吞吐量預(yù)測的目標(biāo)和影響因素的特征,定義影響因素間的相似程度度量標(biāo)準(zhǔn),將各影響因素按照相似程度大小逐一歸類,相似度越大則越優(yōu)先聚合,直到所有的影響因素都聚合完畢,形成一個表示影響因素間親疏關(guān)系的系統(tǒng)聚類圖。根據(jù)系統(tǒng)聚類圖可得到彼此獨(dú)立且具有代表性的影響因素作為典型因素。系統(tǒng)聚類過程如下:
(1)數(shù)據(jù)準(zhǔn)備。假設(shè)港口吞吐量的影響因素有m個,X=(x1,x2,…,xm)T,各影響因素取n年的觀測值,Xi=(xi1,xi2,…,xin),i=1,2,…,m,xij表示第i個影響因素第j年的觀測值。為避免各影響因素值對度量單位的依賴,需對觀測值進(jìn)行Z-Score標(biāo)準(zhǔn)化處理[9]。
(1)
(2)確定影響因素間的相似度。各影響因素間相似度的度量標(biāo)準(zhǔn)為歐氏距離[9]。
(2)
(3)類間相似度的確定。設(shè)Gp和Gq為已聚類合并的兩類影響因素,則定義類間相似度[9]:
xi∈Gp,xk∈Gq, 1≤hp,hq≤m
(3)
式中:Dpq2為Gp和Gq兩個類別中兩兩因素之間的平均平方距離;hp和hq分別為類Gp和類Gq中的影響因素個數(shù)。
(4)影響因素的聚類。應(yīng)用系統(tǒng)聚類法中的組內(nèi)聯(lián)接法進(jìn)行聚類。由式(2)計(jì)算各影響因素之間的距離,將距離最小的兩個影響因素合并成一個新類,其余各影響因素獨(dú)自成類;根據(jù)式(3)計(jì)算類與類之間的距離,并將距離最小的兩類進(jìn)行合并,形成一個新類;重復(fù)進(jìn)行類間距離的計(jì)算及類的合并,直到所有影響因素合并成一個大類為止;最后根據(jù)系統(tǒng)聚類過程生成表示影響因素間親疏關(guān)系的系統(tǒng)聚類圖。
(5)典型因素的確定。根據(jù)實(shí)際需要并結(jié)合系統(tǒng)聚類圖來確定影響因素的分類數(shù),得到彼此獨(dú)立且具有代表性的影響因素類別。在各影響因素類別中分別選取一個總相似距離L值最小的影響因素作為典型因素代替其余影響因素。
與xi為同類影響因素
(4)
式中:Lxi為影響因素xi的總相似距離;h為該類中影響因素的個數(shù),1≤h≤m。
多元線性回歸分析法能考慮到多個因素對港口吞吐量的影響,與系統(tǒng)聚類法結(jié)合能有效地對港口吞吐量進(jìn)行預(yù)測,提高港口吞吐量的預(yù)測精度。設(shè)定影響港口吞吐量的典型因素為x1,x2,…,xl,應(yīng)用多元線性回歸分析法建立典型因素預(yù)測模型為
y=β0+β1x1+β2x2+…+βlxl+ε
(5)
式中:y為港口吞吐量;βi為待定參數(shù),i=0,1,…,l;ε為隨機(jī)干擾項(xiàng),服從正態(tài)分布。
廈門港集裝箱吞吐量的影響因素可分為宏觀因素和微觀因素:宏觀因素包含世界經(jīng)濟(jì)發(fā)展趨勢及政策、海峽西岸經(jīng)濟(jì)區(qū)的建設(shè)、經(jīng)濟(jì)發(fā)展水平、對外貿(mào)易規(guī)模、城市需求能力等;微觀因素包含港口體制改革、管理模式改革、管理因素、生產(chǎn)力布局、集裝箱機(jī)械設(shè)備、集裝箱運(yùn)作模式、集疏運(yùn)能力、基礎(chǔ)設(shè)施、腹地經(jīng)濟(jì)水平、港口競爭力等[10]??紤]到廈門港在兩岸三通、海峽西岸經(jīng)濟(jì)區(qū)、東南國際航運(yùn)中心、自由貿(mào)易區(qū)、21世紀(jì)海上絲綢之路核心區(qū)等規(guī)劃和建設(shè)進(jìn)程中的優(yōu)勢和發(fā)展,廈門港腹地經(jīng)濟(jì)發(fā)展水平會不斷提高,對外貿(mào)易規(guī)模會不斷擴(kuò)大,海鐵聯(lián)運(yùn)量會逐年提高,集疏運(yùn)能力會不斷加強(qiáng)。綜上考慮,選取對廈門港集裝箱吞吐量有較大影響的因素,見表1。
表1 廈門港集裝箱吞吐量的重要影響因素
通過查閱歷年廈門經(jīng)濟(jì)特區(qū)統(tǒng)計(jì)年鑒及相關(guān)統(tǒng)計(jì)資料,收集了表1中影響因素2005—2016年的統(tǒng)計(jì)數(shù)據(jù)。原始數(shù)據(jù)過多,故不在文中一一列舉。
為消除各原始數(shù)據(jù)量綱差異的影響,根據(jù)式(1)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,得
(6)
由式(2)和(3),通過影響因素與影響因素、類與類之間的相似度計(jì)算和類的合并,得到影響因素的系統(tǒng)聚類圖,見圖1。結(jié)合廈門港集裝箱吞吐量的實(shí)際情況和預(yù)測需求,以縱向直線在圖1上左右平移,將直線停在橫坐標(biāo)17時,可確定3類影響因素,此時與直線有交點(diǎn)的每根橫線所對應(yīng)的影響因素就是一類,即其橫線左端包含的各個影響因素就是此類的成員。具體分類結(jié)果見表2。
圖1 廈門港集裝箱吞吐量影響因素的系統(tǒng)聚類圖表2 廈門港集裝箱吞吐量影響因素的分類結(jié)果
類別劃分第1類第2類第3類影響因素x5x10x1,x2,x3,x4,x6,x7,x8,x9,x11,x12,x13
根據(jù)式(4)計(jì)算第3類影響因素中各因素的L值, 得到Lx1=1.803,Lx2=5.745,Lx3=1.810,Lx4=2.136,Lx6=1.914,Lx7=5.008,Lx8=2.495,Lx9=2.026,Lx11=3.171,Lx12=7.850,Lx13=1.919。經(jīng)比較可知,影響因素x1的L值最小,因此確定第3類影響因素中的典型因素為腹地GDP值。因?yàn)樵擃愔懈饕蛩氐奶卣饔休^大相似性,對預(yù)測對象的貢獻(xiàn)率基本一致,所以經(jīng)計(jì)算選出的腹地GDP值能充分代表該類中其余因素對港口吞吐量的影響。
綜上所述,可確定影響廈門港集裝箱吞吐量的典型因素為港口固定資產(chǎn)投資總額、海鐵聯(lián)運(yùn)量和腹地GDP值。經(jīng)系統(tǒng)聚類分析后得到的這3個典型因素彼此獨(dú)立且具有代表性,能綜合代表其余因素對廈門港集裝箱吞吐量的影響。
2005—2016年廈門港集裝箱吞吐量、腹地GDP值、港口固定資產(chǎn)投資總額和海鐵聯(lián)運(yùn)量4個方面的統(tǒng)計(jì)數(shù)據(jù)見表3。
表3 2005—2016年廈門港4個方面的統(tǒng)計(jì)數(shù)據(jù)
根據(jù)式(5),將腹地GDP值、港口固定資產(chǎn)投資總額和海鐵聯(lián)運(yùn)量這3個典型因素作為自變量,應(yīng)用多元線性回歸分析法[9]建立廈門港集裝箱吞吐量的典型因素預(yù)測模型:
(7)
根據(jù)多元線性回歸統(tǒng)計(jì)檢驗(yàn),模型(7)的調(diào)整R2(調(diào)整決定系數(shù))為0.998,且F統(tǒng)計(jì)量的P值(概率值)小于0.01。這表明該預(yù)測模型的擬合度較好,并通過了F檢驗(yàn),因變量與自變量之間存在真正的線性關(guān)系,因此該預(yù)測模型具有較高的有效性。其檢驗(yàn)數(shù)據(jù)見表4。
表4 預(yù)測模型相關(guān)檢驗(yàn)數(shù)據(jù)
模型(7)的誤差分析結(jié)果見表5。由表3可以看出2009—2012年廈門港的港口固定資產(chǎn)投資總額和海鐵聯(lián)運(yùn)量出現(xiàn)突變,這種突變導(dǎo)致了2009—2012年廈門港集裝箱吞吐量預(yù)測值出現(xiàn)較大誤差。但預(yù)測模型計(jì)算得到的平均相對誤差為5%,這表明該預(yù)測模型具有較高的預(yù)測精度。
為預(yù)測2017—2019年廈門港集裝箱吞吐量,先應(yīng)用GM(1,1)預(yù)測模型[11]預(yù)測典型因素在2017—2019年的數(shù)值,再將相關(guān)預(yù)測值代入模型(7),經(jīng)計(jì)算可得2017—2019年廈門港集裝箱吞吐量的預(yù)測值,見表6。
表5 廈門港集裝箱吞吐量預(yù)測結(jié)果誤差分析
表6 2017—2019年廈門港集裝箱吞吐量預(yù)測值 萬TEU
從表6預(yù)測結(jié)果可得到,2017年廈門港集裝箱吞吐量將達(dá)到1 031萬TEU,突破全年千萬標(biāo)箱的關(guān)口,未來3年的集裝箱吞吐量將以7%的增速平穩(wěn)增長。近年來廈門市投入大量資金重點(diǎn)扶持內(nèi)貿(mào)集裝箱航線、國內(nèi)國際中轉(zhuǎn)樞紐等,并進(jìn)一步完善中歐班列和開展海鐵聯(lián)運(yùn),海鐵聯(lián)運(yùn)量持續(xù)增加,保證了廈門港集裝箱吞吐量穩(wěn)定增長的勢頭。
通過系統(tǒng)聚類法將特征相似的影響因素放在同一類,將特征不同的影響因素放在不同的類,可得到彼此獨(dú)立且具有代表性的港口吞吐量典型影響因素。這樣既減少了影響因素的個數(shù),簡化了預(yù)測模型,又不丟失對港口吞吐量有重要影響的因素,保證了預(yù)測結(jié)果的有效性,克服了傳統(tǒng)單一因素預(yù)測模型的弊端。通過對廈門港集裝箱吞吐量進(jìn)行實(shí)例應(yīng)用,驗(yàn)證了港口吞吐量典型因素預(yù)測模型具有較高的有效性和預(yù)測精度,準(zhǔn)確反映了廈門港集裝箱吞吐量變化的實(shí)際情況。腹地GDP值、港口固定資產(chǎn)投資總額和海鐵聯(lián)運(yùn)量等3個典型因素與廈門港集裝箱吞吐量的發(fā)展密切相關(guān),今后可作為廈門港集
裝箱吞吐量預(yù)測和規(guī)劃建設(shè)的一個重要參考,但仍需進(jìn)一步對這三個典型因素的預(yù)測方法進(jìn)行細(xì)化研究。
參考文獻(xiàn):
[1] 張麗君, 劉佳駿. 中國沿海港口吞吐量內(nèi)在影響因素研究[J]. 中國水運(yùn), 2008, 8(10): 18-19.
[2] 程文忠, 任鳳香, 周宣赤. SVM在九江港吞吐量預(yù)測中的應(yīng)用研究[J]. 物流工程與管理, 2012, 34(9): 61-64. DOI: 10.3969/j.issn.1674-4993.2012.09.026.
[3] 戴霖, 黃浩, 黃倩盈, 等. 基于馬爾科夫模型的港口吞吐量預(yù)測[J]. 水運(yùn)管理, 2014, 36(3): 18-22. DOI: 10.13340/j.jsm.2014.03.005.
[4] 范瑩瑩, 余思勤. 基于NARX神經(jīng)網(wǎng)絡(luò)的港口集裝箱吞吐量預(yù)測[J]. 上海海事大學(xué)學(xué)報, 2015, 36(4): 1-5. DOI: 10.13340/j.jsmu.2015.04.001.
[5] 朱小檬, 欒維新, 朱義勝. 基于時間序列-因果關(guān)系結(jié)合法的中國海港集裝箱吞吐量中長期預(yù)測[J]. 大連海事大學(xué)學(xué)報(社會科學(xué)版), 2014, 13(5): 1-5.
[6] XIE Gang, WANG Shouyang, ZHAO Yingxue,etal. Hybrid approaches based on LSSVR model for container throughput forecasting: a comparative study[J]. Applied Soft Computing, 2013, 13(5): 2232-2241.
[7] GENG Jing, LI Mingwei, HONG Weichiang,etal. Port throughput forecasting by using PPPR with chaotic efficient genetic algorithms and CMA[C]//2015 IEEE International Conference on Systems, Man, and Cybernetics. Kowloon, China, 9-12 Oct 2015. IEEE, 2015: 1633-1638. DOI: 10.1109/SMC.2015.288.
[8] HUANG Anqiang, LAI Kinkeung, LI Yinhua,etal. Forecasting container throughput of Qingdao Port with a hybrid model[J]. Journal of Systems Science & Complexity, 2015, 28(1): 105-121. DOI: 10.1007/s11424-014-3188-4.
[9] 韓明. 應(yīng)用多元統(tǒng)計(jì)分析[M]. 上海: 同濟(jì)大學(xué)出版社, 2013.
[10] 林連. 廈門港集裝箱吞吐量預(yù)測研究[D]. 武漢: 武漢理工大學(xué), 2009.
[11] 姚天祥, 鞏在武. 灰色預(yù)測理論及其應(yīng)用[M]. 北京: 科學(xué)出版社, 2014.