国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于灰色關(guān)聯(lián)分析的LS-SVM的高鐵客流量預(yù)測

2019-01-06 03:43趙盼張浩倫耿立艷張占福
中國市場 2019年31期
關(guān)鍵詞:灰色關(guān)聯(lián)分析

趙盼 張浩倫 耿立艷 張占福

摘要:結(jié)合灰色關(guān)聯(lián)分析(GRA)和最小二乘支持向量機(jī)(LS-SVM),構(gòu)建基于GRA的LS-SVM高鐵客流量預(yù)測模型(GRA-LS-SVM)。將高鐵客流量的影響因素初步設(shè)為17項,利用灰色關(guān)聯(lián)分析從中選取主要影響因素,并將其作為輸入變量,構(gòu)建LS-SVM。以我國高鐵客流量數(shù)據(jù)為例,驗證GRA-LS-SVM的有效性。結(jié)果顯示,GRA-LS-SVM不僅簡化了模型結(jié)構(gòu),而且提高了高鐵客流量預(yù)測精度。

關(guān)鍵詞:高鐵客流量 灰色關(guān)聯(lián)分析 最小二乘支持向量機(jī)

1.引言

隨著各種交通工具的發(fā)展,客運市場競爭加劇,消費者對于出行的需求正在發(fā)生著變化。作為我國傳統(tǒng)的交通工具——鐵路運輸業(yè)出現(xiàn)了前所未有的挑戰(zhàn),滿足旅客的出行要求是保持運輸市場份額的重要條件。同時人們對于出行的成本、時間、服務(wù)質(zhì)量等多方面做出了更高的要求,因此我國高速鐵路旅客運輸量在客運總量中所占的比例逐年增加,高速鐵路已經(jīng)逐漸成為人們出行的一種必要選擇方式。隨著高鐵數(shù)據(jù)的涌現(xiàn),如何通過對數(shù)據(jù)的深層次挖掘,提升高鐵客流量預(yù)測精度,是一個亟待解決的重要課題。

高鐵客流量在多種影響因素作用下呈現(xiàn)非線性的變動,且較為復(fù)雜,為了提高預(yù)測精度,劉強(qiáng)、陸化普(2011)等針對區(qū)域鐵路客運量數(shù)據(jù)樣本少的問題,構(gòu)建了基于支持向量機(jī)(SVM)的區(qū)域運量滾動預(yù)測模型,通過實例分析證明該模型的預(yù)測精度優(yōu)于傳統(tǒng)預(yù)測方法[1],夏國恩等(2010)提出的加權(quán)SVM,通過賦予懲罰因子不同的加權(quán)系數(shù),獲得了比SVM和BP神經(jīng)網(wǎng)絡(luò)更優(yōu)的預(yù)測效果[2],張蕾、孫德山(2018)將灰色關(guān)聯(lián)分析方法與支持向量機(jī)預(yù)測方法相結(jié)合預(yù)測鐵路貨運量,預(yù)測較為準(zhǔn)確[3]。可見,SVM是預(yù)測客運、貨運量的重要方法。本文將SVM的改進(jìn)形式最小二乘支持向量機(jī)(LS-SVM)與灰色關(guān)聯(lián)分析相結(jié)合,預(yù)測高鐵客流量的預(yù)測,期望為高鐵的修建、管理及運營提供理論與方法指導(dǎo)。

2. LS-SVM

2.1 LS-SVM算法

支持向量機(jī)最適合于小樣本的學(xué)習(xí)環(huán)境。它的關(guān)鍵在于要找出所有的支持向量,從這些支持向量,就能得出最優(yōu)分隔超平面了。這一做法讓人聯(lián)想到普通信號的處理。對于一個信號,其結(jié)構(gòu)都是真實信號加上各種噪聲。做信號處理時,目的就是為了削弱噪聲的影響,從而得出真實的信號值。支持向量機(jī)與信號濾波有相似之處,在樣本里,除了支持向量的那些點就像是信號里的噪聲,支持向量恰對應(yīng)于信號中的真實成分,支持向量機(jī)里尋找最優(yōu)超平面恰好就是信號處理時要極大化削弱噪聲的影響。

本文所采用的最小二乘支持向量機(jī)便是一種被最為廣泛采用的方法,其對非線性問題的處理有較好的準(zhǔn)確度及精度提升。與人工神經(jīng)網(wǎng)絡(luò)比,它能克服訓(xùn)練時間長、訓(xùn)練結(jié)果存在隨機(jī)性以及過學(xué)習(xí)的不足。

設(shè)樣本為n維向量,其中1個樣本及其值表示為

首先用非線性映射把樣本從原空間映射到特征空間)。在這個高維特征空間中構(gòu)造最優(yōu)決策函數(shù),非線性估計函數(shù)就轉(zhuǎn)化為高維特征空間中的線性估計函數(shù)。根據(jù)風(fēng)險最小化原則,設(shè),其中控制模型的復(fù)雜度,c為正規(guī)化參數(shù),為誤差控制參數(shù),也即不敏感損失函數(shù)。常用的損失函數(shù)有線性損失函數(shù),二次損失函數(shù),huber損失函數(shù)。選取不同的損失函數(shù)可構(gòu)造不同形式的支持向量機(jī)。最小二乘支持向量機(jī)選用的損失函數(shù)為誤差的二次項,故優(yōu)化問題為

(1)

用拉格朗日法求解這個優(yōu)化問題

(2)

其中,是拉格朗日乘子,根據(jù)優(yōu)化條件:

(3)

可得

(4)

定義核函數(shù),是滿足Mercer條件的對稱函數(shù)。根據(jù)(4),優(yōu)化問題轉(zhuǎn)化為求解線性方程:

= ????????????????(5)

最后得到方程: ?????????????????????????????(6)

2.2LS-SVM核函數(shù)

常用的核函數(shù)有線性核函數(shù),多項式核函數(shù),高斯核函數(shù)等,線性核函數(shù)適用于線性可分?jǐn)?shù)據(jù),多項式核函數(shù)的參數(shù)較多,計算復(fù)雜度高,而高斯徑向基函數(shù)是一種局部性較強(qiáng)的核函數(shù),該核函數(shù)是應(yīng)用最廣的核函數(shù),無論對大樣本還是小樣本均具有很好的學(xué)習(xí)性能[4]。由于影響高鐵客流量的非線性因素較復(fù)雜,并且樣本較少,本文采用高斯核函數(shù)(RBF):進(jìn)行最小二乘支持向量機(jī)的預(yù)測。

3.灰色關(guān)聯(lián)分析

灰色關(guān)聯(lián)分析是對影響系統(tǒng)的多個因素進(jìn)行比較,分析因素與因素之間、因素與系統(tǒng)之間的關(guān)聯(lián)程度[5],步驟如下:

(1)確定參考數(shù)據(jù)序列和比較數(shù)據(jù)序列。確定反映系統(tǒng)行為特征的參考數(shù)據(jù)序列和對系統(tǒng)產(chǎn)生影響的比較數(shù)據(jù)序列。這里將參考數(shù)據(jù)序列設(shè)為,比較數(shù)據(jù)序列設(shè)為。

(2)無量綱化處理數(shù)據(jù)。由于各因素列的數(shù)據(jù)因量綱不同導(dǎo)致不易比較或得出錯誤的結(jié)論,因此,在計算關(guān)聯(lián)度時需要將數(shù)據(jù)進(jìn)行無量綱化處理。本文采用初值化處理方法,獲得的數(shù)據(jù)序列稱為原始數(shù)據(jù)序列的初值像,計算公式為:

(7)

(3)計算關(guān)聯(lián)系數(shù)。求出參考數(shù)據(jù)序列與初值像差的絕對值的最大值、最小值,按下式計算關(guān)聯(lián)系數(shù):

(8)

(4)計算關(guān)聯(lián)度。關(guān)聯(lián)度是該序列各關(guān)聯(lián)系數(shù)的平均值,計算公式為:

(9)

其中,。的值越接近于1,說明影響因素與系統(tǒng)的關(guān)聯(lián)性越大;反之,則兩者的關(guān)聯(lián)性越小。

(5)關(guān)聯(lián)度排序。按照關(guān)聯(lián)度的大小,可對影響因素進(jìn)行排序,說明影響因素與系統(tǒng)之間的關(guān)聯(lián)程度。

4.實證分析

4.1高鐵客流量影響因素

選取2008~2015年高鐵客流量及其17項影響因素數(shù)據(jù)(數(shù)據(jù)來源于國家統(tǒng)計局網(wǎng)站和《中國統(tǒng)計年鑒2016》)。17項影響因素由外部、內(nèi)部、其他三類影響因素構(gòu)成。外部影響因素指標(biāo)由國內(nèi)生產(chǎn)總值(GDP)、全社會固定資產(chǎn)投資、總?cè)丝跀?shù)、社會消費品零售總額、城鎮(zhèn)居民人均可支配收入、居民消費水平、貨物進(jìn)出口總額共7個二級指標(biāo)構(gòu)成;內(nèi)部影響因素指標(biāo)包含公路客運量、水運客運量、民用航空客運量、高鐵營業(yè)里程、高鐵營業(yè)里程占鐵路營業(yè)里程比重、高速公路里程、定期航班航線里程共7個二級指標(biāo);其他影響因素指標(biāo)包含國內(nèi)游客數(shù)、入境游客數(shù)、鐵路固定資產(chǎn)投資共3個二級指標(biāo)。

4.2灰色關(guān)聯(lián)分析過程

將參考數(shù)據(jù)序列為高鐵客流量、比較數(shù)據(jù)序列為17項影響因素。按照公式(7)對數(shù)據(jù)進(jìn)行無量綱化處理,得到初值像,計算關(guān)聯(lián)系數(shù)時取分辨系數(shù)=0.65,將各因素的8個關(guān)聯(lián)系數(shù)取平均值得到關(guān)聯(lián)度,計算結(jié)果見表1。

由表1得到關(guān)聯(lián)度排序:入境游客數(shù)<總?cè)丝跀?shù)<公路客運量<貨物進(jìn)出口總額<水運客運量<定期航班航線里程<城鎮(zhèn)居民人均可支配收入<高速公路里程<居民消費水平<國內(nèi)生產(chǎn)總值<國內(nèi)游客數(shù)<民用航空客運量<社會消費品零售總額<鐵路固定資產(chǎn)投資<全社會固定資產(chǎn)投資<高鐵營業(yè)里程占鐵路營業(yè)里程比重<高鐵營業(yè)里程

從關(guān)聯(lián)度排序可知,高鐵營業(yè)里程與高鐵客流量的關(guān)聯(lián)程度最強(qiáng),關(guān)聯(lián)度達(dá)到了=0.7367,其次是高鐵營業(yè)里程占鐵路營業(yè)里程比重,關(guān)聯(lián)度=0.7271,

全社會固定資產(chǎn)投資與鐵路固定資產(chǎn)投資也對高鐵客流量有較大的影響,其他13項影響因素與高鐵客流量的關(guān)聯(lián)程度均在0.68-0.69之間。

4.3 LS-SVM預(yù)測

將全部數(shù)據(jù)樣本分為兩部分:前7組數(shù)據(jù)即2008~2014年的數(shù)據(jù)樣本用于訓(xùn)練LS-SVM,后1組數(shù)據(jù)即2015年的數(shù)據(jù)樣本用于檢驗LS-SVM的預(yù)測性能。

根據(jù)灰色關(guān)聯(lián)分析結(jié)果,將高鐵營業(yè)里程、高鐵營業(yè)里程占鐵路營業(yè)里程比重、全社會固定資產(chǎn)投資、鐵路固定資產(chǎn)投資共4項影響因素作為輸入變量,以高鐵客流量作為輸出變量,構(gòu)建LS-SVM,用于預(yù)測高鐵客流量。

為驗證本文方法的有效性,基于相同的數(shù)據(jù)樣本集,將高鐵客流量的17項影響因素作為輸入變量,構(gòu)建LS-SVM預(yù)測高鐵客流量。最后將兩種方法的預(yù)測結(jié)果進(jìn)行比較,結(jié)果如表2所示,其中,GRA-LS-SVM代表以灰色關(guān)聯(lián)分析選取的4項影響因素作為輸入變量構(gòu)建的LS-SVM。

由表2可知,GRA-LS-SVM的2015年高鐵客流量預(yù)測值為81237萬人,相對預(yù)測誤差為0.1550;而LS-SVM的2015年預(yù)測值為80319萬人,相對預(yù)測誤差為0.1645。GRA-LS-SVM的預(yù)測值更接近于實際值96139萬人。這表明,GRA-LS-SVM的預(yù)測值更接近于實際值,預(yù)測精度更高。由此可見,利用灰色關(guān)聯(lián)分析進(jìn)行影響因素的篩選,不僅減少了LS-SVM輸入變量,而且一定程度上提高了LS-SVM的預(yù)測精度。

表2 兩種方法預(yù)測結(jié)果比較

模型 實際值/萬人 預(yù)測值/萬人 預(yù)測誤差

GRA-LS-SVM 96139 81237 0.1550

LS-SVM 96139 80319 0.1645

5.結(jié)論

將灰色關(guān)聯(lián)分析與用LS-SVM結(jié)合預(yù)測高鐵客流量。結(jié)果表明,通過灰色關(guān)聯(lián)分析選擇影響因素后,LS-SVM的結(jié)構(gòu)更為簡單,其高鐵客流量預(yù)測精度有所提高,預(yù)測結(jié)果更接近于真實值。

參考文獻(xiàn)

[1]劉強(qiáng),陸化普,王慶云,等.基于支持向量機(jī)的區(qū)域運量滾動預(yù)測模型[J].哈爾濱工業(yè)大學(xué)學(xué)報,2011,43(2)

[2]夏國恩.客戶流失預(yù)測的現(xiàn)狀與發(fā)展研究[J].計算機(jī)應(yīng)用研究,2010(2)

[3]張蕾,孫德山,張文政,等.基于灰色關(guān)聯(lián)分析的支持向量機(jī)的鐵路貨運量預(yù)測研究.經(jīng)濟(jì)數(shù)學(xué),2018(2):62-65

[4]王定成.支持向量機(jī)建模預(yù)測與控制[M].北京:氣象出版社,2009.

[5]耿立艷.物流需求的智能預(yù)測方法[M].北京:科學(xué)出版社,2016.

基金項目:2018年度大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目“高鐵客流量智能預(yù)測方法及實證研究”(項目編號:201810107005);國家自然科學(xué)基金青年項目(項目編號:61503261)。

作者簡介:通訊作者:耿立艷(1979-),女,天津人,教授,博士。

猜你喜歡
灰色關(guān)聯(lián)分析
內(nèi)蒙古產(chǎn)業(yè)結(jié)構(gòu)與經(jīng)濟(jì)增長的動態(tài)關(guān)系研究
基于灰色關(guān)聯(lián)的河南省旅游收入影響因素研究
基于灰色關(guān)聯(lián)分析的制造企業(yè)跨國并購財務(wù)決策
基于灰色關(guān)聯(lián)分析的京津冀區(qū)域物流一體化協(xié)同發(fā)展
衡山县| 东平县| 文化| 沛县| 大埔区| 称多县| 五指山市| 都江堰市| 武穴市| 阿鲁科尔沁旗| 东乌珠穆沁旗| 弥勒县| 平原县| 久治县| 缙云县| 福清市| 临沭县| 重庆市| 乌苏市| 大宁县| 太仆寺旗| 通州市| 武川县| 宁河县| 昌江| 屏东县| 中西区| 镇安县| 佛坪县| 云南省| 平度市| 武清区| 南充市| 手游| 冕宁县| 灌南县| 西昌市| 塔河县| 宁国市| 浦城县| 昌乐县|