摘 要:與既有線普通鐵路線相比較,高鐵所吸引的旅客群體主要為高中端旅客,他們在旅行需求和心理存在較大的差異。本文以西成高鐵為例,對旅客進(jìn)行大數(shù)據(jù)分析,旨在找出他們之間的關(guān)聯(lián)度,都有利于西成高鐵對當(dāng)前的系統(tǒng)與服務(wù)進(jìn)行改進(jìn),更好地提升用戶對西成高鐵服務(wù)的利用率。
關(guān)鍵詞:客運(yùn)服務(wù);心理需求;質(zhì)量
一、引言
西成高鐵自2017年12月全面投入運(yùn)營后,西部地區(qū)重慶、成都和西安三個主要城市之間距離被大大縮短,據(jù)中國鐵路總公司發(fā)布發(fā)消息,截至到2018年12月4日18時,西成高鐵客運(yùn)專線所共開行的高鐵/動車列車達(dá)到了4.3萬趟,自該線路開通以來平均每天開行的列車約有117趟;發(fā)送的專線沿線旅客超過了1720萬人次,平均每天發(fā)送旅客數(shù)量達(dá)到了4.7萬人次。
二、基于K-means方法的西成高鐵旅客用戶行為與需求挖掘
1.數(shù)據(jù)獲取與數(shù)據(jù)處理
本研究于2018年11月和12月期間,收集了西成高鐵在該年的11月1日至11月30日鐵路客戶服務(wù)中心系統(tǒng)后臺日志數(shù)據(jù),該系統(tǒng)的日志數(shù)據(jù)詳細(xì)記錄了旅客乘坐西成高鐵的出行及獲得相關(guān)服務(wù)的信息,如旅客證件信息、旅客進(jìn)出站記錄、購票記錄、改簽及退換票記錄、接入網(wǎng)絡(luò)的IP地址及終端信息、乘坐車次、列車發(fā)車時間、旅客使用高鐵訂餐相關(guān)服務(wù)的記錄等。
2.數(shù)據(jù)分析流程
對西成高鐵旅客行為與需求進(jìn)行挖掘和分析所采取的方法為大數(shù)據(jù)分析中常用的K-means算法,在具體執(zhí)行該算法的過程中,考慮到西成高鐵旅客的用戶對象主要以學(xué)生、老人及各行各業(yè)的商務(wù)人士為主,用戶雖然具有比較大的異質(zhì)性,但所設(shè)置的聚類簇?cái)?shù)也不宜過多,否則會導(dǎo)致聚類效果較差。我們根據(jù)西成高鐵旅客用戶的大致分類情況,將擬采用的K-means算法所獲得的聚類簇?cái)?shù)設(shè)置為6個,其具體分析過程包含原始數(shù)據(jù)獲取、數(shù)據(jù)篩選、高鐵服務(wù)使用類別數(shù)量、出行次數(shù)比較、使用增值服務(wù)的行為比重、使用一般服務(wù)的行為比重、數(shù)據(jù)類型設(shè)置、數(shù)據(jù)過濾、K-means聚類等環(huán)節(jié)。
3.聚類分析結(jié)果
本研究通過K-means聚類分析算法所得出的聚類分析結(jié)果如表2所示。由于將K-means聚類簇?cái)?shù)設(shè)置為6個,我們可以因此獲得六個聚類結(jié)果。在這六個類中,聚類3僅包含兩個記錄,且該聚類下的增值服務(wù)使用次數(shù)、一般服務(wù)使用次數(shù)、活動次數(shù)、活動持續(xù)時間、利用西成高鐵服務(wù)數(shù)量的值均要遠(yuǎn)大于其他五個類,說明聚類3所包含的26個記錄存在異常的情況,因此我們不需要對該類的相關(guān)信息進(jìn)行更進(jìn)一步的分析。
聚類1所包含了記錄數(shù)最多,記錄數(shù)占所有數(shù)據(jù)總量的18.57%,該類下聚集了大量用戶,共有8273個用戶,是包含用戶數(shù)最多的類該類用戶在數(shù)據(jù)采集期間在鐵路服務(wù)系統(tǒng)中的出行記錄數(shù)量平均值為3.025個,在出行過程中所包含的活動行為數(shù)量平均有55.764個,在所有類中處于中等水平,說明該類旅客用戶乘坐西成高鐵的行為活動及其使用相關(guān)服務(wù)的行為比較正常。該類旅客用戶使用西成高鐵一般服務(wù)的行為比重相對較低,這些旅客的增值服務(wù)使用次數(shù)、一般服務(wù)使用次數(shù)都處于比較中間的水平,說明這類用戶利用西成高鐵服務(wù)目的比較統(tǒng)一和集中,主要利用的是西成高鐵的某一個服務(wù),通常主要是購票服務(wù)??傮w來看,該類旅客用戶對西成高鐵服務(wù)的利用處于中等水平,其目的主要以購票為主,利用西高鐵提供的其他增值服務(wù)的次數(shù)并不高,因此西成高鐵可重點(diǎn)關(guān)注這類用戶在出行目的地及其在出行過程中的服務(wù)使用記錄,有針對性地為這些旅客推薦一些出行或休閑相關(guān)的信息,以使?jié)M足這類旅客用戶的出行需求。
聚類2所包含的記錄數(shù)其次多,記錄數(shù)占到了所有數(shù)據(jù)總量的12.42%,該類下包含的用戶數(shù)量為4435個,是用戶數(shù)量其次多的類。在該類下使用智能設(shè)備的用戶數(shù)量比較并不算高,只有26%,說明該類用戶大多使用的是桌面端的設(shè)備接入到西成高鐵的鐵路服務(wù)系統(tǒng)。該類用戶使用西成高鐵的出行次數(shù)平均值為2.049次,比聚類1的出行次數(shù)相對要少,該類用戶一般服務(wù)使用的比重也比較高,達(dá)到了58%,該類旅客用戶的增值服務(wù)使用行為比重也不算低,達(dá)到了24.6%,要高于聚類1,說明該類用戶在使用高鐵一般服務(wù)的同時,也會發(fā)起比較多的增值服務(wù)行為。
聚類4和聚類5所包含的記錄數(shù)占所有數(shù)據(jù)記錄的比重分別為6.63%和4.27%,這兩類用戶屬于兩類行為相反的用戶群。其中,聚類4的用戶屬于以一般服務(wù)使用為主要目的,主要利用桌面端設(shè)備進(jìn)行操作,會在鐵路服務(wù)系統(tǒng)中留下比較多的服務(wù)使用記錄,以獲取精確的服務(wù)項(xiàng)目的用戶群,該類用戶進(jìn)行其他的情況相對較少;聚類5的用戶屬于更愿意利用鐵路服務(wù)系統(tǒng)中其他服務(wù)的用戶,這類用戶以利用智能設(shè)備為主。另外,聚類6的用戶在一般服務(wù)行為和增值服務(wù)使用行為的頻次上都不算,但其活動記錄的次數(shù)卻達(dá)到了117.54次,說明這類用戶喜歡比較喜歡漫無目的在鐵路服務(wù)系統(tǒng)進(jìn)行相關(guān)無關(guān)操作,這類用戶利用西成高鐵出行的需求并不明確,需要為之提供必要的指導(dǎo)。
三、討論
總體來看,本研究運(yùn)用K-means算法對西成高鐵旅客用戶的出行及其活動行為進(jìn)行分析,揭示了西成高鐵旅客用戶行為與需求進(jìn)行了挖掘。通過通過K-means算法進(jìn)行聚類分析,我們得出了六個類:第1類用戶對西成高鐵增值服務(wù)的使用頻次并不高,因此西成高鐵可重點(diǎn)關(guān)注這類用戶在出行目的地及其在出行過程中的服務(wù)使用記錄,有針對性地為這些旅客推薦一些出行或休閑相關(guān)的信息,以使?jié)M足這類旅客用戶的出行需求;第2類旅客用戶增值服務(wù)使用行為所占的比重相對較高,其桌面端的用戶占多數(shù),這與本研究之前所得出的結(jié)論保持一致。針對這類用戶,西成高鐵在進(jìn)行高鐵服務(wù)精確推送的同時,還可通過鐵種系統(tǒng)服務(wù)平臺與短信等渠道為其推薦更多的服務(wù)、資源供其選擇;第3類存在異常的情況,故而舍去;第4類和第5類用戶屬于兩類行為相反的用戶群,第4類的用戶屬于以一般服務(wù)使用為主要目的,主要利用桌面端設(shè)備進(jìn)行操作,會在鐵路服務(wù)系統(tǒng)中留下比較多的服務(wù)使用記錄,而第5類的用戶屬于更愿意利用鐵路服務(wù)系統(tǒng)中其他服務(wù)的用戶,這類用戶以利用智能設(shè)備為主;第6類用戶一般服務(wù)行為和增值服務(wù)使用行為的頻次上都不算,這類用戶利用西成高鐵出行的需求并不明確,需要為之提供必要的指導(dǎo)。
另外,從西成高鐵旅客用戶數(shù)據(jù)聚類結(jié)果揭示的各項(xiàng)服務(wù)之間的關(guān)聯(lián)規(guī)則來看,車票查詢和自助售票兩項(xiàng)服務(wù)之間的關(guān)聯(lián)性最強(qiáng),其次是列車運(yùn)行和車票查詢兩項(xiàng)服務(wù),再次是自助售票和自助檢票,說明旅客用戶利用西成高鐵出行最基本的幾項(xiàng)服務(wù)之間具有比較高的關(guān)聯(lián)性,并且也是置信度最高的幾項(xiàng)關(guān)聯(lián)規(guī)則。置信度比較高的關(guān)聯(lián)規(guī)則還有便捷通道和托運(yùn)服務(wù)之間關(guān)聯(lián)規(guī)則,說明西成高鐵的許多旅客用戶在選擇通過車站提供的便捷通道進(jìn)入候車區(qū)域后,還會選擇將使用車站提供的托運(yùn)服務(wù)使自己享受到進(jìn)一步的便捷服務(wù)。這些關(guān)聯(lián)規(guī)則的揭示,都有利于西成高鐵對當(dāng)前的系統(tǒng)與服務(wù)進(jìn)行改進(jìn),更好地提升用戶對西成高鐵服務(wù)的利用率。
參考文獻(xiàn):
[1]趙淇.高速鐵路客運(yùn)服務(wù)質(zhì)量評價體系的研究[D].大連:大連交通大學(xué),2017
[2]王莉莉.鐵路客運(yùn)服務(wù)文化建設(shè)評價體系的研究[D].北京驕傲同大學(xué).2018:75-83
[3]曹陽.世界健康調(diào)查項(xiàng)目中國預(yù)調(diào)查的測量方法及質(zhì)量評估[J].復(fù)旦大學(xué),2014(12):63-64
[4]張秀敏.旅客服務(wù)心理指標(biāo)綜合評價方法[J].鐵道運(yùn)輸與經(jīng)濟(jì),2015(10):35-39
[5]張秀敏.基于旅客心理需求的鐵路客運(yùn)服務(wù)綜合評價模型研究[J].企業(yè)技術(shù)開發(fā),2015(10):35-39
作者簡介:
魏寶紅(1979—)女,陜西西安市人,碩士研究生,西安鐵路職業(yè)技術(shù)學(xué)院交通運(yùn)輸學(xué)院講師,研究方向:高鐵客運(yùn)乘務(wù)。