吳濤 申騰飛 莊明軒 閆新男 段莉華
摘要:開(kāi)放式收費(fèi)停車場(chǎng)是解決城市道路管理和路邊規(guī)范停車的新型手段,停車場(chǎng)的管理運(yùn)營(yíng)公司常常面臨停車計(jì)時(shí)困難和收費(fèi)率低等問(wèn)題。為了降低成本和增加營(yíng)收,運(yùn)營(yíng)公司需要對(duì)停車用戶分析行為進(jìn)行建模和分析。本文通過(guò)分析開(kāi)放式收費(fèi)停車場(chǎng)的停車數(shù)量隨時(shí)間的變化,發(fā)現(xiàn)用戶的停車行為與用戶的通勤時(shí)間、日常作息時(shí)間和假期之間存在相關(guān)性。結(jié)合用戶行為的周期性特征,本文提出運(yùn)營(yíng)公司可以周期性地管理和維護(hù)停車場(chǎng)?;赗FM模型和K-means算法,本文實(shí)現(xiàn)對(duì)開(kāi)放式收費(fèi)停車客戶的準(zhǔn)確分類,并挖掘用戶的潛在價(jià)值以最大限度地提高收入。
關(guān)鍵詞:開(kāi)放式收費(fèi)停車場(chǎng);RFM模型;K-Means聚類
中圖分類號(hào):TP37? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)17-0001-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 引言
隨著我國(guó)經(jīng)濟(jì)水平提高,科技力量不斷增強(qiáng),計(jì)算機(jī)性能、網(wǎng)絡(luò)技術(shù)不斷成熟提高,用戶行為分析[1]技術(shù)愈發(fā)成熟,傳統(tǒng)的商業(yè)模式正在被一個(gè)新的營(yíng)銷模式—“數(shù)據(jù)化營(yíng)銷”所替代,尤其是用戶行為分析技術(shù)在如今的商業(yè)領(lǐng)域的優(yōu)勢(shì)十分明顯。信息化時(shí)代來(lái)臨使得數(shù)據(jù)焦點(diǎn)從企業(yè)產(chǎn)品轉(zhuǎn)向用戶群體,用戶行為分析成為公司部門(mén)的核心問(wèn)題。企業(yè)借助大數(shù)據(jù)技術(shù)對(duì)用戶行為檢測(cè)獲取數(shù)據(jù),分析比較不同的客戶群體,通過(guò)建立合理的客戶價(jià)值評(píng)估模型[2],對(duì)客戶進(jìn)行分群,分析比較不同客戶群的客戶價(jià)值,并制定相應(yīng)的營(yíng)銷策略[3],對(duì)不同的客戶群提供個(gè)性化的客戶服務(wù)提高企業(yè)受益,減輕企業(yè)負(fù)擔(dān)。用戶行為數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。這個(gè)定義包括好幾層含義:數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識(shí);發(fā)現(xiàn)的知識(shí)要可接受、可理解、可運(yùn)用,企業(yè)從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)能更加準(zhǔn)確區(qū)分客戶群體,將資源更準(zhǔn)確地投入用戶手中。
2 數(shù)據(jù)來(lái)源和預(yù)處理
2.1數(shù)據(jù)來(lái)源
本文數(shù)據(jù)取自某三線城市的開(kāi)放式收費(fèi)停車場(chǎng)平臺(tái)2020年的用戶數(shù)據(jù),數(shù)據(jù)中存在部分缺失數(shù)據(jù)、無(wú)效數(shù)據(jù)、重復(fù)數(shù)據(jù)、為了減少數(shù)據(jù)冗余提高數(shù)據(jù)準(zhǔn)確性,剔除無(wú)效數(shù)據(jù)和非法數(shù)據(jù),在數(shù)據(jù)分析之前先對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的清洗和預(yù)處理。
2.2數(shù)據(jù)預(yù)處理
1)屬性規(guī)約:基于客戶價(jià)值的RFM的模型[4],我們選出停車記錄表中的"car_num" ,"car_no","duration","amout","start_time","end_time","fees_paid","recover_amount"這八個(gè)字段。
2)刪除數(shù)據(jù)集中的重復(fù)數(shù)據(jù)。
3)異常數(shù)據(jù)的處理:通過(guò)計(jì)算和觀察發(fā)現(xiàn)數(shù)據(jù)集中存在部分異常數(shù)據(jù),比如客戶停車時(shí)間和結(jié)束停車的時(shí)間一致,對(duì)于這種類似的數(shù)據(jù)意義不大因此本文采取刪除該類型的數(shù)據(jù)。
4)數(shù)據(jù)轉(zhuǎn)換:最近的消費(fèi)間隔 =統(tǒng)計(jì)截止時(shí)間– 每輛車最近一次的消費(fèi)時(shí)間消費(fèi)金額 =已付金額("fees_paid")+補(bǔ)繳("recover_amount")消費(fèi)頻率 =每輛車出現(xiàn)次數(shù)的分類匯總。
3 停車用戶行為特征分析
3.1停車數(shù)量時(shí)間特性分析
選取某三線城市2020年的開(kāi)放式收費(fèi)停車場(chǎng)數(shù)據(jù)。對(duì)2020年平均每天的停車數(shù)據(jù)分析,統(tǒng)計(jì)得到以一小時(shí)為間隔的停車數(shù)量,24小時(shí)的停車流量變化情況如圖1所示。
從圖中可以看出,停車場(chǎng)停車數(shù)量最少的時(shí)刻集中在24:00-05:00,這是因?yàn)榇蟛糠秩硕荚谛菹?,停車車輛大多是該停車場(chǎng)場(chǎng)附近居民的車輛,停車數(shù)量總體較少;在06:30-12:00時(shí)段停車數(shù)量開(kāi)始呈現(xiàn)持續(xù)上升的趨勢(shì),由于該停車場(chǎng)位于都市的商業(yè)圈附近,這段時(shí)間正是人們選擇去商場(chǎng)購(gòu)物的時(shí)候,所以這段時(shí)間內(nèi)的停車的數(shù)量逐漸增加,說(shuō)明這群人大部分是來(lái)商場(chǎng)工作或者消費(fèi)的。在12:00-14:00和19:00-20:00這兩個(gè)時(shí)間段出現(xiàn)了當(dāng)天的兩個(gè)停車高峰,而這兩個(gè)時(shí)間段正好是一天當(dāng)中的午餐時(shí)間和晚餐時(shí)間,人們來(lái)商場(chǎng)購(gòu)物,或者在商場(chǎng)附近就餐;在15:00-17:00這段時(shí)間內(nèi),人們正處于購(gòu)物或完成購(gòu)物準(zhǔn)備離開(kāi)的狀態(tài),停車車輛明顯減少,所以呈現(xiàn)波谷形狀;從20:00-24:00這段時(shí)間,停車場(chǎng)停車數(shù)量呈現(xiàn)下降趨勢(shì),22:00-24:00停車數(shù)量急劇減少,說(shuō)明該時(shí)間段人們完成了購(gòu)物離開(kāi)了商場(chǎng)準(zhǔn)備回家休息。
選取某三線城市2020年的開(kāi)放式收費(fèi)停車場(chǎng)數(shù)據(jù),對(duì)2020年平均一周的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,分析工作日和周末之間的停車數(shù)量差異,統(tǒng)計(jì)以天為間隔的停車數(shù)量,如圖2所示。
從圖中可以看出從星期一到星期五的三個(gè)指標(biāo)趨勢(shì)大致相同,由于人們的生活方式和通勤時(shí)間相對(duì)固定,該時(shí)段內(nèi)消費(fèi)人群規(guī)模較小,所以在工作日這段時(shí)間停車數(shù)量較為穩(wěn)定,而在周末這兩天,停車車輛明顯要高于工作日,這說(shuō)明到了周末人們開(kāi)始選擇放松,出門(mén)逛街或者游玩。
選取某三線城市2020年的開(kāi)放式收費(fèi)停車場(chǎng)數(shù)據(jù),對(duì)2020年特殊月份的開(kāi)放式收費(fèi)停車場(chǎng)數(shù)據(jù)進(jìn)行用戶行為分析,從而找出停車數(shù)量在節(jié)假日對(duì)開(kāi)放式收費(fèi)停車場(chǎng)的影響。統(tǒng)計(jì)得到以二十四小時(shí)為間隔的停車數(shù)量,一個(gè)月各個(gè)時(shí)段的停車數(shù)量變化情況如圖3所示。
從圖中可以看出十月份的停車數(shù)量在十一期間呈現(xiàn)一個(gè)高峰,這是因?yàn)槭粐?guó)慶節(jié)人們放假休息,所以去往商場(chǎng)進(jìn)行消費(fèi)娛樂(lè)活動(dòng)的人數(shù)較多。到了7日,由于后一天是工作日,人們開(kāi)始減少出行,停車數(shù)量相對(duì)前幾日開(kāi)始顯著下降。從10月8日到10月31日可以看到停車數(shù)量趨于平穩(wěn),且?guī)в休^為明顯的周期波動(dòng),說(shuō)明人們已經(jīng)結(jié)束了假期回歸有規(guī)律的生活和工作節(jié)奏。
選取某三線城市2020年的開(kāi)放式收費(fèi)停車場(chǎng)數(shù)據(jù),對(duì)2020年平均月份開(kāi)放式收費(fèi)停車場(chǎng)停車數(shù)據(jù)進(jìn)行用戶分析,統(tǒng)計(jì)得到以24小時(shí)為間隔的停車數(shù)量,如圖4所示。
從圖中可以看出停車數(shù)量整體呈現(xiàn)有規(guī)律的波動(dòng),以五天為間隔在星期六達(dá)到高峰,星期天的停車數(shù)量要略低于星期六的停車數(shù)量。由于居民出行具有基本的生活規(guī)律,例如工作人員有固定的上下班時(shí)間和休息時(shí)間大多數(shù)會(huì)選擇去商場(chǎng)或者出去旅游,從而使停車場(chǎng)的停車數(shù)量在時(shí)間上呈現(xiàn)一定的規(guī)律。
4 用戶聚類
4.1聚類指標(biāo)選取
經(jīng)過(guò)數(shù)據(jù)預(yù)處理和分析[5],統(tǒng)計(jì)得出了客戶的最近一次消費(fèi) (Recency)、消費(fèi)頻率 (Frequency)、消費(fèi)金額 (Monetary)三個(gè)要素。
通過(guò)圖5和數(shù)據(jù)的觀察,發(fā)現(xiàn)M和F的值差異較大,但是那些異常值代表著一些重要的客戶,不能消除。于是我們采取對(duì)模型打分的方法來(lái)消除巨大差異,我們根據(jù)實(shí)際情況和人為判斷,采取等頻的原則進(jìn)行打分,如圖6所示。
4.2聚類結(jié)果
聚類效果如表格1所示。
通過(guò)上述計(jì)算后,得到用戶的分類結(jié)果。重要保持用戶有21636名,占所有用戶的23.23%,這類用戶在平臺(tái)消費(fèi)時(shí)間間隔相距較小,消費(fèi)頻率次數(shù)高、消費(fèi)的金額大,這類用戶能給企業(yè)帶來(lái)可觀的利潤(rùn)收益,重要發(fā)展用戶17353名占所有用戶的18.63%,這類用戶在平臺(tái)消費(fèi)時(shí)間相距較小,消費(fèi)的頻率次數(shù)、消費(fèi)的金額也低,推測(cè)極有可能是新注冊(cè)的用戶,是企業(yè)重點(diǎn)關(guān)注的對(duì)象,重要挽留用戶17049名,占所有用戶的18.31%,這類用戶消費(fèi)頻率次數(shù)和消費(fèi)金額高,但消費(fèi)間隔時(shí)間較長(zhǎng),企業(yè)可以采取優(yōu)惠方式和短信提醒,挽回用戶,一般用戶共有17276名,占所有用戶的18.55%,這類用戶消費(fèi)時(shí)間間隔短,消費(fèi)頻率高,但消費(fèi)金額少,該類用戶可能覺(jué)得企業(yè)的定價(jià)頗高,企業(yè)應(yīng)對(duì)這類用戶群體進(jìn)行調(diào)研,發(fā)現(xiàn)其中的問(wèn)題并解決將其轉(zhuǎn)為重點(diǎn)用戶以及低價(jià)值用戶19818名,占所有用戶的21.29%此類用戶在平臺(tái)消費(fèi)間隔時(shí)間長(zhǎng),消費(fèi)頻率次數(shù)低、消費(fèi)金額也少,這類用戶給企業(yè)創(chuàng)造的營(yíng)收微薄,企業(yè)不必投入過(guò)多的資源在此類用戶身上。分類結(jié)果如圖1所示。
4.3聚類特征分析
聚類結(jié)果如圖7所示。
A類用戶:這類用戶的消費(fèi)金額和消費(fèi)能力大[6],而且來(lái)停車頻率高。這類用戶是高價(jià)值客戶,是最理想的客戶類型,但是,近期停車時(shí)間間隔大,需要用活動(dòng)或者優(yōu)惠吸引他們回來(lái)。
B類用戶:該類用戶近期間隔小,頻率低,消費(fèi)也低,可以推斷為新客戶,具有很大潛力,停車場(chǎng)可以與他們多交流和給出額外的優(yōu)惠,來(lái)培養(yǎng)這類用戶的忠誠(chéng)度。
C類用戶:此類客戶停車頻率高,消費(fèi)金額較少,而且近期停車事件間隔長(zhǎng),可以看出忠誠(chéng)度在慢慢降低,開(kāi)放式收費(fèi)停車場(chǎng)管理平臺(tái)在運(yùn)營(yíng)過(guò)程中要細(xì)心發(fā)現(xiàn)這類用戶的特殊情況,分析競(jìng)爭(zhēng)平臺(tái)的營(yíng)銷方式,采用有效的營(yíng)銷方式回?fù)簟?/p>
D類用戶:此類客戶的消費(fèi)和停車次數(shù)較低,而且近一段時(shí)間間隔較大,創(chuàng)造價(jià)值有限。
E類用戶:此類客戶的頻率一般但消費(fèi)較高,并且近期事件間隔比較小,可以推斷他們是屬于近期頻繁來(lái)停車,屬于增長(zhǎng)性,他們是停車場(chǎng)未來(lái)的主力客戶。開(kāi)放式收費(fèi)停車場(chǎng)在運(yùn)營(yíng)過(guò)程中可以相應(yīng)加大對(duì)這類用戶群體的投入,比如以通知、短信、郵件的方式詢問(wèn)用戶是否滿意開(kāi)放式收費(fèi)停車場(chǎng)管理平臺(tái)提供的服務(wù)等,并給予相關(guān)的優(yōu)惠補(bǔ)貼,提高用戶黏合度。
5 方法評(píng)估
本模型采用近期的歷史數(shù)據(jù)進(jìn)行建模[7],隨著時(shí)間的推移,分析數(shù)據(jù)的觀測(cè)窗口也在變換,因此對(duì)于新增的客戶信息,以及未來(lái)業(yè)務(wù)的實(shí)際情況,該模型建議一個(gè)月運(yùn)行一次,對(duì)新增的客戶信息通過(guò)聚類中心進(jìn)行判斷,同時(shí)對(duì)本次新增客戶的特征進(jìn)行分析,如果新增的數(shù)據(jù)情況與判斷的結(jié)果差異過(guò)大,需要引起相關(guān)部門(mén)的重視,查看變化的原因以及確認(rèn)模型的穩(wěn)定性,如果模型的穩(wěn)定性變化較大,需要對(duì)模型進(jìn)行調(diào)整和重新訓(xùn)練。
6 總結(jié)
某三線城市處于推進(jìn)智慧停車場(chǎng)發(fā)展的起步時(shí)期,在交通信息化的大背景下,如何利用信息化手段提高開(kāi)放式收費(fèi)停車場(chǎng)的利用率,減少開(kāi)放式收費(fèi)停車場(chǎng)的管理成本成為企業(yè)關(guān)注的地方。開(kāi)放式收費(fèi)停車場(chǎng)的投入使用和發(fā)展極大地提高了客戶停車體驗(yàn),解決了客戶尋找停車位難、停車距離遠(yuǎn)、停車不靈活等問(wèn)題,在此基礎(chǔ)上,利用數(shù)據(jù)分析技術(shù)挖掘停車客戶的內(nèi)在的規(guī)律和特征,進(jìn)行有效的車位資源管理和分配,幫助用戶獲得更好的停車體驗(yàn)成為開(kāi)放式收費(fèi)停車場(chǎng)發(fā)展方向。
本文首先介紹了某三線城市2020年的開(kāi)放式收費(fèi)停車場(chǎng)的原始數(shù)據(jù),為了提高數(shù)據(jù)分析的效率和準(zhǔn)確性,對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理和數(shù)據(jù)清洗。通過(guò)時(shí)間維度,對(duì)特征數(shù)據(jù)分析,挖掘其中的規(guī)律。采用RFM模型[8]和K-means算法對(duì)開(kāi)放式收費(fèi)停車場(chǎng)用戶進(jìn)行分類,通過(guò)客戶的近期的消費(fèi)記錄R(Recency)、購(gòu)買(mǎi)行為購(gòu)買(mǎi)頻率F(Frequency)、購(gòu)買(mǎi)金額M(monetary)三個(gè)指標(biāo)來(lái)挖掘客戶的潛在價(jià)值。
對(duì)比本文的實(shí)驗(yàn)結(jié)果和實(shí)證結(jié)果,可以得到以下兩點(diǎn)結(jié)論:第一,針對(duì)開(kāi)放式收費(fèi)停車場(chǎng)停車用戶的停車特征,能夠得出停車用戶行為和時(shí)間維度存在關(guān)聯(lián)性[9],與用戶的作息時(shí)間、通勤時(shí)間和節(jié)假日時(shí)間有關(guān)系。第二,通過(guò)K-means算法和RFM模型將用戶精確分類,分類結(jié)果和實(shí)證結(jié)果較為吻合,為開(kāi)放式收費(fèi)停車場(chǎng)提供決策依據(jù)。
當(dāng)然,本文的研究存在一定的局限性:第一,用戶行為分析指標(biāo)需要更加多元,影響用戶行為的因素很多需要的用戶數(shù)據(jù)[10]更加精確。第二,由于每一個(gè)算法都有自身的局限性,為了更好契合開(kāi)放式收費(fèi)停車場(chǎng)用戶群體,實(shí)現(xiàn)更加有效的用戶細(xì)分,未來(lái)可以選擇將密度聚類等方法納入開(kāi)放式收費(fèi)停車場(chǎng)用戶分類研究當(dāng)中。
參考文獻(xiàn):
[1] 沈佳朋.數(shù)據(jù)挖掘技術(shù)在城市路側(cè)停車管理中的應(yīng)用研究[D].杭州:浙江大學(xué),2020.
[2] 陸建.城市交通系統(tǒng)可持續(xù)發(fā)展規(guī)劃理論與方法[D].南京:東南大學(xué),2003.
[3] 孫展.基于時(shí)空量化分析的停車泊位共享配置方法研究[D].北京:北京建筑大學(xué),2018.
[4] 楊琳,寇勇剛,白釗,等.基于改進(jìn)RFM模型對(duì)民航客戶的細(xì)分研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2021,51(1):33-39.
[5] 靖立崢,吳增源.基于改進(jìn)K-means算法的電子商務(wù)客戶細(xì)分研究[J].中國(guó)計(jì)量大學(xué)學(xué)報(bào),2020,31(4):482-489.
[6] 徐曉敏,谷曉燕.全生命周期客戶價(jià)值數(shù)據(jù)分析挖掘方法[J].北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,35(2):6-9,20.
[7] 陳東洋,陳德旺,江世雄,等.基于時(shí)段客流特征聚類的地鐵運(yùn)營(yíng)時(shí)段劃分[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2021,30(3):256-261.
[8] 翁小雄,謝志鵬.基于RFMS的高速公路客戶商業(yè)價(jià)值挖掘[J].重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,40(4):62-69.
[9] 武志鵬.路邊停車需求預(yù)測(cè)與管理對(duì)策研究[D].西安:西安電子科技大學(xué),2019.
[10] 肖雪.路外停車需求長(zhǎng)短時(shí)預(yù)測(cè)方法研究[D].長(zhǎng)春:吉林大學(xué),2020.
【通聯(lián)編輯:唐一東】