李雪梅 段晨悅 許鑫 傅軍 孫志杰 周國鵬
[摘 要]通過充電交易數(shù)據(jù)發(fā)現(xiàn)電動車用戶的行為特征比較困難,但這些特征對于充電站運營企業(yè)提高運維服務(wù)質(zhì)量至關(guān)重要。文章使用K-means聚類模型對2016年10月至2017年9月冀北地區(qū)充電站交易數(shù)據(jù)進行了研究,發(fā)現(xiàn)了3類用戶:高速一級用戶、高速二級用戶和城市用戶;在此基礎(chǔ)上,進一步鉆取出5類用戶:跨城辦公用戶、游玩用戶、過路用戶、城市居民用戶、北京辦公用戶。根據(jù)這些用戶特征,提出了相應(yīng)的運營策略、充電站規(guī)劃建設(shè)建議。
[關(guān)鍵詞]充電站;用戶行為特征;聚類分析
[DOI]10.13939/j.cnki.zgsc.2018.13.125
1 引 言
充電站作為電動汽車充電基礎(chǔ)設(shè)施,與電動汽車為互補產(chǎn)品。在國家“十三五”規(guī)劃關(guān)于電動汽車充電基礎(chǔ)設(shè)施需要建設(shè)適度超前、車樁相隨、智能高效的充電網(wǎng)絡(luò)體系的精神指導(dǎo)下,電動汽車充電站覆蓋面積不斷擴張、充電站用戶也越來越多。正確識別充電站用戶或電動汽車用戶的行為特征,對于運營企業(yè)提高運營效率、提升運維服務(wù)質(zhì)量、引導(dǎo)用戶充電行為,都具有重要意義。
目前,國內(nèi)關(guān)于電動汽車用戶行為特征的研究較少。李躍(2013)和王飛龍等(2013)在研究充電站的需求預(yù)測中,將電動汽車用戶分為規(guī)律性較強的A類用戶、規(guī)律性一般的B類用戶、隨機性的C類用戶,其依據(jù)主要看電動車是否為公交車或私家車。[1-2]邢龍等(2013)研究電動汽車參與的微網(wǎng)運行優(yōu)化中,將用戶分為及時充電、低價充電和雙向充放電三種模式,其依據(jù)是電動汽車剩余量的多少。[3]陳麗丹等(2015)在研究電動汽車充電負(fù)荷預(yù)測中,將用戶按照出行目的劃分為回家、工作、購物吃飯、社交休閑和其他事務(wù)五大類。[4]陳靜鵬等(2016)研究電動汽車充電站優(yōu)化規(guī)劃模型,也使用了類似的分類。[5]這些研究雖然不是專門研究用戶特征,但是,從側(cè)面反映出用戶行為特征在相關(guān)領(lǐng)域研究中所起的重要作用。
國外關(guān)于電動車用戶充電行為特征的研究也比較少。Xydas等(2016)研究了英國電動車充電需求的特征,集中在充電電量方面。[6]Speidel等(2014)研究了澳大利亞西部電動汽車的充電模式,主要考慮充電時段、電動車剩余電量等方面的因素。[7]Bi等(2016、2017)通過考慮電動車行程和充電剩余電量門限研究了新加坡電動車的充電行為。[8-9]這些研究涉及充電需求,但沒有涉及用戶本身。
國內(nèi)外其他相關(guān)研究基本上集中在充電站布局選址、充電站負(fù)荷、充電站營運模式、電動車產(chǎn)業(yè)政策等方面。本文將使用冀北公司已運行充電樁的相關(guān)數(shù)據(jù),對電動車充電用戶的行為特征進行研究,從用戶標(biāo)簽出發(fā)提出相關(guān)建議,為其他領(lǐng)域的研究奠定基礎(chǔ)。
2 數(shù)據(jù)處理與研究方法
充電用戶行為特征研究主要依賴于從車聯(lián)網(wǎng)管理平臺提取的數(shù)據(jù),其中包括充電樁檔案、冀北地區(qū)充電交易數(shù)據(jù)等。這些數(shù)據(jù)一般只涉及用戶的充電卡號、充電電量、交易金額、交易方式、交易時間、交易樁號,欠缺用戶準(zhǔn)確的描述。如何從現(xiàn)有數(shù)據(jù)抓取用戶特征依賴于正確研究方法的選擇。抓取用戶特征本質(zhì)上就是對用戶進行分類,在數(shù)據(jù)分析技術(shù)中聚類分析是最為有效的分類工具。聚類分析是一組模型、工具,使用這組工具可以將數(shù)據(jù)目標(biāo)分成若干類。由于車聯(lián)網(wǎng)平臺數(shù)據(jù)相對較大,我們選擇K-means模型進行聚類。
K-means模型的使用對數(shù)據(jù)結(jié)構(gòu)有一定要求,但從車聯(lián)網(wǎng)平臺提取的數(shù)據(jù)結(jié)構(gòu)性較差。因此,需要結(jié)合業(yè)務(wù)知識,對原數(shù)據(jù)進行整理和預(yù)處理,得到格式統(tǒng)一的、數(shù)據(jù)完整的和標(biāo)準(zhǔn)化的電動汽車用戶相關(guān)的結(jié)構(gòu)數(shù)據(jù)。
2.1 數(shù)據(jù)處理
數(shù)據(jù)處理將原數(shù)據(jù)從業(yè)務(wù)角度轉(zhuǎn)換成K-means模型可以使用的格式。這包括代表性處理、業(yè)務(wù)處理、K-means處理。
代表性處理:電動車用戶充電行為主要群體是大眾,公交充電不具有代表性,因此,將2016年10月1日至2017年9月30日冀北交易數(shù)據(jù)中公交充電站交易數(shù)據(jù)剔除。
業(yè)務(wù)處理:按照運營企業(yè)業(yè)務(wù)需要,將站點分為北京相關(guān)高速、城際高速、承德市站點、廊坊市站點、唐山市站點、秦皇島市站點、張家口市站點7類;將交易時段劃分為0—3:59、4—7:59、8—11:59、12—15:59、16—19:59、20—23:59 6個時段;將交易日期劃分為工作日、周末、節(jié)日3種。
K-means模型聚類,要求變量為數(shù)值型。因此除了卡號識別用戶作為觀測單位之外,充電交易數(shù)據(jù)中,高速、城市站充電次數(shù);工作日、周末、節(jié)日充電次數(shù);一天各時間段充電次數(shù);各類別充電站的充電次數(shù)等都為數(shù)值型。
通過上述數(shù)據(jù)處理,得到20個變量反映充電用戶的特征,這些變量的數(shù)據(jù)結(jié)構(gòu)可以用K-means模型聚類計算。
2.2 K-means模型
K-means聚類模型由MacQueen(1967)提出后,從算法、工具方面得到很大發(fā)展。[10-11]尤其在處理大數(shù)據(jù)方面表現(xiàn)出比系統(tǒng)聚類的優(yōu)勢更受歡迎。聚類模型的兩個基本步驟是:選擇相似性度量、選擇并類算法。K-means聚類的相似性度量主要依據(jù)歐氏距離,也就是需要不斷計算觀測單位與每個類均值的距離。如果觀測單位包含p個變量,每個類的均值坐標(biāo)計算公式如下:
x—i=1n∑nj=1xji (i=1,2,…,p)
其中n為這個類包含的觀測單位個數(shù),xji是觀測單位j的第i個變量的觀測。因此,這個類的均值為:
x—=(x—1,x—2,…,x—p)
觀測單位j與這個類均值之間的距離就是xj=(xj1,xj2,…,xjp)和x—的歐氏距離,這也表示j和這個類的距離。
K-means聚類模型的并類算法選擇如下:
Step 1:將觀測單位劃分成K個初始類。
Step 2:遍歷觀測單位列表,將每個觀測單位分配到其最近的K個類當(dāng)中的一個;重新計算類元素變化的類的均值。
Step 3:重復(fù)Step 2直到目標(biāo)分配達到穩(wěn)定為止。
其中Step 1可以隨機劃分K個類。Step 2計算每個觀測單位與每個類的距離,然后,將其分配到最近的類。這種分配如果發(fā)生,必然導(dǎo)致某個類元素的減少,另一個類元素的增加。從而需要對變化的類重新計算類均值:
x—i,new=nx—i+xjin+1 (如果觀測單位j分配到這個類)
x—i,new=nx—i-xjin-1 (如果觀測單位j從這個類刪除)
其中i=1,2,…,p為第i個變量,x—i為這個類原來第i個變量的均值,x—i,new為新的均值,n為這個類原來包含的觀測單位數(shù)。Step 3將重復(fù)Step 2,直到形成K個最終的類。
對于用戶特征的研究,觀測單位為充電用戶,或用戶ID,共16012個。每個用戶j都有共p=20個變量(見表1):Dl、Dc、Zg、Zs、Zb、Zc、Zj、Zl、Zq、Zt、Zz、Tg、Tz、Tj、T1、T2、T3、T4、T5、T6對應(yīng)K-means模型中的xj1,xj2,…,xj20。
K-means聚類模型的并類算法可以通過大部分程序語言或軟件包實現(xiàn)。
3 用戶行為特征
下面的分析基于2016年10月至2017年9月冀北交易數(shù)據(jù),經(jīng)過數(shù)據(jù)的標(biāo)準(zhǔn)化處理,使用K-means模型對在冀北地區(qū)使用過充電樁的16012個用戶進行聚類分析。K的設(shè)定以及最終應(yīng)該產(chǎn)生多少類是任何聚類模型的一個難題。一個可行的方法是對給定的一組K的值進行實驗,使得類中的元素個數(shù)相對比較平衡,結(jié)合專業(yè)知識來選擇最終的類數(shù)。
3.1 初步K-means聚類結(jié)果
為了覆蓋潛在的類數(shù),我們對K=1至15進行K-means聚類分析,最終選擇K=6的聚類結(jié)果,再進一步確定最終類數(shù)。K=6的聚類結(jié)果如表2。
從初步聚類結(jié)果來看,類別4、5、6包含的成員數(shù)只有1個或沒有,對于這3個類別可以不去關(guān)注。因此,初步得到3個比較平衡的類別1、2、3。下面分別從高速使用、充電電量、充電次數(shù)、充電時間方面比較這3個類別。
由表3可知,第一、二類用戶高速站充電使用較為頻繁,第三類用戶很少使用高速站充電。因此,初步定義這3個類別為高速一級用戶、高速二級用戶、城市用戶。第一、三類用戶的年人均充電電量遠高于第二類用戶。但三類用戶的平均充電電量都比較顯著、充電時間主要就集中在8:00—20:00,需要我們進一步關(guān)注。
第一類用戶為高速一級用戶,共有5497人,約占冀北用戶群的34.33%,大部分用戶高速使用率高且使用次數(shù)高。高速使用比高;充電電量及充電次數(shù)在三類用戶中最高,微高于第三類用戶。
第二類用戶為高速二級用戶,共有4769人,約占冀北用戶群的29.78%,大部分用戶高速使用率高,但使用次數(shù)低。高速使用比高;充電電量及充電次數(shù)在三類用戶中最低,且遠低于其他類用戶。
第三類用戶為城市用戶,共有5744人,約占冀北用戶群的35.87%,大部分用戶高速使用率低,但使用次數(shù)高。高速使用比低,接近于0;充電電量及充電次數(shù)與第一類用戶相似,微低于第一類用戶。
從表4可以看出,高速一級用戶工作日使用次數(shù):周末使用次數(shù):節(jié)日使用次數(shù)≈3.3∶2.0∶1;8—19:59時間段使用次數(shù)高;站點使用情況,北京相關(guān)高速遠高于其他站類型。
高速二級用戶工作日使用次數(shù):周末使用次數(shù):節(jié)日使用次數(shù)≈3.7∶2.3∶1;8—19:59時間段使用次數(shù)高;站點使用情況,北京相關(guān)高速遠高于其他站類型。
城市用戶工作日使用次數(shù):周末使用次數(shù):節(jié)日使用次數(shù)≈10.6∶4.9∶1;12—19:59時間段使用次數(shù)高;站點使用情況,廊坊市站點遠高于其他站類型。
3.2 用戶特征
通過上述研究,結(jié)合運維業(yè)務(wù)經(jīng)驗大致可以得到如下結(jié)果:
高速一級用戶,多數(shù)為跨城辦公用戶。其充電行為的主要特征為在京津冀地區(qū)工作日充電電量較大且充電次數(shù)較多,充電站使用頻繁人群,而且在北京相關(guān)站點、城際高速站點常有充電。
高速二級用戶,多數(shù)為過路用戶、游玩用戶。其特征是充電量、充電次數(shù)不大,但充電的站點分布相對均勻、分散。
城市用戶,基本上是城市居民用戶、北京辦公用戶。其特點是工作日充電次數(shù)相對多,但充電站點不太均勻,且北京辦公多集中于廊坊市燕郊地區(qū)站點充電。
4 建 議
根據(jù)上述研究,我們提出針對不同用戶類型的運營策略建議。
高速一級用戶:推出分段計價、套餐服務(wù)。這種策略可以通過分時段、分地段,或工作日節(jié)假日等多種形式的組合套餐,給用戶提供一定程度的優(yōu)惠,來更好地吸引用戶,提高服務(wù)質(zhì)量。
高速二級用戶:推送附近景區(qū)信息、周邊服務(wù)(餐飲等)、附近沿途充電站。這種策略從用戶的興趣點出發(fā),不僅可以有效地服務(wù)用戶,也可以和周邊景區(qū)、其他服務(wù)業(yè)進行合作,發(fā)現(xiàn)新型服務(wù)模式。
城市用戶:推送附近低頻使用站點并給予優(yōu)惠、推送新增站點情況。這種策略可以引導(dǎo)用戶以優(yōu)惠價格使用低頻站點,尤其推薦一些附近新增站點。這不僅可以減少用戶等候時間,也充分使用了充電網(wǎng)絡(luò)資源。
增建城市站點:在充電高頻的城市站點周圍,增加充電站點。在整個充電網(wǎng)絡(luò)系統(tǒng)中,各個站點的使用頻數(shù)相差很大。比如,廊坊地區(qū)的站點使用次數(shù)遠高于其他站點。這就需要在該地區(qū)的高頻站點附近增設(shè)新站點,使得站點網(wǎng)絡(luò)布局更加合理。
5 結(jié) 論
通過對冀北地區(qū)充電交易一手?jǐn)?shù)據(jù)進行整理,借助于大數(shù)據(jù)技術(shù)的K-means聚類,我們發(fā)現(xiàn)了冀北地區(qū)充電用戶行為的部分主要特征。根據(jù)不同用戶的特征,為運維管理、規(guī)劃建設(shè)提出相應(yīng)建議。這些建議對于冀北,乃至京津冀電動車充電網(wǎng)絡(luò)的發(fā)展具有一定的實際意義和應(yīng)用價值。隨著交易數(shù)據(jù)的不斷完善、大數(shù)據(jù)技術(shù)的進一步改進,還有更珍貴的用戶信息需要我們?nèi)ネ诰颉?/p>
參考文獻:
[1]李躍.基于用戶分類的電動汽車充電站需求預(yù)測[J].電氣時代,2013(12):98-100.
[2]王飛龍,孫凱航,李燕青.基于用戶分類的電動汽車充電站需求預(yù)測[J].黑龍江電力,2013(2):132-134.
[3]邢龍,張沛超.基于用戶需求分類的電動汽車參與的微網(wǎng)運行優(yōu)化[J].可再生能源,2013(5):46-50.
[4]陳麗丹,聶涌泉,鐘慶.基于出行鏈的電動汽車充電負(fù)荷預(yù)測模型[J].電工技術(shù)學(xué)報,2015(4):216-225.
[5]陳靜鵬,艾芊,肖斐.基于用戶出行需求的電動汽車充電站規(guī)劃[J].電力自動化設(shè)備,2016(6):34-39.
[6]Xydas,Erotokritos,Charalampos Marmaras, et al.A data-driven approach for characterising the charging demand of electric vehicles:A UK case study[J].Applied Energy,2016(162):763-771.
[7]Speidel, Stuart, Thomas Brunl.Driving and charging patterns of electric vehicles for energy usage[J].Renewable and Sustainable Energy Reviews,2014(40):97-110.
[8]BI, RAN,JIAJIAN Xiao,VAISAGH V,ALOIS K.Influence of charging behaviour given charging station placement at existing petrol stations and residential car park locations in singapore[J].Procedia Computer Science,2016(80):335-344.
[9]BI, RAN,JIAJIAN Xiao,VAISAGH V,ALOIS K.Influence of charging behaviour given charging infrastructure specification:A case study of Singapore[J].Journal of Computational Science,2017(20):118-128.
[10]MACQUEEN,JAMES B.Some methods for classification and analysis of multivariate observations[J].Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability,Berkeley,CA:University of California Press,1967:281-297.
[11]JOHNSON,RICHARD A,DEAN W W.Applied multivariate statistical analysis [M].New Jersey: Pearson Prentice Hall,2007.