楊 雨,李 雁,蔡秋雷,馮歐陽,徐正一
(國網瑞安市供電公司,浙江 瑞安325200)
隨著社會經濟高速高質量發(fā)展,生產企業(yè)、居民客戶對用電的敏感度越來越高,對供電企業(yè)服務質量的要求也越來越高,一旦在供電可靠性或供電服務質量上發(fā)生問題,易引起客戶情緒波動甚至引發(fā)輿情。如何有效規(guī)避客戶投訴,消除客戶情緒化事件造成的不良影響,已成為電力企業(yè)亟待解決的問題,因此,需要有效地評估客戶在用電體驗方面的滿意度,以便提升供電服務質量。
查閱文獻發(fā)現(xiàn)有關情緒影響的研究多用于股市金融方面[1-3],有學者用VAR模型和Granger因果檢驗方法分析了投資者情緒對股市收益的影響,并將投資者情緒指數(shù)作為股市盈虧預測數(shù)據(jù)[4]。隨著電網規(guī)模的不斷擴大,目前大數(shù)據(jù)分析在電力行業(yè)也得到廣泛應用[5],王德文等人利用大數(shù)據(jù)分析原理解決電力用戶側負荷分析和處理問題,并進行了負荷預測實驗[6]。借鑒相關學者的理論研究,為有效分析客戶在電力體驗方面的滿意度,本文提出利用大數(shù)據(jù)分析原理,建立客戶的多維數(shù)據(jù)構建客戶行為的畫像模型,依據(jù)客戶行為的畫像模型,同時引入sigmoid函數(shù)來預測客戶的情緒指數(shù)值[7-8],將每個電力事件中的情緒化客戶視為一個對象,對客戶情緒變化進行刻畫打分,最終構建客戶行為特征的全景視圖,通過對客戶不同維度信息數(shù)據(jù)的挖掘,將情緒化事件轉換為數(shù)字化的情緒指數(shù),精準篩選高風險客戶,提升優(yōu)質服務水平,實現(xiàn)更為貼切的個性化服務[9-10]。
以能源互聯(lián)網中的用電信息采集系統(tǒng)、營銷系統(tǒng)、供電服務指揮系統(tǒng)、99598系統(tǒng)、12345政務熱線平臺、氣象數(shù)據(jù)等系統(tǒng)積累的海量客戶信息為基礎。通過停電感知、業(yè)務辦理、電話咨詢、電量波動、12345政務熱線平臺、氣象原因6個方面追溯歷史電力事件,挖掘影響到客戶情緒的事件,分析客戶對供電服務情緒化的原因,通過客戶畫像數(shù)據(jù)分析方法快速篩選出客戶行為特征指標,構建客戶情緒指數(shù)預判指標體系,最終得到基于“客戶畫像”的客戶情緒指數(shù)模型。
本文以供電公司2019年數(shù)據(jù)為依據(jù),將各系統(tǒng)中采集到的基礎數(shù)據(jù),如居民抄表信息、歷史停電記錄、電話呼入工單數(shù)據(jù)、業(yè)務辦理數(shù)據(jù)等數(shù)據(jù),通過數(shù)據(jù)缺失、數(shù)據(jù)冗余、常識性錯誤等清洗規(guī)則對異常數(shù)據(jù)通過Python編程進行清洗與處理,提取最具概括性字段信息,形成戶號、電量、停電次數(shù)、電話呼入工單、業(yè)務辦理為代表的關鍵數(shù)據(jù)字段集,并作為情緒等量化的指標事件。
將系統(tǒng)中清洗與處理完成后的數(shù)據(jù)和電力客戶的行為特征進行有機整合分析判斷,構建客戶行為特征集,如圖1所示。該特征集具備較為完整的客戶數(shù)據(jù)信息源,同時擁有豐富的成長性[11]。
圖1 客戶行為特征集
客戶行為特征集構建完成后,需從用戶信息中抽取出高度精練、能概括用戶某種特征或屬性的“標簽”。本文基于直接抽取、統(tǒng)計抽取、回歸抽取標簽規(guī)則,將部分基礎信息的特征集直接轉換成客戶標簽體系中的基礎客戶標簽,如業(yè)務辦理、停電感知等;通過大數(shù)據(jù)分析挖掘得出客戶行為特征集,再將這些特征通過標簽體系中的邏輯運算得出客戶標簽;依據(jù)應用需求回歸建立模型,確立將電量波動、電話呼入、業(yè)務辦理、停電感知特征集加入模型預算,得出客戶情緒指數(shù)預測標簽。
客戶標簽體系建立包括數(shù)據(jù)采集、標簽體系建模、標簽分類,通過提煉分析客戶行為特征集中的數(shù)據(jù)并對其進行再次加工、清洗、運算,然后給不同的電力客戶打上相應標簽,具體可概括為四個標簽:個人屬性、用戶用電、用戶交費、客戶互動,并通過標簽的全生命周期管理流程及標簽組合應用形成多維客戶全景視圖[12],如圖2所示。
圖2 客戶標簽體系
對采集到的數(shù)據(jù)通過Odps抽取后,經過數(shù)據(jù)獲取、清洗、處理、制定標簽規(guī)則,形成標簽生命周期管理方式。根據(jù)規(guī)則從數(shù)據(jù)中提取對應客戶進行打標簽,打完后經過評估,評估后再通過模型分析預判后再進行規(guī)則微調。在應用與模型中,通過應用收集使用反饋意見,進行調整標簽規(guī)則和更新標簽,圖3為標簽生命周期管理圖[13]。
圖3 標簽生命周期管理圖
以客戶行為特征為指導,利用豐富的信息資源,建立包括客戶電量波動維度、客戶停電感知維度、業(yè)務辦理體驗維度、客戶電話呼入維度的四維特征視圖[14],如圖4所示。
圖4 客戶標簽四維特征視圖
將用戶個人屬性、用戶用電、用戶交費、客戶互動標簽來計算客戶電量波動維度、客戶停電感知維度、業(yè)務辦理體驗維度、客戶電話呼入維度這四個維度的權重,計算公式設定為:
其中,PW代表維度權重;BW代表標簽與業(yè)務關聯(lián)權重;WW代表頻度。其含義為:BW標簽與業(yè)務關聯(lián)權重,標簽項和業(yè)務是否有關聯(lián),無關聯(lián)則權重低,相關維度越高權重越大。WW頻度,標簽出現(xiàn)的頻度,在“用戶畫像”數(shù)據(jù)庫中出現(xiàn)的頻度越高,賦值越大??蛻羟榫w指數(shù)構建公式可定義為:
通過統(tǒng)計客戶在2019年內的電量波動異常情況,獲得本維度在客戶歷史電力事件中的比值,通過下文中的公式(3)轉換成電量波動異常維度的分值Q,如圖5所示。從圖5可以得到該用戶用電信息,特別是該用戶3月份單月用電量比上個月超出200%,屬于不正常信息,需要特殊關注該用戶線路。
圖5 客戶電量環(huán)比
統(tǒng)計客戶在過往2月內的停電情況,獲得本維度在客戶歷史電力事件中的比值,通過下文中的公式(4)轉換成停電感知維度的分值W,如表1所示。
表1 線路停電信息
統(tǒng)計客戶在2019年內的業(yè)務辦理情況,獲得本維度在客戶歷史電力事件中的比值,通過下文中的公式(5)轉換成業(yè)務辦理維度的分值E,如表2所示。
表2 業(yè)務辦理信息列表
統(tǒng)計客戶在2019年內的電話呼入情況,獲得本維度在客戶歷史電力事件中的比值,通過下文中的公式(6)轉換成業(yè)務辦理維度的分值R,如表3所示。
表3 電話呼入信息
對客戶行為特征集與四維視圖互補建立形成客戶情緒化特征,如圖6所示,為客戶情緒指數(shù)全景視圖構建奠定基礎[15-16]。
圖6 基于“客戶畫像”的情緒指數(shù)
電力客戶數(shù)據(jù)量大,數(shù)據(jù)類型多、信息復雜,本項目通過在海量的大數(shù)據(jù)中找到對應每個客戶最具代表性的數(shù)據(jù)進行分析,依靠數(shù)據(jù)挖掘算法找到相應標簽[17-18],具體方式參考上述第2章節(jié),利用sigmoid函數(shù)將其轉化成對應的情緒指數(shù)。
模型通采集客戶2019年內的月電量,計算相鄰兩個月的電量環(huán)比情況,判斷電量波動是否大于100%,公式如下:
其中:
Q:表示客戶在電量波動維度的分值;
A1:表示電量波動異常1次占據(jù)本維度的比值,
A:表示電量波動維度影響客戶情緒百分占比,
an:第n個客戶中,過往1年內電量波動異常發(fā)生事件的次數(shù)。
0次:Q=100*A;
1次:Q=100*A-A1*100*A;
2次:Q=100*A-A2*100*A;
3次:Q=100*A-A3*100*A;
>3次:Q=0,
當Q=0時,客戶的屬性欄直接標紅。
同理,根據(jù)客戶電量波動模型,以此類推可以得到W、E、R三個維度的分值計算公式,分別如式(4)、(5)、(6)所示:
其中,B、C、D表示各自維度占客戶情緒百分占比;B1、C1、D1表示各種維度發(fā)生事件1次占據(jù)本維度的比值;bn、cn、dn表示各維度第n個客戶中,過往1年內電量波動異常發(fā)生事件的次數(shù)。
由于模型需要得到一個概率值,故引入邏輯回歸模型[19-20]。該模型是一個分類預測模型,在實際生產環(huán)境中經常使用??梢栽诜诸惽闆r下經過學習得到一組權值w,當有測試樣本輸入時,這組權值與測試數(shù)據(jù)按照加權得到:
其中,x1、x2、…xn就是每個測試樣本的n個特征值,按照sigmoid函數(shù)的形式求出g(h),如公式(8)所示,從而判斷每個測試樣本所屬的類別。
根據(jù)四個維度客戶行為特征集選取80%作為訓練集進行模型訓練,求得不同樣本空間的收斂值[21],如圖7所示。根據(jù)收斂度最高的模型,最后得到一組初始化參數(shù)。
圖7 不同樣本空間收斂值圖
其中:
最后,根據(jù)得到的參數(shù)對測試集進行預測,準確率在99.2765%。
通過四個維度的分數(shù)值Q、W、E、R來預測客戶在四個維度對于電力服務的滿意度,分數(shù)值越低,滿意度越低。
客戶情緒指數(shù)通過四個維度的事件發(fā)生次數(shù),代入式(2),來求得客戶情緒指數(shù)的預測值,分數(shù)值越低,滿意度越低。
通過對情緒指數(shù)的分段,將客戶畫像為紅色(重點關懷客戶)、黃色(保持關注客戶)、綠色(優(yōu)質客戶)等三類層級。
本文選取汀田片區(qū)部分客戶,分析該片區(qū)客戶在四個維度中的分值及綜合值,如表4所示。然后對其進行客戶畫像,并在情緒指數(shù)模型中預測出客戶相應的情緒指數(shù),如圖8所示,為單個客戶情緒指數(shù)四維圖。將得到的情緒指數(shù)劃分成不同層級的客戶群體,通過在不同維度的得分,為不同客戶制定相應的管控措施,實現(xiàn)客戶情緒的精準把控。
圖8 單個客戶情緒指數(shù)四維圖
表4 客戶情緒指數(shù)匯總表
基于“客戶畫像”的電力客戶行為特征為電力行業(yè)在大數(shù)據(jù)環(huán)境中供電服務情緒指數(shù)的建立提供了基礎。通過構建一個情緒指數(shù)模型,分析從內外網系統(tǒng)中獲取的數(shù)據(jù),從用戶感知角度出發(fā),利用“客戶畫像”數(shù)據(jù)分析工具挖掘客戶行為特征建立全景視圖模型,對供電服務做一個數(shù)字化評價,用紅、黃、綠三種不同顏色反映客戶情緒值,實現(xiàn)客戶情緒指數(shù)的構建。
目前,課題已在瑞安公司3個片區(qū)14.8萬客戶中完成供電服務感受的數(shù)字化評估,實現(xiàn)了客戶分類精準化服務。針對紅色客戶,公司建立“一戶一檔”,安排專人持續(xù)關注用戶用電感受;針對黃色客戶,公司及時收集用戶需求信息,著力加強與用戶的溝通交流;針對綠色客戶,公司繼續(xù)保持優(yōu)質服務,給予客戶更好更貼心的服務體驗。
利用情緒指數(shù)作為客觀評估各地供電服務水平的一個指標,預警潛在的情緒風險,以打造客戶需求為導向的智慧互動、高質量的供電服務新模式,通過“客戶畫像”數(shù)據(jù)庫中的客戶行為特征將客戶精準分類,達到對客戶全面、準確的認知,正確把握客戶心理、掌握客戶期望,進行差異化關懷,做好供電服務,優(yōu)化營商環(huán)境,讓大家用上省心電,實現(xiàn)企業(yè)服務更優(yōu)化、客戶體驗更舒心。
由于情緒是一種外在表現(xiàn),且具有很強的主觀性、隨機性。而99598意見工單、故障工單、投訴工單、12345政務熱線等等,都代表用戶對供電服務的不滿。因此,本文構建供電服務情緒指數(shù),量化對供電服務的感知,利用該模型來訓練數(shù)據(jù)庫中的不同數(shù)據(jù),得出供電服務情緒指數(shù)。經驗證,投訴用戶經模型評估,大多得分極低,模型有效性得到初步驗證。
目前,本文僅僅是將客戶的感受作數(shù)字化評估,把客戶分類。未來可按時間、地域拓展至更多維度進行評估,用更多的客戶行為數(shù)據(jù)進行學習和訓練,進一步完善數(shù)據(jù)庫模型。同時情緒指數(shù)可以用于判斷公眾對供電企業(yè)的滿意度,輔助政府進行行風評價,客觀評估各地電力企業(yè)的供電服務水平,建立競爭性的電力市場聚焦民生服務,一切以客戶為中心,以最大程度滿足客戶需求為首要目的,打造有溫度的數(shù)字社會。