范晨 邢竟 王文靜 龐朝曦 陳偉杰
【摘 要】論文主要研究利用大數(shù)據(jù)挖掘技術(shù)及最優(yōu)化算法,為實(shí)現(xiàn)既保證呼叫中心服務(wù)質(zhì)量的同時(shí),又能保證人力資源最優(yōu)的配置提供預(yù)測(cè)數(shù)據(jù),供95598坐席排班參考,并通過(guò)與實(shí)際值的對(duì)比進(jìn)行驗(yàn)證,結(jié)果顯示該項(xiàng)研究具有較高的推廣和應(yīng)用價(jià)值。
【Abstract】The paper mainly studies the use of big data mining technology and optimization algorithm to provide predictive data for the realization of not only guaranteeing the service quality of call center, but also guaranteeing the optimal allocation of human resources. It can provide some reference for the seats scheduling of 95598. Through comparing with the actual value, the results show that the research has high popularization and application value.
【關(guān)鍵詞】時(shí)間序列;線性回歸;話務(wù)預(yù)測(cè)
【Keywords】time series; linear regression; traffic forecast
【中圖分類號(hào)】TN929.5? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻(xiàn)標(biāo)志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號(hào)】1673-1069(2019)01-0160-02
1 引言
在電改的大環(huán)境下,隨著人們對(duì)電力服務(wù)質(zhì)量的要求不斷提高,南方電網(wǎng)已經(jīng)把提供優(yōu)質(zhì)的供電服務(wù)提升到了發(fā)展戰(zhàn)略的新高度[1]。但隨著業(yè)務(wù)類型的不斷增加,運(yùn)營(yíng)規(guī)模的壯大,排班問(wèn)題變成了日常生產(chǎn)管理者頭痛的問(wèn)題。話務(wù)量是呼叫中心進(jìn)行客服坐席安排的依據(jù),根據(jù)不同話務(wù)量需求以及固定的坐席數(shù)量,安排相應(yīng)的坐席人員,才能實(shí)現(xiàn)既保證呼叫中心服務(wù)質(zhì)量的同時(shí),又能保證人力資源最優(yōu)的配置。傳統(tǒng)的排班模式,需要經(jīng)驗(yàn)豐富的排班師對(duì)話務(wù)量進(jìn)行提前估計(jì),人為主觀因素影響比較大、工作量較大,且無(wú)法確保話務(wù)量預(yù)測(cè)準(zhǔn)確度,無(wú)法滿足實(shí)際生產(chǎn)需求。因此,如何對(duì)話務(wù)量進(jìn)行科學(xué)準(zhǔn)確的預(yù)測(cè)早已成為一個(gè)亟待解決的問(wèn)題。
話務(wù)量是一種隨機(jī)的、動(dòng)態(tài)的時(shí)間序列變化過(guò)程,受天氣、季節(jié)、節(jié)假日、電力業(yè)務(wù)特點(diǎn)等因素的影響,呈現(xiàn)復(fù)雜的變化趨勢(shì)[2]。目前,已有一些預(yù)測(cè)工具被應(yīng)用于話務(wù)量預(yù)測(cè)中,比如,自回歸移動(dòng)平均模型、多元線性回歸模型、Kalman濾波估計(jì)、BP神經(jīng)網(wǎng)絡(luò)等,都取得了一定的成果。但所有的模型都是針對(duì)常規(guī)的話務(wù)量進(jìn)行預(yù)測(cè),并未考察和分析異常情況下的話務(wù)量預(yù)測(cè),在建模過(guò)程中只是將話務(wù)量異常數(shù)據(jù)進(jìn)行剔除或者平滑,并未對(duì)異常的話務(wù)量數(shù)據(jù)進(jìn)行單獨(dú)建模。
針對(duì)以上不足以及話務(wù)量自身的特點(diǎn),我們提出一種基于異常話務(wù)量分塊建模的分析思路。將話務(wù)量分為異常話務(wù)量和正常話務(wù)量,再根據(jù)各自的規(guī)律分別建模。最后為了驗(yàn)證模型的有效性,利用相同的方法對(duì)總話務(wù)量直接建模,以驗(yàn)證異常話務(wù)量分開(kāi)模型的準(zhǔn)確性。
2 模型建立
2.1 模型思路
建模的主要思想是通過(guò)異常因子相關(guān)性建模方法將總話務(wù)量分為異常話務(wù)量和正常話務(wù)量?jī)蓚€(gè)部分。并根據(jù)各自的發(fā)展趨勢(shì)和規(guī)律,建立不同的預(yù)測(cè)模型,進(jìn)而得到異常話務(wù)量預(yù)測(cè)值和正常話務(wù)量預(yù)測(cè)值。異常話務(wù)量分塊建模的基本步驟:首先,找出異常話務(wù)量,確定異常因子。從統(tǒng)計(jì)分析和建模角度利用多種異常值檢驗(yàn)方法、從呼叫中心話單特征角度利用業(yè)務(wù)探索方法、從外部學(xué)習(xí)角度利用文獻(xiàn)綜述法找出引起異常話務(wù)量的原因[3]。其次,確定可分析的異常因子。根據(jù)影響因子影響力大小、影響因子數(shù)據(jù)可得性、影響因子是否可預(yù)見(jiàn)、影響因子是否存在特定規(guī)律等特征篩選出可進(jìn)行數(shù)據(jù)分析和建模的話務(wù)量影響因子。第三,拆分話務(wù)量并分別進(jìn)行預(yù)測(cè)。利用相關(guān)性分析和建模,從總話務(wù)量中分離出異常因子引起的話務(wù)量(異常話務(wù)量)和正常話務(wù)量?jī)深?,再分別利用自回歸移動(dòng)平均模型、支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)異常話務(wù)量、正常話務(wù)量進(jìn)行分別建模和預(yù)測(cè),總話務(wù)量預(yù)測(cè)值=異常話務(wù)量+正常話務(wù)量。最后,對(duì)比驗(yàn)證。
2.2 話務(wù)量影響因素分析
從整體來(lái)看,可以將話務(wù)量影響因素分為以下四大類:一是臨時(shí)擾動(dòng)事件。臨時(shí)擾動(dòng)因素指的是可以預(yù)見(jiàn)但不存在特定規(guī)律的事件,比較典型的是不定期的檢修活動(dòng)、臨時(shí)停電活動(dòng)、異常惡劣天氣等[4]。如果能夠預(yù)見(jiàn)到類似事件,則一定要預(yù)估其作用時(shí)間及幅度,并相應(yīng)的修正話務(wù)量。二是特定擾動(dòng)事件。特定擾動(dòng)因素是指在可以預(yù)見(jiàn)且在一定時(shí)間內(nèi)存在一定規(guī)律的異常事件,主要包括以下幾類,季度檢修引起的計(jì)劃停電、涉及周末和節(jié)假日的特定日期因素、夏季電壓負(fù)荷相關(guān)的特殊時(shí)節(jié)因素以及自身業(yè)務(wù)特點(diǎn)相關(guān)的電費(fèi)通知發(fā)布、欠費(fèi)通知發(fā)布、停電通知發(fā)布、執(zhí)行停電通知發(fā)布等因素。三是臨時(shí)特定事件。臨時(shí)特定因素是指不可預(yù)見(jiàn)但存在一定規(guī)律的異常事件,主要包括以下幾類,電網(wǎng)設(shè)備衰老、用戶計(jì)電設(shè)備老化、電網(wǎng)運(yùn)行管理等[5]。四是隨機(jī)事件。此類事件不可預(yù)見(jiàn)也不存在規(guī)律,如系統(tǒng)故障、意外故障等隨機(jī)因素。
根據(jù)異常話務(wù)量數(shù)據(jù)分析和建模的要求,按照異常影響因子對(duì)話務(wù)量的影響程度大小、異常影響因子的數(shù)據(jù)可得性、數(shù)據(jù)時(shí)間前后統(tǒng)一性等要求,將所有影響因子進(jìn)行排查,最后確定影響話務(wù)量的2類因子:業(yè)務(wù)特點(diǎn)、異常天氣。
利用各類短信通知數(shù)與各業(yè)務(wù)類型每天的話務(wù)量做相關(guān)分析,找出與短信通知有顯著相關(guān)的業(yè)務(wù)類型,將此業(yè)務(wù)類型的話務(wù)量定義為通知類的異常話務(wù)量,剩下的業(yè)務(wù)類型定義為其他話務(wù)量。
2.3 模型建立
支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)建模的基本步驟一樣,但其中運(yùn)用的函數(shù)不同[6]。支持向量機(jī)是以訓(xùn)練誤差作為優(yōu)化問(wèn)題的約束條件,以置信范圍值最小值作為優(yōu)化目標(biāo)。即SVM是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的學(xué)習(xí)方法,其推廣能力明顯優(yōu)于一些傳統(tǒng)的學(xué)習(xí)方法。SVM在解決小樣本、非線性及高維模式識(shí)別問(wèn)題中表現(xiàn)出許多特有的優(yōu)勢(shì),并能推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問(wèn)題中[7]。
3 模型結(jié)果
本次話務(wù)預(yù)測(cè)課題研究共分為兩個(gè)預(yù)測(cè)小組,兩個(gè)預(yù)測(cè)組根據(jù)各自的預(yù)測(cè)方法,分別對(duì)2016年11月14日~12月2日連續(xù)三周每周的話務(wù)量情況進(jìn)行預(yù)測(cè),并將最終的預(yù)測(cè)結(jié)果進(jìn)行比對(duì),進(jìn)一步研究下一步的話務(wù)工作的優(yōu)化提升方案。
在為期三周的話務(wù)量預(yù)測(cè)中,經(jīng)計(jì)算得出設(shè)計(jì)院三周的預(yù)測(cè)精度平均為12.75%,原排班組預(yù)測(cè)系統(tǒng)的平均預(yù)測(cè)精度為34.08%。原排班組預(yù)測(cè)系統(tǒng)的最低預(yù)測(cè)誤差為1.7%, 最高預(yù)測(cè)誤差為105.41%,而設(shè)計(jì)院預(yù)測(cè)最高預(yù)測(cè)誤差為52.09%, 最低預(yù)測(cè)誤差為0.17%。由三周話務(wù)預(yù)測(cè)誤差對(duì)比可知,設(shè)計(jì)院的話務(wù)量預(yù)測(cè)較為平穩(wěn),波動(dòng)不是很大,且與真實(shí)值更接近。
4 結(jié)語(yǔ)
為驗(yàn)證模型有效性,直接利用自回歸模型對(duì)總話務(wù)量進(jìn)行建模和預(yù)測(cè),將預(yù)測(cè)結(jié)果與分塊建模預(yù)測(cè)結(jié)果進(jìn)行對(duì)比[8],同時(shí)為了驗(yàn)證模型的實(shí)用性,與95598呼叫中心的排班組進(jìn)行為期三周的預(yù)測(cè)結(jié)果對(duì)比。實(shí)踐證明,異常話務(wù)量分塊建模比傳統(tǒng)話務(wù)量預(yù)測(cè)結(jié)果精度更好,且異常話務(wù)量分塊建模為期三周的預(yù)測(cè)精度均比目前南方電網(wǎng)排班組的預(yù)測(cè)結(jié)果精度更高,未來(lái)可進(jìn)一步落地實(shí)現(xiàn),具有較高的推廣和應(yīng)用價(jià)值。
【參考文獻(xiàn)】
【1】胡憲華,吳捷. 基于時(shí)間序列的移動(dòng)通信話務(wù)預(yù)測(cè)[D].廣州:華南理工大學(xué),2006.
【2】張昊.電力調(diào)度自動(dòng)化系統(tǒng)及電力負(fù)荷智能化預(yù)測(cè)方法的研究[D].廣州:華南理工大學(xué),1997.
【3】胡波,李磊.含野值的中長(zhǎng)期話務(wù)數(shù)據(jù)分析方法研究[J].武漢水利電力大學(xué)學(xué)報(bào),2000(6):33.
【4】程偉.基于季節(jié)變動(dòng)模型的話務(wù)量預(yù)測(cè)[J].電信技術(shù),2000(10):25-27.
【5】胡毅,李磊.改進(jìn)自回歸算法在電信話務(wù)量預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2001(3):79-82.
【6】鄧聚龍.灰色預(yù)測(cè)預(yù)決策[M].武漢:華中理工大學(xué)出版社,1986.
【7】謝開(kāi)貴,周家啟.變權(quán)組合預(yù)測(cè)模型研究[J].系統(tǒng)工程理論與實(shí)踐,2000(27):7.
【8】任君明.基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)通信話務(wù)預(yù)測(cè)模型[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2015(6):79-82.