王 松,葉曉波,楊 昌
(楚雄師范學(xué)院計(jì)算機(jī)信息管理中心,云南 楚雄 675000)
隨著計(jì)算機(jī)應(yīng)用技術(shù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,各種業(yè)務(wù)系統(tǒng)在給商家管理方便的同時(shí),也積累了海量的電子數(shù)據(jù)。隨著數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)挖掘工具的不斷發(fā)展,對(duì)業(yè)務(wù)應(yīng)用產(chǎn)生的數(shù)據(jù)可從更多方面進(jìn)行“挖掘”,Microsoft SQL SERVER Analysis Services(SSAS)以其容易上手、快速、便捷等特點(diǎn)得到廣泛應(yīng)用。若事先對(duì)業(yè)務(wù)數(shù)據(jù)沒(méi)有任何期望,可利用此工具的SSAS神經(jīng)網(wǎng)絡(luò)模型知道是否會(huì)有任何值得關(guān)注的發(fā)現(xiàn),探查可能的相關(guān)性,分析多個(gè)輸入和輸出之間的復(fù)雜關(guān)系,使業(yè)務(wù)團(tuán)隊(duì)可以用來(lái)理解數(shù)據(jù)中的趨勢(shì)。本文主要介紹數(shù)據(jù)挖掘中的神經(jīng)網(wǎng)絡(luò)算法在對(duì)某呼叫中心數(shù)據(jù)進(jìn)行預(yù)測(cè)分析中的應(yīng)用,用一個(gè)實(shí)際案例說(shuō)明用SSAS神經(jīng)網(wǎng)絡(luò)算法建立的用于呼叫中心運(yùn)營(yíng)中的預(yù)測(cè)分析挖掘模型。
Microsoft神經(jīng)網(wǎng)絡(luò)使用由最多三層神經(jīng)元 (即“感知器”)組成的“多層感知器”網(wǎng)絡(luò) (也稱為“反向傳播Delta法則網(wǎng)絡(luò)”)。這些層分別是輸入層、可選隱藏層和輸出層。
輸入層:輸入神經(jīng)元定義數(shù)據(jù)挖掘模型的所有輸入屬性值及其概率。
隱藏層:隱藏神經(jīng)元接收來(lái)自輸入神經(jīng)元的輸入,并向輸出神經(jīng)元提供輸出。隱藏層是向各種輸入概率分配權(quán)重的位置。權(quán)重說(shuō)明某一特定輸入對(duì)于隱藏神經(jīng)元的相關(guān)性或重要性。輸入所分配的權(quán)重越大,則輸入的值越重要。權(quán)重可為負(fù)值,表示輸入抑制而不是促進(jìn)某一特定結(jié)果。
輸出層:輸出神經(jīng)元代表數(shù)據(jù)挖掘模型的可預(yù)測(cè)屬性值。
SSAS神經(jīng)網(wǎng)絡(luò)算法可描述為:
圖1 SSAS神經(jīng)網(wǎng)絡(luò)算法
圖2 集合N
實(shí)際的做法:
本文以某呼叫中心反映工作效率的指標(biāo)信息為數(shù)據(jù)依據(jù),原始數(shù)據(jù)包括某個(gè)月內(nèi)呼叫中心的運(yùn)轉(zhuǎn)情況。原始數(shù)據(jù)主要包括如下屬性:FactCallCenterID(數(shù)據(jù)導(dǎo)入到數(shù)據(jù)倉(cāng)庫(kù)中時(shí)創(chuàng)建的一個(gè)任意鍵)、DateKey(呼叫中心的運(yùn)營(yíng)日期)、WageType(指示當(dāng)天是工作日、周末還是節(jié)假日)、Shift(指示為其記錄呼叫的輪班時(shí)間,此呼叫中心將工作日劃分為四個(gè)輪班時(shí)間:AM、PM1、PM2和Midnight)、LevelOneOperators(指示值班的一級(jí)接線員的數(shù)量)、LevelTwoOperators(指示值班的二級(jí)接線員的數(shù)量。員工必須達(dá)到一定數(shù)量的工作小時(shí)數(shù)后,才有資格成為二級(jí)接線員)、TotalOperators(此輪班時(shí)間內(nèi)存在的接線員的總數(shù))、Calls(此輪班時(shí)間內(nèi)收到的呼叫數(shù))、AutomaticResponses(完全通過(guò)自動(dòng)呼叫處理來(lái)處理的呼叫數(shù))、Orders(由呼叫產(chǎn)生的訂單數(shù))、IssuesRaised(由呼叫產(chǎn)生的需要后續(xù)操作的問(wèn)題的數(shù)量)、AverageTimePerIssue(應(yīng)答一次來(lái)電所需的平均時(shí)間)、ServiceGrade(指示此輪班時(shí)間的“掛斷率”)。掛斷率是呼叫中心經(jīng)常使用的一個(gè)指標(biāo)。掛斷率越高,說(shuō)明客戶的滿意度越差,因此丟失潛在訂單的可能性也就越大。掛斷率是按輪班時(shí)間計(jì)算的。數(shù)據(jù)跟蹤每個(gè)班次的操作員人數(shù)、呼叫數(shù)和訂單數(shù)、響應(yīng)時(shí)間和基于“掛斷率”(能夠反映客戶失望度)的服務(wù)等級(jí)標(biāo)準(zhǔn)。使用神經(jīng)網(wǎng)絡(luò)算法生成一個(gè)模型,用來(lái)理解數(shù)據(jù)和其中的趨勢(shì)。并嘗試解決哪些因素會(huì)影響客戶滿意度,呼叫中心如何能夠改進(jìn)服務(wù)等級(jí)這兩個(gè)問(wèn)題,根據(jù)結(jié)果,生成可用于預(yù)測(cè)的邏輯回歸模型。使用該預(yù)測(cè)來(lái)幫助規(guī)劃呼叫中心的運(yùn)營(yíng)。
圖 3 IssuesRaised、Shift、LevelOneOperators、ServiceGrade、Calls、TotalOperators柱形圖
圖4 按Shift(班次)來(lái)進(jìn)行篩選所生成的AverageTimePerIssue的透視圖
圖5 按Shift(班次)來(lái)進(jìn)行篩選所生成的LevelTwoOperators的透視圖
以圖形方式顯示由模型發(fā)現(xiàn)的響應(yīng)時(shí)間和服務(wù)等級(jí)之間的相關(guān)性。
從挖掘模型分析可知,首要影響因素是AverageTimePerIssue,AverageTimePerIssue介于44—70分鐘之間時(shí),60.6% 的事例發(fā)生在具有最高服務(wù)等級(jí)(0.030—0.072)的班次內(nèi),8.30% 的事例發(fā)生在具有最低服務(wù)等級(jí) (0.126—0.210)的班次內(nèi)。可得出結(jié)論:較短的呼叫響應(yīng)時(shí)間(44—70分鐘)會(huì)嚴(yán)重影響較好的服務(wù)等級(jí) (0.03—0.07)。
除了分析可能會(huì)影響呼叫中心運(yùn)營(yíng)的因素之外,還需要就員工如何提升其服務(wù)等級(jí)提供一些具體的建議。在此任務(wù)中,將使用生成探索模型時(shí)所使用的挖掘結(jié)構(gòu),并添加一個(gè)用來(lái)通過(guò)使用邏輯回歸模型創(chuàng)建預(yù)測(cè)。
使用數(shù)據(jù)源視圖設(shè)計(jì)器創(chuàng)建一個(gè)T-SQL語(yǔ)句的命名查詢,用于大容量預(yù)測(cè)的源數(shù)據(jù)的聚合視圖。生成大容量預(yù)測(cè)查詢輸入數(shù)據(jù)的T-SQL代碼如下:
表1 每個(gè)班次的示例結(jié)果
表2 三個(gè)不同響應(yīng)時(shí)間用作預(yù)測(cè)查詢的輸入時(shí)的結(jié)果
通過(guò)上述對(duì)SSAS神經(jīng)網(wǎng)絡(luò)算法的討論,以及利用基于SSAS神經(jīng)網(wǎng)絡(luò)算法建立的挖掘模型應(yīng)用到一個(gè)具體實(shí)例,通過(guò)分析神經(jīng)網(wǎng)絡(luò)算法挖掘模型所發(fā)現(xiàn)的模式,得出了對(duì)顧客分類的結(jié)果。根據(jù)結(jié)果,生成可用于預(yù)測(cè)的邏輯回歸模型,使用該預(yù)測(cè)來(lái)幫助規(guī)劃呼叫中心的運(yùn)營(yíng)。
[1]JIAWEIHAN MICHELINE KAMBER.Data Mining:Concepts and Techniques,2nd ed [M].Beijing:China Machine Press,2006.
[2]郭麗.SQLServer2005構(gòu)建數(shù)據(jù)挖掘解決方案 [J].計(jì)算機(jī)與現(xiàn)代化.2007(5):1.
[3](美)陳封能,(美)斯坦巴赫,(美)庫(kù)瑪爾著,范明等譯.數(shù)據(jù)挖掘?qū)д?(完整版)[M].北京:人民郵電出版社.2011.
[4]謝邦昌.商務(wù)智能與數(shù)據(jù)挖掘Microsoft SQL Server應(yīng)用 [M].北京:機(jī)械工業(yè)出版社.2008.
[5](美)邁克倫南,(美)唐朝暉,(美)克里沃茨著,董艷,程文俊譯.數(shù)據(jù)挖掘原理與應(yīng)用 (第2版)—SQL Server 2008數(shù)據(jù)庫(kù) [M].北京:清華大學(xué)出版社.2010.