楊盛苑 張向娟
摘要:關(guān)聯(lián)規(guī)則挖掘是在數(shù)據(jù)挖掘研究中最為活躍的一種挖掘方法之一。該文利用關(guān)聯(lián)規(guī)則的Apriori算法對軟件企業(yè)的客戶與商品之間的關(guān)系進(jìn)行挖掘,發(fā)現(xiàn)商品間的潛在關(guān)系,指導(dǎo)決策者對不同的客戶實施不同的營銷策略,從而達(dá)到高質(zhì)量的客戶關(guān)系管理。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則;Apriori算法;客戶關(guān)系管理
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)30-7169-03
自上世紀(jì)80年代以來,伴隨著我國市場經(jīng)濟的逐漸成熟,客戶對產(chǎn)品的需求平穩(wěn)增長,市場競爭愈加激烈,這使得企業(yè)認(rèn)識到識別、挑選、獲得、發(fā)展和維護(hù)客戶的重要性,進(jìn)而在經(jīng)營理念層面上越來越關(guān)注客戶價值、客戶滿意和客戶忠誠,力圖通過在正確的時間使用正確的方式為正確的客戶提供正確的服務(wù),來創(chuàng)造和傳遞客戶價值,提升客戶滿意水平,從而實現(xiàn)客戶忠誠進(jìn)而維持正確客戶,獲得這些客戶的生涯價值(LTV)。本文設(shè)計了一個關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘模型,結(jié)合實例使用Apriori挖掘技術(shù)分析并檢驗了該方法的有效性。
1 關(guān)聯(lián)規(guī)則挖掘
數(shù)據(jù)挖掘(Data mining)是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的過程。簡單地說,數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識,又被稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(knowledge discovery in database,KDD)。[1]
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最為常見的一種挖掘方法之一,最初由R.Agrawal等人提出,主要目的在于通過超市購物籃發(fā)現(xiàn)超市交易中不同商品之間存在的潛在關(guān)系。
關(guān)聯(lián)規(guī)則可以用一個蘊含式R:X[?]Y來表示,其中:X[?]I,Y[?]I,I為關(guān)聯(lián)規(guī)則挖掘涉及到的項目的集合,稱為項集,并且X[?]Y=[φ]。它表示如果項集X在某一項目中出現(xiàn),則會導(dǎo)致項集Y按照某一概率也會出現(xiàn)在同一項目中。X為規(guī)則的條件,Y為規(guī)則的結(jié)果。
一個經(jīng)典的關(guān)聯(lián)規(guī)則的例子是“啤酒與尿布”的故事,全球最大的連鎖零售商沃爾瑪超市研究發(fā)現(xiàn):美國的婦女們經(jīng)常讓丈夫下班后給孩子買尿布,而30%~40%的丈夫會在買尿布的同時給自己購買啤酒。因此把尿布和啤酒的貨架擺在一起銷售,會大大增加超市的銷售額。
用來衡量什么的關(guān)聯(lián)規(guī)則才是用戶感興趣的關(guān)聯(lián)規(guī)則主要有兩個標(biāo)準(zhǔn):關(guān)聯(lián)規(guī)則的支持度和可信度。
對于關(guān)聯(lián)規(guī)則R:X[?]Y,其中:X[?]I,Y[?]I,X[?]Y=[φ],規(guī)則R的支持度表示同時包含X和Y的項目數(shù)與所有項目數(shù)的比。記為Sup(X[?]Y),Sup(X[?]Y)=[count(X?Y)D]。支持度反映了X和Y中所包含的項目在項目集中同時出現(xiàn)的頻率,支持度越大,關(guān)聯(lián)規(guī)則越重要。
對于關(guān)聯(lián)規(guī)則R:X[?]Y,其中:X[?]I,Y[?]I,X[?]Y=[φ],規(guī)則R的可信度表示包含X和Y的項目數(shù)與包含X的項目數(shù)的比。記為Conf(X[?]Y),Conf(X[?]Y)=[Sup(X?Y)Sup(X)]。可信度反映了如果項目中包含X,則項目中同時出現(xiàn)Y的概率,是對關(guān)聯(lián)規(guī)則的準(zhǔn)確程度的衡量標(biāo)準(zhǔn)。
滿足最小支持度的關(guān)聯(lián)規(guī)則稱為頻繁關(guān)聯(lián)規(guī)則;同時滿足最小支持度和最小可信度的關(guān)聯(lián)規(guī)則稱為強關(guān)聯(lián)規(guī)則,在關(guān)聯(lián)規(guī)則挖掘的過程中,需要先挖掘出所有的頻繁規(guī)則,再從中挖掘出強關(guān)聯(lián)規(guī)則,只有強關(guān)聯(lián)規(guī)則才能指導(dǎo)用戶的決策。
2 客戶關(guān)系管理
客戶關(guān)系管理(Customer Relationship Management, CRM)是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理機制。通過實施客戶關(guān)系管理可以使企業(yè)能夠方便地搜集、追蹤、分析每一個客戶的信息,增強企業(yè)與客戶之間的溝通,更好地滿足客戶的個性化需求,從而達(dá)到以更快速、更優(yōu)質(zhì)的服務(wù)保留現(xiàn)有客戶并挖掘潛在客戶的目的。
有效的客戶關(guān)系管理還能夠觀察和分析客戶行為以及其對企業(yè)的利潤影響,使企業(yè)與客戶的關(guān)系以及企業(yè)的利潤都得到最優(yōu)化,從而達(dá)到雙贏的目的。所以客戶關(guān)系管理的思想與潛在價值對企業(yè)具有極大的吸引力,絕大多數(shù)企業(yè)對于實施客戶關(guān)系管理的規(guī)范化都存在著強烈的欲望。因此,加強對客戶關(guān)系管理理論的研究并通過對客戶關(guān)系的管理和分類挖掘?qū)ζ髽I(yè)的決策提供有效依據(jù)已經(jīng)成為當(dāng)下需要解決的重要課題。
3 關(guān)聯(lián)規(guī)則挖掘在軟件企業(yè)客戶關(guān)系管理中的應(yīng)用
本文以客戶關(guān)系管理的產(chǎn)品銷售模塊作為分析對象進(jìn)行研究,利用關(guān)聯(lián)規(guī)則挖掘的Apriori算法對樣本進(jìn)行分析、挖掘,進(jìn)而找到不同產(chǎn)品銷售之間的潛在關(guān)系。
Apriori算法的核心思想是:通過對樣本數(shù)據(jù)進(jìn)行多次掃描,產(chǎn)生長度不同的頻繁集。通過設(shè)定最小支持度和最小可信度,最終挖掘出對決策有用的強關(guān)聯(lián)規(guī)則。算法的簡要描述如下:
在對客戶的信息和資料進(jìn)行管理的過程中,有的客戶會同時購買某兩種或多種產(chǎn)品,某類的客戶可能會對某種產(chǎn)品類型特別感興趣。如果挖掘出在產(chǎn)品和客戶內(nèi)部潛在的這種規(guī)律,便可以對客戶實施有重點的營銷策略,進(jìn)而提高客戶的服務(wù)水平。在進(jìn)行數(shù)據(jù)挖掘之前,我們先將客戶和客戶購買的產(chǎn)品進(jìn)行分類和標(biāo)識,用不同的代碼和序號代表不同的客戶和產(chǎn)品,如表1所示。然后再利用Apriori算法對數(shù)據(jù)進(jìn)行分析挖掘,找到數(shù)據(jù)之間存在的潛在聯(lián)系。
在此關(guān)聯(lián)規(guī)則挖掘中,設(shè)定最小支持度為0.,最小置信度為0.7,對事務(wù)數(shù)據(jù)庫進(jìn)行掃描,可以得到候選集C1,計算每項候選集的支持度,選取滿足最小支持度的候選集,得到1項頻繁集L1。繼續(xù)掃描,以此類推,直到Lk為空,算法結(jié)束。在循環(huán)的過程中,必須要保證頻繁集的子集一定是頻繁的。
最終的實驗得到的結(jié)果如表2所示:
針對上述挖掘結(jié)果可以分析得出以下結(jié)論:購買物流管理軟件的客戶通常會同時購買財務(wù)管理軟件;購買電子商務(wù)平臺和進(jìn)銷存軟件的客戶大多數(shù)都會選擇購買企業(yè)即時通訊軟件;而選擇績效考評系統(tǒng)的客戶大多數(shù)都會選擇智能化報表系列軟件。根據(jù)分析結(jié)論,在進(jìn)行商品營銷的過程中,把相關(guān)產(chǎn)品在一起向客戶推銷,將會大大增加商品的銷量,同時,客戶的滿意度也會得到相應(yīng)的提升。
以上的挖掘結(jié)果和結(jié)論,在軟件企業(yè)的客戶關(guān)系管理中進(jìn)行了實踐,證明挖掘結(jié)果具有一定的可信度,可以有效支持決策。
4 結(jié)論
使用關(guān)聯(lián)規(guī)則挖掘方法從軟件企業(yè)大量客戶服務(wù)相關(guān)數(shù)據(jù)中發(fā)現(xiàn)潛在的數(shù)據(jù)規(guī)律,并進(jìn)行分析和預(yù)測,可以增強客戶服務(wù)的客觀性和合理性。同時,這些規(guī)律也為決策者做出正確的決策提供了理論依據(jù),可以較好的改善軟件企業(yè)的客戶服務(wù)水平,提高客戶滿意度。
參考文獻(xiàn):
[1] 陳志泊.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2009.
[2] 楊路明,巫寧.客戶關(guān)系管理理論與實務(wù)[M].北京:電子工業(yè)出版社,2009.
[3] 王廣宇.客戶關(guān)系管理方法論[M].北京:清華大學(xué)出版社,2004.
[4] 張華雨.Intranet環(huán)境下基于數(shù)據(jù)倉庫技術(shù)的新型DSS[J].計算機應(yīng)用,2004,22(2):2728.