桑國(guó)珍
摘 要:蟻群算法是優(yōu)化領(lǐng)域中一種新興的生物進(jìn)化算法,與傳統(tǒng)的算法相比,其具有并行、正反饋和啟發(fā)式搜索等特點(diǎn)。在此,運(yùn)用蟻群聚類(lèi)算法對(duì)客戶(hù)關(guān)系管理中的客戶(hù)分類(lèi)問(wèn)題進(jìn)行分析。結(jié)果表明,通過(guò)此算法對(duì)企業(yè)的客戶(hù)消費(fèi)數(shù)據(jù)進(jìn)行分類(lèi),以此來(lái)獲取不同類(lèi)型客戶(hù)的需求,對(duì)支持企業(yè)決策方面有著極為重要的理論參考價(jià)值和實(shí)際應(yīng)用意義。
關(guān)鍵詞:蟻群算法;客戶(hù)關(guān)系管理;聚類(lèi)分析;蟻群聚類(lèi)算法
中圖分類(lèi)號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1004-373X(2009)20-155-02
Application of Ant Colony Clustering Algorithm in Customer Relationship Management
SANG Guozhen
(Department of Computer Science,Weinan Teachers University,Weinan,714000,China)
Abstract:Ant colony algorithm is a new evolutionary algorithm in the domain of optimization.It has characteristics of parallelism,positive feedback and heuristic search in comparison with the traditional algorithm.The problems of client classification among client relationship management using the ant colony clustering algorithm are analysed.The result indicates that classifying the consumption data of client with the algorithm can get customer needs of distinguished type.The algorithm has the most important referential value and application meaning in the aspect of enterprise decision-making.
Keywords:ant colony algorithm;CRM;cluster analysis;ant colony clustering algorithm
收稿日期:2009-04-24
基金項(xiàng)目:渭南師范學(xué)院科研計(jì)劃項(xiàng)目(07YKZ059)
在全球網(wǎng)際賣(mài)方競(jìng)爭(zhēng)中,“客戶(hù)”已升級(jí)為如今買(mǎi)方市場(chǎng)激烈競(jìng)爭(zhēng)下企業(yè)興衰成敗的關(guān)鍵[1]。在激烈的市場(chǎng)競(jìng)爭(zhēng)中,以客戶(hù)為中心的銷(xiāo)售策略已經(jīng)成為企業(yè)和商家的共識(shí)。CRM是一種旨在改善企業(yè)與客戶(hù)之間關(guān)系的新型管理方法,包括的主要內(nèi)容有客戶(hù)識(shí)別、客戶(hù)關(guān)系建立、客戶(hù)保持、客戶(hù)流失控制和客戶(hù)挽留。企業(yè)通過(guò)對(duì)整個(gè)客戶(hù)群體進(jìn)行分類(lèi),并以此來(lái)獲取不同客戶(hù)群體的需求,并針對(duì)不同類(lèi)型的消費(fèi)群體制定相應(yīng)的營(yíng)銷(xiāo)策略。發(fā)掘新客戶(hù)群和增長(zhǎng)迅速的客戶(hù)群體,以制定相應(yīng)的產(chǎn)品和銷(xiāo)售服務(wù)計(jì)劃,開(kāi)拓新的市場(chǎng)。在市場(chǎng)競(jìng)爭(zhēng)獲得主動(dòng)地位,并提高企業(yè)市場(chǎng)競(jìng)爭(zhēng)力。
1 蟻群算法原理
蟻群算法最早是由意大利學(xué)者M(jìn).Dorigo,及其導(dǎo)師Colorni于1991年提出[2]的。其靈感來(lái)源于螞蟻在尋找食物過(guò)程中發(fā)現(xiàn)路徑的行為。蟻群算法是繼神經(jīng)網(wǎng)絡(luò)、遺傳算法、免疫算法之后的又一種新興的啟發(fā)式搜索算法[3]。模擬螞蟻群體智能的人工蟻群算法具有分布計(jì)算、信息正反饋和啟發(fā)式搜索的特點(diǎn)[4]。最初的蟻群算法用來(lái)解決的是組合優(yōu)化問(wèn)題。在這十多年時(shí)間里,基本蟻群算法得到了不斷發(fā)展和完善,現(xiàn)在其應(yīng)用領(lǐng)域已擴(kuò)展到多目標(biāo)優(yōu)化、數(shù)據(jù)分類(lèi)、數(shù)據(jù)聚類(lèi)、模式識(shí)別等各個(gè)方面[5]。
2 聚類(lèi)分析
聚類(lèi)是將一組對(duì)象分成若干個(gè)群體,每個(gè)群體構(gòu)成一個(gè)簇,使得簇內(nèi)對(duì)象盡可能具有最大相似性,簇間的對(duì)象盡可能有最大相異性。聚類(lèi)分析是將數(shù)據(jù)分類(lèi)到不同簇的過(guò)程,目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來(lái)分類(lèi)。聚類(lèi)分析被應(yīng)用于很多領(lǐng)域,在商業(yè)上,聚類(lèi)分析為客戶(hù)關(guān)系管理提供了重要的分析手段[6],從客戶(hù)的購(gòu)買(mǎi)信息里找出不同的客戶(hù)群特征,以發(fā)現(xiàn)不同的客戶(hù)群,從而有助于市場(chǎng)分析人員制定針對(duì)性的營(yíng)銷(xiāo)方案。
3 蟻群聚類(lèi)算法在CRM中的應(yīng)用
隨著蟻群算法研究的興起,人們發(fā)現(xiàn)采用蟻群算法模型進(jìn)行聚類(lèi),更加接近實(shí)際的聚類(lèi)問(wèn)題。將蟻群算法用于聚類(lèi)分析,其靈感源于螞蟻堆積他們的尸體和分類(lèi)他們的幼體[7]。基于蟻群算法的聚類(lèi)方法,從原理上可分為兩種:一種是基于蟻堆形成原理來(lái)實(shí)現(xiàn)數(shù)據(jù)聚類(lèi);另一種是運(yùn)用螞蟻覓食原理,利用信息來(lái)實(shí)現(xiàn)聚類(lèi)分析。Deneubourg等基于蟻群聚類(lèi)現(xiàn)象建立了一種基本模型,Lumer E和Faieta B將該模型推廣到數(shù)據(jù)分析范疇[8],其主要思想是將待聚類(lèi)的數(shù)據(jù)隨機(jī)地散布在一個(gè)二維平面內(nèi),然后在該平面上產(chǎn)生一些虛擬螞蟻,對(duì)其進(jìn)行聚類(lèi)分析。具體過(guò)程,首先將數(shù)據(jù)對(duì)象隨機(jī)地投影到一個(gè)平面上,然后每只螞蟻根據(jù)該對(duì)象在局部區(qū)域的相似性而得到的概率,決定是否“拾起”、“移動(dòng)”或“放下”該數(shù)據(jù)對(duì)象。經(jīng)過(guò)有限次迭代,平面上的數(shù)據(jù)對(duì)象按其相似性而聚集,最后得到聚類(lèi)結(jié)果和聚類(lèi)數(shù)目。
算法描述過(guò)程如下[7]:
(1) 初始狀態(tài)下螞蟻個(gè)數(shù)為n_ant;最大迭代次數(shù)為M;局部區(qū)域邊長(zhǎng)為s,參數(shù)為α,c等。
(2) 將數(shù)據(jù)對(duì)象投影到一個(gè)二維平面,即給每個(gè)數(shù)據(jù)對(duì)象隨機(jī)地分配一對(duì)坐標(biāo)值(x,y)。
(3) 每只螞蟻初始化隨機(jī)地選擇一個(gè)對(duì)象。
(4) 參數(shù)v取三種類(lèi)型值之一,常數(shù)、隨機(jī)數(shù)或遞減隨機(jī)數(shù)。當(dāng)v為常數(shù)時(shí),所有螞蟻在任何時(shí)刻以同樣速度運(yùn)動(dòng);當(dāng)v為隨機(jī)數(shù)時(shí),螞蟻的速度為一個(gè)范圍從1~vmax的隨機(jī)數(shù);當(dāng)v為遞減隨機(jī)數(shù)時(shí),螞蟻剛開(kāi)始運(yùn)動(dòng)時(shí)的速度較快,以便迅速聚類(lèi),然后其值以隨機(jī)的方式逐漸減小,以使聚類(lèi)結(jié)果更為精細(xì)。
(5) For i=1,2,…,M;For j=1,2,…,n_ant
① 根據(jù)式(1)[6]計(jì)算對(duì)象的平均相似性;
SI(oj)=max0,1s2∑oi∈Neighsxs(r)[1-d(oioj)α(1+(v-1)/vmax)](1)
式中:SI(oj)表示對(duì)象的平均相似性;α為相似性參數(shù);v為螞蟻運(yùn)動(dòng)速度;vmax為最大速度;Neighsxs(r)表示地點(diǎn)r周?chē)詓為邊長(zhǎng)的正方形局部區(qū)域;d(oi,oj)為對(duì)象oi和oj在屬性空間中的距離。
② 如果螞蟻未負(fù)載,根據(jù)式(2)計(jì)算“拾起”概率:
Pp=1-Sigmoid[SI(oj)](2)
若Pp大于某隨機(jī)概率,而同時(shí)該對(duì)象未被其他螞蟻“拾起”,則螞蟻“拾起”該對(duì)象,隨機(jī)移往別處,并標(biāo)記自己有負(fù)載;否則,螞蟻拒絕“拾起”該對(duì)象,而隨機(jī)選擇其他對(duì)象;
③ 若螞蟻為有負(fù)載狀態(tài),由式(3)計(jì)算“放下”概率:
Pd=1-Sigmoid[SI(oj)](3)
若Pd大于某一隨機(jī)概率,則螞蟻“放下”該對(duì)象,并標(biāo)記自己無(wú)負(fù)載,再重新選擇一個(gè)新對(duì)象。
(6) For i=1,2,…,n
① 如果某個(gè)對(duì)象是孤立的或其鄰域?qū)ο髠€(gè)數(shù)小于某一常數(shù),則標(biāo)記該對(duì)象為孤立點(diǎn);
② 否則給該對(duì)象分配一個(gè)聚類(lèi)序列號(hào),并遞歸地將其鄰域?qū)ο髽?biāo)記為同樣的序列號(hào)。
可通過(guò)以上描述算法對(duì)企業(yè)客戶(hù)信息進(jìn)行聚類(lèi)分析。首先從客戶(hù)消費(fèi)基本信息表中取出主要屬性值,如年齡、性別、消費(fèi)金額等,其次將上述算法中的參數(shù)灌值,然后聚類(lèi)分析,可發(fā)現(xiàn)比較突出的客戶(hù)群,從而市場(chǎng)分析人員可以進(jìn)行有針對(duì)性的營(yíng)銷(xiāo)策略和制定操作方式,提供有針對(duì)性的服務(wù),提高公司的綜合服務(wù)水平,并可以降低業(yè)務(wù)服務(wù)成本,取得更高的收益。
4 結(jié) 語(yǔ)
企業(yè)的競(jìng)爭(zhēng)重點(diǎn),正在經(jīng)歷著從以產(chǎn)品為中心向以客戶(hù)為中心的轉(zhuǎn)移,客戶(hù)關(guān)系管理作為一種全新的管理、經(jīng)營(yíng)理念,越來(lái)越引起商家的重視?,F(xiàn)代企業(yè)50%以上的銷(xiāo)售額來(lái)自一小部分的重要客戶(hù),而其余的大部分客戶(hù)對(duì)企業(yè)是微利的[9]。因此,企業(yè)要想獲得最大程度的收益,就必須對(duì)自己擁有的客戶(hù)進(jìn)行有效的差異分析,并根據(jù)這種差異來(lái)區(qū)分不同價(jià)值的客戶(hù)。通過(guò)從數(shù)據(jù)倉(cāng)庫(kù)當(dāng)中進(jìn)行數(shù)據(jù)挖掘正逐漸成為CRM 中最核心的部分[10]。用蟻群聚類(lèi)算法解決CRM 的客戶(hù)聚類(lèi)分析問(wèn)題是可行的。這在支持企業(yè)決策方面有著極為重要的理論參考價(jià)值和實(shí)際應(yīng)用意義,可以幫助高層管理者更好地管理企業(yè),使企業(yè)得到更好的發(fā)展,實(shí)現(xiàn)客戶(hù)資源價(jià)值和企業(yè)投入回報(bào)的同步最大化。
參考文獻(xiàn)
[1]劉云強(qiáng),李尤.蟻群算法在客戶(hù)關(guān)系管理中的應(yīng)用[J].商場(chǎng)現(xiàn)代化,2007(6):167-168.
[2]馬良,朱剛,寧愛(ài)兵.蟻群優(yōu)化算法[M].北京:科學(xué)出版社,2008.
[3]李士勇,陳永強(qiáng),李研.蟻群算法及其應(yīng)用[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2004.
[4]李斌.聚類(lèi)分析在客戶(hù)關(guān)系管理中的研究與應(yīng)用[D].昆明:昆明理工大學(xué),2004.
[5]段海濱.蟻群算法原理及其應(yīng)用[M].北京:科學(xué)出版社,2006.
[6]周曉剛,洪春勇.蟻群聚類(lèi)算法在客戶(hù)分類(lèi)中的應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,2007(5):33-35.
[7]許慧,王正友,楊歡慶.蟻群算法及其聚類(lèi)應(yīng)用[J].礦山機(jī)械,2007(1):114-116.
[8]Lumer E,Faieta B.Diversity and Adaptation in Populations of Clustering Ants [A].Proc.Third International Conference on Simulation of Adaptive Behavior: From Animals to Animals 3 [C] .Cambridge,MA: MIT Press,1994:499-508.
[9]陳曉海.CRM實(shí)施的成功因素研究[A].中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)[C].2008.
[10]楊光.淺析數(shù)據(jù)挖掘在CRM中的應(yīng)用[J].情報(bào)科學(xué),2005(2):119-121.