国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)模糊聚類算法在客戶關(guān)系管理軟件中的應(yīng)用

2014-12-09 23:29李克威
無(wú)線互聯(lián)科技 2014年11期
關(guān)鍵詞:模糊聚類

李克威

摘 要:本文考慮到現(xiàn)有CRM的局限性,引入了模糊數(shù)學(xué)相關(guān)算法,給數(shù)據(jù)對(duì)象的隸屬度加上一個(gè)權(quán)值,以及在算法中用有效性函數(shù)來(lái)自動(dòng)確定聚類數(shù)目C,理論分析與實(shí)驗(yàn)結(jié)果表明,在CRM環(huán)境下所引入的改進(jìn)模糊聚類算法比傳統(tǒng)模糊聚類算法有更好的聚類效果,更快的聚類速度。

關(guān)鍵詞:聚類;CRM;模糊

目前,很多企業(yè)都認(rèn)識(shí)到客戶和市場(chǎng)在競(jìng)爭(zhēng)中的重要性,越來(lái)越多的企業(yè)正在提高客戶對(duì)企業(yè)的中邀請(qǐng)。逐步建立以客戶和市場(chǎng)為方向的經(jīng)營(yíng)模式。隨著計(jì)算機(jī)計(jì)算的快速發(fā)展,很多科研機(jī)構(gòu)把CRM作為重點(diǎn)研究對(duì)象,CRM系統(tǒng)和一定服務(wù)系統(tǒng)的結(jié)合,提高客戶滿意度和忠誠(chéng)度,能給企業(yè)帶來(lái)長(zhǎng)久發(fā)展的一種理念。

1 CRM簡(jiǎn)介

客戶關(guān)系管理(CRM)就是為企業(yè)提供全方位的管理視角,給企業(yè)完善的客戶交流能力,最大化客戶的收益。對(duì)CRM我們可以這樣理解。一方面,從經(jīng)營(yíng)管理觀念方面考慮,CRM是一種以客戶為中心的理念,通過(guò)信息化,重新規(guī)劃各個(gè)功能模塊達(dá)到縮減銷售成本,開拓新的市場(chǎng)。另一方面,CRM對(duì)以客戶為中心的商業(yè)模型提供支持的一套軟件系統(tǒng),包含多種與客戶交流的方式,如見面談或者電話談,這樣企業(yè)可以根據(jù)客戶的喜歡采用合適的方法與他們溝通。

2 模糊聚類算法

通常見到的聚類是硬聚類,具有非此即彼的特點(diǎn)。Dunn把硬聚類算法推廣到了模糊的情況下,Bezdk給模糊聚類的隸屬度引入了權(quán)重m這個(gè)概念[1-2]。模糊聚類通過(guò)讓最小化目標(biāo)函數(shù)從而得到最優(yōu)聚類結(jié)果,模糊聚類是根據(jù)樣本之間的特征、親疏程度和相似性,通過(guò)建立類別之間的模糊分類,作為數(shù)理統(tǒng)計(jì)中的一種多元分析方法[3],已廣泛應(yīng)用于諸多領(lǐng)域。

對(duì)于數(shù)據(jù)的類別劃分,定義一個(gè)硬劃分矩陣U,V={V,V2,…VC}是特征空間的矢量集合,Vi表示第i類的聚類中心,dik表示第i類中樣本Xk到第i類聚類中心的距離,硬聚類的目標(biāo)函數(shù)為

J1(U,V)是各個(gè)數(shù)據(jù)與其聚類中心的誤差平方和,(U,V)表示聚類準(zhǔn)則的最佳配對(duì),通過(guò)迭代求J的近似最小值使得J1滿足最小。

FCM聚類算法基本步驟如下[4]:

⑴設(shè)定劃分類別數(shù)c(2≤c≤n,n是數(shù)據(jù)個(gè)數(shù));設(shè)置算法計(jì)算停止閾值為0.01;給聚類中心P(0)設(shè)置初值;

⑵計(jì)算劃分矩陣U(b)的結(jié)果;

⑶求中心矩陣P(b+1);

⑷若 ,則算法數(shù)據(jù)劃分類別陣和聚類的中心,否則讓迭代計(jì)數(shù)器加1。

3 改進(jìn)模糊聚類算法

傳統(tǒng)的模糊聚類算法也存在一些問(wèn)題:(1)難以判斷離群點(diǎn)的歸屬(2)提前確定劃分類別數(shù)目和權(quán)重因子(3)因?yàn)镕CM算法的收斂性,很容易陷入局部極小點(diǎn)或者鞍點(diǎn),從而得不到全局最小值。

3.1 減少離群點(diǎn)的作用

為了減小離群點(diǎn)對(duì)聚類中心的干擾,給隸屬矩陣添加一個(gè)權(quán)重因子,讓隸屬度低的點(diǎn)對(duì)聚類中心起的作用比較小,把隸屬度調(diào)整為為 。

3.2 對(duì)劃分類別書的確定

人為確定劃分類別不太準(zhǔn)確,有可能讓聚類過(guò)程很緩慢。我們把聚類的有效性函數(shù)添加到FCM算法中,利用有效性函數(shù)來(lái)決定劃分類別數(shù)的值。改進(jìn)的模糊聚類算法如下所示:

初始化:設(shè)定迭代的計(jì)算閾值ε,聚類原型P(0),迭代次數(shù)為b=0;

步驟1:計(jì)算劃分矩陣U(b);

對(duì)于 ,k,若 >0, ,r,使得 =0,則有 =1,且對(duì) , =0。

得到改進(jìn)的隸屬度:

步驟2:重新計(jì)算聚類原型P(b+1);

步驟3:若 ,則算法計(jì)算完畢,得到劃分矩陣U和聚類原型P,否則,算法跳轉(zhuǎn)到1繼續(xù)執(zhí)行。

步驟4:求聚類有效性函數(shù)的結(jié)果,若已經(jīng)達(dá)到最小值,則得到數(shù)據(jù)聚類類別數(shù)目,否則跳轉(zhuǎn)到1重新執(zhí)行程序。

4 實(shí)驗(yàn)

數(shù)據(jù)是采用隨機(jī)抽取的50個(gè)樣本信息,由于客戶的數(shù)據(jù)有17個(gè)參數(shù):公司年齡、行業(yè)、規(guī)模、公司性質(zhì)、盈利情況、員工數(shù)量、信譽(yù)度、年銷售量、產(chǎn)品市場(chǎng)定位、新產(chǎn)品數(shù)量、流動(dòng)資金、平均訂購(gòu)規(guī)模、年采購(gòu)量、購(gòu)買渠道、主要客戶、對(duì)待產(chǎn)品的態(tài)度、對(duì)待服務(wù)的態(tài)度,各個(gè)數(shù)據(jù)的量綱不同,或者量綱相同,但是數(shù)量級(jí)不同,直接用原始數(shù)據(jù)計(jì)算會(huì)出現(xiàn)“大數(shù)吃小數(shù)”的現(xiàn)象,所以,在實(shí)驗(yàn)之前,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理[4]。應(yīng)用改進(jìn)模糊聚類算法,設(shè)定加權(quán)參數(shù)為2,停止閾值為0.0001,差異度采用歐幾里得距離公式計(jì)算。下表列出了聚類中心陣和聚類結(jié)果的檢測(cè)指標(biāo)。

表1 聚類結(jié)果

Tab.1 The Result of Clustering

聚類結(jié)果中心陣 測(cè)試指標(biāo)

分類結(jié)果系數(shù) 平均模糊熵

0.05286 0.2200 0.25967

0.11245 0.1538 0.18617

0.09971 0.1185 0.11290

0.15048 0.1362 0.17140

0.19056 0.0392 0.03571 0.942751 0.071643

實(shí)驗(yàn)得到的劃分矩陣表明用戶對(duì)各個(gè)類別的隸屬程度,對(duì)其中兩組用戶數(shù)據(jù)分析:

用戶1:0.0013,0.9263,0.0722,0.0002,0.0000

用戶2:0.1475,0.8451,0.0001,0.0056,0.0017

隸屬度矩陣的每列數(shù)據(jù)表示該客戶對(duì)一個(gè)類別的隸屬程度,每一列之和為1,表示該客戶對(duì)所有類別的隸屬度之和為1。根據(jù)樣本判定的選擇原理,該客戶數(shù)據(jù)對(duì)某個(gè)類別的隸屬度大,我們就認(rèn)為該客戶屬于這個(gè)類別。從上面數(shù)據(jù)可以看出。用戶1對(duì)類別2的隸屬度為0.9263,我們認(rèn)為用戶1屬于第2類,樣本2對(duì)類別2的隸屬度為0.8451。我們認(rèn)為用戶2屬于第2類,同時(shí)樣本2對(duì)類別1有0.1475的隸屬度,所以用戶2還具有類別1的特征。

本實(shí)驗(yàn)把企業(yè)的客戶劃分成不同的種類,區(qū)別出不用種類的特點(diǎn)。下表對(duì)5類用戶進(jìn)行了的特征進(jìn)行了總結(jié):

表2 用戶特征分析

Tab.2 The Analysis of Customer Feature

分類 個(gè)數(shù) 特點(diǎn)

1 9 交往比較多,交易量比較大,

2 27 購(gòu)買金額大,但接觸次數(shù)較少

3 6 于企業(yè)接觸時(shí)間較近,接觸次數(shù)少

4 5 可能是流失危險(xiǎn)的有價(jià)值用戶

5 3 長(zhǎng)時(shí)間和企業(yè)不打交道,估計(jì)會(huì)流失

對(duì)于表2的分析結(jié)果,我們可以看到采用近度、頻率和金額度作為客戶分類的參數(shù),從劃分出的類別能看出不同客戶類別對(duì)企業(yè)的忠誠(chéng)度,對(duì)企業(yè)利潤(rùn)的貢獻(xiàn)大小和客戶估計(jì)要流失的可能性。這次實(shí)驗(yàn)是根據(jù)客戶的消費(fèi)記錄進(jìn)行聚類的,客戶最近的消費(fèi)記錄對(duì)結(jié)果的影響很大。企業(yè)通過(guò)CRM,能挖掘出對(duì)企業(yè)利潤(rùn)貢獻(xiàn)大的客戶,對(duì)不同的客戶類別,實(shí)施不同的經(jīng)營(yíng)策略,提高客戶對(duì)企業(yè)的滿意度,吸引能給企業(yè)帶來(lái)巨大利潤(rùn)的客戶,留住現(xiàn)有的客戶,避免客戶的流失,提高企業(yè)的經(jīng)濟(jì)效益。本文改進(jìn)的模糊聚類算法能夠?qū)崿F(xiàn)初始化聚類類別參數(shù)自動(dòng)生成,減少了人工干預(yù)初始化聚類數(shù)目的影響,有比較好的聚類結(jié)果和收斂速度。

[參考文獻(xiàn)]

[1]張躍.模糊數(shù)學(xué)方法及其應(yīng)用[M].北京:煤炭工業(yè)出版社.1992.

[2]高新波.模糊聚類分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社.2004.

[3]何清.模糊聚類分析理論與應(yīng)用研究進(jìn)展[J],模糊系統(tǒng)與數(shù)學(xué).1998,12(2):89-94.

[4]林輝.改進(jìn)模糊聚類在數(shù)據(jù)流中的應(yīng)用.河南科學(xué).2012.9.

猜你喜歡
模糊聚類
基于DBSACN聚類算法的XML文檔聚類
基于高斯混合聚類的陣列干涉SAR三維成像
基于模糊綜合評(píng)判的網(wǎng)絡(luò)受損狀態(tài)評(píng)估的設(shè)計(jì)與實(shí)現(xiàn)
從心理邊界剖析曾奇峰的《中國(guó)家庭的十種界限不清》
葛浩文的“模糊” 翻譯
淺析人工神經(jīng)網(wǎng)絡(luò)在汽車輪軸松曠間隙檢測(cè)中的應(yīng)用
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例