国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

移動電子商務(wù)情境下客戶細分優(yōu)化算法的研究

2013-08-20 01:54:42楊曦
關(guān)鍵詞:細分權(quán)值均值

楊曦

(福州大學陽光學院 福建 350015)

0 引言

近年來,互聯(lián)網(wǎng)與移動通信技術(shù)的飛速發(fā)展及全球化商務(wù)經(jīng)濟的到來,為移動電子商務(wù)帶來了廣闊的空間和更多的挑戰(zhàn)。一方面,移動電子商務(wù)的移動性極大地增加了客戶種類,且移動數(shù)據(jù)的非結(jié)構(gòu)化及數(shù)據(jù)流量限制,導致企業(yè)需針對不同客戶需求實施個性化定制的營銷策略[1];另一方面,移動電子商務(wù)環(huán)境下,客戶的興趣和需求會隨時空情境的變化而變化,而無序、海量的移動數(shù)據(jù)信息更造成“信息爆炸但知識貧乏”現(xiàn)象[2]。因而,移動電子商務(wù)環(huán)境下的個性化推薦理論與技術(shù)成為學術(shù)界研究的熱點。而作為個性化服務(wù)的基礎(chǔ)的客戶細分也為企業(yè)識別并了解客戶提供了有效的手段。移動電子商務(wù)情境下的客戶細分問題要求算法的求解精度較高,而現(xiàn)有聚類算法存在過早收斂、精度較低、細分效果不佳等缺點,針對移動電子商務(wù)情境下的細分模型又相對匱乏,所以結(jié)合高效的聚類算法提高客戶細分的精度,從而構(gòu)建科學合理的客戶評價體系對移動電子商務(wù)的發(fā)展有著較為重要的理論和應用價值。

1 客戶細分基礎(chǔ)理論

聚類分析能從潛在數(shù)據(jù)中發(fā)現(xiàn)新的、有意義的數(shù)據(jù)分布模式,是客戶細分領(lǐng)域中較為適用的方法[3,4],傳統(tǒng)經(jīng)典的聚類分析有基于劃分的方法(如K-均值算法[5])、基于密度、基于層次和基于模型(如SOM[6])等方法。經(jīng)典聚類算法在很多領(lǐng)域都有廣泛應用,但每一類算法都有各自的缺陷和不足,所以只局限于解決某一類問題。隨著人工智能、模式識別、機器學習等科學理論的產(chǎn)生,聚類算法也有了長足的發(fā)展,例如PSO、粒度計算、FCM等。下面介紹幾種在客戶細分領(lǐng)域較為常用的聚類方法。

1.1 K-均值算法

K-均值法的所有簇類均計算出該類中所有數(shù)據(jù)的平均值或加權(quán)平均值,即聚類中心。其公式如下:

其中d(xi,cj)表示樣本點xi到聚類中心cj的歐式距離。K-均值法從樣本點集中隨機選取K個點作為初始聚類中心,計算并比較每個點xi到聚類中心cj的距離,將xi分配到與其距離最小的簇中;重新選擇聚類中心,重復此步驟,直至聚類中心不再發(fā)生變化。

K-均值法得到的結(jié)果通常只是局部最優(yōu)解且一定程度上依賴于初始聚類中心的選擇,其缺陷還有:K值選擇無標準依據(jù),只能處理數(shù)值群,對“噪聲”和離群數(shù)據(jù)較為敏感等。

1.2 PSO粒子群優(yōu)化算法

PSO是一種基于群的聚類方法[7],通過模擬生物界魚群或鳥群間合作與競爭產(chǎn)生的優(yōu)化算法。PSO在預測精度和運行速度方面優(yōu)勢明顯。其算法表述如下:

設(shè)在n維空間中有粒子群xi(i=1,2,...m),每個粒子有速度vi和位置pi兩種屬性,在n維空間中為xi的速度分量和位置分量,通過PSO模型的計算,粒子群不斷優(yōu)化速度和位置。

PSO是一種隨機搜索方法,類似于遺傳算法和模擬退火算法,但收斂速度更快,具有一定的早熟傾向,所以在求解全局最優(yōu)解方面精度仍較低。

1.3 SOM神經(jīng)網(wǎng)絡(luò)

SOM是一種具有自組織功能的、免監(jiān)控自發(fā)學習的神經(jīng)網(wǎng)絡(luò)[6],由M個輸入神經(jīng)元與N個輸出神經(jīng)元構(gòu)成?;赟OM的聚類方法是為每個輸入神經(jīng)元搜索對應的最優(yōu)輸出神經(jīng)元及相應的連接權(quán)值。由于SOM支持多種網(wǎng)絡(luò)拓撲結(jié)構(gòu),形成的聚類中心能映射到曲面或平面上,從而保持其自身拓撲結(jié)構(gòu)不變。因此,K-均值法初始聚類中心隨意性導致結(jié)果不確性的問題,可以借助自組織映射得到趨于穩(wěn)定的聚類中心。

SOM對于一般客戶細分問題有著較好的聚類效果,具有自穩(wěn)定性,但缺點是需預構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu),訓練樣本時間較長等。

2 改進的混合聚類算法

針對各聚類算法在客戶細分方面的不足,本文結(jié)合幾種聚類算法的優(yōu)點提出了一種改進的聚類算法M-Cluster。

2.1 預處理優(yōu)化

首先,針對K-均值法一定程度上需依賴于初始聚類中心的缺點,使用SOM神經(jīng)網(wǎng)絡(luò)先對樣本集進行預處理,得到的聚類中心作為初始聚類中心。另一方面,利用K-均值法對SOM的訓練數(shù)據(jù)進行預聚類并初始化權(quán)值,以克服網(wǎng)絡(luò)構(gòu)建和訓練時間較長的缺點。具體改進措施如下:

(1)從初始數(shù)據(jù)集中選取樣本集X作為訓練數(shù)據(jù)集,同時用K-均值法將X分為K個簇,得到聚類中心集C;

(2)使用C初始化SOM網(wǎng)絡(luò)頂點位置的神經(jīng)元權(quán)值:從C中尋找間距最大的兩個聚類中心點,分別作為對角線上兩個頂點神經(jīng)元初始化權(quán)值;然后從剩余的聚類中心集中尋找與兩個頂點距離最遠的聚類中心點,放置于副對角線上其中一個頂點位置,再用同樣的方法尋找副對角線上的另一頂點。

(3)初始化SOM網(wǎng)絡(luò)外層四個象限的神經(jīng)元權(quán)值:以左象限為例,利用K-均值法的計算公式依次計算k-4個聚類中心分別與左側(cè)邊最上方兩個頂點間距離之和,從中選取M-2個數(shù)值最小的聚類中心作為初始化權(quán)值,按照與左上頂點距離遞增的順序從左至右依次賦于各神經(jīng)元。同理,從外至內(nèi)逐層初始化剩余神經(jīng)元權(quán)值。

(4)使用樣本集X訓練SOM網(wǎng)絡(luò)后,將初始數(shù)據(jù)集分成K個簇,得到聚類中心集合C',作為進行下一步聚類計算的初始化數(shù)據(jù)。

2.2 改進的M-Cluster算法

PSO的進化過程帶有一定的隨機性,保持粒子多樣性的同時也擴大了全局搜索范圍,從而使得全局解的精度較低。而K-均值法具有局部搜索最優(yōu)解的特性,利用其對PSO進化得到的新粒子進行聚類優(yōu)化,從而提高全局搜索精度。

(1)優(yōu)化PSO模型的慣性權(quán)重的值ω。ω的值直接決定了PSO的搜索范圍,為使算法具有較強的全局搜索能力,在前期保持較高搜索效率,后期保持較高搜索精度,本文對ω做如下修正:

其中,d為迭代次數(shù),n為調(diào)節(jié)參數(shù)(視情況而定)。

(2)利用K-均值法優(yōu)化新群體。首先將粒子添加到距離最近的聚類中心C'的簇中,用K-均值法對形成的粒子簇進行聚類,得到新的聚類中心集C'';然后計算粒子當前位置的適應度、最好位置的適應度和粒子群最好位置的適應度,用適應度最大的位置更新粒子速度并調(diào)整其位置。最后,更新整個粒子群經(jīng)過的最好位置。

3 移動電子商務(wù)情境下的客戶細分模型

基于客戶價值的評價方法通常是用來構(gòu)建客戶細分模型的重要方法,而其中最常用的就是生命周期價值模型LTV和近度/頻度/金額(Recency/Frequency/Monetary)RFM模型。LTV應用計算模型統(tǒng)計出每個客戶的LTV值并通過排序來評價客戶的價值度。LTV模型較為簡單,沒有綜合考慮客戶行為的動態(tài)性、市場競爭等復雜因素,且需基于過去購買模式來評價和推斷,未能反映客戶未來行為及價值的波動趨勢,故而具有一定的局限性。RFM模型通過統(tǒng)計最近購買時間(近度)、購買頻率(頻度)和購買金額三種客戶行為指標來構(gòu)建評價體系。根據(jù)RFM值劃分出若干類別未知的子客戶群,將子客戶群的平均RFM與全局客戶的RFM平均值依據(jù)客戶細分模型進行比較,形成最終的客戶分類。但RFM仍然只能對過去行為交易進行評價,無法發(fā)現(xiàn)潛在客戶。

基于此,本文結(jié)合這兩種模型的思想針對學生群體對移動電子商務(wù)的消費模式和群集現(xiàn)象,構(gòu)建全新的客戶/利潤/金額CPM模型。通過問卷調(diào)查獲取到CPM分別相應的三級指標對于CPM的權(quán)值,然后應用M-Cluster算法對用戶進行分類,具體步驟為:①對C、P、M三個指標分別進行聚類,得到K個的客戶簇;②比較每個客戶簇的C、P、M平均值與全局客戶C、P、M平均值,高于全局均值,記為↑,否則記為↓;③根據(jù)每個用戶簇的指標變動情況分析該類用戶的特征與性質(zhì),定義用戶類型;④用M-Cluster算法對客戶C、P、M指標進行聚類,得到K類用戶群體。

4 結(jié)束語

傳統(tǒng)聚類算法無法滿足移動電子商務(wù)情境下對客戶細分的高精度要求,在分析研究多種經(jīng)典聚類算法理論的基礎(chǔ)上,提出一種收斂速度快、細分精度高的混合聚類算法,且不易陷入局部最優(yōu)解、不會對初始聚類中心數(shù)據(jù)敏感等,更適合解決客戶細分問題。

[1]Kumara V,Shah D.Building and Sustaining Profitable Customer Loyalty for the 21st Century[J].Journal of Retailing,2004,80(10):317-330.

[2]Borchers A,Herlocker J,Konstan J,et al.Ganging up on information overload[J].Computer,1998,31(4):106-108.

[3]陳智高,陳月英,常香云.基于客戶價值的期貨業(yè)客戶聚類細分方法[J].清華大學學報(自然科學學版),2006,46(1):1046-1051.

[4]王華秋,廖曉峰.微粒群并行聚類在客戶細分中的應用[J].計算機應用研究,2008,25(10):2987-2994.

[5]MacQueen J.Some methods for classification and analysis of multivariate observations[C].In Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probabilit,Berkeley:University of California Press,1967:281-297.

[6]Kohonen T.Self-organized formation of topologically correct feature maps[J].Biological Cybernetics,1982,43:59-69.

[7]Kennedy J,Eberhart R.Particle swarm optimization[C].In Proceedingsofthe IEEE International Conference on Neural Network,1995,1942-1948.

猜你喜歡
細分權(quán)值均值
一種融合時間權(quán)值和用戶行為序列的電影推薦模型
CONTENTS
CONTENTS
深耕環(huán)保細分領(lǐng)域,維爾利為環(huán)保注入新動力
華人時刊(2020年23期)2020-04-13 06:04:12
基于權(quán)值動量的RBM加速學習算法研究
自動化學報(2017年7期)2017-04-18 13:41:02
均值不等式失效時的解決方法
1~7月,我國貨車各細分市場均有增長
專用汽車(2016年9期)2016-03-01 04:17:02
均值與方差在生活中的應用
整體低迷難掩細分市場亮點
專用汽車(2015年2期)2015-03-01 04:05:42
關(guān)于均值有界變差函數(shù)的重要不等式
玉树县| 昭通市| 福安市| 聊城市| 安陆市| 常宁市| 会同县| 广安市| 涟水县| 太保市| 仙桃市| 白沙| 肥城市| 孝义市| 无为县| 岳阳市| 乌鲁木齐县| 江口县| 盐边县| 四川省| 贵港市| 平果县| 盐津县| 泸定县| 青神县| 溧水县| 平罗县| 舟曲县| 华阴市| 易门县| 靖西县| 阳江市| 乐业县| 开原市| 陇南市| 万安县| 罗城| 法库县| 南昌县| 鸡西市| 扎兰屯市|