宋曉姣,胡媛媛
(合肥職業(yè)技術(shù)學(xué)院 信息工程與傳媒學(xué)院,安徽 合肥 230000)
隨著電子商務(wù)應(yīng)用群體的不斷增大,電子商務(wù)的群體數(shù)據(jù)的規(guī)模日益龐大,需要對電子商務(wù)群體用戶訪問數(shù)據(jù)完成優(yōu)化挖掘處理,根據(jù)電子商務(wù)群體用戶訪問數(shù)據(jù)的特征提取和模糊聚類結(jié)果,提高電子商務(wù)群體用戶訪問的準(zhǔn)確性和調(diào)度能力[1].相關(guān)的電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘方法在實(shí)現(xiàn)電子商務(wù)的優(yōu)化升級,提高電子商務(wù)的服務(wù)能力水平方面具有重要意義[2].電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘方法研究在電子商務(wù)的發(fā)展過程中發(fā)揮重要作用.
對電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘是建立在對電子商務(wù)群體用戶訪問數(shù)據(jù)的特征提取和融合分析基礎(chǔ)上,采用聯(lián)合組網(wǎng)特征分析,實(shí)現(xiàn)大數(shù)據(jù)時(shí)代電子商務(wù)群體用戶訪問數(shù)據(jù)特征提取和統(tǒng)計(jì)分析,提高信息化管理和電子商務(wù)信息的訪問水平[3].傳統(tǒng)方法中,對電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的方法主要有模糊聚類分析方法、粒子群挖掘方法、基于支持向量機(jī)算法的電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘方法等[4-6],構(gòu)建電子商務(wù)群體用戶訪問數(shù)據(jù)的融合聚類分析模型,結(jié)合自相關(guān)特征提取方法,實(shí)現(xiàn)電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘,其中,采用基于空間分塊特征采樣的數(shù)據(jù)挖掘方法,根據(jù)用戶訪問數(shù)據(jù)的統(tǒng)計(jì)特征量實(shí)現(xiàn)數(shù)據(jù)挖掘,該方法在電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的統(tǒng)計(jì)分析能力不好,融合聚類分析能力不強(qiáng)[7].在基于分組樣本檢測的多元數(shù)據(jù)特征重構(gòu)和挖掘方法中,該方法在大數(shù)據(jù)挖掘中存在收斂性不好和尋優(yōu)控制能力不強(qiáng)的問題[8].針對上述問題,本文提出基于粗糙集的電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘方法.首先構(gòu)建電子商務(wù)群體用戶訪問數(shù)據(jù)的信息跟蹤融合模型,然后通過空間欠采樣的方法實(shí)現(xiàn)電子商務(wù)群體用戶訪問數(shù)據(jù)的優(yōu)化聚類和信息融合分析,根據(jù)信息融合結(jié)果實(shí)現(xiàn)數(shù)據(jù)挖掘優(yōu)化,最后進(jìn)行仿真測試分析,該方法在提高電子商務(wù)群體用戶訪問和數(shù)據(jù)挖掘能力方面的優(yōu)越性能.
為了實(shí)現(xiàn)基于粗糙集的電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘,首先構(gòu)建電子商務(wù)群體用戶訪問數(shù)據(jù)融合模型,綜合考慮類內(nèi)不平衡參數(shù)分布[9],構(gòu)建電子商務(wù)群體用戶訪問的多元數(shù)據(jù)融合跟蹤識別模型,得到電子商務(wù)群體用戶訪問的模糊決策函數(shù)為
μ(n)=β[1-exp(α|e(n)|)],|e(n)|2>K,
(1)
式中,K為電子商務(wù)群體用戶訪問數(shù)據(jù)庫的檢測閾值,β為電子商務(wù)群體用戶訪問數(shù)據(jù)庫的關(guān)聯(lián)度水平集,e(n)為電子商務(wù)群體用戶訪問數(shù)據(jù)融合函數(shù).結(jié)合動(dòng)態(tài)尋優(yōu)方法,進(jìn)行電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘過程中相似度特征分析,得到異構(gòu)環(huán)境下電子商務(wù)群體用戶訪問數(shù)據(jù)的融合均方根誤差,結(jié)合相空間重構(gòu)方法,進(jìn)行電子商務(wù)群體用戶訪問數(shù)據(jù)特征重組和多維重構(gòu),提高電子商務(wù)群體用戶訪問數(shù)據(jù)的挖掘和特征提取能力.
建立電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的量化分析模型,建立稀疏化的電子商務(wù)群體用戶訪問數(shù)據(jù)分布式融合模型[10],得到電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的統(tǒng)計(jì)函數(shù)為
(2)
式中,φ(xi)為電子商務(wù)群體用戶訪問數(shù)據(jù)評價(jià)的約束指標(biāo)參量集,α為分布式融合系數(shù),ξi為用戶訪問數(shù)據(jù)集.建立電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的大數(shù)據(jù)統(tǒng)計(jì)特征分析模型,提取電子商務(wù)群體用戶訪問數(shù)據(jù)的統(tǒng)計(jì)特征量,用ω表示電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的有限特征分布項(xiàng),結(jié)合原始訓(xùn)練數(shù)據(jù)中的多維參數(shù)分布,在相鄰少數(shù)類鄰居節(jié)點(diǎn)中,得到電子商務(wù)群體用戶訪問數(shù)據(jù)的模糊粗糙特征集r,粗糙向量集的關(guān)聯(lián)規(guī)則分布為
(3)
基于粗糙向量集的關(guān)聯(lián)規(guī)則,建立電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的模糊決策函數(shù),在xi的k個(gè)少數(shù)類鄰居集中實(shí)現(xiàn)信息融合和空間結(jié)構(gòu)重組.
建立稀疏化的電子商務(wù)群體用戶訪問數(shù)據(jù)分布式融合模型,將生成的新樣本全部加入原始訓(xùn)練數(shù)據(jù)中,根據(jù)特征分布的聚類性實(shí)現(xiàn)對電子商務(wù)群體用戶訪問數(shù)據(jù)的準(zhǔn)確挖掘[11],電子商務(wù)群體用戶訪問數(shù)據(jù)的特征變量φ,使得粗糙集匹配的方法,得到電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的尋優(yōu)問題滿足
(4)
在合成樣本和其相鄰的父代樣本點(diǎn)之間,構(gòu)建電子商務(wù)群體用戶訪問數(shù)據(jù)的模糊聚類模型,得到電子商務(wù)群體用戶訪問數(shù)據(jù)的模糊聚類函數(shù).在模糊信息聚類中心,得到電子商務(wù)群體用戶的推薦量化特征,結(jié)合隸屬度集合分布,采用最優(yōu)解向量融合的方法,得到電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的算術(shù)平均值為
(5)
通過空間分塊聚類分析方法建立電子商務(wù)群體用戶訪問數(shù)據(jù)的粗糙集匹配特征分布模型,根據(jù)電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的遞歸分布[12],得到數(shù)據(jù)挖掘的量化回歸分析的迭代式描述如下
(6)
其中,?為電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的定量遞歸分析的特征值,S為隸屬度和非隸屬度的聯(lián)合估計(jì)值,且S≠0,γ為灰色關(guān)聯(lián)度加權(quán)系數(shù),構(gòu)建電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的分段樣本回歸分析模型.
假設(shè)m為電子商務(wù)群體用戶訪問數(shù)據(jù)的關(guān)聯(lián)度,得到電子商務(wù)群體用戶訪問數(shù)據(jù)的屬性分布集為p,對電子商務(wù)群體用戶訪問數(shù)據(jù)進(jìn)行信息重組,得到差異度函數(shù)為
(7)
式中,ε為電子商務(wù)群體用戶訪問數(shù)據(jù)采樣的統(tǒng)計(jì)特征量,η為電子商務(wù)群體用戶訪問數(shù)據(jù)自相關(guān)特征量.構(gòu)造樣本數(shù)據(jù)的粗糙集特征匹配模型,根據(jù)灰色關(guān)聯(lián)系數(shù)值得到粗糙集特征提取結(jié)果為
(8)
式中,Yi(t)為第t次迭代后的粗糙集特征量,Gi(t+1)為第t+1次迭代后的粗糙集關(guān)聯(lián)量,建立電子商務(wù)群體用戶訪問數(shù)據(jù)的互信息熵檢測模型.
通過空間分塊聚類分析方法建立電子商務(wù)群體用戶訪問數(shù)據(jù)的粗糙集匹配特征分布模型,得到子電子商務(wù)群體用戶訪問的聯(lián)合概率密度為
(9)
其中,h為電子商務(wù)群體用戶訪問數(shù)據(jù)的參考性量化特征匹配函數(shù).聯(lián)合公式(8)和公式(9)數(shù)據(jù)挖掘輸出過程如下.
首先,根據(jù)參考點(diǎn)來評估結(jié)果,實(shí)現(xiàn)用戶訪問數(shù)據(jù)的模糊聚類處理.
其次,結(jié)合電子商務(wù)群體用戶訪問的關(guān)聯(lián)密度信息融合,得到電子商務(wù)群體用戶訪問數(shù)據(jù)化管理的層次化分布函數(shù)為
(10)
其中,fn為電子商務(wù)群體用戶訪問數(shù)據(jù)分布的相關(guān)性特征量,由此得到電子商務(wù)群體用戶訪問數(shù)據(jù)的模糊信息聚類檢測統(tǒng)計(jì)特征量
(11)
最后,采用空間欠采樣的方法實(shí)現(xiàn)電子商務(wù)群體用戶訪問數(shù)據(jù)的優(yōu)化聚類和信息融合分析,根據(jù)信息融合結(jié)果實(shí)現(xiàn)數(shù)挖掘優(yōu)化[13].
整體流程如圖1所示.
圖1 電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘
為了驗(yàn)證本文方法在實(shí)現(xiàn)電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘中的應(yīng)用性能,進(jìn)行仿真測試分析,電子商務(wù)群體用戶訪問數(shù)據(jù)的測試樣本采集的長度為2000,訓(xùn)練數(shù)據(jù)的近鄰數(shù)k取值為 0.35,粗糙集特征匹配系數(shù)為0.23,樣本數(shù)據(jù)的實(shí)例集規(guī)模為150,根據(jù)上述參數(shù)設(shè)定,得到電子商務(wù)群體用戶訪問數(shù)據(jù)分布如圖2所示.
圖2 電子商務(wù)群體用戶訪問數(shù)據(jù)分布
以圖2的數(shù)據(jù)為測試集,實(shí)現(xiàn)電子商務(wù)群體用戶訪問數(shù)據(jù)的優(yōu)化挖掘,得到挖掘結(jié)果如圖3所示.
圖3 電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘結(jié)果
分析圖3得知,本文方法對電子商務(wù)群體用戶訪問數(shù)據(jù)的模糊聚類性較高,峰值輸出較為明顯,數(shù)據(jù)挖掘的收斂性測試如圖4所示.
圖4 數(shù)據(jù)挖掘的收斂性測試
分析圖4得知,本文方法的收斂性較好,測試數(shù)據(jù)挖掘的精度,得到對比結(jié)果見表1,分析表1得知,該方法對電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的精度較高.
表1 數(shù)據(jù)挖掘的精度對比
本文提出基于粗糙集的電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘方法.綜合考慮類內(nèi)不平衡參數(shù)分布,構(gòu)建電子商務(wù)群體用戶訪問的多元數(shù)據(jù)融合跟蹤識別模型,建立稀疏化的電子商務(wù)群體用戶訪問數(shù)據(jù)分布式融合模型.根據(jù)電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的遞歸分布,構(gòu)造樣本數(shù)據(jù)的粗糙集特征匹配模型,通過空間分塊聚類分析方法建立電子商務(wù)群體用戶訪問數(shù)據(jù)的粗糙集匹配特征分布模型,采用空間欠采樣的方法實(shí)現(xiàn)電子商務(wù)群體用戶訪問數(shù)據(jù)的優(yōu)化聚類挖掘.分析得知,本文方法實(shí)現(xiàn)電子商務(wù)群體用戶訪問數(shù)據(jù)挖掘的精度較高,收斂性和準(zhǔn)確性較好.