謝 鑫
(漳州職業(yè)技術(shù)學(xué)院)
隨著互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步和發(fā)展,電子商務(wù)系統(tǒng)為商戶(hù)和客戶(hù)帶來(lái)了大量的信息,各種基于電子商務(wù)的個(gè)性化服務(wù)也開(kāi)始由此形成,線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘成為研究的熱點(diǎn)話題,相關(guān)專(zhuān)家也相繼展開(kāi)了研究.從線上電商用戶(hù)自身角度出發(fā),用戶(hù)更加關(guān)心如何以更低的價(jià)格獲取最滿(mǎn)意的商品[1-2].從企業(yè)角度出發(fā),企業(yè)更加關(guān)注如何增加收益,制定用戶(hù)滿(mǎn)意的銷(xiāo)售方案,同時(shí)對(duì)企業(yè)的潛在客戶(hù)進(jìn)行優(yōu)化.國(guó)內(nèi)相關(guān)專(zhuān)家也針對(duì)該方面的內(nèi)容進(jìn)行了大量的研究,例如屠守中等將矩陣分解和標(biāo)簽傳播算法兩者進(jìn)行結(jié)合,同時(shí)將用戶(hù)劃分為兩種類(lèi)型,對(duì)用戶(hù)的興趣進(jìn)行提取和計(jì)算,最終實(shí)現(xiàn)用戶(hù)興趣挖掘[3].秦永彬等通過(guò)二次single-pass不完全聚類(lèi)算法進(jìn)行將用戶(hù)微博劃分為多個(gè)不同的簇,同時(shí)將簇進(jìn)行合并,并且采用LDA模型進(jìn)行建模,引入時(shí)間因子,最終獲取用戶(hù)興趣,實(shí)現(xiàn)興趣挖掘[4].但是上述方法無(wú)法獲取準(zhǔn)確的挖掘結(jié)果,所以提出一種基于數(shù)據(jù)特征提取的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘方法.仿真實(shí)驗(yàn)結(jié)果表明,所提方法可以獲取高精度高效率的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘結(jié)果.
1.1.1 線上電商用戶(hù)訪問(wèn)數(shù)據(jù)融合
為了更好實(shí)現(xiàn)線上電商用戶(hù)購(gòu)買(mǎi)力挖掘[5-6],需要優(yōu)先組建信息訪問(wèn)融合模型,由于類(lèi)內(nèi)數(shù)據(jù)一直處于分布不均勻的狀態(tài),所以還需要進(jìn)一步組建多元數(shù)據(jù)融合跟蹤識(shí)別模型,進(jìn)而獲取電商用戶(hù)的模糊決策函數(shù),如公式(1)所示:
μ(n)=β[1-exp(α|e(n))],|e(n)|2>K
(1)
式中,μ(n)代表模糊決策函數(shù);K代表數(shù)據(jù)庫(kù)的檢測(cè)閾值;β代表數(shù)據(jù)庫(kù)的關(guān)聯(lián)度水平;e(n)代表數(shù)據(jù)庫(kù)的融合函數(shù);α代表數(shù)據(jù)庫(kù)的分布式融合系數(shù).
1.1.2 電商用戶(hù)潛在購(gòu)買(mǎi)力分組檢測(cè)
構(gòu)建線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘的量化分析模型,同時(shí)還進(jìn)一步構(gòu)建分布式融合模型[7-8],最終得到以下形式的統(tǒng)計(jì)函數(shù)F,如公式(2)所示:
(2)
式中,φ(xi)代表數(shù)據(jù)庫(kù)的約束指標(biāo)參量集;ξ(i)代表用戶(hù)訪問(wèn)數(shù)據(jù)集.粗糙向量機(jī)對(duì)應(yīng)的關(guān)聯(lián)規(guī)則分布G可以表示為公式(3)的形式:
(3)
式中,ω代表電商用戶(hù)訪問(wèn)數(shù)據(jù)庫(kù)的有限特征項(xiàng)集合;xi代表訪問(wèn)數(shù)據(jù)的類(lèi)數(shù)據(jù)集;r代表類(lèi)節(jié)點(diǎn)數(shù)量.
1.1.3關(guān)聯(lián)特征提取
將全新形成的樣本加入到原始訓(xùn)練集中,為了后期獲取更加準(zhǔn)確的挖掘結(jié)果,結(jié)合粗糙集匹配方法[9-10],獲取數(shù)據(jù)挖掘?qū)?yōu)需要滿(mǎn)足的約束條件:
(4)
分析合成樣本和相鄰父節(jié)點(diǎn)之間的關(guān)系,以此為依據(jù),獲取訪問(wèn)數(shù)據(jù)集對(duì)應(yīng)的模糊聚類(lèi)函數(shù).同時(shí)根據(jù)模糊聚類(lèi)函數(shù),可以獲取最優(yōu)解向量融合方式,同時(shí)計(jì)算線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘的平均值H,如公式(5)所示:
(5)
式中,σ代表數(shù)據(jù)挖掘結(jié)果的方差.
通過(guò)以上分析,對(duì)線上電商用戶(hù)的潛在購(gòu)買(mǎi)力進(jìn)行關(guān)聯(lián)特征提取[11-12](如圖1所示),具體的計(jì)算式為:
圖1 線上電商用戶(hù)潛在購(gòu)買(mǎi)力關(guān)聯(lián)特征提取流程圖
(6)
式中,J代表線上電商用戶(hù)潛在購(gòu)買(mǎi)力的關(guān)聯(lián)特征提取結(jié)果.
設(shè)定共對(duì)N個(gè)線上電商用戶(hù)進(jìn)行潛在購(gòu)買(mǎi)力挖掘,每個(gè)用戶(hù)的潛在購(gòu)買(mǎi)能力并不是固定的,所以可以通過(guò)以下矩陣Ft對(duì)用戶(hù)的行為特征進(jìn)行描述:
(7)
式中,hi,j代表線上電商用戶(hù)的潛在購(gòu)買(mǎi)特征.
對(duì)于觀測(cè)的線上電商用戶(hù)而言,可以獲取線上電商用戶(hù)潛在購(gòu)買(mǎi)力,具體計(jì)算式如下:
(8)
式中,HDii代表線上電商用戶(hù)潛在購(gòu)買(mǎi)力計(jì)算結(jié)果;ωij代表用戶(hù)在t時(shí)間段的購(gòu)買(mǎi)能力;hij代表用戶(hù)在t時(shí)間段的權(quán)重取值.
選取合適的閾值,可以對(duì)線上用戶(hù)的線上電商用戶(hù)潛在購(gòu)買(mǎi)力進(jìn)行等級(jí)劃分,具體的計(jì)算式為:
(9)
式中,HSij代表線上電商用戶(hù)潛在購(gòu)買(mǎi)力劃分結(jié)果.
在對(duì)線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘過(guò)程中,需要設(shè)定多個(gè)參數(shù),不同參數(shù)的取值是完全不同的.需要借助熵權(quán)決策法對(duì)提取到的特征進(jìn)行計(jì)算,進(jìn)而選取合適的權(quán)重取值,詳細(xì)的操作步驟如下所示:
(1)在實(shí)際問(wèn)題中,需要優(yōu)先組建m個(gè)樣本n個(gè)評(píng)價(jià)指標(biāo)的判斷矩陣R,具體如公式(10)所示.
(10)
(2)將判斷矩陣進(jìn)行歸一化處理,進(jìn)而獲取以下形式的歸一化矩陣B,如公式(11)所示:
(11)
(3)通過(guò)熵的定義,可以確定特征向量對(duì)應(yīng)的熵值為:
(12)
式中,hx、hy和hz分別代表不同的參數(shù).
針對(duì)自然對(duì)數(shù)而言,需要設(shè)定熵的定義,假設(shè)不符合實(shí)際情況,則需要借助以下公式進(jìn)行計(jì)算:
(13)
式中,fij代表第i個(gè)特征值對(duì)應(yīng)的熵值.
(4)計(jì)算不同線上電商用戶(hù)潛在購(gòu)買(mǎi)力關(guān)聯(lián)特征對(duì)應(yīng)的權(quán)重值,如公式(14)所示:
(14)
式中,ωi代表綜合熵值.
通過(guò)熵值計(jì)算結(jié)果選擇合適的權(quán)值,同時(shí)計(jì)算不同線上電商用戶(hù)的潛在購(gòu)買(mǎi)力[14-15],通過(guò)購(gòu)買(mǎi)能力進(jìn)行等級(jí)劃分,最終實(shí)現(xiàn)電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘.
為了驗(yàn)證所提基于數(shù)據(jù)特征提取的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘方法的應(yīng)用性能,需要進(jìn)行仿真實(shí)驗(yàn)測(cè)試分析.通過(guò)相關(guān)參數(shù)設(shè)定,獲取線上電商用戶(hù)數(shù)據(jù)分布情況,如圖2所示.
圖2 線上電商用戶(hù)數(shù)據(jù)分布情況
采用圖3對(duì)所提方法的收斂性能進(jìn)行測(cè)試:
分析圖3中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法具有較好的收斂性能.
圖3 線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘的收斂性能測(cè)試結(jié)果
為了進(jìn)一步驗(yàn)證所提方法的性能,以下實(shí)驗(yàn)測(cè)試將召回率作為測(cè)試指標(biāo).其中,當(dāng)召回率的取值在95%以上,則說(shuō)明其具有比較好的挖掘能力.詳細(xì)的實(shí)驗(yàn)測(cè)試結(jié)果如圖4所示.
分析圖4中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法具有較高的召回率,充分說(shuō)明所提方法可以獲取比較滿(mǎn)意的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘結(jié)果.
圖4 召回率測(cè)試結(jié)果分析
以下對(duì)線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘精度進(jìn)行測(cè)試,重點(diǎn)對(duì)使用所提方法前后的挖掘精度進(jìn)行測(cè)試分析,測(cè)試結(jié)果見(jiàn)表1.
表1 使用所提方法前后的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘精度測(cè)試結(jié)果分析
分析表1中的實(shí)驗(yàn)數(shù)據(jù)可知,在使用所提方法進(jìn)行線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘后,挖掘精度相比之前得到有效提升,全面驗(yàn)證了所提方法的優(yōu)越性.
以下對(duì)實(shí)驗(yàn)測(cè)試進(jìn)一步分析所提方法的挖掘效率變化情況,選取傳統(tǒng)方法作為對(duì)比方法,詳細(xì)的實(shí)驗(yàn)測(cè)試結(jié)果如圖5所示.
分析圖5中的實(shí)驗(yàn)數(shù)據(jù)可知,隨著測(cè)試樣本數(shù)量的持續(xù)增加,傳統(tǒng)方法的挖掘效率呈直線下降趨勢(shì).而所提方法的挖掘效率則處于比較穩(wěn)定的狀態(tài),充分說(shuō)明所提方法可以以更快的速度完成線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘.
圖5 不同方法的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘效率對(duì)比
利用表2給出使用所提方法前后的挖掘成本變化情況.
表2 使用所提方法前后的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘成本測(cè)試結(jié)果分析
分析表2中的實(shí)驗(yàn)數(shù)據(jù)可知,在使用所提方法進(jìn)行線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘后,挖掘成本相比之前得到有效降低,有效驗(yàn)證了所提方法的優(yōu)越性.
網(wǎng)絡(luò)技術(shù)以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,線上電子商務(wù)中的線上電商用戶(hù)潛在購(gòu)買(mǎi)力數(shù)據(jù)必將得到更好的挖掘處理,同時(shí)數(shù)據(jù)中隱藏的價(jià)值也將得到更加充分的利用.從數(shù)據(jù)特征挖掘的角度出發(fā),提出一種基于數(shù)據(jù)特征提取的線上電商用戶(hù)潛在購(gòu)買(mǎi)力挖掘方法.所提方法可以準(zhǔn)確挖掘用戶(hù)的潛在購(gòu)買(mǎi)能力,還能夠有效提升挖掘效率,以更低的成本完成挖掘,同時(shí)可以為商務(wù)決策提供有效的數(shù)據(jù)支持,全面推進(jìn)電子商務(wù)的發(fā)展.
哈爾濱師范大學(xué)自然科學(xué)學(xué)報(bào)2022年3期