高 華(大連藝術(shù)學(xué)院,遼寧 大連 116600)
?
一種電子商務(wù)協(xié)同過濾推薦算法
高 華
(大連藝術(shù)學(xué)院,遼寧 大連 116600)
摘 要:依據(jù)當(dāng)前社會(huì)發(fā)展趨勢及電子商務(wù)發(fā)展要求,設(shè)計(jì)了一種以用戶偏好挖掘?yàn)榛A(chǔ)的電子商務(wù)協(xié)同過濾推薦算法。此算法將用戶隱性及顯性偏好知識,運(yùn)用用戶偏好挖掘技術(shù)進(jìn)行深入挖掘剖析,促進(jìn)以用戶偏好知識的智能推薦及最近鄰居社區(qū)的構(gòu)建得以實(shí)現(xiàn)。從本次研究的實(shí)驗(yàn)結(jié)果顯示,此種算法在預(yù)期效果上比較理想,對于協(xié)同過濾推薦的準(zhǔn)確性和質(zhì)量具有顯著提升效果。
關(guān)鍵詞:用戶偏好挖掘;電子商務(wù);協(xié)同過濾推薦算法
首先,用戶相似度計(jì)算。張堯等[1]通過運(yùn)用AVD方法,對用戶的評分?jǐn)?shù)據(jù)特征進(jìn)行降維處理,對不同用戶之間所具有的潛在語義予以獲取,并以此為基礎(chǔ),計(jì)算用戶的相似度,運(yùn)用此種方法,對協(xié)同過濾推薦系統(tǒng)的處理準(zhǔn)確性及效率給與提升;扈中凱等[2]提出以知識處理機(jī)制為基礎(chǔ)的用戶相似度計(jì)算,對定性知識轉(zhuǎn)換及表示采用云模型予以完成,針對傳統(tǒng)用戶相似度計(jì)算方法方面所存在的不足進(jìn)行解決,促使以云模型為基礎(chǔ)的協(xié)同過濾推薦的實(shí)現(xiàn)。其次,用戶信任計(jì)算。楊芳等[3]提出以信任為基礎(chǔ)的協(xié)同過濾推薦方法,開展推薦服務(wù)主要依據(jù)用戶之間所存在的一種信任關(guān)系,以此達(dá)到推薦服務(wù)的效率及質(zhì)量的不斷提升。最后,用戶偏好計(jì)算分析。方耀寧等提出以多目標(biāo)優(yōu)化雙聚類為基礎(chǔ)的協(xié)同過濾方法,通過將用戶注冊時(shí)所填寫信息進(jìn)行深入分析,對用戶的具體需求及偏好予以獲取,以此為基礎(chǔ)采取具有針對性的項(xiàng)目推薦活動(dòng)。以用戶偏好為基礎(chǔ)的協(xié)同過濾推薦方法,不僅可以依據(jù)用戶所存在的實(shí)際需求及偏好,將與之相適應(yīng)的商品及資源向用戶進(jìn)行提供,其為在互聯(lián)網(wǎng)使用當(dāng)中所存在的信息過載問題給與了很好的技術(shù)保證及輔助支撐。但是推薦系統(tǒng)所常使用的用戶偏好信息大的黃匡,多數(shù)均為針對用戶的顯性偏好所設(shè)置,比如用戶所進(jìn)行的投票及評分等內(nèi)容,然而針對用戶所存在的隱性的相關(guān)偏好信息卻沒有予以考慮,諸如用戶的購買動(dòng)機(jī)及在商品頁面所停留的時(shí)間等;與此同時(shí),伴隨時(shí)間的推動(dòng)以及用戶在具體認(rèn)知上的不斷變動(dòng),用戶所存在的偏好信息也會(huì)發(fā)生改變,因此,這就需要充分運(yùn)用推薦系統(tǒng),對用戶可能產(chǎn)生的需求變化進(jìn)行相應(yīng)的預(yù)測。對用戶的偏好信息進(jìn)行更為深層次的剖析,特別是那些所存在的隱性信息及可能變遷的信息,對用戶需求及偏好進(jìn)行及時(shí)掌握,以此達(dá)到推薦系統(tǒng)效率及服務(wù)質(zhì)量的不斷提升。
2.1用戶偏好挖掘
(1)顯性偏好知識的挖掘。針對挖掘顯性偏好知識,當(dāng)用戶對一些網(wǎng)頁進(jìn)行瀏覽時(shí),其將用戶的評論信息及文本信息等作為挖掘?qū)ο?;本文針對用戶顯性偏好信息相應(yīng)的挖掘和分析,主要采用K-means聚類算法予以完成,對用戶所具有的偏好知識類簇給與獲取??蓪⒂脩麸@性偏好信息進(jìn)行采集,對其實(shí)施數(shù)據(jù)預(yù)處理,當(dāng)處理完畢后,將所形成的文本文檔集進(jìn)行設(shè)置,本次研究對用戶顯性偏好知識挖掘主要步驟如下:對初始類簇進(jìn)行構(gòu)建,將在D當(dāng)中的全部文檔,均將其作為單個(gè)初始用戶相應(yīng)的偏好類別形式;然后將任意類別相應(yīng)的差別方面的相似度),(jiccsim給與計(jì)算,將所設(shè)定的閥值ε給與利用,優(yōu)化和合并初始類簇,即獲取對最大相似度類別當(dāng) max>ε時(shí),可以合并ci和cj,并將新類別ck=ci∪cj給與最終形成;當(dāng) max<ε時(shí),那么就將 ci和cj相應(yīng)的類別進(jìn)行深入保持,并將D給與新的子類簇進(jìn)行劃分;然后,將上述當(dāng)中,所得子類簇C,運(yùn)用K-means算法,對相應(yīng)初始聚類中心的種子集給與獲取,將di到si相應(yīng)相似度sim(di, si)進(jìn)行計(jì)算,然后將di納入至聚類中心si相應(yīng)類別ci當(dāng)中,然后可將最終的聚類結(jié)果予以獲取。
(2)隱性偏好知識的挖掘。當(dāng)用戶對電子商務(wù)網(wǎng)站進(jìn)行瀏覽時(shí),其中所存在的許多動(dòng)作都能對用戶所存在的偏好給與暗示,比如在實(shí)際的Web頁面當(dāng)中,用戶所進(jìn)行的點(diǎn)擊量、訪問次數(shù)及停留時(shí)間等。本文針對用戶的隱性偏好知識,在具體的相似性方面急性綜合計(jì)算,分別采用簇間相似度及序列簇內(nèi)相似度給與完成,采用 K-中心聚集的算法形式,對所存在的單一頁面的用戶偏好知識進(jìn)行挖掘。然后依據(jù)以往研究經(jīng)驗(yàn),對在網(wǎng)絡(luò)社交當(dāng)中,依據(jù)用戶自身所存在的興趣,所設(shè)計(jì)的相應(yīng)數(shù)據(jù)挖掘處理方法,將所收集到的用戶自身隱性偏好信息實(shí)施相應(yīng)的處理操作,最終將用戶行為序列集予以獲取,將初始簇?cái)?shù)設(shè)置為 k,對行為簇內(nèi)相似度進(jìn)行計(jì)算:
公式當(dāng)中,ki所代表的是當(dāng)簇?cái)?shù)為k時(shí),在相應(yīng)的聚類模式當(dāng)中,其就是其中的第i個(gè)簇,而Sw(ki)所代表的是,在第i個(gè)簇內(nèi)的平均相似度。針對簇間及簇內(nèi)相似度的計(jì)算來講,其具體的計(jì)算公式為:
在公式當(dāng)中,Sb(ki,kj)所代表的是在行為序列簇i與簇j之間所存在的組間相似度。通過挖掘分析用戶的行為數(shù)據(jù),從中對用戶內(nèi)含的需求及偏好予以獲取,還可根據(jù)用戶所使用的具體界面狀況,依據(jù)瀏覽當(dāng)中所使用的具體使用及點(diǎn)擊量,預(yù)測用戶所可能擁有或存在的偏好變遷,對于用戶還沒有對某些商品進(jìn)行評價(jià)來講,可以根據(jù)用戶以往的評價(jià)內(nèi)容及所具有的顯性偏好狀況,對所需要的內(nèi)容進(jìn)行預(yù)測和深入分析,最終便可將用戶的隱性偏好知識予以獲取。
以上述處理方法可知,針對用戶偏好空間矩陣的構(gòu)建,可運(yùn)用加權(quán)關(guān)鍵詞矢量模型的方法予以完成,即:
公式中,ik所代表的是,在用戶所用偏好當(dāng)中的第k個(gè)偏好類型,而kω所代表的是,用戶在偏好類型當(dāng)中的第k個(gè)。
2.2最近鄰居社區(qū)的形成
針對電子商務(wù)協(xié)同過濾推薦來講,其在具體的環(huán)節(jié)方面,對目標(biāo)用戶相應(yīng)的最近鄰居給與準(zhǔn)確定位,然而通過對用戶之間的相似性進(jìn)行計(jì)算,才能對最近鄰居進(jìn)行確定,通常情況下比較常用的方法為
(1)Pearson相似性。其所具有的計(jì)算公式:
式中,P所代表的是評分項(xiàng)目集合,而商品項(xiàng)目a所具有的評分,采用Ra,u進(jìn)行表示,而所代表的是平均評分。
(2)余弦相似性。將用戶u和v,根據(jù)n維項(xiàng)目空間當(dāng)中所存在的位置狀況,設(shè)計(jì)為m、n,以此,就可將用戶在u和v之間相似性給與表示,即:
修正的余弦相似性。此種相似性,充分考量了不同用戶所存在的各種評分方式給,公式如下:
式中,pv,u所代表的是評分項(xiàng)目集合,而Pu及Pv所代表的是,用戶在具體的u及v之間,所得出的評分過的項(xiàng)目集合,Ra,u所代表的是商品a所存在的的具體評分狀況,所代表的是平均評分。
本文基于修正的余弦相似性,在用戶相似度計(jì)算當(dāng)中將用戶偏好知識融入其中,公式為:
式中,UPSuv所代表的是用戶u和v共同使用的偏好類型集合,UPSu代表的是用戶u的偏好類型集合,而UPSv所代表的是用戶v的相應(yīng)偏好類型集合,ωi,u所代表的是用戶u在偏好類型 i上相對應(yīng)的權(quán)值,而ωi,v所代表的是用戶v在相應(yīng)偏好類型i上所具有的權(quán)值而及對用戶相應(yīng)u和v相應(yīng)偏好類型所具有的平均權(quán)值。
在用戶內(nèi)在的空間中,將隨機(jī)兩用戶之間相似度給與計(jì)算,滿足其在用戶聚類所具有的閥值φ,最終便可在最近鄰居社區(qū)當(dāng)中,得出相似或者相同的偏好類型。
2.3智能推薦
所謂智能推薦,就是依據(jù)修正的余弦相似性,所建立的最近鄰居社區(qū),將商品項(xiàng)目通過推薦操作改變?yōu)槟繕?biāo)用戶。首先,可將等待推薦的目標(biāo)用戶,采用m給與設(shè)置,并將其相似度設(shè)為sim。對于搜索目標(biāo)用戶m最近鄰居用戶來講,可采用用戶偏好空間UPS給與表示,最終將與m相同或相似的最近鄰居集合給與得出,然而對于偏好類型i來講,其UPS1與m之間所存在的相似性sim(m,UPS1)往往最高,以此進(jìn)行類推。對于UPSmi當(dāng)中的各個(gè)用戶,用戶各個(gè)偏好信息可進(jìn)行相應(yīng)加權(quán)平均操作,對目標(biāo)用戶相應(yīng)需求及偏好進(jìn)行預(yù)測,公式為:
公式當(dāng)中,ωi,u所代表的是對用戶u相應(yīng)的偏好類型i的具體權(quán)值,其中,sim(m,u)所代表的是用戶m與u之間所存在的相似度,和所代表的是相應(yīng)的平均權(quán)值。利用上述公式,將所要預(yù)測的需求和偏好最高的相應(yīng)前n項(xiàng)進(jìn)行計(jì)算,最終向目標(biāo)用戶將Top-N給與推薦。
本文將用戶偏好挖掘技術(shù),在具體的協(xié)同過濾推薦當(dāng)中給與有效融入,并以此建立以用戶偏好挖掘?yàn)榛A(chǔ),在電子商務(wù)中給與運(yùn)用的協(xié)同過濾推薦算法,針對此算法,與傳統(tǒng)的協(xié)同過濾推薦算法相比較,其最大特點(diǎn)在于對用戶的相似性進(jìn)行計(jì)算過程中,不僅對顯性偏好信息進(jìn)行計(jì)算,而且還對隱性偏好信息進(jìn)行計(jì)算,通過對二者信息的充分挖掘,然后對于用戶存在相似性的偏好知識進(jìn)行計(jì)算,最終促進(jìn)以用戶偏好知識為基礎(chǔ)的最近鄰居社區(qū)機(jī)制的形成,并基于此,針對用戶的實(shí)際需求進(jìn)行相應(yīng)的智能推薦操作。
參考文獻(xiàn):
[1]張堯,馮玉強(qiáng). 數(shù)據(jù)稀疏環(huán)境下基于用戶主題偏好的協(xié)同過濾算法[J]. 運(yùn)籌與管理,2014(02):145-152.
[2]扈中凱,鄭小林,吳亞峰,等. 基于用戶評論挖掘的產(chǎn)品推薦算法[J]. 浙江大學(xué)學(xué)報(bào):工學(xué)版,2013(08):1475-1485.
[3]楊芳. 電子商務(wù)系統(tǒng)協(xié)同過濾推薦算法研究[D]. 天津: 河北工業(yè)大學(xué),2006.
(責(zé)任編輯:吳 芳)
中圖分類號:F724.6
文獻(xiàn)標(biāo)識碼:A
doi:10.3969/j.issn.1672-7304.2016.01.053
文章編號:1672–7304(2016)01–0111–03
作者簡介:高華(1975-),女,遼寧大連人,副教授,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)與電子商務(wù)。
A collaborative filtering recommendation algorithm e-commerce
GAO Hua
(Dalian Institute of art, Liaoning Dalian 116600)
Abstract:On the basis of the current trend of social development and the requirement of e-commerce development, we design a user preference mining based e-commerce collaborative filtering recommendation algorithm. This algorithm will be user's recessive and dominant knowledge, using the user preferences deeply analyzes mining mining technology, to promote to the user preference knowledge of intelligent recommendation and neighbor community building recently. From the experimental results of this research shows that this algorithm on the expected effect is more ideal, for collaborative filtering recommendation accuracy and quality have a significant boost effect.
Keywords:Mining user preferences; e-commerce; collaborative filtering algorithm