国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合位置相似性度量的快消品電商網(wǎng)站推薦算法

2018-01-29 03:29王晨陽劉垣郭李華肖琳
關(guān)鍵詞:消品余弦相似性

王晨陽, 劉垣, 郭李華, 肖琳

(福建工程學(xué)院 信息科學(xué)與工程學(xué)院, 福建 福州 350118)

近年來,互聯(lián)網(wǎng)快消品市場迅速發(fā)展,涌現(xiàn)出一大批快消品電商網(wǎng)站,如阿里1688零售通、京東掌柜寶、掌合天下、惠民網(wǎng)、易酒批、便利寶、進(jìn)貨寶等??煜冯娚叹W(wǎng)站主要為廣大下游便利店提供一站式的采購進(jìn)貨服務(wù),所以它的用戶通常就是便利店。面對海量的信息,高效的推薦算法無疑將對快消品電商網(wǎng)站的成功起到至關(guān)重要的作用,它能夠在信息過載的環(huán)境中幫助用戶發(fā)現(xiàn)他們感興趣的物品[1]。協(xié)同過濾推薦系統(tǒng)是一個(gè)已經(jīng)在電子商務(wù)系統(tǒng)中廣泛應(yīng)用的一種個(gè)性化推薦算法[2]。該方法首先找到和目標(biāo)用戶興趣相似的用戶集合,然后根據(jù)這個(gè)集合的評分?jǐn)?shù)據(jù)向目標(biāo)用戶推薦商品。算法的關(guān)鍵是用戶的興趣相似性度量準(zhǔn)則。對用戶相似性度量準(zhǔn)則的研究有很多,如文獻(xiàn)[1-2]在計(jì)算用戶相似性度量中引入了位置信息,但是位置信息只是作為商品的一個(gè)屬性,對推薦的作用較弱;文獻(xiàn)[3]將位置信息聚類為位置簇,雖然強(qiáng)化了位置信息的推薦作用,但位置之間的距離所產(chǎn)生的推薦意義沒有融入到推薦模型中。在快消品電商領(lǐng)域,因?yàn)榭煜返牧魍ň哂袇^(qū)域的相似性,因此地理位置較近的便利店,他們的興趣相似度也會相應(yīng)更高。本文提出一種融合位置相似性度量的協(xié)同過濾推薦算法,根據(jù)用戶的位置以及位置之間的距離算出用戶的位置相似度,再與用戶的興趣相似性加權(quán)得到一個(gè)新的用戶相似度,最后在一個(gè)真實(shí)的快消品電商網(wǎng)站數(shù)據(jù)集上驗(yàn)證了該算法的可行性。

1 傳統(tǒng)的用戶興趣相似性度量方法

基于用戶的協(xié)同過濾推薦算法是推薦系統(tǒng)中最古老的算法,包括2個(gè)步驟:1)找到與目標(biāo)用戶興趣相似的最近鄰居集合;2)根據(jù)最近鄰居集合中用戶對商品的評分向目標(biāo)用戶進(jìn)行推薦。其中步驟1)的關(guān)鍵是用戶相似性的計(jì)算方法。最常用的有Jaccard相似性、余弦相似性、修正余弦相似性和相關(guān)相似性[4-6]。

1.1 Jaccard相似性

給定用戶u和v,令N(u)表示用戶u有過評分的商品集合,N(v)表示用戶v有過評分的商品集合。利用Jaccard公式計(jì)算用戶u和v之間的相似度,Jaccard系數(shù)定義為N(u)與N(v)交集的大小與N(u)、N(v)并集的大小比值,定義如下。

(1)

1.2 余弦相似性

給定用戶u和v,令A(yù)和B表示用戶u和v對n個(gè)商品的評分向量。使用兩個(gè)向量之間夾角的余弦值度量用戶間的相似性。公式如下:

(2)

1.3 修正的余弦相似性

余弦相似性度量未考慮到用戶評分尺度問題,如在評分區(qū)間[1-5]的情況下,對用戶i來說評分3以上就是自己喜歡的,而對于用戶j,評分4以上才是自己喜歡的。通過減去用戶對商品的平均評分,修正的余弦相似性改善了用戶評分尺度偏好問題。給定用戶u和v,令I(lǐng)表示所有商品的集合,Ru和Rv分別表示用戶u和v對商品的平均評分值,Ru,i和Rv,i分別表示用戶u和v對商品i的評分,如果用戶u對商品i沒有評分,則Ru,i=0。使用修正余弦相似性度量用戶u和用戶v之間的相似性,公式如下。

(3)

1.4 相關(guān)相似性

(4)

2 融合位置相似性度量的推薦模型設(shè)計(jì)

2.1 模型概述

融合位置相似性度量的協(xié)同過濾推薦算法(collaborative filtering recommendation algorithm with the fusion of location similarity measurement,CF-FLSM)的推薦流程如圖1。算法分為3步:第1步:根據(jù)目標(biāo)用戶的位置搜索出周邊的用戶集合near(N),即距離最近的用戶集合,以縮小用戶范圍;第2步:

圖1 CF-FLSM的推薦流程Fig.1 Recommendation process of CF-FLSM

在第1步中搜索出來的用戶集合near(N)中,結(jié)合用戶歷史行為利用余弦相似性計(jì)算出用戶之間的興趣相似性,結(jié)合用戶的位置信息算出用戶之間的位置相似性;第3步:按照適當(dāng)?shù)臋?quán)重將用戶之間的興趣相似性和位置相似性進(jìn)行合并處理,得到一個(gè)新的用戶相似性,用于產(chǎn)生最終的推薦結(jié)果。

2.2 用戶位置相似性度量方法

本文分析了某快消品電商網(wǎng)站在福州地區(qū)的注冊用戶(因?yàn)榭煜冯娚叹W(wǎng)站服務(wù)的對象是便利店,所以這里的用戶就是便利店)的歷史采購進(jìn)貨記錄。圖2是該地區(qū)注冊用戶的地理位置分布圖。

隨機(jī)選定N(本文實(shí)驗(yàn)過程中N取100)個(gè)用戶,分別計(jì)算出與目標(biāo)用戶距離(單位:km)[0,1]、(1,2]、(2,3]、(3,5]、(5,8]、(8,10]內(nèi)的用戶有過共同評分商品的平均數(shù)量,得出的具有共同評分的商品數(shù)量與用戶之間距離的關(guān)系如圖3所示。

圖2 注冊用戶的地理分布圖Fig.2 Geographic distribution map of registered users

圖3 興趣相似性與距離的關(guān)系 Fig.3 Relationship between interest similarity and distance

從圖3可知,用戶之間共同評分的商品數(shù)量與用戶之間的距離成反比。這說明在同一地區(qū)內(nèi),用戶之間的偏好相似度對用戶之間的距離是敏感的,這也符合快消品電商市場銷售的現(xiàn)狀。因此,本文提出如下度量方法計(jì)算用戶之間的位置相似性:

(5)

2.3 加權(quán)合并處理

將用戶位置相似性度量融合到傳統(tǒng)的用戶興趣相似性度量,兩者進(jìn)行加權(quán)合并處理得出一個(gè)新的用戶相似性。

(6)

其中λ表示sim(u,v)dis的權(quán)重,可以根據(jù)實(shí)際情況適當(dāng)調(diào)整λ的值。

2.4 推薦過程

算出用戶之間的相似度后,可以根據(jù)與目標(biāo)用戶興趣最相似的K個(gè)用戶向目標(biāo)用戶推薦商品。首先可利用以下公式預(yù)測出目標(biāo)用戶對與目標(biāo)用戶最相似的K個(gè)用戶有過評分但目標(biāo)用戶未曾評分的商品的評分預(yù)測值。

(7)

其中,S(u,k)是根據(jù)公式(6)計(jì)算出的與目標(biāo)用戶u興趣最相似的K個(gè)用戶的集合,N(i)是對商品i有過評分的用戶集合,sim(u,v)為用戶u和用戶v的相似度;Rv,i為用戶v對物品i的評分。

最后將評分預(yù)測值最高的前Top-N項(xiàng)商品向目標(biāo)用戶做推薦。

3 實(shí)驗(yàn)

3.1 實(shí)驗(yàn)數(shù)據(jù)

選取某快消品電商網(wǎng)站在福州地區(qū)的2016年真實(shí)數(shù)據(jù)來驗(yàn)證上面提出的算法。該數(shù)據(jù)集在該地區(qū)的每個(gè)用戶都維護(hù)一個(gè)固定的地位經(jīng)緯度坐標(biāo),各項(xiàng)數(shù)據(jù)統(tǒng)計(jì)值如表1所示。

表1 實(shí)驗(yàn)數(shù)據(jù)集Tab.1 Experimental dataset

將數(shù)據(jù)集按照用戶對商品評分的時(shí)間倒序排序選取20%作為測試集,剩下的80%作為訓(xùn)練集。并隨機(jī)選擇test_U家用戶作為測試用戶,在訓(xùn)練集上計(jì)算用戶的相似性,最后在測試集上分別對每個(gè)測試用戶進(jìn)行商品推薦預(yù)測。

3.2 評測指標(biāo)

網(wǎng)站在做商品推薦時(shí),通常是為用戶提供一個(gè)個(gè)性化的推薦欄目,就是推薦系統(tǒng)里的Top-N推薦。對Top-N推薦結(jié)果進(jìn)行評測的指標(biāo)通常是采用準(zhǔn)確率和召回率。

準(zhǔn)確率評測的是最終的推薦結(jié)果中有多少比例是正確推薦的。

(8)

召回率評測的是推薦正確的商品占實(shí)際用戶喜歡的商品集合的多少。

(9)

其中U為測試用戶集合,就是3.1節(jié)中隨機(jī)選擇的測試用戶數(shù)test_U;R(u)表示對測試用戶u在測試集上的推薦商品集合;T(u)為測試用戶u在測試集上實(shí)際喜歡的商品集合。

3.3 實(shí)驗(yàn)結(jié)果

在CF-FLSM和CF的實(shí)驗(yàn)過程中,測試用戶數(shù)test_U取值為50,用戶最近鄰的數(shù)目near_N取值為200,用戶之間的位置相似性度量權(quán)重λ取值為0.5,在推薦商品數(shù)目Top-N的不同取值下,分別算出測試用戶集的平均準(zhǔn)確率和召回率如表2、表3所示。

表2 CF-FLSM的推薦結(jié)果Tab.2 Recommendation results of CF-FLSM

表3 CF的推薦結(jié)果Tab.3 Recommendation results of CF

兩者的實(shí)驗(yàn)結(jié)果的比較如圖4所示,本文提出的CF-FLSM相對于傳統(tǒng)的協(xié)同過濾算法,準(zhǔn)確率和召回率分別提高了3.74%和3.91%。

圖4 CF-FLSM和CF的實(shí)驗(yàn)結(jié)果對比圖 Fig.4 Comparison of experimental results of CF-FLSM and CF

4 結(jié)論

調(diào)研國內(nèi)眾多知名快消品電商平臺,其注冊用戶通常是便利店,而便利店都有一個(gè)固定的地理位置。本文提出的融合位置相似性度量的協(xié)同過濾(CF-FLSM)推薦算法,能夠有效利用位置以及位置之間的距離信息,從而提高快消品電商平臺商品推薦的準(zhǔn)確率和召回率。但是CF-FLSM在推薦的過程中并未考慮時(shí)間的因素,而快消品的流通活躍度通常和季節(jié)有關(guān),比如啤酒飲料在夏季會相對比較活躍,而白酒紅酒在冬季會相對比較活躍。在快消品電商網(wǎng)站推薦算法中加入時(shí)間維度,是將來的研究方向。

[1] 申園園,余文.一種基于位置服務(wù)信息的移動推薦模型[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(12):203-206.

[2] 王付強(qiáng),彭甫镕,丁小煥,等.基于位置的非對稱相似度量的協(xié)同過濾推薦算法[J].計(jì)算機(jī)應(yīng)用,2016,36(1):171-174,180.

[3] 鄭慧,李冰,陳冬林,等.基于位置簇的移動生活服務(wù)個(gè)性化推薦技術(shù)[J].計(jì)算機(jī)應(yīng)用,2015,35(4):1148-1153.

[4] 項(xiàng)亮.推薦系統(tǒng)實(shí)踐[M].北京:人民郵電出版社,2012:45-64.

[5] 李春,朱珍民,高曉芳,等.基于鄰居決策的協(xié)同過濾推薦算法[J].計(jì)算機(jī)工程,2010,36(13):34-39.

[6] 彭德巍,胡斌.一種基于用戶特征和時(shí)間的協(xié)同過濾算法[J].武漢理工大學(xué)學(xué)報(bào),2009,31(3):24-28.

[7] 馬胡雙,石永革,高勝保.基于特征增益與多級優(yōu)化的協(xié)同過濾個(gè)性化推薦算法[J].科學(xué)技術(shù)與工程,2016,16(21):272-277.

[8] 張春永,陳群.一種基于LBS的移動個(gè)性化推薦系統(tǒng)[J].科學(xué)技術(shù)與工程,2011,11(30):7439-7442,7447.

[9] Cacheda F, Formoso V, Femandez D, et al. Comparison of collaborative filtering algorithms: limitations of current techniques and proposals for scalable, high-performance recommender systems[J]. ACM Transactions on the Web,2011,5(1):1-33.

[10] Liu H, Hu Z, Mian A, et al. A new user similarity model to improve the accuracy of collaborative filtering[J].Knowledge-Based Systems,2014,56(3):156-166.

猜你喜歡
消品余弦相似性
一類上三角算子矩陣的相似性與酉相似性
淺析當(dāng)代中西方繪畫的相似性
讓圖片新聞不再是“快消品”
兩個(gè)含余弦函數(shù)的三角母不等式及其推論
大潤發(fā)首超沃爾瑪成為快消品生產(chǎn)商心中最佳零售商
低滲透黏土中氯離子彌散作用離心模擬相似性
分?jǐn)?shù)階余弦變換的卷積定理
圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
快消品電商機(jī)會在哪里
離散余弦小波包變換及語音信號壓縮感知