国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于項目屬性偏好的個性化推薦技術?

2017-04-27 06:31:33馮曉川王正成
林產(chǎn)工業(yè) 2017年5期
關鍵詞:相似性個性化協(xié)同

馮曉川 王正成

隨著各電子商務系統(tǒng)中用戶和項目數(shù)據(jù)的指數(shù)性增長,如何與用戶建立聯(lián)系并實時高效地推薦系統(tǒng)信息,從而實現(xiàn)信息消費者和商家的雙贏局面,越來越受到重視。但目前推薦評價數(shù)據(jù)稀缺,這嚴重影響到推薦系統(tǒng)的推薦精度,而且已經(jīng)成為各類電子商務系統(tǒng)發(fā)展的瓶頸。要實現(xiàn)有效的個性化推薦必須解決好當前所面臨的兩大主要問題:數(shù)據(jù)稀疏性和算法有效性。

針對項目的具體屬性評價有效性數(shù)據(jù)稀疏這一問題,研究人員提出了不少增加有效性數(shù)據(jù)的方法,如缺省值填充法和預測值填充法等。在一定程度上,前者可以降低數(shù)據(jù)稀疏性,但沒有考慮到不同的項目和各個用戶之間的差異。后者為根據(jù)項目之間的相似性使用預測值填充的方法來初步預測用戶對未評分項目的評分[1],相應的預測方法有Slope One方法[2]、BP神經(jīng)網(wǎng)絡[3]等。甚至一些學者提出通過刪除一些無效數(shù)據(jù)或無效評分項目來降低數(shù)據(jù)稀疏性,這雖然在一定程度上減少了標記稀疏矩陣,但是,被刪除的用戶或項目已經(jīng)失去了推薦和被推薦的機會[4]。

比較經(jīng)典傳統(tǒng)的個性化推薦算法是最近鄰協(xié)同過濾推薦算法。該算法需要在整個用戶空間搜索目標用戶的最近鄰居,采用一種混合加權預測填充算法。然而在現(xiàn)實中大型的專業(yè)電子商務推薦網(wǎng)站,因為用戶的項目評分矩陣稀疏性過高,導致系統(tǒng)項目中被用戶有效評分過的項目數(shù)量低于總數(shù)的 1%[5]。因此通過基于傳統(tǒng)的用戶協(xié)同過濾相似度計算方法很難找到準確的最近鄰居,導致推薦質(zhì)量降低。

筆者提出基于用戶的特定屬性偏好值計算用戶之間的相似度,并在此基礎上進一步預測用戶對項目的具體屬性未評分部分的評分,以此改善原始用戶項目評價矩陣的數(shù)據(jù)稀疏狀況,達到數(shù)據(jù)的稠密性要求。最后采用流行的協(xié)同過濾算法實現(xiàn)基于項目屬性偏好的個性化推薦。

1 基于項目屬性偏好的推薦過程模型

針對現(xiàn)有的基于用戶的協(xié)同過濾算法存在的不足,筆者提出了基于項目屬性偏好的協(xié)同過濾算法,推薦過程模型如圖1所示。

圖1 基于項目屬性偏好的推薦過程模型Fig.1 Recommendation process model based on item attribute preference

2 基于項目屬性偏好的協(xié)同推薦算法

2.1 項目特征屬性矩陣

一個項目包含多種類別屬性,例如木材有物質(zhì)和非物質(zhì)的屬性。項目屬性集合可以用集合{Attr1,Attr2,… ,Attrk}表示,其中某個項目特征屬性矩陣用A表示, 其中A(i,j)=1。若項目i具備屬性j,則值為1;為0則代表項目i不具備屬性j?;谏鲜隹紤],構建項目特征屬性矩陣如表1。

表1 項目特征屬性矩陣示意表Tab.1 Schematic table of project characteristic properties matrix

2.2 用戶項目屬性偏好矩陣

借鑒文獻[6]用戶項目屬性偏好計算方法,不同用戶對某項目的屬性i偏好程度L(u,i)計算公式如(1)所示:

上式allScore(u,i)表示用戶u對具有項目屬性i的所有項目的評分值之和,allScore(u)表示用戶u對所有項目的評分值和。

根據(jù)公式(1)計算結果,可用一個二維數(shù)組來表示用戶對所有的項目屬性的偏好程度,如表2所示。

表2 用戶項目屬性偏好示意表Tab.2 Schematic table of preference of project properties for users

2.3 基于項目屬性偏好的用戶相似性

借鑒傳統(tǒng)協(xié)同過濾推薦算法中余弦相似性方法,筆者提出用戶u和v基于項目屬性偏好的相似度sim(u,v)計算如公式(2)所示。

其中,k代表項目具有k種屬性。

2.4 基于用戶相似性項目評分預測

為了解決傳統(tǒng)的基于用戶的協(xié)同過濾算法中相關相似度計算數(shù)據(jù)稀疏性問題,提出基于項目屬性偏好的用戶相似性計算方法:假設用戶u參與評分的項目集合為Iu,用戶v參與評分的項目集合為Iv,找到它們的并集為U(u,v)=Iu∪Iv。用戶u或用戶v對項目集合U(u,v)中項目i的評分計算如公式(3)所示:

ru,i為原始用戶項目矩陣中用戶u對項目i的評分。當用戶u對項目i有評分,則評分等于其實際評分。當用戶u對項目未評價,則評分可通過基于項目屬性偏好的用戶相似性進行預測,該預測值Pu,i計算如公式(4)所示。

其中siml(u,v)表示用戶u和用戶v是基于項目屬性偏好用戶相似度,Rv,i表示用戶v對項目i的實際評分,N(u)為用戶u的基于項目屬性偏好相似度的最近鄰居集合。

經(jīng)過上述處理,用戶u與用戶v的共同評分項目數(shù)據(jù)集增加,這樣用戶u和v對U(u,v)的評分就都是非0值,可有效緩解傳統(tǒng)的協(xié)同過濾算法相似性計算中的數(shù)據(jù)稀疏性問題。

3 實驗結果與分析

3.1 數(shù)據(jù)集

筆者實驗所采用的數(shù)據(jù)集是 epinion數(shù)據(jù)集,此數(shù)據(jù)集包含了 49 290 個獨立用戶對139 738件物品的評分,每個物品都至少被評分一次,共有 664 824個評分記錄,其中物品的屬性被定義為127種類別,每一件物品具有一種或多種屬性。10 501個評分數(shù)據(jù)被隨機選擇為實驗數(shù)據(jù)集,其中共包含101個獨立用戶和1 288件物品,其中每個用戶至少對200件以上物品進行了評分。稀疏等級為:

整個實驗數(shù)據(jù)集按一定規(guī)則分成訓練集和測試集,筆者從實驗數(shù)據(jù)集中選取75%的數(shù)據(jù)作為訓練集,25%作為測試集。

3.2 評價標準

實驗中,筆者采用平均絕對誤差作為度量算法優(yōu)劣的標準。推薦精度與平均絕對誤差值成反比。假設測試集中有t條有效評分數(shù)據(jù),分別為{R1,… ,Rt},提出的推薦算法對這些評分的預測值分別設定位為{P1,… ,Pt},則目標用戶u的平均絕對誤差計算如公式(5)所示。

3.3 實驗設計

根據(jù)文中第1章節(jié)中提出的推薦過程模型及第2章節(jié)中所述的推薦算法,設計算例實現(xiàn)類如圖2所示。

圖2 算例設計類圖Fig.2 Class diagram of an example design

圖2的類Cal_user_RatingSum_ItemClass中實現(xiàn)獲得用戶userid有評分的所有項目。類Cal_user_ItemClass_Like中封裝的兩個方法來計算用戶對每個項目屬性的偏好值。類Cal_Two_user_Sim計算不同用戶之間相似度。類Guess_NoRating中有3個行為方法,其中TopN(){}目的是獲得用戶user的前n個鄰居, get_neiboList(){}目的是獲得userid的鄰居集,方法get_guess_rating(){}預測userid對itemid的評分。類SimuV主要實現(xiàn)計算用戶之間的相似度,其中getCommonRatingItemId(){}方法實現(xiàn)不同用戶共同評分的項目編號的獲取。類PreRating中5個行為方法, 不同用戶的相似度通過getSim(){}實現(xiàn)獲取, 用戶u對public double getRatingById平均分通過getAverageRating(){}來獲取用戶對項目的評分。類MAE主要功能是通過訓練集預測測試集中的用戶對項目的評分。

3.4 實驗結果

以傳統(tǒng)的協(xié)同過濾推薦算法作為對照,筆者對提出的改進算法的推薦質(zhì)量進行了測試。在預測用戶未評分的項目評分時,筆者是通過計算基于項目屬性偏好的用戶相似度,選取5作為最近鄰居數(shù)。改進的算法以相關相似性方法作為用戶/項目之間相似性度量標準并計算其平均絕對誤差,實驗中目標用戶/項目的鄰居個數(shù)從4增加到20,間隔為4。實驗數(shù)據(jù)庫為Oracle,開發(fā)環(huán)境為myeclipse,開發(fā)語言選用Java實現(xiàn)。實驗結果如圖3所示。

由圖3可知,筆者提出的算法在不同的鄰居數(shù)情況下均具有最小的平均絕對誤差。這是因為在基于項目屬性偏好的協(xié)同過濾方法中,用戶項目評分矩陣中無評分項目的評分是通過基于項目屬性偏好的用戶相似度初步預測的,這就使得多用戶之間共同評分項目增多,提高了算法的推薦精度。實驗表明,與傳統(tǒng)的推薦算法相比,該解決方案能切實提高項目的推薦精度。

圖3 推薦算法的推薦績效對比示意圖Fig.3 Contrast schematic diagram of recommended algorithm

4 結語

面對指數(shù)增長的海量信息,如何根據(jù)用戶的個性化需求提供快速有效的產(chǎn)品服務推薦是當今網(wǎng)絡信息社會研究的重點與難點。傳統(tǒng)的推薦算法目前還存在一些難以克服的缺點,如用戶評分的有效數(shù)據(jù)稀疏、預測結果不精確等問題。筆者提出的基于項目屬性偏好的協(xié)同過濾個性化推薦模型與算法,在理論上為解決個性化推薦技術中項目評分數(shù)據(jù)稀疏性和預測精確性問題提出了一種新的研究方案,在實踐中通過驗證表明,該解決方案能切實提高推薦精度。文中提出的方法如用于行業(yè)特色鮮明、供求信息精簡的木制品貿(mào)易網(wǎng)站,可很好地提升產(chǎn)品推薦的效率。

[1]雷琨.電子商務個性化推薦系統(tǒng)研究[D].成都:電子科技大學,2012.

[2]李聰.電子商務推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D].合肥:合肥工業(yè)大學,2013.

[3]陳曉誠.基于信任傳播模型的協(xié)同過濾推薦算法研究[D].廣州:中山大學,2010.

[4]孫小華.協(xié)同過濾系統(tǒng)的稀疏性與冷啟動問題研究[D].杭州:浙江大學,2012.

[5]Matevi Kunaver,Tomai Poirl,Matevi Pogacnik,et al.Optimization of combined collaborative recommender systems[J].International Journal of Electronics and Communications,2007,61(7):433-443.

[6]夏培勇.個性化推薦技術中的協(xié)同過濾算法研究[D].青島:中國海洋大學,2011.

猜你喜歡
相似性個性化協(xié)同
一類上三角算子矩陣的相似性與酉相似性
蜀道難:車與路的協(xié)同進化
科學大眾(2020年23期)2021-01-18 03:09:08
淺析當代中西方繪畫的相似性
河北畫報(2020年8期)2020-10-27 02:54:20
堅持個性化的寫作
文苑(2020年4期)2020-05-30 12:35:12
“四化”協(xié)同才有出路
汽車觀察(2019年2期)2019-03-15 06:00:50
新聞的個性化寫作
新聞傳播(2018年12期)2018-09-19 06:27:10
上汽大通:C2B個性化定制未來
三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
低滲透黏土中氯離子彌散作用離心模擬相似性
滿足群眾的個性化需求
水富县| 南丰县| 塔河县| 平顶山市| 元朗区| 昌宁县| 横山县| 金乡县| 张北县| 郁南县| 于都县| 白水县| 微山县| 库尔勒市| 汝州市| 沐川县| 天峻县| 城步| 南汇区| 旌德县| 安吉县| 义乌市| 通州市| 乌兰察布市| 兴宁市| 思南县| 高州市| 兖州市| 余江县| 姜堰市| 琼中| 临颍县| SHOW| 潮安县| 浦城县| 盖州市| 河池市| 弥勒县| 台江县| 北海市| 达孜县|