国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合相似用戶、物品的矩陣分解推薦算法研究

2023-06-26 18:22洪昶劉偉呂昊宸
無線互聯(lián)科技 2023年8期
關(guān)鍵詞:推薦系統(tǒng)

洪昶 劉偉 呂昊宸

摘要:推薦系統(tǒng)中傳統(tǒng)的協(xié)同過濾算法和基于矩陣分解的推薦算法都單獨(dú)地進(jìn)行相關(guān)推薦,但兩種方法獨(dú)立運(yùn)行,都存在一定的不足,導(dǎo)致推薦質(zhì)量不佳。為了進(jìn)一步提升推薦算法性能來提高推薦準(zhǔn)確度,文章提出一種融合相似用戶、物品的矩陣分解推薦算法,在矩陣分解模型的基礎(chǔ)上,結(jié)合協(xié)同過濾思想來挖掘目標(biāo)用戶的個性化候選物品推薦。文章采用MoviesLens數(shù)據(jù)集進(jìn)行模型訓(xùn)練并評估其性能,與原有的方法相比,推薦準(zhǔn)確度獲得了進(jìn)一步提升。

關(guān)鍵詞:推薦系統(tǒng);協(xié)調(diào)過濾;矩陣分解

中圖分類號:TP3? 文獻(xiàn)標(biāo)志碼:A

0 引言

隨著信息時代的飛速發(fā)展,人們不得不開始面對信息過載的問題[1]。如何快速并準(zhǔn)確地獲得個人感興趣的信息成為現(xiàn)代研究的一個重點(diǎn)問題。人們亟須從傳統(tǒng)的“人找信息”的方式轉(zhuǎn)變?yōu)椤靶畔⒄胰恕钡姆绞剑扑]系統(tǒng)的提出為現(xiàn)代信息索引方式提供了一種有效的解決方案。推薦系統(tǒng)中比較常見而有效的推薦算法分為協(xié)同過濾和矩陣分解兩類方法[2-3]。傳統(tǒng)的協(xié)同過濾分為基于用戶和基于物品的協(xié)同過濾方法,此類方法的本質(zhì)就是通過用戶和物品的評分信息,構(gòu)建交互信息向量兩兩向量之間計(jì)算相似度,通過相似度進(jìn)行相關(guān)推薦。這種算法計(jì)算流程簡單,易于實(shí)現(xiàn),但由于交互向量的稀疏性,計(jì)算相似度時會降低推薦結(jié)果質(zhì)量。基于矩陣分解的推薦算法將評分矩陣分解為較小的用戶興趣矩陣和物品屬性矩陣的乘積。這樣,即使某兩個用戶或者物品之間沒有相同交互項(xiàng),但能通過其他用戶或者物品的共現(xiàn)信息進(jìn)行表示向量學(xué)習(xí),進(jìn)而產(chǎn)生推薦。但缺點(diǎn)是忽略了相似用戶或者物品間的協(xié)同過濾信息,限制了推薦質(zhì)量上限。因此結(jié)合上述兩種算法的優(yōu)缺點(diǎn),本文設(shè)計(jì)了一種融合方法,使兩種算法進(jìn)行相互補(bǔ)充來獲得更高質(zhì)量的推薦結(jié)果。

1 模型

1.1 用戶、物品相似度計(jì)算

傳統(tǒng)的協(xié)同過濾推薦算法首先需要通過相似度計(jì)算,找到用戶或物品的相似項(xiàng),然后為目標(biāo)用戶進(jìn)行推薦。如何計(jì)算相似度成為整個協(xié)同過濾算法的核心。以基于用戶的協(xié)同過濾方法為例,一種可靠的方法是通過兩兩用戶間的行為向量的余弦相似度進(jìn)行相似度計(jì)算,其公式如下:

simuv=|N(u)∩N(v)||N(u)||N(v)|(1)

其中,N(u)表示用戶u有過行為的物品集合,N(v)表示用戶v有過行為的物品集合。公式(1)只考慮了用戶間交互項(xiàng)目的交集,而沒有考慮用戶對交互項(xiàng)評分的信息。例如,用戶u和用戶v對同一項(xiàng)目打分為5分和3分,雖然交互項(xiàng)相同,但用戶偏好并不一樣,因此對應(yīng)的相似度也應(yīng)不一樣,Pearson相似度被引入來處理這類情況,計(jì)算公式如下:

simuv=∑i∈Iuv(rui-r-u)(rvi-r-v)∑i∈Iuv(rui-r-u)2∑i∈Iuv(rvi-r-v)2(2)

其中,Iuv表示用戶u和用戶v都交互過的項(xiàng)目,rui代表用戶u對物品i的評分。本文后續(xù)涉及的用戶間、項(xiàng)目間相似度計(jì)算均采用公式(2)所描述的方法。

1.2 基于用戶的協(xié)同過濾

基于用戶的協(xié)同過濾算法需要首先構(gòu)建用戶—項(xiàng)目評分矩陣,然后將評分矩陣中的每一行評分作為一個用戶的向量表示,采用公式(2)描述的相似度計(jì)算,計(jì)算目標(biāo)用戶和其他用戶之間的相似度,通過相似度的降序排序得到目標(biāo)用戶的K個最相似用戶,從這K個用戶交互歷史中,選取N個候選物品推薦給目標(biāo)用戶,完成個性化推薦。其中,這N個候選物品需要過濾掉目標(biāo)用戶已經(jīng)交互過的項(xiàng)目。

1.3 基于物品的協(xié)同過濾

基于物品的協(xié)同過濾算法,與1.2所描述的方法類似,不同之處在于其將評分矩陣中的每一列評分作為一個物品的向量表示,采用公式(2)描述的相似度計(jì)算,計(jì)算物品間的相似度,通過相似度的降序排序得到每個物品最相似的物品列表排序,當(dāng)目標(biāo)用戶對某一物品產(chǎn)生交互后,就可以找到與該物品最相似的N個物品推薦給目標(biāo)用戶。同樣,這些推薦物品也應(yīng)該過濾掉目標(biāo)用戶已交互過的物品。與基于用戶的協(xié)同過濾相比,這種方法方便冷啟動,只要新用戶對某一物品感興趣,就可以立即推薦相似物品,并且可以通過相似物品為用戶做出可解釋推薦。

1.4 矩陣分解

傳統(tǒng)的協(xié)同過濾方法依賴表示向量之間的交集計(jì)算相似度,但由于表示向量交集較小,導(dǎo)致模型泛化能力有限,沒有交集的用戶或者物品之間的相似度一定為0,限制了模型性能。BiasSVD從擬合評分矩陣已有交互數(shù)據(jù)出發(fā)[4],通過學(xué)習(xí)用戶和物品向量矩陣來預(yù)測評分矩陣未交互部分,形式化描述如下:

r^ui=μ+bu+bi+qTupi(3)

該算法假設(shè)評分偏置來自用戶物品無關(guān)的評分偏置μ、用戶偏置項(xiàng)bu和物品偏置項(xiàng)bi 3部分。qu代表用戶隱向量表示,pi代表物品隱向量表示,r^ui表示用戶u對物品i的預(yù)測評分。通過優(yōu)化模型損失函數(shù)可以學(xué)習(xí)到用戶、物品隱向量,優(yōu)化損失如下:

minp,q,b,u∑(u,i)∈Trui-r^ui2+λ(‖qu‖2+‖pi‖2+bu2+bi2)(4)

其中,rui表示真實(shí)評分,λ為正則系數(shù),一般取λ為1。

1.5 融合相似用戶、物品的矩陣分解

傳統(tǒng)的協(xié)同過濾算法由于評分矩陣的稀疏性無法達(dá)到很好的泛化效果,限制了模型性能上限。矩陣分解算法又忽略了相似物品和相似用戶間的協(xié)同過濾信息,因此,本文提出一種融合這兩種算法優(yōu)勢的融合矩陣分解方法,首先通過1.1節(jié)描述的Pearson相似度計(jì)算每個用戶物品的相似項(xiàng),然后利用相似用戶和相似物品增強(qiáng)矩陣分解中的協(xié)同過濾信息,改進(jìn)矩陣分解中的預(yù)測公式如下:

r^ui=μ+bu+bi+

(qu+∑m∈Nuqm)K+1T(pi+∑n∈Nipn)K+1(5)

其中,Nu表示目標(biāo)用戶u最相似的K個用戶,Ni表示候選物品i最相似的K個物品。優(yōu)化公式(4)的模型損失函數(shù)得到用戶和物品的隱向量表示完成模型訓(xùn)練。矩陣分解推薦算法流程如圖1所示。

2 實(shí)驗(yàn)

2.1 數(shù)據(jù)集與評估指標(biāo)

本文使用MovieLens電影推薦數(shù)據(jù)集來驗(yàn)證所提算法的優(yōu)越性。數(shù)據(jù)集總共包含10萬條用戶對電影的評分信息,評分值為1~5,詳細(xì)統(tǒng)計(jì)指標(biāo)如表1所示。模型評估指標(biāo)采用TOP N推薦[4]中最常用的準(zhǔn)確率(Precision)和召回率(Recall)[5]。

2.2 實(shí)驗(yàn)結(jié)果與分析

在融合矩陣分解推薦算法中,推薦物品數(shù)設(shè)置為20,相似用戶和物品數(shù)K依次設(shè)置為5,10,15,20,25,30,對比評測結(jié)果如圖2—3所示,橫坐標(biāo)K表示推薦物品數(shù)目的設(shè)置。

本文從融合相似用戶、相似物品信息的角度出發(fā),圖2和圖3的實(shí)驗(yàn)結(jié)果表明,捕獲到協(xié)同過濾信息的矩陣分解算法在進(jìn)行多輪實(shí)驗(yàn)驗(yàn)證的情況下,表現(xiàn)出顯著的優(yōu)勢。從實(shí)驗(yàn)結(jié)果可得,融合矩陣分解模? 型無論是在準(zhǔn)確率還是召回率上都展示出了較大的優(yōu)勢,產(chǎn)生了更高質(zhì)量的推薦結(jié)果。

3 結(jié)語

推薦系統(tǒng)中的傳統(tǒng)的協(xié)同過濾算法和基于矩陣分解的推薦算法都單獨(dú)地進(jìn)行相關(guān)推薦,從而導(dǎo)致推薦質(zhì)量不佳。為解決協(xié)同過濾算法與矩陣分解算法中存在的不足,本文提出的融合矩陣分解方法,融合兩者優(yōu)勢來解決存在的不足之處,通過Pearson相似度計(jì)算每個用戶物品的相似項(xiàng),然后利用相似用戶和相似物品增強(qiáng)矩陣分解中的協(xié)同過濾信息。大量的實(shí)驗(yàn)與理論分析表明,本文所提出的融合推薦算法能夠進(jìn)一步在準(zhǔn)確率和召回率上提升推薦性能。融合矩陣分解模型無論是在準(zhǔn)確率還是召回率上都有明顯的提升,其推薦的結(jié)果質(zhì)量有顯著提高。可見,本文提出的融合推薦算法對比原始的方法可以獲得更高質(zhì)量的推薦結(jié)果。

參考文獻(xiàn)

[1]王夢琪,唐長樂.內(nèi)容供給側(cè)信息過載問題及優(yōu)化策略——以互聯(lián)網(wǎng)內(nèi)容平臺為例[J].圖書情報(bào)導(dǎo)刊,2022(9):30-37.

[2]羅潔,王力.基于用戶和項(xiàng)目的協(xié)同過濾算法的比較研究[J].智能計(jì)算機(jī)與應(yīng)用,2023(1):195-197.

[3]張洪為.融合鄰域結(jié)構(gòu)信息的概率矩陣分解算法[J].通化師范學(xué)院學(xué)報(bào),2022(8):50-53.

[4]劉超,趙文靜,賈毓臻,等.基于改進(jìn)的BiasSVD和聚類用戶最近鄰的協(xié)同過濾混合推薦算法[J].計(jì)算機(jī)應(yīng)用與軟件,2021(5):288-293.

[5]胡炳文,孫克雷.一種緩解推薦偏好的協(xié)同過濾TopN算法[J].淮南職業(yè)技術(shù)學(xué)院學(xué)報(bào),2016(1):5-9.

(編輯 王雪芬)

Research on matrix factorization recommendation algorithm fusing similar users and items

Hong? Chang, Liu Wei, Lyu? Haochen

(Chongqing Intellectual Property Protection Center, Chongqing 400023, China)

Abstract:? In the recommendation system, the traditional collaborative filtering algorithm and the recommendation algorithm based on matrix factorization are independently recommended, but the independent operation of the two methods has certain shortcomings, resulting in poor recommendation quality. In order to further improve the performance of the recommendation algorithm to improve the recommendation accuracy, we propose a matrix factorization recommendation algorithm that integrates similar users and items. On the basis of the matrix factorization model, combined with the idea of collaborative filtering, the personalized candidate item recommendation of the target user is mined. In this paper, the MoviesLens data set is used to train the model and evaluate its performance. Compared with the original method, the recommendation accuracy is further improved.

Key words: recommendation system; coordinated filtering; matrix factorization

猜你喜歡
推薦系統(tǒng)
基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
基于Mahout分布式協(xié)同過濾推薦算法分析與實(shí)現(xiàn)
基于Baseline SVD主動學(xué)習(xí)算法的推薦系統(tǒng)