国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合社交網(wǎng)絡(luò)信息的長(zhǎng)尾推薦方法

2022-02-17 05:55馮晨嬌張凱涵梁吉業(yè)
模式識(shí)別與人工智能 2022年1期
關(guān)鍵詞:集上長(zhǎng)尾矩陣

馮晨嬌 宋 鵬 張凱涵 梁吉業(yè)

在信息爆炸時(shí)代,用戶難以高效地獲取可能感興趣的商品、服務(wù)等各類信息,同時(shí),商家也難以準(zhǔn)確地為目標(biāo)用戶展現(xiàn)相關(guān)的產(chǎn)品.因此,推薦系統(tǒng)逐漸成為一個(gè)重要的角色出現(xiàn)在亞馬遜等電子商務(wù)網(wǎng)站.然而,現(xiàn)有的推薦算法常忽略冷門(mén)物品的推薦,即現(xiàn)有方法更傾向于推薦流行物品.

冷門(mén)物品,即長(zhǎng)尾物品,具有獨(dú)特的價(jià)值.首先,相比流行商品,長(zhǎng)尾商品的邊際效用更大,能為公司帶來(lái)更高的利潤(rùn),對(duì)于推薦系統(tǒng)來(lái)說(shuō),增加利潤(rùn)的關(guān)鍵在于長(zhǎng)尾市場(chǎng)的開(kāi)拓[1-3].Yin等[4]進(jìn)一步解釋,由于競(jìng)爭(zhēng)對(duì)手以相同價(jià)格出售流行商品,導(dǎo)致這種商品的利潤(rùn)很低,而長(zhǎng)尾商品恰恰相反,一旦成功被購(gòu)置會(huì)使商家的收益增加.其次,長(zhǎng)尾商品銷售給用戶帶來(lái)更好的滿意度.由于一站式購(gòu)物便利效應(yīng),通過(guò)為客戶提供一站式獲取主流產(chǎn)品和利基產(chǎn)品的便利,可提高消費(fèi)者滿意度,使重復(fù)光顧成為可能.由于長(zhǎng)尾商品推薦的重要性被人們廣泛接受,Shi等[5]指出對(duì)長(zhǎng)尾物品的推薦是推薦系統(tǒng)有效性的重要評(píng)測(cè)指標(biāo).

對(duì)于長(zhǎng)尾物品而言,推薦難度在于數(shù)據(jù)稀疏程度更凸顯,從現(xiàn)有研究進(jìn)展上看,主要集中在聚類、多目標(biāo)優(yōu)化、二部圖及消除流行偏差等.Park等[6-7]基于物品屬性對(duì)長(zhǎng)尾物品聚類,通過(guò)同類中長(zhǎng)尾物品評(píng)分的共享,增加長(zhǎng)尾推薦中可用的評(píng)分?jǐn)?shù)目,運(yùn)用已有的預(yù)測(cè)模型進(jìn)行推薦.Grozin等[8]基于聚類方法,分組相似物品,并通過(guò)關(guān)聯(lián)規(guī)則挖掘算法使用這種密集的數(shù)據(jù)表示,提高交叉銷售推薦的質(zhì)量.

隨后,學(xué)者們開(kāi)始嘗試多目標(biāo)優(yōu)化方法,以多目標(biāo)優(yōu)化為出發(fā)點(diǎn),將準(zhǔn)確性、多樣性、流行度、新穎性等不同指標(biāo)按照一定的原則構(gòu)建優(yōu)化函數(shù),實(shí)現(xiàn)在保證一定準(zhǔn)確度的情況下提高推薦新穎性的折衷方案[9-13].此外也考慮利用附加信息(如用戶評(píng)論、用戶和產(chǎn)品屬性、文本挖掘)挖掘用戶的個(gè)性化偏好和長(zhǎng)尾物品之間的關(guān)系.Johnson等[14]在二部圖添加用戶或產(chǎn)品屬性額外的維度生成三部圖,目的是利用該維度使隨機(jī)游走具有更高的概率到達(dá)長(zhǎng)尾物品.現(xiàn)有的消除流行偏差的主要方法是排名調(diào)整和無(wú)偏學(xué)習(xí).Zhu等[15]對(duì)推薦列表進(jìn)行事后重新排序.Abdollahpouri等[16]采用xQuAD(Explicit Query Aspect Diversification)改進(jìn)版解決流行偏差問(wèn)題,使系統(tǒng)設(shè)計(jì)者能對(duì)系統(tǒng)進(jìn)行調(diào)優(yōu),達(dá)到預(yù)期的折衷目標(biāo).這兩種方法都是啟發(fā)式設(shè)計(jì),旨在有意提高不太受歡迎的項(xiàng)目的分?jǐn)?shù),但缺乏有效性的理論基礎(chǔ).Liu等[17]采用因果嵌入模型,使用無(wú)偏均勻數(shù)據(jù)引導(dǎo)模型學(xué)習(xí)無(wú)偏嵌入,迫使模型丟棄物品流行度.然而,獲取這種統(tǒng)一的數(shù)據(jù)需要將物品隨機(jī)暴露給用戶,存在損害用戶體驗(yàn)的風(fēng)險(xiǎn).盡管上述方法在一定程度上提高長(zhǎng)尾物品的推薦效果,但均未考慮用戶好友對(duì)長(zhǎng)尾物品推薦起到的至關(guān)重要的作用.

Web 2.0時(shí)代的到來(lái)催生博客、P2P、維基、即時(shí)信息、社交網(wǎng)站等主要技術(shù).這些技術(shù)在瀏覽網(wǎng)站的基礎(chǔ)上,更注重用戶之間的交互作用,為Web 2.0的蓬勃發(fā)展帶來(lái)巨大的動(dòng)力.社交媒體、社交網(wǎng)絡(luò)、社交標(biāo)簽等網(wǎng)絡(luò)應(yīng)用的普及催生一個(gè)特殊的應(yīng)用——社會(huì)化推薦.社會(huì)化推薦是建立在社會(huì)選擇和社會(huì)影響效果基礎(chǔ)上的推薦算法.社會(huì)選擇是指人們傾向于接觸具有相似屬性的人,并且由于社會(huì)影響,社會(huì)網(wǎng)絡(luò)中的相關(guān)個(gè)人互相影響變得更相似[9].如何有效融合兩者之間的信息成為社會(huì)化推薦的核心問(wèn)題.基于近鄰的社會(huì)化推薦[18]是一種直觀的做法,即利用社交網(wǎng)絡(luò)中兩位用戶之間共同的好友數(shù)量計(jì)算用戶之間的相似度,將其與傳統(tǒng)的相似度結(jié)合后再進(jìn)行近鄰?fù)扑]或引入矩陣分解推薦方法中.基于圖的社會(huì)化推薦[19-20]結(jié)合用戶和產(chǎn)品的二分圖與用戶的社交網(wǎng)絡(luò)圖,產(chǎn)生表示社群的新節(jié)點(diǎn)后,再進(jìn)行基于圖的推薦.

上述兩種融合策略因涉及用戶數(shù)目龐大,給在線學(xué)習(xí)帶來(lái)一定困難,而融合社交信任網(wǎng)絡(luò)的矩陣分解方法由于其可擴(kuò)展性及靈活性較高等特點(diǎn)被廣泛使用.一些學(xué)者將社交網(wǎng)絡(luò)與評(píng)分矩陣共享用戶潛在特征矩陣,并有機(jī)結(jié)合兩者[21-24].還有些學(xué)者通過(guò)社交網(wǎng)絡(luò)將用戶潛在特征矩陣重表示后,再進(jìn)入矩陣分解環(huán)節(jié)[25-31].

從現(xiàn)有研究進(jìn)展上看,上述方法的出發(fā)點(diǎn)是更多地追求推薦精度,而社會(huì)化推薦不單是追求精度,可通過(guò)好友的可信任推薦增加冷門(mén)物品的點(diǎn)擊率.本文試圖通過(guò)概率圖模型的因果關(guān)系表示優(yōu)勢(shì),將社交網(wǎng)絡(luò)作為影響長(zhǎng)尾推薦的一個(gè)重要影響因素有機(jī)融入推薦方法中,從而在保持精度的前提下,提高長(zhǎng)尾物品的推薦效果.鑒于上述分析,本文提出融合社交網(wǎng)絡(luò)信息的長(zhǎng)尾推薦方法(Long Tail Re-commendation Method Based on Social Network Infor-mation, LTRSN),將用戶活躍度、項(xiàng)目非流行度、用戶項(xiàng)目偏好水平及好友推薦行為作為輸入,采用變分推斷方法得出模型中相關(guān)未知參數(shù),實(shí)現(xiàn)預(yù)測(cè)功能.實(shí)驗(yàn)表明,文中方法能在有效實(shí)現(xiàn)長(zhǎng)尾物品推薦的同時(shí),保證較高的推薦精度.

1 參數(shù)定義

設(shè)G=(U,ε)為一個(gè)社交網(wǎng)絡(luò),其中

U={u1,u2,…,um}

表示用戶節(jié)點(diǎn)集合,ε?U×U表示用戶和用戶之間的信任邊.在社交網(wǎng)絡(luò)中節(jié)點(diǎn)和節(jié)點(diǎn)之間的邊通常為有序?qū)?ui,uk),其中,ui表示信任者,uk表示被信任者.使用鏈接矩陣T=(tik)表示ε中邊的結(jié)構(gòu):tik=1表示用戶ui信任用戶uk;tik=0表示用戶ui、uk之間無(wú)信任關(guān)系.進(jìn)一步,利用社交矩陣T可計(jì)算兩位用戶之間的社交關(guān)系強(qiáng)度,本文采用杰卡德相似度計(jì)算用戶社交關(guān)系強(qiáng)度矩陣S=(sik),其中,sik表示用戶ui、uk之間的社交關(guān)系強(qiáng)度.物品集合V={v1,v2,…,vn},用戶與物品之間的評(píng)分矩陣R=(rij)m×n,rij為第i個(gè)用戶ui對(duì)第j個(gè)物品vj的評(píng)分.評(píng)分通常采用5分制,1分表示最弱的偏好,5分表示最強(qiáng)的偏好.

2 融合社交網(wǎng)絡(luò)信息的長(zhǎng)尾推薦方法

社交信息不僅對(duì)用戶的評(píng)分有影響,同時(shí),對(duì)于長(zhǎng)尾物品的推薦也有重要的推動(dòng)作用,因此,本文從兩方面融入社交網(wǎng)絡(luò)信息:一方面,社交網(wǎng)絡(luò)和評(píng)分矩陣共享用戶的潛在特征向量;另一方面,社交網(wǎng)絡(luò)中的好友推薦是長(zhǎng)尾物品推薦的重要影響因素.

2.1 生成過(guò)程

融合社交網(wǎng)絡(luò)信息的長(zhǎng)尾推薦方法(LTRSN) 是一種融合評(píng)分矩陣和社會(huì)化信息的概率圖模型.具體生成過(guò)程如圖1所示.圖中:□表示超參數(shù);表示觀測(cè)變量;○表示隱變量,即不可觀測(cè)變量,但是對(duì)系統(tǒng)狀態(tài)和能觀察到的輸出存在影響,故稱為隱變量;有向邊表示概率依存關(guān)系;矩形表示重復(fù);數(shù)字表示重復(fù)次數(shù).

圖1 LTRSN概率圖模型Fig.1 LTRSN based probability graph model

生成過(guò)程解釋如下.

p(xij|ci,dj,zij,θij0=1)~B(σ(cidjzij)).

社交網(wǎng)絡(luò)對(duì)xij的影響是指第k個(gè)好友生成

其中k=1,2,…,|fi|,η=(η0,η1).

3)影響長(zhǎng)尾物品推薦的各部分權(quán)重βi生成θij.假設(shè)θij~Mult(βi),βi作為θij的先驗(yàn)服從狄利克雷分布,即βi~Dir(α),其中

α=(α0,α1,…,α|fi|),
βi=(βi0,βi1,…,βi|fi|),
θij=(θij0,θij1,…,θij|fi|).

2.2 變量描述

本文模型中的變量分為用戶、物品和社會(huì)網(wǎng)絡(luò)3類.

對(duì)于第i位用戶:

4)用戶自身偏好選擇長(zhǎng)尾物品和好友推薦長(zhǎng)尾物品的權(quán)重βi~Dir(α),

對(duì)于第j個(gè)物品:

對(duì)于每個(gè)評(píng)分rij:

2)用戶-物品偏好水平

4)貢獻(xiàn)變量θij.

對(duì)于每個(gè)社交關(guān)系強(qiáng)度:

2.3 變分推斷

本文采用平均場(chǎng)理論進(jìn)行變分推斷,目標(biāo)是學(xué)習(xí)隱變量的后驗(yàn)概率分布的參數(shù).首先給出觀測(cè)變量和隱變量組合的聯(lián)合概率分布及變分分布,得到證據(jù)下界表示.然后,推導(dǎo)目標(biāo)函數(shù)的梯度,實(shí)現(xiàn)變分參數(shù)學(xué)習(xí).最后,預(yù)測(cè)未知評(píng)分.

定義偏好z=(zij)m×n,用戶偏置a=(a1,a2,…,am),物品偏置b=(b1,b2,…,bn),用戶活躍度c=(c1,c2,…,cm),物品非流行度d=(d1,d2,…,dn),用戶潛在特征向量U=(U1,U2,…,Um),物品潛在特征向量V=(V1,V2,…,Vn),用戶潛在社交特征向量W=(W1,W2,…,Wm).概率圖模型作為生成模型,首先考慮觀測(cè)變量和隱變量組合的聯(lián)合概率分布,設(shè)為p(R,x,T,S,Θ),其中,Θ={z,a,b,c,d,U,V,W,θ,β,η}為隱變量,R、x,T、S為觀測(cè)變量.聯(lián)合概率分布定義如下:

(1)

本文目標(biāo)是求得后驗(yàn)概率p(Θ|R,x,T,S).

為了降低計(jì)算復(fù)雜度,目標(biāo)變換為尋找q(Φ),使KL散度D(q(Φ)‖p(Θ|R,x,T,S)達(dá)到最小,稱q(Φ)為變分分布,Φ為變分參數(shù).q(Φ)通過(guò)平均場(chǎng)的假設(shè)變得清晰簡(jiǎn)單,下面介紹平均場(chǎng)變分推斷.

此處平均場(chǎng)理論假設(shè)變分參數(shù)相互獨(dú)立(貝葉斯理論中這些參數(shù)實(shí)際是條件獨(dú)立的),即滿足

(2)

其中,Φ為變分參數(shù),

變分推斷最小化KL散度等價(jià)于用它最大化證據(jù)下界[33].證據(jù)下界為

L(q)=Eq(lnp(R,x,T,S,Θ))-Eq(lnq(Φ)).

證據(jù)下界包括兩部分:1)對(duì)數(shù)似然函數(shù)關(guān)于變分分布q(Φ)的期望,2)變分分布q(Φ)的對(duì)數(shù)函數(shù)關(guān)于自身的期望,Eq(·)表示數(shù)學(xué)期望是對(duì)q(Φ)定義的.

由式(1)得

由式(2)可得

最終,可得到證據(jù)下界L(q),其中

利用全概率公式、Jensen′s不等式和對(duì)數(shù)函數(shù)的高斯下界[34]:

σ(x)≥h(x,ξ)=

且x=ξ時(shí)到達(dá)一致下界.故

根據(jù)上述計(jì)算,將證據(jù)下界L(q)中的

其它項(xiàng)可用類似方法求出期望,由于篇幅問(wèn)題在這里不再贅述.

對(duì)于參數(shù)ξij,利用文獻(xiàn)[34]的結(jié)論,有

ξij=Eq((cidjzij)2),

得到ξij的估計(jì):

將ξij的估計(jì)代入高斯下界公式,得到λij的估計(jì):

(4)

令偏導(dǎo)等于0,得到Λzij的估計(jì):

(5)

其它參數(shù)估計(jì)方法類似,不一一詳細(xì)計(jì)算,具體結(jié)果如下:

(6)

[(τi0-1)ψ(τi0)-

(7)

k=1,2,…,|fi|,

(8)

(9)

(10)

(11)

(12)

(13)

(14)

(15)

(16)

(17)

(18)

(19)

(20)

(21)

(22)

基于上述梯度,給出融合社會(huì)化信息的長(zhǎng)尾推薦方法,步驟如算法1所示.

算法 1融合社交網(wǎng)絡(luò)信息的長(zhǎng)尾項(xiàng)推薦方法

輸入R,x,T,ρ

輸出變分參數(shù)Φ

從社交矩陣T計(jì)算社交關(guān)系強(qiáng)度S

隨機(jī)初始化全局變分參數(shù)

Whileiter

iter=iter+1

初始化局部變分參數(shù)

forrij∈Rdo

While 不收斂 do

end for

fori=1,2,…,mdo

end for

forj=1,2,…,ndo

end for

fork=1,2,…,mdo

end for

end While

2.4 概率推斷

當(dāng)所有參數(shù)更新完畢,得到最優(yōu)q*(Θ),預(yù)測(cè)第i名用戶對(duì)第j個(gè)產(chǎn)品的評(píng)分:

3 實(shí)驗(yàn)及結(jié)果分析

3.1 實(shí)驗(yàn)數(shù)據(jù)集

為了驗(yàn)證本文方法,實(shí)驗(yàn)數(shù)據(jù)集需要同時(shí)包含社交網(wǎng)絡(luò)和評(píng)分矩陣,本文采用社會(huì)化推薦常用的FilmTrust、Epinions公開(kāi)數(shù)據(jù)集.FilmTrust 數(shù)據(jù)集是2011年6月從整個(gè)FilmTrust網(wǎng)站上抓取的一個(gè)數(shù)據(jù)集,包含1 641 位用戶,2 071部電影,35 497 個(gè)評(píng)分,1 853 條社交關(guān)系.評(píng)分范圍為0.5~4,步長(zhǎng)為0.5.Epinions數(shù)據(jù)集是2003年從評(píng)價(jià)網(wǎng)站Epinions上收集的數(shù)據(jù)集,包含49 290位用戶,139 738部電影,664 824個(gè)評(píng)分,487 183條社交關(guān)系.評(píng)分范圍為1~5,步長(zhǎng)為1.2個(gè)數(shù)據(jù)集均是單向信任關(guān)系.

本文利用巴萊多定律(也叫二八定律)將電影分為熱門(mén)電影和長(zhǎng)尾電影.具體方法是將電影按照評(píng)分?jǐn)?shù)量由高到低排列,取后20%的電影為長(zhǎng)尾電影[35].

3.2 評(píng)價(jià)指標(biāo)

本文選擇如下5個(gè)指標(biāo)刻畫(huà)長(zhǎng)尾推薦性能:與準(zhǔn)確性相關(guān)的平均絕對(duì)誤差(Mean Absolute Error, MAE),均方根誤差(Root Mean Squared Error, RMSE),召回率(Recall),精確度(Precision),與流行度相反的新穎性(Novelty)[22].具體指標(biāo)計(jì)算公式如下:

其中:|·|表示集合中元素的個(gè)數(shù);Rtest表示五折交叉驗(yàn)證法中,隨機(jī)選擇出的一折測(cè)試集;Iu表示面向用戶u推薦的前k個(gè)物品集合;Tu表示測(cè)試集上面向用戶u推薦的物品集合;Lu表示用戶u的topN列表;Ui表示曾對(duì)物品i評(píng)分的用戶的集合.

在這5個(gè)指標(biāo)中,MAE、RMSE、Recall、Precision均采用五折交叉驗(yàn)證方法.Novelty表示推薦結(jié)果的平均流行度,值越小,推薦結(jié)果越新穎.為了降低隨機(jī)初始化導(dǎo)致的誤差,本文在計(jì)算新穎性時(shí),重復(fù)10次取平均值.

3.3 對(duì)比方法

為了說(shuō)明本文方法的有效性,選擇如下對(duì)比方法.

1)PMF(Probabilistic Matrix Factorization)[36].已知用戶評(píng)分,給出用戶潛在特征和物品潛在特征的后驗(yàn)概率,并以對(duì)數(shù)后驗(yàn)概率最大化為目標(biāo)函數(shù),得到用戶和物品的潛在特征向量的估計(jì)值,通過(guò)它們的內(nèi)積預(yù)測(cè)未知評(píng)分.PMF沒(méi)用融合社交信息,本文把PMF作為基準(zhǔn)預(yù)測(cè).

2)SoRec(Social Recommendation Using Probabilistic Matrix Factorization)[21].在上述PMF的基礎(chǔ)上增加社交關(guān)系矩陣,通過(guò)共享用戶特征向量聯(lián)合分解評(píng)分矩陣和社交關(guān)系矩陣,達(dá)到兩種信息的有效融合.SoRec的社交關(guān)系強(qiáng)度sik通過(guò)用戶連接關(guān)系度計(jì)算[38].

3)RSTE(Recommendation with Social Trust Ensemble)[25].在SoRec的基礎(chǔ)上將目標(biāo)用戶好友的偏好與自身偏好進(jìn)行加權(quán)平均,同時(shí)考慮目標(biāo)用戶及其好友對(duì)同一物品的綜合影響.

4)SocialMF(A Matrix Factorization Technique with Trust Propagation for Recommendation in Social Networks)[26].基于信任傳播機(jī)制,認(rèn)為目標(biāo)用戶的偏好較大程度上由其好友的偏好決定,相應(yīng)地,基于好友特征向量的加權(quán)平均表示目標(biāo)用戶特征向量,并引入模型的目標(biāo)函數(shù)中.

5)SoReg(Recommender Systems with Social Regularization)[27].與SocialMF類似,同樣在PMF的基礎(chǔ)上添加社交正則項(xiàng),區(qū)別在于SoReg對(duì)具有不同關(guān)系強(qiáng)度的好友進(jìn)行區(qū)分.

6)TrustMF(Social Collaborative Filtering by Trust)[22].將社交矩陣分解為信任和被信任雙向關(guān)系,將用戶潛在社交特征向量分為信任者特征向量和被信任者特征向量,類似SoRec建模.

7)TrustSVD(A Trust-Based Matrix Factorization Technique)[28].將SVD++融入社交信息的推廣,即將社交矩陣的顯式關(guān)系作為隱式反饋信息加入SVD++中.

8)面向長(zhǎng)尾推薦的三因素概率圖模型(Three- Factors Based Probability Graph Model, TFPGM)[32].基于用戶活躍度、項(xiàng)目非流行度和用戶-項(xiàng)目偏好水平因素的概率圖推薦方法.

9)FPMF(A Fusion Probability Matrix Factorization)[38].融合局部相似度信息和全局評(píng)價(jià)信息的概率矩陣分解方法.

在實(shí)驗(yàn)中,潛在特征空間維數(shù)設(shè)置為10,迭代步長(zhǎng)均為0.01,迭代100次停止.

3.4 實(shí)驗(yàn)結(jié)果

為了驗(yàn)證本文方法(LTRSN)的有效性,基于如下3類指標(biāo)分析實(shí)驗(yàn)結(jié)果.

第1類指標(biāo)是從用戶預(yù)測(cè)評(píng)分誤差的角度對(duì)比方法性能.不同方法在FilmTrust、Epinions數(shù)據(jù)集上的性能對(duì)比如表1所示.由表1可看出,在2個(gè)數(shù)據(jù)集上,本文方法的MAE、RMSE值僅次于TrustSVD和FPMF,均優(yōu)于其它方法.這是因?yàn)門(mén)rustSVD在融合社交信息時(shí)利用SVD++的思想,而SVD++將評(píng)分矩陣看成隱式反饋和顯式反饋兩種信息的表現(xiàn).類似地,TrustSVD將社交矩陣也分為隱式反饋和顯式反饋,同時(shí)加入用戶、物品偏置以優(yōu)化預(yù)測(cè)評(píng)分.這些原因綜合促成方法在預(yù)測(cè)誤差方面性能最優(yōu).而FPMF是融合局部信息和全局信息的概率矩陣分解方法,信息全面,精度較高.本文方法沿用用戶、物品偏置的概念,利用社交矩陣的顯式反饋等信息,結(jié)果優(yōu)于其它方法.之所以差于TrustSVD是因?yàn)樘砑佑脩艋钴S度、物品流行度等因素,增強(qiáng)長(zhǎng)尾物品的推薦,從而在一定程度上降低預(yù)測(cè)誤差.此外,從PMF的MAE、RMSE值可知,大多數(shù)情況下PMF劣于其它方法,這說(shuō)明社交信息的融合在一定程度上可提高預(yù)測(cè)精度.

表1 不同方法在2個(gè)數(shù)據(jù)集上的性能對(duì)比Tabel 1 Performance comparison of different methods on 2 datasets

第2類指標(biāo)是從排序的角度出發(fā),給出topN推薦.各方法在FilmTrust、Epinions數(shù)據(jù)集上的召回率對(duì)比如圖2所示.由圖可知,在FilmTrust數(shù)據(jù)集上,本文方法在召回率上僅劣于TrustSVD和FPMF,優(yōu)于其它方法.在Epinions數(shù)據(jù)集上,本文方法在召回率上優(yōu)于所有方法.

各方法在FilmTrust、Epinions數(shù)據(jù)集上的精確度對(duì)比如圖3所示.由圖可知,在FilmTrust數(shù)據(jù)集上,本文方法的精確度劣于SoReg、TrustSVD、TFPGM,但優(yōu)于其它方法.在Epinions數(shù)據(jù)集上本文方法的精確度劣于SoReg、TrustMF,但優(yōu)于其它方法.

綜合圖2和圖3,說(shuō)明本文方法對(duì)于topN推薦是有一定優(yōu)勢(shì)的.

(a)FilmTrust (b)Epinions圖2 各方法在2個(gè)數(shù)據(jù)集上的召回率對(duì)比Fig.2 Recall comparison of different methods on 2 datasets

(a)FilmTrust (b)Epinions圖3 各方法在2個(gè)數(shù)據(jù)集上的精確度對(duì)比Fig.3 Precision comparison of different methods on 2 datasets

第3類指標(biāo)是物品推薦的新穎性度量,定義為流行度的對(duì)立面,即長(zhǎng)尾物品推薦的性能.由于SoReg 和TrustSVD在FilmTrust數(shù)據(jù)集上新穎性遠(yuǎn)大于其它方法,即長(zhǎng)尾推薦效果明顯劣于其它方法,因此不做對(duì)比.在Epinions數(shù)據(jù)集上,TrustSVD的長(zhǎng)尾推薦效果顯著劣于其它方法,因此不做對(duì)比.各方法在FilmTrust、Epinions數(shù)據(jù)集上的新穎性對(duì)比如圖4所示.

由圖4可看出,本文方法在2個(gè)數(shù)據(jù)集上均優(yōu)于其它對(duì)比方法.這是因?yàn)楸疚姆椒ㄌ砑娱L(zhǎng)尾物品推薦的影響因素,有效提升長(zhǎng)尾推薦性能.

(a)FilmTrust

(b)Epinions圖4 各方法在2個(gè)數(shù)據(jù)集上的新穎性對(duì)比Fig.4 Novelty comparison of different methods on 2 datasets

4 結(jié) 束 語(yǔ)

本文從信息融合視角出發(fā),基于社交矩陣和評(píng)分矩陣,提取長(zhǎng)尾物品的重要影響因素,即用戶活躍度、物品流行度、用戶-物品偏好水平和好友推薦.在此基礎(chǔ)上,面向長(zhǎng)尾物品推薦任務(wù),提出融合社交網(wǎng)絡(luò)信息的長(zhǎng)尾推薦方法(LTRSN).本文通過(guò)平均場(chǎng)理論降低模型的復(fù)雜表示,采用變分推斷方法優(yōu)化目標(biāo)函數(shù),得到變分參數(shù)的估計(jì),并通過(guò)參數(shù)的估計(jì)預(yù)測(cè)未知評(píng)分.在2個(gè)具有社交信息的FilmTrust、Epinions公開(kāi)數(shù)據(jù)集上進(jìn)行算法的對(duì)比分析.實(shí)驗(yàn)表明,LTRSN在促進(jìn)長(zhǎng)尾物品推薦方面較有效,同時(shí)保證較高的推薦精度,這也進(jìn)一步說(shuō)明社會(huì)化信息融合的重要性.

猜你喜歡
集上長(zhǎng)尾矩陣
單雙點(diǎn)平滑結(jié)合的流形正則化半監(jiān)督分類學(xué)習(xí)框架
長(zhǎng)尾鯊拯救海島旅游
多項(xiàng)式理論在矩陣求逆中的應(yīng)用
矩陣
矩陣
矩陣
幾道導(dǎo)數(shù)題引發(fā)的解題思考
2008年高考考前模擬試題(二)及略解
太谷县| 新巴尔虎左旗| 尼玛县| 石柱| 小金县| 三亚市| 洞口县| 缙云县| 乡城县| 友谊县| 开远市| 白沙| 承德市| 丰县| 慈利县| 佛冈县| 察哈| 宜兰县| 海安县| 芜湖市| 五常市| 射阳县| 牙克石市| 河西区| 灯塔市| 中牟县| 锡林浩特市| 汶上县| 额济纳旗| 东乌| 阳西县| 万全县| 资溪县| 米脂县| 阜宁县| 遵义县| 同江市| 怀集县| 嘉鱼县| 江永县| 张家界市|