陳永鋒 朱振宇
摘 要:面對(duì)數(shù)量繁多的各種商品信息,大多數(shù)用戶并不能從中迅速找到自己所需要的,而個(gè)性化推薦針對(duì)不同的用戶給出不同的推薦信息,大大方便了用戶的決策。文章對(duì)綜合隱語(yǔ)義模型和信任關(guān)系模型的個(gè)性化推薦算法進(jìn)行了研究。通過(guò)將信任關(guān)系網(wǎng)絡(luò)與隱語(yǔ)義模型相結(jié)合,簡(jiǎn)化了運(yùn)算量,提高了推薦效率和準(zhǔn)確度。具體討論了如何建立信任關(guān)系模型,并將其應(yīng)用于推薦系統(tǒng)中。采用樣本訓(xùn)練得到隱語(yǔ)義模型,并通過(guò)Epinions.com數(shù)據(jù)庫(kù)驗(yàn)證該模型的有效性。
關(guān)鍵詞:隱語(yǔ)義模型;信任關(guān)系模型;個(gè)性化推薦;冷啟動(dòng);社交網(wǎng)絡(luò)
1 概述
目前個(gè)性化推薦算法大體可分為基于協(xié)同過(guò)濾技術(shù)的推薦算法和基于內(nèi)容的推薦算法兩大類。協(xié)同過(guò)濾技術(shù)是根據(jù)鄰居用戶的資料對(duì)目標(biāo)用戶進(jìn)行產(chǎn)品推薦?;趦?nèi)容的推薦是推薦與目標(biāo)用戶以前選擇的產(chǎn)品相似的產(chǎn)品。然而,基于用戶相似度的協(xié)同過(guò)濾推薦系統(tǒng)需要用戶對(duì)多個(gè)商品得評(píng)分,而對(duì)于新用戶來(lái)說(shuō)并沒(méi)有商品購(gòu)買行為,也就沒(méi)有評(píng)分,因此很難對(duì)其進(jìn)行推薦[1]。在基于顯式標(biāo)簽的推薦系統(tǒng)中,需要用到人工對(duì)用戶還有產(chǎn)品進(jìn)行打標(biāo)簽分類,但是這種方法具有一定的局限性。為了避免人工分類的局限性,我們可以從用戶的行為數(shù)據(jù)出發(fā),運(yùn)用隱語(yǔ)義模型,自動(dòng)找到那些類然后進(jìn)行個(gè)性化推薦。
2 隱語(yǔ)義模型
隱語(yǔ)義模型LFM屬于隱含語(yǔ)義分析技術(shù),是用來(lái)找出潛在的主題或分類。
3 用戶社交關(guān)系信任網(wǎng)絡(luò)
在Epinion.org系統(tǒng)中,用戶不僅可以對(duì)不同商品的評(píng)分,還可以基于用戶之間的信任關(guān)系對(duì)不同的用戶進(jìn)行打分[2]。
本文將有直接信任關(guān)系的用戶之間的信任強(qiáng)度設(shè)定為1,并假設(shè)用戶之間的信任是可傳遞的。傳遞的規(guī)則如下:給用戶u,該用戶對(duì)其他用戶v的信任強(qiáng)度與他們之間的最短路徑直接相關(guān)[3]。具體來(lái)講,如果我們僅考慮d階最短路徑之內(nèi)的節(jié)點(diǎn)(即對(duì)于用戶u來(lái)說(shuō),與其最短距離超過(guò)d的用戶將不予考慮),那么與源點(diǎn)u之間最短路徑為n的用戶被u信任的程度為:Tust=(d-n+1)/d。
4 融合信任感知的推薦系統(tǒng)結(jié)構(gòu)
信任矩陣(代表所有用戶的信任關(guān)系)和評(píng)分矩陣(表示由用戶給定的項(xiàng)目的所有的評(píng)分),作為整個(gè)系統(tǒng)的輸入,并且產(chǎn)生該用戶對(duì)項(xiàng)目矩陣的預(yù)測(cè)的評(píng)分作為輸出。
5 實(shí)驗(yàn)結(jié)果及評(píng)估
本文使用的數(shù)據(jù)基于Epinions.com的交易數(shù)據(jù),在Epinions.com用戶不僅可以在線購(gòu)買多種商品,還允許對(duì)其他用戶進(jìn)行打分,于是系統(tǒng)中就有了可用的信任關(guān)系網(wǎng)絡(luò)。
整體來(lái)看,綜合用戶信任關(guān)系及隱語(yǔ)義模型的方法比傳統(tǒng)的協(xié)同過(guò)濾方法更優(yōu),其用戶覆蓋率以及評(píng)分覆蓋率都優(yōu)于傳統(tǒng)的協(xié)同過(guò)濾方法。尤其是在對(duì)新用戶的預(yù)測(cè)上,新的方法可以彌補(bǔ)傳統(tǒng)的協(xié)同過(guò)濾的不足。
當(dāng)信任距離大于1時(shí),基于信任度的混合算法在全部用戶上的評(píng)分覆蓋率和用戶覆蓋率都優(yōu)于用戶協(xié)同過(guò)濾。正如預(yù)期的那樣,傳播距離越大,用戶覆蓋率和評(píng)分覆蓋率越高,其對(duì)應(yīng)的預(yù)測(cè)誤差也就越小。對(duì)于缺少評(píng)分?jǐn)?shù)據(jù)的冷啟動(dòng)用戶,相對(duì)于用戶協(xié)同過(guò)濾,基于信任網(wǎng)絡(luò)的混合推薦算法得到了更高的評(píng)分和用戶覆蓋率以及較小的誤差。例如對(duì)于全部用戶來(lái)說(shuō),對(duì)大距離為4時(shí),評(píng)分覆蓋率為72%,用戶覆蓋率為57%,MAE為0.805,MAUE為0.850都優(yōu)于用戶協(xié)同過(guò)濾。
6 結(jié)束語(yǔ)
本文的主要目的是使用基于信任網(wǎng)絡(luò)的混合算法提升推薦系統(tǒng)的性能。本方法對(duì)于解決推薦系統(tǒng)的一些傳統(tǒng)問(wèn)題,例如“新用戶冷啟動(dòng)”問(wèn)題有非常顯著的幫助,經(jīng)過(guò)試驗(yàn)對(duì)比,新的混合算法在用戶和評(píng)分覆蓋率上有了提高,而且從計(jì)算的復(fù)雜度方面來(lái)講,不需要通過(guò)對(duì)比用戶對(duì)商品的評(píng)分情況找出“參照用戶”,而是通過(guò)用戶之間的信任關(guān)系達(dá)到這一目的,因此可以減小計(jì)算量。
參考文獻(xiàn)
[1]P Massa,P Avesani. Trust-aware Collaborative Filtering for Recommender Systems[J].Springer Berlin Heidelberg,2004,3290:492-508.
[2]CN Ziegler,G Lausen. Spreading activation models for trust propagation[J] .IEEE International Conference on E-technology,2004.
[3]F Ricci,L Rokach,B Shapira,PB Kantor. Recommender systems handbook[J].Springer, 2011:1-35.
[4]王升升,趙海燕,陳慶奎.個(gè)性化推薦中的隱語(yǔ)義模型[J].小型微型計(jì)算機(jī)系統(tǒng),2016,5:881-889.
[5]叢麗暉,王科,夏秀峰.利用信任支持度構(gòu)建客戶信任網(wǎng)絡(luò)[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(6):110-115.
[6]李琳娜,江雪琴.推薦系統(tǒng)中的隱語(yǔ)義模型研究[J].情報(bào)工程,2016,4(2):30-39.
作者簡(jiǎn)介:陳永鋒(1961-),男,教授,主要從事風(fēng)險(xiǎn)評(píng)估理論、建模與方法、企業(yè)信息化方面的教學(xué)和科研工作。
朱振宇(1993-),男,碩士,個(gè)性化推薦。