于玉龍+王秀芳
【摘要】 協(xié)同過濾被廣泛應(yīng)用到個(gè)性化推薦中,本文針對(duì)傳統(tǒng)協(xié)同過濾推薦算法準(zhǔn)確度不高的問題進(jìn)行研究,將用戶之間共同評(píng)分的物品數(shù)量作為相似度計(jì)算的重要指標(biāo),并引入信任度對(duì)用戶評(píng)分進(jìn)行修正,提高推薦準(zhǔn)確度。
【關(guān)鍵詞】 協(xié)同過濾 信任度 相似度 電影推薦
一、引言
隨著互聯(lián)網(wǎng)的發(fā)展,人們很難再海量的數(shù)據(jù)中快速找到自己需要的資源,很多網(wǎng)站想挖掘用戶的偏好向用戶推薦他們感興趣的物品,協(xié)同過濾是最常用的推薦技術(shù)[1]。推薦技術(shù)主要有基于物品的推薦與基于用戶的推薦及混合推薦三種。許多研究人員提出了不同的算法來提高推薦可靠性,如采用不同聚類方法的協(xié)同過濾[2]。本文采用基于用戶的推薦方法,最后實(shí)驗(yàn)表明改進(jìn)后的方法比傳統(tǒng)協(xié)同過濾算法更可靠。
二、傳統(tǒng)協(xié)同過濾推薦算法
傳統(tǒng)的協(xié)同過濾的一般過程是根據(jù)用戶評(píng)分對(duì)用戶進(jìn)行相似度的計(jì)算,根據(jù)相似度找到用戶的鄰居用戶,然后由鄰居用戶的喜好來預(yù)測(cè)評(píng)分進(jìn)行推薦[3]。
用戶相似度的計(jì)算是產(chǎn)生鄰居用戶并根據(jù)鄰居用戶進(jìn)行個(gè)性化推薦的重要步驟,Person相似度算法是常用的相似度計(jì)算方法。設(shè)用戶u和v共同評(píng)分過的物品集合為Iuv,則相似性sim(u,v)為:
3.1相似度的修正
3.2引入信任度
傳統(tǒng)的協(xié)同過濾算法在預(yù)測(cè)用戶關(guān)于物品的評(píng)分時(shí),只考慮了兩個(gè)用戶間的相似度,而忽視了該評(píng)分或該用戶是否可信。景民昌等人提出“專家信任度”的概念[4],用來衡量用戶向其他用戶提供可靠信息的能力。用戶u關(guān)于物品i的評(píng)價(jià)可信度為
4.1數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn)
本文采用MovieLens站點(diǎn)提供的ml-100k公開數(shù)據(jù)集,對(duì)提出的算法優(yōu)化并傳統(tǒng)的協(xié)同過濾算法進(jìn)行了對(duì)比實(shí)驗(yàn)。該數(shù)據(jù)集包含了943個(gè)用戶對(duì)1682部電影的100000條評(píng)分,評(píng)分范圍是1到5分。
進(jìn)行實(shí)驗(yàn)時(shí),將實(shí)驗(yàn)數(shù)據(jù)的20%用戶劃為測(cè)試集,其它80%用戶為訓(xùn)練集。利用訓(xùn)練集用戶對(duì)測(cè)試集用戶進(jìn)行推薦。
采用均方根誤差RMSE(Root Mean Squared Error) 來衡量預(yù)測(cè)結(jié)果與用戶真實(shí)評(píng)分之間的誤差。
4.2實(shí)驗(yàn)結(jié)果
本文通過實(shí)驗(yàn)來比較傳統(tǒng)協(xié)同過濾算法與綜合改進(jìn)的協(xié)同過濾算法的性能,在鄰居數(shù)為50的情況下,傳統(tǒng)協(xié)同過濾算法得到的RMSE為1.15,改進(jìn)的算法RMSE為0.93,改進(jìn)的協(xié)同過濾方法有較小的誤差。由此可知,與傳統(tǒng)的相似性度量方法相比,本文提出的改進(jìn)可以顯著地提高推薦系統(tǒng)的推薦質(zhì)量。
五、結(jié)語(yǔ)
本文介紹了協(xié)同過濾的基本原理,提出了一種改進(jìn)的協(xié)同過濾算法,一定程度上提高了推薦準(zhǔn)確度和可靠性,但實(shí)驗(yàn)中仍存在一些問題,有待進(jìn)一步研究。
參 考 文 獻(xiàn)
[1] 項(xiàng)亮. 推薦系統(tǒng)實(shí)踐[M]. 北京: 人民郵電出版社, 2012: 3-4.
[2] 王國(guó)霞, 劉賀平.個(gè)性化推薦系統(tǒng)綜述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2012, 48(7): 66-76.
[3] 鄧愛林,朱揚(yáng)勇,施伯樂.基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003,14(9):1621-1628.
[4] 景民昌, 唐弟官,于迎輝.基于專家信任優(yōu)先的協(xié)同過濾推薦算法[J],圖書情報(bào)工作, 2012.56(11): 105-108.