国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

個(gè)性化推薦系統(tǒng)中協(xié)同過濾方法的研究

2014-10-22 22:05:15趙智韓丹
電腦知識(shí)與技術(shù) 2014年27期
關(guān)鍵詞:相似性

趙智 韓丹

摘要:對基于余弦相似性、相關(guān)相似性與項(xiàng)目評分的CF算法進(jìn)行了性能對比與評價(jià),對其在個(gè)性化推薦系統(tǒng)中的應(yīng)用、面臨的問題以及相應(yīng)的解決方法進(jìn)行了分析與研究。

關(guān)鍵詞:個(gè)性化推薦系統(tǒng);相似性;協(xié)同過濾算法;平均絕對偏差

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)27-6459-02

目前,國際電子商務(wù)市場已成為發(fā)展最快的市場之一,能否利用有限的資源快速找到用戶所需是搶占市場商機(jī)的關(guān)鍵。最近鄰居技術(shù)在個(gè)性化推薦系統(tǒng)中是目前最成功的。他的基本算法是先找到評分相似的最近鄰居,然后根據(jù)最近鄰居的評分?jǐn)?shù)據(jù)向目標(biāo)用戶推薦。這種推薦技術(shù)的結(jié)果成功率非常高,與目標(biāo)用戶的實(shí)際需求非常相似。它并不依賴于對這些商品必須有的文本描述,而是通過構(gòu)造用戶對項(xiàng)目的偏好數(shù)據(jù)集來實(shí)現(xiàn),因此在個(gè)性化推薦系統(tǒng)中成為一項(xiàng)很受歡迎的技術(shù)。

1 協(xié)同過濾算法的分類

目前主流的協(xié)同過濾算法有兩類:基于內(nèi)存和基于模型的協(xié)同過濾算法。1基于內(nèi)存:參與計(jì)算的數(shù)據(jù)集是用戶—項(xiàng)目數(shù)據(jù)庫;2基于模型:先利用各種機(jī)器學(xué)習(xí)的方法離線建立模型。模型的數(shù)據(jù)來源是用戶的評分?jǐn)?shù)據(jù)。模型建立完成后,根據(jù)目標(biāo)用戶的對其它項(xiàng)目的實(shí)際評分,得到用戶對目標(biāo)項(xiàng)目的預(yù)測結(jié)果。該文主要探討基于模型的協(xié)同過濾算法。

2 最近鄰協(xié)同過濾算法

3.3 三種相似性算法分析

基于余弦夾角的相似性度量方法:此方法在計(jì)算中將目標(biāo)用戶對項(xiàng)目的評分假設(shè)為n維空間上的向量。通過計(jì)算求得向量間夾角的余弦值。余弦值越小,兩用戶的相似度越高。為避免數(shù)據(jù)極端稀疏,將用戶沒有評分的項(xiàng)目評分都假設(shè)為0分。但實(shí)際應(yīng)用中,用戶對未評價(jià)項(xiàng)目的評分不能全部為0,因此這種算法的可信度不高,相似性計(jì)算不準(zhǔn)確。從實(shí)驗(yàn)結(jié)果中可以看出MAE值相對較高?;谙嚓P(guān)相似性的相似性計(jì)算方法:在該算法中所有參與計(jì)算的數(shù)據(jù)均為真實(shí)數(shù)據(jù)。但在實(shí)際應(yīng)用中,兩個(gè)用戶共同評分的項(xiàng)目極少。這種計(jì)算方法使得兩個(gè)用戶僅對一個(gè)項(xiàng)目評分,也可計(jì)算出較高的相似性,這與事實(shí)不符。實(shí)驗(yàn)結(jié)果顯示基于相關(guān)相似性的MAE值略低于基于余弦相似性的MAE值?;陧?xiàng)目評分的協(xié)同過濾算法:為增加參與計(jì)算的數(shù)據(jù)量,該算法通過計(jì)算用戶對未評價(jià)項(xiàng)目之間的相似性,從而預(yù)測出用戶對未評價(jià)項(xiàng)目的評分,豐富了參與相似性度量的數(shù)據(jù)。實(shí)驗(yàn)結(jié)果顯示,該算法的MAE值最小,推薦質(zhì)量越高。但是,該算法的時(shí)間復(fù)雜度較高為O(n4) ,計(jì)算較為復(fù)雜,因此必須離線進(jìn)行。

4 結(jié)束語

本文對基于余弦相似性、相關(guān)相似性和項(xiàng)目評分的協(xié)同過濾算法進(jìn)行了性能對比。實(shí)驗(yàn)結(jié)果表明,協(xié)同過濾算法中相似性度量的計(jì)算,既要考慮參與計(jì)算的數(shù)據(jù)數(shù)量又要考慮參與評價(jià)的數(shù)據(jù)的真實(shí)性。由于協(xié)同過濾技術(shù)多用于在線的電子商務(wù)系統(tǒng),因此還要考慮到算法的效率問題。下一步應(yīng)考慮在基于項(xiàng)目評分的相似性度量方法基礎(chǔ)上,提高計(jì)算效率。

參考文獻(xiàn):

[1] 白麗君,張永奎,陳鑫卿.協(xié)作過濾研究概述[J].電腦開發(fā)與應(yīng)用,2002,15(11).

[2] 鄧愛林,朱揚(yáng)勇,施伯樂.基于項(xiàng)目評分預(yù)測得協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003,14(9):1621-1628.

猜你喜歡
相似性
一類上三角算子矩陣的相似性與酉相似性
基于基因表達(dá)譜相似性的四物湯重定位及抗乳腺癌有效成分群辨識(shí)
淺析當(dāng)代中西方繪畫的相似性
基于隱喻相似性研究[血]的慣用句
低滲透黏土中氯離子彌散作用離心模擬相似性
基于相似性評價(jià)的輻射輸運(yùn)計(jì)算建模方法研究
基于序貫相似性檢測的NCC目標(biāo)跟蹤快速匹配方法
基于信號(hào)周期相似性和LZW編碼的數(shù)據(jù)壓縮方法
電測與儀表(2014年6期)2014-04-04 11:59:52
一種新的基于對稱性的字符串相似性處理算法
一種相似性學(xué)習(xí)算法及其在人臉識(shí)別中的應(yīng)用
镇江市| 新源县| 雅安市| 广丰县| 台湾省| 泗洪县| 堆龙德庆县| 读书| 雷州市| 屯留县| 武汉市| 日喀则市| 将乐县| 黄山市| 石门县| 新田县| 信宜市| 防城港市| 华宁县| 沾益县| 宾川县| 儋州市| 赣榆县| 天镇县| 宜良县| 南阳市| 阜阳市| 贺兰县| 上杭县| 类乌齐县| 武城县| 都安| 石台县| 茶陵县| 温泉县| 深州市| 镇江市| 长治县| 新竹市| 岗巴县| 黔西县|