国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于巴氏系數(shù)和Jaccard系數(shù)的協(xié)同過濾算法

2016-07-19 21:08楊家慧劉方愛
計(jì)算機(jī)應(yīng)用 2016年7期
關(guān)鍵詞:巴氏相似性度量

楊家慧 劉方愛

摘要:針對(duì)傳統(tǒng)基于鄰域的協(xié)同過濾推薦算法存在數(shù)據(jù)稀疏性及相似性度量只能利用用戶共同評(píng)分的問題,提出一種基于巴氏系數(shù)和Jaccard系數(shù)的協(xié)同過濾算法(CFBJ)。在項(xiàng)目相似性度量中,該算法引入巴氏系數(shù)和Jaccard系數(shù),巴氏系數(shù)利用用戶所有評(píng)分信息克服共同評(píng)分的限制,Jaccard系數(shù)可以增加相似性度量中共同評(píng)分項(xiàng)所占的比重。該算法通過提高項(xiàng)目相似度準(zhǔn)確率來選取最近鄰,優(yōu)化了對(duì)目標(biāo)用戶的偏好預(yù)測(cè)和個(gè)性化推薦。實(shí)驗(yàn)結(jié)果表明,該算法比平均值杰卡德差分(MJD)算法、皮爾森系數(shù)(PC)算法、杰卡德均方差(JMSD)算法、PIP算法誤差更小,分類準(zhǔn)確率更高,有效緩解了用戶評(píng)分?jǐn)?shù)據(jù)稀疏所帶來的問題,提高了推薦系統(tǒng)的預(yù)測(cè)準(zhǔn)確率。

關(guān)鍵詞:

協(xié)同過濾;巴氏系數(shù);杰卡德系數(shù);相似性度量;矩陣稀疏性

中圖分類號(hào): TP301.6 文獻(xiàn)標(biāo)志碼:A

0引言

推薦系統(tǒng)[1]根據(jù)用戶的興趣特點(diǎn)和歷史記錄向用戶推薦感興趣的內(nèi)容,有效解決信息過載問題,從而使用戶在海量數(shù)據(jù)中快速、準(zhǔn)確地找到有價(jià)值的信息。協(xié)同過濾推薦[2]是推薦系統(tǒng)中最基本的算法之一,分為基于用戶的協(xié)同過濾推薦[3]和基于項(xiàng)目的協(xié)同過濾推薦[4]。協(xié)同過濾算法的基本思想是計(jì)算用戶或項(xiàng)目間相似度,然后根據(jù)相似度預(yù)測(cè)目標(biāo)用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分并產(chǎn)生推薦集。

當(dāng)前協(xié)同過濾推薦算法存在數(shù)據(jù)稀疏性[5]問題,當(dāng)數(shù)據(jù)集項(xiàng)目較多時(shí),用戶項(xiàng)目矩陣數(shù)據(jù)通常十分稀疏。傳統(tǒng)的相似性度量如皮爾森相關(guān)系數(shù)[6]和余弦相似性[7]等在計(jì)算用戶或項(xiàng)目間相似性時(shí)依賴于用戶對(duì)項(xiàng)目的共同評(píng)分。假設(shè)在評(píng)分矩陣中,用戶的評(píng)分?jǐn)?shù)量較少或者有共同評(píng)分的項(xiàng)目很少,那么相似性度量就存在一定偶然性[8],不適用于稀疏矩陣。為了解決數(shù)據(jù)稀疏性問題,相關(guān)研究引入了不同的相似性度量。例如,Luo等[9]通過引入局部用戶相似性和全局用戶相似性來解決稀疏數(shù)據(jù)中的相似性問題,利用每個(gè)用戶的奇異向量計(jì)算用戶之間的局部相似性,最后把局部近鄰和全局近鄰的預(yù)測(cè)進(jìn)行線性擬合。Ahn等[10]提出了PIP(ProximityImpactPopularity)度量模型,通過分析皮爾遜相似性度量和余弦相似性度量的缺點(diǎn),考慮用戶評(píng)分的三方面:接近、影響和普及,但這種相似性度量只考慮局部評(píng)分信息,不考慮用戶全局偏好。Herlocker等[11]提出加權(quán)Pearson相關(guān)系數(shù)解決傳統(tǒng)Pearson相關(guān)系數(shù)不考慮共同評(píng)分用戶規(guī)模的問題,引入鄰居置信度,共同評(píng)分項(xiàng)越高則置信度越高。Jamali等[12]對(duì)用戶之間的信任關(guān)系進(jìn)行深度搜索,尋找更深層次的相似用戶來進(jìn)行推薦。Bobadilla等[13]提出了一種結(jié)合了Jaccard和平均平方差的矩陣,假定這兩項(xiàng)措施可以互補(bǔ)。這些方法在一定程度上減少了矩陣稀疏性[14]對(duì)推薦算法的影響,但沒有從根本上解決協(xié)同過濾推薦算法中相似性度量受共同評(píng)分限制的問題。

本文提出了一種基于巴氏系數(shù)和Jaccard系數(shù)的協(xié)同過濾算法(Collaborative Filtering algorithm based on Bhattacharyya coefficient and Jaccard coefficient, CFBJ)。該方法通過巴氏系數(shù)和Jaccard系數(shù)度量項(xiàng)目間相似性。巴氏系數(shù)利用用戶間所有的評(píng)分信息,克服了共同評(píng)分的限制。Jaccard系數(shù)可以增加相似性度量中共同評(píng)分項(xiàng)所占的比重,將評(píng)分項(xiàng)目進(jìn)行關(guān)聯(lián),計(jì)算無共同評(píng)分項(xiàng)的用戶間相似度,進(jìn)而預(yù)測(cè)目標(biāo)用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分,為用戶進(jìn)行推薦。該算法擺脫了傳統(tǒng)協(xié)同過濾算法在計(jì)算用戶相似性時(shí)共同評(píng)分的限制,有效緩解用戶評(píng)分?jǐn)?shù)據(jù)極端稀疏情況下使用傳統(tǒng)度量方法帶來的問題,提高推薦系統(tǒng)的推薦質(zhì)量。

1相似性度量定義

1.1巴氏系數(shù)相似度

1.2Jaccard相似性度量

Jaccard系數(shù)是兩個(gè)集合交集與并集的元素?cái)?shù)目之比,用于測(cè)量?jī)蓚€(gè)集合在共同項(xiàng)目上的重疊度。Jaccard系數(shù)計(jì)算符號(hào)度量或布爾值度量的個(gè)體間的相似度,不考慮用戶對(duì)項(xiàng)目的評(píng)分取值,僅關(guān)注用戶是否對(duì)該項(xiàng)目評(píng)過分。Jaccard系數(shù)值等于兩個(gè)用戶關(guān)聯(lián)項(xiàng)目數(shù)量的交集除于關(guān)聯(lián)項(xiàng)目數(shù)量的并集,形式化表示公式如下:

1.3修正的余弦相似性

通過向量間的余弦夾角計(jì)算相似性度量,為了修正不同用戶存在不同評(píng)分尺度的偏差,在標(biāo)準(zhǔn)余弦相似性的基礎(chǔ)上,減去用戶對(duì)所有項(xiàng)目的平均評(píng)分來改善這一缺陷。計(jì)算式如下:

2基于巴氏系數(shù)和Jaccard系數(shù)的本文協(xié)同過濾推薦算法

傳統(tǒng)協(xié)同過濾推薦算法通過用戶或項(xiàng)目?jī)?nèi)個(gè)體間的相互作用,來尋找對(duì)當(dāng)前對(duì)象影響力最大的k個(gè)鄰居,為當(dāng)前對(duì)象屬性作出預(yù)測(cè)[8]。使用合適的相似性度量找到目標(biāo)用戶的鄰域是基于鄰域的協(xié)同過濾算法的最關(guān)鍵步驟。本文提出的相似性度量適于用戶評(píng)分?jǐn)?shù)目少或沒有共同評(píng)分的稀疏數(shù)據(jù)集,巴氏系數(shù)通過用戶間所有評(píng)分計(jì)算兩個(gè)項(xiàng)目間的相關(guān)性,且使用局部信息計(jì)算用戶評(píng)分相關(guān)性,利用Jaccard系數(shù)增加相似性度量中共同評(píng)分項(xiàng)所占的比重。

2.1引入巴氏系數(shù)和Jaccard系數(shù)的相似性度量

傳統(tǒng)基于用戶或者基于項(xiàng)目的協(xié)同過濾算法,如果評(píng)分?jǐn)?shù)據(jù)相當(dāng)稀疏,在計(jì)算用戶或項(xiàng)目間的相似性時(shí)會(huì)過多考慮用戶間共同評(píng)分,與實(shí)際相似度存在較大偏差,導(dǎo)致推薦效果不理想。對(duì)此本文將巴氏相似度和用戶局部相似度結(jié)合進(jìn)行改進(jìn)。令I(lǐng)Ua和IUb分別為用戶Ua和用戶Ub在所有項(xiàng)目上的評(píng)分集合,若用戶Ua和Ub之間無共同評(píng)分即IUa∩IUb=,用戶Ua和Ub之間的相似性度量定義為:

當(dāng)用戶評(píng)分都在同一個(gè)項(xiàng)目上時(shí),SimBC(Ii,Ii)=1,此時(shí)用戶間的相似性度量由局部相似度決定;當(dāng)用戶評(píng)分在完全不相似的項(xiàng)目上時(shí),SimBC(Ii,Ij)=0,此時(shí)用戶間的相似性度由Jaccard相似度決定。巴氏系數(shù)利用用戶間所有的評(píng)分信息,提高了數(shù)據(jù)集中評(píng)分利用率;Jaccard系數(shù)彌補(bǔ)傳統(tǒng)相似性度量側(cè)重用戶對(duì)項(xiàng)目的評(píng)分而忽略項(xiàng)目類別的不足,增加相似性度量中共同評(píng)分項(xiàng)所占的比重,優(yōu)化對(duì)目標(biāo)用戶的偏好預(yù)測(cè)和個(gè)性化推薦。該算法擺脫了傳統(tǒng)協(xié)同過濾算法在計(jì)算用戶相似性時(shí)共同評(píng)分的限制,有效緩解了用戶評(píng)分?jǐn)?shù)據(jù)稀疏所帶來的問題,提高了推薦系統(tǒng)的預(yù)測(cè)準(zhǔn)確率。

2.2產(chǎn)生推薦

通過本文提出的相似性度量得到目標(biāo)用戶的最近鄰居,下一步需要產(chǎn)生相應(yīng)的推薦。設(shè)用戶Ua的最近鄰居集合用N(a)表示,則目標(biāo)用戶Ua對(duì)項(xiàng)目Ii的預(yù)測(cè)評(píng)分Rai此處的ui,u是否應(yīng)該大寫,i作為u的下標(biāo)?請(qǐng)明確。感覺描述不太恰當(dāng),沒有看到關(guān)于i的定義。,可通過用戶Ua對(duì)最近鄰居集合N(a)中項(xiàng)目的評(píng)分得到,計(jì)算方法如下:

Rai=Ua+[∑k∈N(a)Sim(Ua,Ub)*(Rki-ka)]/[∑k∈N(a)|Sim(Ua,Ub)|](9)

其中:Ua表示用戶Ua對(duì)項(xiàng)目評(píng)分的平均值;Sim(Ua,Ub)表示用戶Ua和Ub之間的相似度取值;ka表示用戶Ua第k個(gè)近鄰評(píng)分的平均值,Rki表示第k個(gè)近鄰在i上的評(píng)分。

2.3算法描述

輸入:目標(biāo)用戶Ua,目標(biāo)項(xiàng)目Ii,用戶項(xiàng)目評(píng)分矩陣R(m×n)。

輸出:對(duì)目標(biāo)項(xiàng)目的預(yù)測(cè)評(píng)分Rai。

1)在矩陣R(m×n)中,尋找對(duì)目標(biāo)項(xiàng)目i評(píng)分的用戶,并統(tǒng)計(jì)該用戶數(shù)量n(i)及每個(gè)評(píng)分分值為v的用戶數(shù)量n(v),根據(jù)式(2)、(7)分別計(jì)算用戶巴氏系數(shù)相似度SimBC(Ii,Ij)和局部相似度Simrate(Ua,Ub)。

2)結(jié)合步驟1),根據(jù)式(5)計(jì)算用戶總體相似度Sim(Ua,Ub)。

3)根據(jù)式(3)和(7)計(jì)算用戶Jaccard系數(shù)相似度Sim′(Ua,Ub)Jaccard。

4)對(duì)用戶總體相似度進(jìn)行調(diào)整,加入Jaccard相似度,根據(jù)式(8)計(jì)算得到用戶Ua與其他用戶間的最終總體相似度Sim′(Ua,Ub)。

5)根據(jù)最終的總體相似度,選取目標(biāo)用戶最近K個(gè)鄰居集合N(a)。

6)根據(jù)式(9)計(jì)算目標(biāo)用戶對(duì)目標(biāo)項(xiàng)目的預(yù)測(cè)評(píng)分Rai。

3實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)數(shù)據(jù)集選用著名電影評(píng)分?jǐn)?shù)據(jù)集MovieLens,該數(shù)據(jù)集包含3708萬條記錄,記錄了7000個(gè)用戶對(duì)3708部電影的評(píng)分,每個(gè)用戶至少對(duì)20部電影進(jìn)行了評(píng)分,評(píng)分范圍為1~5。為了形式化描述用戶通過對(duì)電影的不同評(píng)分表達(dá)自己的興趣程度,5表示“perfect”(非常好),1表示“poor”(差)。本文將MovieLens數(shù)據(jù)集隨機(jī)分為兩個(gè)子集MLa和MLb,其中:MLa子集上有312個(gè)用戶只有一個(gè)共同評(píng)分項(xiàng)目,12個(gè)用戶有兩個(gè)共同評(píng)分項(xiàng)目;MLb子集上有28個(gè)用戶只有一個(gè)共同評(píng)分項(xiàng)目。為了驗(yàn)證CFBJ的有效性,本文隨機(jī)搜索了5個(gè)相關(guān)項(xiàng)目作為用戶的目標(biāo)項(xiàng)目。

為驗(yàn)證CFBJ有效性,采用4種協(xié)同過濾算法與提出的方法進(jìn)行實(shí)驗(yàn)對(duì)比。對(duì)比實(shí)驗(yàn)用到的算法如下:

1)平均值杰卡德差分(Mean Jaccard Difference, MJD)算法。本文實(shí)現(xiàn)文獻(xiàn)[18]中基于均值杰卡德差分協(xié)同過濾推薦算法,該算法考慮共同評(píng)分項(xiàng)中不同評(píng)價(jià)尺度問題。

2)皮爾森系數(shù)(Pearson Correlation, PC)相似度算法。本文實(shí)現(xiàn)文獻(xiàn)[19]中利用PC系數(shù)計(jì)算不同用戶間項(xiàng)目相似度。

3)杰卡德均方差(Jaccard and Mean Squared Difference, JMSD)算法。本文實(shí)現(xiàn)文獻(xiàn)[20]中基于Jaccard和平均平方差的協(xié)同過濾推薦算法,考慮Jaccard和平均平方差兩者之間互補(bǔ)的情況。

4)PIP(ProximityImpactPopularity)。本文實(shí)現(xiàn)了文獻(xiàn)[10]中提出的接近、影響和普及度量模型,該算法分析皮爾遜相似性度量和余弦相似性度量的缺點(diǎn),考慮模型三方面要素。

3.1評(píng)價(jià)指標(biāo)

評(píng)價(jià)推薦系統(tǒng)推薦質(zhì)量的度量標(biāo)準(zhǔn)主要包括統(tǒng)計(jì)精度度量和決策支持精度度量?jī)深?。其中,統(tǒng)計(jì)精度度量包括均方根誤差(Root Mean Squared Error, RMSE)和平均絕對(duì)誤差(Mean Absolute Error, MAE),衡量評(píng)分預(yù)測(cè)準(zhǔn)確性的標(biāo)準(zhǔn),反映算法的預(yù)測(cè)評(píng)分與用戶實(shí)際評(píng)分的貼近程度,值越小,算法的推薦性能越好。MAE公式定義:

MAE=1T∑Ua,i|Rai-rai|

其中:rai表示用戶Ua對(duì)項(xiàng)目Ii的實(shí)際評(píng)分;Rai表示相應(yīng)的預(yù)測(cè)評(píng)分;T表示測(cè)試樣本的數(shù)量。同樣,RMSE計(jì)算式可以表示為:

RMSE=1T∑Ua,i(Rai-rai)2

決策支持精度度量包括準(zhǔn)確率(precision)和召回率(recall)反映推薦系統(tǒng)對(duì)分類預(yù)測(cè)的準(zhǔn)確程度,適合具有明確二分喜好的推薦系統(tǒng)。precision和recall定義為:

precision=|L∩L′|/|L|

recall=|L∩L′|/|L′|

其中:L表示推薦列表的長(zhǎng)度;L′表示推薦列表中用戶評(píng)分較高的項(xiàng)目的數(shù)量,但存在precision和recall兩者相互矛盾的情況,本文采用F1measure綜合指標(biāo)反映分類預(yù)測(cè)的準(zhǔn)確程度。F1measure定義為:

F1measure=(2×precision×recall)/(precision+recall)

3.2實(shí)驗(yàn)結(jié)果和分析

首先在MLa子集上比較不同協(xié)同過濾算法的MAE和RMSE值,查看算法的預(yù)測(cè)評(píng)分與用戶實(shí)際評(píng)分的貼近程度,相應(yīng)結(jié)果如圖1所示。由圖1可知,CFBJ、MJD、PC、JMSD和PIP算法隨著K最近鄰數(shù)量的變化,MAE和RMSE值隨之變化。其中,CFBJ在MAE和RMSE上的值一直比MJD、PC、JMSD和PIP算法的值都小,說明CFBJ利用用戶間所有的評(píng)分信息后,預(yù)測(cè)評(píng)分與用戶實(shí)際評(píng)分更貼近,算法的推薦性能更好。其他算法尋找最近鄰時(shí)不能利用用戶所有的評(píng)分信息,僅使用一個(gè)共同評(píng)分項(xiàng),且目標(biāo)用戶的近鄰只有一個(gè),預(yù)測(cè)時(shí)錯(cuò)誤數(shù)量超過了近鄰的最大數(shù)(MAE>0.805,RMSE>1.02,K∈[40,400])。在預(yù)測(cè)精度方面,PIP算法的準(zhǔn)確率比較接近CFBJ;但CFBJ的準(zhǔn)確率更高(MAE>0.73,RMSE<1.00)。

在MLa子集上比較不同協(xié)同過濾算法的F1measure值,相應(yīng)結(jié)果如圖2所示。由圖2可知,隨著最近鄰數(shù)目的遞增,每種協(xié)同過濾算法的F1measure都呈上升趨勢(shì),但CFBJ的F1measure值基本上大于等于其他基于鄰域的協(xié)同過濾算法。當(dāng)K=400時(shí),CFBJ的F1measure接近0.67,MJD的F1measure接近0.57。CFBJ推薦的準(zhǔn)確率比MJD高17%。PIP算法的表現(xiàn)與MJD算法相似,其他的協(xié)同過濾算法表現(xiàn)不佳。這也說明了傳統(tǒng)的相似性度量不能正確檢索相關(guān)項(xiàng)目。

接著在MLb子集上比較不同協(xié)同過濾算法的MAE和RMSE值變化,相應(yīng)結(jié)果如圖3所示。由圖3可知,PIP算法在MAE和RMSE的值小于MJD、PC、JMSD算法,這些算法的相似性度量取決于用戶共同評(píng)分項(xiàng),MLb子集上平均每16個(gè)用戶與目標(biāo)用戶只有一個(gè)共同評(píng)分項(xiàng),所以隨著最近鄰數(shù)量增加,這些協(xié)同過濾算法的精度不再提高。而CFBJ由于利用了用戶間所有的評(píng)分,不受共同評(píng)分項(xiàng)的影響,MAE和RMSE值隨著近鄰數(shù)目的增加而變化,且數(shù)值最低。說明CFBJ在共同評(píng)分項(xiàng)稀疏的情況下,推薦的準(zhǔn)確性依然高于其他4個(gè)算法。

在MLb子集上執(zhí)行不同協(xié)同過濾算法的F1measure情況,相應(yīng)結(jié)果如圖4所示。由圖4可以看出,CFBJ的值一直高于其他算法,隨著最近鄰數(shù)目的增加F1measure值也保持增長(zhǎng)。實(shí)驗(yàn)中MLb子集用戶的平均評(píng)分為5.1分,CFBJ的F1measure接近0.47此處正文描述錯(cuò)誤,應(yīng)該是0.370.37,而其他算法得到的F1measure值不足0.1,說明CFBJ的推薦效果比其他算法準(zhǔn)確。這表明MJD、PC、JMSD和PIP算法的相似性度量方法在評(píng)分?jǐn)?shù)據(jù)稀疏且規(guī)定相關(guān)項(xiàng)目的情況下,對(duì)目標(biāo)用戶進(jìn)行推薦表現(xiàn)不佳。CFBJ能夠應(yīng)對(duì)高度稀疏的評(píng)分?jǐn)?shù)據(jù)集,為用戶提供更加準(zhǔn)確的推薦。

4結(jié)語

針對(duì)協(xié)同過濾算法存在的數(shù)據(jù)稀疏性問題,本文提出的基于鄰域的CFBJ,在稀疏的評(píng)分?jǐn)?shù)據(jù)集上,巴氏系數(shù)利用用戶間所有的評(píng)分信息擺脫共同評(píng)分的限制,Jaccard系數(shù)彌補(bǔ)傳統(tǒng)相似性度量側(cè)重用戶對(duì)項(xiàng)目的評(píng)分而忽略項(xiàng)目類別的不足,增加相似性度量中共同評(píng)分項(xiàng)所占的比重,為目標(biāo)用戶提供更加準(zhǔn)確有效的推薦。該算法最大的優(yōu)點(diǎn)是擺脫了傳統(tǒng)相似性度量中用戶共同評(píng)分的限制,提高了用戶評(píng)分?jǐn)?shù)據(jù)的利用率。實(shí)驗(yàn)對(duì)比表明,CFBJ可以在高度稀疏的評(píng)分?jǐn)?shù)據(jù)集上為用戶提供更準(zhǔn)確的推薦。由于推薦系統(tǒng)中數(shù)據(jù)量龐大,系統(tǒng)的可擴(kuò)展性問題尤為突出,今后將致力于把協(xié)同過濾算法遷移部署到云計(jì)算平臺(tái)中改善推薦系統(tǒng)的實(shí)時(shí)性。

參考文獻(xiàn):

[1]

HERLOCKER J L, KONSTAN J A, TERVEEN L G, et al. Evaluating collaborative filtering recommender systems [J]. ACM Transactions on Information Systems, 2004, 22(1): 5-53.

[2]

SARWAR B, KARYPIS G, KONSTAN J, et al. Itembased collaborative filtering recommendation algorithms [C]// Proceedings of the 10th International Conference on World Wide Web. New York: ACM, 2001: 285-295.

[3]

GONG S. A collaborative filtering recommendation algorithm based on user clustering and item clustering [J]. Journal of Software, 2010, 5(7): 745-752.

[4]

DESHPANDE M, KARYPIS G. Itembased topn recommendation algorithms [J]. ACM Transactions on Information Systems, 2004, 22(1): 143-177.

[5]

HUANG Z, CHEN H, ZENG D. Applying associative retrieval techniques to alleviate the sparsity problem in collaborative filtering [J]. ACM Transactions on Information Systems, 2004, 22(1): 116-142.

[6]

ADLER J, PARMRYD I. Quantifying colocalization by correlation: the Pearson correlation coefficient is superior to the Manders overlap coefficient [J]. Cytometry Part A, 2010, 77(8): 733-742.

[7]

ANAND S S, MOBASHER B. Intelligent techniques for Web personalization [C]// Proceedings of the 2003 International Conference on Intelligent Techniques for Web Personalization. Berlin: Springer, 2003: 1-36.

[8]

黃創(chuàng)光,印鑒,汪靜,等.不確定近鄰的協(xié)同過濾推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2010,33(8):1369-1377.(HUANG C G, YIN J, WANG J, et al. Uncertain neighbors collaborative filtering recommendation algorithm [J]. Chinese Journal of Computers, 2010, 33(8): 1369-1377.)

[9]

LUO H, NIU C, SHEN R, et al. A collaborative filtering framework based on both local user similarity and global user similarity [J]. Machine Learning, 2008, 72(3):231-245.

[10]

AHN H J. A new similarity measure for collaborative filtering to alleviate the new user coldstarting problem [J]. Information Sciences, 2008, 178(1):37-51.

[11]

HERLOCKER J L, KONSTAN J A, BORCHERS A, et al. An algorithmic framework for performing collaborative filtering [C]// Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 1999: 230-237.

[12]

JAMALI M, ESTER M. Trustwalker: a random walk model for combining trustbased and itembased recommendation [C]// Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2009: 397-406.

[13]

BOBADILLA J, ORTEGA F, HERNANDO A, et al. A similarity metric designed to speed up, using hardware, the recommender systems knearest neighbors algorithm [J]. KnowledgeBased Systems, 2013, 51: 27-34.

[14]

BOBADILLA J, ORTEGA F, HERNANDO A. A collaborative filtering similarity measure based on singularities [J]. Information Processing & Management, 2012, 48(2): 204-217.

[15]

PATRA B K, LAUNONEN R, OLLIKAINEN V, et al. Exploiting Bhattacharyya similarity measure to diminish user coldstart problem in sparse data [M]// Discovery Science. Berlin: Springer, 2014: 252-263.

[16]

KAILATH T. The divergence and Bhattacharyya distance measures in signal selection [J]. IEEE Transactions on Communication Technology, 1967, 15(1): 52-60.

[17]

JAIN A K. On an estimate of the Bhattacharyya distance [J]. IEEE Transactions on Systems Man & Cybernetics, 1976, SMC6(11): 763-766.

[18]

BOBADILLA J, ORTEGA F, HERNANDO A, et al. A collaborative filtering approach to mitigate the new user cold start problem [J]. KnowledgeBased Systems, 2012, 26: 225-238.

[19]

BREESE J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering [C]// Proceedings of the Conference on Uncertainty in Artificial Intelligence. San Francisco: Morgan Kaufmann, 1998: 43-52.

[20]

BOBADILLA J, SERRADILLA F, BERNAL J. A new collaborative filtering metric that improves the behavior of recommender systems [J]. KnowledgeBased Systems, 2010, 23(6):520-528.

猜你喜歡
巴氏相似性度量
巴氏鈍綏螨對(duì)普通大薊馬的功能反應(yīng)及田間防效
淺談巴氏鮮奶的發(fā)展現(xiàn)狀
不欣賞自己的人,難以快樂
突出知識(shí)本質(zhì) 關(guān)注知識(shí)結(jié)構(gòu)提升思維能力
基于GARCH—VaR模型的股票市場(chǎng)風(fēng)險(xiǎn)度量研究
基于GARCH—VaR模型的股票市場(chǎng)風(fēng)險(xiǎn)度量研究
三參數(shù)射影平坦芬斯勒度量的構(gòu)造
12個(gè)毫無違和感的奇妙動(dòng)物組合
基于隱喻相似性研究[血]的慣用句
釋放巴氏鈍緩螨防治柑橘紅蜘蛛應(yīng)用技術(shù)