劉沛文 陳華鋒
(武漢大學(xué)國家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)(武漢大學(xué)計算機(jī)學(xué)院 湖北 武漢 430072)
基于用戶行為特征的動態(tài)權(quán)重混合推薦算法
劉沛文 陳華鋒
(武漢大學(xué)國家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)(武漢大學(xué)計算機(jī)學(xué)院 湖北 武漢 430072)
推薦系統(tǒng)可以為不同的用戶定制個性化的網(wǎng)絡(luò)服務(wù),如何提供準(zhǔn)確的推薦則成為其最大難點(diǎn)。針對傳統(tǒng)推薦算法的稀疏性問題,提出基于用戶行為特征的動態(tài)權(quán)重混合推薦算法。通過對數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,計算出不同用戶對于不同物品的個性化行為特征指數(shù),并將其引入相似度的計算中。依據(jù)用戶評分?jǐn)?shù)據(jù)稀疏性的差異計算出動態(tài)權(quán)重,并依此將基于用戶內(nèi)容的推薦和協(xié)同過濾推薦進(jìn)行動態(tài)混合。實驗結(jié)果表明,該算法在稀疏數(shù)據(jù)集中能有效降低推薦誤差,提高推薦精度。
行為特征 動態(tài)權(quán)重 混合推薦算法
為了能夠提供更好的產(chǎn)品設(shè)計和用戶服務(wù),電子商務(wù)和社交網(wǎng)絡(luò)始終致力于提高對用戶興趣的理解和預(yù)測。2013年下半年,Twitter通過監(jiān)測用戶關(guān)注和轉(zhuǎn)發(fā)等操作,設(shè)計了一個向個人推薦推文和賬戶的新功能。推薦系統(tǒng)開始大范圍的應(yīng)用于Amazon、Netflix和LinkedIn等網(wǎng)站。
在推薦系統(tǒng)中,推薦算法是其核心。傳統(tǒng)的推薦算法主要包括基于內(nèi)容的過濾算法CBF(Content-based Filtering)、協(xié)同過濾算法CF(Collaborative Filtering)和混合過濾算法HR(Hybrid Recommendation)等[1]。
基于內(nèi)容的過濾算法使用對象的自身信息來進(jìn)行推薦,核心思想是針對待推薦的目標(biāo)用戶,其將來很可能對與該用戶相似的用戶以往感興趣的物品或在內(nèi)容上與該用戶以往感興趣的物品相似的物品仍然感興趣[2]。針對算法的計算對象,基于內(nèi)容的推薦算法可分為基于用戶內(nèi)容的過濾算法和基于項目內(nèi)容的過濾算法[3]。兩種算法分別從用戶和物品的角度,分析目標(biāo)用戶或物品與其他用戶或物品之間因自身內(nèi)容或?qū)傩缘牟煌嬖诘膬?nèi)在聯(lián)系,例如用戶資料、物品描述等,利用相似度計算公式計算用戶或物品間的相似程度,最終加權(quán)計算出推薦預(yù)測值,并按預(yù)測值的大小來決定目標(biāo)用戶的推薦物品。
協(xié)同過濾算法分為兩種,基于用戶的協(xié)同過濾算法UBCF(User-based Collaborative Filtering)和基于項目的協(xié)同過濾算法IBCF(Item-based Collaborative Filtering)[4],其依據(jù)用戶對物品的歷史評分,分別計算用戶或物品間的相似度,找到與目標(biāo)用戶或目標(biāo)物品相似的對象,并根據(jù)相似對象的歷史評分信息計算目標(biāo)用戶對目標(biāo)物品的推薦預(yù)測值,以此來進(jìn)行推薦。
混合過濾算法是將上述提到了多種推薦算法進(jìn)行不同方式的融合,進(jìn)而衍生出的一種推薦算法[5]。大多是引入一個平衡因子,通過線性公式將推薦算法進(jìn)行混合,并通過在特定測試數(shù)據(jù)集上對特定用戶的反復(fù)實驗來確定平衡因子的值。
雖然以上推薦算法在目前的推薦系統(tǒng)中已經(jīng)得到了較為廣泛的應(yīng)用,但還存在以下幾個問題:
(1) 推薦效果強(qiáng)烈依賴于用戶和項目的歷史數(shù)據(jù),受數(shù)據(jù)集稀疏性的干擾[6];
(2) 傳統(tǒng)的混合推薦算法不能靈活感知用戶在不同時期、不同用戶所產(chǎn)生的動態(tài)的個性化偏好[7];
(3) 在實際應(yīng)用中,混合推薦的固定權(quán)重不能適應(yīng)數(shù)據(jù)集中不同用戶數(shù)據(jù)稀疏性的個性化差異。
針對上述問題,本文提出一種基于用戶行為特征的動態(tài)權(quán)重混合推薦算法DWHR(Dynamic-Weighted Hybrid Recommendation),其核心思想是根據(jù)用戶在不同的時期所產(chǎn)生的行為操作,例如評分、瀏覽記錄等,自適應(yīng)地將多種推薦算法進(jìn)行動態(tài)加權(quán),預(yù)測用戶對于該物品的喜好程度。在MovieLens公共電影評分?jǐn)?shù)據(jù)集上的實驗結(jié)果表明,該算法可以針對不同用戶的個性化差異,有效提高在稀疏數(shù)據(jù)集下的推薦精度。
1.1 相關(guān)定義
1.1.1 評分矩陣
在推薦系統(tǒng)中,定義U={u1,u2,…,um}為系統(tǒng)中所有m個用戶的集合,I={i1,i2,…,in}為所有n個項目的集合。則評分矩陣R[m×n]可用表1表示。其中,用戶i對項目j的評分表示為rij。若rij=0,則表示用戶i對項目j未進(jìn)行評分。另外,針對MovieLens數(shù)據(jù)集,定義X={x1,x2,…,x19}為所有19種電影類型,而每種電影類型中又包含了多部電影,即xa={ii},ii∈I,xa∈X。
表1 評分矩陣R[m×n]
1.1.2 相似度定義
(1)
(2)
(3)
(4)其中,T={i|ui≠0∧vi≠0}。從以上公式中可以看出,相對于余弦相似度和皮爾遜相似度,歐氏距離強(qiáng)調(diào)在向量中每個維度在數(shù)值特征上的絕對差異;而余弦相似度關(guān)注的是向量每個維度間的相對差異;修正余弦相似度在余弦相似度的基礎(chǔ)上,修正了其可能在度量標(biāo)準(zhǔn)上存在的不統(tǒng)一的問題;而皮爾遜相似度進(jìn)一步將向量的計算維度縮小至兩向量共有數(shù)據(jù)的維度上。
針對MovieLens數(shù)據(jù)集,評分矩陣可以被看作是針對用戶的n維或是針對項目的m維向量,然后根據(jù)上述公式即可針對不同情況計算出用戶或物品之間的相似度。
1.1.3 用戶行為特征定義及提取
一些早期的推薦模型常常假定用戶的興趣愛好是固定的,以至于在任何情況下系統(tǒng)總是推薦同一類型的項目給用戶。但事實上,用戶的興趣經(jīng)常隨著時間及周圍環(huán)境的影響而改變。比如,用戶在不同的季節(jié)或不同的年齡段喜歡穿不同款式的衣服,看不同類型的電影等。所以,行為特征是用戶由外界環(huán)境影響所引發(fā)的一系列行為表現(xiàn)。
為了量化行為特征,選取MovieLens數(shù)據(jù)集中用戶在不同時間和不同年齡段對不同類型電影的評分情況作為量化指標(biāo)。在通常情況下,用戶如果喜歡一部電影,其評分往往會高于均分。由于MovieLens數(shù)據(jù)集的評分范圍是1~5,因此定義3分為用戶的評分喜好點(diǎn),即如果用戶對一部電影的評分大于等于3分,則說明用戶是喜歡此部電影的。本文定義時間特征指數(shù)monthlike(m,xa)為用戶在m月對xa類型電影的喜好程度;年齡特征指數(shù)agelike(i,xa)為用戶i所在的年齡段xa類型電影的喜好程度,其中年齡段依據(jù)數(shù)據(jù)集中的標(biāo)示進(jìn)行劃分。二者的計算公式如下:
(5)
(6)
其中,Lm,xa表示用戶在m月中喜歡xa類型電影的評分?jǐn)?shù)據(jù)集合,Li,xa表示用戶i所對應(yīng)的年齡段喜歡xa類型電影的評分?jǐn)?shù)據(jù)集合,Lxa表示評分?jǐn)?shù)據(jù)中所有喜歡xa類型電影的評分集合。
依據(jù)上述公式對MovieLens數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,計算出每個月份和每個年齡段的用戶對不同類型電影的特征指數(shù),結(jié)果如圖1和圖2所示。從圖1可看出,用戶隨著其年齡的增長,觀看電影的數(shù)量總體上呈先上升再下降的趨勢。而針對不同的年齡段的用戶,其對不同類型的電影也有著較為明顯的區(qū)別,例如25歲以下的用戶最喜愛動畫片,而25~45歲的用戶喜歡紀(jì)錄片的居多。從圖2可看出,用戶在8月和11月最喜歡看電影。而在1月用戶最喜歡看紀(jì)錄片,在8月喜歡看恐怖片,最不喜歡看紀(jì)錄片。
圖1 不同年齡段對不同類型電影的喜好程度
圖2 不同時間段對不同類型電影的喜好程度
因此,行為特征指數(shù)越大,則此用戶所代表的這類人對該類型的電影越感興趣,則其喜歡對應(yīng)類型電影的可能性越大。
1.1.4 動態(tài)權(quán)重
當(dāng)一個新用戶或新項目進(jìn)入到系統(tǒng)中時,其必然會面對“冷啟動”問題[8-10]。在這種情況下,推薦系統(tǒng)無法利用協(xié)同過濾等基于歷史數(shù)據(jù)的推薦算法進(jìn)行推薦,只有利用基于內(nèi)容的過濾算法,根據(jù)用戶或項目自身特定的屬性和信息來進(jìn)行粗粒推薦;而當(dāng)用戶和項目的歷史數(shù)據(jù)積累到一定數(shù)量之后,基于內(nèi)容的過濾算法過于粗糙的弊端暴露,協(xié)同過濾算法依據(jù)歷史數(shù)據(jù)精確推薦的優(yōu)勢逐漸突出。所以,混合推薦將兩種算法進(jìn)行不同方式的融合,目的在于使單一的推薦算法在不同使用場景中能夠揚(yáng)長避短,提升推薦精度。
傳統(tǒng)的混合推薦算法大多引入一個平衡因子,通過線性公式將兩種或多種推薦算法混合而來[11-14]。其中,平衡因子的取值往往需要在特定的測試數(shù)據(jù)集上反復(fù)實驗,才能找到一個特定的值,來達(dá)到最好的推薦效果。然而,在實際應(yīng)用中,由于項目數(shù)量遠(yuǎn)大于用戶數(shù)量[15],評分?jǐn)?shù)據(jù)矩陣對總體而言十分稀疏,但對于不同的用戶和項目個體來說其稀疏性差別巨大。所以,固定權(quán)重值的混合推薦算法只能針對特定的數(shù)據(jù)集在宏觀上平衡每個個體的推薦誤差,不能很好地滿足用戶的個性差異。
為了解決上述問題,針對不同用戶評分?jǐn)?shù)據(jù)稀疏性的個性化差異,將用戶已評分的物品數(shù)量占物品集總數(shù)量的比值作為動態(tài)權(quán)重平衡因子引入進(jìn)混合推薦中,即依據(jù)用戶評分的多少來動態(tài)決定權(quán)重大小,以此來動態(tài)平衡混合推薦算法中兩種推薦算法所占比重,提出如下計算公式:
(7)
其中,λ為引入的線性因子,用來控制在一定物品數(shù)量下已評分物品數(shù)據(jù)量的線性增長快慢對動態(tài)權(quán)重影響的大小;Tr為用戶i已評分的項目集合,即Tr={r|rij≠0,1≤j≤n},I表示物品集。
1.2 基于用戶行為特征的動態(tài)權(quán)重混合推薦算法
基于用戶行為特征的動態(tài)權(quán)重混合推薦算法主要分為基于內(nèi)容的過濾算法和協(xié)同過濾兩大部分。
首先是基于內(nèi)容過濾算法部分的計算。由上文可知,基于內(nèi)容的過濾算法分為基于用戶和項目兩種。但由于用戶社會網(wǎng)絡(luò)信息的豐富程度遠(yuǎn)高于物品,所以基于用戶內(nèi)容的推薦計算維度更廣,精確度更高。另一方面,在大部分?jǐn)?shù)據(jù)集中,物品數(shù)量極大于用戶數(shù)量,且物品增長速度遠(yuǎn)高于用戶增長速度,所以基于用戶內(nèi)容信息推薦的計算復(fù)雜度遠(yuǎn)低于基于項目信息內(nèi)容過濾算法。因此,基于內(nèi)容的過濾算法部分采用基于用戶內(nèi)容的推薦算法進(jìn)行計算,可分為以下3個步驟:
1) 計算用戶內(nèi)容相似度并組成相似用戶數(shù)據(jù)集
2) 計算用戶行為特征指數(shù)
確定待推薦電影j的電影類型為xj,并遍歷用戶集Ua中每一個用戶和其看過的所有xj類型的電影,根據(jù)式(5)、式(6)分別計算出其對應(yīng)的時間特征指數(shù)monthlike(m,xj)和年齡特征指數(shù)agelike(i,xj)。
3) 計算基于用戶內(nèi)容推薦預(yù)測值
利用加權(quán)平均公式,計算出相似用戶對同類型電影的評分和其特征指數(shù)的基于用戶內(nèi)容推薦的預(yù)測值,即:
PDBR(i,j)=
(8)
其中Ui表示用戶i的基于用戶內(nèi)容推薦的相鄰用戶集,xj表示與電影j相同類型的電影集合,rbk表示用戶b對電影k的評分。
其次進(jìn)行協(xié)同過濾部分的算法計算。由于物品數(shù)量極大于用戶數(shù)量,所以計算物品之間相似度的準(zhǔn)確性會大大優(yōu)于計算用戶之間的。因此,協(xié)同過濾部分的算法采用基于項目的協(xié)同過濾算法。正如上文所述,基于評分矩陣計算相似度更加關(guān)注兩個向量在不同維度之間的相對差異。并且,在評分向量單個維度數(shù)據(jù)稀疏的情況下,皮爾遜相似度可以有效規(guī)避向量之間因線性獨(dú)立所帶來的計算誤差。因此本文采用皮爾遜相似度作為用戶相似度計算的主要方法,相似度計算公式可由式(4)轉(zhuǎn)變?yōu)椋?/p>
PCC(i,j) =simPCC(i,j)
(9)
因此,協(xié)同過濾部分的算法概括為以下2個步驟:
1) 計算物品之間的相似度并組成相似物品數(shù)據(jù)集
根據(jù)式(9)計算出待推薦物品i與任意其他物品j之間的相似度集合SPCC。將SPCC中的相似度按大小進(jìn)行降序排列,并選取前θ個組成相鄰物品數(shù)據(jù)集IPCC。
2) 計算協(xié)同過濾預(yù)測值
針對目標(biāo)用戶,利用IPCC中相似物品的評分?jǐn)?shù)據(jù)進(jìn)行加權(quán),計算出目標(biāo)用戶i對于待推薦物品j的基于項目的協(xié)同過濾的加權(quán)預(yù)測值,即:
(10)
最后,利用式(7)計算出的動態(tài)權(quán)重,將上述基于用戶內(nèi)容的推薦和協(xié)同過濾的推薦算法分別計算出來的預(yù)測值進(jìn)行線性組合,計算出本文提出的基于用戶行為特征的動態(tài)權(quán)重混合推薦算法的預(yù)測結(jié)果,即:
P(i,j)=DynamicWeight(i)·PPCC(i,j)+
(1-DynamicWeight(i))PDBR(i,j)
(11)
2.1 實驗設(shè)計
實驗采用平均絕對誤差MAN(MeanAbsoluteDifference)作為衡量算法準(zhǔn)確性的標(biāo)準(zhǔn),其通過統(tǒng)計算法計算出來的預(yù)測評分與用戶的實際評分之間的絕對距離的均值來實現(xiàn)精確性的度量。介于MAE的計算和實現(xiàn)都非常簡單,所以其已經(jīng)成為絕大多數(shù)文獻(xiàn)中使用的標(biāo)準(zhǔn)[2]。對于n個用戶的實際評分R={r1,r2,…,rn},推薦算法計算出的預(yù)測評分P={p1,p2,…,pn},則MAE計算公式如下:
(12)
其中pi為預(yù)測評分,ri為實際評分。
實驗方案為10折交叉驗證法(10-FoldCross-Validation)[2,3]。此方案將MovieLens數(shù)據(jù)集隨機(jī)分為10個互不相交的數(shù)據(jù)集,輪流選擇其中的一份作為測試數(shù)據(jù)集,其他9份作為訓(xùn)練集,重復(fù)執(zhí)行10次測試算法,保證每個子數(shù)據(jù)集有且僅有一次作為訓(xùn)練集,最后取十次計算結(jié)果的平均值作為實驗的整體結(jié)果。
2.2 實驗結(jié)果及分析
2.2.1 動態(tài)權(quán)重線性因子λ的影響
在式(7)中,動態(tài)權(quán)重線性因子λ起著非常重要的作用,如果λ的取值不當(dāng),會造成動態(tài)權(quán)重DynamicWeight(i)的值過大或者過小,進(jìn)而改變基于用戶內(nèi)容的推薦和協(xié)同過濾兩種推薦算法在混合推薦中所占比重大小,極大影響算法的推薦精度。所以,本次實驗針對在不同線性因子λ下,對本文提出算法的推薦結(jié)果進(jìn)行測試,并對不同的相鄰用戶數(shù)量θ之間的實驗結(jié)果進(jìn)行了對比,實驗結(jié)果如圖3所示。
圖3 不同線性因子λ的實驗結(jié)果對比
從式(7)中可以發(fā)現(xiàn),隨著λ的增加,在最終的預(yù)測評分中協(xié)同過濾部分所占比重增加。而從圖中的曲線變化可知,針對同一相鄰用戶數(shù)量,MAE總體呈下降趨勢,說明相對較大的λ值所提高的協(xié)同過濾比重可以在一定程度上提高推薦的準(zhǔn)確性。特別是當(dāng)λ=4時,算法可以達(dá)到最佳的推薦質(zhì)量。但隨著λ繼續(xù)增大,MAE的數(shù)值并沒有顯著減小,反而略微開始增加,這說明此時協(xié)同過濾預(yù)測所帶來的誤差對結(jié)果的影響增大,而基于用戶內(nèi)容部分在稀疏數(shù)據(jù)中所展現(xiàn)出來的優(yōu)勢在低權(quán)值下無法對結(jié)果產(chǎn)生影響,從而降低了算法的推薦精度。
2.2.2 常見推薦算法推薦效果對比
為了驗證本文算法在提高推薦預(yù)測準(zhǔn)確性方面的有效性,本次實驗選用同是混合推薦算法但采用固定權(quán)重推薦的文獻(xiàn)[16]。優(yōu)化混合推薦算法作為主要對比算法。而在傳統(tǒng)的推薦算法中,相鄰用戶是目標(biāo)用戶預(yù)測評分的關(guān)鍵依據(jù),鄰居規(guī)模的大小都有可能影響推薦算法的準(zhǔn)確度。所以,本次實驗分別對傳統(tǒng)的基于用戶的協(xié)同過濾、基于項目的協(xié)同過濾、優(yōu)化混合推薦算法[16]。以及本文提出的算法等四種算法在不同的相鄰用戶數(shù)量θ下的推薦精度進(jìn)行對比。實驗結(jié)果如圖4所示。
圖4 不同相鄰用戶數(shù)量θ的實驗結(jié)果對比
由圖可知,不論是文獻(xiàn)[16]算法還是本文的算法,其核心都是將多種推薦算法進(jìn)行組合,減小傳統(tǒng)單一推薦算法在不同使用場景下的計算誤差,所以混合算法的推薦精度都遠(yuǎn)高于傳統(tǒng)單一推薦算法。而針對混合推薦算法,由于文獻(xiàn)[16]算法在計算相似度的過程中采用固定權(quán)重的方式將物品屬性相似性和修正余弦相似度線性組合,忽略了相鄰用戶個體評分?jǐn)?shù)據(jù)稀疏性差異以及用戶評分?jǐn)?shù)據(jù)受外界條件等因素的影響。因此,從實驗結(jié)果可以看出,本文所提出的推薦算法在不同數(shù)量的相鄰用戶下其MAE均小于文獻(xiàn)[16]中的混合推薦算法,推薦效果一直處于較高的優(yōu)勢,并隨著相鄰用戶數(shù)量的增加,優(yōu)勢也逐漸增加。就本文提出的算法而言,隨著相鄰用戶數(shù)量的增加,MAE總體呈下降趨勢,特別是當(dāng)50<θ<60,即相鄰用戶數(shù)量取到所有訓(xùn)練集用戶數(shù)量的50%~60%時,MAE值取最小,推薦效果最好。而當(dāng)相鄰用戶數(shù)量超過60%時,由于過多的鄰居評分引入了更多相似度不高的噪聲數(shù)據(jù),從而降低了推薦精度,影響了算法的推薦效果。
本文對傳統(tǒng)的混合推薦算法進(jìn)行了優(yōu)化,將用戶行為特征進(jìn)行量化并引入到用戶相似度的計算中來,并根據(jù)用戶數(shù)據(jù)稀疏性的個性化差異,自適應(yīng)地將多種推薦算法動態(tài)連接并進(jìn)行推薦預(yù)測。實驗結(jié)果表明,該算法從多方面縮小因單一推薦算法所帶來的推薦誤差,極大地提高了傳統(tǒng)單一推薦算法在稀疏數(shù)據(jù)集中推薦的準(zhǔn)確性。相較于其他的混合過濾算法,引入動態(tài)權(quán)重的概念來調(diào)整不同推薦算法所占的比重,有效平衡因用戶歷史數(shù)據(jù)集稀疏性的個性差異所帶來的推薦誤差,提高推薦質(zhì)量。從實驗中發(fā)現(xiàn),算法在相鄰用戶數(shù)量較低的情況下推薦精度下降,并且混合推薦自身存在的計算量大、耗時長等問題,下一步該算法還需在以上兩個方面進(jìn)行深入研究。
[1]AdomaviciusG,TuzhilinA.Towardthenextgenerationofrecommendersystems:Asurveyofthestate-of-the-artandpossibleextensions[J].IEEETransactionsonKnowledgeandDataEngineering,2005,17(6):734-749.
[2] 任磊.推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].上海:華東師范大學(xué),2012.
[3] 朱文奇.推薦系統(tǒng)用戶相似度計算方法研究[D].重慶:重慶大學(xué),2014.
[4]GuptaJ,GadgeJ.Performanceanalysisofrecommendationsystembasedoncollaborativefilteringanddemographics[C]//Communication,Information&ComputingTechnology(ICCICT),2015InternationalConferenceon.IEEE,2015:1-6.
[5] 趙偉明.基于用戶行為分析和混合推薦策略的個性化推薦方法研究[D].北京:北京工業(yè)大學(xué),2014.
[6]AbhishekK,KulkarniS,ArchanaVKN,etal.AReviewonPersonalizedInformationRecommendationSystemUsingCollaborativeFiltering[J].InternationalJournalofComputerScienceandInformationTechnologies(IJCSIT),2011,2(3):1272-1278.
[7]ScheinAI,PopesculA,UngarLH,etal.Methodsandmetricsforcold-startrecommendations[C]//Proceedingsofthe25thAnnualInternationalACMSIGIRConferenceonResearchandDevelopmentinInformationRetrieval.ACM,2002:253-260.
[8]BaoH,LiQ,LiaoSS,etal.AnewtemporalandsocialPMF-basedmethodtopredictusers’interestsinmicro-blogging[J].DecisionSupportSystems,2013,55(3):698-709.
[9]LeeTQ,ParkY,ParkYT.Atime-basedapproachtoeffectiverecommendersystemsusingimplicitfeedback[J].ExpertSystemswithApplications,2008,34(4):3055-3062.
[10]KoenigsteinN,DrorG,KorenY.Yahoo!musicrecommendations:modelingmusicratingswithtemporaldynamicsanditemtaxonomy[C]//ProceedingsoftheFifthACMConferenceonRecommenderSystems.ACM,2011:165-172.
[11] 張騰季.個性化混合推薦算法的研究[D].杭州:浙江大學(xué),2013.
[12] 張新猛,蔣盛益,李霞,等.基于網(wǎng)絡(luò)和標(biāo)簽的混合推薦算法[J].計算機(jī)工程與應(yīng)用,2015,51(1):119-124.
[13]PazzaniMJ,BillsusD.Content-basedrecommendationsystems[M]//TheAdaptiveWeb.Springer,2007:325-341.
[14]ChenW,NiuZ,ZhaoX,etal.Ahybridrecommendationalgorithmadaptedine-learningenvironments[J].WorldWideWeb,2014,17(2):271-284.
[15]TangX,ZhouJ.Dynamicpersonalizedrecommendationonsparsedata[J].IEEETransactionsonKnowledgeandDataEngineering,2013,25(12):2895-2899.
[16] 李鵬飛,吳為民.基于混合模型推薦算法的優(yōu)化[J].計算機(jī)科學(xué),2014,41(2):68-71,98.
A DYNAMIC-WEIGHTED HYBRID RECOMMENDATION ALGORITHM BASED ON USER BEHAVIOR CHARACTERISTICS
Liu Peiwen Chen Huafeng
(NationalEngineeringResearchCenterforMultimediaSoftware,WuhanUniversity,Wuhan430072,Hubei,China)(CollegeofComputer,WuhanUniversity,Wuhan430072,Hubei,China)
A recommendation system can personalize website service for different users, and how to provide accurate recommendations has become the biggest difficulty. Aiming at the sparsity problem of traditional recommendation algorithm, dynamic-weighted hybrid recommendation algorithm based on user behavior characteristics is proposed. Through the data preprocessing in dataset, the personalized behavior characteristic index of different users for different items is calculated and introduced into the similarity calculation. The dynamic weight is calculated according to the difference of the user’s rate data sparseness, and the user’s content recommendation and collaborative filtering recommendation are dynamically mixed. Experimental results show that the proposed algorithm can reduce the recommendation error effectively and improve the recommendation accuracy in the sparse data set.
User behavior characteristics Dynamic-weighted Hybrid recommendation algorithm
2016-03-19。劉沛文,碩士生,主研領(lǐng)域:模式識別與智能系統(tǒng)。陳華鋒,博士生。
TP301.6
A
10.3969/j.issn.1000-386x.2017.04.054