摘? 要:基于線(xiàn)性模型的矩陣分解推薦算法對(duì)信息的特征提取單一,當(dāng)用戶(hù)和物品含有大量隱含信息時(shí),無(wú)法滿(mǎn)足用戶(hù)需求的個(gè)性化推薦。針對(duì)此問(wèn)題,提出一種評(píng)分和社會(huì)標(biāo)簽融合的卷積神經(jīng)網(wǎng)絡(luò)推薦算法,該算法能夠根據(jù)上下文信息,利用非線(xiàn)性模型提取隱含高階信息,處理復(fù)雜且稀疏的數(shù)據(jù)。首先,設(shè)計(jì)由兩路由多層感知器和卷積神經(jīng)網(wǎng)絡(luò)組成的深層網(wǎng)絡(luò)結(jié)構(gòu),分別實(shí)現(xiàn)利用社會(huì)標(biāo)簽信息和用戶(hù)評(píng)分信息建模用戶(hù)興趣和項(xiàng)目信息的潛在特征向量;然后,構(gòu)建對(duì)多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)后的結(jié)果進(jìn)行融合的輸出層,得出預(yù)測(cè)結(jié)果;最后,運(yùn)用真實(shí)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證。結(jié)果表明,該算法與當(dāng)前主流的推薦模型相比,能更好地利用社會(huì)標(biāo)簽信息進(jìn)行精準(zhǔn)推薦。
關(guān)鍵詞:評(píng)分;社會(huì)標(biāo)簽;卷積神經(jīng)網(wǎng)絡(luò);推薦模型
中圖分類(lèi)號(hào):TP391.3? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):2096-1472(2021)-09-28-04
Abstract: Matrix factorization recommendation algorithm based on linear model extracts single characteristics of information. It cannot meet user's need for personalized recommendation when users and items contain a large amount of hidden information. Aiming at this problem, this paper proposes a convolutional neural network recommendation algorithm combining rating and social tags. The algorithm can extract hidden high-order information using a nonlinear model based on context information, and process complex and sparse data. First, a deep network structure composed of two-route multi-layer sensors and convolutional neural networks is designed, which realizes the use of social tag information and user rating information to model the potential feature vectors of user interests and item information. Then, a multi-layer neural network after learning is built, and the fusion output layer is used to obtain the prediction result. Finally, the real data set is used for experimental verification. The results show that compared with the current mainstream recommendation models, the proposed algorithm can better utilize social tag information for accurate recommendation.
Keywords: rating; social tag; convolutional neural network; recommendation model
1? ?引言(Introduction)
隨著社會(huì)化網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)上充斥著各個(gè)領(lǐng)域的海量數(shù)據(jù),信息過(guò)載問(wèn)題日益嚴(yán)峻。推薦系統(tǒng)已經(jīng)成為確保用戶(hù)在網(wǎng)絡(luò)中快速獲取所需信息的一個(gè)重要技術(shù)手段,也是當(dāng)前世界各國(guó)學(xué)者及工業(yè)界研究的一個(gè)熱點(diǎn)問(wèn)題。近些年,一些人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域的重要學(xué)術(shù)會(huì)議已經(jīng)將推薦系統(tǒng)列為其中的一個(gè)重要研究方向,推薦技術(shù)得到前所未有的發(fā)展。
推薦系統(tǒng)的發(fā)展主要經(jīng)歷了三個(gè)階段:基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦及基于深度學(xué)習(xí)的推薦。傳統(tǒng)的基于內(nèi)容的推薦主要根據(jù)上下文選擇資源描述相似的項(xiàng)目向用戶(hù)推薦。協(xié)同過(guò)濾推薦主要是依據(jù)用戶(hù)對(duì)項(xiàng)目的評(píng)分進(jìn)行預(yù)測(cè),矩陣分解技術(shù)在協(xié)同過(guò)濾過(guò)程中被廣泛應(yīng)用。隨著深度學(xué)習(xí)技術(shù)逐漸應(yīng)用在各個(gè)領(lǐng)域中,基于深度學(xué)習(xí)的推薦算法受到當(dāng)前學(xué)者的廣泛關(guān)注。文獻(xiàn)[1]提出了基于用戶(hù)評(píng)論的深度情感分析和多視圖協(xié)同融合的混合推薦算法。該算法使用用戶(hù)對(duì)物品的評(píng)分?jǐn)?shù)據(jù)、隱式反饋信息等對(duì)用戶(hù)進(jìn)行情感分析,利用對(duì)物品的文本描述計(jì)算物品相似性,在此基礎(chǔ)上構(gòu)建基于協(xié)同訓(xùn)練的混合推薦算法。文獻(xiàn)[2]提出一種深度學(xué)習(xí)模型,該模型從用戶(hù)評(píng)論和商品評(píng)論文本中提取用戶(hù)和商品的潛在非線(xiàn)性特征向量,將其與隱向量融合來(lái)預(yù)測(cè)用戶(hù)對(duì)商品的評(píng)分。文獻(xiàn)[3]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)與約束概率矩陣分解的推薦算法。該算法運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)項(xiàng)目特征矩陣進(jìn)行初始化,利用約束概率矩陣對(duì)用戶(hù)特征矩陣進(jìn)行初始化,最后擬合評(píng)分矩陣來(lái)預(yù)測(cè)用戶(hù)對(duì)項(xiàng)目的評(píng)分。文獻(xiàn)[4]建立了改進(jìn)神經(jīng)協(xié)同過(guò)濾模型,利用多層感知機(jī)的非線(xiàn)性特征處理提取隱含高階特征的信息,以及利用貝葉斯個(gè)性化排序算法提取排序信息,結(jié)合電影流行度和電影類(lèi)型因子進(jìn)行推薦得分。以上推薦系統(tǒng)模型引入了深度學(xué)習(xí),利用文本和評(píng)分建立了非線(xiàn)性特征向量,但是在特征提取過(guò)程中,并未考慮用戶(hù)評(píng)論的時(shí)效性,因?yàn)橛脩?hù)的興趣會(huì)隨著時(shí)間推移、年齡增長(zhǎng)、環(huán)境變化等而發(fā)生變化。因此,本文提出一種融合社會(huì)標(biāo)簽和評(píng)分的卷積神經(jīng)網(wǎng)絡(luò)模型DSR-CNN(Dynamic Social Tag and Rating-Convolutional Neural Network)。
2? ?相關(guān)工作(Related work)
2.1? ?基于社會(huì)標(biāo)簽的推薦方法
很多學(xué)者不僅使用評(píng)分?jǐn)?shù)據(jù)進(jìn)行推薦,還將隱式數(shù)據(jù)引入算法中,比如信任關(guān)系、社會(huì)標(biāo)簽等,使得推薦效果大幅提升。文獻(xiàn)[5]提出了一種融合社會(huì)標(biāo)簽的近鄰感知的聯(lián)合概率矩陣分解推薦算法。該算法通過(guò)標(biāo)簽的相似性來(lái)計(jì)算用戶(hù)間和資源之間的相似性,進(jìn)行近鄰選擇;然后構(gòu)建用戶(hù)-資源評(píng)分矩陣、用戶(hù)-標(biāo)簽標(biāo)注矩陣、資源-標(biāo)簽關(guān)聯(lián)矩陣,運(yùn)用聯(lián)合概率矩陣分解方法計(jì)算三個(gè)矩陣的隱含特征向量,通過(guò)對(duì)訓(xùn)練模型進(jìn)行參數(shù)優(yōu)化,為用戶(hù)進(jìn)行推薦。文獻(xiàn)[6]提出了一種融合社會(huì)標(biāo)簽和信任關(guān)系的社會(huì)網(wǎng)絡(luò)推薦方法。該方法利用概率因式分解技術(shù)實(shí)現(xiàn)了社會(huì)信任關(guān)系、項(xiàng)目標(biāo)記信息和用戶(hù)項(xiàng)目評(píng)分矩陣的集成;從不同維度出發(fā),實(shí)現(xiàn)了用戶(hù)和項(xiàng)目潛在特性空間的互聯(lián);再通過(guò)概率矩陣因式分解技術(shù)實(shí)現(xiàn)降維,從而實(shí)現(xiàn)了有效的社會(huì)化推薦。文獻(xiàn)[7]提出一個(gè)融合社交行為和標(biāo)簽行為的推薦算法。該算法用引力模型計(jì)算社交網(wǎng)絡(luò)中用戶(hù)節(jié)點(diǎn)之間的吸引力來(lái)度量用戶(hù)社交行為的相似性;再通過(guò)標(biāo)簽信息構(gòu)建用戶(hù)喜好物體模型,并使用引力公式計(jì)算喜好物體之間的引力來(lái)度量標(biāo)簽行為的相似性;最后,引入變量融合兩方面信息,獲取近鄰用戶(hù),產(chǎn)生推薦。
以上融合社會(huì)標(biāo)簽的算法相對(duì)于傳統(tǒng)推薦算法,在推薦質(zhì)量上有了顯著提高。但當(dāng)用戶(hù)和物品含有大量隱含信息時(shí),仍無(wú)法滿(mǎn)足用戶(hù)需求的個(gè)性化推薦,因此本文提出融合評(píng)分和標(biāo)簽的卷積神經(jīng)網(wǎng)絡(luò)推薦模型,以緩解冷啟動(dòng)及數(shù)據(jù)稀疏問(wèn)題。
2.2? ?融合卷積神經(jīng)網(wǎng)絡(luò)的推薦方法
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一類(lèi)包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一[8-9],其基本結(jié)構(gòu)為四層:輸入層、卷積層、池化層、輸出層。輸入層用于獲取輸入信息;卷積層用于對(duì)輸入信息的特征提取;池化層用于減少參數(shù)和特征數(shù)量,提取關(guān)鍵特征,防止過(guò)擬合;輸出層用于將處理后的文本潛在特征向量輸出。CNN在計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用較為廣泛,近些年,學(xué)者們陸續(xù)將CNN運(yùn)用到了推薦模型中的文本處理上,通過(guò)CNN提取隱式信息的特征,能夠?qū)ξ谋具M(jìn)行更深入的學(xué)習(xí),提高推薦精度[10-11]。
文獻(xiàn)[12]提出融合動(dòng)態(tài)協(xié)同過(guò)濾和深度學(xué)習(xí)的推薦算法,將時(shí)間因素融入?yún)f(xié)同過(guò)濾算法中,利用深度學(xué)習(xí)模型來(lái)學(xué)習(xí)用戶(hù)和電影特征信息,形成高維潛在空間的用戶(hù)特征和電影特征的隱向量,進(jìn)而融合到動(dòng)態(tài)協(xié)同過(guò)濾算法中進(jìn)行推薦。文獻(xiàn)[13]為緩解推薦系統(tǒng)中數(shù)據(jù)稀疏性問(wèn)題,提出一種改進(jìn)CNN的局部相似性預(yù)測(cè)推薦模型LSPCNN。該模型對(duì)初始用戶(hù)-項(xiàng)目評(píng)分矩陣進(jìn)行迭代調(diào)整,使用戶(hù)興趣偏好局部特征化,再融合CNN對(duì)缺失評(píng)分進(jìn)行預(yù)測(cè),從而實(shí)施個(gè)性化推薦。本文在以上工作基礎(chǔ)上進(jìn)行改進(jìn),建立兩路神經(jīng)網(wǎng)絡(luò)模型:一路網(wǎng)絡(luò)對(duì)以用戶(hù)ID檢索的評(píng)分矩陣和用戶(hù)標(biāo)注的標(biāo)簽信息進(jìn)行訓(xùn)練;另一路網(wǎng)絡(luò)對(duì)以項(xiàng)目ID檢索的評(píng)分矩陣和項(xiàng)目被標(biāo)注的標(biāo)簽信息進(jìn)行深度學(xué)習(xí),利用融合層對(duì)用戶(hù)特征偏好和項(xiàng)目特征信息進(jìn)行融合輸出,進(jìn)而提高推薦準(zhǔn)確性。
3? DSR-CNN模型描述(DSR-CNN model description)
本文提出融合評(píng)分和標(biāo)簽的卷積神經(jīng)網(wǎng)絡(luò)模型DSR-CNN,其模型結(jié)構(gòu)如圖1所示。本模型由四路并行的神經(jīng)網(wǎng)絡(luò)組成。首先,其中兩路神經(jīng)網(wǎng)絡(luò)從用戶(hù)角度和項(xiàng)目角度分別運(yùn)用多層感知器對(duì)評(píng)分矩陣的行向量信息和列向量信息進(jìn)行提取,進(jìn)而獲得用戶(hù)評(píng)分潛在特征向量和項(xiàng)目評(píng)分潛在特征向量;另外兩路神經(jīng)網(wǎng)絡(luò)使用卷積神經(jīng)網(wǎng)絡(luò)分別對(duì)用戶(hù)標(biāo)注的標(biāo)簽信息、項(xiàng)目標(biāo)簽信息進(jìn)行深度學(xué)習(xí),從而獲得用戶(hù)標(biāo)注標(biāo)簽潛在特征向量和項(xiàng)目標(biāo)簽潛在特征向量。其次,將用戶(hù)評(píng)分和用戶(hù)標(biāo)注標(biāo)簽潛在特征向量融合得到用戶(hù)特征的矩陣;將項(xiàng)目評(píng)分和項(xiàng)目標(biāo)簽潛在特征向量融合得到項(xiàng)目特征矩陣。第三,將上一步驟的結(jié)果輸入融合層,再進(jìn)行預(yù)測(cè)評(píng)分輸出。本文僅講解如何運(yùn)用多層感知器及CNN提取用戶(hù)特征,由于項(xiàng)目特征提取過(guò)程與用戶(hù)特征提取過(guò)程類(lèi)似,因此不再贅述。
3.1? ?用戶(hù)動(dòng)態(tài)特征提取模塊
3.1.1? ?用戶(hù)評(píng)分潛在特征向量提取
用戶(hù)評(píng)分潛在特征向量提取包括評(píng)分矩陣輸入層、特征向量層、多層MLP層、輸出層。假設(shè)有 個(gè)用戶(hù)、 個(gè)項(xiàng)目,分別表示為,。用戶(hù)-項(xiàng)目評(píng)分矩陣記為,表示用戶(hù)對(duì)項(xiàng)目的評(píng)分,當(dāng)用戶(hù)對(duì)項(xiàng)目無(wú)評(píng)分時(shí),=0;矩陣中行數(shù)據(jù)代表用戶(hù)對(duì)每個(gè)項(xiàng)目的評(píng)分,列數(shù)據(jù)代表項(xiàng)目獲得的用戶(hù)評(píng)分。代表用戶(hù)潛在特征矩陣,代表項(xiàng)目潛在特征矩陣,向量表示用戶(hù)的維特征向量,表示項(xiàng)目的維特征向量。獲得了用戶(hù)評(píng)分特征向量后,將其作為輸入數(shù)據(jù)輸入多層感知器(MLP)中,經(jīng)過(guò)MLP深度學(xué)習(xí)獲得用戶(hù)潛在特征向量,各層MLP學(xué)習(xí)后的輸出結(jié)果表示如式(1)所示。
其中,是用戶(hù)經(jīng)過(guò)MLP學(xué)習(xí)的評(píng)分特征向量,是第個(gè)評(píng)分矩陣,為第個(gè)偏置,為MLP中的隱藏層數(shù),是非線(xiàn)性激活函數(shù)。
3.1.2? ?用戶(hù)標(biāo)注標(biāo)簽潛在特征向量提取
通常,用戶(hù)在網(wǎng)絡(luò)上對(duì)喜歡的資源標(biāo)注標(biāo)簽,標(biāo)簽的信息能夠反映出用戶(hù)的喜好。因此本文利用CNN提取用戶(hù)標(biāo)注標(biāo)簽信息,進(jìn)而建立用戶(hù)特征矩陣。用戶(hù)標(biāo)注標(biāo)簽潛在特征向量提取包括標(biāo)簽矩陣輸入層、嵌入層、用戶(hù)標(biāo)注標(biāo)簽特征向量層、池化層、輸出層,其框架圖如圖2所示。
用戶(hù)標(biāo)注標(biāo)簽潛在特征向量提取模塊首先利用詞嵌入技術(shù)將標(biāo)簽的稀疏矩陣向量映射為稠密矩陣向量,然后使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)提取標(biāo)簽信息的語(yǔ)義特征。假設(shè)有 個(gè)標(biāo)簽,用戶(hù)標(biāo)注標(biāo)簽矩陣記為,表示用戶(hù)標(biāo)注的標(biāo)簽。用戶(hù)對(duì)項(xiàng)目標(biāo)注標(biāo)簽記為,其中是標(biāo)簽中第 個(gè)文本的詞嵌入向量,嵌入層將標(biāo)簽表中的每個(gè)詞映射到維的向量中,。如果同一個(gè)標(biāo)簽出現(xiàn)多次,則相同標(biāo)簽共享嵌入內(nèi)容,因此利用文本嵌入方法將每個(gè)標(biāo)簽轉(zhuǎn)換成詞嵌入矩陣,其中表示文本長(zhǎng)度。
CNN中的卷積層用來(lái)從標(biāo)簽文本中提取語(yǔ)義特征向量。假設(shè)有個(gè)卷積濾波器,分別表示為,每個(gè)濾波器的輸入?yún)?shù)均由矩陣構(gòu)成,其中表示濾波器窗口的大小,表示向量維度。第個(gè)濾波器在嵌入矩陣上的卷積計(jì)算結(jié)果如式(2)所示。
其中,代表非線(xiàn)性激活函數(shù),代表卷積運(yùn)算,是的偏差參數(shù)。第個(gè)濾波器產(chǎn)生的標(biāo)簽特征向量,然后使用H卷積濾波器獲取多種特征,公式如式(3)所示。
池化層的作用主要是提取通過(guò)卷積層得到的特征向量中的最大值,本文利用最大池化方法獲取最重要的信息,操作如式(4)所示。
之后進(jìn)入全連接層,即將用戶(hù)評(píng)分特征向量和用戶(hù)標(biāo)簽特征向量采用加權(quán)處理得到用戶(hù)的潛在特征向量表示,其操作定義如式(5)所示。
3.2? ?融合模塊和預(yù)測(cè)輸出模塊
多層感知器學(xué)習(xí)得到用戶(hù)評(píng)分矩陣,卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到用戶(hù)標(biāo)注標(biāo)簽矩陣,兩者融合得到用戶(hù)深度特征向量,融合公式如式(6)所示。
同理,分別經(jīng)過(guò)感知器學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)計(jì)算得到項(xiàng)目被評(píng)分矩陣和項(xiàng)目被標(biāo)注標(biāo)簽矩陣,兩者融合得到項(xiàng)目深度特征向量,融合公式如式(7)所示。
利用公式(8)對(duì)用戶(hù)深度特征向量和項(xiàng)目深度特征向量進(jìn)行融合得到預(yù)測(cè)值。
公式(8)中,為激活函數(shù),該函數(shù)用于更好地學(xué)習(xí)用戶(hù)和項(xiàng)目之間的非線(xiàn)性關(guān)系;為權(quán)重矩陣,用于學(xué)習(xí)各種向量之間的聯(lián)系程度。
3.3? ?模型損失函數(shù)
對(duì)項(xiàng)目進(jìn)行預(yù)測(cè)評(píng)分的任務(wù)實(shí)質(zhì)上是回歸問(wèn)題,本文利用平方損失函數(shù)訓(xùn)練模型來(lái)優(yōu)化參數(shù),采用正則化項(xiàng)以避免過(guò)度擬合,損失函數(shù)如式(9)所示。
其中,表示待訓(xùn)練實(shí)例的集合,表示用戶(hù)對(duì)項(xiàng)目的真實(shí)評(píng)價(jià),表示正則化項(xiàng)的常數(shù)參數(shù),表示模型中的所有未知參數(shù)集合。
4? ?實(shí)驗(yàn)分析(Experiment analysis)
4.1? ?數(shù)據(jù)集
MovieLens數(shù)據(jù)集是研究機(jī)構(gòu)GroupLens從http://movielens.org網(wǎng)站在不同的時(shí)間段收集并提供的評(píng)級(jí)數(shù)據(jù)集。該數(shù)據(jù)集描述了電影推薦服務(wù)的5星評(píng)分和自由標(biāo)注標(biāo)簽活動(dòng)。MovieLens 20 MB數(shù)據(jù)集中包含27,278 個(gè)電影中的20,000,263 個(gè)評(píng)分和465,564 個(gè)標(biāo)簽應(yīng)用,以上數(shù)據(jù)由138,493 位用戶(hù)參與生成。
用戶(hù)對(duì)電影評(píng)分?jǐn)?shù)據(jù)的稀疏度為:
用戶(hù)對(duì)電影標(biāo)注標(biāo)簽數(shù)據(jù)的稀疏度為:
實(shí)驗(yàn)選取數(shù)據(jù)集中比例分別為8∶1∶1和7∶1∶2的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù),驗(yàn)證不同稀疏度的情況下推薦模型的準(zhǔn)確性。
4.2? ?評(píng)價(jià)指標(biāo)
RMSE(Root Mean Squared Error)被稱(chēng)為均方根誤差,也叫標(biāo)準(zhǔn)誤差。文中實(shí)驗(yàn)采用RMSE作為評(píng)價(jià)指標(biāo)來(lái)衡量預(yù)測(cè)推薦評(píng)分的誤差。其公式表示如式(10)所示。
式(10)中,表示測(cè)試數(shù)據(jù)集中的記錄個(gè)數(shù),表示本文模型計(jì)算的預(yù)測(cè)評(píng)分,表示數(shù)據(jù)集中的用戶(hù)實(shí)際評(píng)分。
4.3? ?對(duì)比算法
本文與以下四種算法進(jìn)行實(shí)驗(yàn)結(jié)果對(duì)比分析。
(1)RA1[14],提出了一種基于張量Tucker分解和列表級(jí)排序?qū)W習(xí)的個(gè)性化標(biāo)簽推薦算法,采用優(yōu)化MAP的方式進(jìn)行訓(xùn)練,實(shí)現(xiàn)根據(jù)用戶(hù)喜好進(jìn)行推薦。本文中將此推薦算法記為RA1。
(2)DeepCoNN[15],提出基于一種神經(jīng)網(wǎng)絡(luò)的模型,一種是從某個(gè)用戶(hù)的評(píng)論中學(xué)習(xí)到該用戶(hù)的喜好;另一種是從所有用戶(hù)對(duì)某個(gè)商品的評(píng)論中學(xué)習(xí)到該商品的特征和特點(diǎn)。用戶(hù)和項(xiàng)目學(xué)習(xí)的潛在特征用于在兩個(gè)網(wǎng)絡(luò)頂部引入的層中預(yù)測(cè)相應(yīng)的等級(jí)。
(3)TTMF[16],該模型為融合標(biāo)簽和時(shí)間信息的矩陣分解推薦模型,通過(guò)評(píng)級(jí)數(shù)據(jù)和標(biāo)簽信息構(gòu)建用戶(hù)、項(xiàng)目、標(biāo)簽三者之間的矩陣模型,進(jìn)而使用梯度下降方法進(jìn)行推薦計(jì)算。
(4)RA2[17],提出了一種用于前N 個(gè)項(xiàng)目推薦的新穎方法,該方法使用三種不同類(lèi)型的信息:用戶(hù)項(xiàng)目評(píng)分?jǐn)?shù)據(jù)、用戶(hù)之間的社交網(wǎng)絡(luò)以及與項(xiàng)目相關(guān)聯(lián)的標(biāo)簽。通過(guò)上面三種信息進(jìn)行優(yōu)先級(jí)計(jì)算,實(shí)現(xiàn)推薦。
4.4? ?結(jié)果分析
圖3顯示了80%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)、10%數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)、10%數(shù)據(jù)作為測(cè)試數(shù)據(jù)情況下,本文算法與RA1、DeepCoNN、TTMF、RA2四種算法計(jì)算結(jié)果的RMSE比較圖。從圖3中可以看出,本文提出的算法DSR-CNN性能要優(yōu)于其他模型,特別在數(shù)據(jù)稀疏的情況下,DSR-CNN算法也能夠較好地進(jìn)行推薦。綜上所述,融合評(píng)分和標(biāo)簽的卷積神經(jīng)網(wǎng)絡(luò)推薦模型,當(dāng)用戶(hù)數(shù)據(jù)稀疏的情況下,能夠根據(jù)用戶(hù)和項(xiàng)目信息學(xué)習(xí)潛在的影響因素,從而進(jìn)行更有效的推薦。
5? ?結(jié)論(Conclusion)
本文提出了一種融合用戶(hù)評(píng)分和用戶(hù)標(biāo)注標(biāo)簽信息的卷積神經(jīng)網(wǎng)絡(luò)推薦模型。模型通過(guò)建立由兩路由多層感知器和卷積神經(jīng)網(wǎng)絡(luò)組成的深層網(wǎng)絡(luò)結(jié)構(gòu),分別實(shí)現(xiàn)利用社會(huì)標(biāo)簽信息建模用戶(hù)動(dòng)態(tài)興趣和項(xiàng)目信息的潛在特征向量;模型能夠充分根據(jù)上下文語(yǔ)境信息提取隱含高階信息,進(jìn)而解決稀疏數(shù)據(jù)的推薦問(wèn)題。文中采用MovieLens 20 MB數(shù)據(jù)集對(duì)模型的推薦效果與其他四種算法進(jìn)行了實(shí)驗(yàn)比較,實(shí)驗(yàn)結(jié)果表明該模型能夠有效地根據(jù)用戶(hù)的偏好進(jìn)行個(gè)性化推薦。
參考文獻(xiàn)(References)
[1] 張宜浩,朱小飛,徐傳運(yùn),等.基于用戶(hù)評(píng)論的深度情感分析和多視圖協(xié)同融合的混合推薦方法[J].計(jì)算機(jī)學(xué)報(bào),2019,042(006):1316-1333.
[2] 馮興杰,曾云澤.基于評(píng)分矩陣與評(píng)論文本的深度推薦模型[J].計(jì)算機(jī)學(xué)報(bào),2020,043(005):884-900.
[3] 馬海江.基于卷積神經(jīng)網(wǎng)絡(luò)與約束概率矩陣分解的推薦算法[J].計(jì)算機(jī)科學(xué),2020(S1):540-545.
[4] 王駿,虞歌.基于改進(jìn)神經(jīng)協(xié)同過(guò)濾模型的電影推薦系統(tǒng)[J].計(jì)算機(jī)工程與設(shè)計(jì),2020,041(7):2069-2075.
[5] 曹玉琳,李文立,鄭東霞.融合社會(huì)標(biāo)簽的聯(lián)合概率矩陣分解推薦算法[J].信息與控制,2017(4):400-407.
[6] 胡云,張舒,李慧,等.融合社會(huì)標(biāo)簽與信任關(guān)系的社會(huì)網(wǎng)絡(luò)推薦方法[J].數(shù)據(jù)采集與處理,2018,033(004):704-711.
[7] 李慧,馬小平,胡云,等.融合社會(huì)網(wǎng)絡(luò)與信任度的個(gè)性化推薦方法研究[J].計(jì)算機(jī)應(yīng)用研究,2014(03):808-810.
[8] HEATON J. Ian Goodfellow, Yoshua Bengio, and Aaron Courville: Deep learning[J]. Genet Program Evolvable Mach, 2018(19):305-307.
[9] GU J X, WANG Z H. Recent advances in convolutional neural networks[J]. Pattern Recognition, 2018, 77(01): 329-353.
[10] LIU H, WANG Y, PENG Q, et al. Hybrid neural recommendation with joint deep representation learning of ratings and reviews[J]. Neurocomputing, 2020, 374(1):77-85.
[11] HUANG Z H, SHAN G X, CHENG J J, et al. TRec: An efficient recommendation system for hunting passengers with deep neural networks[J]. Neural Computing and Applications, 2019, 31(1):209-222.
[12] 鄧存彬,虞慧群,范貴生.融合動(dòng)態(tài)協(xié)同過(guò)濾和深度學(xué)習(xí)的推薦算法[J].計(jì)算機(jī)科學(xué),2019,046(008):28-34.
[13] 吳國(guó)棟,宋福根,涂立靜,等.基于改進(jìn)CNN的局部相似性預(yù)測(cè)推薦模型[J].計(jì)算機(jī)工程與科學(xué),2019,041(006):1071-1077.
[14] 楊洋,邸一得,劉俊暉,等.基于張量分解的排序?qū)W習(xí)在個(gè)性化標(biāo)簽推薦中的研究[J].計(jì)算機(jī)科學(xué),2020,47(S2):525-529.
[15] HAN J, ZHENG L, XU Y, et al. Adaptive deep modeling of users and items using side information for recommendation[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019(99):1-12.
[16] 趙文濤,任行學(xué).融合標(biāo)簽信息和時(shí)間效應(yīng)的矩陣分解推薦算法[J].信息與控制,2020,49(4):472-477.
[17] BANERJEE S, BANJARE P, PAL B, et al. A multistep priority-based ranking for top-N recommendation using social and tag information[J]. J Ambient Intell Human Comput, 2021(12):2509-2525.
作者簡(jiǎn)介:
鄭東霞(1978-),女,碩士,副教授.研究領(lǐng)域:機(jī)器學(xué)習(xí),推薦系統(tǒng).