陳卓,李涵,杜軍威
(青島科技大學(xué)信息科學(xué)技術(shù)學(xué)院,山東青島 266061)
隨著電子商務(wù)和社交媒體平臺(tái)的快速發(fā)展,推薦系統(tǒng)已經(jīng)成為許多企業(yè)不可或缺的工具.一個(gè)高效的推薦系統(tǒng)能通過準(zhǔn)確地捕捉用戶的偏好,發(fā)現(xiàn)用戶可能感興趣的項(xiàng)目,從而提高用戶對平臺(tái)的滿意度,提高用戶的保留率.
推薦系統(tǒng)根據(jù)用戶的興趣和項(xiàng)目屬性來評估用戶對項(xiàng)目的偏好.由于用戶興趣和項(xiàng)目特征都用壓縮向量表示,因此學(xué)習(xí)用戶/項(xiàng)目交互和其他輔助信息,如社會(huì)關(guān)系和知識(shí)圖的嵌入表示,成為該鄰居需解決的關(guān)鍵問題.
在推薦系統(tǒng)中,大多數(shù)信息具有圖結(jié)構(gòu),而圖神經(jīng)網(wǎng)絡(luò)GNN(Graph Neural Network)技術(shù)可以通過圖節(jié)點(diǎn)之間的消息傳遞來捕捉圖的相關(guān)性,因此GNN經(jīng)常被用來生成用戶/項(xiàng)目的嵌入表示.然而傳統(tǒng)的基于GNN 的推薦算法,只能夠處理由單一類型節(jié)點(diǎn)構(gòu)成的規(guī)則拓?fù)鋱D,而當(dāng)下網(wǎng)絡(luò)中的數(shù)據(jù)并非只由單一類型節(jié)點(diǎn)構(gòu)成.此外,傳統(tǒng)GNN 只融合節(jié)點(diǎn)的一階鄰居特征,無法獲取節(jié)點(diǎn)在網(wǎng)絡(luò)中的更深層結(jié)構(gòu)關(guān)系.因此,當(dāng)數(shù)據(jù)集稀疏,各節(jié)點(diǎn)均只有極少的鄰居數(shù)時(shí),基于傳統(tǒng)GNN 的推薦算法的推薦質(zhì)量下降明顯.
為了解決以上的不足之處,本文將圖神經(jīng)網(wǎng)絡(luò)與異質(zhì)網(wǎng)絡(luò)相結(jié)合,提出深度推薦模型H_GNN(Heterogeneous_Graph Neural Network).本文的貢獻(xiàn)可以總結(jié)為以下幾點(diǎn):
1)給出了異質(zhì)信息網(wǎng)絡(luò)的信息的多特征聯(lián)合表示方法.面向用戶/項(xiàng)目交互和用戶社交兩個(gè)域,利用異質(zhì)信息網(wǎng)絡(luò)中的多階拓?fù)浣Y(jié)構(gòu)信息,增強(qiáng)網(wǎng)絡(luò)連接稀疏情況下節(jié)點(diǎn)特征的表示能力.
2)提出了面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦方法.通過對用戶、項(xiàng)目、評分、社交等多維表示向量的有效融合,增強(qiáng)推薦模型在評分矩陣稀疏情況下,推薦模型的推薦質(zhì)量.
3)通過在多個(gè)公共數(shù)據(jù)集上不斷增加數(shù)據(jù)的稀疏性,驗(yàn)證本文模型推薦精度下降速度明顯低于基線方法.
近幾年來,由多種節(jié)點(diǎn)或邊組成的異質(zhì)信息網(wǎng)絡(luò)HIN(Heterogeneous Information Network)作為一種融合復(fù)雜信息的強(qiáng)大建模方法被提出.與同構(gòu)網(wǎng)絡(luò)相比,由實(shí)體類型及其在HIN 中的關(guān)系提供的異質(zhì)信息可以捕獲更多語義上有意義的信息.2014 年,Jacob 等人[1]提出了一種將節(jié)點(diǎn)表示學(xué)習(xí)應(yīng)用于不同節(jié)點(diǎn)類型共有的潛在空間上的新方法,但由于其將異質(zhì)信息網(wǎng)絡(luò)變成同構(gòu)信息網(wǎng)絡(luò)來處理,此類方法會(huì)丟失較多重要信息.2015 年,Tang 等人[2]提出了一種預(yù)測文本嵌入模型,但該方法不適用于除文本網(wǎng)絡(luò)外的大多數(shù)異質(zhì)信息網(wǎng)絡(luò).2017 年,兩種經(jīng)典的基于元路徑的異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法[3-4]被提出,它們使用元路徑游走來捕獲不同類型節(jié)點(diǎn)之間的關(guān)系.劉鈺峰等人[5]采用重啟動(dòng)隨機(jī)游走進(jìn)行查詢推薦,在游走的基礎(chǔ)上進(jìn)行了改進(jìn).黃立威等人[6]利用基于元路徑的異質(zhì)信息網(wǎng)絡(luò)來做鏈路預(yù)測.近年來,異質(zhì)信息網(wǎng)絡(luò)作為一種新興方向,逐漸被應(yīng)用于推薦鄰居中復(fù)雜關(guān)系的建模中.Shi 等人[7]提出異質(zhì)信息網(wǎng)絡(luò)嵌入模型,通過異質(zhì)信息網(wǎng)絡(luò)生成特定關(guān)系對應(yīng)的元路徑,獲得用戶隱含向量,然后通過融合函數(shù)進(jìn)行向量的融合并最終用于推薦.
上述算法在單個(gè)域上構(gòu)建異質(zhì)信息網(wǎng)絡(luò),在網(wǎng)絡(luò)連接稀疏的情況下,節(jié)點(diǎn)可學(xué)習(xí)的鄰居信息極少,使得節(jié)點(diǎn)表示學(xué)習(xí)質(zhì)量不高.
圖神經(jīng)網(wǎng)絡(luò)作為一種新型的拓展神經(jīng)網(wǎng)絡(luò),可以在圖上對節(jié)點(diǎn)進(jìn)行特征提取和表示,是一種高效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).許多方法模型利用了GNN 特有的優(yōu)勢來解決經(jīng)典問題,并得到了優(yōu)于傳統(tǒng)方法的實(shí)驗(yàn)結(jié)果.例如,Berg 等人[8]提出了一種圖自編碼器框架GCMC(Graph Convolution Matrix Completion),從鏈路預(yù)測的角度解決推薦系統(tǒng)中的評分預(yù)測問題.Zhang 等人[9]提出一種采用一堆GCN(Graph Convolution Network)編碼器/解碼器與中間監(jiān)督相結(jié)合的模型,以提高最終預(yù)測性能.Wu 等人[10]利用GNN 機(jī)制捕獲了更深層次的社會(huì)擴(kuò)散過程.Fan 等人[11]提出一種基于圖神經(jīng)網(wǎng)絡(luò)的模型用于推薦任務(wù)并展現(xiàn)了良好的性能.葛堯等人[12]提出一種新的圖卷積網(wǎng)絡(luò)推薦算法,其使用兩組圖卷積來處理不同交互信息.上述算法均只能夠處理由單一類型節(jié)點(diǎn)或單一類型關(guān)系構(gòu)成的規(guī)則拓?fù)鋱D,網(wǎng)絡(luò)節(jié)點(diǎn)隱特征隨機(jī)初始化,GNN 只融合節(jié)點(diǎn)的一階鄰居特征.由于上述算法忽略或未充分挖掘網(wǎng)絡(luò)中節(jié)點(diǎn)間更深層的結(jié)構(gòu)和語義信息,因此當(dāng)網(wǎng)絡(luò)節(jié)點(diǎn)均只有極少的鄰居數(shù),即用戶項(xiàng)目評分?jǐn)?shù)據(jù)稀疏時(shí),上述基于GNN 的推薦算法的推薦質(zhì)量明顯下降.
注意力機(jī)制(Attention Mechanism)源于對人類視覺的研究.在認(rèn)知科學(xué)中,由于信息處理的瓶頸,人類會(huì)選擇性地關(guān)注所有信息的一部分,同時(shí)忽略其他可見的信息,上述機(jī)制通常被稱為注意力機(jī)制.Velikovi 等人[13]通過疊加圖注意力層為中心節(jié)點(diǎn)的鄰居節(jié)點(diǎn)分配不同的權(quán)重,并據(jù)此融合鄰居節(jié)點(diǎn)信息生成更有效的中心節(jié)點(diǎn)的特征表示.張青博等人[14]利用注意力機(jī)制分析用戶對項(xiàng)目不同屬性的關(guān)注度,以此獲取用戶更準(zhǔn)確的偏好信息.
注意力機(jī)制具有直觀性、通用性和可解釋性的優(yōu)點(diǎn),已成為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的重要組成部分,被廣泛應(yīng)用到推薦系統(tǒng)、自然語言生成等不同類型的深度學(xué)習(xí)任務(wù)中[15].
H_GNN 模型框架如圖1 所示,圖中顯示了模型架構(gòu)分為兩部分:首先是異質(zhì)信息網(wǎng)絡(luò)多特征融合(如圖1 中H_GNN 第一部分),采用遷移學(xué)習(xí)的思想,構(gòu)建面向圖神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練模型,對購物和社交兩類數(shù)據(jù)進(jìn)行聯(lián)合解碼,共同學(xué)習(xí)用戶、項(xiàng)目的低維隱特征,從而最大限度地挖掘用戶、項(xiàng)目之間的信息交互潛力,提升圖神經(jīng)網(wǎng)絡(luò)推薦模型的訓(xùn)練效率.其次是面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)(如圖1 中H_GNN 第二部分),在圖神經(jīng)網(wǎng)絡(luò)進(jìn)行推薦建模時(shí),本文基于用戶與項(xiàng)目間的不同交互行為、用戶間的不同社交關(guān)系對用戶偏好、項(xiàng)目特征表示的影響程度不同的假設(shè),將注意力機(jī)制引入用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)的用戶、項(xiàng)目聚合表示過程,從而實(shí)現(xiàn)用戶/項(xiàng)目交互和用戶社交兩類網(wǎng)絡(luò)間的節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征的有效融合.
圖1 H_GNN 模型框架圖Fig.1 Block diagram of H_GNN model
本文構(gòu)建的異質(zhì)信息網(wǎng)絡(luò)由用戶、項(xiàng)目兩類節(jié)點(diǎn),用戶與項(xiàng)目間的交互關(guān)系和用戶與用戶間的社交關(guān)系構(gòu)成.其具體數(shù)學(xué)表示如下.
令U={u1,u2,…,un}和V={v1,v2,…,vn}分別表示數(shù)據(jù)集中用戶集合和項(xiàng)目集合,n 和m 表示用戶和項(xiàng)目的個(gè)數(shù),T∈Rn*m為用戶項(xiàng)目交互矩陣,rij表示用戶i 對項(xiàng)目j 給出的評分,如果用戶沒打出評分則rij=0,評分可以看作是該用戶對該項(xiàng)目的喜好程度,評分越高代表用戶越喜歡該項(xiàng)目.一個(gè)用戶可以對多個(gè)項(xiàng)目進(jìn)行評分,同樣一個(gè)項(xiàng)目也可以被多個(gè)用戶打分.G∈Rn*n為用戶社交矩陣.δ=(A,R)表示一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)圖,分為用戶項(xiàng)目交互網(wǎng)絡(luò)u_v 和用戶社交關(guān)系網(wǎng)絡(luò)u_u,其中A 表示網(wǎng)絡(luò)圖中的實(shí)體,可以是用戶或項(xiàng)目,R 表示實(shí)體之間的交互關(guān)系.
本文定義了兩種元路徑:一種是用戶-項(xiàng)目間的UV 元路徑,體現(xiàn)用戶與項(xiàng)目間的交互關(guān)系;第二種是用戶-用戶間的UU 元路徑,體現(xiàn)用戶-用戶間的社交關(guān)系.下面給出路徑生成規(guī)則.
具體計(jì)算公式為
式中:nt為當(dāng)前節(jié)點(diǎn),nt+1為下一個(gè)節(jié)點(diǎn),NAt+1(v)表示v 的鄰居中屬于At+1類型的節(jié)點(diǎn),ρ 表示本文規(guī)定的元路徑規(guī)則.
按照兩種元路徑分別經(jīng)過采樣后,本文使用Skip-gram[16]算法生成每個(gè)節(jié)點(diǎn)的特征向量,將通過UV 生成的用戶和項(xiàng)目的向量表示為和,將通過UU 生成的用戶向量表示為.這里定義L 為采樣路徑長度,Lc為窗口大小.此時(shí)上述兩類網(wǎng)絡(luò)節(jié)點(diǎn)的特征向量中已學(xué)習(xí)到用戶/項(xiàng)目交互以及用戶社交關(guān)系網(wǎng)絡(luò)中的隱特征.
用戶/項(xiàng)目交互關(guān)系中附帶評分屬性,同一用戶對不同項(xiàng)目的評分、不同用戶對同一項(xiàng)目的評分中蘊(yùn)含著豐富的用戶偏好和項(xiàng)目特征信息.在用戶/項(xiàng)目評分?jǐn)?shù)據(jù)稀疏的情況下,為充分挖掘用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中的關(guān)系和屬性信息,本文將注意力機(jī)制引入用戶、項(xiàng)目的特征聚合表示過程,從而實(shí)現(xiàn)用戶/項(xiàng)目交互和用戶社交兩類網(wǎng)絡(luò)間的節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征的有效融合.
在聚合與中心用戶節(jié)點(diǎn)發(fā)生交互的鄰居項(xiàng)目節(jié)點(diǎn)、社交用戶節(jié)點(diǎn)時(shí),利用注意力機(jī)制根據(jù)用戶特征為鄰居項(xiàng)目、鄰居用戶分配不同的權(quán)重,從而體現(xiàn)不同交互項(xiàng)目、不同社交用戶在體現(xiàn)用戶喜好特征時(shí)不同的重要性.在聚合與中心項(xiàng)目節(jié)點(diǎn)發(fā)生交互的鄰居用戶節(jié)點(diǎn)時(shí),利用注意力機(jī)制根據(jù)項(xiàng)目特征為鄰居用戶分配不同的權(quán)重,從而體現(xiàn)不同鄰居用戶在體現(xiàn)項(xiàng)目特征時(shí)不同的重要性.
2.3.1 用戶特征融合
對于用戶,本文融合了獨(dú)立的兩部分,針對用戶項(xiàng)目交互網(wǎng)絡(luò)的u_v 和針對用戶社交網(wǎng)絡(luò)的u_u.
u_v:對于任何一個(gè)用戶,本文使用其鄰居項(xiàng)目和評分來表示該用戶針對某一項(xiàng)目的隱含向量表示,然后通過attention 網(wǎng)絡(luò)生成對應(yīng)的權(quán)重,最后融合所有的隱含向量得到交互網(wǎng)絡(luò)中該用戶的隱含向量表示.具體計(jì)算公式為
σ 為激活函數(shù),w 和b 為神經(jīng)網(wǎng)絡(luò)參數(shù),αij為項(xiàng)目j 對用戶i 的權(quán)重,每個(gè)項(xiàng)目對用戶的重要程度不同,如果把所有的權(quán)重指數(shù)都置為1,會(huì)導(dǎo)致預(yù)測結(jié)果不理想,因此本文通過兩層神經(jīng)網(wǎng)絡(luò)訓(xùn)練權(quán)重.具體計(jì)算公式為
xjr表示項(xiàng)目j 和對應(yīng)評分r 的向量融合.xjr具體計(jì)算公式為
gτ為一個(gè)多層全連接神經(jīng)網(wǎng)絡(luò),⊕表示向量的拼接.er表示隨機(jī)初始化生成的評分向量.
u_u:本文使用用戶社交網(wǎng)絡(luò)中該用戶的鄰居向量融合來表示該用戶在社交網(wǎng)絡(luò)中的隱含向量表示,具體計(jì)算公式為
式中:βi′i為鄰居i′對用戶i 的權(quán)重指數(shù),具體計(jì)算公式為
由公式(3)和(7),本文分別得到了用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中的用戶隱特征,并最終通過公式(9)將這兩部分特征進(jìn)一步融合.具體計(jì)算公式為
2.3.2 項(xiàng)目特征融合
用戶i 對項(xiàng)目j 的權(quán)重指數(shù)ηij,具體計(jì)算公式為
這里得到的項(xiàng)目隱含向量表示作為最終的項(xiàng)目向量表示.
2.3.3 評分預(yù)測
本文通過上面得到的用戶向量和項(xiàng)目向量來預(yù)測用戶對項(xiàng)目的評分,在這里本文定義了一個(gè)多層的全連接層網(wǎng)絡(luò),把用戶和項(xiàng)目向量的拼接作為網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)的輸出則是預(yù)測評分.具體計(jì)算公式為
2.3.4 模型學(xué)習(xí)
本文使用經(jīng)典交叉熵?fù)p失函數(shù)進(jìn)行模型更新,具體計(jì)算公式為
本文使用了Ciao 和Epinions 兩個(gè)數(shù)據(jù)集進(jìn)行對比實(shí)驗(yàn),這兩個(gè)數(shù)據(jù)集是由亞利桑那州立大學(xué)學(xué)者在做社交網(wǎng)絡(luò)方面研究的時(shí)候使用的數(shù)據(jù)集.可以分別從http://www.cse.msu.edu/~tangjili/trust.html和http://www.trustlet.org/epinions.html 網(wǎng)頁鏈接上獲取.它們分別包含了283 319 和764 352 個(gè)評級.
本文采用了RMSE(Root Mean Square Error)和MAE(Mean Absolute Error)兩項(xiàng)指標(biāo)來驗(yàn)證模型準(zhǔn)確度.
H_GNN 模型的超參數(shù)有路徑長度、窗口大小、學(xué)習(xí)率和嵌入維度.
本文通過實(shí)驗(yàn)對比了在不同學(xué)習(xí)率下,路徑長度為10、窗口大小為5 和路徑長度為20、窗口大小為10 的預(yù)測誤差.關(guān)于參數(shù)實(shí)驗(yàn)結(jié)果如表1 所示,表中顯示了H_GNN 模型在路徑長度為20、窗口大小為10、學(xué)習(xí)率為0.004 時(shí)預(yù)測誤差最小.
表1 路徑長度、窗口大小、學(xué)習(xí)率對比實(shí)驗(yàn)Tab.1 Comparative experiment of path length,window size and learning rate
關(guān)于在不同嵌入維度下,H_GNN 模型的預(yù)測誤差實(shí)驗(yàn)結(jié)果如圖2、圖3 所示,圖中顯示了H_GNN模型在嵌入維度為64 時(shí),預(yù)測誤差最小.
圖2 嵌入維度實(shí)驗(yàn)指標(biāo)RMSE 對比Fig.2 Comparison of experimental index RMSE of embedded dimension
圖3 嵌入維度實(shí)驗(yàn)指標(biāo)MAE 對比Fig.3 Comparison of experimental index MAE of embedded dimension
為了評估H_GNN 模型的推薦性能,本文選擇以下六種推薦模型作為基線方法,進(jìn)行對比實(shí)驗(yàn).
SocialMF[17](Social Matrix Factorization):主要思想是在矩陣分解中引入信任傳播,用戶表示接近其信任的用戶.
NeuMF[18](Neural Matrix Factorization):模型主要思想是結(jié)合了傳統(tǒng)矩陣分解和多層感知機(jī),可以同時(shí)抽取低維和高維的特征.
DeepSoR[19](Deep Social Recommendation):主要思想是從社交關(guān)系學(xué)習(xí)到的用戶表示集成到概率矩陣分解中.
DeepFM[20](Deep Matrix Factorization):主要思想是聯(lián)合訓(xùn)練FM(Matrix Factorization)模型和DNN(Deep Neural Networks)模型,同時(shí)學(xué)習(xí)低階特征組合和高階特征組合.
Wide&Deep[21](Wide and Deep):提出一種融合淺層模型和深層模型進(jìn)行聯(lián)合訓(xùn)練的框架.
GCMC[8]:提出一種從鏈路預(yù)測角度解決評分預(yù)測的圖自編碼器框架.
GraphRec[11](Graph Recommendation):主要思想是按用戶商品間的交互關(guān)系和用戶間的社交關(guān)系兩個(gè)層次,依次融合用戶、項(xiàng)目特征,進(jìn)而訓(xùn)練GNN 網(wǎng)絡(luò)預(yù)測評分.
H_GNN 與基線方法在Ciao 和Epinion 兩個(gè)數(shù)據(jù)集上,按照6 ∶4 劃分訓(xùn)練和測試集.關(guān)于模型對比實(shí)驗(yàn)結(jié)果如表2 所示,表中顯示了在兩個(gè)數(shù)據(jù)集的兩個(gè)評價(jià)指標(biāo)下,H_GNN 模型均得到了最小的預(yù)測誤差.
表2 推薦模型預(yù)測誤差對比實(shí)驗(yàn)Tab.2 Comparison experiment of recommended model prediction error
為了驗(yàn)證H_GNN 模型在稀疏數(shù)據(jù)集上的推薦質(zhì)量,本文基于Ciao 數(shù)據(jù)集構(gòu)造了不同稀疏程度的9 個(gè)數(shù)據(jù)集,在保證Ciao 數(shù)據(jù)集不出現(xiàn)用戶、項(xiàng)目冷啟動(dòng)的情況下,依次對用戶/項(xiàng)目評分?jǐn)?shù)據(jù)進(jìn)行了9次稀疏化,每次減少10%的評分?jǐn)?shù)據(jù),并選擇同樣基于GNN 且也融合了社交網(wǎng)絡(luò)輔助信息的推薦鄰居最先進(jìn)的模型之——GraphRec 模型作為基線方法.
關(guān)于H_GNN 與基線方法中預(yù)測效果最好的GraphRec 模型的稀疏度對比實(shí)驗(yàn)結(jié)果如圖4、圖5所示,圖中顯示了在評分?jǐn)?shù)據(jù)不斷減少的過程中,H_GNN 模型相比GraphRec 模型的推薦質(zhì)量提升明顯,在評分?jǐn)?shù)據(jù)最為稀疏的90%處,H_GNN 模型比GraphRec 模型的推薦誤差降低了約40%.
圖4 隨稀疏度改變RMSE 指標(biāo)對比Fig.4 RMSE index comparison with sparsity change
圖5 隨稀疏度改變MAE 指標(biāo)對比Fig.5 MAE index comparison with sparsity change
由上述實(shí)驗(yàn)結(jié)果可知,在用戶/項(xiàng)目交互稀疏的情況下,相比于基線方法使用隨機(jī)初始化用戶/項(xiàng)目節(jié)點(diǎn)表示進(jìn)行推薦模型訓(xùn)練,本文提出的基于異質(zhì)信息網(wǎng)絡(luò)的多特征聯(lián)合表示方法具有更強(qiáng)的節(jié)點(diǎn)特征表示能力,提出的面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦方法能有效融合用戶、項(xiàng)目、評分、社交等多維特征提升推薦質(zhì)量.
為了探究基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示、用戶社交網(wǎng)絡(luò)信息聚合對H_GNN 模型訓(xùn)練效果的影響,本文在兩種不同稀疏度的Ciao 數(shù)據(jù)集上進(jìn)行了兩組消融實(shí)驗(yàn).其中H_GNN_2 模型為取消基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示,直接采用隨機(jī)值初始化用戶、項(xiàng)目特征向量作為面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法的輸入;H_GNN-u_u 模型為在面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法中,取消用戶社交網(wǎng)絡(luò)u_u,只采用用戶項(xiàng)目交互網(wǎng)絡(luò)u_v 進(jìn)行用戶特征聚合.關(guān)于消融實(shí)驗(yàn)結(jié)果如圖6、圖7 所示,圖中顯示了在稀疏度為50%和90%的Ciao 數(shù)據(jù)集上,H_GNN 模型的預(yù)測誤差明顯低于H_GNN_2 和H_GNN-u_u 模型.
圖6 消融實(shí)驗(yàn)中RMSE 指標(biāo)對比Fig.6 RMSE index comparison in ablation experiment
圖7 消融實(shí)驗(yàn)中MAE 指標(biāo)對比Fig.7 MAE index comparison in ablation experiment
由H_GNN_2 消融實(shí)驗(yàn)結(jié)果可知,使用基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示有助于提升H_GNN 模型推薦質(zhì)量.由H_GNN-u_u 消融實(shí)驗(yàn)結(jié)果可知,融合用戶社交信息,使用戶特征向量中包含用戶社交關(guān)系特征,同樣有助于提升H_GNN 模型推薦質(zhì)量.
數(shù)據(jù)稀疏性問題是推薦系統(tǒng)面臨的最具挑戰(zhàn)性的問題之一.數(shù)據(jù)稀疏使得圖網(wǎng)絡(luò)中節(jié)點(diǎn)可學(xué)習(xí)的結(jié)構(gòu)信息變少,因此傳統(tǒng)基于GNN 的推薦算法預(yù)測誤差大.本文提出一種基于異質(zhì)圖神經(jīng)網(wǎng)絡(luò)的推薦算法,使用異質(zhì)信息網(wǎng)絡(luò)對多源異質(zhì)數(shù)據(jù)進(jìn)行聯(lián)合解碼,引入注意力機(jī)制進(jìn)行用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中用戶、項(xiàng)目特征的聚合表示,從而充分挖掘稀疏數(shù)據(jù)集中蘊(yùn)含圖節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征.通過在兩個(gè)公開數(shù)據(jù)集上進(jìn)行的大量對比實(shí)驗(yàn)結(jié)果表明,本文提出的算法在原始和不斷稀疏化的數(shù)據(jù)集上的推薦誤差均明顯小于所有的基線方法.
隨著時(shí)間的推移,推薦系統(tǒng)中的網(wǎng)絡(luò)節(jié)點(diǎn)及其關(guān)系會(huì)不斷變化,目前本文的推薦模型僅適用于靜態(tài)圖網(wǎng)絡(luò),后續(xù)可進(jìn)一步開展動(dòng)態(tài)圖網(wǎng)絡(luò)增量計(jì)算推薦算法的研究.