基于異質(zhì)圖神經(jīng)網(wǎng)絡(luò)的推薦算法研究

2021-11-04 09:40:26陳卓李涵杜軍威

湖南大學(xué)學(xué)報(bào)(自然科學(xué)版) 2021年10期

陳卓，李涵，杜軍威

（青島科技大學(xué)信息科學(xué)技術(shù)學(xué)院，山東青島 266061）

隨著電子商務(wù)和社交媒體平臺(tái)的快速發(fā)展，推薦系統(tǒng)已經(jīng)成為許多企業(yè)不可或缺的工具.一個(gè)高效的推薦系統(tǒng)能通過準(zhǔn)確地捕捉用戶的偏好，發(fā)現(xiàn)用戶可能感興趣的項(xiàng)目，從而提高用戶對平臺(tái)的滿意度，提高用戶的保留率.

推薦系統(tǒng)根據(jù)用戶的興趣和項(xiàng)目屬性來評估用戶對項(xiàng)目的偏好.由于用戶興趣和項(xiàng)目特征都用壓縮向量表示，因此學(xué)習(xí)用戶/項(xiàng)目交互和其他輔助信息，如社會(huì)關(guān)系和知識(shí)圖的嵌入表示，成為該鄰居需解決的關(guān)鍵問題.

在推薦系統(tǒng)中，大多數(shù)信息具有圖結(jié)構(gòu)，而圖神經(jīng)網(wǎng)絡(luò)GNN（Graph Neural Network）技術(shù)可以通過圖節(jié)點(diǎn)之間的消息傳遞來捕捉圖的相關(guān)性，因此GNN經(jīng)常被用來生成用戶/項(xiàng)目的嵌入表示.然而傳統(tǒng)的基于GNN 的推薦算法，只能夠處理由單一類型節(jié)點(diǎn)構(gòu)成的規(guī)則拓?fù)鋱D，而當(dāng)下網(wǎng)絡(luò)中的數(shù)據(jù)并非只由單一類型節(jié)點(diǎn)構(gòu)成.此外，傳統(tǒng)GNN 只融合節(jié)點(diǎn)的一階鄰居特征，無法獲取節(jié)點(diǎn)在網(wǎng)絡(luò)中的更深層結(jié)構(gòu)關(guān)系.因此，當(dāng)數(shù)據(jù)集稀疏，各節(jié)點(diǎn)均只有極少的鄰居數(shù)時(shí)，基于傳統(tǒng)GNN 的推薦算法的推薦質(zhì)量下降明顯.

為了解決以上的不足之處，本文將圖神經(jīng)網(wǎng)絡(luò)與異質(zhì)網(wǎng)絡(luò)相結(jié)合，提出深度推薦模型H_GNN（Heterogeneous_Graph Neural Network）.本文的貢獻(xiàn)可以總結(jié)為以下幾點(diǎn)：

1）給出了異質(zhì)信息網(wǎng)絡(luò)的信息的多特征聯(lián)合表示方法.面向用戶/項(xiàng)目交互和用戶社交兩個(gè)域，利用異質(zhì)信息網(wǎng)絡(luò)中的多階拓?fù)浣Y(jié)構(gòu)信息，增強(qiáng)網(wǎng)絡(luò)連接稀疏情況下節(jié)點(diǎn)特征的表示能力.

2）提出了面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦方法.通過對用戶、項(xiàng)目、評分、社交等多維表示向量的有效融合，增強(qiáng)推薦模型在評分矩陣稀疏情況下，推薦模型的推薦質(zhì)量.

3）通過在多個(gè)公共數(shù)據(jù)集上不斷增加數(shù)據(jù)的稀疏性，驗(yàn)證本文模型推薦精度下降速度明顯低于基線方法.

1 相關(guān)工作

1.1 基于異質(zhì)信息網(wǎng)絡(luò)的算法

近幾年來，由多種節(jié)點(diǎn)或邊組成的異質(zhì)信息網(wǎng)絡(luò)HIN（Heterogeneous Information Network）作為一種融合復(fù)雜信息的強(qiáng)大建模方法被提出.與同構(gòu)網(wǎng)絡(luò)相比，由實(shí)體類型及其在HIN 中的關(guān)系提供的異質(zhì)信息可以捕獲更多語義上有意義的信息.2014 年，Jacob 等人[1]提出了一種將節(jié)點(diǎn)表示學(xué)習(xí)應(yīng)用于不同節(jié)點(diǎn)類型共有的潛在空間上的新方法，但由于其將異質(zhì)信息網(wǎng)絡(luò)變成同構(gòu)信息網(wǎng)絡(luò)來處理，此類方法會(huì)丟失較多重要信息.2015 年，Tang 等人[2]提出了一種預(yù)測文本嵌入模型，但該方法不適用于除文本網(wǎng)絡(luò)外的大多數(shù)異質(zhì)信息網(wǎng)絡(luò).2017 年，兩種經(jīng)典的基于元路徑的異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法[3-4]被提出，它們使用元路徑游走來捕獲不同類型節(jié)點(diǎn)之間的關(guān)系.劉鈺峰等人[5]采用重啟動(dòng)隨機(jī)游走進(jìn)行查詢推薦，在游走的基礎(chǔ)上進(jìn)行了改進(jìn).黃立威等人[6]利用基于元路徑的異質(zhì)信息網(wǎng)絡(luò)來做鏈路預(yù)測.近年來，異質(zhì)信息網(wǎng)絡(luò)作為一種新興方向，逐漸被應(yīng)用于推薦鄰居中復(fù)雜關(guān)系的建模中.Shi 等人[7]提出異質(zhì)信息網(wǎng)絡(luò)嵌入模型，通過異質(zhì)信息網(wǎng)絡(luò)生成特定關(guān)系對應(yīng)的元路徑，獲得用戶隱含向量，然后通過融合函數(shù)進(jìn)行向量的融合并最終用于推薦.

上述算法在單個(gè)域上構(gòu)建異質(zhì)信息網(wǎng)絡(luò)，在網(wǎng)絡(luò)連接稀疏的情況下，節(jié)點(diǎn)可學(xué)習(xí)的鄰居信息極少，使得節(jié)點(diǎn)表示學(xué)習(xí)質(zhì)量不高.

1.2 基于圖神經(jīng)網(wǎng)絡(luò)的推薦算法

圖神經(jīng)網(wǎng)絡(luò)作為一種新型的拓展神經(jīng)網(wǎng)絡(luò)，可以在圖上對節(jié)點(diǎn)進(jìn)行特征提取和表示，是一種高效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).許多方法模型利用了GNN 特有的優(yōu)勢來解決經(jīng)典問題，并得到了優(yōu)于傳統(tǒng)方法的實(shí)驗(yàn)結(jié)果.例如，Berg 等人[8]提出了一種圖自編碼器框架GCMC（Graph Convolution Matrix Completion），從鏈路預(yù)測的角度解決推薦系統(tǒng)中的評分預(yù)測問題.Zhang 等人[9]提出一種采用一堆GCN（Graph Convolution Network）編碼器/解碼器與中間監(jiān)督相結(jié)合的模型，以提高最終預(yù)測性能.Wu 等人[10]利用GNN 機(jī)制捕獲了更深層次的社會(huì)擴(kuò)散過程.Fan 等人[11]提出一種基于圖神經(jīng)網(wǎng)絡(luò)的模型用于推薦任務(wù)并展現(xiàn)了良好的性能.葛堯等人[12]提出一種新的圖卷積網(wǎng)絡(luò)推薦算法，其使用兩組圖卷積來處理不同交互信息.上述算法均只能夠處理由單一類型節(jié)點(diǎn)或單一類型關(guān)系構(gòu)成的規(guī)則拓?fù)鋱D，網(wǎng)絡(luò)節(jié)點(diǎn)隱特征隨機(jī)初始化，GNN 只融合節(jié)點(diǎn)的一階鄰居特征.由于上述算法忽略或未充分挖掘網(wǎng)絡(luò)中節(jié)點(diǎn)間更深層的結(jié)構(gòu)和語義信息，因此當(dāng)網(wǎng)絡(luò)節(jié)點(diǎn)均只有極少的鄰居數(shù)，即用戶項(xiàng)目評分?jǐn)?shù)據(jù)稀疏時(shí)，上述基于GNN 的推薦算法的推薦質(zhì)量明顯下降.

1.3 注意力機(jī)制

注意力機(jī)制（Attention Mechanism）源于對人類視覺的研究.在認(rèn)知科學(xué)中，由于信息處理的瓶頸，人類會(huì)選擇性地關(guān)注所有信息的一部分，同時(shí)忽略其他可見的信息，上述機(jī)制通常被稱為注意力機(jī)制.Velikovi 等人[13]通過疊加圖注意力層為中心節(jié)點(diǎn)的鄰居節(jié)點(diǎn)分配不同的權(quán)重，并據(jù)此融合鄰居節(jié)點(diǎn)信息生成更有效的中心節(jié)點(diǎn)的特征表示.張青博等人[14]利用注意力機(jī)制分析用戶對項(xiàng)目不同屬性的關(guān)注度，以此獲取用戶更準(zhǔn)確的偏好信息.

注意力機(jī)制具有直觀性、通用性和可解釋性的優(yōu)點(diǎn)，已成為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的重要組成部分，被廣泛應(yīng)用到推薦系統(tǒng)、自然語言生成等不同類型的深度學(xué)習(xí)任務(wù)中[15].

2 H_GNN 模型

2.1 H_GNN 模型框架

H_GNN 模型框架如圖1 所示，圖中顯示了模型架構(gòu)分為兩部分：首先是異質(zhì)信息網(wǎng)絡(luò)多特征融合（如圖1 中H_GNN 第一部分），采用遷移學(xué)習(xí)的思想，構(gòu)建面向圖神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練模型，對購物和社交兩類數(shù)據(jù)進(jìn)行聯(lián)合解碼，共同學(xué)習(xí)用戶、項(xiàng)目的低維隱特征，從而最大限度地挖掘用戶、項(xiàng)目之間的信息交互潛力，提升圖神經(jīng)網(wǎng)絡(luò)推薦模型的訓(xùn)練效率.其次是面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)（如圖1 中H_GNN 第二部分），在圖神經(jīng)網(wǎng)絡(luò)進(jìn)行推薦建模時(shí)，本文基于用戶與項(xiàng)目間的不同交互行為、用戶間的不同社交關(guān)系對用戶偏好、項(xiàng)目特征表示的影響程度不同的假設(shè)，將注意力機(jī)制引入用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)的用戶、項(xiàng)目聚合表示過程，從而實(shí)現(xiàn)用戶/項(xiàng)目交互和用戶社交兩類網(wǎng)絡(luò)間的節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征的有效融合.

圖1 H_GNN 模型框架圖Fig.1 Block diagram of H_GNN model

2.2 基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示

本文構(gòu)建的異質(zhì)信息網(wǎng)絡(luò)由用戶、項(xiàng)目兩類節(jié)點(diǎn)，用戶與項(xiàng)目間的交互關(guān)系和用戶與用戶間的社交關(guān)系構(gòu)成.其具體數(shù)學(xué)表示如下.

令U={u1，u2，…，un}和V={v1，v2，…，vn}分別表示數(shù)據(jù)集中用戶集合和項(xiàng)目集合，n 和m 表示用戶和項(xiàng)目的個(gè)數(shù)，T∈Rn*m為用戶項(xiàng)目交互矩陣，rij表示用戶i 對項(xiàng)目j 給出的評分，如果用戶沒打出評分則rij=0，評分可以看作是該用戶對該項(xiàng)目的喜好程度，評分越高代表用戶越喜歡該項(xiàng)目.一個(gè)用戶可以對多個(gè)項(xiàng)目進(jìn)行評分，同樣一個(gè)項(xiàng)目也可以被多個(gè)用戶打分.G∈Rn*n為用戶社交矩陣.δ=（A，R）表示一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)圖，分為用戶項(xiàng)目交互網(wǎng)絡(luò)u_v 和用戶社交關(guān)系網(wǎng)絡(luò)u_u，其中A 表示網(wǎng)絡(luò)圖中的實(shí)體，可以是用戶或項(xiàng)目，R 表示實(shí)體之間的交互關(guān)系.

本文定義了兩種元路徑：一種是用戶-項(xiàng)目間的UV 元路徑，體現(xiàn)用戶與項(xiàng)目間的交互關(guān)系；第二種是用戶-用戶間的UU 元路徑，體現(xiàn)用戶-用戶間的社交關(guān)系.下面給出路徑生成規(guī)則.

具體計(jì)算公式為

式中：nt為當(dāng)前節(jié)點(diǎn)，nt+1為下一個(gè)節(jié)點(diǎn)，NAt+1（v）表示v 的鄰居中屬于At+1類型的節(jié)點(diǎn)，ρ 表示本文規(guī)定的元路徑規(guī)則.

按照兩種元路徑分別經(jīng)過采樣后，本文使用Skip-gram[16]算法生成每個(gè)節(jié)點(diǎn)的特征向量，將通過UV 生成的用戶和項(xiàng)目的向量表示為和，將通過UU 生成的用戶向量表示為.這里定義L 為采樣路徑長度，Lc為窗口大小.此時(shí)上述兩類網(wǎng)絡(luò)節(jié)點(diǎn)的特征向量中已學(xué)習(xí)到用戶/項(xiàng)目交互以及用戶社交關(guān)系網(wǎng)絡(luò)中的隱特征.

2.3 面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法

用戶/項(xiàng)目交互關(guān)系中附帶評分屬性，同一用戶對不同項(xiàng)目的評分、不同用戶對同一項(xiàng)目的評分中蘊(yùn)含著豐富的用戶偏好和項(xiàng)目特征信息.在用戶/項(xiàng)目評分?jǐn)?shù)據(jù)稀疏的情況下，為充分挖掘用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中的關(guān)系和屬性信息，本文將注意力機(jī)制引入用戶、項(xiàng)目的特征聚合表示過程，從而實(shí)現(xiàn)用戶/項(xiàng)目交互和用戶社交兩類網(wǎng)絡(luò)間的節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征的有效融合.

在聚合與中心用戶節(jié)點(diǎn)發(fā)生交互的鄰居項(xiàng)目節(jié)點(diǎn)、社交用戶節(jié)點(diǎn)時(shí)，利用注意力機(jī)制根據(jù)用戶特征為鄰居項(xiàng)目、鄰居用戶分配不同的權(quán)重，從而體現(xiàn)不同交互項(xiàng)目、不同社交用戶在體現(xiàn)用戶喜好特征時(shí)不同的重要性.在聚合與中心項(xiàng)目節(jié)點(diǎn)發(fā)生交互的鄰居用戶節(jié)點(diǎn)時(shí)，利用注意力機(jī)制根據(jù)項(xiàng)目特征為鄰居用戶分配不同的權(quán)重，從而體現(xiàn)不同鄰居用戶在體現(xiàn)項(xiàng)目特征時(shí)不同的重要性.

2.3.1 用戶特征融合

對于用戶，本文融合了獨(dú)立的兩部分，針對用戶項(xiàng)目交互網(wǎng)絡(luò)的u_v 和針對用戶社交網(wǎng)絡(luò)的u_u.

u_v：對于任何一個(gè)用戶，本文使用其鄰居項(xiàng)目和評分來表示該用戶針對某一項(xiàng)目的隱含向量表示，然后通過attention 網(wǎng)絡(luò)生成對應(yīng)的權(quán)重，最后融合所有的隱含向量得到交互網(wǎng)絡(luò)中該用戶的隱含向量表示.具體計(jì)算公式為

σ 為激活函數(shù)，w 和b 為神經(jīng)網(wǎng)絡(luò)參數(shù)，αij為項(xiàng)目j 對用戶i 的權(quán)重，每個(gè)項(xiàng)目對用戶的重要程度不同，如果把所有的權(quán)重指數(shù)都置為1，會(huì)導(dǎo)致預(yù)測結(jié)果不理想，因此本文通過兩層神經(jīng)網(wǎng)絡(luò)訓(xùn)練權(quán)重.具體計(jì)算公式為

xjr表示項(xiàng)目j 和對應(yīng)評分r 的向量融合.xjr具體計(jì)算公式為

gτ為一個(gè)多層全連接神經(jīng)網(wǎng)絡(luò)，⊕表示向量的拼接.er表示隨機(jī)初始化生成的評分向量.

u_u：本文使用用戶社交網(wǎng)絡(luò)中該用戶的鄰居向量融合來表示該用戶在社交網(wǎng)絡(luò)中的隱含向量表示，具體計(jì)算公式為

式中：βi′i為鄰居i′對用戶i 的權(quán)重指數(shù)，具體計(jì)算公式為

由公式（3）和（7），本文分別得到了用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中的用戶隱特征，并最終通過公式（9）將這兩部分特征進(jìn)一步融合.具體計(jì)算公式為

2.3.2 項(xiàng)目特征融合

用戶i 對項(xiàng)目j 的權(quán)重指數(shù)ηij，具體計(jì)算公式為

這里得到的項(xiàng)目隱含向量表示作為最終的項(xiàng)目向量表示.

2.3.3 評分預(yù)測

本文通過上面得到的用戶向量和項(xiàng)目向量來預(yù)測用戶對項(xiàng)目的評分，在這里本文定義了一個(gè)多層的全連接層網(wǎng)絡(luò)，把用戶和項(xiàng)目向量的拼接作為網(wǎng)絡(luò)的輸入，網(wǎng)絡(luò)的輸出則是預(yù)測評分.具體計(jì)算公式為

2.3.4 模型學(xué)習(xí)

本文使用經(jīng)典交叉熵?fù)p失函數(shù)進(jìn)行模型更新，具體計(jì)算公式為

3 實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集及評價(jià)指標(biāo)

本文使用了Ciao 和Epinions 兩個(gè)數(shù)據(jù)集進(jìn)行對比實(shí)驗(yàn)，這兩個(gè)數(shù)據(jù)集是由亞利桑那州立大學(xué)學(xué)者在做社交網(wǎng)絡(luò)方面研究的時(shí)候使用的數(shù)據(jù)集.可以分別從http：//www.cse.msu.edu/～tangjili/trust.html和http：//www.trustlet.org/epinions.html 網(wǎng)頁鏈接上獲取.它們分別包含了283 319 和764 352 個(gè)評級.

本文采用了RMSE（Root Mean Square Error）和MAE（Mean Absolute Error）兩項(xiàng)指標(biāo)來驗(yàn)證模型準(zhǔn)確度.

3.2 參數(shù)的設(shè)定

H_GNN 模型的超參數(shù)有路徑長度、窗口大小、學(xué)習(xí)率和嵌入維度.

本文通過實(shí)驗(yàn)對比了在不同學(xué)習(xí)率下，路徑長度為10、窗口大小為5 和路徑長度為20、窗口大小為10 的預(yù)測誤差.關(guān)于參數(shù)實(shí)驗(yàn)結(jié)果如表1 所示，表中顯示了H_GNN 模型在路徑長度為20、窗口大小為10、學(xué)習(xí)率為0.004 時(shí)預(yù)測誤差最小.

表1 路徑長度、窗口大小、學(xué)習(xí)率對比實(shí)驗(yàn)Tab.1 Comparative experiment of path length，window size and learning rate

關(guān)于在不同嵌入維度下，H_GNN 模型的預(yù)測誤差實(shí)驗(yàn)結(jié)果如圖2、圖3 所示，圖中顯示了H_GNN模型在嵌入維度為64 時(shí)，預(yù)測誤差最小.

圖2 嵌入維度實(shí)驗(yàn)指標(biāo)RMSE 對比Fig.2 Comparison of experimental index RMSE of embedded dimension

圖3 嵌入維度實(shí)驗(yàn)指標(biāo)MAE 對比Fig.3 Comparison of experimental index MAE of embedded dimension

3.3 對比實(shí)驗(yàn)

為了評估H_GNN 模型的推薦性能，本文選擇以下六種推薦模型作為基線方法，進(jìn)行對比實(shí)驗(yàn).

SocialMF[17]（Social Matrix Factorization）：主要思想是在矩陣分解中引入信任傳播，用戶表示接近其信任的用戶.

NeuMF[18]（Neural Matrix Factorization）：模型主要思想是結(jié)合了傳統(tǒng)矩陣分解和多層感知機(jī)，可以同時(shí)抽取低維和高維的特征.

DeepSoR[19]（Deep Social Recommendation）：主要思想是從社交關(guān)系學(xué)習(xí)到的用戶表示集成到概率矩陣分解中.

DeepFM[20]（Deep Matrix Factorization）：主要思想是聯(lián)合訓(xùn)練FM（Matrix Factorization）模型和DNN（Deep Neural Networks）模型，同時(shí)學(xué)習(xí)低階特征組合和高階特征組合.

Wide&Deep[21]（Wide and Deep）：提出一種融合淺層模型和深層模型進(jìn)行聯(lián)合訓(xùn)練的框架.

GCMC[8]：提出一種從鏈路預(yù)測角度解決評分預(yù)測的圖自編碼器框架.

GraphRec[11]（Graph Recommendation）：主要思想是按用戶商品間的交互關(guān)系和用戶間的社交關(guān)系兩個(gè)層次，依次融合用戶、項(xiàng)目特征，進(jìn)而訓(xùn)練GNN 網(wǎng)絡(luò)預(yù)測評分.

H_GNN 與基線方法在Ciao 和Epinion 兩個(gè)數(shù)據(jù)集上，按照6 ∶4 劃分訓(xùn)練和測試集.關(guān)于模型對比實(shí)驗(yàn)結(jié)果如表2 所示，表中顯示了在兩個(gè)數(shù)據(jù)集的兩個(gè)評價(jià)指標(biāo)下，H_GNN 模型均得到了最小的預(yù)測誤差.

表2 推薦模型預(yù)測誤差對比實(shí)驗(yàn)Tab.2 Comparison experiment of recommended model prediction error

為了驗(yàn)證H_GNN 模型在稀疏數(shù)據(jù)集上的推薦質(zhì)量，本文基于Ciao 數(shù)據(jù)集構(gòu)造了不同稀疏程度的9 個(gè)數(shù)據(jù)集，在保證Ciao 數(shù)據(jù)集不出現(xiàn)用戶、項(xiàng)目冷啟動(dòng)的情況下，依次對用戶/項(xiàng)目評分?jǐn)?shù)據(jù)進(jìn)行了9次稀疏化，每次減少10%的評分?jǐn)?shù)據(jù)，并選擇同樣基于GNN 且也融合了社交網(wǎng)絡(luò)輔助信息的推薦鄰居最先進(jìn)的模型之——GraphRec 模型作為基線方法.

關(guān)于H_GNN 與基線方法中預(yù)測效果最好的GraphRec 模型的稀疏度對比實(shí)驗(yàn)結(jié)果如圖4、圖5所示，圖中顯示了在評分?jǐn)?shù)據(jù)不斷減少的過程中，H_GNN 模型相比GraphRec 模型的推薦質(zhì)量提升明顯，在評分?jǐn)?shù)據(jù)最為稀疏的90%處，H_GNN 模型比GraphRec 模型的推薦誤差降低了約40%.

圖4 隨稀疏度改變RMSE 指標(biāo)對比Fig.4 RMSE index comparison with sparsity change

圖5 隨稀疏度改變MAE 指標(biāo)對比Fig.5 MAE index comparison with sparsity change

由上述實(shí)驗(yàn)結(jié)果可知，在用戶/項(xiàng)目交互稀疏的情況下，相比于基線方法使用隨機(jī)初始化用戶/項(xiàng)目節(jié)點(diǎn)表示進(jìn)行推薦模型訓(xùn)練，本文提出的基于異質(zhì)信息網(wǎng)絡(luò)的多特征聯(lián)合表示方法具有更強(qiáng)的節(jié)點(diǎn)特征表示能力，提出的面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦方法能有效融合用戶、項(xiàng)目、評分、社交等多維特征提升推薦質(zhì)量.

3.4 消融實(shí)驗(yàn)

為了探究基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示、用戶社交網(wǎng)絡(luò)信息聚合對H_GNN 模型訓(xùn)練效果的影響，本文在兩種不同稀疏度的Ciao 數(shù)據(jù)集上進(jìn)行了兩組消融實(shí)驗(yàn).其中H_GNN_2 模型為取消基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示，直接采用隨機(jī)值初始化用戶、項(xiàng)目特征向量作為面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法的輸入；H_GNN-u_u 模型為在面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法中，取消用戶社交網(wǎng)絡(luò)u_u，只采用用戶項(xiàng)目交互網(wǎng)絡(luò)u_v 進(jìn)行用戶特征聚合.關(guān)于消融實(shí)驗(yàn)結(jié)果如圖6、圖7 所示，圖中顯示了在稀疏度為50%和90%的Ciao 數(shù)據(jù)集上，H_GNN 模型的預(yù)測誤差明顯低于H_GNN_2 和H_GNN-u_u 模型.

圖6 消融實(shí)驗(yàn)中RMSE 指標(biāo)對比Fig.6 RMSE index comparison in ablation experiment

圖7 消融實(shí)驗(yàn)中MAE 指標(biāo)對比Fig.7 MAE index comparison in ablation experiment

由H_GNN_2 消融實(shí)驗(yàn)結(jié)果可知，使用基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示有助于提升H_GNN 模型推薦質(zhì)量.由H_GNN-u_u 消融實(shí)驗(yàn)結(jié)果可知，融合用戶社交信息，使用戶特征向量中包含用戶社交關(guān)系特征，同樣有助于提升H_GNN 模型推薦質(zhì)量.

4 結(jié)論

數(shù)據(jù)稀疏性問題是推薦系統(tǒng)面臨的最具挑戰(zhàn)性的問題之一.數(shù)據(jù)稀疏使得圖網(wǎng)絡(luò)中節(jié)點(diǎn)可學(xué)習(xí)的結(jié)構(gòu)信息變少，因此傳統(tǒng)基于GNN 的推薦算法預(yù)測誤差大.本文提出一種基于異質(zhì)圖神經(jīng)網(wǎng)絡(luò)的推薦算法，使用異質(zhì)信息網(wǎng)絡(luò)對多源異質(zhì)數(shù)據(jù)進(jìn)行聯(lián)合解碼，引入注意力機(jī)制進(jìn)行用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中用戶、項(xiàng)目特征的聚合表示，從而充分挖掘稀疏數(shù)據(jù)集中蘊(yùn)含圖節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征.通過在兩個(gè)公開數(shù)據(jù)集上進(jìn)行的大量對比實(shí)驗(yàn)結(jié)果表明，本文提出的算法在原始和不斷稀疏化的數(shù)據(jù)集上的推薦誤差均明顯小于所有的基線方法.

隨著時(shí)間的推移，推薦系統(tǒng)中的網(wǎng)絡(luò)節(jié)點(diǎn)及其關(guān)系會(huì)不斷變化，目前本文的推薦模型僅適用于靜態(tài)圖網(wǎng)絡(luò)，后續(xù)可進(jìn)一步開展動(dòng)態(tài)圖網(wǎng)絡(luò)增量計(jì)算推薦算法的研究.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡