国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于異質(zhì)圖神經(jīng)網(wǎng)絡(luò)的推薦算法研究

2021-11-04 09:40:26陳卓李涵杜軍威
關(guān)鍵詞:異質(zhì)信息網(wǎng)絡(luò)社交

陳卓,李涵,杜軍威

(青島科技大學(xué)信息科學(xué)技術(shù)學(xué)院,山東青島 266061)

隨著電子商務(wù)和社交媒體平臺(tái)的快速發(fā)展,推薦系統(tǒng)已經(jīng)成為許多企業(yè)不可或缺的工具.一個(gè)高效的推薦系統(tǒng)能通過準(zhǔn)確地捕捉用戶的偏好,發(fā)現(xiàn)用戶可能感興趣的項(xiàng)目,從而提高用戶對平臺(tái)的滿意度,提高用戶的保留率.

推薦系統(tǒng)根據(jù)用戶的興趣和項(xiàng)目屬性來評估用戶對項(xiàng)目的偏好.由于用戶興趣和項(xiàng)目特征都用壓縮向量表示,因此學(xué)習(xí)用戶/項(xiàng)目交互和其他輔助信息,如社會(huì)關(guān)系和知識(shí)圖的嵌入表示,成為該鄰居需解決的關(guān)鍵問題.

在推薦系統(tǒng)中,大多數(shù)信息具有圖結(jié)構(gòu),而圖神經(jīng)網(wǎng)絡(luò)GNN(Graph Neural Network)技術(shù)可以通過圖節(jié)點(diǎn)之間的消息傳遞來捕捉圖的相關(guān)性,因此GNN經(jīng)常被用來生成用戶/項(xiàng)目的嵌入表示.然而傳統(tǒng)的基于GNN 的推薦算法,只能夠處理由單一類型節(jié)點(diǎn)構(gòu)成的規(guī)則拓?fù)鋱D,而當(dāng)下網(wǎng)絡(luò)中的數(shù)據(jù)并非只由單一類型節(jié)點(diǎn)構(gòu)成.此外,傳統(tǒng)GNN 只融合節(jié)點(diǎn)的一階鄰居特征,無法獲取節(jié)點(diǎn)在網(wǎng)絡(luò)中的更深層結(jié)構(gòu)關(guān)系.因此,當(dāng)數(shù)據(jù)集稀疏,各節(jié)點(diǎn)均只有極少的鄰居數(shù)時(shí),基于傳統(tǒng)GNN 的推薦算法的推薦質(zhì)量下降明顯.

為了解決以上的不足之處,本文將圖神經(jīng)網(wǎng)絡(luò)與異質(zhì)網(wǎng)絡(luò)相結(jié)合,提出深度推薦模型H_GNN(Heterogeneous_Graph Neural Network).本文的貢獻(xiàn)可以總結(jié)為以下幾點(diǎn):

1)給出了異質(zhì)信息網(wǎng)絡(luò)的信息的多特征聯(lián)合表示方法.面向用戶/項(xiàng)目交互和用戶社交兩個(gè)域,利用異質(zhì)信息網(wǎng)絡(luò)中的多階拓?fù)浣Y(jié)構(gòu)信息,增強(qiáng)網(wǎng)絡(luò)連接稀疏情況下節(jié)點(diǎn)特征的表示能力.

2)提出了面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦方法.通過對用戶、項(xiàng)目、評分、社交等多維表示向量的有效融合,增強(qiáng)推薦模型在評分矩陣稀疏情況下,推薦模型的推薦質(zhì)量.

3)通過在多個(gè)公共數(shù)據(jù)集上不斷增加數(shù)據(jù)的稀疏性,驗(yàn)證本文模型推薦精度下降速度明顯低于基線方法.

1 相關(guān)工作

1.1 基于異質(zhì)信息網(wǎng)絡(luò)的算法

近幾年來,由多種節(jié)點(diǎn)或邊組成的異質(zhì)信息網(wǎng)絡(luò)HIN(Heterogeneous Information Network)作為一種融合復(fù)雜信息的強(qiáng)大建模方法被提出.與同構(gòu)網(wǎng)絡(luò)相比,由實(shí)體類型及其在HIN 中的關(guān)系提供的異質(zhì)信息可以捕獲更多語義上有意義的信息.2014 年,Jacob 等人[1]提出了一種將節(jié)點(diǎn)表示學(xué)習(xí)應(yīng)用于不同節(jié)點(diǎn)類型共有的潛在空間上的新方法,但由于其將異質(zhì)信息網(wǎng)絡(luò)變成同構(gòu)信息網(wǎng)絡(luò)來處理,此類方法會(huì)丟失較多重要信息.2015 年,Tang 等人[2]提出了一種預(yù)測文本嵌入模型,但該方法不適用于除文本網(wǎng)絡(luò)外的大多數(shù)異質(zhì)信息網(wǎng)絡(luò).2017 年,兩種經(jīng)典的基于元路徑的異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法[3-4]被提出,它們使用元路徑游走來捕獲不同類型節(jié)點(diǎn)之間的關(guān)系.劉鈺峰等人[5]采用重啟動(dòng)隨機(jī)游走進(jìn)行查詢推薦,在游走的基礎(chǔ)上進(jìn)行了改進(jìn).黃立威等人[6]利用基于元路徑的異質(zhì)信息網(wǎng)絡(luò)來做鏈路預(yù)測.近年來,異質(zhì)信息網(wǎng)絡(luò)作為一種新興方向,逐漸被應(yīng)用于推薦鄰居中復(fù)雜關(guān)系的建模中.Shi 等人[7]提出異質(zhì)信息網(wǎng)絡(luò)嵌入模型,通過異質(zhì)信息網(wǎng)絡(luò)生成特定關(guān)系對應(yīng)的元路徑,獲得用戶隱含向量,然后通過融合函數(shù)進(jìn)行向量的融合并最終用于推薦.

上述算法在單個(gè)域上構(gòu)建異質(zhì)信息網(wǎng)絡(luò),在網(wǎng)絡(luò)連接稀疏的情況下,節(jié)點(diǎn)可學(xué)習(xí)的鄰居信息極少,使得節(jié)點(diǎn)表示學(xué)習(xí)質(zhì)量不高.

1.2 基于圖神經(jīng)網(wǎng)絡(luò)的推薦算法

圖神經(jīng)網(wǎng)絡(luò)作為一種新型的拓展神經(jīng)網(wǎng)絡(luò),可以在圖上對節(jié)點(diǎn)進(jìn)行特征提取和表示,是一種高效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).許多方法模型利用了GNN 特有的優(yōu)勢來解決經(jīng)典問題,并得到了優(yōu)于傳統(tǒng)方法的實(shí)驗(yàn)結(jié)果.例如,Berg 等人[8]提出了一種圖自編碼器框架GCMC(Graph Convolution Matrix Completion),從鏈路預(yù)測的角度解決推薦系統(tǒng)中的評分預(yù)測問題.Zhang 等人[9]提出一種采用一堆GCN(Graph Convolution Network)編碼器/解碼器與中間監(jiān)督相結(jié)合的模型,以提高最終預(yù)測性能.Wu 等人[10]利用GNN 機(jī)制捕獲了更深層次的社會(huì)擴(kuò)散過程.Fan 等人[11]提出一種基于圖神經(jīng)網(wǎng)絡(luò)的模型用于推薦任務(wù)并展現(xiàn)了良好的性能.葛堯等人[12]提出一種新的圖卷積網(wǎng)絡(luò)推薦算法,其使用兩組圖卷積來處理不同交互信息.上述算法均只能夠處理由單一類型節(jié)點(diǎn)或單一類型關(guān)系構(gòu)成的規(guī)則拓?fù)鋱D,網(wǎng)絡(luò)節(jié)點(diǎn)隱特征隨機(jī)初始化,GNN 只融合節(jié)點(diǎn)的一階鄰居特征.由于上述算法忽略或未充分挖掘網(wǎng)絡(luò)中節(jié)點(diǎn)間更深層的結(jié)構(gòu)和語義信息,因此當(dāng)網(wǎng)絡(luò)節(jié)點(diǎn)均只有極少的鄰居數(shù),即用戶項(xiàng)目評分?jǐn)?shù)據(jù)稀疏時(shí),上述基于GNN 的推薦算法的推薦質(zhì)量明顯下降.

1.3 注意力機(jī)制

注意力機(jī)制(Attention Mechanism)源于對人類視覺的研究.在認(rèn)知科學(xué)中,由于信息處理的瓶頸,人類會(huì)選擇性地關(guān)注所有信息的一部分,同時(shí)忽略其他可見的信息,上述機(jī)制通常被稱為注意力機(jī)制.Velikovi 等人[13]通過疊加圖注意力層為中心節(jié)點(diǎn)的鄰居節(jié)點(diǎn)分配不同的權(quán)重,并據(jù)此融合鄰居節(jié)點(diǎn)信息生成更有效的中心節(jié)點(diǎn)的特征表示.張青博等人[14]利用注意力機(jī)制分析用戶對項(xiàng)目不同屬性的關(guān)注度,以此獲取用戶更準(zhǔn)確的偏好信息.

注意力機(jī)制具有直觀性、通用性和可解釋性的優(yōu)點(diǎn),已成為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的重要組成部分,被廣泛應(yīng)用到推薦系統(tǒng)、自然語言生成等不同類型的深度學(xué)習(xí)任務(wù)中[15].

2 H_GNN 模型

2.1 H_GNN 模型框架

H_GNN 模型框架如圖1 所示,圖中顯示了模型架構(gòu)分為兩部分:首先是異質(zhì)信息網(wǎng)絡(luò)多特征融合(如圖1 中H_GNN 第一部分),采用遷移學(xué)習(xí)的思想,構(gòu)建面向圖神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練模型,對購物和社交兩類數(shù)據(jù)進(jìn)行聯(lián)合解碼,共同學(xué)習(xí)用戶、項(xiàng)目的低維隱特征,從而最大限度地挖掘用戶、項(xiàng)目之間的信息交互潛力,提升圖神經(jīng)網(wǎng)絡(luò)推薦模型的訓(xùn)練效率.其次是面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)(如圖1 中H_GNN 第二部分),在圖神經(jīng)網(wǎng)絡(luò)進(jìn)行推薦建模時(shí),本文基于用戶與項(xiàng)目間的不同交互行為、用戶間的不同社交關(guān)系對用戶偏好、項(xiàng)目特征表示的影響程度不同的假設(shè),將注意力機(jī)制引入用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)的用戶、項(xiàng)目聚合表示過程,從而實(shí)現(xiàn)用戶/項(xiàng)目交互和用戶社交兩類網(wǎng)絡(luò)間的節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征的有效融合.

圖1 H_GNN 模型框架圖Fig.1 Block diagram of H_GNN model

2.2 基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示

本文構(gòu)建的異質(zhì)信息網(wǎng)絡(luò)由用戶、項(xiàng)目兩類節(jié)點(diǎn),用戶與項(xiàng)目間的交互關(guān)系和用戶與用戶間的社交關(guān)系構(gòu)成.其具體數(shù)學(xué)表示如下.

令U={u1,u2,…,un}和V={v1,v2,…,vn}分別表示數(shù)據(jù)集中用戶集合和項(xiàng)目集合,n 和m 表示用戶和項(xiàng)目的個(gè)數(shù),T∈Rn*m為用戶項(xiàng)目交互矩陣,rij表示用戶i 對項(xiàng)目j 給出的評分,如果用戶沒打出評分則rij=0,評分可以看作是該用戶對該項(xiàng)目的喜好程度,評分越高代表用戶越喜歡該項(xiàng)目.一個(gè)用戶可以對多個(gè)項(xiàng)目進(jìn)行評分,同樣一個(gè)項(xiàng)目也可以被多個(gè)用戶打分.G∈Rn*n為用戶社交矩陣.δ=(A,R)表示一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)圖,分為用戶項(xiàng)目交互網(wǎng)絡(luò)u_v 和用戶社交關(guān)系網(wǎng)絡(luò)u_u,其中A 表示網(wǎng)絡(luò)圖中的實(shí)體,可以是用戶或項(xiàng)目,R 表示實(shí)體之間的交互關(guān)系.

本文定義了兩種元路徑:一種是用戶-項(xiàng)目間的UV 元路徑,體現(xiàn)用戶與項(xiàng)目間的交互關(guān)系;第二種是用戶-用戶間的UU 元路徑,體現(xiàn)用戶-用戶間的社交關(guān)系.下面給出路徑生成規(guī)則.

具體計(jì)算公式為

式中:nt為當(dāng)前節(jié)點(diǎn),nt+1為下一個(gè)節(jié)點(diǎn),NAt+1(v)表示v 的鄰居中屬于At+1類型的節(jié)點(diǎn),ρ 表示本文規(guī)定的元路徑規(guī)則.

按照兩種元路徑分別經(jīng)過采樣后,本文使用Skip-gram[16]算法生成每個(gè)節(jié)點(diǎn)的特征向量,將通過UV 生成的用戶和項(xiàng)目的向量表示為和,將通過UU 生成的用戶向量表示為.這里定義L 為采樣路徑長度,Lc為窗口大小.此時(shí)上述兩類網(wǎng)絡(luò)節(jié)點(diǎn)的特征向量中已學(xué)習(xí)到用戶/項(xiàng)目交互以及用戶社交關(guān)系網(wǎng)絡(luò)中的隱特征.

2.3 面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法

用戶/項(xiàng)目交互關(guān)系中附帶評分屬性,同一用戶對不同項(xiàng)目的評分、不同用戶對同一項(xiàng)目的評分中蘊(yùn)含著豐富的用戶偏好和項(xiàng)目特征信息.在用戶/項(xiàng)目評分?jǐn)?shù)據(jù)稀疏的情況下,為充分挖掘用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中的關(guān)系和屬性信息,本文將注意力機(jī)制引入用戶、項(xiàng)目的特征聚合表示過程,從而實(shí)現(xiàn)用戶/項(xiàng)目交互和用戶社交兩類網(wǎng)絡(luò)間的節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征的有效融合.

在聚合與中心用戶節(jié)點(diǎn)發(fā)生交互的鄰居項(xiàng)目節(jié)點(diǎn)、社交用戶節(jié)點(diǎn)時(shí),利用注意力機(jī)制根據(jù)用戶特征為鄰居項(xiàng)目、鄰居用戶分配不同的權(quán)重,從而體現(xiàn)不同交互項(xiàng)目、不同社交用戶在體現(xiàn)用戶喜好特征時(shí)不同的重要性.在聚合與中心項(xiàng)目節(jié)點(diǎn)發(fā)生交互的鄰居用戶節(jié)點(diǎn)時(shí),利用注意力機(jī)制根據(jù)項(xiàng)目特征為鄰居用戶分配不同的權(quán)重,從而體現(xiàn)不同鄰居用戶在體現(xiàn)項(xiàng)目特征時(shí)不同的重要性.

2.3.1 用戶特征融合

對于用戶,本文融合了獨(dú)立的兩部分,針對用戶項(xiàng)目交互網(wǎng)絡(luò)的u_v 和針對用戶社交網(wǎng)絡(luò)的u_u.

u_v:對于任何一個(gè)用戶,本文使用其鄰居項(xiàng)目和評分來表示該用戶針對某一項(xiàng)目的隱含向量表示,然后通過attention 網(wǎng)絡(luò)生成對應(yīng)的權(quán)重,最后融合所有的隱含向量得到交互網(wǎng)絡(luò)中該用戶的隱含向量表示.具體計(jì)算公式為

σ 為激活函數(shù),w 和b 為神經(jīng)網(wǎng)絡(luò)參數(shù),αij為項(xiàng)目j 對用戶i 的權(quán)重,每個(gè)項(xiàng)目對用戶的重要程度不同,如果把所有的權(quán)重指數(shù)都置為1,會(huì)導(dǎo)致預(yù)測結(jié)果不理想,因此本文通過兩層神經(jīng)網(wǎng)絡(luò)訓(xùn)練權(quán)重.具體計(jì)算公式為

xjr表示項(xiàng)目j 和對應(yīng)評分r 的向量融合.xjr具體計(jì)算公式為

gτ為一個(gè)多層全連接神經(jīng)網(wǎng)絡(luò),⊕表示向量的拼接.er表示隨機(jī)初始化生成的評分向量.

u_u:本文使用用戶社交網(wǎng)絡(luò)中該用戶的鄰居向量融合來表示該用戶在社交網(wǎng)絡(luò)中的隱含向量表示,具體計(jì)算公式為

式中:βi′i為鄰居i′對用戶i 的權(quán)重指數(shù),具體計(jì)算公式為

由公式(3)和(7),本文分別得到了用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中的用戶隱特征,并最終通過公式(9)將這兩部分特征進(jìn)一步融合.具體計(jì)算公式為

2.3.2 項(xiàng)目特征融合

用戶i 對項(xiàng)目j 的權(quán)重指數(shù)ηij,具體計(jì)算公式為

這里得到的項(xiàng)目隱含向量表示作為最終的項(xiàng)目向量表示.

2.3.3 評分預(yù)測

本文通過上面得到的用戶向量和項(xiàng)目向量來預(yù)測用戶對項(xiàng)目的評分,在這里本文定義了一個(gè)多層的全連接層網(wǎng)絡(luò),把用戶和項(xiàng)目向量的拼接作為網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)的輸出則是預(yù)測評分.具體計(jì)算公式為

2.3.4 模型學(xué)習(xí)

本文使用經(jīng)典交叉熵?fù)p失函數(shù)進(jìn)行模型更新,具體計(jì)算公式為

3 實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集及評價(jià)指標(biāo)

本文使用了Ciao 和Epinions 兩個(gè)數(shù)據(jù)集進(jìn)行對比實(shí)驗(yàn),這兩個(gè)數(shù)據(jù)集是由亞利桑那州立大學(xué)學(xué)者在做社交網(wǎng)絡(luò)方面研究的時(shí)候使用的數(shù)據(jù)集.可以分別從http://www.cse.msu.edu/~tangjili/trust.html和http://www.trustlet.org/epinions.html 網(wǎng)頁鏈接上獲取.它們分別包含了283 319 和764 352 個(gè)評級.

本文采用了RMSE(Root Mean Square Error)和MAE(Mean Absolute Error)兩項(xiàng)指標(biāo)來驗(yàn)證模型準(zhǔn)確度.

3.2 參數(shù)的設(shè)定

H_GNN 模型的超參數(shù)有路徑長度、窗口大小、學(xué)習(xí)率和嵌入維度.

本文通過實(shí)驗(yàn)對比了在不同學(xué)習(xí)率下,路徑長度為10、窗口大小為5 和路徑長度為20、窗口大小為10 的預(yù)測誤差.關(guān)于參數(shù)實(shí)驗(yàn)結(jié)果如表1 所示,表中顯示了H_GNN 模型在路徑長度為20、窗口大小為10、學(xué)習(xí)率為0.004 時(shí)預(yù)測誤差最小.

表1 路徑長度、窗口大小、學(xué)習(xí)率對比實(shí)驗(yàn)Tab.1 Comparative experiment of path length,window size and learning rate

關(guān)于在不同嵌入維度下,H_GNN 模型的預(yù)測誤差實(shí)驗(yàn)結(jié)果如圖2、圖3 所示,圖中顯示了H_GNN模型在嵌入維度為64 時(shí),預(yù)測誤差最小.

圖2 嵌入維度實(shí)驗(yàn)指標(biāo)RMSE 對比Fig.2 Comparison of experimental index RMSE of embedded dimension

圖3 嵌入維度實(shí)驗(yàn)指標(biāo)MAE 對比Fig.3 Comparison of experimental index MAE of embedded dimension

3.3 對比實(shí)驗(yàn)

為了評估H_GNN 模型的推薦性能,本文選擇以下六種推薦模型作為基線方法,進(jìn)行對比實(shí)驗(yàn).

SocialMF[17](Social Matrix Factorization):主要思想是在矩陣分解中引入信任傳播,用戶表示接近其信任的用戶.

NeuMF[18](Neural Matrix Factorization):模型主要思想是結(jié)合了傳統(tǒng)矩陣分解和多層感知機(jī),可以同時(shí)抽取低維和高維的特征.

DeepSoR[19](Deep Social Recommendation):主要思想是從社交關(guān)系學(xué)習(xí)到的用戶表示集成到概率矩陣分解中.

DeepFM[20](Deep Matrix Factorization):主要思想是聯(lián)合訓(xùn)練FM(Matrix Factorization)模型和DNN(Deep Neural Networks)模型,同時(shí)學(xué)習(xí)低階特征組合和高階特征組合.

Wide&Deep[21](Wide and Deep):提出一種融合淺層模型和深層模型進(jìn)行聯(lián)合訓(xùn)練的框架.

GCMC[8]:提出一種從鏈路預(yù)測角度解決評分預(yù)測的圖自編碼器框架.

GraphRec[11](Graph Recommendation):主要思想是按用戶商品間的交互關(guān)系和用戶間的社交關(guān)系兩個(gè)層次,依次融合用戶、項(xiàng)目特征,進(jìn)而訓(xùn)練GNN 網(wǎng)絡(luò)預(yù)測評分.

H_GNN 與基線方法在Ciao 和Epinion 兩個(gè)數(shù)據(jù)集上,按照6 ∶4 劃分訓(xùn)練和測試集.關(guān)于模型對比實(shí)驗(yàn)結(jié)果如表2 所示,表中顯示了在兩個(gè)數(shù)據(jù)集的兩個(gè)評價(jià)指標(biāo)下,H_GNN 模型均得到了最小的預(yù)測誤差.

表2 推薦模型預(yù)測誤差對比實(shí)驗(yàn)Tab.2 Comparison experiment of recommended model prediction error

為了驗(yàn)證H_GNN 模型在稀疏數(shù)據(jù)集上的推薦質(zhì)量,本文基于Ciao 數(shù)據(jù)集構(gòu)造了不同稀疏程度的9 個(gè)數(shù)據(jù)集,在保證Ciao 數(shù)據(jù)集不出現(xiàn)用戶、項(xiàng)目冷啟動(dòng)的情況下,依次對用戶/項(xiàng)目評分?jǐn)?shù)據(jù)進(jìn)行了9次稀疏化,每次減少10%的評分?jǐn)?shù)據(jù),并選擇同樣基于GNN 且也融合了社交網(wǎng)絡(luò)輔助信息的推薦鄰居最先進(jìn)的模型之——GraphRec 模型作為基線方法.

關(guān)于H_GNN 與基線方法中預(yù)測效果最好的GraphRec 模型的稀疏度對比實(shí)驗(yàn)結(jié)果如圖4、圖5所示,圖中顯示了在評分?jǐn)?shù)據(jù)不斷減少的過程中,H_GNN 模型相比GraphRec 模型的推薦質(zhì)量提升明顯,在評分?jǐn)?shù)據(jù)最為稀疏的90%處,H_GNN 模型比GraphRec 模型的推薦誤差降低了約40%.

圖4 隨稀疏度改變RMSE 指標(biāo)對比Fig.4 RMSE index comparison with sparsity change

圖5 隨稀疏度改變MAE 指標(biāo)對比Fig.5 MAE index comparison with sparsity change

由上述實(shí)驗(yàn)結(jié)果可知,在用戶/項(xiàng)目交互稀疏的情況下,相比于基線方法使用隨機(jī)初始化用戶/項(xiàng)目節(jié)點(diǎn)表示進(jìn)行推薦模型訓(xùn)練,本文提出的基于異質(zhì)信息網(wǎng)絡(luò)的多特征聯(lián)合表示方法具有更強(qiáng)的節(jié)點(diǎn)特征表示能力,提出的面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦方法能有效融合用戶、項(xiàng)目、評分、社交等多維特征提升推薦質(zhì)量.

3.4 消融實(shí)驗(yàn)

為了探究基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示、用戶社交網(wǎng)絡(luò)信息聚合對H_GNN 模型訓(xùn)練效果的影響,本文在兩種不同稀疏度的Ciao 數(shù)據(jù)集上進(jìn)行了兩組消融實(shí)驗(yàn).其中H_GNN_2 模型為取消基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示,直接采用隨機(jī)值初始化用戶、項(xiàng)目特征向量作為面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法的輸入;H_GNN-u_u 模型為在面向注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)推薦算法中,取消用戶社交網(wǎng)絡(luò)u_u,只采用用戶項(xiàng)目交互網(wǎng)絡(luò)u_v 進(jìn)行用戶特征聚合.關(guān)于消融實(shí)驗(yàn)結(jié)果如圖6、圖7 所示,圖中顯示了在稀疏度為50%和90%的Ciao 數(shù)據(jù)集上,H_GNN 模型的預(yù)測誤差明顯低于H_GNN_2 和H_GNN-u_u 模型.

圖6 消融實(shí)驗(yàn)中RMSE 指標(biāo)對比Fig.6 RMSE index comparison in ablation experiment

圖7 消融實(shí)驗(yàn)中MAE 指標(biāo)對比Fig.7 MAE index comparison in ablation experiment

由H_GNN_2 消融實(shí)驗(yàn)結(jié)果可知,使用基于異質(zhì)信息網(wǎng)絡(luò)的信息多特征聯(lián)合表示有助于提升H_GNN 模型推薦質(zhì)量.由H_GNN-u_u 消融實(shí)驗(yàn)結(jié)果可知,融合用戶社交信息,使用戶特征向量中包含用戶社交關(guān)系特征,同樣有助于提升H_GNN 模型推薦質(zhì)量.

4 結(jié)論

數(shù)據(jù)稀疏性問題是推薦系統(tǒng)面臨的最具挑戰(zhàn)性的問題之一.數(shù)據(jù)稀疏使得圖網(wǎng)絡(luò)中節(jié)點(diǎn)可學(xué)習(xí)的結(jié)構(gòu)信息變少,因此傳統(tǒng)基于GNN 的推薦算法預(yù)測誤差大.本文提出一種基于異質(zhì)圖神經(jīng)網(wǎng)絡(luò)的推薦算法,使用異質(zhì)信息網(wǎng)絡(luò)對多源異質(zhì)數(shù)據(jù)進(jìn)行聯(lián)合解碼,引入注意力機(jī)制進(jìn)行用戶/項(xiàng)目交互網(wǎng)絡(luò)和用戶社交網(wǎng)絡(luò)中用戶、項(xiàng)目特征的聚合表示,從而充分挖掘稀疏數(shù)據(jù)集中蘊(yùn)含圖節(jié)點(diǎn)及拓?fù)浣Y(jié)構(gòu)特征.通過在兩個(gè)公開數(shù)據(jù)集上進(jìn)行的大量對比實(shí)驗(yàn)結(jié)果表明,本文提出的算法在原始和不斷稀疏化的數(shù)據(jù)集上的推薦誤差均明顯小于所有的基線方法.

隨著時(shí)間的推移,推薦系統(tǒng)中的網(wǎng)絡(luò)節(jié)點(diǎn)及其關(guān)系會(huì)不斷變化,目前本文的推薦模型僅適用于靜態(tài)圖網(wǎng)絡(luò),后續(xù)可進(jìn)一步開展動(dòng)態(tài)圖網(wǎng)絡(luò)增量計(jì)算推薦算法的研究.

猜你喜歡
異質(zhì)信息網(wǎng)絡(luò)社交
社交之城
英語世界(2023年6期)2023-06-30 06:28:28
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
社交距離
你回避社交,真不是因?yàn)閮?nèi)向
文苑(2018年17期)2018-11-09 01:29:28
幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪的教義學(xué)展開
刑法論叢(2018年2期)2018-10-10 03:32:22
非法利用信息網(wǎng)絡(luò)罪的適用邊界
法律方法(2018年3期)2018-10-10 03:21:34
網(wǎng)絡(luò)共享背景下信息網(wǎng)絡(luò)傳播權(quán)的保護(hù)
幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪若干問題探究
隨機(jī)與異質(zhì)網(wǎng)絡(luò)共存的SIS傳染病模型的定性分析
Ag2CO3/Ag2O異質(zhì)p-n結(jié)光催化劑的制備及其可見光光催化性能
海林市| 金川县| 和顺县| 金寨县| 正镶白旗| 墨脱县| 临湘市| 辽源市| 保靖县| 同江市| 南丹县| 海淀区| 咸宁市| 陇南市| 金乡县| 巴彦淖尔市| 班戈县| 庐江县| 凤台县| 莱阳市| 抚州市| 崇仁县| 永兴县| 长沙市| 涪陵区| 合肥市| 南投市| 罗田县| 滕州市| 清苑县| 永福县| 云梦县| 阿拉善盟| 加查县| 金坛市| 林周县| 阳泉市| 神农架林区| 华阴市| 永年县| 长子县|