国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于超鄰接圖的異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)

2023-10-17 05:50:42楊彬王軼彤
計(jì)算機(jī)工程 2023年10期
關(guān)鍵詞:異質(zhì)信息網(wǎng)絡(luò)語(yǔ)義

楊彬,王軼彤

(復(fù)旦大學(xué) 軟件學(xué)院,上海 200433)

0 概述

異質(zhì)信息網(wǎng)絡(luò)(Heterogeneous Information Network,HIN)[1-2]在人類(lèi)社會(huì)中無(wú)處不在,其中往往存在不同類(lèi)型的節(jié)點(diǎn)和關(guān)系,這些節(jié)點(diǎn)和關(guān)系包含豐富的信息和復(fù)雜的交互,如社會(huì)網(wǎng)絡(luò)[3-4]、引文網(wǎng)絡(luò)[5]、電影網(wǎng)絡(luò)[6]、推薦系統(tǒng)[7-9]等。與同質(zhì)信息網(wǎng)絡(luò)相比,異質(zhì)信息網(wǎng)絡(luò)中包含更豐富的語(yǔ)義信息和更復(fù)雜的關(guān)系,這給當(dāng)前的研究帶來(lái)了巨大的挑戰(zhàn),特別是異質(zhì)信息網(wǎng)絡(luò)中的表征學(xué)習(xí)。大多數(shù)機(jī)器學(xué)習(xí)方法或數(shù)據(jù)挖掘算法都需要通過(guò)準(zhǔn)確的數(shù)據(jù)表征來(lái)構(gòu)建各種任務(wù)模型,如分類(lèi)[10-11]、聚類(lèi)[12-13]、預(yù)測(cè)[14-15]、推薦[16]等。因此,對(duì)于這些任務(wù)模型,表征學(xué)習(xí)是非常重要的。

由于不同類(lèi)型的節(jié)點(diǎn)和復(fù)雜的交互關(guān)系,異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)[17]一直是一個(gè)非常重要和具有挑戰(zhàn)性的問(wèn)題。在過(guò)去的幾年里,人們對(duì)該方向進(jìn)行了一系列的研究,并取得了許多較好的成果。經(jīng)典的范例之一是設(shè)計(jì)和使用元路徑,例如metapath2vec[18]和HIN2Vec[19],其中,元路徑是具有特定節(jié)點(diǎn)和關(guān)系類(lèi)型的預(yù)定義序列模式。近年來(lái),基于圖神經(jīng)網(wǎng)絡(luò)強(qiáng)大的表征能力,人們提出了一些基于圖神經(jīng)網(wǎng)絡(luò)[20]的異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)模型,例如:HAN[21]利用雙層注意力機(jī)制即節(jié)點(diǎn)級(jí)注意力和語(yǔ)義級(jí)注意力來(lái)獲取節(jié)點(diǎn)及其元路徑的重要性,最后通過(guò)鄰域聚合來(lái)實(shí)現(xiàn)節(jié)點(diǎn)表征;HGCN[22]設(shè)計(jì)了一種關(guān)系特征學(xué)習(xí)方法,對(duì)不同類(lèi)型的邊的特征進(jìn)行加權(quán),最后進(jìn)行聚合得到節(jié)點(diǎn)表征。

然而,現(xiàn)有的方法大多存在一定的局限性:1)在多數(shù)研究中,元路徑都是由具有特定領(lǐng)域知識(shí)的專(zhuān)家手工設(shè)計(jì)的,成本高且覆蓋范圍?。?)目前的方法通常沒(méi)有充分考慮高階鄰居的結(jié)構(gòu)和內(nèi)容信息;3)多數(shù)方法要么像在同質(zhì)網(wǎng)絡(luò)中一樣統(tǒng)一處理不同類(lèi)型的節(jié)點(diǎn),要么不考慮不同類(lèi)型節(jié)點(diǎn)之間的連接,直接將它們映射到不同的表征空間中。因此,現(xiàn)有的方法難以準(zhǔn)確有效地捕捉特征。鑒于這些局限性,本文試圖通過(guò)回答以下2 個(gè)問(wèn)題來(lái)解決關(guān)鍵問(wèn)題:1)如何處理不同類(lèi)型的鄰居節(jié)點(diǎn)/邊,以捕獲目標(biāo)節(jié)點(diǎn)上有影響力的鄰居節(jié)點(diǎn)(包括高階鄰居);2)如何有效地聚合有影響力的鄰居節(jié)點(diǎn)來(lái)更新目標(biāo)節(jié)點(diǎn)的表征。

針對(duì)上述問(wèn)題,本文提出一種基于超鄰接圖的異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)模型(HIN-HG)。設(shè)計(jì)一個(gè)圖卷積層來(lái)學(xué)習(xí)不同類(lèi)型的邊的重要性,引入語(yǔ)義圖來(lái)獲取包含高階鄰居的元路徑信息,并將其與特征圖聚合得到超鄰接圖,精確捕獲給定目標(biāo)節(jié)點(diǎn)的有影響力的鄰居節(jié)點(diǎn)。在此基礎(chǔ)上,通過(guò)多通道的圖卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)節(jié)點(diǎn)表征,從而有效地聚合有影響的鄰居節(jié)點(diǎn)的信息。本文具體工作如下:首先,引入節(jié)點(diǎn)圖與語(yǔ)義圖來(lái)精確捕獲與給定目標(biāo)節(jié)點(diǎn)距離不同的有影響力的鄰居;然后,將語(yǔ)義圖與學(xué)習(xí)得到的特征圖聚合得到超鄰接圖,并使用多通道圖卷積神經(jīng)網(wǎng)絡(luò)將有影響的鄰居信息聚合到目標(biāo)節(jié)點(diǎn);最后,在3 個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證本文方法的有效性和優(yōu)越性。

1 相關(guān)工作

目前,表征學(xué)習(xí)研究取得了顯著的進(jìn)展,成為了最受歡迎的數(shù)據(jù)挖掘技術(shù)之一。由于節(jié)點(diǎn)表征的復(fù)雜性和不規(guī)則性,使得異質(zhì)信息網(wǎng)絡(luò)中的節(jié)點(diǎn)表征具有一定的難度和挑戰(zhàn)性,因此早期的研究主要是將同質(zhì)網(wǎng)絡(luò)中的表征方法應(yīng)用到異質(zhì)網(wǎng)絡(luò)中,例如:PEROZZI等[23]受到word2vec[24]的啟發(fā),提出將自然語(yǔ)言處理的思想應(yīng)用于網(wǎng)絡(luò)表征學(xué)習(xí)的DeepWalk,使用隨機(jī)游走策略獲取節(jié)點(diǎn)序列,并通過(guò)skip-gram模型表征節(jié)點(diǎn);類(lèi)似地,node2vec[25]使用帶有偏差的隨機(jī)游走策略擴(kuò)展了DeepWalk;LINE[26]是基于一階和二階相似度學(xué)習(xí)的網(wǎng)絡(luò)表征方法;SDNE[27]使用深度自編碼器來(lái)表征網(wǎng)絡(luò),試圖捕獲網(wǎng)絡(luò)中的高度非線性關(guān)系。這些方法雖然能很好地應(yīng)用于同質(zhì)網(wǎng)絡(luò),但由于語(yǔ)義和結(jié)構(gòu)的復(fù)雜性,并不適合直接應(yīng)用于異質(zhì)網(wǎng)絡(luò)。

近年來(lái),一些專(zhuān)為異質(zhì)信息網(wǎng)絡(luò)設(shè)計(jì)的表征學(xué)習(xí)模型逐漸被提出,例如:metapath2vec 通過(guò)在給定的元路徑上隨機(jī)游走獲得節(jié)點(diǎn)序列,然后使用基于異質(zhì)的skip-gram 模型學(xué)習(xí)節(jié)點(diǎn)表征;metagraph2vec擴(kuò)展了metapath2vec,使用基于元圖的隨機(jī)游走策略進(jìn)行節(jié)點(diǎn)采樣;HIN2Vec 利用淺層神經(jīng)網(wǎng)絡(luò)同時(shí)學(xué)習(xí)網(wǎng)絡(luò)中節(jié)點(diǎn)和關(guān)系的表征。

圖神經(jīng)網(wǎng)絡(luò)是一種新興的深度表征學(xué)習(xí)模型,在相關(guān)任務(wù)中表現(xiàn)出了優(yōu)異的性能。圖神經(jīng)網(wǎng)絡(luò)的核心思想是通過(guò)神經(jīng)網(wǎng)絡(luò)從節(jié)點(diǎn)的鄰居中聚合特征來(lái)更新節(jié)點(diǎn)表征。GNN 模型有許多變體,例如:圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)[28]利用鄰域聚合和多層網(wǎng)絡(luò)捕獲高階鄰居信息;圖注意網(wǎng)絡(luò)(GAT)[29]利用自注意機(jī)制,根據(jù)鄰居的不同重要性將鄰居信息更精確地聚合到目標(biāo)節(jié)點(diǎn)中;GraphSAGE[30]對(duì)給定目標(biāo)節(jié)點(diǎn)的固定大小的k跳鄰居進(jìn)行采樣,并聚合它們的特征來(lái)表征目標(biāo)節(jié)點(diǎn)。

雖然圖神經(jīng)網(wǎng)絡(luò)在表征學(xué)習(xí)方面取得了較好的成果,但由于節(jié)點(diǎn)類(lèi)型和關(guān)系的不同,圖神經(jīng)網(wǎng)絡(luò)不能直接應(yīng)用到異質(zhì)信息網(wǎng)絡(luò)中。為了更好地處理和利用異質(zhì)信息網(wǎng)絡(luò)中的信息,一些異質(zhì)圖神經(jīng)網(wǎng)絡(luò)模型被提出,例如:RGCN[31]根據(jù)不同類(lèi)型的關(guān)系設(shè)計(jì)多個(gè)圖卷積層,然后聚合得到節(jié)點(diǎn)表征;HAN 使用節(jié)點(diǎn)級(jí)注意力機(jī)制聚合鄰居信息,使用語(yǔ)義級(jí)注意力機(jī)制聚合預(yù)定義元路徑信息;HetGNN[32]采用重啟隨機(jī)游走策略采樣強(qiáng)相關(guān)鄰居,利用LSTM 模型分別計(jì)算目標(biāo)節(jié)點(diǎn)及其鄰居的節(jié)點(diǎn)表征;MetaHIN[33]在異質(zhì)信息網(wǎng)絡(luò)中提出使用元學(xué)習(xí)框架來(lái)解決推薦中的冷啟動(dòng)問(wèn)題;HGCN[22]使用基于異質(zhì)信息網(wǎng)絡(luò)的GCN 模型來(lái)解決集體分類(lèi)問(wèn)題;GTN[34]利用圖神經(jīng)網(wǎng)絡(luò),通過(guò)識(shí)別多跳連接來(lái)學(xué)習(xí)圖中的元路徑,獲得了有效的節(jié)點(diǎn)表征;HGSL[35]使用一種聯(lián)合圖結(jié)構(gòu)學(xué)習(xí)和GNN 參數(shù)學(xué)習(xí)的框架來(lái)解決分類(lèi)問(wèn)題。雖然這些方法在實(shí)驗(yàn)中效果良好,但仍存在一些局限性:元路徑對(duì)理解異質(zhì)信息網(wǎng)絡(luò)中節(jié)點(diǎn)之間的結(jié)構(gòu)和語(yǔ)義連接非常重要,然而,手動(dòng)設(shè)計(jì)元路徑通常需要特定領(lǐng)域的知識(shí),而且成本比較高,一些隱含的元路徑連接甚至對(duì)領(lǐng)域?qū)<襾?lái)說(shuō)也很難設(shè)計(jì);對(duì)于沒(méi)有使用元路徑的方法,通常采用消息傳播機(jī)制來(lái)識(shí)別高階鄰居,然而由于傳播距離較短,高階鄰居不能完全被捕獲。因此,如何精確捕獲不同距離的有影響力的鄰居節(jié)點(diǎn),以及如何有效地聚合鄰居的特征以提高表征學(xué)習(xí)性能,仍需要進(jìn)一步研究。

2 研究背景

異質(zhì)圖是一種包含不同類(lèi)型的節(jié)點(diǎn)和邊的信息網(wǎng)絡(luò)。本節(jié)介紹異質(zhì)圖的定義,并總結(jié)全文中使用的數(shù)學(xué)符號(hào)。表1 中列出了本文所使用的數(shù)學(xué)符號(hào)的描述。

表1 符號(hào)描述Table 1 Descriptions for notations

定義1異質(zhì)圖

一個(gè)異質(zhì)圖可以表示為G=(V,E,A,R),由一個(gè)節(jié)點(diǎn)集V和一個(gè)邊集E 組成。它還包括一個(gè)節(jié)點(diǎn)類(lèi)型映射函數(shù)φ:V →A和一個(gè)邊類(lèi)型映射函數(shù)ψ:E →R,其中,A是節(jié)點(diǎn)類(lèi)型的集合,R 是邊類(lèi)型的集合,并且在異質(zhì)圖中滿(mǎn)足|A| +|R| >2。當(dāng)|A|=1且|R|=1時(shí),就得到一個(gè)同質(zhì)圖。一個(gè)異質(zhì)圖可以看作是一組鄰接矩陣的集合即{Ak}Kk=1,其中,Ak∈RN×N是一個(gè)只包含第k種類(lèi)型邊的子圖,K=|R|,N=|V|。多數(shù)異質(zhì)圖還具有一個(gè)初始特征矩陣X∈RN×d,其中,d是每個(gè)節(jié)點(diǎn)的特征維度。

定義2元路徑

元路徑可以被定義為在異質(zhì)信息網(wǎng)絡(luò)模式TG=(A,R)下由節(jié)點(diǎn)類(lèi)型組成的路徑P:,其中,ai∈A,ri∈R。元路徑表示節(jié)點(diǎn)a1和節(jié)點(diǎn)al之間的復(fù)合關(guān)系R=r1?r2?…?rl,其中,?表示關(guān)系的復(fù)合運(yùn)算符。給定一個(gè)復(fù)合關(guān)系R或一系列邊類(lèi)型,將不同邊類(lèi)型的鄰接矩陣進(jìn)行乘法運(yùn)算,就可以得到元路徑的鄰接矩陣:

3 本文方法

3.1 總體框架

本節(jié)介紹基于超鄰接圖的異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)體系結(jié)構(gòu)。如圖1 所示,該模型分為4 個(gè)部分:1)使用1×1 圖卷積層學(xué)習(xí)不同類(lèi)型邊的權(quán)重,獲得節(jié)點(diǎn)圖;2)通過(guò)矩陣乘法和疊加得到語(yǔ)義圖;3)將特征圖與語(yǔ)義圖加權(quán)聚合得到超鄰接圖;4)使用多通道圖卷積網(wǎng)絡(luò)學(xué)習(xí)節(jié)點(diǎn)表征,并通過(guò)最小化預(yù)測(cè)標(biāo)簽與真實(shí)標(biāo)簽之間的多元交叉熵來(lái)優(yōu)化節(jié)點(diǎn)表征。

圖1 本文方法總體框架Fig.1 The overall framework of the proposed method

3.2 節(jié)點(diǎn)圖

在異質(zhì)信息網(wǎng)絡(luò)中,不同類(lèi)型的節(jié)點(diǎn)往往扮演著不同的角色,在學(xué)習(xí)特定任務(wù)的節(jié)點(diǎn)表征時(shí)表現(xiàn)出不同的重要性。為了表示與給定目標(biāo)節(jié)點(diǎn)相關(guān)的不同連接下不同類(lèi)型的鄰居節(jié)點(diǎn)的重要性,通過(guò)引入節(jié)點(diǎn)圖來(lái)學(xué)習(xí)異質(zhì)圖中每種類(lèi)型邊的重要性,例如,異質(zhì)圖通常有多個(gè)子圖,每一個(gè)子圖表示一種類(lèi)型的邊。因此,本文設(shè)計(jì)了一個(gè)1×1 卷積層來(lái)學(xué)習(xí)不同類(lèi)型邊的權(quán)重。卷積過(guò)程可以表示為:

其中:∈RN×N是包含不同類(lèi)型邊的權(quán)重的節(jié)點(diǎn)圖;Wk∈R1×1是不同類(lèi)型邊的可學(xué)習(xí)權(quán)重系數(shù);bk是偏置向量。為了平衡各類(lèi)型邊的權(quán)重,使用Softmax 函數(shù)對(duì)初始化的權(quán)重系數(shù)進(jìn)行歸一化,得到:

其中:ak∈R1×1是第k張子圖的初始權(quán)重系數(shù)。節(jié)點(diǎn)圖是不對(duì)稱(chēng)的,因?yàn)樵诋愘|(zhì)圖中,2 個(gè)節(jié)點(diǎn)對(duì)彼此的影響往往是不同的。它可以看作是一種潛在的注意力機(jī)制,可以幫助目標(biāo)節(jié)點(diǎn)學(xué)習(xí)不同類(lèi)型鄰居節(jié)點(diǎn)的權(quán)重。但是,公式中定義的鄰接矩陣忽略了目標(biāo)節(jié)點(diǎn)本身的重要性。通常,節(jié)點(diǎn)的表征需要保留自己的特征,以防止被鄰居節(jié)點(diǎn)的特征完全同化,故向異質(zhì)圖G中添加單位矩陣,即A0=I,由此,中包含每個(gè)節(jié)點(diǎn)自身的權(quán)重。

3.3 語(yǔ)義圖

通常,異質(zhì)圖中的節(jié)點(diǎn)都包含豐富的語(yǔ)義信息,節(jié)點(diǎn)圖僅僅考慮了一階鄰居的重要性,不能充分反映節(jié)點(diǎn)之間的結(jié)構(gòu)和語(yǔ)義聯(lián)系。想要更全面地學(xué)習(xí)節(jié)點(diǎn)表征,需要學(xué)習(xí)不同元路徑的重要性,以捕獲高階鄰居對(duì)目標(biāo)節(jié)點(diǎn)的影響。為了解決異質(zhì)圖中元路徑選擇和高階鄰居聚集的問(wèn)題,本節(jié)基于上述的節(jié)點(diǎn)圖提出一種新的語(yǔ)義圖來(lái)學(xué)習(xí)不同元路徑的重要性。給定學(xué)習(xí)得到的多個(gè)節(jié)點(diǎn)圖,通過(guò)矩陣乘法計(jì)算長(zhǎng)度為l的元路徑鄰接矩陣,計(jì)算過(guò)程如下:

其中:Al∈RN×N是指定長(zhǎng)度l的元路徑鄰接矩陣;∈RN×N是第i層的節(jié)點(diǎn)圖;Aik∈RN×N是第i層節(jié)點(diǎn)圖的第k張子圖;Wik∈R1×1是Aik的可學(xué)習(xí)權(quán)重系數(shù);bik是偏置向量。Wik通過(guò)歸一化得到:

其中:aik∈R1×1是初始化的權(quán)重系數(shù)。元路徑鄰接矩陣包含所有指定長(zhǎng)度的元路徑,不同的元路徑具有不同的權(quán)重,l=1 的元路徑鄰接矩陣即為第1 層的節(jié)點(diǎn)圖。由于節(jié)點(diǎn)圖中的權(quán)重經(jīng)過(guò)歸一化處理,均小于1,因此一般情況下,元路徑越長(zhǎng),權(quán)重越小,這也符合專(zhuān)家認(rèn)知:一般情況下,對(duì)于目標(biāo)節(jié)點(diǎn)而言,低階鄰居比高階鄰居更重要。給定長(zhǎng)度L,將長(zhǎng)度為1~L的元路徑鄰接矩陣相加,如式(6)所示,可以得到含有長(zhǎng)度不超過(guò)L的所有元路徑的語(yǔ)義圖:

其中:Gsem∈RN×N。語(yǔ)義圖包含長(zhǎng)度不超過(guò)L的所有元路徑,并為其分配不同的權(quán)重來(lái)反映不同的重要性。由于元路徑鄰接矩陣只能學(xué)習(xí)指定長(zhǎng)度元路徑上的鄰居節(jié)點(diǎn)的重要性,通過(guò)疊加得到語(yǔ)義圖,因此可以將與目標(biāo)節(jié)點(diǎn)距離不大于L的所有鄰居節(jié)點(diǎn)都考慮到,且不同類(lèi)型、不同距離的鄰居節(jié)點(diǎn)具有不同的權(quán)重,鄰居節(jié)點(diǎn)的權(quán)重越大,其對(duì)目標(biāo)節(jié)點(diǎn)的影響力也就越大,反之亦然。相比于其他方法,該方法可以學(xué)習(xí)得到不同鄰居節(jié)點(diǎn)的重要性,由此可以更精確地捕獲到有影響力的鄰居節(jié)點(diǎn)。

3.4 超鄰接圖

語(yǔ)義圖可以捕獲指定距離內(nèi)的鄰居節(jié)點(diǎn)信息,但無(wú)法覆蓋與目標(biāo)節(jié)點(diǎn)相似但距離很遠(yuǎn)的節(jié)點(diǎn),因此,進(jìn)一步引入特征圖,為特征相似但距離較遠(yuǎn)的節(jié)點(diǎn)建立連接,以此擴(kuò)充圖的信息。對(duì)于特征圖,給出如下定義:

定義3特征圖

對(duì)于異質(zhì)圖中的任意2 個(gè)節(jié)點(diǎn)進(jìn)行相似性度量,并將原圖中沒(méi)有鏈接但相似性較高的節(jié)點(diǎn)對(duì)直接建立一條邊,邊的權(quán)重即為相似度,由此得到的新的圖結(jié)構(gòu),稱(chēng)之為特征圖。

對(duì)于異質(zhì)圖中的任意2 個(gè)節(jié)點(diǎn)vi和vj,設(shè)置條件函數(shù)來(lái)計(jì)算它們的相似性:

其中:fi,fj∈R1×D是節(jié)點(diǎn)vi和vj的特征向量;εfea∈(0,1)是人工設(shè)定的控制特征圖稀疏度的閾值;Gsem[i,j]=0 代表節(jié)點(diǎn)vi和vj在語(yǔ)義圖中沒(méi)有連接;Γfea為余弦相似度度量函數(shù)。由此可以計(jì)算得到特征圖Gfea∈RN×N。將語(yǔ)義圖和特征圖進(jìn)行聚合即可得到一張包含所有影響力較大的鄰居節(jié)點(diǎn)的圖,稱(chēng)之為超鄰接圖:

其中:wfea∈R1×1是特征圖的可學(xué)習(xí)權(quán)重系數(shù)。超鄰接圖中既包含指定距離內(nèi)對(duì)目標(biāo)節(jié)點(diǎn)有影響力的鄰居節(jié)點(diǎn),又包含與目標(biāo)節(jié)點(diǎn)距離較遠(yuǎn)但特征相似的節(jié)點(diǎn),不同的節(jié)點(diǎn)通過(guò)不同的權(quán)重來(lái)體現(xiàn)它們的重要性。

3.5 多通道圖卷積神經(jīng)網(wǎng)絡(luò)

將圖卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于超鄰接圖,從而得到節(jié)點(diǎn)表征:

其中:D是超鄰接圖的度矩陣;X∈RN×D是特征矩陣;W∈RD×D是可學(xué)習(xí)的權(quán)重矩陣。為了考慮多種可能的超鄰接圖,增強(qiáng)模型的學(xué)習(xí)能力,并行學(xué)習(xí)多個(gè)超鄰接圖并應(yīng)用圖卷積神經(jīng)網(wǎng)絡(luò),將每個(gè)輸出設(shè)置為一個(gè)通道,由此應(yīng)用了多通道機(jī)制,以更有效地聚集有影響力的鄰居。最后,將GCN 應(yīng)用于每個(gè)通道,并將多個(gè)輸出的節(jié)點(diǎn)表征拼接:

其中:Hi為第i個(gè)通道輸出的節(jié)點(diǎn)表征;Z為最終用于節(jié)點(diǎn)分類(lèi)任務(wù)的節(jié)點(diǎn)表征向量。本文的損失函數(shù)定義為具有真實(shí)標(biāo)簽的節(jié)點(diǎn)的標(biāo)準(zhǔn)交叉熵:

其中:Θ是分類(lèi)器的參數(shù);YL是具有標(biāo)簽的節(jié)點(diǎn)索引的集合;Yl和Zl是已標(biāo)記節(jié)點(diǎn)的標(biāo)簽和表征。

4 實(shí)驗(yàn)

4.1 數(shù)據(jù)集

為了評(píng)估HIN-HG 的有效性,在以下3 個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行相關(guān)實(shí)驗(yàn):學(xué)術(shù)網(wǎng)絡(luò)DBLP 和ACM,以及電影網(wǎng)絡(luò)IMDB。這些數(shù)據(jù)集都包含多種類(lèi)型的節(jié)點(diǎn)和關(guān)系,具體信息如表2 所示。

表2 數(shù)據(jù)集信息Table 2 Information of datasets

1)DBLP數(shù)據(jù)集來(lái)自DBLP官網(wǎng),主要包含18 405個(gè)節(jié)點(diǎn)、67 946 條邊和4 種邊類(lèi)型。根據(jù)研究領(lǐng)域可將作者分為4 類(lèi):數(shù)據(jù)庫(kù),數(shù)據(jù)挖掘,信息檢索,人工智能。

2)ACM 數(shù)據(jù)集來(lái)自ACM 電子數(shù)據(jù)庫(kù),主要包含8 994 個(gè)節(jié)點(diǎn)、25 922 條邊和4 種邊類(lèi)型。論文類(lèi)別分為3 類(lèi):數(shù)據(jù)挖掘,數(shù)據(jù)庫(kù),無(wú)線通信。

3)IMDB數(shù)據(jù)集來(lái)自IMDB官網(wǎng),主要包含12 772 個(gè)節(jié)點(diǎn)、37 288 條邊和4 種邊類(lèi)型。電影分為3 類(lèi):動(dòng)作,喜劇,戲劇。

4.2 對(duì)比方法

本文通過(guò)與以下基線方法(包括基于隨機(jī)游走的方法和基于圖神經(jīng)網(wǎng)絡(luò)的方法)進(jìn)行比較,來(lái)驗(yàn)證HIN-HG 的有效性。

1)DeepWalk:針對(duì)同質(zhì)圖設(shè)計(jì)的一種基于隨機(jī)游走策略的表征學(xué)習(xí)方法。在本文的實(shí)驗(yàn)中,忽略了節(jié)點(diǎn)的異質(zhì)性,將異質(zhì)圖當(dāng)作是同質(zhì)圖來(lái)執(zhí)行DeepWalk。

2)metapath2vec:一種使用基于元路徑的隨機(jī)游走策略并利用skip-gram 表征異質(zhì)圖的表征學(xué)習(xí)方法。本文測(cè)試metapath2vec 的所有元路徑,展示其最佳性能。

3)GCN:一種針對(duì)同質(zhì)圖設(shè)計(jì)的半監(jiān)督式圖卷積神經(jīng)網(wǎng)絡(luò)。本文忽略節(jié)點(diǎn)和邊的異質(zhì)性,展示其最佳性能。

4)GAT:一種考慮同質(zhì)圖上注意力機(jī)制的半監(jiān)督式神經(jīng)網(wǎng)絡(luò)。本文忽略節(jié)點(diǎn)和邊的異質(zhì)性,展示其最佳性能。

5)RGCN:一種針對(duì)異質(zhì)圖不同類(lèi)型的邊設(shè)計(jì)的半監(jiān)督式圖卷積神經(jīng)網(wǎng)絡(luò)。本文使用原論文的相關(guān)設(shè)置進(jìn)行實(shí)驗(yàn),并展示其最佳性能。

6)HAN:一種同時(shí)采用節(jié)點(diǎn)級(jí)注意力機(jī)制和語(yǔ)義級(jí)注意力機(jī)制的半監(jiān)督式異質(zhì)圖神經(jīng)網(wǎng)絡(luò)。本文使用原論文中手工指定的元路徑進(jìn)行實(shí)驗(yàn),并展示其最佳性能。

7)GTN:一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的能自動(dòng)學(xué)習(xí)元路徑的半監(jiān)督式圖神經(jīng)網(wǎng)絡(luò)。本文保留原論文的設(shè)置,并展示其最佳性能。

8)HGSL:一種聯(lián)合圖結(jié)構(gòu)學(xué)習(xí)和圖神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的異質(zhì)圖模型。本文使用原論文中對(duì)數(shù)據(jù)集的處理方法,并展示其最佳性能。

4.3 實(shí)驗(yàn)設(shè)置

為了公平比較,本文將上述所有基線方法的參數(shù)設(shè)置為原論文中的最佳參數(shù),并使用Adam 優(yōu)化器分別選擇超參數(shù),以使每個(gè)基線方法都能發(fā)揮最佳性能。對(duì)于基于隨機(jī)游走的方法,在1 000 次迭代中,每個(gè)節(jié)點(diǎn)的行走長(zhǎng)度設(shè)為100,窗口大小設(shè)為5,有7 個(gè)負(fù)樣本。對(duì)于GCN、GAT、HAN 和GTN,使用驗(yàn)證集優(yōu)化它們的參數(shù)。對(duì)于本文的HIN-HG 模型,設(shè)置迭代次數(shù)為40次,通道數(shù)為2個(gè),學(xué)習(xí)率為0.005,權(quán)值衰減率為0.001。對(duì)于DBLP 數(shù)據(jù)集,將維度設(shè)置為512,元路徑的最大長(zhǎng)度設(shè)置為3。對(duì)于ACM 數(shù)據(jù)集和IMDB 數(shù)據(jù)集,將維度設(shè)置為128,元路徑的最大長(zhǎng)度設(shè)置為3。

4.4 分類(lèi)任務(wù)

實(shí)驗(yàn)使用PyTorch 訓(xùn)練一個(gè)淺層神經(jīng)網(wǎng)絡(luò)作為分類(lèi)器。由于是多分類(lèi)問(wèn)題,因此本文采用Macro-F1和Micro-F1 指標(biāo)來(lái)全面地評(píng)價(jià)模型的性能。表3 展示了HIN-HG 與其他節(jié)點(diǎn)分類(lèi)基線方法在DBLP、ACM 和IMDB 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,最優(yōu)和次優(yōu)結(jié)果分別使用粗體和下劃線標(biāo)出,可見(jiàn)HIN-HG 基于2 個(gè)多分類(lèi)指標(biāo)在所有數(shù)據(jù)集上都取得了最好的性能,相比于次優(yōu)算法整體性能提升了1.2%以上?;趫D神經(jīng)網(wǎng)絡(luò)的方法性能往往優(yōu)于基于隨機(jī)游走的方法,這是因?yàn)闇\層模型通常只考慮異質(zhì)信息網(wǎng)絡(luò)的結(jié)構(gòu)信息,而圖神經(jīng)網(wǎng)絡(luò)可以既考慮結(jié)構(gòu)信息,又考慮內(nèi)容信息,而且深度模型往往能更好地捕捉網(wǎng)絡(luò)中的高度非線性關(guān)系。

表3 節(jié)點(diǎn)分類(lèi)實(shí)驗(yàn)結(jié)果Table 3 Results of node classification experiment %

GAT 的性能優(yōu)于GCN,因?yàn)镚CN 聚合鄰居節(jié)點(diǎn)信息時(shí)沒(méi)有考慮鄰居重要性,而GAT 可以給鄰居節(jié)點(diǎn)分配不同的權(quán)重來(lái)反映不同的重要性。雖然HAN 使用了一種基于異質(zhì)信息網(wǎng)絡(luò)的雙層注意力機(jī)制,但實(shí)驗(yàn)結(jié)果表明GAT 在DBLP 和ACM 數(shù)據(jù)集上的性能更好,這可能是因?yàn)镠AN 使用手動(dòng)設(shè)定的元路徑會(huì)影響模型的性能。HGSL 的性能僅次于HIN-HG,體現(xiàn)了學(xué)習(xí)新的圖結(jié)構(gòu)的優(yōu)勢(shì),但是HGSL 使用矩陣乘法進(jìn)行信息傳播與擴(kuò)散的范圍較小,無(wú)法精準(zhǔn)捕獲到距離目標(biāo)節(jié)點(diǎn)較遠(yuǎn)的高階鄰居信息。

與以上方法相比,HIN-HG 無(wú)須手工設(shè)定元路徑,可以獨(dú)立學(xué)習(xí)不同類(lèi)型和長(zhǎng)度的元路徑的權(quán)重,自動(dòng)精確地捕獲有影響力的鄰居節(jié)點(diǎn)(包括高階鄰居)。其中,語(yǔ)義圖的設(shè)計(jì)可以緩解高階鄰居對(duì)低階鄰居的依賴(lài)關(guān)系,為指定距離內(nèi)不同的鄰居節(jié)點(diǎn)學(xué)習(xí)更合理的權(quán)重,同時(shí)特征圖的引入可以找到與目標(biāo)節(jié)點(diǎn)距離較遠(yuǎn)但相似度較高的節(jié)點(diǎn),為目標(biāo)節(jié)點(diǎn)捕獲更深層次的鄰居,進(jìn)一步豐富圖的信息。最后,多通道機(jī)制可以適當(dāng)?shù)仄胶獗碚?,防止過(guò)擬合,提高模型的學(xué)習(xí)能力。實(shí)驗(yàn)結(jié)果證明了HIN-HG 在節(jié)點(diǎn)分類(lèi)任務(wù)中的準(zhǔn)確性和有效性,體現(xiàn)了其相比于其他基線模型的優(yōu)勢(shì)。

4.5 結(jié)果分析

為了進(jìn)一步研究HIN-HG 是否能夠精確地捕獲有影響力的鄰居節(jié)點(diǎn),本文研究了ACM 數(shù)據(jù)集上的節(jié)點(diǎn)圖和語(yǔ)義圖。圖2 展示了不同網(wǎng)絡(luò)層中節(jié)點(diǎn)圖的不同類(lèi)型邊的權(quán)重,其中:P、A、C 分別表示論文、作者和會(huì)議;PA、AP、PC、CP 和I 表示異質(zhì)圖的5 個(gè)質(zhì)子圖,如PA 表示所有論文節(jié)點(diǎn)到作者節(jié)點(diǎn)的子圖,I 表示節(jié)點(diǎn)的自連邊。對(duì)于論文來(lái)說(shuō),影響力最大的鄰居節(jié)點(diǎn)是作者。隨著路徑長(zhǎng)度的增加,會(huì)議對(duì)論文的影響逐漸增大,這是因?yàn)樵诜诸?lèi)任務(wù)中,會(huì)議這類(lèi)度數(shù)較高的中心節(jié)點(diǎn)往往具有更高的影響力。由圖2 可見(jiàn),節(jié)點(diǎn)圖可以自適應(yīng)地調(diào)整不同類(lèi)型邊的權(quán)重,得到不同類(lèi)型的一階鄰居節(jié)點(diǎn)的重要性。由于語(yǔ)義圖由多個(gè)節(jié)點(diǎn)圖經(jīng)過(guò)計(jì)算和聚合得到,節(jié)點(diǎn)圖中權(quán)重的動(dòng)態(tài)變化決定了語(yǔ)義圖中不同元路徑的權(quán)重,能夠確定不同元路徑的重要性。圖3展示了語(yǔ)義圖中不同元路徑的權(quán)重。在作者和論文的連接中,它們可能通過(guò)元路徑A →P 或A →P →C →P 連接,也可能兩者均連接。在語(yǔ)義圖中,通過(guò)不同元路徑與目標(biāo)節(jié)點(diǎn)相連接的鄰居節(jié)點(diǎn)權(quán)重往往不同,這體現(xiàn)了不同鄰居節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的影響力不同,而同時(shí)通過(guò)多個(gè)元路徑連接的鄰居節(jié)點(diǎn)權(quán)重往往更大,對(duì)目標(biāo)節(jié)點(diǎn)的影響力也更大。結(jié)果表明,語(yǔ)義圖可以為不同的鄰居節(jié)點(diǎn)分配不同的權(quán)重,從而精確地捕獲特定距離內(nèi)有影響力的鄰居節(jié)點(diǎn)。

圖2 節(jié)點(diǎn)圖中不同類(lèi)型邊的權(quán)重Fig.2 The weights of different types of edges in node graph

圖3 語(yǔ)義圖中不同元路徑的權(quán)重Fig.3 The weights of different meta-paths in semantic graph

通常,與目標(biāo)節(jié)點(diǎn)特征和結(jié)構(gòu)相似的節(jié)點(diǎn)可以為目標(biāo)節(jié)點(diǎn)提供豐富的信息,但可能因?yàn)榫嚯x較遠(yuǎn)而無(wú)法考慮。特征圖可以為該類(lèi)節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)建立聯(lián)系,并通過(guò)計(jì)算兩者間的相似性得到其對(duì)目標(biāo)節(jié)點(diǎn)的影響力,從而彌補(bǔ)語(yǔ)義圖只能捕獲特定距離內(nèi)鄰居節(jié)點(diǎn)信息的不足。通過(guò)加權(quán)聚合語(yǔ)義圖和特征圖的超鄰接圖中既包含特定距離L以?xún)?nèi)所有有影響力的鄰居節(jié)點(diǎn),又包含距離更遠(yuǎn)但特征相似的鄰居節(jié)點(diǎn)。由此,超鄰接圖為目標(biāo)節(jié)點(diǎn)精確地捕獲了全異質(zhì)圖范圍內(nèi)所有有影響力的鄰居節(jié)點(diǎn)。

4.6 消融實(shí)驗(yàn)

本節(jié)評(píng)估了HIN-HG 的以下3 種變體的性能:1)HIN-HG-hyper:該變體不使用超鄰接圖而僅使用節(jié)點(diǎn)圖。

2)HIN-HG-feature:該變體不使用特征圖而僅使用語(yǔ)義圖。

3)HIN-HG-multi:該變體不使用多通道機(jī)制。

表4 展示了3 個(gè)變體和完整的HIN-HG 在ACM數(shù)據(jù)集上運(yùn)行的結(jié)果,其中加粗表示最優(yōu)值。結(jié)果表明,完整的HIN-HG 模型的性能最好,HIN-HG-hyper性能下降最多,這是因?yàn)槌徑訄D為目標(biāo)節(jié)點(diǎn)捕獲了異質(zhì)圖中所有具有影響力的鄰居節(jié)點(diǎn),將其替換為簡(jiǎn)單的鄰接矩陣后無(wú)法有效捕獲異質(zhì)圖中的結(jié)構(gòu)和語(yǔ)義關(guān)系,這也說(shuō)明了超鄰接圖在圖卷積神經(jīng)網(wǎng)絡(luò)中的巨大貢獻(xiàn)。在消融實(shí)驗(yàn)中,缺少特征圖會(huì)使模型無(wú)法捕獲與目標(biāo)節(jié)點(diǎn)距離較遠(yuǎn)但相似度較高的節(jié)點(diǎn),從而造成部分信息的缺失,導(dǎo)致HIN-HG-feature的性能下降。HIN-HG-multi和HIN-HG 的比較結(jié)果證明了多通道機(jī)制在GCN 中的積極作用。多通道機(jī)制可以學(xué)習(xí)多個(gè)超鄰接圖,提高模型的泛化能力,避免單一圖結(jié)構(gòu)中存在的噪音引起誤差,同時(shí)防止過(guò)擬合現(xiàn)象。實(shí)驗(yàn)結(jié)果充分證明了采用多通道機(jī)制的GCN 能夠有效聚合有影響力的鄰居來(lái)更新目標(biāo)節(jié)點(diǎn)的表征。

表4 消融實(shí)驗(yàn)結(jié)果Table 4 Results of ablation experiment %

4.7 參數(shù)實(shí)驗(yàn)

本節(jié)研究主要參數(shù)即迭代次數(shù)、表征維度、路徑長(zhǎng)度和通道數(shù)的敏感性,并將各種參數(shù)在ACM 數(shù)據(jù)集上的分類(lèi)結(jié)果展示在圖4中。

圖4 參數(shù)敏感性實(shí)驗(yàn)結(jié)果Fig.4 Results of parameter sensitivity experiment

1)評(píng)估迭代次數(shù)的影響。由圖4(a)可見(jiàn),隨著迭代次數(shù)的增加,整體性能呈先上升后下降的趨勢(shì)。當(dāng)?shù)螖?shù)為40 次左右時(shí),性能達(dá)到最佳,這表明HIN-HG 具有較快的收斂速度和較高的效率。性能下降的原因是出現(xiàn)了過(guò)擬合現(xiàn)象。

2)評(píng)估表征維度的影響。由圖4(b)可見(jiàn),隨著表征維度的增加,性能先上升再下降。這是因?yàn)镠IN-HG 需要一個(gè)合適的維度來(lái)編碼信息,較小的維度無(wú)法捕獲完整的信息,而較大的維度可能會(huì)引入額外的冗余信息。

3)評(píng)估語(yǔ)義圖中指定路徑長(zhǎng)度L的影響。由圖4(c)可見(jiàn),HIN-HG 的性能先是隨著路徑長(zhǎng)度的增長(zhǎng)而提高,這是因?yàn)檎Z(yǔ)義圖獨(dú)立學(xué)習(xí)不同元路徑的重要性,充分考慮了高階鄰居的影響。然而,隨著路徑長(zhǎng)度的不斷增長(zhǎng),HIN-HG 的性能開(kāi)始逐漸下降,這是因?yàn)榫嚯x較遠(yuǎn)的鄰居可能帶來(lái)噪聲,對(duì)節(jié)點(diǎn)表征產(chǎn)生負(fù)面影響。

4)為檢驗(yàn)多通道機(jī)制的影響,評(píng)估HIN-HG 在不同通道數(shù)下的性能。在圖4(d)中,當(dāng)通道數(shù)設(shè)置為1 個(gè)時(shí),多通道機(jī)制即被移除??梢园l(fā)現(xiàn)HIN-HG在通道數(shù)為2 個(gè)時(shí)就達(dá)到了最佳性能,過(guò)多的通道可能會(huì)降低性能并大幅增加計(jì)算成本。

5 結(jié)束語(yǔ)

本文嘗試解決異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)的2 個(gè)基本問(wèn)題:如何找到有影響力的鄰居和如何聚合鄰居信息,提出一種基于超鄰接圖的異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)方法。所提出的HIN-HG 模型可以在不從領(lǐng)域知識(shí)中預(yù)先定義元路徑的情況下捕獲異質(zhì)圖的復(fù)雜結(jié)構(gòu)和豐富語(yǔ)義。該模型利用超鄰接圖捕獲不同距離的對(duì)目標(biāo)節(jié)點(diǎn)有影響力的鄰居節(jié)點(diǎn),并利用帶有多通道機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)對(duì)鄰居節(jié)點(diǎn)進(jìn)行有效聚合。HIN-HG 在3 個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行節(jié)點(diǎn)分類(lèi)任務(wù),表現(xiàn)優(yōu)于對(duì)比的基準(zhǔn)模型,證明了它的有效性。消融實(shí)驗(yàn)和參數(shù)敏感性實(shí)驗(yàn)證明了本文方法具有良好的可解釋性。目前大多數(shù)關(guān)于異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)的研究?jī)H使用了靜態(tài)的結(jié)構(gòu)和內(nèi)容信息,沒(méi)有考慮到時(shí)間、地域等交互信息。下一步將在異質(zhì)信息網(wǎng)絡(luò)中引入時(shí)間信息,通過(guò)捕獲網(wǎng)絡(luò)的動(dòng)態(tài)性進(jìn)行表征學(xué)習(xí)和特定任務(wù)的學(xué)習(xí)。

猜你喜歡
異質(zhì)信息網(wǎng)絡(luò)語(yǔ)義
語(yǔ)言與語(yǔ)義
幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪的教義學(xué)展開(kāi)
刑法論叢(2018年2期)2018-10-10 03:32:22
非法利用信息網(wǎng)絡(luò)罪的適用邊界
法律方法(2018年3期)2018-10-10 03:21:34
網(wǎng)絡(luò)共享背景下信息網(wǎng)絡(luò)傳播權(quán)的保護(hù)
幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪若干問(wèn)題探究
“上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
隨機(jī)與異質(zhì)網(wǎng)絡(luò)共存的SIS傳染病模型的定性分析
Ag2CO3/Ag2O異質(zhì)p-n結(jié)光催化劑的制備及其可見(jiàn)光光催化性能
MoS2/ZnO異質(zhì)結(jié)的光電特性
認(rèn)知范疇模糊與語(yǔ)義模糊
英德市| 瑞金市| 阳朔县| 广东省| 定襄县| 资中县| 磴口县| 湘潭县| 固阳县| 凤冈县| 寻乌县| 武隆县| 伊通| 东光县| 南京市| 广东省| 清河县| 鄂温| 阿勒泰市| 大同市| 黄冈市| 昌乐县| 马鞍山市| 砀山县| 曲水县| 确山县| 博野县| 雷州市| 翁牛特旗| 华阴市| 郎溪县| 红原县| 濉溪县| 定边县| 嘉荫县| 娄底市| 合作市| 景泰县| 盐池县| 彭山县| 绵竹市|