国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向多屬性推薦系統(tǒng)的對(duì)抗深度分解模型

2021-06-03 06:41:12李宗陽沈志宏
關(guān)鍵詞:張量因子用戶

李宗陽,吉 源,沈志宏

(1.中國科學(xué)院 計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190;2.悉尼大學(xué),悉尼 NSW2000)

0 引 言

推薦系統(tǒng)在各種在線電子商務(wù)網(wǎng)站和旅游門戶網(wǎng)站中備受重視。傳統(tǒng)的推薦系統(tǒng)通常對(duì)二維用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)進(jìn)行操作,試圖預(yù)測用戶對(duì)特定項(xiàng)目(如產(chǎn)品)的偏好或評(píng)分。

近年來,除了用戶項(xiàng)目評(píng)分外,各大網(wǎng)站平臺(tái)還收集了各種有價(jià)值的信息。特別是,不同結(jié)構(gòu)的信息,如購買意圖、時(shí)間、地點(diǎn)、同伴和活動(dòng)內(nèi)容,都可被用來提高推薦性能[1-9]。在線網(wǎng)站中的非結(jié)構(gòu)化文本評(píng)論通常包含用戶對(duì)產(chǎn)品或服務(wù)的意見、態(tài)度和偏好,并在各種個(gè)性化推薦中與用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)一起被利用[10-14]。

相比之下,在這項(xiàng)工作中,除了考慮用戶對(duì)項(xiàng)目的總體評(píng)分?jǐn)?shù)據(jù)外,還考慮了多個(gè)屬性的用戶對(duì)項(xiàng)目的評(píng)分來解決推薦問題。在許多的電子商務(wù)網(wǎng)站上,除了總體評(píng)分外,在線用戶通常還可以根據(jù)產(chǎn)品或服務(wù)的多個(gè)給定屬性或方面對(duì)其滿意度進(jìn)行評(píng)分。

基于多個(gè)用戶在各種不同屬性上的項(xiàng)目評(píng)分以提供建議的系統(tǒng),通常被稱為多屬性推薦系統(tǒng)(multi-criteria recommender system,M-CRS)。在過去的幾年里,研究者們在處理多屬性推薦系統(tǒng)方面做出了很大的努力?,F(xiàn)有的方法大致可以分為三類,分別是基于啟發(fā)式鄰域的方法、基于聚合的方法和基于模型的方法。基于鄰域的啟發(fā)式方法首先通過使用各種多屬性相似性度量并基于用戶鄰域的已知評(píng)分來預(yù)測用戶的未知評(píng)分,從而為目標(biāo)用戶找到一個(gè)鄰域列表[15-19]。盡管推薦結(jié)果是可以解釋的,但是基于鄰域的方法往往受到原始評(píng)分?jǐn)?shù)據(jù)稀疏的影響,并且在處理大型數(shù)據(jù)集時(shí)可能無法擴(kuò)展。假設(shè)總體項(xiàng)目評(píng)分和個(gè)別屬性特定評(píng)分之間存在某種關(guān)系,基于聚合的方法嘗試在它們之間構(gòu)建聚合函數(shù),然后應(yīng)用該函數(shù)聚合多個(gè)屬性特定評(píng)分以進(jìn)行預(yù)測[17,20-24]。相比之下,基于模型的方法主要用于利用觀察到的多屬性評(píng)分?jǐn)?shù)據(jù)開發(fā)預(yù)測模型,然后使用該模型預(yù)測用戶對(duì)未知項(xiàng)目的評(píng)分[25-31]。不同的推薦方法對(duì)實(shí)際的推薦問題具有很強(qiáng)的魯棒性,因此該文采用了基于學(xué)習(xí)模型的方法來解決多屬性推薦問題。

張量分解在多屬性推薦系統(tǒng)中得到廣泛應(yīng)用。張量是矩陣的多維擴(kuò)展,是用于建模多面數(shù)據(jù)的應(yīng)用程序中非常強(qiáng)大的工具。張量分解是基于模型的技術(shù)的里程碑。已針對(duì)多屬性推薦系統(tǒng)開發(fā)了各種張量分解技術(shù)[32-33]。但是,所有用于多屬性建議的現(xiàn)有技術(shù)都存在數(shù)據(jù)稀疏和污染的問題。換句話說,由于評(píng)分張量非常稀疏,并且在實(shí)際應(yīng)用程序中包含惡意用戶的虛假信息,因此產(chǎn)生的潛在因素仍然不足以實(shí)現(xiàn)令人滿意的性能。

為了克服多屬性推薦器系統(tǒng)中的數(shù)據(jù)稀疏和污染問題,該文嘗試將輔助信息合并到評(píng)級(jí)張量中,以利用先驗(yàn)特征,并使用對(duì)抗性學(xué)習(xí)來防御來自假信息的攻擊。 通常,輔助信息在傳統(tǒng)的單屬性推薦也稱為邊信息(side information)[10-14]。

但是,如何將輔助信息有效地整合到評(píng)分張量中,以及如何利用對(duì)抗性學(xué)習(xí)來增強(qiáng)模型的魯棒性在該方案下仍是挑戰(zhàn)。

為了克服這兩個(gè)挑戰(zhàn),該文通過集成深度表示學(xué)習(xí)和張量因子分解提出了對(duì)抗性深度張量因子分解(ADTF)的方案,其中嵌入了輔助信息以有效補(bǔ)償張量稀疏性,而對(duì)抗性學(xué)習(xí)則用于增強(qiáng)模型穩(wěn)健性。

通過結(jié)合對(duì)抗性堆疊降噪自動(dòng)編碼器(adversarial stacked denoising autoencoder,ASDAE)和CANDECOMP / PARAFAC(CP)張量因子分解,展示了ADTF方案下的實(shí)例,其中用戶和項(xiàng)目的輔助信息與稀疏的多屬性評(píng)分和潛在因子在聯(lián)合優(yōu)化學(xué)習(xí)下緊密相關(guān)。一方面通過堆疊降噪自動(dòng)編碼器(stacked denoising autoencoder,SDAE)對(duì)用戶和商品的邊信息進(jìn)行編碼,以分別補(bǔ)償用戶和商品的塔克分解潛在因素。并使用梯度方法更新了三個(gè)潛在因子矩陣。另一方面,對(duì)抗訓(xùn)練用于學(xué)習(xí)中間層的有效潛在因素,而不是放在SDAE的外部輸入上。

該文的貢獻(xiàn)可總結(jié)如下:為了解決多屬性建議中的數(shù)據(jù)稀疏和污染問題,提出了一種將深度結(jié)構(gòu)和張量因子分解相集成的通用架構(gòu),嵌入了輔助信息以有效補(bǔ)償張量稀疏性,并且采用了對(duì)抗性學(xué)習(xí)以增強(qiáng)模型的魯棒性;基于通用體系結(jié)構(gòu)提出一種特定的ADTF方案,其中CP張量分解和兩個(gè)針對(duì)用戶和項(xiàng)目的ASDAE結(jié)合在一起,以改進(jìn)基于張量分解的建議;在三個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,在多屬性推薦方面,提出的ADTF優(yōu)于最新方法。

1 相關(guān)工作

1.1 多屬性推薦系統(tǒng)

在推薦系統(tǒng)中已廣泛使用多屬性評(píng)分,現(xiàn)有的技術(shù)可以簡單地分為三類,包括基于啟發(fā)式鄰域的方法、基于聚合的方法和基于模型的方法?;趩l(fā)式鄰域的方法嘗試使用各種多屬性相似性度量來收集目標(biāo)用戶的鄰居,然后基于這些鄰居的已知評(píng)分估計(jì)未知評(píng)分[15]。Lakiotaki等人[16]使用多維距離度量計(jì)算成對(duì)用戶之間的距離,然后采用多屬性協(xié)同過濾方法確定每個(gè)用戶最喜歡的項(xiàng)目。Liu等人[17]提出了一種基于用戶偏好的偏好格來預(yù)測未知項(xiàng)的評(píng)分。Mikeli等人[18]利用多屬性歐氏距離估計(jì)每對(duì)用戶之間的總距離,并利用協(xié)同過濾技術(shù)解決推薦問題。Sreepada等人[19]提出了一種新的技術(shù)來學(xué)習(xí)每個(gè)用戶偏好的屬性以及使每個(gè)項(xiàng)目流行的屬性。此學(xué)習(xí)有助于找到相似的用戶/項(xiàng)目組,以便向用戶推薦適當(dāng)?shù)捻?xiàng)目。盡管推薦結(jié)果通常是可以解釋的,但是基于鄰域的方法往往受到原始評(píng)分?jǐn)?shù)據(jù)的稀疏性的影響,并且在處理大型數(shù)據(jù)集時(shí)可能無法擴(kuò)展。

假設(shè)總體用戶評(píng)價(jià)與單項(xiàng)目屬性評(píng)價(jià)之間存在一定的關(guān)系,基于聚合的方法主要是建立映射函數(shù)來聚合多個(gè)特定屬性的評(píng)價(jià)進(jìn)行預(yù)測。Lakiotaki等人[20]提出了一種效用加性方法,在給定的推薦屬性下對(duì)邊際用戶的偏好進(jìn)行綜合。Jannach等人[21]提出使用支持向量回歸來學(xué)習(xí)個(gè)別屬性特定評(píng)分的相對(duì)重要性,然后使用加權(quán)方法將基于用戶和項(xiàng)目的回歸模型結(jié)合起來預(yù)測未知評(píng)分。Zheng[22]提出應(yīng)考慮多個(gè)屬性之間的依賴性,提出了一種基于屬性鏈的多維度評(píng)分匯總推薦方法。Hamada等人[23]提出了一種基于聚合函數(shù)的方法,利用自適應(yīng)遺傳算法有效地融合了多屬性推薦系統(tǒng)的屬性評(píng)分,提高了多屬性推薦系統(tǒng)的準(zhǔn)確性。

另一方面,基于模型的方法旨在利用觀察到的多屬性評(píng)分?jǐn)?shù)據(jù)學(xué)習(xí)預(yù)測模型,然后利用該模型估計(jì)用戶對(duì)未知項(xiàng)目的評(píng)分[24]。Sahoo等人[25]提出了一種基于概率混合模型的算法,利用多屬性評(píng)分依賴結(jié)構(gòu)改進(jìn)推薦。Nilashi等人[26]提出了一種基于自適應(yīng)神經(jīng)模糊推理和自組織地圖聚類模型的推薦方法。Hamada等人[27]為提高推薦系統(tǒng)的預(yù)測精度,提出了一種基于模糊集和系統(tǒng)的結(jié)構(gòu)和主要特征的推薦模型。Li等人[28]利用多線性奇異值分解技術(shù),研究推薦任務(wù)的用戶、項(xiàng)目和屬性之間的顯式和隱式關(guān)系。Hassan等人[29]提出了一種使用模擬退火算法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型,以提高多屬性推薦系統(tǒng)的預(yù)測精度。Tallapally等人[30]提出了一種擴(kuò)展的疊層自動(dòng)編碼器來有效地學(xué)習(xí)每個(gè)用戶的屬性和總體評(píng)分之間的關(guān)系。

與上述工作不同的是,該文考慮了多屬性推薦中的數(shù)據(jù)污染問題,并通過對(duì)抗訓(xùn)練和引入額外信息,來提高推薦系統(tǒng)的魯棒性。

1.2 推薦系統(tǒng)中的對(duì)抗訓(xùn)練

推薦系統(tǒng)容易受到惡意用戶的攻擊,這些惡意用戶會(huì)制作一些虛假信息進(jìn)行數(shù)據(jù)污染,從而使得推薦模型的推薦結(jié)果偏離原始數(shù)據(jù)分布,從而導(dǎo)致推薦中的錯(cuò)誤[34]。

最近,對(duì)抗性機(jī)器學(xué)習(xí)技術(shù)在各種任務(wù)(例如圖像字幕,序列生成,圖像到圖像翻譯,神經(jīng)機(jī)器翻譯和信息檢索)上顯示出了出色的性能。

盡管展示了巨大的潛力,但在推薦系統(tǒng)中應(yīng)用對(duì)抗性機(jī)器學(xué)習(xí)技術(shù)的工作很少[35-36]。Wang等人[35]提出了一種minimax對(duì)抗游戲,以減少傳統(tǒng)訓(xùn)練模型對(duì)對(duì)抗示例的敏感性,這成為了三種不同任務(wù)的最新方法,包括網(wǎng)絡(luò)搜索、問題解答和項(xiàng)目推薦。He等人[36]通過選擇具有成對(duì)損失函數(shù)的模型,將對(duì)抗性噪聲引入訓(xùn)練過程來改進(jìn)信息檢索GAN(IRGAN)。

與先前的工作不同,該文進(jìn)一步利用了將邊信息納入CP分解中的優(yōu)勢,以解決多屬性建議中的數(shù)據(jù)稀疏問題,在多屬性推薦系統(tǒng)中,通過對(duì)抗性訓(xùn)練來解決數(shù)據(jù)污染問題。

2 問題描述

先前的研究表明,矩陣分解及其變體是現(xiàn)代推薦系統(tǒng)中使用的主要技術(shù)[32-33]。在這一節(jié)中,將介紹矩陣分解技術(shù)的一些初步內(nèi)容,并在表1中給出一些相關(guān)的符號(hào)。

表1 符號(hào)定義

在推薦系統(tǒng)中,矩陣分解模型常被用于處理用戶和項(xiàng)目之間的二維偏好關(guān)系,其中矩陣允許每個(gè)用戶在[1-5]的5分評(píng)分表上任意對(duì)給定項(xiàng)目進(jìn)行評(píng)分。

然后,基于已知的評(píng)分?jǐn)?shù)據(jù),將用戶和項(xiàng)目投影到一個(gè)聯(lián)合的潛在因子空間,使得用戶項(xiàng)目偏好可以建模為該空間中潛在因子的內(nèi)積。形式上,設(shè)um從用戶m的矩陣因式分解模型導(dǎo)出的潛在因子表示,in為項(xiàng)目n的潛在表示。然后,可由此估計(jì)項(xiàng)目i的用戶m的偏好評(píng)分rmn。

(1)

顯然,推薦系統(tǒng)的關(guān)鍵挑戰(zhàn)是如何在聯(lián)合潛在因素空間中導(dǎo)出用戶和項(xiàng)目的表示。為了實(shí)現(xiàn)這一點(diǎn),使用等式(2)將觀察到的用戶項(xiàng)評(píng)分?jǐn)?shù)據(jù)集的正則化平方損失最小化。

α(‖um‖1+‖in‖1)

(2)

其中,O是指用戶項(xiàng)對(duì)的集合(m,n),其值rmn是已知的。第一項(xiàng)是預(yù)測誤差的平方,第二項(xiàng)和第三項(xiàng)分布是L2范數(shù),L1范數(shù)正則化,控制了模型復(fù)雜度,其中α和β是超參數(shù)。

公式(2)中的優(yōu)化問題可以用經(jīng)典的隨機(jī)梯度下降法來解決,該方法迭代更新用戶和項(xiàng)目的潛在因素向量[37]。一旦優(yōu)化過程完成,公式(1)便可用于直接預(yù)測給定用戶對(duì)未知項(xiàng)的評(píng)分。

通常,多屬性推薦系統(tǒng)(MCRSs)是指除了支持推薦的總體用戶項(xiàng)目評(píng)分之外,還利用各種不同屬性的用戶項(xiàng)目評(píng)分的系統(tǒng)。如文獻(xiàn)[15]所述,MCR的公式如下:

U×V×C→R0×R1×…×RL-1

(3)

其中,左側(cè)的U、V和C分別是用戶、項(xiàng)目和屬性的集合,而右側(cè)的R0表示用戶對(duì)項(xiàng)的總體評(píng)分,R1,…,RL-1表示用戶對(duì)單個(gè)屬性的評(píng)分(L為屬性數(shù))。在公式中,總體評(píng)分信息被視為一種特殊類型的屬性評(píng)分。

給定觀察到的用戶項(xiàng)目屬性評(píng)分?jǐn)?shù)據(jù),首先通過擬合觀察到的數(shù)據(jù)建立多屬性預(yù)測模型,然后應(yīng)用該模型預(yù)測用戶對(duì)未知項(xiàng)的總體評(píng)分和多屬性特定評(píng)分。

自然地,引入一個(gè)三階張量(矩陣的推廣)來表示三維用戶項(xiàng)目屬性評(píng)分?jǐn)?shù)據(jù)。

3 面向多屬性推薦系統(tǒng)的對(duì)抗深度張量網(wǎng)絡(luò)

基于張量分解的方法已廣泛應(yīng)用于多屬性推薦系統(tǒng)[15-19]。但是,它們遭受數(shù)據(jù)稀疏和污染的困擾。事實(shí)證明,深度學(xué)習(xí)模型可以有效地從原始數(shù)據(jù)中發(fā)現(xiàn)各種任務(wù)的潛在表示[29-37]。對(duì)抗訓(xùn)練方法通過動(dòng)態(tài)生成對(duì)抗示例來增強(qiáng)訓(xùn)練過程。為了改善基于張量分解的建議,利用深度學(xué)習(xí)和對(duì)抗訓(xùn)練有效地合并了輔助信息,從而使所得模型克服了上述缺點(diǎn)。

3.1 通用架構(gòu)

該文提出的ADTF嘗試將深度結(jié)構(gòu)與張量分解結(jié)合起來,其中深度結(jié)構(gòu)處理附帶信息,而張量分解處理3D 用戶項(xiàng)目屬性評(píng)分?jǐn)?shù)據(jù)。

為用戶構(gòu)建深層結(jié)構(gòu),其中分別將用戶的真實(shí)和虛假輔助信息作為輸入。通過聯(lián)合優(yōu)化網(wǎng)絡(luò)和張量因子分解潛在用戶的因子,學(xué)習(xí)到有效的用戶潛在表示。

類似地,對(duì)物品構(gòu)建同樣的深層結(jié)構(gòu),其中將物品的真實(shí)和虛假輔助信息作為輸入。通過聯(lián)合優(yōu)化深度網(wǎng)絡(luò)和張量因子分解項(xiàng)目的潛在因子,可以學(xué)習(xí)項(xiàng)目的有效潛在表示。

輔助信息參與學(xué)習(xí)有效的潛在表示,這為張量分解提供了有效的知識(shí)遷移,而對(duì)抗訓(xùn)練則防御了來自虛假信息的攻擊,因此所提出的對(duì)抗深度張量網(wǎng)絡(luò)的通用架構(gòu)可以緩解稀疏張量和數(shù)據(jù)污染問題。在通用架構(gòu)的基礎(chǔ)上,通過集成ASDAE和CP張量分解來提出特定的實(shí)例。

3.2 面向多屬性推薦系統(tǒng)的對(duì)抗深度張量網(wǎng)絡(luò)ADTF實(shí)例

基于上面提到的通用體系結(jié)構(gòu),特定的ADTF方案由三個(gè)組件組成:用戶的ASDAE、項(xiàng)目的ASDAE和張量分解。如圖1所示,在ADTF中,單個(gè)ASDAE會(huì)將真實(shí)和偽造的輔助信息都作為輸入,而通過判別器進(jìn)行對(duì)抗訓(xùn)練,通過自編碼器進(jìn)行特征提取。

圖1 對(duì)抗深度張量網(wǎng)絡(luò)結(jié)構(gòu)

(4)

并獲得最終輸出層L(u)的輸出為:

(5)

ADTF通過以下目標(biāo)函數(shù)從評(píng)分張量和輔助信息中學(xué)習(xí)用戶的潛在因子、項(xiàng)目的潛在因子和屬性潛在因子。

(6)

其中,總損失函數(shù)J由五個(gè)部分組成:張量分解的損失函數(shù)Lt,輔助信息的重構(gòu)誤差函數(shù)Lr,深度表示和潛在因子之間的近似誤差函數(shù)La,對(duì)抗訓(xùn)練的重構(gòu)誤差函數(shù)Ld和防止過度擬合的正則化項(xiàng)freg之間的損失函數(shù)。

第一項(xiàng)Lt表示稀疏評(píng)級(jí)張量上的因式分解損失,其公式為:

(7)

其中,θt={U,V,C};二元張量I是稀疏性指標(biāo),其中每個(gè)元素指示是否觀察到了相應(yīng)的等級(jí);?表示潛在因子向量在上述相應(yīng)矩陣中的外積;⊙是按元素相乘。

第二項(xiàng)為輔助信息對(duì)于用戶和物品的重建成本,其公式為:

(8)

其中,θr={Wu,bu,Wv,bv},α和β是懲罰參數(shù)。

第三項(xiàng),用戶和項(xiàng)目的深度表示和潛在因子向量之間的近似誤差,公式為:

(9)

其中,θa={Wu,bu,Wv,bv,U,V},ρ和γ是懲罰參數(shù)。

對(duì)抗訓(xùn)練的損失函數(shù)公式表示為:

(10)

最后一項(xiàng)為正則化項(xiàng)freg,約束整個(gè)網(wǎng)絡(luò),其公式如下:

‖W(v)‖2+‖b(u)‖2+‖b(v)‖2

(11)

在公式(6)中,Θ=θt∪θr∪θa。

3.3 算法優(yōu)化過程

張量分解與神經(jīng)網(wǎng)絡(luò)的結(jié)合難以通過統(tǒng)一的神經(jīng)網(wǎng)絡(luò)參數(shù)回傳進(jìn)行更新,而為了同時(shí)取得張量分解的高效性和神經(jīng)網(wǎng)絡(luò)的有效性,通過分布迭代優(yōu)化而不是聯(lián)合優(yōu)化。

該文針對(duì)ADTF提出的分步迭代優(yōu)化,通過使用以下兩步過程來實(shí)現(xiàn)。

步驟I:給定所有神經(jīng)網(wǎng)絡(luò)的權(quán)重W與偏置b,u、v、c,對(duì)總損失函數(shù)J在公式中的梯度可以通過以下方式獲得:

(12)

其中,Iijl指示是否觀測到相應(yīng)的評(píng)分。計(jì)算得到梯度后,統(tǒng)一進(jìn)行梯度更新。

步驟II:固定潛在因子向量U、V和C,所有神經(jīng)網(wǎng)絡(luò)的權(quán)重W與偏置b可以通過SGD方法的反向傳播來訓(xùn)練兩個(gè)ASDAE:

(13)

(14)

(15)

循環(huán)迭代兩個(gè)步驟,直到收斂為止。

通常,兩個(gè)SDAE的中間層調(diào)節(jié)多屬性評(píng)分和邊緣信息的相互作用,以學(xué)習(xí)潛在因子。這兩個(gè)中間層是使ADTF能夠同時(shí)學(xué)習(xí)有效的潛在因素并捕獲用戶和項(xiàng)目之間的相似性和關(guān)系的關(guān)鍵。

4 實(shí) 驗(yàn)

4.1 實(shí)驗(yàn)設(shè)置

為了評(píng)估算法,該文使用了來自TripAdvisor、Yahoo!Movie和RateBeer的數(shù)據(jù)集,這三個(gè)數(shù)據(jù)集都被廣泛用于多屬性推薦系統(tǒng)的評(píng)估。在實(shí)驗(yàn)中,對(duì)每個(gè)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果進(jìn)行五次交叉驗(yàn)證,并采用平均絕對(duì)誤差(MAE)、命中率(HR)和歸一化折現(xiàn)累積增益(NDCG)來評(píng)估推薦性能:

(17)

MAE越低,推薦性能越好。

(18)

其中,Hits@K是推薦列表中顯示的目標(biāo)項(xiàng)目數(shù),GT是真實(shí)項(xiàng)目集。

(19)

其中,ZK確保排名結(jié)果的值范圍為[0,1],ri是位置i處項(xiàng)目的評(píng)分。HR和NDCG越高,推薦性能越好。

通過多屬性推薦實(shí)驗(yàn),對(duì)提出的方法ADTF進(jìn)行了驗(yàn)證。

4.2 實(shí)驗(yàn)對(duì)比方法

AFBM[9]:基于聚合函數(shù)的方法(aggregation function based method),使用矩陣分解將觀察到的用戶標(biāo)準(zhǔn)評(píng)級(jí)數(shù)據(jù)分解為因子,然后使用學(xué)習(xí)模型根據(jù)單個(gè)標(biāo)準(zhǔn)(不包括特殊總體標(biāo)準(zhǔn))估算用戶的評(píng)級(jí)。

CMF[10]:集合矩陣分解模型(collective matrix factorization),可聯(lián)合分解多個(gè)不同矩陣,包括用戶項(xiàng)目矩陣和包含附加邊信息的矩陣;

HCF[11]:混合協(xié)同過濾模型(hybrid collaborative filtering),融合了矩陣分解和aSDAE模型;

DCF[12]:深度協(xié)作過濾(deep collaborative filtering)是一種廣泛使用的深度學(xué)習(xí)推薦模型,結(jié)合了概率矩陣分解與降噪堆疊自動(dòng)編碼器來實(shí)現(xiàn)推薦效果;

t-SVD[24]:張量奇異值分解(tensor singular value decomposition)是將MF方法推廣到更高維度的張量分解模型;

DTF:將文中的ADTF去除對(duì)抗訓(xùn)練模塊,用于對(duì)比對(duì)抗訓(xùn)練模塊的效果;

ADTF:文中所提出的對(duì)抗性深度張量因子分解模型(adversarial deep tensor factorization,ADTF),在深度學(xué)習(xí)網(wǎng)絡(luò)中融合評(píng)分張量和輔助信息,并經(jīng)過對(duì)抗訓(xùn)練以增強(qiáng)模型魯棒性。

4.3 實(shí)驗(yàn)結(jié)果及分析

表2列出了評(píng)估方法的評(píng)分預(yù)測精度,其中每個(gè)數(shù)據(jù)集的最低MAE用黑體突出顯示。

表2 不同算法在數(shù)據(jù)集上的MAE性能

可以看出,ADTF在MAE方面明顯優(yōu)于目前的對(duì)比方法。表2的實(shí)驗(yàn)結(jié)果表明,提出的基于張量因子分解的多屬性評(píng)分信息聯(lián)合建模方法,能夠考慮用戶、項(xiàng)目和屬性維度之間的相關(guān)性,提高預(yù)測性能。相比之下,AFBM采用支持向量回歸的方法對(duì)屬性信息進(jìn)行聚合,只考慮了用戶與屬性、項(xiàng)目與屬性等三個(gè)維度中任意兩個(gè)維度之間的相關(guān)性。t-SVD和ADTF的效果說明張量因子分解非常適合MCRS,因?yàn)樗且环N很好的建模三維(即用戶、項(xiàng)和屬性)之間內(nèi)在交互的方法。

可以看出,在一般情況下,HCF,DCF和CMF優(yōu)于AFBM,而ADTF和DTF又優(yōu)于t-SVD,這表明在2D評(píng)分矩陣或3D評(píng)分張量中合并輔助信息的有效性。ADTF,DTF,HCF和DCF優(yōu)于CMF,表明深度結(jié)構(gòu)可以更好地獲取邊信息的特征。HCF,DCF,CMF和AFBM僅考慮三個(gè)維度中任意兩個(gè)維度之間的相關(guān)性,因此ADTF,DTF和t-SVD優(yōu)于這些方法。ADTF的性能優(yōu)于DCF,這表明張量分解方法可以有效地學(xué)習(xí)三個(gè)維度之間的內(nèi)在相互作用,這對(duì)于多準(zhǔn)則推薦系統(tǒng)是一個(gè)很好的選擇。ADTF的性能優(yōu)于DTF,這表明對(duì)抗訓(xùn)練可以有效提高深度學(xué)習(xí)網(wǎng)絡(luò)的魯棒性。

(a)HR@K (b)NDCG@K

(a)HR@K (b)NDCG@K

(a)HR@K (b)NDCG@K

為了進(jìn)一步評(píng)估Top-K項(xiàng)目推薦,圖2~圖4顯示了三個(gè)數(shù)據(jù)集上不同方法的性能,其中潛在因子數(shù)設(shè)置為10。

圖2~圖4中推薦列表K的長度不固定,而是通過考慮K取值2到10之間來評(píng)估方法在不同Top-K場景下的推薦效果。這里,選擇的K最大到10,是因?yàn)橛脩敉ǔ?huì)只關(guān)注一些最重要的建議,而實(shí)際應(yīng)用場景中,通常訪問頻率最高的也僅限于前十的推薦建議??梢杂^察到,隨著K的增加,由于目標(biāo)項(xiàng)目出現(xiàn)在Top-K列表中的可能性將會(huì)提高,因此得到的性能如預(yù)期一樣得到改善。在三個(gè)數(shù)據(jù)集、不同場景下的Top-K推薦中,ADTF都取得了最好的效果,證明了提出的方法的有效性和魯棒性。

5 結(jié)束語

該文提出對(duì)抗深度張量因子分解模型(ADTF)進(jìn)行推薦,將深度表示學(xué)習(xí)和張量因子分解相結(jié)合。ADTF可以從評(píng)分張量和輔助信息中學(xué)習(xí)有效的潛在因子。在實(shí)際數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,ADTF在評(píng)分預(yù)測任務(wù)和Top-K推薦任務(wù)上的表現(xiàn)優(yōu)于最新模型。未來的工作中,將考慮改進(jìn)輔助信息的合并方式和對(duì)抗性訓(xùn)練網(wǎng)絡(luò),以在多標(biāo)準(zhǔn)推薦系統(tǒng)中實(shí)現(xiàn)更好的性能。

猜你喜歡
張量因子用戶
因子von Neumann代數(shù)上的非線性ξ-Jordan*-三重可導(dǎo)映射
偶數(shù)階張量core逆的性質(zhì)和應(yīng)用
四元數(shù)張量方程A*NX=B 的通解
一些關(guān)于無窮多個(gè)素因子的問題
影響因子
影響因子
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
擴(kuò)散張量成像MRI 在CO中毒后遲發(fā)腦病中的應(yīng)用
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
郯城县| 皋兰县| 太原市| 乳山市| 汕头市| 大渡口区| 漳浦县| 台中市| 江陵县| 临洮县| 托克托县| 新疆| 和龙市| 古交市| 汉川市| 五指山市| 康平县| 萨迦县| 顺昌县| 登封市| 蒙阴县| 固镇县| 周口市| 闽清县| 栖霞市| 宁德市| 沿河| 临澧县| 太谷县| 哈密市| 平塘县| 呼伦贝尔市| 杭州市| 马山县| 阿坝| 平阳县| 沂南县| 鲁甸县| 云阳县| 娄底市| 寿光市|