馮 申,於躍成,張宗海
(江蘇科技大學(xué)計(jì)算機(jī)學(xué)院,江蘇 鎮(zhèn)江 212100)
近年來(lái),像Foursquare、Gowalla和Yelp這樣基于位置的社交網(wǎng)絡(luò)(Location Based Social Networks)已逐漸滲透到人們的日常生活中。數(shù)百萬(wàn)用戶在LBSNs上的簽到行為生成了大量的簽到數(shù)據(jù),這為挖掘用戶簽到行為的內(nèi)在模式提供了一個(gè)絕佳的機(jī)會(huì)[1]。用戶簽到興趣點(diǎn)(如餐館和博物館)并與朋友分享他們的位置和體驗(yàn)時(shí),簽到記錄中往往包含了被訪問(wèn)的興趣點(diǎn)及其用戶活動(dòng)的相關(guān)上下文信息,包括簽到時(shí)間、簽到點(diǎn)的地理位置、類別或評(píng)論等。這些用戶關(guān)于興趣點(diǎn)的簽到序列隱式地反映了用戶對(duì)興趣點(diǎn)的偏好和用戶的日?;顒?dòng)模式,從而為根據(jù)用戶的歷史簽到記錄開(kāi)展個(gè)性化的興趣點(diǎn)推薦提供方便[2]。
傳統(tǒng)的協(xié)同過(guò)濾方法首先從用戶的簽到歷史中挖掘相似用戶,然后根據(jù)相似用戶的簽到記錄來(lái)推薦興趣點(diǎn)[3]。矩陣分解方法是廣為使用的協(xié)同過(guò)濾方法之一,其基本思想是將用戶-項(xiàng)目矩陣分解成代表用戶和項(xiàng)目特征的2個(gè)潛在矩陣。然而,這些方法只能對(duì)用戶的靜態(tài)偏好進(jìn)行建模,無(wú)法捕捉用戶的動(dòng)態(tài)偏好[4]。
為了解決傳統(tǒng)的協(xié)同過(guò)濾方法只能對(duì)用戶的靜態(tài)偏好建模的問(wèn)題,研究者們提出使用深度學(xué)習(xí)模型來(lái)建模用戶的動(dòng)態(tài)偏好。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)中的一種變體長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)由于其結(jié)構(gòu)的特性能更好地學(xué)習(xí)用戶簽到序列之間的長(zhǎng)期依賴模式,被廣泛應(yīng)用于序列化數(shù)據(jù)建模??紤]到用戶興趣點(diǎn)簽到數(shù)據(jù)與時(shí)間之間存在的關(guān)聯(lián),Zhu等[5]提出了一種Time-LSTM模型,以利用時(shí)間門來(lái)描述用戶行為之間的時(shí)間間隔。事實(shí)上,興趣點(diǎn)的簽到數(shù)據(jù)除了包含時(shí)間信息外,其中包含的空間信息也是描述用戶偏好的關(guān)鍵因素。為此,Liu等[6]提出了一種時(shí)空遞歸神經(jīng)網(wǎng)絡(luò)模型(ST-RNN),通過(guò)設(shè)計(jì)特定時(shí)間轉(zhuǎn)換矩陣實(shí)現(xiàn)了RNN模型對(duì)周期性時(shí)間上下文信息的捕捉。同時(shí),該模型結(jié)合了特定距離的轉(zhuǎn)移矩陣來(lái)代替RNN的單一轉(zhuǎn)移矩陣,實(shí)現(xiàn)了簽到用戶地理屬性中動(dòng)態(tài)距離屬性的有效表示。然而,由于用戶簽到的數(shù)據(jù)稀疏性,ST-RNN模型并不能準(zhǔn)確刻畫相鄰簽到點(diǎn)的時(shí)間關(guān)系和空間關(guān)系。針對(duì)這個(gè)問(wèn)題,Kong等[7]提出的HST-LSTM模型將時(shí)空因素引入到LSTM的門機(jī)制中,有效緩解了數(shù)據(jù)稀疏問(wèn)題,并被應(yīng)用于一般興趣點(diǎn)的推薦。
下一個(gè)興趣點(diǎn)推薦主要關(guān)注用戶的長(zhǎng)期和短期偏好建模??紤]到用戶的短期偏好與最近簽到行為相關(guān),F(xiàn)eng等[8]通過(guò)對(duì)個(gè)性化的序列信息建模,并計(jì)算目標(biāo)興趣點(diǎn)與最近訪問(wèn)興趣點(diǎn)之間的距離來(lái)描述地理影響,進(jìn)而捕獲用戶短期的喜好。事實(shí)上,興趣點(diǎn)推薦不僅取決于用戶的短期偏好,還會(huì)受長(zhǎng)期偏好的影響。受這種想法的啟發(fā),F(xiàn)eng等[9]提出了一種DeepMove模型,通過(guò)在簽到歷史軌跡中使用注意力模塊來(lái)捕捉與當(dāng)前移動(dòng)狀態(tài)最相關(guān)的歷史軌跡,從而捕獲用戶的長(zhǎng)期偏好。此外,綜合考慮長(zhǎng)期偏好和短期偏好對(duì)用戶下一步行為的影響,Wu等[10]提出了一種長(zhǎng)短期偏好學(xué)習(xí)模型,利用注意力機(jī)制捕捉用戶對(duì)興趣點(diǎn)的關(guān)注度來(lái)捕捉用戶的長(zhǎng)期偏好;同時(shí),該模型結(jié)合短期模塊,利用LSTM來(lái)學(xué)習(xí)用戶最近的簽到行為。
Wu等[10]同時(shí)考慮了用戶的長(zhǎng)短期偏好,提高了用戶下一步簽到行為推薦的準(zhǔn)確度。然而,該模型沒(méi)有考慮興趣點(diǎn)評(píng)論文本信息對(duì)用戶接下來(lái)選擇的影響。事實(shí)上,用戶評(píng)論包含了用戶對(duì)興趣點(diǎn)的偏好信息,通過(guò)分析評(píng)論文本中隱含的情感傾向,可以更加準(zhǔn)確地捕捉用戶對(duì)興趣點(diǎn)的個(gè)性化偏好。為此,受上述研究啟發(fā),本文在考慮用戶長(zhǎng)短期偏好的基礎(chǔ)上,同時(shí)將用戶的評(píng)論信息融入到興趣點(diǎn)推薦模型中,提出一種結(jié)合多類信息的興趣點(diǎn)推薦模型,即DMGCR。在短期偏好方面,本文方法通過(guò)使用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(BiLSTM)提取學(xué)習(xí)用戶評(píng)論隱含的語(yǔ)義特征,以捕獲用戶對(duì)興趣點(diǎn)的情感傾向; 在長(zhǎng)期偏好方面,則利用注意力機(jī)制來(lái)捕獲用戶對(duì)不同興趣點(diǎn)的關(guān)注程度。最終,結(jié)合長(zhǎng)期偏好和短期偏好來(lái)學(xué)習(xí)不同用戶在不同部分上的關(guān)注權(quán)重,獲得下一個(gè)興趣點(diǎn)推薦的概率。
為了在興趣點(diǎn)推薦中實(shí)現(xiàn)更佳的推薦效果,提供更加符合用戶喜好的位置服務(wù),近年來(lái)越來(lái)越多的研究開(kāi)始挖掘評(píng)論文本隱含的信息來(lái)捕獲用戶偏好。Zhu等[11]提出了一個(gè)位置感知的LDA模型來(lái)挖掘用戶的潛在偏好主題分布,并進(jìn)一步推斷用戶可能想去的興趣點(diǎn)。Ren等[12]利用與興趣點(diǎn)相關(guān)的文本評(píng)論配置用戶與POI之間的話題模型,然后通過(guò)話題提取與參數(shù)學(xué)習(xí)獲取用戶對(duì)興趣點(diǎn)的偏好。Xing等[13]使用卷積神經(jīng)網(wǎng)絡(luò)提取用戶評(píng)論信息中隱含的語(yǔ)義信息特征,并對(duì)這些特征進(jìn)行分析得出用戶的偏好信息。
最近,下一個(gè)興趣點(diǎn)推薦研究的工作主要關(guān)注用戶長(zhǎng)短期偏好的影響。Ying等[14]提出了SHAN模型,它結(jié)合了長(zhǎng)期和短期偏好來(lái)為用戶推薦下一個(gè)項(xiàng)目,但是他們沒(méi)有考慮用戶的順序行為。Zhao等[15]提出了一種STGN模型,該模型通過(guò)在LSTM結(jié)構(gòu)上添加2對(duì)時(shí)間和距離門來(lái)建模簽到點(diǎn)之間的時(shí)間和距離間隔,以提取長(zhǎng)期偏好和短期偏好。Sun等[16]考慮到當(dāng)前軌跡中不相鄰地點(diǎn)之間的地理影響以及神經(jīng)網(wǎng)絡(luò)在短期偏好建模中的局限性,提出了一種地理擴(kuò)張的RNN模型,充分利用非連續(xù)興趣點(diǎn)之間的地理關(guān)系,然后通過(guò)一個(gè)上下文感知的非局部網(wǎng)絡(luò)來(lái)挖掘歷史軌跡和當(dāng)前軌跡之間的時(shí)空相關(guān)性??紤]到用戶的偏好受到興趣點(diǎn)位置和類別因素的影響,Wu等[10]提出了PLSPL模型,該方法在長(zhǎng)期模塊中學(xué)習(xí)興趣點(diǎn)的上下文特征,利用注意力機(jī)制來(lái)捕獲用戶的長(zhǎng)期偏好;在短期偏好模塊中,利用2個(gè)并行的LSTM模型學(xué)習(xí)用戶的順序行為以捕獲對(duì)興趣點(diǎn)位置和類別信息的偏好。
總的來(lái)說(shuō),現(xiàn)有的大多數(shù)基于LSTM模型很少同時(shí)考慮用戶的長(zhǎng)期偏好和短期偏好,在對(duì)短期偏好建模時(shí),重點(diǎn)關(guān)注時(shí)間和空間的影響,忽略了興趣點(diǎn)評(píng)論信息對(duì)用戶做出選擇至關(guān)重要。
為了將評(píng)論信息與興趣點(diǎn)的位置信息和類別信息相結(jié)合,以提高興趣點(diǎn)推薦中用戶下一步行為預(yù)測(cè)的準(zhǔn)確率,本文提出了一種結(jié)合多類信息的興趣點(diǎn)推薦方法DMGCR。該方法主要包括長(zhǎng)期偏好建模、短期偏好建模和預(yù)測(cè)3個(gè)部分。
如圖1所示,本文模型同時(shí)考慮用戶長(zhǎng)短期偏好,在長(zhǎng)期模塊中,利用注意力機(jī)制來(lái)捕獲用戶對(duì)不同興趣點(diǎn)的關(guān)注程度;在短期模塊中,使用LSTM模型學(xué)習(xí)用戶對(duì)興趣點(diǎn)位置和類別的動(dòng)態(tài)偏好。
圖1 DMGCR框架
此外,考慮到用戶評(píng)論的情感信息對(duì)用戶接下來(lái)的決定有重要影響,本文模型在短期偏好模塊中將評(píng)論情感信息與興趣點(diǎn)位置信息和類別信息相結(jié)合。為了充分利用用戶評(píng)論中隱含的情感傾向信息,本文利用BiLSTM學(xué)習(xí)評(píng)論文本中隱含的語(yǔ)義特征,以捕獲用戶對(duì)興趣點(diǎn)的情感傾向。在預(yù)測(cè)模塊部分,結(jié)合長(zhǎng)期偏好和短期偏好來(lái)學(xué)習(xí)不同用戶在不同部分上的關(guān)注權(quán)重,計(jì)算下一個(gè)興趣點(diǎn)推薦的輸出概率。
定義1簽到序列。
定義2長(zhǎng)期序列。
定義3短期序列。
在用戶簽到序列中,并不是所有的歷史簽到數(shù)據(jù)都與用戶的下一步行為同等相關(guān),為此,在學(xué)習(xí)用戶長(zhǎng)期偏好時(shí)需要更多地關(guān)注其中重要的信息。類似于Wu等[10]提出的模型,通過(guò)引入注意力機(jī)制,本文模型可以捕獲用戶對(duì)每個(gè)興趣點(diǎn)不同的偏好,并為它們分配不同的權(quán)重。這就能夠衡量出用戶下一步行為與過(guò)去簽到行為之間的相關(guān)性。
2.2.1 嵌入層表示
(1)
2.2.2 注意力機(jī)制
為了學(xué)習(xí)用戶的長(zhǎng)期偏好,本文利用注意力機(jī)制來(lái)捕獲嵌入層學(xué)習(xí)到的用戶潛在向量和興趣點(diǎn)潛在向量之間的相似性[19]。換言之,就是刻畫用戶對(duì)不同興趣點(diǎn)的關(guān)注程度。
考慮到運(yùn)算速度和空間效率,如公式(2)所示,本文使用點(diǎn)積注意函數(shù)來(lái)計(jì)算注意力權(quán)重:
f(Q,E)=QET
(2)
(3)
(4)
其中,Ulong表示用戶的長(zhǎng)期偏好。
用戶的下一步簽到不僅與用戶穩(wěn)定的長(zhǎng)期偏好相關(guān),還與用戶的短期動(dòng)態(tài)偏好相關(guān)[21]。考慮到短期序列中用戶在不同時(shí)間喜好不同的興趣點(diǎn),Wu等[10]利用LSTM模型學(xué)習(xí)用戶短期簽到的順序模式。該方法考慮到隨著時(shí)間變化,用戶對(duì)興趣點(diǎn)的位置和類別偏好也隨之變化。于是分別使用2個(gè)LSTM模型學(xué)習(xí)用戶對(duì)位置和類別的動(dòng)態(tài)偏好。本文也采用該方法來(lái)學(xué)習(xí)用戶的短期偏好,在此基礎(chǔ)上,考慮興趣點(diǎn)的評(píng)論信息對(duì)用戶下一步行為有重要影響,將簽到興趣點(diǎn)的評(píng)論文本融合到模型中。
2.3.1 學(xué)習(xí)用戶對(duì)興趣點(diǎn)位置和類別的偏好
用戶的下一步簽到行為受用戶的短期偏好影響,用戶的短期偏好會(huì)隨時(shí)間動(dòng)態(tài)變化。在不同的時(shí)間下,用戶對(duì)興趣點(diǎn)的位置和類別有不同的偏好[5]。本文使用Wu等[10]方法,通過(guò)LSTM模型來(lái)學(xué)習(xí)用戶的短期偏好。
(5)
其中,xt表示輸入向量,[vuj;vl;vt]表示用戶uj嵌入向量、位置嵌入向量、時(shí)間嵌入向量的連接。it表示步驟t時(shí)的輸入門,決定了需要存儲(chǔ)的信息,ft表示步驟t時(shí)的遺忘門,選擇了遺忘不重要的信息。ot是步驟t時(shí)的輸出門,決定了最終要輸出的信息。c′t表示步驟t時(shí)的新候選狀態(tài)向量?!咽?個(gè)向量的元素積,ft⊙ct-1表示決定忘記上一個(gè)狀態(tài)ct-1中的信息后保留的信息;it⊙c′t表示從新的候選狀態(tài)向量c′t中決定添加哪些新的信息。ct是結(jié)合上一個(gè)狀態(tài)ct-1和新候選狀態(tài)c′t信息的最終狀態(tài)向量。ht是隱藏輸出向量,代表了用戶的動(dòng)態(tài)偏好。σ是激活函數(shù),輸出0-1之間的數(shù)。Wi、Wf、Wo、Wc是門的權(quán)重,Wi、bf、bo、bc是相應(yīng)的偏置參數(shù)。
2.3.2 用戶評(píng)論文本的情感分析
由于用戶評(píng)論的內(nèi)容中蘊(yùn)含著情感傾向的信息,在推薦中評(píng)論數(shù)據(jù)的情感顯得尤為重要。因此,對(duì)評(píng)論文本內(nèi)容信息的深入挖掘可以有效解決推薦中存在的冷啟動(dòng)問(wèn)題[12]。本文考慮通過(guò)挖掘用戶評(píng)論中包含的信息,以捕捉用戶對(duì)興趣點(diǎn)的情感傾向。主要方法是:先對(duì)評(píng)論文本向量化處理,接著利用BiLSTM去學(xué)習(xí)評(píng)論文本隱含的語(yǔ)義特征,最終結(jié)合學(xué)習(xí)到的情感特征值來(lái)計(jì)算用戶對(duì)興趣點(diǎn)的情感傾向。
通過(guò)對(duì)2層LSTM輸出的語(yǔ)義特征矩陣進(jìn)行相加,將來(lái)自上文的語(yǔ)義信息和來(lái)自下文的語(yǔ)義信息進(jìn)行結(jié)合。最終,將隱藏層最后時(shí)刻輸出的語(yǔ)義特征向量輸入到一個(gè)全連接層去計(jì)算評(píng)論文本的情感值R。
用戶在選擇興趣點(diǎn)時(shí),更加關(guān)注興趣點(diǎn)的評(píng)論數(shù)量和評(píng)論包含的情感信息。對(duì)于其中的某一條評(píng)論數(shù)據(jù),其發(fā)表評(píng)論的時(shí)間也會(huì)影響到該評(píng)論對(duì)用戶的參考程度,進(jìn)而影響到不同時(shí)間下興趣點(diǎn)整體評(píng)論的情感極性變化。興趣點(diǎn)i整體評(píng)論的情感傾向Si如公式(6)所示:
(6)
其中,C表示興趣點(diǎn)i的評(píng)論的個(gè)數(shù),c表示第c個(gè)評(píng)論。Rc(i)表示興趣點(diǎn)i的第c個(gè)評(píng)論的情感值(該值介于[-1,1]之間)。tcur表示當(dāng)前時(shí)間,tRc(i)表示第c個(gè)評(píng)論的評(píng)論時(shí)間。
當(dāng)決定接下來(lái)去哪里時(shí),不同的用戶對(duì)長(zhǎng)期和短期偏好表現(xiàn)出不同的依賴[21]。對(duì)于學(xué)習(xí)不同用戶的不同依賴,即學(xué)習(xí)不同用戶對(duì)長(zhǎng)期模塊和短期模塊的個(gè)性化權(quán)重,本文將長(zhǎng)期和短期偏好模塊學(xué)習(xí)的結(jié)果與基于用戶的線性組合單元相結(jié)合。這里的用戶偏好不同于前面在長(zhǎng)期模塊和短期模塊中的偏好,它們代表了用戶對(duì)長(zhǎng)期偏好和短期偏好的個(gè)性化權(quán)重。通過(guò)線性組合來(lái)計(jì)算用戶uj對(duì)下一個(gè)興趣點(diǎn)i的偏好Pi如公式(7)所示:
(7)
(8)
其中,N是候選興趣點(diǎn)的總數(shù),e是指數(shù)函數(shù)。
上文已經(jīng)定義了興趣點(diǎn)的輸出概率,因此,目標(biāo)用戶uj在下一個(gè)時(shí)間t最可能訪問(wèn)的興趣點(diǎn)是具有最大概率的興趣點(diǎn)。給定有E個(gè)樣本的訓(xùn)練集,所提出模型的損失函數(shù)定義如公式(9)所示:
(9)
其中,J是本文模型的推薦和實(shí)際情況之間的交叉熵?fù)p失。E和N分別代表訓(xùn)練集和候選興趣點(diǎn)的數(shù)量。yij是指示變量,當(dāng)興趣點(diǎn)j為真實(shí)值時(shí),yij的值為1,否則為0。Oij是由本文模型計(jì)算的興趣點(diǎn)j的輸出概率。‖Θ‖2是避免過(guò)度擬合的正則化項(xiàng)。λ控制正則化項(xiàng)的重要性。為了最小化目標(biāo)函數(shù),使用隨機(jī)梯度下降(SGD)和時(shí)間反向傳播(BPTT)算法來(lái)學(xué)習(xí)參數(shù)[23]。算法1中給出了詳細(xì)的學(xué)習(xí)算法。
算法1DMGCR算法
輸入:用戶集U,簽到序列Qu,長(zhǎng)期序列Auj,短期序列Su,評(píng)論序列Rl
輸出:訓(xùn)練的模型
1.初始化Θ
2.while(iteration≤Iter)do
3.for用戶ujin 用戶集Udo
4.計(jì)算uj的嵌入向量ruj
8.end for
9.根據(jù)公式(3)計(jì)算注意力權(quán)重ai
10.根據(jù)公式(4)計(jì)算長(zhǎng)期偏好Ulong
13.使用公式(6)計(jì)算評(píng)論文本的情感傾向Si
14.使用公式(7)和公式(8)計(jì)算興趣點(diǎn)輸出概率
15.使用公式(9)使用梯度下降更新Θ
16.end for
17.end while
18.輸出訓(xùn)練的模型
本文使用Foursquare和Yelp這2個(gè)公開(kāi)可用的LBSN數(shù)據(jù)集進(jìn)行評(píng)估實(shí)驗(yàn),這2個(gè)數(shù)據(jù)集都提供用戶簽到數(shù)據(jù)[24]。本文中每個(gè)簽到記錄包含用戶id、興趣點(diǎn)id、興趣點(diǎn)的經(jīng)緯度、類別名稱、簽到時(shí)間戳、評(píng)論文本等信息。這2個(gè)數(shù)據(jù)集中的所有簽到記錄都被視為用戶序列。此外,本文對(duì)這2個(gè)數(shù)據(jù)集執(zhí)行了一個(gè)預(yù)處理步驟,以過(guò)濾掉不活躍的用戶和不受歡迎的興趣點(diǎn),去除少于10個(gè)簽到的用戶和少于10個(gè)用戶訪問(wèn)的興趣點(diǎn)[25]。然后,按照時(shí)間戳順序?qū)γ總€(gè)用戶的簽到記錄進(jìn)行排序,把前80%作為訓(xùn)練集,剩下的20%作為測(cè)試集。數(shù)據(jù)集統(tǒng)計(jì)結(jié)果如表1所示。
表1 數(shù)據(jù)集統(tǒng)計(jì)
將本文提出的DMGCR模型與以下6種基本方法進(jìn)行了比較:
FPMC:通過(guò)集成矩陣分解和馬爾可夫鏈方法對(duì)一般偏好和順序行為進(jìn)行建模。
ST-RNN:基于RNN模型,用特定時(shí)間的轉(zhuǎn)移矩陣和特定距離的轉(zhuǎn)移矩陣來(lái)建模時(shí)間和空間特征。
Time-LSTM:這是LSTM的擴(kuò)展,它使用時(shí)間門來(lái)建模連續(xù)輸入之間的時(shí)間間隔。
DeepMove:利用注意力機(jī)制從歷史軌跡中學(xué)習(xí)用戶的長(zhǎng)期偏好,并利用RNN模型從當(dāng)前軌跡中學(xué)習(xí)短期偏好。
ST-LSTM:將時(shí)間和空間影響結(jié)合到LSTM模型中,以緩解興趣點(diǎn)預(yù)測(cè)問(wèn)題中的數(shù)據(jù)稀疏性。
PLSPL:該方法綜合考慮用戶的長(zhǎng)期和短期偏好,在長(zhǎng)期模塊中,利用注意力機(jī)制學(xué)習(xí)用戶對(duì)興趣點(diǎn)的長(zhǎng)期偏好;在短期模塊中,使用LSTM模型學(xué)習(xí)對(duì)位置和類別偏好。
本文使用精確率和平均準(zhǔn)確率這2個(gè)指標(biāo)評(píng)估不同興趣點(diǎn)推薦方法的性能,其中精確率使用P@k表示,平均準(zhǔn)確率使用MAP@k表示[26]。它們是評(píng)估排名列表質(zhì)量的標(biāo)準(zhǔn)指標(biāo),值越大,性能越好。對(duì)每個(gè)用戶,P@k表示真實(shí)訪問(wèn)POI是否出現(xiàn)在前k個(gè)推薦POI中,MAP@k衡量推薦列表的順序。使用這2個(gè)指標(biāo)是希望推薦的興趣點(diǎn)不僅出現(xiàn)在前個(gè)列表中,而且出現(xiàn)在推薦列表的頂部。本文在實(shí)驗(yàn)中設(shè)置k=1,5,10,20。給定帶有E個(gè)樣本的訓(xùn)練集,這2個(gè)度量函數(shù)定義如下:
(10)
(11)
在這一小節(jié)中,比較了DMGCR方法與其他方法之間不同的性能。表2和表3分別驗(yàn)證了在Foursquare和Yelp數(shù)據(jù)集上使用P@k和MAP@k評(píng)估方法的性能。
表2 Yelp數(shù)據(jù)集上的性能比較
表3 Foursquare數(shù)據(jù)集上的性能比較
可以觀察到:在2個(gè)數(shù)據(jù)集上,DMGCR模型的所有評(píng)估指標(biāo)都優(yōu)于相比較的方法。具體來(lái)說(shuō),對(duì)于Yelp數(shù)據(jù)集上的P@5,DMGCR方法幾乎比DeepMove高3.9%,比ST-LSTM高13.4%,比PLSPL高5.9%。在Foursquare數(shù)據(jù)集上,DMGCR在所有指標(biāo)下也高于其他方法。這表明本文模型可以更好地捕捉用戶的長(zhǎng)期和短期偏好,同時(shí),也表明了考慮用戶評(píng)論文本信息的有效性。
此外,ST-RNN由于采用了深度模型RNN,比使用馬爾可夫鏈方法的FPMC模型在學(xué)習(xí)用戶的順序行為上表現(xiàn)更優(yōu)。Time-LSTM模型是使用LSTM來(lái)建模連續(xù)輸入之間的時(shí)間間隔,總體要比ST-RNN推薦效果更好。DeepMove在所有指標(biāo)上都比FPMC、ST-RNN、Time-LSTM表現(xiàn)更好,這是因?yàn)镈eepMove將LSTM模型應(yīng)用于長(zhǎng)期和短期偏好。此外,DeepMove利用注意力機(jī)制從歷史軌跡中學(xué)習(xí)用戶的長(zhǎng)期偏好。PLSPL模型與DeepMove相比,綜合考慮興趣點(diǎn)位置和類別因素的影響,使用LSTM學(xué)習(xí)用戶對(duì)位置和類別的偏好,從而在推薦準(zhǔn)確度上有明顯的提升。但與DMGCR模型相比,PLSPL模型忽略了用戶的評(píng)論情感傾向信息,模型的推薦性能還不能達(dá)到更佳的效果。DMGCR模型綜合考慮了用戶長(zhǎng)期和短期偏好,尤其在對(duì)用戶短期偏好建模時(shí),不僅考慮了位置信息和類別信息因素,還融合了用戶的評(píng)論情感傾向信息,因此推薦準(zhǔn)確率最高。與推薦效果較好的PLSPL方法相比,DMGCR模型平均提高了2.3%的準(zhǔn)確率。以上數(shù)據(jù)說(shuō)明,在興趣點(diǎn)推薦中引入用戶評(píng)論文本,能夠有效提高推薦的效果。
3.5.1 長(zhǎng)期和短期模塊的影響
為了驗(yàn)證結(jié)合長(zhǎng)期和短期模塊在模型中的有效性,本文研究了在Yelp和Foursquare數(shù)據(jù)集上P@5、P@10和P@20的性能,比較了以下3種情況:
1)僅考慮長(zhǎng)期偏好學(xué)習(xí)模塊;
2)僅考慮短期偏好學(xué)習(xí)模塊;
3)同時(shí)考慮長(zhǎng)期和短期偏好學(xué)習(xí)模塊。
比較結(jié)果如圖所示。
(a) Yelp數(shù)據(jù)集上受長(zhǎng)短期偏好影響的P@k性能比較
圖2可以觀察到:短期偏好比長(zhǎng)期偏好表現(xiàn)得更好。由于長(zhǎng)期偏好反映了用戶的固有特征,這些特征很難從本質(zhì)上表現(xiàn)出來(lái),而短期偏好可以通過(guò)最近行為的序列信息來(lái)學(xué)習(xí)[27]。此外,在所有評(píng)估指標(biāo)下,長(zhǎng)期和短期偏好學(xué)習(xí)模塊的結(jié)合顯示出比任何單個(gè)部分更好的性能。這表明結(jié)合用戶的長(zhǎng)期偏好和短期偏好對(duì)于更好地學(xué)習(xí)用戶的簽到行為至關(guān)重要。
3.5.2 融入評(píng)論信息的影響
為了驗(yàn)證融入用戶評(píng)論信息在模型中的有效性,本文設(shè)計(jì)并對(duì)比了DMGCR模型的一個(gè)簡(jiǎn)化模型DMGCR-LC,它是一個(gè)只考慮位置偏好和類別偏好因素而沒(méi)有考慮評(píng)論文本因素后構(gòu)建的測(cè)試模型。比較結(jié)果如圖3所示。
(a) 受評(píng)論影響P@k性能比較
從圖3中可以觀察到,DMGCR的推薦性能表現(xiàn)相比DMGCR-LC有了一定的提升,這是由于DMGCR模型使用BiLSTM有效提取了用戶評(píng)論文本隱含的語(yǔ)義特征,捕獲了用戶對(duì)興趣點(diǎn)的情感傾向信息,從一定程度上緩解了數(shù)據(jù)稀疏性問(wèn)題。實(shí)驗(yàn)結(jié)果表明了結(jié)合評(píng)論信息、位置信息、類別信息等因素的推薦效果更好,進(jìn)而驗(yàn)證了DMGCR模型能夠更好地建模用戶的下一步簽到行為,有助于提高推薦的準(zhǔn)確率。這與實(shí)際生活中人們的選擇習(xí)慣相吻合,用戶在選擇自己感興趣的地點(diǎn)時(shí)通常會(huì)考慮地點(diǎn)的評(píng)論情況,某地點(diǎn)的評(píng)論情感信息越積極用戶越有可能選擇該地點(diǎn)。
本文針對(duì)下一個(gè)興趣點(diǎn)推薦問(wèn)題,提出了一種結(jié)合動(dòng)態(tài)多類信息的興趣點(diǎn)推薦模型,稱為DMGCR。該方法通過(guò)在長(zhǎng)期模塊中利用注意力機(jī)制捕捉不同興趣點(diǎn)對(duì)用戶的重要程度,刻畫了用戶的長(zhǎng)期偏好;在短期模塊中,將評(píng)論信息與位置信息和類別信息相結(jié)合,通過(guò)BiLSTM學(xué)習(xí)出評(píng)論文本隱含的語(yǔ)義特征,捕獲了用戶對(duì)興趣點(diǎn)的情感傾向。最終結(jié)合長(zhǎng)期偏好和短期偏好來(lái)計(jì)算用戶下一步簽到行為的概率。在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該方法比其他基線方法表現(xiàn)更好。在未來(lái)的工作中,筆者將在模型中加入更多的上下文信息,如社交網(wǎng)絡(luò)關(guān)系,以進(jìn)一步提高下一個(gè)興趣點(diǎn)的推薦性能。