摘 要:基于位置的社交網(wǎng)絡(luò)(LBSNS)的快速發(fā)展提供了大量的記錄數(shù)據(jù),這能夠提供許多服務(wù),比如,信息點(diǎn)(POI)推薦。在本文中,我們研究了一個(gè)新的POI推薦的問題,使新的信息點(diǎn)基于用戶的當(dāng)前位置來被推薦。這個(gè)挑戰(zhàn)在于精確的了解用戶的序列信息和個(gè)性化推薦模型是有難度的。為此目的,我們求助于公制嵌入方法的推薦,這就避免了矩陣分解技術(shù)的缺點(diǎn)。我們提出了一個(gè)個(gè)性化的排名指標(biāo)嵌入方法(PRME)來模擬個(gè)性化序列。實(shí)驗(yàn)基于兩個(gè)現(xiàn)實(shí)世界LBSN數(shù)據(jù)集,結(jié)果顯示為我們的新算法優(yōu)于最先進(jìn)的POI推薦方法。
關(guān)鍵詞:社交網(wǎng)絡(luò)、信息點(diǎn)、馬爾可夫鏈算法、數(shù)據(jù)集
1. Introduction
隨著基于位置的社交網(wǎng)絡(luò)(LBSNS)的日益普及,用戶想通過記錄POIs來分享他們的位置。大量的記錄數(shù)據(jù)提供了機(jī)會(huì)來更好地了解用戶的移動(dòng)性的行為,在此基礎(chǔ)上推薦的POI將成為有價(jià)值的。 POI的推薦是很有價(jià)值的,它可以幫助用戶探索他們周圍的環(huán)境。POI推薦的重要性是已經(jīng)引起了大量的對(duì)開發(fā)推薦技術(shù)感興趣的研究。
相比于POI推薦,下一個(gè)POI推薦目前受到的關(guān)注較少。除了用戶的偏好,下一個(gè)POI推薦額外考慮了用戶的記錄序列信息。因?yàn)槿梭w行為表現(xiàn)出的有序模式,有序行為對(duì)POI的推薦很重要。我們分析兩個(gè)真實(shí)世界的數(shù)據(jù)集來驗(yàn)證用戶的有序行為。我們開發(fā)了一個(gè)公制嵌入算法來模擬POI的有序轉(zhuǎn)移。為了模擬個(gè)性化序列信息,我們提出了一種新穎的PRME算法,它既考慮到有序轉(zhuǎn)移也考慮到用戶偏好。
2. Related Work
定位推薦最近吸引了深入的研究關(guān)注。大多數(shù)以前的方法是基于協(xié)同過濾(CF)技術(shù)。其中最流行的CF算法是基于用戶的CF,它利用相似用戶簽入的用于建議的目的。在基于CF算法主要利用用戶的喜好提出建議。目前,地域的影響力已經(jīng)融合與CF的算法,以提高POI建議。例如,混合高斯分布和冪律分布已經(jīng)提出來建模地域影響。
3. Next New POI Recommendation
我們使用兩個(gè)可公開獲得的數(shù)據(jù)集。第一個(gè)數(shù)據(jù)集是在新加坡Foursquare的簽到,而第二個(gè)是在加利福尼亞州和內(nèi)華達(dá)州Gowalla的簽到數(shù)據(jù)集。我們用這兩個(gè)數(shù)據(jù)集一年的數(shù)據(jù)。每辦理入住手續(xù)是<用戶的形式的元組; POI;時(shí)間>。各個(gè)POI與緯度和經(jīng)度相關(guān)聯(lián)。我們剔除誰擁有簽入少于10個(gè)興趣點(diǎn)的用戶,以及已經(jīng)訪問了少于10個(gè)用戶的興趣點(diǎn)。
3.1 Observations on real-world datasets
觀察1:新的位置的探索,圖1示出的新的POI對(duì)所有用戶上兩個(gè)數(shù)據(jù)集,每50天平均比率。例如,該比率在第100天是POI的比例拜訪,但沒有被訪問過在先前天第100天。新的POI的比例是相當(dāng)高的(大部分在0.4以上的比例)的兩個(gè)數(shù)據(jù)集,這意味著人們總是喜歡探索新的興趣點(diǎn)。這種觀察是根據(jù)最近的研究結(jié)果[連等人,2013]。
觀察2:暫時(shí)影響,圖2(a)示出兩個(gè)連續(xù)的簽入的時(shí)間差的累積分布函數(shù)(CDF)。圖2(a)表明,50%以上的連續(xù)檢查插件發(fā)生在少于24小時(shí)。與此同時(shí),許多連續(xù)的簽入發(fā)生在較長(zhǎng)的時(shí)間。為25%以上的連續(xù)的簽到,他們的時(shí)間差異超過48小時(shí)大。
(圖1顯示了新的POI對(duì)所有用戶上兩個(gè)數(shù)據(jù)集,每50天平均比率)
觀察3:空間影響,我們計(jì)算了兩個(gè)連續(xù)簽入的地理距離并繪制在圖2(b)的CDF分布,這表明70%連續(xù)簽到有不足10公里的兩個(gè)數(shù)據(jù)集。該CDF曲線增加快時(shí),距離小,這意味著大多數(shù)簽到發(fā)生在附近地區(qū)。該結(jié)果表明用戶的下一個(gè)動(dòng)作由它們的當(dāng)前的位置的影響。這一發(fā)現(xiàn)是根據(jù)所報(bào)告的結(jié)果。
.(圖(a)顯示兩個(gè)連續(xù)的記錄數(shù)據(jù)之間的時(shí)間差的累積分布函數(shù)圖(b)顯示了兩個(gè)連續(xù)的記錄數(shù)據(jù)之間的地理位置距離的累積分布函數(shù))
3.2 Next new POI problem definition
當(dāng)兩個(gè)簽入發(fā)生在很短的時(shí)間內(nèi),馬爾可夫鏈屬性存。根據(jù)觀測(cè)1,用戶傾向于訪問新的POI為他們的勘探利益,這表明這表明新的POI為用戶的問題是有意義的。
根據(jù)一個(gè)很短的時(shí)間周期和新的POI用戶意愿內(nèi)連續(xù)屬性,我們正式定義下面N2-POI建議問題。
對(duì)于一組用戶的U和一組的POI L,C是歷史校驗(yàn)數(shù)據(jù),并且 是一組POI中的用戶U已經(jīng)訪問過。鑒于用戶u當(dāng)前POIlC 時(shí), N2-POI問題是推薦一套POI ,可實(shí)現(xiàn)用戶U接下來的訪問和興趣點(diǎn)是新的用戶
4 Personalized Ranking Metric Embedding
為了模擬順序信息,我們需要在馬爾可夫鏈模型的轉(zhuǎn)移概率。然而,由于該數(shù)據(jù)稀疏,這是不可行通過使用標(biāo)準(zhǔn)計(jì)數(shù)方法估計(jì)的轉(zhuǎn)換。度量嵌入模型可以用來處理數(shù)據(jù)稀疏和推廣到未觀察到的數(shù)據(jù)。我們代表每個(gè)POI作為一個(gè)潛在的空間中的一個(gè)點(diǎn)。我們假設(shè)在潛在空間的POI之間的歐幾里德距離反映了轉(zhuǎn)換概率。距離越大,轉(zhuǎn)場(chǎng)的強(qiáng)度越低。
I
where ,
在度量嵌入模型,將各個(gè)POI升具有在K維空間中的位置X(l)。鑒于觀察到的連續(xù)的POI轉(zhuǎn)換,目標(biāo)是學(xué)習(xí)所有POI的位置。我們涉及的一對(duì),li和lj的轉(zhuǎn)移概率,以歐氏距離的公式定義。
其中 ,K為潛在空間和Z(LI)的維數(shù), 是正常化術(shù)語。
5.Conclusion and FutureWork
在本文中,我們研究了下一個(gè)新的POI推薦的問題。我們提出了一個(gè)新穎的成對(duì)公制嵌入來模型化連續(xù)的POI轉(zhuǎn)移。我們進(jìn)一步發(fā)展出PRME-G,這個(gè)模型連接了三個(gè)因素:連續(xù)轉(zhuǎn)移,個(gè)人偏好和地域的影響力。我們的算法性能表現(xiàn)在兩個(gè)數(shù)據(jù)集中進(jìn)行大量的實(shí)驗(yàn)。幾個(gè)有趣的未來發(fā)展方向可以作進(jìn)一步的探索,例如產(chǎn)品的推薦和朋友的推薦。
References
[Chen et al., 2012] Shuo Chen, Josh L Moore, Douglas Turnbull, and Thorsten Joachims. Playlist prediction via metric embedding. In KDD, pages 714–722, 2012.
[Chen et al., 2013] Shuo Chen, Jiexun Xu, and Thorsten Joachims. Multi-space probabilistic sequence modeling. In KDD, pages 865–873, 2013.
[Chen et al., 2015] Xuefeng Chen, Yifeng Zeng, Gao Cong, Shengchao Qin, Yanping Xiang, and Yuanshun Dai. On information coverage for location category based point-ofinterest recommendation. In AAAI, pages 37–43, 2015.
[Cheng et al., 2012] Chen Cheng, Haiqin Yang, Irwin King, and Michael R Lyu. Fused matrix factorization with geographical and social influence in location-based social networks. In AAAI, 2012.
[Cheng et al., 2013] Chen Cheng, Haiqin Yang, Michael R Lyu, and Irwin King. Where you like to go next: Successive point-of-interest recommendation. In IJCAI, pages 2605–2611, 2013.
作者簡(jiǎn)介:
尹榮(1992.8.4—), 男,漢,上海,本科,中國(guó)電信股份有限公司上海分公司、助理工程師、項(xiàng)目管理。