劉彤 曾誠 何鵬
摘 要:隨著民宿行業(yè)的迅速發(fā)展,在線民宿訂房系統(tǒng)開始流行起來。讓用戶在海量房源信息中快速找到所需房源是訂房系統(tǒng)中待解決的問題。針對房源推薦中用戶冷啟動與數(shù)據(jù)稀疏性的問題,提出基于網(wǎng)絡(luò)嵌入法的房源個性化推薦(UNER)方法。首先通過用戶在系統(tǒng)中的歷史行為數(shù)據(jù)及標(biāo)簽信息構(gòu)建兩類用戶網(wǎng)絡(luò);然后基于網(wǎng)絡(luò)嵌入法將網(wǎng)絡(luò)映射至低維向量空間中,得到用戶節(jié)點的向量表示并通過用戶向量計算用戶相似度矩陣;最后依據(jù)該矩陣為用戶進(jìn)行房源推薦。實驗數(shù)據(jù)來源于貴州“水東鄉(xiāng)舍”民宿訂房系統(tǒng)。實驗結(jié)果表明,相對于基于用戶的協(xié)同過濾算法,所提方法的綜合評價指標(biāo)(F1)提升了20個百分點,平均正確率(MAP)提升11個百分點,體現(xiàn)出該方法的優(yōu)越性。
關(guān)鍵詞:網(wǎng)絡(luò)嵌入;房源推薦;協(xié)同過濾;用戶行為
中圖分類號:TP311.51
文獻(xiàn)標(biāo)志碼:A
Housing recommendation method based on user network embedding
LIU Tong1, ZENG Cheng1,2*, HE Peng1,2
1.School of Computer Science and Information Engineering, Hubei University, Wuhan Hubei 430062, China)
2.Hubei Engineering Research Center for Education Informationization, Wuhan Hubei 430062, China
Abstract:
With the rapid development of the hotel industry, the online hotel reservation system has become popular. How to let users quickly find the housing they need from massive housing information is the problem to be solved in the reservation system. Aiming at the cold start and data sparseness of users in the housing recommendation, the User Network Embedding Recommendation (UNER) method based on the network embedding method was proposed. Firstly, two kinds of user networks were constructed by the users historical behavior data and tag information in the system. Then, the network was mapped into the lowdimensional vector space based on the network embedding method, and the vector representation of the user node was obtained and the user similarity matrix was calculated by the user vector. Finally, according to the matrix, the housing recommendation was performed for the user. The experimental data come from the hotel reservation system of “Shuidongxiangshe” in Guizhou. The experimental results show that compared with the userbased collaborative filtering algorithm, the proposed method has the comprehensive evaluation index (F1) increased by 20 percentage points and the Mean Average Precision (MAP) increased by 11 percentage points, reflecting the superiority of the method.
Key words:
network embedding; housing recommendation; collaborative filtering; user behavior
0?引言
隨著互聯(lián)網(wǎng)越發(fā)普及和成熟,在線訂房系統(tǒng)受到很多人的青睞,為用戶提供個性化推薦策略也是訂房系統(tǒng)中必不可少的一部分,它可以幫助用戶在海量房源中找到所需房源。推薦系統(tǒng)主要是挖掘用戶潛在需求,幫助用戶進(jìn)行決策[1],推薦效果的好壞直接影響著用戶體驗和公司收益。[2]。在民宿房源推薦問題中,協(xié)同過濾推薦方法[3-5]無法解決用戶冷啟動問題[6]及數(shù)據(jù)稀疏性問題。
針對上述問題,本文通過用戶在注冊時選擇的標(biāo)簽數(shù)據(jù)與用戶行為數(shù)據(jù)構(gòu)建兩類用戶用戶網(wǎng)絡(luò),并使用網(wǎng)絡(luò)嵌入(network embedding)法分別得到兩種網(wǎng)絡(luò)中用戶節(jié)點的向量表示。使用用戶標(biāo)簽數(shù)據(jù)構(gòu)建的網(wǎng)絡(luò)來解決系統(tǒng)中用戶冷啟動問題;同時在構(gòu)建網(wǎng)絡(luò)時充分考慮網(wǎng)絡(luò)中節(jié)點的一階和二階關(guān)系用來解決數(shù)據(jù)稀疏問題。
1?相關(guān)工作
網(wǎng)絡(luò)結(jié)構(gòu)在現(xiàn)實生活中處處可見, 比如道路將城市之間連接成交通網(wǎng)絡(luò),論文中引用關(guān)系將論文之間構(gòu)成學(xué)術(shù)論文網(wǎng)絡(luò)。對各種數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行分析時首先要對網(wǎng)絡(luò)進(jìn)行表示,常用的方法是用鄰接矩陣表示網(wǎng)絡(luò),最終將節(jié)點用高維稀疏向量表示, 這種方法計算時間長并且消耗大量空間。文獻(xiàn)[7]中將由網(wǎng)絡(luò)表示的鄰接矩陣作為奇異值分解(Singular Value Decomposition, SVD)算法的輸入?yún)?shù),將節(jié)點用低維表示,但是這種表示在數(shù)據(jù)挖掘中性能不理想。文獻(xiàn)[8]中提出的算法將網(wǎng)絡(luò)中的信息擴散問題轉(zhuǎn)換為低維空間上的信息擴散問題,并使用低維向量表示節(jié)點信息,但是算法的復(fù)雜度可以達(dá)到立方量級,所以不適合大規(guī)模網(wǎng)絡(luò)分析任務(wù)。
網(wǎng)絡(luò)嵌入法[9]又稱網(wǎng)絡(luò)表示學(xué)習(xí),是表示學(xué)習(xí)技術(shù)的一個子集。表示學(xué)習(xí)是一種對數(shù)據(jù)廣義的特征表示,而網(wǎng)絡(luò)嵌入法則更加專注于網(wǎng)絡(luò)的表示,旨在將網(wǎng)絡(luò)中的節(jié)點以更加直觀、更加高效的某種方式盡可能地還原原始空間中節(jié)點的關(guān)系,把網(wǎng)絡(luò)中的每個節(jié)點映射成為一個低維稠密實數(shù)向量,不僅可以降低時間和空間上的計算開銷,而且可以提高節(jié)點向量在各種網(wǎng)絡(luò)分析任務(wù)中的性能。
Xie等[10-11]將網(wǎng)絡(luò)表示學(xué)習(xí)應(yīng)用于地點推薦領(lǐng)域;Ding等[12]在基于位置的社交網(wǎng)絡(luò)中利用用戶的興趣點來提供更加準(zhǔn)確的推薦;He等[13]通過向NCF(Neural Collaborative Filtering)模型中輸入用戶和商品網(wǎng)絡(luò)中邊的信息,同時使用多層感知機來得到用戶和商品間的非線性關(guān)系,最終計算用戶間相似度來進(jìn)行推薦;文獻(xiàn)[14]中DeepWalk算法在網(wǎng)絡(luò)中進(jìn)行隨機游走得到節(jié)點訪問序列,然后將其作為skipgram[15]的輸入并得到節(jié)點向量。網(wǎng)絡(luò)嵌入法是近幾年快速發(fā)展的數(shù)據(jù)分析技術(shù),但是它在個性推薦領(lǐng)域還處于剛起步的階段。
2?解決方案
UNER(User Network Embedding Recommendation)方法的整體解決方案如圖1所示。
1)通過用戶標(biāo)簽數(shù)據(jù)構(gòu)建用戶用戶網(wǎng)絡(luò),并通過網(wǎng)絡(luò)嵌入法計算用戶節(jié)點向量表示形式,通過該類型網(wǎng)絡(luò)中用戶的向量表示來解決民宿房源推薦問題中用戶冷啟動問題。
2)使用對比標(biāo)度權(quán)重法計算用戶各行為的權(quán)重值,并通過用戶行為數(shù)據(jù)構(gòu)建用戶用戶網(wǎng)絡(luò)。
3)為解決用戶標(biāo)簽數(shù)據(jù)和用戶行為數(shù)據(jù)稀疏問題,本文在計算網(wǎng)絡(luò)中節(jié)點向量時不僅考慮節(jié)點間的一階鄰近度,同時還考慮節(jié)點間的二階鄰近度,即通過增加節(jié)點的高階鄰居(如鄰居的鄰居)來拓展網(wǎng)絡(luò)中節(jié)點的鄰居,用以解決用戶數(shù)據(jù)稀少造成的稀疏性問題。
4)通過用戶節(jié)點的特征向量計算用戶間相似性,使用協(xié)同推薦得到TopN推薦房源列表。
為方便閱讀,介紹算法中用到的結(jié)構(gòu)和定義。
定義1?用戶標(biāo)簽。用戶在注冊時選擇興趣標(biāo)簽,對于用戶u而言,用戶標(biāo)簽集Tu可以表示一個用戶u自身的標(biāo)簽集合〈u,t〉,數(shù)據(jù)集T={Tu:u∈U}是所有用戶的標(biāo)簽記錄集合。
定義2?用戶行為。用戶在使用民宿訂房系統(tǒng)時,會產(chǎn)生各種行為,比如瀏覽、收藏、購買等。一個用戶u對房源h產(chǎn)生的行為b可以用三元組〈u,h,b〉來表示,將該三元組稱為Bu。數(shù)據(jù)集B是所有用戶對房源產(chǎn)生的行為數(shù)據(jù)集合。
定義3?用戶共現(xiàn)。當(dāng)兩個用戶具有相同標(biāo)簽或者對同一房源都具有行為時,那么就稱為這兩個用戶共現(xiàn)。
當(dāng)給定用戶標(biāo)簽數(shù)據(jù)集后,需要通過用戶的標(biāo)簽來統(tǒng)計用戶對之間的共現(xiàn)次數(shù)來確定兩用戶之間的權(quán)重。若使用用戶行為數(shù)據(jù),則需要計算用戶各行為的權(quán)重。最終通過數(shù)據(jù)集T和B,構(gòu)建兩類用戶用戶網(wǎng)絡(luò)。下面介紹用戶用戶網(wǎng)絡(luò)的定義。
定義4?用戶用戶網(wǎng)絡(luò)。用戶用戶網(wǎng)絡(luò)主要是通過抽取用戶對之間的共現(xiàn)信息構(gòu)建獲得。可以將用戶用戶網(wǎng)絡(luò)表示成G=(V,E)的加權(quán)無向圖形式,每一個節(jié)點代表著一個用戶,V表示網(wǎng)絡(luò)中的節(jié)點信息。E表示網(wǎng)絡(luò)中節(jié)點和節(jié)點即用戶和用戶之間的無向邊,代表用戶之間共現(xiàn)信息。節(jié)點Vi和節(jié)點Vj之間邊的權(quán)重Wi, j是由用戶標(biāo)簽集合T和用戶行為集合B中用戶i和用戶j之間的共現(xiàn)次數(shù)。
根據(jù)以上定義,可以通過用戶標(biāo)簽集合T和用戶行為集合B構(gòu)建出兩類用戶用戶網(wǎng)絡(luò)。圖2是基于用戶標(biāo)簽的用戶用戶網(wǎng)絡(luò)。在通過用戶標(biāo)簽構(gòu)建用戶用戶網(wǎng)絡(luò)的過程中,分析用戶標(biāo)簽中每個用戶和其他用戶是否具有相同的標(biāo)簽,從而獲得用戶用戶網(wǎng)絡(luò)中邊的權(quán)重。在本例中,用戶1和用戶2都有標(biāo)簽1和標(biāo)簽2,因此在用戶用戶網(wǎng)絡(luò)中,用戶1和用戶2對應(yīng)節(jié)點的邊的權(quán)重為2。
圖3是基于用戶行為的用戶用戶網(wǎng)絡(luò)。在通過用戶行為構(gòu)建用戶用戶網(wǎng)絡(luò)的過程中,分析用戶和其他用戶是否對同一房源產(chǎn)生行為。使用對比標(biāo)度權(quán)重法計算各種行為所對應(yīng)的權(quán)重,網(wǎng)絡(luò)中兩個用戶節(jié)點間邊的權(quán)重是這兩個用戶對同一房源產(chǎn)生的行為權(quán)重相加之和。圖3中user_1和user_2之間邊的權(quán)重為user_1對h_2和h_3產(chǎn)生行為的權(quán)重加上user_2對h_2和h_3產(chǎn)生行為的權(quán)重。
最終,構(gòu)建兩類用戶網(wǎng)絡(luò)后,當(dāng)系統(tǒng)判定用戶為新用戶時,則通過用戶標(biāo)簽信息來構(gòu)建用戶用戶網(wǎng)絡(luò)并計算用戶向量,然后計算用戶相似矩陣,最終完成TopN推薦。基于用戶標(biāo)簽的網(wǎng)絡(luò)主要用于解決用戶冷啟動問題;如果用戶不是新用戶,那么利用用戶在系統(tǒng)中的行為數(shù)據(jù)來構(gòu)建網(wǎng)絡(luò),然后計算用戶相似矩陣,最后為用戶提供TopN推薦。
3?研究方法
3.1?網(wǎng)絡(luò)嵌入法的一階鄰近度和二階鄰近度
一階鄰近度?該模型只適用于無向圖,對于用戶用戶網(wǎng)絡(luò)中的一條無向邊(i, j)定義兩個節(jié)點vi和vj的共享概率如下:
p1(vi,vj)=11+exp(-uiT,uj)(1)
其中:ui和uj是網(wǎng)絡(luò)中節(jié)點i和j的向量化表示形式,相當(dāng)于從Embedding的角度來描述節(jié)點之間的親密程度,兩個節(jié)點親密程度的度量將由網(wǎng)絡(luò)的數(shù)據(jù)結(jié)構(gòu)中獲得。
1(vi,vj)=wijW(2)
其中:wij是節(jié)點i和j間邊的權(quán)值;W是指網(wǎng)絡(luò)中所有邊權(quán)值的和,即W=∑ (i,j)∈Ewij。為保證一階鄰近度的可靠性,p1和1之間的分布差異越小越好,則將目標(biāo)函數(shù)優(yōu)化如下:
O1=d(p1,1)(3)
兩個概率之間的分布差異由d()函數(shù)來衡量,本文中選用KL散度,可以將式(3)優(yōu)化為:
O1=-∑ (i,j)∈EWijlogp1(vi,vj)(4)
通過學(xué)習(xí)訓(xùn)練,我們可以得到每個用戶節(jié)點的特征向量{ui}i=1,2,…,|U|,并且滿足使式(4)最小化。
二階鄰近度?二階鄰近度是認(rèn)為網(wǎng)絡(luò)中與其他節(jié)點具有相同鄰居節(jié)點的兩個節(jié)點彼此相似。在該情況下,每個節(jié)點也被認(rèn)為是一個特定的“上下文”,并假設(shè)在“上下文”上具有相似分布的節(jié)點是相似的。因此每個節(jié)點都具有兩種角色:節(jié)點本身和其他節(jié)點的特定“上下文”。引入兩個向量ui和ui′,當(dāng)vi被處理為節(jié)點時,ui是vi的表示;當(dāng)vi被當(dāng)作“上下文”處理時,ui′是vi的表示。對于邊(i,j),將節(jié)點vi生成“上下文”vj的概率定義為:
p(vj|vi)=exp(ui′T·ui)∑|V|k=1exp(uK′T·ui)(5)
其中|V|是頂點或“上下文”的數(shù)量。為了保證節(jié)點間二階相似度信息,則應(yīng)該使降維之后上下文的概率p(·|vi)盡可能地接近實際概率(·|vi)。表示為:
O2=∑ i∈Vaid((·|vi),p(·|vi))(6)
由于網(wǎng)絡(luò)節(jié)點的重要性可能不同,所以式(6)中的ai表示網(wǎng)絡(luò)中節(jié)點i的重要程度。實際概率定義為(vj|vi)=wij∑ k∈N(i)wik,其中wij是邊(i,j)的權(quán)重,N(i)是節(jié)點vi鄰近的節(jié)點集。這里采用KL散度作為距離函數(shù):
O2=-∑ (i,j)∈EWijlogp2(vj|vi)(7)
通過模型的學(xué)習(xí)訓(xùn)練,可以得到使式(7)最小化{ui}i=1,2,…,|U|,就能通過一個d維的向量的ui′表示每個頂點ui。最后,每個用戶節(jié)點ui的嵌入向量表示ui為一級鄰近度下的向量ui1與二階鄰近度下向量ui2的線性組合,即:
ui=γui1+(1-γ)ui2(8)
3.2?基于用戶網(wǎng)絡(luò)嵌入的推薦
基于用戶網(wǎng)絡(luò)嵌入法的推薦是通過用戶用戶網(wǎng)絡(luò)得到用戶相似矩陣,使用相似用戶進(jìn)行房源推薦。通過上述方法計算,可得到每個用戶的特征向量ui,本文中采用余弦相似度[16]來計算用戶間相似度,并獲得相似用戶集合S(u)。
sim(ui,uj)=cos(ui,uj)(9)
對于用戶u是否選擇房源h,根據(jù)其相似用戶集中的用戶選擇情況進(jìn)行判斷。對于房源h,用戶u選擇它的概率的計算公式如下:
p(u,h)=∑ v∈S(u)∩N(h)sim(u,v)·rvh(10)
其中:rvh表示用戶u的相似用戶v對房源h的喜歡程度,N(h)是已選擇了房源h的用戶集。最后得到用戶u對未曾關(guān)注過的房源感興趣的概率列表,并且將概率大的房源進(jìn)行優(yōu)先推薦。
3.3?對比標(biāo)度權(quán)重法
民宿訂房系統(tǒng)中的用戶行為包括瀏覽、收藏和購買。本文利用對比標(biāo)度權(quán)重法[17]來確定不同行為下用戶對該房源的喜愛程度。它是指事物與離散變量各類之間有一定的聯(lián)系,所以就可將權(quán)重的概念使用到分類變量上,數(shù)量化賦值的標(biāo)準(zhǔn)將由對指標(biāo)各分類的不同權(quán)重來確定。首先按層次分析法的原則將某個分類變量依據(jù)一定的規(guī)則進(jìn)行賦值,然后根據(jù)各個類之間的重要程度,最后按照從1~9的標(biāo)度方法,如表1所示,一一對比標(biāo)度,構(gòu)造如下判斷矩陣:
D1D2?…?Dn
D1D2Dn-1Dnd11d12…d1n
d21d22…d2n
d(n-1)1d(n-1)2…d(n-1)n
dn1dn2…dnn
4?實驗分析
4.1?數(shù)據(jù)獲取
實驗數(shù)據(jù)主要來自于貴州“水東鄉(xiāng)舍”項目2018年5月—2019年2月 200位用戶的標(biāo)簽數(shù)據(jù)和行為數(shù)據(jù)以及150間民宿房源數(shù)據(jù)。“水東鄉(xiāng)舍”是我們團隊為貴州某公司實施的精準(zhǔn)扶貧項目,擬在開陽縣試點,成功后在貴陽市及貴州省推廣。
1)用戶標(biāo)簽數(shù)據(jù)。民宿訂房系統(tǒng)中的用戶注冊頁面設(shè)計了用戶選擇興趣標(biāo)簽的功能。用戶在注冊時選擇的標(biāo)簽數(shù)據(jù)就是用戶標(biāo)簽數(shù)據(jù)集。
2)用戶行為數(shù)據(jù)。民宿訂房系統(tǒng)中定義了三種用戶行為,分別為瀏覽、收藏和購買。用戶對商品的收藏和購買行為是在系統(tǒng)中明確產(chǎn)生的行為,很容易獲取。系統(tǒng)中獲取用戶瀏覽房間的記錄主要是通過頁面中的JavaScript代碼來實現(xiàn)。
4.2?計算用戶各行為權(quán)重
用戶行為(瀏覽、收藏、購買)是用戶對該房源是否有興趣的體現(xiàn),不同的行為表示了用戶對該房源的喜好程度。用戶各行為的權(quán)重計算分為下面三步。
1)根據(jù)表1構(gòu)建判斷矩陣,兩兩行為進(jìn)行對比,得出行為之間的相對重要性,如表2所示。
2)計算特征向量。從表3中的數(shù)值可以計算瀏覽、收藏和購買行為的特征向量值。計算方法在4.3節(jié)詳細(xì)講述。計算過程如下所示:
瀏覽=31×1/5×1/9=0.28;收藏=35×1×1/4=1.08;購買=39×4×1=3.30。
3)對特征向量值作歸一化處理,確定權(quán)重系數(shù)。計算過程如下:
瀏覽=0.28/4.66=0.06;收藏=1.08/4.66=0.23;購買=3.30/4.66=0.70。通過計算,可以得到三種行為的權(quán)重系數(shù)。
4.3?構(gòu)建網(wǎng)絡(luò)
本節(jié)以用戶行為數(shù)據(jù)集為例,構(gòu)建基于用戶行為的用戶用戶網(wǎng)絡(luò)。圖4為用戶行為的部分?jǐn)?shù)據(jù)集,該數(shù)據(jù)集主要由用戶編號、房源編號和行為編號構(gòu)成。
圖5為將圖4中數(shù)據(jù)轉(zhuǎn)換為帶權(quán)無向圖后的數(shù)據(jù)形式。
將圖5中的數(shù)據(jù)經(jīng)過網(wǎng)絡(luò)嵌入法計算其一階與二階鄰近度,并將兩種近鄰度下的用戶特征向量進(jìn)行線性組合就可得到每個用戶節(jié)點的向量表示形式,如圖6所示。
4.4?參數(shù)影響分析
本文所提算法采用綜合評價指標(biāo)(F1值)和平均正確率(Mean Average Precision,MAP)來衡量。F1計算公式為:
F1@K=2PRP+R
其中:P為精確率,R為召回率。
MAP的計算公式為:
MAP@K=∑Nn=1Avep(n)N
其中Avep(n)=∑nq=1(p(q)×rel(q))number of relevant documents;N表示為N個用戶推薦;對于已排序好的推薦列表,q代表推薦列表中房源的排名,當(dāng)q為已推薦成功房源時rel(k)為1,否則為0;p(q)是q前面房源的精確度。
將用戶行為數(shù)據(jù)集隨機抽出25%的數(shù)據(jù)作為測試集,剩余數(shù)據(jù)作為訓(xùn)練集。用戶向量維度的設(shè)置為LINE方法中的默認(rèn)值128維,在優(yōu)化過程中取負(fù)采用數(shù)為5,學(xué)習(xí)率的初始值設(shè)置為ρ0=0.025,且ρτ=ρ0(1-t/T),其中T為網(wǎng)絡(luò)中邊的數(shù)量。對于式(8)參數(shù)γ值的確定,采用變量固定措施。保持UNER方法中相似用戶集S(u)=5,參數(shù)γ按照每次增加0.1的方式從0到1變化,分別為用戶推薦4、6和8個房源,結(jié)果如圖7所示,當(dāng)γ值取0.7時,實驗結(jié)果最佳。
4.5?實驗結(jié)果
為了驗證本文實驗的有效性,將UNER方法的推薦結(jié)果與基于用戶的協(xié)同過濾算法(Userbased Collaborative Filtering,UserCF)的結(jié)果再進(jìn)行對比。當(dāng)γ=0.7,目標(biāo)用戶的相似數(shù)據(jù)集S(u)長度取5時,分別推薦6~10個房源,然后計算F1值和MAP值,兩種算法得到的結(jié)果,如表3所示。
當(dāng)目標(biāo)用戶的相似數(shù)據(jù)集S(u)長度取10時,分別推薦6~10個房源,然后計算F1值,分別得到兩種算法的F1值和MAP值,如表4所示。
將表4與表5轉(zhuǎn)換為圖表形式,如圖8和圖9所示,可以看出在兩種情況下UNER的綜合評價指標(biāo)和平均正確率均比UserCF高,即UNER的推薦結(jié)果比UserCF更優(yōu)。
5?結(jié)語
從實驗結(jié)果中可看出,基于用戶網(wǎng)絡(luò)嵌入法的民宿房源推薦方法要比協(xié)同過濾算法在綜合評價指標(biāo)上更優(yōu)。相對基于用戶的協(xié)同過濾算法,UNER方法的推薦綜合評價指標(biāo)(F1值)和平均正確率(MAP)均比基于用戶的協(xié)同過濾算法更優(yōu)。由于本文的研究主要是針對民宿房源的推薦,所以數(shù)據(jù)集采用貴州“水東鄉(xiāng)舍”項目中的用戶標(biāo)簽數(shù)據(jù)和用戶行為數(shù)據(jù)。
另外,在后期研究中應(yīng)加入用戶的社交網(wǎng)絡(luò)數(shù)據(jù),來提高推薦的精準(zhǔn)度。同時,應(yīng)結(jié)合更多用戶的隱性行為數(shù)據(jù),比如用戶在頁面的停留時間、用戶對房源的評價信息以及用戶行為產(chǎn)生的時間,并考慮多方面因素確定行為權(quán)重,從而更加精準(zhǔn)為用戶推薦房源信息。
參考文獻(xiàn) (References)
[1]DESHPANDE M, KARRYPIS G. Itembased TopNrecommendation algorithms[J]. ACM Transactions on Information Systems, 2004, 22(1):143-177.
[2]JUNG K Y, HWANG H J, KANG U G. Constructing full matrix through Naive Bayesian for collaborative filtering[C]// Proceedings of the 2006 International Conference on Intelligent Computing, LNCS 4114. Berlin: Springer, 2006:1210-1215.
[3]GOLDBERG D, NICHOLS D, OKI B M, et al. Using collaborative filtering to weave an information tapestry[J]. Communications of the ACM, 1992, 35(12): 61-70.
[4]BREESE B J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering[C]// Proceedings of the 4th Conference on Uncertainty in Artificial Intelligence, 1998:43-52.
[5]鄧愛林,朱揚勇,施伯樂. 基于項目評分預(yù)測的協(xié)同過濾推薦算法[J]. 軟件學(xué)報, 2003, 14(9):1621-1628. (DENG A L, ZHU Y Y, SHI B L. A collaborative filtering recommendation algorithm based on item rating prediction [J]. Journal of Software, 2003, 14(9): 1621-1628.)
[6]邵煜,謝穎華. 協(xié)同過濾算法中冷啟動問題研究[J]. 計算機系統(tǒng)應(yīng)用, 2019, 28(2):246-252. (SHAO Y, XIE Y H. Research on coldstart problem of collaborative filtering algorithm[J]. Computer Systems & Applications, 2019, 28(2):246-252.)
[7]LE T M V, LAUW H W. Probabilistic latent document network embedding[C]// Proceedings of the 2014 IEEE International Conference on Data Mining. Piscataway: IEEE, 2014: 270-279.
[8]BOURIGAULT S, LAGNIER C, LAMPRIER S, et al. Learning social network embeddings for predicting information diffusion[C]// Proceedings of the 2014 IEEE International Conference on Data Mining. Piscataway: IEEE, 2014: 393-402.
[9]PEROZZI B, ALRFOU R, SKIENA S. DeepWalk: online learning of social representations[C]// Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2014:701-710.
[10]XIE M, YIN H, XU F, et al. Graphbased metric embedding for next POI recommendation[C]// Proceedings of the 2016 International Conference on Web Information Systems Engineering, LNCS 10042. Berlin: Springer, 2016: 207-222.
[11]XIE M, YIN H, WANG H, et al. Learning graphbased POI embedding for locationbased recommendation[C]// Proceedings of the 25th ACM International on Conference on Information and Knowledge Management. New York: ACM, 2016:15-24.
[12]DING R, CHEN Z. RecNet: a deep neural network for personalized POI recommendation in locationbased social networks[J]. International Journal of Geographical Information Science, 2018, 32(8): 1631-1648.
[13]HE X, LIAO L, ZHANG H, et al. Neural collaborative filtering[J]. Proceedings of the 26th International Conference on World Wide Web. Republic and Canton of Geneva, Switzerland: International World Wide Web Conferences Steering Committee, 2017:173-182.
[14]WANG D, CUI P, ZHU W. Structural deep network embedding[C]// Proceedings of the 22nd ACM SIGKDD International Conference. New York: ACM, 2016:1225-1234.
[15]MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality[C]// Advances in Neural Information Processing Systems 26. Cambridge, MA: MIT Press, 2013:3111-3119.
[16]LUO C, ZHAN J, WANG L, et al. Cosine normalization: using cosine similarity instead of dot product in neural networks[EB/OL]. [2019-03-20]. https://arxiv.org/pdf/1702.05870.pdf.
[17]高陽,余建偉. 判斷矩陣標(biāo)度擴展法在不同標(biāo)度下的比較[J]. 統(tǒng)計與決策, 2007(20):152-154. (GAO Y, YU J W. Comparison of judgment matrix scale expansion method under different scales[J]. Statistics and Decision, 2007(20):152-154.)
This work is partially supported by the National Natural Science Foundation of China (61902114), the Hubei Province Major Technological Innovation Project (2016CFB309).
LIU Tong, born in 1993, M. S. candidate. His research interests include big data processing, recommendation algorithm.
ZENG Cheng, born in 1976, Ph. D., professor. His research interests include big data processing, domain software engineering, service recommendation.
HE Peng, born in 1988, Ph. D., associate professor. His research interests include big data processing, software metrics, complex network.