国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于用戶興趣序列相似性度量的圖書協(xié)同過濾推薦方法研究

2019-12-16 08:17王剛郭雪梅
新世紀(jì)圖書館 2019年11期

王剛 郭雪梅

摘 要 論文通過用戶在一系列時(shí)間節(jié)點(diǎn)對所借閱圖書的評分形成用戶興趣序列,并提取用戶之間的最長公共興趣子序列(LCSIS)和所有公共興趣子序列(ACSIS),以此為基礎(chǔ)計(jì)算用戶之間的相似性并與傳統(tǒng)的協(xié)同過濾推薦方法相結(jié)合,提出了基于用戶興趣序列的改進(jìn)協(xié)同過濾圖書推薦方法。將本文提出的方法和傳統(tǒng)的基于用戶的協(xié)同過濾推薦方法在天津醫(yī)科大學(xué)圖書館圖書借閱數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果發(fā)現(xiàn)該方法在推薦效果上優(yōu)于傳統(tǒng)方法。

關(guān)鍵詞 用戶興趣序列 相似性度量 協(xié)同過濾推薦 智能薦書

分類號 G250.7

DOI 10.16810/j.cnki.1672-514X.2019.11.008

Research on Book Collaborative Filtering Recommendation Based on Similarity Measurement of Users Interest Sequences

Wang Gang, Guo Xuemei

Abstract This paper forms user interest sequence through the user rating of the borrowed books in a series of time nodes, and exacts the Longest Common Sub-IS (LCSIS) and All Common Sub-IS (ACSIS) between users interest sequences. Based on this, the similarity between users is measured and combined with the traditional collaborative filtering book recommendation method, and an improved collaborative filtering book recommendation method based on user interest sequence is proposed. The proposed method is compared with the traditional user based collaborative filtering recommendation method by experiment on our library database. The experimental results show that the proposed method is superior to the traditional method in book recommendation effect.

Keywords Users interest sequence. Similarity measurement. Collaborative filtering recommendation. Intelligent book recommendation.

0 引 言

隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,數(shù)字圖書館的信息量日益增多,瀏覽大量無關(guān)的圖書信息會(huì)使讀者浪費(fèi)大量的時(shí)間,并導(dǎo)致信息過載現(xiàn)象 [1]。為了適應(yīng)圖書館館藏?cái)?shù)量快速增長的實(shí)際情況,便于用戶快速準(zhǔn)確獲取所需館藏資源,個(gè)性化推薦服務(wù)應(yīng)運(yùn)而生。在圖書館個(gè)性化推薦服務(wù)所使用的技術(shù)中,協(xié)同過濾推薦方法應(yīng)用最為廣泛,它通過收集眾多類似用戶的興趣來預(yù)測用戶的評分,該方法基于的假設(shè)是過去有類似興趣的用戶在未來可能有共同的興趣[2-3]。協(xié)同過濾最廣泛的處理方式是基于目標(biāo)用戶最近鄰方法進(jìn)行實(shí)現(xiàn),它依賴于用戶之間的相似性,選擇最相似的用戶作為目標(biāo)用戶的最近鄰,然后使用最近鄰的項(xiàng)目評分來預(yù)測目標(biāo)用戶的項(xiàng)目評分[4],而對于用戶隨著時(shí)間變化對于項(xiàng)目評分的序列很少被研究,因此本文將評分序列作為研究重點(diǎn)。

1 相關(guān)研究

協(xié)同信息推薦系統(tǒng)逐漸被應(yīng)用到數(shù)字圖書館中,并成為該領(lǐng)域的主要研究主題之一[3]。董坤提出構(gòu)建基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng),該方法通過引入讀者專業(yè)、角色、學(xué)歷、借閱記錄等影響和反映讀者信息需求的因素構(gòu)建讀者特征模型,基于該模型采用優(yōu)化的協(xié)同過濾算法挖掘讀者信息需求,并產(chǎn)生個(gè)性化圖書推薦信息[5]。林曉霞等在研究傳統(tǒng)協(xié)同過濾算法的基礎(chǔ)上,首先利用借閱記錄中的數(shù)據(jù)構(gòu)建評分矩陣,然后融合信任相似度對用戶相似度進(jìn)行改進(jìn),同時(shí)引入對新生、新書推薦的解決方法,并對圖書館借閱數(shù)據(jù)集進(jìn)行對比實(shí)驗(yàn)[6]。宋楚平提出一種協(xié)同過濾改進(jìn)方法,以圖書分類為圖書生成用戶評價(jià)矩陣,并考慮借閱方式、借閱時(shí)間和圖書相似度對用戶興趣度的影響,優(yōu)化矩陣中的樣本數(shù)據(jù);同時(shí),在計(jì)算讀者相似度時(shí)融入讀者特征和圖書特征[7]。

對相關(guān)研究的分析中可以發(fā)現(xiàn),實(shí)現(xiàn)圖書推薦服務(wù)相似性度量是首要工作,最常用的相似性度量方法包括皮爾遜相關(guān)系數(shù)、余弦相似性和改進(jìn)余弦相似性等[8]。但是,現(xiàn)有的基于協(xié)同過濾的圖書推薦方法忽略了用戶對于所評分圖書的順序,而用戶所借閱圖書的評分序列對于提高推薦準(zhǔn)確度至關(guān)重要,這是由于用戶各自的特征會(huì)導(dǎo)致每個(gè)用戶產(chǎn)生獨(dú)特的項(xiàng)目評分序列,此外評分序列可以反映用戶興趣和偏好的變化,這在一定程度上可以揭示用戶興趣偏好的潛在信息。因此,基于協(xié)同過濾的圖書推薦中,用戶對于所借閱圖書的興趣序列比單個(gè)項(xiàng)目評分包含更多的語義,這些語義可以用來分析用戶真實(shí)的動(dòng)態(tài)興趣演化模式。這些動(dòng)態(tài)興趣過程可以通過用戶行為序列來表示。以此為基礎(chǔ)本文設(shè)計(jì)了基于用戶興趣序列的用戶相似性度量方法以及目標(biāo)用戶所感興趣圖書的評分預(yù)測方法。

2 基于興趣序列相似性度量的協(xié)同過濾推薦

2.1 相關(guān)定義

時(shí)間序列數(shù)據(jù)大量存在于現(xiàn)實(shí)世界中,主要應(yīng)用于生物信息學(xué)、Web挖掘和文本挖掘等[9]。由于連續(xù)的時(shí)間序列數(shù)據(jù)的特點(diǎn)和時(shí)間,最長公共子序列的長度(LCS)是最常用的測量兩時(shí)間序列之間距離的指標(biāo)[10]。協(xié)同過濾方法可以使用最長公共子序列為序列之間相似性的度量指標(biāo)[11],但該方法忽略了其他較短公共子序列中所共有的信息,因此需要引入全部公共子序列的數(shù)量來提高序列之間相似性度量的效果。

本文提出的推薦方法是基于用戶借閱圖書的興趣序列,根據(jù)用戶借閱圖書的時(shí)間順序考慮用戶的圖書借閱行為序列。首先對所提出的推薦方法涉及的相關(guān)概念進(jìn)行詳細(xì)說明。對用戶的圖書借閱行為可以通過函數(shù)形式表示,表明用戶對于圖書的興趣。令U={u1,u2,……,un}表示用戶集合,I={it1, it2,……,itn}表示圖書集合,Ts={ts1, ts2,……, tsn}表示用戶借閱圖書的時(shí)間節(jié)點(diǎn)。為了便于描述基于興趣序列的推薦方法,進(jìn)行如下相關(guān)概念的定義。

定義1:興趣點(diǎn)(Interest Point,記為IP) 代表用戶某一時(shí)間節(jié)點(diǎn)上對某本圖書的借閱行為,它由用戶、圖書、評分和時(shí)間節(jié)點(diǎn)組成,記為:

其中,用戶u在時(shí)間節(jié)點(diǎn)tsi借閱圖書iti后歸還,產(chǎn)生對該圖書的評分值,記為。

定義2:興趣序列(Interest Sequence,記為IS)是根據(jù)用戶的借閱圖書時(shí)間序列來表示該用戶一系列興趣點(diǎn)序列,記為:

其中,ts1

基于上述定義,我們可以將所有用戶對所借閱圖書的評分?jǐn)?shù)據(jù)轉(zhuǎn)化為興趣序列。與現(xiàn)有推薦方法不同,本文利用用戶行為分析的方法,分析用戶的獨(dú)特偏好,因?yàn)樗哂斜葐为?dú)用戶的項(xiàng)目評分更深的語義,不僅能揭示用戶的動(dòng)態(tài)興趣,而且能顯示其演化模式。為了計(jì)算用戶之間的相似性,使用最長公共子序列的長度和全部公共子序列的數(shù)量,為此進(jìn)行如下定義。

定義3:興趣序列匹配(Interest Sequence Match,記為ISM)給定一個(gè)用戶評分偏差約束閾值θ,以及兩個(gè)不同用戶的興趣序列中isu、isv的子序列:

當(dāng)且僅當(dāng)(1);(2)時(shí),兩個(gè)子序列形成長度為j的興趣序列匹配。

在上述定義中,函數(shù)用來計(jì)算用戶u和用戶v借閱同一本圖書i產(chǎn)生的評分時(shí),評分之間的偏差,記為:

鑒于不同用戶對于所借閱圖書評分尺度的多樣性,即不同用戶對于所借閱的相同圖書因滿足其個(gè)人需要的程度不同,導(dǎo)致借閱時(shí)長的差距明顯,進(jìn)而導(dǎo)致評分存在明顯差異。因此,所有用戶對于所借閱圖書的評分值應(yīng)規(guī)范為相同取值區(qū)間,即[0,1]。如果他們的評分偏差小于偏差約束閾值θ,兩用戶評分可以考慮相同。閾值θ取值設(shè)定越小意味著相似性約束越嚴(yán)格,但過于嚴(yán)格的相似性約束將限制推薦的效果。因此,應(yīng)該根據(jù)具體的應(yīng)用環(huán)境確定合理的閾值。

定義4:最長公共興趣子序列(Longest Common Sub-IS,記為LCSIS)。兩個(gè)興趣序列之間的興趣序列匹配形成的公共興趣子序列,當(dāng)且僅當(dāng)兩個(gè)興趣序列之間沒有其他更長的興趣序列匹配時(shí),才是最長的公共興趣子序列。

定義5:全部公共興趣子序列(All Common Sub-IS,記為ACSIS)。計(jì)算兩個(gè)興趣序列的所有興趣序列匹配的數(shù)量,其中包括空興趣序列匹配。

通過定義4和定義5可知,當(dāng)兩用戶的興趣序列之間具有更長的LCSIS和更多的ACSIS數(shù)量時(shí),表明這兩個(gè)用戶的相似程度較高。

2.2 基于LCSIS和ACSIS的用戶相似性度量

本文從用戶興趣序列的角度出發(fā)計(jì)算用戶之間的相似度。正如上節(jié)的相關(guān)定義,用戶興趣序列使用所借閱的圖書及其評分組成的時(shí)間序列數(shù)據(jù),按照時(shí)間順序排序,并以索引指示各個(gè)興趣點(diǎn)在序列中的位置。最長興趣子序列是度量時(shí)間序列數(shù)據(jù)之間相似性的重要指標(biāo)。此外,當(dāng)兩個(gè)用戶興趣序列之間存在較長的最長公共子序列和較多的全部公共興趣子序列數(shù)量時(shí),用戶之間興趣偏好的相似程度較高。

分別從用戶u和v的歷史評分記錄中獲取兩個(gè)用戶的興趣序列,分別記為:isu和isv,isu長度為m,isv長度為n,令ω為(m+1)×(n+1)階矩陣。用戶u和v興趣序列之間的最長公共興趣子序列記為:lcsis(u,v),其長度計(jì)算方法如下:

當(dāng)0≤i≤m且0≤i≤n時(shí),則|lcsis(u,v)|=ω[m,n]

示例1:如表1所示,給定用戶u和v對于所借閱圖書集合Item={圖書1,圖書2,圖書3,圖書4}的評分形成的興趣序列isu和isv,令max(ruit)=max(rυit)=5.0且min(ruit)=min(rυit)=0,此外設(shè)定閾值θ=0.2,則興趣序列isu和isv間的最長公共興趣子序列為{圖書1→圖書4,圖書3→圖書4},且|lcsis|=2。

表1 用戶u和v借閱圖書評分序列

t1 t2 t3 t4

isu (圖書1,2.5) (圖書3,3.0) (圖書2,4.5) (圖書4,0.5)

isv (圖書3,4.0) (圖書2,2.5) (圖書1,3.5) (圖書4,1.5)

|lcsis|的計(jì)算過程如下所示:

興趣序列isu和isv間的全部公共興趣子序列的數(shù)量記為|acsis(u,v)|,其計(jì)算公式如下所示:

當(dāng)0≤i≤m且0≤i≤n時(shí),則|acsis(u, v)|=ω[m,n]

在最長公共興趣子序列和全部公共興趣子序列長度的計(jì)算方法中均考慮兩個(gè)用戶評分匹配項(xiàng)的偏差。函數(shù)用于獲取當(dāng)且時(shí),用戶v的興趣序列isv中的興趣點(diǎn)所在的位置x,該函數(shù)如下所示:

示例2:考慮示例1中用戶u和v的興趣序列isu和isv,這兩個(gè)序列間全部公共子序列集合為{ 圖書1, 圖書3, 圖書1→圖書4,圖書3→圖書4},則兩個(gè)興趣序列間全部公共子序列數(shù)量即|acsis(u,v)|=6,計(jì)算過程如下所示:

|acsis(u,v)| =ω[4,4]

=ω[3,4]+ω[3,4-1]

=ω[2,4]+ω[3,3]

=ω[1,4]+ω[1,1-1]+ω[3,3]

=ω[0,4]+ω[0,3-1]+1+ω[3,3]

=1+1+1+ω[2,3]

=3+ω[1,3]+ω[1,1-1]

=3+ω[0,3]+ω[0,3-1]+1

=4+1+1

=6

為了比較兩個(gè)用戶興趣序列的相似性,將|lcsis(u,v)|和|acsis(u,v)|分別進(jìn)行歸一化,如下所示:

然后,引入調(diào)節(jié)因子α將上述兩個(gè)公式進(jìn)行組合形成基于LCSIS和ACSIS的用戶相似性度量方法,如公式(1) 所示:

公式(1)

其中調(diào)節(jié)因子α取值范圍為[0,1],α和1-α分別表示LCSIS和ACSIS在度量方法中的各自權(quán)重,其取值的設(shè)定根據(jù)具體的應(yīng)用環(huán)境而定。

2.3 建立評分矩陣

電商網(wǎng)站中用戶對于購買過的商品會(huì)做出評價(jià),以此作為對該商品的評分。圖書館圖書借閱場景中很難獲得用戶對于所借閱圖書的評分,因此用戶對于圖書的評分可以通過多種因素綜合而成,其中包括以下三個(gè)方面:借閱時(shí)長、借閱形式及用戶類型。

2.3.1 借閱時(shí)長

借閱時(shí)長能夠反映出用戶對于所借閱圖書的偏好程度,借閱時(shí)長與偏好呈正相關(guān)關(guān)系,本文中的圖書借閱時(shí)長以“天”為計(jì)算單位。tui表示用戶u對圖書i的借閱天數(shù),tmin(i)表示圖書i被借閱的最短天數(shù),tmax(i)表示圖書i被借閱的最長時(shí)間,用戶u對圖書i的借閱時(shí)長經(jīng)規(guī)范化處理后記為:

2.3.2 用戶類型

圖書館特別是高校圖書館針對不同的用戶類型賦予不同的圖書借閱時(shí)長,不同類型用戶的圖書借閱時(shí)長分別記為{d1,d2,…dn},取圖書借閱時(shí)長最短的用戶類型記為dmin=min{d1,d2,…dn},以d1t(t=1…n)表示用戶類型t的借閱因子為。

2.3.3 借閱形式

如果用戶對于某本圖書進(jìn)行預(yù)約,表明該用戶對于圖書有一定了解,存在一定的興趣度。相比于預(yù)約,初次借閱圖書存在一定的盲目性,而續(xù)借圖書表明用戶在初次借閱后產(chǎn)生興趣。因此對于這三種不同的借閱形式賦予不同的權(quán)重值,故用戶u對于圖書i的借閱形式系數(shù)記為buj,其計(jì)算公式如下:

因此,綜合借閱時(shí)長、借閱形式以及用戶類型三個(gè)因素,可以得到用戶u借閱圖書i歸還后產(chǎn)生評分,得到用戶-圖書評分矩陣:

2.4 基于興趣序列相似性度量的評分預(yù)測

將基于興趣序列的相似性度量與現(xiàn)有協(xié)同過濾推薦算法中的傳統(tǒng)相似性度量相結(jié)合,引入皮爾遜相似性計(jì)算方法可以進(jìn)一步改進(jìn)推薦效果,因此基于用戶興趣序列相似性的度量方法如公式(2)所示:

公式(2)

其中pc(u,v)為通過皮爾遜相關(guān)系數(shù)利用用戶評分計(jì)算用戶之間的相似性,其計(jì)算公式如公式(3) 所示:

公式(3)

fIS(u,v)為權(quán)重函數(shù),用于反映用戶興趣序列對用戶相似性的影響,其計(jì)算公式如公式(4) 所示:

公式(4)

其中,common(u,v)表示用戶u和v共同借閱的圖書數(shù)量,total(u,v)表示用戶u和v二者分別借閱的圖書總和,SimIS(u,v)表示公式(1)所示的基于LCSIS和ACSIS的用戶相似性度量方法。

在計(jì)算用戶相似性之后,對借閱過所要推薦圖書的用戶進(jìn)行排序,排序規(guī)則為這些用戶與目標(biāo)用戶之間的相似性降序排列,選擇排序最高的K個(gè)用戶作為目標(biāo)用戶的最近鄰。對于目標(biāo)用戶u,令作為推薦系統(tǒng)需要給目標(biāo)用戶提供預(yù)測評分的圖書集合,令為借閱過所要推薦圖書的目標(biāo)用戶u最近鄰集合,評分預(yù)測公式如公式(5)所示:

公式(5)

3 實(shí)驗(yàn)對比與分析

為了驗(yàn)證本文所提出的方法的有效性,需要通過數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,并將結(jié)果與其它的推薦方法在評估指標(biāo)上進(jìn)行性能比對。此外,通過實(shí)驗(yàn)驗(yàn)證用戶之間評分偏離約束閾值θ,以及基于最長共同興趣子序列(LCSIS)和所有公共子序列(ACSIS)進(jìn)行相似性度量中的權(quán)重調(diào)節(jié)因子α對于用戶相似性度量結(jié)果的影響。

3.1 數(shù)據(jù)準(zhǔn)備

本文在對比實(shí)驗(yàn)中使用本校圖書館2018年度1月至8月的圖書借閱數(shù)據(jù)作為實(shí)驗(yàn)對象,圖書借閱量共計(jì)11273條,涉及中外文圖書共計(jì)3275種。本校圖書館的用戶分為三種類型,分別為本科生、研究生以及教職工,對應(yīng)的圖書借閱時(shí)間(天)為{30,45,60}。根據(jù)建立評分矩陣中的方法,計(jì)算得到用戶對于所借閱圖書的評分?jǐn)?shù)據(jù)。實(shí)驗(yàn)將數(shù)據(jù)集分割為訓(xùn)練集(80%)和測試集(20%)。此外,為了便于實(shí)驗(yàn)比對,將本文提出方法中用戶之間評分偏離約束閾值θ設(shè)置為0.8,最長共同興趣子序列(LCSIS)和所有公共子序列(ACSIS)進(jìn)行相似性度量中的權(quán)重調(diào)節(jié)因子α設(shè)置為0.5。

3.2 評價(jià)標(biāo)準(zhǔn)

為了驗(yàn)證實(shí)驗(yàn)效果,本文在對比實(shí)驗(yàn)中采用均方根誤差(RMSE)和平均絕對誤差(MAE)來驗(yàn)證兩種推薦方法的推薦質(zhì)量[12],其計(jì)算公式如下:

其中,u∈Users表示目標(biāo)用戶,i∈upred表示目標(biāo)用戶的未評分項(xiàng)目,表示目標(biāo)用戶對于項(xiàng)目的實(shí)際評分,表示目標(biāo)用戶對于項(xiàng)目的預(yù)測評分,表示目標(biāo)用戶未評分項(xiàng)目的數(shù)量。因此,可知RMSE和MAE值越低表明推薦效果越精確。

3.3 對比分析

為了驗(yàn)證本文所提出方法的性能和有效性,將該方法與傳統(tǒng)的基于用戶的協(xié)同過濾推薦方法和基于用戶動(dòng)態(tài)信息的推薦方法進(jìn)行比較。文獻(xiàn)[13]所提出的基于用戶的協(xié)同過濾推薦方法(記為User-Based) 是利用用戶的評分歷史計(jì)算用戶之間的相似度,然后結(jié)合相似度度量結(jié)果以及目標(biāo)用戶最近鄰的評分進(jìn)行評分預(yù)測。文獻(xiàn)[14]考慮用戶興趣的動(dòng)態(tài)變化,通過引入時(shí)間遞減函數(shù)來模擬用戶的動(dòng)態(tài)興趣特征實(shí)現(xiàn)對目標(biāo)用戶的推薦,該方法記為Interest-Based。

3.3.1 RMSE和MAE結(jié)果對比

將User-Based、Interest-Based及本文方法在借還書記錄數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果進(jìn)行比較,并將最近鄰K值設(shè)置為{10,20,30,40,50,60,70,80}。MAE和RMSE實(shí)驗(yàn)對比結(jié)果分別如圖1和圖2所示。

通過實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),三種方法中User-Based推薦精度最差,本文提出方法的推薦精度最高。當(dāng)K=10時(shí),三種方法的推薦精度均最低,隨著K取值提高,三種方法的推薦精度逐步提高。其中,K提高至20時(shí)推薦精度提高程度最大。當(dāng)K=30時(shí),本文所提出方法的推薦精度達(dá)到最高;當(dāng)K>30時(shí),其他兩種方法推薦精度提升程度降低,且隨著K取值增大,推薦精度保持平穩(wěn);而本文所提出的方法在K>30情況下,推薦精度略微下降,這種情況說明最近鄰數(shù)量的提高對于本文所提出的方法有著細(xì)微的影響,但總體的推薦精度仍然優(yōu)于另兩種方法。

3.3.2 參數(shù)θ和α對相似性度量結(jié)果的影響

為了評估最長公共子序列和所有共同興趣子序列對推薦結(jié)果的影響,在該部分實(shí)驗(yàn)中為評分偏離約束閾值θ,以及基于最長共同感興趣子序列(LCSIS)和全部公共子序列(ACSIS)進(jìn)行相似性度量中的權(quán)重調(diào)節(jié)因子α設(shè)置不同的取值。其中,θ取值為{0.2,0.5,0.8}分別表示用戶之間評分的偏差弱、中、強(qiáng)約束,同時(shí)將α取值設(shè)置為{0.2,0.5,0.8},表示在進(jìn)行用戶相似性計(jì)算時(shí),LCSIS和ACSIS各自所占權(quán)重。預(yù)期結(jié)果應(yīng)該是隨著θ和α取值不同會(huì)導(dǎo)致不同的相似性度量結(jié)果,但是通過實(shí)際的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),推薦精度幾乎保持不變。其原因在于,用戶對于項(xiàng)目的評分歷史具有較高的稀疏性。因此,最長公共子序列的長度和全部公共子序列的數(shù)量不會(huì)隨著θ和α取值發(fā)生顯著變化。

4 結(jié)語

傳統(tǒng)的基于協(xié)同過濾技術(shù)的圖書推薦方法中通常關(guān)注于用戶對于所借閱圖書的靜態(tài)評分,而忽略了用戶隨著時(shí)間變化對于所借閱圖書評分順序。但是,用戶對于所借閱圖書的評分序列可以反映用戶興趣和偏好的變化,用戶興趣序列可以揭示用戶興趣偏好的潛在信息。針對這一問題,本文首先引入最長興趣子序列和全部興趣子序列這兩項(xiàng)指標(biāo),并給出了指標(biāo)的規(guī)范化定義。其次,將這兩項(xiàng)指標(biāo)應(yīng)用于用戶之間興趣序列相似性度量,結(jié)合基礎(chǔ)與傳統(tǒng)的協(xié)同過濾推薦方法產(chǎn)生目標(biāo)用戶所感興趣圖書的評分預(yù)測。最后,將本文提出的方法與其他兩種推薦方法在本校圖書館圖書借閱數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證,通過對比實(shí)驗(yàn)驗(yàn)證引入用戶興趣序列在提高推薦精度方面的有效性。

參考文獻(xiàn):

[1] 朱白.數(shù)字圖書館推薦系統(tǒng)協(xié)同過濾算法改進(jìn)及實(shí)證分析[J].圖書情報(bào)工作,2017,61(9):130-134.

[2] 鄧愛林,朱揚(yáng)勇,施伯樂.基于項(xiàng)目評分預(yù)測的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003(9):1621-1628.

[3] 吳志強(qiáng),馬慧娟.協(xié)同信息推薦技術(shù)及其在數(shù)字圖書館中的應(yīng)用研究述評[J].圖書情報(bào)工作,2012,56(19):122-127.

[4] 榮輝桂,火生旭,胡春華,莫進(jìn)俠.基于用戶相似度的協(xié)同過濾推薦算法[J].通信學(xué)報(bào),2014,35(2):16-24.

[5] 董坤.基于協(xié)同過濾算法的高校圖書館圖書推薦系統(tǒng)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2011(11):44-47.

[6] 林曉霞,劉敏,楊曉東,徐堯.融合信任相似度的高校圖書館個(gè)性化推薦研究[J].數(shù)字圖書館論壇,2018(8):14-19.

[7] 宋楚平.一種改進(jìn)的協(xié)同過濾方法在高校圖書館圖書推薦中的應(yīng)用[J].圖書情報(bào)工作,2016,60(24):86-91.

[8] Lu Z, Dou Z, Lian J, et al. Content-Based Collaborative Filtering for News Topic Recommendation[C].In: Procedings of the twenty-Ninth AAAI Conference on Artificial Intelligence. Austin Texas, USA, 2015:217–223.

[9] ?Deorowicz S, Obstoj J. Constrained Longest Common Subsequence Computing Algorithms in Practice[J]. Computing & Informatics, 2010, 29(3):427-445.

[10] 李曉靜,張曉濱.基于LCS的用戶時(shí)空行為興趣相似性計(jì)算方法[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(20):251-254.

[11] 汪彥紅,楊波,胡玉鵬.個(gè)性化推薦推薦系統(tǒng)中基于WEB的挖掘[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2011,20(10):67-70,119.

[12] 于金明,孟軍,吳秋峰.基于改進(jìn)相似性度量的項(xiàng)目協(xié)同過濾推薦算法[J].計(jì)算機(jī)應(yīng)用,2017,37(5):1387-1391,1406.

[13] Su X, Khoshgoftaar T M. A Survey of Collaborative Filtering Techniques[M]. Hindawi Publishing Corp. 2009.

[14] Cheng J, Liu Y, Zhang H, et al. A New Recommendation Algorithm Based on Users Dynamic Information in Complex Social Network[J]. Mathematical Problems in Engineering,2015,(2015-3-29), 2015, 2015(9):1-6.

民乐县| 芜湖市| 大悟县| 乐昌市| 合川市| 周口市| 林口县| 仲巴县| 汶上县| 永德县| 庆元县| 陆丰市| 昌吉市| 卢龙县| 恩施市| 汉寿县| 福泉市| 太白县| 车险| 潜山县| 崇明县| 新田县| 连云港市| 广饶县| 霞浦县| 抚顺市| 大埔区| 永宁县| 资中县| 安吉县| 凤山市| 湘阴县| 姜堰市| 屯留县| 渝北区| 彩票| 信丰县| 探索| 昌黎县| 开原市| 赣榆县|