国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

圖書(shū)推薦算法綜述

2017-01-14 21:05傅漢霖顧小宇
計(jì)算機(jī)時(shí)代 2016年12期
關(guān)鍵詞:協(xié)同過(guò)濾綜述

傅漢霖++顧小宇

摘 要: 圖書(shū)館的信息庫(kù)中保存著大量的讀者檢索信息和借閱記錄,充分利用這些信息并結(jié)合高效的圖書(shū)推薦算法可以充分地滿足讀者的借閱需求。綜述了目前常用的圖書(shū)推薦算法的思想、特點(diǎn)及應(yīng)用,根據(jù)對(duì)圖書(shū)館的適用性分析了各推薦算法的優(yōu)缺點(diǎn),并提出了將適用性廣泛的協(xié)同過(guò)濾算法推廣為多特征的混合推薦算法策略的研究方向。

關(guān)鍵詞: 圖書(shū)推薦算法; 協(xié)同過(guò)濾; 多特征; 綜述

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2016)12-21-03

Abstract: There are a lot of readers' retrieval information and borrowing records in the library information database, to fully utilize the information and combine with the high efficient books recommendation algorithm can fully meet the needs of readers. This paper reviews the thoughts, characteristics and application of the current commonly used books recommendation algorithms, according to the applicability of the library, analyzes the advantages and disadvantages of each recommendation algorithm, and proposes a research direction to extend the collaborative filtering algorithm to the multi-feature mixed books recommendation algorithm.

Key words: books recommendation algorithm; collaborative filtering; multi-feature; summary

0 引言

在每座圖書(shū)館的數(shù)據(jù)庫(kù)中都保存著大量的讀者檢索信息和借閱記錄,這些信息蘊(yùn)含著讀者對(duì)館藏圖書(shū)資源的需求,使用相關(guān)推薦算法可以對(duì)數(shù)據(jù)庫(kù)中所保存的讀者檢索信息和借閱記錄進(jìn)行歸納和整理,有助于圖書(shū)館進(jìn)一步對(duì)館藏資源的優(yōu)化,預(yù)測(cè)讀者對(duì)圖書(shū)信息的潛在需求,也有助于圖書(shū)館個(gè)性化服務(wù)的智能化。本文參考了國(guó)內(nèi)外關(guān)于圖書(shū)推薦算法的相關(guān)文獻(xiàn),從多角度探討了現(xiàn)有算法的核心思想,以推動(dòng)圖書(shū)館相關(guān)推薦算法的深入研究。

1 推薦算法綜述

1.1 基于密度的協(xié)同過(guò)濾算法

該算法的核心思想是:根據(jù)圖書(shū)的歸還時(shí)間,利用模糊理論的隸屬函數(shù)來(lái)計(jì)算讀者對(duì)圖書(shū)的興趣程度,并篩除讀者不感興趣的借閱記錄。讀者借閱的圖書(shū)信息可以反映其偏好的圖書(shū)類別;讀者歸還已借閱圖書(shū)的時(shí)間可以反映讀者對(duì)該書(shū)的興趣;讀者對(duì)續(xù)借的書(shū)一定是感興趣的。

1.1.1 圖書(shū)歸還

圖書(shū)歸還時(shí)間可以反映讀者對(duì)所借閱圖書(shū)的偏好程度。如果剛借圖書(shū)就立即歸還,說(shuō)明讀者對(duì)該書(shū)不感興趣;如果圖書(shū)被續(xù)借,則表明對(duì)該圖書(shū)感興趣。

定義圖書(shū)歸還集:。

其中,分別為讀者對(duì)某冊(cè)圖書(shū)的借閱時(shí)間和歸還時(shí)間,T為圖書(shū)借閱規(guī)定還書(shū)周期。

1.1.2 模糊值函數(shù)定義

用隸屬函數(shù)ulike和udislike分別表示對(duì)圖書(shū)感興趣與不感興趣的模糊程度,flike(ri)為讀者基于圖書(shū)歸還的感興趣與不感興趣的模糊值。

其中,a和c是隸屬函數(shù)ulike和udislike的界定參數(shù)值。圖書(shū)的歸還時(shí)間區(qū)域ra-rmin用來(lái)篩選出不感興趣的書(shū)目,歸還時(shí)間區(qū)域rmax-rc篩選出感興趣的書(shū)目。如果借閱時(shí)間超過(guò)規(guī)定的歸還周期,則該圖書(shū)的借閱時(shí)間信息無(wú)效。

1.1.3 推薦估值

讀者借閱記錄的聚類區(qū)域反映了讀者對(duì)圖書(shū)的興趣特征,采用距離平方反比進(jìn)行推薦:距離越近者,權(quán)重值越大。根據(jù)距離點(diǎn)q0的最近質(zhì)心所屬的聚類區(qū)域,點(diǎn)q0的推薦估值定義為

其中,αCR(i)為點(diǎn)q0最近聚類區(qū)域的區(qū)域權(quán)重;權(quán)重,為點(diǎn)q0聚類區(qū)域中離點(diǎn)q0最近x個(gè)點(diǎn)的歐式距離[1]。

1.2 基于中圖分類法的推薦算法

該算法的核心思想是:根據(jù)中圖分類法和圖書(shū)的特征向量計(jì)算圖書(shū)的相似性,依據(jù)讀者的特征向量和借閱記錄計(jì)算讀者的相似性,對(duì)其進(jìn)行加權(quán),產(chǎn)生最終推薦結(jié)果。

1.2.1 基于中圖分類號(hào)的圖書(shū)相似性

中國(guó)圖書(shū)館分類法,簡(jiǎn)稱中圖分類法,具有從總到分、從一般到具體的特點(diǎn)。采用漢語(yǔ)拼音字母與阿拉伯?dāng)?shù)字相結(jié)合的混合號(hào)碼[2]。中圖分類法把屬于相同學(xué)科、具有相同主題的圖書(shū)歸為一個(gè)類。依次歸類后,相似度最高的圖書(shū)的分類號(hào)處于中途分類樹(shù)的底層。

所以如果要比較兩本圖書(shū)的相似性,應(yīng)先比較中圖分類號(hào)最左邊的字母。字母相同時(shí),比較字母后的第一位數(shù)字,若相同,則比較第二位數(shù)字,以此類推。可構(gòu)建目標(biāo)讀者r未外借圖書(shū)i與已外借圖書(shū)j基于中圖分類號(hào)特征向量的相似度simL(i,j):

其中,Layer(i,j)為圖書(shū)i的分類號(hào)c(i)與圖書(shū)j的分類號(hào)c(j)在中圖分類樹(shù)中最近的父節(jié)點(diǎn)所在的層數(shù);Layer(all)為中圖分類樹(shù)的總層數(shù)。

1.2.2 圖書(shū)的受歡迎程度

設(shè)頁(yè)數(shù)為Page(i)的圖書(shū)j的所有讀者集合為

R(all),讀者r'∈R(all),外借的日期為Borrowdate(r',i)和Returndate(r',i),圖書(shū)j基于頁(yè)數(shù)特征向量的外借與歸還時(shí)間間隔為:

所有借閱過(guò)該圖書(shū)的讀者,平均每次從外借到歸還圖書(shū)的時(shí)間間隔為Ainterval(i)。

設(shè)圖書(shū)j入庫(kù)的日期為Indate(i),當(dāng)前日期為Nowdate,Borrow(i)為該圖書(shū)在時(shí)間段Nowdate-Indate(i)內(nèi)被借閱的總次數(shù)。圖書(shū)j在某時(shí)間段內(nèi)平均被借閱次數(shù)ABorrow(i)。當(dāng)前日期與出版日期之差的倒數(shù)衡量圖書(shū)j的新舊程度New(i),New(i)的值越大,表明圖書(shū)i越新。

綜上所述,可得出圖書(shū)j受廣大讀者的歡迎程度Welcome(i)為:

其中,α、β、分別為該方程的系數(shù)[3]。

1.3 基于主題模型的推薦算法

該算法的核心思想是:通過(guò)對(duì)讀者的歷史借閱記錄與其他圖書(shū)數(shù)據(jù)進(jìn)行相似度分析,得到與讀者歷史借閱圖書(shū)相似度較高的圖書(shū);通過(guò)對(duì)讀者的歷史借閱記錄與其他讀者的歷史借閱記錄進(jìn)行相似度分析,得到最近鄰讀者的歷史借閱記錄。通過(guò)求解圖書(shū)被推薦的概率,最終得到讀者潛在感興趣的圖書(shū)。

1.3.1 圖書(shū)內(nèi)容相似度

讀者的歷史借閱圖書(shū)類別的集合G=(g1,g2,…,gi,…,gI)及每一類所對(duì)應(yīng)的關(guān)鍵詞集合J=(j1,j2,…,ji,…,jI),其中ji=(m1,m2,…,mv)。對(duì)于一本非目標(biāo)讀者借閱過(guò)的圖書(shū),可以根據(jù)圖書(shū)對(duì)應(yīng)的關(guān)鍵詞集合與目標(biāo)讀者歷史借閱記錄中各類別的圖書(shū)關(guān)鍵詞進(jìn)行相似度分析,得到:

其中,vi為目標(biāo)讀者歷史借閱圖書(shū)類別i的關(guān)鍵詞個(gè)數(shù)。

由此可知,sim1的值大則相似度越大,此圖書(shū)被推薦的可能性也越大。取d0=1,若nk=mi(即此圖書(shū)的關(guān)鍵詞與目標(biāo)讀者的歷史借閱記錄中某一類圖書(shū)的關(guān)鍵詞匹配),則dr取值為1,否則取值為0。

1.3.2 最近鄰借閱者

通過(guò)其他借閱者的歷史借閱記錄,可能從中挖掘出目標(biāo)借閱者新的感興趣的圖書(shū)。設(shè)有矩陣U(n,m)表示有n個(gè)目標(biāo)讀者與最近鄰借閱者集合P=(p1,p2,…,pn)及m個(gè)圖書(shū)集合Q=(q1,q2,…,qn)的評(píng)分矩陣,利用余弦相似度計(jì)算公式計(jì)算與讀者相似程度較高的其他讀者作為目標(biāo)讀者的最近鄰。相似度計(jì)算公式如下:

其中,Q1,2表示兩個(gè)讀者p1,p2具有共同評(píng)分的圖書(shū),Q1為讀者p1有過(guò)評(píng)分的圖書(shū),Q2為讀者p2有過(guò)評(píng)分的圖書(shū),Up,q表示讀者p1對(duì)圖書(shū)q的評(píng)分。與分別表示讀者p1,p2對(duì)圖書(shū)的平均評(píng)分。評(píng)分Up,q的計(jì)算公式如下:

其中,tq為讀者所花時(shí)間,Tmin為統(tǒng)計(jì)開(kāi)始時(shí)刻,Tmax為統(tǒng)計(jì)結(jié)束時(shí)刻[4]。

2 結(jié)束語(yǔ)

基于內(nèi)容相似度的推薦算法的推薦結(jié)果直觀,但面對(duì)新用戶和復(fù)雜情況無(wú)法對(duì)讀者進(jìn)行合適的圖書(shū)推薦;協(xié)同過(guò)濾推薦算法的推薦個(gè)性化和自動(dòng)化程度高[5],但是面對(duì)新用戶、新項(xiàng)目仍無(wú)法進(jìn)行合適的圖書(shū)推薦,對(duì)歷史數(shù)據(jù)質(zhì)量要求較高;基于中圖分類法的推薦算法推薦結(jié)果直觀,但個(gè)性化程度低。

將普通的協(xié)同過(guò)濾算法推廣為多特征推薦算法,在此設(shè)計(jì)一種混合圖書(shū)推薦策略,可以充分利用各種算法的優(yōu)點(diǎn),有關(guān)的研究表明這些混合算法的準(zhǔn)確率要高于單獨(dú)算法[6-7]。在該混合圖書(shū)推薦策略中,若是新用戶,則根據(jù)圖書(shū)受大眾讀者歡迎程度對(duì)用戶進(jìn)行推薦,使得新用戶即使剛使用系統(tǒng),也可以獲得推薦結(jié)果。用戶開(kāi)始借閱和檢索圖書(shū),在數(shù)據(jù)庫(kù)中留下歷史借閱記錄,可以基于中圖分類法對(duì)用戶進(jìn)行相關(guān)書(shū)籍推薦。當(dāng)用戶的歷史借閱記錄達(dá)到一定數(shù)量時(shí),可根據(jù)基于內(nèi)容、最近鄰讀者、密度等算法進(jìn)行有效的推薦。

參考文獻(xiàn)(References):

[1] 武建偉,俞曉紅,陳文清.基于密度的動(dòng)態(tài)協(xié)同過(guò)濾圖書(shū)推薦

算法[J].計(jì)算機(jī)應(yīng)用研究,2010.27(8).

[2] 國(guó)家圖書(shū)館《中國(guó)圖書(shū)館分類書(shū)》編輯委員會(huì).中國(guó)圖書(shū)館分

類法(5版)[M].北京圖書(shū)館出版社,2010.

[3] 李克潮,梁正友.基于多特征的個(gè)性化圖書(shū)推薦算法[J].計(jì)算

機(jī)工程,2012.38(11)

[4] 鄭祥云,陳志剛,黃瑞,李博.基于主題模型的個(gè)性化圖書(shū)推薦

算法[J].計(jì)算機(jī)應(yīng)用,2015.9.

[5] 陳永光.基于OPAC的高校圖書(shū)館個(gè)性化圖書(shū)推薦算法研究[D].

南京理工大學(xué),2013.4.

[6] Soboroff I, Nicholas C. Combining content and

collaboration in text filtering[C].ProcIn'l Joint Conf Artificial Intelligence Work-shop: Machine Learning for Information Filtering, Stockholm,1999:86-91

[7] Tran T, Cohen R. Hybrid recommender systems for

electronic commerce. Proc. Knowledge-Based Electronic Markets[C].the AAAI Workshop. Menlo Park: AAAIPress,2000:78-83

猜你喜歡
協(xié)同過(guò)濾綜述
SEBS改性瀝青綜述
NBA新賽季綜述
近代顯示技術(shù)綜述
基于用戶評(píng)分和項(xiàng)目類偏好的協(xié)同過(guò)濾推薦算法
改進(jìn)的協(xié)同過(guò)濾推薦算法
基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過(guò)濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過(guò)濾推薦算法研究
基于協(xié)同過(guò)濾算法的個(gè)性化圖書(shū)推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評(píng)述
JOURNAL OF FUNCTIONAL POLYMERS
平湖市| 兴隆县| 怀集县| 金昌市| 奉贤区| 凌海市| 香港 | 德州市| 咸阳市| 贺州市| 蒙自县| 宣化县| 黑河市| 崇明县| 太康县| 阿坝县| 六盘水市| 中西区| 广宗县| 古交市| 抚松县| 柳林县| 客服| 东光县| 雷波县| 巫溪县| 贵德县| 濮阳市| 和田市| 江油市| 丰台区| 高唐县| 宁强县| 榆树市| SHOW| 德清县| 鄯善县| 洪泽县| 涟水县| 合肥市| 乌拉特前旗|