柴榮
摘 要:?為了獲得更加理想的圖書館書推薦效果,設(shè)計(jì)了一種圖書館書目協(xié)同智能推薦系統(tǒng)。首先設(shè)計(jì)了圖書館書目協(xié)同智能推薦系統(tǒng)的總體結(jié)構(gòu),然后利用文獻(xiàn)引證關(guān)系度量讀者興趣度量范圍,采用采用協(xié)同過濾算法計(jì)算讀者相似度,獲取與讀者感興趣相似的結(jié)果,最后根據(jù)相似度得到讀者對(duì)每種圖書感興趣的評(píng)價(jià)值,并根據(jù)評(píng)價(jià)值進(jìn)行圖書館書目智能推薦。仿真實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)可以獲得最優(yōu)的推薦圖書館書目,讀者對(duì)圖書館書目推薦結(jié)果的滿意度高。
關(guān)鍵詞:?圖書館書目; 協(xié)同過濾; 智能推薦; 檢索結(jié)果
中圖分類號(hào): G 250? ? ? 文獻(xiàn)標(biāo)志碼: A
Design and Implementation of Library Bibliographic Collaborative Intelligent Recommendation System
CHAI Rong
(Library, Xi'an Aviation Vocational and Technical College, Xi'an, Shanxi 710089, China)
Abstract:
In order to get more ideal effect of library book recommendation, a library book collaborative intelligent recommendation system is designed. First, the overall structure of library bibliography collaborative intelligent recommendation system is designed, then the scope of reader's interest measurement is measured by literature citation relationship, the reader's similarity is calculated by collaborative filtering algorithm, and the result being similar to the reader's interest is obtained. Finally, the evaluation value of reader's interest in each kind of book is obtained according to the similarity, and library bibliography intelligence is carried out according to the evaluation value. The simulation results show that the system can get the best library bibliography recommendation, and the readers are satisfied with the result of library bibliography recommendation.
Key words:
library bibliography; collaborative filtering; intelligent recommendation; retrieval results
0 引言
數(shù)字圖書館中包含大量圖書書目,讀者所具有信息獲取能力有限,無法獲取最廣泛的圖書選取途徑,將書目推薦系統(tǒng)應(yīng)用于數(shù)字圖書館管理中,書目推薦系統(tǒng)提供給讀者具有針對(duì)性的書目信息資源,為讀者選取合適圖書提供判斷依據(jù),書目推薦系統(tǒng)可從大量圖書館信息資源中,選取讀者需要信息并展示至讀者,節(jié)省讀者挑選圖書時(shí)間[1-2]。
協(xié)同智能推薦是通過協(xié)同過濾算法推薦讀者所需書目的個(gè)性化推薦方法,協(xié)同智能推薦包括讀者協(xié)同過濾以及物品協(xié)同過濾兩方面,系統(tǒng)可依據(jù)讀者購買以及瀏覽記錄挖掘與之相關(guān)的圖書信息并發(fā)送到讀者界面實(shí)現(xiàn)推薦[3]。協(xié)同推薦是以大數(shù)據(jù)為依托的推薦方式,協(xié)同推薦需要從大量數(shù)據(jù)中挖掘相關(guān)數(shù)據(jù),需要較高的計(jì)算機(jī)存儲(chǔ)能力、計(jì)算能力才可實(shí)現(xiàn)數(shù)據(jù)挖掘,高質(zhì)量計(jì)算機(jī)軟件、硬件背景才可維持圖書館書目協(xié)同智能推薦良好運(yùn)行[4-6]。
協(xié)同推薦已被廣泛應(yīng)用于社交媒體以及電子商務(wù)中,結(jié)合高校圖書館環(huán)境特點(diǎn),設(shè)計(jì)了一種圖書館書目協(xié)同智能推薦系統(tǒng),并對(duì)其性能進(jìn)行了測(cè)試。
1 圖書館書目協(xié)同智能推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
1.1 系統(tǒng)總體設(shè)計(jì)
圖書館書目協(xié)同智能推薦系統(tǒng)總體結(jié)構(gòu)圖,如圖1所示。
通過圖1可以看出,圖書館書目協(xié)同智能推薦系統(tǒng)主要包括書目推薦模塊以及管理模塊兩部分。系統(tǒng)圖書書目信息利用書目推薦模塊展示至讀者閱讀界面,其中書目推薦模塊包括借閱排行榜、精品圖書推薦、相似圖書推薦以及新書推薦四部分,系統(tǒng)通過協(xié)同過濾算法實(shí)現(xiàn)不同類型圖書的推薦,系統(tǒng)可檢索圖書館信息庫全部圖書,便于讀者檢索并閱讀圖書相關(guān)信息;系統(tǒng)管理員利用管理模塊實(shí)現(xiàn)圖書添加、修改以及刪除,并實(shí)時(shí)更新與動(dòng)態(tài)發(fā)布圖書信息[7]。
1.2 書目協(xié)同過濾算法
采用協(xié)同過濾算法實(shí)現(xiàn)書目的智能推薦,先采集讀者感興趣圖書信息資源,并采用有效方法分析所采集資源,獲取讀者興趣偏好,實(shí)現(xiàn)最終智能圖書信息資源推薦,利用所獲取的圖書信息資源尋找潛在讀者[8]。讀者興趣準(zhǔn)確評(píng)價(jià)是書目協(xié)同過濾算法基礎(chǔ),以往通過讀者瀏覽、保存以及打印圖書資源評(píng)價(jià)讀者興趣,評(píng)價(jià)效率較差,無法實(shí)現(xiàn)智能化。利用文獻(xiàn)引證關(guān)系度量讀者對(duì)該圖書的引證文獻(xiàn)以及參考文獻(xiàn)所具有興趣,即讀者興趣度量范圍評(píng)價(jià)[9]。設(shè)x與y分別為讀者以及圖書,則x對(duì)y的偏好程度如式(1)所示。
當(dāng)讀者打印、保存以及收藏圖書以及讀者為圖書信息資源作者(包括曾發(fā)表參考文獻(xiàn)以及引證文獻(xiàn))時(shí),Bxy=1。當(dāng)讀者僅瀏覽圖書并未打印、保存以及引用圖書時(shí),Bxy=0。lxy、σ1以及σ2分別表示讀者瀏覽圖書時(shí)間以及瀏覽時(shí)間長度閾值;讀者瀏覽圖書時(shí)間小于σ2且大于σ1時(shí),表明該讀者對(duì)該圖書感興趣;讀者瀏覽圖書時(shí)間大于σ2時(shí),表明該操作無效;讀者瀏覽圖書時(shí)間小于σ1時(shí),表明該讀者僅經(jīng)過該頁面;Len(i)為圖書長度[10]。
依據(jù)所獲取讀者興趣相似性推薦圖書資源的過程即協(xié)同過濾算法,將與目前讀者相似度較高的其余讀者興趣推薦至目前讀者,即利用目前讀者評(píng)價(jià)圖書感興趣程度以及與其相似讀者評(píng)價(jià)圖書感興趣程度,獲取未評(píng)價(jià)該圖書讀者感興趣程度,并將該圖書推薦至感興趣程度較高讀者。
設(shè)讀者集合X={x1,x2,…,xm}和圖書信息項(xiàng)目集合為:Y={y1,y2,…,yn},Yx表示讀者x已評(píng)價(jià)過興趣的圖書資源集合。利用讀者與圖書組成的資源評(píng)價(jià)矩陣Rm*n生成讀者-資源近鄰居集M。系統(tǒng)利用當(dāng)前讀者xk的歷史記錄評(píng)價(jià)讀者興趣,并計(jì)算與訪問行為較為相近的多讀者形成讀者xk的最近鄰居集,選取讀者xk未瀏覽而鄰居讀者瀏覽的圖書信息資源形成候選推薦集合,獲取推薦集合中讀者xk受圖書資源y的推薦度,讀者xk的top_N即推薦度排名較為靠前的圖書資源。圖書館書目協(xié)同過濾算法步驟如下:
輸入:此時(shí)讀者xk、完成興趣評(píng)價(jià)圖書信息項(xiàng)Yxk、讀者-資源近鄰居集合M;
輸出:此時(shí)讀者M(jìn)的top_N推薦集;
算法過程:
(1) 設(shè)圖書信息項(xiàng)y∈Yxk,從M內(nèi)獲取最近鄰居集Zy={x1,x2,…,xz},將全部最近鄰居集合并獲取集合G={x1,x2,…,xg};
(2) 計(jì)算集合G內(nèi)全部讀者xy與此時(shí)讀者xk的讀者相似度,將相似度結(jié)果較高的讀者建立相似興趣讀者集合Gsim={x1,x2,…,xsim}。選取讀者相關(guān)相似度計(jì)算方法計(jì)算讀者相似度,該方法需要將不同讀者完成評(píng)價(jià)的信息項(xiàng)考慮計(jì)算內(nèi),提升相似度計(jì)算準(zhǔn)確性,相似度計(jì)算式如式(2)所示。
式中,Zxk與jyn分別表示讀者xy與讀者xk間相似度以及讀者y對(duì)圖書資源n興趣評(píng)價(jià)值,jkn、ji與jk分別表示讀者xk和xy分別對(duì)圖書資源n的興趣評(píng)價(jià)均值。
(3) 根據(jù)Gsim對(duì)全部推薦圖書信息項(xiàng)的興趣評(píng)價(jià)值之和,讀者的xk的top_N推薦集即興趣評(píng)價(jià)值之和前N個(gè)。
興趣評(píng)價(jià)值之和計(jì)算式如式(3)所示。
1.3 智能推薦系統(tǒng)的工作流程
圖書館書目協(xié)同智能推薦系統(tǒng)主要工作流程為:讀者輸入檢索詞后,采用協(xié)同過濾算法于圖書館信息庫中檢索,將獲取圖書檢索結(jié)果與讀者感興趣相似圖書結(jié)果形成書目,將推薦書目結(jié)果發(fā)送至讀者顯示界面。系統(tǒng)實(shí)現(xiàn)流程圖,如圖2所示。
系統(tǒng)依據(jù)協(xié)同過濾算法將檢索目標(biāo)圖書與目標(biāo)圖書相似度較高的讀者感興趣書籍集合發(fā)送至讀者界面。系統(tǒng)具有圖書簡(jiǎn)介、相似圖書推薦等功能,實(shí)現(xiàn)圖書館書目推薦的智能化。
2 圖書館書目協(xié)同智能推薦系統(tǒng)性能測(cè)試
選取某高校圖書館作為實(shí)際應(yīng)用環(huán)境,隨機(jī)選取該高校100名學(xué)生作為研究對(duì)象,采用AP、MAP作實(shí)驗(yàn)結(jié)果的評(píng)價(jià)標(biāo),其中系統(tǒng)所推薦與檢索圖書相關(guān)信息越靠前,AP值以及MAP值越高,AP值以及MAP值為1時(shí),表明系統(tǒng)推薦與檢索圖書相關(guān)信息相關(guān)度達(dá)到最高;系統(tǒng)未推薦相關(guān)信息時(shí),AP與MAP值為0。選擇矩陣分解系統(tǒng)和語義填充系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn)。
輸入10個(gè)圖書檢索詞語時(shí),對(duì)不同系統(tǒng)推薦結(jié)果前10本圖書評(píng)價(jià),分析推薦結(jié)果與檢索圖書相關(guān)性,獲取不同系統(tǒng)AP值以及MAP值,對(duì)比結(jié)果如表1所示。
通過表1實(shí)驗(yàn)結(jié)果可以看出,本文系統(tǒng)AP值以及MAP值明顯高于矩陣分解系統(tǒng)以及語義填充系統(tǒng),且本文系統(tǒng)的AP值與MAP值變化較小,實(shí)驗(yàn)結(jié)果說明本文系統(tǒng)推薦效果較好,所推薦圖書與檢索圖書具有較高相似性。
統(tǒng)計(jì)不同系統(tǒng)針對(duì)所檢索10本圖書的書目推薦時(shí)間,對(duì)比結(jié)果如表2所示。
通過表2實(shí)驗(yàn)結(jié)果可以看出,本文系統(tǒng)的圖書書目推薦時(shí)間低于35 ms;而矩陣分解系統(tǒng)、語義填充系統(tǒng)的書目推薦時(shí)間均高于70 ms,這表明本文系統(tǒng)可在較短時(shí)間獲取理想書目推薦結(jié)果,可有效節(jié)省讀者檢索時(shí)間,能夠有效提升數(shù)字化圖書館服務(wù)水平。
統(tǒng)計(jì)不同系統(tǒng)的圖書獲取推薦書目推薦豐富度,結(jié)果如圖3所示。通過圖3可以看出,采用本文系統(tǒng)在10次檢索圖書時(shí),所推薦書目豐富性均高于97%;而采用矩陣分解系統(tǒng)、語義填充系統(tǒng),所推薦書目豐富性僅為84%-93%之間,實(shí)驗(yàn)結(jié)果說明采用本文系統(tǒng)所推薦書目具有極高的豐富性,可滿足不同類型讀者需求。
統(tǒng)計(jì)不同系統(tǒng)的空間開銷,結(jié)果如圖4所示。通過圖4實(shí)驗(yàn)結(jié)果可以看出,本文系統(tǒng)的空間開銷僅為13.5%;矩陣分解系統(tǒng)、語義填充系統(tǒng)的空間開銷高達(dá)22.5%以及22.9%,本文系統(tǒng)的機(jī)運(yùn)行空間開銷明顯低于對(duì)比,空間開銷越低,系統(tǒng)運(yùn)行越快,證本文系統(tǒng)的運(yùn)行效率更高。
選取100名該校學(xué)生,100名學(xué)生分別對(duì)三種系統(tǒng)的滿意度進(jìn)行評(píng)分,結(jié)果如表3所示。通過表3評(píng)分結(jié)果可以看出,學(xué)生對(duì)本文系統(tǒng)平均評(píng)分為4.1分;而對(duì)矩陣分解系統(tǒng)以及語義填充系統(tǒng)平均評(píng)分僅為2.9分以及3.1分,統(tǒng)計(jì)結(jié)果可以看出,本文系統(tǒng)可令讀者獲取較高的滿意度,表明本文方法可有效提升圖書館服務(wù)質(zhì)量,提升讀者滿意度。
3 總結(jié)
隨著大數(shù)據(jù)時(shí)代的到來,計(jì)算機(jī)軟件與硬件基礎(chǔ)不斷提升,為圖書館書目協(xié)同智能推薦提供良好基礎(chǔ)。協(xié)同推薦在社交媒體與電子商務(wù)中已取得巨大成功,將協(xié)同推薦的智能化推薦機(jī)制應(yīng)用于圖書館中,設(shè)計(jì)了一種圖書館書目協(xié)同智能推薦系統(tǒng)現(xiàn),結(jié)果表明,本文系統(tǒng)可以提升圖書館服務(wù)質(zhì)量,改善高校圖書館讀者滿意度。
參考文獻(xiàn)
[1] 程秀峰, 張孜銘, 孟亞琪, 等. 知識(shí)找回場(chǎng)景下推薦系統(tǒng)模擬實(shí)現(xiàn)及評(píng)價(jià)研究[J]. 圖書情報(bào)工作, 2019, 63(16):72-83.
[2] 霍歡, 鄭德原, 高麗萍, 等. 棧式降噪自編碼器的標(biāo)簽協(xié)同過濾推薦算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2018, 39(1):7-11.
[3] 蔣偉, 秦志光. 耦合輔助信息的矩陣分解推薦模型[J].計(jì)算機(jī)應(yīng)用研究, 2019, 36(10):2900-2906.
[4] 王永康, 袁衛(wèi)華, 張志軍, 等. 融合時(shí)間隱語義填充和子群劃分的推薦算法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2019, 55(16):130-137.
[5] 賈偉洋, 李書琴, 李昕宇, 等. 基于離散量和讀者興趣貼近度的協(xié)同過濾推薦算法[J]. 計(jì)算機(jī)工程, 2018, 44(01):226-232+237.
[6] 梁仕威, 張晨蕊, 曹雷, 等. 基于協(xié)同表示學(xué)習(xí)的個(gè)性化新聞推薦[J]. 中文信息學(xué)報(bào), 2018, 32(11):72-78.
[7] 過仕明. “互聯(lián)網(wǎng)+”背景下高校圖書館協(xié)同服務(wù)機(jī)制研究[J]. 情報(bào)科學(xué), 2019, V37(4):52-58.
[8] 王紅, 袁小舒, 雷菊霞. 人工智能:圖書館應(yīng)用架構(gòu)和服務(wù)模式的重塑[J]. 現(xiàn)代情報(bào), 2019, 39(09):101-108.
[9] 董同強(qiáng), 馬秀峰. 融合與重構(gòu):一流學(xué)科建設(shè)中高校圖書館智慧型學(xué)科服務(wù)平臺(tái)的設(shè)計(jì)[J]. 國家圖書館學(xué)刊, 2019, 28(3):54-62.
[10] 曹樹金, 劉慧云. 以讀者為中心的智慧圖書館研究[J]. 圖書情報(bào)工作, 2019, 63(1):23-29.
(收稿日期: 2019.07.24)