李大偉,杜洪波,周孝林,岳 賽,齊 飛
(沈陽(yáng)工業(yè)大學(xué) 理學(xué)院,遼寧 沈陽(yáng) 110870)
隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,手機(jī)App呈現(xiàn)出爆炸式增長(zhǎng)[1],逐漸改變著人們的生活習(xí)慣,App閱讀逐漸代替?zhèn)鹘y(tǒng)的紙質(zhì)讀物,導(dǎo)致網(wǎng)民通過(guò)手機(jī)看書的比例逐年上升。與此同時(shí)產(chǎn)生網(wǎng)名盲目閱讀書籍,閱讀消極書籍等問(wèn)題。鑒于現(xiàn)存問(wèn)題,形成一個(gè)新的服務(wù)——圖書推薦[2]。通過(guò)用戶平時(shí)的閱讀習(xí)慣進(jìn)行數(shù)據(jù)挖掘,為用戶推薦合適有價(jià)值的書籍,號(hào)召全民讀書。
(1)館藏資源:功能包含書目檢索、熱門排行、分類瀏覽、新書通報(bào)、圖書推薦。圖書推薦功能是通過(guò)分析用戶歷史數(shù)據(jù)將用戶感興趣或者有價(jià)值的書籍推薦給用戶。
(2)個(gè)人中心:構(gòu)建讀者個(gè)人中心模塊,具體功能包含用戶信息、閱讀管理(包括閱讀歷史)、個(gè)性書單、我的書評(píng)、我的通知。個(gè)性書單模塊是根據(jù)某些書共同的特性將自己喜愛(ài)的書籍進(jìn)行分類,同時(shí)可以向其他用戶分享優(yōu)質(zhì)的書單。“我的書評(píng)”模塊可以將用戶讀后感進(jìn)行上傳,與其他人進(jìn)行共享。
(3)互動(dòng)平臺(tái):包括好友推薦,群組討論、參與論壇、查看他人書評(píng)、與管理員進(jìn)行溝通等。好友推薦是通過(guò)運(yùn)用“用戶畫像”技術(shù),分析用戶,為用戶推薦有相同愛(ài)好的好友,使得好友之間交流讀書心得,提高用戶閱讀興趣。
“用戶畫像”是基于推薦算法實(shí)現(xiàn)的。在掌握用戶的信息和行為后,主動(dòng)為用戶推薦相關(guān)的信息。推薦算法的基本原理:(1)輸入基本數(shù)據(jù),包括用戶信息(性別,年齡等)、用戶對(duì)書籍的評(píng)價(jià)、書籍的信息等;(2)通過(guò)數(shù)據(jù)源與推薦算法結(jié)合為用戶推薦相關(guān)書籍。推薦算法不同的數(shù)據(jù)源所用的算法不同,本文使用協(xié)同過(guò)濾推薦算法實(shí)現(xiàn)圖書推薦。
協(xié)同過(guò)濾推薦[3](Collaborative Filtering recommendation,簡(jiǎn)稱CF),通過(guò)分析用戶興趣,在數(shù)據(jù)中尋找與該用戶興趣相似的用戶,綜合每個(gè)用戶對(duì)該物品的評(píng)價(jià),形成該物品的“得分”既用戶對(duì)該物品的喜歡程度?;静襟E:(1)根據(jù)用戶的基本資料了解用戶的喜好;(2)構(gòu)造用戶之間的相識(shí)度;(3)為用戶進(jìn)行推薦[3-4]。
相似度計(jì)算[7]:
(1)歐幾里得相似性
(2)皮爾遜相似性
取值在[-1,1]之間
(3)Cosine相似度
協(xié)同過(guò)濾推薦分為基于用戶和基于物品[4]的,本文考慮到用戶的數(shù)量遠(yuǎn)遠(yuǎn)小于書籍的數(shù)量,于是使用基于用戶的協(xié)同過(guò)濾推薦算法描述:(1)計(jì)算相似度:將用戶對(duì)所有書籍的喜歡程度作為一個(gè)向量來(lái)計(jì)算用戶之間的相似度;(2)預(yù)測(cè)用戶可能喜歡的書籍:找到K鄰居后,根據(jù)鄰居相似度權(quán)重和他們對(duì)書籍的偏好進(jìn)行預(yù)測(cè);(3)根據(jù)權(quán)重對(duì)書籍列表進(jìn)行排序,進(jìn)行推薦,如圖1所示。
圖1 協(xié)同過(guò)濾推薦算法Fig.1 Collab orative filtering recommendation algorithm
基于“用戶畫像”挖掘的圖書推薦 App[8]不僅在算法上進(jìn)行研究,同時(shí)對(duì)界面進(jìn)行詳細(xì)設(shè)計(jì),設(shè)計(jì)出善于操作的界面,下面就部分界面進(jìn)行介紹。
圖書推薦:通過(guò)“用戶畫像”算法進(jìn)行后臺(tái)分析,推薦符合讀者的書籍。通過(guò)使用 ImageButton控件將推薦書籍的封面進(jìn)行展示。將所有的 image-Button,統(tǒng)一放入 ScrollView中實(shí)現(xiàn)滑動(dòng)。點(diǎn)擊imageButton彈出對(duì)應(yīng)圖書的介紹,如圖2所示。
互動(dòng)平臺(tái):如圖3所示,展示用戶對(duì)書的感受,上端是用ImageView控件制作的動(dòng)態(tài)切換頁(yè)面,實(shí)時(shí)進(jìn)行新聞動(dòng)態(tài)更新。中間是用itemlist控件將用戶發(fā)布的題目,時(shí)間,作者名,瀏覽量等信息顯式出來(lái)。最下端使用了 tabhost來(lái)選擇不同的板塊,包括互動(dòng)平臺(tái),圖書推薦,如圖4所示。個(gè)人中心:如圖5所示,用listView控件顯式個(gè)人可操作的功能,點(diǎn)擊查看各種信息。包括個(gè)性書單,如圖6所示,我的書評(píng),如圖7所示,薦購(gòu)歷史,如圖8所示等。
圖2 圖書推薦Fig.2 Book recommended
圖3 互動(dòng)平臺(tái)Fig.3 I nteractive platform
圖4 圖書推薦Fig.4 Lib rary resource
圖5 個(gè)人中心Fig.5 Personal center
圖6 個(gè)性書單Fig.6 Personality book
圖7 我的書評(píng)Fig.7 Individual review
21世紀(jì)正處于信息化時(shí)代,互聯(lián)網(wǎng)+給人類帶來(lái)的便利有目共睹。十八大之后“提倡全名閱讀”的口號(hào)多次被國(guó)務(wù)院提出,全名閱讀已被列為國(guó)家戰(zhàn)略[5]。本文通過(guò)協(xié)同過(guò)濾推薦算法,對(duì)用戶的行為信息進(jìn)行分析,為用戶個(gè)性化推薦書籍,有效地滿足用戶個(gè)性薦購(gòu)需要和提高全民讀書[6],實(shí)現(xiàn)互聯(lián)網(wǎng)+[11]文化。
[1] 葉剛峰. 基于APP數(shù)據(jù)的標(biāo)簽提取與整合[D]. 浙江大學(xué),2017.
[2] 田丹. 我國(guó)移動(dòng)圖書館APP應(yīng)用現(xiàn)狀分析[J]. 國(guó)家圖書館學(xué)刊, 2015, 24(5): 74-80.
[3] IT獨(dú)白者. 基于用戶的協(xié)同過(guò)濾算法和基于物品的協(xié)同過(guò)濾算法之java實(shí)現(xiàn)[EB/OL]. http://blog.csdn.net/sun_wangdong/article/details/54728909. 2017-01-25
[4] Flying_sfeng. 基于物品的協(xié)同過(guò)濾算法itemCF原理及python代碼實(shí)現(xiàn)[EB/OL]. https://blog.csdn.net/Flying_sfeng/article/details/56280872. 2017-02-21
[5] 常馨月. 公共移動(dòng)圖書館個(gè)性化薦讀服務(wù)模型構(gòu)建[D].吉林大學(xué), 2017.
[6] 唐小新, 李高虎, 唐秋鴻, 曹紅兵, 高嵩. 高校圖書館個(gè)性化電子圖書薦購(gòu)系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2012(3): 83-88.
[7] 榮輝桂, 火生旭, 胡春華, 莫進(jìn)俠. 基于用戶相似度的協(xié)同過(guò)濾推薦算法[J]. 通信學(xué)報(bào), 2014, 35(2): 16-24.
[8] 胡媛, 毛寧. 基于用戶畫像的數(shù)字圖書館知識(shí)社區(qū)用戶模型構(gòu)建[J]. 圖書館理論與實(shí)踐, 2017(4): 82-85+97.
[9] 陳慧香, 邵波. 國(guó)外圖書館領(lǐng)域用戶畫像的研究現(xiàn)狀及啟示[J]. 圖書館學(xué)研究, 2017(20): 16-20.
[10] 張興旺, 李晨暉. “互聯(lián)網(wǎng)+圖書館”頂層設(shè)計(jì)相關(guān)問(wèn)題研究[J]. 圖書與情報(bào), 2015(5): 33-40.
[11] 劉芳. “互聯(lián)網(wǎng)+公共圖書館”: 服務(wù)創(chuàng)新與轉(zhuǎn)型發(fā)展[J].圖書館雜志, 2016, 35(8): 42-48.