黃海云 袁立強(qiáng) 靳紅 張屹 牛曉艷 劉平
1?引言
隨著信息技術(shù)的飛速發(fā)展和知識(shí)的大量累積,大數(shù)據(jù)技術(shù)得到廣泛應(yīng)用,圖書館傳統(tǒng)的服務(wù)內(nèi)容和服務(wù)方式已不能滿足新時(shí)代的需求,需要不斷創(chuàng)新來尋找更有效的服務(wù)途徑。大學(xué)生,尤其是新生面對(duì)海量的圖書,需要更精準(zhǔn)的閱讀指導(dǎo)。為此,河北科技大學(xué)圖書館(以下簡稱“我館”)依托大數(shù)據(jù)技術(shù)進(jìn)行了一系列有效嘗試。根據(jù)十年來開展讀書系列活動(dòng)的經(jīng)驗(yàn),我館不斷完善活動(dòng)形式與內(nèi)容,并分析讀者的借閱數(shù)據(jù)和借閱習(xí)慣,開發(fā)了讀者興趣預(yù)測軟件,篩選出有共同愛好的讀者群,有針對(duì)性地開展活動(dòng)和推薦書目,從而吸引了更廣泛的讀者關(guān)注和參與。
近十年來,我館陸續(xù)開展了“好書月月談”“名家講座”“文化之旅”“好書推薦”等系列活動(dòng),從歷年的活動(dòng)經(jīng)驗(yàn)中發(fā)現(xiàn),雖然開展的閱讀推廣與輔導(dǎo)活動(dòng)不斷更新,但仍存在著很多“局限性”,例如:參與活動(dòng)的讀者缺乏廣泛的代表性;聘請專家、學(xué)者進(jìn)行講課和交流會(huì)受到時(shí)間、地點(diǎn)等因素的制約;陳舊的活動(dòng)形式,使讀者的積極性逐漸淡化,以點(diǎn)帶面的作用不大,因此難以實(shí)現(xiàn)圖書館服務(wù)和讀者需求有效的銜接。這就迫切需要圖書館工作人員創(chuàng)新工作思路,不斷更新活動(dòng)方式。我館在這一背[LL]景下,利用貝葉斯網(wǎng)絡(luò)技術(shù)預(yù)測讀者的需求,為讀者借閱提供更精確的指導(dǎo);針對(duì)有共同愛好的讀者群體開展相應(yīng)的活動(dòng),提升讀者閱讀興趣;秉承從讀者的需求出發(fā),再服務(wù)到讀者中去的理念,提高閱讀推廣服務(wù)水平,培養(yǎng)讀者的讀書習(xí)慣;把讀書活動(dòng)方式從被動(dòng)服務(wù)逐步轉(zhuǎn)變到有針對(duì)性的主動(dòng)服務(wù)上去,提升服務(wù)效能。
2?案例背景
隨著讀者信息需求水平的提高,我館開展的閱讀推廣與輔導(dǎo)活動(dòng)已不能滿足不同類型的讀者需求,必須從大數(shù)據(jù)技術(shù)入手,從海量數(shù)據(jù)中挖掘出有價(jià)值的信息來提高服務(wù)水平。我館通過分析歷年借閱數(shù)據(jù)和讀者信息數(shù)據(jù),開發(fā)了讀者興趣預(yù)測軟件,預(yù)測出“閱讀傾向”相同的讀者群體,結(jié)合館藏圖書資源,分批分類地精準(zhǔn)推送讀者所需的書籍,并且有針對(duì)性地對(duì)這些群體開展他們喜聞樂見的讀書系列活動(dòng)。
3?實(shí)施步驟
3.1?整合讀者信息和借閱數(shù)據(jù)
數(shù)據(jù)來源于我館2011-2017年度讀者的個(gè)人信息和借閱記錄信息。其中,讀者個(gè)人信息包括:借書證ID、性別、所屬院系、辦證時(shí)間、讀者類別;借閱記錄包括:圖書的館藏信息、讀者類型信息、所借書號(hào)、借還書日期等。通過整合出有用信息,為開發(fā)軟件做好充分的前期準(zhǔn)備工作。
3.2?統(tǒng)計(jì)分析相關(guān)數(shù)據(jù)
(1)首先對(duì)河北科技大學(xué)男女讀者各類圖書的人均借閱次數(shù)統(tǒng)計(jì)。從統(tǒng)計(jì)結(jié)果可知,男性讀者對(duì)于數(shù)理化和工技類等方面書籍平均借閱量明顯高于女性,而對(duì)于語言、文學(xué)、藝術(shù)、史地類書籍則是女性讀者平均借閱量要高于男性讀者。
(2)對(duì)各個(gè)學(xué)院所借各類書籍的人均借閱量進(jìn)行對(duì)比統(tǒng)計(jì)。結(jié)果發(fā)現(xiàn)所有學(xué)院的讀者借閱語言、文學(xué)類圖書都比較多;除了影視、外語、文法、藝術(shù)等幾個(gè)學(xué)院外,其他學(xué)院借閱數(shù)理化方面的圖書也比較多;理學(xué)院的學(xué)生對(duì)于哲學(xué)和經(jīng)濟(jì)類圖書也很感興趣,而影視和藝術(shù)學(xué)院對(duì)于文學(xué)類圖書的興趣沒有理科學(xué)生的興趣高。
(3)對(duì)各類讀者的人均借閱次數(shù)做了統(tǒng)計(jì)。從統(tǒng)計(jì)結(jié)果看,本科生借閱量最大,理工學(xué)院和研究生借閱量相對(duì)較少;理工學(xué)院的讀者對(duì)于數(shù)理化方面的圖書借閱興趣不高,而對(duì)于文學(xué)和工技類的圖書借閱量稍高些;研究生對(duì)于工程技術(shù)類圖書借閱量最多。
(4)最后對(duì)不同年級(jí)的讀者借閱各類書籍的人均借閱次數(shù)統(tǒng)計(jì)。發(fā)現(xiàn)大一、大三學(xué)生借閱量相對(duì)小,大四和準(zhǔn)備考研的學(xué)生借閱量比較大。各屆學(xué)生對(duì)于文學(xué)類圖書借閱仍然是最多的。利用這些數(shù)據(jù)開發(fā)出能預(yù)測有共同愛好的讀者群體,是我們開發(fā)軟件的初衷。
3.3?開發(fā)和使用軟件
以上述統(tǒng)計(jì)出來的數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練貝葉斯軟件模型,編制出預(yù)測行為軟件,把讀者興趣預(yù)測軟件安裝在體驗(yàn)機(jī)上,讀者輸入四個(gè)選項(xiàng)的信息,就會(huì)彈出該生預(yù)借的圖書類別比例。
4?活動(dòng)效果
圖書館工作人員統(tǒng)計(jì)出有共同偏好的讀者,對(duì)他們有針對(duì)性地開展活動(dòng)。我們根據(jù)統(tǒng)計(jì)出來的數(shù)據(jù)信息開展了兩期閱讀推廣活動(dòng):一期是以“科幻”為主題,圍繞作者劉慈欣的作品展開評(píng)論;另一期是以“明史”為主題,以時(shí)間為軸線展開討論。因?yàn)閰⒓诱哂邢嗤膼酆?,所以發(fā)言踴躍,各抒己見,達(dá)到了理想的預(yù)期效果,同時(shí)借閱量也有了明顯的提升。經(jīng)過多年不斷的創(chuàng)新、探索,終于有了“破繭成蝶”的發(fā)展。從統(tǒng)計(jì)表1來看,很多相關(guān)種類的書籍,月平均借閱量呈現(xiàn)總體上升的趨勢。
5?總結(jié)
目前我們開發(fā)的預(yù)測軟件可以挖掘不同專業(yè)、性別、年級(jí)和不同類型的讀者對(duì)于各類書籍的借閱偏好。圖1是我們對(duì)于目前咨詢軟件的一個(gè)改進(jìn)思路:全貝葉斯網(wǎng)絡(luò)A可以根據(jù)讀者個(gè)人信息推導(dǎo)出書籍的借閱概率。分層貝葉斯網(wǎng)絡(luò)B可根據(jù)讀者的查詢詞集及同義詞推導(dǎo)出書籍的
借閱概率。兩者結(jié)合可實(shí)現(xiàn)更精準(zhǔn)的借閱咨詢。