摘 要:基于上海對(duì)外經(jīng)貿(mào)大學(xué)師生圖書(shū)借閱的歷史數(shù)據(jù)與藏書(shū)的外經(jīng)貿(mào)特色,通過(guò)統(tǒng)計(jì)分析與數(shù)學(xué)建模方法,發(fā)展和應(yīng)用用戶個(gè)性化分析模型與技術(shù),預(yù)測(cè)上海對(duì)外經(jīng)貿(mào)大學(xué)用戶薦購(gòu)行為,為圖書(shū)館采購(gòu)提供量化參考。具體擬達(dá)到以下目的:從讀者出發(fā),討論未收錄新書(shū)選擇增添問(wèn)題,為圖書(shū)館采購(gòu)提供科學(xué)化參考,更精準(zhǔn)的滿足讀者需求。為圖書(shū)館考慮,為圖書(shū)采購(gòu)提供推薦新書(shū)通報(bào),從而在購(gòu)書(shū)預(yù)算限制下,最大限度的提高我校師生借書(shū)體驗(yàn),提高圖書(shū)借閱率與紙質(zhì)圖書(shū)流通率。
關(guān)鍵字:圖書(shū)借閱;用戶薦購(gòu);統(tǒng)計(jì)分析;個(gè)性化模型
1 國(guó)內(nèi)外研究現(xiàn)狀及發(fā)展動(dòng)態(tài)
1.在圖書(shū)復(fù)本量?jī)?yōu)化決策方向已有研究:
我國(guó)圖書(shū)采購(gòu)管理的研究很多基于復(fù)本量?jī)?yōu)化決策問(wèn)題[1],主要分為兩種方法,第一種通過(guò)影響圖書(shū)復(fù)本量的因素進(jìn)行定性分析,主要因素有實(shí)際讀者人數(shù)、圖書(shū)館的借閱制度、圖書(shū)文獻(xiàn)的使用年限、圖書(shū)館舍得分布情況、原有資源的規(guī)模與布局、信息媒體的類型文種載體及專業(yè)水平、信息服務(wù)機(jī)構(gòu)提供的信息媒體復(fù)制能力和、預(yù)計(jì)丟失和損壞的數(shù)量;第二種類型是把影響圖書(shū)采購(gòu)復(fù)本量的影響因素作為變量,建立數(shù)學(xué)模型,并通過(guò)對(duì)流通數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,找出它們之間的關(guān)系,用來(lái)指導(dǎo)圖書(shū)采購(gòu)計(jì)劃的制定與執(zhí)行。
盡管人們已經(jīng)提出許多計(jì)算信息媒體采集復(fù)本量的數(shù)學(xué)模型,但由于復(fù)本問(wèn)題與眾多的變動(dòng)因素緊密聯(lián)系,隨機(jī)性很強(qiáng),難以給出確定的數(shù)值,以至于這些模式通常把簡(jiǎn)單的問(wèn)題復(fù)雜化,因此,真正能夠投入實(shí)際應(yīng)用的統(tǒng)計(jì)方法至今仍很少見(jiàn)到[2]。
2.在數(shù)據(jù)挖掘領(lǐng)域已有相關(guān)探索:
近年來(lái),利用一般性的數(shù)據(jù)挖掘算法,如聚類算法、關(guān)聯(lián)挖掘等技術(shù),對(duì)圖書(shū)借閱數(shù)據(jù)中的用戶偏好進(jìn)行數(shù)據(jù)挖掘,受到了越來(lái)越多的討論?,F(xiàn)有研究,如文獻(xiàn),多針對(duì)實(shí)際問(wèn)題,應(yīng)用數(shù)據(jù)挖掘相關(guān)算法,解決圖書(shū)借閱之間的關(guān)聯(lián)規(guī)則挖掘,從而對(duì)圖書(shū)館的館藏布局提供意見(jiàn),實(shí)現(xiàn)圖書(shū)推薦功能[3]。
2 研究方法
首先關(guān)于圖書(shū)采購(gòu)、原則、組織結(jié)構(gòu)以及業(yè)務(wù)流程等方面對(duì)上海對(duì)外經(jīng)貿(mào)大學(xué)圖書(shū)采購(gòu)工作與目標(biāo)進(jìn)行訪談。
針對(duì)數(shù)據(jù)庫(kù)現(xiàn)有的借閱數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,了解我校圖書(shū)流通現(xiàn)狀。
結(jié)合以上兩步內(nèi)容從圖書(shū)館信息管理的實(shí)際需求出發(fā),以圖書(shū)、讀者、時(shí)間等多個(gè)維度進(jìn)行統(tǒng)計(jì)推斷與分析,從大量的圖書(shū)借閱數(shù)據(jù)中量化規(guī)律,討論未收錄新書(shū)選擇增添問(wèn)題,為圖書(shū)館采購(gòu)提供科學(xué)化參考,更精準(zhǔn)的滿足讀者需求。探索利用用戶個(gè)性化分析,實(shí)現(xiàn)圖書(shū)館采購(gòu)?fù)扑]的關(guān)鍵統(tǒng)計(jì)技術(shù),并以技術(shù)報(bào)告呈現(xiàn)。
3 研究成果
以下成果均基于2010-2015年度上海對(duì)外經(jīng)貿(mào)大學(xué)圖書(shū)館圖書(shū)借閱數(shù)據(jù)
1.圖書(shū)類別維度
6年內(nèi),累計(jì)借閱量前十名圖書(shū)類別及借閱比重分別是文學(xué)15.97%、經(jīng)濟(jì)9.82%、語(yǔ)言、文字9.64%、哲學(xué)類6.59%、政治法律5.87%、數(shù)理科學(xué)和化學(xué)5.36%、社科總論5.14%、歷史、地理5.13%、文化、科學(xué)、教育、體育4.65%、工業(yè)技術(shù)4.44%。
2.借閱總量維度
以2010-2014前五年的借閱數(shù)據(jù)作為訓(xùn)練樣本,2015年作為驗(yàn)證樣本,去除重復(fù)的圖書(shū),前五年被借閱過(guò)的不同圖書(shū)數(shù)量分別為1078、1236、1467、1372、2092,從數(shù)據(jù)源中舍棄重復(fù)的圖書(shū),共有4032本不同的圖書(shū)。2015年被借閱數(shù)量為2403,其中前五年出現(xiàn)的圖書(shū)共有3086本。
3.推薦結(jié)果評(píng)估
在六年的借閱數(shù)據(jù)中,會(huì)同時(shí)出現(xiàn)在前五年及最后一年的借閱資料中的讀者共6772名,根據(jù)回歸預(yù)測(cè)可得共有788位讀者的借閱圖書(shū)至少含有一本,那么推薦圖書(shū)的出現(xiàn)率為11.64%(788/6772)。因此圖書(shū)推薦系統(tǒng)可以根據(jù)推薦率,為目標(biāo)讀者只能推薦圖書(shū),促進(jìn)提升借閱量,也同時(shí)為我校學(xué)生提供更加智能的數(shù)據(jù)推薦服務(wù),提升目標(biāo)化、鎖定式閱讀體驗(yàn)[2]。
參考文獻(xiàn)
[1]張金連.NS學(xué)院圖書(shū)館圖書(shū)采購(gòu)管理優(yōu)化研究[D].華南理工大學(xué),2014.
[2]劉斌.基于數(shù)據(jù)挖掘的高校圖書(shū)館借閱數(shù)據(jù)特性分析與應(yīng)用[D].蘇州大學(xué),2010.
[3]王正宇.數(shù)據(jù)挖掘在讀者偏好研究中的應(yīng)用[D].上海交通大學(xué),2010.
作者簡(jiǎn)介
時(shí)嘉遙(1995-),女,山東省,本科在讀,學(xué)生,研究方向:統(tǒng)計(jì)分析。