張宏偉 史惠媛
摘要:在高校圖書館文獻(xiàn)采購過程中,應(yīng)用數(shù)據(jù)挖掘技術(shù)對讀者利用圖書館歷史數(shù)據(jù)進(jìn)行分析,可以預(yù)測出圖書采購經(jīng)費分配比例,按照讀者閱讀需求采購熱點圖書,補(bǔ)充缺漏圖書及復(fù)本量不足圖書,進(jìn)而為文獻(xiàn)采購工作提供科學(xué)、合理的決策依據(jù)。
關(guān)鍵詞:高校圖書館;文獻(xiàn)采購;數(shù)據(jù)挖掘
中圖分類號:G253.1 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-5707(2016)02-0022-03
程煥文先生認(rèn)為資源是圖書館絕對的至高無上的王。文獻(xiàn)采購是高校圖書館文獻(xiàn)資源建設(shè)的第一站,是決定文獻(xiàn)資源建設(shè)質(zhì)量的最重要的關(guān)鍵環(huán)節(jié)。隨著圖書價格持續(xù)上漲,高校圖書館文獻(xiàn)購置費相對有限,在圖書采購過程中如何保證館藏結(jié)構(gòu)科學(xué)性的同時,提高紙質(zhì)文獻(xiàn)資源利用率,是圖書館亟待解決的問題。
數(shù)據(jù)挖掘(date mining)是從大量的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、潛在有用的信息和知識的過程。圖書館自動化管理系統(tǒng)每天會產(chǎn)生大量流通、檢索、查詢等數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行挖掘,可以獲知讀者個性化需求、文獻(xiàn)利用率等信息。利用這些信息對已有館藏進(jìn)行評估,可以為文獻(xiàn)采購工作提供科學(xué)、合理的決策依據(jù)。
1.傳統(tǒng)文獻(xiàn)采購工作存在的不足
目前,高校圖書館紙質(zhì)文獻(xiàn)傳統(tǒng)采購決策過程中,決策主觀性較強(qiáng),客觀依據(jù)不足。文獻(xiàn)采購多以現(xiàn)場采購和書目采購為主,采購人員少,對各專業(yè)、學(xué)科所需文獻(xiàn)資源把握不到位、訂購精確度不高。一方面受采購人員的知識結(jié)構(gòu)、專業(yè)背景、業(yè)務(wù)素質(zhì)及工作經(jīng)驗等因素的限制,圖書館文獻(xiàn)采購決策長期以來停留在憑經(jīng)驗和靠感覺的水平上,文獻(xiàn)采購時主觀判斷成分過多。另一方面讀者參與文獻(xiàn)采購的熱情不高,使得文獻(xiàn)采購的采全率和采準(zhǔn)率不高,導(dǎo)致學(xué)校投入的有限購書經(jīng)費所購文獻(xiàn)資源利用率不高,讀者文獻(xiàn)需求得不到滿足和保障。
為了使文獻(xiàn)采購工作更客觀、科學(xué)、合理,有必要應(yīng)用數(shù)據(jù)挖掘技術(shù)對讀者借閱流通、檢索查詢、預(yù)約借書、博碩學(xué)位論文引文等歷史數(shù)據(jù)進(jìn)行定性和定量分析,獲知讀者個性化閱讀需求,為圖書館文獻(xiàn)采購決策提供數(shù)據(jù)參考,進(jìn)而提高文獻(xiàn)資源采選質(zhì)量和館藏資源利用率。
2.數(shù)據(jù)挖掘在文獻(xiàn)采購決策中的應(yīng)用
2.1依據(jù)借閱流通數(shù)據(jù)指導(dǎo)采購資金分配
利用金盤圖書管理系統(tǒng)集成統(tǒng)計模塊對每年各大類圖書借閱流通情況進(jìn)行統(tǒng)計,得到讀者借閱量趨勢變化情況,進(jìn)而預(yù)測讀者需求量,指導(dǎo)下一年采購經(jīng)費在各大類文獻(xiàn)中的投入增減情況川。遵循文獻(xiàn)利用率最大效應(yīng)原則,對于零借閱的圖書應(yīng)減少或停止采購,保證各大類圖書的借閱流通數(shù)量和采購經(jīng)費所占比重相一致,有針對性地補(bǔ)充館藏文獻(xiàn)資源,從而達(dá)到資源優(yōu)化配置。
黑龍江中醫(yī)藥大學(xué)圖書館2013、2014、2015年圖書采購經(jīng)費分別為166.1萬、155.9萬、143.2萬元人民幣,借閱量分別為71 112、87 278、80 538冊。表1中列出這3年各類借出圖書所占采購經(jīng)費及借閱量的百分比,據(jù)此可以指導(dǎo)2016年制定文獻(xiàn)資源采購計劃,合理分配各類圖書采購經(jīng)費,使采購決策更加科學(xué)合理,最大限度地提升館藏資源利用率。
2.2依據(jù)檢索查詢數(shù)據(jù)獲知讀者亟需文獻(xiàn)
利用數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則對讀者每個月圖書檢索查詢數(shù)據(jù)進(jìn)行自動捕捉、采集和整理,過濾冗余信息。將讀者關(guān)注度較高的檢索詞按使用次數(shù)降序排列(見圖1)。對照2014年熱門圖書檢索詞排行榜,取檢索次數(shù)≥50次的圖書作為熱點圖書,這些是讀者迫切亟需的文獻(xiàn)資源,圖書館應(yīng)對照館藏規(guī)劃,優(yōu)先采購人氣熱點圖書。
2.3依據(jù)圖書預(yù)約借書數(shù)據(jù)補(bǔ)充館藏復(fù)本量
預(yù)約借書是指讀者預(yù)約登記某種借出狀態(tài)的圖書,該圖書歸還后,預(yù)約讀者優(yōu)先得到此書的借閱權(quán),館藏復(fù)本量不足是讀者預(yù)約借書的原因。圖書預(yù)約信息真實反映了讀者對某類圖書的實際需求。首先,采購人員基于金盤管理系統(tǒng),對預(yù)約數(shù)據(jù)進(jìn)行統(tǒng)計。其次,根據(jù)讀者預(yù)約次數(shù),形成預(yù)約熱點圖書的書目表。最后,通過與館藏書目數(shù)據(jù)比較,制定符合讀者需求的采購計劃,確定復(fù)本采購數(shù)量。及時補(bǔ)充館藏復(fù)本量不足的圖書,提升圖書館的服務(wù)質(zhì)量和服務(wù)效果,使高校圖書館文獻(xiàn)資源保障能力得到加強(qiáng)。
2.4依據(jù)博碩士論文引文量補(bǔ)充缺漏圖書
博碩士學(xué)位論文的引文真實地反映出作者在撰寫過程中對專業(yè)文獻(xiàn)的需求特點和規(guī)律,其引文具有數(shù)量大、范圍廣和學(xué)術(shù)質(zhì)量高的特點。博碩士學(xué)位論文是對以前成果的借鑒、利用和創(chuàng)新,參考文獻(xiàn)具有精選性,對文獻(xiàn)的學(xué)術(shù)價值具有評測功能。因此,對博碩士學(xué)位論文引文進(jìn)行數(shù)據(jù)挖掘,可以發(fā)現(xiàn)博碩士所在學(xué)科信息需求的一般規(guī)律和特點,有利于指導(dǎo)圖書館文獻(xiàn)信息資源的館藏建設(shè)。基于博碩士學(xué)位論文在線提交系統(tǒng),對博碩論文引文量進(jìn)行統(tǒng)計分析,對照館藏將文獻(xiàn)引用頻次≥3的缺漏圖書,列為預(yù)采購圖書。并根據(jù)文獻(xiàn)購置經(jīng)費的許可程度,最終有重點、有層次對缺漏圖書進(jìn)行補(bǔ)充。
2.5依據(jù)科技查新參考文獻(xiàn)獲知教學(xué)科研文獻(xiàn)需求
科技查新,是為避免科研課題重復(fù)立項和客觀正確地判別科研成果的創(chuàng)新性而設(shè)立的一項工作。通過科技查新工作,能為科研立項,科技成果的鑒定、評估、驗收、獎勵,專利申請等提供客觀依據(jù),為科研人員提供快捷、可靠、豐富的文獻(xiàn)支持。
黑龍江中醫(yī)藥大學(xué)圖書館檢索中心(中國中醫(yī)藥文獻(xiàn)檢索中心黑龍江分中心),是國家中醫(yī)管理局于1995年批準(zhǔn)成立的,為首批國家級定點查新分中心,也是我省中醫(yī)藥領(lǐng)域唯一的國家級查新單位。由于科研人員研究方向多,文獻(xiàn)需求廣,因此不易從個體角度來分析其文獻(xiàn)需求,但可以從群體角度來研究高校教研室、重點實驗室所需文獻(xiàn)需求?;谖茵^科技查新系統(tǒng),對科研人員申報的科技查新參考文獻(xiàn)進(jìn)行數(shù)據(jù)挖掘,可以對我校重點實驗室所關(guān)注的研究領(lǐng)域、研究熱點和發(fā)展方向進(jìn)行分類和預(yù)測。通過專家咨詢、建立模型與數(shù)據(jù)可視化等動態(tài)結(jié)合方式,生成重點實驗室所需科研文獻(xiàn)采購報告,為滿足該重點實驗室文獻(xiàn)需求提供客觀準(zhǔn)確的采購依據(jù)。
2015年,我館采購原則是“保證中醫(yī)藥學(xué)科,兼顧醫(yī)學(xué)相關(guān)門類,關(guān)注學(xué)校新增專業(yè),滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展需求”。通過對上述5類數(shù)據(jù)綜合分析,形成科學(xué)、合理的客觀采購依據(jù),輔助管理層作出及時有效的決策,進(jìn)而制定2016年的圖書采購原則,即“中醫(yī)類求精、西醫(yī)類求新、關(guān)注新增專業(yè)、滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展要求”。
3.小結(jié)
應(yīng)用數(shù)據(jù)挖掘技術(shù)從海量的借閱流通數(shù)據(jù)中預(yù)測采購經(jīng)費比例,對照年度采購原則和計劃,將讀者亟需的圖書進(jìn)行分類,按需求頻度進(jìn)行排序,頻度相同、資金有限或數(shù)量已達(dá)上限的情況下,以優(yōu)先滿足教學(xué)和科研圖書為采購原則。需要指出的是,采購決策應(yīng)以實際數(shù)據(jù)為參考,同時也要避免唯數(shù)據(jù)論,對時效性強(qiáng)、借閱量大的教材、輔導(dǎo)類等圖書要控制其采購的種數(shù)和復(fù)本量,可通過購買電子書形式予以解決。在經(jīng)費有限的情況下使投入產(chǎn)出收益達(dá)到最大化,真正做到“每位讀者有其書”和“每本書有其讀者”。