陳海軍
(鹽城市圖書館,江蘇 鹽城 224000)
?
數(shù)據(jù)挖掘在公共圖書館管理工作中的應(yīng)用
陳海軍
(鹽城市圖書館,江蘇 鹽城 224000)
[摘 要]大數(shù)據(jù)時(shí)代的到來,加速了圖書館的數(shù)字化進(jìn)程,使得海量的數(shù)據(jù)信息得到完好的保存。數(shù)據(jù)挖掘技術(shù)是一種結(jié)合多門學(xué)術(shù)領(lǐng)域技術(shù)開發(fā)而成的新型技術(shù),在現(xiàn)代圖書館的數(shù)字化建設(shè)過程中具有重要作用。本文探究了數(shù)據(jù)挖掘在公共圖書館管理工作中的應(yīng)用。
[關(guān)鍵詞]數(shù)據(jù)挖掘;公共圖書館;管理;應(yīng)用
數(shù)據(jù)挖掘技術(shù)(KDD),又叫做知識(shí)發(fā)現(xiàn)技術(shù),是利用數(shù)據(jù)庫(kù)技術(shù)、人工智能技術(shù)、數(shù)據(jù)統(tǒng)籌等多個(gè)領(lǐng)域的實(shí)用技術(shù),對(duì)信息存儲(chǔ)倉(cāng)庫(kù)中的有用數(shù)據(jù)信息進(jìn)行挖掘的一種新型技術(shù)。在金融分析、醫(yī)學(xué)數(shù)據(jù)分析和銷售產(chǎn)業(yè)管理等社會(huì)生產(chǎn)生活的各個(gè)方面,數(shù)據(jù)挖掘技術(shù)都有大量應(yīng)用。在公共圖書館管理工作中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用,為館存信息的管理帶來了很大便利。
數(shù)據(jù)挖掘技術(shù)包括兩個(gè)基本過程:數(shù)據(jù)準(zhǔn)備、信息挖掘。
1.1數(shù)據(jù)準(zhǔn)備
在公共圖書館管理工作中,數(shù)據(jù)挖掘的應(yīng)用首先要對(duì)四個(gè)數(shù)據(jù)集進(jìn)行分析概括,洞悉書籍使用情況。第一,獲取用戶的基本信息。在信息化的圖書館中,用戶的基本信息主要分為用戶身份信息和借閱行為信息兩個(gè)部分,包括用戶姓名、年齡、性別、年齡、職業(yè)、證件號(hào)碼、聯(lián)系方式、借閱等級(jí)。第二,獲取借閱歷史信息。這一類數(shù)據(jù)信息在圖書館的日常管理工作中十分重要,主要包括用戶編號(hào)、書籍信息、借閱時(shí)間、歸還時(shí)間等。通過對(duì)這類信息的分析處理,能把圖書的實(shí)時(shí)使用狀態(tài)清晰地表達(dá)出來,并能依此進(jìn)行較為準(zhǔn)確的預(yù)測(cè)。第三,獲取圖書檢索記錄。在現(xiàn)代信息化的圖書館中,大多具有一定的圖書檢索功能,用戶在進(jìn)行借閱操作前大多需要通過圖書檢索系統(tǒng)尋找圖書,這就會(huì)為圖書館管理員提供大量的用戶需求信息。對(duì)于圖書檢索信息的處理,需要獲取用戶編號(hào)信息、檢索內(nèi)容、檢索時(shí)間,其中對(duì)檢索內(nèi)容的處理,要根據(jù)檢索方式、檢索關(guān)鍵詞、檢索符合等進(jìn)行分類整理。同時(shí),圖書檢索系統(tǒng)往往具有相當(dāng)大的使用量,所以關(guān)于檢索記錄的數(shù)據(jù)存儲(chǔ),需要技術(shù)水平達(dá)到一定高度的硬件設(shè)施支持。第四,獲取書籍信息。書籍信息的數(shù)據(jù)集是圖書館信息系統(tǒng)建立的基礎(chǔ),包括書籍名稱、書籍編號(hào)、位置編號(hào)、作者、出版社信息、學(xué)科分類、館藏日期等,對(duì)這部分信息,需要從其特征屬性進(jìn)行概化處理。
1.2信息挖掘
信息挖掘階段包括以下四個(gè)環(huán)節(jié):確定挖掘目標(biāo)、選擇挖掘工具、建立挖掘模型實(shí)施搜索以及結(jié)果分析。第一,確定挖掘目標(biāo)。首先將數(shù)據(jù)挖掘的目標(biāo)確定,一種是數(shù)據(jù)挖掘系統(tǒng)自動(dòng)幫助用戶做出假設(shè),即發(fā)現(xiàn)驅(qū)動(dòng),另一種是驗(yàn)證驅(qū)動(dòng),即用戶對(duì)圖書館數(shù)據(jù)庫(kù)中的有用知識(shí)進(jìn)行合理假設(shè)。第二,選擇挖掘工具,即選擇合適的軟件進(jìn)行挖掘操作。第三,建立挖掘模型實(shí)施搜索,通過挖掘工具在數(shù)據(jù)庫(kù)中建立模型,進(jìn)行查找,這一過程既能讓系統(tǒng)全程自行操作,也能讓用戶進(jìn)行一定的主動(dòng)操作。第四,結(jié)果分析。數(shù)據(jù)的挖掘需要進(jìn)行數(shù)次操作,通過對(duì)結(jié)果的分析,使數(shù)據(jù)挖掘的精度達(dá)到要求范圍內(nèi)。
分類規(guī)則挖掘分類就是根據(jù)數(shù)據(jù)庫(kù)中各個(gè)數(shù)據(jù)單元的共同特征進(jìn)行分類規(guī)劃。聚類規(guī)則挖掘是一種以數(shù)據(jù)單元的特點(diǎn)為基礎(chǔ),根據(jù)其特性差異大小進(jìn)行分類,即,首先分析數(shù)據(jù)進(jìn)行劃分歸類、然后再確定每一部分屬于的類。預(yù)測(cè)分析是通過挖掘數(shù)據(jù),分析相應(yīng)對(duì)象在一定時(shí)間的發(fā)展規(guī)律,對(duì)未來一段時(shí)間的發(fā)展進(jìn)行預(yù)測(cè)。關(guān)聯(lián)規(guī)則挖掘,在圖書館數(shù)據(jù)庫(kù)中,大多數(shù)數(shù)據(jù)單元之間都會(huì)存在一定的具備相應(yīng)規(guī)律的關(guān)聯(lián)性,在數(shù)據(jù)挖掘的應(yīng)用中,可通過數(shù)據(jù)的關(guān)聯(lián)規(guī)則,進(jìn)行數(shù)據(jù)的查詢及處理。
3.1分析用戶需求
對(duì)于用戶需求的分析,為了得到更加真實(shí)、準(zhǔn)確的結(jié)果,相關(guān)人員需要對(duì)量足夠巨大的數(shù)據(jù)信息進(jìn)行處理。比如圖書的借閱次數(shù)比例可在一定程度上反映讀者的需求,這種數(shù)據(jù)信息的挖掘來源于大量的數(shù)據(jù)挖掘,圖書館管理人員可通過數(shù)據(jù)挖掘?qū)τ脩粜枨筮M(jìn)行分析,由此得出最受讀者歡迎的藏書模式,并進(jìn)行相應(yīng)的合理圖書管理規(guī)劃和系統(tǒng)優(yōu)化。
3.2優(yōu)化信息架構(gòu)
由于公共圖書館的文獻(xiàn)采購(gòu)費(fèi)用是有一定規(guī)劃的。如何有效利用這些有限經(jīng)費(fèi),是一個(gè)很重要的問題。而數(shù)據(jù)挖掘技術(shù)的應(yīng)用,能很好地優(yōu)化信息架構(gòu),解決這一難題。首先,可對(duì)公共圖書館的檢索系統(tǒng)、借閱記錄、館藏文獻(xiàn)記錄等數(shù)據(jù)進(jìn)行分析挖掘,對(duì)于讀者需求大的文獻(xiàn)進(jìn)行合理的補(bǔ)充,有效調(diào)整各類文獻(xiàn)的購(gòu)入比例。其次,應(yīng)用數(shù)據(jù)挖掘技術(shù)可從因特網(wǎng)上進(jìn)行文檔的搜集和整理,從中篩選出有用的內(nèi)容,納入圖書館的信息資源,在不花費(fèi)、少花費(fèi)經(jīng)費(fèi)的情況下最大程度地補(bǔ)充圖書館的電子信息資源。最后,應(yīng)用數(shù)據(jù)挖掘技術(shù),可對(duì)圖書館電子文獻(xiàn)進(jìn)行高效有序的管理,例如,對(duì)于文本數(shù)據(jù),可引入文本發(fā)掘技術(shù),進(jìn)行資源查找、分類整理,能在減少人工操作成本的同時(shí),完成工作量巨大的電子文獻(xiàn)整理工作。
圖書館的存在是記載人類文明所不可缺少的。隨著網(wǎng)絡(luò)時(shí)代的降臨,圖書館的建設(shè)發(fā)生了相應(yīng)變化,信息化圖書館的建設(shè),有效增大了圖書館的館藏容量,節(jié)約了圖書館的建設(shè)成本。數(shù)據(jù)挖掘這一新興技術(shù)的廣泛應(yīng)用,大大簡(jiǎn)化了公共圖書館復(fù)雜繁重的管理工作,為信息化圖書館的推廣建設(shè)提供了有效支持。同時(shí),科技的不斷進(jìn)步,也為數(shù)據(jù)挖掘技術(shù)在公共圖書館管理工作中的深化應(yīng)用提供技術(shù)支持和硬件保障。數(shù)據(jù)挖掘技術(shù)的應(yīng)用,具有廣闊前景。
主要參考文獻(xiàn)
[1]宋麗軍.數(shù)據(jù)挖掘在圖書館管理上的應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2014(5).
[2]馮毅.數(shù)據(jù)挖掘技術(shù)在高校圖書館管理中的應(yīng)用研究[J].中國(guó)電子商務(wù),2013(12).
[3]黃蘭,孫林山,羅日輝.數(shù)據(jù)挖掘及其在圖書館管理中的應(yīng)用[J].華南熱帶農(nóng)業(yè)大學(xué)學(xué)報(bào),2015(2).
[收稿日期]2015-11-10
[中圖分類號(hào)]G250.7;G258.2
[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)]1673-0194(2016)02-0169-01
doi:10.3969/j.issn.1673 - 0194.2016.02.130