常麗巖
摘要:隨著科技發(fā)展,信息的流通速度越來越快,讀者獲取信息的主要來源圖書館每天都會(huì)有人為其提供大量的數(shù)據(jù),那么怎樣從這大量的數(shù)據(jù)當(dāng)中獲取有利于圖書管理的信息就顯得相當(dāng)重要了。下文將會(huì)在圖書管理的基礎(chǔ)上,重點(diǎn)對數(shù)據(jù)挖掘方法做具體闡述,望對大家有所幫助。
關(guān)鍵詞:數(shù)據(jù)挖掘;圖書館;圖書管理;決策
中圖分類號:G250.7 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-864X(2016)09-0039-01
近些年來由于全球信息化速度的加快,圖書館數(shù)據(jù)挖掘已經(jīng)成為了一項(xiàng)非常具有發(fā)展前景的工程,并且其不僅在圖書管理方面受到大量關(guān)注,其在制造業(yè)、零售業(yè)、供應(yīng)鏈分析和電子商務(wù)等領(lǐng)域也都扮演著相當(dāng)重要的角色。在圖書管理系統(tǒng)當(dāng)中每天所產(chǎn)生的數(shù)據(jù)大都是一些關(guān)于讀者興趣、借閱習(xí)慣及學(xué)科關(guān)聯(lián)等信息,如果能夠?qū)ζ溥M(jìn)行科學(xué)合理的分類,那將會(huì)給圖書館的發(fā)展帶來非常大的好處,因此,加強(qiáng)對信息的數(shù)據(jù)挖掘工作就顯得尤為重要了。
一、數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘技術(shù)是近些年來跟隨數(shù)據(jù)庫以及人工智能技術(shù)發(fā)展起來的全新信息技術(shù),這項(xiàng)技術(shù)主要可以從大數(shù)量的信息當(dāng)中獲取人們所需要信息以及一些具有潛在價(jià)值的信息技術(shù)。近年來隨著自動(dòng)化產(chǎn)業(yè)的普及,自動(dòng)化管理在現(xiàn)代圖書館當(dāng)中已經(jīng)占據(jù)了非常重要的地位,可以對每位學(xué)員在使用期間所應(yīng)用的程序以及使用建議全部備案在冊,這些信息對于圖書館的發(fā)展是有非常大幫助的。
圖書館數(shù)據(jù)挖掘系統(tǒng)也可以稱之為知識發(fā)現(xiàn)系統(tǒng),因?yàn)樗梢詭椭芾碚邔ζ渌枰畔⑦M(jìn)行篩選與總結(jié),即可以智能化的實(shí)現(xiàn)查詢服務(wù),從而更好的幫助決策者獲取自己所需要的數(shù)據(jù)。數(shù)據(jù)挖掘系統(tǒng)根據(jù)其對事物分析方式不同,我們可以將其進(jìn)行分類,其中最常見的分析方法有關(guān)聯(lián)分析法、決策樹分析法以及聚類分析法等。
二、數(shù)據(jù)挖掘及其在圖書管理中的應(yīng)用
數(shù)據(jù)挖掘在圖書管理系統(tǒng)中主要是通過查看大量閱讀者的閱讀數(shù)據(jù),在利用數(shù)據(jù)挖掘技術(shù)對這些數(shù)據(jù)進(jìn)行深度分析,從而得到一些關(guān)于圖書利用率、特定類型讀者借閱需求、圖書管理效率等相關(guān)的信息,這就為合理規(guī)劃圖書館館藏、提高圖書利用效率以及提高圖書館服務(wù)效率提供了保障。舉個(gè)例子,在某高校中,可以通過數(shù)據(jù)挖掘系統(tǒng)對不同專業(yè)學(xué)生對不同類型書籍的需求關(guān)系做出簡要分析,然后圖書館管理者就可以根據(jù)這些供需關(guān)系來為不同專業(yè)的學(xué)生配備他們所喜愛的書籍,這不僅會(huì)使得同學(xué)們的閱讀效率、借閱效率都得到明顯提升,并且還可以通過借閱數(shù)據(jù)挖掘各類圖書在不同館藏?cái)?shù)量下的流通情況,從而確定合理館藏?cái)?shù)量,提高流通效率。
(一)關(guān)聯(lián)分析法。
關(guān)聯(lián)分析就是尋找數(shù)據(jù)庫中各數(shù)據(jù)項(xiàng)之間存在的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)分析通過關(guān)聯(lián)規(guī)則挖掘?qū)崿F(xiàn),關(guān)聯(lián)規(guī)則一般定義為,對于需要分析的各種項(xiàng)集合,實(shí)際數(shù)據(jù)中一定存在某些事務(wù)集合,用事務(wù)集中同時(shí)包含兩項(xiàng)或多項(xiàng)的概率來表示某關(guān)聯(lián)規(guī)則的支持度,用包含某項(xiàng)的事務(wù)集中同時(shí)包含其他項(xiàng)的概率來表示置信度,若設(shè)定一定的支持度閾值和置信度閾值,則可判定兩項(xiàng)或多項(xiàng)的關(guān)聯(lián)規(guī)則。
分類和預(yù)測是兩種數(shù)據(jù)分析形式,可以用于提取描述重要數(shù)據(jù)類的模型或預(yù)測未來的數(shù)據(jù)趨勢。在進(jìn)行數(shù)據(jù)分類之前,首先需要建立一個(gè)模型,來描述一個(gè)數(shù)據(jù)類或者概念集,例如對于圖書管理數(shù)據(jù),可以用時(shí)間周期和借閱量來描述一個(gè)熱門書籍的概念集,然后以借閱數(shù)據(jù)庫作為訓(xùn)練數(shù)據(jù)集,通過查詢分析獲取該概念集的分類規(guī)則、判定樹或者數(shù)學(xué)描述公式等分類判據(jù),通過該分類判據(jù)可以判斷某類書籍是否屬于熱門書籍。預(yù)測則是通過描述歷史數(shù)據(jù)某種屬性的變化曲線或者趨勢,然后評估或者預(yù)測該屬性的可能值或者區(qū)間,例如我們針對某類書籍的借閱歷史數(shù)據(jù),利用回歸分析描述借閱量隨時(shí)間的變化曲線,然后通過對回歸曲線的擬合分析,可以預(yù)測未來某個(gè)時(shí)間段的借閱量。
(二)讀者服務(wù)。
1.為讀者起到導(dǎo)讀的作用。
在圖書館中,讀者導(dǎo)讀一直屬于一項(xiàng)工作重點(diǎn)。當(dāng)前屬于數(shù)字化時(shí)代,信息資源無論在數(shù)量上,還是在速度和來源上,相對以往都有很大的不同,這就導(dǎo)致我們讀者容易產(chǎn)生信息過剩反而無從下手的感覺。因此,導(dǎo)讀工作的重要性不言而喻。具體來說,分類技術(shù)能夠?qū)?shù)量龐大的信息資源進(jìn)行分類;聚類技術(shù)則可以對雜亂無序的信息進(jìn)行歸類,進(jìn)而給其標(biāo)引或者建立一個(gè)相應(yīng)數(shù)據(jù)庫,這能夠幫助信息用戶群的不同信息需求。舉例來說,我們可以以用戶角度出發(fā),對用戶在何種情況下需要何種信息解決何種問題進(jìn)行了解,也就是對用戶信息需求進(jìn)行全面的了解,進(jìn)而確定信息使用模式,然后設(shè)計(jì)更為有效地信息服務(wù)系統(tǒng)。
此外,在讀者檢索的過程中,傳統(tǒng)的信息數(shù)據(jù)庫定題情報(bào)服務(wù)當(dāng)前存在著很大的難題,對于一些排列不規(guī)范或者無序的電子信息要要在不同平臺上操作,效率很多。而通過數(shù)據(jù)挖掘技術(shù)能夠?qū)Ω鞣N數(shù)據(jù)進(jìn)行整合,把不同平臺電子版信息及紙質(zhì)圖書利用四種規(guī)則建立一個(gè)統(tǒng)一平臺,這能夠極大地提升檢索效率。
2.服務(wù)競爭情報(bào)。
當(dāng)前隨著市場化的加劇,圖書館服務(wù)更為重視經(jīng)濟(jì)及社會(huì)效益,使得不論是高校科研教育服務(wù),還是企業(yè)事業(yè)單位服務(wù),競爭性都成為了一個(gè)重要的課題。在這種背景下,數(shù)據(jù)挖掘技術(shù)可以對競爭情報(bào)起到服務(wù)的作用,這方面的研究成果主要有專題情報(bào)價(jià)值數(shù)據(jù)挖掘、面向集成競爭情報(bào)系統(tǒng)數(shù)據(jù)挖掘等,可以說已經(jīng)獲得了較為廣泛的應(yīng)用。
三、結(jié)語
數(shù)據(jù)挖掘在數(shù)據(jù)組織與分析和知識發(fā)現(xiàn)以及信息深層次挖掘等方面體現(xiàn)出整體優(yōu)勢。隨著圖書館自動(dòng)化程度的不斷提高,自動(dòng)化管理系統(tǒng)每天都要產(chǎn)生大量的統(tǒng)計(jì)數(shù)據(jù),如何從這些數(shù)據(jù)中挖掘出有用的圖書管理信息已成為一個(gè)亟待研究解決的重要課題。通過詳細(xì)分析決策和關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法對圖書流通和圖書采編工作的決策支持作用,以期用于指導(dǎo)圖書館的各項(xiàng)工作,使圖書館的館藏資源得以進(jìn)一步優(yōu)化和利用,使管理水平和服務(wù)質(zhì)量得到進(jìn)一步提高。
參考文獻(xiàn):
[1]張顯恒. 數(shù)據(jù)挖掘技術(shù)在圖書管理中的應(yīng)用[J]. 科技資訊,2012,26.
[2]姚磊. 基于數(shù)據(jù)挖掘的圖書管理決策系統(tǒng)研究與實(shí)現(xiàn)[J]. 甘肅科技,2012,21.
[3]高勇. 利用數(shù)據(jù)挖掘?yàn)楦咝YY產(chǎn)管理提供決策支持[J]. 廣東科技,2013,14.
[4]李剛. 基于數(shù)據(jù)挖掘的圖書管理決策支持系統(tǒng)研究[J]. 信息與電腦(理論版),2010,09.
[5]楊丹,屈艷玲. 基于數(shù)據(jù)挖掘的圖書館科學(xué)決策模型構(gòu)建研究[J]. 企業(yè)技術(shù)開發(fā),2013,31.