宋麗萍
摘 要:在高校圖書館進行生態(tài)化、數(shù)字化建設(shè)的今天,提高圖書館的個性化服務(wù)質(zhì)量已成為迫切需要。本文介紹了關(guān)聯(lián)規(guī)則的基本原理, 闡述了關(guān)聯(lián)規(guī)則挖掘分析的過程及結(jié)果, 論述了關(guān)聯(lián)規(guī)則分析結(jié)果在圖書館工作中的應(yīng)用,以此可以為讀者提供準確的服務(wù),促進圖書館的生態(tài)化建設(shè)。
關(guān)鍵詞:圖書館;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法
中圖分類號:C289 文獻標識碼:A 文章編號:1672-4437(2014)02-0025-03
目前高校圖書館普遍采用圖書管理自動化系統(tǒng),每天都會產(chǎn)生大量的圖書流通數(shù)據(jù),圖書館數(shù)據(jù)庫里積累了大量的讀者對圖書資源的歷史訪問數(shù)據(jù),這些數(shù)據(jù)主要用于圖書館的日常管理,其實在這些數(shù)據(jù)背后隱藏著許多重要的信息。但是,由于目前的圖書館管理系統(tǒng)缺乏數(shù)據(jù)的集成和分析能力,無法發(fā)現(xiàn)這些數(shù)據(jù)中存在的關(guān)系和規(guī)則。也就很難根據(jù)讀者的需求開展個性化服務(wù),如何運用數(shù)據(jù)挖掘技術(shù)從圖書館數(shù)據(jù)中挖掘出有價值的信息,已成為數(shù)據(jù)挖掘應(yīng)用的一個重要領(lǐng)域,也是數(shù)字化、生態(tài)化圖書館建設(shè)中一項非常重要的研究內(nèi)容。
一、關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是美國IBM Almaden Research Center的Rabesh Agrawal等人在1993年的SIGMOG會議上提出的,反映一個事物與其他事物之間的相互依賴性或相互關(guān)聯(lián)性,從而達到認識事物客觀規(guī)律的技術(shù)方法。如果兩個或者多個事物之間存在一定的關(guān)聯(lián)規(guī)則,那么其中一個事物就能夠通過其他事物預(yù)測到[1]。
四、結(jié)束語
數(shù)據(jù)挖掘技術(shù)目前已經(jīng)成功地應(yīng)用于各個領(lǐng)域,但大部分集中在金融、商業(yè)等贏利性領(lǐng)域中,在高校、政府等一些非贏利性機構(gòu)中應(yīng)用較少,本文對圖書館的讀者借閱信息進行關(guān)聯(lián)規(guī)則挖掘,采用了關(guān)聯(lián)規(guī)則中最具有影響力的Apriori算法,目的是從大量的讀者借閱信息中得到各個學(xué)科之間的相關(guān)信息,以幫助優(yōu)化圖書館藏書的布局。促進生態(tài)圖書館的建設(shè),但由于Apriori算法在每次尋找頻繁項集時,都需要掃描數(shù)據(jù)庫一次,因此隨著數(shù)據(jù)量的增大,尋找頻繁項集的時間也就越長,尤其在高校學(xué)生逐年增長,圖書館數(shù)據(jù)庫呈指數(shù)增長的情況下,系統(tǒng)的效率就會受到影響。因此,在今后的工作中,我會采取其他的方法對Apriori算法加以改進,以便提高系統(tǒng)的效率。
————————
參考文獻:
[1] 李雄飛,李軍.數(shù)據(jù)挖掘與知識發(fā)現(xiàn)[M]. 北京:高等教育出版社,2003, 2:126-145.
[2] 李愛鳳. 基于數(shù)據(jù)挖掘技術(shù)的課程相關(guān)性模式研究與實現(xiàn)[D]. 華南師范大學(xué), 2006.
[3] Agrawal R,Imielinski T,Swami A.Mining associat -ion rules between ets of it- ems in large database[J].IEEE Transactions on Knowledge and ata Engineering,1996,8(6):962- 969.
[4] 魏育輝,潘潔.圖書流通數(shù)據(jù)的關(guān)聯(lián)挖掘量化分析[J].現(xiàn)代情報,2005,(11): 69