張冬
摘要:該文將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書(shū)館數(shù)據(jù)庫(kù),挖掘主題確定后,依次進(jìn)行了數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換和清理、數(shù)據(jù)再豐富、編程工作、數(shù)據(jù)挖掘。利用關(guān)聯(lián)挖掘?qū)D書(shū)館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類(lèi)圖書(shū)時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以?xún)?yōu)化館藏布局,并為圖書(shū)館管理人員提供技術(shù)和決策支持。其中數(shù)據(jù)挖掘是使用Clementine12完成。
關(guān)鍵詞:數(shù)據(jù)挖掘;圖書(shū)館;關(guān)聯(lián)規(guī)則;SqlServer;Clementine
中圖分類(lèi)號(hào): TP393. 41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)31-7260-03
Abstract: In this paper ,Data Mining Techniques is used on the library database. After determined areas of focus on the mining, the stages of the knowledge discovery processes are done,they are Data selection, Cleaning, Enrichment, Coding, Data mining, Reporting. By Analyzing Association Mining of the study,readers other borrowing behaviors is recovered when borrowing one type of books. The mining-results can help optimize the layout of library and provide technical and decision support for the librarys managers . Clementine12 is used for Data Mining.
Key words: data mining; library; asocciation rules; SqlServer; Clementine
1 概述
我所在圖書(shū)館文獻(xiàn)管理系統(tǒng)已經(jīng)建成和使用多年,隨著圖書(shū)館數(shù)據(jù)庫(kù)中數(shù)據(jù)量的增加,圖書(shū)館的流通管理數(shù)據(jù)正在快速上漲。但海量、分散的流通數(shù)據(jù),往往很難直接發(fā)現(xiàn)其中相互間的聯(lián)系和規(guī)律。本研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于我院的圖書(shū)館數(shù)據(jù)庫(kù),利用關(guān)聯(lián)挖掘?qū)D書(shū)館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類(lèi)圖書(shū)時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以?xún)?yōu)化館藏布局,并為圖書(shū)館管理人員提供技術(shù)和決策支持。本研究過(guò)程包括:數(shù)據(jù)倉(cāng)庫(kù)建立,根據(jù)挖掘主題進(jìn)行數(shù)據(jù)集成和選擇;數(shù)據(jù)變換,數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式;數(shù)據(jù)清理,除噪聲和刪除不一致數(shù)據(jù);數(shù)據(jù)挖掘,使用Clementine12,選擇特定的算法實(shí)施數(shù)據(jù)挖掘;知識(shí)表示,分析和研究數(shù)據(jù)挖掘結(jié)果,向用戶(hù)提供挖掘的知識(shí)。
2 建立數(shù)據(jù)倉(cāng)庫(kù)
參考文獻(xiàn):
[1] 鮑靜,范生萬(wàn).基于數(shù)據(jù)挖掘的圖書(shū)數(shù)據(jù)預(yù)處理[J]. 大學(xué)圖書(shū)情報(bào)學(xué)刊,2008(2).
[2] 陸覺(jué)民,鄭宇.基于矩陣的數(shù)據(jù)挖掘技術(shù)在數(shù)字化圖書(shū)館中的應(yīng)用[J]. 現(xiàn)代情報(bào),2007(12) .
[3] 李虹.面向用戶(hù)的數(shù)字圖書(shū)館信息服務(wù)模式研究[J]. 情報(bào)雜志,2007(08) .
[4] 王偉,張征芳,王海明.基于數(shù)據(jù)挖掘的圖書(shū)館讀者行為分析[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2006(11) .
[5] 魏育輝,潘潔.圖書(shū)流通數(shù)據(jù)的關(guān)聯(lián)挖掘量化分析方法[J]. 現(xiàn)代情報(bào),2005(11) .
[6] 王燕,溫有奎.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在數(shù)字圖書(shū)館中的應(yīng)用[J]. 情報(bào)科學(xué),2007(6) .
[7] 張永梅,韓焱,薛海麗.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書(shū)館中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化,2005(10) .
[8] 司徒浩臻.數(shù)據(jù)挖掘技術(shù)在圖書(shū)館信息服務(wù)中的應(yīng)用[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(10).endprint
摘要:該文將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書(shū)館數(shù)據(jù)庫(kù),挖掘主題確定后,依次進(jìn)行了數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換和清理、數(shù)據(jù)再豐富、編程工作、數(shù)據(jù)挖掘。利用關(guān)聯(lián)挖掘?qū)D書(shū)館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類(lèi)圖書(shū)時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以?xún)?yōu)化館藏布局,并為圖書(shū)館管理人員提供技術(shù)和決策支持。其中數(shù)據(jù)挖掘是使用Clementine12完成。
關(guān)鍵詞:數(shù)據(jù)挖掘;圖書(shū)館;關(guān)聯(lián)規(guī)則;SqlServer;Clementine
中圖分類(lèi)號(hào): TP393. 41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)31-7260-03
Abstract: In this paper ,Data Mining Techniques is used on the library database. After determined areas of focus on the mining, the stages of the knowledge discovery processes are done,they are Data selection, Cleaning, Enrichment, Coding, Data mining, Reporting. By Analyzing Association Mining of the study,readers other borrowing behaviors is recovered when borrowing one type of books. The mining-results can help optimize the layout of library and provide technical and decision support for the librarys managers . Clementine12 is used for Data Mining.
Key words: data mining; library; asocciation rules; SqlServer; Clementine
1 概述
我所在圖書(shū)館文獻(xiàn)管理系統(tǒng)已經(jīng)建成和使用多年,隨著圖書(shū)館數(shù)據(jù)庫(kù)中數(shù)據(jù)量的增加,圖書(shū)館的流通管理數(shù)據(jù)正在快速上漲。但海量、分散的流通數(shù)據(jù),往往很難直接發(fā)現(xiàn)其中相互間的聯(lián)系和規(guī)律。本研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于我院的圖書(shū)館數(shù)據(jù)庫(kù),利用關(guān)聯(lián)挖掘?qū)D書(shū)館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類(lèi)圖書(shū)時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以?xún)?yōu)化館藏布局,并為圖書(shū)館管理人員提供技術(shù)和決策支持。本研究過(guò)程包括:數(shù)據(jù)倉(cāng)庫(kù)建立,根據(jù)挖掘主題進(jìn)行數(shù)據(jù)集成和選擇;數(shù)據(jù)變換,數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式;數(shù)據(jù)清理,除噪聲和刪除不一致數(shù)據(jù);數(shù)據(jù)挖掘,使用Clementine12,選擇特定的算法實(shí)施數(shù)據(jù)挖掘;知識(shí)表示,分析和研究數(shù)據(jù)挖掘結(jié)果,向用戶(hù)提供挖掘的知識(shí)。
2 建立數(shù)據(jù)倉(cāng)庫(kù)
參考文獻(xiàn):
[1] 鮑靜,范生萬(wàn).基于數(shù)據(jù)挖掘的圖書(shū)數(shù)據(jù)預(yù)處理[J]. 大學(xué)圖書(shū)情報(bào)學(xué)刊,2008(2).
[2] 陸覺(jué)民,鄭宇.基于矩陣的數(shù)據(jù)挖掘技術(shù)在數(shù)字化圖書(shū)館中的應(yīng)用[J]. 現(xiàn)代情報(bào),2007(12) .
[3] 李虹.面向用戶(hù)的數(shù)字圖書(shū)館信息服務(wù)模式研究[J]. 情報(bào)雜志,2007(08) .
[4] 王偉,張征芳,王海明.基于數(shù)據(jù)挖掘的圖書(shū)館讀者行為分析[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2006(11) .
[5] 魏育輝,潘潔.圖書(shū)流通數(shù)據(jù)的關(guān)聯(lián)挖掘量化分析方法[J]. 現(xiàn)代情報(bào),2005(11) .
[6] 王燕,溫有奎.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在數(shù)字圖書(shū)館中的應(yīng)用[J]. 情報(bào)科學(xué),2007(6) .
[7] 張永梅,韓焱,薛海麗.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書(shū)館中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化,2005(10) .
[8] 司徒浩臻.數(shù)據(jù)挖掘技術(shù)在圖書(shū)館信息服務(wù)中的應(yīng)用[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(10).endprint
摘要:該文將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書(shū)館數(shù)據(jù)庫(kù),挖掘主題確定后,依次進(jìn)行了數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換和清理、數(shù)據(jù)再豐富、編程工作、數(shù)據(jù)挖掘。利用關(guān)聯(lián)挖掘?qū)D書(shū)館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類(lèi)圖書(shū)時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以?xún)?yōu)化館藏布局,并為圖書(shū)館管理人員提供技術(shù)和決策支持。其中數(shù)據(jù)挖掘是使用Clementine12完成。
關(guān)鍵詞:數(shù)據(jù)挖掘;圖書(shū)館;關(guān)聯(lián)規(guī)則;SqlServer;Clementine
中圖分類(lèi)號(hào): TP393. 41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)31-7260-03
Abstract: In this paper ,Data Mining Techniques is used on the library database. After determined areas of focus on the mining, the stages of the knowledge discovery processes are done,they are Data selection, Cleaning, Enrichment, Coding, Data mining, Reporting. By Analyzing Association Mining of the study,readers other borrowing behaviors is recovered when borrowing one type of books. The mining-results can help optimize the layout of library and provide technical and decision support for the librarys managers . Clementine12 is used for Data Mining.
Key words: data mining; library; asocciation rules; SqlServer; Clementine
1 概述
我所在圖書(shū)館文獻(xiàn)管理系統(tǒng)已經(jīng)建成和使用多年,隨著圖書(shū)館數(shù)據(jù)庫(kù)中數(shù)據(jù)量的增加,圖書(shū)館的流通管理數(shù)據(jù)正在快速上漲。但海量、分散的流通數(shù)據(jù),往往很難直接發(fā)現(xiàn)其中相互間的聯(lián)系和規(guī)律。本研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于我院的圖書(shū)館數(shù)據(jù)庫(kù),利用關(guān)聯(lián)挖掘?qū)D書(shū)館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類(lèi)圖書(shū)時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以?xún)?yōu)化館藏布局,并為圖書(shū)館管理人員提供技術(shù)和決策支持。本研究過(guò)程包括:數(shù)據(jù)倉(cāng)庫(kù)建立,根據(jù)挖掘主題進(jìn)行數(shù)據(jù)集成和選擇;數(shù)據(jù)變換,數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式;數(shù)據(jù)清理,除噪聲和刪除不一致數(shù)據(jù);數(shù)據(jù)挖掘,使用Clementine12,選擇特定的算法實(shí)施數(shù)據(jù)挖掘;知識(shí)表示,分析和研究數(shù)據(jù)挖掘結(jié)果,向用戶(hù)提供挖掘的知識(shí)。
2 建立數(shù)據(jù)倉(cāng)庫(kù)
參考文獻(xiàn):
[1] 鮑靜,范生萬(wàn).基于數(shù)據(jù)挖掘的圖書(shū)數(shù)據(jù)預(yù)處理[J]. 大學(xué)圖書(shū)情報(bào)學(xué)刊,2008(2).
[2] 陸覺(jué)民,鄭宇.基于矩陣的數(shù)據(jù)挖掘技術(shù)在數(shù)字化圖書(shū)館中的應(yīng)用[J]. 現(xiàn)代情報(bào),2007(12) .
[3] 李虹.面向用戶(hù)的數(shù)字圖書(shū)館信息服務(wù)模式研究[J]. 情報(bào)雜志,2007(08) .
[4] 王偉,張征芳,王海明.基于數(shù)據(jù)挖掘的圖書(shū)館讀者行為分析[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2006(11) .
[5] 魏育輝,潘潔.圖書(shū)流通數(shù)據(jù)的關(guān)聯(lián)挖掘量化分析方法[J]. 現(xiàn)代情報(bào),2005(11) .
[6] 王燕,溫有奎.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在數(shù)字圖書(shū)館中的應(yīng)用[J]. 情報(bào)科學(xué),2007(6) .
[7] 張永梅,韓焱,薛海麗.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書(shū)館中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化,2005(10) .
[8] 司徒浩臻.數(shù)據(jù)挖掘技術(shù)在圖書(shū)館信息服務(wù)中的應(yīng)用[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(10).endprint