張雷蕾
摘要:隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,高校圖書(shū)館傳統(tǒng)管理模式和系統(tǒng)受到了巨大的沖擊,現(xiàn)階段,結(jié)合大數(shù)據(jù)和云計(jì)算等技術(shù),提高圖書(shū)館系統(tǒng)管理功能顯得尤為重要。目前,讀者對(duì)于圖書(shū)館要求不僅僅限于傳統(tǒng)借還服務(wù)方式上,還包括網(wǎng)絡(luò)檢索、快速查閱、個(gè)性化服務(wù)等多方面。圖書(shū)館系統(tǒng)建設(shè)中要充分利用現(xiàn)代網(wǎng)絡(luò)及信息技術(shù),促進(jìn)推薦系統(tǒng)的逐步完善,加強(qiáng)信息審核,結(jié)合讀者需求定期推薦,進(jìn)而提高圖書(shū)服務(wù)水平。本文首先對(duì)數(shù)據(jù)挖掘的概念進(jìn)行了分析,指出了圖書(shū)館系統(tǒng)應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì),對(duì)具體算法、數(shù)據(jù)處理和關(guān)鍵技術(shù)改進(jìn)提出了有效的建議和對(duì)策。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);圖書(shū)館;推薦系統(tǒng)
中圖分類號(hào):TP311 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)13-0001-02
現(xiàn)代網(wǎng)絡(luò)技術(shù)的發(fā)展,使圖書(shū)館發(fā)生了翻天覆地的變革,最初的紙質(zhì)圖書(shū)館到目前的自動(dòng)化、智能化圖書(shū)館,網(wǎng)絡(luò)虛擬技術(shù)在圖書(shū)館系統(tǒng)中的應(yīng)用較為普遍。目前,圖書(shū)館系統(tǒng)中服務(wù)項(xiàng)目逐漸增加,讀者圖書(shū)服務(wù)水平逐漸提高,但是針對(duì)性的個(gè)性化的服務(wù)項(xiàng)目還有待挖掘和完善。我國(guó)高校建設(shè)也十分重視圖書(shū)館的建設(shè)和發(fā)展,推進(jìn)數(shù)字化校園建設(shè)。數(shù)據(jù)挖掘技術(shù)作為信息技術(shù)中的重要組成部分,在圖書(shū)館推薦系統(tǒng)中應(yīng)用該類技術(shù),可以實(shí)現(xiàn)為讀者提供個(gè)性化服務(wù),創(chuàng)新管理形式,促進(jìn)系統(tǒng)功能優(yōu)化,進(jìn)而促進(jìn)圖書(shū)館建設(shè)的日趨完善。
1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘概念最早是在加拿大被提出,1995年加拿大蒙特利爾第一屆知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘國(guó)際會(huì)議上國(guó)外學(xué)者Usaama提出,后期在美國(guó)底特律舉行的學(xué)術(shù)會(huì)議上,對(duì)人工智能進(jìn)行了系統(tǒng)的分析。從20世紀(jì)依賴,數(shù)據(jù)技術(shù)逐步萬(wàn)漢,數(shù)據(jù)庫(kù)系統(tǒng)建設(shè)逐步更新,數(shù)據(jù)信息整合和挖掘的水平顯著提高,很多有價(jià)值的信息被快速提取出來(lái)。由于海量信息處理的難度加大,數(shù)據(jù)挖掘和篩選技術(shù)應(yīng)運(yùn)而生,數(shù)據(jù)挖掘技術(shù)逐漸被人們關(guān)注和認(rèn)可。數(shù)據(jù)挖掘技術(shù)的發(fā)展是與計(jì)算機(jī)技術(shù)革新、數(shù)據(jù)庫(kù)建設(shè)發(fā)展和網(wǎng)絡(luò)信息技術(shù)發(fā)展息息相關(guān)的。知識(shí)發(fā)現(xiàn)也是一個(gè)重要的相關(guān)概念,是指在海量信息中辨別出有價(jià)值的知識(shí),這是對(duì)數(shù)據(jù)和信息的高級(jí)處理過(guò)程。數(shù)據(jù)挖掘技術(shù)是知識(shí)發(fā)現(xiàn)的核心技術(shù),是從數(shù)據(jù)庫(kù)中提取特定規(guī)律的數(shù)據(jù)和信息,作為參考,進(jìn)而提煉出用戶所需的最終信息和資源。
2 圖書(shū)館服務(wù)系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì)
數(shù)據(jù)挖掘技術(shù)對(duì)于人類生活和工作的影響是十分突出的,這是一種高效便捷的數(shù)據(jù)整合和篩選技術(shù),集成了多個(gè)領(lǐng)域的知識(shí)系統(tǒng),目前正逐步走向成熟,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校圖書(shū)館智能體系中,十分必要。
2.1 數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì)
2.1.1 信息需求的促進(jìn)
隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,人們對(duì)于信息的需求量逐漸增加,使用層次加深,在眾多海量信息和數(shù)據(jù)中,如何將復(fù)雜的數(shù)據(jù)轉(zhuǎn)換成有價(jià)值的資源和信息是十分必要的。在圖書(shū)館系統(tǒng)中龐大的數(shù)據(jù)和信息資源難以計(jì)算和篩選,必須采用一種先進(jìn)的技術(shù),實(shí)現(xiàn)數(shù)據(jù)的整合和處理,進(jìn)而篩選出有價(jià)值的資源,為讀者提供針對(duì)性的圖書(shū)服務(wù)。
2.1.2 爭(zhēng)取潛在讀者的需求
圖書(shū)館管理系統(tǒng)中,很多讀者的訪問(wèn)數(shù)據(jù)都存在這里,如何將這些數(shù)據(jù)和信息進(jìn)行整合至關(guān)重要,數(shù)據(jù)挖掘技術(shù)就是這樣一種技術(shù),可以對(duì)數(shù)據(jù)進(jìn)行分類處理,從而確定圖書(shū)館中那類書(shū)籍借閱量較大,讀者感興趣的書(shū)籍都是哪些類別。數(shù)據(jù)挖掘技術(shù)可以將一些隱藏的信息挖掘出來(lái),將智能整合后的資源和信息推送給讀者,進(jìn)而更好地為讀者服務(wù)。
2.1.3 提高獲取信息和數(shù)據(jù)的速度
圖書(shū)館系統(tǒng)要定期更新,在傳統(tǒng)系統(tǒng)使用中,對(duì)于數(shù)據(jù)和信息的處理和計(jì)算速度較慢,數(shù)據(jù)挖掘技術(shù)可以有效地避免這些弊端,計(jì)算速度極快,信息篩選能力強(qiáng),使用這類技術(shù)可以顯著提高圖書(shū)館系統(tǒng)的各項(xiàng)功能。數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以提高圖書(shū)館獲取資源的速率,提升讀者應(yīng)用體驗(yàn),提高系統(tǒng)反應(yīng)能力。
2.2 數(shù)據(jù)挖掘技術(shù)的可行性分析
我國(guó)高校圖書(shū)館積累了很多的經(jīng)驗(yàn),數(shù)據(jù)挖掘技術(shù)在實(shí)際應(yīng)用中是具有可行性的。首先,我國(guó)高校現(xiàn)代化建設(shè)水平逐步提高,為了發(fā)揮圖書(shū)館的價(jià)值,要充分利用信息資源,挖掘數(shù)據(jù)和信息中有價(jià)值的資源,提高數(shù)據(jù)的利用率,從而提高圖書(shū)館服務(wù)質(zhì)量。圖書(shū)館喲滿足讀者的需求,要提供個(gè)性化、針對(duì)性的服務(wù),這也是圖書(shū)推薦系統(tǒng)的主要功能,這就需要對(duì)現(xiàn)有數(shù)據(jù)和信息進(jìn)行挖掘和處理,對(duì)數(shù)據(jù)進(jìn)行分析,加強(qiáng)信息管理,組織各類數(shù)據(jù),為圖書(shū)館的知識(shí)管理提供依據(jù)。其次,數(shù)據(jù)挖掘技術(shù)逐漸成熟也為圖書(shū)館推薦系統(tǒng)的逐步完善提供了可能。數(shù)據(jù)挖掘技術(shù)目前應(yīng)用多種領(lǐng)域,包括工業(yè)生產(chǎn)、醫(yī)療機(jī)構(gòu)、圖書(shū)管理系統(tǒng)等等,數(shù)據(jù)挖掘技術(shù)逐步的發(fā)展和完善,運(yùn)作方式方法日趨成熟,管理方便,技術(shù)逐步革新,圖書(shū)館推薦系統(tǒng)應(yīng)用數(shù)據(jù)挖掘技術(shù)十分可行。另外,圖書(shū)館信息化建設(shè)水平逐漸提高,數(shù)據(jù)庫(kù)建設(shè)較為完善,數(shù)據(jù)庫(kù)系統(tǒng)分析能力不斷增強(qiáng),圖像數(shù)據(jù)庫(kù)、對(duì)象數(shù)據(jù)庫(kù)、智能數(shù)據(jù)庫(kù)逐步建設(shè),這也為數(shù)據(jù)挖掘技術(shù)的應(yīng)用提供了平臺(tái)。
3 數(shù)據(jù)挖掘算法
3.1 分類分析
對(duì)于數(shù)據(jù)分類的分析是比較基礎(chǔ)的,要對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,要采取科學(xué)的算法進(jìn)行計(jì)算,數(shù)據(jù)庫(kù)確定后要進(jìn)行初步分析,做好數(shù)據(jù)類別的基本分類,要做好類別描述,要根據(jù)數(shù)據(jù)性質(zhì)進(jìn)行建立模型,之后要利用原有信息和數(shù)據(jù)進(jìn)行研究,加強(qiáng)信息和數(shù)據(jù)預(yù)測(cè)。
3.2 聚類分析
聚類分析是指將數(shù)據(jù)和信息分為若干類別,主要根據(jù)分析對(duì)象的特征找出一定的規(guī)律,進(jìn)而對(duì)同一類型數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分布模式較為特殊,對(duì)數(shù)據(jù)之間的關(guān)系進(jìn)行分析。
3.3 關(guān)聯(lián)分析
數(shù)據(jù)挖掘技術(shù)中的算法還有關(guān)聯(lián)分析,這也是基礎(chǔ)算法之一,主要是針對(duì)不同的數(shù)據(jù)建立一種聯(lián)系,可以是因果聯(lián)系、時(shí)序聯(lián)系或簡(jiǎn)單聯(lián)系等等,進(jìn)而實(shí)現(xiàn)各類數(shù)據(jù)的瞬間提取和篩選。