国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用

2018-12-07 07:20:26李雅
中國(guó)管理信息化 2018年19期
關(guān)鍵詞:館藏數(shù)據(jù)挖掘圖書館

李雅

[摘 要] 闡述了數(shù)據(jù)挖掘技術(shù)的概念,提出了數(shù)據(jù)挖掘技術(shù)在高校圖書館中應(yīng)用的必要性,并對(duì)數(shù)據(jù)挖掘在高校圖書館四個(gè)方面的應(yīng)用進(jìn)行了分析,旨在為高校圖書館個(gè)性化信息服務(wù)拋磚引玉。

[關(guān)鍵詞] 數(shù)據(jù)挖掘; 高校圖書館

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 19. 059

[中圖分類號(hào)] G251 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2018)19- 0138- 02

1 數(shù)據(jù)挖掘技術(shù)

1.1 數(shù)據(jù)挖掘技術(shù)概念

隨著科技日新月異的發(fā)展,信息加工和處理也成為信息化的主要技術(shù)支撐,目前,許多領(lǐng)域的問(wèn)題都是通過(guò)數(shù)據(jù)挖掘來(lái)解決的,數(shù)據(jù)挖技術(shù)在人們?nèi)粘I钪袘?yīng)用也越來(lái)越廣泛。數(shù)據(jù)挖掘技術(shù)幫助人們對(duì)各個(gè)領(lǐng)域的信息處理。

數(shù)據(jù)挖掘是什么?

目前,人們對(duì)信息需求遠(yuǎn)遠(yuǎn)大于過(guò)去任何一個(gè)時(shí)代,傳統(tǒng)的統(tǒng)計(jì)工具無(wú)法滿足現(xiàn)階段人們的需求,數(shù)據(jù)挖掘技術(shù)也隨著數(shù)字化、信息化的飛速發(fā)展應(yīng)運(yùn)而生。數(shù)據(jù)挖掘就是根據(jù)已有的不清晰、雜亂無(wú)章的海量信息,提取出所需信息的過(guò)程。

通過(guò)數(shù)據(jù)挖掘,大量無(wú)規(guī)范的數(shù)據(jù)通過(guò)統(tǒng)計(jì)進(jìn)行數(shù)據(jù)分類管理,從而將數(shù)據(jù)的規(guī)律和數(shù)據(jù)模式挖掘出來(lái),并對(duì)未來(lái)數(shù)據(jù)的走向進(jìn)行有效分析和預(yù)測(cè)[1]。數(shù)據(jù)挖掘技術(shù)與很多學(xué)科領(lǐng)域相互交叉應(yīng)用,涉及的知識(shí)面比較廣泛,相比傳統(tǒng)的信息處理方法,從表面上沒(méi)有任何相互關(guān)聯(lián)的數(shù)據(jù)中,挖掘出事情的關(guān)聯(lián)原因,找出事物發(fā)展的規(guī)律,并用數(shù)據(jù)作為支撐,為決策者提供切實(shí)可靠的參考。

1.2 數(shù)據(jù)挖掘類型

按照數(shù)據(jù)結(jié)構(gòu)的方式來(lái)劃分,通??梢苑譃槲谋緮?shù)據(jù)挖掘、Web數(shù)據(jù)挖掘和數(shù)值數(shù)據(jù)挖掘。

1.2.1 文本數(shù)據(jù)挖掘

文本數(shù)據(jù)挖掘,顧名思義就是從文本數(shù)據(jù)中通過(guò)計(jì)算機(jī)處理技術(shù)挖掘出有效、有價(jià)值的信息。文本信息挖掘主要包含兩類,一是文本信息;二是文檔類信息挖掘。數(shù)據(jù)挖掘的對(duì)象均為文本信息數(shù)據(jù)。文本信息挖掘方法主要有:文本分類、文本聚類、信息抽取、摘要及壓縮。

挖掘文本數(shù)據(jù),主要包含對(duì)文本信息特征提取與文本信息分類、分析文本數(shù)據(jù)等。在對(duì)文本數(shù)據(jù)挖掘進(jìn)行應(yīng)用時(shí),主要是以詞串表示法、貝葉斯分類算法、詞集合算法等技術(shù)手段為輔助,以便于完成信息數(shù)據(jù)相關(guān)工作。

1.2.2 Web數(shù)據(jù)挖掘

Web 數(shù)據(jù)挖掘,從字面上來(lái)解讀,是挖掘技術(shù)在Web頁(yè)面上的應(yīng)用。包括針對(duì)Web數(shù)據(jù)等信息,如Web頁(yè)面結(jié)構(gòu)、用戶信息等等信息數(shù)據(jù),進(jìn)行提取、優(yōu)化頁(yè)面設(shè)置,掌握訪問(wèn)用戶的內(nèi)容和行為。為用戶提供更多優(yōu)質(zhì)服務(wù),根據(jù)服務(wù)目的和內(nèi)容的差異,對(duì)不同個(gè)體進(jìn)行差異性的挖掘,具體包括挖掘Web日志、內(nèi)容和結(jié)構(gòu)。

1.2.3 數(shù)值數(shù)據(jù)挖掘

數(shù)值數(shù)據(jù)挖掘,從字面上來(lái)看,主要是對(duì)數(shù)值數(shù)據(jù)的挖掘。主要的任務(wù)有描述數(shù)值數(shù)據(jù)和預(yù)測(cè)數(shù)值數(shù)據(jù)兩種。數(shù)值數(shù)據(jù)挖掘功能為概念描述,重點(diǎn)進(jìn)行分類分析和預(yù)測(cè)分析。常見(jiàn)的方法,有歸納法、模糊數(shù)學(xué)方法、遺傳算法等。

2 數(shù)據(jù)挖掘技術(shù)在高校圖書館建設(shè)中的必要性

2.1 館藏建設(shè)的需要

圖書館作為高??蒲泻椭R(shí)的前沿陣地,它不僅擁有濃郁的書香文化氛圍,豐富的館藏資源也是必不可少的?,F(xiàn)代圖書館,不光需要滿足讀者用戶翻閱紙質(zhì)書籍的需求,也需要滿足數(shù)字資源的需求?,F(xiàn)代科技和互聯(lián)網(wǎng)的發(fā)展,改變了人們的閱讀模式,便利、快捷的碎片化閱讀成為人們首選的閱讀方式。數(shù)字化閱讀越來(lái)越受廣大讀者用戶喜愛(ài),人們可以通過(guò)搜索引擎迅速查閱到所需圖書的相關(guān)信息,具有時(shí)效性和便捷性。計(jì)算機(jī)應(yīng)用技術(shù)的發(fā)展在數(shù)據(jù)挖掘技術(shù)領(lǐng)域,結(jié)合圖書館原有的館藏資源,分析館藏已有資源,將紙質(zhì)書籍做可視化處理,挖掘出信息數(shù)據(jù)中館藏建設(shè)的優(yōu)勢(shì)和劣勢(shì),良好結(jié)合圖書館現(xiàn)有館藏情況進(jìn)行分析,將分析結(jié)果進(jìn)行評(píng)估,這對(duì)豐富館藏建設(shè)有著建設(shè)性意義。高校圖書館館藏必須滿足科研和學(xué)科需要,學(xué)生用戶處于積累知識(shí)階段,所需要的信息資源也是各種各樣,對(duì)讀者信息的挖掘,能夠有效有針對(duì)性的節(jié)省開(kāi)支,館藏內(nèi)容都通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)推算和評(píng)估,以供指導(dǎo)未來(lái)采購(gòu)書籍和學(xué)科建設(shè)[2]。

2.2 滿足用戶多樣化需求

高校圖書館的用戶類型,主要是教師讀者和學(xué)生讀者。讀者用戶的不同,需要提供的信息也大不相同。這就要求圖書館對(duì)讀者多樣化需求進(jìn)行數(shù)據(jù)挖掘,并根據(jù)讀者用戶的個(gè)性化需求來(lái)推送信息。首先,根據(jù)已知基本讀者信息,得出不同讀者的個(gè)性化需求。其次,分析不同讀者信息需求和獲取信息的多樣化途徑。最后,根據(jù)已有信息內(nèi)容和信息獲取方式,進(jìn)行數(shù)據(jù)挖掘分析對(duì)比,從而實(shí)現(xiàn)因人而異的服務(wù)方式,提升圖書館信息服務(wù)質(zhì)量。根據(jù)讀者信息和訪問(wèn)等數(shù)據(jù)挖掘,可以反映出讀者用戶的需求,從而更好地服務(wù)讀者。

2.3 符合圖書館未來(lái)發(fā)展

現(xiàn)代高校圖書館的重要競(jìng)爭(zhēng)力是數(shù)字圖書館,這一點(diǎn)符合“互聯(lián)網(wǎng)+圖書館”的發(fā)展。高校圖書館的應(yīng)用信息系統(tǒng)擁有大量數(shù)字資源,并通過(guò)網(wǎng)絡(luò)技術(shù)等資源進(jìn)行組織和整合,滿足用戶的需求。只有將大量數(shù)據(jù)資源和互聯(lián)網(wǎng)關(guān)聯(lián)信息進(jìn)行有效的數(shù)據(jù)挖掘,才能挖掘出其中的最大價(jià)值,數(shù)據(jù)挖掘技術(shù)在圖書館信息化發(fā)展和信息服務(wù)建設(shè)方面有著無(wú)可替代的優(yōu)勢(shì)。

3 數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用

3.1 數(shù)據(jù)挖掘技術(shù)在文獻(xiàn)推薦中的應(yīng)用

文獻(xiàn)利用率是考核高校圖書館服務(wù)質(zhì)量的一項(xiàng)重要的指標(biāo),如何為讀者用戶提供可參考有價(jià)值的圖書文獻(xiàn),做好文獻(xiàn)推薦工作是高校圖書館個(gè)性化服務(wù)的重要組成部分。

數(shù)據(jù)挖掘技術(shù)在圖書館借閱率中的應(yīng)用,主要是根據(jù)讀者用戶進(jìn)出圖書館的數(shù)據(jù)與借閱、瀏覽圖書數(shù)據(jù)、進(jìn)行分類分析與關(guān)聯(lián)分析。通過(guò)數(shù)據(jù)分析,得出讀者用戶所借閱的數(shù)據(jù)與相關(guān)類別圖書,呈現(xiàn)出一定的關(guān)聯(lián)性,根據(jù)其中的規(guī)律,可以用于后臺(tái)熱點(diǎn)推薦和個(gè)性化推送。

如讀者在借閱卡耐基的《人性的優(yōu)點(diǎn)》時(shí)候,又借閱了相關(guān)心理學(xué)書籍,說(shuō)明這個(gè)讀者喜歡書籍類型,具有一定關(guān)聯(lián),那么適當(dāng)推薦心理學(xué)相關(guān)書籍、勵(lì)志書籍給該讀者,可以幫助讀者節(jié)約查閱書籍的時(shí)間,提高對(duì)圖書館的利用率。

3.2 可視化信息服務(wù)

數(shù)據(jù)挖掘技術(shù)比傳統(tǒng)數(shù)據(jù)統(tǒng)計(jì)和表格更加清晰地體現(xiàn)出直觀效果。人工智能技術(shù)和可視化設(shè)備大量引進(jìn)圖書館后,圖書館不僅僅可以將讀者借閱數(shù)據(jù)、館藏?cái)?shù)據(jù)、個(gè)性化偏好等數(shù)據(jù),用直觀可視化的圖表清晰表現(xiàn)出來(lái)。還為圖書館建設(shè)提供一些參考。通過(guò)收集數(shù)據(jù)-數(shù)據(jù)挖掘-數(shù)據(jù)評(píng)價(jià),將圖書館各項(xiàng)數(shù)據(jù)指標(biāo),實(shí)時(shí)記錄高校圖書館各個(gè)部門人員圖書借閱情況、到館情況、讀者密集度和習(xí)慣,用圖表方式展現(xiàn)出來(lái),為圖書館管理者提供服務(wù)和管理重要依據(jù)。

3.3 閱讀推廣服務(wù)

高校圖書館閱讀推廣服務(wù),為保證廣大讀者用戶更加充分利用圖書館資源,激發(fā)讀者興趣,推廣校園讀書文化有重要意義。數(shù)據(jù)挖掘技術(shù)結(jié)合圖書館閱讀推廣活動(dòng),首先對(duì)讀者用戶的瀏覽圖書館界面和借閱記錄進(jìn)行數(shù)據(jù)采集,根據(jù)讀者偏好,結(jié)合圖書館現(xiàn)有館藏資源,篩選讀者用戶可能感興趣的內(nèi)容,并通過(guò)網(wǎng)絡(luò)手段推送給讀者用戶;其次,根據(jù)搜索數(shù)據(jù)進(jìn)行統(tǒng)計(jì),如將熱門關(guān)鍵詞與館藏資源進(jìn)行數(shù)據(jù)信息匹配,以評(píng)價(jià)最好、熱度最大等排列組合推薦給讀者,如熱門當(dāng)紅讀者、出版社、話題最熱等內(nèi)容。再次,根據(jù)深度挖掘信息數(shù)據(jù),找到相關(guān)規(guī)律,如世界讀書日等熱門節(jié)日,以這些為指標(biāo)為讀者推廣工作提供一些依據(jù)。

3.4 學(xué)科信息服務(wù)

高校圖書館的資源具有豐富的學(xué)術(shù)性特點(diǎn),數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館,為學(xué)院發(fā)展、學(xué)科建設(shè)和服務(wù)提供了特色化服務(wù)。高校圖書館應(yīng)主動(dòng)結(jié)合用戶的實(shí)際需求和專業(yè)特色,進(jìn)行信息服務(wù)。如根據(jù)熱點(diǎn)專業(yè)、精品課程、課堂研究等已有的內(nèi)容,進(jìn)行深度挖掘,使其具有更高價(jià)值,為讀者用戶提供的前沿研究領(lǐng)域和熱點(diǎn)動(dòng)態(tài)。如建筑行業(yè)高校圖書館,重點(diǎn)關(guān)注建筑設(shè)計(jì)、建筑工程、建筑設(shè)備、橋梁等相關(guān)領(lǐng)域前沿研究信息和動(dòng)態(tài),通過(guò)熱點(diǎn)和館內(nèi)資源進(jìn)行深度數(shù)據(jù)挖掘,為讀者用戶從海量數(shù)據(jù)中挑選出隱含的知識(shí)信息,為研究提供正確方向,實(shí)現(xiàn)學(xué)科信息服務(wù)功能。

4 展 望

數(shù)據(jù)挖掘技術(shù)在高校圖書館中除了在文中提到的文獻(xiàn)推薦、可視化信息、學(xué)科信息服務(wù)、閱讀推廣工作中應(yīng)用,在其他圖書館管理工作和建設(shè)中也應(yīng)用得相當(dāng)廣泛。在圖書館未來(lái)發(fā)展中,數(shù)據(jù)挖掘技術(shù)還將進(jìn)一步應(yīng)用于信息服務(wù)中,服務(wù)于高校讀者用戶。如何做好數(shù)據(jù)挖掘工作關(guān)系到高校圖書館信息化的發(fā)展。

主要參考文獻(xiàn)

[1]馬婷婷,李濤.基于數(shù)據(jù)挖掘的高校圖書館信息服務(wù). [J].信息與電腦,2017(22):145-151.

[2]楊建明,劉 芳.基于數(shù)據(jù)挖掘的高校圖書館服務(wù)優(yōu)化研究 [J].情報(bào)與探索,2014(4):25-32.

猜你喜歡
館藏數(shù)據(jù)挖掘圖書館
館藏
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
博物館的生存之道:館藏能否變賣?
知還印館藏印選——古印篇
圖書館
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
飛躍圖書館
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
介紹兩件館藏青銅器
文物春秋(2014年2期)2014-12-24 21:23:05
去圖書館
永顺县| 平阴县| 辽源市| 仙桃市| 德化县| 蛟河市| 石景山区| 巴楚县| 左贡县| 蓝山县| 塔城市| 大新县| 元江| 望江县| 申扎县| 葵青区| 成武县| 鄯善县| 永安市| 河池市| 南川市| 新龙县| 屏东县| 中西区| 阿巴嘎旗| 大石桥市| 伊金霍洛旗| 浦江县| 永吉县| 阿拉尔市| 岑溪市| 清新县| 合肥市| 临洮县| 襄城县| 德令哈市| 稻城县| 斗六市| 岢岚县| 巧家县| 扶风县|