国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的高校圖書(shū)館讀者行為研究——以西南交通大學(xué)圖書(shū)館為例

2013-02-01 06:21:12楊江麗董若劍
圖書(shū)館研究 2013年3期
關(guān)鍵詞:本科生數(shù)據(jù)挖掘圖書(shū)

楊江麗,高 凡,董若劍

(西南交通大學(xué)圖書(shū)館,四川 成都 610031)

1 引言

圖書(shū)館是高校師生學(xué)習(xí)與科研的知識(shí)后盾。 即使在信息資源高速發(fā)展的今天,圖書(shū)的流通借閱依然是高校圖書(shū)館基本的服務(wù)內(nèi)容。 因此,圖書(shū)館每天會(huì)產(chǎn)生大量的圖書(shū)借閱流通記錄數(shù)據(jù),目前大多數(shù)圖書(shū)館只是將這些數(shù)據(jù)用做一些常規(guī)的工作量統(tǒng)計(jì), 圖書(shū)館管理系統(tǒng)無(wú)法發(fā)現(xiàn)這些數(shù)據(jù)中存在的關(guān)系和規(guī)則,無(wú)法預(yù)測(cè)讀者的信息需求。 利用數(shù)據(jù)挖掘技術(shù),分析這些數(shù)據(jù)之間的關(guān)聯(lián),有利于合理配置資源和提高圖書(shū)館資源的利用率,同時(shí)能提高服務(wù)水平,使圖書(shū)館的服務(wù)能真正滿足師生的需求。

2 數(shù)據(jù)挖掘技術(shù)及其在圖書(shū)館領(lǐng)域中的研究現(xiàn)狀

2.1 數(shù)據(jù)挖掘的定義

數(shù)據(jù)挖掘是指從數(shù)據(jù)集合中自動(dòng)抽取隱藏在數(shù)據(jù)中的那些有用信息的非平凡過(guò)程, 這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。 它可幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測(cè)未來(lái)可能發(fā)生的行為。 數(shù)據(jù)挖掘的主要特點(diǎn)是對(duì)數(shù)據(jù)庫(kù)中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,并從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘是KDD(Knowledge Discovery in Database)中的重要技術(shù),它并不是用規(guī)范的數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)言(如SQL)進(jìn)行查詢(xún),而是對(duì)查詢(xún)的內(nèi)容進(jìn)行模式的總結(jié)和內(nèi)在規(guī)律的搜索。

2.2 數(shù)據(jù)挖掘的方法

數(shù)據(jù)挖掘的研究融合了多個(gè)不同學(xué)科領(lǐng)域的技術(shù)與成果, 使得目前的數(shù)據(jù)挖掘方法表現(xiàn)出多種多樣的形式。從統(tǒng)計(jì)分析類(lèi)的角度來(lái)說(shuō),統(tǒng)計(jì)分析技術(shù)中使用的數(shù)據(jù)挖掘模型有線形分析和非線形分析、回歸分析、邏輯回歸分析、單變量分析、多變量分析、時(shí)間序列分析、最近序列分析、最近鄰算法和聚類(lèi)分析等方法。 圖書(shū)館領(lǐng)域一般使用知識(shí)發(fā)現(xiàn)類(lèi)數(shù)據(jù)挖掘技術(shù),它是一種與統(tǒng)計(jì)分析類(lèi)數(shù)據(jù)挖掘技術(shù)完全不同的挖掘技術(shù),包括人工神經(jīng)元網(wǎng)絡(luò)、支持向量機(jī)、決策樹(shù)、遺傳算法、粗糙集、規(guī)則發(fā)現(xiàn)和關(guān)聯(lián)順序等。

2.3 數(shù)據(jù)挖掘的過(guò)程

數(shù)據(jù)挖掘一般分為三個(gè)階段:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果的評(píng)價(jià)和表達(dá)。 詳細(xì)流程見(jiàn)圖1。

圖1 數(shù)據(jù)挖掘的過(guò)程

3 數(shù)據(jù)挖掘技術(shù)在圖書(shū)館領(lǐng)域中的研究現(xiàn)狀

我國(guó)從20 世紀(jì)90 年代中期開(kāi)始開(kāi)展數(shù)據(jù)挖掘的研究,但發(fā)展十分迅速。 隨著計(jì)算機(jī)、人工智能、數(shù)理統(tǒng)計(jì)科學(xué)的迅速發(fā)展及數(shù)據(jù)庫(kù)技術(shù)的大規(guī)模應(yīng)用而越來(lái)越顯示出其強(qiáng)大的生命力。

在國(guó)內(nèi),數(shù)據(jù)挖掘技術(shù)在圖書(shū)館領(lǐng)域中的研究才剛剛起步,研究主要集中在高校的科研隊(duì)伍中,沒(méi)有形成整體的研究團(tuán)隊(duì)。 通過(guò)對(duì)中國(guó)期刊全文數(shù)據(jù)庫(kù)網(wǎng)站(CNKI)的檢索分析,共有298 篇該主題研究的相關(guān)報(bào)道。 從2000 年開(kāi)始就有相關(guān)文獻(xiàn)對(duì)數(shù)據(jù)挖掘技術(shù)在圖書(shū)館中的應(yīng)用的研究報(bào)道,2005 年進(jìn)入了高速發(fā)展期,2010 年相關(guān)文獻(xiàn)有41 篇,截至2011 年9 月已經(jīng)有39 篇相關(guān)研究報(bào)道。 由此看來(lái),數(shù)據(jù)挖掘技術(shù)在我國(guó)圖書(shū)館領(lǐng)域中的應(yīng)用研究還趨于上升階段。

4 圖書(shū)館數(shù)據(jù)挖掘技術(shù)的實(shí)例研究

4.1 研究對(duì)象與目的

本文以高校本科生讀者作為研究對(duì)象,研究該類(lèi)讀者在校期間的借閱行為,讀者從入學(xué)到畢業(yè)的時(shí)間是一個(gè)完整的學(xué)習(xí)階段,通過(guò)對(duì)其在校期間借閱數(shù)據(jù)的分析,可以分析出本科生和研究生讀者在校幾年中的表現(xiàn)和特點(diǎn),還有其借閱行為的不同之處;同時(shí)研究不同類(lèi)別的圖書(shū)在該專(zhuān)業(yè)的利用率,其結(jié)論可以給圖書(shū)館優(yōu)化館藏資源提供有效、科學(xué)的依據(jù),更好地滿足讀者的閱讀要求。

4.2 數(shù)據(jù)的準(zhǔn)備

圖2 西南交通大學(xué)2006 級(jí)本科生原始借閱數(shù)據(jù)(部分)

本文選用西南交通大學(xué)圖書(shū)館BSLC 圖書(shū)館管理系統(tǒng)中的借閱記錄、館藏記錄、讀者信息記錄等數(shù)據(jù)庫(kù)中的數(shù)據(jù)。 西南交通大學(xué)為“211 院?!保x者具有知識(shí)、地域多元性,對(duì)于數(shù)據(jù)挖掘的樣本提取也具有多樣性和代表性。 圖書(shū)館數(shù)據(jù)庫(kù)系統(tǒng)中有眾多的數(shù)據(jù)表, 通過(guò)SQL 查詢(xún)語(yǔ)言從數(shù)據(jù)表中提取所需數(shù)據(jù),導(dǎo)出數(shù)據(jù)的主要字段包括:借閱證號(hào)、姓名、讀者類(lèi)型、題名、索書(shū)號(hào)、借閱時(shí)間,參見(jiàn)圖2。 本文采用西南交通大學(xué)2006 級(jí)土木學(xué)院本科生在圖書(shū)館系統(tǒng)中記錄的33 634 條借閱數(shù)據(jù)作為分析的數(shù)據(jù)來(lái)源。

4.3 運(yùn)用spss 軟件進(jìn)行數(shù)據(jù)分析處理

按照借閱時(shí)間分別整理2006 級(jí)土木學(xué)院本科生四個(gè)學(xué)年的借閱數(shù)據(jù), 將整理后的數(shù)據(jù)導(dǎo)入spss 軟件進(jìn)行數(shù)據(jù)分析,得出這些讀者在各年級(jí)的借閱情況,見(jiàn)表1。 可以看出,讀者在大一到大三的借閱量逐年增長(zhǎng),在大三時(shí)借閱量達(dá)到最高的9 640 冊(cè)次,占四個(gè)學(xué)年比例的28.7%,大四時(shí)借閱量最少,低于大一的圖書(shū)借閱量。

表1 各年級(jí)大學(xué)生讀者借閱量統(tǒng)計(jì)

用中圖法將原始數(shù)據(jù)中的分類(lèi)號(hào)進(jìn)行轉(zhuǎn)換, 并且用spss 軟件對(duì)該級(jí)讀者整個(gè)本科階段的借閱量進(jìn)行分析后,得出讀者借閱各類(lèi)圖書(shū)的情況,見(jiàn)圖3。 土木學(xué)院屬于工科學(xué)科范疇,所以學(xué)生對(duì)工業(yè)技術(shù)類(lèi)的書(shū)籍需求量最大,在借閱圖書(shū)時(shí)主要以與專(zhuān)業(yè)相關(guān)的參考書(shū)和基礎(chǔ)理論書(shū)籍為主,該類(lèi)書(shū)籍占到了總借閱量的31.2%;同時(shí)文學(xué)、語(yǔ)言類(lèi)的圖書(shū)也是該類(lèi)讀者的熱門(mén)借閱類(lèi)型。 因此,圖書(shū)館在采購(gòu)圖書(shū)時(shí)應(yīng)根據(jù)其借閱特點(diǎn),對(duì)讀者需求量大的圖書(shū)應(yīng)適當(dāng)增加復(fù)本,以滿足讀者的借閱需求。

圖3 各類(lèi)圖書(shū)借閱情況柱形圖

為了觀察同級(jí)讀者在不同年級(jí)借閱情況的變化,將整理后數(shù)據(jù)進(jìn)行分類(lèi),并將最后的數(shù)據(jù)導(dǎo)入spss軟件,針對(duì)不同年級(jí)學(xué)生對(duì)不同類(lèi)型圖書(shū)的借閱情況進(jìn)行分析比較,參見(jiàn)表2。

利用卡方檢驗(yàn)來(lái)考察圖書(shū)類(lèi)型變量和讀者所在年級(jí)兩個(gè)變量是否有關(guān)系, 該檢驗(yàn)?zāi)茌^精確地給出這種判斷的可靠程度。經(jīng)過(guò)對(duì)變量的檢驗(yàn),從表3 可以明顯看出借閱圖書(shū)的類(lèi)型與讀者所在年級(jí)變量存在顯著性關(guān)系,相同的讀者,隨著年級(jí)的不同,借閱圖書(shū)類(lèi)型也在發(fā)生變化。

表2 不同年級(jí)大學(xué)生對(duì)不同類(lèi)型圖書(shū)借閱統(tǒng)計(jì)表(部分)

表3 卡方檢驗(yàn)

圖4 不同年級(jí)的借閱情況條形圖

將表2 中的結(jié)果用條形圖表示(見(jiàn)圖4),從中可以很直觀地看出借閱圖書(shū)的類(lèi)型與讀者所在年級(jí)存在顯著性關(guān)系,這個(gè)結(jié)論和表3 卡方檢驗(yàn)的結(jié)論相吻合。 對(duì)于土木學(xué)院本科生讀者來(lái)說(shuō),大一主要是學(xué)習(xí)基礎(chǔ)知識(shí),所以對(duì)基礎(chǔ)學(xué)科的書(shū)籍需求量較大,因?yàn)檫€沒(méi)有具體的接受專(zhuān)業(yè)課學(xué)習(xí),所以對(duì)專(zhuān)業(yè)書(shū)籍需求較少,隨著對(duì)專(zhuān)業(yè)課學(xué)習(xí)研究的不斷深入,讀者對(duì)專(zhuān)業(yè)書(shū)籍需求量呈明顯的逐年增長(zhǎng)態(tài)勢(shì),大三達(dá)到最高峰,占當(dāng)年總借閱量的32.5%;語(yǔ)言類(lèi)、文學(xué)類(lèi)的書(shū)籍在大一、大二、大三需求相對(duì)穩(wěn)定,大四由于要完成畢業(yè)論文、找工作等借閱量呈減少趨勢(shì),但整體來(lái)看,以工科為主的該類(lèi)讀者群體,除了對(duì)相關(guān)專(zhuān)業(yè)的學(xué)習(xí)外,對(duì)語(yǔ)言文化及文學(xué)修養(yǎng)也非常重視,對(duì)這些書(shū)籍的需求相對(duì)較大,僅次于專(zhuān)業(yè)書(shū)籍的需求。圖書(shū)館利用數(shù)據(jù)挖掘技術(shù),可以準(zhǔn)確地把握讀者的需求,提高讀者借閱的滿意度。同時(shí)也將圖書(shū)館采購(gòu)圖書(shū)中的人為的主觀性降到最低,最大限度地提高決策的科學(xué)性、準(zhǔn)確性和全面性。

專(zhuān)業(yè)類(lèi)書(shū)籍是土木學(xué)院本科生讀者的主要閱讀類(lèi)型, 讀者借閱專(zhuān)業(yè)類(lèi)書(shū)籍?dāng)?shù)據(jù)描述如表4 所示,通過(guò)spss 軟件分析隨著學(xué)生年級(jí)的變化與對(duì)專(zhuān)業(yè)類(lèi)書(shū)籍的需求是否存在顯著性變化,對(duì)兩個(gè)變量的分析見(jiàn)表5,顯著性(0.000)〈0.05 表示兩個(gè)變量之間存在顯著性差異,這說(shuō)明隨著年級(jí)的不同,學(xué)生對(duì)工業(yè)用書(shū)的需求量也在發(fā)生著明顯的變化。

表4 專(zhuān)業(yè)類(lèi)書(shū)籍借閱數(shù)據(jù)描述

表5 顯著性分析

5 結(jié)束語(yǔ)

在數(shù)字化時(shí)代,圖書(shū)館需要在龐大信息資源中挖掘信息,為個(gè)性化優(yōu)質(zhì)服務(wù)提供有效的決策依據(jù)。讀者的借閱數(shù)據(jù)可以帶給圖書(shū)館決策者很多不同的有價(jià)值的信息,文中的研究分析方法及結(jié)果只是其中的一小部分。 根據(jù)數(shù)據(jù)挖掘技術(shù)對(duì)高校圖書(shū)館讀者行為分析的結(jié)果,圖書(shū)館可以掌握高校圖書(shū)館讀者的借閱規(guī)律,把握讀者的借閱傾向,進(jìn)而優(yōu)化館藏資源,提高高校圖書(shū)館館藏資源的利用率,準(zhǔn)確提供讀者所需要的書(shū)籍。

[1] 王斌.數(shù)據(jù)挖掘在高校圖書(shū)館中的應(yīng)用研究[D].西安:西安理工大學(xué),2010.

[2] 王桂芹,黃道.數(shù)據(jù)挖掘技術(shù)綜述[J].電腦應(yīng)用技術(shù),2007(69):9-14.

[3] 楊光,張學(xué)潮.數(shù)據(jù)挖掘在高校圖書(shū)館用戶行為分析中的應(yīng)用——以山西大學(xué)圖書(shū)館為例[J].晉圖學(xué)刊,2011(2):19-28.

[4] 廖秋榮.基于數(shù)據(jù)挖掘的圖書(shū)館的讀者借閱行為分析[J].柳州職業(yè)技術(shù)學(xué)院學(xué)報(bào),2011(11):90-93.

[5] 譚云江,凌云,閆海峰,等.基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)館讀者行為研究[J].圖書(shū)情報(bào)工作,2010(Z2):359-362.

猜你喜歡
本科生數(shù)據(jù)挖掘圖書(shū)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
圖書(shū)推薦
南風(fēng)(2020年22期)2020-09-15 07:47:08
歡迎來(lái)到圖書(shū)借閱角
班里有個(gè)圖書(shū)角
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
中醫(yī)藥大學(xué)本科生流行病學(xué)教學(xué)改革初探
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
探索如何提高藥學(xué)本科生實(shí)習(xí)的質(zhì)量
基于GPGPU的離散數(shù)據(jù)挖掘研究
讓教授回歸本科生課堂
镇康县| 安多县| 晋江市| 囊谦县| 华阴市| 应城市| 永修县| 福清市| 含山县| 册亨县| 巴彦淖尔市| 江都市| 壶关县| 阳新县| 弥勒县| 长白| 德令哈市| 兰溪市| 阿巴嘎旗| 理塘县| 临邑县| 宜宾县| 桂阳县| 安图县| 科技| 皮山县| 阳信县| 大兴区| 桐城市| 普格县| 五寨县| 仙游县| 荔浦县| 阳高县| 永川市| 大安市| 遂溪县| 宜州市| 晴隆县| 南溪县| 博爱县|