〔摘 要〕隨著資源的數(shù)字化程度不斷提高,高校圖書館數(shù)字資源建設(shè)也得到逐步重視。數(shù)字資源的真實(shí)利用率一直是圖書館管理者所希望得到的數(shù)據(jù)之一。而數(shù)字資源使用率數(shù)據(jù)一般由數(shù)字資源供應(yīng)商提供,真實(shí)性和準(zhǔn)確性有待商榷。由于高校圖書館數(shù)字資源使用范圍有一定的限制性,借助于這個(gè)特點(diǎn),設(shè)計(jì)與建設(shè)數(shù)字資源訪問(wèn)統(tǒng)計(jì)系統(tǒng),提供圖書館數(shù)字資源使用的真實(shí)信息,為圖書館資源建設(shè)提供決策基礎(chǔ)。本文從圖書館需求入手,引入系統(tǒng)需求和系統(tǒng)技術(shù)原理,同時(shí)介紹系統(tǒng)實(shí)現(xiàn)案例部分內(nèi)容,指出數(shù)字資源統(tǒng)計(jì)系統(tǒng)建設(shè)的必要性與存在的難題。
〔關(guān)鍵詞〕數(shù)字資源;統(tǒng)計(jì)系統(tǒng);高校圖書館
DOI:10.3969/j.issn.1008-0821.2015.09.026
〔中圖分類號(hào)〕G25074 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2015)09-0140-06
〔Abstract〕With the constant improvement degree of digital resources,the university library digital resource construction also gradually attention.True utilization ratio of digital resource has been one of library managers hope to get the data.The digital resource utilization data generally by digital resource suppliers,authenticity and accuracy is up for debate.Due to the college library digital resources have certain restriction,using range by using this feature,the design and construction of digital resources access statistics system,to provide the true information,library digital resources use resources construction to provide decision-making basis for the library.This article obtained from the library demand,the introduction of system requirements and system technology theory,at the same time introduce case part of system implementation,and pointed out the necessity of statistic system of digital resources construction and the existing problems.
〔Key words〕digital resources;the statistical system;the university library
1 數(shù)字資源使用現(xiàn)狀
11 相關(guān)研究
截至2015年1月15日為止,通過(guò)對(duì)中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)搜索關(guān)鍵詞“數(shù)字資源使用統(tǒng)計(jì)”,一共搜索出5篇研究性論文。其中,學(xué)者秦鴻[1]以數(shù)字資源績(jī)效評(píng)估為切入點(diǎn),從數(shù)據(jù)分析方面進(jìn)行決策,認(rèn)為使用量和成本的定量評(píng)價(jià)必須結(jié)合學(xué)科相關(guān)性、用戶調(diào)查等定性評(píng)價(jià)。數(shù)字資源績(jī)效研究,主要分3個(gè)方面:第一是數(shù)字資源評(píng)價(jià)指標(biāo)體系相關(guān)研究;第二是數(shù)字資源使用統(tǒng)計(jì)研究,包括使用數(shù)據(jù)獲取方法以及數(shù)據(jù)的分析應(yīng)用;第三是數(shù)據(jù)資源的評(píng)價(jià)方法選取研究等等。段惠靜[2]從數(shù)字服務(wù)績(jī)效評(píng)估相關(guān)的使用統(tǒng)計(jì)數(shù)據(jù)入手,進(jìn)行系統(tǒng)的分析與闡釋,從而建設(shè)相關(guān)的數(shù)字資源評(píng)估體系。而對(duì)于數(shù)字資源使用相關(guān)研究中,杜瑩琦[3]從試用數(shù)字資源方面進(jìn)行把關(guān),結(jié)合下載頻次等相關(guān)條件進(jìn)行綜合評(píng)價(jià)。吳金鵬[4]認(rèn)為公共網(wǎng)絡(luò)資源與圖書館數(shù)字資源,兩者在爭(zhēng)奪讀者方面形成競(jìng)爭(zhēng)態(tài)勢(shì)??v觀以上研究,在獲取數(shù)字資源使用數(shù)據(jù)方面,沒(méi)有客觀有效的方法。而真實(shí)使用數(shù)據(jù)的獲取,是對(duì)數(shù)字資源使用情況乃至評(píng)估的基礎(chǔ),所以構(gòu)建數(shù)字資源使用統(tǒng)計(jì)系統(tǒng)迫在眉睫。
12 評(píng)估需要
根據(jù)教育部高校圖工委的相關(guān)報(bào)告指出,我國(guó)高等學(xué)校的數(shù)字資源采購(gòu)經(jīng)費(fèi)逐年提高。同時(shí)高等學(xué)校對(duì)數(shù)字資源的投入不斷加大,評(píng)估數(shù)字資源效率問(wèn)題也逐步被相關(guān)圖書館所重視。而對(duì)數(shù)字資源使用的各項(xiàng)評(píng)估,最基礎(chǔ)的數(shù)據(jù)就是使用率。而客觀真實(shí)的使用率數(shù)據(jù),是影響圖書館決策者們正確判斷的基礎(chǔ)。所以,客觀真實(shí)使用率數(shù)據(jù)的獲得,是圖書館對(duì)各種數(shù)字資源評(píng)估的關(guān)鍵因素。
2 研究理論現(xiàn)實(shí)意義
21 理論意義
對(duì)于高校而言,圖書館作為一個(gè)文獻(xiàn)資源保障部門,提供服務(wù)效益不能與產(chǎn)品相同,也不能通過(guò)產(chǎn)值和利潤(rùn)進(jìn)行衡量。同時(shí),隨著社會(huì)的不斷發(fā)展,資源的建設(shè)成本不斷提高,而圖書館的建設(shè)經(jīng)費(fèi)也有所增加,但是不能與資源增長(zhǎng)費(fèi)用成正比,造成了一定的圖書館經(jīng)費(fèi)匱乏。與此同時(shí),讀者對(duì)資源信息獲取的要求也不斷提高,讀者群體不斷增大。這些諸多因素的集合,使圖書館在資源建設(shè)過(guò)程中,必須要考慮到資源的合理化建設(shè)的問(wèn)題。簡(jiǎn)單來(lái)說(shuō),用有限的資源建設(shè)經(jīng)費(fèi),購(gòu)買能夠滿足大部分讀者的需求的資源。
22 現(xiàn)實(shí)意義
高校對(duì)圖書館進(jìn)行投入,主要目的就是通過(guò)圖書館,為讀者的教學(xué)與科研進(jìn)行服務(wù),從而提高讀者的教學(xué)質(zhì)量和科研水平。隨著信息化程度的不斷提高,讀者對(duì)于數(shù)字資源的依賴性不斷加強(qiáng)。隨著資源成本的不斷增加,使圖書館在數(shù)字資源建設(shè)中,必須要遵循一定評(píng)估機(jī)制,通過(guò)數(shù)字資源使用率這個(gè)基礎(chǔ)數(shù)據(jù),對(duì)數(shù)字資源進(jìn)行一定的評(píng)價(jià),同時(shí)也促使數(shù)字資源供應(yīng)商不斷加強(qiáng)對(duì)讀者的宣傳和培訓(xùn),從而提高數(shù)字資源的使用率。做到了資源的最大化利用,避免了資源的浪費(fèi)。endprint
3 數(shù)據(jù)分析方法選取
31 數(shù)據(jù)分析原理
數(shù)字資源使用的數(shù)據(jù),是進(jìn)行數(shù)據(jù)分析的基礎(chǔ),也是數(shù)據(jù)分析的關(guān)鍵。數(shù)據(jù)分析[5]是為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程。數(shù)據(jù)也稱觀測(cè)值,是實(shí)驗(yàn)、測(cè)量、觀察、調(diào)查等的結(jié)果,常以數(shù)量的形式給出。進(jìn)行數(shù)據(jù)分析,首先要定義問(wèn)題,例如數(shù)字資源使用系統(tǒng)數(shù)據(jù)分析等,主要目的就是對(duì)圖書館數(shù)字資源使用數(shù)據(jù)進(jìn)行有效分析,向決策者提供真實(shí)有效的數(shù)據(jù)分析結(jié)果。數(shù)字資源數(shù)據(jù)分析流程可以用圖1來(lái)表示:
從圖1中可以看出,整個(gè)數(shù)字資源評(píng)價(jià)過(guò)程,數(shù)字資源使用數(shù)據(jù)獲取關(guān)系到整個(gè)數(shù)字資源評(píng)價(jià)結(jié)論,因此,數(shù)字資源使用數(shù)據(jù)的真實(shí)性,直接影響到?jīng)Q策者們對(duì)數(shù)字資源建設(shè)規(guī)劃與政策制定。
32 數(shù)據(jù)指標(biāo)確定
根據(jù)高校圖書館數(shù)字資源的存在形式,可以分為:期刊型數(shù)據(jù)庫(kù),例如:中國(guó)知網(wǎng),萬(wàn)方知識(shí),維普期刊資源等等。電子書型數(shù)據(jù)庫(kù),例如:超星數(shù)字圖書館,中華數(shù)字書苑等等。文摘索引型數(shù)據(jù)庫(kù),例如中文社會(huì)科學(xué)引文索引,讀秀學(xué)術(shù)搜索,方略學(xué)科導(dǎo)航等等,多媒體學(xué)習(xí)型數(shù)據(jù)庫(kù),例如:超星學(xué)術(shù)視頻數(shù)據(jù)庫(kù),新東方多媒體學(xué)習(xí)庫(kù)等等。數(shù)字資源呈現(xiàn)方式不徑相同,所以對(duì)數(shù)據(jù)指標(biāo)的確定,需要進(jìn)行相應(yīng)的調(diào)整。根據(jù)以上數(shù)字資源存在形式,結(jié)合各個(gè)數(shù)字資源使用方式,做出的統(tǒng)計(jì)數(shù)據(jù)指標(biāo)如表1所示。
根據(jù)各種數(shù)字資源的類型不同,對(duì)數(shù)字資源使用的分析方式也不相同,所謂的數(shù)字資源使用,一般分為兩種模式:第一,資源訪問(wèn);第二,資源下載。但是對(duì)于文摘索引和多媒體學(xué)習(xí)兩種類型數(shù)據(jù)庫(kù)而言,不能按照上述兩個(gè)模式進(jìn)行統(tǒng)計(jì)分析。文摘索引型數(shù)據(jù)庫(kù),要從訪問(wèn)量以及使用文摘索引型數(shù)據(jù)庫(kù)進(jìn)行搜索使用量這兩個(gè)方面進(jìn)行統(tǒng)計(jì)。而多媒體學(xué)習(xí)型數(shù)據(jù)庫(kù),則同樣要從訪問(wèn)量和在線觀看學(xué)習(xí)量這兩點(diǎn)來(lái)統(tǒng)計(jì)數(shù)據(jù)。
33 數(shù)據(jù)決策探究
數(shù)字資源建設(shè)過(guò)程中,需要實(shí)時(shí)調(diào)整優(yōu)化整個(gè)資源體系結(jié)構(gòu),在經(jīng)費(fèi)一定的條件下,能夠做到盡可能多的滿足讀者需求,同時(shí)保障學(xué)校教學(xué)科研建設(shè)的文獻(xiàn)需求。所以,在利用數(shù)據(jù)決策時(shí)候,可以幫助決策者們做到以下幾點(diǎn):
(1)能夠決定購(gòu)買數(shù)字資源種類的問(wèn)題。
(2)能夠決定購(gòu)買數(shù)字資源內(nèi)容的問(wèn)題。
(3)能夠幫助決策者們對(duì)數(shù)字資源提供商進(jìn)行有效督促。
(4)能夠促使數(shù)字資源提供商提供有效宣傳推廣。
數(shù)字資源建設(shè),對(duì)于決策層的要求,就是實(shí)時(shí)掌握數(shù)字資源使用的真實(shí)數(shù)據(jù)。從數(shù)據(jù)分析中,可以讓決策者們能夠獲取讀者對(duì)數(shù)字資源滿意程度以及在資源建設(shè)過(guò)程中,可能存在的資源分配不合理的情況。
4 系統(tǒng)建設(shè)研究原理
數(shù)字資源評(píng)價(jià)體系中,重要的一個(gè)環(huán)節(jié)就是數(shù)字資源使用數(shù)據(jù)獲取。而在高校圖書館中,數(shù)字資源使用范圍一般是在高校的數(shù)字化校園環(huán)境內(nèi),所以在系統(tǒng)建設(shè)過(guò)程中,可以從環(huán)境限制條件入手,建設(shè)整體的數(shù)字資源使用數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)。
41 系統(tǒng)環(huán)境研究
校園網(wǎng)建設(shè)[6]過(guò)程中,涉及相關(guān)技術(shù)包括局域網(wǎng)技術(shù)、虛擬局域網(wǎng)(VLAN,Virtual Local Area Network)技術(shù)、第三層交換技術(shù)、虛擬專用網(wǎng)絡(luò)(VPN,Virtual Private Network)技術(shù),同時(shí)涉及校園無(wú)線網(wǎng)絡(luò)、校園網(wǎng)絡(luò)安全方面。校園網(wǎng)安全內(nèi)容包括隔離與訪問(wèn)控制、網(wǎng)絡(luò)傳輸安全、網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)、數(shù)據(jù)存儲(chǔ)備份系統(tǒng)以及病毒防護(hù)系統(tǒng)等等。數(shù)字資源訪問(wèn)統(tǒng)計(jì)系統(tǒng),從網(wǎng)絡(luò)傳輸入手,通過(guò)訪問(wèn)控制相關(guān)技術(shù)獲取相關(guān)數(shù)據(jù),進(jìn)行網(wǎng)絡(luò)定點(diǎn)監(jiān)控的方法,進(jìn)行數(shù)字資源使用統(tǒng)計(jì)。
42 系統(tǒng)原理分析
高校圖書館網(wǎng)絡(luò)建設(shè)屬于高校整體網(wǎng)絡(luò)規(guī)劃中,是學(xué)校校園網(wǎng)絡(luò)管理范圍。數(shù)字資源的存儲(chǔ)分為本地資源和遠(yuǎn)程資源。本地資源,即資源存放在高校圖書館存儲(chǔ)設(shè)備中,定期更新提供服務(wù)。遠(yuǎn)程資源,即資源存放在數(shù)字資源提供商存儲(chǔ)設(shè)備中,提供遠(yuǎn)程訪問(wèn)支持。讀者訪問(wèn)圖書館數(shù)字資源,一般需要在校園網(wǎng)絡(luò)范圍之內(nèi)。有效讀者不在校園網(wǎng)絡(luò)范圍之內(nèi)訪問(wèn),需要通過(guò)虛擬專用網(wǎng)絡(luò)(VPN)進(jìn)行連接訪問(wèn)??傊x者對(duì)于資源訪問(wèn)、下載,需要在資源提供商規(guī)定的網(wǎng)絡(luò)范圍內(nèi)進(jìn)行。所以,以校園網(wǎng)絡(luò)出口訪問(wèn)數(shù)據(jù)為研究對(duì)象,獲取校園網(wǎng)路范圍內(nèi)訪問(wèn)相關(guān)數(shù)字資源的網(wǎng)絡(luò)行為,對(duì)這些行為進(jìn)行統(tǒng)計(jì)分析,是數(shù)字資源使用統(tǒng)計(jì)系統(tǒng)的基礎(chǔ)工作。
43 系統(tǒng)功能探究
高校圖書館管理者對(duì)統(tǒng)計(jì)功能是非常關(guān)心的功能之一,統(tǒng)計(jì)數(shù)據(jù)的呈現(xiàn)方式是關(guān)系到管理者能否在龐大的使用數(shù)據(jù)中獲得直觀利用率的感官體驗(yàn)。所以,在統(tǒng)計(jì)類型中必須有以下幾個(gè)方面的功能:
(1)站點(diǎn)統(tǒng)計(jì):記錄電子資源在某個(gè)時(shí)間段內(nèi)被訪問(wèn)的次數(shù)。報(bào)表中可以清晰地看到站點(diǎn)名稱、站點(diǎn)地址、訪問(wèn)次數(shù)和創(chuàng)建時(shí)間。統(tǒng)計(jì)視圖可以直觀的以柱狀圖、餅狀圖、折線圖和區(qū)域圖的形式進(jìn)行呈現(xiàn)等。
(2)訪問(wèn)統(tǒng)計(jì):記錄電子資源在某個(gè)時(shí)間段內(nèi)被某個(gè)IP或人員訪問(wèn)的次數(shù)。報(bào)表中可以清晰地看到站點(diǎn)名稱、IP地址(對(duì)接后可以看到對(duì)應(yīng)的用戶信息)、站點(diǎn)地址、訪問(wèn)次數(shù)和創(chuàng)建時(shí)間。訪問(wèn)視圖可以直觀的以柱狀圖、餅狀圖、折線圖和區(qū)域圖的形式進(jìn)行呈現(xiàn)等。
(3)熱點(diǎn)統(tǒng)計(jì):按照統(tǒng)計(jì)類型統(tǒng)計(jì)每個(gè)類型最近訪問(wèn)資源最多,可以統(tǒng)計(jì)資源熱點(diǎn)、人員熱點(diǎn)、圖書類型熱點(diǎn)、學(xué)院熱點(diǎn)等;訪問(wèn)視圖可以直觀的以柱狀圖、餅狀圖、折線圖和區(qū)域圖的形式進(jìn)行呈現(xiàn)等。
(4)站點(diǎn)統(tǒng)計(jì)升降視圖:記錄電子資源在不同的時(shí)間段被訪問(wèn)的一個(gè)次數(shù)的對(duì)比,是上升還是下降,直觀了解資源被訪問(wèn)的一個(gè)趨勢(shì)。
(5)訪問(wèn)統(tǒng)計(jì)升降視圖:記錄電子資源在不同的時(shí)間段被不同的IP(或者人員)訪問(wèn)的一個(gè)次數(shù)的對(duì)比,是上升還是下降,直觀了解IP(或人員)訪問(wèn)資源的一個(gè)趨勢(shì)。
5 功能實(shí)現(xiàn)探索研究
51 圖書館資源現(xiàn)狀
數(shù)字資源的來(lái)源呈現(xiàn)多樣性。圖書館在信息化程度提高,尤其是資源信息化平臺(tái)逐步提升的過(guò)程中,各種方法和措施方便了讀者對(duì)圖書館資源的獲取,但是數(shù)字資源真實(shí)的利用數(shù)據(jù)以及數(shù)字資源提供商提供的數(shù)字資源使用率的數(shù)據(jù)準(zhǔn)確率還有待考證。而且圖書館也忽視讀者在使用數(shù)字資源過(guò)程中的真實(shí)感知程度。綜上所述,圖書館通過(guò)獨(dú)立平臺(tái)對(duì)數(shù)字資源的利用率進(jìn)行統(tǒng)計(jì)是十分必要的。通過(guò)對(duì)數(shù)字資源的利用情況進(jìn)行統(tǒng)計(jì),不僅可以讓圖書館了解各種數(shù)字資源的真實(shí)使用情況,而且可以讓圖書館知曉讀者尤其是教師讀者的研究喜好,可以對(duì)讀者進(jìn)行定點(diǎn)的資源推送提供依據(jù)。endprint
52 功能實(shí)現(xiàn)迫切性
數(shù)字資源建設(shè)經(jīng)費(fèi)逐年提高,而缺乏合理的評(píng)估體系。而評(píng)估體系中最重要的數(shù)據(jù)之一就是真實(shí)的利用率數(shù)據(jù)。建設(shè)獨(dú)立的數(shù)字資源統(tǒng)計(jì)系統(tǒng)尤為重要。不僅可以為圖書館提供真實(shí)可信的數(shù)字資源利用率數(shù)據(jù),而且可以在原始數(shù)據(jù)中進(jìn)行充分的數(shù)據(jù)挖掘分析,提供給資源建設(shè)的管理者們進(jìn)行資源規(guī)劃的支撐數(shù)據(jù)信息。
6 系統(tǒng)技術(shù)原理
數(shù)字資源統(tǒng)計(jì)分析的原理目前采用的方法有兩種:第一,是端口鏡像方式;第二,是網(wǎng)關(guān)分析方式。兩種方式各有利弊,端口鏡像方式硬件投入較少,但是需要獲取較高級(jí)別的網(wǎng)絡(luò)管理權(quán)限。網(wǎng)關(guān)分析方式硬件投入較大,節(jié)點(diǎn)較多,管理較為復(fù)雜,但是網(wǎng)絡(luò)管理權(quán)限較低。本文所選取的實(shí)驗(yàn)方式是端口鏡像方式,并已經(jīng)處于實(shí)現(xiàn)。
在校園網(wǎng)絡(luò)中,采用對(duì)核心交換機(jī)端口鏡像方式,獲取網(wǎng)絡(luò)中對(duì)圖書館數(shù)字資源訪問(wèn)的數(shù)據(jù)信息的方法。鏡像數(shù)據(jù)流量采集的方法,不影響網(wǎng)絡(luò)的原始架構(gòu)、不影響網(wǎng)絡(luò)的數(shù)據(jù)流向、不會(huì)造成網(wǎng)絡(luò)瓶頸以及可以有選擇的采集不同類型的數(shù)據(jù)信息。具體方式如圖2所示:
圖2 數(shù)字資源統(tǒng)計(jì)系統(tǒng)原理圖
校園網(wǎng)絡(luò)內(nèi)通過(guò)核心交換機(jī)訪問(wèn)外網(wǎng),對(duì)核心交換機(jī)的訪問(wèn)數(shù)據(jù)進(jìn)行鏡像分析,可以獲取在校園網(wǎng)絡(luò)內(nèi)訪問(wèn)數(shù)字資源的信息,對(duì)信息進(jìn)行分析處理,即可得到較為真實(shí)可靠的數(shù)字資源訪問(wèn)的數(shù)據(jù)。而防火墻作用是從網(wǎng)絡(luò)安全考慮,編輯策略過(guò)濾掉與數(shù)字資源統(tǒng)計(jì)工作無(wú)關(guān)的信息。數(shù)字資源統(tǒng)計(jì)系統(tǒng)主要技術(shù)實(shí)現(xiàn)模塊有以下3個(gè)方面:第一,數(shù)據(jù)包獲取處理模塊;第二,統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)管理模塊;第三,統(tǒng)計(jì)數(shù)據(jù)呈現(xiàn)模塊。
61 數(shù)據(jù)包獲取處理模塊
該功能模塊是在校園網(wǎng)絡(luò)中,將數(shù)據(jù)包采用端口鏡像的方式進(jìn)行采集,通過(guò)預(yù)先設(shè)置好的過(guò)濾機(jī)制進(jìn)行數(shù)據(jù)包清洗,以獲得統(tǒng)計(jì)分析系統(tǒng)所需要處理的數(shù)字資源相關(guān)的數(shù)據(jù)包,用于統(tǒng)計(jì)分析。數(shù)據(jù)包獲取模塊中,一般采用目前網(wǎng)絡(luò)分析較為成熟的Winpacap或者Libpcap函數(shù)庫(kù)進(jìn)行數(shù)據(jù)包捕獲。數(shù)據(jù)清洗是將與數(shù)字資源不匹配的數(shù)據(jù)包進(jìn)行丟棄,以減少數(shù)據(jù)分析的工作量。數(shù)據(jù)包獲取處理過(guò)程中,會(huì)記錄相關(guān)數(shù)據(jù)包中信息,例如訪問(wèn)地址、源地址,以及檢索詞等,同時(shí)會(huì)將行為做記錄,訪問(wèn)頁(yè)面或者下載等信息。將這些結(jié)果記錄到統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)管理模塊中,一般是數(shù)據(jù)庫(kù)中,例如MySql或者Orcal數(shù)據(jù)庫(kù)中。
62 統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)管理模塊
統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)模塊,只要是由數(shù)據(jù)庫(kù)組成,其主要功能是保存統(tǒng)計(jì)系統(tǒng)的相關(guān)信息。并支持對(duì)相關(guān)信息調(diào)用。而統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)管理模塊同時(shí)也存儲(chǔ)著數(shù)字資源相關(guān)的數(shù)據(jù)信息,例如數(shù)字資源名稱、數(shù)字資源的訪問(wèn)站點(diǎn)地址(URL)等等。
63 統(tǒng)計(jì)數(shù)據(jù)呈現(xiàn)模塊
統(tǒng)計(jì)數(shù)據(jù)呈現(xiàn)模塊,主要是將統(tǒng)計(jì)數(shù)據(jù)進(jìn)行展示的作用,同時(shí)設(shè)置不同的統(tǒng)計(jì)歸類,分析方式調(diào)取數(shù)據(jù)庫(kù)信息進(jìn)行呈現(xiàn),例如數(shù)據(jù)庫(kù)比較、訪問(wèn)的百分率等等。該模塊主要是采用頁(yè)面呈現(xiàn)方式,以圖表的形式將數(shù)據(jù)呈現(xiàn)給圖書館決策者們,用于資源建設(shè)規(guī)劃與調(diào)整。
總之,統(tǒng)計(jì)分析系統(tǒng)的技術(shù)原理采用的是當(dāng)前比較成熟的網(wǎng)絡(luò)管理技術(shù)方案。不管選擇何種方案,其基本原理是不變的,需要解決的主要問(wèn)題是如何獲取更高的網(wǎng)絡(luò)管理權(quán)限,用于數(shù)字資源統(tǒng)計(jì)系統(tǒng)建設(shè),這才是關(guān)鍵的問(wèn)題。
7 系統(tǒng)建設(shè)實(shí)際價(jià)值
71 數(shù)字資源使用的針對(duì)性
在統(tǒng)計(jì)分析系統(tǒng)中,加入資源中心模塊,可以統(tǒng)一管理所需分析的數(shù)字資源。通過(guò)分析系統(tǒng),對(duì)網(wǎng)絡(luò)中鏡像數(shù)據(jù)進(jìn)行歸類分析,得出各種數(shù)據(jù)資源利用率信息。所以,統(tǒng)計(jì)系統(tǒng)只針對(duì)數(shù)字資源相關(guān)信息。
72 數(shù)字資源數(shù)據(jù)的真實(shí)性
由于系統(tǒng)采集的鏡像數(shù)據(jù)是從核心交換機(jī)中直接獲取資源,統(tǒng)計(jì)的數(shù)據(jù)相對(duì)全面。這是由于所有網(wǎng)絡(luò)訪問(wèn)外網(wǎng)資源都必須匯聚到核心交換機(jī)上,所以統(tǒng)計(jì)分析系統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)較為準(zhǔn)確。
73 數(shù)字資源采購(gòu)的決策性
統(tǒng)計(jì)系統(tǒng)提供的利用率數(shù)據(jù)由于其具有針對(duì)性和真實(shí)性,可以為高校圖書館提供真實(shí)可靠的數(shù)字資源利用率數(shù)據(jù),而在高校圖書館資源建設(shè)尤其是數(shù)字資源建設(shè)過(guò)程中,利用率信息的提供可以幫助圖書館決策者們合理規(guī)劃數(shù)字資源建設(shè)方案,同時(shí)為方案的執(zhí)行提供原始依據(jù)。
74 系統(tǒng)建設(shè)難點(diǎn)
統(tǒng)計(jì)分析系統(tǒng)的建設(shè)需要學(xué)校網(wǎng)絡(luò)管理部門配合,而在核心交換機(jī)上采集網(wǎng)絡(luò)數(shù)據(jù),其數(shù)據(jù)的安全性令網(wǎng)絡(luò)管理部門所擔(dān)心的。如圖2所示,在核心交換機(jī)和統(tǒng)計(jì)分析服務(wù)器之間加載硬件防火墻的目的就是進(jìn)行一次數(shù)據(jù)過(guò)濾,使統(tǒng)計(jì)分析服務(wù)器只獲取到數(shù)字資源的相關(guān)數(shù)據(jù),減少龐大數(shù)據(jù)的分析壓力,同時(shí)對(duì)其他校園網(wǎng)內(nèi)的與數(shù)字資源不相關(guān)數(shù)據(jù)進(jìn)行阻攔,打消網(wǎng)絡(luò)管理部門的顧慮。
8 系統(tǒng)案例與功能解析
81 系統(tǒng)組成
系統(tǒng)是由資源管理、統(tǒng)計(jì)分析、預(yù)警管理、系統(tǒng)配置四部分組成。資源管理部分是系統(tǒng)管理員對(duì)高校圖書館需要統(tǒng)計(jì)的數(shù)字資源訪問(wèn)地址進(jìn)行管理。統(tǒng)計(jì)分析部分是系統(tǒng)對(duì)校園網(wǎng)內(nèi)系統(tǒng)管理員添加的數(shù)字資源訪問(wèn)地址的讀者訪問(wèn)行為進(jìn)行統(tǒng)計(jì)分析,得出訪問(wèn)次數(shù)、下載次數(shù)等相關(guān)信息功能,并對(duì)相關(guān)數(shù)據(jù)進(jìn)行對(duì)比分析。預(yù)警管理主要是對(duì)分析服務(wù)器進(jìn)行管理,例如磁盤空間預(yù)警等等。系統(tǒng)配置主要具備網(wǎng)卡配置功能、服務(wù)器配置功能以及相關(guān)參數(shù)配置和用戶管理功能等。
82 資源管理
系統(tǒng)的數(shù)字資源管理,主要是將數(shù)字資源的訪問(wèn)地址進(jìn)行添加和修改。讓系統(tǒng)實(shí)現(xiàn)對(duì)涉及相關(guān)數(shù)字資源進(jìn)行統(tǒng)計(jì)和分析的功能。如圖3所示:
資源管理功能,可以隨時(shí)添加刪減數(shù)字資源地址,實(shí)現(xiàn)對(duì)資源特別是試用資源在規(guī)定時(shí)間內(nèi)進(jìn)行利用率統(tǒng)計(jì),得出真實(shí)的利用率數(shù)據(jù)信息。資源管理功能的運(yùn)用,可以讓圖書館對(duì)需要統(tǒng)計(jì)的數(shù)字資源進(jìn)行有效的管理,添加新增資源地址,刪除失效資源地址。
83 統(tǒng)計(jì)分析
統(tǒng)計(jì)分析功能是系統(tǒng)的核心功能,需要實(shí)現(xiàn)對(duì)數(shù)字資源利用率數(shù)據(jù)進(jìn)行有效的分析和處理,呈現(xiàn)詳細(xì)的分析報(bào)告。(如圖4所示)endprint
圖4 數(shù)字資源利用率分析圖
從圖4中,可以看出,系統(tǒng)對(duì)資源訪問(wèn)的次數(shù)做了詳細(xì)的分析統(tǒng)計(jì),統(tǒng)計(jì)近一周的數(shù)據(jù)來(lái)看,名稱為中國(guó)科學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)服務(wù)系統(tǒng)的訪問(wèn)次數(shù)達(dá)到22 969次,占到總訪問(wèn)比例為3666%。其他的數(shù)字資源訪問(wèn)信息,都可以在統(tǒng)計(jì)分析模塊中得到相應(yīng)的數(shù)據(jù)結(jié)果。
84 讀者資源行為分析與資源推送
讀者資源行為分析,是在統(tǒng)計(jì)分析數(shù)據(jù)的基礎(chǔ)上,對(duì)讀者訪問(wèn)圖書館的數(shù)字資源以及查閱相關(guān)學(xué)科分類的信息進(jìn)行歸類統(tǒng)計(jì),得到讀者對(duì)數(shù)字資源信息偏好的數(shù)據(jù),并對(duì)該數(shù)據(jù)加以分析后進(jìn)行相關(guān)的學(xué)科信息推送。讀者資源行為需求,是讀者對(duì)圖書館資源與服務(wù)的滿意度的佐證。獲得讀者需求的方法很多,采用信息技術(shù)的方法獲取讀者訪問(wèn)需求數(shù)據(jù),已經(jīng)不再是很困難的事情,例如從網(wǎng)站訪問(wèn)數(shù)據(jù)分析獲取讀者對(duì)圖書館網(wǎng)站欄目興趣也是一種獲取讀者對(duì)圖書館關(guān)注的途徑之一[7]。
總之,統(tǒng)計(jì)系統(tǒng)是在大數(shù)據(jù)分析的環(huán)境下,借助于網(wǎng)絡(luò)抓取技術(shù)獲取讀者在校園網(wǎng)內(nèi)對(duì)圖書館的相關(guān)數(shù)字資源利用的數(shù)據(jù)信息,對(duì)數(shù)據(jù)進(jìn)行分析處理得出一系列圖書館決策者們所需的數(shù)字資源利用率信息,讀者對(duì)相關(guān)學(xué)科的興趣愛(ài)好信息[8]等,并利用該信息規(guī)劃圖書館數(shù)字資源建設(shè),對(duì)數(shù)字資源進(jìn)行合理配置同時(shí)可以利用該信息對(duì)讀者進(jìn)行定點(diǎn)資源推送服務(wù)。
85 存在遺漏之處
該系統(tǒng)方案,主要用于桌面訪問(wèn)方式,而對(duì)于移動(dòng)客戶端訪問(wèn)方式不能做到有效統(tǒng)計(jì),原因是多方面的,首先,移動(dòng)客戶端以及資源提供是數(shù)字資源商自主管理;其次,移動(dòng)客戶端型數(shù)字資源本身不受校園網(wǎng)絡(luò)限制,例如超星移動(dòng)圖書館等;由于以上原因,對(duì)于移動(dòng)客戶端型數(shù)字資源統(tǒng)計(jì)方式還需要關(guān)聯(lián)數(shù)字資源提供商的統(tǒng)計(jì)平臺(tái)進(jìn)行數(shù)據(jù)整合。
總之,在當(dāng)今數(shù)字資源還是以桌面平臺(tái)為主,尤其是多媒體資源,其數(shù)據(jù)量較大,移動(dòng)客戶端雖然可以承載該服務(wù),但是由于顯示效果以及流量的限制,讀者在當(dāng)前環(huán)境下還是利用桌面訪問(wèn)方式較多。由于統(tǒng)計(jì)系統(tǒng)能夠?qū)?shù)字資源提供商提供的統(tǒng)計(jì)平臺(tái)數(shù)據(jù)進(jìn)行采集,可以采用數(shù)據(jù)采集方式進(jìn)行整合,實(shí)現(xiàn)數(shù)字資源統(tǒng)計(jì)平臺(tái)的統(tǒng)一化與系統(tǒng)化。
9 結(jié)束語(yǔ)
統(tǒng)計(jì)系統(tǒng)的技術(shù)原理簡(jiǎn)單,技術(shù)實(shí)現(xiàn)容易。需要解決的重點(diǎn)問(wèn)題是網(wǎng)絡(luò)管理部門網(wǎng)絡(luò)交換機(jī)端口鏡像權(quán)限是否對(duì)數(shù)字資源統(tǒng)計(jì)系統(tǒng)的開(kāi)放,而數(shù)據(jù)包分析,主要是對(duì)數(shù)據(jù)包中的日志信息進(jìn)行分析。網(wǎng)絡(luò)管理部門從網(wǎng)絡(luò)安全維護(hù)考慮,不會(huì)同意圖書館對(duì)其管理職責(zé)范圍內(nèi)的數(shù)據(jù)包進(jìn)行有效分析,從而影響數(shù)字資源統(tǒng)計(jì)數(shù)據(jù)的準(zhǔn)確性。如何獲取更高的網(wǎng)絡(luò)管理權(quán)限,這已經(jīng)不是技術(shù)能夠解決的問(wèn)題,需要相關(guān)法規(guī)對(duì)高校圖書館賦予一定的支持才行。對(duì)于建設(shè)數(shù)字資源統(tǒng)計(jì)系統(tǒng),其實(shí)現(xiàn)的目的是多方面的,其一數(shù)字資源利用率數(shù)據(jù)統(tǒng)計(jì),可以客觀真實(shí)的統(tǒng)計(jì)出在校園網(wǎng)絡(luò)范圍內(nèi)讀者利用數(shù)字資源情況。其二讀者利用角度,圖書館管理者可以從讀者利用數(shù)字資源以及相關(guān)內(nèi)容上獲取讀者的喜歡信息,從而提供針對(duì)性的信息資源推送,提高讀者服務(wù)效率,拉近讀者與圖書館之間的距離??傊谛畔⒓夹g(shù)不斷進(jìn)步的時(shí)代,新的信息技術(shù)與資源呈現(xiàn)方式逐步被圖書館所利用,例如圖書館信息門戶從桌面平臺(tái)向移動(dòng)平臺(tái)轉(zhuǎn)變[9-11],移動(dòng)平臺(tái)也逐步實(shí)行聯(lián)盟化發(fā)展[12],圖書館的信息資源推送可以利用讀者資源行為的大數(shù)據(jù)分析進(jìn)行定點(diǎn)推送等。數(shù)據(jù)包分析方法的原理和方法已經(jīng)進(jìn)行實(shí)踐應(yīng)用測(cè)試[13]。而圖書館已經(jīng)從基礎(chǔ)的硬件建設(shè)逐步向理念建設(shè)和思路建設(shè)轉(zhuǎn)變,好的理念、好的想法、好的思路,運(yùn)用信息技術(shù)手段實(shí)現(xiàn),是未來(lái)圖書館特色服務(wù)乃至圖書館發(fā)展與進(jìn)步的源動(dòng)力之一。
參考文獻(xiàn)
[1]秦鴻.決策支持視角下的數(shù)字資源使用統(tǒng)計(jì)分析實(shí)例研究[J].大學(xué)圖書館學(xué)報(bào),2013,(6):60-65.
[2]段惠靜.數(shù)字資源使用統(tǒng)計(jì)分析——以山西大學(xué)圖書館為例[J].晉圖學(xué)刊,2012,(3):24-27.
[3]杜瑩琦.高校圖書館試用數(shù)字資源的選擇與評(píng)價(jià)策略[J].圖書館建設(shè),2011,(7):13-15.
[4]吳金鵬.基于博弈論的高校數(shù)字圖書館發(fā)展策略研究[J].圖書館工作與研究,2011,(5):14-18.
[5]數(shù)據(jù)分析[OL].http:∥baike.haosou.com/doc/3840640.html,2015-01-20.
[6]黃煒.高校校園網(wǎng)架構(gòu)及其安全系統(tǒng)的分析與設(shè)計(jì)[D].南昌:南昌大學(xué)信息工程學(xué)院,2010.
[7]陸康.網(wǎng)絡(luò)行為讀者需求分析運(yùn)用探討[J].現(xiàn)代情報(bào),2015,(5):94-97,104.
[8]劉慧.基于網(wǎng)絡(luò)行為的圖書館數(shù)字資源評(píng)價(jià)方法研究[J].現(xiàn)代情報(bào),2015,(2):62-66.
[9]陸康,劉慧,王圣元.基于3G無(wú)線網(wǎng)絡(luò)時(shí)代手機(jī)圖書館的前景與發(fā)展[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2012,(7):177-179.
[10]陸康.基于4G網(wǎng)絡(luò)環(huán)境的移動(dòng)圖書館研究[J].新世紀(jì)圖書館,2013,(11):63-65.
[11]陸康.基于增值業(yè)務(wù)的圖書館移動(dòng)門戶建設(shè)研究[J].現(xiàn)代情報(bào),2014,(11):143-146.
[12]吳靜.江寧大學(xué)城高校移動(dòng)圖書館聯(lián)盟構(gòu)建設(shè)想[J].圖書館學(xué)研究,2013,(8):86-88.
[13]王政軍.電子資源統(tǒng)計(jì)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].大連:大連理工大學(xué),2012.
(本文責(zé)任編輯:郭沫含)endprint