国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國2005—2015年數(shù)字圖書館建設(shè)中關(guān)鍵技術(shù)的定量分析*

2017-10-22 10:25:00陳雅陸紅如
數(shù)字圖書館論壇 2017年9期
關(guān)鍵詞:個性化推薦推薦系統(tǒng)個性化

陳雅,陸紅如

(南京大學(xué)信息管理學(xué)院,南京 210046)

我國2005—2015年數(shù)字圖書館建設(shè)中關(guān)鍵技術(shù)的定量分析*

陳雅,陸紅如

(南京大學(xué)信息管理學(xué)院,南京 210046)

在大數(shù)據(jù)時代,信息技術(shù)的變革使數(shù)字圖書館面臨全新的機(jī)遇和挑戰(zhàn)。本文介紹當(dāng)前數(shù)字圖書館建設(shè)中的關(guān)鍵技術(shù),指出在當(dāng)前形勢下,圖書館作為社會的信息服務(wù)中心,應(yīng)當(dāng)積極做出相應(yīng)改變以更好地發(fā)揮出其社會職能,滿足社會信息需求。

數(shù)字圖書館;大數(shù)據(jù);信息技術(shù)

1 引言

數(shù)字圖書館(digital library)概念最初在20世紀(jì)90年代被提出,之后逐漸應(yīng)用于計算機(jī)、圖書情報等領(lǐng)域,并在多國掀起數(shù)字圖書館研究的熱潮[1]。目前學(xué)界對數(shù)字圖書館比較綜合的定義是對以數(shù)字化形式存在的信息進(jìn)行收集、整理、保存、發(fā)布和利用的實(shí)體,其形式可以是具體的社會機(jī)構(gòu)或組織,也可以是虛擬的網(wǎng)站或者任何數(shù)字信息資源集合[1]。

當(dāng)代全球圖書館事業(yè)的發(fā)展主要面臨技術(shù)挑戰(zhàn)、服務(wù)挑戰(zhàn)和管理挑戰(zhàn),而技術(shù)要素是圖書館服務(wù)與管理能力提升的推動力[2],如數(shù)字技術(shù)、自助借還技術(shù)等。技術(shù)體系是數(shù)字圖書館建設(shè)的重要基礎(chǔ),是數(shù)字圖書館在計算機(jī)與網(wǎng)絡(luò)基礎(chǔ)上的具體實(shí)現(xiàn)[3]。數(shù)字圖書館系統(tǒng)要在信息采集、加工、處理、存儲和應(yīng)用流程中根據(jù)相關(guān)標(biāo)準(zhǔn)采用相應(yīng)技術(shù),因此需建立合理的技術(shù)體系結(jié)構(gòu)以滿足數(shù)字圖書館系統(tǒng)的技術(shù)需求。以國家工程技術(shù)數(shù)字圖書館為例,其各結(jié)構(gòu)與功能的實(shí)現(xiàn)均需相應(yīng)的技術(shù)支持。如信息采集技術(shù)、數(shù)字化技術(shù)、信息服務(wù)技術(shù)等,構(gòu)成相應(yīng)的技術(shù)體系結(jié)構(gòu)。

以計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、現(xiàn)代通信技術(shù)等為代表的信息技術(shù)早已深入社會生活的各方面,在推動社會進(jìn)步和經(jīng)濟(jì)發(fā)展的同時,也將人類社會帶入信息時代。如今,海量信息的爆炸式增長使全球進(jìn)入“大數(shù)據(jù)”時代,因此如何在海量數(shù)據(jù)中挖掘有用的信息并加以組織和利用,已經(jīng)成為社會各領(lǐng)域共同關(guān)注的問題。圖書館作為社會的文獻(xiàn)交流中心和信息服務(wù)中心,在大數(shù)據(jù)時代也面臨新的挑戰(zhàn)和機(jī)遇。大數(shù)據(jù)時代的圖書館建設(shè),尤其是數(shù)字圖書館建設(shè),也要順應(yīng)當(dāng)前的技術(shù)變革。由于海量數(shù)據(jù)的處理需要采用更先進(jìn)的大數(shù)據(jù)技術(shù)(如云計算技術(shù)、大規(guī)模數(shù)據(jù)并行處理技術(shù)、分布式存儲技術(shù)、海量數(shù)據(jù)挖掘技術(shù)等),因此數(shù)字圖書館建設(shè)隨著技術(shù)水平的發(fā)展,其所采用的關(guān)鍵技術(shù)也將與以往有所不同。本文首先對“數(shù)字圖書館技術(shù)”相關(guān)主題的國內(nèi)外文獻(xiàn)進(jìn)行定量分析,其次探討數(shù)字圖書館建設(shè)中的相關(guān)技術(shù)問題,并總結(jié)當(dāng)前數(shù)字圖書館關(guān)鍵技術(shù)的發(fā)展趨勢。

2 國內(nèi)外數(shù)字圖書館技術(shù)研究分析

2.1 國內(nèi)相關(guān)研究

本文在中國知網(wǎng)數(shù)據(jù)庫以“主題=數(shù)字圖書館+技術(shù)”作為檢索式,檢索時間為2005—2015年,文獻(xiàn)來源限定為核心期刊,檢索日期為2017年3月10日,共檢索出1 683篇期刊論文。

2005年以來,國內(nèi)對數(shù)字圖書館技術(shù)相關(guān)的研究整體上處于一個緩慢衰減的趨勢,相關(guān)論文發(fā)表數(shù)量在十年內(nèi)減少將近一半。發(fā)文數(shù)量減少的原因主要有:(1)數(shù)字圖書館相關(guān)技術(shù)理論已趨于成熟,在現(xiàn)有技術(shù)條件下對數(shù)字圖書館管理、服務(wù)等的研究也取得一定成果,在新技術(shù)能成熟應(yīng)用前,很難再有新的創(chuàng)新成果出現(xiàn);(2)數(shù)字圖書館研究領(lǐng)域的研究對象已進(jìn)一步分化,衍生出許多對具體技術(shù)或新型模式的子研究領(lǐng)域,這種對衍生子領(lǐng)域研究的日益深入使從宏觀角度研究數(shù)字圖書館技術(shù)的文獻(xiàn)相對減少。

借助CiteSpace可視化工具[4],對檢索到的論文數(shù)據(jù)做進(jìn)一步分析。將1 683篇論文的特征數(shù)據(jù)導(dǎo)入CiteSpace,在參數(shù)設(shè)置中,時區(qū)分割(time slicing)選擇2005—2015年,單個時間分區(qū)長度(years per slice)設(shè)置為1年,主題詞來源(term source)全部選中,對關(guān)鍵詞節(jié)點(diǎn)類型(node types-keyword)進(jìn)行分析,得到關(guān)鍵詞共現(xiàn)圖譜,如圖1所示。圖中每個節(jié)點(diǎn)表示一個關(guān)鍵詞,節(jié)點(diǎn)大小反映關(guān)鍵詞出現(xiàn)的頻率高低,節(jié)點(diǎn)間連線表示關(guān)鍵詞間的共現(xiàn)關(guān)系。

圖1 國內(nèi)2005—2015年數(shù)字圖書館領(lǐng)域關(guān)鍵詞可視化圖譜

由于“數(shù)字圖書館”出現(xiàn)頻率遠(yuǎn)高于其他關(guān)鍵詞,為不影響圖譜展示效果,過濾該詞。

高頻關(guān)鍵詞夠反映十年來較熱門的研究主題。對其進(jìn)行歸類分析,可得到主要的數(shù)字圖書館技術(shù)關(guān)鍵詞有“云計算”“信息服務(wù)”(尤其是“個性化服務(wù)”“數(shù)據(jù)挖掘”),此外還有資源整合、信息檢索、信息安全方面的研究。部分關(guān)鍵詞間存在一定聯(lián)系,如與“云計算”相關(guān)的關(guān)鍵詞有“云服務(wù)”“云存儲”等,與“個性化服務(wù)”相近的關(guān)鍵詞還有“個性化”“個性化信息服務(wù)”“個性化推薦”“推薦系統(tǒng)”“個人數(shù)字圖書館”等。

2.2 國外相關(guān)研究

在Web of Science核心合集中以“digital librar*”為主題,檢索時間為2005—2015年,文獻(xiàn)類型限定為Article,語種設(shè)置為English,檢索日期為2017年3月10日,共檢索到1 450篇文獻(xiàn)。當(dāng)以“digital librar* techn*”等為主題詞檢索時,檢索結(jié)果過少,故將主題詞擴(kuò)充為“digital librar*”。在檢索結(jié)果中含有部分國內(nèi)研究者在國際上發(fā)表的研究論文,不過由于這種情況較少,對整體統(tǒng)計影響不大,即認(rèn)為以Web of Science核心合集中的文獻(xiàn)為研究對象,在一定程度上可反映國外相關(guān)研究情況。

國外關(guān)于數(shù)字圖書館的研究論文量在2005—2007年明顯下降,2007年以后發(fā)文量維持在較低水平。這種變化趨勢反映了國外對數(shù)字圖書館理論研究已趨于成熟,更多的研究可能并不直接反映數(shù)字圖書館,而是從更細(xì)化的子領(lǐng)域進(jìn)行研究。

從圖2可見,國外論文的關(guān)鍵詞涉及“design”“model”“system”“behavior”“users”等,而國內(nèi)論文的關(guān)鍵詞主要集中于“信息服務(wù)”“信息技術(shù)”“知識組織”“信息資源”等。由圖2可見,國外研究與數(shù)字圖書館技術(shù)有關(guān)的關(guān)鍵詞主要有“information retrieval”“digital storage”等。這反映出國內(nèi)更側(cè)重于理論層次研究,而國外則更傾向于對具體實(shí)踐操作和具體模型系統(tǒng)進(jìn)行研究。

圖2 國外2005—2015年數(shù)字圖書館領(lǐng)域關(guān)鍵詞可視化圖譜

3 數(shù)字圖書館建設(shè)的關(guān)鍵技術(shù)

數(shù)字圖書館建設(shè)過程中會應(yīng)用很多相關(guān)技術(shù)。有些技術(shù)在初期是數(shù)字圖書館建設(shè)的關(guān)鍵技術(shù),但隨著技術(shù)日益成熟,逐漸成為數(shù)字圖書館建設(shè)的基礎(chǔ)技術(shù)(如早期圖像掃描技術(shù)、光學(xué)字符識別技術(shù)、縮微存儲技術(shù)、壓縮技術(shù)、數(shù)字水印技術(shù)等)。因此,本文主要選取當(dāng)前關(guān)鍵技術(shù)進(jìn)行分類介紹,并研究其發(fā)展現(xiàn)狀。

3.1 面向信息資源的技術(shù)

3.1.1 傳統(tǒng)技術(shù)——數(shù)字資源整合技術(shù)

圖書館藏有眾多數(shù)字資源,而不同圖書館的數(shù)字資源在存儲格式、組織方式、檢索方法等方面可能會有所不同,這給圖書館用戶帶來很大的不便。尤其是在大數(shù)據(jù)時代,圖書館中的海量數(shù)字資源和數(shù)據(jù)庫資源如果不經(jīng)過有序整合,用戶更容易在海量信息中迷失方向。數(shù)字資源整合指將不同圖書館數(shù)字資源系統(tǒng)中的數(shù)據(jù)對象、功能結(jié)構(gòu)、互動關(guān)系進(jìn)行融合和重組,使用戶通過統(tǒng)一的數(shù)字檢索平臺便捷地檢索和瀏覽相關(guān)信息的一種嶄新服務(wù)模式[5]。

利用數(shù)字資源整合技術(shù)構(gòu)建統(tǒng)一的信息服務(wù)平臺,弱化數(shù)字資源的異構(gòu)性,對其進(jìn)行合理整合,從而實(shí)現(xiàn)對數(shù)字資源的一站式查詢,這既是數(shù)字圖書館建設(shè)面臨的重要任務(wù),也是信息資源管理的重要研究課題。數(shù)字資源整合并不是簡單地進(jìn)行資源的集中和鏈接,而是對資源進(jìn)行體系結(jié)構(gòu)上的重組,構(gòu)成新的有機(jī)整體。

圖書館數(shù)字資源整合的方式主要有基于OPAC系統(tǒng)的數(shù)字資源整合、基于導(dǎo)航系統(tǒng)的數(shù)字資源整合、基于鏈接系統(tǒng)的數(shù)字資源整合、基于跨庫檢索系統(tǒng)的數(shù)字資源整合。國外在20世紀(jì)90年代開始對數(shù)字資源整合進(jìn)行研究,如Dialog聯(lián)機(jī)檢索系統(tǒng)就是多個數(shù)據(jù)庫的整合。國內(nèi)對數(shù)字資源的整合研究除引進(jìn)國外成熟的研究方法和系統(tǒng)外,還自主開發(fā)數(shù)字資源整合系統(tǒng),如“中國知識基礎(chǔ)設(shè)施工程”等。數(shù)字資源整合模式包括元數(shù)據(jù)整合模式、中間件整合模式和網(wǎng)頁搜索代理模式等[6]。數(shù)字資源整合技術(shù)包括檢索技術(shù)、網(wǎng)絡(luò)存儲管理技術(shù)、Web 2.0技術(shù)、XML技術(shù)、數(shù)據(jù)加工技術(shù)等[7]。

數(shù)字資源整合對數(shù)字圖書館建設(shè)具有以下重要意義。(1)將宏觀上雜亂無章的數(shù)字資源進(jìn)行有效組織,以促進(jìn)數(shù)字資源的有序化;(2)構(gòu)建數(shù)字資源的規(guī)模優(yōu)勢,進(jìn)一步提高圖書館的信息服務(wù)質(zhì)量;(3)將原本相互孤立的資源關(guān)聯(lián)起來,促進(jìn)數(shù)字資源的共享。因此,數(shù)字資源整合不僅能更好地滿足用戶信息需求,還能更好地促進(jìn)圖書館事業(yè)發(fā)展。

3.1.2 前沿技術(shù)——基于大數(shù)據(jù)的信息服務(wù)資源整合技術(shù)

在大數(shù)據(jù)時代背景下,數(shù)字圖書館資源建設(shè)應(yīng)積極拓展資源范疇,擴(kuò)充資源整合的廣度并加強(qiáng)資源組織加工的深度[8]?;诖髷?shù)據(jù)的數(shù)字圖書館信息服務(wù)資源整合可通過大數(shù)據(jù)資源層、資源過濾與解析層、資源整合層以及整合反饋與控制層來進(jìn)行資源整合的控制與管理[9]。

大數(shù)據(jù)資源層主要進(jìn)行系統(tǒng)管理、用戶管理等方面數(shù)據(jù)的存儲及初步分類;資源過濾與解析層負(fù)責(zé)提取大數(shù)據(jù)的特征、識別和規(guī)范大數(shù)據(jù)的類型和格式,并完成數(shù)據(jù)的篩選和解析;資源整合層負(fù)責(zé)按照大數(shù)據(jù)的轉(zhuǎn)換規(guī)則將相應(yīng)數(shù)據(jù)進(jìn)行轉(zhuǎn)換并錄入主數(shù)據(jù)庫;整合反饋與控制層負(fù)責(zé)運(yùn)用處理和分析技術(shù)對大數(shù)據(jù)進(jìn)行評估、調(diào)整及系統(tǒng)優(yōu)化,增加數(shù)據(jù)的可利用性和可控制性[9]。

3.2 面向文本文獻(xiàn)的技術(shù)

3.2.1 傳統(tǒng)技術(shù)——全文檢索技術(shù)

信息檢索技術(shù)是數(shù)字圖書館建設(shè)中的重要技術(shù)之一,其目標(biāo)是更好地幫助用戶從海量信息資源中快速查找所需要內(nèi)容,以解決信息超載問題,因此信息檢索技術(shù)與用戶服務(wù)息息相關(guān)。在計算機(jī)檢索中,凡是信息特征標(biāo)識與檢索提問標(biāo)識匹配的信息,計算機(jī)即將其輸出以滿足用戶的需求[10]。信息檢索既可看作從信息資源中找出相關(guān)信息的過程,也可看作過濾掉無關(guān)信息的過程。

全文檢索指對文獻(xiàn)全文或其主要部分進(jìn)行索引并提供檢索的一種信息檢索技術(shù),能迅速定位信息集合中的相關(guān)信息[11]。在全文檢索中,計算機(jī)索引程序會掃描文獻(xiàn)內(nèi)容的每個詞,并對這些詞建立索引,記錄其在文獻(xiàn)出現(xiàn)的位置和次數(shù)。當(dāng)用戶進(jìn)行查詢時,檢索系統(tǒng)會根據(jù)之前建立的索引來查找,最終將結(jié)果返回給用戶。由于傳統(tǒng)信息檢索技術(shù)是對信息資源的外部特征標(biāo)識進(jìn)行匹配,全文檢索技術(shù)則是對信息資源的內(nèi)容進(jìn)行檢索,因此后者更具有實(shí)用性,以全文檢索技術(shù)為核心的搜索引擎已經(jīng)成為當(dāng)前網(wǎng)絡(luò)時代的重要應(yīng)用系統(tǒng)。全文搜索引擎是根據(jù)全文檢索理論構(gòu)建的用于提供全文檢索服務(wù)的系統(tǒng),其以網(wǎng)頁全部內(nèi)容為檢索對象,是目前應(yīng)用最廣泛的主流搜索引擎。

隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,海量互聯(lián)網(wǎng)信息使全文檢索技術(shù)可以更好地發(fā)揮自身優(yōu)勢。當(dāng)前全文檢索技術(shù)已廣泛應(yīng)用于各領(lǐng)域的網(wǎng)站和各種類型的信息檢索系統(tǒng),數(shù)字圖書館系統(tǒng)也不例外。圖書館擁有海量信息資源,網(wǎng)絡(luò)時代的圖書館不是以收藏資源為中心,而應(yīng)該以資源服務(wù)為中心,提供高質(zhì)量的信息資源服務(wù)離不開全面的信息檢索服務(wù)。隨著人們對獲取信息便捷性要求的提高,對信息檢索系統(tǒng)性能的要求也越來越高,全文檢索技術(shù)能滿足圖書館用戶對信息獲取時快速、全面、準(zhǔn)確等方面的要求,方便用戶查詢所需全文信息,使數(shù)字圖書館更好地為用戶提供服務(wù)。

全文檢索主要可采用任意文本查詢、倒排法以及超文本模型法實(shí)現(xiàn)。全文檢索技術(shù)主要涉及詞語切分、信息表述和人機(jī)交互三個方面,具體包括超文本傳輸協(xié)議、公共網(wǎng)關(guān)接口、數(shù)據(jù)庫設(shè)計技術(shù)、數(shù)據(jù)組織和存儲技術(shù)等[12]。目前全文檢索技術(shù)向智能化方向發(fā)展,要求突破地域和數(shù)據(jù)庫的檢索障礙,協(xié)助用戶進(jìn)行檢索策略的制定和優(yōu)化,并采用分布式檢索為用戶提供精確的檢索結(jié)果[13]。

3.2.2 前沿技術(shù)——音視頻技術(shù)

傳統(tǒng)檢索方法的檢索對象主要是文本文獻(xiàn),無法精確檢測到數(shù)字圖書館中多媒體信息資源?;趦?nèi)容的音頻和視頻檢索技術(shù)可以突破傳統(tǒng)檢索技術(shù)的限制,對音頻、視頻資源進(jìn)行精確檢索。這類技術(shù)可分析和提取音頻、視頻和圖像等多媒體資源的特征,并可對其特征進(jìn)行建庫索引。系統(tǒng)通過用戶檢索條件與數(shù)據(jù)庫特征的匹配來完成多媒體資源的檢索,從而滿足用戶需求[14]。

音頻檢索技術(shù)先要分析音頻屬性,再賦予音頻數(shù)據(jù)不同的語義,從而通過語義進(jìn)行檢索。音頻數(shù)據(jù)索引根據(jù)旋律等特征來設(shè)置。視頻檢索技術(shù)通過幀、鏡頭和場景等屬性來標(biāo)記、描述和分析視頻數(shù)據(jù),按照鏡頭分類后提取關(guān)鍵幀,再通過色彩、紋路等特征進(jìn)行檢索[14]。

3.3 面向數(shù)據(jù)發(fā)現(xiàn)的技術(shù)

3.3.1 傳統(tǒng)技術(shù)——數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘技術(shù)是伴隨人工智能技術(shù)和數(shù)據(jù)庫技術(shù)發(fā)展而來的信息技術(shù),目前已成為數(shù)據(jù)庫研究中最活躍的分支。數(shù)據(jù)挖掘是從大量、不完全、有噪音、模糊、隨機(jī)的數(shù)據(jù)中提取潛在有用的信息和知識的過程[15]。利用數(shù)據(jù)挖掘技術(shù),決策者能從海量信息或數(shù)據(jù)中找出有利用價值的模式或關(guān)系,進(jìn)而可以對將來可能產(chǎn)生的行為活動進(jìn)行預(yù)測。常用的數(shù)據(jù)挖掘方法有統(tǒng)計分析、仿生物技術(shù)、決策樹、歸納法、遺傳算法和模糊集等[16]。

圖書館在日常運(yùn)作和管理過程中會產(chǎn)生大量數(shù)據(jù),如圖書館書目數(shù)據(jù)、圖書館網(wǎng)站訪問記錄、圖書館系統(tǒng)檢索記錄、圖書館用戶借還流通數(shù)據(jù)等。以往這些數(shù)據(jù)可能不會得到有效利用,甚至不會被記錄下來,而實(shí)際上這些海量數(shù)據(jù)中蘊(yùn)藏著很大的研究價值。應(yīng)用數(shù)據(jù)挖掘技術(shù)對其進(jìn)行有效分析,可以為圖書館進(jìn)行資源管理和組織、提升服務(wù)質(zhì)量、擴(kuò)展服務(wù)范圍等提供有利幫助,對于圖書館的文獻(xiàn)采訪、參考咨詢、資源流通、數(shù)字圖書館建設(shè)等工作也有很大的指導(dǎo)意義,還可以為圖書館執(zhí)行決策和開展各項創(chuàng)新服務(wù)提供參考依據(jù)。

文獻(xiàn)采集工作是數(shù)字圖書館建設(shè)的重要環(huán)節(jié)。傳統(tǒng)文獻(xiàn)采集中資源的選擇不可避免地帶有一定的主觀性,而利用數(shù)據(jù)挖掘技術(shù)對圖書館的借閱記錄、檢索記錄進(jìn)行分析后,可以發(fā)現(xiàn)用戶最需要的文獻(xiàn)資源,圖書館可據(jù)此有針對性地進(jìn)行相關(guān)資源的采購和補(bǔ)充。個性化服務(wù)技術(shù)是數(shù)字圖書館提高服務(wù)質(zhì)量的重要手段,利用數(shù)據(jù)挖掘技術(shù)可以對與用戶行為有關(guān)的數(shù)據(jù)記錄(如歷史借閱記錄)進(jìn)行挖掘和分析處理,從而更好地了解用戶的喜好,獲取讀者特征,實(shí)現(xiàn)準(zhǔn)確地向用戶推薦專題信息,或是改進(jìn)信息檢索系統(tǒng),使用戶在檢索時返回更準(zhǔn)確的檢索結(jié)果。因此,隨著數(shù)據(jù)挖掘技術(shù)進(jìn)一步成熟,將對圖書館資源建設(shè)、讀者服務(wù)、管理層決策分析等起到巨大的推動作用。

數(shù)據(jù)挖掘技術(shù)可應(yīng)用于數(shù)字圖書館的用戶資源管理、參考咨詢服務(wù)以及圖書館管理系統(tǒng),如數(shù)字挖掘技術(shù)可以識別潛在用戶和潛在流失用戶,從而根據(jù)用戶信息探索用戶需求,提供針對性的服務(wù)措施來提高用戶滿意度[17]。

3.3.2 前沿技術(shù)——序列模式挖掘技術(shù)

序列模式挖掘技術(shù)既是數(shù)據(jù)挖掘技術(shù)的重要分支,也是關(guān)聯(lián)規(guī)則的延伸,其目的是挖掘序列數(shù)據(jù)庫項集間包含時序關(guān)系的關(guān)聯(lián)規(guī)則[18]。數(shù)據(jù)挖掘技術(shù)針對的是雜亂無章的數(shù)據(jù)集,而序列模式挖掘技術(shù)主要面向具有偏序關(guān)系的數(shù)據(jù)集。

數(shù)字圖書館可運(yùn)用序列模式挖掘技術(shù)分析用戶數(shù)據(jù)和讀者日志,從而更好地滿足用戶需求;還可高效分析本館借閱流通記錄和檢索需求,從而調(diào)整和完善館藏資源[18]。

3.4 面向存儲傳遞的技術(shù)

3.4.1 傳統(tǒng)技術(shù)——云計算技術(shù)

自2007年起,云計算作為一種新興的概念被諸多領(lǐng)域所重視,谷歌、微軟、亞馬遜、雅虎、IBM等世界著名企業(yè)都投入巨資開展對云計算的研究和應(yīng)用。云計算實(shí)際上是一種全新的商業(yè)計算模型,由分布式計算、并行處理、網(wǎng)格計算等發(fā)展而來。目前,對于云計算的認(rèn)識仍處于不斷深入中,云計算的定義也多種多樣。美國國家標(biāo)準(zhǔn)與技術(shù)研究院將云計算定義為“云計算是一種模型,它可以實(shí)現(xiàn)隨時隨地、便捷地、隨需求應(yīng)變地從可配置計算資源共享池中獲取所需的資源(如網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用及服務(wù)),資源能夠快速供應(yīng)并釋放,使管理資源的工作量和與服務(wù)商的交互減小到最低限度”[19]。云計算的核心思想是對互聯(lián)網(wǎng)海量計算資源進(jìn)行統(tǒng)一的管理和調(diào)度,從而構(gòu)建一個大規(guī)模、虛擬化的計算資源池供用戶利用。

目前,云計算技術(shù)已經(jīng)在計算機(jī)、互聯(lián)網(wǎng)、通信等信息服務(wù)領(lǐng)域產(chǎn)生廣泛影響,而圖書館作為知識組織和傳遞的重要機(jī)構(gòu)中心,積極地與當(dāng)前云計算環(huán)境進(jìn)行融合是必然趨勢。云計算技術(shù)具有超大規(guī)模、虛擬化、高可靠性、動態(tài)擴(kuò)展性、成本低廉等優(yōu)勢,這使得它能夠在數(shù)字圖書館建設(shè)的各方面發(fā)揮重要作用。如云計算技術(shù)的大規(guī)模容量能保障數(shù)字圖書館服務(wù)器的正常運(yùn)作,建設(shè)成本低廉的同時能保障中心服務(wù)器的極高性能,并實(shí)現(xiàn)更高層次的信息資源共享,訪問渠道不斷拓寬的同時也能加快信息的更新速度[20]。

圖書館領(lǐng)域?qū)υ朴嬎愕膽?yīng)用也開展了相應(yīng)研究。2009年4月,OCLC(Online Computer Library Center)在都柏林宣布為成員館提供基于云的、Web規(guī)模的協(xié)作式圖書館管理服務(wù),這是圖書館界的第一個云計算服務(wù),OCLC因此開啟了圖書館應(yīng)用云計算的大門。2008年,中國高等教育文獻(xiàn)保障系統(tǒng)推出數(shù)字圖書館云服務(wù)平臺,采用云計算在全國構(gòu)建分布式數(shù)字圖書館云服務(wù)平臺,標(biāo)志國內(nèi)高校數(shù)字圖書館云時代的開啟[21]。盡管云計算應(yīng)用于圖書館的過程還存在問題,但總體而言,云計算在圖書館建設(shè)應(yīng)用上具有非常廣闊的前景,未來也會發(fā)揮更大的作用。

3.4.2 前沿技術(shù)——Hadoop分布式云計算

Hadoop分布式云計算是一種分布式處理海量數(shù)據(jù)的軟件框架,核心是分布式文件存儲系統(tǒng)和分布式計算模式,它將程序切割為小的工作單位,運(yùn)用集群的能力實(shí)現(xiàn)高速儲存和計算[22]。Hadoop分布式云計算可以實(shí)現(xiàn)網(wǎng)格計算、分布式處理和并行處理,有助于提高數(shù)字圖書館的資源建設(shè)水平。

3.5 面向用戶服務(wù)的技術(shù)

3.5.1 傳統(tǒng)技術(shù)——個性化服務(wù)技術(shù)

大數(shù)據(jù)時代海量信息的產(chǎn)生使得數(shù)字圖書館加工和整理的信息也越來越多,一方面滿足圖書館用戶的各種信息需求,另一方面讓用戶在面對海量信息時難以準(zhǔn)確獲取相關(guān)信息,從而導(dǎo)致“信息迷航”現(xiàn)象。這實(shí)際上是用戶自身有限的精力與圖書館海量信息間的矛盾。在當(dāng)前大數(shù)據(jù)環(huán)境下,用戶的信息需求正逐漸向個性化方向發(fā)展,一方面數(shù)字圖書館用戶希望能快速、準(zhǔn)確、方便地獲取所需信息;另一方面用戶希望能直接獲取符合自身特征的信息,即經(jīng)過篩選和整合的信息資源。因此,數(shù)字圖書館建設(shè)要充分重視服務(wù)能力的提升,將服務(wù)方式從被動模式轉(zhuǎn)變?yōu)橹鲃幽J?,以用戶至上為理念,根?jù)用戶需求為其提供量身訂制的服務(wù)模式,從而提高數(shù)字圖書館用戶的滿意度。

最早的個性化信息服務(wù)由美國學(xué)者舒曼于1979年提出,他認(rèn)為信息服務(wù)機(jī)構(gòu)應(yīng)當(dāng)提供滿足個人需求的個性化服務(wù)[23]。一些互聯(lián)網(wǎng)門戶網(wǎng)站采用這種理念開發(fā)出相應(yīng)的個性化服務(wù)技術(shù),允許用戶訂制其感興趣的內(nèi)容或網(wǎng)頁顯示形式。圖書館界也逐漸將這種個性化服務(wù)技術(shù)運(yùn)用到自身服務(wù),并在國內(nèi)外取得一定成效。圖書館個性化服務(wù)指數(shù)字圖書館在面對不同用戶時,能根據(jù)直接或間接收集到的用戶信息,為用戶提供相應(yīng)服務(wù)內(nèi)容的服務(wù)模式,是當(dāng)前數(shù)字圖書館提高服務(wù)質(zhì)量和資源利用效率的重要措施。

數(shù)字圖書館開展個性化服務(wù)的前提,是能夠準(zhǔn)確識別用戶的個性化信息需求。建立的用戶模型可實(shí)時跟蹤用戶的興趣和行為,但須合理設(shè)置和實(shí)時更新用戶與資源的對應(yīng)關(guān)系。在此基礎(chǔ)上,通過基于規(guī)則的技術(shù)、協(xié)作過濾技術(shù)和基于內(nèi)容過濾的技術(shù)來完成對用戶個性信息的調(diào)度[24]。

20世紀(jì)90年代國外對數(shù)字圖書館個性化服務(wù)展開研究,個性化服務(wù)系統(tǒng)也陸續(xù)被推出。國內(nèi)個性化服務(wù)系統(tǒng)如浙江大學(xué)圖書館的My Library系統(tǒng)、中國科學(xué)院文獻(xiàn)情報中心的個人數(shù)字圖書館系統(tǒng)等。這些系統(tǒng)集成各圖書館服務(wù)功能,允許用戶根據(jù)自身需要來訂制個人圖書館,從而獲得圖書館提供的個性化服務(wù)[25]。

3.5.2 前沿技術(shù)——虛擬現(xiàn)實(shí)技術(shù)

虛擬現(xiàn)實(shí)技術(shù)指眾多借助多媒體、網(wǎng)絡(luò)傳感等媒介的科學(xué)技術(shù)總和,可利用計算機(jī)創(chuàng)建三維動態(tài)仿真視景,讓用戶通過體驗虛擬世界感知真實(shí)環(huán)境[26]。如數(shù)字圖書館可以運(yùn)用虛擬現(xiàn)實(shí)技術(shù),為用戶展示圖書館整體及書架內(nèi)容的三維全景,讓用戶可以方便快捷地進(jìn)入任意閱覽專區(qū),獲得檢索圖書的具體信息。數(shù)字圖書館可以充分利用虛擬現(xiàn)實(shí)技術(shù)的人機(jī)交互功能,為用戶創(chuàng)建三維立體的學(xué)習(xí)環(huán)境。

3.6 面向系統(tǒng)安全的技術(shù)

3.6.1 傳統(tǒng)技術(shù)——信息安全技術(shù)

“信息安全”這一概念有多種定義,目前主要有兩大類:一類指具體信息技術(shù)系統(tǒng)的安全,另一類指某種特定的信息體系的安全。信息安全一般包括5種屬性:(1)完整性,指保證信息在傳輸或存儲時不被修改、不丟失的特性;(2)可用性,指信息能被合法用戶訪問和使用的特性;(3)保密性,指信息不被泄漏給非授權(quán)的個人或?qū)嶓w,或供其使用的特性;(4)可控性,指授權(quán)機(jī)構(gòu)可隨時控制信息的機(jī)密性;(5)可靠性,指信息以用戶認(rèn)可的質(zhì)量連續(xù)服務(wù)于用戶的特性。信息安全指采用一切可能的方法和手段,來保證信息的上述特性的安全[27]。

數(shù)字圖書館發(fā)展至今,信息安全已經(jīng)成為圖書館建設(shè)特別重視的問題。威脅數(shù)字圖書館信息安全的因素逐漸增多,如人為安全隱患、自然安全隱患和計算機(jī)系統(tǒng)安全等[28]。在這些隱患影響下,數(shù)字圖書館建設(shè)可能面臨數(shù)據(jù)保密、安全存儲、權(quán)限管理、訪問控制以及知識產(chǎn)權(quán)等信息安全問題,因此需要建立一套數(shù)字化信息安全體系,以滿足圖書館信息安全需求。為保證信息資源數(shù)據(jù)的安全性,圖書館可采用先進(jìn)的海量信息存儲技術(shù),并對館藏信息資源進(jìn)行定期安全備份;為實(shí)現(xiàn)有效訪問控制,可采用統(tǒng)一身份認(rèn)證的方式,確保訪問用戶是合法認(rèn)證的授權(quán)用戶。圖書館還可根據(jù)不同用戶的信息需求,將用戶劃分為不同的層級并設(shè)置相應(yīng)的訪問權(quán)限。在宏觀層面上,圖書館應(yīng)加快信息安全基礎(chǔ)設(shè)施建設(shè),制定相應(yīng)標(biāo)準(zhǔn)和法律法規(guī),在保證圖書館數(shù)據(jù)安全的同時,也能保障圖書館的合法利益。

3.6.2 前沿技術(shù)——云安全技術(shù)

云安全技術(shù)包括云計算的安全防護(hù)和安全云計算[29]。云計算的安全防護(hù)包括云計算應(yīng)用服務(wù)和數(shù)據(jù)信息兩個方面,安全云計算可以保證云計算技術(shù)的詳細(xì)應(yīng)用(即云形式的交付和提供的安全)。云安全技術(shù)能保障數(shù)據(jù)安全、防止黑客攻擊、控制用戶使用權(quán)限和提高網(wǎng)絡(luò)防火墻的防護(hù)級別。

4 結(jié)語

數(shù)字圖書館技術(shù)發(fā)展包括圍繞書目或自動化系統(tǒng)的技術(shù)(如聯(lián)機(jī)編目系統(tǒng))、圍繞資源數(shù)字化的技術(shù)(如全文檢索技術(shù))和圍繞資源集成的技術(shù)(如跨庫檢索)。近年來,數(shù)字圖書館建設(shè)更加注重多種技術(shù)的融合使用,如將云計算技術(shù)與數(shù)字資源整合技術(shù)相結(jié)合等。未來我國數(shù)字圖書館建設(shè)將繼續(xù)引進(jìn)或借鑒國外先進(jìn)技術(shù),進(jìn)一步簡化各類技術(shù)方便用戶的掌握和運(yùn)用。

大數(shù)據(jù)時代的到來給社會各個領(lǐng)域帶來新的變革與挑戰(zhàn),新的信息技術(shù)環(huán)境也為當(dāng)前數(shù)字圖書館建設(shè)提供新的技術(shù)支持,使海量信息的處理和利用成為現(xiàn)實(shí)。同時,新技術(shù)的發(fā)展為圖書館的管理和服務(wù)帶來前進(jìn)的動力,在這種形勢下,圖書館建設(shè)應(yīng)采取積極的應(yīng)對措施,主動將有利于圖書館建設(shè)的信息技術(shù)引入并應(yīng)用,充分發(fā)揮圖書館信息中心和知識中心的社會職能,滿足社會和個人的更高的信息需求。

[1]奉國和.數(shù)字圖書館[M].北京:北京大學(xué)出版社,2013.

[2]奉國和.數(shù)字圖書館體系結(jié)構(gòu)研究[J].情報雜志,2009,28(7):145-149.

[3]王世偉.當(dāng)代全球圖書館事業(yè)面臨的難題與挑戰(zhàn)[J].中國圖書館學(xué)報,2008,34(1):13-15,32.

[4]CiteSpace[EB/OL].[2017-03-21].http://cluster.cis.drexel.edu/~cchen/citespace/.

[5]何驥.試析網(wǎng)絡(luò)環(huán)境下圖書館數(shù)字資源整合的現(xiàn)狀與發(fā)展[J].當(dāng)代圖書館,2011(3):64-66.

[6]王慶恒,馬自衛(wèi),李高虎.統(tǒng)一檢索服務(wù)關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2010,26(4):18-23.

[7]屈冠軍.基于實(shí)現(xiàn)跨庫檢索的數(shù)字資源整合技術(shù)探討[J].圖書館,2009(6):86-88.

[8]蘇新寧.大數(shù)據(jù)時代數(shù)字圖書館面臨的機(jī)遇和挑戰(zhàn)[J].中國圖書館學(xué)報,2015(6):4-12.

[9]葉翔.基于大數(shù)據(jù)的數(shù)字圖書館信息服務(wù)資源整合系統(tǒng)研究[J].河南圖書館學(xué)刊,2017,37(1):123-125.

[10]沈固朝,儲荷婷,華薇娜.信息檢索(多媒體)教程:第2版[M].北京:高等教育出版社,2009.

[11]蘇新寧.基于XML的中文全文檢索關(guān)鍵技術(shù)及其發(fā)展——簡評《XML文檔全文檢索的理論與方法》[J].情報科學(xué),2013(11):155-158.

[12]莫祖英.數(shù)字圖書館信息檢索技術(shù)研究綜述[J].情報探索,2010(9):97-100.

[13]孟春全.數(shù)字圖書館關(guān)鍵技術(shù)探討[J].技術(shù)與創(chuàng)新管理,2007,28(5):77-78.

[14]胡虓宇.數(shù)字圖書館音視頻資源信息檢索技術(shù)研究[J].電子技術(shù)與軟件工程,2013(11):21.

[15]唐吉深.圖書館數(shù)據(jù)挖掘技術(shù)研究現(xiàn)狀述評[J].圖書館界,2011(1):42-44,66.

[16]楊曄.數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館建設(shè)中的應(yīng)用[J].現(xiàn)代經(jīng)濟(jì)信息,2008(7):216-217.

[17]喬幸娟.數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中的應(yīng)用研究[J].農(nóng)業(yè)圖書情報學(xué)刊,2014,26(12):118-120.

[18]李碩,石麗紅,呼忠權(quán),等.序列模式挖掘技術(shù)在數(shù)字圖書館中的應(yīng)用[J].農(nóng)業(yè)圖書情報學(xué)刊,2015,27(7):40-43.

[19]MELL P M, GRANCE T. The NIST definition of cloud computing[EB/OL].(2011-09-28)[2017-07-01].https://www.nist.gov/publications/nist-definitioncloud-computing?pub_id=909616.

[20]胡榮.淺論云計算技術(shù)在數(shù)字圖書館中的應(yīng)用[J].科技創(chuàng)業(yè)月刊,2011,24(7):107-109.

[21]韓普,沈思,路高飛.云計算在國內(nèi)外數(shù)字圖書館中的應(yīng)用及進(jìn)展[J].現(xiàn)代情報,2012,28(5):67-70.

[22]李志萍.Hadoop分布式云計算在圖書館數(shù)字資源建設(shè)中的應(yīng)用研究[J].內(nèi)蒙古科技與經(jīng)濟(jì),2017(1):82-84,156.

[23]王耀東.數(shù)字圖書館個性化服務(wù)技術(shù)[J].中國科技信息,2006(16):168-170.

[24]柳燕,高蕾.數(shù)字圖書館個性化服務(wù)技術(shù)研究[J].長沙鐵道學(xué)院學(xué)報(社會科學(xué)版),2011(4):275-276.

[25]胡秀云.云計算環(huán)境下數(shù)字圖書館個性化信息服務(wù)研究[D].武漢:湖北工業(yè)大學(xué),2014.

[26]陸穎雋.虛擬現(xiàn)實(shí)技術(shù)在數(shù)字圖書館的應(yīng)用研究[D].武漢:武漢大學(xué),2013.

[27]馬建峰,沈玉龍編著.信息安全[M].西安:西安電子科技大學(xué)出版社,2013.

[28]陳鵬.數(shù)字圖書館發(fā)展及其信息安全管理策略研究現(xiàn)狀[J].農(nóng)業(yè)圖書情報學(xué)刊,2016(4):88-91.

[29]馬曉亭,陳臣.云安全2.0技術(shù)體系下數(shù)字圖書館信息資源安全威脅與對策研究[J].現(xiàn)代情報, 2011,31(3):62-66.

The Quantitative Analysis of Key Technologies in the Construction of Digital Library in China from 2005 to 2015

CHEN Ya, LU HongRu
(School of Information Management, Nanjing University, Nanjing 210046, China)

At the age of big data, the digital libraries face new opportunities and challenges as the changes of information technologies. This paper introduces several key technologies under the present construction of the digital library, and points out that in the current situation, as the social information service center, libraries should make corresponding changes positively. Only in this way can the libraries play the social role better and satisfy the social information needs.

Digital Library; Big Data; Information Technology

G251

10.3772/j.issn.1673-2286.2017.09.009

* 本研究得到國家社會科學(xué)基金項目“我國圖書館大眾化服務(wù)模式定位和建設(shè)策略研究”(編號:14BTQ019)資助。

陳雅,女,1965年生,博士,教授,研究方向:數(shù)字信息資源管理、圖書館管理與服務(wù),E-mail:yachen@nju.edu.cn。陸紅如,女,1993年生,碩士研究生,研究方向:服務(wù)評價。

2017-06-29)

猜你喜歡
個性化推薦推薦系統(tǒng)個性化
堅持個性化的寫作
文苑(2020年4期)2020-05-30 12:35:12
新聞的個性化寫作
新聞傳播(2018年12期)2018-09-19 06:27:10
基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
上汽大通:C2B個性化定制未來
基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實(shí)現(xiàn)
基于個性化的協(xié)同過濾圖書推薦算法研究
個性化推薦系統(tǒng)關(guān)鍵算法探討
基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
無線定位個性化導(dǎo)覽關(guān)鍵技術(shù)在博物館中的運(yùn)用
图们市| 上蔡县| 龙山县| 湘乡市| 依安县| 竹北市| 上思县| 新蔡县| 丰原市| 海淀区| 涟水县| 贵阳市| 隆化县| 稷山县| 逊克县| 海盐县| 湖南省| 柘城县| 武隆县| 永州市| 增城市| 荆门市| 营口市| 吴江市| 子长县| 和田市| 华宁县| 怀化市| 酉阳| 綦江县| 灵璧县| 扶风县| 瑞金市| 中西区| 广南县| 托里县| 乌拉特后旗| 象州县| 方城县| 青岛市| 普兰店市|