韓 梅
(佳木斯大學,154007)
數(shù)字資源整合(Digital resources integration)是數(shù)字資源優(yōu)化組合的一種存在狀態(tài),是依據(jù)一定的需要,對各個相對獨立關系進行融合、類聚和重組,重新結(jié)合為一個新的有機整體,形成一個效能更好、效率更高的新的數(shù)字資源體系。國外的數(shù)字資源整合研究始于1998年,至今經(jīng)歷了三個發(fā)展階段:介紹推廣階段、普及應用階段和全面發(fā)展階段。我國數(shù)字資源整合研究幾乎和國外同時起步,從目前可以檢索到的資料來看,我國最早闡述這一理論的是臺灣省的陳昭珍教授。2000年,他寫了《電子圖書館整合檢索之理論與實踐》,該書在當時技術水平基礎上分析了數(shù)字資源的整合檢索需求與模式,介紹了Z39.50協(xié)議在圖書館數(shù)字資源整合中的應用,并對電子資訊的整合檢索發(fā)展趨勢作一些宏觀上的展望[1];同年,黃學軍和唐太可在《現(xiàn)代圖書情報技術》第2期上發(fā)表文章,提出基于Z39.50協(xié)議基礎上的書目整合檢索的必要性及其實現(xiàn)方法[2];之后,相繼發(fā)表了一些介紹性和應用性的論文,并逐漸應用到各學科領域。經(jīng)過10年的努力,我國數(shù)字資源整合研究取得了長足發(fā)展,成為圖書情報界一個嶄新的研究課題。
關于我國數(shù)字資源整合研究狀況的文獻調(diào)研主要是以中國知識資源總庫的《中國學術期刊全文數(shù)據(jù)庫》、《優(yōu)秀博碩士學位論文全文數(shù)據(jù)庫》、《中國重要報紙全文數(shù)據(jù)庫》、《中國重要會議論文全文數(shù)據(jù)庫》、維普期刊網(wǎng)為數(shù)據(jù)統(tǒng)計源,以“關鍵詞”為檢索入口,用“數(shù)字資源整合”為檢索式,采用“模糊”檢索方式進行的(截止2009年11月30日),共檢索出文獻316篇,基本的調(diào)研結(jié)果如表1所示。
表1提供的統(tǒng)計數(shù)據(jù)表明,10年來我國數(shù)字資源整合的發(fā)展經(jīng)歷了三個階段:(1) 第一階段(2000-2002年)為研究基礎建立階段。這段時間相關研究論文不多,有13篇,約占論文總數(shù)的4.11%,說明數(shù)字資源整合在當時尚屬新事物,雖然有強大生命力,但是沒有得到應有的重視,該階段的任務主要是明確數(shù)字資源整合的概念和意義、性質(zhì)和特點、目標和原則、結(jié)構(gòu)和功能、技術和模式等所組成的理論框架,解決本領域存在的最基本的問題,并且逐步從基礎理論的內(nèi)部加以完善。(2)第二階段(2003-2006年)為理論創(chuàng)新和實踐發(fā)展階段。這一階段研究論文有顯著增長,有123篇,說明數(shù)字資源整合研究在學術界引起了研究者的廣泛重視,該階段的任務主要是明確數(shù)字資源整合這個領域所覆蓋的豐富內(nèi)容以及這些內(nèi)容之間的關系,在加強上一階段研究的基礎上,開展數(shù)字資源整合的理論創(chuàng)新,促進數(shù)字資源整合的實踐發(fā)展。(3)第三階段(2007-2009年)為理論方法技術推廣和完善階段。這一階段研究的熱點仍然高漲,尤其突出的是,在各個高校的碩士論文和博士論文中研究數(shù)字資源整合的人數(shù)不斷增加,該階段的任務主要是將上述兩個階段已經(jīng)建立的基本理論和實踐經(jīng)驗從內(nèi)部和外部全面加以完善,將數(shù)字資源整合推廣到更廣闊的領域,尋求數(shù)字資源整合更深層次的應用。
表1 2000年-2009年發(fā)表的研究論文數(shù)量統(tǒng)計
用科研立項的方式或者借助其它項目的資助進行數(shù)字資源整合研究是我國數(shù)字資源整合研究的重要方法。本文選擇檢索入口“基金”,主題為“數(shù)字資源整合”,匹配方式為“模糊”,對中國知識資源總庫和中國期刊網(wǎng)CNKI兩個數(shù)據(jù)庫中收錄的2000-2009年的全部期刊進行統(tǒng)計,表2為立項研究的統(tǒng)計情況。
從表2的統(tǒng)計數(shù)據(jù)可以看出,316篇研究論文共獲得12個項目資金或課題資助,其中國家基金4項,省部級基金2項,市級基金3項,校級基金3項。從基金資助情況來看,“數(shù)字資源整合”研究論文獲得基金資助率很低,說明被重視的程度不夠,今后應多方位爭取資金的資助。
表2 立項研究的統(tǒng)計
表3 論文的主題統(tǒng)計
對論文主題進行分析有助于我們了解該研究領域的基本特點和重點內(nèi)容,掌握研究發(fā)展的整體趨勢和規(guī)律,認清優(yōu)勢與不足,指導今后的研究發(fā)展。通過閱讀原文或摘要,按照論文所討論的主要內(nèi)容,每一篇論文歸入一個主題,316篇論文分5個主題進行歸納,具體分布情況見表3。
國內(nèi)數(shù)字資源整合工作近幾年才剛剛起步,但受到了研究者們的普遍關注,大多數(shù)高校圖書館及技術力量雄厚的公共圖書館都已經(jīng)開展了此項工作。根據(jù)筆者對全國10所大學圖書館網(wǎng)站和中國高等教育文獻保障體系網(wǎng)站的調(diào)查,現(xiàn)對當前國內(nèi)圖書館開展數(shù)字資源整合工作的狀況及數(shù)字資源整合系統(tǒng)的使用情況作一介紹。
目前,我國大多數(shù)圖書館開展數(shù)字資源整合工作所采用的整合方式主要有4種:基于OPAC的整合、基于資源導航的整合、基于系統(tǒng)的整合和基于服務的整合。其中基于OPAC的整合是一種基于傳統(tǒng)書目管理的整合模式,它通過執(zhí)行Z39.50協(xié)議,聚合不同平臺上的異構(gòu)OPAC數(shù)據(jù)庫,建立書目整合檢索系統(tǒng)[3],用戶只要通過此系統(tǒng)就可以檢索相關圖書館的OPAC。基于資源導航的整合也就是數(shù)據(jù)源的整合,即通過數(shù)字資源的URL建立數(shù)字資源導航系統(tǒng),根據(jù)整合資源類型的多少,可以分為整體導航和部分導航:整體導航是將多種類型的數(shù)字資源作為導航對象,為用戶提供統(tǒng)一的檢索界面或鏈接;部分導航只對一種類型的數(shù)字資源進行導航?;谙到y(tǒng)的整合也可分為跨庫檢索的整合方式和參考鏈接整合兩種方式:跨庫檢索的整合方式其實是數(shù)據(jù)源整合的進階,實現(xiàn)對分布式資源的一站式訪問;參考鏈接整合是實現(xiàn)不同信息源的內(nèi)容關聯(lián)?;诜盏恼蟿t是在資源整合的基礎上建立知識化、智能化、個性化的知識服務系統(tǒng)[4]。2009年10月,筆者對國內(nèi)10所高校圖書館的數(shù)字資源整合方式進行了調(diào)查,結(jié)果見表4。
目前,國內(nèi)圖書館的整合工作并不是面向所有類型的數(shù)字資源,而是從部分類型的資源整合入手,再逐步擴大整合范圍,比較有代表性的數(shù)字資源整合類型主要有兩類:一類是OPAC系統(tǒng)的資源類型,另一類是學科導航的資源類型。其中OPAC系統(tǒng)的資源類型包括紙質(zhì)書刊、電子期刊、電子圖書、報紙、光盤、學位論文、縮微資料、多媒體資料、圖片、網(wǎng)絡資源、參考工具書;學科導航的資源類型包括電子期刊、電子圖書、學位論文、會議論文、多媒體資源、網(wǎng)絡資源等。
表4 數(shù)字資源整合的方式
表5 數(shù)字資源整合的類型及系統(tǒng)功能調(diào)查表
要開展數(shù)字資源整合工作,就必須使用適合本館資源現(xiàn)狀的整合系統(tǒng)。也就是說,數(shù)字資源整合系統(tǒng)功能的強弱,是影響整合效果的關鍵所在。當前,各圖書館使用的整合系統(tǒng)不盡相同,主要來自三個途徑:引進購買、自主開發(fā)、聯(lián)合相關的信息服務單位開發(fā)產(chǎn)品。
有關數(shù)字資源整合的類型及系統(tǒng)功能的詳細情況見表5。
基于知識管理的數(shù)字資源整合不僅提供各類文獻數(shù)據(jù)庫的檢索,而且還利用Links機制建立起與多種學術信息源的鏈接,能實現(xiàn)不同類型、不同學科數(shù)據(jù)庫的雙向鏈接,拓展了文獻之間的內(nèi)在聯(lián)系,實現(xiàn)了二次文獻與事實性文獻的整合以及與原始文獻全文的鏈接。
利用知識組織原理和技術,對不同渠道、不同類型、不同學科、不同形式的知識加以整合,按數(shù)字資源的邏輯關系,組織成立體網(wǎng)狀、相互聯(lián)系的知識體系,以實現(xiàn)數(shù)字資源的有效組織和共享利用[5]。
以用戶為中心,充分利用信息技術促進數(shù)字資源整合是數(shù)字圖書館建設到一定階段出現(xiàn)的新任務,這里涉及觀念問題、技術問題、服務模式構(gòu)架等?;谟脩舻臄?shù)字資源整合就是通過技術合力,將復雜轉(zhuǎn)變?yōu)楹唵?,將?shù)據(jù)線性一元轉(zhuǎn)變?yōu)榫W(wǎng)絡多元,同時,查全率與查準率共生增長,用戶滿意度實質(zhì)性提高,實現(xiàn)數(shù)字圖書館建設的最優(yōu)目標[6]。
基于語義的數(shù)字資源整合主要采用了本體技術,本體是對某個領域中概念的形式化描述,即本體是領域內(nèi)部不同主體之間進行交流的一種語義基礎,提供了一種明確定義的共識。基于語義的資源整合借助XML語法,以元數(shù)據(jù)為基礎構(gòu)建知識本體,通過RDF來實現(xiàn)元數(shù)據(jù)描述和交換,這樣能夠最大可能地解決一詞多義和同義詞的問題,減少漏檢和錯檢,同時發(fā)現(xiàn)資源之間潛在的相互聯(lián)系。另外,基于語義的資源整合在保持各個異構(gòu)數(shù)據(jù)庫獨立性的基礎上通過抽取元數(shù)據(jù),來代表相關資源,這樣就克服了異構(gòu)統(tǒng)一平臺對特殊數(shù)據(jù)庫無法整合的弊端,實現(xiàn)資源更大范圍的整合[7]。
綜上所述,經(jīng)過10年的發(fā)展,我國數(shù)字資源整合研究已經(jīng)取得了不小的成就,但同時也存在著不足:(1)在基礎理論部分對數(shù)字資源整合比較專門的問題仍然缺乏研究;(2)缺乏資源組織的規(guī)范與標準,資源共享較難;(3)我國數(shù)字資源整合實踐發(fā)展不足,基本上沒有形成數(shù)字資源整合的方法和技術的研究體系;(4)系統(tǒng)整合平臺眾多,但缺乏實踐團體的積極參與以及理論團體與實踐團體之間的密切溝通和合作。所以,筆者認為,我國數(shù)字資源整合研究今后的發(fā)展方向應是:(1)通過基于服務的整合,實現(xiàn)從信息服務到知識服務;(2)建立一個中國特色的,研究者們可以互相學習、交流、溝通和相互促進的平臺,讓中國的數(shù)字資源整合從理論走向應用;(3)需要產(chǎn)生大量具有中國知識產(chǎn)權的數(shù)字資源整合系統(tǒng),為世界的數(shù)字資源整合研究做出貢獻。
[1]陳昭珍.電子圖書館整合檢索之理論與實踐[M].臺灣:文華圖書館管理資訊股份有限公司,2000:23-24.
[2]黃學軍,唐太可.書目整合檢索Web網(wǎng)關的設計[J].現(xiàn)代圖書情報技術,2000,(2).29-31.
[3]馬文鋒.數(shù)字資源整合研究[J].中國圖書館學報,2002,(4):64-67.
[4]許萍華,丁申桃.數(shù)字資源整合目標與模式探討[J].圖書館雜志,2005,(5):32-34,38.
[5]王愛麗.數(shù)字資源整合技術與模式研究[J].圖書館學研究,2006,(3):60-62,73.
[6]高新陵,謝友寧.基于用戶的數(shù)字資源整合模式研究[J].圖書館雜志,2005,(5):35-38.
[7]雷 強等.基于語義的數(shù)字資源整合[J].中國信息導報,2005,(5):32-34.