蔣曉艷
(遼寧省委黨校圖書館,遼寧 沈陽 110004)
數(shù)字圖書館(Digital Lib rary)是當今一個國家信息基礎水平的重要標志,也是21世紀世界圖書館發(fā)展的方向。從上個世紀末起,世界各國就掀起了數(shù)字圖書館建設的熱潮。2001年我國政府投資11.2億人民幣用于國家數(shù)字圖書館建設,我國各地、各類型圖書館也紛紛把建設數(shù)字圖書館作為當務之急。數(shù)字圖書館的建設不同于單個傳統(tǒng)圖書館,它不僅是一個高科技項目,更是一個跨地區(qū)、跨部門、跨行業(yè)乃至跨國界的大文化工程,它在理論與實踐中存在著許多迫切需要解決的問題,標準建設更是重中之重。
歷史上各個圖書館特色資源的獨享性和服務范圍的針對性,決定了數(shù)字圖書館的建設需要由眾多圖書館以及各信息提供機構(gòu)共同來完成。由于缺乏統(tǒng)一的標準來規(guī)范,各館都從自身目的和現(xiàn)實條件出發(fā),自主開發(fā)數(shù)字化信息資源,導致各館建設的數(shù)字資源在用戶檢索界面、檢索語言和管理系統(tǒng)等方面存在較大差異,而且大量的數(shù)據(jù)庫及電子出版物結(jié)構(gòu)本身也不兼容,各系統(tǒng)之間難以相互應用,互操作性差。例如,在CERNET(中國教育和科研計算機網(wǎng))中我們可以發(fā)現(xiàn)不少單位所建的信息資源不僅標引項設置不一致,而且缺少檢索其資源的幫助信息,甚至在不同的鏈接點使用不同的名稱等等??梢哉f,數(shù)字圖書館信息資源建設與利用過程中存在的不能共享的問題,絕大多數(shù)是因為沒有建立和執(zhí)行統(tǒng)一的標準造成的。資源共享需要資源共建,但共建并不是泛泛地你建一個,我建一個,而應該是按照統(tǒng)一的標準和規(guī)范,分主題、分學科、分階段地進行。只有在統(tǒng)一的標準之下對電子信息、多媒體信息以及印刷型載體數(shù)字化信息進行規(guī)范的組織和加工,使之有序化,才能將各單位所獨享的信息資源按統(tǒng)一的格式組織起來,實現(xiàn)網(wǎng)絡連接,完成信息資源的有效交流和傳遞,資源共享的夢想才能最終得以實現(xiàn)。
國外數(shù)字圖書館發(fā)展的模式是首先進行圖書館網(wǎng)絡建設,然后再進行網(wǎng)上資源的共建共享,而我國正相反,各館都先忙于進行館藏數(shù)字化建設,然后才想到聯(lián)網(wǎng)。由于沒有全國性的宏觀規(guī)劃和布局,也沒有相應的統(tǒng)一標準,各館已經(jīng)建立的數(shù)字化資源難以相互溝通和相互應用,使得沒有數(shù)字化資源的圖書館也不得不進行自己的數(shù)字化資源建設,從而造成了嚴重的重復建設。據(jù)有關統(tǒng)計資料顯示,2001年我國數(shù)字資源建設的重復率高達90%以上。只有建立統(tǒng)一的標準,才可以協(xié)調(diào)各個單位的資源建設,使大到一個國家,小到一個圖書館或個人,只要符合統(tǒng)一的標準,所建設的數(shù)字資源就可以非常方便地實現(xiàn)共享,從而避免重復建設。同時,制定和執(zhí)行統(tǒng)一的標準還有助于數(shù)字圖書館相關軟件的開發(fā),使得數(shù)字圖書館能夠在擁有統(tǒng)一的數(shù)字資源基礎上,進一步開展信息挖掘、知識查詢、智能處理等工作,否則會在數(shù)據(jù)的轉(zhuǎn)換上花費大量的時間和經(jīng)費。
數(shù)字圖書館是我國信息產(chǎn)業(yè)的重要組成部分。目前,國際上對信息產(chǎn)業(yè),包括對數(shù)字圖書館的保護已不能再采取貿(mào)易壁壘的方式,而只能通過制定本國的行業(yè)、技術等標準和規(guī)范來實現(xiàn)。美國的幾大IT業(yè)巨頭IBM、MICROSOFT等公司在新技術產(chǎn)品研發(fā)時所采取的一個重要策略,就是圍繞所涉及的標準開展大量的宣傳和研究,并竭力使其為其他公司和國家所接受,這實際上也是另一種意義上的侵略。而法國、德國、英國等西歐發(fā)達國家為保護自己國家和企業(yè)的利益,在充分利用現(xiàn)有技術供給的同時,紛紛制定本國技術標準以形成強有力的非貿(mào)易壁壘。我國的數(shù)字圖書館事業(yè)只有制定自己的相關標準,才能形成有力的屏障,保護其自主發(fā)展。因此,標準建設是我國數(shù)字圖書館工程建設應對競爭和挑戰(zhàn)的需要。我們不能將研究重點只放在技術、資源數(shù)字化以及服務模式上,更應當關注數(shù)字圖書館建設中不可或缺的標準與規(guī)范問題。
國外數(shù)字圖書館建設非常重視標準的選擇和應用。20世紀90年代以來,隨著信息技術等高新技術應用速度的加快,一些網(wǎng)絡化、數(shù)字化資源組織在國際標準化方面取得了長足的進展。ISO、國際圖書館標準化國際組織、W3C(萬維網(wǎng)聯(lián)盟World Wide Web Consortium) 和 IETF(Internet Engineering Task Force)等都采取設立專家工作組、全程開放、吸收多方意見和建議等方式,積極推進標準規(guī)范的完善與推廣工作。美國國家標準學會(ANSI)下設全國信息技術標準委員會,從事有關元數(shù)據(jù)的命名、標識、定義、分類和注冊等工作。歐盟在信息與傳播技術標準化方面也做了很大努力,1998年創(chuàng)建的標準化組織——信息社會標準化系統(tǒng)(Information Society Standardization System,ISSS)負責提供全面的標準化服務及產(chǎn)品,提高用戶的標準化意識。隨著數(shù)字圖書館的進一步發(fā)展,更為廣泛和系統(tǒng)的標準規(guī)范體系正逐步被確立。如英國分布式國家電子資源項目(DNER)標準體系、美國RLG/CMI數(shù)字化指南、美國國家信息標準局(NISO)的圖書館系統(tǒng)標準指南以及新西蘭國家圖書館元數(shù)據(jù)標準框架等,都對數(shù)字資源的管理、傳播、利用和保存進行了系統(tǒng)規(guī)范。
目前我國數(shù)字圖書館標準建設也取得了較大進展??萍疾俊段覈鴶?shù)字圖書館標準規(guī)范發(fā)展戰(zhàn)略》項目按照數(shù)字資源的生命周期建立了關于數(shù)字化加工、資源描述、資源組織、資源互操作和資源服務等方面的標準規(guī)范;我國高等教育文獻保障系統(tǒng)也編制了一系列《中國高等教育數(shù)字圖書館技術標準與規(guī)范》,但總體上來說我國數(shù)字圖書館標準規(guī)范建設還處于研究成果的宣傳與推廣階段。2007年以來,《數(shù)字圖書館標準與規(guī)范建設》項目組委托中國科學院國家科學圖書館在全國范圍內(nèi)展開了“全國數(shù)字圖書館標準規(guī)范建設宣傳與推廣”培訓活動,宣傳推廣數(shù)字圖書館的各類技術標準。但同時我國在數(shù)字圖書館支撐技術方面的標準規(guī)范,如信息傳遞標準、網(wǎng)絡互連協(xié)議、服務標準和數(shù)據(jù)保存與安全標準等研究較少,現(xiàn)有的幾種標準大多限于對資源的描述和著錄,并且基本是對國際上比較通用的DC(Dublin Core,都柏林核心元數(shù)據(jù)集)研究和應用的結(jié)果。它們主要有:
①《中文核心元數(shù)據(jù)集》。由國家圖書館根據(jù)OAIS(開放式檔案信息系統(tǒng)ISO標準)模型標準制定,其目標是為海內(nèi)外中文數(shù)字資源的創(chuàng)建、存儲、服務和交換提供一個統(tǒng)一的可供參考的中文元數(shù)據(jù)方案。它適應不同層次對元數(shù)據(jù)的制作要求,考慮了與其他元數(shù)據(jù)方案的可交換性,對中文元數(shù)據(jù)的總體框架結(jié)構(gòu)、核心元數(shù)據(jù)集、基本擴展集、細分規(guī)則作了規(guī)定。其核心元數(shù)據(jù)涵蓋了DC的所有基本元數(shù)據(jù)元素,集成了其他一些元數(shù)據(jù)項目的優(yōu)點,形成了一套結(jié)構(gòu)化的元數(shù)據(jù)解決方案。
②《數(shù)字式中文全文文獻通用格式》。這是文化部制定的行業(yè)標準。它在通用置標語言以及其他國際標準的基礎上設計了中文文獻的數(shù)據(jù)格式,以DC為基本框架,共有16個數(shù)據(jù)項目,可以對文本、圖像、音頻、視頻、計算機程序以及網(wǎng)址資源進行編目和數(shù)字化處理,并規(guī)定了中文數(shù)字化文獻的文本著錄格式,具有高度的兼容性和通用性??梢哉f是中文的“都柏林核心元數(shù)據(jù)”。
③上海圖書館數(shù)字圖書館元數(shù)據(jù)方案。以IBM DL2.4為開發(fā)平臺,該系統(tǒng)的元數(shù)據(jù)方案采用以DC為核心集、多種元數(shù)據(jù)并存的方法,根據(jù)基于XML/PDF的資源描述體系將各類數(shù)據(jù)封裝在一起,統(tǒng)一了元數(shù)據(jù)的描述方法,保證了原始素材內(nèi)容管理中元數(shù)據(jù)的完整性,提高了元數(shù)據(jù)之間以及與其他資源對象數(shù)據(jù)之間的互操作性,同時也提供了一個統(tǒng)一的內(nèi)容管理體系。
④《中文文獻元數(shù)據(jù)標準框架》。北京大學數(shù)字圖書館研究所研制,以各類具有鮮明中文特征的金石拓片和敦煌古卷、善本、輿圖等“中文文獻”為資源實體對象的元數(shù)據(jù)標準?,F(xiàn)已成為北京大學數(shù)字圖書館后續(xù)一系列元數(shù)據(jù)標準制定工作的規(guī)范性文件。北京大學古籍數(shù)字圖書館拓片元數(shù)據(jù)標準就是在此基礎上制定的。
⑤機讀目錄MARC。它是傳統(tǒng)的元數(shù)據(jù)代表。作為國內(nèi)圖書館實現(xiàn)計算機自動化管理的規(guī)范格式,在圖書館中使用最廣,是圖書館描述、存儲、交換、處理以及檢索信息的基礎,經(jīng)過不斷發(fā)展已被圖書館用來描述和存取電子信息資源。從信息技術角度來看,MARC本身是一個詳細的元數(shù)據(jù)規(guī)范,但不適合網(wǎng)絡的特點。
從以上可以看出,中文元數(shù)據(jù)方案中相關數(shù)據(jù)項的數(shù)量相差較大,國家圖書館聯(lián)合其他單位建立的“中文核心元數(shù)據(jù)規(guī)范”使用了近80個數(shù)據(jù)項,而清華大學使用的元數(shù)據(jù)項有16個,且以DC為主要依據(jù)。由于不同單位在中文元數(shù)據(jù)建設方面未達成共識,沒有采取聯(lián)合、協(xié)作、共享的策略,故此中文元數(shù)據(jù)的標準化和規(guī)范化還難以實現(xiàn)。同時,由于DC以描述性數(shù)據(jù)為主,不足以全面揭示電子文獻的內(nèi)容,而MARC雖對數(shù)據(jù)的描述十分詳盡,但過于復雜,因此要想實現(xiàn)MARC與元數(shù)據(jù)格式之間的互操作和完全對應仍存在困難。
數(shù)字圖書館工程不僅是高科技項目,也是跨部門、跨行業(yè)的大文化工程。同時數(shù)字圖書館的資源囊括了所有學科,而且還包括了文字、表格、圖像、音頻的數(shù)字化表達和無縫鏈接,組織極其復雜。因此數(shù)字圖書館標準與規(guī)范的制定涉及到計算機與通信技術、信息檢索查詢、文本編碼、知識產(chǎn)權保護、電子讀物、開放系統(tǒng)互連協(xié)議等諸多方面。它不是一個孤立的標準,而是一個標準體系,更需要多個標準之間的聯(lián)系、協(xié)調(diào)與銜接,必須由政府出面來統(tǒng)一規(guī)劃、組織和推行。
正如我們所看到的,目前我國已經(jīng)有很多社會團體在不同程度上進行了數(shù)字圖書館的建設或者電子資源的積累,這些都是未來數(shù)字圖書館的資源基礎。我國數(shù)字圖書館建設由于各單位、各地區(qū)的發(fā)展很不平衡,資金、技術、人員素質(zhì)、信息儲量等條件差別很大,導致它們的開發(fā)目的、技術基礎、運行手段都各不相同,這就造成了不同系統(tǒng)提供信息服務的底層應用、操作平臺、通信協(xié)議等各不相同的情況。但作為面向整個社會提供信息基礎設施服務的數(shù)字圖書館建設,不能也不應該把這些信息基礎設施抹去重建,而必須充分利用這些現(xiàn)有的信息資源,以免造成人力物力的巨大浪費。這樣一來異構(gòu)平臺的兼容、現(xiàn)有系統(tǒng)的集成、網(wǎng)絡復雜系統(tǒng)的支持等問題就擺在了我們面前。因此,我國數(shù)字圖書館標準建設必須要充分考慮到我國現(xiàn)有的情況,要在已有的信息基礎設施之上建設通用的、兼容性強的標準,實現(xiàn)更高層次信息服務協(xié)議的統(tǒng)一,從而解決異構(gòu)系統(tǒng)間的互操作問題。
在數(shù)字圖書館標準制定過程中,應參考國外所制定的標準,優(yōu)先采用國際標準(ISO),其次采用國際同類項目使用的工業(yè)標準和事實標準。對于已經(jīng)可用的成熟標準規(guī)范,在數(shù)字資源的組織、存儲、加工、發(fā)布、檢索、存取等方面,要充分加以吸收和利用,使之在數(shù)字圖書館環(huán)境中可以得到很好的實現(xiàn)。同時,由于這些標準基本上都是英文版本,所以在使用過程中,要結(jié)合中文環(huán)境的特殊性,實施本地化工作,在吸收利用的基礎上研究并制定符合中文環(huán)境的標準規(guī)范。對于目前沒有的標準規(guī)范,應根據(jù)數(shù)字圖書館建設的具體實踐,本著與國際接軌的原則,通過周密細致的調(diào)研,制定出具有自主知識產(chǎn)權的技術規(guī)范,供我國數(shù)字圖書館建設使用。同時,在適當時機,可以向國家或國際標準化組織申請,將其形成國家或國際標準。對于需要繼續(xù)研究和開發(fā)的標準規(guī)范,則應根據(jù)標準規(guī)范的動態(tài)發(fā)展變化和逐漸完善的特點,注意采用最新版本,及時更改或增加內(nèi)容。
[1] 潘薇,喻杰.數(shù)字圖書館相關技術領域標準規(guī)范綜述.世界標準化與質(zhì)量管理,2008(6).
[2] 陳定權,張儉恭.數(shù)字資源建設及相關標準.圖書情報工作,2002(6).
[3] 黃星亮.都柏林核心元數(shù)據(jù)及其在我國數(shù)字圖書館建設中的應用.津圖學刊,2002(3).
[4] 郝曉蔚,沈玉蘭.我國數(shù)字圖書館標準建設現(xiàn)狀綜述.科技情報開發(fā)與經(jīng)濟,2007(18).蔣曉艷 女,館員,從事典藏工作。