李莘 李蕾
(哈爾濱工業(yè)大學(xué)圖書館,黑龍江 哈爾濱 150001)
數(shù)字資源的標準化建設(shè)主要涉及對各項相關(guān)技術(shù)標準的制定和實施,是關(guān)系到當前圖書館資源使用和共享的關(guān)鍵因素。如果不按照標準化建設(shè),數(shù)字資源就容易出現(xiàn)重復(fù)開發(fā)和建設(shè)、重復(fù)投入和使用,造成人力和物力的浪費,同時造成資源信息的冗余[1]。美國信息學(xué)專家Gail M.Hodge將數(shù)字資源生命周期劃分為創(chuàng)建、資源獲取與集合生成、標識與編目、存儲、保存成檔以及檢索與復(fù)用6個階段[2]。因此,數(shù)字資源標準規(guī)范體系的建設(shè)規(guī)劃應(yīng)該圍繞數(shù)字資源生命周期的全過程進行。國外關(guān)于數(shù)字資源建設(shè)的標準研究主要集中在對不同標準的理解[3~4]、元數(shù)據(jù)管理與長期保存[5-7],依據(jù)OAIS參考模型構(gòu)建的數(shù)字資源長期保存系統(tǒng)[8],不同國家的長期保存認證標準體系情況[2],采用ISO15489系列標準的電子資源呈繳等[8]方面。我國數(shù)字資源建設(shè)標準研究主要包括國家數(shù)字圖書館的數(shù)字資源建設(shè)類、數(shù)字資源發(fā)布與服務(wù)規(guī)范類、數(shù)字資源統(tǒng)計類、數(shù)字資源長期保存規(guī)范類的標準規(guī)范;科技部制訂的《數(shù)字圖書館建設(shè)中標準規(guī)范應(yīng)用指南》《基本元數(shù)據(jù)規(guī)范》《元數(shù)據(jù)擴展規(guī)劃》《專門元數(shù)據(jù)規(guī)范》《唯一標識符應(yīng)用規(guī)范》等;CALIS管理中心制訂的《中國高等教育數(shù)字圖書館技術(shù)標準與規(guī)范》[9]等。
綜上,國內(nèi)外關(guān)于數(shù)字資源標準體系建設(shè)的研究除國標委提出的規(guī)范體系外[9],基本只研究了數(shù)字資源全生命周期中某一階段的標準或者雖然圍繞生命周期階段制訂了標準,但是未形成通用的國家標準。因此,筆者提出在圖標委擬定的標準規(guī)范體系下,按照全生命周期6階段收集整理現(xiàn)存國內(nèi)外相應(yīng)標準及已出版的國家標準及數(shù)字資源的發(fā)展規(guī)律,以生命周期理論規(guī)劃不同階段的數(shù)字資源建設(shè)標準。
筆者以數(shù)字資源建設(shè)、數(shù)字圖書館、標準等主題詞在中外文數(shù)據(jù)庫進行檢索。將檢索結(jié)果利用知識圖譜軟件進行解析,以便更加直觀地了解數(shù)字資源標準的國內(nèi)外研究現(xiàn)狀。
以主題=(數(shù)字資源建設(shè)or數(shù)字圖書館)and主題=標準,在中國知網(wǎng)中檢索相關(guān)文獻1385篇。該主題發(fā)表文獻的整體趨勢,關(guān)鍵詞出現(xiàn)頻次分布如圖1、2所示。
圖1 中文文獻發(fā)表趨勢分析
圖2 中文文獻主題分布情況(前40個主題詞)
為了進一步細化該領(lǐng)域的研究主題,選取了SATI軟件為該領(lǐng)域文獻繪制了知識圖譜。利用該軟件對所研究主題下的文獻關(guān)鍵詞網(wǎng)絡(luò)做進一步的分析,圖3、4分別是對前40個、前100個出現(xiàn)頻率最高的關(guān)鍵詞網(wǎng)絡(luò)的呈現(xiàn)。由關(guān)鍵詞知識圖譜可見,關(guān)于數(shù)字資源建設(shè)的標準研究主要圍繞Marc格式、XML格式、SGML格式、互操作格式、元數(shù)據(jù)等方面,參考的標準主要有ISO、Dublin、Core、Z39.50等。
圖3 中文文獻中前40個關(guān)鍵詞的共現(xiàn)情況
圖4 中文文獻中前100個關(guān)鍵詞的共現(xiàn)情況
對于外文文獻,選擇了VOSviewer進行關(guān)鍵詞網(wǎng)絡(luò)繪制。選擇Emerald數(shù)據(jù)庫采集樣本,該數(shù)據(jù)庫于1967年由來自世界著名百所商學(xué)院之一Bradford University Management Center的學(xué)者建立。主要出版管理學(xué)、圖書館學(xué)、工程學(xué)等專業(yè)領(lǐng)域的期刊(出版32種圖書館和信息管理學(xué)期刊,其中10種被ISI收錄)。在Emerald數(shù)據(jù)庫以("digital resource*"or"digital library*")and construct*and(standard*or criteria*)為檢索式在任意字段進行檢索,共檢出文獻1278篇。在VOSviewer中選擇在題名摘要字段提取關(guān)鍵詞,以共現(xiàn)40次以上的詞匯形成共詞網(wǎng)絡(luò),如圖5所示。
圖5 外文文獻共現(xiàn)40次以上的關(guān)鍵詞共詞網(wǎng)絡(luò)
由圖5可見,外文文獻中關(guān)于數(shù)字資源建設(shè)的標準研究主要涉及對不同標準的理解[3-4]、元數(shù)據(jù)管理與長期保存[5-7]、數(shù)字資源獲取方式[10]、基于云計算范式的圖書館電子書采用標準[11]、比較中外同義詞庫標準[12]、數(shù)字圖書館建設(shè)與管理中涉及的標準[13-14]、OAI標準[15]、數(shù)字資源的保存[16]等方面,研究范圍較為寬泛。
綜上所述,中文文獻中關(guān)于數(shù)字資源建設(shè)的標準研究主要圍繞Marc格式、XML格式、SGML格式、互操作格式、元數(shù)據(jù)等方面,參考的標準主要有ISO、Dublin、Core、Z39.50等。外文文獻對于數(shù)字資源建設(shè)的標準研究主要集中于元數(shù)據(jù)、文獻(館藏)、資源獲取等方面,參考的標準主要有Dublin、OAI等。
以ISO網(wǎng)站及李晶等對ISO數(shù)字圖書館標準規(guī)范體系內(nèi)容體系的總結(jié)[17]、NISO網(wǎng)站頒布的標準、國家數(shù)字圖書館工程建設(shè)標準為對象,對比分析不同國家、機構(gòu)制訂的標準,國內(nèi)外按數(shù)字資源生命周期制定的標準或規(guī)范在數(shù)字資源建設(shè)不同階段的覆蓋情況如下。
主要包括數(shù)字內(nèi)容的編碼標準、對象標識標準,如ISO10646、GB1803、DOI、EPUB[18]等;WH/T系列包括網(wǎng)絡(luò)資源、圖像、音頻資源、視頻資源、電子連續(xù)性資源、電子圖書、古籍、期刊論文、學(xué)位論文的元數(shù)據(jù)規(guī)范及WH/T52-2012《管理元數(shù)據(jù)規(guī)范》[9]等。
資源獲取與集合生成階段的資源組織管理標準 主 要 包 括 PIE-J、KBART、DOI、ODI、Z39.2、Z39.71[19]等,國內(nèi)標準有WH/T系列射頻識別數(shù)據(jù)模型標準及兩個待審查標準、WH/T47-2012《圖書館數(shù)字資源統(tǒng)計規(guī)范》、WH/T48-2012《數(shù)字對象唯一標識符》等[9]。
主要包括ISO15836:2009《信息與文獻-都柏林核心元數(shù)據(jù)元素集》、ISO 23081-1:2017《信息與文獻-文件管理-文件管理過程-元數(shù)據(jù)-第1部分:原則》《第2部分-概念與實施問題》[17]等涵蓋元數(shù)據(jù)格式、編碼體系、元數(shù)據(jù)置標等內(nèi)容的標準,GB/T31219系列圖書館館藏資源數(shù)字化加工規(guī)范第2部分:文本資源、第3部分:圖像資源、第5部分:視頻資源及WH/T系列的文本、圖像、音頻數(shù)據(jù)加工規(guī)范[9]。
主要包括DOI、DDA、ISO 14721:2012《空間數(shù)據(jù)和信息傳輸系統(tǒng)》——開放檔案信息系統(tǒng)(OAIS)——參考模型》、WH/T72-2015《圖書館數(shù)字資源長期保存信息包封裝規(guī)范》、WH/Z1-2012《圖書館數(shù)字資源長期保存元數(shù)據(jù)規(guī)范》[9]等。
主要包括ISO 25964-1:2011《信息與文獻-敘詞表及與其他詞表的互操作-第1部分:用于信息檢索的敘詞表》、ISO 25964-2:2013《信息與文獻-詞庫和互操作性與其他詞匯-第2部分:互操作性與其他詞匯》、ISO 10160:2015《信息與文獻-開放系統(tǒng)互連-館際互借應(yīng)用服務(wù)定義》[17]等。
高校圖書館數(shù)字資源的標準化建設(shè)應(yīng)該在圖標委框架下以避免出現(xiàn)標準不統(tǒng)一,未來無法與國家標準兼容統(tǒng)一的問題。目前,圖標委在數(shù)據(jù)加工、數(shù)字圖書館管理、對象元數(shù)據(jù)規(guī)范、數(shù)字資源長期保存4大類制訂了25項數(shù)字圖書館相關(guān)標準,其中22項已發(fā)布[9]。
當前,高校圖書館的數(shù)字資源主要包括數(shù)據(jù)庫、電子出版物(電子期刊、電子圖書、光盤等)、網(wǎng)絡(luò)資源、新媒體資源等。數(shù)據(jù)庫包括購買的中外文數(shù)據(jù)庫、自建的數(shù)據(jù)庫(如特色資源庫、學(xué)科導(dǎo)航庫、光盤資源庫、網(wǎng)絡(luò)資源庫、新媒體資源庫等)。對于購買的中外文數(shù)據(jù)庫,可以通過summon等一站式檢索平臺進行檢索,其主要的數(shù)字資源建設(shè)問題是長期保存。而自建數(shù)據(jù)庫的問題是系統(tǒng)多樣、操作困難、數(shù)據(jù)兼容性與互操作性差、原始數(shù)據(jù)處理方式不統(tǒng)一等,非常不利于資源的共享。因此,高校圖書館的數(shù)字資源建設(shè)對于不同類型的數(shù)字資源要考慮設(shè)計的標準也不同。
高校圖書館應(yīng)該發(fā)揮CALIS聯(lián)盟共建共享優(yōu)勢,充分考慮用戶使用需求,結(jié)合數(shù)字資源的特性進行評估,積極參與圖標委標準制訂。在與NISO合作獲得標準翻譯的授權(quán)下,按照圖標委籌建中擬定的標準規(guī)范體系,考慮數(shù)字資源全生命周期各個階段標準覆蓋情況,在已完成的25項標準外重點規(guī)劃建設(shè)下列標準。
江蘇師范大學(xué)蒲筱哥等以數(shù)字資源使用績效評價的5個準則層為基礎(chǔ),構(gòu)建了包括收錄量、學(xué)科覆蓋率、權(quán)威出版物、檢索結(jié)果準確性、數(shù)字資源適用率、年漲價幅度等23個反映數(shù)字資源使用績效的指標層指標,利用改進熵權(quán)法和網(wǎng)絡(luò)分析法相結(jié)合的賦權(quán)模型計算被評價數(shù)字資源使用績效指標的組合權(quán)重,并應(yīng)用改進TOPSIS模型對各樣本數(shù)字資源使用績效進行了實證分析[20]。張瑩(音譯)調(diào)查來自22個國家學(xué)者對數(shù)字圖書館整體評價指標的意見后,建立了數(shù)字圖書館評估模型,用于數(shù)字圖書館的整體評價[21]。Hariri、Nadjla等通過文獻比較研究了數(shù)字圖書館建設(shè)用戶界面的評估標準[22]。上述研究僅涉及數(shù)字資源績效評估標準的部分內(nèi)容,而考慮全生命周期的數(shù)字資源績效評估標準應(yīng)包括數(shù)字圖書館績效評估標準、電子出版物服務(wù)績效評估標準、二次文獻數(shù)據(jù)庫服務(wù)績效標準、自建數(shù)據(jù)庫績效評估標準等。
可參照ISO15489、ISO9000[23]制定包括數(shù)據(jù)資源創(chuàng)建、資源獲取與集合生成、標識與編目、存儲、保存成檔以及檢索與復(fù)用6個階段的數(shù)字資源建設(shè)全生命周期管理標準。在管理中避免出現(xiàn)數(shù)據(jù)孤島,規(guī)范數(shù)據(jù)格式,保證資源的完整性,注意數(shù)字資源的版權(quán)保護問題,提高服務(wù)、管理與建設(shè)效率[24]。
在國際標準基礎(chǔ)上,構(gòu)建中國特色數(shù)字資源長期保存的認證標準體系,該體系建設(shè)可參照歐盟的ERPANET電子資源存儲和獲取項目、德國數(shù)字資源長期保存項目Nestor、美國數(shù)字信息設(shè)施保存項目NDIIPP[2]、英國長期保存的應(yīng)用服務(wù)PLANETS和國家數(shù)字記憶、澳大利亞數(shù)字信息長期保存和利用PADI、荷蘭網(wǎng)絡(luò)化歐洲存儲圖書館NEDLIB、日本網(wǎng)絡(luò)信息保存項目WARP、新西蘭聯(lián)合數(shù)字保存戰(zhàn)略JDPS[25]等,這些長期保存項目多由國家圖書館主導(dǎo),而國外很多高校也自主或作為合作方參與到數(shù)字保存項目[25]。在數(shù)字資源長期保存標準建設(shè)中可參照的標準包括OAIS和ISO15489[8]。
作為高校圖書館的協(xié)調(diào)管理部門,CALIS管理中心可以借鑒國家公共文化數(shù)字支撐平臺資源共享系統(tǒng)的數(shù)字資源建設(shè)標準化流程[26],前瞻性地以智慧圖書館[27-28]為研究對象選擇上述尚未建立或者尚不完整的方向與國家圖書館合作制定建設(shè)標準框架體系,組織協(xié)調(diào)聯(lián)盟內(nèi)各高校圖書館參與編撰上述標準,完成標準制定后先在聯(lián)盟內(nèi)各成員館中試行相關(guān)標準,及時就出現(xiàn)的問題進行標準修訂,完成修訂后通過圖標委認證并報請國家標準化管理委員會批準成為正式標準,推廣并及時組織貫標、標準培訓(xùn)等工作,使各成員館可以統(tǒng)一工作標準,按照數(shù)字資源全生命周期創(chuàng)建、資源獲取與集合生成、標識與編目、存儲、保存成檔以及檢索與復(fù)用的6個階段完成數(shù)字資源的呈繳、管理、長期保存等,同時推進聯(lián)盟內(nèi)及與公共圖書館、專業(yè)圖書館的數(shù)字資源共建共享,避免交叉重復(fù)研究。
數(shù)字資源的建設(shè)標準一直是近年國內(nèi)外的研究熱點,在標準建設(shè)方面,國內(nèi)仍存在信息互通不暢的問題,筆者主要利用文獻調(diào)研及知識圖譜等方法研究國內(nèi)外已發(fā)表的文獻及相關(guān)標準,厘清了數(shù)字資源建設(shè)全生命周期6階段標準覆蓋情況。同時為避免重復(fù)研究,建議高校圖書館數(shù)字資源標準建設(shè)應(yīng)利用CALIS聯(lián)盟優(yōu)勢,與國家圖書館合作,在目前圖標委的數(shù)字資源建設(shè)標準框架下查缺補漏,重點選擇6階段中未制訂或制訂不完善的標準如數(shù)字資源績效評估標準、數(shù)字資源建設(shè)全生命周期的管理標準、數(shù)字資源長期保存標準進行研究。并且,在標準制定規(guī)劃中要具有前瞻性,充分考慮未來智慧圖書館的發(fā)展需求,力求使研究制訂的標準符合智慧圖書館的發(fā)展需要。