譚 燁
(國家圖書館 北京 100081)
“十三五”規(guī)劃建議中提出要“深化文化體制改革,實施重大文化工程,完善公共文化服務體系”,強調了現(xiàn)代公共文化服務體系的建設與完善[1]。近年來,數(shù)字圖書館、數(shù)字藝術館、數(shù)字博物館、文化云等公共數(shù)字文化服務形式不斷涌現(xiàn),數(shù)字資源急劇增長,各個機構根據(jù)本單位的資源特點、組織方式、技術方法、系統(tǒng)能力和管理模式等,獨立制定其對應系統(tǒng)的數(shù)字資源標識方式和讀取方式,導致資源重復建設情況普遍存在[2]。這種各自為政的建設模式極大限制了各文化機構間的互操作,阻礙了人們對數(shù)字資源的有效利用。為響應公共數(shù)字文化工程融合發(fā)展的需要,構建公共數(shù)字文化唯一標識符體系,建立唯一標識符數(shù)據(jù)全國資源目錄勢在必行。
數(shù)字資源唯一標識符(CDOI)是獨立于應用系統(tǒng)、物理位置和存取協(xié)議而存在的永久性獨有名稱,能有效地定位與鏈接到指定數(shù)字資源,實現(xiàn)跨系統(tǒng)的指向、鏈接與讀取,并支持多個系統(tǒng)對分布數(shù)字資源的調用和集成操作,具有唯一性、持久性、兼容性、互操作性、易維護性、通用性等特點[3]。唯一標識符作為數(shù)字化對象的識別符,對所標識的數(shù)字對象而言,具有全球唯一性,類似于公民身份證。在互聯(lián)網(wǎng)環(huán)境下,這種唯一性能夠有效保證對數(shù)字化對象的準確訪問,避免重復。數(shù)字對象標識符具有持久性的特征,數(shù)字化對象的版權或者其物理存儲地址的變化都不會影響唯一標識符,唯一標識符產(chǎn)生之后便永遠不變[5]。數(shù)字資源的唯一標識符也是實現(xiàn)應用系統(tǒng)互操作的關鍵技術之一[4],通過對每個數(shù)字資源進行唯一標識,可以使數(shù)字資源的標識獨立于物理位置、應用系統(tǒng)和存取協(xié)議,有效鏈接每個數(shù)字資源。
對數(shù)字資源進行唯一標識,可以將數(shù)據(jù)采集、加工、組織、發(fā)布、服務以及保存等全生命周期的各環(huán)節(jié)中的數(shù)字資源進行統(tǒng)一編號和規(guī)范管理,也可以實現(xiàn)全國圖書館數(shù)字資源的精確定位和應用系統(tǒng)之間的互操作。公共圖書館唯一標識符體系以各級圖書館為主要節(jié)點,覆蓋全國的知識網(wǎng)絡,提供完善的資源注冊和知識定位服務,采用技術手段打破不同行業(yè)、不同地域圖書館之間的界限,實現(xiàn)全國用戶對資源的統(tǒng)一定位和資源獲取,使全國分散異構的公共圖書館系統(tǒng)業(yè)務能夠有效融合。
借鑒該思路,將唯一標識符體系從公共圖書館行業(yè)拓展至公共數(shù)字文化行業(yè),建立公共數(shù)字文化唯一標識符體系,可以實現(xiàn)全國公共文化行業(yè)之間的數(shù)據(jù)交換以及應用系統(tǒng)之間的互操作,有效避免各文化機構間資源的重復建設,促進信息資源的共建共享,提高公共文化服務的覆蓋面和適用性,滿足用戶不斷增長的數(shù)字文化需求,推動公共數(shù)字文化工程融合創(chuàng)新發(fā)展,為全國文化大融合提供技術支撐。
2.1 建設歷程
國家圖書館于2008年對數(shù)字資源唯一標識符標準規(guī)范開展研究,并建立了國家圖書館唯一標識符標準規(guī)范,提出了國家圖書館唯一標識符應用的實施路線,制定了唯一標識符的體系框架、語法規(guī)則、命名規(guī)則、解析規(guī)則和管理規(guī)則等。
2011年初,在數(shù)字圖書館推廣工程的帶動下,國家圖書館啟動了國家數(shù)字圖書館唯一標識符系統(tǒng)項目,該項目于2012年11月完成建設。在近五年的運行中,完成了全國48 個省、市級圖書館唯一標識符系統(tǒng)的部署,完成220 萬條唯一標識符的注冊,基本構建了公共圖書館數(shù)字資源唯一標識符體系[5]。
為提高系統(tǒng)核心性能,優(yōu)化系統(tǒng)功能,豐富系統(tǒng)平臺接口,建立唯一標識符數(shù)據(jù)的聚類關系,2016年,國家圖書館唯一標識符系統(tǒng)的升級優(yōu)化項目啟動立項,2017年該項目上線運行。升級后的系統(tǒng),由原來的“國家-省-市”三層架構,改為星形架構,以國家圖書館為核心,下屬省級/副省級/直轄市圖書館的注冊機構,其它市級館/區(qū)級圖書館不分配直接在所屬省館里注冊數(shù)據(jù)。截至2019年底,已分配省級注冊機構38 個。升級后的系統(tǒng)兼顧實用性、穩(wěn)定性、可擴展性、兼容性,為公共圖書館數(shù)字資源的建設和充分利用提供了便捷、高效的平臺。
2.2 應用現(xiàn)狀
唯一標識符(CDOI)命名規(guī)則采用“前綴/后綴”的方式,前綴和后綴各段采用英文半角“.”分 隔,如“108.ndlc.2.1100009031010001/T1.003171449”。前綴包括四段,分別為國家區(qū)域代碼、國家數(shù)字圖書館代碼、服務節(jié)點代碼以及注冊機構代碼;后綴為綜合信息編號和系統(tǒng)內部標識號。標識范圍包括公共圖書館已有數(shù)字資源以及數(shù)字圖書館和國內外相關領域應用與發(fā)展的各種語種的所有元數(shù)據(jù)和對象數(shù)據(jù)。標識對象粒度包括多種形式,如單冊圖書和一套叢書,圖書的章節(jié),期刊,期刊中的一期,一期中的目次、一篇論文,一篇論文的幾頁、單頁,單頁中的一幅圖片、公式,多媒體資源集合,一首樂曲,樂曲中的一段音樂等。
唯一標識符注冊、解析、數(shù)據(jù)同步是唯一標識符系統(tǒng)(CDOI 系統(tǒng))的核心功能。國家圖書館自2012年起,持續(xù)進行館藏自建在線服務數(shù)字資源注冊工作;隨著數(shù)字圖書館推廣工程資源聯(lián)建項目和公共數(shù)字文化工程資源聯(lián)建項目的推進,各省市圖書館亦根據(jù)實際需求對本館在線服務數(shù)字資源進行唯一標識符注冊工作[6]。唯一標識符注冊方式可以分為手工注冊(單條、批量)、系統(tǒng)接口自動注冊。
唯一標識符注冊完成后,利用唯一標識符強大的解析功能,在國家圖書館數(shù)字資源發(fā)布服務系統(tǒng)、OPAC 系統(tǒng)等業(yè)務系統(tǒng)中持續(xù)開展應用[7]。讀者點擊資源詳情頁的唯一標識符鏈接,系統(tǒng)可調取唯一標識符正向解析接口獲取對象數(shù)據(jù)URL 地址,快速定位到對象數(shù)據(jù)閱讀頁,實現(xiàn)資源在線閱讀。CDOI 系統(tǒng)不僅可以解析符合自身標準的唯一標識符,還在正向解析上兼容符合DOI 國際標準的唯一標識符,公眾可通過本系統(tǒng)解析任何DOI 唯一標識符。
作為系統(tǒng)互操作的關鍵技術,唯一標識符為數(shù)字圖書館的資源集成、服務整合和知識鏈接提供了重要手段。唯一標識符的生成、注冊和服務與數(shù)字圖書館其他系統(tǒng)相互關聯(lián),共同構成數(shù)字圖書館的服務體系,對全國聯(lián)合目錄等資源主導項目以及搜索引擎、門戶等服務主導項目提供基礎性、技術性支撐。
隨著公共數(shù)字文化工程融合工作的開展,為加強公共數(shù)字文化工程數(shù)字資源的規(guī)范管理和統(tǒng)一調度,構建公共數(shù)字文化唯一標識符體系,國家圖書館于2019年啟動了公共數(shù)字文化唯一標識符系統(tǒng)建設項目,擬對公共圖書館、文化館等機構數(shù)字資源提供唯一標識符注冊和解析等服務,提供跨域跨平臺的資源服務業(yè)務支撐[8]。
公共數(shù)字文化唯一標識符體系的建設首先要考慮文化機構數(shù)字資源的建設情況,根據(jù)唯一標識符命名規(guī)則、注冊規(guī)則和解析規(guī)則,進行系統(tǒng)平臺的建設。通過系統(tǒng)平臺整合公共文化機構的數(shù)字資源,形成能夠容納國家級文化機構、省級/副省級文化機構、市/縣、區(qū)級文化機構的總分式唯一標識符體系,實現(xiàn)唯一標識符的統(tǒng)一規(guī)劃和服務。
3.1 體系架構
公共數(shù)字文化工程唯一標識符體系架構包括唯一標識符中心節(jié)點、國家級文化機構系統(tǒng)節(jié)點、省級/副省級文化機構注冊節(jié)點及市/縣/區(qū)文化機構節(jié)點四個層次,其體系架構如圖1所示。
圖1 公共數(shù)字文化唯一標識符體系架構
唯一標識符中心節(jié)點:唯一標識符中心節(jié)點是系統(tǒng)核心控制層。中心節(jié)點主要負責數(shù)據(jù)同步、審核管理及機構管理。中心節(jié)點具有審核國家級、省級及市縣區(qū)所有注冊申請的權限。
國家級文化機構系統(tǒng)節(jié)點:針對各文化機構體系內的注冊機構進行統(tǒng)籌管理,對下級注冊節(jié)點提交的數(shù)據(jù)進行審核及終驗并提供唯一標識符的解析服務,向唯一標識符中心節(jié)點進行數(shù)據(jù)同步。國家級文化機構系統(tǒng)節(jié)點包括國家數(shù)字圖書館節(jié)點及國家數(shù)字文化館節(jié)點,也可根據(jù)實際需要,擴充其他文化機構節(jié)點,各節(jié)點分別部署服務器,單獨管理。
省級/副省級文化機構注冊節(jié)點:省級/副省級文化機構注冊節(jié)點為各省、自治區(qū)、直轄市級的文化機構,可根據(jù)實際需要擴充其他類文化機構。該級注冊節(jié)點,主要負責本機構的數(shù)據(jù)注冊、維護和審核;對下級注冊節(jié)點提交的數(shù)據(jù)進行審核并向其對應國家級系統(tǒng)節(jié)點提交;對市/縣/區(qū)文化機構節(jié)點的操作員賬戶進行分配及管理。
市/縣/區(qū)文化機構節(jié)點:市/縣/區(qū)文化機構節(jié)點需向省級/副省級文化機構注冊節(jié)點申請操作員用戶,主要負責本節(jié)點唯一標識符數(shù)據(jù)的注冊、維護及向省級/副省級文化機構注冊節(jié)點提交數(shù)據(jù)審核申請。其上級節(jié)點默認根據(jù)區(qū)域就近劃分。
3.2 系統(tǒng)業(yè)務流程
唯一標識符貫穿于數(shù)字資源采集與加工、服務與保存等環(huán)節(jié)。通過對資源進行唯一標識,串聯(lián)資源生命周期中關聯(lián)的應用系統(tǒng),可以將數(shù)字資源的生命周期管理進一步簡單化、標準化、規(guī)范化。通過中心節(jié)點、國家級、省級和市區(qū)縣等分級結構,實現(xiàn)唯一標識符數(shù)據(jù)的注冊、審核、解析和同步等操作。系統(tǒng)業(yè)務流程如圖2所示。
圖2 公共數(shù)字文化唯一標識符體系統(tǒng)業(yè)務流程
3.2.1 唯一標識符注冊/維護 唯一標識符注冊有單條注冊、批量注冊和接口注冊三種方式。注冊元數(shù)據(jù)信息數(shù)據(jù)項主要包括資源類型、資源格式、系統(tǒng)內部唯一編號、MARC 記錄唯一編號、題名、作者、ISBN (ISSN)標準號 、顆粒度信息、出版者、出版時間、描述信息、數(shù)據(jù)來源系統(tǒng)等。
根據(jù)唯一標識符命名規(guī)則,唯一標識符前綴由獲取的注冊機構代碼生成,同一注冊機構唯一標識符前綴固定。系統(tǒng)支持默認規(guī)則、隨機字符串、指定標準號等三種唯一標識符后綴生成規(guī)則。數(shù)據(jù)提交注冊后,系統(tǒng)對注冊數(shù)據(jù)進行格式校驗和數(shù)據(jù)查重。查重通過后,根據(jù)所選擇的后綴生成方式生成唯一標識符后綴。由前綴和后綴共同組成唯一標識符。
系統(tǒng)運行過程中,CDOI 數(shù)據(jù)對應的元數(shù)據(jù)項可能會發(fā)生變更,為了保證CDOI 的正確性和有效性,需要對唯一標識符元數(shù)據(jù)項進行維護,例如變更CDOI 對應的URL 地址等。唯一標識符維護方式包括手工維護(單條維護、批量維護)和接口維護。元數(shù)據(jù)維護查重規(guī)則與元數(shù)據(jù)注冊的查重規(guī)則保持一致。
3.2.2 唯一標識符審核 為保證唯一標識符的準確性,唯一標識符元數(shù)據(jù)注冊、維護后均需要通過審核操作才能提供解析服務。數(shù)據(jù)審核分為初驗和終驗兩個階段,注冊機構提交審核需求后,在省級/副省級文化機構注冊節(jié)點進行初驗;初驗審核通過的唯一標識符元數(shù)據(jù)被提交至國家級文化機構系統(tǒng)節(jié)點,在系統(tǒng)節(jié)點進行終驗。終驗審核通過后,唯一標識符方可提供解析服務。
3.2.3 唯一標識符同步 唯一標識符注冊數(shù)據(jù)和維護數(shù)據(jù)可以通過自動方式和手動方式同步到中心節(jié)點。系統(tǒng)節(jié)點定時向中心節(jié)點發(fā)起唯一標識符數(shù)據(jù)自動同步請求。為確保數(shù)據(jù)同步及時準確,也可以手動在中心節(jié)點或者系統(tǒng)節(jié)點發(fā)起數(shù)據(jù)同步請求,即時進行數(shù)據(jù)同步。
3.2.4 唯一標識符解析 唯一標識符生成后,通過解析服務來實現(xiàn)數(shù)字資源的定位,實現(xiàn)數(shù)字資源的統(tǒng)一調度[9]。唯一標識符解析包括正向解析和反向解析。
正向解析可根據(jù)CDOI 解析獲取其對應的URL 地址。系統(tǒng)根據(jù)唯一標識符的前綴信息識別其注冊服務節(jié)點,再向相對應的服務節(jié)點提交解析請求并獲取解析結果;若所請求的服務節(jié)點在規(guī)定時間內無響應,再向頂層服務節(jié)點發(fā)出解析請求并獲得解析結果。同一資源可能存在于不同的物理位置,產(chǎn)生多個不同的URL,正向解析結果可以為一條或者多條,當CDOI 對應多個URL地址時,用戶可以手工選擇所需要訪問的資源鏈接。
反向解析與正向解析對應,是根據(jù)注冊的數(shù)據(jù)信息,例如標題、出版社、作者、出版時間等,逆向查詢到對應的唯一標識符的過程。用戶根據(jù)輸入的元數(shù)據(jù)項為查詢條件獲取多條元數(shù)據(jù)記錄(支持查詢結果的二次檢索),用戶可以手工選擇一條查詢結果查看其URL 信息。
3.3 服務方式 唯一標識符體系以分級注冊和統(tǒng)一解析的模式對外提供服務。各系統(tǒng)節(jié)點不僅負責本系統(tǒng)有唯一標識符注冊需求的注冊節(jié)點申請和管理,還要負責本系統(tǒng)下唯一標識符的解析服務。系統(tǒng)可以向圖書館、文化館、出版單位、研究機構、博物館等有需要的各種文化單位提供公益性的唯一標識符注冊和解析服務。
3.3.1 注冊服務 除中心節(jié)點外,各國家級文化機構需要搭建系統(tǒng)環(huán)境,省級/副省級文化機構為三級服務節(jié)點,市/縣/區(qū)文化機構為四級服務節(jié)點。各省級/副省級文化機構可以根據(jù)本機構數(shù)字資源建設情況,申請注冊唯一標識符注冊機構,完成本地唯一標識符的注冊和管理;市/縣/區(qū)文化機構由省級/副省級文化機構分配帳號進行唯一標識符的注冊管理。各文化機構獲得命名授權后方可進行授權范圍內唯一標識符的注冊。
3.3.2 解析服務 唯一標識符解析包含正向和反向兩種解析模式,正向解析是通過唯一標識符獲取資源的URL 地址,該服務面向所有用戶開放;反向解析是通過查詢注冊數(shù)據(jù)的相應字段獲取資源的URL 地址,該服務僅面向注冊機構用戶開放。
通過唯一標識符的解析服務,可以實現(xiàn)資源的穩(wěn)定定位,一個數(shù)字化對象的標識符一經(jīng)產(chǎn)生就永久不變,不隨其所標識的數(shù)字化對象的存儲地址等屬性的變更而改變。即使資源的URL 地址發(fā)生變更,資源所有者只要在本系統(tǒng)進行URL更新,而資源的唯一標識符永久不變,保證數(shù)據(jù)在互聯(lián)網(wǎng)上的穩(wěn)定性。
唯一標識符系統(tǒng)不僅可以解析CDOI 唯一標識符,還在正向解析上兼容符合DOI 國際標準的唯一標識符,公眾可通過本系統(tǒng)解析任何DOI唯一標識符。同時,唯一標識符系統(tǒng)可以定位、解析來自于不同操作系統(tǒng)不同版本不同應用系統(tǒng)平臺注冊的唯一標識符。
為了對圖書館、文化中心、博物館、出版社、檔案館等不同文化機構與唯一標識符關聯(lián)的業(yè)務系統(tǒng)進行整合,唯一標識符系統(tǒng)提供必要的自動化系統(tǒng)接口,各文化機構可以調用唯一標識符注冊以及元數(shù)據(jù)查詢等功能接口,將唯一標識符解析服務嵌入用戶的編輯出版平臺、機構自動化系統(tǒng)或其它業(yè)務系統(tǒng)中。
4.1 實現(xiàn)公共文化行業(yè)數(shù)字資源統(tǒng)一調度
社會公眾對公共數(shù)字文化資源的需求往往不止于單個公共文化機構,而是多個文化機構或者文化行業(yè)[10]。在公共數(shù)字文化工程建設繁榮發(fā)展的同時,各機構應用系統(tǒng)陸續(xù)上線服務,然而各應用系統(tǒng)在數(shù)據(jù)組織和服務模式上缺乏深入的整合。因此實現(xiàn)各個公共文化行業(yè)數(shù)字資源的統(tǒng)一調度也非常有意義[10]。文化資源的統(tǒng)一調度必須基于統(tǒng)一的標準規(guī)范,對數(shù)字資源注冊唯一標識符并進行規(guī)范管理,可以給數(shù)字資源建立唯一和永久的編號,賦予資源生命周期,貫穿數(shù)字資源的采集、加工、組織管理、檢索以及服務。此外,唯一標識符可以解決URL 地址失效導致的“死鏈”問題[11],和URL 無法描述資源多副本變更、多版本等問題[12]??梢允箶?shù)字資源的標識獨立于應用系統(tǒng)和存取協(xié)議,實現(xiàn)資源的精確定位。鑒于唯一標識符的唯一性、永久性、穩(wěn)定性以及強大的解析功能,通過對文化行業(yè)唯一標識符的統(tǒng)一管理,可以大大提高公共文化行業(yè)數(shù)字資源管理和利用的效率,實現(xiàn)公共文化行業(yè)數(shù)字資源統(tǒng)一調度[13]。
4.2 促進傳統(tǒng)文化行業(yè)和數(shù)字文化行業(yè)融合
目前,文化行業(yè)依然處于業(yè)務發(fā)展的轉型期,傳統(tǒng)文化行業(yè)與數(shù)字文化行業(yè)需要共存互補、有機融合。然而傳統(tǒng)文化機構服務手段有限,服務方式單一,傳統(tǒng)文化服務與數(shù)字文化服務需要進行有效地整合,形成順暢的服務信息鏈。利用唯一標識符技術,可以將信息技術、數(shù)字技術、網(wǎng)絡技術廣泛應用于文化行業(yè),在傳統(tǒng)文化行業(yè)基礎上,實現(xiàn)信息化、數(shù)字化、網(wǎng)絡化,從數(shù)字文化服務體系建設和催生文化服務新業(yè)態(tài)的角度整合傳統(tǒng)服務與數(shù)字服務。通過唯一標識符技術,在OPAC 等傳統(tǒng)實體資源檢索系統(tǒng)檢索頁導入唯一標識符,用戶在檢索實體資源時,即可通過唯一標識符解析跳轉至該實體資源對應的電子資源鏈接,為用戶提供除實體資源外的另一種選擇,實現(xiàn)實體資源和電子資源的有效鏈接。用戶無需到現(xiàn)場,即可直接通過網(wǎng)絡查找訪問想要的數(shù)字展品或圖書資源,無論從時間上、經(jīng)濟上都可以給用戶帶來極大的便利。通過唯一標識符,可以有效地實現(xiàn)傳統(tǒng)文化行業(yè)和數(shù)字文化行業(yè)之間的融合,實現(xiàn)更為高效的檢索和館藏功能。
4.3 加強不同文化機構之間的互聯(lián)互通
在公共文化領域,通過對其他文化機構數(shù)字資源唯一標識符的解析調用,可以為用戶提供訪問更多本機構未能收藏藏品的機會。
通過對數(shù)字資源進行唯一標識和規(guī)范管理,可以解決不同文化機構之間資源建設存在的異構數(shù)據(jù)存儲、異域數(shù)據(jù)存儲、數(shù)據(jù)結構轉換等技術問題[14],可以實現(xiàn)不同類型、不同語種數(shù)字資源之間的無縫鏈接,有效解決信息資源的共建和共享。通過基于唯一標識符技術進行機構間資源調度,可以提高各文化行業(yè)數(shù)字資源建設的透明度,可以基于統(tǒng)一的接口規(guī)范,促進不同文化機構間應用系統(tǒng)的互操作,減少文化機構間資源重復建設,為不同文化機構之間資源的獲取及應用系統(tǒng)之間的互操作提供極大便利。
公共數(shù)字文化工程唯一標識符體系將基于各個文化機構的唯一標識符數(shù)據(jù),賦予每個資源全球唯一的標識符,建立一套跨地區(qū)、跨應用系統(tǒng)平臺的資源鏈接數(shù)據(jù)庫,實現(xiàn)公共文化機構資源鏈接數(shù)據(jù)的共享,可以面向各文化機構提供免費的數(shù)字資源唯一標識符的注冊、解析以及元數(shù)據(jù)的查詢服務,各文化機構可以有效地實現(xiàn)鏈接的本地化,可以把唯一標識符作為本地化鏈接方案的關鍵技術,通過提供指向全文信息的永久性鏈接來增加已獲得資源的可用性。同時只要加入公共數(shù)字文化唯一標識符體系,便可隨時了解全國各級公共文化機構數(shù)字資源的建設與服務情況,通過對各機構電子資源進行集成和整合,可以實現(xiàn)全國文化機構電子資源的無縫集成。公共數(shù)字文化唯一標識符體系可以拓展到整個文化行業(yè),如博物館、檔案館、美術館等,共同建設文化數(shù)字資源服務體系,形成我國文化行業(yè)統(tǒng)一的資源標識與服務中心,有利于文化行業(yè)間更方便地實現(xiàn)數(shù)字資源的聯(lián)合與共享,也有利于文化行業(yè)的數(shù)字資源與其他地區(qū)、其他行業(yè)數(shù)字資源的鏈接與共享,對促進全國公共數(shù)字文化大融合起到有利作用。