丁遒勁
(中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)
聯(lián)合目錄能夠一站式揭示、報(bào)道多個(gè)文獻(xiàn)收藏機(jī)構(gòu)所藏文獻(xiàn)情況,通常由若干文獻(xiàn)收藏機(jī)構(gòu)共同遵循統(tǒng)一著錄原則和標(biāo)準(zhǔn)合作編制而成[1]。在以印本文獻(xiàn)為主體的資源建設(shè)時(shí)期,聯(lián)合目錄在指明文獻(xiàn)館藏處所,支持文獻(xiàn)傳遞、館際互借等文獻(xiàn)資源共享活動(dòng)中發(fā)揮了重要作用[2]。但是,隨著越來(lái)越多文獻(xiàn)資源以數(shù)字化方式呈現(xiàn),聯(lián)合目錄單純以印本文獻(xiàn)為主要揭示對(duì)象的建設(shè)局限性日益顯現(xiàn),建設(shè)動(dòng)力存在明顯不足。與聯(lián)合目錄發(fā)展相對(duì)緩慢形成鮮明對(duì)比,自2009 年Serials Solution 公司發(fā)布全球第一個(gè)大型資源發(fā)現(xiàn)系統(tǒng)Summon 起,引進(jìn)資源發(fā)現(xiàn)系統(tǒng)成為各大圖書(shū)館整合與揭示館藏資源的重要手段,主要用于在論文層級(jí)向用戶(hù)提供資源獲取線索[3]。通過(guò)將資源發(fā)現(xiàn)系統(tǒng)中的統(tǒng)一元數(shù)據(jù)倉(cāng)儲(chǔ)與本地館藏相結(jié)合,國(guó)內(nèi)主要高校圖書(shū)館形成了各自專(zhuān)有資源發(fā)現(xiàn)系統(tǒng),例如清華大學(xué)“水木搜索”[4]、北京大學(xué)“未名學(xué)術(shù)搜索”[5]等。
無(wú)論是聯(lián)合目錄還是資源發(fā)現(xiàn)系統(tǒng),其功能實(shí)質(zhì)都在于協(xié)助用戶(hù)發(fā)現(xiàn)和獲取其所需資源?,F(xiàn)有資源發(fā)現(xiàn)系統(tǒng)雖然已經(jīng)擁有數(shù)據(jù)量龐大的統(tǒng)一元數(shù)據(jù)倉(cāng)儲(chǔ),但是各圖書(shū)館在實(shí)際應(yīng)用中仍多是以本館館藏以及開(kāi)放獲取資源作為主要全文來(lái)源,館際資源界限仍然存在,用戶(hù)對(duì)本館以外的館藏檢索與獲取能力仍相對(duì)較弱。聯(lián)合目錄作為多家館藏信息的集合,恰好能夠彌補(bǔ)資源發(fā)現(xiàn)系統(tǒng)的這一不足。也正因如此,聯(lián)合目錄的建設(shè)不能局限于印本文獻(xiàn)館藏的書(shū)目數(shù)據(jù),需要結(jié)合數(shù)字信息環(huán)境中用戶(hù)的資源發(fā)現(xiàn)需求,通過(guò)有效的調(diào)度計(jì)算在更大范圍內(nèi)實(shí)現(xiàn)文獻(xiàn)資源服務(wù)的精準(zhǔn)配置[6]。
中國(guó)真正現(xiàn)代意義上的聯(lián)合目錄是1929 年出版的《北平各圖書(shū)館所藏中文期刊聯(lián)合目錄》[7]。20 世紀(jì)50年代以后,伴隨著1956 年圖書(shū)館為科學(xué)服務(wù)方針的制定,中國(guó)的聯(lián)合目錄的編制與研究出現(xiàn)了一個(gè)高潮[8]。此后,在計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和Z39.50 技術(shù)的支撐下,聯(lián)合目錄的編制伴隨編目技術(shù)的進(jìn)步也得到快速發(fā)展,各系統(tǒng)、行業(yè)相繼形成各類(lèi)聯(lián)合目錄。但是在當(dāng)前數(shù)字出版環(huán)境和用戶(hù)需求的雙重變革下,現(xiàn)有聯(lián)合目錄的建設(shè)亟待轉(zhuǎn)型。
受機(jī)構(gòu)性質(zhì)以及版權(quán)等因素限制,中國(guó)當(dāng)前的文獻(xiàn)資源建設(shè)一方面采購(gòu)經(jīng)費(fèi)日益縮減,另一方面存在資源重復(fù)建設(shè)與使用不充分的情況,各級(jí)、各類(lèi)圖書(shū)館都需要依托聯(lián)合目錄全面了解國(guó)內(nèi)文獻(xiàn)資源建設(shè)情況。但是,國(guó)內(nèi)目前具有代表性的聯(lián)合目錄,例如CALIS 管理中心的“CALIS 聯(lián)合目錄公共檢索系統(tǒng)”、中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心的“全國(guó)期刊聯(lián)合目錄”以及華東地區(qū)六省一市科技情報(bào)(信息)所的“華東地區(qū)外國(guó)和港臺(tái)科技期刊預(yù)訂聯(lián)合目錄”等,一般多是側(cè)重于不同系統(tǒng)或地區(qū)對(duì)圖書(shū)館館藏(訂購(gòu))信息進(jìn)行了整合與揭示,造成各聯(lián)合目錄收錄文獻(xiàn)資源在館藏單位、館藏資源品種等不同維度存在交叉重復(fù),而又未能有單一聯(lián)合目錄能夠覆蓋國(guó)內(nèi)所有館藏文獻(xiàn)。此外,現(xiàn)有聯(lián)合目錄以整合印本資源館藏信息為主,對(duì)包括開(kāi)放獲取資源、數(shù)據(jù)庫(kù)在內(nèi)的電子資源館藏信息揭示較少,亟待通過(guò)優(yōu)化聯(lián)合目錄建設(shè)完整揭示國(guó)內(nèi)文獻(xiàn)資源館藏格局。
無(wú)論是聯(lián)合目錄,還是資源發(fā)現(xiàn)系統(tǒng),基于資源、用戶(hù)、使用情境等特征進(jìn)行資源調(diào)度計(jì)算都是其核心功能所在,因此兩者的建設(shè)并不能完全獨(dú)立開(kāi)來(lái)。國(guó)內(nèi)現(xiàn)有聯(lián)合目錄涵蓋數(shù)據(jù)分為兩類(lèi),一類(lèi)是館藏信息,一類(lèi)是訂購(gòu)信息。單純的訂購(gòu)品種信息難以支撐后端文獻(xiàn)獲取,而按年度更新館藏?cái)?shù)據(jù)對(duì)終端用戶(hù)的檢索效用較小。在資源發(fā)現(xiàn)服務(wù)構(gòu)建方面,國(guó)內(nèi)圖書(shū)館多是在商業(yè)系統(tǒng)中添加本地館藏,館際之間的館藏壁壘依舊存在。但是,有效的資源發(fā)現(xiàn)服務(wù)既需要海量論文元數(shù)據(jù)細(xì)化資源揭示粒度,也需要融合多館藏信息,在資源發(fā)現(xiàn)服務(wù)中增加多館藏信息指引,只有這樣才能實(shí)現(xiàn)全國(guó)文獻(xiàn)資源與服務(wù)的精準(zhǔn)配置,協(xié)調(diào)全國(guó)文獻(xiàn)機(jī)構(gòu)有層次地開(kāi)展文獻(xiàn)服務(wù)、數(shù)據(jù)服務(wù)乃至定制化情報(bào)分析服務(wù),吸引全國(guó)文獻(xiàn)機(jī)構(gòu)參與文獻(xiàn)資源發(fā)現(xiàn)服務(wù)體系建設(shè),從根本上提升中國(guó)文獻(xiàn)資源的保障能力和服務(wù)水平。
在目前以在IP 范圍內(nèi)開(kāi)通數(shù)據(jù)庫(kù)為主的商業(yè)模式中,圖書(shū)館能夠獲取的用戶(hù)數(shù)據(jù)十分有限。在電子資源使用統(tǒng)計(jì)數(shù)據(jù)采集方法上,目前主要包括本地網(wǎng)絡(luò)日志分析和服務(wù)器端數(shù)據(jù)商獲取,存在日志文件數(shù)據(jù)過(guò)于簡(jiǎn)單,無(wú)法真實(shí)還原讀者信息行為,統(tǒng)計(jì)數(shù)據(jù)完整性等問(wèn)題[9]。商業(yè)出版社提供的標(biāo)準(zhǔn)化使用統(tǒng)計(jì),主要按月度或年份提供用戶(hù)檢索和下載次數(shù),但是一般不提供包括高頻檢索詞、單一用戶(hù)信息等在內(nèi)的更為具體的使用數(shù)據(jù)。因此,中國(guó)自主構(gòu)建的聯(lián)合目錄需要強(qiáng)化豐富用戶(hù)數(shù)據(jù)維度,既包括用戶(hù)學(xué)歷、所屬機(jī)構(gòu)、學(xué)科專(zhuān)業(yè)等靜態(tài)數(shù)據(jù),又包括地理位置、檢索瀏覽日志等動(dòng)態(tài)數(shù)據(jù),通過(guò)收集和分析系統(tǒng)用戶(hù)的個(gè)人基本統(tǒng)計(jì)信息、實(shí)時(shí)動(dòng)態(tài)行為、采集用戶(hù)的興趣偏好等數(shù)據(jù),基于自然語(yǔ)言處理、數(shù)據(jù)挖掘等能夠提煉并描繪出特定的用戶(hù)畫(huà)像類(lèi)型,從而形成基于用戶(hù)畫(huà)像的精準(zhǔn)知識(shí)服務(wù)模式和策略[10],進(jìn)一步深化館藏資源利用。
為了突破聯(lián)合目錄的建設(shè)瓶頸,以O(shè)CLC 為代表的國(guó)外部分聯(lián)合目錄的建設(shè)模式已發(fā)生較大變化,早已不再局限于印本文獻(xiàn)的書(shū)目數(shù)據(jù),它們正在通過(guò)更為廣泛的數(shù)據(jù)獲取以及多來(lái)源元數(shù)據(jù)融合優(yōu)化其資源發(fā)現(xiàn)服務(wù),以適應(yīng)大數(shù)據(jù)環(huán)境下用戶(hù)對(duì)文獻(xiàn)資源的精準(zhǔn)定位和獲取需求。
面對(duì)電子資源的大量增加以及用戶(hù)需求的個(gè)性化特征日益凸顯,以紙質(zhì)資料為中心的傳統(tǒng)OPAC 難以適應(yīng)數(shù)字信息環(huán)境中的各項(xiàng)服務(wù)要求。為此,日本國(guó)立國(guó)會(huì)圖書(shū)館于2004 年發(fā)布《數(shù)字圖書(shū)館中期計(jì)劃(2004 年版)》,將國(guó)立國(guó)會(huì)圖書(shū)館數(shù)字存儲(chǔ)門(mén)戶(hù)網(wǎng)(PORTA)建設(shè)列為圖書(shū)館三大支柱功能之一[11],并在2012 年1 月開(kāi)始使用新的檢索服務(wù)系統(tǒng)NDL(National Diet Library)Search。在《關(guān)于國(guó)立國(guó)會(huì)圖書(shū)館的搜索合作拓展的實(shí)施計(jì)劃(2019 年修訂版)》(《國(guó)立國(guó)會(huì)図書(shū)館サ+チ連攜拡張に係る実施銒畫(huà)(2019 年修訂版)》)中,日本國(guó)立國(guó)會(huì)圖書(shū)館將NDL Search 定位為元數(shù)據(jù)的聚集者和提供者,需要在用戶(hù)中扮演“知識(shí)接入點(diǎn)”的角色。NDL Search 除了能夠檢索本館館藏資源外,還囊括了日本國(guó)內(nèi)其他學(xué)術(shù)信息機(jī)構(gòu)、公共圖書(shū)館、大學(xué)圖書(shū)館、專(zhuān)業(yè)圖書(shū)館的館藏信息,具體合作對(duì)象包括館藏目錄、數(shù)字檔案、機(jī)構(gòu)庫(kù)資源、開(kāi)放獲取期刊等。由此可見(jiàn),圖日本國(guó)立國(guó)會(huì)圖書(shū)館對(duì)元數(shù)據(jù)的開(kāi)發(fā)利用不再局限于自主編目的書(shū)目數(shù)據(jù),而是通過(guò)對(duì)內(nèi)外部元數(shù)據(jù)的廣泛關(guān)聯(lián)集成,充分發(fā)揮元數(shù)據(jù)的規(guī)模效應(yīng)。
面對(duì)電子資源規(guī)模不斷擴(kuò)大帶來(lái)的各項(xiàng)挑戰(zhàn),特別是圖書(shū)館的工作重點(diǎn)從“擁有”轉(zhuǎn)變?yōu)椤矮@取”,WorldCat 的發(fā)展不再局限于印本文獻(xiàn)的書(shū)目數(shù)據(jù),而是利用其作為全球眾多圖書(shū)館的代表身份,通過(guò)與內(nèi)容提供商合作直接獲取電子資源的論文元數(shù)據(jù),不斷充實(shí)WorldCat 知識(shí)庫(kù)(WorldCat Knowledge Base)。截至2021 年2 月,知識(shí)庫(kù)中涵蓋5 233 萬(wàn)條記錄和1.79 萬(wàn)份內(nèi)容館藏,這些資料來(lái)自包括Wiley、Elsevier等在內(nèi)的731 內(nèi)容提供商[12]。以WorldCat 和WorldCat知識(shí)庫(kù)為統(tǒng)一元數(shù)據(jù)倉(cāng)儲(chǔ),OCLC 構(gòu)建了發(fā)現(xiàn)服務(wù),可為用戶(hù)提供對(duì)超過(guò)9.77 億篇電子版論文的集成訪問(wèn)。與OCLC 類(lèi)似,俄亥俄圖書(shū)館與信息網(wǎng)絡(luò)(The Ohio Library and Information Network,簡(jiǎn)稱(chēng)OhioLink)的中央書(shū)目庫(kù)同時(shí)涵蓋了印本和電子資源館藏?cái)?shù)據(jù),因此除了文獻(xiàn)傳遞服務(wù)外,在相應(yīng)的電子資源開(kāi)通范圍內(nèi),用戶(hù)還可通過(guò)系統(tǒng)提供的電子期刊訪問(wèn)鏈接獲取所需文獻(xiàn)[13]。因此,面對(duì)當(dāng)前文快速變化的獻(xiàn)資源生產(chǎn)和傳播模式,任何文獻(xiàn)收藏機(jī)構(gòu)都難以對(duì)文獻(xiàn)資源進(jìn)行完整保障。特別是在數(shù)字出版與數(shù)字圖書(shū)館融合趨勢(shì)下,聯(lián)合目錄需要包括圖書(shū)館以及出版社、數(shù)據(jù)庫(kù)商等在內(nèi)的各類(lèi)型文獻(xiàn)信息服務(wù)機(jī)構(gòu)的共同參與建設(shè)。
傳統(tǒng)聯(lián)合目錄雖然也面向終端用戶(hù)提供館藏查詢(xún)服務(wù),但是其更側(cè)重于對(duì)圖書(shū)館業(yè)務(wù)的支撐,如編目、館際互借以及文獻(xiàn)傳遞。在當(dāng)前“以用戶(hù)為中心”的服務(wù)理念,聯(lián)合目錄需要以多個(gè)觸角接近終端用戶(hù),數(shù)據(jù)的開(kāi)放共享則是實(shí)現(xiàn)的前提。為此,OCLC 通過(guò)Google 等學(xué)術(shù)搜索引擎盡可能豐富終端用戶(hù)的資源發(fā)現(xiàn)服務(wù)入口,進(jìn)一步提升元數(shù)據(jù)的能見(jiàn)度[14]。NDL Search 通過(guò)API 廣泛分發(fā)內(nèi)容來(lái)提高內(nèi)容的可見(jiàn)性并促進(jìn)其使用[15],實(shí)現(xiàn)國(guó)立國(guó)會(huì)圖書(shū)館和外部機(jī)構(gòu)的數(shù)據(jù)糅合,為用戶(hù)提供新的具有附加價(jià)值的信息服務(wù)[16]。由此可見(jiàn),資源發(fā)現(xiàn)服務(wù)的內(nèi)涵不止于用戶(hù)檢索詞與內(nèi)部數(shù)據(jù)倉(cāng)儲(chǔ)的檢索匹配,它需要通過(guò)與搜索引擎合作、開(kāi)放API 接口等方式促進(jìn)數(shù)據(jù)的進(jìn)一步傳播利用,只有促進(jìn)數(shù)據(jù)利用的多樣性。
綜觀OCLC、日本國(guó)立國(guó)會(huì)圖書(shū)館等機(jī)構(gòu)近年來(lái)在書(shū)目以及館藏?cái)?shù)據(jù)集成與服務(wù)方面的實(shí)踐與規(guī)劃,上述機(jī)構(gòu)都清晰地認(rèn)識(shí)到數(shù)字信息環(huán)境正在深刻影響著圖書(shū)館的資源遴選、采集、描述、檢索發(fā)現(xiàn)等各個(gè)環(huán)節(jié)產(chǎn)生影響,并且正在積極適應(yīng)各項(xiàng)變化,為中國(guó)創(chuàng)新構(gòu)建聯(lián)合目錄體系提供了參考。
在國(guó)家大型文獻(xiàn)保障機(jī)構(gòu)既有元數(shù)據(jù)資源基礎(chǔ)上,結(jié)合國(guó)內(nèi)已有的聯(lián)合目錄工作基礎(chǔ)和數(shù)據(jù)優(yōu)勢(shì),對(duì)國(guó)內(nèi)主要文獻(xiàn)收藏機(jī)構(gòu)的書(shū)目和館藏信息進(jìn)行集成揭示,形成“面向發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”,一方面有利于在拓展館藏發(fā)現(xiàn)范圍的基礎(chǔ)上豐富用戶(hù)全文獲取路徑,優(yōu)化國(guó)家文獻(xiàn)保障服務(wù)體系,另一方面也能夠通過(guò)全國(guó)性的聯(lián)合目錄建設(shè)工作加強(qiáng)國(guó)內(nèi)主要文獻(xiàn)收藏機(jī)構(gòu)在資源建設(shè)方面的交流與互動(dòng),促進(jìn)文獻(xiàn)資源共享,盡可能減少文獻(xiàn)資源的重復(fù)和低效建設(shè)情況??傮w構(gòu)建框架如圖1 所示。
圖1 面向資源發(fā)現(xiàn)的聯(lián)合目錄體系構(gòu)建框架Fig.1 The framework of the union catalog system for resource discovery
結(jié)合中國(guó)聯(lián)合目錄建設(shè)現(xiàn)狀,以及國(guó)外典型聯(lián)合目錄發(fā)展特征,“面向資源發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”主要從構(gòu)建主體、數(shù)據(jù)采集與處理以及開(kāi)放利用方面,與傳統(tǒng)聯(lián)合目錄相比發(fā)生較大變化。
4.1.1 多類(lèi)型機(jī)構(gòu)共同參與構(gòu)建
傳統(tǒng)聯(lián)合目錄建設(shè)方式下,一方面是單一圖書(shū)館可能同時(shí)參與多個(gè)聯(lián)合目錄建設(shè)造成重復(fù)勞動(dòng),另一方面仍以圖書(shū)館為建設(shè)主體,缺乏出版社、圖書(shū)進(jìn)出口代理公司等其他環(huán)節(jié)主體的參與,在當(dāng)前數(shù)字出版與信息服務(wù)融合發(fā)展的大背景下,出版社與圖書(shū)館已不再是單純的甲乙方關(guān)系,競(jìng)爭(zhēng)與合作關(guān)系并存[17]。因此,圖書(shū)館必須以開(kāi)放的態(tài)度吸引各類(lèi)型信息服務(wù)機(jī)構(gòu)參與聯(lián)合目錄建設(shè)。即使在圖書(shū)館界內(nèi)部,也存在著一定的系統(tǒng)或地區(qū)的條塊分割,新型聯(lián)合目錄體系則是需要著眼于全國(guó)各類(lèi)型圖書(shū)館的館藏信息集成。
4.1.2 印本資源與電子資源融合建設(shè)
國(guó)內(nèi)圖書(shū)館對(duì)外文印本資源訂購(gòu)普遍呈下降趨勢(shì)。根據(jù)《2019 年高校圖書(shū)館發(fā)展報(bào)告》[18]統(tǒng)計(jì)數(shù)據(jù)顯示,高校圖書(shū)館館均紙質(zhì)文獻(xiàn)資源購(gòu)置費(fèi)自2016 年起呈逐年下降趨勢(shì),反之,館均電子資源購(gòu)置費(fèi)上漲趨勢(shì)明顯。因此,單純印本館藏信息整合使聯(lián)合目錄建設(shè)動(dòng)力不足,逐漸走向“無(wú)水之源,無(wú)木之本”。因此需要重視印本資源與電子資源的融合揭示,一方面在經(jīng)費(fèi)允許的情況下保持印本資源的訂購(gòu),另一方面著力加大電子資源引進(jìn)力度。所謂電子資源引進(jìn),不再是單純以IP 方式開(kāi)通使用,而要同時(shí)強(qiáng)化論文元數(shù)據(jù)乃至全文在本地的保存與使用權(quán)益,從而實(shí)現(xiàn)印本資源和電子資源的真正融合。
4.1.3 強(qiáng)化數(shù)據(jù)、系統(tǒng)和服務(wù)開(kāi)放性
數(shù)據(jù)之間的有效關(guān)聯(lián)是拓展和深化館藏利用的重要途徑之一。僅僅在書(shū)目層級(jí)的文獻(xiàn)資源集成揭示往往滿足的是圖書(shū)館的業(yè)務(wù)需求而非終端使用需求?!懊嫦蛸Y源發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”將在書(shū)目數(shù)據(jù)和論文元數(shù)據(jù)之間形成有效關(guān)聯(lián),這既是書(shū)目數(shù)據(jù)向文章乃至知識(shí)單元層級(jí)的有效延伸,也是在書(shū)目層級(jí)對(duì)海量元數(shù)據(jù)進(jìn)行結(jié)構(gòu)化管理,基于資源調(diào)度系統(tǒng)協(xié)助用戶(hù)在資源發(fā)現(xiàn)過(guò)程中反向獲取印本資源館藏信息和電子資源開(kāi)通信息。此外,對(duì)系統(tǒng)本身而言,數(shù)據(jù)接口也是“面向資源發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”與外部其他系統(tǒng)形成有效關(guān)聯(lián)和深化利用的有效途徑,能夠支持機(jī)構(gòu)在學(xué)科、主題等方面構(gòu)建專(zhuān)有服務(wù)系統(tǒng)。
“面向資源發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”自下而上包括協(xié)調(diào)運(yùn)行層、系統(tǒng)工具層、數(shù)據(jù)匯交層、數(shù)據(jù)管理層和數(shù)據(jù)服務(wù)層。
4.2.1 協(xié)調(diào)運(yùn)行層
目前,國(guó)內(nèi)已有大型文獻(xiàn)保障機(jī)構(gòu)開(kāi)始注重元數(shù)據(jù)資源建設(shè)工作,例如,國(guó)家科技圖書(shū)文獻(xiàn)中心(簡(jiǎn)稱(chēng)“NSTL”)已與科睿唯安、Elsevier、Springer、ProQuest 等20 余家出版社/集成商達(dá)成元數(shù)據(jù)合作[19]。依托類(lèi)似NSTL 這類(lèi)機(jī)構(gòu)既有書(shū)目數(shù)據(jù)、館藏?cái)?shù)據(jù)以及論文元數(shù)據(jù)資源,利用其統(tǒng)籌優(yōu)勢(shì)和工作體系,協(xié)調(diào)專(zhuān)業(yè)圖書(shū)館系統(tǒng)、高校圖書(shū)館系統(tǒng)和公共圖書(shū)館系統(tǒng)主要機(jī)構(gòu)參與書(shū)目和館藏?cái)?shù)據(jù)共享,從而對(duì)國(guó)內(nèi)主要文獻(xiàn)收藏機(jī)構(gòu)的書(shū)目數(shù)據(jù)和館藏信息進(jìn)行集成揭示。數(shù)據(jù)共享是多機(jī)構(gòu)持續(xù)參與建設(shè)的根本保障。面向發(fā)現(xiàn)服務(wù)的聯(lián)合目錄建設(shè)強(qiáng)調(diào)基礎(chǔ)數(shù)據(jù)的雙向流動(dòng)與互利共享,最大化提升數(shù)據(jù)使用效率,保障系統(tǒng)建設(shè)的穩(wěn)定性和持續(xù)性。參建機(jī)構(gòu)能夠持續(xù)地共享數(shù)據(jù),用于豐富自身數(shù)據(jù)體系,并根據(jù)本地特定的用戶(hù)需求將數(shù)據(jù)用于系統(tǒng)開(kāi)發(fā)、定制化分析服務(wù)等。在版權(quán)管理方面,參考OCLC 針對(duì)WorldCat 數(shù)據(jù)的做法[20],無(wú)論是通過(guò)牽頭機(jī)構(gòu)還是成員機(jī)構(gòu)直接上傳的書(shū)目數(shù)據(jù)和館藏?cái)?shù)據(jù),都需要保證數(shù)據(jù)不存在版權(quán)糾紛;牽頭組織和管理機(jī)構(gòu)將代表所有數(shù)據(jù)上傳機(jī)構(gòu)對(duì)集成數(shù)據(jù)的匯編權(quán),牽頭機(jī)構(gòu)對(duì)集成數(shù)據(jù)均具有永久使用權(quán),但是單條數(shù)據(jù)的版權(quán)始終歸各上傳機(jī)構(gòu)所有。
4.2.2 系統(tǒng)工具層
目前,各個(gè)現(xiàn)有聯(lián)合目錄在數(shù)據(jù)遵循標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量方面存在較大差異,多個(gè)聯(lián)合目錄數(shù)據(jù)的集成需要依據(jù)統(tǒng)一的標(biāo)準(zhǔn)規(guī)范進(jìn)行集成。聯(lián)合目錄系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)及其映射規(guī)范、書(shū)目與館藏?cái)?shù)據(jù)質(zhì)量控制規(guī)范是影響聯(lián)合目錄數(shù)據(jù)集成效果的主要標(biāo)準(zhǔn)規(guī)范。因此,在分析各個(gè)聯(lián)合目錄數(shù)據(jù)格式和數(shù)據(jù)質(zhì)量的基礎(chǔ)上,參建機(jī)構(gòu)將聯(lián)合制訂統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),并建立各個(gè)聯(lián)合目錄數(shù)據(jù)規(guī)范與統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)之間的映射轉(zhuǎn)換規(guī)則。在統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)制定方面,NSTL 在2017 年便基于多家國(guó)際知名出版商和信息服務(wù)機(jī)構(gòu)采用的文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn),形成《NSTL 統(tǒng)一文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)》[21],可作為中心元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)各來(lái)源數(shù)據(jù)進(jìn)行映射轉(zhuǎn)化。同時(shí),為了保證數(shù)據(jù)字段完整性、準(zhǔn)確性等,需要制訂書(shū)目與館藏?cái)?shù)據(jù)質(zhì)量控制規(guī)范,對(duì)各來(lái)源數(shù)據(jù)進(jìn)行二次補(bǔ)充和完善,提升數(shù)據(jù)質(zhì)量。
4.2.3 數(shù)據(jù)匯交層
“面向發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”數(shù)據(jù)匯交采取多級(jí)匯交管理方式。例如,CALIS 管理中心負(fù)責(zé)高校圖書(shū)館系統(tǒng),NSTL 負(fù)責(zé)其九家成員單位、地方情報(bào)所和專(zhuān)業(yè)圖書(shū)館,以及國(guó)家圖書(shū)館負(fù)責(zé)各省市公共圖書(shū)館的數(shù)據(jù)集中收集,它們分別將各自系統(tǒng)參建機(jī)構(gòu)提交的數(shù)據(jù)進(jìn)行匯總,并統(tǒng)一上傳至系統(tǒng)。在各自圖書(shū)館系統(tǒng)內(nèi)部,也可根據(jù)既有管理體系對(duì)數(shù)據(jù)管理組織進(jìn)行進(jìn)一步細(xì)分,例如在CALIS 內(nèi)部,按照學(xué)科中心或地區(qū)中心進(jìn)行管理。各參建機(jī)構(gòu)提交數(shù)據(jù)分為回溯數(shù)據(jù)和更新數(shù)據(jù),回溯數(shù)據(jù)為一次性提交,更新書(shū)目數(shù)據(jù)和館藏?cái)?shù)據(jù)需要至少按周或月進(jìn)行更新,對(duì)于長(zhǎng)時(shí)間未更新數(shù)據(jù)單位,將由上一級(jí)數(shù)據(jù)提交單位負(fù)責(zé)跟蹤催缺,以保障聯(lián)合目錄數(shù)據(jù)的及時(shí)性、完整性和連續(xù)性。
4.2.4 數(shù)據(jù)管理層
相比于通過(guò)編目產(chǎn)生的書(shū)目數(shù)據(jù),數(shù)字環(huán)境中的數(shù)據(jù)種類(lèi)、層級(jí)、來(lái)源、渠道、形態(tài)和格式則更為多樣,存在數(shù)據(jù)孤島、數(shù)據(jù)蜘蛛網(wǎng)等問(wèn)題,需要通過(guò)集成整合在數(shù)據(jù)源邏輯層上建立統(tǒng)一的訪問(wèn)結(jié)構(gòu),屏蔽底層數(shù)據(jù)源的差異,實(shí)現(xiàn)統(tǒng)一的查詢(xún)界面靈活地訪問(wèn)網(wǎng)絡(luò)上的異構(gòu)數(shù)據(jù)源[22]。因此,對(duì)各參建機(jī)構(gòu)提交的數(shù)據(jù),最終將由牽頭組織和管理機(jī)構(gòu)基于統(tǒng)一業(yè)務(wù)平臺(tái)進(jìn)行規(guī)范集成。通過(guò)本地?cái)?shù)據(jù)收割以及FTP 等遠(yuǎn)程數(shù)據(jù)收割方式,系統(tǒng)將對(duì)從不同來(lái)源獲取的數(shù)據(jù)進(jìn)行初步格式校驗(yàn),并基于統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)將數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式。不同來(lái)源數(shù)據(jù)可能涉及相同館藏機(jī)構(gòu)或同一資源實(shí)體,需要依靠品種名稱(chēng)、資源唯一標(biāo)識(shí)符等進(jìn)行查重和歸并,最終形成統(tǒng)一的書(shū)目數(shù)據(jù)和館藏?cái)?shù)據(jù)倉(cāng)儲(chǔ)[23],并以聯(lián)合目錄形式對(duì)外提供服務(wù)。
4.2.5 數(shù)據(jù)服務(wù)層
基于“面向發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”的功能定位,系統(tǒng)服務(wù)主要在于支持參建機(jī)構(gòu)實(shí)現(xiàn)數(shù)據(jù)的穩(wěn)定傳輸、查詢(xún)和下載,并能夠按照館藏單位、文獻(xiàn)資源品種等不同維度對(duì)系統(tǒng)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,以支持本館資源建設(shè)決策。與此同時(shí),系統(tǒng)同時(shí)對(duì)外提供數(shù)據(jù)服務(wù)方面,外部機(jī)構(gòu)的目錄系統(tǒng)和數(shù)據(jù)存儲(chǔ)系統(tǒng)可以通過(guò)Restful 接口及OAI 接口等與系統(tǒng)互聯(lián),形成穩(wěn)定的在線接口數(shù)據(jù)傳輸,能夠利用系統(tǒng)數(shù)據(jù)支持本地系統(tǒng)建設(shè)和服務(wù)。通過(guò)靈活使用統(tǒng)計(jì)數(shù)據(jù)查詢(xún)、書(shū)目數(shù)據(jù)獲取等接口,“面向發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”和外部機(jī)構(gòu)能實(shí)現(xiàn)數(shù)據(jù)糅合,從而為使用者提供具有更高附加價(jià)值的信息服務(wù)。
圖2 數(shù)據(jù)匯交管理流程Fig.2 The process of metadata collection
在印本資源為主體的資源建設(shè)時(shí)期,聯(lián)合目錄在文獻(xiàn)資源共享中發(fā)揮了不可替代的作用。但是,隨著數(shù)字出版潮流以及用戶(hù)需求的不斷變化,傳統(tǒng)聯(lián)合目錄建設(shè)的弊端逐漸顯現(xiàn),需要面向發(fā)現(xiàn)服務(wù)構(gòu)建新型聯(lián)合目錄體系。與以往相比,新型聯(lián)合目錄特征突出表現(xiàn)在3 個(gè)方面,參建主體多樣化、建設(shè)對(duì)象同時(shí)涵蓋印本資源和電子資源,數(shù)據(jù)、系統(tǒng)和服務(wù)的開(kāi)放性得到強(qiáng)化,能夠進(jìn)一步提升聯(lián)合目錄的服務(wù)效益。“面向發(fā)現(xiàn)服務(wù)的聯(lián)合目錄”有效適應(yīng)了數(shù)字出版時(shí)代的發(fā)展要求,能夠在一定程度上打破資源發(fā)現(xiàn)服務(wù)中的館藏壁壘,進(jìn)一步推動(dòng)文獻(xiàn)資源的共享利用。
農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊2021年8期