周俊燁
(武漢大學(xué)信息管理學(xué)院 武漢 430072)
為了更好地滿足人們的精神文化追求,圖書館、檔案館、博物館(Libraries Archives and Museums,簡(jiǎn)稱LAM)的數(shù)字資源整合工作迫在眉睫。在LAM的數(shù)字資源整合領(lǐng)域,英國、美國、德國和加拿大等國都采取了一些措施[1]:加拿大將國家圖書館和國家檔案館合二為一,建立了新的國家圖書檔案館(Library and Archives Canada,LAC),美國建立了世界數(shù)字圖書館(World Digital Library,WDL),英國組建了博物館、圖書館和檔案館理事會(huì)(Museums, Libraries and Archives Council,MLA)。 這 些LAM資源整合案例全部是為了滿足公眾共享社會(huì)文化資源的需求,改善圖書館、檔案館和博物館公共文化服務(wù)的現(xiàn)狀,結(jié)合互聯(lián)網(wǎng)手段與電子通信技術(shù),構(gòu)建的面向公眾的現(xiàn)代化服務(wù)平臺(tái)。我國在改善LAM數(shù)字資源整合現(xiàn)狀、提升公共文化服務(wù)水平方面也緊跟國際步伐,開展了部分實(shí)踐,如2002年推出的“全國文化信息資源共享工程”[2]。但這些實(shí)踐多局限于系統(tǒng)內(nèi)部的數(shù)字資源共享,缺乏建立一體化服務(wù)平臺(tái)、實(shí)現(xiàn)跨機(jī)構(gòu)數(shù)字資源整合的意識(shí)?;谡Z義網(wǎng)的關(guān)聯(lián)數(shù)據(jù)技術(shù)的產(chǎn)生,為LAM數(shù)字資源的整合帶來了新的契機(jī)。
筆者經(jīng)調(diào)查發(fā)現(xiàn),目前國內(nèi)對(duì)利用關(guān)聯(lián)數(shù)據(jù)進(jìn)行LAM數(shù)字資源整合的研究成果寥寥無幾,僅可找到2012年鄭燃等發(fā)表的《基于關(guān)聯(lián)數(shù)據(jù)的圖書館、檔案館和博物館數(shù)字資源整合研究》一文。國內(nèi)基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源整合研究,重點(diǎn)在圖書館,研究成果主要為對(duì)應(yīng)用模式的探索。檔案館的相關(guān)研究成果,目前僅有石華于2015年發(fā)表的《基于關(guān)聯(lián)數(shù)據(jù)的語義數(shù)字檔案館框架設(shè)計(jì)研究》一文。博物館領(lǐng)域內(nèi)的相關(guān)研究,亦僅有易軍凱于2014年的發(fā)表《一種基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字博物館語義融合方法》一文。
為充分發(fā)揮關(guān)聯(lián)數(shù)據(jù)在LAM數(shù)字資源整合中的價(jià)值,筆者基于對(duì)關(guān)聯(lián)數(shù)據(jù)基本原理的理解,論述了關(guān)聯(lián)數(shù)據(jù)應(yīng)用于LAM數(shù)字資源整合的可行性,構(gòu)建了基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架,并通過具體案例分析,設(shè)計(jì)了基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺(tái),最后,對(duì)基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合過程中可能存在的問題進(jìn)行了論述。
關(guān)聯(lián)數(shù)據(jù)技術(shù)由“萬維網(wǎng)之父”Tim Berners-Lee于2006年提出,隨后互聯(lián)網(wǎng)協(xié)會(huì)(W3C)推出一種用于發(fā)布和聯(lián)接各種數(shù)據(jù)、信息和知識(shí)的標(biāo)準(zhǔn),即開放關(guān)聯(lián)數(shù)據(jù)(Link Open Data,LOD)[3],推動(dòng)了關(guān)聯(lián)數(shù)據(jù)在全世界的研究應(yīng)用。
Tim Berners-Lee認(rèn)為,關(guān)聯(lián)數(shù)據(jù)在理念上就是一箱箱的數(shù)據(jù),能夠通過開放標(biāo)準(zhǔn)關(guān)聯(lián)在一起,從而萌發(fā)出新的價(jià)值和應(yīng)用。從應(yīng)用角度看,關(guān)聯(lián)數(shù)據(jù)可視為一種建立在Web網(wǎng)絡(luò)標(biāo)準(zhǔn)之上的結(jié)構(gòu)化數(shù)據(jù)發(fā)布與共享方法[4]。這樣就可以將一個(gè)個(gè)資源孤島通過各種邏輯關(guān)系整合為統(tǒng)一的數(shù)據(jù)空間,提高Web網(wǎng)絡(luò)的智能化水平。關(guān)聯(lián)數(shù)據(jù)將各類實(shí)體和概念都轉(zhuǎn)換為機(jī)器可讀或可理解的方式,并用特定的邏輯關(guān)系將它們鏈接起來,再借助互聯(lián)網(wǎng)將結(jié)構(gòu)化的數(shù)據(jù)發(fā)布出去,最終形成一個(gè)語義網(wǎng)。
關(guān)聯(lián)數(shù)據(jù)是通過構(gòu)建對(duì)象間的關(guān)聯(lián),最終將其整合成全球語義網(wǎng)的重要途徑。為了統(tǒng)一規(guī)范標(biāo)準(zhǔn),Tim Berners-Lee規(guī)定了關(guān)聯(lián)數(shù)據(jù)發(fā)布的四原則:使用URI(統(tǒng)一資源標(biāo)識(shí)符)作為任何事物的標(biāo)志;使用HTTP URIs 以便任何人都可以訪問這些標(biāo)志;當(dāng)有人訪問某個(gè)標(biāo)志時(shí),使用RDF、SPARQL標(biāo)準(zhǔn)提供有用的信息;盡可能提供相關(guān)的URI以便人們發(fā)現(xiàn)更多的事物[5]。關(guān)聯(lián)數(shù)據(jù)的基本原則是在遵循URI復(fù)用原則的前提下,以HTTP URIs命名與解析機(jī)制為依據(jù),以RDF數(shù)據(jù)模型為基礎(chǔ)[6]。這不僅是在關(guān)聯(lián)數(shù)據(jù)的運(yùn)用中建立了明確的統(tǒng)一規(guī)范和實(shí)踐模式,還在關(guān)聯(lián)數(shù)據(jù)資源的聯(lián)系和整合中起到了不可替代的作用。
總的來說,以互聯(lián)網(wǎng)統(tǒng)一規(guī)范和基本框架為基礎(chǔ)的技術(shù)支撐提供了關(guān)聯(lián)數(shù)據(jù)構(gòu)建的可能性和便利性,以語義聯(lián)系為基礎(chǔ)的邏輯性概念和便于人機(jī)交互的規(guī)范化語言保證了關(guān)聯(lián)數(shù)據(jù)語義問題處理的高效性,同時(shí)URI復(fù)用原則與RDF數(shù)據(jù)鏈接機(jī)制也在數(shù)字資源的整合實(shí)踐中作出了巨大的貢獻(xiàn)。
關(guān)聯(lián)數(shù)據(jù)因其可透過浮于信息表層的內(nèi)容,深入資源內(nèi)部包含的客觀實(shí)體和抽象概念間的聯(lián)系,以邏輯關(guān)系為基礎(chǔ),借助靈活的語義鏈接機(jī)制建立數(shù)據(jù)間的聯(lián)接,將一個(gè)個(gè)信息孤島拼湊起來形成一個(gè)完整的語義網(wǎng)絡(luò)[7],而被視為在跨部門、跨領(lǐng)域情況下進(jìn)行數(shù)字資源整合的有效方法。具體而言,關(guān)聯(lián)數(shù)據(jù)共享機(jī)制主要依靠URI復(fù)用原則、RDF鏈接機(jī)制和LOD發(fā)布,即提倡積極使用URI復(fù)用原則揭示資源內(nèi)部的關(guān)系,并借助RDF鏈接機(jī)制讓資源對(duì)象間建立語義關(guān)聯(lián),將結(jié)構(gòu)化數(shù)據(jù)或文本內(nèi)容以數(shù)據(jù)集的形式發(fā)布在萬維網(wǎng)上特別是開放關(guān)聯(lián)數(shù)據(jù)LOD中,使所有用戶都能夠通過網(wǎng)絡(luò)自由開放地檢索、存取與利用LAM數(shù)據(jù)。其具體共享機(jī)制見圖1。
圖1 關(guān)聯(lián)數(shù)據(jù)共享機(jī)制[8]
3.1.1 廣泛的合作基礎(chǔ)
圖書館、檔案館與博物館是收藏我國民族文化資源的主要部門, 它們有許多共同點(diǎn)與互補(bǔ)點(diǎn),這是合作的基礎(chǔ)與動(dòng)力。 第一,在機(jī)構(gòu)屬性上,圖書館、檔案館和博物館同屬于公共文化服務(wù)機(jī)構(gòu),是記錄和傳承社會(huì)文化遺產(chǎn)的重要部門,在保留本國文化精髓,滿足民眾精神文化需求方面有著不可或缺的重要作用。第二,在資源屬性上,圖書館的圖書、檔案館的檔案和博物館的館藏實(shí)物,同屬于文化資源,都是本國文化所留存的社會(huì)文化遺產(chǎn)。第三,在服務(wù)方式上,三者都是以免費(fèi)公益的方式,向全社會(huì)公眾開放,保證公眾公平獲取信息,致力于提高全社會(huì)文化素養(yǎng),增強(qiáng)全民族文化軟實(shí)力[9]。所以,在目標(biāo)、關(guān)注點(diǎn)相同且面臨共同挑戰(zhàn)的情況下,LAM的數(shù)字資源整合存在廣泛的合作基礎(chǔ)。
3.1.2 強(qiáng)大的技術(shù)支持
信息技術(shù)的高速發(fā)展為LAM數(shù)字資源整合奠定了技術(shù)基礎(chǔ),突出體現(xiàn)在解決網(wǎng)絡(luò)異構(gòu)問題上。網(wǎng)絡(luò)異構(gòu)指的是計(jì)算機(jī)快速更新?lián)Q代,各機(jī)構(gòu)使用的網(wǎng)絡(luò)系統(tǒng)不盡相同,缺乏定時(shí)的交流與溝通,系統(tǒng)間因不能互相通信而形成一個(gè)個(gè)信息孤島,導(dǎo)致網(wǎng)絡(luò)異構(gòu)環(huán)境的產(chǎn)生。我國圖書館、檔案館和博物館的現(xiàn)狀就是這樣,館際缺乏最基本的協(xié)調(diào)與合作,館藏?cái)?shù)字資源的整合遙不可及。關(guān)聯(lián)數(shù)據(jù)的出現(xiàn)則能更好地解決這一問題。
3.1.3 元數(shù)據(jù)的整合和互操作的實(shí)現(xiàn)
LAM擁有豐富的數(shù)字資源且對(duì)元數(shù)據(jù)進(jìn)行了規(guī)范控制,但由于管理體制和館藏發(fā)展政策等原因,各機(jī)構(gòu)實(shí)施的元數(shù)據(jù)標(biāo)準(zhǔn)、遵循的協(xié)議都不同。如果LAM都以統(tǒng)一的關(guān)聯(lián)數(shù)據(jù)形式建設(shè)館藏資源,就能實(shí)現(xiàn)元數(shù)據(jù)的整合與互操作,促進(jìn)館藏資源的充分利用,改善資源重復(fù)建設(shè)現(xiàn)象,進(jìn)而提高LAM的知識(shí)服務(wù)質(zhì)量。
3.1.4 先進(jìn)的自身意識(shí)
在關(guān)聯(lián)開放數(shù)據(jù)(LOD)項(xiàng)目的推動(dòng)下,目前有超過130 億條傳統(tǒng)網(wǎng)頁上的數(shù)據(jù),例如維基百科、地理數(shù)據(jù)集和政府?dāng)?shù)據(jù)集等,已經(jīng)自動(dòng)半自動(dòng)地轉(zhuǎn)換成了關(guān)聯(lián)數(shù)據(jù),構(gòu)建了龐大的數(shù)據(jù)網(wǎng)絡(luò)[10]。關(guān)聯(lián)數(shù)據(jù)的產(chǎn)生讓LAM三機(jī)構(gòu)間、LAM和相關(guān)部門間的數(shù)字資源共建共享工作越來越簡(jiǎn)單,LAM意識(shí)到建立與分布LAM關(guān)聯(lián)數(shù)據(jù)的責(zé)任,開始將注意點(diǎn)轉(zhuǎn)移到數(shù)字資源整合。LAM應(yīng)當(dāng)利用先進(jìn)的存儲(chǔ)技術(shù)如云存儲(chǔ)技術(shù),對(duì)以館藏資源為基礎(chǔ)建立的關(guān)聯(lián)數(shù)據(jù)進(jìn)行處理,全方位多層次地滿足用戶多樣化個(gè)性化的信息要求,進(jìn)一步提升用戶對(duì)公共文化服務(wù)的滿意度。
如圖2所示,館藏?cái)?shù)字資源一般要通過5個(gè)基本流程才能實(shí)現(xiàn)整合。
圖2 基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源整合過程[11]
幾乎所有LAM都進(jìn)入了館藏?cái)?shù)字化進(jìn)程。為方便機(jī)器可讀或可理解,也為后期的整合奠定基礎(chǔ),LAM在其數(shù)字資源整合過程中應(yīng)做到以下幾點(diǎn):第一,要以規(guī)范化的形式即RDF(資源描述框架)描述館藏?cái)?shù)字資源,創(chuàng)建關(guān)聯(lián)數(shù)據(jù)。第二,為了實(shí)現(xiàn)館藏資源的開放共享,需要將創(chuàng)建好的關(guān)聯(lián)數(shù)據(jù)通過互聯(lián)網(wǎng)發(fā)布,發(fā)布過程要遵循關(guān)聯(lián)數(shù)據(jù)四原則,尤其提倡URI的復(fù)用原則以便于體現(xiàn)資源的內(nèi)在關(guān)聯(lián)。第三,通過RDF語義鏈接機(jī)制建立所發(fā)布資源間的內(nèi)外部關(guān)聯(lián)關(guān)系。內(nèi)部關(guān)聯(lián)關(guān)系是指在形成RDF記錄時(shí)建立的與其他內(nèi)容對(duì)象的關(guān)聯(lián)描述,而外部關(guān)聯(lián)關(guān)系的構(gòu)建主要指的是建立一個(gè)數(shù)據(jù)庫。具體而言,關(guān)聯(lián)數(shù)據(jù)瀏覽器能利用RDF 機(jī)制為公眾提供對(duì)象間的瀏覽服務(wù),把得到的RDF 對(duì)象進(jìn)一步加工,建立能提供訪問服務(wù)的RDF 數(shù)據(jù)庫。這個(gè)數(shù)據(jù)庫既可以是虛擬數(shù)據(jù)庫也可以是實(shí)際數(shù)據(jù)庫。第四,為了提高用戶使用滿意度,適應(yīng)用戶的使用習(xí)慣,需要將瀏覽界面做得更加友好、人性化。因此要根據(jù)用戶所需資源的類型,將與該對(duì)象相關(guān)的所有信息以可視化的形式展現(xiàn)給用戶,提供直觀便利的關(guān)聯(lián)數(shù)據(jù)瀏覽服務(wù),即構(gòu)建統(tǒng)一視圖。最后,為了避免關(guān)聯(lián)數(shù)據(jù)源在開放環(huán)境中因數(shù)據(jù)更改成丟失而造成斷鏈或錯(cuò)鏈現(xiàn)象,必須定時(shí)掃描和修補(bǔ)關(guān)聯(lián)數(shù)據(jù)的URI鏈接,維護(hù)關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)的正常運(yùn)行。
語義網(wǎng)的誕生在一定程度上減少了用戶在利用數(shù)字資源過程中的不便,這些不便產(chǎn)生的原因主要是傳統(tǒng)的Web網(wǎng)絡(luò)由大量缺乏關(guān)聯(lián)的動(dòng)態(tài)或靜態(tài)文檔構(gòu)成。Web的智能化得益于數(shù)字資源的有效整合,而實(shí)現(xiàn)數(shù)字資源有效整合的一個(gè)重要方法就是建立數(shù)據(jù)之間的語義關(guān)聯(lián),通過URI來實(shí)現(xiàn)語義關(guān)聯(lián),提高計(jì)算機(jī)的數(shù)據(jù)處理效率,使得Web更加智能化[12]。
圖3 基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源集成一般框架[13]
如圖3所示,基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源集成一般框架由底部至頂部主要包括數(shù)據(jù)發(fā)布層、數(shù)據(jù)關(guān)聯(lián)層與數(shù)據(jù)集成應(yīng)用層三部分。數(shù)據(jù)發(fā)布層是資源主體將來源渠道不同的數(shù)據(jù)用資源描述框架進(jìn)行描述,并在遵循關(guān)聯(lián)數(shù)據(jù)四原則的基礎(chǔ)上將數(shù)據(jù)發(fā)布到萬維網(wǎng)上以便其他用戶瀏覽。數(shù)據(jù)關(guān)聯(lián)層是將不同領(lǐng)域內(nèi)可能存在特定關(guān)聯(lián)關(guān)系的資源借助RDF鏈接機(jī)制聯(lián)系起來,形成一個(gè)數(shù)據(jù)網(wǎng)絡(luò)。數(shù)據(jù)集成應(yīng)用層指利用關(guān)聯(lián)數(shù)據(jù)技術(shù)向用戶提供各種服務(wù)。
研究者以基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源集成一般框架為基礎(chǔ),結(jié)合各個(gè)機(jī)構(gòu)的實(shí)際情況與差異點(diǎn),創(chuàng)建了基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架(見圖4),主要分為數(shù)據(jù)及標(biāo)引、關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建和發(fā)布、關(guān)聯(lián)數(shù)據(jù)的具體應(yīng)用三部分。
圖4 基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架[14]
3.3.1 LAM數(shù)字資源的元數(shù)據(jù)標(biāo)引
數(shù)字資源的整合需要在充分考慮元數(shù)據(jù)的基礎(chǔ)上進(jìn)行,不應(yīng)該只是相關(guān)資源的簡(jiǎn)單集合。通過關(guān)聯(lián)數(shù)據(jù)的方法,將基于元數(shù)據(jù)標(biāo)引的數(shù)字資源進(jìn)行聚合,首先需要利用URI對(duì)有關(guān)數(shù)據(jù)集合進(jìn)行統(tǒng)一標(biāo)識(shí),其次就是數(shù)據(jù)集合的關(guān)聯(lián)過程,即將具有關(guān)聯(lián)關(guān)系的數(shù)據(jù)集通過RDF機(jī)制鏈接起來。數(shù)字資源的整合過程不是單純的分類或者按序調(diào)整,而是語義層面的深度關(guān)聯(lián),從而形成以元數(shù)據(jù)為基礎(chǔ)的、高效的數(shù)字資源整合[15]。
3.3.2 關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布
LAM數(shù)字資源進(jìn)行元數(shù)據(jù)標(biāo)引后,需要利用規(guī)范格式即資源描述框架(RDF/XML)對(duì)數(shù)字資源特定的一些屬性作出轉(zhuǎn)換性的描述,建立HTTP URI以利于機(jī)器可讀和可理解,所生成的用來揭示資源對(duì)象內(nèi)部關(guān)聯(lián)關(guān)系的RDF數(shù)據(jù)則要通過互聯(lián)網(wǎng)發(fā)布出去以供公眾瀏覽和檢索[16]。將RDF數(shù)據(jù)發(fā)布到互聯(lián)網(wǎng)上有兩種選擇,一是利用HTTP的內(nèi)容協(xié)商機(jī)制,該機(jī)制能根據(jù)客戶端信息請(qǐng)求的類型決定返回HTML的表示形式還是RDF的表示形式;二是采用帶“#”號(hào)的URI方式定位到RDF中具體的數(shù)字資源[17]。除此之外,LAM在使用該數(shù)字資源整合框架時(shí)還要設(shè)置一個(gè)開放許可的訪問接口,用戶可以通過這個(gè)接口,用RDF標(biāo)準(zhǔn)化的檢索語言SPARQL和預(yù)定義函數(shù)進(jìn)行相關(guān)檢索,還可不受空間限制調(diào)用本地?cái)?shù)據(jù)。
3.3.3 關(guān)聯(lián)數(shù)據(jù)的瀏覽與檢索
關(guān)聯(lián)數(shù)據(jù)發(fā)布后,其應(yīng)用除了互聯(lián)與維護(hù)外,最主要的就是瀏覽與檢索。用戶有這類需求時(shí),既可以選擇專門的關(guān)聯(lián)數(shù)據(jù)瀏覽器,也可以利用專門的關(guān)聯(lián)數(shù)據(jù)搜索引擎。另外,由于關(guān)聯(lián)數(shù)據(jù)的RDF鏈接機(jī)制已將一個(gè)個(gè)資源孤島通過各種邏輯關(guān)系整合為統(tǒng)一的數(shù)據(jù)空間,用戶可以借助導(dǎo)航在不同數(shù)據(jù)源間進(jìn)行訪問。目前,被廣泛使用的關(guān)聯(lián)數(shù)據(jù)瀏覽器有Tabulator Browser、Disco Hyperdata Browser、OpenLink Data Web Browser、Object-viewer、Marbles等,而常用的關(guān)聯(lián)數(shù)據(jù)搜索引擎有Falcons、Sindice、Watson、SWSE(Semantic Web Search Engine)、Swoogle 等[18]。
A市圖書館、檔案館、博物館分布在該市不同地點(diǎn),其隸屬部門、館藏發(fā)展政策均存在較大差異,三者間并無合作。筆者現(xiàn)想將基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架在A市實(shí)踐,針對(duì)A市的基本情況提出了基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺(tái)設(shè)計(jì)方案。
4.1.1 分類法使用情況與特點(diǎn)
A市LAM館藏資源分類方法各不相同,圖書館分類以《中國圖書館分類法》為準(zhǔn),博物館的館藏大多為實(shí)物型,主要根據(jù)外部特征來分類,檔案館使用的分類依據(jù)是《中國檔案分類法》。
4.1.2 服務(wù)模式與特點(diǎn)
圖書館、博物館、檔案館因不同的館藏資源和服務(wù)目的而形成了不同的服務(wù)模式[19]:①圖書館所提供的服務(wù)有文獻(xiàn)資源流通服務(wù)、信息服務(wù)、讀者教育服務(wù)、技術(shù)服務(wù)以及數(shù)字圖書館服務(wù)等。②檔案館除了提供檢索、瀏覽、參考咨詢以及培訓(xùn)等服務(wù)外,還提供保密保管服務(wù),但開放服務(wù)有所欠缺。③博物館因其館藏資源的特殊性,向公眾提供參觀游覽、講解教育、數(shù)字博物館等服務(wù)。
4.1.3 資源建設(shè)情況與特點(diǎn)
圖書館、檔案館收集和保存的資源主要是文獻(xiàn)型資源,而博物館的資源則大多為實(shí)物型,部分資源可能因與各館都有關(guān)聯(lián)而被各館同時(shí)收藏。LAM如果不進(jìn)行資源整合,就會(huì)造成館藏資源重復(fù)建設(shè)。
LAM云服務(wù)平臺(tái)即在對(duì)所有館藏?cái)?shù)字資源進(jìn)行整合的前提下,根據(jù)用戶的需求查找和檢索資源,并及時(shí)反饋給用戶的一站式檢索和服務(wù)平臺(tái)。用戶通過這個(gè)云服務(wù)平臺(tái),不用輾轉(zhuǎn)三處,只需聯(lián)網(wǎng)就可以不受時(shí)間和空間的限制,享受LAM提供的公共文化服務(wù)。在關(guān)聯(lián)技術(shù)的幫助下,LAM所提供的信息服務(wù)也更加全面、準(zhǔn)確和高效。
由圖5可知,基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺(tái)總體框架包括兩大模塊:LAM云服務(wù)平臺(tái)和LAM關(guān)聯(lián)數(shù)據(jù)處理平臺(tái)。LAM云服務(wù)平臺(tái)主要包括:LAM基礎(chǔ)設(shè)施與基礎(chǔ)平臺(tái)服務(wù)、LAM公共云服務(wù)平臺(tái)(公有云)、LAM本地云服務(wù)平臺(tái)(私有云)和LAM混合云服務(wù)平臺(tái)(混合云)。LAM的基礎(chǔ)設(shè)施與基礎(chǔ)平臺(tái)建設(shè)如計(jì)算機(jī)、數(shù)據(jù)庫、存儲(chǔ)系統(tǒng)等由各館自行負(fù)責(zé),各館也可選擇由第三方承建。LAM公共云服務(wù)平臺(tái)主要負(fù)責(zé)各館數(shù)字資源共建共享,減少資源重復(fù)建設(shè)。公共云服務(wù)平臺(tái)還會(huì)定期發(fā)布一些關(guān)于館際合作、交流之類的信息,這些都由特定的工作人員負(fù)責(zé)。LAM本地云服務(wù)平臺(tái)主要包括本地應(yīng)用平臺(tái)與應(yīng)用系統(tǒng),負(fù)責(zé)各館自身的館藏資源數(shù)字化、館藏資源發(fā)展、特色數(shù)據(jù)庫建設(shè)、向公眾提供宣傳教育和參考咨詢等。LAM混合云服務(wù)平臺(tái)主要任務(wù)是將LAM云服務(wù)平臺(tái)中的其他平臺(tái)整合到一起,進(jìn)行統(tǒng)一的集成管理,實(shí)現(xiàn)公有云與私有云之間的互操作。
圖5 基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺(tái)總體框架[20]
LAM關(guān)聯(lián)數(shù)據(jù)處理平臺(tái)就是當(dāng)用戶有了具體的信息資源需求,并向LAM云服務(wù)平臺(tái)提出請(qǐng)求時(shí),LAM云服務(wù)平臺(tái)會(huì)用統(tǒng)一的格式將用戶請(qǐng)求轉(zhuǎn)換為機(jī)器語言,即對(duì)用戶請(qǐng)求進(jìn)行資源描述,以便于機(jī)器更好地理解。系統(tǒng)會(huì)根據(jù)之前的資源描述在數(shù)據(jù)庫內(nèi)進(jìn)行查找與定位,一旦發(fā)現(xiàn)與用戶需求相匹配的資源,系統(tǒng)會(huì)對(duì)其進(jìn)行預(yù)置,將資源位置記錄下來。在所有查找工作結(jié)束后,系統(tǒng)根據(jù)之前的記錄對(duì)所有符合條件的對(duì)象進(jìn)行調(diào)度,最后,LAM將依據(jù)關(guān)聯(lián)規(guī)則知識(shí)庫創(chuàng)建的關(guān)聯(lián)數(shù)據(jù)發(fā)布在Web網(wǎng)絡(luò)上。
關(guān)聯(lián)數(shù)據(jù)最突出的優(yōu)勢(shì)在于將之前沒有關(guān)聯(lián)但相似的對(duì)象聯(lián)系起來,并在進(jìn)一步聚合后將與之有關(guān)的全部數(shù)據(jù)進(jìn)行加工處理,最終以統(tǒng)一視圖的形式呈現(xiàn)在公眾面前?,F(xiàn)有的關(guān)聯(lián)數(shù)據(jù)搜索引擎能夠提供不同數(shù)據(jù)源間隨意瀏覽的服務(wù),但針對(duì)數(shù)據(jù)整合而采取的用戶交互模式并不適用且存在難點(diǎn)[21]。因此,LAM應(yīng)采取有效措施,改進(jìn)現(xiàn)有的用戶交互模式,如設(shè)置與互聯(lián)網(wǎng)瀏覽器類似的前進(jìn)和后退功能或創(chuàng)建用戶能夠?qū)Ξ?dāng)前視圖中的數(shù)據(jù)資源進(jìn)行添加或去除的機(jī)制。
LAM 要利用訪問接口才能購買、租用或開發(fā)資源庫[22],假如這些資源庫接口都不開放的話,系統(tǒng)封閉,關(guān)聯(lián)數(shù)據(jù)就不起作用。為了保證數(shù)據(jù)源全面可靠,LAM要吸引更多的數(shù)據(jù)供應(yīng)者為構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)提供服務(wù)。另外,LAM數(shù)字資源整合模式的開放許可標(biāo)準(zhǔn)必須在守法的前提下均衡考慮各方利益,為數(shù)據(jù)供應(yīng)者發(fā)布關(guān)聯(lián)數(shù)據(jù)提供方便和動(dòng)力。
關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)面向用戶開放,且處于持續(xù)更新中,數(shù)據(jù)源若在開放環(huán)境或更新過程中發(fā)生改變、損壞或丟失,斷鏈或錯(cuò)鏈隨之產(chǎn)生,系統(tǒng)也會(huì)發(fā)生錯(cuò)誤,甚至無法運(yùn)行。為了避免這種情況,減少不必要的人力、物力和財(cái)力損失,LAM需要實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)源并對(duì)斷鏈或錯(cuò)鏈及時(shí)采取措施,可以安裝監(jiān)控插件,并安排專人負(fù)責(zé)管理,以更好地維護(hù)數(shù)據(jù)源之間的關(guān)聯(lián)。
LAM的數(shù)字資源都較為豐富,館藏資源的類型、數(shù)據(jù)存儲(chǔ)格式、元數(shù)據(jù)規(guī)范各不相同, 資源載體功能互異,描述方法不一,信息的選擇、組織和揭示有一定難度[23]。基于關(guān)聯(lián)數(shù)據(jù)的整合模式實(shí)施時(shí),需要首先解決將關(guān)系性數(shù)據(jù)等非關(guān)聯(lián)性數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)性數(shù)據(jù)的問題。我們可以建立統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),采用統(tǒng)一的元數(shù)據(jù)對(duì)來自各館的數(shù)字資源進(jìn)行編目,確保各館在資源組織過程中的一致性。
本文以關(guān)聯(lián)數(shù)據(jù)有關(guān)知識(shí)為理論基礎(chǔ),探索將其運(yùn)用于LAM數(shù)字資源整合的可能性,進(jìn)而構(gòu)建出一個(gè)整合模式,并通過案例假設(shè)讓該模式在A市試點(diǎn),挖掘其與云服務(wù)的聯(lián)系,提出了云服務(wù)平臺(tái)的設(shè)計(jì)方案。當(dāng)前的研究只集中在理論層面,該LAM數(shù)字資源整合模式與云服務(wù)平臺(tái)有待在實(shí)踐中進(jìn)行相關(guān)效度檢驗(yàn),提出評(píng)測(cè)指標(biāo),才能進(jìn)一步完善。但仍可作為LAM數(shù)字資源整合的一種可行方案,為今后的研究提供參考和借鑒。
(來稿時(shí)間:2018年4月)