金翼
摘 要:隨著語義關聯(lián)時代的到來,數(shù)字圖書館資源的組織與服務方式必然發(fā)生巨大變革。圖書館關聯(lián)數(shù)據(jù)是真正意義上的數(shù)據(jù)開放,既對圖書館的用戶開放,也對全球的網(wǎng)絡用戶開放。關聯(lián)數(shù)據(jù)在圖書館中的具體應用主要在三個方面,即圖書館資源可發(fā)布為關聯(lián)數(shù)據(jù),可利用關聯(lián)數(shù)據(jù)擴展資源與發(fā)現(xiàn)服務以及利用關聯(lián)數(shù)據(jù)實現(xiàn)數(shù)據(jù)融合與語義檢索服務,這對推動圖書館融入數(shù)據(jù)網(wǎng)絡服務具有一定的積極作用。
關鍵詞:關聯(lián)數(shù)據(jù);圖書館;基本模式;數(shù)據(jù)網(wǎng)絡服務
中圖分類號:G250.7 文獻標識碼:A 文章編號:2095-7394(2017)03-0114-04
多年來, 文獻資源檢索與提供利用一直是圖書館信息服務的核心。傳統(tǒng)的信息服務是人們所熟知的,當然仍然具有一定的使用價值,但將用戶需求等同于文獻檢索是非常機械的,而那些超出文獻檢索的需求又應該如何處理呢?在信息時代的當下,這種服務顯然已不能滿足人們的需求了。如果說知識發(fā)現(xiàn)是公共圖書館服務重要內容之一,那么,關聯(lián)數(shù)據(jù)(Linked Data)則為此種服務提供了極佳的途徑。2006年7月,“互聯(lián)網(wǎng)之父”蒂姆·伯納斯-李(Timothy John Berners-Lee,1955-)提出關聯(lián)數(shù)據(jù)以來,關聯(lián)數(shù)據(jù)在短時間內便成為互聯(lián)網(wǎng)研究與應用的新寵。隨后,關聯(lián)數(shù)據(jù)應用之廣令人難以想象,它不僅應用于媒介,如英國廣播公司(BBC)、紐約時報和路透社等,而且應用于政府層面,如美國與英國政府的政府信息等。2008年,瑞典國家圖書館(National Library of Sweden)率先以關聯(lián)數(shù)據(jù)形式發(fā)布LIBRIS(Library Resources Information System,即圖書館資源信息系統(tǒng))國家書目,兩年后便有20多個圖書館的關聯(lián)數(shù)據(jù)集。甚至連美國國會圖書館(The Library of Congress)也采用關聯(lián)數(shù)據(jù)技術。關聯(lián)數(shù)據(jù)可以將圖書館的知識或資源與外部世界連接起來,為讀者或用戶提供了更加便利和全面的服務,更為重要的是,它可創(chuàng)造更有價值的知識或資源。因此,圖書館利用關聯(lián)數(shù)據(jù),并整合不同的知識或資源,盡可能接近支持用戶解決問題的目標。[1]關聯(lián)數(shù)據(jù)對圖書館的意義越來越重大,它對于將全球圖書館的數(shù)據(jù)進行互通互聯(lián),并為用戶提供新的服務內容和服務方式,都具有重要的作用。
一、關聯(lián)數(shù)據(jù)及其基本模式
什么是關聯(lián)數(shù)據(jù)呢?所謂關聯(lián)數(shù)據(jù),指國際互聯(lián)網(wǎng)協(xié)會(World Wide Web Consortium,W3C)所推薦的一種規(guī)范,用以發(fā)布與聯(lián)接各種數(shù)據(jù)、信息與知識。它是基于萬維網(wǎng)而建立的一個數(shù)據(jù)網(wǎng)絡,包括所有的自然、社會與精神世界。如此一來,世界萬事萬物及其相互關系都可進行機器可讀描述,使互聯(lián)網(wǎng)成為真正意義上的互聯(lián)互通,使任何一個用戶不僅可查找,而且還可分享和利用這些相互關聯(lián)的數(shù)據(jù)、信息與知識。[2]其實,關聯(lián)數(shù)據(jù)的定義繁多,其中,最常用的或許就是維基百科的定義:關聯(lián)數(shù)據(jù)是語義網(wǎng)的主題之一,它描述了通過可鏈接的URI(Uniform Resource Identifier,即統(tǒng)一資源標識符)方式來發(fā)布、分享、鏈接WEB中的各類資源的一種方法。[3]
關聯(lián)數(shù)據(jù)有兩種基本模式:1)瀏覽器/服務器模式(Browser / Server);2)客戶端/服務器模式(Client / Server)。瀏覽器/服務器模式指人們通過瀏覽器便可以非常便利地訪問相關的關聯(lián)數(shù)據(jù);而客戶端/服務器模式則指應用的系統(tǒng),她實指系統(tǒng)與系統(tǒng)之間所進行的數(shù)據(jù)與數(shù)據(jù)之間的傳遞。但在兩種模式中,關聯(lián)數(shù)據(jù)都必須通過HTTP(Hyper-Text Transfer Protocol,即超文本傳輸協(xié)議)來進行數(shù)據(jù)傳遞。
眾所周知,作為一種網(wǎng)絡技術,關聯(lián)數(shù)據(jù)與圖書情報工作極為相關。當互聯(lián)網(wǎng)發(fā)展到當下的語義網(wǎng)時代(the Age of the Semantic Web),作為一種基礎技術的關聯(lián)數(shù)據(jù),可對所有網(wǎng)上的資源進行編目與控制。關聯(lián)數(shù)據(jù)也是數(shù)字圖書館發(fā)布信息資源和提供服務的一種核心技術。
二、關聯(lián)數(shù)據(jù)之應用于圖書館
21世紀,關聯(lián)數(shù)據(jù)之應用于圖書館不僅可提高自身的對讀者的服務意識,也可增強自身在資源或知識方面的核心競爭力。如果要解決這些問題,那么,知識集成與資源發(fā)現(xiàn)就成為了圖書館一個關鍵問題。關聯(lián)數(shù)據(jù)就是一種極佳的途徑。關聯(lián)數(shù)據(jù)具有以下特點:框架簡潔、去中心化、標準化、自助化、低成本,因而得到快速發(fā)展與應用。[4]現(xiàn)在,許多政府部門、國際組織、研究機構、大型傳媒、商業(yè)企業(yè)等,始建自己的關聯(lián)數(shù)據(jù)。圖書館既能將其數(shù)據(jù)發(fā)布為關聯(lián)數(shù)據(jù),并提供利用以及與之相關的各種服務,又能將數(shù)據(jù)網(wǎng)絡引入圖書館的服務之中。[5]
(一)將圖書館資源發(fā)布為關聯(lián)數(shù)據(jù)
關聯(lián)數(shù)據(jù)可增強也可擴展圖書館的資源發(fā)現(xiàn)平臺,也可以創(chuàng)造這樣一個機會,即將圖書館的資源與外界相互聯(lián)接成一個網(wǎng)絡。隨著我國互聯(lián)網(wǎng)的快速發(fā)展,關聯(lián)數(shù)據(jù)也得到了很好的發(fā)展,并且其應用前景非常廣泛。萬維網(wǎng)聯(lián)盟(國際互聯(lián)網(wǎng)協(xié)會)宣布,SKOS(Simple Knowledge Organization System,即簡單知識組織系統(tǒng))已經(jīng)全面關聯(lián)數(shù)據(jù)化了。對圖書館而言,這是極具里程碑的意義的。目前,國外在關聯(lián)數(shù)據(jù)的應用方面比較發(fā)達,如一些圖書館開始采用RDF(Resource Description Framework,資源描述框架)和關聯(lián)數(shù)據(jù)。國外對關聯(lián)數(shù)據(jù)的應用確實有很多值得學習的地方,如瑞典國家圖書館、德國國家經(jīng)濟學圖書館(Deutsche Zentralbibliothek für Wirtschaftswissenschaften,ZBW)等,都在采用RDF和關聯(lián)數(shù)據(jù)。[6]
關聯(lián)數(shù)據(jù)的應用可以推動和推廣圖書館關聯(lián)數(shù)據(jù)的新的應用模式與途徑。一般而言,圖書館通過四個步驟而將相關的關聯(lián)數(shù)據(jù)集發(fā)布于網(wǎng)絡,如安裝D2R Server軟件,自動生成D2RQ mapping文件(RDF格式數(shù)據(jù))等,然后發(fā)布于網(wǎng)絡,在與網(wǎng)上其他數(shù)據(jù)集關聯(lián)。[7]
瑞典是世界上第一個將書目數(shù)據(jù)發(fā)布成關聯(lián)數(shù)據(jù)的聯(lián)合目錄的國家。目前,瑞典皇家圖書館已創(chuàng)建從聯(lián)合目錄到DBpedia(資料庫百科全書)的鏈接。其經(jīng)驗與方法值得其他圖書館學習和借鑒,包括我國的圖書館。美國國會圖書館也以SKOS的格式來將國會標題表LCSH(Library of Congress Subject Headings,即美國國會圖書館編制的一部大型綜合性標題表)全部關聯(lián)數(shù)據(jù)化,它也提供LCSH詞表的相關下載。這自然就能更好推動關聯(lián)數(shù)據(jù)之于圖書館的進一步應用與發(fā)展。另外,美國國會圖書館也創(chuàng)建不同資源之間的關聯(lián),如LIBRIS和LCSH之間的關聯(lián)等。通過應用關聯(lián)數(shù)據(jù),使美國國會圖書館服務器的負載得到有效降低,提高對圖書館資源查詢的效率。它也作為其他圖書館的效仿的對象。
圖書館一方面,可利用館內的關聯(lián)數(shù)據(jù)或知識;另一方面,也可將許多獨具特色的數(shù)據(jù)發(fā)布成關聯(lián)數(shù)據(jù),以便于世界上其他資源或知識形成一個又一個的網(wǎng)絡,以提高服務質量。因此,圖書館既可以擴展其關聯(lián)數(shù)據(jù),又可以增強其自身的公共價值與社會凝聚力。
(二) 利用關聯(lián)數(shù)據(jù)擴展資源和發(fā)現(xiàn)服務
圖書館必須為讀者或用戶提供高質量的知識資源服務,就必須鏈接其他機構的知識資源,與此同時,相關的關鏈接又可以擴大圖書館的知識資源的使用范圍。[8]目前,許多圖書館已開始擴展相關資源,并實施資源發(fā)現(xiàn)服務,如AquaBrowser、Encore、Endeca及Primo等的使用便是如此。這既可以擴展和豐富目錄的檢索界面功能,提高讀者或用戶對圖書館資源的發(fā)現(xiàn)與使用率,又可以利用圖書館資源發(fā)現(xiàn)服務,使讀者或用戶可隨時瀏覽圖書館動態(tài)更新的結果。
隨著網(wǎng)絡技術的發(fā)展,圖書館的書目目錄信息也在不斷變化,且增加了很多額外的信息,如目次、圖書封皮及評論的鏈接。關聯(lián)數(shù)據(jù)技術改變了傳統(tǒng)的服務方式,因它主要以記錄為中心。關聯(lián)數(shù)據(jù)從不同分面展示資源,并從第三方鏈入圖書館資源,而提供書目數(shù)據(jù)以外的信息,如如人、地點、出版信息及教學信息等。Open Library便是其中的代表。Open Library旨在成為全球最大最全的圖書目錄。[9]該方法對圖書館資源查詢具有一定的方便性,但其僅限于書目層次上的信息。在此,關聯(lián)數(shù)據(jù)可以擴展圖書館的書目信息,并提供結構化的數(shù)據(jù)基礎,從而使其超越圖書館的資源或知識,并提供新各種不同的資源服務。關聯(lián)數(shù)據(jù)可以使圖書館關聯(lián)更加廣泛的信息資源或知識,以便于讀者或用戶利用關聯(lián)數(shù)據(jù)擴展資源發(fā)現(xiàn)服務;它也可幫助用戶判斷其所需要的圖書館資源信息,還可提供圖書館以外的資源或知識。
現(xiàn)在,可以利用關聯(lián)數(shù)據(jù)的倉儲庫與搜索引擎來擴展圖書館的資源及知識的范圍。上海圖書館應用以關聯(lián)數(shù)據(jù)為代表的新型數(shù)據(jù)管理技術,其家譜數(shù)據(jù),既可以滿足一般用戶的尋根服務,又可以為人文研究者提供語義搜索、可視化瀏覽及知識挖掘服務,這有助于促進知識的流動,推動數(shù)據(jù)的開放,充分發(fā)揮圖書館的潛在價值。[10]
關聯(lián)數(shù)據(jù)可通過某一點關聯(lián)并集成更為廣泛的信息資源,基于語義關系二揭示更豐富的知識與知識之間關系,從而為開展知識服務提供重要保障。關聯(lián)數(shù)據(jù)還可深入和拓展使圖書館的服務方式與范圍。就學術成果傳播而言,可以利用關聯(lián)數(shù)據(jù),整合并集成相關內容,如研究人員、參加會議、科研項目、所屬機構、研究成果等,實現(xiàn)學術資源推薦服務。而在出版方面,關聯(lián)數(shù)據(jù)也開始參與出版物描述與導航功能的改善、出版物的自動評估及引用檢索等。可見,關聯(lián)數(shù)據(jù)起了關鍵作用,它提供了新的查詢服務、資源與知識訪問。
(三)利用關聯(lián)數(shù)據(jù)實現(xiàn)數(shù)據(jù)融合與語義檢索服務
在關聯(lián)數(shù)據(jù)云圖中,許多關聯(lián)資源可以作為圖書館的資源庫和知識庫,以便為讀者和用戶提供更加多樣、更加豐富的檢索結果。
在語義關聯(lián)的時代背景下,有這樣一種越來越明顯的趨勢,即科學數(shù)據(jù)與其他領域的數(shù)據(jù)之間相互融合以及數(shù)據(jù)與數(shù)據(jù)之間的關聯(lián)、交換和利用。作為信心資源與知識的中心之一的圖書館與其他機構的數(shù)據(jù)關聯(lián)、識別和交換也更加頻繁,其數(shù)據(jù)與其他數(shù)據(jù)的融合度也就愈高。同時,圖書館也承擔更多的責任與義務,如幫助研究者管理其創(chuàng)建的數(shù)據(jù)等。
在圖書館檢索系統(tǒng)如OPAL(Open Phone Abstraction Library)等中,用戶只能檢索作者、主題、題名等,卻無相關鏈接或關聯(lián)的知識檢索與知識發(fā)現(xiàn)等服務。關聯(lián)數(shù)據(jù)則能研究相關知識的網(wǎng)絡關系。計算機技術的發(fā)展導致不同數(shù)據(jù)之間進行交換和利用的頻率增加,同樣,對圖書館的資源數(shù)據(jù)信息與其它組織的數(shù)據(jù)之間進行交換和識別也愈發(fā)簡便,如此就增加了數(shù)據(jù)與數(shù)據(jù)之間的融合度。有鑒于此,圖書館極為重視數(shù)據(jù)與數(shù)據(jù)之間的融合。同時,圖書館在數(shù)據(jù)的融合方面也發(fā)揮巨大的作用。圖書館與其他機構,如博物館、數(shù)據(jù)存儲機構等之間的合作也越來越緊密,如CultureSampo是芬蘭文化記憶的語義WEB門戶,也是博物館開放數(shù)據(jù)之一例。
作為歐洲國家圖書館的數(shù)字資源門戶,Europeana能聚合圖書館、文化機構與圖書館對象的元數(shù)據(jù)等。這種數(shù)字資源重視門戶對門戶的相互操作性,它采用SKOS和其他元數(shù)據(jù)模式。采用數(shù)字資源門戶的語義檢索服務能更好地幫助讀者和用戶查詢相關資源信息,查詢出的結果也更準確、更有實際意義。使用該檢索服務模式,能把檢索詞匹配到名字、概念、地點、日期以及題名等相關信息。另外,通過Europeana,EuropeanaConnect可以引入語義層,以便在對象之間建立語義鏈接。
目前,我國國內有關關聯(lián)數(shù)據(jù)技術的研究尚處于起步探索階段。2015年,由上海圖書館與上??茖W技術情報研究所共同開發(fā)的上海圖書館開放數(shù)據(jù)平臺向互聯(lián)網(wǎng)公開發(fā)布了各種術語表、規(guī)范檔、書目數(shù)據(jù)等開放關聯(lián)數(shù)據(jù)集,在國內率先推出了基于關聯(lián)數(shù)據(jù)的數(shù)字人文服務。[11]
三、結語
伴隨互聯(lián)網(wǎng)發(fā)展而來的語義關聯(lián)時代的來臨,我國圖書館急需擴展和豐富相關的信息資源服務的手段與方法,提供更好的數(shù)據(jù)資源服務??茖W技術的發(fā)展日新月異,圖書館的相關管理及技術也要努力發(fā)展,只有這樣,才能趕上時代的步伐,才能不斷滿足讀者和用戶的需求,以確保圖書館的信息資源和數(shù)據(jù)資源服務更加具有競爭力。而關聯(lián)數(shù)據(jù)在圖書館中的應用便很好地解決了這個問題,對我國圖書館事業(yè)的發(fā)展具有里程碑的意義。有些圖書館將擺脫實體存在,以便為科研、教學及社會機構的決策等提供更多的互聯(lián)網(wǎng)數(shù)據(jù)服務。關聯(lián)數(shù)據(jù)通過互聯(lián)網(wǎng)而使全世界的知識連成一體,而最終成為“大數(shù)據(jù)”。關聯(lián)數(shù)據(jù)將加強并拓展知識與知識之間的聯(lián)系。關聯(lián)數(shù)據(jù)技術在圖書館中的應用及其發(fā)展將使圖書情報成為真正的數(shù)據(jù)資源服務和知識服務。
參考文獻:
[1] 羅錚. 高校圖書館應用關聯(lián)數(shù)據(jù)的意義及注意事項[J]. 圖書館雜志,2012(5):50-57.
[2] 劉煒. 關聯(lián)數(shù)據(jù):概念、技術及應用展望[J]. 大學圖書館學報,2011(4):5-12.
[3] 黃永文. 關聯(lián)數(shù)據(jù)在圖書館中的應用研究綜述[J]. 現(xiàn)代圖書情報技術,2010(5):17-25.
[4] 白海燕. 關聯(lián)數(shù)據(jù)及DBpedia實例分析[J]. 現(xiàn)代圖書情報技術,2010(3):39-45.
[5] 林海青,樓向英,夏翠娟. 圖書館關聯(lián)數(shù)據(jù):機會與挑戰(zhàn)[J]. 中國圖書館學報,2012(1):60-69,114.
[6] 徐華. 關聯(lián)數(shù)據(jù)在國外圖書館的應用及其借鑒意義[J]. 圖書館學研究,2011(8):62-67.
[7] 譚潔清. 關聯(lián)數(shù)據(jù)的簡介與進展[J]. 信息與電腦,2011(1):103,106.
[8] 黃永文. 技術,關聯(lián)數(shù)據(jù)在圖書館中的應用研究綜述[J]. 現(xiàn)代圖書情報,2010(5):1-7.
[9] Welcome to Open Library (Open Library)[EB / OL]. [2016-12-24]. http://openlibrary.org/.
[10] 夏翠娟. 家譜關聯(lián)數(shù)據(jù)服務平臺的開發(fā)實踐[J]. 中國圖書館學報,2016(3):27-38.
[11] 曹月珍. 關聯(lián)數(shù)據(jù)在圖書館的最新發(fā)展[J]. 圖書館學研究,2014(14):6-12.
The Application of Linked Data in the Library
JIN Yi
(Library, Jiangsu University of Technology, Changzhou 213001, China)
Abstract: With the advent of the age of semantic relations, the organization and service of digital resources of libraries must be a huge change. Linked data used in the library is really open data, which is open to both library users and the global Internet users. This article sums up the definition and the basic model of linked data. And it also analyses the actual uses of linked data in library, in terms of the following three aspects: library resources being released for linked data, using the linked data to extend and discover services, and utilizing linked data to realize data fusion and semantic retrieval service. All of this will positively promote libraries to be integrated into data network.
Key words: linked data; libraries; basic mode; data network service
責任編輯 徐 晶