国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于DC元數(shù)據(jù)的資源統(tǒng)一描述策略探討

2020-06-11 00:36范小松
關(guān)鍵詞:元數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)資源管理

范小松

摘要:不同類型信息資源、不同信息應(yīng)用行業(yè),有著眾多不同的元數(shù)據(jù)標(biāo)準(zhǔn)或應(yīng)用規(guī)范。尋求一種通用的、兼容多種類型信息資源和應(yīng)用需求的資源統(tǒng)一描述方案,既能降低資源描述與管理成本,又能消除跨系統(tǒng)、跨資源類型的數(shù)據(jù)交換與信息整合障礙。本文基于都柏林核心元數(shù)據(jù)(Dublin Core Metadata,DC元數(shù)據(jù))的理念,從元數(shù)據(jù)的編碼實(shí)現(xiàn)著手,探討了一種資源統(tǒng)一描述方案的設(shè)計(jì)策略,包括描述元素的核心化、可修飾或可限定策略,元數(shù)據(jù)結(jié)構(gòu)化與可伸縮化策略,資源描述對(duì)象單一化策略。

關(guān)鍵詞:元數(shù)據(jù);統(tǒng)一描述;數(shù)據(jù)結(jié)構(gòu);資源管理

中圖分類號(hào):G250.7 ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ?文章編號(hào):2095-5707(2020)03-0021-05

Abstract: Different types of information resources and different information application industries have various metadata standards or application specifications. Seeking a resource uniform description strategy that is universal and compatible with multiple types of information resources and application requirements can not only reduce resource description and management costs, but also eliminate barriers to data exchange and information integration across systems and resources. Based on the concept of Dublin Core Metadata (DC Metadata), and starting with the implementation of metadata encoding, this article discussed a design strategy for a uniform resource description scheme, including core, modifiable or definable strategies for describing elements, metadata structure and scalability strategy, and resource description object simplification strategy.

Key words: metadata; uniform description; data structure; resource management

隨著科學(xué)技術(shù)的發(fā)展,圖書館館藏信息資源除了具備圖書、期刊,及非書、非刊等類型多樣性特征外,還具備紙質(zhì)、磁帶與數(shù)字化等載體多樣性特征。數(shù)量豐富、類型與載體格式不同的館藏資源,在滿足讀者信息需求的同時(shí),也給圖書館增加了信息資源的組織成本。

元數(shù)據(jù)作為描述信息資源或數(shù)據(jù)本身特征和屬性的數(shù)據(jù),在信息資源的組織過程中發(fā)揮著重要作用。針對(duì)不同類型的信息資源,產(chǎn)生了大量的元數(shù)據(jù)體系,甚至同一資源類型因不同的應(yīng)用與管理需求,并存多種元數(shù)據(jù)體系。目前,信息資源描述中,有機(jī)讀目錄(Machine Readable Cataloging, MARC)、都柏林核心元數(shù)據(jù)(Dublin Core Metadata, DC元數(shù)據(jù))、編碼檔案著錄(Encoded Archival Description, EAD)、藝術(shù)作品描述目錄(Categories for the Description of Works of Art, CDWA)等多種元數(shù)據(jù)格式。元數(shù)據(jù)體系的多樣性和重疊現(xiàn)象不可避免地增加了資源描述成本,也影響了各種資源描述成果的共享和整合。

應(yīng)當(dāng)采用一種大家共同遵守的元數(shù)據(jù)體系,對(duì)各類型信息資源進(jìn)行語義與格式統(tǒng)一的元數(shù)據(jù)描述。狹義的資源統(tǒng)一描述,指大家都采用同一種元數(shù)據(jù)體系,實(shí)現(xiàn)多種類型信息資源的描述。廣義的資源統(tǒng)一描述,是忽略前期采用的哪種元數(shù)據(jù)體系描述信息資源,只要求這些元數(shù)據(jù)在對(duì)外呈現(xiàn)或發(fā)布時(shí),轉(zhuǎn)換或二次加工為大家共同遵守的元數(shù)據(jù)體系。由于涉及既有元數(shù)據(jù)成果的繼承與轉(zhuǎn)換,及現(xiàn)有信息系統(tǒng)的改造,廣義上的資源統(tǒng)一描述更是業(yè)界當(dāng)前思考的重點(diǎn)。當(dāng)然,對(duì)于全新的信息系統(tǒng)與數(shù)據(jù)建設(shè)者來說,直接采用狹義的資源統(tǒng)一描述策略與體系,更能降低資源描述和轉(zhuǎn)換成本,輕易實(shí)現(xiàn)元數(shù)據(jù)的互操作性,促進(jìn)信息共享、交換及整合。

1 ?傳統(tǒng)元數(shù)據(jù)資源描述概述

1.1 ?傳統(tǒng)元數(shù)據(jù)資源描述的現(xiàn)狀

圖書情報(bào)界主要從語義互操作、語法互操作、結(jié)構(gòu)互操作及應(yīng)用協(xié)議4個(gè)方面提出了元數(shù)據(jù)互操作的多個(gè)解決方案[1]。

借助計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)行業(yè)國際標(biāo)準(zhǔn),在語法互操作層面,有采用文檔類型定義(Document Type Definition, DTD)或模式(Schema)約束的可擴(kuò)展標(biāo)記語言(Extensible Markup Language, XML)等解決方案;在結(jié)構(gòu)互操作層面,有資源描述框架(Resource Description Framework, RDF)等解決方案;在應(yīng)用協(xié)議層面,有Z39.50、開放檔案協(xié)議(Open Archives Initiative, OAI)等解決方案。這些成熟、并容易被計(jì)算機(jī)理解與實(shí)現(xiàn)的解決方案,完全可以滿足圖書情報(bào)界在資源統(tǒng)一描述和元數(shù)據(jù)互操作性上的需求。

但是,在元數(shù)據(jù)的語義互操作層面,目前尚無一個(gè)廣泛認(rèn)可的、足以保障對(duì)各類型信息資源進(jìn)行語義與格式統(tǒng)一的元數(shù)據(jù)描述方案。目前采用元數(shù)據(jù)映射解決方案已成為一種共識(shí),即從語義和應(yīng)用功能角度,建立2種甚至多種元數(shù)據(jù)間的對(duì)照關(guān)系,從而實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換或映射檢索。目前已有大量的轉(zhuǎn)換程序,供若干流行元數(shù)據(jù)格式之間的轉(zhuǎn)化使用,例如DC元數(shù)據(jù)與美國機(jī)讀目錄(United States Machine Readable Cataloging, USMARC)、DC元數(shù)據(jù)與EAD等[2]。應(yīng)用層面,也有基于轉(zhuǎn)換后的DC元數(shù)據(jù)而提供服務(wù)的OAI項(xiàng)目。

1.2 ?傳統(tǒng)元數(shù)據(jù)資源描述的不足

傳統(tǒng)元數(shù)據(jù),比如MARC的元數(shù)據(jù)編碼體系結(jié)構(gòu)復(fù)雜、關(guān)系不明、標(biāo)記元素眾多,而新型元數(shù)據(jù),如都柏林核心元數(shù)據(jù)元素集(Dublin Core Metadata Element Set, DCMES)又過于原則化與抽象化,沒有也不會(huì)針對(duì)具體應(yīng)用推出更多的核心元素與限定修飾詞,更不會(huì)指定DCMES的編碼格式。所以,在映射轉(zhuǎn)換中,常常出現(xiàn)語義無法對(duì)應(yīng)或無法一一對(duì)應(yīng),導(dǎo)致信息丟失的現(xiàn)象。再加上元數(shù)據(jù)格式眾多,針對(duì)它們分別建立兩兩映射關(guān)系所需要的工作量和協(xié)調(diào)成本會(huì)急劇上升。針對(duì)這種多格式映射的難題,人們提出以一種元數(shù)據(jù)格式為中心,其他格式都向這一格式映射的星形映射方式改進(jìn)方案。目前公認(rèn)讓各方容易接受的中心元數(shù)據(jù)格式是DC元數(shù)據(jù),各元數(shù)據(jù)都統(tǒng)一轉(zhuǎn)換為DC元數(shù)據(jù)后實(shí)現(xiàn)匯總,比如OAI項(xiàng)目[1]。

OAI首先是一種計(jì)算機(jī)協(xié)議,它約定了元數(shù)據(jù)的檢索與獲取的接口和調(diào)用方式,并非圖書情報(bào)界專有。OAI不關(guān)心數(shù)據(jù)提供者內(nèi)部元數(shù)據(jù)的格式,僅要求數(shù)據(jù)提供者能夠?qū)⒆约旱脑獢?shù)據(jù)以DC元數(shù)據(jù)15個(gè)核心元素的方式向外提供。OAI這類星形映射方案,且映射為DC元數(shù)據(jù)15個(gè)核心元素的映射方案,雖然降低了映射難度——將多格式映射等價(jià)為一組兩兩映射,將格式復(fù)雜且語義豐富的元數(shù)據(jù)映射成格式與語義都簡單的元數(shù)據(jù),但也正是這種簡單化,無法保障元數(shù)據(jù)的無損轉(zhuǎn)換,造成更多信息無法被共享與整合。

2 ?關(guān)于DC元數(shù)據(jù)

2.1 ?DC元數(shù)據(jù)帶來的困惑

DC元數(shù)據(jù)是致力于規(guī)范網(wǎng)絡(luò)資源體系結(jié)構(gòu)的國際性元數(shù)據(jù)解決方案,它定義了一個(gè)所有網(wǎng)絡(luò)資源都應(yīng)遵循的、通用的核心標(biāo)準(zhǔn)。因?yàn)樗耐ㄓ眯?、核心性、可擴(kuò)展性的特征,得到了廣泛認(rèn)可,現(xiàn)已成為深具影響力的國際標(biāo)準(zhǔn)[3]。然而近年來,圖書館界對(duì)DC元數(shù)據(jù)到底能做什么還是比較困惑。因?yàn)椤皠傂浴钡脑獢?shù)據(jù)方案(例如MARC),有著成熟的國際標(biāo)準(zhǔn)書目著錄(International Standard Bibliographic Description, ISBD)規(guī)范,需要描述資源的哪些內(nèi)容與形態(tài)特征、用哪些元素(字段或子字段)去描述皆有據(jù)可查、拿來即用,也有成熟的配套系統(tǒng)[3]。所以,面對(duì)只有原則、指導(dǎo)方針和框架的DC元數(shù)據(jù),無論是資源描述標(biāo)引工作人員,還是系統(tǒng)開發(fā)設(shè)計(jì)人員,都有無從下手的迷茫感。導(dǎo)致這個(gè)影響深遠(yuǎn)、多方認(rèn)可的元數(shù)據(jù)方案,卻在最注重信息資源描述的圖書館界無法推廣與普及。

2.2 ?DC元數(shù)據(jù)的價(jià)值

屈指可數(shù)的15個(gè)核心元素,及有限的語義限定和編碼限定詞,讓習(xí)慣于MARC成百上千字段與子字段的資源描述者找不到映射關(guān)系,多有“DC元數(shù)據(jù)只能簡單編目”的錯(cuò)誤觀感與認(rèn)知。正是為了突破之前針對(duì)一種或有限幾種資源的元數(shù)據(jù)方案的局限性,欲使DC元數(shù)據(jù)更具通用性和適用性,使之承擔(dān)起跨類型與跨載體格式的信息資源統(tǒng)一描述功能的設(shè)計(jì)初衷和“野心”,才讓DC元數(shù)據(jù)體系更注重從語義層面、原則層面指導(dǎo)應(yīng)用,而非針對(duì)具體應(yīng)用具象化和形式化。

所以,正確理解DC元數(shù)據(jù)的相關(guān)原則,才能在具體應(yīng)用中,遵循DC元數(shù)據(jù)原則并自行擴(kuò)展(也包括縮?。┵Y源描述規(guī)范,采用合理的元數(shù)據(jù)結(jié)構(gòu)化組織方案(規(guī)范的數(shù)據(jù)格式),從而既滿足不同應(yīng)用中的資源描述需求,又保障各方元數(shù)據(jù)遵循同一個(gè)元數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范。

3 ?基于DC元數(shù)據(jù)的資源統(tǒng)一描述策略

由于DC元數(shù)據(jù)具有簡單性、可擴(kuò)展性、可修改性和可選擇性原則,借助DC元數(shù)據(jù),圖書館可對(duì)館藏資源進(jìn)行統(tǒng)一描述,促進(jìn)館藏資源信息的共享與整合,更有效地解決在網(wǎng)絡(luò)中查找信息資源的問題。在圖書的資源描述方面,可以使用基于XML的DC元數(shù)據(jù)組織技術(shù)。遵循DC元數(shù)據(jù)一一對(duì)應(yīng)原則,一個(gè)著錄對(duì)象著錄一個(gè)元數(shù)據(jù),提高著錄效率。同時(shí),通過不同元數(shù)據(jù)的關(guān)聯(lián)引用,形成諸如資源描述與檢索(Resource Description & Access, RDA)需要的信息關(guān)聯(lián)的標(biāo)引與整合效果。

3.1 ?描述元素核心化策略

DC元數(shù)據(jù)的簡單性原則,要求定義一個(gè)能得到廣泛應(yīng)用、被全球所理解和接受的小元素集,并能作為特殊用戶詳細(xì)描述需求的一個(gè)核心集[3]。這個(gè)原則的核心價(jià)值在于,將資源描述對(duì)象分成各個(gè)語義互不重疊、互不交叉的描述層面或著錄項(xiàng),1個(gè)描述層面或著錄項(xiàng)采用1個(gè)標(biāo)記元素進(jìn)行標(biāo)記。

雖然DC元數(shù)據(jù)只確定了15個(gè)涵蓋面最廣、能得以公認(rèn)的核心元素,但DC元數(shù)據(jù)的可擴(kuò)展原則指出,可以DC元數(shù)據(jù)核心元素集為基礎(chǔ),并為適應(yīng)各領(lǐng)域資源描述需要而擴(kuò)展或自定義別的元素。當(dāng)然,這些擴(kuò)展或自定義的元素也需要符合DC元數(shù)據(jù)的簡單性原則,即語義要與DC元數(shù)據(jù)核心元素及其它擴(kuò)展或自定義元素相對(duì)獨(dú)立。

與MARC對(duì)資源的同一描述層面(如各種題名信息)采用多個(gè)標(biāo)記字段或子字段進(jìn)行資源描述標(biāo)記的元數(shù)據(jù)體系相比,DC元數(shù)據(jù)的標(biāo)記元素確立原則顯然更具針對(duì)性與準(zhǔn)確性,也極大地降低了資源描述與理解的成本和難度。

所以,在行業(yè)應(yīng)用中,針對(duì)特定資源進(jìn)行描述時(shí),首先應(yīng)該保證描述元素核心化的描述策略。例如,在書目元數(shù)據(jù)中,應(yīng)該將傳統(tǒng)的“正題名”“并列題名”“副題名”“叢書名”“書脊題名”等各種與題名信息相關(guān)的標(biāo)記元素,核心化或抽象化為1個(gè)“題名”元素。結(jié)合DC元數(shù)據(jù)的簡單性原則和可選擇性原則,語義獨(dú)立的、有限的核心元素,就可以低成本實(shí)現(xiàn)資源的簡單描述了。

3.2 ?描述元素可修飾或可限定策略

DC元數(shù)據(jù)的可修改性原則,是指在具體應(yīng)用中,可以對(duì)DC元數(shù)據(jù)元素集中的任何元素進(jìn)行進(jìn)一步修飾或限定,但不能擴(kuò)大或改變?cè)氐幕菊Z義[3]。即元素是某個(gè)信息面全部的語義集合標(biāo)記,其“修飾”或“限定”后的語義只是這個(gè)語義集合范疇中的子集,根據(jù)需要,可以從多個(gè)角度、多種粒度對(duì)元素所標(biāo)記的語義實(shí)現(xiàn)精致、細(xì)化或取值限定。所以,正確理解這個(gè)原則,可以消除DC元數(shù)據(jù)不能滿足圖書館復(fù)雜的書目描述需求的常見誤會(huì)。

雖然前例中,將所有與題名信息相關(guān)的標(biāo)記元素核心化為1個(gè)“題名”元素后,肯定無法實(shí)現(xiàn)題名細(xì)節(jié)的描述與表達(dá)。但根據(jù)元素可修飾與可限定的統(tǒng)一描述策略,可以制定相應(yīng)的語義修飾或限定詞表,及決定采用哪些編碼取值體系并據(jù)此取值,從而實(shí)現(xiàn)“題名”這個(gè)核心元素的語義精致(細(xì)化)或編碼取值體系聲明。

圖書館人熟知的“題名”著錄項(xiàng)中的“題名(正的)”“題名(另一著者的)”“題名(副的)”“題名(并列的)”“題名(分輯的)”等著錄細(xì)節(jié),括號(hào)中的詞匯就可視為“題名”元素的語義修飾或限定詞。而“題名(拼音形式)”,括號(hào)中的“拼音形式”,就可視為“題名”元素的編碼體系修飾或限定詞(即聲明采用漢語拼音這種規(guī)范體系或格式對(duì)資源“題名”信息進(jìn)行描述)。可以看出,在修飾或限定詞的輔助下,基于DC元數(shù)據(jù)的新型元數(shù)據(jù),可以實(shí)現(xiàn)與MARC元數(shù)據(jù)的一一對(duì)應(yīng)與映射。

根據(jù)需要,可以對(duì)元素不作修飾或限定,也可以只對(duì)元素作語義修飾或限定,或者只對(duì)元素作編碼體系修飾或限定,當(dāng)然也可以對(duì)元素同時(shí)采用語義和編碼體系的修飾或限定。根據(jù)描述元素可修飾與可限定策略,按需規(guī)劃并確定好元素的語義修飾或限定詞表、編碼體系修飾或限定詞表(體系名稱或標(biāo)識(shí)符,并據(jù)此規(guī)范取值),保證任何粒度的資源描述實(shí)現(xiàn)。

3.3 ?元數(shù)據(jù)結(jié)構(gòu)化與可伸縮化策略

盡管DC元數(shù)據(jù)體系理念非常先進(jìn),但沒有特定的元數(shù)據(jù)結(jié)構(gòu)化組織方案就不可能實(shí)用化,也無法體現(xiàn)出它的先進(jìn)性與獨(dú)特性。眾所周知,越結(jié)構(gòu)化的數(shù)據(jù),計(jì)算機(jī)越容易理解,信息間的關(guān)系越清晰、語義越明確。XML作為目前公認(rèn)最具結(jié)構(gòu)化的數(shù)據(jù)格式和互聯(lián)網(wǎng)標(biāo)準(zhǔn),包括DC元數(shù)據(jù)在內(nèi)的多種元數(shù)據(jù)標(biāo)準(zhǔn)也多采用XML作為其編碼方案。借助XML的元素、屬性概念與數(shù)據(jù)結(jié)構(gòu),很容易構(gòu)建出高度結(jié)構(gòu)化且語義表達(dá)彈性伸縮的資源統(tǒng)一描述策略[3]。例如:

UKOLN

UK Office for Library

當(dāng)不清楚是否需要對(duì)“UK Office for Library”這個(gè)題名信息啟用語義限定或啟用什么語義限定詞時(shí),忽略這個(gè)數(shù)據(jù)結(jié)構(gòu)中的refinement屬性即可(這個(gè)refinement屬性名稱,與元數(shù)據(jù)無關(guān),僅從數(shù)據(jù)結(jié)構(gòu)層面體現(xiàn)出元數(shù)據(jù)的語義限定信息,所以,是否采用或更換這個(gè)屬性名稱,各應(yīng)用可視情況而定)。

與采用XML元素屬性結(jié)構(gòu)來表達(dá)元數(shù)據(jù)元素的語義限定一樣,元數(shù)據(jù)元素的編碼限定也應(yīng)該采用XML元素屬性結(jié)構(gòu)實(shí)現(xiàn)表達(dá)。類似自定義的refinement屬性名,應(yīng)用中也可以自定義另1個(gè)屬性名,用其值來聲明具體的編碼限定體系(表達(dá)元素已被編碼限定)。推薦:作為XML的規(guī)范與模式約束,結(jié)合XML Schema這個(gè)標(biāo)準(zhǔn)中的數(shù)據(jù)類型派生(取值限定)表達(dá),直接在XML數(shù)據(jù)結(jié)構(gòu)中,采用業(yè)界熟知的xsi:type屬性名比自定義屬性名更容易讓人理解與接受。例如:

騎士的故事

qi shi de gu shi

這樣的數(shù)據(jù)結(jié)構(gòu),可以清晰表明“qi shi de gu shi”這是題名的描述信息,是采用漢語拼音體系而非其它可能的語種、注音或字母體系,避免了可能有的歧義和沖突。

甚至,結(jié)合XML標(biāo)準(zhǔn)中的xml:lang屬性、xml:id屬性,在有需要時(shí),就可以滿足添加或忽略描述語種、實(shí)現(xiàn)描述元素間的關(guān)聯(lián)表達(dá)(id引用或交叉引用)的需求。

騎士的故事

The Knights Tale

qi shi de gu shi

XML的元素、元素屬性,是獨(dú)立于元數(shù)據(jù)體系、屬于數(shù)據(jù)結(jié)構(gòu)化、屬于計(jì)算機(jī)技術(shù)層面的表達(dá)與實(shí)現(xiàn),不會(huì)對(duì)資源的元數(shù)據(jù)描述帶來干擾和增加成本。所以,選擇與設(shè)計(jì)一個(gè)清晰和無歧義、穩(wěn)定和可伸縮的元數(shù)據(jù)編碼結(jié)構(gòu)的資源統(tǒng)一描述策略,會(huì)輔助元數(shù)據(jù),實(shí)現(xiàn)資源的描述和信息揭示。

3.4 ?資源描述對(duì)象單一化策略

RDA是應(yīng)數(shù)字環(huán)境的發(fā)展而制定的最新國際編目規(guī)則,力求涵蓋當(dāng)前數(shù)字環(huán)境中所有內(nèi)容類型和媒介類型的資源,從一般到特殊,為不同類型的文獻(xiàn)資源提供著錄和檢索的統(tǒng)一方法。為了更深入、詳細(xì)、直白地揭示信息資源,RDA在對(duì)英美編目規(guī)則第二版(Anglo-American Cataloguing Rules, 2nd Edition, AACR2)做了相應(yīng)的調(diào)整與改進(jìn)的同時(shí),更是以書目記錄的功能需求(Functional Requirements for Bibliographic Records, FRBR)提出的實(shí)體-關(guān)系模型(Entity-Relationship model, E-R)概念模型為基礎(chǔ),通過“識(shí)別”和“關(guān)聯(lián)”,將館藏資源分成作品、內(nèi)容表達(dá)、載體表現(xiàn)和單件4個(gè)層次,分別記錄實(shí)體、屬性、實(shí)體間的關(guān)系[4]。

強(qiáng)調(diào)資源描述對(duì)象間的關(guān)系,及資源描述對(duì)象與其屬性的關(guān)系,是RDA順應(yīng)資源統(tǒng)一描述與統(tǒng)一檢索需求的創(chuàng)新思路。然而,RDA只是一套編目規(guī)則,或者說“內(nèi)容標(biāo)準(zhǔn)”,數(shù)據(jù)格式與元數(shù)據(jù)觀念不更新,再好的目標(biāo)也無法實(shí)現(xiàn)。事實(shí)上,在現(xiàn)有MARC元數(shù)據(jù)體系下,依靠擴(kuò)展或調(diào)整元數(shù)據(jù)的標(biāo)記字段或子字段,依靠規(guī)范描述細(xì)節(jié)要求,MARC元數(shù)據(jù)既有的局限仍會(huì)繼續(xù)影響資源描述的應(yīng)用。甚至,如果只理解RDA就只是增加了著錄項(xiàng)和著錄對(duì)象,這種同時(shí)面對(duì)多種資源對(duì)象的描述工作,必然增加RDA著錄理解成本和著錄難度。這也是采用RDA實(shí)現(xiàn)資源描述至今尚未普及的原因。

在資源統(tǒng)一描述中,堅(jiān)持資源描述對(duì)象單一化的策略,可以很好地推動(dòng)RDA目標(biāo)的實(shí)現(xiàn)。DC元數(shù)據(jù)的一對(duì)一原則,即每個(gè)資源都應(yīng)該有一條單獨(dú)的(discrete)元數(shù)據(jù)描述,而每一條元數(shù)據(jù)描述所包含的元素必須與1個(gè)單獨(dú)的資源相關(guān)聯(lián)?;诖隧?xiàng)原則,目前通常認(rèn)為1條元數(shù)據(jù)描述應(yīng)該只描述1個(gè)資源對(duì)象(雖然1個(gè)資源對(duì)象不一定只有1條元數(shù)據(jù))。因?yàn)橛?條元數(shù)據(jù)同時(shí)描述其各種載體表現(xiàn),或?yàn)榱怂^的統(tǒng)一描述與檢索需要,在1條元數(shù)據(jù)中還涉及與當(dāng)前描述對(duì)象相關(guān)的其它資源對(duì)象的描述,會(huì)帶來資源描述成本的增加、數(shù)據(jù)冗余及管理和長期保存上的嚴(yán)重問題[3]。

1條RDA目錄中可能涉及到內(nèi)容信息、紙質(zhì)館藏信息、數(shù)字化信息、責(zé)任者信息、它包括的部分對(duì)象信息、包含它的對(duì)象信息等。信息內(nèi)容豐富的同時(shí),也極大地增加了著錄難度與成本。其實(shí),更科學(xué)合理的資源描述理念與管理方式應(yīng)該是:對(duì)紙質(zhì)館藏對(duì)象進(jìn)行描述,對(duì)數(shù)字化對(duì)象進(jìn)行描述,對(duì)人物或機(jī)構(gòu)對(duì)象進(jìn)行描述,分別形成1條元數(shù)據(jù);對(duì)其它相關(guān)的對(duì)象,也同樣獨(dú)立地進(jìn)行描述,形成1條元數(shù)據(jù)。然后,通過計(jì)算機(jī)系統(tǒng)或著錄工具,實(shí)現(xiàn)這些不同元數(shù)據(jù)的參考引用,并綁定相關(guān)的引用標(biāo)識(shí)。

每條元數(shù)據(jù),都可以根據(jù)需要靈活選擇不同的元數(shù)據(jù)標(biāo)識(shí)體系并據(jù)其取值,甚至可以同時(shí)采用多種標(biāo)識(shí)體系并據(jù)其取值。包括國際標(biāo)準(zhǔn)書號(hào)(International Standard Book Number, ISBN)、統(tǒng)一資源定位符(Uniform Resource Locator, URL)、數(shù)字對(duì)象標(biāo)識(shí)(Digital Object Identifier, DOI)及自定義的多種標(biāo)識(shí)體系。遵照前述,在資源唯一標(biāo)識(shí)元素dc:identifier中,采用這些具備唯一性特征的編碼體系,在實(shí)際應(yīng)用中計(jì)算機(jī)系統(tǒng)就能準(zhǔn)確尋找到對(duì)應(yīng)元數(shù)據(jù),例如,以下標(biāo)識(shí)符表達(dá)方式都是合理的:

9788888888888

http://example.com/search?GeoffreyChaucer

10.3969/j.issn.7788-8877.2015.02.009

7788xyz

在針對(duì)《騎士的故事》這種圖書的元數(shù)據(jù)描述中,根據(jù)dc:contributor元素的語義限定詞,知道是“著者”的描述信息,根據(jù)“URL”這個(gè)編碼體系聲明,知道著者的描述信息可以通過URL方式對(duì)應(yīng)獲取,即可引導(dǎo)訪問者查看人物或機(jī)構(gòu)規(guī)范庫中的著者描述元數(shù)據(jù),從而獲得著者的詳細(xì)信息。同理,通過查找ISBN號(hào)“9788888888888”,可以獲得包含當(dāng)前資源對(duì)象的另一個(gè)資源對(duì)象的詳細(xì)信息;通過URL標(biāo)識(shí)值,可以獲得另一個(gè)載體格式版本資源對(duì)象的詳細(xì)信息;通過DOI標(biāo)識(shí)值,可以獲得引用過當(dāng)前資源對(duì)象的另一個(gè)資源對(duì)象的信息;甚至根據(jù)應(yīng)用需要,可以實(shí)現(xiàn)多個(gè)資源間的各種特定關(guān)系的描述,并引導(dǎo)獲取相應(yīng)的資源描述信息:

騎士的故事

http://example.com/search?GeoffreyChaucer

9788888888888

http://example.com/search?KnightsTale

10.3969/ j.issn.7788-8877.2015.02.009

7788xyz

從以上可以看出,在堅(jiān)持資源描述對(duì)象單一化的策略指導(dǎo)下,可以實(shí)現(xiàn)一個(gè)描述(元數(shù)據(jù)),多次、多方關(guān)聯(lián)和調(diào)用,極大地降低了數(shù)據(jù)冗余與資源描述成本。

4 ?小結(jié)

采用一種大家共同遵守的元數(shù)據(jù)體系,對(duì)各類型信息資源進(jìn)行語義與格式統(tǒng)一的元數(shù)據(jù)描述是完全可行的。在這種策略指導(dǎo)下,可以對(duì)OAI與RDA進(jìn)行低成本、高效率地改造,有助于其應(yīng)用與推廣,更有助于早日實(shí)現(xiàn)資源共享、信息整合的業(yè)界目標(biāo)。目前,DC元數(shù)據(jù)在數(shù)字圖書館建設(shè)中的應(yīng)用越來越多,中國國家圖書館以DC元數(shù)據(jù)制作了大量的數(shù)字化資源,上海圖書館與清華大學(xué)也參與了聯(lián)機(jī)計(jì)算機(jī)圖書館中心(Online Computer Library Center, OCLC)基于都柏林核心元數(shù)據(jù)元素集的合作聯(lián)機(jī)資源目錄(Co-operative Online Resource Catalog, CORC)計(jì)劃,另外還有清華大學(xué)建筑數(shù)字圖書館、北京大學(xué)圖書館古籍拓片數(shù)據(jù)庫等[5],相信DC元數(shù)據(jù)在圖書館的應(yīng)用前景一定會(huì)更廣闊。

參考文獻(xiàn)

[1] 朱超.關(guān)于元數(shù)據(jù)互操作的探討[J].情報(bào)理論與實(shí)踐,2005,28(6): 644-647,655.

[2] DAY M. Mapping between metadata formats[EB/OL].[2019-12-04]. http://www.ukoln.ac.uk/metadata/interoperability/.

[3] 劉煒,樓向英,趙亮.DC元數(shù)據(jù)的歷史、現(xiàn)狀及未來[EB/OL]. ?[2019-10-16].http://www.libnet.sh.cn/sztsg/fulltext/reports/ 2005/DC元數(shù)據(jù)_overview.pdf.

[4] 葛紅梅,徐晶晶,董鵬.資源描述與檢索(RDA)書目數(shù)據(jù)在圖書館編目中的應(yīng)用[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2015,24(2):38-42.

[5] 黃星亮.都柏林核心元數(shù)據(jù)及其在我國數(shù)字圖書館建設(shè)中的應(yīng)用[J].津圖學(xué)刊,2002(3):17-19,24.

(收稿日期:2020-01-13)

(修回日期:2020-03-16;編輯:魏民)

猜你喜歡
元數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)資源管理
國企改革中政工工作與人力資源管理的融合推進(jìn)
電信管線資源管理系統(tǒng)在規(guī)劃設(shè)計(jì)中的應(yīng)用
數(shù)據(jù)結(jié)構(gòu)線上線下混合教學(xué)模式探討
重典型應(yīng)用,明結(jié)構(gòu)關(guān)系
強(qiáng)化國土資源管理,調(diào)控土地交易行為
企業(yè)戰(zhàn)略人力資源管理策略
基于來源的組織機(jī)構(gòu)元數(shù)據(jù)構(gòu)建研究
元數(shù)據(jù)與社會(huì)化標(biāo)簽在微視頻搜索中的應(yīng)用
高等院校智慧校園建設(shè)規(guī)劃與實(shí)現(xiàn)
數(shù)據(jù)結(jié)構(gòu)與算法課程設(shè)計(jì)教學(xué)模式的探討
黑水县| 阿拉尔市| 莱芜市| 城步| 沽源县| 个旧市| 九龙县| 克东县| 拉萨市| 清镇市| 宁都县| 阿克陶县| 汪清县| 呈贡县| 视频| 泰兴市| 临潭县| 文成县| 淳安县| 彰武县| 任丘市| 新平| 泌阳县| 胶州市| 溧阳市| 额尔古纳市| 东乡县| 泉州市| 涞源县| 双桥区| 信丰县| 宁夏| 上犹县| 谢通门县| 临邑县| 建宁县| 防城港市| 西盟| 仲巴县| 砚山县| 江陵县|