国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

元數(shù)據(jù)在數(shù)字圖書館中的應(yīng)用

2011-07-09 01:44:10那旭東
關(guān)鍵詞:修飾詞檢索對象

那旭東

(長春工業(yè)大學(xué)圖書館,吉林長春 130012)

1 數(shù)字圖書館中元數(shù)據(jù)的產(chǎn)生

隨著計算機技術(shù)、因特網(wǎng)的迅猛發(fā)展,人類知識信息資源的海量增加,數(shù)字化信息正以前所未有的速度不斷增加,人們獲取知識信息的方式也隨之發(fā)生了巨大變化,數(shù)字圖書館也就應(yīng)運而生,并逐步由傳統(tǒng)圖書館向數(shù)字圖書館過渡轉(zhuǎn)變。

圖書館原來那種一成不變的管理方式已經(jīng)適應(yīng)不了以動態(tài)和開放為特征的新型方式,因此,整個圖書館的管理模式、工作環(huán)境、作業(yè)流程及服務(wù)手段都會隨之改變,圖書館通過搭建數(shù)字應(yīng)用系統(tǒng)平臺,對數(shù)字信息資源進行采集、加工整理并提供服務(wù),圖書館與讀者之間的供需關(guān)系變得更加密切,一切與知識資源相關(guān)的要素都將被有機地整合起來,形成一種面向需求、適應(yīng)變化的圖書館知識管理機制。在這種不斷變化的新環(huán)境下,元數(shù)據(jù)作為一種有效的資源描述方法便會越來越顯示出它的重要性和實用性。

2 元數(shù)據(jù)的概念

元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù)[1],專門用來描述數(shù)據(jù)的內(nèi)容、特征和屬性,并對數(shù)據(jù)進行管理,結(jié)構(gòu)化的數(shù)據(jù)是數(shù)字圖書館信息組織的根本。具體概括起來,元數(shù)據(jù)對資源對象的作用主要有描述和管理兩個方面。

2.1 與元數(shù)據(jù)有關(guān)的相關(guān)概念

2.1.1 描述元數(shù)據(jù)

描述元數(shù)據(jù)用于描述或標識信息資源對象的內(nèi)容、屬性和外觀特征,并對這個對象進行定位、管理,且有助于發(fā)現(xiàn)與獲取數(shù)據(jù)。由于描述元數(shù)據(jù)屬于應(yīng)用范圍最廣、應(yīng)用頻率最高的元數(shù)據(jù)類型,通常也可以把描述元數(shù)據(jù)直接稱為元數(shù)據(jù)。針對每一個具體的數(shù)字資源的元數(shù)據(jù),也稱為元數(shù)據(jù)記錄。描述元數(shù)據(jù)是整個元數(shù)據(jù)體系中最主要的元數(shù)據(jù),應(yīng)用廣泛,可以根據(jù)不同的學(xué)科、主題、資源類型、用途等編制不同的描述元數(shù)據(jù)標準。

2.1.2 元數(shù)據(jù)元素項

一個元數(shù)據(jù)由許多完成不同功能的具體數(shù)據(jù)描述項構(gòu)成,這些具體的數(shù)據(jù)描述項又稱元數(shù)據(jù)元素項或元素。如題名、責(zé)任者、日期、唯一標識符等都是元數(shù)據(jù)中的元素。

2.1.3 修飾詞

修飾詞是組成元素的最小術(shù)語單位。包括:

語義修飾詞:簡稱修飾詞,對元素的語義進行修飾,提高元素的專指性和精確性。

編碼體系修飾詞:用來幫助某個術(shù)語值的上下文信息或解析規(guī)則。其形式包括受控詞表、規(guī)范表或者解析規(guī)則。

2.1.4 描述元數(shù)據(jù)規(guī)范

描述元數(shù)據(jù)規(guī)范也可以稱元數(shù)據(jù)規(guī)范、元數(shù)據(jù)標準,是描述某類資源的具體對象時所有規(guī)則的集合。一般包括完整描述一個具體對象時所需要的數(shù)據(jù)項集合,以及數(shù)據(jù)項的語義定義、著錄規(guī)則和計算機應(yīng)用時的語法規(guī)則。

2.1.5 元數(shù)據(jù)規(guī)范設(shè)計指南

元數(shù)據(jù)規(guī)范設(shè)計指南是設(shè)計制定某類特定資源所用的元數(shù)據(jù)規(guī)范需要遵照的規(guī)則和方法。元數(shù)據(jù)規(guī)范設(shè)計指南是抽象化的元數(shù)據(jù),它從更高層次上規(guī)定了元數(shù)據(jù)的功能、結(jié)構(gòu)、格式、設(shè)計方法、擴展規(guī)則、語義語法規(guī)則、元數(shù)據(jù)規(guī)范的結(jié)構(gòu)格式等多方面的內(nèi)容,以保證各種元數(shù)據(jù)規(guī)范的一致性和整體性,在更大范圍內(nèi)實現(xiàn)數(shù)字圖書館之間的互操作和數(shù)據(jù)共享。

2.2 元數(shù)據(jù)的結(jié)構(gòu)

元數(shù)據(jù)的結(jié)構(gòu)主要指內(nèi)容結(jié)構(gòu)、語法結(jié)構(gòu)和語義結(jié)構(gòu)。

內(nèi)容結(jié)構(gòu)是指元數(shù)據(jù)的元素、修飾詞及其屬性、定義,其中可包含用于描述的通用的核心元素,用于描述某一類型資源的資源類型核心元素,用于描述某個具體對象的個別元素,以及揭示對象標識、版權(quán)等內(nèi)容的管理性元素。

語法結(jié)構(gòu)是指元數(shù)據(jù)的格式結(jié)構(gòu)及其描述方式。例如用于文本編碼的內(nèi)容元數(shù)據(jù)TEI就包含了4個部分:頭標、正文前內(nèi)容、正文、正文后附錄。目前,主要是采用XML語言和RDF框架用于標識和描述元數(shù)據(jù)的這種格式結(jié)構(gòu)。

語義結(jié)構(gòu)主要是指元數(shù)據(jù)的元素及其修飾詞的定義方法。在這方面可以借鑒采用ISO/IEC11179標準,按以下10個方面定義:

名稱(Name):元素名稱;

標識(Identifier):元素唯一標識;

版本(Version):產(chǎn)生該元素的元數(shù)據(jù)版本;

注冊機構(gòu)(Registration Authority):注冊元素的授權(quán)機構(gòu);

語言(Language):元素說明語言;

定義(Definition):對元素概念與內(nèi)涵的說明;

選項(Obligation):說明元素是限定必須使用的還是可選擇的(必備性);

數(shù)據(jù)類型(Data type):元素值中所表現(xiàn)的數(shù)據(jù)類型;

最大使用頻率(Maximum Occurrence):元素的最大使用頻次(可重復(fù)性);

注釋(Comment):元素應(yīng)用注釋,用于說明子元素情況[2]。

3 元數(shù)據(jù)在數(shù)字圖書館的應(yīng)用

數(shù)字圖書館是將圖像、文字、聲音等信息數(shù)字化,并通過網(wǎng)絡(luò)傳輸,從而使信息資源能夠全球共享[3]。簡單地說,數(shù)字圖書館就是以數(shù)字形式存儲和處理信息的圖書館[4]。對數(shù)字資源的組織和管理是數(shù)字圖書館建設(shè)的重點,元數(shù)據(jù)作為提供信息資源或數(shù)據(jù)的一種結(jié)構(gòu)化的編碼數(shù)據(jù),是其進行的基礎(chǔ)[5]。

數(shù)字圖書館無論在哪個環(huán)境和層面上,都與元數(shù)據(jù)密不可分,或者說元數(shù)據(jù)在數(shù)字圖書館中時刻都存在和發(fā)揮著作用。

3.1 元數(shù)據(jù)在數(shù)字資源建設(shè)中的作用

在數(shù)字資源產(chǎn)生、制作、管理、發(fā)布、保存的過程中,元數(shù)據(jù)在各個環(huán)節(jié)上發(fā)揮著作用。

3.1.1 元數(shù)據(jù)對數(shù)字對象的描述

即對具體對象的內(nèi)容和外觀特征進行格式化揭示和描述。例如一本數(shù)字化圖書的篇名、作者、出版者、大小等,以便于用戶的發(fā)現(xiàn)和尋找。

3.1.2 元數(shù)據(jù)對數(shù)字對象的管理

即對數(shù)字對象進行管理的相關(guān)信息的格式化揭示和描述,包括在檢索、存取與顯示一個數(shù)字對象時所需的管理信息,如對象的標識符;數(shù)字的權(quán)限管理如版權(quán)信息;文件的格式、大小、壓縮算法等特征;文件的上下文相關(guān)信息;在資源數(shù)字化或顯示、利用時的軟硬件環(huán)境信息等。

3.1.3 元數(shù)據(jù)對數(shù)字對象之間結(jié)構(gòu)的描述

一般來講,數(shù)字對象很少是一個實體的,通常來說是個復(fù)合對象。例如一篇數(shù)字格式的學(xué)位論文,有Word格式、PDF格式,PDF格式又分為供免費使用的文件以及必須經(jīng)過許可才能使用的全文文件,這樣一篇學(xué)位論文就對應(yīng)了3個實體對象,因此,需要對這些對象之間的關(guān)系和結(jié)構(gòu)進行格式化揭示、描述和組織。

3.1.4 元數(shù)據(jù)對數(shù)字對象保存的描述

當(dāng)資源需要存儲和長期保存時,就要對其制作信息、保護條件、轉(zhuǎn)換方式、遷移方法、仿真環(huán)境、封裝方法、保存責(zé)任以及其它相關(guān)技術(shù)細節(jié)進行描述和揭示。

3.2 元數(shù)據(jù)在數(shù)字圖書館服務(wù)中的作用

在用戶使用數(shù)字圖書館的過程中,元數(shù)據(jù)的主要作用是在門戶網(wǎng)站和應(yīng)用系統(tǒng)中支持對信息的檢索和發(fā)現(xiàn)。在這個過程中,元數(shù)據(jù)可以發(fā)揮如下的作用。

3.2.1 提供準確和快速的檢索

由于有了元數(shù)據(jù),可以通過字段檢索快速準確地得到檢索結(jié)果,而不是“全文檢索”后又要在大量的檢索結(jié)果中大海撈針一般尋找自己所需的信息。所謂字段檢索,即指定檢索詞出現(xiàn)的字段,是指在元數(shù)據(jù)中被標引過的,例如作者、文摘、主題詞、篇名、刊名、書名、出版者、出版年、圖像格式等。

3.2.2 提供知識導(dǎo)航功能

在數(shù)字圖書館門戶網(wǎng)站上為用戶建立基于某一知識體系的資源導(dǎo)航服務(wù),即由系統(tǒng)從元數(shù)據(jù)的某一特定字段中抽取相關(guān)內(nèi)容,并提供一個樹狀結(jié)構(gòu)的概念等級體系,用戶可以沿著這棵“樹”進入不同的分支,到達葉子節(jié)點,并在節(jié)點看到資源結(jié)果列表。

3.2.3 提供資源索引功能

資源索引功能是指將元數(shù)據(jù)中某一字段中的概念按字母順序線性排列起來,不分等級。用戶通過檢索可以定位在索引中的任意某個位置,并瀏覽在這個位置附近的所有詞語,進而查詢所需詞語對應(yīng)的結(jié)果列表。

3.2.4 在報道和揭示服務(wù)中的作用

元數(shù)據(jù)也可以對服務(wù)過程、服務(wù)項目等進行揭示和報道。例如,一個大學(xué)數(shù)字圖書館門戶網(wǎng)站的服務(wù)內(nèi)容元數(shù)據(jù)就包括:統(tǒng)一認證、書目檢索、統(tǒng)一檢索、學(xué)科導(dǎo)航、資源類型導(dǎo)航、全文獲取服務(wù)、咨詢服務(wù)、用戶培訓(xùn)、在線幫助、個性化定制、動態(tài)消息、網(wǎng)站介紹、網(wǎng)站索引、站內(nèi)檢索、相關(guān)鏈接等。這個門戶元數(shù)據(jù)既是設(shè)計數(shù)字圖書館門戶時使用的元數(shù)據(jù),也向用戶全面科學(xué)地揭示了數(shù)字圖書館的相關(guān)服務(wù)。

下面是用都柏林(Dublin Core)元數(shù)據(jù)對一篇網(wǎng)頁進行描述的實例。

3.2.5 在數(shù)字資源開放存取的作用

所謂“開放存取”是針對傳統(tǒng)的基于訂閱的出版模式而言的,即是指由作者直接在線出版論文,在互聯(lián)網(wǎng)公共領(lǐng)域里可以被免費獲取,允許用戶閱讀、下載、拷貝、傳遞、打印、檢索、超級鏈接,并為此建立索引或者用于其它任何合法用途[6]。它是基于互聯(lián)網(wǎng)的一種新型學(xué)術(shù)交流方式和出版模式[7],也是一種行之有效的學(xué)術(shù)出版模式,這其中包括正式發(fā)表論文的后印本,正式出版的著作、教材、會議論文集與研究報告等學(xué)術(shù)成果,非正式出版的論文的預(yù)印本、學(xué)位論文、工作論文、各種原始數(shù)據(jù)和元數(shù)據(jù)、教學(xué)參考資料、照片、圖表、地圖以及數(shù)據(jù)庫、政府出版物、網(wǎng)站等。

3.3 元數(shù)據(jù)在數(shù)字圖書館互操作性和可持續(xù)發(fā)展的作用

元數(shù)據(jù)揭示的是數(shù)字對象的內(nèi)容、特征和屬性,那么在元數(shù)據(jù)加工制作的過程中,就必須遵循相關(guān)的規(guī)則和格式,這些規(guī)則和格式的集合就是元數(shù)據(jù)規(guī)則。

隨著各種元數(shù)據(jù)標準的出現(xiàn),元數(shù)據(jù)的互操作性問題也就逐漸顯現(xiàn)出來。元數(shù)據(jù)的互操作性的好壞直接影響了各種不同信息資源的檢索、共享和互相兼容性。元數(shù)據(jù)的互操作主要是通過語義互操作和結(jié)構(gòu)與語法的互操作來實現(xiàn)的[8]。例如,以Dublin Core的15個核心元素為基礎(chǔ),使不同元數(shù)據(jù)中相似相近的元數(shù)據(jù)元素相互映射,從而實現(xiàn)了語義上的互操作。又比如資源描述框架RDF的制定為元數(shù)據(jù)在互聯(lián)網(wǎng)的應(yīng)用提供了一個基礎(chǔ)結(jié)構(gòu),使不同元數(shù)據(jù)間可以互相操作,可擴展標記語言XML,又為元數(shù)據(jù)在語法上提供了互通性,用RDF/XML創(chuàng)建元數(shù)據(jù)格式時,借用其它元數(shù)據(jù)集的一些元素,增加了元數(shù)據(jù)間語義的互通性,很容易就實現(xiàn)了互操作。

由于元數(shù)據(jù)規(guī)范的應(yīng)用,保持了元數(shù)據(jù)結(jié)構(gòu)的一致性,為信息的有效組織、元數(shù)據(jù)之間的互操作、元數(shù)據(jù)的廣泛應(yīng)用和共享奠定了基礎(chǔ),使數(shù)字圖書館的可持續(xù)發(fā)展成為可能。

數(shù)字圖書館作為信息時代的產(chǎn)物正處在篷勃發(fā)展的階段,而元數(shù)據(jù)是數(shù)字圖書館許多關(guān)鍵技術(shù)的基礎(chǔ),有了這個基礎(chǔ),數(shù)字圖書館的信息管理才能更趨合理化和科學(xué)化,資源的利用率也會大大提高。

[1] 王英芬.元數(shù)據(jù)模式組織網(wǎng)絡(luò)信息資源研究[J].農(nóng)業(yè)圖書情報學(xué)刊,2009(11):50-52.

[2] 肖瓏,趙亮.中文元數(shù)據(jù)概念與實例[M].北京:北京圖書館出版社,2007.

[3] 龔永紅.DC元數(shù)據(jù)及其在數(shù)字圖書館建設(shè)中的應(yīng)用[J].科技情報開發(fā)與經(jīng)濟,2010,20(31):78-80.

[4] 夏立新,黃曉斌.?dāng)?shù)字圖書館導(dǎo)論[M].北京:科學(xué)出版社,2009.

[5] 盧笑明,唐琳,李學(xué)鳴.元數(shù)據(jù)與圖書館數(shù)字資源組織管理[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2010(12):70-71.

[6] 陳紅星,張淑芳.網(wǎng)絡(luò)原生數(shù)字資源:概念特征與類型[J].圖書館學(xué)刊,2010(5):1-4.

[7] 關(guān)萍,吳立東.開放獲取運動在高校圖書館的發(fā)展策略[J].黑龍江科技信息,2010(35):188-189.

[8] 吳開華,邢春曉,羅德胤.?dāng)?shù)字圖書館元數(shù)據(jù)研究[J].中國圖書館學(xué)報,2002(3):43-46.

猜你喜歡
修飾詞檢索對象
神秘來電
睿士(2023年2期)2023-03-02 02:01:09
學(xué)加修飾詞
2019年第4-6期便捷檢索目錄
攻略對象的心思好難猜
意林(2018年3期)2018-03-02 15:17:24
我屬“懶”
基于熵的快速掃描法的FNEA初始對象的生成方法
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
區(qū)間對象族的可鎮(zhèn)定性分析
基于語料庫的中國英語學(xué)習(xí)者期刊論文中的弱化修飾詞研究
國際標準檢索
阿拉善左旗| 邮箱| 崇阳县| 鲜城| 阳山县| 天祝| 丹阳市| 新乡市| 广安市| 贞丰县| 健康| 类乌齐县| 塔城市| 安康市| 双峰县| 黑山县| 同德县| 望谟县| 龙山县| 杨浦区| 姜堰市| 和硕县| 枣阳市| 大宁县| 瑞丽市| 永新县| 克拉玛依市| 海口市| 离岛区| 平陆县| 长沙市| 冕宁县| 克拉玛依市| 常熟市| 珠海市| 曲阜市| 乡城县| 贞丰县| 嘉祥县| 永年县| 当雄县|