国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智慧型高校檔案信息檢索服務(wù)環(huán)境研究

2018-05-10 12:44:04張倩
山東檔案 2018年2期
關(guān)鍵詞:信息檢索知識(shí)庫(kù)檢索

文·張倩

高校積淀的檔案信息資源,記錄著其發(fā)展歷程的沿遷。高校檔案信息資源檢索體系是否健全,檔案信息檢索數(shù)據(jù)化、網(wǎng)絡(luò)化服務(wù)能力如何,制約著檔案信息資源的開發(fā)與利用。本研究緊密依托江蘇高校檔案信息化建設(shè)的基礎(chǔ)條件和探索經(jīng)驗(yàn),選用IT技術(shù)發(fā)展中的優(yōu)秀成果,從特點(diǎn)要素、功能模塊的智能化改造等方面,提出了一個(gè)較為完整的模擬性解決方案,幫助解決當(dāng)前高校檔案管理機(jī)構(gòu)所面臨的一些現(xiàn)實(shí)問題,努力營(yíng)造智慧型的高校檔案信息檢索服務(wù)環(huán)境。

一、高校檔案信息檢索的主要特點(diǎn)

江蘇不僅高校多,而且類型多,辦校的歷史大多比較悠久,特別是教育的質(zhì)量、科研的能力、辦學(xué)的效益和管理工作的水平都位于全國(guó)前列??梢哉f,江蘇高校檔案工作的發(fā)展?fàn)顩r,也是全國(guó)高校檔案整體發(fā)展的縮影??紤]到筆者與江蘇省內(nèi)高校檔案業(yè)界的專家、學(xué)者有多年良好的合作經(jīng)歷,因而選擇江蘇省30所高校檔案館(室)進(jìn)行問卷調(diào)研,通過調(diào)研對(duì)存在的問題進(jìn)行深入、系統(tǒng)的分析研究,具體了解高校檔案信息檢索建設(shè)的現(xiàn)狀,為進(jìn)一步研究和具體工作的開展,提供第一手的數(shù)據(jù)和資料。

表1 高校檔案管理機(jī)構(gòu)調(diào)研名單

調(diào)研結(jié)果顯示,江蘇省高校檔案信息檢索的主要特點(diǎn)體現(xiàn)在以下幾個(gè)方面:

(一)檢索工作體系基礎(chǔ)較好

江蘇省高校檔案管理機(jī)構(gòu)日臻完善,館藏檔案信息資源檢索工作體系建設(shè)已成為高?,F(xiàn)代化建設(shè)的重要組成部分。很多擁有悠久辦學(xué)歷史的高校,都已著手系統(tǒng)挖掘、開發(fā)校史文化資源,注重凝練、總結(jié)具有鮮明特色的學(xué)術(shù)傳統(tǒng)和文化氣脈,建立了形式多樣、內(nèi)涵豐富的檔案信息資源檢索體系,不僅擁有黨政管理、教學(xué)、科研、基建、聲像、會(huì)計(jì)、設(shè)備、實(shí)物等多門類檔案信息資源檢索數(shù)據(jù)庫(kù),還有名人全宗、口述校史訪談錄、特色學(xué)科檔案信息資源檢索數(shù)據(jù)庫(kù)等。

(二)檢索服務(wù)平臺(tái)初具雛形

江蘇省高校檔案管理機(jī)構(gòu)十分重視提升檔案管理信息化水平,開發(fā)與應(yīng)用檔案信息網(wǎng)絡(luò)檢索服務(wù)平臺(tái)的步伐明顯加快。據(jù)30家調(diào)查樣本反映:設(shè)立檔案檢索利用閱覽場(chǎng)所及設(shè)備的已占77%;檔案網(wǎng)站上有檢索端口的占66%;檔案檢索系統(tǒng)屬于B/S體系結(jié)構(gòu)的占60%、C/S體系結(jié)構(gòu)的占26%、單機(jī)版的占10%;建立檔案檢索相關(guān)規(guī)章制度的占47%;有檔案檢索相關(guān)智能技術(shù)開發(fā)專項(xiàng)經(jīng)費(fèi)的占30%。調(diào)研訪談中還發(fā)現(xiàn),很多高校檔案館都在積極轉(zhuǎn)變角色,努力爭(zhēng)當(dāng)高校信息資源的整合者、組織者,不僅將檔案工作融于教學(xué)、研究和社會(huì)服務(wù)之中,還積極響應(yīng)大學(xué)變革之需,充分應(yīng)用檔案信息網(wǎng)絡(luò)檢索服務(wù)平臺(tái),大力發(fā)揮高校檔案“存史、資政、育人”的重要作用,通過不斷創(chuàng)新贏得自身地位。

(三)檢索技術(shù)應(yīng)用得到重視

為提升檔案信息資源開發(fā)利用水平,江蘇省一些高校已在研發(fā)和應(yīng)用檔案信息智能檢索技術(shù)方面進(jìn)行了積極探索。據(jù)30家調(diào)查樣本反映:可進(jìn)行文本類檔案語義檢索的占63%,有的高校檔案管理機(jī)構(gòu)已采用檔案RFID檢索、云計(jì)算檢索等先進(jìn)技術(shù)。如:南京大學(xué)檔案館積極引入云計(jì)算技術(shù)的建立“云檔案平臺(tái)”,配備了服務(wù)器和站點(diǎn),不僅能夠使用自然語言進(jìn)行標(biāo)引和查詢,而且可以運(yùn)用文本檔案語義檢索、檔案?jìng)€(gè)性化檢索等方法進(jìn)行檢索。又如:東南大學(xué)檔案館使用專用服務(wù)器(HPML350),自主研制了網(wǎng)絡(luò)版“聲像檔案管理系統(tǒng)”,建立了網(wǎng)絡(luò)化實(shí)時(shí)歸檔與查詢(檢索)平臺(tái)、檔案館SAN系統(tǒng),使服務(wù)器和管理(檢索)系統(tǒng)的安全性、訪問速度和可靠性大為提高。再如:南京藝術(shù)學(xué)院綜合檔案室主持的《檔案信息智能檢索模式研究》不僅獲得了江蘇省檔案科技項(xiàng)目立項(xiàng),而且在檔案信息智能檢索技術(shù)應(yīng)用的實(shí)證探索方面積累了一定的知識(shí)儲(chǔ)備。還如:南京中醫(yī)藥大學(xué)檔案館準(zhǔn)備應(yīng)用基于web2.0的智能檢索技術(shù),引進(jìn)新的檔案檢索軟件,希望通過軟件自帶檢索工具實(shí)現(xiàn)檔案的分類別、分詞段的各種檢索。

(四)檢索管理制度基本完善

二、檔案信息檢索系統(tǒng)功能模塊的智能化改造

一個(gè)完整的信息檢索系統(tǒng)應(yīng)當(dāng)必備以下六個(gè)功能模塊:文獻(xiàn)與數(shù)據(jù)選擇與采集子系統(tǒng)、詞表子系統(tǒng)、標(biāo)引子系統(tǒng)、建庫(kù)子系統(tǒng)、系統(tǒng)-用戶接口子系統(tǒng)、提問處理子系統(tǒng)。[1]這六大功能模塊,主要是針對(duì)傳統(tǒng)信息檢索系統(tǒng)而設(shè)計(jì)布局的,不具備檔案信息智能處理的相關(guān)功能。因此,必須充分運(yùn)用各類智能技術(shù),對(duì)原有數(shù)字檔案館信息管理平臺(tái)進(jìn)行智能化改造。改造重點(diǎn)主要是三個(gè)部分:一是建立智能人機(jī)接口功能模塊。這是利用與系統(tǒng)之間的“通道”。二是建立知識(shí)庫(kù)功能模塊。這是智能檢索系統(tǒng)的“資源庫(kù)”。三是建立文本處理功能模塊。這是計(jì)算機(jī)自動(dòng)處理自然語言形式的文本輸入“轉(zhuǎn)換器”。通過智能化改造,形成實(shí)體檢索與內(nèi)容檢索的立體檢索結(jié)構(gòu),使系統(tǒng)一定程度上可實(shí)現(xiàn)智能訪問不同載體檔案信息的集成化運(yùn)作。

(一) 智能人機(jī)接口建設(shè)

在B/S智能集成的結(jié)構(gòu)設(shè)置下,用戶端只要通過Web瀏覽器即可進(jìn)入系統(tǒng)的檢索入口。但檢索入口要想具有人機(jī)交互的智能特性,則需提供四個(gè)方面的技術(shù)支撐條件:一是設(shè)計(jì)的檢索接口必須簡(jiǎn)潔、直觀,界面清爽、一目了然,并擁有可視化的界面和自然語言處理能力。如:讓檢索檔案信息像使用Google、百度等流行的商業(yè)搜索引擎一樣容易。二是必須有多種登錄方式供用戶選擇。除了采用普通的賬號(hào)方式,還應(yīng)增加具有智能特性的接口。如:增加語音識(shí)別接口、聲紋識(shí)別接口、二維碼掃碼接口、射頻識(shí)別接口等。三是為用戶創(chuàng)建個(gè)性化查詢“標(biāo)識(shí)”。如:根據(jù)每個(gè)用戶的需要,定制其專屬的個(gè)性化搜索引擎。四是實(shí)現(xiàn)用戶知識(shí)管理和需求分析,將用戶的檢索提問作為詞匯收集的來源,增加檢索入口,提高系統(tǒng)易用性。

(二)檔案知識(shí)庫(kù)建設(shè)

所謂“知識(shí)庫(kù)”,是指檔案信息檢索系統(tǒng)所需各類知識(shí)的智能數(shù)據(jù)庫(kù)。它與傳統(tǒng)數(shù)據(jù)庫(kù)不同的性能區(qū)別主要在于:知識(shí)庫(kù)是在數(shù)據(jù)庫(kù)的基礎(chǔ)上,通過對(duì)檔案信息資源進(jìn)行深度語義分析、自動(dòng)標(biāo)引等技術(shù)處理,從而實(shí)現(xiàn)對(duì)原始檔案信息中的知識(shí)進(jìn)行揭示和表達(dá)。

知識(shí)庫(kù)的資源儲(chǔ)備和結(jié)構(gòu)優(yōu)化程度決定著系統(tǒng)檢索能力的高低。因此,在建立知識(shí)庫(kù)之前,必須根據(jù)檔案信息數(shù)據(jù)庫(kù)已有的基礎(chǔ)條件和庫(kù)藏的知識(shí)資源狀況來科學(xué)設(shè)計(jì)知識(shí)庫(kù)結(jié)構(gòu)。借鑒相關(guān)領(lǐng)域的經(jīng)驗(yàn),在建設(shè)高校檔案信息智能檢索服務(wù)平臺(tái)的初級(jí)階段,我們應(yīng)當(dāng)先易后難地來建立“高校檔案知識(shí)庫(kù)”。

1.構(gòu)建用戶知識(shí)庫(kù)。建立用戶知識(shí)庫(kù),既是系統(tǒng)自動(dòng)生成查詢與反饋對(duì)接機(jī)制的內(nèi)在要求,也是增強(qiáng)系統(tǒng)對(duì)用戶查詢?cè)~匯辨認(rèn)與理解能力的重要手段??少Y借鑒的應(yīng)用實(shí)例:一是建立用戶模型庫(kù),通過統(tǒng)一的檢索服務(wù)平臺(tái)對(duì)用戶注冊(cè)信息進(jìn)行智能分析。即:待用戶完成登錄后,系統(tǒng)在對(duì)用戶身份信息進(jìn)行分析的基礎(chǔ)上,進(jìn)一步對(duì)用戶的研究領(lǐng)域、研究偏好與用戶輸入的關(guān)鍵詞等信息進(jìn)行數(shù)據(jù)挖掘,而后通過自動(dòng)記錄和分析用戶的檢索需求來建立用戶檔案庫(kù)(存貯用戶的基本資料、訪問記錄、訪問行為、興趣偏好等)。二是建立用戶需求類型庫(kù),通過統(tǒng)一的檢索服務(wù)平臺(tái)對(duì)用戶檢索需求信息進(jìn)行智能分析。即:按高校檔案用戶檢索需求的性質(zhì),將其分為“學(xué)習(xí)研究型用戶、行政管理決策型用戶、咨詢查考型用戶、休閑消遣型用戶”四大類,而后自動(dòng)錄入用戶檢索需求分類庫(kù)。三是建立用戶信息反饋庫(kù),通過統(tǒng)一的檢索服務(wù)平臺(tái)對(duì)用戶的反饋信息進(jìn)行智能分析。即:收集、分析各類型用戶檢索需求的反饋信息,并根據(jù)用戶的反饋信息來調(diào)整、更新用戶需求庫(kù),進(jìn)而確定檔案知識(shí)庫(kù)的資源范圍,以期達(dá)到準(zhǔn)確描述用戶需求的目的。四是建立用戶檢索特征詞典庫(kù),通過統(tǒng)一的檢索服務(wù)平臺(tái)對(duì)用戶檢索行為的個(gè)性特征進(jìn)行智能分析。即:以賬號(hào)為“標(biāo)識(shí)”,對(duì)用戶個(gè)性化檢索行為的數(shù)據(jù)進(jìn)行分析,并將其自動(dòng)入駐用戶檢索個(gè)性行為特征詞典,以記錄用戶的查詢蹤跡,以利在用戶再次登錄時(shí),可迅速提供其所需的個(gè)性化檢索服務(wù)。

2.構(gòu)建檔案信息資源知識(shí)庫(kù)。建立檔案信息資源知識(shí)庫(kù),既是充實(shí)和優(yōu)化高校庫(kù)藏信息資源的客觀需要,也是增強(qiáng)系統(tǒng)智能檢索服務(wù)能力的重要基礎(chǔ)??少Y借鑒的應(yīng)用實(shí)例:一是建立高校機(jī)構(gòu)知識(shí)庫(kù)。高校檔案管理機(jī)構(gòu)可在原有庫(kù)藏檔案信息資源基礎(chǔ)上,不斷搶占先機(jī),積極學(xué)習(xí)參照國(guó)外著名的CDR(Carolina Digital Repository)、OpenDOAR 等,依據(jù)來源原則與機(jī)構(gòu)劃分,對(duì)高校科研產(chǎn)出成果加以整合并形成檢索數(shù)據(jù),以利逐步推進(jìn)檔案館(室)主導(dǎo)的高校機(jī)構(gòu)知識(shí)庫(kù)(Institutional Repositories,IR)建設(shè)。二是建立高校教學(xué)檔案知識(shí)庫(kù)。高校的教學(xué)檔案主要包括“學(xué)生學(xué)籍、教學(xué)文件、課程與學(xué)科、教師業(yè)務(wù)、教學(xué)實(shí)物”等幾個(gè)方面內(nèi)容。目前,江蘇省多數(shù)高校的在校生規(guī)模已超萬人,每學(xué)期都會(huì)產(chǎn)生大量教學(xué)檔案,其中各高校檔案館(室)的學(xué)生學(xué)籍檔案查詢利用尤為頻繁。因此,高校檔案管理機(jī)構(gòu)加強(qiáng)教學(xué)檔案知識(shí)庫(kù)建設(shè)十分重要。三是建立特色檔案知識(shí)庫(kù)。高校檔案管理機(jī)構(gòu)要應(yīng)用Web數(shù)據(jù)挖掘等技術(shù),對(duì)館藏的特色檔案資源進(jìn)行整理發(fā)掘,并提供在線智能檢索信息的功能,使知名校友等特色檔案資源服務(wù)得以互動(dòng)展示,以利加快推進(jìn)特色檔案信息數(shù)據(jù)庫(kù)的開發(fā)與利用。四是借鑒國(guó)外機(jī)構(gòu)網(wǎng)站存檔(OCLC Digital Archive、TRAIL/EDP)的先進(jìn)技術(shù),加快研發(fā)高校官網(wǎng)信息抓取存檔的解決方案,以利實(shí)現(xiàn)自動(dòng)監(jiān)控報(bào)告網(wǎng)站的任何變化并實(shí)時(shí)記錄存儲(chǔ)的功能要求。五是加強(qiáng)高校之間的合作共享機(jī)制建設(shè),大力整合優(yōu)化高校庫(kù)藏信息資源,以利增強(qiáng)跨庫(kù)檢索功能。

(三)檔案信息自動(dòng)化處理建設(shè)

這次調(diào)研發(fā)現(xiàn),江蘇省高校檔案信息檢索系統(tǒng)主要有四種檢索模式[2]:一是常規(guī)檢索模式,也被稱為“前控詞表”應(yīng)用模式,即在標(biāo)引和檢索兩端均對(duì)詞匯進(jìn)行人工控制,預(yù)先采用分類表、敘詞表等“先控詞表”對(duì)詞匯進(jìn)行受控標(biāo)引,檢索時(shí)也采用詞表中的類號(hào)和語詞來表達(dá)檢索需求。這種方式的查全率和查準(zhǔn)率最高,但人工控制需耗費(fèi)大量的人力物力財(cái)力,響應(yīng)時(shí)間也最長(zhǎng)。二是自然語言檢索模式,即在標(biāo)引和檢索兩端均不對(duì)詞匯進(jìn)行控制。目前,絕大多數(shù)網(wǎng)絡(luò)搜索引擎都采用這種模式,并由全文索引方式建立索引庫(kù),用戶以自然語言進(jìn)行字面匹配,系統(tǒng)將命中結(jié)果返回用戶。這種方式不需任何人工介入,投入最少,但檢索效率低下已是不爭(zhēng)的事實(shí)。三是后控制檢索模式,即在標(biāo)引階段不實(shí)施控制,在檢索階段通過“后控詞表”或“自然語言敘詞表”實(shí)施不嚴(yán)格的控制,可顯示相關(guān)詞供用戶用于檢索詞的擴(kuò)展、參考選用。這種方式兼有自然語言與受控語言的特點(diǎn),但建立一個(gè)“后控詞表”需花費(fèi)較多人力物力。四是標(biāo)引階段實(shí)施詞匯控制、檢索階段不予控制模式。這種模式采用的是一種半自然語言檢索系統(tǒng),其在檢索階段增加了一個(gè)自然語言接口——入口詞表,但由于編制一個(gè)完備的“入口詞表”幾乎不可能,因此檢索效率不高。

其實(shí)在黑龍江這片土地上,春天到秋天大概七個(gè)月,隨著農(nóng)作物的成熟期,春耕、秋收都是陸陸續(xù)續(xù)開展,供油在七個(gè)月里都不間斷,只不過那兩個(gè)特定的階段是高峰期?!斑@不,現(xiàn)在收完了大豆,在上凍之前,玉米就要收了?!焙樗蓾f。

檔案信息智能檢索建設(shè)的最終目的是要讓查詢語句與用戶查詢意圖通過計(jì)算機(jī)自動(dòng)處理實(shí)現(xiàn)“語”“意”相符,而非“問”“答”相悖。目前,針對(duì)高?,F(xiàn)有四種檢索模式存在的缺陷,我們可采用語義檢索的理念,進(jìn)一步升級(jí)改造“內(nèi)核受控,外殼非控”的檔案信息檢索系統(tǒng)。即:系統(tǒng)的“外殼”——標(biāo)引和檢索兩端均采用自然語言,最大限度方便利用者,復(fù)雜的檢索匹配等過程均由內(nèi)核系統(tǒng)完成;系統(tǒng)“內(nèi)核”是與智能軟件檢索結(jié)為一體的檔案檢索語言及基于概念語義網(wǎng)絡(luò)的知識(shí)庫(kù),可利用系統(tǒng)自動(dòng)將自然語言轉(zhuǎn)化為受控語言。[3]這是一種具有自然語言優(yōu)點(diǎn)又兼具了人工語言優(yōu)點(diǎn)的檔案信息檢索模型。其技術(shù)特性主要有:

1.這種檢索模式提問可直接采用自然語言,用戶無需經(jīng)過專門訓(xùn)練即可與系統(tǒng)進(jìn)行交流,不需要知道提問式在后臺(tái)與標(biāo)引數(shù)據(jù)所采用的各種知識(shí)組織系統(tǒng)的匹配機(jī)制,并可通過瀏覽備選詞條選用合適的檢索詞,以利提高檢索速度和精度;檔案管理人員則可采用自由標(biāo)引方式,讓系統(tǒng)自動(dòng)將自然語言語句詞轉(zhuǎn)換為受控的主題詞,與提問式進(jìn)行匹配。

2.這種檢索模式可通過改造現(xiàn)有的信息組織工具(檔案敘詞表或分類表等源詞庫(kù)),將其作為檔案領(lǐng)域“本體”構(gòu)建的基礎(chǔ)進(jìn)行改造和轉(zhuǎn)換,以利于設(shè)計(jì)和管理超文本鏈路;同時(shí),參考收錄高等教育領(lǐng)域中權(quán)威、規(guī)范、核心的專業(yè)詞匯的辭典,以及研究論文中的大量專業(yè)術(shù)語和其他網(wǎng)絡(luò)百科資源等豐富語料,作為多種同義詞獲取技術(shù)相互融合的最佳切入點(diǎn),為高校檔案領(lǐng)域建立以自然語言敘詞的關(guān)聯(lián)詞表,并通過篩選規(guī)范,最終建成一個(gè)能夠體現(xiàn)高校檔案領(lǐng)域概念關(guān)系的、適用于網(wǎng)絡(luò)檔案信息檢索的“知識(shí)圖譜”。

3.這種檢索模式可將主題的特性檢索(直觀性見長(zhǎng))和分類的族性檢索(系統(tǒng)性見長(zhǎng))兩種不同的檢索方式加以結(jié)合并相互彌補(bǔ),從而挖掘出分類號(hào)—主題詞串—關(guān)鍵詞串之間的概念對(duì)應(yīng)關(guān)系,并可利用系統(tǒng)自動(dòng)實(shí)現(xiàn)三者之間的兼容轉(zhuǎn)換,為分類檢索語言、主題檢索語言、自然語言三者在標(biāo)引、檢索中的互操作奠定基礎(chǔ)。

4.這種檢索模式可利用超文本技術(shù)對(duì)有同義、近義、相關(guān)等關(guān)系的詞進(jìn)行組織,特別是應(yīng)用這種分類層次結(jié)構(gòu)的系統(tǒng),可為用戶提供相關(guān)詞、上位詞和下位詞,并能將全文檢索功能與詞表的瀏覽和檢索置于同一界面,以利提示與用戶檢索需求相對(duì)應(yīng)的合適主題詞或語義層面上的同義詞,非常方便用戶選擇使用或直接轉(zhuǎn)換成主題詞進(jìn)行查詢。

5.這種檢索模式設(shè)置了容錯(cuò)功能,系統(tǒng)不僅能對(duì)用戶輸入的錯(cuò)字、別字進(jìn)行智能糾錯(cuò),還能聯(lián)想適合的主題詞,并可將與之有關(guān)的檢索詞條自動(dòng)出現(xiàn)在下拉框中,以利通過添加檢索詞來提高檔案信息檢索的查全率。

實(shí)際證明,應(yīng)用這種檢索模式的系統(tǒng)能夠多視角、多途徑直觀展示比較完整的語義關(guān)系網(wǎng)狀結(jié)構(gòu),實(shí)現(xiàn)自動(dòng)建立詞間關(guān)聯(lián)、詞匯聚類,以方便不同層次網(wǎng)絡(luò)用戶選擇使用盡可能多的語詞,特別是通過系統(tǒng)提供的提示與導(dǎo)航,可使查詢得到適當(dāng)?shù)募m正或擴(kuò)展,從而大幅度提高檔案信息檢索的查準(zhǔn)率。

(四)檔案信息資源描述標(biāo)準(zhǔn)化體系建設(shè)

建立健全采集“元數(shù)據(jù)”檔案信息資源描述標(biāo)準(zhǔn),這既是實(shí)現(xiàn)跨庫(kù)數(shù)據(jù)交換的基礎(chǔ)條件,也是克服多系統(tǒng)模式配置功能互不兼容等方面弊端的有效舉措。但需要指出的是,這些標(biāo)準(zhǔn)的建設(shè),必須注重與國(guó)際接軌并優(yōu)先采用國(guó)際標(biāo)準(zhǔn),同時(shí)要使工業(yè)標(biāo)準(zhǔn)及事實(shí)標(biāo)準(zhǔn)盡量與圖書、情報(bào)的國(guó)際、國(guó)內(nèi)標(biāo)準(zhǔn)相銜接。如:江蘇省高校檔案管理機(jī)構(gòu)應(yīng)積極參照CALIS(中國(guó)高等教育文獻(xiàn)保證系統(tǒng))項(xiàng)目建設(shè)的成功經(jīng)驗(yàn),對(duì)檔案信息數(shù)據(jù)進(jìn)行規(guī)范化改造,構(gòu)建統(tǒng)一、規(guī)范的“機(jī)構(gòu)知識(shí)庫(kù)”,完善以數(shù)字檔案館(室)為核心的公共服務(wù)體系,確立互操作協(xié)議,以利實(shí)現(xiàn)檔案信息資源跨館、跨數(shù)據(jù)庫(kù)共建、共知、共享。

我們知道,檔案信息資源“元數(shù)據(jù)”的采集,通常包括檔案著錄和標(biāo)引,這是檔案信息檢索工作的“前處理”(即:建立檔案檢索系統(tǒng)的基礎(chǔ)和前提)。因此,在對(duì)檔案信息數(shù)據(jù)進(jìn)行著錄時(shí),必須在全面分析的基礎(chǔ)上,高度重視選擇需要揭示的特征,特別要注意加強(qiáng)內(nèi)容特征的著錄和標(biāo)引。

據(jù)媒體報(bào)道,國(guó)際上對(duì)檔案機(jī)讀目錄交換格式的研究,是從上世紀(jì)70年代發(fā)展起來的。20世紀(jì)80年代初,美國(guó)率先頒布《檔案機(jī)讀目錄交換格式》標(biāo)準(zhǔn)(MARC AMC), 并于1996年形成了ISO1709信息交換格式國(guó)際標(biāo)準(zhǔn)。這項(xiàng)標(biāo)準(zhǔn),主要是針對(duì)檔案的目錄記錄,提供館藏級(jí)概略的檔案目錄信息。1993年,美國(guó)加州大學(xué)伯克利分校首先研發(fā)了檔案編碼著錄標(biāo)準(zhǔn)(EAD)。1994年,國(guó)際檔案理事會(huì)公布了《國(guó)際檔案著錄規(guī)則(總則)》(第一版)。這是檔案著錄的第一個(gè)國(guó)際標(biāo)準(zhǔn),其目的是為各國(guó)提供統(tǒng)一合理的檔案著錄規(guī)則,方便檔案信息的檢索與交換,以期實(shí)現(xiàn)檔案信息資源的全球共享。此外,XML是一種通用、簡(jiǎn)單、一致且面向Web的格式化數(shù)據(jù)和傳送數(shù)據(jù)的方式(即:綜合了SGML的豐富功能與HTML的易用性,是不同平臺(tái)上可實(shí)現(xiàn)數(shù)據(jù)互操作的國(guó)際標(biāo)準(zhǔn)格式),它將成為數(shù)字檔案館最重要的基礎(chǔ)性語言。

目前,我國(guó)雖已制定了《檔案著錄規(guī)則》(DA/T18—1999)、《中國(guó)檔案機(jī)讀目錄格式》(GB/T 20163-2006)等標(biāo)準(zhǔn),但許多檔案管理機(jī)構(gòu)至今尚未將標(biāo)準(zhǔn)建設(shè)放上重要位置,致使檔案機(jī)讀目錄數(shù)據(jù)著錄形式呈各行其是之態(tài)。如:一些高校檔案管理機(jī)構(gòu)沒有采用統(tǒng)一標(biāo)準(zhǔn)的機(jī)讀目錄(MARC)交換格式,導(dǎo)致各自檔案數(shù)據(jù)庫(kù)數(shù)據(jù)著錄項(xiàng)目的字段名與字段類型等各不相同,甚至同一個(gè)檔案館(室)不同時(shí)期錄入的數(shù)據(jù),表示形式也不統(tǒng)一;有的只是采用簡(jiǎn)單的固定結(jié)構(gòu)格式生成的計(jì)算機(jī)檔案目錄記錄,無法反映檔案目錄數(shù)據(jù)的各種變化和類型多樣的特點(diǎn);有的沒有設(shè)置“頭標(biāo)區(qū)”,機(jī)讀檔案目錄數(shù)據(jù)不具備自我說明功能;有的檔案目錄數(shù)據(jù)的生產(chǎn)和保存要依賴特定的應(yīng)用軟件,難以實(shí)現(xiàn)對(duì)檔案信息數(shù)據(jù)的長(zhǎng)久保存和利用;等等。加之,目前全國(guó)沒有形成統(tǒng)一的檔案信息檢索行業(yè)評(píng)價(jià)體系和評(píng)價(jià)標(biāo)準(zhǔn),這給檔案數(shù)據(jù)的共享、交換、遷移、傳輸、合并等工作造成了諸多障礙。

毋庸置疑,全面推行并實(shí)施數(shù)字網(wǎng)絡(luò)環(huán)境下檔案信息資源描述標(biāo)準(zhǔn),這已是建立檔案信息智能化、共享化檢索模式的當(dāng)務(wù)之急。因此,我國(guó)各級(jí)檔案行政管理部門和高校檔案管理機(jī)構(gòu)應(yīng)借鑒數(shù)字圖書館等其他行業(yè)信息化建設(shè)的成功經(jīng)驗(yàn),按照“統(tǒng)一、通用、科學(xué)、規(guī)范、共享”的原則要求,加快推進(jìn)檔案標(biāo)準(zhǔn)制定工作。與此同時(shí),高校檔案管理機(jī)構(gòu)應(yīng)通過MARC AMC、EAD、DC元數(shù)據(jù)等標(biāo)準(zhǔn)格式的建設(shè),盡快采用目錄、索引及機(jī)讀數(shù)據(jù)庫(kù)等多種形式的檢索工具來創(chuàng)建完備的系統(tǒng)梯度檢索體系,尤其要加快建立如Z39.50等適合異構(gòu)分布式檢索系統(tǒng)的標(biāo)準(zhǔn)檢索協(xié)議,促進(jìn)高校檔案信息檢索系統(tǒng)之間的無縫鏈接,以利跟上并融入全社會(huì)信息化建設(shè)的進(jìn)程。

● 參考文獻(xiàn) ●

[1]陳麗.檔案信息檢索[M].成都:四川人民出版社,2010:183.

[2]侯漢清、馬張華.主題法導(dǎo)論[M].北京:北京大學(xué)出版社,1991:22-23.

[3]馬張華,侯漢清,薛春香.文獻(xiàn)分類法主題法導(dǎo)論[M].北京:國(guó)家圖書館出版社,2009:307.

猜你喜歡
信息檢索知識(shí)庫(kù)檢索
2019年第4-6期便捷檢索目錄
基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
新聞傳播(2016年18期)2016-07-19 10:12:06
高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
圖書館研究(2015年5期)2015-12-07 04:05:48
教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
河南科技(2014年11期)2014-02-27 14:10:19
公共圖書館信息檢索服務(wù)的實(shí)踐探索——以上海浦東圖書館為例
圖書館界(2013年5期)2013-03-11 18:50:29
國(guó)際標(biāo)準(zhǔn)檢索
清远市| 平顶山市| 井研县| 金阳县| 原阳县| 七台河市| 阿尔山市| 秭归县| 民和| 崇明县| 德阳市| 郴州市| 遵化市| 香河县| 珲春市| 兴国县| 灌阳县| 武平县| 新邵县| 宁津县| 丰顺县| 章丘市| 山阴县| 和静县| 田东县| 长岛县| 额尔古纳市| 勃利县| 民丰县| 利辛县| 彰化市| 确山县| 隆子县| 阜城县| 凉城县| 泌阳县| 兴业县| 梁河县| 洪江市| 丰顺县| 泗水县|