謝守鳳
摘 要:多媒體數(shù)據(jù)庫在檔案管理中具有重要的作用,因此,要特別重視檔案多媒體數(shù)據(jù)庫建立中的主要工作,即數(shù)據(jù)的采集和存入數(shù)據(jù)庫方法。
關(guān)鍵詞:檔案;多媒體;數(shù)據(jù)庫
從目前學(xué)校檔案管理現(xiàn)狀看,還有大量有價(jià)值的檔案沒有轉(zhuǎn)變成電子形式?,F(xiàn)在,信息傳媒日益發(fā)展,有文字、圖像、圖形、聲頻、視頻等等,如果把這些信息變成電子形式,組成一個(gè)功能齊全的數(shù)據(jù)庫系統(tǒng),進(jìn)行傳統(tǒng)的利用服務(wù)或者借助Web的傳輸機(jī)制提供即時(shí)的信息服務(wù)就相當(dāng)方便了,這將給檔案事業(yè)帶來極大的社會(huì)效益和經(jīng)濟(jì)效益。下面,就建立檔案多媒體數(shù)據(jù)庫談幾點(diǎn)拙見。
一、多媒體數(shù)據(jù)庫在檔案管理中的作用
多媒體技術(shù)的特征是集成性、交互性、控制性、實(shí)時(shí)性、直觀性、虛擬性,它已經(jīng)廣泛運(yùn)用在社會(huì)的各個(gè)角落。一個(gè)學(xué)校建校至今保存的檔案數(shù)量種類繁多,而且新的檔案還在不斷地產(chǎn)生。傳統(tǒng)的管理方式不僅雜瑣,而且利用率較低,如果沒有進(jìn)行有效的管理,這些檔案不僅難以真正反映學(xué)校發(fā)展的歷史軌跡,也難以成為學(xué)校日常工作、學(xué)習(xí)的得力助手。但現(xiàn)在計(jì)算機(jī)多媒體技術(shù)的介入,使得我們建立大型檔案管理數(shù)據(jù)庫成為可能。
(1)多媒體數(shù)據(jù)庫有利于檔案存儲(chǔ)。檔案多媒體數(shù)據(jù)庫是以數(shù)字形式存儲(chǔ)檔案信息的,數(shù)字化的檔案信息容易進(jìn)行存儲(chǔ)、顯示、編輯、打印等操作。雖然這種多媒體信息需要很大的空間來存放,但光盤、磁帶的海量存儲(chǔ)技術(shù)為多媒體檔案數(shù)據(jù)庫的發(fā)展提供了便利,幾張光盤就可裝下一個(gè)小型的檔案館變成可能。
(2)多媒體數(shù)據(jù)庫有利于檔案保護(hù)。檔案多媒體數(shù)據(jù)庫可以保護(hù)原件、修復(fù)破損件。數(shù)據(jù)庫建成后,大量的利用服務(wù)就可以轉(zhuǎn)移到計(jì)算機(jī)上進(jìn)行了,調(diào)用原件的次數(shù)減少,它們的機(jī)械損害的機(jī)會(huì)也就相應(yīng)減少。而在建庫的過程中,一些破損的傳統(tǒng)檔案也可以得到修復(fù),如利用字跡恢復(fù)技術(shù)對(duì)模糊字跡進(jìn)行恢復(fù);電子檔案的編輯、數(shù)據(jù)恢復(fù)也更加方便。隨著光盤等存儲(chǔ)介質(zhì)耐久性研究的進(jìn)展,多媒體檔案的保護(hù)將越來越完善。
(3)多媒體數(shù)據(jù)庫有利于檔案檢索。多媒體技術(shù)的交互性和實(shí)時(shí)性,是提高檔案檢索水平的秘密。便捷的操作界面、簡(jiǎn)易的輸入方式,使一般用戶檢索基本沒有什么障礙。除了人們習(xí)慣的傳統(tǒng)文字上的題名、責(zé)任者、主題詞等多個(gè)檢索入口外,有了多媒體技術(shù)的支撐,人們還可以把聲音、圖形、圖像、動(dòng)畫等多種媒體形式作為檢索標(biāo)志。目前,對(duì)多媒體信息的檢索方法有全文檢索法、特征描述法、模糊識(shí)別法、特征矢量法和超文本法等。檢索的效率大大提高,檔案人員的工作量也可大大減少。
(4)多媒體數(shù)據(jù)庫有利于檔案編研。有了海量的數(shù)據(jù)庫,檔案編研工作自然比從前簡(jiǎn)單了。例如:制作檔案館指南,館藏檔案介紹等只需文字的剪剪貼貼、稍加潤(rùn)色,再增加一些聲頻、視頻服務(wù)及實(shí)時(shí)的鏈接就基本完成。而以前耗時(shí)耗力的專題編研的資料收集工作,現(xiàn)在也只需輸入檢索詞,幾秒鐘內(nèi)信息就鋪天蓋地而來,通過高級(jí)檢索,編研檔案信息的靈活度還是較高的。由于多媒體技術(shù)的集成性、交互性的特點(diǎn),我們的編研成果集圖、文、聲、像為一體,人機(jī)交流方便快捷,其市場(chǎng)前景比傳統(tǒng)編研成果好得多。
(5)多媒體數(shù)據(jù)庫有利于檔案信息交流。用傳統(tǒng)的方法是很難實(shí)現(xiàn)館藏的規(guī)模傳遞的,多媒體數(shù)據(jù)庫是展示各檔案館館藏的大型倉庫,也使規(guī)模傳遞成為可能。如今,多媒體存儲(chǔ)技術(shù)的發(fā)展,光盤、磁帶的廣泛運(yùn)用,使得檔案信息的傳遞與交流變得極為方便;再加上環(huán)球的網(wǎng)絡(luò),就使多媒體檔案信息的遠(yuǎn)距離資源共享也只需在鼠標(biāo)的輕輕點(diǎn)擊中完成。
二、檔案多媒體數(shù)據(jù)庫的建立方法
檔案多媒體數(shù)據(jù)庫的建立需要學(xué)校檔案部門與數(shù)據(jù)庫建設(shè)技術(shù)人員的協(xié)同工作,他們的主要工作有兩方面:一是將多媒體檔案數(shù)據(jù)通過各種輸入設(shè)備,輸入到計(jì)算機(jī)中,進(jìn)行數(shù)字化、壓縮處理,存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)設(shè)備中。這就是數(shù)據(jù)的采集。二是將已存儲(chǔ)在計(jì)算機(jī)中的多媒體檔案數(shù)據(jù)存入數(shù)據(jù)庫中,以便數(shù)據(jù)庫管理系統(tǒng)的管理和訪問。
(1)檔案數(shù)據(jù)采集的方法。檔案數(shù)據(jù)的采集或者說數(shù)據(jù)準(zhǔn)備是建立一個(gè)良好系統(tǒng)的基礎(chǔ)。因?yàn)槟壳皩W(xué)校檔案館的館藏量較大,因而在數(shù)據(jù)錄入之前,要根據(jù)利用者的需求對(duì)非電子檔案進(jìn)行鑒定,確定出轉(zhuǎn)換與不轉(zhuǎn)換成電子形式的檔案及轉(zhuǎn)換先后的大致界限,對(duì)已經(jīng)是電子形式的檔案也要簡(jiǎn)單鑒定后再轉(zhuǎn)移到數(shù)據(jù)庫中。這樣,便于利用價(jià)值高的檔案盡早最大限度地提供利用。然后,才是數(shù)據(jù)的正式錄入、存儲(chǔ)和編輯的工作。數(shù)據(jù)的錄入、存儲(chǔ)與編輯分基本數(shù)據(jù)和原文兩部分,工作人員依據(jù)檔案鑒定人員提供的鑒定結(jié)果順序錄入與存儲(chǔ)?;緮?shù)據(jù)的錄入方式有:用選擇、聯(lián)想式的鍵盤錄入,這種方法速度較慢,但數(shù)據(jù)經(jīng)過人工判斷,質(zhì)量一般較高;用智能方式自動(dòng)錄入責(zé)任者、標(biāo)題、主題詞、發(fā)文字號(hào)、主題曲、主要圖表、主要圖像、主要影像及半自動(dòng)方式錄入內(nèi)容提要等基本信息。這些基本數(shù)據(jù)按檔案全宗原則,分類存儲(chǔ)在各個(gè)子數(shù)據(jù)庫中。對(duì)此,檔案多媒體數(shù)據(jù)庫要進(jìn)行如下設(shè)計(jì):基本數(shù)據(jù)的編輯分卡片編輯和快速編輯,通過提示給出條件,很快找到編輯點(diǎn)進(jìn)行編輯,條件給定是在條件框圖中完成,它應(yīng)當(dāng)打破系統(tǒng)的條件給出必須是固定幾項(xiàng)的束縛,由編輯者給出條件并任意組合。為了防止表達(dá)式書寫錯(cuò)誤,系統(tǒng)還應(yīng)在表達(dá)式類型和關(guān)系符上都加入出錯(cuò)處理,確保表達(dá)式書寫正確。原文錄入是通過掃描儀將非電子文件一頁頁錄入、壓縮,存儲(chǔ)。其編輯在掃描過程中或掃描后進(jìn)行,一旦刻入光盤后就不能再編輯。
(2)檔案數(shù)據(jù)存入數(shù)據(jù)庫的方法。檔案多媒體信息存入數(shù)據(jù)庫的方法有兩種:基于文件的方法(File Based)和二進(jìn)制域(BLOB:Binary Large Object,二進(jìn)制大對(duì)象)的方法。基于文件的方法適用于大數(shù)據(jù)量的檔案,比如多媒體數(shù)據(jù)等,它將數(shù)據(jù)信息分成兩部分:數(shù)據(jù)的基本信息(比如文件位置、文件名等)以及檔案數(shù)據(jù)的具體內(nèi)容。其中數(shù)據(jù)的基本信息存儲(chǔ)在數(shù)據(jù)庫中,具體檔案數(shù)據(jù)存儲(chǔ)在其他位置,例如:硬盤、光盤等。檢索數(shù)據(jù)時(shí),根據(jù)數(shù)據(jù)庫中的數(shù)據(jù)基本信息得到數(shù)據(jù)文件的位置,從而獲取該檔案數(shù)據(jù)。這種方法容易實(shí)現(xiàn),它減輕了數(shù)據(jù)庫的壓力,方便檔案信息的修改,但是我們需要額外的開銷來維護(hù)檔案數(shù)據(jù)文件。
二進(jìn)制大對(duì)象方法是把檔案數(shù)據(jù)作為數(shù)據(jù)庫的一個(gè)字段存儲(chǔ)于數(shù)據(jù)庫中。這種技術(shù)將檔案數(shù)據(jù)當(dāng)做數(shù)據(jù)庫的普通字段,操作該字段與其他一樣,這樣更利于我們的檢索讀取。但是,另一方面,這種技術(shù)將大數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)庫中,增加了數(shù)據(jù)庫的開銷,數(shù)據(jù)庫延遲相對(duì)要大,而且不利于檔案數(shù)據(jù)的修改。
當(dāng)前學(xué)校的檔案多媒體的存儲(chǔ)方法兩者皆有,它根據(jù)檔案的類別而采用相應(yīng)的存儲(chǔ)方法。檔案多媒體數(shù)據(jù)庫和信息系統(tǒng)的開發(fā),用的是基于二進(jìn)制大對(duì)象方法的多媒體數(shù)據(jù)庫,這有利于檔案信息的建立以及統(tǒng)一管理;而在檔案的前期編研、對(duì)外提供多媒體信息共享時(shí),對(duì)檔案的操作較多,但是要求的技術(shù)較低,適合采用基于文件的方法。
目前,學(xué)校檔案多媒體數(shù)據(jù)庫應(yīng)用廣泛,但是在實(shí)施時(shí)仍然存在一些問題:如檔案多媒體數(shù)據(jù)庫的有關(guān)標(biāo)準(zhǔn)的制定,不同檔案多媒體數(shù)據(jù)庫之間的兼容性,以及檔案多媒體數(shù)據(jù)庫的備份、安全性等等。這些問題,影響著檔案多媒體數(shù)據(jù)庫的維護(hù)以及進(jìn)一步推廣。
參考文獻(xiàn):
[1]李勝娟,孫炳文.多媒體技術(shù)在科技檔案信息管理中的應(yīng)用[J].情報(bào)學(xué)報(bào),1998(6).
[2]盛春梅,王原.多媒體技術(shù)在檔案信息管理中的作用[J].浙江檔案,2000(7).
(莆田第五中學(xué))