尹子業(yè)
博物館數(shù)據(jù)庫與證件信息系統(tǒng)相融通,可以有效地提升博物館的管理質(zhì)量,并有利于博物館安防層次的提升。文章從四個方面系統(tǒng)地介紹了博物館數(shù)據(jù)庫中的證件信息文檔管理,并結(jié)合當(dāng)前最新博物館安防技術(shù)與證件信息技術(shù)相結(jié)合,進(jìn)一步提升博物館的安防質(zhì)量。
【關(guān)鍵詞】博物館 證件信息 文檔管理
隨著計算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,人類已經(jīng)邁入了信息化時代,在各大博物館中早已實(shí)現(xiàn)了自動辦公,博物館的各項設(shè)備也已實(shí)現(xiàn)現(xiàn)代化管理,其中證件文檔管理成為自動管理項目的重要一環(huán)。
文檔管理是指對文件、表格、圖形、影像進(jìn)行掃描,并將相關(guān)資料分類儲存,便于檢索。文檔的管理一般包含有以下幾方面內(nèi)容:文件收發(fā)、文件儲存、檔案儲存、證件信息儲存等等。故而,要想管理好文檔,首先必須確定好文檔對象,然后必須確定文檔管理方法,例如文檔分類、文檔質(zhì)量等等內(nèi)容。
1 博物館數(shù)據(jù)庫中證件信息文檔的獲取
目前,有很多方法和途徑可以獲取計算機(jī)中的文檔。現(xiàn)在一般采用的技術(shù)是通過掃描儀進(jìn)行掃描,然后,可以使用OCR技術(shù)進(jìn)行文檔識別,OCR是最為常見的半自動獲取答案方式之一。當(dāng)然,除了此項技術(shù)外,還可以通過其他技術(shù),尤其是更高科技技術(shù)獲取高質(zhì)量文檔,是否需要采取其他技術(shù)與單位花銷和實(shí)際需求相關(guān),如果單位實(shí)際開支并不大,則沒必要獲取更高質(zhì)量的文檔。使用OCR并不是獲取了真正的文檔結(jié)構(gòu),在很多情況下OCR產(chǎn)生的文檔質(zhì)量較差,需要進(jìn)行人工修改才能便于檢索。目前,有很多研究者在研究自動捕獲文檔方法,但是技術(shù)依舊不是很成熟。
在博物館文檔獲取中,降低不必要的費(fèi)用非常重要,因為大型證件文檔庫的建立和維護(hù)往往占據(jù)整個博物館系統(tǒng)開銷的80%。如果采用全自動系統(tǒng)則這種費(fèi)用可以承受,但是如果采用半自動或者手動獲取文檔方式,則經(jīng)費(fèi)就顯得捉襟見肘,特別是對于博物館這種存放許多證件證件文檔的大型文庫。因此,在博物館證件安保系統(tǒng)中,為了應(yīng)對實(shí)際需求也為了更好的節(jié)約經(jīng)費(fèi),安保系統(tǒng)讀取身份信息可以選擇全自動系統(tǒng)。
2 證件信息文檔存儲系統(tǒng)的體系結(jié)構(gòu)
按照儲存需求,有些儲存可以有幾kb,有些也可以有50MB,甚至有2G的彩色圖像,變化多種多樣。因此,對于非編碼的相關(guān)信息,為了有效節(jié)約空間,我們可以采取壓縮方式進(jìn)行儲存。例如,美國國家博物館大約藏有3億人證件信息,需要大概200萬tb儲存量,面對如此龐大儲存需求,使用高密度影像或者自動換片機(jī)可以實(shí)現(xiàn)有效儲存。
大型博物館證件儲藏庫需要包含各種各樣的儲存器,例如主存緩沖、硬盤、硬盤緩沖甚至還要包含有離線的相關(guān)儲蓄器。在數(shù)據(jù)發(fā)生遷移時,例如從系統(tǒng)主硬盤遷移到其他應(yīng)用中,數(shù)據(jù)就必須全新的方式進(jìn)行組織,以適合新介質(zhì)的儲存方式。如果在證件證件儲存在讀取速度較慢的儲存設(shè)備中,可以使用相關(guān)索引以提升讀取速度。在通常情況下,索引僅占總內(nèi)容的1%甚至更少。在文檔中,證件信息的讀取頻率越高,則獲取儲存速度也相對較快,并且這也只是整個證件文檔的一小部分,故而應(yīng)當(dāng)保存在較快的儲存設(shè)備上。因此,在博物館證件文檔管理系統(tǒng)中,設(shè)計一個合理管理應(yīng)用程序非常重要。在博物館的安保系統(tǒng)中,往往需要及時調(diào)取身份信息,這就需要我們設(shè)計出讀取速度更快的設(shè)備,以適應(yīng)圖書館的實(shí)際需要。
在一般情況下,證件信息文庫處于局域網(wǎng)和廣域網(wǎng)的網(wǎng)絡(luò)中。為lan設(shè)計的程序很難被使用在wan上,這主要是因為lan的應(yīng)用程序需要十毫秒來執(zhí)行硬盤命令,因此,程序會自動的抹去執(zhí)行時間,而在wlan環(huán)境下,一般只需要五秒鐘時間才能完成,將近慢了五百倍。
3 檢索
證件文檔信息查找與檢索有密切關(guān)系。一般來說,獲取過程越詳細(xì),投入資源越大就越可以獲得一個高效方便的檢索技術(shù)。在目前技術(shù)中,主要檢索技術(shù)可以分為以下幾種:層次分類檢索法和文本查找檢索法。除了以上兩種方法之外,還有模糊查找方法、順序查找方法等等都能提高檢索的效率。在安保的過程中,可以先用層次分類法進(jìn)行檢索,如果不行可以兼顧其他的方法進(jìn)行檢索。
以上這些方法都使用了傳統(tǒng)數(shù)據(jù)庫讀取技術(shù),在文本檢索過程中,如果使用基于b-樹索引方法則查到時間更短,可以獲得信息也更多。在證件證檢索和連接上,使用超文本的www技術(shù)已經(jīng)非常普遍。但是,在這其中也會出現(xiàn)一些狀況,主要是因為證件證相關(guān)信息缺失,缺少主要的搜索主題。目前,已經(jīng)有越來越多的學(xué)者將原始證件信息檢索、超文本檢索、原信息檢索等等匯合在一起,通過高級語言方式使得檢索更加方便、更加迅速。
4 顯示
一個證件信息文檔管理系統(tǒng),由于要求不同,往往會產(chǎn)生不同的儲存方式。例如,通常一個證件信息文檔會采用三元組方式進(jìn)行表示,即顯示證件信息結(jié)構(gòu)、文本以及圖像。證件信息結(jié)構(gòu)和文本主要是為了便于檢索。證件信息結(jié)構(gòu)還有一些其他功能,比如在博物館參觀前可以進(jìn)行預(yù)約等等。
為了顯示證件信息的圖像,在網(wǎng)絡(luò)上可以用壓縮方式進(jìn)行傳輸,然后在目標(biāo)用戶器上直接解壓。為了實(shí)現(xiàn)此項技術(shù),需要不對稱解壓以優(yōu)化服務(wù)器的工作。在證件文檔顯示過程中,同樣會引發(fā)安全問題。由于并不是每一個證件信息都能得到有效處理,因此,在文檔管理系統(tǒng)中,必須將用戶信息分成各種類別,并給予各種權(quán)限。在wan應(yīng)用中,由于證件信息還在未知中轉(zhuǎn)站上進(jìn)行傳送,需要考慮匿名甚至使用假名來進(jìn)行收發(fā)。故而,在證件信息文檔傳輸過程中必須進(jìn)行加密。
5 在博物館安防中的證件信息的使用
在目前博物館安防系統(tǒng)中,最先進(jìn)的是采用人臉識別技術(shù)進(jìn)行安防。由于人臉識別技術(shù)是個人證件證件信息重要組成部分,對于博物館安放具有重要意義。
人臉識別主要是根據(jù)人面部特征進(jìn)行證件識別。由于人臉非接觸、直觀不易被假冒以及識別迅速等等優(yōu)點(diǎn),被廣泛應(yīng)用于博物館出入、視頻監(jiān)控等等系統(tǒng)中。但是在博物館的環(huán)境下,面對人流量不斷增多,人流量不斷復(fù)雜的情況,人臉識別系統(tǒng)也具有一定的難度。
目前,博物館的人臉識別系統(tǒng)最大挑戰(zhàn)主要在場景變化,例如采集位置、光照、人們姿態(tài)等等都會影響到人臉識別系統(tǒng)的采集。為了使博物館可以更好地使用該系統(tǒng),必須在證件管理系統(tǒng)中添加人臉識別子選項,以便更好做好博物館安防工作。
參考文獻(xiàn)
[1]黃結(jié)海.項目管理中文檔控制與管理的應(yīng)用[J].中華民居(下旬刊),2012(06):120.
[2]李軍.論工程項目文檔控制人員的素養(yǎng)[J].中國檔案,2010(09):52-53.
作者單位
中國國家博物館 北京市 100006