陳麗榕
(莆田市后海圍墾管理局,福建 莆田 351100)
檔案的信息化管理需要一定的技術支撐,通過建立電子檔案數據庫,來完成檔案的管理并且還能夠實現(xiàn)檔案的信息共享。電子檔案在進行歸檔保存的時候需要通過一些技術來實現(xiàn),其中需要注意的就是保持電子檔案格式的標準化。
電子檔案在進行管理的時候需要建立數據庫,通過數據庫來完成檔案的存儲以及管理等工作。數據庫管理系統(tǒng)中承擔文件職責的數據或者是文件的主要組成成分都可以稱為電子文件。目前大多數數據庫中都存在著大量的表格,這些表格中還會有不同的字段,這些字段中含有不同類型的數據。數據庫中數據表的數據就是電子檔案的內容,表結構以及表間關系是一些電子文檔的背景信息,比如數據庫權限、日志以及結構信息等。這些背景信息也是構成電子文檔的重要因素。
數據庫中的電子文件與傳統(tǒng)的電子文件有著很大的不同,因為數據庫中的電子文件之間存在一定的聯(lián)系,并且其內部的邏輯關系也比較復雜,也就是說數據庫中的電子文件是一個有機的整體,但是不同數據庫中的電子文檔只能由自己管理系統(tǒng)中的軟件讀取。傳統(tǒng)的電子文檔進行歸檔的時候檔案內容已經辦畢了,但是數據庫中的電子文檔可以隨著檔案的變化而進行調整[1]。
電子文件歸檔的依據是歸檔范圍,但是數據庫中的電子文檔之間都是相互聯(lián)系的,這也就導致了歸檔范圍難以確定。如果在進行歸檔的時候將全部的文件歸檔,那么就會有一些多余的信息出現(xiàn),使得電子文檔不夠簡潔。但是如果只選擇其中一部分文件進行歸檔,那么就會造成檔案信息的丟失,從而降低了檔案的價值。同時,由于電子檔案的數據是處于動態(tài)變化中的,這樣也很難確定歸檔范圍。
當前很多數據庫在研究電子文件的時候,分為兩種不同的方式。首先是整體論,這種方式是在整體的電子文件數據庫中挑選歸檔文件,但是其需要后臺管理系統(tǒng)做技術支撐。還有一種是分散論,就是對所有的數據進行分析,找出需要管理保存的文件,然后再制定具體的管理辦法。這種方式是在管理系統(tǒng)的前臺進行電子文件管理的,但是與整體論一樣都是選擇有價值的文件進行歸檔處理。
電子文件進行歸檔的時候可以選擇物理歸檔,也可以選擇邏輯歸檔。其中邏輯歸檔不會對電子文件的存儲方式和位置進行改變,只是將權限做了移交。但是物理歸檔時將電子文件從原有的系統(tǒng)中脫離出來,移交給專門的檔案管理部門。如果電子文件是保存在數據庫中的,那么進行歸檔處理的時候就要考慮數據庫的安全、效率、規(guī)模以及類型等問題,因為數據庫中的電子文件會隨著實際情況而發(fā)生變化。采取邏輯歸檔的方式,那么一旦業(yè)務系統(tǒng)遭到破壞,就會影響到電子文件,使得歸檔工作不能有效進行。但是選擇物理歸檔的話,電子文件一旦離開數據庫就無法進行讀取,因此也是應該考慮到的問題。
電子文件從生成到保存都需要計算機系統(tǒng)作為技術支撐。但是電子文件在整個生命周期中對用戶都是不透明的,用戶操作的時候只能通過DBMS,但是DBMS的類型不同的話,那么電子文件之間也不能互操作,這樣電子文件對計算機系統(tǒng)的依賴程度比較高,管理起來也就比較困難。因此進行歸檔的時候,不僅要保證電子文件的信息、背景以及內容沒有缺失,還要保證電子文件在別的系統(tǒng)中仍然有可讀性。比較傳統(tǒng)的方式是將電子文件以及系統(tǒng)一起保存。但是這種方式需要對系統(tǒng)進行專門的歸檔,同時當出現(xiàn)新的系統(tǒng)時還要重新進行歸檔,使得管理成本升高。因此應該選擇更加科學的歸檔方式,不僅要保證電子文件的安全、完整以及真實,同時還應該降低對系統(tǒng)的依賴,使其在不同的系統(tǒng)中都能夠讀取。
當電子文件歸檔后主要的目標就是長期保存。因為數據庫中的電子文件之間是相互聯(lián)系并且依賴系統(tǒng)的,因此不能選擇傳統(tǒng)的長期保存方式。進行電子文件長期保存的時候,應該考慮到所選擇的技術、管理以及相關政策等多方面的因素。但是由于我國的電子文件管理起步比較晚,因此相關的標準規(guī)范還不夠完善,同時相關的管理方式以及保存技術還比較落后,這樣導致在電子文件長期保存的時候沒有相應的參考,也是一個難點問題。
進行電子文件歸檔與長期保存的時候,需要解決的問題比較多,比如不同類型DBMS的差異性、電子文件背景信息、結構以及內容的封裝、電子文檔長期保存的實現(xiàn)方式等。通過分析采用一些技術手段來解決上述的一些問題,首先是不同DBMS電子文件的歸檔,由ODBC提供統(tǒng)一的數據接口。對電子文件的信息內容等進行封裝的時候由DPT實現(xiàn),這種方式是以SIARD數據庫歸檔標準以及XML可擴展標記語言為基礎的,使得電子文件對系統(tǒng)的依賴性降低。進行歸檔電子文件的長期保存的時候以信息包的形式流轉在各管理模塊中,而對歸檔的電子文件進行歸檔的時候可以使用DVT。這樣通過各種技術可以解決電子文件歸檔和長期保存時遇到的各種難題。
目前市面上存在的數據管理系統(tǒng)比較多,不同類型甚至同一系統(tǒng)不同版本之間的電子文檔格式都是不同的,因此不同系統(tǒng)的文件不能互相操作。而ODBC則形成了一套標準的規(guī)范,其可以在數據系統(tǒng)與電子文件之間建立統(tǒng)一的接口,這樣就可以通過不同的系統(tǒng)對電子文件進行讀取,也為電子文件的集中歸檔提供了方便。
數據庫在發(fā)展的過程中產生的數據模型比較多,比如對象模型、網狀模型以及層次模型等,但是這些數據模型對于系統(tǒng)的依賴程度比較高,歸檔的時候比較困難。而還有一種模型是關系數據模型,其數據結構基礎是二維表,這樣就很好地解決了電子文檔對系統(tǒng)的依懶性問題。對這種數據模型的電子文件進行保存的時候可以選擇將二維表轉化為XML格式,這樣使得電子文件比較容易讀取,因此目前很多數據庫都在使用這種模型。XML是W3C推薦的標準,其特點是具有較高的靈活性以及可擴展性,這樣用戶就能自定義標簽格式,電子文檔就能在不同的管理系統(tǒng)中進行操作。
進行電文文件的長期保存時使用OAIS技術能夠提供基本概念框架與參考模型,使得系統(tǒng)中的電子文件能夠長期的保存和讀取。OAIS中的參考模型有保存規(guī)劃模塊、存取模塊、數據管理模塊、檔案存儲模塊以及攝取模塊等,同時信息數據是以信息包的形式存在的,能夠在各模塊之間流轉。
對電子文件進行保存的時候,首先應該將其轉換為符合XML規(guī)范的SIARD文件,然后以數據包的形式進入攝取模塊,對電子文檔的所有信息進行檢驗,使其能夠符合封裝的標準。檔案存儲模塊能夠將SIP封裝為可以長期保存的AIP檔案信息,進行封裝的時候要保證檔案的內容是完整可靠的。
隨著科學技術的不斷發(fā)展,電子文件的管理方式也越來越多。但是由于我國的電子文件管理起步比較晚,因此相關制度以及技術都比較落后。進行電子文件歸檔和長期保存的時候,可以使用一些技術手段,比如XML、OAIS等。