国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電子文件格式長期保存策略

2015-05-30 15:19:47徐萌
2015年24期
關(guān)鍵詞:電子文件

徐萌

摘要:電子文件格式登記系統(tǒng)是電子文件格式長期保存的重要方式之一,文章通過對電子文件長期保存格式的介紹上,著重分析了開發(fā)電子文件格式登記系統(tǒng)的必要性及其成功案例,包括PRONOM,MIME MTR,GDFR,UDFR,并對電子文件格式登記系統(tǒng)的未來發(fā)展做出了展望。

關(guān)鍵詞:電子文件;長期保存;文件格式;格式登記系統(tǒng)

電子文件長期保存是國內(nèi)外公認的電子文件管理的難點之一,國內(nèi)學(xué)術(shù)界目前的研究和實踐主要集中于采取軟硬件載體轉(zhuǎn)換、文件備份、格式轉(zhuǎn)化等被動管理的方式①。而電子文件存在形式是特定格式的,因此,格式管理是電子文件管理的源頭,電子文件的長期保存、可讀取首先要保證電子文件格式的長期保存、可讀取。

一、電子文件格式的長期保存

文件格式是一種電腦計算機用語,指計算機為了存儲信息而使用的對信息的特殊編碼方式,用于識別內(nèi)部儲存的資料。但通常我們認為格式就是指文件的類型,如PDF、JPEG等,這樣的理解只能滿足日常的應(yīng)用。為了保證電子文件的長期保存,文件格式還包括文件版本、壓縮算法、比特流編碼、軟硬件運行環(huán)境等更特殊、粒度更細的表示信息②。

(一)電子文件長期保存格式

目前,電子文件格式種類繁多,五花八門。由于電子文件產(chǎn)生于不同的應(yīng)用軟件、不同的硬件設(shè)備、不同的信息類型、不同的運行環(huán)境、不同的操作系統(tǒng)等,會產(chǎn)生類型不一的電子文件格式,電子文件證據(jù)保留工作將遭遇困難。

為了維護電子文件的有效性、真實性和完整性,各國國家檔案館在接收電子文件時會從源頭上限定接收的文件格式類型,選擇一些利于長期保存的文件格式,例如英國公共檔案館公布的《電子文件管理、鑒定和保護指南》明確規(guī)定可以接收的文件格式主要有PostScript,TIFF,SGML、PDF等③。我國《電子文件歸檔與管理規(guī)范》(GB/T 18894-2002)規(guī)定文字型電子文件的通用格式為XML、RTF、TXT;掃描性電子文件的通用格式為JPEG,TIFF;視頻、多媒體電子文件的通用格式為MPEG、AVI;音頻電子文件的通用格式為WAV、MP3。

(二)電子文件長期保存格式的特征

劉家真認為電子文件長期保存格式應(yīng)該具有下列特征:能在不同的環(huán)境下使用,通用而非專用,支持數(shù)據(jù)從專用格式的環(huán)境中移出,被業(yè)界和用戶廣泛支持,可擴展,可真實完整地被用戶讀出并理解,無論何時何地用戶所查到的文件信息都與該文件最初情況完全一致,具有自身的可證明性和可評價性④。

我國檔案行業(yè)標準《板式電子文件長期保存格式需求》(DA/T47-2009)明確規(guī)定了檔案系統(tǒng)對電子文件長期保存格式的需求:支持真實性、格式透明、不綁定軟硬件、格式自包含、格式自描述、固定顯示、持續(xù)可解釋、持續(xù)可用、可轉(zhuǎn)換、易存儲。

二、電子文件格式登記系統(tǒng)

電子文件格式登記系統(tǒng)是指能對數(shù)字文件格式的屬性進行描述、識別、記錄和保存,支持信息系統(tǒng)通過公開發(fā)行和規(guī)范的機制去發(fā)現(xiàn)所需要的文件格式信息,進而識別、轉(zhuǎn)換、展示和保存相應(yīng)文件的系統(tǒng)⑤。電子文件格式登記系統(tǒng)保存了各種常見的文件格式以及創(chuàng)建、運行和遷移這些文件格式的軟件的相關(guān)技術(shù)信息。通俗地講,電子文件格式登記系統(tǒng)就是給文件格式“上戶口”。

(一)電子文件格式長期保存的必要性

1、文件格式生命周期縮短

雖然各國檔案館在接收電子文件時都嚴格規(guī)定了電子文件接收格式,但由于文件格式具有生命周期,信息技術(shù)發(fā)展速度越快,文件格式生命周期就越短。當前新技術(shù)的飛速發(fā)展使得一些文件格式在較短的時間內(nèi)就遭到廢棄或被取代,文件格式的生命周期越來越短。所以,即使是電子文件長期保存格式,我們也無法確保幾十年或幾百年后它是否還適合長期保存。當這些格式被廢棄或被取代后,以這種格式保存的無數(shù)的電子文件就會面臨無法讀取的危險。

2、特殊文件格式受專利保護

在一些專門領(lǐng)域,會形成很多特殊的、專門的格式,一些特定的電子文件只能通過這種格式才能被解碼并顯示、讀取,而這種格式又只能通過特殊的軟硬件設(shè)備才能有效地運行。但由于這些格式為某單位私有或受專利的保護,因此未向社會公開。當這些電子文件向檔案館移交時,由于檔案館并沒有支持此格式運行的軟硬件設(shè)備,所以以這種特殊的專門格式保存的電子文件在檔案館中就成為“死檔”。另外,當這種格式由于更新?lián)Q代遭到廢棄時,因為沒有關(guān)于此格式的相關(guān)信息,所以當用戶需要利用這份文件時卻不能讀取它,使其失去利用價值。

3、歷史文件格式未及時轉(zhuǎn)換

傳統(tǒng)的檔案鑒定原則沒有涉及電子文件格式的鑒定,因此早期的一些電子文件在向檔案館移交時并沒有進行格式的鑒定和轉(zhuǎn)換,從而使得檔案館中保存了大量的以不利于長期保存的格式存在的電子文件。由于文件格式的更新?lián)Q代和軟硬件等設(shè)備的不斷升級,以及對傳統(tǒng)電子文件格式的忽略,一些特定格式的電子文件就同樣面臨成為“死檔”的危險。

因此,針對這些問題,最有效的辦法就是建立一個電子文件格式登記系統(tǒng),把文件格式及與其相關(guān)的軟件、技術(shù)等信息一并登記,以便電子文件格式及電子文件的長期保存和查詢。

(二)電子文件格式登記系統(tǒng)的功能

1、防止格式過時帶來的信息損失

電子文件格式登記系統(tǒng)能跟蹤文件長期保存由于格式過時可能造成的潛在信息損失,當文件有可能出現(xiàn)過時的情況時,系統(tǒng)的查詢和自動提醒系統(tǒng)能夠幫助我們得到應(yīng)當轉(zhuǎn)換的格式,然后利用系統(tǒng)提供的轉(zhuǎn)換工具和服務(wù)直接轉(zhuǎn)換。

2、持久維護文件格式的描述信息

電子文件格式登記系統(tǒng)支持對文件格式的公共描述以及這些描述信息的持久維護,從而在被保存對象、保存技術(shù)與保存環(huán)境的不斷變化中能識別、解析、遷移、轉(zhuǎn)換和保存各種格式的數(shù)字資源⑥。

(三)電子文件格式登記系統(tǒng)的成功案例

1、PRONOM⑦

PRONOM是提供關(guān)于電子文件長期保存所必需的關(guān)于文件格式、軟件產(chǎn)品和其他技術(shù)要素等方面的公正、權(quán)威信息的在線技術(shù)登記系統(tǒng)。它最初是英國國家檔案館為支持其自身的電子文件接收與長期保存而開發(fā)的,現(xiàn)在已經(jīng)發(fā)展成為通過網(wǎng)絡(luò)向所有人開放的資源庫,它保存了軟件產(chǎn)品信息與產(chǎn)品可讀寫的文件格式信息,包含格式的標式信息、環(huán)境信息、保存規(guī)劃信息與其他技術(shù)參數(shù),而且個人還可以通過在線方式提交新的文件格式到PRONOM。

PRONOM網(wǎng)站與英國國家檔案館網(wǎng)站的整體風(fēng)格一致,簡潔美觀,而且使用非常方便簡單,無需專門培訓(xùn);PRONOM運用權(quán)限控制,采用用戶名和密碼限制特定人員進入管理系統(tǒng),安全可靠;PRONOM的主系統(tǒng)和公共系統(tǒng)能夠支持超過100名用戶同時利用系統(tǒng),性能強大;在檢索方面,PRONOM支持七種檢索方式:簡單檢索、格式名稱/擴展名檢索、PUID(PRONOM永久唯一標識符)檢索、軟件名稱檢索、組織名稱(格式開發(fā)組織)檢索、生命周期檢索(即在某一個日期被支持的文件格式、軟件名稱)、遷移路徑檢索等。

2、MIME MTR⑧

MIME MTR(多用途網(wǎng)際郵件擴展協(xié)議媒體類型注冊,Multipurpose Internet Mail Extensions Media Types Registry)是目前最多被使用的格式登記系統(tǒng),由IANA(互聯(lián)網(wǎng)數(shù)字分配機構(gòu)Internet Assigned Numbers Authority)管理維護,提供關(guān)于Internet上傳輸文件的類型和格式的權(quán)威、標準的定義信息、編碼信息、參數(shù)信息等。

MIME MTR主要登記關(guān)于MIME文件的屬性信息,目前共有9種媒體類型,分別是應(yīng)用文件、音頻、示例、圖像、信息、模型、多媒體類型文件、文本、視頻。每個媒體類型還有子媒體類型。登記的格式屬性包括MIME類型名稱、MIME子類型名稱、編碼要求、必備參數(shù)、可選參數(shù)、發(fā)布說明、安全要求、聯(lián)系人、互操作要求、所支持的應(yīng)用等。

MIME允許在線登記,用戶可以通過瀏覽的方式來查看文件類型和類型定義。如果用戶要了解相應(yīng)的格式,鏈接的格式信息可以被用來定義文本,獲得查驗和解讀格式技術(shù)參數(shù)。

3、GDFR⑨

GDFR(全球數(shù)字格式登記系統(tǒng),Global Digital Format Registry)在美國哈佛大學(xué)主持下建立,是為了提供持久的存儲、發(fā)現(xiàn)、利用文件格式表征信息的分布式服務(wù)。它將文件格式解釋成一種穩(wěn)固的以位序列編碼的信息模型,本質(zhì)上是一種可交換的正式的知識表達,具體的內(nèi)容流與屬性可以通過一定的表示信息來說明。不管哪一種文件格式,都可通過某個格式分類體系注冊于某個格式登記系統(tǒng),用唯一的標識符來標記這三種文件格式。

GDFR建立了特有的格式對象數(shù)據(jù)模型,包括四類屬性:特征屬性、一般描述屬性、操作屬性、管理屬性。每個格式的基本屬性包括:標識符、別名、分類、關(guān)系、創(chuàng)建者、所有者、維護者、工具、狀態(tài)、定義說明、簽名、來源和注釋等。

GDFR主要提供四類服務(wù):管理服務(wù),發(fā)現(xiàn)新格式和棄用格式,評審、發(fā)布新格式,修改、刪除廢棄格式;檢索服務(wù),依照檢索請求提供特定格式的描述信息,向特定的存儲庫推送登記的格式信息;表示服務(wù),確定并驗證特定電子文件的格式;中介服務(wù),轉(zhuǎn)換格式,提取特定格式的電子文件中的元數(shù)據(jù)。

4、UDFR⑩

由于GDFR和PRONOM的格式登記不是由同一地區(qū)主導(dǎo),具有一些局限性:PRONOM是英國國家檔案館的一個部門來承擔(dān)的,所以協(xié)作相對容易,但是它的實施范圍不夠廣;而GDFR是由哈佛大學(xué)領(lǐng)導(dǎo),多個機構(gòu)共同參加的項目,它的溝通不夠充分,技術(shù)性也沒有PRONOM好。這種情況下,國家IT和檔案領(lǐng)域相關(guān)專家認識到建立一種全球統(tǒng)一的文件格式登記系統(tǒng)是有必要的。

UDFR(統(tǒng)一數(shù)字格式登記系統(tǒng),Unified Digital Format Registry)由美國加州大學(xué)內(nèi)容管理中心帶頭研發(fā),加州數(shù)字圖書館提供資金支持。它融合了GDFR和PRONOM的優(yōu)點,數(shù)據(jù)來源于MIME和PRONOM。2009年4月正式成立,2012年7月投入生產(chǎn)使用。UDFR是一個開源的、基于語義可用平臺的系統(tǒng),該系統(tǒng)是為了收集、長期管理和傳播與人們利益相關(guān)的具有重要意義的文件格式屬性。

UDFR登記的格式屬性包括文件格式、字符編碼、壓縮算法、標識符、外部簽名、內(nèi)部簽名、MIME類型、代理商、軟件包、軟件過程、知識產(chǎn)權(quán)報表、關(guān)系等。

三、電子文件格式登記系統(tǒng)的未來發(fā)展

數(shù)字檔案館在不斷發(fā)展進步,而電子文件格式登記系統(tǒng)也必將面臨新的挑戰(zhàn),在接受挑戰(zhàn)的過程中,電子文件格式登記系統(tǒng)將會向著一個新的方向發(fā)展:第一,加強國際合作,從單一的或獨立的格式登記系統(tǒng)發(fā)展成為分布式聯(lián)合服務(wù)系統(tǒng),如UDFR,這就把維護管理登記系統(tǒng)的重擔(dān)和責(zé)任分攤到多個承擔(dān)者身上;第二,從被動的格式登記系統(tǒng)發(fā)展為主動的監(jiān)測系統(tǒng),不斷指引用戶去主動、規(guī)范、及時地在線提交格式技術(shù)信息和格式變化信息;第三,從單一的公告版式系統(tǒng)發(fā)展到智能的格式識別系統(tǒng),支持通過分析軟件對格式進行自動標識、驗證、屬性描述和轉(zhuǎn)換等功能;第四,與其他登記系統(tǒng)有機連接,支持對復(fù)雜信息環(huán)境下多層次和多樣化對象的無縫識別、驗證和轉(zhuǎn)換。當實現(xiàn)以上這些功能時,電子文件格式登記系統(tǒng)將作為一個公共服務(wù)機制,為電子文件的長期保存提供有力的支撐。(作者單位:山東科技大學(xué))

注解:

① 閆曉創(chuàng).國外電子文件格式登記系統(tǒng)研究[J].浙江檔案,2013(3):15-18

② 李澤鋒.基于OAIS電子文件管理系統(tǒng)體系研究[M].上海:中國出版集團,2010:120-121

③ 鞠曉嵐.英國電子文件向檔案館的移交[J].中國檔案,2004(7):44-45

④ 劉家真.文件保存格式與PDF文檔[J].檔案學(xué)研究,2002(2):46-51

⑤ 梁娜,張曉琳.數(shù)字文件格式登記系統(tǒng)[J].圖書情報工作,2005(11):80-84

⑥ 梁娜,張曉琳.數(shù)字文件格式登記系統(tǒng)[J].圖書情報工作,2005(11):80-84

⑦ The National Archives.The technical registry PRONOM[EB/OL].[2013-12-22].http://www.nationalarchives.gov.uk/PRONOM/Default.aspx

⑧ INAN.MIME Media Types.[EB/OL].[2013-12-22].http://www.iana.org/assignments/media-types/media-types.xhtml

⑨ GDFR.[EB/OL].[2013-12-22].http://hul.harvard.edu/gdfr/documents.html

⑩ UDFR.[EB/OL].[2013-12-22].http://www.udfr.org/.

參考文獻:

[1]閆曉創(chuàng).國外電子文件格式登記系統(tǒng)研究[J].浙江檔案,2013(3):15-18

[2]李澤鋒.基于OAIS電子文件管理系統(tǒng)體系研究[M].上海:中國出版集團,2010:120-121

[3]鞠曉嵐.英國電子文件向檔案館的移交[J].中國檔案,2004(7):44-45

[5]劉家真.文件保存格式與PDF文檔[J].檔案學(xué)研究,2002(2):46-51

[6]梁娜,張曉琳.數(shù)字文件格式登記系統(tǒng)[J].圖書情報工作,2005(11):80-84

[7]The National Archives.The technical registry PRONOM[EB/OL].[2013-12-22].http://www.nationalarchives.gov.uk/PRONOM/Default.aspx

[8]INAN.MIME Media Types.[EB/OL].[2013-12-22].http://www.iana.org/assignments/media-types/media-types.xhtml

[9]GDFR.[EB/OL].[2013-12-22].http://hul.harvard.edu/gdfr/documents.html

[10]UDFR.[EB/OL].[2013-12-22].http://www.udfr.org/

猜你喜歡
電子文件
圖像電子文件的歸檔格式及其轉(zhuǎn)換研究
檔案管理(2017年1期)2017-01-17 19:15:57
電子文件檢查歸檔移交備份存儲機研究
淺談電子文檔與紙質(zhì)文檔在保護技術(shù)上的差異
檔案管理中電子文件的存儲探究
淺談電子文件的全過程管理
淺談交通運輸部門檔案管理中的信息化建設(shè)
活力(2016年6期)2016-06-22 01:33:11
淺析傳統(tǒng)紙質(zhì)檔案管理與電子檔案管理的區(qū)別
國內(nèi)外電子文件管理標準的對比研究
科技視界(2016年2期)2016-03-30 20:16:59
“新詹金遜主義”管窺
檔案管理(2015年5期)2016-01-05 20:50:30
工程設(shè)計電子文件的非線性流轉(zhuǎn)模型及其功能分析
檔案管理(2015年2期)2015-04-23 21:06:48
蒙城县| 府谷县| 新乡市| 广安市| 淮滨县| 乌拉特后旗| 利辛县| 彩票| 瑞金市| 富宁县| 台中市| 麻栗坡县| 庆元县| 揭阳市| 油尖旺区| 桦甸市| 石狮市| 孟津县| 黄梅县| 丰镇市| 阿拉尔市| 彰武县| 乐陵市| 鄱阳县| 阿城市| 安吉县| 车致| 洪江市| 利川市| 泊头市| 柘城县| 贡觉县| 孙吴县| 白银市| 和龙市| 遂平县| 甘谷县| 容城县| 武清区| 辽阳市| 齐齐哈尔市|