国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字信息保存系統(tǒng)威脅比較研究

2012-04-13 09:12楊琳
河南圖書館學刊 2012年6期
關鍵詞:存儲介質數(shù)字信息數(shù)字

楊琳

(鄭州圖書館,河南 鄭州 450053)

1 數(shù)字信息保存系統(tǒng)威脅分析

作為數(shù)字信息保存項目的核心,數(shù)字信息保存系統(tǒng)無疑應當是數(shù)字保存項目的研究重點。然而國內(nèi)外的研究現(xiàn)狀表明,目前僅有幾個項目提出了“數(shù)字信息保存系統(tǒng)”概念并進行初步的系統(tǒng)實現(xiàn),對數(shù)字信息保存系統(tǒng)可能遇到的障礙及應對策略進行研究的項目就屈指可數(shù)。數(shù)字信息保存系統(tǒng)實現(xiàn)數(shù)字資源的長期保存的具體時間尚不明確,一般的理解是依據(jù)現(xiàn)有的技術和條件,能夠實現(xiàn)的最長的時間。它要比單個存儲介質或單個軟硬件或信息的存儲格式的壽命都要長。因此,為了實現(xiàn)數(shù)字信息“長期保存”的目標,筆者分析了數(shù)字信息保存系統(tǒng)的常見威脅,并結合實例總結提出若干應對策略。

1.1 技術威脅

數(shù)字信息保存系統(tǒng)在技術上面臨三大威脅因素:一是存儲載體不耐久;二是讀寫信息的計算機軟硬件技術過時;三是數(shù)字信息的真實性。[1]

(1)存儲介質易脆性:數(shù)字信息是存儲在各種類型的物理媒體上的。它既可以承載于磁盤和光盤,又可以存儲于網(wǎng)絡服務器。由于數(shù)字存儲介質的物理特性而天生不穩(wěn)定,如果沒有相適應的存儲環(huán)境和管理,可能迅速破碎,引起諸如磁盤損壞、脫機媒體損壞等暫時性的或永久性的故障。

(2)技術老化:數(shù)字信息的長期可用依賴相應軟件,而這些軟件又依賴專門的操作系統(tǒng)甚至硬件系統(tǒng),一旦離開了軟硬件系統(tǒng),數(shù)字信息的使用價值也就結束了。然而近二十年來經(jīng)常性的技術變化引起了重大的技術變革,因此技術老化被大部分館藏管理者看作是對數(shù)字存儲的最大威脅。[2]

(3)內(nèi)容真實性:與紙質環(huán)境相比,在數(shù)字環(huán)境中對存儲內(nèi)容進行改動顯得更加容易。不論是故意還是無意所致,辯別數(shù)字信息的真?zhèn)我殉蔀槟壳耙粋€比較棘手的問題。

1.2 環(huán)境威脅

環(huán)境威脅因素[3]主要包括網(wǎng)絡環(huán)境、組織環(huán)境及自然環(huán)境。

(1)網(wǎng)絡環(huán)境:這主要指數(shù)字保存系統(tǒng)的外部網(wǎng)絡服務(包括域名及URLs)可能會遇到暫時性的或永久性的故障;在某特定時間段內(nèi),網(wǎng)絡可能會出現(xiàn)傳輸錯誤(傳輸失敗或部分傳輸);數(shù)字保存系統(tǒng)易遭受公網(wǎng)上的病毒攻擊。

(2)組織(機構)因素:組織機構的解體、破產(chǎn)或使命改變可能導致數(shù)字保存系統(tǒng)的技術喪失。遇到此種威脅,要么有后繼組織接管,要么進行其他的合理處置。

(3)自然災害:如洪水、火災及地震等各種自然災害都可能給數(shù)字保存系統(tǒng)帶來意外故障。

1.3 其他威脅

其他威脅因素包括人為因素[3]、成本因素[3][4]及知識產(chǎn)權因素[5]。

(1)人為因素:這主要指計算機專家和操作人員兩方面。由于計算機專家經(jīng)常授權訪問數(shù)字保存系統(tǒng),就算將系統(tǒng)與外部網(wǎng)絡隔離能夠防止了外部病毒的襲擊也難抵御內(nèi)部攻擊。操作人員的不良行為也可能造成暫時性的或永久性的系統(tǒng)故障。這種故障不僅可能發(fā)生在數(shù)字保存系統(tǒng)本身,而且也可能發(fā)生在操作系統(tǒng)、應用程序、硬件設施及計算機網(wǎng)絡。

(2)成本因素:首先將數(shù)字保存成本與文獻數(shù)字化的成本區(qū)分開來,后者只是前者的一部分。數(shù)字保存成本不僅大于文獻數(shù)字化成本,而且與保存紙質文獻相比,更易受到經(jīng)費的影響,因為如耗電、帶寬、系統(tǒng)管理、域名注冊等一系列數(shù)字保存活動都需要經(jīng)費作保障。

(3)知識產(chǎn)權:知識產(chǎn)權問題是數(shù)字保存面臨的重要挑戰(zhàn),從數(shù)字信息的收集開始,知識產(chǎn)權問題就出現(xiàn),而數(shù)字保存進程的每一個階段又都與此息息相關,不可分割。但到目前為止,各個國家和地區(qū)都沒有完整的數(shù)字保存知識產(chǎn)權法律,這不能不說是影響數(shù)字保存的重要因素。

2 數(shù)字保存系統(tǒng)威脅的應對策略

2.1 普通文本的“雙套制”解決方案[5]

復制/拷貝又稱數(shù)據(jù)更新,是在原來的技術環(huán)境下實時重寫信息數(shù)據(jù),將數(shù)據(jù)流從舊存儲介質轉移到新存儲介質上,防止由于存儲介質理化性能變化而引起的信息丟失。這種方法早就已經(jīng)大量應用于磁帶、磁盤、光盤的保存上。但這只是一項常規(guī)的管理工作,并不是真正解決由于計算機軟硬件過時引起的長期保存問題。再生性保護技術指將技術過時的數(shù)字信息實時的轉移到縮微品或紙上。由于縮微膠片存儲量大、壽命長(其保存壽命理論值是500年,國際上已有100多年的實踐經(jīng)驗,國內(nèi)也有幾十年的實踐經(jīng)驗。)、便于保管、不再使用計算機軟硬件技術讀取,因此,它為長期保存數(shù)字信息提供方便,并且可避免計算機軟硬件技術過時所帶來的任何麻煩。于是,筆者認為數(shù)字拷貝和保存縮微膠片的“雙套制”方案[6]為保存使用頻率較低的純文本信息,而不是聲音、超文本、多媒體信息提供了一種最佳方案。隨著所謂攝影技術和設備的發(fā)展,縮微膠片記錄的模擬信息,能進入計算機網(wǎng)絡系統(tǒng),不用擔心數(shù)字信息會失去它原有的數(shù)字風格。

2.2 技術仿真策略[4][5]

技術仿真策略是在實施拷貝保存數(shù)字信息內(nèi)容的同時,制造一種能運行過時軟硬件的軟件,在這種軟件中對某一過時的軟硬件進行模仿,使得保存的數(shù)字信息能在模擬的軟件上運行,這是一種延遲技術淘汰的方法。實際上這和“計算機技術檔案館”方法有關,由于保存有關軟件版本和硬件設備的物理實體建立“計算機技術檔案館”對大多數(shù)保存機構來說都不現(xiàn)實,因此,人們更多的是詳細描述數(shù)字信息利用和各種技術參數(shù)和環(huán)境條件,以便未來計算機系統(tǒng)可以模仿原始系統(tǒng)環(huán)境來讀取和使用數(shù)字信息內(nèi)容。技術方針策略使我們總可通過新的仿真器來仿真上一代仿真虛擬機,因此不必持續(xù)更新針對特定數(shù)字信息的定義語言、仿真說明、解釋器等。從技術的角度來看是可行的,但在實際中它的兼容性并不可靠,仿真器自身的耐用性不穩(wěn)定,所以筆者認為這不太可能是一直有效的方法,軟件制造商也可能最終放棄某些軟件的向下兼容性。

2.3 數(shù)字信息格式遷移策略[3][5]

遷移是持續(xù)地將數(shù)字信息從一種技術環(huán)境轉換到另一種技術環(huán)境,意味著基于字符的數(shù)據(jù)可以從一個存儲介質轉移到另一個存儲介質上,以進行數(shù)字信息的長期保存,同時,也可以將原始數(shù)據(jù)格式轉換為獨立于具體原始軟硬件平臺的標準數(shù)據(jù)格式,由于這些原始數(shù)據(jù)格式的開放性和標準性,可以保證總有相應軟硬件系統(tǒng)來處理這些數(shù)據(jù)。這種方法維護了數(shù)字對象的物理形體,也保護了其內(nèi)容存在,但可能無法保證其外觀、功能和背景信息等,限制遷移過程中的各種損失是使用這種方法的關鍵,但它至少對于結構簡單的單一文件是比較適用的。盡管各機構采用數(shù)字遷移策略,但具體實施辦法又有所不同,有的是改變存儲媒體(如再生性保護技術,筆者認為它是遷移策略的一種方法),這種方法主要用于保存使用頻率較低的數(shù)字信息;有的是格式遷移(也是狹義的遷移策略),適于保存使用頻率較高的數(shù)字信息。為了建立有效的數(shù)據(jù)格式遷移戰(zhàn)略,需要對數(shù)字文獻格式進行標準化處理,如澳大利亞國家檔案館采用了規(guī)范化方法,就是將各種數(shù)字信息存檔為通用的XML格式,荷蘭國家圖書館(KB)僅接受PDF格式的數(shù)字信息。

2.4 評估策略[3]

采用評估策略的原因有二:一是在獲取數(shù)字信息階段對獲取的數(shù)字信息進行評估以檢驗其真實性;二是對保存特色文獻的系統(tǒng)評估及時發(fā)現(xiàn)潛在故障,從而降低維修成本。

評估方法主要有第三方評估和互評估。前者是一種常用的評估方法,它是將被檢索的系統(tǒng)內(nèi)容樣本與被檢索的內(nèi)容摘要及保存在其他系統(tǒng)內(nèi)的內(nèi)容摘要比較。如果先前的文摘是按SIP(遞交信息包)處理的,那么就包含了元數(shù)據(jù)。如果系統(tǒng)能將檢索到的SIP作為DIP(傳播信息包)的部分或全部內(nèi)容,那么系統(tǒng)就具備了端到端檢測系統(tǒng)的性能。其不足是信息內(nèi)容及原有文摘都以比特流的形式存在,可能會導致二者錯誤匹配?;ピu估對原有文摘信息不會產(chǎn)生風險。這種評估機制的優(yōu)點是不必向評估人員泄露信息內(nèi)容;不足之處是不能進行端到端的評估。兩種方法各有千秋,于是筆者認為二者恰當?shù)慕Y合對于數(shù)字信息的長期保存更是相得益彰。

2.5 經(jīng)濟策略[3]

保存數(shù)字信息要比紙質文獻的成本高。數(shù)字保存系統(tǒng)的運作過程可分為獲取數(shù)字信息及相關元數(shù)據(jù)、保存及發(fā)布數(shù)字信息三個階段,每個階段都有其成本構成。

首先,獲取階段的成本有獲取數(shù)字信息的產(chǎn)權許可費用、獲取數(shù)字信息費用及相關元數(shù)據(jù)的費用三部分構成。其次,保存階段的成本有三部分構成:購買并持續(xù)更新軟硬件的費用;業(yè)務成本如電力、帶寬、員工的時間及評估成本;格式遷移成本。最后,發(fā)布階段的成本有兩部分構成:保存數(shù)字信息協(xié)議條款中規(guī)定的費用以及向授權用戶發(fā)布數(shù)字信息的費用。前者主要指認證系統(tǒng)的管理成本,如引導用戶進入和退出系統(tǒng)及監(jiān)督有關出版機構的管理費用;向授權用戶發(fā)布數(shù)字信息的費用一般都很低,主要指操作web服務器和帶寬的花費。

根據(jù)以最小的投入獲得最大的收益這一經(jīng)濟學原理,數(shù)字保存系統(tǒng)的主辦機構在經(jīng)費有限的情況下,就必須考慮以最小的成本投入保存更多的信息資源,并降低保存風險。筆者所說的經(jīng)濟策略主要指降低獲取和保存階段的成本。主要措施有:采取保存本單位擁有版權的資源,健全版權許可法律體系等措施來降低產(chǎn)權許可費;通過對獲取過程及評估系統(tǒng)實施自動化管理來降低獲取數(shù)字信息的成本;通過采用機器自動生成元數(shù)據(jù)或從數(shù)字信息創(chuàng)建者那里獲取數(shù)字信息時一起獲取元數(shù)據(jù)來降低獲取元數(shù)據(jù)的成本;由于對數(shù)字信息實施單獨管理或將數(shù)字保存系統(tǒng)與其他基礎設施集成管理降低業(yè)務成本的方案風險性高,因此盡量使操作人員參與系統(tǒng)操作;采用適當?shù)霓D移方法來降低格式遷移成本。

2.6 健全數(shù)字保存法律規(guī)定,建立全國統(tǒng)一的數(shù)字信息歸檔系統(tǒng)[5][7]

目前,一些傳統(tǒng)的圖書館、檔案館與其他文獻收藏部門,開始收藏數(shù)字文獻,并提供網(wǎng)上瀏覽與借閱,但這些傳統(tǒng)圖書館包括發(fā)達國家的數(shù)字圖書館,都沒有把數(shù)字信息長期保存納入其職能范圍之內(nèi)。這樣,就使得一些在網(wǎng)上流動的、未被收容的、有價值的信息,在當前技術情況之下無法長期保存。因此,有必要建立一個全國數(shù)字信息歸檔系統(tǒng),使之對全國文化、經(jīng)濟、科技、社會等領域的數(shù)字信息的存貯和存取承擔管理責任,使之成為我國數(shù)字信息的資源基地。

法定保存是解決數(shù)字保存面臨的知識產(chǎn)權問題的首選方法,而且它為數(shù)字信息歸檔系統(tǒng)提供了強有力的資源保障。各國采用不同的方法實施法定保存,英國采用法律條文規(guī)定,澳大利亞采用法律覆蓋和自愿收集的混合法。筆者認為建立數(shù)字信息呈繳本制度具有可行性,因為印刷文獻的呈繳本制度在各國廣泛實施,成功地解決了印刷文獻長期保存的知識產(chǎn)權問題,對于人類文化遺產(chǎn)的長久傳承發(fā)揮了關鍵作用。由于數(shù)字信息的真?zhèn)坞y辨,數(shù)字信息的呈繳本制度可能會比印刷文獻的呈繳本制度實施方面具有一定的難度,但在丹麥、芬蘭和挪威等少數(shù)國家已有先例存在。當然,解決知識產(chǎn)權問題的方法還有法定許可等措施。

3 結語

每種新技術都是一把雙刃劍,所有的技術解決方案都不是盡善盡美的,只是部分地解決了問題,因此,筆者建議選擇數(shù)字保存系統(tǒng)的風險防范策略時,要根據(jù)選擇技術方案的要求和標準[6](保存什么、為誰保存及怎樣保存)來選擇最理想的技術解決方案。

[1] 郭瑞華.數(shù)字信息長期存取策略研究[J].情報理論與實踐,2002(2).

[2] Hedstrom,M,Montgomery,S.Digital Preservation Needs and Requirements inRLGMember Institutions.RLG website.http://www.rlg.ac.uk/preserv/digpres.html.

[3] David S.H.Rosenthal,Thomas Robertson,Tom Lipkis,Vicky Reich,Seth Morabito.Requirements for Digital Preservation Systems:A Bottom-Up Approach.D-lib Magazine 11,11(Nove.2005).

[4] 朱燁.數(shù)字保存中的技術、組織及法律因素分析[J].圖書館學研究,2005(4).

[5] 宋顯彪.數(shù)字信息的長期保存[D].碩士學位論文,2005(4).

[6] 顏曉棟.保存數(shù)字信息技術方案選擇與評價[J].檔案管理,2003(1).

[7] 張紹武.數(shù)字信息長期保存的策略[J].現(xiàn)代情報,2002(4).

猜你喜歡
存儲介質數(shù)字信息數(shù)字
北京尚水數(shù)字信息產(chǎn)品介紹
數(shù)字有形狀嗎?數(shù)字信息精確性和品牌標識形狀的匹配效應*
檔案館移動存儲介質管理方法探討
答數(shù)字
一種使用存儲介質驅動的方式
數(shù)字看G20
成雙成對
數(shù)字信息時代圖書館職業(yè)權利缺失與回歸路徑
網(wǎng)絡環(huán)境下數(shù)字信息產(chǎn)品定價策略
醫(yī)院環(huán)境下移動存儲介質的信息安全管理