吳燕
[摘 要]本文通過對(duì)舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)存在的不足之處進(jìn)行分析,提出引入互聯(lián)網(wǎng)環(huán)境下的數(shù)字對(duì)象單一標(biāo)識(shí)技術(shù),應(yīng)用于舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)建設(shè)。該技術(shù)既可以極大地提高舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)的應(yīng)用效率,又可以進(jìn)一步擴(kuò)大館藏?cái)?shù)據(jù)的應(yīng)用范圍,還可以降低管理、軟件、硬件的成本投入,大幅度減少用戶訪問館藏舊有文件的時(shí)間、瀏覽時(shí)間,進(jìn)而提升館藏檔案的利用率。
[關(guān)鍵詞]互聯(lián)網(wǎng);數(shù)字檔案館;標(biāo)識(shí)技術(shù)
doi:10.3969/j.issn.1673 - 0194.2017.24.116
[中圖分類號(hào)]G270.7 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1673-0194(2017)24-0-02
0 引 言
互聯(lián)網(wǎng)技術(shù)環(huán)境下的舊有文件的數(shù)字、電子化和信息化是互聯(lián)網(wǎng)技術(shù)環(huán)境下的形式創(chuàng)新,指的是電子信息條件下的檔案管理的新方式。所有文獻(xiàn)的數(shù)字、電子化和對(duì)其進(jìn)行管理的電子信息系統(tǒng)的研發(fā)與升級(jí)換代,已經(jīng)給傳統(tǒng)的檔案館管理帶來了強(qiáng)烈的沖擊,還將對(duì)舊有檔案館管理格局的發(fā)展造成影響。計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的普及,也加快了檔案管理部門不斷提升信息化、數(shù)字、電子化步伐。
1 館藏舊有文件的數(shù)字、電子化和管理信息系統(tǒng)的定義
目前,互聯(lián)網(wǎng)環(huán)境下的各類館藏舊有文獻(xiàn)的數(shù)字、電子化和與其對(duì)應(yīng)的管理系統(tǒng),是一個(gè)依靠計(jì)算機(jī)技術(shù)、互聯(lián)網(wǎng)技術(shù)、電子存儲(chǔ)技術(shù)等一系列前沿科技,使其能夠進(jìn)行信息接收、文獻(xiàn)管理和舊有檔案的數(shù)字化處理,并提供互聯(lián)網(wǎng)環(huán)境和文獻(xiàn)物理存儲(chǔ)兩方面高效利用、服務(wù)的管理信息系統(tǒng)。
有序的信息空間和開放的信息環(huán)境是舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)的重要特征之一。它說明舊有文件的數(shù)字、電子化和信息化信息系統(tǒng),不是封閉的檔案館信息互聯(lián)網(wǎng)技術(shù),而是包含在OA系統(tǒng)、CAD和MIS等更為廣闊的大系統(tǒng)中的組成部分;是由網(wǎng)狀分布式、檔案資源構(gòu)成的具有各類服務(wù)功能的跨管理層級(jí)、跨地理分布的管理信息系統(tǒng)。
2 舊有檔案文件的數(shù)字、電子化和信息化系統(tǒng)的劣勢(shì)
現(xiàn)有關(guān)于人類的各類信息記錄的技術(shù),使各類型載體所需要儲(chǔ)存的內(nèi)容迅速增加。而現(xiàn)有可用于信息長(zhǎng)期和永久存儲(chǔ)的技術(shù),遠(yuǎn)沒有得到相應(yīng)的快速發(fā)展,存儲(chǔ)各類信息的物理載體的使用期反而下降了很多。
數(shù)字檔案存儲(chǔ)、管理的安全問題。互聯(lián)網(wǎng)技術(shù)有其存取速度快捷的優(yōu)點(diǎn)。因?yàn)榛ヂ?lián)網(wǎng)技術(shù)本身的無(wú)中心特點(diǎn),也有其安全性差和不甚可靠的缺點(diǎn)。其一,互聯(lián)網(wǎng)技術(shù)本身的隱患。由眾多計(jì)算機(jī)組成的網(wǎng)絡(luò)環(huán)境,其技術(shù)系統(tǒng)本身就是開放的。其廣域性、信息的共享性、通信網(wǎng)絡(luò)的共享性等特點(diǎn),都為竊取、盜用、非法操作、篡改及惡意破壞提供了可能。其二,由于互聯(lián)網(wǎng)技術(shù)本身就與計(jì)算技術(shù)有著不可或缺的關(guān)系,所以,計(jì)算機(jī)具有的一些漏洞,如計(jì)算機(jī)病毒、黑客攻擊等,都會(huì)造成檔案內(nèi)容的被篡改和遺失。其三,受人工影響的幾率很大。人為的或小概率事故等,都會(huì)導(dǎo)致不可估量的結(jié)果。
3 “數(shù)字對(duì)象”定義的引入
“數(shù)字對(duì)象”就是互聯(lián)網(wǎng)和計(jì)算機(jī)技術(shù)興起后,對(duì)檔案領(lǐng)域的各類文檔的一種新提法。數(shù)字對(duì)象模型對(duì)不同內(nèi)容、不同形式的信息的表示具有普適性,它為信息系統(tǒng)的構(gòu)造提供了一個(gè)通用的工具,運(yùn)用這個(gè)數(shù)字、電子化的信息基礎(chǔ),完全可以建立一個(gè)包括各類文獻(xiàn)格式、可以對(duì)復(fù)雜檔案進(jìn)行整理、按照各類用戶的實(shí)際需求,形成高水平服務(wù)且可以滿足外部環(huán)境變化的數(shù)字文件檔案系統(tǒng)。其他的表現(xiàn)格式,如,OCLC使用“Document-Like Object(DLO)”、W3C的“Document Object Model”、威倫斯基體系的“Digital Object”、FEDORA項(xiàng)目作為專有名詞使用的“Digital Object”、加州伯克利分校舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)項(xiàng)目提出的“Multivalent Document”等。這些對(duì)電子信息的描述都是引用和借用了計(jì)算機(jī)相關(guān)理論中“對(duì)象”的定義方法,來表示檔案領(lǐng)域文本數(shù)字、電子化,但其應(yīng)用目的、文本文獻(xiàn)的組成結(jié)構(gòu)、檔案管理的管理過程等方面各有不同而已。
“館藏舊有文件數(shù)字、電子化”作為互聯(lián)網(wǎng)環(huán)境下文獻(xiàn)、檔案信息化實(shí)現(xiàn)的最小單元,它不僅僅是最小的信息單位,還可以成為互聯(lián)網(wǎng)環(huán)境下舊有文件的數(shù)字、電子化和信息化的重要組成部分,更是最底層的基本訪問操作,還是舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)各種復(fù)雜結(jié)構(gòu)的組成單元。館藏舊有文件對(duì)象數(shù)字、電子化后,這個(gè)被數(shù)字、電子化的館藏對(duì)象,能夠表示各種不同含義與格式的信息,因?yàn)閿?shù)字、電子化過程是對(duì)館藏各類文獻(xiàn)的一個(gè)高度統(tǒng)一的邏輯抽象表達(dá)。這種高度統(tǒng)一,確保了文獻(xiàn)在格式和基本操作系統(tǒng)上的單一,這一過程將給互聯(lián)網(wǎng)環(huán)境下的館藏管理帶來館藏訪問的快速和館藏利用上的簡(jiǎn)潔。館藏舊有文件的數(shù)字、電子化,就是為館藏舊有文件建立一個(gè)數(shù)學(xué)模型,這個(gè)模型是可以被計(jì)算機(jī)程序進(jìn)行處理的模型,這個(gè)對(duì)象的數(shù)學(xué)模型的形成過程,是一個(gè)從案例到高度抽象的邏輯抽象過程的全過程,正好是高度抽象的邏輯順序的逆過程,即館藏對(duì)象的案例的形成和實(shí)際運(yùn)行的完成順序。
4 館藏舊有文件數(shù)字、電子化對(duì)象的單一標(biāo)識(shí)方法
隨著互聯(lián)網(wǎng)技術(shù)和計(jì)算機(jī)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)環(huán)境下的信息資源的數(shù)量級(jí)數(shù)也快速的變化著。由于互聯(lián)網(wǎng)技術(shù)環(huán)境自身就沒有一個(gè)統(tǒng)一的管理,同一信息資源被多次、重復(fù)拷貝和使用的事情皆有發(fā)生。這造成了互聯(lián)網(wǎng)技術(shù)空間的低效率使用,其更嚴(yán)重的是,極大地妨礙了互聯(lián)網(wǎng)環(huán)境下用戶對(duì)信息資源的有效利用。
為了順應(yīng)互聯(lián)網(wǎng)技術(shù)和計(jì)算機(jī)技術(shù)的巨大、快速的環(huán)境變化,國(guó)內(nèi)外的科技從業(yè)者,經(jīng)過研究,提出了用數(shù)字對(duì)象單一標(biāo)識(shí)符技術(shù)(Digital Object Identifier),來描述、詮釋互聯(lián)網(wǎng)環(huán)境中的館藏舊有文件的數(shù)字、電子化對(duì)象,進(jìn)而將表現(xiàn)格式和物理存儲(chǔ)位置不同但信息本質(zhì)屬性相同(所描述的內(nèi)容相同)的數(shù)字對(duì)象描述出來,以方便人們加以利用。Handle System就是最早提出的應(yīng)用范圍最廣的全互聯(lián)網(wǎng)范圍的數(shù)字對(duì)象單一標(biāo)識(shí)符系統(tǒng),作為第一個(gè)完整的數(shù)字對(duì)象單一標(biāo)識(shí)符系統(tǒng),其對(duì)數(shù)字對(duì)象描述、詮釋和解析、管理、利用以及開放式數(shù)字信息環(huán)境的構(gòu)建都產(chǎn)生了深遠(yuǎn)影響。
1998年,國(guó)際數(shù)字對(duì)象標(biāo)識(shí)符基金會(huì)(International DOI Foundation,IDF)在德國(guó)的法蘭克福成立,是專門負(fù)責(zé)數(shù)字對(duì)象標(biāo)識(shí)符運(yùn)作的國(guó)際性專業(yè)機(jī)構(gòu)。因其是一個(gè)非盈利性的國(guó)際組織,因而任何組織和用戶都可以在其網(wǎng)頁(yè)上下載其提供的DOI手冊(cè)以供使用,包括DOI技術(shù)手冊(cè)、系統(tǒng)組成架構(gòu)、算法的使用方法、運(yùn)行管理方式等。IDF發(fā)出的數(shù)字單一的對(duì)象標(biāo)識(shí)符超過2 000多萬(wàn)個(gè)。
4.1 DOI系統(tǒng)的特點(diǎn)
DOI單一標(biāo)識(shí)符管理系統(tǒng)的功能在于,給被描述的對(duì)象分配全互聯(lián)網(wǎng)范圍內(nèi)的不變且單一的標(biāo)識(shí)符,其標(biāo)識(shí)符是由一串?dāng)?shù)字組成的,不但要體現(xiàn)其價(jià)值,更包含對(duì)標(biāo)識(shí)符的處理算法系統(tǒng)正確的描述、邏輯元數(shù)據(jù)盡可能正確的描述,以及所有者自己闡述的合適編碼組合等。DOI單一標(biāo)識(shí)符系統(tǒng)一般有4部分:編碼、描述、處理算法和要求。
DOI的特點(diǎn)有以下幾方面。第一,單一特性。一個(gè)數(shù)字對(duì)象只對(duì)應(yīng)一個(gè)專用編碼。第二,不變性。即使被標(biāo)識(shí)的對(duì)象被邏輯移動(dòng)、物理上重新組合或者被修改,其單一性不被破壞。第三,能與別的來源的數(shù)據(jù)進(jìn)行邏輯互操作。第四,延展性。DOI系統(tǒng)可增加新的被描述對(duì)象的新特征和服務(wù)。第五,跨平臺(tái)性。同一被描述對(duì)象,可以多種輸出格式進(jìn)行單一管理(與平臺(tái)無(wú)關(guān))。第六,對(duì)應(yīng)用和服務(wù)兩個(gè)方面的操作,系統(tǒng)可以分開進(jìn)行。第七,邏輯上的元數(shù)據(jù)、應(yīng)用操作和服務(wù)過程及其內(nèi)容的動(dòng)態(tài)更新。
4.2 DOI算法(Resolution)
DOI系統(tǒng)算法,即由互聯(lián)網(wǎng)技術(shù)和組成互聯(lián)網(wǎng)的各個(gè)計(jì)算機(jī)(網(wǎng)絡(luò)服務(wù)器),在接收到DOI編碼后,通過計(jì)算機(jī)服務(wù)器內(nèi)預(yù)先儲(chǔ)存的處理算法,將DOI轉(zhuǎn)變成該對(duì)象在該服務(wù)器的邏輯值空間內(nèi)的有效地址。由于所有數(shù)字出版文獻(xiàn)的對(duì)象識(shí)別資料都集中在注冊(cè)中心的大型數(shù)據(jù)庫(kù)中進(jìn)行管理,如果數(shù)字對(duì)象的存放地址發(fā)生變化,只要伴隨DOI的元數(shù)據(jù)隨之更新,用戶即可通過其固定的DOI碼方便地找到該數(shù)字對(duì)象。通常一種數(shù)字出版品可能有多種版本及格式,但只對(duì)應(yīng)一個(gè)DOI碼,用戶查找時(shí)可通過處理算法器自動(dòng)或手動(dòng)選擇想要的資料。目前,DOI的處理算法功能是采用CNRI(The Corporation for National Research Initiatives)開發(fā)的Handle System技術(shù)。Handle System是一個(gè)通用的分布式名稱服務(wù)系統(tǒng),它包括一套開放的系統(tǒng)協(xié)議,惟一標(biāo)識(shí)符名稱空間以及協(xié)議的參考實(shí)現(xiàn)模型。目前,Handle System的相關(guān)標(biāo)準(zhǔn)已被互聯(lián)網(wǎng)工程任務(wù)組(The Internet Engineering Task Force,IETF)接收為RFC文檔。
5 結(jié) 語(yǔ)
當(dāng)前,互聯(lián)網(wǎng)技術(shù)飛速發(fā)展、計(jì)算機(jī)技術(shù)日新月異,所以,舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)勢(shì)在必行。互聯(lián)網(wǎng)技術(shù)環(huán)境下的舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)的存儲(chǔ)內(nèi)容(文字、圖片、視頻等信息)都是符合數(shù)字對(duì)象的定義的?;ヂ?lián)網(wǎng)環(huán)境數(shù)字對(duì)象唯一標(biāo)識(shí)技術(shù)(DOI)不僅可以給舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)帶來不可估量的效率,更可以解決舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)的諸多不足。
主要參考文獻(xiàn)
[1]李敏.企業(yè)舊有文件的數(shù)字、電子化和信息化信息系統(tǒng)建設(shè)[J].機(jī)電兵船檔案,2008(3).
[2]張孺.數(shù)字檔案館的優(yōu)勢(shì)與劣勢(shì)分析[J].蘭臺(tái)世界,2014(z2).
[3]S Payette ,C Lagoze . Flexible and Extensible Digital Object and Repository Architecture (FEDORA)[C]// European Conference on Research and Advanced Technology for Digital Libraries,1998.
[4]于順安.石油勘探開發(fā)信息化必須依靠物聯(lián)網(wǎng)與虛擬現(xiàn)實(shí)技術(shù)的完美結(jié)合[J].天然氣勘探與開發(fā),2014(3).