文/郭慧霞
區(qū)塊鏈作為新興的信息技術(shù)之一,在檔案管理中的應(yīng)用不僅是新時(shí)代發(fā)展檔案事業(yè)的需要,也是滿足社會(huì)和公眾日益多元的檔案利用的需求,是實(shí)現(xiàn)檔案管理信息化、高質(zhì)量發(fā)展的大勢(shì)所趨,以其去中心化、開(kāi)放性、自治性、不可篡改性的特點(diǎn)給檔案管理帶來(lái)新思路。目前,區(qū)塊鏈應(yīng)用于檔案管理尚處于起步階段,還面臨著應(yīng)用成本高、信息安全等問(wèn)題。對(duì)此,分別從檔案收集與歸檔、流轉(zhuǎn)與管理、利用與服務(wù)三大階段提出區(qū)塊鏈在檔案管理中的應(yīng)用路徑,為實(shí)現(xiàn)區(qū)塊鏈技術(shù)與檔案管理的深度融合與發(fā)展提供參考
近年來(lái),全國(guó)檔案信息化建設(shè)不斷推進(jìn),檔案管理與利用的方式呈現(xiàn)出明顯的數(shù)字化、網(wǎng)絡(luò)化和自動(dòng)化趨勢(shì)。在理想情況下,區(qū)塊鏈技術(shù)以其去中心化、開(kāi)放性、自治性、不可篡改性和匿名性的特點(diǎn)給檔案管理帶來(lái)新思路,它能夠集成大量的電子檔案,大大提高檔案管理的效率,同時(shí)也提供了便捷、安全和快速的訪問(wèn)服務(wù),有利于檔案資源的共享與利用。2016年,美國(guó)、英國(guó)、日本等發(fā)達(dá)國(guó)家相繼將區(qū)塊鏈技術(shù)上升至國(guó)家戰(zhàn)略層面,成立了區(qū)塊鏈發(fā)展聯(lián)盟。《“十四五”國(guó)家信息化規(guī)劃》中講到,我國(guó)目前已經(jīng)成為區(qū)塊鏈、人工智能等領(lǐng)域?qū)@暾?qǐng)量全球第一,這也有利于其在檔案領(lǐng)域中的廣泛應(yīng)用[1]?;诖耍瑱n案工作者應(yīng)積極探索檔案管理中區(qū)塊鏈應(yīng)用的領(lǐng)域和技術(shù)特征,探尋其應(yīng)用的方法措施,以更好地推動(dòng)檔案管理高質(zhì)量發(fā)展。
目前,區(qū)塊鏈在世界范圍內(nèi)的應(yīng)用已步入3.0時(shí)代,即區(qū)塊鏈已經(jīng)由數(shù)字貨幣加密技術(shù)推廣到對(duì)互聯(lián)網(wǎng)中數(shù)據(jù)價(jià)值的識(shí)別、認(rèn)定、分配和存儲(chǔ),這也使得“數(shù)據(jù)”背后所代表的資產(chǎn)能夠在區(qū)塊鏈內(nèi)被交易或者控制。[2]
狹義上講,區(qū)塊鏈的本質(zhì)是一種特殊的數(shù)據(jù)結(jié)構(gòu),其核心特征在于去中心化、開(kāi)放性、不可篡改性、自治性。
第一,區(qū)塊鏈的核心——分布式算法和存儲(chǔ)不依賴于中心化的硬件或管理機(jī)構(gòu),在區(qū)塊鏈中的所有節(jié)點(diǎn)的權(quán)限和義務(wù)都是對(duì)等的,同時(shí)每個(gè)結(jié)果也能夠參與到數(shù)據(jù)的記錄和維護(hù),這就區(qū)別于傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)中對(duì)“中心”的依賴,從而實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的數(shù)據(jù)傳輸和實(shí)時(shí)的數(shù)據(jù)記錄,其效率更高、速度更快。同時(shí),傳統(tǒng)硬件體系和數(shù)據(jù)結(jié)構(gòu)中如果“中心”的網(wǎng)絡(luò)或硬件遭受攻擊(無(wú)論是鏈路層或是物理層),都將直接影響整個(gè)系統(tǒng)的正常運(yùn)轉(zhuǎn),特別是對(duì)于檔案管理來(lái)說(shuō),一旦遭受到攻擊,那么所有檔案數(shù)據(jù)都面臨著損壞或者丟失的風(fēng)險(xiǎn),這種系統(tǒng)性癱瘓所帶來(lái)的損失是不可估量的。而借助區(qū)塊鏈的分布式算法,單一節(jié)點(diǎn)的失效并不會(huì)影響到其他節(jié)點(diǎn),這就在提升工作效率的同時(shí)保障了檔案安全。
第二,區(qū)塊鏈擁有較傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)更加開(kāi)放的工作環(huán)境。在區(qū)塊鏈最初應(yīng)用的領(lǐng)域數(shù)字加密貨幣中,區(qū)塊鏈的核心技術(shù)之一就是公開(kāi)且透明的交易信息。一般情況下,在區(qū)塊鏈內(nèi)產(chǎn)生、流轉(zhuǎn)和存儲(chǔ)的信息是對(duì)所有節(jié)點(diǎn)用戶開(kāi)放的,其高度的透明化也使得區(qū)塊內(nèi)的所有人都能夠查看數(shù)據(jù)的所有相關(guān)信息同時(shí)使用其應(yīng)用。因此,區(qū)塊鏈技術(shù)在信息共享與數(shù)據(jù)交換領(lǐng)域具有天然優(yōu)勢(shì)。
第三,去中心化和開(kāi)放性會(huì)帶來(lái)新的信息安全問(wèn)題。而區(qū)塊鏈的非對(duì)稱(chēng)加密、工作量識(shí)別等技術(shù)則可以較好地解決該風(fēng)險(xiǎn)。相較于傳統(tǒng)數(shù)據(jù)存儲(chǔ)模式,區(qū)塊鏈的數(shù)據(jù)通常都是永久保存的,其增減刪改等操作不能只通過(guò)某一節(jié)點(diǎn)進(jìn)行,而是需要超過(guò)50%節(jié)點(diǎn)的共同授權(quán)才能完成,因此區(qū)塊鏈具有極佳的穩(wěn)定性和容錯(cuò)率。
第四,區(qū)塊鏈的自治性實(shí)際上是智能合約技術(shù)的體現(xiàn)。區(qū)塊鏈3.0的技術(shù)優(yōu)勢(shì)還體現(xiàn)在“智能合約”。智能合約的優(yōu)勢(shì)在于能夠在節(jié)點(diǎn)通過(guò)統(tǒng)一的規(guī)范或者協(xié)議,對(duì)信息的產(chǎn)生、存儲(chǔ)和交易行為進(jìn)行約束,從而創(chuàng)造出一個(gè)公信力強(qiáng)的系統(tǒng)環(huán)節(jié),讓所有參與節(jié)點(diǎn)都能夠自由地在其中交換和共享數(shù)據(jù),這有利于區(qū)塊鏈技術(shù)應(yīng)用于更廣闊的領(lǐng)域。[3]
目前,隨著數(shù)字檔案建設(shè)的持續(xù)推進(jìn),檔案管理部門(mén)也面臨著巨大的存儲(chǔ)壓力,特別是對(duì)于高分辨率的圖片和視頻,中心化的存儲(chǔ)方式匯集了所有檔案資源,導(dǎo)致存儲(chǔ)成本居高不下。借助區(qū)塊鏈的分布式賬本,檔案管理部門(mén)能夠構(gòu)建起多主體參與、信息對(duì)稱(chēng)的檔案治理格局,檔案的產(chǎn)生者同時(shí)也成為檔案的記錄者,不僅有利于檔案的直接利用,同時(shí)也能夠有效提高信息查詢與檢索效率。如麻省理工學(xué)院Azaria等開(kāi)發(fā)了一個(gè)名為MedRec的系統(tǒng),解決數(shù)據(jù)的互操作性和權(quán)限管理問(wèn)題,用于管理醫(yī)療檔案,其中應(yīng)用到的主要技術(shù)就是分布式賬本和智能合約。
新技術(shù)的應(yīng)用使得電子檔案的內(nèi)容生產(chǎn)與管理環(huán)境、歸檔材料的完整性(包括元數(shù)據(jù)在內(nèi))以及知識(shí)產(chǎn)權(quán)面臨的安全威脅更加多樣。而區(qū)塊鏈具有的時(shí)間戳和非對(duì)稱(chēng)加密技術(shù)則能夠有效提升檔案的安全性。其中,時(shí)間戳能夠完整記錄檔案的任何操作,包括移動(dòng)、刪減和查詢,正如上文所說(shuō),區(qū)塊鏈?zhǔn)且粋€(gè)開(kāi)放且透明的系統(tǒng),運(yùn)用時(shí)間戳后我們得以看到檔案流轉(zhuǎn)的全部明細(xì),能夠有效防止檔案歸檔與管理過(guò)程中因人工失誤所導(dǎo)致的信息安全風(fēng)險(xiǎn)。非對(duì)稱(chēng)加密能夠有效提高用戶端的信息安全水平,它需要兩個(gè)密鑰來(lái)進(jìn)行加密和解密,無(wú)需同步密鑰且算法強(qiáng)度復(fù)雜,大大提高檔案服務(wù)與利用過(guò)程中的安全性。
去中心化的存儲(chǔ)模式,檔案收集與管理、檔案管理與利用需要多主體、多部門(mén)的共同參與,這也給檔案部門(mén)的管理能力提出更高要求。傳統(tǒng)管理模式下,對(duì)工作量的監(jiān)控是十分低效的,同時(shí)也難以實(shí)現(xiàn)實(shí)時(shí)對(duì)檔案規(guī)范和標(biāo)準(zhǔn)進(jìn)行監(jiān)管。借助共識(shí)機(jī)制,我們可以完成各個(gè)節(jié)點(diǎn)之間的互信,實(shí)現(xiàn)數(shù)據(jù)等方面的交互,節(jié)點(diǎn)可以基于某種信任達(dá)成協(xié)作,更好地開(kāi)展檔案管理。
在檔案收集與歸檔階段,區(qū)塊鏈的主要作用是借助智能合約和非對(duì)稱(chēng)加密技術(shù)捕獲真實(shí)且完整的檔案數(shù)據(jù)。首先,根據(jù)鏈內(nèi)形成的統(tǒng)一智能合約和檔案數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范盡可能多地收集元數(shù)據(jù)信息,并進(jìn)行自動(dòng)化的初步鑒定,排除重復(fù)和無(wú)價(jià)值的檔案內(nèi)容;其次,對(duì)于有價(jià)值的信息,由相應(yīng)部門(mén)應(yīng)用非對(duì)稱(chēng)加密技術(shù)獲得公鑰并進(jìn)行加密,并提出存儲(chǔ)需求;最后,將整合好的檔案數(shù)據(jù)借助共識(shí)機(jī)制保存到區(qū)塊中,這便是一次完整的數(shù)據(jù)采集流程。采集時(shí),要確保所有的檔案數(shù)據(jù)都通過(guò)區(qū)塊鏈完成,以實(shí)現(xiàn)每個(gè)節(jié)點(diǎn)都能夠完整的記錄和查閱采集過(guò)程。在這一階段,檔案管理部門(mén)應(yīng)參考檔案管理與利用需求多元化的趨勢(shì),充分整合原生電子檔案和傳統(tǒng)檔案的數(shù)字化產(chǎn)品。檔案管理部門(mén)應(yīng)事先編制好檔案的收集范圍與標(biāo)準(zhǔn),考慮到區(qū)塊鏈的技術(shù)特征,在多節(jié)點(diǎn)共同參與記錄時(shí)提供同一模板和標(biāo)準(zhǔn),強(qiáng)調(diào)數(shù)據(jù)的標(biāo)準(zhǔn)化、規(guī)范化。此外,還要進(jìn)一步探索區(qū)塊鏈的應(yīng)用前景,不斷探索其與檔案管理領(lǐng)域的契合點(diǎn),遵循差異化、層次化的原則,同時(shí)也要考慮到信息技術(shù)更新迭代可能帶來(lái)的新的問(wèn)題,采用量化評(píng)價(jià)的方式對(duì)區(qū)塊鏈的應(yīng)用及成效進(jìn)行預(yù)測(cè),為后續(xù)新技術(shù)的部署和應(yīng)用提供參考。
檔案流轉(zhuǎn)與管理階段的關(guān)鍵在于保障檔案的安全性,這一階段涉及到的主要技術(shù)是數(shù)字簽名和加密算法。檔案管理部分一方面要做好檔案基礎(chǔ)信息安全保障,主要針對(duì)區(qū)塊鏈環(huán)境下線上操作系統(tǒng)中的檔案編輯工作站、元數(shù)據(jù)數(shù)據(jù)庫(kù)、密鑰數(shù)據(jù)庫(kù)、規(guī)則數(shù)據(jù)庫(kù)和高分辨率電子檔案存儲(chǔ)等核心環(huán)節(jié)進(jìn)行防護(hù),其工作重點(diǎn)包括兩個(gè)方面:一是防止數(shù)據(jù)的丟失和損毀,針對(duì)此類(lèi)問(wèn)題主要采用數(shù)據(jù)備份技術(shù)。對(duì)電子檔案的數(shù)據(jù)備份應(yīng)采用異地備份方式,當(dāng)下較為主流的是采用云存儲(chǔ),確保數(shù)據(jù)的永久保存;二是防止數(shù)據(jù)被竊取。在上述的風(fēng)險(xiǎn)識(shí)別與應(yīng)對(duì)中,除一般的檔案編輯工作站其余所有數(shù)據(jù)庫(kù)中的數(shù)據(jù)都處于加密狀態(tài)。因此對(duì)電子檔案編輯工作應(yīng)采用全面的數(shù)據(jù)標(biāo)記,確保數(shù)據(jù)在可控范圍內(nèi)。與此同時(shí),檔案管理部門(mén)還應(yīng)進(jìn)一步完善權(quán)限機(jī)制,根據(jù)檔案價(jià)值的大小、利用需求和使用場(chǎng)所將訪問(wèn)用戶分為系統(tǒng)管理員、檔案管理員、一般用戶和禁止訪問(wèn)等幾類(lèi),并根據(jù)用戶的調(diào)用、查閱、流轉(zhuǎn)等操作進(jìn)行權(quán)限匹配。除此之外,檔案數(shù)據(jù)的流轉(zhuǎn)還應(yīng)推動(dòng)各類(lèi)數(shù)據(jù)與管理平臺(tái)的共享共建,進(jìn)一步完善檔案資源易地備份模式,對(duì)相關(guān)存儲(chǔ)標(biāo)準(zhǔn)進(jìn)行新華,共同構(gòu)建區(qū)塊鏈應(yīng)用的長(zhǎng)效機(jī)制。
檔案利用與服務(wù)階段應(yīng)基于區(qū)塊鏈的技術(shù)特征創(chuàng)新檔案利用服務(wù)方式。第一,可借助區(qū)塊鏈的多節(jié)點(diǎn) 工作模式實(shí)現(xiàn)節(jié)點(diǎn)間的配合與數(shù)據(jù)挖掘。在多鏈配合的基礎(chǔ)上,應(yīng)用智能合約和工作量識(shí)別機(jī)制,整合全渠道的信息資源,構(gòu)建面向區(qū)塊鏈的檔案信息資源平臺(tái)。平臺(tái)中除了集成檔案資源外,還應(yīng)提供檔案的過(guò)程信息,如版本號(hào)、時(shí)間、操作管理員等,借助共識(shí)機(jī)制實(shí)現(xiàn)集中管理、集中開(kāi)發(fā),形成完備的數(shù)據(jù)庫(kù),集成檢索服務(wù),構(gòu)建一站式的服務(wù)平臺(tái)。第二,借助區(qū)塊鏈去中心化的特點(diǎn)構(gòu)建個(gè)性化的檔案服務(wù)方式。具體而言,提供模塊化的服務(wù)功能,用戶可根據(jù)個(gè)人需求在區(qū)塊鏈上的各個(gè)服務(wù)節(jié)點(diǎn)查詢和獲取信息,這就改變了傳統(tǒng)檔案的中心服務(wù)模式,用戶與檔案資源直接的距離進(jìn)一步縮短,點(diǎn)對(duì)點(diǎn)的利用方式也有助于提高檔案利用率,化解傳統(tǒng)模式下的信息孤單難題,構(gòu)建出多主體參與的協(xié)同服務(wù)模式。