文/黑龍江八一農(nóng)墾大學 郭昱 康忠偉
2021年6月,中辦國辦印發(fā)的《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》指出:檔案事業(yè)發(fā)展處于重要戰(zhàn)略機遇期,同時也面臨嚴峻挑戰(zhàn)。新一代信息技術廣泛應用,檔案工作環(huán)境、對象、內(nèi)容發(fā)生巨大變化,迫切要求創(chuàng)新檔案工作理念、方法、模式,加快全面數(shù)字轉(zhuǎn)型和智能升級。提出了“檔案信息化建設再上新臺階”及“檔案科技創(chuàng)新實現(xiàn)新突破”等發(fā)展目標,部署“推進檔案信息資源共享平臺建設、完善檔案科技創(chuàng)新和應用機制、重點開展新一代信息技術在檔案管理中的應用”等工作任務。檔案管理數(shù)字化、檔案化以及實現(xiàn)上網(wǎng)、上云、上鏈是大家共同期待的目標。
信息共享的網(wǎng)絡信息時代,檔案數(shù)字化程度直接影響著檔案數(shù)據(jù)的傳輸效率和工作效率。國家檔案局印發(fā)的“十三五”規(guī)劃綱要和“十四五”發(fā)展規(guī)劃提出,加快檔案資源數(shù)字轉(zhuǎn)型,加速數(shù)字檔案館(室)建設,加快推進檔案信息化建設,引領檔案管理現(xiàn)代化,加快推進信息技術與檔案工作深度融合。還提出,加快提升電子檔案管理水平:在有條件的部門開展電子檔案單套制(即電子設備生成的檔案僅以電子方式保存)、單軌制(即不再生成紙質(zhì)檔案)管理試點。
目前,一些檔案管理部門雖然引進了檔案管理系統(tǒng),但應用程度不高。檔案管理數(shù)字化不是簡單地將紙質(zhì)材料掃描或?qū)嵨锱恼眨瑹o序存儲在計算機內(nèi)。電子檔案信息必須經(jīng)過檔案化管理歸檔處理后才能稱為電子檔案。否則,只能稱其為電子文件。檔案化過程主要是將每件電子信息封裝成為以卷或件為單位的檔案基本單位,并且每個卷或件都有一個標準的元數(shù)據(jù)。把應用系統(tǒng)的電子信息進行憑證化處理后,形成電子檔案,將電子信息從應用系統(tǒng)中獨立出來,形成與應用無關的,可追溯的,能夠直接閱讀的帶樣式的文檔、檔案化的電子信息、結(jié)構(gòu)化的數(shù)據(jù)庫。經(jīng)過電子化、檔案化、結(jié)構(gòu)化的數(shù)據(jù)才有利于檢索、傳輸、分享、快速導入導出和網(wǎng)絡間可交互驗證的信息化數(shù)據(jù)。
區(qū)塊鏈技術具備去中心化、不可篡改、防止抵賴、全程留痕、可以追溯、集體維護、公開透明等應用特點。區(qū)塊鏈技術提供了一種在不可信網(wǎng)絡中進行信息與價值傳遞交換的可信通道,逐漸在各領域展現(xiàn)出豐富的應用場景。區(qū)塊鏈技術將為云計算、大數(shù)據(jù)、移動互聯(lián)網(wǎng)等新一代信息技術的發(fā)展帶來新的機遇,有可能引發(fā)新一輪的信息技術創(chuàng)新和產(chǎn)業(yè)變革。
(一)區(qū)塊鏈機器信任特征讓檔案數(shù)據(jù)公信力在網(wǎng)絡節(jié)點所及范圍發(fā)揮作用。從前開具證明,需要到相關的組織機構(gòu)所在檔案管理部門辦理。這種信用關系是建立在社會群體之上,是人為主導,證明是否可以開具或者開具證明的真實性都會受到人為因素的主觀影響,證明的公信力受到出具證明部門的類型、規(guī)模、級別等因素影響。證明信任在一定區(qū)域內(nèi)會被承認,涉及跨區(qū)域、跨省、跨國,可信度會受到影響。而區(qū)塊鏈網(wǎng)絡則打破這種限制,數(shù)據(jù)一旦在區(qū)塊鏈上進行記錄,這種具有數(shù)據(jù)元不可篡改、數(shù)據(jù)變動全程留痕特性的加密數(shù)據(jù),在任何區(qū)塊鏈網(wǎng)絡節(jié)點存在的地方都可以獲得數(shù)據(jù)信任驗證。以區(qū)塊鏈技術加密數(shù)據(jù)代碼為信任基礎出具的證明,是排除人為因素影響的數(shù)據(jù)關系型的機器信任。從前信任關系是建立在鋼筋水泥的大廈之中,信任關系需要較高的經(jīng)濟基礎來維護,導致信任成本大大增加,而區(qū)塊鏈技術的機器信任,只需要互聯(lián)網(wǎng)和加密數(shù)據(jù)代碼的支持,最大幅度降低了信任成本。
(二)區(qū)塊鏈的鏈式結(jié)構(gòu)讓檔案數(shù)據(jù)在上下游之間實現(xiàn)價值傳遞。1.檔案數(shù)據(jù)在高效傳遞的情況下才能真正實現(xiàn)利用價值。檔案管理部門將檔案數(shù)據(jù)電子化、檔案化并記錄在標準格式檔案數(shù)據(jù)庫中,并不是終點,而是新的起點。檔案數(shù)據(jù)只有在上下游之間按照一定規(guī)則高效傳遞,形成無縫銜接的數(shù)據(jù)流并加入高效利用的信息數(shù)據(jù)鏈條的情況下,才算實現(xiàn)其真正價值。以高等學校為例:省級招生辦的新生錄取名冊檔案數(shù)據(jù)直接可導入高校新生檔案錄入系統(tǒng);高校畢業(yè)生在校檔案直接可以導入國家人力資源部門,用于企事業(yè)單位招聘和個人社會就業(yè)信息查詢。2.統(tǒng)一檔案數(shù)據(jù)傳輸格式標準提高數(shù)據(jù)利用效率。隨著檔案系統(tǒng)應用主體不斷推動,檔案管理信息傳輸技術不斷提高,檔案行業(yè)需要制訂統(tǒng)一的數(shù)據(jù)傳輸接口標準,規(guī)范業(yè)務系統(tǒng)與區(qū)塊鏈系統(tǒng)間的對象傳輸協(xié)議,使得檔案業(yè)務系統(tǒng)之間表現(xiàn)出最好的兼容性。如果上游數(shù)據(jù)符合數(shù)據(jù)格式化要求,那么下游數(shù)據(jù)使用主體就可以將標準化的數(shù)據(jù)(或經(jīng)簡單的數(shù)據(jù)轉(zhuǎn)換)直接導入數(shù)據(jù)庫加以利用,節(jié)省人力物力的同時,提高工作效率,降低了數(shù)據(jù)出錯機率。3.區(qū)塊鏈智能合約的應用能顯著提高檔案管理工作效率。區(qū)塊鏈智能合約有別于現(xiàn)實法律合同,是通過計算機語言的邏輯判斷,當預先編寫的邏輯條款滿足時,自動執(zhí)行相應合約條款,智能合約所執(zhí)行的合約條款又與現(xiàn)實世界相關,將虛擬世界與現(xiàn)實世界連接在一起。智能合約最大的優(yōu)點是當滿足條件時自動執(zhí)行,這樣大大降低了執(zhí)行成本。在檔案管理行業(yè)中,查詢、錄入、出證等多個方面都可以利用區(qū)塊鏈智能合約提高工作效率。區(qū)塊鏈技術智能合約的進一步應用,促使可編程經(jīng)濟得到進一步發(fā)展,推動社會從現(xiàn)有的“契約社會”向前過渡到智能合約社會,也就是可編程社會。
區(qū)塊鏈技術是已有的計算密碼學、分布式存儲及網(wǎng)絡通信等技術的組合。區(qū)塊鏈是點對點傳輸、共識機制、分布式數(shù)據(jù)存儲、時間戳、梅克爾樹結(jié)構(gòu)、散列函數(shù)、非對稱加密和智能合約等計算機技術的新型應用模式。特別是點對點分布式技術(P2P)、非對稱加密技術、哈希算法、共識機制被稱為區(qū)塊鏈技術的四大核心技術。
(一)去中心化的分布式對等網(wǎng)絡優(yōu)勢?!叭ブ行幕笔侵妇W(wǎng)絡系統(tǒng)的歸屬關系。系統(tǒng)歸屬于整個社區(qū)和所有參與者,則是去中心化的;系統(tǒng)歸于公司和個人,則是中心化的。而分布式網(wǎng)絡是指網(wǎng)絡部署分布結(jié)構(gòu)和數(shù)據(jù)分布式存儲結(jié)構(gòu),是物理性的。區(qū)塊鏈通過分布式存儲技術實現(xiàn)各通信節(jié)點對數(shù)據(jù)的完整存儲,各節(jié)點數(shù)據(jù)彼此相同、實時更新,免去數(shù)據(jù)備份工作,降低資料遺失的風險,系統(tǒng)也不會因為單點崩潰而引發(fā)數(shù)據(jù)災難風險。區(qū)塊鏈系統(tǒng)也可以有效防范黑客、病毒等攻擊。某節(jié)點可以根據(jù)設備性能或工作需要,申請為輕節(jié)點(比如手機用戶),不存儲完整數(shù)據(jù),只保留自身相關數(shù)據(jù)。
(二)采用共識機制來對新生數(shù)據(jù)區(qū)塊達成共識。區(qū)塊鏈的所有節(jié)點運行于去中心化的對等網(wǎng)絡系統(tǒng)中,那么如何在沒有中心化權(quán)威機構(gòu)管理的情況下,讓區(qū)塊鏈系統(tǒng)不斷運行下去?共識機制是一種區(qū)塊鏈治理體系,是通過結(jié)合經(jīng)濟學、博弈論等多學科設計出來的一套保證區(qū)塊鏈中各節(jié)點都能積極維護區(qū)塊鏈系統(tǒng)的方法,逐漸發(fā)展成為一種維護分布式賬本多中心化的重要機制,是保持區(qū)塊鏈安全穩(wěn)定運行的核心。共識機制主要遵循“少數(shù)服從多數(shù)”和“人人平等”兩個哲學原則,通過一定規(guī)則,約束去中心化網(wǎng)絡中的每一個分散的節(jié)點,維護系統(tǒng)的運作順序與公平性,使每一個互不相干的節(jié)點能夠驗證、確認網(wǎng)絡中的數(shù)據(jù),進而產(chǎn)生信任,達成區(qū)塊鏈網(wǎng)絡每個節(jié)點的數(shù)據(jù)共識。使系統(tǒng)中各個參與者快速將系統(tǒng)中記錄的數(shù)據(jù)達成一致。在網(wǎng)絡系統(tǒng)遭受攻擊時,只要被同時控制(或有害)的節(jié)點達不到一定的數(shù)量(與所選用的共識機制相關,例如POW、POS不超過50%,PBFT不超過1/3),那么對整個網(wǎng)絡系統(tǒng)就無法形成實質(zhì)性危害。
(三)檔案數(shù)據(jù)通過散列(哈希)函數(shù)值首尾相接形成鏈式結(jié)構(gòu)。區(qū)塊鏈網(wǎng)絡中通過對某一時間段內(nèi)發(fā)生的檔案數(shù)據(jù),按相應共識機制對數(shù)據(jù)內(nèi)容進行打包形成新的數(shù)據(jù)區(qū)塊,每一區(qū)塊內(nèi)容通過逐級哈希運算形成哈希值存儲在區(qū)塊當中,使區(qū)塊數(shù)據(jù)與哈希值產(chǎn)生映射關系。哈希函數(shù)是一種數(shù)字摘要技術,把消息或數(shù)據(jù)壓縮成摘要,使得數(shù)據(jù)量變小,將信息數(shù)據(jù)的內(nèi)容固定下來。哈希值通常用一個隨機字母和數(shù)字組成的字符串來代表,例如:SHA256進行哈?!爸讣y”運算,產(chǎn)生256位的數(shù)二進制哈希值,通常用一個長度為64位的十六進制字符串來表示,Hash算法很難找到逆向規(guī)律。一個區(qū)塊內(nèi)存儲本區(qū)塊和上一區(qū)塊哈希值(父哈希),使檔案數(shù)據(jù)通過具有密碼學特征的散列(哈希)函數(shù)值首尾相接形成鏈式結(jié)構(gòu)。如果區(qū)塊鏈檔案數(shù)據(jù)被篡改將無法完成Hash值驗證,在此機制下,事務請求是不可偽造和防篡改的,保證了檔案數(shù)據(jù)安全。使用Hash算法可以提高存儲空間的利用率,可以提高數(shù)據(jù)的查詢效率,也可以做數(shù)字簽名來保障數(shù)據(jù)傳遞的安全性。
(四)采用密碼學的方法來完成檔案數(shù)據(jù)的加密和用戶身份認證。一般檔案管理系統(tǒng)能夠采用數(shù)字證書、電子印章及數(shù)據(jù)加密技術實現(xiàn)用戶對數(shù)據(jù)訪問的身份控制,這樣的管理模式離不開第三方機構(gòu)認證和中心化的賬戶密碼信息管理。而區(qū)塊鏈采用非對稱加密技術的公私鑰來完成數(shù)據(jù)的加密和解密過程。每個用戶都有一對鑰匙,如果用公開密鑰對數(shù)據(jù)進行加密,只有用對應的私有密鑰才能解密;如果用私有密鑰對數(shù)據(jù)進行加密,那么只有用對應的公開密鑰才能解密。數(shù)字簽名技術是非對稱加密技術與數(shù)字摘要技術的結(jié)合,一般包括數(shù)字簽名和簽名驗簽兩個具體操作。數(shù)字簽名功能組件被接收者用以確認數(shù)據(jù)單元的完整性以及不可偽造性,即:確定消息確實是由簽發(fā)方簽署的。向區(qū)塊鏈寫入數(shù)據(jù)的事務請求需附有發(fā)起方私鑰簽名,該簽名隨事務請求在網(wǎng)絡參與節(jié)點間廣播并進行驗證,完成數(shù)據(jù)加密和身份認證。
區(qū)塊鏈具有不可篡改和不可偽造、數(shù)據(jù)變動全程留痕的技術特點。從廣義上講,區(qū)塊鏈數(shù)據(jù)本身已經(jīng)具有電子數(shù)據(jù)檔案的部分特征。再加上區(qū)塊鏈在網(wǎng)絡應用方面所展現(xiàn)出來的機器信任、價值傳遞、智能合約等功能,區(qū)塊鏈技術應用已擴展到物聯(lián)網(wǎng)、智能制造、供應鏈管理、數(shù)字資產(chǎn)交易、司法存證、電子發(fā)票等多個領域。
2018年8月,全國范圍內(nèi)首個“區(qū)塊鏈+發(fā)票”生態(tài)體系應用——區(qū)塊鏈電子發(fā)票在深圳亮相;2018年海南省??谑猩暇€運行全國首個區(qū)塊鏈電子繳存證明平臺;2019年3月29日,將區(qū)塊鏈技術應用到信用檔案管理一體化公共平臺“誠信檔案——全國社會一體化公共平臺”UfileChain正式發(fā)布,Ufile Chain框架結(jié)構(gòu)實現(xiàn)了“區(qū)塊鏈+信用檔案”的高效結(jié)合;2020年6月,北京技術創(chuàng)新示范區(qū)利用區(qū)塊鏈技術完成了“中小微企業(yè)檔案管理云平臺”項目,成為國內(nèi)首個區(qū)塊鏈電子檔案平臺;2021年3月,由深圳市稅務局和騰訊主導推進的《基于區(qū)塊鏈技術的電子發(fā)票應用推薦規(guī)程》成為全球首個基于區(qū)塊鏈的電子發(fā)票應用的國際標準。
檔案區(qū)塊鏈管理系統(tǒng),根據(jù)主流區(qū)塊鏈系統(tǒng)設計理念,基礎層提供了區(qū)塊鏈系統(tǒng)運行的軟硬件、數(shù)據(jù)存儲及網(wǎng)絡通信環(huán)境(見圖1)。
圖1 檔案區(qū)塊鏈管理系統(tǒng)功能架構(gòu)圖
數(shù)據(jù)層的主要作用確定區(qū)塊鏈技術的物理形式。應用層提供安全代碼執(zhí)行環(huán)境、共識機制、區(qū)塊鏈的安全驗證工作、賬本記錄及點對點安全通信機制等;業(yè)務層封裝了檔案管理相關業(yè)務應用組件在內(nèi)的區(qū)塊鏈的各種應用場景和案例;用戶層提供用戶應用和運維應用,也為跨層功能提供應用;外部交互層為鏈外數(shù)據(jù)或跨鏈、側(cè)鏈數(shù)據(jù)提供通信通道。API(應用編程接口)是用戶層及外部交互層提供訪問和節(jié)點管理的接口。