文/天津武警后勤學院 郭媛 張彥如 羅南
《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》明確指出,要“促進檔案信息資源館際、館室共建互通,推進檔案信息資源跨層級跨部門共享利用”,但在傳統(tǒng)互聯(lián)網(wǎng)模式下,數(shù)字檔案資源的利用多局限于內(nèi)網(wǎng)查詢管理,服務對象、服務方式和服務范圍受到限制,未能發(fā)揮數(shù)字檔案資源建設的優(yōu)勢。區(qū)塊鏈是一種分布式的共享信息存儲技術,已被廣泛應用到金融、餐飲等多個領域,并取得一定的成功。在檔案相關領域,也有學者嘗試從理論層面探索如何讓區(qū)塊鏈在檔案方面發(fā)揮作用。在中國知網(wǎng)平臺上,檢索到發(fā)表時間最早的一篇文章是黃永剛關于電子健康檔案安全建設的文章。在此之后,研究區(qū)塊鏈應用在電子檔案方面的文章增多,涉及數(shù)據(jù)管理、體系建設、信息安全、數(shù)據(jù)存儲等內(nèi)容,如張珊探討區(qū)塊鏈技術在電子檔案管理中的適用性;白茹花探討基于區(qū)塊技術的電子檔案信任體系建設;聶云霞等人關于區(qū)塊鏈的區(qū)域檔案資源協(xié)同治理的模式和路徑的研究等文章。研究內(nèi)容的多元化為檔案數(shù)據(jù)的利用、流動提供探究思路,為實現(xiàn)數(shù)據(jù)互聯(lián)互通提供研究方向。本文在前人研究的基礎上,嘗試探討區(qū)塊鏈在檔案數(shù)據(jù)共享方面的應用。
(一)區(qū)塊鏈的概念。區(qū)塊鏈概念第一次被引入是在基于點對點網(wǎng)絡的比特幣電子現(xiàn)金系統(tǒng)中,它是一個分布式存儲賬本,網(wǎng)絡中的每個節(jié)點都具備記賬能力,可實現(xiàn)點對點的去中心化功能,確保數(shù)據(jù)傳輸和訪問的安全性和透明度。區(qū)塊鏈將數(shù)字簽名技術、智能合約、共識機制的技術、P2P網(wǎng)絡、默克爾樹結構、哈希算法等等技術組合,在對等網(wǎng)絡環(huán)境下,通過透明和可信規(guī)則,構建具有去中心化、不可偽造、不可篡改和可追溯的塊鏈式數(shù)據(jù)結構。
(二)區(qū)塊鏈的特征。1.去中心化。區(qū)塊鏈的每個節(jié)點既能平等、自由地交換數(shù)據(jù),也能相互連接、制約,使區(qū)塊鏈具備了容錯性、抗攻擊力、防合謀的優(yōu)點。2.不可篡改性。區(qū)塊鏈通過共識機制將信息添加到區(qū)塊后,所有節(jié)點會共同記錄,并通過加密保證前后區(qū)塊的關聯(lián)性,很難實現(xiàn)對記錄的修改。3.自治性。區(qū)塊鏈通過共識機制和智能合約,能使節(jié)點自由安全地交換數(shù)據(jù),擺脫以往系統(tǒng)對人的依賴性。
(三)區(qū)塊鏈的類型。1.公有鏈。公有鏈是完全去中心化,鏈上的數(shù)據(jù)完全公開透明。它允許全部節(jié)點準入,而且全部節(jié)點都是共識參與方,適用于數(shù)據(jù)能對所有人開放的情況。2.聯(lián)盟鏈。聯(lián)盟鏈是部分去中心化,系統(tǒng)有幾個權威機構共同分布式記賬,數(shù)據(jù)部分透明,公眾可以進行查閱和交易,讀取權限由具有準入機制的組織或機構決定。聯(lián)盟鏈適用于允許有限節(jié)點準入,共識參與方是預選節(jié)點的情況。3.私有鏈。私有鏈的特點是系統(tǒng)內(nèi)的每個節(jié)點的權限都需要組織來分配,鏈上的數(shù)據(jù)不透明,由于讀取數(shù)據(jù)設有權限,任何節(jié)點參與者都很難獲得鏈上面的數(shù)據(jù)。它適用于允許有限節(jié)點準入,但共識參與方為中心節(jié)點的情況。
(一)保證檔案數(shù)據(jù)的原始真實性。區(qū)塊鏈上數(shù)據(jù)的驗證、記賬、存儲、維護和傳輸?shù)冗^程均基于分布式系統(tǒng)結構,借助共識算法建立節(jié)點間的信任關系。當檔案數(shù)據(jù)經(jīng)過驗證添加到區(qū)塊鏈后,將在不同節(jié)點同步進行記錄,變成“全網(wǎng)共享”的模式,保證了數(shù)據(jù)的不可篡改性,也避免了傳統(tǒng)復式記賬的復雜性。此外,鏈上的任何一塊區(qū)塊都會記載之前產(chǎn)生的所有信息,并永久保存,即使管理者和用戶都想終止也無法修改或刪除,有效保證上鏈檔案數(shù)據(jù)的原始記錄性。
(二)區(qū)跨鏈類型與檔案共享層級相對應。依據(jù)檔案數(shù)據(jù)共享范圍,可將檔案數(shù)據(jù)劃分為完全共享、局部共享和不可共享三種類型。區(qū)塊鏈也有三種類型,因此,可以根據(jù)檔案數(shù)據(jù)共享范圍對應選擇區(qū)塊鏈類型。完全對公眾開放的檔案數(shù)據(jù)適合使用“公有鏈”,比如解密的紅色檔案資源;只在局部小范圍內(nèi)進行共享的檔案數(shù)據(jù)適合使用中心化程度最高的“私有鏈”;若是在一定范圍內(nèi)共享的檔案數(shù)據(jù),則可以考慮使用聯(lián)盟鏈,聯(lián)盟鏈公開程度介于公有鏈和私有鏈兩者之間,既有效避免了公有鏈擴展性太強,又避免了私有鏈擴展性太弱的不足。需要注意的是,在檔案數(shù)據(jù)共享的過程中,去中心化并不意味著所有參與主體具有相同的權限,在數(shù)據(jù)共享之初,還需要對參與的各節(jié)點、各主體進行權責劃分。
(三)智能合約提高檔案數(shù)據(jù)共享效能。智能合約是區(qū)塊鏈的重要組成部分,是一種信息化方式的計算機協(xié)議,主要用來傳播、驗證或執(zhí)行合同,Nick Szabo將其描述為“一個智能合約,就是一套以數(shù)字形式定義的承諾”。在用戶使用檔案數(shù)據(jù)時,智能合約會直接研判用戶的申請與自身要求是否相互符合,只有當申請符合合約要求時,也就是當合約事件出現(xiàn)時,區(qū)塊鏈才會自動啟動執(zhí)行代碼型合約,為用戶提取和提供所需的檔案數(shù)據(jù)。這種服務方式,改變了以往局域網(wǎng)的單向檔案信息傳遞模式,即前期需要在傳統(tǒng)信息平臺進行著錄和標引,制作出規(guī)范化檢索標識并存儲的方式,這就要求當檔案工作者或檔案信息用戶使用平臺時,需要運用能被系統(tǒng)理解的檢索標識或檢索表達式表達需求,以便于系統(tǒng)進行相符性對比。最終,平臺只能將符合標識或檢索表達式的條目信息找出來提供給需求者。在這種服務模式下,易存在檢索的檔案內(nèi)容不完整、數(shù)據(jù)不齊全、分類邏輯不科學、著錄不規(guī)范、格式不規(guī)范等現(xiàn)象,增加了用戶獲取檔案信息的難度,導致平臺檔案信息利用效率低。
(四)多種技術保障檔案數(shù)據(jù)安全。區(qū)塊鏈是一種分布式網(wǎng)絡,鏈上的所有數(shù)據(jù)會被分成小塊分布在整個網(wǎng)絡中,并通過哈希計算、數(shù)字簽名、非對稱加密算法、數(shù)據(jù)加密技術等多種技術集合,對上鏈的數(shù)據(jù)也僅具備“增查”兩種功能,從而能有效地應對檔案數(shù)據(jù)泄露和被篡改的風險。比如,時間戳將相關的檔案數(shù)據(jù)記入同一條時間鏈,并精確地形成唯一的時間印跡,從而保證檔案數(shù)據(jù)的可查驗、可追溯;非對稱密碼算法以一一對應的密鑰的方式,可對不同保密層級的檔案數(shù)據(jù)設置不同的權限;智能合約對檔案信息用戶進行身份識別并簽訂協(xié)議后,通過公鑰進行加密,檔案信息用戶接收到加密的檔案信息資源后再通過自身私鑰對其解密,從而達到利用檔案信息資源并保障其傳輸安全性的目的。
(一)樹立區(qū)塊鏈應用和檔案共享意識。理論指導行動,檔案部門要實現(xiàn)區(qū)塊鏈在檔案數(shù)據(jù)共享方面的應用,既要加強理論探討和實踐探索,也要提高思想認識,通過加強意識引領,達成區(qū)跨鏈共享數(shù)據(jù)共識。一直以來,不少檔案部門對數(shù)據(jù)共享的響應不積極,存在不愿共享、不敢共享、不會共享的情況。這主要受兩大方面的因素影響:一是檔案管理者的知識構成多側重于本學科內(nèi)容,缺少對先進信息技術知識的儲備,在應用新技術時存在數(shù)據(jù)知識掌握不全面、數(shù)據(jù)工具運用不熟練以及畏難心理;二是由于區(qū)塊鏈技術在檔案領域還未得以充分實踐,檔案人員在技術的使用性能和安全可靠性上存在擔憂,一旦出現(xiàn)問題會被追責問責,這也削弱了應用區(qū)塊鏈技術的意愿。因此,可先在一定區(qū)域范圍建設試驗單位,政策方面給予傾斜,加大資金、物力、人力的投入,并將建設經(jīng)驗和取得的結果通過短視頻、網(wǎng)絡、公眾號、專家講座等形式進行宣傳,以此來提高行業(yè)內(nèi)的共享意愿。
(二)編制安全可靠的智能合約。檔案數(shù)據(jù)共享過程中需要依靠區(qū)塊鏈中的核心技術之一智能合約來實現(xiàn),它是區(qū)塊鏈中運行在分布式賬本上的各種規(guī)則的計算機程序,這些規(guī)則包括設置規(guī)則、狀態(tài)、響應、交換記錄、價值信息等,通常用于實現(xiàn)物聯(lián)網(wǎng)設備的訪問控制。
智能合約影響著數(shù)據(jù)的使用率和安全性,在進行檔案數(shù)據(jù)訪問控制時,要保證數(shù)據(jù)所有者對數(shù)據(jù)訪問策略有安全控制權,能進行靈活且可擴展的訪問控制管理,并能對是否是惡意訪問作出判斷,對惡意訪問作出懲罰,保護好訪問用戶信息的安全性。編制時可結合自身實際需要,參考不同學者提出的模式,例如姜慶臣等人提出了采用PBFT算法構建一種面向智能合約數(shù)據(jù)庫共享(To-Contract Database Share,To C-DBS)模式,以保證數(shù)據(jù)共享的安全性和可信性。由于檔案數(shù)據(jù)共享范圍不同,共享權限存在差異,智能合約則需要解決訪問的信任問題。XIA等人提出的Me DShare系統(tǒng)可以解決無信任環(huán)境下醫(yī)療大數(shù)據(jù)的共享問題,通過智能合約技術完成數(shù)據(jù)的審計和追蹤具有一定的可借鑒性。此外,由于用戶訪問時,智能合約需要提升系統(tǒng)在響應時間、數(shù)據(jù)吞吐量、時間延遲等方面的性能。因此,檔案部門在訂立智能合約時,需要通盤考慮,可按照概念模型、邏輯模型、合約程序設計、合約編譯和部署等過程,制定好合約內(nèi)容。
(三)實現(xiàn)跨鏈檔案數(shù)據(jù)共享。從目前情況看,檔案機構對區(qū)塊鏈的信任度不高,局限于聯(lián)盟內(nèi)部,各種共識機制還屬于“中心化”范疇,小范圍的“信任”,并沒有發(fā)揮出區(qū)塊鏈技術應有的技術優(yōu)勢。區(qū)塊鏈上的數(shù)據(jù)共享存在同鏈共享、不同鏈共享、同鏈不同系統(tǒng)、不同鏈不同系統(tǒng)間數(shù)據(jù)共享等多種類型,若要實現(xiàn)跨鏈的數(shù)據(jù)共享是一個很復雜的過程,需要節(jié)點具備單獨驗證能力和對鏈外信息的獲取能力,解決區(qū)塊鏈應用彼此隔離、不同業(yè)務場景的獨立區(qū)塊鏈應用不能互聯(lián)的問題,才能實現(xiàn)跨不同類型、不同系統(tǒng)間的數(shù)據(jù)共享。因此,在進行建設時,可以優(yōu)先建立兩類聯(lián)盟區(qū)塊鏈:一是省級檔案局(館)聯(lián)盟區(qū)塊鏈;二是省級以下檔案機構聯(lián)盟區(qū)塊鏈。并通過跨鏈技術把它們連在一起,形成區(qū)域范圍內(nèi)的檔案機構聯(lián)盟區(qū)塊鏈系統(tǒng),各省級檔案館各掌握一個授權節(jié)點,每個授權節(jié)點之間都可以實現(xiàn)點對點的信息交互,并通過共識機制和智能合約機制共同維護聯(lián)盟區(qū)塊鏈的運行;各省級以下檔案機構共同建立一條聯(lián)盟區(qū)塊鏈,并通過跨鏈技術與省級檔案局(館)聯(lián)盟區(qū)塊鏈相連,從而實現(xiàn)更大范圍的檔案信息資源共享。
(四)加強政策法規(guī)建設。法治建設能為基于區(qū)跨鏈技術的檔案數(shù)據(jù)共享工作開展提供有力保障。從我國法治建設情況來看,2016年10月工信部出臺關于區(qū)塊鏈《中國區(qū)塊鏈技術和應用發(fā)展白皮書》,2019年中國國家互聯(lián)網(wǎng)信息辦公室又發(fā)布了《區(qū)塊鏈信息服務管理規(guī)定》,為區(qū)塊鏈的信息服務提供了可靠有效的法律依據(jù)??傮w而言,我國的區(qū)塊鏈發(fā)展還處于探索階段,因此一方面,需要加強頂層設計相關政策規(guī)章制度的建設,頂層設計的缺失,會導致檔案數(shù)據(jù)在共享原則、數(shù)據(jù)分類、共享范圍、共享質量、互操作性等方面存在問題,且一旦出現(xiàn)問題,也難以找到相應問題解決的依據(jù);另一方面,要完善法律保障體系,例如,如何對完全公開的公有鏈違法存儲數(shù)據(jù)和傳播數(shù)據(jù)相關權責進行認定,如何在法定或約定事由出現(xiàn)并產(chǎn)生糾紛時,個人刪除的權益無法得到保障等等,都需要相關法規(guī)政策進行明確。
檔案數(shù)據(jù)共享是充分調動檔案信息資源、實現(xiàn)檔案信息資源流轉、發(fā)揮檔案信息資源價值的基礎,數(shù)據(jù)共享的前提需要技術做支撐。區(qū)塊鏈在理論和技術層面可以為上鏈的檔案數(shù)據(jù)共享提供可信、安全保障。檔案行業(yè)在積極探討和應用區(qū)塊鏈優(yōu)勢的同時,也應關注區(qū)塊鏈潛在的問題和風險,并研究制定相適應的應對策略,為檔案數(shù)據(jù)共享工作良好發(fā)展奠定基礎。