孫大東 楊 晗/鄭州大學信息管理學院
區(qū)塊鏈技術具有去中心化、集體維護和可信數(shù)據(jù)庫等特征[1],將其引入電子檔案單套制管理可以從信息安全、實體安全以及載體安全三個方面提供保障,有效解決用戶對電子載體的不信任問題,為檔案管理方式從雙套制向單套制的轉(zhuǎn)變提供技術支持。
根據(jù)實際應用需求和去中心化程度的不同,區(qū)塊鏈技術可以分為三種應用模式——公共鏈、聯(lián)盟鏈和私有鏈,其向社會開放程度逐漸減弱,與開放電子檔案和不開放電子檔案管理的要求相契合。
“公共鏈是完全去中心化的區(qū)塊鏈,分布式系統(tǒng)的任何節(jié)點均可參與鏈上數(shù)據(jù)的讀寫、驗證和共識過程, 并根據(jù)其PoW或PoS貢獻獲得相應的經(jīng)濟激勵”[2]??梢钥闯觯叉溇哂虚_放性和共享性特征。值得注意的是,在三種模式中公共鏈模式的開放程度最大,也最適合于開放電子檔案的管理。筆者構(gòu)建了一個基于公共鏈模式的開放電子檔案管理體系,具體內(nèi)容如下:
數(shù)據(jù)層封裝了開放電子檔案數(shù)據(jù)區(qū)塊以及相關的數(shù)據(jù)加密技術,包括時間戳技術和非對稱技術。
1.1.1 數(shù)據(jù)區(qū)塊
區(qū)塊鏈中的數(shù)據(jù)由各節(jié)點共同形成,并存儲在所有參與形成數(shù)據(jù)的節(jié)點中。區(qū)塊鏈是一個龐大的數(shù)據(jù)庫,根據(jù)應用場景的不同,其保存的數(shù)據(jù)類型也不同。將其應用于開放電子檔案管理可以存儲所有機構(gòu)形成的開放電子檔案數(shù)據(jù):通過P2P網(wǎng)絡將電子檔案形成、保管單位組合起來;將經(jīng)過鑒定可以開放的電子檔案數(shù)據(jù)包括內(nèi)容信息、元數(shù)據(jù)、配置數(shù)據(jù)、日志數(shù)據(jù)等打包,進行數(shù)字簽名后保存到區(qū)塊中;將承擔檔案資源的區(qū)塊向全網(wǎng)廣播,并使其他區(qū)塊對該區(qū)塊的軟硬件環(huán)境、元數(shù)據(jù)、病毒等信息進行檢測,確保上傳電子檔案的真實性、可用性和完整性;通過驗證的區(qū)塊會加蓋時間戳,根據(jù)哈希函數(shù)值(對原始數(shù)據(jù)經(jīng)過散列函數(shù)計算而得到的一組由數(shù)字和字母組合的字符串)鏈入主區(qū)塊鏈;沒有達成共識的區(qū)塊則會被廢棄,以防止無效數(shù)據(jù)繼續(xù)廣播。檔案數(shù)據(jù)區(qū)塊形成的全過程公開透明、不可刪改、不可篡改,各個節(jié)點共同認證新上傳區(qū)塊數(shù)據(jù)的有效性,可有效提升檔案資源質(zhì)量和信息流通速度。
1.1.2 時間戳技術
利用區(qū)塊鏈的時間戳機制,可以對電子檔案的形成、流轉(zhuǎn)、改動、保存、移交等過程中形成的信息加蓋時間印章和信息主體的數(shù)字簽名,為檔案信息變動提供證據(jù),可有效、全面記錄電子檔案生命周期的管理過程,從而形成連續(xù)、完整、可證的檔案保管鏈。時間戳技術可使電子檔案數(shù)據(jù)得到前所未有的信任背書,也可保證電子檔案來源的可追溯性。
1.1.3 非對稱加密算法
為滿足身份驗證和數(shù)據(jù)安全的需求,區(qū)塊鏈運用了非對稱加密技術,即通過橢圓曲線加密、RSA、Elgamal等算法產(chǎn)生一對非對稱密鑰,分別稱為公開密鑰和私有密鑰(以下簡稱公鑰和私鑰)。其中公鑰用來加密信息,只有對應的私鑰才能解開信息。此算法具有單向性,其他人無法通過公鑰推算出其對應的私鑰。如區(qū)塊鏈技術最初在比特幣中應用時,其私鑰是由操作系統(tǒng)底層的隨機數(shù)生成器生成的256位隨機數(shù)組成的,總量可達2256[3],其他人極難通過不正當途徑獲得比特幣的私鑰。區(qū)塊鏈中的非對稱加密算法從傳輸層可保證電子檔案的安全,杜絕黑客非法入侵、竊取信息的行為。將非對稱加密算法應用于開放電子檔案的管理,公鑰和私鑰都可以向社會公開,以便公眾查找所需的電子檔案。
“公共鏈采用獨特的經(jīng)濟激勵機制來吸引節(jié)點完成工作,促使節(jié)點提供算力或其他資源,保證整個分布式網(wǎng)絡的順利運行”[4]。在比特幣中應用時,網(wǎng)絡中的節(jié)點通過數(shù)學運算、解決數(shù)學問題,可獲得一定數(shù)量的比特幣以及區(qū)塊的記賬權(quán)。由此可知,在開放電子檔案數(shù)據(jù)庫中應用區(qū)塊鏈技術時,亦可通過經(jīng)濟獎勵來吸引各單位存儲其形成的開放電子檔案、自發(fā)地維護數(shù)據(jù)庫,從而保證數(shù)據(jù)區(qū)塊的持續(xù)增長,使全國性的開放電子檔案數(shù)據(jù)庫長期運行成為可能。
在開放電子檔案管理中可引入公共鏈模式做分布式記錄和存儲,任何開放電子檔案的形成者、接收者、保管者均可跨部門、跨地區(qū)存儲經(jīng)過鑒定后可以開放的電子檔案,形成全國性的開放電子檔案數(shù)據(jù)庫。公共鏈的完全去中心化,可以使這些機構(gòu)在沒有中心機構(gòu)的管理下組織起來,解決目前中心化模式存在的高成本、低效率和安全性差等問題。
公共鏈具有公開透明和共享性,系統(tǒng)中每個節(jié)點都可以獲得一份完整的數(shù)據(jù)庫拷貝,因此每個節(jié)點既是電子檔案數(shù)據(jù)的形成者,也是數(shù)據(jù)的獲取者和傳播者,以此為依托建成的開放電子檔案數(shù)據(jù)庫既可作為保存庫,又可作為管理庫和利用庫,可有效解決“三庫分離”的現(xiàn)象、節(jié)約管理成本。并且由于建成的數(shù)據(jù)庫是全國性的開放電子檔案數(shù)據(jù)庫,利用者可在最短時間內(nèi)快捷地找到所需要的電子檔案,提高了開放電子檔案的利用效率。
由若干機構(gòu)聯(lián)合發(fā)起、允許授權(quán)機構(gòu)參與該區(qū)塊鏈的讀寫被稱為聯(lián)盟鏈,如R3區(qū)塊聯(lián)盟、BiTA和金鏈盟等。準入權(quán)限只向特定機構(gòu)內(nèi)部公開、網(wǎng)絡中所有節(jié)點都由該機構(gòu)掌握的區(qū)塊鏈被稱為私有鏈。聯(lián)盟鏈模式和私有鏈模式的主要區(qū)別在于中心機構(gòu)個數(shù),聯(lián)盟鏈模式是部分去中心化(或稱多中心化)的區(qū)塊鏈,私有鏈模式則是完全中心化的區(qū)塊鏈,兩者都是寫入權(quán)限在一定機構(gòu)內(nèi)、讀取權(quán)限在一定程度上被限制的區(qū)塊鏈模式。部分去中心化和完全中心化都意味著公眾不能隨意閱讀,因此聯(lián)盟鏈和私有鏈模式較適用于不開放電子檔案的管理。
根據(jù)管理的不同特點和需求,聯(lián)盟鏈和私有鏈模式可以應用于不同類型的不開放電子檔案管理中,如電子健康檔案、人事檔案和學籍檔案等。筆者以企業(yè)電子檔案和私人電子檔案為例,構(gòu)建了基于聯(lián)盟鏈模式的企業(yè)電子檔案管理體系和基于私有鏈模式的私人電子檔案管理體系。在管理企業(yè)電子檔案中引入聯(lián)盟鏈模式,運用聯(lián)盟鏈模式多中心化特性形成多中心的企業(yè)電子檔案管理聯(lián)盟,可使企業(yè)內(nèi)部的職能機構(gòu)或者不同企業(yè)通過共識機制和智能合約,更加有效地整合企業(yè)檔案信息資源。私有鏈模式是完全中心化的區(qū)塊鏈,其寫入權(quán)限由該機關的中心機構(gòu)控制,而讀取權(quán)限可視情況有選擇性地對外開放,適用于私人電子檔案只允許形成者和特定機構(gòu)(人員)查閱的特性。
2.1.1 數(shù)據(jù)層
綜上所述,國內(nèi)外學者對水牛乳的理化特性都進行了大量研究,但要充分了解我國水牛乳理化和生物學特性還需要大量研究。此外,在研究時,還需要特別注意乳水牛品種、生活地域環(huán)境、產(chǎn)乳胎次等因素,才能得出較為客觀的結(jié)論。
兩種管理體系都有最底層的數(shù)據(jù)層且與基于公共鏈模式的開放電子檔案數(shù)據(jù)庫的建設步驟相似,時間戳技術和非對稱加密算法能夠確保數(shù)據(jù)的真實可靠性,只是保存的數(shù)據(jù)種類和形成者不同。在數(shù)據(jù)種類方面,企業(yè)電子檔案管理體系是集檔案信息一體化的管理,包括檔案、圖書、情報、以及資料等數(shù)據(jù);私人電子檔案管理體系則側(cè)重于對書信、手稿、照片和字畫等數(shù)據(jù)的保管,相比較而言,前者電子檔案數(shù)據(jù)的形成速度快且數(shù)量龐大,比如中國航信集團目前存儲著超過2PB的結(jié)構(gòu)化檔案數(shù)據(jù),每年結(jié)構(gòu)化檔案數(shù)據(jù)增長量為35%,因此對數(shù)據(jù)層應變性能和存儲空間有更高的要求。在形成者方面,企業(yè)電子檔案管理體系中集團企業(yè)旗下的子公司或者企業(yè)內(nèi)部的職能機構(gòu)或者不同的企業(yè)是這個聯(lián)盟的成員;私人電子檔案管理體系中則保存的是“私營企業(yè)事業(yè)單位以及公民個人在私務活動中形成的和通過繼承、贈送等合法途徑獲取”[5]的私人電子檔案,其“形成者比較廣泛,既包括國家領導人、科學家、藝術家、勞動模范等著名人物,又包括普通老百姓,同時也包括私營企業(yè)事業(yè)單位”[6]。但是這兩種管理體系一般均只允許授權(quán)節(jié)點參與系統(tǒng)數(shù)據(jù)的讀寫和查看。
2.1.2 應用層
一方面,隨著知識經(jīng)濟的進一步發(fā)展,企業(yè)檔案由實體信息資源管理向知識資產(chǎn)管理模式轉(zhuǎn)變,因此在管理過程中更加注重企業(yè)電子檔案資源的交流和共享。引入聯(lián)盟鏈技術,使得不同企業(yè)電子檔案形成者組成管理聯(lián)盟,從而有效打破各企業(yè)間的“信息孤島”,建設跨主體的企業(yè)電子檔案共建共享網(wǎng)。另一方面,當前許多企業(yè)的檔案散落在各部門或者個人手中,極易造成檔案的泄密或丟失。在企業(yè)內(nèi)部引入聯(lián)盟鏈技術,可讓總部檔案管理部門、子公司檔案形成部門及各職能機構(gòu)“形成一個分布的、受監(jiān)督的檔案登記網(wǎng)絡,各方均保存一個完整的檔案副本”[7],有助于打破企業(yè)內(nèi)部的“信息孤島”,建設跨部門的企業(yè)電子檔案共建共享網(wǎng)。而且聯(lián)盟鏈模式整合了不同企業(yè)內(nèi)部的電子檔案,有利于運用大數(shù)據(jù)技術對數(shù)量龐大的電子檔案進行數(shù)據(jù)挖掘和價值分析,可更加充分地挖掘企業(yè)電子檔案的潛在價值,為市場調(diào)研和企業(yè)決策提供依據(jù)。
在私人電子檔案管理體系中,私有鏈模式通過加密和驗證機制,公鑰只向檔案管理部門公開,私鑰歸網(wǎng)絡中特定節(jié)點所有。機構(gòu)內(nèi)的任何用戶都可以上傳電子檔案,并通過公鑰加密信息;私鑰嚴格保密,只有檔案形成者或管理者才能使用私鑰解密信息,如此一來就能夠防止檔案信息泄露,有效保護和傳承社會記憶。
2.2.1 企業(yè)電子檔案管理體系中的合約層
目前,我國企業(yè)檔案管理大體上有兩種模式:大型民營企業(yè)主要采用自主管理模式,中小型企業(yè)主要采取業(yè)務外包模式。但由于檔案意識淡薄以及資金匱乏等諸多原因,企業(yè)電子檔案管理未能形成完整規(guī)范的管理流程,企業(yè)檔案流失現(xiàn)象較為嚴重。通過引入聯(lián)盟鏈模式中的智能合約(“一套以數(shù)字形式定義的承諾,包括合約參與方可以在上面執(zhí)行這些承諾的協(xié)議”[8]),可對企業(yè)電子檔案歸檔的內(nèi)容、范圍等方面提前預置觸發(fā)條件和響應規(guī)則,如可設置各部門形成的檔案在一定時間內(nèi)自動向總部檔案室移交、企業(yè)檔案室在一定時間內(nèi)自動向相應檔案館移交電子檔案等。這樣既無需人工操作,也可規(guī)范企業(yè)電子檔案的管理流程,又可整合企業(yè)內(nèi)部的電子檔案資源,節(jié)省人力、物力和財力,有助于改變當前企業(yè)電子檔案管理松散、混亂的現(xiàn)象。
2.2.2 私人電子檔案管理體系中的權(quán)限層
私人檔案的內(nèi)容既具有私密性,又具有社會性,這使得私人電子檔案在管理中既要保護檔案內(nèi)容不被外人所知,又要使檔案管理部門能夠了解到其內(nèi)容的歷史價值和社會價值。因此,可以在私人電子檔案管理體系中引入權(quán)限層來解決這個問題。
首先是私人電子檔案上傳者的身份驗證,可通過引入PKI技術,從注冊、交易兩級安全證書體系及隨機生成交易證書序號的方式實現(xiàn),只有通過驗證的節(jié)點才能登錄此檔案系統(tǒng)上傳電子檔案。其次是允許檔案形成者之外的單位或個人對其進行合法查閱的問題,目前有兩種解決方案:一種是在Fabric架構(gòu)中,在權(quán)限隔離層面將節(jié)點分為驗證節(jié)點和非驗證節(jié)點,根據(jù)實際情況將這些查閱者設為驗證節(jié)點,可以查看數(shù)據(jù)庫、維護賬本,而非驗證節(jié)點即形成者只能上傳電子檔案,維護上下節(jié)點間的安全;另一種是國際大銀行區(qū)塊鏈聯(lián)盟R3在分布式賬本Corda中采用的方案,Corda在賬本層面各個節(jié)點之間的數(shù)據(jù)不向全網(wǎng)廣播,只有數(shù)據(jù)關聯(lián)方才能收到相應信息。這兩種方案都可以解決私人電子檔案管理中查閱權(quán)限的問題,使得私人電子檔案管理既滿足了個人層面的私密性要求,又滿足了社會層面的開放性要求。
本文在分析區(qū)塊鏈技術三種模式特點的基礎上,將公共鏈模式引入到開放電子檔案管理中,構(gòu)建了包括數(shù)據(jù)層、激勵層和應用層的開放電子檔案管理體系;將聯(lián)盟鏈模式和私有鏈模式引入到不開放電子檔案管理中,構(gòu)建了基于聯(lián)盟鏈模式的企業(yè)電子檔案管理體系和基于私有鏈模式的私人電子檔案管理體系??梢钥闯?,區(qū)塊鏈技術能夠適用于不同類型的電子檔案管理,其應用和管理要求也各有不同,并且由于區(qū)塊鏈技術具有自身的優(yōu)勢和特點,將其運用于電子檔案管理能夠更好地推動電子檔案單套制管理的進程。區(qū)塊鏈技術仍處于不斷發(fā)展和完善階段,將其應用到電子檔案管理中的具體技術細節(jié)和步驟還需要進一步研究。