岳林恒
在大數(shù)據(jù)時(shí)代下,信息消費(fèi)和主體互動(dòng)產(chǎn)生的數(shù)據(jù),已經(jīng)呈現(xiàn)爆炸式增長(zhǎng),學(xué)術(shù)、商業(yè)和政府領(lǐng)域在大數(shù)據(jù)時(shí)代下也在逐步向“數(shù)據(jù)化”轉(zhuǎn)型,檔案事業(yè)也不例外。數(shù)據(jù)是作為重要的生產(chǎn)要素和國(guó)家的戰(zhàn)略資產(chǎn),其中檔案數(shù)據(jù)是作為社會(huì)的隱藏財(cái)富,積極助力國(guó)家現(xiàn)代化建設(shè)?!笆奈濉币?guī)劃明確提出了“加快數(shù)字化發(fā)展”“保護(hù)數(shù)據(jù)資源產(chǎn)權(quán)”的戰(zhàn)略定位,為今后在大數(shù)據(jù)時(shí)代下開(kāi)展檔案數(shù)據(jù)治理工作,提出了相應(yīng)的頂層設(shè)計(jì)與策略。不僅如此,2021年甘肅省、黑龍江省、陜西省等地方“十四五”檔案事業(yè)發(fā)展規(guī)劃都明確指出檔案數(shù)據(jù)治理是重點(diǎn)科研攻關(guān)任務(wù)之一。可見(jiàn)檔案數(shù)據(jù)治理是大數(shù)據(jù)時(shí)代國(guó)家治理體系的重要手段和建設(shè)內(nèi)容,也是檔案資源的數(shù)據(jù)化背景帶來(lái)的重大挑戰(zhàn)之一。如何進(jìn)一步加強(qiáng)對(duì)檔案數(shù)據(jù)的治理迫在眉睫,是檔案工作者和專(zhuān)家需要解決的問(wèn)題[1]。對(duì)檔案數(shù)據(jù)治理的研究,有利于檔案部門(mén)更好地履行新時(shí)代下的職責(zé),也利于檔案事業(yè)本身的發(fā)展,完善檔案學(xué)科理論體系。
一、我國(guó)檔案數(shù)據(jù)治理相關(guān)研究綜述
2016年在《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中提出“推動(dòng)檔案數(shù)據(jù)開(kāi)放共享、保障檔案數(shù)據(jù)安全”后,加上如今大數(shù)據(jù)時(shí)代背景下,檔案數(shù)據(jù)治理問(wèn)題在學(xué)界得到的關(guān)注度越來(lái)越高。首先從治理主體視角出發(fā),劉越男[2]、 楊晶晶[3]分別從檔案部門(mén)主體、我國(guó)企業(yè)角度出發(fā),探討了不同主體該如何參與實(shí)現(xiàn)檔案數(shù)據(jù)治理;楊茜茜[4]則據(jù)檔案數(shù)據(jù)特征提出了治理研究的理論坐標(biāo)體系。其次從治理方法角度出發(fā),常大偉[5]、潘娜[5]等從宏觀和微觀研究來(lái)提升檔案數(shù)據(jù)治理能力;陳永生[6]、王沐暉[6]等人從政務(wù)服務(wù)平臺(tái)出發(fā)來(lái)完善檔案治理;金波[7]、楊鵬[7]通過(guò)新興信息技術(shù)賦能檔案治理智慧化。最后,檔案數(shù)據(jù)治理的安全研究也是檔案數(shù)據(jù)治理體系的重要前提,金波[8][9]、楊鵬[8][9]、周林興[10]、韓永繼[10]等著重論述了一系列可行的檔案數(shù)據(jù)安全治理的方法與成熟度評(píng)估模型。這些研究成果涉及各種視角下的檔案數(shù)據(jù)治理,從理念內(nèi)涵、意義特征、治理重點(diǎn)、治理安全、開(kāi)發(fā)模式、方案構(gòu)建等多方面揭示了檔案數(shù)據(jù)治理問(wèn)題研究的豐富性?;诖耍疚膶@我國(guó)檔案數(shù)據(jù)治理的現(xiàn)狀和困境,運(yùn)用生命周期理論、以多元主體協(xié)同共治為落腳點(diǎn)來(lái)展望治理路徑,旨在為我國(guó)檔案事業(yè)與檔案數(shù)據(jù)治理工作提供有益的借鑒。
二、檔案數(shù)據(jù)治理內(nèi)涵及重要性
(一)檔案數(shù)據(jù)治理的內(nèi)涵
檔案數(shù)據(jù)治理,是指檔案部門(mén)以多元協(xié)作的方式,通過(guò)運(yùn)用數(shù)據(jù)治理技術(shù),在符合相關(guān)法律法規(guī)情況下,以確保檔案數(shù)據(jù)的真實(shí)完整性、安全共享、價(jià)值增值為目的,全面實(shí)施檔案數(shù)據(jù)的全生命周期治理,達(dá)到檔案數(shù)據(jù)善治的效果[11]。大數(shù)據(jù)時(shí)代下檔案數(shù)據(jù)來(lái)源廣泛、涵蓋的內(nèi)容更雜亂,治理對(duì)象是具有檔案屬性的各類(lèi)數(shù)據(jù)資源,不僅僅包括以往政務(wù)、企業(yè)和個(gè)人的檔案,新聞媒體、社交媒體和網(wǎng)頁(yè)等所產(chǎn)生的檔案屬性數(shù)據(jù),也被列入檔案數(shù)據(jù)治理的范疇。對(duì)檔案部門(mén)的工作提出了更高的要求與國(guó)家治理體系相匹配。
(二)檔案數(shù)據(jù)治理的重要性與必要性
一方面,檔案數(shù)據(jù)治理在國(guó)家治理體系中占有舉足輕重的地位。檔案治理能力的內(nèi)涵應(yīng)與國(guó)家治理能力的內(nèi)涵同源,檔案工作由于其自身的政治文化屬性,檔案數(shù)據(jù)治理既是構(gòu)成國(guó)家治理體系的重要組成部分,也是實(shí)現(xiàn)國(guó)家治理體系現(xiàn)代化的重要手段。檔案數(shù)據(jù)治理要在全社會(huì)范圍內(nèi)開(kāi)展,加快檔案治理水平和檔案治理能力現(xiàn)代化,成為推進(jìn)國(guó)家治理體系現(xiàn)代化的助推器,為實(shí)現(xiàn)“十四五”規(guī)劃的順利完成做出新的貢獻(xiàn)。
另一方面,檔案數(shù)據(jù)治理是推動(dòng)檔案工作轉(zhuǎn)型的力量。從治理的主體上來(lái)看,過(guò)去檔案機(jī)構(gòu)單打獨(dú)斗的工作模式,與如今的大數(shù)據(jù)時(shí)代發(fā)展不相適應(yīng)?,F(xiàn)檔案數(shù)據(jù)治理,需要以檔案機(jī)構(gòu)為主體,領(lǐng)導(dǎo)社會(huì)組織機(jī)構(gòu)、民眾多元主體協(xié)作共治。從治理的客體上來(lái)看,檔案數(shù)據(jù)治理是適應(yīng)大數(shù)據(jù)發(fā)展的必由之路,隨著大數(shù)據(jù)的不斷發(fā)展,檔案數(shù)據(jù)的存儲(chǔ)、管理和服務(wù)方式也在不斷變化,社會(huì)大眾對(duì)檔案數(shù)據(jù)的需求日趨個(gè)性化、智慧化,迫使傳統(tǒng)檔案管理工作模式向檔案數(shù)據(jù)治理模式轉(zhuǎn)型。
三、檔案數(shù)據(jù)治理現(xiàn)狀及困境
我國(guó)檔案數(shù)據(jù)治理工作正在蓬勃發(fā)展,部分城市已經(jīng)走在前列。近年來(lái),檔案數(shù)據(jù)中心建設(shè)項(xiàng)目如雨后春筍般涌現(xiàn)出來(lái),例如浙江省檔案館[12]、三明市檔案館[13]、益陽(yáng)市檔案館[14]等積極建設(shè)檔案數(shù)據(jù)中心,作為全面收集、整合檔案數(shù)據(jù)的資源管理平臺(tái),利于檔案信息化建設(shè)、政務(wù)數(shù)據(jù)的歸集和整合,大幅提升檔案數(shù)據(jù)治理水平。對(duì)于檔案館內(nèi)部的數(shù)據(jù)整合,例如杭州市檔案局開(kāi)發(fā)了一個(gè)數(shù)據(jù)集成平臺(tái)——杭州市電子業(yè)務(wù)數(shù)據(jù)歸檔系統(tǒng),可以有效地整合、保存、管理、利用各類(lèi)業(yè)務(wù)數(shù)據(jù),增加了檔案部門(mén)保存的數(shù)據(jù)種類(lèi)和數(shù)據(jù)量,彌補(bǔ)檔案部門(mén)間的“數(shù)據(jù)縫隙”,提升了檔案部門(mén)數(shù)據(jù)治理效能[15]。大數(shù)據(jù)時(shí)代下檔案館構(gòu)建的各類(lèi)檔案數(shù)據(jù)庫(kù)也積極助力檔案數(shù)據(jù)治理,例如萊州市檔案館構(gòu)建的專(zhuān)題檔案數(shù)據(jù)庫(kù),不僅盤(pán)活數(shù)據(jù),提升檔案公共服務(wù)能力,還能深入挖掘資源獲得歷史啟示,為當(dāng)?shù)仡I(lǐng)導(dǎo)的決策增加前瞻性與檔案支持,提升治理績(jī)效[16]。
雖然我國(guó)檔案數(shù)據(jù)治理工作已經(jīng)初見(jiàn)成效,傳統(tǒng)的檔案管理也正在逐步走向檔案數(shù)據(jù)治理,但是我國(guó)整體檔案數(shù)據(jù)治理情況仍參差不齊,存在滯后性和失衡性。受資金、人員、信息技術(shù)等因素的影響,特別是檔案數(shù)據(jù)治理落后的地方檔案館,很可能簡(jiǎn)單地將檔案數(shù)據(jù)治理看作是檔案數(shù)據(jù)的整理和保存,忽略了檔案數(shù)據(jù)治理對(duì)社會(huì)的效益和價(jià)值,工作重心放在了簡(jiǎn)單的檔案數(shù)據(jù)組織工作上,如收集、整理、電子化等基礎(chǔ)環(huán)節(jié)??傊诖髷?shù)據(jù)時(shí)代背景下,數(shù)據(jù)增長(zhǎng)與治理落后、海量數(shù)據(jù)與價(jià)值開(kāi)發(fā)等矛盾日益凸顯,檔案部門(mén)應(yīng)積極滿(mǎn)足公眾的數(shù)據(jù)需求[17],提升公共服務(wù)能力與國(guó)家治理現(xiàn)代化相匹配,在檔案數(shù)據(jù)治理中數(shù)據(jù)質(zhì)量、價(jià)值挖掘、數(shù)據(jù)安全風(fēng)險(xiǎn)等問(wèn)題值得被重視起來(lái)。
(一)檔案數(shù)據(jù)質(zhì)量參差不齊
一是檔案數(shù)據(jù)規(guī)模大。2021年底全國(guó)檔案部門(mén)館藏電子檔案數(shù)據(jù)1629.9TB,不僅檔案數(shù)據(jù)量大,而且目前檔案數(shù)據(jù)的處理對(duì)人工的依賴(lài)程度高,且數(shù)據(jù)處理的效率低,數(shù)據(jù)質(zhì)量不易控制,會(huì)影響檔案的完整性,加上數(shù)據(jù)量大,進(jìn)而影響檔案的使用效率[18]。二是來(lái)源渠道多樣化,結(jié)構(gòu)各異。具有檔案屬性的信息都可以納入檔案數(shù)據(jù)治理中來(lái),例如文檔、表格、網(wǎng)頁(yè)、音視頻等。檔案機(jī)構(gòu)部門(mén)各自系統(tǒng)建設(shè)情況不同,缺乏統(tǒng)一的檔案數(shù)據(jù)標(biāo)準(zhǔn),既增加了多元檔案數(shù)據(jù)整合的難度和復(fù)雜性,還容易造成檔案數(shù)據(jù)標(biāo)準(zhǔn)各異,并且容易導(dǎo)致整合后的數(shù)據(jù)質(zhì)量參差不齊。例如,建設(shè)浙江紹興市的檔案數(shù)據(jù)中心時(shí),經(jīng)常出現(xiàn)檔案數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)不一,極大地增加了建設(shè)難度[19]。三是影響了檔案后續(xù)的工作。對(duì)質(zhì)量不一的檔案數(shù)據(jù)很難直接進(jìn)行發(fā)掘開(kāi)發(fā),參差不齊的檔案數(shù)據(jù)質(zhì)量增加了后續(xù)開(kāi)發(fā)利用的成本,這對(duì)些檔案數(shù)據(jù)的治理又提出了新的要求。
(二)對(duì)檔案數(shù)據(jù)價(jià)值挖掘不足
一是檔案數(shù)據(jù)價(jià)值意識(shí)不高。檔案機(jī)構(gòu)等單位保存了大量、豐富的檔案數(shù)據(jù)資源,但對(duì)檔案中的數(shù)據(jù)缺乏價(jià)值意識(shí),受以往“重收藏、輕利用”理念的影響,習(xí)慣被動(dòng)地去利用開(kāi)發(fā)檔案,只有部分檔案數(shù)據(jù)利用頻繁,浪費(fèi)了豐富的館藏資源數(shù)據(jù),滿(mǎn)足不了精準(zhǔn)化、個(gè)性化的檔案需求。二是缺少信息技術(shù)支撐檔案數(shù)據(jù)挖掘。盡管現(xiàn)有許多檔案機(jī)構(gòu)進(jìn)行數(shù)據(jù)開(kāi)發(fā),但數(shù)據(jù)開(kāi)發(fā)使用模式簡(jiǎn)單,主要是粗淺的編研材料和建立簡(jiǎn)單的檢索框架,檔案數(shù)據(jù)的價(jià)值挖掘、關(guān)聯(lián)分析的治理技術(shù)等信息技術(shù)沒(méi)有得到充分利用,檔案數(shù)據(jù)的隱藏價(jià)值沒(méi)有被充分發(fā)現(xiàn),所蘊(yùn)含的經(jīng)濟(jì)和社會(huì)效益沒(méi)有得到體現(xiàn)。
(三)檔案數(shù)據(jù)安全風(fēng)險(xiǎn)問(wèn)題
數(shù)據(jù)安全是大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理的先決條件,檔案數(shù)據(jù)安全風(fēng)險(xiǎn)能引起檔案數(shù)據(jù)的損失、價(jià)值實(shí)現(xiàn)受到限制以及其他不確定問(wèn)題。一是檔案數(shù)據(jù)安全的法律不夠完善。2020年修訂的《中華人民共和國(guó)檔案法》檔案數(shù)據(jù)中有關(guān)版權(quán)、知識(shí)產(chǎn)權(quán)等問(wèn)題沒(méi)有明確的規(guī)范。由于數(shù)字化的檔案數(shù)據(jù)內(nèi)容信息可以被復(fù)制粘貼,與原本載體的關(guān)聯(lián)度不高,因而數(shù)字化的檔案數(shù)據(jù)不存在傳統(tǒng)意義上的“原件”的說(shuō)法,在人為的轉(zhuǎn)移或者共享的過(guò)程中,容易發(fā)生一些數(shù)據(jù)安全性、知識(shí)產(chǎn)權(quán)相關(guān)的風(fēng)險(xiǎn)問(wèn)題,對(duì)此相關(guān)部門(mén)缺乏必要的權(quán)屬法律體系[20]。二是信息技術(shù)風(fēng)險(xiǎn)問(wèn)題。大數(shù)據(jù)時(shí)代下信息技術(shù)日新月異,不法分子利用漏洞、網(wǎng)絡(luò)病毒等方式入侵篡改檔案數(shù)據(jù)等風(fēng)險(xiǎn)日益突出。由于檔案數(shù)據(jù)本身的價(jià)值性、敏感性特點(diǎn),極易導(dǎo)致其受到病毒入侵和黑客攻擊。不法分子為了進(jìn)行非法牟利從而入侵攻擊、販賣(mài)泄漏檔案數(shù)據(jù),并且檔案數(shù)據(jù)篡改后不易即時(shí)被發(fā)現(xiàn)。例如,2016年2月王某輝用非法手段入侵某部委醫(yī)療服務(wù)信息系統(tǒng),導(dǎo)致個(gè)人檔案數(shù)據(jù)嚴(yán)重泄漏[21]。由此可見(jiàn),檔案數(shù)據(jù)安全在大數(shù)據(jù)時(shí)代下十分依賴(lài)信息技術(shù),存在技術(shù)帶來(lái)的風(fēng)險(xiǎn)問(wèn)題。
四、大數(shù)據(jù)時(shí)代下檔案數(shù)據(jù)治理的對(duì)策
基于信息生命周期理論,從檔案數(shù)據(jù)的產(chǎn)生、組織和開(kāi)發(fā)利用環(huán)節(jié)為切入點(diǎn),來(lái)探討大數(shù)據(jù)時(shí)代下的檔案數(shù)據(jù)治理的對(duì)策,以多元主體協(xié)同共治來(lái)強(qiáng)化大數(shù)據(jù)時(shí)代下的檔案數(shù)據(jù)治理能力,積極打造一個(gè)契合大數(shù)據(jù)時(shí)代下的檔案數(shù)據(jù)治理安全環(huán)境。
(一)檔案數(shù)據(jù)產(chǎn)生階段
1.多元主體協(xié)同共治,增強(qiáng)收集力量
檔案部門(mén)作為檔案數(shù)據(jù)治理的領(lǐng)頭部門(mén),應(yīng)該積極融入大數(shù)據(jù)時(shí)代,轉(zhuǎn)變單一治理的觀念。強(qiáng)調(diào)多元化主體協(xié)同共治,社會(huì)組織機(jī)構(gòu)與社會(huì)群眾要積極與檔案部門(mén)合作,以多樣化的收集方式來(lái)增強(qiáng)收集的力量[22]。檔案部門(mén)要積極發(fā)揮主導(dǎo)作用,近年來(lái)對(duì)于保護(hù)和開(kāi)發(fā)非物質(zhì)文化遺產(chǎn)檔案數(shù)據(jù)資源,檔案部門(mén)應(yīng)該走在前面。在收集非物質(zhì)文化遺產(chǎn)檔案數(shù)據(jù)資源時(shí),要與圖書(shū)館和博物館保持溝通,可以通過(guò)技術(shù)手段建立統(tǒng)一的資源平臺(tái),共建共治共享珍貴的數(shù)據(jù)資源。應(yīng)該積極與當(dāng)?shù)卮髷?shù)據(jù)局達(dá)成合作意識(shí),把數(shù)據(jù)平臺(tái)鏈接共享,實(shí)現(xiàn)信息化數(shù)據(jù)化,從而打破信息壁壘。協(xié)同共治涉及多方主體,檔案部門(mén)應(yīng)該讓各主體之間的利益得到協(xié)調(diào),讓各主體跨系統(tǒng)、跨組織、跨部門(mén)的合作形式多樣。
2. 擴(kuò)大收集范圍,豐富數(shù)據(jù)構(gòu)成
擴(kuò)大檔案數(shù)據(jù)收集范圍,豐富非政務(wù)檔案數(shù)據(jù)收集。首先,增加大數(shù)據(jù)下檔案數(shù)據(jù)的構(gòu)成種類(lèi)。例如,加強(qiáng)對(duì)地方特色檔案的保護(hù)和收集,地方特色檔案數(shù)據(jù)資源反映了地方風(fēng)俗、民俗等,是具有地方歷史文化價(jià)值的特色數(shù)據(jù),對(duì)地方社會(huì)記憶具有重要意義。其次,加強(qiáng)突發(fā)公共事件檔案文獻(xiàn)數(shù)據(jù)的收集。檔案數(shù)據(jù)源于社會(huì),其價(jià)值也應(yīng)該回饋給社會(huì)。突發(fā)公共事件涉及社會(huì)全體成員,加強(qiáng)公共事件檔案數(shù)據(jù)記錄,建立更完整、更科學(xué)的國(guó)家治理體系。例如,全球性公共衛(wèi)生事件新冠病毒疫情,檔案部門(mén)增強(qiáng)了傳染病暴發(fā)狀態(tài)檔案數(shù)據(jù)的收集,為今后突發(fā)公共衛(wèi)生事件提供參考。最后,增加來(lái)自非政務(wù)性質(zhì)檔案的渠道,例如一些具有檔案性質(zhì)網(wǎng)站和媒體,提高檔案數(shù)據(jù)為群眾服務(wù)的能力[23]。
(二)檔案數(shù)據(jù)的組織階段
1. 引入數(shù)據(jù)處理技術(shù)
在大數(shù)據(jù)生命周期方面這個(gè)階段主要針對(duì)檔案數(shù)據(jù)預(yù)處理,將收集到的檔案數(shù)據(jù)進(jìn)行清洗、規(guī)范化、一致性等技術(shù)處理,使檔案數(shù)據(jù)有序、統(tǒng)一,這一步是為了提高數(shù)據(jù)的質(zhì)量,為后續(xù)的分析、利用打下基礎(chǔ)。一方面,數(shù)據(jù)處理技術(shù)可減少對(duì)人工的依賴(lài),不僅降低節(jié)約成本,還能有效地提高檔案數(shù)據(jù)的處理速度。例如,浙江省檔案館使用科大訊飛的技術(shù)處理聲像檔案,實(shí)現(xiàn)自動(dòng)編目和著錄,極大地提高了效率。另一方面,數(shù)據(jù)處理技術(shù)可以提高檔案數(shù)據(jù)的質(zhì)量。例如成都市檔案館對(duì)于不能全文檢索的檔案數(shù)據(jù)資源,采用人工智能、圖像識(shí)別技術(shù)進(jìn)行分析提取,不僅提升檔案數(shù)據(jù)質(zhì)量也方便后續(xù)的發(fā)掘利用[24];又例如在組織檔案數(shù)據(jù)時(shí),可以使用數(shù)據(jù)倉(cāng)庫(kù)ETL工具即時(shí)刪除無(wú)效的檔案數(shù)據(jù),把有效的檔案數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,從而提高了檔案數(shù)據(jù)的質(zhì)量。現(xiàn)依托于大數(shù)據(jù)的新的信息數(shù)據(jù)技術(shù)可以很好地處理檔案大數(shù)據(jù),檔案數(shù)據(jù)作為更有價(jià)值、數(shù)量級(jí)別大的數(shù)據(jù),引入新的數(shù)據(jù)技術(shù)是必不可少的。
2. 多主體協(xié)同組織檔案數(shù)據(jù)
一是加強(qiáng)與當(dāng)?shù)匚幕瘷C(jī)構(gòu)溝通。當(dāng)?shù)匚幕瘷C(jī)構(gòu)對(duì)于檔案的形成比較了解,在檔案數(shù)據(jù)組織工作中,可以分辨出有效檔案數(shù)據(jù),也可以保障檔案數(shù)據(jù)元數(shù)據(jù)的準(zhǔn)確性和完整性。目前少數(shù)民族檔案資料大都散落在各民族地方的文化組織中。檔案管理部門(mén)加強(qiáng)與各民族文化機(jī)構(gòu)的溝通,高效地組織、整理少數(shù)民族檔案數(shù)據(jù)的同時(shí),建立共享少數(shù)民族檔案平臺(tái)或數(shù)據(jù)庫(kù)、元數(shù)據(jù)標(biāo)準(zhǔn),突破檔案數(shù)據(jù)組織的障礙。二是協(xié)同檔案研究的社會(huì)機(jī)構(gòu)。研究檔案的科研所、高校、協(xié)會(huì)等社會(huì)機(jī)構(gòu)在檔案數(shù)據(jù)的組織中扮演著舉足輕重的角色。例如,檔案部門(mén)與研究檔案的高校、機(jī)構(gòu),可以研究制定適用于本地區(qū)的檔案數(shù)據(jù)組織標(biāo)準(zhǔn)、規(guī)范,推動(dòng)檔案數(shù)據(jù)組織的科學(xué)發(fā)展。三是發(fā)動(dòng)社會(huì)公眾群體。通過(guò)媒體或檔案部門(mén),一些檔案數(shù)據(jù)可以讓群眾自發(fā)地進(jìn)行組織整理,從而實(shí)現(xiàn)社會(huì)公眾群體與檔案部門(mén)共治的路徑。
(三)檔案數(shù)據(jù)開(kāi)發(fā)與利用階段
1. 技術(shù)賦能檔案數(shù)據(jù)發(fā)掘與利用
檔案數(shù)據(jù)的善治是為了對(duì)檔案數(shù)據(jù)更深層次地進(jìn)行開(kāi)發(fā)和挖掘。首先,從內(nèi)容文本入手發(fā)掘。由于檔案數(shù)據(jù)具有復(fù)雜性和多樣性,適用于大數(shù)據(jù)分析技術(shù)來(lái)開(kāi)發(fā)挖掘,例如機(jī)器學(xué)習(xí)實(shí)現(xiàn)對(duì)羅馬歷史檔案文獻(xiàn)的自動(dòng)轉(zhuǎn)錄[25];文本挖掘還包括主題挖掘,是一種基于文本屬性特征的相關(guān)關(guān)系的分析,對(duì)專(zhuān)題檔案數(shù)據(jù)的特征項(xiàng)進(jìn)行文本主題分析,實(shí)現(xiàn)對(duì)專(zhuān)題檔案數(shù)據(jù)全面分析。其次,引用新的展示技術(shù)利用檔案數(shù)據(jù)。利用全息影像、人工智能等技術(shù),創(chuàng)造出一種情景化的演示,讓檔案數(shù)據(jù)更加鮮活生動(dòng)地展示出來(lái),使用戶(hù)沉浸在檔案展示的場(chǎng)景中,從而讓用戶(hù)自身更好地利用檔案數(shù)據(jù)的價(jià)值。最后,積極與信息技術(shù)公司協(xié)同合作。例如浙江省檔案館與阿里云計(jì)算公司達(dá)成智慧檔案研究合作協(xié)議,合作研發(fā)并且準(zhǔn)備將電子檔案存證出證的區(qū)塊鏈技術(shù)、檔案便民服務(wù)技術(shù)等用于實(shí)踐,積極探尋檔案數(shù)據(jù)利用高效化、治理智慧化,以適應(yīng)公眾對(duì)檔案利用的新要求[26]。
2.多元渠道提供個(gè)性檔案數(shù)據(jù)服務(wù)
一是通過(guò)用戶(hù)畫(huà)像提供個(gè)性化服務(wù)。在各類(lèi)用戶(hù)之間收集用戶(hù)的喜好,提供個(gè)性化的服務(wù)。例如,在非物質(zhì)文化遺產(chǎn)檔案資源開(kāi)發(fā),利用社交媒體收集檔案使用者信息,識(shí)別其動(dòng)機(jī)和喜好,利用收集的信息進(jìn)行用戶(hù)畫(huà)像分析,把更精確的非物質(zhì)文化遺產(chǎn)檔案展現(xiàn)給用戶(hù)。二是拓寬服務(wù)平臺(tái)??梢酝ㄟ^(guò)微信平臺(tái)、流行的短視頻模式傳播特色檔案數(shù)據(jù)資源,使檔案資源不再局限于檔案館,改變以往被動(dòng)地開(kāi)發(fā)利用檔案的局面,提高群眾利用民生檔案的積極性。三是建立用戶(hù)反饋制度。檔案部門(mén)應(yīng)積極調(diào)研和關(guān)心居民用戶(hù)的檔案需求,探索檔案受用群體的檔案使用軌跡和檔案使用習(xí)慣,根據(jù)反饋結(jié)果不斷調(diào)整檔案數(shù)據(jù)管理制度,進(jìn)一步對(duì)服務(wù)模式進(jìn)行改進(jìn),提高檔案數(shù)據(jù)的開(kāi)發(fā)和利用。
(四)積極防范檔案數(shù)據(jù)治理的安全風(fēng)險(xiǎn)
1.加強(qiáng)檔案數(shù)據(jù)治理安全法治建設(shè)
一是加強(qiáng)目前檔案數(shù)據(jù)安全相關(guān)法規(guī)體系建設(shè)。我國(guó)已經(jīng)有《數(shù)據(jù)安全法》《信息安全技術(shù)大數(shù)據(jù)安全管理指南》等法律法規(guī),但是在當(dāng)前的檔案數(shù)據(jù)治理中,仍然無(wú)法解決當(dāng)前的安全問(wèn)題。因此,制定相關(guān)政策來(lái)保障檔案數(shù)據(jù)治理的安全,新《檔案法》為出發(fā)點(diǎn),確保檔案數(shù)據(jù)治理過(guò)程中有法可依。解決檔案數(shù)據(jù)在移交、儲(chǔ)存、管理等權(quán)責(zé)問(wèn)題和涉及數(shù)據(jù)隱私、知識(shí)產(chǎn)權(quán)問(wèn)題,為檔案數(shù)據(jù)的收集、組織、利用全生命周期提供法律依據(jù) [27]。二是檔案部門(mén)要強(qiáng)化主體執(zhí)法責(zé)任。在檔案數(shù)據(jù)治理的生命周期中依法管理,解決遇到的安全風(fēng)險(xiǎn)問(wèn)題,做到勇于執(zhí)法,違法必究。監(jiān)督檔案數(shù)據(jù)治理過(guò)程中的行為規(guī)范,擺正執(zhí)法主體位置,清晰地劃清權(quán)責(zé)范圍,盡可能地避免數(shù)據(jù)安全風(fēng)險(xiǎn)的發(fā)生。
2. 構(gòu)建檔案數(shù)據(jù)安全治理體制機(jī)制
一是建立檔案數(shù)據(jù)安全應(yīng)急機(jī)制。結(jié)合檔案部門(mén)的地理和社會(huì)環(huán)境,利用模擬虛擬技術(shù)構(gòu)建應(yīng)急預(yù)案,確保發(fā)生突發(fā)安全事件時(shí),化解檔案數(shù)據(jù)所面臨的安全問(wèn)題。二是建立安全協(xié)同機(jī)制。檔案部門(mén)除了獲得政府的支持,還要領(lǐng)導(dǎo)社會(huì)機(jī)構(gòu)、公眾參與到檔案數(shù)據(jù)的安全治理中來(lái),形成多元主體共治渠道。例如,檔案部門(mén)、信息技術(shù)企業(yè)、高校信息科研所等多元主體協(xié)同共治,有效降低對(duì)“大數(shù)據(jù)”“云計(jì)算”等技術(shù)開(kāi)發(fā)的難度,加強(qiáng)對(duì)檔案工作各過(guò)程信息技術(shù)的治理力度,減少數(shù)據(jù)安全風(fēng)險(xiǎn)。三是運(yùn)用信息安全技術(shù)構(gòu)成技防機(jī)制。檔案數(shù)據(jù)安全技術(shù)壁壘有效地保障了數(shù)據(jù)的完整、保密。特別是在檔案數(shù)據(jù)的存儲(chǔ)和利用階段,運(yùn)用加密技術(shù)、訪(fǎng)問(wèn)控制技術(shù)進(jìn)行身份識(shí)別,可以限制部分訪(fǎng)問(wèn)人員對(duì)核心檔案數(shù)據(jù)的權(quán)限,從而保護(hù)關(guān)鍵檔案數(shù)據(jù)不被泄露。還可以利用隱私保護(hù)技術(shù),防止檔案數(shù)據(jù)在開(kāi)發(fā)和使用過(guò)程中的泄露問(wèn)題。應(yīng)對(duì)網(wǎng)絡(luò)攻擊時(shí),入侵檢測(cè)技術(shù)可以幫助系統(tǒng)防止破解,即時(shí)檢測(cè)修復(fù)系統(tǒng)漏洞。
參考文獻(xiàn):
[1]中辦國(guó)辦印發(fā)《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》[J].電子政務(wù),2021.
[2]劉越男.數(shù)據(jù)治理:大數(shù)據(jù)時(shí)代檔案管理的新視角和新職能[J].檔案學(xué)研究 ,2020 (05):50-57.
[3]楊晶晶.設(shè)計(jì)企業(yè)檔案數(shù)據(jù)治理體系研究[J].北京檔案,2020(2):26-28.
[4]楊茜茜.概念、內(nèi)容與定位:我國(guó)檔案數(shù)據(jù)治理研究的理論坐標(biāo)[J].檔案學(xué)研究, 2021(06):28-34.
[5]常大偉,潘娜.檔案數(shù)據(jù)治理能力的結(jié)構(gòu)體系與建設(shè)路徑 [J].浙江檔案 ,2020(02): 27-29
[6]陳永生,王沐暉,蘇煥寧,楊茜茜.基于互聯(lián)網(wǎng)政務(wù)服務(wù)平臺(tái)的文件歸檔與管理:治理觀[J].檔案學(xué)研究,2019(6):4-11.
[7]金波,楊鵬.“數(shù)智”賦能檔案治理現(xiàn)代化:話(huà)語(yǔ)轉(zhuǎn)向、范式變革與路徑構(gòu)筑[J].檔案學(xué)研究,2022(02):4-11.
[8]金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)安全治理能力成熟度模型構(gòu)建[J].檔案學(xué)通訊, 2022(01):29-36.
[9]金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)安全保障探究[J].檔案學(xué)通訊,2022(03):30-38.
[10]周林興,韓永繼.檔案數(shù)據(jù)安全治理能力成熟度模型構(gòu)建研究[J].中國(guó)檔案,2020(12):79.
[11]金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(04):29-37.
[12]浙江省檔案館. 浙江省檔案館啟動(dòng)省檔案數(shù)據(jù)中心建設(shè)[EB/OL]. [2020-04-14]. http://www.zjda.gov.cn/art/2020/4/14/art_1229005493_42564205.html
[13] 福建省三明市檔案館辦公室. 三明市檔案館(檔案數(shù)據(jù)中心)建設(shè)項(xiàng)目奠基[EB/OL]. [2021-05-12]. http://www.chinaarchives.cn/home/category/detail/id/34430.html
[14] 益陽(yáng)市檔案館. 市檔案館館藏檔案數(shù)字化率達(dá)100% [EB/OL]. [2022-06-24]. http://www.yiyang.gov.cn/yiyang/2/3/73/content_1607266.html
[15]梁凱.“最多跑一次”事項(xiàng)電子業(yè)務(wù)數(shù)據(jù)歸檔系統(tǒng)建 設(shè)實(shí)踐——以杭州市檔案局為例[J].浙江檔案,2017 (8):31-32.
[16] 萊州市檔案館. 山東萊州市檔案館抓牢專(zhuān)題檔案數(shù)據(jù)庫(kù)建設(shè)[N].中國(guó)檔案報(bào),2022-04-25(2)
[17]何振,楊文,唐思慧,邢文明.大數(shù)據(jù)時(shí)代檔案學(xué)教育的新常態(tài)與實(shí)踐拓展[J].檔案學(xué)研究,2016(1):117-123.
[18]趙生輝,胡瑩.“檔案數(shù)據(jù)化”底層邏輯的解析與啟示[J].檔案學(xué)通訊,2021(4):20-27.
[19] 周?chē)?guó)剛.樹(shù)牢檔案數(shù)字化思維[N]. 中國(guó)檔案報(bào),2021-09-06(3)
[20]金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)安全治理策略探析[J].情報(bào)科學(xué),2020,38(9):30-35.
[21] 中國(guó)新聞網(wǎng).浙江松陽(yáng)破獲特大侵犯公民個(gè)人信息案7億條信息遭泄露[EB/OL].[2017-4-12]. https://www.chinanews.com.cn/sh/2017/04-12/8197266.shtml
[22]金波,晏秦.從檔案管理走向檔案治理[J].檔案學(xué)研究,2019(1):46-55.
[23]錢(qián)毅.從“數(shù)字化”到“數(shù)據(jù)化”——新技術(shù)環(huán)境下文件管理若干問(wèn)題再認(rèn)識(shí)[J]檔案學(xué)通訊,2018(5):42-45.
[24] 成都市檔案館.成都市檔案館深入推進(jìn)檔案智慧化發(fā)展加快融入智慧城市建設(shè)[EB/OL].[2022-07-12].http://www.chinaarchives.cn/home/category/detail/id/39516.html
[25]楊建梁,劉越男.機(jī)器學(xué)習(xí)在檔案管理中的應(yīng)用:進(jìn)展與挑戰(zhàn)[J]. 檔案學(xué)通訊,2019(06):48-56.
[26]省檔案館與阿里云計(jì)算有限公司簽訂智慧檔案研究合作框架協(xié)議[J].浙江檔案,2020(09):9.
[27]肖冬梅,孫蕾.云環(huán)境中科學(xué)數(shù)據(jù)的安全風(fēng)險(xiǎn)及其治理對(duì)策[J]. 圖書(shū)館論壇,2021,41(02):89-98.
作者單位:湘潭大學(xué)公共管理學(xué)院