周文泓
摘要:立足開放數(shù)據(jù)背景探索文檔管理發(fā)展旨在明確檔案領(lǐng)域數(shù)字轉(zhuǎn)型方向與策略。本文以理論構(gòu)建法基于開放數(shù)據(jù)內(nèi)涵,明確對文檔管理的主要影響點,并通過梳理相應(yīng)的文檔管理研究與實踐明晰尚需完善之處。由此,本文提出開放數(shù)據(jù)背景下的文檔管理應(yīng)當拓展對數(shù)據(jù)的管理、建設(shè)參與協(xié)作并行的主體機制、基于開放數(shù)據(jù)本質(zhì)優(yōu)化文檔管理模式、為適應(yīng)開放數(shù)據(jù)的文檔管理提供保障措施。
關(guān)鍵詞:開放數(shù)據(jù)文件管理檔案管理檔案利用
Abstract: Study on archives management in the background of open data aims to identify direc? tions and strategies of digital transformation of ar? chives field. The paper took the method of theory building to understand effects open data have on records management. With analysis of research and practice progress of records management for open data, some disadvantages were discovered. Thus, the paper proposed that records manage? ment adapting to open data should expand manage? ment of data, establish more participation and col? laboration mechanism, optimize records manage? ment based on essence of open data, and take measures to support records management adapt? ing to open data.
Keywords: open data; archives managements; records management; archives access
引言
當前,開放數(shù)據(jù)已成為我國政府基于政務(wù)信息資源提升國家治理能力的關(guān)鍵行動,無論是信息資源的維護還是相應(yīng)管理工作的開展無一不與文件、檔案部門的工作密切關(guān)聯(lián)。這在檔案領(lǐng)域有了一定程度的實踐,例如英國國家檔案館在公共部門信息開放中強調(diào)要將數(shù)據(jù)納入,也有專門的數(shù)據(jù)庫檔案專題;美國國家檔案與文件署也將開放數(shù)據(jù)作為其開放政府計劃中的重點任務(wù)。
研究領(lǐng)域亦有一定成果。一方面,圍繞政府信息公開和大數(shù)據(jù)的相關(guān)研究為將文檔管理與開放數(shù)據(jù)關(guān)聯(lián)奠定了基礎(chǔ),例如倡導(dǎo)在大數(shù)據(jù)背景下文檔管理應(yīng)有的新型管理思維[1],信息公開方面的研究也為在開放政府框架下優(yōu)化檔案機構(gòu)工作提供建議[2]。另一方面,也有部分研究直指開放數(shù)據(jù)背景下的文檔管理。這類研究主要從兩大層面提出檔案領(lǐng)域應(yīng)當充分參與開放數(shù)據(jù)的項目與行動:一是指出數(shù)據(jù)應(yīng)當納入文檔管理的范疇。[3]二是提出文檔管理的理論與方法可為開放數(shù)據(jù)提供有效指導(dǎo),這既包括在開放數(shù)據(jù)過程中幫助構(gòu)建真實可靠、高價值的數(shù)據(jù)資源體系[4],也涉及檔案部門積極將檔案進行數(shù)據(jù)挖掘以參與開放數(shù)據(jù)行動[5]。這一部分的研究未成系統(tǒng),但也顯示了開放數(shù)據(jù)背景下探索文檔管理的必要性與空間,有待進一步明確開放數(shù)據(jù)是什么、與文檔管理的相互關(guān)系、如何在開放數(shù)據(jù)的框架下開展文檔工作等。
因而,本文將基于開放數(shù)據(jù)的內(nèi)涵梳理開放數(shù)據(jù)與文檔管理的相互關(guān)系,應(yīng)用文獻調(diào)研與案例研究呈現(xiàn)開放數(shù)據(jù)框架下的文檔管理行動進展,最后立足當前開放數(shù)據(jù)提出的挑戰(zhàn)來探討文檔管理發(fā)展方向。
一、開放數(shù)據(jù)對文檔管理的影響
(一)開放數(shù)據(jù)內(nèi)容概覽
開放數(shù)據(jù)是開放政府的組成,它不僅是開放政府的行動構(gòu)件,也秉承了開放政府透明、參與、協(xié)作的理念。[6]隨著理論研究與實踐的深入,開放數(shù)據(jù)頗具規(guī)模,從概念層到行動層都形成相對統(tǒng)一的認識與實踐,主要體現(xiàn)為:
1.以數(shù)據(jù)為核心,即開放數(shù)據(jù)要共享和利用的是一手的原始記錄,這就將其同信息公開區(qū)分開來。從數(shù)據(jù)屬性來看,其內(nèi)容、形式、背景都與信息有一定區(qū)別,也在是否加工與解讀上與信息形成差異。
2.開放擁有雙層含義,既是屬性也是行動。一方面是指數(shù)據(jù)要具有開放的特征,從內(nèi)容到形式保證數(shù)據(jù)能夠在合法合規(guī)框架內(nèi)得到最大的共享與利用。例如,依據(jù)開放政府工作組的提議,開放數(shù)據(jù)應(yīng)當具備八項特征才能稱之為開放:完整、一手、及時、可獲取、可機讀、非歧視性、非私有、免于授權(quán)。另一方面則指開放行動,開放不僅要共享數(shù)據(jù),而且要實現(xiàn)數(shù)據(jù)的開發(fā)與利用。[7]
3.開放數(shù)據(jù)已形成相對一致的行動框架:第一,制度建設(shè),包括國家戰(zhàn)略、行動計劃、管理規(guī)范等從頂層設(shè)計到具體規(guī)范對開放數(shù)據(jù)予以規(guī)劃、協(xié)調(diào)和指導(dǎo)。第二,組織架構(gòu)優(yōu)化,例如設(shè)置數(shù)據(jù)管理機構(gòu)以統(tǒng)籌與落實開放數(shù)據(jù)行動。第三,數(shù)據(jù)平臺建設(shè),以作為共享與開發(fā)數(shù)據(jù)資源的入口以及互動交流平臺。
(二)開放數(shù)據(jù)對文檔管理的影響要點
開放數(shù)據(jù)由此影響著文檔管理的發(fā)展變化,這些影響點也成為文檔管理在開放數(shù)據(jù)背景下的探索方向。
一方面,隨著數(shù)據(jù)成為業(yè)務(wù)活動形成與利用的重要形式的記錄,那么在全程管理框架下,同樣處于信息管理領(lǐng)域,開放數(shù)據(jù)既可能拓展文檔管理范疇并促進其優(yōu)化發(fā)展,也可能給予弱化文檔管理的話語權(quán)。由此,需要考慮:(1)隨著數(shù)據(jù)成為業(yè)務(wù)活動中重要形式的記錄,文檔管理是否需要將數(shù)據(jù)作為更重要的那部分記錄進行管理,如何升級對檔案的認知與界定,這些數(shù)據(jù)的形成、采集、整合、鑒定、開發(fā)、利用如何同現(xiàn)有的文檔管理的流程如捕獲、歸檔、鑒定等相融合,文檔管理如何促進數(shù)據(jù)資源的建設(shè)以及開放,文檔管理方法是否也會受到數(shù)據(jù)管理的影響發(fā)生變化以及如何變化;(2)隨著開放數(shù)據(jù)的深入,各地紛紛成立數(shù)據(jù)或數(shù)據(jù)管理部門,機構(gòu)內(nèi)也在建立數(shù)據(jù)中心。在這種背景下,檔案機構(gòu)與數(shù)據(jù)機構(gòu)能否建立更好的協(xié)作以及競爭關(guān)系,檔案機構(gòu)是否會獲得數(shù)據(jù)歸檔管理的權(quán)力,如若可以,那么和數(shù)據(jù)機構(gòu)如何協(xié)同,如若不能,檔案機構(gòu)是否面臨危機以及如何解決?例如,2016年2月 18日浙江省的《浙江省促進大數(shù)據(jù)發(fā)展實施計劃》,其示范工程之一由檔案局牽頭,提出加強大數(shù)據(jù)歸檔管理,制定大數(shù)據(jù)歸檔范圍、標準,建立統(tǒng)一歸檔平臺,促進大數(shù)據(jù)證據(jù)保全、長期保存和再利用,這需要檔案部門探索如何升級優(yōu)化相應(yīng)的歸檔框架、機制與方法。
另一方面,檔案機構(gòu)也是需要開放數(shù)據(jù)的主體,如何開放數(shù)據(jù)也是促進其業(yè)務(wù)工作的重要方面。那么,在開放數(shù)據(jù)背景下:(1)檔案機構(gòu)如何以數(shù)據(jù)形式提供檔案利用,是僅針對檔案資源中本身就以數(shù)據(jù)形式存在的那部分記錄還是要將檔案進行數(shù)據(jù)化處理以提供更加豐富的數(shù)據(jù)資源;(2)檔案工作中會形成哪些數(shù)據(jù),檔案機構(gòu)的開放數(shù)據(jù)包括這些數(shù)據(jù)的共享嗎,開放數(shù)據(jù)平臺與檔案信息資源平臺是什么關(guān)系;(3)隨著要求以數(shù)據(jù)形式來開放信息資源,那么是否在檔案資源的建設(shè)中會要求在接收之前就盡量以數(shù)據(jù)形式形成?前文所提的浙江省檔案局也提出加強數(shù)字檔案館(室)建設(shè),推進檔案數(shù)據(jù)聚合,構(gòu)建查閱利用檔案數(shù)據(jù)服務(wù)平臺,完善檔案數(shù)據(jù)共享開放標準。
二、開放數(shù)據(jù)驅(qū)動下的檔案研究與實踐
上述的那些問題在檔案領(lǐng)域已有一定程度的探索,這在理論與實踐層面均有成果。
(一)理論研究進展
理論層面已有研究提出,開放數(shù)據(jù)優(yōu)化有賴于數(shù)據(jù)資源的質(zhì)量,亦要檔案機構(gòu)作為開放主體參與開放數(shù)據(jù)行動。在開放數(shù)據(jù)資源的構(gòu)建上,文檔管理理論與方法可以幫助從管理原則、流程、架構(gòu)、規(guī)范等方面提升數(shù)據(jù)質(zhì)量,這需要文檔管理充分參與到開放數(shù)據(jù)的全生命周期。國外學者認為盡管開放數(shù)據(jù)的政策中更多地使用信息和數(shù)據(jù)這樣的提法,但這些信息與數(shù)據(jù)理當納入文檔管理的框架。[8]數(shù)據(jù)應(yīng)用層面,可通過文檔控制的方法提供高質(zhì)量和可信任的數(shù)據(jù),例如基于ISO15489標準等以文檔管理的要求提供數(shù)據(jù)的位置、背景和歷史等信息來提升數(shù)據(jù)質(zhì)量。[9]再如,開放數(shù)據(jù)將促進數(shù)據(jù)資源的增長,這些資源的保存與處置提出諸多管理挑戰(zhàn)如保管期限的設(shè)定,文檔的有機聯(lián)系以及可靠性、準確性、真實性要求都可為數(shù)據(jù)保管期限表的制定提供借鑒:不會保存所有數(shù)據(jù);期限的設(shè)定要依賴對業(yè)務(wù)流程的分析,可推薦使用《ISO/TR 26,122:信息與記錄——文檔的工作流程分析》[10]。
同時,檔案機構(gòu)成為開放數(shù)據(jù)的主體也得到倡導(dǎo),這開放政府框架下開展檔案工作的延伸[11]。研究提出,由檔案館、圖書館等公共事業(yè)單位搜集、整理和保管的信息也是重要的一部分,這些單位要積極開放數(shù)據(jù)[12]。一方面,基于開放數(shù)據(jù)、大數(shù)據(jù)、數(shù)字人文提出檔案信息資源的開發(fā)與利用的策略,數(shù)據(jù)形式的資源構(gòu)建與管理方法得到提倡。另一方面,聚焦當前檔案機構(gòu)的開放數(shù)據(jù)實踐,從制度建立、平臺建設(shè)、數(shù)據(jù)資源構(gòu)建等方面解析美國、英國、新西蘭等國的開放數(shù)據(jù)案例,從而相應(yīng)優(yōu)化策略[13]。
總的來說,目前的理論探索有一定成果,但如何基于開放數(shù)據(jù)要求做好數(shù)據(jù)的檔案化管理有待頂層設(shè)計、組織架構(gòu)、系統(tǒng)開發(fā)、流程再造等更多方面的明確與設(shè)計。升級優(yōu)化檔案開放利用工作的研究也尚需形成相對全面系統(tǒng)的實施方案。
(二)實踐探索的成效
實踐層面,多個國家的檔案機構(gòu)都在探索開放數(shù)據(jù)的最佳實踐。以NARA為例,其聯(lián)邦公報辦公室致力于形成和公開高品質(zhì)的元數(shù)據(jù),為了最終用戶能賦予其新的用途。在和政府出版局的合作中,發(fā)行了聯(lián)邦法規(guī)的電子代碼的XML版本。在和總務(wù)管理局的合作中,聯(lián)邦注冊登記局將得到機構(gòu)組織目錄,因此他們可以創(chuàng)建和發(fā)布與美國聯(lián)邦政府一致的機讀原格式數(shù)據(jù)。
在我國,北京、浙江、貴州、深圳、青島、武漢、濟南、哈爾濱、佛山、東莞都在各地的開放數(shù)據(jù)平臺上線了相關(guān)數(shù)據(jù),或是關(guān)于檔案機構(gòu)本身的數(shù)據(jù)如館藏地址、三公經(jīng)費一類的數(shù)據(jù)集,或是以數(shù)據(jù)形式共享一些檔案資源如館藏目錄,涵蓋公共服務(wù)、機構(gòu)團體、教育科技、社保就業(yè)、企業(yè)登記監(jiān)管、社會發(fā)展、資質(zhì)認定等主題。
然而,當前各檔案機構(gòu)的開放數(shù)據(jù)并不成熟。一方面,開放數(shù)據(jù)行動并不全面:(1)制度建設(shè)不完善,未形成立足文檔管理的開放數(shù)據(jù)的頂層設(shè)計、行動規(guī)劃、具體方案、規(guī)范指南等。(2)檔案館藏中數(shù)據(jù)形式的記錄沒有全面的共享,這很大程度上受限于數(shù)字化工作,11個地方只開放了75個數(shù)據(jù)集。例如,北京市檔案局在目前北京市整體的開放數(shù)據(jù)中只提供了關(guān)于北京市國家綜合檔案館的數(shù)據(jù)集,這并沒有做到以開放數(shù)據(jù)的形式共享檔案信息資源。(3)開放數(shù)據(jù)沒有在檔案平臺建設(shè)中凸顯,未提供方便的入口獲取開放數(shù)據(jù)。另一方面,開放數(shù)據(jù)的成效有限,體現(xiàn)為沒有得到用戶足夠的關(guān)注和利用。例如,11個地方的75個數(shù)據(jù)集截止2018年4月15日只有2052次的下載量。
三、開放數(shù)據(jù)背景下文檔管理的適應(yīng)性策略
目前,文檔管理與開放數(shù)據(jù)的結(jié)合較為有限,從上述的分析與總結(jié)來看,還需在如下方面深入探索以更好適應(yīng)開放數(shù)據(jù)這一大趨勢:
第一,拓展對數(shù)據(jù)的管理。開放數(shù)據(jù)呈現(xiàn)的是數(shù)據(jù)在社會發(fā)展過程中發(fā)揮著越來越大的作用,在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)推動下持續(xù)增長的數(shù)據(jù)正從數(shù)量和價值上成為越來越重要的記錄,數(shù)據(jù)亟待可信管理。這意味著文檔管理需要將數(shù)據(jù)作為重要對象,一方面,拓展對數(shù)據(jù)的檔案化管理范圍,從業(yè)務(wù)價值以及未來的研究價值等多方面考察當前數(shù)據(jù)資源從背景、形式與內(nèi)容,擴大對數(shù)據(jù)的歸檔管理范圍。另一方面,在全程管理框架下及時參與數(shù)據(jù)管理,將文檔管理的要求嵌入于數(shù)據(jù)的形成、采集、處理、整合等全流程中。
第二,建設(shè)參與協(xié)作并行的主體機制。隨著數(shù)據(jù)科學逐漸成為一門學科,實踐中數(shù)據(jù)機構(gòu)與部門紛紛設(shè)立,文檔管理如何同數(shù)據(jù)管理形成良好的協(xié)作與競爭關(guān)系需要多方面的探索,開放數(shù)據(jù)是重要方向。文檔管理在開放數(shù)據(jù)中應(yīng)當明晰同數(shù)據(jù)管理的界限,明確理論與方法上的交集以及差異,從而在實踐中明晰二者在組織架構(gòu)中的權(quán)責與相互關(guān)系。例如,數(shù)據(jù)部門可主要支持現(xiàn)行數(shù)據(jù)的采集和挖掘,檔案部門可提供價值判定標準、方法以及保管方面的支持以積極參與開放數(shù)據(jù)資源的建設(shè)工作,甚至可在數(shù)據(jù)質(zhì)量的管控上起一定的主要作用。此外,在信息資源平臺建設(shè)上,開放數(shù)據(jù)平臺與檔案信息資源平臺可相互補充。
第三,基于開放數(shù)據(jù)本質(zhì)優(yōu)化文檔管理模式。開放數(shù)據(jù)是共享與利用的統(tǒng)一,它以多元特征的數(shù)據(jù)資源為基礎(chǔ)。對文檔管理而言,不僅是通過參與數(shù)據(jù)治理來促進開放數(shù)據(jù)工作,亦可通過開放數(shù)據(jù)在管理、技術(shù)、文化等方面的要求來實現(xiàn)文檔管理的優(yōu)化升級。例如,以完整、一手、及時、可獲取、可機讀、非歧視性、非私有、免于授權(quán)為要求的開放數(shù)據(jù)將促進文檔管理在保障數(shù)據(jù)真實性、完整性、安全性、有用性上進行更多研究,以利用為目的的開放數(shù)據(jù)是促進文檔管理如何在更加開放的框架下進行流程再造,及時參與數(shù)據(jù)的檔案化管理更是為檔案資源建設(shè)提供了數(shù)據(jù)化的基礎(chǔ)以促進資源的豐富化和深度的價值挖掘。
第四,為適應(yīng)于開放數(shù)據(jù)的文檔管理提供保障措施。從我國國家層面的戰(zhàn)略來看,開放數(shù)據(jù)已在局館長會議等報告中得到倡導(dǎo),成為國家檔案局科技項目2018選題之一。從制度層面來看,在這樣的趨勢下,除戰(zhàn)略引導(dǎo),還需從政策到規(guī)范指南的保駕護航,從而可幫助檔案工作人員明確文檔管理在開放數(shù)據(jù)背景下文檔管理工作需要調(diào)整之處,更能明晰如何在實際工作中如何參與開放數(shù)據(jù)工作。例如,數(shù)據(jù)歸檔指南的制定或是檔案機構(gòu)開放數(shù)據(jù)目錄清單的確認都是需要落實于制度中。同時,技術(shù)層面的保障亦是必要,這需要從平臺建設(shè)、系統(tǒng)開發(fā)、輔助工具設(shè)計上基于已有的文檔管理系統(tǒng)針對開放數(shù)據(jù)的要求進行一定調(diào)整與優(yōu)化。
1本文在全程管理理念之下將文件、檔案進行整體論述,為方便表述,統(tǒng)稱文檔.
參考文獻:
[1]宋淑琴.大數(shù)據(jù)視野下檔案管理思維方式的轉(zhuǎn)變[J].檔案學研究,2015(3):36-39.
[2]張斌,黃建軍.政府信息公開背景下公共檔案館建設(shè)芻議[J].檔案學研究2010(6):36-39.
[3] Erik Borglund;Tove Engvall,“Open data?: Data, information, document or record?”,Records Management Journal,24(2),2014,163 -180.
[4] Lluís Esteve Casellas Serra, "The mapping, selecting and opening of data: The records management contri- bution to the Open Data project in Girona City Council", Records Management Journal, Vol. 24(2),2014,87-98.
[5] [13]李孟秋.開放數(shù)據(jù)環(huán)境下英國、美國、新西蘭數(shù)字檔案資源再利用的特點及其啟示[J]. 2017(8): 36-38.
[6]駱毅,王國華.“開放政府”理論與實踐對中國的啟示——基于社會協(xié)同治理機制創(chuàng)新的研究視角[J].江漢學術(shù),2016(2):113-122.
[7] [8]艾伯特J.梅杰(李倩譯).開放政府:連接“知情”與“建言”[J].國際行政科學評論,2012(3)10-27.
[9]Victoria Louise;Lemieux Brianna;Gormly Lyse Rowledge,“Meeting Big Data challenges with visual analytics”,Records Management Journal,24(2),2014,122–141.
[10] John McDonald;Valerie Léveillé,“Whither the retention schedule in the era of big data and open data?”,Records Management Journal,24(2),2014,99–121.
[11]喻玲.開放政府背景下的檔案開放[J].檔案與建設(shè),2016(5):12-16.
[12]鄭磊.開放政府數(shù)據(jù)研究:概念辨析、關(guān)鍵因素及其互動關(guān)系[J].中國行政管理,2015(11):13-18.
作者單位:四川大學公共管理學院