馮惠玲
(中國人民大學(xué)信息資源管理學(xué)院,北京,100872)
寧波是一座江海交融的大港之城,收藏古今,港通天下,它既承載著厚重如檔案的歷史底蘊(yùn),也散發(fā)著璀璨如數(shù)據(jù)的時(shí)代光輝。今天各路先鋒闖將幾百人共聚于此,共同探討面向數(shù)字中國戰(zhàn)略的檔案數(shù)據(jù)產(chǎn)教融合的全新議題,這次會(huì)議在檔案學(xué)術(shù)、檔案事業(yè)以及數(shù)據(jù)管理方面,一定會(huì)留下具有時(shí)代價(jià)值的光彩一筆。我今天講三個(gè)關(guān)鍵詞,一是背景——數(shù)字中國,二是檔案數(shù)據(jù),三是產(chǎn)教融合。對“產(chǎn)教融合”我稍作解釋:檔案數(shù)據(jù)的管理需要檔案領(lǐng)域政、產(chǎn)、管、學(xué)、研各個(gè)方面的協(xié)力參與,這個(gè)報(bào)告的“產(chǎn)”是從廣義的社會(huì)生產(chǎn)概念出發(fā),把從事檔案業(yè)務(wù)及行政管理,檔案數(shù)據(jù)相關(guān)企業(yè)等統(tǒng)稱為“產(chǎn)業(yè)方”,把教學(xué)和研究機(jī)構(gòu)統(tǒng)稱為“教育方”,這樣的產(chǎn)教融合就是一個(gè)涵蓋各方的大協(xié)作圈。
從2000 年習(xí)近平同志在福建工作時(shí)提出數(shù)字福建戰(zhàn)略,到2023 年2 月中共中央國務(wù)院發(fā)出《數(shù)字中國建設(shè)整體布局規(guī)劃》,展示了我國全面推進(jìn)數(shù)字化轉(zhuǎn)型的戰(zhàn)略安排。這個(gè)規(guī)劃指出,數(shù)字中國是數(shù)字時(shí)代推進(jìn)中國式現(xiàn)代化的重要引擎,是構(gòu)筑國家競爭新優(yōu)勢的有力支撐。習(xí)近平總書記在黨的二十大報(bào)告中論述有關(guān)實(shí)施科教興國戰(zhàn)略、強(qiáng)化現(xiàn)代化人才支撐時(shí),提出了推進(jìn)產(chǎn)教融合的重要思想,為我國教育改革和發(fā)展提出了新的戰(zhàn)略指向。
數(shù)字化正在成為中國經(jīng)濟(jì)社會(huì)發(fā)展的強(qiáng)勁動(dòng)力,我國在全球數(shù)字競爭格局中的地位也逐漸提升。這里和大家分享兩組數(shù)據(jù),一個(gè)是根據(jù)國家網(wǎng)信辦等機(jī)構(gòu)發(fā)布的《數(shù)字中國發(fā)展報(bào)告(2022 年)》,我國2022年的數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到了50.2 萬億,總量位于全球第二,同比名義增長10.3%,在國內(nèi)生產(chǎn)總值中的占比提升至41.5%,這個(gè)數(shù)據(jù)體現(xiàn)了我國整個(gè)數(shù)字經(jīng)濟(jì)的發(fā)展勢頭。第二個(gè)是國際數(shù)據(jù)公司(IDC)的預(yù)測顯示,到2025 年,中國的數(shù)據(jù)產(chǎn)量將達(dá)到40.6ZB,占據(jù)全球數(shù)據(jù)量的27.8%,屆時(shí)中國將成為全球最大的數(shù)據(jù)中心,這個(gè)預(yù)測描繪了我國在全球數(shù)據(jù)產(chǎn)量和數(shù)據(jù)處理能力方面的領(lǐng)先地位。
數(shù)字中國建設(shè)按照“2522”的整體框架進(jìn)行布局,即夯實(shí)數(shù)字基礎(chǔ)設(shè)施和數(shù)據(jù)資源體系“兩大基礎(chǔ)”,推進(jìn)數(shù)字技術(shù)與經(jīng)濟(jì)、政治、文化、社會(huì)、生態(tài)文明建設(shè)“五位一體”深度融合,強(qiáng)化數(shù)字技術(shù)創(chuàng)新體系和數(shù)字安全屏障“兩大能力”,優(yōu)化數(shù)字化發(fā)展國內(nèi)國際“兩個(gè)環(huán)境”。
檔案數(shù)據(jù)在數(shù)字中國戰(zhàn)略“2522”整體框架中占據(jù)非常重要的地位,它是數(shù)據(jù)資源體系和數(shù)字基礎(chǔ)設(shè)施的核心組成部分。在數(shù)字中國的戰(zhàn)略大背景下,怎樣挖掘檔案數(shù)據(jù)和檔案思想的潛在價(jià)值,可以稱之為一項(xiàng)時(shí)代之問,具有重大時(shí)代意義。面對這個(gè)問題,一方面,我們需要更深刻理解檔案數(shù)據(jù)的價(jià)值,發(fā)掘它在經(jīng)濟(jì)社會(huì)發(fā)展當(dāng)中的無限潛能;另一方面,在數(shù)字中國建設(shè)的各個(gè)領(lǐng)域提高數(shù)字業(yè)務(wù)的科學(xué)化、規(guī)范化水平的過程中,檔案思想、理念、制度和方法,將成為重要的具有廣泛價(jià)值的基礎(chǔ)性要素。這個(gè)問題由于時(shí)間關(guān)系今天無法展開,簡單地說,就是數(shù)字中國的每個(gè)方面都需要檔案方法、檔案思想的加入與支持,非常值得我們重視并展開探討。
在數(shù)字中國戰(zhàn)略實(shí)施當(dāng)中,檔案必須突破活動(dòng)后端記錄的定位,在檔案數(shù)據(jù)管理的范圍大幅擴(kuò)展的同時(shí),檔案觀念、檔案思想、檔案意識(shí)將滲透到所有的業(yè)務(wù)領(lǐng)域,“滲透”這個(gè)詞將成為重要的實(shí)踐,檔案意識(shí)將成為與安全意識(shí)同等重要的普適性要素,檔案素養(yǎng)也將成為數(shù)據(jù)人才必備的核心素質(zhì)素養(yǎng)之一。當(dāng)然另一方面數(shù)據(jù)素養(yǎng)也將成為檔案工作者的必備條件。
趨勢就是檔案數(shù)據(jù)不斷升溫,特點(diǎn)主要從檔案數(shù)據(jù)的“雙重特性”和“雙向融合”兩個(gè)方面展開。
檔案數(shù)據(jù)的升溫可以從檔案數(shù)據(jù)的生成、管理和研究三個(gè)方面來顯示。在現(xiàn)實(shí)生活中,越來越多的社會(huì)活動(dòng)記錄以數(shù)據(jù)形式生成,越來越多的檔案機(jī)構(gòu)開始接收和探索數(shù)據(jù)形態(tài)的管理,如Druva和DataArchiva就是兩個(gè)具有相當(dāng)規(guī)模的國際檔案數(shù)據(jù)存檔保管企業(yè)。近三年國家社科基金立項(xiàng)中以檔案數(shù)據(jù)管理為主題的項(xiàng)目有23 項(xiàng),占全部檔案項(xiàng)目的40%左右,一個(gè)主題占到全部項(xiàng)目的如此之高的比例是很少見的。
在剛剛結(jié)束的ICA阿布扎比國際檔案大會(huì)上,法國前總統(tǒng)奧朗德在講演中用相當(dāng)篇幅強(qiáng)調(diào)保存氣候變化檔案數(shù)據(jù)的重要性。他說法國從19 世紀(jì)末就開始保存這一類的檔案數(shù)據(jù),我想或許類似的檔案數(shù)據(jù)管理還可以追溯到更久以前和更多事例。
檔案數(shù)據(jù)是一個(gè)很復(fù)雜的概念,包括各種環(huán)境中生成的各種模態(tài)的具有檔案屬性的數(shù)據(jù),檔案數(shù)據(jù)的兩重性是指它既有檔案的屬性,又有數(shù)據(jù)的屬性。這樣的雙重屬性使得檔案數(shù)據(jù)既繼承了檔案的記錄和保存功能,又賦予它強(qiáng)大的數(shù)據(jù)分析和處理能力,共同鑄就了檔案數(shù)據(jù)的特質(zhì)和潛能。檔案數(shù)據(jù)固有的雙重性,要求我們在學(xué)術(shù)上、實(shí)踐上打破原來的壁壘,在兩個(gè)門類之間尋求和建立更深層次的融合和創(chuàng)新。
在大數(shù)據(jù)時(shí)代,我們看到檔案越來越多地被賦予數(shù)據(jù)屬性,或者說按照數(shù)據(jù)形式來管理,而數(shù)據(jù)則越來越蘊(yùn)藏檔案屬性,或者說按照檔案來管理。也就是說檔案逐漸走向數(shù)據(jù)化,數(shù)據(jù)也逐漸走向檔案化,這是檔案界和數(shù)據(jù)界都必須正視的新趨勢。
檔案數(shù)據(jù)化是在這幾年一直探討的傳統(tǒng)檔案管理顆粒度的細(xì)化,我們稱為檔案數(shù)據(jù)化管理。同時(shí)也包括文件檔案直接以數(shù)據(jù)模態(tài)形成,有學(xué)者說文件裂變?yōu)榱藬?shù)據(jù)。檔案模態(tài)在歷史上經(jīng)歷了三個(gè)發(fā)展階段:紙質(zhì)或者實(shí)體的檔案,電子文件文本,和當(dāng)前的數(shù)據(jù)態(tài)檔案。如果以重大的事件為例的話,二戰(zhàn)時(shí)期的檔案主要以紙質(zhì)檔案為主,911 事件大部分是電子文件文本,而大量新冠疫情的檔案記錄則是數(shù)據(jù)態(tài)檔案,這兩種情況都可以叫作檔案數(shù)據(jù)化。
再看數(shù)據(jù)檔案化。數(shù)據(jù)管理呈現(xiàn)出了檔案化變革,對于很多大數(shù)據(jù)的價(jià)值認(rèn)知和管理方式都逐漸呈現(xiàn)出了一種“檔案主義”的趨勢,除了很多機(jī)構(gòu)開始對業(yè)務(wù)數(shù)據(jù)加以歸檔管理外,一些數(shù)據(jù)項(xiàng)目,例如著名的預(yù)印本平臺(tái)arXiv、全球互聯(lián)網(wǎng)檔案平臺(tái)Internet Archive,數(shù)字人文中的數(shù)據(jù)集(稱為Archives),以及開源軟件開發(fā)社區(qū)平臺(tái)Git和GitHub,都在借鑒檔案管理的理念和方法。
因此我們得以揭示一個(gè)非常有趣,也非常有意義的趨勢性發(fā)現(xiàn),即檔案的數(shù)據(jù)化和數(shù)據(jù)的檔案化正在“雙向奔赴”,共同開啟更加廣闊的檔案數(shù)據(jù)新紀(jì)元。
一個(gè)重要的變化是檔案管理活動(dòng)逐漸向以機(jī)器為中心轉(zhuǎn)移。模擬態(tài)的檔案是人工管理的,后來有了計(jì)算機(jī)輔助管理。進(jìn)入檔案數(shù)據(jù)階段之后,數(shù)據(jù)基本上要靠機(jī)器來識(shí)別、管理和提取,人對于數(shù)據(jù)的直接掌控力很低,必須借助于機(jī)器的管理能力。人工管理主要依靠檔案工作者的經(jīng)驗(yàn)和技能,有作坊特征,而檔案數(shù)據(jù)管理則主要依賴于機(jī)器的算法和模型,依賴管理系統(tǒng)的功能,顯示出很強(qiáng)的工程化管理特點(diǎn)。在這樣的發(fā)展過程當(dāng)中,我們也要始終把握人的主體性,在機(jī)器管理中加入必要的人工介入節(jié)點(diǎn),避免檔案專業(yè)人員的體外化和工具化。
面向機(jī)器的檔案數(shù)據(jù)管理需要具有三大挑戰(zhàn),即實(shí)施主動(dòng)元數(shù)據(jù)管理,對底層技術(shù)與原理的關(guān)注,管理模式和理論的創(chuàng)新。其中第一條,引入“主動(dòng)元數(shù)據(jù)管理”的方法與技術(shù)將更加智能和面向業(yè)務(wù)行動(dòng)。以對檔案保管期限開展主動(dòng)元數(shù)據(jù)管理為例,可以實(shí)現(xiàn)自動(dòng)響應(yīng)環(huán)境變化的動(dòng)態(tài)調(diào)整,如根據(jù)新的法律法規(guī)自動(dòng)調(diào)整相關(guān)檔案的保管期限,自動(dòng)發(fā)送操作提醒或建議,具有上下文敏感,理解和適應(yīng)不同的上下文,為不同的應(yīng)用和場景提供合適的信息和支持等。鑒于時(shí)間關(guān)系其他兩條就不再展開講述。
必須重視面向機(jī)器的檔案管理特性,從這里出發(fā),對更多類型業(yè)務(wù)數(shù)據(jù)實(shí)施檔案化管理,從而擴(kuò)展傳統(tǒng)檔案概念和實(shí)務(wù)邊界,必將導(dǎo)致檔案涵蓋的“泛化”趨向,并根據(jù)價(jià)值區(qū)分形成不同層級(jí)數(shù)據(jù)檔案化管理體系。只要接受數(shù)據(jù)檔案化管理,就必須接受檔案概念的擴(kuò)展,或曰“有限泛化”。
當(dāng)前我們面臨的主要挑戰(zhàn)是怎樣彌合學(xué)術(shù)界和檔案數(shù)據(jù)產(chǎn)業(yè)界之間的差距或鴻溝。我這里借用“數(shù)據(jù)編織”概念,它用了一橫一縱的兩個(gè)維度。我把學(xué)術(shù)界比作“經(jīng)度”,它致力于頂天的理論研究,包括基礎(chǔ)理論和前瞻性研究,但是學(xué)術(shù)界在實(shí)踐舞臺(tái)上常常會(huì)有一些短板和困惑。我把產(chǎn)業(yè)界比作“緯度”,側(cè)重于立地的實(shí)際探索,與社會(huì)需求最接近,逐漸擴(kuò)展檔案數(shù)據(jù)的管轄范圍以及對數(shù)字中國的支撐點(diǎn)位,急需較為系統(tǒng)的理論指導(dǎo)和前瞻思維。為此我們需要連接基礎(chǔ)與應(yīng)用,頂天與立地,探索理論經(jīng)度與實(shí)踐緯度的有機(jī)交融,協(xié)力推進(jìn)檔案數(shù)據(jù)管理進(jìn)展和檔案思想在數(shù)據(jù)管理活動(dòng)中的廣泛應(yīng)用,并促使檔案學(xué)界和數(shù)據(jù)產(chǎn)業(yè)界實(shí)現(xiàn)協(xié)同進(jìn)步。
從國內(nèi)產(chǎn)教融合的經(jīng)驗(yàn)看,主要有三種類型或功能:一是教書育人型,核心是提高人才培養(yǎng)質(zhì)量。以教育部的產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目為例,從2014 年實(shí)施以來,已經(jīng)有1700 多家企業(yè)參與立項(xiàng),立項(xiàng)數(shù)量達(dá)9.9萬項(xiàng),企業(yè)累計(jì)投入經(jīng)費(fèi)35.6 億元。2023 年9 月,教育部公布了第一批擬入圍國家級(jí)產(chǎn)教聯(lián)合體的28 家名單。二是科技攻關(guān)型,主要聚焦于基礎(chǔ)理論創(chuàng)新和解決重大技術(shù)問題,比如華為的“難題揭榜”和騰訊犀牛鳥基金等都是這一類型的代表。三是社會(huì)服務(wù)型,以滿足國家重大戰(zhàn)略需求和社會(huì)需要為目標(biāo)。教育部共建“一帶一路”教育行動(dòng)和“千校萬企”協(xié)同創(chuàng)新伙伴行動(dòng),以及很多高校承擔(dān)的檔案橫向項(xiàng)目都是這種類型。這三種類型各有特色,分別從三個(gè)維度推進(jìn)了產(chǎn)教融合,推動(dòng)了學(xué)術(shù)界和產(chǎn)業(yè)界的緊密合作和共同發(fā)展。近三年國家檔案局的科技項(xiàng)目立項(xiàng)數(shù)據(jù)顯示,校館合作、校企合作項(xiàng)目從2021年的8 項(xiàng)到2023年的18 項(xiàng),呈現(xiàn)明顯的增長態(tài)勢。
教育界在積極跟進(jìn),積累了一些經(jīng)驗(yàn)和工作基礎(chǔ)。以中國人民大學(xué)信息資源管理學(xué)院為例,在人才培養(yǎng)方面,邀請20 多位產(chǎn)業(yè)實(shí)踐導(dǎo)師,把產(chǎn)教融合理念和產(chǎn)業(yè)需求融入人才培養(yǎng)全過程,在科技攻關(guān)和社會(huì)服務(wù)方面,與國家檔案局、多地多類型檔案館、交通運(yùn)輸部研究院、敦煌研究院、上海鴻翼軟件技術(shù)股份有限公司等建立了長期合作關(guān)系,這次會(huì)議期間又結(jié)交了很多新的合作伙伴,學(xué)院老師與阿里云計(jì)算公司合作開發(fā)的項(xiàng)目榮獲“教育部產(chǎn)學(xué)協(xié)同育人項(xiàng)目優(yōu)秀案例項(xiàng)目”的表彰,在產(chǎn)教融合方面取得了一些初步成效。
但是,總體上我國檔案數(shù)據(jù)產(chǎn)教融合還處于相對淺層,如雙方的請進(jìn)來、走出去。理想狀態(tài)是把星星點(diǎn)點(diǎn)的交集節(jié)點(diǎn)編織成一張?jiān)絹碓酱?、越來越密?shí)的織物或屏障,這就需要經(jīng)度和緯度逐漸拉長、加密、對接、靠攏,并相互滲透,共同應(yīng)對檔案數(shù)據(jù)管理的各種時(shí)代挑戰(zhàn)。檔案數(shù)據(jù)方面的產(chǎn)教融合應(yīng)該成為超越傳統(tǒng)邊界的一種新共識(shí),產(chǎn)業(yè)和教育科研需要在承擔(dān)各自使命的同時(shí),面向融合重新定位自己的“坐標(biāo)”和“姿態(tài)”,共同探索和開創(chuàng)構(gòu)建這一新生態(tài)、新路徑。在這個(gè)過程中需要開展大量探索與創(chuàng)新,包括理論研究、工程實(shí)踐、產(chǎn)業(yè)治理和人才培養(yǎng)。這些探索所創(chuàng)建的檔案數(shù)據(jù)新生態(tài)是寬廣而光明的,值得我們共同為之努力。
我把這樣一個(gè)歷史性探索歸結(jié)成4 句話作為我們共同的心愿,每句話都用了“共同”二字。即共同尋求檔案數(shù)字化轉(zhuǎn)型之“道”,發(fā)展中國自主的檔案學(xué)知識(shí)體系;共同連通檔案數(shù)據(jù)經(jīng)緯之“網(wǎng)”,推動(dòng)我國檔案行業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展;共同創(chuàng)建檔案數(shù)據(jù)治理之“規(guī)”,切實(shí)貫徹《數(shù)字中國建設(shè)整體布局規(guī)劃》;共同鑄造檔案數(shù)據(jù)平臺(tái)之“基”,培育具有中國特色的檔案事業(yè)新生態(tài)。