摘要:明確數(shù)字人文及數(shù)字人文服務(wù)平臺(tái)的內(nèi)涵,解析目前數(shù)字人文服務(wù)平臺(tái)建設(shè)中存在的誤區(qū)。通過(guò)提煉民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)建設(shè)的價(jià)值目標(biāo),確立民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)的功能定位,進(jìn)一步(從完善跨學(xué)科研究體系、構(gòu)建檔案整理開發(fā)自動(dòng)化體系、優(yōu)化知識(shí)服務(wù)體系、加強(qiáng)網(wǎng)絡(luò)文獻(xiàn)資源采集和信息組織等四個(gè)方面)提出民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)的建設(shè)思路。
關(guān)鍵詞:開放利用 民國(guó)檔案 數(shù)字人文服務(wù)平臺(tái)
新《檔案法》把創(chuàng)新檔案信息資源共享服務(wù)平臺(tái)建設(shè)作為推進(jìn)檔案開放利用體系和開放利用能力現(xiàn)代化的重要內(nèi)容,提出了“推動(dòng)檔案數(shù)字資源跨區(qū)域、跨部門共享利用”的目標(biāo)要求。民國(guó)檔案資源建設(shè)是檔案信息資源建設(shè)的重要組成部分,是提升民國(guó)檔案服務(wù)能力的一項(xiàng)基礎(chǔ)建設(shè),也是當(dāng)前和今后民國(guó)檔案工作的一項(xiàng)重點(diǎn)任務(wù)。
數(shù)字人文是借助數(shù)字科技進(jìn)行人文研究的新型跨學(xué)科研究領(lǐng)域,從技術(shù)角度看,其熱點(diǎn)主題有文本挖掘與可視化、語(yǔ)義網(wǎng)技術(shù)兩類。前者又可以分成三個(gè)子主題:文獻(xiàn)計(jì)量與知識(shí)圖譜,自然語(yǔ)言處理、機(jī)器學(xué)習(xí)與可視化,文本挖掘、可視化與地理信息系統(tǒng)(GIS)技術(shù)。[1]空間人文通過(guò)抽取文獻(xiàn)中不同粒度的地理位置、人口、自然等信息,利用GIS重現(xiàn)原文對(duì)地點(diǎn)的描述,或與現(xiàn)實(shí)地理位置關(guān)聯(lián),為歷史、考古等研究提供支撐。文本挖掘則是沿著“從真實(shí)的數(shù)據(jù)到結(jié)構(gòu)化數(shù)據(jù),再到有用的知識(shí)”這條路,通過(guò)標(biāo)記數(shù)據(jù)或發(fā)現(xiàn)數(shù)據(jù)隱式結(jié)構(gòu),將文本數(shù)據(jù)轉(zhuǎn)化為多維知識(shí)。[2]
數(shù)字人文服務(wù)平臺(tái)本質(zhì)上就是基于數(shù)字人文技術(shù)構(gòu)建的一個(gè)聚合數(shù)據(jù)資源、數(shù)據(jù)工具、數(shù)據(jù)服務(wù)的知識(shí)共享平臺(tái)、內(nèi)容開放平臺(tái)。通過(guò)對(duì)國(guó)內(nèi)數(shù)字人文項(xiàng)目的考察,當(dāng)前數(shù)字人文服務(wù)平臺(tái)主要實(shí)現(xiàn)的功能包括六類:一是文本挖掘。利用文本挖掘、關(guān)聯(lián)數(shù)據(jù)等技術(shù)對(duì)文本內(nèi)容信息與外部特征進(jìn)行捕獲與收集,分類組織、定量分析并提供多種檢索途徑;二是可視化分析?;诳梢暬ぞ邔⒌乩砜臻g與時(shí)間空間的相互疊加,以圖表、詞云、動(dòng)圖等形式勾勒地理空間和特定歷史事件、事物或數(shù)據(jù)間的聯(lián)系,形成路線圖、演進(jìn)圖、沿革圖、遷徙圖等可視化圖表[3];三是場(chǎng)景模擬與復(fù)原。通過(guò)對(duì)文獻(xiàn)記載、圖像、音視頻資料進(jìn)行分析、挖掘,運(yùn)用計(jì)算機(jī)建模、關(guān)聯(lián)數(shù)據(jù)等技術(shù)將相關(guān)元素集中分析提煉,立體、多維、生動(dòng)的還原各類歷史場(chǎng)景;四是語(yǔ)料庫(kù)利用。挖掘口述文獻(xiàn)、文本文獻(xiàn)中的大量地名、機(jī)構(gòu)、人物等名稱,建立人名庫(kù)、地名庫(kù)、地理名詞表、機(jī)構(gòu)名錄等規(guī)范數(shù)據(jù)庫(kù),提供多途徑檢索服務(wù);五是用戶參與。對(duì)開放瀏覽的數(shù)字化資料提供自由創(chuàng)建標(biāo)簽、百科辭典編輯、數(shù)據(jù)審核眾包等互動(dòng)參與式的利用服務(wù);六是研究支持。匯集必要的背景知識(shí)、參考數(shù)據(jù),以及歷史年表、歷史地圖、字典詞典等研究工具。
一是單學(xué)科利用需求大于社會(huì)公眾需求,導(dǎo)致數(shù)字人文服務(wù)平臺(tái)的價(jià)值迷失。數(shù)字人文服務(wù)平臺(tái)建設(shè)的實(shí)質(zhì)是以實(shí)現(xiàn)和維護(hù)公眾權(quán)利為目標(biāo),通過(guò)匹配和實(shí)現(xiàn)公眾表達(dá)資源需求、利用資源、參與建設(shè)的權(quán)利,推動(dòng)數(shù)字資源的合理配置和有效利用。但目前數(shù)字人文服務(wù)平臺(tái)建設(shè)一方面把某一學(xué)科利用需求作為平臺(tái)建設(shè)的核心價(jià)值需求,把建設(shè)中的主要資源和精力都用于學(xué)科內(nèi)部“表淺化的檢索”,忽視學(xué)科間、數(shù)據(jù)間聯(lián)結(jié)的建立,不足以提供增加新認(rèn)知的結(jié)構(gòu)性信息。另一方面,平臺(tái)匯集了大量面向公眾開放的數(shù)字資源,但在運(yùn)行方式上,開放程度普遍不高,多數(shù)僅限內(nèi)部使用,實(shí)際并沒(méi)有讓社會(huì)公眾享受數(shù)字技術(shù)福利、降低查找文獻(xiàn)資料的成本。
二是數(shù)字化外包替代多元參與,導(dǎo)致數(shù)字人文服務(wù)平臺(tái)的協(xié)作格局沒(méi)有形成。隨著眾包、共享等服務(wù)功能的出現(xiàn),平臺(tái)資源的提供者由單一的保管機(jī)構(gòu)向個(gè)人、企業(yè)、團(tuán)體等多中心轉(zhuǎn)變,數(shù)字人文服務(wù)平臺(tái)的建設(shè)主體不僅是人文社會(huì)科學(xué)學(xué)者、資源保管機(jī)構(gòu),還要依托群體智慧和用戶的協(xié)同參與?!埃ňW(wǎng)絡(luò)世界資源交換群體)以社區(qū)論壇為活動(dòng)中心,以網(wǎng)絡(luò)云盤作存儲(chǔ)場(chǎng)所,利用微博、微信群傳遞消息,通過(guò)這些形式發(fā)布的資源具有公開、免費(fèi)和即時(shí)性?!盵4]然而,由于部分資源涉及版權(quán)糾紛,存在大量繁復(fù)的甄別工作,并且數(shù)字化外包已規(guī)模化、專業(yè)化,使國(guó)內(nèi)網(wǎng)絡(luò)信息資料的采集與保存工作沒(méi)有獲得足夠的重視,從而忽略了豐富的網(wǎng)絡(luò)文獻(xiàn)資源在數(shù)字人文服務(wù)平臺(tái)中的作用,漠視了網(wǎng)絡(luò)資源的集聚效應(yīng)實(shí)際傳達(dá)出的社會(huì)公眾對(duì)自由、平等、開放數(shù)字人文服務(wù)平臺(tái)建設(shè)的公共需求。結(jié)果不僅會(huì)導(dǎo)致協(xié)同合作的數(shù)字人文服務(wù)平臺(tái)建設(shè)難以持續(xù),也會(huì)因?yàn)槿狈τ脩魠⑴c和多主體參與而缺乏認(rèn)同,演變成閉門造車式的自?shī)首詷?lè)。
三是被動(dòng)開放重于用戶需求,導(dǎo)致數(shù)字人文服務(wù)平臺(tái)建設(shè)的路徑本末倒置。目前數(shù)字人文服務(wù)平臺(tái)一方面把主要精力放在新功能的豐富和實(shí)驗(yàn)上,對(duì)文本標(biāo)引、詞頻統(tǒng)計(jì)、語(yǔ)義標(biāo)記、文本對(duì)比、影像文字辨識(shí)等基礎(chǔ)功能、工具的升級(jí)更新研究不足,使用戶的參與度、參與數(shù)只是平臺(tái)功能自我驗(yàn)證的實(shí)驗(yàn)數(shù)據(jù)。另一方面,平臺(tái)旨在滿足用戶個(gè)性化的知識(shí)需求,但用戶需求又無(wú)法影響數(shù)字資源供給的范圍和水平,由此導(dǎo)致平臺(tái)數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)間缺乏關(guān)聯(lián)等不足,會(huì)不斷帶來(lái)新的功能訴求。因此,只有把用戶需求作為數(shù)字人文服務(wù)平臺(tái)建設(shè)的基本,通過(guò)優(yōu)化知識(shí)服務(wù)模式,形成資源共建共享的高效分享機(jī)制,才有可能從根本上實(shí)現(xiàn)不同功能的合理實(shí)現(xiàn)與劃分。[5]
四是項(xiàng)目式舉措多于科學(xué)規(guī)劃,導(dǎo)致數(shù)字人文服務(wù)平臺(tái)建設(shè)的穩(wěn)定保障不足。目前數(shù)字人文服務(wù)平臺(tái)的原始語(yǔ)料庫(kù)多是各類社科項(xiàng)目數(shù)據(jù)庫(kù)建設(shè)成果的衍生,具備學(xué)術(shù)創(chuàng)新,但由于多數(shù)屬于專題式、局部式、個(gè)人式的學(xué)術(shù)積累,缺乏宏觀的統(tǒng)籌設(shè)計(jì)和科學(xué)規(guī)劃,往往出現(xiàn)課題結(jié)項(xiàng)后數(shù)據(jù)庫(kù)關(guān)閉或停止更新維護(hù),可持續(xù)性不足的情況。當(dāng)前,一方面數(shù)據(jù)庫(kù)建設(shè)質(zhì)量、規(guī)模的參差不齊,分類體系、功能設(shè)置的不一致,銜接溝通、配合協(xié)調(diào)的缺乏,使得單一數(shù)據(jù)庫(kù)成為資源“孤島”,難以構(gòu)建縱向貫通、橫向集成的數(shù)字人文服務(wù)平臺(tái)資源庫(kù),實(shí)現(xiàn)量化研究和質(zhì)性研究的對(duì)話;[6]另一方面部分平臺(tái)建設(shè)缺乏數(shù)字人文和傳統(tǒng)研究方式的融通。人文學(xué)科具有特定的屬性,這些屬性對(duì)于數(shù)字人文的功能要求實(shí)際超出了文本間關(guān)聯(lián)的發(fā)現(xiàn),同時(shí)也對(duì)平臺(tái)設(shè)計(jì)者、維護(hù)者的素質(zhì)提出了更高的要求。
新《檔案法》不僅對(duì)“推進(jìn)電子檔案管理信息系統(tǒng)建設(shè),有條件的檔案館應(yīng)當(dāng)建設(shè)數(shù)字檔案館,國(guó)家推動(dòng)檔案數(shù)字資源跨區(qū)域、跨部門共享利用”的主要任務(wù)做了明確部署,也深刻指出數(shù)字人文服務(wù)平臺(tái)的建設(shè)既包括檔案開放范圍、利用形式,還包括平臺(tái)建設(shè)的內(nèi)涵和基本原則。民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)理應(yīng)是工具價(jià)值和獨(dú)立價(jià)值兼具的系統(tǒng)平臺(tái)。
共享共建。在民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)建設(shè)中必須堅(jiān)持公眾的主體地位。要樹立檔案活態(tài)保護(hù)、動(dòng)態(tài)利用的服務(wù)理念,一切以維護(hù)公眾利用檔案的合法權(quán)益為根本,變“被動(dòng)開放”為“主動(dòng)開放”,最終走向“合作開放”,促進(jìn)民國(guó)檔案開放利用制度化、規(guī)范化、程序化,在學(xué)術(shù)科研、社會(huì)服務(wù)等方面發(fā)展更加廣泛、更加充分、更加健全的共享共建機(jī)制。[7]
精準(zhǔn)公平。一方面,檔案部門絕不能只以“資源提供者”的角色參與到數(shù)字人文浪潮中,因?yàn)橹挥幸怨卜?wù)部門為主導(dǎo)的數(shù)字人文項(xiàng)目才最有可能實(shí)現(xiàn)數(shù)字人文成果面向社會(huì)公眾的免費(fèi)開放。另一方面,民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)的建設(shè)也是檔案資源重新組織、配置的過(guò)程,必然面臨各方主體的不同利用需求,只有建立精準(zhǔn)的用戶需求調(diào)查機(jī)制、公平的檔案資源利用機(jī)制,才能有效化解供需矛盾,讓檔案整理編研、開放利用的成果更精準(zhǔn)地惠及每一名用戶,保障普通用戶平等參與共建過(guò)程,構(gòu)建資源匹配精準(zhǔn)、機(jī)會(huì)開放公平的數(shù)字人文服務(wù)平臺(tái)。
多元活力。在當(dāng)前學(xué)科劃分細(xì)化、學(xué)者跨界頻繁、學(xué)術(shù)交流深化、學(xué)術(shù)原創(chuàng)精神不斷拓展、學(xué)術(shù)視野更趨開闊的條件下,民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)既要確保公共服務(wù)能力的最大化,堅(jiān)守“為黨管檔、為國(guó)守史、為民服務(wù)”價(jià)值體系,確?;緝r(jià)值功能不受侵害,也要鼓勵(lì)社會(huì)多元,理解用戶多樣化和個(gè)性化的需求。特別是在數(shù)字人文服務(wù)功能的設(shè)置上,及時(shí)把合理的個(gè)性化訴求轉(zhuǎn)化為服務(wù)功能的創(chuàng)新,讓用戶和網(wǎng)絡(luò)文獻(xiàn)資源充滿生機(jī)活力,使民國(guó)檔案收集與開放保持動(dòng)態(tài)平穩(wěn)狀態(tài)。[8]
安全有序。民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)的宗旨是確保檔案開放有序、檔案數(shù)據(jù)安全。面向社會(huì)化網(wǎng)絡(luò)的平臺(tái)建設(shè)并不是完全沒(méi)有潛在風(fēng)險(xiǎn),因此要在共同遵循規(guī)則秩序的前提下將檔案安全風(fēng)險(xiǎn)控制在有限范圍內(nèi),用戶矛盾糾紛可以在統(tǒng)一的解決機(jī)制下獲得較快解決。[9]首先需要平臺(tái)具備完善的管理系統(tǒng),依靠身份管理、誠(chéng)信管理、知識(shí)管理彌合由于信息不對(duì)稱、關(guān)系聯(lián)結(jié)松散帶來(lái)的風(fēng)險(xiǎn)形成;其次需要構(gòu)建網(wǎng)絡(luò)環(huán)境下民國(guó)檔案資源建設(shè)的標(biāo)準(zhǔn)體系,包括收集、流轉(zhuǎn)、存儲(chǔ)、利用等方面的技術(shù)標(biāo)準(zhǔn),以及檔案元數(shù)據(jù)標(biāo)準(zhǔn);最后需要建立知識(shí)產(chǎn)權(quán)保護(hù)機(jī)制,運(yùn)用數(shù)字版權(quán)管理技術(shù),全過(guò)程保護(hù)平臺(tái)知識(shí)貢獻(xiàn)者的正當(dāng)權(quán)益,防止知識(shí)產(chǎn)權(quán)的濫用。
民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)是以滿足和維護(hù)公眾需求為核心,發(fā)揮各類主體作用,針對(duì)現(xiàn)有檔案開放利用中的不足,創(chuàng)新開放形式,強(qiáng)化服務(wù)功能,提高數(shù)字化水平,促進(jìn)社會(huì)共享,推動(dòng)民國(guó)檔案工作緊跟時(shí)代改革創(chuàng)新。[10]《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》鼓勵(lì)加大檔案資源跨領(lǐng)域、跨區(qū)域、跨層級(jí)整合力度,推動(dòng)檔案數(shù)字資源跨區(qū)域、跨部門共享利用,具有很強(qiáng)的時(shí)代創(chuàng)新性和戰(zhàn)略指導(dǎo)性,為我們深刻理解民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)在促進(jìn)民國(guó)檔案開放利用中的功能定位提供了引導(dǎo)作用。[11]
一是推進(jìn)檔案治理能力現(xiàn)代化的先行示范。民國(guó)檔案開放利用體系在形式上體現(xiàn)為一系列規(guī)范機(jī)制的檔案管理制度,內(nèi)容涉及保管、修復(fù)、整理、信息化、編研、利用等六個(gè)方面,重點(diǎn)在于利用規(guī)則、開放形式、服務(wù)功能、協(xié)作方向、數(shù)字化內(nèi)容、信息安全的完善,實(shí)質(zhì)是通過(guò)運(yùn)用民國(guó)檔案資源為國(guó)家機(jī)關(guān)和社會(huì)公眾開展有關(guān)問(wèn)題研究提供文獻(xiàn)支持和便利,適應(yīng)檔案管理體系和檔案治理能力現(xiàn)代化要求,實(shí)現(xiàn)民國(guó)檔案事業(yè)走向依法治理、走向開放、走向現(xiàn)代化。民國(guó)檔案開放利用能力,就是運(yùn)用上述各項(xiàng)檔案管理體制機(jī)制推進(jìn)民國(guó)檔案開放利用的水平和績(jī)效。[12]因?yàn)槊駠?guó)檔案開放利用能力反映了開放利用行為的水平和質(zhì)量,是對(duì)創(chuàng)新模式有效性、合理性和長(zhǎng)期性的直觀度量。
二是提升民國(guó)檔案開放利用實(shí)效的知識(shí)中心。民國(guó)檔案的開放利用由于經(jīng)過(guò)鑒定審查、劃控、審核等流程,與公共需求存在一定時(shí)間上的延滯。隨著近代史、抗戰(zhàn)史研究的日益精細(xì)化,對(duì)外交流合作的日益國(guó)際化,公眾閱文查檔的日益頻繁化,在加快民國(guó)檔案開放范圍擴(kuò)大、開放方式轉(zhuǎn)變、利用形式多樣的過(guò)程中,必然面臨知識(shí)觀念深刻變化、協(xié)作方式深刻調(diào)整、檔案需求深刻變動(dòng)等現(xiàn)實(shí)難題,能否正確處理好民國(guó)檔案事業(yè)發(fā)展與社會(huì)共享,數(shù)據(jù)化、全文化與檔案保護(hù),用戶需求與檔案信息安全,需求增長(zhǎng)與服務(wù)供給不足等開放利用問(wèn)題,這既是構(gòu)建民國(guó)檔案開放利用體系的基礎(chǔ),也是提升民國(guó)檔案開放利用能力的前提。[13]
三是民國(guó)檔案數(shù)字化成果集中展示的創(chuàng)新基地。民國(guó)檔案數(shù)字化建設(shè),既包括發(fā)展檔案數(shù)字化工作,即數(shù)據(jù)信息挖掘、檔案史料眾包、檔案文件級(jí)目錄著錄、檔案信息安全等基本服務(wù)功能[14],也包括網(wǎng)絡(luò)文獻(xiàn)資料的采集、檔案編研數(shù)字化出版。這些既是民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)的核心內(nèi)容,也是民國(guó)檔案開放利用的基礎(chǔ)。
四是強(qiáng)化社會(huì)協(xié)同合作的共享平臺(tái)。其基本方向:一是以跨學(xué)科合作為利用方式。要實(shí)現(xiàn)民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)的建設(shè),必須建立一個(gè)以資源互通為基礎(chǔ),以多維度協(xié)作為特征的多元統(tǒng)一的數(shù)字人文服務(wù)平臺(tái)結(jié)構(gòu)。促進(jìn)與博物館、地方館、科研院校等主體廣泛協(xié)作的制度化發(fā)展。二是資源主體趨于多元化,檔案保管機(jī)構(gòu)必須與各種網(wǎng)絡(luò)文獻(xiàn)資源一起形成互補(bǔ)網(wǎng)絡(luò),在共同開放利用的基礎(chǔ)上形成信息的重組與增值,共享檔案資源,并使各方共同獲益。[15]三是檔案資源向社會(huì)的回歸。檔案資源的開放利用過(guò)程不再是自上而下、由內(nèi)而外的,而是回歸社會(huì)和網(wǎng)絡(luò)之中成為服務(wù)者。
一是要完善跨學(xué)科研究體系。跨學(xué)科研究既指在平臺(tái)建設(shè)中加入如文獻(xiàn)學(xué)、民俗學(xué)、人類學(xué)、經(jīng)濟(jì)學(xué)、教育學(xué)、敦煌學(xué)等不同學(xué)科領(lǐng)域的方法和數(shù)據(jù),也指在已有的海量文本數(shù)據(jù)挖掘中采用不同學(xué)科視角多維度、多粒度的提取文本數(shù)據(jù)中的知識(shí)信息??鐚W(xué)科研究體系是推進(jìn)民國(guó)檔案數(shù)字人文服務(wù)平臺(tái)建設(shè)的基本保障,也是影響其建設(shè)質(zhì)量的制度基礎(chǔ)。
二是要構(gòu)建檔案整理開發(fā)自動(dòng)化體系。自動(dòng)化體系主要是指實(shí)現(xiàn)檔案整理開發(fā)自動(dòng)化的技術(shù)保障和功能規(guī)則制度。檔案的整理開發(fā)如果缺乏實(shí)現(xiàn)識(shí)別檢錯(cuò)、主題提取、自動(dòng)分類等技術(shù)工具僅依靠人工進(jìn)行文本字符的數(shù)字化,就很難充分發(fā)揮檔案資源的研究支持功能。首先,要建立民國(guó)檔案文獻(xiàn)語(yǔ)料庫(kù),利用抽取民國(guó)公文、職官、機(jī)構(gòu)、軍事、人名、區(qū)劃等,與異名別稱規(guī)則、分類規(guī)則、斷句標(biāo)點(diǎn)規(guī)則、書法字體、圖片唱片等形成豐富的語(yǔ)料庫(kù),為實(shí)現(xiàn)規(guī)范數(shù)據(jù)的重用和共享構(gòu)建基礎(chǔ);其次,要運(yùn)用語(yǔ)料庫(kù)實(shí)現(xiàn)民國(guó)檔案整理與開發(fā)自動(dòng)化。通過(guò)基數(shù)龐大的語(yǔ)料庫(kù),組織編纂期刊論文索引、職官機(jī)構(gòu)索引、卷宗主題索引等各類索引,構(gòu)建起語(yǔ)料庫(kù)之間的元數(shù)據(jù)交叉聯(lián)系,并結(jié)合語(yǔ)言學(xué)方法,實(shí)現(xiàn)計(jì)算機(jī)的輔助識(shí)別、自動(dòng)???、自動(dòng)斷句,從而實(shí)現(xiàn)成果挖掘和知識(shí)增值功能。[16]
三是要優(yōu)化知識(shí)服務(wù)體系。首先,要提升知識(shí)服務(wù)模式的共建化水平,平臺(tái)可以打通館藏資源和社會(huì)資源、工作人員與檔案館、讀者與工作人員之間的聯(lián)系,而且挖掘出廣大社會(huì)讀者的知識(shí)資源;其次,轉(zhuǎn)變?nèi)藛T服務(wù)角色,構(gòu)建多主體協(xié)同供給機(jī)制。借助平臺(tái)可以實(shí)現(xiàn)知識(shí)資源的交換,實(shí)現(xiàn)用戶參與與知識(shí)貢獻(xiàn)的互動(dòng)關(guān)系,逐步形成檔案館主導(dǎo),多主體協(xié)同共建的知識(shí)聚合格局。[17]
四是要加強(qiáng)網(wǎng)絡(luò)文獻(xiàn)資源采集和信息組織。首先要統(tǒng)一網(wǎng)絡(luò)文獻(xiàn)資源采集的標(biāo)準(zhǔn)規(guī)范。針對(duì)目前網(wǎng)絡(luò)文獻(xiàn)資源標(biāo)引不規(guī)范導(dǎo)致難以二次開發(fā)利用的問(wèn)題,探索建立“垂直典藏、專題建設(shè)、深層檢索”的元數(shù)據(jù)加工制度,實(shí)施分類管理;[18]其次構(gòu)建網(wǎng)絡(luò)文獻(xiàn)資源的信息組織機(jī)制。檔案館作為知識(shí)的存儲(chǔ)機(jī)構(gòu),可以承擔(dān)對(duì)網(wǎng)絡(luò)文獻(xiàn)資源的采集與信息組織分析機(jī)制的探索,制定網(wǎng)絡(luò)文獻(xiàn)資源采集、編目、管理工作規(guī)范。引導(dǎo)社會(huì)公眾參與對(duì)網(wǎng)絡(luò)文獻(xiàn)資源的信息抽取、知識(shí)組織等環(huán)節(jié),引入網(wǎng)絡(luò)文獻(xiàn)資源觀察評(píng)估制度,編制網(wǎng)絡(luò)文獻(xiàn)資源的年度報(bào)告書,逐步建立起一個(gè)嵌入民國(guó)檔案數(shù)字人文服務(wù)平臺(tái),與既有檔案資源數(shù)據(jù)相互補(bǔ)充的互聯(lián)網(wǎng)資源服務(wù)體系;最后,要建立網(wǎng)絡(luò)文獻(xiàn)資源采集的激勵(lì)機(jī)制。制定激勵(lì)公眾用戶參與網(wǎng)絡(luò)文獻(xiàn)資源發(fā)展的管理策略,運(yùn)用欣賞激勵(lì)、獎(jiǎng)勵(lì)激勵(lì),鼓勵(lì)用戶在學(xué)習(xí)、交流中完成網(wǎng)絡(luò)文獻(xiàn)資源的轉(zhuǎn)移、留存和流動(dòng)。[19]
注釋與參考文獻(xiàn)
[1]王東波.面向知識(shí)挖掘的平行句法語(yǔ)料庫(kù)構(gòu)建研究[M].南京:南京大學(xué)出版社,2019:12-31.
[2張超,韓家煒等.海量文本數(shù)據(jù)的多維挖掘[M].北京:機(jī)械工業(yè)出版社,2020:1-10.
[3]王華.晚清民國(guó)華僑文獻(xiàn)整理與研究[M].廣州:廣東人民出版社,2021:448-459.
[4]陳宇.應(yīng)急保障視角下對(duì)網(wǎng)絡(luò)資源“集聚效應(yīng)”的重新審視[J].高校圖書館工作.2020(5):50.
[5]程靜.國(guó)內(nèi)外數(shù)字人文服務(wù)平臺(tái)建設(shè)現(xiàn)狀及思考[J].圖書館學(xué)研究. 2020(2):41-43.
[6]周耀林,趙躍等.非物質(zhì)文化遺產(chǎn)檔案資源建設(shè)“群體智慧模式”[M].武漢:武漢大學(xué)出版社,2020:272-276.
[7]陳果.面向網(wǎng)絡(luò)社區(qū)的領(lǐng)域知識(shí)聚合研究[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社, 2019:30-35.
[8]賀晨芝,張磊.圖書館數(shù)字人文眾包項(xiàng)目實(shí)踐[J].圖書館論壇. 2020(5):6-8.
[9]左娜,張衛(wèi)東.面向數(shù)字人文的檔案資源整合模式構(gòu)想:解構(gòu)與重組[J].檔案學(xué)通訊. 2020(3):33-34.
[10]唐燕,劉小榕等.智慧圖書館空間再造與數(shù)字人文服務(wù)創(chuàng)新研究[J].圖書館. 2020(5):74-76.
[11]劉舒妍.以法治化促進(jìn)檔案治理現(xiàn)代化[N].中國(guó)檔案報(bào). 2020-12-10(3).
[12]朱麗梅.檔案信息化建設(shè)的績(jī)效評(píng)價(jià)研究[D].華南理工大學(xué),2014:24-27.
[13]李明華.在全國(guó)檔案局長(zhǎng)館長(zhǎng)會(huì)議上的工作報(bào)告[J].中國(guó)檔案. 2019(4):25-28.
[14]馬振犢,王俊明等.檔案數(shù)字化前整理工作的實(shí)踐研究[J].創(chuàng)新:檔案與文化強(qiáng)國(guó)建設(shè)——2014年檔案事業(yè)發(fā)展研究報(bào)告集. 2014:93-100.
[15]馬費(fèi)成.信息管理與信息系統(tǒng)研究進(jìn)展第2輯[M].武漢:武漢大學(xué)出版社,2017:496-498.
[16]王雅戈著.古籍計(jì)算機(jī)自動(dòng)索引研究以民國(guó)農(nóng)業(yè)文獻(xiàn)自動(dòng)索引為例[M].蕪湖:安徽師范大學(xué)出版社, 2013:2-6.
[17]尉遲文珠.試論我國(guó)高校圖書館知識(shí)服務(wù)模式構(gòu)建[D].天津師范大學(xué),2007:27.
[18]李曉明,馬寧寧.國(guó)家圖書館網(wǎng)絡(luò)信息采集的實(shí)踐與發(fā)展[J].網(wǎng)絡(luò)資源采集與數(shù)字資源長(zhǎng)期保存學(xué)術(shù)研討會(huì)論文集. 2013:15-17.
[19]陳鶴陽(yáng).眾包平臺(tái)用戶持續(xù)知識(shí)貢獻(xiàn)行為研究[M].2020:164-166.
作者單位:中國(guó)第二歷史檔案館