周文泓 許強(qiáng)寧 高振華 張曉宇/四川大學(xué)公共管理學(xué)院
網(wǎng)絡(luò)為新冠肺炎疫情這一全球性重大突發(fā)事件提供了關(guān)鍵的信息即時(shí)發(fā)布、交流、集成空間,也從歷史敘事和信息資源產(chǎn)業(yè)角度提出海量信息在傳播過后如何存續(xù)的問題。檔案館、圖書館、博物館等記憶機(jī)構(gòu)正在全球范圍內(nèi)發(fā)起戰(zhàn)“疫”材料征集以留存對國家與社會有價(jià)值的記錄,網(wǎng)絡(luò)信息涵蓋其中。從網(wǎng)上紀(jì)念館、戰(zhàn)“疫”記憶庫到GitHub上一度登上趨勢榜第一的各類存檔項(xiàng)目,均反映出網(wǎng)絡(luò)信息存檔是不可或缺的行動(dòng)。那么目前實(shí)踐進(jìn)展如何,已形成哪些實(shí)質(zhì)成果且面臨哪些問題,對我國新冠肺炎疫情以及更廣泛的重大社會事件網(wǎng)絡(luò)信息存檔,具有哪些啟示和可供參照之處?
理論層面在疫情之初就倡導(dǎo)建立針對新冠肺炎疫情的專題檔案庫[1],作為代表性類型的網(wǎng)絡(luò)信息如社交媒體存檔也得到相應(yīng)探討,從為什么與如何做等方面提供了一定見解[2]。此外,以往的重大社會事件網(wǎng)絡(luò)信息存檔以實(shí)踐案例(如倫敦奧運(yùn)會)分析實(shí)踐挑戰(zhàn)與策略[3][4]。由此,這些研究幫助明確網(wǎng)絡(luò)信息的龐大數(shù)量、復(fù)雜特性與存檔價(jià)值,并從主體協(xié)同、善用技術(shù)、制度保障等方面提供了方向。然而,研究對具體進(jìn)展缺乏行動(dòng)層的實(shí)證支撐,有待形成更具啟示性的策略。
因此,本文將對面向新冠肺炎疫情的網(wǎng)絡(luò)信息存檔行動(dòng)進(jìn)行全球范圍的線上調(diào)查,從代表性實(shí)踐發(fā)現(xiàn)行動(dòng)進(jìn)展與特征,由此為新冠肺炎疫情網(wǎng)絡(luò)檔案庫的全景建設(shè)乃至重大社會事件網(wǎng)絡(luò)信息存檔提供啟發(fā)式策略。
2020年2月13日,國際互聯(lián)網(wǎng)保存聯(lián)盟(International Internet Preservation Consortium,IIPC)下設(shè)的內(nèi)容開發(fā)小組(Content Development Group,CDG)開展面向各個(gè)國家、地區(qū)新冠疫情的網(wǎng)頁存檔項(xiàng)目[5],旨在存取與新型冠狀病毒有關(guān)的網(wǎng)絡(luò)內(nèi)容,包括與新冠病毒感染傳播信息、各地為遏制病毒所做的努力以及和疫情有關(guān)的醫(yī)療、科學(xué)、社會、經(jīng)濟(jì)、政治等各個(gè)方面的信息。項(xiàng)目進(jìn)程中,可由作為成員的來自世界各地的各類記憶機(jī)構(gòu)提名應(yīng)存檔的網(wǎng)址,感興趣的群體或公眾亦可參與;需在線填寫信息并提交表格,包括網(wǎng)址、域名、標(biāo)題、語言、描述/關(guān)鍵詞(選填)、范圍、參與者姓名或機(jī)構(gòu)(選填)、主題,通過CDG審核后確定應(yīng)捕獲目標(biāo),通過參與者提交與網(wǎng)絡(luò)爬取獲得信息。
截至目前,IIPC已借助Internet Archive提供的工具 Archive-It形成了可在線檢索的獲得網(wǎng)站訪問許可的5000條存檔網(wǎng)頁資源,具體信息涵蓋標(biāo)題、網(wǎng)址、內(nèi)容描述、捕獲實(shí)踐、國家、域名等類別。這些資源包含15種語言如英文、葡萄牙文、德文的網(wǎng)絡(luò)信息,中文信息亦得到一定的捕獲,總數(shù)排名第13位,如我國應(yīng)急管理部的疫情專題首頁自2020年3月20日以來被存檔3次[6]。
以傳承國家信息資源與文化遺產(chǎn)為重要職責(zé)的檔案館、圖書館、博物館等記憶機(jī)構(gòu)正在全球范圍內(nèi)面向國家層級從官方視角發(fā)起戰(zhàn)“疫”材料征集,網(wǎng)絡(luò)信息成為重要組成。以我國為例,國家圖書館在2020年4月22日發(fā)起聯(lián)合全國各級各類圖書館的中國戰(zhàn)“疫”記憶庫建設(shè)項(xiàng)目,通過面向社會公眾的廣泛征集活動(dòng),完整記錄全國人民抗“疫”的真實(shí)情境,包括疫情防控中運(yùn)用的新技術(shù)和社會管理形態(tài)的變化,如數(shù)字化生活、網(wǎng)上辦公、線上學(xué)習(xí)等都被設(shè)置在捕獲范疇之中。
項(xiàng)目的參與者極為開放,包括全國黨政機(jī)關(guān)、企事業(yè)單位、社會團(tuán)體和社會各界人士,資源類型涵蓋文字、圖片、音頻、視頻等多媒體資源以及實(shí)物。當(dāng)前,項(xiàng)目尚處在征集階段,將成為常態(tài)化工作;征集方式包括網(wǎng)絡(luò)資源采集、多渠道征集、交換及購買,并依據(jù)著作權(quán)、復(fù)制權(quán)、信息網(wǎng)絡(luò)傳播權(quán)明確征集和使用事項(xiàng)。根據(jù)報(bào)道,預(yù)計(jì)年底形成原型系統(tǒng),滿足以互動(dòng)問答形式在線調(diào)取文獻(xiàn)的需求。
新冠肺炎疫情作為重大社會事件,其存檔情況無疑得到了社會各方關(guān)注,不同組織、機(jī)構(gòu)、群體或個(gè)人基于各自的存檔取向、資源或能力發(fā)起多樣化的項(xiàng)目。一方面,主流機(jī)構(gòu)如新聞媒介、學(xué)術(shù)團(tuán)體、行業(yè)協(xié)會等有一定行動(dòng)。如,華中科技大學(xué)出版社聯(lián)合參戰(zhàn)醫(yī)院和海內(nèi)外傳媒機(jī)構(gòu)共同打造武漢戰(zhàn)“疫”數(shù)字博物館,向海內(nèi)外公眾征集戰(zhàn)“疫”過程中的各類資料,形成在線可用的檔案庫[8]。項(xiàng)目保存對象是抗“疫”過程中的個(gè)人故事與生活,強(qiáng)調(diào)真實(shí)原創(chuàng),鼓勵(lì)醫(yī)務(wù)工作者、患者、各方志愿者、“疫區(qū)”群眾等作為主要參與者,貢獻(xiàn)音視頻、文字、圖片;內(nèi)容應(yīng)描述標(biāo)題、創(chuàng)作人、聯(lián)系方式、發(fā)生地點(diǎn)。一經(jīng)錄用,提供完整規(guī)范的版權(quán)保護(hù)。
另一方面,擁有不同專長的群體和個(gè)人亦參與其中。截至2020年5月,79個(gè)項(xiàng)目借助技術(shù)開源社區(qū)Github平臺廣泛參與新冠肺炎疫情存檔,收集、保存包括數(shù)據(jù)、新聞、微博、文章等多種類型的資源。其中,以個(gè)人為主體構(gòu)建的新冠肺炎疫情存檔項(xiàng)目占比高達(dá)84.81%。此類實(shí)踐一般選擇開源軟件與服務(wù)平臺進(jìn)行分布式共建的網(wǎng)絡(luò)收集、上傳與發(fā)布,由社群成員自主選擇、收集、保存內(nèi)容。以“2020新冠肺炎疫情個(gè)人故事”項(xiàng)目為例,項(xiàng)目旨在保存我國普通公眾在疫情期間的個(gè)人生活記錄,選擇豆瓣網(wǎng)絡(luò)日志為存檔來源,大部分記錄來自湖北武漢,反映了戰(zhàn)“疫”期間武漢普通市民的真實(shí)生活。
實(shí)踐顯示,網(wǎng)絡(luò)信息存檔漸成規(guī)模且已有多方成果的直接原因,在于前瞻性的存檔布局和行動(dòng)設(shè)計(jì)。新冠肺炎疫情這樣的重大社會事件有著難以完全管控的隨機(jī)性,面向各類平臺各類主體不同視角和事件角色或過程中存在于復(fù)雜傳播網(wǎng)絡(luò)的龐雜信息,需要存檔主體有充分的重大社會事件存檔嗅覺,從而及時(shí)啟動(dòng)存檔項(xiàng)目且付諸具體行動(dòng)。IIPC能成為較早啟動(dòng)項(xiàng)目并已有可供利用的存檔結(jié)果,原因就在于其本身具有面向國際性事件的存檔機(jī)制,從設(shè)置的內(nèi)容開發(fā)小組到具體的流程都較為成熟。再以我國為例,前期各地方圖書館、檔案館或博物館征集的資料并沒有明確指出包括網(wǎng)絡(luò)信息,而國家圖書館的戰(zhàn)“疫”記憶庫項(xiàng)目能將網(wǎng)絡(luò)信息納入,很大程度在于它是我國互聯(lián)網(wǎng)信息社會化保存項(xiàng)目主導(dǎo)方。
在事件維度的牽引下,跨平臺、跨主體、跨過程、跨內(nèi)容的信息存檔需要的是多方協(xié)同。一方面,多元發(fā)起主體立足不同的目標(biāo)與對象展開多樣化行動(dòng),不同項(xiàng)目的成果,在信息來源、記錄對象、記錄視角上相互交叉、疊加、互補(bǔ),形成還原度更高的檔案結(jié)果。如,Github平臺的多個(gè)項(xiàng)目在2月初就著手對國內(nèi)疫情信息進(jìn)行存檔,以期補(bǔ)足國家圖書館缺失的部分網(wǎng)絡(luò)信息。另一方面,即使是單個(gè)項(xiàng)目,也需要不同主體形成協(xié)作網(wǎng)絡(luò),從而獲得多維度多層級的資源與方法支持。如,國家圖書館主導(dǎo)的戰(zhàn)“疫”記憶庫已明確指出合作方是各級圖書館與網(wǎng)絡(luò)平臺。同時(shí),這些或大或小的項(xiàng)目無一例外地倡導(dǎo)社會參與。
實(shí)體與數(shù)字空間的深度融合趨勢意味著網(wǎng)絡(luò)信息存檔同其他空間的檔案工作在方法、經(jīng)驗(yàn)、資源上須強(qiáng)化協(xié)作,這在新冠肺炎疫情中尤為顯著。新冠肺炎疫情除網(wǎng)絡(luò)信息外形成了大量離線信息或其他形式的記錄,共同形成更全面完整的記錄結(jié)果,且隨著線上利用需求的倒逼,這些信息也將進(jìn)入網(wǎng)絡(luò)檔案庫。因此,新冠肺炎疫情的網(wǎng)絡(luò)信息存檔在具體實(shí)踐中并不只是獨(dú)立行動(dòng),而是作為整個(gè)事件檔案化體系的有機(jī)組成。以國家圖書館的戰(zhàn)“疫”記憶庫為例,它的提出更具整體視角,在信息對象上涵蓋各種空間中形成的各類形式的記錄,關(guān)鍵點(diǎn)不僅在于存檔范疇的開放性與包容性,也在于它以“庫”的形式將存檔結(jié)果設(shè)定為不同形式對象的融合。
縱觀新冠肺炎疫情網(wǎng)絡(luò)信息存檔實(shí)踐,其進(jìn)展為我國更加系統(tǒng)的存檔規(guī)劃與行動(dòng)乃至未來更多的重大社會事件網(wǎng)絡(luò)信息存檔,提供了值得深入思考的策略。
網(wǎng)絡(luò)信息的形成與傳播是即時(shí)、非線性和碎片化的,面臨失真失存的風(fēng)險(xiǎn),且重大社會事件在記錄主體、數(shù)量、內(nèi)容、平臺等方面更加復(fù)雜,不是短期內(nèi)可完成的存檔任務(wù)。因而,存檔的及時(shí)性體現(xiàn)于盡早展開綜合性部署規(guī)劃,在疫情尚未完全解決、信息將持續(xù)增長的情況下就體現(xiàn)為需要在當(dāng)下制定存檔框架與方案。同時(shí),行動(dòng)層的落實(shí)要在疫情后期緊湊展開,可以試點(diǎn)的方式依據(jù)存檔框架與方案實(shí)施更具針對性的行動(dòng)。
由此,一方面要明確存檔目標(biāo),以我國可以構(gòu)建全景映射重大社會事件多方面與持續(xù)性過程的網(wǎng)絡(luò)信息資源完整體系為最終的整體目標(biāo),這是驅(qū)動(dòng)記憶領(lǐng)域與社會多元參與的重要力量。另一方面要設(shè)定適用不同階段不同存檔條件與要求的過程性方案,循序漸進(jìn)地落實(shí)存檔行動(dòng)。如,在不能一次性捕獲所有信息的前提下,依據(jù)同重大社會事件的密切度與價(jià)值來確定信息捕獲的優(yōu)先級。再如,在無法捕獲部分平臺完整信息及其元數(shù)據(jù)的情況下,可暫時(shí)“妥協(xié)性”地簡化格式與元數(shù)據(jù)要求,既可為后續(xù)形成完善信息提供線索,也可在原生信息丟失的情況下保存具有一定價(jià)值的不完整樣本。
記憶領(lǐng)域從意識、戰(zhàn)略、能力、行動(dòng)等方面,對引領(lǐng)新冠肺炎疫情這一對我國與我國人民而言有著重要分量的社會事件的網(wǎng)絡(luò)信息存檔有著“天然”使命。記憶機(jī)構(gòu)除檔案館外,還包括同樣以構(gòu)建國家記憶為目標(biāo)的圖書館與博物館等相關(guān)機(jī)構(gòu),可從專業(yè)上提供針對可信檔案信息資源建設(shè)更加專業(yè)的方法與制度指導(dǎo),且可作為資源基地提供保管和后續(xù)的開發(fā)利用功能。同時(shí),網(wǎng)絡(luò)信息的復(fù)雜性也意味著應(yīng)發(fā)揮群體力量,實(shí)現(xiàn)更具體系與規(guī)模的存檔,這包括檔案的高校學(xué)術(shù)團(tuán)體與學(xué)者、提供技術(shù)和資源支持的社會組織等。其中,可發(fā)揮更具龐大基數(shù)的網(wǎng)絡(luò)信息的形成者、傳播者和利用者的行動(dòng)力,通過建立眾包型的平臺,由網(wǎng)民提供信息、幫助鑒別信息、組織和描述信息、開發(fā)信息產(chǎn)品等。
重大社會事件的網(wǎng)絡(luò)信息存檔在我國還處于初步進(jìn)程中。為實(shí)現(xiàn)最優(yōu)目標(biāo),一方面,在我國記憶機(jī)構(gòu)包括檔案館、圖書館、博物館等具備的館網(wǎng)跨層級、跨地區(qū)、跨系統(tǒng)的連接優(yōu)勢下,將線下征集的規(guī)?;袆?dòng)拓展至網(wǎng)絡(luò)空間。盡管目前網(wǎng)絡(luò)信息存檔相比發(fā)達(dá)國家有一定差距,但此前面向社會的征集經(jīng)驗(yàn)和方法都可立足網(wǎng)絡(luò)空間進(jìn)行適應(yīng)性調(diào)整以形成我國模式獨(dú)具的全國廣泛力量的集聚。如,目前在征集宣傳上,官方網(wǎng)站、社交媒體、電視媒介等都包含在內(nèi)。
另一方面,國際上已有實(shí)踐可從經(jīng)驗(yàn)與問題的正反兩大方面提供借鑒,涉及存檔主體、存檔范圍、存檔方法、存檔成果的資源化、存檔成果的利用等。如,IIPC的內(nèi)容征集機(jī)制與流程以及存檔各環(huán)節(jié)已提供的數(shù)十種數(shù)字工具,都是可供使用或改良的基礎(chǔ)。
本文為國家社會科學(xué)基金項(xiàng)目“基于多元數(shù)字技術(shù)的網(wǎng)絡(luò)空間參與式歸檔研究”(項(xiàng)目號:18CTQ037)的研究成果。