周文泓
2019年4月19日,以新浪為首個基地的國家圖書館互聯(lián)網(wǎng)信息戰(zhàn)略保存項目開啟圍繞國家數(shù)字記憶話題的討論,尤其是把新浪微博2,000多億公開博文與相應(yīng)的5,000億評論互動納入其中,引發(fā)熱搜熱議。這意味著網(wǎng)絡(luò)歸檔在我國從分散的局部實踐走向建設(shè)覆蓋全國的分級分布式中文互聯(lián)網(wǎng)信息資源采集、保存與服務(wù)體系的新階段,有利于記錄多主體多時空的文明脈絡(luò),更助力國家信息安全與社會信息化建設(shè)。其中,項目提出的社會化保存彰顯了我國信息管理主體從國家戰(zhàn)略層提出的宏大命題,它面向不同網(wǎng)絡(luò)層、服務(wù)平臺、應(yīng)用工具、信息形成傳輸與利用主體等,但同時從內(nèi)容、形式、背景等方面呈現(xiàn)社會、文化、技術(shù)、司法、管理挑戰(zhàn)。識別其中的重點難點并探索出相應(yīng)對策是互聯(lián)網(wǎng)信息保存項目得以連續(xù)的要義所在,限于互聯(lián)網(wǎng)包含眾多門類,而社交媒體作為代表性的網(wǎng)絡(luò)應(yīng)用,亦是此項目的首個試點基地,從其入手有助于一窺全景。
社交媒體保存檔實踐早已顯示互聯(lián)網(wǎng)信息社會化保存絕非一蹴而就的命題。政務(wù)社交媒體信息的檔案化管理通過近10 年的實踐,在美國、澳大利亞、英國等形成政務(wù)社交媒體文件全流程管理以及與之相應(yīng)的檔案庫;同國家圖書館互聯(lián)網(wǎng)信息戰(zhàn)略保存項目性質(zhì)類似的涵蓋范圍更廣的社交媒體保存2010年已體現(xiàn)于美國國會圖書館Twitter 檔案項目中;其他實踐均體現(xiàn)出各國與地區(qū)多元主體的參與和協(xié)作。然而,具體進(jìn)展頻頻陷入瓶頸,法規(guī)政策、收集方案、長久保存策略、技術(shù)工具、利益機(jī)制等均存難解之題。在展望通過互聯(lián)網(wǎng)信息社會化保存拓展數(shù)字記憶建構(gòu)的同時亦需考慮到互聯(lián)網(wǎng)記憶稍縱即逝的風(fēng)險。
理論層面,社交媒體保存已不是檔案領(lǐng)域新論題,國內(nèi)外一系列研究對社交媒體信息保存的必要性、挑戰(zhàn)、模式、優(yōu)化策略等展開探索。首先,社交媒體信息保存的必要性獲認(rèn)可,證據(jù)、信息、資產(chǎn)、資源、記憶等多維度價值得到明晰[1];其次,圍繞社交媒體信息的背景、形式與內(nèi)容特征基于已有實踐分析保存對象特點以及相應(yīng)的管理挑戰(zhàn),如制度不充分、信息量大、多形成主體、技術(shù)環(huán)境復(fù)雜等得到明確[2-3];再次,機(jī)制、技術(shù)、政策等方面的對策都在研究中有所提及,多元主體參與的社會化模式得到倡導(dǎo),提倡建立政府機(jī)構(gòu)、記憶機(jī)構(gòu)以及社交媒體平臺的協(xié)作機(jī)制[4];最后,探討了組織架構(gòu)、制度規(guī)范、技術(shù)工具等具體支撐,各方面策略得以提出,如建立社會化記憶機(jī)構(gòu)聯(lián)盟、優(yōu)化歸檔政策、API或爬蟲工具的開發(fā)[5-6]。然而,在研究成果凸顯社會化這一要義的同時,這些研究偏重于社交媒體信息保存的必要性、價值、方向以及宏觀模式,對于如何實現(xiàn)社交媒體信息社會化保存的具體問題與策略則缺乏充分設(shè)計和說明。
本文立足于社交媒體信息存檔的代表性實踐,解析其共同呈現(xiàn)出的問題以明確社交媒體信息所顯示的互聯(lián)網(wǎng)信息社會化保存的復(fù)雜性,然后基于對策的角度設(shè)計應(yīng)對策略并展望保存成效。
由于信息形成于獨立于政府之外的商業(yè)平臺,政務(wù)社交媒體信息的檔案化管理體現(xiàn)出對社會力量的依賴,正逐步實現(xiàn)不同層面的社會化參與,尤其表現(xiàn)為銜接自商業(yè)性文件中心的外包特色。目前的實踐主要體現(xiàn)為:
(1)平臺契約類。即由政務(wù)社交媒體信息形成主體,在政策法規(guī)、檔案機(jī)構(gòu)規(guī)章制度、機(jī)構(gòu)內(nèi)部管理規(guī)范的合規(guī)框架內(nèi),同社交媒體平臺達(dá)成平臺使用協(xié)議,對信息實現(xiàn)全流程管理。社交媒體信息形成主體以合約方式將信息管理一定程度上免費外包于平臺。美國與澳大利亞從聯(lián)邦到多個地方州均有采用這類管理模式[7-8]。以美國聯(lián)邦政府機(jī)構(gòu)為例,隨著總統(tǒng)換屆,奧巴馬2008年競選后在社交媒體平臺形成的白宮Twitter信息、視頻記錄等社交媒體信息,依據(jù)《聯(lián)邦文件法》與相關(guān)法規(guī),應(yīng)被及時移交、處置與保存,由此啟動針對奧巴馬及其團(tuán)隊的社交媒體檔案項目。依據(jù)NARA《公告2014-02》,一旦聯(lián)邦機(jī)構(gòu)在社交媒體上的信息被識別為聯(lián)邦文件,聯(lián)邦機(jī)構(gòu)需按照《聯(lián)邦文件法》等規(guī)定捕獲、管理、保存、利用好這些文件。在美國總統(tǒng)預(yù)算辦公室的推動下、國家檔案與文件署的專業(yè)指導(dǎo)下、各社交媒體平臺依據(jù)協(xié)議以及法律法規(guī)的配合下,社交媒體信息得以在線捕獲和移交保存。以Twitter為例,在Twitter的技術(shù)和開放接口支持下,奧巴馬的@POTUS賬戶在2017年1月20日由第45任總統(tǒng)啟用的同時,奧巴馬總統(tǒng)原有的Twitter信息一方面線上遷移至由NARA維護(hù)的新創(chuàng)立賬戶@POTUS44,同時在線下保存至國家檔案館[9]。
(2)商業(yè)托管類。即在當(dāng)前文件管理系統(tǒng)和網(wǎng)絡(luò)歸檔專業(yè)能力有限的情況下有償使用第三方商業(yè)機(jī)構(gòu)的服務(wù),由第三方商業(yè)機(jī)構(gòu)根據(jù)文件檔案管理相關(guān)法律法規(guī)以及機(jī)構(gòu)的特定需求開展服務(wù)。目前Archive Social、Archive it等機(jī)構(gòu)均對各國與地區(qū)的政府提供定制化服務(wù)[10]。以美國聯(lián)邦與地方政府較常使用的Archive Social 為例,它是政府社交媒體文件托管公司,有超過1,800個政府機(jī)構(gòu)客戶。它能做到嚴(yán)謹(jǐn)?shù)暮弦?guī)性,遵從聯(lián)邦層面的《信息自由法》《總統(tǒng)文件法案》等以及每個州的法律法規(guī),在文件必要捕獲、優(yōu)質(zhì)維護(hù)、提供利用如信息公開、回應(yīng)公眾請求等方面均有相應(yīng)產(chǎn)品。Archive Social能全天24小時自動持續(xù)捕獲Twitter、Facebook等8類社交媒體平臺信息,不同配置中形成的原始格式信息及其相應(yīng)元數(shù)據(jù)均能得以捕獲,從捕獲到保存都能實現(xiàn)其真實、完整、安全、可用;還能面向利用整合信息,以多元方式如關(guān)鍵詞、日期、內(nèi)容、標(biāo)簽等組織所捕獲信息。同時,Archive Social還提供個性化服務(wù),信息的鑒定、審核、保存、處置等均能根據(jù)各機(jī)構(gòu)的規(guī)則設(shè)置[11]。
對應(yīng)于由形成者分散式地對社交媒體信息進(jìn)行前期獨立的檔案化管理,由記憶機(jī)構(gòu)如檔案館、圖書館集中統(tǒng)籌建成長久的資源庫亦是較為普及的模式,這有賴多方支持:平臺的配合,保證開放技術(shù)接口與捕獲前、捕獲時的質(zhì)量;第三方機(jī)構(gòu)的工具、技術(shù)支持;信息形成者,確認(rèn)和許可捕獲范圍與處置方案。較典型的案例為:
(1)檔案館主導(dǎo)的社交媒體信息資源庫。英國、加拿大的檔案機(jī)構(gòu)均有相關(guān)實踐[12]。以英國國家檔案館為例,其依據(jù)《公共文件法》在2013年正式收集中央政府Twitter或YouTube賬戶發(fā)布的內(nèi)容。英國國家檔案館統(tǒng)籌整個項目規(guī)則制定和落實,是信息資源最終的保存者和提供利用者;MirrorWeb公司有償提供技術(shù)服務(wù),按照一定頻次爬取和捕獲相應(yīng)社交媒體上的內(nèi)容;英國中央政府各部門按照法律,許可其所發(fā)布的內(nèi)容被捕獲,且提供應(yīng)有支持,例如社交媒體上存在無法網(wǎng)頁爬取的內(nèi)容時,該部門應(yīng)主動報告部門文件管理官和國家檔案館,以評估是否應(yīng)以其他方法保存,從而確保歸檔的完整性;社會組織——互聯(lián)網(wǎng)記憶基金會對該歸檔項目提供資金支持[13]。
(2)圖書館主導(dǎo)的社交媒體信息資源庫。美國、中國、荷蘭均有相應(yīng)實踐,規(guī)模上更具代表性的則是美國與中國[14]。美國國會圖書館的Twitter檔案項目,2010年4月,美國國會圖書館與Twitter簽訂協(xié)議,協(xié)議規(guī)定Twitter公司將為國會圖書館提供公司從成立開始的tweets文本。項目主要開展如下方面的工作:①接收數(shù)據(jù)。2010年Twitter指定名為Gnip的公司來完成數(shù)據(jù)移交事務(wù),之后國會圖書館和Gnip 在移交“現(xiàn)行”tweets 的具體要求和流程上達(dá)成共識,移交工作于2011年開始。②建立穩(wěn)定與持續(xù)的Twitter 檔案館,這是指形成穩(wěn)定和可持續(xù)的方式獲取、保存與組織Twitter不斷增長的信息流。③探索實現(xiàn)Twitter收藏利用的方法,Twitter信息在數(shù)量、增速、內(nèi)容和形式等方面都對管理與技術(shù)提出了挑戰(zhàn),如何將這些海量信息整合成可供方便利用的資源需要研究[10]。項目把Twitter的收集對象主要分為3個階段:①對2006-2010年12月的Twitter文本進(jìn)行全部收集,這是簽訂合約時明確規(guī)定的;②以更加同步的時間接收Twitter 在2011 年之后形成的全部文本類信息;③2017年12月31日起,基于國會圖書館的收集政策有選擇地收集Twitter信息,形式上不再僅限于文本,而是包括視頻、圖片、音頻、鏈接等其他形式[15]。
中國國家圖書館“互聯(lián)網(wǎng)信息戰(zhàn)略保存項目”尚處于啟動期,在實踐數(shù)據(jù)上顯示有限。經(jīng)由網(wǎng)絡(luò)調(diào)研所收集的國家圖書館與新浪網(wǎng)對外公布的信息,項目亦有較充分的內(nèi)容:根據(jù)雙方在2019年4月19日簽署的合作協(xié)議,為實現(xiàn)對網(wǎng)絡(luò)時代社會記憶、人類文明的協(xié)同保存,中國國家圖書館將會統(tǒng)籌建設(shè)覆蓋全國的分級分布式中文互聯(lián)網(wǎng)信息資源采集與保存體系,并提供信息數(shù)據(jù)保存規(guī)范、遴選機(jī)制、服務(wù)需求及利用需求;新浪將會全力發(fā)揮自身技術(shù)優(yōu)勢與平臺優(yōu)勢,與中國國家圖書館加強(qiáng)數(shù)據(jù)對接,提供信息數(shù)據(jù)采集、保存、檢索、提取和挖掘等方面的技術(shù)支持;此外,國內(nèi)其他互聯(lián)網(wǎng)企業(yè)和機(jī)構(gòu)都可申請參與該戰(zhàn)略保存基地的共建中。在新浪微博上形成信息的各類主體所有已經(jīng)公開發(fā)布的博文,都將被該戰(zhàn)略保存基地采集和保存。據(jù)新浪統(tǒng)計,截至2018年12月,微博全站公開發(fā)布博文超過2,000 億條,圖片和視頻量超過500 億條,評論互動總量近5,000億,且新發(fā)布的內(nèi)容也會持續(xù)被保存[16]。
同互聯(lián)網(wǎng)的高度自組織特點相關(guān),網(wǎng)絡(luò)歸檔主體亦有大量的非政府組織與個人,其依賴社會贊助與各類專家獲得持續(xù)運營的資源提供兩類服務(wù):以第三方的名義捕獲各類社交媒體信息且提供信息利用服務(wù);在為機(jī)構(gòu)與個人自主收集提供工具的同時將這些機(jī)構(gòu)與個人轉(zhuǎn)換為公共資源貢獻(xiàn)方。全球最大的互聯(lián)網(wǎng)檔案館Internet archive和Andrew W.Mellon基金會資助的由美國馬里蘭大學(xué)、弗吉尼亞大學(xué)、Shift Design公司合作創(chuàng)建的DocNow項目是其中兩個代表性實踐[17]。
以Internet Archive 為例,作為全球最大的網(wǎng)絡(luò)信息保存服務(wù)型平臺,它的運營支持來自自身提供服務(wù)的收入、基金會和公眾捐贈。它所保存的社交媒體信息主要來自4方面。(1)Internet Archive每隔一段時間通過網(wǎng)頁快照存檔許可被抓取的信息,其中包括部分社交媒體網(wǎng)頁,部分以專題整合為“檔案集”,如“占領(lǐng)華爾街Flickr照片檔案集”存有15,103 張在Flickr 社交平臺上公開發(fā)布的照片。(2)Internet Archive 增值服務(wù)工具Archive it 幫助各類用戶依照需求捕獲、維護(hù)和利用自身的社交媒體信息,可共享至Internet Archive,截至目前Archive it已經(jīng)為16個國家共694個組織服務(wù),社交媒體信息是歸檔信息中的重要組成部分。(3)社交媒體平臺自主提供合作資源,如YouTube就貢獻(xiàn)了部分視頻;(4)公眾個人通過Archive-it和Wayback Machine保存自己或者他人的當(dāng)時的社交媒體信息,還可上傳自己已有的數(shù)字資源到“檔案集”中,如在美國國會圖書館的個人存檔項目中得到推薦使用。在技術(shù)開發(fā)過程中,圖書館提供了協(xié)助,如北歐五國圖書館同其合作研發(fā)信息采集軟件Heritrix[10,18]。公眾作為用戶利用其所保存資源的同時可通過打分、信息補(bǔ)充等方式完善資源,且可申請刪除已捕獲信息維護(hù)自身權(quán)益以及幫助平臺減少倫理與法理風(fēng)險。
縱觀國內(nèi)外現(xiàn)有的社交媒體信息保存實踐,均處于不完備的狀態(tài)中。政務(wù)社交媒體文件遲遲未有完整的政策規(guī)范明確其捕獲、鑒定、分類、長期保存的要求;社交媒體信息保存法律與標(biāo)準(zhǔn)尚未面向長期保存與即時處置的平衡予以制定;已經(jīng)得到捕獲的信息未能被有效整合與提供利用;社交媒體平臺與第三方保存機(jī)構(gòu)提供的只是暫存以及有限的保存功能,信息質(zhì)量維護(hù)力度不足。這很大程度在于社交媒體信息存檔是復(fù)雜的系統(tǒng)性事務(wù),更突顯出互聯(lián)網(wǎng)信息社會化保存需關(guān)注的多方挑戰(zhàn)。
社會化保存需應(yīng)對跨平臺、跨主體、跨時空的復(fù)雜信息,社交媒體僅受其傳播特性、用戶基數(shù)大、覆蓋領(lǐng)域廣泛、形式多樣以及平臺多元的影響都形成了大量復(fù)雜內(nèi)容與多種形式的信息。因而,就某個平臺的社交媒體信息而言,若要面向社會化保存匹配多元需求的信息:一方面,需大量齊全和動態(tài)升級的軟硬件基礎(chǔ)設(shè)施,包括存儲與運行設(shè)備、管理系統(tǒng)、網(wǎng)絡(luò)配置等,這要求大量的管理資源與經(jīng)費投入。另一方面,社會化保存的整體規(guī)劃、統(tǒng)籌和落實,需要不同層級人員,如高級主管和基層人員以及有著各類業(yè)務(wù)專長(包括信息、技術(shù)、法務(wù)、人文、管理等領(lǐng)域)的人才組成的團(tuán)隊,由此滿足整體項目的運行和保存這一專業(yè)事項從收集到提供利用的全流程要求。因而,社交媒體信息,尤其是在以構(gòu)筑整體網(wǎng)絡(luò)資源為目標(biāo)的情況下,絕非某類機(jī)構(gòu)可提供完整的保存資源。以美國國會圖書館為例,其項目公告中提及的一個重要挑戰(zhàn)就是難以配備充足的基礎(chǔ)設(shè)施,依據(jù)其自我評估,完成一個檢索任務(wù)需要24個小時才能完成,除非能投入成千上萬臺服務(wù)器[15]。更需說明的是,對我國而言,當(dāng)前僅是新浪一個平臺,首期要收集的新浪微博在2018年12月前就包括2,000多億公開博文與5,000億評論互動,之后還將隨著3億多用戶對平臺的持續(xù)使用不斷擴(kuò)充[16]。而微信、百度貼吧、豆瓣、知乎等社交媒體平臺尚未納入,且其他類型的互聯(lián)網(wǎng)應(yīng)用更不在其中。相比此后將隨著互聯(lián)網(wǎng)信息保存項目拓展的其他平臺,這僅是一小部分,所需資源更要通盤考慮和計算。
社交媒體被視作由多元主體共同生產(chǎn)與消費機(jī)制支撐的平臺,其信息的形成者、傳播者、利用者相互轉(zhuǎn)換和融合。一方面,內(nèi)容生產(chǎn)者與消費者互通互換,并同提供網(wǎng)絡(luò)服務(wù)的平臺形成多邊信息消費場景,平臺用戶通過平臺獲取信息的同時也貢獻(xiàn)信息于整體的資源建設(shè)。另一方面,不同主體形成的信息需融合才能組成某個主題或活動的完整記錄。例如,用戶發(fā)布的信息之下往往有其他用戶的評論、轉(zhuǎn)發(fā)和點贊信息,更依賴于平臺為信息提供的半結(jié)構(gòu)化形式配置。因而,在保證完整性立足關(guān)聯(lián)收集和提供利用信息的同時,社會化保存中不同主體之間的價值取向和利益沖突是需要克服的挑戰(zhàn)。一方面,形成者、保存者和利用者的立場與要求不同,信息權(quán)屬與隱私需界定和保障。已有實踐將用戶發(fā)布的公開信息納入保存的潛在范疇,那么法理上將個人或私人機(jī)構(gòu)所形成信息捕獲至公共機(jī)構(gòu)并提供利用是否侵犯其信息資產(chǎn),且一旦提供利用是否會違反形成者的意愿或造成倫理風(fēng)險,形成者為現(xiàn)行活動創(chuàng)建與公開信息是否就意味著允許面向未來的長久開放利用?另一方面,平衡共同形成者機(jī)制下不同形成者的權(quán)益與取向需從倫理上明晰人與信息的利益邊界,更要從法理層確定形成者與信息的權(quán)屬規(guī)則。例如,美國聯(lián)邦政府捕獲社交媒體信息時明確為保障13周歲以下兒童權(quán)益不公開與收集其評論[19];英國國家檔案館和美國國會圖書館認(rèn)為提供利用網(wǎng)絡(luò)信息的挑戰(zhàn)是如何識別和處置已收集但在平臺端被用戶刪除的信息[20]。
社交媒體信息保存是對信息內(nèi)容、背景、形式、有機(jī)聯(lián)系等要素的整體行動,它從整體到微觀都是以疊加和關(guān)聯(lián)形態(tài)呈現(xiàn)。微觀層,即使一條記錄,也有很大可能圍繞某個主體、某類事件同其他信息產(chǎn)生關(guān)系。宏觀層面,社會組織、機(jī)構(gòu)、群體以及個人在社交媒體平臺開展社會活動開展信息行為時也依托社會網(wǎng)絡(luò)產(chǎn)生互動,因而圍繞主體或活動產(chǎn)生整個社會的關(guān)聯(lián),這也是互聯(lián)網(wǎng)信息保存項目被視作構(gòu)建國家數(shù)字記憶的緣由所在。社交媒體平臺要作為整體關(guān)聯(lián)的資源庫得以持續(xù)運行且納入保存項目也需維護(hù)此特質(zhì),以幫助最大程度還原社交媒體信息所記錄下的多元場景、主體、活動以及相互之間的關(guān)聯(lián)。然而,上文所述關(guān)聯(lián)往往隱性嵌入信息對象及其元數(shù)據(jù)中。一方面,在捕獲的前端就需收集平臺主要信息關(guān)聯(lián)機(jī)制及其要素,如主體類型、社交網(wǎng)絡(luò)、內(nèi)容、時間、地點、活動,明確有哪些關(guān)聯(lián)且能夠與應(yīng)當(dāng)先捕獲哪些關(guān)聯(lián);另一方面,面向利用的整合過程中進(jìn)一步補(bǔ)全與提煉關(guān)聯(lián),通過技術(shù)與人工分析共同將其完整顯性化,從而將充斥碎片化信息的社交媒體信息庫轉(zhuǎn)化為有序化資源體系。然而,這些關(guān)聯(lián)的數(shù)量、類型、向度與深度的復(fù)雜使得難以被直接捕獲與整合,要求制定與動態(tài)升級相應(yīng)規(guī)則與技術(shù)方案。例如,Internet Archive 只能依據(jù)平臺或時間提供檢索結(jié)果,未能充分展示某個主體或某個事件的全貌,這在于信息之間的關(guān)聯(lián)在捕獲與整合時暫時難以整體構(gòu)建[18]。
社會化保存意味著不同保存力量的參與,它被視作由大眾書寫國家記憶的重要途徑。各類協(xié)作式實踐顯示多元力量參與的必然趨勢,社交媒體網(wǎng)絡(luò)服務(wù)提供商、形成者、記憶機(jī)構(gòu)、第三方社會機(jī)構(gòu)等涉及其中,但不同保存方存在立場、目標(biāo)、意識、能力、方法、資源的差異,協(xié)作是對各方記憶與遺忘的平衡,即使是同樣作為記憶機(jī)構(gòu)的圖書館和檔案館,都有不同之處。在這其中,保存什么、誰來保存、如何保存、保存的信息如何利用等都需要統(tǒng)籌與設(shè)計。當(dāng)下實踐中挑戰(zhàn)源于各方參與的過程缺乏協(xié)同或統(tǒng)一的框架。以Facebook 為例,保存由3 條主線組成:一是由平臺自主保存,采用了冷保存與共享式開發(fā)的策略;二是為用戶提供“檔案管理”功能,為形成的不同類別信息配備信息下載功能[21];三是Internet Archive會抓取部分網(wǎng)頁,F(xiàn)acebook已是其每年捕獲數(shù)量最多的15個網(wǎng)站之一。然而,三方各自展開保存行動,并未協(xié)同甚至形成了沖突。前二者同Internet Archive 基本相互獨立,沒有在方法、資源與平臺上協(xié)作,而Facebook同用戶作為保存者的矛盾更甚,引起平臺信任危機(jī),最典型的是Facebook向社會開放部分信息供開發(fā)使用,導(dǎo)致技術(shù)公司劍橋分析通過10多萬用戶信息關(guān)聯(lián)捕獲到8,000多萬相關(guān)用戶的信息用于美國總統(tǒng)競選,引發(fā)關(guān)于信息權(quán)和隱私的恐慌[22]。以英國國家檔案館的社交媒體檔案庫為例,在為2012年倫敦奧運會展開專項行動的過程中,由于Facebook沒有開放接口導(dǎo)致整個項目缺失了存有大量奧運會信息的記錄[5]。
由多主體形成的涵蓋社會多方面甚至跨平臺的全方位社交媒體信息向圖書館、檔案館、博物館、信息部門等提出多重復(fù)雜挑戰(zhàn),在以“全體”保存數(shù)字記憶的目標(biāo)下,面臨權(quán)益與義務(wù)、法理與倫理、技術(shù)應(yīng)用與開發(fā)等有待周全的事宜,互聯(lián)網(wǎng)信息社會化保存項目作為分支分階段項目的集成群將迎來更復(fù)雜的挑戰(zhàn)。同時,當(dāng)前實踐困境亦為制定對策提供方向,更是為記憶與信息機(jī)構(gòu)在數(shù)字轉(zhuǎn)型中立足網(wǎng)絡(luò)空間升級理論、方法、實踐能力顯示空間。
為匹配信息保存所需的軟硬件、文化、智力、財力等資源,社會化協(xié)同是必要途徑,即多元主體參與信息保存,依據(jù)各主體的特質(zhì)相應(yīng)定位,為不同方面的貢獻(xiàn)提供協(xié)同機(jī)制。當(dāng)前,我國基本形成了以圖書館、檔案館等記憶機(jī)構(gòu)領(lǐng)銜的互聯(lián)網(wǎng)信息保存機(jī)制,立法機(jī)構(gòu)、政府、網(wǎng)絡(luò)服務(wù)提供商、個人與機(jī)構(gòu)形成者、第三方服務(wù)機(jī)構(gòu)都有參與空間。
(1)信息與記憶機(jī)構(gòu)成為關(guān)鍵輔助者。在國家圖書館作為領(lǐng)導(dǎo)機(jī)構(gòu)的當(dāng)下,還應(yīng)納入其他圖書館、檔案館、博物館、信息部門等信息與記憶機(jī)構(gòu)形成記憶聯(lián)盟,以形成更加充分的資源推動互聯(lián)網(wǎng)信息保存項目的開展。不僅要做保存者,而且要通過全局性的頂層設(shè)計和行動計劃做統(tǒng)籌者、主動的收集者與指導(dǎo)員。
(2)形成者尤其是大眾是絕對參與主體,如果實現(xiàn)人人參與,那么人人都成為信息的記錄者、搬運工與管控人,他們不僅是信息的利用者或有限的參與者,而是成為一定程度或情境中的主導(dǎo)者,以眾包等形式分解復(fù)雜任務(wù)。
(3)立法與政府機(jī)構(gòu),可通過網(wǎng)絡(luò)空間的法律法規(guī)與規(guī)章制度來確定信息保存與處置要求,明確信息與數(shù)據(jù)權(quán)屬,確認(rèn)有哪些利益相關(guān)者及其相應(yīng)的權(quán)利與義務(wù),由此幫助互聯(lián)網(wǎng)信息保存項目確認(rèn)法理與倫理規(guī)則。
(4)網(wǎng)絡(luò)服務(wù)提供商作為信息的形成、傳播、存儲與暫時性保存平臺,應(yīng)在管理與技術(shù)上配合互聯(lián)網(wǎng)信息保存項目,既要保證信息真實、完整、安全、可用等可信屬性,亦要依據(jù)權(quán)屬完成信息的遷移、保存以及提供利用。
(5)第三方記憶機(jī)構(gòu),可為互聯(lián)網(wǎng)信息保存項目提供資源與技術(shù)支持,如可同Internet archive交流合作使用相關(guān)技術(shù)實現(xiàn)對信息的捕獲、整合以及提供利用。
為保障多元主體參與,多層級多類型的制度幫助明確利益機(jī)制與規(guī)則是要務(wù)。當(dāng)前我國圍繞網(wǎng)絡(luò)空間信息形成《中華人民共和國網(wǎng)絡(luò)安全法》《互聯(lián)網(wǎng)個人信息安全保護(hù)指南》《全國人民代表大會常務(wù)委員會關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定》《互聯(lián)網(wǎng)信息內(nèi)容管理行政執(zhí)法程序規(guī)定》GB/T 35273-2017《信息安全技術(shù) 個人信息安全規(guī)范》《微博客信息服務(wù)管理規(guī)定》《即時通信工具公眾信息服務(wù)發(fā)展管理暫行規(guī)定》等政策法規(guī)。基于現(xiàn)有制度,兩大方面的補(bǔ)足是當(dāng)下互聯(lián)網(wǎng)信息保存項目可獲得實質(zhì)性持續(xù)推進(jìn)的重中之重。
一方面,政策法規(guī)的內(nèi)容覆蓋面應(yīng)持續(xù)拓展。首先,信息管理流程上應(yīng)從形成與傳播層面拓展至更加全面深入的保存段,當(dāng)前政策法規(guī)主要是規(guī)范信息與傳播環(huán)節(jié),但信息形成與傳播之后的捕獲、遷移、處置、維護(hù)、保存等一系列跟保存相關(guān)的事宜除了在安全維護(hù)上有一定涉及外基本無相關(guān)內(nèi)容,這是政策法規(guī)應(yīng)拓展的部分。其次,從個人信息擴(kuò)充至體量更大的內(nèi)容信息,即用戶開展社會活動在社交媒體所形成的各類記錄,內(nèi)容信息的價值是作為用戶證據(jù)、記憶、資產(chǎn)、資源所必要管理的一方面,而內(nèi)容信息的失真失存失當(dāng)利用給利益相關(guān)者帶來的損失亦是內(nèi)容信息保存應(yīng)得到規(guī)范的原因。最后,社交媒體信息保存利益相關(guān)者應(yīng)當(dāng)在政策法規(guī)層面得到確認(rèn),即保存相關(guān)方如記憶機(jī)構(gòu)、形成者、第三方機(jī)構(gòu)、網(wǎng)絡(luò)服務(wù)提供商等應(yīng)予以識別并從權(quán)利與義務(wù)上明晰邊界與具體內(nèi)容。
另一方面,以政策法規(guī)為中間層進(jìn)行層級拓展。首先,在頂層設(shè)計上實現(xiàn)國家級的戰(zhàn)略導(dǎo)引與部署,國家數(shù)字記憶的提法呈現(xiàn)了一定的頂層戰(zhàn)略性,但互聯(lián)網(wǎng)信息的證據(jù)、資產(chǎn)、資源價值應(yīng)當(dāng)同樣體現(xiàn),并同網(wǎng)絡(luò)空間治理、安全以及網(wǎng)絡(luò)命運共同體等進(jìn)一步關(guān)聯(lián),且與人工智能、智慧城市等規(guī)劃連接,由此從國家層面倡導(dǎo)互聯(lián)網(wǎng)信息的社會化保存,并實現(xiàn)階段性目標(biāo)設(shè)置與具體規(guī)劃。其次,豐富規(guī)范與指南制定,幫助不同主體在有意識參與的前提下明確可以提供何種貢獻(xiàn)以及如何行動以貢獻(xiàn)于互聯(lián)網(wǎng)信息的社會化保存,從目標(biāo)、原則、方法、流程、保障等多方面明晰具體要求。最后,增加不同主體圍繞互聯(lián)網(wǎng)信息保存的協(xié)議建設(shè)。例如,平臺提供的服務(wù)協(xié)議要加強(qiáng)信息保存的內(nèi)容且要符合專業(yè)管理要求,而機(jī)構(gòu)形成者更要同社交媒體平臺達(dá)成合約確定信息歸屬,社交媒體平臺、用戶、記憶機(jī)構(gòu)亦要通過協(xié)議確認(rèn)保存以及利用社交媒體信息的權(quán)責(zé)等,由此能夠?qū)⒉煌黧w的保存需求與所能提供的貢獻(xiàn)精準(zhǔn)融合于協(xié)同機(jī)制中以落實到具體實踐層,從而確?;ヂ?lián)網(wǎng)信息保存項目有“契約”依據(jù)。
依據(jù)我國網(wǎng)絡(luò)歸檔現(xiàn)狀以及互聯(lián)網(wǎng)信息保存項目的基本路徑,保存能力在整體關(guān)聯(lián)的前提下表現(xiàn)為:一方面,在能力建設(shè)上顯示為互聯(lián)網(wǎng)信息保存各利益相關(guān)者的識別、關(guān)聯(lián)與協(xié)作,這包括信息的形成者與傳播者、提供服務(wù)的互聯(lián)網(wǎng)平臺、具有專業(yè)能力的信息與記憶機(jī)構(gòu)、有意參與的具有資源的第三方社會機(jī)構(gòu)等?;ヂ?lián)網(wǎng)信息保存絕非一方可獨立完成的任務(wù),他們既要形成面向整體的多元協(xié)作主體群,亦要明確信息與記憶機(jī)構(gòu)在專業(yè)前沿和使命擔(dān)當(dāng)上的示范性。另一方面,這些主體要共同構(gòu)建出的能力在內(nèi)容上表現(xiàn)為兼具信息管理、技術(shù)應(yīng)用、人文素養(yǎng)的系統(tǒng)整體。信息管理是互聯(lián)網(wǎng)信息社會化保存的核心,即保存哪些信息、具體流程與環(huán)節(jié)、相應(yīng)規(guī)范和標(biāo)準(zhǔn)等都在互聯(lián)網(wǎng)文化與技術(shù)情境中得到細(xì)化與建構(gòu),以此解決如何做的問題;技術(shù)應(yīng)用是強(qiáng)化實踐技能,將互聯(lián)網(wǎng)信息保存如何做的問題通過開發(fā)和應(yīng)用各類技術(shù)予以輔助乃至落實;人文素養(yǎng)則是幫助明確互聯(lián)網(wǎng)信息保存的方向,在協(xié)作中明晰相互邊界,在信息內(nèi)容與信息管理分工上協(xié)調(diào)好法理和倫理沖突。具體能力建設(shè)將分成通用與專業(yè)能力建設(shè)兩大層面。
(1)作為形成協(xié)同的主體群,文化培育與素養(yǎng)建構(gòu)是重點。文化培育上,要確保各主體參與信息保存且發(fā)揮主觀能動性以落實于合規(guī)有效的行動,這為互聯(lián)網(wǎng)信息保存項目提供認(rèn)識基礎(chǔ)。一方面,信息文化應(yīng)得到貫徹,即在國家層面完成自上而下的信息作為證據(jù)、記憶、資產(chǎn)、資源的認(rèn)知構(gòu)建,推動各類主體將信息保存作為必要的社會活動進(jìn)行開展。另一方面,參與文化需得以培育,即各主體能認(rèn)識到互聯(lián)網(wǎng)信息保存是社會共建的事務(wù),不僅能夠主動參與,而且能知道在協(xié)同框架內(nèi)各有分工,積極和有效的參與是重點。素養(yǎng)建構(gòu)是信息保存從意識落實于有效行動的關(guān)鍵,即各主體能夠理解信息保存的內(nèi)涵、要求、自身定位以及實踐要領(lǐng),這就更加要求圖書館等信息與記憶機(jī)構(gòu)作為推動者組織形成互聯(lián)網(wǎng)信息保存框架,包括滿足不同需求的法律、政策、標(biāo)準(zhǔn)、原則與方案等。
(2)作為互聯(lián)網(wǎng)信息保存項目的領(lǐng)導(dǎo)者,國家圖書館及其組織的記憶聯(lián)盟更應(yīng)加強(qiáng)能力建設(shè)。兩大方面尤其要得到強(qiáng)化:一方面,信息保存專業(yè)能力。當(dāng)前信息管理理論與方法已不完全適用于互聯(lián)網(wǎng)信息的整體關(guān)聯(lián)保存。可針對不同應(yīng)用如社交媒體試點多元方案,根據(jù)互聯(lián)網(wǎng)信息的特質(zhì)、保存目標(biāo)、保存要求等形成相適應(yīng)的模式,由此需要的是在專業(yè)能力上重構(gòu)信息管理理論與方法,并完成流程再造。另一方面,技術(shù)應(yīng)用與開發(fā)能力。互聯(lián)網(wǎng)信息保存依賴于技術(shù)支持,能夠識別技術(shù)需求并應(yīng)用合適技術(shù)是信息與記憶機(jī)構(gòu)不可或缺的能力,同時能夠?qū)⒓夹g(shù)使用于互聯(lián)網(wǎng)信息保存的具體場景中,且必要時面向?qū)I(yè)需求完成部分技術(shù)的自主升級甚至開發(fā)。
互聯(lián)網(wǎng)信息保存不是一蹴而就的命題,更非即時完成的任務(wù),只有這樣的理解,才能將目標(biāo)與規(guī)劃精準(zhǔn)融合。因而,認(rèn)識與行動都要有相應(yīng)策略。
(1)理解互聯(lián)網(wǎng)信息保存是復(fù)雜任務(wù)的內(nèi)涵。它的復(fù)雜性在于:一方面,互聯(lián)網(wǎng)信息保存是跨網(wǎng)絡(luò)場景與應(yīng)用的,即面向不同功能的網(wǎng)絡(luò)平臺以及利用主體,其信息背景、內(nèi)容與形式均各有特點,實現(xiàn)全體或大部分保存是極為艱巨的任務(wù)。例如,即使是新浪微博這一單獨的社交媒體信息保存已呈現(xiàn)各種挑戰(zhàn),而新浪微博只是眾多平臺的一個,充分的資源與能力有待長久的建構(gòu)。另一方面,互聯(lián)網(wǎng)處于“生長”中,它并非固化于當(dāng)下的形態(tài),而是隨著社會與技術(shù)發(fā)展而變換,其形成的信息隨之在背景、內(nèi)容、形式上發(fā)生變化,保存要求亦需要調(diào)整保存理論、方法與具體方案,這將隨著互聯(lián)網(wǎng)的發(fā)展而持續(xù)。
(2)有效規(guī)劃是應(yīng)對關(guān)鍵?;ヂ?lián)網(wǎng)信息保存作為復(fù)雜任務(wù)絕非一個時間段與一個方案可簡單完成,而是需要精密部署形成有效規(guī)劃:一方面,確認(rèn)保存目標(biāo)以明晰方向、原則與方法,從而依據(jù)時空設(shè)定保存范圍與行動階段。例如,總體目標(biāo)是哪類信息的保存、項目分為幾期、平臺選擇標(biāo)準(zhǔn)等都應(yīng)納入頂層設(shè)計中。另一方面,面向未來的具體行動規(guī)劃亦是必要,即確認(rèn)清楚每一階段的策略、維度與實施路徑。例如,在無法周全所有平臺的情況下可選定重點的網(wǎng)絡(luò)應(yīng)用類型與相應(yīng)的代表性平臺。
互聯(lián)網(wǎng)信息社會化保存已是數(shù)字轉(zhuǎn)型背景下社會記憶建構(gòu)的重要方面,是人類記憶由國家書寫走向社會書寫的關(guān)鍵方面,在當(dāng)前社交媒體從官方組織、社會機(jī)構(gòu)、群體以及個人相互協(xié)作又各有主導(dǎo)的多元實踐中呈現(xiàn)了探索進(jìn)程、挑戰(zhàn)與發(fā)展方向。本文基于社交媒體存檔實踐從資源、主體、對象、方式等維度顯示了互聯(lián)網(wǎng)信息保存的復(fù)雜性,對應(yīng)提出組建完備資源、強(qiáng)化制度建設(shè)、構(gòu)建保存能力、部署連續(xù)性行動的具體策略。同時,限于互聯(lián)網(wǎng)信息社會化保存涉及信息、管理、司法、人文、技術(shù)等多方面的復(fù)雜性,既要求理論上深化跨學(xué)科的升級闡釋,又要求更多實踐數(shù)據(jù)的收集分析,有待更全面深入的研究。