周文泓 賀譚濤 黃小宇 文利君
(四川大學公共管理學院 成都 610064)
社交媒體信息存檔于全球正從價值確認、戰(zhàn)略設(shè)計走向有效行動的落實,以此推進信息資源與資產(chǎn)的長久保存。美國國家檔案與文件署(以下稱NARA)2011年發(fā)布《社交媒體文件管理指南》、澳大利亞國家檔案館(以下稱NAA)為政府機構(gòu)解答社交媒體信息捕獲問題、英國國家檔案館(以下稱TNA)形成社交媒體檔案庫、我國國家檔案局在《重大活動和突發(fā)事件檔案管理辦法》中提及保管社交媒體信息等行動顯示了社交媒體信息正成為存檔對象的重要門類落于實踐進程中。依據(jù)實踐對外發(fā)布的信息,這項任務(wù)極為艱巨,具體的挑戰(zhàn)與影響點尚在識別與解析之中,關(guān)于檔案館應(yīng)存檔哪些社交媒體信息、以怎樣的方式存檔、如何實現(xiàn)長久保存和有效利用等有待充分的實踐解析與理論指導。
研究層面,相關(guān)理論成果中檔案館的視角顯著。首先,檔案館應(yīng)在存檔社交媒體信息發(fā)揮作用從檔案館保存文化遺產(chǎn)與社交媒體信息豐富的證據(jù)與記憶價值得到明確[1]。其次,檔案館在社交媒體信息存檔中體現(xiàn)的主要功能被設(shè)定為或是作為存取基地或是面向社會提供社交媒體信息存檔指導[2]。最后,對于檔案館社交媒體信息存檔模式的探討,主要圍繞政務(wù)類社交媒體信息或重大事件社交媒體信息展開論證與設(shè)計,涵蓋從捕獲到保存等多個存檔的過程性環(huán)節(jié)[3]。同時,關(guān)于如何存檔亦從引入社會力量、強化自身專業(yè)與技術(shù)能力、適當拓展面向社會的存檔范圍等策略展開如何做的討論[4]。然而,研究多限于基于社交媒體信息推導對應(yīng)的存檔情境從而指出該情境下檔案館存檔社交媒體信息的方法與策略,或是對有限案例形成經(jīng)驗啟示,缺乏對實踐更全面與深入的數(shù)據(jù)收集以及分析。
因而,本文將對全球范圍內(nèi)檔案館的社交媒體存檔項目展開調(diào)查,通過檔案網(wǎng)站搜集、搜索引擎檢索、文獻調(diào)研等方式明確提供公開信息的相關(guān)實踐。經(jīng)過所獲取實踐信息的梳理與整合,明確檔案館存檔社交媒體信息的總體特征,由此形成面向未來的優(yōu)化策略。
依據(jù)檔案館在存檔主體機制所體現(xiàn)出的功能定位與關(guān)聯(lián)方的不同,對應(yīng)于不同模式的實踐進展為:
在這類模式之下,檔案館作為信息管理的專業(yè)方同信息形成者主要是業(yè)務(wù)指導與被指導的關(guān)系,社交媒體信息由形成者捕獲,然后依據(jù)保管價值與年限由檔案館在一定時間后接收部分信息進行長久保存。
這類實踐的代表為NARA與NAA,面向政府機構(gòu)分別提供《使用Web2.0和社交媒體網(wǎng)站的規(guī)則和內(nèi)容管理職責》[5][6]等政策,指導信息形成者展開具體的捕獲與管理工作。具體而言,以奧巴馬總統(tǒng)社交媒體檔案項目為例[7],NARA展開的具體行動及其成果表現(xiàn)在兩個方面:一方面,指導美國聯(lián)邦政府主要為白宮辦公室形成符合聯(lián)邦法規(guī)與社交媒體信息特性的存檔方案,例如將奧巴馬總統(tǒng)所形成的社交媒體的信息全部遷移至新建賬戶中,且賬戶的對應(yīng)信息例如關(guān)注者與被關(guān)注者同樣遷移,在保證美國總統(tǒng)賬號更新使用的前提下最大程度維護其檔案特性與在線開放。另一方面,依照聯(lián)邦法規(guī),總統(tǒng)卸任后要將在任期間有檔案價值的那部分記錄移交至檔案館,因而奧巴馬總統(tǒng)的社交媒體信息作為具有重要價值的內(nèi)容同樣要由NARA接收一份,從而保障這些信息的長久保存與可用。由此,通過采用ArchiveSocial公司的服務(wù),已形成名為“ArchiveSocial's Search Box”的可供檢索的數(shù)據(jù)庫,目前該數(shù)據(jù)庫中共整合了100多個奧巴馬政府官方社交媒體共享的超過25萬條的社交媒體信息。
于這種模式之中,檔案館作為信息遺產(chǎn)的保管者,主動識別社交媒體信息對象,依據(jù)自主設(shè)定的存檔范圍對社交媒體信息進行捕獲直接納入檔案資源中。
這類模式的實踐主體一是公共檔案館,如TNA、美國北卡羅萊納州檔案館均是此類實踐。除了熟知的TNA在網(wǎng)絡(luò)檔案庫的實踐基礎(chǔ)上形成以Twitter、YouTube、Flicker平臺為主的面向中央政府機構(gòu)賬戶的社交媒體檔案庫外,北卡羅萊納州亦有相近實踐。北卡羅萊納州檔案館意識到以Twitter、Facebook為主的社交媒體集中了龐大的用戶群體,使得社交媒體成為改善政府和用戶之間互動性的重要渠道,由此而產(chǎn)生的大量互動信息需要得到合理安排。為此,北卡羅萊納州檔案館開展了“social media archive”項目[8],旨在提供對該州法律規(guī)定的或與公共業(yè)務(wù)相關(guān)機構(gòu)的社交媒體信息的免費訪問。項目團隊協(xié)同社會第三方存檔公司ArchiveSocial,利用其技術(shù)進行歸檔。具體而言,項目團隊利用快照技術(shù)對社交媒體信息進行自動歸檔,并捕獲HTML核心數(shù)據(jù)。此外,為了保證社交媒體信息的真實性和完整性,項目團隊還以其原始格式保存了網(wǎng)頁的底層元數(shù)據(jù),并將上述數(shù)據(jù)存儲在云端。最后,利用公共訪問門戶OpenArchive提供對相關(guān)信息的訪問。目前項目團隊已經(jīng)歸檔了特定機構(gòu)的數(shù)十萬條社交媒體信息,涵蓋文本、圖片和視頻等多種形式。歸檔的社交媒體信息來自Twitter、Facebook、Flickr等平臺,從內(nèi)容上看主要為有關(guān)該州的歷史、新聞和公共文件等內(nèi)容,這些內(nèi)容已作為檔案進行開放,訪問者可以按照關(guān)鍵詞、日期、信息所屬平臺、文本和賬戶對社交媒體進行篩選。
另一實踐主體則是高校檔案館,它的主要服務(wù)對象是所屬高校,同時也關(guān)注留存所在社區(qū)或地域的記憶材料。以杜克大學檔案館為例,杜克大學檔案館旨在識別、獲取、管理和保存具有持久價值的大學記錄,并根據(jù)杜克大學董事會,行政管理和教職員工批準的政策使這些記錄可供使用。為此,在2011年,杜克大學檔案館開始開展“大學檔案館網(wǎng)絡(luò)收藏”項目[9],有選擇地將網(wǎng)絡(luò)和社交媒體內(nèi)容添加到他們的館藏中。這一項目存檔的對象大多數(shù)是杜克大學的附屬網(wǎng)絡(luò)站點,這些站點建立在杜克大學擁有的域上,或者建立在附屬辦公室、部門或組織的外部平臺上。存檔內(nèi)容涉及行政辦公室、學術(shù)部門、運動隊、公共關(guān)系辦公室、出版物和學生組織的網(wǎng)絡(luò)資源,還包括一些與個人教師有關(guān)的網(wǎng)站,涉及杜克社區(qū)成員的爭議以及與學生積極性有關(guān)的網(wǎng)絡(luò)內(nèi)容,其中包括Twitter,F(xiàn)acebook和Instagram等社交媒體相關(guān)內(nèi)容。該項目使用Internet Archive的Archive-It服務(wù)、Social Feed Manager(SFM)和Twitter Archive Google Service(TAGS)來收集網(wǎng)站和社交媒體,捕獲和保存基于Web的數(shù)字內(nèi)容。收集的內(nèi)容以網(wǎng)絡(luò)快照的形式在Archive-It的網(wǎng)站和杜克大學檔案館網(wǎng)站的收藏指南或目錄記錄中予以開放,部分收集的內(nèi)容也被杜克大學檔案館進行二次開發(fā)以杜克大學年鑒的形式呈現(xiàn)。
在這樣的模式下,檔案館作為記憶機構(gòu)聯(lián)盟的一員,依據(jù)其在所處聯(lián)盟中的地區(qū)、專長、資源等方面的定位合作制定存檔方案、展開存檔行動,共建更加全面完整的社交媒體檔案資源體系。
在全球的社交媒體存檔項目中,以記憶機構(gòu)聯(lián)盟的形式展開的實踐不在少數(shù),例如TNA與大英圖書館合作而各自分工存檔不同賬戶的奧運會相關(guān)信息,從而在資源配置與工作量分解的前提下形成更完整的英國2012年奧運會的社交媒體檔案集。當前,最具全球影響力的則是IIPC(全球互聯(lián)網(wǎng)保存聯(lián)盟),英、美、加拿大等國的檔案館均在其中。具體來說,圍繞社交媒體信息的存檔有兩類情況:一是存檔項目的中包含社交媒體信息,二是項目以社交媒體信息存檔為中心。以“Novel Coronavirus (COVID-19)”項目[10]為例,于實施過程,本項目由來自各檔案館與圖書館人員組成的內(nèi)容開發(fā)工作小組負責,同其他各環(huán)節(jié)工作組協(xié)作,從存檔內(nèi)容的選擇、采集、存儲、利用方面進行全流程的質(zhì)量控制和技術(shù)支持。于成果來說,現(xiàn)已存的近萬個網(wǎng)站中含有千萬條標準化數(shù)據(jù),其中社交媒體類網(wǎng)站近四百個,涵蓋了起源、傳播、醫(yī)學等各類內(nèi)容。用戶可瀏覽、檢索或分類篩選相關(guān)數(shù)據(jù),同時可提名網(wǎng)站以共建疫情檔案。
現(xiàn)有實踐顯示出檔案館的社交媒體信息存檔有如下特征,并表明當前的成效與挑戰(zhàn)在于:
在存檔信息對象層面,檔案館的存檔范圍體現(xiàn)出兩個方面的趨向:一方面,延續(xù)檔案館傳統(tǒng)定位,以官方記錄主導下的信息資源建設(shè)為基本方向。因而,相比于圖書館或是社會第三方記憶機構(gòu),檔案館的存檔主要面向能反映所在國家、地區(qū)或是組織的管理主體業(yè)務(wù)活動的信息。美國、澳大利亞、英國等均是在此前提下明確哪些應(yīng)當作為檔案館的檔案納入管理范疇。從存檔結(jié)果來看,主要的資源構(gòu)成還是以官方機構(gòu)所形成的信息為主。例如,英國的社交媒體檔案庫只針對政府賬戶捕獲信息。
另一方面,社交媒體的信息與傳播機制弱化了信息的公私邊界,促使檔案館的社交媒體信息存檔向社會范疇拓展。一是在于官方機構(gòu)于社交媒體平臺并非單向傳播,而是同社會不同類型的組織、群體或個人產(chǎn)生互動,甚至官方機構(gòu)并非發(fā)起方而是回應(yīng)方,結(jié)果是公私交疊的信息。二是重大事件作為社交媒體的信息生成與傳播的重要據(jù)點,同樣會通過輿情效應(yīng)成為官方機構(gòu)的發(fā)聲對象,公私邊界的區(qū)分會破壞事件記錄的完整性與真實性。在這樣的背景下,檔案館的社交媒體信息存檔同樣涉及私人記錄。例如,北卡羅萊納州檔案館所捕獲的就是同北卡羅萊納州相關(guān)的歷史敘述、新聞報道、公共文件、“檔案館怪談”、軍事有關(guān)的信息,這些內(nèi)容包含了官方機構(gòu)以外形成的記錄。
檔案館作為社交媒體信息存檔重要的實踐主體有兩個關(guān)鍵定位,這在實踐中得到充分體現(xiàn):一是檔案館作為專業(yè)的信息長久存取基地,有其職責與方法展開具有專屬特色的社交媒體信息存檔實踐。這意味著同圖書館、博物館以及其他信息或記憶機構(gòu)等同樣有責任與能力存檔社交媒體信息的相關(guān)方相比,檔案館的立場、方案以及目標均有所不同。例如,檔案館的存檔實踐中,同圖書館相比,信息主要來源于官方機構(gòu)且可由形成者依據(jù)法律法規(guī)自主完成存檔后移交至檔案館,同時對信息的權(quán)威性有更高要求。
二是檔案館的存檔實踐同樣處于社交媒體信息存檔所倡導的協(xié)作框架下,檔案館主導不代表孤立。一方面,社交媒體信息遍布各個平臺形成于大基數(shù)的多元群體,檔案館同其他信息或記憶機構(gòu)在屬性相近但各有職責的情況下分工完成對信息的存檔有助于優(yōu)化資源配置。例如TNA與大英圖書館等已有近20年采用這樣的協(xié)作方法,既有助于保持各自的獨立性,又有效的促進了信息相對完整的存檔。另一方面,社交媒體信息存檔的復雜性意味著對存檔方的跨領(lǐng)域能力要求,檔案館正成為統(tǒng)籌者與決策者而將行動執(zhí)行“外包”于社會力量,例如archive social、archive it等社交媒體信息存檔的商業(yè)服務(wù)提供商都出現(xiàn)于上述實踐中,公眾提名重要的社交媒體信息也在部分事件中顯示。
社交媒體信息作為新類型的電子文件或網(wǎng)絡(luò)信息需要存檔方法的適應(yīng)性調(diào)整,這于學術(shù)研究與理論探索中都明確了必要性,從多元化的實踐亦可看出方法建構(gòu)正在進程中。然而,對比于網(wǎng)絡(luò)信息存檔已有較充分的制度與技術(shù)保障,社交媒體信息存檔尚未在檔案館的實踐中建構(gòu)系統(tǒng)方法以面向具體行動形成工具體系。一方面,制度性的工具依據(jù)調(diào)查有一定的缺失。社交媒體信息的背景、形式與內(nèi)容呈現(xiàn)的新特征使得當前的制度未能完全對照使用,存檔哪些信息、由誰存檔、具體流程及其行動要求如何等缺乏依據(jù)。例如,NARA在2014年提出要針對社交媒體信息更新分類方案與保管期限表,但至2020年依舊未形成可供使用的具體方案。
另一方面,在網(wǎng)絡(luò)信息存檔的啟示下可發(fā)現(xiàn),自動化與半自動化的存檔是關(guān)鍵,這同樣適合于社交媒體信息存檔的技術(shù)性工具要求,從而能夠處理復雜的信息要素。然而,當前檔案館主要依賴于技術(shù)外包,除商業(yè)機構(gòu)外,也主要是高?;蚱渌谌綑C構(gòu)形成部分工具,但是否滿足檔案館要求與檔案特性就存有質(zhì)疑空間。
實踐成效從多樣化存檔成果得以顯現(xiàn),同樣也呈現(xiàn)了完善空間:
一方面,社交媒體信息存檔成果的多元可能性得到體現(xiàn)。以簡單歸類形成初級有序資源如依照平臺類型、日期、賬戶、信息形式進行組織的分類信息,由具體主題形成專題匯集資源如政治、文體、科教以及突發(fā)事件專題,強化挖掘與設(shè)計形成知識化產(chǎn)品和服務(wù)等顯示了從社交媒體碎片化信息到檔案資源的多樣性與深度。例如,奧巴馬總統(tǒng)檔案既留存了“原始”的賬號信息與運營內(nèi)容,也依托社會化開發(fā)形成文本、圖片、視頻等多形式挖掘的產(chǎn)品。
另一方面,存檔成果依舊存有較多局限,重點體現(xiàn)在兩方面:一是資源量有限,相比于總體的社交媒體信息量與社交媒體信息內(nèi)涵的豐富構(gòu)件,當前的存檔結(jié)果是極小的比例。即使是只關(guān)注官方機構(gòu)的社交媒體信息,所存檔的也只是部分賬戶中的部分內(nèi)容。例如,TNA捕獲的只是賬戶發(fā)布的主體信息,轉(zhuǎn)發(fā)、評論類信息沒有納入其中。二是從信息到檔案的整合力度有限,多數(shù)檔案館只做到初級的分類,既無向細顆粒度延伸的數(shù)據(jù)集提取,也缺乏面向數(shù)字產(chǎn)品的開發(fā)。
社交媒體信息納入檔案資源體系實現(xiàn)長久保存與利用已是必然趨勢,社交媒體存檔已從10年前的是否應(yīng)當存檔的討論與構(gòu)想走向具體行動,檔案館依舊發(fā)揮著重要作用。于我國而言,隨著政府網(wǎng)站歸檔已有明確的國家級政策規(guī)范指導,面向“互聯(lián)網(wǎng)+”延伸的社交媒體信息亦將是未來的資源建設(shè)對象,全球范圍內(nèi)的實踐為此提供了有效的經(jīng)驗對照:
范圍與具體對象的明確是檔案館存檔社交媒體信息的顯性挑戰(zhàn),這在于社交媒體信息有著多元的背景、形式與內(nèi)容,其類別與價值難以確認,且海量信息的存檔也會造成對檔案館的資源與能力負擔。從現(xiàn)有實踐來看,存檔對象盡管各有不同,但策略相近,即對照檔案館條件確認具體存檔對象:
一方面,從檔案館的職能出發(fā),實踐中或是協(xié)同形成者、或是自主存檔、或是聯(lián)合其他信息與記憶機構(gòu),均是對應(yīng)不同國家與地區(qū)的檔案館定位,而官方機構(gòu)信息為主的存檔范圍更是對接于檔案館的特性。因而,在我國檔案館黨政屬性顯著的情況下,除政務(wù)類信息,黨委系統(tǒng)的官方記錄同樣要考慮納入存檔范疇。
另一方面,檔案館自有的工作方法亦要得到遵循,關(guān)于對檔案與檔案管理的理解要融合于存檔對象的明晰中。盡管社交媒體信息關(guān)聯(lián)繁雜且內(nèi)在構(gòu)件多,但在現(xiàn)有管理條件下需要面向檔案屬性進行選擇,這取決于不同檔案館的認知與對應(yīng)方法,如TNA只捕獲機構(gòu)發(fā)布的主體信息而非所獲評論在于他們認為主體信息才具有檔案價值。因而,于我國而言,社交媒體信息存檔范圍的確認應(yīng)對照《檔案法》中的規(guī)定和工作傳統(tǒng)來辨識應(yīng)成為檔案的那部分社交媒體信息。
檔案館絕非社交媒體信息存檔單一主體在理論與實踐上均獲得相近共識,多元主體協(xié)同輔助檔案館及時、有效、優(yōu)質(zhì)達成社交媒體信息存檔目標被視作根本策略。于檔案館而言:
一方面,認同并搭建以檔案館主導的協(xié)作機制。現(xiàn)有實踐顯示出這在于要識別有效的輔助力量,包括共建單位、眾包方、存檔服務(wù)提供商等。于我國而言,將互聯(lián)網(wǎng)信息保存納入業(yè)務(wù)范疇的國家圖書館、數(shù)字文件與檔案管理系統(tǒng)開發(fā)商、學術(shù)機構(gòu)、以及公民等都是潛在力量,關(guān)鍵的是要形成相關(guān)政策與規(guī)范來確定不同力量參與檔案館社交媒體信息存檔的流程、具體要求和機制。
另一方面,檔案館的功能升級,即如果一部分工作如存檔對象識別和系統(tǒng)開發(fā)交托于社會,那么檔案館的業(yè)務(wù)內(nèi)容亦要調(diào)整。于我國而言,檔案館作為資源存取基地的重要功能不僅是要做好保管利用工作,而且要作為信息資產(chǎn)的守護者拓展出統(tǒng)籌、協(xié)調(diào)、監(jiān)督的功能。這涉及到存檔治理框架即完整規(guī)則的確定、面向不同協(xié)作力量的對接機制建立、以及具體存檔流程中的全程管控。
制度和技術(shù)是行動得以啟動和持續(xù)的保障,是對存檔方法系統(tǒng)化的表達。在制度層,NARA與NAA在2011年起就著手于政策制定來解答社交媒體信息存檔的共性問題并提出要考慮的挑戰(zhàn),這對于存檔有著有效的行動指導與問題引導。而技術(shù)層的缺失則是當前檔案館實踐進展有限的原因之一。
因而,于我國而言,形成系統(tǒng)的存檔方法是需要重點探索的方向,這需要制度與技術(shù)的雙重融合加以實現(xiàn)。一方面,這指向了整體保障應(yīng)包含怎樣的內(nèi)容,制度作為規(guī)則與技術(shù)滿足規(guī)則所需的相互關(guān)系需要在未來進一步利用以實現(xiàn)高效的保障體系建設(shè),這需要規(guī)則為技術(shù)開發(fā)提供事無巨細的需求分析,亦要技術(shù)開發(fā)牽引制度層設(shè)定規(guī)則時對主體、對象、行動內(nèi)容、成果等方面的綜合考慮和平衡。另一方面,整體保障的建立策略同樣要得到考慮,涉及從法律法規(guī)到標準規(guī)范面向?qū)I(yè)共同體的意見征集、不同主體的力量綜合使用如技術(shù)的開放開發(fā)、存檔共同體的建立和協(xié)作以共享共建有共識可共通的保障體系等。
實踐顯示出社交媒體信息存檔的復雜性,難有一蹴而就的完善方案供具體行動使用,因而以行動為導向推動進程以發(fā)展的方式完善存檔成果。換言之,社交媒體信息存檔的基本假設(shè)是:在現(xiàn)有條件下形成適合的方案并知曉方案的局限,為最大程度降低信息失真、失存、失用的風險而盡可能開展行動,承認存檔成果的不足并積極優(yōu)化后續(xù)的存檔方案。
于我國而言,行動力的缺失一定程度上在于當前檔案館主要工作內(nèi)容并未涵蓋社交媒體信息這類相對非主流的范疇,數(shù)字檔案館與電子文件單軌制等已有較大的資源損耗,且對于社交媒體的信息價值與存檔挑戰(zhàn)有較多不確定性。在這樣的實踐困境中,有局限的行動應(yīng)當被鼓勵與落實。例如,在存檔對象難以確定的情況下,可根據(jù)職能選取較為重要的賬戶。同時,具體存檔內(nèi)容與格式都可以選擇較簡單甚至不完全符合檔案特性的方式,如只摘取主體信息與發(fā)布賬戶名稱、存為WARC的網(wǎng)絡(luò)信息標準格式等。關(guān)鍵在于,需要通過行動啟動這樣一項復雜且側(cè)重于長遠價值的任務(wù),并在行動過程中發(fā)現(xiàn)問題,才可形成完整、系統(tǒng)的存檔框架與方案。
總而言之,在社交媒體平臺已成為政府、民眾、社會組織等多種社會主體之間信息傳遞以及相互交流和溝通重要工具的背景下,社交媒體信息在記憶、證據(jù)、資產(chǎn)等方面的價值得以凸顯。于檔案館而言,如何實現(xiàn)上述信息的長久保存和有效利用離不開理論上的指導和對現(xiàn)有實踐的經(jīng)驗總結(jié)。本文通過調(diào)研全球范圍內(nèi)檔案館的社交媒體信息存檔項目,發(fā)現(xiàn)當前檔案館的社交媒體信息存檔實踐可細分為指導式接收、主動式捕獲和協(xié)作式共建三類,明確了相關(guān)實踐在對象、主體、方法和成果等維度的特征。由此提出基于我國國情的檔案館社交媒體信息存檔策略。當然,研究側(cè)重于對現(xiàn)有實踐成果的梳理和歸納,尚需更為深入的研究幫助構(gòu)建檔案館視角下的社交媒體信息存檔框架,明確檔案館參與社交媒體存檔的關(guān)鍵要素及要求,從而有效促進我國檔案館的社交媒體信息存檔實踐升級優(yōu)化。