趙 玉 王 健
(中國(guó)人民大學(xué)信息資源管理學(xué)院,北京,100872)
英國(guó)國(guó)家檔案館(The National Archives,簡(jiǎn)稱(chēng)TNA)2012年11頒布的《文件收集政策》(Records Collection Policy)取代了2007 年的舊版本《文件征集和處置政策》(Acquisition and Disposal Policy)。《文件收集政策》中規(guī)定了英國(guó)國(guó)家檔案館需要長(zhǎng)期保存文件的歸檔范圍、收集時(shí)間和保存地點(diǎn)。
為了處置與公眾相關(guān)的文件,英國(guó)國(guó)家檔案館接著頒布了一系列《操作選擇策略》(Operational Selection Policies,OSPs)。這些策略接受各方的意見(jiàn),包括文件使用者、檔案工作者、使用該策略的政府機(jī)構(gòu)等,并會(huì)根據(jù)這些意見(jiàn)進(jìn)行修訂和更新。在2014 年4 月11 日針對(duì)英國(guó)政府網(wǎng)站檔案館(UK Government Web Archive,簡(jiǎn) 稱(chēng)UKGWA)頒布的《操作選擇策略第27 則:英國(guó)中央政府網(wǎng)站資產(chǎn)》(Operational Selection Policy OSP27: UK Central Government Web Estate,簡(jiǎn)稱(chēng)OSP27)中正式對(duì)政府機(jī)構(gòu)網(wǎng)站歸檔項(xiàng)目的范圍和內(nèi)容作出說(shuō)明和規(guī)定。
英國(guó)國(guó)家檔案館對(duì)政府機(jī)構(gòu)網(wǎng)站的歸檔由來(lái)已久。早在1997年,英國(guó)國(guó)家檔案館就利用國(guó)家數(shù)字檔案數(shù)據(jù)集系統(tǒng)(National Digital Archive of Datasets ,簡(jiǎn)稱(chēng)NDAD)對(duì)政府機(jī)構(gòu)的數(shù)據(jù)集有選擇地收集和保存。這些數(shù)據(jù)集及其背景信息來(lái)自政府部門(mén)的物理轉(zhuǎn)移。為了保證數(shù)據(jù)通過(guò)NDAD網(wǎng)站能夠被下載或者購(gòu)買(mǎi),NDAD 將原始數(shù)據(jù)的格式統(tǒng)一轉(zhuǎn)為開(kāi)放的CSV格式。
2010 年至今,隨著政府公布數(shù)據(jù)集方式的演變,英國(guó)國(guó)家檔案館推出UKGWA 捕獲和保存這些數(shù)據(jù)。英國(guó)國(guó)家檔案館利用UKGWA在文件產(chǎn)生的原始背景下保存政府機(jī)構(gòu)網(wǎng)站所有形式的內(nèi)容(包括網(wǎng)頁(yè)、官方出版物、數(shù)據(jù)集、多媒體等網(wǎng)站信息)及元數(shù)據(jù)(比如形成時(shí)間、形成者等),保證數(shù)字檔案資源的內(nèi)容、背景和結(jié)構(gòu)的完整性。
2013年12月,英國(guó)中央政府部門(mén)逐漸由各自的網(wǎng)站向集成的GOV.UK 轉(zhuǎn)變,英國(guó)國(guó)家檔案館的目標(biāo)由抓取部門(mén)網(wǎng)站的數(shù)據(jù)集和部門(mén)網(wǎng)站本身變?yōu)槊磕陜纱螌?duì)data.gov.uk 清單上的數(shù)據(jù)集及data.gov.uk網(wǎng)站本身進(jìn)行全面捕獲和抓取。目前,UKGWA 已是世界上最大的和使用最頻繁的網(wǎng)站檔案館之一,擁有超過(guò)30 億資源定位符并仍然以每月超過(guò)1000 萬(wàn)的頁(yè)面瀏覽量增加。
表1 UKGWA與OSMA對(duì)比表
在線(xiàn)社交媒體檔案庫(kù)(Online Social Media Archive,OSMA)建于2014年5月8日,是英國(guó)國(guó)家檔案館在社交媒體蓬勃發(fā)展的背景下建設(shè)的UKGWA的重要組成部分。隨著Twitter、YouTube 等社交媒體在英國(guó)社會(huì)的流行,英國(guó)政府機(jī)構(gòu)開(kāi)始普遍利用社交媒體和其他數(shù)字媒體形式與公眾在線(xiàn)交流。相應(yīng)地,文件的產(chǎn)生方式也隨之改變。正如英國(guó)國(guó)家檔案館館長(zhǎng)Clem Brohier所說(shuō),“社交媒體在政府部門(mén)活動(dòng)中的作用越來(lái)越重要,政府機(jī)構(gòu)利用Twitter 闡釋政策,通過(guò)YouTube 推廣各種舉措。因此英國(guó)國(guó)家檔案館有必要開(kāi)發(fā)出專(zhuān)門(mén)的系統(tǒng)支持社交媒體平臺(tái)上的歸檔工作,并將收集的信息作為官方公眾文件的一部分?!蟠梢酝ㄟ^(guò)推文了解歷史,正如我們通過(guò)歷史電報(bào)了解過(guò)去?!?/p>
為了適應(yīng)這種變化,英國(guó)國(guó)家檔案館適時(shí)將政府機(jī)構(gòu)的社交媒體賬戶(hù)產(chǎn)生的信息有選擇地作為文件列入歸檔范圍,以可獲取、保存背景信息和再利用的方式來(lái)保存所產(chǎn)生的數(shù)字文件,保證文件的真實(shí)性和完整性。從2014 年5 月8 日起,英國(guó)國(guó)家檔案館對(duì)中央政府部門(mén)在官方推特賬戶(hù)上發(fā)布的推文和YouTube賬戶(hù)上發(fā)布的視頻進(jìn)行歸檔。
UKGWA(英國(guó)政府網(wǎng)站檔案館)和OSMA(在線(xiàn)社交媒體檔案庫(kù))之間的關(guān)系,詳見(jiàn)表1。
為了有效地利用資源和限制所捕獲文件的范圍,英國(guó)國(guó)家檔案館Twitter的歸檔工作根據(jù)以下規(guī)則進(jìn)行,英國(guó)在線(xiàn)社交媒體檔案庫(kù)收集的文件是政府機(jī)構(gòu)而非公眾個(gè)人或者其他組織在推特上發(fā)布的推文,其歸檔范圍如下:國(guó)家政府機(jī)構(gòu)和非內(nèi)閣部門(mén)的推文;其他政府組織和非政府組織可按照政府部門(mén)的要求歸檔;在UKGWA 歸檔范圍內(nèi)的網(wǎng)站鏈接都會(huì)被保存。但并不是政府機(jī)構(gòu)所有的推文以及每條推文下面的內(nèi)容都會(huì)被保存,在線(xiàn)社交媒體檔案庫(kù)也對(duì)不在歸檔范圍的內(nèi)容作出規(guī)定:轉(zhuǎn)發(fā)的推文、對(duì)推文的的回復(fù)和對(duì)話(huà)、官員個(gè)人的賬戶(hù)、不在UKGWA 歸檔范圍的網(wǎng)站鏈接(比如報(bào)紙文章)。
在推文的收集方面,英國(guó)在線(xiàn)社交媒體檔案庫(kù)一次就能夠捕獲多達(dá)3200 張推特的“快照”。用戶(hù)可以獲取出現(xiàn)在推文的鏈接,還可以通過(guò)網(wǎng)絡(luò)檔案館或者完整的網(wǎng)址訪(fǎng)問(wèn)原來(lái)的網(wǎng)頁(yè)。英國(guó)在線(xiàn)社交媒體檔案庫(kù)保存的帶有編碼的推文能夠確保每條推文和它的背景信息(比如發(fā)布日期和時(shí)間)的完整性,為以后的長(zhǎng)久研究提供了可靠的資源。
圖1 2012年倫敦奧運(yùn)會(huì)官方推特賬戶(hù)
此外,在YouTube 視頻的捕獲方面,英國(guó)在線(xiàn)社交媒體檔案庫(kù)目前運(yùn)行的視頻檔案庫(kù)測(cè)試版具備搜索功能,即按照發(fā)布的部門(mén),可以搜索整個(gè)視頻目錄。Twitter 目前沒(méi)有搜索選項(xiàng),但也可以使用英國(guó)國(guó)家檔案館已公布的JSON和XML文件查詢(xún)和分析推文所包含的信息。
目前,在線(xiàn)社交媒體檔案庫(kù)上保存了包括2006 年至2014 年早期產(chǎn)生的7000 多個(gè)視頻和2008 年至2013年9月產(chǎn)生的65000條推文,這些被歸檔的社交媒體的內(nèi)容是在“在線(xiàn)社交媒體檔案庫(kù)”項(xiàng)目的試點(diǎn)階段被捕獲的,收集了包括2012年倫敦奧運(yùn)會(huì)(見(jiàn)圖1)和2012年女王鉆石慶典(見(jiàn)圖2)等歷史性事件的文件。
圖2 2012年女王鉆石慶典
在線(xiàn)社交媒體檔案庫(kù)的出現(xiàn)和發(fā)展標(biāo)志著英國(guó)國(guó)家檔案館開(kāi)始捕獲政府機(jī)構(gòu)在社交媒體上產(chǎn)生的文件,并將其長(zhǎng)期保存。2003年以來(lái),英國(guó)政府網(wǎng)站在線(xiàn)開(kāi)放的超過(guò)30億的資源(包括網(wǎng)頁(yè)、文檔、互動(dòng)游戲等)被英國(guó)國(guó)家檔案館作為UKGWA 的一部分歸檔?,F(xiàn)在,隨著社交媒體的出現(xiàn),這個(gè)規(guī)模將會(huì)越來(lái)越大。在線(xiàn)社交媒體檔案庫(kù)上保存的文件和視頻,成為UKGWA眾多檔案資源的組成部分。英國(guó)國(guó)家檔案館的在線(xiàn)社交媒體檔案庫(kù)根據(jù)英國(guó)國(guó)內(nèi)各個(gè)社交媒體平臺(tái)使用的現(xiàn)實(shí)情況,有針對(duì)性地選擇了使用最為頻繁的Twitter和YouTube提出具體的應(yīng)用指南,因此有很強(qiáng)的實(shí)踐指導(dǎo)性。
隨著網(wǎng)上服務(wù)理念的日益成熟,電子政務(wù)應(yīng)用建設(shè)水平不斷提高,越來(lái)越多的政府機(jī)構(gòu)采用Web技術(shù),通過(guò)網(wǎng)站發(fā)布信息、提供服務(wù)、辦理業(yè)務(wù),實(shí)現(xiàn)與公眾之間的直接互動(dòng)。在這些活動(dòng)過(guò)程中,必然產(chǎn)生大量有價(jià)值的Web資源。政府網(wǎng)站信息不僅包含了大量的政府政策法規(guī)、新聞、通告等,還是對(duì)政府網(wǎng)絡(luò)活動(dòng)的最真實(shí)記錄,并且其中有不少都是“原生性”數(shù)字信息。
政府網(wǎng)站信息資源是政府為了履行職責(zé),向公眾提供服務(wù)而發(fā)布在政府網(wǎng)站上的信息,是政府運(yùn)作的記錄憑證,具備長(zhǎng)期保存價(jià)值,其重要性不言而喻。作為英國(guó)政府網(wǎng)站檔案館(UKGWA)的有機(jī)組成部分,在線(xiàn)社交媒體檔案庫(kù)(OSMA)中的社交媒體文件無(wú)疑屬于重要的政府網(wǎng)站信息資源。
不管是為了開(kāi)發(fā)政府網(wǎng)站信息資源所包含的社會(huì)和經(jīng)濟(jì)效益,還是為公眾長(zhǎng)久獲取政府網(wǎng)站信息資源提供途徑,又或是為后代保存重要的數(shù)字記憶,開(kāi)展政府網(wǎng)站信息資源長(zhǎng)期保存工作刻不容緩。而英國(guó)國(guó)家檔案館在這方面的有益探索,即英國(guó)政府網(wǎng)站檔案館(UKGWA)和在線(xiàn)社交媒體檔案庫(kù)(OSMA)項(xiàng)目的開(kāi)展,為我國(guó)檔案館和圖書(shū)館界進(jìn)行政府網(wǎng)站信息資源長(zhǎng)期保存工作提供了借鑒,值得我們思考與學(xué)習(xí)。
[1]OPERATIONAL SELECTION POLICY(OSP27). http://www. nationalarchives.gov.uk/documents/information-management/osp27.pdf.[2015-05-28].
[2]The National Archives Makes Social Media Part of the Nation's Official History-Videos and tweets archived online as the public record.http://www.nationalarchives.gov.uk/documents/press-release-social-media-archive.pdf.[2015-05-28].
[3]英國(guó)國(guó)家檔案館.http://www.nationalarchives.gov.uk/.[2015-05-28].