劉 超,鄭建程
論微博信息的長期保存價值
劉 超,鄭建程
微博是最受歡迎的社交媒體之一,龐大的微博用戶群體生產(chǎn)了大量有長期保存價值的微博信息,然而與之相關(guān)的研究、實踐卻十分匱乏。文章分別論述了微博信息的長期保存價值,以及對微博信息長期保存價值的質(zhì)疑,指出并建議國內(nèi)外相關(guān)學(xué)者、機構(gòu)應(yīng)對微博信息保存開展更加全面而深入的研究。
微博 微博信息 長期保存 保存價值
Web 2.0時代,人們不僅可以瀏覽信息,還可以利用各式各樣的社交媒體工具發(fā)表觀點、分享經(jīng)驗,參與到信息的創(chuàng)建、利用和修改活動中。微博作為最受歡迎的社交媒體工具之一,其用戶生產(chǎn)了大量有價值的信息,這些信息是當(dāng)代數(shù)字信息的重要組成部分,應(yīng)該得到妥善的保管。2010年4月,美國國會圖書館與Twitter簽訂了一項協(xié)議,協(xié)議要求自簽訂日起Twitter向國會圖書館捐贈自該公司成立以來所有公開的Twitter信息,并且今后會持續(xù)地為國會圖書館提供Twitter信息歸檔[1]。國會圖書館以實際行動證明了微博信息具有保存價值。另外,OCLC董事會主席Larry P.Alford也指出學(xué)術(shù)圖書館的其中一個使命就是要“探索收集社群(會)媒體及其他當(dāng)代數(shù)據(jù)信息”[2]。為此,學(xué)術(shù)圖書館有必要認識到微博信息的長期保存價值,主動承擔(dān)起相應(yīng)的保存使命。
微博(又稱微博客)是一種允許用戶及時更新簡短文本并可以公開發(fā)布的微型博客形式,一些微博也可以發(fā)布多媒體信息,如圖片、flash、音/視頻等[3]。手機、Pad微博客戶端的出現(xiàn)和普及,以及單條微博140個字?jǐn)?shù)的限制,使得微博的信息傳播成本極低,用戶能夠隨時隨地分享所見所聞、所感所思。Twitter是最早也是最著名的微博,2006年一經(jīng)推出,便迅速獲得了全世界廣大網(wǎng)絡(luò)用戶的歡迎,目前其網(wǎng)站的訪問量位居世界第11位[4]。2009年微博開始在我國流行,CNNIC(中國互聯(lián)網(wǎng)絡(luò)信息中心)《第32次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r調(diào)查報告》的數(shù)據(jù)顯示,截至2013年6月底,我國使用微博的網(wǎng)民規(guī)模已經(jīng)突破了3.3億,微博在網(wǎng)民中的使用率達到了56%,目前微博已經(jīng)成為網(wǎng)民獲取信息的重要途徑之一[5]。
微博一詞既可以指代微博這種社交媒體平臺,也可以指微博用戶在微博平臺上發(fā)布的短消息,在平時的使用中人們多不加以區(qū)分。本文所要研究的對象為后者,故在本文中使用“微博信息”一詞以示區(qū)分。
2.1 微博信息的科學(xué)研究意義
美國國會圖書館認為[6],Twitter信息的價值體現(xiàn)在三方面:(1)為一些因Twitter而引發(fā)的事件提供了最直接的第一手資料;(2)Twitter可視作一個主要信息源(如路透社、紐約時報等)的動態(tài)聚合器,并且為公民新聞提供了一個發(fā)布、傳播的公共平臺;(3)Twitter上忠實地記錄了普通人的生活,可為后代提供一個了解現(xiàn)代人們生活狀況的窗口。所有這些都可以作為國會圖書館現(xiàn)有文化遺產(chǎn)收藏的有益補充。在其發(fā)布的“Twitter存檔現(xiàn)狀的白皮書”中提到[7],雖然目前該存檔還無法對研究者開放,但已經(jīng)從全世界收到了400條訪問的請求,而且研究者們關(guān)注的主題非常廣泛。其實微博信息潛在的研究價值早已突破了網(wǎng)絡(luò)信息環(huán)境的限制,如卡內(nèi)基梅隆大學(xué)的Jacob Eisenstein教授認為Twitter一類的數(shù)據(jù)將使得語言研究的“游戲規(guī)則”發(fā)生實質(zhì)性的改變,他通過研究發(fā)現(xiàn),美國不同區(qū)域的微博語言甚至發(fā)展出了不同的“方言”[8]。
國內(nèi)的微博相較于Twitter更像是一個微媒體,在微博打拐、貪腐舉報、公益募捐等活動上,微博均發(fā)揮了不可替代的作用。另外,由于漢語是當(dāng)今世界上信息量最大的文字符號系統(tǒng),同樣140個字?jǐn)?shù)的限制,中文微博往往能包含更大的信息量。從這些方面來看,國內(nèi)本應(yīng)對微博信息的保存投入更多關(guān)注,然而,筆者在研究過程中發(fā)現(xiàn),目前針對微博信息長期保存的中文文獻極為有限[9-10]。
從以上可以看出,西方國家對微博信息的科學(xué)研究價值已有所認識,并正在積極地對其進行保存。具有語言優(yōu)勢的中文微博信息的長期保存更有必要引起重視,以保障當(dāng)前及未來科學(xué)研究的需求。
2.2 微博信息的社會記憶作用
記憶是人的一種生理和心理機能,但從社會學(xué)角度來講,純粹的個體性記憶是不存在的,記憶所依賴的語言、邏輯和概念都是在社會交往中實現(xiàn)的。著名社會學(xué)家 Maurice Halbwachs認為[11]:存在著一個所謂的集體記憶或記憶的社會框架,它決定著個人記憶能否被回憶起、以什么方式被回憶起。所以,個人記憶實際上是客觀世界經(jīng)社會記憶映射而呈現(xiàn)的鏡像。從這個意義上來講,社會記憶對人們的認知和觀念的形成具有重要影響作用,某種程度而言,甚至可以影響社會發(fā)展的進程。
社會記憶是人類在世代生活生產(chǎn)活動中傳承下來的經(jīng)驗、教訓(xùn)、智慧、知識的集合,通常表現(xiàn)為書面記錄信息,而隨著數(shù)字化信息技術(shù)和網(wǎng)絡(luò)的出現(xiàn)與發(fā)展,網(wǎng)絡(luò)信息也成了社會記憶的有機組成部分。微博是互聯(lián)網(wǎng)進化的產(chǎn)物之一,其龐大的用戶群體在微博平臺上發(fā)布了大量有價值的信息內(nèi)容,這些內(nèi)容正是當(dāng)代社會記憶不可或缺的一部分。人們通過微博這種社交媒體所發(fā)布的內(nèi)容,既有對生活狀態(tài)的記錄,更重要的是有對社會事件的關(guān)注和點評,以及對新聞線索的披露和挖掘。相較于傳統(tǒng)媒體而言,微博信息通常具有民主性、及時性等特點,在一些社會科學(xué)的研究中被當(dāng)作第一手資料使用,其價值甚至超越了傳統(tǒng)的信息源。
然而,社會記憶如不妥善保存也會被“遺忘”。由于網(wǎng)絡(luò)的特點,微博信息這部分記憶的被“遺忘”速度會更快。所以,數(shù)字化網(wǎng)絡(luò)化時代的圖書館更應(yīng)主動擔(dān)負起保存這些社會記憶的重任,以發(fā)揮和完善其社會記憶功能[12]。
2.3 微博信息是人類數(shù)字遺產(chǎn)的一部分
國內(nèi)有部分學(xué)者認為,數(shù)字遺產(chǎn)應(yīng)界定為具有一定審美價值和文化價值,并且能夠起到文化傳承作用的原生數(shù)字資源,是數(shù)字資源的下位概念,數(shù)字遺產(chǎn)的特點有內(nèi)容形式的多樣性、快速增長性、易消失性、數(shù)字形式唯一性以及富有價值性等[13]。從上文的分析中可以看出,微博信息完全符合數(shù)字遺產(chǎn)的定義及特點。聯(lián)合國教科文組織于2003年頒布的《保存數(shù)字遺產(chǎn)憲章》中指出:“無論何種形式遺產(chǎn)的消逝都是全人類遺產(chǎn)的損失,……由于軟、硬件迅速淘汰,維護和保存這類遺產(chǎn)的資金、責(zé)任與方法的不確定,以及缺少相關(guān)的立法等原因,世界上的數(shù)字遺產(chǎn)面臨著消失和失傳的危險?!瓚?yīng)優(yōu)先保存‘原生數(shù)字'資源?!盵14]有學(xué)者指出,圖書館應(yīng)在充分認識數(shù)字遺產(chǎn)與數(shù)字資源的區(qū)別以及數(shù)字遺產(chǎn)價值的基礎(chǔ)上,構(gòu)建以圖書館為中心的數(shù)字遺產(chǎn)合作保存網(wǎng)絡(luò),制定合理有效的數(shù)字遺產(chǎn)保存策略,以履行圖書館保存數(shù)字遺產(chǎn)的使命[13]。
3.1 對微博信息內(nèi)容的質(zhì)疑
雖然大部分人都承認微博可以提供一個真實、客觀的新聞平臺,甚至能在許多重大突發(fā)事件的報道和事件的后續(xù)發(fā)展中發(fā)揮重要作用,但也有人對此并不認同,如MarketWatch網(wǎng)站科技專欄作家John C.Dvorak就總結(jié)了Twitter作為新聞源有報道片面、“記者”不專業(yè)、易受操縱、用戶愛搞惡作劇、缺乏獲取新聞線索途徑、缺乏分析、主次顛倒等七大不足[15]。研究機構(gòu)Pearanalytics對Twitter短消息的抽樣調(diào)查顯示[16],有40.5%的信息屬于“沒有價值的無聊話(Pointless Babble)”,如“我現(xiàn)在正在吃一個三明治”,而且令人意外的是,盡管Twitter在新聞事件中的高引用率,但具有新聞價值的消息只占到全部Twitter內(nèi)容的3.6%。隨著微博在國內(nèi)的普及,越來越多的網(wǎng)友將其當(dāng)作首選的信息獲取渠道和意見表達平臺,但對它的質(zhì)疑也越來越多?!稄V州日報》載文稱,“微博已經(jīng)從傳播信息、交互式交流平臺淪落成‘公共廁所',是許多垃圾信息、八卦、惡搞甚至謠言的集散地?!盵17]央視《朝聞天下》欄目也曾以《微博的倫理底線在哪里》為題報道了“微博造假”現(xiàn)象,引發(fā)了網(wǎng)民熱議。
從以上可以看出,對微博信息內(nèi)容的質(zhì)疑主要體現(xiàn)在兩方面:一是微博信息內(nèi)容質(zhì)量良莠不齊;二是微博信息內(nèi)容瑣碎、枯燥。而這些質(zhì)疑也容易令人對微博信息的保存價值產(chǎn)生疑問。
針對第一種質(zhì)疑,首先應(yīng)指出的是,互聯(lián)網(wǎng)只是社會生活的一個縮影,不能把網(wǎng)絡(luò)當(dāng)作現(xiàn)實社會問題的替罪羊。“惡搞”和“謠言”并非微博獨有的現(xiàn)象,而是互聯(lián)網(wǎng)的通病,可通過建立網(wǎng)絡(luò)文明公約、強化言論管理等措施得到有效遏制。而且,包括微博資源在內(nèi),保存任何一種資源都需要接受評價、遴選等程序的檢驗,造假與不實消息一旦被發(fā)現(xiàn)將會被剔除出去。其次,對于微博信息內(nèi)容中“公民新聞”不專業(yè)、主觀片面等的質(zhì)疑,我們應(yīng)該看到這些由微博用戶原創(chuàng)的內(nèi)容與傳統(tǒng)媒體互相補充的意義。美國網(wǎng)絡(luò)新聞學(xué)的創(chuàng)始人Dan Gillmor提出[18],應(yīng)該用公平、詳盡、準(zhǔn)確和公開四項新原則來替代新聞界歷來所崇尚的客觀性原則,因為人與生俱來會帶有主觀性傾向,完全客觀是個不可能實現(xiàn)的目標(biāo),相比較而言,他認為網(wǎng)絡(luò)環(huán)境下更容易實現(xiàn)以上提到的四個新目標(biāo),從而產(chǎn)生高質(zhì)量的新聞。傳統(tǒng)媒體雖然在信息的采集、加工、傳播等環(huán)節(jié)嚴(yán)格把關(guān),但往往由于過分追求客觀性的目標(biāo),反而容易使得媒體觀點僵化,顯得千篇一律。盡管微博上的“公民記者”沒有經(jīng)過專業(yè)的訓(xùn)練,但他們往往更敢于發(fā)表不同的見解和觀點,這無疑有助于豐富公眾對某一社會事件的認知,與傳統(tǒng)媒體相互補充;也將有助于后人更客觀、全面地還原歷史真相。
而針對第二種質(zhì)疑,事實上,早期博客的長期保存價值也曾經(jīng)受到過類似的質(zhì)疑,但隨著人們對博客的認識逐步加深,一些原先將博客排除在外的網(wǎng)絡(luò)資源保存項目也將博客納入歸檔范圍內(nèi),如澳大利亞國家圖書館啟動的PANDORA項目[19]。正如歷史學(xué)家Dan Snow所說,“也許正是(博客中記錄的)那些瑣碎、枯燥的細節(jié)對幾百年后的人們來說才具備特別意義?!盵20]而且由于微博打破了固定互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)之間的限制,且多數(shù)微博將字?jǐn)?shù)限制在140個以內(nèi),有人從“生產(chǎn)成本”降低這點推算有意愿寫有價值微博的人是博客的4倍,加上“消費成本”的降低,認為微博的傳播力是博客的200倍[21]。從這個意義上來說,由博客進化而來的微博甚至應(yīng)比博客具有更大的保存價值。
或許未來的人們會好奇二十一世紀(jì)人們的日常生活面貌,未來的相關(guān)專家、學(xué)者會迫切需要了解歷史上某一事件的客觀全貌,以及普通大眾的看法,那么微博就是一個不能繞開的主題。所以,我們要用長遠的眼光客觀辯證地看待微博信息的保存價值。
3.2 對微博信息用戶需求的質(zhì)疑
評價一種資源是否具有保存價值要看用戶是否對這種資源有需求,而用戶需求不僅體現(xiàn)在當(dāng)下,更重要的是體現(xiàn)在未來。微博信息的保存價值就更多地體現(xiàn)在用戶的未來需求中。但這種未來需求存在著諸多不確定因素,使得當(dāng)前的人們無法估測微博的保存價值。興許有人會據(jù)此提出質(zhì)疑,認為只有出現(xiàn)明確需求時,才有必要對一種資源進行保存。然而,如果當(dāng)前不進行保存,當(dāng)需求發(fā)生時,內(nèi)容已經(jīng)消失,由此帶來的損失將無法彌補。
對此,有人提出對于保存價值不確定的數(shù)字資源,可采取“購買時間”(經(jīng)濟學(xué)術(shù)語)的保存策略[22],即當(dāng)前投入少許資金將這些數(shù)字資源僅僅存貯在安全的物理介質(zhì)中,而不投資進行其他形式的長期保存管理活動,當(dāng)未來出現(xiàn)明確需求時,再有選擇地對這些數(shù)字資源進行全面保存管理并提供服務(wù),從而避免不可逆轉(zhuǎn)的損失。不過需要注意的是,對于微博來說,這種保存策略雖然能夠暫時使保存價值不確定的微博信息免于消失的風(fēng)險,但由于每天都會有新的社會事件產(chǎn)生,用戶每時每刻都在生產(chǎn)微博信息,如此規(guī)模巨大且不斷增長的數(shù)據(jù)量,對存貯的物理介質(zhì)提出了更高的要求,加上日常維護的費用,前期投入的資金規(guī)模也是不容小覷的,這就需要相應(yīng)的保存機構(gòu)提前做出縝密的安排和計劃。
微博資源是網(wǎng)絡(luò)信息資源的重要組成部分,其中大量有價值的信息內(nèi)容也是人類數(shù)字遺產(chǎn)的一部分,需要引起保存機構(gòu)的重視。與網(wǎng)絡(luò)信息資源一樣,微博信息的保存也面臨著來自技術(shù)、法律、經(jīng)濟以及責(zé)任體系等方面的挑戰(zhàn)。相較于一般的網(wǎng)頁信息,微博信息的動態(tài)性、數(shù)據(jù)的海量性、格式的多樣性、信息間的關(guān)聯(lián)性以及用戶版權(quán)與隱私問題的復(fù)雜性會增加問題的解決難度。在微博信息長期保存的價值獲得普遍認可后,國內(nèi)外學(xué)者和機構(gòu)對微博信息保存技術(shù)等各方面的研究也應(yīng)加快步伐。
[1][7]Library of Congress.Update on the Twitter Archive At the Library of Congress[EB/OL].[2014-01-04].http://www.loc.gov/today/pr/2013/files/twitter_report_ 2013 jan.pdf.
[2]Larry P.Alford.把握當(dāng)下:為學(xué)術(shù)圖書館的未來而定義[J].嚴(yán)丹,錢卓珺,編譯.圖書館雜志,2013(7):4-8.
[3]維基百科.微博[EB/OL].[2014-02-12].http://zh. wikipedia.org/wiki/%E5%BE%AE%E5%8D%9A.
[4]Alexa.Twitter.com Site Info.[EB/OL].[2014-02-12]. http://www.alexa.com/siteinfo/twitter.com.
[5]CNNIC.第32次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[EB/OL].[2014-02-12].http://www.cnnic.net.cn/ hlwfzyj/hlwxzbg/hlwtjbg/201307/P020130717505343 100851.pdf.
[6]Library ofCongress.The Library and Twitter:An FAQ [EB/OL].[2014-02-12]. http://blogs.loc.gov/loc/ 2010/04/the-library-and-twitter-an-faq/.
[8]BBC News.You have a regional dialect even on Twitter[EB/OL].[2014-02-12].http://www.bbc.co. uk/news/technology-12381912.
[9]廖璠,劉國敏.微博長期保存的可行性研究——基于德爾菲法的調(diào)查報告[J].圖書館論壇,2013(3):45-49.
[10]黃新榮,吳建華.政務(wù)微博檔案化保存初探[J].檔案與建設(shè),2012(4):4-6.
[11]莫里斯·哈布瓦赫.論集體記憶[M].畢然,郭金華,譯.上海:上海人民出版社,2002:68-69.
[12]黃晨,虎嬌玫.圖書館發(fā)揮社會記憶功能的思考[J].圖書館建設(shè),2013(8):8-10.
[13]謝歡,鄭永田.數(shù)字遺產(chǎn)保護:圖書館義不容辭的使命[J].圖書館論壇,2012(7):15-20.
[14]UNESCO.Charter on the Preservation of the Digital Heritage[EB/OL].[2014-02-12].http://portal.unesco. org/ci/en/files/13367/10700115911Charter_en.pdf/ Charter_en.pdf.
[15]MarketWatch.The seven flaws of Twitter[EB/OL]. [2014-01-04].http://www.marketwatch.com/story/ as-news-source-twitter-has-seven-deadly-flaws.
[16]Pearanalytics.Twitter Study[EB/OL].[2014-02-12]. http://www.pearanalytics.com/wp-content/uploads/ 2012/12/Twitter-Study-August-2009.pdf.
[17]李光焱.微博還能搏動多久?[N].廣州日報,2011-03-23(C12).
[18]Dan Gillmor.The End of Objectivity(Version 0.91)[EB/OL].[2014-01-04].http://dangillmor.typepad. com/dan_gillmor_on_grassroots/2005/01/the_end_of_ obje.html.
[19]謝春枝.博客長期存取的國外研究與實踐[J].情報研究,2009(4):50-53.
[20]ALA.Thousands blog for British Library[EB/OL]. [2014-02-12].http://www.ala.org/Template.cfm?% 20Section=news&template=/ContentManagement/ ContentDisplay.cfm&ContentID=140832.
[21]劉潔.微博在電視新聞節(jié)目中的運用[J].視聽界,2011(3):61-63.
[22]周獻紅.基于案例分析的數(shù)字資源保存價值研究[J].圖書館論壇,2011(6):81-83.
On the Long-term Preservation Value of Microblog Information
LIU Chao,ZHENG Jian-cheng
Microblog is one of the popular social networking tools.There is a large number of information,deserving of long-term preservation,produced by its colossal user groups.However,studies and practices on it are scarce.This paper discusses the long-term preservation value of microblog,which,as the authors suggest,is worth doing more research intensely and deeply by scholars and institutions at home and abroad.
microblog;microblog information;long-term preservation;preservation value
格式 劉超,鄭建程.論微博信息的長期保存價值[J].圖書館論壇,2014(6):101-105.
劉超(1989-),男,中國科學(xué)院國家科學(xué)圖書館2012級碩士研究生;鄭建程(1957-),男,中國科學(xué)院國家科學(xué)圖書館研究館員,碩士生導(dǎo)師。
2014-01-07