楊智勇+史曉杰
摘 要:文章在概括和歸納大數據概念和特點的基礎上,分析了數字檔案館與大數據的關系,并闡述數字檔案館微服務的基本范疇:個性化、專題化、特殊化和差異化,提出微服務的實現途徑:微博、微信、手機短信、在線咨詢和個性化定制等服務方式。
關鍵詞:大數據;數字檔案資源;微服務
隨著大數據時代的到來,無論對個人還是企事業(yè)單位以及社會乃至整個國家和世界,數據都已成為一種資產、一種寶貴的財富。而數字檔案館的檔案資源作為人類社會最精華、最寶貴的一種資產和財富,也將在大數據時代發(fā)揮其文化傳播和信息服務的作用。本文就數字檔案館應用大數據的技術和理念探討一種新的信息服務方式——微服務。
1 大數據概述
維基百科定義大數據是:由數量巨大、結構復雜、類型眾多數據構成的數據集合,是基于云計算的數據處理與應用模式,通過數據的整合共享,交叉復用形成的智力資源和知識服務能力。[1]盡管目前大數據還沒有統(tǒng)一定義,但對其存在一個共識:大數據不是對數據量大小的定量描述,而是一種在種類繁多、數量龐大的多樣數據中進行的快速信息獲取和應用。
1.1 大數據的種類及特點。大數據的類型大概包括以下幾種:(1)數字化數據:掃描并借助光學字符識別轉化而成電子形式的傳統(tǒng)文獻數據,其主要存在于國家和地方的檔案、圖書等文獻數據資源庫中;(2)自然數據:即直接形成用于計算機和數據處理系統(tǒng)的數據,其主要存在于應用程序、管理平臺、交易系統(tǒng)、數據庫、電子郵件、公眾網絡、社交媒體及GPS定位系統(tǒng)中;(3)模擬數據:是從物理世界中發(fā)散出來但可以不斷被轉化成數字格式的,其主要存在于手機、相機、攝像設備、傳感器以及可穿戴設備中。[2]以上數據以實時、迭代的方式不斷產生、轉化和融合。
大數據的特點從理論角度可以概括為“4V”:大量(Volume),數據從TB躍升到PB甚至是ZB;多樣(Variety),數據來源多和數據類型多;價值(Value),單個有價值的數據比例越來越小,但龐大的數據量蘊含巨大價值;快速(Velocity),數據增長速度快,數據處理速度快。從實踐角度可以概括為“三性”:全體性,收集和分析更多的數據去分析和解決問題;混雜性,從大量混雜的數據中判斷某種大的方向;相關性,利用大數據背后的相關性分析現狀和預測未來。
1.2 數字檔案館已具備大數據的基本特征
(1)數字檔案館的信息資源總量龐大且增長迅速。2013年6月8日,江蘇省檔案局副局長張姬雯介紹江蘇省截至2012年底共存儲數字檔案資源總量為33TB,[3]如果推算到全國大概接近1PB,所以,全國數字檔案館的信息資源總量已經是一個龐大的數據集。2013年3月3日,國家檔案局局長楊冬權在提交的《關于隨館藏數量增加而相應增加各級國家檔案館人員編制的提案》中提到:2011年省、地、縣三級國家檔案館館藏總量比1987年館藏量增長了5倍,而到2020年將比1987年增加近10倍,[4]可見數字檔案館的信息資源總量增長速度也比較快。
(2)數字檔案館的信息資源與大數據在內容價值上是相互交叉的。一方面,數字檔案館的信息資源是大數據的重要組成部分。因為數字檔案資源最重要的特點是有機聯(lián)系,而大數據的主要特點也是相關性,因此,本身即存在有機聯(lián)系或存在潛在聯(lián)系的數字檔案資源是大數據極其精華的一部分。另一方面,大數據又可以劃歸為數字檔案資源的理論范疇內。因為大數據也是國家機構、社會組織或個人在社會活動中直接形成的各種形式的信息記錄。如:手機運營商掌握的人們實時通信記錄,金融行業(yè)掌握的國家、機構和個人資金交易記錄,網絡服務商掌握的人們各種社會交往、交流記錄,監(jiān)視器留下的人們行動的信息記錄……這些都是大數據內容,而從“大檔案”觀的角度看,這些大數據又是數字檔案資源的組成部分。
(3)數字檔案館的信息資源在形式類型上像大數據一樣更加復雜多樣。過去的數字檔案資源類型主要是檔案數字化后形成以數據庫為載體的結構化數據;而大數據時代非結構化數據大量產生,如:各種格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息,等等,這就使得數字檔案資源的類型越來越復雜多樣且難以管理。
2 大數據時代數字檔案館微服務的基本范疇
筆者所提的數字檔案館微服務是相對于傳統(tǒng)檔案服務在大數據時代的一種全新服務方式,其內涵可以概括為:借助于全媒體信息、高速網絡和移動通信等技術充分挖掘數字檔案館特有的文獻資源,為用戶提供細微化、個體化、差異化的利用服務。微服務與傳統(tǒng)服務的區(qū)別在于:傳統(tǒng)服務是“我提供什么,你就接受什么”的以檔案部門為主體的服務,微服務則是“你需要什么,我就提供什么”的以用戶為主體的服務。數字檔案館微服務的基本范疇包括:
2.1 個性化服務。傳統(tǒng)檔案服務側重于宏觀層面的整體服務,服務模式是普適的、大眾的,對微觀層面的個性化需求考慮較少。微服務是將檔案用戶細分為每個個體,通過短信提醒、信息推送等方式為個體用戶提供滿足個人工作、學習、生活等多種個性化需求的功能性服務。個性化服務體現在三個方面:一是實現數字檔案信息服務時空的個性化,即用戶可以隨時隨地獲取其所需的檔案信息;二是實現服務方式的個性化,即根據用戶個人的利用習慣和利用方式來開展數字檔案信息服務;三是提供個性化的服務內容,即根據不同用戶的需求,結合用戶的個人背景和需求特點,有針對性地使用戶能獲其所需,得其所要。[5]
2.2 專題化服務。專題化服務是檔案信息的主要服務方式,如針對重大活動、重大事件、重要文化宣傳、重要民生問題等,通過有針對性的收集、整理和編研形成專題成果來提供服務。微服務中的專題化是對傳統(tǒng)檔案專題服務的有益補充,它是針對當前數字信息越來越繁雜和多元,用戶難以從浩如煙海的信息中完全獲取有用的信息,尤其是散狀分布、稍縱即逝的微內容。因此,檔案人員根據某一專題對數字檔案資源進行檢索、挖掘、整序、定制和篩選,形成相對集中有序、細化的專題知識數據,方便用戶隨時獲取。
2.3 特殊化服務。傳統(tǒng)檔案服務主要是借助紙質檔案和老照片的借閱和展示以及對檔案數字化后的數據庫進行脫機或聯(lián)機檢索。而現今如平板電腦、電子閱讀器、手機等逐漸成為主流利用載體,因其易用性、便攜性、多樣性等優(yōu)點,深受廣大青年用戶喜愛。因此,開發(fā)針對新型載體的服務平臺,提供獨具檔案館特點的內容服務,實現與平板電腦、手機等利用載體的無縫對接,這將對數字檔案館服務產生創(chuàng)新性的改革。目前,國內已經有檔案館利用WAP網站或APP實現豐富靈活的檔案信息服務,這些服務可以向移動終端用戶提供館藏資源查詢、珍品推薦、歷史探究、在線展廳、利用案例、檔案信息動態(tài)等服務內容。
2.4 差異化服務。不同年齡、不同職業(yè)、不同教育背景的用戶,對檔案信息的需求有著較大差異。因此,面對這些水平各異的用戶如何滿足其差異化的需求既是檔案館服務的重點也正符合微服務的初衷,微服務本身的特殊性決定了它能夠為各種類型的用戶提供不同的服務。例如,針對普通民眾的民生問題提供婚姻檔案、房產檔案服務,針對涉案人員關于知情權和證據憑證問題提供政策信息和檔案憑證服務,針對學者、研究人員關于歷史研究和文化傳承問題提供歷史檔案、檔案文化服務,針對科技人員、工程人員關于經濟建設和城市發(fā)展問題提供科技檔案和城建檔案服務,等等。而且不同的人針對同一問題會有不同的需求,所以,為不同需求的目標用戶群提供差異化服務也是今后數字檔案信息服務的主要方向。[6]
3 大數據時代數字檔案館微服務的實現途徑
2011年9月27日,國家檔案局局長楊冬權在全國檔案宣傳工作會議上強調:“注重發(fā)揮各種新興媒體的宣傳作用,比如動漫的形式、網絡視頻的形式、手機短信的形式、電視滾動字幕的形式、戶外電子屏信息的形式、電子書的形式、微博的形式等,從而拓展宣傳形式、手段和載體,占領新興媒體陣地,進一步豐富和創(chuàng)新傳播渠道,吸引更多的宣傳受眾?!盵7]
由此可見,微博、微信、短信、電子書、社交網絡等新媒體形式既是檔案宣傳的新途徑,也將是數字檔案館微服務的新途徑。
3.1 微博服務。微博作為一種網絡上分享、傳播和交流信息的平臺,其在信息發(fā)布、網絡營銷、政府管理以及個人交流等諸多方面都得到廣泛應用和發(fā)展,而且微博在泛內容、大眾化內容的基礎上,開始涌現出一些垂直化、精細化的內容,對于用戶個性化需求滿意度逐步提升。2014年7月21日,第34次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》顯示:截至2014年6月底,我國微博用戶規(guī)模為2.75億;其中手機微博用戶數為1.89億,占所有微博用戶的68.7%。[8]目前,越來越多的檔案館通過開通官方微博向社會公眾提供方便快捷的檔案服務,微博服務已逐漸成為數字檔案館微服務的主要途徑之一。
通過開通微博,數字檔案館可以將檔案館的使命、目標、愿景等傳達給用戶,也可以將檔案館的活動動態(tài)、館藏信息、文化教育、服務項目等發(fā)送給用戶,拉近檔案館與廣大公眾的距離,提高檔案信息服務的范圍和質量,進而提高社會的檔案意識;另外,通過微博,檔案館人員之間可以就工作中的問題進行交流,共享信息,增強協(xié)作,共建信任,為更好地服務社會創(chuàng)造條件。目前,較有影響和特色的檔案館微博有:“蘇州檔案”、“銀川檔案”、“撫順檔案”等。
3.2 微信服務。微信是騰訊公司于2011年推出的一個為智能終端提供即時通訊服務的應用程序,它支持跨通信運營商、跨操作系統(tǒng)平臺通過網絡快速發(fā)送語音、視頻、圖片和文字等功能,目前國內用戶已超5億?;邶嫶蟮挠脩羧后w,在數字檔案館服務中應用微信這類新興的信息傳播和共享平臺,既可以改善檔案服務過程中的弱互動性,還可以提高檔案信息服務的共享性和智能化水平,微信服務也將成為未來數字檔案館微服務的重要途徑。
檔案館通過建立微信公共平臺,有利于提高檔案信息服務的關注度,通過對進出檔案館或附近的目標人群定位,即可“一對一”式主動致以問候;利用微信公共平臺可以較大范圍地綁定用戶群,從而更好地掌握用戶需求;通過微信公共平臺的自助服務,用戶可以隨時了解所需信息,有利于提高用戶的自主性和自發(fā)性活動,從而從根本上提高檔案服務的個性化水平。[9]目前,山東省檔案館、天津泰達圖書館檔案館、海鹽檔案館等已開通了微信公共平臺。
3.3 手機短信服務。短信作為手機最傳統(tǒng)、最基本的功能之一,至今一直是人們進行信息交流的有效工具,而這一服務也正好迎合大數據時代人們對檔案信息“短、平、快”的需要特點。手機短信服務主要內容包括:檔案信息咨詢、檔案信息發(fā)布以及個性化短信服務。檔案信息咨詢是用戶將自己所要查閱或咨詢的問題以短信方式發(fā)送到檔案部門,檔案人員首先根據系統(tǒng)預先設定的常見問題提供解答,然后對未能解答問題進行分析和整理,最后將相關信息發(fā)送給用戶;檔案信息發(fā)布是將檔案方面的新聞動態(tài)、政策法規(guī)、重要活動等以短信形式發(fā)送給用戶;個性化短信服務是用戶根據需求定制自己感興趣的檔案信息,檔案人員可以定期或不定期將這些信息發(fā)送給用戶。
3.4 在線咨詢服務。在線咨詢(又稱“在線客服”)是新一代的網絡商務即時通訊系統(tǒng),它以網頁為載體,為網站訪客提供方便快捷的交流方式。在線咨詢已經在消費、服務、醫(yī)療、通信、金融等行業(yè)有了較為成熟和普遍應用。盡管目前國內很多檔案部門已經在網站首頁設置了檔案咨詢功能,但絕大多數都是靜態(tài)和滯后的。而微服務的理念即是倡導用戶參與,只有用戶積極響應才可以反饋檔案館所提供的服務是否令人滿意,才能真正了解用戶的需求。因此,檔案館可以借鑒商業(yè)客服的在線咨詢服務方式,當用戶查找信息遇到困難時,自動彈出檔案館在線客服的即時對話框,使檔案信息服務人員隨時“守候”在用戶身邊,及時解決用戶在檔案利用過程中的問題。
3.5 個性化定制服務。傳統(tǒng)的檔案利用系統(tǒng)是為所有專業(yè)、層次、地域的用戶提供統(tǒng)一的資源和服務,而大數據時代提倡個性化、差異化的微服務,就需要開發(fā)新型的數字檔案資源利用系統(tǒng),為用戶量身定做專門的數字檔案資源和服務。該系統(tǒng)可以設計三大模塊:一是數據資源模塊,其中設置“我的專題檔案資料”、“我的個人數據資料”、“我的參考資料”等選項,將用戶最常用的數字檔案資源作為首層列出,便于檢索和利用;二是網絡資源模塊,其中設置“我的收藏夾”、“我的個人鏈接”、“我的搜索引擎”等選項,將用戶經常查找的網絡檔案資源有效組織起來,滿足其多元化的信息組合需求;三是服務功能模塊,通過設置“我的檔案館員”、“我的檔案新聞”、“我的檢索界面”、“我的幫助”等選項,使用戶與相應的檔案館員建立直接聯(lián)系,為其提供檔案咨詢服務,并使用戶及時獲取有針對性的與檔案相關的動態(tài)信息內容。[10]
4 結束語
《大數據時代》一書中提到:“數據價值的關鍵在于其無限的再利用,即它的潛在價值。收集信息固然至關重要,但還遠遠不夠,因為大部分的數據價值在于它的使用,而不是占有本身。”[11]因此,數字檔案館的檔案資源作為大數據最重要的一部分,要充分發(fā)揮其價值,也需要從以“藏”為主向以“用”為主轉變,從“被動服務”向“主動服務”轉變,將宏觀、大眾化服務與微觀、個性化服務有機結合。而微服務作為一種“短、平、快”的服務方式,它將成為傳統(tǒng)檔案服務的有益補充和有效改進,將會更加貼近用戶并為其提供更加細微、專業(yè)的服務。
參考文獻:
[1]大數據[EB/OL].[2013-08-02].http://zh.wikipedia.org/zh/%E5%A4%A7%E6%95%B0%E6%8D%AE.
[2]Presidents Council of Advisors on Science & Technology.Big Data and Privacy: A Technological Perspective[R].The White House,2014:18~22.
[3]江蘇檔案資源總量居全國前列,“死”檔案變?yōu)椤盎睢辟Y源[EB/OL].[2013-06-08].http://news.jschina.com.cn/system/2013/06/08/017577171.shtml.
[4]楊冬權.關于隨館藏數量增加而相應增加各級國家檔案館人員編制的提案[N].中國檔案報,2013:3~7.
[5][10]李漫,李紅梅.基于數字檔案館的檔案信息個性化服務研究[J].湖北檔案,2010(2):25~26.
[6]張英.微服務:開創(chuàng)圖書館服務的“藍?!盵J].圖書館建設,2011(7):51~52.
[7]楊冬權在全國檔案宣傳工作會議上的講話[EB/OL].[2011-10-03].http://www.zgdazxw.com.cn/NewsView.asp?ID=16066.
[8]第34次中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告[EB/OL].[2014-07-21]. http://www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/P020140721507223212132.pdf.
[9]李明玉,周耀林.檔案網絡化社會服務探微[J].湖北檔案,2014(3):15~16.
[11][英]維克托·邁爾-舍恩伯格,等.大數據時代[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2012:165.
(作者單位:楊智勇,上海大學圖書情報檔案系; 史曉杰,開封市城市建設檔案館 來稿日期:2014-08-08)