楊利軍 高軍
〔摘 要〕隨著計算機(jī)軟硬件的快速發(fā)展和網(wǎng)絡(luò)普及,圖書館中的大數(shù)據(jù)量呈現(xiàn)爆炸式增長。本文介紹了大數(shù)據(jù)的定義,闡述了圖書館個性化服務(wù)中的大數(shù)據(jù)可視化分析的重要意義。為保證圖書館員更好地對海量、復(fù)雜大數(shù)據(jù)進(jìn)行有效分析,本文設(shè)計了一種圖書館大數(shù)據(jù)可視化分析系統(tǒng)框架。該系統(tǒng)可有效提升大數(shù)據(jù)挖掘的效能,幫助用戶更好地理解數(shù)據(jù),并具有較為完善的可視化分析功能。
〔關(guān)鍵詞〕圖書館;個性化服務(wù);大數(shù)據(jù);可視化分析
DOI:10.3969/j.issn.1008-0821.2015.07.013
〔中圖分類號〕G25076 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2015)07-0068-05
〔Abstract〕With the rapid development of computer hardware,software and network technology,the size of large data in library is growing exponentially.This paper introduced the definition of big data,the significance of large data visualization analysis in library personalized service.In order to analyze the massive and complex large data effectively,this paper designed a large data visualized analysis frame structure for library.The system frame structure can effectively improve the efficiency of large data mining,help users to better understand data,and contain perfect visualized analysis function.
〔Key words〕library;personalized service;big data;visualization analysis
目前,圖書館已進(jìn)入大數(shù)據(jù)時代。大數(shù)據(jù)時代,數(shù)據(jù)和文獻(xiàn)、設(shè)備、館員一起成為圖書館服務(wù)生產(chǎn)資源和生產(chǎn)力的重要組成部分,為圖書館的服務(wù)系統(tǒng)構(gòu)建、服務(wù)模式變革和服務(wù)質(zhì)量保證提供安全、可靠、經(jīng)濟(jì)、便捷的大數(shù)據(jù)決策支持。圖書館大數(shù)據(jù)環(huán)境呈現(xiàn)海量(Volume)激增、多類型(Variety)、快速處理(Velocity)和高價值(Value) 的大數(shù)據(jù)4V特征[1]。隨著云計算、傳感器網(wǎng)絡(luò)、高速數(shù)據(jù)傳輸網(wǎng)絡(luò)和大數(shù)據(jù)技術(shù)在圖書館中應(yīng)用的不斷深入,圖書館在提高自身服務(wù)能力和讀者閱讀滿意度的同時,其數(shù)據(jù)總量和數(shù)據(jù)類型將呈現(xiàn)快速增長態(tài)勢。如何在復(fù)雜、多變的數(shù)據(jù)環(huán)境中有效發(fā)現(xiàn)和挖掘大數(shù)據(jù)價值,為圖書館提供全面、精確、可視和可靠的大數(shù)據(jù)決策支持,成為關(guān)系圖書館服務(wù)模式科學(xué)、服務(wù)方式有效和讀者閱讀滿意的重要因素。
圖書館大數(shù)據(jù)環(huán)境具有信息分散、數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一的特點(diǎn),傳統(tǒng)的人工分析方式因其本身存在的分析過程非結(jié)構(gòu)性、不確定性和分析流程不可控等問題,難以將大數(shù)據(jù)調(diào)入應(yīng)用系統(tǒng)中進(jìn)行數(shù)據(jù)價值的有效發(fā)現(xiàn)、挖掘和客觀表現(xiàn),不能為圖書館的系統(tǒng)管理、運(yùn)營和讀者服務(wù)提供可靠的大數(shù)據(jù)決策支持。數(shù)據(jù)可視化分析是有效適應(yīng)圖書館大數(shù)據(jù)復(fù)雜環(huán)境和滿足大數(shù)據(jù)分析需求行之有效的方法。維基百科對數(shù)據(jù)可視化的定義為“數(shù)據(jù)可視化是技術(shù)上較為高級的技術(shù)方法。這些技術(shù)方法允許利用圖形、圖像處理、計算機(jī)視覺和用戶界面,通過表達(dá)、建模方式實現(xiàn)對立體、表面、屬性和變量的顯示,并對數(shù)據(jù)加以可視化解釋”[2]。因此,如何借助圖形化的手段,清晰、準(zhǔn)確和可視地表現(xiàn)出大數(shù)據(jù)之間的關(guān)系和從知識中獲取的價值,是圖書館增強(qiáng)大數(shù)據(jù)價值發(fā)現(xiàn)有效性和將數(shù)據(jù)價值轉(zhuǎn)換為服務(wù)生產(chǎn)力的重要途徑。
1 圖書館大數(shù)據(jù)可視化分析的需求與挑戰(zhàn)
11 圖書館大數(shù)據(jù)可視化分析的應(yīng)用現(xiàn)狀
圖書館大數(shù)據(jù)分析與可視化展示二者相輔相成。一方面大數(shù)據(jù)分析賦予可視化展示價值與意義;另一方面可視化展示幫助圖書館從數(shù)據(jù)中提取價值和知識。據(jù)調(diào)查現(xiàn)示,目前我國圖書館界大數(shù)據(jù)可視化分析應(yīng)用還不普及,僅在少部分國家級和國家最高學(xué)術(shù)機(jī)構(gòu)圖書館部署,絕大部分圖書館僅制定了相應(yīng)的部署、應(yīng)用計劃。從大數(shù)據(jù)可視化分析產(chǎn)品的選擇看,絕大多數(shù)圖書館偏向于應(yīng)用免費(fèi)、開源的可視化分析平臺,僅有少數(shù)高級別圖書館與第三方共同研發(fā)了相應(yīng)的大數(shù)據(jù)可視化分析平臺。其中,功能強(qiáng)大、系統(tǒng)開源、兼容性強(qiáng)和易操作,是圖書館在大數(shù)據(jù)可視化分析系統(tǒng)構(gòu)建中最關(guān)注的4個問題。其次,圖書館可視化分析重點(diǎn)關(guān)注的方向是數(shù)據(jù)空間的分布、大數(shù)據(jù)的定量計算、數(shù)據(jù)的多維分析、分析結(jié)果的可視化展示,以及如何通過大數(shù)據(jù)可視化分析來有效支持圖書館建設(shè)、管理與服務(wù)的科學(xué)決策等問題。第三,圖書館大數(shù)據(jù)資源主要以半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)方式存在。圖書館大數(shù)據(jù)可視化分析的對象主要涉及服務(wù)系統(tǒng)日志文件、圖書館運(yùn)營與CRM(Customer Relationship Management,客戶關(guān)系管理)數(shù)據(jù)、讀者閱讀終端和模式數(shù)據(jù)、讀者閱讀反饋數(shù)據(jù)、讀者閱讀行為和社會關(guān)系數(shù)據(jù)、服務(wù)市場競爭環(huán)境數(shù)據(jù)等,且其可控性和可用性將隨著大數(shù)據(jù)總量、數(shù)據(jù)類型的快速遞增而呈現(xiàn)快速下降趨勢[3]。第四,隨著大數(shù)據(jù)資源采集深度和廣度的不斷增長,可視化分析過程將更多地涉及圖書館保密與讀者隱私數(shù)據(jù)。因此,如何加強(qiáng)大數(shù)據(jù)的安全管理和訪問權(quán)限控制,是圖書館大數(shù)據(jù)可視化分析需要重點(diǎn)關(guān)注的問題。
12 可視化分析應(yīng)以大數(shù)據(jù)價值發(fā)現(xiàn)為目的
圖書館大數(shù)據(jù)環(huán)境具有數(shù)據(jù)海量、數(shù)據(jù)結(jié)構(gòu)多樣、數(shù)據(jù)價值分布不均勻和數(shù)據(jù)價值密度低的特點(diǎn),數(shù)據(jù)分析過程難以控制和不能形成統(tǒng)一的分析流程。因此,如何有效發(fā)現(xiàn)大數(shù)據(jù)價值和數(shù)據(jù)間隱匿的關(guān)系,并以可視化圖表方式展示供圖書館員決策參考,是圖書館大數(shù)據(jù)可視化分析的根本目的。其次,可視化分析系統(tǒng)服務(wù)對象應(yīng)由圖書館管理層轉(zhuǎn)換為普通館員,服務(wù)模式也應(yīng)由數(shù)據(jù)分析員的主動式服務(wù)轉(zhuǎn)變?yōu)槠胀^員的自助式服務(wù)。支持不同部門員工通過身份與權(quán)限認(rèn)證,快速獲得直觀、可視、互動和高價值的圖形與報表,有效洞察相關(guān)數(shù)據(jù)中隱藏的價值和數(shù)據(jù)關(guān)系。支持圖書館員通過網(wǎng)絡(luò)和移動設(shè)備,實現(xiàn)與其它用戶可視化分析結(jié)果的共享。第三,大數(shù)據(jù)可視化分析系統(tǒng)應(yīng)具有良好的數(shù)據(jù)環(huán)境和硬件平臺適應(yīng)能力,支持用戶根據(jù)圖書館數(shù)據(jù)規(guī)模分別部署于公有云、私有云和普通IT硬件環(huán)境中,有效實現(xiàn)大數(shù)據(jù)的多類型圖表可視化展示、高效關(guān)聯(lián)分析和人機(jī)決策交互[4]。第四,大數(shù)據(jù)可視化分析系統(tǒng)應(yīng)以數(shù)據(jù)價值的全面發(fā)現(xiàn)和可視化精準(zhǔn)展示為目的。因此,數(shù)據(jù)分析員應(yīng)控制好可視化分析系統(tǒng)在價值發(fā)現(xiàn)和可視化展示間的平衡點(diǎn),不能過于強(qiáng)調(diào)數(shù)據(jù)價值發(fā)現(xiàn)而忽視可視化展示的有效性,也不能片面強(qiáng)調(diào)大數(shù)據(jù)的可視化展示形式而影響大數(shù)據(jù)的價值發(fā)現(xiàn)。endprint
13 圖書館數(shù)據(jù)中心系統(tǒng)運(yùn)營管理的可視化分析需求 圖書館數(shù)據(jù)中心系統(tǒng)運(yùn)營管理具有系統(tǒng)結(jié)構(gòu)復(fù)雜、服務(wù)負(fù)載突發(fā)、故障定位困難和問題描述不準(zhǔn)確的特點(diǎn)。如何通過可視化分析技術(shù)實現(xiàn)數(shù)據(jù)中心運(yùn)營復(fù)雜數(shù)據(jù)的分析,并以可視化形式全面、完整、準(zhǔn)確和清晰地展示出來,是圖書館有效發(fā)現(xiàn)數(shù)據(jù)中心運(yùn)營數(shù)據(jù)中隱藏的價值、明確服務(wù)系統(tǒng)運(yùn)營狀況、準(zhǔn)確定位系統(tǒng)故障和優(yōu)化系統(tǒng)綜合服務(wù)能力的關(guān)鍵。
首先,圖書館數(shù)據(jù)中心系統(tǒng)可視化分析應(yīng)加強(qiáng)運(yùn)營數(shù)據(jù)的采集與處理、數(shù)據(jù)可視化分析和數(shù)據(jù)價值可視化表現(xiàn)3個方面的內(nèi)容。須將大數(shù)據(jù)統(tǒng)計、計算機(jī)圖形學(xué)和計算機(jī)仿真學(xué)等技術(shù)結(jié)合,全面、準(zhǔn)確和實時地以視覺圖形的方式,表現(xiàn)出數(shù)據(jù)中心系統(tǒng)運(yùn)營大數(shù)據(jù)中隱含的知識,為圖書館系統(tǒng)管理員和服務(wù)系統(tǒng)平臺交互,提供可視化的數(shù)據(jù)決策、交互和反饋控制支持。其次,讀者群閱讀需求具有極強(qiáng)的突發(fā)性和不可控性,龐大的讀者群在同一時段突發(fā)的閱讀需求,會導(dǎo)致圖書館服務(wù)數(shù)據(jù)傳輸網(wǎng)絡(luò)負(fù)荷快速增長,使服務(wù)數(shù)據(jù)傳輸網(wǎng)絡(luò)擁塞和運(yùn)營成本急劇攀升。因此,圖書館應(yīng)通過部署可視化分析工具實現(xiàn)對服務(wù)網(wǎng)絡(luò)的監(jiān)控、分析、評估和預(yù)測,支持管理員通過提前決策、快速部署來避免未來服務(wù)高峰網(wǎng)絡(luò)擁塞。第三,數(shù)據(jù)中心系統(tǒng)自身存在的安全漏洞和運(yùn)營風(fēng)險是圖書館應(yīng)關(guān)注的另一個重要問題。隨著數(shù)據(jù)中心系統(tǒng)功能和結(jié)構(gòu)復(fù)雜度的不斷增長,其系統(tǒng)漏洞、安全威脅和運(yùn)營風(fēng)險可控性等問題越來越突出,如何通過可視化分析系統(tǒng)來發(fā)現(xiàn)漏洞、識別漏洞、定位漏洞和評估風(fēng)險,是圖書館提高數(shù)據(jù)中心系統(tǒng)安全性和保證讀者個人隱私的關(guān)鍵[5]。
14 圖書館讀者個性化服務(wù)的大數(shù)據(jù)可視化分析需求 讀者閱讀個性化需求的發(fā)現(xiàn)和個性化服務(wù)QOS保證,是圖書館讀者個性化服務(wù)應(yīng)重點(diǎn)關(guān)注的兩個問題。通過視頻監(jiān)控系統(tǒng)、傳感器網(wǎng)絡(luò)設(shè)備、閱讀終端運(yùn)營數(shù)據(jù)和讀者閱讀滿意度反饋等數(shù)據(jù),圖書館能夠有效獲得讀者閱讀的內(nèi)容、閱讀群體關(guān)系、閱讀習(xí)慣和移動閱讀路徑,以及讀者對關(guān)注內(nèi)容的有效訪問次數(shù)、回訪者與新訪問者數(shù)量、不同讀者群關(guān)注度、間隔訪問天數(shù)等,最終可準(zhǔn)確判斷個體讀者和不同讀者群的閱讀需求。其次,隨著個性化服務(wù)的深入和讀者個體數(shù)據(jù)的激增,傳統(tǒng)的依據(jù)讀者服務(wù)需求建模、提前匯總數(shù)據(jù)和提取數(shù)據(jù)分析結(jié)果的作法,因可視化圖表靜態(tài)、建模方法預(yù)先設(shè)置、報表內(nèi)容不可實時調(diào)整、分析員不能動態(tài)修改和完善模型,而不能滿足讀者個性化服務(wù)高效、實時、定制和快捷的需求[6]。第三,可視化分析系統(tǒng)還應(yīng)滿足圖書館管理員即時、簡單和交互式分析的需求,而不需要圖書館館員具有專業(yè)的可視化數(shù)據(jù)分析知識,系統(tǒng)能夠自動生成支持館員自主決策的可視化分析報告和圖表。第四,面對讀者個體特征數(shù)據(jù)海量、快速遞增、動態(tài)變化和低價值密度的特點(diǎn),可視化分析系統(tǒng)應(yīng)采取輕量建模和構(gòu)建N個視圖的方法,確保系統(tǒng)能夠隨著讀者個體數(shù)據(jù)的導(dǎo)入而實現(xiàn)即時分析與可視化展示,支持使用者根據(jù)分析需求實時調(diào)整大數(shù)據(jù)分析的維度和度量計算方式,保證分析結(jié)果系統(tǒng)、準(zhǔn)確、實時和直觀。
15 圖書館對大數(shù)據(jù)可視化分析系統(tǒng)的功能需求
百度百科對數(shù)據(jù)可視化思想的定義是“將數(shù)據(jù)庫中每一個數(shù)據(jù)項作為單個圖元元素,通過抽取的數(shù)據(jù)集構(gòu)成數(shù)據(jù)圖像,同時將數(shù)據(jù)的各個屬性值加以組合,并以多維數(shù)據(jù)的形式通過圖表、三維等方式用以展現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)信息,使用戶能從不同的維度以及不同的組合對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行觀察,從而對數(shù)據(jù)進(jìn)行更深入的分析和挖掘”。因此,圖書館大數(shù)據(jù)可視化工具應(yīng)以服務(wù)圖書館員的用戶服務(wù)決策需求為核心,具有可視化分析過程數(shù)據(jù)實時更新、系統(tǒng)易于操作、數(shù)據(jù)知識多維度展示、支持多數(shù)據(jù)源和數(shù)據(jù)庫的特點(diǎn)。其次,大數(shù)據(jù)可視化分析結(jié)果展示應(yīng)具有多視圖整合、所有數(shù)據(jù)視圖交互聯(lián)動和強(qiáng)大的主屏顯示功能,可根據(jù)數(shù)據(jù)價值展示需求,實現(xiàn)主從屏聯(lián)動、多屏聯(lián)動、自動翻屏,以及展現(xiàn)內(nèi)容的快速查詢、縮放、切換功能。第三,可視化分析系統(tǒng)應(yīng)具備高性能內(nèi)存分析架構(gòu),可根據(jù)圖書館員的工作特點(diǎn)、決策任務(wù)和分析需求定制系統(tǒng)工作界面,有效實現(xiàn)圖書館智能管理和分析能力的完美結(jié)合[7]。此外,還應(yīng)支持圖書館員通過個人移動數(shù)據(jù)終端完成移動可視化分析,實現(xiàn)圖書館內(nèi)不同部門間的可視化決策共享和聯(lián)動。
2 圖書館大數(shù)據(jù)可視化分析的流程與應(yīng)用策略
21 圖書館大數(shù)據(jù)可視化分析的流程
圖書館大數(shù)據(jù)可視化平臺應(yīng)支持絕大多數(shù)主流操作系統(tǒng)平臺和多種開發(fā)語言,可以無縫嵌入到相關(guān)的應(yīng)用系統(tǒng)之中,能夠根據(jù)可視化分析的內(nèi)容、對象和結(jié)果需求,幫助圖書館員采用不同的大數(shù)據(jù)分析模式和方法開展可視化分析,并以多種展現(xiàn)方式實現(xiàn)大數(shù)據(jù)價值和大數(shù)據(jù)關(guān)系的表現(xiàn)。
圖書館大數(shù)據(jù)可視化分析流程如圖1所示。
圖書館通過視頻監(jiān)控器、傳感設(shè)備、服務(wù)器監(jiān)控設(shè)備和閱讀終端等大數(shù)據(jù)采集設(shè)備,完成對用戶服務(wù)系統(tǒng)運(yùn)營、讀者閱讀需求和行為、閱讀終端運(yùn)行狀況、服務(wù)市場競爭環(huán)境大數(shù)據(jù)資源的采集。其次,可通過大數(shù)據(jù)處理系統(tǒng)實現(xiàn)圖書館結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)的準(zhǔn)備、噪聲過濾和標(biāo)準(zhǔn)化模式轉(zhuǎn)換,在有效提高大數(shù)據(jù)價值密度、數(shù)據(jù)可用性和可控性的前提下,傳輸至大數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲。第三,大數(shù)據(jù)可視化分析系統(tǒng)可通過身身的API(Application Programming Interface,應(yīng)用程序編程接口)與其他應(yīng)用系統(tǒng)實現(xiàn)緊耦合或松耦合。依據(jù)分析對象的數(shù)據(jù)總量、類型和決策需求,通過關(guān)聯(lián)分析、時序分析、列表分析、路徑分析和群組分析等方法,科學(xué)、準(zhǔn)確、快速和經(jīng)濟(jì)地挖掘圖書館大數(shù)據(jù)價值和發(fā)現(xiàn)大數(shù)據(jù)之間的關(guān)系[8]??梢暬故鞠到y(tǒng)應(yīng)具有較強(qiáng)的可操作性、交互性和表現(xiàn)多樣性,能夠輔助圖書館員完成各種圖表的操作和靜態(tài)、動態(tài)圖形展示。此外,還應(yīng)支持不同部門的圖書館員和第三方服務(wù)商在獲得相應(yīng)數(shù)據(jù)庫訪問權(quán)后,通過簡單的網(wǎng)絡(luò)參數(shù)配置完成數(shù)據(jù)庫的連接、模型定義和分析結(jié)果的可視化共享展示。
22 圖書館員可視化分析的知識發(fā)現(xiàn)與獲取過程
圖書館員可視化分析知識的發(fā)現(xiàn)與獲取過程,是由計算機(jī)可視化分析系統(tǒng)與圖書館員對大數(shù)據(jù)的共同作用、交互和分析而產(chǎn)生。計算機(jī)負(fù)責(zé)大數(shù)據(jù)的處理、分析和可視化展示,而圖書館員則負(fù)責(zé)大數(shù)據(jù)知識的獲取、識別、修改和完善,具體過程如圖2所示。endprint
計算機(jī)可視化分析系統(tǒng)負(fù)責(zé)對所采集的大數(shù)據(jù)進(jìn)行處理、分析系統(tǒng)建模和分析結(jié)果的可視化輸出。知識通常隱匿在圖書館大數(shù)據(jù)庫存儲的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中,圖書館員通過構(gòu)建科學(xué)、高效和簡單的分析系統(tǒng)模式,實現(xiàn)大數(shù)據(jù)的快速處理、分析和價值挖掘,并以人機(jī)交互可視化展現(xiàn)的方式傳輸給圖書館員,通過圖書館員對大數(shù)據(jù)可視化展示信息的識別而最終形成知識。由于圖書館員的認(rèn)知能力具有主面性、片面性和不確定性,因此,必須通過知識驗證過程對所發(fā)現(xiàn)的知識進(jìn)行證明、分析和總結(jié)。同時,依據(jù)知識驗證的結(jié)果提出新的科學(xué)假設(shè),經(jīng)過若干次驗證循環(huán)和后知識產(chǎn)生循環(huán),進(jìn)而獲取科學(xué)、正確、可靠和易用的新知識[9]。隨后,通過數(shù)據(jù)傳輸接口將獲取的知識反饋給計算機(jī)可視化分析系統(tǒng),最終提升可視化分析系統(tǒng)的數(shù)據(jù)處理、分析建模和可視化展示的科學(xué)性與準(zhǔn)確性。
23 圖書館大數(shù)據(jù)可視化分析的應(yīng)用策略
231 大數(shù)據(jù)可視化分析系統(tǒng)平臺的功能構(gòu)建
可視化分析平臺應(yīng)滿足圖書館決策層、數(shù)據(jù)分析員和管理員的大數(shù)據(jù)分析、決策需求,具有平臺界面可定制、操作簡單、無縫對接任何數(shù)據(jù)源和分析結(jié)果直觀可視化展現(xiàn)的特點(diǎn),能夠幫助圖書館完成服務(wù)市場環(huán)境數(shù)據(jù)、讀者閱讀需求與變化趨勢、服務(wù)風(fēng)險控制與預(yù)警、QOS和讀者滿意度保證、KPI(關(guān)鍵績效指標(biāo))分析、服務(wù)系統(tǒng)運(yùn)營效率、CRM、精準(zhǔn)營銷和業(yè)務(wù)流程等多業(yè)務(wù)領(lǐng)域的可視化分析服務(wù),可為圖書館提供覆蓋所有業(yè)務(wù)領(lǐng)域、員工層次和工作流程的可視化決策支持。其次,分析系統(tǒng)應(yīng)具備先進(jìn)的內(nèi)存分析引擎,支持大數(shù)據(jù)的動態(tài)整合和直觀的數(shù)據(jù)分段、分層劃分,操作人員可通過簡單的拖放而建立數(shù)據(jù)關(guān)系和過濾喊聲。此外,系統(tǒng)還應(yīng)根據(jù)用戶可視化分析的實時性和復(fù)雜性特點(diǎn),支持大數(shù)據(jù)的動態(tài)和靜態(tài)可視化分析。分析員可根據(jù)實時大數(shù)據(jù)可視化分析結(jié)果,滿足圖書館服務(wù)對讀者QOS保障、系統(tǒng)運(yùn)營安全與效率管理、讀者閱讀需求變化等應(yīng)用的時限需求[10]。第三,可視化分析系統(tǒng)應(yīng)具有較強(qiáng)的語義分析、地理空間分析、關(guān)聯(lián)分析、時序分析、列表分析、路徑分析和群組分析能力,可為用戶提供管理層決策界面、自助智能分析與查詢、電子報表、多維分析、移動商業(yè)智能應(yīng)用、大數(shù)據(jù)分析報告、數(shù)據(jù)價值挖掘、ETL(Extract-Transform-Load,數(shù)據(jù)的萃取、轉(zhuǎn)置、加載至目的端的過程)和數(shù)據(jù)調(diào)度等服務(wù)。
232 可視化分析系統(tǒng)平臺應(yīng)堅持技術(shù)開放的原則
可視化分析系統(tǒng)平臺應(yīng)堅持技術(shù)開放、系統(tǒng)集成、統(tǒng)一平臺和統(tǒng)一管理的原則。首先,可視化分析系統(tǒng)平臺部署應(yīng)支持UNIX、Linux和Windows等世界主流系統(tǒng)平臺、應(yīng)用服務(wù)器和中間件??稍诓煌牟僮飨到y(tǒng)和應(yīng)用平臺間移植,支持用戶通過瀏覽器、應(yīng)用程序和顯示終端訪問,具有較強(qiáng)的系統(tǒng)獨(dú)立性和軟、硬件兼容性。其次,由于圖書館大數(shù)據(jù)庫存儲海量、多類型的特點(diǎn),可視化分析系統(tǒng)應(yīng)支持對國內(nèi)外主流關(guān)系數(shù)據(jù)庫(Oracle、DB2、Teradata、SQL Server、Sybase等)的配置、訪問、查詢、下載和存儲等操作[11]。此外,還可根據(jù)分析對象的數(shù)據(jù)復(fù)雜度、類型和維度,支持對多維數(shù)據(jù)庫的多維OLAP(聯(lián)機(jī)分析處理),確保大數(shù)據(jù)可視化分析和數(shù)據(jù)價值表現(xiàn)的多維性。第三,分析系統(tǒng)平臺應(yīng)堅持SOA(面向服務(wù)的體系結(jié)構(gòu))構(gòu)建,并給圖書館服務(wù)管理系統(tǒng)、CRM系統(tǒng)、第三方大數(shù)據(jù)庫和其它應(yīng)用平臺預(yù)留足夠的API(應(yīng)用程序編程接口)接口,保證可視化分析系統(tǒng)平臺易于和第三方平臺、應(yīng)用程序集成[12]。第四,可視化分析系統(tǒng)平臺應(yīng)支持分析員的個性化定制操作,有效降低分析系統(tǒng)在特殊環(huán)境下對硬件資源的性能需求,支持圖書館員通過移動PC等設(shè)備,實現(xiàn)大數(shù)據(jù)的移動分析與可視化展示、數(shù)據(jù)共享和數(shù)據(jù)查詢等功能。
233 大數(shù)據(jù)可視化分析平臺功能構(gòu)建應(yīng)堅持高效、智能的原則
圖書館大數(shù)據(jù)可視化分析平臺應(yīng)堅持高效、智能和自動化的構(gòu)建原則,才能有效提高分析平臺對數(shù)據(jù)價值的發(fā)現(xiàn)效率的同時,大幅降低圖書館數(shù)據(jù)分析員的工作量和大數(shù)據(jù)分析成本的投入,為圖書館管理和決策活動提供精確、實時、經(jīng)濟(jì)和便捷的可視化大數(shù)據(jù)決策支持。
可視化分析平臺與大數(shù)據(jù)庫安全、高效、快速和直接的連接,是圖書館大數(shù)據(jù)分析平臺有效融合數(shù)據(jù)結(jié)構(gòu)差異、精確發(fā)現(xiàn)數(shù)據(jù)關(guān)系和實時開展可視化分析的關(guān)鍵。因此,圖書館大數(shù)據(jù)可視化分析平臺應(yīng)通過統(tǒng)一的數(shù)據(jù)接口,實現(xiàn)與大數(shù)據(jù)庫、多維數(shù)據(jù)集、文件和電子表格的直接連接,確??梢暬治鱿到y(tǒng)無需編程和預(yù)先參數(shù)設(shè)置,即可實時、動態(tài)地發(fā)現(xiàn)大數(shù)據(jù)庫數(shù)據(jù)的內(nèi)容、結(jié)構(gòu)和關(guān)系變化,通過有效下載、整合大數(shù)據(jù)而完成動態(tài)變化的可視化分析結(jié)果。其次,當(dāng)擬分析大數(shù)據(jù)資源總量有限、靜態(tài)和結(jié)構(gòu)簡單時,圖書館員可通過在館員個人終端電腦上安裝可視化分析平臺的客戶端程序,實現(xiàn)大數(shù)據(jù)的可視化移動分析。而當(dāng)大數(shù)據(jù)資源海量、結(jié)構(gòu)復(fù)雜和動態(tài)變化時,可視化分析平臺應(yīng)支持圖書館員將大數(shù)據(jù)傳輸?shù)娇梢暬治龉蚕矸?wù)器上,由高性能可視化分析服務(wù)器或者多臺用戶端設(shè)備,共同完成復(fù)雜大數(shù)據(jù)的可視化分析,并將分析結(jié)果傳輸?shù)綀D書館員客戶端上顯示。第三,可視化分析平臺還應(yīng)具備較強(qiáng)的人機(jī)交互性??梢暬治銎脚_通過對服務(wù)器運(yùn)行日志、系統(tǒng)安全漏洞和風(fēng)險監(jiān)測數(shù)據(jù)、數(shù)據(jù)中心硬件設(shè)備運(yùn)行效率數(shù)據(jù)、服務(wù)器負(fù)載變化等大數(shù)據(jù)的分析,將結(jié)果以動態(tài)的圖形、表格等方式展示出來,管理員依據(jù)分析結(jié)果對服務(wù)與安全管理系統(tǒng)的參數(shù)進(jìn)行設(shè)置和修正,最終通過智能化反饋控制有效保證服務(wù)系統(tǒng)性能最優(yōu)化[13]。
234 可視化分析應(yīng)以圖書館讀者個性化服務(wù)為中心
滿足讀者閱讀和服務(wù)保障任務(wù)需求,是圖書館大數(shù)據(jù)可視化分析系統(tǒng)構(gòu)建、運(yùn)營的中心工作。首先,圖書館應(yīng)利用視頻監(jiān)控設(shè)備、讀者閱讀行為監(jiān)控服務(wù)器、傳感器網(wǎng)絡(luò)和第三方運(yùn)營商API接口,全面、準(zhǔn)確、即時和便捷地采集與讀者閱讀活動相關(guān)的數(shù)據(jù)。通過對所采集的讀者相關(guān)數(shù)據(jù)的選擇、噪聲過濾和價值發(fā)現(xiàn),為每一名讀者構(gòu)建屬于自己的小數(shù)據(jù)庫,依靠小數(shù)據(jù)全面、準(zhǔn)確地展示讀者的個體特征和閱讀活動信息[14]。其次,對讀者個體的可視化分析應(yīng)基于圖書館小數(shù)據(jù)庫資源,實現(xiàn)從經(jīng)驗分析到定量分析的轉(zhuǎn)變。分析系統(tǒng)通過對讀者行為的可視化描述和過去行為的回溯、分析與判斷,在有效過濾噪聲行為數(shù)據(jù)后,準(zhǔn)確、清晰地表述出讀者內(nèi)在的個體閱讀需求和所處閱讀群體的閱讀意愿。有助于圖書館將具有相似特征和需求的讀者劃分為一個大的讀者群,通過采用為用戶群整體定制的服務(wù)方式而有效降低成本。同時,在嚴(yán)格控制服務(wù)成本的前提下,以個性化服務(wù)保障模式來滿足個體讀者的個性化閱讀服務(wù)需求。第三,讀者個性化閱讀服務(wù)具有個性化、持續(xù)性、多樣化和需求快速增長的特點(diǎn)。因此,圖書館對讀者個性化服務(wù)需求的分析,應(yīng)堅持實時數(shù)據(jù)和歷史數(shù)據(jù)相結(jié)合、靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)相結(jié)合的原則,準(zhǔn)確、實時地發(fā)現(xiàn)讀者新需求的產(chǎn)生和需求變化的總發(fā)展趨勢,以便更科學(xué)地做出大數(shù)據(jù)服務(wù)決策和提供服務(wù)。第四,讀者行為大數(shù)據(jù)可視化分析過程應(yīng)以有效保護(hù)讀者隱私安全為前提,不能片面強(qiáng)調(diào)可視化分析科學(xué)性和準(zhǔn)確度而侵犯讀者隱私,由讀者決定自身相關(guān)數(shù)據(jù)的采集、存儲、分析和應(yīng)用決策。endprint
3 結(jié)束語
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)已成為圖書館生產(chǎn)資料組成和服務(wù)生產(chǎn)力發(fā)展的重要因素。如何安全、高效、經(jīng)濟(jì)和快速地挖掘大數(shù)據(jù)價值,并將所獲得的知識運(yùn)用到圖書館基礎(chǔ)設(shè)施構(gòu)建、讀者個性化閱讀保障、客戶關(guān)系管理和服務(wù)模式變革中,成為關(guān)系圖書館服務(wù)能力建設(shè)和讀者QOS保障有效的關(guān)鍵。當(dāng)前,大數(shù)據(jù)可視化分析系統(tǒng)是圖書館精確發(fā)現(xiàn)數(shù)據(jù)價值,將所發(fā)現(xiàn)的數(shù)據(jù)價值轉(zhuǎn)化為知識和決策依據(jù),并以可視化形式直觀展示的有效途徑。圖書館在大數(shù)據(jù)可視化分析系統(tǒng)建設(shè)、應(yīng)用中,應(yīng)從自身大數(shù)據(jù)應(yīng)用的實際狀況、讀者服務(wù)保障的內(nèi)容和標(biāo)準(zhǔn)、IT基礎(chǔ)設(shè)施建設(shè)水平和大數(shù)據(jù)分析需求出發(fā),和第三方共同開發(fā)出符合自身環(huán)境特點(diǎn)和大數(shù)據(jù)應(yīng)用模式的可視化分析平臺,才能真正實現(xiàn)大數(shù)據(jù)與圖書館員、大數(shù)據(jù)與讀者、大數(shù)據(jù)與圖書館之間的“零距離”,才能為讀者服務(wù)全程提供安全、精確、經(jīng)濟(jì)和便捷的大數(shù)據(jù)可視化決策支持[4]。
參考文獻(xiàn)
[1]代雙鳳,董繼陽,薛健.科學(xué)計算中大數(shù)據(jù)可視化分析與應(yīng)用[J].工程研究——跨學(xué)科視野中的工程,2014,6(3):275-281.
[2]王宇燦,李一飛,袁勤儉.國際大數(shù)據(jù)研究熱點(diǎn)及前沿演化可視化分析[J].工程研究——跨學(xué)科視野中的工程,2014,6(3):282-293.
[3]游進(jìn)國,楊卓犖,胡建華,等.一種支持大規(guī)模數(shù)據(jù)的多維可視化分析框架[J].計算機(jī)工程,2011,37(19):26-31.
[4]何非,何克清.大數(shù)據(jù)及其科學(xué)問題與方法的探討[J].武漢大學(xué)學(xué)報:理學(xué)版,2014,60(1):1-12.
[5]牛春華,李慧佳.基于WOS數(shù)據(jù)的活動理論研究現(xiàn)狀可視化分析[J].圖書與情報,2014,(2):99-104.
[6]張志強(qiáng),何文春,朱江,等.基于B/S架構(gòu)的霧霾專題數(shù)據(jù)可視化服務(wù)系統(tǒng)設(shè)計與實現(xiàn)[J].計算機(jī)應(yīng)用,2014,32(s2):140-142.
[7]孫寧偉,趙瑜,劉勇,等.TVBRT:一種基于Radial Tree的具有度量屬性的多變元時態(tài)數(shù)據(jù)可視化方法[J].計算機(jī)科學(xué),2014,41(6):5-11,17.
[8]李久松,常曉峰,田豐林,等.海洋和大氣數(shù)據(jù)多模式動態(tài)可視化系統(tǒng)的設(shè)計和實現(xiàn)[J].海洋科學(xué),2014,38(1):10-14.
[9]李國杰.大數(shù)據(jù)研究的科學(xué)價值[J].中國計算機(jī)學(xué)會通訊,2012,8(9):8-15.
[10]周曉分,黃國彬,白雅楠.科學(xué)計量可視化軟件的對比與數(shù)據(jù)預(yù)處理研究[J].圖書與情報,2013,57(23):64-72.
[11]鄭偉連,楊敏潔,劉睿,等.基于MBD的檢測數(shù)據(jù)和三維模型關(guān)聯(lián)與可視化技術(shù)[J].航空精密制造技術(shù),2014,50(6):11-14,35.
[12]劉金碩,程力,王麗娜,等.利用CUDA的剪切波數(shù)據(jù)三維可視化[J].武漢大學(xué)學(xué)報:信息科學(xué)版,2013,38(11):1271-1275.
[13]Jiang D,Chen G,Ooi B C,et al.epiC:an Extensible and Scalable System for Processing Big Data[J].Proceedings of the VLDB Endowment,2014,7(7):1-12.
[14]楊良斌.關(guān)于科學(xué)計量學(xué)與可視化的若干問題探討[J].情報雜志,2012,31(4):2-3.
(本文責(zé)任編輯:郭沫含)endprint