馬曉亭( 蘭州財(cái)經(jīng)大學(xué)信息工程學(xué)院 蘭州 730020 )
·專(zhuān)題研究·
圖書(shū)館思維的變革:從小數(shù)據(jù)思維到大數(shù)據(jù)思維
馬曉亭
( 蘭州財(cái)經(jīng)大學(xué)信息工程學(xué)院 蘭州 730020 )
隨著互聯(lián)網(wǎng)的發(fā)展、智能閱讀終端設(shè)備的普及,圖書(shū)館的大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。大數(shù)據(jù)時(shí)代需要有大數(shù)據(jù)思維。大數(shù)據(jù)引發(fā)圖書(shū)館員重新認(rèn)識(shí)數(shù)據(jù)的價(jià)值,使得解決問(wèn)題的思維從追求因果關(guān)系向注重關(guān)聯(lián)關(guān)系方向轉(zhuǎn)變。因此,圖書(shū)館員的思維模式必須實(shí)現(xiàn)從小數(shù)據(jù)到大數(shù)據(jù)的轉(zhuǎn)變,才能從海量數(shù)據(jù)中獲取價(jià)值,才能為讀者提供滿(mǎn)意的個(gè)性化閱讀服務(wù)。
圖書(shū)館 大數(shù)據(jù)思維 變革
〔引用本文格式〕馬曉亭.圖書(shū)館思維的變革:從小數(shù)據(jù)思維到大數(shù)據(jù)思維[J].圖書(shū)館,2016(5):61-65
目前,圖書(shū)館界已進(jìn)入大數(shù)據(jù)時(shí)代。作為新的生產(chǎn)要素和生產(chǎn)力的重要組成部分,大數(shù)據(jù)已成為圖書(shū)館界服務(wù)模式變革、管理理念提升、服務(wù)生產(chǎn)力發(fā)展和讀者閱讀QOS保障的決定性因素。同時(shí),也為圖書(shū)館精準(zhǔn)發(fā)現(xiàn)讀者需求和優(yōu)化內(nèi)部業(yè)務(wù)流程,實(shí)現(xiàn)從以服務(wù)系統(tǒng)建設(shè)為中心向以讀者為中心的轉(zhuǎn)變,提供科學(xué)的大數(shù)據(jù)決策支持。
管理咨詢(xún)公司麥肯錫的報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》中給出的大數(shù)據(jù)定義是:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫(kù)工具獲取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集。并指出:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)要素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)?!保?]大數(shù)據(jù)研究專(zhuān)家維克托·邁爾-舍恩伯格和肯尼斯·庫(kù)克耶在編寫(xiě)的《大數(shù)據(jù)時(shí)代》一書(shū)中描述大數(shù)據(jù)具有Volume(海量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)的4“V”特性。并明確指出:大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系[2]。這條理論改變了人類(lèi)對(duì)外部未知世界的知識(shí)發(fā)現(xiàn)和思維方式,提高了人類(lèi)對(duì)外部世界認(rèn)知和交流的效率與準(zhǔn)確度。
伴隨大數(shù)據(jù)時(shí)代的到來(lái),圖書(shū)館數(shù)據(jù)環(huán)境呈現(xiàn)海量、數(shù)據(jù)總量指數(shù)級(jí)遞增、數(shù)據(jù)關(guān)系復(fù)雜和低價(jià)值密度的特點(diǎn)。傳統(tǒng)的實(shí)驗(yàn)科學(xué)、理論科學(xué)和計(jì)算科學(xué)模式,難以實(shí)時(shí)、準(zhǔn)確和快速地發(fā)現(xiàn)大數(shù)據(jù)中蘊(yùn)含的知識(shí)和數(shù)據(jù)關(guān)系,不能有效實(shí)現(xiàn)數(shù)據(jù)到知識(shí)、知識(shí)到技術(shù)、技術(shù)到創(chuàng)新、創(chuàng)新到服務(wù)之間的轉(zhuǎn)換。因此,圖書(shū)館必須轉(zhuǎn)變傳統(tǒng)的知識(shí)發(fā)現(xiàn)和思維理念,構(gòu)建全新、科學(xué)的大數(shù)據(jù)思維模式,才能高效、實(shí)時(shí)、精確和快速地發(fā)現(xiàn)大數(shù)據(jù)中蘊(yùn)含的價(jià)值,才能為讀者閱讀服務(wù)和圖書(shū)館發(fā)展提供可靠的大數(shù)據(jù)決策支持。
2.1大數(shù)據(jù)與大數(shù)據(jù)思維的關(guān)系
大數(shù)據(jù)的數(shù)量、范圍和價(jià)值密度,是決定大數(shù)據(jù)可用性和決策科學(xué)性的關(guān)鍵因素。因此,圖書(shū)館應(yīng)采用智能、自動(dòng)化和便捷的數(shù)據(jù)采集模式,在提高大數(shù)據(jù)采集總量、廣度和價(jià)值密度的前提下,大幅度降低圖書(shū)館大數(shù)據(jù)的采集成本。圖書(shū)館通常利用監(jiān)控服務(wù)器、服務(wù)器運(yùn)營(yíng)日志、網(wǎng)絡(luò)監(jiān)控器、視頻監(jiān)控系統(tǒng)、用戶(hù)閱讀終端、可穿戴閱讀設(shè)備和讀者管理系統(tǒng)等,完成圖書(shū)館相關(guān)大數(shù)據(jù)的采集[3]。
這些大數(shù)據(jù)具有數(shù)據(jù)海量、種類(lèi)繁多、低價(jià)值密度和高時(shí)效性的特點(diǎn),并且大數(shù)據(jù)的價(jià)值總量和價(jià)值密度是由數(shù)據(jù)的采集規(guī)模、顆粒度、多維度、活性和相關(guān)性共同作用。因此,大數(shù)據(jù)與有限數(shù)據(jù)在數(shù)據(jù)環(huán)境、數(shù)據(jù)特點(diǎn)和數(shù)據(jù)應(yīng)用方式等方面的差別,導(dǎo)致圖書(shū)館必須采取與傳統(tǒng)思維不同的大數(shù)據(jù)思維模式。首先,大數(shù)據(jù)思維摒棄了傳統(tǒng)思維對(duì)數(shù)據(jù)進(jìn)行隨機(jī)采樣分析的模式,實(shí)現(xiàn)了對(duì)海量大數(shù)據(jù)整體的全面性處理與分析。其次,大數(shù)據(jù)思維更加追求對(duì)數(shù)據(jù)復(fù)雜性和所蘊(yùn)含知識(shí)的挖掘,弱化了傳統(tǒng)思維模式對(duì)知識(shí)和信息的精準(zhǔn)發(fā)現(xiàn)。第三,大數(shù)據(jù)思維更加注重對(duì)數(shù)據(jù)相關(guān)性的發(fā)現(xiàn),而摒棄了傳統(tǒng)思維模式對(duì)事物因果關(guān)系的精準(zhǔn)探索。第四,大數(shù)據(jù)思維的最終目的是實(shí)現(xiàn)數(shù)據(jù)、知識(shí)、智慧和決策之間的轉(zhuǎn)化,為圖書(shū)館的變革、管理和用戶(hù)服務(wù)提供科學(xué)的大數(shù)據(jù)決策支持。
2.2圖書(shū)館大數(shù)據(jù)思維在數(shù)據(jù)應(yīng)用上的三個(gè)重大變化
圖書(shū)館大數(shù)據(jù)具有Volume(海量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)的4“V”特性,并且讀者對(duì)圖書(shū)館閱讀服務(wù)有精準(zhǔn)、智慧、實(shí)時(shí)和個(gè)性化的需求,因此,圖書(shū)館必須轉(zhuǎn)變傳統(tǒng)的大數(shù)據(jù)應(yīng)用理念,才能高效、全面、精確和低成本地挖掘、發(fā)現(xiàn)大數(shù)據(jù)價(jià)值。
對(duì)包括與圖書(shū)館變革、管理、運(yùn)營(yíng)和讀者服務(wù)相關(guān)的數(shù)據(jù)進(jìn)行全樣本采集,是圖書(shū)館大數(shù)據(jù)思維,在數(shù)據(jù)應(yīng)用與傳統(tǒng)隨機(jī)樣本處理理念上的一個(gè)重要區(qū)別。圖書(shū)館在傳統(tǒng)的數(shù)據(jù)采集分析中發(fā)現(xiàn),分析結(jié)果的精確性與數(shù)據(jù)采集的隨機(jī)性成正比關(guān)系,而與所采集數(shù)據(jù)的總量相關(guān)性較小。因此,采樣對(duì)象的局限性、方法的科學(xué)性、采樣周期在時(shí)間軸上的正態(tài)分布等,決定著圖書(shū)館采樣數(shù)據(jù)的價(jià)值和可用性,進(jìn)而影響著傳統(tǒng)數(shù)據(jù)思維模式的科學(xué)性和決策可靠性。伴隨圖書(shū)館大數(shù)據(jù)采集技術(shù)的發(fā)展和采集成本的大幅下降,數(shù)據(jù)采集已不是制約圖書(shū)館全量數(shù)據(jù)獲取和數(shù)據(jù)全維度保證的主要因素。圖書(shū)館可通過(guò)高效、實(shí)時(shí)、經(jīng)濟(jì)和低成本的全樣數(shù)據(jù)采集,從多角度和多層面挖掘大數(shù)據(jù)的價(jià)值,為大數(shù)據(jù)決策提供可靠支持。
多閱讀模式和個(gè)性化服務(wù)保障是讀者閱讀活動(dòng)發(fā)展的一個(gè)大趨勢(shì)。據(jù)統(tǒng)計(jì)分析,當(dāng)前圖書(shū)館大數(shù)據(jù)總量中僅有15%的數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù),而85%的大數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),且隨著圖書(shū)館服務(wù)模式的發(fā)展和變革,非結(jié)構(gòu)化數(shù)據(jù)所占大數(shù)據(jù)總量的比例逐年上升。受到數(shù)據(jù)采集技術(shù)、工具和方法的影響,大數(shù)據(jù)的采集與有限數(shù)據(jù)采集相比,具有較高的不精確性和較低的價(jià)值密度。圖書(shū)館大數(shù)據(jù)思維應(yīng)重點(diǎn)關(guān)注大數(shù)據(jù)帶來(lái)的高價(jià)值和新洞察屬性,通過(guò)數(shù)據(jù)的過(guò)濾與清洗過(guò)程,消除大數(shù)據(jù)不精確、高混雜性、低價(jià)值密度和實(shí)時(shí)性等特性對(duì)大數(shù)據(jù)思維的不利影響。
大數(shù)據(jù)思維致力于對(duì)數(shù)據(jù)之間相關(guān)關(guān)系的分析與發(fā)現(xiàn),取代了傳統(tǒng)探求事物因果關(guān)系的思維模式,這是大數(shù)據(jù)思維的又一個(gè)重大變化。讀者在閱讀活動(dòng)中,其閱讀需求、閱讀行為、閱讀模式和閱讀社會(huì)關(guān)系數(shù)據(jù)的產(chǎn)生具有較強(qiáng)的隨機(jī)性。圖書(shū)館通過(guò)對(duì)這些不相關(guān)大數(shù)據(jù)的整理、清洗、轉(zhuǎn)換和分析,可發(fā)現(xiàn)大數(shù)據(jù)之間隱匿的相關(guān)性和知識(shí),并基于圖書(shū)館大數(shù)據(jù)分析系統(tǒng)的“分析即服務(wù)”支持,為讀者個(gè)性化閱讀活動(dòng)提供科學(xué)、即時(shí)的大數(shù)據(jù)決策支持,而不必過(guò)分探究與讀者閱讀活動(dòng)QOS保證無(wú)關(guān)的事物因果關(guān)系。
2.3大數(shù)據(jù)思維與圖書(shū)館的大規(guī)模個(gè)性化定制服務(wù)
大數(shù)據(jù)研究權(quán)威維克托·邁爾-舍恩伯格教授在其著作《大數(shù)據(jù)時(shí)代》中描述:大量的數(shù)據(jù)能夠讓傳統(tǒng)行業(yè)更好地了解客戶(hù)需求,提供個(gè)性化的服務(wù)[4]。隨著云計(jì)算技術(shù)的發(fā)展及其在圖書(shū)館界應(yīng)用的深入,圖書(shū)館的大數(shù)據(jù)采集、存儲(chǔ)、計(jì)算和傳輸效率快速提升,其應(yīng)用成本在服務(wù)總成本中所占比例大幅度下降。圖書(shū)館可利用云計(jì)算技術(shù),對(duì)讀者閱讀活動(dòng)相關(guān)大數(shù)據(jù)進(jìn)行全面的采集、高效處理、精準(zhǔn)分析和科學(xué)決策,以此來(lái)掌握每一位讀者的閱讀需求、模式、愛(ài)好和習(xí)慣,并為龐大的讀者群提供大規(guī)模的個(gè)性化定制服務(wù)。因此,如何提升圖書(shū)館大規(guī)模個(gè)性化定制服務(wù)的效率、精確度、實(shí)時(shí)性和QOS(服務(wù)質(zhì)量)保證有效性,是圖書(shū)館大數(shù)據(jù)思維應(yīng)重點(diǎn)關(guān)注的一個(gè)問(wèn)題。
大數(shù)據(jù)的4“V”特性,使得圖書(shū)館大數(shù)據(jù)思維必須堅(jiān)持全面、連續(xù)、大規(guī)模和快速的數(shù)據(jù)應(yīng)用原則,來(lái)替代傳統(tǒng)小數(shù)據(jù)思維抽樣、片面、局部的模式。通過(guò)對(duì)大數(shù)據(jù)全體的價(jià)值發(fā)現(xiàn)、挖掘、分析和決策,可對(duì)圖書(shū)館的服務(wù)模式變革、讀者需求發(fā)展、系統(tǒng)管理運(yùn)營(yíng)和外部競(jìng)爭(zhēng)環(huán)境變化宏觀趨勢(shì),給出科學(xué)、高效、實(shí)時(shí)、經(jīng)濟(jì)的預(yù)測(cè)和決策支持。因此,大數(shù)據(jù)思維的一個(gè)主體就是堅(jiān)持以讀者為中心的思維模式。
此外,為龐大的讀者群定制個(gè)性化的產(chǎn)品和服務(wù),是圖書(shū)館服務(wù)模式變革的一個(gè)重要方向。在個(gè)性化服務(wù)的定制中,如何在保證服務(wù)滿(mǎn)足讀者個(gè)性化需求的前提下,具有較低的服務(wù)成本投入和較高的實(shí)時(shí)性保證,是關(guān)系圖書(shū)館服務(wù)投資收益率的一個(gè)重要問(wèn)題。因此,大數(shù)據(jù)思維應(yīng)基于海量數(shù)據(jù)的決策支持,從關(guān)注事物因果性轉(zhuǎn)向數(shù)據(jù)之間關(guān)聯(lián)性,從因果關(guān)系的串聯(lián)思維轉(zhuǎn)向大數(shù)據(jù)相關(guān)關(guān)系的并聯(lián)思維,努力提升圖書(shū)館對(duì)讀者閱讀需求和服務(wù)變革發(fā)展的感知力,才能實(shí)現(xiàn)讀者大規(guī)模個(gè)性化服務(wù)定制從量變到質(zhì)變的過(guò)程[5]。
2.4“小數(shù)據(jù)思維”與“大數(shù)據(jù)思維”
“小數(shù)據(jù)”環(huán)境下,圖書(shū)館的思維與決策常常依據(jù)管理者對(duì)事物發(fā)展的假設(shè)做出,以及管理層在圖書(shū)館建設(shè)、運(yùn)營(yíng)和讀者服務(wù)過(guò)程中的經(jīng)驗(yàn)來(lái)制定,然后通過(guò)對(duì)“小數(shù)據(jù)”的采集、分析和判斷,來(lái)驗(yàn)證小數(shù)據(jù)思維與決策的正確性和可行性。這種“小數(shù)據(jù)”思維模式具有較強(qiáng)的主觀性、隨機(jī)性和不確定性。大數(shù)據(jù)思維通過(guò)對(duì)海量、全景數(shù)據(jù)的實(shí)時(shí)分析,可準(zhǔn)確發(fā)現(xiàn)大數(shù)據(jù)中隱匿的數(shù)據(jù)相關(guān)性和知識(shí),并基于在大數(shù)據(jù)中發(fā)現(xiàn)的知識(shí)來(lái)進(jìn)行大數(shù)據(jù)決策,具有科學(xué)、高效、實(shí)時(shí)和快速的特點(diǎn)。與“小數(shù)據(jù)思維”相比,“大數(shù)據(jù)思維”位于新的數(shù)據(jù)環(huán)境和思維模式中,面臨著諸多新的挑戰(zhàn)。
核心數(shù)據(jù)是關(guān)系圖書(shū)館發(fā)展變革、運(yùn)營(yíng)管理、QOS保證和綜合競(jìng)爭(zhēng)力提升的關(guān)鍵數(shù)據(jù),是圖書(shū)館大數(shù)據(jù)的重要組成。首先,圖書(shū)館在大數(shù)據(jù)思維中,往往過(guò)分強(qiáng)調(diào)對(duì)全量數(shù)據(jù)的實(shí)時(shí)、快速處理和分析,而忽視了核心數(shù)據(jù)在圖書(shū)館核心業(yè)務(wù)決策中的重要性,導(dǎo)致圖書(shū)館在大數(shù)據(jù)決策中主次不分,影響了服務(wù)的總體收益率。其次,從數(shù)據(jù)的來(lái)源和范圍劃分,圖書(shū)館大數(shù)據(jù)可分為內(nèi)部數(shù)據(jù)與外圍數(shù)據(jù)兩大部分。如何通過(guò)內(nèi)部數(shù)據(jù)與外圍數(shù)據(jù)的整合,增強(qiáng)圖書(shū)館大數(shù)據(jù)之間的交互性和關(guān)聯(lián)性,是實(shí)現(xiàn)圖書(shū)館大數(shù)據(jù)二次增值和提升數(shù)據(jù)價(jià)值總量、可用性、可控性的關(guān)鍵。第三,圖書(shū)館的云計(jì)算技術(shù)水平、數(shù)據(jù)的共享與開(kāi)放程度、大數(shù)據(jù)的分析能力、大數(shù)據(jù)算法科學(xué)性、管理人員的大數(shù)據(jù)素養(yǎng)、主體業(yè)務(wù)對(duì)大數(shù)據(jù)思維的依賴(lài)程度等,都是關(guān)系圖書(shū)館大數(shù)據(jù)思維有效性的關(guān)鍵因素,圖書(shū)館在上述任何一個(gè)主要環(huán)節(jié)的失誤,都會(huì)影響大數(shù)據(jù)思維的科學(xué)性和準(zhǔn)確性[6]。第四,時(shí)效性是圖書(shū)館大數(shù)據(jù)的一個(gè)根本特性,因此,大數(shù)據(jù)思維隨著大數(shù)據(jù)生命周期的發(fā)展,也會(huì)有一個(gè)發(fā)展、成長(zhǎng)、成熟、衰退和消亡的過(guò)程。圖書(shū)館如何依據(jù)大數(shù)據(jù)生命周期發(fā)展規(guī)律,構(gòu)建科學(xué)的大數(shù)據(jù)思維失效預(yù)警機(jī)制,是保證大數(shù)據(jù)思維與決策科學(xué)、可用的關(guān)鍵。
3.1圖書(shū)館大數(shù)據(jù)思維應(yīng)實(shí)現(xiàn)四個(gè)緯度的轉(zhuǎn)變
隨著云計(jì)算和網(wǎng)絡(luò)傳輸技術(shù)的發(fā)展,數(shù)據(jù)的采集、傳輸、存儲(chǔ)、處理和分析技術(shù),已不是影響圖書(shū)館數(shù)據(jù)思維科學(xué)性的主要因素,圖書(shū)館的思維模式已從小數(shù)據(jù)樣本思維轉(zhuǎn)向大數(shù)據(jù)整體思維,使圖書(shū)館能夠全面、立體和系統(tǒng)地認(rèn)識(shí)自身組織結(jié)構(gòu)和服務(wù)的相關(guān)性?;诖髷?shù)據(jù)的4“V”特性,圖書(shū)館大數(shù)據(jù)思維應(yīng)實(shí)現(xiàn)四個(gè)緯度的轉(zhuǎn)變。
首先,是從定量思維向總體思維的轉(zhuǎn)變。維克托·邁爾-舍恩伯格認(rèn)為:“我們總是習(xí)慣把統(tǒng)計(jì)抽樣看作文明得以建立的牢固基石,就如同幾何學(xué)定理和萬(wàn)有引力定律一樣。但是,統(tǒng)計(jì)抽樣其實(shí)只是為了在技術(shù)受限的特定時(shí)期,解決當(dāng)時(shí)存在的一些特定問(wèn)題而產(chǎn)生的,其歷史不足一百年。如今,技術(shù)環(huán)境已經(jīng)有了很大的改善。在大數(shù)據(jù)時(shí)代進(jìn)行抽樣分析就像是在汽車(chē)時(shí)代騎馬一樣。在某些特定的情況下,我們依然可以使用樣本分析法,但這不再是我們分析數(shù)據(jù)的主要方式。[7]”當(dāng)前,圖書(shū)館數(shù)據(jù)環(huán)境已實(shí)現(xiàn)了從抽樣本數(shù)據(jù)到全樣本數(shù)據(jù)的轉(zhuǎn)變,傳統(tǒng)小數(shù)據(jù)的精準(zhǔn)性思維向混亂、復(fù)雜的大數(shù)據(jù)整體思維轉(zhuǎn)化,從探尋事物因果關(guān)系向發(fā)現(xiàn)大數(shù)據(jù)間的規(guī)律、相關(guān)性轉(zhuǎn)化,這必然要求圖書(shū)館應(yīng)站在全數(shù)據(jù)高度,堅(jiān)持總體思維的方式。
其次,是從精確思維向容錯(cuò)思維的轉(zhuǎn)變。在“小數(shù)據(jù)”環(huán)境下,圖書(shū)館受到數(shù)據(jù)采集、傳輸、處理和計(jì)算技術(shù)的限制,具有數(shù)據(jù)采集總量小、數(shù)據(jù)采集隨機(jī)性強(qiáng)和數(shù)據(jù)價(jià)值密度分布不均勻的特點(diǎn)。因此,為了提升小數(shù)據(jù)思維、決策的科學(xué)性和精確度,圖書(shū)館必須保證有限小數(shù)據(jù)精確、結(jié)構(gòu)化、高價(jià)值和可控,并通過(guò)小數(shù)據(jù)精確思維來(lái)彌補(bǔ)圖書(shū)館在數(shù)據(jù)采集、傳輸、處理和計(jì)算能力上的不足。大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的價(jià)值總量、相關(guān)性是關(guān)系圖書(shū)館大數(shù)據(jù)可用性的最重要因素。因此,圖書(shū)館必須降低對(duì)數(shù)據(jù)精確性、價(jià)值密度和結(jié)構(gòu)化程度的要求,適當(dāng)忽略數(shù)據(jù)在微觀層面上的精確度,將“小數(shù)據(jù)”的精確思維向“大數(shù)據(jù)”的容錯(cuò)思維模式轉(zhuǎn)變。
第三,完成從因果思維向相關(guān)思維的轉(zhuǎn)變。舍恩伯格指出:“大數(shù)據(jù)的出現(xiàn)讓人們放棄了對(duì)因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系,人們只需知道是什么,而不用知道為什么。[8]”小數(shù)據(jù)樣本的有限性,導(dǎo)致小數(shù)據(jù)所擁有的價(jià)值總量和數(shù)據(jù)可用性有限,只能幫助圖書(shū)館解析、證明具體事物內(nèi)部的因果關(guān)系,而不能有效揭示數(shù)據(jù)之間隱匿的復(fù)雜數(shù)據(jù)關(guān)系和巨量知識(shí)。大數(shù)據(jù)思維可以幫助圖書(shū)館挖掘出大數(shù)據(jù)之間存在的復(fù)雜、非線性相關(guān)關(guān)系,理解圖書(shū)館管理員、服務(wù)基礎(chǔ)設(shè)施、讀者和服務(wù)競(jìng)爭(zhēng)環(huán)境之間的復(fù)雜相關(guān)性,而不需要知道事物或現(xiàn)象背后的復(fù)雜深層原因,可直接為圖書(shū)館提供大數(shù)據(jù)決策支持服務(wù)。
第四,實(shí)現(xiàn)從人工思維向智能思維的轉(zhuǎn)變。通過(guò)智慧的感知、分析、集成,來(lái)增強(qiáng)圖書(shū)館的讀者個(gè)性化服務(wù)響應(yīng)、信息資源融合、服務(wù)平臺(tái)協(xié)同和智能服務(wù)能力,是不斷提高讀者個(gè)性化推送服務(wù)效率、精確性、交互性、時(shí)效性、連續(xù)性和業(yè)務(wù)彈性的關(guān)鍵。小數(shù)據(jù)時(shí)代,圖書(shū)館的管理、服務(wù)系統(tǒng)處于人工智慧與自動(dòng)化相結(jié)合的半智慧狀態(tài),系統(tǒng)的思維方式屬于線性、簡(jiǎn)單、物理的自然思維,不能象“人腦”一樣主動(dòng)、立體、邏輯地分析數(shù)據(jù),并在分析過(guò)程中實(shí)現(xiàn)自主學(xué)習(xí)和智慧思維。大數(shù)據(jù)時(shí)代,圖書(shū)館基于大數(shù)據(jù)思維而獲得的知識(shí)和經(jīng)驗(yàn),可與物聯(lián)網(wǎng)、云計(jì)算、社會(huì)計(jì)算、可視化技術(shù)等相結(jié)合,實(shí)現(xiàn)了機(jī)器設(shè)備和服務(wù)系統(tǒng)從自然思維向智能思維的轉(zhuǎn)變,提升了圖書(shū)館的智慧思維和智慧服務(wù)的能力。
3.2圖書(shū)館大數(shù)據(jù)思維必須以數(shù)據(jù)價(jià)值為中心
當(dāng)前,隨著高速無(wú)線傳輸網(wǎng)絡(luò)、云計(jì)算技術(shù)和閱讀終端制造技術(shù)的發(fā)展,圖書(shū)館的用戶(hù)服務(wù)已能夠滿(mǎn)足讀者實(shí)時(shí)閱讀、支持快速移動(dòng)和高速視頻播放的需求。圖書(shū)館在讀者閱讀服務(wù)過(guò)程中產(chǎn)生的大數(shù)據(jù),除具備4“V”特性外,還具有在線數(shù)據(jù)采集、全景數(shù)據(jù)和可實(shí)時(shí)快速調(diào)用的特點(diǎn)。同時(shí),圖書(shū)館大數(shù)據(jù)也隨著圖書(shū)館服務(wù)模式的變革和發(fā)展,其價(jià)值總量和可用性快速累積、提升,已成為決定圖書(shū)館服務(wù)生產(chǎn)力提升和服務(wù)模式科學(xué)變革的決策依據(jù)和可靠保證。因此,圖書(shū)館大數(shù)據(jù)思維必須以數(shù)據(jù)的價(jià)值為中心,才能保證大數(shù)據(jù)價(jià)值的完全發(fā)現(xiàn)和科學(xué)思維。
傳統(tǒng)小數(shù)據(jù)環(huán)境下,圖書(shū)館在數(shù)據(jù)的取樣、處理、分析和決策過(guò)程往往注重以流程為中心,科學(xué)的流程雖然可以提高結(jié)構(gòu)化小數(shù)據(jù)的思維效率、準(zhǔn)確性和經(jīng)濟(jì)性,但無(wú)法解決大數(shù)據(jù)本身存在的數(shù)據(jù)海量、非結(jié)構(gòu)化、復(fù)雜相關(guān)性和低價(jià)值密度等問(wèn)題。因此,大數(shù)據(jù)思維應(yīng)從流程為中心轉(zhuǎn)變到以數(shù)據(jù)為中心,在大數(shù)據(jù)的采集、傳輸、處理、存儲(chǔ)和計(jì)算上體現(xiàn)出數(shù)據(jù)核心的理念,不斷提升大數(shù)據(jù)的價(jià)值密度和可用、可控性[9]。
此外,圖書(shū)館在讀者的服務(wù)定制和服務(wù)提供中,應(yīng)將以產(chǎn)品服務(wù)功能為中心轉(zhuǎn)變到數(shù)據(jù)價(jià)值為中心上來(lái)。圖書(shū)館在讀者服務(wù)中,應(yīng)利用視頻監(jiān)控設(shè)備、傳感器網(wǎng)絡(luò)、監(jiān)控服務(wù)器和閱讀終端等設(shè)備,采集與讀者個(gè)性化閱讀服務(wù)相關(guān)的大數(shù)據(jù)。通過(guò)圖書(shū)館大數(shù)據(jù)總量的不斷積累和增長(zhǎng),實(shí)現(xiàn)大數(shù)據(jù)到知識(shí)、知識(shí)到科學(xué)決策、科學(xué)決策到服務(wù)保障的轉(zhuǎn)變,完成圖書(shū)館個(gè)性化定制服務(wù)從量變到質(zhì)變轉(zhuǎn)變的過(guò)程。
大數(shù)據(jù)價(jià)值的準(zhǔn)確發(fā)現(xiàn)和完全提取,是關(guān)系圖書(shū)館大數(shù)據(jù)思維科學(xué)性的又一個(gè)重要因素。伴隨云計(jì)算技術(shù)和數(shù)據(jù)處理算法效率的不斷提升,圖書(shū)館的數(shù)據(jù)處理和計(jì)算能力快速增長(zhǎng),但仍不能滿(mǎn)足圖書(shū)館以指數(shù)級(jí)增長(zhǎng)的大數(shù)據(jù)處理需求。因此,圖書(shū)館的大數(shù)據(jù)思維應(yīng)放棄對(duì)海量數(shù)據(jù)處理精度的要求,而將關(guān)注點(diǎn)放在對(duì)大數(shù)據(jù)價(jià)值挖掘的效率和總量上,不斷提升大數(shù)據(jù)思維的效率、速度和實(shí)時(shí)性。
3.3數(shù)據(jù)開(kāi)放與共享是圖書(shū)館大數(shù)據(jù)思維的必要前提
大數(shù)據(jù)時(shí)代,伴隨用戶(hù)服務(wù)和讀者閱讀模式多樣性的發(fā)展,圖書(shū)館的大數(shù)據(jù)呈現(xiàn)出多源、海量、實(shí)時(shí)和動(dòng)態(tài)變化的新發(fā)展趨勢(shì)。圖書(shū)館可利用可穿戴閱讀終端、智能網(wǎng)絡(luò)、物聯(lián)網(wǎng)等,將所有的用戶(hù)服務(wù)過(guò)程相關(guān)信息和知識(shí)數(shù)據(jù)化,才能確保圖書(shū)館全面、適時(shí)感知讀者的閱讀行為和準(zhǔn)確判定用戶(hù)服務(wù)質(zhì)量。
CUP、內(nèi)存儲(chǔ)器和電池性能,是制約圖書(shū)館大數(shù)據(jù)移動(dòng)采集、實(shí)時(shí)處理和快速存儲(chǔ)有效性的瓶頸因素。隨著科技的發(fā)展,圖書(shū)館服務(wù)設(shè)備和讀者閱讀終端的CUP呈現(xiàn)高集成、多核、超高速緩存和散熱性好的特點(diǎn);內(nèi)存儲(chǔ)器具有巨量存儲(chǔ)、高速傳輸和體積小等優(yōu)點(diǎn),此外,電池能量的效率高轉(zhuǎn)換、微型、低損耗和持續(xù)工作等特性,可支持圖書(shū)館移動(dòng)、高速、動(dòng)態(tài)和不間斷地采集與處理數(shù)據(jù)。因此,對(duì)自身大數(shù)據(jù)的采集、處理和存儲(chǔ)能力,已不是影響圖書(shū)館大數(shù)據(jù)思維科學(xué)性的主要因素。如何實(shí)現(xiàn)圖書(shū)館不同部門(mén)之間、圖書(shū)館與相關(guān)第三方服務(wù)商之間的數(shù)據(jù)開(kāi)放和共享,已成為關(guān)系圖書(shū)館大數(shù)據(jù)價(jià)值總量快速增長(zhǎng)和二次增值的重要問(wèn)題[10]。
蘋(píng)果、百度、Facebook、Google、Amazon等公司是世界著名的信息服務(wù)與咨詢(xún)公司,所擁有的大數(shù)據(jù)總價(jià)值、大數(shù)據(jù)發(fā)現(xiàn)與處理效率、大數(shù)據(jù)的二次增值能力,是關(guān)系這些公司競(jìng)爭(zhēng)力和未來(lái)發(fā)展的關(guān)鍵因素。圖書(shū)館可在保證讀者服務(wù)安全性和用戶(hù)隱私的前提下,將讀者服務(wù)與上述公司的軟硬件產(chǎn)品結(jié)合,完成對(duì)讀者服務(wù)前置產(chǎn)品和海量用戶(hù)數(shù)據(jù)入口的掌控。并通過(guò)對(duì)海量、異構(gòu)、持續(xù)更新和跨行業(yè)的數(shù)據(jù)共享,實(shí)現(xiàn)圖書(shū)館大數(shù)據(jù)的開(kāi)放、共享、融合和二次增值[11]。
3.4大數(shù)據(jù)思維應(yīng)以讀者個(gè)性化服務(wù)定制為目的
目前,隨著圖書(shū)館生產(chǎn)要素組成和數(shù)據(jù)環(huán)境的變化,其思維模式正在從互聯(lián)網(wǎng)思維向大數(shù)據(jù)思維轉(zhuǎn)型?;ヂ?lián)網(wǎng)環(huán)境下,網(wǎng)絡(luò)是圖書(shū)館服務(wù)承載和信息交流的主要載體,圖書(shū)館通過(guò)互聯(lián)網(wǎng)完成讀者閱讀體驗(yàn)反饋、服務(wù)質(zhì)量評(píng)估、CRM(客戶(hù)關(guān)系管理)和優(yōu)質(zhì)客戶(hù)群發(fā)展等工作。但其有限的數(shù)據(jù)采集、傳輸、存儲(chǔ)和處理能力,已無(wú)法滿(mǎn)足圖書(shū)館對(duì)海量服務(wù)與讀者個(gè)體數(shù)據(jù)的大數(shù)據(jù)應(yīng)用。大數(shù)據(jù)時(shí)代,圖書(shū)館通過(guò)大數(shù)據(jù)的全面采集、深度挖掘、系統(tǒng)分析和科學(xué)決策,實(shí)現(xiàn)了對(duì)服務(wù)和用戶(hù)更加全面、詳細(xì)和精準(zhǔn)的認(rèn)知,有效保證了讀者閱讀服務(wù)更加智慧、精準(zhǔn)和個(gè)性化。
圖書(shū)館大數(shù)據(jù)思維應(yīng)以讀者個(gè)性化服務(wù)定制為目的,就是要求圖書(shū)館依靠大數(shù)據(jù)完成讀者的精準(zhǔn)畫(huà)像,使圖書(shū)館明確讀者是誰(shuí)?有什么個(gè)性化閱讀需求?閱讀社會(huì)關(guān)系是什么?閱讀模式是什么?閱讀習(xí)慣是什么?同時(shí),圖書(shū)館還應(yīng)基于第三方服務(wù)商的大數(shù)據(jù)資源支持,對(duì)所定制讀者服務(wù)的個(gè)性化精準(zhǔn)性進(jìn)行判定和評(píng)估,依據(jù)讀者個(gè)性化需求進(jìn)行動(dòng)態(tài)的閾值設(shè)置與校正。此外,圖書(shū)館大數(shù)據(jù)思維的另一個(gè)重要目的,是通過(guò)大數(shù)據(jù)實(shí)現(xiàn)對(duì)讀者個(gè)性化服務(wù)未來(lái)發(fā)展趨勢(shì)的科學(xué)預(yù)測(cè),并依靠預(yù)測(cè)結(jié)果對(duì)用戶(hù)服務(wù)系統(tǒng)進(jìn)行改進(jìn)和完善,使服務(wù)系統(tǒng)具備自主學(xué)習(xí)、自我優(yōu)化、自動(dòng)分析和自覺(jué)決策的智能功能,最終實(shí)現(xiàn)圖書(shū)館讀者個(gè)性化服務(wù)定制的智慧感知、智慧管理、智慧服務(wù)和智慧決策[12]。
目前,圖書(shū)館已進(jìn)入大數(shù)據(jù)時(shí)代。隨著數(shù)據(jù)采集技術(shù)、云計(jì)算與云存儲(chǔ)技術(shù)、高速網(wǎng)絡(luò)傳輸技術(shù)的發(fā)展,圖書(shū)館的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)傳輸性能已不是影響其大數(shù)據(jù)應(yīng)用的關(guān)鍵因素。圖書(shū)館已能夠安全、高效、快速和經(jīng)濟(jì)地,從海量、快速變化、多類(lèi)型和低價(jià)值密度的大數(shù)據(jù)中發(fā)現(xiàn)與挖掘數(shù)據(jù)價(jià)值,為圖書(shū)館的管理與決策提供可靠的大數(shù)據(jù)支持。大數(shù)據(jù)思維、決策的科學(xué)性與可用性,已成為關(guān)系圖書(shū)館大數(shù)據(jù)價(jià)值發(fā)現(xiàn)和科學(xué)決策的重要因素。
隨著圖書(shū)館大數(shù)據(jù)應(yīng)用環(huán)境和主要矛盾的轉(zhuǎn)變,其傳統(tǒng)的計(jì)算和思維方式已不適應(yīng)新型大數(shù)據(jù)應(yīng)用的需求,圖書(shū)館員應(yīng)重新構(gòu)建符合大數(shù)據(jù)應(yīng)用實(shí)際的思維模式。在大數(shù)據(jù)新思維模式的構(gòu)建中,圖書(shū)館必須將大數(shù)據(jù)思維與讀者閱讀服務(wù)需求相結(jié)合,結(jié)合大數(shù)據(jù)環(huán)境變化實(shí)際和大數(shù)據(jù)決策需求,實(shí)現(xiàn)樣本數(shù)據(jù)思維到全體數(shù)據(jù)思維、精確思維到混雜性思維、因果關(guān)系思維到相關(guān)關(guān)系思維的轉(zhuǎn)變[13]。同時(shí),大數(shù)據(jù)思維還應(yīng)注重讀者的隱私保護(hù),提升讀者對(duì)大數(shù)據(jù)決策和大數(shù)據(jù)服務(wù)的可信度,才能確保圖書(shū)館員大數(shù)據(jù)思維的科學(xué)性和精確性,才能構(gòu)建安全、高效、智慧和低碳的圖書(shū)館,才能為讀者提供基于科學(xué)大數(shù)據(jù)思維支撐的個(gè)性化智慧閱讀服務(wù)。
(來(lái)稿時(shí)間:2015年12月)
1.(英)維克托 · 邁爾-舍恩伯格,(英)肯尼思 · 庫(kù)克耶.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤, 譯.杭州:浙江人民出版社,2013:17-21
2.高琳.大數(shù)據(jù)思維與圖書(shū)館知識(shí)資源發(fā)現(xiàn)[J].圖書(shū)與情報(bào),2015(1):122-124
3.鄔賀銓.大數(shù)據(jù)思維[J].科學(xué)與社會(huì),2014, 4(1):1-13
4.王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013, 36(6):1125-1138
5.和婷.大數(shù)據(jù)思維對(duì)圖書(shū)館信息服務(wù)工作的啟示[J].圖書(shū)館建設(shè), 2014(1):64-68
6.楊繹.基于文獻(xiàn)計(jì)量的“大數(shù)據(jù)”研究[J].圖書(shū)館雜志,2012(9):29-32,37
7.大數(shù)據(jù)帶來(lái)的四種思維[EB/OL]. [2015-11-01].http:// www.techxue.com/techxue-12814-1.html
8. Cox B L, Jantti M H. Capturing Business Intelligence Required for Targeted Marketing, Demonstrating Value, and Driving Process Improvement [J].Library & Information Science Research,2012, 34(4):308-316
9.馮登國(guó),張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(1):246-258
10. NetApp .Big Data Solutions for Government [EB/OL]. [2015-11-01]. http://www.netapp.com/us/solutions/industry/ government/bigdata.html
11.陳宇新.互聯(lián)網(wǎng)思維PK 大數(shù)據(jù)思維[EB/OL]. [2015-11-02]. http://mt.sohu.com/20140819/n403586440.shtml
12.陳臣.基于大數(shù)據(jù)的圖書(shū)館個(gè)性化智慧服務(wù)體系構(gòu)建[J].情報(bào)資料工作, 2013(6):75-79
13.(英)維克托·邁爾-舍恩伯格.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].周濤, 譯. 浙江:浙江人民出版社, 2013:78-83
Change of Library Thinking : From Little Data Thinking to Big Data Thinking
Ma Xiaoting
( School of Information Engineering, Lanzhou university of Finance and Economics )
〕With the development of the internet industry, popularity of smart reading terminals, the era of big data in library has arrived, the era of big data requires big data thinking. Big data make librarian rethink of the value of data, and the pursuit of causality shifts to the pursuit of relevance in problem solving. So the librarian’s thinking must change from little data thinking to big data thinking, to get value from endless data, and can provide satisfactory personalized reading service for readers.
〕Library Big data thinking Change
G250.76
馬曉亭(1974-),女,碩士,副教授,研究方向:大數(shù)據(jù)、數(shù)字圖書(shū)館建設(shè)。