路厚旺
摘 要:隨著大數(shù)據(jù)時(shí)代到來(lái),圖書(shū)館知識(shí)服務(wù)面臨兩個(gè)日益凸顯的矛盾,其一是知識(shí)爆炸性增長(zhǎng)與用戶選擇能力局限性之間的矛盾,其二是信息量極度豐富和用戶感興趣信息局限性之間的矛盾。圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)的個(gè)性化推薦技術(shù)是圖書(shū)館知識(shí)服務(wù)一個(gè)有效工具。圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)的個(gè)性化推薦是將讀者興趣、知識(shí)領(lǐng)域等關(guān)聯(lián)信息加工為能夠生動(dòng)描述讀者偏好的知識(shí)元,由此來(lái)支持?jǐn)?shù)字圖書(shū)館各種推薦服務(wù),最終為用戶提供滿足其個(gè)性化需求的知識(shí)資源。面對(duì)海量的知識(shí)資源,用戶的需求并非一成不變,會(huì)隨著其所處的環(huán)境與場(chǎng)景 (情境) 變化而發(fā)生變化。但目前大多數(shù)圖書(shū)館對(duì)情境因素的感知能力不足,因此難以為圖書(shū)館用戶提供與其情境最為匹配的精準(zhǔn)個(gè)性化服務(wù)。
關(guān)鍵詞:圖書(shū)館;大數(shù)據(jù)知識(shí);服務(wù)系統(tǒng);用戶動(dòng)力機(jī)制分析
隨著大數(shù)據(jù)時(shí)代到來(lái),圖書(shū)館知識(shí)服務(wù)面臨兩個(gè)日益凸顯的矛盾,其一是知識(shí)爆炸性增長(zhǎng)與用戶選擇能力局限性之間的矛盾,其二是信息量極度豐富和用戶感興趣信息局限性之間的矛盾。圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)的個(gè)性化推薦技術(shù)是圖書(shū)館解決該矛盾的一個(gè)有效工具。下問(wèn)將詳細(xì)分析怎樣進(jìn)行圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)系統(tǒng)用戶動(dòng)力機(jī)制建設(shè)。
一、大數(shù)據(jù)思維與用戶中心論的有機(jī)結(jié)合
大數(shù)據(jù)知識(shí)服務(wù)是在原有的知識(shí)服務(wù)概念基礎(chǔ)上,引入大數(shù)據(jù)思維和技術(shù),利用大數(shù)據(jù)工具和平臺(tái),基于大數(shù)據(jù)知識(shí)組織,提供滿足用戶信息和知識(shí)需求的服務(wù)模式。大數(shù)據(jù)思維強(qiáng)調(diào)從傳統(tǒng)的抽樣到全樣思維、從過(guò)去的精準(zhǔn)到容錯(cuò)思維、從單一的因果關(guān)系拓展到相關(guān)關(guān)系。圖書(shū)館可以在大量占有用戶數(shù)據(jù)的基礎(chǔ)上對(duì)用戶進(jìn)行現(xiàn)實(shí)和潛在的需求分析; 且人口屬性數(shù)據(jù)、行為數(shù)據(jù)、態(tài)度評(píng)價(jià)數(shù)據(jù)等各種數(shù)據(jù)存在關(guān)聯(lián)性,在數(shù)據(jù)量保證的前提下產(chǎn)生數(shù)據(jù)質(zhì)的飛越,使得對(duì)用戶的分析從過(guò)去的單維度進(jìn)入到多維度狀態(tài),并從過(guò)去的滯后發(fā)展到今天的實(shí)時(shí)同步,即無(wú)時(shí)無(wú)刻都在產(chǎn)生數(shù)據(jù),哪怕用戶沉默無(wú)動(dòng)作也是一種數(shù)據(jù)傳達(dá)。圖書(shū)館對(duì)用戶各方數(shù)據(jù)的收集與存儲(chǔ)是全樣思維的體現(xiàn)。只有占有足夠量的數(shù)據(jù)才能對(duì)事件的全貌有更準(zhǔn)確的描述,才能對(duì)用戶畫(huà)像進(jìn)行精準(zhǔn)描述,即將用戶的方方面面暴露在圖書(shū)館面前,這是圖書(shū)館提供適時(shí)知識(shí)服務(wù)的基礎(chǔ)。正是對(duì)各種數(shù)據(jù)之間的內(nèi)在聯(lián)系進(jìn)行挖掘、分析與預(yù)測(cè),使得簡(jiǎn)單的因果關(guān)系逐漸演變成用戶行為的影響因素,即相關(guān)關(guān)系。數(shù)據(jù)驅(qū)動(dòng)能夠降低事物的不確定性,對(duì)用戶服務(wù)的影響因素分析得越多、我們對(duì)用戶的了解就越深入,智慧推薦就越精準(zhǔn)。大數(shù)據(jù)思維是圍繞用戶開(kāi)展收集、整理、組織、存儲(chǔ)、發(fā)布、傳輸、應(yīng)用等各種操作,離開(kāi)這個(gè)中心,大數(shù)據(jù)思維和行動(dòng)都將失去目標(biāo)。以用戶為中心具體表現(xiàn)為充分考慮用戶的需求、保障用戶隱私數(shù)據(jù)安全、提供優(yōu)質(zhì)的知識(shí)服務(wù)。用戶需求存在潛在和現(xiàn)實(shí)需求,大數(shù)據(jù)可以深度挖掘數(shù)據(jù)之間的關(guān)聯(lián)性,更好地揭示用戶沒(méi)有表達(dá)出來(lái)的隱性需求。用戶隱私安全是指用戶使用網(wǎng)絡(luò)的過(guò)程中希望個(gè)人的敏感、秘密、不想被其他人知道的信息在自己的掌控之下,在個(gè)人技術(shù)和專業(yè)不及的情況下機(jī)構(gòu)能夠給出專業(yè)的防護(hù)體系。因此,圖書(shū)館的大數(shù)據(jù)收集與分析也是有邊界的,在不觸及用戶隱私的情況下全樣收集與分析,在觸及用戶隱私的情況下如何規(guī)避用戶損失,提高用戶收益是圖書(shū)館必須考慮的事情。優(yōu)質(zhì)的知識(shí)服務(wù)是用戶使用圖書(shū)館的目的,在學(xué)習(xí)、工作和研究的驅(qū)動(dòng)下,用戶尋求圖書(shū)館給予更為全面、專業(yè)、優(yōu)良的知識(shí)服務(wù); 在知識(shí)和體驗(yàn)的雙重促進(jìn)下,用戶可實(shí)現(xiàn)持續(xù)使用的動(dòng)機(jī)和意愿,這是圖書(shū)館核心功能建設(shè)和發(fā)展的根本所在。
二、基于情境對(duì)圖書(shū)館用戶需求的動(dòng)態(tài)感知
讀者或用戶是在一定情境下開(kāi)展圖書(shū)館行為的。早期情境研究因技術(shù)等原因只能集中于單興趣情境領(lǐng)域,而在大數(shù)據(jù)的驅(qū)動(dòng)下,多興趣情境研究也開(kāi)始出現(xiàn)。劉海鷗等2018年提出一種面向圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)的多情境興趣推薦方法,即通過(guò)對(duì)用戶多情境興趣的層次劃分,利用蟻群層次挖掘的優(yōu)勢(shì)來(lái)發(fā)現(xiàn)目標(biāo)用戶的若干最近鄰類簇,然后根據(jù)類簇內(nèi)相似用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分對(duì)未評(píng)分項(xiàng)目進(jìn)行預(yù)測(cè),最后結(jié)合Mapreduce 化的大數(shù)據(jù)并行處理方法來(lái)進(jìn)行協(xié)同過(guò)濾推薦,以此解決單興趣建模存在的歧義推薦問(wèn)題,提高多興趣推薦的寬度和精準(zhǔn)性。這表明,用戶情境的構(gòu)成因素是多元的,且每個(gè)因素的重要性是不同的,不同情境因素組合后也會(huì)呈現(xiàn)不同的用戶需求。圖書(shū)館可依托大數(shù)據(jù)、云計(jì)算、機(jī)器學(xué)習(xí)等技術(shù)和功能,實(shí)時(shí)動(dòng)態(tài)感知用戶的情境因素及對(duì)用戶產(chǎn)生的影響,進(jìn)行大數(shù)據(jù)之間的關(guān)聯(lián)分析與深度挖掘。在情境大數(shù)據(jù)收集與分析過(guò)程中,要注意情境的主體性,即用戶個(gè)體的服務(wù)需求、文化水平、信息素養(yǎng)、行為連貫性與偶然性、情境持續(xù)性與突發(fā)性等??蓪⒂脩粜枨髲娘@性到隱性細(xì)分化,分為五個(gè)層次,即清晰表達(dá)的需求、行為顯示的需求、刺激產(chǎn)生的需求、潛在的需求、無(wú)意識(shí)的需求。有些需求是由相對(duì)固定的群體反映出來(lái)的,可以借助靜態(tài)數(shù)據(jù)收集與分析來(lái)實(shí)現(xiàn),如用戶專業(yè)不同具有典型的閱讀分類。但有些需求只能通過(guò)動(dòng)態(tài)數(shù)據(jù)收集與分析來(lái)實(shí)現(xiàn),如某些用戶因使用時(shí)間、空間、心情、情緒、興趣、環(huán)境等因素不同,相同的圖書(shū)館行為也會(huì)產(chǎn)生不同的體驗(yàn)結(jié)果,這時(shí)大數(shù)據(jù)就需要分析為什么會(huì)產(chǎn)生差異結(jié)果,哪些情境因素促進(jìn)用戶吸收與體驗(yàn); 反之,哪些情境因素阻礙用戶吸收與體驗(yàn)。
三、保證用戶獲得的大數(shù)據(jù)知識(shí)服務(wù)質(zhì)量
用戶利用圖書(shū)館的目的是獲得個(gè)體無(wú)法知道的知識(shí)和無(wú)法解決的問(wèn)題。雖然影響用戶使用體驗(yàn)的因素較多,但圖書(shū)館知識(shí)服務(wù)的核心功能始終是用戶評(píng)價(jià)的第一要素和核心要素,直接體現(xiàn)為知識(shí)服務(wù)系統(tǒng)的易用性與可用性。為此,圖書(shū)館需要保證用戶能夠?qū)崿F(xiàn)或超過(guò)原有預(yù)期,即為用戶提供優(yōu)質(zhì)的大數(shù)據(jù)知識(shí)服務(wù)質(zhì)量,將用戶原有的簡(jiǎn)單式經(jīng)驗(yàn)決策升級(jí)為 “大數(shù)據(jù)式智慧決策”。故此,圖書(shū)館首先要保證大數(shù)據(jù)知識(shí)服務(wù)系統(tǒng)的數(shù)據(jù)來(lái)源質(zhì)量,從收集到監(jiān)控合理設(shè)置大數(shù)據(jù)管理過(guò)程。2017年陳臣基于大數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)構(gòu)建了圖書(shū)館智慧服務(wù)體系。該系統(tǒng)分為數(shù)據(jù)感知層、數(shù)據(jù)傳輸層、數(shù)據(jù)分析層、智慧服務(wù)層 4 個(gè)部分,依次實(shí)現(xiàn)了圖書(shū)館服務(wù)的數(shù)據(jù)化、信息化、智能化和智慧化。該系統(tǒng)既符合大數(shù)據(jù)的生命周期理論,也符合用戶對(duì)知識(shí)需求的不同層次。同時(shí),遵循實(shí)時(shí)、動(dòng)態(tài)和可靠原則,對(duì)用戶各方面數(shù)據(jù)能夠進(jìn)行最全樣的收集、分析與預(yù)測(cè),奠定了大數(shù)據(jù)服務(wù)精準(zhǔn)、響應(yīng)與追溯的基礎(chǔ)。其次,構(gòu)建圖書(shū)館大數(shù)據(jù)預(yù)警系統(tǒng),進(jìn)行風(fēng)控制、安全對(duì)象掃描、安全性審計(jì)和安全結(jié)果可視化,確保當(dāng)多個(gè)安全事件同時(shí)發(fā)生時(shí),安全管理系統(tǒng)可依據(jù)圖書(shū)館服務(wù)系統(tǒng)運(yùn)行和安全威脅的程度,按照安全事件的威脅級(jí)別、服務(wù)內(nèi)容等級(jí)和讀者優(yōu)先級(jí),在滿足圖書(shū)館安全管理事件對(duì)系統(tǒng)資源需求的前提下,保證讀者具有較高的閱讀收益率和愉悅感。最后,設(shè)計(jì)圖書(shū)館知識(shí)服務(wù)質(zhì)量管理進(jìn)程表。用戶需求處于動(dòng)態(tài)變化中,且需求會(huì)越來(lái)越高。圖書(shū)館應(yīng)該居安思危,走在用戶需求之前,主動(dòng)設(shè)計(jì)質(zhì)量提升管理的規(guī)劃與進(jìn)程。質(zhì)量提升的來(lái)源主要有兩個(gè)方面,一是內(nèi)部驅(qū)動(dòng),即圖書(shū)館自身積極革新變化,創(chuàng)新服務(wù)模式和內(nèi)容; 二是外部驅(qū)動(dòng),或是用戶反饋與評(píng)價(jià)中的不足、缺點(diǎn)、弱勢(shì)等,或是行業(yè)內(nèi)涌現(xiàn)的經(jīng)典示范,或是相關(guān)領(lǐng)域的技術(shù)革新等。不論哪個(gè)方面,圖書(shū)館都應(yīng)該積極發(fā)揮信息行業(yè)的敏銳觸角,主動(dòng)提升知識(shí)服務(wù)的層次和質(zhì)量。
4平衡大數(shù)據(jù)管理與用戶隱私保護(hù)的關(guān)系
讀者在享受大數(shù)據(jù)帶來(lái)便利的同時(shí),也面臨著個(gè)人隱私泄露的風(fēng)險(xiǎn)。大數(shù)據(jù)隱私是在靜態(tài)隱私的基礎(chǔ)上進(jìn)行的精細(xì)分析與加工,且各種數(shù)據(jù)之間存在動(dòng)態(tài)關(guān)聯(lián),能夠進(jìn)行相互印證,可以說(shuō)是對(duì)用戶進(jìn)行動(dòng)靜結(jié)合的精準(zhǔn)描述,且具有發(fā)展性與預(yù)期性。大數(shù)據(jù)隱私除了基礎(chǔ)的身份信息以外,對(duì)用戶的空間變換、個(gè)性、消費(fèi)觀念、價(jià)值觀、行為習(xí)慣等都有覆蓋,甚至能夠非常清晰、高概率地預(yù)測(cè)一個(gè)人未來(lái)的行為及自主決策的各種可能性,對(duì)人產(chǎn)生全方位的監(jiān)控,使得每個(gè)人的隱私在大數(shù)據(jù)技術(shù)之下變得完全公開(kāi)透明,逐漸使人喪失個(gè)體的自由度和自主性。馬曉亭等2016年指出,讀者個(gè)人隱私可能會(huì)面臨 “被肆意收集”、“大數(shù)據(jù)不完全脫敏”、“隱私權(quán)法律界定不清”、“被二次分析與使用”等風(fēng)險(xiǎn)。的確,大數(shù)據(jù)作為一種快速發(fā)展的新事物,由于法律、制度及個(gè)人信息管理的缺陷,導(dǎo)致用戶在處理大數(shù)據(jù)分析與用戶隱私二者的關(guān)系中處于弱勢(shì)地位,圖書(shū)館不同于其他商業(yè)機(jī)構(gòu),公益性決定其更應(yīng)該關(guān)注用戶隱私保護(hù)問(wèn)題,不能以大數(shù)據(jù)智慧推薦為理由犧牲用戶的隱私。圖書(shū)館可以通過(guò)兩個(gè)方面處理二者關(guān)系,一是基于生命周期理論分析大數(shù)據(jù)開(kāi)發(fā)不同階段的特征,以及容易產(chǎn)生用戶隱私泄露的可能途徑。大數(shù)據(jù)生命周期管理流程分為大數(shù)據(jù)產(chǎn)生與發(fā)布、大數(shù)據(jù)采集與傳輸、大數(shù)據(jù)云存儲(chǔ)、大數(shù)據(jù)計(jì)算與分析、大數(shù)據(jù)應(yīng)用決策五個(gè)階段,圖書(shū)館應(yīng)對(duì)應(yīng)設(shè)置隱私安全動(dòng)態(tài)監(jiān)控、動(dòng)態(tài)評(píng)估、隱私安全管理技術(shù)、安全事故審計(jì)問(wèn)責(zé)制度、隱私保護(hù)法律與行業(yè)規(guī)定等。二是調(diào)查分析圖書(shū)館用戶對(duì)隱私泄露的態(tài)度和容忍程度,處理好大數(shù)據(jù)收集、分析、應(yīng)用與用戶個(gè)人隱私保護(hù)的平衡關(guān)系。實(shí)證研究發(fā)現(xiàn),圖書(shū)館用戶隱私泄露容忍度總體偏低,讀者對(duì)個(gè)人隱私信息持保守態(tài)度,隱私關(guān)注度高。信息類型敏感性方面,讀者最關(guān)注交流隱私,即最不能容忍自己的通訊方式、聊天記錄等隱私被披露或竊取; 信息接收敏感性方面,不能容忍圖書(shū)館隨意采集并披露自己的借閱記錄,尤其不能容忍圖書(shū)館通過(guò)網(wǎng)絡(luò)遠(yuǎn)程追蹤、后臺(tái)監(jiān)控等互聯(lián)網(wǎng)技術(shù)手段了解用戶使用圖書(shū)館的情況; 在信息使用敏感性方面,對(duì)與其他圖書(shū)館、書(shū)商、網(wǎng)絡(luò)服務(wù)商、軟件開(kāi)發(fā)商等第三方的數(shù)據(jù)共享持比較謹(jǐn)慎和保守態(tài)度。此外,職業(yè)、受教育水平、年齡等個(gè)體差異都成為用戶隱私泄露容忍度的影響因素。
參考文獻(xiàn):
[1]賈鳳旭.基于大數(shù)據(jù)的信息知識(shí)服務(wù)系統(tǒng)構(gòu)建研究[J].圖書(shū)館學(xué)刊,2017,39(04):114-117.
[2]譚黔林,盧艷蘭.大數(shù)據(jù)時(shí)代高校圖書(shū)館知識(shí)服務(wù)模型研究[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2016,28(11):157-160.
[3]張宏.我國(guó)高校圖書(shū)館大數(shù)據(jù)研究現(xiàn)狀分析[J].圖書(shū)館工作與研究,2016(07):46-50.
[4]劉桂鋒,盧章平,化慧.圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)生態(tài)體系及其動(dòng)力機(jī)制研究[J].國(guó)家圖書(shū)館學(xué)刊,2016,25(03):52-60.