吳海春 林志益
(瓊臺(tái)師范學(xué)院圖書館 海南 ???571100)
近年來國(guó)家和政府提倡深入推進(jìn)全民閱讀,全民閱讀也已連續(xù)9年被寫入《政府工作報(bào)告》中。圖書館作為社會(huì)教育機(jī)構(gòu)之一,積極響應(yīng)國(guó)家政策,通過舉辦閱讀推廣活動(dòng),激發(fā)全民的閱讀熱情,提高全民的閱讀素養(yǎng)和信息素養(yǎng)。圖書館在開展閱讀推廣活動(dòng)時(shí)主要面臨以下挑戰(zhàn)[1]:一是閱讀推廣活動(dòng)受眾范圍有限,缺乏跨區(qū)域的交流和互動(dòng)途徑;二是活動(dòng)開展存在周期性(一般在讀書月舉辦系列推廣活動(dòng)),長(zhǎng)期性和持續(xù)性相對(duì)不足;三是圖書館與圖書館之間的溝通交流較少,資源共享效果不佳,資源重復(fù)建設(shè)現(xiàn)象嚴(yán)重。為解決以上不足,圖書館開始嘗試構(gòu)建閱讀推廣平臺(tái),目前關(guān)于閱讀推廣平臺(tái)的研究主要集中在利用用戶行為感知技術(shù)設(shè)計(jì)數(shù)字期刊服務(wù)推送系統(tǒng)[2]、基于區(qū)塊鏈技術(shù)設(shè)計(jì)閱讀平臺(tái)[3]、利用混合現(xiàn)實(shí)技術(shù)設(shè)計(jì)數(shù)字化閱讀界面[4]、利用5G和AI技術(shù)提供智能化閱讀服務(wù)[5]等。通過閱讀推廣服務(wù)平臺(tái),讀者可以及時(shí)享受到圖書館的資源服務(wù)。雖然閱讀推廣平臺(tái)解決了用戶個(gè)性化、精準(zhǔn)化的資源服務(wù)需求,但目前服務(wù)平臺(tái)眾多,容易造成讀者操作不便以及個(gè)人信息泄露、資源重復(fù)建設(shè)、信息不對(duì)稱等問題。因此,本文基于多源數(shù)據(jù)融合技術(shù)建立了多源數(shù)據(jù)融合驅(qū)動(dòng)的圖書館智能化閱讀推廣平臺(tái)架構(gòu)和工作流程,旨在為圖書館優(yōu)化閱讀推廣服務(wù)內(nèi)容和提高用戶體驗(yàn)提供參考。
多源數(shù)據(jù)融合是指對(duì)不同來源、不同結(jié)構(gòu)或相同結(jié)構(gòu)的數(shù)據(jù)進(jìn)行判斷、清洗、分析、集成的過程[6]。多源數(shù)據(jù)融合可分為階段性融合、特征拼接融合和語義融合[7]。數(shù)據(jù)階段性融合是指分階段處理數(shù)據(jù),先處理一種類型數(shù)據(jù)接著再處理另一類型數(shù)據(jù);特征拼接融合是指利用深度學(xué)習(xí)、特征串聯(lián)等方法融合多源數(shù)據(jù);語義融合是指通過相似度算法、知識(shí)關(guān)聯(lián)等方法識(shí)別數(shù)據(jù)特征與特征之間的關(guān)系,并進(jìn)行數(shù)據(jù)語義信息融合。目前圖情領(lǐng)域關(guān)于多源數(shù)據(jù)的研究主要集中在理論研究[8]、圖書館資源整合[9]、學(xué)科評(píng)價(jià)[10]、智慧圖書館建設(shè)[11]等領(lǐng)域,圖書館通過多源數(shù)據(jù)融合的方法,為用戶提供精準(zhǔn)化、個(gè)性化的信息服務(wù)。
閱讀推廣是圖書館發(fā)揮社會(huì)教育作用的重要手段[12]。圖書館通過開展知識(shí)競(jìng)賽、圖書分享、專題講座等形式激發(fā)公眾的閱讀興趣,全面提高公眾的文化素質(zhì)。目前,關(guān)于圖書館閱讀推廣的研究主要集中在概念研究、策略研究、系統(tǒng)研究、閱讀行為研究等方面。黃佳[13]利用生命周期理論構(gòu)建了圖書館閱讀推廣服務(wù)體系,以期為圖書館閱讀推廣服務(wù)提供理論支撐和實(shí)踐借鑒;孫靜靜[14]分析了如何將4R理論應(yīng)用到圖書館閱讀推廣活動(dòng)中,優(yōu)化了閱讀推廣服務(wù)策略;路錦怡等[15]設(shè)計(jì)了針對(duì)兒童的繪本標(biāo)識(shí)系統(tǒng),該系統(tǒng)可以提高兒童查詢繪本的成功率;Langendonk A等[16]研究了荷蘭全國(guó)性的閱讀推廣計(jì)劃——“閱讀的藝術(shù)”,該計(jì)劃對(duì)學(xué)生和老師的閱讀行為有正向的促進(jìn)作用。
根據(jù)超星公司對(duì)閱讀推廣系統(tǒng)的定義[17],全民閱讀推廣系統(tǒng)是指以圖書館館藏?cái)?shù)字資源為基礎(chǔ),利用互聯(lián)網(wǎng)等傳播媒介,以各個(gè)終端應(yīng)用的形式推送給不同場(chǎng)景下的讀者,讓全民閱讀無處不在。數(shù)字化時(shí)代的圖書館要充分利用自身的資源和平臺(tái)優(yōu)勢(shì)以及數(shù)字化信息技術(shù),構(gòu)建一個(gè)立體的閱讀推廣服務(wù)體系——數(shù)字化閱讀推廣系統(tǒng)。目前學(xué)者們關(guān)于圖書館閱讀推廣平臺(tái)的研究更多地將閱讀推廣平臺(tái)當(dāng)作閱讀推廣服務(wù)平臺(tái)[18-19],在此平臺(tái)上讀者可以隨時(shí)隨地享受到圖書館的數(shù)字化閱讀資源,同時(shí)可以進(jìn)行閱讀資源的分享和傳播,從而拓寬圖書館讀者的覆蓋面,達(dá)到促進(jìn)全民閱讀的目的。本文的圖書館智能化閱讀推廣平臺(tái)是指基于集智能化操作、服務(wù)為一體的數(shù)字化閱讀推廣平臺(tái),建立該系統(tǒng)的目的是充分挖掘用戶需求,激發(fā)用戶閱讀積極性,同時(shí)促進(jìn)不同圖書館機(jī)構(gòu)間的資源交流和共享,提高資源利用效率。
隨著數(shù)字化閱讀的興起以及大數(shù)據(jù)、人工智能等技術(shù)的迅猛發(fā)展,用戶更加追求智能化、精準(zhǔn)化、個(gè)性化的閱讀推廣平臺(tái)[20]。多源數(shù)據(jù)融合驅(qū)動(dòng)下的圖書館智能閱讀推廣平臺(tái)主要包含以下功能需求:(1)實(shí)現(xiàn)精準(zhǔn)化服務(wù)。隨著信息技術(shù)的發(fā)展,讀者的需求更加個(gè)性化、多樣化。目前圖書館的閱讀推廣活動(dòng)對(duì)讀者的個(gè)性化需求關(guān)注仍稍顯不足,活動(dòng)內(nèi)容主要針對(duì)大多數(shù)讀者的需求開展,因此,圖書館閱讀推廣平臺(tái)要充分分析用戶需求和用戶特征信息,為用戶提供實(shí)時(shí)且精準(zhǔn)的閱讀推廣服務(wù)。(2)實(shí)現(xiàn)智能化操作。5G、人工智能、AR、VR等技術(shù)的興起,讀者更加注重在閱讀推廣平臺(tái)中的智能交互體驗(yàn)。因此,圖書館閱讀推廣系統(tǒng)要充分利用新興技術(shù)實(shí)現(xiàn)系統(tǒng)智能化推薦、智能化檢索、智能化閱讀導(dǎo)航、智能化預(yù)約等操作,增強(qiáng)用戶在閱讀中的互動(dòng)體驗(yàn),同時(shí)為用戶提供體驗(yàn)反饋途徑,以便系統(tǒng)不斷完善用戶畫像,實(shí)現(xiàn)對(duì)用戶信息的精準(zhǔn)捕捉。(3)實(shí)現(xiàn)跨機(jī)構(gòu)資源共享。雖然目前圖書館搭建了一些閱讀推廣平臺(tái),但不同機(jī)構(gòu)間的閱讀推廣平臺(tái)缺乏數(shù)據(jù)共享通道,容易造成資源重復(fù)建設(shè)和資源浪費(fèi)等情況。因此,多源數(shù)據(jù)融合驅(qū)動(dòng)的圖書館智能化閱讀推廣平臺(tái)要充分利用多源數(shù)據(jù)融合技術(shù)實(shí)現(xiàn)跨機(jī)構(gòu)資源融合,促進(jìn)圖書館間的交流共享,提高資源的利用效率。
本文將圖書館智能化閱讀推廣平臺(tái)的數(shù)據(jù)來源分為用戶數(shù)據(jù)、資源數(shù)據(jù)和場(chǎng)景數(shù)據(jù)(見表1)。用戶數(shù)據(jù)是圖書館開展精準(zhǔn)化閱讀推廣服務(wù)的主要數(shù)據(jù)來源。隨著圖書館舉辦閱讀推廣活動(dòng)次數(shù)的增加,用戶與圖書館的互動(dòng)日益頻繁,用戶的特征信息以及不同場(chǎng)景下的閱讀推廣活動(dòng)數(shù)據(jù)均被廣泛記錄在圖書館的各個(gè)服務(wù)平臺(tái)上。此外,圖書館資源數(shù)據(jù)是圖書館開展閱讀推廣服務(wù)的基礎(chǔ),將用戶數(shù)據(jù)、場(chǎng)景數(shù)據(jù)與資源數(shù)據(jù)精確匹配,可以為用戶提供精準(zhǔn)化、個(gè)性化的閱讀服務(wù)。
2.2.1 用戶數(shù)據(jù)
用戶數(shù)據(jù)包含基礎(chǔ)數(shù)據(jù)和行為數(shù)據(jù)。用戶基礎(chǔ)數(shù)據(jù)是表征用戶基本屬性的數(shù)據(jù),包含用戶的基本信息數(shù)據(jù)和科研信息數(shù)據(jù)。用戶特征數(shù)據(jù)可通過記錄用戶注冊(cè)信息、問卷調(diào)查、數(shù)據(jù)庫(kù)等方式獲取。用戶行為數(shù)據(jù)是指用戶使用圖書館資源以及參與相關(guān)圖書館閱讀推廣活動(dòng)的數(shù)據(jù),如借閱數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù)、數(shù)據(jù)庫(kù)使用數(shù)據(jù)等。圖書館官網(wǎng)、公眾號(hào)、館藏?cái)?shù)據(jù)庫(kù)等設(shè)備上記錄了用戶的使用數(shù)據(jù),能夠反映用戶使用圖書館資源進(jìn)行學(xué)習(xí)、科研等的細(xì)節(jié)數(shù)據(jù)。圖書館通過深入挖掘這些行為數(shù)據(jù),為后續(xù)用戶畫像分析奠定數(shù)據(jù)基礎(chǔ)。
表1 圖書館智能化閱讀推廣平臺(tái)的多源數(shù)據(jù)分析
2.2.2 資源數(shù)據(jù)
圖書館資源數(shù)據(jù)包含圖書館本身的館藏資源以及其他機(jī)構(gòu)共享的資源數(shù)據(jù),數(shù)據(jù)類型包含圖書、期刊、專利等,館藏資源可通過各種類型的數(shù)據(jù)庫(kù)獲取,共享的資源數(shù)據(jù)可通過開源數(shù)據(jù)庫(kù)以及共享的知識(shí)服務(wù)平臺(tái)等獲取。資源數(shù)據(jù)是圖書館開展智能化閱讀推廣服務(wù)的關(guān)鍵,隨著數(shù)字圖書館建設(shè)的推進(jìn),數(shù)字資源的類型和數(shù)量爆發(fā)式增長(zhǎng),圖書館開展閱讀推廣服務(wù)時(shí)需要綜合利用這些資源數(shù)據(jù),為用戶提供高質(zhì)量的知識(shí)服務(wù)。
2.2.3 場(chǎng)景數(shù)據(jù)
場(chǎng)景數(shù)據(jù)是圖書館開展閱讀推廣服務(wù)應(yīng)用場(chǎng)景數(shù)據(jù),主要包括與活動(dòng)開展相關(guān)的空間數(shù)據(jù)(如空間面積、空間的地理位置等)、設(shè)施設(shè)備數(shù)據(jù)等(如電腦、投影儀、實(shí)操儀器設(shè)備等)。服務(wù)場(chǎng)景數(shù)據(jù)一般是基于以往圖書館開展閱讀推廣活動(dòng)時(shí)的記錄所得。多源數(shù)據(jù)融合驅(qū)動(dòng)的圖書館智能化閱讀推廣平臺(tái)建立用戶數(shù)據(jù)、資源數(shù)據(jù)、場(chǎng)景數(shù)據(jù)三者間的關(guān)聯(lián)關(guān)系,從而實(shí)現(xiàn)精準(zhǔn)化、智能化、個(gè)性化的閱讀推廣服務(wù)。
多源數(shù)據(jù)融合驅(qū)動(dòng)為圖書館智能化閱讀推廣平臺(tái)完善提供了新思路。本文在廣泛采集多種數(shù)據(jù)來源的基礎(chǔ)上,充分利用數(shù)據(jù)融合技術(shù),實(shí)現(xiàn)數(shù)據(jù)分析、集成與關(guān)聯(lián),進(jìn)而為用戶提供精準(zhǔn)化、智能化的閱讀推廣服務(wù)。具體而言,多源數(shù)據(jù)融合驅(qū)動(dòng)的圖書館智能化閱讀推廣平臺(tái)架構(gòu)分為基礎(chǔ)數(shù)據(jù)層、數(shù)據(jù)融合層、平臺(tái)系統(tǒng)層(見圖1)?;A(chǔ)數(shù)據(jù)層是服務(wù)系統(tǒng)多源數(shù)據(jù)融合驅(qū)動(dòng)的基礎(chǔ),包含用戶數(shù)據(jù)、資源數(shù)據(jù)和場(chǎng)景數(shù)據(jù);數(shù)據(jù)融合層主要進(jìn)行多源數(shù)據(jù)的融合,為系統(tǒng)搭建提供高質(zhì)量的數(shù)據(jù)集合;平臺(tái)系統(tǒng)層是閱讀推廣平臺(tái)的應(yīng)用層,面向用戶提供智能化的閱讀服務(wù)。
基礎(chǔ)數(shù)據(jù)層是實(shí)現(xiàn)多源數(shù)據(jù)驅(qū)動(dòng)構(gòu)建智能化閱讀推廣系統(tǒng)的基礎(chǔ),圖書館需要廣泛采集多源異構(gòu)或同構(gòu)數(shù)據(jù),為后續(xù)數(shù)據(jù)融合奠定基礎(chǔ)。基礎(chǔ)數(shù)據(jù)層數(shù)據(jù)包含圖書館館藏資源數(shù)據(jù)、用戶特征數(shù)據(jù)以及圖書館在開展閱讀推廣活動(dòng)所需的場(chǎng)景數(shù)據(jù)、活動(dòng)數(shù)據(jù)等,數(shù)據(jù)采集過程中要盡量避免數(shù)據(jù)缺失,保證數(shù)據(jù)完整性。
圖1 多源數(shù)據(jù)融合驅(qū)動(dòng)的圖書館智能化閱讀推廣平臺(tái)架構(gòu)
數(shù)據(jù)融合層是實(shí)現(xiàn)智能化閱讀推廣服務(wù)的關(guān)鍵,從數(shù)據(jù)采集、分析到融合、應(yīng)用,為后續(xù)系統(tǒng)服務(wù)奠定基礎(chǔ)。首先收集和分析用戶數(shù)據(jù),分析用戶需求,建立用戶畫像模型,分析用戶特征和用戶閱讀偏好。接著系統(tǒng)建立用戶特征數(shù)據(jù)、用戶需求數(shù)據(jù)、資源數(shù)據(jù)、場(chǎng)景數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,進(jìn)行數(shù)據(jù)融合,形成關(guān)聯(lián)數(shù)據(jù)集。數(shù)據(jù)融合層主要涉及到智能數(shù)據(jù)分析技術(shù)、數(shù)據(jù)關(guān)聯(lián)技術(shù)、知識(shí)網(wǎng)絡(luò)技術(shù)、感知技術(shù)等技術(shù),通過上述技術(shù)為多源異構(gòu)數(shù)據(jù)融合提供保障。
平臺(tái)系統(tǒng)層包含四個(gè)模塊:閱讀活動(dòng)管理模塊、資源管理模塊、個(gè)人信息管理模塊和數(shù)據(jù)安全模塊。閱讀活動(dòng)管理模塊主要管理閱讀推廣活動(dòng)內(nèi)容,包含活動(dòng)籌備、執(zhí)行、反饋評(píng)價(jià)等。資源管理模塊主要存儲(chǔ)各類出版資源、原創(chuàng)作品和共享資源等,可為用戶提供精準(zhǔn)的資源推送服務(wù),系統(tǒng)根據(jù)用戶需求的動(dòng)態(tài)變化實(shí)時(shí)調(diào)整資源存儲(chǔ),不斷完善圖書館資源配置。個(gè)人信息管理模塊主要存儲(chǔ)用戶的閱讀足跡、活動(dòng)記錄和基本信息,支持用戶進(jìn)行系統(tǒng)登錄以及自主化資源使用,該模塊可實(shí)現(xiàn)用戶個(gè)性化資源收藏、下載、分享等服務(wù)。數(shù)據(jù)安全模塊主要提供后臺(tái)安全保障服務(wù),防止個(gè)人數(shù)據(jù)泄露和資源泄露,該模塊嚴(yán)格把控?cái)?shù)據(jù)采集、存儲(chǔ)等環(huán)節(jié),并進(jìn)行數(shù)據(jù)安全檢測(cè),當(dāng)可能出現(xiàn)數(shù)據(jù)安全危險(xiǎn)時(shí)及時(shí)向用戶和圖書館提供安全預(yù)警,從而全方位保障數(shù)據(jù)安全性。
本文結(jié)合系統(tǒng)架構(gòu)設(shè)計(jì),將多源數(shù)據(jù)融合驅(qū)動(dòng)的圖書館智能化閱讀推廣平臺(tái)業(yè)務(wù)流程分為多源數(shù)據(jù)采集、數(shù)據(jù)處理、多源數(shù)據(jù)融合、應(yīng)用服務(wù)四個(gè)步驟,不斷滿足用戶智能化服務(wù)的需求。
由于用戶數(shù)據(jù)、資源數(shù)據(jù)、場(chǎng)景數(shù)據(jù)廣泛分布在不同的系統(tǒng)平臺(tái)和設(shè)備中,數(shù)據(jù)量大,數(shù)據(jù)類型各異,因此需要利用不同的技術(shù)進(jìn)行數(shù)據(jù)采集。一方面,可以利用結(jié)構(gòu)化數(shù)據(jù)采集工具(如Sqoop、ODI等)抽取標(biāo)準(zhǔn)化數(shù)據(jù);另一方面,可以利用非結(jié)構(gòu)化數(shù)據(jù)采集工具(如Flume、Kattle等)采集用戶訪問數(shù)據(jù)、場(chǎng)景數(shù)據(jù)、開源網(wǎng)絡(luò)數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù)。在數(shù)據(jù)采集過程中,如碰到系統(tǒng)接口標(biāo)準(zhǔn)不一的情況,可將數(shù)據(jù)抽取到臨時(shí)表或者數(shù)據(jù)交換平臺(tái)進(jìn)行存儲(chǔ),以便后續(xù)跨系統(tǒng)數(shù)據(jù)調(diào)用。
由于用戶數(shù)據(jù)、資源數(shù)據(jù)和場(chǎng)景數(shù)據(jù)來自不同的數(shù)據(jù)庫(kù)、文件系統(tǒng)等,易受到數(shù)據(jù)沖突、數(shù)據(jù)缺失等影響,因此需要對(duì)多源異構(gòu)或同構(gòu)數(shù)據(jù)進(jìn)行處理,提高數(shù)據(jù)的易用性。數(shù)據(jù)處理流程包含數(shù)據(jù)清洗、轉(zhuǎn)換、統(tǒng)一、集成等環(huán)節(jié),被處理后的數(shù)據(jù)可以整體提高數(shù)據(jù)質(zhì)量,以保證多源數(shù)據(jù)融合的準(zhǔn)確性與價(jià)值性。
多源數(shù)據(jù)融合是圖書館智能化閱讀推廣系統(tǒng)構(gòu)建的關(guān)鍵環(huán)節(jié),服務(wù)系統(tǒng)可分別從用戶需求關(guān)聯(lián)、時(shí)空關(guān)聯(lián)、資源關(guān)聯(lián)等維度建立多源數(shù)據(jù)融合規(guī)則,搭建統(tǒng)一的數(shù)據(jù)整合框架,集成不同類型數(shù)據(jù)的關(guān)系特征,建立關(guān)系網(wǎng)絡(luò),從而實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)的融合認(rèn)知計(jì)算與融合分析,為后續(xù)圖書館閱讀推廣平臺(tái)應(yīng)用賦能。
多源數(shù)據(jù)融合驅(qū)動(dòng)的圖書館智能化閱讀推廣系統(tǒng)應(yīng)用服務(wù)內(nèi)容包含智能化推送服務(wù)、智能化檢索服務(wù)、互動(dòng)交流服務(wù)、自主學(xué)習(xí)服務(wù)等。智能化推送服務(wù)是指服務(wù)系統(tǒng)將用戶畫像分析結(jié)果與資源數(shù)據(jù)相匹配,為用戶提供個(gè)性化資源推送服務(wù),同時(shí)根據(jù)用戶動(dòng)態(tài)需求變化及時(shí)優(yōu)化調(diào)整推送內(nèi)容。智能化檢索服務(wù)是指用戶在該系統(tǒng)中輸入檢索詞,系統(tǒng)可根據(jù)用戶需求提供資源下載路徑、知識(shí)推薦、知識(shí)關(guān)聯(lián)等服務(wù)?;?dòng)交流服務(wù)是指一方面用戶可以實(shí)時(shí)與圖書館館員溝通交流,獲取所需的閱讀資源;另一方面用戶可以與共同參與閱讀推廣活動(dòng)的其他用戶進(jìn)行互動(dòng)交流,進(jìn)行閱讀心得分享,迸發(fā)出新的靈感。自主學(xué)習(xí)服務(wù)是指用戶可通過該系統(tǒng)參與專題講座、培訓(xùn)等活動(dòng),提高自身的閱讀素養(yǎng)和信息素養(yǎng)。
大數(shù)據(jù)時(shí)代,多源數(shù)據(jù)融合驅(qū)動(dòng)為圖書館閱讀推廣活動(dòng)提供了新途徑和新思路。未來圖書館一方面要不斷完善閱讀推廣服務(wù)制度,從組織架構(gòu)、人員配置、宣傳機(jī)制、活動(dòng)目標(biāo)等整體規(guī)劃閱讀推廣活動(dòng),促進(jìn)圖書館閱讀推廣規(guī)模化、系列化發(fā)展,為閱讀推廣平臺(tái)的優(yōu)化完善奠定制度基礎(chǔ);另一方面要構(gòu)建系統(tǒng)評(píng)估體系,完善用戶反饋渠道,不斷為用戶提供高質(zhì)量的閱讀服務(wù)以及豐富用戶的閱讀體驗(yàn)。