文利情
(廣東省立中山圖書館,廣州 510110)
推動全民閱讀,是培育和踐行社會主義核心價值觀、展現(xiàn)中華文化永久魅力和時代風采的重要途徑,也是提高人民素質(zhì)、滿足人民文化需求和增強人民精神力量的重要方式。2014 年以來,全民閱讀已經(jīng)連續(xù)八次寫入政府工作報告。2021 年3 月11 日,十三屆全國人大四次會議批準《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035 年遠景目標綱要》[1]。其中,“提升公共文化服務水平”一章中專門提出“深入推進全民閱讀,建設 ‘書香中國’”。如何高效、有效地開展閱讀推廣活動,使之實現(xiàn)全民閱讀的目標,成為圖書館關注和研究的焦點。圖書館閱讀推廣包括以線下紙媒為支撐的傳統(tǒng)模式、以信息技術為支撐的新模式?;谛畔⒓夹g的閱讀推廣模式與傳統(tǒng)模式相比,具有覆蓋面廣、效率高、對讀者有吸引力等優(yōu)勢和特色。如何充分利用信息技術,有效提高讀者關注度和推廣效率成為研究的重點。
知識圖譜是結(jié)構(gòu)化的語義知識庫,用于迅速描述物理世界中的概念及其相互關系[2]。知識圖譜是把應用數(shù)學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現(xiàn)分析等方法結(jié)合,用可視化的圖譜形象地展示學科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領域以及整體知識架構(gòu)的多學科融合的一種研究方法。知識圖譜的應用主要包括明晰學科基本框架、探究學科研究內(nèi)容、描述學科研究人員、預測學科研究進展、揭示學科間關系、面向?qū)嶋H應用等。知識圖譜可以直觀地揭示圖書、讀者、著者等實體之間的關聯(lián),可以更好地指導閱讀推廣工作。
目前國內(nèi)外圖書館都在積極推進閱讀推廣,甚至各種為圖書館提供館藏的傳統(tǒng)資源供應商,都開始逐漸轉(zhuǎn)型為提供線上線下相結(jié)合的閱讀推廣活動的服務型資源。而對于圖書館,本身掌握著海量信息,如何利用好這些信息,為讀者做出更好的“個性化服務”也是閱讀推廣面臨的一個考驗性的問題。對于推廣工作,目前大部分公共圖書館的閱讀推廣工作方式均較為傳統(tǒng),大部分是采用圖書推薦、讀書會、主題活動或知識競賽等方式。由于目前大數(shù)據(jù)技術在圖書館的應用也僅限于數(shù)據(jù)收集和簡單的功能展現(xiàn),而且這些功能與讀者的需求交互體驗效果較差,顯然想要實現(xiàn)“個性化”的推廣是有一定難度的。
筆者以“Information Technology/Reading Promotion、Knowledge Graph/Reading Promotion”作為主題詞、關鍵詞或者題名,分別在EBSCO 數(shù)據(jù)庫、WOS數(shù)據(jù)庫和Springerlink 數(shù)據(jù)庫中進行查詢,檢索到的信息技術在閱讀推廣方面的研究經(jīng)篩選最相關的有2 篇,LISA 等討論了大學圖書館通過開發(fā)信息素養(yǎng)游戲來進行閱讀推廣的模式[3]。MANSO-RODRIGUEZ 等通過對讀者行為和相關信息技術工具的分析,指出網(wǎng)絡環(huán)境下的讀書俱樂部開展閱讀推廣活動,充分利用了博客、社交網(wǎng)絡等進行共享和傳播[4]。
以“圖書館/ 閱讀推廣”“信息技術/ 閱讀推廣”和“知識圖譜/閱讀推廣”作為主題詞、關鍵詞或者題名,分別在CNKI 數(shù)據(jù)庫、萬方數(shù)據(jù)庫中進行查詢,檢索到的針對信息化技術在閱讀推廣中的相關文獻經(jīng)篩選后共有55 篇,其研究主要集中在以下6 個方面。
(1)基于數(shù)字圖書館、移動圖書館的推廣模式[5];
(2)基于微信、微博等新媒體平臺的推廣模式[6-10];
(3)基于大數(shù)據(jù)的推廣模式[11-14],如圖書館提供用戶閱讀賬單、個性化閱讀推薦等服務,如IBM 公司的“3A5 步”法等[15]、利益相關者共贏策略[16]、利用讀者行為精準營銷[17];
(4)基于新媒體技術的推廣模式,通過微視頻、微電影等直觀推廣,以及通過點播直播等流媒體方式進行推廣[18-22];
(5)游戲式推廣模式,通過小游戲增加與讀者的溝通互動,推送閱讀信息[23];
(6)基于虛擬現(xiàn)實技術,通過構(gòu)建虛擬化導覽系統(tǒng)、虛擬化明信片等推廣圖書館相關信息[24,25]。
上述文獻研究可見,針對讀者個性化的閱讀推廣主要是集中在基于大數(shù)據(jù)的推廣,而其他模式也并沒有集中于為讀者提供精準化推廣服務,暫未發(fā)現(xiàn)與知識圖譜相關的閱讀推廣理論研究和實例研究。
綜上所述,無論是國內(nèi)還是國外至今圖書館界對信息技術以及知識圖譜在閱讀推廣應用方面的研究還較少,主要集中在基于大數(shù)據(jù)的研究模式,缺乏模式創(chuàng)新,且個性化推薦方面的精準閱讀推廣研究暫未有發(fā)現(xiàn)。
知識圖譜本質(zhì)上是語義網(wǎng)絡,是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點(Point)和邊(Edge)組成。若兩個節(jié)點之間存在關系,它們就會被一條無向邊連接在一起,那么這個節(jié)點,我們就稱為實體(Entity),它們之間的這條邊,我們就稱為關系(Relationship)。知識圖譜是關系的最有效的表示方式。通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關系網(wǎng)絡。知識圖譜提供了從“關系”的角度去分析問題的能力。我們通常將知識圖譜在邏輯上劃分為兩個層次:數(shù)據(jù)層和模式層。數(shù)據(jù)層存儲真實的數(shù)據(jù),如胡適-思想家-白話文學史、胡適-教授-北京大學。模式層在數(shù)據(jù)層之上,是知識圖譜的核心,存儲經(jīng)過提煉的知識,通常通過本體庫來管理,即實體-關系-實體、實體-屬性-性值。
基于知識圖譜的閱讀推廣服務平臺,重點在于構(gòu)建關于文獻、讀者的基于知識圖譜的數(shù)據(jù)庫,并對“閱讀推廣”中兩個重要因子“文獻”“讀者”進行知識圖譜分析,得出它們的內(nèi)在聯(lián)系,以揭示文獻與讀者之間的關聯(lián)關系,由此來提供閱讀推廣決策分析。第一,關于文獻的知識圖譜,從圖書館的書目數(shù)據(jù)庫中抽取文獻信息,如題名、主題、著者、出版社、出版地、出版時間等,經(jīng)過融合后,形成文獻知識圖譜,根據(jù)該圖譜,我們可以知道同一個主題下的所有圖書、同一著者的所有著作、同一出版社的作品等。第二,關于讀者的知識圖譜,從圖書館的讀者數(shù)據(jù)庫和流通數(shù)據(jù)庫中抽取如讀者性別、職業(yè)、教育程度、住址、借閱記錄等信息,同樣經(jīng)融合后,形成讀者信息知識圖譜,根據(jù)該圖譜,我們可以知道圖書借閱數(shù)據(jù)與讀者性別、職業(yè)、教育程度、住址等的關系,進一步分析出讀者閱讀習慣主要受哪些因素影響。第三,文獻和讀者整合的圖譜,我們可以知道哪些文獻被同一讀者借過,哪些讀者借過同一文獻,某些讀者同時借過同一類文獻等揭示一對多、多對一、多對多的關聯(lián)關系,用以分析讀者個人的、群體的閱讀行為習慣,某一種圖書或同一類圖書受歡迎的程度。
構(gòu)建知識圖譜賦能的閱讀推廣服務平臺的關鍵是構(gòu)建知識圖譜。知識圖譜的構(gòu)建流程主要有:構(gòu)建本體、配置數(shù)據(jù)源、配置信息抽取、配置知識映射、知識融合和融合驗證(可選),如圖1 所示。
圖1 閱讀推廣服務平臺知識圖譜構(gòu)建流程圖Fig.1 Construction flow chart of knowledge graph of the reading promotion service platform
(1)構(gòu)建本體及配置數(shù)據(jù)源。這里可把本體確定為“文獻-讀者”,數(shù)據(jù)源可能是結(jié)構(gòu)化的、非結(jié)構(gòu)化的以及半結(jié)構(gòu)化的,可通過一系列自動化或半自動化的技術手段,從原始數(shù)據(jù)中提取出知識要素,即實體和關系,如文獻、讀者、著者、借閱關系等,并將其存入我們的知識庫的模式層和數(shù)據(jù)層。
(2)配置信息抽取。針對實體的特點,從不同的數(shù)據(jù)源中提取屬性,形成全方面的描述,如文獻的屬性有題名、著者、出版社、出版日期、主題詞等。文獻和讀者兩個實體間的關系即為借閱關系、文獻和著者之間是創(chuàng)作關系……實體之間的關系描述是關聯(lián)分析的關鍵。
(3)配置知識映射。知識映射是將實體的多種類型數(shù)據(jù)進行關聯(lián)存儲。
(4)知識融合。知識融合是指在獲得新知識之后,需要使用相似函數(shù)對其進行整合,以消除矛盾和歧義,比如某些實體可能有多種表達,某個特定稱謂也許對應于多個不同的實體等。
(5)融合驗證。若在創(chuàng)建圖譜時,配置了知識融合,則需要進行融合驗證,即驗證當前知識融合的配置產(chǎn)生的結(jié)果是否符合預期。
在“文獻-讀者”知識圖譜的基礎之上,便可以搭建閱讀推廣智能服務平臺[26],如圖2 所示。閱讀推廣智能服務包括實現(xiàn)讀者用戶畫像、發(fā)現(xiàn)不活躍讀者和閱讀推廣精準化推薦。
圖2 知識圖譜賦能閱讀推廣服務平臺架構(gòu)圖Fig.2 The architecture diagram of the knowledge graph-enabled reading promotion service platform
3.3.1 實現(xiàn)讀者的用戶畫像
在互聯(lián)網(wǎng)時代,營銷手段多種多樣,但不管有多少種方式,都離不開一個核心——分析用戶和理解用戶。圖書館的服務對象是讀者,圖書館需要一個能夠與讀者智能交互的平臺,以更了解讀者的情況。用戶畫像就是給用戶打一組標簽,每個標簽給一個權(quán)重,權(quán)重代表了用戶在這個方面興趣的強烈程度,如圖3所示,加大加粗的文字標簽表示了該用戶具有強烈興趣的依次是閱讀、房貸、活動和團購等[27]。知識圖譜提供了一個構(gòu)建讀者用戶畫像的技術,幫助圖書館更全面地了解讀者的需求。利用知識圖譜作為背景知識來做標簽擴展、標簽推斷,用以提高機器對用戶標簽的理解水平,實現(xiàn)基于標簽的知識圖譜的精準推薦。
圖3 基于標簽的用戶典型性Fig.3 Label-based users' typical features
在用戶畫像的基礎上,當讀者提交一個檢索需求后,可由后臺經(jīng)過圖譜(用戶畫像)的分析,系統(tǒng)會根據(jù)不同的人而展現(xiàn)不同的結(jié)果,讀者通過可視化結(jié)果做出更準確可靠的需求決策。圖譜向讀者展示未知的資源,引導讀者閱讀,增強閱讀廣度和深度,提升讀者閱讀體驗,幫助讀者有效達到發(fā)現(xiàn)目標。
3.3.2 發(fā)現(xiàn)不活躍讀者
眾所周知,圖書館存在著大量不活躍讀者,他們來圖書館的次數(shù)不多,甚至可能因為交通不便、不在這個城市、在圖書館沒找到想要的書等原因沒有再來圖書館,變成了不活躍讀者。這時我們可以通過知識圖譜發(fā)現(xiàn)這類讀者,對其“標簽”屬性進行分析,進而挖掘出他們可能具有的與其他活躍讀者類似的閱讀需求,并提供解決方案,如將圖書館的閱讀服務與之匹配,或者根據(jù)他們的需求拓展新的服務模式,如“你選書、我買單”“網(wǎng)借服務”等形式,吸引讀者重新使用圖書館,使他們從“不活躍”狀態(tài)變?yōu)椤盎钴S”狀態(tài)。如此,借助知識圖譜來提升閱讀推廣的廣度。
3.3.3 實現(xiàn)閱讀推廣的精準化推薦
當前,圖書館的文獻推薦只做到根據(jù)用戶的檢索關鍵字推薦相關的主題文獻,模式比較單一。事實上,文獻是可以根據(jù)著者、出版社、主題詞、借閱者等信息關聯(lián)起來的。在知識圖譜的分析下,文獻推薦的根據(jù)不再是簡單的關鍵字,而是文獻的信息關聯(lián)關系,加上讀者的用戶畫像,比如閱讀習慣或需求,系統(tǒng)會向讀者推薦更符合讀者需求的閱讀資源,這些閱讀資源同時關聯(lián)著更深層次的文獻資源,讀者根據(jù)可視化操作瀏覽各種資源,從而更快更準地挑選出需要的文獻。如圖4 所示,場景一:讀者B 與讀者D 可能會被互相推薦巴金和老舍的作品;場景二:當讀者E 查詢到《紅樓夢》時可以關聯(lián)查到讀者A 借過的《紅樓夢》和《胡適論紅樓夢》,進一步可查看到胡適和曹雪芹的其他作品,再進一步可通過同時借過《容忍與自由》和《電》的讀者C 關聯(lián)到巴金的作品,繼續(xù)往下關聯(lián)可查看到老舍的作品。
圖4 “文獻-讀者”知識圖譜Fig.4 "Document-reader"knowledge graph
相比傳統(tǒng)數(shù)據(jù)庫而言,知識圖譜以更加直觀的展示形式表現(xiàn)實體間的關聯(lián)關系。知識圖譜將讀者、文獻、著者、出版社等元素(實體)相互關聯(lián),呈現(xiàn)給讀者更全面的知識脈絡。通過知識圖譜我們可以發(fā)現(xiàn)這些元素本身并不是孤立的,它們相互關聯(lián),這就構(gòu)成了這些實體間多樣的關聯(lián)關系。通過這種關聯(lián)關系,多維度地向讀者精準化推送更多信息,讀者更容易發(fā)現(xiàn)或找到喜歡的文獻,從而增強閱讀興趣。
“知識圖譜”是一種基于大數(shù)據(jù)分析的可視化分析研究方式,可以利用部分知識圖譜工具對文獻信息和讀者信息(如借閱、預約歷史、個人信息等)做知識抽取,知識融合,建立數(shù)據(jù)倉庫,并用可視化界面直接展示出來,利用這種技術可以更好地與讀者進行需求交互,讓讀者可以自主選擇更加適合自己的推薦。
傳統(tǒng)意義的大數(shù)據(jù)分析,只能將問題、現(xiàn)象或者結(jié)果本身展現(xiàn),不能串聯(lián)成一個整體,無法提供具體的解決方法。而“知識圖譜”可以直接展示多種邏輯聯(lián)系。因此,圖書館能夠利用知識圖譜勾勒出閱讀推廣的思路圖甚至是具體實施關鍵點,來更好地利用現(xiàn)有資源進行讀者的閱讀推廣工作。讀者也可以根據(jù)自己的情況,自行選擇路徑,篩選感興趣的內(nèi)容,提升推廣的準確度和成功率。依托此技術展開的閱讀推廣,不僅可以讓讀者直觀地進行自主判斷選擇,還能夠以一種“引導”的方式啟發(fā)讀者新的閱讀思路,提供讓讀者更為容易接納的內(nèi)容,完成個性化的閱讀推廣。
利用“知識圖譜”分析的意義在于可自動完善讀者的需求,甚至能夠分析出隱藏的需求,并在解讀后提供完整的、多維度的、可行性的解決方案。面對大眾讀者的閱讀推廣方面的應用研究,則可能是未來人工智能在圖書館應用的著陸點,該應用的研究會帶來更加智能的自動需求交互。
知識圖譜為圖書館的人工智能應用研究提供了一個好的數(shù)據(jù)庫儲備及分析表達方式。在日常工作及閱讀推廣的活動中,知識圖譜將提供具體的解決方案。例如,在未來某個讀者與圖書館的智能服務終端對話:“我現(xiàn)在大四,對未來很迷茫?!敝悄芸头涂梢詫⑦@段自然語言解析后與知識圖譜信息結(jié)合,除了推薦就業(yè)規(guī)劃方面的主題圖書外,還能就“迷?!币辉~所表述的心理狀態(tài)給出如“鑒于您可能對心理學方面的著作比較感興趣,我們推薦您閱讀《弗洛伊德心理健康思想解析》《發(fā)展心理學》《心理咨詢師手記》《心理咨詢師國家職業(yè)資格考試專用輔導教材》”等達到多目標的建議,以此來展示讀者未知的資源,引導讀者閱讀,增強閱讀廣度和深度,提升讀者閱讀體驗,幫助讀者有效達到獲取知識的目標。
大數(shù)據(jù)環(huán)境下,圖書館作為全民閱讀的重要陣地,為了進一步提升閱讀推廣工作效益,應積極探索精準化閱讀推廣服務新模式?;诖?,圖書館可以利用知識圖譜技術,構(gòu)建“文獻-讀者”知識圖譜,以更加直觀的表現(xiàn)形式將圖書館本身擁有的文獻、讀者等相關的海量信息有效關聯(lián)起來,用以搭建圖書館閱讀推廣智能服務平臺。閱讀推廣智能服務平臺可以應用于構(gòu)建讀者用戶畫像與讀者進行需求交互、發(fā)現(xiàn)不活躍讀者并解析其閱讀需求提供解決方案、開拓精準推薦及引導閱讀的新思路,增強閱讀推廣精準化力度,助推全民閱讀。知識圖譜賦能閱讀推廣的研究是知識圖譜在圖書館資源發(fā)現(xiàn)和服務應用中的其中一方面,是智慧化圖書館服務的探索,為“十四五”時期公共圖書館貫徹高質(zhì)量發(fā)展理念、建設“智慧圖書館”提供了新思路。