王懿松 張雪蕾
摘要隨著信息過載時代的到來,海量的電子資源使用戶身處“知識迷航”的困境。同時,用來刻畫用戶行為的用戶畫像已在各領(lǐng)域廣泛應(yīng)用。通過對用戶數(shù)據(jù)的分析挖掘,可構(gòu)建出高精度的用戶畫像,這對面向用戶開展電子資源推薦服務(wù)具有重要作用。論文構(gòu)建的用戶畫像是基于用戶與資源維度,結(jié)合了用戶的基本屬性、興趣屬性及社交屬性構(gòu)建了用戶相似度模型來發(fā)現(xiàn)相似用戶,并對用戶與相似用戶的閱讀偏好進行相似度計算,最后將相似用戶閱讀偏好中相似度值較高的電子資源進行推薦服務(wù)。實驗結(jié)果表明基于用戶畫像的個性化電子資源推薦服務(wù)可較為精確地實現(xiàn)個性化推薦服務(wù),這是對智慧圖書館提供相應(yīng)智慧服務(wù)的有效探索,更加便利用戶的數(shù)據(jù)獲取。
關(guān)鍵詞用戶畫像;電子資源;訪問行為;推薦服務(wù)
分類號 G250.7
Preliminary Exploration of Personalized Electronic Resource Recommendation Service Based on User Personas
Wang Yisong, Zhang Xuelei
AbstractWith the advent of the era of information overload, the use of massive electronic resources has placed users in a dilemma of “knowledge loss”. At the same time, user personas, which are used to characterize user behavior, have been widely applied in various fields. Through the analysis and mining of user data, a highly accurate user persona can be constructed, which plays an important role in providing electronic resource recommendation services to users. The user persona constructed in this paper?is based on the dimensions of users and resources, and combines the basic attributes, interest attributes, and social attributes of users to construct a user similarity model to discover similar users. The similarity calculation is performed on the reading preferences of users and similar users, and finally, the electronic resources with high similarity values in the reading preferences of similar users are recommended for service. The experimental results show that personalized electronic resource recommendation services based on user personas can achieve personalized recommendation services more accurately. This is an effective exploration of providing corresponding smart services for smart libraries, which is more convenient for users to obtain data.
Keywords ?User profiles. Electronic resources. Access behaviors. Recommendation services.
0引言
隨著社會智慧化進程的加快,及“全國智慧圖書館體系建設(shè)”項目的正式啟動,智慧圖書館建設(shè)已由“將來時”逐步發(fā)展到了“現(xiàn)在時”[1],智慧圖書館更強調(diào)在智慧技術(shù)加持下通過創(chuàng)新智慧服務(wù)來賦能用戶?,F(xiàn)階段,知識爆炸時代引發(fā)了海量資源信息,使得用戶深陷“知識迷航”困境,搜索所需資源需要耗費更多的時間成本,因此如何減輕信息過載困境,面向用戶提供便捷的數(shù)據(jù)獲取途徑,進而提升文獻精準(zhǔn)服務(wù)能力,滿足用戶個性化閱讀需求,就更需要精確地刻畫出用戶信息需求并據(jù)此開展智慧推薦服務(wù)。
目前,解決信息過載的主要方式是搜索引擎與推薦系統(tǒng),二者對于用戶來說是互補工具。搜索引擎滿足了明確目的用戶的主動查找需求,推薦系統(tǒng)幫助用戶發(fā)現(xiàn)無明確目的時的感興趣內(nèi)容。推薦系統(tǒng)是將用戶與物品聯(lián)系,更好地發(fā)掘出物品的長尾,這正是個性化推薦系統(tǒng)的主要目標(biāo)。個性化推薦需要依賴于用戶的行為數(shù)據(jù),通過解析大量的用戶行為日志,給不同用戶添加標(biāo)簽來實現(xiàn)。而用戶畫像技術(shù)是對真實用戶的抽象描述,通過構(gòu)建多維度標(biāo)簽屬性勾畫用戶特征、行為、興趣或偏好,從而為個性化服務(wù)、精準(zhǔn)推送提供了數(shù)據(jù)支持。
常見電子資源的推薦算法有基于圖的推薦、基于內(nèi)容推薦和協(xié)同過濾推薦等,但前兩者未考慮影響推薦結(jié)果的其他重要因素,且在小數(shù)據(jù)集上表現(xiàn)良好卻難以處理大規(guī)模在線數(shù)據(jù),而協(xié)同過濾容易受到冷啟動及稀疏數(shù)據(jù)問題的影響。本文提出的基于用戶畫像的電子資源推薦方法,可對傳統(tǒng)推薦效能給予補充和效應(yīng)增強。
綜上,基于用戶畫像的個性化電子資源推薦系統(tǒng)會主動面向用戶推薦相似文獻,進而建立系統(tǒng)與用戶間的密切聯(lián)系,形成“用戶-系統(tǒng)-用戶”的良性循環(huán)。本文在用戶畫像框架下,提出了結(jié)合用戶的基本屬性、興趣屬性及社交屬性構(gòu)建用戶相似度模型發(fā)現(xiàn)相似用戶,并對用戶與相似用戶的閱讀偏好進行相似度計算,最后將相似用戶閱讀偏好中相似度值較高的電子資源進行推薦服務(wù)。該方法是以平臺建設(shè)為抓手,是對設(shè)計、探索圖書館開展創(chuàng)新智慧服務(wù)的有效探索。
1相關(guān)研究概述
1.1用戶畫像
傳統(tǒng)的用戶畫像最初多應(yīng)用于計算機及電子商務(wù)領(lǐng)域,作為精準(zhǔn)營銷、個性化推薦推薦及用戶拓展等業(yè)務(wù)的數(shù)據(jù)支撐。近年來,用戶畫像也逐步應(yīng)用到圖書館服務(wù)領(lǐng)域。早在1985年,英國國家書目和Blaise-line通過訪談及電話采訪方式調(diào)查用戶對英國國家書目和Blaise-line的使用情況進行分析,以滿足用戶多元化信息需求[2]。P., Jomsri[3]通過用戶數(shù)據(jù)構(gòu)建用戶畫像,并應(yīng)用關(guān)聯(lián)規(guī)則建立圖書推薦模型;Kumar[4]等使用奇異值分解方法為每個用戶構(gòu)建用戶興趣畫像,并標(biāo)注用戶感興趣的資源,并將其應(yīng)用于用戶的個性化搜索。Abri等[5]通過主題模型構(gòu)建用戶主題特征,并使用主題模型根據(jù)用戶配置文件對用戶進行分組實現(xiàn)群體用戶興趣畫像的刻畫。
國內(nèi)相關(guān)研究起步較晚,李業(yè)根[6]在2014年首次提出了使用用戶畫像實現(xiàn)圖書館精準(zhǔn)營銷策略;張鈞[7]構(gòu)建了基于用戶畫像的圖書館知識發(fā)現(xiàn)服務(wù)模型。劉速[8]以天津圖書館為例,闡述了用戶畫像的構(gòu)建方法及可視化、多維度交叉分析、關(guān)系圖譜等分析方法。徐海玲等[9]借鑒概念格方法,對不同群體用戶進行關(guān)聯(lián)規(guī)則挖掘,并實現(xiàn)群體用戶興趣畫像的刻畫。王慶等[10]整合圖書館各個系統(tǒng)的用戶數(shù)據(jù),通過聚類等數(shù)據(jù)挖掘分析方式形成用戶標(biāo)簽體系并建立用戶畫像模型,從單用戶及群體用戶角度開展了資源的精準(zhǔn)推薦。何娟[11]、李曉敏等[12]、王大阜等[13]從用戶多屬性維度出發(fā)構(gòu)建用戶畫像,并實現(xiàn)智慧圖書館的圖書個性化。于興尚等、陳丹等、徐鵬程等基于用戶畫像,構(gòu)建圖書館精準(zhǔn)服務(wù)模型[14],為用戶提供個性化服務(wù)[15],促進數(shù)字圖書館的知識服務(wù)升級[16]。
1.2電子資源推薦
電子資源推薦技術(shù)是根據(jù)用戶在平臺內(nèi)的檢索、閱讀習(xí)慣主動向用戶推送其感興趣的資源,旨在幫助用戶從海量資源中迅速找到所需文獻,滿足其個性化需求。隨著電子文獻數(shù)量激增及用戶對電子資源利用率的提高,越來越多的學(xué)者開始關(guān)注電子資源的推薦方式。傳統(tǒng)的電子資源推薦方式主要分為三類:基于圖的推薦、基于內(nèi)容的推薦和協(xié)同過濾推薦[17]。
基于圖的推薦算法不考慮到用戶的背景信息及資源的內(nèi)容,而是通過將用戶或物品的聯(lián)系抽象成網(wǎng)絡(luò)中的節(jié)點,通過度量節(jié)點間的相關(guān)性進行推薦。例如Chakraborty等[18]使用關(guān)鍵詞構(gòu)建引文圖表并通過頂點增強的隨機游走算法進行推薦;Cai等[19]構(gòu)建了一個地點層、作者層與論文層的三層圖,并結(jié)合書目網(wǎng)絡(luò)模型實現(xiàn)了個性化論文推薦。
基于內(nèi)容的推薦方式是從資源內(nèi)容本身提取特征構(gòu)建推薦模型,如R., Nagori等[20]通過LDA對語料庫進行主題分析,并通過相似度模型實現(xiàn)基于內(nèi)容的推薦方法;曾子明[21]等通過基于內(nèi)容的個性化過濾方法識別用戶主題偏好,再利用社會網(wǎng)絡(luò)分析方法識別文獻并進行推薦。
協(xié)同過濾算法是電子資源推薦中應(yīng)用較為普遍的算法,其理論是通過用戶對資源的反饋構(gòu)建評分矩陣,從中篩選出目標(biāo)用戶可能感興趣的信息。如李默等[22]提出了在協(xié)同過濾算法的基礎(chǔ)上融合了相似性評價、信任度與社會網(wǎng)絡(luò)的學(xué)術(shù)資源推薦方法;王剛[23]通過挖掘用戶行為對其興趣量化,并建立隨時間而變的自適應(yīng)用戶興趣模型,結(jié)合基于用戶與基于項目的協(xié)同過濾算法實現(xiàn)電子資源推薦服務(wù);楊辰等[24]在基于用戶的協(xié)同過濾算法基礎(chǔ)上,使用非監(jiān)督的融合策略整合了文本相似度及用戶相似度,構(gòu)建了個性化的電子文獻資源推薦系統(tǒng)。
綜合已有研究可知,現(xiàn)用推薦算法不能很好地獲取及挖掘用戶的特征及隱顯興趣,但綜合考慮用戶與資源特征是有效提高電子資源推薦準(zhǔn)確性的關(guān)鍵要素,基于此,本文通過構(gòu)建用戶畫像,結(jié)合用戶相似度與資源相似度算法,可以從多維度為不同背景、不同知識需求的用戶提供差異化的個性化電子資源推送,有效實現(xiàn)服務(wù)定位精準(zhǔn)化與資源利用高效化。
2?用戶畫像的構(gòu)建
用戶畫像的構(gòu)建可分為3個步驟:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理及用戶畫像生成。在數(shù)據(jù)采集時,需盡可能從多維角度收集詳盡的原始數(shù)據(jù),預(yù)處理繁雜冗余的原始數(shù)并提煉有效信息,并利用自然語言處理、標(biāo)簽等方式生成多維度的用戶畫像。
2.1數(shù)據(jù)收集
為更精準(zhǔn)地描述用戶全貌,需要采集多來源數(shù)據(jù)構(gòu)建不同維度的用戶畫像模型。用戶畫像數(shù)據(jù)多分為靜態(tài)數(shù)據(jù)與動態(tài)數(shù)據(jù)。靜態(tài)數(shù)據(jù)多是用戶基本屬性,如姓名、性別、院系、年級等;動態(tài)數(shù)據(jù)多指戶行為數(shù)據(jù),如用戶不斷變化的行為類型。
本文利用西安交通大學(xué)電子資源使用統(tǒng)計分析系統(tǒng)作為用戶畫像采集數(shù)據(jù)源,并以西安交通大學(xué)2023年CNKI數(shù)據(jù)庫為例完成畫像構(gòu)建及資源推薦。靜態(tài)數(shù)據(jù)為校園統(tǒng)一身份認(rèn)證接入的信息傳遞及圖書館管理系統(tǒng)中的相關(guān)讀者信息;動態(tài)信息為用戶訪問數(shù)據(jù)庫時的點擊、訪問操作數(shù)據(jù)。
2.2數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理階段是將有效數(shù)據(jù)從原始數(shù)據(jù)中提煉并分離,轉(zhuǎn)換為合理的存儲結(jié)構(gòu),便于后續(xù)數(shù)據(jù)挖掘及畫像構(gòu)建。在預(yù)處理過程中,除對所需字段的日志解析外,還需判斷用戶行為,防止用戶誤操作或網(wǎng)絡(luò)導(dǎo)致的重復(fù)、錯誤數(shù)據(jù)。如:在處理檢索日志時,在1分鐘內(nèi)發(fā)生的多次相同詞檢索記為1次檢索。本文設(shè)置時間參數(shù)為T,T取值1分鐘,將1分鐘內(nèi)重復(fù)行為刪除。預(yù)處理數(shù)據(jù)后,本文選擇了在CNKI數(shù)據(jù)庫均存在檢索、閱讀及下載行為,且閱讀下載記錄總和大于20條記錄的用戶作為用戶數(shù)據(jù)源。并從每位用戶的閱讀下載記錄中選擇時間排序最近的20條文獻放入電子資源推薦數(shù)據(jù)池。
2.3用戶畫像生成
為更深層地體現(xiàn)用戶差異,需從多維度刻畫用戶特征,為個性化推薦服務(wù)奠定數(shù)據(jù)基礎(chǔ)。本文以電子訪問行為作為數(shù)據(jù)特征,從用戶維度及資源維度刻畫用戶畫像。其中,用戶維度分為基本屬性、興趣屬性及社交屬性3個維度。詳細(xì)的用戶畫像見圖1所示 。
2.3.1用戶維度
(1)基本屬性
基本屬性用于描述用戶基礎(chǔ)的特征,為靜態(tài)數(shù)據(jù),包括學(xué)號、姓名、性別、院系、專業(yè)、年級、身份類型等數(shù)據(jù)。
(2)興趣屬性
興趣屬性維度是反映用戶偏好和需求的核心屬性,是用于挖掘用戶隱性興趣的重要維度。通過對用戶電子資源使用行為的采集與挖掘,分析出用戶的對不同主題內(nèi)容的興趣度。一般認(rèn)為,檢索行為表現(xiàn)出用戶感興趣的研究方向,閱讀和下載行為能更體現(xiàn)出用戶對資源的喜好。
本文使用Jieba分詞庫分別對用戶的檢索內(nèi)容、閱讀及下載文獻分詞并去除停用詞。檢索內(nèi)容分詞結(jié)果頻次賦值1,閱讀及下載文獻分詞結(jié)果頻次賦值2,統(tǒng)計所有特征詞及詞頻作為用戶興趣屬性的基礎(chǔ)數(shù)據(jù)。選擇每位用戶詞頻大于5的特征詞類標(biāo)注用戶興趣屬性維度。部分用戶興趣屬性維度的特征詞如表1所示。
(3)社交屬性維度
社交屬性是描述用戶間的交互行為,可反映出用戶在資源閱讀方面的興趣關(guān)聯(lián)。通過對電子資源的使用行為可挖掘分析用戶潛在社交關(guān)系,即用戶訪問或閱讀下載同一類電子資源時,表征其存在隱性交互關(guān)系,可借助中圖分類號識別文獻學(xué)科屬性與特征。當(dāng)不同用戶訪問的資源屬于中圖分類法相同二級類目時,默認(rèn)其有資源的興趣關(guān)聯(lián),相同二級類目資源訪問行為越多,證明其關(guān)聯(lián)性越強,用戶間相似度更高。因此社交屬性維度可表示為S=(N1,N2,……,N),其中i表示中圖分類號二級類目,Ni表示用戶對i類電子資源的訪問次數(shù)。
2.3.2資源維度
資源維度是描述電子資源屬性,反映電子資源文獻的基本信息,包括了題名、摘要、作者、中圖分類法、關(guān)鍵詞、出版期刊等數(shù)據(jù)。用戶畫像的資源維度是用戶閱讀下載文獻的記錄。部分資源及其維度特征如表2。
2.3.3用戶畫像示例
通過以上的用戶畫像構(gòu)建方式,構(gòu)建出用戶ID3的用戶畫像構(gòu)成如圖2所示。
3基于用戶畫像的電子資源推薦
本文構(gòu)建的用戶畫像是從用戶及資源兩個維度進行探討,因此在電子資源推薦時也分為基于相似用戶與基于相似資源兩個維度。為了提高推薦效率,降低用戶等待時間,本文先通過用戶相似模型生成相似用戶集,再從相似用戶的電子資源推薦池中,利用資源模型向用戶推薦相似度較高的電子資源,實現(xiàn)個性化推薦服務(wù)。
3.1相似用戶集的生成
相似用戶集的生成時,需要基于用戶畫像中的3個用戶維度分別尋求最相似用戶群體,線性擬合后選出相似度最高的用戶群體作為相似用戶集。
3.1.1用戶基本屬性相似度
用戶的基本屬性包括學(xué)號、姓名、性別、院系、專業(yè)、年級、身份類型等數(shù)據(jù),本文計算除編號和姓名外的定量標(biāo)簽,計算相似度公式為
用戶性別使用0或1代指男女,院系、專業(yè)、年級、身份類型使用數(shù)字編碼進行換算,相似度計算采取差額絕對值方式,并對所有定量標(biāo)簽數(shù)據(jù)歸一化處理,將不同取值范圍的數(shù)據(jù)統(tǒng)一映射到[0,1]區(qū)間內(nèi)。采取線性函數(shù)轉(zhuǎn)換為:
3.1.2用戶興趣屬性相似度
用戶的興趣屬性相似度需通過計算用戶特征詞的相似度實現(xiàn)。本文采用Word2Vec[25]訓(xùn)練語料獲取詞向量計算特征詞相似度。首先先選取了基于Hierarchical Softmax結(jié)構(gòu)的Skip-Gram模型完成語料訓(xùn)練,訓(xùn)練語料為電子資源推薦池內(nèi)文獻的摘要及全文;再利用gensim庫語料訓(xùn)練來獲取特征詞的詞向量,詞向量維度為300。訓(xùn)練后的詞向量通過余弦相似度模型計算特征詞相似度,余弦值越大,兩個向量之間的夾角就越小,其相似性越高。計算公式如下:
最后將結(jié)果集記為用戶興趣屬性相似度集合B。
3.1.3用戶社交屬性相似度
由用戶共同閱讀下載同一二級類目下的文獻記錄越多,說明用戶的社交屬性相似度越高。為了減少不同用戶對同一二級類目下文獻的閱讀量差異過大帶來的影響,考慮采用修正余弦相似度計算,計算公式如下:
最后將結(jié)果集記為用戶社交屬性相似度集合??。
3.2基于相似資源的電子資源推薦
本文選擇題名、作者、關(guān)鍵詞、出版期刊作為聯(lián)合特征詞,通過短文本相似度計算選擇出最相似的電子資源。由于聯(lián)合特征詞較長, Word2Vec已無法精準(zhǔn)描述詞向量,本文使用Sentence-BERT(SBERT)模型[26]計算短文本相似度。SBERT是使用孿生網(wǎng)絡(luò)和對三級網(wǎng)絡(luò)結(jié)構(gòu)的權(quán)重更新,生成語義句向量,通過距離度量計算發(fā)現(xiàn)相似語義文本,其模型如圖 3所示。
SBERT在BERT的輸出上添加一個pooling操作產(chǎn)生等長的句子向量,本文選擇了效果更好的平均池化(MEAN pooling)操作。SBERT模型的子網(wǎng)絡(luò)為2個共享參數(shù)的BERT模型。在模型中,???????????????????與??????????????????兩個句子進入BERT模型后,分別得到對應(yīng)句子向量??、??,將??、??和兩者求差向量進行拼接,拼接結(jié)果與權(quán)重系數(shù)()進行softmax函數(shù)進行分類訓(xùn)練。公式如下所示:
3.3基于用戶畫像的電子資源推薦結(jié)果生成
在生成相似用戶集后,根據(jù)相似用戶集中用戶電子資源與目標(biāo)用戶電子資源集,進行資源的相似度模型比較后,選擇相似度最高的topN電子資源,并將其推薦給目標(biāo)用戶。具體步驟如下:
以上文提到的某用戶ID3舉例,根據(jù)相似用戶集生成與用戶3最相似的Top5用戶,分別為用戶ID55、73、102、31和17,計算結(jié)果如下:
其用戶代表特征(部分)如表3:
在得到5位相似用戶后,分別通過資源相似度模型計算出電子資源推薦池內(nèi)相似度值較高的電子資源與,將Top10電子資源推薦給目標(biāo)用戶ID3,其推薦結(jié)果如表 4所示。
用戶ID3的研究方向聚焦于“人口老齡化、醫(yī)療保障、老齡化 …醫(yī)養(yǎng)結(jié)合、醫(yī)療保障體系、社會救助”等方向,最終的推薦結(jié)果與其研究方向重合度較高,驗證了推薦算法的合理性,表明此算法能夠較好地完成個性化推薦服務(wù)。
4?結(jié)語
電子資源的個性化推薦是有效緩解信息過載,最大化滿足用戶文獻檢索時效性需求,提高文獻資源利用率的有效方法。因此,構(gòu)建電子資源推薦系統(tǒng)對滿足用戶個性化閱讀需求具有重要意義。本文提出了一種基于用戶畫像的個性化電子資源推薦服務(wù)思路,旨在通過構(gòu)建用戶畫像準(zhǔn)確、全面地把握用戶閱讀偏好,通過對用戶靜態(tài)、動態(tài)數(shù)據(jù)采集、挖掘構(gòu)建出用戶畫像,并在此基礎(chǔ)上以某一用戶為例,測評電子資源個性化推薦算法,結(jié)果表明該算法與傳統(tǒng)推薦算法相較更為準(zhǔn)確可靠。個性化電子資源服務(wù)初探,是智慧圖書館中智能技術(shù)的實踐探索。在未來研究中,可與各類云服務(wù)平臺打通,打破各平臺信息壁壘,獲得更多的用戶數(shù)據(jù)源,提升推薦效果,增強用戶與圖書館黏性。
參考文獻:
[1] 吳漢華,王波. 2020年中國高校圖書館基本統(tǒng)計數(shù)據(jù)報告[J]. 大學(xué)圖書館學(xué)報, 2021, 39(4): 5-11.
[2] 庫珀著. 交互設(shè)計之路 [M]. 北京:電子工業(yè)出版社, 2006:10.
[3] 劉漫. 基于用戶畫像的高校圖書館閱讀推廣模式構(gòu)建[J]. 圖書館理論與實踐, 2019(7): 21-26.
[4] 李業(yè)根. 基于大數(shù)據(jù)的圖書館信息營銷策略[J]. 圖書館學(xué)刊, 2014, 36(10): 7-9.
[5] 張鈞. 基于用戶畫像的圖書館知識發(fā)現(xiàn)服務(wù)研究[J]. 圖書與情報, 2017(6): 60-63.
[6] 劉速. 淺議數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)中的用戶畫像:以天津圖書館為例[J]. 圖書館理論與實踐, 2017(6): 103-106.
[7] 徐海玲,張海濤,張梟慧,等. 基于概念格的高校圖書館群體用戶興趣畫像研究[J]. 情報科學(xué), 2019, 37(9): 153-158.
[8] 尤明輝,殷亞鳳,謝磊,等. 基于行為感知的用戶畫像技術(shù)[J]. 浙江大學(xué)學(xué)報(工學(xué)版), 2021, 55(4): 608-614.
[9] 王慶,趙發(fā)珍. 基于“用戶畫像”的圖書館資源推薦模式設(shè)計與分析[J]. 現(xiàn)代情報, 2018, 38(3): 105-109.
[10] 何娟. 基于用戶個人及群體畫像相結(jié)合的圖書個性化推薦應(yīng)用研究[J]. 情報理論與實踐, 2019, 42(1): 129-133.
[11] 李曉敏,熊回香,杜瑾,等. 智慧圖書館中基于用戶畫像的圖書推薦研究[J]. 情報科學(xué), 2021, 39(7): 15-22.
[12] 王大阜,鄧志文,賈志勇,等. 基于用戶畫像的高校圖書館個性化圖書推薦研究[J]. 河南師范大學(xué)學(xué)報(自然科學(xué)版), 2022, 50(3): 95-103.
[13] 陳丹,羅燁,吳智勤. 基于大數(shù)據(jù)挖掘和用戶畫像的高校圖書館個性化服務(wù)研究[J]. 圖書館研究與工作, 2019(4): 50-53.
[14] 許鵬程,畢強,張晗,等. 數(shù)據(jù)驅(qū)動下數(shù)字圖書館用戶畫像模型構(gòu)建[J]. 圖書情報工作, 2019, 63(3): 30-37.
[15] 于興尚,王迎勝. 面向精準(zhǔn)化服務(wù)的圖書館用戶畫像模型構(gòu)建[J]. 圖書情報工作, 2019, 63(22): 41-48.
[16] BEEL?J, GIPP?B, LANGER?S, et al. Research-paper recommender systems: a literature survey.[J]. International Journal on Digital Libraries, 2016, 17(4): 305-338.
[17] CHAKRABORTY?T, MODANI?N, NARAYANAM?R, et al. DiSCern: A diversified citation recommendation system for scientific queries[J].IEEE, 2015:555-566.
[18] XIAOYAN?C, YU?Z, LIBIN?Y, et al. Bibliographic Network Representation Based Personalized Citation Recommendation[J]. IEEE Access, 2019, 7: 457-467.
[19] R. N, G. A. LDA based integrated document recommendation model for e-learning systems[C]?Emerging Trends in Networks and Computer Communications (ETNCC), 2011 International Conference on?IEEE,2011: 230-233.
[20] 曾子明,周紅. 科技文獻中基于主題的社會化推薦研究[J]. 情報理論與實踐, 2015, 38(3): 71-76.
[21] 李默,梁永全,趙建立. 融合相似性評價、信任度與社會網(wǎng)絡(luò)的學(xué)術(shù)資源推薦方法研究[J]. 情報理論與實踐, 2015, 38(5): 77-81.
[22] 王剛. 自適應(yīng)用戶興趣偏好的電子資源協(xié)同過濾推薦研究[J]. 情報探索, 2018(9): 18-22.
[23] 楊辰,劉婷婷,劉雷,等. 融合語義和社交特征的電子文獻資源推薦方法研究[J].?情報學(xué)報, 2019, 38(6): 632-640.
[24] 張慧敏,辛向陽.構(gòu)建動態(tài)用戶畫像的四個維度[J]. 工業(yè)設(shè)計, 2018(04): 59-61.
[25] 范曉玉,竇永香,趙捧未,等. 融合多源數(shù)據(jù)的科研人員畫像構(gòu)建方法研究[J].?圖書情報工作, 2018, 62(15): 31-40.
[26] 胡媛,毛寧. 基于用戶畫像的數(shù)字圖書館知識社區(qū)用戶模型構(gòu)建[J].?圖書館理論與實踐, 2017(4): 82-85.
[27] MIKOLOV?T, CHEN?K, CORRADO?G, et al. Efficient Estimation of Word Representations in Vector Space[J]. Computer Science, 2013: 1301-3781.?http://arxiv.org/abs/1301.3781.
[28]?REIMERS N, GUREVYCH?I. Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks[J]. Computer Science, 2019: 1908-10084.?http://arxiv.org/abs/1908.10084.
王懿松 ?西安交通大學(xué)圖書館館員。陜西西安。710049。
張雪蕾 ?西安交通大學(xué)圖書館信息技術(shù)部主任,副研究館員。陜西西安。710049。
(收稿時間:?2023-12-18 ?編校:左靜遠(yuǎn))