国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

學(xué)術(shù)資源推薦服務(wù)中多維度用戶畫像構(gòu)建

2021-04-23 05:50:40顧亦然郭玉雯
軟件導(dǎo)刊 2021年4期
關(guān)鍵詞:畫像學(xué)術(shù)維度

顧亦然,郭玉雯

(南京郵電大學(xué)自動(dòng)化學(xué)院、人工智能學(xué)院,江蘇南京 210046)

0 引言

隨著大數(shù)據(jù)時(shí)代的來(lái)臨,信息超載是互聯(lián)網(wǎng)用戶面臨的一個(gè)嚴(yán)重問(wèn)題,學(xué)術(shù)研究領(lǐng)域也深受影響。論文、會(huì)議報(bào)告、專利、學(xué)術(shù)博客和學(xué)術(shù)新聞等學(xué)術(shù)資源呈爆炸式增長(zhǎng),面對(duì)海量學(xué)術(shù)資源,科研人員往往需要花費(fèi)大量時(shí)間和精力查找所需資源。常規(guī)的關(guān)鍵詞搜索模式未考慮用戶研究背景、用戶偏好、行為目的等信息,無(wú)法很好地滿足各類型學(xué)者的個(gè)性化需求,因此個(gè)性化推薦系統(tǒng)應(yīng)運(yùn)而生。然而,現(xiàn)有個(gè)性化推薦系統(tǒng)仍存在很多問(wèn)題,大量無(wú)關(guān)的冗余信息嚴(yán)重影響了對(duì)有效信息的檢索、選擇及利用。近年來(lái),用戶畫像概念被引入學(xué)術(shù)資源推薦領(lǐng)域,彌補(bǔ)了個(gè)性化推薦服務(wù)的缺陷。本文從多個(gè)維度分析學(xué)術(shù)用戶畫像,構(gòu)建學(xué)術(shù)用戶畫像模型,為學(xué)術(shù)資源推薦服務(wù)優(yōu)化提供一種新思路。

1 國(guó)內(nèi)外相關(guān)研究進(jìn)展

用戶畫像這一概念起源于交互設(shè)計(jì)之父Cooper[1],其定義用戶畫像為真實(shí)用戶的虛擬代表,是“建立在真實(shí)數(shù)據(jù)之上的目標(biāo)用戶模型”。如今,用戶畫像廣泛應(yīng)用于電子商務(wù)等多個(gè)領(lǐng)域,為制定真實(shí)商品及虛擬產(chǎn)品推薦策略提供多元化的參考依據(jù)。在學(xué)術(shù)資源(尤其是圖書館資源)推薦領(lǐng)域,也有很多學(xué)者針對(duì)用戶畫像概念開(kāi)展了大量研究。

現(xiàn)有研究中對(duì)學(xué)術(shù)用戶畫像的構(gòu)建,主要通過(guò)分析用戶學(xué)術(shù)行為,挖掘用戶的興趣、研究方向等學(xué)術(shù)偏好,并找出影響用戶偏好和興趣的因素,賦予用戶不同的標(biāo)簽信息,從個(gè)性化角度優(yōu)化學(xué)術(shù)資源推薦算法。如李丹等[2]通過(guò)將顯式和隱式相結(jié)合獲取用戶信息,深度探討用戶潛在興趣,從而提供個(gè)性化的推薦方案;劉海鷗等[3]基于圖書館用戶的基本信息、內(nèi)容偏好,以及互動(dòng)數(shù)據(jù)、情境數(shù)據(jù)等進(jìn)行標(biāo)簽化識(shí)別,構(gòu)建圖書館用戶畫像,引入情境化的推薦方法;Javier 等[4]根據(jù)用戶與Web 應(yīng)用程序的交互方式確定用戶在人口學(xué)上的差異性表現(xiàn),將用戶偏好與用戶體驗(yàn)作為控制變量,采用多元回歸方式進(jìn)行分析,對(duì)用戶具體需求及偏好等進(jìn)行分類,實(shí)現(xiàn)個(gè)性化推薦;Leung 等[5]從搜索日志中獲取用戶畫像信息,考慮用戶的積極和消極兩方面偏好,以提升聚類算法質(zhì)量,提高推薦結(jié)果的準(zhǔn)確性。

隨著學(xué)術(shù)社交媒體(如科學(xué)網(wǎng)、科研之友、Research-Gate 等)的發(fā)展,用戶的社交網(wǎng)絡(luò)關(guān)系也成為學(xué)術(shù)資源推薦的重要依據(jù)。李默等[6]利用信任度分析與社會(huì)網(wǎng)絡(luò)關(guān)系挖掘技術(shù)對(duì)協(xié)同過(guò)濾推薦方法進(jìn)行改進(jìn),提高了學(xué)術(shù)資源推薦系統(tǒng)的推薦質(zhì)量;Mazhari 等[7]基于社交網(wǎng)絡(luò)中的友誼關(guān)系建立推薦平臺(tái),構(gòu)建用戶畫像,挖掘并分析用戶模型,找出影響友誼形成的因素及不同因素之間的影響程度,在社交網(wǎng)絡(luò)中提取用戶真實(shí)數(shù)據(jù),從而建立推薦系統(tǒng);Amoreti 等[8]基于情境感知理論提出Universal Profiling and Recommendation(UPR)方法,揭示了用戶個(gè)體行為與群體行為之間的關(guān)聯(lián)性,并使用K-means 算法對(duì)用戶進(jìn)行聚類,從而找到用戶偏好和興趣;Li 等[9]根據(jù)作者的合著關(guān)系,利用隨機(jī)游走算法提出ACRec 模型,將合著順序、合著時(shí)間點(diǎn)及持續(xù)時(shí)間作為連接要素,進(jìn)行學(xué)術(shù)協(xié)作推薦。

綜上所述,當(dāng)前國(guó)內(nèi)外研究多以挖掘用戶偏好、用戶社交關(guān)系等作為優(yōu)化推薦策略的核心。大多數(shù)研究在建立學(xué)術(shù)用戶畫像模型時(shí)只考慮了與學(xué)術(shù)活動(dòng)直接相關(guān)的因素,圍繞用戶的學(xué)術(shù)興趣、研究方向、學(xué)科需求等進(jìn)行模型構(gòu)建,導(dǎo)致用戶畫像的呈現(xiàn)過(guò)于扁平化,賦予用戶的標(biāo)簽具有集中化、單一化的缺陷,稀疏的標(biāo)簽維度也可能使推薦結(jié)果陷入過(guò)擬合。考慮學(xué)術(shù)社交網(wǎng)絡(luò)的因素是對(duì)學(xué)術(shù)用戶畫像的豐富與完善,但同時(shí)也存在著一定局限性:需要用戶存在學(xué)術(shù)社交媒體使用記錄,無(wú)法對(duì)一個(gè)新用戶進(jìn)行社交網(wǎng)絡(luò)關(guān)系定位,也增加了冷啟動(dòng)問(wèn)題的負(fù)擔(dān);從用戶關(guān)系角度出發(fā),缺乏語(yǔ)義理解等。因此,本文考慮從新的視角出發(fā),試圖挖掘用戶個(gè)體本身的屬性,而不單單考慮與學(xué)術(shù)活動(dòng)相關(guān)的信息標(biāo)簽,進(jìn)一步拓寬學(xué)術(shù)用戶畫像維度,將所有標(biāo)簽重新組合,賦予合適的語(yǔ)義信息,從而增強(qiáng)學(xué)術(shù)資源推薦服務(wù)的客觀性。

2 多維度學(xué)術(shù)用戶畫像模型

建立多維度的學(xué)術(shù)用戶畫像模型,可以全方位、多層次地獲取用戶屬性,更精準(zhǔn)地反映用戶特征,滿足用戶多樣化的閱讀需求。多維度的學(xué)術(shù)用戶畫像主要由維度分析和模型構(gòu)建兩部分組成。

2.1 維度分析

確立用戶畫像維度是建立用戶畫像模型的基礎(chǔ)。本文選取以下3 個(gè)維度:基本信息、行為特征和學(xué)術(shù)人格,如圖1 所示。

Fig.1 Structure of multi-dimensional user profile圖1 多維度用戶畫像結(jié)構(gòu)

2.1.1 基本信息

用戶基本信息,除用戶性別、年齡等基礎(chǔ)屬性外,更重要的是與學(xué)術(shù)相關(guān)的信息,如學(xué)歷、專業(yè)、身份以及研究方向。學(xué)歷的高低影響了學(xué)術(shù)用戶對(duì)學(xué)術(shù)資源的需求水平,而專業(yè)與研究領(lǐng)域能幫助推薦系統(tǒng)快速定位用戶所需的資源內(nèi)容。

2.1.2 行為特征

用戶學(xué)術(shù)行為是指用戶在獲取學(xué)術(shù)資源信息時(shí)的行為,包括在各類學(xué)術(shù)資源平臺(tái)(例如文獻(xiàn)數(shù)據(jù)庫(kù)、學(xué)術(shù)搜索引擎等)的查詢、選擇與利用行為。學(xué)術(shù)用戶的行為特征具體體現(xiàn)為對(duì)文獻(xiàn)的檢索、收藏、下載、引用等行為。這些行為的實(shí)質(zhì)是與學(xué)術(shù)資源平臺(tái)交互的過(guò)程,通過(guò)分析用戶與平臺(tái)交互的頻率、時(shí)間、內(nèi)容等,便可從中獲取該用戶學(xué)術(shù)行為規(guī)律,為向其推薦學(xué)術(shù)資源提供指導(dǎo)。

2.1.3 學(xué)術(shù)人格

學(xué)術(shù)用戶在搜尋學(xué)術(shù)信息過(guò)程中會(huì)受到很多因素影響,具有不同于普通用戶搜尋信息的復(fù)雜性和層次性[11]。除基本信息和行為特征外,還存在一些難以直觀描述、與用戶所處科研情境相關(guān)的特征,對(duì)于學(xué)術(shù)資源獲取造成一定影響。這些特征反映了學(xué)術(shù)用戶在科研活動(dòng)中影響其學(xué)術(shù)行為的一系列因素,即學(xué)術(shù)用戶的“學(xué)術(shù)人格”屬性,可劃分為3 個(gè)子維度:學(xué)術(shù)動(dòng)機(jī)、認(rèn)知風(fēng)格及領(lǐng)域知識(shí)。

(1)學(xué)術(shù)動(dòng)機(jī)。學(xué)術(shù)動(dòng)機(jī)是指獲取學(xué)術(shù)資源時(shí)的動(dòng)機(jī)傾向。從學(xué)術(shù)用戶完整的科研過(guò)程來(lái)看,一般分為科研籌備、科研進(jìn)行、科研產(chǎn)出3 個(gè)主要階段。在不同階段,學(xué)術(shù)用戶對(duì)學(xué)術(shù)資源的獲取目的也有一定區(qū)別,表1 描述了3個(gè)階段的不同特征。

Table 1 Characteristics of research stage表1 科研階段特征

為了更簡(jiǎn)潔地描述不同科研階段的特征,本文將學(xué)術(shù)動(dòng)機(jī)提煉為模糊型和明確型兩類。在已知學(xué)術(shù)用戶的不同學(xué)術(shù)動(dòng)機(jī)之后,學(xué)術(shù)資源推薦服務(wù)便可在策略上作出相應(yīng)調(diào)整,即面對(duì)具有模糊型學(xué)術(shù)動(dòng)機(jī)的用戶,傾向于推薦范圍更廣、內(nèi)容更多的學(xué)術(shù)資源;面對(duì)具有明確型學(xué)術(shù)動(dòng)機(jī)的用戶,則以文獻(xiàn)的高相關(guān)性、高凝練度作為推薦的優(yōu)先指標(biāo)。

(2)認(rèn)知風(fēng)格。人們采集并處理信息時(shí),會(huì)表現(xiàn)出個(gè)體差異,這種差異性體現(xiàn)在感知、記憶和思維過(guò)程上[12],由此形成不同的“認(rèn)知風(fēng)格”。學(xué)術(shù)用戶在獲取學(xué)術(shù)資源時(shí)也會(huì)受到認(rèn)知風(fēng)格的影響。目前分類方式之一是分析用戶處理信息時(shí)采取的不同策略傾向,根據(jù)其對(duì)信息的感知是否受到環(huán)境影響分為場(chǎng)獨(dú)立型和場(chǎng)依存型。①場(chǎng)獨(dú)立型用戶不易受外界環(huán)境影響,而是更多地從自身經(jīng)驗(yàn)出發(fā)去吸收信息,較少受到干預(yù)和暗示,這類用戶在學(xué)術(shù)資源獲取上呈現(xiàn)出一種“專一性”,他們可能不會(huì)關(guān)注自身學(xué)科或研究領(lǐng)域以外的學(xué)術(shù)信息,因此在為其提供推薦服務(wù)時(shí)可剔除與用戶學(xué)科相關(guān)性低的文獻(xiàn),保留用戶學(xué)科領(lǐng)域內(nèi)的相關(guān)資源;②場(chǎng)依存型用戶會(huì)參照外部信息進(jìn)行判斷,容易受到外界的影響和驅(qū)動(dòng),此類用戶在學(xué)術(shù)領(lǐng)域表現(xiàn)為對(duì)學(xué)科融合、學(xué)科交叉內(nèi)容的較高包容性,其在瀏覽學(xué)術(shù)文獻(xiàn)時(shí),可能不僅對(duì)自身學(xué)科范圍內(nèi)的資源感興趣,對(duì)于其它學(xué)科中的類似問(wèn)題或關(guān)聯(lián)學(xué)術(shù)信息也會(huì)表現(xiàn)出一定關(guān)注度,因此在為其進(jìn)行推薦服務(wù)時(shí),也可以適當(dāng)?shù)靥岣呓徊鎸W(xué)科內(nèi)容的權(quán)值,以“投其所好”,同時(shí)也有利于啟發(fā)出新的學(xué)術(shù)研究方向。

(3)領(lǐng)域知識(shí)。領(lǐng)域知識(shí)代表學(xué)術(shù)用戶在獲取學(xué)術(shù)資源過(guò)程中因知識(shí)儲(chǔ)備不同而產(chǎn)生的經(jīng)驗(yàn)差異。簡(jiǎn)單來(lái)說(shuō),作為剛接觸科研活動(dòng)的初級(jí)用戶,使用學(xué)術(shù)資源平臺(tái)的時(shí)間較短,閱讀科研類文獻(xiàn)的能力也偏低,缺乏領(lǐng)域知識(shí)的群體在瀏覽信息時(shí)會(huì)自然地采用“簡(jiǎn)單優(yōu)先”的模式,容易陷入無(wú)特定“方向感”的迷失狀態(tài)[10]。具備領(lǐng)域知識(shí)的用戶因其專業(yè)知識(shí)及學(xué)術(shù)資源平臺(tái)使用經(jīng)驗(yàn)較為豐富,善于利用高級(jí)檢索、重組關(guān)鍵詞等平臺(tái)功能,并以更專業(yè)的角度閱讀文獻(xiàn)內(nèi)容。因此,不同領(lǐng)域知識(shí)的學(xué)術(shù)用戶也需要不同的推薦服務(wù)。

2.2 模型構(gòu)建

2.2.1 數(shù)據(jù)采集

為了獲取學(xué)術(shù)用戶畫像建模過(guò)程中所需的真實(shí)數(shù)據(jù),本文設(shè)計(jì)一套調(diào)查問(wèn)卷進(jìn)行數(shù)據(jù)收集。針對(duì)基本信息和學(xué)術(shù)人格兩個(gè)維度,調(diào)查問(wèn)卷分為兩部分:第一部分多采用選擇題形式,包括年齡、性別、學(xué)歷、專業(yè)、身份、從事科研工作時(shí)間、研究方向等問(wèn)題,用于收集基本信息;第二部分對(duì)用戶科研進(jìn)展情況和使用學(xué)術(shù)資源平臺(tái)的熟練度作進(jìn)一步調(diào)查,并結(jié)合第一部分獲取的身份、職稱及從業(yè)時(shí)間等信息,可得到用戶學(xué)術(shù)動(dòng)機(jī)和領(lǐng)域知識(shí)情況。對(duì)于認(rèn)知風(fēng)格的調(diào)查,采用心理學(xué)領(lǐng)域常用的量表測(cè)驗(yàn),設(shè)立8種情景并讓用戶選擇與自身相符的情況。為了補(bǔ)充驗(yàn)證量表結(jié)果的真實(shí)性,問(wèn)卷還設(shè)置了一個(gè)鑲嵌圖形實(shí)驗(yàn),要求用戶在一幅復(fù)雜圖形中找到指定的簡(jiǎn)單圖形,認(rèn)知風(fēng)格更偏向于場(chǎng)獨(dú)立型的用戶能夠更快地在復(fù)雜圖形中尋找出簡(jiǎn)單圖形。這些問(wèn)題的結(jié)果能最終反饋被調(diào)查用戶的“學(xué)術(shù)人格”。

針對(duì)行為特征維度,則通過(guò)查看學(xué)術(shù)用戶在學(xué)術(shù)資源平臺(tái)的行為日志進(jìn)行獲取。本文根據(jù)收集的數(shù)據(jù)構(gòu)建出多維度學(xué)術(shù)用戶畫像模型。

2.2.2 基本信息模型

本文將基本信息模型分為年齡、性別、學(xué)歷、專業(yè)、身份和研究方向6 個(gè)子維度。為了簡(jiǎn)化信息,年齡維度采用年齡段的形式,研究方向由調(diào)查問(wèn)卷中用戶自行填寫的信息進(jìn)行描述?;拘畔⒛P腿绫? 所示。

Table 2 Model of basic information表2 基本信息模型

2.2.3 行為特征模型

行為特征由用戶的檢索、收藏、下載、引用4 個(gè)維度組成。各維度取值如下:①檢索維度:用戶的檢索詞K、訪問(wèn)頁(yè)面的時(shí)間T(單位:min)、檢索頁(yè)的文獻(xiàn)名P;②收藏維度:用戶的收藏頁(yè)文獻(xiàn)名C;③下載頁(yè)面:用戶的下載頁(yè)文獻(xiàn)名D;④引用維度:用戶的引用文獻(xiàn)名R。

Table 3 Model of behavior characteristic表3 行為特征模型

2.2.4 學(xué)術(shù)人格模型

學(xué)術(shù)人格模型包含的學(xué)術(shù)動(dòng)機(jī)、認(rèn)知風(fēng)格和領(lǐng)域知識(shí)3 個(gè)子維度均由調(diào)查問(wèn)卷獲取的數(shù)據(jù)進(jìn)行描述,其中學(xué)術(shù)動(dòng)機(jī)和領(lǐng)域知識(shí)可由用戶勾選的結(jié)果直接獲得。學(xué)術(shù)人格模型如表4 所示。

Table 4 Model of academic personality表4 學(xué)術(shù)人格模型

為了準(zhǔn)確判斷學(xué)術(shù)用戶的認(rèn)知風(fēng)格,本文將問(wèn)卷中的部分文字性結(jié)果進(jìn)行量化,定義3 個(gè)變量:量表值N、速度值V 和認(rèn)知風(fēng)格指數(shù)S。N 值代表用戶在量表測(cè)驗(yàn)題目的得分情況,每道題分值越高,即越符合所描述的情景,該用戶在此題的情境下更偏向于場(chǎng)獨(dú)立型認(rèn)知風(fēng)格;V 值代表用戶在鑲嵌圖形實(shí)驗(yàn)中的作答情況,用戶完成鑲嵌圖形實(shí)驗(yàn)的速度越快,越能反映該用戶的場(chǎng)獨(dú)立型認(rèn)知趨勢(shì);S 值反映了用戶認(rèn)知風(fēng)格的最終情況,用戶的S 值越高,說(shuō)明該用戶越偏向于場(chǎng)獨(dú)立型認(rèn)知風(fēng)格,S 值越低,則代表該用戶偏向于場(chǎng)依存型認(rèn)知風(fēng)格。S 值與N 值、V 值呈正相關(guān)關(guān)系,S 值計(jì)算公式為:

3 調(diào)查問(wèn)卷結(jié)果分析

3.1 數(shù)據(jù)處理

3.1.1 量表測(cè)驗(yàn)

量表共有8 道題,具體問(wèn)題及問(wèn)卷結(jié)果如表5 所示。

Table 5 Questionnaire results of user’s cognitive style trends表5 用戶認(rèn)知風(fēng)格趨勢(shì)量表結(jié)果

考慮到實(shí)際情境的復(fù)雜性,不能以單純的分值高低作為評(píng)判依據(jù)。N 值具體計(jì)算過(guò)程如下:量表題目Q1~Q8的平均分為,用戶第k 題勾選的分值為Mk,若Mk≥(1≤k≤8),則該題實(shí)際得分nk=1,反之nk=0。計(jì)算公式為:

3.1.2 鑲嵌圖形實(shí)驗(yàn)

安排鑲嵌圖形實(shí)驗(yàn)的目的是通過(guò)考察用戶能否在排除背景干擾的情況下快速察覺(jué)到指定的簡(jiǎn)單圖形位置。在鑲嵌圖形實(shí)驗(yàn)中,被調(diào)查用戶在復(fù)雜圖形中找到指定簡(jiǎn)單圖形的情況如圖2 所示。

Fig.2 Results of embedded figure test圖2 鑲嵌圖形實(shí)驗(yàn)結(jié)果

文字選項(xiàng)和速度值V 的關(guān)系如表6 所示,平均值V 為2.76。

Table 6 Relationships between text options and speed value表6 文字選項(xiàng)與速度值關(guān)系

3.2 結(jié)果分析

從收集到的問(wèn)卷情況來(lái)看,接受調(diào)查的人群中男女比例為55.17%∶44.83%,約接近1∶1;用戶專業(yè)以工學(xué)為主,兼具哲學(xué)、法學(xué)、教育學(xué)、理學(xué)、醫(yī)學(xué)和管理學(xué)專業(yè)的用戶;在學(xué)歷方面,碩士占比89.66%,本科生占比10.34%,用戶群體均為學(xué)生。下面主要針對(duì)本文提出的用戶畫像中第三維度“學(xué)術(shù)人格”的調(diào)查結(jié)果進(jìn)行分析。

在本問(wèn)卷針對(duì)科研階段的調(diào)查結(jié)果中,有37.93% 的用戶選擇科研籌備階段,51.72% 的用戶選擇科研進(jìn)行階段,10.34% 的用戶選擇科研發(fā)表階段??梢钥闯?,學(xué)術(shù)用戶在科研工作道路上的確會(huì)經(jīng)歷不同的科研階段,在學(xué)術(shù)資源搜尋過(guò)程中也會(huì)有不同的學(xué)術(shù)動(dòng)機(jī)。

統(tǒng)計(jì)受調(diào)查用戶的認(rèn)知風(fēng)格指數(shù)S,計(jì)算得出基準(zhǔn)值S˙=11.316,結(jié)果顯示,參與調(diào)查的學(xué)術(shù)用戶中有55.17% 的人群具有場(chǎng)獨(dú)立型認(rèn)知風(fēng)格,44.82% 的用戶具有場(chǎng)依存型認(rèn)知風(fēng)格。

對(duì)于領(lǐng)域知識(shí)水平的統(tǒng)計(jì),信息來(lái)源包括用戶的年齡、學(xué)歷、職稱以及從事科研工作的時(shí)間、使用學(xué)術(shù)資源平臺(tái)的熟練度等。在此次問(wèn)卷調(diào)查中,本科學(xué)歷用戶毫無(wú)例外選擇了“直接使用一個(gè)或若干個(gè)關(guān)鍵詞進(jìn)行檢索,盡量擴(kuò)大搜索范圍”,而碩士學(xué)歷用戶中有近一半用戶選擇的常用檢索手段與本科學(xué)歷用戶相同,另有38.46% 的用戶選擇“使用關(guān)鍵詞的同時(shí)選擇一定限制條件(短語(yǔ)、標(biāo)簽等)”,還有11.54% 的用戶作出了“以作者或發(fā)表單位、所屬期刊為檢索標(biāo)簽,遍歷相關(guān)學(xué)術(shù)資源”的選擇。從中可以看出,學(xué)術(shù)用戶隨著科研經(jīng)驗(yàn)的逐漸累積,領(lǐng)域知識(shí)也不斷擴(kuò)充,初級(jí)用戶和經(jīng)驗(yàn)用戶對(duì)于學(xué)術(shù)資源的獲取也存在著一定差異。因此,將學(xué)術(shù)用戶的學(xué)術(shù)經(jīng)驗(yàn)水平融入用戶畫像中是必不可少的環(huán)節(jié)。

通過(guò)對(duì)問(wèn)卷結(jié)果的分析,學(xué)術(shù)用戶存在不同的學(xué)術(shù)人格,融入學(xué)術(shù)人格后的用戶畫像更加立體,能夠極大地改善學(xué)術(shù)資源推薦服務(wù)的個(gè)性化和準(zhǔn)確性。

4 學(xué)術(shù)資源推薦服務(wù)結(jié)果驗(yàn)證

為了驗(yàn)證本文設(shè)計(jì)的用戶畫像維度體系在學(xué)術(shù)資源推薦服務(wù)中的可信度,選取參與調(diào)查問(wèn)卷的3 位用戶。邀請(qǐng)3 位用戶使用CNKI 知網(wǎng)數(shù)據(jù)庫(kù)搜索所需的學(xué)術(shù)資源,再將基于多維度學(xué)術(shù)用戶畫像的推薦列表發(fā)送給用戶。最后,以滿意度評(píng)分的方式測(cè)驗(yàn)本文提出的用戶畫像對(duì)學(xué)術(shù)資源推薦服務(wù)是否具有優(yōu)化效果。

以邀請(qǐng)的測(cè)試用戶中序號(hào)為28 的人為例,分析調(diào)查問(wèn)卷結(jié)果并抓取該用戶調(diào)查當(dāng)日的CNKI 知網(wǎng)數(shù)據(jù)庫(kù)記錄,最終得出其多維度學(xué)術(shù)用戶畫像模型如圖3 所示。

Fig.3 User profile No.28圖3 序號(hào)為28 的用戶畫像

邀請(qǐng)測(cè)試的3 位用戶對(duì)知網(wǎng)檢索結(jié)果和本文優(yōu)化推薦結(jié)果的評(píng)分如表7 所示。

Table 7 Rating of the user under test(out of ten)表7 測(cè)試用戶評(píng)分(滿分:10 分)

考慮到每位用戶的個(gè)人評(píng)分標(biāo)準(zhǔn)不同,對(duì)測(cè)試結(jié)果采用min-max 標(biāo)準(zhǔn)化方法進(jìn)行歸一化處理,并將分?jǐn)?shù)范圍設(shè)置為0~1。具體評(píng)分如表8 所示。

以上結(jié)果說(shuō)明,基于用戶畫像體系的學(xué)術(shù)資源推薦服務(wù)對(duì)于傳統(tǒng)推薦服務(wù)可起到一定的優(yōu)化作用。

Table 8 Rating of the user under test(after normalization)表8 測(cè)試用戶評(píng)分(歸一化處理后)

5 結(jié)語(yǔ)

引入用戶畫像概念能夠幫助學(xué)術(shù)資源推薦系統(tǒng)往更加個(gè)性化、精確化的方向發(fā)展。本文在常規(guī)的用戶基本信息和行為特征基礎(chǔ)上,挖掘出與用戶本身相關(guān)的學(xué)術(shù)人格屬性,按照學(xué)術(shù)動(dòng)機(jī)、認(rèn)知風(fēng)格和領(lǐng)域知識(shí)3 方面進(jìn)行劃分,力求構(gòu)建一個(gè)更立體、豐富的學(xué)術(shù)用戶畫像。學(xué)術(shù)動(dòng)機(jī)決定了學(xué)術(shù)用戶使用學(xué)術(shù)資源系統(tǒng)的目的,認(rèn)知風(fēng)格反映了用戶在處理學(xué)術(shù)信息時(shí)的心理傾向,領(lǐng)域知識(shí)為學(xué)術(shù)資源篩選提供了依據(jù),從而促進(jìn)學(xué)術(shù)資源推薦服務(wù)的不斷優(yōu)化,為用戶畫像理論的發(fā)展提供新思路。

下一步本文將會(huì)拓寬調(diào)查問(wèn)卷范圍,彌補(bǔ)用戶群體較為單一,且數(shù)量不足的缺點(diǎn),統(tǒng)計(jì)與分析出“學(xué)術(shù)人格”這一概念更多相關(guān)信息,例如:不同專業(yè)領(lǐng)域和不同學(xué)歷水平下,場(chǎng)依存型與場(chǎng)獨(dú)立型用戶占比關(guān)系等。這些工作將會(huì)在接下來(lái)的研究中逐一實(shí)現(xiàn),真正將本文提出的學(xué)術(shù)用戶畫像應(yīng)用于資源推薦服務(wù)中。

猜你喜歡
畫像學(xué)術(shù)維度
威猛的畫像
“00后”畫像
畫像
如何理解“Curator”:一個(gè)由翻譯引發(fā)的學(xué)術(shù)思考
淺論詩(shī)中“史”識(shí)的四個(gè)維度
對(duì)學(xué)術(shù)造假重拳出擊
商周刊(2019年2期)2019-02-20 01:14:22
光的維度
燈與照明(2016年4期)2016-06-05 09:01:45
“五個(gè)維度”解有機(jī)化學(xué)推斷題
潛行與畫像
人生三維度
吐魯番(2014年2期)2014-02-28 16:54:43
陵川县| 梁山县| 蒙城县| 同德县| 神木县| 永胜县| 东源县| 宁安市| 平谷区| 凤庆县| 陈巴尔虎旗| 安远县| 桐柏县| 临泉县| 五寨县| 平果县| 上虞市| 叙永县| 武功县| 永嘉县| 铜鼓县| 凤阳县| 通辽市| 长春市| 威宁| 青田县| 平定县| 庆城县| 平舆县| 旌德县| 噶尔县| 长葛市| 贵溪市| 巴楚县| 荔浦县| 徐州市| 麟游县| 岱山县| 余干县| 安阳县| 新密市|