国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字圖書(shū)館個(gè)性化搜索引擎的用戶建模

2016-07-09 15:39楊凱
現(xiàn)代電子技術(shù) 2016年7期
關(guān)鍵詞:數(shù)字圖書(shū)館

楊凱

摘 要: 網(wǎng)絡(luò)信息的高速增長(zhǎng)導(dǎo)致了信息定位與獲取的復(fù)雜化,通過(guò)分析目前網(wǎng)絡(luò)的信息超載問(wèn)題,對(duì)現(xiàn)有用戶模型的表示法和更新技術(shù)進(jìn)行比較,提出了一種以用戶行為和用戶操作的資料作為數(shù)據(jù)源,在用戶興趣漂移問(wèn)題上采用興趣衰減,即興趣學(xué)習(xí)與常用的滑動(dòng)窗口算法相結(jié)合的方法。最后以數(shù)字圖書(shū)館個(gè)性化搜索引擎中的用戶建模系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)為例,先后通過(guò)與普通向量空間表示模型的對(duì)比實(shí)驗(yàn)以及用戶興趣漂移時(shí)的跟蹤學(xué)習(xí),證明算法優(yōu)化有利于更好地表達(dá)用戶的興趣,對(duì)提高個(gè)性化信息服務(wù)的質(zhì)量有實(shí)用價(jià)值。

關(guān)鍵詞: 數(shù)字圖書(shū)館; 個(gè)性化搜索引擎; 用戶建模; 向量空間模型

中圖分類號(hào): TN911?34; TM417 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)07?0097?06

Abstract: The rapid increasing of network information leads to the complexity of information positioning and acquisition. The existing expression method of user model and updating technology are compared by the analysis of information overloading problem of the current networks. A method of using user behavior and use operation data as the data source is proposed. The interest declining method is adopted for the user interest drift, which is integrated with interest learning and commen used sliding window algorithm. The design and implementation of user modeling system in personalized search engine of digital library is taken an example. The contrast experiments of the proposed model and the model expressed by common vector space, and tracing learning while user interest drift verifies that the optimized algorithm can better express the user interest, and has practical value to improve the quality of high personalized information service.

Keywords: digital library; personalized search engine; user modeling; vector space model

0 引 言

以用戶為中心這一服務(wù)理念越來(lái)越深入圖書(shū)館行業(yè)的每個(gè)角落。早期的個(gè)性化信息服務(wù)主要集中在實(shí)現(xiàn)個(gè)性化服務(wù)的具體技術(shù)上,如推薦技術(shù),信息檢索技術(shù),用戶聚類技術(shù)。然而隨著個(gè)性化信息服務(wù)的深入研究,人們逐漸意識(shí)到個(gè)性化信息服務(wù)的質(zhì)量不僅取決于具體的推薦技術(shù)、檢索技術(shù)等,還取決于對(duì)用戶興趣特點(diǎn)的可計(jì)算描述,而且后者更為重要[1]。所以,對(duì)用戶建模技術(shù)的研究開(kāi)始獨(dú)立出來(lái)作為信息服務(wù)中的基礎(chǔ)技術(shù)。近年來(lái),國(guó)內(nèi)對(duì)個(gè)性化信息檢索用戶模型的研究主要集中在用戶模型的表示方法、用戶建模方法、用戶建模技術(shù)、用戶模型優(yōu)化等問(wèn)題上。例如,最常用的用戶個(gè)性化模型的表示方法有:向量表示法,概念層次表示法等[2]。

因特網(wǎng)為人們提供了日益豐富的資源,但如何從海量的信息資源中獲得所需的信息是一個(gè)亟待解決的問(wèn)題。用戶對(duì)搜索結(jié)果的滿意度是衡量搜索引擎服務(wù)質(zhì)量的關(guān)鍵之一。用戶希望在數(shù)字圖書(shū)館搜索和獲取信息的時(shí)候,能夠得到更智能的服務(wù)方式,而這個(gè)智能服務(wù)的一個(gè)關(guān)鍵因素就是基于個(gè)性化[3]。

通過(guò)用戶建模,得到用戶的搜索傾向,當(dāng)用戶進(jìn)行檢索時(shí),對(duì)搜索關(guān)鍵詞進(jìn)行分析、擴(kuò)展并對(duì)搜索結(jié)果進(jìn)行過(guò)濾,可以在一定程度上提高搜索引擎的搜索質(zhì)量。同時(shí),可以定時(shí)搜索網(wǎng)絡(luò)新增信息,主動(dòng)向用戶提供其感興趣的信息。而各種用戶模型之間可以通過(guò)交流變得更合理,更完善[4]。

個(gè)性化搜索引擎不僅可以提高搜索引擎的檢索效率,而且使檢索結(jié)果更加人性化。它通過(guò)建立用戶的興趣描述和對(duì)不同用戶提供不同的信息服務(wù),來(lái)滿足人們的需求。用戶模型作為個(gè)性化服務(wù)的基礎(chǔ)和核心,其質(zhì)量直接關(guān)系到個(gè)性化信息服務(wù)的質(zhì)量。在個(gè)性化搜索引擎中,首先挖掘用戶的興趣信息,建立合理的模型,然后管理用戶的興趣,通過(guò)不斷的更新與維護(hù)逐漸優(yōu)化模型,提高用戶興趣需求的表達(dá)準(zhǔn)確度,為后續(xù)的個(gè)性化搜索提供基礎(chǔ)。

1 用戶建模的理論與技術(shù)

目前提供個(gè)性化信息服務(wù)的系統(tǒng)有很多。一些常用的方式有:信息定制服務(wù)、最新信息推薦服務(wù)、專家咨詢服務(wù)、個(gè)人的知識(shí)管理服務(wù)、個(gè)性化信息檢索服務(wù)等。要實(shí)現(xiàn)個(gè)性化服務(wù),首先必須了解用戶的個(gè)性,對(duì)用戶興趣進(jìn)行挖掘是個(gè)性化主動(dòng)信息服務(wù)的基礎(chǔ)性前提。目前收集用戶信息,發(fā)現(xiàn)用戶興趣的方法主要有三類:顯示獲取方法、隱式獲取方法、評(píng)價(jià)反饋。在用戶信息獲取技術(shù)中,最常用的方法就是前兩種獲取方式的結(jié)合。本系統(tǒng)就是采用了這種方法,并以隱式的行為信息為主,較少需要用戶主動(dòng)參與。顯式信息主要包括用戶的基本信息和定制信息,隱式信息主要包括用戶的瀏覽行為信息,搜索行為信息。

正確的建模方法能夠?qū)τ脩魝€(gè)性和使用習(xí)慣進(jìn)行跟蹤,系統(tǒng)能夠不斷學(xué)習(xí),挖掘用戶潛在的興趣。系統(tǒng)采用了一種有針對(duì)性的機(jī)器學(xué)習(xí)方法建模。首先明確可以代表用戶興趣的行為有哪些,并確定這些行為所能表達(dá)的用戶興趣程度,然后對(duì)搜集到的用戶行為信息進(jìn)行數(shù)據(jù)挖掘、分析和抽取,計(jì)算出模型信息。有針對(duì)性的機(jī)器學(xué)習(xí)提高了學(xué)習(xí)的準(zhǔn)確度,通過(guò)調(diào)節(jié)興趣行為權(quán)重參數(shù)提高模型的表達(dá)能力。

針對(duì)用戶興趣漂移問(wèn)題,采用LRU算法和滑動(dòng)窗口算法結(jié)合的方案。若用戶主動(dòng)更新,如修改并提交定制信息,則以主動(dòng)行為為主,同時(shí)隨時(shí)間系統(tǒng)自動(dòng)更新,若用戶沒(méi)有主動(dòng)參與,則完全采用系統(tǒng)的自動(dòng)更新。這種方式既利用了用戶定制興趣的針對(duì)性,也取消了用戶參與的必要性,但保證了模型的準(zhǔn)確性。

2 用戶建模系統(tǒng)的分析與設(shè)計(jì)

2.1 向量空間模型的某些局限性

目前,基于向量空間方法用戶建模過(guò)程中的一些局限性。大部分用戶建模的信息源是基于用戶瀏覽的頁(yè)面和文本內(nèi)容,或基于用戶的查詢字段;向量空間表示法是常用的信息資源的表示方式,但是沒(méi)有考慮到特征項(xiàng)的領(lǐng)域含義和詞語(yǔ)表達(dá)本身固有的同義性;而單純的滑動(dòng)窗口方法,如文獻(xiàn)[5]所述,當(dāng)興趣量大于窗口大小[L]時(shí),按照到來(lái)的先后順序, 將最初到達(dá)的興趣移出,這種做法有可能將某些先到,但興趣度高的興趣描述移出。

系統(tǒng)將采用興趣衰減、興趣學(xué)習(xí)與滑動(dòng)窗口相結(jié)合的方式,提高興趣表達(dá)的準(zhǔn)確度。

2.2 信息資源模型

對(duì)于被用戶使用的對(duì)象需要提供基本的情況信息,至少包括代碼、名稱、類別、關(guān)鍵字/介紹。對(duì)象的特征由類別和關(guān)鍵字代表,即{類別,關(guān)鍵字列表},在這種表示法中,類別使用的數(shù)據(jù)結(jié)構(gòu)是樹(shù),如圖1所示。

2.3 用戶興趣模型

在個(gè)性化服務(wù)用戶建模中,最常用的方式是將顯式方式和隱式方式結(jié)合起來(lái),通過(guò)顯式方式來(lái)獲取靜態(tài)用戶信息,通過(guò)隱式方式來(lái)獲取動(dòng)態(tài)用戶信息[6]。建模的用戶信息源包括以下幾個(gè)方面:

(1) 用戶瀏覽的頁(yè)面;

(2) 用戶在頁(yè)面內(nèi)的行為,如添加網(wǎng)頁(yè)到書(shū)簽,打印頁(yè)面,頁(yè)面內(nèi)容復(fù)制,頁(yè)面保存等;

(3) 用戶的定制信息;

(4) 用戶搜索行為查詢的關(guān)鍵字,查詢次數(shù)及其最后查詢時(shí)間。

當(dāng)用戶使用某信息資源時(shí),例如瀏覽某些文獻(xiàn),將產(chǎn)生對(duì)該資源的興趣值,使用式(3)進(jìn)行計(jì)算。對(duì)于某用戶的瀏覽行為,假設(shè)如圖2所示。

圖2中系列1,系列2,系列3分別表示用戶瀏覽的三類圖書(shū)。用戶對(duì)系列1的興趣逐漸上升,對(duì)系列2的興趣先升后降,對(duì)系列3的興趣也逐漸上升但上升幅度較慢。對(duì)于用戶的此瀏覽行為,單純的滑動(dòng)窗口算法得到的用戶興趣序列如圖3所示。

由圖3可知,當(dāng)興趣穩(wěn)定時(shí),單純的滑動(dòng)窗口模型表達(dá)比較準(zhǔn)確,但是當(dāng)用戶的興趣發(fā)生變化,即由系列1和系列2的興趣變?yōu)橄盗?和系列3的興趣的過(guò)程中,興趣對(duì)象發(fā)生劇烈變化,穩(wěn)定性很差。若采用興趣衰減,興趣學(xué)習(xí)與滑動(dòng)窗口相結(jié)合的方法,得到的用戶興趣表達(dá)如圖4所示。

每天的興趣得分由前一天的興趣得分經(jīng)過(guò)一天時(shí)間的衰減加上本天的瀏覽得分,由此興趣得分圖可得到此模型的滑動(dòng)窗口中的興趣對(duì)象,如圖5所示,對(duì)于三方面結(jié)合的方法,由于考慮了用戶興趣權(quán)重的衰減,新的瀏覽行為的影響,當(dāng)用戶的興趣發(fā)生改變時(shí),雖然有所遲延,但可以迅速調(diào)節(jié)跟蹤興趣變化,表達(dá)能力比滑動(dòng)窗口方法要好,比較符合實(shí)際情況。

滑動(dòng)窗口的大小與用戶平均興趣量、對(duì)資源訪問(wèn)的頻度、資源量的大小相關(guān)。用戶的興趣量越大,資源量越大,所需的滑動(dòng)窗口的尺寸就越大。

2.4 系統(tǒng)功能設(shè)計(jì)

本文設(shè)計(jì)的系統(tǒng)功能模塊包括信息搜集模塊、用戶建模模塊和檢索模塊,信息搜集和檢索功能模塊通過(guò)與客戶端的交互得到所需資料,并提供服務(wù),用戶建模功能模塊是系統(tǒng)功能的核心。

搜集本系統(tǒng)所需的相關(guān)信息,包括用戶基本信息,用戶行為信息等,并把從客戶端得到的用戶信息經(jīng)檢驗(yàn)后整理到數(shù)據(jù)庫(kù)中,為其他模塊提供所需的信息,是系統(tǒng)建模的主要數(shù)據(jù)依據(jù)。

用戶建模代理是系統(tǒng)的核心部分。以用戶模型為中心,通過(guò)使用可設(shè)置的參數(shù),建立用戶模型,并提供模型更新方法。當(dāng)用戶使用某對(duì)象時(shí),顯然用戶對(duì)此對(duì)象是有一定興趣的。對(duì)于對(duì)象,可用相應(yīng)的類別代碼及對(duì)象的關(guān)鍵字或簡(jiǎn)述表示。然后根據(jù)參數(shù)權(quán)重計(jì)算用戶行為代表的對(duì)此類別的興趣度及對(duì)此類別下某些關(guān)鍵字的興趣度,并把此結(jié)果記錄到用戶模型中。

搜索代理是使用用戶模型提供服務(wù)的一個(gè)功能模塊,它通過(guò)對(duì)搜索結(jié)果的過(guò)濾及重置,向用戶提供優(yōu)化后的檢索記錄。由用戶模型可以得知用戶對(duì)哪些類別比較感興趣,因此不同類別的對(duì)象可以按用戶的興趣度排序。相同類別的對(duì)象可以按關(guān)鍵字列表得分排序,即對(duì)照用戶模型中此類別的關(guān)鍵字列表及分?jǐn)?shù),分別計(jì)算各對(duì)象的關(guān)鍵字得分,分值大的興趣度高。

2.5 總體設(shè)計(jì)方案

個(gè)性化信息檢索根據(jù)用戶的興趣和特點(diǎn)進(jìn)行檢索,返回與用戶需求相關(guān)的檢索結(jié)果。與傳統(tǒng)信息檢索系統(tǒng)相比,個(gè)性化信息檢索系統(tǒng)增加了信息處理,用戶建模,更新模型,優(yōu)化查詢等模塊。搜索引擎的個(gè)性化技術(shù)主要包含:建立能較好反映用戶興趣偏好的用戶模型,并且用戶模型能隨用戶新的行為做適應(yīng)性的改變,用戶的搜索結(jié)果可使用用戶模型進(jìn)行重排。在數(shù)字圖書(shū)館環(huán)境下,信息資源為文獻(xiàn)資源。個(gè)性化信息服務(wù)的總體設(shè)計(jì)如圖6所示,本文設(shè)計(jì)的系統(tǒng)主要是服務(wù)器端的功能。

相對(duì)于一般的基于向量空間的用戶模型系統(tǒng)和針對(duì)數(shù)字圖書(shū)館的文獻(xiàn)信息資源,本系統(tǒng)做了以下修改和改進(jìn):針對(duì)文獻(xiàn)資源,使用中圖分類樹(shù)及關(guān)鍵字列表表示信息的特征;使用雙重權(quán)重向量空間方法進(jìn)行用戶建模;考慮了時(shí)間的有效性。當(dāng)進(jìn)行用戶建模時(shí),若提供的行為信息超過(guò)了某時(shí)間段, 則視為無(wú)效;資源關(guān)聯(lián)性分析,讀者對(duì)不同類別資源的喜愛(ài)存在一定的關(guān)聯(lián);同時(shí)優(yōu)化興趣的衰減過(guò)程,使用可調(diào)節(jié)的權(quán)重參數(shù)。系統(tǒng)使用一些可調(diào)節(jié)的參數(shù)滿足不同應(yīng)用程序的需要,系統(tǒng)部分可調(diào)節(jié)參數(shù)及默認(rèn)值見(jiàn)表1。

3 系統(tǒng)實(shí)現(xiàn)

系統(tǒng)結(jié)構(gòu)采用三層架構(gòu)的模式。因?yàn)檫@種模型下,將復(fù)雜的業(yè)務(wù)邏輯從數(shù)據(jù)操作中分離,不必直接與數(shù)據(jù)庫(kù)交互,而是通過(guò)使用DAO層向外提供的接口,更加易于訪問(wèn),易于管理。

3.1 信息的表示與存放

對(duì)于用戶的瀏覽行為,通常包括把頁(yè)面加入書(shū)簽,復(fù)制頁(yè)面部分內(nèi)容,保存頁(yè)面到本地磁盤,打印此頁(yè)面等,這些代表用戶興趣的行為需要被記錄下來(lái),同時(shí)是哪個(gè)用戶在哪個(gè)頁(yè)面進(jìn)行操作也需要記錄,這是一種隱式的不需要用戶參與的數(shù)據(jù)。用戶定制自己感興趣的類別是一種顯示的直接得到用戶興趣的方式,需要有CustomInfo和CustomeTime信息,包括用戶ID、用戶定制信息、用戶定制日期。

當(dāng)用戶對(duì)某關(guān)鍵字搜索時(shí),系統(tǒng)將進(jìn)行記錄,很明顯用戶對(duì)此關(guān)鍵字有一定的興趣。用戶的搜索行為需要得到的信息有KeyWord,LastSearchTime,Times信息;同時(shí),系統(tǒng)需要了解用戶的基本情況,獲取用戶的基本信息,如Name,Sex,Major等。對(duì)于數(shù)字圖書(shū)館系統(tǒng),需要有文獻(xiàn)信息的支持,其中類別代碼和關(guān)鍵字列表為重點(diǎn),類別代碼使用此文獻(xiàn)的中圖分類碼。關(guān)鍵字列表使用文獻(xiàn)的關(guān)鍵字,表示為逗號(hào)隔開(kāi)的關(guān)鍵字,如數(shù)據(jù)挖掘,用戶模型,個(gè)性化,本體等。

3.2 用戶興趣模型的實(shí)現(xiàn)

通過(guò)對(duì)各種用戶基本信息及行為信息的分析,得到用戶模型,此模型是整個(gè)系統(tǒng)的核心,使用模型對(duì)用戶新的搜索行為進(jìn)行重排或提供信息推薦服務(wù)。用戶的興趣用興趣類別,興趣得分,興趣程度及類別中的關(guān)鍵字表示。分類碼BookCode的長(zhǎng)度是可重置的,BookCode的長(zhǎng)度是指類別樹(shù)的深度。一個(gè)用戶可有多條記錄,這些記錄共同表示該用戶的興趣。

3.3 用戶建模功能的實(shí)現(xiàn)

4 數(shù)據(jù)模擬與實(shí)驗(yàn)

4.1 文獻(xiàn)數(shù)據(jù)搜集

測(cè)試所需的對(duì)象數(shù)據(jù)關(guān)鍵在于標(biāo)題,類別代碼,作者,關(guān)鍵字列表,鑒于這些信息在一些文獻(xiàn)網(wǎng)如萬(wàn)方數(shù)據(jù)庫(kù),能獲得較全內(nèi)容,因此把文獻(xiàn)作為被使用的對(duì)象。共搜集圖書(shū)數(shù)據(jù)1 158條。同時(shí),提取全部關(guān)鍵字及對(duì)應(yīng)的分類號(hào),作為備選待用的搜索字存入表SearchWords中,共得到3 598條關(guān)鍵字。

4.2 與普通向量空間模型對(duì)比測(cè)試

在此采用雙重權(quán)重表示法,考慮了一定程度的資源關(guān)聯(lián)性及隨時(shí)間的興趣衰減模式等,與普通的用戶模型相比有一定的優(yōu)勢(shì)。

模擬設(shè)計(jì)10人參與,其ID分別為1~10,興趣點(diǎn)分別為:政治法律,經(jīng)濟(jì),文化,天文,生物,醫(yī)藥衛(wèi)生,農(nóng)業(yè)科學(xué),工業(yè)技術(shù),交通,環(huán)境科學(xué)。首先隨機(jī)選出100篇文章,每類別10篇,按照興趣點(diǎn)隨機(jī)產(chǎn)生10人的瀏覽行為數(shù)據(jù)。

系統(tǒng)隨機(jī)產(chǎn)生10用戶對(duì)相關(guān)類別的定制,每人定制約2類,并產(chǎn)生相關(guān)類別的一些關(guān)鍵字的搜索行為,每人搜索大約2個(gè)關(guān)鍵字,產(chǎn)生定制數(shù)據(jù)及搜索行為數(shù)據(jù),使用本系統(tǒng)所提供方法及默認(rèn)的建模參數(shù),建模結(jié)果如圖7所示。采用普通的用戶模型,建模結(jié)果如圖8所示。

建模之后,針對(duì)每個(gè)讀者對(duì)其余1 058本圖書(shū)重排序,假設(shè)此1 058本圖書(shū)是某次搜索產(chǎn)生的結(jié)果,位置前者為高興趣度的文獻(xiàn)。由于系統(tǒng)只是對(duì)假定的檢索結(jié)果重排,所以不宜對(duì)查全率檢測(cè),對(duì)于查準(zhǔn)率,取信息總量為100,因?yàn)槿抠Y源的數(shù)目有限,不相關(guān)文獻(xiàn)較多,對(duì)各種用戶模型都沒(méi)有明顯的區(qū)分效果,所以只查看前100條記錄的準(zhǔn)確率會(huì)更有利。查準(zhǔn)率與普通向量空間用戶模型的對(duì)比如圖9所示。圖中,采用雙重權(quán)重表示的用戶模型,結(jié)合用戶行為數(shù)據(jù)和改進(jìn)的滑動(dòng)窗口算法比普通的向量空間模型表示法更能準(zhǔn)確表達(dá)用戶的興趣趨勢(shì),滿足用戶的需求。

4.3 動(dòng)態(tài)學(xué)習(xí)效果測(cè)試

為了測(cè)試學(xué)習(xí)算法的動(dòng)態(tài)學(xué)習(xí)效果,首先用數(shù)理化類作為興趣樣本生成用戶瀏覽,定制,搜索數(shù)據(jù),然后從序列4開(kāi)始,逐漸改變興趣,追加學(xué)習(xí)工業(yè)技術(shù)類的文獻(xiàn),產(chǎn)生行為數(shù)據(jù)。每次興趣學(xué)習(xí)后,都對(duì)測(cè)試樣本文獻(xiàn)進(jìn)行重排,然后計(jì)算其查準(zhǔn)率,表2為用戶的學(xué)習(xí)過(guò)程。

用戶興趣中數(shù)理化領(lǐng)域所占比例及數(shù)理化的查準(zhǔn)率呈上升趨勢(shì),這表明用戶模型文件中該領(lǐng)域的興趣度在不斷上升,學(xué)習(xí)算法能動(dòng)態(tài)地捕捉到該過(guò)程,能隨著學(xué)習(xí)的進(jìn)行實(shí)時(shí)地更新用戶模型。之后,隨著數(shù)理化類文獻(xiàn)學(xué)習(xí)量的減少及工業(yè)技術(shù)類文獻(xiàn)的追加學(xué)習(xí),前者查準(zhǔn)率呈下降趨勢(shì),后者上升。這說(shuō)明,如果用戶的興趣發(fā)生了轉(zhuǎn)移,系統(tǒng)中體現(xiàn)在追加學(xué)習(xí)其他類別的文獻(xiàn)、原類別的文獻(xiàn)在結(jié)果中所占的比例會(huì)下降。這表明學(xué)習(xí)算法能夠隨著用戶興趣的轉(zhuǎn)移合理地“遺忘”掉用戶過(guò)去的愛(ài)好,而積累用戶的新近興趣。

5 結(jié) 論

本系統(tǒng)采用用戶的瀏覽、定制和搜索行為結(jié)合被操作的信息作為建模信息來(lái)源,使用一種改進(jìn)的基于向量空間模型的雙重向量表示法來(lái)表達(dá)用戶特征,并采用興趣衰減、興趣學(xué)習(xí)與滑動(dòng)窗口算法相結(jié)合的方式對(duì)用戶模型進(jìn)行更新。最后,在數(shù)字圖書(shū)館個(gè)性化搜索引擎系統(tǒng)中實(shí)現(xiàn),并通過(guò)兩組實(shí)驗(yàn),即與普通向量空間用戶模型的對(duì)比實(shí)驗(yàn)和用戶興趣漂移時(shí)的跟蹤學(xué)習(xí),實(shí)驗(yàn)證明該方法能夠比較準(zhǔn)確地描述讀者興趣,通過(guò)用戶模型優(yōu)化搜索結(jié)果,有一定的使用價(jià)值。

參考文獻(xiàn)

[1] KANG Haiyan, LI Chen. Research and design on personalized DL based on J2EE [C]// 2008 IEEE Pacific?Asia Workshop on Computational Intelligence and Industrial Application. Wuhan, China: IEEE, 2008: 527?531.

[2] ZHU Zhengyu, XU Jingqiu, REN Xiang, et al. Query expansion based on a personalized Web search model [C]// Procee?dings of 2007 3rd IEEE International Conference on Semantics, Knowledge and Grid. [S.l.]: IEEE, 2007: 128?133.

[3] 胡燕,吳虎子,鐘珞.中文文本分類中基于詞性的特征提取方法研究[J].武漢理工大學(xué)學(xué)報(bào),2007,29(4):132?135.

[4] 屈軍,林旭.文本分類中特征提取方法的比較與分析[J].現(xiàn)代計(jì)算機(jī),2007(4):10?13.

[5] 林霜梅,汪更生,陳弈秋.個(gè)性化推薦系統(tǒng)中的用戶建模及特征選擇[J].計(jì)算機(jī)工程,2007,33(17):196?199.

[6] 張莉.基于Web數(shù)據(jù)挖掘的個(gè)性化信息智能Agent挖掘系統(tǒng)模型[J].科技廣場(chǎng),2006(8):53?55.

猜你喜歡
數(shù)字圖書(shū)館
我國(guó)醫(yī)學(xué)數(shù)字圖書(shū)館研究的文獻(xiàn)計(jì)量分析
互聯(lián)網(wǎng)思維下數(shù)字圖書(shū)館個(gè)性化服務(wù)建設(shè)研究
談圖書(shū)館資源與小學(xué)數(shù)學(xué)教學(xué)有效整合
論新時(shí)代公共圖書(shū)館員的職業(yè)素養(yǎng)
充電者的知識(shí)殿堂——數(shù)字圖書(shū)館
高校圖書(shū)館的未來(lái)發(fā)展模式芻議
淺析“互聯(lián)網(wǎng)+”時(shí)代的圖書(shū)館管理
基于云計(jì)算的數(shù)字圖書(shū)館建設(shè)與服務(wù)模式研究
芻議數(shù)字圖書(shū)館計(jì)算機(jī)網(wǎng)絡(luò)的安全技術(shù)及其防護(hù)策略
额济纳旗| 沙洋县| 龙州县| 武威市| 翁牛特旗| 全椒县| 梅河口市| 唐山市| 宝鸡市| 龙游县| 高要市| 前郭尔| 永年县| 宁国市| 九寨沟县| 瑞安市| 含山县| 西乌珠穆沁旗| 易门县| 绥江县| 邵东县| 荔波县| 祥云县| 渝北区| 上蔡县| 泗阳县| 同心县| 社旗县| 滨海县| 清河县| 临高县| 达孜县| 阳谷县| 专栏| 双流县| 南投县| 广德县| 高淳县| 扎鲁特旗| 鹰潭市| 汝南县|