国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)下的圖書館個性化推薦研究

2017-07-13 12:14:16何波章宏遠(yuǎn)
新世紀(jì)圖書館 2017年6期
關(guān)鍵詞:個性化推薦數(shù)據(jù)挖掘大數(shù)據(jù)

何波?章宏遠(yuǎn)

摘 要 隨著大數(shù)據(jù)時代的來臨,針對所有的用戶都采用同一種方法的圖書館個性化推薦,已經(jīng)無法滿足圖書館用戶的需要。論文利用基于大數(shù)據(jù)的數(shù)據(jù)挖掘預(yù)處理技術(shù),將圖書館用戶細(xì)分為新用戶和一般用戶,然后利用數(shù)據(jù)挖掘與mapreduce技術(shù),提出大數(shù)據(jù)下的圖書館個性化推薦方法和策略。

關(guān)鍵詞 大數(shù)據(jù) 數(shù)據(jù)挖掘 個性化推薦

分類號 G250.7

DOI 10.16810/j.cnki.1672-514X.2017.06.015

Abstract The traditional recommendation strategy adopts the same recommendation method for all users. It is not able to satisfy the library users needs in the era of big data. This paper divides library users into new users and ordinary users by data mining preprocessing technology based on big data. Also, it proposes the library personalized recommendation strategy based on data mining and mapreduce.

Keywords Big data. Data mining. Personalized recommendation.

大數(shù)據(jù)時代,圖書館在個性化推薦服務(wù)中應(yīng)用數(shù)據(jù)挖掘[1]和Mapreduce[2]技術(shù),將圖書館的海量數(shù)據(jù)優(yōu)勢[3-4] 充分發(fā)揮出來,大幅提升圖書館的個性化推薦服務(wù)水平。國內(nèi)外研究人員和研究機(jī)構(gòu)對大數(shù)據(jù)下的圖書館個性化服務(wù)進(jìn)行了初步的研究和應(yīng)用。代表性的有楊亮的“大數(shù)據(jù)環(huán)境下圖書館個性化服務(wù)研究”[5]、陳臣的“基于大數(shù)據(jù)的圖書館個性化智慧服務(wù)體系構(gòu)建”[6]、Cassidy R. Sugimoto的“Library and information science in the big data era:funding, projects, and future”[7]等研究成果。但是這些研究成果對圖書館全體用戶采用同樣的推薦方法,沒有考慮圖書館新用戶和一般用戶的不同。與一般用戶相比,圖書館新用戶被收集的個人信息較少,需要使用有針對性的個性化推薦方法。因此,對于海量圖書館數(shù)據(jù),需要根據(jù)圖書館新用戶和一般用戶的不同特點(diǎn),提出有針對性的大數(shù)據(jù)下的圖書館個性化推薦方法和策略。

1 大數(shù)據(jù)下的圖書館個性化用戶模式

個性化用戶模式[8]是圖書館個性化推薦服務(wù)的基礎(chǔ)。利用大數(shù)據(jù)的數(shù)據(jù)挖掘預(yù)處理技術(shù),對圖書館訪問數(shù)據(jù)進(jìn)行預(yù)處理挖掘,形成大數(shù)據(jù)下的圖書館個性化用戶模式。圖書館個性化用戶模式定義為三元組,形式化的具體表示如下所示:

其中ipt為用戶IP地址,idt為用戶ID,URLt為訪問的圖書館網(wǎng)頁的URL,u為一條用戶訪問圖書館網(wǎng)頁的記錄,u.time為訪問圖書館網(wǎng)頁的時間戳,u.timelength為訪問圖書館網(wǎng)頁的時長。u.timelength=u.time- u.time,1 ≤ k ≤ m-1.

2 大數(shù)據(jù)下的圖書館用戶細(xì)分

圖書館新用戶被收集的個人信息較少,不適合和一般用戶采用同樣的推薦方法。大數(shù)據(jù)下圖書館用戶細(xì)分的目的是針對不同的用戶來提供不同的個性化推薦服務(wù)。

針對圖書館用戶的特點(diǎn),將其分為新用戶(newuser)和一般用戶(domesticuser)。新用戶和一般用戶的確定需要考慮多個因素,包括圖書館訪問時長(duration)、圖書館新鮮度(new)以及圖書館訪問頻率(Frequent)。

(1)圖書館訪問時長(duration)為用戶多次訪問圖書館的時長之和

其中count是用戶訪問圖書館的次數(shù),durationi是用戶第i次訪問圖書館所花費(fèi)的時間。

(2)圖書館新鮮度(new)表示用戶對圖書館的訪問時間的新鮮程度

其中userstart是用戶首次訪問圖書館的日期,usercurrency是現(xiàn)在的日期, userend是用戶最近一次訪問圖書館的結(jié)束日期。

(3)圖書館訪問頻率(Frequent)表示用戶訪問圖書館的頻率

其中count是用戶訪問圖書館的次數(shù)。

對于以上各個公式計算出來的值,利用模糊函數(shù)轉(zhuǎn)換到[0,1]范圍;Frequent的權(quán)重最大,設(shè)定為;duration的權(quán)重較大,都設(shè)為;new的權(quán)重最小,都設(shè)為;用戶閾值設(shè)定為。

if (*Frequent +*duration +*new>),表明該用戶為一般用戶(domesticuser); else 該用戶為新用戶(newuser);

3 大數(shù)據(jù)下的圖書館個性化推薦方法和策略

通過利用大數(shù)據(jù)的數(shù)據(jù)挖掘與mapreduce技術(shù),針對新用戶和一般用戶的不同,分別提出有針對性的圖書館個性化推薦方法。推薦策略描述如下。

針對圖書館個人信息較少的新用戶,提出基于用戶模式聚類與mapreduce的圖書館個性化推薦方法。該方法利用大數(shù)據(jù)的mapreduce技術(shù),首先采用map分解任務(wù),對相似的圖書館個性化用戶模式聚類;然后匹配圖書館個性化用戶聚類模式與圖書館用戶當(dāng)前訪問路徑;最后采用reduce進(jìn)行歸并,將匹配度高的推薦集推薦給用戶。該方法對相似的圖書館個性化用戶模式聚類,利用興趣相似的圖書館個性化用戶聚類模式獲得推薦集,擴(kuò)大了推薦范圍,非常適合圖書館新用戶。

一般用戶是圖書館的主要用戶。為了吸引并留住一般用戶,提出基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法。該方法利用大數(shù)據(jù)的mapreduce技術(shù),首先采用map分解任務(wù),從圖書館個性化用戶模式中挖掘出頻繁訪問路徑,然后從頻繁訪問路徑中挖掘與圖書館用戶當(dāng)前訪問路徑匹配的關(guān)聯(lián)規(guī)則;最后采用reduce進(jìn)行歸并,根據(jù)關(guān)聯(lián)規(guī)則和推薦度閾值將推薦集推薦給用戶。該方法推薦速度快,準(zhǔn)確度高,非常適合圖書館一般用戶。

4 個性化推薦方法相關(guān)實(shí)驗(yàn)

測試設(shè)備為Lenove服務(wù)器。實(shí)驗(yàn)數(shù)據(jù)來自重慶理工大學(xué)校圖書館一個月的訪問記錄。選擇100位新用戶和100位一般用戶,第1次實(shí)驗(yàn)采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法進(jìn)行推薦準(zhǔn)確度測試,第2次實(shí)驗(yàn)采用基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法進(jìn)行推薦準(zhǔn)確度測試。圖書館用戶推薦準(zhǔn)確度如圖1所示。

第1次實(shí)驗(yàn)采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法,實(shí)驗(yàn)結(jié)果是圖書館新用戶的推薦平均準(zhǔn)確度為83%,圖書館一般用戶的推薦平均準(zhǔn)確度為72%。第2次實(shí)驗(yàn)采用基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法,實(shí)驗(yàn)結(jié)果是圖書館新用戶的推薦平均準(zhǔn)確度為68%,圖書館一般用戶的推薦平均準(zhǔn)確度為92%。從實(shí)驗(yàn)結(jié)果可以看出,第1次實(shí)驗(yàn)采用的方法適合圖書館新用戶,第2次實(shí)驗(yàn)采用的方法非常適合一般用戶。

將提出的基于用戶模式聚類與mapreduce的圖書館個性化推薦方法、基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法應(yīng)用到學(xué)校圖書館。對200位新用戶采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法進(jìn)行推薦,對200位一般用戶采用基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法進(jìn)行推薦。讓用戶30天后進(jìn)行推薦滿意度調(diào)查。圖書館用戶推薦滿意度如圖2所示。

圖書館用戶推薦滿意度調(diào)查結(jié)果是:200位新用戶對基于用戶模式聚類與mapreduce的圖書館個性化推薦方法的推薦滿意度為88%,200位一般用戶對基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法的推薦滿意度為94%。從實(shí)驗(yàn)結(jié)果可以看出,有針對性的、準(zhǔn)確的圖書館個性化推薦能夠滿足不同用戶的推薦需求,吸引并留住圖書館用戶。

5 結(jié)語

圖書館新用戶被收集的個人信息較少,不適合采用和一般用戶同樣的推薦方法。圖書館應(yīng)積極利用大數(shù)據(jù)的數(shù)據(jù)挖掘預(yù)處理技術(shù),將圖書館用戶細(xì)分為新用戶和一般用戶,并通過數(shù)據(jù)挖掘與mapreduce技術(shù),形成大數(shù)據(jù)下的圖書館個性化推薦方法和策略。實(shí)驗(yàn)結(jié)果表明,這一大數(shù)據(jù)下的圖書館個性化推薦方法和策略是有效的。

參考文獻(xiàn):

[ 1 ] HAM J W, KAMBER M, PEI J. Data mining: concepts and techniques third edition[M].San Francisco: Morgan Kaufmann, 2011.

[ 2 ] 李建江,崔健,王聃,等. Mapreduce并行編程模型研究綜述[J].電子學(xué)報, 2011,39(11):2635-2642.

[ 3 ] Science. Special online collection: dealing with Data [EB/OL].[2015-12-20].http://www.sciencemag.org/site/special/data/,2011.

[ 4 ] 李國杰.大數(shù)據(jù)研究的科學(xué)價值[J].中國計算機(jī)學(xué)會通訊,2012,9(8):8-15.

[ 5 ] 楊亮.大數(shù)據(jù)環(huán)境下圖書館個性化服務(wù)研究[J]. 現(xiàn)代情報,2014,34(4):74-77.

[ 6 ] 陳臣.基于大數(shù)據(jù)的圖書館個性化智慧服務(wù)體系構(gòu)建[J].情報資料工作, 2013,34(6):75-79.

[ 7 ] CASSIDY R. SUGIMOTO, YING DING, THELWALL M. Library and information science in the big data era: funding, projects, and future[J].Proceedings of the American Society for Information Science and Technology, 2012,49(1):1-3.

[ 8 ] 張潼.互聯(lián)網(wǎng)大數(shù)據(jù)發(fā)展趨勢[J].重慶理工大學(xué)學(xué)報(自然科學(xué)). 2015(10):3-4.

猜你喜歡
個性化推薦數(shù)據(jù)挖掘大數(shù)據(jù)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實(shí)現(xiàn)
個性化推薦系統(tǒng)關(guān)鍵算法探討
基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
無線定位個性化導(dǎo)覽關(guān)鍵技術(shù)在博物館中的運(yùn)用
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
梅河口市| 台中县| 固安县| 张家界市| 千阳县| 津市市| 北流市| 齐齐哈尔市| 姜堰市| 延川县| 平潭县| 吐鲁番市| 许昌县| 米易县| 伊宁县| 绥棱县| 桃源县| 雅江县| 凤山市| 石景山区| 侯马市| 崇文区| 新闻| 泗洪县| 大庆市| 新竹市| 梧州市| 林州市| 抚松县| 汕头市| 舒城县| 新乐市| 桂林市| 乐亭县| 吉安市| 三都| 溧阳市| 大渡口区| 清苑县| 乌审旗| 屯留县|