趙彥輝 劉樹(shù)春
[摘要]構(gòu)建基于分布式平臺(tái)及大量借閱數(shù)據(jù)的圖書推薦算法。是實(shí)現(xiàn)圖書館個(gè)性化信息推送服務(wù)的關(guān)鍵環(huán)節(jié)。本文從搭建Hadoup分布式平臺(tái)和運(yùn)用Mahout的MapReduce實(shí)現(xiàn)算法入手,針對(duì)讀者借閱記錄的分類號(hào)進(jìn)行頻數(shù)統(tǒng)計(jì)和借閱時(shí)間統(tǒng)計(jì),依據(jù)借閱次數(shù)和借閱時(shí)間獲得偏好值。并使用Mahout基于圖書的推薦器,測(cè)試偽分布式單節(jié)點(diǎn)模式和完全分布式MapReduce計(jì)算框架下的推薦效果。測(cè)試表明:在MapReauce運(yùn)算中增加DataNode的數(shù)量同時(shí)優(yōu)化BlockSize參數(shù)能顯著縮短運(yùn)算時(shí)間,是實(shí)現(xiàn)個(gè)性化薦書服務(wù)自動(dòng)推送的可行方法。endprint
[摘要]構(gòu)建基于分布式平臺(tái)及大量借閱數(shù)據(jù)的圖書推薦算法。是實(shí)現(xiàn)圖書館個(gè)性化信息推送服務(wù)的關(guān)鍵環(huán)節(jié)。本文從搭建Hadoup分布式平臺(tái)和運(yùn)用Mahout的MapReduce實(shí)現(xiàn)算法入手,針對(duì)讀者借閱記錄的分類號(hào)進(jìn)行頻數(shù)統(tǒng)計(jì)和借閱時(shí)間統(tǒng)計(jì),依據(jù)借閱次數(shù)和借閱時(shí)間獲得偏好值。并使用Mahout基于圖書的推薦器,測(cè)試偽分布式單節(jié)點(diǎn)模式和完全分布式MapReduce計(jì)算框架下的推薦效果。測(cè)試表明:在MapReauce運(yùn)算中增加DataNode的數(shù)量同時(shí)優(yōu)化BlockSize參數(shù)能顯著縮短運(yùn)算時(shí)間,是實(shí)現(xiàn)個(gè)性化薦書服務(wù)自動(dòng)推送的可行方法。endprint
[摘要]構(gòu)建基于分布式平臺(tái)及大量借閱數(shù)據(jù)的圖書推薦算法。是實(shí)現(xiàn)圖書館個(gè)性化信息推送服務(wù)的關(guān)鍵環(huán)節(jié)。本文從搭建Hadoup分布式平臺(tái)和運(yùn)用Mahout的MapReduce實(shí)現(xiàn)算法入手,針對(duì)讀者借閱記錄的分類號(hào)進(jìn)行頻數(shù)統(tǒng)計(jì)和借閱時(shí)間統(tǒng)計(jì),依據(jù)借閱次數(shù)和借閱時(shí)間獲得偏好值。并使用Mahout基于圖書的推薦器,測(cè)試偽分布式單節(jié)點(diǎn)模式和完全分布式MapReduce計(jì)算框架下的推薦效果。測(cè)試表明:在MapReauce運(yùn)算中增加DataNode的數(shù)量同時(shí)優(yōu)化BlockSize參數(shù)能顯著縮短運(yùn)算時(shí)間,是實(shí)現(xiàn)個(gè)性化薦書服務(wù)自動(dòng)推送的可行方法。endprint