国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于興趣預(yù)測(cè)和熱點(diǎn)分析的聯(lián)合推薦算法研究 

2016-11-07 17:50:19葉加加趙逢禹
軟件導(dǎo)刊 2016年9期
關(guān)鍵詞:貝葉斯網(wǎng)絡(luò)

葉加加++趙逢禹

摘要:興趣模型是一種根據(jù)用戶的行為和偏好建立起來的數(shù)學(xué)模型,它反映用戶在一段時(shí)期內(nèi)對(duì)信息需求的主要傾向。通常的興趣模型推薦主要基于用戶興趣,沒有考慮到熱點(diǎn)信息對(duì)用戶的影響以及存在冷啟動(dòng)的問題。提出一種基于興趣預(yù)測(cè)和熱點(diǎn)分析的聯(lián)合推薦算法,利用貝葉斯網(wǎng)絡(luò)對(duì)用戶興趣進(jìn)行預(yù)測(cè),并利用基于速度增長(zhǎng)的預(yù)測(cè)方法對(duì)當(dāng)前的熱點(diǎn)信息進(jìn)行預(yù)測(cè)。該方法綜合考慮了興趣預(yù)測(cè)與熱點(diǎn)預(yù)測(cè),能夠有效增強(qiáng)用戶興趣預(yù)測(cè)準(zhǔn)確度。實(shí)驗(yàn)證明,該方法(BPUR)比傳統(tǒng)的Bayesian方法準(zhǔn)確率更高,能夠有效避免新用戶的冷啟動(dòng)問題。

關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);興趣預(yù)測(cè);熱點(diǎn)信息;聯(lián)合推薦

DOIDOI:10.11907/rjdk.161375

中圖分類號(hào):TP312

文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào)文章編號(hào):16727800(2016)009002504

基金項(xiàng)目基金項(xiàng)目:國家質(zhì)檢公益性行業(yè)科研專項(xiàng)(201310032-3)

作者簡(jiǎn)介作者簡(jiǎn)介:葉加加(1991-),男,安徽合肥人,上海理工大學(xué)光電信息與計(jì)算機(jī)學(xué)院碩士研究生,研究方向?yàn)槿斯ぶ悄芡扑]系統(tǒng);趙逢禹(1963-),男,山東濟(jì)南人,博士,上海理工大學(xué)光電信息與計(jì)算機(jī)工程學(xué)院教授、碩士生導(dǎo)師,研究方向?yàn)橛?jì)算機(jī)軟件與軟件系統(tǒng)安全、軟件工程與軟件質(zhì)量控制、軟件可靠性。

0引言

網(wǎng)絡(luò)包含了海量信息,但缺乏高效的工具把有用的信息推送給用戶。搜索引擎技術(shù)的出現(xiàn),方便了人們對(duì)海量信息的篩選,但搜索引擎面向的是所有用戶,是將通用性的結(jié)果返回給用戶,難以滿足用戶的個(gè)性化需求。個(gè)性化推薦技術(shù)的出現(xiàn)在一定程度上解決了這些問題,它通過用戶行為數(shù)據(jù)分析,自動(dòng)生成用戶比較感興趣的內(nèi)容并直接向用戶推薦,為用戶提供個(gè)性化、有特色的信息服務(wù)。

Philip使用貝葉斯層次模型[1]將顯式與隱式反饋互相混合來創(chuàng)建用戶的興趣模型,通過向其他用戶借用類似興趣,向新用戶推薦合適的內(nèi)容,從而避免新用戶的冷啟動(dòng)問題。Mariam等[2]利用圖來表示用戶的搜索興趣模型,使用等級(jí)相關(guān)性度量方法來劃分用戶會(huì)話,將相關(guān)性較強(qiáng)、能夠以確定用戶興趣的搜索劃分到同一個(gè)會(huì)話中。Peilin[3]提出一種基于用戶對(duì)地點(diǎn)評(píng)價(jià)的方法建立用戶的興趣模型,以基于用戶所處地理位置對(duì)項(xiàng)目的評(píng)價(jià)來分析用戶的喜好,以達(dá)到更精確推薦的目的。

系統(tǒng)的推薦性能容易受到熱點(diǎn)信息的影響。Cataldi等[4] 針對(duì)熱點(diǎn)話題提出了時(shí)序與社會(huì)關(guān)系混合評(píng)價(jià)的方法。在一個(gè)時(shí)段內(nèi),某個(gè)話題被檢測(cè)多次,但在此之前很少被檢測(cè)到,則可認(rèn)為該話題有較大幾率成為熱點(diǎn)話題。Phuvipadawat等[5]提出了一種對(duì)Twitter中檢測(cè)具有爆炸性新聞的方法,利用采集、分類和排列等方法進(jìn)行檢測(cè)?;诳臻g向量模型,文獻(xiàn)[6]介紹了基于SP&HA算法的熱點(diǎn)話題檢測(cè)。文獻(xiàn)[7]中提出的熱點(diǎn)話題發(fā)現(xiàn)方法采用了垂直搜索引擎、文本分析法和挖掘技術(shù)。

可以看出,基于用戶行為的興趣模型研究與基于時(shí)序與空間向量的熱點(diǎn)話題發(fā)現(xiàn)在用戶個(gè)性化推薦上取得了一定的成果。但筆者認(rèn)為目前大部分推薦模型只是基于用戶本身的興趣進(jìn)行推薦。實(shí)際上,熱點(diǎn)信息對(duì)用戶興趣也會(huì)產(chǎn)生一定的影響。當(dāng)新用戶僅有少量文檔時(shí),興趣模型和熱點(diǎn)推薦存在盲區(qū),系統(tǒng)無法給出即時(shí)的信息推薦,存在冷啟動(dòng)問題。

針對(duì)以上問題,本文提出基于用戶興趣預(yù)測(cè)和熱點(diǎn)分析的聯(lián)合推薦算法,通過記錄用戶行為來構(gòu)造用戶的興趣模型,并使用貝葉斯網(wǎng)絡(luò)來預(yù)測(cè)用戶興趣,在此基礎(chǔ)上,利用基于速度增長(zhǎng)的熱點(diǎn)預(yù)測(cè)方法預(yù)測(cè)當(dāng)前信息的流行趨勢(shì),給用戶推薦近鄰熱點(diǎn)信息??紤]到新用戶創(chuàng)建時(shí)文檔較少,無法產(chǎn)生推薦信息,為避免冷啟動(dòng),本文引入近鄰熱點(diǎn)推薦算法。

1相關(guān)工作

對(duì)于個(gè)性化推薦系統(tǒng),用戶興趣模型作用非常重要。早期的個(gè)性化推薦系統(tǒng)中,研究者主要關(guān)注信息的篩選和過濾,用戶興趣以記錄文本信息的方式存在。后來,隨著研究的深入,有些學(xué)者將機(jī)器學(xué)習(xí)的相關(guān)技術(shù)運(yùn)用到個(gè)性化興趣建模中[8]。構(gòu)建興趣模型主要是從一系列紛亂繁雜的數(shù)據(jù)記錄中發(fā)現(xiàn)用戶偏好,而機(jī)器學(xué)習(xí)在處理這類問題上有著天然的優(yōu)勢(shì)。貝葉斯網(wǎng)絡(luò)是基于概率推理的圖形化概率網(wǎng)絡(luò),是不確定知識(shí)表達(dá)與推理領(lǐng)域最有效的理論模型之一,它將經(jīng)典的概率論與圖論結(jié)合起來,用于發(fā)現(xiàn)隨機(jī)變量之間的潛在關(guān)系,適用于表述和分析不確定的事件,可以從分散的、粗糙的信息中作出推理。

系統(tǒng)的推薦性能容易受到熱點(diǎn)話題影響。話題探測(cè)與追蹤技術(shù)為網(wǎng)絡(luò)熱點(diǎn)話題發(fā)現(xiàn)提供了技術(shù)支持。話題檢測(cè)與跟蹤是在沒有人工干涉的情況下研究如何自動(dòng)發(fā)現(xiàn)新聞信息中的話題[9]。如今話題探測(cè)與追蹤技術(shù)在網(wǎng)絡(luò)媒體上的應(yīng)用已層出不窮。

4結(jié)語

針對(duì)現(xiàn)有興趣模型中沒有考慮到新聞熱點(diǎn)對(duì)用戶

的影響以及存在冷啟動(dòng)的問題,本文提出一種基于興趣預(yù)測(cè)的聯(lián)合推薦算法。首先,基于用戶行為建立用戶興趣模型,采用基于平均閱讀時(shí)長(zhǎng)的方法估計(jì)用戶對(duì)目標(biāo)的興趣高低,從而產(chǎn)生隱性評(píng)分。在興趣預(yù)測(cè)階段,考慮用戶興趣的多樣性與非相關(guān)性,引入樸素貝葉斯方法預(yù)測(cè)用戶興趣集,并綜合一定時(shí)間內(nèi)的新聞熱點(diǎn),給用戶作出聯(lián)合推薦。實(shí)驗(yàn)結(jié)果證明,本文方法較傳統(tǒng)的基于貝葉斯預(yù)測(cè)的推薦方法有著更高的預(yù)測(cè)推薦精度。下一步研究工作將在用戶興趣模型建立階段引入更能表征用戶興趣變化的方法,以建立能更準(zhǔn)確地反映用戶興趣轉(zhuǎn)移和變化的模型,以提高預(yù)測(cè)推薦精確性。

參考文獻(xiàn):

[1]ZIGORIS P, ZHANG Y. Bayesian adaptive user profiling with explicit & implicit feedback[C].Proc of the 15th ACM International Conference on Information And Knowledge Management. ACM, 2006: 397404.

[2]DAOUD M, LECHANI L T, BOUGHANEM M. Towards a graphbased user profile modeling for a sessionbased personalized search[J]. Knowledge and Information Systems, 2009, 21(3): 365398.

[3]YANG PEILIN,F(xiàn)ANG HUI.Opinionbased user profile modeling for contextual suggestions[C].In:Proceedings of the 2013 Conference on the Theory of Information Retrieval,ACM,2013:18.

[4]CATALDI M, CARO L D, SCHIFANELLA C. Emerging topic detection on twitter based on temporal and social terms evaluation[C].Proceedings of the Tenth International Workshop on Multimedia Data Mining.ACM,2010:110.

[5]PHUVIPADAWAT S, MURATA T. Breaking news detection and tracking in twitter[C].Web Intelligence and Intelligent Agent Technology (WIIAT), 2010 IEEE/WIC/ACM International Conference on. IEEE, 2010:120123.

[6]孫勝平. 中文微博客熱點(diǎn)話題檢測(cè)與跟蹤技術(shù)研究[D]. 北京:北京交通大學(xué), 2011.

[7]張劭捷. 基于微博社交網(wǎng)絡(luò)的輿情分析模型及實(shí)現(xiàn)[D]. 廣州:華南理工大學(xué), 2011.

[8]胡昌平, 胡吉明. 個(gè)性化服務(wù)中基于支持向量機(jī)的用戶興趣挖掘分析[J]. 情報(bào)學(xué)報(bào), 2009, 28(4):543547.

[9]R NALLAPATI, A FENG, F C PENG, et al. Event threading within news topics[C]. Proceedings of the Thirteenth ACM Conference on Information and Knowledge Management, Washington DC, New York: Association for Computing Machinery, 2004: 446453.

[10]CLAYPOOL M, LE P, WASEDA M, et al. Implicit interest indicators[C].Proceeding of the ACM Intelligent User Interfaces Conference(IU).New York:ACM Press,2001:1417.

[11]薛素芝, 魯燃, 任圓圓. 基于速度增長(zhǎng)的微博熱點(diǎn)話題發(fā)現(xiàn)[J]. 計(jì)算機(jī)應(yīng)用研究, 2013, 30(9):25982601.

責(zé)任編輯(責(zé)任編輯:杜能鋼)

猜你喜歡
貝葉斯網(wǎng)絡(luò)
貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究
基于貝葉斯網(wǎng)絡(luò)的分類器研究
商情(2016年46期)2017-03-06 04:14:12
基于分布式貝葉斯網(wǎng)絡(luò)的多故障診斷方法研究
無人機(jī)數(shù)據(jù)鏈測(cè)試與評(píng)估研究
科技資訊(2016年25期)2016-12-27 16:22:32
基于貝葉斯網(wǎng)絡(luò)的流域內(nèi)水文事件豐枯遭遇研究
基于CHAID算法和貝葉斯網(wǎng)絡(luò)的基金風(fēng)險(xiǎn)預(yù)警研究
基于貝葉斯網(wǎng)絡(luò)的企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)研究
基于貝葉斯網(wǎng)絡(luò)的城市居民出行方式研究
基于故障樹貝葉斯網(wǎng)絡(luò)的數(shù)控刀架故障研究
科技資訊(2015年20期)2015-10-15 19:08:14
基于貝葉斯網(wǎng)絡(luò)的協(xié)同過濾推薦算法
蕲春县| 南陵县| 三原县| 龙胜| 庆阳市| 蓬安县| 繁昌县| 增城市| 正蓝旗| 南昌市| 保亭| 井冈山市| 久治县| 涞水县| 界首市| 张家界市| 弥勒县| 五指山市| 邻水| 龙山县| 金沙县| 阳山县| 忻城县| 镇平县| 寿阳县| 华宁县| 西峡县| 镇宁| 太康县| 景谷| 防城港市| 海安县| 赫章县| 任丘市| 莆田市| 临潭县| 宿松县| 永泰县| 万全县| 手机| 奎屯市|