国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于文本CNN的電影推薦系統(tǒng)的研究與實(shí)現(xiàn)

2019-10-08 09:01張嘉凱楊成劉里
軟件 2019年3期
關(guān)鍵詞:協(xié)同過濾

張嘉凱 楊成 劉里

摘? 要: 觀賞電影是一項(xiàng)普及的娛樂活動(dòng),很多人會(huì)選擇在電影世界中度過閑暇時(shí)光。但是,面對網(wǎng)絡(luò)上的海量電影資源,人們往往把預(yù)定觀看電影的時(shí)間浪費(fèi)在選擇電影上。如何在電影庫中快速、準(zhǔn)確地找到中意的電影成了一個(gè)急需解決的問題。我們需要一個(gè)智能系統(tǒng),能根據(jù)用戶的喜好推薦合適的電影,節(jié)省選擇電影的時(shí)間。本文研究電影推薦算法,嘗試將文本卷積神經(jīng)網(wǎng)絡(luò)技術(shù)融入到電影推薦系統(tǒng)中。實(shí)現(xiàn)推薦模型,包含對電影數(shù)據(jù)集的預(yù)處理、對用戶信息(包含用戶性別、年齡、職業(yè)等)以及對電影的預(yù)估評分。使用Movielens數(shù)據(jù)集進(jìn)行電影推薦訓(xùn)練與測試。實(shí)驗(yàn)結(jié)果表明,本文建立的電影推薦模型能夠取得令人滿意的效果。

關(guān)鍵詞: 電影推薦系統(tǒng);文本卷積神經(jīng)網(wǎng)絡(luò);電影評分;協(xié)同過濾

【Abstract】: Watching movies is popular, and many people like to spend their leisure time in the movie world. However, facing to the massive movie resources on the internet, people often waste time on choosing movies. It is an urgent problem how to find movie quickly and accurately in the movie library. We need an intelligent system that can recommend suitable movie according to users preferences, so that it can save our time in selecting movies. This paper researches the movie recommendation algorithm and tries to integrate the Text CNN technology into the movie recommendation system. We Implement a recommendation model, which includes the pre-proposing of the movie data set, the users information (the users gender, age, occupation, etc.) and the users estimated rating of the movie. We use Movielens data set for training and testing. Experimental results demonstrate that the recommendation model can achieve satisfactory results.

【Key words】: Movie recommendation system; Convolutional neural network for Text; Movie rating; Collaborative filtering

0? 引言

互聯(lián)網(wǎng)的迅速發(fā)展使信息量以指數(shù)級別迅速增長。如何幫助用戶在海量的信息數(shù)據(jù)中快速并且高效地找到對用戶有價(jià)值的內(nèi)容亟待解決。在電影領(lǐng)域,解決電影信息超載問題的一個(gè)有效的途徑就是電影推薦系統(tǒng)[1]。電影推薦系統(tǒng)能夠根據(jù)注冊用戶的個(gè)人信息、觀影信息、瀏覽信息以及評分歷史等信息給用戶推薦感興趣的電影,還能夠從用戶的注冊信息和觀影的行為出發(fā),找到用戶的隱性興趣愛好并將之推薦給用戶。相對于電影搜索引擎來說,電影推薦系統(tǒng)更智能化。一個(gè)優(yōu)秀的電影推薦系統(tǒng),不僅能為在線用戶提供更多的電影推薦服務(wù),還可以提高用戶對電影平臺(tái)的認(rèn)可度和使用體驗(yàn)。

1? 研究背景與意義

如今的推薦系統(tǒng)已經(jīng)在各個(gè)領(lǐng)域大放異彩,如電商領(lǐng)域[2]、社交網(wǎng)絡(luò)領(lǐng)域[3]、圖書推送領(lǐng)域[4]以及電影視頻推薦領(lǐng)域[5]等。最早的視頻推薦根據(jù)網(wǎng)站熱門視頻以及用戶的瀏覽數(shù)據(jù)排行給用戶提供推薦服務(wù),這樣的服務(wù)可以加深用戶對該平臺(tái)的粘度并且有利于提高網(wǎng)站流量[6]。對于在線電影供應(yīng)商,在線影片的推薦質(zhì)量會(huì)直接影響公司的經(jīng)濟(jì)效益,因此各大視頻電影網(wǎng)站都非常重視推薦算法的質(zhì)量及效率。在二十一世紀(jì)初,Netflix的視頻領(lǐng)域推薦大賽[7]為參賽者提供了豐富的獎(jiǎng)金,鼓勵(lì)參賽者能夠提高相關(guān)推薦算法的準(zhǔn)確度。這種比賽將關(guān)聯(lián)規(guī)則、奇異值分解(SVD)、協(xié)同過濾(Collaborative Filtering)[8]等眾多推薦方法應(yīng)用于電影推薦領(lǐng)域,并獲得了非常好的推薦效果。

在電影推薦系統(tǒng)中,推薦模型的好壞直接影響了推薦系統(tǒng)的質(zhì)量,所以現(xiàn)有的電影推薦系統(tǒng)仍避免不了一些問題,如數(shù)據(jù)稀疏[9]問題和推薦精確度問題。數(shù)據(jù)稀疏問題的表現(xiàn)之一就是冷啟動(dòng)問題,對于新上映的電影未得到用戶的任何評價(jià)或者評分,導(dǎo)致模型無法推薦和推薦精度過低的問題。因此,在保證推薦精確度的條件下降低數(shù)據(jù)稀疏所造成的影響成為目前主要的研究方向。

2? 相關(guān)概念及算法

本文使用TensorFlow作為深度學(xué)習(xí)工具來實(shí)現(xiàn)推薦算法。TensorFlow是谷歌于2015年開源的計(jì)算框架[10],該計(jì)算框架可以很好地支持深度學(xué)習(xí)的各種算法,相比于其他工具,TensorFlow實(shí)用性更強(qiáng),計(jì)算效率和系統(tǒng)穩(wěn)定性更高,支持的平臺(tái)更多,支持的深度學(xué)習(xí)算法更廣。

通過使用TensorFlow提供的封裝算法進(jìn)行開發(fā)、研究,文本卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network for Text,簡稱Text CNN)算法的實(shí)現(xiàn)將更簡單,即可專注于神經(jīng)網(wǎng)絡(luò)的搭建,在算法的代碼實(shí)現(xiàn)節(jié)省時(shí)間。以下為卷積神經(jīng)網(wǎng)絡(luò)中涉及到的一些基本概念:

猜你喜歡
協(xié)同過濾
改進(jìn)的協(xié)同過濾推薦算法
北安市| 谢通门县| 张家港市| 浦县| 东阳市| 长治市| 县级市| 无棣县| 八宿县| 台州市| 晋宁县| 临泉县| 高青县| 英山县| 泌阳县| 沾化县| 兖州市| 定陶县| 祁东县| 武定县| 武隆县| 那坡县| 江油市| 明溪县| 扬州市| 高尔夫| 出国| 宣威市| 云和县| 靖州| 渑池县| 杭锦后旗| 日土县| 邢台县| 兴山县| 察隅县| 昭苏县| 勃利县| 涿州市| 陵水| 攀枝花市|