国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對(duì)網(wǎng)絡(luò)視頻影評(píng)推薦方式的探討

2018-03-11 09:32焦沫青
科技資訊 2018年35期
關(guān)鍵詞:網(wǎng)絡(luò)視頻探討

焦沫青

摘 要:現(xiàn)如今,隨著網(wǎng)絡(luò)技術(shù)的高速發(fā)展和網(wǎng)絡(luò)技術(shù)的廣泛普及,互聯(lián)網(wǎng)已經(jīng)成為大眾生活中不可缺少的一部分。然而越來(lái)越多的網(wǎng)絡(luò)用戶正面臨著一個(gè)問(wèn)題,即當(dāng)使用網(wǎng)絡(luò)時(shí),大量的網(wǎng)絡(luò)信息同時(shí)展現(xiàn)在用戶面前,用戶無(wú)法第一時(shí)間找到需要的信息:淘寶網(wǎng)上有上千件同樣的商品,Netfix上有數(shù)萬(wàn)部影片,用戶何以快速得其所需?就此問(wèn)題本文展開探討。

關(guān)鍵詞:網(wǎng)絡(luò)視頻 影評(píng) 推薦方式 探討

中圖分類號(hào):J905 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2018)12(b)-000-02

1 諸論

1.1 研究背景

基于互聯(lián)網(wǎng)進(jìn)行的信息推薦技術(shù),正是解決以上這些難題的有效手段。它有利于用戶從因特網(wǎng)這個(gè)信息海洋中尋找所需的信息資源,并推薦其所需要的服務(wù),同時(shí)也能夠讓商家獲得用戶對(duì)其產(chǎn)品的反饋信息,比如阿里巴巴公司的淘寶網(wǎng)、國(guó)外購(gòu)物網(wǎng)站Amazon、視頻網(wǎng)站Youtube等。用戶將基于推薦系統(tǒng)接受這些建議并給予反饋,這些反饋可以存儲(chǔ)在推薦數(shù)據(jù)庫(kù)中,并在未來(lái)的交互中生成新的建議。

在電影網(wǎng)站中很多用戶在看完電影后都會(huì)發(fā)表相應(yīng)的評(píng)論和評(píng)分,在被應(yīng)用于推薦系統(tǒng)方面時(shí),用戶的電影評(píng)論非常有價(jià)值,這些評(píng)論信息直接反映了用戶對(duì)某個(gè)電影的喜好程度。當(dāng)用戶瀏覽網(wǎng)站尋找電影時(shí),網(wǎng)站可以利用這些信息推薦給目標(biāo)用戶可能感興趣的一些電影,提高了用戶體驗(yàn),幫助用戶在最短的時(shí)間內(nèi)找到自己喜歡的電影欣賞。

然而如今視頻網(wǎng)站中,大部分采用的仍是以標(biāo)簽為主的推薦系統(tǒng),僅有少數(shù)視頻網(wǎng)站嘗試過(guò)以用戶評(píng)論為基礎(chǔ)的推薦系統(tǒng),使用過(guò)此種推薦系統(tǒng)的網(wǎng)站收到了不錯(cuò)的用戶反饋,如國(guó)外知名的視頻網(wǎng)站Youtube與全球有名的在線影片租賃商N(yùn)etfli。在非視頻網(wǎng)站中,知名電商Amazon和國(guó)內(nèi)的每日頭條等使用評(píng)論推薦系統(tǒng)。目前在結(jié)合評(píng)論挖掘的推薦方面,Adomavicius等通過(guò)深入研究各種推薦算法,指出推薦系統(tǒng)在應(yīng)用評(píng)論挖掘的方面還有待發(fā)展。針對(duì)目前推薦系統(tǒng)中結(jié)合電影評(píng)論研究相對(duì)缺乏的情況,本文希望對(duì)如今互聯(lián)網(wǎng)環(huán)境下以用戶評(píng)論為基礎(chǔ)的推薦系統(tǒng)的使用現(xiàn)況,優(yōu)點(diǎn)和發(fā)展前景進(jìn)行調(diào)查研究。

1.2 本文主要目的

探究如今互聯(lián)網(wǎng)環(huán)境下基于用戶評(píng)論的推薦系統(tǒng)的應(yīng)用情況,調(diào)查此種推薦系統(tǒng)與其他推薦系統(tǒng)相比有何優(yōu)缺點(diǎn)之處,分析基于用戶評(píng)論的推薦系統(tǒng)未來(lái)發(fā)展前景。

1.3 本文結(jié)構(gòu)

本文的內(nèi)容安排如下。

第一章介紹了本文的研究和實(shí)踐背景,基本闡明了意見挖掘和推薦系統(tǒng)的結(jié)合在當(dāng)今互聯(lián)網(wǎng)時(shí)代下的意義以及本文對(duì)基于用戶評(píng)論的推薦系統(tǒng)進(jìn)行研究的原因。

第二章描述了對(duì)基于用戶評(píng)論的推薦系統(tǒng)在當(dāng)今時(shí)代下的使用現(xiàn)狀。

第三章利用評(píng)論推薦系統(tǒng)對(duì)隨機(jī)選定的影片進(jìn)行了過(guò)濾,并用影視網(wǎng)站原有的標(biāo)簽推薦系統(tǒng)進(jìn)行過(guò)濾,通過(guò)對(duì)兩種推薦系統(tǒng)過(guò)濾出的影片進(jìn)行閱覽,比較出評(píng)論推薦系統(tǒng)的優(yōu)缺點(diǎn)。

第四章綜合二、三章對(duì)用戶評(píng)論推薦系統(tǒng)進(jìn)行了綜合分析,分析了基于用戶評(píng)論的推薦系統(tǒng)的發(fā)展前景。

2 對(duì)基于用戶評(píng)論的推薦系統(tǒng)使用現(xiàn)狀的調(diào)查

本章的第一部分是對(duì)基于用戶評(píng)論的推薦系統(tǒng)(以下簡(jiǎn)稱“評(píng)論推薦系統(tǒng)”)使用現(xiàn)狀的調(diào)查。

2.1 使用評(píng)論推薦系統(tǒng)的視頻網(wǎng)站

目前全球主流視頻網(wǎng)站中,Youtube在其混合推薦系統(tǒng)中加入了評(píng)論推薦系統(tǒng)。Youtube巨大的用戶量所提供的用戶評(píng)論為評(píng)論推薦系統(tǒng)提供了可能。

2.2 非視頻網(wǎng)站上對(duì)于評(píng)論推薦系統(tǒng)的應(yīng)用

除視頻網(wǎng)站外,其他類型的大眾用戶型網(wǎng)站也對(duì)評(píng)論推薦系統(tǒng)有應(yīng)用,例如貓途鷹,其基于大量用戶評(píng)論的推薦系統(tǒng)已經(jīng)成為其網(wǎng)站招牌。

除以上網(wǎng)站外,還有其他使用評(píng)論推薦系統(tǒng)的網(wǎng)站,在此就不再一一論述。從以上的網(wǎng)站來(lái)看,評(píng)論推薦系統(tǒng)已經(jīng)被部分網(wǎng)站所使用,但在視頻網(wǎng)站上使用相對(duì)較少,而在非視頻網(wǎng)站的應(yīng)用則相對(duì)廣泛。

3 評(píng)論推薦系統(tǒng)的優(yōu)缺點(diǎn)調(diào)查

為了實(shí)際調(diào)查評(píng)論推薦系統(tǒng)的優(yōu)缺點(diǎn)及視頻網(wǎng)站用戶對(duì)評(píng)論推薦系統(tǒng)的滿意度,本章利用作者設(shè)計(jì)的評(píng)論推薦系統(tǒng)進(jìn)行調(diào)查。

3.1 數(shù)據(jù)準(zhǔn)備及預(yù)處理

本文的數(shù)據(jù)來(lái)自豆瓣電影網(wǎng)頁(yè)信息,對(duì)豆瓣電影網(wǎng)頁(yè)信息抓取的基本思路是:首先得到網(wǎng)頁(yè)中電影的基本信息,包括電影名、評(píng)分、導(dǎo)演、演員、類型;其次再抓取整個(gè)電影的所有用戶評(píng)論,將所有元素保存在一份文件中。

本文選擇了豆瓣電影網(wǎng)上對(duì)電影《大偵探福爾摩斯》的影評(píng),使用網(wǎng)絡(luò)信息搜集軟件八爪魚進(jìn)行用戶評(píng)論采集,并提取用戶評(píng)論中的關(guān)鍵詞進(jìn)行過(guò)濾,經(jīng)過(guò)分詞并將出現(xiàn)次數(shù)最多的關(guān)鍵詞與豆瓣網(wǎng)站其他電影評(píng)論進(jìn)行逆向比較,選擇出與《大偵探福爾摩斯》影評(píng)最相近的3部電影。

3.1.1 影評(píng)數(shù)據(jù)采集

選定隨機(jī)目標(biāo),本文此次選擇豆瓣網(wǎng)對(duì)電影《大偵探福爾摩斯》的影評(píng)進(jìn)行采集過(guò)濾。利用網(wǎng)絡(luò)信息采集軟件對(duì)影評(píng)進(jìn)行采集。本文此次選擇“八爪魚采集器”軟件。

3.1.2 影評(píng)元素預(yù)處理

將前面抓取到的所有電影的評(píng)論,進(jìn)行分詞,本文采用的是結(jié)巴分詞。分詞后詞表有很多無(wú)用詞,采用哈工大中文停用詞表,在此基礎(chǔ)上人工加入一些涉及到電影評(píng)論領(lǐng)域的停用詞,進(jìn)行了去除停用詞的處理。(1)排除停用詞來(lái)減小詞表文件的大小。觀察統(tǒng)計(jì)好的詞表發(fā)現(xiàn),里面有很多詞作為評(píng)價(jià)詞沒有價(jià)值,并且出現(xiàn)的次數(shù)很少,因此做了排除低頻詞的處理。(2)經(jīng)過(guò)這三步預(yù)處理工作,電影的全部信息預(yù)處理完畢。如此,提取出5個(gè)高頻詞。

提取的5個(gè)高頻詞為:福爾摩斯、偵探、英、美、基,計(jì)算出高頻詞在總評(píng)論有效詞語(yǔ)中出現(xiàn)的百分比并記錄。將提取出的關(guān)鍵詞與豆瓣其他電影的影評(píng)關(guān)鍵詞進(jìn)行對(duì)比,得出符合次數(shù)最多的兩部電影:《大偵探福爾摩斯2》《福爾摩斯歸來(lái)記》。同時(shí)記錄下上文5個(gè)關(guān)鍵詞在以上3部電影中有效詞語(yǔ)的百分比。

3.2 利用標(biāo)簽系統(tǒng)提取視頻

利用豆瓣電影網(wǎng)所使用的標(biāo)簽推薦系統(tǒng)進(jìn)行視頻篩選。

對(duì)于《大偵探福爾摩斯》,豆瓣標(biāo)簽為“動(dòng)作/懸疑/驚悚/犯罪/冒險(xiǎn)美國(guó)/德國(guó)”等。利用類型標(biāo)簽進(jìn)行篩選,運(yùn)用如上方法,隨機(jī)選測(cè)其他兩部電影《羅馬假日》《復(fù)仇者聯(lián)盟》。

3.3 評(píng)價(jià)指標(biāo)

本文選擇對(duì)關(guān)鍵詞所占所有詞語(yǔ)百分比高低作為評(píng)價(jià)指標(biāo),若關(guān)鍵詞百分比符合度相似則證明篩選準(zhǔn)確。

3.4 實(shí)驗(yàn)結(jié)果分析

總有效詞取2458個(gè),從百分比綜合可以看出,評(píng)論推薦結(jié)果百分比更高,更加精確。其余兩部電影均得出相似結(jié)論,如表1所示。

4 評(píng)論推薦系統(tǒng)的綜合分析以及前景預(yù)測(cè)

4.1 評(píng)論推薦系統(tǒng)的綜合分析

綜上所述,評(píng)論推薦系統(tǒng)相較于標(biāo)簽推薦系統(tǒng),因其直觀的反映出了用戶的感受,所以推薦更具準(zhǔn)確性。但正如第三章中所演示的操作一樣,評(píng)論推薦系統(tǒng)需要通過(guò)采集用戶評(píng)論—提取評(píng)論關(guān)鍵詞—視頻評(píng)論關(guān)鍵詞比對(duì)—篩選比對(duì)結(jié)果—反饋給用戶這樣一個(gè)相對(duì)漫長(zhǎng)且復(fù)雜的過(guò)程,而標(biāo)簽推薦系統(tǒng)僅需將標(biāo)簽相同的對(duì)象反饋給用戶即可,相對(duì)簡(jiǎn)略。因此在主旨為向用戶提供視頻,而僅僅將推薦系統(tǒng)作為一種附屬系統(tǒng)的視頻網(wǎng)站中,評(píng)論推薦系統(tǒng)并未像標(biāo)簽推薦系統(tǒng)一樣的到廣泛的應(yīng)用。相反,在以向用戶推薦為主的旅游網(wǎng)站中,準(zhǔn)確度高的評(píng)論推薦系統(tǒng)得到了廣泛運(yùn)用。

4.2 評(píng)論推薦系統(tǒng)的前景預(yù)測(cè)

由現(xiàn)在的網(wǎng)絡(luò)環(huán)境以及網(wǎng)絡(luò)技術(shù)來(lái)看,評(píng)論推薦系統(tǒng)未在視頻網(wǎng)站上的到廣泛運(yùn)用的原因是其復(fù)雜的操作程序,較大的操作量難以吸引視頻網(wǎng)站對(duì)這種推薦方式進(jìn)行開發(fā)研究,僅僅是具有代表性的Youtube對(duì)這種推薦方式進(jìn)行了開發(fā)。在未來(lái),隨著硬件技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,提取—過(guò)濾—反饋的過(guò)程會(huì)變得更加快捷簡(jiǎn)單,評(píng)論推薦系統(tǒng)也會(huì)逐漸被各大視頻網(wǎng)站所采用。而在以推薦為主的旅游等服務(wù)型網(wǎng)站上,高準(zhǔn)確性的評(píng)論推薦系統(tǒng)會(huì)繼續(xù)發(fā)展下去。

參考文獻(xiàn)

[1] 周良,王璇.視頻網(wǎng)站運(yùn)營(yíng)中用戶評(píng)論的作用及實(shí)證分析[J].中國(guó)流通經(jīng)濟(jì),2015,29(2):90-97.

[2] 李佳.基于意見挖掘與深度學(xué)習(xí)的推薦算法研究[D].吉林大學(xué),2018.

[3] 扈中凱,鄭小林,吳亞峰,等.基于用戶評(píng)論挖掘的產(chǎn)品推薦算法[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2013,47(8):1475-1485.

猜你喜歡
網(wǎng)絡(luò)視頻探討
愛奇藝競(jìng)爭(zhēng)戰(zhàn)略研究
網(wǎng)絡(luò)視頻節(jié)目的特點(diǎn)及優(yōu)勢(shì)簡(jiǎn)析
網(wǎng)絡(luò)視頻的著作權(quán)侵權(quán)分析
環(huán)境科學(xué)專業(yè)《環(huán)境生態(tài)學(xué)》課程教學(xué)改革探討
芻議小學(xué)足球教學(xué)的訓(xùn)練教學(xué)方法
體育旅游產(chǎn)業(yè)的特征及發(fā)展策略探討
稅收籌劃的效應(yīng)問(wèn)題
網(wǎng)紅形成與papi醬現(xiàn)象的社會(huì)成因
探析網(wǎng)絡(luò)視頻的產(chǎn)業(yè)化發(fā)展
網(wǎng)絡(luò)視頻行業(yè)的發(fā)展策略探析
仁布县| 永福县| 竹北市| 沧源| 宁波市| 从江县| 包头市| 浦北县| 清河县| 漯河市| 西吉县| 旅游| 介休市| 泊头市| 宁河县| 连云港市| 胶南市| 通山县| 建始县| 潢川县| 榆树市| 鄂温| 武鸣县| 望奎县| 定边县| 云浮市| 怀宁县| 和静县| 成武县| 观塘区| 宜阳县| 玛沁县| 含山县| 武宣县| 高碑店市| 永修县| 山阳县| 武威市| 凤冈县| 年辖:市辖区| 柏乡县|