国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據時代網絡視頻用戶推薦研究

2016-05-18 07:49:13賈金娜陳罡鄭艾明
河北傳媒研究 2016年3期
關鍵詞:海量個性化用戶

賈金娜陳罡鄭艾明

(河北傳媒學院,河北石家莊 050071)

大數(shù)據時代網絡視頻用戶推薦研究

賈金娜陳罡鄭艾明

(河北傳媒學院,河北石家莊 050071)

大數(shù)據時代,基于海量用戶信息挖掘用戶興趣進行精確推薦,是網絡視頻供應商亟須解決的核心問題。目前有非個性化推薦、個性化推薦、相關推薦、協(xié)同過濾推薦等不同推薦技術,這些技術及相關算法各有其適用之地和不足之處,應采用不同策略加以綜合應用。大數(shù)據時代網絡視頻推薦技術的發(fā)展,要強化海量信息存儲加工基礎條件,加強特征化信息提取技術研究,加快個性化產品推薦方法研究,廣泛開展視頻產品傳播反饋分析,以提升用戶推薦的精確化、精細化、精準化水平。

網絡影視;視頻推薦;大數(shù)據

近年來,我國個人互聯(lián)網應用發(fā)展迅速,網絡視頻、網絡應用、網絡購物等應用用戶規(guī)模均呈明顯上升趨勢。我國“十三五”規(guī)劃建議提出:“實施國家大數(shù)據戰(zhàn)略。把大數(shù)據作為基礎性戰(zhàn)略資源,全面實施促進大數(shù)據發(fā)展行動,加快推動數(shù)據資源共享開放和開發(fā)應用,助力產業(yè)轉型升級和社會治理創(chuàng)新”[1]。隨著我國信息化建設的深入推進,海量用戶在各類應用中不斷生產海量數(shù)據。正如中國工程院院士高文所說:“不管你是否認同,大數(shù)據時代已經來臨,并將深刻地改變著我們的工作和生活?!盵2]在這個信息數(shù)量飛速增長的時代,我國傳統(tǒng)的網絡視頻行業(yè)依舊未能擺脫對資本和流量的訴求,馬太效應愈發(fā)凸顯,我國網絡視頻網站呈現(xiàn)愛奇藝、優(yōu)酷土豆、騰訊視頻三足鼎立局面,其他視頻網站與其差距越來越大。在確保內容優(yōu)質和版權合法的前提下,網絡視頻應加強技術創(chuàng)新,做到在基于大眾熱點強力推薦和基于用戶興趣精準推薦等不同策略之間的平衡,使得相關各類面向行業(yè)、面向領域和面向用戶的推薦能夠更加準確、科學、有效,從而不斷提升自身核心競爭力。

一、大數(shù)據時代的網絡視頻發(fā)展分析

2016年1月22日,中國互聯(lián)網絡信息中心(CNNIC)發(fā)布第37次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》。該報告顯示,截至2015年12月,中國網民規(guī)模達6.88億,互聯(lián)網普及率達到50.3%,半數(shù)中國人已接入互聯(lián)網。其中,截至2015年12月,中國網絡視頻用戶規(guī)模達5.04億,較2014年底增加7093萬,網絡視頻用戶使用率為73.2%,較2014年底增加了6.5個百分點,網絡視頻應用緊隨即時通信、搜索引擎和網絡新聞,排在第4位,全年增長率為16.4%[3]。如表1所示。

當前網絡視頻節(jié)目,按照內容來源可分為如下幾類:(1)電視視頻信號轉播或電視節(jié)目剪輯、回放。網站將電視節(jié)目作為視頻輸入源,在網絡上提供電視節(jié)目服務,相當于電視信號的網絡擴展,例如中國網絡電視臺,以及各類視頻終端軟件的直播頻道。(2)電影、電視劇等影像制品在線觀看。網站通過購買在線播放版權,在網絡上向用戶提供有償或無償?shù)囊曨l服務,相當于影院和傳統(tǒng)DVD等家用播出設備在網絡上的擴展,也是國內的優(yōu)酷土豆、愛奇藝、搜狐視頻、騰訊視頻等主流網絡視頻服務提供方,以及國外Hulu,YouTube的主要線上業(yè)務。(3)個人錄制上傳分享的視頻。視頻經過上傳、轉碼、內容審核到最終發(fā)布,在網絡上向用戶提供自主視頻內容分享服務,進一步豐富了網絡視頻的內容。

表1 2014-2015年中國網民各類互聯(lián)網應用的使用率(部分)

這些視頻要想得以長期生存,必須有相當規(guī)模的搜索量和觀看量。以近年來孔笙執(zhí)導的熱播電視劇《瑯琊榜》(2015年)和《歡樂頌》(2016年)兩部網絡熱播視頻為例,對其在優(yōu)酷土豆網站的日搜索指數(shù)和日播放指數(shù)等網絡視頻指數(shù)①進行分析可發(fā)現(xiàn)如下規(guī)律:(1)一部網絡視頻的熱播周期只能維持3~6個月左右;(2)同一導演或劇組的前期成功作品會對后繼作品起到極其重要的宣傳作用;(3)取得成功的作品將延續(xù)很長時間的“長尾效應”②;(4)主推網絡視頻開播前期的大眾熱點強力推薦是確保開播前期2類指數(shù)曲線迅速上揚的關鍵保證;(5)過期網絡視頻的“長尾”用戶的持續(xù)推薦是確保視頻生存的關鍵保證。

近年來,我國網絡娛樂類應用穩(wěn)步發(fā)展,它們以優(yōu)質內容為核心拉動了娛樂應用的快速增長。以知識產權為核心的網絡娛樂產業(yè)鏈在2015年展現(xiàn)出巨大商業(yè)價值,由熱門網絡文學作品改編的影視作品屢創(chuàng)收視新高。愛奇藝、優(yōu)酷土豆、騰訊視頻等主要視頻網站在2015年新增的付費用戶數(shù)超過之前的積累,用戶付費收入在整體收入中的占比增大,預計未來會成為視頻網站重要的收入來源。這種大背景下,互聯(lián)網影視產業(yè)鏈進一步加強,網絡視頻作品若要取得成功,必須靠優(yōu)質內容、精準推薦來吸引更多收看者以提升口碑,靠嵌入廣告收費或靠視頻付費購買來提升收益。

二、大數(shù)據條件下網絡視頻推薦策略研究

大數(shù)據時代,網絡視頻、網絡音樂、網絡社交等傳媒行業(yè)的變革有目共睹,如按2013年有關數(shù)據顯示,F(xiàn)acebook每天有40億條發(fā)布量,網絡每天日志總額達35TB,每天吸收逾500TB圖片、視頻等新數(shù)據[4],YouTube網站目前有數(shù)十億視頻條目在線,用戶群體規(guī)模達到數(shù)百萬,每分鐘用戶上傳的視頻時長超過24小時。而Hulu網站擁有超過400萬高級用戶和平均每月3000萬免費用戶,總視頻規(guī)模達到40億[5]?;ヂ?lián)網的快速發(fā)展給用戶提供了大量的視頻資源,面對已經過多的信息,用戶通常很難找到自己感興趣的內容;同時,對于網絡視頻網站而言,網站間的競爭必將逐漸集中在提升用戶體驗之上,為用戶提供有效的個性化推薦服務勢在必行。面對海量用戶,網站必須深入挖掘和分析用戶的歷史行為信息,預測未來行為,找到不同用戶的興趣,為他們提供適合的、感興趣的資源,從而提升用戶的粘滯性和忠誠度,以求獲得更多的觀看率和經濟效益。目前的推薦方法種類繁多,但不同網絡視頻網站應當根據自身特點和不同類別視頻的實際需求,選擇合適的推薦策略。

(一)非個性化推薦

這種推薦基于用戶對產品的獨立于用戶推薦系統(tǒng)的平均評分,即所有受眾用戶都會得到相同的推薦結果。這種推薦方式做的就是將所有的反饋信息綜合起來并對要推薦的產品進行排序,從中選擇出當前最熱門的產品進行推薦。對于在線視頻網站來說,其往往針對未登錄的用戶采用這種推薦方式提供電影、電視劇、體育、綜藝、娛樂、動漫、教育、健康、軍事等熱門視頻,以期望更多的未登錄用戶或潛在用戶觀看,從而提升收看率,確保廣告收入或視頻收費增長。這種推薦方式的缺點非常明顯,非個性化推薦無論在未登錄用戶的體驗還是實際收看數(shù)量上都與個性化推薦有著很大的差距。這種方式適用于暫時無法確定用戶唯一身份的情況,也被普遍用于網站當前重點發(fā)展的熱門視頻推薦。

(二)個性化推薦

個性化視頻推薦就是網站不斷地搜集用戶搜索、觀看、點評各類視頻的行為,通過各種算法來計算用戶未來會感興趣的視頻,然后將相應的結果推薦給用戶[6]。個性化視頻推薦往往會采用很多種因素來決策用戶的行為,如訂閱、評分、搜索、評論,以及點擊、一次觀看時長、暫停點、回看時段、重復觀看次數(shù)等多種行為。個性化推薦方法通過綜合計算用戶的各種各樣的行為,來準確地找出用戶對于視頻的興趣點。用戶的歷史行為往往能從側面反應出用戶對視頻的需求方向,因此可以為推薦給用戶視頻提供很好的參照。例如,目前Youtube、Hulu、愛奇藝等視頻網站都會根據用戶已觀看、已購買的網絡視頻來為用戶推薦新的可能感興趣的視頻。站在用戶視角,推薦的視頻大多數(shù)都是和用戶歷史觀看、收藏、購買、評分、瀏覽等行為密切相關的。由此可見,個性化推薦的可行性還是非常高的。此種方式適用于可掌握海量用戶視頻操作行為大數(shù)據的相關網站。

(三)相關推薦

相關推薦就是將與用戶正在觀看的視頻比較相關的視頻推薦給當前的用戶?,F(xiàn)有的專業(yè)性視頻網站,如QQ影音、PPS等會根據你的選中視頻給你推薦一些結果。這些結果通常匹配程度較好,但是相關推薦通??紤]因素過分單一,最常見的問題就是如果用戶偶爾訪問一些視頻并且再不想觀看,那么根據這些推薦出的結果就適得其反。目前,相關推薦仍然是視頻推薦的重要推薦方式之一,雖然在專業(yè)性視頻網站上普遍已有實現(xiàn),但是基于生活、社交、興趣等以用戶為主的非專業(yè)視頻網站上,這方面做得還不夠全面。

(四)協(xié)同過濾推薦

這種方法也是通過用戶視頻操作歷史行為,分析出用戶的興趣標簽,然后對用戶做推薦。很多知名網站,如YouTube等視頻網站都采取了協(xié)同過濾的方式。協(xié)同過濾的一個優(yōu)點是可以有很多算法來供推薦者使用,如鄰域算法、圖算法、矩陣分解算法等等。這種算法的主要缺點是用戶新加入的視頻不能及時地融入推薦算法中,必須要有一定的基礎數(shù)據才能保證算法可以正確執(zhí)行。但是在過濾的準確程度上來講,協(xié)同過濾比前兩種過濾方式有明顯優(yōu)勢。

目前,以上方法中,具體算法有基于內容的推薦、協(xié)同過濾推薦、基于關聯(lián)規(guī)則的推薦、基于效用的推薦、基于知識的推薦以及組合推薦方法等多種類型[7]。筆者在此綜合分析了各種推薦方法均有其優(yōu)缺點和適用范圍,具體如表2所示。實際應用中應根據網站策略和不同視頻具體特點綜合考慮,采取合適的網絡視頻推薦策略。

由此可見,當前各種推薦方法都有優(yōu)缺點和具體應用限制。因此,在實際應用中,應該考慮若干種算法進行組合,如將基于內容的推薦和協(xié)同過濾推薦相結合組合,即分別用基于內容的方法和協(xié)同過濾推薦方法去產生一個推薦預測結果,然后用某方法組合其結果。各類技術的組合,要重復發(fā)揮各自優(yōu)勢,并避免或彌補各自不足,如通過加權(Weight)來綜合利用多種推薦技術結果,通過變換(Switch)來適應不同問題背景和實際情況,通過混合(Mixed)同時采用多種推薦技術給出多種推薦結果為用戶提供參考,通過特征組合(Feature combination)將不同推薦數(shù)據源的特征用于另一種推薦算法,通過層疊算法(Cascade)③分步進行逐次精確的推薦,通過特征擴充(Feature augmentation)將一種推薦技術產生附加的特征信息嵌入到另一種推薦技術的特征輸入中,通過元級別(Meta-level)方法用一種推薦方法產生的模型作為另一種推薦方法的輸入。

三、大數(shù)據環(huán)境中網絡視頻推薦技術發(fā)展的有關建議

大數(shù)據環(huán)境下,網絡視頻推薦技術的發(fā)展面臨著巨大的機遇和挑戰(zhàn),需要相關經營商從管理、技術兩方面不斷創(chuàng)新。針對目前情況,筆者給出以下發(fā)展建議。

(一)強化海量信息存儲加工基礎條件,為大數(shù)據推薦提供硬件能力

隨著網絡視頻用戶數(shù)量的暴漲,隨著網站海量日志的飛速上漲(如Facebook每天網絡日志量已達幾十TB),要在大數(shù)據時代深入挖掘海量數(shù)據中存在的各種規(guī)律,僅靠傳統(tǒng)的計算模式和計算軟硬件平臺是難以應付的。同時,隨著大數(shù)據時代的來臨,網絡中的信息量呈現(xiàn)指數(shù)式增長,帶來了信息過載問題,推薦系統(tǒng)是解決信息過載最有效的方式之一,大數(shù)據推薦系統(tǒng)已經逐漸成為信息領域的研究熱點。為有效進行科學推薦,大數(shù)據儲存、加工、處理的基礎平臺必須先行打牢。筆者認為各網絡視頻供應商應充分預估未來3~5年新增數(shù)據量,制訂數(shù)據存儲加工策略,建議自身核心數(shù)據采用自建方式,其余數(shù)據資源盡量采用IBM、易安信(EMC)、華為等大數(shù)據存儲服務商相關服務,以充分借助他人優(yōu)勢,聚焦業(yè)務核心發(fā)展需求。

表2網絡視頻推薦算法對比表

(二)加強特征化信息提取技術研究,為精確化推薦提供手段支撐

大數(shù)據時代,精確的信息識別技術是所有技術的基礎。在海量網絡視頻信息中提取具有特定特征的片段,并根據行為或屬性進行分類,從基礎數(shù)據中提煉與特定需求相關的數(shù)據進行整理與匹配,分析各類網絡視頻中的個性化需求,可提供個性化的信息服務。例如通過調查分析網絡視頻用戶觀看喜好等數(shù)據,可為某部電視劇確定觀眾喜好的主角人選;又如,通過數(shù)據分析獲取未來傳媒領域專業(yè)熱點及人才急需,可為某類傳媒專業(yè)學生提供個性化的教學資源服務,等等。建議各網絡視頻供應商應立足自身實際推薦核心需求,不斷找出適用于自身需求的各類數(shù)據資源的特征化屬性,創(chuàng)新文本特征信息提取、圖像幀特征信息提取、音樂特征抽取、用戶偏好綜合推理、領域知識推理等技術,做好各類資源、各類用戶的直接特征、間接特征的表達、選擇、組合及分析,從而實現(xiàn)推薦的精確化,做到在“正確”的時間、“正確的”環(huán)境下,為“正確的”用戶推薦“正確的”網絡視頻。

(三)加快個性化產品推薦方法研究,為精細化推薦提供技術支持

在傳統(tǒng)數(shù)據時代,傳媒電商營銷投向的精確度不高,網絡常見的各類用戶根本不感興趣的廣告層出不窮,令人反感。在大數(shù)據時代,傳媒電商可以通過基于Cookie的用戶偏好采集系統(tǒng),將更加個性化、精確化、差異化的產品推薦給更感興趣的受眾群體,在提升自身效益的基礎上,也可為相關受眾群體帶來更符合需求的選擇項目和更便捷的服務。如2014年BBC開設了BBS Store,為注冊用戶提供最近一年6000小時左右的節(jié)目和4000小時存檔節(jié)目,是拓展用戶對BBC公共服務和商業(yè)內容的搜索功能,鼓勵用戶購買個性化節(jié)目[8]。筆者建議網絡視頻供應商要不斷擴展信息收集的深度和廣度,在當前及未來海量數(shù)據的支持下,不斷細分市場,在更精確的數(shù)據特征支持下,快速開發(fā)形成應用個性化的產品推薦策略,從而實現(xiàn)推薦的精細化。

(四)廣泛開展視頻產品傳播反饋分析,為精準化推薦提供閉環(huán)反饋

大數(shù)據時代,傳媒行業(yè)的受眾群體可通過網站、博客、微博、微信等多種渠道、多個新媒體平臺針對媒體的新聞報道發(fā)表自己的觀點、表明自己的喜好。具體傳媒行業(yè)應該廣泛收集與己相關的各類反饋信息,建立符合自身需求的反饋信息大數(shù)據分析處理系統(tǒng),分析受眾好惡、特征、趨勢等,及時調整自身傳媒戰(zhàn)略和媒體內容,形成良性正反饋,不斷擴大自身影響度。如Netflix公司利用Cinematch推薦系統(tǒng),每天產生的3000多萬個基于用戶視頻點播的評分、播放、快進、暫停、觀看持續(xù)時間、觀看地點、終端類型等海量基礎數(shù)據進行分析,計算用戶喜好,進行個性化推薦定制。筆者建議網絡視頻供應商在上述各種“正向”推薦的基礎上,要通過多種技術手段采集用戶的瀏覽、點評、關注、停留、回看等多種“負向”反饋信息,并以此調整修正相應的個性化推薦方法,不斷提升推薦的精準化水平。

四、結語

涂子沛《正在到來的數(shù)據革命》中指出:“除了上帝,任何人都必須用數(shù)據說話。”當前各種行業(yè)中,大數(shù)據都意味著巨大的發(fā)展機遇,如互聯(lián)網視頻領域的YouTube、Netflix等,社交領域的Facebook、Twitter、新浪微博、騰訊微信等,傳統(tǒng)電視紙媒領域巨頭等,都在積極積累海量數(shù)據,創(chuàng)造大數(shù)據的應用環(huán)境,主導大數(shù)據的應用模式。同政府、工業(yè)、商業(yè)等成熟行業(yè)需求一樣,網絡視頻這一新的傳媒行業(yè)對大數(shù)據的需求也非常旺盛,但其用戶推薦模式還相對單一。筆者認為網絡視頻供應商應努力開展各類數(shù)據采集、深度加工和廣泛交換應用等工作,面對日益增長的海量用戶,應積極主動作為,加快技術創(chuàng)新,不斷提升各類推薦的精確化、精細化、精準化水平,促進自身競爭力的快速形成和長期保持。

注釋:

①2004年10月,美國《連線》雜志主編克里斯·安德森(Chris Anderson)首次提出提出長尾(Long Tail)理論。只要存儲和流通的渠道足夠大,長尾理論對傳統(tǒng)“二八法則”的挑戰(zhàn)在于,80%的非主流“長尾”不是僅占20%的份額,有可能達到甚至超過50%。

②視頻指數(shù)可以用于描述視頻播放周期、用戶核心特征、用戶播放行為、視頻熱度排行等。本文利用中國網絡視頻指數(shù)beta版(http://index.youku.com/)進行數(shù)據采集分析。

③所謂層疊算法,就是先用一種推薦技術產生一種粗糙的推薦結果,第二種推薦技術在此推薦結果的基礎上進一步作出更精確的推薦。

[1]中華人民共和國國民經濟和社會發(fā)展第十三個五年規(guī)劃綱要[EB/OL].(2016-03-17)[2016-05-21].http://news.xinhuanet.com/politics/2016lh/2016-03/17/c_1118366322.htm.

[2]國家大數(shù)據戰(zhàn)略——習近平與“十三五”十四大戰(zhàn)略[EB/ OL].(2015-11-12)[2016-05-21].http://politics.people.com.cn/ n/2015/1112/c1001-27809382.html.

[3]第37次中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告[EB/OL].(2016-01-22)[2016-05-21].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/ 201601/P020160122469130059846.pdf.

[4]張國強.大數(shù)據時代媒體轉型研究——以山東電視業(yè)為例[D].山東財經大學,2015.

[5]ALEKSANDRA KLASNJA MILICEVIC,BOBAN VESIN,MIRJANA IVANOVIC,et a1.Personalization of programming tutoring system using tag-based recommender systems[C].ICALT'12 Proceeding of the 2012 IEEE 12"'International Conference on Advanced Learning Technologies,2012:666-667.

[6]崔昊旻.海量視頻節(jié)目的檢索、推薦與反饋學習[D].中國科學技術大學,2014:2-3.

[7]戴思.基于可視化知識框架的視頻推薦系統(tǒng)研究與實現(xiàn)[D].中南大學,2014:22-33.

[8]彭錦.歐盟大數(shù)據政策及其在傳媒業(yè)的應用[J].科技與出版,2015(6):14-15.

(責任編輯:杭長釗)

2016-05-15

賈金娜,河北傳媒學院信息技術與文化管理學院教師,本科,研究方向:數(shù)字媒體技術;陳罡,河北傳媒學院信息技術與文化管理學院院長,碩士,研究方向:信息技術;鄭艾明,河北傳媒學院信息技術與文化管理學院輔導員,本科,研究方向:多媒體技術。

猜你喜歡
海量個性化用戶
一種傅里葉域海量數(shù)據高速譜聚類方法
堅持個性化的寫作
文苑(2020年4期)2020-05-30 12:35:12
海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
當代陜西(2019年14期)2019-08-26 09:42:00
新聞的個性化寫作
新聞傳播(2018年12期)2018-09-19 06:27:10
上汽大通:C2B個性化定制未來
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
一個圖形所蘊含的“海量”巧題
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
武乡县| 太湖县| 孝感市| 色达县| 石渠县| 新建县| 财经| 上栗县| 加查县| 海安县| 沾益县| 望江县| 武定县| 乌兰浩特市| 天长市| 东兰县| 吉木萨尔县| 瑞昌市| 昆明市| 古蔺县| 安塞县| 锦屏县| 雷波县| 万宁市| 张家界市| 景谷| 肃宁县| 车致| 赫章县| 雅安市| 高密市| 玉环县| 渭南市| 阜南县| 天津市| 鲁甸县| 化德县| 隆回县| 威海市| 辰溪县| 佛山市|