牛媛媛 劉慶振
隨著大數(shù)據(jù)、云計算、人工智能等技術的快速發(fā)展,算法、個性化分發(fā)、推薦系統(tǒng)等概念正在為內容產業(yè)乃至整個傳媒產業(yè)帶來新的思維方式、生產方式和消費方式。在今天,中國至少有超過6億以上的人、全球至少有超過25億以上的人借助于算法來獲取每天所消費的內容產品。本文將聚焦于重點探討短視頻、影視作品等內容產品的個性化推薦算法及其對影視傳媒產業(yè)可能產生的重要影響。
短視頻是內容推薦系統(tǒng)的典型應用場景之一,用戶在看完一段短視頻之后,系統(tǒng)就會自動推薦一段新的短視頻,用戶只需要動動手指點擊觀看即可,而不再需要自己輸入關鍵詞、點擊搜索并篩選內容這一繁瑣過程。這就是推薦引擎和搜索引擎的差異,也正是因為這種差異,短視頻的推薦系統(tǒng)才必須要更好地了解用戶需求以便向他們推薦更加合適的視頻內容。很多用戶在使用不同的短視頻移動應用時,都會有類似的體會:有的應用體驗非常好,能讓人沉迷進去無法自拔,有的應用推薦的內容卻根本不感興趣,讓人覺得無聊至極以致直接卸載該應用。事實上,這就是不同應用程序所采用的推薦算法之間的差異。如果一款短視頻應用所采用的推薦算法不夠優(yōu)秀,所完成的內容畫像和用戶畫像不夠精準,就完全有可能導致該系統(tǒng)向用戶推薦的內容無法實現(xiàn)個性化的精準匹配,從而進一步導致用戶體驗差、粘著性差、卸載率高等嚴重影響該產品市場競爭力的惡果。
由于短視頻本身存在短、小、輕、薄等特征,這就在很大程度上提高了對推薦內容的精準度的要求,不恰當?shù)囊粍t短視頻會與上一則內容之間產生明顯的違和感、突兀感,從而使得用戶無法沉浸在對內容的流暢體驗中。所以,在短視頻行業(yè)經過了一年多的快速爆發(fā)和嚴厲整頓后,下半場的競爭將會更多地聚焦在推薦算法的競爭上,算法強則核心競爭力強、推薦精準度高則市場占有率高將會成為短視頻領域競爭的殘酷法則。對于短視頻應用而言,無論其推薦系統(tǒng)所采用的技術如何先進或者其算法對不同維度的數(shù)據(jù)賦予的權重如何不同,其根本目的都是要最大化地實現(xiàn)內容與用戶的精準匹配,只有這樣它才可能在爭奪用戶注意力的戰(zhàn)場上勝出。
在這一點上,快手的思路是非常清晰的,它通過精準刻畫用戶的意圖,組合運用不同的算法來針對性地推薦個性化的視頻、全面地覆蓋用戶的不同需求,以期能夠提升其用戶的點擊率和觀看率。具體而言,在一位新用戶尚未注冊登陸的情況下,它在沒有形成一個較為完善的用戶畫像的時候,主要通過簡潔的界面、隨機的展示和體驗友好的瀑布流等方式鼓勵用戶根據(jù)自身的興趣愛好選擇相應的短視頻內容。在用戶已經點擊觀看了幾則短視頻內容并刷新之后,推薦系統(tǒng)就會根據(jù)用戶已經選擇的內容向他展示更多與前幾條短視頻相類似的內容。在用戶完成注冊并登錄之后,推薦系統(tǒng)主要通過組合“關注”“發(fā)現(xiàn)”和“同城”等幾種不同的推薦算法力圖做到用戶在不同場景下的不同內容需求?!鞍l(fā)現(xiàn)”推薦的內容綜合運用了協(xié)同推薦系統(tǒng)和內容過濾推薦系統(tǒng)兩種方式,前者通過歷史數(shù)據(jù)推斷用戶的興趣偏好并據(jù)此向用戶推薦新的內容,而后者則主要向用戶推薦與他們之前看過的內容高度相似的短視頻?!瓣P注”向用戶呈現(xiàn)的則是他已經關注了的短視頻生產者創(chuàng)作的內容,推薦系統(tǒng)也會根據(jù)這些內容與用戶需求之間的匹配程度進行排序。畢竟同一作者發(fā)布的內容也可能截然不同,如果不利用算法進行過濾就可能會直接影響用戶的體驗。推薦系統(tǒng)會對發(fā)布的內容進行類型化和標簽化,并利用機器快速地完善其畫像,然后再根據(jù)算法模型判斷這則視頻與該用戶之前觀看的視頻是否高度相似,從而決定是否向他推薦?!巴恰眲t是主要基于地理位置的遠近來決定優(yōu)先向用戶推薦哪些短視頻內容。利用多種算法進行組合推薦的好處在于它可以在很大程度上規(guī)避掉單一算法可能存在的明顯不足,從而最大可能地向用戶提供符合其需求的短視頻推薦服務。此外,如果用戶使用微博賬號或者微信賬號登錄快手的話,推薦系統(tǒng)還會使用社會化過濾推薦系統(tǒng)向用戶推薦其社會化媒體中的好友看過、點贊過和評論過的短視頻內容。
另外一款短視頻應用抖音為了更好地連接內容與用戶,也在其推薦算法上面花費了大量的心思。有人將抖音對新上傳內容的推薦方式總結為“賽馬機制”,其基本的邏輯是:向每一則新上傳的短視頻內容隨機地分配一個比較平均的流量池,對這些新上傳視頻的綜合數(shù)據(jù)進行比較,并進一步向那些表現(xiàn)較好的視頻內容分配一個更大的流量池,經過幾輪疊加和不斷強化的推薦之后,抖音的爆款內容也就出現(xiàn)了。當然,這種推薦機制更多地是從打造爆款內容的角度出發(fā),其思路在于:已經有100W+的用戶喜歡這則短視頻內容了,那么它是值得推薦給更多用戶的,沒看過這則短視頻的用戶或許也會喜歡。也恰恰正是這樣的思路使得抖音的推薦系統(tǒng)更多地向用戶推薦了那些看上去更熱門的內容,而非更符合用戶真正需求的內容。而為了解決推薦過程中存在的類似問題,抖音采用了“算法推薦+人工精選”的組合機制。一方面利用最新的機器學習技術設計相應的算法規(guī)則,確保推薦系統(tǒng)能夠按照一定的頻率和節(jié)奏向用戶推薦相似短視頻,但同時將這種推薦控制在一定的限度之內從而避免用戶產生審美疲勞。另一方面,抖音會經常性地人工精選出不同類型、不同領域、不同作者的優(yōu)質內容,根據(jù)相應的推薦規(guī)則和不同的用戶標簽向他們推薦不同的精選內容。隨著學術領域對信息繭房問題的深入探討以及政策層面對低俗內容的強勢整頓,很多短視頻應用也逐漸意識到自身推薦系統(tǒng)存在的各類瑕疵并加大力度完善其算法。事實上,好的推薦算法并不是站在流量經濟的立場上一味迎合并向用戶推薦相似度很高的內容,而是要從更多元化的角度向他針對性地推薦其視野范圍之外的有價值內容。
算法推薦的最重要價值在于它能夠提高內容分發(fā)的效率,尤其是在今天內容產品以爆炸式的速度增長的語境之下,無論對于用戶需求還是對于內容本身,個性化推薦系統(tǒng)無疑都是一個實現(xiàn)精準匹配、解決信息過載問題的重要手段。具體到影視領域,個性化推薦系統(tǒng)的價值也是顯而易見的。今天的用戶在互聯(lián)網上消費影視產品的時候,他們面對的是數(shù)十萬乃至上百萬部影視作品的巨大庫存,而且這個數(shù)字每年還在陸續(xù)地增加。單就國內來看,從2012-2017過去的五年間,我國的電影產量年均超過1000部、電視劇產量年均超過10000集。如果一名用戶每天24小時不吃不睡只用來觀看這些新增的影視作品,他的時間都是不夠用的。在過去,幾乎所有的視頻網站都傾向于采用熱門影視劇推薦的方式向所有用戶進行千篇一律的內容推薦,舉例而言,用戶A和用戶B登錄某一家視頻網站的時候,在兩位用戶的登錄首頁所看到的推薦作品是一樣的,幾乎都是最近一段時間比較熱門的影視劇集,視頻網站并不會因為兩位用戶的的性別、年齡、地域、職業(yè)、興趣等差異化的屬性向他們分別推薦更符合他們各自口味的影像內容。這就會導致所有視頻網站的幾乎絕大部分流量都流向少數(shù)的所謂“頭部”內容,出現(xiàn)80/20現(xiàn)象:即80%的流量流向了20%的熱門作品,其余80%的作品分享了剩余的20%流量。這種粗放式的經營方式在過去個性化推薦技術尚不流行的時代還有其生存的空間,但是隨著流量紅利的褪去以及內容產業(yè)競爭的加劇,面向用戶進行的更集約化、更精準化的運營方式對影視作品的個性化推薦系統(tǒng)提出了更高的要求,算法推薦也成為影視作品分發(fā)環(huán)節(jié)的標配。
從國際上看,Netflix在全球范圍內都可以算得上較早進行影像內容個性化推薦的先行者,它從2006年懸賞百萬美元進行推薦算法大賽開始,就一直致力于不斷優(yōu)化面向用戶消費需求的影像內容推薦系統(tǒng),并取得了令人矚目的業(yè)績。截至到2017年12月31日,Netflix全球用戶總數(shù)已經達到1.1758億人,其中付費用戶超過6000萬,每天在其網站上的觀看時長超過1億小時,這在很大程度上得益于其面向用戶進行個性化匹配的算法推薦系統(tǒng)。更值得一提的是,根據(jù)Netflix官方的粗略估算,其推薦系統(tǒng)每年為它節(jié)約的運營費用為10億美元左右。正是因為Netflix對其推薦系統(tǒng)的高度自信,所以它大膽地在用戶登錄的首頁就采用了個性化的推薦算法,用戶登陸后首先看到的不是熱門影視內容的推薦,而是為每名用戶量身打造的差異化內容呈現(xiàn)。
事實上,這一策略也為Netflix帶來了很好的回報:用戶的平均每3個小時的視頻播放時長中就有2個小時是來自于用戶登錄首頁的個性化推薦內容。為了減少用戶漫無目的進行內容搜索與過濾的時間,Netflix綜合運用了多種算法在登陸首頁的最重要位置進行推薦,針對每位不同的用戶都會有40行個性化的影視作品可供瀏覽選擇,每行又有75部根據(jù)不同算法、不同標簽和不同需求組合而成的推薦列表,而且每一部作品都清晰直白地向用戶說明了為什么進行推薦的理由,例如用戶喜歡的演員陣容或網絡評分等。涉及到具體的推薦算法,Netflix會根據(jù)用戶的瀏覽記錄選擇相似的影像作品進行推薦、會根據(jù)內容排行榜的短期熱點和周期性熱點進行推薦、會根據(jù)繼續(xù)觀看的場景和用戶搜索的場景進行推薦、會根據(jù)付費用戶更加個人化的興趣點進行推薦等。通過近幾年不斷改進和優(yōu)化自身的算法,Netflix已經顯著提高了它向用戶推薦的影視作品的接受度,提升了這些內容的被播放比率。
除了Netflix之外,YouTube也是全球范圍內在影像領域運用推薦系統(tǒng)進行個性化分發(fā)的典型企業(yè)。2016年在美國波士頓舉辦的第十屆全球ACM推薦系統(tǒng)大會上,谷歌的研發(fā)團隊發(fā)表了一篇題為《YouTube推薦系統(tǒng)中的深度學習網絡》的論文,首次詳細地公布了YouTube如何運用深度學習策略提升其推薦效果的技術細節(jié)?!案雀杵渌I域的產品一樣,YouTube同樣經歷了用深度學習來解決所有通用學習問題的根本性范式轉變?!边@也就意味著,推薦系統(tǒng)將會針對用戶的歷史數(shù)據(jù)、即時場景以及各種其他復雜因素的不斷變化而動態(tài)性地調整其所推薦的內容列表。
國內以影視作品為主的互聯(lián)網企業(yè)在推薦算法方面起步較晚,2006年Netflix嘗試運用推薦系統(tǒng)進行作品分發(fā)的時候,國內的優(yōu)酷、土豆等視頻網站剛剛成立。盡管如此,國內的互聯(lián)網企業(yè)近幾年來也快速地在自身的業(yè)務領域加大了應用推薦系統(tǒng)的力度。例如,優(yōu)酷在其首頁上線了“優(yōu)酷懂你”,向用戶宣稱看得越多其推薦的內容便會越符合用戶的口味;騰訊視頻上線了“你的專屬頻道”,通過算法為每位用戶精挑細選量身打造一個個性化的內容頻道;愛奇藝上線了“猜你喜歡”,以期借助于對過往瀏覽數(shù)據(jù)的挖掘找到用戶可能會喜歡的同類內容;豆瓣的電影頻道則專注于通過用戶的“興趣圖譜”來挖掘標簽體系和社交關系對于個性化影視作品推薦的巨大價值。事實上,未來的影視作品分發(fā)領域,版權和算法將是各大互聯(lián)網企業(yè)能否在激烈的市場競爭環(huán)境下持續(xù)保持優(yōu)勢地位的兩大關鍵要素。而隨著數(shù)據(jù)挖掘、深度學習和人工智能技術不斷地迭代進化,應用層面對于“千人千面”分發(fā)策略的不斷完善也將推動著個性化推薦系統(tǒng)向著它的理想狀態(tài)演進,從而使得內容平臺方對用戶的服務模式也逐漸從過去的主觀臆斷向基于數(shù)據(jù)的客觀預測轉變。
在一篇題為《2018年傳媒業(yè)技術趨勢報告》的文章中,未來今日研究所提到了作為傳媒從業(yè)者我們應該重點關注的75個重要技術發(fā)展趨勢,這其中的很多趨勢與我們今天所提及的個性化推薦系統(tǒng)和智能算法息息相關,例如深度學習、機器閱讀理解、計算傳播學、5G通信網絡等,這些技術都在以前所未有的程度影響著當前的影像內容乃至更多信息產品的分發(fā)模式朝著更加智能化的方向演進。舉例而言,實時機器學習技術(Real-Time Machine Learning)意味著已經開發(fā)出來的計算機算法和智能硬件完全可以做到在獲取數(shù)據(jù)的同時馬上根據(jù)已經取得的這些數(shù)據(jù)調整相應的模型了。在這樣的前提下,真正能夠稱得上個性化的推薦算法就可以根據(jù)用戶當前在手機應用(如抖音或騰訊視頻)的瀏覽速度、關注焦點、乃至用戶情緒進行更加精準的內容推薦,或者實時調整頁面的字體、顏色、風格以更適應不同用戶的觀看習慣。再如,這個研究所進行的更有意思的一項研究是,它的科學家正在訓練機器人觀看電視節(jié)目,而且在觀看了大量的YouTube視頻以及類似《絕望的主婦》這樣的電視劇之后,這臺基于人工智能的機器人設備已經能夠非常準確地預測視頻中的人物的下一個動作將要握手、擊掌、擁抱或者親吻了。這就意味著算法可以根據(jù)對影像內容的預測以及對用戶需求的預測實時地調整其所推薦內容的播放速度以更加符合用戶的觀看體驗。
事實上,無論是影像內容的分發(fā)環(huán)節(jié),還是信息產品的產消流程,都將在已經開啟的算法時代進行本質上的重構。推薦系統(tǒng)、人工智能、深度學習等技術創(chuàng)新背后的全新邏輯正在以更加廣泛、更加深刻和更加具體的方式重塑著信息、內容、傳播等領域的理論基礎和現(xiàn)實基礎,改造著我們通過媒體手段、內容產品和傳播方式所建立起來的自身與他人之間的互動關系,并從根本上升華著每位用戶的世界觀和方法論。通過全新的算法邏輯和智能生態(tài),推薦系統(tǒng)能更精確地依靠目標人群的興趣圖譜、用戶畫像和標簽體系實現(xiàn)精準匹配,從而實現(xiàn)由“人找信息”到“信息找人”的本質性轉變。因此在未來的理想化的內容分發(fā)和信息傳播景觀中,任何非智能化、非個性化的內容推薦都在一定程度上可以被視為某種信息噪音,而如何過濾這些噪音則是推薦系統(tǒng)不斷進化的核心使命。