摘要:本文從分析互動(dòng)電視業(yè)務(wù)發(fā)展遇到的問題入手,闡述將個(gè)性化推薦算法技術(shù)引入視頻點(diǎn)播系統(tǒng)的必要性。個(gè)性化推薦使用特殊的信息過濾技術(shù),向用戶推薦其感興趣的內(nèi)容。簡(jiǎn)而言之,個(gè)性化推薦算法是將用戶的個(gè)人喜好與具體的內(nèi)容特征進(jìn)行對(duì)比,從而響應(yīng)預(yù)測(cè)用戶對(duì)某些未評(píng)分項(xiàng)目的喜好程度。選擇參考功能項(xiàng)基于內(nèi)容屬性、用戶屬性和情景信息。
關(guān)鍵詞:個(gè)性化推薦;融合推薦;數(shù)據(jù)挖掘;自學(xué)習(xí)能力
0引言
隨著江蘇有線互動(dòng)電視業(yè)務(wù)的快速發(fā)展,互動(dòng)電視節(jié)目?jī)?nèi)容進(jìn)入海量時(shí)代。業(yè)務(wù)部門通過每日更新欄目推薦內(nèi)容,使用戶可以快速瀏覽到業(yè)務(wù)部門推薦的節(jié)目。但是每個(gè)用戶關(guān)心的內(nèi)容是千差萬別的,如何保證用戶能夠從海量?jī)?nèi)容中準(zhǔn)確定位自己需要和感興趣的內(nèi)容,是關(guān)系到用戶體驗(yàn)和運(yùn)營(yíng)商收益的關(guān)鍵。因此有必要將一些個(gè)性化推薦的算法引入視頻點(diǎn)播系統(tǒng),用于支撐未來業(yè)務(wù)運(yùn)營(yíng)的發(fā)展,更好順應(yīng)信息技術(shù)產(chǎn)業(yè)發(fā)展趨勢(shì),為搶占市場(chǎng)先機(jī)打下有利基礎(chǔ)。
2 個(gè)性化推薦算法
智能推薦系統(tǒng)中的個(gè)性化推薦通過貝葉斯網(wǎng)絡(luò)算法和協(xié)同過濾算法。兩種算法均是擴(kuò)展多種服務(wù)類型的業(yè)務(wù)概率、提高用戶體驗(yàn)的重要方式。個(gè)性化算法賴于用戶數(shù)據(jù)和歷史數(shù)據(jù)對(duì)用戶喜好進(jìn)行預(yù)測(cè)。智能推薦系統(tǒng)可以利用內(nèi)置的接口API、算法、用戶ID、群組和情景來生成HTTP請(qǐng)求,并發(fā)送到智能推薦系統(tǒng)接口引擎。推薦項(xiàng)列表將以JSON格式的HTTP消息返回。系統(tǒng)需要提取項(xiàng)目ID(作為業(yè)務(wù)需求)并獲取其它相關(guān)信息,以將現(xiàn)有層呈現(xiàn)至終端設(shè)備,狀態(tài)和推薦理由亦將嵌入在返回信息中。
2.1個(gè)性化推薦算法概述
根據(jù)提取和比較功能項(xiàng)的方式,可將智能推薦系統(tǒng)支持的推薦算法分為兩類:
2基于協(xié)同過濾的推薦:推薦給用戶一些與該用戶使用習(xí)慣相似的其他用戶喜歡的內(nèi)容。例如,當(dāng)用戶在瀏覽影片時(shí),基于協(xié)同過濾的推薦系統(tǒng)會(huì)根據(jù)其瀏覽記錄或歷史購買記錄,分析出與其使用習(xí)慣相似的一些用戶,將他們?yōu)g覽和購買的影片推薦給用戶。
2基于模型過濾的推薦:通過分析用戶屬性、內(nèi)容屬性、用戶購買歷史建立數(shù)據(jù)推理模型(貝葉斯網(wǎng)絡(luò)),根據(jù)推理模型計(jì)算出該用戶已選擇過的內(nèi)容相似的內(nèi)容。例如,當(dāng)用戶在準(zhǔn)備購買影片時(shí),一般總是選擇與之前購買歷史相似的內(nèi)容,那么推薦系統(tǒng)就會(huì)推薦一些相似的內(nèi)容。
2.2個(gè)性化推薦系統(tǒng)特征
支持多種推薦算法(協(xié)同過濾、貝葉斯網(wǎng)絡(luò)、排名),并提供智能的算法選擇邏輯,可根據(jù)用戶屬性和購買歷史等因數(shù)自動(dòng)選擇合適的推薦算法。
提供個(gè)人推薦和家庭組成員推薦的支持。在支持個(gè)性化推薦的同時(shí),可根據(jù)多個(gè)家庭成員不同的個(gè)人喜好作出群組推薦。例如,當(dāng)家庭中有多人(父親、母親、子女)同時(shí)觀看電視時(shí),系統(tǒng)可綜合多人不同的偏好,返回的推薦列表中將同時(shí)涵蓋多人的喜好。
同時(shí)應(yīng)用兩種反饋機(jī)制(隱式、顯式)。隱式:用戶的訪問或點(diǎn)播記錄。顯式:用戶對(duì)內(nèi)容的評(píng)價(jià)。
2.3健壯性和自學(xué)習(xí)能力
內(nèi)置異常處理機(jī)制和可靠的數(shù)據(jù)存儲(chǔ)機(jī)制保證了個(gè)性化推薦引擎的健壯性。推薦系統(tǒng)由于需要進(jìn)行大量的實(shí)時(shí)運(yùn)算,所以采用算法保護(hù)和切換機(jī)制??筛鶕?jù)不同類型的請(qǐng)求進(jìn)行算法選擇,保證推薦結(jié)果的完整性和精確性。在數(shù)據(jù)存儲(chǔ)方面推薦系統(tǒng)支持分布式管理,能夠自動(dòng)維護(hù)數(shù)據(jù)的多個(gè)拷貝,并在任務(wù)失敗后自動(dòng)重新部署計(jì)算任務(wù)。
推薦系統(tǒng)支持自我學(xué)習(xí)的能力,根據(jù)用戶最近的瀏覽、購買行為不斷修正用戶的偏好。有效解決用戶興趣會(huì)隨時(shí)間發(fā)生變化的問題。
2.4個(gè)性化推薦算法 – 協(xié)同過濾(CF)
協(xié)同過濾(Collaborative Filtering,簡(jiǎn)稱CF)是一種應(yīng)用廣泛的推薦算法,其特點(diǎn)是算法能夠基于一些復(fù)雜的信息(如質(zhì)量、品質(zhì))作出推薦。支持發(fā)散式推薦,可以幫助用戶發(fā)現(xiàn)之前從未關(guān)注過的內(nèi)容。系統(tǒng)包含以下兩種協(xié)同過濾算法:
基于用戶的協(xié)同過濾:根據(jù)用戶的評(píng)分歷史,找到與用戶有相近愛好的其他用戶,之后把這些用戶感興趣的內(nèi)容推薦給此用戶。
基于項(xiàng)目的協(xié)同過濾:根據(jù)用戶的評(píng)分歷史,找到與用戶曾經(jīng)觀看的內(nèi)容相近的其他內(nèi)容,并把這些內(nèi)容推薦給此用戶。與基于用戶協(xié)同過濾相比,基于項(xiàng)目協(xié)同過濾算法解決了隨著用戶量的不斷增長(zhǎng)實(shí)時(shí)計(jì)算量過大的問題。
2.5 個(gè)性化推薦算法-貝葉斯網(wǎng)絡(luò)(BN)
貝葉斯網(wǎng)絡(luò)是一種用于上下文推理的技術(shù),非常適合解決信息分發(fā)的概率問題。由于貝葉斯網(wǎng)絡(luò)是基于數(shù)據(jù)推導(dǎo)的特性,所以不像協(xié)同過濾算法一樣存在數(shù)據(jù)稀疏的問題。該算法通過分析用戶瀏覽、點(diǎn)播、評(píng)分記錄,并使用貝葉斯網(wǎng)絡(luò)預(yù)測(cè)其對(duì)內(nèi)容的偏好,然后將用戶偏好與內(nèi)容特征進(jìn)行匹配計(jì)算從而產(chǎn)生內(nèi)容推薦。該算法的特點(diǎn)是:能夠參照多種屬性為用戶提供更為精確有效的個(gè)性化推薦。
正面模型和負(fù)面模型推理過程如下(圖1所示):
推薦系統(tǒng)接收個(gè)性化推薦請(qǐng)求,推薦系統(tǒng)獲取用戶屬性信息、內(nèi)容信息、用戶情景信息(例如:觀看時(shí)間、觀看人數(shù)、情緒等)
推薦系統(tǒng)使用正面負(fù)面模型進(jìn)行數(shù)據(jù)推理,并對(duì)推理結(jié)果進(jìn)行權(quán)重距離計(jì)算,計(jì)算出靠近正面模型的內(nèi)容權(quán)重和遠(yuǎn)離負(fù)面模型的內(nèi)容權(quán)重。
算出的用戶對(duì)內(nèi)容的偏好概率大小順序生成推薦結(jié)果。
3關(guān)聯(lián)推薦算法
3.1使用余弦相似度的關(guān)聯(lián)推薦
關(guān)聯(lián)項(xiàng)目算法是一種基于服務(wù)內(nèi)容屬性的推薦算法。服務(wù)項(xiàng)將在余弦相似度基礎(chǔ)上進(jìn)行比較,并將根據(jù)特定項(xiàng)目的相似度進(jìn)行分類。算法特征:由于事先計(jì)算了項(xiàng)目相似度,因此可以實(shí)現(xiàn)實(shí)時(shí)計(jì)算。該推薦于終端用戶搜索特定類別或關(guān)鍵字時(shí)適用。推薦引擎將通過數(shù)據(jù)庫中的預(yù)處理矩陣獲取關(guān)聯(lián)程序最高的項(xiàng)(由分?jǐn)?shù)決定:1-相同,0-完全無關(guān))。因此,它與終端用戶的登錄狀態(tài)不相關(guān)。集成人員可以利用內(nèi)置的接口 API、算法名稱(余弦相似度)、用戶ID、當(dāng)前內(nèi)容ID以及跨服務(wù)標(biāo)識(shí)來生成HTTP請(qǐng)求,并發(fā)送到智能推薦系統(tǒng)接口引擎。推薦項(xiàng)列表將以JSON格式的HTTP消息返回。集成人員可能需要提取項(xiàng)目ID(作為業(yè)務(wù)需求)并獲取其它相關(guān)信息,以將現(xiàn)有層呈現(xiàn)至終端設(shè)備。狀態(tài)和推薦理由亦將嵌入在返回信息中。
3.2使用關(guān)鍵字搜索的關(guān)聯(lián)推薦
使用關(guān)鍵字搜索的關(guān)聯(lián)推薦基于全文搜索技術(shù),該技術(shù)旨在通過將文本內(nèi)容分解為關(guān)鍵字來尋找最為相關(guān)的服務(wù)內(nèi)容,并根據(jù)反向索引進(jìn)行搜索。該推薦于終端用戶搜索特定類別或關(guān)鍵字時(shí)適用。操作員可向用戶推薦關(guān)聯(lián)的服務(wù)內(nèi)容。集成人員可以利用內(nèi)置的接口 API、算法名稱(關(guān)鍵字)、用戶ID、當(dāng)前內(nèi)容ID、跨服務(wù)標(biāo)識(shí)以及內(nèi)容所屬語言來生成HTTP請(qǐng)求,并發(fā)送到智能推薦系統(tǒng)接口引擎。推薦項(xiàng)列表將以JSON格式的HTTP消息返回。集成人員可能需要提取項(xiàng)目ID(作為業(yè)務(wù)需求)并獲取其它相關(guān)信息,以將現(xiàn)有層呈現(xiàn)至終端設(shè)備。狀態(tài)和推薦理由亦將嵌入在返回信息中。
4 結(jié)束語
將智能推薦技術(shù)引入到視頻點(diǎn)播系統(tǒng)后,方便用戶快速找到自己喜愛的節(jié)目,提高了互動(dòng)電視節(jié)目點(diǎn)播量,產(chǎn)生顯著的社會(huì)效益和經(jīng)濟(jì)效益。智能推薦技術(shù)除了可以應(yīng)用于視頻點(diǎn)播系統(tǒng),還可以應(yīng)用到更多其它廣電業(yè)務(wù)。
通過與終端管理系統(tǒng)集成,獲取用戶對(duì)直播節(jié)目的收視習(xí)慣的統(tǒng)計(jì)和分析,同時(shí)結(jié)合直播節(jié)目的深度EPG信息,可以實(shí)現(xiàn)點(diǎn)播、直播、回看節(jié)目的融合推薦,如當(dāng)用戶收看直播節(jié)目時(shí),可以向用戶推薦相關(guān)聯(lián)的點(diǎn)播節(jié)目和頻道回看節(jié)目,給用戶帶來更好的收視體驗(yàn)。
通過定制化開發(fā),智能推薦技術(shù)還可以為其它廣電業(yè)務(wù),如電視商城、電視游戲、電視互聯(lián)網(wǎng)等進(jìn)行內(nèi)容推薦,具有很好的應(yīng)用前景。
參考文獻(xiàn)
[1]周虹君,殷復(fù)蓮,陳怡婷,周嘉琪,伊成昱.Spark框架下的受眾分群及矩陣分解的推薦算法研究[J].互聯(lián)網(wǎng)+健康,2016,20(2):139-141.
[2]張曉陽.基于受眾收視行為分析的電視節(jié)目編排策略芻探[J].企業(yè)家天地,2011,3(1):187-188.
[3]高肖俊,丁云強(qiáng).基于用戶收視興趣模型的廣電客戶分群及精確化營(yíng)銷系統(tǒng)建設(shè)[J].視聽界,2016,3(2):1-3.
[4]夏歡.基于組合策略的IPTV節(jié)目推薦[D]:[碩士學(xué)位論文].昆明:云南大學(xué),2016.
[5]沈建軍.面向互動(dòng)電視的影視節(jié)目推進(jìn)系統(tǒng)研究與實(shí)現(xiàn)[D]:[碩士學(xué)位論文].杭州:復(fù)旦大學(xué),2012.
作者簡(jiǎn)介:
葛雨,男,1983年生,學(xué)士,江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司播控中心科長(zhǎng),主要從事VOD、OTT業(yè)務(wù)運(yùn)行管理方面的研究,曾參與過省市縣三級(jí)播控等江蘇省文化產(chǎn)業(yè)引導(dǎo)資金項(xiàng)目、Tvos業(yè)務(wù)等國(guó)家“核高基”項(xiàng)目。
江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司,南京 210018