張軍
摘要:在當(dāng)前互聯(lián)網(wǎng)技術(shù)以及智能AI技術(shù)的發(fā)展背景下,合肥有線利用大數(shù)據(jù)技術(shù)對(duì)電視用戶群和節(jié)目資源進(jìn)行細(xì)分,整合規(guī)范合肥有線的直播和點(diǎn)播節(jié)目資源元數(shù)據(jù),利用基于內(nèi)容的推薦算法和協(xié)同過(guò)濾算法對(duì)推薦模型的數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,實(shí)現(xiàn)有線電視用戶的個(gè)性化推薦服務(wù)。
關(guān)鍵詞:推薦系統(tǒng);大數(shù)據(jù);互動(dòng)電視;HFC雙向網(wǎng)絡(luò)
中圖分類號(hào):G642? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)25-0297-02
在當(dāng)前互聯(lián)網(wǎng)技術(shù)以及智能AI技術(shù)的發(fā)展背景下,為了應(yīng)對(duì)新媒體技術(shù)的挑戰(zhàn),合肥有線對(duì)傳統(tǒng)機(jī)頂盒進(jìn)行著技術(shù)升級(jí),利用大數(shù)據(jù)技術(shù)對(duì)自己的用戶群進(jìn)行細(xì)分,并以此信息對(duì)用戶進(jìn)行合肥有線的直播和點(diǎn)播節(jié)目資源進(jìn)行系統(tǒng)推薦,以期做到千人千面的個(gè)性服務(wù),用以提高合肥有線的品牌競(jìng)爭(zhēng)力。本系統(tǒng)從合肥有線雙向網(wǎng)絡(luò)中收集用戶終端的各類信息(用戶信息、用戶行為信息以及業(yè)務(wù)信息等),通過(guò)對(duì)各類數(shù)據(jù)信息的建模分析利用大數(shù)據(jù)平臺(tái)來(lái)實(shí)現(xiàn)有線用戶的個(gè)性化推薦服務(wù)。
1 對(duì)有線節(jié)目資源進(jìn)行大數(shù)據(jù)分析的意義
自全網(wǎng)雙向改造后,合肥有線不僅保證直播節(jié)目穩(wěn)定無(wú)延時(shí)地傳輸也引進(jìn)了海量視頻資源以供有線用戶點(diǎn)播收看。雖然節(jié)目資源的初步聚合歸類改變了用戶的被動(dòng)接收的收視習(xí)慣,但與互聯(lián)網(wǎng)視頻網(wǎng)站對(duì)節(jié)目詳盡的分類相比,合肥有線的視頻資源入口相對(duì)簡(jiǎn)單、點(diǎn)播路徑過(guò)長(zhǎng)以及影片搜索不便捷等問(wèn)題無(wú)不影響著用戶收視。因此,運(yùn)用大數(shù)據(jù)分析系統(tǒng),對(duì)節(jié)目資源進(jìn)行深度分析,不僅可以提升有線優(yōu)質(zhì)資源的曝光率而且可以增加用戶的黏度;對(duì)用戶進(jìn)行群體細(xì)分以及用戶喜好的分析,改變了有線電視節(jié)目的運(yùn)營(yíng)模式,從傳統(tǒng)的粗放式推送轉(zhuǎn)化為精細(xì)化的用戶運(yùn)營(yíng),提升了用戶的品牌忠誠(chéng)度。
2 推薦系統(tǒng)介紹
推薦技術(shù)的發(fā)展是隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展而興起的,是信息過(guò)載時(shí)代信息消費(fèi)者和信息生產(chǎn)者之間的紐帶,是一種幫助用戶快速發(fā)現(xiàn)有用信息的工具。推薦系統(tǒng)并不需要用戶提供明確的需求,是分析并挖掘用戶的歷史行為,利用特定算法找出用戶的個(gè)性化特點(diǎn)并主動(dòng)給用戶推薦滿足他們需求的信息的系統(tǒng)。推薦系統(tǒng)面向的對(duì)象稱為用戶,推薦的產(chǎn)品稱為物品,推薦系統(tǒng)所關(guān)心的就是用戶與物品之間的關(guān)系,現(xiàn)有的一些基本類型的推薦系統(tǒng)包括:協(xié)同系統(tǒng)、基于內(nèi)容的系統(tǒng)和基于知識(shí)的系統(tǒng)。[1]這些系統(tǒng)都具有一個(gè)重要的特點(diǎn)擁有強(qiáng)大的用于跟蹤和識(shí)別用戶長(zhǎng)期興趣的用戶識(shí)別機(jī)制。
3 有線節(jié)目資源推薦系統(tǒng)架構(gòu)圖
有線節(jié)目資源推薦系統(tǒng)的用戶是收看有線電視節(jié)目的終端用戶,推薦系統(tǒng)的物品是有線節(jié)目資源,包括了直播電視節(jié)目、在線點(diǎn)播影片以及電視劇。有線節(jié)目資源推薦系統(tǒng)的架構(gòu)如圖1所示。
3.1 數(shù)據(jù)信息
推薦系統(tǒng)能否提供用戶滿意的結(jié)果依賴于數(shù)據(jù)信息源。數(shù)據(jù)源需要具有大數(shù)據(jù)的特性:大量化、多樣化以及速度化等特點(diǎn)。涉及的數(shù)據(jù)信息可以分為以下幾類:
(1)終端用戶自身數(shù)據(jù)信息:收看電視節(jié)目的終端設(shè)備以及智能卡號(hào),用戶姓名、用戶地址;
(2)終端用戶行為數(shù)據(jù)信息:用戶點(diǎn)播的數(shù)據(jù)信息(片名、開始點(diǎn)播時(shí)間、結(jié)束收看時(shí)間、暫停播放的時(shí)長(zhǎng)以及對(duì)節(jié)目的評(píng)分)、用戶瀏覽的數(shù)據(jù)信息(片名、開始瀏覽時(shí)間、結(jié)束瀏覽時(shí)間)
(3)節(jié)目資源的數(shù)據(jù)信息:節(jié)目資源的元信息(片名、類別、供應(yīng)商、導(dǎo)演、主演、內(nèi)容介紹、時(shí)長(zhǎng)、集數(shù))以及節(jié)目資源的綜合評(píng)分(網(wǎng)絡(luò)評(píng)分以及用戶評(píng)分)
(4)其他數(shù)據(jù):為了彌補(bǔ)節(jié)目資源元數(shù)據(jù)的不足,也需要利用網(wǎng)絡(luò)爬蟲技術(shù),從互聯(lián)網(wǎng)上獲取節(jié)目資源相關(guān)的元數(shù)據(jù)作為數(shù)據(jù)信息的補(bǔ)充。
3.2 數(shù)據(jù)處理
跟一般的挖掘分析相同,推薦系統(tǒng)需要對(duì)已有的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)清洗以及整理,將重復(fù)的、不合理的以及錯(cuò)誤的數(shù)據(jù)去除掉,并對(duì)符合要求的數(shù)據(jù)進(jìn)行格式化處理。
3.3 數(shù)據(jù)分析
經(jīng)過(guò)處理后的數(shù)據(jù)依然不能講用戶和物品關(guān)聯(lián)起來(lái),要想給用戶推薦個(gè)性化的物品,就需要通過(guò)建模來(lái)對(duì)用戶和物品進(jìn)行聚類分析,并依據(jù)特定算法用戶的個(gè)性化需求。推薦算法一般包括:協(xié)同過(guò)濾、基于內(nèi)容的推薦、基于知識(shí)的推薦以及基于上下文的推薦系統(tǒng)等。本文中使用了基于內(nèi)容的推薦和協(xié)同過(guò)濾兩種算法作為系統(tǒng)的推薦算法。
3.4 數(shù)據(jù)展示
數(shù)據(jù)展示部分就是將推薦算法得出的接口通過(guò)特定的方式提供給用戶,比如:機(jī)頂盒首頁(yè)個(gè)性推薦、其他系統(tǒng)頁(yè)面以及各類數(shù)據(jù)接口等。
4 系統(tǒng)實(shí)現(xiàn)
依據(jù)有線節(jié)目資源推薦系統(tǒng)的需求分析,我們結(jié)合爬蟲數(shù)據(jù)整理了有線節(jié)目資源的元數(shù)據(jù),實(shí)時(shí)記錄了有線用戶的點(diǎn)播數(shù)據(jù)(瀏覽信息以及點(diǎn)播信息),并依據(jù)推薦模型采用基于內(nèi)容的推薦算法和協(xié)同過(guò)濾算法的混合算法作為整個(gè)系統(tǒng)的推薦算法,對(duì)有線節(jié)目進(jìn)行分類排行以及個(gè)性推薦。
4.1分類排行
包含熱門節(jié)目排行、熱門影星參演排行、經(jīng)典老片以及綜合評(píng)分排行等,為有線用戶提供最常用的節(jié)目資源推薦(如圖2所示)。
4.2個(gè)性化推薦
個(gè)性推薦與單個(gè)用戶對(duì)節(jié)目的喜好有關(guān),依據(jù)用戶的歷史行為通過(guò)推薦算法來(lái)推斷用戶的喜好,從而為用戶提供可能感興趣的節(jié)目資源,相對(duì)于分類排行而言,個(gè)性推薦更加地智能化(如圖3所示)。
5 結(jié)語(yǔ)
本系統(tǒng)是針對(duì)合肥有線節(jié)目資源進(jìn)行的數(shù)據(jù)分析,為有線互動(dòng)點(diǎn)播業(yè)務(wù)提供長(zhǎng)尾分析以及資源推薦,其實(shí)現(xiàn)主要包括兩部分,其一,合肥有線節(jié)目資源與爬蟲信息的基礎(chǔ)信息整合;其二,基于內(nèi)容的推薦算法和協(xié)同過(guò)濾算法對(duì)推薦模型的數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析。實(shí)踐證明,該系統(tǒng)對(duì)有線節(jié)目資源進(jìn)行的大數(shù)據(jù)分析為合肥有線互動(dòng)點(diǎn)播業(yè)務(wù)提供了強(qiáng)有力的技術(shù)支持。
參考文獻(xiàn):
[1] [美]CharuC.,Aggarwal.推薦系統(tǒng):原理與實(shí)踐[M].王宏志,譯.機(jī)械工業(yè)出版社,2018.
[2] 美弗朗西斯科·里奇著推薦系統(tǒng):技術(shù)、評(píng)估及高效算法[M].李艷民,譯.機(jī)械工業(yè)出版社,2018.
[3] [美]Bruce Eckel. Java編程思想[M].陳昊鵬,譯.2007-06-01.
[4] [美]Craig Walls. Spring實(shí)戰(zhàn)[M].張衛(wèi)濱,譯.2016.
[5] [美]湯姆,懷特.Hadoop權(quán)威指南:大數(shù)據(jù)的存儲(chǔ)與分析[M].王海,華東,劉喻,呂粵海,譯清華大學(xué)出版社, 2017.
【通聯(lián)編輯:王力】