国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于項目協(xié)同過濾的電視產(chǎn)品營銷推薦模型

2019-01-30 12:53檀亞寧金澤明陳輝
科技資訊 2019年32期
關(guān)鍵詞:個性化推薦數(shù)據(jù)處理

檀亞寧 金澤明 陳輝

摘? 要:互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和應(yīng)用拓展使我們迎來了三網(wǎng)融合的時代,為傳統(tǒng)廣播電視媒介帶來了發(fā)展機遇。節(jié)目數(shù)據(jù)的劇增一方面豐富了電視節(jié)目的內(nèi)容,另一方面卻為用戶選擇帶來了困難,這就要求電視運營商建立合理的個性化推薦模型。該文采用基于物品的協(xié)同過濾的個性化推薦算法,通過分析用戶觀看收視信息數(shù)據(jù)、電視產(chǎn)品信息數(shù)據(jù),同時考慮到目前傳統(tǒng)的互聯(lián)網(wǎng)資源推薦系統(tǒng)大都是針對個體推薦,在對家庭不同成員的推薦時可能會出現(xiàn)適得其反的情況,綜合考慮整個家庭成員的點播集合,構(gòu)成了家庭用戶完整的歷史觀看記錄,分析每個家庭成員的偏好,建立電視產(chǎn)品營銷推薦模型,做出節(jié)目的個性化推薦。同時對不同節(jié)目的標(biāo)簽進行組成分析,以數(shù)據(jù)圖的形式更加直觀地展示在結(jié)果中,用以了解不同時期標(biāo)簽的熱度與關(guān)注度,從而進一步得出影視作品的熱度,對不同時期的推薦偏好做出指導(dǎo)性建議。

關(guān)鍵詞:基于物品的協(xié)同過濾? 個性化推薦? 節(jié)目標(biāo)簽? 數(shù)據(jù)處理

中圖分類號:TP31 ? ?文獻標(biāo)識碼:A 文章編號:1672-3791(2019)11(b)-0214-03

Abstract: The rapid development and application of Internet technology has ushered in the era of triple play, which has brought opportunities for the development of traditional broadcast and television media. The dramatic increase of program data has on the one hand enriched the content of television programs and on the other hand brought difficulties to user selection. This requires television operators to establish a reasonable personalized recommendation model. This article adopts a personalized recommendation algorithm based on item-based collaborative filtering, and analyzes users' viewing information data and TV product information data, taking into account that the current traditional Internet resource recommendation systems are mostly for individual recommendations, and are recommended for different family members. There may be counterproductive situations in which the on-demand collection of the entire family member is taken into account, constitutes a complete historical viewing record of the family user, analyzes the preferences of each family member, establishes a television product marketing recommendation model, and makes a personalized recommendation of the program.At the same time, the composition of the labels of different programs is analyzed and displayed in the results in the form of data graphs more intuitively to understand the heat and attention of the labels in different periods, thereby further obtaining the popularity of film and television works and recommending preferences for different periods. Make guidelines.

Key Words: Collaborative filtering based on items; Personalized recommendation; Program labels; Data processing

協(xié)同過濾推薦系統(tǒng)[1]是個性化信息服務(wù)的重要組成部分,可以實現(xiàn)主動精準(zhǔn)地為用戶推薦感興趣的信息。隨著互聯(lián)網(wǎng)上信息的增長和用戶個性化需求的提高,推薦系統(tǒng)的應(yīng)用日益廣泛,成為電子商務(wù)、社會網(wǎng)絡(luò)、視頻和音樂點播等個性化服務(wù)的核心技術(shù)。

基于此,該文圍繞電視產(chǎn)品的營銷推薦系統(tǒng)及其若干關(guān)鍵模型與推薦算法實現(xiàn)了基于項目協(xié)同過濾的電視產(chǎn)品營銷推薦的工作,并且經(jīng)過一些對比分析實驗,證明了基于項目協(xié)同過濾算法在推薦系統(tǒng)上具有一定優(yōu)勢,并總結(jié)歸納了該文的優(yōu)缺點,提出了改進方向。

1? 相關(guān)工作——數(shù)據(jù)預(yù)處理

1.1 用戶及節(jié)目特征

將所給數(shù)據(jù)進行處理和分析,分析其中用戶特征即觀看時長、資源熱度以及資源關(guān)注度;分析其中節(jié)目特征即節(jié)目地區(qū)、節(jié)目語種、節(jié)目類型。

1.2 正則表達式

原本數(shù)據(jù)中存在如:“【】”,“(高清)”,“(10)”等附加信息,對于直接獲取到節(jié)目原本的名字造成了一定程度的干擾,該文利用Python中的正則表達式來去除存在于原節(jié)目名稱中的干擾字符串。如寄生獸(高清)經(jīng)過正則表達式除去干擾后為寄生獸。

2? 模型建立

模型建立流程如圖1所示。

2.1 基于項目的協(xié)同過濾算法

基于項目的協(xié)同過濾通過分析項目之間的相似性進行推薦,算法假設(shè):對于一些資源,如果很多的用戶對它的打分比較類似,那么當(dāng)前用戶對它的打分也會比較類似。算法將尋找與當(dāng)前資源評分最相似的資源作為此資源的最近鄰居,通過當(dāng)前用戶對當(dāng)前資源最近鄰居的評分來預(yù)測他對此資源的評分。

這里只以皮爾森相關(guān)系數(shù)為例。

設(shè)Uab為對資源a和b都評價過的用戶的集合,那么相關(guān)相似性的皮爾森系數(shù)可表示為:

(1)

上式中,ru,a、ru,b代表用戶u對資源a和b的打分,和表示是大量用戶對資源a和b的打分的均值[2]。

接下來對用戶評分進行預(yù)測:

(2)

2.2 協(xié)同過濾推薦

將經(jīng)過上述清洗的數(shù)據(jù)用作模型的原始數(shù)據(jù),按照觀看的時間順序?qū)⒚總€用戶的觀看數(shù)據(jù)平均分為2份,其中較早的數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),較晚的數(shù)據(jù)作為模型的驗證數(shù)據(jù)[3],用來計算推薦結(jié)果的準(zhǔn)確率及召回率。

首先剔除數(shù)據(jù)的異常值,剔除異常值的數(shù)據(jù)按照時間順序排序,然后將排序后的數(shù)據(jù)讀入到列表中,對每一個用戶編號的觀看數(shù)據(jù)進行均分處理。然后獲取訓(xùn)練數(shù)據(jù),導(dǎo)入到模型中進行訓(xùn)練,輸出推薦的節(jié)目及推薦指數(shù)(見圖2)。

3? 實驗及結(jié)果分析

3.1 實驗數(shù)據(jù)與評估指標(biāo)

3.1.1 實驗數(shù)據(jù)

此次實驗所采用的是“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽平臺的數(shù)據(jù),共計445278條數(shù)據(jù),其中包括了用戶收視信息、電視產(chǎn)品信息數(shù)據(jù)和用戶基本信息3個方面。

3.1.2 評估指標(biāo)

精確率(precision)的公式是,它計算的是所有“正確被檢索的item(TP)”占所有“實際被檢索到的(TP+FP)”的比例。

召回率(recall)的公式是,它計算的是所有“正確被檢索的item(TP)”占所有“應(yīng)該檢索到的item(TP+FN)”的比例。

3.2 實驗結(jié)果

采用基于項目的協(xié)同過濾算法,根據(jù)上述分成的前期訓(xùn)練數(shù)據(jù)以及后期的評判數(shù)據(jù),此用戶的推薦準(zhǔn)確率為20.000%,召回率為16.000%。

4? 結(jié)論與展望

該文通過對用戶觀看收視信息數(shù)據(jù)、電視產(chǎn)品信息數(shù)據(jù)等進行基于項目協(xié)同過濾的算法處理,實現(xiàn)了單個家庭的個性化節(jié)目推薦,同時考慮了單個家庭不同用戶偏好不同的情況,實現(xiàn)了推薦結(jié)果的標(biāo)簽豐富性,同時綜合標(biāo)簽的數(shù)據(jù)圖結(jié)果,在推薦結(jié)果中考慮了熱度偏好,較好地實現(xiàn)了個性化推薦。

在實際調(diào)查后,我們還發(fā)現(xiàn)目前存在著用戶不愿過多對接收的資源評分、打標(biāo)簽等致使資源提供者需要花費更多的精力分析用戶對資源的使用情況、用戶性別年齡、地區(qū)等基本屬性缺失,且難以從觀看節(jié)目準(zhǔn)確判斷等問題。因此,在系統(tǒng)的用戶交互上應(yīng)采取觀看后星級打分手段,有償積分長評短評等策略,進一步完成標(biāo)簽補全,同時在用戶進行賬號注冊時可完成對性別年齡這些基本特征的補全。在分析過程中應(yīng)意識到電視賬號不具有手機號碼的普及性,一個家庭可以共用一個電視賬號,因此賬號注冊只能獲取家庭成員之一的基本特征,故不應(yīng)僅局限于此基本特征推薦,而應(yīng)從此基本特征出發(fā),適時適量地對其家庭成員進行刻畫與內(nèi)容推薦,并根據(jù)反饋機制調(diào)整推薦系統(tǒng)。

參考文獻

[1] 肖潔.面向網(wǎng)絡(luò)電視的推薦系統(tǒng)框架及算法研究[D].華東師范大學(xué),2012.

[2] 喻玲.面向家庭用戶的互聯(lián)網(wǎng)電視資源推薦模型研究[D].華中師范大學(xué),2015.

[3] 沈建軍.面向互動電視的影視節(jié)目推薦系統(tǒng)研究與實現(xiàn)[D].復(fù)旦大學(xué),2012.

猜你喜歡
個性化推薦數(shù)據(jù)處理
電容式傳感系統(tǒng)數(shù)據(jù)處理電路的設(shè)計
基于ARCGIS 的三種數(shù)據(jù)處理方法的效率對比研究
貴州開建FAST科學(xué)研究與數(shù)據(jù)處理中心
高層建筑沉降監(jiān)測數(shù)據(jù)處理中多元回歸分析方法的應(yīng)用研究
高層建筑沉降監(jiān)測數(shù)據(jù)處理中多元回歸分析方法的應(yīng)用研究
視頻大數(shù)據(jù)處理的設(shè)計與應(yīng)用
基于遠程教育的個性化知識服務(wù)研究
基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
個性化推薦系統(tǒng)關(guān)鍵算法探討
基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究