国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)個(gè)性化推薦分析

2019-12-11 10:00任敏
物聯(lián)網(wǎng)技術(shù) 2019年11期

任敏

摘 要:個(gè)性化推薦技術(shù)通過分析用戶的興趣愛好,對用戶進(jìn)行有針對性的推薦,在大數(shù)據(jù)時(shí)代,該技術(shù)被越來越多地應(yīng)用到互聯(lián)網(wǎng)領(lǐng)域,如何實(shí)現(xiàn)大數(shù)據(jù)個(gè)性化推薦機(jī)制已成為人們研究的熱點(diǎn)之一。在對大數(shù)據(jù)個(gè)性化推薦算法的發(fā)展歷程進(jìn)行分析的基礎(chǔ)上,研究了大數(shù)據(jù)個(gè)性化推薦的各種算法,對比分析了算法的優(yōu)缺點(diǎn)及適用場合,探討了大數(shù)據(jù)個(gè)性化推薦在數(shù)據(jù)、算法、用戶、冷啟動及推薦多樣性方面存在的問題,并展望了其在教育、醫(yī)療、電子商務(wù)及互聯(lián)網(wǎng)金融等領(lǐng)域的應(yīng)用趨勢。

關(guān)鍵詞:大數(shù)據(jù);個(gè)性化推薦;興趣愛好;推薦算法;協(xié)同過濾;混合推薦

中圖分類號:TP39文獻(xiàn)標(biāo)識碼:A文章編號:2095-1302(2019)11-00-03

0 引 言

大數(shù)據(jù)背景下的信息過載問題越來越嚴(yán)重,基于大數(shù)據(jù)的個(gè)性化推薦技術(shù)在教育、醫(yī)療和社會網(wǎng)絡(luò)領(lǐng)域的實(shí)際應(yīng)用價(jià)值,使其逐漸成為緩解信息過載問題的有效方法。大數(shù)據(jù)具有Volume,Variety,Value,Velocity四個(gè)特征,如何分析和處理用戶感興趣的海量數(shù)據(jù),提取有價(jià)值的信息,從而進(jìn)行有針對性的推薦服務(wù)是大數(shù)據(jù)個(gè)性化推薦的關(guān)鍵。

1 大數(shù)據(jù)個(gè)性化推薦發(fā)展歷程

歷史上最具代表性的檢索技術(shù)是分類目錄和搜索引擎。分類目錄是用戶在知道明確的知識前提下,通過分類選擇找到自己想要的信息,使用極其不便,之后研究出搜索引擎技術(shù),但是當(dāng)用戶需求不明確時(shí),搜索系統(tǒng)則無法實(shí)現(xiàn)較好的效果,因此推薦技術(shù)應(yīng)運(yùn)而生。近幾年,隨著信息爆炸與大數(shù)據(jù)技術(shù)的普及,基于大數(shù)據(jù)的個(gè)性化推薦成了時(shí)代的新寵。大數(shù)據(jù)背景下的個(gè)性化推薦通過收集大量用戶感興趣的信息、采用大數(shù)據(jù)分析技術(shù)挖掘用戶的喜好,通過個(gè)性化推薦算法為用戶提供準(zhǔn)確的個(gè)性化推薦。

在國內(nèi),大數(shù)據(jù)個(gè)性化推薦算法自2012年提出之后,經(jīng)過兩年的發(fā)展期和一年的成熟期,到2016年進(jìn)入了廣泛的應(yīng)用期[1],同時(shí)在技術(shù)方面也從最初的hadhoop技術(shù)應(yīng)用到大數(shù)據(jù)的快速處理、推薦算法及框架的研究,進(jìn)而轉(zhuǎn)向在電子商務(wù)、新聞和社交網(wǎng)絡(luò)等領(lǐng)域的個(gè)性化推薦應(yīng)用研究。國外的研究早于國內(nèi),自2015年開始國外已從理論研究轉(zhuǎn)向教育、醫(yī)療及用戶行為等多方面的應(yīng)用研究。

2 大數(shù)據(jù)個(gè)性化推薦算法分析

大數(shù)據(jù)背景下的個(gè)性化推薦算法如圖1所示。

2.1 基于內(nèi)容的個(gè)性化推薦

所有物品都有內(nèi)容的分類,如人們常吃的肉類就包括豬肉、牛肉、羊肉、狗肉、驢肉、兔肉等?;趦?nèi)容的個(gè)性化推薦首先對物品的內(nèi)容信息進(jìn)行分析,提取內(nèi)容特征,然后根據(jù)物品的內(nèi)容屬性和用戶的歷史評分或操作記錄,提取用戶需求和對不同內(nèi)容屬性的愛好程度,并且構(gòu)建相應(yīng)的用戶需求和偏好模型,由此向用戶推薦與其需求和偏好模型相匹配的資源。該推薦方法的核心在于利用用戶需求和偏好與目標(biāo)資源的相似性來過濾信息,進(jìn)而實(shí)現(xiàn)個(gè)性化信息推薦。推薦步驟如圖2所示。

若物品沒有明確的內(nèi)容特征,則根據(jù)對推薦物品特征的描述可以分為結(jié)構(gòu)化特征和非結(jié)構(gòu)化特征兩種,前者特征的取值限定在某個(gè)區(qū)間范圍內(nèi),并且按照定長的格式來表示,而后者無法按固定格式表示,文章就是最典型的此類數(shù)據(jù)[2-3],我們經(jīng)常將其轉(zhuǎn)化為結(jié)構(gòu)化特征加入模型中,進(jìn)而完成推薦。

2.2 基于協(xié)同過濾的個(gè)性化推薦

人們外出就餐、購物、旅游或者看電影時(shí)都會詢問親朋好友或者通過網(wǎng)上評價(jià)進(jìn)行選擇。協(xié)同過濾正是運(yùn)用了這一思想,即采用最近鄰技術(shù),由近鄰用戶的喜好預(yù)測目標(biāo)用戶的喜好進(jìn)行推薦[4]。它是推薦系統(tǒng)中應(yīng)用最早且最成功的技術(shù)之一[5],已經(jīng)成為大數(shù)據(jù)推薦算法的研究熱點(diǎn)和重點(diǎn)。

2.2.1 基于物品的協(xié)同過濾推薦

根據(jù)不同物品之間的相似度和用戶以往的喜好推薦類似物品,例如在酷狗音樂的每一首歌曲下面都有相似歌曲的推薦,而各大購物網(wǎng)站也都有“找相似”等類似商品的推薦。與基于內(nèi)容推薦不同的是,這里所說的相似主要是利用用戶行為的集體智慧,該算法的推薦過程如圖3所示。

2.2.2 基于用戶的協(xié)同過濾推薦

將具有相同愛好的用戶感興趣的項(xiàng)目推薦給目標(biāo)用戶,是至今為止實(shí)際運(yùn)用效果最成功的算法[6],推薦步驟如圖4所示,基于用戶的協(xié)同過濾過程如圖5所示。

2.2.3 基于模型的協(xié)同過濾推薦

利用用戶的歷史項(xiàng)目評價(jià)進(jìn)行學(xué)習(xí)以構(gòu)建用戶模型。用戶模型作為項(xiàng)目的評價(jià)預(yù)測基礎(chǔ),其中應(yīng)用比較成熟的是矩陣分解技術(shù),基于矩陣分解的個(gè)性化推薦是一種學(xué)習(xí)算法,它使用數(shù)學(xué)中的奇異值分解技術(shù),通過矩陣分解使矩陣降維并對大量數(shù)據(jù)進(jìn)行壓縮,能較好地挖掘已知數(shù)據(jù)中的潛在關(guān)系,具有較高的推薦精度,較少的時(shí)間和較低的離線計(jì)算空間復(fù)雜度,但特征挖掘的層次不夠深入,對推薦結(jié)果的解釋性較差。

2.3 基于社交網(wǎng)絡(luò)的個(gè)性化推薦

通過對社交網(wǎng)絡(luò)中用戶的興趣愛好進(jìn)行挖掘分析后進(jìn)行個(gè)性化推薦。著名的社交網(wǎng)站有Facebook和 Twitter、微博、微信和QQ等,在社交網(wǎng)絡(luò)背景下,個(gè)性化推薦不僅要關(guān)注用戶和物品之間的關(guān)系,還要關(guān)注用戶和用戶之間的關(guān)系[7]。

2.4 基于關(guān)聯(lián)規(guī)則的個(gè)性化推薦

分析物品間的相似性及相關(guān)聯(lián)性,建立一套行為規(guī)則進(jìn)行個(gè)性化推薦。它有一定的通用性,可以應(yīng)用于多種領(lǐng)域,但抽取關(guān)聯(lián)規(guī)則比較難,且花費(fèi)時(shí)間較多,另外隨著關(guān)聯(lián)規(guī)則數(shù)量的增加,系統(tǒng)管理的難度也會加大,最典型的應(yīng)用是購物車分析。

2.5 混合個(gè)性化推薦

單一的個(gè)性化推薦算法各有優(yōu)缺點(diǎn),因此可將優(yōu)劣勢互補(bǔ)的推薦方法組合在一起進(jìn)行混合式個(gè)性化推薦,既剔除了單一算法的缺點(diǎn)又提高了推薦效果。在系統(tǒng)架構(gòu)方面,采用在線-離線-近線三段混合系統(tǒng),分別負(fù)責(zé)熱門請求、短期計(jì)算和長期推薦計(jì)算,通過多段的混合推薦可以達(dá)到可靠的推薦結(jié)果,在技術(shù)上有加權(quán)型、切換型、交叉型等多種混合推薦方式?;旌贤扑]在提高精確性的同時(shí)增加了算法的時(shí)空復(fù)雜度,因此要處理好混合推薦算法間的協(xié)調(diào)性[8]。

大數(shù)據(jù)個(gè)性化推薦算法各有優(yōu)缺點(diǎn),具體見表1所列。

3 大數(shù)據(jù)個(gè)性化推薦存在的問題

3.1 大數(shù)據(jù)方面

(1)大數(shù)據(jù)背景下海量數(shù)據(jù)使數(shù)據(jù)的稀疏性和長尾問題劇增[9]。

(2)大數(shù)據(jù)類型的多樣性和復(fù)雜性以及數(shù)據(jù)量的巨大性,使計(jì)算復(fù)雜度成倍增加。

(3)大數(shù)據(jù)本身的價(jià)值密度低,但價(jià)值巨大,如何從海量數(shù)據(jù)中抽取有用的信息進(jìn)行個(gè)性化推薦是個(gè)難題。

(4)推薦系統(tǒng)對時(shí)效性要求較高,可擴(kuò)展性是推薦算法需要解決的難點(diǎn)問題之一。

(5)數(shù)據(jù)安全問題。為了更好地挖掘用戶喜好,需要收集更多的個(gè)人信息,當(dāng)基于大數(shù)據(jù)的推薦系統(tǒng)聚集了大量有價(jià)值的信息時(shí),必然會成為被攻擊的目標(biāo),過度的暴露個(gè)人信息會給用戶的個(gè)人隱私帶來安全隱患,破壞大數(shù)據(jù)推薦系統(tǒng)的發(fā)展。如何在不暴露用戶隱私的情況下進(jìn)行精準(zhǔn)的個(gè)性化推薦是亟待解決的問題。

(6)怎樣對系統(tǒng)中的不良內(nèi)容進(jìn)行過濾,對惡俗非法內(nèi)容進(jìn)行曝光打擊,傳遞正能量也是推薦系統(tǒng)需要關(guān)注的問題。

3.2 推薦算法方面

從推薦算法的對比分析可得每一種推薦算法都有各自的優(yōu)缺點(diǎn)和適用場合,隨著軟硬件技術(shù)的發(fā)展,不管是對原有算法的優(yōu)化,還是對新算法的探索,算法的準(zhǔn)確性和覆蓋面都是值得研究的問題。

3.3 用戶方面

用戶的喜好是多種因素綜合作用的結(jié)果,隨著時(shí)間的推移和年齡的增長,興趣愛好會發(fā)生很大的變化,根據(jù)原有信息進(jìn)行的推薦就有失偏頗,因此怎樣在不同的時(shí)間段抽取不斷變化的興趣愛好,繼而進(jìn)行有效推薦是需要解決的問題。

3.4 冷啟動問題

用戶、物品及系統(tǒng)都存在冷啟動問題,當(dāng)商品上新用戶第一次購買時(shí),由于之前沒有相關(guān)數(shù)據(jù)的積累,因此將嚴(yán)重影響個(gè)性化推薦的準(zhǔn)確性。

3.5 推薦的多樣性問題

推薦的準(zhǔn)確性是算法關(guān)注的目標(biāo),而結(jié)果的多樣性很少被重視,因此推薦結(jié)果越來越同質(zhì)化,降低了用戶的使用體驗(yàn)。

4 大數(shù)據(jù)個(gè)性化推薦的應(yīng)用

(1)個(gè)性化教育

大數(shù)據(jù)促進(jìn)了個(gè)性化教育的快速發(fā)展,我國的教育明確提出發(fā)展學(xué)生的個(gè)性,但目前我們的個(gè)性化教育還處在初級階段,因此立足大數(shù)據(jù)分析實(shí)現(xiàn)學(xué)生的個(gè)性化培養(yǎng)已成為大數(shù)據(jù)個(gè)性化推薦的一個(gè)重要應(yīng)用領(lǐng)域。

(2)個(gè)性化醫(yī)療

基于位置信息的服務(wù)已融入人們的生活,醫(yī)療行業(yè)正在迎來屬于自己的個(gè)性化時(shí)代,各種健康醫(yī)療推薦服務(wù)已成為研究熱點(diǎn),如何在有限的醫(yī)療資源條件下實(shí)現(xiàn)用戶的個(gè)性化醫(yī)療推薦服務(wù)是大數(shù)據(jù)個(gè)性化推薦的另一個(gè)重要應(yīng)用。

(3)電子商務(wù)個(gè)性化

為了進(jìn)行精準(zhǔn)營銷,多數(shù)電子商務(wù)平臺都提供個(gè)性化推薦服務(wù),大數(shù)據(jù)個(gè)性化推薦可以為用戶提供準(zhǔn)確的推薦服務(wù),實(shí)現(xiàn)商家的精準(zhǔn)營銷。

(4)互聯(lián)網(wǎng)金融個(gè)性化

在互聯(lián)網(wǎng)金融領(lǐng)域,各大平臺都有針對個(gè)人定制的千人千面投資推薦。

(5)其他方面的個(gè)性化

隨著互聯(lián)網(wǎng)的發(fā)展,個(gè)性化的推薦將在多媒體娛樂及社交網(wǎng)絡(luò)等領(lǐng)域發(fā)展得越來越好??傊?,大數(shù)據(jù)個(gè)性化的推薦已成為未來教育、醫(yī)療、電子商務(wù)、互聯(lián)網(wǎng)金融及社交網(wǎng)絡(luò)等領(lǐng)域的標(biāo)配。

5 結(jié) 語

大數(shù)據(jù)個(gè)性化推薦時(shí)代已經(jīng)到來,隨著深度學(xué)習(xí)的爆發(fā)及推薦算法的不斷發(fā)展和延伸,基于深度學(xué)習(xí)的個(gè)性化推薦將會得到快速發(fā)展,同時(shí)混合式綜合推薦、群體推薦也將成為未來大數(shù)據(jù)個(gè)性化推薦研究的重要方向。

參 考 文 獻(xiàn)

[1]陳軍,謝衛(wèi)紅,陳揚(yáng)森.國內(nèi)外大數(shù)據(jù)推薦算法領(lǐng)域前沿動態(tài)研究[J].中國科技論壇,2018(1):173-181.

[2]馮浩垠.網(wǎng)絡(luò)化創(chuàng)新外包任務(wù)的知識需求解析研究[D].上海:上海交通大學(xué),2014.

[3]陳敏.個(gè)性化推薦系統(tǒng)研究[D].南京:南京郵電大學(xué),2012.

[4]李艷萍,于麗梅,劉國麗,等.協(xié)同過濾算法的改進(jìn)研究[J].電腦知識與技術(shù),2015,11(7):261-263.

[5]史玉珍,鄭浩.基于協(xié)同過濾技術(shù)的個(gè)性化推薦系統(tǒng)研究[J].電子設(shè)計(jì)工程,2012,20(11):41-44.

[6]楊芹英.電子商務(wù)個(gè)性化推薦系統(tǒng)中協(xié)同過濾技術(shù)研究[C]// 系統(tǒng)工程理論與應(yīng)用:貴州省系統(tǒng)工程學(xué)會第二屆學(xué)術(shù)年會論文集,貴陽:貴州大學(xué)出版社,2011.

[7]丁沂.基于社會網(wǎng)絡(luò)的個(gè)性化推薦系統(tǒng)研究[J].無線互聯(lián)科技,2017(1):37-38.

[8]曹嘉倫.個(gè)性化推薦技術(shù)研究與系統(tǒng)設(shè)計(jì)[D].南京:南京郵電大學(xué),2014.

[9]朱揚(yáng)勇,孫婧.推薦系統(tǒng)研究進(jìn)展[J].計(jì)算機(jī)科學(xué)與探索,2015(5):513-525.

[10]雷名龍.基于阿里巴巴大數(shù)據(jù)的購物行為研究[J].物聯(lián)網(wǎng)技術(shù),2016,6(5):57-60.

县级市| 临颍县| 都匀市| 嘉峪关市| 新营市| 筠连县| 德惠市| 张家川| 宁陵县| 乐至县| 霍州市| 蕉岭县| 黄平县| 牙克石市| 沂水县| 黄龙县| 和龙市| 温州市| 商都县| 泰顺县| 大丰市| 齐河县| 黄山市| 绥芬河市| 尚志市| 漠河县| 剑川县| 光山县| 昔阳县| 安阳县| 德昌县| 张家港市| 图片| 沅陵县| 紫阳县| 长岭县| 婺源县| 和平县| 通许县| 蚌埠市| 龙江县|