国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電子商務(wù)個(gè)性化推薦系統(tǒng)綜述

2015-05-30 15:04黃春華寇偉
2015年43期
關(guān)鍵詞:冷啟動(dòng)電子商務(wù)

黃春華 寇偉

作者簡(jiǎn)介:黃春華(1979.03-),女,漢族,四川邛崍,四川郵電職業(yè)技術(shù)學(xué)院,講師,碩士,計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)挖掘。

摘要:目前我國(guó)已經(jīng)迎來了電子商務(wù)蓬勃發(fā)展的時(shí)代,然而面對(duì)海量的商品,客戶難以及時(shí)地找到符合心意的商品。在這種情況下,只有借助于電子商務(wù)個(gè)性化推薦系統(tǒng),電子商務(wù)系統(tǒng)才能準(zhǔn)確及時(shí)地發(fā)現(xiàn)用戶的購(gòu)物需求,并為其提供相關(guān)的產(chǎn)品的信息,同時(shí)還能在最大程度上挖掘用戶的潛在需求。

協(xié)同過濾技術(shù)是目前個(gè)性化推薦系統(tǒng)中廣泛使用的、最成功的推薦算法之一,但也仍然存在許多問題,需要進(jìn)行改善。

關(guān)鍵詞:電子商務(wù);個(gè)性化推薦系統(tǒng);協(xié)同過濾算法;數(shù)據(jù)稀疏性;冷啟動(dòng)

一、研究背景

隨著電子商務(wù)市場(chǎng)的成熟,電子商務(wù)網(wǎng)站中商品數(shù)量與規(guī)模的與日俱增,面對(duì)海量的數(shù)據(jù),客戶常常無法及時(shí)地找到自己滿意的商品。在這種情況下,利用推薦系統(tǒng)為用戶進(jìn)行推薦才能及時(shí)地把握用戶的需求,精準(zhǔn)地為其提供感興趣的、偏好的產(chǎn)品的信息,進(jìn)而挖掘出用戶的潛在需求。

電子商務(wù)個(gè)性化推薦系統(tǒng)(E-commerce Personalized Recommendation System)的定義為:“它是利用電子商務(wù)網(wǎng)站向客戶提供信息和建議,幫助用戶決定應(yīng)該購(gòu)買什么產(chǎn)品,模擬銷售人員幫助客戶完成購(gòu)買過程[2]。也就是在獲取用戶的興趣愛好信息以后,經(jīng)過分析和學(xué)習(xí),向用戶推薦他們可能感興趣的商品、給出信息建議等,進(jìn)而實(shí)現(xiàn)個(gè)性化推薦的服務(wù)。

二、國(guó)內(nèi)外研究現(xiàn)狀

Xerox PARC在1992年推出Typestry系統(tǒng),這是一個(gè)用來對(duì)垃圾和廣告電子郵件實(shí)現(xiàn)過濾并且還能向用戶推薦電子新聞的系統(tǒng),被學(xué)術(shù)界認(rèn)定為第一個(gè)真正的推薦系統(tǒng)。但其缺 陷是需要用戶事先對(duì)系統(tǒng)中的其他用戶比較熟悉和了解。隨著用戶數(shù)量的增加,一個(gè)用戶要去了解熟悉其他大量用戶是不可行的,所以該推薦系統(tǒng)只適合在系統(tǒng)中用戶數(shù)量比較少的情況下使用。

明尼蘇達(dá)大學(xué)的GroupLens Research 實(shí)驗(yàn)室在 1997 年開發(fā)了Movie Lens系統(tǒng)。該系統(tǒng)通過用戶對(duì)電影的評(píng)分?jǐn)?shù)據(jù)來分析他可能喜歡的電影類型、風(fēng)格、演員、導(dǎo)演等,然后預(yù)測(cè)他對(duì)其他電影的接受程度(喜好程度和評(píng)分),從而向用戶推薦合適的電影。

Amazon 的商品推薦系統(tǒng)也叫亞馬遜網(wǎng)絡(luò)書城,其推薦功能強(qiáng)大,用戶瀏覽某一本書的時(shí)候,會(huì)自動(dòng)地向用戶推薦已經(jīng)購(gòu)買過這本書的顧客還購(gòu)買了哪本書,曾為亞馬遜貢獻(xiàn)了20%-30%的創(chuàng)收。Amazon的成功拉開了推薦系統(tǒng)在電子商務(wù)領(lǐng)域內(nèi)被大范圍使用的序幕,各大電商紛紛推出了自己的推薦系統(tǒng)。

此外,國(guó)外比較著名的推薦系統(tǒng)還有Netflix(研究影視和視頻的在線推薦的網(wǎng)站)、AdSense(谷歌的定向廣告推薦系統(tǒng))、Facebook(社區(qū)交友網(wǎng)站,推薦朋友和游戲)等等。

國(guó)內(nèi)對(duì)推薦系統(tǒng)的研究開始于二十一世紀(jì)初,起步晚但發(fā)展迅速,在智能數(shù)據(jù)挖掘、資源數(shù)據(jù)處理的準(zhǔn)確度、統(tǒng)計(jì)數(shù)據(jù)分析等等涉及到推薦系統(tǒng)的各方面的研究都取得了可喜的成果。與此同時(shí),推薦系統(tǒng)的應(yīng)用也在高速增加。在新聞網(wǎng)站、數(shù)字圖書館、網(wǎng)上社區(qū)、電子商務(wù)等領(lǐng)域里,個(gè)性化推薦系統(tǒng)都得到了大量的應(yīng)用,較為著名的有百度競(jìng)價(jià)排名、當(dāng)當(dāng)圖書推薦、淘寶商品推薦(掌柜熱賣、猜你喜歡的)、京東商品推薦、豆瓣影視推薦、中國(guó)人民大學(xué)數(shù)字圖書館等等。很多網(wǎng)站都以多種形式增加或者整合了推薦功能,以改進(jìn)現(xiàn)有服務(wù)。

但由于對(duì)推薦系統(tǒng)方面的理論研究起步的晚,國(guó)內(nèi)的研究水平相比國(guó)外還有不小的差距,主要表現(xiàn)在推薦自動(dòng)化程度低、實(shí)時(shí)性較差和推薦準(zhǔn)確度還不夠高等方面。

三、推薦技術(shù)

目前,推薦系統(tǒng)的研究熱點(diǎn)主要有以下三類:技術(shù)系統(tǒng)的開發(fā)研究、用戶行為研究以及隱私性問題的研究。就算法層面來說,推薦技術(shù)的分類如圖1所示。

1.基于關(guān)聯(lián)規(guī)則的推薦

關(guān)聯(lián)規(guī)則挖掘算法的核心思想是:通過頻繁項(xiàng)集的挖掘,發(fā)現(xiàn)巨量數(shù)據(jù)中所包含著的、滿足一定支持度的規(guī)則模式和這些模式間的相互關(guān)系,它的根本目的是在商品銷售記錄中尋找相關(guān)性,以此來制定銷售策略,最常用的關(guān)聯(lián)規(guī)則挖掘技術(shù)是“支持-置信度”分析。例如電子商務(wù)網(wǎng)站中對(duì)購(gòu)物車當(dāng)中數(shù)據(jù)的分析就是基于關(guān)聯(lián)規(guī)則的。

2.基于內(nèi)容的推薦

基于內(nèi)容的推薦的應(yīng)用系統(tǒng)非常普及,如搜索引擎和電子商務(wù)網(wǎng)站平臺(tái)的搜索欄等。基于內(nèi)容的推薦技術(shù)的關(guān)鍵是對(duì)系統(tǒng)中的用戶或者項(xiàng)目,要先提取并過濾其特征、屬性信息等,再根據(jù)這些數(shù)據(jù)去分析它們同新用戶或項(xiàng)目?jī)?nèi)容的相似性,如果相似程度足夠高就可以用來產(chǎn)生推薦。但是基于內(nèi)容的推薦系統(tǒng)在某些信息屬性特征的提取上是有一定局限的,例如在自動(dòng)提取網(wǎng)頁(yè)中圖像、音視頻等具有多媒體信息的特征屬性時(shí)就存在相當(dāng)大的技術(shù)上的困難。

3.協(xié)同過濾推薦

協(xié)同過濾推薦技術(shù)基本思想是利用“群體的智慧”,因?yàn)椤叭艘匀悍帧?,?duì)于經(jīng)常購(gòu)買同樣商品的顧客們,可以推斷他們具有相似的興趣、偏好,把他們歸為一個(gè)群組,然后根據(jù)用戶組對(duì)項(xiàng)目的喜好來向目標(biāo)用戶進(jìn)行推薦。

協(xié)同過濾推薦算法又可以分為以下三種,分別是:基于用戶的推薦、基于項(xiàng)目的推薦和基于模型的推薦。

基于用戶的協(xié)同過濾推薦的基本原理是:“根據(jù)所有用戶對(duì)項(xiàng)目偏好數(shù)據(jù),通過計(jì)算發(fā)現(xiàn)與目標(biāo)用戶的口味和偏好相似的鄰居用戶組(通常采用計(jì)算“K-鄰居”的算法),然后再基于選擇出的K個(gè)鄰居的歷史偏好信息,向當(dāng)前用戶進(jìn)行推薦[1]?!?/p>

基于項(xiàng)目的協(xié)同過濾在2001年由Sarwar提出,該方法是基于項(xiàng)目之間的相似度來計(jì)算出預(yù)測(cè)值的,其思路是:“先找到待測(cè)項(xiàng)目的若干最近鄰居,然后通過用戶對(duì)待預(yù)測(cè)項(xiàng)的最近鄰居評(píng)分來求出加權(quán)平均值,再以此來逼近目標(biāo)用戶對(duì)待預(yù)測(cè)項(xiàng)目的評(píng)分,然后把預(yù)測(cè)評(píng)分結(jié)果最高的前若干項(xiàng)作為結(jié)果推薦給反饋給用戶[3]。”

基于模型的方法的基本思想可以簡(jiǎn)單的理解為:在離線時(shí)先對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行訓(xùn)練學(xué)習(xí),獲得一個(gè)緊湊的決策模型,根據(jù)該模型對(duì)用戶的未評(píng)分?jǐn)?shù)據(jù)進(jìn)行預(yù)測(cè),然后在在線的狀態(tài)下為目標(biāo)用戶進(jìn)行相關(guān)推薦。其缺點(diǎn)是離線模型的訓(xùn)練花費(fèi)時(shí)間較長(zhǎng),優(yōu)點(diǎn)是預(yù)測(cè)準(zhǔn)確度很高。

4.基于知識(shí)的推薦技術(shù)

基于知識(shí)的推薦技術(shù)在進(jìn)行推薦之前,需要預(yù)先建立好“商品信息知識(shí)庫(kù)”,即對(duì)某個(gè)特定的領(lǐng)域?qū)iT建立的特定知識(shí)庫(kù),適合用來對(duì)一些無法根據(jù)內(nèi)容信息和購(gòu)買的歷史記錄來推薦的商品進(jìn)行預(yù)測(cè)。但產(chǎn)品知識(shí)庫(kù)的構(gòu)建對(duì)基于知識(shí)的推薦系統(tǒng)來說是一個(gè)難道問題,也是瓶頸所在。

5.基于效用的推薦

基于效用的推薦是根據(jù)用戶對(duì)使用項(xiàng)目的效用情況進(jìn)行計(jì)算的,核心思想是為每個(gè)用戶建立一個(gè)效用函數(shù)來建立用戶的資料模型。其優(yōu)點(diǎn)是能把非產(chǎn)品的屬性,比如供應(yīng)商的可靠性、產(chǎn)品的可得性和用戶對(duì)商品的評(píng)價(jià)等因素考慮到效用計(jì)算當(dāng)中。

6.混合推薦

為了提升推薦結(jié)果的有效性,可以將幾種推薦技術(shù)進(jìn)行融合,用組合推薦的方式來為用戶進(jìn)行推薦。目前常見的是把基于內(nèi)容推薦和協(xié)同過濾推薦進(jìn)行組合,比如,先使用這兩種推薦方法各得到一個(gè)推薦結(jié)果,然后將其按照一定的規(guī)則進(jìn)行重組得到最終的推薦結(jié)果。

四、存在的問題及展望

目前個(gè)性化推薦系統(tǒng)中最為成功的算法是協(xié)同過濾算法,被廣泛的使用在各大電子商務(wù)網(wǎng)站中,但也存在許多問題亟需改進(jìn)。

(1)稀疏性問題:協(xié)同過濾實(shí)現(xiàn)推薦,需要通過用戶-項(xiàng)目評(píng)分矩陣對(duì)用戶信息進(jìn)行表示。電子商務(wù)推薦系統(tǒng)一般都要對(duì)大量的數(shù)據(jù)信息進(jìn)行處理,但事實(shí)上,系統(tǒng)中用戶購(gòu)買商品的總量一般只占到網(wǎng)站中的商品總量的百分之一左右,評(píng)價(jià)矩陣的數(shù)據(jù)會(huì)非常的稀疏。這會(huì)帶來一些困難,一是很難找到最近鄰居用戶集,二是進(jìn)行相似性計(jì)算的開銷很大,都會(huì)影響到推薦結(jié)果的精確度。

(2)冷啟動(dòng)問題:該問題可以看成是數(shù)據(jù)稀疏性問題的極端情況。也就是在系統(tǒng)中新出現(xiàn)一個(gè)用戶或項(xiàng)目時(shí),由于系統(tǒng)中還沒有相應(yīng)的購(gòu)買記錄或者用戶評(píng)價(jià),所以不能用協(xié)同過濾來進(jìn)行預(yù)測(cè)評(píng)分和推薦。

(3)實(shí)時(shí)性問題:實(shí)際應(yīng)用中用戶的興趣愛好是隨著時(shí)間變化的,為了確保推薦結(jié)果的準(zhǔn)確性,就要實(shí)時(shí)地更新所有用戶的相似性。

(4)隱私性和魯棒性問題:如何保護(hù)用戶的隱私、阻止惡意用戶操縱推薦系統(tǒng)并防止其在系統(tǒng)數(shù)據(jù)庫(kù)中插入偽造的用戶和評(píng)分,這也是電子商務(wù)領(lǐng)域研究的熱點(diǎn)問題。

(5)現(xiàn)在已經(jīng)進(jìn)入了移動(dòng)互聯(lián)網(wǎng)時(shí)代,“應(yīng)用無處不在”。目前的技術(shù)能為構(gòu)建下一代推薦系統(tǒng)準(zhǔn)備哪些條件?無處不在的應(yīng)用將如何影響推薦算法?這些都是需要研究解決的問題。

結(jié)語(yǔ)

電子商務(wù)的發(fā)展,離不開電子商務(wù)個(gè)性化推薦系統(tǒng)的推動(dòng)。二十多年來,學(xué)者們推薦技術(shù)進(jìn)行了研究并取得了豐碩的成果。協(xié)同過濾算法作為個(gè)性化推薦系統(tǒng)中最為常用算法取得了巨大的成功,但也存在著很多缺陷,如數(shù)據(jù)稀疏性問題、冷啟動(dòng)問題等,仍然需要繼續(xù)研究尋找解決改善的方法。(作者單位:四川郵電職業(yè)技術(shù)學(xué)院)

參考文獻(xiàn):

[1]李聰.電子商務(wù)協(xié)同過濾可擴(kuò)展性研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2010(11):37-44.

[2]Resnick,Varian.Recommender Systems[J].In Communications of the ACM,1997,40(3):56-78.

[3]Sarwar B,Karypis G,Konstan J,Riedl J.Item-Based collaborative filtering recommendation algorithms[C].In:Proc.of the 10th Intl Conf.on World Wide Web.ACM Press.2001:285-295.

[4]劉建國(guó),周濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展.2009(19):1-15.

猜你喜歡
冷啟動(dòng)電子商務(wù)
輕型汽油車實(shí)際行駛排放試驗(yàn)中冷啟動(dòng)排放的評(píng)估
Evaluation of Arctic Sea Ice Drift and its Relationship with Near-surface Wind and Ocean Current in Nine CMIP6 Models from China
2025年我國(guó)農(nóng)村電子商務(wù)交易額達(dá)到2.8萬(wàn)億元
基于PEMS試驗(yàn)的重型柴油車?yán)鋯?dòng) 排放特征研究
基于學(xué)習(xí)興趣的冷啟動(dòng)推薦模型
質(zhì)子交換膜燃料電池冷啟動(dòng)研究綜述①
《電子商務(wù)法》如何助力直銷
電子商務(wù)
關(guān)于加快制定電子商務(wù)法的議案
電子商務(wù)人的核心能力