国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

推薦算法概述與展望

2019-11-29 18:48徐德華
科技與創(chuàng)新 2019年4期
關鍵詞:相似性協(xié)同深度

俞 偉,徐德華

(同濟大學 經(jīng)濟與管理學院,上海 200092)

隨著科技的飛速發(fā)展與我國改革開放的日趨深入,我國經(jīng)濟正朝著數(shù)字化經(jīng)濟轉型升級。尤其是在電子商務領域,我國已經(jīng)走在世界前列,代表性企業(yè)有淘寶天貓、蘇寧易購等。電子商務已經(jīng)成為了一種不可或缺的生活方式。然而,由于電子商務平臺擁有越來越多的商品,用戶有效獲取到滿意的商品變得越來越困難,產(chǎn)生了信息過載(Information Overload)問題。對于這樣的難題,推薦系統(tǒng)應運而生。它承擔了解決信息過載問題重任,已成為工業(yè)界和學術界的關注焦點,目前已經(jīng)得到了廣泛應用并形成了大量研究成果。本文將對推薦系統(tǒng)領域的國內外研究成果進行梳理,并對未來的研究方向進行展望。

1 協(xié)同過濾推薦算法

協(xié)同過濾的基本思想是,通過協(xié)作的機制,用戶對已瀏覽的商品做出一定回應,并將這些信息記錄下來以實現(xiàn)過濾的目的,從而幫助其他用戶篩選商品。一般的,協(xié)同過濾算法可以劃分為兩大類,即基于記憶的協(xié)同過濾和基于模型的協(xié)同過濾。

1.1 基于記憶的協(xié)同過濾

基于記憶的協(xié)同過濾的實現(xiàn)過程主要包括兩個關鍵步驟:①使用用戶-商品評分數(shù)據(jù)來計算用戶或者商品之間的相似性;②根據(jù)與目標用戶相似性最高的近鄰或與目標商品相似性最高的近鄰來計算目標用戶對某商品的評分?;谟洃浀膮f(xié)同過濾算法包括基于用戶的協(xié)同過濾和基于商品的協(xié)同過濾。

1.1.1 基于用戶的協(xié)同過濾

對于推薦任務來說,評分數(shù)據(jù)僅僅知道一部分,需要對未知的評分進行預測。根據(jù)基于用戶的協(xié)同過濾算法的思想,需要計算用戶兩兩之間的相似性,目前度量用戶相似性的 方 法 主 要 有 皮 爾 森 相 關 系 數(shù) ( Pearson correlation coefficient)、余弦相似性(Cosine similarity)和調整余弦相似性(Adjusted cosine similarity)這三種方式。在用戶相似性計算時,通常會面臨評分尺度、共同評分商品過少、隱式評分數(shù)據(jù)和相似性關系不滿足傳遞性等問題。在獲得目標用戶的最近鄰居之后,接下來就需要計算目標用戶對待預測商品的評分。一般的,采用引入用戶對商品評分的平均數(shù)來有效克服評分尺度不一致問題。此外,還可以通過偏好過濾的方法來消除用戶評分尺度不同的問題[1]。最后,根據(jù)目標用戶對每個待預測商品的評分值,選擇得分最高的幾項商品推薦給該用戶。

1.1.2 基于商品的協(xié)同過濾

隨著電商平臺用戶數(shù)量的不斷增長,基于用戶的協(xié)同過濾需要頻繁更新用戶相似性矩陣,但是被推薦的商品數(shù)量則保持相對穩(wěn)定,商品相似性矩陣更新頻率較低。據(jù)此,基于商品的協(xié)同過濾算法被提出,其基本思路是:根據(jù)用戶對商品的歷史評分數(shù)據(jù),通過計算商品間的相似性來獲得每個商品的最近鄰居集合,然后根據(jù)目標用戶對待預測商品的最近鄰居的評分數(shù)據(jù),預測該商品的評分,最后根據(jù)商品的評分高低,為該用戶推薦商品。

有學者研究認為相比于基于用戶的協(xié)同過濾,基于商品的協(xié)同過濾能夠取得很好的推薦效果[2]。

1.2 基于模型的協(xié)同過濾

基于模型的協(xié)同過濾算法的基本思路是:基于數(shù)據(jù)挖掘與機器學習的方法,利用用戶歷史數(shù)據(jù)構建用戶模型,并據(jù)此對待預測商品進行評分預測,最后為目標用戶產(chǎn)生推薦列表。Breese等在1998年提出了基于概率的協(xié)同過濾算法。隨著機器學習方法的興起,越來越多的模型被應用到協(xié)同過濾算法當中,比如概率相關模型、貝葉斯模型、線性回歸模型和最大熵模型[3]。

2 基于內容的推薦算法

協(xié)同過濾算法只考慮了用戶歷史評分數(shù)據(jù),并不包含用戶本身的特征和商品信息?;趦热莸耐扑]算法可以較為充分地使用這些信息,即把與用戶曾經(jīng)喜歡的商品最相似的商品推薦給他。利用機器學習、數(shù)據(jù)挖掘等技術,對歷史數(shù)據(jù)分析建模,通過模型實現(xiàn)推薦。在對網(wǎng)頁進行分類時,Park等采用Bayse分類器技術[4]。用戶配置文件建模與更新是基于內容的推薦算法中最核心的環(huán)節(jié)之一[5]。Chang等提出了減少更新用戶配置文件代價的方法,即對用戶的長短期興趣進行區(qū)分,短期感興趣的關鍵字被賦于更高的權重[6]。

3 混合推薦算法

協(xié)同過濾推薦算法與基于內容的推薦算法都有各自的優(yōu)缺點,因此在實際應用中,往往把不同的推薦算法進行組合來進行組合推薦,即混合推薦算法[7]。Campos等在混合推薦算法中使用了貝葉斯概率框架,將基于內容的特征和協(xié)作特征相結合,并取得了較好的推薦效果[8]。Burke等提出了一種在異構網(wǎng)絡中引入多重關系的加權混合推薦算法,在不損失推薦精度的情況下提高了推薦的多樣性[9]。Renckes等研究了一種混合基于記憶和基于模型的協(xié)同過濾算法的組合推薦,可以有效地生成商品推薦[10]。在提供相當準確推薦服務的同時,他們使用了隨機化技術來保護用戶的隱私。Sun等提出了一種基于排序學習的混合推薦算法[11]。對于在線旅游產(chǎn)品,Lucas等研究了基于關聯(lián)度的分類方法的旅游推薦系統(tǒng)[12],實驗表明其一定程度上可以消除推薦系統(tǒng)中的限制并提高推薦質量。

通常來講,混合推薦算法融合了協(xié)同過濾和基于內容的推薦算法的優(yōu)點,推薦效果更好,但是算法的復雜度增加了,其運行的時間成本更高。

4 未來的研究方向

隨著時代的發(fā)展和需求的變化,推薦領域面臨數(shù)據(jù)量越來越大,數(shù)據(jù)結構越來越豐富,同時對推薦效果要求越來越高的新情況,學術界和工業(yè)界都十分迫切地想要開發(fā)新的技術和方法來應對這些新的挑戰(zhàn)。與此同時,深度學習技術在最近幾年得到了快速發(fā)展,已經(jīng)成為人工智能和互聯(lián)網(wǎng)大數(shù)據(jù)的一個熱潮。深度學習在計算機視覺、自然語言處理、語音識別和語義分析等研究領域取得了突破性進展[13]。深度學習憑借其具有的深層非線性網(wǎng)絡結構,相對淺層模型具有兩大優(yōu)勢:①理論上可以實現(xiàn)復雜函數(shù)的任意逼近;②可以通過逐層學習方法獲得輸入數(shù)據(jù)的分布式表示。深度學習能夠很好地從樣本中學習到數(shù)據(jù)集的本質特征,進而提升預測或者分類的準確性。由此,將深度學習應用到推薦算法之中成了推薦算法研究的最新方向。

Elkahky等提出了一種基于多視角深度學習方法的跨領域用戶模型,采用深度學習模型,從用戶瀏覽記錄中獲取用戶的特征,并且根據(jù)用戶信息實體與商品信息實體的語義匹配,進而得到用戶的商品推薦列表[14]。Cheng等創(chuàng)新性地將深度模型和廣度模型融合在一起,提出了廣度與深度學習模型,使模型同時具備了泛化能力和記憶能力[15]。Li等提出了一種新的基于注意力的LSTM模型,該模型通過注意機制將主題建模融入到LSTM體系結構中,實現(xiàn)微博的Hashtag推薦[16]。Hidasi等提出了一種基于循環(huán)神經(jīng)網(wǎng)絡的推薦算法來模擬短期會話,以此獲取會話中用戶行為的潛在關系[17]。Geng等使用神經(jīng)網(wǎng)絡模型來獲取社交網(wǎng)絡中用戶與圖像的一致表示[18]。Kim等提出了一種新的上下文感知推薦模型——卷積矩陣因子分解模型,其將概率矩陣分解與卷積神經(jīng)網(wǎng)絡相結合,實驗表明該模型具有非常好的推薦效果[19]。Bansal等提出了基于循環(huán)神經(jīng)網(wǎng)絡的文本推薦算法,該算法利用了三種數(shù)據(jù),包括評分數(shù)據(jù)、文本標簽數(shù)據(jù)和文本內容信息[20]。

深度學習可以從兩個方面改進傳統(tǒng)推薦系統(tǒng):①它可以基于多層非線性映射單元組成的網(wǎng)絡結構,從數(shù)據(jù)集中學習到用戶和商品的深層次特征表示,而通常這些特征表示具備良好的泛化能力;②它可以從多元異構數(shù)據(jù)源中進行特征表示學習,并將不同結構的數(shù)據(jù)映射到同一個隱空間,從而獲得數(shù)據(jù)的統(tǒng)一表征。顯然,對于基于深度學習的推薦算法的研究已經(jīng)成為推薦算法領域的前沿研究。

猜你喜歡
相似性協(xié)同深度
輸入受限下多無人機三維協(xié)同路徑跟蹤控制
四增四減 深度推進
深度思考之不等式
家校社協(xié)同育人 共贏美好未來
隱喻相似性問題的探討
簡約教學 深度學習
“四化”協(xié)同才有出路
京津冀協(xié)同發(fā)展
12個毫無違和感的奇妙動物組合
基于隱喻相似性研究[血]的慣用句
高碑店市| 休宁县| 黑河市| 义马市| 淮阳县| 萍乡市| 康保县| 从化市| 锡林浩特市| 达尔| 秦皇岛市| 深水埗区| 紫阳县| 余庆县| 化德县| 年辖:市辖区| 通许县| 张北县| 肥城市| 武冈市| 茶陵县| 昭平县| 那曲县| 板桥市| 霍城县| 孝义市| 平罗县| 呼和浩特市| 太仓市| 泽库县| 阿拉尔市| 息烽县| 鸡西市| 屯留县| 仪陇县| 江阴市| 南充市| 萨嘎县| 五寨县| 大竹县| 丰都县|