国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

混合推薦算法在電商相關(guān)領(lǐng)域的應(yīng)用研究

2024-01-24 14:36:59黃玉盛祝迎春
電腦知識(shí)與技術(shù) 2023年34期
關(guān)鍵詞:知識(shí)圖譜神經(jīng)網(wǎng)絡(luò)

黃玉盛 祝迎春

摘要:隨著5G移動(dòng)通信技術(shù)、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)等技術(shù)的應(yīng)用與普及,電商相關(guān)領(lǐng)域中傳統(tǒng)的單一推薦算法在應(yīng)對(duì)日益增長(zhǎng)的結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)、多源數(shù)據(jù)的融合和用戶需求多樣等方面逐漸顯露出不足之處。結(jié)合電商相關(guān)領(lǐng)域的現(xiàn)有特點(diǎn)與難點(diǎn)來(lái)進(jìn)行推薦算法的選擇和優(yōu)化改進(jìn),混合推薦算法應(yīng)運(yùn)而生。首先,分析了傳統(tǒng)單個(gè)基于二部圖網(wǎng)絡(luò)的、基于知識(shí)圖譜的和基于神經(jīng)網(wǎng)絡(luò)推薦算法的特征和優(yōu)缺點(diǎn);其次,總結(jié)梳理了以上三種類型的混合推薦算法在電商相關(guān)領(lǐng)域的研究現(xiàn)狀;最后,指出混合推薦算法在電商相關(guān)領(lǐng)域應(yīng)用中遇到的困境、不足和未來(lái)應(yīng)用研究方向,以期為混合推薦算法在電商相關(guān)領(lǐng)域的深入應(yīng)用提供有力支持。

關(guān)鍵詞:混合推薦算法;電商相關(guān)領(lǐng)域;二部圖網(wǎng)絡(luò);知識(shí)圖譜;神經(jīng)網(wǎng)絡(luò)

中圖分類號(hào):TP391.3? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2023)34-0004-05

開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID) :

0 引言

近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展、疫情影響和線下門(mén)店成本高等原因,電商直播憑借互動(dòng)性強(qiáng)、投入成本低和用戶觀看粘性強(qiáng)等特點(diǎn),讓持續(xù)低迷的傳統(tǒng)電商相關(guān)領(lǐng)域重新燃起了“戰(zhàn)火”,一躍成為蓬勃發(fā)展的行業(yè)。在國(guó)家相關(guān)電商相關(guān)領(lǐng)域政策的加持下,電商直播成為新的電商熱點(diǎn)。與此同時(shí),電商相關(guān)領(lǐng)域也面臨著一個(gè)重要的挑戰(zhàn),即消費(fèi)者往往難以從眾多商品中選擇到最適合自己的商品,以實(shí)現(xiàn)精準(zhǔn)地推薦商品,這也是行業(yè)上俗稱的“信息過(guò)載”,而個(gè)性化推薦被認(rèn)為是解決信息過(guò)載問(wèn)題的最有效方法之一。

個(gè)性化推薦算法已在各個(gè)行業(yè)得到廣泛應(yīng)用,尤其是在電商領(lǐng)域發(fā)展迅速,如在提升用戶體驗(yàn)、增加銷量等方面展現(xiàn)出巨大潛力。研究表明個(gè)性化推薦算法幫助電商平臺(tái)推薦的產(chǎn)品更符合個(gè)體用戶的需求、喜好,從而提升購(gòu)買(mǎi)體驗(yàn)。傳統(tǒng)的商品推薦算法往往只考慮了用戶的歷史行為,忽略了其他因素對(duì)用戶行為的影響,導(dǎo)致推薦的結(jié)果缺乏個(gè)性化和多樣性。針對(duì)電商相關(guān)領(lǐng)域的特性和推薦難題,混合推薦算法結(jié)合多種算法的優(yōu)點(diǎn),綜合考慮多種因素對(duì)用戶行為的影響,使推薦結(jié)果更加準(zhǔn)確、個(gè)性化和多樣化。本文針對(duì)混合推薦算法在電商相關(guān)領(lǐng)域中的應(yīng)用研究進(jìn)行梳理和總結(jié),對(duì)已有的推薦算法模型、特點(diǎn)和應(yīng)用優(yōu)勢(shì)進(jìn)行探討,進(jìn)一步梳理分析電商相關(guān)領(lǐng)域中混合推薦算法應(yīng)用遇到的問(wèn)題,以及解決這些問(wèn)題的方法和探討未來(lái)發(fā)展方向。

1 個(gè)性化推薦算法

隨著互聯(lián)網(wǎng)技術(shù)的持續(xù)進(jìn)步,信息技術(shù)領(lǐng)域出現(xiàn)了許多通過(guò)計(jì)算機(jī)傳輸信息的應(yīng)用形式,如電子郵件、個(gè)人網(wǎng)站和在線論壇等。用戶很難在眾多的數(shù)據(jù)中精確而快速地獲取滿足自身需求的內(nèi)容,迫切需要一種技術(shù)能夠幫助自己精準(zhǔn)地獲取信息。1992年施樂(lè)公司的Goldberg等人提出一種融合協(xié)同過(guò)濾思想的推薦系統(tǒng),并將其用于垃圾郵件過(guò)濾。2001年Amazon最早將推薦系統(tǒng)引入電商相關(guān)領(lǐng)域平臺(tái),并帶來(lái)銷售額的大幅度提升,產(chǎn)生了“啤酒與尿不濕”的著名案例。2006年,Netflix在其網(wǎng)站上舉辦了一個(gè)推薦算法競(jìng)賽,目的是鼓勵(lì)研究人員發(fā)現(xiàn)更好的算法來(lái)提升Netflix的推薦效果。競(jìng)賽吸引了來(lái)自世界各地的研究人員,推動(dòng)了推薦算法的發(fā)展。隨著在線平臺(tái)的廣泛應(yīng)用和電子商務(wù)的快速發(fā)展,推薦系統(tǒng)的普及程度迅速提高,推動(dòng)了針對(duì)書(shū)籍、電影、服裝等領(lǐng)域的特定推薦系統(tǒng)的成長(zhǎng)。

目前,隨著“短視頻平臺(tái)+直播”成為流量吸引的風(fēng)口,以及第五代移動(dòng)通信技術(shù)、虛擬現(xiàn)實(shí)以及增強(qiáng)現(xiàn)實(shí)等技術(shù)的進(jìn)一步發(fā)展,能夠增強(qiáng)互動(dòng)性,使內(nèi)容展示更加豐富,這將成為未來(lái)電子商務(wù)的新常態(tài)。個(gè)性化推薦算法的優(yōu)化升級(jí)已成為必然趨勢(shì),不僅可以向用戶提供精準(zhǔn)且多樣化的推薦服務(wù),還有助于進(jìn)一步縮短電商相關(guān)平臺(tái)與用戶之間的距離。因此,需要深入研究個(gè)性化推薦算法,并不斷加強(qiáng)理論和實(shí)際的聯(lián)系,為用戶提供良好應(yīng)用體驗(yàn)。通過(guò)對(duì)現(xiàn)有的推薦算法進(jìn)行梳理分析,本文對(duì)基于二部圖網(wǎng)絡(luò)的、基于知識(shí)圖譜的和基于神經(jīng)網(wǎng)絡(luò)的推薦算法進(jìn)行介紹。

1.1 基于二部圖網(wǎng)絡(luò)的推薦算法

基于二部圖的推薦算法是Aggarwal于1999年率先提出的,其特點(diǎn)將用戶與物品看作二部圖網(wǎng)絡(luò)中的節(jié)點(diǎn),且可以用一個(gè)無(wú)權(quán)無(wú)向的二部網(wǎng)絡(luò)G(U,O,E)表示。該二部網(wǎng)絡(luò)的功能是描述用戶和物品之間的關(guān)系的,其中U、O和E分別為用戶集、物品集和用戶行為的集合。其主要思想是通過(guò)用戶和物品之間的選擇關(guān)系建立用戶-物品的二部圖模型,然后利用資源分配等算法為用戶提供個(gè)性化的推薦[1]。例如協(xié)同過(guò)濾算法(Collaborative Filtering,CF) 、質(zhì)量擴(kuò)散算法(Mass Diffusion,MD) 和熱傳導(dǎo)算法(Heat Conduction,HC) 。

CF算法是最早、最流行且應(yīng)用最廣泛的推薦算法,其基本思想是“物以類聚,人以群分”的群體智慧理念。簡(jiǎn)單來(lái)說(shuō),利用與目標(biāo)用戶有相同興趣和愛(ài)好的用戶的偏好來(lái)進(jìn)行推薦。其主要分為兩類:基于用戶的協(xié)同過(guò)濾(User-based CollaboratIve Filtering,UCF) 和基于物品的協(xié)同過(guò)濾(Item-based Collaborative Filtering,ICF) ,這兩種算法的區(qū)別在于計(jì)算相似度矩陣的參考對(duì)象不同。UCF是以用戶為中心,計(jì)算用戶之間的相似度。ICF是以物品為中心,計(jì)算物品與物品之間的相似性,通過(guò)尋找目標(biāo)用戶購(gòu)買(mǎi)過(guò)的類似物品并推薦給用戶。在計(jì)算用戶與用戶或物品與物品之間的相似性矩陣時(shí),常用的相似性計(jì)算方法有余弦相似度和Jaccard相似系數(shù)。

CF算法在實(shí)踐中被廣泛使用,具有良好的推薦效果。其優(yōu)點(diǎn)是具有推薦準(zhǔn)確度高、良好的擴(kuò)展性且不需要物品的特征屬性,完全依靠用戶的行為數(shù)據(jù)。然而,由于其完全依賴用戶行為數(shù)據(jù),導(dǎo)致冷啟動(dòng)問(wèn)題(新產(chǎn)品或新用戶沒(méi)有足夠的行為數(shù)據(jù))和因用戶行為稀疏而導(dǎo)致的相似度矩陣稀疏。

MD算法采用了物質(zhì)流動(dòng)的思想。將初始能量給目標(biāo)用戶選擇的物品節(jié)點(diǎn),然后根據(jù)物品選擇關(guān)系將物品節(jié)點(diǎn)的能量平均分配給選擇了該物品的用戶節(jié)點(diǎn),再根據(jù)用戶節(jié)點(diǎn)的能量除以用戶節(jié)點(diǎn)的度的規(guī)則,將用戶節(jié)點(diǎn)上的能量傳回物品節(jié)點(diǎn)。經(jīng)過(guò)兩次能量的傳遞,每個(gè)物品節(jié)點(diǎn)上都有相應(yīng)的能量。HC算法與MD算法類似。兩者都給被目標(biāo)用戶選中的物品節(jié)點(diǎn)分配一個(gè)初始能量,但能量傳遞時(shí)的規(guī)則和資源分配方法不同。

基于二部圖的推薦算法是一種常見(jiàn)的推薦算法,它將用戶和物品看作兩個(gè)獨(dú)立的節(jié)點(diǎn)集合,通過(guò)構(gòu)建二部圖模型來(lái)預(yù)測(cè)用戶對(duì)物品的評(píng)分和偏好,可以不受推薦類型的限制,而且魯棒性強(qiáng)、算法易實(shí)現(xiàn)且計(jì)算過(guò)程不復(fù)雜等優(yōu)點(diǎn)。由于其過(guò)于依賴用戶與物品的選擇關(guān)系,即用戶的行為數(shù)據(jù),因此無(wú)法很好地解決冷啟動(dòng)和數(shù)據(jù)稀疏等問(wèn)題。

1.2 基于知識(shí)圖譜的推薦算法

2012年,谷歌公司提出了“知識(shí)圖譜”(Knowledge Graph) 的概念,其初衷是以更智能的形式展現(xiàn)搜索引擎的返回結(jié)果,提升用戶體驗(yàn)。知識(shí)圖譜是一種解釋實(shí)體之間關(guān)系的語(yǔ)義網(wǎng)絡(luò),以結(jié)構(gòu)化的三元組形式描述現(xiàn)實(shí)世界中的事物及其相互關(guān)系,已廣泛應(yīng)用于語(yǔ)義搜索、問(wèn)答、推薦和文本理解與生成等方面。<雷軍,創(chuàng)辦,小米>是一個(gè)知識(shí)三元組,“雷軍”“小米”是現(xiàn)實(shí)世界中的兩個(gè)實(shí)體,在知識(shí)圖譜中表現(xiàn)為兩個(gè)節(jié)點(diǎn),“創(chuàng)辦”是它們兩個(gè)之間的關(guān)系。知識(shí)圖譜中的節(jié)點(diǎn)和邊是多對(duì)多的關(guān)系,該特點(diǎn)使得知識(shí)圖譜中的三元組不僅可以表示實(shí)體之間的關(guān)系,也可以存儲(chǔ)知識(shí)實(shí)體的屬性。

根據(jù)應(yīng)用知識(shí)圖譜的不同形式,分為基于嵌入的方法、基于路徑的方法和混合的方法?;谇度氲闹R(shí)圖譜核心思想是利用知識(shí)表示模型學(xué)習(xí)到知識(shí)圖譜中實(shí)體以及關(guān)系的向量表示,并通過(guò)這種帶有語(yǔ)義信息的向量表示去擴(kuò)充原有的用戶與物品的交互信息,進(jìn)而提高推薦性能[2]。基于路徑的知識(shí)圖譜核心思想是通過(guò)挖掘知識(shí)圖譜中用戶以及物品之間的路徑關(guān)系來(lái)探索知識(shí)圖譜實(shí)體間的連通性去完成推薦[3]?;旌系姆椒ㄊ侵笇⒒谇度氲姆椒ê突诼窂降姆椒ńY(jié)合起來(lái),以提高知識(shí)圖譜的構(gòu)建效率和準(zhǔn)確性?;谇度氲姆椒ㄍǔD軌虿东@實(shí)體和關(guān)系的潛在語(yǔ)義信息,而基于路徑的方法則能夠利用知識(shí)圖譜中的結(jié)構(gòu)信息?;旌戏椒ㄔ噲D結(jié)合這兩種信息,從而獲得更為準(zhǔn)確和魯棒的知識(shí)圖譜表示。因此,引入知識(shí)圖譜可以為推薦系統(tǒng)帶來(lái)三個(gè)方面的好處,一是緩解用戶行為的稀疏性;二是豐富的物品屬性,從而學(xué)習(xí)到更全面的物品表示,提升推薦的準(zhǔn)確性;三是利用知識(shí)圖譜的語(yǔ)義關(guān)系,給出推薦的原因,使推薦結(jié)果具有可解釋性。目前,基于知識(shí)圖譜的推薦算法研究仍面臨一些挑戰(zhàn):一是如何有效建模知識(shí)圖譜的復(fù)雜結(jié)構(gòu)特征;二是如何捕捉知識(shí)圖譜多跳復(fù)雜推理路徑中的語(yǔ)義;三是如何將外部知識(shí)有效注入推薦模型中;四是如何處理跨領(lǐng)域知識(shí)的推薦;五是如何處理海量知識(shí)圖譜的推理和計(jì)算。

1.3 基于神經(jīng)網(wǎng)絡(luò)的推薦算法

神經(jīng)網(wǎng)絡(luò)是一種由多個(gè)神經(jīng)元節(jié)點(diǎn)相互連接而成的計(jì)算模型,其基本原理是對(duì)輸入數(shù)據(jù)的非線性變換來(lái)提取特征,通過(guò)多層的全連接層將這些特征進(jìn)行建模和學(xué)習(xí),挖掘用戶的興趣和偏好特征,根據(jù)這些特征進(jìn)行個(gè)性化推薦。同時(shí),神經(jīng)網(wǎng)絡(luò)可以處理復(fù)雜和動(dòng)態(tài)的推薦任務(wù),并具有良好的泛化能力。常見(jiàn)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN) 、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN) 和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN) 等。DNN將用戶和物品的多種特征(如文本、圖像、點(diǎn)擊歷史等)融合到一個(gè)統(tǒng)一的稠密向量中,這有助于捕捉用戶和物品之間的復(fù)雜交互關(guān)系,從而獲取用戶的特定興趣提高推薦的相關(guān)性。CNN通過(guò)卷積層和池化層來(lái)提取數(shù)據(jù)的空間和時(shí)間特征,再通過(guò)全連接層進(jìn)行分類或預(yù)測(cè)。卷積層通過(guò)局部連接和權(quán)重共享的方式,有效地捕捉輸入數(shù)據(jù)中的局部模式和特征,而池化層則用于減小特征圖的尺寸,并保留關(guān)鍵的特征。CNN能夠自動(dòng)學(xué)習(xí)圖像的特征表示,具有平移不變性和局部連接性等特點(diǎn),能夠處理大規(guī)模的圖像數(shù)據(jù)集,提高分類和檢測(cè)的準(zhǔn)確性。因此,其在圖像分類、目標(biāo)檢測(cè)和圖像生成等任務(wù)中表現(xiàn)出色。RNN通過(guò)引入循環(huán)結(jié)構(gòu),能夠處理可變長(zhǎng)度的序列數(shù)據(jù),并且能夠捕捉序列中的長(zhǎng)期依賴關(guān)系。因此,其在許多序列處理任務(wù)中都有廣泛的應(yīng)用,如語(yǔ)言模型、機(jī)器翻譯、語(yǔ)音識(shí)別、時(shí)間序列預(yù)測(cè)等領(lǐng)域。RNN的每個(gè)時(shí)間步的隱藏狀態(tài)會(huì)根據(jù)輸入和前一個(gè)時(shí)間步的隱藏狀態(tài)進(jìn)行更新,從而實(shí)現(xiàn)信息的傳遞和保存,并通過(guò)學(xué)習(xí)隱藏狀態(tài)的演化過(guò)程,實(shí)現(xiàn)對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行建模和預(yù)測(cè)。而深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的一個(gè)分支,它使用多層神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)數(shù)據(jù)的深層次特征,由于其強(qiáng)大的建模能力和靈活性,已經(jīng)在許多領(lǐng)域取得了顯著的成果,包括語(yǔ)音識(shí)別、圖像處理和自然語(yǔ)言處理等。

基于神經(jīng)網(wǎng)絡(luò)的推薦算法的架構(gòu)通常由三層組成:輸入層、隱藏層和輸出層。輸入層將用戶在一組物品上的歷史行為作為輸入,如評(píng)級(jí)、點(diǎn)擊或購(gòu)買(mǎi)。隱蔽層負(fù)責(zé)處理這些信息并學(xué)習(xí)數(shù)據(jù)中的基本模式。輸出層為每個(gè)物品產(chǎn)生一個(gè)預(yù)測(cè)的評(píng)級(jí),用于為用戶產(chǎn)生推薦。

神經(jīng)元定義如下:

[y=fi=0n-1wixi+b]

公式中,計(jì)算輸入[xi]和權(quán)重[wi]的加權(quán)和[wixi](也成為激活值)。此外,[xi]是輸入數(shù)據(jù)的數(shù)值或其他神經(jīng)元的輸出(如果神經(jīng)元是神經(jīng)網(wǎng)絡(luò)中的一部分)。權(quán)重[wi]是表示輸入強(qiáng)度或神經(jīng)元之間連接強(qiáng)度的數(shù)值,權(quán)重b是一個(gè)稱為偏置的特殊值,其輸入始終為1。使用加權(quán)和的結(jié)果作為激活函數(shù)f的輸入,激活函數(shù)也成為傳遞函數(shù)。激活函數(shù)有很多類型,但都必須滿足非線性這一必要條件,如Sigmoid函數(shù)、Tanh函數(shù)和ReLu函數(shù)等。

1.4 混合推薦算法

為了解決推薦系統(tǒng)中準(zhǔn)確性-多樣性不能同時(shí)兼顧、數(shù)據(jù)稀疏和冷啟動(dòng)等問(wèn)題,眾多的混合算法應(yīng)運(yùn)而生。這些算法采用多種推薦算法相互融合的方式,以達(dá)到最優(yōu)的推薦效果。根據(jù)多種推薦算法的混合方式,分為加權(quán)式、變換式和合并式。其中,加權(quán)式是指分配給推薦算法不同的權(quán)重,將推薦結(jié)果進(jìn)行加權(quán)混合,得到最終的推薦列表,且權(quán)重不唯一,會(huì)隨著推薦結(jié)果或應(yīng)用場(chǎng)景等有所調(diào)整。變換式是指根據(jù)不同的應(yīng)用場(chǎng)景,使用不同的推薦算法,如由UCF切換到ICF。合并式將多個(gè)推薦算法的推薦列表合并成一個(gè)大的推薦列表推薦給用戶,由用戶自行選擇,使大的推薦列表更具有多樣性?;旌贤扑]系統(tǒng)的核心思想與集成學(xué)習(xí)算法類似,通過(guò)整合多個(gè)推薦算法,充分利用各個(gè)算法的優(yōu)勢(shì),可以顯著降低系統(tǒng)性誤差(方差),提升推薦系統(tǒng)的綜合性能。隨著技術(shù)的不斷進(jìn)步和推薦場(chǎng)景的多樣化,混合推薦算法將繼續(xù)發(fā)展,并在實(shí)際應(yīng)用中發(fā)揮更大的作用。

2 電商相關(guān)領(lǐng)域中的混合推薦算法應(yīng)用

隨著信息技術(shù)的迭代升級(jí)、大數(shù)據(jù)時(shí)代的到來(lái)和深度學(xué)習(xí)相關(guān)技術(shù)的蓬勃發(fā)展,傳統(tǒng)的單一推薦算法在應(yīng)對(duì)日益增長(zhǎng)的數(shù)據(jù)和用戶需求方面逐漸顯露出不足之處,電商的推薦系統(tǒng)需要結(jié)合電商相關(guān)領(lǐng)域的特征來(lái)進(jìn)行進(jìn)一步的推薦算法的選擇和優(yōu)化設(shè)計(jì)。以下從基于協(xié)同過(guò)濾、知識(shí)圖譜和神經(jīng)網(wǎng)絡(luò)推薦三個(gè)方面詳細(xì)介紹面向電商相關(guān)領(lǐng)域混合推薦算法應(yīng)用。

2.1 電商相關(guān)領(lǐng)域中基于協(xié)同過(guò)濾的混合推薦算法

隨著社交媒體、移動(dòng)設(shè)備和物聯(lián)網(wǎng)的廣泛應(yīng)用,用戶生成的數(shù)據(jù)變得越來(lái)越豐富和多樣化。推薦算法不僅分析處理用戶的行為數(shù)據(jù),還要處理結(jié)合用戶的社交關(guān)系、地理位置、短視頻和文本內(nèi)容等多種數(shù)據(jù),為了解決以上問(wèn)題,基于協(xié)同過(guò)濾算法通過(guò)結(jié)合深度學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)等技術(shù),克服傳統(tǒng)協(xié)同過(guò)濾算法在數(shù)據(jù)稀疏性和冷啟動(dòng)問(wèn)題上的局限性,提高推薦的準(zhǔn)確性和個(gè)性化程度。上海攜程旅游網(wǎng)絡(luò)技術(shù)有限公司董鑫[4]等人提出了一種混合的協(xié)同過(guò)濾模型,結(jié)合了深度學(xué)習(xí)技術(shù),通過(guò)從評(píng)分矩陣和輔助信息中學(xué)習(xí)到的用戶和物品的潛在因素,實(shí)現(xiàn)協(xié)同過(guò)濾和輔助信息的有效利用。王香蒙[5]等人提出了一種基于圖神經(jīng)網(wǎng)絡(luò)的協(xié)同過(guò)濾推薦算法(Causal Neural Graph Collaborative Filtering,CNGCF) ,將節(jié)點(diǎn)之間的因果關(guān)系注入基于圖協(xié)同過(guò)濾的圖表示學(xué)習(xí)中,從而明確對(duì)目標(biāo)節(jié)點(diǎn)的鄰節(jié)點(diǎn)的因果影響進(jìn)行編碼。這種方法能夠識(shí)別偽相關(guān)性,并揭示用戶偏好的根本原因。何向南[6]等人提出了神經(jīng)網(wǎng)絡(luò)的協(xié)同過(guò)濾(Neural Collaborative Filtering,NCF) ,該算法使用多層感知機(jī)來(lái)建模用戶和物品之間的非線性關(guān)系,將用戶和物品的特征通過(guò)全連接層映射到隱含空間,并通過(guò)內(nèi)積或外積運(yùn)算來(lái)計(jì)算用戶對(duì)物品的興趣,提高了推薦系統(tǒng)的準(zhǔn)確性和效果。

2.2 電商相關(guān)領(lǐng)域中基于知識(shí)圖譜的混合推薦算法

基于嵌入的方法忽略了知識(shí)圖譜的信息連通性,缺少可解釋性,而基于路徑的方法可以為推薦的結(jié)果提供可解釋性,混合的方法將基于嵌入的方法與基于路徑的方法相結(jié)合,充分挖掘兩方面的信息,保證混合的方法具有解釋推薦過(guò)程的能力,具備可解釋性,并成為當(dāng)前的研究的一個(gè)熱點(diǎn)。王宏偉[7]等人提出了一種基于知識(shí)圖譜的深度學(xué)習(xí)模型水波網(wǎng)絡(luò)(RippleNet) ,是第一個(gè)有效將基于嵌入與基于路徑的知識(shí)圖譜結(jié)合起來(lái)的模型。它利用物品的知識(shí)圖譜數(shù)據(jù)一層一層地向外擴(kuò)散后提取節(jié)點(diǎn),然后聚合嵌入,每一層的物品會(huì)影響到在它之后的所有層,并且越往外對(duì)結(jié)果的影響就越小,像水波一樣。該算法能夠有效地捕捉用戶和物品之間的復(fù)雜關(guān)系,并成為現(xiàn)在最熱門(mén)的知識(shí)圖譜推薦算法之一。杜彥輝[8]等人提出了一種基于知識(shí)圖譜的個(gè)性化推薦模型——NRH(Node2vec-side and RippleNet Hybrid Model) 模型。該模型采用了基于協(xié)同過(guò)濾和知識(shí)圖譜的混合推薦方法,通過(guò)使用Node2vec-side進(jìn)行物品畫(huà)像建模,探索物品之間的潛在關(guān)聯(lián)關(guān)系,并將用戶畫(huà)像劃分為靜態(tài)歷史畫(huà)像和動(dòng)態(tài)偏好畫(huà)像,可以用于解決傳統(tǒng)用戶畫(huà)像更新的本地化問(wèn)題。郭慶宇[9]等人系統(tǒng)性地介紹了知識(shí)圖譜的概念和構(gòu)建方法,總結(jié)已有的知識(shí)圖譜推薦系統(tǒng)研究,并對(duì)其進(jìn)行了分類。同時(shí),歸納了知識(shí)圖譜在動(dòng)態(tài)推薦、跨領(lǐng)域推薦、多任務(wù)學(xué)習(xí)和用戶輔助信息等方面的研究應(yīng)用和挑戰(zhàn)。

2.3 電商相關(guān)領(lǐng)域中基于神經(jīng)網(wǎng)絡(luò)的混合推薦算法

由于傳統(tǒng)的推薦算法在面對(duì)大規(guī)模和復(fù)雜的數(shù)據(jù)時(shí),往往存在準(zhǔn)確性不高、個(gè)性化程度不夠等問(wèn)題。而深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的重要分支,其通過(guò)構(gòu)建深層次的神經(jīng)網(wǎng)絡(luò)模型,可以學(xué)習(xí)到更抽象、更高級(jí)的特征表示,進(jìn)一步提升了神經(jīng)網(wǎng)絡(luò)的性能。在推薦系統(tǒng)中,單獨(dú)使用神經(jīng)網(wǎng)絡(luò)可能存在一些挑戰(zhàn),如數(shù)據(jù)稀疏性、冷啟動(dòng)問(wèn)題和解釋性等問(wèn)題。為了克服這些問(wèn)題,將神經(jīng)網(wǎng)絡(luò)與其他推薦算法相結(jié)合,充分發(fā)揮它們各自的優(yōu)勢(shì),從而提高推薦的準(zhǔn)確性和個(gè)性化程度成為趨勢(shì)。張帥[10]等人提出了一種基于深度學(xué)習(xí)的推薦模型VLC-AR(Viewer’s Watching Behavior and Live streaming Content change for Anchor Recommendation) ,其由兩個(gè)主要組成部分組成:一是基于長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM) 的觀眾行為預(yù)測(cè)模型,用于預(yù)測(cè)觀眾的下一步行為,例如繼續(xù)觀看、暫停觀看或跳過(guò)視頻等。該模型利用觀眾的歷史觀看記錄以及當(dāng)前觀看視頻的交互信息來(lái)進(jìn)行預(yù)測(cè),并通過(guò)反向傳播算法(Back Propagation,BP) 進(jìn)行訓(xùn)練。第二個(gè)部分是基于CNN的實(shí)時(shí)視頻內(nèi)容模型,用于捕捉主播實(shí)時(shí)視頻內(nèi)容的特征。該模型利用卷積神經(jīng)網(wǎng)絡(luò)來(lái)提取視頻幀的空間特征,并通過(guò)反向傳播算法進(jìn)行訓(xùn)練。VLC-AR模型將這兩個(gè)部分整合在一起,通過(guò)將觀眾的行為和實(shí)時(shí)視頻內(nèi)容特征進(jìn)行聯(lián)合編碼,實(shí)現(xiàn)對(duì)用戶觀看行為和內(nèi)容變化的準(zhǔn)確預(yù)測(cè),從而提供更個(gè)性化和精準(zhǔn)的主播推薦服務(wù)。吳方照[11]等人構(gòu)建了一個(gè)名為MIND規(guī)模龐大的新聞推薦數(shù)據(jù)集,并在這個(gè)數(shù)據(jù)集上進(jìn)行了大量實(shí)驗(yàn)。新聞推薦的性能在很大程度上依賴于新聞內(nèi)容理解和用戶興趣建模的質(zhì)量。有效的文本表示方法和預(yù)先訓(xùn)練好的語(yǔ)言模型等自然語(yǔ)言處理和機(jī)器學(xué)習(xí)技術(shù)可以有效地提高新聞推薦的性能。

3 電商相關(guān)領(lǐng)域中混合推薦算法存在的問(wèn)題

隨著電商相關(guān)領(lǐng)域行業(yè)的發(fā)展,混合推薦算法逐漸成為電商相關(guān)領(lǐng)域平臺(tái)中的重要組成部分?;旌贤扑]算法通過(guò)綜合考慮用戶的歷史行為、興趣偏好和商品屬性等多個(gè)因素,為用戶提供個(gè)性化的推薦服務(wù),從而增加用戶粘性和銷售額。然而,混合推薦算法在應(yīng)用中仍然面臨著一些問(wèn)題,如數(shù)據(jù)質(zhì)量參差不齊、用戶隱私安全堪憂、算法偏見(jiàn)和冷啟動(dòng)等。

3.1 數(shù)據(jù)質(zhì)量參差不齊

首先,電商相關(guān)領(lǐng)域數(shù)據(jù)質(zhì)量問(wèn)題是影響混合推薦算法效果的重要因素之一。電商相關(guān)領(lǐng)域平臺(tái)涉及大量的商品和用戶數(shù)據(jù),這些數(shù)據(jù)的質(zhì)量直接影響著推薦算法的準(zhǔn)確性和效果。常見(jiàn)的如以下幾點(diǎn):

1) 數(shù)據(jù)缺失與冗余:用戶與商品之間的交互數(shù)據(jù)較少或者用戶沒(méi)有提供足夠的信息,導(dǎo)致數(shù)據(jù)缺失;同時(shí),電商相關(guān)領(lǐng)域平臺(tái)中可能存在大量的重復(fù)數(shù)據(jù),如同一商品的多個(gè)圖片、多個(gè)描述等。

2) 數(shù)據(jù)偏差:由于數(shù)據(jù)來(lái)源的多樣性,電商相關(guān)領(lǐng)域平臺(tái)中的數(shù)據(jù)往往不夠一致。例如商品名稱、商品描述和商品分類等信息可能會(huì)因?yàn)閿?shù)據(jù)來(lái)源不同而存在偏差的情況。

3) 數(shù)據(jù)噪聲:在電商相關(guān)領(lǐng)域平臺(tái)中,一些用戶行為數(shù)據(jù)可能是虛假的或者注水的,例如,惡意刷單、惡意評(píng)價(jià)與標(biāo)簽錯(cuò)誤等。

4) 多源數(shù)據(jù)融合的問(wèn)題:在混合推薦算法中,需要將來(lái)自不同數(shù)據(jù)源或多種類型的數(shù)據(jù)進(jìn)行融合。不同來(lái)源的數(shù)據(jù)可能存在格式不一致、缺失值、噪聲等問(wèn)題,這些問(wèn)題會(huì)對(duì)推薦算法的訓(xùn)練和預(yù)測(cè)產(chǎn)生負(fù)面影響。

對(duì)于前3點(diǎn)問(wèn)題電商相關(guān)領(lǐng)域平臺(tái)需要加強(qiáng)對(duì)數(shù)據(jù)的清洗和預(yù)處理工作,確保數(shù)據(jù)的質(zhì)量和一致性。而針對(duì)第4點(diǎn),常見(jiàn)的多源數(shù)據(jù)融合方法是直接將多種類型數(shù)據(jù)(通常表示成特征向量)進(jìn)行拼接或求和。這類方法操作簡(jiǎn)單,易于實(shí)施,但大多數(shù)情況下無(wú)法取得令人滿意的效果,甚至在某些特定情況下的準(zhǔn)確性還不如直接基于用戶物品評(píng)分?jǐn)?shù)據(jù)做推薦的準(zhǔn)確率高。

3.2 用戶隱私安全堪憂

隨著電商相關(guān)領(lǐng)域平臺(tái)的用戶數(shù)量不斷增加,用戶隱私安全問(wèn)題也變得越來(lái)越重要。在混合推薦算法中,需要從用戶的行為數(shù)據(jù)中提取用戶的偏好和習(xí)慣,這就涉及用戶隱私的保護(hù)問(wèn)題。傳統(tǒng)的推薦算法中,用戶行為數(shù)據(jù)通常會(huì)發(fā)送到服務(wù)器進(jìn)行處理,這會(huì)帶來(lái)一些用戶隱私泄漏的風(fēng)險(xiǎn)。2018年,國(guó)內(nèi)某快遞公司發(fā)生了信息泄露事件,超過(guò)10億條快遞數(shù)據(jù)在網(wǎng)上兜售,包括姓名、手機(jī)號(hào)和家庭住址等。因此,如何在保證用戶隱私不被泄露給推薦系統(tǒng)以及任何第三方的前提下,收集和挖掘用戶數(shù)據(jù)的價(jià)值是大數(shù)據(jù)時(shí)代值得研究的問(wèn)題。

為了保護(hù)用戶的隱私,2016年由谷歌提出的一個(gè)名為聯(lián)邦學(xué)習(xí)的機(jī)器學(xué)習(xí)方法,被廣泛應(yīng)用于推薦系統(tǒng)中。聯(lián)邦學(xué)習(xí)是一種分布式機(jī)器學(xué)習(xí)的方法,它通過(guò)在本地設(shè)備上進(jìn)行模型訓(xùn)練,并在不泄露數(shù)據(jù)的情況下將模型參數(shù)聚合到中央服務(wù)器上,從而保護(hù)用戶隱私。在聯(lián)邦學(xué)習(xí)中,用戶的隱私數(shù)據(jù)不會(huì)離開(kāi)本地設(shè)備,這有效地保護(hù)了用戶的隱私。聯(lián)邦學(xué)習(xí)可以有效地解決用戶隱私泄漏的問(wèn)題,但也存在一些問(wèn)題,如計(jì)算代價(jià)、通信開(kāi)銷、隱私泄露和模型的安全性難以保證等。

3.3 算法偏見(jiàn)

算法偏見(jiàn)是指推薦算法在推薦商品時(shí),受到一些非正常因素的影響,導(dǎo)致推薦的準(zhǔn)確性和公正性受到影響。主要包括:特征偏見(jiàn)或流行度偏見(jiàn)、統(tǒng)計(jì)公平性、遵從偏見(jiàn)和長(zhǎng)期公平性等。特征偏見(jiàn)是主要關(guān)注監(jiān)督學(xué)習(xí)過(guò)于依賴預(yù)定的敏感特征帶來(lái)的不公平問(wèn)題,如放大“性別”與“電影類別”之間的聯(lián)系;流行度偏見(jiàn)是指在推薦商品時(shí),推薦算法可能會(huì)受到商品的熱度、銷量和廣告費(fèi)用等因素的影響,從而導(dǎo)致熱門(mén)商品被過(guò)度推薦,而一些冷門(mén)商品則被忽視;統(tǒng)計(jì)公平性是關(guān)注一個(gè)或一組用戶得到的推薦結(jié)果與用戶興趣的分布是否一致,如一個(gè)小組內(nèi)90%喜歡喝咖啡,10%的人喝茶,那么推薦結(jié)果就是90%是咖啡,10%是茶;遵從偏見(jiàn)是指用戶容易受到其他用戶意見(jiàn)的影響,傾向于放棄個(gè)人獨(dú)特興趣而保持與大多數(shù)人意見(jiàn)的一致,如羊群效應(yīng);長(zhǎng)期公平性是指需要考慮長(zhǎng)期且動(dòng)態(tài)的環(huán)境下如何保證推薦的公平性,如物品的流行度是隨著時(shí)間變化的[12]。

混合推薦算法是通過(guò)結(jié)合多個(gè)推薦算法來(lái)提高準(zhǔn)確度和推薦效果的,但是這些推薦算法本身可能存在偏見(jiàn),從而導(dǎo)致混合推薦算法的偏見(jiàn)。為了解決算法偏見(jiàn)問(wèn)題,采用一些算法技術(shù)來(lái)檢測(cè)和消除算法的偏見(jiàn),如基于約束規(guī)劃的算法,基于主成分分析(Principal Component Analysis,PCA) 的算法和用戶反饋機(jī)制來(lái)糾正算法偏見(jiàn),但仍需要大量的實(shí)驗(yàn)與探索。

3.4 冷啟動(dòng)

冷啟動(dòng)指當(dāng)一個(gè)新用戶或者一個(gè)新商品進(jìn)入電商相關(guān)領(lǐng)域平臺(tái)時(shí),由于缺乏歷史數(shù)據(jù),推薦算法無(wú)法準(zhǔn)確地預(yù)測(cè)用戶的偏好和行為。冷啟動(dòng)可以分為兩類:用戶冷啟動(dòng)和物品冷啟動(dòng)。用戶冷啟動(dòng)指的是當(dāng)一個(gè)新用戶加入系統(tǒng)時(shí),由于缺乏其歷史行為數(shù)據(jù),推薦系統(tǒng)無(wú)法準(zhǔn)確地了解其興趣和偏好,從而無(wú)法提供個(gè)性化推薦。物品冷啟動(dòng)則指的是當(dāng)一個(gè)新的物品加入系統(tǒng)時(shí),由于缺乏與該物品相關(guān)的歷史數(shù)據(jù),推薦系統(tǒng)無(wú)法有效地為用戶推薦該物品。大多數(shù)過(guò)于依賴于用戶和物品的歷史交互數(shù)據(jù)的推薦算法,如協(xié)同過(guò)濾,都會(huì)遇到冷啟動(dòng)的問(wèn)題。該問(wèn)題會(huì)降低推薦算法的覆蓋率和用戶的滿意度。為了解決推薦算法的冷啟動(dòng)問(wèn)題,研究者們提出了許多方法。例如,提出了基于內(nèi)容的推薦、基于內(nèi)容的推薦和協(xié)同過(guò)濾的混合推薦方法。針對(duì)用戶冷啟動(dòng)采用的“千人一面”的方式推薦熱門(mén)物品,或利用附加信息與專家標(biāo)注進(jìn)行推薦。隨著技術(shù)的不斷發(fā)展,深度學(xué)習(xí)、社交網(wǎng)絡(luò)和因果推理等方法被采納,用于挖掘用戶和物品的深度屬性,從而輔助系統(tǒng)借鑒其他相關(guān)任務(wù)或領(lǐng)域的經(jīng)驗(yàn)來(lái)應(yīng)對(duì)冷啟動(dòng)問(wèn)題。

4 總結(jié)

目前,在電商相關(guān)領(lǐng)域中的混合推薦算法近年來(lái)取得了顯著的進(jìn)展,尤其隨著神經(jīng)網(wǎng)絡(luò)算法的提出,深度學(xué)習(xí)混合推薦算法通過(guò)引入更多的商品特征信息,嘗試建模傳統(tǒng)算法無(wú)法處理的數(shù)據(jù)類型,引入更多的商品特征信息提升推薦算法的效果。其中,傳統(tǒng)的協(xié)同過(guò)濾算法與神經(jīng)網(wǎng)絡(luò)的結(jié)合、基于知識(shí)圖譜的混合推薦算法成為當(dāng)下研究的熱點(diǎn)?,F(xiàn)有的電商相關(guān)領(lǐng)域中的混合推薦算法擁有了不錯(cuò)的推薦效果,但仍面臨著一些問(wèn)題,如多源數(shù)據(jù)融合的問(wèn)題、用戶隱私安全問(wèn)題和算法偏見(jiàn)等問(wèn)題沒(méi)有得到較好的解決。未來(lái),電商相關(guān)領(lǐng)域中的混合推薦算法可以聚焦于自動(dòng)選擇最優(yōu)算法、自適應(yīng)調(diào)整算法權(quán)重以及實(shí)時(shí)混合推薦算法等方面,以進(jìn)一步提高推薦的準(zhǔn)確性和個(gè)性化程度。

參考文獻(xiàn):

[1] 黃玉盛.基于協(xié)方差的個(gè)性化推薦算法研究[D].成都:成都理工大學(xué),2020.

[2] LIU C,LI L,YAO X L,et al.A survey of recommendation algorithms based on knowledge graph embedding[C]//2019 IEEE International Conference on Computer Science and Educational Informatization (CSEI).IEEE,2019:168-171.

[3] WANG H W,ZHANG F Z,WANG J L,et al.Exploring high-order user preference on the knowledge graph for recommender systems[J].ACM Transactions on Information Systems,37(3):32.

[4] DONG X,YU L,WU Z H,et al.A hybrid collaborative filtering model with deep structure for recommender systems[C]//Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence.ACM,2017:1309-1315.

[5] WANG X, LI Q, YU D, et al. Neural graph collaborative filtering[C]//Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval,2019:165-174.

[6] HE X N,LIAO L Z,ZHANG H W,et al.Neural collaborative filtering[C]//Proceedings of the 26th International Conference on World Wide Web.Perth Australia.Republic and Canton of Geneva,Switzerland:International World Wide Web Conferences Steering Committee,2017.

[7] WANG H W,ZHANG F Z,WANG J L,et al.RippleNet:propagating user preferences on the knowledge graph for recommender systems[J].ACM, 2018.

[8] NI W K,DU Y H,MA X B,et al.Research on hybrid recommendation model for personalized recommendation scenarios[J].Applied Sciences,2023,13(13):7903.

[9] GUO Q, ZHUANG F, QIN C, et al. A Survey on Knowledge Graph-Based Recommender Systems[J].IEEE Transactions on Knowledge and Data Engineering,2020,50(7):937-954.

[10] ZHANG S,LIU H Y,MEI L,et al.Predicting viewer’s watching behavior and live streaming content change for anchor recommendation[J].Applied Intelligence,2022,52(3):2480-2495.

[11] WU F Z,QIAO Y,CHEN J H,et al.MIND:a large-scale dataset for news recommendation[C]//ACL,2020:3597-3606.

[12] 李東勝,練建勛,張樂(lè),等.推薦系統(tǒng):前沿與實(shí)踐[M].北京:電子工業(yè)出版社,2022.

【通聯(lián)編輯:王 力】

猜你喜歡
知識(shí)圖譜神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
國(guó)內(nèi)圖書(shū)館嵌入式服務(wù)研究主題分析
國(guó)內(nèi)外政府信息公開(kāi)研究的脈絡(luò)、流派與趨勢(shì)
近十五年我國(guó)小學(xué)英語(yǔ)教學(xué)研究的熱點(diǎn)、問(wèn)題及對(duì)策
基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
從《ET&S》與《電化教育研究》對(duì)比分析中管窺教育技術(shù)發(fā)展
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
林周县| 佛冈县| 静海县| 镇赉县| 文水县| 北川| 大方县| 尚志市| 宜兰市| 胶州市| 萨迦县| 涿鹿县| 嘉荫县| 高密市| 教育| 阿勒泰市| 安泽县| 郧西县| 江永县| 兴宁市| 新龙县| 田东县| 都江堰市| 富宁县| 西和县| 克拉玛依市| 凌海市| 宜兰县| 鹤峰县| 乌海市| 西和县| 普陀区| 恩平市| 黄大仙区| 陆丰市| 榆林市| 鲜城| 奈曼旗| 南汇区| 东城区| 黄大仙区|