国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于耦合CNN評(píng)分預(yù)測(cè)模型的個(gè)性化商品推薦

2020-05-09 02:59:48韓曉龍顧兆旭徐孟陽(yáng)劉志國(guó)
關(guān)鍵詞:卷積矩陣預(yù)測(cè)

馮 勇,韓曉龍,顧兆旭,王 龍,徐孟陽(yáng),劉志國(guó)

1(遼寧大學(xué) 信息學(xué)院,沈陽(yáng) 110036)2(遼寧輕工職業(yè)學(xué)校 計(jì)算機(jī)系,遼寧 大連 116100)3(中國(guó)石油天然氣股份有限公司 華北化工銷售公司,鄭州 450000)

1 引 言

隨著多媒體技術(shù)的迅猛發(fā)展與移動(dòng)互聯(lián)的廣泛應(yīng)用,互聯(lián)網(wǎng)用戶數(shù)量得到急速增加.根據(jù)IDC報(bào)告顯示,進(jìn)入2020年后全球的數(shù)據(jù)總量預(yù)計(jì)超過(guò)40ZB,人類社會(huì)將正式進(jìn)入“信息大爆炸”時(shí)代[1].用戶的角色由傳統(tǒng)的信息消費(fèi)者變成信息提供者,在此轉(zhuǎn)變過(guò)程中用戶間的信任關(guān)系顯得尤為重要,用戶往往更愿意接受自己相信的人提供的信息.在電子商務(wù)的商品推薦過(guò)程中用戶也更愿意選擇自己信任用戶給予好評(píng)或推薦的商品[2].

Web2.0技術(shù)的興起使得用戶可以自由地發(fā)表對(duì)商品的評(píng)論,相對(duì)于稀疏的評(píng)分?jǐn)?shù)據(jù),如何從商品的在線評(píng)論短文本中挖掘代表用戶興趣、喜好的主題,已經(jīng)成為眾多學(xué)者研究的熱點(diǎn).在線評(píng)論反映的是用戶對(duì)購(gòu)買商品或享受服務(wù)后最直觀和最真實(shí)的感受,包含著用戶對(duì)商品正向和負(fù)向的客觀評(píng)價(jià).電商平臺(tái)可以依據(jù)評(píng)論數(shù)據(jù)發(fā)現(xiàn)商品的受歡迎程度,以便發(fā)現(xiàn)質(zhì)量差或令客戶不滿意的商品,對(duì)商品采購(gòu)以及經(jīng)營(yíng)策略做出正確地調(diào)整;也可以依據(jù)評(píng)論發(fā)現(xiàn)客服、物流等相關(guān)服務(wù)出現(xiàn)的問(wèn)題,并及時(shí)做出應(yīng)對(duì)管理[3].

傳統(tǒng)的推薦方法中普遍存在因評(píng)分?jǐn)?shù)據(jù)稀疏而導(dǎo)致推薦準(zhǔn)確率低等問(wèn)題,因而很多學(xué)者考慮分析用戶或項(xiàng)目的其他相關(guān)信息來(lái)進(jìn)行評(píng)分的數(shù)據(jù)填充,以提高推薦準(zhǔn)確率[4].因此,在商品的個(gè)性化推薦系統(tǒng)中,大量存在的評(píng)論信息可以充分反應(yīng)用戶對(duì)所購(gòu)買物品的喜好.因此,本文利用構(gòu)建的耦合CNN模型對(duì)評(píng)論文本進(jìn)行分析,從中提取商品特征、預(yù)測(cè)用戶對(duì)商品的評(píng)分而生成相應(yīng)的預(yù)測(cè)評(píng)分矩陣,最終將高預(yù)測(cè)評(píng)分商品推薦給用戶.

2 相關(guān)工作

2.1 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是在人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上發(fā)展起來(lái)的一種具有卷積操作的特殊前饋神經(jīng)網(wǎng)絡(luò),已經(jīng)在語(yǔ)音識(shí)別、圖像處理和自然語(yǔ)言處理等方面得到廣泛應(yīng)用[5].典型的CNN模型主要包括:輸入層、隱含層(卷積層、池化層、全連接層)、輸出層.卷積層和池化層的組合可以在隱含層中多次出現(xiàn).

隱含層各組成部分功能如下:

1)卷積層:對(duì)輸入的數(shù)據(jù)進(jìn)行特征提取操作,由m個(gè)卷積核(神經(jīng)元)組成,通過(guò)對(duì)輸入層過(guò)來(lái)的數(shù)據(jù)進(jìn)行卷積運(yùn)算得到新特征.

2)池化層:在特征映射上的最大池化操作,取最大值作為對(duì)應(yīng)于這個(gè)特定內(nèi)核的特征.這種方案可以處理不同長(zhǎng)度的文本.在最大值合并操作之后,卷積結(jié)果被減少為固定大小的向量.

3)全連接層:將經(jīng)過(guò)多個(gè)卷積層和池化層提取出來(lái)的特征,利用全連接網(wǎng)絡(luò)進(jìn)行特征分類,最終得到一個(gè)關(guān)于輸入層的概率分布函數(shù).

2.2 數(shù)據(jù)稀疏的處理

針對(duì)數(shù)據(jù)稀疏問(wèn)題,Sarwar Badrul等人[6]最早提出了基于項(xiàng)目的協(xié)同過(guò)濾算法,該方法比基于用戶的推薦方法更加穩(wěn)定,并且在實(shí)驗(yàn)中加入奇異值分解,以此降低高維數(shù)據(jù)維度,填補(bǔ)稀缺數(shù)據(jù),較好地解決了數(shù)據(jù)稀疏問(wèn)題,但推薦準(zhǔn)確率卻不盡人意.

Koren Yehuda等人[7]提出采用矩陣分解技術(shù)來(lái)降低數(shù)據(jù)維度,解決數(shù)據(jù)稀疏問(wèn)題,并成為近年來(lái)推薦系統(tǒng)研究的熱點(diǎn).該方法通過(guò)將用戶和商品特征分別映射到不同的低維空間中,將用戶-評(píng)分矩陣降維,得到用戶矩陣和商品矩陣,以兩個(gè)低維矩陣乘積的形式表示原來(lái)的高維矩陣.

程芳等人[8]考慮傳統(tǒng)用戶相似度計(jì)算存在的問(wèn)題,提出了直接相似度與間接相似度的概念,然后引入關(guān)鍵人物權(quán)重計(jì)算最終評(píng)價(jià)值.該算法在一定程度上解決了稀疏性問(wèn)題,但關(guān)鍵人物的選取以及在缺少關(guān)鍵人物情況下,該解決方案尚存問(wèn)題.

李全等人[9]在解決信任數(shù)據(jù)稀疏時(shí),提出了一種融合信任度與項(xiàng)目關(guān)聯(lián)度的推薦方法,其關(guān)鍵在于將用戶信任矩陣進(jìn)行分解降維,并引入用戶影響力,以此提出局部信任度和全局信任度的概念,并通過(guò)項(xiàng)目相關(guān)度與流行度進(jìn)行模型構(gòu)建,以此提高推薦的效果.

隨著深度學(xué)習(xí)在圖像處理、自然語(yǔ)言處理和語(yǔ)音識(shí)別等領(lǐng)域的迅猛發(fā)展,學(xué)者研究的焦點(diǎn)轉(zhuǎn)移到將深度學(xué)習(xí)與推薦系統(tǒng)相融合,以此來(lái)構(gòu)建更加符合用戶需求的個(gè)性化推薦模型.Oord等人[10]提出了基于CNN模型的音樂(lè)推薦系統(tǒng),通過(guò)訓(xùn)練CNN模型,學(xué)習(xí)用戶的歷史收聽(tīng)記錄和音樂(lè)的音頻信號(hào),將兩種記錄通過(guò)CNN模型映射到共享空間,來(lái)尋找用戶和音樂(lè)的隱式表達(dá),進(jìn)而為用戶推薦其感興趣的音樂(lè),在一定程度上緩解了數(shù)據(jù)稀疏為推薦系統(tǒng)帶來(lái)的制約.

受到上述推薦算法的啟發(fā),本文構(gòu)建了由用戶網(wǎng)絡(luò)和商品網(wǎng)絡(luò)組成的耦合CNN模型,利用該模型進(jìn)行商品推薦時(shí),將用戶評(píng)論和商品評(píng)論文本輸入到模型中,利用對(duì)評(píng)論數(shù)據(jù)的分析來(lái)提取商品的特征信息,同時(shí)模擬用戶對(duì)感興趣商品進(jìn)行評(píng)分的行為來(lái)生成商品的預(yù)測(cè)評(píng)分矩陣.本文所提的商品推薦策略并不依賴于原始評(píng)分?jǐn)?shù)據(jù),而是使用CNN模型形成的預(yù)測(cè)評(píng)分矩陣來(lái)生成推薦列表,因此即使原始評(píng)分矩陣為稀疏矩陣也不會(huì)影響本文算法的推薦效率.最后通過(guò)實(shí)驗(yàn)驗(yàn)證,本文所提的基于預(yù)測(cè)評(píng)分的商品推薦算法與使用原始評(píng)分矩陣進(jìn)行商品推薦的傳統(tǒng)算法在準(zhǔn)確率上具有明顯的優(yōu)勢(shì).

3 基于耦合CNN評(píng)分預(yù)測(cè)模型

模型中使用用戶評(píng)論和商品評(píng)論模擬用戶行為和商品屬性,將學(xué)習(xí)到的用戶和商品特征匯集于共享層,共享層使相互獨(dú)立的不同特征交互后形成商品的評(píng)分預(yù)測(cè).

3.1 耦合CNN評(píng)分預(yù)測(cè)模型結(jié)構(gòu)

基于耦合CNN評(píng)分預(yù)測(cè)模型結(jié)構(gòu)如圖1所示.

圖1 耦合CNN評(píng)分預(yù)測(cè)模型Fig.1 Scoring prediction model of coupled CNN

該模型由一個(gè)用戶網(wǎng)絡(luò)和一個(gè)商品網(wǎng)絡(luò)耦合并行而成.該耦合CNN模型由三層構(gòu)成:

1)輸入層:將用戶評(píng)論數(shù)據(jù)和商品評(píng)論數(shù)據(jù),分別從兩個(gè)并行網(wǎng)絡(luò)的輸入層輸入.

2)隱含層:包括卷積層、池化層和全連接層,用于對(duì)輸入的評(píng)論數(shù)據(jù)進(jìn)行字向量角度的語(yǔ)義分析,使用多個(gè)并行的卷積層,利用多個(gè)大小不同的卷積核對(duì)句子進(jìn)行特征提取,并產(chǎn)生相應(yīng)的商品特征輸出.

3)共享層:匯集來(lái)自兩個(gè)并行網(wǎng)絡(luò)輸出的用戶特征與商品特征后,使用機(jī)器學(xué)習(xí)算法(Factorization Machine,F(xiàn)M)進(jìn)行商品評(píng)分預(yù)測(cè).

3.2 句子表示

目前,評(píng)論的處理方式大都采用詞袋模型[11],但詞袋模型不考慮句子中詞語(yǔ)的順序,往往會(huì)將評(píng)論隱含的主題提取出完全相反的結(jié)果.例如,“正義最終打敗了邪惡”和“邪惡最終打敗了正義”,在詞袋模型中擁有完全相同的表示方法,但實(shí)際卻是完全相反的表達(dá)[12].另外,在進(jìn)行評(píng)論主題特征提取方面,目前主要做法是對(duì)句子進(jìn)行分詞處理,但現(xiàn)在的短文本通常是噪聲大、網(wǎng)絡(luò)用語(yǔ)多且沒(méi)有足夠的上下文信息作參考[13],使用傳統(tǒng)分詞方法常常會(huì)產(chǎn)生歧義或者無(wú)法切分分詞.針對(duì)這些問(wèn)題,本文將從字向量的角度,對(duì)句子進(jìn)行處理,學(xué)習(xí)評(píng)論的主題特征,以提高評(píng)分預(yù)測(cè)準(zhǔn)確率.

從字角度來(lái)解析句子,就是將單個(gè)字作為句子的基本組成單位,對(duì)單個(gè)字進(jìn)行字向量級(jí)別的訓(xùn)練.例如,“我喜歡學(xué)習(xí)”,分詞處理結(jié)果是“我-喜歡-學(xué)習(xí)”,分字處理的結(jié)果便是“我-喜-歡-學(xué)-習(xí)”.

在對(duì)句子進(jìn)行處理時(shí),往往會(huì)碰到兩方面的問(wèn)題:一是不同的句子其長(zhǎng)度不同,最后得到的特征向量長(zhǎng)度也不同;二是句子中的主題特征信息將會(huì)出現(xiàn)在句首、句中和句尾等不同的地方[14,15].利用耦合CNN模型進(jìn)行處理時(shí),可以有效地解決上述問(wèn)題,問(wèn)題一的解決是通過(guò)在隱含層進(jìn)行最大池化操作,從而得到固定長(zhǎng)度的主題特征向量;問(wèn)題二的解決是采用多個(gè)大小不同的卷積核對(duì)句子進(jìn)行處理,卷積操作后可以得到句子中所有字的局部特征[16].

(1)

3.3 模型評(píng)分預(yù)測(cè)過(guò)程

(2)

其中*是卷積運(yùn)算符,bi是一個(gè)偏置項(xiàng),f是一個(gè)激活函數(shù)——線性整流函數(shù)(ReLU),通過(guò)加入ReLU可以避免了梯度爆炸和梯度消失問(wèn)題,加速隨機(jī)梯度下降的收斂速度,大大提高訓(xùn)練的速度[17].f的選擇我們采用斜坡函數(shù)如式(3)所示.

f(x)=max{0,x}

(3)

圖2 句子處理過(guò)程Fig.2 Sentence processing

接著,將在特征映射層上進(jìn)行最大池化操作,取操作后的最大值作為對(duì)應(yīng)的這個(gè)特定卷積內(nèi)核的特征.這種方法可以處理不同長(zhǎng)度的文本,在最大合并操作之后,卷積結(jié)果被減少為固定大小的向量[18],如式(4)所示.

(4)

通過(guò)從一個(gè)卷積核中提取一個(gè)特征的過(guò)程可知,卷積層的輸出向量經(jīng)過(guò)最大池化操作時(shí),只會(huì)選取句子中特征最強(qiáng)的局部信息,而把其他信息拋棄,所以該模型使用多個(gè)濾波器來(lái)獲得各種特征,卷積窗口t的大小不同,致使學(xué)習(xí)到的局部信息是不同的,利用多個(gè)并行的卷積層,可以得到不同的n-gram信息[19],如公式(5)所示.

R={R1,R2,R3,…,Rj}

(5)

其中,R表示所有卷積核輸出特征的集合,j為卷積層中進(jìn)行卷積操作的卷積核數(shù).

來(lái)自最大池化層的結(jié)果被傳遞到具有權(quán)重矩陣W的全連接層.如公式(6)所示,全連接層的輸出Xu被認(rèn)為是用戶u的特征.

Xu=f(W×R+b)

(6)

上述過(guò)程是以用戶網(wǎng)絡(luò)為例得到用戶特征,同樣,將商品評(píng)論由商品網(wǎng)絡(luò)輸入,將會(huì)得到商品特征Yc,兩個(gè)網(wǎng)絡(luò)并行運(yùn)行,最終輸出用戶特征Xu和商品特征Yc.

這些輸出特征雖然是從用戶評(píng)論和商品評(píng)論中得到的,但它們存在于兩個(gè)網(wǎng)絡(luò)的不同映射空間中,兩者之間并不具有可比性.因此,為了將它們映射到相同的特征空間,我們引入了一個(gè)共享層來(lái)耦合用戶網(wǎng)絡(luò)輸出和商品網(wǎng)絡(luò)輸出,將Xu和Yc連接成單個(gè)向量Z=(Xu,Yc).為了模擬Z中的所有相互獨(dú)立的用戶與商品變量之間的交互關(guān)系,我們引入FM算法進(jìn)行相應(yīng)的評(píng)分預(yù)測(cè).因此,給定N個(gè)訓(xùn)練樣本,我們可以用公式(7)進(jìn)行訓(xùn)練.

(7)

其中,S表示評(píng)分預(yù)測(cè),w0表示模型參數(shù),wj表示全局偏置,k表示分解所得隱因子向量維度,vj,fvi,f分別為特征j和i對(duì)應(yīng)隱向量的一個(gè)隱因子.

最終,對(duì)于預(yù)測(cè)的商品評(píng)分進(jìn)行由高到低的排序,采用top-k的方法選取前k個(gè)高評(píng)分商品推薦給用戶.

3.4 模型訓(xùn)練

本文通過(guò)公式(7)來(lái)訓(xùn)練耦合的CNN評(píng)分預(yù)測(cè)網(wǎng)絡(luò).對(duì)公式(7)中函數(shù)y求關(guān)于z的偏導(dǎo)數(shù)[20],得到公式(8).

(8)

對(duì)于不同層中的其他參數(shù)的導(dǎo)數(shù)可以通過(guò)鏈?zhǔn)椒▌t進(jìn)行計(jì)算.給定一組由N個(gè)樣本組成的訓(xùn)練集T,通過(guò)RMSprop梯度下降法進(jìn)行模型優(yōu)化[21].該方法對(duì)于梯度的絕對(duì)值自適應(yīng)地控制步長(zhǎng),通過(guò)將每個(gè)權(quán)重的更新值按其梯度范數(shù)的運(yùn)行平均值進(jìn)行縮放來(lái)實(shí)現(xiàn).

4 實(shí)驗(yàn)分析

4.1 實(shí)驗(yàn)環(huán)境配置

本文實(shí)驗(yàn)環(huán)境具體的配置如表1所示.

表1 實(shí)驗(yàn)環(huán)境配置
Table 1 Configure of experiment environment

名稱規(guī) 格硬盤SATA 1TB 7200轉(zhuǎn)內(nèi)存8G DDRIII 1600CPUCORE I5-4590 3.3GHz 6MB緩存操作系統(tǒng)Windows 7 64位系統(tǒng)編程平臺(tái)JetBrains PyCharm 2017編程語(yǔ)言Python

4.2 從字角度劃分句子的有效性實(shí)驗(yàn)

在評(píng)論處理方面,本文選用新浪微博數(shù)據(jù)對(duì)本文提出的利用耦合CNN從字角度劃分文本的方法進(jìn)行有效性驗(yàn)證.該數(shù)據(jù)集是從2012年11月26日至2012年12月28日之間的微博數(shù)據(jù)中隨機(jī)爬取的75740條記錄組成實(shí)驗(yàn)數(shù)據(jù)集,主題分布如表2所示.

表2 微博數(shù)據(jù)主題分布
Table 2 Microblog data topic distribution

主題數(shù)量主題數(shù)量明星7305政治6427體育8692旅游7305數(shù)碼7850汽車7563游戲7365寵物6387時(shí)尚8529財(cái)經(jīng)8047

本文選用余弦相似度作為評(píng)價(jià)標(biāo)準(zhǔn),對(duì)比實(shí)驗(yàn)分別從字角度和詞角度劃分句子,相似度計(jì)算如式(9)所示.

(9)

相似度計(jì)算結(jié)果如表3所示.

實(shí)驗(yàn)結(jié)果可以看出,評(píng)論文本從字角度作為原始特征取得了更好的實(shí)驗(yàn)效果.原因主要在于:字級(jí)別特征的粒度比詞級(jí)別的粒度小,字角度向量相比于詞角度向量可以學(xué)習(xí)到更加具體的特征.

4.3 模型重要參數(shù)的選取實(shí)驗(yàn)

在實(shí)驗(yàn)中選擇了兩個(gè)聚數(shù)力的Amazon公開數(shù)據(jù)集1對(duì)模型進(jìn)行評(píng)估,Amazon Food(642M)抓取了截止2012年10月份在Amazon網(wǎng)站上的568454條數(shù)據(jù),包括用戶、評(píng)論內(nèi)容、食品評(píng)分等9項(xiàng)數(shù)據(jù);Unlocked Mobile phone(141M)抓取了在Amazon網(wǎng)站上的40萬(wàn)條數(shù)據(jù),包括用戶、無(wú)鎖移動(dòng)手機(jī)的價(jià)格、用戶評(píng)分、評(píng)論等8項(xiàng)數(shù)據(jù).實(shí)驗(yàn)中選擇數(shù)據(jù)集的70%作為訓(xùn)練集,10%作為驗(yàn)證集,用于調(diào)整模型的超參數(shù)和用于對(duì)模型的能力進(jìn)行初步評(píng)估,20%作為測(cè)試集.實(shí)驗(yàn)選擇均方誤差(MSE)作為評(píng)價(jià)標(biāo)準(zhǔn),如式(10)所示.

(10)

表3 余弦相似度比較
Table 3 Comparisons of cosine similarity

詞語(yǔ)詞角度字角度詞語(yǔ)余弦相似度詞角度字角度手機(jī)手+機(jī)華為0.6670.682球鞋球+鞋耐克0.6730.691酸奶酸+奶牛奶0.8110.842電腦電+腦聯(lián)想0.6210.601汽車汽+車現(xiàn)代0.6220.664

潛在因子X(jué)u和Yc的選擇實(shí)驗(yàn),結(jié)果如圖3所示.

圖3 潛在因子數(shù)量Fig.3 Number of potential factors

在圖3中顯示了模型在兩個(gè)所選數(shù)據(jù)集上的性能,潛在因子數(shù)量的變化范圍從5到100.從結(jié)果可以看出,當(dāng)潛在因子的數(shù)量大于50時(shí),模型的性能幾乎不變.因此,實(shí)驗(yàn)中設(shè)置潛在因子X(jué)u=Yc=40.

卷積核數(shù)量m的選擇實(shí)驗(yàn),結(jié)果如圖4所示.

圖4 卷積核數(shù)量Fig.4 Number of convolution cores

圖4中,m的取值范圍從10到400,觀察模型在兩個(gè)所選數(shù)據(jù)集上的性能可以看出:當(dāng)卷積核數(shù)量m大于100時(shí),模型的性能將不再提高.因此,實(shí)驗(yàn)中卷積核數(shù)目m=100.實(shí)驗(yàn)中其他超參數(shù)的設(shè)置如下:卷積窗口t=3,維度c=400,學(xué)習(xí)率λ=0.001和batch_szie=100.

4.4 模型評(píng)分預(yù)測(cè)效果對(duì)比

在對(duì)預(yù)測(cè)評(píng)分?jǐn)?shù)據(jù)推薦準(zhǔn)確性進(jìn)行評(píng)價(jià)的實(shí)驗(yàn)中,實(shí)驗(yàn)數(shù)據(jù)集仍采用Food和Unlocked Mobile phone數(shù)據(jù)集.首先,使用本文所提出的CNN評(píng)分預(yù)測(cè)模型對(duì)數(shù)據(jù)集中的評(píng)論文本進(jìn)行分析得到預(yù)測(cè)評(píng)分矩陣,然后依據(jù)評(píng)分矩陣將評(píng)分高的商品推薦給用戶.對(duì)比算法中的LDA方法同樣也是利用文本分析生成評(píng)分矩陣進(jìn)行推薦,而其他算法的推薦依舊是基于原始評(píng)分矩陣.因?yàn)楸疚姆椒ㄔ谕扑]商品時(shí)不使用原始評(píng)分矩陣,因此即使原始評(píng)分為稀疏數(shù)據(jù)集,對(duì)本文算法的推薦結(jié)果亦無(wú)任何影響.

評(píng)價(jià)評(píng)分預(yù)測(cè)結(jié)果的指標(biāo)除了采用MSE,還使用均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)作為評(píng)價(jià)標(biāo)準(zhǔn),如式(11)、式(12)所示.

(11)

(12)

在參數(shù)確定的情況下,將本文評(píng)分預(yù)測(cè)模型與MF、LDA、SVD、SVD++、LFM等評(píng)分預(yù)測(cè)方法進(jìn)行對(duì)比.在Food和Unlocked Mobile phone兩份數(shù)據(jù)集上以MSE、RMSE及MAE為指標(biāo)進(jìn)行對(duì)比,如圖5所示,本文模型在各指標(biāo)的對(duì)比上均優(yōu)于其他方法.

圖5 不同評(píng)分預(yù)測(cè)模型對(duì)比Fig.5 Comparison of different scoring prediction models

通過(guò)圖5的對(duì)比結(jié)果可以看出,本文模型在評(píng)分預(yù)測(cè)的各個(gè)指標(biāo)上均優(yōu)于其他對(duì)比方法.在指標(biāo)MSE上,本文方法在Food數(shù)據(jù)集上提高了4.8%,在Unlocked Mobile phone數(shù)據(jù)集上提高了4.9%,平均提高了4.8%;在指標(biāo)RMSE上,本文方法在Food數(shù)據(jù)集上提高了2.5%,在Unlocked Mobile phone數(shù)據(jù)集上提高了6.3%,平均提高了4.3%;在指標(biāo)MAE上,本文方法在Food數(shù)據(jù)集上提高了1.6%,在Unlocked Mobile phone數(shù)據(jù)集上提高了6.7%,平均提高了4.1%.

圖6是本文方法與對(duì)比算法在處理每個(gè)用戶數(shù)據(jù)的平均時(shí)間,本文方法在時(shí)間效率上要略差于SVD、SVD++及MF算法,原因是對(duì)比的三種方法均是基于對(duì)數(shù)值型矩陣的分析,而本文方法是基于對(duì)評(píng)論文本的分析;本文方法的處理時(shí)間要優(yōu)于LFM和LDA,其原因是:LFM要在提取隱式因子的基礎(chǔ)上進(jìn)行矩陣計(jì)算,而隱式因子的提取會(huì)耗費(fèi)大量時(shí)間,從而降低LFM算法的時(shí)間效率;而LDA作為非監(jiān)督機(jī)器學(xué)習(xí)算法,在處理大量短文本評(píng)論時(shí),需要重復(fù)遍歷計(jì)算主題概率以提取主題,因而處理效率較低.

圖6 不同模型算法時(shí)間對(duì)比Fig.6 Time comparison of different model algorithm

5 結(jié) 論

本文將卷積神經(jīng)網(wǎng)絡(luò)引入到個(gè)性化商品推薦中,提出了基于耦合CNN評(píng)分預(yù)測(cè)模型的個(gè)性化商品推薦方法.該方法主要通過(guò)構(gòu)建的耦合網(wǎng)絡(luò)分別進(jìn)行用戶和商品評(píng)論分析,以提取商品特征和模擬用戶行為,在共享空間進(jìn)行交互評(píng)分預(yù)測(cè),最終選取高評(píng)分商品推薦給用戶.所提方法充分利用卷積神經(jīng)網(wǎng)絡(luò)在短文本分析方面的優(yōu)勢(shì),并通過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證了所給評(píng)分預(yù)測(cè)方法在MSE、RMSE、MAE等指標(biāo)方面均有明顯提升.在今后的研究工作中,考慮充分利用深度學(xué)習(xí)模型處理異構(gòu)數(shù)據(jù)的優(yōu)勢(shì),例如處理評(píng)論中的圖片數(shù)據(jù),進(jìn)而充分挖掘評(píng)論數(shù)據(jù)中蘊(yùn)含的價(jià)值,進(jìn)一步提升推薦的準(zhǔn)確率.

猜你喜歡
卷積矩陣預(yù)測(cè)
無(wú)可預(yù)測(cè)
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
初等行變換與初等列變換并用求逆矩陣
矩陣
南都周刊(2015年4期)2015-09-10 07:22:44
矩陣
南都周刊(2015年3期)2015-09-10 07:22:44
砀山县| 房产| 包头市| 蓝田县| 普兰县| 辽阳县| 潞城市| 沾益县| 日照市| 西乌珠穆沁旗| 鄂伦春自治旗| 宁陵县| 洪江市| 手机| 肥东县| 宜章县| 镇巴县| 安福县| 新安县| 马关县| 瓮安县| 花莲县| 宝坻区| 溧阳市| 白城市| 华亭县| 阳山县| 恩平市| 九台市| 井陉县| 确山县| 探索| 汉沽区| 德昌县| 全椒县| 弥渡县| 长泰县| 英吉沙县| 巴林右旗| 平湖市| 天台县|