国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

PMUS-HOSGD張量分解方法及其在標(biāo)簽推薦中的應(yīng)用

2018-11-20 06:42:32顧軍華張宇娟彭玉青
計(jì)算機(jī)工程 2018年11期
關(guān)鍵詞:張量標(biāo)簽準(zhǔn)確率

楊 林,顧軍華,官 磊,張宇娟,彭玉青

(河北工業(yè)大學(xué) a.計(jì)算機(jī)科學(xué)與軟件學(xué)院; b.河北省大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室,天津 300400)

0 概述

隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)使用者從信息匱乏的時(shí)代步入了信息過載的時(shí)代,用戶的個(gè)性化需求也越來越大。用戶的個(gè)性化特征注重的是用戶的參與,用戶可以對(duì)資源(視頻、歌曲、圖片等)賦予自定義的標(biāo)簽,逐漸形成Folksonomy的大眾分類法[1],該分類法不僅可以獲取并分析用戶的興趣特征,而且在一定程度上豐富了資源的描述信息。隨著網(wǎng)絡(luò)資源規(guī)模爆發(fā)式的增長(zhǎng)[2],用于標(biāo)注的標(biāo)簽越來越多,用戶面對(duì)大量的數(shù)據(jù)如何選出自己需要的標(biāo)簽越來越困難。解決信息過載的有效方法是個(gè)性化推薦[3],由此基于社會(huì)標(biāo)注系統(tǒng)的標(biāo)簽推薦服務(wù)應(yīng)運(yùn)而生。例如,給書籍和視頻提供短評(píng)的豆瓣網(wǎng)、論文書簽網(wǎng)站CiteULike和視頻推薦網(wǎng)站MovieLens等都是利用社會(huì)標(biāo)注系統(tǒng)對(duì)資源進(jìn)行標(biāo)注,然后通過標(biāo)簽推薦系統(tǒng)將用戶感興趣的標(biāo)簽推薦給用戶。推薦系統(tǒng)簡(jiǎn)化標(biāo)注過程,方便用戶,提高了標(biāo)簽的質(zhì)量和標(biāo)注的準(zhǔn)確性。

標(biāo)簽推薦系統(tǒng)的核心是構(gòu)建“用戶-資源-標(biāo)簽”三維數(shù)據(jù),挖掘數(shù)據(jù)之間的潛在關(guān)系,從而準(zhǔn)確的為用戶推薦標(biāo)簽。目前,針對(duì)標(biāo)簽推薦系統(tǒng)已經(jīng)展開了大量的研究。文獻(xiàn)[4-5]將三維關(guān)系拆成“用戶-資源”、“用戶-標(biāo)簽”和“資源-標(biāo)簽”3個(gè)二維矩陣,使用協(xié)同過濾算法進(jìn)行處理。文獻(xiàn)[6]受Google的PageRank算法[7]啟發(fā)提出FolkRank算法,同樣將三維關(guān)系拆分成3個(gè)二維關(guān)系。但是這些方法破壞了高維空間數(shù)據(jù)原本的特征結(jié)構(gòu),丟失了三者之間的協(xié)同關(guān)系。為解決這個(gè)問題,挖掘“用戶-資源-標(biāo)簽”之間潛在的語義關(guān)聯(lián),文獻(xiàn)[8]提出使用三維張量存儲(chǔ)“用戶-資源-標(biāo)簽”數(shù)據(jù)。

在構(gòu)建初始張量階段,目前使用最多的方法是用“0/1”構(gòu)建張量,這種方法構(gòu)建容易,可讀性強(qiáng),但是不能體現(xiàn)出標(biāo)簽在資源中的差異。文獻(xiàn)[9]發(fā)現(xiàn)由于熱門標(biāo)簽通常有較大的權(quán)重,導(dǎo)致推薦結(jié)果偏向于熱門標(biāo)簽,反而降低推薦的準(zhǔn)確率。文獻(xiàn)[10-12]提出使用TF-IDF來設(shè)置懲罰項(xiàng),用以區(qū)分標(biāo)簽對(duì)資源的重要程度,可以減少熱門標(biāo)簽對(duì)結(jié)果的影響。然而上述方法都忽略了用戶對(duì)資源的偏好程度。

對(duì)構(gòu)建完成的張量進(jìn)行分解,可以挖掘張量包含的潛在信息。文獻(xiàn)[13]將奇異值分解方法推廣到三維張量,提出高階奇異值分解(Hign Order Singular Value Decomposition,HOSVD)方法對(duì)張量進(jìn)行分解,該方法保留了三者的關(guān)聯(lián)信息。文獻(xiàn)[14]基于矩陣奇異值分解能有效地平滑數(shù)據(jù)矩陣中的數(shù)據(jù)特點(diǎn),在使用HOSVD進(jìn)行分解的過程中,結(jié)合用戶朋友關(guān)系修正張量分解結(jié)果,建立張量分解模型。文獻(xiàn)[15]提出新的推薦算法PITF(Pairwise Interaction Tensor Factorization),該算法在張量分解的過程中加入3個(gè)二維關(guān)系之間的潛在聯(lián)系,推薦質(zhì)量得到提高。針對(duì)目前推薦系統(tǒng)存在的稀疏性問題,文獻(xiàn)[16]在CubeSVD[17]的基礎(chǔ)上進(jìn)行改進(jìn),使用ALS算法進(jìn)行矩陣分解,提出CubeALS推薦算法,該算法有效提高了稀疏數(shù)據(jù)標(biāo)簽推薦的準(zhǔn)確性。文獻(xiàn)[18]提出一種基于上下文學(xué)習(xí)和張量分解的個(gè)性化推薦算法,將用戶和項(xiàng)目的上下文信息加入2個(gè)張量中,有效改善數(shù)據(jù)稀疏性。文獻(xiàn)[19]提出一種改進(jìn)的基于張量分解的推薦算法,引入基于標(biāo)簽綜合共現(xiàn)的譜聚類方法,使用HOSVD-HOOI算法對(duì)初始張量進(jìn)行分解,進(jìn)一步優(yōu)化推薦效果。目前的張量分解方法多數(shù)以SVD為基礎(chǔ)進(jìn)行改進(jìn)。使用SVD方法對(duì)張量的每個(gè)維度矩陣進(jìn)行分解,雖然在一定程度上提高了推薦的準(zhǔn)確性,但由于構(gòu)建的初始張量極其稀疏,需要在分解前對(duì)初始張量的展開矩陣進(jìn)行填充,這樣存在2個(gè)問題:1)填充過程增加數(shù)據(jù)量,同時(shí)增加算法復(fù)雜度;2)簡(jiǎn)單的數(shù)據(jù)填充易造成數(shù)據(jù)失真,從而影響推薦結(jié)果的準(zhǔn)確度。

針對(duì)上述問題,本文結(jié)合PMUS(Penalty Mechanism-User Score)張量構(gòu)建方法與HOSGD(High Order Stochastic Gradient Descent)張量分解方法,提出PMUS-HOSGD算法對(duì)“用戶-資源-標(biāo)簽” 三維數(shù)據(jù)進(jìn)行處理,為用戶推薦個(gè)性化標(biāo)簽。本文主要工作如下:1)在張量構(gòu)建階段,提出懲罰機(jī)制與用戶評(píng)分相結(jié)合的張量構(gòu)建方法PMUS來計(jì)算標(biāo)簽的權(quán)值;2)在張量分解階段,提出基于隨機(jī)梯度下降(Stochastic Gradient Desecent,SGD)的高階張量分解方法HOSGD。

1 相關(guān)工作

1.1 張量及其矩陣展開

張量由多維數(shù)據(jù)組成,是一個(gè)N維的向量空間,一維張量是一個(gè)向量(Vector),二維張量是一個(gè)矩陣(Matrix),三維或者更高維的張量則是高維張量(Tensor)。標(biāo)簽推薦系統(tǒng)使用三維張量存儲(chǔ)數(shù)據(jù),3個(gè)維度分別代表用戶、資源、標(biāo)簽。

使用aijk表示三維張量的值,其大小代表用戶i給資源j標(biāo)注標(biāo)簽k的概率。例如,用戶1給資源1標(biāo)注了標(biāo)簽2,則對(duì)應(yīng)張量中的值為a112=1,其余的標(biāo)注0。

矩陣展開是將一個(gè)張量的元素重新排列(即對(duì)張量的不同維度進(jìn)行重新排列),得到一個(gè)矩陣的過程。三維張量A∈RI1×I2×I3在第n維度上的展開矩陣表示為X(n)∈RIn×(I1×I2×…×In-1×In+1×…×IN)。

1.2 張量分解

基本的張量分解算法HOSVD需要對(duì)張量A每個(gè)維度(n=1,2,3)的展開矩陣進(jìn)行SVD分解,計(jì)算公式是:

(1)

通過上述公式對(duì)An進(jìn)行奇異值分解,分別得到3個(gè)維度的展開矩陣的U矩陣和奇異值矩陣S。

張量與矩陣的模積定義為一個(gè)張量X∈RI1×I2×…×IN和一個(gè)矩陣U∈RJ×In的n-mode乘積(X×nU)∈RI1×I2×…×In-1×J×In+1×…×IN,其元素定義為:

(2)

如果J

(3)

(4)

2 PMUS-HOSGD張量分解方法

傳統(tǒng)的張量分解算法HOSVD可以挖掘“用戶-資源-標(biāo)簽”三維數(shù)據(jù)之間的關(guān)系,但在實(shí)際應(yīng)用中,用戶僅對(duì)個(gè)別資源進(jìn)行標(biāo)簽標(biāo)注,這會(huì)導(dǎo)致張量中的數(shù)據(jù)極度稀疏。目前常用的HOSVD算法在張量分解的過程前需要對(duì)稀疏矩陣進(jìn)行填充,這樣會(huì)造成數(shù)據(jù)的失真。因此,本文結(jié)合PMUS張量構(gòu)建方法與HOSGD張量分解方法,提出PMUS-HOSGD算法對(duì) “用戶-資源-標(biāo)簽” 三維數(shù)據(jù)進(jìn)行處理,為用戶推薦個(gè)性化標(biāo)簽。

2.1 PMUS初始張量構(gòu)建

在“用戶-資源-標(biāo)簽”三維張量中,“0/1”構(gòu)建方法簡(jiǎn)單易行,但是標(biāo)簽之間沒有區(qū)分度,因此可以使用PMUS的思想計(jì)算標(biāo)簽的權(quán)重;同時(shí),用戶對(duì)資源的評(píng)分可以體現(xiàn)出用戶對(duì)資源的偏好程度,用標(biāo)簽的權(quán)重乘以評(píng)分可以很好地區(qū)分出標(biāo)簽之間以及用戶和資源之間的重要度,最終構(gòu)建整個(gè)張量。

PMUS的主要思想是:如果一個(gè)標(biāo)簽在一個(gè)資源中出現(xiàn)多次,并且在其他資源中很少出現(xiàn),則可以認(rèn)為該標(biāo)簽具有很好的區(qū)分度,同時(shí)如果一個(gè)用戶給資源的評(píng)分越高,用戶對(duì)這個(gè)資源的偏愛程度越大,則給這個(gè)視頻標(biāo)注的標(biāo)簽的概率就越大。

使用PMUS計(jì)算標(biāo)簽權(quán)值的過程如下:

1)計(jì)算標(biāo)簽t對(duì)于資源i的重要度import(t,i),針對(duì)每個(gè)資源都有一個(gè)標(biāo)簽權(quán)重向量,公式如下:

(5)

2)根據(jù)重要度(import)計(jì)算標(biāo)簽t在用戶u對(duì)資源i標(biāo)注的標(biāo)簽集中占的比例權(quán)重weight(u,t,i),公式如下:

weight(u,t,i)=import(t,i)/sum_weight(u,i)

(6)

其中,sum_weight(u,i)是用戶u給資源i標(biāo)注的所有標(biāo)簽的重要度的總和。

3)weight(u,t,i)乘以用戶u給資源i的評(píng)分就是張量中用戶u在資源i中使用標(biāo)簽t的權(quán)值Value(u,t,i),公式如下:

Value(u,t,i)=weight(u,t,i)×score(u,i)

(7)

2.2 基于隨機(jī)梯度下降的張量分解算法HOSGD

傳統(tǒng)的SVD算法對(duì)二維矩陣進(jìn)行分解,可以求出對(duì)應(yīng)的特征矩陣,隨著用戶數(shù)量、資源數(shù)量和標(biāo)簽數(shù)量的急劇增長(zhǎng),SVD分解帶來的誤差和復(fù)雜度也在不斷增加,正是由于這些問題,Simon Funk發(fā)表了一個(gè)只考慮已有評(píng)分的矩陣分解方法,稱為Funk-SVD,也就是被文獻(xiàn)[20]稱為隱語義模型的矩陣分解方法,該方法使用梯度下降法(Gradient Descent,GD)最小化訓(xùn)練集中觀察值的RMSE(Root Mean Squared Error),在二維矩陣分解中取得了較好的推薦效果。

標(biāo)準(zhǔn)的梯度下降法在更新變量前要對(duì)所有的樣本計(jì)算誤差并匯總,導(dǎo)致算法收斂速度較慢,因此本文使用隨機(jī)梯度下降法,SGD是在梯度下降法的基礎(chǔ)上,在迭代過程中使用部分樣本計(jì)算梯度,因此其比標(biāo)準(zhǔn)梯度下降法有更高的收斂速度。

借鑒SGD在二維矩陣分解領(lǐng)域中的應(yīng)用,本文提出HOSGD張量分解算法。HOSGD算法在張量進(jìn)行分解的過程中,為提高準(zhǔn)確性,使用SGD算法對(duì)展開矩陣分解,降低了傳統(tǒng)分解方法帶來的計(jì)算復(fù)雜度及誤差。

在用戶給資源標(biāo)注標(biāo)簽的過程中,形成了若干{用戶,資源,標(biāo)簽}數(shù)據(jù),使用PMUS方法構(gòu)建利用式(5)、式(6)和式(7)計(jì)算Value(u,t,i),得到三維張量A∈RX×Y×Z,HOSGD算法對(duì)張量的展開矩陣進(jìn)行SGD分解,得到3個(gè)特征矩陣,進(jìn)而計(jì)算出初始張量的核心張量,然后可以得到初始張量的近似張量。算法描述如下:

算法1PMUS-HOSGD張量分解

輸入用戶、資源、標(biāo)簽數(shù)據(jù)三元組(u,i,t)

輸出初始張量的近似張量

1.使用PMUS方法按照式(5)、式(6)、式(7)計(jì)算標(biāo)簽的權(quán)值

2.使用張量A存儲(chǔ)式(7)計(jì)算得到的Value(u,t,i)

3.將張量A按照3個(gè)維度展開得到A1、A2、A3

4.for i=1 to 3

5.按照算法2對(duì)Ai進(jìn)行處理,得到P1、P2、P3

6.end for

在算法1中,對(duì)于三維張量A∈RX×Y×Z,其中,用戶、資源和標(biāo)簽的數(shù)量分別為X,Y和Z,初始張量A展開得到的3個(gè)矩陣A1、A2、A3的規(guī)模分別為X×YZ、Y×XZ和Z×XY,按照算法2,分別對(duì)A1、A2、A3進(jìn)行分解,得到每個(gè)維度的特征矩陣P1、P2、P3,其中P1∈RX×k1,P2∈RY×k2,P3∈RZ×k3,3個(gè)特征矩陣的特征數(shù)k1、k2、k3是根據(jù)數(shù)據(jù)規(guī)模設(shè)定的,一般ki<

(8)

(9)

其中,左邊第1項(xiàng)是誤差項(xiàng),用原始矩陣中有值的項(xiàng)減去P和Q對(duì)應(yīng)行和列相乘得到的值,左邊第2項(xiàng)是正則化項(xiàng),防止過擬合。對(duì)L最小化就得到了P和Q。

通過式(8)分別對(duì)PU和QI求其梯度:

(10)

(11)

其中,λ表示正則化參數(shù),A(U)表示矩陣A第U行中不為0或者空的列,A(I)表示矩陣A第I列中不為0或者空的行,通過矩陣A第U行,可以得到矩陣P第U行的梯度,也就是PU需要更新的值:

(12)

(13)

其中,α表示步長(zhǎng),對(duì)矩陣P中所有的PU進(jìn)行更新,或者對(duì)Q矩陣中所有的QI進(jìn)行更新,就完成了一次迭代,在每次迭代的過程中,實(shí)現(xiàn)了P和Q矩陣的一次更新,損失函數(shù)L的值減小。算法描述如下:

算法2基于SGD的張量展開矩陣分解

輸入張量的展開矩陣Ai

輸出Ai的特征矩陣P

4.步驟2和步驟3是一次迭代的過程,多次執(zhí)行步驟2和步驟3,不斷更新PU和QI的值,直到完成迭代次數(shù)t或者誤差小于閾值,得到P和Q的最優(yōu)解

在算法2中,λ和α參數(shù)需要在實(shí)驗(yàn)中多次調(diào)優(yōu)得到。算法的核心在于每次更新PU和QI時(shí)只使用原始矩陣中有值的部分,得到P和Q的最優(yōu)解,P即為對(duì)應(yīng)的特征矩陣。

PMUS-HOSGD張量分解方法的時(shí)間復(fù)雜度主要是在對(duì)每個(gè)維度展開矩陣的分解基礎(chǔ)上進(jìn)行計(jì)算的。算法2矩陣分解的時(shí)間復(fù)雜度是O(t×X×k1×n1′),據(jù)此可得算法1的時(shí)間復(fù)雜度是O(t×(X×k1×n1′+Y×k2×n2′+Z×k3×n3′)),其中,t為迭代次數(shù),k為特征數(shù),n′是矩陣中平均每行非空數(shù)據(jù)的數(shù)目。

3 實(shí)驗(yàn)結(jié)果與分析

本文使用相同的數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn)對(duì)比張量構(gòu)建方法和張量分解方法,采用常用的評(píng)價(jià)指標(biāo)驗(yàn)證算法的有效性。

3.1 數(shù)據(jù)集

本文使用MovieLens數(shù)據(jù)集,包含用戶對(duì)視頻的評(píng)分,以及用戶給視頻標(biāo)注的標(biāo)簽數(shù)據(jù)。

使用MovieLens數(shù)據(jù)集構(gòu)建的三維張量極其稀疏,因此對(duì)初始數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理后的數(shù)據(jù)中每個(gè)用戶都對(duì)15個(gè)或15個(gè)以上視頻打過標(biāo)簽,每個(gè)視頻都由15個(gè)或15個(gè)以上用戶打過標(biāo)簽。處理后的數(shù)據(jù)中用戶、視頻、標(biāo)簽的數(shù)量分別是184、122、378,有20 149條“用戶、資源、標(biāo)簽”數(shù)據(jù)。

3.2 評(píng)價(jià)標(biāo)準(zhǔn)

本文使用準(zhǔn)確率(Precision)、召回率(Recall)和F值[21]作為算法的評(píng)價(jià)標(biāo)準(zhǔn)。在推薦系統(tǒng)中,準(zhǔn)確率表示在推薦列表中得到的推薦結(jié)果與測(cè)試集中實(shí)際情況相同的物品數(shù)與所有的推薦物品數(shù)的比值,召回率指的是推薦列表中準(zhǔn)確的結(jié)果占測(cè)試樣本的比例。在實(shí)驗(yàn)過程中,將預(yù)處理后的數(shù)據(jù)集分成2部分:訓(xùn)練集和測(cè)試集,其中,訓(xùn)練集占75%,測(cè)試集占25%。

準(zhǔn)確率和召回率的計(jì)算公式如下:

(14)

(15)

其中,test表示測(cè)試集,top_N表示推薦的結(jié)果,N表示推薦的數(shù)目,準(zhǔn)確率和召回率的值越高推薦效果越好。

F值作為常用評(píng)價(jià)指標(biāo),能更好地反映推薦結(jié)果的效果,F的值越高推薦效果越好。

(16)

3.3 實(shí)驗(yàn)結(jié)果

為驗(yàn)證PMUS方法構(gòu)建張量能提高推薦結(jié)果的準(zhǔn)確率,實(shí)驗(yàn)結(jié)合使用HOSVD分解算法,分別對(duì)比“0/1”、TF-IDF和PMUS張量構(gòu)建方法的準(zhǔn)確率、召回率和F值。實(shí)驗(yàn)結(jié)果如圖1~圖3所示,每個(gè)圖中各有3條曲線,分別代表“0/1”、TF-IDF和PMUS張量構(gòu)建方法結(jié)合HOSVD分解方法的實(shí)驗(yàn)結(jié)果,每條曲線有8個(gè)節(jié)點(diǎn),橫軸代表top_N的值,縱軸分別代表準(zhǔn)確率、召回率和F值。

圖1 3種構(gòu)建方法的準(zhǔn)確率比較

圖2 3種構(gòu)建方法的召回率比較

圖3 3種構(gòu)建方法的F值比較

由圖1~圖3中3種不同構(gòu)建方法的對(duì)比可知,在top_1時(shí),使用“0/1”構(gòu)建的張量進(jìn)行分解推薦的準(zhǔn)確率比PMUS和TF-IDF方法要好,但是隨著N的增長(zhǎng),PMUS方法構(gòu)建的張量的準(zhǔn)確率要高于其他2種算法,比TF-IDF平均高0.03。在推薦數(shù)量小于10時(shí),PMUS方法構(gòu)建張量的召回率和F值要明顯高于其他2種方法,說明使用PMUS方法構(gòu)建張量,張量權(quán)值在加入標(biāo)簽對(duì)視頻的權(quán)重以及用戶對(duì)視頻的評(píng)分后,使用戶對(duì)視頻標(biāo)注的標(biāo)簽權(quán)值更加真實(shí)。在實(shí)際推薦系統(tǒng)中,給用戶推薦的少量標(biāo)簽不止1個(gè),因此使用PMUS方法構(gòu)建張量得到的推薦結(jié)果要優(yōu)于普通的“0/1”和TF-IDF構(gòu)建方法。

為進(jìn)一步驗(yàn)證HOSGD推薦算法的性能,本文結(jié)合使用PMUS方法構(gòu)建張量,對(duì)HOSGD與HOSVD、協(xié)同過濾(Collaborative Filtering,CF)和CubeALS 算法進(jìn)行了對(duì)比?;贑F的標(biāo)簽推薦算法是目前應(yīng)用比較廣泛的個(gè)性化推薦算法;HOSVD是一種經(jīng)典的張量分解算法,被大量的應(yīng)用于三維數(shù)據(jù)推薦領(lǐng)域,而且取得了良好的實(shí)驗(yàn)結(jié)果;CubeALS推薦算法與其他優(yōu)秀的算法對(duì)比,推薦效果有顯著提高。

在用HOSGD分解展開矩陣的過程中,涉及到步長(zhǎng)α、正則化系數(shù)λ、特征因子數(shù)目k、迭代次數(shù)和閾值5個(gè)參數(shù)。α過大可能會(huì)導(dǎo)致迭代不收斂,從而發(fā)散,因此α分別取0.01、0.05、0.1、0.2、0.3、0.6進(jìn)行對(duì)比;k數(shù)目過多會(huì)導(dǎo)致收斂速度慢,程序時(shí)間復(fù)雜度高,因此特征因子k數(shù)目取10到20進(jìn)行對(duì)比。通過多次實(shí)驗(yàn),發(fā)現(xiàn)在迭代50次左右誤差結(jié)果接近0.08,趨于穩(wěn)定。結(jié)合實(shí)驗(yàn)結(jié)果,張量分解中取步長(zhǎng)α為0.2,正則化系數(shù)λ為0.000 3,特征因子k數(shù)目為17,迭代50次,閾值為0.08。實(shí)驗(yàn)結(jié)果如圖4~圖6所示。由圖4~圖6可知,4種算法的準(zhǔn)確率呈下降趨勢(shì),HOSGD的準(zhǔn)確率在top_N小于5的情況下均高于其他算法,尤其在top_1至top_4階段HOSGD的準(zhǔn)確率平均比CubeALS提升0.07。在top_1至 top_5階段HOSGD的召回率和F值也明顯高于次優(yōu)的CubeALS算法。在實(shí)際推薦系統(tǒng)中,給用戶提供1-5個(gè)標(biāo)簽,HOSGD算法符合實(shí)際要求。實(shí)驗(yàn)結(jié)果表明,使用隨機(jī)梯度下降的張量分解算法HOSGD能夠充分利用SGD方法的優(yōu)勢(shì),有效處理稀疏張量,減少誤差。

圖4 4種推薦算法的準(zhǔn)確率比較

圖5 4種推薦算法的召回率比較

圖6 4種推薦算法的F值比較

綜上所述,使用PMUS構(gòu)建張量并結(jié)合使用基于隨機(jī)梯度下降法的HOSGD進(jìn)行張量分解的PMUS-HOSGD算法,可以有效提高標(biāo)簽推薦的準(zhǔn)確率。

4 結(jié)束語

在個(gè)性化標(biāo)簽推薦領(lǐng)域,使用張量存儲(chǔ)“用戶-資源-標(biāo)簽”數(shù)據(jù)是一種很好的數(shù)據(jù)表示形式,但由于三維數(shù)據(jù)的稀疏性,傳統(tǒng)的張量構(gòu)建方法和張量分解方法的推薦準(zhǔn)確率較低。因此,本文利用PMUS構(gòu)建張量,并結(jié)合基于隨機(jī)梯度下降法的HOSGD對(duì)張量進(jìn)行分解。實(shí)驗(yàn)結(jié)果表明,與 HOSVD、CF和CubeALS算法相比,PMUS-HOSGD算法具有更好的推薦效果。下一步將重點(diǎn)研究在大數(shù)據(jù)量的情況下如何提高推薦速度,并使用分布式平臺(tái)運(yùn)行該算法。

猜你喜歡
張量標(biāo)簽準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
偶數(shù)階張量core逆的性質(zhì)和應(yīng)用
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
四元數(shù)張量方程A*NX=B 的通解
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
車迷(2018年11期)2018-08-30 03:20:32
高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
擴(kuò)散張量成像MRI 在CO中毒后遲發(fā)腦病中的應(yīng)用
標(biāo)簽化傷害了誰
井冈山市| 姚安县| 屏山县| 舟曲县| 黑水县| 那坡县| 泗阳县| 英吉沙县| 林芝县| 饶河县| 凤庆县| 余姚市| 拜城县| 临西县| 汨罗市| 霸州市| 绩溪县| 东平县| 泸州市| 西青区| 临城县| 德惠市| 平遥县| 东海县| 滁州市| 阳江市| 鹰潭市| 屯门区| 洱源县| 临海市| 陵川县| 新安县| 固安县| 永丰县| 称多县| 烟台市| 汉中市| 大城县| 开化县| 多伦县| 射阳县|