網(wǎng)絡(luò)決策形式背景下基于因果力的鄰域推薦算法

2023-01-30 01:10:50郭瑞欣李金海

模式識別與人工智能 2022年11期

范敏郭瑞欣李金海

早期形式概念分析(Formal Concept Analysis, FCA)[1]專注于研究概念及概念層次的數(shù)學(xué)化和形式化表達(dá).隨著FCA的快速發(fā)展，與各領(lǐng)域的交叉研究日漸深入，現(xiàn)已廣泛應(yīng)用于軟件工程[2-3]、數(shù)據(jù)挖掘[4-6]、推薦系統(tǒng)[7]等具有廣闊應(yīng)用前景的領(lǐng)域.

基于形式背景的概念認(rèn)知是一個新興的研究領(lǐng)域，主要以形式概念分析、粗糙集及粒計算等理論為工具.在大數(shù)據(jù)環(huán)境下，概念認(rèn)知學(xué)習(xí)具有諸多認(rèn)知優(yōu)勢，學(xué)者們對其進(jìn)行一系列的研究[8-10].在概念認(rèn)知學(xué)習(xí)中，基于各種算子的研究得到不同的概念[11].Düntsch等[12]給出近似算子——必要算子和可能算子，研究面向?qū)傩愿拍罡?Yao[13]研究面向?qū)ο蟾拍罡窈兔嫦驅(qū)傩愿拍罡?，以及它們之間的關(guān)系.閆夢宇等[14]基于Wille概念格、面向?qū)ο蟾拍罡窈兔嫦驅(qū)傩愿拍罡?，定義共有屬性(對象)與獨(dú)有屬性(對象)，并研究它們的算子性質(zhì).將上述算子結(jié)合變精度思想可得到各種變精度算子，進(jìn)一步與實際應(yīng)用結(jié)合，有利于豐富概念認(rèn)知理論與應(yīng)用的研究.如何將概念認(rèn)知學(xué)習(xí)方法與網(wǎng)絡(luò)中的因果推斷、規(guī)則提取結(jié)合，是一個有意義的課題.

目前，常見的推薦系統(tǒng)包括以下幾種：Zaier等[15]提出的基于鄰域的推薦系統(tǒng)，主要是通過計算相似度找到相關(guān)鄰域，根據(jù)鄰域信息進(jìn)行推薦；Garcia等[16]提出的組推薦系統(tǒng)(Group Recommender System)，推薦對象為整個群組.基于鄰域的推薦方法常見于協(xié)同過濾推薦系統(tǒng)中，主要分為基于用戶的協(xié)同過濾推薦[17]和基于項目的協(xié)同過濾推薦[18].前者是根據(jù)用戶之間的相似度進(jìn)行推薦，后者是根據(jù)項目之間的相似度進(jìn)行推薦.組推薦系統(tǒng)通過研究所有鄰域成員偏好之間的關(guān)聯(lián)性得到鄰域偏好，最后利用鄰域偏好進(jìn)行推薦[19].

由上述研究可知，基于鄰域的推薦算法需要解決兩個問題：1)如何得到相關(guān)鄰域，并使這些鄰域中能涌現(xiàn)足夠多的規(guī)律；2)如何根據(jù)每個鄰域信息得到鄰域偏好之間的關(guān)聯(lián)性，構(gòu)建推薦算法.

Pearl[20]在《Causality》中指出：因果關(guān)系不應(yīng)被視為單一關(guān)系，而應(yīng)被視為具有兩個維度——充分性和必要性.該書結(jié)合概率論的相關(guān)知識，給出充分性與必要性的定義，為研究因果力奠定基礎(chǔ).之后Pearl又深入研究當(dāng)代的因果分析方法，將因果科學(xué)從一個模糊的概念變成一個可以量化的理論，并廣泛應(yīng)用于數(shù)理統(tǒng)計[21]、人工智能[22-23]、認(rèn)知科學(xué)[24-25]等領(lǐng)域.

之后，學(xué)者們重新定義因果力的衡量標(biāo)準(zhǔn)[26]，并將

PNS=suff(e|c)+nec(e|c)-1

作為度量因果關(guān)系的新標(biāo)準(zhǔn).Hoel等[27]提出使用一般的因果關(guān)系度量有效信息以衡量因果有效性，并在文獻(xiàn)[28]中列舉十幾種較通用的因果力測量方法.學(xué)者們結(jié)合各種因果力的研究與規(guī)則挖掘，得到更有效的規(guī)則挖掘算法，進(jìn)一步應(yīng)用于推薦系統(tǒng)[29-31].

當(dāng)前，基于概念格的推薦方法已取得如下研究成果：基于概念鄰域的Top-N推薦[7]、啟發(fā)式構(gòu)造概念格進(jìn)行推薦[32]、基于RSS(Really Simple Syndi-cation)的電子學(xué)習(xí)推薦[33]、模擬退火法構(gòu)造概念集進(jìn)行推薦[34]、PRS(Personalized Recommendation System)[35]、形式概念分析和協(xié)同過濾推薦結(jié)合[36].然而概念格構(gòu)造效率太低，幾乎與形式背景的規(guī)模增長呈指數(shù)關(guān)系[37-39]，使基于經(jīng)典概念集的社區(qū)劃分在實際數(shù)據(jù)中難以實現(xiàn).

為了解決在進(jìn)行組推薦時應(yīng)用概念格劃分社區(qū)出現(xiàn)的高復(fù)雜度問題，范敏等[40]提出基于弱概念相似度的組推薦算法(Group Recommendation Algori-thm Based on Weaken-Concept Similarity, GRAWS),通過*算子誘導(dǎo)的弱概念集劃分論域形成社區(qū)，并在劃分社區(qū)時計算屬性弱概念下限相似度,以此進(jìn)行組推薦，降低劃分社區(qū)的計算復(fù)雜度，同時提高推薦效果.但是，*算子的約束條件過于嚴(yán)格，誘導(dǎo)的弱概念集頻繁出現(xiàn)空集，因此無法保證獲得足夠多的弱概念，導(dǎo)致誘導(dǎo)的規(guī)則集應(yīng)用于組推薦效果不佳.

1 相關(guān)定義

定義1[1]三元組(U,A,I)稱為形式背景，其中，U={x1,x1,…,xn}為非空有限對象集，A={a1,a2,…,am}為非空有限屬性集，I為笛卡爾積U×A上的二元關(guān)系.約定(x,a)∈I表示對象x擁有屬性a；(x,a)?I表示對象x不擁有屬性a.

為了從形式背景中誘導(dǎo)出概念，給出如下算子的定義.對于?X∈2U，B∈2A，有

1)xI={a∈A|(x,a)∈I}，

2)Ia={x∈U|(x,a)∈I}，

3)X*={a∈A|?x∈X,(x,a)∈I},

4)B*={x∈U|?a∈B,(x,a)∈I},

其中，xI表示對象x擁有的所有屬性組成的集合，Ia表示擁有屬性a的所有對象組成的集合，X*表示X中所有對象共同擁有的屬性，B*表示擁有B中所有屬性的對象.

例1已知評分矩陣Q(見表1)，由定義2結(jié)合用戶矩陣，可得到網(wǎng)絡(luò)決策形式背景(見表2).

表1 評分矩陣QTable 1 Scoring matrix Q

表2 網(wǎng)絡(luò)決策形式背景(U,M,C,D,I)Table 2 Network formal decision context(U,M,C,D,I)

表1給出的評分矩陣Q描述用戶xi對項目aj的評分情況.v(x1,a1)=4表示用戶x1對項目a1的評分為4，v(x1,a2)=0表示用戶x1沒有對項目a2做出評分.表2描述用戶之間的連接關(guān)系和用戶對項目的擁有情況.

在表1中，首先，采用

對項目評分進(jìn)行修正(https://blog.csdn.net/Joeny

圖1 電影推薦網(wǎng)絡(luò)圖Fig.1 Movie recommendation network

表3 圖1對應(yīng)的網(wǎng)絡(luò)決策形式背景(U,M,C,D,I)Table 3 Network formal decision context(U,M,C,D,I) of Fig.1

2 問題描述與解決

本文將主要解決如下兩個問題：1)通過變精度弱概念劃分論域，構(gòu)建社區(qū)；2)利用因果力代換實現(xiàn)鄰域推薦.

2.1 變精度弱概念

文獻(xiàn)[40]通過構(gòu)建弱概念集進(jìn)行組推薦時，需滿足約束條件：1)得到的弱概念集要覆蓋形式背景的所有對象，即保證每個對象都至少屬于一個弱概念；2)挖掘的弱概念內(nèi)涵的規(guī)模必須大于預(yù)設(shè)閾值.由于*算子約束條件較嚴(yán)格，誘導(dǎo)出的對象弱概念或?qū)傩匀醺拍罱M成的集合頻繁出現(xiàn)空集，因此，按上述方式構(gòu)建弱概念集可能出現(xiàn)無法找到足夠多的弱概念滿足上述約束條件的現(xiàn)象.

定義3對于評分矩陣Q，

Vi={v(xi,ap),?ap∈A}為用戶xi對項目集的評分，

Vj={v(xj,ap),?ap∈A}

為用戶xj對項目集的評分，則用戶間的相似矩陣

S=(s(i,j))n×n，

其中

由定義2和定義3可將相似矩陣S轉(zhuǎn)換為網(wǎng)絡(luò)鄰接矩陣M.

定義 4給定網(wǎng)絡(luò)決策形式背景(U,M,C,D,I)，則節(jié)點xi的相似性聚合中心度定義為

定義5給定一個網(wǎng)絡(luò)決策形式背景(U,M,C,D,I)，對?X∈2U，C∈2C，D∈2D，變精度共有算子定義如下：

證明先證1).對?X∈2U，由定義5可得

再證2).對?C∈2C，由定義5可得

（4）要正確合理選擇分片剛性樓蓋和整體非剛性樓蓋的結(jié)構(gòu)抗震設(shè)計計算模型，比如樓板在大震下不能處于基本彈性狀態(tài)時，要先研究出合理的計算模型后再進(jìn)行抗震設(shè)計驗算。

在上述定義1～定義6的基礎(chǔ)上提出問題1，描述如下.

問題1通過變精度弱概念劃分論域U

輸入網(wǎng)絡(luò)決策形式背景(U,M,C,D,I)

輸出劃分集CS

優(yōu)化目標(biāo)min(|CS|)

其中

優(yōu)化目標(biāo)表示最小化社區(qū)數(shù)量，用于提高模型的擬合能力.約束條件1表示變精度弱概念集覆蓋論域U中所有對象，即每個對象至少劃分在一個鄰域(社區(qū))中.約束條件2表示挖掘的變精度條件弱概念內(nèi)涵規(guī)模不小于ω1，變精度決策弱概念內(nèi)涵規(guī)模不小于ω2，即只有當(dāng)用戶擁有的項目足夠多時，形成的鄰域(社區(qū))才有意義.下面進(jìn)一步研究鄰域推薦算法.

2.2 基于因果力的鄰域推薦

本節(jié)首先給出推薦規(guī)則、規(guī)則置信度與規(guī)則因果力的概念.

定義7推薦規(guī)則r(ci,dj)表示向擁有條件屬性ci的對象推薦決策屬性dj，即r(ci,dj)∶ci→dj.

定義8對于規(guī)則r(ci,dj)∶ci→dj，稱

為規(guī)則r(ci,dj)的置信度.

定義9設(shè)規(guī)則r(dj,ci)∶dj→ci為規(guī)則r(ci,dj)∶ci→dj的反規(guī)則，稱

為反規(guī)則r(dj,ci)的置信度.

Pearl[20]在《Causality》中定義必要性概率:

nec(e|c)=P(～e|～c)，

即反事實概率.也就是如果原因c沒有發(fā)生，結(jié)果e就不會發(fā)生的概率.定義充分性概率

suff(e|c)=P(e|c)，

即原因c導(dǎo)致結(jié)果e發(fā)生的概率.并且，給出衡量因果力的標(biāo)準(zhǔn)：

PNS=nec(e|c)+suff(e|c)-1.

Eells[29]從另外一個角度提出,c是e的原因需滿足

p(e|c)>p(e|C-c)，

其中C為原因集.并且可用這兩個量之間的差衡量因果強(qiáng)度：

SCEells=p(e|c)-p(e|C-c)=suff(e|c)+nec(e|c)-1.

下面基于文獻(xiàn)[20]、文獻(xiàn)[29]和定義7～定義9，研究因果關(guān)系充分性和必要性與定義8、定義9中規(guī)則置信度的關(guān)系，并給出ci和dj之間因果力的定義.

定義10對于規(guī)則r(ci,dj)∶ci→dj，充分性

特別地，若

P(dj|ci)=1，

表示ci的發(fā)生必然導(dǎo)致dj發(fā)生，也可理解為規(guī)則r(ci,dj)∶dj→ci的置信度為1.

定義11對于規(guī)則r(ci,dj)∶ci→dj，必要性

特別地，若

1-P(dj|C-ci)=1，

則

P(dj|C-ci)=0，

即在C中刪除ci之后，dj不發(fā)生，表示ci的發(fā)生對dj的發(fā)生是必要的.

定理1對于反向規(guī)則

有如下結(jié)論成立：

μji=1?P(dj|C-ci)=0.

證明先證充分性.若

即

故

P(dj|C-ci)=0.

必要性顯然成立.

推論1對于反向規(guī)則

有如下結(jié)論成立：

μji=P(ci|dj)=1?nec(dj,ci)=1.

由定理1和推論1可知，若P(ci|dj)=1，表示ci的發(fā)生對dj的發(fā)生是必要的.也可理解為規(guī)則r(dj,ci)的置信度μji=1，反之亦然.

定理2對于反向規(guī)則

置信度μji與nec(dj,ci)呈正相關(guān)關(guān)系.

證明假設(shè)

從而

P(～ci|dj)=1-P(ci|dj)=1-β，

進(jìn)一步得

又因為

所以

故置信度μji與nec(dj,ci)呈正相關(guān)關(guān)系.

根據(jù)上述研究并結(jié)合文獻(xiàn)[20]中因果力的定義，可得到如下因果力的定義.

定義12對于規(guī)則

及其反規(guī)則

ci和dj之間的因果力定義為

CP=μij+μji-1.

顯然CP∈[-1,1].

文獻(xiàn)[39]指出，當(dāng)SCEells<0時，不能說明c是e的原因，即：當(dāng)CP<0時，不能說明ci是dj的原因；反之，當(dāng)CP≥0時，要么ci是dj的原因，要么dj是ci的原因，要么ci和dj互為因果.

下面討論ci和dj互為因果的情形.假設(shè)當(dāng)μij≥ξ時，ci是dj的原因，即ci→dj成立.同理，當(dāng)μji≥ξ時，dj是ci的原因，即dj→ci成立.同時滿足μij+μji≥1，于是有

從而2ξ≥1，進(jìn)一步得到ξ≥0.5.

因此，根據(jù)上述研究可得到如下推論2.

推論2若μij≥0.5，有ci→dj成立，否則有ci→dj成立.同理，若μji≥0.5，有dj→ci成立，否則有dj→ci成立.

在問題1輸出劃分集CS的基礎(chǔ)上結(jié)合上述定理和推論，進(jìn)一步可研究如下問題2.

問題2基于因果力代換的鄰域推薦

輸入CS，置信度閾值η、δ

輸出推薦規(guī)則r(ci,dj)

優(yōu)化目標(biāo)max(F1)

1)若μij≥η，則向擁有屬性ci的對象推薦屬性dj,

2)若μji≥δ，則向擁有屬性dj的對象推薦屬性ci.

其中，優(yōu)化目標(biāo)是最大化綜合評價指標(biāo)F1，用于提高模型的質(zhì)量.約束條件表示在社區(qū)Xi中，若μij≥η，則將屬性dj推薦給社區(qū)Xi中擁有屬性ci的節(jié)點；若μji≥δ，則將屬性ci推薦給社區(qū)Xi中擁有屬性dj的節(jié)點.

特別地，由推論2可知，在提取推薦規(guī)則時，置信度閾值η≥0.5，δ≥0.5.因此，在后面實驗部分設(shè)置置信度閾值分別為η=δ=0.5.

3 基于因果力的鄰域推薦算法

3.1 算法步驟

基于因果力的鄰域推薦算法(NRACF)框圖如圖2所示.

圖2 NRACF框架圖Fig.2 Flowchart of NRACF

下面給出NRACF的具體步驟.

算法1基于因果力的鄰域推薦算法(NRACF)

輸入網(wǎng)絡(luò)決策形式背景(U,M,C,D,I)，

專家比例λ，置信度閾值η、δ

輸出推薦規(guī)則r(ci,dj)，r(dj,ci)

step 1 計算網(wǎng)絡(luò)中所有節(jié)點的聚合中心度:

將所有的聚合度中心度sD(i)按從大到小的順序排列，并依據(jù)λ選取專家集，記為E={e1,e2,…,eh}，其中h=λ|U|.

step 2 依次選取E中的節(jié)點ei，及其一階鄰接節(jié)點集構(gòu)成社區(qū)N={X1,X2,…,Xh}.

step 3 依次選取N中的社區(qū)Xs，計算每個條件屬性ci在社區(qū)Xs中的密度

以及每個決策屬性dj在社區(qū)Xs中的密度

在此基礎(chǔ)上，計算每個社區(qū)ρc的均值μ及標(biāo)準(zhǔn)差σ，并對所有社區(qū)的μ-σ求平均值，記為條件屬性密度α的閾值，同理得到?jīng)Q策屬性密度β的閾值.

step 4 依次選取N中的社區(qū)Xs，計算

若μij≥η，輸出推薦規(guī)則r(ci,dj)；若μji≥δ，輸出推薦規(guī)則r(dj,ci)；若μij≥η且μji≥δ，輸出推薦規(guī)則r(ci,dj)和r(dj,ci)；否則，返回step 4.

step 6 利用獲取的推薦規(guī)則對網(wǎng)絡(luò)中的節(jié)點進(jìn)行推薦預(yù)測，算法結(jié)束.

3.2 時間復(fù)雜度分析

假設(shè)網(wǎng)絡(luò)決策形式背景中有n位用戶和m個屬性，屬性包括p個條件屬性，q個決策屬性，m=p+q，則選取的專家個數(shù)為λn，通過專家節(jié)點劃分社區(qū)的時間復(fù)雜度為O(λn2).在劃分的社區(qū)中，計算條件弱概念內(nèi)涵的時間復(fù)雜度為O(λn2p)，計算決策弱概念內(nèi)涵的時間復(fù)雜度為O(λn2q)，對于w個條件弱概念內(nèi)涵和v個決策弱概念內(nèi)涵，計算條件弱概念內(nèi)涵與決策弱概念內(nèi)涵間因果力的時間復(fù)雜度為O(wv).由于要遍歷所有社區(qū)進(jìn)行推薦，所以算法1的時間復(fù)雜度為O(λ2n3m+λnwv).

注意到，對象擁有的屬性個數(shù)小于m，因此，構(gòu)造弱概念集進(jìn)行鄰域劃分的時間復(fù)雜度小于O(λn2m).對比構(gòu)造概念格進(jìn)行鄰域劃分的時間復(fù)雜度O(n2m)[37]和文獻(xiàn)[40]的時間復(fù)雜度O(λn3m2)，NRACF具有明顯的計算優(yōu)勢.

4 實驗及結(jié)果分析

4.1 實驗環(huán)境

本文實驗選取電影評分MovieLens數(shù)據(jù)集(https://grouplens.org/datasets/movielens)上的ML-1m數(shù)據(jù)集與ML-100k數(shù)據(jù)集的5個抽樣數(shù)據(jù)集和電影評分Filmtrust數(shù)據(jù)集(https://guoguibing.github.io/librec/datasets.html),數(shù)據(jù)集信息如表4所示.

在實驗中，首先將所用數(shù)據(jù)集進(jìn)行預(yù)處理,再隨機(jī)選取80%的數(shù)據(jù)作為訓(xùn)練集，剩余20%的數(shù)據(jù)作為測試集.然后在訓(xùn)練集上利用算法1得到推薦規(guī)則.進(jìn)一步，在測試集上進(jìn)行推薦列表預(yù)測，并計算該算法在數(shù)據(jù)集上的精確度、召回率和F1值.最后，將算法1的結(jié)果與常見的6種推薦算法進(jìn)行對比.

下面說明數(shù)據(jù)集的預(yù)處理步驟.

1)構(gòu)造決策形式背景.首先，由于部分電影評論人數(shù)較少，可用性不強(qiáng)，故選擇評論人數(shù)前30%的電影作為屬性集.然后，將篩選的屬性集按照例1中方法分為條件屬性集C與決策屬性集D.最后，在電影評分矩陣Q中：若v(xi,ci)>0，則IC(xi,ci)=1，否則，IC(xi,ci)=0；若v(xi,dj)>0，則ID(xi,dj)=1，否則，ID(xi,dj)=0，得到?jīng)Q策形式背景.

2)構(gòu)造網(wǎng)絡(luò)鄰接矩陣.對于電影評分矩陣Q，根據(jù)定義3將對象間的相似性矩陣S轉(zhuǎn)化為網(wǎng)絡(luò)鄰接矩陣M，得到對象間的網(wǎng)絡(luò)鄰接矩陣.

本文采用如下推薦系統(tǒng)常用的評價指標(biāo).

1)精確度(Precision)：

2)召回率(Recall)：

3)F1-measure：

其中,R(x)為根據(jù)訓(xùn)練集得到的推薦預(yù)測列表，T(x)為用于驗證結(jié)果的測試列表.

4.2 參數(shù)討論

本節(jié)分析參數(shù)λ對F1值的影響，并討論算法1中計算參數(shù)α、β方法的合理性.

在算法1中，選取λ=0.1、0.3、0.5、0.7、0.9,依次計算F1值，結(jié)果如表5所示，表中黑體數(shù)字表示最大值.由表可知，隨著λ的增大，各數(shù)據(jù)集上F1值逐漸減小，變化幅度較小，但均在λ=0.1時取得最大值.這說明當(dāng)專家比例達(dá)到0.1時，算法1在各數(shù)據(jù)集上的指標(biāo)值最優(yōu).

表5 參數(shù)λ對F1值的影響Table 5 Effect of λ on F1

在算法1中，根據(jù)統(tǒng)計原理求得條件屬性密度閾值α=0.2，決策屬性密度閾值β=0.1.

下面分別定義α=0.1,0.2，…，0.9，β=0.1,0.2，…，0.9，根據(jù)算法1獲取推薦規(guī)則集，并在測試集上計算F1值，結(jié)果如表6和表7所示，表中黑體數(shù)字表示最大值.另外，當(dāng)α=0.5,0.6，…，0.9時，F(xiàn)1值都為0，所以未顯示在表6中.而當(dāng)β=0.4,0.5，…，0.9時，F(xiàn)1值都為0，所以也未顯示在表7中.

表6 參數(shù)α對F1值的影響Table 6 Effect of α on F1

表7 參數(shù)β對F1值的影響Table 7 Effect of β on F1

由表6可知，當(dāng)α從0.1增大到0.2時，各數(shù)據(jù)集上的F1值逐漸增大，并在α=0.2時取得最大值.而當(dāng)α繼續(xù)增大時，各數(shù)據(jù)集上的F1值逐漸減小直至為0.這是因為當(dāng)α達(dá)到一定值時，若繼續(xù)增大，社區(qū)中滿足條件的條件屬性會減少，獲取的推薦規(guī)則也會減少，最終導(dǎo)致F1值越來越小.所以，在算法1中，根據(jù)統(tǒng)計原理求得α的方法是可行的.

由表7可知，隨著β的增大，各數(shù)據(jù)集上的F1值逐漸減小，直至為0，但均在β=0.1時取得最大值.這是因為當(dāng)β達(dá)到一定值時，若繼續(xù)增大，社區(qū)中滿足條件的決策屬性就會減少，獲取的推薦規(guī)則也會減少，最終導(dǎo)致F1值越來越小.所以，在算法1中，根據(jù)統(tǒng)計原理求得β的方法也是可行的.

綜上所述，本文將算法1的參數(shù)設(shè)置為λ=0.1，η=δ=0.5，并進(jìn)行如下對比實驗.

4.3 對比實驗結(jié)果

GRAWS[40]是基于弱概念相似度的組推薦算法，主要通過*算子誘導(dǎo)的網(wǎng)絡(luò)弱概念進(jìn)行社區(qū)劃分，并在劃分的社區(qū)中根據(jù)屬性弱概念下限相似度進(jìn)行組推薦.對于n位用戶和m個屬性的網(wǎng)絡(luò)決策形式背景，GRAWS的時間復(fù)雜度為O(λn3m2).為了驗證NRACF的有效性與運(yùn)行效率，將其與GRA-WS在不同的數(shù)據(jù)集上進(jìn)行對比實驗，結(jié)果如表8所示，表中黑體數(shù)字部分表示最優(yōu)值.

表8 NRACF與GRAWS的推薦效果及運(yùn)行時間對比Table 8 Comparison of recommendation results and running time between NRACF and GRAWS

由表8可知，在7個數(shù)據(jù)集上，相比GRAWS，NRACF的推薦效果有小幅提升，但在運(yùn)行效率上有明顯提高.具體地，在精確度上，NRACF均優(yōu)于GRAWS.在召回率上，NRACF在ML-1m、ML-100k-u2、ML-100k-u5、Filmtrust數(shù)據(jù)集上優(yōu)于GRAWS.在F1值方面，除了ML-100k-u1、ML-100k-u4數(shù)據(jù)集，NRACF在其它數(shù)據(jù)集上都取得最優(yōu)值.在運(yùn)行時間上，NRACF的運(yùn)行時間明顯短于GRAWS，GRAWS的平均運(yùn)行時間為6 407.21 s，而NRACF的平均運(yùn)行時間為1 708.43 s，計算效率提升超過2倍.

為了進(jìn)一步驗證NRACF的有效性，將其與如下5種常見的推薦算法進(jìn)行對比.

1)User-Based CF(User-Based Collaborative Filtering)[17].基于用戶的協(xié)同過濾推薦算法，通過用戶之間的相似性對目標(biāo)用戶進(jìn)行預(yù)測評分.

2)Item-Based CF(Item-Based Collaborative Filtering)[18].基于項目的協(xié)同過濾推薦算法，通過計算項目之間的相似度，并根據(jù)評分信息預(yù)測目標(biāo)項目.

3)GraphRec[41].基于圖神經(jīng)網(wǎng)絡(luò)的社交推薦算法，利用圖神經(jīng)網(wǎng)絡(luò)對社交網(wǎng)絡(luò)中的用戶和項目的特征進(jìn)行學(xué)習(xí)，預(yù)測評分.

4)ETBRec(A Novel Recommendation Algorithm Combining the Double Influence of Trust Relationship and Expert Users)[42].結(jié)合用戶信任關(guān)系和專家用戶影響的協(xié)同過濾推薦算法，通過用戶之間的相似性構(gòu)造信任關(guān)系矩陣，并根據(jù)用戶的信任度和積極態(tài)度計算各用戶成為專家的可能，結(jié)合信任關(guān)系矩陣和專家進(jìn)行預(yù)測評分.

5)TF*Clarity(Term Frequency*Clarity)[43].結(jié)合標(biāo)簽相關(guān)性和用戶社會關(guān)系的推薦算法，構(gòu)建標(biāo)簽相關(guān)矩陣和社交關(guān)系相似矩陣，獲取用戶標(biāo)簽矩陣，并進(jìn)行預(yù)測評分.

各對比算法在各數(shù)據(jù)集上的精確度、召回率和F1值的對比結(jié)果如表9～表11所示，表中黑體數(shù)字表示最優(yōu)值.

由表9～表11可知：在精確度上，NRACF在所有數(shù)據(jù)集上都優(yōu)于其它算法；在召回率上，NRACF在ML-1m、ML-100k-u2、Filmtrust數(shù)據(jù)集上優(yōu)于其它算法；在F1值上，除了ML-100k-u4數(shù)據(jù)集，NRACF在其它數(shù)據(jù)集上都得到最優(yōu)值.

表9 各算法在7個數(shù)據(jù)集上的精確度對比Table 9 Accuracy comparison of different algorithms on 7 datasets

表10 各算法在7個數(shù)據(jù)集上的召回率對比Table 10 Recall comparison of different algorithms on 7 datasets

表11 各算法在7個數(shù)據(jù)集上的F1值對比Table 11 F1 value comparison of different algorithms on 7 datasets

綜上所述，在選取的大部分?jǐn)?shù)據(jù)集上，NRACF在精確度、召回率和F1值上均表現(xiàn)出明顯優(yōu)勢.因此，對于網(wǎng)絡(luò)鄰域推薦任務(wù)，當(dāng)數(shù)據(jù)集上的條件屬性與決策屬性之間存在較強(qiáng)的因果力時，建議采用NRACF.

5 結(jié) 束語

本文結(jié)合網(wǎng)絡(luò)決策形式背景、變精度算子、Pearl因果力理論，提出基于因果力的鄰域推薦算法(NRACF)，并運(yùn)用在MovieLens、Filmtrust數(shù)據(jù)集上.通過對比實驗發(fā)現(xiàn)，NRACF整體上性能較優(yōu)，這有助于形式概念分析與因果推斷的交叉融合研究.今后，還可進(jìn)一步結(jié)合因果涌現(xiàn)、因果推斷與網(wǎng)絡(luò)形式背景，開展其它研究.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡