国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種面向任務(wù)需求的群智感知任務(wù)分配模型*

2021-09-24 11:12:36廖祎瑋趙國生謝寶文
關(guān)鍵詞:類別標(biāo)簽聚類

王 鑫,廖祎瑋,趙國生,王 健,謝寶文

(1.哈爾濱師范大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院,黑龍江 哈爾濱 150025; 2.哈爾濱理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150080)

1 引言

移動(dòng)群智感知是指利用移動(dòng)設(shè)備來收集、分析和共享感知信息與數(shù)據(jù)。隨著移動(dòng)設(shè)備的普及,移動(dòng)群智感知技術(shù)得到了越來越多的關(guān)注[1],并且已經(jīng)廣泛服務(wù)于各大應(yīng)用領(lǐng)域,如交通狀況監(jiān)控[2]、環(huán)境監(jiān)測[3]和移動(dòng)社交推薦[4]等。在移動(dòng)群智感知系統(tǒng)中,感知任務(wù)具有類型多、范圍廣和數(shù)量大等基本特性。面向不同的任務(wù)需求,將任務(wù)分配給合適的用戶以提高任務(wù)與用戶的匹配度,同時(shí)提高任務(wù)的分配效率成為群智感知任務(wù)分配的關(guān)鍵。

目前,國內(nèi)外很多學(xué)者對群智感知任務(wù)分配問題展開了研究。Amintoosi等[5]針對社會(huì)感知中參與者復(fù)雜的、未知的社交關(guān)系提出一種參與者選擇架構(gòu),根據(jù)參與者的適合性得分和參與者間的相互信任度選擇合適的參與者。Xiao等[6]基于貪心算法提出了一種最大程度提高已招募用戶的效率同時(shí)在截止時(shí)間內(nèi)使感知支出最小的用戶招募算法,該算法招募多個(gè)用戶合作完成感知任務(wù)。韓俊櫻等[7]提出了基于貪婪算法的分布式多任務(wù)分配方法,該方法劃分任務(wù)和用戶區(qū)域,動(dòng)態(tài)定價(jià)并發(fā)任務(wù)組合構(gòu)成的任務(wù)路徑,根據(jù)感知用戶的歷史信譽(yù)度分配任務(wù)。上述任務(wù)分配機(jī)制主要以用戶或平臺(tái)為中心進(jìn)行設(shè)計(jì),沒有考慮任務(wù)與用戶的聯(lián)系。為解決上述問題,Zhao等[8]提出一種每個(gè)任務(wù)最多由一個(gè)用戶來完成的感知任務(wù)拍賣機(jī)制,該機(jī)制并沒有考慮任務(wù)分配過程中用戶可靠性的影響。Peng等[9]提出在任務(wù)分配時(shí)首先預(yù)測用戶的期望任務(wù)完成質(zhì)量來選擇高可靠性的用戶,并且為了使用戶提交的數(shù)據(jù)質(zhì)量更高,根據(jù)用戶實(shí)際提交的數(shù)據(jù)質(zhì)量來決定用戶的報(bào)酬。劉媛妮等[10]以最大化用戶效用為目的提出了一種基于拍賣模型的激勵(lì)機(jī)制,該機(jī)制以任務(wù)為中心選擇贏標(biāo)用戶且基于臨界價(jià)格對贏標(biāo)用戶支付報(bào)酬,該機(jī)制中用戶可將未完成任務(wù)轉(zhuǎn)售他人。Han等[11]研究了一種用戶根據(jù)感知時(shí)間和感知成本對平臺(tái)發(fā)布的感知任務(wù)進(jìn)行競爭的激勵(lì)機(jī)制,感知平臺(tái)在預(yù)算約束下支付報(bào)酬。Koutsopoulos[12]基于反向競拍模型考慮到平臺(tái)的預(yù)算條件約束,設(shè)計(jì)了一種最小化平臺(tái)預(yù)算成本的激勵(lì)機(jī)制,該機(jī)制結(jié)合用戶貢獻(xiàn)的數(shù)據(jù)量和數(shù)據(jù)質(zhì)量進(jìn)行用戶選擇與報(bào)酬支付。

群智感知中感知平臺(tái)發(fā)布的任務(wù)是多類的,用戶完成不同類別任務(wù)的效力也互不相同,上述研究均沒有考慮到面向任務(wù)需求的用戶分配問題,無法滿足任務(wù)需求的復(fù)雜性。王濤春等[13]提出了從5個(gè)方面評估參與者信譽(yù)度的參與者信譽(yù)評估方案,包括參與者歷史信譽(yù)度、提交數(shù)據(jù)的響應(yīng)時(shí)間、距離、數(shù)據(jù)相關(guān)性和數(shù)據(jù)質(zhì)量,通過建立信譽(yù)評估方程計(jì)算出參與者本次提交數(shù)據(jù)后的信譽(yù)度,新任務(wù)由群智感知網(wǎng)絡(luò)根據(jù)更新后的信譽(yù)度選擇合適的參與者來完成。Messaoud等[14]提出了在滿足信息質(zhì)量與能量約束的條件下,最大化信息質(zhì)量和最小化能耗地選擇合適的用戶參與感知任務(wù),該機(jī)制基于禁忌搜索算法且對能量和信息質(zhì)量敏感。Li等[15]基于感知任務(wù)的實(shí)時(shí)性和異構(gòu)性難題提出根據(jù)離線算法和在線算法來招募合適的參與者。Luo等[16]提出了一個(gè)基于Stackelberg博弈的激勵(lì)框架,該框架考慮了不同情況下平臺(tái)和用戶之間的交互關(guān)系以及任務(wù)之間的相互關(guān)系。Feng等[17]設(shè)計(jì)一種考慮用戶和任務(wù)的位置關(guān)聯(lián)的激勵(lì)機(jī)制,該機(jī)制基于逆向競拍框架,用戶根據(jù)自身的位置信息響應(yīng)感知任務(wù)并上報(bào)目標(biāo)報(bào)酬,感知平臺(tái)通過贏標(biāo)價(jià)決策算法決定贏標(biāo)價(jià),以最小化預(yù)算成本。上述任務(wù)分配機(jī)制雖面向任務(wù)需求對用戶進(jìn)行選擇,但未明確用戶適合完成任務(wù)的類別,未考慮用戶具有完成多類別任務(wù)的能力,且一旦有新任務(wù)推送會(huì)再次對用戶信息進(jìn)行處理,增加了機(jī)制的整體復(fù)雜性。因此,構(gòu)建一種以任務(wù)為中心,篩選適合任務(wù)類別且滿足任務(wù)其他需求的用戶的高效任務(wù)分配模型有重要研究意義。

針對上述問題,本文提出了一種任務(wù)需求特征提取算法TRFEA(Task Requirement Feature Extraction Algorithm)和用戶標(biāo)簽分類方法相結(jié)合的TREAULCM(Task Requirement Extraction Algorithm and User Label Classification Method)任務(wù)分配模型。利用任務(wù)需求特征提取算法提取感知任務(wù)的類別關(guān)鍵詞,通過多線性神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到數(shù)據(jù)集中各類數(shù)據(jù)的高層特征并利用徑向基核函數(shù)將高層特征融合,通過多核學(xué)習(xí)訓(xùn)練得到分類器,利用分類器預(yù)測用戶的類型標(biāo)簽。根據(jù)任務(wù)類別、空間位置信息和用戶參與度選擇滿足任務(wù)需求的用戶分發(fā)任務(wù)。本文主要貢獻(xiàn)包括以下2點(diǎn):

(1)本文通過用戶標(biāo)簽分類方法得到適合用戶的任務(wù)類別標(biāo)簽,根據(jù)任務(wù)需求選擇合適的用戶進(jìn)行任務(wù)分發(fā),實(shí)現(xiàn)用戶優(yōu)選。

(2)本文針對多線性神經(jīng)網(wǎng)絡(luò)2個(gè)全連接層提取到的特征,采用多核學(xué)習(xí)方法將它們在核空間中自適應(yīng)融合,融合后的特征有更好的表現(xiàn)力和魯棒性。

2 群智感知任務(wù)分配模型

群智感知的經(jīng)典網(wǎng)絡(luò)體系結(jié)構(gòu)由任務(wù)發(fā)布者、感知平臺(tái)和感知用戶3部分組成。任務(wù)發(fā)布者向感知平臺(tái)購買感知數(shù)據(jù);感知平臺(tái)根據(jù)感知任務(wù)需求和激勵(lì)機(jī)制等選擇合適的感知用戶發(fā)布任務(wù),并對用戶提交的數(shù)據(jù)進(jìn)行評估和支付報(bào)酬;感知用戶可根據(jù)自身?xiàng)l件有選擇性地參與任務(wù)。

2.1 模型描述

本文提出的任務(wù)分配模型如圖1所示。該模型首先對感知任務(wù)進(jìn)行處理,明確感知任務(wù)類別,然后通過用戶標(biāo)簽分類方法對數(shù)據(jù)集進(jìn)行訓(xùn)練,得到分類器,利用分類器得到適合用戶處理的任務(wù)類別并給予用戶該類標(biāo)簽。在任務(wù)分配過程中,感知平臺(tái)選擇符合任務(wù)類別且滿足其他任務(wù)需求的用戶執(zhí)行任務(wù),使任務(wù)分配更有針對性,任務(wù)完成后對用戶的標(biāo)簽進(jìn)行迭代預(yù)測。

Figure 1 Model of task assignment圖1 任務(wù)分配模型

2.2 問題描述

感知平臺(tái)發(fā)布的不同類別的感知任務(wù),意味著不同的任務(wù)需求。只有從任務(wù)需求的角度選擇和感知任務(wù)需求匹配度更高的用戶參與任務(wù),才能最大限度保證任務(wù)的完成率和感知數(shù)據(jù)的可用性,使得資源利用最大化,減少感知平臺(tái)工作量。本文提出任務(wù)需求特征提取算法TRFEA和用戶標(biāo)簽分類方法,其中TRFEA用于提取感知任務(wù)類型的關(guān)鍵詞;用戶標(biāo)簽分類方法用于提取用戶類型標(biāo)簽。

3 任務(wù)需求類型的提取

發(fā)布的感知任務(wù)可形式化地描述為任務(wù)屬性向量task=(Tt,U,Lab,St,W,Par),其中,Tt代表任務(wù)的文字描述;U代表需要招募的感知用戶數(shù)量;Lab代表任務(wù)要求的用戶類型;St為感知任務(wù)的位置信息;W為任務(wù)要求的距離遠(yuǎn)近度;Par為任務(wù)要求的用戶參與度。用矩陣Bg×e存放任務(wù)向量,其中g(shù)個(gè)任務(wù)用g行表示,任務(wù)的第e個(gè)屬性用第e列表示。任務(wù)集可表示為Task={task1,task2,…,taskt}。

感知用戶可形式化地描述為用戶屬性向量user=(X,Y,Su),其中,X為用戶的數(shù)據(jù)集;Y為用戶的標(biāo)簽集;Su為用戶的位置信息。用矩陣Qx×f存放用戶向量,其中x個(gè)用戶用x行表示,用戶的第f個(gè)屬性用第f列表示。用戶集可表示為User={user1,user2,…,useru}。為了方便理解,表1給出了本文部分符號(hào)標(biāo)記及其對應(yīng)的定義。

Table 1 Symbols and their definitions表1 符號(hào)及其定義

本文提出了TRFEA算法來提取感知任務(wù)的類別關(guān)鍵詞。TRFEA算法用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度并自適應(yīng)地確定聚類中心個(gè)數(shù)。去除任務(wù)文字描述中無實(shí)際意義的虛詞和代詞,得到所有任務(wù)的詞集Tx={T1,T2,…,Tnu},將其用空間向量模型表示,轉(zhuǎn)換成高維空間中的向量,然后對這些向量聚類。Txi表示任務(wù)taski的詞集,任一Txi可表示為以特征項(xiàng)的權(quán)重為分量的向量Ti,其中每個(gè)詞或詞組作為特征項(xiàng),權(quán)重為詞或詞組出現(xiàn)的頻數(shù)。

每個(gè)Ti到聚類中心Cj(j=1,2,…,q)的隸屬度Fij的計(jì)算公式為:

(1)

其中,ψ是模糊指數(shù),此處取ψ=2;‖Ti-Cj‖表示第i個(gè)任務(wù)的描述向量與第j個(gè)聚類中心之間的歐幾里得距離,所有任務(wù)到每個(gè)聚類中心隸屬度總和為1。

聚類中心的計(jì)算公式為:

(2)

設(shè)置目標(biāo)函數(shù)JFK:

(3)

對于聚類算法得到的聚類中心集C={C1,C2,…,Cq}中任一聚類結(jié)果Cs,把構(gòu)成Cs的每一個(gè)任務(wù)看作一個(gè)有v個(gè)不同單詞的序列W=(w1,w2,…,wv),每一個(gè)wi到該類的主題詞服從泊松分布,并把聚類中心集C中涉及的所有不同單詞組成大集合Word。通過統(tǒng)計(jì)主題LDA(Latent Dirichlet Allocation)模型來識(shí)別潛藏的主題信息。TRFEA算法流程如算法1所示:

算法1TRFEA算法

輸入:任務(wù)描述集Tx={T1,T2,…,Tnu}。

輸出:各類任務(wù)的類別關(guān)鍵詞集合Lab。

步驟1隨機(jī)得到自適應(yīng)q個(gè)模糊聚類中心Cj,并初始化,設(shè)迭代次數(shù)num=0;

步驟2通過式(1)計(jì)算每個(gè)Ti到聚類中心Cj的隸屬度Fij;

步驟3通過式(2)計(jì)算聚類中心。根據(jù)Cj的變化,重新計(jì)算隸屬度Fij;

步驟4通過式(3)計(jì)算目標(biāo)函數(shù)JFK,如果目標(biāo)函數(shù)不收斂,num=num+1,返回步驟3,否則得到聚類中心集C,轉(zhuǎn)步驟5;

步驟5設(shè)置主題的參數(shù)α和詞的參數(shù)δ,兩者均隨著訓(xùn)練和學(xué)習(xí)過程自動(dòng)變化;

步驟6對于聚類結(jié)果Cs中每個(gè)詞wi,根據(jù)其到各個(gè)主題發(fā)生的概率P(θ|α)得到主題分布θ,主題個(gè)數(shù)設(shè)為Tnum,并以概率P(Zs|θ)選擇當(dāng)前的主題Zs;

步驟7按照當(dāng)前主題Zs下的多項(xiàng)分布概率P(topici|Zs,δ),選擇一個(gè)單詞topici,topici∈Word;

步驟8對于每類任務(wù)主題詞的結(jié)果集Topic={topic1,topic2,…,topicTnum},返回步驟1進(jìn)行聚類分析,直到結(jié)果集Topic不再變化,轉(zhuǎn)步驟9;

步驟9Lab=Topic,并返回Lab。

4 用戶標(biāo)簽的分類

明確任務(wù)需求基礎(chǔ)上的用戶選擇問題實(shí)際上是篩選和任務(wù)需求更匹配的用戶,本文提出了一種多線性神經(jīng)網(wǎng)絡(luò)結(jié)合多核學(xué)習(xí)的用戶標(biāo)簽分類方法,如圖2所示,其中MLSVM(Multi Label Support Vector Machine)表示多核支持向量機(jī)。該方法首先通過多線性神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)集得到各類數(shù)據(jù)的高層特征并利用徑向基核函數(shù)融合特征,根據(jù)已知的類別信息通過多核學(xué)習(xí)訓(xùn)練得到一個(gè)分類器,待預(yù)測用戶的數(shù)據(jù)經(jīng)過分類器可得到該用戶的標(biāo)簽集。

Figure 2 Framework of user label classification method 圖2 用戶標(biāo)簽分類方法框架

4.1 感知數(shù)據(jù)特征提取

對于數(shù)據(jù)集{(X1,Y1),(X2,Y2),…,(XHH,YHH)},數(shù)據(jù)集中數(shù)據(jù)信息表示為Xh={xh1,xh2,…,xhη},xh*∈χ,χ為數(shù)據(jù)空間,η為Xh中數(shù)據(jù)個(gè)數(shù),Yh?Y為Xh的標(biāo)簽集Yh={yh1,yh2,…,yhλ},Y為標(biāo)簽空間,λ為Yh中包含的標(biāo)簽個(gè)數(shù)。對數(shù)據(jù)集中每類數(shù)據(jù)均隨機(jī)抽取2/3并去掉標(biāo)簽組成訓(xùn)練集Tr,對于每類數(shù)據(jù)進(jìn)行高層特征提取并得到核函數(shù)。

本文設(shè)計(jì)了一種卷積層-池化層循環(huán)的優(yōu)化多線性神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),保持了網(wǎng)絡(luò)良好的可區(qū)分性,縮短了計(jì)算時(shí)間。本文搭建多線性神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提取各類數(shù)據(jù)的高層特征,該網(wǎng)絡(luò)結(jié)構(gòu)的前5層每層由卷積層和池化層構(gòu)成,用l1~l5表示。ac1和ac2表示第6層和第7層,第6層、第7層為全連接層,將第6層和第7層特征作為2種不同的高層特征。將訓(xùn)練集Tr輸入到搭建好的網(wǎng)絡(luò)中。首先計(jì)算每個(gè)神經(jīng)元的輸出值。

(1)卷積層。

(4)

(2)池化層。

(5)

(3)全連接層。

(6)

其中,pl-1表示第l-1層所有特征圖的加權(quán)結(jié)果。

其次,反向計(jì)算多線性神經(jīng)網(wǎng)絡(luò)整體損失函數(shù)。設(shè)任一帶標(biāo)簽樣本Ii(i=1,2,…,Nm),Nm表示訓(xùn)練集樣本總個(gè)數(shù),Ii的標(biāo)簽實(shí)際上是一對多標(biāo)簽。

(7)

(8)

損失函數(shù)E0的計(jì)算公式為:

(9)

(10)

更新多線性神經(jīng)網(wǎng)絡(luò)的參數(shù)H,同時(shí)最小化損失函數(shù)E0:

(11)

其中,ω表示多線性神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,決定了每步調(diào)整的幅度;H(i)表示第i組更新的參數(shù)。

最后根據(jù)式(6),分別得到ac1、ac2層輸出結(jié)果ac1-r、ac2-r,二者分別包含了ac1、ac2層計(jì)算得到的所有特征圖,將其作為待融合的全連接層特征。

本文利用徑向基核函數(shù)解決全連接層特征融合問題。進(jìn)一步地,可以利用基于核的分類器得到用戶的類型標(biāo)簽。

(12)

其中,k(Xn) 表示第n類數(shù)據(jù)的核函數(shù);za表示Xn中第a個(gè)數(shù)據(jù)在多核某一尺度下ac1層的特征向量ac1-r;zb表示Xn中第b個(gè)數(shù)據(jù)在多核某一尺度下ac2層的特征向量ac2-r,μ表示帶寬參數(shù)。

4.2 多標(biāo)簽分類器

在群智感知任務(wù)分配中一個(gè)用戶可完成多類任務(wù),故而用戶的數(shù)據(jù)樣本分布特征存在差異性,如果數(shù)據(jù)采用同一種高維映射方式,會(huì)忽略不同任務(wù)類別的差異性。因此,本文采用多核學(xué)習(xí)方法通過融合不同權(quán)系數(shù)的核函數(shù)使分類的靈活性和準(zhǔn)確性更高。

根據(jù)得到的每類數(shù)據(jù)的核函數(shù)和訓(xùn)練集數(shù)據(jù)的類別信息,采用SimpleMKL工具箱訓(xùn)練得到一個(gè)MLSVM分類器hy并得到權(quán)系數(shù)βn(1≤n≤N),完成多核融合過程,如圖3所示。

Figure 3 Multi-kernel fusion process圖3 多核融合過程

(13)

5 TREAULCM任務(wù)分配模型

本文根據(jù)任務(wù)的需求類別、距離遠(yuǎn)近度和用戶參與度3種因素共同決定感知用戶的選擇,實(shí)現(xiàn)滿足任務(wù)需求的任務(wù)分配。

在實(shí)際的群智感知任務(wù)分配問題中,感知平臺(tái)希望選擇距離較近的感知用戶參與感知任務(wù)以減少報(bào)酬支出,感知用戶也會(huì)偏向于參與離自身位置較近的任務(wù),為了最大化用戶的參與意愿,最小化平臺(tái)支出,本文考慮到任務(wù)與用戶的空間位置信息,提出距離遠(yuǎn)近度W作為任務(wù)分配的決定性因素之一,計(jì)算公式如下:

Wij=1-min[logodis(Sti,Suj),1],Wij∈[0,1]

(14)

其中,Wij為任務(wù)taski和用戶userj的距離遠(yuǎn)近度,Wij越接近1,則無論從感知平臺(tái)還是從用戶角度考慮,雙方的開銷都越??;o為感知平臺(tái)設(shè)置的任務(wù)區(qū)域半徑,即在該半徑內(nèi)選擇用戶參與任務(wù);dis(Sti,Suj)表示任務(wù)taski的位置Sti到用戶userj的位置Suj的歐幾里得距離。

為了選擇更活躍的用戶參與任務(wù)以保證已分配任務(wù)的完成情況,且調(diào)動(dòng)用戶的參與積極性,本文提出以用戶參與度作為用戶選擇的決定性因素之一。在本文模型中,用戶參與度由其之前在其他感知任務(wù)中的表現(xiàn)共同決定。

設(shè)frj是用戶userj對所分配任務(wù)的執(zhí)行總次數(shù),fej是用戶userj對所分配任務(wù)的未執(zhí)行總次數(shù),用戶userj在過去任務(wù)中積累的執(zhí)行情況為:

(15)

感知平臺(tái)對用戶提供的數(shù)據(jù)進(jìn)行評分,評分值在[1,5],結(jié)合用戶執(zhí)行任務(wù)的情況,可計(jì)算用戶userj的參與度:

(16)

其中,num為用戶完成任務(wù)的總個(gè)數(shù);s(i)為用戶完成任務(wù)taski后平臺(tái)的評分;min(i)和max(i)為對完成任務(wù)taski的所有用戶,平臺(tái)評分最低值和最高值。

TREAULCM任務(wù)分配模型詳細(xì)描述如下:

(1)對于任務(wù)集Task={task1,task2,…,taskt},通過算法1得到任務(wù)taski的類別關(guān)鍵詞Labi。

(2)對于用戶集User={user1,user2,…,useru},將數(shù)據(jù)通過用戶標(biāo)簽分類方法訓(xùn)練好的MLSVM分類器得到用戶userj的類型標(biāo)簽集YLabj。

(3)根據(jù)任務(wù)要求的用戶類型篩選用戶。如果YLabj中某一元素是Labi中的元素,那么userj進(jìn)入候選用戶集Usercd={user1,user2,…,userc}(1

(4)計(jì)算候選用戶集中所有用戶到任務(wù)taski的距離遠(yuǎn)近度,形成以距離遠(yuǎn)近度降序排列的新候選用戶序列Usercd1。

(5)對于Usercd1中用戶,以用戶參與度降序排列得到用戶序列Usercd2。

(6)根據(jù)任務(wù)需要招募的感知用戶數(shù)量,從前往后選取Usercd2中需求用戶數(shù)量×120%個(gè)用戶組成最終的待分發(fā)任務(wù)用戶集。

6 仿真分析

為了驗(yàn)證本文的TRFEA算法在任務(wù)需求特征提取方面的效率和準(zhǔn)確性,將TRFEA算法與IKAnalyzer算法[18]和傳統(tǒng)的最長子串LCS(Longest Common Subsequence)算法進(jìn)行對比。其中,IKAnalyzer算法[18]是一種中文文本的分詞技術(shù),它根據(jù)給定的字符而不是依賴于字符數(shù)量來分詞,該算法掃描文本,遇到預(yù)先定義的字符才會(huì)進(jìn)行分詞;LCS算法具有語種獨(dú)立性,適用處理中文文本,該算法不需要對文本內(nèi)容進(jìn)行語言預(yù)處理,并且對提取出的公共子字符串的長度沒有限制。

為了驗(yàn)證本文模型在任務(wù)分配中的高效性和準(zhǔn)確性,在相同實(shí)驗(yàn)環(huán)境下,將本文模型與采用余弦相似度計(jì)算方法的用戶選擇激勵(lì)模型TRIM(Task Requirement-oriented user selection Incentive Mechanism)[19]和基于邏輯回歸LR(Logistic Regression)方法的任務(wù)分配模型[20]進(jìn)行比較。

6.1 仿真環(huán)境

實(shí)驗(yàn)基于Python 3.5以及TensorFlow 2.0實(shí)現(xiàn),并在Linux環(huán)境下運(yùn)行。本文數(shù)據(jù)集由公用數(shù)據(jù)集MSRC-v2[21]中的數(shù)據(jù)組成,MSRC-v2[21]數(shù)據(jù)集包含23類的591幅圖像,每幅圖像大小為320×213左右,其中很多圖像同時(shí)屬于多類。在數(shù)據(jù)集上每類數(shù)據(jù)均隨機(jī)選取2/3的樣本組成訓(xùn)練集,剩余樣本用作測試。根據(jù)數(shù)據(jù)集MSRC-v2[21]隨機(jī)生成由23種類別信息和其他文字組成的任務(wù)文字描述,每個(gè)任務(wù)描述大于100字符數(shù),作為實(shí)驗(yàn)中的感知平臺(tái)發(fā)布的任務(wù)信息,并對包含類別信息的詞或詞組進(jìn)行標(biāo)記,同時(shí)隨機(jī)生成其他任務(wù)需求;由MSRC-v2[21]數(shù)據(jù)集中591幅圖像數(shù)據(jù)組成用戶的歷史感知數(shù)據(jù),并隨機(jī)生成其他用戶信息,構(gòu)造100個(gè)感知用戶。

根據(jù)數(shù)據(jù)集設(shè)置主題數(shù)目Tnum=23,聚類中心個(gè)數(shù)q=23,參數(shù)α=50/Tnum,參數(shù)δ=0.01,多線性神經(jīng)網(wǎng)絡(luò)中初始學(xué)習(xí)率ω=0.001,帶寬參數(shù)μ=0.05,核函數(shù)的總個(gè)數(shù)N=23,在[0,1]隨機(jī)選擇用戶參與度。

6.2 實(shí)驗(yàn)分析

6.2.1 任務(wù)類別關(guān)鍵詞提取準(zhǔn)確率

TRFEA算法著重于提高任務(wù)類別關(guān)鍵詞提取的準(zhǔn)確率,任務(wù)類別關(guān)鍵詞提取的準(zhǔn)確率與任務(wù)文本的長度具有相關(guān)性,通過式(17)計(jì)算任務(wù)類別關(guān)鍵詞的提取準(zhǔn)確率Tra,如圖4所示。

(17)

其中,CHd表示其有標(biāo)記的關(guān)鍵詞的字符數(shù);fqb表示其有標(biāo)記的關(guān)鍵詞在文本中出現(xiàn)的頻數(shù);CH表示提取出的所有關(guān)鍵詞的字符數(shù);fq表示其提取出的關(guān)鍵詞在文本中出現(xiàn)的頻數(shù)。

Figure 4 Extraction accuracy of task category keywords 圖4 任務(wù)類別關(guān)鍵詞提取準(zhǔn)確率

從圖4可以看出,TRFEA算法的任務(wù)類別關(guān)鍵詞提取準(zhǔn)確率明顯高于IKAnalyzer算法和傳統(tǒng)的LCS算法的,準(zhǔn)確率在85%以上,且隨著任務(wù)字符數(shù)的增多呈上升趨勢。這是因?yàn)門RFEA算法采用了自適應(yīng)聚類方法,該方法用隸屬度確定聚類中心,對任務(wù)需求進(jìn)行聚類預(yù)處理,該方法提取出的詞或詞組不會(huì)由于截取而失去其原本的含義,并且能夠自適應(yīng)調(diào)整聚類中心,不斷優(yōu)化任務(wù)類別關(guān)鍵詞與任務(wù)的契合性。又因?yàn)門RFEA算法用LDA模型將文本信息轉(zhuǎn)化成易于建模的數(shù)字信息,所以其與文本描述的任務(wù)需求類別更為貼近,模型會(huì)隨著信息的增多更加完善,使TRFEA算法提取關(guān)鍵詞的準(zhǔn)確率更高。IKAnalyzer算法雖然分詞較為準(zhǔn)確,但是由于并不具有關(guān)鍵詞提取的功能,僅通過給定字符分詞,缺乏自主性和能動(dòng)性,使得提取準(zhǔn)確率較低。綜上,TRFEA算法的任務(wù)類別關(guān)鍵詞提取準(zhǔn)確率較高。

6.2.2 任務(wù)類別關(guān)鍵詞提取時(shí)間

任務(wù)類別關(guān)鍵詞提取時(shí)間會(huì)隨著測試文本長度的增加而增加,本文選取了100個(gè)任務(wù)文本來測試算法的執(zhí)行時(shí)間,并求取平均值,結(jié)果如圖5所示。

Figure 5 Relationship of execution time and the number of task characters圖5 執(zhí)行時(shí)間與任務(wù)字符數(shù)的關(guān)系

從圖5可以看出,TRFEA算法提取任務(wù)類別所需時(shí)間少于傳統(tǒng)的LCS算法的,略多于IKAnalyzer算法的。因?yàn)門RFEA算法在進(jìn)行詞或詞組提取時(shí)需對文本進(jìn)行聚類提取,而傳統(tǒng)的LCS算法對提取出的公共子字符串的長度沒有限制,該算法的空間復(fù)雜度會(huì)隨著文本分句長度的增長呈平方倍增長。TRFEA算法將文本信息轉(zhuǎn)化成數(shù)字信息進(jìn)而識(shí)別關(guān)鍵詞,降低了空間復(fù)雜度,因此效率高于傳統(tǒng)的LCS算法。IKAnalyzer算法需要掃描文本尋找指定的字符進(jìn)行分詞,因此耗時(shí)與TRFEA算法相近。但是,TRFEA算法使用的聚類方法適合處理批量任務(wù),隨著任務(wù)數(shù)量的增加,總的任務(wù)需求提取時(shí)間少于IKAnalyzer算法和傳統(tǒng)的LCS算法的,如圖6所示,此處選用的任務(wù)文本長度在[200,400]。

Figure 6 Relationship of execution time and the number of tasks圖6 執(zhí)行時(shí)間與任務(wù)數(shù)量的關(guān)系

綜上分析,本文的TRFEA算法適用于任務(wù)需求的提取,準(zhǔn)確率高于IKAnalyzer算法和傳統(tǒng)的LCS算法的,處理多個(gè)任務(wù)的效率也優(yōu)于兩者。

6.2.3 任務(wù)分發(fā)效率

在相同時(shí)間內(nèi)對TRIM模型、LR模型和本文TREAULCM模型進(jìn)行任務(wù)分發(fā)率(Tdr)對比,結(jié)果如圖7所示。通過式(18)計(jì)算Tdr:

(18)

其中,Tdrp表示單位時(shí)間內(nèi)成功分發(fā)的任務(wù)個(gè)數(shù);Tdrs表示單位時(shí)間內(nèi)待分發(fā)任務(wù)的總數(shù)。假設(shè)每小時(shí)待分發(fā)的任務(wù)數(shù)為500個(gè),任務(wù)分發(fā)率越高,模型效率越高。

從圖7可以看出,在相同時(shí)間內(nèi)TREAULCM的任務(wù)分發(fā)率明顯大于LR模型的,略大于TRIM模型的。這是由于隨著任務(wù)數(shù)量的增加,多線性神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型不斷最小化損失函數(shù),并更新網(wǎng)絡(luò)中各個(gè)參數(shù)使任務(wù)分配模型不斷完善。因此,TREAULCM的任務(wù)分發(fā)率更高。

Figure 7 Comparison of task distribution rate圖7 任務(wù)分發(fā)率對比

6.2.4 感知任務(wù)與用戶的匹配度

為了驗(yàn)證文本模型對任務(wù)與用戶匹配的準(zhǔn)確性,本文選擇了基于空間權(quán)值向量的余弦度量法計(jì)算任務(wù)-用戶匹配度。將任務(wù)的類別關(guān)鍵詞和用戶標(biāo)簽抽象為詞語向量,余弦度量法通過計(jì)算兩者的夾角余弦值得到任務(wù)-用戶匹配度。具體過程如下:

假設(shè)Wd={wd1,wd2,…,wdε}是任務(wù)taski的描述Ti和用戶userj的類型標(biāo)簽YLabj的所有詞集合。taski的類別關(guān)鍵詞Labi在Wd中的出現(xiàn)次數(shù)為c1i(1≤i≤ε);用戶userj的類型標(biāo)簽在Wd中的出現(xiàn)次數(shù)為c2i(1≤i≤ε),分別可以表示為向量Mi=(c11,c12,…,c1ε)和Nj=(c21,c22,…,c2ε)。任務(wù)-用戶匹配度計(jì)算如下所示:

(19)

表2為根據(jù)式(19)計(jì)算TRIM模型、LR模型和TREAULCM對MSRC-v2數(shù)據(jù)集上不同類別的平均任務(wù)-用戶匹配度。從表2可以看出,TREAULCM模型對不同類別任務(wù)的識(shí)別度更高,這表明TREAULCM模型具有準(zhǔn)確性高的優(yōu)點(diǎn)。

任務(wù)-用戶匹配度越大,表明用戶完成該類別任務(wù)的優(yōu)勢越大。圖8表明隨著任務(wù)數(shù)量的增加,TREAULCM的平均任務(wù)-用戶匹配度略高于TRIM模型的,明顯高于LR模型的。這是因?yàn)闊o論采用余弦相似度計(jì)算方法的用戶選擇激勵(lì)模型TRIM還是基于邏輯回歸(LR)方法的任務(wù)分配模型,在用戶選擇上依賴固定的設(shè)置,缺乏靈活性;而本文的用戶標(biāo)簽分類方法不斷調(diào)整分類器的最優(yōu)參數(shù),隨著任務(wù)數(shù)量和迭代次數(shù)的增加,用戶標(biāo)簽不斷更新,使任務(wù)與用戶的匹配有更高的準(zhǔn)確性。因此,本文模型在用戶選擇方面有較大的優(yōu)勢。

Figure 8 Relationship of number of tasks and average task-user matching圖8 任務(wù)數(shù)量與平均任務(wù)-用戶匹配度的關(guān)系

7 結(jié)束語

本文針對群智感知中的任務(wù)分配問題,提出了一種面向任務(wù)需求的任務(wù)分配模型。由于任務(wù)需求具有多元性,本文首先通過TRFEA算法提取感知任務(wù)的類別關(guān)鍵詞;然后通過用戶標(biāo)簽分類方法得到用戶類型標(biāo)簽,根據(jù)任務(wù)類別、空間位置信息和用戶參與度選擇滿足任務(wù)需求的用戶分發(fā)任務(wù)。仿真結(jié)果表明,與其他模型相比,本文提出的模型能以較少的時(shí)間開銷相對準(zhǔn)確地選擇合適的用戶執(zhí)行任務(wù),能夠批量處理用戶數(shù)據(jù),適合大宗任務(wù)分發(fā)。然而現(xiàn)實(shí)中任務(wù)平臺(tái)和用戶任務(wù)交互過程復(fù)雜且受到的隨機(jī)干擾因素眾多,可能會(huì)影響用戶類型標(biāo)簽的預(yù)測。本文模型對隨機(jī)因素的考慮還不夠全面,針對這個(gè)問題進(jìn)行改進(jìn)是下一步研究的重點(diǎn)。

Table 2 Average task-user matching degree of different task types in three models表2 3種模型對不同任務(wù)類別的平均任務(wù)-用戶匹配度

猜你喜歡
類別標(biāo)簽聚類
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
車迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
標(biāo)簽化傷害了誰
服務(wù)類別
新校長(2016年8期)2016-01-10 06:43:59
基于改進(jìn)的遺傳算法的模糊聚類算法
基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
論類別股東會(huì)
商事法論集(2014年1期)2014-06-27 01:20:42
中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
岚皋县| 肥西县| 龙川县| 商水县| 台州市| 普定县| 兴化市| 安国市| 衡山县| 千阳县| 蚌埠市| 新乡市| 凤山县| 荔波县| 灵台县| 会昌县| 大丰市| 大同市| 克东县| 诏安县| 乡宁县| 嘉黎县| 溆浦县| 石家庄市| 江都市| 师宗县| 樟树市| 三江| 平度市| 乳源| 宝山区| 鲜城| 南靖县| 曲松县| 莲花县| 高州市| 色达县| 民勤县| 江达县| 惠来县| 临颍县|