国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向邊緣智能計(jì)算的數(shù)據(jù)場(chǎng)分類(lèi)算法

2022-11-30 08:39:16孫志于王琪高彬梁中軍徐曉斌王尚廣
計(jì)算機(jī)應(yīng)用 2022年11期
關(guān)鍵詞:邊緣分布式分類(lèi)

孫志于,王琪,高彬,梁中軍,徐曉斌,王尚廣

面向邊緣智能計(jì)算的數(shù)據(jù)場(chǎng)分類(lèi)算法

孫志于1,王琪2,高彬2,梁中軍3*,徐曉斌2,王尚廣4

(1.新疆氣象信息中心,烏魯木齊 830002; 2.北京工業(yè)大學(xué) 信息學(xué)部,北京 100124; 3.國(guó)家氣象信息中心 資料服務(wù)室,北京 100081; 4.網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室(北京郵電大學(xué)),北京 100876)(?通信作者電子郵箱 liangzj@cma.gov.cn)

針對(duì)聚類(lèi)算法研究中普遍存在不能充分利用歷史信息、參數(shù)優(yōu)化過(guò)程慢的問(wèn)題,結(jié)合邊緣智能計(jì)算提出了一種基于數(shù)據(jù)場(chǎng)的分布式自適應(yīng)分類(lèi)算法,算法部署于邊緣計(jì)算(EC)節(jié)點(diǎn),提供本地的智能分類(lèi)服務(wù)。該算法通過(guò)引入監(jiān)督信息改造傳統(tǒng)數(shù)據(jù)場(chǎng)聚類(lèi)模型的結(jié)構(gòu),使其能夠應(yīng)用于分類(lèi)問(wèn)題,擴(kuò)展了數(shù)據(jù)場(chǎng)理論可應(yīng)用的領(lǐng)域?;跀?shù)據(jù)場(chǎng)思想,該算法將數(shù)據(jù)的域值空間轉(zhuǎn)化為數(shù)據(jù)勢(shì)場(chǎng)空間,依據(jù)空間勢(shì)值將數(shù)據(jù)分為無(wú)標(biāo)簽的多個(gè)類(lèi)簇結(jié)果,再將類(lèi)簇結(jié)果與歷史監(jiān)督信息進(jìn)行云相似度比較,并將其歸屬于與其最相似的類(lèi)中;同時(shí),提出了一種基于滑動(dòng)步長(zhǎng)的參數(shù)搜索策略以提高算法參數(shù)的優(yōu)化速度。在此算法基礎(chǔ)上還提出了一種基于分布式的數(shù)據(jù)處理方案,通過(guò)云中心與邊緣設(shè)備的協(xié)作,將分類(lèi)任務(wù)切割分配到不同層次的節(jié)點(diǎn),實(shí)現(xiàn)模塊化、低耦合。仿真結(jié)果表明,所提算法的查準(zhǔn)率和查全率均保持在96%以上,且漢明損失均低于0.022。實(shí)驗(yàn)結(jié)果表明,所提算法可以準(zhǔn)確分類(lèi)并提高參數(shù)優(yōu)化速度,整體性能優(yōu)于邏輯回歸(LR)算法與隨機(jī)森林(RF)算法。

邊緣智能計(jì)算;分布式數(shù)據(jù)處理;參數(shù)優(yōu)化;數(shù)據(jù)場(chǎng);自適應(yīng)分類(lèi)

0 引言

隨著數(shù)以億計(jì)的智能終端部署于醫(yī)院、學(xué)校、工廠等地,在各個(gè)終端內(nèi)產(chǎn)生了海量的數(shù)據(jù)。其中,很多數(shù)據(jù)都需要做出及時(shí)的決策,但受限于本地的計(jì)算能力,終端無(wú)法對(duì)數(shù)據(jù)進(jìn)行有效處理,這時(shí)終端節(jié)點(diǎn)就需要占用網(wǎng)絡(luò)鏈路將本地?cái)?shù)據(jù)上傳,并等待云端反饋結(jié)果[1]。為了減少網(wǎng)絡(luò)通信時(shí)間、實(shí)現(xiàn)更快的本地響應(yīng),邊緣計(jì)算(Edge Computing, EC)將云計(jì)算的資源、計(jì)算、存儲(chǔ)能力下沉到本地邊緣設(shè)備(如網(wǎng)關(guān)、基站等),使大量計(jì)算可直接在本地進(jìn)行。近些年來(lái),學(xué)者們?cè)陉P(guān)于EC的具體實(shí)踐提出了兩種思路:一是設(shè)計(jì)合理的通信與計(jì)算資源聯(lián)合分配方案[2];二是將機(jī)器學(xué)習(xí)技術(shù)引入EC,提供一種本地的泛智能服務(wù)[3-4]。文獻(xiàn)[3]中提出了一種用于EC環(huán)境中的自動(dòng)攻擊檢測(cè)系統(tǒng),利用EC能力來(lái)有效地執(zhí)行基于云上預(yù)構(gòu)建的復(fù)雜極限學(xué)習(xí)機(jī)器模型的流量分類(lèi);文獻(xiàn)[4]提出了一種基于長(zhǎng)短期記憶(Long Short?Term Memory, LSTM)網(wǎng)絡(luò)的面向移動(dòng)邊緣網(wǎng)絡(luò)的智能互聯(lián)車(chē)輛信道預(yù)測(cè)模型,該模型能夠捕獲序列中有價(jià)值的信息,很好地分析信道參數(shù)的時(shí)空相關(guān)性。文獻(xiàn)[3-4]將機(jī)器學(xué)習(xí)技術(shù)和EC有機(jī)結(jié)合在一起,不僅為機(jī)器學(xué)習(xí)技術(shù)找到了實(shí)踐應(yīng)用的方向,也使邊緣設(shè)備更加智能。

以機(jī)器學(xué)習(xí)為代表的智能技術(shù)有效地?cái)U(kuò)大了EC的應(yīng)用空間,經(jīng)過(guò)優(yōu)化的模型并不會(huì)占用太多的資源,很適用于部署于邊緣設(shè)備以提供高效的服務(wù)[5]。更進(jìn)一步地,采用分布式的EC與機(jī)器學(xué)習(xí)框架,可以為整個(gè)系統(tǒng)帶來(lái)更高的智能,利用終端采集大量的數(shù)據(jù),聯(lián)合邊緣服務(wù)器與云端共同學(xué)習(xí)算法,智能地通過(guò)云中心與邊緣節(jié)點(diǎn)的協(xié)作交換學(xué)習(xí)參數(shù),通過(guò)動(dòng)態(tài)的系統(tǒng)優(yōu)化與應(yīng)用級(jí)的調(diào)整,可以更好地訓(xùn)練和推斷模型,達(dá)到更高的智能[6]。

現(xiàn)在很多經(jīng)典的機(jī)器學(xué)習(xí)算法被廣泛應(yīng)用于EC,為邊緣設(shè)備提供各種服務(wù)[7]。本文主要提出一種基于數(shù)據(jù)場(chǎng)的自適應(yīng)學(xué)習(xí)的分類(lèi)算法,類(lèi)似于傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù),同樣可以部署于EC中,提供有效的分類(lèi)服務(wù)。分類(lèi)算法是當(dāng)前數(shù)據(jù)挖掘領(lǐng)域中最重要的技術(shù)之一,為數(shù)據(jù)處理提供重要的支撐作用。分類(lèi)算法通過(guò)學(xué)習(xí)有標(biāo)簽的樣本數(shù)據(jù)、優(yōu)化模型參數(shù)、訓(xùn)練分類(lèi)器,從而獲得預(yù)測(cè)未知類(lèi)型數(shù)據(jù)的能力[8]。

數(shù)據(jù)場(chǎng)理論基于傳統(tǒng)物理學(xué),將多維數(shù)據(jù)映射為多維空間內(nèi)的對(duì)象點(diǎn)。映射后的對(duì)象會(huì)在數(shù)據(jù)空間內(nèi)相互作用,通過(guò)彼此的牽引形成場(chǎng)域,該場(chǎng)域也被稱為數(shù)據(jù)場(chǎng)。現(xiàn)在,學(xué)者們基于數(shù)據(jù)場(chǎng)提出了多種聚類(lèi)算法[9-10],這些聚類(lèi)算法在各自的應(yīng)用領(lǐng)域均取到了良好的效果?;跀?shù)據(jù)場(chǎng)的聚類(lèi)算法具有參數(shù)依賴量少、算法適應(yīng)性強(qiáng)的優(yōu)點(diǎn),但是也有不能充分利用歷史信息、參數(shù)優(yōu)化過(guò)程慢的缺點(diǎn)。

本文改進(jìn)傳統(tǒng)數(shù)據(jù)場(chǎng)聚類(lèi)算法的結(jié)構(gòu),引入了監(jiān)督信息,使其可以應(yīng)用于分類(lèi)問(wèn)題中;同時(shí),為了加快算法參數(shù)的優(yōu)化,提出了一種基于滑動(dòng)步長(zhǎng)的搜索策略,避免了傳統(tǒng)模型陷入過(guò)擬合或欠擬合的問(wèn)題,通過(guò)學(xué)習(xí)數(shù)據(jù)之間的相互關(guān)系將數(shù)據(jù)分類(lèi),且僅依賴于少量的參數(shù);還提出了一種基于分布式的數(shù)據(jù)處理方案,通過(guò)云中心與邊緣設(shè)備的協(xié)作,將分類(lèi)任務(wù)切割分配到不同層次的節(jié)點(diǎn),實(shí)現(xiàn)模塊化、低耦合。

1 相關(guān)工作

傳統(tǒng)的分類(lèi)算法有基于決策樹(shù)的算法、基于貝葉斯的算法和基于神經(jīng)網(wǎng)絡(luò)的算法等。文獻(xiàn)[11]基于經(jīng)典的ID3算法提出了一種改進(jìn)的疾病預(yù)測(cè)分類(lèi)方法,解決了數(shù)值屬性離散化的問(wèn)題;文獻(xiàn)[12]提出了一種用于寬帶無(wú)線電中的信號(hào)分類(lèi)和干擾檢測(cè)技術(shù),使用貝葉斯分類(lèi)器將各種窄帶信號(hào)分類(lèi)為各自的調(diào)制,檢測(cè)不同窄帶信號(hào)的干擾;文獻(xiàn)[13]提出了一種基于粒子分類(lèi)優(yōu)化的BP網(wǎng)絡(luò)客戶流失預(yù)測(cè)算法,優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,提高了預(yù)測(cè)精度。傳統(tǒng)的分類(lèi)算法存在一些弊端,如容易陷入過(guò)擬合、欠擬合,也不易分析數(shù)據(jù)間的相互關(guān)系。

分布式分類(lèi)算法可以提高分類(lèi)的效率,很多研究者對(duì)基于分布式分類(lèi)算法進(jìn)行了研究。如文獻(xiàn)[14]提出了一種分布式像素統(tǒng)計(jì)方法,探討了分布式處理技術(shù)開(kāi)發(fā)用于監(jiān)督分割和高分辨率遙感圖像分類(lèi)方法的有效性,以縮短所需的計(jì)算時(shí)間;文獻(xiàn)[15]描述了用于分布式優(yōu)化的交替方向乘子算法的具體實(shí)現(xiàn),實(shí)現(xiàn)在大型數(shù)據(jù)集上運(yùn)行具有L2正則化的邏輯回歸。

基于數(shù)據(jù)場(chǎng)的分類(lèi)方法在聚類(lèi)中應(yīng)用較多,文獻(xiàn)[16]研究了基于數(shù)據(jù)場(chǎng)的K?Means聚類(lèi)雷達(dá)信號(hào)分類(lèi)算法,將數(shù)據(jù)場(chǎng)引入非自由度雷達(dá)信號(hào)排序以消除噪聲;文獻(xiàn)[17]提出了一種基于數(shù)據(jù)場(chǎng)聚類(lèi)和云模型分區(qū)的算法,以解決相鄰群集中心的估計(jì)問(wèn)題。由于數(shù)據(jù)場(chǎng)沒(méi)有監(jiān)督信息,是自適應(yīng)而形成的類(lèi),所以傳統(tǒng)的數(shù)據(jù)場(chǎng)只能用于聚類(lèi)而不能用于分類(lèi)。

本文提出一種基于數(shù)據(jù)場(chǎng)的自學(xué)習(xí)分類(lèi)算法,通過(guò)將數(shù)據(jù)場(chǎng)理論應(yīng)用到分類(lèi)問(wèn)題中,引入監(jiān)督信息,利用類(lèi)的數(shù)量對(duì)參數(shù)進(jìn)行優(yōu)化,充分利用現(xiàn)有信息,使分類(lèi)更加高效。利用分布式的數(shù)據(jù)處理方案,將分類(lèi)任務(wù)切割分配到不同層次的節(jié)點(diǎn),實(shí)現(xiàn)模塊化、低耦合。

2 基于數(shù)據(jù)場(chǎng)的分布式自適應(yīng)分類(lèi)算法

2.1 數(shù)據(jù)場(chǎng)

在物理學(xué)中,某一物理量在空間區(qū)域的分布稱為場(chǎng),如磁場(chǎng)、引力場(chǎng)等,物質(zhì)粒子之間的相互作用通過(guò)場(chǎng)的作用來(lái)實(shí)現(xiàn)。隨著場(chǎng)論的發(fā)展,它被抽象為一個(gè)數(shù)學(xué)概念來(lái)描述物理量或數(shù)學(xué)函數(shù)在空間中的分布[18]。數(shù)據(jù)場(chǎng)理論突破了在傳統(tǒng)數(shù)據(jù)挖掘領(lǐng)域中數(shù)據(jù)對(duì)象只有一對(duì)一的映射關(guān)系,因?yàn)樗J(rèn)為在數(shù)域空間內(nèi)的數(shù)據(jù)可以互相作用,從而在整體上形成一個(gè)新的勢(shì)值場(chǎng)域。

式(1)被稱為勢(shì)值函數(shù),其中:是單位數(shù)據(jù)點(diǎn)的質(zhì)量;是數(shù)據(jù)點(diǎn)之間的歐氏距離;是數(shù)據(jù)場(chǎng)的影響因子。影響因子會(huì)影響數(shù)據(jù)對(duì)象之間相互作用力的大小,從而影響數(shù)據(jù)勢(shì)場(chǎng)的分布,影響分類(lèi)決策。圖1描述了基于高斯隨機(jī)函數(shù)生成的兩團(tuán)類(lèi)簇。

圖2 影響因子對(duì)于分類(lèi)結(jié)果的影響

2.2 基于滑動(dòng)步長(zhǎng)的參數(shù)優(yōu)化搜索策略

現(xiàn)有關(guān)于數(shù)據(jù)場(chǎng)影響因子的優(yōu)化普遍面向聚類(lèi)過(guò)程,不能完全適用于分類(lèi)任務(wù)。優(yōu)化的核心在于是否對(duì)分類(lèi)標(biāo)簽進(jìn)行了有效學(xué)習(xí)。舊有的優(yōu)化方法一般分為兩類(lèi):一是基于經(jīng)驗(yàn)的選取,二是基于信息熵的選取。

如圖3所示,多分類(lèi)的數(shù)據(jù)集會(huì)在數(shù)據(jù)場(chǎng)內(nèi)形成多峰的數(shù)據(jù)勢(shì)圖,越靠近勢(shì)值中心其勢(shì)值會(huì)越大。其中,峰值代表了分類(lèi)簇的分類(lèi)中心,是局部勢(shì)值的極大點(diǎn)。

圖3 面向兩個(gè)分類(lèi)簇的3D勢(shì)圖

本文利用滑動(dòng)搜索框?qū)ふ揖植縿?shì)值的極大點(diǎn),搜索框如圖4所示。圖4描述了一個(gè)簡(jiǎn)單的數(shù)據(jù)勢(shì)場(chǎng),滑動(dòng)框會(huì)沿著上、下、左、右四個(gè)方向向框內(nèi)勢(shì)值最大的方向滑動(dòng)。當(dāng)框內(nèi)中心勢(shì)值達(dá)到最大時(shí),滑動(dòng)框會(huì)將此最大點(diǎn)返回,作為分類(lèi)中心。

圖4 局部勢(shì)值與滑動(dòng)搜索框

當(dāng)面對(duì)多分類(lèi)問(wèn)題時(shí),將在勢(shì)值場(chǎng)內(nèi)均勻分布生成與分類(lèi)個(gè)數(shù)相同的搜索框,當(dāng)各個(gè)搜索框停止搜索返回后,若發(fā)現(xiàn)兩個(gè)搜索框重合,則需要再隨機(jī)生成一個(gè)搜索框,直到生成與分類(lèi)目標(biāo)簇?cái)?shù)相同的獨(dú)立中心。

2.3 基于數(shù)據(jù)場(chǎng)的自學(xué)習(xí)分類(lèi)算法

本文提出了一種基于數(shù)據(jù)場(chǎng)的自學(xué)習(xí)分類(lèi)算法。算法分類(lèi)器的構(gòu)造需要學(xué)習(xí)目標(biāo)數(shù)據(jù)樣本的期望、熵、超熵、數(shù)據(jù)場(chǎng)影響因子。

通過(guò)對(duì)訓(xùn)練集進(jìn)行參數(shù)訓(xùn)練,構(gòu)造最優(yōu)分類(lèi)器模型,接著對(duì)未知類(lèi)別的數(shù)據(jù)進(jìn)行分類(lèi)分析,算法流程如下:

算法1 基于數(shù)據(jù)場(chǎng)的自學(xué)習(xí)分類(lèi)算法。

輸出 分類(lèi)結(jié)果。

步驟3 將局部最大勢(shì)值點(diǎn)確定為類(lèi)別中心;

2.4 基于分布式的智能算法

在網(wǎng)絡(luò)中,傳感器節(jié)點(diǎn)一般只負(fù)責(zé)收集數(shù)據(jù)并提交到上行匯聚節(jié)點(diǎn),如一些基站等邊緣節(jié)點(diǎn),可以利用本地有限的資源處理一些簡(jiǎn)單的信息處理任務(wù)。但面對(duì)不斷增長(zhǎng)的任務(wù)需求,傳統(tǒng)小規(guī)模集群越來(lái)越難以滿足機(jī)器學(xué)習(xí)算法訓(xùn)練、學(xué)習(xí)的需求。云中心可以支持多用戶共享物理資源,支持高效執(zhí)行多個(gè)模型任務(wù)的訓(xùn)練。

算法主要分為兩個(gè)部分:一是基于滑動(dòng)搜索的模型訓(xùn)練階段;二是基于模型預(yù)測(cè)的推理階段。模型的訓(xùn)練是一個(gè)探索性的過(guò)程,通過(guò)反復(fù)大量的運(yùn)算調(diào)整訓(xùn)練目標(biāo)超參數(shù),但EC節(jié)點(diǎn)難以滿足大量的計(jì)算需求,所以可以將模型的訓(xùn)練過(guò)程放到性能更為強(qiáng)大的云端進(jìn)行集中訓(xùn)練,再將訓(xùn)練好的模型分布式下發(fā)反饋到EC節(jié)點(diǎn)。將訓(xùn)練模型的任務(wù)從EC節(jié)點(diǎn)抽離,可以更好地減少EC節(jié)點(diǎn)的負(fù)荷,而且經(jīng)過(guò)優(yōu)化的模型并不會(huì)占用太多的資源,很適于部署到邊緣節(jié)點(diǎn)[6]。網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖5所示。

圖5 網(wǎng)絡(luò)拓?fù)鋱D

基于分布式的智能算法的具體過(guò)程如下:

1)傳感器節(jié)點(diǎn)收集數(shù)據(jù)并提交到推理層相應(yīng)的EC節(jié)點(diǎn)中。

2)各個(gè)EC節(jié)點(diǎn)將收集到的數(shù)據(jù)發(fā)送到訓(xùn)練層的云中心進(jìn)行訓(xùn)練。

3 實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集

本文實(shí)驗(yàn)采用了來(lái)自UCI(University of California Irvine)大學(xué)的鳶尾花數(shù)據(jù)集和人工生成的二維隨機(jī)數(shù)數(shù)據(jù)集。其中,二維隨機(jī)數(shù)數(shù)據(jù)集的數(shù)據(jù)共有三類(lèi)?;诙S數(shù)據(jù)的可視化,本文實(shí)驗(yàn)主要對(duì)鳶尾花數(shù)據(jù)集中花瓣長(zhǎng)度和花瓣寬度兩個(gè)維度進(jìn)行分類(lèi)處理。對(duì)數(shù)據(jù)集進(jìn)行分析,由于訓(xùn)練樣本具有天然不平衡性,本文實(shí)驗(yàn)使用逆向云模型提取數(shù)據(jù)集原始數(shù)據(jù)特征,再使用正向云模型重構(gòu)基于隨機(jī)數(shù)數(shù)據(jù)集的新數(shù)據(jù)集和基于鳶尾花原始數(shù)據(jù)特征的3個(gè)不同規(guī)模的數(shù)據(jù)集[21]。本文使用原始數(shù)據(jù)集作為訓(xùn)練集,將重構(gòu)數(shù)據(jù)作為測(cè)試集。二維隨機(jī)數(shù)數(shù)據(jù)集重構(gòu)數(shù)據(jù)如圖6所示,鳶尾花數(shù)據(jù)集重構(gòu)數(shù)據(jù)如圖7所示。

3.2 運(yùn)行環(huán)境

本文實(shí)驗(yàn)主要針對(duì)本文算法與邏輯回歸(Logistic Regression, LR)算法和隨機(jī)森林(Random Forest, RF)算法對(duì)鳶尾花數(shù)據(jù)集的分類(lèi)進(jìn)行比較。實(shí)驗(yàn)環(huán)境:操作系統(tǒng)為MacOS Catalina,開(kāi)發(fā)軟件為Matlab R2019a,CUP為Intel Core i5@2.40 GHz,內(nèi)存16 GB,硬盤(pán)容量512 GB。

3.3 實(shí)驗(yàn)結(jié)果與結(jié)果分析

表1 混淆矩陣

查準(zhǔn)率表示預(yù)測(cè)正確的結(jié)果占預(yù)測(cè)為正例中的比例,計(jì)算公式如下:

查全率表示預(yù)測(cè)正確的結(jié)果占實(shí)際為正例中的比例,計(jì)算公式如下:

漢明損失表示所有錯(cuò)誤預(yù)測(cè)樣本的比例,其值越小,模型的分類(lèi)能力越強(qiáng)。計(jì)算公式如下:

隨機(jī)數(shù)數(shù)據(jù)集的分類(lèi)結(jié)果如表2所示,由圖6可知隨機(jī)數(shù)據(jù)分為三類(lèi),可以看出在數(shù)據(jù)量很大的情況下,本文算法的查準(zhǔn)率和查全率都大于90%,保持在較高的水平。

表2 隨機(jī)數(shù)測(cè)試集規(guī)模為1 800時(shí)本文算法準(zhǔn)確率與漢明損失

圖6 使用云模型重構(gòu)的1 800個(gè)隨機(jī)數(shù)數(shù)據(jù)

不同測(cè)試集規(guī)模下的鳶尾花分類(lèi)實(shí)驗(yàn)結(jié)果對(duì)比如表3所示。

對(duì)比圖7(a)與表3可知,在數(shù)據(jù)規(guī)模為150時(shí),三種算法均對(duì)線性易區(qū)分的山鳶尾數(shù)據(jù)有了清晰的分類(lèi),在線性較不易區(qū)分的雜色鳶尾、維吉尼亞鳶尾的分類(lèi)中,本文算法相比LR算法和RF算法保持了較高或相近的查準(zhǔn)率、查全率水平。對(duì)比圖7(b)與表3可知,在數(shù)據(jù)規(guī)模為300時(shí),得到了與上一個(gè)實(shí)驗(yàn)相近的結(jié)果。對(duì)比圖7中的(a)、(b)、(c)可知,在數(shù)據(jù)規(guī)模為600時(shí),雜色鳶尾與維吉尼亞鳶尾數(shù)據(jù)大量交錯(cuò)在一起,線性極不易區(qū)分,分類(lèi)難度大。通過(guò)表3可知,在數(shù)據(jù)規(guī)模為600時(shí),本文算法在雜色鳶尾和維吉尼亞鳶尾的分類(lèi)中的查準(zhǔn)率和查全率仍高于RF算法;在雜色鳶尾數(shù)據(jù)的分類(lèi)中,查全率高于LR算法,但查準(zhǔn)率略低于LR算法;在維吉尼亞鳶尾的分類(lèi)中,查準(zhǔn)率高于LR算法,但查全率略低于LR算法。

表3 不同測(cè)試集規(guī)模下鳶尾花分類(lèi)實(shí)驗(yàn)結(jié)果對(duì)比 單位: %

通過(guò)表4可知,在三次不同規(guī)模數(shù)據(jù)集實(shí)驗(yàn)中,本文算法的漢明損失都要小于LR算法和RF算法。通過(guò)表3和表4可以得出結(jié)論:本文算法的分類(lèi)能力優(yōu)于LR算法和RF算法,整體性能上也優(yōu)于LR算法和RF算法。

圖7 云模型重構(gòu)的鳶尾花數(shù)據(jù).

表4 不同規(guī)模鳶尾花數(shù)據(jù)集下的漢明損失對(duì)比

4 結(jié)語(yǔ)

分類(lèi)算法是數(shù)據(jù)挖掘領(lǐng)域的重要組成部分,研究高效可靠的分類(lèi)算法已經(jīng)成為廣大研究者的重要目標(biāo)。本文主要提出了一種基于數(shù)據(jù)場(chǎng)的分類(lèi)算法,該算法可部署于EC設(shè)備中,提供有效的分類(lèi)服務(wù)。在基于分布式的系統(tǒng)中,利用云端訓(xùn)練模型、邊緣設(shè)備端推演模型,達(dá)到分層的協(xié)作。下一步的工作中,可以重點(diǎn)探討算法關(guān)于異常點(diǎn)的識(shí)別,進(jìn)一步優(yōu)化算法;同時(shí),也需要構(gòu)建更注重細(xì)節(jié)、更系統(tǒng)性的EC與機(jī)器學(xué)習(xí)的協(xié)同框架。

[1] STERGIOU C, PSANNIS K E, KIM B G, et al. Secure integration of IoT and cloud computing[J]. Future Generation Computer Systems, 2016, 78(3): 964-975.

[2] BOZORGCHENANI A, MASHHADI F, TARCHI D, et al. Multi? objective computation sharing in energy and delay constrained mobile edge computing environments[J]. IEEE Transactions on Mobile Computing, 2020, 20(10): 2992-3005.

[3] KOZIK R, CHORA? M, FICCO M, et al. A scalable distributed machine learning approach for attack detection in edge computing environments[J]. Journal of Parallel & Distributed Computing, 2018, 119: 18-26.

[4] LIU G, XU Y, HE Z, et al. Deep learning?based channel prediction for edge computing networks toward intelligent connected vehicles[J]. IEEE Access, 2019, 7: 114487-114495.

[5] ZHU G, LIU D, DU Y, et al. Toward an intelligent edge: wireless communication meets machine learning[J]. IEEE Communications Magazine, 2020, 58(1):19-25.

[6] WANG X, HAN Y, WANG C, et al. In?Edge AI: intelligentizing mobile edge computing, caching and communication by federated learning[J]. IEEE Network, 2019, 33(5): 156-165.

[7] CUI Q, GONG Z, NI W, et al. Stochastic online learning for mobile edge computing: learning from changes[J]. IEEE Communications Magazine, 2019, 57(3):63-69.

[8] SARITAS M M, YASAR A. Performance analysis of ANN and Naive Bayes classification algorithm for data classification[J]. International Journal of Intelligent Systems and Applications in Engineering, 2019, 7(2): 88-91.

[9] 盧意紅,王雪紅,薛開(kāi)創(chuàng),等.一種基于數(shù)據(jù)場(chǎng)聚類(lèi)的圖片相似性比較方法[J].光電技術(shù)應(yīng)用,2019,34(4):34-38,51.(LU Y H, WANG X H, XUE K C, et al. Image similarity comparison method based on data field clustering[J]. Electro?Optic Technology Application, 2019, 34(4): 34-38,51.)

[10] 郜麗鵬,沙作金.一種改進(jìn)的數(shù)據(jù)場(chǎng)聚類(lèi)算法[J].應(yīng)用科技, 2019, 46(6): 30-34.(GAO L P, SHA Z J. An improved data field clustering algorithm[J]. Applied Science and Technology, 2019, 46(6): 30-34.)

[11] YANG S, GUO J Z, JIN J W. An improved Id3 algorithm for medical data classification[J]. Computers & Electrical Engineering, 2018, 65: 474-487.

[12] MUGHAL M O, KIM S. Signal classification and jamming detection in wide?band radios using Naive Bayes classifier[J]. IEEE Communications Letters, 2018, 22(7): 1398-1401.

[13] YU R Y, AN X M, JIN B, et al. Particle classification optimization?based BP network for telecommunication customer churn prediction[J]. Neural Computing and Applications, 2018, 29(3): 707-720.

[14] VILLALON T, IVAN E. Distributed land use classification with improved processing time using high?resolution multispectral data[C]// IGARSS 2012: Proceedings of the 2012 IEEE International Geoscience and Remote Sensing Symposium. Piscataway: IEEE, 2012: 6987-6990.

[15] LUBELL D P, SONDAG J. Practical distributed classification using the Alternating Direction Method of Multipliers algorithm[C]// Proceedings of the IEEE International Conference on Big Data. Piscataway: IEEE, 2013: 773-776.

[16] FENG X, HU X, LIU Y. Radar signal sorting algorithm of k?means clustering based on data field[C]// ICCC 2017: Proceedings of the 2017 3rd IEEE International Conference on Computer and Communications. Piscataway: IEEE, 2017: 2262-2266.

[17] RUAN G Q, GUO Q, GONG X. Underdetermined mixing matrix estimation algorithm based on data field clustering and cloud model partitioning[C]// ICEMI 2017: Proceedings of the 2017 13th IEEE International Conference on Electronic Measurement & Instruments. Piscataway: IEEE, 2017: 337-342.

[18] 李德毅,劉常昱,杜鹢,等.不確定性人工智能[M].北京:國(guó)防工業(yè)出版社, 2004: 1583-1594.(LI D Y, LIU C Y, DU Y, et al. Artificial Intelligence with Uncertainty[M]. Beijing: National Defense Industry Press, 2004: 1583-1594.)

[19] WANG S L, GAN W Y, LI D Y, et al. Data field for hierarchical clustering[J]. International Journal of Data Warehousing & Mining, 2011, 7(4): 43-63.

[20] 余陽(yáng).基于數(shù)據(jù)場(chǎng)的聚類(lèi)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京理工大學(xué),2016:33-34.(YU Y. Design and Implementation of Cluster System Based on Data Field[D]. Beijing: Beijing Institute of Technology, 2016: 33-34.)

[21] 李杰,鄒慧蘭.大數(shù)據(jù)交叉映射融合的逆向云算法仿真[J].計(jì)算機(jī)仿真,2020,37(2):284-288.(LI J, ZOU H L. Reverse cloud algorithm simulation of big data cross mapping fusion [J]. Computer Simulation, 2020, 37(2): 284-288.)

Data field classification algorithm for edge intelligent computing

SUN Zhiyu1, WANG Qi2, GAO Bin2, LIANG Zhongjun3*, XU Xiaobin2, WANG Shangguang4

(1,830002,;2,,100124,;3,,100081,;4,,100876,)

In view of the general problems of not fully utilizing historical information and slow parameter optimization process in the research of clustering algorithms, an adaptive classification algorithm based on data field was proposed in combination with edge intelligent computing, which can be deployed on Edge Computing (EC) nodes to provide local intelligent classification service. By introducing supervision information to modify the structure of the traditional data field clustering model, the proposed algorithm enabled the traditional data field to be applied to classification problems, extending the applicable fields of data field theory. Based on the idea of the data field, the proposed algorithm transformed the domain value space of the data into the data potential field space, and divided the data into several unlabeled cluster results according to the spatial potential value. After comparing the cluster results with the historical supervision information for cloud similarity, the cluster results were attributed to the most similar category. Besides, a parameter search strategy based on sliding step length was proposed to speeded up the parameter optimization of the proposed algorithm. Based on this algorithm, a distributed data processing scheme was proposed. Through the cooperation of cloud center and edge devices, classification tasks were cut and distributed to different levels of nodes to achieve modularity and low coupling. Simulation results show that the precision and recall of the proposed algorithm maintained above 96%, and the Hamming loss was less than 0.022. Experimental results show that the proposed algorithm can accurately classify and accelerate the speed of parameter optimization, and outperforms than Logistic Regression (LR) algorithm and Random Forest (RF) algorithm in overall performance.

edge intelligent computing; distributed data processing; parameter optimization; data field; adaptive classification

SUN Zhiyu, born in 1973, senior engineer. His research interests include cloud computing, meteorological big data.

WANG Qi, born in 1998, M. S. candidate. Her research interests include space?air?ground integrated information network, internet of things, mobile edge computing.

GAO Bin, born in 1996, M. S. candidate. His research interests include network big data.

LIANG Zhongjun, born in 1983, Ph. D., senior engineer. His research interests include cloud computing, meteorological big data.

XU Xiaobin, born in 1986, Ph. D., lecturer. His research interests include space?air?ground integrated information network, internet of things, mobile edge computing.

WANG Shangguang, born in 1982, Ph. D., professor. His research interests include service computing, 6G, mobile edge computing.

TP301

A

1001-9081(2022)11-3473-06

10.11772/j.issn.1001-9081.2021091692

2021?09?29;

2021?10?29;

2021?11?08。

孫志于(1973—),男,江蘇新沂人,高級(jí)工程師,主要研究方向:云計(jì)算、氣象大數(shù)據(jù);王琪(1998—),女,北京人,碩士研究生,主要研究方向:天地一體化信息網(wǎng)絡(luò)、物聯(lián)網(wǎng)、移動(dòng)邊緣計(jì)算;高彬(1996—),男,山西太原人,碩士研究生,主要研究方向:網(wǎng)絡(luò)大數(shù)據(jù);梁中軍(1983—),男,新疆烏魯木齊人,高級(jí)工程師,博士,主要研究方向:云計(jì)算、氣象大數(shù)據(jù);徐曉斌(1986—),男,河南鶴壁人,講師,博士,CCF會(huì)員,主要研究方向:天地一體化信息網(wǎng)絡(luò)、物聯(lián)網(wǎng)、移動(dòng)邊緣計(jì)算;王尚廣(1982—),男,河南周口人,教授,博士,CCF會(huì)員,主要研究方向:服務(wù)計(jì)算、6G、移動(dòng)邊緣計(jì)算。

猜你喜歡
邊緣分布式分類(lèi)
分類(lèi)算一算
分類(lèi)討論求坐標(biāo)
數(shù)據(jù)分析中的分類(lèi)討論
分布式光伏熱錢(qián)洶涌
能源(2017年10期)2017-12-20 05:54:07
教你一招:數(shù)的分類(lèi)
分布式光伏:爆發(fā)還是徘徊
能源(2017年5期)2017-07-06 09:25:54
一張圖看懂邊緣計(jì)算
基于DDS的分布式三維協(xié)同仿真研究
西門(mén)子 分布式I/O Simatic ET 200AL
在邊緣尋找自我
雕塑(1999年2期)1999-06-28 05:01:42
文化| 托里县| 普安县| 嘉定区| 大新县| 贵溪市| 汶上县| 海伦市| 福泉市| 渭源县| 宜阳县| 仲巴县| 九江市| 花垣县| 镇康县| 昌都县| 富宁县| 修文县| 平安县| 城固县| 陆河县| 东明县| 曲阜市| 东莞市| 张家界市| 清流县| 延边| 凤凰县| 东光县| 彭山县| 安国市| 南漳县| 精河县| 太谷县| 鹤峰县| 中江县| 澄城县| 奎屯市| 咸阳市| 泾源县| 甘孜县|