国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于箱線圖異常檢測(cè)的指數(shù)加權(quán)平滑預(yù)測(cè)模型

2021-01-27 06:52:58顧國(guó)慶李曉輝
關(guān)鍵詞:線圖傳感突發(fā)事件

顧國(guó)慶,李曉輝

(華北計(jì)算技術(shù)研究所,北京 100083)

0 引 言

無線傳感網(wǎng)WSN(Wireless Sensor Network)是由大量邊緣傳感節(jié)點(diǎn)和少量匯聚節(jié)點(diǎn)組成的一種計(jì)算機(jī)網(wǎng)絡(luò),傳感節(jié)點(diǎn)相互協(xié)作監(jiān)控某一區(qū)域不同位置的環(huán)境狀況并將采集到的實(shí)時(shí)數(shù)據(jù)上傳至匯聚節(jié)點(diǎn)。這些傳感節(jié)點(diǎn)廣泛分布在一些監(jiān)管困難甚至長(zhǎng)期無人監(jiān)管的惡劣環(huán)境中,通常采用自攜式電池供電,因此如何減少傳感節(jié)點(diǎn)能耗、延長(zhǎng)傳感節(jié)點(diǎn)壽命成為該行業(yè)的一大痛點(diǎn)[1-2]。

目前國(guó)內(nèi)外學(xué)者主要從精簡(jiǎn)數(shù)據(jù)傳輸方面提出了一些解決方案,Lazaridis等人[3]在2003年提出了一種有界的傳輸數(shù)據(jù)壓縮方案,同年又提出了一種使用恒定值作為預(yù)測(cè)值的預(yù)測(cè)方案;Lim等人[4]在2005年提出了2種不同的自適應(yīng)線性預(yù)測(cè)模型;Santini等人[5]在2006年提出了最小均方差自適應(yīng)預(yù)測(cè)模型;Wei等人[6]在2011年提出了一種結(jié)合卡爾曼濾波和灰色模型兩者的預(yù)測(cè)方案;Razzaque等人[7]在2013年提出了3類數(shù)據(jù)預(yù)測(cè)方法,隨機(jī)方式[8-10]、時(shí)間序列方式[11-12]和復(fù)雜算法方式[13];Raza等人[14]在2016年提出了包括wake-up receiver和專用感應(yīng)設(shè)備的節(jié)能傳感器網(wǎng)絡(luò)模型;同年Tan等人[15]提出了基于前N項(xiàng)數(shù)據(jù)進(jìn)行分層的LMS模型;余修武等人[16]在2017年提出了一種基于分簇的自適應(yīng)的預(yù)測(cè)加權(quán)數(shù)據(jù)融合算法;魏煜等人[17]在2018年提出了基于線性預(yù)測(cè)模型和HeartBeat機(jī)制的LRPH算法來抵制丟包帶來的影響,同時(shí)提出了LRSH算法來優(yōu)化LRPH算法,減少冗余信息。

在實(shí)際監(jiān)測(cè)環(huán)境中,傳感節(jié)點(diǎn)有可能采集到異常數(shù)據(jù),而大多數(shù)現(xiàn)有的精簡(jiǎn)數(shù)據(jù)傳輸方案會(huì)將異常數(shù)據(jù)視為正常數(shù)據(jù),難以避免異常數(shù)據(jù)對(duì)模型預(yù)測(cè)帶來的負(fù)面影響。因此,本文提出一種基于箱線圖異常檢測(cè)機(jī)制的指數(shù)平滑預(yù)測(cè)模型,該模型創(chuàng)新性地引入箱線圖異常檢測(cè)機(jī)制過濾異常點(diǎn),同時(shí)為了更好地區(qū)分異常點(diǎn)和突發(fā)事件,引入短期環(huán)比作為判定依據(jù),最終有效過濾掉異常數(shù)據(jù),提高數(shù)據(jù)傳輸?shù)木?jiǎn)程度和預(yù)測(cè)準(zhǔn)確度,達(dá)到傳感節(jié)點(diǎn)節(jié)能降耗的效果。

1 指數(shù)加權(quán)平滑預(yù)測(cè)模型

1.1 指數(shù)加權(quán)平滑預(yù)測(cè)模型概述

指數(shù)加權(quán)平滑預(yù)測(cè)模型[18]是一種特殊的加權(quán)移動(dòng)平均方法,其對(duì)不同時(shí)間觀察值賦予不等的指數(shù)權(quán)重,距離預(yù)測(cè)值越近的觀察值被賦予的指數(shù)權(quán)重越大且呈指數(shù)變化。目前該模型在無線傳感網(wǎng)數(shù)據(jù)預(yù)測(cè)方面具有易實(shí)現(xiàn)、準(zhǔn)確度高以及低消耗等優(yōu)勢(shì),Gaura等人[19]在2013年提出的L-SIP預(yù)測(cè)模型正是采用指數(shù)加權(quán)平滑濾波方式進(jìn)行線性預(yù)測(cè)。

該模型存在3種具體表現(xiàn)形式:1)一次指數(shù)加權(quán)平滑針對(duì)沒有趨勢(shì)和季節(jié)性序列;2)雙指數(shù)加權(quán)平滑針對(duì)存在趨勢(shì)但沒有季節(jié)性序列;3)三次指數(shù)加權(quán)平滑針對(duì)存在趨勢(shì)且季節(jié)性序列。本文實(shí)驗(yàn)采用北京市密云區(qū)某監(jiān)測(cè)點(diǎn)全天PM10值和北京市東四某監(jiān)測(cè)點(diǎn)全天AQI值作為實(shí)驗(yàn)數(shù)據(jù),PM10和AQI序列存在趨勢(shì)但無季節(jié)性,因此采用雙指數(shù)加權(quán)平滑法作為預(yù)測(cè)模型最為適宜。

1.2 雙指數(shù)加權(quán)平滑預(yù)測(cè)模型原理

雙指數(shù)加權(quán)平滑模型是從一次指數(shù)加權(quán)平滑模型演變而來,一次指數(shù)平滑計(jì)算公式為:

(1)

(2)

可以看出權(quán)重值根據(jù)距離由近到遠(yuǎn)呈指數(shù)遞減規(guī)律,雙指數(shù)加權(quán)平滑模型是在一次指數(shù)加權(quán)平滑模型基礎(chǔ)上將趨勢(shì)作為一個(gè)額外考量,保留了趨勢(shì)的詳細(xì)信息。雙指數(shù)加權(quán)平滑計(jì)算公式為:

(3)

xt+T=AT+BTT

(4)

其中:

(5)

2 基于箱線圖異常檢測(cè)的雙指數(shù)加權(quán)平滑預(yù)測(cè)模型

2.1 整體流程

本文提出的預(yù)測(cè)模型是在雙指數(shù)加權(quán)平滑模型基礎(chǔ)上,引入箱線圖異常檢測(cè)機(jī)制處理異常數(shù)據(jù),同時(shí)通過短期環(huán)比判定突發(fā)事件,最終將結(jié)果匯聚到匯聚節(jié)點(diǎn)。該算法的數(shù)據(jù)處理流程如圖1所示,其大致可以劃分成4個(gè)階段。

圖1 數(shù)據(jù)處理流程

1)在數(shù)據(jù)采集初始化階段,傳感節(jié)點(diǎn)會(huì)以一定頻率采集數(shù)據(jù),如果傳感節(jié)點(diǎn)正處于開機(jī)狀態(tài),那么會(huì)初始化傳感節(jié)點(diǎn)和匯聚節(jié)點(diǎn)的預(yù)測(cè)模型;如果系統(tǒng)處于正常工作狀態(tài),則會(huì)跳過模型初始化的過程直接進(jìn)入到下一個(gè)階段。

2)在異常值檢測(cè)階段,傳感節(jié)點(diǎn)采集到的檢測(cè)值會(huì)與雙指數(shù)加權(quán)平滑模型進(jìn)行比較,如果差值在可接受范圍內(nèi),則直接跳過數(shù)據(jù)突發(fā)事件判定階段,傳感節(jié)點(diǎn)不上傳數(shù)據(jù),匯聚節(jié)點(diǎn)采用預(yù)測(cè)值作為監(jiān)測(cè)結(jié)果;如果預(yù)測(cè)值被判定為疑似異常點(diǎn),則將疑似異常值按照隊(duì)列的順序存入滑動(dòng)窗口,滑動(dòng)窗口是在傳感節(jié)點(diǎn)開辟的一塊內(nèi)存空間,用來存儲(chǔ)連續(xù)疑似異常點(diǎn)。

3)在突發(fā)事件判定階段,當(dāng)滑動(dòng)窗口存滿數(shù)據(jù)時(shí),取出滑動(dòng)窗口所有值進(jìn)行短期環(huán)比判斷是否為集中或趨勢(shì)數(shù)據(jù)集,如果是,則將該數(shù)據(jù)集全部上傳至匯聚節(jié)點(diǎn),修正模型參數(shù);如果不是,則清空滑動(dòng)窗口數(shù)據(jù),傳感節(jié)點(diǎn)不上傳數(shù)據(jù),同時(shí)匯聚節(jié)點(diǎn)采用預(yù)測(cè)值作為監(jiān)測(cè)結(jié)果。

4)在數(shù)據(jù)匯聚階段,匯聚節(jié)點(diǎn)同步傳感節(jié)點(diǎn)信息,如果匯聚節(jié)點(diǎn)接收到傳感節(jié)點(diǎn)上傳的數(shù)據(jù),則采用上傳數(shù)據(jù)作為監(jiān)測(cè)結(jié)果,否則采用模型預(yù)測(cè)值作為監(jiān)測(cè)結(jié)果。

2.2 箱線圖異常檢測(cè)機(jī)制

2.2.1 確定箱線圖參數(shù)

箱線圖[19]是一種用作顯示一組數(shù)據(jù)分散情況的統(tǒng)計(jì)圖,用于反映數(shù)據(jù)分布特征。箱線圖對(duì)異常數(shù)據(jù)的判定原理如下圖2所示:

圖2 箱線圖異常數(shù)據(jù)判定

Q1為一組數(shù)據(jù)的第一四分位點(diǎn),Xm為中位數(shù),Q3為第三四分位點(diǎn),IQR為Q3與Q1兩數(shù)之差。當(dāng)檢測(cè)值小于Q1-1.5 IQR或大于Q3+1.5 IQR時(shí),認(rèn)為該值屬于溫和異常值;當(dāng)檢測(cè)值小于Q1-3 IQR或大于Q3+3 IQR時(shí),認(rèn)為該值屬于極端異常值。異常值區(qū)邊界的設(shè)定基于經(jīng)驗(yàn)判斷,大量實(shí)踐表明該方法在處理異常數(shù)據(jù)方面性能表現(xiàn)優(yōu)異。一方面,箱線圖繪制僅依靠實(shí)際數(shù)據(jù),不需要事先假定數(shù)據(jù)服從特定的分布形式,沒有對(duì)數(shù)據(jù)做任何限制性要求,它真實(shí)直觀反映數(shù)據(jù)變化趨勢(shì)本來面貌;另一方面,箱線圖判斷異常值的標(biāo)準(zhǔn)以四分位數(shù)和四分位距為基礎(chǔ),四分位數(shù)具有一定耐抗性,多達(dá)25%的數(shù)據(jù)可以變得任意遠(yuǎn)而不會(huì)很大干擾四分位數(shù),所以異常值不會(huì)對(duì)這個(gè)標(biāo)準(zhǔn)施加影響,識(shí)別結(jié)果更加客觀。

2.2.2 異常檢測(cè)過程

根據(jù)箱線圖異常檢測(cè)機(jī)制,當(dāng)遇到陡然變化的數(shù)值時(shí),異常檢測(cè)系統(tǒng)將其判定為異常點(diǎn),同時(shí)該數(shù)據(jù)被傳感節(jié)點(diǎn)忽略不會(huì)上傳至匯聚節(jié)點(diǎn),以此類推,下一個(gè)監(jiān)測(cè)數(shù)據(jù)乃至該突發(fā)事件產(chǎn)生的一批監(jiān)測(cè)數(shù)據(jù)都會(huì)被忽略,無法上傳到匯聚節(jié)點(diǎn)。此時(shí)就會(huì)產(chǎn)生新的問題:異常點(diǎn)和突發(fā)事件難以被區(qū)分開,從而突發(fā)事件可能會(huì)被系統(tǒng)視為連續(xù)異常點(diǎn)被過濾掉。對(duì)于任一突發(fā)事件,其必定會(huì)持續(xù)一段時(shí)間,在這段時(shí)間內(nèi)必定會(huì)產(chǎn)生一批突發(fā)事件下的正常數(shù)據(jù),如果能檢測(cè)出這批數(shù)據(jù)本身具備趨勢(shì)性或相對(duì)集中,就能判定出該批數(shù)據(jù)是某一事件產(chǎn)生的而非異常點(diǎn)。

本文通過引入滑動(dòng)窗口暫存疑似突發(fā)事件的數(shù)據(jù)集,箱線圖異常檢測(cè)機(jī)制算法原理如下:

1:N←slide window size

2:X[N]←store exception data

3:while(true)

4:for(inti=0;i

5:if(exception data detected)

6:X[i]←exception data

7:i←i+1

8:if(iequalN)

9:break

10:if(no exception data detected)

11:cleanX

12:i←0

13:if(verifyXis an emergency)

14:reportXto sink node

15:modify model parameters

在傳感節(jié)點(diǎn)開辟一塊內(nèi)存作為滑動(dòng)窗口X用來存儲(chǔ)疑似異常點(diǎn),滑動(dòng)窗口大小為N。當(dāng)監(jiān)測(cè)數(shù)據(jù)為疑似異常點(diǎn)時(shí),將該數(shù)據(jù)按照隊(duì)列順序存入滑動(dòng)窗口X中。如果滑動(dòng)窗口X數(shù)據(jù)存滿,則說明采集到的疑似異常數(shù)據(jù)量已經(jīng)滿足突發(fā)事件最小數(shù)據(jù)量,只需判斷這批數(shù)據(jù)是否是突發(fā)事件,如果這批數(shù)據(jù)被判定為突發(fā)事件,則將這批數(shù)據(jù)上報(bào)至匯聚節(jié)點(diǎn)同時(shí)修改指數(shù)平滑加權(quán)模型;如果滑動(dòng)窗口未存滿時(shí),檢測(cè)到的數(shù)據(jù)不是疑似異常數(shù)據(jù),則清空滑動(dòng)窗口并將指針i重置為0。

2.3 短期環(huán)比判定突發(fā)事件

2.3.1 確定短期環(huán)比參數(shù)

本文通過短期環(huán)比(SS)來判斷一組數(shù)據(jù)是否具備趨勢(shì)性或相對(duì)集中,如公式(6)所示:

(6)

其中,threshold是動(dòng)態(tài)閾值,根據(jù)實(shí)際監(jiān)測(cè)環(huán)境設(shè)置,avg為這一組數(shù)的平均值,count_num是可接受超過動(dòng)態(tài)閾值的數(shù)目,如果判定條件較寬松,count_num可設(shè)置為較大值;如果判定條件嚴(yán)格,count_num則需要設(shè)置為較小值,其設(shè)值范圍在0~N之間。通過與動(dòng)態(tài)閾值的比較,就可以判斷出一組數(shù)據(jù)是否具備趨勢(shì)性或相對(duì)集中。

2.3.2 突發(fā)事件判定過程

短期環(huán)比判定突發(fā)事件算法原理如下:

1:X[N]← short term chain data sets

2:threshold ← set manually

according to the actual situation

3:count_num ← number of acceptable

exceeding dynamic threshold

4:sum ← 0 , avg ← 0

5:temp_num ← number of exceeding

dynamic threshold,default is 0

6:for(inti=0;i

7:sum+=X[i]

8:avg = sum/N

9:for(inti=0 ;i

10:if(|X[i]-avg|>threshold)

11:temp_num +=1

12:if(temp_num <= count_num)

13:this data set is normal

14:else

15:this data set is not normal

當(dāng)滑動(dòng)窗口存滿數(shù)據(jù)觸發(fā)了突發(fā)事件時(shí),通過短期環(huán)比驗(yàn)證該數(shù)據(jù)集是否具備相對(duì)集中或具備趨勢(shì)性的特征。具體流程如下:

1)取出滑動(dòng)窗口的所有數(shù)據(jù)集,統(tǒng)計(jì)所有數(shù)據(jù)總和sum并計(jì)算出平均值avg;

2)依次遍歷數(shù)據(jù)集的每個(gè)數(shù)據(jù)與平均值avg進(jìn)行比較,若兩者差值大于動(dòng)態(tài)閾值threshold,超過動(dòng)態(tài)閾值數(shù)目temp_num增加1;

3)遍歷結(jié)束后,若temp_num小于等于count_num,則可以判定該數(shù)據(jù)集為突發(fā)事件而非異常數(shù)據(jù)。傳感節(jié)點(diǎn)此時(shí)會(huì)將該數(shù)據(jù)集全部上傳給匯聚節(jié)點(diǎn),并同步更新預(yù)測(cè)模型參數(shù)。

3 實(shí)驗(yàn)驗(yàn)證

3.1 實(shí)驗(yàn)環(huán)境

本次實(shí)驗(yàn)使用Java語言實(shí)現(xiàn),集成開發(fā)環(huán)境是IntelliJ IDEA,采用MATLAB繪制圖形。硬件配置:Intel(R)Core(TM)i7-3770處理器、3.4 GHz最大主頻、16 GB運(yùn)行內(nèi)存、1 TB磁盤大小、64位Win7操作系統(tǒng)。

3.2 實(shí)驗(yàn)數(shù)據(jù)

本次實(shí)驗(yàn)數(shù)據(jù)集采用北京市密云區(qū)某監(jiān)測(cè)點(diǎn)全天PM10監(jiān)測(cè)值,為進(jìn)一步驗(yàn)證模型的魯棒性和普適性,又采用北京市東四某檢測(cè)點(diǎn)全天AQI監(jiān)測(cè)值不同地點(diǎn)和指標(biāo)的數(shù)據(jù)作為對(duì)比實(shí)驗(yàn)數(shù)據(jù)集,儀器每隔30 s采集一次實(shí)驗(yàn)數(shù)據(jù)并記錄,全天共產(chǎn)生2880個(gè)離散數(shù)據(jù)點(diǎn)。

3.3 實(shí)驗(yàn)結(jié)論及對(duì)比分析

為了便于研究異常數(shù)據(jù)對(duì)預(yù)測(cè)模型的影響,在原始數(shù)據(jù)集引入50個(gè)異常邊緣尖銳點(diǎn),首先不采用箱線圖法異常檢測(cè)機(jī)制,僅使用雙指數(shù)加權(quán)平滑模型進(jìn)行預(yù)測(cè)。經(jīng)過多次粗細(xì)粒度劃分,平滑指數(shù)設(shè)置為0.5為最佳,誤差閾值設(shè)置為4,考慮到傳感節(jié)點(diǎn)計(jì)算能力有限且距目標(biāo)點(diǎn)太遠(yuǎn)的數(shù)據(jù)對(duì)目標(biāo)點(diǎn)影響較小,所以本實(shí)驗(yàn)采用目標(biāo)點(diǎn)前8位數(shù)據(jù)作為預(yù)測(cè)模型數(shù)據(jù)集。其預(yù)測(cè)情況如圖3所示(其中圓圈圈出的尖銳點(diǎn)為部分引入異常點(diǎn),矩形框出的變化劇烈數(shù)據(jù)集為部分突發(fā)事件),通過分析圖3可以得出如下結(jié)論。

1)預(yù)測(cè)模型對(duì)邊緣尖銳點(diǎn)或劇烈變化數(shù)據(jù)集擬合程度高,反而對(duì)變化不大的平穩(wěn)數(shù)據(jù)集擬合出現(xiàn)少許波動(dòng)。從本質(zhì)上來說,前者并非擬合而來,反而是擬合偏差超過誤差范圍,傳感節(jié)點(diǎn)直接上報(bào)數(shù)據(jù),匯聚節(jié)點(diǎn)直接采用上報(bào)數(shù)據(jù),從而出現(xiàn)了邊緣尖銳點(diǎn)擬合度高,平穩(wěn)數(shù)據(jù)集擬合度低的反?,F(xiàn)象。

2)通過結(jié)論1分析可知,傳感節(jié)點(diǎn)上報(bào)往往發(fā)生在監(jiān)測(cè)結(jié)果為邊緣尖銳點(diǎn)或劇烈變化數(shù)據(jù)集上,且通常會(huì)出現(xiàn)拖尾現(xiàn)象,即邊緣尖銳點(diǎn)隨后的一段數(shù)據(jù)也會(huì)出現(xiàn)上報(bào),這是因?yàn)檫吘壖怃J點(diǎn)作為預(yù)測(cè)模型參數(shù)直接影響了模型對(duì)隨后數(shù)據(jù)的預(yù)測(cè)。將預(yù)測(cè)情況進(jìn)一步繪制成表1。

表1 各誤差程度具體分布情況(無異常檢測(cè))

采用本文提出的基于箱線圖異常檢測(cè)的二次指數(shù)加權(quán)平滑算法進(jìn)行預(yù)測(cè),結(jié)果如圖4所示。

圖4 引入異常檢測(cè)機(jī)制模型預(yù)測(cè)結(jié)果

將預(yù)測(cè)情況進(jìn)一步繪制成表2。

表2 各誤差程度具體分布情況(異常檢測(cè))

相比于普通無異常處理機(jī)制的預(yù)測(cè)模型,有異常處理機(jī)制的預(yù)測(cè)模型無誤差預(yù)測(cè)率提高了2.15個(gè)百分點(diǎn),誤差值為1預(yù)測(cè)率提高了6.08個(gè)百分點(diǎn),誤差值為2預(yù)測(cè)率提高了0.17個(gè)百分點(diǎn),誤差值為3預(yù)測(cè)率降低了3.16個(gè)百分點(diǎn),誤差值為4預(yù)測(cè)率降低了7.12個(gè)百分點(diǎn),上報(bào)率降低了5.8個(gè)百分點(diǎn)。通過圖4標(biāo)出的部分圓圈可知,原始數(shù)據(jù)集大多數(shù)邊緣尖銳異常點(diǎn)通過異常檢測(cè)機(jī)制或判定為異常點(diǎn),或經(jīng)過平滑處理,同時(shí)通過短期環(huán)比判定機(jī)制較好區(qū)分開邊緣尖銳異常點(diǎn)和突發(fā)事件,從而預(yù)測(cè)并上報(bào)了突發(fā)事件完整數(shù)據(jù)。對(duì)異常點(diǎn)的具體預(yù)測(cè)情況如圖5所示。

圖5 異常點(diǎn)預(yù)測(cè)結(jié)果

該模型成功過濾掉48個(gè)異常點(diǎn),有效率高達(dá)96%,同時(shí)僅將6個(gè)正常點(diǎn)誤判成異常點(diǎn),陽性誤判率僅為0.21%,從整體數(shù)據(jù)可以看出,引入異常檢測(cè)機(jī)制有效消減了異常點(diǎn)帶來的負(fù)面影響,從而顯著提高了數(shù)據(jù)精簡(jiǎn)傳輸率和預(yù)測(cè)精準(zhǔn)度。

為了進(jìn)一步驗(yàn)證基于箱線圖法異常檢測(cè)機(jī)制的雙指數(shù)加權(quán)平滑預(yù)測(cè)模型對(duì)異常點(diǎn)和突發(fā)事件的處理效果,本文進(jìn)行不同數(shù)據(jù)集下的對(duì)照實(shí)驗(yàn),對(duì)照實(shí)驗(yàn)數(shù)據(jù)為北京市東四某采集點(diǎn)全天AQI的監(jiān)測(cè)值,傳感節(jié)點(diǎn)每隔30 s采集一次數(shù)據(jù),全天共有2880個(gè)離散點(diǎn)。為了進(jìn)一步研究異常數(shù)據(jù)對(duì)預(yù)測(cè)模型的影響,在原始數(shù)據(jù)集引入100個(gè)邊緣尖銳異常點(diǎn),未采用異常檢測(cè)機(jī)制的預(yù)測(cè)情況如圖6所示。

圖6 無異常檢測(cè)機(jī)制預(yù)測(cè)模型結(jié)果(對(duì)照組)

將預(yù)測(cè)情況進(jìn)一步繪制成表3。

表3 對(duì)照組各誤差程度具體分布情況(無異常檢測(cè))

由于沒有排除異常的檢測(cè)機(jī)制,當(dāng)檢測(cè)到異常數(shù)據(jù)時(shí),預(yù)測(cè)模型會(huì)將該異常數(shù)據(jù)視為正常數(shù)據(jù),同時(shí)將該異常數(shù)據(jù)對(duì)比預(yù)測(cè)值,發(fā)現(xiàn)兩者差值遠(yuǎn)遠(yuǎn)超出了誤差閾值,此情況不符合精簡(jiǎn)傳輸策略,所以傳感節(jié)點(diǎn)會(huì)將此異常數(shù)據(jù)連同預(yù)測(cè)模型所需的前面N-1個(gè)數(shù)據(jù)一起上傳同步匯聚節(jié)點(diǎn)模型參數(shù)。由于異常數(shù)據(jù)并不會(huì)持久存在,在出現(xiàn)個(gè)別次數(shù)后又會(huì)回落到正常的檢測(cè)范圍,此時(shí)預(yù)測(cè)模型由于受到異常數(shù)據(jù)影響反而會(huì)使正常數(shù)據(jù)與預(yù)測(cè)值超出誤差閾值,此時(shí)又會(huì)出現(xiàn)上傳情況。

該實(shí)驗(yàn)監(jiān)測(cè)到的AQI數(shù)據(jù)較集中,連續(xù)數(shù)據(jù)差值一般不超過1,所以動(dòng)態(tài)閾值設(shè)置為1,經(jīng)過2輪粗細(xì)粒度劃分,平滑系數(shù)為0.4時(shí)表現(xiàn)最佳。其平穩(wěn)階段的數(shù)據(jù)浮動(dòng)范圍在2以內(nèi),此時(shí)模型更傾向于預(yù)測(cè)成一直線。采用本文提出的基于箱線圖異常檢測(cè)的雙指數(shù)加權(quán)平滑算法進(jìn)行預(yù)測(cè),結(jié)果如圖7所示。

圖7 引入異常檢測(cè)機(jī)制預(yù)測(cè)模型結(jié)果(對(duì)照組)

將預(yù)測(cè)情況進(jìn)一步繪制成表4。

表4 對(duì)照組各誤差程度具體分布情況(異常檢測(cè))

相比于普通無異常處理機(jī)制的預(yù)測(cè)模型,有異常處理機(jī)制的預(yù)測(cè)模型無誤差預(yù)測(cè)率提高了2.02個(gè)百分點(diǎn),誤差值為1預(yù)測(cè)率降低了5.8%個(gè)百分點(diǎn)。對(duì)異常點(diǎn)的具體預(yù)測(cè)情況如圖8所示。

圖8 異常點(diǎn)預(yù)測(cè)結(jié)果(對(duì)照組)

該模型成功過濾掉98個(gè)異常點(diǎn),有效率高達(dá)98%,同時(shí)僅將11個(gè)正常點(diǎn)誤判成異常點(diǎn),陽性誤判率僅為0.38%,通過對(duì)照實(shí)驗(yàn)組進(jìn)一步驗(yàn)證了引入異常檢測(cè)機(jī)制在不同數(shù)據(jù)集、平滑系數(shù)變動(dòng)和不同動(dòng)態(tài)閾值多種條件下都能有效消減異常點(diǎn)帶來的負(fù)面影響,從而顯著提高數(shù)據(jù)精簡(jiǎn)傳輸率和預(yù)測(cè)精準(zhǔn)度,取得良好的效果。

4 結(jié)束語

本文針對(duì)無線傳感網(wǎng)在精簡(jiǎn)傳輸過程中如何過濾異常點(diǎn)和判定突發(fā)事件等問題進(jìn)行研究,有效地提高了預(yù)測(cè)模型準(zhǔn)確度,進(jìn)一步減少了邊緣傳感節(jié)點(diǎn)上報(bào)次數(shù),提升了數(shù)據(jù)傳輸精簡(jiǎn)程度。本文首先分析了異常數(shù)據(jù)點(diǎn)對(duì)預(yù)測(cè)模型的影響,依據(jù)實(shí)際應(yīng)用場(chǎng)景提出了基于箱線圖異常檢測(cè)的指數(shù)加權(quán)平滑算法的預(yù)測(cè)模型,同時(shí)通過短期環(huán)比區(qū)分異常點(diǎn)和突發(fā)事件。實(shí)驗(yàn)結(jié)果表明,該預(yù)測(cè)模型可以有效過濾引入的異常點(diǎn),同時(shí)較準(zhǔn)確地區(qū)分開異常點(diǎn)和突發(fā)事件,明顯提高了模型預(yù)測(cè)準(zhǔn)確性和數(shù)據(jù)傳輸精簡(jiǎn)程度。下一步工作將箱線圖異常檢測(cè)機(jī)制更廣泛地應(yīng)用到其他預(yù)測(cè)模型,同時(shí)采用各種應(yīng)用場(chǎng)景的監(jiān)測(cè)數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,不斷修正調(diào)整異常檢測(cè)機(jī)制,使其更具魯棒性和應(yīng)用廣泛性。

猜你喜歡
線圖傳感突發(fā)事件
個(gè)體化預(yù)測(cè)結(jié)腸癌術(shù)后發(fā)生并發(fā)癥風(fēng)險(xiǎn)列線圖模型的建立
《傳感技術(shù)學(xué)報(bào)》期刊征訂
新型無酶便攜式傳感平臺(tái) 兩秒內(nèi)測(cè)出果蔬農(nóng)藥殘留
基于箱線圖的出廠水和管網(wǎng)水水質(zhì)分析
IPv6與ZigBee無線傳感網(wǎng)互聯(lián)網(wǎng)關(guān)的研究
電子制作(2018年23期)2018-12-26 01:01:26
東山頭遺址采集石器線圖
突發(fā)事件的輿論引導(dǎo)
清朝三起突發(fā)事件的處置
文史春秋(2016年8期)2016-02-28 17:41:32
某型Fabry-Perot光纖應(yīng)變計(jì)的傳感特性試驗(yàn)
突發(fā)事件
小說月刊(2014年10期)2014-04-23 08:53:40
铜川市| 锡林郭勒盟| 大英县| 绵阳市| 莱芜市| 秀山| 武夷山市| 博乐市| 泗阳县| 名山县| 黄骅市| 阳山县| 宁陕县| 和顺县| 南康市| 鹤壁市| 济阳县| 灵宝市| 恩平市| 湖口县| 苏州市| 平顶山市| 东莞市| 柳州市| 儋州市| 陆河县| 扎赉特旗| 东山县| 临西县| 雅安市| 宁晋县| 黄石市| 会东县| 大安市| 湘阴县| 台南县| 兴国县| 安丘市| 莲花县| 苍南县| 齐河县|