国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)間序列數(shù)據(jù)的無線傳感器網(wǎng)絡(luò)的異常檢測方法*

2018-05-03 05:37:52彭能松張維緯張育釗鄭力新
傳感技術(shù)學(xué)報(bào) 2018年4期
關(guān)鍵詞:誤報(bào)率置信區(qū)間錯(cuò)誤

彭能松,張維緯*,張育釗,黃 焯,鄭力新

(1.華僑大學(xué)工學(xué)院,福建 泉州 362000;2.工業(yè)智能化技術(shù)與系統(tǒng)福建省高校工程研究中心,福建 泉州 362000)

無線傳感器網(wǎng)絡(luò)WSN(Wireless Sensor Networks)作為溝通主觀感知世界和客觀物理世界的橋梁,是一種全新的信息獲取和處理技術(shù),是物聯(lián)網(wǎng)的重要支撐技術(shù)之一,已經(jīng)得到了迅速的發(fā)展和廣泛的應(yīng)用[1],包括國防、軍事、醫(yī)療保健、環(huán)境監(jiān)測、制造業(yè)和其他許多領(lǐng)域[2-3]。

隨著無線傳感器網(wǎng)絡(luò)規(guī)模的增加,傳感器網(wǎng)絡(luò)的異常檢測越發(fā)的關(guān)鍵。尤其是對(duì)于一些緊急事件,例如化學(xué)物質(zhì)泄漏、火災(zāi)等,往往需要及時(shí)預(yù)警并采取緊急處理措施。但是,惡劣的部署環(huán)境和傳感器本身的不可靠性導(dǎo)致傳感器產(chǎn)生錯(cuò)誤的讀數(shù),從而影響傳感器網(wǎng)絡(luò)的異常檢測。

現(xiàn)有的空間離群檢測算法通常分為三步[4-5]:首先,通過最小鄰數(shù)來確定基于空間屬性的鄰域關(guān)系。其次,使用空間屬性來計(jì)算離群的程度,捕獲對(duì)象與其空間鄰域之間的差異。最后,將具有最大空間離群度的n個(gè)對(duì)象輸出為異常點(diǎn)。在進(jìn)行空間離群檢測時(shí)需要與鄰居節(jié)點(diǎn)交換信息,額外的通信會(huì)加快傳感器節(jié)點(diǎn)能量的消耗。外部的因素或傳感器節(jié)點(diǎn)自身的問題(如能量耗盡等),導(dǎo)致無線傳感器網(wǎng)絡(luò)錯(cuò)誤節(jié)點(diǎn)增加,利用WSN的空間屬性將降低事件的檢測率。

WSN的時(shí)間屬性記錄著周圍環(huán)境隨時(shí)間的變化規(guī)律,當(dāng)事件發(fā)生時(shí),例如火災(zāi)發(fā)生時(shí)溫度會(huì)在短時(shí)間內(nèi)急劇上升。也就是說,事件發(fā)生后會(huì)持續(xù)一段時(shí)間,并且事件的特征隨著時(shí)間具有某些變化規(guī)律。利用WSN的時(shí)間屬性進(jìn)行異常檢測具有很高的研究價(jià)值。對(duì)無線傳感器網(wǎng)絡(luò)中的異常數(shù)據(jù)進(jìn)行檢測通常要考慮兩個(gè)問題[6]:①錯(cuò)誤傳感器會(huì)影響整個(gè)網(wǎng)絡(luò)對(duì)事件的檢測;②傳感器能量有限,應(yīng)盡量減少網(wǎng)絡(luò)中消息通信,降低傳感器能源的消耗。

基于此,本文從傳感器網(wǎng)絡(luò)的時(shí)間屬性入手,采用分布式檢測方法對(duì)傳感器網(wǎng)絡(luò)進(jìn)行異常檢測。實(shí)驗(yàn)結(jié)果和分析表明了本文方法減少了錯(cuò)誤傳感器對(duì)事件檢測的影響,提高了事件的檢測率并降低了傳感器節(jié)點(diǎn)能量的消耗。

本文第1節(jié)介紹已有的相關(guān)工作及研究成果;第2節(jié)將介紹傳感器網(wǎng)絡(luò)異常檢測的方法及相關(guān)定義,并給出本文使用的符號(hào)定義;第3節(jié)介紹基于時(shí)間序列的無線傳感器網(wǎng)絡(luò)異常檢測方法;第4節(jié)是實(shí)驗(yàn)結(jié)果及分析;最后是本文的小結(jié)。

1 相關(guān)工作

Krishnamachari B等[7]最早提出一種分布式的局部算法,通過空間(鄰居節(jié)點(diǎn))交換感知信息(0表示正常數(shù)據(jù),1為非正常數(shù)據(jù)),統(tǒng)計(jì)鄰居檢測到事件的概率,結(jié)合節(jié)點(diǎn)故障概率,最后利用Bayesian分析的方法,決定是否發(fā)生了錯(cuò)誤或事件。李桂丹等[8]提出一種分布式的容錯(cuò)事件邊界檢測算法,節(jié)點(diǎn)通過和鄰居節(jié)點(diǎn)交換一次信息,通過簡單地計(jì)算識(shí)別故障;并利用統(tǒng)計(jì)比較的方法判斷其是否處于事件邊界。這種方法算法復(fù)雜度低,容錯(cuò)性高。但比較依賴傳感器網(wǎng)絡(luò)的密度,密度越大檢測率越高。魏暢[9]等提出一種基于約簡策略與自適應(yīng)SVDD(Support Vector Data Description)的離群檢測方法,利用基于數(shù)據(jù)分布密度準(zhǔn)則和數(shù)據(jù)流時(shí)間相關(guān)性自適應(yīng)更新決策模型,取得了很好的檢測效果。高建良等[10]提出了基于加權(quán)中值的故障診斷策略,對(duì)鄰居節(jié)點(diǎn)測量數(shù)據(jù)進(jìn)行進(jìn)行加權(quán)處理,測量數(shù)據(jù)之間差距的方法來檢測故障節(jié)點(diǎn),但文中沒有涉及事件的檢測。費(fèi)歡[11]等改進(jìn)k-means 算法,根據(jù)無線傳感器數(shù)據(jù)特點(diǎn),采用歐氏距離為指標(biāo),根據(jù)數(shù)據(jù)到聚類中心的距離判斷數(shù)據(jù)的異常。姜旭寶等[12]提出一種基于變寬直方圖的異常數(shù)據(jù)檢測算法,將相同特性的高頻區(qū)域合并,減少不必要的數(shù)據(jù)傳輸,降低網(wǎng)絡(luò)開銷。曹冬磊等[13]從事件的時(shí)空相關(guān)性入手,提出了一種分布式的無線傳感器網(wǎng)絡(luò)事件區(qū)域檢測的容錯(cuò)算法,通過檢驗(yàn)事件隨機(jī)過程的統(tǒng)計(jì)特征和傳感器本地采樣值構(gòu)成的時(shí)間序列的符合程度來實(shí)現(xiàn)容錯(cuò),但隨著網(wǎng)絡(luò)錯(cuò)誤節(jié)點(diǎn)的增加,事件檢測率也隨之降低。趙志剛[14]將傳統(tǒng)的置信區(qū)間用于異常數(shù)據(jù)的檢測,在實(shí)際應(yīng)用中取得很好的檢測效果。李云飛[15]提出一種中位數(shù)的置信區(qū)間討論了Ⅰ型極小值分布總體位置參數(shù)和尺度參數(shù)的區(qū)間估計(jì)問題。

受文獻(xiàn)[14-15]的啟發(fā),本文將改進(jìn)的置信區(qū)間用來檢測數(shù)據(jù)是否存在異常。借鑒文獻(xiàn)[11,16]采用距離檢測離群點(diǎn)的思想,結(jié)合文獻(xiàn)[13]的事件閾值函數(shù),提出區(qū)間差異度的概念,作為異常來源的判斷。并針對(duì)以往成果的不足:采用空間屬性的異常檢測方法對(duì)傳感器網(wǎng)絡(luò)密度要求高以及當(dāng)錯(cuò)誤節(jié)點(diǎn)增加事件檢測率降低,誤報(bào)率增加。本文從時(shí)間序列數(shù)據(jù)入手提出了以時(shí)間序列為基礎(chǔ)的無線傳感器網(wǎng)絡(luò)異常檢測方法,實(shí)現(xiàn)采樣集中異常值的檢測,識(shí)別故障節(jié)點(diǎn)和事件節(jié)點(diǎn)。

2 WSN異常檢測基本原理

一般當(dāng)傳感器在連續(xù)的一段時(shí)間內(nèi),檢測的數(shù)據(jù)偏離正常的數(shù)據(jù),就可以認(rèn)為有異常發(fā)生。而導(dǎo)致異常的原因有很多,特定區(qū)域發(fā)生事件稱為事件異常;由自身故障或外部引起的稱為發(fā)生故障或發(fā)生錯(cuò)誤。

由于采用傳感器網(wǎng)絡(luò)空間屬性將加快節(jié)點(diǎn)能量消耗,隨著無線傳感器網(wǎng)絡(luò)故障節(jié)點(diǎn)的增加,事件檢出率降低的問題。因此本文的檢測方法采用傳感器網(wǎng)絡(luò)時(shí)間序列數(shù)據(jù)。改進(jìn)置信區(qū)間,估計(jì)小范圍的總體樣本波動(dòng)區(qū)間,用于異常值的檢測,再利用區(qū)間差異度判斷異常的來源。

2.1 時(shí)間序列數(shù)據(jù)模型

本文從WSN的時(shí)間相關(guān)性角度分析,在進(jìn)行數(shù)據(jù)分析前需先建立一個(gè)時(shí)間序列數(shù)據(jù)模型。假設(shè)在監(jiān)測區(qū)域隨機(jī)的部署有n個(gè)傳感器進(jìn)行數(shù)據(jù)的采集。傳感器節(jié)點(diǎn)通過底層時(shí)間同步機(jī)制保證采集和傳輸?shù)臄?shù)據(jù)同步性。

由于傳感器節(jié)點(diǎn)的存儲(chǔ)能力有限,不能滿足時(shí)間序列數(shù)據(jù)的無限增長性,本文采用滑動(dòng)窗口處理數(shù)據(jù),節(jié)點(diǎn)只保存最新的k個(gè)數(shù)據(jù)?;瑒?dòng)窗口具體定義為:

定義1滑動(dòng)窗口模型(Sliding Window Model)[17]為數(shù)據(jù)流最新的k個(gè)數(shù)據(jù)元素維護(hù)一個(gè)窗口,假設(shè)新數(shù)據(jù)元素從右邊進(jìn)來,當(dāng)新數(shù)據(jù)元素到達(dá),最左邊的元素將過期,窗口向右滑動(dòng)一個(gè)數(shù)據(jù)元素。

假設(shè)在某一個(gè)采樣周期內(nèi),任一傳感器采集的數(shù)據(jù)集為R(ti)={r(t1),r(t2),…,r(tn)}其中t1,t2,…,tn為采樣時(shí)刻。設(shè)節(jié)點(diǎn)當(dāng)前的窗口數(shù)據(jù)為{r(t1),r(t2),…,r(tp)},當(dāng)新數(shù)據(jù)r(tp+1)到達(dá)且為正常數(shù)據(jù)時(shí),窗口向前滑動(dòng),同時(shí)將窗口中的數(shù)據(jù)更新為{r(t2),r(t3),…,r(tp+1)},后續(xù)的數(shù)據(jù)以此類推。

當(dāng)建立滑動(dòng)窗口模型之后,要對(duì)時(shí)間序列數(shù)據(jù)計(jì)算置信區(qū)間和區(qū)間差異度。

2.2 置信區(qū)間和區(qū)間差異度

2.2.1 置信區(qū)間

如何確定傳感器t時(shí)刻的讀數(shù)r(t)是否異常,傳統(tǒng)的閾值方法存在閾值范圍難以確定的問題,太小或太大會(huì)產(chǎn)生誤報(bào)或者漏報(bào)。而傳感器網(wǎng)絡(luò)采集的數(shù)據(jù)在不同的部署環(huán)境具有不同的特點(diǎn),例如在某些溫度變化很大的環(huán)境中,即使數(shù)據(jù)變動(dòng)較大,數(shù)據(jù)也是正常的;而在有些穩(wěn)定的環(huán)境下,有可能小的波動(dòng)就是異常。根據(jù)數(shù)據(jù)特點(diǎn)采用置信區(qū)間判斷異常值。

在自然條件下假設(shè)正常數(shù)據(jù)在范圍[a,b]內(nèi)波動(dòng),而異常數(shù)據(jù)往往與正常數(shù)據(jù)有較大的差異,一般反映為樣本的極值,它們會(huì)對(duì)統(tǒng)計(jì)推斷帶來不良的影響[15],而樣本的中位數(shù)能很好的抵抗異常值的干擾,越靠近中位數(shù)的樣本其抵抗能力越強(qiáng)[18],因此本文采用中位數(shù)構(gòu)造樞軸量。

設(shè)X1,X2,…,Xn是來自均勻分布的總體X~U(a,b)的獨(dú)立同分布樣本,設(shè)med為樣本X1,X2,…,Xn的中位數(shù)[15]。

(1)

在方差δ2未知的情況下采用樣本方差S2來計(jì)算中位數(shù)的置信區(qū)間[14]。

(2)

(3)

易驗(yàn)證T為關(guān)于μ的樞軸量,對(duì)于給定的α,令

(4)

(5)

得到置信度為1-α的置信區(qū)間

(6)

由式(6)知該區(qū)間為總體樣本中位數(shù)的一個(gè)估計(jì)區(qū)間,將式(6)做相應(yīng)的變形得到總體樣本的估計(jì)區(qū)間。

(7)

式(7)即為總體樣本區(qū)間估計(jì),但區(qū)間估計(jì)的精度受樣本數(shù)k和置信度α的影響較大,樣本數(shù)k和置信度α的選擇將在實(shí)驗(yàn)結(jié)果及分析中說明。

2.2.2 區(qū)間差異度

為了定性的描述傳感器t時(shí)刻的讀數(shù)r(t)與總體樣本{r(t1),r(t2),…,r(tp)}的關(guān)系,即r(t)與置信區(qū)間[LCL,UCL]的差異。而衡量個(gè)體差異的方法有很多,主要分為兩大類:距離度量和相似度度量,其中距離度量主要有歐幾里得距離和明可夫斯基距離等;相似度度量包含向量空間余弦相似度和皮爾森相關(guān)系數(shù)等。本文根據(jù)距離度量的思想提出區(qū)間差異度的概念,定義如下:

定義2區(qū)間差異度:對(duì)于樣本空間點(diǎn)rt(i),其區(qū)間差異度γ表示rt(i)與置信區(qū)間的差異程度,公式如下:

(8)

式中:rt(i)為傳感器t(i)時(shí)刻的讀數(shù),UCL(Upper Confidence Limit)為置信區(qū)間上限,LCL(Lower Confidence Limit)為置信區(qū)間下限。γ表示t(i)時(shí)刻的讀數(shù)與置信區(qū)間的差異程度,γ越大說明傳感器讀數(shù)距離總體樣本越遠(yuǎn),為異常值的可能性越大。

在本文中只考慮異常值大于正常值的情況,若檢測異常值小于正常值的情況只需將式(8)換為式(9)即可。

(9)

當(dāng)檢測到異常值后需要驗(yàn)證異常值的來源,判斷是節(jié)點(diǎn)異常還是突發(fā)事件,首先對(duì)判斷條件進(jìn)行分析。

(10)

(11)

式中:Rth(t)為判斷事件的閾值函數(shù)[13],En(t)是正確的傳感器在正常區(qū)域中的讀數(shù)的期望函數(shù);Ee(t)是正確的傳感器在事件區(qū)域中讀數(shù)的期望函數(shù)。ξ是判斷是否發(fā)生事件的重要指標(biāo),如果區(qū)間差異度大于ξ,則認(rèn)為發(fā)生事件。

綜上,置信區(qū)間對(duì)樣本總體參數(shù)估計(jì)及差異度采用距離衡量類間相似程度的思想為進(jìn)行異常值檢測提供了理論基礎(chǔ),在此基礎(chǔ)上,本文提出了一種利用WSN時(shí)間序列數(shù)據(jù)進(jìn)行異常檢測的方法。本文的方法不僅適用于高密度的傳感器網(wǎng)絡(luò),對(duì)于低密度非均勻分布的傳感器網(wǎng)絡(luò)同樣適用。

本文中使用的符號(hào)和術(shù)語定義如表1所示。

表1 符號(hào)定義

3 異常檢測

本節(jié)將給出一種以WSN時(shí)間序列為基礎(chǔ),分為異常數(shù)據(jù)識(shí)別,異常來源驗(yàn)證兩個(gè)步驟,利用置信區(qū)間識(shí)別傳感器數(shù)據(jù)集中可能存在的異常數(shù)據(jù)點(diǎn),在檢測到異常數(shù)據(jù)點(diǎn)后,需計(jì)算γ和ξ從而區(qū)分其異常來源。下文將分別進(jìn)行詳細(xì)說明。

3.1 異常數(shù)據(jù)識(shí)別

在自然環(huán)境下,傳感器的采樣值rt(i)表現(xiàn)為在小范圍內(nèi)小幅度的波動(dòng),但出現(xiàn)異常時(shí)則會(huì)在短時(shí)間內(nèi)出現(xiàn)明顯的偏差[18],且事件特征至少可以持續(xù)Tth時(shí)間[13]。

傳感器節(jié)點(diǎn)里保存k個(gè)正常數(shù)據(jù),數(shù)據(jù)可在部署前保存在傳感器節(jié)點(diǎn)里或部署后節(jié)點(diǎn)保存采集的正常數(shù)據(jù)。利用k個(gè)正常值和給定的置信度α計(jì)算得到總體樣本的區(qū)間估計(jì)[LCL,UCL]。如果r(t)不滿足式(12),那么該測量值可能為異常數(shù)據(jù)。

LCL≤r(t)≤UCL

(12)

式中:UCL,LCL分別為置信區(qū)間的上下限,r(t)為t時(shí)刻采樣值,當(dāng)r(t)滿足(12)時(shí)更新滑動(dòng)窗口的數(shù)據(jù)元素。

此外,當(dāng)傳感器節(jié)點(diǎn)發(fā)生故障時(shí),可能在連續(xù)的采樣時(shí)刻內(nèi)產(chǎn)生同樣的讀數(shù)[19],即

r(t)=r(t-1)

(13)

將式(12)和式(13)稱為判斷傳感器讀數(shù)是否異常的判斷條件。

3.2 異常來源驗(yàn)證

當(dāng)某個(gè)傳感器t時(shí)刻的讀數(shù)r(t)的值不在區(qū)間[LCL,UCL]內(nèi)或r(t)=r(t-1)時(shí)就認(rèn)為發(fā)生了異常;為確定異常來源需要計(jì)算數(shù)據(jù)與置信區(qū)間的區(qū)間差異度γ和ξ,在Tth時(shí)間內(nèi),計(jì)算m次區(qū)間差異度的值,并計(jì)算平均值μ(γ)如果μ(γ)<1可以認(rèn)為是由測量誤差或置信區(qū)間預(yù)估偏差引起的。

如果μ(γ)>ξ且r(t)≠r(t-1),認(rèn)為該節(jié)點(diǎn)檢測到事件。

如果μ(γ)<ξ或r(t)=r(t-1),認(rèn)為該節(jié)點(diǎn)發(fā)生錯(cuò)誤。當(dāng)節(jié)點(diǎn)發(fā)生故障時(shí),傳感器采集的前一刻數(shù)據(jù)可能丟失,為了避免數(shù)據(jù)的丟失,在傳感器節(jié)點(diǎn)發(fā)生故障前將數(shù)據(jù)備份到鄰居節(jié)點(diǎn)。當(dāng)m/2次滿足條件(μ(γ)<ξ或r(t)=r(t-1))時(shí),認(rèn)為該節(jié)點(diǎn)即將發(fā)生故障,這時(shí)將該傳感器節(jié)點(diǎn)的數(shù)據(jù)向所有鄰居節(jié)點(diǎn)傳播。

本文的偽代碼描述如下:

Input:r(t),En(t),Ee(t),Tth,ΔT,k,α,Rth(t);

Calculating confidence intervals

if(LCL<=r(t)<=UCL andr(t)!=r(t-1)){

Update sliding window

status=Normal;

}

else{

while(every ΔTtime andt′

Calculatingμ(γ)andξ

if(μ(γ)<1 andr(t)!=r(t-1)){

ErrorCount+=1;

}

if(μ(γ)<ξorr(t)=r(t-1)){

FaultCount+=1;

if(FaultCount>m/2){

broadcasting data to all neighbors

}

}

if(μ(γ)>ξandr(t)!=r(t-1)){

EventCount+=1;

}

t′+=ΔT;

}

if(ErrorCount>2m/3);

status=Error;

if(FaultCount>2m/3);

status=Fault;

if(EventCount>2m/3);

status=Event;

3.3 性能分析

從時(shí)間復(fù)雜度和空間復(fù)雜度考慮,假設(shè)滑動(dòng)窗口中的數(shù)據(jù)流規(guī)模為w,滑動(dòng)窗口的大小為k,w>k。進(jìn)行一次數(shù)據(jù)更新,滑動(dòng)窗口有w-k次的數(shù)據(jù)輸入。每更新一次窗口就要重新計(jì)算置信區(qū)間,所以時(shí)間復(fù)雜度O(w-k),空間復(fù)雜度為O(k)。所以本文的算法即使在大規(guī)模的數(shù)據(jù)中也不會(huì)出現(xiàn)數(shù)據(jù)災(zāi)難。

與采用WSN空間屬性的方法相比,本文只從WSN時(shí)間數(shù)據(jù)入手,沒有和鄰居節(jié)點(diǎn)交換信息,不產(chǎn)生額外的通信消耗。只有當(dāng)節(jié)點(diǎn)即將發(fā)生故障的時(shí)候向鄰居傳播數(shù)據(jù),以消耗少量的能量,提高算法的安全性。

4 實(shí)驗(yàn)結(jié)果及分析

為了對(duì)本文的算法進(jìn)行定性的分析,引入節(jié)點(diǎn)的檢測率(True Positive Rate)和誤報(bào)率(False Positive Rate)[20]用來衡量算法的可靠性。

定義3事件節(jié)點(diǎn)檢測率(Event True Positive Rate ETPR)ETPR(C):

(14)

定義4事件節(jié)點(diǎn)誤報(bào)率(Event False Positive Rate EFPR)EFPR(C):

(15)

定義5錯(cuò)誤節(jié)點(diǎn)檢測率(Fault True Positive Rate FTPR)FTPR(C):

(16)

定義6錯(cuò)誤節(jié)點(diǎn)誤報(bào)率(Fault False Positive Rate FFPR)FFPR(C):

(17)

式中:Ev為實(shí)際事件節(jié)點(diǎn)集合,S為事件區(qū)域所有節(jié)點(diǎn),Er為實(shí)際錯(cuò)誤節(jié)點(diǎn)集合。

由于估計(jì)的置信區(qū)間存在精度偏差,有可能將正常節(jié)點(diǎn)識(shí)別為誤差節(jié)點(diǎn),所以引入誤差節(jié)點(diǎn)誤識(shí)率。

定義7誤差節(jié)點(diǎn)誤識(shí)率(Error False Recogni-tion Rate EFRR)EFRR(C):

(18)

式中:N為正常節(jié)點(diǎn)集合。

如前文所述樣本數(shù)k(滑動(dòng)窗口大小)和置信度α的選擇會(huì)影響置信區(qū)間的估計(jì)值。樣本數(shù)太少會(huì)造成較大的偏差,影響算法的性能。由于傳感器節(jié)點(diǎn)空間資源有限,樣本不能太大否則會(huì)導(dǎo)致傳感器節(jié)點(diǎn)能源過快消耗。為了確定樣本數(shù)和置信度大小,本文通過實(shí)驗(yàn)來進(jìn)行選擇。

本文的實(shí)驗(yàn)是在python2.7平臺(tái)上,n個(gè)傳感器均勻的部署在32a×32a的區(qū)域中。假設(shè)事件過程{r(t)}和錯(cuò)誤隨機(jī)過程{r′(t)}分別滿足r(t)~N(μ,σ2)和r′(t)~U(En(t),Ee(t)),對(duì)?t,模擬實(shí)驗(yàn)中取μ=100,σ=10。假設(shè)傳感器的采樣頻率為10 Hz,即ΔT=0.1s,Tth=1s,m=10。

實(shí)驗(yàn)1 本實(shí)驗(yàn)n=1024,錯(cuò)誤節(jié)點(diǎn)占傳感器節(jié)點(diǎn)總數(shù)的10%。假設(shè)事件發(fā)生在(17,5)到(27,15)的11a×11a區(qū)域。α取值為95%或99%。實(shí)驗(yàn)結(jié)果均取100次實(shí)驗(yàn)結(jié)果的平均值,仿真結(jié)果如表2所示。

表2 不同樣本數(shù)和置信度下的實(shí)驗(yàn)結(jié)果

隨著樣本數(shù)增加,同一個(gè)置信度下,檢出率總體先增加后減小,誤報(bào)率總體先減小后增加。在樣本數(shù)為30時(shí)有較好的檢測結(jié)果,為減小因置信區(qū)間估計(jì)導(dǎo)致的誤差節(jié)點(diǎn)誤識(shí)率EFRR(C),選擇樣本數(shù)為30,置信度為99%作為后續(xù)實(shí)驗(yàn)的參數(shù)。

為驗(yàn)證本文方法的效果并評(píng)估其性能與文獻(xiàn)[13]的方法進(jìn)行對(duì)比實(shí)驗(yàn)。

實(shí)驗(yàn)2 比較本文的方法在不同規(guī)模,相同的錯(cuò)誤節(jié)點(diǎn)(0.5%)下的性能。文獻(xiàn)[13]使用其論文描述的實(shí)驗(yàn)參數(shù)δ=1.96,C=8。圖1為一次實(shí)驗(yàn)的快照,圓點(diǎn)為錯(cuò)誤節(jié)點(diǎn)。實(shí)驗(yàn)結(jié)果如圖2~圖5所示。圖2和圖3為事件區(qū)域事件的檢測率和誤報(bào)率,圖4和圖5為錯(cuò)誤節(jié)點(diǎn)檢測率和誤報(bào)率。本文采用WSN的時(shí)間屬性,所以在不同規(guī)模傳感器網(wǎng)絡(luò)下具有較高的事件檢出率和較低的事件誤報(bào)率,且錯(cuò)誤節(jié)點(diǎn)同樣保持較高的檢測率和低的誤報(bào)率。實(shí)驗(yàn)結(jié)果表明本文的方法在不同規(guī)模的傳感器網(wǎng)絡(luò)下算法穩(wěn)定性高,受傳感器網(wǎng)絡(luò)規(guī)模影響小。

圖5 錯(cuò)誤節(jié)點(diǎn)誤報(bào)率

圖1 一次模擬實(shí)驗(yàn)快照

圖2 事件節(jié)點(diǎn)檢測率

圖3 事件節(jié)點(diǎn)誤報(bào)率

圖4 錯(cuò)誤節(jié)點(diǎn)檢測率

實(shí)驗(yàn)3 為了驗(yàn)證不同錯(cuò)誤節(jié)點(diǎn)下算法的穩(wěn)定性,采用傳感器節(jié)點(diǎn)數(shù)量n=1 024,并和文獻(xiàn)[13]做比較。實(shí)驗(yàn)結(jié)果如圖6~圖9所示。

圖6 事件節(jié)點(diǎn)檢測率

圖7 事件節(jié)點(diǎn)誤報(bào)率

圖8 錯(cuò)誤節(jié)點(diǎn)檢測率

圖9 錯(cuò)誤節(jié)點(diǎn)誤報(bào)率

圖6和圖7為事件區(qū)域事件檢測率和事件誤報(bào)率,實(shí)驗(yàn)表明,即使隨著錯(cuò)誤節(jié)點(diǎn)的增加,采用本文的算法還能保持較高的檢出率,而誤報(bào)率也不會(huì)隨著錯(cuò)誤節(jié)點(diǎn)的增加而增加,這是因?yàn)楸疚牟捎肳SN時(shí)間序列的數(shù)據(jù),這樣可以減少因WSN空間錯(cuò)誤節(jié)點(diǎn)影響而產(chǎn)生誤判的情況。

圖8和圖9為錯(cuò)誤節(jié)點(diǎn)檢測率和誤報(bào)率,當(dāng)錯(cuò)誤節(jié)點(diǎn)增加時(shí),傳感器節(jié)點(diǎn)的錯(cuò)誤檢測率保持98%以上,誤報(bào)率保持0.5%以下。

5 結(jié)語

本文從數(shù)據(jù)的時(shí)間相關(guān)性入手,只需少量的數(shù)據(jù)通過簡單的計(jì)算就能估計(jì)出較好的總體樣本區(qū)間,計(jì)算區(qū)間與數(shù)據(jù)的區(qū)間差異度實(shí)現(xiàn)異常來源的判斷,算法復(fù)雜度低,計(jì)算量小而且不產(chǎn)生額外的傳感器網(wǎng)絡(luò)通信,有效的延長了傳感器網(wǎng)絡(luò)的壽命。受傳感器網(wǎng)絡(luò)規(guī)模的影響小,在傳感器網(wǎng)絡(luò)錯(cuò)誤節(jié)點(diǎn)增加的情況下仍保持較高的檢測率和較低的誤報(bào)率。

參考文獻(xiàn):

[1] Zhou Zhangbing,Xu Jiabei,Zhang Zhenjiang. Energy-Efficient Optimization for Concurrent Compositions of WSN Services[J]. IEEE Access,15 Sep 2017,PP(99):1-1,ISSN:2169-3536.

[2] Bai X,Liu L,Cao M,et al. Collaborative Actuation of Wireless Sensor and Actuator Networks for the Agriculture Industry[J]. IEEE Access,2017,5(99):13286-13296.

[3] Qiu T,Zhao A,Xia F,et al. ROSE:Robustness Strategy for Scale-Free Wireless Sensor Networks[J]. IEEE/ACM Transactions on Networking,2017,PP(99):1-16.

[4] Ayadi H,Zouinkhi A,Boussaid B,et al. A Machine Learning Methods:Outlier Detection in WSN[C]//International Conference on Sciences and Techniques of Automatic Control and Computer Engineering. IEEE,2016:722-727.

[5] Xu W,Gao H,Liu Y,et al. An Adaptive Spatial Outlier Detection Algorithm with no Parameter for WSN[C]//International Conference on Information Fusion. 2017:1-8.

[6] Luo X,Dong M,Huang Y. On Distributed Fault-Tolerant Detection in Wireless Sensor Networks[J]. IEEE Transactions on Computers,2006,55(1):58-70.

[7] Krishnamachari B,Iyengar S. Distributed Bayesian Algorithms for Fault-Tolerant Event Region Detection in Wireless Sensor Networks[J]. Computers IEEE Transactions on,2004,53(3):241-250.

[8] 李桂丹,孫雨耕,劉麗萍,等. 分布式無線傳感器網(wǎng)絡(luò)容錯(cuò)事件邊界檢測[J]. 計(jì)算機(jī)工程與應(yīng)用,2009,45(17):28-32.

[9] 魏暢,李光輝. 基于約簡策略與自適應(yīng)SVDD的無線傳感網(wǎng)絡(luò) 離群檢測方法[J]. 傳感技術(shù)學(xué)報(bào),2017,30(9):1388-1395.

[10] 高建良,徐勇軍,李曉維. 基于加權(quán)中值的分布式傳感器網(wǎng)絡(luò)故障檢測[J]. 軟件學(xué)報(bào),2007,18(5):1208-1217.

[11] 費(fèi)歡,李光輝. 基于K-means聚類的WSN異常數(shù)據(jù)檢測算法[J]. 計(jì)算機(jī)工程,2015,41(7):124-128.

[12] 姜旭寶,李光耀,連朔. 基于變寬直方圖的無線傳感器網(wǎng)絡(luò)異常數(shù)據(jù)檢測算法[J]. 計(jì)算機(jī)應(yīng)用,2011,31(3):694-697.

[13] 曹冬磊,曹建農(nóng),金蓓弘. 一種無線傳感器網(wǎng)絡(luò)中事件區(qū)域檢測的容錯(cuò)算法[J]. 計(jì)算機(jī)學(xué)報(bào),2007,30(10):1770-1776.

[14] 趙志剛,屈劍鋒. 基于WSN和置信區(qū)間計(jì)算的轉(zhuǎn)播機(jī)房溫控系統(tǒng)[J]. 計(jì)算機(jī)工程與應(yīng)用,2011,47(30):219-223.

[15] 李云飛. 極值分布參數(shù)基于不完全數(shù)據(jù)的區(qū)間估計(jì)[J]. 統(tǒng)計(jì)與決策,2015(13):81-83.

[16] 陳圣兵,王曉峰. 基于樣本差異度的SVM訓(xùn)練樣本縮減算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2012,48(7):20-22.

[17] Datar M,Gionis A,Indyk P,et al. Maintaining Stream Statistics over Sliding Windows[J]. Siam Journal on Computing,2002,31(6):1794-1813.

[18] Huber P J. Robust Statistics[J]. Journal of the American Statistical Association,1981,78(381):1248-1251.

[19] Lee D W,Kim J H. High Reliable In-Network Data Verification in Wireless Sensor Networks[J]. Wireless Personal Communications,2010,54(3):501-519.

[20] Fei H,Xiao F,Guang-Hui L I,et al. An Anomaly Detection Method of Wireless Sensor Network Based on Multi-Modals Data Stream[J]. Chinese Journal of Computers,2017,40(8):1829-1842.

猜你喜歡
誤報(bào)率置信區(qū)間錯(cuò)誤
基于GRU-LSTM算法的物聯(lián)網(wǎng)數(shù)據(jù)入侵檢測分析
基于SSA-SVM的網(wǎng)絡(luò)入侵檢測研究
定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
在錯(cuò)誤中成長
p-范分布中參數(shù)的置信區(qū)間
家用燃?xì)鈭?bào)警器誤報(bào)原因及降低誤報(bào)率的方法
煤氣與熱力(2021年6期)2021-07-28 07:21:40
多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
列車定位中置信區(qū)間的確定方法
神經(jīng)網(wǎng)絡(luò)技術(shù)在網(wǎng)絡(luò)入侵檢測模型及系統(tǒng)中的應(yīng)用
不犯同樣錯(cuò)誤
阜新市| 太康县| 海口市| 麟游县| 沙雅县| 民和| 江永县| 莱阳市| 平利县| 浮梁县| 台中县| 霍州市| 汝阳县| 弥勒县| 乐东| 井陉县| 西盟| 民勤县| 曲沃县| 饶阳县| 正定县| 乳源| 南岸区| 浦城县| 岳普湖县| 白玉县| 夏邑县| 浮山县| 峨边| 枣庄市| 错那县| 淮安市| 南华县| 丰镇市| 白朗县| 庆安县| 马公市| 大石桥市| 五河县| 商水县| 宁陵县|