国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)壓縮的WSN 水質(zhì)異常數(shù)據(jù)檢測算法

2022-06-13 16:49:14楊明潤郭星鋒黃元峰陳柄全
電視技術(shù) 2022年5期
關(guān)鍵詞:誤報(bào)率分量水質(zhì)

楊明潤,郭星鋒,黃元峰,陳柄全

(武漢工程大學(xué) 電氣信息系,湖北 武漢 430000)

0 引 言

利用無線傳感器網(wǎng)絡(luò)(Wireless Sensor Network,WSN)對大面積水域進(jìn)行檢測時(shí),通常會部署大量傳感器節(jié)點(diǎn)來感知采集大量的水質(zhì)數(shù)據(jù),這對水質(zhì)數(shù)據(jù)異常檢測算法的性能提出了更高的要求。文獻(xiàn)[1]提出了基于局部密度分析的非周期水質(zhì)異常檢測方法,利用水質(zhì)時(shí)序數(shù)據(jù)的空間距離關(guān)系來準(zhǔn)確判斷數(shù)據(jù)是否存在異常。文獻(xiàn)[2]提出了一種基于概率密度補(bǔ)償?shù)母倪M(jìn)支持向量機(jī)(Support Vector Machines,SVM)異常水質(zhì)檢測算法,通過密度特征思想優(yōu)化SVM,更有利于后續(xù)的數(shù)據(jù)分類。文獻(xiàn)[3]提出了基于自回歸(Autoregressive,AR)模型和孤立森林算法的水質(zhì)異常數(shù)據(jù)檢測方法,通過AR 模型實(shí)現(xiàn)水質(zhì)時(shí)間序列數(shù)據(jù)的高精度預(yù)測,并通過孤立森林進(jìn)行后續(xù)的異常檢測,能夠?qū)崿F(xiàn)大量數(shù)據(jù)的異常實(shí)時(shí)檢測。文獻(xiàn)[4]針對上述問題提出了基于向量自回歸(Vector Autoregression,VAR)模型的水質(zhì)異常檢測算法,通過VAR 算法進(jìn)行數(shù)據(jù)多特征融合,檢測精度相較于AR 模型得到了較大提升。文獻(xiàn)[5]提出了采用人工神經(jīng)網(wǎng)絡(luò)預(yù)測水質(zhì)變化,并通過回歸分析建立水質(zhì)參數(shù)模型,通過比對神經(jīng)網(wǎng)絡(luò)的預(yù)測值與模型中數(shù)據(jù)的分布特點(diǎn)來判斷水質(zhì)異常數(shù)據(jù)。文獻(xiàn)[6]提出了多元數(shù)據(jù)融合突發(fā)水質(zhì)異常事件預(yù)估方法,通過融合算法隨水質(zhì)數(shù)據(jù)進(jìn)行兩兩融合,減少了數(shù)據(jù)傳輸量。文獻(xiàn)[7]提出了多傳感器數(shù)據(jù)融合的水質(zhì)檢測方法,通過異類數(shù)據(jù)和同類數(shù)據(jù)融合算法將數(shù)據(jù)進(jìn)行實(shí)時(shí)融合,再對融合數(shù)據(jù)進(jìn)行最終的判定。文獻(xiàn)[8]提出了基于動態(tài)關(guān)聯(lián)矩陣的水質(zhì)異常檢測方法,通過動態(tài)時(shí)間規(guī)整算法對多維數(shù)據(jù)進(jìn)行特征提取,再借助隨機(jī)森林算法進(jìn)行后續(xù)的異常水質(zhì)數(shù)據(jù)檢測。文獻(xiàn)[9]提出了基于主成分分析和SVM 的數(shù)據(jù)異常檢測算法,通過主成分分析對數(shù)據(jù)進(jìn)行降維處理,再利用SVM 進(jìn)行異常檢測。

上述算法對水質(zhì)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合時(shí)的壓縮比不高,數(shù)據(jù)異常特征保留不完整,而且異常檢測模型訓(xùn)練集不具代表性。在上述研究的基礎(chǔ)上,本文提出了一種基于數(shù)據(jù)壓縮的WSN 異常檢測算法。該算法通過小波變換將數(shù)據(jù)分為低頻分量和高頻分量,利用壓縮感知對低頻分量進(jìn)行壓縮,保留高頻分量,將高頻分量作為異常檢測階段模型的訓(xùn)練集。

1 基于WT-CS 與SVM 相結(jié)合的水質(zhì)異常數(shù)據(jù)檢測算法

在大面積待測水域中,通常會部署成千上萬個(gè)水質(zhì)傳感器節(jié)點(diǎn)來感知采集水質(zhì)參數(shù),但是同一傳感器在時(shí)間序列上采集到的水質(zhì)數(shù)據(jù)存在大量冗余,使得水質(zhì)數(shù)據(jù)在傳輸過程中會大量消耗節(jié)點(diǎn)能量,降低檢測效率[10]。針對該問題,本文提出了基于小波變換的壓縮感知(WT-CS)與SVM 相結(jié)合的分級式水質(zhì)異常數(shù)據(jù)檢測算法。算法分為兩個(gè)階段,第一階段是水質(zhì)數(shù)據(jù)壓縮階段,第二階段是水質(zhì)數(shù)據(jù)異常檢測階段。算法具體流程如圖1 所示。

圖1 基于WT-CS 與SVM 相結(jié)合的分級式水質(zhì)異常數(shù)據(jù)檢測算法流程

1.1 水質(zhì)數(shù)據(jù)壓縮階段

假設(shè)M個(gè)傳感器節(jié)點(diǎn)在N個(gè)時(shí)刻內(nèi)采集到的初始水質(zhì)數(shù)據(jù)為SM×N,利用db1 小波對水質(zhì)數(shù)據(jù)SM×N進(jìn)行多重分解。

(1)采用Mallat 算法通過低頻和高頻系數(shù)將水質(zhì)數(shù)據(jù)在db1 小波域內(nèi)分解,小波低頻系數(shù)和高頻系數(shù)為:

式中:Sα,L(n)和Sα,H(n)分別是db1 小波函數(shù)對應(yīng)的低通濾波系數(shù)和高通濾波,α為分解層數(shù)。

將初始水質(zhì)數(shù)據(jù)分別與低頻系數(shù)和高頻系數(shù)進(jìn)行計(jì)算后,得到一個(gè)低頻分量和一個(gè)高頻分量:

如果要進(jìn)行下一步分解,則需要通過第一層低頻分量再一次與低頻系數(shù)和高頻系數(shù)進(jìn)行計(jì)算。經(jīng)過三層小波分解后,初始水質(zhì)數(shù)據(jù)集可以表示為:

在三重小波分解后,可以將水質(zhì)數(shù)據(jù)分為包含絕大部分正常水質(zhì)數(shù)據(jù)信息的低頻分量和包含絕大部分水質(zhì)數(shù)據(jù)異常特征的高頻分量。此時(shí)的低頻分量是稀疏表示的,即:

通過壓縮感知對小波變換后的低頻分量L3(n)進(jìn)行二次壓縮,選取合適的觀測矩陣φ對L3(n)進(jìn)行計(jì)算,得到壓縮后的測量值y為:

二次壓縮后的數(shù)據(jù)由3 個(gè)高頻分量和1 個(gè)壓縮后的低頻分量共同組成,其表現(xiàn)形式為:

1.2 水質(zhì)異常數(shù)據(jù)檢測階段

利用SVM 的超平面對水質(zhì)數(shù)據(jù)進(jìn)行劃分:

尋找最優(yōu)超平面對數(shù)據(jù)進(jìn)行最優(yōu)劃分的過程實(shí)質(zhì)上就是對目標(biāo)函數(shù)進(jìn)行二次優(yōu)化,即:

式中:ζi是松弛變量(ζi≥i=1,2,…,l),c是懲罰系數(shù)。引入拉格朗日乘αi(i=1,2,3,…,l)得到對偶形式為:

將后續(xù)的待測樣本導(dǎo)入SVM 模型中進(jìn)行訓(xùn)練,通過計(jì)算來判斷數(shù)據(jù)的所屬類別。SVM 模型中一般選擇RBF 核函數(shù),即:

此時(shí)得到算法的決策函數(shù)為:

由決策函數(shù)確定邊界,再通過計(jì)算數(shù)據(jù)點(diǎn)到邊界線的距離進(jìn)行類別劃分。

2 仿真實(shí)驗(yàn)

2.1 算法性能評價(jià)指標(biāo)

一般而言,機(jī)器學(xué)習(xí)算法的評價(jià)指標(biāo)就是精度。由于WSN 中異常數(shù)據(jù)和正常數(shù)據(jù)所占比例極不平衡,因此精度不適合作為異常檢測的評價(jià)指標(biāo)[11]。在數(shù)據(jù)異常檢測中,數(shù)據(jù)集一般被分為正常數(shù)據(jù)(負(fù)類)和異常數(shù)據(jù)(正類)兩類,則檢測結(jié)果及樣本實(shí)際所屬類別為真正例(True Positive,TP)、假正例(False Positive,F(xiàn)P)、真反例(True Negative,TN)、反假例(False Negative,F(xiàn)N)。將召回率(True Positive Rate,TPR)和誤報(bào)率(False Positive Rate,F(xiàn)PR)作為算法性能的評價(jià)指標(biāo),召回率是被正常檢測出來的異常數(shù)據(jù)的個(gè)數(shù)與實(shí)際異常數(shù)據(jù)樣本的個(gè)數(shù)之比,誤報(bào)率是被算法誤判為異常的正常數(shù)據(jù)的個(gè)數(shù)與正常數(shù)據(jù)樣本總數(shù)之比,即:

2.2 數(shù)據(jù)集與實(shí)驗(yàn)環(huán)境介紹

本次實(shí)驗(yàn)采用太湖水體理化監(jiān)測數(shù)據(jù),該數(shù)據(jù)集包含了16 種水質(zhì)參數(shù)。為了增加實(shí)驗(yàn)數(shù)據(jù)中數(shù)據(jù)的多樣性,向數(shù)據(jù)集中人為添加5%的異常數(shù)據(jù),添加的異常數(shù)據(jù)類型包括噪聲數(shù)據(jù)、電池故障數(shù)據(jù)以及節(jié)點(diǎn)短路數(shù)據(jù)。

為了驗(yàn)證基于WT-CS 與SVM 相結(jié)合的分級式水質(zhì)異常數(shù)據(jù)檢測算法的性能,在Win10 系統(tǒng)中通過Matlab2019a 軟件進(jìn)行了算法的仿真實(shí)驗(yàn)與分析。同時(shí)為了驗(yàn)證本文算法(以下簡稱WT-CS-SVM)的有效性,還選取了基于主成分分析的異常數(shù)據(jù)檢測算法(以下簡稱PAC-SVM)以及支持向量機(jī)算法(以下簡稱SVM)在公開數(shù)據(jù)集上進(jìn)行對比仿真。

2.3 仿真結(jié)果分析

基于太湖水質(zhì)數(shù)據(jù),對WT-CS-SVM、PACSVM 和SVM 算法進(jìn)行實(shí)驗(yàn)仿真,并將檢測時(shí)間、檢測率和誤報(bào)率作為衡量指標(biāo)評價(jià)算法性能的指標(biāo),結(jié)果如表1 所示。

表1 太湖水質(zhì)數(shù)據(jù)下的算法性能對比

實(shí)驗(yàn)結(jié)果表明,本文算法相較于其他兩種對比算法,在保證較高檢測率的同時(shí),實(shí)現(xiàn)了大量水質(zhì)數(shù)據(jù)的實(shí)時(shí)檢測。為了避免實(shí)驗(yàn)的偶然性,使實(shí)驗(yàn)結(jié)果更具有說服力,對3 組算法循環(huán)運(yùn)行100 次,取10 次結(jié)果為一組,對其求均值。3 種算法的檢測率和誤報(bào)率均值如圖2、圖3 所示。

圖2 2006—2015 年太湖水質(zhì)檢測率平均值

圖3 2007—2015 年太湖水質(zhì)誤報(bào)率平均值

為了更直觀地體現(xiàn)3 種算法的檢測性能,將檢測率和誤報(bào)率的平均值折線轉(zhuǎn)化成對應(yīng)值的分布區(qū)間,使各個(gè)性能指標(biāo)的對比更為明顯,如表2 所示。

由表2 可知,WT-CS-SVM 分級式水質(zhì)異常數(shù)據(jù)檢測算法檢測時(shí)間更短、檢測率更高,保證水質(zhì)異常數(shù)據(jù)檢測準(zhǔn)確率的同時(shí)實(shí)現(xiàn)了對大量水質(zhì)數(shù)據(jù)檢測的實(shí)時(shí)性,檢測性能更優(yōu)。

表2 3 種算法檢測率平均值取值區(qū)間

3 結(jié) 語

基于數(shù)據(jù)壓縮的水質(zhì)異常檢測算法首先通過db1 小波對初始水質(zhì)數(shù)據(jù)進(jìn)行三重分解,得到包含絕大部分?jǐn)?shù)據(jù)信息的低頻系數(shù)和包含異常數(shù)據(jù)的高頻系數(shù),其次利用壓縮感知對低頻系數(shù)進(jìn)行二次壓縮,將處理后的水質(zhì)數(shù)據(jù)作為訓(xùn)練集導(dǎo)入SVM 模型中進(jìn)行訓(xùn)練,得到最終的水質(zhì)數(shù)據(jù)檢測模型。雖然算法具有良好的壓縮和異常檢測性能,但是受傳感器自身因素的限制,小波壓縮算法必須是輕量級,選擇合適的波形尤為重要,后續(xù)將會對該問題進(jìn)行深入研究。

猜你喜歡
誤報(bào)率分量水質(zhì)
基于GRU-LSTM算法的物聯(lián)網(wǎng)數(shù)據(jù)入侵檢測分析
基于SSA-SVM的網(wǎng)絡(luò)入侵檢測研究
水質(zhì)抽檢豈容造假
環(huán)境(2023年5期)2023-06-30 01:20:01
家用燃?xì)鈭?bào)警器誤報(bào)原因及降低誤報(bào)率的方法
煤氣與熱力(2021年6期)2021-07-28 07:21:40
帽子的分量
一物千斤
智族GQ(2019年9期)2019-10-28 08:16:21
一月冬棚養(yǎng)蝦常見水質(zhì)渾濁,要如何解決?這9大原因及處理方法你要知曉
論《哈姆雷特》中良心的分量
分量
神經(jīng)網(wǎng)絡(luò)技術(shù)在網(wǎng)絡(luò)入侵檢測模型及系統(tǒng)中的應(yīng)用
蓬安县| 彭泽县| 四川省| 特克斯县| 买车| 平武县| 宜宾市| 休宁县| 渝中区| 嘉荫县| 揭西县| 柞水县| 屏东县| 宣城市| 罗江县| 岳普湖县| 图们市| 临澧县| 彰化县| 耿马| 雷山县| 永丰县| 拜泉县| 万荣县| 安塞县| 彭州市| 长沙市| 台安县| 红河县| 渝北区| 衡水市| 天等县| 盱眙县| 商洛市| 东安县| 尉犁县| 松滋市| 米泉市| 墨竹工卡县| 南京市| 南昌市|