国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的水表故障檢測(cè)算法

2020-07-14 11:02:34徐藝文王芝燕李立春李貴生
關(guān)鍵詞:水表準(zhǔn)確率卷積

徐藝文,王芝燕,李立春,李貴生

(1. 福州大學(xué)物理與信息工程學(xué)院,福建 福州 350108;2. 智恒科技股份有限公司,福建 福州 350109)

0 引言

水表計(jì)數(shù)關(guān)系到千家萬戶的水費(fèi)收取,不能出現(xiàn)絲毫差錯(cuò). 但合格水表運(yùn)行一段時(shí)間后可能出現(xiàn)硬件故障,造成水費(fèi)計(jì)量異常. 因此,研究一種通過水表日常計(jì)量數(shù)據(jù)快速判斷其故障狀態(tài)的高精度檢測(cè)算法是非常必要的. 傳統(tǒng)的工程儀器儀表的故障診斷方法,主要是基于機(jī)器學(xué)習(xí)的方法,比如樸素貝葉斯[1]、 支持向量機(jī)(SVM)[2]等,以及基于信號(hào)處理的方法,比如小波變換[3]. 然而傳統(tǒng)故障診斷方法往往因人工特征提取不準(zhǔn)而造成診斷精度難以滿足實(shí)用要求. 近年來,深度學(xué)習(xí)的浪潮席卷而來,其中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)因具備局部感知、 權(quán)重共享以及降采樣等特性,通過較少的計(jì)算資源和較少的時(shí)間即可訓(xùn)練出符合實(shí)用要求的CNN模型,因此受到廣泛關(guān)注,目前研究人員已經(jīng)將其應(yīng)用于計(jì)算機(jī)視覺、 語音識(shí)別以及自然語言處理等領(lǐng)域,并均成果斐然. 由于CNN在特征學(xué)習(xí)以及分類方面卓越的能力,近年來研究人員亦將其廣泛應(yīng)用于機(jī)器故障診斷領(lǐng)域. 例如,Chen[4]利用CNN自動(dòng)提取輸入信號(hào)的特征,軸承故障診斷準(zhǔn)確率最終可達(dá)98%;Jing等[5]利用CNN直接從頻率數(shù)據(jù)中學(xué)習(xí)特征,結(jié)果表明CNN能夠從頻率數(shù)據(jù)中自適應(yīng)地學(xué)習(xí)特征,并且比其他方法具有更高的準(zhǔn)確率;黃馳城[6]用信號(hào)處理方法將軸承故障數(shù)據(jù)變?yōu)闀r(shí)頻圖像數(shù)據(jù)集,然后用CNN進(jìn)行故障檢測(cè),最終平均準(zhǔn)確率達(dá)到99.5%;Zhang等[7]利用寬內(nèi)核提取軸承故障數(shù)據(jù)初步特征并抑制噪聲,再用小內(nèi)核細(xì)化特征,最終準(zhǔn)確率達(dá)到100%.

雖然很多研究人員將深度學(xué)習(xí)(尤其CNN)應(yīng)用于故障檢測(cè)領(lǐng)域,但已有研究主要針對(duì)軸承這類傳動(dòng)部件,其數(shù)據(jù)為振動(dòng)信號(hào),特征明顯,故障診斷較易實(shí)現(xiàn). 而在水表故障檢測(cè)領(lǐng)域,由于水表安裝現(xiàn)場(chǎng)往往未能提供市電供電,在現(xiàn)場(chǎng)難以安裝傳統(tǒng)監(jiān)測(cè)設(shè)備,造成水表故障檢測(cè)只能根據(jù)每天采集一次的用水?dāng)?shù)據(jù)做出判斷,其難度顯然遠(yuǎn)高于傳統(tǒng)振動(dòng)類設(shè)備的故障檢測(cè). 基于此, 本研究提出一種基于CNN的水表故障檢測(cè)方法,并與SVM和集成SVM算法進(jìn)行性能對(duì)比.

1 傳統(tǒng)的水表故障檢測(cè)方法及其缺陷

圖1 傳統(tǒng)的水表故障自動(dòng)檢測(cè)算法流程Fig.1 Flow of traditional fault detection for water meter

水表最常見的故障是脫軸故障,即水表的傳動(dòng)葉輪脫離中心,影響正常運(yùn)轉(zhuǎn),造成水表計(jì)數(shù)不準(zhǔn). 此類故障前期難以發(fā)現(xiàn),后隨時(shí)間的推移故障表現(xiàn)越來越明顯. 早期的水表脫軸故障檢測(cè)采用人工現(xiàn)場(chǎng)判斷或者日常巡檢,此方法費(fèi)時(shí)費(fèi)力,且檢測(cè)實(shí)時(shí)性極差. 為克服人工檢測(cè)的缺陷,有技術(shù)人員提出了基于機(jī)器學(xué)習(xí)的自動(dòng)檢測(cè)方法,其原理如圖1所示. 首先根據(jù)經(jīng)驗(yàn)人工選擇特征,然后將水表日常采集數(shù)據(jù)與這些特征相對(duì)比,如果符合故障特征則判定該表出現(xiàn)故障. 該方法的檢測(cè)精度極度依賴于特征提取的準(zhǔn)確性. 且實(shí)踐證明,人工提取的特征往往不能適應(yīng)復(fù)雜的應(yīng)用場(chǎng)景,從而造成檢測(cè)準(zhǔn)確度低,實(shí)用效果不佳.

目前,CNN在很多研究領(lǐng)域都取得了巨大的成功,雖然在這些領(lǐng)域中解決的問題不盡相同,但是這些方法都可以歸納為:CNN自動(dòng)從(通常大規(guī)模)數(shù)據(jù)中學(xué)習(xí)特征,并把結(jié)果向同類型的未知數(shù)據(jù)泛化. 顯然,CNN可解決傳統(tǒng)機(jī)器學(xué)習(xí)方法人工提取特征不準(zhǔn)的問題,因此可利用其實(shí)現(xiàn)更高精度的水表故障檢測(cè).

2 構(gòu)建基于CNN的水表故障檢測(cè)模型

本節(jié)以水表脫軸故障為例,利用CNN卓越的特征提取能力實(shí)現(xiàn)一種新的故障檢測(cè)方法,并對(duì)模型進(jìn)行參數(shù)優(yōu)化,以獲得最優(yōu)性能.

2.1 數(shù)據(jù)描述

表1 水表原始數(shù)據(jù)示例

數(shù)據(jù)集來源于某供水公司,原始數(shù)據(jù)共有10 443個(gè)樣本. 其中無故障樣本數(shù)為6 765個(gè),有故障樣本數(shù)為3 678個(gè),樣本數(shù)據(jù)示例如表1所示. 因每個(gè)樣本之間水表讀數(shù)數(shù)據(jù)差異較大,可能出現(xiàn)因樣本間數(shù)據(jù)差異太大而導(dǎo)致模型無法收斂的問題,而日用水量可避免該問題,因此采用其作為實(shí)驗(yàn)數(shù)據(jù).

2.2 基于CNN的水表故障檢測(cè)模型

首先利用一個(gè)經(jīng)典的CNN模型—LeNet-5模型[8]對(duì)水表數(shù)據(jù)進(jìn)行故障檢測(cè),以驗(yàn)證方法的可行性. 結(jié)合水表數(shù)據(jù)的特性和目前建立CNN模型的經(jīng)驗(yàn)值,將模型的輸入數(shù)據(jù)由二維改為一維,設(shè)置第一層卷積層深度為32,第三層卷積層深度為64,取卷積核尺寸為5×1,步長(zhǎng)為1,池化層采樣寬度為2. 損失熵采用損失函數(shù),神經(jīng)網(wǎng)絡(luò)的優(yōu)化采用SGD算法,池化采用最大池化,激活函數(shù)選擇ReLu函數(shù),基于以上構(gòu)建了初步的基于CNN的水表故障檢測(cè)模型. 構(gòu)建過程主要分為訓(xùn)練和測(cè)試兩個(gè)階段,具體步驟如下.

Step1:根據(jù)留出法[9],以1∶5的比例劃分測(cè)試集和訓(xùn)練集,且取每個(gè)樣本長(zhǎng)度為365.

Step2:訓(xùn)練階段

① 初始化模型參數(shù)如W、b等,并設(shè)立訓(xùn)練終止條件;

② 對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,通過前向傳播過程后得到輸出;

③ 若達(dá)到訓(xùn)練目標(biāo)或達(dá)到預(yù)先設(shè)定的次數(shù)則停止訓(xùn)練,否則進(jìn)入步驟④;

④ 反向傳播算法更新W、b等;

⑤ 重新回到步驟②,繼續(xù)進(jìn)行訓(xùn)練.

圖2 無故障樣本截取方式對(duì)故障分類結(jié)果的影響Fig.2 Impact of fault-free sample interception on fault classification results

Step3:測(cè)試階段. 把測(cè)試集輸入到模型中測(cè)試,將輸出結(jié)果與相應(yīng)的標(biāo)簽進(jìn)行比較,并對(duì)結(jié)果進(jìn)行統(tǒng)計(jì),最終得到測(cè)試集的準(zhǔn)確率.

基于上述過程,訓(xùn)練集準(zhǔn)確度為95.3%,測(cè)試集準(zhǔn)確度為82.1%,出現(xiàn)了明顯的過擬合. 為解決此問題,在模型訓(xùn)練中加入正則化和dropout方法.

另外,為避免“臟”數(shù)據(jù)對(duì)模型性能的不利影響,對(duì)有故障樣本采取倒序截取方式. 針對(duì)無故障樣本做了對(duì)比實(shí)驗(yàn),結(jié)果如圖2所示. 從該圖可看出正序截取時(shí)模型性能明顯較好. 這是因?yàn)榈剐蚪厝o故障數(shù)據(jù)可能帶來了無效的特征或與有故障的特征交叉,造成特征不準(zhǔn),使得模型性能較差. 所以針對(duì)無故障樣本采用正序截取方式. 最終訓(xùn)練集準(zhǔn)確度為91.2% ,測(cè)試集準(zhǔn)確度為84.1% .

2.3 模型參數(shù)優(yōu)化

表2 結(jié)構(gòu)參數(shù)對(duì)故障檢測(cè)結(jié)果的影響

上節(jié)搭建了基于水表故障檢測(cè)的初步模型,但其性能仍存較大提升空間,本節(jié)將通過實(shí)驗(yàn)優(yōu)化CNN模型的相關(guān)參數(shù),獲得最佳性能的參數(shù)組合,在此基礎(chǔ)上最終確定基于CNN的水表故障檢測(cè)模型. 參數(shù)優(yōu)化主要包括結(jié)構(gòu)參數(shù)優(yōu)化(網(wǎng)絡(luò)深度、 卷積核尺寸、 激活函數(shù)、 池化方式)和訓(xùn)練參數(shù)(學(xué)習(xí)率和訓(xùn)練批量(BATCH_SIZE))優(yōu)化. 實(shí)驗(yàn)中以測(cè)試集的準(zhǔn)確度作為評(píng)價(jià)標(biāo)準(zhǔn),為消除隨機(jī)誤差,取10次實(shí)驗(yàn)的平均值作為最終結(jié)果,然后進(jìn)行比較,其中結(jié)構(gòu)參數(shù)優(yōu)化結(jié)果如表2所示.

首先優(yōu)化激活函數(shù)和池化方式. 從表2數(shù)據(jù)可看出,不同激活函數(shù)的性能差別較大,其中Sigmoid函數(shù)易飽和,導(dǎo)致變量不更新,造成測(cè)試集準(zhǔn)確度極低,而Tanh函數(shù)收斂較慢,并且存在梯度消失問題,故選擇ReLu函數(shù);經(jīng)過不同池化后的特征有著不一樣的變化,在池化方式上,最大池化表現(xiàn)比平均池化好,這是因?yàn)樽畲蟪鼗軠p小卷積層參數(shù)誤差造成的估計(jì)均值偏移,故選擇最大池化.

隨后,針對(duì)網(wǎng)絡(luò)深度和卷積核尺寸進(jìn)行綜合優(yōu)化. 由表2數(shù)據(jù)可知:① 模型越深并不代表性能就越好,在網(wǎng)絡(luò)深度中,4層準(zhǔn)確率較低,6層和8層較高,因?yàn)楦畹哪P湍軌驍M合更為復(fù)雜的特征. 但是網(wǎng)絡(luò)加深可能會(huì)帶來梯度不穩(wěn)定、 網(wǎng)絡(luò)退化等問題,因此6層網(wǎng)絡(luò)的性能略高于8層;② 水表數(shù)據(jù)是一種時(shí)間序列數(shù)據(jù),卷積核尺寸可以反映該類數(shù)據(jù)的周期性特征,表2 數(shù)據(jù)表明卷積核尺寸為7×1的性能最好,這可能源于水表數(shù)據(jù)在“周”上的關(guān)聯(lián)性比較強(qiáng). 根據(jù)表2數(shù)據(jù),選擇性能最好的6層&7×1組合.

最后,利用網(wǎng)格搜索法進(jìn)行學(xué)習(xí)率和BATCH_SIZE的參數(shù)尋優(yōu),確定最優(yōu)參數(shù)集合為(0.07,40),即學(xué)習(xí)率為0.07,BATCH_SIZE為40. 基于此組合,最終測(cè)試集準(zhǔn)確率為88.7%.

2.4 模型架構(gòu)

基于以上參數(shù)優(yōu)化過程,最終得到基于CNN的水表故障檢測(cè)模型,如圖3所示. 其相關(guān)參數(shù)設(shè)置如表3所示,其中CW為濾波器寬度,CH為濾波器高度,CC為濾波器通道,CN為濾波器數(shù)量,B為偏差,S為子采樣率.

圖3 基于CNN的水表故障檢測(cè)模型Fig.3 CNN-based water meter fault detection model

表3 基于CNN的水表故障檢測(cè)模型參數(shù)

3 實(shí)驗(yàn)與分析

為評(píng)估本研究所提算法的性能,將其與基于SVM、 集成學(xué)習(xí)(集成多個(gè)SVM)[10]的方法進(jìn)行對(duì)比,采用準(zhǔn)確率、 平均準(zhǔn)確率、 精確率、 召回率、 精確率和召回率的調(diào)和平均值(FI-Score)等5個(gè)常見分類性能評(píng)價(jià)指標(biāo)[11]. 對(duì)比結(jié)果如表4所示.

準(zhǔn)確率表示模型對(duì)正負(fù)樣本的綜合識(shí)別能力;平均準(zhǔn)確率表示每個(gè)類別的準(zhǔn)確率的算術(shù)平均;召回率體現(xiàn)了分類模型對(duì)正樣本的識(shí)別能力,其值越高說明模型對(duì)正樣本的識(shí)別能力越強(qiáng);精確率體現(xiàn)了模型對(duì)負(fù)樣本的區(qū)分能力,精確率越高說明模型對(duì)負(fù)樣本的區(qū)分能力越強(qiáng);F1-Score 是兩者的綜合,F(xiàn)1-Score 越高,說明分類模型越穩(wěn)健. 由表4可知,相比SVM、 集成學(xué)習(xí)而言,本研究所提算法在各類性能評(píng)價(jià)指標(biāo)上均表現(xiàn)得更為出色,且性能可滿足實(shí)用要求.

表4 本研究所提算法與SVM、 集成學(xué)習(xí)方法的對(duì)比結(jié)果

4 結(jié)語

深入研究基于CNN的水表故障檢測(cè)算法,解決傳統(tǒng)方法因特征提取不準(zhǔn)而造成的檢測(cè)精度低的問題. 首先初步構(gòu)建水表故障檢測(cè)的CNN模型,基于此模型討論無故障樣本截取方式對(duì)分類準(zhǔn)確率的影響. 然后通過實(shí)驗(yàn)對(duì)模型中相關(guān)參數(shù)(網(wǎng)絡(luò)深度、 卷積核尺寸等)進(jìn)行優(yōu)化,得到最優(yōu)參數(shù),構(gòu)建了最終模型. 對(duì)比實(shí)驗(yàn)中,本研究所提算法準(zhǔn)確率達(dá)88.7%,各項(xiàng)指標(biāo)均高于基于SVM和集成學(xué)習(xí)的方法,充分證明了其可行性和有效性.

猜你喜歡
水表準(zhǔn)確率卷積
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
水表普查與水表掛接子系統(tǒng)建設(shè)
水表檢定裝置不確定度分析計(jì)算的相關(guān)思考
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
防凍水表
高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
德昌县| 淳化县| 甘德县| 渑池县| 高密市| 普安县| 芒康县| 长岛县| 志丹县| 大邑县| 东乌珠穆沁旗| 新乡县| 洪湖市| 墨竹工卡县| 郓城县| 十堰市| 双流县| 思南县| 拉孜县| 安多县| 沾益县| 新野县| 德惠市| 旌德县| 繁峙县| 承德市| 碌曲县| 皋兰县| 聂拉木县| 渝北区| 东平县| 北辰区| 枝江市| 乐都县| 含山县| 华阴市| 玉树县| 达拉特旗| 宁津县| 靖安县| 安仁县|