高 露,馬元婧
(中國(guó)科學(xué)院大學(xué),北京 100049)
(中國(guó)科學(xué)院 沈陽(yáng)計(jì)算技術(shù)研究所,沈陽(yáng) 110168)
我國(guó)環(huán)境監(jiān)測(cè)設(shè)備行業(yè)起步較晚,且環(huán)境監(jiān)測(cè)設(shè)備多是中小型企業(yè)生產(chǎn),產(chǎn)品基本集中在中低檔的環(huán)境監(jiān)測(cè)設(shè)備,還遠(yuǎn)遠(yuǎn)不能適應(yīng)我國(guó)環(huán)境監(jiān)測(cè)工作發(fā)展的需要,主要表現(xiàn)為產(chǎn)品質(zhì)量不高、使用壽命短、性能不穩(wěn)定、故障高等方面,這導(dǎo)致環(huán)境監(jiān)測(cè)頻次低、采樣誤差大、監(jiān)測(cè)數(shù)據(jù)不準(zhǔn)確,不能及時(shí)反映環(huán)境質(zhì)量狀況.因此,加強(qiáng)設(shè)備的故障監(jiān)測(cè)力度,保障設(shè)備的正常運(yùn)轉(zhuǎn),提高設(shè)備的安全性與可靠性具有非凡的意義[1].
目前,對(duì)設(shè)備故障檢測(cè)的研究主要集中在對(duì)設(shè)備的紅外熱圖像的分析.在檢測(cè)電力設(shè)備熱故障中,根據(jù)設(shè)備的形狀特征識(shí)別熱圖像中的電力設(shè)備,計(jì)算設(shè)備區(qū)域內(nèi)的最高溫度值,并對(duì)各種影響因素進(jìn)行修正后作出診斷,取得了令人滿意的結(jié)果[2].還可以通過(guò)紅外圖像配準(zhǔn)區(qū)域的溫度信息,憑借溫度信息相互對(duì)比獲取的結(jié)果,實(shí)現(xiàn)電力設(shè)備熱故障檢測(cè),具有較高的檢測(cè)精度和魯棒性[3].由于環(huán)境溫度等因素對(duì)紅外熱圖像的影響較大,這些方法仍然存在很大的局限性.
隨著深度學(xué)習(xí)在目標(biāo)檢測(cè)領(lǐng)域的廣泛應(yīng)用,Faster R-CNN[4]算法作為該領(lǐng)域的經(jīng)典算法之一,具有較高的識(shí)別準(zhǔn)確率的同時(shí),也具有較快的檢測(cè)速度,已經(jīng)廣泛應(yīng)用于車輛檢測(cè)[5]、靜態(tài)飛機(jī)檢測(cè)[6]、商品圖像檢測(cè)[7]等方面.
本文提出了一種基于Faster R-CNN 的環(huán)境監(jiān)測(cè)設(shè)備故障檢測(cè)與識(shí)別方法,將Faster R-CNN 應(yīng)用于環(huán)境監(jiān)測(cè)設(shè)備的故障檢測(cè)上,通過(guò)收集環(huán)境監(jiān)測(cè)設(shè)備周圍的視頻監(jiān)控,有間隔地提取其中關(guān)于設(shè)備運(yùn)行時(shí)狀態(tài)的圖像,對(duì)這些圖像數(shù)據(jù)進(jìn)行離線訓(xùn)練,獲得相對(duì)應(yīng)的故障檢測(cè)模型,然后通過(guò)設(shè)備故障在線檢測(cè)系統(tǒng)實(shí)現(xiàn)在線實(shí)時(shí)監(jiān)測(cè),從而及時(shí)有效地獲取到設(shè)備是否出現(xiàn)故障的信息,并通知相關(guān)的工作人員.本文主要從設(shè)備開(kāi)關(guān)狀態(tài)識(shí)別、設(shè)備指示燈異常識(shí)別、設(shè)備顯示異常數(shù)據(jù)識(shí)別三個(gè)方面驗(yàn)證了深度學(xué)習(xí)在環(huán)境監(jiān)測(cè)設(shè)備故障識(shí)別上的可行性,有效地解決了對(duì)環(huán)境監(jiān)測(cè)設(shè)備的故障檢測(cè)問(wèn)題,節(jié)省了人力物力,進(jìn)一步實(shí)現(xiàn)了設(shè)備的自動(dòng)化檢測(cè).
目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)的實(shí)際應(yīng)用中重要的一個(gè)領(lǐng)域,不僅包括對(duì)目標(biāo)物體的分類,還包含對(duì)目標(biāo)物體的定位,Faster R-CNN 算法就是該領(lǐng)域的一個(gè)經(jīng)典之作,與另一個(gè)目標(biāo)檢測(cè)算法Fast R-CNN[8]相比,Faster R-CNN在PASCA VOC 2007 數(shù)據(jù)集上的準(zhǔn)確率略有提高,圖像的處理速度大幅度提高.在測(cè)試上,Faster R-CNN 比Fast R-CNN 快10 倍,圖像處理速度基本可以達(dá)到17fps(每秒可處理17 幀圖像),能達(dá)到準(zhǔn)實(shí)時(shí)處理的能力.
Faster R-CNN 算法的整體結(jié)構(gòu)如圖1所示,可將其分為四個(gè)部分:VOC 數(shù)據(jù)集、特征提取器、RPN(區(qū)域建議網(wǎng)絡(luò))和Fast R-CNN 網(wǎng)絡(luò).
數(shù)據(jù)集指的是用來(lái)訓(xùn)練和測(cè)試模型的圖片數(shù)據(jù),將其處理成符合要求的數(shù)據(jù)格式,目前Faster RCNN 算法常用的數(shù)據(jù)集是VOC,將收集到的圖片數(shù)據(jù)按照PASCAL VOC 2007 數(shù)據(jù)集的格式存儲(chǔ)即可.
將VOC 數(shù)據(jù)集作為Faster R-CNN 算法的輸入數(shù)據(jù),經(jīng)過(guò)相應(yīng)的輸入層處理,返回三個(gè)值作為后面模型訓(xùn)練的輸入,這三個(gè)值分別是:圖片信息img、邊界框信息bbox 和標(biāo)簽信息label,如圖1所示.
圖1 Faster R-CNN 結(jié)構(gòu)圖
在圖像中,目標(biāo)事物的特征主要體現(xiàn)在像素與像素之間的關(guān)系,如區(qū)分一張圖片中是否有一條直線的依據(jù)是該直線上的像素與直線相鄰像素的區(qū)別.在這里,依賴卷積運(yùn)算可以找到像素與像素之間的關(guān)系,對(duì)目標(biāo)事物的特征進(jìn)行提取,從而區(qū)分目標(biāo)事物與周圍的背景.
本文采用的特征提取器是用于大規(guī)模圖像識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)VGG16,整個(gè)結(jié)構(gòu)包含13 個(gè)卷積層,按照“2+2+3+3+3”的模式分成5 段,每段卷積層后面都緊跟著一個(gè)最大池化層.這里的卷積層可以從輸入的一小塊數(shù)據(jù)中學(xué)習(xí)到圖像的特征,并且可以保留像素的空間關(guān)系.在實(shí)際應(yīng)用中,使用的卷積層數(shù)越多,提取到的圖像特征就越多,網(wǎng)絡(luò)在未知圖像上識(shí)別效果越好,VGG16 網(wǎng)絡(luò)的13 個(gè)卷積層能夠很好的提取到圖像中目標(biāo)的有用特征,獲得其對(duì)應(yīng)的特征圖,用于后面的模型訓(xùn)練.在這里,最大池化層主要是在保持大部分特征的基礎(chǔ)上控制卷積層提取出的特征圖的維度,使網(wǎng)絡(luò)對(duì)輸入圖像的變化不敏感,從而最大程度上保持圖像的尺度不變性.
RPN 網(wǎng)絡(luò)是全卷積的網(wǎng)絡(luò)結(jié)構(gòu),它能同時(shí)預(yù)測(cè)輸入圖片產(chǎn)生的目標(biāo)候選框的位置和該目標(biāo)屬于真實(shí)目標(biāo)的概率,同時(shí),在訓(xùn)練網(wǎng)絡(luò)的過(guò)程中,通過(guò)對(duì)RPN 網(wǎng)絡(luò)和Fast R-CNN 網(wǎng)絡(luò)交替訓(xùn)練的方式,在訓(xùn)練時(shí)可以共享卷積特征,大大地減少了訓(xùn)練時(shí)需要的參數(shù)量,提高了訓(xùn)練效率.Faster R-CNN 的核心貢獻(xiàn)就在于提出了RPN 網(wǎng)絡(luò)代替?zhèn)鹘y(tǒng)的選擇性搜索(Selective Search)方法,從而將候選區(qū)域提取的時(shí)間開(kāi)銷幾乎降為 0(由2 s 下降為0.01 s).
RPN 網(wǎng)絡(luò)的優(yōu)勢(shì)主要體現(xiàn)在RPN 網(wǎng)絡(luò)能預(yù)測(cè)出質(zhì)量高、數(shù)量少的建議框,并且RPN 的預(yù)測(cè)絕大部分在GPU 中完成,能大幅度地加快目標(biāo)檢測(cè)的速度.
首先,RPN 網(wǎng)絡(luò)采用了3 種不同類型的滑動(dòng)窗口(稱為錨點(diǎn)),長(zhǎng)寬比分別為1:1、2:1、1:2,并用3 種尺度縮放滑動(dòng)窗口,一共采用了9 種類型的錨點(diǎn).利用這些滑動(dòng)窗口在特征圖上自左到右、從上向下移動(dòng),對(duì)于一張圖片,大約有20 000 個(gè)錨點(diǎn),這有點(diǎn)類似于暴力窮舉,能保證包含了絕大部分目標(biāo)的真實(shí)邊界框.
接下來(lái)RPN 要做的事情就是從20000 多個(gè)候選的錨點(diǎn)中選出256 個(gè)錨點(diǎn)進(jìn)行分類和回歸位置,選擇算法如下:
另一方面,RPN 在自身訓(xùn)練的同時(shí),還會(huì)提供感興趣區(qū)域作為Fast R-CNN 的訓(xùn)練樣本.RPN 網(wǎng)絡(luò)生成感興趣區(qū)域的算法如下:
該部分負(fù)責(zé)對(duì)感興趣區(qū)域進(jìn)行類別分類和位置邊框微調(diào),判斷RPN 找出的感興趣區(qū)域是否包含目標(biāo)以及該目標(biāo)的類別,并修正框的位置坐標(biāo).RPN 只是給出了2000 個(gè)候選框,Fast R-CNN 網(wǎng)絡(luò)需要在給出的2000 個(gè)候選框上繼續(xù)進(jìn)行分類和位置參數(shù)的回歸.
首先挑選出128 個(gè)樣本感興趣區(qū)域,然后使用RoI-Pooling 層將這些不同尺寸的區(qū)域全部下采樣到同一個(gè)尺度上.這里,RoI-Pooling 是一種特殊的下采樣操作,給定一張圖片的特征圖,假設(shè)該特征圖的維度是512×(H/16)×(W/16),以及128 個(gè)候選區(qū)域的坐標(biāo)(其維度為128×4),RoI-Pooling 層將這些候選區(qū)域的維度統(tǒng)一下采樣成512×7×7 的維度,最終可以得到維度為128×512×7×7 的向量,可以將其看成是一個(gè)批處理尺寸為128、通道數(shù)為512、尺寸為7×7 的特征圖.簡(jiǎn)而言之,這整個(gè)過(guò)程是為了將挑選出的感興趣區(qū)域全部下采樣成7×7 尺寸,從而實(shí)現(xiàn)權(quán)重共享.當(dāng)所有的感興趣區(qū)域都被下采樣成512×7×7 的特征圖后,將它重塑成一個(gè)一維的向量,就可以利用VGG16 預(yù)訓(xùn)練的權(quán)重,初始化前兩層全連接,最后再接上用來(lái)分類的全連接層和用來(lái)回歸位置的全連接層.
環(huán)境監(jiān)測(cè)設(shè)備是用來(lái)收集評(píng)定環(huán)境質(zhì)量的各種數(shù)據(jù),比如大氣中含有SO2、NOx 等污染物的濃度、溫濕度范圍等等,通過(guò)這些數(shù)據(jù),研究人員可以分析當(dāng)前的環(huán)境質(zhì)量.監(jiān)測(cè)到的各種數(shù)據(jù)是否準(zhǔn)確是這個(gè)過(guò)程中的關(guān)鍵,而設(shè)備發(fā)生故障是影響監(jiān)測(cè)數(shù)據(jù)是否準(zhǔn)確的重要因素.因此,能否及時(shí)地檢測(cè)到設(shè)備故障與準(zhǔn)確地監(jiān)測(cè)環(huán)境質(zhì)量有著密切聯(lián)系.
由于人力物力的限制,環(huán)境監(jiān)測(cè)設(shè)備的工作站會(huì)安裝許多的監(jiān)控?cái)z像頭,用于實(shí)時(shí)地監(jiān)控設(shè)備的運(yùn)行狀況.通過(guò)熟悉工作站設(shè)備擺放位置的工作人員,挑選出相關(guān)設(shè)備運(yùn)行狀況的監(jiān)控視頻,從這些視頻中提取出設(shè)備運(yùn)行時(shí)狀態(tài)的視頻幀,包含正常運(yùn)行時(shí)圖像和發(fā)生故障時(shí)圖像,將其作為Faster R-CNN 算法訓(xùn)練模型的樣本集.通常情況下,環(huán)境監(jiān)測(cè)設(shè)備的工作站會(huì)安排技術(shù)人員定期檢查工作站中設(shè)備是否正常工作,而人工檢查時(shí)間過(guò)長(zhǎng)、效率過(guò)低,同時(shí)也受技術(shù)人員工作經(jīng)驗(yàn)、工作狀態(tài)等主觀因素影響較大,利用監(jiān)控視頻提取相關(guān)設(shè)備的狀態(tài)圖像,既能節(jié)省人力物力,也能有效地保證信息的正確性.
環(huán)境監(jiān)測(cè)設(shè)備種類繁多,會(huì)導(dǎo)致收集到的圖像數(shù)據(jù)量巨大,通過(guò)工作人員逐個(gè)排查的方法困難重重.本文將深度學(xué)習(xí)算法應(yīng)用于環(huán)境監(jiān)測(cè)設(shè)備故障的檢測(cè)問(wèn)題,在Caffe 平臺(tái)的基礎(chǔ)上,提供Faster R-CNN 目標(biāo)檢測(cè)和識(shí)別算法訓(xùn)練該識(shí)別模型.首先配置Caffe 平臺(tái)的運(yùn)行環(huán)境,并在該平臺(tái)上搭建Faster R-CNN 算法,然后將篩選出的樣本集按照PASCAL VOC 2007 數(shù)據(jù)集的標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)標(biāo)注和存儲(chǔ),基于VGG16 預(yù)訓(xùn)練模型進(jìn)行參數(shù)微調(diào),使得最終模型適用于環(huán)境監(jiān)測(cè)設(shè)備的故障檢測(cè)和識(shí)別問(wèn)題,算法流程如圖2所示.
圖2 基于Faster R-CNN 設(shè)備故障檢測(cè)算法流程圖
簡(jiǎn)單來(lái)說(shuō),訓(xùn)練模型的過(guò)程就是先初始化一個(gè)幾乎什么也不能做的模型,然后抓取一些有標(biāo)注的數(shù)據(jù)集,修改模型使得它在抓取的數(shù)據(jù)集上能夠更準(zhǔn)確的執(zhí)行任務(wù),一直重復(fù)上面的步驟,直到模型看起來(lái)不錯(cuò).Faster R-CNN 算法使用預(yù)先標(biāo)注好的VOC 數(shù)據(jù)集進(jìn)行模型訓(xùn)練,通過(guò)對(duì)這些有標(biāo)注的數(shù)據(jù)進(jìn)行分析提取微調(diào)模型,從而使得最終得到的模型適用于設(shè)備故障檢測(cè)和識(shí)別任務(wù).
Faster R-CNN 算法使用了RPN 和Fast R-CNN 兩種網(wǎng)絡(luò),由于直接使用BP (Back Propagation,反向傳播)算法進(jìn)行訓(xùn)練比較繁瑣,訓(xùn)練模型時(shí),采用16 層的VGG16 卷積神經(jīng)網(wǎng)絡(luò)提取圖片的特征,使用RPN 網(wǎng)絡(luò)和Fast R-CNN 網(wǎng)絡(luò)交叉訓(xùn)練的方式,由于訓(xùn)練時(shí)共享卷積特征,既減少了訓(xùn)練時(shí)的參數(shù)量,又提高了訓(xùn)練效率,基本達(dá)到了準(zhǔn)實(shí)時(shí)的檢測(cè)性能.
本次實(shí)驗(yàn)主要是為了驗(yàn)證Faster R-CNN 算法在環(huán)境監(jiān)測(cè)設(shè)備故障檢測(cè)與識(shí)別任務(wù)上的有效性和優(yōu)越性,將該算法應(yīng)用在開(kāi)關(guān)、指示燈、數(shù)字儀器三種設(shè)備的故障檢測(cè)上,能夠及時(shí)有效地檢測(cè)到該設(shè)備發(fā)生了故障,然后通知相關(guān)的工作人員采取有效的解決方法,從而有效的提高了設(shè)備故障監(jiān)測(cè)的效率.
樣本數(shù)據(jù)來(lái)源于環(huán)境檢測(cè)設(shè)備周圍的監(jiān)控視頻,抽取最近7 天內(nèi)的全部監(jiān)控視頻,每間隔15 分鐘,從中截取一幀圖像,然后通過(guò)人工的方式,從最后截取的視頻幀中挑選出6000 張環(huán)境監(jiān)測(cè)設(shè)備開(kāi)關(guān)狀態(tài)相關(guān)的圖像、6000 張環(huán)境監(jiān)測(cè)設(shè)備指示燈異常狀態(tài)相關(guān)的圖像和6000 張環(huán)境監(jiān)測(cè)設(shè)備數(shù)字顯示異常的圖像,將其作為訓(xùn)練樣本.這樣,對(duì)于開(kāi)關(guān)、指示燈、數(shù)字這三種設(shè)備,每種設(shè)備的樣本圖像集均為6000 張,其中訓(xùn)練集與測(cè)試集的比例為2:1.對(duì)整個(gè)數(shù)據(jù)集中每張圖像里設(shè)備的狀態(tài)進(jìn)行人工標(biāo)記,將所有的樣本圖像集按照PASAL VOC2007 樣本集的格式處理并存儲(chǔ),然后利用隨機(jī)函數(shù)將數(shù)據(jù)集隨機(jī)的分成訓(xùn)練集和數(shù)據(jù)集(數(shù)量比例為1:1),對(duì)于開(kāi)關(guān)、指示燈、數(shù)字這三種設(shè)備,每類的訓(xùn)練集和測(cè)試集的數(shù)據(jù)量均為3000 張,其中每個(gè)類別中訓(xùn)練集和測(cè)試集的正負(fù)樣本比例基本達(dá)到了1:1.
目標(biāo)檢測(cè)中衡量檢測(cè)精度的指標(biāo)是mAP(mean Average Precision),指的是多個(gè)類別的平均準(zhǔn)確率的平均值.AP 指的是單個(gè)類別的平均準(zhǔn)確率,衡量的是模型在該類別上識(shí)別效果的好壞,而mAP 衡量的是模型在所有類別上識(shí)別效果的好壞,實(shí)際上,mAP 就是求所有AP 的平均值.mAP 的值介于0-1 之間,且越大表示該模型的識(shí)別準(zhǔn)確率越好.本次實(shí)驗(yàn)中,用mAP 來(lái)評(píng)判模型識(shí)別的效果.
本次試驗(yàn)的服務(wù)器操作系統(tǒng)是Ubuntu16.04,顯卡型號(hào)為GeForce GTX 960,顯卡內(nèi)存為2 GB,在該服務(wù)器上搭建深度學(xué)習(xí)框架Caffe,并配置Faster R-CNN 的運(yùn)行環(huán)境.然后將標(biāo)定完成后的樣本數(shù)據(jù)集使用Faster R-CNN 進(jìn)行訓(xùn)練,基礎(chǔ)特征提取網(wǎng)絡(luò)選用VGG16 網(wǎng)絡(luò),使用輪流訓(xùn)練的方式訓(xùn)練模型.
Faster R-CNN 在訓(xùn)練網(wǎng)絡(luò)模型的過(guò)程中,為了能夠使得梯度下降法有較好的性能,需要把學(xué)習(xí)率的值設(shè)定在合適的范圍內(nèi).太大的學(xué)習(xí)速率導(dǎo)致學(xué)習(xí)的不穩(wěn)定,太小值又導(dǎo)致極長(zhǎng)的訓(xùn)練時(shí)間.訓(xùn)練模型的學(xué)習(xí)速率、衰減系數(shù)和動(dòng)量參數(shù)的選取直接影響到最終檢測(cè)模型的訓(xùn)練速度和結(jié)果,本文選取一些較常用的學(xué)習(xí)速率和衰減系數(shù)作為候選值,如表1所示.將衰減系數(shù)確定為0.1,學(xué)習(xí)速率的選取值有0.1、0.01、0.001,動(dòng)量參數(shù)的選取值有0.5 和0.9,在衰減系數(shù)不變的情況下,首先確定了學(xué)習(xí)速率,然后確定動(dòng)量的大小.其中,當(dāng)學(xué)習(xí)率為0.1 時(shí),訓(xùn)練無(wú)法收斂,可能是學(xué)習(xí)速率初始值設(shè)置過(guò)大的原因.由表可知,最終確定衰減系數(shù)為0.1,初始學(xué)習(xí)速率為0.001,動(dòng)量參數(shù)大小為0.9.
Faster R-CNN 輪流訓(xùn)練的方式,其實(shí)質(zhì)是對(duì)RPN 網(wǎng)絡(luò)和Fast R-CNN 網(wǎng)絡(luò)的兩次輪流訓(xùn)練,即“RPN-Fast RCNN-RPN-Fast R-CNN”的方式.使用實(shí)驗(yàn)確定的訓(xùn)練參數(shù),改變Faster R-CNN 的第一階段的RPN 網(wǎng)絡(luò)和Fast R-CNN 網(wǎng)絡(luò)的迭代次數(shù),分布計(jì)算器對(duì)應(yīng)的損失函數(shù)值,如圖3所示,當(dāng)RPN 網(wǎng)絡(luò)和Fast R-CNN 網(wǎng)絡(luò)分別迭代到80 000 和40 000 時(shí),損失函數(shù)值趨于平緩.
表1 不同參數(shù)對(duì)應(yīng)的測(cè)試精度
圖3 Faster R-CNN 訓(xùn)練階段損失值變化情況
由于RPN 網(wǎng)絡(luò)是Faster R-CNN 的核心網(wǎng)絡(luò),大大提高了獲取候選建議框的效率,而Fast R-CNN 算法是通過(guò)選擇性搜索方法獲取候選建議框,分別將這兩種算法運(yùn)用在環(huán)境檢測(cè)設(shè)備的開(kāi)關(guān)、指示燈和數(shù)字儀器的故障識(shí)別任務(wù)上,實(shí)驗(yàn)結(jié)果如表2所示.
由表2可知,Faster R-CNN 在不同的基礎(chǔ)特征提取網(wǎng)絡(luò)上的檢測(cè)效果差異很大.ZF 網(wǎng)絡(luò)相對(duì)于VGG16來(lái)說(shuō),是一種小型的卷積網(wǎng)絡(luò),將其作為Faster R-CNN 的基礎(chǔ)特征提取網(wǎng)絡(luò),分別對(duì)開(kāi)關(guān)、指示燈、數(shù)字儀器三種設(shè)備的故障狀態(tài)進(jìn)行檢測(cè)識(shí)別,VGG16 網(wǎng)絡(luò)的mAP 基本能達(dá)到90%以上,而ZF 的mAP 在85%左右,但是,ZF 對(duì)圖像的處理速度明顯比VGG16 大約快3 倍左右.在實(shí)際的環(huán)境設(shè)備故障檢測(cè)場(chǎng)景中,VGG16 對(duì)每幅圖像處理時(shí)間為0.2s 左右仍然是可以接受的,因此,綜合考慮識(shí)別準(zhǔn)確率和處理速率兩個(gè)因素,VGG16 仍然優(yōu)于ZF 網(wǎng)絡(luò).另一方面,將同樣以VGG16 作為特征提取網(wǎng)絡(luò)的Faster R-CNN 和Fast RCNN 算法做對(duì)比試驗(yàn).結(jié)果顯示,Faster R-CNN 算法的平均識(shí)別準(zhǔn)確率明顯優(yōu)于Fast R-CNN 算法,至于圖像的處理速度,Faster R-CNN 比Fast R-CNN 算法快了8 倍.因此,在環(huán)境檢測(cè)設(shè)備故障檢測(cè)的復(fù)雜場(chǎng)景中,Faster R-CNN 有著明顯的優(yōu)勢(shì).
表2 Faster R-CNN 與Fast R-CNN 的對(duì)比結(jié)果
如圖4、圖5和圖6所示,對(duì)不同拍攝角度、有部分遮擋物、不同光照條件下的圖片,Faster R-CNN 算法都能得到較好的檢測(cè)效果.由實(shí)驗(yàn)結(jié)果可以得出,本文方法在開(kāi)關(guān)、指示燈、數(shù)字儀表三種設(shè)備故障檢測(cè)上都能得到較好的結(jié)果.同時(shí)可以分析得到,在設(shè)備機(jī)房監(jiān)控獲得的圖像中,由于監(jiān)控角度多變、設(shè)備種類多、場(chǎng)景的復(fù)雜度大、監(jiān)控視頻的清晰度等問(wèn)題,使得設(shè)備目標(biāo)的檢測(cè)難度增加,識(shí)別的準(zhǔn)確率相對(duì)于單一場(chǎng)景的目標(biāo)識(shí)別有了一定程度的下降,而本文提出的方法,在一定程度上緩解了這些問(wèn)題,對(duì)于不同的拍攝角度、不同程度的遮擋條件下的設(shè)備故障檢測(cè)仍能夠得到較好的檢測(cè)效果.
針對(duì)環(huán)境檢測(cè)設(shè)備故障檢測(cè)中,由于設(shè)備故障頻發(fā)、人工排查工作量大等因素,同時(shí)需要保障設(shè)備機(jī)房的特定監(jiān)測(cè)環(huán)境,提出了基于深度學(xué)習(xí)算法的設(shè)備故障檢測(cè)與識(shí)別的方法.與其他方法的對(duì)比試驗(yàn)表明,本文使用的方法在環(huán)境監(jiān)測(cè)設(shè)備故障檢測(cè)和識(shí)別上能夠取得較好的檢測(cè)效果,提升了復(fù)雜環(huán)境場(chǎng)景下模板檢測(cè)的準(zhǔn)確率,對(duì)不同拍攝角度的設(shè)備、有部分遮擋的設(shè)備、不同光照條件下的設(shè)備檢測(cè)都有較好的效果.但是,本文的方法對(duì)于部分密集目標(biāo)的檢測(cè)效果并不好,出現(xiàn)了部分目標(biāo)誤檢或漏檢的情況.由于設(shè)備機(jī)房監(jiān)控設(shè)備的限制,對(duì)某些放置比較緊密的小型設(shè)備的拍攝圖像比較模型,難以提取到有效的設(shè)備狀態(tài)特征圖,從而無(wú)法對(duì)最終的檢測(cè)模型進(jìn)行有效的優(yōu)化.因此,在以后的研究中,將重點(diǎn)解決環(huán)境監(jiān)測(cè)設(shè)備機(jī)房中密集小設(shè)備的檢測(cè)問(wèn)題,從圖像特征提取、目標(biāo)定位等方面對(duì)其進(jìn)行改進(jìn),以獲得更高的準(zhǔn)確率和檢測(cè)效果.
圖4 開(kāi)關(guān)儀器檢測(cè)結(jié)果
圖5 指示燈檢測(cè)結(jié)果
圖6 數(shù)字儀表檢測(cè)結(jié)果