魏偉航 馬乾力 高治良 趙錦成
摘 要:目前基于卷積神經(jīng)網(wǎng)絡(luò)的煙霧檢測(cè)主要通過(guò)若干個(gè)有序的卷積層的學(xué)習(xí)識(shí)別煙霧。為了提高煙霧檢測(cè)的精確度,提出了一種改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)框架。該框架增加了批量歸一化層和輕量級(jí)的卷積結(jié)構(gòu),并提取網(wǎng)絡(luò)中不同卷積層的特征圖進(jìn)行聯(lián)合訓(xùn)練。改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)更小,訓(xùn)練參數(shù)更少。在仿真實(shí)驗(yàn)中,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行了圖像擴(kuò)增,結(jié)果證明了改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)能夠有效提高煙霧識(shí)別的準(zhǔn)確率和識(shí)別速度。
關(guān)鍵詞: 煙霧檢測(cè);卷積神經(jīng)網(wǎng)絡(luò);圖像擴(kuò)增
文章編號(hào): 2095-2163(2019)03-0040-05?中圖分類號(hào): TP391?文獻(xiàn)標(biāo)志碼: A
0?引?言
煙霧檢測(cè)作為防治火災(zāi)的一種重要且有效的方法,一直是國(guó)內(nèi)外火情預(yù)警研究的重要方向。傳統(tǒng)的煙霧檢測(cè)方案主要采用溫度感應(yīng)傳感器、濕度感應(yīng)傳感器和煙感應(yīng)式傳感器等[1],這些傳感器價(jià)廉物美,準(zhǔn)確度高,但是感應(yīng)范圍較小、且容易損壞,難以大面積鋪設(shè),不適用于一些空間較大的高火災(zāi)隱患場(chǎng)所。隨著圖像、視頻等數(shù)據(jù)大規(guī)模普及和深度學(xué)習(xí)的興起,基于圖像識(shí)別的煙霧檢測(cè)技術(shù)成為了更加方便,科學(xué)的火災(zāi)探測(cè)手段。
卷積神經(jīng)網(wǎng)絡(luò)是一種深度神經(jīng)網(wǎng)絡(luò)模型,主要應(yīng)用于圖像識(shí)別,僅就過(guò)去的不到10年期間,即在目標(biāo)識(shí)別、物體定位等領(lǐng)域中取得了巨大的成就?,F(xiàn)有的基于圖像識(shí)別的煙霧檢測(cè)方法主要采用局部模式特征、灰度共生矩陣或者各類統(tǒng)計(jì)量(如標(biāo)準(zhǔn)差、均值、傾斜度等)特征對(duì)煙霧進(jìn)行建模[2],而使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行煙霧檢測(cè)的算法卻不多。陳俊周等人[3]在卷積神經(jīng)網(wǎng)絡(luò)中綜合了視頻的靜態(tài)紋理信息和動(dòng)態(tài)紋理信息,將原始圖像及其光流序列分別作為靜態(tài)紋理和動(dòng)態(tài)紋理的輸入,有效地降低了誤檢率。李誠(chéng)等人[4]使用了GoogLeNet[5]的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行火焰和煙霧檢測(cè)。Yin 等人[6]?提出了基于深度歸一化化卷積神經(jīng)網(wǎng)絡(luò)的圖像煙霧檢測(cè)算法,該網(wǎng)絡(luò)在每個(gè)卷積層后增加了批量歸一化層[7],有效抑制了訓(xùn)練中產(chǎn)生的梯度消失和過(guò)擬合等問(wèn)題,加速了網(wǎng)絡(luò)的收斂速度,對(duì)文中提出的數(shù)據(jù)集的準(zhǔn)確率接近98%。
當(dāng)前煙霧識(shí)別卷積網(wǎng)絡(luò)模型層數(shù)較深,模型訓(xùn)練參數(shù)較多,網(wǎng)絡(luò)模型冗余。因此,本文采用了深度可分離卷積結(jié)構(gòu)[8-9],減少網(wǎng)絡(luò)參數(shù),并提取不同網(wǎng)絡(luò)層的特征進(jìn)行融合訓(xùn)練,抑制由于網(wǎng)絡(luò)泛化導(dǎo)致的有效煙霧特征彌散現(xiàn)象,再針對(duì)正負(fù)樣本不平衡的問(wèn)題,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行了數(shù)據(jù)擴(kuò)增,在減小網(wǎng)絡(luò)模型的同時(shí),得到更高的分類精度和識(shí)別度。
1?改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)
1.1?深度可分離卷積結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)一般由卷積層、非線性激活函數(shù)層、池化層和全連接層組成,其中卷積層主要為網(wǎng)絡(luò)提供權(quán)重參數(shù),在迭代訓(xùn)練的過(guò)程中,網(wǎng)絡(luò)在某種確定的損失函數(shù)和隨機(jī)梯度下降算法的指導(dǎo)下不斷更新卷積層提供的權(quán)重參數(shù),使權(quán)重更趨向于正確的分類界面。常規(guī)的卷積運(yùn)算如圖1所示,在計(jì)算時(shí)使用卷積核的權(quán)重參數(shù)遍歷每個(gè)輸入通道得到特征圖,再疊加每個(gè)輸入通道對(duì)應(yīng)的特征圖后獲得一個(gè)完整的特征圖。
這一過(guò)程涉及的參數(shù)和計(jì)算量非常大,因此,2017年谷歌提出了一種輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò):MobileNet[9],可將常規(guī)卷積結(jié)構(gòu)轉(zhuǎn)換為深度可分離卷積結(jié)構(gòu),這種新的卷積結(jié)構(gòu)在準(zhǔn)確率基本不變的情況下,計(jì)算速度提高了9倍,參數(shù)數(shù)量降為原來(lái)的七分之一。深度可分離卷積結(jié)構(gòu)可以分為兩層卷積層,分別為深度卷積層和逐點(diǎn)卷積層。如圖2所示,深度卷積對(duì)每個(gè)輸入通道進(jìn)行獨(dú)立的空間卷積,去除了疊加特征圖的步驟;逐點(diǎn)卷積運(yùn)算與常規(guī)的卷積運(yùn)算相同,只將卷積核的尺寸固定為1×1。深度可分離卷積將空間特征和通道特征的學(xué)習(xí)進(jìn)行分離的做法,減少了權(quán)重參數(shù)數(shù)量,降低了網(wǎng)絡(luò)的計(jì)算量。
1.2?批量歸一化層
在卷積神經(jīng)網(wǎng)絡(luò)中,卷積運(yùn)算后特征圖的數(shù)據(jù)分布會(huì)發(fā)生極大的變化,這種不可控的改變?cè)黾恿司W(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)的難度。批量歸一化有效地解決了這個(gè)問(wèn)題并能夠抑制訓(xùn)練過(guò)擬合現(xiàn)象,輸入的特征圖在卷積計(jì)算后進(jìn)行批量歸一化,使其數(shù)據(jù)分布趨向于一個(gè)均值為0,方差為1的高斯分布,在這一過(guò)程中信息不丟失,并且批量歸一化的運(yùn)用使訓(xùn)練的難度大大減低,減少了訓(xùn)練過(guò)程中調(diào)整學(xué)習(xí)率的操作。
區(qū)別于常規(guī)的歸一化操作,批量歸一化也加入網(wǎng)絡(luò)的訓(xùn)練,數(shù)學(xué)公式如下所示:
1.3?改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本文提出的卷積神經(jīng)網(wǎng)絡(luò)分為主體部分和旁支部分,網(wǎng)絡(luò)整體結(jié)構(gòu)如圖3所示。
主體部分由6個(gè)深度可分離卷積層和一個(gè)全連接層組成,每個(gè)深度可分離卷積層后進(jìn)行批量歸一化和非線性函數(shù)激活。批量歸一化對(duì)輸入數(shù)據(jù)進(jìn)行正則化,加速網(wǎng)絡(luò)收斂和抑制過(guò)擬合,第一、二個(gè)卷積層后使用了雙曲正切激活函數(shù),防止網(wǎng)絡(luò)的底層卷積泛化時(shí)煙霧信息損失過(guò)多,在之后的4個(gè)卷積層采用ReLU激活函數(shù),第二、四卷積層后使用最大值池化,最后一個(gè)卷積層后通過(guò)全局均值池化[10]將每個(gè)特征圖融合為一個(gè)特征點(diǎn),全局均值池化層實(shí)際等同對(duì)整個(gè)特征圖正則化,有利于防止過(guò)擬合,能大幅度減少全連接層的神經(jīng)元數(shù)量,但會(huì)降低收斂速度。
旁支部分中,前面的卷積層的輸出不僅為下一個(gè)卷積層提供輸入數(shù)據(jù),并且通過(guò)均值池化作為更深的卷積層輸入特征圖的一部分,均值池化對(duì)特征圖進(jìn)行不失真的下采樣,保證不同尺寸的特征圖在拼接層進(jìn)行特征圖合并。在改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)模型中,采用了3個(gè)拼接層對(duì)不同卷積層輸出的特征圖進(jìn)行合并。這一部分網(wǎng)絡(luò)的設(shè)計(jì)主要來(lái)源于深度殘差卷積神經(jīng)網(wǎng)絡(luò)[11],深度殘差卷積神經(jīng)網(wǎng)絡(luò)利用短連接來(lái)抑制梯度消失,以此增加網(wǎng)絡(luò)層數(shù),在多分類任務(wù)中具有顯著的效果。在2015年的ILSVRC挑戰(zhàn)中,引入短連接的網(wǎng)絡(luò)結(jié)構(gòu)得到了較先進(jìn)的性能,其性能類似于InceptionV3網(wǎng)絡(luò)[5]。本文給出了明確的實(shí)驗(yàn)數(shù)據(jù),證明使用短連接的訓(xùn)練顯著加速了網(wǎng)絡(luò)的訓(xùn)練。對(duì)于煙霧檢測(cè)這一類二分類任務(wù),采用了類似于短連接的方式能夠得到不同泛化程度的煙霧特征,這些組合起來(lái)的特征能夠防止煙霧信息丟失,有利于網(wǎng)絡(luò)的優(yōu)化和訓(xùn)練。
2?數(shù)據(jù)擴(kuò)增與實(shí)驗(yàn)結(jié)果
2.1?獲取擴(kuò)增數(shù)據(jù)集
進(jìn)行實(shí)驗(yàn)使用的初始數(shù)據(jù)來(lái)自于文獻(xiàn)[6]中提供的煙霧檢測(cè)數(shù)據(jù)集,這個(gè)圖像數(shù)據(jù)集中一共有24 217幅圖像,包括5 695幅煙霧圖像及18 522幅非煙霧圖像。本文采用了該數(shù)據(jù)集的圖像訓(xùn)練了一個(gè)初始改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)模型,使用python網(wǎng)絡(luò)爬蟲從YouTube網(wǎng)站和優(yōu)酷網(wǎng)站上下載了500多個(gè)含有煙霧的相關(guān)視頻,利用初始模型結(jié)合光流幀移法從有煙視頻中獲取煙霧圖像,再通過(guò)人工檢查剔除錯(cuò)誤檢測(cè)得到的煙霧圖像,共獲取16 234張煙霧圖像,并從imagenet數(shù)據(jù)集中隨機(jī)挑選了25 000張不同場(chǎng)景的非煙霧圖像,因此本文實(shí)驗(yàn)所采用的數(shù)據(jù)集包含了21 929張煙霧圖像和43 522張非煙霧圖像,圖像示例如圖4所示。
2.2?實(shí)驗(yàn)設(shè)置
本文中實(shí)驗(yàn)所使用的計(jì)算機(jī)配置為Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20 GH和Nvidia GTX 1080 GPU,內(nèi)存為32 GB。計(jì)算機(jī)的操作系統(tǒng)為Ubuntu 16.04.4 LTS,使用的深度學(xué)習(xí)框架為Tensorflow 1.7和Keras。
將2.1節(jié)所獲取的圖像隨機(jī)分為3個(gè)數(shù)據(jù)集,分別為訓(xùn)練數(shù)據(jù)集,測(cè)試數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集。具體劃分情況見表1。網(wǎng)絡(luò)的所有參數(shù)以均值為零,標(biāo)準(zhǔn)差為0.01的高斯分布生成的隨機(jī)數(shù)進(jìn)行初始化,網(wǎng)絡(luò)優(yōu)化算法采用了AdaDelta梯度下降算法[12],對(duì)比起原始的梯度下降算法,該算法能夠動(dòng)態(tài)地調(diào)整學(xué)習(xí)率,并且不用設(shè)置初始化學(xué)習(xí)率這一超參。每次訓(xùn)練輸入的圖像數(shù)量為64,輸入圖像尺寸為64×64×3,批量歸一化時(shí)設(shè)置衰減度和epsilon為0.05和0.01。停止訓(xùn)練的標(biāo)準(zhǔn)為通過(guò)對(duì)驗(yàn)證數(shù)據(jù)集的檢驗(yàn)判定網(wǎng)絡(luò)是否訓(xùn)練完成,網(wǎng)絡(luò)的性能評(píng)判通過(guò)對(duì)測(cè)試數(shù)據(jù)集進(jìn)行校驗(yàn)比較,判別標(biāo)準(zhǔn)為準(zhǔn)確率和誤檢率。其中,準(zhǔn)確率為煙霧圖像和非煙霧圖像準(zhǔn)確判斷的數(shù)量與測(cè)試數(shù)據(jù)集圖像總數(shù)量的比值,誤檢率為非煙霧圖像被錯(cuò)誤判斷的數(shù)量與非煙霧圖像總數(shù)量的比值,準(zhǔn)確率越高,誤檢率越低,網(wǎng)絡(luò)的性能越好。
2.3?實(shí)驗(yàn)結(jié)果與分析
本文選擇了InceptionV3 [5]、MobileNet[9]、ResNet[11]和DNCNN[6]四種網(wǎng)絡(luò)模型進(jìn)行對(duì)比試驗(yàn), Inception-v3,MobileNet和ResNet都采用了開源的超參設(shè)置,4種模型的預(yù)計(jì)訓(xùn)練的參數(shù)量分別為13 835萬(wàn)、2 563萬(wàn)、425萬(wàn)和2 434萬(wàn),而改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)所需訓(xùn)練的參數(shù)量?jī)H有52萬(wàn)。為了便于比較,對(duì)于不同的網(wǎng)絡(luò)結(jié)構(gòu),統(tǒng)一了輸入圖像的尺寸。初始和擴(kuò)增數(shù)據(jù)集在改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)上的檢測(cè)結(jié)果比較見表2。表2的實(shí)驗(yàn)結(jié)果證明了擴(kuò)增的數(shù)據(jù)集對(duì)比初始數(shù)據(jù)集具有顯著的提升,因此在表3的所有對(duì)比算法都使用了數(shù)據(jù)擴(kuò)增后的數(shù)據(jù)集。
幾種卷積神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果見表3。proposed1的網(wǎng)絡(luò)模型為圖3所述結(jié)構(gòu),proposed2在proposed1的基礎(chǔ)上去除了旁支部分。proposed1的準(zhǔn)確率超過(guò)99%,誤檢率也僅有0.22%,檢測(cè)性能低于ResNet,與MobileNet的性能相當(dāng),現(xiàn)實(shí)生活中無(wú)煙霧的場(chǎng)景較為常見,因此要求網(wǎng)絡(luò)的誤檢率比較低,盡管在準(zhǔn)確率上低于MobileNet,但具有更強(qiáng)的魯棒性。當(dāng)旁支部分被移除時(shí),網(wǎng)絡(luò)的準(zhǔn)確率和誤檢率都有所下降,證明了旁支部分對(duì)網(wǎng)絡(luò)的性能提升有積極的作用。對(duì)比一幅圖像在GPU上測(cè)試的運(yùn)行時(shí)間,改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算成本要遠(yuǎn)低于其他對(duì)比網(wǎng)絡(luò)模型。
proposed1和proposed2兩個(gè)模型在訓(xùn)練時(shí)的收斂情況如圖5所示。由圖5可知,proposed1收斂速度較快,在大約15個(gè)訓(xùn)練周期后,訓(xùn)練準(zhǔn)確率就達(dá)到99%,而且后續(xù)的訓(xùn)練也非常穩(wěn)定。proposed2需要訓(xùn)練到30個(gè)周期后才逐步收斂。由表2和圖5可得,增加了旁支部分的網(wǎng)絡(luò)對(duì)煙霧識(shí)別的準(zhǔn)確率更高,訓(xùn)練時(shí)收斂更快。
3?結(jié)束語(yǔ)
本文通過(guò)數(shù)據(jù)擴(kuò)增與設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)很好地提高了煙霧檢測(cè)的準(zhǔn)確率,在基于原有數(shù)據(jù)的基礎(chǔ)上,通過(guò)網(wǎng)絡(luò)爬蟲、煙霧檢測(cè)和人工篩選的方式對(duì)數(shù)據(jù)庫(kù)進(jìn)行了圖像擴(kuò)增,增強(qiáng)了圖像質(zhì)量;對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),深度可分離卷積層的使用大大減少了網(wǎng)絡(luò)的參數(shù)量,加快了單幀處理速度,改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)增加的旁支部分能夠加快網(wǎng)絡(luò)收斂。通過(guò)仿真驗(yàn)證實(shí)驗(yàn),本文提出的網(wǎng)絡(luò)模型提高了對(duì)于煙霧圖像的檢測(cè)精度,同時(shí)具有較強(qiáng)的魯棒性,是一種可靠、且高精度的圖像煙霧檢測(cè)算法。
參考文獻(xiàn)
[1]YUAN Feiniu. Rotation and scale invariant local binary pattern based on high order directional derivatives for texture classification[J]. Digital Signal Processing, 2014, 26:142-152.
[2]?史勁亭, 袁非牛, 夏雪. 視頻煙霧檢測(cè)研究進(jìn)展[J]. 中國(guó)圖象圖形學(xué)報(bào), 2018,23(3):0303-0322.
[3]?陳俊周, 汪子杰, 陳洪翰, 等. 基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的視頻動(dòng)態(tài)煙霧檢測(cè)[J]. 電子科技大學(xué)學(xué)報(bào), 2016, 45(6):992-996.
[4]?李誠(chéng),唐李洋, 潘李偉. 城鎮(zhèn)森林交界域視頻檢測(cè)算法[J]. 計(jì)算機(jī)工程, 2018,44(1) :258-262.
[5]?SZEGEDY C, LIU Wei, JIA Yangqing, et al. Going deeper with convolutions[C]// 2015 IEEE CVPR. Boston:IEEE Computer Society, 2015:1-12.