馮嘉良 朱定局 廖麗華
(1.華南師范大學計算機學院 廣州 510631)(2.華南師范大學教育信息技術(shù)學院 廣州 510631)
森林火災是一種危害性較強的自然災害,1950年以來中國年均發(fā)生森林火災13067起,受害林地面積653019公頃,因災傷亡580人。森林火災給人類生存發(fā)展造成重大影響,因此對森林火災進行監(jiān)測是十分重要的?;馂谋O(jiān)測分為火焰監(jiān)測與煙監(jiān)測。在森林火災的監(jiān)測中,煙總是比火焰更早被觀測到,而且在整個火災過程中,煙都是其圖像信號中一個重要特征。在實際事例中,森林火災的早期只觀察到煙,此時如果能采取撲救措施便能極大減少傷亡損失,而觀察到遠距離的森林明火,其火勢已經(jīng)發(fā)展到一定階段,撲救難度相對較大。
森林火災監(jiān)測經(jīng)歷過紅外監(jiān)測、ZigBee無線傳感技術(shù)監(jiān)測[1]等階段。近年深度學習方法在文本分類[2]、人臉識別[3]等領(lǐng)域中都有較好表現(xiàn),其通過多個隱藏層自動提取特征,具有更強的特征表達能力。深度學習方法也應用在森林火災監(jiān)測中,文獻[4]將卷積網(wǎng)絡模型應用在森林火災識別,取得比人工提取特征更好的效果。文獻[5]使用深度方法自動提取動態(tài)紋理的特征,并成功在森林火災動態(tài)場景的分類中實現(xiàn)。在深度學習中使用自編碼器能提取更優(yōu)的特征表達,文獻[6]用稀疏自編碼器訓練樣本數(shù)據(jù),找出同圖復制圖像的規(guī)律,通過降維權(quán)值矩陣得到檢測圖像的特征。文獻[7]提出卷積稀疏自編碼網(wǎng)絡,降低反卷積操作復雜度。目前對于森林火災的識別多使用傳統(tǒng)算法。因為森林圖像距離遠范圍大,其提取特征的范圍同樣更大,普通卷積自編碼網(wǎng)絡也難以提取有效更大范圍特征。而且在火災中取得良好效果的模型大多是只針對火焰特征的研究,對于實際森林火災中煙霧和森林霧氣等相似圖像的識別仍有提升空間。如何在森林火災監(jiān)控中提升起火煙霧圖像的識別準確率從而及時撲救對森林防火十分重要。針對上述問題,本文提出改進的MSDCAE多尺度空洞卷積自編碼器方法對模型進行無監(jiān)督學習,提升大范圍特征表達能力。另外為了增大相似分類之間的距離和加強同類樣本聚合度,設計ISWL損失函數(shù),進而提出一種基于深度學習的森林火災煙火監(jiān)測方法。該方法通過關(guān)注森林火災煙火圖像大范圍特征重構(gòu)數(shù)據(jù),訓練出更優(yōu)的初始權(quán)值,減少煙霧、霧氣等相似圖像的錯誤識別,在實驗中取得比普通深度網(wǎng)絡更好的效果。
在森林火災監(jiān)測研究中,Vicente等[8]用提取像素的持久動態(tài)特點改進圖像分割技術(shù),提出一種監(jiān)測森林火災的圖像識別方法。另外,F(xiàn)eng等[9]基于FY-1D/MVISR數(shù)據(jù)提出快速檢測方法并應用在森林火災監(jiān)測。在森林火災煙的監(jiān)測中,Stathero?poulos等[10]提出了一種基于計算機視覺和模式識別技術(shù)的火焰煙霧檢測方法,研究在森林火災事件監(jiān)測到的煙霧成分的復雜性。Ko等[11]探測早期火災的時空特征,從而對其產(chǎn)生的煙霧進行分析。文獻[12]將森林火災煙霧預測與監(jiān)測數(shù)據(jù)相結(jié)合來研究煙霧與空氣質(zhì)量的關(guān)系。
深度網(wǎng)絡有利于提取森林火災圖像的特征。文獻[13]將卷積神經(jīng)網(wǎng)絡應用在森林火災圖像識別上,將底層特征結(jié)合成更抽象特征,并結(jié)合實驗證明其在森林火災監(jiān)測任務中的有效性。自編碼器使神經(jīng)網(wǎng)絡有更好的初始權(quán)值參數(shù)。文獻[14]基于原始像素和局部描述驗證了自編碼器的降維、表達能力,并提出基于自編碼器的轉(zhuǎn)換策略。在圖像處理領(lǐng)域卷積自編碼器應用更廣泛。文獻[15]提出一種基于自編碼網(wǎng)絡的重構(gòu)車牌數(shù)字方法,并證明其具有優(yōu)秀識別性能。文獻[16]提出了一種混合卷積自編碼極限學習機結(jié)構(gòu),使用極限學習機進行分類,獲得更好的快速泛化能力。在針對森林火災的圖像識別中,文獻[17]提出一種基于稀疏自編碼深度神經(jīng)網(wǎng)絡的森林火災圖像分類方法,更有效地區(qū)分火焰與紅旗、紅葉等類似物體。
損失函數(shù)是評價模型的指標之一,文獻[18]提出一種啟發(fā)式線性回歸損失函數(shù)選取方法,與常用的平方損失函數(shù)相比性能更健壯。文獻[19]構(gòu)造組樣本似然損失函數(shù),并結(jié)合排序?qū)W習方法和最優(yōu)初始序列選擇策略,證明了其能夠有效提高排序準確率。文獻[20]提出了將稀疏自編碼和Softmax回歸組合成一個新的特征提取模型,利用多分類器返回值可以反映輸入信息相似程度的特點提高分類效果。
針對現(xiàn)實中森林火災起火過程中依次出現(xiàn)有煙、有煙與火、有明火等情況,本文在有監(jiān)督學習中,設計了如圖1所示的卷積神經(jīng)網(wǎng)絡框架(以輸入尺寸32×32為例)。
圖1 本文有監(jiān)督學習的網(wǎng)絡模型
無監(jiān)督學習階段,普通的自編碼器對數(shù)據(jù)進行線性或非線性的特征提取。在卷積自編碼神經(jīng)網(wǎng)絡中,使用卷積運算提取并重構(gòu)數(shù)據(jù)。通過重構(gòu)數(shù)據(jù)與原始數(shù)據(jù)的對比,更新自編碼器卷積核權(quán)值參數(shù)并逐步減少誤差。卷積自編碼計算公式如下所示:
其中,Kw,h為卷積核對應位置的卷積矩陣,Iw,h為被卷積的輸入數(shù)據(jù),W和H分別為不同方向進行卷積的次數(shù)。為了在解碼后得到的重構(gòu)圖像和原始圖像有相同的尺寸,需要在自編碼后進行圖像填充,每個維度填充的大小為2K-2,其中K為卷積核大小。填充后的特征圖尺寸為為了得到更優(yōu)的重構(gòu)圖像并與原始圖像比較從而進行無監(jiān)督學習,解碼器的參數(shù)需要根據(jù)編碼器調(diào)整,下式為解碼器每個通道的重構(gòu)公式:
普通自編碼器經(jīng)過訓練能有效重構(gòu)數(shù)據(jù),但是在輸入數(shù)據(jù)受到干擾時難以保持不變性。特別在面對森林火災遠程圖像的監(jiān)測中,霧氣、風塵等因素會導致圖像局部模糊。傳統(tǒng)的卷積自編碼網(wǎng)絡只關(guān)注圖像局部特征而忽略更大范圍特征,這對于大范圍的森林火災監(jiān)測來說是不足夠的。針對卷積自編碼器的不足,本文提出一種多尺度空洞卷積自編碼器(Multi-Scale Dilated Convolution Auto En?coder,MSDCAE),對卷積核對應的感受野分割并進行空洞擴張,通過不同程度的擴張卷積核,使其更具備提取更大范圍圖像特征的能力。
圖2 本文提出的MSDCAE模型
圖2(a)所示是MSDCAE模型,使用堆棧式逐層訓練的方法。在每一層網(wǎng)絡進行擴充空洞卷積核尺度并提取更大范圍特征后(圖2(b)),再結(jié)合相應的空洞卷積解碼器重構(gòu)圖像,并根據(jù)損失函數(shù)進行參數(shù)更新。在無監(jiān)督學習階段,MSDCAE自編碼器在編碼階段采用空洞卷積,設置每個卷積核的dilation參數(shù)分別為1、2、3進行運算,得到3種不同感受野尺寸的特征圖,充分考慮了局部以及更大范圍特征。然后,本文提出一種對不同參數(shù)的空洞卷積得到的特征進行連接的策略??斩淳矸e核的輸出權(quán)值根據(jù)模型關(guān)注目標特征的尺度特性不同來進行調(diào)整,基于多尺度空洞卷積的編碼器輸出計算如下:
其中,n為空洞卷積的尺度種類數(shù),Ki為第i種尺度的空洞卷積,Ai為不同尺度的空洞卷積核的輸本文MSDCAE模型考慮更大范圍特征,所以隨著dilation參數(shù)的增大,其輸出權(quán)值也會隨之調(diào)整,使其對于更大范圍的特征表達更為充分。在得到空洞卷積的連接輸出后,經(jīng)過激活函數(shù)計算輸出編碼器的特征表達。在解碼階段,MS?DCAE根據(jù)編碼卷積核來調(diào)整解碼器的空洞卷積核參數(shù),分別得到重構(gòu)特征,結(jié)合激活函數(shù)運算得到解碼器的重構(gòu)結(jié)果。整個MSDCAE自編碼器通過損失函數(shù)對比重構(gòu)結(jié)果和原始數(shù)據(jù),進行參數(shù)更新。
在圖像識別領(lǐng)域,Softmaxwithloss損失函數(shù)多應用在卷積神經(jīng)網(wǎng)絡多分類中。Sotfmaxwithloss損失函數(shù)如下所示:
在L中,1{y(i)=j}是示性函數(shù),損失函數(shù)先經(jīng)過softmax運算再計算多項邏輯損失。
由于火災前期起煙圖像與森林充滿霧氣的圖像有一定相似性,單純用Softwithloss作為整個模型的損失函數(shù)難以保證相似分類的識別性能。另外,圖像在大霧、沙塵等環(huán)境下同類圖像樣本的聚合程度較低。針對上述不足,在Softmaxwithloss基礎(chǔ)上進行改進,設計了一種新的損失函數(shù)(Improved Softmaxwithloss,ISWL)。ISWL損失函數(shù)在考慮全部類別樣本的基礎(chǔ)上,將相似類別樣本之間的距離增大,并適當提升同一類別樣本特征的聚合度。
Softwithloss損失函數(shù)較少考慮煙霧、霧氣等相似類別樣本均值之間的距離,現(xiàn)將其作為關(guān)注因素,提出L1公式:
其中X(p)為第 p類樣本的算術(shù)平均值,L1公式計算每一類樣本與其它每類樣本之間的均值距離,在反向傳播的過程中,L1公式求導為
除了增大相似類別樣本之間的距離外,還考慮到森林煙火圖像在不同因素情況下導致同類樣本過于分散,所以結(jié)合L2公式控制提取到的同類樣本特征的聚合程度:
在本文神經(jīng)網(wǎng)絡模型訓練時,L1,L2結(jié)合Softmaxwithloss共同組成一個新的Improved Soft?maxwithloss損失函數(shù)。總的損失函數(shù)表達式為
ISWL損失函數(shù)由三部分組成,第一部分是原Softmaxwithloss函數(shù);第二部分是考慮不同類別之間均值距離的子項,由參數(shù)α根據(jù)相似分類的混淆程度調(diào)整;第三部分則是考慮同類樣本的聚合度,同樣受參數(shù)α影響。
目前,圖像識別中使用較多的數(shù)據(jù)庫有MNIST,CIFAR等。但由于這些數(shù)據(jù)庫中并沒有足夠的滿足本文研究森林火災煙火識別的多類型圖像樣本,所以為了更好地訓練出能識別現(xiàn)實森林火災煙火過程的模型,本文選取火災前期起煙森林圖像、火災中煙火共存的森林圖像、大范圍明火森林圖像以及森林霧氣圖像作為具代表性的數(shù)據(jù)類別,通過數(shù)據(jù)挖掘技術(shù)每類分別抓取1100張不同圖像作為數(shù)據(jù)集,其中每類220張作為測試集。訓練集與測試集每張圖片均不重復。部分數(shù)據(jù)集圖片如圖3所示。
圖3 部分數(shù)據(jù)集圖片
在本文實驗中,從訓練集按照10%的比例隨機選取驗證集,在有監(jiān)督學習的訓練中進行驗證。為了降低數(shù)據(jù)分配對實驗結(jié)果的影響,每組實驗都采用十折交叉驗證法計算平均值。
4.2.1 驗證MSDCAE自編碼器的有效性
實驗設置隨機初始化參數(shù)的卷積網(wǎng)絡、基于卷積自編碼器的卷積網(wǎng)絡和基于MSDCAE自編碼器的卷積網(wǎng)絡進行對比。表1后三個三元組為采用MSDCAE自編碼預訓練模型下,不同尺度的空洞卷積輸出權(quán)值 (A1,A2,A3)的具體取值,Ai為對應dila?tion參數(shù)值i的權(quán)值。
從表1可以看出在無監(jiān)督學習階段,使用自編碼器預訓練的神經(jīng)網(wǎng)絡具有更高的精確度,而MS?DCAE自編碼器將不同尺度空洞卷積特征的連接后,在(0.2,0.3,0.5)權(quán)值組中取得較好效果,而在(0.33,0.33,0.33)的均值化權(quán)值組中,模型表現(xiàn)還不如基于普通卷積自編碼器的網(wǎng)絡,說明在煙火監(jiān)測圖像中,充分關(guān)注更大范圍特征會得到更好的預訓練參數(shù),也體現(xiàn)森林火災監(jiān)控圖像范圍大、距離遠的特點。
表1 不同模型的準確率對比
4.2.2 驗證ISWL損失函數(shù)的適用性
神經(jīng)網(wǎng)絡模型的優(yōu)化依賴于網(wǎng)絡參數(shù)的更新,而損失函數(shù)的梯度直接影響參數(shù)更新。本文在有監(jiān)督的神經(jīng)網(wǎng)絡訓練階段中分別采用MSE、Soft?maxwithloss和ISWL作為模型的損失函數(shù)進行訓練。表2為ISWL損失函數(shù)不同的α取值下,各損失函數(shù)的準確率對比。
表2 不同損失函數(shù)的準確率對比
從表2可以看出,采用ISWL損失函數(shù)對比MSE和Softmaxwithloss準確率有明顯提高。在α=0.2的ISWL中取得最高的準確率,這主要是考慮了森林火災煙火圖像中相似分類的距離。在火災煙火圖像中,起火產(chǎn)生的煙霧和森林霧氣是相似分類,如果不考慮類間均值距離,訓練的模型會有造成誤判的可能,而ISWL的提出使模型準確率得到提高。
圖4 損失函數(shù)效果對比
從圖4(a)可以看到ISWL損失函數(shù)比Softmax?withloss損失函數(shù)有更低的損失,而且相對更快達到收斂狀態(tài),證明了改進ISWL損失函數(shù)的有效性。圖 4(b)、圖4(c)為 Softmaxwithloss和ISWL損失函數(shù)訓練網(wǎng)絡所提取特征經(jīng)PCA降維后的聚合程度對比。
可以看出,Softmaxwithloss較少考慮相似分類的均值距離,其分類的特征聚簇判別性不強。網(wǎng)絡經(jīng)ISWL損失函數(shù)訓練后相似分類的距離明顯增大,各類樣本也向類別中心靠攏。
4.2.3 基于MSDCAE自編碼器的神經(jīng)網(wǎng)絡優(yōu)化
本文在基于MSDCAE自編碼器無監(jiān)督預訓練卷積核的基礎(chǔ)上,結(jié)合ISWL損失函數(shù)進行有監(jiān)督標簽的訓練學習。為了更好地得到滿足森林火災煙火監(jiān)測的神經(jīng)網(wǎng)絡模型,對激活函數(shù)選擇、學習率大小、學習率衰減策略和輸入數(shù)據(jù)尺寸等因素作實驗對比。結(jié)合實驗結(jié)果分析這些因素對網(wǎng)絡性能的影響,訓練出適用于森林火災煙火監(jiān)測的模型。
在神經(jīng)網(wǎng)絡中卷積核提取特征一般是線性特征,而通過激活函數(shù)非線性計算后特征有更好的表達。選取Sigmoid、Tanh、RELU和PRELU激活函數(shù)作為對比,實驗結(jié)果如表3所示。
表3 不同激活函數(shù)的準確率對比
從表3中可以看出,Sigmoid和Tanh函數(shù)在本文網(wǎng)絡中相比表現(xiàn)較差。而RELU和PRELU函數(shù)能解決梯度彌散的問題,能有效地反向調(diào)整更新參數(shù)使網(wǎng)絡的總體損失收斂,從而在訓練后能達到相對較高準確率。而PRELU相比RELU,在負半軸加入?yún)?shù)修正,有更好的效果。
在神經(jīng)網(wǎng)絡反向傳遞梯度更新權(quán)值的過程中,權(quán)值會根據(jù)學習率設置進行更新。較大的學習率能提升訓練速度,但過大的學習率會使權(quán)值在最優(yōu)點附近震蕩。本文網(wǎng)絡通過設置為0.01、0.003、0.001和0.0003等不同的學習率來進行對比,實驗結(jié)果如表4所示。
表4 不同學習率大小的準確率對比
從表4可見,較大學習率能夠快速收斂,而較小學習率則相對緩慢。而隨著迭代次數(shù)增加,不同學習率變化都逐漸穩(wěn)定,0.01學習率經(jīng)過迭代能得到最小的損失值以及最大準確率。在本文模型中,選擇0.01作為最優(yōu)學習率損失函數(shù)會有更好的收斂效果。
在訓練中,隨著時間變化而適當調(diào)整學習率衰減策略能有效提升訓練效率。學習率衰減策略有FIXED、STEP、INV和POLY等?,F(xiàn)選取上述衰減策略進行對比實驗。
表5 不同衰減策略的準確率對比
從表5可以看出,不同的衰減策略經(jīng)過訓練所達到的精確率較接近。在FIXED學習策略下,學習率大小相對固定所以得到更好準確率。從結(jié)果可知,F(xiàn)IX衰減策略的效果更好。
除了模型自身參數(shù)之外,輸入圖像的尺寸往往也影響著模型的學習性能。因此本文設計了幾組不同尺寸的圖像,并輸入到神經(jīng)網(wǎng)絡當中進行訓練學習,實驗結(jié)果如下所示。
表6 不同圖像尺寸的準確率對比
從表6可以看出,準確率隨著圖像尺寸的縮放而變化。尺寸越大,準確率越大,但相應的運算參數(shù)也急劇增加,網(wǎng)絡訓練時間也明顯增長。總的來說,對于不同的圖像尺寸其準確率相差不大,在時間允許的范圍內(nèi)可以使用分辨率較高的圖像。
本文結(jié)合MSDCAE多尺度空洞卷積自編碼器以及基于森林煙火圖像相似分類改進的ISWL損失函數(shù),提出一種新的基于卷積網(wǎng)絡的森林火災煙火監(jiān)測方法;該方法在無監(jiān)督學習階段,針對森林火災范圍大距離遠的特點,在自編碼器中使用空洞卷積進行大范圍特征提取,提升在干擾下的不變性,并根據(jù)不同煙火圖像有效特征尺寸的變化性,量化考慮局部及更大范圍特征,提出一種連接多尺度特征的提取策略;另外針對森林火災煙霧及霧氣等相似分類,提出關(guān)注類間均值距離及類內(nèi)聚攏程度的ISWL改進損失函數(shù)及其更新推導。實驗結(jié)果驗證了MSDCAE自編碼器在無監(jiān)督學習中能提取更優(yōu)的特征表達,以及ISWL損失函數(shù)對于相似圖像分類的優(yōu)越性。最后結(jié)合網(wǎng)絡參數(shù)對比實驗優(yōu)化網(wǎng)絡性能,證明其有效性。接下來,結(jié)合煙火圖像中的其它天氣特征數(shù)據(jù),在本文研究的基礎(chǔ)上,分析整個森林火災過程的發(fā)展趨勢。