余星辰,王云泉
(1.中國礦業(yè)大學(xué)(北京)機(jī)電與信息工程學(xué)院,北京 100083;2.中國中煤能源集團(tuán)有限公司,北京 100011)
瓦斯爆炸、瓦斯煤塵爆炸和煤塵爆炸(以下簡稱瓦斯和煤塵爆炸)是煤礦重特大事故之一[1-2]。煤礦瓦斯和煤塵爆炸具有突發(fā)性,一旦發(fā)生將造成重大的人員傷亡和財產(chǎn)損失。目前,煤礦瓦斯和煤塵爆炸監(jiān)測主要通過人工完成,存在漏報率和誤報率高等問題,難以滿足瓦斯和煤塵爆炸事故應(yīng)急救援需求。因此,正確辨識煤礦瓦斯和煤塵爆炸具有重要意義[3-5]。
聲音具有傳播距離遠(yuǎn)、受巷道彎曲和分支影響小等特點[5],聲音識別在煤礦瓦斯和煤塵爆炸辨識中取得了較好效果。文獻(xiàn)[2]根據(jù)爆炸聲的時域和頻域特征與其他聲音不同的特點,提出了通過聲音智能分析和聲音頻率、幅度、短時能量等特征參數(shù)分析感知煤礦瓦斯和煤塵爆炸。文獻(xiàn)[3]采用互補集合經(jīng)驗?zāi)B(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)對聲音信號進(jìn)行分解,得到模態(tài)分量的樣本熵,構(gòu)成聲音信號的特征量,再將特征量輸入到支持向量機(jī)(Support Vector Machine,SVM)中進(jìn)行聲音識別分類,實現(xiàn)瓦斯和煤塵爆炸聲音識別。文獻(xiàn)[4]通過雙樹復(fù)小波變換得到的能量熵比值來表征聲音信號,并利用極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)對聲音進(jìn)行分類,從而識別瓦斯和煤塵爆炸聲音。
小波包分解是小波分解的推廣,提高了信號的時頻分辨率,是一種更精細(xì)的信號分析方法,具有良好的正交性、完備性、局部性[6-10]。信號通過小波包分解后的能量分布可反映信號的不確定性和復(fù)雜度,實現(xiàn)對信號特征量化表征的目的。為進(jìn)一步提高煤礦瓦斯和煤塵爆炸聲音識別的準(zhǔn)確率,筆者提出基于小波包能量的煤礦瓦斯和煤塵爆炸聲音識別方法,通過實時監(jiān)測聲音信號的小波包能量分布,實現(xiàn)瓦斯和煤塵爆炸聲音識別。
煤礦瓦斯和煤塵爆炸聲音特征與煤礦井下環(huán)境和設(shè)備工作聲音有明顯區(qū)別[1-2]?;谛〔ò芰康拿旱V瓦斯和煤塵爆炸聲音識別方法原理如圖1 所示。在煤礦井下重點監(jiān)測區(qū)域安裝礦用拾音設(shè)備,實時采集環(huán)境與設(shè)備工作聲音;將采集到的聲音通過小波包分解得到分解分量的能量占比,構(gòu)成表征聲音的特征向量;將特征向量輸入BP 神經(jīng)網(wǎng)絡(luò)中,訓(xùn)練得到煤礦瓦斯和煤塵爆炸聲音識別模型;將待測聲音通過小波包分解后,得到表征該聲音的特征向量,并輸入煤礦瓦斯和煤塵爆炸聲音識別模型中,識別待測聲音類別。
圖1 基于小波包能量的煤礦瓦斯和煤塵爆炸聲音識別方法原理Fig.1 Principle of coal mine gas and coal dust explosion sound recognition method based on wavelet packet energy
1.1.1 小波包分解
小波包分解是在小波分解的基礎(chǔ)上增加對信號高頻部分的分解,可以克服小波分解在高頻段的頻率分辨率較差的缺點,能對聲音信號頻帶進(jìn)行多層次的均勻劃分[11-16]。鑒于礦用拾音器收集到的聲音通常是非平穩(wěn)信號,采集的聲音數(shù)據(jù)通過小波包分解后可以得到任意獨立頻段的信號,且煤礦瓦斯和煤塵爆炸聲音與煤礦井下其他聲音在時域和頻域差異明顯[3-4],因此,小波包分解在處理煤礦井下聲音信號方面更有優(yōu)勢,能分辨煤礦井下聲音在不同頻帶的能量分布情況。小波包分解得到高頻和低頻子頻帶,對于l層小波包分解的信號,能夠得到 2l個子頻帶[17-19]。
1.1.2 小波包能量占比
根據(jù)帕塞瓦爾定理,信號在時域的總能量與信號在頻域的總能量相等。由此可知,信號在通過小波包分解前后的總能量始終保持相等。不同子頻帶上的能量為[8,20]
式中di,j(k)為信號分解后第i個子頻帶第j層對應(yīng)的第k(k=1,2,…,n,n為信號長度)個采樣點的幅值。
信號總能量為
小波包能量占比為[8]
小波包能量占比構(gòu)成表征聲音信號的特征向量。本文選擇小波包分解層數(shù)為3,因此可得包含8 個特征值的特征向量。
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式主要分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)2 種[17]。結(jié)合煤礦瓦斯和煤塵爆炸聲音、煤礦井下設(shè)備工作聲音及環(huán)境音等信號特征和小波包分解特征向量表征方式,筆者建立有監(jiān)督學(xué)習(xí)的BP 神經(jīng)網(wǎng)絡(luò)對煤礦瓦斯和煤塵爆炸聲音進(jìn)行識別。
BP 神經(jīng)網(wǎng)絡(luò)主要由輸入層、隱含層和輸出層組成[17]。BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程分為特征正向傳播和誤差反向傳播2 個部分:輸入信號由神經(jīng)網(wǎng)絡(luò)正向傳遞到隱含層,計算得到神經(jīng)元的輸出結(jié)果,將輸出結(jié)果傳入輸出層與期望輸出比較,若小于期望輸出,則將二者誤差反向傳回輸入層,并作為權(quán)值和閾值的修正依據(jù),如此反復(fù),直至誤差達(dá)到預(yù)設(shè)的目標(biāo)閾值,訓(xùn)練完成。
1.2.1 BP 神經(jīng)網(wǎng)絡(luò)各層節(jié)點數(shù)
(1)輸入層節(jié)點數(shù)。輸入層節(jié)點數(shù)由輸入信號的維度決定。由于輸入BP 神經(jīng)網(wǎng)絡(luò)的表征聲音信號的特征向量包括8 個特征值,所以確定輸入層節(jié)點數(shù)為8。
(2)輸出層節(jié)點數(shù)。本文將需要區(qū)分的聲音信號劃分為煤礦瓦斯和煤塵爆炸聲音及非煤礦瓦斯和煤塵爆炸聲音2 類:識別為煤礦瓦斯和煤塵爆炸聲音則BP 神經(jīng)網(wǎng)絡(luò)輸出結(jié)果為1;識別為非煤礦瓦斯和煤塵爆炸聲音則BP 神經(jīng)網(wǎng)絡(luò)輸出結(jié)果為0。因此,輸出層節(jié)點數(shù)為1。
(3)隱含層節(jié)點數(shù)。BP 神經(jīng)網(wǎng)絡(luò)可實現(xiàn)從M維到N維的非線性映射,隱含層節(jié)點數(shù)為[18]
式中:M為輸入層節(jié)點數(shù);N為輸出層節(jié)點數(shù);m為經(jīng)驗參數(shù),1 由于輸入層節(jié)點數(shù)為8,輸出層節(jié)點數(shù)為1,取m=5,所以確定隱含層節(jié)點數(shù)為8。 1.2.2 BP 神經(jīng)網(wǎng)絡(luò)參數(shù) (1)采用雙曲正切S 型傳輸函數(shù)(tansig)作為隱含層和輸出層的激活函數(shù)。 (2)初始權(quán)值在(0,1)內(nèi)由BP 神經(jīng)網(wǎng)絡(luò)根據(jù)條件隨機(jī)選取產(chǎn)生。 (3)學(xué)習(xí)率的選取對訓(xùn)練網(wǎng)絡(luò)權(quán)值變化、訓(xùn)練時長及收斂速度有直接影響。通過大量實驗論證,本文選擇學(xué)習(xí)率為0.15。 (4)神經(jīng)網(wǎng)絡(luò)的期望誤差為0.01,最大迭代次數(shù)為5 000。 在神華寧夏煤業(yè)集團(tuán)有限責(zé)任公司雙馬煤礦和中煤科工集團(tuán)重慶研究院有限公司完成聲音采集。聲音采集設(shè)備為HYV-E720 錄音筆,內(nèi)存為16 GB,所有音頻文件均為單聲道,采樣頻率為48 kHz,保存格式為.wav。數(shù)據(jù)處理及實驗均在Intel i9-9980HK CPU@2.40 GHz、32 GB 內(nèi)存、64 位操作系統(tǒng)的服務(wù)器上使用Matlab2012b 完成。 2.2.1 小波包分解層數(shù) 小波包分解層數(shù)對信號分解效果具有重要作用。信號通過小波包分解的噪聲主要集中在高頻部分,噪聲隨著分解層數(shù)的增加而減少,但分解層數(shù)過高會導(dǎo)致信號的信息丟失。為選擇最優(yōu)分解層數(shù),監(jiān)測不同分解層數(shù)中的噪聲。最大分解層高頻部分噪聲含量與前一分解層基本無差別,則表示該層是最優(yōu)分解層數(shù)[21]。小波包能量占比可表征分解層的噪聲大小。若某一層高頻分量與前一層高頻分量的小波包能量占比差值小于前一層高頻分量與相鄰層高頻分量的小波包能量占比差值,則代表該層為最優(yōu)分解層數(shù)。 煤礦井下采集的聲音經(jīng)過小波包分解的高頻分量小波包能量占比差值分布如圖2 所示??煽闯雎曇粜盘柾ㄟ^小波包分解后,第4 層高頻分量與第3 層高頻分量的小波包能量占比差值小于第3 層高頻分量與第2 層高頻分量的小波包能量占比差值;除了錨桿機(jī)工作聲音和風(fēng)鎬工作聲音,其余聲音的高頻分量小波包能量占比差值不足0.5%,若分解層數(shù)增加到4,信號分解效果的提升空間不大,且易造成聲音信號的丟失。因此,選擇小波包分解層數(shù)為3 是符合實際應(yīng)用要求的。 圖2 經(jīng)小波包分解的聲音高頻分量小波包能量占比差值分布Fig.2 Distribution of wavelet packet energy proportion difference of high frequency sound component decomposed by wavelet packet 2.2.2 小波函數(shù) 為選取最優(yōu)的小波函數(shù)對聲音信號進(jìn)行小波包分解,將瓦斯爆炸、采煤機(jī)工作、掘進(jìn)機(jī)工作3 種聲音信號(聲音時長為1 s)分別通過Haar 小波函數(shù)和db4 小波函數(shù)進(jìn)行小波包分解(小波包分解層數(shù)為3),得到第3 層分解結(jié)果及小波包系數(shù)分布,分別如圖3、圖4 所示,其中,d1-d4為低頻分量,d5-d8為高頻分量。由于本文聲音采集設(shè)備的采樣頻率為48 kHz,根據(jù)小波包分解原理可知,d1的頻率范圍為0~6 kHz,d2的頻率范圍為6~12 kHz,d3的頻率范圍為12~18 kHz,d4的頻率范圍為18~24 kHz,d5的頻率范圍為24~30 kHz,d6的頻率范圍為30~36 kHz,d7的頻率范圍為36~42 kHz,d8的頻率范圍為42~48 kHz。 由圖3 可知,經(jīng)Haar 小波函數(shù)分解的瓦斯爆炸聲音小波包系數(shù)分布與其他聲音的差異較明顯:瓦斯爆炸聲音的小波包系數(shù)主要分布在d1的頻率范圍內(nèi),其次分布在d2-d4的頻率范圍內(nèi);采煤機(jī)工作聲音的小波包系數(shù)集中分布在d1的頻率范圍內(nèi),其次分布在d2的頻率范圍內(nèi);掘進(jìn)機(jī)工作聲音的小波包系數(shù)主要分布在d1的頻率范圍內(nèi),其次分布在d2,d3的頻率范圍內(nèi)。 由圖4 可知,經(jīng)db4 小波函數(shù)分解的瓦斯爆炸聲音小波包系數(shù)分布與其他聲音的差異較明顯:瓦斯爆炸聲音的小波包系數(shù)主要分布在d1的頻率范圍內(nèi),其次分布在d2的頻率范圍內(nèi);采煤機(jī)工作聲音的小波包系數(shù)集中分布在d1的頻率范圍內(nèi);掘進(jìn)機(jī)工作聲音的小波包系數(shù)分布較其他2 個聲音分散,主要分布在d1的頻率范圍內(nèi),其次分布在d2,d3的頻率范圍內(nèi)。 結(jié)合圖3、圖4 可看出,基于Haar 小波函數(shù)的小波包分解信號在d1-d8的連續(xù)性較好,信號幅度變化較小,且波形穩(wěn)定,小波包分解效果優(yōu)于db4 小波函數(shù)。 圖3 基于Haar 小波函數(shù)的聲音信號小波包分解結(jié)果及小波包系數(shù)分布Fig.3 Wavelet packet decomposition results and wavelet packet coefficient distribution of sound signals based on Haar wavelet function 圖4 基于db4 小波函數(shù)的聲音信號小波包分解結(jié)果及小波包系數(shù)分布Fig.4 Wavelet packet decomposition results and wavelet packet coefficient distribution of sound signals based on db4 wavelet function 本文選擇Haar 小波函數(shù),小波包分解層數(shù)為3,將采集到的煤礦井下包括瓦斯和煤塵爆炸聲音在內(nèi)的17 種聲音(聲音時長均為1 s)進(jìn)行小波包分解,得到小波包能量占比分布,見表1。可看出瓦斯和煤塵爆炸聲音的小波包能量占比與其他聲音差異明顯:瓦斯和煤塵爆炸聲音能量主要集中在d1的頻率范圍內(nèi),瓦斯爆炸聲音在d1的頻率范圍內(nèi)能量占比達(dá)87.280%,煤塵爆炸聲音在d1的頻率范圍內(nèi)能量占比達(dá)90.100%,瓦斯爆炸聲音在d2-d8的頻率范圍內(nèi)能量占比為12.720%,煤塵爆炸聲音在d2-d8的頻率范圍內(nèi)能量占比為9.900%,瓦斯和煤塵爆炸聲音能量占比分布相似性高;非瓦斯和煤塵爆炸聲音屬于不同類型的干擾聲音,其中除了膠帶和水泵工作聲音與瓦斯和煤塵爆炸聲音在d1,d2,d5,d7的頻率范圍內(nèi)能量占比較接近(但在d3,d4,d6,d8的頻率范圍內(nèi)能量占比仍存在差異),其余非爆炸聲音與瓦斯和煤塵爆炸聲音的能量占比分布相似性低。 為了研究小波包能量占比作為聲音信號特征向量的魯棒性,本文截取時長分別為0.5,1.0,1.5,2.0 s 的瓦斯爆炸聲音、煤塵爆炸聲音、采煤機(jī)工作聲音、掘進(jìn)機(jī)工作聲音,得到其小波包能量占比分布情況,如圖5 所示??煽闯鲭S著時間增加,4 種聲音的小波包能量占比變化不大,分布較為穩(wěn)定;瓦斯和煤塵爆炸聲音的小波包能量占比有較小的波動,但整體處于穩(wěn)定狀態(tài);采煤機(jī)工作聲音的小波包能量占比波動不大,能量基本集中在d1內(nèi),能量占比超過99.6%;掘進(jìn)機(jī)工作聲音的小波包能量占比有輕微波動,但仍保持較穩(wěn)定的狀態(tài),能量同樣集中在d1內(nèi),能量占比超過95%。 由表1 和圖5 可知,聲音信號通過小波包分解提取的能量占比分布穩(wěn)定,瓦斯和煤塵爆炸聲音的小波包能量占比與非瓦斯和煤塵爆炸聲音的小波包能量占比差異明顯,不同時長的同一聲音信號的小波包能量占比分布穩(wěn)定。因此,小波包能量占比可有效表征聲音信號特征,從而有效區(qū)分瓦斯和煤塵爆炸聲音與非瓦斯和煤塵爆炸聲音,且具備較強(qiáng)的抗噪聲能力。 圖5 不同時長下聲音小波包能量占比分布Fig.5 Wavelet packet energy proportion distribution of sound under different time 表1 煤礦井下聲音小波包能量占比分布Table 1 Wavelet packet energy proportion distribution of sound in underground coal mine % 將采集到的聲音信號通過GoldWave 軟件剪輯100 組作為訓(xùn)練樣本,提取聲音信號的小波包能量占比構(gòu)成表征聲音的特征向量,并輸入BP 神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練。BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線如圖6 所示,可看出僅需經(jīng)過19 步迭代訓(xùn)練后,誤差降低至期望誤差。 圖6 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線Fig.6 BP neural network training error curve 為驗證BP 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢,將100 組聲音信號作為測試樣本(其中瓦斯和煤塵爆炸聲音20 組,非瓦斯和煤塵爆炸聲音80 組),測試樣本經(jīng)小波包分解得到的能量占比作為特征向量分別輸入訓(xùn)練好的ELM 模型、SVM 模型和BP 神經(jīng)網(wǎng)絡(luò)模型中,識別結(jié)果見表2??煽闯鯞P 神經(jīng)網(wǎng)絡(luò)模型的識別率、召回率、精確率分別為95%,75%,100%,與其他2 種模型相比,識別效果最優(yōu)。 表2 不同模型識別結(jié)果Table 2 Recognition results of different models % (1)聲音信號通過小波包分解提取的能量占比分布穩(wěn)定,瓦斯和煤塵爆炸聲音的小波包能量占比與非瓦斯和煤塵爆炸聲音的小波包能量占比差異明顯,不同時長的同一聲音信號的小波包能量占比分布穩(wěn)定。因此,以小波包能量占比作為特征向量可有效表征聲音信號特征,且具有較強(qiáng)的魯棒性。 (2)將聲音信號的特征向量作為BP 神經(jīng)網(wǎng)絡(luò)的輸入值,經(jīng)過訓(xùn)練后得到瓦斯和煤塵爆炸聲音識別模型。實驗結(jié)果表明:BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度快,僅需較少的訓(xùn)練迭代次數(shù)就能達(dá)到期望誤差,且在煤礦井下眾多干擾聲音信號存在的情況下識別率達(dá)95%,與SVM 模型、ELM 模型相比,BP 神經(jīng)網(wǎng)絡(luò)識別效果最優(yōu)。2 實驗分析
2.1 實驗條件
2.2 參數(shù)選擇
2.3 特征提取
2.4 分類識別
3 結(jié)論