何勝明,劉 劍,胡 捷,李 政,劉豪睿
(1.雅礱江流域水電開發(fā)有限公司,四川 成都 610051;2.北京華控智加科技有限公司,北京 100084)
現(xiàn)代水電站越來越多的按照無人值守的原則進行設計和改造,大量引入各級監(jiān)控系統(tǒng)。傳統(tǒng)監(jiān)控系統(tǒng)采集振動、擺度、溫度、電壓、電流等信號數(shù)據(jù);振動擺度數(shù)據(jù)反映轉子等運動機械部件的狀態(tài)、摩擦以及轉速等;電壓電流等數(shù)據(jù)則反映發(fā)電質量[1]。
但是在發(fā)電廠房內,仍舊會出現(xiàn)上述傳感器所不能監(jiān)測的異常故障現(xiàn)象。類似水輪發(fā)電機組轉輪葉片裂紋、轉輪室鋼板脫落、過流部件空化空蝕和蝸殼門故障等缺陷在機組運行過程中難以用現(xiàn)有的診斷方式進行診斷。由于上述缺陷難以及時發(fā)現(xiàn),且現(xiàn)有的在線監(jiān)測手段也無法很好地解決這個問題。如果使用聲音監(jiān)測,則可使水電站運維人員更加直觀地判斷出設備運行狀態(tài),縮短故障診斷時間[2]。
基于聲音信號的故障診斷技術被應用在多個領域,例如風機故障診斷,發(fā)動機故障診斷,放電故障診斷等,并引起了諸多學者的關注。目前,基于聲音信號的水輪發(fā)電機組故障診斷研究可供參考成果較少,且仍存在一些問題,如:故障源不確定性,噪聲復雜且信噪比較低,故障診斷分類器無法實現(xiàn)類別增量學習等[3,4]。Carvalho 針對水輪發(fā)電機組的放電聲音事件,使用小波包進行降噪處理,在閾值選擇等方面獲得一定的成果[5]。目前聲音處理領域的通用技術流程為:采集聲音信號、預處理(重采樣和解壓縮等)、降噪、提取特征、使用統(tǒng)計分類器或深度學習模型等進行識別[6]。各種時頻聯(lián)合特征分析方法得到了廣泛的研究和應用。從短時傅里葉變換到小波變換、維格納分布等各類時頻分布多達幾十種。如今時頻分析已經(jīng)得到了許多有價值的成果[7]。辨識模型通常包括以SVM 為代表的傳統(tǒng)機器學習算法和深度學習算法。以卷積神經(jīng)網(wǎng)絡為代表的網(wǎng)絡模型在大規(guī)模圖像樣本識別中具有更多優(yōu)點。因此在聲學場景分類背景下使用卷積神經(jīng)網(wǎng)絡對頻譜圖進行分析[8-10]。
本文選取兩河口2 號發(fā)電機組進行實驗研究,全方位采集發(fā)電廠房的聲音,對采集的聲音數(shù)據(jù)進行RMS、頻譜、聲譜圖(STFT)和深度神經(jīng)網(wǎng)絡分析;建立聲紋模型,通過聲音對發(fā)電廠房健康狀況進行監(jiān)測。使用基于神經(jīng)網(wǎng)絡的聲譜圖特征分類方法識別水輪機組發(fā)電設備的運行狀態(tài)。因此在聲學場景分類背景下使用卷積神經(jīng)網(wǎng)絡對頻譜圖進行分析[8-10]。
本次試驗對兩河口2 號水輪發(fā)電機組進行42 個測點布置,包括水車室、風洞和尾水門等。聲音采集參數(shù)為48k 采樣率。試驗安排時間見表1。分析方法采用有效值趨勢分析分析、頻譜分析、聲譜圖分析和基于聲紋特征的神經(jīng)網(wǎng)絡模型分析。
表1 試驗工況總體說明Tab.1 General description of test conditions
機組甩負荷試驗是檢驗主機和調速器、勵磁裝置、繼電保護及管路等的設計、制造和安裝質量最重要的試驗項目之一。通過甩負荷試驗測量主機的振動、轉速上升率、水壓上升率、電壓上升率以及軸承溫度上升等重要指標,來判定機組及其相應的引水管路和水工建筑物的設計、制造、安裝是否符合要求。因此,在機組開機試驗過程中進行不同負荷的升負荷甩負荷實驗,負荷分別為額定功率的25%,50%,75%,具體調整時間表見表2。
表2 升/甩負荷調整時間表Tab.2 Load rejection adjustment schedule
聲音采集裝置采集信號數(shù)據(jù)為聲壓,使用公式(1),對各個測點的聲壓進行RMS(Root Mean Square)的計算:
式中:x1,x2,…,xn為采樣時間內樣本點的聲壓值;n為樣本點數(shù)量。
圖1~4分別為各個測點聲壓的RMS趨勢圖。
圖1 水車室側壁測點聲音有效值趨勢分析圖Fig.1 Trend analysis chart of sound RMS of sidewall of waterwheel chamber
圖2 尾水進人門測點聲音有效值趨勢分析圖Fig.2 Trend analysis chart of sound RMS of tail water gate
由圖1、2可見水車室側壁和尾水進人門測點的聲音有效值在不同負荷工況下有明顯的差異,其中未加載負荷狀態(tài)下聲音有效值最大,不同負荷狀態(tài)下聲音有效值處于各自相對穩(wěn)定的能級上。由圖1可見水車室側壁聲音有效值在甩負荷的瞬間出現(xiàn)一個尖脈沖,且脈沖能級和被甩負荷的大小正相關。
由圖3、4可見發(fā)電機風洞側壁和定子機座測點聲音有效值在不同的負荷狀態(tài)下基本處于同一個穩(wěn)定的能級,只有在甩負荷的瞬間出現(xiàn)一個尖脈沖,且脈沖能級和被甩負荷的大小正相關。
圖3 發(fā)電機風洞側壁測點聲音有效值趨勢分析Fig.3 Trend analysis chart of sound RMS of sidewall of generator wind tunnel
圖4 定子機座測點聲音有效值趨勢分析圖Fig.4 Trend analysis chart of sound RMS of stator frame
根據(jù)上述分析得到如下初步結論:水車室側壁測點采集到的聲音有效值對于機組的負荷和負荷變化具有良好的區(qū)別性。尾水進人門測點采集到的聲音有效值對于機組的負荷具有區(qū)別性,但是對于負荷的瞬間變化不是特別敏感。發(fā)電機風洞側壁和定子機座測點采集到的聲音有效值對于機組的甩負荷具有良好的指示性,但是對于負荷穩(wěn)定狀態(tài)和升負荷沒有區(qū)分性。
針對上述聲音有效值趨勢分析的結果,重點分析水車室側壁測點的聲音數(shù)據(jù)。對該測點的各種工作負荷狀態(tài)所采集的數(shù)據(jù)進行傅里葉變換,得到頻譜圖。
圖5為50%和75%負荷狀態(tài)聲音信號的波形圖,所示頻譜圖中,該負荷下存在較穩(wěn)定的400 Hz 及800 Hz。同時參考圖1有效值趨勢圖可以看出,隨著負荷增加,測點聲音信號幅值開始逐步下降,甩負荷后幅值迅速增加。通過上述分析,得到如下的初步結論:在機組升負荷時,測點聲音信號的波形圖幅值會較為平緩的下降至一定的水平;當機組甩負荷時,機組測點聲音信號波形圖幅值通常會急劇增加至一定水平,原因是在甩負荷時刻隨著水輪機組的負載突然減小,轉速則突然增加,隨后被控制到額定轉速。
圖5 水車室側壁不同負荷狀態(tài)聲音信號波和形頻譜圖Fig.5 Time domain wave and spectrogram of the sound signal of the waterwheel sidewall under different loading states
通過對機組的信號頻譜觀察,由于不同負荷其頻譜較接近,因此較難對負荷狀態(tài)進行判斷。此時需要借助聲譜圖進行輔助分析。
聲譜圖是基于短時傅里葉變換(STFT)計算得到的數(shù)據(jù)分析,使用公式(2)進行計算。其中通過窗函數(shù)w(n-m)對信號序列x(m)實現(xiàn)在m附近的開窗和平移,同時進行傅里葉變換。跟隨m的變化,窗函數(shù)在時間軸上移動,使得時間序列進入”逐段”的分析狀態(tài)。為了抑制頻譜泄露帶來的不利影響,通常會選擇在時域加窗,常見的窗函數(shù)有矩形窗、Hanning 和Hamming等,本次數(shù)據(jù)處理選取Hamming 窗。聲譜圖中同時包含了聲音能量在時間和頻率兩個維度上的細微變化。
通過觀察聲譜圖,圖6中可以看到,以75%負荷為例,升∕甩負荷前后其能量變化更為明顯。此時需要借助神經(jīng)網(wǎng)絡方法對這種能量變化做出判斷。
圖6 75%升/甩負荷時段的波形圖、聲譜圖和頻域分析圖Fig.6 Waveform,spectrogram and frequency domain analysis of the 75% load rejection period
目前流行的深度學習算法有卷積神經(jīng)網(wǎng)絡(CNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)、受限玻爾茲曼機(RBM)和自動編碼器算法。選取CNN進行模型訓練,網(wǎng)絡輸入層為短時傅里葉變換得到的聲譜圖。
對聲譜圖樣本標注的狀態(tài)為無負荷狀態(tài)、25%負荷、50%負荷、75%負荷4 種工況。整個神經(jīng)網(wǎng)絡經(jīng)過多次卷積和池化后得到一個固定維度的特征向量,稱之為Embedding層特征,亦稱為聲紋特征。將聲紋特征接入一個聚類模型或者softmax 層實現(xiàn)分類,該分類對應4種工況。
(1)輸入二維圖像。采用以二維卷積層為主要結構的神經(jīng)網(wǎng)絡結構,輸入層接收一個二維圖像作為模型輸入。短時傅里葉變換(STFT)計算過程如圖7所示。
圖7 短時傅里葉變換計算示意圖Fig.7 Schematic diagram of short-time Fourier transform
圖7中利用短時傅里葉變換制作聲譜圖有兩個重要的控制參數(shù),幀長(圖中的2n_fft)和幀移(圖中的hop_size)。不同的幀長和幀移產(chǎn)生的聲譜圖差異很大,尤其是幀長的選擇。
當采用較小的幀長時,聲譜圖具有很高的時間分辨率,但是頻率分辨率低,在聲譜圖呈現(xiàn)為頻率軸方向的豎條紋;當采用較大的幀長時,聲譜圖具有很高的頻率分辨率,但是時間分辨率低,在聲譜圖呈現(xiàn)為頻率軸方向的橫條紋。在人聲聲紋識別領域研究人員根據(jù)人聲發(fā)聲機理的研究成果通常采用20~25 ms 的幀長制作語譜圖。對于本方案要研究的機器聲紋領域,同樣需要根據(jù)機器的發(fā)聲特點選擇合適的幀長。
通過短時傅里葉變換得到的聲譜圖縱坐標是頻率,單位為Hz。由于本方案采集的聲音數(shù)據(jù)采樣率很高,通常得到的頻率維度的維數(shù)很高。以48 kHz 采樣,幀長100 ms 為例,一幀采樣點數(shù)為4 800,最高分析頻率為24 kHz,得到的頻率維度為2 048維。幀移選擇256,幀數(shù)選擇128,即構成了圖7(c)中的紅框部分,該紅框部分為一個神經(jīng)網(wǎng)絡輸入的一個測試樣本。
上述算法實現(xiàn)需實驗分析的譜圖制作方法及需要試驗選取的參數(shù)包括:幀長、幀移和幀數(shù)(時間context)。
(2)深度神經(jīng)網(wǎng)絡搭建。深度卷積網(wǎng)絡設計需要考慮模型的層數(shù)、每層卷積核的尺寸、每層卷積核的個數(shù)等參數(shù)。深度卷積模型結構見表3。
表3 深度卷積模型結構參數(shù)表Tab.3 Structure parameters of depth convolution model
表3中c表示輸出通道數(shù),n表示重復次數(shù),s表示步長。網(wǎng)絡結構單元由Depthwise Conv、Piontwise Conv、Inverted residual block和Linear GD Conv組成。
(3)Embedding(聲紋特征)。上述步驟的目的是得到Embedding,Embedding 就是用一個低維的向量表達一個高維數(shù)據(jù)的特征,也就是本方案中的聲紋特征。在深度神經(jīng)網(wǎng)絡中,除最后一層非線性映射函數(shù)SoftMax,其余所有層對輸入矩陣的操作都可以看作將高維空間中的樣本點通過變換和映射投影的方式,或丟棄一部分無用信息(權重小的維度),或去除線性相關項,在盡可能保持原有信息的情況下投影到另一個空間,通常會讓高維空間的點映射到低維空間,映射后的點通過SoftMax 或其他非線性映射函數(shù)輸出分類結果。若移除SoftMax層,那么最后一層Linear Convolution 的輸出的128 維向量可視為原始數(shù)據(jù)在低維空間的投影,這個128 維的向量就是模型提取的Embedding特征。因本次數(shù)據(jù)提取的是聲音信號中蘊含的細微特征,故稱之為聲紋特征。
(4)輸出類別。輸出為4 類,分別對應不同的負荷工況,標簽采用one-hot 編碼方式進行編碼。分類的類別由不同的負荷工況決定,由于采用經(jīng)典的SoftMax 交叉熵損失函數(shù),模型的分類訓練將迅速收斂,而得到的Embedding 特征對多工況的狀態(tài)的特異性表達不足。因此采用Large-Margin SoftMax,驅使不同類別的Embedding 在特征空間具有更大的距離,而同類別的Embedding 具有更小的距離,最終達到Embedding 表達和特異性狀態(tài)特征的強相關。
圖8為本測試訓練得到的深度神經(jīng)網(wǎng)絡工況分析測試結果(以25%負荷為例)。一共測試了約6 000 條不同負荷時段的樣本。對每一個樣本進行類別打分,每個樣本對4 種工況計算得到4個分數(shù),分數(shù)越高表示屬于該類別的概率越高,通常取最高分數(shù)對應的類別作為最終的分類結果。圖中橫坐標為樣本編號,縱坐標為打分分數(shù)。其中的藍色曲線表示的是測試樣本所屬類別(屬于25%負荷工況)得到的打分分數(shù),紅色曲線為測試樣本歸屬其他類別(屬于其他負荷工況)得到的打分分數(shù)的最高分。由圖8可見本試驗訓練的模型對工況分類的正確率達到了100%。
圖8 深度神經(jīng)網(wǎng)絡工況分類測試結果Fig.8 Classification test results of deep neural network
尾水泄露試驗通過采集正常聲音信號和模擬打開尾水門進行。圖9、圖10中,通過聲音信號的原始波形、頻譜圖和聲譜圖可以看到,兩個狀態(tài)下頻率以及能量是有區(qū)分的。為了更準確判斷事故狀態(tài),使用深度神經(jīng)網(wǎng)絡模型對正常狀態(tài)樣本和泄露狀態(tài)樣本分類。圖11中橫坐標為樣本編號,縱坐標為打分分數(shù)。其中的藍色曲線表示的是泄露時測試樣本所屬類別得到的打分分數(shù),黃色曲線為泄露測試樣本所屬其他類別得到的打分分數(shù)。由圖可見本試驗訓練的模型對泄露聲音的正確率達到了100%。
圖9 測點38C泄露試驗波形對比Fig.9 Comparison of waveforms of leakage test at measuring point 38C
圖10 測點38C泄露試驗聲譜圖對比Fig.10 Comparison of spectrum of leakage test at measuring point 38C
圖11 深度神經(jīng)網(wǎng)絡事故識別測試結果Fig.11 Classification test results of deep neural network
通過采集升負荷甩負荷等試驗工況狀態(tài)中聲音信號,對波形、頻譜、有效值、聲譜圖進行分析,得到不同工況聲音的特征具有可分性的結論。試驗用深度神經(jīng)網(wǎng)絡對聲譜圖進行分類,結果顯示模型可完全實現(xiàn)不同負荷工況的分類。
(1)聲音信號對于不同負荷工況狀態(tài)具有良好的可分性。利用深度神經(jīng)網(wǎng)絡的細微特征提取能力,試驗結果顯示聲譜圖可以完全實現(xiàn)對不同負荷工況狀態(tài)的正確分類。
(2)模擬尾水門泄露實驗無法利用傳統(tǒng)的信號處理方法進行識別。利用深度神經(jīng)網(wǎng)絡的細微特征提取能力對測點采集的數(shù)據(jù)進行分析,得到完全正確的分類結果。
上述結果只針對本次試驗采集的數(shù)據(jù),由于實際運行過程涉及更復雜的工況參數(shù)變化,本實驗結論需要進一步認證。利用分類模型進行很好的負荷工況分類,只能說明良好標注分類模型的有效性,對于無標注工況的異常檢測需要進一步研究和分析。