劉華新,劉紅艷,韓中合,朱霄珣,侯棟楠
(1.華北電力大學(xué) 能源動(dòng)力與機(jī)械工程學(xué)院,河北 保定 071003;2.河北軟件職業(yè)技術(shù)學(xué)院,河北 保定 071000)
齒輪箱作為風(fēng)電機(jī)組的關(guān)鍵設(shè)備,承受變速變載荷和惡劣的工作環(huán)境,一旦發(fā)生故障會(huì)造成風(fēng)電機(jī)組停機(jī),發(fā)電量損失較大。如果能夠利用狀態(tài)檢測(cè)技術(shù)對(duì)機(jī)組SCADA 系統(tǒng)的數(shù)據(jù)進(jìn)行監(jiān)測(cè)和分析,評(píng)估機(jī)組齒輪箱運(yùn)行狀態(tài)并提前發(fā)現(xiàn)齒輪箱的異常征兆,能夠有效地降低齒輪箱的故障時(shí)間,提高風(fēng)電機(jī)組可靠性及風(fēng)電場(chǎng)的經(jīng)濟(jì)效益。
文獻(xiàn)[1]使用了線性調(diào)頻小波分解對(duì)齒輪箱的振動(dòng)信號(hào)進(jìn)行處理,進(jìn)而實(shí)現(xiàn)不同故障模式的識(shí)別。文獻(xiàn)[2]運(yùn)用變分模態(tài)分解(VMD)和深度置信網(wǎng)絡(luò)提取風(fēng)電機(jī)組易損部件故障信號(hào)的微弱特征,并進(jìn)行故障有效識(shí)別。文獻(xiàn)[3]通過計(jì)算出齒輪箱振動(dòng)信號(hào)的狀態(tài)參數(shù),利用BP 神經(jīng)網(wǎng)絡(luò)對(duì)齒輪箱的狀態(tài)進(jìn)行判斷。文獻(xiàn)[4]通過提取齒輪箱振動(dòng)信號(hào)提升小波包能量熵,再利用支持向量機(jī)(Support Vector Machine,SVM)對(duì)其進(jìn)行分類,進(jìn)而判斷出齒輪箱的故障類別。文獻(xiàn)[5]基于數(shù)據(jù)挖掘的思想對(duì)風(fēng)電機(jī)組的SCADA 數(shù)據(jù)建立非線性狀態(tài)估計(jì)診斷模型(NSET),并使用極限學(xué)習(xí)機(jī)對(duì)NSET 進(jìn)行改進(jìn),提高了對(duì)風(fēng)電機(jī)組齒輪箱的狀態(tài)預(yù)測(cè)的準(zhǔn)確性。文獻(xiàn)[6]提出了一種基于風(fēng)電機(jī)組SCADA 和振動(dòng)信號(hào)的深度自編碼網(wǎng)絡(luò),利用該網(wǎng)絡(luò)從數(shù)據(jù)中學(xué)習(xí)出齒輪箱的狀態(tài)特征。文獻(xiàn)[7]對(duì)齒輪箱的油溫和軸承溫度構(gòu)建過程記憶矩陣,通過溫度的預(yù)測(cè)殘差判斷齒輪箱的狀態(tài)特征。
近年來(lái),隨著深度學(xué)習(xí)技術(shù),特別是其中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像識(shí)別、語(yǔ)音識(shí)別以及模式識(shí)別上的應(yīng)用,使計(jì)算機(jī)能夠快速、準(zhǔn)確、自適應(yīng)地學(xué)習(xí)到數(shù)據(jù)的內(nèi)在特征,完成一系列復(fù)雜的分類任務(wù)[8],[9]。因此,將深度學(xué)習(xí)方式應(yīng)用于齒輪箱的故障診斷和狀態(tài)分析上也成為目前的研究熱點(diǎn)。與傳統(tǒng)故障診斷方法相比,深度學(xué)習(xí)算法能夠自適應(yīng)地從風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)中學(xué)習(xí)狀態(tài)特征,而與基于風(fēng)電機(jī)組數(shù)據(jù)的狀態(tài)預(yù)測(cè)方法相比,深度學(xué)習(xí)方法具有更強(qiáng)的泛化能力,可以通過遷移學(xué)習(xí)的方式推廣到不同類型機(jī)組中。
本文以某1.5 MW 風(fēng)電機(jī)組齒輪箱為研究對(duì)象,基于SCADA 數(shù)據(jù)和振動(dòng)信號(hào)特征,設(shè)計(jì)了一種CNN 模型,對(duì)風(fēng)電機(jī)組齒輪箱進(jìn)行整體的狀態(tài)評(píng)價(jià)。該模型能夠自適應(yīng)地學(xué)習(xí)輸入信息所蘊(yùn)含的特征,在齒輪箱發(fā)生運(yùn)行異常時(shí)識(shí)別出其狀態(tài),從而提早發(fā)現(xiàn)齒輪箱潛在故障,避免故障造成更大的損失。
在深度學(xué)習(xí)領(lǐng)域中,CNN 是目前最經(jīng)典、最具代表的算法之一。CNN 學(xué)習(xí)過程的實(shí)質(zhì)是通過訓(xùn)練多個(gè)能夠提取輸入數(shù)據(jù)特征的特征過濾器(卷積核),利用這些特征過濾器對(duì)輸入數(shù)據(jù)進(jìn)行逐層卷積和池化操作,進(jìn)而將隱藏在數(shù)據(jù)中的特征清晰地輸出到新的空間中[10]。
本文首先構(gòu)建了一個(gè)能夠描述風(fēng)電機(jī)組齒輪箱狀態(tài)的矩陣D,然后利用CNN 提取矩陣D 所隱藏的機(jī)組齒輪箱狀態(tài)特征。由于狀態(tài)矩陣的數(shù)據(jù)量相對(duì)于CNN 通常處理的圖片更小,為了提高計(jì)算效率,本文以一種優(yōu)秀的 CNN 模型—VGGNet[10]為基礎(chǔ),設(shè)計(jì)了一個(gè)規(guī)模更小、訓(xùn)練速度更快的CNN 模型來(lái)學(xué)習(xí)風(fēng)電機(jī)組齒輪箱信號(hào)中蘊(yùn)含的狀態(tài)特征(圖1)。
圖1 基于VGGNet 設(shè)計(jì)的CNN 模型Fig.1 CNN model based on VGGNet
由圖1 可知,本文建立的CNN 模型在學(xué)習(xí)輸入信息的特征中主要由3 種層級(jí)結(jié)構(gòu)以及softmax 分類器對(duì)信息進(jìn)行處理,不同種類的CNN模型間的區(qū)別則反映在這3 種層級(jí)結(jié)構(gòu)參數(shù)的選擇、排列的方式上,因此,這3 種層級(jí)結(jié)構(gòu)是CNN的基本構(gòu)成單元。
1)卷積層(convolution layer)
卷積層中每個(gè)節(jié)點(diǎn)的輸入與上一層的局部感受野區(qū)域相連,通過卷積核對(duì)該局部感受野的區(qū)域進(jìn)行計(jì)算。卷積層的輸入為
在 VGGNet 模型中,卷積核大小為 3×3,因此,本文CNN 模型的卷積核大小也選用3×3。
卷積層的輸出為
式中:f () 為激活函數(shù),一般選取 ReLU,tanh,Sigmoid 等函數(shù),本文所使用模型參考了VGGNet,確定激活函數(shù)為ReLU。
2)池化層(pooling layer)
池化層中利用池化函數(shù)來(lái)減少上一層輸出的數(shù)據(jù)量。池化層的輸出為
本文設(shè)計(jì)的CNN 模型參考VGGNet 設(shè)置為最大池化函數(shù),但池化的范圍與方式和VGGNet有一定區(qū)別。
3)全連接層(fully connected layer)
將所有經(jīng)過卷積、 池化過程的數(shù)據(jù)特征由全連接層映射到新的特征空間上,以便進(jìn)行樣本的分類。全連階層的輸出可通過下式計(jì)算得到。
式中:ul為前一層輸出特征xl-1進(jìn)行加權(quán)和偏置后的結(jié)果;ωl為全連接層的權(quán)重;bl為全連接層l 的偏置項(xiàng)。
由于本文建立的CNN 模型輸入的矩陣信息為 9×72,相對(duì) VGGNet 的圖片輸入 224×224 更小。為了降低計(jì)算規(guī)模,本文CNN 模型是在去掉了前兩層卷積層的VGGNet 上修改而來(lái)。
本文以某風(fēng)電場(chǎng)1.5 MW 雙反饋型風(fēng)電機(jī)組的齒輪箱為研究對(duì)象。該機(jī)組的齒輪箱采用一級(jí)行星-兩級(jí)平行的結(jié)構(gòu),SCADA 系統(tǒng)每10 min 記錄一次期間的機(jī)組狀態(tài)平均值。選擇與齒輪箱狀態(tài)密切相關(guān)的風(fēng)速、 發(fā)電功率、 齒輪箱潤(rùn)滑油溫度、齒輪箱主軸承溫度、環(huán)境溫度等參數(shù)組成齒輪箱狀態(tài)矩陣。同時(shí),增加一些振動(dòng)傳感器采集信號(hào)獲得齒輪箱的振動(dòng)狀態(tài)[11]??紤]到振動(dòng)信號(hào)會(huì)隨著風(fēng)速、風(fēng)向等多種因素變化,因此,采用振動(dòng)信號(hào)的峭度特征作為反映齒輪箱振動(dòng)特征的輸入值。由于振動(dòng)傳感器和SCADA 系統(tǒng)采用的頻率差異較大,因此,對(duì)獲得的振動(dòng)信號(hào)每1 s 計(jì)算一次峭度特征值,取10 min 內(nèi)特征值較大的前30%求平均作為特征變量輸入。最終輸入表1 所示參數(shù)對(duì)風(fēng)電機(jī)組齒輪箱狀態(tài)進(jìn)行描述。
表1 風(fēng)電機(jī)組齒輪箱的狀態(tài)參數(shù)Table 1 State parameters of wind turbine gearbox
表1 中的齒輪箱狀態(tài)參數(shù)均具有一定的物理意義,但各自數(shù)值和單位之間存在較大差異,需要進(jìn)行歸一化處理。參考文獻(xiàn)[11]對(duì)風(fēng)電機(jī)組狀態(tài)參數(shù)進(jìn)行歸一化的方式,使用相對(duì)劣化度的方法將風(fēng)電齒輪箱狀態(tài)參數(shù)折算到[0,1]區(qū)間,對(duì)于本文所涉及的狀態(tài)參數(shù),主要涉及兩種劣化度計(jì)算。
1)參數(shù)較小時(shí)齒輪箱的狀態(tài)較好
如齒輪箱潤(rùn)滑油溫度、軸承溫度、振動(dòng)信號(hào)的峭度等因素,其數(shù)值越小,齒輪箱的運(yùn)行越平穩(wěn)、健康。計(jì)算劣化度的公式為
式中:x 為所獲得的參數(shù);xmin,xmax分別為該參數(shù)在機(jī)組正常運(yùn)行時(shí)的最小值、最大值。
2)參數(shù)值位于某一范圍內(nèi)齒輪箱狀態(tài)較好
功率、風(fēng)速等位于某一區(qū)域內(nèi)時(shí),齒輪箱的狀態(tài)運(yùn)行最佳,其計(jì)算劣化度的公式為
式中:[xa,xb]為該參數(shù)的最佳范圍。
在使用CNN 模型對(duì)輸入的參數(shù)進(jìn)行訓(xùn)練的過程中,首先,需要對(duì)輸入數(shù)據(jù)進(jìn)行規(guī)范化。對(duì)于某一時(shí)刻i,齒輪箱的狀態(tài)可以由表1 狀態(tài)參數(shù)歸一化后組成如下式所示向量X(i)。
由于齒輪箱的狀態(tài)是一個(gè)發(fā)展的過程,為了讓CNN 能夠全面把握齒輪箱的狀態(tài),可以將m個(gè)歷史觀測(cè)向量X(i)組成狀態(tài)矩陣(D)。
D 是由從時(shí)刻n 開始到n+m 時(shí)刻間的m 個(gè)齒輪箱狀態(tài)向量組成,D 能夠代表在這m 個(gè)時(shí)刻內(nèi)設(shè)備的動(dòng)態(tài)過程,CNN 對(duì)齒輪箱狀態(tài)特征的評(píng)價(jià)就是通過對(duì)齒輪箱D 的學(xué)習(xí)并分類實(shí)現(xiàn)的。
本文D 的寬度m 表示狀態(tài)矩陣含有多少時(shí)間長(zhǎng)度的齒輪狀態(tài)信息。由于臨近時(shí)刻間的狀態(tài)信息存在著關(guān)聯(lián),而且數(shù)值上也接近,因此,在CNN 學(xué)習(xí)過程中可以采用最大池化方式將相鄰時(shí)刻間的信息進(jìn)行下采樣。而矩陣的高度上是并列關(guān)系的不同特征參數(shù),之間缺乏關(guān)聯(lián)性,因此,在卷積過程中不對(duì)矩陣高度方向上進(jìn)行下采樣。
本文選取某風(fēng)電場(chǎng)3 號(hào)、23 號(hào)、34 號(hào)機(jī)組齒輪箱在 2016年1月2日-12月25日的 SCADA數(shù)據(jù)和振動(dòng)特征數(shù)據(jù)建立風(fēng)電機(jī)組齒輪箱狀態(tài)特征數(shù)據(jù)集。其中,每個(gè)樣本為9×72 大小的D,代表12 h 內(nèi)齒輪箱的狀態(tài)。去除部分并非由齒輪箱故障導(dǎo)致的預(yù)警,獲得機(jī)組正常運(yùn)行下的樣本318個(gè)。再選取因齒輪箱故障造成的保護(hù)性停機(jī)狀態(tài)下的26 個(gè)樣本,將D 的最后時(shí)刻設(shè)置為選取發(fā)生故障前2 h~10 min,最終擴(kuò)容出312 個(gè)故障樣本。隨機(jī)選取正常狀態(tài)下和故障狀態(tài)下的330 個(gè)樣本作為訓(xùn)練集,剩下300 個(gè)樣本作為測(cè)試集,在Caffe 框架下訓(xùn)練圖1 所示的CNN 模型。由于本文的分類任務(wù)中只進(jìn)行故障和正常的二分類,因此,CNN 模型中只保留一個(gè)全連接層,并將全連接層維度修改為32 個(gè),降低了計(jì)算規(guī)模。
訓(xùn)練CNN 識(shí)別模擬齒輪箱D 時(shí),采用隨機(jī)梯度下降法訓(xùn)練CNN。通過多次試錯(cuò)實(shí)驗(yàn)選擇最優(yōu)的網(wǎng)絡(luò)參數(shù),最終CNN 在對(duì)齒輪箱狀態(tài)的識(shí)別中最高達(dá)到了96.3%的準(zhǔn)確率。圖2 為訓(xùn)練過程中模型對(duì)測(cè)試集的分類識(shí)別準(zhǔn)確率曲線。
由圖2 可知,模型收斂速度較快,在迭代3 000 次之后準(zhǔn)確率就達(dá)到了93%以上。為了進(jìn)一步了解CNN 對(duì)齒輪箱D 的具體識(shí)別效果,本文選取第6 000 次迭代時(shí)的CNN 模型對(duì)300 個(gè)測(cè)試樣本進(jìn)行分類,輸出結(jié)果如表2 所示。
圖2 CNN 訓(xùn)練過程中識(shí)別率的變化Fig.2 Change of recognition rate in CNN training
表2 CNN 對(duì)齒輪箱狀態(tài)矩陣的識(shí)別結(jié)果Table 2 Recognition result of state matrix of gearbox by CNN
由表2 可知,經(jīng)過訓(xùn)練的CNN 模型能夠相對(duì)準(zhǔn)確地在故障發(fā)生前2 h 內(nèi)識(shí)別出齒輪箱的故障狀態(tài),但隨著距離SCADA 發(fā)出預(yù)警的時(shí)間越超前,識(shí)別的準(zhǔn)確率越低,這和實(shí)際規(guī)律是相符合的。
由于CNN 的訓(xùn)練過程接近一個(gè)黑箱,本文使用流形學(xué)習(xí)方法中的T-SNE 工具對(duì)D 和CNN全連接輸出進(jìn)行降維與可視化,通過這種可視化的手段印證CNN 對(duì)齒輪箱D 的特征提取效果。
隨機(jī)從數(shù)據(jù)集中選取200 個(gè)齒輪箱D 樣本,利用訓(xùn)練完成的CNN 模型進(jìn)行分類并輸出識(shí)別過程中的全連接層向量。利用T-SNE 工具對(duì)原始D 和對(duì)應(yīng)輸出全連接層向量進(jìn)行降維和分類,結(jié)果如圖3 所示。由圖3 可知,齒輪箱D 無(wú)法直接在低維上表現(xiàn)出良好的分類特征,這說(shuō)明了簡(jiǎn)單的分類手段難以對(duì)齒輪箱D 進(jìn)行識(shí)別。但是經(jīng)過CNN 將D 處理為全連層接向量后,全連接層向量卻具有很好的分類特征,可以用一個(gè)簡(jiǎn)單的分類器進(jìn)行分類。據(jù)此可以判斷CNN 能夠從D 中提取齒輪箱狀態(tài)特征,使得蘊(yùn)含在狀態(tài)特征中的分類信息清晰表示在全連接層輸出向量中,進(jìn)而完成對(duì)齒輪箱狀態(tài)的定性。
圖3 CNN 對(duì)D 處理前后數(shù)據(jù)的T-SNE 圖像Fig.3 T-SNE image of data before and after CNN processing state matrix
在實(shí)際生產(chǎn)中,一個(gè)風(fēng)電場(chǎng)中往往具有大量相同型號(hào)的風(fēng)電機(jī)組設(shè)備,如果訓(xùn)練的CNN 模型不具有泛化性,那將大大降低其應(yīng)用價(jià)值。因此,本文將同一風(fēng)場(chǎng)的17 號(hào)機(jī)組作為測(cè)試樣本,提取17號(hào)機(jī)機(jī)組在2016年2月期間正常、齒輪箱油溫過高(供油故障)、齒輪箱油溫過高(齒輪磨損)3種狀態(tài)下的運(yùn)行數(shù)據(jù)作為輸入,驗(yàn)證本文建立的CNN 模型的應(yīng)用效果。依照上文建立的齒輪箱D規(guī)則,選取了最后時(shí)刻為故障發(fā)生前10 min~7 h 的齒輪箱D 以及正常運(yùn)行的齒輪箱D,然后使用本文所訓(xùn)練完成的CNN 模型進(jìn)行識(shí)別,輸出對(duì)應(yīng)識(shí)別故障狀態(tài)的概率值如圖4 所示。
圖4 CNN 識(shí)別齒輪箱狀態(tài)為故障的概率Fig.4 Probability of CNN recognizing gearbox state as fault
由圖4 可知,在距離故障發(fā)生時(shí)刻較超前時(shí),CNN 判斷齒輪箱狀態(tài)為故障的概率小于0.5,這表示CNN 判斷齒輪箱為正常狀態(tài)的概率大于判斷其為故障狀態(tài)的概率。隨著D 的時(shí)刻距離故障時(shí)間更近,CNN 判斷齒輪箱為故障狀態(tài)的概率開始增大,最終超過了0.5,因此,CNN 判斷齒輪箱為故障狀態(tài)。同時(shí),可以發(fā)現(xiàn),相比于齒輪箱供油故障,齒輪磨損故障被更早地識(shí)別出來(lái)。而在實(shí)地檢查中發(fā)現(xiàn),供油故障是由于齒輪潤(rùn)滑油粘度較大引起的油泵過載,這和當(dāng)時(shí)環(huán)境溫度密切相關(guān),因此具有一定的突然性。而隨后發(fā)生的齒輪磨損故障則能從振動(dòng)信號(hào)特征和其他特征表現(xiàn)出來(lái),因此,能更早地發(fā)出故障狀態(tài)的判斷。值得說(shuō)明的是,在將該模型應(yīng)用到對(duì)風(fēng)電機(jī)組齒輪箱狀態(tài)監(jiān)測(cè)時(shí),可以設(shè)置更高的故障概率閾值作為發(fā)出故障報(bào)警的條件,這樣雖然降低了模型的超前預(yù)警能力,但是提高了模型發(fā)出故障報(bào)警的可信度,更適應(yīng)對(duì)風(fēng)電機(jī)組的實(shí)時(shí)監(jiān)測(cè)。
針對(duì)風(fēng)電機(jī)組狀態(tài)檢測(cè)和分析的需要,本文基于深度學(xué)習(xí)理論,首先,建立了反映齒輪箱狀態(tài)的矩陣作為學(xué)習(xí)對(duì)象。然后,設(shè)計(jì)了一個(gè)基于VGGNet 結(jié)構(gòu)的CNN 模型,并按照一些特定規(guī)則對(duì)D 進(jìn)行深度學(xué)習(xí),使CNN 學(xué)習(xí)到提取齒輪箱狀態(tài)特征的能力。最后,將經(jīng)過訓(xùn)練的CNN 模型應(yīng)用于對(duì)其他同型號(hào)機(jī)組齒輪箱的狀態(tài)檢測(cè)和分析中,并取得了較為滿意的結(jié)果。該方法兼顧了輸入信息的物理意義,具有計(jì)算規(guī)模相對(duì)較小等優(yōu)點(diǎn),實(shí)現(xiàn)了對(duì)齒輪箱進(jìn)行狀態(tài)監(jiān)測(cè)的目的。