陳亞楠 胡凱凱 陳剛 胡嬋娟 舒暉 李籽圓
旋轉(zhuǎn)機械廣泛存在于大中型機械裝置中,如汽輪機、燃氣輪機、離心式及軸流式壓縮機、泵、水輪機、發(fā)電機和航空發(fā)動機等。大中型旋轉(zhuǎn)機械一般安裝有振動監(jiān)測保護和故障診斷系統(tǒng),通常在旋轉(zhuǎn)機械關(guān)鍵點上安裝振動傳感器,采集關(guān)鍵點振動信息。通過對采集的數(shù)據(jù)進行時域、頻域、時頻域、小波變換、自相關(guān)等分析,能夠?qū)πD(zhuǎn)機械進行故障診斷。但是這種方法需要工程師有足夠的經(jīng)驗,且因機組數(shù)量多,人工分析費時費力。
機器學習是近些年興起的新學科,是人工智能和模式識別領(lǐng)域共同的研究熱點,其理論和方法已被廣泛應(yīng)用于解決工程應(yīng)用和科學領(lǐng)域的復雜問題。機器學習常見的算法有決策樹算法、樸素貝葉斯算法、支持向量機算法、隨機森林算法、人工神經(jīng)網(wǎng)絡(luò)算法、回歸算法和深度學習算法等。理論上,直接將采集到的大量振動原始數(shù)據(jù)及標簽數(shù)據(jù)(通常是有無故障)作為機器學習的輸入,能夠?qū)崿F(xiàn)對模型的訓練。但是,對于實際工程問題,往往正負樣本極不均衡,正樣本(無故障)數(shù)據(jù)量遠遠大于負樣本(有故障),且原始數(shù)據(jù)通常維度較高,直接采用原始數(shù)據(jù)往往會導致模型過擬合,模型泛化能力差。
因此,本文結(jié)合針對旋轉(zhuǎn)機械的振動分析方法和機器學習常用的分類方法,通過提取不同特征作為機器學習的輸入,大大降低了數(shù)據(jù)維度,并通過模型訓練,構(gòu)建了故障診斷和預測模型,用于旋轉(zhuǎn)機械的故障自動診斷。
特征提取
通常對于旋轉(zhuǎn)機械的狀態(tài)監(jiān)測系統(tǒng),所采集到的原始信號為高頻信號,維度高,不適合直接作為機器學習的特征輸入,而從原始信號中提取特征信息可有效降低輸入特征維度。
一、時域特征提取
旋轉(zhuǎn)機械在狀態(tài)發(fā)生改變時,時域參數(shù)能夠反映其狀態(tài)變化。當旋轉(zhuǎn)機械發(fā)生故障時,可能出現(xiàn)沖擊,表現(xiàn)在時序圖中即是某些點遠遠超出其他點(圖1)。
常用的時域參數(shù)包括峰值、均值、方差、歪度、峭度、均方根值、波形指標、脈沖指標、峭度指標、歪度指標和裕度指標。
對于一組信號xi,i=1,…,n,其時序特征如表1所示。
有量綱的幅值診斷參數(shù)值會隨著故障的增大而不同程度增大,且其中峭度對探測信號中含有脈沖的故障最敏感。有量綱幅值診斷參數(shù)值也會因工作條件(如負荷、轉(zhuǎn)速、記錄儀器的靈敏度等)的改變而改變,實際上很難加以區(qū)分。通常希望幅值診斷參數(shù)對故障足夠敏感,而對信號的幅值和頻率的變化不敏感,即與機器的工作條件關(guān)系不大,為此引入了不受工作狀況影響的無量綱幅值參數(shù)。無量綱時域參數(shù)對故障的敏感性與穩(wěn)定性情況如表2所示。
根據(jù)旋轉(zhuǎn)機械的工作特性及不同的診斷目標,需選用不同的時域指標作為時域特征。
二、頻域特征提取
工程應(yīng)用中,常用快速傅里葉變換(FFT)作為頻譜分析方法,使信號從時域空間變換到頻域空間。在頻譜圖中,旋轉(zhuǎn)機械特征頻率、倍頻及幅值變化可用于診斷旋轉(zhuǎn)機械狀態(tài)。如圖2所示,通常頻譜圖中含有測量范圍內(nèi)所有頻譜信息。
對于特定診斷問題,需從頻譜中截取目標頻率帶,在頻率帶中自動抽取頻率與對應(yīng)幅值作為頻域特征(圖3)。
三、時頻域特征提取
旋轉(zhuǎn)機械在其壽命末期,在頻譜圖中呈現(xiàn)出整個頻率段幅值增大的情況,且尖峰不明顯。將原始信號通過快速傅里葉變換后,在某個頻率段范圍內(nèi),將信號按照時序特征抽取方法計算時頻域特征,計算的指標包括波形指標、峰值指標、脈沖指標、裕度指標、峭度指標、均方根值,并將提取的指標組成一維向量。
四、功率譜密度特征提取
功率譜是功率譜密度函數(shù)的簡稱,其定義為單位頻帶內(nèi)的信號功率,表示信號功率隨著頻率的變化情況,即信號功率在頻域的分布狀況。
旋轉(zhuǎn)機械在狀態(tài)正常、運行良好的情況下,少有能量泄漏;出現(xiàn)狀態(tài)異常時,其運行不平穩(wěn)會導致能量泄漏。特定頻率段的功率譜可用于旋轉(zhuǎn)機械狀態(tài)檢測。某信號功率譜如圖4所示。
五、自相關(guān)特征提取
自相關(guān)是指信號在一個時刻的瞬間值與另一個時刻的瞬間值之間的依賴關(guān)系,是對一個信號的時域描述。如果一個信號包含一種模式,該模式會在幾秒鐘的時間周期后重復自身,則該信號與其延遲后的信號之間將具有很高的相關(guān)性。某信號的自相關(guān)圖如圖5所示。
模型訓練及預測
數(shù)據(jù)準備:包括正負樣本數(shù)據(jù)收集,故障特征頻率收集,并通過數(shù)據(jù)預處理,去除空值、異常值等無效數(shù)據(jù)。
模型訓練:將搜集到的數(shù)據(jù)分成訓練數(shù)據(jù)和測試數(shù)據(jù),從原始數(shù)據(jù)中提取時序特征、頻域特征、時頻域特征、PSD特征和自相關(guān)特征并組成模型的輸入特征,將其輸入至多種分類器模型(常用的機器學習分類模型包括對數(shù)幾率回歸、隨機森林、梯度提升、支持向量機和神經(jīng)網(wǎng)絡(luò)等)中進行訓練,從訓練及測試結(jié)果中挑選出表現(xiàn)最好的模型,并對模型參數(shù)進行保存。
故障預測:讀取需要預測的原始數(shù)據(jù),抽取原始數(shù)據(jù)特征,包括時序特征、頻域特征、時頻域特征、PSD特征和自相關(guān)特征,組成輸入特征。載入訓練好的模型參數(shù),將輸入特征輸入至模型中,輸出預測結(jié)果。模型訓練及預測流程如圖6所示。
案例分析
某型號風電齒輪箱發(fā)生中速級斷齒,其嚙合頻率為19.2Hz。訓練集共58組數(shù)據(jù),正例29,負例29;測試集共32組數(shù)據(jù),正例14,負例18。選取低頻段作為頻譜及時頻域段關(guān)注頻段。分別提取每一組數(shù)據(jù)的特征值作為模型的輸入,提取的指標包括:時域有量綱和無量綱指標作為時域特征;0~100Hz頻率段內(nèi)幅值及對應(yīng)頻率作為頻域特征;0~100Hz頻率段內(nèi)有量綱和無量綱指標作為時頻域特征。正例標記為0,負例標記為1。
采用不同算法進行訓練,測試結(jié)果如表3所示。從表中不同分類算法在訓練集及測試集上的表現(xiàn)可以得出,梯度提升分類器表現(xiàn)最優(yōu),在訓練集上的準確率達到100%,在測試集上的準確率達到90%,有效檢測出了中速級斷齒故障。
總結(jié)
本文針對旋轉(zhuǎn)機械振動分析和機器學習各自的優(yōu)缺點,將兩者有機結(jié)合,采用振動分析方法,從原始信號及其頻域信號中提取時域特征、頻域特征、時頻域特征、PSD特征和自相關(guān)特征,組合作為機器學習的輸入,通過搜集的故障案例數(shù)據(jù)進行模型訓練,并在測試集上獲得較好表現(xiàn)。
該方法可廣泛應(yīng)用于旋轉(zhuǎn)機械的狀態(tài)監(jiān)測領(lǐng)域,實現(xiàn)各類故障的自動診斷和預測。但需要指出的是,該方法針對特定問題,需要提取其特征頻率帶,對于無法獲取特征頻率帶的部件,需結(jié)合模糊匹配算法實現(xiàn)特征頻率帶的自動匹配,使算法具備更強的適應(yīng)能力。
(作者單位:中車株洲電力機車研究所有限公司)