国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Stacking的雷達(dá)伺服系統(tǒng)故障診斷

2020-09-02 06:31王智吳俊盼魏海坤
軟件導(dǎo)刊 2020年8期
關(guān)鍵詞:異常檢測故障診斷

王智 吳俊盼 魏海坤

摘 要:為了提高南京某所某型雷達(dá)伺服系統(tǒng)故障診斷準(zhǔn)確率,考慮到傳統(tǒng)故障診斷算法的局限性,提出一種基于Stacking集成算法的雷達(dá)伺服系統(tǒng)故障診斷方法。針對某所某型雷達(dá)伺服系統(tǒng)的歷史監(jiān)測數(shù)據(jù),首先采用孤立森林算法識(shí)別異常樣本;然后基于原始數(shù)據(jù)構(gòu)造出新的特征,使用卡方檢驗(yàn)進(jìn)行特征選擇,并使用SMOTE算法解決樣本不平衡問題;最后,通過建立一種新穎、準(zhǔn)確的基于XGBoost、隨機(jī)森林和BP神經(jīng)網(wǎng)絡(luò)的Stacking集成模型進(jìn)行故障診斷。實(shí)驗(yàn)結(jié)果表明,該方法在測試集上的診斷準(zhǔn)確率達(dá)到了96.2%,比傳統(tǒng)方法診斷準(zhǔn)確率提高了1.8%,證明該方法能夠很好地完成雷達(dá)伺服系統(tǒng)故障診斷任務(wù)。

關(guān)鍵詞:雷達(dá)伺服系統(tǒng);故障診斷;異常檢測;特征工程;Stacking

DOI:10. 11907/rjdk. 192683 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

中圖分類號(hào):TP303文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)008-0006-04

Abstract: In order to improve the accuracy of fault diagnosis for a certain type of radar servo system in a research institute in Nanjing, with the consideration of the limitations of traditional fault diagnosis algorithms, a fault diagnosis method of radar servo system based on Stacking integrated algorithm is proposed. Aiming at the historical monitoring data of a certain type of radar servo system, we first use the isolated forest algorithm to identify abnormal samples. Then, new features are constructed based on the original data, feature selection is performed bt using Chi-square test, and sample imbalance is solved by using SMOTE algorithm. Finally, a novel and accurate Stacking integrated model based on XGBoost, random forest and BP neural network is established for fault diagnosis. The experimental results show that the diagnostic accuracy of the traditional method on the test set is up to 94.4%, and the diagnostic accuracy of the method proposed in this paper reaches 96.2%, which is 1.8% higher than the traditional method. The method proposed in this paper can well complete the fault diagnosis task of radar servo system.

Key Words: radar servo system;fault diagnosis;abnormal detection;feature engineering;Stacking

0 引言

隨著國防科技的飛速發(fā)展和社會(huì)需求的不斷增長,雷達(dá)系統(tǒng)在我國國防建設(shè)和國民經(jīng)濟(jì)中發(fā)揮著越來越重要的作用。伴隨著雷達(dá)技術(shù)的日益進(jìn)步,雷達(dá)系統(tǒng)的復(fù)雜程度越來越高,雷達(dá)系統(tǒng)的穩(wěn)定性和可靠性也越發(fā)重要,快速且準(zhǔn)確地實(shí)現(xiàn)雷達(dá)系統(tǒng)的故障診斷成為亟待解決的問題[1]。雷達(dá)伺服系統(tǒng)作為雷達(dá)系統(tǒng)的一個(gè)重要子系統(tǒng),其故障診斷研究十分重要。目前,傳統(tǒng)故障診斷算法診斷速度較慢、診斷準(zhǔn)確率不高,難以應(yīng)對越來越復(fù)雜的雷達(dá)系統(tǒng)。因此,設(shè)計(jì)一套高效且準(zhǔn)確率高的故障診斷算法尤為必要。

近年來,人工智能技術(shù)飛速發(fā)展,其在故障診斷領(lǐng)域的應(yīng)用不斷深入。文獻(xiàn)[2]采用IRN神經(jīng)網(wǎng)絡(luò)模型進(jìn)行雷達(dá)天線伺服系統(tǒng)故障診斷,解決了雷達(dá)天線伺服系統(tǒng)故障診斷準(zhǔn)確率不高的問題,但是該方法對樣本數(shù)據(jù)質(zhì)量要求較高且診斷準(zhǔn)確率提升不夠明顯;文獻(xiàn)[3]采用異常檢測算法和SVM算法進(jìn)行故障診斷,解決了對樣本數(shù)據(jù)質(zhì)量要求過高的問題,但是該方法故障診斷的準(zhǔn)確率存在瓶頸,診斷結(jié)果不能達(dá)到預(yù)期;文獻(xiàn)[4]采用Adaboost-SVM的方法進(jìn)行故障診斷,一定程度上解決了故障診斷準(zhǔn)確率存在瓶頸的問題,但是該方法沒有進(jìn)行針對性的特征工程處理,并且在集成模型選擇和優(yōu)化方面做得不夠深入,故障診斷準(zhǔn)確率還有一定提升空間;文獻(xiàn)[5]采用隨機(jī)森林模型進(jìn)行故障診斷,模型預(yù)測準(zhǔn)確率較高,但缺少模型融合研究;文獻(xiàn)[6]采用隨機(jī)森林模型和XGBoost模型進(jìn)行故障診斷,通過模型融合進(jìn)一步提升了故障診斷準(zhǔn)確率,但是該方法模型間融合較為簡單,模型集成研究不夠深入。

以上方法都未在特征工程和模型集成上進(jìn)行深度優(yōu)化,本文通過針對性的特征工程處理和Stacking集成算法,對特征工程和模型集成兩個(gè)方面進(jìn)行深度優(yōu)化,并結(jié)合異常檢測算法,提出一套新穎、高效的雷達(dá)伺服系統(tǒng)故障診斷方法。該方法彌補(bǔ)了故障數(shù)據(jù)特征表述單一和對故障數(shù)據(jù)質(zhì)量要求過高的問題,優(yōu)化了雷達(dá)伺服系統(tǒng)故障診斷模型,改進(jìn)了雷達(dá)伺服系統(tǒng)故障診斷準(zhǔn)確率。

1 數(shù)據(jù)預(yù)處理

雷達(dá)伺服系統(tǒng)的歷史監(jiān)測數(shù)據(jù)會(huì)由于設(shè)備老化、操作失誤和傳感器故障等原因,造成數(shù)據(jù)異常。因此,在進(jìn)行特征工程之前需要對數(shù)據(jù)進(jìn)行異常值檢測[7]。孤立森林模型(Isolation Forest,IF)是一種適用于連續(xù)型數(shù)據(jù)的無監(jiān)督異常檢測算法,該算法通過判斷樣本點(diǎn)的孤立性檢測異常值[8],具有較好的魯棒性。本文采用該算法對雷達(dá)伺服系統(tǒng)的歷史監(jiān)測數(shù)據(jù)進(jìn)行異常值檢測。

2 特征工程

目前,常見故障診斷算法往往都忽視特征工程的重要性,通常將原始特征直接注入模型中。本文基于原始特征構(gòu)造出一些新的特征,使得數(shù)據(jù)對故障的描述更加完備。

根據(jù)雷達(dá)伺服系統(tǒng)歷史監(jiān)測數(shù)據(jù),能夠基于時(shí)間維度挖掘出一些新的特征,主要包括兩個(gè)方面:歷史值和歷史變化率。某所某型雷達(dá)伺服系統(tǒng)的運(yùn)行監(jiān)測數(shù)據(jù)共有53項(xiàng)狀態(tài)參數(shù),每隔5分鐘記錄1次。在歷史值方面,將本次監(jiān)測數(shù)據(jù)、5分鐘前的監(jiān)測數(shù)據(jù)和10分鐘前的監(jiān)測數(shù)據(jù)加入原始數(shù)據(jù)作為新的特征。在歷史變化率方面,將本次監(jiān)測數(shù)據(jù)與5分鐘前監(jiān)測數(shù)據(jù)的差值以及5分鐘前監(jiān)測數(shù)據(jù)與10分鐘前監(jiān)測數(shù)據(jù)的差值作為新的特征加入原始數(shù)據(jù)。經(jīng)過處理,得到數(shù)據(jù)特征維度為265維。加入這兩類特征使得故障數(shù)據(jù)本身具備一定的時(shí)間序列特性,可描述故障產(chǎn)生的過程,使得數(shù)據(jù)對故障的描述更加完備。

3 算法模型

目前,雷達(dá)系統(tǒng)故障診斷方法是支持向量機(jī)算法[12],但其存在3點(diǎn)不足:處理多分類問題較為困難、在大規(guī)模樣本上訓(xùn)練困難、對參數(shù)和核函數(shù)的選擇十分敏感。同時(shí),單分類器的預(yù)測精度往往存在瓶頸,很難達(dá)到令人滿意的準(zhǔn)確率。針對如上問題,本文在雷達(dá)伺服系統(tǒng)故障診斷領(lǐng)域中提出一種新模型:結(jié)合XGBoost、隨機(jī)森林和BP神經(jīng)網(wǎng)絡(luò)的Stacking模型。該模型充分吸收了3種模型的優(yōu)點(diǎn),通過集成算法將這3種模型相結(jié)合,預(yù)測精度得到了大幅提升。

3.1 基分類器

極限梯度提升樹(eXtreme Gradient Boosting, Xgboost)、隨機(jī)森林(Random Forest,RF)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)都是十分優(yōu)秀的機(jī)器學(xué)習(xí)模型,在工程實(shí)踐中獲得了廣泛應(yīng)用。本文將這3種模型作為最終基分類器。

XGBoost算法是梯度提升樹算法(Gradient Boosting Decision Tree,GBDT)的一種高效實(shí)現(xiàn),是Boosting算法的一種,其基學(xué)習(xí)器通常為分類回歸樹(Classification and Regression Tree,CART),基本思想是將多個(gè)CART樹的預(yù)測結(jié)果相加作為最終預(yù)測結(jié)果。該算法支持并行計(jì)算,模型預(yù)測準(zhǔn)確率高[13-14]。

隨機(jī)森林算法是一種常用的Bagging模型。該算法采用自助采樣方法從原始數(shù)據(jù)中抽取多個(gè)Bootstrap樣本,然后分別對每個(gè)Bootstrap樣本構(gòu)建決策樹,最終預(yù)測結(jié)果為各決策樹的預(yù)測均值。該算法不需要特征選擇、訓(xùn)練速度快、可實(shí)現(xiàn)并行計(jì)算、泛化性能好[15-16]。

BP神經(jīng)網(wǎng)絡(luò)[17]是一種多層前饋神經(jīng)網(wǎng)絡(luò),一般由輸入層、隱含層、輸出層構(gòu)成,其基本原理是通過梯度搜索技術(shù)使得模型預(yù)測值和實(shí)際值誤差最小。該算法非線性映射能力強(qiáng),具有高度的自學(xué)習(xí)和自適應(yīng)能力[17]。

3.2 模型集成

集成算法是一種非常強(qiáng)大的機(jī)器學(xué)習(xí)方法,該方法將幾種機(jī)器學(xué)習(xí)算法組合成一個(gè)元算法以獲得縮小方差、降低偏差或改進(jìn)預(yù)測的效果。集成算法主要分為3類:Boosting、Bagging和Stacking。考慮到Stacking方法在改進(jìn)預(yù)測準(zhǔn)確率方面表現(xiàn)優(yōu)異[18],本文采用該方法進(jìn)行算法集成。該算法共有兩層,第一層將故障樣本訓(xùn)練數(shù)據(jù)分成5份,使用每一種基模型對數(shù)據(jù)集進(jìn)行5折交叉驗(yàn)證,第二層利用第一層的預(yù)測結(jié)果作為訓(xùn)練數(shù)據(jù),繼續(xù)進(jìn)行訓(xùn)練,得到最終結(jié)果。

以XGBoost模型為例,將雷達(dá)伺服系統(tǒng)歷史故障檢測數(shù)據(jù)中的訓(xùn)練集切分為5份,分別選擇1份作為測試集,其余4份作為訓(xùn)練集,共得到5份訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。對于這5份數(shù)據(jù),訓(xùn)練5個(gè)不同的XGBoost模型,使用5個(gè)同類模型分別預(yù)測對應(yīng)的測試集并得到對應(yīng)的預(yù)測結(jié)果,再將這5份預(yù)測結(jié)果合并在一起得到訓(xùn)練集完整的預(yù)測結(jié)果。在測試集上,分別使用5個(gè)已經(jīng)訓(xùn)練好的XGBoost模型進(jìn)行預(yù)測,通過投票選出最終預(yù)測結(jié)果。同理,隨機(jī)森林和神經(jīng)網(wǎng)絡(luò)兩種基模型也使用同樣的步驟訓(xùn)練模型。最終將3種模型的預(yù)測結(jié)果合并,將最終合并結(jié)果作為第二層模型的特征。集成模型如圖1所示。

對于第二層輸入而言,其輸入特征發(fā)生了變化,不再是原始數(shù)據(jù)特征,而是第一層3種模型預(yù)測結(jié)果的合并數(shù)據(jù)??紤]到邏輯回歸模型(Logistics Regression,LR)具有計(jì)算代價(jià)小和魯棒性好等優(yōu)點(diǎn)[19],本文在Stacking算法的第二層采用邏輯回歸模型繼續(xù)進(jìn)行訓(xùn)練。當(dāng)Stacking集成模型的兩層模型都訓(xùn)練完畢時(shí),可得到最終預(yù)測模型。

4 實(shí)例分析

基于2016年5月-2019年7月某所某型雷達(dá)伺服系統(tǒng)歷史監(jiān)測數(shù)據(jù)中的故障數(shù)據(jù),采用本文提出的故障診斷算法進(jìn)行處理。其中,XGBoost模型使用Python的機(jī)器學(xué)習(xí)庫XGBoost[20]加以實(shí)現(xiàn),隨機(jī)森林模型、BP神經(jīng)網(wǎng)絡(luò)模型和邏輯回歸模型都是通過TensorFlow實(shí)現(xiàn)[21]。故障診斷具體流程如圖2所示。

某所某型雷達(dá)伺服系統(tǒng)共計(jì)有53個(gè)監(jiān)測點(diǎn),記錄間隔為5分鐘。某型雷達(dá)的測試點(diǎn)分布在4個(gè)區(qū)域,分別為天線控制單元、雷達(dá)驅(qū)動(dòng)單元、時(shí)序控制單元和軸角編碼器。其中,天線控制單元有14個(gè)測試點(diǎn),天線驅(qū)動(dòng)單元有11個(gè)測試點(diǎn),時(shí)序控制單元有19個(gè)測試點(diǎn),軸角編碼器有9個(gè)測試點(diǎn)。故障類別如表1所示。

首先使用孤立森林算法對原始數(shù)據(jù)進(jìn)行異常點(diǎn)檢測并去除異常值,然后將該故障數(shù)據(jù)前5分鐘和前10分鐘53個(gè)測點(diǎn)的數(shù)據(jù)及其對應(yīng)的歷史差值和原始數(shù)據(jù)合并,初步構(gòu)造出265個(gè)特征。使用卡方檢驗(yàn)進(jìn)行特征選擇,選擇出相關(guān)性較高的200個(gè)測點(diǎn)數(shù)據(jù)構(gòu)成最終特征輸入。由于本次樣本數(shù)據(jù)中F6和F10的故障數(shù)據(jù)相對較少,因而使用SMOTE算法對這兩類樣本進(jìn)行數(shù)據(jù)擴(kuò)充。最后,使用集成模型進(jìn)行訓(xùn)練。模型最終準(zhǔn)確率對比如表2所示。

通過比較可以得出本文方法準(zhǔn)確率最高,在測試集上的預(yù)測準(zhǔn)確率達(dá)到了96.2%,能夠很好地完成雷達(dá)伺服系統(tǒng)故障診斷任務(wù)。

5 結(jié)語

本文利用雷達(dá)伺服系統(tǒng)的歷史監(jiān)測數(shù)據(jù)進(jìn)行故障診斷方法研究,對比了不同算法模型的表現(xiàn),提出了基于XGBoost、隨機(jī)森林和BP神經(jīng)網(wǎng)絡(luò)這3種基學(xué)習(xí)器的Stacking模型。該模型充分吸收了3個(gè)基學(xué)習(xí)器的優(yōu)點(diǎn),準(zhǔn)確率高于其它主流算法模型。同時(shí),本文在數(shù)據(jù)預(yù)處理方面提出了一種新穎有效的方法,將數(shù)據(jù)歷史值和歷史差值作為新的特征加入數(shù)據(jù)集中,給數(shù)據(jù)加入了時(shí)序特性,改善了故障數(shù)據(jù)特征表述單一和對故障數(shù)據(jù)質(zhì)量要求過高的問題。實(shí)驗(yàn)結(jié)果表明,本文故障診斷方法診斷準(zhǔn)確率達(dá)到了96.2%,高于其它主流模型,具備很好的應(yīng)用價(jià)值。下一步將通過增加基學(xué)習(xí)器種類和集成模型層數(shù),驗(yàn)證能否得到更好的診斷結(jié)果。

參考文獻(xiàn):

[1] 聶成,蔡宏,李力. CINRAD/SA天氣雷達(dá)伺服系統(tǒng)工作原理與典型故障及處理方法[J]. 氣象水文海洋儀器,2018,35(1):76-79.

[2] 薛松,劉濤. 基于IRN神經(jīng)網(wǎng)絡(luò)的雷達(dá)天線伺服系統(tǒng)故障診斷[J]. 電子機(jī)械工程,2018,34(6):55-59.

[3] 徐頌捷,何建新,黎志波,等. 基于天氣雷達(dá)標(biāo)準(zhǔn)輸出控制器的故障診斷方法研究[J]. 成都信息工程大學(xué)學(xué)報(bào),2019,34(3):257-262.

[4] 劉洋,華璧辰,張侃健,等. 基于優(yōu)化AdaBoost-SVM的模擬電路故障診斷[J]. 軟件導(dǎo)刊,2019,18(10):130-134,139.

[5] CERRADA M,ZURITA G,CABRERA D,et al. Fault diagnosis in spur gears based on genetic algorithm and random forest[J]. Mechanical Systems and Signal Processing, 2016,70: 87-103.

[6] 錢力揚(yáng). 基于隨機(jī)森林和XGBoost的大型風(fēng)力機(jī)故障診斷方法研究[D]. 杭州:浙江大學(xué),2018.

[7] 祝永晉,馬吉科,季聰. 基于多判據(jù)融合的用電信息采集系統(tǒng)異常數(shù)據(jù)甄別模型[J]. 廣東電力,2019,32(9):184-192.

[8] SCHERMAN M,BüLOW J.Insider threat detection using isolation forest[Z]. 2018.

[9] LI J,CHENG K,WANG S,et al. Feature selection: a data perspective[J]. ACM Computing Surveys (CSUR),2018,50(6): 94.

[10] SHARPE D. Your chi-square test is statistically significant: now what?[J]. ?Practical Assessment, Research & Evaluation,2015,20:10.

[11] FERNáNDEZ A,GARCIA S,HERRERA F,et al. SMOTE for learning from imbalanced data: progress and challenges, marking the 15-year anniversary[J]. Journal of Artificial Intelligence Research, 2018, 61: 863-905.

[12] YIN Z,HOU J. Recent advances on SVM based fault diagnosis and process monitoring in complicated industrial processes[J]. Neurocomputing,2016,174: 643-650.

[13] 孫琛,田曉聲. 基于XGBOOST算法的變壓器故障診斷[J]. 佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,37(3):378-380.

[14] LEI Y F, JIANG W L, JIANG A Q,et al. Fault diagnosis method for hydraulic directional valves integrating PCA and XGBoost[J]. Processes, 2019,7(9): 589.

[15] 王子蘭,楊瑞. 基于隨機(jī)森林算法的旋轉(zhuǎn)機(jī)械齒輪組故障診斷[J]. 山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,38(5):104-112.

[16] LI C,SANCHEZ R V,ZURITA G,et al. Gearbox fault diagnosis based on deep random forest fusion of acoustic and vibratory signals[J]. Mechanical Systems and Signal Processing,2016,76:283-293.

[17] 顧彬,汪柯穎,沈東,等. 基于BP神經(jīng)網(wǎng)絡(luò)的模擬電路診斷[J]. 科技創(chuàng)新與應(yīng)用,2019(31):57-58.

[18] 包志強(qiáng),胡嘯天,趙媛媛,等. 基于熵權(quán)法的Stacking算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2019,40(10):2885-2890.

[19] YALCIN A, REIS S, AYDINOGLU A C,et al. A GIS-based comparative study of frequency ratio, analytical hierarchy process, bivariate statistics and logistics regression methods for landslide susceptibility mapping in Trabzon, NE Turkey[J]. Catena,2011,85(3): 274-287.

[20] CHEN T,GUESTRIN C. Xgboost: A scalable tree boosting system[C]. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM,2016:785-794.

[21] ABADI M,AGARWAL A,BARHAM P,et al. Tensorflow: large-scale machine learning on heterogeneous distributed systems[DB/OL]. https://arxiv.org/pdf/1603.04467v1.pdf.

(責(zé)任編輯:孫 娟)

猜你喜歡
異常檢測故障診斷
凍干機(jī)常見故障診斷與維修
基于量子萬有引力搜索的SVM自駕故障診斷
因果圖定性分析法及其在故障診斷中的應(yīng)用
基于LCD和排列熵的滾動(dòng)軸承故障診斷
基于WPD-HHT的滾動(dòng)軸承故障診斷
高速泵的故障診斷
灯塔市| 大厂| 浦北县| 永德县| 府谷县| 德令哈市| 富宁县| 双牌县| 鄂托克前旗| 长海县| 尖扎县| 丹东市| 钟祥市| 壶关县| 安阳市| 柏乡县| 兰考县| 达日县| 新竹市| 合水县| 阿瓦提县| 同德县| 和政县| 哈密市| 英吉沙县| 藁城市| 大名县| 军事| 平原县| 津南区| 仁布县| 临朐县| 泊头市| 乐安县| 曲周县| 全南县| 定西市| 高邮市| 睢宁县| 衢州市| 尤溪县|