国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多傳感器數(shù)據(jù)融合的復(fù)雜系統(tǒng)退化模式挖掘

2022-07-14 13:19:16彭宅銘程龍生姚啟峰
振動與沖擊 2022年13期
關(guān)鍵詞:聚類距離樣本

彭宅銘, 程龍生, 姚啟峰

(1.江蘇科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,江蘇 鎮(zhèn)江 212100;2.南京理工大學(xué) 經(jīng)濟(jì)管理學(xué)院,南京 210094)

隨著復(fù)雜性、綜合性和智能化水平的日益提升,現(xiàn)代裝備系統(tǒng)逐漸發(fā)展成為具有更長壽命和更高可靠性的大規(guī)模復(fù)雜系統(tǒng)。由于系統(tǒng)結(jié)構(gòu)復(fù)雜,各功能模塊相互作用、相互依賴,關(guān)鍵部件的故障可能導(dǎo)致整個系統(tǒng)停止運(yùn)行,給用戶帶來巨大的經(jīng)濟(jì)損失。復(fù)雜系統(tǒng)故障預(yù)測與健康管理(prognostics and health management, PHM)技術(shù)就是針對大型高價值復(fù)雜系統(tǒng)的自主保障、自主診斷的要求提出來的,該技術(shù)可利用先進(jìn)的傳感器獲取系統(tǒng)運(yùn)行狀態(tài)信息,借助智能推理算法,實(shí)現(xiàn)系統(tǒng)狀態(tài)的分析與監(jiān)控、診斷與預(yù)測評估,對降低系統(tǒng)的維修成本、提高安全性與可靠性具有重要的意義[1]。退化模式挖掘是PHM技術(shù)的主要內(nèi)容之一,該技術(shù)基于裝備或系統(tǒng)的歷史數(shù)據(jù)來構(gòu)建狀態(tài)評估模型,以此掌握不同環(huán)境下系統(tǒng)退化或降級的規(guī)律,挖掘可能存在的退化或降級模式,搭建全面的系統(tǒng)退化模式庫。由于歷史數(shù)據(jù)往往呈現(xiàn)時序性、高維性、復(fù)雜性、高噪聲等特性,如果將其直接用于退化模式挖掘,不但在儲存和計算上要花費(fèi)高昂代價,而且可能會影響算法的準(zhǔn)確性和可靠性。因此,有效的建立退化模式的方法就是對歷史數(shù)據(jù)進(jìn)行時間序列數(shù)據(jù)挖掘[2]。一方面,在降維或融合算法的基礎(chǔ)上構(gòu)建健康狀態(tài)評估模型,以健康指數(shù)(health indicator,HI)曲線刻畫系統(tǒng)的變化趨勢;另一方面,利用時間序列聚類算法開展退化模式挖掘研究,探索不同的衰退模式。

復(fù)雜系統(tǒng)健康狀態(tài)評估方法層出不窮,從HI構(gòu)建的策略可以分為基于物理特征的健康指數(shù)(physics HI,PHI)方法和基于融合特征的健康指數(shù)(fusion HI,F(xiàn)HI)方法兩類[3]。PHI方法主要使用統(tǒng)計方法或信號處理技術(shù)從監(jiān)測信號中提取物理特征作為監(jiān)測指標(biāo),如均方根、峰值、頻譜特征和能量等。但這些PHI僅對特定性能退化階段中特定故障敏感,無法滿足系統(tǒng)全面健康狀態(tài)監(jiān)測的敏感性和穩(wěn)定性。于是,在此基礎(chǔ)上開發(fā)出了FHI方法,通過融合多個PHI或多傳感器信號來構(gòu)造表征系統(tǒng)健康狀態(tài)和退化程度的參數(shù)。主成分分析法(PCA)能夠在減少特征維數(shù)的同時保留盡可能多的信息,在FHI方法中也得到了大量的應(yīng)用[4-6]。但是,PCA選擇的主成分的物理特性往往難以解釋。此外,特征融合方法,如神經(jīng)網(wǎng)絡(luò)[7]、遺傳算法[8]、隱馬爾可夫模型[9]、支持向量機(jī)[10]等方法也被廣泛使用到FHI的構(gòu)建中。這些算法的實(shí)用性在實(shí)踐中都得到了驗(yàn)證,但無法描述特征對系統(tǒng)故障的敏感性和重要程度。馬氏距離(Mahalanobis distance,MD)作為一種無量綱、尺度化的協(xié)方差距離,能夠量化不同類別數(shù)據(jù)之間的差異,在構(gòu)建FHI時表現(xiàn)出了較為理想的效果[11-12]。馬田系統(tǒng)(Mahalanobis-Taguchi system,MTS)方法[13]是Taguchi提出的一種結(jié)合MD和質(zhì)量工程學(xué)的多維模式識別方法,該算法可以在使用較小的樣本量且沒有任何先驗(yàn)信息的情況下,輕松地測量數(shù)據(jù)的異常程度并提供準(zhǔn)確的結(jié)果。相比其它的特征融合算法,MTS不僅使用MD將所有相關(guān)信息融合為一個度量標(biāo)準(zhǔn),而且能夠識別出對故障信息敏感的特征。因此,MTS成為了當(dāng)前部件或系統(tǒng)PHM的有效工具之一[14-15]。

時間序列聚類算法的主要過程是距離度量和聚類。在距離度量過程中,可選擇多種不同的距離度量方法,如MD、歐式距離(Euclidean distance,ED)和動態(tài)時間彎曲(dynamic time warping,DTW)距離等[16]。相比MD和ED,DTW克服了點(diǎn)對點(diǎn)的缺陷,通過彎曲時間來測量長度不等的時間序列數(shù)據(jù),能夠?qū)崿F(xiàn)數(shù)據(jù)點(diǎn)一對多匹配。因此,這種距離度量對時間偏差和幅度改變具有更強(qiáng)的穩(wěn)健性[17]。在聚類算法選擇上,層次聚類算法不僅不需要預(yù)先制定聚類數(shù),而且能通過聚類結(jié)果準(zhǔn)確描述整個聚類過程。因此,可利用DTW距離和層次聚類算法有效地挖掘滾動軸承的衰退模式[18]。

基于此,本文提出一種基于多傳感器數(shù)據(jù)融合方法的復(fù)雜系統(tǒng)退化模式挖掘方法,通過改進(jìn)MTS算法構(gòu)建融合健康指數(shù),利用分段點(diǎn)分析方法和基于DTW的層次聚類算法挖掘系統(tǒng)的不同退化模式,并利用航空發(fā)動機(jī)實(shí)例來驗(yàn)證所提方法的有效性。該方法充分利用現(xiàn)有系統(tǒng)全壽命周期數(shù)據(jù),對系統(tǒng)衰退模式進(jìn)行挖掘,為系統(tǒng)在線監(jiān)測和剩余壽命預(yù)測提供依據(jù),具有一定的理論價值和應(yīng)用價值。

1 多傳感器特征融合技術(shù)

復(fù)雜系統(tǒng)不同部件(或子系統(tǒng))的傳感器數(shù)據(jù)能夠真實(shí)反映其性能狀態(tài),是其健康評估的基礎(chǔ)。隨著系統(tǒng)復(fù)雜程度的不斷提升,數(shù)據(jù)維度也成倍增長,為在線評估和預(yù)測帶來了挑戰(zhàn)。根據(jù)PHM的內(nèi)容,在對復(fù)雜系統(tǒng)進(jìn)行健康狀態(tài)評估前,需要通過數(shù)據(jù)采集、特征提取和特征選擇等過程來提取有利故障特征,構(gòu)建評估矩陣,基于評估矩陣構(gòu)建健康狀態(tài)評估模型,以此來量化評估系統(tǒng)的健康水平。

MTS將MD與質(zhì)量工程學(xué)中的正交表(OA)和信噪比(SNR)相結(jié)合,實(shí)現(xiàn)多維特征的篩選和融合。同時,得到的MD是一種協(xié)方差距離,可以通過計算樣本與樣本集“重心”的最近距離來量化兩個樣本的差異。但是,在實(shí)際操作中MTS方法也存在明顯不足:在基準(zhǔn)空間優(yōu)化時利用OA和SNR篩選的特征子集未必是最好的[19]。為此,本文提出改進(jìn)MTS(improved MTS,IMTS)算法,并將其運(yùn)用到多傳感器數(shù)據(jù)的降維和融合中,以此來構(gòu)建FHI。

1.1 基于IMTS的退化參數(shù)篩選與融合

基于IMTS的退化參數(shù)篩選與融合過程主要有四個階段,具體如下:

階段1基準(zhǔn)空間(MS)構(gòu)建

該階段是IMTS的基礎(chǔ),需要從連續(xù)的時間序列數(shù)據(jù)中區(qū)分出“正常樣本”和“異常樣本”,確定“正常樣本”和計算MD值。

(1) 按照性能參數(shù)的退化程度進(jìn)行樣本選擇,早期的T0個監(jiān)測數(shù)據(jù)作為“正常樣本”,末期T1監(jiān)測數(shù)據(jù)作為“異常樣本”;

(2) 計算“正常樣本”的MD值。設(shè)xi(i=1,2,…,n)為n個包含p個變量的樣品,xi=(xi1,xi2,…,xip),xij為第i個樣本的第j個變量的觀測值,則第i個樣品的馬氏距離平方(簡稱馬氏距離)為

(1)

階段2基準(zhǔn)空間有效性驗(yàn)證

在基準(zhǔn)空間優(yōu)化之前要對上一階段構(gòu)建的基準(zhǔn)空間的有效性進(jìn)行驗(yàn)證。

階段3基準(zhǔn)空間優(yōu)化

Taguchi認(rèn)為并非所有的特征對分類都有貢獻(xiàn),有些變量可能會產(chǎn)生冗余信息、增加計算的成本和復(fù)雜度,因此,需要對原始變量進(jìn)行篩選,挑選出其中的重要特征作為分類依據(jù)。

ReliefF算法是Kononenko[20]于1994年提出的基于特征權(quán)重的特征選擇算法。通過搜索當(dāng)前樣本的各種近鄰,綜合計算特征權(quán)重,將權(quán)重小于閾值的特征移除,以選擇最優(yōu)特征子集。該算法計算簡單,易于理解,在分類問題的特征選擇中具有獨(dú)特優(yōu)勢。為此,本文使用ReliefF算法代替OAs和SNR方法優(yōu)化基準(zhǔn)空間。但是,在實(shí)際運(yùn)用中發(fā)現(xiàn),利用ReliefF算法選擇的特征之間可能存在高相關(guān)性,出現(xiàn)特征冗余,導(dǎo)致式(1)中的S不可逆,使得MD值無法計算。因此,如果能在進(jìn)行ReliefF選擇之前消除特征之間的相關(guān)性,將會有效地解決此類問題。基于以上的理論和實(shí)踐,提出基于相關(guān)性聚類和ReliefF算法的兩階段特征選擇算法來優(yōu)化基準(zhǔn)空間,具體步驟如下:

(4) 分別計算特征之間相關(guān)性系數(shù)的絕對值rij,得到相關(guān)系數(shù)矩陣r;

(5) 根據(jù)r進(jìn)行特征聚類,將特征相關(guān)性大于閾值δ1的特征聚為一類,得到k類特征子集;

(6) 利用ReliefF算法計算所有特征的權(quán)重Wj并選擇每一類中權(quán)重最大的特征構(gòu)成特征子集FS1;

在上述過程中,步驟(5)和(6)利用相關(guān)系數(shù)聚類,可以消除特征集的高冗余性。本文選取Person相關(guān)系數(shù),當(dāng)其絕對值在0.8以上,認(rèn)為特征間有強(qiáng)的相關(guān)性。因此,本文δ1選擇在0.8~1.0之間。步驟(8)中的Sp類似于PCA中的累計貢獻(xiàn)率,當(dāng)Sp>δ2時可認(rèn)為選擇的特征子集可以解釋原有的特征集,類似地,本文取δ2在0.85~1.0之間。

階段4樣本馬氏距離計算

優(yōu)化后的基準(zhǔn)空間中包含初始特征集中的重要特征,可以利用其計算各樣本的MD值。

(9) 利用優(yōu)化后的基準(zhǔn)空間計算樣本的MD值:

(2)

以上的IMTS方法操作簡單,在降維時保持了特征集的分類能力,大大降低算法的復(fù)雜度。另外,利用該算法計算出的MD也是一種有效的刻畫樣本差異性的工具,可以作為表征系統(tǒng)性能狀態(tài)的參數(shù)。

1.2 基于優(yōu)化MD的健康指數(shù)構(gòu)建

單一時刻的MD只能刻畫系統(tǒng)偏離正常狀態(tài)的程度,不能很好的反映該系統(tǒng)的健康狀態(tài)變化過程,因此需要結(jié)合時間信息來獲取相應(yīng)的MD時間序列,以此來描述系統(tǒng)的退化過程及隨時間偏移的程度。事實(shí)上,系統(tǒng)的健康狀態(tài)遵循單調(diào)性原則,即如果沒有進(jìn)行人工干預(yù)(例如維修),系統(tǒng)的健康狀態(tài)不會隨時間推移而改善,也不會突然出現(xiàn)大幅度下降(例如,從90%突然降到20%)。因此,需要根據(jù)單調(diào)性原則來計算HI,從而可以準(zhǔn)確反映系統(tǒng)健康狀況。

(3)

式中,OMDmin和OMDmax分別為系統(tǒng)全壽命周期樣本計算的OMDi的最小值和最大值。

由式(3)可知,HIi∈[0,1],且單調(diào)遞減,值越大,系統(tǒng)越健康。系統(tǒng)整個壽命周期的HI曲線會呈現(xiàn)明顯的變化趨勢(如圖1)。在整個過程中,曲線斜率均為負(fù)值,當(dāng)系統(tǒng)處于穩(wěn)定階段時,曲線趨近于直線,而當(dāng)系統(tǒng)逐漸退化,到達(dá)一定的閾值之后,曲線的斜率不斷減小,直到HIi趨近于0。因此,通過以上方法定義的健康指數(shù)將有利于退化分段點(diǎn)確定。

圖1 分段性能退化過程Fig.1 Piecewise performance degradation process

2 DTW層次聚類退化模式挖掘

2.1 退化分段點(diǎn)確定

假設(shè)某一系統(tǒng)全壽命周期共存在n個循環(huán),其HI值記為H={h1,h2,…,hn},對應(yīng)的HI曲線圖如圖1所示。根據(jù)第1.2節(jié)的定義可知,HI存在圖1中的退化分段點(diǎn),該分段點(diǎn)的確定對于退化模式挖掘具有重要價值。

CUSUM(cumulative sum)算法是一種序貫分析技術(shù),可以通過累積作用,將退化過程中的微小波動通過累計偏差反映出來,從而可以準(zhǔn)確檢測出退化分段點(diǎn)。CUSUM算法步驟如下:

(2) 令S0=0,計算累計和Sj:

(4)

(3) 尋找累積和Sj的極值點(diǎn),即為退化分段點(diǎn)。

2.2 退化模式庫構(gòu)建

通過計算訓(xùn)練集樣本的健康指數(shù),建立健康指數(shù)曲線集合C={C1,C2,…,CN}。這些曲線記錄了同一類型設(shè)備在不同環(huán)境中的運(yùn)行狀態(tài),雖然各不相同,但存在具有類似退化趨勢的樣本。因此,有必要對健康指數(shù)曲線進(jìn)行聚類分析,構(gòu)建退化模式庫。

DTW距離在計算時不要求兩條時間序列具有相等的長度,可實(shí)現(xiàn)異步相似性比較,同時,對異常點(diǎn)不敏感。因此,DTW距離可以很好的作為健康指數(shù)曲線相似性度量的標(biāo)準(zhǔn)。層次聚類算法不需要預(yù)先設(shè)定聚類數(shù),通過計算數(shù)據(jù)集樣本間的相似性,不斷的將相似性最高的樣本合并構(gòu)成新的集群,直到所有樣本聚為一類。該算法的優(yōu)勢就在于可以表征聚類的全過程,同時可以清楚地知道各類之間的距離關(guān)系。為此,本文將利用DTW距離度量的層次聚類算法來挖掘系統(tǒng)的退化模式。具體步驟如下:

(1) 利用CUSUM算法確定N個健康指數(shù)曲線的分段點(diǎn),并將退化階段的健康指數(shù)曲線構(gòu)成退化曲線集合D={D1,D2,…,DN};

(2) 將單個退化曲線Di視為一類,計算Di和Dj之間的DTW距離dij,得到初始距離矩陣;

(3) 將初始距離矩陣中距離值及對應(yīng)的退化曲線存放在數(shù)組DS={(Di,Dj,dij)|1≤i

(4) 將DS中dij最小的值對應(yīng)的兩條退化曲線合并為一類,形成新的聚類;

(5) 從DS中刪除對應(yīng)的類和距離值,計算新聚類與其它類之間的距離,更新距離矩陣;

(6) 重復(fù)步驟(3)~(5),直到全部聚為一類;

(7) 根據(jù)設(shè)定的終止條件確定聚類數(shù)目k和聚類結(jié)果。

為更好地刻畫新的聚類與其它類之間的特征,將新的聚類中所有樣本到其它類之間距離的平均值作為類間距離。由于層次聚類的最終結(jié)果不是單一聚類,而是一個聚類層次,選擇不同的終止條件將產(chǎn)生不同聚類數(shù)目。因此,選擇一個合適的終止條件對聚類的結(jié)果有很大的影響。本文將根據(jù)類內(nèi)相似度和退化時間區(qū)間確定不同類之間的閾值。

3.3 基于相似度的退化模式識別

基于相似度的退化模式識別的基本思想是找到與測試樣本具有最高相似性的退化模式。對待測樣本Y=[y1,y2,…,ym]T,yi=(yi1,yi2,…,yip)為第i個周期的特征數(shù)據(jù),其退化模式識別步驟和流程如下:

(1) 利用IMTS優(yōu)化的基準(zhǔn)空間計算待測樣本從開始運(yùn)行到當(dāng)前周期的MD值和MD累計和OMDi;

(2) 利用式(3)計算各時刻的健康指數(shù)HIi,得到HY=[HI1,HI2,…,HIm]T,其中OMDmin和OMDmax使用退化模式庫中各模式樣本的OMDmin最小值和OMDmax最大值;

(3) 根據(jù)退化模式庫中的退化閾值確定Y的退化曲線DY;

(4) 計算DY與各退化模式Ci的相似度:

(5)

式中:Sim(Ci,j)為DY與Ci中每一條退化曲線D(j)的DTW距離;ni為模式Ci中退化曲線個數(shù)。

(5) 根據(jù)SIM(Ci)值和退化模式Ci的退化時間區(qū)間來確定Y所屬的退化模式。模式Ci的退化時間區(qū)間定義為DTCi=[min(TCi),max(TCi)],其中TCi為模式Ci中樣本的退化時間,min(TCi)和max(TCi)分別為模式Ci中樣本退化時間的最小值和最大值。假設(shè)測試樣本Y所經(jīng)歷的退化時間為T,DY與模式Ci的相似度為SIM(Ci),i=1,2,…,l,將其按照從小到大排序?yàn)椋篠IM(Ck1)

①若T∈DTCk1,則Y屬于模式Ck1;

②若T?DTCk1,則Y不屬于模式Ck1,進(jìn)而判斷T是否在DTCk2,若T∈DTCk2,則Y屬于模式Ck2;以此類推,直到T在某一模式的退化時間區(qū)間內(nèi),則將其歸為該類模式。

③若T不是任何一種模式的退化時間區(qū)間內(nèi),則將Y單獨(dú)作為一類新的退化模式。

退化模式庫的構(gòu)建是一個不斷學(xué)習(xí)的過程,在確定某樣本的退化模式后,可將其加入相應(yīng)的退化模式,更新模式庫,以便更準(zhǔn)確識別其他測試樣本。退化模式識別的具體流程如圖2所示。

圖2 退化模式識別流程Fig.2 Flowchart of degradation pattern recognition

3 實(shí)驗(yàn)與分析

航空發(fā)動機(jī)是一個復(fù)雜的機(jī)電液磁耦合系統(tǒng),其性能退化并不決定于某一個變量的退化,而是多個狀態(tài)變量動態(tài)變化且相互耦合的結(jié)果,如溫度、電壓、振動等,所以必須充分利用多個傳感器的特征參數(shù),從中提取能體現(xiàn)系統(tǒng)退化特性的特征參數(shù),才能準(zhǔn)確了解航空發(fā)電機(jī)的退化狀態(tài)。本文對美國國家航空航天局(NASA)提供的航空發(fā)動機(jī)全壽命周期退化仿真數(shù)據(jù)進(jìn)行分析,該仿真數(shù)據(jù)是借助商用模塊化航空推進(jìn)器軟件(C-MPASS)獲得的。通過改變輸入?yún)?shù)模擬風(fēng)扇、高壓渦輪、低壓渦輪、高壓壓氣機(jī)和低壓壓氣機(jī)的故障和性能退化過程,利用傳感器記錄反映航空發(fā)動機(jī)運(yùn)行狀況的21個監(jiān)測參數(shù),其中包括低壓壓縮機(jī)出口溫度(T24)、高壓壓縮機(jī)入口溫度(T30)、高壓壓縮機(jī)出口壓力(P30)、風(fēng)扇物理轉(zhuǎn)速(Nf)、核心機(jī)轉(zhuǎn)速(NRc)、涵道比(BPR)、高壓渦輪冷卻引氣流量(W31)、低壓渦輪冷卻引氣流量(W32)和引氣焓值(htBleed)等[21]。不同性能監(jiān)測參數(shù)與航空發(fā)動機(jī)的退化狀態(tài)有不同的相關(guān)性,根據(jù)訓(xùn)練集所有參數(shù)的散點(diǎn)圖和局部加權(quán)回歸(LOESS)散點(diǎn)平滑法選擇有明顯變化趨勢的14 個參數(shù)構(gòu)建航空發(fā)動機(jī)的狀態(tài)矩陣。

本文選取FD001數(shù)據(jù)集,該數(shù)據(jù)集包含100個訓(xùn)練集樣本,可作為歷史數(shù)據(jù)進(jìn)行退化模式挖掘。為驗(yàn)證方法的有效性和穩(wěn)定性,利用5折交叉驗(yàn)證,隨機(jī)選擇其中的80個樣本作為測試集,剩余20個樣本作為測試集。以其中的一次交叉驗(yàn)證為例,介紹退化模式挖掘的流程,具體如下:

首先利用IMTS對歷史樣本數(shù)據(jù)進(jìn)行分析,篩選對退化有利的特征。為消除發(fā)動機(jī)初期不穩(wěn)定帶來的影響,選取訓(xùn)練集中發(fā)動機(jī)的第6-10個周期飛行的數(shù)據(jù)作為正常樣本,最終運(yùn)行的5個周期飛行的數(shù)據(jù)作為異常樣本,各包含500個樣本。選擇有變化趨勢的參數(shù)構(gòu)建航空發(fā)動機(jī)的評估矩陣?;鶞?zhǔn)空間有效性驗(yàn)證結(jié)果顯示,超過98.8%的正常樣本的MD值小于異常樣本的MD值的最小值,說明所建立的基準(zhǔn)空間是有效的。利用特征之間的相關(guān)性,按照第1.1節(jié)進(jìn)行特征聚類,取δ1=0.9。利用ReliefF算法計算特征的權(quán)重,并選擇每一類中權(quán)重最大的特征構(gòu)建特征子集,得到9個特征,將其按照標(biāo)準(zhǔn)化權(quán)重從大到小的順序排列,如圖3所示。

圖3 特征的權(quán)重占比Fig.3 The weight ratio of each feature

由圖可知,前6個特征的累積權(quán)重已經(jīng)達(dá)到了93%,因此,選擇NRc、T24、W31、P30、BPR、Nf構(gòu)建優(yōu)化基準(zhǔn)空間。

分別計算訓(xùn)練集樣本的全壽命周期的MD值和HI。利用CUSUM方法獲取每個編號發(fā)動機(jī)的退化分段點(diǎn)和退化曲線。結(jié)果顯示,航空發(fā)動機(jī)的退化閾值HIi0集中在0.6~0.9之間。結(jié)合航空發(fā)動機(jī)退化特性,取平均值HI0=0.745 0作為該類型發(fā)動機(jī)的退化閾值,即當(dāng)健康指數(shù)大于0.745 0時,發(fā)動機(jī)緩慢退化,處于穩(wěn)定階段;當(dāng)健康指數(shù)小于0.745 0時,發(fā)動機(jī)加速退化,處于退化階段,直至完全失效。

根據(jù)退化閾值和健康指數(shù)曲線,確定發(fā)動機(jī)的退化曲線,如圖4所示。

圖4 發(fā)動機(jī)退化曲線圖Fig.4 Degradation curve of engines

按照DTW層次聚類的步驟,得到如圖5所示的聚類譜系圖。聚類數(shù)目的選取對模式識別的準(zhǔn)確率具有重要意義,本文基于以下三個原則來確定最佳聚類數(shù)目:①保證各類樣本具有較高的類內(nèi)相似性;②要求各退化模式得到的退化時間區(qū)間盡量不重疊;③各模式樣本退化時間在剩余壽命預(yù)測允許的正向和負(fù)向預(yù)測誤差(10和-13)內(nèi)。經(jīng)過多次試驗(yàn),選擇類內(nèi)相似度閾值為85%,最終選擇聚類數(shù)目為7,得到如表1所示的模式分類結(jié)果。分別選取各模式的樣本和退化循環(huán)次數(shù)進(jìn)行對比,如圖6所示。

圖5 DTW分層聚類譜系圖Fig.5 Dendrogram of DTW hierarchical clustering

(a) 不同模式退化曲線對比

(b) 不同模式退化循環(huán)次數(shù)對比圖6 不同退化模式對比Fig.6 Comparison of different degradation modes

表1 基于DTW聚類的模式聚類結(jié)果Tab.1 Model clustering results based on DTW clustering

由圖6(a)可知,各模式的退化趨勢有明顯的差異。從表1中可以看出,不同退化模式經(jīng)歷的退化時間區(qū)間存在少量的重疊區(qū)域(模式四和模式五、模式五和模式六),但從圖6(b)中線箱圖可以看出,不同模式的退化時間存在明顯的差異。因此,可以利用得到的聚類結(jié)果和退化時間區(qū)間建立全面的系統(tǒng)退化模式庫。

最后,利用建立的退化模式庫和退化模式識別方法,對待測樣本進(jìn)行識別,識別結(jié)果如表2所示。

表2 模式識別結(jié)果Tab.2 Model recognition results

為度量模式識別的準(zhǔn)確性,評估所有測試樣本中正確識別的百分比,借鑒文獻(xiàn)[21]中的準(zhǔn)確率計算公式,構(gòu)造如下的準(zhǔn)確率計算公式

(6)

式中:N為待測樣本個數(shù);Cor(ei)表示識別結(jié)果,當(dāng)識別的樣本的退化時間在對應(yīng)的模式區(qū)間內(nèi)時,說明預(yù)測正確,此時Cor(ei)=1,反之Cor(ei)=0。

通過計算可知,除了一個樣本被錯誤識別到模式七以外,剩余樣本的識別準(zhǔn)確率為100%。通過對比該樣本退化曲線,該樣本的退化時間不在任何一類中,因此,可將其歸為單獨(dú)一類。

為驗(yàn)證本文方法的穩(wěn)定性,利用5折交叉驗(yàn)證,得到如表3所示的結(jié)果。結(jié)果顯示,得到的模式數(shù)較為穩(wěn)定,準(zhǔn)確率較高,除了第1和第3次交叉驗(yàn)證出現(xiàn)的新模式被誤識別外,其他測試樣本均識別準(zhǔn)確。因此,本文的退化模式聚類和識別方法是有效的,可以將其作為剩余壽命預(yù)測的依據(jù)。

表3 交叉驗(yàn)證結(jié)果Tab.3 Cross-validation results

為驗(yàn)證本文方法的在退化模式挖掘中的優(yōu)勢,選擇文獻(xiàn)[18]中的方法從健康指數(shù)構(gòu)建和退化模式聚類兩個層面進(jìn)行對比。在健康指數(shù)構(gòu)建方面,本文利用MD累計和構(gòu)建的健康指數(shù)具有單調(diào)性,而且可以準(zhǔn)確區(qū)分出穩(wěn)定階段和退化階段,而文獻(xiàn)中選擇信號的時域特征作為退化趨勢,不單調(diào),且較難識別故障點(diǎn)。在退化模式聚類方面,航空發(fā)動機(jī)退化模式只與退化過程相關(guān),本文利用退化曲線進(jìn)行DTW聚類,而文獻(xiàn)則使用整個壽命周期退化趨勢進(jìn)行DTW分段聚合,相比起來,本文方法更簡便、合理。

4 結(jié) 論

本文針對復(fù)雜系統(tǒng)的退化模式挖掘方法進(jìn)行了研究,提出了基于IMTS的復(fù)雜系統(tǒng)健康狀態(tài)評估方法和基于DTW層次聚類算法的退化模式挖掘過程,通過NASA 提供的航空發(fā)電機(jī)的全壽命周期內(nèi)的性能監(jiān)測數(shù)據(jù),驗(yàn)證所提方法的有效性,得到以下結(jié)論:

(1) 本文所提的改進(jìn)MTS方法有效地解決了MTS中基準(zhǔn)空間優(yōu)化過程的不足,在復(fù)雜系統(tǒng)的健康評估時不僅能夠降低復(fù)雜系統(tǒng)監(jiān)測數(shù)據(jù)的維度與冗余性,還能融合多傳感器數(shù)據(jù)構(gòu)建MD度量,為構(gòu)建合理的健康指數(shù)提供可能。

(2) 本文提出的基于DTW層次聚類的退化模式挖掘算法可以構(gòu)建系統(tǒng)全面的退化模式庫,并準(zhǔn)確識別出待測樣本的退化模式,能夠?yàn)閺?fù)雜系統(tǒng)剩余壽命預(yù)測提供依據(jù)。

猜你喜歡
聚類距離樣本
用樣本估計總體復(fù)習(xí)點(diǎn)撥
算距離
推動醫(yī)改的“直銷樣本”
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
隨機(jī)微分方程的樣本Lyapunov二次型估計
每次失敗都會距離成功更近一步
山東青年(2016年3期)2016-02-28 14:25:55
村企共贏的樣本
基于改進(jìn)的遺傳算法的模糊聚類算法
愛的距離
母子健康(2015年1期)2015-02-28 11:21:33
一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
东丰县| 牡丹江市| 香港 | 巫山县| 谢通门县| 汉寿县| 博乐市| 永泰县| 康乐县| 深泽县| 东丰县| 蒙阴县| 遵义县| 邯郸县| 元氏县| 杭锦旗| 章丘市| 临邑县| 民权县| 兴山县| 金坛市| 普兰店市| 天气| 曲松县| 民县| 稷山县| 武功县| 进贤县| 西和县| 东乌珠穆沁旗| 松桃| 上饶市| 大庆市| 阳朔县| 屏边| 淮安市| 凌云县| 葵青区| 板桥市| 洛南县| 济源市|