張繼洲 米志飛 謝春麗
摘要:為了減少故障參數(shù)的特征數(shù)量,加快診斷算法的運(yùn)行速度,提高故障診斷的效率,本文提出利用熵度量理論對(duì)故障參數(shù)的特征按重要程度進(jìn)行排序,將重要程度靠后的特征依次去除,計(jì)算去除某些特征后的特征集的熵變化量,若熵變化量變化比較小,則將該特征真正約簡,再從約簡后的特征集中選出一個(gè)最優(yōu)的約簡特征集。利用自組織特征映射神經(jīng)網(wǎng)絡(luò)對(duì)故障參數(shù)特征約簡結(jié)果進(jìn)行檢驗(yàn),驗(yàn)證結(jié)果表明:利用熵度量理論得出的約簡結(jié)果能夠用于故障診斷且診斷結(jié)果正確。
關(guān)鍵詞:熵度量;屬性約簡;故障診斷;SOM神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):S11;TP206+.3
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001-005X(2015)04-0087-05
隨著儲(chǔ)存技術(shù)的快速發(fā)展,越來越多的故障數(shù)據(jù)被儲(chǔ)存,而故障診斷過程就是對(duì)這些海量般的歷史數(shù)據(jù)進(jìn)行分類分析的過程。在診斷過程中,最重要的一步就是特征提取。為了更加準(zhǔn)確的描述機(jī)器的工作狀態(tài),大量的特征被創(chuàng)造出來并被用來描述機(jī)器設(shè)備的運(yùn)行狀態(tài)。但是,數(shù)據(jù)的特征越多(維度越高),分析的難度越大,分析結(jié)果的可信度也越低。所以,必須對(duì)數(shù)據(jù)進(jìn)行屬性約簡(特征約簡或者維歸約)。利用熵度量理論,能夠直接對(duì)特征的重要程度進(jìn)行排序,可以有效降低故障診斷參數(shù)的維數(shù)、加快診斷算法的運(yùn)算速度。
1 熵度量理論
已知初始特征全集 ,去除任意特征 得到一個(gè)特征集 ,特征集變化前后的熵的變量 越小,特征 對(duì)特征集F越不重要
根據(jù)文獻(xiàn),設(shè)約簡集合 ,故約筒子集 的熵的重要度為
最簡約簡子集(集合中元素最少)定義為:
2 熵度量理論屬性約簡實(shí)例
根據(jù)熵度量理論,本文對(duì)電控發(fā)動(dòng)機(jī)故障征兆集進(jìn)行約簡,利用文獻(xiàn)中的部分故障與征兆對(duì)熵度量理論屬性約簡算法進(jìn)行說明。
定義對(duì)象集(故障集) 屬性集(征兆集) ,各參量定義見表1和表2。
根據(jù)熵度量理論,求得數(shù)據(jù)集各樣本間的相似度量,即漢明距離,見表4。
由表4計(jì)算得,原始數(shù)據(jù)集的熵:
分別去除各個(gè)特征,計(jì)算得到熵的變化量(以去除特為例):
去除特征,得到表5的樣本數(shù)據(jù)集。
根據(jù)表6計(jì)算得,表內(nèi)數(shù)據(jù)集的熵:
熵的改變量:
去除特征X4得到表7的樣本數(shù)據(jù)集。
根據(jù)表8計(jì)算得,表內(nèi)數(shù)據(jù)集的熵:
熵的改變量:
以相同的方法計(jì)算求得:
根據(jù)熵的變化量可知,存在兩種約簡方案見表9。
采用方案一時(shí),約簡特征X4、X5、X6后,屬性集的熵為 ,約簡前后熵的改變量
采用方案二時(shí),約簡特征X4、X5、X6、X11后,屬性集的熵為 ,約簡前后熵的改變量 。比較兩方案結(jié)果, ,根據(jù)熵度量理論,熵的改變量越大,該特征越重要,所以特征X11對(duì)故障診斷的正確性和診斷速度影響更大,方案一更合適,即將特征X4、X5、X6約簡,得到核心屬性X1、X2、X3、X7、X8、X9、X10、X11、。
3 約簡結(jié)果算法驗(yàn)證
為驗(yàn)證約簡結(jié)果是否可以用于實(shí)踐運(yùn)用,本文利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)約簡結(jié)果進(jìn)行驗(yàn)證,驗(yàn)證是否可以利用約簡得到的核心屬性識(shí)別出文獻(xiàn)中的8種故障類型。在驗(yàn)證過程中,將約簡結(jié)果即X1、X2、X3、X7、X8、X9、X10、X11作為SOM神經(jīng)網(wǎng)絡(luò)的輸入,文獻(xiàn)中的8種故障類型即y1、y2、y3、y4、y5、y6、y7、y8作為SOM神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果。神經(jīng)網(wǎng)絡(luò)的理想輸入和輸出見表10。
將樣本1~8作為訓(xùn)練樣本,對(duì)SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,文獻(xiàn)中的故障現(xiàn)象數(shù)據(jù)見表11作為測(cè)試數(shù)據(jù)進(jìn)行故障診斷,訓(xùn)練結(jié)果和診斷結(jié)果見表12和表13(以樣本4和樣本7為例)。
由表12和表13可以看出,當(dāng)訓(xùn)練步數(shù)為100時(shí),每個(gè)故障類型都被劃分為一類,分類非常細(xì)化,互不影響診斷結(jié)果。當(dāng)訓(xùn)練步數(shù)提高到200、500、1000時(shí),分類結(jié)果沒有變化,對(duì)診斷結(jié)果已經(jīng)沒有實(shí)際影響。在訓(xùn)練好的網(wǎng)絡(luò)中,輸入樣本4和樣本7,診斷結(jié)果如上表12和表13所示,SOM神經(jīng)網(wǎng)絡(luò)將樣本4分到故障類型y4,將樣本7分到故障類型y7中,故障診斷結(jié)果與實(shí)際故障原因相同,說明約簡后的屬性集可以用于故障診斷,且不影響故障診斷結(jié)果。
4 約簡結(jié)果實(shí)驗(yàn)驗(yàn)證
在算法驗(yàn)證的基礎(chǔ)上,筆者在實(shí)驗(yàn)室組建一個(gè)由可設(shè)置不同故障的測(cè)試車輛、X-431開放式汽車故障診斷儀組成的測(cè)試系統(tǒng)對(duì)約簡結(jié)果進(jìn)行驗(yàn)證。在8種故障分別存在的情況下進(jìn)行測(cè)試,每種故障情況下測(cè)得20組數(shù)據(jù),總共160組數(shù)據(jù),從中隨機(jī)選出152組數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù)集,剩余8組數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,構(gòu)建一個(gè)8-17-8的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷。由圖1可知,當(dāng)訓(xùn)練迭代次數(shù)達(dá)到13次時(shí),系統(tǒng)網(wǎng)絡(luò)的輸出達(dá)到要求誤差,結(jié)束訓(xùn)練,輸入測(cè)試數(shù)據(jù)集進(jìn)行測(cè)試,得到輸出結(jié)果,見表14。
由表14可以看出,實(shí)際輸出與理想輸出相吻合,說明約簡后的特征屬性集可以用于實(shí)踐中,再次表明本文的約簡方法的正確的、可用于實(shí)踐的。
5 結(jié)束語
本文利用熵度量理論,根據(jù)屬性約簡前后屬性集的熵的改變量大小對(duì)故障屬性的重要程度進(jìn)行了排序并將不重要的特征挑選出來進(jìn)行約簡,得到一個(gè)最簡約簡屬性集合。為了驗(yàn)證該最簡屬性集是否能夠用于屬性約簡,本文利用SOM神經(jīng)網(wǎng)絡(luò)從算法上對(duì)屬性約簡結(jié)果進(jìn)行故障診斷驗(yàn)證,利用BP神經(jīng)網(wǎng)絡(luò)從實(shí)際測(cè)試中對(duì)約簡結(jié)果進(jìn)行故障診斷驗(yàn)證,驗(yàn)證結(jié)果表明根據(jù)熵度量理論得出的最簡約簡屬性集合是合適的,能夠得到正確的診斷結(jié)果,達(dá)到了減少屬性特征且不影響診斷結(jié)果的目的。