李鳳春
山東理工職業(yè)學(xué)院電氣工程系 山東 272105
概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)是在徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展而來的一種前饋型神經(jīng)網(wǎng)絡(luò),最早是由D.F.Specht博士在1989年提出。其實(shí)質(zhì)是基于貝葉斯最小風(fēng)險(xiǎn)準(zhǔn)則的一種并行算法,特別適合于模式識別及分類。PNN結(jié)構(gòu)簡單,訓(xùn)練簡潔,當(dāng)獲得足夠多且足夠代表性的樣本后可直接使用,無需訓(xùn)練過程,在一般的模式識別問題中都能取得比較理想的效果。
但PNN在訓(xùn)練樣本數(shù)量較大冗余度較高的情況下,分類效果往往不理想。主成分分析(Principal Component Analysis,PCA)是一種重要的多元統(tǒng)計(jì)分析方法,它將顯示變量作一定的線性轉(zhuǎn)化產(chǎn)生數(shù)量較少的隱式變量,降低原始數(shù)據(jù)空間的維數(shù),再從新的隱式變量中提取主要變化信息及特征,這樣既保留了原有數(shù)據(jù)信息的特征,又消除變量間的關(guān)聯(lián)、簡化分析復(fù)雜度,從新的數(shù)據(jù)空間中提取符合相應(yīng)的主元數(shù),同時(shí)也消除了部分的系統(tǒng)噪聲干擾。目前PCA被廣泛用于神經(jīng)網(wǎng)絡(luò),主要用來降低神經(jīng)網(wǎng)絡(luò)輸入向量的維數(shù),進(jìn)而提高神經(jīng)網(wǎng)絡(luò)的模式識別效率。為此,本文提出了一種基于PCA和PNN的故障診斷方法,克服了訓(xùn)練樣本數(shù)據(jù)冗余度比較大的缺點(diǎn),并以某汽車發(fā)動(dòng)機(jī)的故障診斷為例驗(yàn)證了所提算法的有效性。
主成分分析法(PCA)通常又稱為Hotelling變換或者K-L變換,它是研究如何將多指標(biāo)問題轉(zhuǎn)化為較少綜合指標(biāo)的一種重要方法,是一種基于目標(biāo)統(tǒng)計(jì)特性的最佳正交變換,這是因?yàn)樗哂泻芏嘀匾膬?yōu)良性質(zhì),如變換后產(chǎn)生的新的分量正交或者不相關(guān),以部分新的分量表示原矢量時(shí)均方誤差最小,變換矢量更趨確定、能量更趨集中等,這使它在特征選取、數(shù)據(jù)壓縮等方面都有著極其重要的應(yīng)用。
設(shè)x=(x1,x2,???,xn)T為n維隨機(jī)矢量,則PCA的具體計(jì)算步驟如下:
(1)將原始觀察數(shù)據(jù)組成樣本矩陣X,每一列為一個(gè)觀察樣本x,每一行代表一維數(shù)據(jù)。
(2)計(jì)算每一維的均值,即計(jì)算樣本矩陣X每一行的均值,并對矩陣中的每個(gè)樣本x做如下處理:
這樣做的目的是簡化利用新生成的分量估計(jì)原始目標(biāo)特征時(shí)估計(jì)式的形式。
(3)計(jì)算樣本的協(xié)方差矩陣:
(4)計(jì)算協(xié)方差矩陣Cn的特征值λi及相應(yīng)特征向量,其中i=1,2,…,n。
(5)將特征值按由大到小順序排列,并按照下式計(jì)算前m個(gè)主元的累積貢獻(xiàn)率:
(6)取前m個(gè)較大特征值對應(yīng)的特征向量構(gòu)成的變化矩陣'T:
(7)通過Y=(T')TX計(jì)算前m個(gè)主成分,達(dá)到降低維數(shù)的目的。
若用壓縮后的數(shù)據(jù)Y估計(jì)原始數(shù)據(jù),即數(shù)據(jù)恢復(fù),可以按照以下步驟進(jìn)行處理:
(1)估計(jì)原始數(shù)據(jù)矩陣:
(2)對估計(jì)矩陣X每一維分別進(jìn)行加均值處理:由于變換矩陣'T僅由協(xié)方差矩陣的部分特征向量構(gòu)成,因此,恢復(fù)數(shù)據(jù)不可能完全與原始數(shù)據(jù)相同,差異程度由所選的m個(gè)主元的累積貢獻(xiàn)率衡量。
發(fā)動(dòng)機(jī)是最常用的動(dòng)力設(shè)備之一,在國民經(jīng)濟(jì)和日常生活中起著舉足輕重的作用,廣泛應(yīng)用于各個(gè)行業(yè),已成為某些行業(yè)中不可或缺的關(guān)鍵設(shè)備。它具有零部件多且相互關(guān)聯(lián)、運(yùn)動(dòng)復(fù)雜、工作環(huán)境惡劣等特點(diǎn),因而發(fā)生故障的可能性也比較大,而且發(fā)生故障后,將會(huì)影響機(jī)械系統(tǒng)的正常運(yùn)轉(zhuǎn),直接或者間接地造成巨大的經(jīng)濟(jì)損失。發(fā)動(dòng)機(jī)在運(yùn)行過程中,最常見的故障一般分為兩類,一類是油路故障;另一類是氣路故障。這兩類故障的檢測與診斷一直是研究的熱點(diǎn)。
本文以某汽車發(fā)動(dòng)機(jī)的故障診斷為研究實(shí)例。在發(fā)動(dòng)機(jī)運(yùn)行過程中,選取AI、MA、DI、MD、TR和PR共計(jì)6個(gè)變量作為特征參數(shù)。其中,AI為最大加速度指標(biāo),MA為平均加速度指標(biāo),DI為最大減速度指標(biāo)。
在進(jìn)行故障診斷時(shí),首先根據(jù)PCA對所提取的特征參數(shù)進(jìn)行降維處理,然后利用 PNN進(jìn)行診斷,診斷模型如圖 1所示。
圖1 基于PNN的發(fā)動(dòng)機(jī)診斷模型
由圖2可見,我們設(shè)計(jì)了兩個(gè)PNN進(jìn)行故障診斷。PNN-I的輸入層有兩個(gè)節(jié)點(diǎn),對應(yīng)TR和正常狀態(tài);樣本模式層有兩個(gè)節(jié)點(diǎn),分別對應(yīng)正常和故障兩種模式;輸出層有兩個(gè)節(jié)點(diǎn),分別對應(yīng)正常和故障兩種狀態(tài)。
PNN-II的輸入層有5個(gè)節(jié)點(diǎn),分別對應(yīng)5個(gè)特征參數(shù)為AI、MA、DI、MD、PR;模式層有十個(gè)節(jié)點(diǎn),對應(yīng)每個(gè)節(jié)點(diǎn)的正常和故障中的10組模式;輸出層有4個(gè)節(jié)點(diǎn),分別對應(yīng)油路故障、氣門漏氣、汽缸漏氣和正常4種狀態(tài)。所謂信息處理就是通過輸出的4種狀態(tài)綜合判定實(shí)際輸出究竟是單故障還是復(fù)合故障。
選用發(fā)動(dòng)機(jī)中的1號汽缸進(jìn)行分析。經(jīng)過分析,該汽缸一共出現(xiàn)了3種故障,分別為油量少、氣門漏氣和汽缸漏氣,再加上正常狀態(tài),可以認(rèn)為一共有4種故障模式。利用二進(jìn)制數(shù)格式描述這4種故障模式,如表1所示。這4種故障模式通過現(xiàn)場試驗(yàn)和對歷史資料的收集分析,可以得到4組故障樣本數(shù)據(jù),如表2所示。
表1 故障模式分類
表2 故障樣本數(shù)據(jù)
由于這些數(shù)據(jù)之間相差都不大,因此,不需要再進(jìn)行歸一化處理。將表2所得的故障樣本數(shù)據(jù)用PCA方法進(jìn)行分析處理,得到降維后的數(shù)據(jù),如表3所示。
表3 降維后的故障樣本數(shù)據(jù)
利用這些降維后的故障信息作為網(wǎng)絡(luò)的訓(xùn)練樣本,從而創(chuàng)建一個(gè)概率神經(jīng)網(wǎng)絡(luò)用于故障診斷。PNN的創(chuàng)建方法和RBF網(wǎng)絡(luò)的創(chuàng)建方法非常相似,代碼為:
其中,P和T分別為輸入向量和目標(biāo)向量,SPREAD為徑向基函數(shù)的分布密度,默認(rèn)為 0.1。為了更好地分析SPREAD對網(wǎng)絡(luò)性能的影響,這里將SPREAD設(shè)置為5個(gè)值,分別為0.1、0.2、0.3、0.4和0.5。
函數(shù) newpnn已經(jīng)創(chuàng)建了一個(gè)準(zhǔn)確的概率神經(jīng)網(wǎng)絡(luò),可以利用該網(wǎng)絡(luò)進(jìn)行故障診斷和分析了。
首先,檢驗(yàn)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)的分類:
不同的 SPREAD值對應(yīng)的概率神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果都是一樣的,即:由此可見,網(wǎng)絡(luò)成功地將故障模式分為了4類。為了進(jìn)一步檢驗(yàn)網(wǎng)絡(luò)的分類效果,接下來給出了一組測試樣本數(shù)據(jù),如表4所示。這組數(shù)據(jù)都來源于真實(shí)的故障信息,因此可以有效地檢驗(yàn)網(wǎng)絡(luò)的分類性能。
表4 測試樣本數(shù)據(jù)
同樣的,根據(jù)PCA方法對表4所得的測試樣本數(shù)據(jù)進(jìn)行分析處理,并得到降維后的數(shù)據(jù),如表5所示。
表5 降維后的測試樣本數(shù)據(jù)
利用表5降維后中測試樣本對概率神經(jīng)網(wǎng)絡(luò)進(jìn)行測試,代碼為:
輸出結(jié)果為:
由此可見,網(wǎng)絡(luò)的分類是正確的。也就是說,概率神經(jīng)網(wǎng)絡(luò)成功地診斷出了這4種故障。
本文提出了一種基于PCA和PNN的汽車發(fā)動(dòng)機(jī)的故障檢測與診斷算法。仿真研究結(jié)果表明,與傳統(tǒng)的PNN相比,該方法在降低數(shù)據(jù)維數(shù)的同時(shí)保證了很高的識別正確率,進(jìn)一步說明了PCA很好地保留了原始特征信息。在保證較高的分類識別率的前提下,簡化了識別算法、提高了識別算法的推廣能力和運(yùn)算速度,這對于分類識別系統(tǒng)尤其是實(shí)時(shí)分類識別系統(tǒng)具有重要意義。
[1] Specht D F.Probabilistic neural network [J].Neural Network.1990.
[2] 李冬輝,劉浩.基于概率神經(jīng)網(wǎng)絡(luò)的故障診斷方法及應(yīng)用[J].系統(tǒng)工程與電子技術(shù).2004.
[3] 常羽彤,張鵬.基于 PNN 的飛機(jī)發(fā)動(dòng)機(jī)故障診斷研究[J].微計(jì)算機(jī)信息.2007.
[4] 邢杰,蕭德云.基于 PCA 的概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版).2008.
[5] 李軍梅,胡以華,陶小紅.基于主成分分析與 BP神經(jīng)網(wǎng)絡(luò)的識別方法研究[J].紅外與激光工程.2005.
[6] 楊榮英,苗張木.BP神經(jīng)網(wǎng)絡(luò)主成分分析法在交通需求預(yù)測中的應(yīng)用[J].武漢理工大學(xué)學(xué)報(bào).2002.
[7] 黃孝彬,劉吉臻,牛玉廣.主元分析方法在火電廠鍋爐過程檢測中的應(yīng)用[J].動(dòng)力工程.2004.
[8] 孫文爽,陳蘭祥.多元統(tǒng)計(jì)分析[M].北京:高等教育出版社.1994.