王 冰,張震宇,劉 慧,張洪泉
(1.哈爾濱工程大學(xué)信息與通信工程學(xué)院,黑龍江哈爾濱 150001;2.中國電子科技集團(tuán)公司第49研究所,黑龍江哈爾濱 150001;3.中國船舶重工集團(tuán)公司第703研究所,黑龍江哈爾濱 150001)
?
基于相關(guān)向量機(jī)的氫氣傳感器故障恢復(fù)方法
王 冰1,2,張震宇3,劉 慧2,張洪泉1
(1.哈爾濱工程大學(xué)信息與通信工程學(xué)院,黑龍江哈爾濱 150001;2.中國電子科技集團(tuán)公司第49研究所,黑龍江哈爾濱 150001;3.中國船舶重工集團(tuán)公司第703研究所,黑龍江哈爾濱 150001)
在相關(guān)向量機(jī)回歸模型的基礎(chǔ)上,提出了一種新的氫氣傳感器故障數(shù)據(jù)恢復(fù)方法。利用小生境粒子群算法的“共享機(jī)制”對(duì)相關(guān)向量回歸的核參數(shù)進(jìn)行了優(yōu)化,使其能快速準(zhǔn)確地找到全局最優(yōu)參數(shù)。用優(yōu)化并訓(xùn)練后的回歸模型對(duì)發(fā)生故障后的數(shù)據(jù)進(jìn)行預(yù)測,實(shí)現(xiàn)故障恢復(fù)。將本文所用方法與其他較成熟的方法進(jìn)行了比較,實(shí)驗(yàn)結(jié)果表明本方法在恢復(fù)準(zhǔn)確度和魯棒性方面均優(yōu)于傳統(tǒng)方法。數(shù)據(jù)恢復(fù)相對(duì)誤差在±2.8%以內(nèi)。
相關(guān)向量機(jī);故障恢復(fù);小生境粒子群算法;參數(shù)優(yōu)化
氫氣(H2)是重要的化工原料,也是航天器發(fā)動(dòng)機(jī)的主要燃料,在社會(huì)發(fā)展和提高國民經(jīng)濟(jì)中發(fā)揮著重要的作用[1-2]。氫氣傳感器作為氫氣檢測的主要手段之一,被廣泛應(yīng)用。然而,由于氫氣傳感器大多長時(shí)間使用,且工作環(huán)境惡劣,使故障發(fā)生的概率增大[3-4]。而且一旦發(fā)現(xiàn)故障,可能無法迅速更換。因此,對(duì)其進(jìn)行故障狀態(tài)監(jiān)控及高效準(zhǔn)確及時(shí)的故障數(shù)據(jù)恢復(fù)意義重大。
目前,國內(nèi)外對(duì)傳感器故障數(shù)據(jù)恢復(fù)的研究相對(duì)較少,大多集中在對(duì)故障狀態(tài)的檢測和診斷上[5]。傳統(tǒng)的故障恢復(fù)方法主要有啟發(fā)式搜索方法、數(shù)學(xué)優(yōu)化方法、專家系統(tǒng)方法和神經(jīng)網(wǎng)絡(luò)等智能方法,但都存在結(jié)構(gòu)復(fù)雜、實(shí)現(xiàn)困難以及收斂速度慢等各種問題[6-8]。支持向量機(jī)(Support Vector Machine,SVM)方法由于能夠在較小的樣本情況下,實(shí)現(xiàn)結(jié)構(gòu)風(fēng)險(xiǎn)的最小化等優(yōu)勢,近年來被廣泛研究,但其也存在著核參數(shù)設(shè)置復(fù)雜以及稀疏性有限等缺點(diǎn)[9-10]。針對(duì)這些問題,本文采用了相關(guān)向量機(jī)(Relevance Vector Machine,RVM)回歸預(yù)測方法。RVM具備SVM的優(yōu)點(diǎn),且參數(shù)設(shè)置簡單,核函數(shù)不受Mercer 條件限制,能夠以概率形式給出輸出結(jié)果,比SVM更具有稀疏性[11]。
在基于RVM的氫氣傳感器故障數(shù)據(jù)恢復(fù)方法中,核函數(shù)參數(shù)的選擇對(duì)故障數(shù)據(jù)的恢復(fù)結(jié)果有很大的影響。針對(duì)這一問題,本文采用小生境粒子群優(yōu)化算法對(duì)RVM的核參數(shù)進(jìn)行優(yōu)化,利用其"資源共享"的機(jī)制,快速獲得RVM的最優(yōu)參數(shù),提高RVM回歸模型的泛化精度,進(jìn)而提高其恢復(fù)的準(zhǔn)確度。
tn=y(xn;w)+εn
(1)
式中:εn服從均值為0,方差為σ2的高斯分布。
方差σ2一般可根據(jù)訓(xùn)練集目標(biāo)值的噪聲方差賦初值,通過數(shù)據(jù)訓(xùn)練迭代更新獲取。監(jiān)督學(xué)習(xí)模型可表示為:
(2)
式中:K(x,xi)為核函數(shù);ωi為權(quán)重向量。
由于εn滿足高斯分布,假設(shè)目標(biāo)值tn獨(dú)立同分布,則整個(gè)數(shù)據(jù)集的似然函數(shù)可表示為:
(3)
式中:t=(t1…tN)T;ω=(ω0KωN)T;Φ=[φ(x1),φ(x2),K,φ(xN)]T為N×(N+1)的矩陣;φ(xn)=[1,K(xn,x1),K(xn,x2),K,K(xn,xN)]T。
如果直接采用極大似然方法估計(jì)ω和σ2,可能會(huì)導(dǎo)致過適應(yīng),因此采用稀疏貝葉斯理論,定義高斯先驗(yàn)概率分布:
(4)
根據(jù)貝葉斯公式,所有未知參數(shù)的后驗(yàn)概率可以表示為:
(5)
式中:
(6)
式中:∑=(σ-2ΦTΦ+A)-1;μ=σ-2∑ΦTt;A=diag(α0,α1,K,αN)。
用delta函數(shù)的峰值做近似運(yùn)算,在一致超先驗(yàn)分布的情況下,p(t|α,σ2)可表示為:
(7)
使用迭代公式進(jìn)行整理得:
(8)
(9)
式中:μi為式(6)中均值向量μ的第i個(gè)元素;γi=1-αiNii;Nii為式(6)中方差∑的對(duì)角線上的第i個(gè)元素。
這樣,如果給定一個(gè)新的輸入值x*,根據(jù)式(6),預(yù)測值分布可以記為:
(10)
假設(shè)被積函數(shù)都滿足高斯分布,因此預(yù)測值同樣服從高斯分布,
(11)
這樣,RVM對(duì)新觀測值的預(yù)測輸出即為y(x*,μ)。
在RVM的回歸模型中,核參數(shù)的選擇會(huì)直接影響其回歸的泛化性能,因此選擇合適的參數(shù)是保證RVM 泛化精度的關(guān)鍵。傳統(tǒng)的核參數(shù)選擇方法往往是通過經(jīng)驗(yàn)或遍歷搜尋方法,具有一定的盲目性而且需要大量的時(shí)間,最后找到的參數(shù)也未必是全局最優(yōu)解。針對(duì)這一問題,本文提出了一種基于小生境粒子群優(yōu)化算法(NPSO)的RVM參數(shù)尋優(yōu)方法,在傳統(tǒng)粒子群優(yōu)化算法中引入小生境共享機(jī)制,對(duì)核函數(shù)的帶寬進(jìn)行優(yōu)化。小生境的共享機(jī)制增加了粒子種群的多樣性,使其能夠快速找到全局最優(yōu)解。
傳統(tǒng)的慣性權(quán)重PSO算法中,粒子的速度和位置按照如下公式更新:
vid(t+1)=wvid(t)+c1r1〔pbestid(t)-xid(t)〕+c2r2〔gbestid(t)-xid(t)〕
(12)
xid(t+1)=xid(t)+vid(t+1)
(13)
式中:i為第i個(gè)粒子;d為粒子維數(shù);t為迭代次數(shù);c1和c2為加速度常數(shù);r1和r2是介于[0,1]之間的隨機(jī)數(shù);w代表慣性權(quán)重;xid代表粒子位置;vid代表粒子速度;pbestid是單個(gè)粒子i所經(jīng)歷的最好位置;gbestid是群體中所有粒子所經(jīng)歷的最好位置。
由于傳統(tǒng)PSO算法容易出現(xiàn)早熟現(xiàn)象和陷入局部最優(yōu)的問題,本文采用小生境粒子群算法對(duì)RVM參數(shù)進(jìn)行優(yōu)化。小生境粒子群優(yōu)化算法是在傳統(tǒng)PSO方法的基礎(chǔ)上,引入了共享函數(shù)策略。共享函數(shù)代表了粒子之間的相似程度,通過它來調(diào)整群體中各粒子的適應(yīng)度值,來增強(qiáng)種群的多樣性,進(jìn)而找到全局最優(yōu)解。本文選擇的共享函數(shù)如下式所示。
Sh(xj,xk)=‖xj-xk‖
(14)
式中:xj、xk表示兩個(gè)不同的粒子。
如果兩個(gè)粒子之間的距離小于某一給定距離S,用懲罰函數(shù)P乘以適應(yīng)度值較差的個(gè)體的適應(yīng)度值,來削減適應(yīng)度值較差粒子的性能,使其適應(yīng)度值更差。削減后的適應(yīng)度函數(shù)為:
Fitness=Fitnessmax(xj,xk)×P
(15)
通過這種方式,在以后的迭代更新中淘汰適應(yīng)度值更差的個(gè)體。由此,根據(jù)粒子之間的距離,調(diào)整群體中各粒子的適應(yīng)度,使其之間保持一定的距離,保證了群體中個(gè)體的多樣性,提高了收斂的速度。
NPSO算法的具體步驟如下:
(1)初始化種群的各參數(shù)以及各粒子的速度、位置;
(2)按適應(yīng)度函數(shù)計(jì)算各粒子的適應(yīng)度值,并計(jì)算兩粒子間的共享函數(shù)值,若小于給定閾值S,用懲罰函數(shù)削減該粒子的適應(yīng)度值,削減其性能;
(3)比較各粒子的當(dāng)前適應(yīng)度值及其所經(jīng)歷的最優(yōu)適應(yīng)度值,如果當(dāng)前適應(yīng)度值更小,將當(dāng)前適應(yīng)度值作為該個(gè)體所經(jīng)歷的最優(yōu)適應(yīng)度值;
(4)計(jì)算群體中所有粒子所經(jīng)歷的最優(yōu)適應(yīng)度值,講其最小值作為全局最優(yōu)適應(yīng)度值;
(5)更新粒子的速度和位置,計(jì)算新的適應(yīng)度值;
(6)如果達(dá)到最大迭代次數(shù),停止更新,輸出最優(yōu)適應(yīng)度值及其位置;否則轉(zhuǎn)到(2)。
3.1 基于NPSO的RVM回歸參數(shù)優(yōu)化
圖1 NPSO方法對(duì)RVM參數(shù)優(yōu)化流程圖
根據(jù)上文所述原理,本文采用NPSO算法對(duì)RVM的回歸參數(shù)進(jìn)行優(yōu)化。RVM參數(shù)的適應(yīng)度函數(shù)是通過樣本測試結(jié)果的均方根誤差設(shè)置的,通過適應(yīng)度函數(shù)來判斷RVM的回歸性能。如式(16)所示。
(16)
在RVM回歸模型中,本文采用目前應(yīng)用最廣泛的高斯徑向基核函數(shù)。因?yàn)橹灰獏?shù)選擇合適,它可以適用于任意分布的樣本。本文試驗(yàn)中,選取20組實(shí)驗(yàn)數(shù)據(jù)作為測試樣本,NPSO算法的粒子數(shù)為30,最大迭代次數(shù)100次,初始權(quán)重w為1,加速度常數(shù)c1=c2=2,小生境距離常數(shù)S為1.5,懲罰因子P為1 000。參數(shù)優(yōu)化過程的適應(yīng)度值曲線如圖2所示,在第62代以后,算法近似收斂于最優(yōu)解,對(duì)應(yīng)的RVM回歸模型參數(shù)為σ2=1.4112。
圖2 適應(yīng)度值迭代曲線
3.2 基于RVM的故障數(shù)據(jù)恢復(fù)
根據(jù)分析,氫氣傳感器的氣敏元件可能發(fā)生的故障有加熱電極開路、短路;敏感膜開裂、脫落;零×10-7點(diǎn)滿度漂移;多介質(zhì)孔合閉;氣敏材料自身結(jié)構(gòu)變化等情況,這些故障可能會(huì)使傳感器的輸出值高于或低于測量范圍,發(fā)生顯著突變或恒值輸出等。本文以傳感器的輸出值發(fā)生過載和突變的故障為例,利用得到的RVM最優(yōu)參數(shù),應(yīng)用RVM回歸模型對(duì)傳感器的故障數(shù)據(jù)進(jìn)行恢復(fù),并取相同的測試樣本和訓(xùn)練樣本,與SVM、RBFNN方法進(jìn)行了比較,如圖3和圖4所示。其中,RBF網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)為2,隱層節(jié)點(diǎn)數(shù)采用自動(dòng)確定的方法,輸出節(jié)點(diǎn)數(shù)為1;SVM算法中選取徑向基核函數(shù),懲罰因子C=500,帶寬σ2=1。
(a)
(b)
(c)圖3 過載故障恢復(fù)曲線
從圖3和圖4可以看出,在過載和突變兩種故障狀態(tài)下,三種方法均能對(duì)故障數(shù)據(jù)進(jìn)行恢復(fù),但本文所用的方法在準(zhǔn)確度上優(yōu)于其它兩種方法,且恢復(fù)數(shù)據(jù)的相對(duì)誤差在±2.8%以內(nèi),驗(yàn)證了該方法的有效性,也說明了本文所用的方法具有良好的預(yù)測和推廣能力。
本文針對(duì)氫氣傳感器故障恢復(fù)的問題,研究了一種基于RVM回歸的故障數(shù)據(jù)恢復(fù)方法。該方法結(jié)合了小生境粒子群和RVM回歸的優(yōu)點(diǎn),提高了RVM回歸模型的準(zhǔn)確率和傳感器的穩(wěn)定性,解決了現(xiàn)有氫氣傳感器發(fā)生故障后短時(shí)間內(nèi)無法立即更換的問題,體現(xiàn)了傳感器智能化的發(fā)展趨勢。
圖4 突變故障恢復(fù)曲線
[1] WINTER C.Hydrogen energy-abundant,efficient,clean:A debate over the energy system of change.International Journal of Hydrogen Energy,2009,34:1-52.
[2] CLARK W W,RIFKIN J,O’Connor T,et al.Hydrogen energy stations:along the roadside to the hydrogen economy.Utilities Policy,2005,13(2):41-50.
[3] 王祁,趙樹延,宋凱.多功能自確認(rèn)傳感器.傳感技術(shù)學(xué)報(bào),2011,24(4):527-531.
[4] ELAOUD S,HADJ-TAIEB L,HADJ-TAIEB E.Leak detection of hydrogen natural gas mixtures in pipes using the characteristics method of specified time intervals.Journal of Loss Prevention in the Process Industries,2010,23(3):637-645.
[5] 申?duì)幑?,朱鳳宇,王祁.基于PFP-WRVM的多功能傳感器狀態(tài)自確認(rèn)研究.儀器儀表學(xué)報(bào),2012,33(9):1986-1994.
[6] 張美金,鄂小雪.基于改進(jìn)LS-SVM的變壓器油中氣體濃度預(yù)測.儀表技術(shù)與傳感器,2013(5):88-90.
[7] 范庚,馬登武,鄧力.基于灰色相關(guān)向量機(jī)的故障預(yù)測模型.系統(tǒng)工程與電子技術(shù),2012,34(2):424-428.
[8] WANG W Q,GOLNARAGHI M F,ISMAIL F.Prognosis of machine health condition using neuro-fuzzy systems.Mechanical Systerns and Signal Processing,2004,18(4):1813-1831.
[9] 馮志剛,信太克規(guī),王祁.基于最小二乘支持向量機(jī)預(yù)測器的傳感器故障檢測與數(shù)據(jù)恢復(fù).儀器儀表學(xué)報(bào),2007,28(2):193-197.
[10] 馬笑瀟,黃席樾,柴毅.基于支持向量機(jī)的故障過程趨勢預(yù)測研究.系統(tǒng)仿真學(xué)報(bào),2002,14(11):1548-1551.
[11] TIPPING M E.Sparse Bayes Learning and the relevance vector machine.Machine Learning Research,2001:211-244.
Fault Recovery Method of Hydrogen Sensor Based on Relevance Vector Machine
WANG Bing1,2,ZHANG Zhen-yu3,LIU Hui2,ZHANG Hong-quan1
(1. School of Information and Communication Engineering,Harbin Engineering Univ.,Harbin 150001,China;2. Chinese Electron Science and Technology Conglomerate 49th Research Institute,Harbin,150001,China;3. No.703 Research Institute of China Shipbuilding Industry Corporation,Harbin,150001,China)
Based on relevance vector machine regression model,a new fault data recovery method of hydrogen sensor was proposed in this paper. The “sharing mechanism” of niche particle swarm optimization algorithm was used to optimize kernel parameter of RVM,which can make it to find the global optimal parameter fast and exactly. The fault data were prognosed by using the regression model of optimized and trained to realize the fault recovery. The proposed method was compared with other mature algorithms,the results show that the proposed method is superior to the traditional ones in recovery accuracy and robustness.The relative error of fault recovery is within ±2.8%.
relevance vector machine; fault recovery; niche particle swarm optimization; parameter optimizing
2014-11-20 收修改稿日期:2015-07-04
TP206.3
A
1002-1841(2015)09-0011-03
王冰(1984— ),工程師,博士。主要研究領(lǐng)域:傳感器信號(hào)檢測、處理。E-mail:wangbing@hrbeu.edu.cn