曾存 胡以懷 胡光忠 李方玉 李凱
摘要:
為快速檢測柴油機(jī)異常情況,分別采用空間幾何法和
距離法對記錄的35組MAN?B&W?6S35ME-B9型船用低速柴油機(jī)在25%、50%、75%和90%負(fù)載下的熱工參數(shù)進(jìn)行異常數(shù)據(jù)檢測,確定異常數(shù)據(jù)樣本。通過兩種方式的交叉驗(yàn)證,發(fā)現(xiàn)檢測結(jié)果相近,論證了兩種方法的可行性。
關(guān)鍵詞:
船用柴油機(jī);?異常數(shù)據(jù)檢測;?空間幾何;?馬氏距離
中圖分類號:U664.121.1
文獻(xiàn)標(biāo)志碼:A
Diesel?engine?abnormal?thermal?parameter?detection?method
based?on?space?geometry?method?and?distance?method
ZENG?Cun,?HU?Yihuai,?HU?Guangzhong,?LI?Fangyu,?LI?Kai
(Merchant?Marine?College,?Shanghai?Maritime?University,?Shanghai?201306,?China)
Abstract:
In?order?to?detect?the?abnormal?situation?of?diesel?engines?quickly,?for?35?groups?of?thermal?parameters?of?MAN?B&W?6S35ME-B9?marine?low-speed?diesel?engine?under?load?conditions?of?25%,?50%,?75%?and?90%,?the?abnormal?data?are?detected?by?the?space?geometry?method?and?the?distance?method,?respectively.?The?abnormal?data?samples?are?determined.?Through?the?cross-verification?of?two?methods,?it?is?found?that?their?detection?results?are?similar,?and?the?feasibility?of?the?two?methods?is?demonstrated.
Key?words:
marine?diesel?engine;?abnormal?data?detection;?space?geometry;?Mahalanobis?distance
收稿日期:?2019-01-13
修回日期:?2019-06-04
作者簡介:
曾存(1995—),男,江蘇鹽城人,碩士研究生,研究方向?yàn)橹悄艽肮收显\斷,(E-mail)zc.shmtu@foxmail.com;
胡以懷(1964—),男,江蘇高郵人,教授,博導(dǎo),博士后,研究方向?yàn)榇爸鳈C(jī)振動、故障診斷和系統(tǒng)仿真,
(E-mail)yhhu@shmtu.edu.com
0?引?言
數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)篩選、相關(guān)性能分析、趨勢分析等,其中數(shù)據(jù)篩選是數(shù)據(jù)處理的前提。傳統(tǒng)的異常數(shù)據(jù)篩選檢測方法主要有原始?xì)埐?、杠桿值法等[1],采用這些方法篩選后直接將異常數(shù)據(jù)影響降至最低或直接剔除,這可能會導(dǎo)致重要數(shù)據(jù)信息丟失,造成“屏蔽效應(yīng)”[2]?,F(xiàn)有檢測異常試驗(yàn)數(shù)據(jù)的方法主要有基于統(tǒng)計(jì)的方法、基于距離的方法、基于偏離的方法、基于密度的方法,以及高維數(shù)據(jù)異常點(diǎn)檢測法和基于聚類的異常點(diǎn)檢測算法[3]。本文從支持向量機(jī)(support?vector?machine,?SVM)角度分別采用空間幾何分析法和穩(wěn)健式馬氏距離方法結(jié)合最小距離分類器的原理進(jìn)行檢測,交互驗(yàn)證篩選異常數(shù)據(jù)。
筆者記錄了MAN?B&W?6S35ME-B9型船用低速柴油機(jī)在25%、50%、75%、90%和100%負(fù)載下的部分熱工參數(shù),包括轉(zhuǎn)速、功率、機(jī)艙溫度等共19個參數(shù),變量尺度和樣本跨度都較大。MAN?B&W?6S35ME-B9型船用低速柴油機(jī)的基本技術(shù)參數(shù)見表1。
1?數(shù)據(jù)檢測
1.1?最小馬氏距離
常用的距離有明氏距離、蘭氏距離、杰氏距離和馬氏距離等[4],其中馬氏距離是一種多元數(shù)據(jù)異常值檢驗(yàn)的重要方法,它表示多元數(shù)據(jù)在協(xié)方差矩陣下的距離,是一種與尺度無關(guān)的獨(dú)立數(shù)據(jù)。
設(shè)一組變量矩陣為X=X11…X1n
XN1…XNn,其中,Xi表示為第i列向量(i=1,2,…,n,n為樣本參數(shù)個數(shù)),Xa和Xb分別表示第a和b行向量(Xa、Xb為兩個樣本的變量向量,a,b=1,2,…,N,N為樣本個數(shù)),則樣本之間的明氏距離[5]為
D=ni=1Xa-Xbk1k(1)
當(dāng)k=2時,明氏距離即為歐氏距離。在實(shí)際情況下,為消除尺度之間的互相影響,常用處理方式有兩種:一是將變量矩陣進(jìn)行歸一化處理,進(jìn)行尺度變化;二是將歐氏距離通過協(xié)方差矩陣變?yōu)轳R氏距離。
D=(X-XT)
Σ-1(X-X)(2)
式中:Σ為X的協(xié)方差矩陣,其對角元素反映了X的方差大小即樣本空間內(nèi)各變量的變化速度,其余各元素反映相關(guān)系數(shù)大小即各變量間的包含關(guān)系;
X為均值變量。
對X去中心化后,
展開Σ可得Σ=XTX,則式(2)變?yōu)?/p>
D=XT(XTX)-1
X(3)
若樣本空間呈正態(tài)分布,則可從置信區(qū)間著手確定D的范圍,進(jìn)而檢測出異常數(shù)據(jù)。然而,用這種方式確定異常數(shù)據(jù)位置不夠精確、快速,因此本次數(shù)據(jù)檢測結(jié)合穩(wěn)健式馬氏距離進(jìn)行改進(jìn)。
P(xj)=exp(-D2/2)/((2π)n/2Σ1/2)
(4)
1.2?穩(wěn)健式馬氏距離
傳統(tǒng)馬氏距離不能精確檢測的主要原因在于,因異常數(shù)據(jù)的存在使整個樣本空間的變量均值不夠穩(wěn)健,進(jìn)而影響式(3)中的去中心矩陣
X和協(xié)方差矩陣XTX的穩(wěn)健性。就此,王斌會等[1]提出一種基于迭代原理的穩(wěn)健式馬氏距離求解方法,張紅飛等[6]利用改進(jìn)馬氏距離對空壓機(jī)進(jìn)行狀態(tài)評估,蓋炳良等[7]也利用
穩(wěn)健式馬氏距離模型對馬氏距離的二元退化的可靠性進(jìn)行了分析。
由于異常數(shù)據(jù)的數(shù)量有限,在重復(fù)進(jìn)行迭代的過程中,發(fā)現(xiàn)迭代至3次以上異常數(shù)據(jù)基本剔除,其均值向量與協(xié)方差矩陣的行列式數(shù)值接近,對監(jiān)測結(jié)果影響不大。通過式(4)可以發(fā)現(xiàn),距離大小與數(shù)據(jù)正常的可能性成反比,因此筆者提出如下的簡化和假設(shè):
(1)為體現(xiàn)柴油機(jī)的不同狀態(tài),將主機(jī)轉(zhuǎn)速和功率兩個變量確定為固定變量,并且假定柴油機(jī)的某種狀態(tài)可以達(dá)到均值變量。
(2)為消除尺度影響,不對傳統(tǒng)的協(xié)方差矩陣求逆,而通過樣本之間的相對距離進(jìn)行距離的計(jì)算[8]。
(3)由于數(shù)據(jù)樣本有限,且絕大部分?jǐn)?shù)據(jù)為真實(shí)數(shù)據(jù),隨著迭代次數(shù)的增加,其數(shù)據(jù)異常的可能性越來越小,所以對馬氏距離的迭代次數(shù)進(jìn)行限制,通過距離的排列確定異常數(shù)據(jù)的概率大小。
1.3?空間幾何判定機(jī)理
對于線性可分的樣本數(shù)據(jù),SVM可實(shí)現(xiàn)非線性映射,把樣本空間映射到一個高維乃至無窮維的特征空間,再尋找最優(yōu)線性超平面,實(shí)現(xiàn)數(shù)據(jù)樣本的分類[9]。本文根據(jù)空間幾何分類的思路在三維空間內(nèi)找出特定的超平面實(shí)現(xiàn)正常數(shù)據(jù)點(diǎn)與異常數(shù)據(jù)點(diǎn)隔離。SVM是尋求最優(yōu)的
Y=αX+β
進(jìn)行分類的,即在三維樣本空間內(nèi)通過平面進(jìn)行分類。結(jié)合球面坐標(biāo)的表示方式,利用方位角進(jìn)行異常數(shù)據(jù)檢測,即通過三維空間進(jìn)行數(shù)據(jù)篩選。
數(shù)據(jù)點(diǎn)球坐標(biāo)(Φ,θ,r)由方位角Φ、仰角θ和距離r構(gòu)成,與直角坐標(biāo)系的轉(zhuǎn)化關(guān)系如下:
tan?Φ=x2+y2z
tan?θ=yx
r=x2+y2+z2(5)
若忽略仰角θ的變化而將其取為2π,即將柴油機(jī)轉(zhuǎn)速和功率歸一化后取a=x2+y2為同一狀態(tài),則因變量z僅與方位角Φ有關(guān)。
以主機(jī)轉(zhuǎn)速、功率和增壓器轉(zhuǎn)速為例,當(dāng)三維空間內(nèi)的方位角一定時增壓器轉(zhuǎn)速和對應(yīng)的主機(jī)轉(zhuǎn)速與功率會形成圓錐面(圖1),本文利用這種圓錐面對異常數(shù)據(jù)位置進(jìn)行排列,并與利用距離法得到的異常數(shù)據(jù)的結(jié)果進(jìn)行對比。
2?馬氏距離與空間幾何
設(shè)馬氏距離的測量尺度為D,空間幾何的測量尺度為E,根據(jù)式(3)和(5)可得
D2=(X-a)2+(Y-b)2+
X2+Y2E2+c2-2cZ
(6)
式中:a、b和c為通過穩(wěn)健式馬氏距離得到的中心矩陣元素,即均值變量的無量綱常量;X和Y為固定變量的無量綱常量;Z為檢測變量的無量綱常量。由于X和Y為固定變量,當(dāng)檢測不同變量時Z可以被看成為擾動項(xiàng)。式(6)可改寫為
D2=c1E2+c2(7)
式中:c1=X2+Y2;c2=
(X-a)2+(Y-b)2+c2-2cZ。當(dāng)檢測同一變量時,c1和c2為常量,此時D與E單調(diào),則通過馬氏距離和空間幾何來檢測異常數(shù)據(jù)具備可行性。
3?數(shù)據(jù)檢測分析
由于柴油機(jī)故障數(shù)據(jù)不易得到,本文參照文獻(xiàn)[10]的大型二沖程柴油機(jī)的數(shù)學(xué)模型利用MATLAB/Simulink建立整個機(jī)型的“平均值法”模型,通過真實(shí)數(shù)據(jù)驗(yàn)證模型基本正確。柴油機(jī)仿真模型框圖見圖2,圖中具體參數(shù)符號可參考文獻(xiàn)[10-11]。由于一些數(shù)據(jù)缺少能比其更為貼近真實(shí)的測量數(shù)據(jù),整個模型做了3個方面的變動:
(1)壓氣機(jī)和渦輪的效率和流量不是采用文獻(xiàn)[10]中的插表,而是采用s-function調(diào)用MATLAB內(nèi)置的RBF進(jìn)行擬合的方式[12]。
(2)柴油機(jī)的排氣溫度不是通過排氣溫度升高因子K計(jì)算,而是直接采用真實(shí)排氣溫度的升高量與仿真的過量空氣系數(shù)擬合的方式[13-14]。
(3)沒有建立調(diào)速機(jī)構(gòu)模型,噴油量是給定值,所有仿真計(jì)算均是在穩(wěn)態(tài)負(fù)載下進(jìn)行的。
圖2?柴油機(jī)仿真模型框圖
筆者以MAN?B&W?6S35ME-B9型船用低速柴油機(jī)為計(jì)算對象,記錄了19個熱工參數(shù)共35個樣本(包含自動化機(jī)艙的真實(shí)熱工參數(shù)、正常仿真熱工參數(shù)和異常熱工參數(shù)),并將真實(shí)熱工參數(shù)與正常仿真熱工參數(shù)進(jìn)行對比(表2)用以驗(yàn)證模型。異常熱工參數(shù)是通過改變上述模型的單項(xiàng)參數(shù)進(jìn)行模擬得來的,包括改變渦輪背壓、空冷器水路進(jìn)口溫度等。
以25%負(fù)載和75%負(fù)載下的樣本數(shù)據(jù)為例。先取25%負(fù)載下的部分熱工參數(shù)進(jìn)行歸一化處理,得到樣本點(diǎn)排布見圖3,其橫坐標(biāo)為樣本點(diǎn),縱坐標(biāo)為各樣本參數(shù)在樣本空間里的相對距離。從圖3中可以看出,雖然部分樣本參數(shù)偏離數(shù)據(jù)的整體趨勢,但其整體變化規(guī)律并不明顯,不能很好地找出異常數(shù)據(jù)的位置。
對圖3中部分?jǐn)?shù)據(jù)分別運(yùn)用空間幾何法和馬氏距離法進(jìn)行異常數(shù)據(jù)檢測。由于處理方法不同,得出結(jié)果的尺度亦不同,進(jìn)行歸一化處理后可繪制出如圖4和5的數(shù)據(jù)點(diǎn)分布。對比圖4和5可以發(fā)現(xiàn),兩種方法對柴油機(jī)熱工參數(shù)檢測的整體趨勢相近,但利用空間幾何判別會使整個樣本點(diǎn)的距離更遠(yuǎn),數(shù)據(jù)分布進(jìn)一步離散化,各變量參數(shù)之間的差距拉大,便于判斷樣本參數(shù)異??赡苄缘拇笮?。
再取75%負(fù)載下的部分熱工參數(shù)進(jìn)行歸一化處理,得到的樣本點(diǎn)排布見圖6。
分別運(yùn)用空間幾何法和馬氏距離法
對75%負(fù)載下的柴油機(jī)的熱工參數(shù)進(jìn)行異常數(shù)據(jù)篩選,得出結(jié)果見圖7和8。
對比圖7和8可以發(fā)現(xiàn),用這兩種方法判斷的數(shù)據(jù)變化趨勢大體近似,但是利用空間幾何法會使樣本點(diǎn)進(jìn)一步離散化,利于區(qū)分異常參數(shù)與樣本點(diǎn)。對比發(fā)現(xiàn)這兩種方法對具體樣本參數(shù)的處理尺度有差異,這是因?yàn)?5%負(fù)載下各參數(shù)值相應(yīng)增大程度不同,某些參數(shù)相對變化值較小,兩種方法的處理尺度愈加接近,而篩選尺度的不同以及一些參數(shù)相對變化較大使得部分篩選結(jié)果在圖中反映的結(jié)果亦不相同,具體可參考圖9~12重合度不一致說明。
圖9~12是利用上述兩種異常數(shù)據(jù)檢測方法繪制的所有樣本的增壓器轉(zhuǎn)速、空冷器水路進(jìn)口壓力和透平前后溫度異常可能性的變化情況。可以發(fā)現(xiàn),盡管經(jīng)兩種方法處理后的樣本在空間內(nèi)的相對距離不一致,但數(shù)據(jù)的變化趨勢顯著
相近,即樣本異常的可能性排列一致。
圖9~12的變化趨勢有較大差異,結(jié)合式(7)
分析原因可知,當(dāng)X、Y固定時,D與E的變化趨勢
與測量
變量Z有較大的關(guān)系。然而,當(dāng)測量變量較大時,Z值不易受測量變量影響,因此Z值變化較小,c2的影響變小,則D與E的差異會縮小,使得圖9中曲線變化趨勢重合度比圖11和12中的高得多;圖10中空冷器水路進(jìn)口壓力的變化趨勢重合度遠(yuǎn)遠(yuǎn)高于圖11和12中透平后溫度的變化趨勢重合度。
結(jié)合圖9~12可看出,樣本1的增壓器轉(zhuǎn)速、空冷器水路進(jìn)口壓力、透平前后溫度均有較大變化,而樣本13的空冷器水路進(jìn)口壓力、透平前后溫度也有較大變化,可能為設(shè)置的異常數(shù)據(jù),而其余樣本如21、28等也有個別參數(shù)變化,可能為仿真誤差,與實(shí)際仿真數(shù)據(jù)對比可知驗(yàn)證正確。
利用空間幾何法和馬氏距離法對柴油機(jī)的熱工參數(shù)進(jìn)行異常數(shù)據(jù)檢測,對其可能性的大小進(jìn)行排列,表3即為利用兩種方法對25%、50%、75%負(fù)載下柴油機(jī)部分熱工參數(shù)異常可能性進(jìn)行排列的樣本序號。從表3可以看出,由于數(shù)據(jù)間的差異較小,兩種方法判別的效果降低,使得前幾位序號的排列顯著一致,但后幾位序號排列相差較大。
將本文中的17個參數(shù)分別編號,分別為1,2,…,17,計(jì)算25%負(fù)載下11個樣本的17個參數(shù)角
度尺度的歸一化值并作圖(圖13),找出異常樣本。
通過各個樣本的性能分析即計(jì)算上述各樣本尺度之
和的倒數(shù)(見表4)可以發(fā)現(xiàn),樣本1與樣本10的熱
工參數(shù)異常的可能性最大。經(jīng)過驗(yàn)證發(fā)現(xiàn):樣本1中的增壓器轉(zhuǎn)速和柴油機(jī)功率都相應(yīng)地降低,這是由于改變了模型中的渦輪背壓;樣本10中各參數(shù)雖有異常卻并不明顯,這是由于提高了空冷器冷卻水溫度。
4?結(jié)束語
異常數(shù)據(jù)檢測是現(xiàn)代數(shù)據(jù)處理的熱點(diǎn)問題,如何保證數(shù)據(jù)信息的全面性、數(shù)據(jù)處理的精確性和處理過程的靈敏性是未來數(shù)據(jù)檢測的趨勢。本文對記錄的35組MAN?B&W?6S35ME-B9型船用低速柴油機(jī)在25%、50%、75%、90%負(fù)載下的熱工參數(shù)分別采用
空間幾何法和馬氏距離法進(jìn)行異常數(shù)據(jù)檢測,通過兩種方式的交叉驗(yàn)證,發(fā)現(xiàn)處理結(jié)果相近,論證了兩種方法的可行性。
利用空間幾何法和距離法進(jìn)行篩選只能確定異常數(shù)據(jù)樣本,無法判斷數(shù)據(jù)異常原因即故障源位置,也不能給出具體的排除故障的手段,因此可以結(jié)合模糊理論[15]、專家系統(tǒng)、灰色關(guān)聯(lián)度等方法進(jìn)行優(yōu)化。
參考文獻(xiàn):
[1]王斌會,?陳一非.?基于穩(wěn)健馬氏距離的多元異常值檢測[J].?統(tǒng)計(jì)與決策,?2005(6):?4-6.?DOI:?10.13546/j.cnki.tjyjc.2005.06.002.
[2]王建州,?馬志新,?李廉.?基于混沌的異常數(shù)據(jù)的動態(tài)識別與挖掘[J].?清華大學(xué)學(xué)報(bào)(自然科學(xué)版),?2005,?45(s1):?1753-1756.?DOI:?10.16511/j.cnki.qhdxxb.2005.s1.006.
[3]王元明,?熊偉.?異常數(shù)據(jù)的檢測方法[J].?重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版),?2009,?23(2):?86-89.
[4]韓亞娟.?基于馬氏田口的多元系統(tǒng)穩(wěn)健性優(yōu)化與診斷分析研究[D].?天津:?天津大學(xué),?2007.
[5]趙澤茂,?何坤金,?胡友進(jìn).?基于距離的異常數(shù)據(jù)挖掘算法及其應(yīng)用[J].?計(jì)算機(jī)應(yīng)用與軟件,?2005,?22(9):?105-107.
[6]張紅飛,?夏霜,?程志友.?基于改進(jìn)馬氏距離的空壓機(jī)健康狀態(tài)評估[J].?電測與儀表,?2018,?55(17):?32-36.
[7]蓋炳良,?滕克難,?唐金國.?基于馬氏距離的二元退化可靠性分析[J].?系統(tǒng)工程與電子技術(shù),?2019,?41(3):?686-692.?DOI:?10.3969/j.issn.1001-506X.2019.03.31.
[8]劉罡,?王興成,?楊昺崧.?基于融合距離法的柴油機(jī)故障診斷方法[J].?大連海事大學(xué)學(xué)報(bào),?2017,?43(1):?61-66.?DOI:?10.16411/j.cnki.issn1006-7736.2017.01.010.
[9]詹玉龍,?翟海龍,?曾廣芳.?基于支持向量機(jī)的船舶柴油機(jī)故障診斷的研究[J].?中國航海,?2007(2):?89-92.
[10]王海燕.?大型低速船用柴油機(jī)建模與系統(tǒng)仿真[D].?大連:?大連海事大學(xué),?2006.
[11]李淑英.?船舶動力裝置仿真技術(shù)[M].?哈爾濱:?哈爾濱工程大學(xué)出版社,?2013:?94-105.
[12]帥英梅,?高世倫.?渦輪增壓柴油機(jī)的平均值模型及仿真[J].?柴油機(jī)設(shè)計(jì)與制造,?2004(2):?19-23.
[13]馮國勝,?楊紹普.?柴油機(jī)及其電控系統(tǒng)仿真[J].?系統(tǒng)仿真學(xué)報(bào),?2005,?17(9):?2276-2279.
[14]趙泉華,?李曉麗,?趙雪梅,?等.?結(jié)合馬氏距離的區(qū)域化模糊聚類遙感圖像分割[J].?中國礦業(yè)大學(xué)學(xué)報(bào),?2017,?46(1):?222-228.
(編輯?賈裙平)