謝彥紅, 薛志強(qiáng), 李 元
(沈陽(yáng)化工大學(xué) 技術(shù)過(guò)程故障診斷與安全性研究中心, 遼寧 沈陽(yáng) 110142)
間歇過(guò)程是工業(yè)中比較常見(jiàn)的一種生產(chǎn)過(guò)程.相比于其他的工業(yè)生產(chǎn)過(guò)程,間歇過(guò)程具有高效、靈活、柔性生產(chǎn)等特點(diǎn),但產(chǎn)品質(zhì)量易受原材料、設(shè)備狀況、環(huán)境條件等不確定性因素的影響.為了保障間歇生產(chǎn)過(guò)程的安全平穩(wěn),同時(shí)提高產(chǎn)品質(zhì)量和生產(chǎn)效率,針對(duì)間歇過(guò)程的故障檢測(cè)和診斷方法日益受到重視[1].
基于數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)過(guò)程監(jiān)控從歷史生產(chǎn)數(shù)據(jù)出發(fā),通過(guò)對(duì)過(guò)程測(cè)量數(shù)據(jù)的統(tǒng)計(jì)建模和分析,判斷過(guò)程所處的運(yùn)行狀態(tài),在線檢測(cè)和識(shí)別過(guò)程中出現(xiàn)的異常工況,實(shí)現(xiàn)過(guò)程的安全、穩(wěn)定運(yùn)行,最終達(dá)到提高產(chǎn)品質(zhì)量和提升企業(yè)經(jīng)濟(jì)效益的目的.傳統(tǒng)多向主元分析(multi-way principal component analysis,MPCA)方法[2-3]是一種典型的基于數(shù)據(jù)驅(qū)動(dòng)技術(shù)的過(guò)程故障檢測(cè)方法,針對(duì)間歇過(guò)程具有非線性、非高斯分布、多階段性等復(fù)雜的數(shù)據(jù)特性,MPCA作為傳統(tǒng)的線性檢測(cè)方法并不能有效地進(jìn)行故障檢測(cè).此外,應(yīng)用MPCA模型過(guò)程監(jiān)測(cè)時(shí),需要所有間歇數(shù)據(jù)等長(zhǎng),在線監(jiān)測(cè)時(shí)需要調(diào)整數(shù)據(jù)結(jié)構(gòu),這些問(wèn)題都會(huì)影響過(guò)程監(jiān)測(cè)結(jié)果的準(zhǔn)確性.
針對(duì)間歇過(guò)程數(shù)據(jù)的非線性和不等長(zhǎng)特征,He[4-5]等、李元[6-8]等提出一種基于統(tǒng)計(jì)模量故障檢測(cè)方法,并將其應(yīng)用在間歇和連續(xù)生產(chǎn)過(guò)程中.在統(tǒng)計(jì)模量框架下依托K近鄰(Knearest neighbor,KNN)方法[9-14]進(jìn)行檢測(cè),繁重的數(shù)據(jù)計(jì)算嚴(yán)重影響檢測(cè)的效率.間歇過(guò)程數(shù)據(jù)具有多模態(tài)的特性,各模態(tài)數(shù)據(jù)結(jié)構(gòu)離散程度差異較大時(shí),檢測(cè)效果也會(huì)不理想.Xu[15]提出了一種基于統(tǒng)計(jì)局部性保留投影(SLPP)的局部和非高斯特征提取方法.首先,利用統(tǒng)計(jì)模式分析(SPA)構(gòu)造過(guò)程統(tǒng)計(jì)量,利用高階統(tǒng)計(jì)量掌握非高斯統(tǒng)計(jì)量的性質(zhì).然后,利用局部保持投影(LPP)方法發(fā)現(xiàn)統(tǒng)計(jì)量的局部流形結(jié)構(gòu).利用SLPP模型的T2 和SPE來(lái)檢測(cè)過(guò)程故障.Zhang[16]提出了一種局部和全局統(tǒng)計(jì)模式分析(LGSPA)方法,該方法將SPA框架和局部投影集成到主成分分析中,利用各種統(tǒng)計(jì)信息,同時(shí)保留觀測(cè)數(shù)據(jù)的局部和全局信息實(shí)現(xiàn)故障檢測(cè).但該方法并沒(méi)有解決間歇過(guò)程數(shù)據(jù)的多模態(tài)問(wèn)題.
20世紀(jì)90年代末,Tax[17-18]等提出支持向量數(shù)據(jù)描述(support vector data description,SVDD) 方法,該方法通過(guò)映射將低維空間數(shù)據(jù)投影到高維特征空間并建立模型.SVDD方法可以檢測(cè)非線性、多模態(tài)數(shù)據(jù),因此其廣泛應(yīng)用于工業(yè)生產(chǎn)過(guò)程.謝彥紅[19]等針對(duì)間歇過(guò)程數(shù)據(jù)存在動(dòng)態(tài)變化特征,傳統(tǒng)的支持向量數(shù)據(jù)描述方法很難實(shí)現(xiàn)實(shí)時(shí)在線狀態(tài)監(jiān)測(cè)的問(wèn)題,提出一種基于滑動(dòng)窗口的SVDD在線實(shí)時(shí)故障監(jiān)測(cè)方法.李冠男等[20]將SVDD方法應(yīng)用在冷水機(jī)組傳感器故障檢測(cè)中,結(jié)果表明SVDD對(duì)冷水機(jī)組傳感器故障檢測(cè)效果明顯,但對(duì)于不同傳感器的不同幅值偏差故障,故障識(shí)別程度并不一致.謝彥紅等[21]提出一種PCA-SVDD的故障檢測(cè)方法.利用PCA方法進(jìn)行數(shù)據(jù)維數(shù)約減,降低建模過(guò)程的計(jì)算量,縮減建模時(shí)間.
綜上所述,針對(duì)間歇過(guò)程提出一種SPA-SVDD故障診斷方法.通過(guò)統(tǒng)計(jì)模量分析方法對(duì)間歇過(guò)程數(shù)據(jù)進(jìn)行處理,得到二維的過(guò)程統(tǒng)計(jì)模量數(shù)據(jù);建立SVDD模型,計(jì)算模型的超球半徑R,將其作為新樣本是否偏離正常樣本的指標(biāo).
間歇過(guò)程采集的數(shù)據(jù)以三維矩陣形式儲(chǔ)存,如圖1所示,由于每一批次數(shù)據(jù)都是矩陣,在檢測(cè)之前需要預(yù)處理為向量形式,通常預(yù)處理方法為多向方法.把第i個(gè)批次的數(shù)據(jù)記為
圖1 三維數(shù)據(jù)結(jié)構(gòu)
(1)
多向方法將數(shù)據(jù)按時(shí)間方向展開(kāi)為
Xi={x11,x12,…,x1j;x21,x22,…,x2j;…;xi1,xi2,…,xij}.
Xi表示第i批次按時(shí)間方向展開(kāi)的向量.使用多向展開(kāi)方法后數(shù)據(jù)大小會(huì)變成(I×JK).隨著時(shí)間增加樣本數(shù)也會(huì)增加,為后續(xù)建模檢測(cè)增加負(fù)擔(dān).除此之外各批次采樣數(shù)據(jù)不等長(zhǎng)時(shí)需要進(jìn)行數(shù)據(jù)截取,以獲得等長(zhǎng)數(shù)據(jù),此方法會(huì)導(dǎo)致部分?jǐn)?shù)據(jù)信息缺失,影響模型檢測(cè)的有效性.因此,提出一種新的數(shù)據(jù)展開(kāi)方法.
統(tǒng)計(jì)模量分析是一種數(shù)據(jù)處理方法,可克服傳統(tǒng)多向展開(kāi)方法在間歇過(guò)程中的缺點(diǎn).統(tǒng)計(jì)模量方法就是利用變量的數(shù)據(jù)特征代替變量數(shù)據(jù),常用到均值μij、方差σij、偏度γij、峭度κij等.
(2)
SVDD方法目標(biāo)是構(gòu)建一個(gè)超球面來(lái)描述數(shù)據(jù)的邊界.構(gòu)建的超球需要滿足其體積最小,同時(shí)保證包含全部(大多數(shù))數(shù)據(jù).構(gòu)建超球的目標(biāo)函數(shù)為
F(R,a)=R2.
(3)
其中:R表示超球面的半徑;a表示球心.
當(dāng)數(shù)據(jù)中出現(xiàn)偏離的數(shù)據(jù)時(shí),會(huì)導(dǎo)致構(gòu)建的超球面不能有效地描述數(shù)據(jù)邊界,此時(shí)構(gòu)建的目標(biāo)函數(shù)需要引入松弛向量ξi來(lái)調(diào)節(jié)離散數(shù)據(jù)對(duì)超球面的影響.
(4)
C是懲罰系數(shù),其權(quán)衡超球包含數(shù)據(jù)個(gè)數(shù)和超球體積的比率關(guān)系,通常利用公式
(5)
計(jì)算得到.d與置信度相對(duì)應(yīng),選取99 %置信度則d=0.01.
為保證超球體體積最小,建立約束條件:
(xi-a)T(xi-a)≤R2+ξi.
(6)
從而轉(zhuǎn)化為求解最優(yōu)化問(wèn)題:
(7)
利用拉格朗日乘子法求解最優(yōu)化問(wèn)題:
(8)
求解(8)得到
(9)
由公式(9)可知:球心是所有數(shù)據(jù)點(diǎn)的線性組合;數(shù)據(jù)xi都會(huì)被分配系數(shù)αi,其中非零系數(shù)αi對(duì)應(yīng)的數(shù)據(jù)xα被稱為支持向量,超球體的大小、輪廓正是由支持向量決定的.將式(9)帶入式(8),拉格朗日函數(shù)問(wèn)題轉(zhuǎn)化為
(10)
通常原始空間數(shù)據(jù)不會(huì)呈現(xiàn)球狀分布,無(wú)法利用一個(gè)準(zhǔn)確的球面邊界來(lái)描述數(shù)據(jù).因此考慮通過(guò)映射將數(shù)據(jù)投影到高維空間,使高維空間數(shù)據(jù)呈球型分布.通過(guò)構(gòu)建包含高維空間數(shù)據(jù)的超球面進(jìn)行數(shù)據(jù)描述.引入核函數(shù)代替高維數(shù)據(jù)間的內(nèi)積運(yùn)算.由于Gaussian核具有更加穩(wěn)定的數(shù)據(jù)描述能力,因此通常選取高斯核函數(shù)[22-24]作為映射對(duì)應(yīng)的函數(shù):
KG(xi,xj)=exp[-(xi-xj)2/s2].
(11)
其中s為核參數(shù).將式(11)帶入式(10)得到
(12)
通過(guò)式(12)計(jì)算支持向量xα到球心a的距離Rα.
(13)
將Rα設(shè)定為控制限,當(dāng)新的樣本到球心的距離D 針對(duì)非線性數(shù)據(jù)和多模態(tài)數(shù)據(jù)進(jìn)行2次實(shí)驗(yàn).通過(guò)式(14)得到500個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)X,并通過(guò)加入0.65的階躍信號(hào)產(chǎn)生30個(gè)故障數(shù)據(jù)F. (14) e為高斯隨機(jī)噪聲.數(shù)據(jù)滿足非線性特征. 用SVDD對(duì)訓(xùn)練數(shù)據(jù)X進(jìn)行建模,其中主要參數(shù)C可由式(5)確定為0.2,s通過(guò)交叉驗(yàn)證法確定為0.4.得到控制限Rα.檢測(cè)結(jié)果如圖2所示. 圖2 非線性數(shù)據(jù)SVDD檢測(cè)圖 從圖3 可以看出數(shù)據(jù)的非線性結(jié)構(gòu),支持向量分布在數(shù)據(jù)邊界上.連接支持向量的曲線為等高線,代表等高線上的數(shù)據(jù)在高維空間中到球心的距離等于支持向量到球心的距離. 圖3 非線性數(shù)據(jù)輪廓 通過(guò)式(15)得到稀疏差異較大的兩個(gè)模態(tài)數(shù)據(jù)X1和X2,每個(gè)模態(tài)擁有250個(gè)訓(xùn)練樣本,40個(gè)校驗(yàn)樣本.同時(shí)生成5個(gè)位于模態(tài)間的5個(gè)故障數(shù)據(jù)F1和靠近密集模態(tài)的故障數(shù)據(jù)F2. (15) 用SVDD 對(duì)訓(xùn)練數(shù)據(jù)X1和X2進(jìn)行建模,其中主要參數(shù)C可由式(5)確定為0.2,s通過(guò)交叉驗(yàn)證法確定為0.6.得到控制限Rα. 圖3和圖4展示了SVDD描述的訓(xùn)練數(shù)據(jù)邊界(輪廓). 此邊界上的點(diǎn)在高維空間中與支持向量到球心距離等高.SVDD方法對(duì)邊界數(shù)據(jù)有著嚴(yán)格的界定,當(dāng)新來(lái)數(shù)據(jù)到球心的距離大于半徑時(shí),就會(huì)被認(rèn)定為故障數(shù)據(jù).圖5和圖6分別為多模態(tài)數(shù)據(jù)SVDD檢測(cè)圖和多模態(tài)數(shù)據(jù)KNN檢測(cè)圖. 圖4 多模態(tài)數(shù)據(jù)輪廓 圖5 SVDD多模態(tài)數(shù)據(jù)檢測(cè)圖 圖6 多模態(tài)數(shù)據(jù)KNN檢測(cè)圖 針對(duì)多模態(tài)數(shù)據(jù)中各模態(tài)稀疏差異較大時(shí)SVDD的檢測(cè)不會(huì)受到影響,而KNN方法則會(huì)發(fā)生檢測(cè)錯(cuò)誤.因?yàn)槊芗B(tài)數(shù)據(jù)樣本近鄰之間距離尺度遠(yuǎn)小于稀疏模態(tài)中樣本近鄰距離.這就會(huì)導(dǎo)致靠近密集模態(tài)的故障樣本計(jì)算統(tǒng)計(jì)量D2時(shí),距離會(huì)被稀疏模態(tài)距離尺度覆蓋,導(dǎo)致此類故障無(wú)法被檢測(cè). SVDD方法對(duì)于線性、非線性、多模態(tài)數(shù)據(jù)均可以有效地進(jìn)行數(shù)據(jù)邊界描述,并且對(duì)異常值進(jìn)行準(zhǔn)確判定. 半導(dǎo)體數(shù)據(jù)來(lái)源于美國(guó)德州儀器公司的半導(dǎo)體生產(chǎn)過(guò)程實(shí)際數(shù)據(jù).半導(dǎo)體工藝過(guò)程[25-27]是典型的間歇過(guò)程,數(shù)據(jù)類型是典型的三維數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)集由3個(gè)不同實(shí)驗(yàn)共129個(gè)生產(chǎn)批次組成,每一生產(chǎn)批次對(duì)應(yīng)不等長(zhǎng)的采樣時(shí)間和相同的21個(gè)變量.由于數(shù)據(jù)缺失,第2個(gè)實(shí)驗(yàn)的第22正常批次數(shù)據(jù)(整體數(shù)據(jù)的第56批次數(shù)據(jù))只有3個(gè)采樣時(shí)刻.本文針對(duì)數(shù)據(jù)包里的107個(gè)批次和21個(gè)故障批次進(jìn)行數(shù)據(jù)預(yù)處理. 圖7為變量EndPt A的變量軌跡,可以看出半導(dǎo)體數(shù)據(jù)為3個(gè)模態(tài)數(shù)據(jù). 圖7 變量EndPt A軌跡 圖8 多向展開(kāi)半導(dǎo)體KNN檢測(cè)圖 圖9 多向展開(kāi)半導(dǎo)體數(shù)據(jù)SVDD檢測(cè)圖 多向展開(kāi)方法會(huì)增加數(shù)據(jù)維數(shù)從而增加SVDD、KNN計(jì)算量和建模時(shí)間,同時(shí)由于數(shù)據(jù)采樣不等長(zhǎng),需要對(duì)數(shù)據(jù)進(jìn)行截取,此操作會(huì)將有用信息拋棄并且增加多余的信息,從而影響檢測(cè)結(jié)果. 圖10 SPA-KNN半導(dǎo)體檢測(cè)圖 圖11 SPA-SVDD半導(dǎo)體檢測(cè)圖 文章提出一種SPA-SVDD的故障檢測(cè)方法,并應(yīng)用于半導(dǎo)體過(guò)程監(jiān)控和故障檢測(cè).實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法對(duì)間歇過(guò)程故障檢測(cè)的優(yōu)越性,在實(shí)際生產(chǎn)中具有較強(qiáng)的指導(dǎo)意義.統(tǒng)計(jì)模量分析方法可有效將間歇過(guò)程數(shù)據(jù)的三維數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)化成二維數(shù)據(jù)結(jié)構(gòu),避免采樣不等長(zhǎng)帶來(lái)的問(wèn)題,同時(shí)保留了原始數(shù)據(jù)特征.SVDD方法對(duì)非線性數(shù)據(jù)、多模態(tài)數(shù)據(jù)可以準(zhǔn)確地檢測(cè)故障.下一步工作方向?qū)?huì)針對(duì)SVDD方法中參數(shù)的確定、故障的定位及分類.2.2 數(shù)值實(shí)驗(yàn)
3 仿真實(shí)驗(yàn)
3.1 半導(dǎo)體工藝過(guò)程介紹及數(shù)據(jù)處理
3.2 實(shí)例仿真
4 結(jié) 論