国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于差分動態(tài)主元分析的多模態(tài)過程故障檢測

2020-01-16 03:00黃瑩瑩
沈陽化工大學學報 2019年4期
關(guān)鍵詞:主元差分模態(tài)

李 元, 黃瑩瑩

(沈陽化工大學 信息工程學院, 遼寧 沈陽 110142)

隨著自動化技術(shù)的發(fā)展和對產(chǎn)品質(zhì)量要求的不斷提高,現(xiàn)代生產(chǎn)過程變得越來越復雜,同時故障發(fā)生的概率也在不斷增加,因此,對工業(yè)過程進行實時監(jiān)控,對可能發(fā)生的故障進行實時在線監(jiān)測與診斷是現(xiàn)代工業(yè)中不可或缺的一部分.近年來,故障診斷技術(shù)[1-3]不斷發(fā)展,其中基于數(shù)據(jù)驅(qū)動的故障診斷方法[4-6]是它的一個重要分支,它利用過程數(shù)據(jù)建立故障檢測模型,提取過程中有用信息,并通過這些信息判斷過程是否處于正常狀態(tài).

多元統(tǒng)計過程監(jiān)控(multivariate statistical process monitoring,MSPM)是目前基于數(shù)據(jù)驅(qū)動的主流方法,其中應用最廣泛的為主元分析(principal component analysis,PCA)算法[7-8].PCA使用T2統(tǒng)計量和SPE統(tǒng)計量作為統(tǒng)計指標進行故障檢測,但傳統(tǒng)的PCA方法是靜態(tài)多變量方法.為了將PCA應用于動態(tài)過程,Ku等[9]在1995年提出了動態(tài)主元分析(dynamic principal component analysis,DPCA)的概念,并得到了廣泛應用[10-11].DPCA通過引入變量觀測值構(gòu)造增廣矩陣,然后對增廣矩陣進行PCA建模來解決這一問題.但PCA、DPCA方法假定過程數(shù)據(jù)是單一模態(tài),而對多模態(tài)過程的監(jiān)控效果不好.為了能夠更好地監(jiān)測多模態(tài)過程,He[12]提出了基于k近鄰的故障檢測方法(fault detection-knearest neighbor rule,FD-kNN),該方法以kNN距離為監(jiān)測指標,可以實現(xiàn)對方差差異不明顯的多模態(tài)數(shù)據(jù)的監(jiān)測,但該方法對距離的求解計算量較大,所占存儲空間也比較大,阻礙了該方法的在線實施.為了克服上述缺點并保留FD-kNN在處理多模態(tài)數(shù)據(jù)時的優(yōu)勢,在FD-kNN基礎(chǔ)上,He又提出了基于k近鄰的主元分析故障檢測方法[13](principal component basedk-nearest-neighbor,PC-kNN),并成功地應用于半導體生產(chǎn)過程中.該方法利用PCA降維和信息處理后,將FD-kNN方法應用于主元子空間的得分矩陣中.但該方法的故障警告和數(shù)據(jù)丟失比FD-kNN多.此外Ma等提出了局部近鄰標準化((local neighborhood standardized,LNS)[14]方法用來解決方差差異明顯的多模態(tài)數(shù)據(jù),但k值的選取會對整個系統(tǒng)的性能產(chǎn)生影響.因此,針對現(xiàn)代生產(chǎn)過程中數(shù)據(jù)的多模態(tài)和動態(tài)時間序列問題,本文將差分法和DPCA算法相結(jié)合,提出基于差分動態(tài)主元分析(differential dynamic principal component analysis,Dif-DPCA)的故障檢測方法,差分法可以剔除原始數(shù)據(jù)的多模態(tài)特性,DPCA算法可以有效處理數(shù)據(jù)的動態(tài)特性.

1 基于動態(tài)主元分析的故障檢測方法(DPCA)

傳統(tǒng)PCA方法是靜態(tài)的多變量檢測方法,該方法假設(shè)當前時刻觀測數(shù)據(jù)與過去時刻觀測數(shù)據(jù)是相互獨立的,當采樣時間較長時這種假設(shè)有效.但在實際生產(chǎn)過程中,采樣間隔較小,如果不考慮動態(tài)關(guān)系的影響,檢測結(jié)果可能達不到預期.為了更好地監(jiān)測生產(chǎn)過程,Ku[9]等在論文中提出了DPCA方法.該方法應用前面時刻的觀測數(shù)據(jù)對當前觀測數(shù)據(jù)進行擴充,得到新矩陣,再對新矩陣進行PCA.DPCA算法彌補了PCA算法在處理動態(tài)關(guān)系上的不足,因此,由DPCA方法得到的主元更能真實地反映過程數(shù)據(jù)的動態(tài)特性.

假設(shè)原始數(shù)據(jù)X∈Rn×m,即X具有n個樣本,m個變量.具有h個時滯的觀測數(shù)據(jù)的增廣矩陣為

(1)

(1) 令h=0,數(shù)據(jù)中的靜態(tài)關(guān)系數(shù)等于變量數(shù)減去主元個數(shù);

(2) 令h=1,數(shù)據(jù)中的動態(tài)關(guān)系數(shù)等于變量數(shù)減去主元個數(shù),再減去式(1)中計算的靜態(tài)關(guān)系數(shù);

(3) 增加h的值,并按照遞推公式(2)計算新的動態(tài)關(guān)系數(shù),直到rnew(h)≤0為止.

(2)

將式(1)得到的增廣矩陣X(h)作為訓練數(shù)據(jù)進行PCA運算.首先對X(h)進行z-score標準化處理,使其變?yōu)榫禐?、方差為1的數(shù)據(jù)陣,然后構(gòu)造協(xié)方差矩陣S:

(3)

對協(xié)方差矩陣S進行奇異值分解(SVD)得到

S=VΛVT.

(4)

其中:Λ為對角陣,其對角線上元素為協(xié)方差矩陣S的特征值,且λ1≥λ2≥…≥λn≥0;矩陣V為S的特征向量.

主元子空間得分矩陣T∈Xm×k,T為

T=XP.

(5)

其中:P∈Xm×k為主元空間的負載矩陣,由S的前k個主元組成,矩陣P將原始數(shù)據(jù)X從高維空間降維到低維空間.

將上式變換得

(6)

(7)

將X投影到主元空間和殘差空間

(8)

主元個數(shù)的選取主要是根據(jù)累計方差貢獻率(cumulative percent varience,CPV)選取.

(9)

其中λi是X的協(xié)方差矩陣的特征值.當CPV值大于期望值時,所得k值即為主元個數(shù).

根據(jù)式(10)、(11)計算SPE統(tǒng)計量和T2統(tǒng)計量

SPE=‖(I-PPT)x‖2,

(10)

T2=xTPΛ-1PTx.

(11)

PCA模型建立后,對于待檢測樣本,經(jīng)差分處理后構(gòu)建增廣矩陣,然后向PCA模型上投影,在主元子空間建立平方預測誤差(Squared Prediction Error,SPE)統(tǒng)計量、殘差子空間HotellingT2統(tǒng)計量,并將統(tǒng)計量與對應控制限比較,判斷檢測過程是否發(fā)生異常.

2 基于差分動態(tài)主元分析的故障檢測方法

2.1 差分算法

差分可以在保持數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上削弱其中心漂移的影響.差分[15]算法的思想是計算出訓練樣本中每個樣本的近鄰距離并排序,找到每個樣本的最近鄰樣本,并用原始訓練樣本減去其最近鄰樣本,其差值組成新的訓練樣本.

假設(shè)數(shù)據(jù)集X∈Rn×m,在數(shù)據(jù)集X中找到每個樣本xi的最近鄰樣本xj,然后進行差分運算,方法如下:

Dxi=xi-xj.

(12)

其中Dxi為差分矩陣,將其作為新的訓練樣本參與后續(xù)運算.差分法可以有效去除數(shù)據(jù)多模態(tài)特性.

2.2 基于差分動態(tài)主元分析的故障檢測(Dif-DPCA)

基于差分動態(tài)主元分析的故障檢測過程分為兩步:離線建模和在線檢測.

離線建模過程如下:

(1) 收集正常操作時的歷史數(shù)據(jù)集X,X∈Rn×m,n為樣本數(shù),m為變量數(shù);X的每一列代表一個測量變量,每一行代表一個測量樣本;

(2) 利用差分法對原始數(shù)據(jù)集X進行處理,去除多模態(tài)特征,處理后的矩陣記為X1;

(3) 根據(jù)公式(2)計算出合適的滯后h,對矩陣X1進行擴充,構(gòu)造增廣矩陣X1(h);

(4) 對X1(h)進行PCA降維和特征提??;

(5) 根據(jù)式(10)、(11)計算SPE統(tǒng)計量和T2統(tǒng)計量;

在線檢測過程如下:

(1) 對于待測樣本數(shù)據(jù)F,找到樣本fi的最近鄰樣本,將fi與其最近鄰樣本做差分處理,得到新矩陣,記為F1;

(2) 根據(jù)時滯h構(gòu)造增廣矩陣F1(h);

(4) 將SPE統(tǒng)計量SPEi與控制限SPEα比較,若SPEi>SPEα,則將該樣本判定為故障樣本,反之正常;

差分動態(tài)主元分析的流程如圖1所示.

圖1 Dif-DPCA算法流程Fig.1 Dif-DPCA algorithm flowchart

3 數(shù)值例子

選用的數(shù)值例子為Ku在論文中提到的多變量自回歸過程,并另加入一個模態(tài),構(gòu)成多模態(tài)的AR過程.

(13)

Y(k)=Z(k)+V(k).

其中:U是相關(guān)輸入;輸入W是隨機噪聲;V(k)是均值為0、方差為0.01的隨機噪聲.用于分析的向量由[YT(k)UT(k)YT(k-1)UT(k-1)]構(gòu)成.

由公式(13)產(chǎn)生兩個模態(tài):第一模態(tài)均值為0、方差為1;第二模態(tài)均值為3,方差為2.每個模態(tài)產(chǎn)生100個訓練數(shù)據(jù)、10個校驗數(shù)據(jù),共200個訓練數(shù)據(jù)、20個訓練數(shù)據(jù).另外產(chǎn)生5個故障數(shù)據(jù)用于檢測方法的有效性,故障加在W中.

訓練樣本共4列,圖2給出了變量4的分布散點圖.由圖2(a)可知:原始變量4的散點圖為中心不同、方差差異不明顯的兩個模態(tài);由圖2(b)可知:經(jīng)z-score標準化處理后雖然消除了量綱,但并沒有消除多模態(tài)特征;由圖2(c)可以看出:經(jīng)差分處理后兩個模態(tài)變?yōu)橐粋€模態(tài),剔除了多模態(tài)特征.圖3給出數(shù)據(jù)的直方圖.

圖2 變量4分布散點圖Fig.2 Scatter plot of variable 4 distribution

圖3 變量4分布圖Fig.3 Distribution chart of variable 4

由圖3(a)可知:原始數(shù)據(jù)包含兩個模態(tài),不滿足單峰高斯分布;由圖3(b)可知:經(jīng)差分處理后變?yōu)橐粋€模態(tài),滿足高斯分布,為PCA、DPCA算法的應用提供了適宜的數(shù)據(jù)條件.

分別使用PCA、DPCA、差分主元分析(difference principal component analysis,Dif-PCA)、Dif-DPCA方法進行仿真實驗,選取主元個數(shù)為2,滯后為1.仿真結(jié)果如圖4至圖7所示.

由圖4可以看出:T2和SPE控制限由第二模態(tài)決定,應用PCA算法不能檢測到任一故障.這是由于PCA是線性統(tǒng)計量,對單一模態(tài)數(shù)據(jù)處理效果很好,而對于不服從高斯分布的多模態(tài)數(shù)據(jù)處理效果不好.圖5給出了DPCA的檢測結(jié)果,可以看出:雖然T2統(tǒng)計量在214、215時刻有誤報,但相比PCA算法,DPCA算法的SPE統(tǒng)計量有一個故障變量被檢測出來,因此,對于動態(tài)過程,DPCA算法的檢測效果比PCA好.由圖6可以看出:相比PCA和DPCA算法,Dif-PCA方法的SPE統(tǒng)計量雖然有誤報,但是能檢測出大部分故障.這是由于引入了差分思想,使原始數(shù)據(jù)變?yōu)榱朔母咚狗植嫉膯我荒B(tài),為PCA方法的檢測提供了適宜的數(shù)據(jù)條件.但SPE統(tǒng)計量和T2統(tǒng)計量仍然各有一個故障沒有檢測出來.這可能是由于數(shù)據(jù)的動態(tài)特性造成的.因此,使用Dif-DPCA方法對多模態(tài)AR過程進行檢測.由圖7可以看出:T2統(tǒng)計量無誤報產(chǎn)生并且檢測到4個故障,SPE統(tǒng)計量檢測出全部5個故障,并且無誤報產(chǎn)生.與Dif-PCA算法比較,對于動態(tài)過程引入DPCA思想,故障檢測效果比使用PCA效果好.綜上所述,與其他3種方法比,Dif-DPCA算法的效果最好,同時證明了該算法的可行性.

圖4 多模態(tài)AR過程的PCA故障檢測結(jié)果Fig.4 PCA fault detection results of multimodal AR process

圖5 多模態(tài)AR過程的DPCA故障檢測結(jié)果Fig.5 DPCA fault detection results of multimodal AR process

圖6 多模態(tài)AR過程的Dif-PCA故障檢測結(jié)果Fig.6 Dif-PCA fault detection results of multimodal AR process

圖7 多模態(tài)AR過程的Dif-DPCA故障檢測結(jié)果Fig.7 Dif-DPCA fault detection results of multimodal AR process

4 工業(yè)實例

對半導體工業(yè)過程進行故障檢測.所用數(shù)據(jù)的采集來自A1堆腐蝕過程[18-20].半導體生產(chǎn)過程是典型的非線性、時變、多工況過程,如圖8所示.

圖8 半導體數(shù)據(jù)Fig.8 Semiconductor data

半導體數(shù)據(jù)采集來自3個不同實驗的共129個晶片數(shù)據(jù),包括108個正常晶片和21個故障晶片.由于一個正常晶片和故障晶片存在數(shù)據(jù)丟失,因此,實際可用的批次為107個正常批次和20個故障批次.在107個正常晶片中隨機選取100個晶片為訓練集,7個晶片為校驗集,20個故障晶片組成故障集.原始半導體數(shù)據(jù)包含40個測量變量,本文使用其中17個變量.

以變量7為例,圖9給出了變量7的分布散點圖.由圖9(a)可以看出:原始變量7包含3個模態(tài),可知半導體過程是一個多模態(tài)過程.由圖9(b)可以看出:經(jīng)差分處理后變量7的3個模態(tài)變?yōu)橐粋€模態(tài),為PCA和DPCA算法的使用提供了良好的數(shù)據(jù)條件.

圖9 變量7分布散點圖Fig.9 Scatter plot of variable 7 distribution

依次對半導體采用4種故障診斷算法來比較不同故障診斷方法的性能.4種算法包括PCA、DPCA、Dif-PCA、Dif-DPCA.其中選取的主元數(shù)為2,滯后為1.圖10~圖13為不同算法的故障檢測效果圖.

圖10 基于PCA的SPE和T2檢測圖Fig.10 SPE and T2 detection chart based on PCA

圖11 基于DPCA的SPE和T2檢測圖Fig.11 SPE and T2 detection chart based on DPCA

圖12 基于Dif-PCA的SPE和T2檢測圖Fig.12 SPE and T2 detection chart based on Dif-PCA

圖13 基于Dif-DPCA的SPE和T2檢測圖Fig.13 SPE and T2 detection chart based on Dif-DPCA

由圖10可以看出:基于PCA算法的SPE檢測到11個故障,T2統(tǒng)計量檢測到4個故障,說明PCA在處理具有多模態(tài)和動態(tài)特性數(shù)據(jù)時存在局限性.由圖11可以看出:基于DPCA的SPE統(tǒng)計量檢測出13個故障并且無誤報現(xiàn)象,T2檢測出3個故障.通過比較圖10、圖11可以得出:使用DPCA算法比使用PCA算法效果好.這是由于半導體數(shù)據(jù)具有很強的時序性,當前某一時刻的數(shù)據(jù)會受到前面某一時刻數(shù)據(jù)的影響,因此,引入時滯可以檢測到更多的故障.但無論使用DPCA算法還是PCA算法都有部分故障沒有檢測出來.這是由半導體數(shù)據(jù)的多模態(tài)特性造成的,而DPCA和PCA算法都是針對單一模態(tài).由圖12可以看出:使用Dif-PCA算法對半導體數(shù)據(jù)進行故障檢測,T2檢測出13個故障,SPE檢測出19個故障,故障檢測率大大增加.這是由于引入了差分思想,去除了原始數(shù)據(jù)的多模態(tài)特性.由圖12可以看出SPE有1個故障未檢測出來,這是由于Dif-PCA算法雖然能處理數(shù)據(jù)的多模態(tài)特性,卻不能處理帶有時序性的數(shù)據(jù).由圖13看出:使用Dif-DPCA算法對半導體數(shù)據(jù)進行故障檢測,SPE檢測出全部20個故障,T2檢測出18個故障,并且都無誤報產(chǎn)生.與Dif-PCA算法相比,由于引入了動態(tài)觀測值h,最后一個故障被檢測出來,故障檢測率增加.與其他3種算法相比,Dif-DPCA方法的檢測效果最好,因此,證明了本文所提方法的有效性.表1給出了4種不同算法的檢測效果.

表1 99 %控制限下4種算法對半導體數(shù)據(jù)的監(jiān)測結(jié)果Table 1 Monitoring results of semiconductor data by four algorithms under 99 % control limit

5 結(jié) 論

針對具有多模態(tài)和動態(tài)特性的現(xiàn)代工業(yè)生產(chǎn)過程,提出了基于Dif-DPCA的故障檢測方法.Dif-DPCA方法不僅能處理多模態(tài)數(shù)據(jù),還能對具有動態(tài)關(guān)系的過程數(shù)據(jù)進行檢測.Dif-DPCA方法應用差分法對原始數(shù)據(jù)進行處理,降低數(shù)據(jù)中心漂移影響,使多模態(tài)數(shù)據(jù)變?yōu)榉母咚狗植嫉膯我荒B(tài),為PCA和DPCA算法的使用提供了適宜的數(shù)據(jù)條件;對新數(shù)據(jù)應用DPCA算法,克服了動態(tài)關(guān)系的影響.對多模態(tài)AR過程和半導體生產(chǎn)過程的仿真研究表明:Dif-DPCA算法克服了傳統(tǒng)PCA、DPCA算法在多模態(tài)和動態(tài)過程監(jiān)測中的局限性,仿真結(jié)果較為理想,證明了本文所提方法的有效性.

猜你喜歡
主元差分模態(tài)
RLW-KdV方程的緊致有限差分格式
基于BERT-VGG16的多模態(tài)情感分析模型
符合差分隱私的流數(shù)據(jù)統(tǒng)計直方圖發(fā)布
多模態(tài)超聲監(jiān)測DBD移植腎的臨床應用
數(shù)列與差分
跨模態(tài)通信理論及關(guān)鍵技術(shù)初探
應用主元變換法分解因式
轉(zhuǎn)換主元 解放思想
運用結(jié)構(gòu)的齊次化,選換主元解題
相對差分單項測距△DOR