国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的化工過程故障診斷方法

2024-01-01 00:00:00胡宇鵬郭麗杰張子龍康建新崔超宇喬桂英
燕山大學(xué)學(xué)報(bào) 2024年6期
關(guān)鍵詞:注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)故障診斷

收稿日期:2024-01-03責(zé)任編輯:王建青

基金項(xiàng)目:河北省自然科學(xué)基金資助項(xiàng)目(E2021203069);秦皇島市科技計(jì)劃項(xiàng)目(202101A319)

作者簡介:胡宇鵬(1999-),男,河北唐山人,碩士研究生,主要研究方向?yàn)榛み^程安全;*通信作者:郭麗杰(1972-),女,遼寧葫蘆島人,博士,副教授,主要研究方向?yàn)榛み^程安全,Email:guolijie56970@126.com。

摘要:為了從復(fù)雜化工過程的海量監(jiān)測(cè)數(shù)據(jù)中提取出有效的故障特征,及時(shí)發(fā)現(xiàn)故障并準(zhǔn)確識(shí)別故障原因,提出了一種基于優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的化工過程故障診斷方法。首先,構(gòu)建一維卷積神經(jīng)網(wǎng)絡(luò)二分類狀態(tài)監(jiān)測(cè)模型,以顯著提高狀態(tài)監(jiān)測(cè)效率。其次,針對(duì)卷積神經(jīng)網(wǎng)絡(luò)無法評(píng)估網(wǎng)絡(luò)特征數(shù)據(jù)重要程度的問題,引入注意力機(jī)制,通過為數(shù)據(jù)特征賦予不同權(quán)重,有效捕捉特征細(xì)節(jié),抑制干擾信息,從而實(shí)現(xiàn)復(fù)雜化工系統(tǒng)中故障關(guān)鍵特征的自動(dòng)提取,提高多種故障模式診斷的準(zhǔn)確率。然后,針對(duì)卷積神經(jīng)網(wǎng)絡(luò)超參數(shù)優(yōu)化手動(dòng)設(shè)置建模效率低的問題,采用樹型Parzen估計(jì)算法超參數(shù)優(yōu)化技術(shù),通過靈活的建模方式和高效的采集函數(shù)實(shí)現(xiàn)對(duì)超參數(shù)組合的自動(dòng)精準(zhǔn)調(diào)優(yōu),構(gòu)建優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的故障診斷模型。最后,采用田納西-伊斯曼過程對(duì)所提出方法的有效性進(jìn)行驗(yàn)證。結(jié)果表明,該方法能夠及時(shí)、有效地監(jiān)測(cè)并診斷出多種故障模式,可為維修人員提供可靠的決策依據(jù)。

關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);化工過程;故障診斷;注意力機(jī)制;超參數(shù)優(yōu)化

中圖分類號(hào): X937文獻(xiàn)標(biāo)識(shí)碼: ADOI:10.3969/j.issn.1007-791X.2024.06.009

0引言

眾所周知,大型化工生產(chǎn)裝置工藝流程極其復(fù)雜、設(shè)備種類和數(shù)量眾多,且介質(zhì)通常具有易燃、易爆、有毒的特性,一旦發(fā)生故障,整個(gè)裝置的運(yùn)行可能會(huì)受到影響,甚至引發(fā)災(zāi)難性后果。近年來,國內(nèi)外化工生產(chǎn)事故頻發(fā),安全生產(chǎn)面臨嚴(yán)峻挑戰(zhàn)[1-2]。因此,采取有效措施保障生產(chǎn)安全勢(shì)在必行。

故障診斷在保障化工安全生產(chǎn)中發(fā)揮著重要的作用。目前,故障診斷方法分為基于知識(shí)、基于解析模型和基于數(shù)據(jù)驅(qū)動(dòng)的方法[3]。其中,基于知識(shí)的方法主要依賴專家知識(shí),基于模型的方法需要建立準(zhǔn)確的過程機(jī)理模型,因而,對(duì)于日益復(fù)雜的大型化工裝置,這兩類方法都難以普遍應(yīng)用[4]。而基于數(shù)據(jù)驅(qū)動(dòng)的方法是針對(duì)狀態(tài)監(jiān)測(cè)數(shù)據(jù)提取故障特征,不需要復(fù)雜的專業(yè)知識(shí)。對(duì)于廣泛采用DCS積累出海量監(jiān)測(cè)數(shù)據(jù)的大型化工裝置,基于數(shù)據(jù)驅(qū)動(dòng)的方法正在成為故障診斷研究的熱點(diǎn)[5]。

基于數(shù)據(jù)驅(qū)動(dòng)的方法主要包括多元統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法[6-7],對(duì)于高維、高度耦合、非線性的化工過程海量監(jiān)測(cè)數(shù)據(jù),多元統(tǒng)計(jì)方法通常對(duì)處理這些動(dòng)態(tài)非線性和非高斯特征數(shù)據(jù)具有很大的局限性,故障診斷效果不理想。因此,近年來以機(jī)器學(xué)習(xí)為核心的人工智能故障診斷方法備受關(guān)注。按照網(wǎng)絡(luò)結(jié)構(gòu),機(jī)器學(xué)習(xí)分為淺層學(xué)習(xí)與深度學(xué)習(xí),相較于以支持向量機(jī)為代表的淺層學(xué)習(xí)算法,深層學(xué)習(xí)算法通過構(gòu)建多個(gè)隱藏層進(jìn)行故障特征的有效提取,從而可以解決淺層學(xué)習(xí)表征能力不足和數(shù)據(jù)處理能力有限的缺點(diǎn),提高故障診斷的準(zhǔn)確率,因而一些學(xué)者正在積極探索基于深度學(xué)習(xí)的化工過程故障診斷研究。以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)為代表的深度學(xué)習(xí)故障診斷方法,不只應(yīng)用于抽油機(jī)、軸承等機(jī)械方向[8-9],在化工領(lǐng)域也越來越受到重視[10-11]。

程誠等[12]提出了一種將數(shù)值數(shù)據(jù)轉(zhuǎn)化成雷達(dá)圖的分類方法,將化工過程的高維信息轉(zhuǎn)變?yōu)橹庇^的平面信息,便于直觀感受特征的時(shí)序變化。蘇堪裂[13]提出了一種粒子群優(yōu)化卷積神經(jīng)網(wǎng)絡(luò),對(duì)CNN的部分超參數(shù)進(jìn)行優(yōu)化。Wu等[14]提出了一種深度卷積神經(jīng)網(wǎng)絡(luò)模型,將一維時(shí)域信息轉(zhuǎn)化為便于卷積操作的二維數(shù)據(jù)矩陣,可以更好地提取特征。張佳鑫等[15]提出了強(qiáng)化深度卷積神經(jīng)網(wǎng)絡(luò),用最大平滑單元來代替?zhèn)鹘y(tǒng)激活函數(shù),同時(shí)引入注意力機(jī)制和結(jié)合門控循環(huán)單元用于解決神經(jīng)網(wǎng)絡(luò)參數(shù)冗余的問題,在工業(yè)致動(dòng)器控制系統(tǒng)和工業(yè)酸性氣體吸收過程中都取得了不錯(cuò)的效果。

CNN結(jié)合注意力機(jī)制可以進(jìn)一步增強(qiáng)網(wǎng)絡(luò)模型對(duì)非線性高維數(shù)據(jù)的特征提取能力。但是,高性能的CNN故障診斷模型結(jié)構(gòu)趨于復(fù)雜化,導(dǎo)致產(chǎn)生了大量的超參數(shù)。這些超參數(shù)的選擇對(duì)于模型性能具有至關(guān)重要的影響。然而,在現(xiàn)有CNN故障診斷方法中,手動(dòng)調(diào)整模型超參數(shù)以優(yōu)化性能通常需要耗費(fèi)大量時(shí)間。此外,隨著超參數(shù)數(shù)量的增加,模型的計(jì)算量也會(huì)呈指數(shù)級(jí)增長,從而導(dǎo)致建模效率很低。

為解決上述問題,提出一種優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的化工過程故障診斷方法。首先構(gòu)建CNN故障診斷模型,在該模型中融入注意力機(jī)制,對(duì)化工過程中物質(zhì)、能量和信息傳遞等比較敏感的特征進(jìn)行重要度評(píng)估,并為這些特征分配相應(yīng)的權(quán)重,從而可以更加準(zhǔn)確地捕捉關(guān)鍵信息,增強(qiáng)網(wǎng)絡(luò)的泛化能力。然后,在結(jié)構(gòu)優(yōu)化的CNN中引入樹型Parzen估計(jì)算法(Tree-structured Parzen Estimator,TPE),TPE能夠自適應(yīng)地自動(dòng)調(diào)整參數(shù)搜索空間的大小,從而在盡可能少的迭代次數(shù)內(nèi)找到全局最優(yōu)解。該方法不僅可以有效提高模型的計(jì)算效率和性能,還能進(jìn)一步提高故障診斷的準(zhǔn)確率,實(shí)現(xiàn)復(fù)雜化工過程的高效智能化故障診斷。

1卷積神經(jīng)網(wǎng)絡(luò)

CNN的命名最早起源于Yann LeCun的LeNet-5[16],其原理起源于20世紀(jì)80年代,由Kunihiko Fukushima提出[17]。它借鑒了生物獨(dú)特的認(rèn)知機(jī)制,其局部敏感性和方向選擇性可以有效地降低神經(jīng)網(wǎng)絡(luò)的復(fù)雜性[18]。CNN可以自動(dòng)提取特征并學(xué)習(xí),通過局部篩選抽取數(shù)據(jù)的關(guān)鍵信息。卷積操作具有平移不變性,同時(shí)其多層的結(jié)構(gòu)可以逐步提取深度特征。它通常由卷積層、池化層(下采樣層)、全連接層和輸出層組成,完成前向傳播和反向調(diào)節(jié)。其中,一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)模型主要是由一維輸入層、卷積層、池化層、全連接層和輸出層構(gòu)成。

輸入層:把狀態(tài)監(jiān)測(cè)數(shù)據(jù)轉(zhuǎn)換為一維向量,作為CNN的輸入。

卷積層:通過多個(gè)卷積核進(jìn)行特征提取,并采用非線性激活函數(shù)輸出特征。常用的激活函數(shù)有ReLU、Tanh、Sigmoid等函數(shù),文中采用ReLU函數(shù)。一維卷積層的計(jì)算公式如下:

式中:Hlj為l層第j個(gè)輸出;Mj為l-1層中第j個(gè)卷積區(qū)域;i為卷積計(jì)算的次數(shù);代表卷積計(jì)算;Hl-1j為l-1層第j個(gè)輸出;Wlij表示為l層中對(duì)應(yīng)的權(quán)重(卷積核);blj為l層中的偏置;f(x)表示非線性激活函數(shù)。

池化層:降低數(shù)據(jù)維度并提取關(guān)鍵特征,常見的池化類型包括最大池化和平均池化,文中采用最大池化,計(jì)算公式如下:

G(I)=max(G(i),G(i+1),…,G(i+L-1)),(2)

P=(G(I),G(I+1),…,G((N-L)/S+1)),(3)

式中:G(i)表示輸入序列在位置i的元素;max表示選擇最大值的操作;G(I)表示進(jìn)行一次池化操作所得到的結(jié)果;P表示池化層的全部輸出,為一維數(shù)據(jù)序列;N表示整個(gè)輸入序列的全部長度;L表示池化窗口的大?。籗表示池化窗口的步長,即每個(gè)池化窗口移動(dòng)的距離。

全連接層:將之前卷積和池化層提取的特征重新排成一列,計(jì)算公式為

式中:zlj代表第l層第j個(gè)輸出;n代表輸入神經(jīng)元的個(gè)數(shù);Hl-1i代表l-1層第i個(gè)輸出;Wlij代表示l層中對(duì)應(yīng)的權(quán)重;blj代表l層中的偏置;σ(x)表示非線性激活函數(shù)。

輸出層:對(duì)于故障多分類問題通常采用Softmax函數(shù)歸一化,輸出通道與故障模式一一對(duì)應(yīng),最后以數(shù)值最大的通道所對(duì)應(yīng)的故障模式作為網(wǎng)絡(luò)輸出。計(jì)算公式為

式中:Zi代表第i個(gè)數(shù)據(jù)所對(duì)應(yīng)的輸入數(shù)據(jù);n代表所有輸入數(shù)據(jù)的個(gè)數(shù)。

2優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的化工過程故障診斷方法2.1注意力機(jī)制-卷積神經(jīng)網(wǎng)絡(luò)模型

首先以化工過程多參數(shù)監(jiān)測(cè)數(shù)據(jù)作為輸入,故障模式作為輸出,建立1D-CNN故障診斷模型。然后在每個(gè)卷積層之后引入一個(gè)注意力層,將注意力機(jī)制融入到卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,重點(diǎn)關(guān)注復(fù)雜化工系統(tǒng)中的關(guān)鍵故障特征,由此構(gòu)建注意力機(jī)制-卷積神經(jīng)網(wǎng)絡(luò)模型(Attention Convolutional Neural Networks, ACNN),架構(gòu)如圖1所示。

注意力機(jī)制分為單路和多路注意力機(jī)制[19]。單路注意力機(jī)制只有一個(gè)路徑或一種方式來計(jì)算注意力權(quán)重。多路注意力機(jī)制擴(kuò)展了標(biāo)準(zhǔn)的注意力機(jī)制,允許模型在同一層中學(xué)習(xí)多個(gè)不同的注意力權(quán)重,以便同時(shí)提取輸入數(shù)據(jù)的多個(gè)特征。注意力機(jī)制又可分為空間、通道、時(shí)間和分支等類型。在CNN中,空間和通道注意力機(jī)制最為常用,文中分別引入SE-Net(Squeeze-and-Excitation Networks)和CBAM(Convolutional Block Attention Module)兩種注意力機(jī)制,通過性能對(duì)比確定最終方案。

1) SE-Net注意力機(jī)制

單路的通道注意力機(jī)制的SE-Net架構(gòu)如圖2所示,其過程包括壓縮Fsq和激勵(lì)Fex兩個(gè)部分。通道數(shù)保持不變,每個(gè)通道的特征圖通過全局平均池化進(jìn)行擠壓,再將特征圖擠壓成一個(gè)包含全圖特征的實(shí)數(shù),最后形成一個(gè)特征向量。激勵(lì)過程是通過全連接層來學(xué)習(xí)每個(gè)通道的權(quán)重,對(duì)特征向量應(yīng)用一個(gè)縮放因子,最后自適應(yīng)地找到能夠表達(dá)復(fù)雜系統(tǒng)特征重要性高的通道。

2) CBAM注意力機(jī)制

CBAM結(jié)合了通道和空間的注意力模塊對(duì)網(wǎng)絡(luò)重要特征進(jìn)行強(qiáng)化[20],架構(gòu)如圖3所示。通道注意力模塊使用全局平均池化和最大池化最大程度地提取數(shù)據(jù)特征,然后依次送入一個(gè)全連接層中,將處理結(jié)果相加并采用Sigmoid函數(shù)得到通道注意力的權(quán)重矩陣,再與原數(shù)據(jù)相乘得到與輸入數(shù)據(jù)維數(shù)相同的數(shù)據(jù)。空間注意力模塊是對(duì)通道進(jìn)行壓縮,在通道維度分別進(jìn)行了平均值池化和最大值池化,將提取的特征進(jìn)行卷積,再用Sigmoid函數(shù)進(jìn)行激活,最終與通道注意力模塊處理后的數(shù)據(jù)進(jìn)行點(diǎn)乘得到輸出數(shù)據(jù)。表示如下:

MC(F)=σ(MLP(AvgPool(F)+MaxPool(F))),(6)

MS(F)=σ(f(AvgPool(F);MaxPool(F))),(7)

式中:f(·)表示卷積操作;σ(·)表示Sigmoid函數(shù);Mc(F)表示通道注意力模塊所提取的特征;Ms(F)表示空間注意力模塊所提取的特征。

2.2HA-CNN的超參數(shù)優(yōu)化

在CNN中,超參數(shù)往往指訓(xùn)練之前就已經(jīng)確定好的參數(shù),例如學(xué)習(xí)率、遺忘率、批尺寸等。超參數(shù)優(yōu)化是一個(gè)尋找最優(yōu)超參數(shù)組合以實(shí)現(xiàn)最佳網(wǎng)絡(luò)性能的過程,通過不斷調(diào)整超參數(shù)組合,深入挖掘訓(xùn)練數(shù)據(jù)的內(nèi)在特征,從而獲得對(duì)具有相似特征的未知數(shù)據(jù)集的良好識(shí)別能力[21]。因此參數(shù)設(shè)置是否適當(dāng)對(duì)CNN模型的性能有著決定性的作用。目前,常用的超參數(shù)優(yōu)化算法有網(wǎng)格搜索、隨機(jī)采樣、貝葉斯優(yōu)化、TPE等[22]。

針對(duì)化工過程監(jiān)測(cè)數(shù)據(jù)的高維度、非線性和多變量強(qiáng)耦合等特點(diǎn),研究采用TPE方法對(duì)已建立的ACNN模型進(jìn)行超參數(shù)自動(dòng)優(yōu)化,構(gòu)建超參數(shù)-注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)(Hyperparametric optimization-Attention mechanism Convolutional Neural Network, HA-CNN)故障診斷模型。TPE方法通過構(gòu)建一個(gè)樹型結(jié)構(gòu)模型,并使用Parzen窗函數(shù)估計(jì)每個(gè)超參數(shù)的概率分布。相比于傳統(tǒng)的網(wǎng)格搜索、遺傳算法等方法,TPE方法可以自適應(yīng)地調(diào)整參數(shù)搜索空間大小,高效地尋找神經(jīng)網(wǎng)絡(luò)全局最優(yōu)解,特別適用于高維復(fù)雜問題。其樹型結(jié)構(gòu)將每個(gè)超參數(shù)視為一個(gè)節(jié)點(diǎn),而超參數(shù)之間的關(guān)系則被視為樹枝,這種結(jié)構(gòu)能夠捕捉到超參數(shù)之間的依賴關(guān)系,并使得TPE方法能夠更有效地搜索超參數(shù)空間。

與TPE相融合的ACNN方法的架構(gòu)如圖4所示。研究對(duì)ACNN中的卷積核尺寸、學(xué)習(xí)率、權(quán)重衰減因子等八種超參數(shù)進(jìn)行優(yōu)化,輸出的最優(yōu)解即為ACNN模型的最優(yōu)參數(shù),由此建立HA-CNN模型。

2.3故障診斷性能評(píng)價(jià)指標(biāo)

為了全面地評(píng)價(jià)所建狀態(tài)監(jiān)測(cè)和故障診斷模型的性能,研究采用準(zhǔn)確率(Accuracy)、故障診斷率(Fault Diagnosis Rate, FDR)作為檢驗(yàn)指標(biāo)。準(zhǔn)確率采用預(yù)測(cè)結(jié)果正確的樣本數(shù)量除以總的樣本數(shù)量來表示。故障診斷率表示第i種預(yù)測(cè)結(jié)果正確的樣本數(shù)量占第i種樣本總量的比例。

2.4優(yōu)化CNN的故障診斷方法

研究提出的基于優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的化工過程故障診斷方法包括離線建模和在線故障診斷兩部分,其流程圖如圖5所示。

2.4.1離線建模

1) 數(shù)據(jù)預(yù)處理

把收集到的正常和故障工況歷史數(shù)據(jù)劃分成狀態(tài)監(jiān)測(cè)數(shù)據(jù)集和故障診斷數(shù)據(jù)集,均采用Z-score方法進(jìn)行標(biāo)準(zhǔn)化處理,以消除不同量綱對(duì)于特征提取過程的影響。

2) 建立CNN狀態(tài)監(jiān)測(cè)模型

為了快速、準(zhǔn)確地進(jìn)行狀態(tài)監(jiān)測(cè),研究首先建立二分類CNN狀態(tài)監(jiān)測(cè)模型直接反映設(shè)備的工作狀態(tài)。狀態(tài)監(jiān)測(cè)模型的輸出為二分類:正?;蚬收瞎r。將已經(jīng)完成預(yù)處理的狀態(tài)監(jiān)測(cè)數(shù)據(jù)集分成為訓(xùn)練集和測(cè)試集,通過訓(xùn)練過程的多次迭代和參數(shù)更新,以測(cè)試樣本預(yù)測(cè)結(jié)果的準(zhǔn)確率作為評(píng)價(jià)指標(biāo),確定最優(yōu)的CNN參數(shù),保存模型。

3) 建立HA-CNN故障診斷模型

為了更好地評(píng)估和優(yōu)化故障診斷模型,把故障診斷數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。

首先引入注意力機(jī)制優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),構(gòu)建ACNN多分類故障診斷模型。將時(shí)序排列的多個(gè)監(jiān)測(cè)數(shù)據(jù)作為模型輸入,把相應(yīng)的故障模式編號(hào)作為輸出;定義網(wǎng)絡(luò)結(jié)構(gòu),如網(wǎng)絡(luò)的層數(shù)、隱藏層的節(jié)點(diǎn)數(shù)、卷積核的尺寸、激活函數(shù)等;設(shè)定訓(xùn)練的次數(shù)、批量大小等。采用故障診斷訓(xùn)練集和驗(yàn)證集進(jìn)行多次訓(xùn)練,把驗(yàn)證集準(zhǔn)確率最高的ACNN模型作為最優(yōu)的網(wǎng)絡(luò)模型并保存。

之后,將故障診斷中的訓(xùn)練集和驗(yàn)證集進(jìn)行TPE超參數(shù)優(yōu)化,進(jìn)行學(xué)習(xí)率、權(quán)重衰減因子等連續(xù)參數(shù)和輸入樣本數(shù)、隱藏層節(jié)點(diǎn)等非連續(xù)參數(shù)的迭代優(yōu)化,根據(jù)不同超參數(shù)組合的準(zhǔn)確率結(jié)果,選取出最優(yōu)超參數(shù)組合。確定最優(yōu)超參數(shù)組合后,再用故障診斷中的訓(xùn)練集和驗(yàn)證集進(jìn)行訓(xùn)練,選取出最高的驗(yàn)證集準(zhǔn)確率所對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)參數(shù)值作為該模型參數(shù)的最優(yōu)值。

最后采用故障診斷中的測(cè)試集進(jìn)行測(cè)試,故障診斷準(zhǔn)確率滿足要求即最終完成HA-CNN模型的構(gòu)建。

2.4.2在線故障診斷

1) 把采集到的實(shí)時(shí)工況數(shù)據(jù)采用Z-score方法進(jìn)行標(biāo)準(zhǔn)化預(yù)處理。

2) 將預(yù)處理后的實(shí)時(shí)工況數(shù)據(jù)作為CNN狀態(tài)監(jiān)測(cè)模型的輸入,由網(wǎng)絡(luò)輸出判斷是否發(fā)生故障。當(dāng)該神經(jīng)網(wǎng)絡(luò)輸出結(jié)果表示為正常工況時(shí),繼續(xù)進(jìn)行下一時(shí)刻的數(shù)據(jù)采集和監(jiān)測(cè);當(dāng)該神經(jīng)網(wǎng)絡(luò)輸出結(jié)果表示為故障工況時(shí),將工況監(jiān)測(cè)數(shù)據(jù)輸入到HA-CNN模型中進(jìn)行故障模式識(shí)別,根據(jù)不同的故障類型發(fā)出相應(yīng)的故障預(yù)警,提醒操作和維修人員依據(jù)工況變化,做好維修準(zhǔn)備。

3實(shí)例分析

研究采用田納西-伊斯曼(Tennessee Eastman,TE)過程來驗(yàn)證所提出方法的有效性。TE仿真模型來自文獻(xiàn)[23],采用預(yù)置模態(tài)1進(jìn)行仿真。每個(gè)數(shù)據(jù)樣本有53個(gè)觀測(cè)變量,包括41個(gè)測(cè)量變量和12個(gè)控制變量,其中測(cè)量變量包括22個(gè)連續(xù)測(cè)量變量和19個(gè)組分測(cè)量變量。由于控制變量中的壓縮機(jī)循環(huán)閥XMV-5開度、汽提塔再沸器加熱蒸汽閥XMV-9開度和攪拌器速度XMV-12都是常量,這三個(gè)常量不予考慮,只選取其他的50個(gè)觀測(cè)變量進(jìn)行研究。

在數(shù)據(jù)采集中,對(duì)于預(yù)設(shè)的20種故障工況均進(jìn)行5次重復(fù)仿真。首先正常工況運(yùn)行8小時(shí),之后引入故障運(yùn)行20小時(shí)。每3分鐘采集1次數(shù)據(jù),每小時(shí)得到20個(gè)樣本。考慮到故障模式6在故障引入后,只能持續(xù)運(yùn)行7小時(shí),為了保持?jǐn)?shù)據(jù)集中各種故障模式樣本數(shù)量的一致性,故障模式6共重復(fù)模擬了15次。上述仿真得到的故障樣本分別作為狀態(tài)監(jiān)測(cè)數(shù)據(jù)集(隨機(jī)抽取1次)和故障診斷數(shù)據(jù)集(剩下4次)。

狀態(tài)監(jiān)測(cè)數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,由于是二分類網(wǎng)絡(luò),所以訓(xùn)練集和測(cè)試集中只設(shè)置了正常工況數(shù)據(jù)集和故障工況數(shù)據(jù)集。正常工況仿真單獨(dú)運(yùn)行了300小時(shí),前200小時(shí)得到的樣本用于訓(xùn)練集,后100個(gè)小時(shí)得到的樣本用于測(cè)試集;故障樣本分別取每種故障模式仿真得到的前10個(gè)小時(shí)和之后5個(gè)小時(shí)的樣本。

故障診斷數(shù)據(jù)集分為三部分,其中隨機(jī)取50%的仿真數(shù)據(jù)用于訓(xùn)練集、另外50%的樣本平均分配分別用于驗(yàn)證集和測(cè)試集。上述的所有數(shù)據(jù)都按照2.4.1中的方法進(jìn)行預(yù)處理,各數(shù)據(jù)樣本數(shù)量如表1所示。

3.1離線狀態(tài)監(jiān)測(cè)建模

首先建立1D-CNN狀態(tài)監(jiān)測(cè)模型,由兩層卷積構(gòu)成,網(wǎng)絡(luò)中的各項(xiàng)超參數(shù)設(shè)置如下:dropout為0.2,lr為0.01,weight_decay為0.005,卷積核的大小為4,隱藏層節(jié)點(diǎn)為40,1D-CNN輸入的樣本個(gè)數(shù)n_sample為3。圖6為該模型迭代50次之后的訓(xùn)練集和測(cè)試集的準(zhǔn)確率。

由圖6可知,測(cè)試集到第35次整體監(jiān)測(cè)準(zhǔn)確率基本穩(wěn)定,第49次達(dá)到最大值99.37%,表明該模型能夠有效地實(shí)現(xiàn)對(duì)化工生產(chǎn)過程的狀態(tài)監(jiān)測(cè)。

3.2離線故障診斷建模

為尋找1D-CNN最優(yōu)故障診斷模型,根據(jù)輸入批次大小,卷積核及卷積層和池化層個(gè)數(shù)不同,共建立了10種不同網(wǎng)絡(luò)層數(shù)和結(jié)構(gòu)的CNN(如表2所示)。采用故障診斷訓(xùn)練集中的數(shù)據(jù)作為輸入,與輸入相對(duì)應(yīng)的故障模式從1到20進(jìn)行編號(hào)作為輸出標(biāo)簽。每種網(wǎng)絡(luò)模型訓(xùn)練50個(gè)epoch,運(yùn)行10次作為1組,共運(yùn)行10組。各種網(wǎng)絡(luò)架構(gòu)的訓(xùn)練結(jié)果如圖7和表3所示。

由圖7和表3可知,在10種CNN架構(gòu)中,從總體上看,Model 5訓(xùn)練結(jié)果的平均準(zhǔn)確率最高,因而確定Model 5作為故障診斷卷積神經(jīng)網(wǎng)絡(luò)的框架。從以上數(shù)據(jù)中還可以看出,一方面,雖然網(wǎng)絡(luò)層數(shù)的增加理論上會(huì)提升整體的準(zhǔn)確率,但過多的神經(jīng)網(wǎng)絡(luò)層數(shù)結(jié)構(gòu)會(huì)導(dǎo)致過擬合現(xiàn)象,從而影響網(wǎng)絡(luò)特征提取的準(zhǔn)確率。另一方面,適當(dāng)增加批尺寸大小和卷積層輸出維數(shù)可以提高網(wǎng)絡(luò)特征提取準(zhǔn)確率。

之后,將注意力機(jī)制融入到Model 5中,分別建立基于SE-Net和CBAM的ACNN模型,通過比較兩種網(wǎng)絡(luò)模型訓(xùn)練結(jié)果的準(zhǔn)確率來確定最優(yōu)的ACNN架構(gòu)。將上述兩個(gè)模型均進(jìn)行50次樣本迭代訓(xùn)練,記錄最高準(zhǔn)確率,連續(xù)運(yùn)行5組,故障診斷準(zhǔn)確率如圖8所示。由圖8可知,在三種模型中,多路注意力機(jī)制的CBAM-1D-CNN的故障診斷準(zhǔn)確率最高,因而選用CBAM與1D-CNN相融合,得到ACNN模型。

由圖9可知第8組超參數(shù)組合的準(zhǔn)確率最高,其最優(yōu)超參數(shù)具體數(shù)值如表4所示。超參數(shù)優(yōu)化后的卷積神經(jīng)網(wǎng)絡(luò)即為HA-CNN模型。將HA-CNN模型對(duì)訓(xùn)練集和驗(yàn)證集進(jìn)行50次迭代,故障診斷準(zhǔn)確率和損失值如圖10和圖11所示。

由圖10和11可知,經(jīng)過30次迭代后,訓(xùn)練和驗(yàn)證過程的收斂都趨于穩(wěn)定,而且驗(yàn)證集的故障診斷準(zhǔn)確率最高達(dá)到了90.68%。最終把測(cè)試集數(shù)據(jù)作為故障診斷樣本進(jìn)行預(yù)處理輸入到已建立的神經(jīng)網(wǎng)絡(luò)模型,運(yùn)行網(wǎng)絡(luò)后各故障模式診斷結(jié)果的混淆矩陣如圖12所示,由于每次進(jìn)入網(wǎng)絡(luò)的樣本數(shù)都為4,所以實(shí)際故障診斷個(gè)數(shù)為397個(gè)。1D-CNN、SE-1D-CNN、CBAM-1D-CNN和HA-CNN的測(cè)試集故障診斷結(jié)果對(duì)比如表5所示。

由表5可知,HA-CNN模型的整體故障診斷準(zhǔn)確率為88.33%,與標(biāo)準(zhǔn)1D-CNN模型相比,故障診斷準(zhǔn)確率提高了15.64%,與SE-1D-CNN模型相比,故障診斷準(zhǔn)確率提高了13.66%,與CBAM-1D-CNN模型相比,故障診斷準(zhǔn)確率提高了6.8%;而且與其他方法相比,HA-CNN方法對(duì)于故障3、5、9和15等難以檢測(cè)的故障檢出率以及整體的檢出率都有明顯的提升。其中,故障3、5、9和15都與溫度有關(guān),在整個(gè)過程控制系統(tǒng)中,溫度的變化存在滯后性,因而與溫度相關(guān)聯(lián)的工藝參數(shù)之間的相互作用也存在滯后性。例如,故障9為反應(yīng)器冷卻水溫度變化,該參數(shù)變化直接影響反應(yīng)器內(nèi)溫度,進(jìn)而影響反應(yīng)速率和反應(yīng)的正常進(jìn)行,但是冷卻水與反應(yīng)器溫度之間作用有嚴(yán)重的滯后性,反應(yīng)器冷卻水溫度變化,并不能很快地反映反應(yīng)器相關(guān)各工藝參數(shù)的變化,因此,這種滯后性可能會(huì)造成故障診斷方法準(zhǔn)確率低和發(fā)生漏檢,但運(yùn)用研究所提出的方法該故障診斷準(zhǔn)確率也達(dá)到了70.03%。

由表5還可以看出,HA-CNN方法與文獻(xiàn)[24]中DBN(Deep Belief Network)方法相比,顯著提高了整體故障診斷準(zhǔn)確率,且故障15、16的診斷準(zhǔn)確率明顯提升。與文獻(xiàn)[25]中AAE(Adversarial Autoencoder)和文獻(xiàn)[26]中HGAN(High-Efficiency Generative Adversarial Network)方法相比,HA-CNN方法不僅整體準(zhǔn)確率高于二者,而且明顯提高了故障3、5、9、15的診斷準(zhǔn)確率。以上結(jié)果說明HA-CNN方法增強(qiáng)了神經(jīng)網(wǎng)絡(luò)的魯棒性,能夠提取復(fù)雜化工過程中其他方法難以提取到的參數(shù)滯后特征,從而驗(yàn)證了該故障診斷方法的有效性。

4結(jié)論

為了深度挖掘高維、高度耦合、非線性的化工過程海量監(jiān)測(cè)數(shù)據(jù)的特征,提出了優(yōu)化的CNN化工過程故障診斷方法。基于化工過程大數(shù)據(jù),建立1D-CNN模型,把多路注意力機(jī)制CBAM引入到CNN中,強(qiáng)化網(wǎng)絡(luò)重要特征,建立ACNN故障診斷模型,從而重點(diǎn)關(guān)注化工過程中物質(zhì)、能量和信息傳遞的復(fù)雜關(guān)系,以增強(qiáng)網(wǎng)絡(luò)特征提取能力。為了進(jìn)一步提高ACNN模型參數(shù)優(yōu)化的效率和有效性,把TPE方法與ACNN相融合進(jìn)行超參數(shù)自適應(yīng)優(yōu)化,以增強(qiáng)神經(jīng)網(wǎng)絡(luò)的泛化能力和魯棒性,從而建立了基于優(yōu)化CNN的離線和在線智能故障診斷模型。

TE過程實(shí)例驗(yàn)證結(jié)果表明,對(duì)于多故障模式,優(yōu)化的CNN模型故障診斷準(zhǔn)確率高,與標(biāo)準(zhǔn)CNN模型相比,整體故障診斷準(zhǔn)確率提高了15.64%,特別是對(duì)于與溫度相關(guān)的滯后型故障,采用該方法可以明顯提高故障診斷準(zhǔn)確率,從而可為化工安全生產(chǎn)提供可靠的依據(jù)。

參考文獻(xiàn)

[1] 仇登可, 侯士超, 劉鋒. 反演在化工過程故障診斷中的探索[J]. 化工管理, 2022(27): 136-139.

QIU D K, HOU S C, LIU F.Exploration of inversion in fault diagnosis of chemical process[J]. Chemical Management, 2022(27): 136-139.

[2] 張偉, 王連彪, 張廣帥. 基于RF-RFECV和PSO-SVM的化工過程故障診斷方法[J]. 青島科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 43(5): 101-108.

ZHANG W, WANG L B, ZHANG G S. Fault diagnosis method of chemical process based on RF-RFECV and PSO-SVM[J]. Journal of Qingdao University of Science and Technology(Natural Science Edition), 2022,43(5): 101-108.

[3] 任玉佳. 基于機(jī)理相關(guān)分析貝葉斯網(wǎng)絡(luò)的化工過程故障診斷[D]. 青島: 青島科技大學(xué), 2020.

REN Y J.Fault diagnosis of chemical process using mechanism correlation based Bayesian network[D]. Qingdao: Qingdao University of Science and Technology, 2020.

[4] YAO L, GE Z Q. Deep learning of semisupervised process data with hierarchical extreme learning machine and soft sensor application[J]. IEEE Transactions on Industrial Electronics, 2018, 65(2): 1490-1498.

[5] LIU Y, YANG C, GAO Z L, et al. Ensemble deep kernel learning with application to quality prediction in industrial polymerization processes[J]. Chemometrics amp; Intelligent Laboratory Systems, 2018, 174: 15-21.

[6] 楊曉暉, 王衛(wèi)賓. 基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)模型[J]. 燕山大學(xué)學(xué)報(bào), 2023, 47(1): 73-81.

YANG X H, WANG W B. Rumor detection model based on gated graph neural network[J]. Journal of Yanshan University, 2023, 47(1): 73-81.

[7] 陳奧. 基于改進(jìn)多元統(tǒng)計(jì)方法的故障診斷技術(shù)研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2017.

CHEN A.The research on the modified multivariate statistics based fault diagnosis technology[D]. Harbin:Harbin Institute of Technology, 2017.

[8] 吳昊臻, 許燕, 周建平, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)的抽油機(jī)故障診斷[J]. 燕山大學(xué)學(xué)報(bào), 2024, 48(1): 30-38.

WU H Z, XU Y, ZHOU J P, et al.Fault diagnosis of pumping unit based on convolutional neural network[J]. Journal of Yanshan University, 2024, 48(1): 30-38.

[9] 時(shí)培明, 吳術(shù)平, 于越, 等. 基于注意力機(jī)制和深度殘差網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷[J]. 燕山大學(xué)學(xué)報(bào), 2024, 48(1): 39-47.

SHI P M, WU S P, YU Y, et al.Rolling bearing fault diagnosis based on attention mechanism and depth residual network[J]. Journal of Yanshan University, 2024, 48(1): 39-47.

[10] JIA F, LEI Y G, GUO L, et al. A neural network constructed by deep learning technique and its application to intelligent fault diagnosis of machines[J]. Neurocomputing, 2018, 272: 619-628.

[11] 張士發(fā). 基于深度學(xué)習(xí)與符號(hào)有向圖的化工過程故障診斷[D]. 青島: 青島科技大學(xué), 2023.

ZHANG S F. Fault diagnosis of chemical process based on deep learning and signed directed graph[D]. Qingdao: Qingdao University of Science and Technology, 2023.

[12] 程誠, 任佳. 一種基于雷達(dá)圖表示的數(shù)值型數(shù)據(jù)CNN分類方法[J]. 信息與控制, 2019, 48(4): 429-436.

CHENG C, REN J.A classification method of CNN for numerical data based on radar chart representation[J]. Information and Control, 2019, 48(4): 429-436.

[13] 蘇堪裂. 基于卷積神經(jīng)網(wǎng)絡(luò)的化工過程故障診斷研究[D]. 廣州: 華南理工大學(xué), 2020.

SU K L. Fault diagnosis of chemical process based on convolutional neural network research[D]. Guangzhou:South China University of Technology, 2020.

[14] WU H, ZHAO J S. Deep convolutional neural network model based chemical process fault diagnosis[J]. Computers amp; Chemical Engineering, 2018, 115: 185-197.

[15] 張佳鑫, 張淼, 戴一陽, 等. 面向?qū)嶋H化工過程故障診斷的強(qiáng)化深度卷積神經(jīng)網(wǎng)絡(luò)模型構(gòu)建與應(yīng)用[J].化工進(jìn)展, 2024, 43(9): 4833-4844.

ZHANG J X, ZHANG M, DAI Y Y, et al. Design and application of enhanced DCNN model for fault diagnosis in practical chemical processes [J]. Chemical Industry and Engineering Progress, 2024, 43(9): 4833-4844.

[16] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.

[17] FUKUSHIMA K. Neocognitron: a self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]. Biological Cybernetics, 1980, 36(4): 193-202.

[18] 張新魁. 基于自組織網(wǎng)絡(luò)的PX化工過程故障診斷識(shí)別研究[D]. 秦皇島: 燕山大學(xué), 2023.

ZHANG X K.Research on fault diagnostic recognition in PX chemical process based on self-organization network[D]. Qinhuangdao: Yanshan University, 2023.

[19] 朱張莉, 饒?jiān)?吳淵, 等. 注意力機(jī)制在深度學(xué)習(xí)中的研究進(jìn)展[J]. 中文信息學(xué)報(bào), 2019, 33(6): 1-11.

ZHU Z L, RAO Y, WU Y, et al.Research progress of attention mechanism in deep learning[J]. Journal of Chinese Information Processing, 2019, 33(6): 1-11.

[20] YAN X A, YAN W J, XU Y D, et al. Machinery multi-sensor fault diagnosis based on adaptive multivariate feature mode decomposition and multi-attention fusion residual convolutional neural network[J]. Mechanical Systems and Signal Processing, 2023, 202: 1-33.

[21] BERGSTRA J, BARDENET R, BENGIO Y, et al. Algorithms for hyper-parameter optimization[C] //International Conference on Neural Information Processing Systems.Red Hook, USA:Curran Associates Inc.,2011: 2546-2554.

[22] 羅敏, 楊勁鋒, 俞蕙, 等. 基于TPE優(yōu)化集成學(xué)習(xí)的短期負(fù)荷預(yù)測(cè)方法[J/OL]. 上海交通大學(xué)學(xué)報(bào).(2023-05-30)[2023-11-09].https://doi.org/10.16183/j.cnki.jsjtu. 2022.483.

LUO M, YANG J F, YU H, et al. TPE-based boosting short-term load forecasting method online first[J/OL]. Journal of Shanghai Jiaotong University.(2023-05-30)[2023-11-09].https://doi.org/10.16183/j.cnki.jsjtu. 2022.483.

[23] BATHELT A, RICKER N L, JELALI M. Revision of the Tennessee Eastman process model[J]. IFAC-PapersOnLine, 2015, 48(8): 309-314.

[24] ZHANG Z P, ZHAO J S. A deep belief network based fault diagnosis model for complex chemical processes[J]. Computers amp; Chemical Engineering, 2017, 107: 395-407.

[25] JANG K, HONG S, KIM M, et al. Adversarial autoencoder based feature learning for fault detection in industrial processes[J]. IEEE Transactions on Industrial Informatics, 2021, 18(2): 827-834.

[26] QIN R S, ZHAO J S. High-efficiency generative adversarial network model for chemical process fault diagnosis[J].IFAC-PapersOnLine, 2022, 55(7): 732- 737.

Fault diagnosis method based on optimized convolutional

neural network for chemical process

HU Yupeng1, GUO Lijie1, ZHANG Zilong1, KANG Jianxin1,2, CUI Chaoyu1, QIAO Guiying1

(1. School of Environmental and Chemical Engineering, Yanshan University, Qinhuangdao, Hebei 066004, China;

2. Hebei Key Laboratory of Applied Chemistry,Yanshan University, Qinhuangdao, Hebei 066004, China)

Abstract: In order to extract effective fault features from the massive monitoring data of complex chemical process, a fault diagnosis method for chemical process based on optimized Convolutional Neural Network (CNN) is proposed to find faults in time and accurately identify the fault cause. Firstly, a one-dimensional CNN for binary classification is constructed to improve the efficiency of condition monitoring. Secondly, to address the issue that CNN cannot evaluate the importance of network feature data, the attention mechanism is introduced into the fault diagnosis model of CNN, which can effectively capture feature details and suppress interference information. Different weights are assigned to the importance of the network feature data to realize the automatic extraction of key fault features for complex chemical systems. Then, to tackle the low efficiency challenge in manual hyperparameter optimization, the Tree-structured Parzen Estimator (TPE) hyperparameter optimization technology is used to realize the precise tuning of hyperparameter combination with flexible modeling method and efficient acquisition function. The optimized fault diagnosis model of CNN is constructed. Finally, the Tennessee Eastman (TE) process is used to verify the effectiveness of the proposed method. The results show that the proposed method can detect multiple failure modes in a timely and effective manner, which can provide a reliable decision-making basis for maintenance staff.

Keywords: convolutional neural network; chemical process; fault diagnosis; attention mechanism; hyperparameter optimization

猜你喜歡
注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)故障診斷
基于深度學(xué)習(xí)的問題回答技術(shù)研究
基于LSTM?Attention神經(jīng)網(wǎng)絡(luò)的文本特征提取方法
基于注意力機(jī)制的雙向LSTM模型在中文商品評(píng)論情感分類中的研究
軟件工程(2017年11期)2018-01-05 08:06:09
InsunKBQA:一個(gè)基于知識(shí)庫的問答系統(tǒng)
基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
基于卷積神經(jīng)網(wǎng)絡(luò)的樹葉識(shí)別的算法的研究
因果圖定性分析法及其在故障診斷中的應(yīng)用
基于LCD和排列熵的滾動(dòng)軸承故障診斷
英德市| 武功县| 合阳县| 彩票| 喀什市| 马山县| 吉林省| 田阳县| 台南县| 铜山县| 沙田区| 双鸭山市| 荥经县| 中西区| 北安市| 滨海县| 厦门市| 会昌县| 深水埗区| 中西区| 从化市| 瑞昌市| 辽源市| 阳高县| 陕西省| 巩留县| 雷山县| 福安市| 托里县| 仙桃市| 沧源| 洪湖市| 泰和县| 三穗县| 大石桥市| 涞源县| 诸城市| 南康市| 朝阳市| 昔阳县| 泸西县|