馬方圓,林德溪,許明陽,王璟德,孫巍
(1北京化工大學(xué)化學(xué)工程學(xué)院,北京100029;2中化泉州石化有限公司,福建泉州362103)
隨著自動(dòng)化水平不斷提高,化學(xué)工業(yè)生產(chǎn)運(yùn)行中大量的測(cè)量數(shù)據(jù)可以被讀取并存儲(chǔ)在數(shù)據(jù)庫(kù)中,使得利用多元統(tǒng)計(jì)學(xué)方法提取數(shù)據(jù)特征用于過程監(jiān)測(cè)的想法得以應(yīng)用[1-2]。目前,用于過程監(jiān)測(cè)的多元統(tǒng)計(jì)學(xué)方法主要有主元分析法(principal component analysis,PCA)、偏最小二乘法(partial least square,PLS)、獨(dú)立成分分析法(independent component analysis,ICA)等[3]。這些方法主要通過提取數(shù)據(jù)之間的相互關(guān)系來建立監(jiān)測(cè)模型。其中PCA是常用的過程監(jiān)測(cè)方法之一,通過監(jiān)測(cè)當(dāng)前裝置運(yùn)行狀態(tài)與預(yù)設(shè)運(yùn)行狀態(tài)的偏差來實(shí)現(xiàn)對(duì)過程偏離的識(shí)別[4-5]。
在實(shí)際生產(chǎn)過程中存在著一些緩變的故障,在故障發(fā)生初期時(shí)偏離預(yù)設(shè)運(yùn)行狀態(tài)并不明顯,不易被基于PCA 的過程監(jiān)測(cè)模型識(shí)別出來。但這些緩變故障如果不被及時(shí)發(fā)現(xiàn),不僅會(huì)導(dǎo)致產(chǎn)品質(zhì)量的下降,影響企業(yè)的生產(chǎn)效益,甚至?xí)?dǎo)致生產(chǎn)安全事故的發(fā)生,威脅人員生命安全[6-7]。目前針對(duì)緩變故障的識(shí)別,主要是利用統(tǒng)計(jì)分析方法對(duì)數(shù)據(jù)信號(hào)進(jìn)行處理,捕捉其相對(duì)于正常狀態(tài)時(shí)的微小偏差[8-9]。例如,Mandal等[10-11]提出了一種基于時(shí)間序列的監(jiān)測(cè)方法,通過計(jì)算試驗(yàn)信號(hào)與標(biāo)準(zhǔn)信號(hào)之間距離的經(jīng)驗(yàn)累積分布函數(shù)來檢測(cè)微小的故障信號(hào),采用時(shí)間序列上的移動(dòng)平均方法對(duì)信號(hào)的微小偏離實(shí)現(xiàn)時(shí)間上的累積;周媛等[12]利用基于相關(guān)時(shí)間規(guī)整算法,獲取發(fā)動(dòng)機(jī)在退化過程中的數(shù)據(jù)信息,提取其數(shù)據(jù)特征,實(shí)現(xiàn)對(duì)發(fā)動(dòng)機(jī)狀態(tài)變化的識(shí)別;趙修斌等[13]提出了一種基于BP 神經(jīng)網(wǎng)絡(luò)的緩變故障雙閾值檢測(cè)方法,利用BP 神經(jīng)網(wǎng)絡(luò)建立回歸預(yù)測(cè)模型,在預(yù)測(cè)誤差的基礎(chǔ)上設(shè)置雙閾值的低檢測(cè)門限,可以實(shí)現(xiàn)對(duì)緩變故障發(fā)生初期微小變化的識(shí)別。這些方法均需要通過對(duì)系統(tǒng)的先驗(yàn)知識(shí)或足夠的故障案例來實(shí)現(xiàn)對(duì)監(jiān)測(cè)閾值的確定,但面對(duì)復(fù)雜系統(tǒng)或故障案例較少時(shí)則需要通過統(tǒng)計(jì)學(xué)方法計(jì)算出相應(yīng)的監(jiān)測(cè)指標(biāo)。
孫美紅等[14]提出了MCUSUM-PCA 方法,結(jié)合小波變換和累積和控制圖(MCUSUM)的方法實(shí)現(xiàn)了對(duì)緩變故障信息的放大,在此基礎(chǔ)上建立PCA模型,有效地改善了對(duì)緩變故障的監(jiān)測(cè)效果;Bakdi 等[15]利用PCA 算法建立過程監(jiān)測(cè)模型,通過基于修正的指數(shù)加權(quán)移動(dòng)平均(exponentially weighted moving average, EWMA)控制圖統(tǒng)計(jì)方法首先對(duì)統(tǒng)計(jì)量修正,開發(fā)了一種新的自適應(yīng)閾值方法,該方法可有效地檢測(cè)過程操作中的微小變化和突變;Harrou 等[16]利用PLS 算法作為建模框架,將對(duì)稱化的Kullback-Leibler 距離作為檢測(cè)異常情況的指標(biāo),通過計(jì)算無故障數(shù)據(jù)和故障數(shù)據(jù)概率密度函數(shù)之間的不相似性,實(shí)現(xiàn)對(duì)故障的早期識(shí)別,相較于傳統(tǒng)的基于PLS的過程監(jiān)測(cè)方法,對(duì)緩變故障具有更高的靈敏性和有效性。但這些方法計(jì)算復(fù)雜,且模型需提前設(shè)置眾多參數(shù),特別是機(jī)理過程不明時(shí),這些參數(shù)很難被準(zhǔn)確確定,因此應(yīng)用于化工生產(chǎn)過程中較為困難。
受以上方法的啟發(fā),假設(shè)能夠放大裝置發(fā)生故障時(shí)與預(yù)設(shè)狀態(tài)之間的偏差,則應(yīng)該可以更好地實(shí)現(xiàn)對(duì)緩變故障的識(shí)別。當(dāng)裝置平穩(wěn)運(yùn)行時(shí),變量之間的相互關(guān)系是固定的,一旦發(fā)生故障,這種關(guān)系也會(huì)隨之發(fā)生改變。此時(shí)使用原有的變量間的回歸關(guān)系預(yù)測(cè)某個(gè)變量,其預(yù)測(cè)值與實(shí)測(cè)值誤差則會(huì)很大。同時(shí)由于發(fā)生故障時(shí)每個(gè)變量本身均有微小的偏離,將其代入回歸模型中會(huì)進(jìn)一步放大預(yù)測(cè)值與實(shí)測(cè)值之間的誤差。如果在此基礎(chǔ)上建立過程監(jiān)測(cè)模型,則應(yīng)該能夠更好地實(shí)現(xiàn)對(duì)緩變故障的識(shí)別。PLS是一種常用于高維數(shù)據(jù)降維回歸的方法,利用PLS 提取了變量之間的互相關(guān)關(guān)系建立回歸模型,計(jì)算預(yù)測(cè)值與實(shí)際值之間的差值,實(shí)現(xiàn)了將裝置偏離正常工況的程度定量化。同時(shí),經(jīng)過PLS預(yù)處理后正常工況的數(shù)據(jù)分布范圍更小,更有利于發(fā)現(xiàn)緩變故障早期時(shí)的微小偏離。PCA是一種常用的高維數(shù)據(jù)降維方法,結(jié)合T2統(tǒng)計(jì)量可以較為容易地獲取監(jiān)測(cè)指標(biāo),用來判斷裝置的運(yùn)行狀態(tài)是否偏離正常工況。在經(jīng)PLS預(yù)處理后的數(shù)據(jù)基礎(chǔ)上建立PCA模型,相當(dāng)于變量之間的互相關(guān)關(guān)系進(jìn)行了二次挖掘,進(jìn)一步正交了監(jiān)測(cè)模型對(duì)變量間關(guān)系變化的敏感性,可以更好地實(shí)現(xiàn)對(duì)緩變故障的早期識(shí)別。同時(shí),相比于文獻(xiàn)中所提到的方法,將偏最小二乘法和主元分析法相融合,建立相應(yīng)的過程監(jiān)測(cè)模型過程更簡(jiǎn)單,監(jiān)測(cè)指標(biāo)易于獲取且所需選擇的參數(shù)較少,更易于應(yīng)用在工業(yè)實(shí)際生產(chǎn)過程中。
本文在PCA 模型的基礎(chǔ)上提出了PLS-PCA 模型,利用PLS算法提取過程變量之間的關(guān)系,獲取裝置運(yùn)行狀態(tài)與預(yù)設(shè)狀態(tài)間的偏差,在此基礎(chǔ)上建立PCA 模型,連續(xù)兩次提取變量之間的互相關(guān)關(guān)系,進(jìn)一步放大緩變故障的偏離程度,以實(shí)現(xiàn)對(duì)緩變故障的有效識(shí)別。該方法被應(yīng)用于某石化企業(yè)制氫裝置預(yù)轉(zhuǎn)化反應(yīng)器的過程監(jiān)測(cè)中,用于對(duì)緩變故障的早期識(shí)別。
PCA 及PLS 是兩種常見的過程監(jiān)測(cè)方法。其中,PCA是一種廣泛使用的數(shù)據(jù)降維方法,通過多元投影的方式將高維數(shù)據(jù)經(jīng)過線性變化后投影在相互正交的新空間內(nèi),實(shí)現(xiàn)了對(duì)高維數(shù)據(jù)的降維處理。后經(jīng)過美國(guó)數(shù)理統(tǒng)計(jì)學(xué)家Hotelling的改進(jìn),被廣泛應(yīng)用于化工生產(chǎn)過程中的過程監(jiān)測(cè)與故障診斷[17]。PLS 是一種常用的多元線性回歸方法,被應(yīng)用于許多領(lǐng)域的回歸計(jì)算,該方法通過提取變量間的潛變量,實(shí)現(xiàn)對(duì)高維數(shù)據(jù)的降維回歸,且可以有效去除變量之間的共線性[18]。
選取生產(chǎn)過程中正常運(yùn)行的歷史數(shù)據(jù)X ∈R(n×m),其中n為樣本數(shù),m為變量數(shù)。其協(xié)方差矩陣可由式(1)得到。
通過對(duì)原始矩陣X的分解,可以將原始矩陣寫成載荷矩陣pi和得分矩陣ti的乘積再加上殘差矩陣E的形式,如式(2)所示。
式中,k為PCA模型的主元個(gè)數(shù),可以通過累計(jì)方差貢獻(xiàn)率法(cumulative percent variance,CPV)、PRESS檢驗(yàn)法和交叉驗(yàn)證法等方法來確定。建立了PCA 監(jiān)測(cè)模型后,可以利用T2統(tǒng)計(jì)量及其控制限來判斷生產(chǎn)過程是否偏離正常的運(yùn)行狀態(tài)。T2統(tǒng)計(jì)量的計(jì)算如式(3)。
式中,λi為特征值;為ti的方差。
偏最小二乘法與主元分析法有許多相同點(diǎn),也可以很好地解決變量間的相關(guān)性問題,實(shí)現(xiàn)對(duì)高維數(shù)據(jù)的降維回歸,同時(shí)最大限度地保證自變量空間的數(shù)據(jù)特征對(duì)因變量的解釋作用。其實(shí)現(xiàn)過程如下,假設(shè)自變量X ∈R(n×m)及因變量Y ∈R(n×p)為經(jīng)過標(biāo)準(zhǔn)化處理后的數(shù)據(jù)矩陣,PLS通過提取變量的潛變量,并建立X和Y之間的有偏回歸模型。矩陣X和Y可以分別分解如式(4)和式(5)。
式中,T和U為得分矩陣;P和Q為載荷矩陣;α為潛變量的個(gè)數(shù);E和F為殘差矩陣;ti和ui為得分向量;pi和qi為載荷向量。
由線性估計(jì)可獲得ti和ui之間的關(guān)系,其關(guān)系如式(6)所示。
式中,bi為回歸系數(shù)。在PLS模型中,潛變量的個(gè)數(shù)是一個(gè)十分重要的參數(shù),可以通過交叉驗(yàn)證的方法來選取最優(yōu)的潛變量個(gè)數(shù)。殘差標(biāo)準(zhǔn)誤差(residual standard error,RSE)是評(píng)價(jià)線性回歸擬合效果的一個(gè)常用指標(biāo),被認(rèn)為是建立的模型與數(shù)據(jù)不匹配的度量[19],其計(jì)算如式(7)所示。
式中,yi表示真實(shí)值;y?i表示模型的預(yù)測(cè)價(jià)值。RSE值越小,說明模型的擬合效果越好。
在實(shí)際化工生產(chǎn)過程中,裝置平穩(wěn)運(yùn)行可視為裝置的預(yù)設(shè)狀態(tài)。當(dāng)裝置處于平穩(wěn)運(yùn)行狀態(tài)時(shí),變量之間的關(guān)系是相對(duì)穩(wěn)定的,因此可以利用PLS算法提取變量之間的關(guān)系,實(shí)現(xiàn)利用一部分變量回歸其余變量。當(dāng)裝置處于平穩(wěn)狀態(tài)時(shí),回歸值與實(shí)際值之間的偏差應(yīng)是均值為零,近于正態(tài)分布的數(shù)值較小的隨機(jī)值;而過程出現(xiàn)異常時(shí),盡管該偏差數(shù)值較小,但會(huì)呈持續(xù)大于或小于零的狀態(tài),是過程偏離及隨機(jī)波動(dòng)的疊加。
本文在PLS算法和PCA算法的基礎(chǔ)上構(gòu)建了一個(gè)PLS-PCA 模型,用于實(shí)現(xiàn)對(duì)化工生產(chǎn)過程中緩變故障的識(shí)別。如圖1所示,首先選取一段裝置平穩(wěn)運(yùn)行的過程數(shù)據(jù)作為PLS模型的訓(xùn)練數(shù)據(jù),針對(duì)每一個(gè)過程變量,依次提取其與剩余變量之間的回歸關(guān)系,分別建立PLS模型。利用所建立的各PLS回歸模型,可獲取假設(shè)裝置處于平穩(wěn)運(yùn)行狀態(tài)時(shí)各變量的預(yù)設(shè)值。
在建立PLS回歸模型的基礎(chǔ)上,選取另一段裝置平穩(wěn)運(yùn)行的數(shù)據(jù)作為PCA 模型的訓(xùn)練數(shù)據(jù),將其輸入至各PLS回歸模型中進(jìn)行預(yù)處理,獲取裝置各變量的預(yù)設(shè)值Yipre。通過計(jì)算變量實(shí)測(cè)值與預(yù)測(cè)值之間的誤差,獲取各變量相對(duì)于正常工況時(shí)的偏離程度ΔY,然后在偏離值ΔY的基礎(chǔ)上建立PCA過程監(jiān)測(cè)模型,至此基于PLS-PCA 的過程監(jiān)測(cè)模型建立完成。在運(yùn)用于實(shí)際生產(chǎn)過程的監(jiān)測(cè)時(shí),實(shí)時(shí)數(shù)據(jù)首先通過PLS回歸模型后計(jì)算出其與正常工況時(shí)的偏差,再將偏差值輸入PCA過程監(jiān)測(cè)模型中,從而實(shí)現(xiàn)對(duì)生產(chǎn)過程的實(shí)時(shí)監(jiān)測(cè)。
圖1 算法邏輯框圖
本研究所使用的數(shù)據(jù)均來自于某石化企業(yè)制氫裝置預(yù)轉(zhuǎn)化反應(yīng)器的實(shí)際生產(chǎn)數(shù)據(jù)。如圖2 所示,該反應(yīng)器為絕熱式固定床反應(yīng)器。原料氣沿軸向自上而下流經(jīng)反應(yīng)床層,在固體催化劑的作用下,高分子烴類與稀釋蒸汽發(fā)生預(yù)轉(zhuǎn)化反應(yīng),生產(chǎn)富甲烷氣體,從而降低了制氫轉(zhuǎn)化爐的反應(yīng)強(qiáng)度和熱負(fù)荷。
圖2 預(yù)轉(zhuǎn)化反應(yīng)器床層測(cè)溫點(diǎn)分布圖
在化工生產(chǎn)過程中,設(shè)備不同位置的組分、溫度和壓力數(shù)據(jù)可以直接或間接反映出反應(yīng)的進(jìn)程。其中組分?jǐn)?shù)據(jù)是對(duì)反應(yīng)進(jìn)程最直接的體現(xiàn),而溫度和壓力數(shù)據(jù)則反映了反應(yīng)的結(jié)果。如果能夠?qū)崟r(shí)獲取組分?jǐn)?shù)據(jù),則可以實(shí)現(xiàn)對(duì)反應(yīng)進(jìn)程的直接監(jiān)測(cè)。但在實(shí)際生產(chǎn)過程中,獲取組分?jǐn)?shù)據(jù)較為困難,相比于組分?jǐn)?shù)據(jù),溫度和壓力數(shù)據(jù)則更容易實(shí)現(xiàn)實(shí)時(shí)獲取。因此,工程師主要利用溫度和壓力數(shù)據(jù)來間接判斷反應(yīng)的進(jìn)程。
本文主要收集了該預(yù)轉(zhuǎn)化反應(yīng)器的床層溫度數(shù)據(jù)用于實(shí)現(xiàn)對(duì)緩變故障的過程監(jiān)測(cè)。該預(yù)轉(zhuǎn)化反應(yīng)器溫度測(cè)量點(diǎn)的空間分布情況如圖2所示,18個(gè)溫度測(cè)量點(diǎn)分布在6個(gè)不同的床層高度上,每個(gè)床層高度各有3個(gè)溫度測(cè)量點(diǎn)。本文收集了該反應(yīng)器某年10 月1 日至12 月31 日共132480 組床層溫度數(shù)據(jù),其時(shí)間間隔為1min。
根據(jù)前文中所提出的構(gòu)建基于PLS-PCA 的過程監(jiān)測(cè)模型方法,首先選取了一段裝置平穩(wěn)運(yùn)行的生產(chǎn)過程數(shù)據(jù),針對(duì)每一個(gè)床層溫度變量,分別建立了相應(yīng)的PLS 回歸模型,利用其余17 個(gè)床層溫度變量實(shí)現(xiàn)了對(duì)該溫度數(shù)據(jù)的回歸預(yù)測(cè)。在建立PLS回歸模型的過程中,潛變量個(gè)數(shù)是一個(gè)重要的參數(shù)。表1 為根據(jù)交叉驗(yàn)證的方法,選取了18 個(gè)PLS回歸模型的潛變量個(gè)數(shù)。
在建立PLS回歸模型的基礎(chǔ)上,選取一段運(yùn)行平穩(wěn)的數(shù)據(jù)代入到PLS回歸模型中,并計(jì)算出裝置正常運(yùn)行狀態(tài)時(shí)與預(yù)設(shè)狀態(tài)之間的差值,并將其作為PCA 模塊的訓(xùn)練數(shù)據(jù)建立基于PCA 的過程監(jiān)測(cè)模型,PCA模型的主元個(gè)數(shù)通過累計(jì)方差貢獻(xiàn)率法確定,如圖3所示當(dāng)主元個(gè)數(shù)為15時(shí),PCA模型的累計(jì)方差貢獻(xiàn)率超過90%,說明此時(shí)主元模型提取數(shù)據(jù)信息包含絕大多數(shù)的歷史數(shù)據(jù)信息,因此選擇模型的主元個(gè)數(shù)為15。在完成以上工作后,基于PLS-PCA 的過程監(jiān)測(cè)模型建立完成,然后將測(cè)試數(shù)據(jù)首先代入PLS回歸模型中,計(jì)算各變量與預(yù)設(shè)狀態(tài)的偏差,再將其代入PCA 模型中實(shí)現(xiàn)對(duì)生產(chǎn)過程的監(jiān)測(cè)。
圖3 信息提取量變化圖
將上文中已建立的基于PLS-PCA 的過程監(jiān)測(cè)模型應(yīng)用于該預(yù)轉(zhuǎn)化反應(yīng)器的運(yùn)行狀態(tài)監(jiān)測(cè)中,監(jiān)測(cè)結(jié)果如圖4所示。其超限時(shí)間點(diǎn)為2016年11月9日15 時(shí)35 分。通過查詢裝置歷史記錄得知,工程師在2016 年11 月10 日4 時(shí)20 分發(fā)現(xiàn)床層C、D 點(diǎn)溫度下降,后經(jīng)分析發(fā)現(xiàn)稀釋蒸氣中硫含量超標(biāo),導(dǎo)致預(yù)轉(zhuǎn)化催化劑硫中毒,從而引發(fā)了過程偏離。由此看出模型對(duì)緩變故障具有較好的識(shí)別效果,可以比工程師提前13h發(fā)現(xiàn)過程偏離。
圖4 基于PLS-PCA模型的過程監(jiān)測(cè)結(jié)果
為了進(jìn)一步與傳統(tǒng)PCA 監(jiān)測(cè)模型的性能進(jìn)行比較,建立一個(gè)基于PCA 的過程監(jiān)測(cè)模型并應(yīng)于該裝置的過程監(jiān)測(cè)中,其監(jiān)測(cè)結(jié)果如圖5所示。其超限時(shí)間點(diǎn)為2016年11月9日23時(shí)48分。對(duì)比兩種模型的監(jiān)測(cè)結(jié)果可以發(fā)現(xiàn),基于PLS-PCA 的過程監(jiān)測(cè)模型要比基于PCA 的過程監(jiān)測(cè)模型提前8h左右發(fā)現(xiàn)該過程偏離,說明基于PLS-PCA 的過程監(jiān)測(cè)模型對(duì)于緩變故障具有更好的監(jiān)測(cè)效果。
圖5 基于PCA模型的過程監(jiān)測(cè)結(jié)果
本文針對(duì)化工生產(chǎn)過程中存在的緩變故障提出了一個(gè)基于PLS-PCA 的過程監(jiān)測(cè)模型,利用PLS算法捕捉裝置無故障狀態(tài)下變量間的相關(guān)關(guān)系。在預(yù)測(cè)值與實(shí)測(cè)值偏差的基礎(chǔ)上建立PCA 模型。當(dāng)過程發(fā)生緩變故障時(shí),該模型可以放大緩變故障的過程偏離,實(shí)現(xiàn)對(duì)緩變故障的早期識(shí)別。該模型被應(yīng)用在某制氫裝置的預(yù)轉(zhuǎn)化反應(yīng)器上,實(shí)現(xiàn)了對(duì)緩變故障的早期識(shí)別。結(jié)果表明,該模型能夠比工程師提前13h發(fā)現(xiàn)過程偏離,對(duì)緩變故障具有較好的監(jiān)測(cè)效果,其結(jié)果可以為工程師提供參考。