郭麗瑩,郎憲明
(遼寧石油化工大學信息與控制工程學院,遼寧 撫順 113001)
常減壓蒸餾過程是一個復雜的物理和化學變化過程,由于產(chǎn)品數(shù)目眾多,很多變量之間耦合嚴重,造成常減壓裝置控制困難[1-3]。國內(nèi)多數(shù)煉油廠都沒有安裝質(zhì)量分析儀表,只能間隔幾個小時對常壓塔側(cè)線產(chǎn)品進行抽樣離線化驗分析,根本無法實現(xiàn)對產(chǎn)品質(zhì)量的實時監(jiān)控。常壓塔塔頂干點直接影響產(chǎn)品的質(zhì)量、產(chǎn)量以及能源消耗量,采用軟測量方法對篩選的常壓塔塔頂干點實現(xiàn)在線估計,可實現(xiàn)對篩選干點的推斷控制[4-5]。
由于軟測量技術(shù)針對過程控制可實現(xiàn)更為嚴格的卡邊優(yōu)化控制,近些年對軟測量方法的大量研究成果不斷涌現(xiàn)。多變量統(tǒng)計建模逐漸發(fā)展成更具有代表性的方法[6],支持向量機(SVM)[7]與人工神經(jīng)網(wǎng)絡(ANN)[8]這些方法通過訓練對主導變量具有一定的預測能力和較好的泛化能力。但是,由于常減壓蒸餾過程隨著原油生產(chǎn)方案的變化常常顯示動態(tài)特性,這些建模方法往往在預測精確度上達不到要求。高斯過程回歸(Gaussian Process Regression,GPR)作為一種非參數(shù)概率,根據(jù)實際工況建立基于相似準則的局部模型,不僅可以給出干點預測值,還可以得到預測值對模型的信任值[9-11]。因此,可以使用GPR軟測量模型對常壓塔塔頂汽油干點進行預測。
常減壓蒸餾過程是一項比較復雜的工藝流程,變量之間的復雜關(guān)聯(lián)導致所采集的變量數(shù)據(jù)過多,但是對過程控制有用的信息卻很少。因此,基于數(shù)據(jù)驅(qū)動的軟測量方法在建模前一定要對數(shù)據(jù)進行預處理[12-13]。目前解決信息冗余的主要算法有主成分分析法(Principal Component Analysis,PCA)[14]、偏最小二乘法(Partial least squares,PLS)[15]。近年來,很多學者都致力于二種方法的改進,在數(shù)據(jù)預處理中得到了廣泛的應用,由于變量數(shù)據(jù)間存在嚴重的耦合性和非線性,因此核主元算法(KPCA)應用較為廣泛[16-18]。本文利用KPCA對過程變量進行分析,對過程變量進行降維,解決了不同變量之間的非線性相關(guān)性,然后采用GPR建立軟測量模型,進而建立了KPCA-GPR常壓塔塔頂汽油干點模型。
設數(shù)據(jù)樣本集為X={x1,x2,…,xk,…,xn},其中xk∈Rn,n為樣本總數(shù);Φ為一個非線性映射,對應的空間為F,F中的樣本記為Φ(xk),且滿足:
且F空間中樣本的協(xié)方差矩陣為:
式中,N=n-1。
C的特征 值λ和特征 向量V滿 足:
其中,特征向量V可由投影到F空間內(nèi)的樣本映射組成。
式中,Φ(X)=[Φ(x1),Φ(x2),…,Φ(xn)];β=[β1,β2,…,βn]T。由此,式(4)可改寫為:
等式(5)兩端左乘Φ(X)T,即:
引入核函數(shù)Ki,j:
式中,i、j=1,2,…,n。
式(7)用與核矩陣K的特征值λ和特征向量β表示。
即:
對核矩陣進行中心化處理,結(jié)果如式(10)所示。
式中,In為所有元素均為的n維矩陣。
本文采用的徑向基函數(shù)為:
式中,σ為方差,σ>0;‖xi-xj‖為歐氏距離。
GPR模型是近幾年發(fā)展起來的一種機器學習回歸方法,并取得了許多研究成果,現(xiàn)已成為研究熱點,在許多領(lǐng)域得到了成功應用[9-11]。
GPR模型是有限個數(shù)的任意隨機變量均具有聯(lián)合高斯分布的集合,其性質(zhì)完全由均值函數(shù)m(x)和協(xié)方差函數(shù)c(x,x')確定。均值函數(shù)m(x)和協(xié)方差函數(shù)c(x,x')的表達式為:
式中,x、x'∈Rd為任意隨機變量,因此GPR模型可定義為f(x)?GPR[m(x),c(x,x')],通常對數(shù)據(jù)作預處理,使其均值函數(shù)等于0。回歸問題模型可表示為:
式中,ε為微小誤差;y為受噪聲影響的觀測值。進一步假設噪聲ε~N(0,δ2n),可得觀測值y的先驗分布為y~N[0,c(x,x)+δ2n In]以及觀測值y和預測值f*的聯(lián)合先驗分布:
式中,X為訓練集的輸入;x*為測試樣本集的輸入;C(X,X)=Cn=(cij)為n×n階對稱正定協(xié)方差矩陣;C(X,x*)=C(x*,X)T為x*與X之間的n×1階協(xié)方差矩陣;c(x*,x*)為x*自身的協(xié)方差。由此可以計算預測值f*的均值和方差。
常減壓蒸餾過程是將不同化學成分物質(zhì)分離的過程,從蒸餾的結(jié)構(gòu)上看,它是一個典型的、復雜的多側(cè)線系統(tǒng)。常減壓蒸餾裝置用于對原油的一次加工,將原油根據(jù)現(xiàn)實要求分為不同的餾分。常壓塔不同餾分的產(chǎn)品成分與這段時間內(nèi)進料溫度、壓力,塔內(nèi)各處溫度、壓力,回流量等過程變量密切相關(guān),一旦過程變量的變化明顯,則會對產(chǎn)品質(zhì)量造成影響。在實際生產(chǎn)過程中,通過抽取大量的數(shù)據(jù)樣本在一定時間間隔內(nèi)進行離線化驗分析,獲得干點、凝固點、閃點等產(chǎn)品指標,其滯后性大,難以實現(xiàn)實時的自動控制,使整個常減壓蒸餾過程的產(chǎn)品質(zhì)量。常減壓蒸餾工藝流程如圖1所示。圖中,M為自控泵。
圖1 常減壓蒸餾工藝流程
采用軟測量建模,從采集到的樣本中選擇具有代表性的、能夠覆蓋正常運行工況的適當數(shù)據(jù)作為學習樣本訓練,只要輸入實時采集的過程參數(shù),模型就會給出相應的質(zhì)量指標,從而實現(xiàn)產(chǎn)品質(zhì)量指標在線測量的目標。
輔助變量的選擇應遵循常減壓蒸餾過程的機理及規(guī)律[14]。通過對撫順石化公司石油二廠操作規(guī)程的了解,結(jié)合現(xiàn)場生產(chǎn)數(shù)據(jù),初步選擇影響常壓塔塔頂干點的14個輔助變量(見表1)。
表1 影響常壓塔塔頂干點的輔助變量
基于數(shù)據(jù)驅(qū)動的軟測量建模方法是經(jīng)過數(shù)值計算而實現(xiàn)的。一個模型的準確性和有效性依賴于輸入數(shù)據(jù)中包含的有用信息量。因此,對輸入數(shù)據(jù)的預處理也是軟測量建模前必不可少的一道工序。在常減壓蒸餾過程中,影響常壓塔塔頂干點的不同變量之間相互關(guān)聯(lián),直接建模會增加問題分析的復雜性。對模型的輸入進行簡化,對輸入數(shù)據(jù)進行核主成分分析,可為常壓塔塔頂干點建立模型奠定一定的基礎(chǔ)。
干點影響變量為:
經(jīng)過KPCA處理后的輸入變量為:
汽油干點輸出變量為:
為了驗證上述KPCA-GPR模型的有效性,使用某煉油廠的實際數(shù)據(jù)進行系統(tǒng)仿真分析。從現(xiàn)場采集的數(shù)據(jù)雖然擁有大量的原始信息,但是由于所得數(shù)據(jù)易受到測量方法、人為操作因素、環(huán)境因素等因素干擾,需要在進行數(shù)據(jù)預處理之前做好篩選、誤差處理等工作。
將經(jīng)過處理的數(shù)據(jù)分成訓練集和測試集。根據(jù)交叉驗證法選擇模型參數(shù),經(jīng)過多次實驗,最終將其中300組數(shù)據(jù)用于訓練,100組數(shù)據(jù)用于測試。在使用KPCA提取數(shù)據(jù)信息時,貢獻率ak表示每個主成分包含原始總信息量的多少。累計貢獻率bk表示前k個主成分對原始信息提取的能力。一般情況下,當bk≥85%時,就可以用k個主成分來表示原有指標而不會損失過多信息。貢獻率ak和累計貢獻率bk表示為:
采用MATLAB軟件進行仿真實驗,分別使用PCA、KPCA算法計算貢獻率和累計貢獻率,計算結(jié)果如表2所示。表2中,R1-R6表示前6個主元。
表2 基于PCA、KPCA算法的貢獻率和累積貢獻率
基于離線數(shù)據(jù)訓練得到汽油干點軟測量模型,將原始數(shù)據(jù)經(jīng)過PCA、KPCA處理后作為輸入變量,汽油干點化驗值作為輸出變量,代入GPR模型中進行學習,保證汽油干點模型能實時準確預測出當前時刻干點值的均值和方差。為了更好地對比,采用均方根誤差(RMSE)和平均絕對誤差(MAE)作為模型性能評價準則。
分別使用GPR、PCA-GPR、KPCA-GPR建立常壓塔塔頂汽油干點軟測量預測模型,常壓塔塔頂干點預測均值可視化結(jié)果如圖2所示。GPR、PCAGPR、KPCA-GPR模型性能如表3所示。
圖2 常壓塔塔頂干點預測均值可視化結(jié)果
表3 GPR、PCA-GPR、KPCA-GPR模型性能
從圖2可以看出,KPCA-GPR與GPR、PCAGPR相比,預測精度有所提高,基本上能滿足工藝的要求。對比表3的數(shù)據(jù)可知,KPCA-GPR模型性能優(yōu)于GPR、PCA-GPR模型。因此,KPCA-GPR模型具有更好的預測精度和應用前景。
針對常壓塔塔頂干點預測提出了KPCA-GPR軟測量方法。首先,對數(shù)據(jù)樣本采用核主成分分析進行預處理,解決變量間的非線性問題,降低數(shù)據(jù)的維數(shù),減少噪聲的干擾,提高主成分的穩(wěn)定性;用未經(jīng)預處理數(shù)據(jù)和經(jīng)過PCA和KPCA處理的數(shù)據(jù)進行了分析。結(jié)果表明,KPCA-GPR模型有較高的預測精度和較好的模型性能。