潘艷秋,張超陽,李鵬飛,俞 路
(大連理工大學(xué)化工學(xué)院,遼寧 大連 116024)
2022年,工業(yè)和信息化部印發(fā)了《“十四五”推動(dòng)石化化工行業(yè)高質(zhì)量發(fā)展的指導(dǎo)意見》,指出石化化工行業(yè)要推動(dòng)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、加快改造提升、提高行業(yè)競(jìng)爭(zhēng)能力[1]。煉化企業(yè)可以通過信息智能化轉(zhuǎn)型來開發(fā)提升產(chǎn)業(yè)競(jìng)爭(zhēng)力的核心技術(shù),助力煉化企業(yè)實(shí)現(xiàn)高效綠色化的增質(zhì)提效[2-3]。
催化重整是生產(chǎn)石化原料和提升汽油質(zhì)量的重要手段[4],全球約27%的汽油來自重整汽油、70%以上的芳烴來自重整芳烴、50%以上的煉油用氫來自重整產(chǎn)氫[5]。目前,針對(duì)催化重整裝置的研究以對(duì)裝置各單元進(jìn)行建模和過程優(yōu)化為主,如王連山等[6]針對(duì)某煉油廠連續(xù)催化重整過程提出了一種38集總組分動(dòng)力學(xué)模型,并應(yīng)用序列二次規(guī)劃法(SQP)進(jìn)行優(yōu)化求解,最終可將芳烴收率提高0.17%。宋舉業(yè)等[7]以中國石化洛陽分公司1.2 Mt/a連續(xù)催化重整裝置為背景,建立了C4/C5分離流程模型,并對(duì)塔底溫度和進(jìn)料溫度進(jìn)行優(yōu)化,實(shí)現(xiàn)降本增效達(dá)450萬元/a。Askari等[8]利用Aspen HYSYS軟件對(duì)煉油廠催化重整裝置進(jìn)行模擬,考察了原料組成、反應(yīng)溫度、反應(yīng)壓力對(duì)最終產(chǎn)品分布和汽油辛烷值的影響,結(jié)果表明該動(dòng)力學(xué)模型準(zhǔn)確,模擬方法有效。
由于催化重整加工過程機(jī)理十分復(fù)雜,重整裝置具有時(shí)滯性強(qiáng),操作參數(shù)高非線性、強(qiáng)耦合性特點(diǎn),因而構(gòu)建與實(shí)際運(yùn)行狀況高度一致的機(jī)理模型難度很大。隨著互聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)技術(shù)的快速發(fā)展,以神經(jīng)網(wǎng)絡(luò)為代表的數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)成為化工過程機(jī)理研究的重要手段[9]。例如,王杰等[10]以某煉化企業(yè)運(yùn)行數(shù)據(jù)為基礎(chǔ),結(jié)合最大信息系數(shù)(MIC)法和Pearson相關(guān)系數(shù)法篩選出22個(gè)變量,基于BP神經(jīng)網(wǎng)絡(luò)建立了汽油研究法辛烷值(RON)預(yù)測(cè)模型,并采用遺傳算法(GA)對(duì)模型參數(shù)進(jìn)行優(yōu)化,使重整汽油RON損失降低了25%。石翠翠等[11]針對(duì)特征變量存在高度非線性和冗余的特點(diǎn),提出了一種基于偏最小二乘回歸(PLS)和互信息(MI)組合降維的改進(jìn)天牛須搜索算法(RSBAS)優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型(PLS-MI-RSBASBP),用于S Zorb裝置汽油辛烷值預(yù)測(cè)。結(jié)果表明,相較于普通BP神經(jīng)網(wǎng)絡(luò)模型,該模型的預(yù)測(cè)性能更優(yōu)秀。
然而,針對(duì)催化重整裝置的數(shù)據(jù)驅(qū)動(dòng)建模研究目前仍鮮有報(bào)道?;诖?本課題以國內(nèi)某煉油廠催化重整裝置實(shí)際運(yùn)行數(shù)據(jù)為基礎(chǔ),通過設(shè)置數(shù)據(jù)篩選和處理規(guī)則構(gòu)建BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)驅(qū)動(dòng)模型,用以預(yù)測(cè)重整裝置苯產(chǎn)品中甲苯和非芳烴含量;進(jìn)而通過實(shí)際應(yīng)用效果對(duì)該模型進(jìn)行評(píng)價(jià),為后續(xù)全裝置實(shí)時(shí)優(yōu)化與平臺(tái)模型集成提供技術(shù)支撐。
以某煉油廠連續(xù)催化重整裝置為對(duì)象,按每1 h采集1次數(shù)據(jù)的頻率,連續(xù)采集了其運(yùn)行45 d的實(shí)時(shí)數(shù)據(jù),共計(jì)1 000組數(shù)據(jù)。每組數(shù)據(jù)均包括流股流量、系統(tǒng)溫度、流股組成共3類60個(gè)變量參數(shù)。其中部分關(guān)鍵數(shù)據(jù)如表1所示。由于通過實(shí)時(shí)監(jiān)測(cè)系統(tǒng)獲取的裝置操作數(shù)據(jù)經(jīng)常存在隨機(jī)誤差、儀表故障、記錄錯(cuò)誤等問題,而且部分變量間存在高度相關(guān)性,不能直接用于數(shù)據(jù)建模,因此需要進(jìn)行數(shù)據(jù)處理以提高數(shù)據(jù)質(zhì)量。
表1 部分變量數(shù)據(jù)采集結(jié)果
(1)數(shù)據(jù)初篩:①剔除恒為零的數(shù)據(jù);②保留能夠代表裝置運(yùn)行狀況的變量。初篩后每組數(shù)據(jù)由60個(gè)變量減少為30個(gè)變量。
(2)顯著誤差校正:由于裝置實(shí)時(shí)運(yùn)行數(shù)據(jù)樣本為正態(tài)分布或近似正態(tài)分布,故依據(jù)拉依達(dá)準(zhǔn)則[12]進(jìn)行數(shù)據(jù)顯著誤差檢測(cè)和校正。
數(shù)據(jù)樣本中不同變量的量綱和數(shù)據(jù)量級(jí)不同,無法直接用于建模分析,故采用線性無量綱法[13]中的極值法對(duì)數(shù)據(jù)樣本進(jìn)行無量綱化處理,在盡可能縮小各變量數(shù)據(jù)間數(shù)量級(jí)差異的同時(shí)保持變異系數(shù)盡量不變[14]。數(shù)據(jù)無量綱標(biāo)準(zhǔn)化處理方法見式(1)。
(1)
式中:x為原數(shù)據(jù);x′為標(biāo)準(zhǔn)化后的數(shù)據(jù);xmax與xmin分別為原數(shù)據(jù)的最大值與最小值。
基于重整裝置運(yùn)行過程的復(fù)雜性,裝置實(shí)時(shí)變量數(shù)據(jù)之間存在高度非線性關(guān)系和強(qiáng)相關(guān)性。為避免冗余變量加大模型的計(jì)算量及模型臃腫性,需要篩選出與目標(biāo)變量具有強(qiáng)相關(guān)性的變量作為模型輸入變量。由于輸入變量之間也存在強(qiáng)相關(guān)性,所以需要去除輸入變量之間具有強(qiáng)相關(guān)性的變量,保證數(shù)據(jù)的高質(zhì)量。常見的變量相關(guān)性分析方法有Pearson,Spearman,Kendall,MIC等[15],其中MIC方法適用范圍更廣、計(jì)算復(fù)雜度較低、魯棒性較高[16-18],更適用于催化重整裝置的變量相關(guān)性分析。MIC方法基于隨機(jī)變量的n個(gè)觀測(cè)值來計(jì)算,見式(2)。
(2)
式中:a、b分別是網(wǎng)格劃分?jǐn)?shù)量;B為最大網(wǎng)格數(shù),式中B=n0.6[18];X,Y為基于網(wǎng)格的兩個(gè)離散變量;I(X,Y)為互信息。其中,0≤MIC≤1;當(dāng)MIC(X,Y)=0時(shí),說明兩個(gè)變量相互獨(dú)立;當(dāng)MIC(X,Y)=1時(shí),說明兩個(gè)變量線性相關(guān)。
1.3.1輸入變量與目標(biāo)輸出變量間相關(guān)性分析
采用MIC法計(jì)算初步篩選后28個(gè)輸入變量與2個(gè)目標(biāo)變量間的相關(guān)性,結(jié)果如表2所示。其中MIC1和MIC2為各輸入變量分別與目標(biāo)輸出變量1、2的MIC分析結(jié)果。
表2 輸入變量與目標(biāo)變量的相關(guān)性
為了盡可能地保留關(guān)鍵變量,以所有MIC計(jì)算結(jié)果的平均值作為分界線對(duì)變量進(jìn)行取舍。由表2可知,輸入變量與輸出變量1、2的相關(guān)性均值分別為0.238 2和0.198 4,而對(duì)兩個(gè)輸出變量的平均均值為0.233 3。因此,舍去相關(guān)性小于0.233 3的15個(gè)輸入變量[15,19],保留高于平均均值的13個(gè)變量,進(jìn)行變量間相關(guān)性計(jì)算。
1.3.2輸入變量間相關(guān)性分析
同樣,采用MIC方法對(duì)上述13個(gè)輸入變量進(jìn)行相關(guān)性分析,結(jié)果見圖1。
圖1 輸入變量間相關(guān)性分析結(jié)果
由圖1可知,變量6(裝置產(chǎn)氫流量)與多個(gè)變量間相關(guān)性系數(shù)較大(≥0.8),說明其相關(guān)性較高,故舍去變量6[20-21]。最終,共保留12個(gè)輸入變量用于建模,見表3。
表3 相關(guān)性分析后優(yōu)選的輸入變量
BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性擬合能力,對(duì)具有復(fù)雜運(yùn)行狀況和數(shù)據(jù)強(qiáng)非線性特點(diǎn)的連續(xù)催化重整裝置建模尤為適用[22]。采用性能優(yōu)異的B-R訓(xùn)練算法[23],將上述預(yù)處理好的數(shù)據(jù)樣本按照70%,15%,15%的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集、測(cè)試集3組,訓(xùn)練集和驗(yàn)證集數(shù)據(jù)樣本用于模型參數(shù)的訓(xùn)練,測(cè)試集數(shù)據(jù)樣本用于驗(yàn)證模型的泛化能力。
2.1.1隱含層數(shù)的確定
在隱含層數(shù)分別為1~5、每層神經(jīng)元數(shù)分別設(shè)置為6,8,10的情況下[23],選擇回歸系數(shù)R和均方根誤差RMSE作為評(píng)價(jià)指標(biāo),回歸系數(shù)R越大,說明模型的預(yù)測(cè)值越接近真實(shí)值,表示模型越精確;均方根誤差RMSE越小,表明計(jì)算值與真實(shí)值誤差越小,采用多次計(jì)算、對(duì)結(jié)果求平均值的方法評(píng)價(jià)不同模型結(jié)構(gòu)對(duì)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度的影響,結(jié)果如圖2所示。
由圖2(a)可知:對(duì)于目標(biāo)變量苯產(chǎn)品中非芳烴組分含量,當(dāng)隱含層神經(jīng)元數(shù)為6、隱含層數(shù)為3時(shí),獲得最大的R和最小的RMSE;當(dāng)隱含層神經(jīng)元數(shù)為8或10、隱含層數(shù)為3時(shí),獲得較大的R和較小的RMSE(效果僅次于隱含層數(shù)為4時(shí))。由圖2(b)可知:當(dāng)隱含層數(shù)為3,隱含層神經(jīng)元數(shù)分別取6,8,10時(shí),均獲得最大的R和最小的RMSE。綜合考慮隱含層數(shù)對(duì)兩個(gè)目標(biāo)變量的影響,神經(jīng)網(wǎng)絡(luò)模型隱含層數(shù)選擇3為宜。
2.1.2神經(jīng)元數(shù)的確定
依次使用公式經(jīng)驗(yàn)法和反復(fù)試驗(yàn)法來確定模型隱含層的神經(jīng)元數(shù)和最佳神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[24]。隱含層神經(jīng)元數(shù)由式(3)計(jì)算。
(3)
式中:Nhid為隱含層神經(jīng)元數(shù);Nin為輸入層神經(jīng)元數(shù);Nout為輸出層神經(jīng)元數(shù)。
輸入變量數(shù)為12、輸出目標(biāo)變量數(shù)為2,由式(3)可初步確定Nhid=6。在此基礎(chǔ)上,將每層神經(jīng)元數(shù)范圍擴(kuò)展為4~8個(gè),探討神經(jīng)元數(shù)不同對(duì)模擬結(jié)果的影響。在優(yōu)化隱含層數(shù)為3條件下計(jì)算共獲得125種組合結(jié)構(gòu)模型的模擬結(jié)果,每種組合計(jì)算200次,其均值如表4所示。由表4可知,3層隱含層的神經(jīng)元數(shù)分別為8,6,8時(shí)(第115組計(jì)算結(jié)果),模型回歸效果最好。最終,優(yōu)化得到的BP網(wǎng)絡(luò)模型結(jié)構(gòu)為(12,8×6×8,2)。
表4 不同神經(jīng)元組合計(jì)算結(jié)果
基于上述優(yōu)化的BP網(wǎng)絡(luò)模型結(jié)構(gòu)進(jìn)行訓(xùn)練,由測(cè)試集數(shù)據(jù)樣本得到模型性能結(jié)果,見表5。由表5可知:①對(duì)于產(chǎn)品苯中非芳烴含量與甲苯含量,模型預(yù)測(cè)結(jié)果的回歸系數(shù)分別為0.872 1和0.901 2,說明模型預(yù)測(cè)值與真實(shí)值一致性較好,該模型能夠很好地預(yù)測(cè)裝置運(yùn)行的波動(dòng)性;②二者的均方根誤差分別為0.012 4和0.046 3,表明預(yù)測(cè)值與真實(shí)值偏差較小;③二者平均相對(duì)誤差(MRE)分別為1.036%和3.312%,表明所建模型預(yù)測(cè)結(jié)果的準(zhǔn)確性良好,能夠滿足化工裝置控制精度要求。
圖3為采集數(shù)據(jù)裝置運(yùn)行的真實(shí)值與所建神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值的對(duì)比結(jié)果。由圖3可以看出,隨著裝置運(yùn)行時(shí)間的增加,預(yù)測(cè)模擬值與裝置真實(shí)值的變化趨勢(shì)相同且吻合良好,表明所建模型的預(yù)測(cè)結(jié)果具有較高的準(zhǔn)確性,達(dá)到了利用該模型預(yù)測(cè)裝置產(chǎn)品中非芳烴含量和甲苯含量的目的,可以用于后續(xù)優(yōu)化工作。
圖3 苯產(chǎn)品中非芳烴和甲苯含量模擬值與真實(shí)值變化趨勢(shì)對(duì)比
結(jié)合現(xiàn)場(chǎng)裝置參數(shù)調(diào)節(jié)難度和操作參數(shù)對(duì)產(chǎn)品質(zhì)量(苯產(chǎn)品中非芳烴和甲苯含量)影響程度的大小,選取易于調(diào)控、對(duì)產(chǎn)品質(zhì)量影響程度較大的5個(gè)參數(shù)進(jìn)行優(yōu)化分析,并確定參數(shù)優(yōu)化合理區(qū)間,見表6。除待優(yōu)化輸入變量外,其他輸入變量采用2.1節(jié)預(yù)處理后變量數(shù)據(jù)的平均值。
表6 優(yōu)化參數(shù)及其變化范圍
采用帶精英策略的遺傳算法NSGA-Ⅱ?qū)ι鲜鲎兞繀?shù)進(jìn)行優(yōu)化求解,求解器參數(shù)設(shè)置:最優(yōu)個(gè)體系數(shù)為0.3,種群規(guī)模為200,最大進(jìn)化代數(shù)為500,停止代數(shù)為200,適應(yīng)度函數(shù)偏差為1×10-4,其他參數(shù)設(shè)置為函數(shù)默認(rèn)值。輸入變量參數(shù)的變化范圍介于變量變化下限與上限之間,優(yōu)化目標(biāo)為苯產(chǎn)品中非芳烴質(zhì)量分?jǐn)?shù)(y1)和/或甲苯質(zhì)量分?jǐn)?shù)(y2)最小。變量優(yōu)化結(jié)果見圖4,圖中點(diǎn)N代表催化重整裝置正常操作點(diǎn),點(diǎn)A、點(diǎn)B、點(diǎn)C分別為優(yōu)化后的操作點(diǎn)。優(yōu)化后的輸入變量和目標(biāo)函數(shù)如表7所示。
圖4 多目標(biāo)優(yōu)化最優(yōu)解集
表7 最優(yōu)解優(yōu)化變量及目標(biāo)函數(shù)
由圖4可以看出,對(duì)催化重整裝置苯產(chǎn)品質(zhì)量優(yōu)化的方案有3種:①為最大程度降低產(chǎn)品中非芳烴含量,則選擇操作點(diǎn)A工況,此時(shí)產(chǎn)品中非芳烴質(zhì)量分?jǐn)?shù)降低40.12%,但甲苯含量有所增加;②為保持甲苯含量不增加的同時(shí)降低非芳烴含量,則選擇操作點(diǎn)B工況,此時(shí)產(chǎn)品中非芳烴質(zhì)量分?jǐn)?shù)降低36.85%;③為同時(shí)降低苯產(chǎn)品中非芳烴和甲苯的含量,則選擇最佳操作點(diǎn)C工況,此時(shí)苯產(chǎn)品中非芳烴和甲苯的質(zhì)量分?jǐn)?shù)分別降低24.38%和82.58%。從以上分析可知,可通過改變相關(guān)操作參數(shù)實(shí)現(xiàn)提高苯產(chǎn)品質(zhì)量的目的,方案③對(duì)應(yīng)的操作點(diǎn)C工況對(duì)提高苯產(chǎn)品質(zhì)量的效果最佳。
(1)基于催化重整裝置的實(shí)時(shí)數(shù)據(jù),建立了實(shí)時(shí)數(shù)據(jù)處理規(guī)則,將采集到的60個(gè)變量簡化至14個(gè),在保證數(shù)據(jù)完整性和準(zhǔn)確性的同時(shí),降低了數(shù)據(jù)的維度,為后續(xù)建模提供了簡約的數(shù)據(jù)集。
(2)基于處理后的數(shù)據(jù)集,建立了苯產(chǎn)品質(zhì)量的預(yù)測(cè)模型,當(dāng)模型輸入變量為12個(gè),輸出變量為2個(gè),隱含層為3層,3層隱含層的神經(jīng)元數(shù)分別為8,6,8時(shí)模型的預(yù)測(cè)結(jié)果最優(yōu),因此優(yōu)化的模型結(jié)構(gòu)為(12,8×6×8,2)。
(3)經(jīng)過模型訓(xùn)練和驗(yàn)證,對(duì)于苯產(chǎn)品中的非芳烴含量與甲苯含量,模型預(yù)測(cè)結(jié)果的回歸系數(shù)(R)分別為0.872 1和0.901 2;二者的均方根誤差分別為0.012 4和0.046 3,平均相對(duì)誤差(MRE)分別為1.036%和3.312%,表明所建模型預(yù)測(cè)值與真實(shí)值一致性較好,預(yù)測(cè)精度較高。
(4)采用帶精英策略的遺傳算法NSGA-Ⅱ?qū)τ绊懏a(chǎn)品質(zhì)量較大的5個(gè)操作變量進(jìn)行優(yōu)化,優(yōu)化后的工況下,苯產(chǎn)品中非芳烴和甲苯質(zhì)量分?jǐn)?shù)分別可降低24.38%和82.58%,說明所建模型可用于裝置的產(chǎn)品質(zhì)量預(yù)測(cè)和調(diào)控,有利于現(xiàn)代工廠智能化建設(shè)。