王俊凱,喬 非,祝 軍,倪嘉呈
(同濟(jì)大學(xué) 電子與信息工程學(xué)院,上海 201804)
燒結(jié)是鋼鐵企業(yè)中耗能最大的工序之一,研究燒結(jié)工序節(jié)能降耗意義重大.同時,燒結(jié)為高爐煉鐵提供主要原料,與后續(xù)生產(chǎn)的產(chǎn)量、質(zhì)量以及能源消耗有著密切關(guān)系,因而研究和預(yù)測燒結(jié)礦的物理化學(xué)指標(biāo)具有重要意義.
從能耗預(yù)測的角度來看,燒結(jié)工序中固體燃料消耗占到75%~80%,是燒結(jié)降耗的一個主要方向[1].然而目前相關(guān)研究還非常匱乏,僅有利用BPNN[2-3],RBFN[4]為代表的方法通過歷史數(shù)據(jù)挖掘輸入?yún)?shù)與能耗之間的關(guān)系,仍存在建模方法精度不高、模型訓(xùn)練時間長的問題.從性能指標(biāo)預(yù)測角度來看,這些指標(biāo)可以分為生產(chǎn)指標(biāo)、質(zhì)量指標(biāo)和化學(xué)指標(biāo)三類.這方面的研究相對較多,大致也可分為機(jī)理建模、專家系統(tǒng)和數(shù)據(jù)挖掘三類.機(jī)理模型往往存在較多前提假設(shè),導(dǎo)致與實(shí)際脫節(jié)嚴(yán)重,并且在描述復(fù)雜過程和對象時無能為力.專家系統(tǒng)也存在模型精度有限、推廣性不強(qiáng)的缺點(diǎn).針對燒結(jié)過程具有非線性、大滯后、參數(shù)眾多且耦合嚴(yán)重的特點(diǎn),應(yīng)用基于數(shù)據(jù)的方法進(jìn)行相關(guān)問題的建模和分析正被廣泛接受.目前,BP(back propagation)神經(jīng)網(wǎng)絡(luò)[5]、模糊神經(jīng)網(wǎng)絡(luò)[6]、灰色神經(jīng)網(wǎng)絡(luò)[7]等方法已有應(yīng)用.神經(jīng)網(wǎng)絡(luò)的參數(shù)確定是影響模型精度的關(guān)鍵問題,故又有自適應(yīng)遺傳神經(jīng)網(wǎng)絡(luò)[8]等方法用于網(wǎng)絡(luò)參數(shù)調(diào)整.然而,已有的這些研究存在以下幾個問題:①預(yù)測指標(biāo)偏少,未考慮固體能耗、成品率等重要指標(biāo);②輸入層參數(shù)考慮不足,未考慮主要的操作參數(shù)和設(shè)備參數(shù);③訓(xùn)練速度慢,容易陷入局部極小,對學(xué)習(xí)參數(shù)的選擇敏感.
針對以上問題,本文基于回歸型支持向量機(jī)方法研究了燒結(jié)礦能耗及性能指標(biāo)的預(yù)測模型,探究了2種建模模式,在獲取典型鋼鐵企業(yè)燒結(jié)生產(chǎn)歷史數(shù)據(jù)的基礎(chǔ)上,從預(yù)測精度和時間效率上比較了其與多種建模方法效果的優(yōu)劣,對模型預(yù)測結(jié)果進(jìn)行分析探討.
SVR算法的主要思想是:在傳統(tǒng)支持向量機(jī)分類的基礎(chǔ)上引入了不敏感損失函數(shù)(ε),尋找一個最優(yōu)分類面使得所有訓(xùn)練樣本離該最優(yōu)分類面的誤差最?。?].
設(shè)含有l(wèi)個訓(xùn)練樣本的訓(xùn)練集樣本對為,其中,xi是第i個訓(xùn)練樣本的輸入列向量表示d維實(shí)數(shù);yi∈R為相應(yīng)的輸出值.
設(shè)在高維特征空間中建立的線性回歸函數(shù)為
式中:f(x)為回歸函數(shù)返回的預(yù)測值;Φ()x為非線性映射函數(shù);ω,b為系數(shù).
定義ε線性不敏感損失函數(shù)
其中,y={yi|i=1,2,…,l}為樣本的真實(shí)值.
式中:C為懲罰因子,C越大表示對訓(xùn)練誤差大于ε的樣本懲罰越大,ε規(guī)定了回歸函數(shù)的誤差要求,ε越小表示回歸函數(shù)的誤差越小.
引入拉格朗日函數(shù),該問題即可轉(zhuǎn)換為對偶形式求解,即
式中,αi和是針對式(3)2個約束條件構(gòu)造的拉格朗日乘子,核函數(shù)
SVR模型只需確定核函數(shù)類型及其參數(shù)和懲罰因子即可,故相比BP神經(jīng)網(wǎng)絡(luò)而言參數(shù)個數(shù)少,無需反復(fù)湊試,容易確定.
在燒結(jié)能耗及性能指標(biāo)的預(yù)測中,常用的預(yù)測方法包括:多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)、RBF(radical basis function)網(wǎng) 絡(luò)、ELM (extreme learning machine)[10]等.這些方法大致可分為兩類,對于線性回歸、SVR(support vector macline for regression)等回歸方法,每個回歸模型只能對一個指標(biāo)進(jìn)行預(yù)測,即只能建立多輸入單輸出模型,稱為MISO模式,如圖1a所示.對MISO模式,若要建立多個輸出的預(yù)測模型,則要根據(jù)輸出個數(shù)建立相應(yīng)個數(shù)的MISO模型.而對于BP,RBF,ELM等神經(jīng)網(wǎng)絡(luò),則可以直接建立多輸入多輸出模型,稱為MIMO模式,如圖1b所示.本文針對這2類建模模式分別建立相應(yīng)模型并測試驗(yàn)證,比較模式內(nèi)和模式間不同方法的預(yù)測精度和時間效率.
圖1 預(yù)測建模模式Fig.1 Modes of predictive modeling
建模過程一般分為以下5步,如圖2所示.
圖2 基于SVR預(yù)測建模過程Fig.2 Predictive modeling process based on SVR
步驟1:輸入輸出量提取.影響燒結(jié)工序能耗及性能指標(biāo)的因素多種多樣且關(guān)系復(fù)雜.不僅混合料配比值、溶劑添加量等與燒結(jié)能耗和性能指標(biāo)有密切聯(lián)系,一些操作參數(shù)如料層厚度、點(diǎn)火溫度和狀態(tài)參數(shù)如風(fēng)箱負(fù)壓等也與燒結(jié)礦的產(chǎn)量、質(zhì)量及能耗密不可分.
步驟2:數(shù)據(jù)清理.歷史數(shù)據(jù)中異常值對模型的精度影響很大,因而離群點(diǎn)檢測是很重要的一步.這里采用基于密度的方法進(jìn)行離群點(diǎn)檢測.
步驟3:數(shù)據(jù)歸約與轉(zhuǎn)化.將原料加入量歸一化,轉(zhuǎn)換成0~1之間的數(shù)據(jù),所有原料配比之和為1.將生產(chǎn)參數(shù)數(shù)據(jù)轉(zhuǎn)化為0~1之間的歸一化數(shù)據(jù),以消除單位和數(shù)量級對于模型精度的影響.
步驟4:訓(xùn)練網(wǎng)絡(luò)建立模型.將數(shù)據(jù)分為訓(xùn)練集與測試集,確定核函數(shù)類型及其參數(shù)和懲罰因子C的大小,并用訓(xùn)練集數(shù)據(jù)訓(xùn)練SVR模型.
步驟5:測試網(wǎng)絡(luò)對比結(jié)果.用測試集測試模型精度,得到測試結(jié)果后先反歸一化處理,再比較預(yù)測值與真實(shí)值之間的誤差.采用4項(xiàng)指標(biāo)對模型進(jìn)行評價(jià),分別是平均相對誤差emean、最大相對誤差emax、均方差Emse、決定系數(shù)R2.
式中:m為測試集樣本個數(shù);yk(k=1,2,…,m)為第k個樣本的真實(shí)值;yk(k=1,2,…,m)為第k個樣本的預(yù)測值.
以某年產(chǎn)650萬t鋼規(guī)模的鋼鐵聯(lián)合企業(yè)為例,選取2010年1~5月的122組燒結(jié)生產(chǎn)歷史數(shù)據(jù)進(jìn)行分析建模,仿真試驗(yàn)在MATLAB 2013a平臺上進(jìn)行.
(1)變量選擇.輸入變量分為3類:原料參數(shù)、狀態(tài)參數(shù)和操作參數(shù).本例中共有26個輸入,其中原料參數(shù)包含8種原料的配比值,狀態(tài)參數(shù)包括南北兩側(cè)各7個風(fēng)箱的負(fù)壓值,操作參數(shù)包括2個點(diǎn)火嘴的溫度以及料層厚度和臺車速度.輸出變量也有3類:生產(chǎn)指標(biāo)、質(zhì)量指標(biāo)和化學(xué)指標(biāo).本例中共11個,其中生產(chǎn)指標(biāo)包括固體能耗(solid energy consumption,SEC)和 成 品 率 (rate of finished products,RFP);質(zhì)量指標(biāo)主要指轉(zhuǎn)股指數(shù)(drum index,DI);化學(xué)指標(biāo)則是7種化學(xué)成分的質(zhì)量分?jǐn)?shù)(全鐵TFe、氧化亞鐵FeO、氧化硅SiO2、氧化鈣CaO、氧化鎂 MgO、氧化鋁Al2O3、硫分S對應(yīng)的質(zhì)量分?jǐn)?shù)分別為wTFe,wFeO,wSiO2,wCaO,wMgO,wAl2O3和wS)和堿度(R).因而,需建立11個SVR子模型.
(2)數(shù)據(jù)清理.為了清除數(shù)據(jù)中的噪聲,采用基于密度的方法檢測離群點(diǎn),獲得較為干凈的113條樣本.為使結(jié)果與文獻(xiàn)[3]具有可比性,再從113條樣本中隨機(jī)選擇105條,其中90條作為訓(xùn)練集,15條作為測試集.
(3)數(shù)據(jù)歸約.對原始數(shù)據(jù)進(jìn)行歸一化處理,規(guī)范到[0.2,0.8]區(qū)間.歸一化公式如下:
式中:Qi為各輸入變量的第i個值;Qmax,Qmin分別為該輸入變量中的最大值和最小值;x~i為歸一化后該輸入變量的第i個量;a,c為參數(shù),這里a=0.6,c=(1-a)/2.
(4)創(chuàng)建模型.采用RBF核函數(shù),懲罰因子C和RBF核函數(shù)中的方差g通過交叉驗(yàn)證法獲得.為了減少計(jì)算時間,當(dāng)模型性能相同時優(yōu)先選擇C比較小的參數(shù)組合.
(5)測試網(wǎng)絡(luò).SVR模型訓(xùn)練完成后,利用15個測試樣本對模型進(jìn)行測試驗(yàn)證,反歸一化,記錄每個輸出變量的平均相對誤差、最大相對誤差、均方差、決定系數(shù)等性能指標(biāo).
研究不同的模型模式下多種預(yù)測方法的性能,對于MISO模式,采用多元線性回歸(LR)、多輸入單輸出BP神經(jīng)網(wǎng)絡(luò)(BP_M(jìn)ISO)作對比;對于MIMO模式,采用了多輸入多輸出BP神經(jīng)網(wǎng)絡(luò)(BP_M(jìn)IMO)和RBF以及ELM等方法進(jìn)行比較.需要說明的是,為使各試驗(yàn)結(jié)果具有說服力,對于其他對照模型,已通過多次湊試將模型參數(shù)調(diào)至最佳狀態(tài).例如,對于BP_M(jìn)ISO模型,每個子模型隱層節(jié)點(diǎn)個數(shù)為10,隱層采用Sigmoid傳輸函數(shù),輸出層采用線性傳輸函數(shù),學(xué)習(xí)速率為0.05,訓(xùn)練精度為0.001,最大訓(xùn)練次數(shù)為5 000次,采用LM訓(xùn)練函數(shù),動量因子取0.9.ELM模型隱層節(jié)點(diǎn)數(shù)為15,采用Sigmoid傳輸函數(shù).RBF網(wǎng)絡(luò)模型中徑向基函數(shù)擴(kuò)展速度取0.3.同時,每種模型都運(yùn)行10次,取每個指標(biāo)的平均值作為最終結(jié)果.
(1)MISO模式模型結(jié)果.如表1所示,從相對誤差來看,SVR預(yù)測平均相對誤差均在5%以內(nèi),除了硫分質(zhì)量分?jǐn)?shù)預(yù)測誤差達(dá)到4.78%外,其余指標(biāo)均在2%以內(nèi),最低僅為0.18%,較線性回歸和BP網(wǎng)絡(luò)預(yù)測精度高.從均方差來看,線性回歸各指標(biāo)存在較大波動,原因在于某些指標(biāo)與輸入因素間線性關(guān)系不大;BP和SVR模型中各指標(biāo)均方差則相對平穩(wěn),這與兩者出色的非線性擬合能力有關(guān),其中SVR各指標(biāo)均方差均維持在較低水平,表現(xiàn)出更優(yōu)的性能.從決定系數(shù)也可以看出,SVR中絕大多數(shù)指標(biāo)優(yōu)于其他2種方法.
表1 MISO模式模型測試結(jié)果比較Tab.1 Comparison of testing results between MISO models
(2)MIMO模式模型結(jié)果比較.如表2所示,BP_M(jìn)IMO是文獻(xiàn)[3]中提出的方法,從相對誤差來看,三者平均相對誤差基本都在3%以內(nèi),只有硫分質(zhì)量分?jǐn)?shù)相對誤差偏高,這是因其實(shí)際數(shù)值較小的緣故.三者的誤差相差不大,這也說明3種神經(jīng)網(wǎng)絡(luò)都對解決該類問題具有較好的效果.從均方差和決定系數(shù)來看,ELM略優(yōu)于其他兩者.
表2 MIMO模式模型測試結(jié)果比較Tab.2 Comparison of testing results between MIMO models
(3)模式間對比分析.比較MISO和MIMO模式模型中性能表現(xiàn)最好的SVR和極限學(xué)習(xí)機(jī)模型,如圖3所示,從這2項(xiàng)主要指標(biāo)來看,SVR和ELM都取得了較好的性能,SVR有8個指標(biāo)仍略優(yōu)于ELM,例如SEC提升了0.60%,TFe質(zhì)量分?jǐn)?shù)提升了0.06%,F(xiàn)eO質(zhì)量分?jǐn)?shù)提升了0.89%.值得一提的是,S質(zhì)量分?jǐn)?shù)的預(yù)測在6種方法中僅SVR方法的平均相對誤差在5%內(nèi).
(4)時間效率分析.如圖4所示,線性回歸方法訓(xùn)練時間和測試時間最短,但模型效果不佳;2種BP神經(jīng)網(wǎng)絡(luò)都存在訓(xùn)練時間長的問題;RBF和ELM時間效率都較好,其中ELM網(wǎng)絡(luò)因不用調(diào)整神經(jīng)元的連接權(quán)值和神經(jīng)元閾值而學(xué)習(xí)速度更快.SVR模型雖然需要建立11個子模型,但因其拓?fù)浣Y(jié)構(gòu)由支持向量決定,避免了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要反復(fù)試湊確定網(wǎng)絡(luò)結(jié)構(gòu)的問題,其訓(xùn)練時間略遜于線性回歸和
圖3 SVR和ELM試驗(yàn)結(jié)果對比Fig.3 Comparison of results between SVR and ELM
圖4 6種預(yù)測模型訓(xùn)練時間與測試時間比較Fig.4 Comparison of training and test time between six predictive models
ELM,而測試時間僅次于線性回歸法,比ELM優(yōu).
將回歸型支持向量機(jī)應(yīng)用于鋼鐵企業(yè)燒結(jié)能耗及性能指標(biāo)預(yù)測模型研究中,該模型較好地實(shí)現(xiàn)了基于實(shí)際生產(chǎn)數(shù)據(jù)預(yù)測燒結(jié)能耗及其性能指標(biāo)的功能,通過多種模型的比較研究表明,SVR在該領(lǐng)域的應(yīng)用取得了較好的模型精度和時間效率,這一模型可以與燒結(jié)配料優(yōu)化模型結(jié)合,通過優(yōu)化配料方案預(yù)測未來能耗值,如果能耗未能達(dá)到預(yù)期目標(biāo),再調(diào)整優(yōu)化模型中的約束,生成新的優(yōu)化解集,如此迭代,直至找到滿意的配料比,這也是今后的一個研究方向.
[1] 王社斌,許并社.鋼鐵生產(chǎn)節(jié)能減排技術(shù)[M].北京:化學(xué)工業(yè)出版社,2008.
WANG Shebin,XU Bingshe.Technology of energy saving and emission reduction for iron and steel production[M].Beijing:Chemical Industry Press,2008.
[2] 韓慶虹,金永龍.人工神經(jīng)網(wǎng)絡(luò)在燒結(jié)固體燃耗預(yù)測中的應(yīng)用[J].冶金能源,2005,24(2):9.
HAN Qinghong, JIN Yonglong, ZHANG Junhong.Application of neural networks in the prediction of solid fuel consumption in sintering process[J].Energy for Metallurgical Industry,2005,24(2):9.
[3] 孟輝,喬非,李莉.基于BP神經(jīng)網(wǎng)絡(luò)的燒結(jié)能耗預(yù)測模型[J].機(jī)械工程師,2012(2):45.
MENG Hui,QIAO Fei,LI Li.Predictive model of energy consumption in sintering process based on BP neural network[J].Mechanical Engineer,2012(2):45.
[4] 馮朝輝,張華,王艷紅.燒結(jié)工序能耗預(yù)測與優(yōu)化研究[J].燒結(jié)球團(tuán),2012,37(6):13.
FENG Zhaohui,ZHANG Hua,WANG Yanhong.Study on prediction and optimization of sintering process energy consumption[J].Sintering and Pelletizing,2012,37(6):13.
[5] 王煒,陳畏林,賈斌,等.基于線性規(guī)劃和神經(jīng)網(wǎng)絡(luò)的優(yōu)化燒結(jié)配料系統(tǒng)開發(fā)[J].燒結(jié)球團(tuán),2006,31(1):27.
WANG Wei,CHEN Weilin,JIA Bin,etal.A sinter feed proportion optimum system based on linear programming and neural network[J].Sintering and Pelletizing,2006,31 (1):27.
[6] ER Mengjoo,LIAO Jun,LIN Jianya.Fuzzy neural networksbased quality prediction system for sintering process[J].IEEE Transactions on Fuzzy Systems,2000,8(3):314.
[7] 鮑雅萍,馬金元,宋強(qiáng).基于灰色神經(jīng)網(wǎng)絡(luò)的燒結(jié)礦堿度組合預(yù)測[J].控制理論與應(yīng)用,2008,25(4):791.
BAO Yaping, MA Jinyuan,SONG Qiang.Combination forecasting of sintered ore alkalinity based on grey neural network[J].Control Theory and Application,2008,25(4):791.
[8] 劉勇,程武山,孫鑫.基于自適應(yīng)遺傳神經(jīng)網(wǎng)絡(luò)的燒結(jié)礦化學(xué)成分超前預(yù)報(bào)模型[J].燒結(jié)球團(tuán),2005,6(12):16.
LIU Yong,CHENG Wushan,SUN Xin.A prediction model of sinter chemistry based on adaptive genetic-neural network[J].Sintering and Pelletizing,2005,6(12):16.
[9] Shevad S K, Keerthi S S, Bhattacharyya C,etal.Improvements to the SMO Algorithm for SVM Regression[J].IEEE Transactions on Neural Networks,2000,11(5):1188.
[10] Sun Z L,Choi T M,Au K F,etal.Sales forecasting using extreme learning machine with applications in fashion retailing[J].Decision Support Systems,2008,46:411.