林滿山 王雅楠
(北方工業(yè)大學(xué)計算機學(xué)院 北京 100144)
焙燒是陽極生產(chǎn)中的一個重要工序,焙燒前后產(chǎn)品的物理化學(xué)性能將發(fā)生很大變化,對預(yù)焙陽極的理化性能指標(biāo)和成品率有著重要的影響[1]。國內(nèi)主要對陽極焙燒過程的研究包括,陽極焙燒燃燒架、陽極焙燒爐火道結(jié)構(gòu)、陽極焙燒重油供給溫度的控制、陽極焙燒工藝、焙燒煙氣溫度的控制和陽極焙燒溫度等[2]。魏新偉等[3]依據(jù)其多年在實驗室對不同最高焙燒溫度對陽極性能影響的研究結(jié)果,在原有基礎(chǔ)上對某公司敞開式環(huán)式焙燒爐焙燒曲線和最高焙燒溫度進行了優(yōu)化。趙爽[4]依據(jù)其在實際生產(chǎn)中的工作經(jīng)驗和實驗結(jié)果闡述了陽極焙燒參數(shù)對陽極質(zhì)量的影響。杜玉祿[5]根據(jù)某公司敞開式環(huán)式焙燒爐焙燒曲線的研究發(fā)現(xiàn)設(shè)定周期、終溫、保溫時長為某些值的焙燒曲線,能使陽極達到較好的性能指標(biāo)。目前針對焙燒升溫曲線與量化指標(biāo)間關(guān)系的研究極少,調(diào)整焙燒升溫曲線往往依靠個人實踐經(jīng)驗和人工分析實踐數(shù)據(jù)。
為了評估焙燒升溫曲線對陽極塊質(zhì)量參數(shù)的影響,將深度學(xué)習(xí)的方法應(yīng)用于傳統(tǒng)行業(yè)。遞歸神經(jīng)網(wǎng)絡(luò)RNN 通過神經(jīng)元之間的連接形成有向循環(huán),這使它能夠表達出動態(tài)的時間行為,也使得它們在自然語言處理領(lǐng)域的諸多與時序相關(guān)的問題中應(yīng)用廣泛,如語言模型[6~7],命名實體識別[8]和語法解析[9~10]等。由于溫度數(shù)據(jù)是帶有時間序列屬性的,因此使用時序數(shù)據(jù)的首選網(wǎng)絡(luò)RNN 作為模型建立焙燒溫度與陽極塊質(zhì)量參數(shù)間的關(guān)系模型。本文使用焙燒溫度數(shù)據(jù)和優(yōu)化的RNN模型GRU對質(zhì)量參數(shù)數(shù)據(jù)做預(yù)測,然后使用GBM 完成對預(yù)測值的分類。本文還涉及到對于多個質(zhì)量指標(biāo)的綜合評價,嘗試采用我國在研究中應(yīng)用與關(guān)注較多的聚類分析方法[11],將多個評價指標(biāo)轉(zhuǎn)化為一個,但聚類效果不夠理想。李曉琳和李曉斌[12]研究將多目標(biāo)模糊決策方法應(yīng)用到炭陽極焙燒工藝參數(shù)優(yōu)化中,而本文使用多指標(biāo)投票的方式來劃分質(zhì)量等級。
GRU 模型是一種循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。RNN每個時刻的輸出不僅與當(dāng)前時刻的輸入有關(guān),與上一時刻的輸出也有關(guān)。一個典型的RNN 如圖1 所示。
圖1 RNN結(jié)構(gòu)
假設(shè)時刻t 時,輸入為xt,隱層狀態(tài)為ht。ht不僅和當(dāng)前時刻的輸入有關(guān),也和上一個時刻的隱層狀態(tài)相關(guān)。一般使用如下函數(shù):
這里的f 是非線性函數(shù),一般為logistic 函數(shù)或tanh 函數(shù),W 是輸入層和隱含層之間的權(quán)值矩陣,U 是上一時刻隱含層和當(dāng)前時刻隱含層之間的權(quán)值矩陣,b 是偏置向量。
Gated Recurrent Unit(GRU)是由LSTHochreiter 和Schmidhuber 提出[13]的長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)的一種改動較大的變體,由Cho 等提出[14]。GRU 不僅將LSTM 中的遺忘門和輸入門合成為一個單一的更新門,而且還混合了細胞狀態(tài)和隱藏狀態(tài),使得該模型比標(biāo)準的LSTM 簡單,同時還具備LSTM 避免長期依賴和梯度彌散等問題的優(yōu)點。
上面四個公式是對RNN 中f 函數(shù)的改進,GRU 使用上述公式計算隱含層的值。其中,rt 控制當(dāng)前時刻在計算隱含層的值時對上一時刻的信息獲取量,zt 控制隱含層的最終輸出中上一時刻和當(dāng)前時刻隱層值的占比。其中,式(2)中的Wz ?[ht-1,xt,bz]可以表示為Uzht-1+Wzxt+bz ,式(3)和式(4)與之類似。 σ 表示sigmoid 函數(shù),tanh 表示雙曲正切函數(shù),⊙表示哈達瑪積(Hadamard product)。
本文的質(zhì)量參數(shù)數(shù)據(jù)共包含七個理化指標(biāo)數(shù)據(jù),每個理化指標(biāo)有各自的性能指標(biāo)和企業(yè)標(biāo)準,如表1、2、3所示。
表1 鋁電解用預(yù)焙陽極理化性能指標(biāo)
表2 鋁電解用預(yù)焙陽極理化性能指標(biāo)
表3 鋁電解用預(yù)焙陽極理化性能指標(biāo)
根據(jù)表中企業(yè)標(biāo)準,由如下步驟計算獲得該焙燒塊最終質(zhì)量得分:
1)計算每個樣本達標(biāo)系數(shù)γ,每個理化指標(biāo)值均滿足企業(yè)標(biāo)準則γ=1,否則γ=-1。
2)分別計算每個理化指標(biāo)所有數(shù)據(jù)平均值μi,i 為理化指標(biāo)索引,m 為樣本數(shù)。
3)計算每個理化指標(biāo)數(shù)據(jù)的級別分數(shù)sji ,相應(yīng)指標(biāo)數(shù)據(jù)值優(yōu)于μi則值為1,否則為0。
4)各個指標(biāo)投票獲取最終分值。
5)根據(jù)計算出的焙燒塊質(zhì)量分數(shù)進行評級,五個等級分值范圍分別為:(0.75,1],(0.55,0.75],(0.35,0.55],[0,0.35],(-1,0)。其中小括號為開區(qū)間,中括號為閉區(qū)間。
本文使用的模型由GRU 模型和GBM[15]模型組合而成,將模型的學(xué)習(xí)分為兩個階段,GRU 模型負責(zé)學(xué)習(xí)焙燒溫度數(shù)據(jù)與多個質(zhì)量參數(shù)數(shù)據(jù)之間的關(guān)系,對每條溫度曲線所對應(yīng)的各質(zhì)量指標(biāo)數(shù)值做出預(yù)測。GBM 模型負責(zé)對預(yù)測出的質(zhì)量指標(biāo)數(shù)據(jù)進行分類,判斷按照該溫度曲線焙燒的陽極塊所屬的質(zhì)量等級。本文分別對多個質(zhì)量指標(biāo)數(shù)據(jù)進行了等級劃分,并通過投票的方式統(tǒng)一為質(zhì)量等級。由人工對等級劃分結(jié)果進行核對和評定后,作為GBM 輸出數(shù)據(jù)的標(biāo)識。溫度曲線評估模型如圖2所示。
圖2 溫度曲線評估模型
當(dāng)直接采用GRU 或其他模型來做分類時,由于溫度數(shù)據(jù)每個維度數(shù)值非常相似,模型的效果較差,故嘗試使用分段計算的方式,先對質(zhì)量參數(shù)進行預(yù)測,再將預(yù)測結(jié)果做分類。通過GRU 代價函數(shù)計算出的誤差調(diào)整參數(shù),來最小化訓(xùn)練數(shù)據(jù)的預(yù)測誤差,優(yōu)化模型。
某鋁廠采用采集設(shè)備,采集到陽極焙燒溫度、陽極焙燒壓強等數(shù)據(jù),本文就陽極焙燒溫度進行研究,本文中的焙燒溫度指的是焙燒火道的煙氣溫度。該鋁廠有兩個焙燒廠房,每個廠房有A、B兩個焙燒系統(tǒng)存儲焙燒數(shù)據(jù),每個廠房有若干焙燒爐,每個焙燒爐有九個火道。焙燒升溫過程共六個升溫階段,每個升溫階段持續(xù)30個小時,其中第1、4、5、6 階段的溫度數(shù)據(jù)存儲在焙燒系統(tǒng)中。原始焙燒數(shù)據(jù)部分內(nèi)容如表2所示。
表4 一號廠房A系統(tǒng)部分原始焙燒數(shù)據(jù)
表4 中為整個焙燒數(shù)據(jù)表中的一部分溫度數(shù)據(jù),其中A_1_1 表示A 系統(tǒng)第1 個升溫階段第1 火道在該溫度下的值與它所對應(yīng)的爐號。該表中包含A、B 兩個系統(tǒng)每個系統(tǒng)四個升溫階段的溫度數(shù)據(jù)。設(shè)備采集數(shù)據(jù)頻率為5s 一次,隨著時間的積累,溫度數(shù)據(jù)量巨大,存儲時數(shù)據(jù)按小時存儲。
1)采集原始溫度數(shù)據(jù)和焙燒塊理化指標(biāo)數(shù)據(jù)。
2)將原始溫度數(shù)據(jù)按時間和爐號等信息整合為焙燒溫度數(shù)據(jù),并對溫度數(shù)據(jù)進行min-max標(biāo)準化處理。
3)根據(jù)理化指標(biāo)數(shù)據(jù)利用式(6),式(7)計算出的分值判定其類別,對理化指標(biāo)數(shù)據(jù)進行預(yù)處理。
4)將理化指標(biāo)數(shù)據(jù)作為預(yù)測值,溫度數(shù)據(jù)作為輸入訓(xùn)練GRU 模型,使用tanh 激活函數(shù),學(xué)習(xí)率為0.001,dropout值為0.5,GRU層的時刻t共120個。
5)使用GBM 算法對每個樣本理化指標(biāo)的預(yù)測值進行分類,得到分類結(jié)果。
本實驗使用python 語言編寫所有程序,并在CPU 3.40DHz,內(nèi)存4GB,Windows7 操作系統(tǒng)的計算機上進行了算法的驗證,數(shù)據(jù)采用某鋁廠2015年3 月1 日至2017 年3 月31 日焙燒數(shù)據(jù)。其中3/5數(shù)據(jù)作為訓(xùn)練集,1/5 數(shù)據(jù)作為交叉驗證集,1/5 數(shù)據(jù)作為測試集。模型使用誤差和準確率進行評價。GRU 在不同參數(shù)下訓(xùn)練的預(yù)測值與理化指標(biāo)真實值的均方誤差,以學(xué)習(xí)率為例,如圖3所示。
圖3 不同學(xué)習(xí)率的泛化誤差值
將GRU 模型計算出的理化指標(biāo)預(yù)測值輸入不同算法后得出的焙燒塊類別的準確率如圖4所示。
圖4 模型比較
由上圖可以看出,若直接使用GRU 建立焙燒溫度數(shù)據(jù)與焙燒塊質(zhì)量等級之間的關(guān)系模型,準確率較低。因此考慮將GRU 算法與其他分類算法相結(jié)合。本文分別嘗試了KNN、SVM和GBM算法,使得準確率得到大幅提升。其中SVM 算法比KNN提高約1.9%,GBM 比SVM 算法提高約3.2%,GBM 算法準確率為94.67%,結(jié)果顯示GRU 與GBM 相結(jié)合的方法可以較好的反映焙燒溫度數(shù)據(jù)與焙燒塊質(zhì)量等級之間的關(guān)系。
本文對陽極塊焙燒的升溫曲線和其對應(yīng)的焙燒塊理化指標(biāo)數(shù)據(jù)進行分析,將多指標(biāo)評估任務(wù)轉(zhuǎn)化為單指標(biāo)分類任務(wù)。通過評判使用該升溫曲線燒制出的陽極塊質(zhì)量的好壞,基于GRU 和GBM 的組合模型對溫度曲線進行評估。該模型將分類任務(wù)拆分為預(yù)測和分類兩個步驟,在升溫曲線數(shù)據(jù)上驗證了算法的有效性和可行性,可以達到良好的評估效果。