傅 筱,韓俊毅,曹 闊
(1.上海立信會計金融學(xué)院 信息管理學(xué)院,上海 201209;2.英科鑄數(shù)網(wǎng)絡(luò)科技有限公司,重慶 401147)
鋼鐵是支撐國家發(fā)展和經(jīng)濟建設(shè)的工業(yè)脊梁,也是反映一個國家綜合實力的重要標志。“工業(yè)4.0”自2013年提出后便引起了鋼鐵行業(yè)的廣泛關(guān)注,標志著傳統(tǒng)制造業(yè)向智能化的轉(zhuǎn)型[1]。截至2020年1月,世界經(jīng)濟論壇共評選出44家在第四次工業(yè)革命尖端技術(shù)應(yīng)用整合工作方面卓有成效、在大規(guī)模采用新技術(shù)方面走在世界前沿的“燈塔工廠(global lighthouse network)”,其中就有四家鋼鐵企業(yè)入選,它們分別是塔塔鋼鐵荷蘭艾默伊登公司、塔塔鋼鐵印度公司、韓國浦項制鐵公司與中國寶鋼股份上?;毓S[2]。
近年來,越來越多的過程監(jiān)控與故障診斷系統(tǒng)被用于保證工業(yè)生產(chǎn)過程的安全、節(jié)能、穩(wěn)定與高效。來自美國、德國等工業(yè)發(fā)達體的制造業(yè)企業(yè)率先圍繞自身設(shè)備展開工業(yè)智慧化,建立了各自的云服務(wù)平臺,例如通用電氣公司的Predix工業(yè)互聯(lián)網(wǎng)操作系統(tǒng)與西門子股份公司的MindSphere開放式物聯(lián)網(wǎng)操作系統(tǒng);與此同時,在國內(nèi)如上海寶信軟件股份有限公司、中冶賽迪集團有限公司等科技型企業(yè)也積極響應(yīng)智能化升級戰(zhàn)略,助力我國鋼鐵工業(yè)初步進入轉(zhuǎn)型階段。
目前針對工業(yè)故障診斷問題已經(jīng)建立了相對完整的理論體系,并積累了一定的實踐經(jīng)驗,但是鋼鐵冶煉過程中的不確定、不規(guī)則、強相關(guān)、高主觀等因素仍制約著這項傳統(tǒng)工業(yè)的數(shù)字化轉(zhuǎn)型進程[3-5]。
隨著大數(shù)據(jù)時代的到來,故障診斷系統(tǒng)在推進鋼鐵智能制造的實際應(yīng)用中存在著亟待解決的問題,依據(jù)大數(shù)據(jù)的特征可以歸納為以下幾點。
1)數(shù)據(jù)量大(Volume):如何高效采集、傳輸、存儲和管理工業(yè)大數(shù)據(jù);
2)速度快(Velocity):面對高速積累與實時更新的監(jiān)測數(shù)據(jù),如何保障故障診斷系統(tǒng)的時效性;
3)價值密度低及真實性保障(Value & Veracity):如何挖掘出隱藏在海量數(shù)據(jù)中的有價值的信息,并對未來可能發(fā)生的故障做出可靠、及時的預(yù)警;
4)類型多(Variety):多類型及非同源的數(shù)據(jù)可以更好地描述設(shè)備運行狀態(tài),但同時也對診斷模型的多模態(tài)處理與自適應(yīng)能力提出了更高的要求。
針對以上問題,本文結(jié)合當前大數(shù)據(jù)時代的特征,總結(jié)分析了故障診斷方法在國內(nèi)外鋼鐵行業(yè)的研究現(xiàn)狀,探索了機器學(xué)習(xí)算法與遷移學(xué)習(xí)技術(shù)在高爐冶鐵過程管控中的應(yīng)用前景及有待突破的關(guān)鍵問題,并在此基礎(chǔ)上對未來可能的研究方向進行了展望。
高爐煉鐵是指在高溫下使用還原劑將含鐵礦石還原成液態(tài)生鐵的過程,其工藝流程由高爐本體與上料、送風(fēng)、煤氣回收與除塵、渣鐵處理、噴吹燃料五個輔助系統(tǒng)組成[6-7]。在運行過程中,齒輪疲勞損壞、主軸動平衡破壞、通流管路堵塞及其引起的喘振、軸承溫度異常升高等都會影響冶煉設(shè)備的正常運行[8-9]。如果無法及時識別設(shè)備故障,不僅會降低生鐵的質(zhì)量和產(chǎn)量,增加能源消耗,還會縮短設(shè)備使用壽命,甚至導(dǎo)致嚴重的安全事故[10]。
傳統(tǒng)的工業(yè)設(shè)備故障處理主要由技術(shù)人員根據(jù)原始設(shè)備制造商提供的獨立設(shè)備的性能參數(shù)做出判斷,其任務(wù)包括發(fā)現(xiàn)和診斷過程異常事件,并做出合適的決策使對象恢復(fù)到安全、正常的運行狀態(tài)[3-4]。而當前鋼鐵廠的現(xiàn)場操作員通常只能完成較淺層次的設(shè)備養(yǎng)護工作,且即便是具備了較高專業(yè)知識水平的工程師也可能由于過往經(jīng)驗的差異而在面對相同故障時做出不同的判斷[5]。此外,外部生產(chǎn)環(huán)境(如溫度、濕度等)的變化及設(shè)備運行過程中零部件的磨損、腐蝕直至被替換,都會導(dǎo)致設(shè)備的實際性能參數(shù)與原廠參數(shù)發(fā)生偏移;并且隨著制造業(yè)水平的提高,各類設(shè)備的耦合性也在逐漸增強。
因此,我們需要從全局的角度,綜合分析冶煉自動化設(shè)備現(xiàn)場采集到的工業(yè)大數(shù)據(jù),從中發(fā)現(xiàn)新的模式與知識,實現(xiàn)變工況條件下高爐煉鐵故障的智能診斷與預(yù)警。
本節(jié)分別從工業(yè)大數(shù)據(jù)的采集與實時監(jiān)控,基于機器學(xué)習(xí)的故障診斷方法,及遷移學(xué)習(xí)技術(shù)在故障診斷中的應(yīng)用三方面討論了可用于解決鋼鐵企業(yè)在大數(shù)據(jù)時代所面臨的數(shù)據(jù)量大、速度快、價值密度低與類型多等問題的研究進展(其對應(yīng)關(guān)系如圖1所示)。
圖1 工業(yè)故障診斷系統(tǒng)研究與大數(shù)據(jù)特征之間的對應(yīng)關(guān)系
近些年分布式數(shù)據(jù)采集和監(jiān)控(supervisory control and data acquisition,SCADA)系統(tǒng)的普及使人們可以管理和監(jiān)督鋼鐵制造過程,充分利用現(xiàn)有的SCADA數(shù)據(jù)是當前提高設(shè)備運行可靠性最迅速、有效的方式之一[11]。然而目前該類系統(tǒng)的故障診斷模塊仍主要采用基本的上下限報警模式,即當實時數(shù)據(jù)與健康估計值之間的殘差呈持續(xù)升高的趨勢并超過預(yù)設(shè)閾值時,就認為設(shè)備出現(xiàn)異常[12]。由于其沒有考慮噪聲信號的干擾及監(jiān)測參數(shù)之間的相關(guān)性,從而存在著較高的虛警率,且無法對部分潛在故障做出及時預(yù)警。現(xiàn)有的研究主要從閾值選擇和殘差評估兩方面對SCADA系統(tǒng)的故障診斷模塊進行優(yōu)化。
1.1.1 閾值選擇
傳感器失效、數(shù)據(jù)傳輸異常及人為操作失誤等因素都會導(dǎo)致SCADA數(shù)據(jù)中出現(xiàn)異常值,為了分辨噪聲數(shù)據(jù)與設(shè)備異常信號,Marti-puig等[13]通過分析與齒輪箱溫度變化相關(guān)的特征參數(shù)后,發(fā)現(xiàn)由環(huán)境噪聲產(chǎn)生的離群點對正常狀態(tài)的偏離較大,因而在確定了參數(shù)的絕對與相對閾值(例如,軸承溫度=環(huán)境溫度±30 ℃)的基礎(chǔ)上,依據(jù)專家知識設(shè)置了范圍更廣的上下限去除環(huán)境噪聲的影響。而針對工業(yè)參數(shù)閾值選擇仍較大程度依賴于主觀經(jīng)驗,缺少理論依據(jù)的問題,劉躍飛等[12]使用統(tǒng)計過程控制分析得到齒輪箱油溫殘差近似服從正態(tài)分布,并依此分別設(shè)定μ±2σ與μ±3σ為異常提示與故障報警閾值。通過研究SCADA數(shù)據(jù)間的耦合關(guān)系,Zhu等[14]使用層次分析法與最小二乘法獲得參數(shù)的動態(tài)閾值,如齒輪潤滑箱溫度隨冷卻系統(tǒng)、電機功率、艙室溫度等因素的變化而改變;方志寧等[15]則提出通過設(shè)置基于邏輯規(guī)則的自定義報警閾值,實現(xiàn)在參數(shù)值未單獨越限的情況下,從系統(tǒng)整體的角度提前做出預(yù)警。
1.1.2 殘差評估
為了減少因局部異常點而導(dǎo)致的虛警,并有效表征工業(yè)過程的動態(tài)特性,具有數(shù)據(jù)平滑功能的滑動窗口被研究用于評估實際觀測值與模型預(yù)測值間的差異。孫建平等[16]利用滑動窗殘差統(tǒng)計法計算估計值與實際值之間的殘差均值,描繪相似度曲線,并以此均值的實時變化趨勢監(jiān)測齒輪箱軸承溫度是否異常。劉峰里[17]提出雙滑動窗法,先利用寬度較小的快速預(yù)警窗口對鼓風(fēng)機相似度序列進行統(tǒng)計分析,而當快速預(yù)警窗口監(jiān)測到異常時,則觸發(fā)寬度較長的備用窗口進行驗證,從而在保證及時發(fā)現(xiàn)異常的同時減少因孤立異常點引發(fā)的虛警次數(shù)。周韶園[18]根據(jù)過程事件變化的緩慢或劇烈程度,使用變長度移動窗口保證在每一時刻截取的過程數(shù)據(jù)都能有效包含過程異常狀態(tài)的特征信息。Kusiak等[19]與Zhu等[14]則采用滑動窗平均消除緩慢的熱傳導(dǎo)對溫度相關(guān)參數(shù)的潛在影響。
與此同時,SCADA系統(tǒng)中自帶的上下限報警信號則被作為基準,評估改進后的故障診斷模型的性能。為了避免風(fēng)機報警信號過多導(dǎo)致操作人員難以及時識別,Bangalore等[20]使用三位數(shù)字編碼對發(fā)生在不同部位的不同故障進行分類標注,從而可以直接將故障信息用于指導(dǎo)設(shè)備檢修。
SCADA系統(tǒng)測點眾多,采集得到的數(shù)據(jù)包括振動、溫度、壓力、功率、電壓、電流等信號。其中振動信號因可以指示機械故障與結(jié)構(gòu)缺陷而被廣泛地應(yīng)用于評估設(shè)備中齒輪、軸承等部件的健康狀況[21-22],現(xiàn)有的很多工業(yè)故障診斷系統(tǒng)都依賴于測量和分析位移、速度、加速度等振動信號[23-26]。但是,基于信號的故障診斷方法通常只能提取輸出信號的時頻域特征,而較少關(guān)注輸入信號的動態(tài)變化,未知的輸入擾動會降低它的診斷準確性;并且由于冶金設(shè)備涉及的參數(shù)眾多,單純地使用基于信號的方法無法表征整個系統(tǒng)的實際運行狀況。
因此,為了快速、精確地識別異常,通過分析大量離線及在線數(shù)據(jù)來描述過程對象的運行模式和相關(guān)規(guī)律,同時對領(lǐng)域?qū)<业囊蕾嚦潭容^小的,基于機器學(xué)習(xí)的故障診斷方法被越來越多地應(yīng)用于提取海量SCADA監(jiān)控數(shù)據(jù)中的隱含信息[27]。
過程工業(yè)控制中的故障診斷任務(wù)可以分為故障檢測,故障分離與故障識別[21,28]。
1.2.1 故障檢測
故障檢測是工業(yè)故障診斷中最基本的任務(wù),即判斷設(shè)備是否出現(xiàn)異常。劉帥等[29]使用核極限學(xué)習(xí)機(extreme learning machine, ELM)并結(jié)合信息熵識別齒輪箱軸承溫度異常。為了觀察工業(yè)設(shè)備運行的動態(tài)時間特性,吳亞聯(lián)等[30]將前一采樣時刻的主軸承溫度與當前時刻的轉(zhuǎn)速、功率等參數(shù)同時輸入反向傳播(backpropagation,BP)神經(jīng)網(wǎng)絡(luò)預(yù)測當前時刻的軸承溫度;方志寧等[15]將BP神經(jīng)網(wǎng)絡(luò)與決策樹算法結(jié)合,以當前的監(jiān)測數(shù)據(jù)為模型輸入預(yù)測后續(xù)時刻的參數(shù)取值。而Bangalore等[20]則運用NARX(nonlinear autoregressive neural network with exogenous input)神經(jīng)網(wǎng)絡(luò)為齒輪箱軸承正常工作10分鐘的平均溫度建立行為模型,其研究結(jié)果表明使用基于機器學(xué)習(xí)的診斷方法可以比分析振動信號提前約一周預(yù)警溫度異常。
1.2.2 故障分離
故障分離用于進一步確定故障的種類、發(fā)生時間及位置。Zhang等在利用Hotelling’s T2統(tǒng)計量與SPE統(tǒng)計量分析一臺高爐12天的歷史數(shù)據(jù)識別其低溫異常[31]的基礎(chǔ)上,提出了一種基于主成分分析與LMNN (large margin nearest neighbor)的多分類方法診斷四類高爐故障(即懸料、管道行程、崩料與爐溫過低)[32];在此過程中,研究者通過融合三臺反應(yīng)機理相似的高爐的兩年歷史數(shù)據(jù),解決了單臺高爐故障訓(xùn)練數(shù)據(jù)不足的問題。機器學(xué)習(xí)中其它的多分類算法如最小二乘支持向量機[33]、Softmax回歸[34]、k近鄰算法[35]等同樣被應(yīng)用于判斷高爐本體或輔助系統(tǒng)旋轉(zhuǎn)機械的故障類別。
為了識別設(shè)備零部件協(xié)同工作所造成的同時發(fā)生多處故障的情況,Wang等[36]利用基于粒子群優(yōu)化的變分模態(tài)分解算法得到模態(tài)分量個數(shù)m(即當m=0時:無故障;當m=1時:單一故障;當m>1時:并發(fā)故障數(shù)目),并通過修改ELM決策方程使其輸出前m個可能性最大的故障類別實現(xiàn)對并發(fā)故障的診斷,實驗結(jié)果顯示對并發(fā)故障的識別率低于對單一故障的識別。
而針對冶金過程中時常會發(fā)生的新的未知故障的問題,一種基于滑動窗隱馬爾可夫模型(hidden markov model,HMM)的閾值統(tǒng)計方法被用于判斷已知及未知故障[37]。研究者提出如果實際觀測值的后驗概率方差小于HMM方法學(xué)習(xí)得到的閾值,則說明實際值屬于現(xiàn)有模式的概率極低,從而可以判定產(chǎn)生了未知故障;否則就進一步使用維特比算法確定當前滑動窗所屬的模式向量,實現(xiàn)故障分離。
1.2.3 故障識別
故障識別用于評估故障的嚴重程度,如使用現(xiàn)有的ISO-2372設(shè)備振動標準[38-39]根據(jù)振動速度對轉(zhuǎn)子不平衡與軸系不對中故障進行分級[24]。由于目前并沒有統(tǒng)一的冶金設(shè)備或零部件故障嚴重程度的分級標準,Zhu等[14]首先通過對72組軸承振動信號的峰度與均方根聚類分析后,發(fā)現(xiàn)適合將其劃分為四類,隨后采用模糊評價模型將設(shè)備健康狀況劃分“良好”、“需關(guān)注”、“異?!迸c“故障”。設(shè)備的故障等級將直接影響鋼鐵廠后續(xù)的運維決策。
1.2.4 方法集成
鋼鐵工業(yè)作為大型復(fù)雜工業(yè)系統(tǒng),需要監(jiān)測的數(shù)據(jù)類型多種多樣。若只采用單一的故障診斷技術(shù),則會存在識別精度低、泛化能力弱等問題,難以取得滿意的診斷效果[40]。
融合多種故障診斷方法被證實可以通過方法間的差異互補或交叉驗證,平衡不同方法的優(yōu)缺點來獲得比使用單一技術(shù)更出色的性能[41]。如通過裝袋法與多數(shù)投票算法集成不同核函數(shù)的SVM算法更準確地判斷高爐的運行狀態(tài)[42],使用支持向量回歸合并三種ELM模型(即ELM,WELM與ORELM)的預(yù)測結(jié)果得到更精確的功率曲線[43];或在采樣初期因缺少故障數(shù)據(jù)先使用基于觀測器的方法,而隨著設(shè)備的運行,當發(fā)生故障后,通過將故障數(shù)據(jù)反饋給診斷模型實現(xiàn)基于知識的診斷[44-45];也可以將振動信號的時頻域特征作為參數(shù)輸入基于機器學(xué)習(xí)算法的故障診斷模型,通過結(jié)合信號處理技術(shù)與機器學(xué)習(xí)方法提高故障診斷系統(tǒng)的精確性與魯棒性[20,43]。
基于機器學(xué)習(xí)的智能故障診斷方法已被廣泛地應(yīng)用于從不同結(jié)構(gòu)、不同來源的工業(yè)SCADA數(shù)據(jù)中挖掘和解釋隱藏的重要信息。然而傳統(tǒng)的機器學(xué)習(xí)方法通常都假設(shè):1)訓(xùn)練集數(shù)據(jù)與測試集數(shù)據(jù)服從同一分布;2)可以獲得足夠的數(shù)據(jù)訓(xùn)練可靠模型。但在實際的冶金數(shù)據(jù)采集過程中,由于生產(chǎn)環(huán)境和市場需求的持續(xù)變化,使用歷史數(shù)據(jù)訓(xùn)練得到的模型很可能無法適用于當前階段;并且難以將所有類型的,特別是極端工況條件下的故障信息都事先涵蓋于模型的訓(xùn)練集中。因此,遷移學(xué)習(xí)被研究用于解決高爐煉鐵故障診斷中,訓(xùn)練集與測試集數(shù)據(jù)分布存在差異,以及標注數(shù)據(jù)過期或缺少的問題。
遷移學(xué)習(xí)指將在解決一個問題時所獲得的知識應(yīng)用于解決另一個不同但相關(guān)的問題,即將從源域?qū)W習(xí)到的知識遷移到目標域中[46]。在設(shè)備的故障診斷中,遷移學(xué)習(xí)通過分析已有的源域數(shù)據(jù),為目標域的故障診斷提供有價值的信息,實現(xiàn)在提高數(shù)據(jù)利用率的同時,提升建模效果。
Zhang等[34]使用測地線流式核方法從少量已標注的源域數(shù)據(jù)與未標注的目標域數(shù)據(jù)中提取可傳遞的特征參數(shù)。Chai等[35]提出了一種改良的基于細粒度對抗網(wǎng)絡(luò)的領(lǐng)域自適應(yīng)方法,使得通過遷移所產(chǎn)生的特征在降低了源域與目標域之間的分布偏差的同時,也保存了目標域中不同種類的樣本的差異化信息。Cao等[47]發(fā)現(xiàn)來自ImageNet數(shù)據(jù)集的海量圖片可以被用于訓(xùn)練m層卷積神經(jīng)網(wǎng)絡(luò)的前n層神經(jīng)元完成特征提取,而訓(xùn)練剩余的實現(xiàn)分類功能的m-n層神經(jīng)元僅需少量的齒輪故障數(shù)據(jù)即可完成。Xu等[48]使用模型仿真得到的不同制造階段的數(shù)據(jù)后,利用棧式稀疏自編碼器傳遞模擬故障信息用以識別真實生產(chǎn)線異常。
現(xiàn)有的智能故障診斷技術(shù)被證實可對高爐煉鐵過程中不同設(shè)備的異常狀態(tài)進行預(yù)警,包括電動機(電機)的超速、斷軸、大軸承彎曲、燒瓦與油膜振蕩,鼓風(fēng)機(風(fēng)機)的風(fēng)量不足、過熱、潤滑油泄漏與軸承振動加劇,以及高爐本體的崩料,懸料,管道行程與爐溫過低等。研究通過設(shè)置相對閾值降低外部環(huán)境因素的影響,并利用滑動窗口法評估系統(tǒng)殘差,動態(tài)監(jiān)控工業(yè)過程,減少虛警的發(fā)生。多種機器學(xué)習(xí)算法被用于從海量SCADA測點數(shù)據(jù)中自動挖掘隱藏信息,實現(xiàn)故障的檢測、分離與識別;同時結(jié)合遷移學(xué)習(xí)技術(shù)可以解決冶煉過程中故障數(shù)據(jù)與健康數(shù)據(jù)比例失衡的問題。
但是由于高爐煉鐵數(shù)據(jù)采集、檢驗、標注過程的周期長、成本高,以及不同鋼鐵集團間數(shù)據(jù)的非共享性,現(xiàn)有的大多數(shù)研究結(jié)果都僅僅基于狀態(tài)相對理想的實驗室數(shù)據(jù)或采樣時長較短的現(xiàn)場數(shù)據(jù),其在真實復(fù)雜工業(yè)環(huán)境中的魯棒性及普適能力仍有待進一步驗證。
在如今的大數(shù)據(jù)背景下,智能故障診斷方法隨著信息技術(shù)和鋼鐵工業(yè)自動化的快速發(fā)展而不斷完善,但是在解決實際工業(yè)問題的過程中仍存在著如下問題:
1)機器學(xué)習(xí)算法的“黑箱”特性使得現(xiàn)有的基于知識的診斷方法的可解釋性較差,很難直觀地描述模型輸入特征與輸出值之間的關(guān)系,導(dǎo)致現(xiàn)場操作人員無法直接根據(jù)模型結(jié)果調(diào)整設(shè)備參數(shù);
2)不同傳感器采樣頻率不同或信號傳輸不穩(wěn)定會造成某些時間點觀測數(shù)據(jù)缺失,且由于冶煉設(shè)備長期運行于高溫、高壓等惡劣環(huán)境中,從而易導(dǎo)致傳感器失效而無法獲得部分參數(shù);
3)目前仍缺乏統(tǒng)一的設(shè)備故障嚴重程度分級標準,這將不僅不利于故障診斷方法在實際工業(yè)領(lǐng)域的應(yīng)用與推廣,同時也將阻礙對微小故障的早期診斷,可能導(dǎo)致部分隱蔽性較強的故障直到發(fā)展到較嚴重的水平時才能夠被識別出來;
4)以往的故障診斷研究一般只強調(diào)設(shè)備運行的安全性而沒有考慮其運行成本,而值得注意的是,基于機器學(xué)習(xí)的診斷方法不能做到準確識別每一個潛在故障[49-50],從而可能產(chǎn)生虛警,并影響后續(xù)的運維活動;
5)機器學(xué)習(xí)算法的應(yīng)用仍局限于局部組件的故障診斷,未能綜合考慮零部件及設(shè)備間的耦合關(guān)系,離評估整體設(shè)備及完整工藝流程的運行狀態(tài)還有一定的差距。
針對以上實際應(yīng)用需求,基于采集到的工業(yè)大數(shù)據(jù),我們使用“系統(tǒng)—模塊—功能—屬性”四層結(jié)構(gòu)描述鋼鐵冶煉工藝流程(如圖2所示,圖中以高爐鼓風(fēng)機的故障診斷為例展開),其中系統(tǒng)層由電動機系統(tǒng)、鼓風(fēng)機系統(tǒng)、高爐系統(tǒng)等關(guān)鍵設(shè)備構(gòu)成;而各系統(tǒng)可劃分為不同模塊,如數(shù)據(jù)采集模塊、故障診斷模塊、運維管理模塊、成本分析模塊等;針對每一模塊,又可以按照其不同功能設(shè)置進一步分解,如故障診斷模塊包括故障的檢測、分離與識別;最底層的參數(shù)屬性則直觀展示了各個部位的運行狀態(tài),同時也是數(shù)據(jù)與人產(chǎn)生交互的基本方式。
圖2 鋼鐵冶煉工藝層次結(jié)構(gòu)(以鼓風(fēng)機的故障診斷為例展開)
本節(jié)依此結(jié)構(gòu)由底至上整體地對未來可能的研究方向進行展望。
在鋼鐵工業(yè)中,實現(xiàn)對關(guān)鍵屬性超前一定時間的序列預(yù)測對掌握底層動態(tài)制造過程,并優(yōu)化上層性能表現(xiàn)十分重要。煉鐵過程中的參數(shù)采樣具有隨機性和間歇性的特點[51],在學(xué)習(xí)和預(yù)測長度不同的時間序列時具有穩(wěn)定表現(xiàn)的長短時記憶網(wǎng)絡(luò)和門控循環(huán)單元網(wǎng)絡(luò)模型[52-53]可被進一步研究,如通過添加氣溫、空氣密度、相對濕度等環(huán)境因素為附加輸入或與其它機器學(xué)習(xí)算法融合,提高模型中長期預(yù)測精度。
1)盡管單純地應(yīng)用機理分析或技術(shù)人員的經(jīng)驗較難解決當前多屬性、多耦合、多狀態(tài)的工業(yè)問題,但通過向數(shù)據(jù)補缺、特征篩選等步驟中引入物理機理模型與領(lǐng)域?qū)<抑R(如風(fēng)機性能曲線、管網(wǎng)特性曲線等),以“數(shù)據(jù)+機理/知識”的模式進行工業(yè)大數(shù)據(jù)分析,將有助于破解智能故障診斷模型的“黑箱”問題,提升模型的可解釋性與可交互性;
2)由于在鋼鐵行業(yè)即使是微小的故障也可能引發(fā)嚴重的安全事故,建立統(tǒng)一的《冶金設(shè)備故障嚴重程度分級標準》可以通過數(shù)字、文本、圖像等方式多模態(tài)地描述故障演變過程,保證決策的一致性;也可以將該分級標準作為基于機器學(xué)習(xí)的故障識別方法的評價依據(jù),融合信號處理、自然語言處理、圖像處理等技術(shù),構(gòu)建工業(yè)知識圖譜,更好地實現(xiàn)對故障的早期識別與早期維護。
1)采集得到的數(shù)據(jù)質(zhì)量將直接影響故障診斷的效果,目前針對鋼鐵廠所使用的超大功率電機、風(fēng)機設(shè)備的研究較少,且由于現(xiàn)場數(shù)據(jù)采集耗時長、代價高,多數(shù)診斷方法僅采用標準仿真數(shù)據(jù)庫或?qū)嶒炇夷M數(shù)據(jù)評估其性能,因而研究如何高效地存儲、傳輸并更新海量工業(yè)數(shù)據(jù)可以推進實驗理論研究在真實的工業(yè)環(huán)境中的應(yīng)用;
2)故障種類、發(fā)生部位、嚴重程度等因素應(yīng)與成本分析結(jié)果共同指導(dǎo)工廠運維部門的作業(yè)調(diào)度,且對潛在故障的預(yù)警及相應(yīng)的預(yù)防性運維活動也會影響經(jīng)濟決策的制定,因此研究“故障”、“運維”、“成本”相關(guān)模塊之間的交互與融合將幫助提高運維效率,降低生產(chǎn)成本,實現(xiàn)鋼鐵制造的多目標優(yōu)化。
鋼鐵冶煉由電機、風(fēng)機、高爐等系統(tǒng)協(xié)同工作,如通過勵磁同步電機帶動軸流式鼓風(fēng)機向高爐送風(fēng),任一系統(tǒng)的故障都有可能聯(lián)動導(dǎo)致其它系統(tǒng)發(fā)生異常。而鋼鐵廠現(xiàn)有的技術(shù)未能實現(xiàn)對工藝流程所涉及的各系統(tǒng)進行統(tǒng)一管控,系統(tǒng)與系統(tǒng)之間仍依靠人工聯(lián)系,信息的不一致、溝通的不及時會增加冶煉過程的不確定性,如何將面向單一系統(tǒng)局部故障的診斷方法擴展至面向整體的多系統(tǒng)仍有待研究。
工業(yè)大數(shù)據(jù)具有數(shù)據(jù)量大、實時性高、價值密度低、數(shù)據(jù)類型多及需保障真實性等特點,為有效提升其在鋼鐵工業(yè)中的利用價值,深度挖掘揭示工藝流程運行狀態(tài)的新知識與新規(guī)律,本文對近年來應(yīng)用于高爐煉鐵過程的基于機器學(xué)習(xí)算法的故障診斷技術(shù)進行了總結(jié),并探討了應(yīng)用遷移學(xué)習(xí)解決故障數(shù)據(jù)小樣本與類別不均衡問題的可行性,最后結(jié)合鋼鐵企業(yè)的實際需求與現(xiàn)存問題,提出了面向整體的分層故障診斷研究思想。通過融合多源數(shù)據(jù)分析技術(shù),將可以建立高準確率、高可靠性的故障診斷模型,從而降低運維成本、提升工藝水平、保障生產(chǎn)安全,同時將人力解放出來從事更有意義的管理與決策工作。
工業(yè)大數(shù)據(jù)是我國“智能制造”和“工業(yè)互聯(lián)網(wǎng)”的重要技術(shù)支撐[54],工業(yè)大數(shù)據(jù)分析技術(shù)的創(chuàng)新與發(fā)展,必將成為未來提升工業(yè)生產(chǎn)力和競爭力的關(guān)鍵要素?;跈C器學(xué)習(xí)算法的故障診斷技術(shù)促進了鋼鐵工業(yè)數(shù)字化的發(fā)展,但面對大數(shù)據(jù)時代不斷涌現(xiàn)的新需求、新機遇,為進一步推進智能故障診斷方法在實際工業(yè)場景中的應(yīng)用,保障傳統(tǒng)工業(yè)的智能制造與綠色發(fā)展,仍需做更多更深入的研究。