李思思,杜永貴,閆 飛,閻高偉
(太原理工大學(xué) 電氣與動力工程學(xué)院,太原 030024)
球磨機(jī)是廣泛應(yīng)用于電力、化工等流程工業(yè)領(lǐng)域的典型高能耗設(shè)備,其負(fù)荷參數(shù)的準(zhǔn)確檢測對磨礦作業(yè)環(huán)節(jié)的優(yōu)化控制、節(jié)能降耗、安全運(yùn)行具有重要的意義。
目前,球磨機(jī)的負(fù)荷參數(shù)檢測通常采用軟測量策略,即選擇與主導(dǎo)變量相關(guān)的輔助變量(振動或振聲信號)建立模型,得到負(fù)荷參數(shù)預(yù)測值。文獻(xiàn)[1]針對球磨機(jī)振動信號特征值具有散度大、隨機(jī)性強(qiáng)的特點(diǎn)提出基于云模型的建模策略。文獻(xiàn)[2]根據(jù)多源信號存在相關(guān)性、互補(bǔ)性以及冗余性的特性提出多源數(shù)據(jù)特征融合的球磨機(jī)負(fù)荷軟測量方法。然而,上述建模策略僅適用于解決單工況問題。
在實(shí)際的運(yùn)行中,運(yùn)行任務(wù)與設(shè)定值的變化、外界環(huán)境的改變、設(shè)備重組等,會導(dǎo)致運(yùn)行工況、數(shù)據(jù)分布發(fā)生改變[3]。對于多工況過程,現(xiàn)有研究通常采用多模型策略。該策略主要針對全局模型抽取共同特征以達(dá)到概率同分布的技術(shù)要求。文獻(xiàn)[4]依據(jù)先驗(yàn)知識劃分工況,然后對多個工況分別建立子模型。文獻(xiàn)[5]引入均值聚類的方法對工況進(jìn)行劃分與識別。但是,多模型在集成過程中,由于樣本劃分不精確、部分模型數(shù)據(jù)缺失等因素導(dǎo)致輸出精度低,預(yù)測效果不理想。
遷移學(xué)習(xí)[6-7]是一種放寬了數(shù)據(jù)同分布要求的機(jī)器學(xué)習(xí)方法。該方法通過抽取領(lǐng)域間“隱含語義”或挖掘領(lǐng)域間“共享知識結(jié)構(gòu)”,遷移源域已有的知識來解決未知但與源域相關(guān)的學(xué)習(xí)問題。目前,遷移學(xué)習(xí)應(yīng)用于計(jì)算機(jī)視覺[8]、多工況故障診斷[9]等方面,并且取得了諸多成果。
綜上所述,本文引入遷移學(xué)習(xí)策略,同時(shí)考慮到球磨機(jī)振動信號不確定性的特點(diǎn),研究了一種基于半監(jiān)督域適應(yīng)模糊推理的軟測量方法。該方法首先通過半監(jiān)督域適應(yīng)解決數(shù)據(jù)分布差異導(dǎo)致的模型失配問題;然后,通過模糊C均值聚類對不確定非線性系統(tǒng)的源域數(shù)據(jù)劃分規(guī)則并建立回歸模型,從而提高模型預(yù)測性能。
希爾伯特-施密特獨(dú)立標(biāo)準(zhǔn)[10]計(jì)算兩組數(shù)據(jù)集間再生核希爾伯特空間的協(xié)方差來衡量數(shù)據(jù)之間的獨(dú)立性。當(dāng)且僅當(dāng)兩數(shù)據(jù)集間相互獨(dú)立時(shí),其值為零;當(dāng)數(shù)據(jù)集間的依賴性越強(qiáng)時(shí),其值越大。最大化數(shù)據(jù)X及標(biāo)簽Y的依賴性,得到目標(biāo)函數(shù)為:
max Tr(VTXHYHXTV) .
(1)
文獻(xiàn)[11]研究了基于流形正則化域適應(yīng)濕式球磨機(jī)負(fù)荷參數(shù)軟測量方法。目標(biāo)函數(shù)為:
(2)
式中:上標(biāo)s、t表示為源域和目標(biāo)域;L為Laplacian矩陣;Mc為擴(kuò)展非參數(shù)最大均值差異矩陣。流形正則化域適應(yīng)方法首先采用集成流形約束、最大方差及擴(kuò)展非參數(shù)最大均值差異方法得到特征變換矩陣;然后將目標(biāo)域和源域數(shù)據(jù)通過投影變換矩陣投影到公共子空間;最后應(yīng)用統(tǒng)計(jì)方法建立預(yù)測模型。
球磨機(jī)是包含多種不確定性擾動的多變量對象。其運(yùn)行過程中,由于環(huán)境的復(fù)雜性,即使在同一負(fù)荷參數(shù)的情況下振動信號也會存在很強(qiáng)的不確定性,并且隨著鋼球和襯板的磨損,振動信號存在時(shí)變性。為此,可以采用非線性的模糊推理方法建立回歸預(yù)測模型,從而利用IF-THEN模糊規(guī)則把不確定非線性系統(tǒng)的狀態(tài)空間分成不同的區(qū)域,構(gòu)建容忍參數(shù)不確定性的模糊推理模型[12]。
設(shè)模糊規(guī)則把不確定非線性系統(tǒng)的狀態(tài)空間劃分為K個區(qū)域,第i∈[1,K]個規(guī)則為Ri,則模糊推理如下:
Ri:IfxisAi(x,ci), theny=L(x,pi) .
(3)
式中:Ai為模糊系統(tǒng)的模糊集;pi為模糊參數(shù);ci為隸屬中心。
工況改變時(shí),待測數(shù)據(jù)與歷史數(shù)據(jù)分布失配,導(dǎo)致原模型失準(zhǔn)。若根據(jù)少量有標(biāo)簽的待測樣本建模,則難以滿足傳統(tǒng)機(jī)器學(xué)習(xí)方法需要足夠多樣本才能建立模型的前提條件。若根據(jù)歷史數(shù)據(jù)建立軟測量回歸模型,則會違背機(jī)器學(xué)習(xí)及統(tǒng)計(jì)方法建立在同分布條件的前提。
針對振動信號的不確定性及工況改變后數(shù)據(jù)分布的差異造成模型失配的問題,本文根據(jù)工況變化前后數(shù)據(jù)分布特征,建立基于半監(jiān)督域適應(yīng)模糊推理模型,從而得到待測工況負(fù)荷參數(shù)預(yù)測值。
文獻(xiàn)[11]屬于無監(jiān)督特征映射方法,無法將標(biāo)簽信息融入特征映射的過程來提高公共子空間數(shù)據(jù)的可辨識屬性。為此,將公式(1)引入公式(2)得到得到半監(jiān)督域適應(yīng)方法。該方法目標(biāo)函數(shù)為:
(4)
為求得特征變換矩陣V,將公式(4)最大化問題轉(zhuǎn)化為:
(5)
引入拉格朗日乘子:
(6)
式(6)對V求導(dǎo)得:
(7)
半監(jiān)督域適應(yīng)方法具體過程:首先,根據(jù)公式(7)求得特征變換矩陣V;其次,分別將源域、目標(biāo)域數(shù)據(jù)投影公共子空間。
建立前件辨識模型。設(shè)樣本個數(shù)為n,利用模糊C均值聚類方法將輸入數(shù)據(jù)X=[x1,x2,…,xn]分成若干類。模糊C均值聚類的目標(biāo)函數(shù)為:
(8)
式中,m為模糊指數(shù)。聚類中心ci及其隸屬度μ可以利用拉格朗日條件極值得到:
(9)
(10)
建立后件辨識模型。對于輸入數(shù)據(jù),輸出可以表示為:
(11)
因此,給定輸入數(shù)據(jù)X=[x1,x2,…,xn],模糊推理的輸出數(shù)據(jù)為:
(12)
系數(shù)矩陣p可以通過最小化目標(biāo)函數(shù)(13)求得:
J2=(Fp-Y)T(Fp-Y) .
(13)
式中,Y為真實(shí)輸出標(biāo)簽。目標(biāo)函數(shù)為關(guān)于p的二次函數(shù),則輸出的系數(shù)矩陣最優(yōu)解為:
p=(FTF)-1FTY.
(14)
基于半監(jiān)督域適應(yīng)模糊推理方法如圖1所示。首先利用半監(jiān)督域適應(yīng)方法將源域和目標(biāo)域的高維數(shù)據(jù)映射到公共子空間,降低因數(shù)據(jù)分布差異造成的模型失配的影響;然后利用特征映射后源域數(shù)據(jù)進(jìn)行模糊C均值聚類;最后根據(jù)聚類結(jié)果建立相應(yīng)的模糊推理預(yù)測模型,并將特征映射后的目標(biāo)域數(shù)據(jù)帶入模型,得到負(fù)荷參數(shù)預(yù)測值。
圖1 半監(jiān)督域適應(yīng)模糊推理方法 Fig.1 Semi-supervised domain adaptive fuzzy inference
為了驗(yàn)證本文所提出的半監(jiān)督域適應(yīng)模糊推理方法的有效性,進(jìn)行了兩組仿真實(shí)驗(yàn):第一組仿真實(shí)驗(yàn)證明工況改變時(shí),傳統(tǒng)的軟測量方法不能取得可靠結(jié)果;第二組實(shí)驗(yàn)引入遷移學(xué)習(xí)策略,分別將本文所提算法與流形正則化域適應(yīng)、半監(jiān)督-偏最小二乘進(jìn)行對比,LX驗(yàn)證算法的有效性。本文所選用的評價(jià)指標(biāo)為均方根誤差(RMSE).
通過改變介質(zhì)充填率(ball charge volume ratio,BCVR)的方式模擬工況突變。數(shù)據(jù)采集裝置為D602 mm×715 mm小型實(shí)驗(yàn)室球磨機(jī)。利用多通道數(shù)據(jù)采集裝置,獲取5組固定BCVR的小型實(shí)驗(yàn)室球磨機(jī)振動信號。為保證負(fù)荷參數(shù)的高分辨率,每組都做了充分的實(shí)驗(yàn),并對實(shí)驗(yàn)進(jìn)行振動信號現(xiàn)場同步采集。每組實(shí)驗(yàn)通過添加物料量改變料球比、濃度、充填率。濕式球磨機(jī)實(shí)驗(yàn)實(shí)施方案如表1所示。
表1 工況突變實(shí)驗(yàn)情況Table 1 Experimental condition of sudden change
將每組源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的振動信號平均分為20個樣本,每個樣本覆蓋長度大于濕式球磨機(jī)旋轉(zhuǎn)一周所用時(shí)間,然后將難以建模的時(shí)域信號通過快速傅里葉變換轉(zhuǎn)換為頻域信號。
以介質(zhì)充填率變化的5種工況為例,每個工況下隨機(jī)選取500個振動信號的樣本,通過鄰域保持嵌入(neighborhood preserving embedding,NPE)方法將高維頻譜特征降維至三維空間進(jìn)行可視化。圖2給出了5種工況下三維空間的數(shù)據(jù)分布情況。
圖2 不同工況數(shù)據(jù)降維后的分布情況 Fig.2 Distribution of different working conditions data after dimensionality reduction
從圖2中可以看出不同工況下,數(shù)據(jù)分布存在差異性。
實(shí)驗(yàn)一:傳統(tǒng)軟測量方法通常分為兩步,即特征提取與回歸模型建立。常見的特征提取有主成分分析(principal component analysis,PCA)、深度信念網(wǎng)絡(luò)(deep belief network,DBN)等。常見的建模方法有偏最小二乘回歸(partial least squares,PLS)、核模糊回歸以及極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)等算法。
本文采用傳統(tǒng)方法PCA提取特征,其原因?yàn)镻CA是一種多變量的統(tǒng)計(jì)學(xué)方法且對過程噪音和數(shù)據(jù)缺失具有一定的魯棒性?;貧w模型采用模糊推理方法,其規(guī)則數(shù)為5。不同工況負(fù)荷參數(shù)預(yù)測的RMSE如表2所示。表中“1→2”表示工況1為訓(xùn)練數(shù)據(jù),工況2的數(shù)據(jù)為測試數(shù)據(jù),其他記號同理。
表2 模糊推理方法負(fù)荷參數(shù)預(yù)測結(jié)果Table 2 Fuzzy inference method for load parameters prediction
根據(jù)表2可知,工況發(fā)生改變后,模型負(fù)荷參數(shù)預(yù)測的精度就會逐漸降低,泛化性能差。其原因?yàn)楣r改變后,不同工況數(shù)據(jù)分布的差異造成模型的失配。
實(shí)驗(yàn)二:當(dāng)工況發(fā)生改變后,傳統(tǒng)軟測量方法不再適應(yīng),為此引入遷移學(xué)習(xí)策略中的特征映射方法。對比實(shí)驗(yàn)中,流形正則化域適應(yīng)采用文獻(xiàn)[11]中的方案。半監(jiān)督-偏最小二乘表示采用半監(jiān)督域適應(yīng)將源域和目標(biāo)域數(shù)據(jù)映射到公共子空間,利用偏最小二乘法建立回歸模型。半監(jiān)督域適應(yīng)模糊推理建模方法如2節(jié)所述,其規(guī)則數(shù)為5.表中“1→2”表示工況1遷移到工況2,即工況1為源域數(shù)據(jù),工況2的數(shù)據(jù)為目標(biāo)域數(shù)據(jù),其他記號同理。不同遷移學(xué)習(xí)方法的RMSE如表3所示。
表3 不同遷移學(xué)習(xí)方法預(yù)測結(jié)果Table 3 Prediction results of different transfer learning methods
對比表2與表3可知,通過采用遷移學(xué)習(xí)策略,負(fù)荷參數(shù)預(yù)測精度明顯提高。相對于傳統(tǒng)方法,遷移學(xué)習(xí)方法在建模的過程中,挖掘更多與球磨機(jī)負(fù)荷參數(shù)相關(guān)的特定領(lǐng)域信息,使預(yù)測結(jié)果與真實(shí)值更加接近,誤差減小,模型的泛化性能及預(yù)測精度有所提高。根據(jù)表3中的結(jié)果,可以看出:
1) 將希爾伯特-施密特獨(dú)立標(biāo)準(zhǔn)引入特征映射過程中對于模型預(yù)測精度的提高有一定的作用。
2) 對比半監(jiān)督-偏最小二乘建模結(jié)果與半監(jiān)督域適應(yīng)模糊推理方法,后者預(yù)測精度相對較高。其原因?yàn)槟:评硎且环N能容忍參數(shù)不確定性的非線性建模方法。
圖3 負(fù)荷參數(shù)預(yù)測結(jié)果 Fig.3 Prediction results of load parameters
為直觀了解參數(shù)預(yù)測情況,以工況1的數(shù)據(jù)作為源域數(shù)據(jù),工況2的數(shù)據(jù)作為目標(biāo)域數(shù)據(jù),繪制了圖3。圖中模糊推理為實(shí)驗(yàn)一中傳統(tǒng)方法的預(yù)測結(jié)果。
由圖3可知,半監(jiān)督域適應(yīng)模糊推理方法較好地跟蹤了真實(shí)值的變化,這充分說明該方法對于預(yù)測球磨機(jī)負(fù)荷參數(shù)的有效性。
本文研究了一種基于半監(jiān)督域適應(yīng)模糊推理的球磨機(jī)負(fù)荷參數(shù)軟測量方法。與其他軟測量方法相比,該方法的優(yōu)點(diǎn)在于:
1) 當(dāng)工況發(fā)生改變后,可以充分利用歷史工況數(shù)據(jù),降低數(shù)據(jù)采集成本。
2) 可以有效避免傳統(tǒng)建模方法因數(shù)據(jù)分布差異而造成的模型失配問題。
3) 采用模糊推理建模過程簡單,具有良好的預(yù)測性能,易于在實(shí)際應(yīng)用中實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,引入半監(jiān)督域適應(yīng)模糊推理方法可以實(shí)現(xiàn)磨機(jī)負(fù)荷參數(shù)的較高精度預(yù)測。這種建模方法及思想對其他領(lǐng)域的參數(shù)預(yù)測有一定的參考價(jià)值。