呂寧 姜懷斌
摘?要:在啤酒發(fā)酵過程中,為了建立精準的傳感器溫度故障診斷模型,在標準支持向量機(SVM)的基礎上提出了分段最小二乘支持向量機的方法,該方法首先利用模糊C聚類(FCM)對樣本進行聚類分析,達到劃分發(fā)酵階段和建立局部模型的目的,然后采用最小二乘支持向量機(LS-SVM)的方法對各類樣本進行建模。實驗結果表明,使用該方法建立的啤酒發(fā)酵過程溫度故障診斷模型具有較高的準確性。經(jīng)過比較,該方法建立的模型的泛化能力要強于其他SVM方法建立的模型。
關鍵詞:支持向量機;模糊C均值聚類;最小二乘支持向量機;啤酒發(fā)酵;建模
DOI:10.15938/j.jhust.2018.06.017
中圖分類號: TP206.3
文獻標志碼: A
文章編號: 1007-2683(2018)06-0094-06
Abstract:In the process of beer fermentation?in order to establish the precise temperature sensor fault diagnosis model?on the basis of standard support vector machineSVM)?We proposed piecewise least square support vector machine method?first using fuzzy c-means clusteringFCM) of the sample of poly class analysis to divide fermentation stage and the establishment of local model.?Then the least square support vector machineLS-SVM) method is used for modeling of various types of samples.?The experimental results show that the model has a high accuracy in the process of temperature fault diagnosis of beer fermentation process.?After comparison?the proposed method establishes the model's generalization ability better than other SVM methods to build the model.
Keywords:support vector machine;fuzzy C mean clustering;least squares support vector machine; beer fermentation;modeling
0?引?言
對于間歇過程,多操作階段是其一個固有特性,過程中的非線性與過程的各階段往往是密不可分的。這就導致了一個問題,我們通過對過程整體的運行狀況進行建模分析,不能夠準確的進行判斷運行情況,由于過程分為多個階段,每一個階段,它的主導變量與過程特征都會不同,由于操作過程的變化,過程之間一些變量的相互關系也無法判斷是否隨時間不斷變化,它呈現(xiàn)一定的分階段性。所以,對于它的統(tǒng)計建模與在線監(jiān)控,我們要整體進行建模分析還要對每一階段進行細致分析[1-3]。
啤酒發(fā)酵過程一般分為四個階段:主酵階段,后酵階段、還原階段、貯酒階段,每一個階段對溫度控制的要求都很嚴格,直接關系到啤酒發(fā)酵的質量。想要建立局部模型,我們就需要對發(fā)酵階段進行劃分,由于過程的階段性密不可分,直接進行階段劃分,難度很大,聚類分析是將數(shù)據(jù)進行分類,將相似性大的數(shù)據(jù)歸為一類,而類別之間數(shù)據(jù)的差異較大,這一特性滿足啤酒發(fā)酵過程階段劃分的要求,所以本文通過對樣本數(shù)據(jù)進行聚類分析,將發(fā)酵過程劃分為幾個不同的階段。聚類分析分為兩種,硬聚類、模糊聚類,由于硬聚類直接將各類別的隸屬度規(guī)定為0跟1兩個值,這就使得樣本與樣本之間的關系被割裂,因此,這種方法不能得到理想的聚類結果,Ruspini將Zadeh模糊數(shù)學理論引入聚類分析,提出模糊劃分的概念,模糊聚類表現(xiàn)了樣本與樣本之間的聯(lián)系,建立了數(shù)據(jù)樣本對類別的不確定性描述,可對類別間有交叉的數(shù)據(jù)集進行有效的聚類[4-7]。
由于間歇過程自身復雜的特點,人們對該過程的監(jiān)測進行了長期的研究,主成分回歸(PCR),主成分分析(PCA) ,支持向量機(SVM),偏最小二乘(PLS)和獨立分量分析(ICA)等一系列多元統(tǒng)計分析建模方法已經(jīng)成為間歇過程和連續(xù)化工過程的常用的建模與監(jiān)測方法,并且取得了很多成功的案例。支持向量機(Support Vector Machine,SVM)方法是Vapnik等提出的,采用結構風險最小化原則代替經(jīng)驗風險最小化原則,對小樣本、非線性、高維數(shù)、局部極小等問題給了很好的處理方法,泛化能力很強。SVM方法也為發(fā)酵過程故障診斷提供了一個嶄新的途徑[8-10]。
大量的矩陣運算是SVM學習過程的一個特點,這也導致了一個問題,訓練速度緩慢且訓練時間長,這勢必會使SVM泛化能力受到影響,針對此種情況,基于本文研究的實際情況,在這里采用最小二乘支持向量機(LS-SVM),它將SVM中的二次規(guī)劃問題轉換成求解線性方程的問題,這樣使得計算復雜度降低,計算速度也加快[11]。
本文提出將FCM聚類和LS-SVM相結合的建模方法。該方法首先利用FCM對樣本進行聚類分段,然后對各段樣本建立LS-SVM模型。在MATLAB2009Ra軟件中,使用現(xiàn)場數(shù)據(jù)建立了啤酒發(fā)酵過程的分段故障診斷模型,經(jīng)過與其他SVM建模方法比較,此方法建立的模型具有較高的泛化能力[12]。
1?模糊C均值聚類算法
啤酒的釀制,就是控制各種參數(shù)使其達到某種發(fā)酵的效果,發(fā)酵的過程被劃分為很多階段,在每個階段一些生物量的值都有不同的變化,所以可以根據(jù)生物量的不同變化來劃分發(fā)酵的階段,但這種劃分由于每次試驗的相同階段過程會隨時間發(fā)生變化而顯得極其復雜,而且同一試驗的相鄰階段之間也沒有明確劃分原理,這就要求試驗人員有扎實的實驗基礎,否則劃分不精確會對建模精度產(chǎn)生極大影響。聚類分析的方法在上述劃分的問題上有其獨特的優(yōu)勢,它能使相同階段中的對象顯示出最大的相似度,而使不同階段中的對象顯示出最大的差異性,從而能完全顯示出不同階段的數(shù)據(jù)分布特性,利用聚類算法的原理去分析啤酒發(fā)酵的過程,提取發(fā)酵過程中每個階段的數(shù)據(jù)信息,完全能夠實現(xiàn)發(fā)酵階段的自動劃分[13-15]。
FCM算法首先由Dunn提出,經(jīng)過Bezdek等完善和推廣,其用于發(fā)酵過程數(shù)據(jù)分類的基本思想是,根據(jù)發(fā)酵過程數(shù)據(jù)與C個聚類中心間的加權相似性測度,對目標函數(shù)進行迭代最小化,以確定其最佳的類別。其目標函數(shù)如下:
3?基于FCM和LS-SVM的建模方法
基于FCM和LS-SVM的建模過程可以劃分成兩個過程進行分析,結構如圖1所示。階段一,F(xiàn)CM把整個輸入樣本空間劃分為若干個互相分離的區(qū)域,區(qū)域數(shù)量根據(jù)具體研究對象決定,每個獨立的階段擁有不同特征。階段二,對不同階段應用相異的LS-SVM進行建模。上述方法與全局LS-SVM模型方法有很大差異。全局LS-SVM模型雖然也是在整個研究樣本空間中操作,但是能在每個階段都能得到充分訓練還不能保證,該過程的操作步驟為:
1)將采集的訓練樣本進行[0,1]歸一化處理,目的是避免各種不同特征數(shù)據(jù)之間的數(shù)量級相差太大以至于造成誤差;
2)將樣本數(shù)據(jù)輸入到FCM聚類算法中,輸出為每個樣本對每個階段的隸屬度的值,將樣本數(shù)據(jù)劃分為幾類;
3)基于第2步中已按照階段劃分的幾類訓練樣本,分別采用LS-SVM對模型進行訓練,分別得到每個階段的估計函數(shù)f(x),模型訓練結束;
4)將訓練結果應用于LS-SVM模型中,根據(jù)整個過程階段的劃分原則,將不同階段的測試數(shù)據(jù)輸
入,得到預測樣本的輸出量;
5)模型的泛化能力使用測試樣本進行測試。
建立LS-SVM分類器模型,在分類問題上,支持向量機通常只考慮兩類,yi=1表示該樣本屬于一類,yi=-1表示該樣本屬于第二類,處理多類分類問題時,需要將多類分類問題轉換為兩類分類問題,本文采用“一對多”方法,該方法用一個LS-SVM分類器將每一類與剩下的所有類別作區(qū)分,因此需建立的LS-SVM分類器與故障類型的數(shù)目相一致[19~22]。
4?啤酒溫度故障診斷仿真實驗
啤酒發(fā)酵是一個對溫度控制相當嚴格的過程,對于溫度傳感器的準確性有較高的要求,啤酒發(fā)酵溫度控制采用PID控制,準確的溫度狀態(tài)反饋將直接影響到PID控制的運行,所以能夠及時的檢測出溫度傳感器的故障,并且迅速的確定問題的原因就顯得尤為重要,溫度傳感器通常有如表1常見的故障現(xiàn)象。
使用基于FCM和LS-SVM的方法,建立啤酒發(fā)酵過程溫度故障診斷模型。采用5批生產(chǎn)數(shù)據(jù),每一小時采樣一次數(shù)據(jù),每一批次共360個溫度數(shù)據(jù),代表一個完整的發(fā)酵過程,數(shù)據(jù)被分成兩部分:4批次數(shù)據(jù)用于建立模型,1批數(shù)據(jù)用于測試,故障數(shù)據(jù)為實驗過程中曾出現(xiàn)的數(shù)據(jù),建模中采用RBF核函數(shù),RBF核函數(shù)即K(x,y)=exp[-‖x-y‖2/2σ2],能夠更好地反映發(fā)酵過程的非線性特點。
啤酒發(fā)酵過程一般分為四個階段:主酵階段,后酵階段、還原階段、貯酒階段,所以根據(jù)實際情況,使用FCM將整個樣本空間劃分為四個區(qū)域,如圖2,由圖可以看出,0h~140h為主酵階段,140h~270h為后酵階段,270h~310h為還原階段,310h~360h為貯酒階段。
實驗仿真采用Matlab2009Ra軟件,F(xiàn)CM的參數(shù)為:聚類數(shù)目C=4,加權指數(shù)m=2,迭代終止參數(shù)ε=0.001,對大迭代次數(shù)t=100。經(jīng)過多次實驗,對LS-SVM模型,主酵階段的參數(shù)選擇為σ=211和C=4500,后酵階段的參數(shù)選擇為σ=124和C=3200,還原階段的參數(shù)選擇為σ=148和C=5500,貯酒階段的參數(shù)選擇為σ=34和C=5000。鑒于故障類型,每一個階段需要構建2個分類器,每一個故障對應一個分類器,故障數(shù)據(jù)逐一輸入到2個分類器中,直到將故障數(shù)據(jù)正確分類。
圖3和圖4是按表1的故障類型采用LS-SVM對故障的分類,其中標簽號1代表故障屬于該類別,-1代表故障不屬于該類別,橫坐標為采樣點數(shù),縱坐標為故障標號。
圖3為在主酵階段(階段一)人為引進故障,在0~100h引入故障二,圖a表示全局LS-SVM對故障的診斷,圖b為分段LS-SVM對故障的診斷。
圖4為在后酵階段(階段二)人為引進故障,在140~220h引入故障一,圖c表示全局LS-SVM對故障的診斷,圖d為分段LS-SVM對故障的診斷。
由圖3、圖4可以看出,全局LS-SVM對于發(fā)酵過程的故障診斷,存在比較嚴重的誤報與漏報現(xiàn)象,對發(fā)酵過程進行分段,針對每一段進行故障診斷,大大提高了診斷的準確率。
表2為以故障一為故障數(shù)據(jù),得出的診斷結果時間,從中可以得出結論,對發(fā)酵過程分段處理,使得模型的運算復雜度降低,診斷的速度也得到了提高。
5?結?論
本文首先闡述了啤酒發(fā)酵過程的階段性,指出對其分段處理的必要性,之后對每個階段進行建模處理,聚類算法FCM因其有更獨特的優(yōu)勢而被采用;在此基礎上,又詳細闡述對啤酒發(fā)酵每階段的建模過程和方法,應用FCM和LS-SVM相結合的方式,利用在現(xiàn)場采集到的數(shù)據(jù),建立了整個啤酒發(fā)酵過程的模型,通過這個模型對出現(xiàn)的故障進行診斷處理,該模型保證了診斷結果的準確性,與全局建模方式比較,具有更強的泛化能力,此方法建立的故障診斷模型,對故障的診斷與分類更加準確,進而可以根據(jù)故障診斷的結構精準迅速的去斷定故障原因,加以排除。
參 考 文 獻:
[1]?張旭.?青霉素間歇過程故障診斷方法研究[D].沈陽:沈陽理工大學,2012.
[2]?熊偉麗,王肖,陳敏芳,徐保國.?基于加權LS-SVM的青霉素發(fā)酵過程建模[J]. 化工學報,2012(9):2913-2919.
[3]?CHIANG L H,RUSSELL F L,BRAATZ R D.Fault detection and diagnosis in industrial systems[J].Springer,2001(9):317-335.
[4]?L.in C T,Juang C F,LiCP.Temperature Control with a Neural Fuzzy Inference Network [J].IEEE Trans.Stst.Man,Cybern.1999,C(29):440-451.
[5]?劉樹啟,徐光憲,劉建輝.啤酒發(fā)酵過程監(jiān)控系統(tǒng)研究[J],遼寧工程技術大學學報,2002,21(2):224-226.
[6]?陽同光,桂衛(wèi)華.基于 KPCA 與 RVM 感應電機故障診斷研究[J].電機與控制學報,2016,20(9):89-95.
[7]?張志艷,馬宏忠,楊存祥,等.?小波包與樣本熵相融合的PMSM失磁故障診斷[J].電機與控制學報,2015,19(02):26-32.
[8]?VAAG P.et al.Charaeterization of a Beer Foam Protein Originating From Barley[J].EBC Congress,1999,25:157-166.
[9]?楊奎河,單甘霖,趙玲玲.基于最小二乘支持向量機的故障診斷方法[J].計算機應用研究,2007(7):99-101.
[10]邊莉,邊晨源.?采用交叉熵支持向量機和模糊積分的電網(wǎng)故障診斷[J].電機與控制學報,2016,20(2):112-120.
[11]MARCU T?KOPPEN-SELIGER B?STUCHER R.?Design of Fault Detection for a Hydraulic Looper Using Dynamic Neural Networks[M]. 16.OXFORD?2008,192-213.
[12]VAAG P.et al.Charaeterization of a Beer Foam Protein Originating From Barley[J].EBC Congress,1999,25:157-166.
[13]蔡艷寧,胡昌華,汪洪橋,等.基于自適應動態(tài)無偏 LSSVM 的故障在線監(jiān)測[J].機電工程,2013(1):56-57.
[14]高學金,王普,孫崇正,易建強,張亞庭,張會清.?分階段建立發(fā)酵過程模型的方法的研究和應用[J]. 系統(tǒng)仿真學報,2007,11:2574-2577.
[15]楊小梅,劉文琦,楊俊.?基于分階段的LSSVM發(fā)酵過程建模[J]. 化工學報,2013,09:3262-3269.
[16]EL-TAWEEL Gh S,HELMY A K.An Edge Detection Scheme Based on Least Squares Support Vector Machine in a Contourlet HMT Domain[J].Applied Soft Computing Journal,2014,32(6):211-223.
[17]王強,陳歡歡,王珽.一種基于多類支持向量機的故障診斷算法[J].電機與控制學報,2009,02:302-306.
[18]張繼軍,馬登武,鄧力,范庚. LS-SVM參數(shù)估計與稀疏化方法研究及應用[J]. 系統(tǒng)仿真學報,2014,05:1113-1117.
[19]HIROFUMI Osada,HIDEKI Tanemura.Strong Markov Property of Determinantal Processes with Extended Kernels[J].Stochastic Processes and their Applications,2016,41:686-702.
[20]公彥杰.?基于LS-SVM建立發(fā)酵過程動態(tài)模型的研究及軟件實現(xiàn)[D].北京工業(yè)大學,2010.
[21]劉斌,蘇宏業(yè),王強.一種基于最小二乘支持向量機的預測控制算法[J].控制與決策,2010(8):173-177.
[22]武俊峰,艾嶺.一種基于改進聚類算法的模糊識別辨識[J].哈爾濱理工大學學報,2010(3):1-5.
(編輯:王?萍)