劉冠華,肖 威,韓林潔
(1.北京機械工業(yè)自動化研究所,北京 100120;2.北京機械工業(yè)自動化研究所有限公司,北京 100120)
就收卷機張力控制系統(tǒng)而言,其模型的多耦合和不確定性與現(xiàn)場工作環(huán)境的擾動都降低了收卷機的張力控制精度?;诖?,本文提出了一種使用基于徑向基函數(shù)(RBF)系統(tǒng)辨識與PID控制算法相結(jié)合的智能控制器,即利用神經(jīng)網(wǎng)絡對任意非線性模型的逼近能力,將其辨識模型用于PID參數(shù)的整定,以此來提升其常規(guī)張力控制系統(tǒng)的自適應性,并在一定范圍內(nèi)使其具有自學習能力,而后通過實驗來驗證該控制策略的魯棒性和優(yōu)越性。
傳統(tǒng)PID控制系統(tǒng)結(jié)構(gòu)如圖1所示。其中r(t)為系統(tǒng)期望輸出值,y(t)為系統(tǒng)實際輸出值,e(t)為偏差值作為PID控制系統(tǒng)的輸入量即e(t)=r(t)-y(t)。u(t)是PID控制系統(tǒng)的輸出量。
圖1 傳統(tǒng)PID控制系統(tǒng)結(jié)構(gòu)圖
常規(guī)PID控制系統(tǒng)實質(zhì)是將輸入量分別進行比例(P)、積分(I)、微分(D)運算并將運算結(jié)果進行線性組合求得出輸出量u(t)。u(t)的表達式如式(1)所示。
式中控制系統(tǒng)的輸入為e(t),控制系統(tǒng)的比例系數(shù)為Kp。控制系統(tǒng)的積分時間常數(shù)為Ti,控制系統(tǒng)的微分時間常數(shù)為Td。
設系統(tǒng)采樣周期為T,用k個采樣時刻點的總時間kT代表連續(xù)時間,將積分以累加形式表示,微分以增量形式代替,對式(1)進行離散化即:
根據(jù)式(2)計算u(k-1),并令Δu(K)=u(k)-u(k-1)可得:
式(3)即為增量式PID算法表達式,適用于自身帶有積分記憶元件的被控對象,該控制算法的第k次輸出值Δu(k)只與于控制系統(tǒng)第k、k-1、k-2次的輸入信號有關(guān),并對其分別進行了加權(quán),這有利于降低處理器計算負擔且不易出現(xiàn)積分飽和現(xiàn)象,只在需要時進行輸出限幅[1]。
徑向基函數(shù)(RBF-Radial Basis Function)神經(jīng)網(wǎng)絡是J.Moody在80年代末提出的一種神經(jīng)網(wǎng)絡[2],是以函數(shù)逼近理論為依據(jù)的一種全連接單隱層的三層前向神經(jīng)網(wǎng)絡(FFNN)[3],它包括一個輸入層,一個隱含層和一個輸出層。目前認為其可以逼近任意連續(xù)函數(shù)[2]。
RBF神經(jīng)網(wǎng)絡的激活函數(shù)為高斯(Gaussian)核函數(shù),高斯核函數(shù)在局部范圍內(nèi)為非零值,因此RBF神經(jīng)網(wǎng)絡為局部逼近的神經(jīng)網(wǎng)絡[4]。RBF神經(jīng)網(wǎng)絡的學習速度相對較高,可以滿足實時控制。且其對于訓練樣本的依賴性和要求不高,現(xiàn)代工業(yè)控制通常采用RBF網(wǎng)絡與其他常規(guī)控制算法相結(jié)合,此類控制系統(tǒng)通常具有相當?shù)木?、自適應性和魯棒性[5]。
當前許多領(lǐng)域都是以數(shù)學模型為依據(jù)來確定最終的控制決策,這可以有效保證控制決策的科學可靠[6]。但收卷機張力控制系統(tǒng)統(tǒng)較為復雜,難以經(jīng)過理論分析獲得數(shù)學模型,因此采用RBF神經(jīng)網(wǎng)絡辨識系統(tǒng)利用現(xiàn)場實驗來獲取數(shù)學模型以及估計參數(shù),為相關(guān)實驗提供理論支撐[7]。
RBF辨識網(wǎng)絡在運算時是按照前向或反向傳播過程組織的,下面將對這兩種過程進行敘述。
1)前向傳播過程。
設RBF神經(jīng)網(wǎng)絡的系統(tǒng)辨識結(jié)構(gòu)設計n-m-1網(wǎng)絡結(jié)構(gòu),激活函數(shù)選擇高斯函數(shù),設輸入層有n個節(jié)點,即其中輸入為:
hj為隱含層m個節(jié)點中第j個神經(jīng)元的輸出,表達式為:
cj=cj1,cj2,cj3,…,cjn,cj為第j個節(jié)點的中心向量。
b=[b1,b2,b3,…,bm]T,bj為第j個節(jié)點的基寬參數(shù)且為大于0的數(shù)值。
w=[w1,w2,w3,…,wm]T,w為網(wǎng)絡的權(quán)值。
RBF神經(jīng)網(wǎng)絡前向傳播的輸出為:ym(k)=w1h1+,w2h2+…+wmhm。
2)反向傳播過程
梯度下降法具有形式簡單、初始效率較高[8]、局部尋優(yōu)效果良好等優(yōu)點[9],因此采用梯度下降法作為訓練算法。
設RBF神經(jīng)網(wǎng)絡辨識系統(tǒng)的輸出誤差為e(t),表達式為e(t)=y(t)-ym(t)。其中y(t)為系統(tǒng)實際輸出,ym(t)則為辨識模型實際輸出。同時取辨識誤差指標為E(t),表達式為式(4)。
1)權(quán)值大小按照式(5)進行調(diào)節(jié):
2)隱藏層節(jié)點基寬參數(shù)按照式(6)進行調(diào)節(jié):
3)隱藏層中心向量按照式(7)進行調(diào)節(jié):
Jacobian信息是反映了RBF網(wǎng)絡辨識所得對象的輸出對輸入的敏感度,其辨識算法如式(8)所示。
基于RBF系統(tǒng)辨識的自適應PID控制器的原理是使用基于RBF神經(jīng)網(wǎng)絡的辨識系統(tǒng)對收卷機張力控制系統(tǒng)進行在線辨識,然后根據(jù)得到的辨識系統(tǒng)對增量式PID參數(shù)進行在線整定。
本文中辨識系統(tǒng)的輸入量為系統(tǒng)偏差、張力控制系統(tǒng)輸入量以及張力控制系統(tǒng)輸出量。在運行過程中辨識系統(tǒng)對張力控制系統(tǒng)進行學習和逼近,使用辨識系統(tǒng)的Jacobian信息來實現(xiàn)對PID參數(shù)的整定。RBF神經(jīng)網(wǎng)絡自適應PID控制的結(jié)構(gòu)如圖2所示。
圖2 基于RBF系統(tǒng)辨識的自適應PID控制結(jié)構(gòu)圖
圖2中增量式PID算法中增量表達式為式(9),控制率為式(10)。
其中Kp、Ki、Kd為PID可調(diào)參數(shù),且:
性能指標函數(shù)為式(11)所示。
使用梯度下降法對PID參數(shù)進行調(diào)整,下述三式即為其參數(shù)變化量的計算方法。其中ηc為學習率。
PID參數(shù)的更新算法為:
由于辨識模型的未知性,因此需做近似處理[10],取RBF網(wǎng)絡的第一個輸出x1為uk即x1=uk則:
假設欲辨識的非線性系統(tǒng)結(jié)構(gòu)參數(shù)已知,則基于RBF神經(jīng)網(wǎng)絡的自適應PID控制器結(jié)構(gòu)如圖4所示,則其運行步驟如下:
1)確認RBF神經(jīng)網(wǎng)絡結(jié)構(gòu)為n-m-1,其中輸入?yún)?shù)數(shù)量為n,隱含層節(jié)點數(shù)為m,并確認中心向量、基寬向量、權(quán)值向量、學習速率、動量因子初始值。設置PID算法的參數(shù)初始值Kp(0)、Ki(0)、Kd(0),以及學習率ηc。
2)接收輸入向量,使用式(9)、式(10)計算被控系統(tǒng)輸入u(t),計算辨識系統(tǒng)輸出ym(t),采樣系統(tǒng)實際輸出y(t),利用式(4)計算辨識模型取辨識誤差指標為E(t)。
3)將得到誤差指標E(t)值,聯(lián)立式(5)、式(6)、式(7)計算網(wǎng)絡參數(shù)中心向量、基寬向量、權(quán)值向量的更新量。
4)使用y(t)、r(t)計算性能參Ec(k),聯(lián)立式(13)計算Jacobian信息,使用式(12)計算PID參數(shù)更新量。
5)使用得到的的更新量更新辨識系統(tǒng)以及增量PID控制系統(tǒng)參數(shù)。
6)將ec(t)與設定的偏差值對比,判斷結(jié)束程序或返回步驟2)繼續(xù)(t+1)次運行。
基于RBF辨識系統(tǒng)的自適應PID控制算法屬于智能PID算法,而現(xiàn)階段張力控制系統(tǒng)常用的張力控制策略依舊是常規(guī)PID控制,下面將通過仿真進行兩者性能對比。
結(jié)合收卷機張力控制系統(tǒng)的常用模型對傳遞函數(shù)為式(14)的被控系統(tǒng)進行控制。其中兩者初始參數(shù)由實驗得到,而智能PID控制器的辨識系統(tǒng)使用3-6-1結(jié)構(gòu),辨識系統(tǒng)學習率為0.5,PID參數(shù)學習率ηc使用動態(tài)學習率,以此避免后期系統(tǒng)震蕩,且初始值設為0.1,動量因子為0.01。
對智能PID控制器與常規(guī)PID控制器分別輸入一個階躍信號,并在50秒時再對兩者分別給與一個干擾信號,使用MATLAB進行仿真,結(jié)果對比如圖3所示。
圖3 智能PID控制器與常規(guī)PID控制器仿真曲線
根據(jù)仿真結(jié)果可知,智能PID控制器響應曲線的超調(diào)量較小,回穩(wěn)較快,較常規(guī)PID控制器有著更強的適應性和魯棒性。在穩(wěn)定狀態(tài)受到干擾時,智能PID控制器的波動幅度較小,調(diào)整較快,即智能PID控制器在性能上優(yōu)于常規(guī)PID控制器。
繼續(xù)使用上文的非線性被控系統(tǒng),并使用智能PID控制系統(tǒng)和常規(guī)PID控制器分別進行控制。被跟蹤信號表達式如式(15)所示。RBF神經(jīng)網(wǎng)絡選取3-8-1結(jié)構(gòu)。跟蹤結(jié)果如圖4所示。
圖4 智能PID控制器與常規(guī)PID控制器仿真曲線(2)
由圖4可知,智能PID控制器的跟蹤能力不管在調(diào)整速度還是跟蹤精度方面均優(yōu)于常規(guī)PID控制器。在調(diào)整過程中幾乎無超調(diào),具有良好的控制精度和效率,而且隨著仿真的持續(xù)進行其正在不斷接近被跟蹤系統(tǒng)。而圖5則更明顯的反映了智能PID控制器的自學習和自調(diào)整能力,隨著仿真時間的增加被控系統(tǒng)的輸出正在明顯逼近被跟蹤信號,兩者之間的誤差越來越小,甚至幾乎重合。
圖5 智能PID控制器的自學習曲線
根據(jù)仿真結(jié)果,可以明顯看出智能PID控制器在響應、調(diào)整性能和跟蹤性能兩方面均優(yōu)于常規(guī)PID控制器,且具有一定的自學習能力。
現(xiàn)場測試在本單位已經(jīng)進場施工的某市6.6mBOPA同步拉伸生產(chǎn)線進行,試驗平臺采用北自所自研6.6m高速雙工位翻轉(zhuǎn)式收卷機,使用常規(guī)PID控制與智能PID控制分別對量產(chǎn)合格薄膜進行三次完整收卷,其中收卷機實時張力標準值使用錐度張力函數(shù)計算。收卷機張力控制系統(tǒng)工作過程如圖6所示,其中收卷電機使用轉(zhuǎn)矩模式。
圖6 收卷機張力控制器內(nèi)部結(jié)構(gòu)圖
張力傳感器最終測得的張力隨卷徑變化結(jié)果如圖7所示,可以看出智能PID控制張力與標準值偏差較小,且隨著收卷持續(xù)進行,張力偏差不斷減小,說明具有相較于常規(guī)PID收卷其具有較強自適應性和一定的自學習能力。
圖7 收卷張力曲線對比
本文簡要介紹了常規(guī)PID控制與RBF神經(jīng)網(wǎng)絡,并將基于RBF的辨識系統(tǒng)與PID控制相結(jié)合設計了智能PID系統(tǒng),通過試驗和仿真證明了該系統(tǒng)較于傳統(tǒng)PID控制在收卷機張力控制方面具有良好的自適應和自學習能力。在一定范圍內(nèi)提高了生產(chǎn)質(zhì)量。