宋春寧,寧正高
(廣西大學(xué)電氣工程學(xué)院,廣西南寧 530004)
單液流鋅鎳電池為典型的強非線性系統(tǒng),在充電控制中,充電電流是最為重要的參數(shù)之一。在充電過程中,如果充電設(shè)備抗干擾能力與跟蹤性能不理想,可能會引起電池充電不穩(wěn)定,同時降低充電效率,給電池造成損害,甚至爆炸。
近年來,有關(guān)單液流鋅鎳電池充電控制的研究成果不多。對電池在充電電流控制方面的研究,仍然需要從其他更成熟的電池充電控制方法研究成果中學(xué)習(xí)與借鑒。采用比例積分微分(PID)算法,設(shè)計電流控制器對電池進行電流控制,是較常用的方法,但PID控制存在難以處理復(fù)雜非線性系統(tǒng)、超調(diào)量較大和調(diào)節(jié)時間長等缺點[1]。王君瑞等[2]設(shè)計的基于脈沖寬度調(diào)制(PWM)整流器和雙向直流(DC)-DC變換器的車輛到電網(wǎng)(V2G)充放電拓撲,可控制電網(wǎng)側(cè)與電池之間的能量流動;采用傳統(tǒng)比例積分(PI)控制,實現(xiàn)電池的間歇式恒流充電仿真。研究發(fā)現(xiàn),在負載擾動的情況下,系統(tǒng)能快速達到穩(wěn)定狀態(tài)。
自適應(yīng)動態(tài)規(guī)劃(ADP)是一種能夠使動態(tài)規(guī)劃的“維數(shù)災(zāi)難”得到有效解決的近似最優(yōu)控制算法[3]。執(zhí)行依賴啟發(fā)式動態(tài)規(guī)劃(ADHDP)是一種ADP算法,通過逐次迭代逼近最優(yōu)控制解,不需要求解系統(tǒng)的復(fù)雜方程,是一種能較好解決非線性系統(tǒng)控制問題的優(yōu)化算法[4]。X.P.Wang等[5]將具有在線學(xué)習(xí)能力的ADHDP用于控制超導(dǎo)儲能(SMES)裝置,吸收或釋放有功功率和無功功率,并在MATLAB/SIMULINK中與PI控制器進行仿真比較,證明ADHDP控制器在三相故障和風(fēng)電波動引起的電力系統(tǒng)振蕩方面具有較好的阻尼性能,可提高電力系統(tǒng)的穩(wěn)定性。李相俊等[6]使用ADHDP方法,通過儲能系統(tǒng)對風(fēng)電輸出的不穩(wěn)定功率進行調(diào)節(jié),從而滿足風(fēng)電并網(wǎng)要求,且控制電池荷電狀態(tài)(SOC)保持在適宜的范圍內(nèi),實現(xiàn)電池儲能系統(tǒng)合理充放電的功能,在與斜率控制方法比較后,驗證了ADHDP控制方法的有效性和可行性。
為對單液流鋅鎳電池的充電電流進行跟蹤優(yōu)化,增強抗干擾能力,提高系統(tǒng)穩(wěn)定性,減少跟蹤誤差、能量損耗,并提高充電效率,本文作者提出采用ADHDP的優(yōu)化算法,對單液流鋅鎳電池的充電電流進行閉環(huán)跟蹤控制。
為保證等效電路模型辨識精度高和所需計算量小,同時反映單液流鋅鎳電池的濃差極化與電化學(xué)極化現(xiàn)象,本文作者建立二階RC等效電路模型,并進行參數(shù)辨識和充電電流控制實驗[7]。采用額定容量為14 Ah單液流鋅鎳電池的充電脈沖電流和脈沖電壓做參數(shù)辨識實驗。
電流(I)流經(jīng)歐姆內(nèi)阻(R0)、電化學(xué)極化電阻(R1)與電化學(xué)極化電容(C1)組成的R1C1回路、濃差極化電阻(R2)與濃差極化電容(C2)組成的R2C2回路,根據(jù)基爾霍夫定律可知:
式(1)-(3)中:Um為開路電壓;Ucell為端電壓;U1、U2分別為電化學(xué)極化和濃差極化的電壓。
由式(1)和式(2)有:
式(4)、(5)中:U1(0)為R1C1回路的初值電壓;U2(0)為R2C2回路的初值電壓;t為連續(xù)時間;e為自然常數(shù)。
將式(3)-(5)離散化,則有:
式(6)-(8)中:T為采樣周期;k為離散時間。
Buck電路是降壓型電路,Ui為Buck電路的輸入電壓,即有Ui>Ucell[8]。Buck電路的輸出負載為單液流鋅鎳電池。
濾波電感L的運算公式為:
式(9)中:D為占空比;fs為PWM發(fā)生器的頻率;I0為單液流鋅鎳電池的充電電流。
濾波電容C的運算公式為:
式(10)中:Us為輸出紋波電壓。
本文作者采用ADHDP控制器對所設(shè)計模型電路進行控制,控制系統(tǒng)框圖如圖1所示。
圖1 單液流鋅鎳電池的ADHDP控制原理圖Fig.1 Schematic diagram of action dependent heuristic dynamic programming(ADHDP)control of single-flow zinc-nickel battery
圖1中:Z-1為延遲因子;C為電容;L為電感;D為二極管;Iref為參考電流;Ii為Buck電路的輸入電流;uc為ADHDP的輸出控制信號;Q為金屬-氧化物半導(dǎo)體場效應(yīng)晶體管(MOSFET);PWMpulse為PWM脈沖波,用于控制MOSFET管的通斷。
該控制系統(tǒng)模型均采用MATLAB/SIMULINK平臺下Simscape庫的元器件進行設(shè)計。ADHDP電流控制器可實時對電池的充電電流進行反饋,通過ADHDP算法,進行自適應(yīng)計算,求出最優(yōu)或次優(yōu)的控制信號增量,進而獲得控制信號。該控制信號輸入PWM發(fā)生器后,生成不同占空比的PWM脈沖波,對Buck電路的MOSFET管進行調(diào)整,因此能有效地跟蹤控制目標(biāo)。
文獻[9]介紹了ADHDP的算法原理與ADHDP控制器的設(shè)計。在ADHDP控制器中,評價網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)都由BP神經(jīng)網(wǎng)絡(luò)構(gòu)成。ADHDP內(nèi)部采取誤差反向傳播算法分別對這兩個BP神經(jīng)網(wǎng)絡(luò)的權(quán)值實行更新調(diào)節(jié),得到最優(yōu)權(quán)值,計算出最優(yōu)控制動作,接著對單液流鋅鎳電池進行調(diào)控,使電池得以穩(wěn)定,控制對象達到最優(yōu)。
性能指標(biāo)函數(shù)J(t)的運算公式為:
式(11)中:VU(t)為效用函數(shù),它反映了整個系統(tǒng)的性能;γ為折扣因子,且0<γ≤1。
效用函數(shù)VU(t)的運算公式為:
式(12)中:采用t、(t-1)和(t-2)時刻的電流偏量ΔI0作為效用函數(shù)VU(t)的調(diào)節(jié)量。
在對單液流鋅鎳電池二階RC等效電路模型充電的過程中,于1 000 s與2 000 s時對充電電流進行突變擾動,分別觀察在ADHDP控制和PI控制下的控制性能。單液流鋅鎳電池充電電流參考值突變的ADHDP控制和PI控制見圖2。
圖2 單液流鋅鎳電池充電電流和端電壓在ADHDP和PI控制下的動態(tài)響應(yīng)曲線Fig.2 Dynamic response curves of the charging currentand terminal voltage of the single-flow zinc-nickel battery under ADHDP and PI control
從圖2可知,在系統(tǒng)啟動初期,ADHDP控制下的充電電流幾乎無超調(diào),而PI的超調(diào)量為32.86%。
在ADHDP控制和PI控制下,電池在1 000 s和2 000 s時的局部放大動態(tài)響應(yīng)曲線見圖3。
圖3 單液流鋅鎳電池充電電流在ADHDP和PI控制下的局部放大動態(tài)響應(yīng)曲線Fig.3 Partially amplified dynamic response curves of the charging current of the single-flow zinc-nickel battery under ADHDP and PI control
從圖3可知,在1 000 s時,充電電流參考值由7 A突減到6 A,PI控制器不斷地調(diào)控,使充電電流在幾次大波動后才趨于穩(wěn)定;而在ADHDP控制下,充電電流快速衰減趨向電流參考值,且?guī)缀鯚o振蕩,從而使電池端電壓具有較小波動,說明ADHDP控制器相比于PI控制器具有更好的抗干擾能力。在2 000 s時,充電電流參考值由6 A突增回7 A,PI控制下的充電電流超調(diào)量仍較大,而ADHDP控制下的充電電流超調(diào)量較小,ADHDP控制下的調(diào)節(jié)時間短于PI控制下的調(diào)節(jié)時間??梢钥闯?ADHDP控制器的電流控制效果更好。
在ADHDP控制和PI控制下,1 000 s和2 000 s時的PWM占空比變化曲線見圖4。
圖4 在ADHDP控制和PI控制下的PWM占空比變化曲線Fig.4 Change curves of PWM duty cycle under ADHDP and PI control
從圖4可知,在1 000 s時,充電電流參考值由7 A突減到6 A,為了使充電電流趨于參考值,在控制器控制下獲得PWM占空比,并在PWM發(fā)生器中產(chǎn)生相應(yīng)脈寬的PWM脈沖信號,從而對BUCK電路進行調(diào)控;而此時的ADHDP控制器能快速對電路進行補償調(diào)節(jié)。在2 000 s時,充電電流參考值由6 A突增回7 A,ADHDP控制器比PI控制器補償調(diào)節(jié)BUCK電路的速度更快,從而使充電電流快速趨于穩(wěn)定。
ADHDP的性能指標(biāo)函數(shù)變化曲線見圖5。
圖5 ADHDP的性能指標(biāo)函數(shù)變化曲線Fig.5 Change curve of performance index function of ADHDP
從圖5可知,在100 s、1 000 s、2 000 s和7 500 s時,單液流鋅鎳電池的充電電流均有突變,在ADHDP控制器的控制下均能快速收斂,說明ADHDP具有良好的優(yōu)化控制性能。
ADHDP的效用函數(shù)變化曲線見圖6。
圖6 ADHDP的效用函數(shù)變化曲線Fig.6 Change curves of utility function of ADHDP
從圖6可知,在100 s、1 000 s、2 000 s和7 500 s時,效用函數(shù)VU(t)均能快速收斂,表明在ADHDP電流控制器的控制下,單液流鋅鎳電池控制系統(tǒng)的整體控制性能較好。
本文作者為對單液流鋅鎳電池的充電電流進行較好跟蹤優(yōu)化,增強抗干擾能力,提高系統(tǒng)穩(wěn)定性,減少跟蹤誤差,減少能量損耗,提高充電效率,采用ADHDP算法對單液流鋅鎳電池的充電電流進行閉環(huán)跟蹤自適應(yīng)控制研究。研究表明,在系統(tǒng)啟動初期,ADHDP控制下的充電電流幾乎無超調(diào),而PI的超調(diào)量為32.86%。通過在1 000 s和2 000 s時分別對單液流鋅鎳電池充電電流參考值進行突變,將ADHDP電流控制器的仿真控制結(jié)果與PI電流控制器的仿真控制結(jié)果進行比較,驗證了ADHDP電流控制器具有較優(yōu)的跟蹤突變能力和較好的抗干擾能力。