孫 劍,俞 赟,張 瑞
(中國核動力研究設(shè)計院 核反應(yīng)堆系統(tǒng)設(shè)計技術(shù)重點實驗室,四川 成都 610041)
反應(yīng)堆控制系統(tǒng)(Reactor Control System,RRC)的作用是控制反應(yīng)堆安全、有效地運行,使得核蒸汽供應(yīng)系統(tǒng)生產(chǎn)出合格、適量的蒸汽,以實現(xiàn)核能向機械能、電能的轉(zhuǎn)化。在整個反應(yīng)堆儀表與控制系統(tǒng)(I&C)中,RRC處于核心地位,是反應(yīng)堆設(shè)計的重要技術(shù)領(lǐng)域之一?,F(xiàn)有的主流壓水堆堆型,RRC系統(tǒng)都是基于經(jīng)典控制理論進行設(shè)計,從結(jié)構(gòu)到參數(shù)都大同小異??刂仆ǖ阑诜答?、單回路、串級、前饋等經(jīng)典控制理論進行設(shè)計,系統(tǒng)優(yōu)化使用線性系統(tǒng)穩(wěn)定性分析理論,用頻域指標界定系統(tǒng)的瞬態(tài)性能,從而尋找最優(yōu)化控制系統(tǒng)參數(shù)。
本文針對反應(yīng)堆控制系統(tǒng)參數(shù)優(yōu)化問題,提出了一種新的優(yōu)化設(shè)計方法,從優(yōu)化結(jié)果和操作的簡易性上都要優(yōu)于現(xiàn)有的工程方法,并且使用時不用完全替代老方法,方便在工程上使用。為了說明該方法的操作流程和效果,以穩(wěn)壓器壓力控制為實例,編制了完整的程序,對比了兩種方法的優(yōu)化過程及結(jié)果。
問題
控制系統(tǒng)參數(shù)是通過對單個系統(tǒng)進行仿真優(yōu)化得出,現(xiàn)有的工程優(yōu)化方法具體操作流程如下:通過選定幾組可能的控制器參數(shù)及控制通道整定值,分別分析其經(jīng)典控制理論頻域指標(如Nichols曲線所揭示的幅值增益、相位增益等),以判斷不同參數(shù)組合下線性系統(tǒng)的時域性能(超調(diào)量、調(diào)節(jié)時間等),通過分析和比對,找出優(yōu)化后的各控制系統(tǒng)整定值。
在使用頻域指標考察控制系統(tǒng)的時域性能時,主要考慮幅值增益和相位增益指標。簡單的來說,幅值增益小于0 dB,則系統(tǒng)不穩(wěn)定;相位增益小于0°,則系統(tǒng)不穩(wěn)定。RRC系統(tǒng)的分析不僅要求系統(tǒng)穩(wěn)定,更要求系統(tǒng)具有一定的穩(wěn)定程度,即考慮系統(tǒng)參數(shù)不確定性情況下,系統(tǒng)仍然是穩(wěn)定的,時域指標也是接近最優(yōu)的。這就要求RRC系統(tǒng)的參數(shù)設(shè)置要使幅值增益和相位增益合適,因為幅值增益越大,系統(tǒng)的響應(yīng)越遲緩;相位增益越大,系統(tǒng)越震蕩、調(diào)節(jié)時間越長;相位增益越小,超調(diào)量越大。
進一步分析,幅值增益揭示了RRC系統(tǒng)的閉環(huán)增益增大多少倍,系統(tǒng)開始變到臨界穩(wěn)定和不穩(wěn)定狀態(tài)。一般來說,幅值增益應(yīng)大于6 dB。對于如式(1)所示的典型二階系統(tǒng),其相位增益可以表達為式(2)。
(1)
式中:ωn——無阻尼震蕩角頻率;
ξ——阻尼系數(shù)。
(2)
式中:φ——相位增益。
對于2階系統(tǒng),超調(diào)量可以表示為式(3):
(3)
因此,可以通過相位增益φ求出阻尼系數(shù)ξ,進而求出超調(diào)量σ。為了折中考慮超調(diào)量和調(diào)節(jié)時間性能,應(yīng)盡量使相位增益φ在30°~60°。
當RRC各控制系統(tǒng)整定值均已優(yōu)化完成之后,需要對RRC所有控制系統(tǒng)進行聯(lián)合仿真分析(反應(yīng)堆對象使用數(shù)字化仿真模型),以確定各控制系統(tǒng)在相互配合時,整個反應(yīng)堆控制系統(tǒng)性能指標得到了滿足,并且驗證RRC系統(tǒng)能夠應(yīng)對電廠正常運行瞬態(tài)(階躍變化10%FP的瞬態(tài)、線性變化5%FP/min的瞬態(tài)、汽機甩負荷到廠用電瞬態(tài)和緊急停堆瞬態(tài)),不會觸發(fā)保護系統(tǒng)動作。
傳統(tǒng)參數(shù)優(yōu)化方法在解決反應(yīng)堆控制系統(tǒng)參數(shù)優(yōu)化問題時,需要解決頻域指標和時域指標的復(fù)雜對應(yīng)關(guān)系,操作起來較為復(fù)雜,且參數(shù)組合的選取采用人為試湊方式,不能涵蓋所有可能的控制系統(tǒng)參數(shù)組合。RRC控制系統(tǒng)優(yōu)化的結(jié)果是一組相對優(yōu)化的參數(shù)組合,并非最優(yōu)化參數(shù),這也是傳統(tǒng)參數(shù)優(yōu)化方法的不足之處。
這是由兩方面原因引起。一方面,20世紀60年代,計算機還不夠普及,計算性能也不夠強大,還無法通過高效地計算控制系統(tǒng)動態(tài)響應(yīng)的方式進行參數(shù)優(yōu)化,只能使用頻域計算間接推斷控制系統(tǒng)的時域性能。在最初的頻域分析時甚至只能通過手繪方式計算Nichols曲線,而以這種方式完成RRC系統(tǒng)的優(yōu)化將是十分龐大的工作量。再者,當時情況下,工業(yè)領(lǐng)域可選擇的控制領(lǐng)域的理論工具十分有限。對于反應(yīng)堆控制系統(tǒng)參數(shù)優(yōu)化問題,研究使用群體智能算法來求解將是一個很好和可行的嘗試。這樣做優(yōu)點是顯而易見的,首先是可以對一個大的參數(shù)范圍進行搜索,其次充分利用計算機的能力,直接用時域響應(yīng)作為評判指標,從而得到一組最優(yōu)化的控制系統(tǒng)參數(shù)。
粒子群優(yōu)化算法是基于群智能方法的演化算法,由美國社會心理學(xué)家Kenndy和電氣工程師Eberhar于1995年提出。基本概念源于對鳥群捕食行為的研究,鳥群在飛行過程中經(jīng)常會突然改變方向、散開、聚集,其行為不可預(yù)測,但整體總保持一致性,個體與個體之間也保持著最適宜的距離。研究發(fā)現(xiàn),鳥僅僅追蹤它有限數(shù)量的鄰居,但最終的整體結(jié)果是整個鳥群好像在一個中心的控制之下,即復(fù)雜的全局行為是由簡單規(guī)則的相互作用引起的,生物群體之間存在著一種社會信息共享機制,為群體的進化提供了一種優(yōu)勢。使用計算機模擬鳥群的覓食行為,可用于解決優(yōu)化問題?;驹砣缦拢簡栴}的解對應(yīng)于搜索空間中粒子的位置。每個粒子有自己的位置和速度(決定飛行的方向和距離),還有一個由被優(yōu)化函數(shù)決定的適應(yīng)值。各個粒子記憶、追隨當前的最優(yōu)粒子,在解空間中搜索。每次迭代的過程不是完全隨機的,如果找到較好解,將會以此為依據(jù)尋找下一個解。
算法描述如下:隨機初始化一群粒子,其中第i個粒子在D維解空間的位置表示為xi=(xi1,xi2,…,xiD)。每一次迭代,粒子通過動態(tài)跟蹤兩個極值來更新其速度和位置。第一個是粒子從初始到當前迭代次數(shù)搜索產(chǎn)生的最優(yōu)解:個體極值pBesti=(pi1,pi2,…,piD);第二個是粒子種群目前的最優(yōu)解:全局極值gBest=(g1,g2,…,gD)。第i個粒子根據(jù)以下公式來更新其第d維(1≤d≤D)速度和位置:
vid=wvid+c1r(pid-xid)+c2R(gd-xid)
(4)
xid=xid+vid
(5)
式中:v——粒子速度;
x——粒子位置;
w——為避免粒子在全局最優(yōu)解附近震蕩的可變慣性系數(shù);
r,R——均勻分布在(0,1)區(qū)間的隨機數(shù);
c1,c2——學(xué)習因子。
粒子在解空間內(nèi)不斷跟蹤個體極值和全局極值進行搜索,直至達到規(guī)定的迭代次數(shù)或滿足規(guī)定的性能指標為止。算法流程如圖1所示。
圖1 粒子群優(yōu)化算法計算流程Fig.1 Calculation flow of particle swarm optimization algorithm
利用粒子群算法進行RRC系統(tǒng)參數(shù)優(yōu)化時需要計算某種參數(shù)組合情況下系統(tǒng)的適應(yīng)度值,即系統(tǒng)在給定控制通道參數(shù)作用下的響應(yīng)性能評價。對于一般的最小相位系統(tǒng),階躍響應(yīng)中包含的上升時間、超調(diào)量、穩(wěn)態(tài)偏差等指標足以用于評價系統(tǒng)的性能。為了便于計算機編程,設(shè)計如式(6)所示的指標,用于表征系統(tǒng)的時域性能。
(6)
式中:e(t)——控制偏差;
t——時刻;
J——適應(yīng)度函數(shù)值。
該指標對初始誤差考慮較少,而主要限制過渡過程后期出現(xiàn)的誤差,即控制系統(tǒng)評價考慮的是對誤差的消除能力再加上時間的懲罰項。該指標綜合了上升時間、超調(diào)量、穩(wěn)態(tài)偏差等指標,J值最小的控制系統(tǒng)參數(shù)可被看作是最優(yōu)化的控制系統(tǒng)參數(shù),而控制參數(shù)最優(yōu)化的迭代過程則由粒子群算法解決。
使用粒子群優(yōu)化控制系統(tǒng)參數(shù)時,計算量大,粗略估算總耗時為:每一次控制參數(shù)性能評價時間、粒子群種群規(guī)模和最大學(xué)習代數(shù)三者的乘積。對于每一次控制參數(shù)性能評價,需要計算控制通道的階躍響應(yīng),而對反應(yīng)堆控制系統(tǒng)涉及的大部分對象,至少需要計算600~1 000 s范圍內(nèi)系統(tǒng)的響應(yīng)才有意義。由此可見,使用粒子群算法進行反應(yīng)堆控制系統(tǒng)參數(shù)優(yōu)化的計算量十分龐大,若算法設(shè)置不合理,將導(dǎo)致整個優(yōu)化過程漫長。
本文在進行控制通道階躍響應(yīng)計算時,沒有直接利用連續(xù)系統(tǒng)離散化的現(xiàn)成軟件包,而是采用對復(fù)雜傳遞函數(shù)進行技巧性拆分,分成基本環(huán)節(jié)的組合,然后利用離散相似法計算得出快速運算的差分方程。這樣做的優(yōu)點是便于編制計算機迭代程序,提高運算速度。
例如,圖2所示的復(fù)雜傳遞函數(shù):
圖2 復(fù)雜傳遞函數(shù)的拆分Fig.2 Splitting of complex transfer functions
對于積分環(huán)節(jié)有式(7),其中ts是采樣周期。
x2(k+1)=x2(k)+k·x1(k)×ts
(7)
(8)
根據(jù)離散相似法公式:
x(k+1)=eAts·u(k)+
(9)
當采用零階保持器時,慣性環(huán)節(jié)的差分方程可以寫為:
(10)
(11)
利用上述,圖2的控制通道就能在計算機上進行高速仿真。
下面以國內(nèi)典型三環(huán)路M310機組的穩(wěn)壓器壓力控制系統(tǒng)優(yōu)化為例,說明控制系統(tǒng)參數(shù)優(yōu)化的過程。簡化的控制邏輯如圖3所示,控制目標是在正常運行瞬態(tài)將穩(wěn)壓器壓力控制在15.5 MPa abs,而不引起停堆或穩(wěn)壓器安全閥開啟??刂剖侄斡袃蓚€,2組比例式電加熱器通過增加水的閃蒸來提高穩(wěn)壓器壓力,兩條噴淋管線通過控制冷水噴淋流量來降低壓力。兩個非線性環(huán)節(jié)用來使得電加熱器和噴淋流量按順序投入運行。
圖3 穩(wěn)壓器壓力控制簡化邏輯圖Fig.3 Simplified logic of pressure control for the pressurizer
圖4 穩(wěn)壓器壓力控制參數(shù)優(yōu)化完整框圖Fig.4 Complete block diagram of pressure control parameter optimization of the pressurizer
使用電加熱器改變穩(wěn)壓器壓力是一個緩慢的過程,而噴淋相對而言快速得多。因此,可以大致將優(yōu)化過程分成兩步進行。首先不考慮微分作用(即微分項置為0),只考慮電加熱器的動作來優(yōu)化積分項,主要考察控制系統(tǒng)消除壓力穩(wěn)態(tài)偏差的能力。人為選取三組積分常數(shù)值(100 s,600 s,1 000 s),繪制控制通道Nichols曲線如圖5。
圖5 積分項優(yōu)化Fig.5 Integral term optimization
表1 控制器積分項幅值、相位增益表
可見,積分項的選取不會顯著改變幅值增益,但會顯著影響相位增益。積分項的目的是消除穩(wěn)態(tài)偏差,壓力控制并不需要大的積分項,以便開關(guān)式電加熱器不會頻繁開啟,且控制通道應(yīng)避免阻尼震蕩,因此選取600 s較為合適。
在積分項確定之后,第二步優(yōu)化PID控制器的微分項,這主要通過對噴淋系統(tǒng)的分析,確定控制系統(tǒng)具有良好快速性的微分時間。限于篇幅,這里不再論述,優(yōu)化的結(jié)果是λ=1.25,τ22=5 s。
使用智能參數(shù)優(yōu)化時,不需要針對電加熱器控制通道和噴淋控制通道單獨優(yōu)化,因為這兩個通道的特性已經(jīng)包含在他們的對象模型中,再者分開優(yōu)化也不好界定兩個通道之間的影響程度,這也是相對于古典控制理論優(yōu)化更合理的地方。
學(xué)習代數(shù)設(shè)定為最大30代,學(xué)習系數(shù)設(shè)定為典型值2.05,慣性權(quán)重設(shè)定為0.729。迭代過程適應(yīng)度的變化過程如圖6,優(yōu)化結(jié)果為τ21=867 s,λ=2.6,τ22=6.8 s。
圖6 迭代過程適應(yīng)度變化Fig.6 Change of fitness in iterative process
為了比較兩組參數(shù)的優(yōu)劣,分別仿真壓力設(shè)定值階躍+0.2 MPa和-0.2 MPa時兩組控制參數(shù)的控制系統(tǒng)響應(yīng)效果,對比曲線見圖7和圖8。其中,壓力階躍-0.2 MPa時,噴淋和電加熱器同時起作用。從圖中可以看出,根據(jù)古典控制理論優(yōu)化出來的PID參數(shù)效果良好,但不是最優(yōu)參數(shù),粒子群算法優(yōu)化的參數(shù)在超調(diào)量指標上有明顯改進,優(yōu)于現(xiàn)有工程方法的優(yōu)化結(jié)果。
對于實際工程來說,優(yōu)選出來的PID參數(shù)還應(yīng)考慮開關(guān)式電加熱器的動作,而這可以通過控制系統(tǒng)聯(lián)調(diào)來測試其性能。限于篇幅,這里不再論述。
圖7 兩組PID參數(shù)控制效果對比Fig.7 Comparison of control effects of two groups of PID parameters
圖8 兩組PID參數(shù)控制效果對比Fig.8 Comparison of control effects of two groups of PID parameters
隨著計算機的出現(xiàn)和處理能力的提升,幾乎所有工業(yè)領(lǐng)域都產(chǎn)生了革命性發(fā)展。反應(yīng)堆控制系統(tǒng)設(shè)計也應(yīng)緊跟潮流,一方面利用計算機的能力提升設(shè)計水平,另一方面在過程控制中改進整個系統(tǒng)的性能。
本文論述了反應(yīng)堆控制系統(tǒng)參數(shù)優(yōu)化的過程和理論,闡明了現(xiàn)有的工程優(yōu)化方法及其不足之處,提出了基于粒子群優(yōu)化的新方法。該方法利用現(xiàn)代計算機高速計算的能力,對反應(yīng)堆控制系統(tǒng)的參數(shù)進行最優(yōu)化搜索。相對于目前工程中使用的方法,新方法能夠做到最優(yōu)化設(shè)計,且優(yōu)化過程更為直接、直觀,并且以穩(wěn)壓器壓力控制系統(tǒng)的優(yōu)化為例,測試了新方法的有效性,為工程使用打下了基礎(chǔ)。