王健
(大慶華科股份有限公司 聚丙烯分公司,黑龍江 大慶 163316)
一類基于Multi-Agent的實(shí)時(shí)進(jìn)化算法
王健
(大慶華科股份有限公司 聚丙烯分公司,黑龍江 大慶 163316)
實(shí)時(shí)進(jìn)化(Real-Time Evolutionary,RTE)策略解決了傳統(tǒng)實(shí)時(shí)優(yōu)化(Real-Time Optimization, RTO)方案中等待穩(wěn)態(tài)的缺點(diǎn),受RTE思想的啟發(fā),論文提出了一種基于Multi-Agent的實(shí)時(shí)進(jìn)化算法。首先將粒子群算法與Multi-Agent機(jī)制相結(jié)合,每一個(gè)Agent相當(dāng)于粒子群算法中的一個(gè)粒子,通過和其鄰居進(jìn)行競(jìng)爭(zhēng)、合作以及學(xué)習(xí),能夠迅速、準(zhǔn)確的找到全局最優(yōu)解;然后,根據(jù)RTE思想,將基于Multi-Agent的粒子群算法應(yīng)用于RTO的解決方案。通過對(duì) Williams-otto反應(yīng)器的實(shí)例研究,證明了所提算法的有效性。
Multi-Agent;RTE;RTO
Multi-Agent是由多個(gè)具有感知能力和自學(xué)習(xí)能力的智能體組成的系統(tǒng),可以在其定義的局域環(huán)境中與其鄰居進(jìn)行競(jìng)爭(zhēng)與合作,并且可以自主的進(jìn)行自學(xué)習(xí),以完成復(fù)雜的控制任務(wù)或解決復(fù)雜的問題,因而被廣泛應(yīng)用于優(yōu)化算法中。Zhong等[1]提出了多Agent遺傳算法,用于解決全局?jǐn)?shù)值優(yōu)化問題;Cardon等[2]則將多目標(biāo)遺傳算法應(yīng)用到多Agent系統(tǒng)中,尋找分配問題——車間生產(chǎn)調(diào)度方案,以減少延遲時(shí)間;Ackchai等[3]結(jié)合多目標(biāo)進(jìn)化算法與Agent系統(tǒng)建立了聯(lián)合貨運(yùn)樞紐定位的優(yōu)化模型,尋找一個(gè)好的定位方案;我國(guó)學(xué)者楊萍等[4]提出了一種基于遺傳算法(GA)協(xié)調(diào)進(jìn)化算法;丁輝等[5]則提出了一種求解約束多目標(biāo)優(yōu)化問題的Agent進(jìn)化算法;宿翀等[6]則通過對(duì)Agent傳統(tǒng)的BDI結(jié)構(gòu)進(jìn)行擴(kuò)展,提出了一類面向交互式進(jìn)化計(jì)算的情感學(xué)習(xí)Agent等。然而,上述粒子群算法中均沒有涉及實(shí)時(shí)優(yōu)化思想,從而導(dǎo)致了模型在收斂速度和穩(wěn)定性上的不足。
本文結(jié)合粒子群算法和Multi-Agent機(jī)制,提出了一個(gè)基于Multi-Agent的粒子群優(yōu)化算法;結(jié)合RTE思想,構(gòu)造了一個(gè)解決進(jìn)化式實(shí)時(shí)優(yōu)化中的設(shè)定點(diǎn)優(yōu)化問題的方案;通過對(duì)Williams-otto反應(yīng)器進(jìn)行仿真研究,表明了所提算法具有收斂速度快、計(jì)算精度高等優(yōu)點(diǎn)。
本文通過將基于Multi-Agent的粒子群算法引入RTE思想之中,使該算法在真正意義上實(shí)現(xiàn)了對(duì)過程的在線優(yōu)化,從而提高了搜尋最優(yōu)解的收斂速度以及精度。
圖1 給出了基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法中一種 “擬穩(wěn)態(tài)”區(qū)間的流程。
RTE中△t的值較高的時(shí)候?qū)?huì)阻礙系統(tǒng)的性能,但是△t也應(yīng)足夠大以允許模型進(jìn)行優(yōu)化計(jì)算。作為一個(gè)初步的定義,△t值大約占一個(gè)穩(wěn)態(tài)優(yōu)化過程時(shí)間的1%~7%為宜。
圖1 基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法Fig.1 The process of Multi-Agent based realtime PSO algorithm
在該部分,本文利用階躍擾動(dòng)和連續(xù)正弦擾動(dòng)兩種方式,結(jié)合工業(yè)優(yōu)化過程中典型的反應(yīng)器——Williams-otto反應(yīng)器對(duì)傳統(tǒng)粒子群算法和基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法的效用進(jìn)行比較。
2.1 問題描述
圖2 Williams-otto反應(yīng)器Fig.2 Williams-otto reactor
如圖 2所示,Williams-otto反應(yīng)器為帶夾套的連續(xù)攪拌反應(yīng)器。反應(yīng)器溫度為Tr;A、B為進(jìn)料。經(jīng)過下式的反應(yīng),出口物料R中含有六種組分A、B、C、E、P、G。并且,反應(yīng)器中有三個(gè)二級(jí)的不可逆反應(yīng):
其中,k1,k2和k3分別為三個(gè)反應(yīng)的反應(yīng)系數(shù)。之后,給出該反應(yīng)器的經(jīng)濟(jì)目標(biāo)方程:
式中:Xi—相應(yīng)組分的質(zhì)量分?jǐn)?shù);Fr—出口物料流率;過程的主要擾動(dòng)來自于A的進(jìn)料流率Fa;過程的設(shè)定值是反應(yīng)器的反應(yīng)溫度Tr和組分B的流量Fb。該反應(yīng)器的目的即為令I(lǐng)FO值最大化。
基于已有的相關(guān)文獻(xiàn),可知當(dāng) Fa為 1.83kg/s時(shí),最佳操作點(diǎn)為Fb=4.89kg/s和Tr=89.7℃。
2.2 階躍擾動(dòng)
由于目標(biāo)函數(shù)IOF為瞬態(tài)目標(biāo)函數(shù)值,為了使該試驗(yàn)更有實(shí)踐意義,引入平均目標(biāo)函數(shù)(MOF)對(duì)結(jié)果進(jìn)行評(píng)估。MOF可定義為:
式中,t0和t分別代表初始時(shí)刻和當(dāng)前時(shí)刻。之后,利用階躍擾動(dòng)對(duì)該算法進(jìn)行試驗(yàn)分析。在優(yōu)化操作條件下,在300s時(shí)對(duì)系統(tǒng)加入一個(gè)階躍干擾 (Fa=1.83kg/s減小到Fa=1.7 Kg/s)。
階躍擾動(dòng)中兩種算法下的反應(yīng)器系統(tǒng)中各參數(shù)的變動(dòng)情況中分別如圖3和圖4所示。
圖3 階躍擾動(dòng)中傳統(tǒng)粒子群算法下各參數(shù)變動(dòng)情況Fig.3 The fluctuation of parameters within the traditional PSO algorithm in step disturbance
圖4 階躍擾動(dòng)中基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法下的各參數(shù)變動(dòng)情況Fig.4 The fluctuation of parameters within the Multi-Agent based real-time PSO algorithm in step disturbance
從圖3和圖4可以看出,針對(duì)于Fb參數(shù),傳統(tǒng)粒子群算法尋優(yōu)并不穩(wěn)定,直至800s仍舊沒有收斂到穩(wěn)定狀態(tài);而本文提出的新型算法則在約400s處就已經(jīng)達(dá)到最優(yōu)值,并且在之后無波動(dòng)發(fā)生。并且,Tr參數(shù)部分也出現(xiàn)了類似的情況。
而比較IOF參數(shù)的數(shù)據(jù)時(shí)發(fā)現(xiàn):基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法所用時(shí)間要稍長(zhǎng)于傳統(tǒng)粒子群算法(約為0.0003s),這可能是由于算法中間隔時(shí)間△t的選取或程序隨機(jī)性等因素造成的。另外,兩種算法中 IOF參數(shù)的數(shù)據(jù)也顯示了基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法的收斂速度要優(yōu)于傳統(tǒng)粒子群算法。
綜上所述,基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法的效用要優(yōu)于傳統(tǒng)粒子群算法。
2.3 連續(xù)sin擾動(dòng)
本文對(duì)該部分進(jìn)行如下規(guī)定:干擾為連續(xù)sin干擾,F(xiàn)a=1.83-0.13sin(t/1000),仿真時(shí)間0~2500,整個(gè)過程始終都存在干擾。連續(xù)sin擾動(dòng)中兩種算法下的反應(yīng)器系統(tǒng)中各參數(shù)的變動(dòng)情況中分別如圖5和圖6所示。
圖5 連續(xù)sin擾動(dòng)中傳統(tǒng)粒子群算法下的各參數(shù)變動(dòng)情況Fig.5 The fluctuation of parameters within the traditional PSO algorithm in continuous sin disturbance
從整體上看,基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法在穩(wěn)定性和收斂速度都要明顯優(yōu)于傳統(tǒng)粒子群算法,尤其以Fb和IOF參數(shù)最為明顯。
本文將粒子群算法、Multi-Agent技術(shù)和實(shí)時(shí)優(yōu)化機(jī)制進(jìn)行結(jié)合,構(gòu)造了一個(gè)新的優(yōu)化算法——基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法,從而對(duì)進(jìn)化式實(shí)時(shí)優(yōu)化中的設(shè)定點(diǎn)優(yōu)化問題進(jìn)行解決。 之后, 通過對(duì)Williams-otto反應(yīng)器中的優(yōu)化問題進(jìn)行仿真,比較傳統(tǒng)粒子群算法和該算法的效用,實(shí)驗(yàn)結(jié)果表明,基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法不僅在穩(wěn)定性和收斂速度上都要優(yōu)于傳統(tǒng)粒子群算法,而且該算法還提高了過程的實(shí)時(shí)性,使系統(tǒng)無需等待過程穩(wěn)態(tài),從而令整體優(yōu)化性能有了大幅度增強(qiáng)。然而,由于本文中所使用的檢驗(yàn)環(huán)境過于簡(jiǎn)單,無法驗(yàn)證該算法在復(fù)雜工業(yè)系統(tǒng)中的效用,因此,引用更為復(fù)雜的系統(tǒng)對(duì)該算法進(jìn)行檢驗(yàn)將是我們下一步的研究主題。
圖6 連續(xù)sin擾動(dòng)中基于Multi-Agent的實(shí)時(shí)粒子群優(yōu)化算法下的各參數(shù)變動(dòng)情況Fig.6 The fluctuation of parameters within the Multi-Agent based real-time PSO algorithm in continuous sin disturbance
[1]Alain C,Thieny G B,Vacher J P.Genetic algorithms using multiobjectives in a Multi-Agent System[J].Robotics and Autonomous System,2000,33.
[2]Sirikijpaniehku1 A,Van D K H,F(xiàn)erreira L,Lukszo Z.Optimizing the Location of Intermodal Freight Hubs:An overview of the Agent Based Modeling Approach[J].Journal of Transportation Systems Engineering and Information Technology,2007,4.
[3]楊萍,劉衛(wèi)東,畢義明.基于分布式協(xié)商進(jìn)化算法的多Agent目標(biāo)沖突消解[J].系統(tǒng)工程與電子技術(shù),2009,8.
[4]丁輝,李宏光.一種求解約束多目標(biāo)優(yōu)化問題的Agent進(jìn)化算法[J].吉林大學(xué)學(xué)報(bào),2011,41(S1).
[5]宿翀,李宏光.基于情感學(xué)習(xí)Agent的交互式進(jìn)化計(jì)算方法[J/OL].計(jì)算機(jī)集成制造系統(tǒng),2012,18.
[6]趙波,曹一家.電力系統(tǒng)無功優(yōu)化的多智能體粒子群優(yōu)化算法[J].中國(guó)電機(jī)工程學(xué)報(bào),2005,5.
A Real-time Evolutionary Algorithm Based on the Multi-Agent Theory
WANG Jian
(Daqing Huake Company Limited,Daqing Heilongjiang 163316,China)
The Real-Time Evolutionary(RTE)can be utilized to address the demerit of the traditional Real-Time Optimization(RTO)which is the requirement for waiting the steady.Based on this conception,this paper proposed a real-time evolutionary algorithm regarding the Multi-Agent theory.Firstly,a combination between the Particle Swarm Optimization(PSO)algorithm and the Multi-Agent theory is demonstrated,in which each Agent can be treated as a particle within the PSO,which can quickly and accurately find the global optimal solution through competition,cooperation,and learning with their neighbors.Then,derived from the conception of RTE,the Multi-Agent based PSO algorithm is applied on the RTO problem.In the end,the effectiveness and availability of this algorithm are confirmed by the empirical test of Williams-otto reactor.
Multi-agent;RTE;RTO
TP317
:Adoi:10.3969/j.issn.1002-6673.2014.01.005
1002-6673(2014)01-015-03
2013-12-16
王?。?975-),女,1998年7月畢業(yè)于大慶石化總廠職工大學(xué)生產(chǎn)過程自動(dòng)化專業(yè)。曾長(zhǎng)期在生產(chǎn)一線從事儀表過程控制工作,積累了大量而寶貴的實(shí)際生產(chǎn)經(jīng)驗(yàn)。