韓曉霞,謝 剛,韓曉明,謝克明
(太原理工大學 信息工程學院,山西 太原 030024)
ACPSO-SVR結合的非線性建模預測算法研究
韓曉霞,謝 剛,韓曉明,謝克明
(太原理工大學 信息工程學院,山西 太原 030024)
提出一種基于自適應混沌粒子群優(yōu)化和支持向量機結合的非線性預測建模算法(ACPSO-SVR),引入ACPSO啟發(fā)式尋優(yōu)機制對SVR模型的超參數進行自動選取,在超參數取值范圍變化較大的情況下,效果明顯優(yōu)于網格式搜索算法。選取UCI機器學習數據庫中的Forest fires標準數據集進行測試,實驗結果表明該方法具有較高的精度和良好的泛化能力,對于解決多變量的回歸預測問題是一種有效的方法。最后給出了混合算法在碳一多相催化領域的兩種典型應用,在反應動力學模型未知的情況下建立催化劑組份模型和操作條件模型,以及基于混合算法的最優(yōu)催化劑設計框架。
支持向量機;自適應混沌粒子群優(yōu)化;建模;預測;碳一多相催化劑
許多實際工業(yè)過程或研究對象都具有很高的復雜性,其機理尚不十分清楚,或機理方程非常復雜,難以用現有的數學理論建立機理模型。隨著人工智能和計算機技術的發(fā)展,非線性工業(yè)過程建模技術和方法主要集中在專家經驗方法、神經網絡方法、模糊邏輯方法、支持向量機方法、模式識別方法、遺傳編碼方法等方面。
支持向量機(Support Vector Machines,SVM)遵循統(tǒng)計學習VC維理論和結構風險最小化原理 (Structural Risk Minimization,SRM),最早應用于模式識別領域,后來通過引入ε不敏感損失函數概念,推廣到ε-SVR (Support Vector Regression,SVR),廣泛應用于函數回歸問題,成為經驗建模中重要的智能建模方法之一。由于SVR能較好地解決小樣本、高維、非線性和局部極小點等實際問題,并且可以有效地克服維數災難和過擬合等問題,己經成功地應用于復雜工業(yè)過程的動態(tài)建模、系統(tǒng)辨識和控制、數據分析、故障診斷等方面。
針對SVR模型的超參數選擇直接影響著SVR的一般性能和回歸檢驗,是確保SVR模型優(yōu)秀性能的關鍵,筆者提出自適應混沌粒子群優(yōu)化算法對SVR模型的超參數進行優(yōu)化選擇,在此基礎上,提出了基于ACPSO-SVR的預測模型,并給出了詳細的建模與算法流程。應用該方法對UCI數據庫的Forest fires回歸預測數據進行測試,結果顯示基于ACPSO-SVR的預測模型具有較高的精度和良好的泛化能力,對于解決多變量的建模和預測問題是一種有效的方法。最后,給出了該方法在碳一多相催化劑建模與最優(yōu)化設計中的2種應用。
支持向量機[1]是統(tǒng)計學習理論中最年輕、最實用的部分,是基于結構風險最小化原理和VC維理論的新型機器學習方法。它最初主要用來解決模式識別問題。1997年,Vapnik等拓寬了SVM的應用范圍,成功地解決了小樣本、非線性及高維數據的函數回歸擬合問題。對于非線性回歸,通過引入核函數來簡化非線性逼近,將低維空間映射到高維的重建核Hilbert空間,即x→Q(x),然后在高維特征空間中進行線性回歸,從而取得在原空間非線性回歸的效果。根據Mercer定理[2]計算核函數中的內積運算就可以實現非線性函數擬合。
SVR學習與預測的示意圖如圖1所示。
圖1 SVR學習與預測算法示意圖Fig.1 Schematic diagram of the SVR training and predicting algorithm
圖1可見,SVR的訓練過程與ANN有著某種類似,兩者都具有網絡結構和節(jié)點權值,但與ANN訓練過程中網絡結構固定不變不同,在SVR的訓練過程中,其網絡的結構和權值隨著尋優(yōu)過程的變化而時刻調整著,即在算法的復雜性與預測精度之間進行協(xié)調。
對于非線性支持向量機回歸,構造SVM回歸估計函數:
使得預測的期望風險函數最小:
式(2)中,松弛變量(ζi,ζ*i)和懲罰因子 C(>0)用于調節(jié)超出ε管道的樣本點。懲罰因子C和管道因子ε是兩個可以調節(jié)的自由參數,C表示模型的復雜性和逼近誤差之間的平衡,ε表示訓練數據合適的管道寬度[3]。在SVM回歸算法求解實際問題只需對支持向量進行,支持向量可以看做是壓縮了的訓練集里信息量最真實的數據點,于是最終的回歸估計函數形式為:
其中K為核函數,采用不同的核函數可以構建出不同的支持向量回歸機。 文中采用徑向基核(Gaussian 核),K(x,xi)=exp[-(x-xi)/2σ2],它對于常見的模式識別問題都具有優(yōu)異的泛化性能。以上自由參數和核函數的選擇共同決定SVR回歸估計的準確性和泛化能力。
自適應混沌粒子群優(yōu)化 (Adaptive Chaos Particle Swarm Optimization,ACPSO)算法引入混沌優(yōu)化思想和自適應慣性權調整策略,利用混沌特性提高種群的多樣性和粒子搜索的遍歷性,將混沌狀態(tài)引入到優(yōu)化變量使粒子獲得持續(xù)搜索的能力;引入自適應慣性權系數 (Adaptive Inertia Weight Factor,AIWF)[4],提高算法效率,避免陷入早熟,有利于全局范圍內產生很好的搜索能力。
已知基本粒子群優(yōu)化算法[5]按公式(4)和(5)分別更新各粒子的速度和位置:在ACPSO算法中,采用自適應慣性權系數AIWF來動態(tài)調節(jié)慣性權重w,其計算公式如下:
其中,wmax和 wmin分別代表慣性權重w的最大值和最小值,f為粒子當前的目標函數值,favg和 fmin分別為所有粒子的平均值和最小目標值。
當各粒子的目標值區(qū)域一致或者趨于局部最優(yōu)時,將使w增加;而當各粒子的目標值比較分散時,將使w減少。同時,對于目標值f優(yōu)于平均目標值favg的粒子,將對應于較小的w,從而使該粒子得以保護;而對于目標值f差于平均目標值favg的粒子,將對應于較高的w,從而使該粒子能夠更快地趨向較好的搜索空間。
ACPSO算法是一個兩階段算法,其中AIFW調整算法主要用于執(zhí)行全局搜索,而混沌優(yōu)化搜索[6-7]除了在初始階段產生混沌序列之外,將根據PSO算法的結果執(zhí)行局部搜索。
將ACPSO-SVR混合算法應用于非線性系統(tǒng)建模與預測中,建模流程如圖2所示。本文選用libSVM工具箱ε-SVR回歸,SVR 超參數(C,σ,ε)采用 ACPSO 算法優(yōu)化,核函數選用RBF核函數,目標函數采用CV意義下的性能指標對網格上的每組參數對(C,σ,ε)進行泛化能力評價,libSVM工具箱中ε-SVR回歸的性能指標采用均方誤差MSE(Mean Squared Error)、根均方誤差 RMSE(Root Mean Squared Error)和相關系數 CC(Squared Correlation Coefficient)。
圖2 ACPSO算法優(yōu)化SVR超參數流程圖Fig.2 Modeling flow diagram based on ACPSO-SVR
為驗證本文提出的ACPSO-SVR建模方法的預測能力,選取UCI機器學習數據庫(http://archive.ics.uci.edu/ml/)中的Forest Fires標準數據集進行測試。Forest Fires數據集是一個預測森林火災發(fā)生地的數據庫,數據集規(guī)模517×13,屬于多變量的預測問題。實驗的硬件環(huán)境為PIV3.4 GHz,1 G內存,120 G硬盤;仿真工具為Matlab7.0。
首先將原始數據預處理,歸一化到[0,1]之間。選用ε-SVR回歸算法,高斯基RBF核函數,10-fold交叉驗證模式。設置SVR模型參數的取值范圍:懲罰參數c的變化范圍(取以2為底的對數后)為[2-10,210],RBF函數寬度σ的變化范圍(取以 2 為底的對數后)為[2-5,25],損失函數 ε =0.001,SVR 模型輸出為均方誤差MSE和相關系數R。設置ACPSO的參數取值范圍:學習因子c1=1.5,c2=1.7,最大迭代次數 M=200,種群規(guī)模PoP=20。
圖3所示為采用ACPSO對SVR模型參數選擇結果圖。
圖3 基于ACPSO的SVR模型參數優(yōu)化結果圖Fig.3 Optimization results of SVR model based on ACPSO
其中(a)圖是SVR參數初選結果,(b)圖為將參數c和σ的取值范圍依據 (a)圖結果進一步縮小范圍后的精選結果圖。粗選結果:Best Cross Validation MSE=0.000 961 388,Best c=0.29,Best g=2,由圖 3(a),對應 MSE 最小處,重新設置懲罰參數c的變化范圍 (取以2為底的對數后)為[20,210],RBF函數寬度σ的變化范圍(取以2為底的對數后)為[2-2,23],得到最好的 Best c=0.17,Best g=2.5,回歸結果:均方誤差 MSE=1.950 29e-005,相關系數R=99.934 5%。
圖4(a)所示為SVR參數精選過程中ACPSO的適應度曲線,(b)所示為ACPSO-SVR回歸預測的誤差曲線,結果表明基于ACPSO-SVR的預測算法具有良好的回歸能力,對于多變量回歸問題能保證良好的預測精度。
隨著國民經濟的發(fā)展,尤其新能源需求、新材料的不斷涌現,多相催化科學與技術面臨新的挑戰(zhàn),既要從經濟、安全、多功能等方面尋求新型、高效的催化劑,又要從化學進程全局出發(fā)全面考察催化劑的性能。作為催化領域的難點和迫切需要解決的3個關鍵問題:催化劑的動力學關系模型、催化劑的活性關系模型、催化劑的優(yōu)化設計,這無論是對于催化劑對象的特性研究,還是實際化工生產過程控制、優(yōu)化、模擬等都具有重要的現實意義。作者嘗試在碳一催化劑的建模與最優(yōu)化設計中,使用本文提出的非線性系統(tǒng)建模與預測算法,克服傳統(tǒng)催化劑研發(fā)中反復 “試錯”試驗的缺陷,縮短了催化劑研發(fā)的時間,節(jié)約資金和降低時間的消耗,取得了一定的成果。
煤基二甲醚(簡稱DME),在我國富煤、貧油、少氣的能源環(huán)境下,成為優(yōu)先發(fā)展的替代能源。而影響漿態(tài)床二甲醚合成工業(yè)化進程的關鍵因素是催化劑穩(wěn)定性和活性之間的關系。將本文提出的ACPSO-SVR建模與預測方法應用于合成二甲醚多相催化劑實驗室制備中,結合兩種催化劑各自優(yōu)點,尋求一種Cu-Zn-Al-Zr的新配方組分,以及最佳的制備條件,提高CO轉化率和二甲醚的選擇性。
圖4 基于ACPSO-SVR預測算法性能曲線Fig.4 Performance curves of ACPSO-SVR prediction algorithm
圖5所示為基于ACPSO-SVR建模與預測示意圖。以催化劑的組分(Cu-Zn-Al-Zr)和制備條件(溫度、攪拌回流時間、加料方式)作為輸入變量。催化劑性能指標(CO轉化率、二甲醚的選擇性)作為輸出變量,建立Cu-Zn-Al-Zr漿狀催化劑動態(tài)模型,實現預測。
圖5 基于多相催化歷史數據的SVR建模示意圖Fig.5 Configuration of SVR model based heterogeneous catalysis historical data
多相催化過程是個混合過程,過程的優(yōu)化目標屬于多目標優(yōu)化,可以描述為:給定過程的操作變量值或多相催化劑的組分變量值作為輸入變量,以及相應的過程輸出變量值,如催化劑的活性和選擇性、目標產物的轉化率等,尋求輸入變量的最優(yōu)值,使得預先指定的過程性能同時最大,即發(fā)現具有最佳組分或最佳操作條件下的具有最優(yōu)催化性能的最優(yōu)催化劑。
然而,在多相催化領域,獲取催化劑性能評價(活性、選擇性、穩(wěn)定性)非常困難,需要反復的制備、表征,不借助軟計算方法來發(fā)現最優(yōu)組分和最優(yōu)制備條件下的催化劑,其成本和時間耗費難以想象。將訓練好的ACPSO-SVR模型作為最優(yōu)化設計方法中的適應度評價模型,試圖通過ACPSO-SVR最優(yōu)化設計來解決上述多相催化劑實驗室設計問題。
本文提出了一種非線性系統(tǒng)的建模與預測的新方法,該算法理論上具有全局最優(yōu)點,解決了神經網絡方法無法避免的局部最優(yōu)解和網絡結構難以選擇等問題,同時克服了維數災難問題,SVR算法的復雜度與樣本維數無關,具有良好的泛化能力。
仿真結果表明,將ACPSO算法的智能搜索用于ε-SVR支持向量回歸機算法的參數選擇過程中,與K-CV(K-fold cross validation)意義下的窮盡式網格搜索算法(Grid-search Method)相比,能夠在更大的參數空間內,不必遍歷網格內的所有參數點,以較少的搜索次數獲得全局最優(yōu)解,使得SVR算法具有良好的泛化能力和逼近精度。
[1]VAPNIK V.The nature of statistical learning theory[M].New York:Springer,1995.
[2]Burges C J C.A tutorial on support vector machines for pattern recognition[J].Data Mining and Knowledge Discovery,1998(2):121-167.
[3]Cherkassky V,Yunqian M.Practical selection of SVM parameters and noise estimation for SVM regression[J].Neural Networks,2004(17):113-126.
[4]王凌,劉波.微粒群優(yōu)化與調度算法[M].北京:清華大學出版社,2008.
[5]Kennedy J,Eberhart R C.Particle swarm optimization[C]//Proc IEEE International Conference on Neural Networks,Perth, Australiam, Piscataway:IEEE Press,1995:1942-1948.
[6]李兵,蔣慰孫.混沌優(yōu)化方法及其應用[J].控制理論與應用,1997,14 (4):613-615.
LI Bing,JIANG Wei-sun.Chaos optimization method and its application[J].Control Theory&Applications,1997,14(4):613-615.
[7]賈東立,張家樹.基于混沌變異的小生境粒子群算法[J].控制與決策,2007,22(1):117-120.
JIA Dong-li,ZHANG Jia-shu.Niche particle swarm optimization combined with chaotic mutation[J].Control and Decision,2007,22(1):117-120.
Application of adaptive chaos particle swarm optimization and support vector regression for modeling and forecasting of nonlinear system
HAN Xiao-xia, XIE Gang, HAN Xiao-ming, XIE Ke-ming
(College of Information Engineering,Taiyuan University of Technology,Taiyuan030024,China)
An effective relevance prediction algorithm is presented for nonlinear system forecasting and modeling based on adaptive chaos particle swarm optimization and support vector regression,namely ACPSO-SVR method.A heuristic optimization method ACPSO was introduced to automatic selection of hyper-parameters in SVR.The forest fires standard data set of UCI machine learning database was selected to test.The experimental results showed that the new method has high relatively precision and good generalization ability with a wide range of parameter values,better than that of mesh searching algorithm.It could be used as an effective method to solve the problems of multivariate regression predication.Moreover,two main applications were introduced in C1 heterogeneous catalysts yield,obtaining the catalyst composition model and the kinetic model,and building the optimization framework of catalyst development in laboratory.
support vector regression; adaptive chaos particle swarm optimization; modeling; forecasting; C1 heterogeneous catalysts
TP391
A
1674-6236(2012)05-0014-04
2012-01-06稿件編號:201201017
國家自然科學基金(60975032);國家青年科學基金資助(20606022)
韓曉霞(1976—),女,山西忻州神池人,博士,講師。研究方向:智能控制理論與應用,軟計算方法,智能傳感器與檢測技術。