周容卉,趙光興
(安徽工業(yè)大學電氣與信息工程學院,安徽馬鞍山243032)
基于支持向量機的彩色光高溫測量系統(tǒng)建模
周容卉,趙光興
(安徽工業(yè)大學電氣與信息工程學院,安徽馬鞍山243032)
針對實際物體的發(fā)射率方程難以確定,導致彩色光高溫測量過程中建模困難的問題,提出將支持向量機應用于建模過程的方案。研究參數(shù)對支持向量機模型的影響,采用改進的網(wǎng)格搜索算法對參數(shù)進行優(yōu)化,利用優(yōu)化后的最優(yōu)參數(shù)構建支持向量機,得到彩色光高溫測量系統(tǒng)的模型。用實驗室實測數(shù)據(jù)對所建模型預測效果進行驗證,并與采用神經(jīng)網(wǎng)絡方法建立模型的預測結果進行對比。結果表明,基于支持向量機的仿真模型具有較高的精度和泛化能力。
彩色光;高溫測量;支持向量機
彩色光高溫測量是根據(jù)高溫物體發(fā)出的可見光顏色信息與其溫度之間存在的對應關系,實現(xiàn)物體溫度測量的一種非接觸測溫方法。此方法可測溫度范圍大,理論上不存在測溫上限,響應速度快且不破壞被測對象溫度場,因此其在高溫測量領域越來越受到重視[1]。輻射測溫理論均由黑體輻射定律發(fā)展而來,而實際被測物體大多是非黑體,物體發(fā)射率隨溫度變化而變化,因此測溫模型的建立一直是彩色光測溫中的一個難題。
早期的彩色光測溫系統(tǒng)采用機理建模,大多選擇固定光譜發(fā)射率與波長間關系的方法[2-3],需求解大型矩陣方程,并且固定發(fā)射率函數(shù)和實際材料的發(fā)射率很難完全匹配,導致測量誤差較大、建模難度大。隨著人工神經(jīng)網(wǎng)絡理論的發(fā)展,利用神經(jīng)網(wǎng)絡在非線性擬合方面的優(yōu)勢可以建立材料發(fā)射率與波長之間的動態(tài)模型,但是神經(jīng)網(wǎng)絡存在收斂速度慢、易陷入局部最優(yōu)等問題[4-5]。支持向量機(support vector machine,SVM)是一種在統(tǒng)計學理論的基礎上發(fā)展的新型機器學習算法,具有能夠對復雜的非線性關系充分逼近、自適應能力強等特點,可用于多變量、非線性、小樣本建模。根據(jù)有限的樣本信息,在模型復雜度與學習能力之間尋找合適的平衡度,克服過擬合和欠學習問題[6-7]。因此,文中提出采用SVM建立測溫模型,以期解決現(xiàn)有建模方法在彩色光測溫系統(tǒng)中存在精度不高、無法確定發(fā)射率、需大樣本等問題,為彩色光測溫系統(tǒng)建模探索新方法。
任何一個物體,只要其能量高于絕對零度,就會輻射出電磁波。當物體溫度達到600℃左右時,輻射光譜開始進入可見光的紅光波段,物體發(fā)出暗紅色的光;溫度繼續(xù)升高,輻射出更多紅光的同時,增加了少量橙光和黃光;達到1 000℃左右時,這些色光的混合使人眼感知到橙色;而2 000℃左右時,則感知到黃色,溫度繼續(xù)上升,發(fā)出的光譜幾乎包含整個可見光區(qū),最終呈現(xiàn)出“白熱”。
由三基色原理可知,任意顏色都可用紅(R)、綠(G)、藍(B)3種基色按照一定的比例混合得到,因此可采取R,G,B三基色分量對其進行分析。據(jù)此可以通過測量高溫物體輻射光的R,G,B的值來求解高溫物體的溫度t。對于黑體,其輻射的分布可以用普朗克定律來描述
式中:Eb(λ,t)為輻射強度;λ為高溫物體輻射波長;C1為普朗克第一常數(shù);C2為普朗克第二常數(shù)。普朗克定律說明了黑體輻射強度與其輻射頻率和溫度相關。對于非黑體的實際物體輻射測量,傳感器測量輻射量的輸出為
式中:J為傳感器測量信號強度;A為與物理測量裝置參數(shù)相關的幾何量;ε(λ,t,θ,φ,β)為物體光譜發(fā)射率;θ為輻射方向與表面法相的夾角;φ為方位角;β為表面狀態(tài)。物體在溫度t發(fā)出功率為P(λ)的可見光輻射時,描述其色彩的方程為[8]
式中r(λ),g(λ),b(λ)為RGB制中的三刺激值混色曲線。由(3)式可知,物體由于自身輻射表現(xiàn)出來的顏色取決于其光譜輻射。同樣,通過對物體輻射出顏色的測量,可以計算出物體的溫度。根據(jù)輻射和光學成像可以寫出輻射方程:
式中:α為與測量方向有關的參數(shù);u,f,d,m,p為與距離和透鏡有關的參數(shù);τ(λ)為透鏡透過率函數(shù);F(λ)為顏色傳感器的光譜響應函數(shù)。
通過光學成像過程可以同時獲得物體表面溫度場的輻射信息,在傳感器接收輻射信息的過程中,物體發(fā)射率的多變性和復雜性對輻射的測量產(chǎn)生很大的影響。實際物體的輻射包含發(fā)射率和溫度2個未知量,但只能提供1個測量值,所以測量方程不封閉,無法求解[3]。在工程應用中,為了解決方程封閉性問題,大多會假設物體的發(fā)射率為固定模型,如灰性介質(zhì)假設(假設物體發(fā)射率與波長無關)和Hottel模型使測量方程達到封閉。但是假設模型與實際變化的發(fā)射率相差較大,會帶來測量誤差,并不適用于需要準確測量高溫溫度的場合。因此,尋找一種不需假設發(fā)射率模型的建模方法是顏色測溫能否應用于實際高溫測量的決定性因素。
符泰然等[9]對光譜發(fā)射率進行泰勒多項式展開,并引入量綱為一的參數(shù),在窄波段內(nèi)將發(fā)射率函數(shù)改造為波長的線性函數(shù)
式中:Λ=(λ-λ0)/δ,Λ∈(0,1)為量綱為一的波長;α0∈(0,1];α1∈[1,1]。
將式(5)代入式(4),令FR(λ),F(xiàn)G(λ),FB(λ)為顏色傳感器的三原色響應函數(shù);JR,JG,JB為顏色傳感器輸出的測量值;K為傳感器輸出顏色量轉化為標準R,G,B值的修正參數(shù),則可得到關于R,G,B的3個測量方程:
對式(6)進行歸一化處理,得2個互相獨立的方程,化簡后方程可解,但是計算過程復雜。采用SVM算法可簡化模型建立過程,不需求解方程,利用樣本數(shù)據(jù)直接擬合輸入與輸出間的關系。
利用SVM算法直接由測量得到的顏色值和與其對應的溫度數(shù)據(jù)來建立顏色測溫模型。
2.1 建模原理
對于非線性回歸問題,有n個樣本的樣本點集{xi,yi},其中i=1,2,…,n;xi∈Rd,yi∈R;d為自變量個數(shù)。通過一個非線性映射將x轉變?yōu)棣?x),即將輸入空間中的樣本點數(shù)據(jù)映射到高維空間Z(Hilbert空間)中,在這個空間建立線性回歸函數(shù)來擬合樣本點集,這樣,在高維特征空間的線性回歸就對應于低維輸入空間的非線性回歸[10-11]。
用高維特征空間的線性回歸函數(shù) f(x)=<w,φ(x)>+b擬合樣本集,w為權值,b∈R為偏置量,<>為向量內(nèi)積。假設所有樣本都能在精度ε下無誤差進行擬合,根據(jù)統(tǒng)計學理論,優(yōu)化目標為最小化,考慮到擬合誤差,引入非負松弛因子 ξ和 ξ*,則可以將回歸問題轉化為最小化結構風險函數(shù)問題,即其中,c是平衡訓練誤差項權重的參數(shù),即懲罰因子,控制對超出誤差ε樣本的懲罰程度。最小化結構風險函數(shù)問題相應的約束條件為[11]。
導出原始問題的對偶問題,通過Lagrange函數(shù)將約束條件融合到目標函數(shù)中得到L(w,b,α),
即先求L對ω,b的極小,再求L對α的極大。求解對偶問題得到后可得回歸函數(shù),
2.2 核函數(shù)和模型參數(shù)優(yōu)化
SVM核函數(shù)及其參數(shù)選擇沒有形成統(tǒng)一標準,一般憑借經(jīng)驗并根據(jù)實驗對參數(shù)進行選擇。式(10)中<φ(xi),φ(xj)>為核函數(shù)K(xi,xj)。常用核函數(shù)有多項式核函數(shù)、高斯徑向基(RBF)核函數(shù)、sigmoid核函數(shù)等。其中徑向基核與多項式核比較適合非線性建模,且基于徑向基核函數(shù)的支持向量機能夠自動確定核函數(shù)與中心點,所以文中選擇徑向基核函數(shù)[12-13]。
在基于RBF核的支持向量回歸估計中,重要的參數(shù)有c和g。c用來調(diào)節(jié)置信范圍和經(jīng)驗風險的比例,平衡控制機器復雜性和不可分離點數(shù)之間的平衡;g影響樣本在高維特征空間分布的復雜程度,決定輸入空間到特征空間映射的方式。因此,必須得到最優(yōu)的參數(shù)c和g才能建立精度高的模型[14]。文中采用改進的網(wǎng)格搜索算法對模型參數(shù)進行尋優(yōu)。
網(wǎng)格搜索算法[15](Grid SearchAlgorithms,GSA)是一種解決有約束非線性極值問題的原始的數(shù)字規(guī)劃法,按照設定的步長將c和g在其各自空間上劃分為若干網(wǎng)格,對所有網(wǎng)格點取值并利用交叉驗證得到每個取值下訓練集驗證分類的準確率,準確率最高的(c,g)即為所求最佳參數(shù)值。其優(yōu)點是算法簡單,可以同時搜索所需參數(shù),且在尋優(yōu)過程中能夠較好地避免參數(shù)間可能出現(xiàn)的耦合問題。缺點是由于可行域單向逼近使得計算量大,降低了搜索效率。為了提高運行速度和準確率,提出一種改進方法,算法步驟如下。
1)在c,g取值范圍內(nèi)設定較大步距搜索步長,將c和g按照設定步長劃分網(wǎng)格并對所有的點進行樣本集訓練測試,找到準確率最高的c,g值;若有多組c,g同時達到最高,則取其中c值最小的一個。此c值與第一次被搜索到的g值,作為參數(shù)最優(yōu)值(c,g)。
2)減小搜索步長為前次步長的1/2,在步驟1)中得到(c,g)的附近范圍,在此范圍內(nèi)選擇較小的區(qū)間,按照同樣方法進行最優(yōu)值二次搜索。
3)判斷搜索到的參數(shù)最優(yōu)值是否滿足精度要求,若滿足,跳到步驟4),若不滿足,則繼續(xù)進行步驟2),直到所得參數(shù)滿足條件。
4)尋優(yōu)結束,保存最優(yōu)參數(shù)值。
改進的網(wǎng)格搜索算法排除了多數(shù)準確率范圍內(nèi)的搜索,減少了運算,大量降低了運行時間。
3.1 實驗數(shù)據(jù)采集與建模
基于顏色傳感器TCS230和AVR單片機Mega16構建硬件測量裝置,選取實驗室電阻爐XSL-1400-1作為被測對象,用測量裝置獲取輻射色彩信息并輸入計算機,數(shù)據(jù)處理后得到的R,G,B值和對應的t構建成樣本集,用于建模。圖1為彩色光測溫系統(tǒng)結構。
如圖1所示,單片機控制白光LED用作系統(tǒng)白平衡,被測物體發(fā)出的光經(jīng)光學鏡頭投射到顏色傳感器的感光區(qū),經(jīng)單片機控制依次選通紅、綠、藍濾波器通道,測量并運算后分別得到光信號中的R,G,B值,存儲R,G,B值在單片機的數(shù)據(jù)存儲器中,根據(jù)需要送數(shù)碼管顯示或者通過RS485串口與計算機通信傳輸數(shù)據(jù)。
用改進網(wǎng)格優(yōu)化參數(shù)支持向量機(GSA-SV)對彩色光測溫系統(tǒng)建模,步驟如下:
1)將采集到的樣本數(shù)據(jù)進行歸一化處理,分為訓練集和測試集;
2)設定精度ε=0.01,設定參數(shù)范圍c∈(2-8,28),g∈(2-8,28),初始步長為1;
3)采用交叉驗證對訓練樣本進行測試,交叉數(shù)V=5,利用改進的網(wǎng)格搜索法尋找最優(yōu)參數(shù)(c,g);
4)根據(jù)訓練樣本集和最優(yōu)參數(shù)組合建立支持向量機顏色測溫模型;
5)利用建立的模型對測試樣本集進行預測,評估模型的精確度及泛化能力。
3.2 仿真結果與分析
算法在MATLAB中編程實現(xiàn)。測溫系統(tǒng)在外界環(huán)境穩(wěn)定的條件下,采集800~1 300℃之間的70組顏色值,每組樣本測3次,取均值。從中選取50樣本點作為訓練樣本,剩余20樣本作為預測樣本。選擇被測物體輻射顏色信息分量R,G,B作為支持向量機的輸入,以被測物體的溫度t作為支持向量機的輸出,設置支持向量機參數(shù)范圍,導入訓練樣本數(shù)據(jù),交叉數(shù)V=5,ε=0.01,交叉驗證后取其中能使交叉驗證的均方誤差(mean square error,MSE)最小的參數(shù)作為最佳參數(shù)。本實驗尋優(yōu)結果為c=194,g=9.810-4,此時MSE為7.4。圖2是參數(shù)優(yōu)化3D圖。
采用此c,g值建立顏色測溫最優(yōu)預測模型,訓練集建模過程中實際值與預測值的建模結果如圖3。建模成功后,還需用測試樣本集測試模型的推廣能力,將測試樣本集輸入模型中,得到的泛化誤差如圖4。
圖3表明,建立模型的輸出與實際數(shù)據(jù)整體貼合程度很高,只是前幾個樣本數(shù)據(jù)相差較大,隨著溫度的升高,樣本數(shù)據(jù)的被擬合程度越來越高。由圖4可看出,模型應用在測試樣本集中前5個低溫區(qū),樣本誤差也比較大,后面的樣本誤差都在5℃以內(nèi)。造成此結果的原因是在數(shù)據(jù)采集的過程中,測量裝置的距離和外界光干擾等問題造成低溫區(qū)輸出信號微弱而導致測量數(shù)據(jù)產(chǎn)生誤差。
用均方誤差和平方相關系數(shù)來評判模型和實際系統(tǒng)的逼近程度,均方誤差定義為
式中:f(xi)為樣本的估計值;yi為樣本的測量值。GSA-SVM建模的平方相關系數(shù)(Squared Correlation Coefficient,SCC)為0.996,測試得到的RMSE為8.065,即在800~1300℃測溫范圍內(nèi)的測量均方誤差為8℃。
為了說明該方法用于顏色測溫建模的優(yōu)越性,選取BP神經(jīng)網(wǎng)絡作為對比,在同樣的數(shù)據(jù)集上進行建模預測,對比結果如表1。
由表1可知,GSA-SVM建模的平均相對誤差為0.76%,BP神經(jīng)網(wǎng)絡為2.30%,GSA-SVM優(yōu)于BP,而且網(wǎng)絡訓練時間比BP短。綜上可知,GSA算法尋優(yōu)的參數(shù)模型擬合度高,學習能力強。說明GSA-SVM對彩色光測溫系統(tǒng)建模具有更好的應用能力。
表1 模型預測誤差對比Tab.1 Comparison of model prediction error
針對彩色光測溫建模困難的問題,提出一種基于支持向量機的彩色光測溫建模方法,分析尋優(yōu)參數(shù)對支持向量機建模的影響。理論研究和實驗驗證了此方法的可行性,且表明本文方法精度較高。在800~1 300℃的測溫范圍內(nèi),系統(tǒng)建模的平方相關系數(shù)為0.996,測量均方誤差為8℃,平均相對誤差為0.76%。與傳統(tǒng)的輻射測溫技術相比,此方法不需對測量系統(tǒng)進行標定,也不必對發(fā)射率進行修正,且結構簡單、測量精度較高,在高溫測量方面具有較好的應用前景。
[1]王文革.輻射測溫技術綜述[J].宇航計測技術,2005,25(4):20-24.
[2]程曉舫,趙洋.高溫溫度場彩色測量系統(tǒng)的設計[J].儀器儀表學報,2007,27(1):176-179.
[3]王安全.彩色測溫方法的原理研究[D].合肥:中國科學技術大學,2005:56-65.
[4]周黃斌,周永華,朱麗娟.基于BP神經(jīng)網(wǎng)絡顏色單通道溫度測量及比較[J].廣西大學學報(自然科學版),2008,33(6):124-127.
[5]孫曉剛,原桂彬,戴景民.基于遺傳神經(jīng)網(wǎng)絡的多光譜輻射測溫法[J].光譜學與光譜分析,2007,27(2):213-216.
[6]Hsu C W,Chang C C,Lin C J.A practical guide to support vector classification[R]//Technical Report.Department of Computer Science and Information Engineering,National Taiwan University,2003:35-46.
[7]李芳.支持向量機在TE過程故障診斷中的應用[J].安徽工業(yè)大學學報(自然科學版),2010,27(2):195-199.
[8]程曉舫,符泰然,范學良.譜色測溫原理[J].中國科學G輯,2004,34(6):639-647.
[9]符泰然,程曉舫,鐘茂華,等.輻射測溫中光譜發(fā)射率的表征描述[J].光譜學與光譜分析,2008,28(1):1-4.
[10]Glenn M,Fung O L.Mangasarian,multicategory proximal support vector machine classifiers[J].Machine Learning,2005, 59(1):77-97.
[11]Bhatt D,Aggarwal P,Bhattacharya P.An enhanced MEMS error modeling approach based on Nu-support vector regression[J].Sensors,2012,12(12):9448-9466.
[12]Chapelle O,Vapnik V,Bousquet O.Choosing multiple parameters for support vector machines[J].Machine Learning,2002, 46(1):131-159.
[13]耿俊豹,孫林凱,陳是學.支持向量機的混合核函數(shù)參數(shù)優(yōu)選方法[J].計算機應用,2013,33(5):1321-1323.
[14]Keerthi S S,Lin C J.Asymptotic behaviors of support vector machines with Gaussian kernel[J].Neural Computation,2003, 15(7):1667-1689.
[15]王興玲,李占斌.基于網(wǎng)格搜索的支持向量機核函數(shù)參數(shù)的確定[J].中國海洋大學學報,2005,35(5):859-862.
責任編輯:何莉
Colorama High Temperature Measurement System Modeling Based on Support Vector Machine
ZHOU Ronghui,ZHAO Guangxing
(School of Electrical and Information Engineering,Anhui University of Technology,Ma'anshan 243032,China)
In view of the fact that object emissivity equation is difficult to determine,which makes it difficult to establish model in colorama high temperature measurement process,hence,support vector machine was employed to solve this problem.By studying the influence of the parameter selection on support vector machine,an improved grid search algorithm was used to optimize parameters,and with optimized parameters support vector machine was built and colorama high temperature measurement model was obtained.With the real data measured in laboratory,the predicted effect of the proposed model was verified,and the result was compared with that obtained by neural network,which shows that the model based on support vector machine has higher accuracy and better generalization ability.
colorama;high temperature measurement;support vector machine
TP391.9
A
10.3969/j.issn.1671-7872.2015.04.013
2015-01-06
安徽工業(yè)大學創(chuàng)新基金(2013074)
周容卉(1989-),女,安徽阜陽人,碩士生,主要研究方向為光電檢測與控制。
趙光興(1964-),男,安徽繁昌人,博士,教授,主要研究方向為光電檢測與控制、智能儀表開發(fā)。
1671-7872(2015)-04-0366-06