劉 令 郭正堯 李示威 程東海 李 昊 劉桂國 楊洪壯 黃 元
(吉林建筑大學(xué),長春 130118)
生活中,我們經(jīng)常需要測量某一物質(zhì)的濃度,比色法是目前檢測物質(zhì)濃度較為常用的一種方法,即把待測物質(zhì)制成溶液滴在特定的白色試紙表面,再把該試紙與一個(gè)標(biāo)準(zhǔn)比色卡進(jìn)行比對,就可以確定待測物質(zhì)的濃度,但此法需要用肉眼觀測,致使精確度太低,伴隨著顏色分辨率和照相技術(shù)的逐步提高,我們可以相對準(zhǔn)確地得到待測物質(zhì)的顏色分量(紅、綠、藍(lán)、色調(diào)、飽和度),最終確定待測物質(zhì)的濃度.
在回歸分析中,如果有兩個(gè)或兩個(gè)以上自變量,就稱為多元回歸.本文討論物質(zhì)濃度與5個(gè)顏色分量的關(guān)系,我們考慮到由多個(gè)自變量的最優(yōu)組合共同來預(yù)測物質(zhì)濃度,比只用一個(gè)自變量進(jìn)行預(yù)測更有效,更符合實(shí)際,故本文采用多元回歸模型解決問題.
設(shè)無量綱物質(zhì)濃度為y,無量綱顏色分量為xi(i=1,2,3,4,5),顏色分量系數(shù)為βi(i=1,2,3,4,5),計(jì)算后的無量綱截距為β0,多元回歸模型的一般表現(xiàn)形式為:
y=β0+β1x1+β2x2+β3x3+β4x4+β5x5
為了得到物質(zhì)各濃度所對應(yīng)顏色分量的讀數(shù),本文采用綠紅藍(lán)(Green red blue,英文縮寫為GRB)圖像顏色檢測技術(shù),即可以得到綠紅藍(lán)3種顏色分量的讀數(shù),然后通過色空間轉(zhuǎn)換算法[3]可以得到色調(diào)和飽和度兩種顏色分量的讀數(shù),將顏色分量的數(shù)據(jù)導(dǎo)入MATLAB中,得到無量綱截距和顏色分量系數(shù)(見表1).
表1 各物質(zhì)通過回歸模型確定的回歸系數(shù)Table 1 Regression coefficient determined by linear regression model for eachsubstance
截距為各種物質(zhì)的最小覆蓋濃度,當(dāng)物質(zhì)濃度達(dá)到此值時(shí),顏色讀數(shù)等于0(溶液的透光性為0),不會(huì)隨著濃度的提高發(fā)生明顯的變化,表1中β1至β5數(shù)值為各顏色讀數(shù)的回歸系數(shù),由這些數(shù)據(jù)可得到相應(yīng)物質(zhì)的回歸方程,即多元回歸模型,現(xiàn)以二氧化硫?yàn)槔?其形式為:
y=2 150.8-7.2x1-7.4x2+0.2x3+0.5x4+4.0x5
(1)
其他物質(zhì)也可以用同樣的方法得出函數(shù)表達(dá)式.
本文利用殘差(在數(shù)理統(tǒng)計(jì)中是指實(shí)測值與計(jì)算值之間的差)分析法判斷數(shù)據(jù)的優(yōu)劣,將數(shù)據(jù)導(dǎo)入MATLAB中,用多元回歸分析函數(shù)Regress導(dǎo)出濃度和五個(gè)顏色分量的關(guān)系式,得到殘差函數(shù)Rcoplot,然后輸出函數(shù)的數(shù)據(jù)殘差圖.
圖1 硫酸鋁鉀殘差Fig.1 Residual of potassium aluminum sulfate
圖2 溴酸鉀殘差Fig.2 Residual of potassium bromat
用箭頭指出的是誤差較大的點(diǎn),沒有標(biāo)注的是合理數(shù)據(jù)的殘差圖,線長代表了每點(diǎn)的置信區(qū)間.置信區(qū)間越小,說明有效性越好,若含零點(diǎn),說明結(jié)果無效.
利用殘差分析法并結(jié)合圖1與圖2,可以清楚地看出硫酸鋁鉀與溴酸鉀對比,硫酸鋁鉀的置信區(qū)間小,所以硫酸鋁鉀的數(shù)據(jù)更好,可靠性更高.
本文進(jìn)一步對多元回歸模型進(jìn)行誤差分析,先將數(shù)據(jù)[4]導(dǎo)入MATLAB,然后根據(jù)(1)式計(jì)算出預(yù)測濃度值,并導(dǎo)入MATLAB中,得到圖3.
圖3 二氧化硫的實(shí)測值與計(jì)算值Fig.3 Measured yalue and calculated value for sulfur dioxide
圖3中加號代表實(shí)測點(diǎn),折線代表(1)式的圖像,這幅對比圖有助于直觀地觀測計(jì)算值與實(shí)測值之間的聯(lián)系與差異.從圖3可以看出,通過該模型求出的計(jì)算值與實(shí)測值非常接近,但仍然存在誤差.為了檢驗(yàn)?zāi)P团c數(shù)據(jù)[4]的擬合程度,本文采取擬合優(yōu)度檢驗(yàn)法[5]來說明擬合度,構(gòu)造一個(gè)表征擬合程度的指標(biāo)R2,統(tǒng)計(jì)量R2定義為:
式中,S1(總變差平方和)是各個(gè)實(shí)測值與樣本均值之差的平方和,S2(殘差平方和)是總變差平方和中不符合(1)式的部分.
根據(jù)MATLAB求出R2等于0.975 3,R2越接近于1,表示模型擬合程度越高,由此看出所求的模型合理,可以推廣使用.
經(jīng)過全文論述可知,運(yùn)用多元回歸模型可得出二氧化硫的濃度與顏色分量的關(guān)系式,可以較為準(zhǔn)確地得出二氧化硫的濃度,由最小覆蓋濃度的大小可知物質(zhì)透光性的強(qiáng)弱,諸如硫酸鋁鉀,溴酸鉀等其他物質(zhì)也可通過這種方法得到相應(yīng)的結(jié)果,體現(xiàn)了多元回歸模型廣闊的應(yīng)用前景.