丁學(xué)利 曹文康 李玉葉
(1.阜陽(yáng)職業(yè)技術(shù)學(xué)院基礎(chǔ)教學(xué)部,安徽 阜陽(yáng) 236031;2.赤峰學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,內(nèi)蒙古 赤峰 024000)
顏色與質(zhì)量濃度辨識(shí)的方法目前常用的是比色法[1],即把待測(cè)物質(zhì)制備成溶液后滴在特定的白色試紙表面,等其充分反應(yīng)后獲得1張有顏色的試紙,再把該顏色試紙與標(biāo)準(zhǔn)比色卡進(jìn)行對(duì)比,就可以確定待測(cè)物質(zhì)的質(zhì)量濃度檔位。由于每個(gè)人對(duì)顏色的敏感差異和觀測(cè)誤差,使得這一方法在精度上受到很大影響。隨著照相技術(shù)和顏色分辨率的提高,希望建立顏色讀數(shù)和質(zhì)量濃度的數(shù)學(xué)模型,即只要輸入照片中的顏色讀數(shù)即可獲得待測(cè)物質(zhì)的質(zhì)量濃度。顏色讀數(shù)和質(zhì)量濃度的關(guān)系一般是多元非線性關(guān)系,如何建立它們之間的數(shù)量關(guān)系成為該問(wèn)題研究的重點(diǎn)。多數(shù)研究利用多項(xiàng)式擬合、多元非線性回歸、差值分析和主成分分析等方法建立數(shù)學(xué)模型[2-6]。
此次研究以2017年“高教社杯”全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽C題[7]為例,運(yùn)用相關(guān)性分析和多元非線性逐步回歸分析方法,通過(guò)逐步剔除最不顯著變量,建立最優(yōu)的質(zhì)量濃度與顏色讀數(shù)的數(shù)學(xué)模型。利用該模型可以較好地建立顏色讀數(shù)和質(zhì)量濃度的數(shù)量關(guān)系,也為實(shí)際的質(zhì)量濃度辨識(shí)問(wèn)題提供理論參考。
SO2質(zhì)量濃度和物質(zhì)顏色讀數(shù)的原始數(shù)據(jù),如表1所示[7]。表1中的變量B、G、R、H、S的含義依次為:藍(lán)色顏色值、綠色顏色值、紅色顏色值、色調(diào)、飽和度。
為了分析SO2質(zhì)量濃度與顏色讀數(shù)之間的關(guān)系,對(duì)其進(jìn)行相關(guān)性分析。表2是SO2質(zhì)量濃度與物質(zhì)顏色讀數(shù)的相關(guān)系數(shù)。從表2可看出,SO2質(zhì)量濃度與B、G、R和H的相關(guān)系數(shù)的絕對(duì)值較大,與S的相關(guān)系數(shù)的絕對(duì)值稍小,但S的作用不能忽略。因此認(rèn)為SO2質(zhì)量濃度受B、G、R、S和H等5個(gè)變量的影響。
根據(jù)SO2質(zhì)量濃度和顏色讀數(shù)的相關(guān)性分析,初步考慮建立五元線性回歸模型,稱為模型I,表達(dá)式為:
y=c0+c1x1+c2x2+c3x3+c4x4+c5x5+ε
(1)
式中:x1——藍(lán)色顏色值(B);
x2——綠色顏色值(G);
x3——紅色顏色值(R);
x4——色調(diào)(H);
x5——飽和度(S);
y——SO2質(zhì)量濃度;
c0,c1,c2,c3,c4,c5——回歸系數(shù);
ε——隨機(jī)誤差變量。
表1 SO2質(zhì)量濃度與物質(zhì)顏色讀數(shù)的原始數(shù)據(jù)
表2 SO2質(zhì)量濃度與顏色讀數(shù)的相關(guān)系數(shù)
利用EViews軟件,采用最小二乘法對(duì)模型I進(jìn)行計(jì)算,參數(shù)估計(jì)見(jiàn)表3,方差分析見(jiàn)表4。
表3 模型I最小二乘法參數(shù)估計(jì)
從圖1可看出,雖然模型I通過(guò)逐步回歸后各變量明顯顯著了,但擬合效果較差,說(shuō)明SO2質(zhì)量濃度與各顏色讀數(shù)之間不是簡(jiǎn)單的線性關(guān)系,因此考慮建立五元完全二次多項(xiàng)式回歸模型,稱其為模型II:
表4 模型I最小二乘法方差分析
表5 模型I剔除不顯著變量后的參數(shù)估計(jì)
(2)
式中,b0、b1、b2、b3、b4、b5、bjk(j≥1,k≤5)為回歸系數(shù)。通過(guò)如下變換,可將式(2)的非線性問(wèn)題轉(zhuǎn)化成線性問(wèn)題來(lái)求解。
令z1=x1;z2=x2;z3=x3;z4=x4;z5=x5;
z12=x1x2;z13=x1x3;z14=x1x4;z15=x1x5;
z23=x2x3;z24=x2x4;z25=x2x5;z34=x3x4;
z35=x3x5;z45=x4x5;z11=x1x1;z22=x2x2;
z33=x3x3;z44=x4x4;z55=x5x5。
變換后的方程為:
(3)
利用EViews求解模型II,結(jié)果如表7、8所示。
表6 模型I剔除不顯著變量后的方差分析
圖1 逐步回歸擬合曲線
下面將這些最不顯著項(xiàng)z2、z12、z13和z24依次去掉,作逐步回歸[8-9]分析,得到逐步回歸后的參數(shù)估計(jì)和方差分析,如表9、10所示。
表7 模型II最小二乘法參數(shù)估計(jì)
表8 模型II最小二乘法方差分析
從表9可看出,剔除變量z2、z12、z13、z24后,回歸方程的每一項(xiàng)均在顯著性水平0.05以下,p均小于0.05,說(shuō)明每一項(xiàng)均是顯著的。表10中的F統(tǒng)計(jì)量明顯大于表8中的F統(tǒng)計(jì)量,說(shuō)明通過(guò)逐步回歸后的模型優(yōu)于逐步回歸之前的模型。
為了進(jìn)一步檢驗(yàn)逐步回歸后的模型是否存在異方差,對(duì)逐步回歸后的模型進(jìn)行White檢驗(yàn)[10]。構(gòu)造輔助函數(shù)式(4):
(4)
式中:E——?dú)埐睿?/p>
γ0,γ1,γ2——回歸系數(shù);
ε——隨機(jī)誤差項(xiàng)。
輔助回歸估計(jì)結(jié)果如下:
(5)
根據(jù)非線性逐步回歸分析后的模型可得到原始數(shù)據(jù)散點(diǎn)和逐步回歸后的擬合圖,如圖2所示。從圖2可看出,非線性逐步回歸分析后的模型擬合效果較好。
表9 模型II剔除不顯著變量后的參數(shù)估計(jì)
圖2 非線性逐步回歸擬合曲線
依據(jù)SO2質(zhì)量濃度與顏色讀數(shù),先后建立五元線性回歸模型和五元非線性回歸模型,并不斷檢驗(yàn)和修正SO2質(zhì)量濃度與顏色讀數(shù)間的回歸關(guān)系。通過(guò)變換將非線性回歸模型轉(zhuǎn)化成線性回歸模型,再對(duì)變換后的線性回歸模型作逐步回歸分析,剔除不顯著變量,最終得到最優(yōu)的非線性回歸模型。對(duì)比分析知非線性逐步回歸模型擬合效果較好,且不存在異方差性,因此該模型具有較好的實(shí)用價(jià)值。但是,此次只研究了SO2質(zhì)量濃度與各顏色讀數(shù)之間的多元非線性回歸模型,還可進(jìn)一步研究SO2質(zhì)量濃度與單個(gè)顏色讀數(shù)之間的相關(guān)關(guān)系。
表10 模型II剔除不顯著變量后的方差分析