游晉峰 安 瑩
(晉中師范高等??茖W(xué)校,山西 晉中 030600)
空氣質(zhì)量指標(biāo)是否合格是現(xiàn)在人們關(guān)注的一個(gè)熱點(diǎn)話題之一,尤其是“兩塵四氣”的濃度。國(guó)家監(jiān)測(cè)控制站點(diǎn)(簡(jiǎn)稱“國(guó)控點(diǎn)”)對(duì)它們的濃度進(jìn)行監(jiān)測(cè)。但是由于布控點(diǎn)較少、數(shù)據(jù)發(fā)布滯后時(shí)間長(zhǎng)、花費(fèi)大等缺點(diǎn),無(wú)法實(shí)時(shí)監(jiān)控和預(yù)報(bào)。某公司研發(fā)了一種花費(fèi)小的檢測(cè)儀,不僅可以測(cè)量空氣質(zhì)量,也可對(duì)該地區(qū)的濕度、溫度、降水量、壓強(qiáng)、風(fēng)速進(jìn)行測(cè)量。而它存在的問(wèn)題是傳感器在工作一段時(shí)間后會(huì)因?yàn)榱泓c(diǎn)漂移、量程漂移、非常規(guī)氣態(tài)污染物濃度的變化和氣象因素受到影響,與附近國(guó)控點(diǎn)的數(shù)據(jù)值存在差異。因此,需利用國(guó)控點(diǎn)數(shù)據(jù)對(duì)近鄰的自建點(diǎn)數(shù)據(jù)進(jìn)行校準(zhǔn)。
本文以2019年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽D題“空氣質(zhì)量數(shù)據(jù)的校準(zhǔn)”為背景,首先對(duì)數(shù)據(jù)進(jìn)行了描述性和探索性分析,然后分析了造成自建點(diǎn)數(shù)據(jù)與國(guó)控點(diǎn)數(shù)據(jù)之間存在差異的影響因素,并建立了基于多元多項(xiàng)式回歸的空氣質(zhì)量數(shù)據(jù)校準(zhǔn)模型,為空氣質(zhì)量數(shù)據(jù)校準(zhǔn)提供了可行的辦法。
題目要求對(duì)自建點(diǎn)數(shù)據(jù)與國(guó)控點(diǎn)數(shù)據(jù)進(jìn)行探索性分析。而探索性分析是在描述性分析的基礎(chǔ)上,對(duì)數(shù)據(jù)分布特征的詳細(xì)分析[1-2]。為更清晰地分析數(shù)據(jù)的分布特征,利用題目所給數(shù)據(jù)繪制了散點(diǎn)圖和箱形圖,并計(jì)算了月均值、方差、眾數(shù)等。
為準(zhǔn)確觀察數(shù)據(jù)的分布特征,利用Excel的繪圖功能,對(duì)國(guó)控點(diǎn)和自建點(diǎn)的“兩塵四氣”數(shù)據(jù)繪制了散點(diǎn)圖,如圖1和圖2。
通過(guò)觀察所給“兩塵四氣”的濃度值隨時(shí)間的變化趨勢(shì)發(fā)現(xiàn),國(guó)控點(diǎn)數(shù)據(jù)和自建點(diǎn)數(shù)據(jù)都在量程范圍[3]內(nèi),沒(méi)有異常數(shù)據(jù)。故不需要對(duì)數(shù)據(jù)進(jìn)行清理。
查閱資料發(fā)現(xiàn),影響空氣質(zhì)量數(shù)據(jù)的因素,可能是空氣、溫度、濕度、風(fēng)等自然因素,也可能是尾氣、煙塵、工廠排放、節(jié)假日煙花爆竹和人員流動(dòng)等人為因素影響,所以監(jiān)測(cè)得到的數(shù)據(jù)有波動(dòng)。
為了更好地觀察國(guó)控點(diǎn)與自建點(diǎn)之間的關(guān)系,利用Excel中的AVERAGE函數(shù)求出了2018年11月-12月、2019年1月-6月二者的“兩塵四氣”濃度值的月均值,并且利用繪圖功能做出了相應(yīng)的折線統(tǒng)計(jì)圖,如圖3。
通過(guò)觀察圖3可以知道,二者的月均值數(shù)據(jù)有一定的差異,但是趨勢(shì)走向大致相同。PM2.5 、PM10和NO2自建點(diǎn)的月均值基本比國(guó)控點(diǎn)的都要高,CO自建點(diǎn)的月均值比國(guó)控點(diǎn)的要低,同時(shí)可以知道國(guó)控點(diǎn)監(jiān)測(cè)的SO2均值在2019年1月之前比自建點(diǎn)監(jiān)測(cè)的高,國(guó)控點(diǎn)監(jiān)測(cè)的O3均值在2019年2月之前比自建點(diǎn)監(jiān)測(cè)的低。
利用Excel中的VARPA函數(shù)對(duì)國(guó)控點(diǎn)與自建點(diǎn)的“兩塵四氣”濃度值進(jìn)行了求方差,并繪制出了對(duì)應(yīng)的折線統(tǒng)計(jì)圖,如圖4。
圖1 國(guó)控點(diǎn)“兩塵四氣”濃度值的散點(diǎn)圖
圖2 自建點(diǎn)“兩塵四氣”濃度值的散點(diǎn)圖
圖3 國(guó)控點(diǎn)與自建點(diǎn)的“兩塵四氣”濃度值的月均值比對(duì)
圖4 國(guó)控點(diǎn)與自建點(diǎn)的“兩塵四氣”濃度值的方差比對(duì)
從圖4可以知道,各空氣質(zhì)量數(shù)據(jù)的方差除在個(gè)別時(shí)期的差值較大外,其余都相差較小。
為有效地觀測(cè)某一時(shí)間段內(nèi)兩個(gè)監(jiān)測(cè)點(diǎn)數(shù)據(jù)之間出現(xiàn)最頻繁的值是否一致,利用Excel中MODE函數(shù)對(duì)兩個(gè)監(jiān)測(cè)點(diǎn)監(jiān)測(cè)到的數(shù)據(jù)進(jìn)行了求眾數(shù)。
圖5 國(guó)控點(diǎn)與自建點(diǎn)的“兩塵四氣”濃度值的眾數(shù)比對(duì)
觀察圖5發(fā)現(xiàn),在同一時(shí)間段內(nèi)兩個(gè)檢測(cè)點(diǎn)所監(jiān)測(cè)數(shù)據(jù)中出現(xiàn)次數(shù)最頻繁的數(shù)據(jù)值大致相等。特別地,國(guó)控點(diǎn)與自建點(diǎn)O3的數(shù)據(jù)相差值過(guò)大,其值可能在監(jiān)測(cè)的過(guò)程中誤差較大。
為了直觀地看出國(guó)控點(diǎn)數(shù)據(jù)與自建點(diǎn)數(shù)據(jù)的中位數(shù)、最大值和最小值,利用Excel 2016的繪圖功能,制作了箱形圖。
圖6 國(guó)控點(diǎn)與自建點(diǎn)的“兩塵四氣”濃度值的平均值的箱形圖
根據(jù)圖6,能夠看出國(guó)控點(diǎn)與自建點(diǎn)數(shù)據(jù)的最大值、最小值和中位數(shù)之間的大小。
要對(duì)導(dǎo)致國(guó)控點(diǎn)與自建點(diǎn)數(shù)據(jù)造成差異的因素進(jìn)行分析,從各方面對(duì)比兩個(gè)監(jiān)測(cè)點(diǎn)的數(shù)據(jù),為使結(jié)果準(zhǔn)確,在Excel中繪制了日均值折線統(tǒng)計(jì)圖。不僅如此,也利用SPSS軟件中的pearson相關(guān)系數(shù),對(duì)各數(shù)據(jù)之間的相關(guān)性[4-5]進(jìn)行了分析。
觀察1.2節(jié)繪制出的月均值折線圖,并不能準(zhǔn)確地反映各值每天的詳細(xì)變化趨勢(shì)、以及自建點(diǎn)與國(guó)控點(diǎn)之間的詳細(xì)差異。因此,對(duì)每天的日均值數(shù)據(jù)進(jìn)行了分析。
圖7 2018年11月“兩塵四氣”日均值比對(duì)
以2018年11月和2019年5月“兩塵四氣”濃度值的日均值對(duì)比圖為例,如圖7和圖8,發(fā)現(xiàn)國(guó)控點(diǎn)與自建點(diǎn)數(shù)據(jù)的趨勢(shì)走向大致相同,但由于影響因素的存在而有偏差。
為了找出對(duì)國(guó)控點(diǎn)數(shù)據(jù)與自建點(diǎn)數(shù)據(jù)造成差異的因素,用SPSS軟件對(duì)其進(jìn)行數(shù)據(jù)分析。在選擇相關(guān)性的計(jì)算中,由于spearman相關(guān)系數(shù)不容易檢測(cè)出兩者事實(shí)上存在的相關(guān)關(guān)系、kendall’stau-b相關(guān)系數(shù)適用于兩個(gè)變量均為有序分類,所以選擇了pearson相關(guān)系數(shù)對(duì)自建點(diǎn)數(shù)據(jù)和國(guó)控點(diǎn)數(shù)據(jù)與溫度、濕度、風(fēng)速、氣壓、降水量的相關(guān)性進(jìn)行探索。
圖9給出了2018年11月“兩塵四氣”濃度值數(shù)據(jù)的相關(guān)性分析,觀察發(fā)現(xiàn):
1)PM2.5與PM10正強(qiáng)相關(guān),與濕度正強(qiáng)相關(guān);
2)PM10與CO 負(fù)相關(guān),與濕度正相關(guān);
3)CO與O3負(fù)強(qiáng)相關(guān),與風(fēng)速正相關(guān),與降水量負(fù)相關(guān),與溫度負(fù)相關(guān);
4)NO2與降水量正強(qiáng)相關(guān);
5)O3與風(fēng)速負(fù)相關(guān),與壓強(qiáng)負(fù)相關(guān),與溫度正相關(guān)。
類似地,觀察其他月份的數(shù)據(jù),可以發(fā)現(xiàn):
1)PM2.5與PM10、NO2、CO、SO2、濕度正強(qiáng)相關(guān),與風(fēng)速負(fù)強(qiáng)相關(guān),與溫度負(fù)相關(guān);與降水量正相關(guān)或正強(qiáng)相關(guān);
2)PM10與NO2正強(qiáng)相關(guān);與濕度、降水量、SO2正相關(guān)或正強(qiáng)相關(guān),與風(fēng)速、溫度負(fù)相關(guān),與壓強(qiáng)負(fù)強(qiáng)相關(guān),與CO負(fù)相關(guān)或正強(qiáng)相關(guān),與O3正強(qiáng)相關(guān)和負(fù)強(qiáng)相關(guān);
3)CO與O3負(fù)強(qiáng)相關(guān)或正相關(guān),與風(fēng)速、壓強(qiáng)正相關(guān)或正強(qiáng)相關(guān),與降水量、NO2負(fù)相關(guān),與濕度負(fù)強(qiáng)相關(guān),與溫度負(fù)強(qiáng)相關(guān)或負(fù)相關(guān);
4)NO2與SO2風(fēng)速負(fù)相關(guān),與O3正強(qiáng)相關(guān),與降水量、溫度正強(qiáng)相關(guān)或負(fù)強(qiáng)相關(guān),與濕度正強(qiáng)相關(guān)或正相關(guān),與壓強(qiáng)負(fù)強(qiáng)相關(guān)或負(fù)相關(guān);
5)O3與風(fēng)速、壓強(qiáng)負(fù)強(qiáng)相關(guān)或負(fù)相關(guān),與溫度正強(qiáng)相關(guān)或正相關(guān),與降水量正強(qiáng)相關(guān),與濕度正相關(guān);
6)SO2與濕度正強(qiáng)相關(guān),與溫度負(fù)強(qiáng)相關(guān)或負(fù)相關(guān),與風(fēng)速正強(qiáng)相關(guān),與O3負(fù)強(qiáng)相關(guān)或正強(qiáng)相關(guān)。
圖8 2019年5月“兩塵四氣”日均值比對(duì)
圖9 2018年11月數(shù)據(jù)的相關(guān)性分析
利用SPSS軟件的基于最小二乘法的多元多項(xiàng)式回歸[6],將各月每天的國(guó)控點(diǎn)數(shù)據(jù)作為因變量,記作Y,相應(yīng)的自建點(diǎn)的空氣質(zhì)量數(shù)據(jù)和天氣數(shù)據(jù)作為自變量,記作X,利用最小二乘法對(duì)系數(shù)矩陣A進(jìn)行多元多項(xiàng)式Y(jié)=AX的系數(shù)矩陣A進(jìn)行回歸分析,并計(jì)算預(yù)測(cè)值。
求解得到2018年12月的各空氣質(zhì)量數(shù)據(jù)的擬合結(jié)果如下(圖10):
1)2018年12月PM2.5的擬合結(jié)果(圖11)
圖10 2018年12月PM2.5的校準(zhǔn)系數(shù)
圖11 2018年12月PM2.5的擬合度
2018年12月PM2.5的校準(zhǔn)方程為:
F1=0.614PM2.5+0.014PM10+41.218CO+0.045NO2+0.073SO2-1.546O3-40.003E1+0.649P1-0.105J1+1.103W1-0.337S1-498.349
2)2018年12月PM10的擬合結(jié)果(圖12、圖13)
2018年12月PM10的校準(zhǔn)方程為:
F2=1.144PM2.5-0.221PM10-98.981CO-0.296NO2+4.434SO2-2.295O3-73.696E1+1.205P1-0.111J1+7.018W1-1.624S1-847.926
圖12 2018年12月PM10的校準(zhǔn)系數(shù)
圖13 2018年12月PM10的擬合度
3)2018年12月CO的擬合結(jié)果(圖14、圖15)
圖14 2018年12月CO的校準(zhǔn)系數(shù)
圖15 2018年12月CO的擬合度
2018年12月CO的校準(zhǔn)方程為:
F3=0.002PM10+1.794CO-0.008NO2+0.039SO2-0.020O3-0.666E1+0.012P1+0.001J1+0.058W1-0.005S1-10.901
4)2018年12月NO2的擬合結(jié)果(圖16、圖17)
圖16 2018年12月NO2的校準(zhǔn)系數(shù)
圖17 2018年12月NO2的擬合度
2018年12月NO2的校準(zhǔn)方程為:
F4=-0.014PM2.5+0.008PM10+18.022CO+0.117NO2-0.218SO2-0.068O3+0.309E1-0.082P1-0.457W1-0.104S1+93.214
5)2018年12月SO2的擬合結(jié)果(圖18、圖19)
圖18 2018年12月SO2的校準(zhǔn)系數(shù)
圖19 2018年12月SO2的擬合度
2018年12月SO2的校準(zhǔn)方程為:
F5=1.957PM2.5-0.966PM10-27.648CO-0.480NO2+0.217SO2+0.228O3-59.478E1+0.174P1+0.32J1+1.238W1-0.557S1-34.960
6)2018年12月O3的擬合結(jié)果(圖20、圖21)
圖20 2018年12月O3的校準(zhǔn)系數(shù)
圖21 2018年12月O3的擬合度
2018年12月O3的校準(zhǔn)方程為:
F6=-2.189PM2.5+1.180PM10-48.981CO-0.385NO2-0.132SO2+0.244O3+21.224E1-0.644P1+0.006J1-1.789W1+0.203S1+700.076
利用SPSS軟件,可以求解得到2018年11月和2019年1-6月各空氣質(zhì)量數(shù)據(jù)的擬合結(jié)果。下面給出了所有數(shù)據(jù)回歸分析的擬合度,如圖22:
圖22 “兩塵四氣”多項(xiàng)式回歸的擬合度
2019年2月,SO2的多項(xiàng)式回歸的擬合度最低,為0.6;
2018年12月,NO2和O3的多項(xiàng)式回歸的擬合度較低;
2019年1月,O3的多項(xiàng)式回歸的擬合度較低;
2019年4月,CO和SO2的多項(xiàng)式回歸的擬合度較低;
2019年5月,CO的多項(xiàng)式回歸的擬合度較低。
本文分析了自建點(diǎn)數(shù)據(jù)與國(guó)控點(diǎn)數(shù)據(jù)的特征,通過(guò)對(duì)二者造成差異的因素分析,對(duì)自建點(diǎn)數(shù)據(jù)進(jìn)行了校準(zhǔn)。由于題目數(shù)據(jù)較大,采用了每天數(shù)據(jù)的平均值進(jìn)行分析。
但是,日照時(shí)長(zhǎng)、早晚溫度等都會(huì)對(duì)空氣質(zhì)量數(shù)據(jù)造成影響。而每天24小時(shí)內(nèi),這些值都可能在變化,比如早晚溫度差等。因此,可以利用國(guó)控點(diǎn)每小時(shí)的數(shù)據(jù)對(duì)自建點(diǎn)的數(shù)據(jù)進(jìn)行校準(zhǔn),尤其是擬合度不高的數(shù)據(jù)。
另外,本文采用的是多元線性回歸,為考慮因素之間的交叉影響,可進(jìn)一步研究因素之間的交叉影響,利用多元非線性回歸進(jìn)行更準(zhǔn)確的數(shù)據(jù)校準(zhǔn)。
山東商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào)2020年6期