国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

城市空氣污染數(shù)據(jù)的分析與研究

2016-03-14 06:51:08楊小雷湯鳳香
高師理科學(xué)刊 2016年12期
關(guān)鍵詞:二階方差空氣質(zhì)量

楊小雷,湯鳳香

(佳木斯大學(xué) 理學(xué)院,黑龍江 佳木斯 154007)

城市空氣污染數(shù)據(jù)的分析與研究

楊小雷,湯鳳香

(佳木斯大學(xué) 理學(xué)院,黑龍江 佳木斯 154007)

針對日益嚴(yán)重的大氣污染問題,基于現(xiàn)有數(shù)據(jù)與相關(guān)研究,采用相關(guān)分析法,對AQI指標(biāo)之間的相關(guān)性進(jìn)行了定量分析.利用主成分分析,確定PM10為被解釋變量,其它4種污染物為解釋變量,應(yīng)用逐步回歸分析方法及多元回歸分析,通過逐層分析比較得到了PM10與PM2.5,CO,SO2,NO2的最優(yōu)二次回歸模型.

空氣污染;相關(guān)分析;主成分分析;逐步回歸分析

1 問題背景

1.1 問題的提出

近年來,隨著城市空氣污染的加劇以及廣大民眾對生活環(huán)境與質(zhì)量要求的日益提高,空氣質(zhì)量(AQI)越來越受到廣大民眾與政府相關(guān)部門的重視.AQI主要指標(biāo)有PM10,PM2.5,CO,NO2,SO2,探究這些污染物之間關(guān)系對空氣污染的治理具有一定的現(xiàn)實意義.

1.2 模型假設(shè)

假設(shè)1 監(jiān)測數(shù)據(jù)是用統(tǒng)一的設(shè)備配置與標(biāo)準(zhǔn)獲得的;

假設(shè)2 所有空氣質(zhì)量數(shù)據(jù)的誤差均相互獨立,并且服從正態(tài)分布

假設(shè)3 空氣質(zhì)量的5個指標(biāo),其監(jiān)測是相互獨立的.

1.3 符號說明

本文中2σ為方差;α為顯著性水平,一般設(shè)為0.05或更小,本文設(shè)為0.01;y表示PM10的值;x1表示PM2.5的值;x2表示CO的值;x3表示NO2的值;x4表示SO2的值.

2 模型求解

2.1 預(yù)備知識

2.1.1 相關(guān)分析 在直線相關(guān)條件下,相關(guān)系數(shù)是2個變量x和y之間相關(guān)關(guān)系的方向和密切程度的綜合性指標(biāo)[1],記為r,則有

其中:n為樣本容量;r取正值或負(fù)值決定于分子協(xié)方差;r的絕對值在0與1之間,其絕對值大小可說明現(xiàn)象之間相關(guān)關(guān)系的緊密程度,具體標(biāo)準(zhǔn)為:當(dāng)時,變量x和y沒有關(guān)系;當(dāng)時,變量x和y低程度相關(guān);當(dāng)時,變量x和y呈顯著相關(guān);當(dāng)時,變量x和y呈高度相關(guān).

2.1.2 主成分分析 主成分分析也稱主分量分析[2-3],旨在利用降維的思想(本文利用其性質(zhì)即貢獻(xiàn)率)把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo).

具體分析步驟為:

Step3 對m個主成分進(jìn)行綜合評價.對m個主成分進(jìn)行加權(quán)求和,即得最終評價值,權(quán)數(shù)為每個主成分的方差貢獻(xiàn)率.

Step4 求KMO測度.

該方法是SPSS提供的判斷原始變量是否適合作主成分分析的統(tǒng)計檢驗方法之一,它比較了觀測到的原始變量間的相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小.一般而言,KMO測度大于0.5意味著因子分析可以進(jìn)行,當(dāng)KMO的測度大于0.7時,則其是令人滿意的值.

對于n組獨立觀測值,設(shè),其中:相互獨立.設(shè)最小二乘法就是選擇β0和β1的估計和,使得,而此時yi所對應(yīng)的值稱為回歸值,記為.

回歸直線與各觀測點的接近程度稱為回歸直線對數(shù)據(jù)的擬合優(yōu)度.為了說明直線的擬合優(yōu)度,引進(jìn)判定系數(shù)

(2)當(dāng)R2=1時,原始數(shù)據(jù)的總變異完全可以由擬合值的變異來解釋,并且殘差為零,即擬合點與原始數(shù)據(jù)完全吻合;

(3)當(dāng)R2=0時,回歸方程完全不能解釋原始數(shù)據(jù)的總變異.

判定系數(shù),一方面反映了解釋的變異占總變異的百分比,從而說明回歸直線擬合的優(yōu)良程度;另一方面,它從相關(guān)性的角度,說明原因變量y與擬合變量的相關(guān)程度,從這個角度看,擬合變量與原變量y的相關(guān)度越大,擬合直線的優(yōu)良度就越高.

2.1.4 多元回歸分析 多元回歸分析可以看成是一元線性回歸分析的擴(kuò)展[5].多重判定系數(shù)2R是多元回歸中回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個統(tǒng)計量,反映在因變量y的變差中被估計的回歸方程所解釋的比例.

對于多重判定系數(shù)有一點需要注意:給模型增加自變量時,多重判定系數(shù)也隨之增大,然而多重判定系數(shù)的代價是殘差自由度的減少,因為殘差自由度等于樣本個數(shù)與自變量個數(shù)之差.自由度小意味著估計和預(yù)測的可靠性低.這表明,當(dāng)一個回歸方程涉及的自變量很多時,回歸模型的擬合從表面上看是良好的,而區(qū)間預(yù)測和區(qū)間估計的幅度卻變大,以致失去實際意義.為此,利用樣本量n和自變量的個數(shù)k去調(diào)整,計算出調(diào)整的多重判定系數(shù),記為,其計算公式為

2.2 數(shù)據(jù)的預(yù)處理與被解釋變量的確定

2.2.1 數(shù)據(jù)的處理與相關(guān)分析模型的求解 本文采用廣東省東莞、深圳和廣州3個地區(qū)從2014-06-01—2015-05-31的空氣質(zhì)量監(jiān)測數(shù)據(jù).由于收集的數(shù)據(jù)有缺漏,存在一些缺省值,所以在分析時首先利用SPSS對其缺省值進(jìn)行了直接剔除,得到可用于統(tǒng)計分析的數(shù)據(jù)集(見表1)(由于篇幅限制,僅示意性列出最前2次與最后1次觀測值).3個城市的空氣質(zhì)量數(shù)據(jù)經(jīng)預(yù)處理后,由SPSS Pearson[6-8]求得AQI的5種指標(biāo)之間的相關(guān)矩陣表(見表2).

表1 廣東省東莞、深圳和廣州3個地區(qū)空氣污染數(shù)據(jù)

表2 5種空氣質(zhì)量指標(biāo)間的相關(guān)矩陣

由表2可以看出,聯(lián)系最為緊密的監(jiān)測指標(biāo)組依次為:(PM2.5,PM10),(PM10,NO2),(PM10,CO),(PM2.5,NO2),且PM10與PM2.5間相關(guān)系數(shù)為0.929,呈高度正相關(guān),且相關(guān)系數(shù)相對較大;PM10與CO,NO2,SO2間相關(guān)系數(shù)分別為0.683,0.706,0.572,呈顯著正相關(guān),且除了SO2與CO之間的相關(guān)系數(shù)低于0.572以外,其余各指標(biāo)之間相關(guān)系數(shù)均超過0.572,且均在α=0.01水平上顯著,因此各指標(biāo)之間顯著相關(guān).

2.2.2 運用主成分分析求解AQI的被解釋變量 利用主成分分析法對AQI中5項監(jiān)測指標(biāo)求解KMO,進(jìn)行Bartlett的檢驗,并求取解釋的總方差(見表3~4).

表3 KMO和Bartlett的檢驗

表4 解釋的總方差

由表3可以看出,KMO測度為0.805>0.7,表示變量之間的相關(guān)性很好;而Bartlett球形度檢驗中的顯著性水平值為0,達(dá)到了極其顯著水平,這表明原變量之間具有明顯的結(jié)構(gòu)性和相關(guān)性,可以進(jìn)行主成分分析.

由表4可以看出,PM10的特征值為3.476,方差貢獻(xiàn)率為69.523%,是方差貢獻(xiàn)率最大的一個主成分.因此,可以確定PM10為被解釋變量,PM2.5,NO2,CO,SO2為解釋變量.

2.3 求解PM10最優(yōu)回歸模型

2.3.1 PM10與PM2.5,CO,NO2,SO2多元一次及二次線性回歸模型求解 由于PM10與PM2.5,CO,NO2,SO2等指標(biāo)之間具有一定的相關(guān)性和獨立性,應(yīng)用Matlab的regress(Y,X,α)函數(shù)[9],對多個候選回歸模型進(jìn)行逐步回歸,分別求得多元一次回歸方程

與多元二次方程

2.3.2 PM10與PM2.5,CO,NO2,SO2多元二階多項式回歸模型求解 考慮到兩兩因素之間的交互關(guān)系,應(yīng)用Matlab對PM10的多元二階多項式回歸模型進(jìn)行求解,得

3 模型評價

3.1 模型的優(yōu)點

(1)通過逐層比較,建立了相對優(yōu)化的多元二階多項式回歸模型,得出了令人滿意的結(jié)果;

(2)通過所求多元二階多項式回歸模型的置信區(qū)間可以用來判斷一些數(shù)據(jù)的真實性;

(3)利用多元二階多項式回歸模型可以通過控制變量來預(yù)測某一數(shù)據(jù)或數(shù)據(jù)走勢;

(4)可以做出關(guān)于PM10的多元二階非線性回歸模型(3)的殘差分析圖,直觀感受模型的擬合程度;

(5)所有樣本信息結(jié)合在一起分析,增加了分析的可靠性.

3.2 模型的缺點

(1)通過網(wǎng)絡(luò)搜集到的數(shù)據(jù)本身可能存在不真實性,從而導(dǎo)致建立的模型不能準(zhǔn)確地辨別出不真實的數(shù)據(jù);

(2)由于地域差異性的存在,使得建立的模型不能適應(yīng)所有地區(qū)的空氣質(zhì)量數(shù)據(jù);

(3)PM10與PM2.5,CO,NO2,SO2的多元高階回歸模型可能效果更佳,因此還可以繼續(xù)探究PM10與PM2.5,CO,NO2,SO2的多元高階關(guān)系.

[1]賈俊平,何曉群,金勇進(jìn).統(tǒng)計學(xué)[M].北京:中國人民大學(xué)出版社,2012:30-31

[2]張志涌.MATLAB教程[M].北京:北京航空航天大學(xué)出版社,2010:20-25

[3]杜強(qiáng),賈麗艷.SPSS統(tǒng)計分析從入門到精通[M].北京:人民郵電出版社,2011:18-20

[4]何曉群,劉文卿.應(yīng)用回歸分析[M].北京:中國人民大學(xué)出版社,2015:48-55

[5]何曉群.多元統(tǒng)計分析[M].北京:中國人民大學(xué)出版社,2004:21-23

[6]謝志英,劉浩,唐新明.北京市近12年空氣污染變化特征及其與氣象要素的相關(guān)性分析[J].環(huán)境工程學(xué)報,2015,9(9):4471-4478

[7]鄧霞君,廖良清,胡桂萍.近10年中國主要城市空氣API及與氣象因子相關(guān)性分析[J].環(huán)境科學(xué)與技術(shù),2013,36(9):70-75

[8]楊光霞,謝華.SPSS數(shù)據(jù)統(tǒng)計與分析[M].北京:清華大學(xué)出版社,2014:54-60

[9]司守奎,孫璽菁.數(shù)學(xué)建模算法與應(yīng)用[M].北京:國防工業(yè)出版社,2012:45-50

Analysis and study of urban air pollution data

YANG Xiao-lei,TANG Feng-xiang
(School of Science,Jiamusi University,Jiamusi 154007,China)

Aiming at increasingly serious air pollution problems,use correlation analysis to make an quantitative analysis for the correlation between the AQI indicators based on existing data and the related research, and principal component analysis is used to determine that PM10is the explained variable,the other four kinds of pollutants are explained variable.Using stepwise regression analysis method and multiple regression analysis,through analysis step by step and comparison get the optimal quadratic regression model between PM10and PM2.5,CO,SO2,NO2.

air pollution;correlation analysis;principal component analysis;stepwise regression analysis

O213.1

A

10.3969/j.issn.1007-9831.2016.12.003

2016-07-30

佳木斯大學(xué)科研項目(13Z1201585)

楊小雷(1991-),男,安徽宿州人,在讀本科生.E-mail:577560628@qq.com

湯鳳香(1978-),女,黑龍江安達(dá)人,講師,碩士,從事應(yīng)用數(shù)理統(tǒng)計研究.E-mail:54993661@qq.com

1007-9831(2016)12-0012-05

猜你喜歡
二階方差空氣質(zhì)量
方差怎么算
概率與統(tǒng)計(2)——離散型隨機(jī)變量的期望與方差
一類二階迭代泛函微分方程的周期解
計算方差用哪個公式
一類二階中立隨機(jī)偏微分方程的吸引集和擬不變集
二階線性微分方程的解法
一類二階中立隨機(jī)偏微分方程的吸引集和擬不變集
方差生活秀
“空氣質(zhì)量發(fā)布”APP上線
車內(nèi)空氣質(zhì)量標(biāo)準(zhǔn)進(jìn)展
汽車與安全(2016年5期)2016-12-01 05:22:14
呼伦贝尔市| 行唐县| 敦煌市| 泽州县| 兰坪| 筠连县| 尚志市| 赤城县| 陆川县| 霍城县| 阳谷县| 云浮市| 威远县| 南投市| 孙吴县| 祁门县| 于都县| 东至县| 新田县| 南澳县| 邹平县| 阜南县| 肥乡县| 乌兰县| 湟中县| 武山县| 津市市| 承德市| 从化市| 苗栗县| 张家界市| 山阴县| 西平县| 张家口市| 正宁县| 罗定市| 囊谦县| 蓝田县| 元谋县| 德江县| 堆龙德庆县|