劉菊紅 李青
摘 要:本文以中國2009年各地區(qū)工業(yè)廢氣排放的情況為研究對(duì)象,首先根據(jù)各地區(qū)工業(yè)廢氣排放的情況進(jìn)行分類,將要研究的復(fù)雜問題簡(jiǎn)單化,接著運(yùn)用貝葉斯判別分析法將待判的幾個(gè)地區(qū)分到已知類中,而后運(yùn)用降維的思想將影響各地區(qū)工業(yè)廢氣排放的多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),進(jìn)而分析我國工業(yè)廢氣排放的主要原因。
關(guān)鍵詞:廢氣排放 聚類分析 判別分析 主成分分析 降維 本文主要研究2009年我國各地區(qū)工業(yè)廢氣排放的情況,采用多元統(tǒng)計(jì)中的聚類分析法、貝葉斯判別分析法、主成分分析法將要研究的復(fù)雜問題簡(jiǎn)單化,將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),進(jìn)而分析我國工業(yè)廢氣排放的主要原因。
一、使用系統(tǒng)聚類法對(duì)各大中城市進(jìn)行分類與結(jié)論
各地區(qū)工業(yè)廢氣排放量是反映一定時(shí)期內(nèi)工業(yè)廢氣排放量變動(dòng)趨勢(shì)和程度的相對(duì)數(shù),包括工業(yè)二氧化硫排放量、工業(yè)煙塵排放量、工業(yè)粉塵排放量、工業(yè)二氧化硫去除量、工業(yè)煙塵去除量、工業(yè)粉塵去除量。我們將要研究的是這六個(gè)指標(biāo)下15個(gè)地區(qū)(北京、天津、貴陽、西寧、重慶、太原、南京、杭州、濟(jì)南、石家莊、呼和浩特、哈爾濱、鄭州、武漢、長沙)廢氣排放情況的問題,對(duì)這個(gè)問題進(jìn)行系統(tǒng)聚類,其中樣品間距離采用歐氏距離,類間距離的度量分別采用離差平方和法和最長距離法做聚類圖。輸出結(jié)果。
數(shù)據(jù)來源:2010中國統(tǒng)計(jì)年鑒,中華人民共和國國家統(tǒng)計(jì)局網(wǎng)站:http://www.stats.gov.cn
按離差平方和法,由圖我們可以將15個(gè)地區(qū)進(jìn)行系統(tǒng)聚類:
第一類:北京、天津、太原、南京、杭州、濟(jì)南;第二類:石家莊、呼和浩特、哈爾濱、鄭州、武漢、貴陽、西寧;第三類:重慶;第四類:長沙。
數(shù)據(jù)來源:2010中國統(tǒng)計(jì)年鑒,中華人民共和國國家統(tǒng)計(jì)局網(wǎng)站:http://www.stats.gov.cn
按最長距離法,由圖我們可以將15個(gè)大中城市進(jìn)行系統(tǒng)聚類:
第一類:北京、天津、太原、南京、杭州、濟(jì)南;第二類:石家莊、呼和浩特、哈爾濱、鄭州、武漢、貴陽、西寧;第三類:重慶;第四類:長沙。
由聚類圖不難看出兩種分類方法分析結(jié)果是完全一致的。
從聚類圖上我們可以把我國15個(gè)地區(qū)工業(yè)廢氣排放情況分成四類:
第一種類型,這些地區(qū)都是國家重點(diǎn)工業(yè)建設(shè)經(jīng)濟(jì)區(qū)域,工業(yè)技術(shù)先進(jìn),也是最近幾年我國工業(yè)經(jīng)濟(jì)發(fā)展速度最快的地區(qū),尤其北京是我國首都,發(fā)展尤為重要,而太原主要有煤炭事業(yè);
第二種類型,這些地區(qū)都是正處于發(fā)展建設(shè)中,工業(yè)經(jīng)濟(jì)發(fā)展處于穩(wěn)步建設(shè)中,與北京等地相比顯然不屬于同一類型;
第三種類型,重慶屬于老工業(yè)基地,現(xiàn)在又走新型工業(yè)化建設(shè)道路,故與上面的兩種類型都有所區(qū)別;
第四種類型,長沙屬于新型工業(yè)建設(shè)基地,堅(jiān)持走新型工業(yè)化道路,與上面三種類型顯然不能化為同一類。
二、使用判別分析對(duì)未知分類地區(qū)進(jìn)行分類與結(jié)論
現(xiàn)從未分類的地區(qū)中選出6個(gè)地區(qū):沈陽、合肥、廣州、成都、西安、烏魯木齊進(jìn)行判別分析,分析它們屬于哪一類型。假設(shè)他們都屬于第一類,現(xiàn)調(diào)用SAS9.1統(tǒng)計(jì)軟件進(jìn)行貝葉斯判別分析,分析結(jié)果。
數(shù)據(jù)來源:2010中國統(tǒng)計(jì)年鑒,中華人民共和國國家統(tǒng)計(jì)局網(wǎng)站:http://www.stats.gov.cn
從分類看出,只有廣州屬于第一類,其余地區(qū)劃分為第二類。
廣州是全國重要的工業(yè)基地,華南地區(qū)的綜合性工業(yè)制造中心,屬于我國經(jīng)濟(jì)發(fā)達(dá)地區(qū),因此,應(yīng)歸為第一類。沈陽、合肥、廣州、成都、西安這些地方,工業(yè)經(jīng)濟(jì)處于穩(wěn)步建設(shè)中,與第二類的各個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展相似,所以應(yīng)歸為第二類。而烏魯木齊重點(diǎn)發(fā)展油氣加工及化學(xué)工業(yè),廢氣排放的狀況和第二類的各地區(qū)也應(yīng)屬于同一類別。
三、使用主成分分析各地區(qū)工業(yè)廢氣排放情況與結(jié)論
對(duì)我國各地區(qū)廢氣排放情況進(jìn)行統(tǒng)計(jì)分析,選出六個(gè)影響指標(biāo)中較重要的作為主成分。
工業(yè)二氧化硫排放量; 工業(yè)煙塵排放量; 工業(yè)粉塵排放量;
工業(yè)二氧化硫去除量; 工業(yè)煙塵去除量; 工業(yè)粉塵去除量。
這些指標(biāo)基本可以反映我國各地區(qū)廢氣排放情況,再用SAS軟件中的主成分分析對(duì)X1 — X6進(jìn)行主成分分析。分析的結(jié)果。
在上述第一表達(dá)式中, X1的系數(shù)最大,表明第一主成分值大時(shí)工業(yè)二氧化硫排放量較大,因此可以把第一主成分稱為二氧化硫排放因子;在第二表達(dá)式中, X3,X5的系數(shù)最大,說明第二個(gè)主成分值越大時(shí),工業(yè)粉塵排放量、工業(yè)煙塵去除量越大,因此可以把第二主成分稱為工業(yè)粉塵排放因子;在第三表達(dá)式中, X6的系數(shù)最大,說明第三個(gè)主成分值越大時(shí)工業(yè)粉塵去除量越大,因此可以把第三主成分稱為工業(yè)粉塵去除因子;在第四表達(dá)式中, X2,X4的系數(shù)最大,說明第四個(gè)主成分值越大時(shí)工業(yè)煙塵排放量、工業(yè)二氧化硫去除量越大,因此可以把第四主成分稱為工業(yè)煙塵排放因子。由以上討論可知,4個(gè)變量可分為4類:{X1},{X3,X5},{ X6},{X2,X4 }。
數(shù)據(jù)來源:2010中國統(tǒng)計(jì)年鑒,中華人民共和國國家統(tǒng)計(jì)局網(wǎng)站:http://www.stats.gov.cn
由前兩個(gè)主成分的散點(diǎn)圖可知,我國各地區(qū)廢氣排放情況是居中的占大部分,偏高或偏低的占小部分。
在影響各地區(qū)廢氣排放情況的六個(gè)指數(shù)中,最重要的指數(shù)是工業(yè)二氧化硫排放量,它是造成廢氣排放最主要的因素,像北京等一線地區(qū),工業(yè)技術(shù)快速發(fā)展,在發(fā)展工業(yè)經(jīng)濟(jì)建設(shè)的同時(shí)燃燒掉大量的燃料,釋放出各種污染大氣的氣體,二氧化硫就是主要的污染物之一。而到目前為止北方地區(qū)獲取能源的主要供給為煤炭,大量的煤炭在燃燒的過程中就會(huì)釋放出過量的污染氣體、固體顆粒,致使二氧化硫的含量在廢氣排放中所占的比例越來越重。
參考文獻(xiàn):
[1] 盛來運(yùn).中國統(tǒng)計(jì)年鑒[M].中國統(tǒng)計(jì)出版社,2010.
[2] 裴喜春.SAS及應(yīng)用(第二版)[J].北京:中國農(nóng)業(yè)出版社,2007(7).
[3] 任雪松, 于秀林.多元統(tǒng)計(jì)分析[J].北京:中國統(tǒng)計(jì)出版社,2007(7).
[4] 王靜龍,梁小筠.參數(shù)統(tǒng)計(jì)分析[J].北京:高等教育出版社,200(4).
[5] 楊啟帆,康徐升,趙雅圖.數(shù)學(xué)建模[J].北京:高等教育出版社,2008(5).
[6] Dallase Johnson,Applied Multivariate Methods for Data Analysis[J].Beijing:Higher Education Press, 2005(5).
(責(zé)任編輯:康偉)