王芳
摘 要:本文運(yùn)用R軟件對(duì)重慶市各區(qū)(自治縣、市)國(guó)民經(jīng)濟(jì)主要指標(biāo)進(jìn)行分析,最后根據(jù)分析結(jié)果,將這這些地區(qū)分為了四類。
關(guān)鍵詞:判別分析;國(guó)民經(jīng)濟(jì)主要指標(biāo)
聚類分析和判別分析都是根據(jù)對(duì)象之間的距離遠(yuǎn)近對(duì)對(duì)象進(jìn)行歸類,但二者之間的不同點(diǎn)在于,在聚類分析中,一般事先不知道應(yīng)該將數(shù)據(jù)分為幾類,完全根據(jù)數(shù)據(jù)來(lái)確定;而在判別分析中,至少有一個(gè)已經(jīng)明確知道的類別的“訓(xùn)練樣本”,利用這個(gè)數(shù)據(jù),來(lái)建立基本的判別準(zhǔn)則,并通過(guò)預(yù)測(cè)變量來(lái)為未知類別的觀測(cè)樣本進(jìn)行判別分類。
1 判別分析
采用重慶市各區(qū)國(guó)民經(jīng)濟(jì)主要指標(biāo)作為原始數(shù)據(jù),并利用快速聚類后各區(qū)分類結(jié)果進(jìn)行判別分析,得到判別函數(shù),具體結(jié)果如下:
上表是分類統(tǒng)計(jì)量的表格,包括各個(gè)類別以及總和的未加權(quán)和加權(quán)的有效值。
2 結(jié)論
在使用SPSS時(shí)設(shè)置各組的先驗(yàn)概率均相等,由于分為了4個(gè)組,因此先驗(yàn)概率為0.25。另外還給出了參與分析的未加權(quán)的和加權(quán)的個(gè)案數(shù)。
上表給出的分類函數(shù)系數(shù)是貝葉斯得分系數(shù),使用的是貝葉斯原理而不是fisher原理。在SPSS中,也是使用這個(gè)系數(shù)來(lái)計(jì)算得分的,如果想利用fisher判別方法就要用表中的系數(shù)來(lái)計(jì)算得分。將自變量的值與上表中系數(shù)相乘,哪類得出的值大就屬于哪一類。例如,將重慶市江北區(qū)作為待判數(shù)據(jù),將江北區(qū)的人均GDP,工業(yè)GOV,消費(fèi)TRS,IBFR,YEDBFI分別和上表中對(duì)應(yīng)項(xiàng)相乘,在于對(duì)于的常量相加,就可以得出一類的得分,將四類的得分都計(jì)算出來(lái),比較大小,得出第四類得分最高,因此江北區(qū)屬于第四類經(jīng)濟(jì)區(qū)。
[參考文獻(xiàn)]
[1](美)約翰遜(Johnson,R.A.).實(shí)用多元統(tǒng)計(jì)分析.清華大學(xué)出版社,2008.
[2]薛毅.統(tǒng)計(jì)建模與R軟件.清華大學(xué)出版社.