国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分組主成分法的應(yīng)用

2014-09-01 01:09:17谷偉偉
關(guān)鍵詞:蘇北分組載荷

谷偉偉,程 坤

(1.中國礦業(yè)大學(xué)理學(xué)院,中國 徐州 221116;2.南京航空航天大學(xué)理學(xué)院,中國 南京 210016)

分組主成分法的應(yīng)用

谷偉偉1*,程 坤2

(1.中國礦業(yè)大學(xué)理學(xué)院,中國 徐州 221116;2.南京航空航天大學(xué)理學(xué)院,中國 南京 210016)

分別利用正交因子法和分組主成分法,對(duì)2010年江蘇省13個(gè)市的經(jīng)濟(jì)發(fā)展水平進(jìn)行對(duì)比分析,發(fā)現(xiàn)分組主成分法分析的結(jié)果更加合理,并分析了原因,最后對(duì)江蘇未來的經(jīng)濟(jì)發(fā)展提出了建議,供有關(guān)部門決策參考.

因子分析模型;分組主成分分析;SPSS

1 預(yù)備知識(shí)

1.1 正交因子模型

設(shè)有n個(gè)樣品,每個(gè)樣品觀測p個(gè)變量,這p個(gè)變量具有較強(qiáng)的相關(guān)性.為了消除量綱不同造成的影響,將樣本觀測數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理的變量為X=(x1,x2,…,xp)′,其相關(guān)矩陣R的秩為r.

設(shè)λ1,λ2,…,λr,0,…,0為R的p個(gè)特征值,不失一般性,設(shè)λ1≥λ2≥…≥λr>0.

(2)

這里取r個(gè),是使得特征值做分母有意義.

設(shè)因子載荷矩陣為A=(aij)p×m,m≤r,公因子為F=(f1,f2,…,fm)′. 誤差項(xiàng)為ε=(ε1,ε2,…,εp)′.取

ε=Aε·Fε.

又Cov(Y)=Cov(L′X)=L′Cov(X)L=L′RL=diag(λ1,λ2,…,λr,0,…,0),故(yr+1,yr+2,…,yp)′=0,即yr+1=yr+2=…=yp=0.

則(2)式變?yōu)檎灰蜃幽P?/p>

(3)

即X=AF+ε.不難證明E(ε)=0,E(F)=0,Cov(F)=Im,Cov(F,ε)=0.

旋轉(zhuǎn)后的因子載荷陣和公因子可以類似地證明,詳細(xì)內(nèi)容參見文獻(xiàn)[12].

作者發(fā)現(xiàn)這樣取的ε并不完全滿足因子模型的條件,因?yàn)榘?2)式中主成分系數(shù)和主成分的第m+1項(xiàng)到第r項(xiàng)看成了ε(第r項(xiàng)之后全為0),而它們之間是有關(guān)聯(lián)的,即Cov(ε)不是對(duì)角陣.但從文獻(xiàn)[13]可知ε的影響是最小的.因此這從理論上和SPSS操作上來說都是沒有影響的.

1.2 分組主成分法的基本思想

2 實(shí)例分析

本文選取的數(shù)據(jù)來自《江蘇省統(tǒng)計(jì)年鑒2011》中8個(gè)國民經(jīng)濟(jì)指標(biāo),具體指標(biāo)如下:

x1: 地區(qū)生產(chǎn)總值GDP(億元);x2:第一產(chǎn)業(yè)產(chǎn)值(億元);x3:進(jìn)出口總額(億元);x4: 社會(huì)消費(fèi)品零售總額(億元);x5:城鎮(zhèn)居民人均收入(元);x6:農(nóng)村居民人均收入(元);x7: 全社會(huì)固定資產(chǎn)投資(億元);x8:公路里程(km).

這8個(gè)指標(biāo)都是正向化指標(biāo).為了消除量綱的影響,作者對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化變量為Zx1~Zx8(見表1).

表1 標(biāo)準(zhǔn)化后的數(shù)據(jù)

經(jīng)過SPSS計(jì)算,KMO值為0.670>0.6,Bartlett球形檢驗(yàn)值為0.000,說明適合進(jìn)行因子分析.旋轉(zhuǎn)前的方差貢獻(xiàn)為66.006、25.135,旋轉(zhuǎn)后的方差貢獻(xiàn)為63.158、27.982(因篇幅有限,此處圖表從略).本例中以旋轉(zhuǎn)后載荷矩陣為分組的依據(jù).表2中的f1和f2為SPSS中提出的公因子,矩陣中的數(shù)字表示公因子對(duì)變量的載荷.

表2 旋轉(zhuǎn)載荷陣和因子得分系數(shù)陣

從旋轉(zhuǎn)因子載荷陣中不難發(fā)現(xiàn):f1對(duì)變量x1,x3,x4,x5,x6,x7的載荷較高,f2對(duì)變量x2,x8的載荷較高,不妨將f1命名為城市發(fā)展和居民生活因子,f2命名為第一產(chǎn)業(yè)和交通因子.

公因子f1和f2的因子得分分別記為F1和F2,由成分得分系數(shù)矩陣可知因子得分:

F1=0.206x1+0.038x2+…+0.086x8,F(xiàn)2=0.066x1+0.448x2+…+0.472x8.

在F1表達(dá)式中,x1,x3,x4,x5,x6,x7前的系數(shù)都為正;在F2表達(dá)式中,x2,x8前的系數(shù)都為正.說明它們是正相關(guān)關(guān)系.對(duì)那些和F1,F(xiàn)2相關(guān)性較低的變量,它們前面的系數(shù)則有正有負(fù).

下面用分組主成分法分析.

將x1,x3,x4,x5,x6,x7作為第1組,將x2,x8作為第2組.分別對(duì)第1組和第2組進(jìn)行主成分分析,分別提出第一主成分,它們的特征值分別為5.122和1.946,第一組中因子載荷分別為0.981,0.958,0.923,0.922,0.903,0.852;第二組為0.986,0.986.

把Y1與Y2的表達(dá)式輸入SPSS中,利用“轉(zhuǎn)換”中的“計(jì)算變量”功能進(jìn)行計(jì)算.最后利用文獻(xiàn)[14]中的熵值法計(jì)算總得分,為了使對(duì)數(shù)有意義,先將Y1,Y2得分矩陣的各個(gè)元素都加上2.6,得2010年Y1,Y2的熵權(quán),即ω1=0.011 7,ω2=0.004 4.

注意:謝智聰在文獻(xiàn)[15]中,先對(duì)各組主成分的得分值進(jìn)行了標(biāo)準(zhǔn)化,然后將各組得分值放在一起進(jìn)行主成分分析,進(jìn)而算出綜合得分.但本例中沒有運(yùn)用這種方法,如果對(duì)Y1和Y2進(jìn)行標(biāo)準(zhǔn)化處理,那么Y1和Y2就不是主成分得分,而是因子得分(見預(yù)備知識(shí)).另外,本文將Y1和Y2的得分值進(jìn)行主成分分析發(fā)現(xiàn):Bartlett球形檢驗(yàn)值為0.49(遠(yuǎn)大于0.05),說明不適合做主成分分析,其原因:雖然Y1和Y2不是完全無關(guān)的,但是它們的相關(guān)性已經(jīng)非常弱了.

將以上兩種方法的計(jì)算結(jié)果放在一起對(duì)比分析.結(jié)果見表3.

表3 兩種方法的結(jié)果對(duì)比

CLU5表示用聚類方法將樣本分為5類.F1,F(xiàn)2,F(xiàn),CLU5-1是正交因子模型做出的結(jié)果;Y1,Y2,Y,CLU5-2是用分組主成分法做出的結(jié)果.

從常規(guī)上判斷:蘇南工業(yè)發(fā)達(dá),蘇北農(nóng)業(yè)發(fā)達(dá),蘇中介于兩者之間.

F1和Y1對(duì)比:南通的得分應(yīng)該小于蘇南的常州,鹽城的得分應(yīng)小于揚(yáng)州,鎮(zhèn)江.Y1較合理.

F2和Y2對(duì)比:蘇州是發(fā)達(dá)的工業(yè)城市,尤其是工廠很多,但它的農(nóng)業(yè)相對(duì)不發(fā)達(dá),因此蘇州的得分不應(yīng)該比農(nóng)業(yè)經(jīng)濟(jì)占很大比重的連云港、淮安高許多.因此,F(xiàn)2不合理.

之所以出現(xiàn)F1,F(xiàn)2的部分?jǐn)?shù)據(jù)不合理的情況,是因?yàn)镕1,F(xiàn)2受相關(guān)性較低變量的影響,由上文可知f1在變量x1,x3,x4,x5,x6,x7上的載荷較高,f2在變量x2,x8上的載荷較高.但F1=0.206x1+0.038x2+…+0.086x8,F(xiàn)2=0.066x1+0.448x2+…+0.472x8中,F(xiàn)1的值受相關(guān)性較低的x2,x8值影響,F(xiàn)2的值受相關(guān)性較低的x1,x3,x4,x5,x6,x7值影響,具體情況見表1中的因子得分系數(shù)矩陣.相反,Y1,Y2則不受相關(guān)性較低的變量影響,因此比較準(zhǔn)確.

F和Y對(duì)比:由F和Y的表達(dá)式和上面的F1,F(xiàn)2和Y1,Y2的對(duì)比討論,我們發(fā)現(xiàn)Y的得分較為合理.例如:徐州的綜合得分應(yīng)該低于蘇南的常州;鎮(zhèn)江、泰州的綜合得分不應(yīng)該比蘇北的連云港、淮安低;鹽城的綜合得分不能比無錫高,比常州高很多.

另外,Y的表達(dá)式不能是

以F1和F2為變量進(jìn)行聚類得CLU5-1,以Y1和Y2為變量進(jìn)行聚類得CLU5-2.在CLU5-2中:①蘇州在Y1上的得分最高,這和它顯著的區(qū)位優(yōu)勢(受到上海經(jīng)濟(jì)的輻射帶動(dòng)作用)和發(fā)達(dá)的個(gè)體私營經(jīng)濟(jì)是分不開的,而且工業(yè)十分發(fā)達(dá)(尤其是昆山),在Y2上的得分也高于平均水平,在Y上的得分最高,所以把它單獨(dú)分為一類較合理;②南京(江蘇省省會(huì),擁有良好的地理環(huán)境和悠久的歷史,高等教育又在全省遙遙領(lǐng)先)和無錫(太湖流域的交通樞紐)在Y1上的得分都較高,基礎(chǔ)設(shè)施十分完善,無錫在Y2上得分比南京低些,所以將南京,無錫分為一類較合理;③常州、揚(yáng)州、鎮(zhèn)江、泰州的制造業(yè)較發(fā)達(dá),在Y1上的得分也較高,但遠(yuǎn)不如蘇州、無錫、南京;它們在Y2上的得分不是很高,尤其是鎮(zhèn)江最低,所以把它們分為一類較合理;④徐州、南通在Y2上的得分很高,在Y1得分也高于平均水平,因此它們在Y上得分也很高.鹽城在Y2上得分達(dá)最大,因?yàn)辂}城的面積很大,農(nóng)業(yè)用地很多,公路里程長.農(nóng)村經(jīng)濟(jì)發(fā)展較快,農(nóng)村產(chǎn)業(yè)結(jié)構(gòu)發(fā)生很大變化,但和蘇南相比,工業(yè)產(chǎn)業(yè)結(jié)構(gòu)層次還有差距[17],所以將它們分為一類較合理;⑤淮安、連云港、宿遷在Y2上的得分較高,但在Y1上的得分很低,工業(yè)主要以勞動(dòng)密集型為主,輕工業(yè)中以農(nóng)產(chǎn)品為原料,所占比重依然很高[17],高等教育發(fā)展程度全省最低,所以將它們分為一類較合理.顯然CLU5-1中將連云港,淮安,揚(yáng)州,泰州,宿遷分為一類是不合理的.

3 建議

江蘇發(fā)展的主要問題是經(jīng)濟(jì)發(fā)展不均衡.蘇南是江蘇發(fā)展水平最高的地區(qū),蘇中次之,蘇北最低.

對(duì)于蘇北:“沒有蘇北的小康,就沒有江蘇的小康”.由上述統(tǒng)計(jì)分析可知,蘇北整體在Y1上得分不高,而在Y2上得分很高,所以應(yīng)努力加快農(nóng)村城鎮(zhèn)化進(jìn)程,著力提高居民的收入水平和改善人民的就業(yè)層次,逐步推進(jìn)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整.省政府應(yīng)該加強(qiáng)宏觀調(diào)控,適當(dāng)有些政策傾斜.當(dāng)?shù)卣矐?yīng)該因地制宜,發(fā)展當(dāng)?shù)氐奶厣a(chǎn)業(yè).同時(shí),要注重基礎(chǔ)設(shè)施建設(shè),過去支持蘇北基礎(chǔ)設(shè)施建設(shè)主要指交通、水利、電力等硬件設(shè)施.今后,基礎(chǔ)設(shè)施建設(shè)支持范圍擴(kuò)展到信息化、城鄉(xiāng)社會(huì)服務(wù)體系、環(huán)境設(shè)施等方面.最后,還要注重提高蘇北的教育水平,尤其是蘇北的廣大農(nóng)村地區(qū).

對(duì)于蘇中,蘇南:在保持傳統(tǒng)優(yōu)勢的情況下,加大科研投入,改變目前的研究成果轉(zhuǎn)化率不高的情況,加大人才引進(jìn)力度,逐步依靠勞動(dòng)者素質(zhì)的提高來促進(jìn)經(jīng)濟(jì)發(fā)展.

[1] JONATHON S. A tutorial on principal component analysis[EB/OL].(2007-01-01)[2012-12-01].http://www.cs.otago.ac.nz/cosc453.

[2] RAJKIRAN G, ASARI V K. An improved face recognition technique based on modular PCA approach [J]. Pattern Recog Lett, 2004,25(4):429-436.

[3] YANG J, ZHANG D, FRANGI A F,etal. Two-dimensional PCA: A new approach to appearance-based face representation and recognition [J]. IEEE Trans Pattern Anal Machine Intell, 2004,26(1):131-137.

[4] 張珍花. 運(yùn)用多元統(tǒng)計(jì)分析綜合評(píng)判江蘇省經(jīng)濟(jì)效益[J]. 統(tǒng)計(jì)與決策, 2001(9):23,43.

[5] 孟 瑩,謝守祥,彭 瀟. 江蘇省區(qū)域經(jīng)濟(jì)差異的多元統(tǒng)計(jì)分析[J]. 特區(qū)經(jīng)濟(jì), 2010(4):51-52.

[6] 錢存陽,李丹青. 多元統(tǒng)計(jì)分析在課堂教學(xué)質(zhì)量評(píng)價(jià)元中的應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理, 2005,24(6):40-43.

[7] 吳 棟,李樂夫,李陽子. 近年居民消費(fèi)結(jié)構(gòu)統(tǒng)計(jì)分析的研究綜述[J]. 數(shù)理統(tǒng)計(jì)與管理, 2007,26(5):776-781.

[8] 劉曉娥,康艷芳,王 立. 河南省區(qū)域經(jīng)濟(jì)發(fā)展比較的因子分析[J]. 統(tǒng)計(jì)與決策, 2010(5):119-121.

[9] 陳希鎮(zhèn),林俊濤. 用多元統(tǒng)計(jì)方法分析浙江省各地區(qū)的經(jīng)濟(jì)結(jié)構(gòu)[J]. 數(shù)理統(tǒng)計(jì)與管理, 2010,29(6):1043-1051.

[10] 殷明娥. 分組主成分評(píng)價(jià)法及其應(yīng)用[J]. 遼寧師范大學(xué)學(xué)報(bào), 2005,28(4):408-409.

[11] 侯 文. 對(duì)應(yīng)用主成分法進(jìn)行綜合評(píng)價(jià)的探討[J]. 數(shù)理統(tǒng)計(jì)與管理, 2006,25(2):211-214.

[12] 汪東華. 多元統(tǒng)計(jì)分析與SPSS應(yīng)用[M]. 上海:華東理工大學(xué)出版社, 2010.

[13] 林海明. 因子分析模型的改進(jìn)與應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理, 2009,28(6):998-1012.

[14] 孫劉平,錢吳永.基于主成分分析法的綜合評(píng)價(jià)方法的改進(jìn)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2009,39(18):17-20.

[15] 謝智聰. 運(yùn)用因子載荷陣分組變量的新主成分法及應(yīng)用[J]. 統(tǒng)計(jì)與決策, 2008(12):19-22.

[16] 徐雅靜,汪遠(yuǎn)征. 主成分分析應(yīng)用方法的改進(jìn)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2006,36(6):68-75.

[17] 李載成. 江蘇省各市區(qū)域經(jīng)濟(jì)發(fā)展水平聚類分析[J]. 全國商情(理論研究), 2011(3):13-14.

(編輯 沈小玲)

Application of Grouped Principal Component Analysis

GUWei-wei1*,CHENGKun2

(1.School of Science, China University of Mining and Technology, Xuzhou 221116, China;2.College of Science, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)

On the basis of both orthogonal factor analysis method and grouped principal component analysis method, a comparative study is made on the 13 cities of Jiangsu province in 2010. Results show that grouped principal component analysis is more reasonable than orthogonal factor analysis in the investigation. Some suggestions are put forward to improve the economic development of Jiangsu province, and can be used as a reference for government decision.

factor analysis model; grouped principal component analysis; SPSS

2012-12-17

南京航空航天大學(xué)基本科研業(yè)務(wù)專項(xiàng)科研資助項(xiàng)目(NS2012118)

*

,E-mail864037364@qq.com

F224.9

A

1000-2537(2014)01-0076-05

猜你喜歡
蘇北分組載荷
交通運(yùn)輸部海事局“新一代衛(wèi)星AIS驗(yàn)證載荷”成功發(fā)射
水上消防(2022年2期)2022-07-22 08:45:00
CSAMT在蘇北月亮灣地?zé)峥辈橹械膽?yīng)用
喊一聲蘇北大平原
分組搭配
怎么分組
分組
滾轉(zhuǎn)機(jī)動(dòng)載荷減緩風(fēng)洞試驗(yàn)
八路軍新四軍的蘇北整編始末
文史春秋(2016年8期)2016-02-28 17:41:28
一種基于白噪聲響應(yīng)的隨機(jī)載荷譜識(shí)別方法
底排藥受力載荷及其分布規(guī)律
修武县| 界首市| 金溪县| 宜城市| 丰镇市| 宜良县| 进贤县| 武威市| 太康县| 同德县| 海丰县| 宝应县| 都兰县| 崇信县| 横山县| 乌拉特前旗| 叙永县| 峨边| 和龙市| 双峰县| 江陵县| 平泉县| 镇坪县| 新乡市| 青龙| 黄冈市| 门源| 电白县| 南和县| 邻水| 富川| 虹口区| 汝阳县| 牟定县| 教育| 云霄县| 都江堰市| 东丽区| 科技| 枣强县| 乌什县|