左韶澤
摘 要:城市的經(jīng)濟發(fā)展水平是一個城市發(fā)展水平的重要體現(xiàn),但由于各方面的原因,城市間的經(jīng)濟發(fā)展水平差異越來越大。選取能夠體現(xiàn)經(jīng)濟發(fā)展水平的8個變量,利用因子分析的方法對山東省17市的經(jīng)濟發(fā)展水平進行綜合分析。之后對得到的因子得分進行聚類,將17市劃分為3個類別,分析不同類別之間的差異和影響因素,并對區(qū)域經(jīng)濟的協(xié)調(diào)發(fā)展提出一些建議。
關(guān)鍵詞:區(qū)域經(jīng)濟;因子分析;聚類分析
中圖分類號:F2 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2019.29.001
1 前言
山東省位于渤海與黃海之畔,是中國著名的經(jīng)濟強省之一。2018年山東省的生產(chǎn)總值高達7.6萬億元,在全國排名第三。改革開放以來,全省經(jīng)濟持續(xù)快速發(fā)展,成為中國經(jīng)濟不可或缺的一部分,這與山東各市的貢獻是分不開的。但由于多方面的原因,省內(nèi)區(qū)域經(jīng)濟發(fā)展差異顯著,尤其是在近些年來有進一步拉大的趨勢,這也將成為制約山東經(jīng)濟發(fā)展的一個重要問題。因此本文選取2017年山東省17市體現(xiàn)經(jīng)濟發(fā)展水平的相關(guān)數(shù)據(jù),采用因子分析和聚類分析來探索不同城市的經(jīng)濟發(fā)展情況,找到一些對山東省的區(qū)域經(jīng)濟差異造成影響的公共因素,借助這些公共因素,對山東各市的經(jīng)濟差異進行一個客觀的評價,并且找出造成這種經(jīng)濟差異的主要原因。最后希望能通過分析,提出一些行之有效的方法,能夠有利于山東省區(qū)域經(jīng)濟的協(xié)調(diào)發(fā)展。
2 模型介紹與指標選取
2.1 模型介紹
因子分析的基本思想是根據(jù)相關(guān)性的大小對原始變量進行分組,使同一組內(nèi)變量之間的相關(guān)性較高,不是同一組的變量間的相關(guān)性低。每組變量都是一個基本結(jié)構(gòu),用一個綜合變量表示,這個基本結(jié)構(gòu)被稱之為公共因子。對所研究的一個具體問題,原始變量可以分解成兩部分之和的形式:一部分是不可觀測的公共因子的線性函數(shù);另一部分是與公共因子無關(guān)的特殊因子。聚類分析則是按照某種距離計算方法,對個體或?qū)ο蠓诸?,使得同類對象相似性最高,異類對象差異性最大?/p>
2.2 指標選取
本文選取了X1-工業(yè)總產(chǎn)值、X2-就業(yè)人數(shù)、X3-城鎮(zhèn)人口數(shù)、X4-地區(qū)生產(chǎn)總值、X5-公共預算收入、X6-在崗職工工資總額、X7-住宿餐飲業(yè)就業(yè)人數(shù)和X8-貨運總量8個指標,所有數(shù)據(jù)均來自《山東統(tǒng)計年鑒2018》。其中X2、X3、X6是反映城市規(guī)模的指標,X1、X8反映的是工業(yè)發(fā)展規(guī)模,X7反映第三產(chǎn)業(yè)的規(guī)模,X4、X5在一定程度上反映了國民收入水平。
3 因子分析
3.1 數(shù)據(jù)檢驗
因子分析是為了從眾多的原始變量中綜合出少數(shù)幾個具有代表性的因子,這其中有一個要求,原有的變量間應當具有較強的相關(guān)關(guān)系。因為如果變量間的相關(guān)關(guān)系弱的話,就無法從原始變量中綜合出反映某些變量共同特性的幾個較少的公共因子。因此在進行因子分析前,需要對原始的變量是否相關(guān)進行檢驗。檢驗結(jié)果顯示,所有相關(guān)變量的相關(guān)系數(shù)都大于0.3,大部分相關(guān)變量的相關(guān)系數(shù)較高,各變量具有較強的線性相關(guān)關(guān)系。巴特利特球度檢驗統(tǒng)計量的觀測值是240.796,相應的P值接近0。把顯著性水平α設為0.05,則相應的概率P值小于顯著性水平α,應當拒絕原假設,認為相關(guān)系數(shù)矩陣與單位陣有顯著差異。同時,KMO值為0.731,符合KMO度量標準,所以原始變量適合進行因子分析。
3.2 因子提取
在對原始變量進行相關(guān)性檢驗后,就應該求解因子載荷矩陣進行因子提取了。因子載荷矩陣的求法很多,本文使用的是在因子分析中占主要地位的主成分分析法。主成分分析法能夠為因子分析提供初始解,因子分析是對主成分分析的擴展與補充。主成分分析法的核心就是通過原有變量的線性組合以及各個主成分的求解來達到對原始變量的降維目的。因為本文選取的變量數(shù)量級差異很大,而且單位不同,所以采用相關(guān)系數(shù)矩陣作為提取因子的依據(jù)。進行因子提取后,根據(jù)因子的累計方差貢獻率來確定因子個數(shù)。一般選取累計方差貢獻率大于0.85時的特征值個數(shù)為因子個數(shù)k。本文提取了2個主因子,累計方差貢獻率達到了93.6%,基本體現(xiàn)了原始變量中所有的信息。
3.3 因子旋轉(zhuǎn)與命名
建立因子分析模型的目的不僅僅在于找到公共因子,更重要的是對公共因子進行解釋,能夠更加容易的分析實際問題。然而,得到的初始因子解各主因子的代表變量常常不是很突出,容易造成因子意義含糊不清的后果,不容易分析實際問題。因此,可以對初始公共因子進行線性組合,通過線性組合來找到意義明確,更容易被解釋的公共因子,這就是因子旋轉(zhuǎn)。因子旋轉(zhuǎn)可以被分為正交旋轉(zhuǎn)和斜交旋轉(zhuǎn),二者各有優(yōu)劣。本文選用的是正交旋轉(zhuǎn)方式中的方差極大法,以便使因子更容易被命名解釋。旋轉(zhuǎn)后的因子載荷是按照第一個因子降序的順序輸出的,旋轉(zhuǎn)后的因子載荷矩陣如表1。
從表1可以看出,住宿餐飲業(yè)就業(yè)人數(shù)、公共預算收入、地區(qū)生產(chǎn)總值、在崗職工工資總額、工業(yè)總產(chǎn)值在第一個因子上的載荷都大于0.85,這幾個變量主要被因子一解釋,可以理解為對山東省內(nèi)區(qū)域經(jīng)濟差異的直接影響因素,因此命名為經(jīng)濟發(fā)展因子;就業(yè)人數(shù)、貨運總量、城鎮(zhèn)人口數(shù)在第二個因子上的載荷都大于0.85,因子二主要解釋了這幾個變量,可以理解為對區(qū)域經(jīng)濟差異的間接影響因素,命名為持續(xù)影響因子。經(jīng)過旋轉(zhuǎn)后,各個變量的因子含義更清晰。
3.4 計算因子得分
在建立因子模型后,就要反過來考察每個樣品的性質(zhì)和樣品間的關(guān)系。比如在建立了關(guān)于區(qū)域經(jīng)濟差異的因子模型后,就想要知道哪些區(qū)域經(jīng)濟發(fā)展好,哪些區(qū)域經(jīng)濟發(fā)展較差等,這就要進行因子分析的關(guān)鍵一步,即計算因子得分。因子得分也是因子分析的最終體現(xiàn),需要計算各個因子在每個樣品點上的具體數(shù)值,這些數(shù)值就是因子得分,由此形成的變量也被稱之為因子得分變量。在以后的分析中,就可以直接使用因子得分變量來研究樣品的評價或?qū)ζ溥M行分類了。本文采用回歸法計算因子得分系數(shù),得分系數(shù)的均值為0,標準差為1,大于0證明比平均水平高,小于0表示比平均水平低,計算結(jié)果如表2。