摘要:本文對(duì)我國(guó)2020 年疫情期間31省份農(nóng)林牧漁業(yè)總產(chǎn)值數(shù)據(jù)進(jìn)行了梳理, 運(yùn)用SPSS對(duì)這四個(gè)指標(biāo)進(jìn)行聚類分析,先進(jìn)行系統(tǒng)聚類,然后運(yùn)用K-means方法繼續(xù)聚類,得出了一些結(jié)論和思考。
關(guān)鍵詞:農(nóng)林牧漁;總產(chǎn)值;聚類分析;SPSS
1.論文的背景與意義
農(nóng)林牧漁業(yè)總產(chǎn)值指以貨幣表現(xiàn)的農(nóng)、林、牧、漁業(yè)全部產(chǎn)品的總量,它反映一定時(shí)期內(nèi)農(nóng)業(yè)生產(chǎn)總規(guī)模和總成果。農(nóng)業(yè)總產(chǎn)值的計(jì)算方法通常是按農(nóng)林牧漁業(yè)產(chǎn)品及其副產(chǎn)品的產(chǎn)量分別乘以各自單位產(chǎn)品價(jià)格求得;少數(shù)生產(chǎn)周期較長(zhǎng),當(dāng)年沒有產(chǎn)品或產(chǎn)品產(chǎn)量不易統(tǒng)計(jì)的,則采用間接方法匡算其產(chǎn)值;然后將四業(yè)產(chǎn)品產(chǎn)值相加即為農(nóng)業(yè)總產(chǎn)值。
農(nóng)林牧漁業(yè)總產(chǎn)值在國(guó)內(nèi)總產(chǎn)值中占有重要地位,其發(fā)展對(duì)我國(guó)國(guó)民經(jīng)濟(jì)穩(wěn)定快速發(fā)展有著深遠(yuǎn)的意義。2011-2020年中國(guó)農(nóng)林牧漁業(yè)總產(chǎn)值呈直線增長(zhǎng)趨勢(shì),至2020年底,中國(guó)農(nóng)林牧漁業(yè)總產(chǎn)值13.78萬億元,較2011年增長(zhǎng)5.9萬億元。
疫情影響下各地的農(nóng)林牧漁業(yè)發(fā)展穩(wěn)定性尤為重要,本文主要以2020年疫情下全國(guó)31個(gè)省市自治區(qū)農(nóng)林牧漁業(yè)總產(chǎn)值為研究對(duì)象,通過系統(tǒng)聚類和快速聚類法(K-means聚類)把31個(gè)地區(qū)分為三類比較合適,對(duì)全國(guó)31個(gè)省、市、自治區(qū)的農(nóng)林牧漁業(yè)總產(chǎn)值水平進(jìn)行了地區(qū)差異分析。
2.數(shù)據(jù)的來源與數(shù)據(jù)的介紹
數(shù)據(jù)來源于國(guó)際統(tǒng)計(jì)局。其中該數(shù)據(jù)是按照現(xiàn)行統(tǒng)計(jì)制度,農(nóng)林牧漁業(yè)總產(chǎn)值的核算范圍是本轄區(qū)內(nèi)一定時(shí)期內(nèi)生產(chǎn)的農(nóng)業(yè)、林業(yè)、牧業(yè)、漁業(yè)產(chǎn)品的價(jià)值量和對(duì)農(nóng)林牧漁業(yè)生產(chǎn)活動(dòng)進(jìn)行的各種支持性服務(wù)活動(dòng)的價(jià)值的總和。
根據(jù)農(nóng)業(yè)生產(chǎn)特點(diǎn),農(nóng)林牧漁業(yè)總產(chǎn)值的核算采用“產(chǎn)品法”進(jìn)行計(jì)算,即用產(chǎn)品產(chǎn)量乘以價(jià)格求出各種產(chǎn)品的產(chǎn)值,然后把它們加總求得各業(yè)的產(chǎn)值,最后各業(yè)相加求出農(nóng)林牧漁業(yè)總產(chǎn)值。當(dāng)年生產(chǎn)的各種農(nóng)產(chǎn)品都要計(jì)算產(chǎn)值,并且每種產(chǎn)品都按全部產(chǎn)量計(jì)算,不扣除用于當(dāng)年農(nóng)產(chǎn)品生產(chǎn)消耗的那部分產(chǎn)品的產(chǎn)值。以林業(yè)為例,其產(chǎn)值主要包括林木的培育和種植,木材、竹材采運(yùn)產(chǎn)值,林產(chǎn)品產(chǎn)值等。其中林木的培育和種植采用以費(fèi)用代替生長(zhǎng)量計(jì)算,即按從事人造林木各項(xiàng)生產(chǎn)活動(dòng)的成本計(jì)算,先取得育苗面積、造林面積、零星植樹株數(shù)、跡地更新面積、幼林撫育面積、成林撫育面積六項(xiàng)資料,然后分別乘以上述各項(xiàng)生產(chǎn)活動(dòng)的單位成本得到。
3.簡(jiǎn)單的描述性統(tǒng)計(jì)分析
運(yùn)用SPSS對(duì)這八個(gè)指標(biāo)進(jìn)行描述統(tǒng)計(jì)分析,對(duì)數(shù)據(jù)進(jìn)行過程處理,得到處理結(jié)果如下:
1. 四大類指標(biāo)中農(nóng)業(yè)總產(chǎn)值平均值最高為2314.4584,林業(yè)總產(chǎn)值平均值最低為192.3087。
2. 31省份指標(biāo)差異性最大也就是離散程度最高(標(biāo)準(zhǔn)差最大為1614.18928)的為農(nóng)業(yè)總產(chǎn)值,其次是牧業(yè)總產(chǎn)值;省份間差異性較小(標(biāo)準(zhǔn)差為147.11588)的為是漁業(yè)總產(chǎn)值。
4.實(shí)證分析
統(tǒng)計(jì)或計(jì)量方法的介紹:
系統(tǒng)聚類法(或?qū)哟尉垲惙?,hierarchical clustering method)是通過一系列相繼的合并或相繼的分割來進(jìn)行的,分為聚集的(agglomerative) 和分割的(divisive)兩種,適用于樣品數(shù)目n不是很大的情形。聚集系統(tǒng)法的基本思想是:開始時(shí)將n個(gè)樣品各自作為一類,并規(guī)定樣品之 間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個(gè)新類, 計(jì)算新類與其他類的距離;重復(fù)進(jìn)行兩個(gè)最近類的合并,每次減少一類, 直至所有的樣品合并為一類。常用的系統(tǒng)聚類方法有: 最短距離法、最長(zhǎng)距離法、類平均法、重心法、離差平方和法(Ward方法),以上系統(tǒng)聚類方法的區(qū)別在于類與類之間距離的計(jì)算方法不同。
動(dòng)態(tài)聚類法,只能用于對(duì)樣品的聚類,而不能用于對(duì)變量的聚類。 動(dòng)態(tài)聚類法有許多種方法,一種比較流行的動(dòng)態(tài)聚類法為k均值法(k-means法) 。動(dòng)態(tài)聚類法的計(jì)算量要比建立在距離矩陣基礎(chǔ)上的系統(tǒng)聚類法小得 多。因此,使用動(dòng)態(tài)聚類法計(jì)算機(jī)所能承受的樣品數(shù)目n要遠(yuǎn)遠(yuǎn)超過使用系統(tǒng)聚類法所能承受的n。
k均值法(k-means法)的基本步驟:
1.選擇k個(gè)樣品作為初始凝聚點(diǎn),或者將所有樣品分成k個(gè)初始類,然 后將這k個(gè)類的重心(均值)作為初始凝聚點(diǎn)。
2. 對(duì)除凝聚點(diǎn)之外的所有樣品逐個(gè)歸類,將每個(gè)樣品歸入凝聚點(diǎn)離它 最近的那個(gè)類(通常采用歐氏距離),該類的凝聚點(diǎn)更新為這一類 目前的均值,直至所有樣品都?xì)w了類。
3. 重復(fù)步驟2,直至所有的樣品都不能再分配為止。最終的聚類結(jié)果在一定程度上依賴于初始凝聚點(diǎn)或初始分類的選擇。 經(jīng)驗(yàn)表明,聚類過程中的絕大多數(shù)重要變化均發(fā)生在第一次再分配中。
(2)數(shù)據(jù)與模型相結(jié)合分析
表1為我國(guó)2020 年31省份農(nóng)林牧漁業(yè)總產(chǎn)值數(shù)據(jù)情況,我們想要用這四個(gè)指標(biāo)來分析疫情發(fā)展一整年我國(guó)北京等31個(gè)省、直轄市、自治區(qū)農(nóng)林牧漁業(yè)水平分別屬于哪一個(gè)類別,哪幾個(gè)省市農(nóng)林牧漁業(yè)水平處在同一個(gè)水平。
運(yùn)用SPSS對(duì)這四個(gè)指標(biāo)進(jìn)行聚類分析,先進(jìn)行系統(tǒng)聚類,得到初始的聚類結(jié)果樹狀圖,確定聚類的個(gè)數(shù),然后運(yùn)用K-means方法繼續(xù)聚類。
第一步:先進(jìn)行系統(tǒng)聚類,這里的系統(tǒng)聚類法,分別采用歐氏距離的類平均法、最短距離法、最長(zhǎng)距離法把31個(gè)省市分類來得到我們需要的結(jié)論。對(duì)數(shù)據(jù)進(jìn)行系統(tǒng)聚類過程處理,得到處理結(jié)果:
1. 其中三個(gè)方法得到的數(shù)據(jù)缺失值報(bào)告均一致:
數(shù)據(jù)的缺失值為0,很可觀,可對(duì)其進(jìn)行聚類分析。
2. 三個(gè)方法得到的樹狀聚類圖結(jié)果顯示:類平均法和最遠(yuǎn)近鄰法這兩種方法來看,聚類數(shù)分為3類較為合適,最近鄰元素法最合適分類不太明顯。
第二步:再利用K-means法對(duì)31個(gè)省、市、自治區(qū)的城鎮(zhèn)居民消費(fèi)水平進(jìn)行聚類分析,其中聚類數(shù)分為3類。
K=3時(shí)的k-means輸出結(jié)果如下:
1. 通過初始聚類中心表:可以看出,第一類的各指標(biāo)值總體上是最優(yōu)的,往下依次為第二類和第三類。
2. 迭代歷史記錄表展示了3個(gè)類中心點(diǎn)每次迭代的偏移情況,第三次迭代3個(gè)類的中心點(diǎn)偏移達(dá)到指定判定標(biāo)準(zhǔn)。
3. 最終聚類中心表展示了3個(gè)類的最終類中心情況,總體來看,第一類各指標(biāo)值仍是最優(yōu)的。
4. ANOVA表可以看出漁業(yè)總產(chǎn)值對(duì)聚類分析影響較小,顯著性大于0.05,農(nóng)業(yè)、林業(yè)、牧業(yè)總產(chǎn)值等對(duì)聚類分析影響較大。由于已選擇聚類以使不同聚類中個(gè)案之間的差異最大化,因此 F 檢驗(yàn)只應(yīng)該用于描述目的。實(shí)測(cè)顯著性水平并未因此進(jìn)行修正,所以無法解釋為針對(duì)“聚類平均值相等”這一假設(shè)的檢驗(yàn)。
5. 每個(gè)聚類中的個(gè)案數(shù)目表:給出了各類中的樣品數(shù)目,第一類包括13個(gè)地區(qū),第二類包括15個(gè) 地區(qū),第三類包括3個(gè)地區(qū)。
5.結(jié)論
以上先針對(duì)八大指標(biāo)先進(jìn)行了系統(tǒng)聚類,得到每?jī)蓚€(gè)地區(qū)或類間的聚類過程,確定聚類數(shù)量為3,在此基礎(chǔ)上在進(jìn)行K-means聚類,通過這兩種方法的結(jié)合,使分析更充分優(yōu)化,得到疫情下2020年的全國(guó)31個(gè)省、市、自治區(qū)的農(nóng)、林、牧、漁業(yè)各總產(chǎn)值的差異化分析,得到了這31個(gè)省、直轄市、自治區(qū)消費(fèi)水平分別屬于哪一個(gè)類別,哪幾個(gè)省市消費(fèi)水平處在同一個(gè)水平,其中:
第一類:山東省、河南省、四川省,這3個(gè)省份農(nóng)業(yè)總產(chǎn)值尤其高,農(nóng)業(yè)產(chǎn)出大省;
第二類:江蘇省、黑龍江省、廣東省、湖北省、河北省、湖南省、廣西壯族自治區(qū)、新疆維吾爾自治區(qū)、云南省、陜西省、貴州省、安徽省、遼寧省、福建省、內(nèi)蒙古自治區(qū),這些省份農(nóng)牧業(yè)總產(chǎn)值還可以,部分省份漁業(yè)總產(chǎn)值不錯(cuò);
第三類:北京市、天津市、山西省、吉林省、上海市、浙江省、江西省、海南省、重慶市、西藏自治區(qū)、甘肅省、青海省、寧夏回族自治區(qū),這些省份農(nóng)、林、牧、漁業(yè)各總產(chǎn)值均較低,這些城市城市發(fā)展更多的不依賴于農(nóng)業(yè),比如北京、天津、上海等更多的依賴于科技、金融等。
6.分析與討論
2020年新冠肺炎疫情對(duì)我國(guó)經(jīng)濟(jì)產(chǎn)生了重大沖擊,此次疫情情對(duì)國(guó)民經(jīng)濟(jì)、農(nóng)業(yè)和農(nóng)業(yè)食物系統(tǒng)的沖擊顯著。與無疫情基期相比,全國(guó) GDP 下降嚴(yán)重的情況下,農(nóng)業(yè)下降的幅度相對(duì)小一些。特殊時(shí)期,保障國(guó)家糧食安全和重要農(nóng)產(chǎn)品有效供給更是尤為重要,2020 年又是全面建成小康社會(huì)和“十三五”規(guī)劃收官之年,也是脫貧攻堅(jiān)決戰(zhàn)決勝之年,面對(duì)國(guó)內(nèi)外風(fēng)險(xiǎn)與挑戰(zhàn),我們穩(wěn)住了農(nóng)業(yè),尤其是農(nóng)業(yè)大省的農(nóng)林牧漁業(yè)總產(chǎn)值。未來我們不僅要體量更要質(zhì)量,更要堅(jiān)持農(nóng)業(yè)科技優(yōu)先發(fā)展,深化農(nóng)業(yè)科技體制改革確保糧食和重要副食品的安全。
參考文獻(xiàn):
[1]郭志剛.《社會(huì)統(tǒng)計(jì)分析方法——SPSS軟件應(yīng)用》中國(guó)人民大學(xué)出版社
[2]張啟楠,張凡凡,曾詠梅.《我國(guó)城鎮(zhèn)化率與農(nóng)林牧漁業(yè)總產(chǎn)值之間的關(guān)系》江西農(nóng)業(yè)
[3]魏后凱.《協(xié)調(diào)推進(jìn)農(nóng)林牧漁業(yè)現(xiàn)代化改革的核心內(nèi)涵》 中國(guó)禽業(yè)導(dǎo)刊
[4]于超,江賽君,許光宇.《以企業(yè)產(chǎn)品法開展農(nóng)林牧漁業(yè)統(tǒng)計(jì)的探索思考》統(tǒng)計(jì)科學(xué)與實(shí)踐
作者簡(jiǎn)介:張靜(1992.1-),女,滿族,天津市,本科,對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)統(tǒng)計(jì)學(xué)院,研究方向:大數(shù)據(jù)科學(xué)與應(yīng)用。