国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SPSS的數(shù)據(jù)模型分析

2020-09-10 05:23:53佘雅婷
關(guān)鍵詞:建模

佘雅婷

摘要:進(jìn)行數(shù)據(jù)分析工作的基礎(chǔ)是掌握數(shù)據(jù)分析方法?;貧w分析、聚類分析、因子分析是三種在實(shí)際工作中經(jīng)常使用的多元統(tǒng)計方法,不過通常在實(shí)際使用過程中容易使用錯誤或不易區(qū)分。本文基于數(shù)據(jù)分析理論基礎(chǔ)運(yùn)用SPSS軟件求解數(shù)據(jù)分析模型并對三種方法進(jìn)行對比。

關(guān)鍵詞:數(shù)據(jù)分析模型;SPSS;建模

數(shù)據(jù)分析即把具有價值的信息從數(shù)據(jù)中提取出來,在該過程中離不開對數(shù)據(jù)各種形式的分類以及處理,數(shù)據(jù)分析員必須準(zhǔn)確掌握高效的數(shù)據(jù)分類方法以及數(shù)據(jù)處理模式,才可以發(fā)揮事半功倍的效果。

SPSS是英文Statistical Package for the Social Science(社會科學(xué)統(tǒng)計軟件包)的縮寫.SPSS名為社會科學(xué)統(tǒng)計軟件包,常適用于工學(xué)、農(nóng)學(xué)、醫(yī)學(xué)、教育學(xué)、管理學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)、體育學(xué)、商學(xué)等多種領(lǐng)域。SPSS數(shù)據(jù)分析工具的基礎(chǔ)功能是數(shù)據(jù)輸入輸出全生命周期管理、數(shù)據(jù)統(tǒng)計分析、圖表可視化分析等。SPSS同時提供專業(yè)的制圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。

一、回歸分析

回歸分析方法是以相關(guān)原則為基礎(chǔ)的能夠定量預(yù)測的方法。依據(jù)具有變量的數(shù)量,細(xì)化成兩類,一元回歸分析以及多元回歸分析;依據(jù)自變量以及因變量兩者間關(guān)系結(jié)構(gòu),細(xì)化成線性回歸分析以及非線性回歸分析;依據(jù)啞變量的書序位置,細(xì)化為含啞變量回歸分析、線性概率模型和Logistic即邏輯回歸分析。在此重點(diǎn)介紹多元線性回歸分析。

多元線性回歸模型的定義是當(dāng)回歸具有一個因變量y和大于等于兩個自變量x,描繪因變量隨著若干個自變量以及誤差項而變動的數(shù)學(xué)方程。具有k個自變量x1,x2,…,xk的多元線性回歸模型能夠顯示如下

y=β0+β1 x1+β2 x2+…+βk xk+ε

式中:β0,β1,β2,…,βk是方程的偏回歸系數(shù);ε是被稱為誤差項的隨機(jī)變量;y是x1,x2,…,xk的線性函數(shù)加上誤差項。

多元線性回歸分析方法能夠歸納為五個基本流程:第一,確定變量,對照課題的目標(biāo)以及內(nèi)容確定自變量以及因變量;第二,建立模型,依據(jù)上文提到的回歸模型理論基礎(chǔ)建立;第三步,參數(shù)估計;第四步,檢驗以及更改模型,不過回歸模型的質(zhì)量仍必須去校驗?zāi)P妥约汉透鱾€參數(shù)項,常見的檢驗方法包括統(tǒng)計檢驗(像擬合優(yōu)度檢驗、回歸模型線性F檢驗、參數(shù)t檢驗等等)和殘差圖檢驗;第五步,模型的運(yùn)用。

選取逐步回歸法,利用SPSS工具運(yùn)行后得到如下數(shù)據(jù):回歸系數(shù)b=(β0,β1,β2)=( -0.443, 0.05, -0.032),包含三個檢驗統(tǒng)計量:相關(guān)系數(shù)的平方R2,假設(shè)驗證統(tǒng)計量F,與驗證統(tǒng)計量F一一對照的概率p這三個變量如下所示:0.739;35.037;0.000,得到初步的回歸模型為y=-0.443+0.05x1-0.032x2,模型中x1表示各項貸款余額,x2表示本年固定資產(chǎn)投資額。參照檢驗統(tǒng)計量R, 驗證統(tǒng)計量F, 概率p的大小得出本數(shù)學(xué)模型能否使用的結(jié)論。

(一)相關(guān)系數(shù)R的評價。這個條件下判定系數(shù)是0.739,得出結(jié)論該模型線性相關(guān)性較強(qiáng)。

(二)F檢驗法(線性關(guān)系檢驗)。F=35.037>F1-0.05 (2,22)=3.1

(三)p值檢驗。P=0.000,符合約束條件 p<α=0.05,使用三種不同的統(tǒng)計校驗方法得到的結(jié)論相同,得出結(jié)論因變y和自變量x二者間存在顯著的線性相關(guān)關(guān)系,假設(shè)建立的線性回歸模型成立可以用于數(shù)學(xué)分析。

二、聚類分析

聚類分析方法是把研究中的對象進(jìn)行分類,分類依據(jù)是相同類元素間的相似性遠(yuǎn)強(qiáng)于不屬于該類元素的相似性。本數(shù)學(xué)分析方法的意義是實(shí)現(xiàn)相同類元素同質(zhì)性最大化以及不同類間元素異質(zhì)性最大化。聚類分析常用的分析方法有系統(tǒng)聚類法,K均值聚類法等等。

系統(tǒng)聚類也稱層次聚類(Hierarchical Cluster),不需要事先確定要分多少類,其聚類過程是一層層進(jìn)行,先把每一個對象作為一類,然后一層層進(jìn)行分類,會得出所有可能的類別結(jié)果,而研究者由實(shí)際情況確定需要的類別。K均值聚類又可以叫做快速聚類(quick cluster),這種分析方法在進(jìn)行分析前要明確所需分類的數(shù)量。

K均值聚類步驟:第一步,確定要分的類別數(shù)目K;第二步,確定K個類別的原始聚類中心位置,可以采用人工選定K個樣本點(diǎn)的方式確定聚類中心,還可以令系統(tǒng)隨機(jī)選定K個樣本點(diǎn)的方式確定聚類中心;第三步,計算仍未包含在類之中的剩下的樣本點(diǎn)距離聚類中心數(shù)值的大小,把其劃分到距離其最近的類;第四步,將重新分好的類的均值更新為新的聚類中心,更新所有樣本點(diǎn)距離新聚類中心的數(shù)值;第五步,循環(huán)進(jìn)行第4步操作,直至實(shí)現(xiàn)緊挨的兩次聚類結(jié)果不發(fā)生特別大的變化停止。

使用系統(tǒng)聚類法:繪圖選項中點(diǎn)擊繪制樹狀圖,聚類方法選用Ward法,標(biāo)準(zhǔn)化選用z分?jǐn)?shù)。聚類結(jié)果,粗黑線從左到右依次代表將飲料分為五類、四類、三類、兩類。

使用K均值聚類法:把原始變量進(jìn)行標(biāo)準(zhǔn)化處理,把標(biāo)準(zhǔn)化處理之后的變量當(dāng)成聚類變量的初始值,聚類數(shù)預(yù)定是4。分析報告中“聚類”給出每個飲料的列別數(shù),給出了每個飲料距離其所在類中心點(diǎn)的距離。參照給定的方差分析表能夠得到按照分析方法分出的類別可否使用的結(jié)論。從表中可以看出,分類后熱量和價格在不同類別之間是顯著的(p<0.05),咖啡因和納不顯著(p>0.05)。

通過這個例題我們可以得出結(jié)論,兩種方法給有優(yōu)缺點(diǎn)。K均值聚類法必須分析前確定類別個數(shù),比之系統(tǒng)聚類法計算量會小的多,效率較高。系統(tǒng)聚類法不需要分析前確定類別分?jǐn)?shù),本方法能夠繪制得到樹狀聚類圖,更加方便直觀。

三、因子分析

因子分析方法是實(shí)現(xiàn)數(shù)據(jù)簡化的方法,該法對若干變量間的相互關(guān)系進(jìn)行探究,研究參考數(shù)據(jù)的基本數(shù)據(jù)結(jié)構(gòu),同時假設(shè)少量的有限個假想變量代表它的基本數(shù)據(jù)結(jié)構(gòu),假定的有限個假想變量就可以代表最初若干變量的大量信息。參考變量為能夠進(jìn)行觀測的顯性變量,另外假想變量為不能夠進(jìn)行觀測的隱性變量,我們把它稱之是因子。

假設(shè)原有變量有p個,分別用x1,x2,x3…xp表示xi(i=1,2, …p)為均值為零、標(biāo)準(zhǔn)差為壹的標(biāo)準(zhǔn)化變量,F(xiàn)1,F(xiàn)2,F(xiàn)3…Fm分別表示m個因子變量,m應(yīng)小于p0于是有:

x1=a11 F1-a12 F2+…+a1m Fm+a1 ε1

x2=a21 F1-a22 F2+…+a2m Fm+a2 ε2

xp=ap1 F1-ap2 F2+…+apm Fm+ap εp

也可以矩陣的形式表示為:X=AF+aε

上文講述了回歸分析、聚類分析、因子分析三種分析模型的理論知識,并使用SPSS輔助工具進(jìn)行了實(shí)例操作??梢钥吹?,針對不同的數(shù)據(jù)選用不同的模型。因子分析和回歸分析是兩種不同的分析方法,因子分析提到的因子為相對抽象的理論,此外回歸因子卻是具有特別確定的實(shí)際意義和價值。聚類分析常用于簡化數(shù)據(jù)。

參考文獻(xiàn):

[1]陳永勝,宋立新.多元線性回歸建模以及SPSS軟件求解【J】.通化師范學(xué)院學(xué)報,2007,28(12).

猜你喜歡
建模
聯(lián)想等效,拓展建模——以“帶電小球在等效場中做圓周運(yùn)動”為例
縝密審題,準(zhǔn)確建模,學(xué)以致用
基于PSS/E的風(fēng)電場建模與動態(tài)分析
電子制作(2018年17期)2018-09-28 01:56:44
不對稱半橋變換器的建模與仿真
IDEF3和DSM在拆裝過程建模中的應(yīng)用
三元組輻射場的建模與仿真
措美县| 浦城县| 安龙县| 灵寿县| 曲周县| 阿勒泰市| 龙江县| 综艺| 临清市| 南汇区| 宝坻区| 嵊泗县| 丰宁| 东莞市| 汽车| 厦门市| 那曲县| 阆中市| 香河县| 广平县| 故城县| 怀安县| 赤城县| 甘孜| 布尔津县| 扎鲁特旗| 普陀区| 台北市| 兴安县| 白山市| 安顺市| 南京市| 水富县| 浙江省| 上栗县| 武胜县| 巩留县| 商河县| 桂平市| 安仁县| 丰都县|