国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺談主成分分析與因子分析方法的聯(lián)系與區(qū)別

2011-12-30 02:50:26滕達(dá)
中國新技術(shù)新產(chǎn)品 2011年22期
關(guān)鍵詞:方差分析法變量

滕達(dá)

(吉林工商學(xué)院會計(jì)分院,吉林 長春 130062)

1 問題的提出

在現(xiàn)實(shí)生活或科學(xué)研究過程中,影響某一事物的特征或該事物發(fā)展規(guī)律的因素是多元化的,我們在對這些影響因素對于事物的影響進(jìn)行研究過程中,該事物的某一特征作為統(tǒng)計(jì)學(xué)意義上的因變量,而影響因素則作為自變量。為了更加全面的對事物的特征或發(fā)展規(guī)律進(jìn)行反映,需要綜合與其相關(guān)各種影響因素進(jìn)行評價(jià),即在研究過程中對于影響事物特征或發(fā)展規(guī)律的因素需要更多的引入,對其進(jìn)行綜合分析和評價(jià)。然而,多變量大樣本資料盡管可以對事物特征或發(fā)展規(guī)律提供更加全面的信息,但同時(shí)帶來了多重共線性等問題,使得影響因素所反映的信息重復(fù),影響統(tǒng)計(jì)結(jié)果的真實(shí)性和科學(xué)性。對此,降維思想成為解決這一問題的有效方式。主成分分析和因子分析方法都是運(yùn)用降維的思想,將多變量信息歸納為少數(shù)幾個(gè)相互無關(guān)的的綜合變量以反映原來數(shù)據(jù)的大部分信息。

近年來,主成分分析和因子分析方法作為一種統(tǒng)計(jì)分析方法在科學(xué)研究中的應(yīng)用十分廣泛,運(yùn)用其進(jìn)行多變量分析的學(xué)術(shù)文獻(xiàn)越來越多。然而,在實(shí)際使用過程中,常常出現(xiàn)一些將兩種方法進(jìn)行混淆的錯(cuò)誤,由此產(chǎn)生的統(tǒng)計(jì)分析結(jié)果在科學(xué)性上大打折扣。因子分析方法是主成分分析方法的推廣和發(fā)展,兩種方法之間既存在共同之處,也有著顯著的差別,有必要對兩種方法之間的聯(lián)系和區(qū)別進(jìn)行嚴(yán)格區(qū)分,并針對實(shí)際問題選擇恰當(dāng)?shù)姆治龇椒ā?/p>

2 兩者的聯(lián)系與區(qū)別

2.1 兩者的聯(lián)系

主成分分析和因子分析方法都屬于多元統(tǒng)計(jì)分析中處理降維的統(tǒng)計(jì)方法。在數(shù)理統(tǒng)計(jì)的基本原理上,兩者都是基于多變量的相關(guān)系數(shù)矩陣,在確保較少信息缺失的前提下(一般小于或等于15%),用少數(shù)幾個(gè)不相關(guān)綜合變量概括多個(gè)變量的信息(多個(gè)變量之間存在較強(qiáng)的相關(guān)性)。即用少數(shù)不相關(guān)的綜合變量盡可能全面的反映多個(gè)原始變量的信息,消除了原始變量的相關(guān)性,可信度得到提高,統(tǒng)計(jì)結(jié)果可以有效地解釋現(xiàn)實(shí)問題。需要注意的是,兩種方法產(chǎn)生的新的變量(因子)不是原始變量篩選后的剩余變量,而是綜合所有變量信息后的新變量。其中,在主成分分析過程中,新變量是原始變量的線性組合,即將多個(gè)原始變量經(jīng)過線性(坐標(biāo))變換得到新的變量。在因子分析過程中,新變量則是通過原始變量之間的復(fù)雜關(guān)系對原始變量進(jìn)行分解,得到公共因子和特殊因子。其中公共因子是所有原始變量中所共同具有的特征,而特殊因子則是原始變量所特有的部分。兩種方法下得到的主成分變量與因子變量在數(shù)量上顯著少于原始變量,起到了降維的作用,也提高了數(shù)據(jù)有效利用程度。

2.2 兩者的區(qū)別

2.2.1 基本概念不同主成分分析法是將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)彼此不相關(guān)的綜合指標(biāo)(即主成分)的統(tǒng)計(jì)方法。而因子分析法是主成分分析法的推廣和發(fā)展,它也是將具有錯(cuò)綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個(gè)因子,再根據(jù)不同因子還可以對變量進(jìn)行分類,同時(shí)重塑原始變量與因子之間的相互關(guān)系。

2.2.2 基本原理不同

主成分分析方法旨在通過方差-協(xié)方差矩陣將多個(gè)原始變量通過多次線性變換得到少數(shù)幾個(gè)主成分(新的變量),這些主成分變量能夠反映原始變量盡可能多的信息(一般大于或者等于85%為通過標(biāo)準(zhǔn)),并且它們之間不相關(guān)。從數(shù)理上講,主成分分析法是一種矩陣變換的方法,即將給定的變量(原始變量)通過多次線性變換,轉(zhuǎn)換成一組彼此不相關(guān)的變量,在這個(gè)過程中,變量的方差之和保持不變,方差最大的作為第一主成分變量,以此類推,得到數(shù)量較少的、可以涵蓋大部分原始變量信息幾個(gè)主成分,從這個(gè)意義上講,主成分分析法是作為因子分析的一種方式。

而因子分析法則是通過原始變量的相關(guān)系數(shù)矩陣將變量進(jìn)行分組,分組的原則是將相關(guān)性較高的變量置于一組中,但組與組之間的變量相關(guān)性較低。這樣各組變量代表一個(gè)基本要素(公共因子),所研究的問題可以分解為少數(shù)幾個(gè)公共因子的線性函數(shù)與特殊因子之和??梢?,因子分析法下的新變量是對原始變量進(jìn)行分解得到,而不是原始變量的線性組合。具體而言,就是通過獲取原始變量中可測量的、具有一定相關(guān)性的統(tǒng)計(jì)指標(biāo)測定各個(gè)因子的狀態(tài)。從該意義上來講,因子分析只能解釋變量的部分變異,而主成分分析法則解釋了所有變異。

2.2.3 數(shù)據(jù)處理過程不同

在消除量綱和數(shù)量級的處理上,主成分分析通常需要對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將原始數(shù)據(jù)轉(zhuǎn)換成為均值為0、方差為1的標(biāo)準(zhǔn)化數(shù)據(jù)。而因子分析法對此則要求不高,這是因?yàn)橐蜃臃治龇ū旧砜梢酝ㄟ^加權(quán)最小二乘法、主成分法等求解因子變量,在這個(gè)過程中,因子是原始變量內(nèi)部分解的結(jié)果,與原始變量是否同量綱關(guān)系不大。只有通過主成分法確認(rèn)因子變量時(shí),需要對原始數(shù)據(jù)進(jìn)行無量綱化處理。另外一點(diǎn),主成分分析法下的新變量(主成分)是通過原始變量的多次線性組合后得到的,這個(gè)過程本身具有可逆性;而在因子分析法下,因子分析中的載荷矩陣是不可逆的,只能通過可觀測的原變量去估計(jì)不可觀測的公共因子。

此外,主成分分析法主要側(cè)重于變量的信息貢獻(xiàn)能力,而因子分析法則側(cè)重于因子的可解釋性。

2.2.4 統(tǒng)計(jì)軟件實(shí)現(xiàn)過程不同-以SPSS為例

在利用統(tǒng)計(jì)軟件SPSS進(jìn)行主成分分析時(shí),其基本步驟大致為:(1)對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;(2)選擇 "分析(Analyze)- 數(shù)據(jù)提?。―ata Reduction)-成分分析(Factor Analyze)"打開主成分分析對話框,在"數(shù)據(jù)描述(Descriptives):相關(guān)系數(shù)矩陣(Correlation Matrix)"框中選系數(shù)(Coefficients),"統(tǒng)計(jì)(Statistics)"框中選初始解(Initial solution);Step4:"提?。‥xtraction):方式(Method)"框中選主成分(Principal components);"分析(Analyze)框 "中選相關(guān)系數(shù)矩陣(Correlation matrix);"顯示(Display)"框中選未經(jīng)旋轉(zhuǎn)的因子載荷(Unrotated factor solution);" 提取(Extract)" 框中選特征值(Eigenvalues);Step5:結(jié)果顯示在 Output中:提取方差總合計(jì)(Total Variance Explained)中主成分的累計(jì)貢獻(xiàn)率大于等于85%的主成分個(gè)數(shù):"Component Matrix"中第i個(gè)主成分的列向量除以相應(yīng)特征根的平方根后就得到這個(gè)主成分的變量系數(shù)向量,可以利用"Transform-compute"來實(shí)現(xiàn);Step6:寫出主成分表達(dá)式及主成分命名。

在利用統(tǒng)計(jì)軟件SPSS進(jìn)行因子分析時(shí),其基本步驟為:(1)--(4)同主成分分析的實(shí)現(xiàn)過程;(5)"旋轉(zhuǎn)(Rotation):方式(Method)"框中選最大方差法(Varimax),"顯示(Display)"框中選擇旋轉(zhuǎn)的因子載荷陣(Rotated solution);(6)" 得分(Scores)" 框中變量形式保存(Save as variables),"方法(Method)"框中選中回歸(Regression);(7)結(jié)果同樣顯示在 Output中,提取方差總合計(jì)(Total Variance Explained)中主成分的累計(jì)貢獻(xiàn)率大于等于85%的因子個(gè)數(shù),并對各個(gè)因子進(jìn)行命名,并根據(jù)因子得分函數(shù)對因變量進(jìn)行排序。

結(jié)束語

目前,主成分分析法和因子分析法在科學(xué)研究中應(yīng)用十分廣泛,在處理多變量、大樣本的統(tǒng)計(jì)問題上優(yōu)勢十分明顯。因此,廣受學(xué)術(shù)界學(xué)者們的青睞。但是,在現(xiàn)實(shí)中,因?yàn)閮煞N方法之間存在著諸多內(nèi)在的聯(lián)系,不少學(xué)者在運(yùn)用這兩種方法解決問題過程中常常出現(xiàn)混淆使用的現(xiàn)象,統(tǒng)計(jì)軟件輸出的結(jié)果也很難解釋,科學(xué)性和可信性大打折扣。因此,明確兩種方法之間的聯(lián)系和區(qū)別,正確、恰當(dāng)?shù)氖褂眠@兩種方法,對于學(xué)術(shù)研究十分關(guān)鍵。本文正基于此,探討了兩種方法之間的聯(lián)系和區(qū)別,以期拋磚引玉。

[1]魏艷華,王丙參,田玉柱.主成分分析與因子分析的比較研究,天水師范學(xué)院學(xué)報(bào),2009年第3期.

[2]景慧麗.主成分分析和因子分析比較.商業(yè)文化.2008年第8期.

[3]馬娟,楊益民.主成分分析與因子分析之比較及實(shí)證分析.市場研究,2007年第3期.

猜你喜歡
方差分析法變量
方差怎么算
異步機(jī)傳統(tǒng)分析法之困難及其克服
概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
抓住不變量解題
也談分離變量
計(jì)算方差用哪個(gè)公式
方差生活秀
基于時(shí)間重疊分析法的同車倒卡逃費(fèi)探析
層次分析法在SWOT分析法中的應(yīng)用
SL(3,3n)和SU(3,3n)的第一Cartan不變量
苍山县| 湖州市| 邵阳市| 儋州市| 肇东市| 麟游县| 南陵县| 来凤县| 尼玛县| 崇文区| 监利县| 麻江县| 家居| 香河县| 临城县| 枣强县| 青浦区| 图片| 台北县| 双江| 宜川县| 平昌县| 宣汉县| 明光市| 湘西| 新安县| 天峻县| 永福县| 清河县| 民县| 丹凤县| 嫩江县| 于都县| 大埔县| 文山县| 容城县| 方山县| 宝应县| 香河县| 禄丰县| 临清市|