高小明
(閩南理工學院,福建 泉州 362700)
應用主成分分析對學生綜合素質進行評價
高小明
(閩南理工學院,福建 泉州 362700)
運用主成分分析方法,對高校學生的綜合素質進行評價。避免傳統(tǒng)方法在綜合評價中對指標的主觀選擇及對權重的主觀判斷,使權重的分配更合理,盡可能地減少重疊信息的不良影響,克服變量之間的多重相關性,簡化系統(tǒng)分析。
主成分分析;綜合素質;評價
高校在對學生的綜合素質進行評價時,傳統(tǒng)的做法是從現(xiàn)有的指標中精選出若干個有代表性的指標,但人為地精選指標難免帶有主觀隨意性,可能丟失部分有價值的原始信息。
而利用主成分分析法對多維變量進行降維,降維后的變量是原變量的線性組合,并能反映原變量絕大部分的信息,使信息量損失最小,對原變量的綜合解釋能力強。該方法通過主成分的方差貢獻率來表示變量的作用,可避免在系統(tǒng)分析中對權重的主觀判斷,使權重的分配更合理,盡可能地減少重疊信息的不良影響,克服變量之間的多重相關性,簡化系統(tǒng)分析。
從實際的運行結果來看,應用主成分分析法對高校學生的綜合素質進行評價總體上是合理的,這能為大學生在校期間創(chuàng)造一個相對公平的育人環(huán)境,因此是有積極意義的。
1.1 什么是主成分分析
在實際問題中,研究多指標(變量)問題是經(jīng)常遇到的,在很多情況下,不同的指標之間具有一定的相關性。由于指標較多并且指標之間有一定的相關性,增加了分析問題的復雜性。主成分分析就是將原指標重新組成一組新的相互無關的綜合指標以代替原指標,同時根據(jù)實際需要從中可取幾個較少的綜合指標盡可能多地反映指標的統(tǒng)計方法叫做主成分分析或主分量分析。
將原來p個指標作線性組合,作為新的綜合指標,然后從中選取若干個,準則如下:用Fi(i=1,2,…)表示綜合指標,選擇其中方差最大的(方差越大包含的信息越多)那個綜合指標作為第一個綜合指標,標記為 F1,稱為第一主成分,即Var(F1)最大。如果第一主成分不足以代表原來p個指標的信息,再考慮選取第二個綜合指標,為了有效反映原來信息,F(xiàn)1已有的信息就不需要出現(xiàn)在F2中,用數(shù)學語言表達就是Cov(F1,F(xiàn)2)=0,稱F2為第二主成分,依此類推可以構造出第三、四,…,第p個主成分,雖然這樣做會損失一部分信息,但是由于它使我們抓住了主要矛盾,并從原始數(shù)據(jù)中進一步提取了某些新的信息,因而在某些實際問題的研究中得益比損失大。
2.2 主成分分析法及其主要研究思路
由提供的信息得到原始資料矩陣:
表示矩陣X的列向量,為簡單計,不妨設X1,…,XP已經(jīng)過標準化。
原始數(shù)據(jù)來源:漳州師范學院**級數(shù)學與應用數(shù)學專業(yè)本科班37位同學2003-2004學年各門課程的成績。(成績見附錄一)
該學年該班同學共修了10門課程,每位同學均有成績,即沒有缺失值。具體的指標為:X1:高等代數(shù),X2:數(shù)學分析1,X3:C語言,X4:英語1,X5:心理學,X6:鄧小平理論, X7:英語2,X8:常微分,X9:近世代數(shù),X10:數(shù)學分析2。
3.1 標準化
一般情況下,進行主成分分析,由于原始數(shù)據(jù)各指標的量綱不同,分析時需進行標準化處理,具體步驟是:
(1)中心化
(2)標準化
3.1 建立相關系數(shù)陣,求特征值和單位特征向量
表1
對表1的分析:表1中的主成分的特征值與方差貢獻率都是按從大到小排列,4個主成分可以解釋所有變量總方差的85.89%,這意味著在新的指標體系中4個指標就可以反映樣本差異的85.89%。
表2
對表2的分析:根據(jù)表2提供的數(shù)據(jù)可建立主成分Fi的線性表達式
第一主成分是專業(yè)素質變量,包括高等代數(shù),數(shù)學分析1,常微分,近世代數(shù),數(shù)學分析 2,這也是數(shù)學專業(yè)學生學習的主要專業(yè)課,從評價這個傳導機制上給予正確引導。第二主成分是人文素質變量,包括C語言,英語1,英語2。這是學生學習專業(yè)課程必不可缺的基礎內容。第三主成分是思想道德素質,即鄧小平理論。第四主成分是身心素質,即心理學。
按照各主成分的線性表達式計算出具體得分,以各主成分的方差貢獻率為權重系數(shù),計算出每個學生的綜合得分,進行排名,排名的結果是:
名次 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19座號29 4 37 25 12 6 2 22 7 21 17 3 18 11 14 10 19 16 5名次 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37座號 28 20 26 15 35 8 13 34 1 23 27 9 30 36 32 24 31 33
最終的評價結果總體上是符合實際情況的。因此主成分分析法是一種科學,簡便的評價方法。
附錄一
[1] 閻慈琳. 關于主成分分析做綜合評價的若干問題[J]. 數(shù)理統(tǒng)計與管理,1998,(2).
[2] 黃寧. 關于主成分分析應用的思考[J]. 數(shù)理統(tǒng)計與管理,1999,(5).
[3] 張祟甫,陳述云. 成分數(shù)據(jù)主成分分析及其應用[J]. 數(shù)理統(tǒng)計與管理,1996,(4).
[4] 方開泰. 實用多元統(tǒng)計分析[M]. 上海:華東師范大學出版社,1986.
Use the Principal Component Analysis to Evaluate College Students’ Comprehensive Qualities
GAO Xiao-ming
In conventional synthetic evaluation, we choose index and judge weight coefficient subjectively, in this paper we use the principal component analysis to evaluate college students’ comprehensive qualities, so the distribution of weight coefficient is more rational, and we can reduce the vicious influence of overlapping information as much as possible, overcome relevant between variances, simplify the systematic analysis .
Principal component analysis; Comprehensive qualities; Evaluation
O212.4
A
1008-7427(2012)05-0113-02
2012-03-08