曲霄紅
山西大同大學教育科學與技術(shù)學院 山西 037009
開源科學計算自由軟件SCILAB具有運行穩(wěn)定,占用計算機資源少,運行速度快等優(yōu)點,已經(jīng)被廣泛地引進到教育研究、教學及產(chǎn)品開發(fā)中。
教育考試的目的是根據(jù)考生在考試設(shè)計的行為目標上的測量結(jié)果,推測考生具有哪些心理結(jié)構(gòu),包括心理結(jié)構(gòu)的性質(zhì)和不同心理結(jié)構(gòu)之間的關(guān)系。以考試語言表述,這些心理結(jié)構(gòu)實質(zhì)就是考試測量的能力,能力結(jié)構(gòu)就是指這些能力的性質(zhì)以及它們的相互關(guān)系??荚嚲S度是指完全描述考生群體在考試中表現(xiàn)出的差異所要求的最小能力數(shù)。
從教育測量的角度看,命題人員希望同一試卷中部分試題測量的是某一主要潛質(zhì),另一部分試題測量另一主要潛質(zhì),即一個試卷可以分解成若干個單維量表。每個單維量表總分的意義比較明確,可以解釋考生在考試中的表現(xiàn)依據(jù)。這就需要研究考試的能力結(jié)構(gòu)和維度。
從統(tǒng)計學角度看,我們可以利用因子分析的方法分析考試的能力結(jié)構(gòu)和維度。因子分析實際上是一種統(tǒng)計方法,該方法分析一組觀察變量與少數(shù)假設(shè)變量的關(guān)系,統(tǒng)計學上稱這些假設(shè)變量為因子,并且認為這些因子包含了分析的觀察變量的大部分信息。因子分析利用觀察變量之間的相互關(guān)系,以及觀察變量與因子之間的關(guān)系,用少數(shù)因子來解釋觀察變量的大部分信息。
設(shè)有p個觀察變量,對n個考生進行測試后,獲得的測量結(jié)果為xi(i=1,2,…,p),而且測量結(jié)果已經(jīng)標準化,即每個觀察變量的測量結(jié)果的平均值為0,方差為1。因子模型為:
式中,F(xiàn)j(j=1,2,…,m)是由標準化的觀察變量分解出來的相互獨立的公共因子,其平均值為 0,方差為 1,它們是不可觀測的,其含義要根據(jù)具體情況來解釋。Ei是各觀察變量xi所特有的因子,稱為特殊因子。它們與公共因子Fj相互獨立,表示xi中所不能被公共因子解釋的部分。aij是觀察變量i在因子j上的負荷,也就是觀察變量i與因子j的相關(guān)系數(shù)。
上式也可以表示成矩陣形式:
因子分析是從眾多的原始變量中構(gòu)造出少數(shù)幾個具有代表意義的因子變量。這里有一個潛在的要求,即原有變量之間要具有比較強的相關(guān)性。如果原有變量之間不存在較強的相關(guān)關(guān)系,那么就無法從中綜合出能反映某些變量共同特性的少數(shù)公共因子變量來。
判斷原始變量是否合適做因子分析,最簡單的方法就是計算變量之間的相關(guān)系數(shù)矩陣。如果在相關(guān)系數(shù)矩陣在進行檢驗時,大部分相關(guān)系數(shù)都小于 0.3,那么這些變量不適合做因子分析。
因子分析中有多種確定因子變量的方法,獲得了相關(guān)系數(shù)矩陣后,需要決定采用哪一種因子分析模型進行因子分析??傮w上主成分法是最常用的確定因子變量的方法。
提取出因子后,必須確定應(yīng)該保留多少個因子,也就是確定考試的維度。保留的因子數(shù)不同,對考試內(nèi)部結(jié)構(gòu)解釋也不同,考試結(jié)果的一系列處理方式都將相應(yīng)不同。因此,因子分析研究時要認真考慮應(yīng)該保留多少個因子。確定保留的因子數(shù)有多種規(guī)則,這里選用的規(guī)則是:根據(jù)方差的累積貢獻率來確定,通常取累積貢獻率為80%。
提取出因子后,有時可能難以根據(jù)因子負荷對因子進行解釋和命名。解決這個問題的方法就是對因子進行旋轉(zhuǎn)。因子旋轉(zhuǎn)可以改變因子的負荷結(jié)構(gòu),因此可以改進對因子的解釋。
實際應(yīng)用過程中,可以對因子分析結(jié)果進行旋轉(zhuǎn),因子旋轉(zhuǎn)分為正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)。通常最常用的因子旋轉(zhuǎn)方式是正交旋轉(zhuǎn)中的方差最大正交旋轉(zhuǎn)。
因子分析的最主要結(jié)果是因子負荷和因子得分。這些結(jié)果一般以旋轉(zhuǎn)的因子負荷矩陣和因子得分系數(shù)矩陣形式報道。
對因子進行解釋實際上就是解釋哪些觀察變量在因子上的負荷有意義。這種意義包含兩個方面,統(tǒng)計意義和實際意義。
實際意義就是要確定一個變量在因子上的負荷應(yīng)該多大才有實際意義。如果變量在因子上的負荷為 0.2,則該因子只能解釋該變量方差的4%,這個結(jié)果可能太小。J.F.Hair等建議,為了保證因子對變量方差的解釋有實際意義,一般因子負荷最低應(yīng)該在0.3,比較重要的變量應(yīng)該在0.4以上,大于0.5才真正有實際意義。
根據(jù)因子分析法的原理和步驟,這里描述利用因子分析法分析考試的能力結(jié)構(gòu)和維度的計算過程(如圖1所示)。
圖1 因子分析流程圖
以 2009年貴陽市中考英語科目的部分試題分數(shù)為例,并選用試卷中的3道閱讀方面的試題t1,t2,t3和4道寫作方面的試題t4,t5,t6,t7的分數(shù)作為變量。在SCILAB 4.1.2 平臺上編寫因子分析算法,利用因子分析法確定其能力結(jié)構(gòu)和維度。
表1是根據(jù)2009年貴陽市中考英語科目的部分試題成績計算的相關(guān)系數(shù)矩陣,從中得知觀察變量的測量結(jié)果是可靠的。表1可看出試題間相關(guān)系數(shù)都大于0.30。說明試題間有較好的相關(guān)性,適合進行因子分析。
從表1可以看出,有兩組相關(guān)度較高的試題變量。一組是閱讀試題t1,t2,t3,另一組是寫作試題t4,t5,t6和t7。每一組變量都是某一潛在變量,即因子的外顯變量。
表1 試題相關(guān)系數(shù)矩陣
表2是由表1中試題相關(guān)系數(shù)求得的相關(guān)系數(shù)的特征值和特征向量表,從表2中可以看出前兩個特征值的累積百分比為86.0%,結(jié)合因子保留的規(guī)則,可以提取兩個公共因子,并且認為這兩個因子基本反映了原變量的絕大部分信息。
表2 相關(guān)系數(shù)矩陣的特征根和特征向量
由表3得知,絕大多數(shù)的變量共同度都在0.80以上,說明這7項指標之間存在著高度的信息重疊,既驗證了數(shù)據(jù)間的高度相關(guān)性,也體現(xiàn)了資料數(shù)據(jù)的較高可靠性。從表3中可以看出,所有試題變量在因子1上都有相差不太大的正負荷,因子2上負荷有正有負,暫時不好解釋因子變量的含義。
表3 公共因子負荷矩陣、共同度、及公共因子方差貢獻
為了更加合理解釋因子變量的含義,需要將表3中的初始因子負荷矩陣進行因子旋轉(zhuǎn),經(jīng)過因子旋轉(zhuǎn)后,三道閱讀試題t1,t2,t3負荷集中在因子2上,負荷分別為0.92,0.87和0.93;最小的負荷為0.87,最大的負荷為0.93。四道寫作試題在因子1上的負荷分別是0.91,0.89,0.92和0.91,介于0.89到0.92之間。因此,可以確定因子1為寫作能力因子,解釋為表達信息的能力;因子2為閱讀能力因子,解釋為接受信息的能力;確定測試是二維的。
由上述分析得出考試的能力結(jié)構(gòu)同實際水平基本吻合,這兩個因子的累計貢獻率達 86.1%,它們基本上解釋了每個試題變量的變異的絕大部分。
考試的能力結(jié)構(gòu)和維度是考試效度的重要依據(jù),本文引入多元統(tǒng)計理論中的因子分析法分析考試的能力結(jié)構(gòu)和維度,并利用科學計算軟件SCILAB編寫分析算法,結(jié)合實際進行分析計算后,得到了與實際情況比較吻合的結(jié)果。
[1]謝曉堯等.SCILAB及其在基礎(chǔ)教育科學計算中的應(yīng)用[M].北京:科學出版社.2011.
[2]雷新勇.考試數(shù)據(jù)的統(tǒng)計分析和解釋[M].上海:華東師范大學出版社.2007.
[3]李實.科學計算開放源代碼軟件SCILAB研究、開發(fā)與應(yīng)用[M].北京:清華大學出版社.2006.
[4]劉颋.開源軟件在教育中的應(yīng)用[J].信息技術(shù)教育.2007.
[5]劉美宏.試卷質(zhì)量分析與評估技術(shù)的研究與實現(xiàn)[D].沈陽工業(yè)大學.2009.