筅華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院 劉曉燕 徐章韜
作為數(shù)學(xué)教育研究數(shù)據(jù)處理的卡方分析法
筅華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院劉曉燕徐章韜
定量取向的實(shí)證教育、心理研究所處理的數(shù)據(jù)層次較低,大多是一些定類、定序變量,這些數(shù)據(jù)有時(shí)候也稱作質(zhì)性數(shù)據(jù).數(shù)據(jù)處理的精要之一是依據(jù)變量的不同特點(diǎn)而選用不同的處理方法,否則不僅得不到有益的結(jié)論,還誤導(dǎo)了人們的認(rèn)識(shí).在數(shù)學(xué)教育研究中,人們常常會(huì)遇到各種分類變量,分類變量的不同取值表示個(gè)體所屬的不同類別.例如,性別變量,其取值為男和女,表示按性別劃分,研究對(duì)象的群體可分為兩類;又如,對(duì)于某一事物的態(tài)度,其取值可以為喜歡、不喜歡,表示按態(tài)度劃分,研究對(duì)象的群體可分為兩類.在實(shí)證取向的數(shù)學(xué)研究中,我們常常關(guān)心兩個(gè)分類變量之間是否有關(guān)系,即兩個(gè)因素變量之間是彼此相關(guān)還是相互獨(dú)立.如,學(xué)生對(duì)數(shù)學(xué)的態(tài)度是否與性別有關(guān)是一個(gè)常見的教育問題,顯然不能用個(gè)案來說明問題.男生中有喜歡數(shù)學(xué)的,也有不喜歡數(shù)學(xué)的;女生的情況亦然.于是,人們發(fā)展了針對(duì)分類變量的卡方分析法,以檢驗(yàn)分類變量與分類變量之間是否存在相關(guān)關(guān)系.
卡方分析法充分體現(xiàn)了比較分析法的精神,可以從多方面理解.
1.尊重生活經(jīng)驗(yàn),從頻次看卡方
各種統(tǒng)計(jì)方法得到的結(jié)論或者其之所以合理,如果能得到經(jīng)驗(yàn)層次的支持,就容易得到理解.兩個(gè)人關(guān)系密切的話,其來往必定密切.老死不相往來,久不往來走動(dòng),親戚也會(huì)成路人.統(tǒng)計(jì)分類變量的頻次及其在全體中所占的比例,是研究分類變量之間是否存在關(guān)系的突破口.
例如,學(xué)生對(duì)數(shù)學(xué)的態(tài)度是否與性別有關(guān),也就是這兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問題.性別變量x有男x1和女x2兩種取值,態(tài)度變量y有喜歡y1和不喜歡y2兩種取值,為了研究x是否與y有關(guān),其關(guān)鍵在于尋找合適的統(tǒng)計(jì)量.我們?cè)O(shè)想一下,如果態(tài)度與性別無關(guān),那么無論是喜歡數(shù)學(xué)的,還是不喜歡數(shù)學(xué)的,是分不出性別上的差異的.先把數(shù)據(jù)進(jìn)行分類,得到按兩個(gè)分類變量進(jìn)行交叉分類的頻數(shù)分配表,即2×2的列聯(lián)表(見表1).
表1 性別與態(tài)度的2×2列聯(lián)表
其中n+1=n11+n21,n+2=n12+n22,n1+=n11+n12,n2+=n21+n22,n=n11+ n21+n12+n22.
如果性別與態(tài)度無關(guān),那么男生中喜歡數(shù)學(xué)的比例應(yīng)該與女生中喜歡數(shù)學(xué)的比例差不多,即,化簡(jiǎn)得n11n22-n12n21≈0;換言之,如果性別與態(tài)度無關(guān),那么男生中不喜歡數(shù)學(xué)的比例應(yīng)該與女生中不喜歡數(shù)學(xué)的比例差不多,即化簡(jiǎn)得n11n22-n12n21≈0.因此|n11n22-n12n21|越小,說明性別與態(tài)度之間的關(guān)系越弱;|n11n22-n12n21|越大,說明性別與態(tài)度之間的關(guān)系越強(qiáng).
2.理論思考,從概率看卡方
基于上述分析,為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),可以通過各個(gè)變量的頻次及其在全體中所占的比例來構(gòu)造一個(gè)隨機(jī)變量對(duì)其進(jìn)行檢驗(yàn).從獨(dú)立性的角度進(jìn)行分析,當(dāng)性別x與態(tài)度y無關(guān)時(shí),即事件x與事件y獨(dú)立,這時(shí)有P(x1y1)=P(x1)P(y1),P(x1y2)=P(x1)P(y2),
P(x2y1)=P(x2)P(y1),P(x2y2)=P(x2)P(y2)成立.
因?yàn)槭录母怕识伎捎孟鄳?yīng)的頻率來估計(jì),如P(x1),
P(y1)的估計(jì)值分別為的估計(jì)值為很接近,即的值應(yīng)該很小.上述四個(gè)式子應(yīng)同時(shí)成立,左右兩端估計(jì)值之差應(yīng)很接近,故也應(yīng)該比較小,上式化簡(jiǎn)得到χ2=,這就是卡方統(tǒng)計(jì)量的表達(dá)式.[1]
從這個(gè)統(tǒng)計(jì)量可以看出,|n11n22-n12n21|越小,χ2越小,即性別與態(tài)度之間關(guān)系越弱,|n11n22-n12n21|越大,χ2越大,即性別與態(tài)度之間關(guān)系越強(qiáng),符合最初的分析.最后將χ2值與研究所得的臨界值進(jìn)行比較,進(jìn)而得出性別對(duì)于數(shù)學(xué)態(tài)度是否有影響.上述是二分變量與二分變量間的獨(dú)立性檢驗(yàn)問題,并得到相應(yīng)的2×2列聯(lián)表的χ2值計(jì)算公式.
還可以從另一個(gè)角度進(jìn)行分析.不妨把表中的數(shù)據(jù)看作理論頻次,那么就有進(jìn)行一下數(shù)學(xué)處理有,這個(gè)式子表明,如果變量間是相對(duì)獨(dú)立的,那么變量的條件分布和邊緣分布是相同的.這時(shí)可以得到.對(duì)下一行也可以進(jìn)行同樣的分析,得到類似的式子.當(dāng)分類變量x可以分作c類,分別為x1,x2,…,xc;分類變量y可以分為r類,分別為y1,y2,…,yr.為了研究x分類是否與y分類有關(guān),對(duì)r×c列聯(lián)表用上述原理和方法可以得到通)表示.變形得到.所以如果列聯(lián)表中的變量是獨(dú)立的,則pij=pi*p*j.這樣為什么要研究條件就看得很清楚了.
由于pi*和p*j是對(duì)于總體而言,一般都是未知的,可以利用樣本數(shù)據(jù)對(duì)其進(jìn)行估計(jì),得到.若變量間是相互獨(dú)立的,則pij與很接近,也就是說npij與很接近.令Eij=npij表示表中各個(gè)變量的期望頻次,那么實(shí)際的頻次nij與期望頻次的值Eij很接近,這時(shí)我們構(gòu)造統(tǒng)計(jì)量x2=(分子取平方是為了取其絕對(duì)差值,分母Eij是為了平衡Eij數(shù)值本身的大?。?[2]實(shí)際頻次與期望頻次之間的差值越小,說明分類變量越接近獨(dú)立,這是構(gòu)建χ2統(tǒng)計(jì)量基本想法.把χ2值與臨界值比較,就能得到兩個(gè)分類變量究竟是彼此相關(guān),還是相互獨(dú)立.
很明顯,2×2列聯(lián)表是r×c列聯(lián)表的特例,那么它們通過分析得出的χ2統(tǒng)計(jì)量是否一致呢?在r×c列聯(lián)表中,令r=2,c=2時(shí),根據(jù)前面的分析,可分別得到E11,E12,E21, E22的值,將其代入χ2=統(tǒng)計(jì)量中,也能得到特例公式
各種檢驗(yàn)的精髓在于構(gòu)造統(tǒng)計(jì)量.這種構(gòu)造統(tǒng)計(jì)量的方法從理論分析入手,重視局部信息與整體信息之間的關(guān)系,同時(shí)又兼顧了經(jīng)驗(yàn)直觀.
卡方分析法的精致之處還在于基于小概率事件,運(yùn)用比較法確定何為大,何為小.指定一個(gè)臨界值k0,如果卡方的值大于這個(gè)值,就謂之為大,兩個(gè)變量之間有關(guān)系;反之,則謂之為小,兩個(gè)變量之間沒有關(guān)系.細(xì)細(xì)品味起來,這有點(diǎn)極限定義中“ε-σ”語言的味道.“ε-σ”語言中,ε、σ辨證相依才能說明問題.然而,這種大小依據(jù)的制定合不合理,要根據(jù)小概率原理來確定.在卡方分析中,把“兩個(gè)分類變量沒有關(guān)系”錯(cuò)誤地判斷為“兩個(gè)分類變量有關(guān)系”,這是一個(gè)不能容許事件,應(yīng)該是一個(gè)小概率事件.確定這個(gè)事件發(fā)生概率的上界,然后確定相應(yīng)的臨界值.概率上界不同,相應(yīng)的臨界值也不一樣,兩者之間是一種依存關(guān)系.
從上面的分析中可以看到,卡方分析法是判斷兩個(gè)分類變量之間是否相互獨(dú)立的非常有效的方法.它尊重了生活經(jīng)驗(yàn),同時(shí)也得到了理論分析的支持.卡方分析法的思路非常精致,不同于在方差分析中通過對(duì)真實(shí)值與測(cè)量值之間的誤差進(jìn)行分析,得到分類變量與定距變量之間的相關(guān)性.[3]在卡方分析中,要判斷兩個(gè)變量是否獨(dú)立,不妨先假設(shè)這兩個(gè)變量獨(dú)立,進(jìn)行理論上的分析,得到一系列理論值.然后,以這些理論值為參照點(diǎn),看實(shí)際值與理論值的絕對(duì)差距占理論值比例如何,從直觀而言,如果兩者很接近,在一定的條件下,就可以認(rèn)為兩者沒有差別,即兩個(gè)變量是相互獨(dú)立的.這也符合物理測(cè)量經(jīng)驗(yàn).測(cè)量一個(gè)物體的長(zhǎng)度,測(cè)量值T1和理論值T之間總會(huì)產(chǎn)生誤差e,故有T1=T+e,如果測(cè)量是有效的,應(yīng)有E(T1)=E(T),σ(T)=σ(T1),而且的值也不應(yīng)太大.這也正是正態(tài)分布所要揭示的道理之一.事實(shí)上,正態(tài)分布可以看作是卡方分布的疊加.這樣教材中關(guān)于分布的兩塊內(nèi)容之間的內(nèi)在關(guān)聯(lián)性就找到了.
除了進(jìn)行獨(dú)立性檢驗(yàn)之外,卡方分析法還可以根據(jù)樣本數(shù)據(jù)對(duì)未知總體與某一假設(shè)或理論進(jìn)行擬合度檢驗(yàn),即推斷總體的分布.如,實(shí)際分布與正態(tài)分布的擬合度檢驗(yàn)是檢驗(yàn)來自總體的樣本是否服從正態(tài)分布,或者說兩者是否存在顯著差異.如要判斷某次考試學(xué)生的成績(jī)是否符合正態(tài)分布,就可用卡方檢驗(yàn).首先假設(shè)數(shù)學(xué)成績(jī)服從正態(tài)分布,并求出各組的理論頻次,代入公式確定自由度和顯著性水平后進(jìn)行查表,得出的值與χ2值進(jìn)行比較,從而接受或拒絕原假設(shè),判斷學(xué)生的考試成績(jī)的頻數(shù)分布是否屬于正態(tài)分布,從而得出一些教學(xué)上的建議和思考.
卡方檢驗(yàn)法對(duì)數(shù)據(jù)的要求不高,能夠?qū)Χ惢蚨ㄐ虻淖兞窟M(jìn)行假設(shè)檢驗(yàn);定比或定距數(shù)據(jù)如果視作定類數(shù)據(jù),也可應(yīng)用卡方檢驗(yàn)法,所以卡方檢驗(yàn)法在教育研究中的應(yīng)用比其他檢驗(yàn)法更為廣泛.因此,要充分利用卡方檢驗(yàn)法對(duì)教育研究中的數(shù)據(jù)進(jìn)行合理的分析.
1.中學(xué)數(shù)學(xué)教材實(shí)驗(yàn)研究組.普通高中課程標(biāo)準(zhǔn)實(shí)驗(yàn)教科書數(shù)學(xué)(選修1-2)[M].北京:人民教育出版社,2007.
2.盧淑華.社會(huì)統(tǒng)計(jì)學(xué)[M].北京:北京大學(xué)出版社,2009.
3.徐章韜,趙弘.作為數(shù)學(xué)教育研究數(shù)據(jù)處理的方差[J].中學(xué)數(shù)學(xué)(上),2016(2).Z