□牛 凱 陳 悅
在假設(shè)檢驗原理中T的檢驗原理及對比應用研究就具有很強的實際價值,為了貼近現(xiàn)階段的數(shù)學分析課堂教學及教研,本文在數(shù)據(jù)分析假設(shè)檢驗中T檢驗原理與對比應用研究中,依舊是采用單樣本,然后利用T分布統(tǒng)計量和T檢驗統(tǒng)計量的關(guān)系,對T檢驗原理及對比應用進行清晰闡述。
假設(shè)檢驗是梳理數(shù)據(jù)中根據(jù)相應的假設(shè)條件通過樣本推斷出總體的一種方法,所以在假設(shè)檢驗中需要對研究總體進行某種假設(shè),也就是原始假設(shè)H0,然后在假設(shè)H0成立條件下選取合適的統(tǒng)計量,確保其分布為已知,再通過實際樣本測量情況,計算出統(tǒng)計值針對預先給定的顯著性水平進行檢驗對H0進行判斷給出肯定或是拒絕的結(jié)果?;诩僭O(shè)檢驗的小概率反證思想,以小概率事件(P<0.01或P<0.05)作為假設(shè)依據(jù),利用反證法先提出相應的假設(shè),根據(jù)統(tǒng)計方法確定假設(shè)成立的可能性大小判斷,可能性大的情況下還需要進行T值的判斷,當測量總體服從正態(tài)分布N的(μ,σ2)時,則可以通過T=遵從自由度為n-1的T分布,可以對μ有以下的水平為α的檢驗,基于T檢驗的判斷依據(jù)之后才能夠得出判斷結(jié)論。T檢驗是利用T分布理論來推測差異發(fā)生的概率,應用于數(shù)據(jù)分析假設(shè)檢驗,通過兩個平均數(shù)的差異的顯著性進行假設(shè)驗證,是由戈斯特發(fā)明,起初目的在于觀測釀酒質(zhì)量,其檢驗效果與f檢驗、卡方檢驗有著異曲同工的用途。
T檢驗的原理是以T分布作為基礎(chǔ),對一個或者是兩個樣本數(shù)據(jù)進行假設(shè)檢驗的常用方法,也是參數(shù)檢驗的一種。是根據(jù)各回歸系數(shù)的顯著性進行檢驗,在檢驗過程中若是多元回歸則是先針對回歸系數(shù)是否為零進行F檢驗,之后再對整體回歸系數(shù)進行是否為零的T檢驗,然后根據(jù)檢驗樣本的一元正態(tài)分布的總體期望也就是均值進行檢測,是否與二元正態(tài)分布的總體期望相等。T檢驗的最終目的是為了比較樣本均數(shù)所代表的未知總體均數(shù)μ和已知總體均數(shù)μ0,如此一來就可以避免大量的實驗直接進行假設(shè)結(jié)果檢驗。
T檢驗一共分為單總體檢驗與雙總體檢驗,單總體T檢驗是對一個樣本平均數(shù)與已知總體平均數(shù)的差異的顯著性進行判斷,但總體分布為正態(tài)分布時,如果總體標準差未知并且樣本容量低于30的時候,那么樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計量則呈現(xiàn)為T分布,雙總體T檢驗是檢驗兩個樣本平均數(shù)與其帶包的總體差異的顯著性進行判斷,雙總體T檢驗也存在兩種情況,一是獨立樣本T檢驗,二是配對樣本T檢驗,兩者檢驗的方程并不相同。三個方法中單總體檢驗以及配對樣本T檢驗常用,而配對T檢驗方法在日常和科研中應用較少,所以在教學還是實際使用中比較常用的是單總體T檢驗以及獨立樣本T檢驗法。
(一)單總體檢驗。單總體T檢驗主要是用于研究單個樣體(變量)的均值與假設(shè)檢驗值之間的差異顯著性,例如某一個學生成績與班級總體學生成績之間有無顯著差異性?或者本地大學生心理健康水平與全國平均水平有無顯著差異性?單總體檢驗中還有其他的檢驗方式,例如單總體X2擬合優(yōu)度檢驗,非參數(shù)性假設(shè),用于觀察樣本頻數(shù)與期望頻數(shù)之間的差異顯著性,例如網(wǎng)絡(luò)成癮研究視角研究是否存在差異顯著性;單樣本二項檢驗,主要是用于檢驗二分變量樣本中第一類情況出現(xiàn)的比率與總體中該事物出現(xiàn)比率的是否存在差異顯著性,例如合格率的判定。單總體T檢驗的假設(shè)判斷依據(jù)在于樣本均值與總均值之間的關(guān)系,但樣本均值接近總體均值則表示原假設(shè)成立,樣本均值與總均值相差很大,則原假設(shè)被拒絕,判斷總均值與樣本均值差距的是拒絕域和接受域,跟正態(tài)曲線的區(qū)域劃分,如圖1所示。
圖1
所以原假設(shè)不成立,備擇假設(shè)成立。
(二)獨立樣本檢驗。獨立樣本T檢驗,要求兩個樣本之間沒有具體的關(guān)系彼此獨立存在,均來自于正態(tài)分布,并且均值對檢驗量有意義的描述統(tǒng)計量。例如男女性之間的工資均值比較,其解析步驟為:分析——比較均值——獨立樣本T檢驗。通過兩個獨立樣本存在不同均值之間的差異進行經(jīng)驗,以檢驗這兩個樣本是否來自于具有相同均值的主體。
1.先進行原假設(shè)與備擇假設(shè)建立。H0為兩個樣本均值總體無明顯差異,μ1-μ2=0,H1為兩個樣本均值總體存在差異顯著性,μ1-μ2≠0。
總而言之,數(shù)據(jù)分析假設(shè)檢驗中的T檢驗原理是基于T分布來推測發(fā)生概率,對比應用主要是針對備擇假設(shè)以及原假設(shè),通過兩個假設(shè)成立條件以及樣本的組間差距判斷兩者的成立結(jié)果,無論是在數(shù)學統(tǒng)計課堂教學中還是教研中,都需要注意T檢驗的適用范圍以及限制條件的明確。