陳學(xué)云
摘 要 文章在闡明標(biāo)準(zhǔn)正態(tài)分布分位數(shù)、置信水平、置信區(qū)間和樣本均值的抽樣分布的基礎(chǔ)上,通過(guò)計(jì)算樣本均值落在總體均值兩側(cè)任何位數(shù)抽樣標(biāo)準(zhǔn)差范圍內(nèi)的概率,運(yùn)用中心極限定理建立總體均值的參數(shù)估計(jì)區(qū)間; 根據(jù)估計(jì)區(qū)間,提出假設(shè)檢驗(yàn)的基本思想,明確雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)的拒絕域,并提醒學(xué)生左側(cè)檢驗(yàn)與右側(cè)檢驗(yàn)容易誤判的地方;通過(guò)引例,實(shí)施理實(shí)一體化教學(xué),邊講原理邊做實(shí)驗(yàn),化抽象為具體,從具體再到抽象,消除學(xué)生對(duì)參數(shù)估計(jì)和假設(shè)檢驗(yàn)的畏懼感,明晰推導(dǎo)思路,讓學(xué)生在完成操作任務(wù)的過(guò)程中學(xué)習(xí)統(tǒng)計(jì)學(xué)知識(shí)。
關(guān)鍵詞 參數(shù);區(qū)間估計(jì);假設(shè)檢驗(yàn);理實(shí)一體化教學(xué)
中圖分類號(hào):G642?? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? DOI:10.16400/j.cnki.kjdk.2024.9.047
Integration of Theory and Practice Teaching Exploration of the Principle of
Estimation Interval Estimation and Hypothesis Testing of Parameters
CHEN Xueyun
(School of Economics and Management, Chuzhou University, Chuzhou, Anhui 239000)
Abstract On the basis of elucidating the sampling distribution of standard normal distribution quantiles, confidence levels, confidence intervals, and sample means, the article calculates the probability that the sample mean falls within the sampling standard deviation range of any digit on either side of the population mean, and uses the central limit theorem to establish the parameter estimation interval of the population mean. Based on the estimated interval, propose the basic idea of hypothesis testing, clarify the rejection domains of bilateral and unilateral tests, and remind students of the areas where left and right tests are prone to misjudgment. By citing examples, implementing integrated teaching of theory and practice, teaching principles while conducting experiments, transforming abstract concepts into concrete ones, and moving from concrete to abstract ones, students' fear of parameter estimation and hypothesis testing is eliminated. The reasoning process is clarified, allowing students to learn statistical knowledge while completing operational tasks.
Keywords parameters; interval estimation; hypothesis testing; integrated teaching of theory and practice
現(xiàn)行的本科統(tǒng)計(jì)學(xué)(非統(tǒng)計(jì)學(xué)專業(yè))教材對(duì)于參數(shù)估計(jì)和假設(shè)檢驗(yàn)原理的講解大致有下列兩條思路:一是先計(jì)算樣本均值落在總體均值兩側(cè)任何倍數(shù)的標(biāo)準(zhǔn)誤差范圍內(nèi)的概率,然后利用樣本均值與總體均值的對(duì)稱性解釋置信區(qū)間建立的原理;二是利用中心極限定理和標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)定義建立置信區(qū)間。前者顯得有些抽象,學(xué)生難得要領(lǐng);后者顯得煩瑣,學(xué)生不易理解。本文嘗試結(jié)合案例,使用理一體化教學(xué)方式綜合這兩種思路,進(jìn)一步明晰置信區(qū)間的建立過(guò)程,使學(xué)生更易理解。假設(shè)檢驗(yàn)則利用參數(shù)估計(jì)區(qū)間確定拒絕域來(lái)實(shí)現(xiàn),消除學(xué)生抽象感。
理實(shí)一體化教學(xué)是一種采用理論與實(shí)踐有機(jī)結(jié)合的方式,促進(jìn)學(xué)生認(rèn)知能力發(fā)展和實(shí)踐能力提高的混合式教學(xué)方式。在參數(shù)估計(jì)和假設(shè)檢驗(yàn)的教學(xué)中,全面突出教學(xué)做一體,將每個(gè)知識(shí)點(diǎn)視為一個(gè)模塊,并完成一個(gè)實(shí)驗(yàn)操作任務(wù),采用示范教學(xué)法、分組操作等多種教學(xué)方法,讓學(xué)生在完成任務(wù)的過(guò)程中學(xué)習(xí)統(tǒng)計(jì)學(xué)知識(shí)。通過(guò)實(shí)例,在講解理論的同時(shí)進(jìn)行實(shí)驗(yàn)(統(tǒng)計(jì)軟件)操作,有利于學(xué)生對(duì)參數(shù)估計(jì)和假設(shè)檢驗(yàn)基本原理的深刻理解,突破教學(xué)難點(diǎn)。
1? 參數(shù)估計(jì)與假設(shè)檢驗(yàn)
1.1? 參數(shù)估計(jì)
參數(shù)估計(jì)是在抽樣及抽樣分布的基礎(chǔ)上,根據(jù)樣本統(tǒng)計(jì)量來(lái)推斷總體參數(shù)的過(guò)程;點(diǎn)估計(jì)是指通過(guò)樣本數(shù)據(jù)得到總體參數(shù)的一個(gè)單值估計(jì)。點(diǎn)估計(jì)的常用方法有矩估計(jì)、極大似然估計(jì)、最小二乘法和順序統(tǒng)計(jì)量法等,它不考慮估計(jì)的誤差,直接用樣本估計(jì)量估計(jì)總體的參數(shù)。區(qū)間估計(jì)是指通過(guò)樣本數(shù)據(jù)得到總體參數(shù)的一個(gè)區(qū)間估計(jì),是在點(diǎn)估計(jì)的基礎(chǔ)上估計(jì)總體參數(shù)所在的區(qū)間范圍。在區(qū)間估計(jì)中,我們能給出一個(gè)范圍,有一定的把握說(shuō)這個(gè)區(qū)間包含真實(shí)參數(shù)值。常用的區(qū)間估計(jì)方法包括置信區(qū)間和預(yù)測(cè)區(qū)間。置信區(qū)間是用于估計(jì)總體參數(shù)的一個(gè)范圍,而預(yù)測(cè)區(qū)間則是用于估計(jì)未來(lái)觀測(cè)值的范圍。
1.2? 假設(shè)檢驗(yàn)基本原理
假設(shè)檢驗(yàn)是根據(jù)樣本信息對(duì)總體某特征值做出決策判斷,但抽樣有其偶然性。因此,要判斷抽樣結(jié)果是偶然性在起作用還是系統(tǒng)誤差造成的,需給出一個(gè)量的界限(臨界值),如果超出這一界限,則抽樣結(jié)果是由系統(tǒng)誤差造成的。具體運(yùn)用小概念原理加以判斷(概率反正法):假定原假設(shè)成立,如果小概率事件在一次試驗(yàn)中竟然發(fā)生了,則拒絕原假設(shè);若原假設(shè)正確,則某個(gè)統(tǒng)計(jì)量(計(jì)算樣本值與假設(shè)值差異的大?。┞淙肽硞€(gè)區(qū)域(拒絕域)是一小概率事件,如果該統(tǒng)計(jì)量的值真的落入該區(qū)域,則說(shuō)明原假設(shè)不可信,有理由拒絕之。
2? 引例
一個(gè)班級(jí)共有60名學(xué)生,身高服從正態(tài)分布。假定該班學(xué)生平均身高為170cm,標(biāo)準(zhǔn)差為6.08cm,試估計(jì)該班學(xué)生身高在160cm到180cm之間的人數(shù)。
該問(wèn)題可以歸結(jié)為求該班學(xué)生身高落在[160,180]cm區(qū)間上的概率,可用SPSS函數(shù)CDF.Normal(180,170,6.08)-CDF.Normal(160,170,6.08)計(jì)算之。學(xué)生操作統(tǒng)計(jì)學(xué)軟件,邊實(shí)驗(yàn)邊學(xué)理論,達(dá)到理實(shí)一體化教學(xué)效果。得到的結(jié)果大約為0.9,說(shuō)明該班大概有90%的學(xué)生(54個(gè))身高在160cm到180cm之間。
那么,如果以170cm為中心構(gòu)建一個(gè)區(qū)間,要求落在該區(qū)間上的概率為0.9,則該區(qū)間一定為[160,180],這個(gè)區(qū)間稱為置信水平(置信度)為90%的置信區(qū)間。若對(duì)該班學(xué)生的身高進(jìn)行標(biāo)準(zhǔn)化處理,則該班學(xué)生的身高服從標(biāo)準(zhǔn)正態(tài)分布,置信區(qū)間轉(zhuǎn)換為[-10/6.08,10/6.08],約為[-1.645,1.645]。我們把Z0.05=1.645稱為此標(biāo)準(zhǔn)正態(tài)分布的上分位數(shù),Z0.95=-Z0.05=-1.645稱為此標(biāo)準(zhǔn)正態(tài)分布的下分位數(shù)。
3? 參數(shù)的區(qū)間估計(jì)
3.1? 解釋分位數(shù)
解釋分位數(shù)是連續(xù)分布函數(shù)中的一個(gè)數(shù),這個(gè)數(shù)對(duì)應(yīng)的概率為。上分位數(shù)是指使得標(biāo)準(zhǔn)正態(tài)分布中有一定比例的數(shù)據(jù)大于等于該值的臨界點(diǎn);下分位數(shù)是指使得標(biāo)準(zhǔn)正態(tài)分布中有一定比例的數(shù)據(jù)小于等于該值的臨界點(diǎn)。
3.2? 解釋置信水平與置信區(qū)間
置信水平表示我們對(duì)于置信區(qū)間的可信程度,通常以百分比的形式表示,常見(jiàn)的有90%、95%和99%。置信區(qū)間是根據(jù)樣本統(tǒng)計(jì)量所構(gòu)造的關(guān)于總體參數(shù)在一定置信水平下的估計(jì)區(qū)間。因此,置信水平與置信區(qū)間是一對(duì)相依相伴的概念,其中置信水平用1― 來(lái)表達(dá)。若置信水平為1― ,意思是說(shuō),重復(fù)構(gòu)造置信區(qū)間若干次,有比例為1― 的區(qū)間包含總體參數(shù)真值,有 比例的樣本不包含總體真值。需要注意的是,置信水平和置信區(qū)間是表示估計(jì)結(jié)果的可靠性程度,并不是針對(duì)具體的某個(gè)樣本,而是概括了在相同條件下多次抽樣所獲得的區(qū)間。同時(shí),置信水平和置信區(qū)間是相互關(guān)聯(lián)的,較高的置信水平通常對(duì)應(yīng)較寬的置信區(qū)間。
3.3? 解釋樣本均值的抽樣分布
樣本均值的抽樣分布是指在重復(fù)選取容量為n的樣本時(shí),由樣本均值所有可能取值所形成的相對(duì)頻數(shù)分布。當(dāng)樣本容量n足夠大時(shí),樣本均值的抽樣分布是正態(tài)分布,且均值等于總體均值,方差為總體方差的1/n倍。可以作出這樣的判斷:在樣本均值的抽樣中,有90%的樣本均值落在 ?.645 區(qū)間內(nèi),有95%的樣本均值落在 ?.96 區(qū)間內(nèi)等。為對(duì)此判斷作檢驗(yàn)(以90%為例),把樣本均值的抽樣分布作標(biāo)準(zhǔn)化,已知有90%的落在區(qū)間[-1.645,1.645]內(nèi),運(yùn)用SPSS函數(shù)CDF.Normal(1.645,0,1)-CDF.Normal(-1.645,0,1)來(lái)驗(yàn)證之,使學(xué)生容易理解。
3.4? 構(gòu)造總體均值的置信區(qū)間
基本思路:中心極限定理保證了樣本均值的數(shù)學(xué)期望等于總體均值,樣本均值落在總體均值 兩側(cè)任何倍數(shù)標(biāo)準(zhǔn)誤差范圍內(nèi)的概率都可以計(jì)算。由于和 的距離是對(duì)稱的,如果某個(gè)落在 的某倍數(shù)的標(biāo)準(zhǔn)誤差范圍內(nèi),則 也被包括在以為中心兩側(cè)一該倍數(shù)的標(biāo)準(zhǔn)差范圍之內(nèi)。這意味著,約有1― 比例的樣本均值所構(gòu)造的該倍數(shù)標(biāo)準(zhǔn)誤差的區(qū)間會(huì)包括總體均值 。在上述對(duì)分位數(shù)、置信水平和置信區(qū)間以及樣本均值的抽樣分布的概念做解釋的基礎(chǔ)上,構(gòu)造總體均值的置信區(qū)間。
4? 假設(shè)檢驗(yàn)原理
如果假設(shè)值在置信區(qū)間內(nèi),則不能拒絕原假設(shè),如果不在,則拒絕原假設(shè),這是假設(shè)檢驗(yàn)的基本思想。在引例中,假如我們隨機(jī)抽到一個(gè)均值為165cm的樣本(樣本容量為36),可計(jì)算出具體的區(qū)間為[163.35,166.65],然后看總體均值的假設(shè)值(為170cm)是否在這一區(qū)間(不在),來(lái)判斷關(guān)于總體的假設(shè)是否正確(不正確)。
人們相信一次抽樣所得到的統(tǒng)計(jì)量的值在置信區(qū)間內(nèi)。以均值為例,一次抽樣的樣本均值標(biāo)準(zhǔn)化之后應(yīng)該在區(qū)間上下分位數(shù)之間;若計(jì)算的標(biāo)準(zhǔn)化值不在這個(gè)區(qū)間,則有理由拒絕原假設(shè)(雙側(cè)檢驗(yàn)),因?yàn)樾「怕适录l(fā)生了。因此,我們把置信區(qū)間以外的區(qū)間稱為拒絕域,從而得出拒絕域和非拒絕域的概念。
在引例中,若抽到的是一個(gè)均值為165cm的樣本(樣本容量為36),把該值進(jìn)行標(biāo)準(zhǔn)化處理得到的值為-5,不在[-1.645,1.645]區(qū)間內(nèi),拒絕原假設(shè)。
在引例中,若假設(shè)全班學(xué)生平均身高大于等于170cm,而抽到的樣本均值為165cm,比170cm要小,但是否小到達(dá)到明顯的程度呢?如上所述,樣本均值的標(biāo)準(zhǔn)化值為-5,小于-1.645,在(-∞,-1.645]區(qū)間內(nèi),所以在90%的置信度下要拒絕原假設(shè),表明全班學(xué)生的平均身高不足170cm。
這里要提醒學(xué)生,根據(jù)樣本計(jì)算的統(tǒng)計(jì)量的值的正負(fù)不能作為判斷是左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn)的依據(jù)。在引例中,如果假設(shè)全班學(xué)生平均身高小于等于170cm,則是右側(cè)檢驗(yàn)問(wèn)題。而統(tǒng)計(jì)量的標(biāo)準(zhǔn)化值仍然是-5,在左邊。而此時(shí)的區(qū)間為[1.645,-∞],顯然-0.882不在這一區(qū)間內(nèi)且明顯小于1.645,不能拒絕原假設(shè),表明沒(méi)有充分的理由說(shuō)明該班學(xué)生的平均身高不小于170cm。由于樣本計(jì)算的統(tǒng)計(jì)量的值為負(fù),而拒絕域在右,注意這時(shí)觀察到的顯著水平p值會(huì)很大(超過(guò)0.5),在用p值進(jìn)行檢驗(yàn)時(shí)要充分注意這一點(diǎn)。
參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)教學(xué)的重點(diǎn)也是難點(diǎn),實(shí)現(xiàn)融會(huì)貫通及靈活運(yùn)用較為困難。因此,需要教師在教學(xué)過(guò)程中貫徹理實(shí)一體化教學(xué)理念,采用系列化探究式項(xiàng)目教學(xué)法,將實(shí)驗(yàn)實(shí)訓(xùn)和理論知識(shí)相結(jié)合,用直觀的形式展現(xiàn)抽象的內(nèi)容,使學(xué)生在完成設(shè)定的任務(wù)中深刻理解所學(xué)內(nèi)容,同時(shí)做好過(guò)程性考核,提高學(xué)習(xí)效率,增強(qiáng)學(xué)習(xí)效果。
5? 進(jìn)一步討論
5.1? 參數(shù)估計(jì)與假設(shè)檢驗(yàn)的一般性步驟
參數(shù)估計(jì)一般性步驟:①定義問(wèn)題。明確要估計(jì)的參數(shù)是什么,屬于哪一個(gè)參數(shù)(均值、比例、方差)。②收集數(shù)據(jù)。收集與該參數(shù)相關(guān)的數(shù)據(jù)樣本。③構(gòu)造區(qū)間。根據(jù)總體和樣本特征,使用適當(dāng)?shù)膮?shù)估計(jì)公式構(gòu)造估計(jì)區(qū)間。
假設(shè)檢驗(yàn)一般性步驟:①假設(shè)定義。明確要檢驗(yàn)的假設(shè)、假設(shè)的前提條件和假設(shè)的預(yù)期結(jié)果。②數(shù)據(jù)收集。抽取樣本,收集與該假設(shè)相關(guān)的數(shù)據(jù),并確保數(shù)據(jù)的可靠性和完整性。③作出決策。根據(jù)所收集的數(shù)據(jù),計(jì)算出統(tǒng)計(jì)量(均值、比例、方差等),根據(jù)規(guī)則作出決策。必要時(shí)對(duì)結(jié)果作進(jìn)一步解釋,并提出對(duì)策建議。
5.2? 參數(shù)估計(jì)與假設(shè)檢驗(yàn)的關(guān)系
參數(shù)估計(jì)和假設(shè)檢驗(yàn)是數(shù)理統(tǒng)計(jì)的兩個(gè)基本問(wèn)題,也是推斷統(tǒng)計(jì)的兩種重要統(tǒng)計(jì)方法,兩者密切聯(lián)系。①兩者都是以樣本統(tǒng)計(jì)量的抽樣分布為依據(jù),對(duì)總體參數(shù)進(jìn)行推斷。在區(qū)間估計(jì)中用到的樣本標(biāo)準(zhǔn)化統(tǒng)計(jì)量和在假設(shè)檢驗(yàn)中用到的檢驗(yàn)統(tǒng)計(jì)量本質(zhì)上是同一個(gè)函數(shù),選擇標(biāo)準(zhǔn)也相同。②在區(qū)間估計(jì)中置信水平與假設(shè)檢驗(yàn)中顯著性水平具有對(duì)偶關(guān)系,而區(qū)間估計(jì)中置信區(qū)間與參數(shù)假設(shè)檢驗(yàn)中的接受域(“接受域”的說(shuō)法,主要是為了方便,而并不是說(shuō)在現(xiàn)有的樣本信息條件下不能拒絕原假設(shè)時(shí)就等于“接受”原假設(shè))一致。③區(qū)間估計(jì)與假設(shè)檢驗(yàn)所得結(jié)論相容。如果總體參數(shù)落在置信區(qū)間里,則假設(shè)檢驗(yàn)的決策結(jié)果就不會(huì)拒絕原假設(shè)。相反,如果總體參數(shù)沒(méi)有落在置信區(qū)間里,則假設(shè)檢驗(yàn)的決策結(jié)果就會(huì)拒絕原假設(shè)。
5.3? 置信區(qū)間表述與兩類錯(cuò)誤
用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,該區(qū)間要么“絕對(duì)包含”,要么“絕對(duì)不包含”總體參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問(wèn)題。因此,置信水平只是說(shuō)明用多次抽樣所得到的樣本構(gòu)造出的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值,而不是針對(duì)某一具體區(qū)間而言的。如果在構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么用該方法構(gòu)造的區(qū)間是置信水平為95%的置信區(qū)間(其他置信水平的區(qū)間也同樣表述)。其中的5%在假設(shè)檢驗(yàn)中稱為顯著性水平,即事先確定的用于拒絕原假設(shè)時(shí)所必須的證據(jù),能夠容忍的犯第Ⅰ類錯(cuò)誤的最大概率(上限值),或者說(shuō)原假設(shè)為真時(shí)拒絕原假設(shè)的概率。
基金項(xiàng)目:安徽省本科教學(xué)質(zhì)量工程一流課程項(xiàng)目“統(tǒng)計(jì)學(xué)原理與實(shí)驗(yàn)”(2021XSXXKC210)。
參考文獻(xiàn)
[1] 程建華,洪文.統(tǒng)計(jì)學(xué)原理與應(yīng)用[M].北京:人民郵電出版社,2013:124.
[2] 吳和成.應(yīng)用統(tǒng)計(jì)學(xué)[M].北京:科學(xué)出版社,2015:11.
[3] 賈俊平.統(tǒng)計(jì)學(xué)——基于SPSS(第二版)[M].北京:中國(guó)人民大學(xué)出版社,2016:83.
[4] 李奇明,徐德義.參數(shù)估計(jì)與假設(shè)檢驗(yàn):原理、方法與誤區(qū)[J].大學(xué)教育,2018(2):40-42.
[5] 戴金輝.區(qū)間估計(jì)與參數(shù)假設(shè)檢驗(yàn)的比較[J].統(tǒng)計(jì)與決策,2019(9):72-74.
[6] 衛(wèi)淑芝,張興旭,周越.檢驗(yàn)統(tǒng)計(jì)量對(duì)假設(shè)檢驗(yàn)影響效果分析[J].大學(xué)數(shù)學(xué),2023(3):93-97.
[7] 劉高生,柏楊,余平.部分函數(shù)型線性空間自回歸模型的假設(shè)檢驗(yàn)[J].數(shù)學(xué)學(xué)報(bào)(中文版),2023(2):239-252.
[8] 徐曉嶺,王蓉華,顧蓓青.統(tǒng)計(jì)學(xué)教學(xué)中的若干問(wèn)題思考[J].高等數(shù)學(xué)研究,2023(1):66-69.
[9] 楊羽,孫加秀.經(jīng)貿(mào)專業(yè)理實(shí)一體化教學(xué)模式創(chuàng)新探索——以“國(guó)際經(jīng)濟(jì)學(xué)”為例[J].科教文匯,2023(16):71-74.