張 森 張 江 曹南斌
(河北地質(zhì)大學(xué)數(shù)理教學(xué)部 河北 石家莊 050031)
在大學(xué)物理實(shí)驗(yàn)中,最普遍的等厚干涉實(shí)驗(yàn)是牛頓環(huán)實(shí)驗(yàn).最早的牛頓環(huán)實(shí)驗(yàn)是1675年牛頓在制作天文望遠(yuǎn)鏡時(shí),偶然發(fā)現(xiàn)將一個(gè)望遠(yuǎn)鏡的物鏡放在平板玻璃上,就可以實(shí)現(xiàn)光學(xué)中常見的定域等厚干涉現(xiàn)象.牛頓環(huán)在大學(xué)物理實(shí)驗(yàn)數(shù)據(jù)誤差處理教學(xué)中起著重要作用,更精確的牛頓環(huán)估計(jì)方法將提高學(xué)生對等厚干涉和誤差統(tǒng)計(jì)分析領(lǐng)域的理解[1-2].
牛頓環(huán)實(shí)驗(yàn)基本方法是通過讀數(shù)顯微鏡對牛頓環(huán)的干涉條紋進(jìn)行測量,進(jìn)而計(jì)算出平凸鏡的曲率半徑.為了提高曲率半徑的測量精度,人們從各方面進(jìn)行了詳細(xì)研究.計(jì)算機(jī)軟件在誤差統(tǒng)計(jì)分析數(shù)值處理中起到了決定性作用[3].在壓力的作用下,平凸鏡在接觸面附近發(fā)生了不可避免的彈性形變,使得暗斑“吞噬”了若干條明暗圓環(huán),因此,實(shí)驗(yàn)只能精確測出暗環(huán)的直徑,卻很難確定暗紋的誤差不確定度.所以,既然誤差不可避免,我們將注意力轉(zhuǎn)移到如何構(gòu)建更準(zhǔn)確的統(tǒng)計(jì)模型,并進(jìn)一步得到測量數(shù)據(jù)的最佳估計(jì)值,從而提高計(jì)算曲率半徑的精度.同時(shí),建立牛頓環(huán)測量數(shù)據(jù)不確定誤差參數(shù)統(tǒng)計(jì)模型對于牛頓環(huán)在測量薄膜、玻璃彈性模量、液體折射率等方面應(yīng)用也具有重要意義.
在過去幾十年,高等院校大學(xué)物理實(shí)驗(yàn)主要使用兩種不同的實(shí)驗(yàn)方法分析牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù):逐差法和最小二乘法.逐差法一般采用的方法是把測量的偶數(shù)個(gè)數(shù)據(jù)對半分成前后兩組,后一組的數(shù)據(jù)與前一組的對應(yīng)數(shù)據(jù)逐差再取平均.最小二乘法是統(tǒng)計(jì)學(xué)中最常見的回歸分析方法.最近十幾年,眾多物理實(shí)驗(yàn)對測量不確定度分析要求越來越高,這對大學(xué)物理實(shí)驗(yàn)教學(xué)研究起到了極大促進(jìn)作用.然而,不同方法測定的牛頓環(huán)平凸透鏡的曲率半徑有一定的差異,這是多年以來存在于實(shí)驗(yàn)教學(xué)領(lǐng)域尚需討論的疑難問題[4-5].如果實(shí)驗(yàn)數(shù)據(jù)存在特殊的離群點(diǎn),那就需要選擇更穩(wěn)健的誤差統(tǒng)計(jì)分析方法.
不同大學(xué)物理實(shí)驗(yàn)方法測量結(jié)果之間的偏差是長期困擾廣大師生的難題.為此不同學(xué)派的理論學(xué)家提出了多種不確定度統(tǒng)計(jì)模型解釋.對于穩(wěn)健性統(tǒng)計(jì)模型,我們已經(jīng)基于實(shí)驗(yàn)數(shù)據(jù)集,將MFV統(tǒng)計(jì)方法(most frequent value),應(yīng)用到觀測數(shù)據(jù)最佳估計(jì)值問題[6-7].在我們之前的工作顯示,誤差分布完全可能是非高斯的,且測量數(shù)據(jù)之間可能存在無法精確衡量的相關(guān)性.
加權(quán)平均方法也是一種常見誤差處理統(tǒng)計(jì)方法.應(yīng)用加權(quán)平均方法要滿足一些假設(shè),包括數(shù)據(jù)在統(tǒng)計(jì)意義下獨(dú)立分布和隨機(jī)誤差滿足高斯分布.然而實(shí)驗(yàn)測量的誤差分布可能是非高斯的,采用加權(quán)平均方法不一定能夠得到合理的中心估計(jì)和不確定度置信區(qū)間.中位數(shù)方法具有對異常值不敏感特性,已經(jīng)有很多應(yīng)用中位數(shù)統(tǒng)計(jì)處理實(shí)驗(yàn)數(shù)據(jù)集的工作[8].
在非高斯分布情況下,傳統(tǒng)方法的應(yīng)用受到了巨大限制.為詳細(xì)分析測量過程中的統(tǒng)計(jì)誤差和系統(tǒng)誤差,許多研究人員選取誤差參數(shù)模型分析物理測量數(shù)據(jù).文獻(xiàn)[9]在2020年應(yīng)用貝葉斯分層模型,計(jì)算出實(shí)驗(yàn)數(shù)據(jù)的擬合值.文獻(xiàn)[10]應(yīng)用頻率學(xué)派方法構(gòu)造了一種具有優(yōu)良穩(wěn)健性的模型,該模型對數(shù)據(jù)誤差的建模分析較為全面.
本文將詳細(xì)分析Cowan的統(tǒng)計(jì)方法,以及頻率學(xué)派不確定誤差參數(shù)統(tǒng)計(jì)模型的構(gòu)造和計(jì)算過程.基于河北地質(zhì)大學(xué)物理實(shí)驗(yàn)協(xié)會學(xué)生測量的牛頓環(huán)6~15級實(shí)驗(yàn)數(shù)據(jù)結(jié)果,如表1所示,重新構(gòu)建其不確定誤差參數(shù)統(tǒng)計(jì)模型,以減小異常值的影響.最后給出數(shù)值計(jì)算擬合結(jié)果.
表1 牛頓環(huán)實(shí)驗(yàn)曲率半徑數(shù)據(jù)結(jié)果
續(xù)表1
頻率學(xué)派參數(shù)估計(jì)常用方法為極大似然估計(jì)和最小二乘法.這兩種方法的應(yīng)用均需滿足一定的假設(shè),特別是在應(yīng)用極大似然估計(jì)時(shí),需要預(yù)先假設(shè)數(shù)據(jù)的分布.通過引入額外的冗余參數(shù),可以降低可能出現(xiàn)的錯(cuò)誤先驗(yàn)信息影響,從而提升模型的穩(wěn)健性,但這可能會使得模型的計(jì)算更為復(fù)雜.
基于頻率學(xué)派對概率的定義,頻率學(xué)派置信區(qū)間邊界由測量數(shù)據(jù)的函數(shù)給出.其定義為:覆蓋概率指一個(gè)集合中包含參數(shù)真實(shí)值的概率.構(gòu)造置信區(qū)間使覆蓋概率大于給定的置信度.觀測值Y的概率密度函數(shù)為p(y|θ),其中θ是未知參數(shù).對參數(shù)θ和置信度1-α,有y1(θ,α)與y2(θ,α),滿足
(1)
通常y1(θ,α)與y2(θ,α)是單射,因此在給定的置信度下,可以求出反函數(shù)θ1(y)和θ2(y).假設(shè)y0與θ0分別為物理量真值和參數(shù)真值.則θ0落在[θ1,θ2]當(dāng)且僅當(dāng)y0落在[y1(θ0),y2(θ0)],對于所有的θ0值均成立.因此
1-α=P[y1(θ) (2) 這就是置信區(qū)間的Neyman構(gòu)造方法.置信區(qū)間構(gòu)造方法并不唯一,常見選取置信區(qū)間方法為:選取中心對稱區(qū)間、單側(cè)區(qū)間,或構(gòu)造似然比統(tǒng)計(jì)量進(jìn)行檢驗(yàn)求解.另外,若觀測值服從離散分布,置信區(qū)間的覆蓋概率可能大于1-α. 頻率學(xué)派置信區(qū)間的構(gòu)造方法與假設(shè)參數(shù)真值為θ0,并對其進(jìn)行假設(shè)檢驗(yàn)是等價(jià)的.常用的一種檢驗(yàn)為似然比統(tǒng)計(jì)量檢驗(yàn),似然比λ定義為 (3) (4) 置信區(qū)間的數(shù)值計(jì)算有時(shí)會很困難,可以通過蒙特卡羅(MC)方法求解.如果模型中使用似然函數(shù)較為復(fù)雜,那么運(yùn)算過程中將包含較多難算的最優(yōu)化問題. 對于構(gòu)造似然比時(shí)引入冗余參數(shù),Cowan提出一種應(yīng)用輪廓似然比(profile likelihood ratio)統(tǒng)計(jì)量的不確定誤差參數(shù)統(tǒng)計(jì)模型.此模型對數(shù)據(jù)誤差應(yīng)用Gamma分布進(jìn)行建模,通過調(diào)整超參數(shù)r,得到具有優(yōu)良穩(wěn)健性的擬合結(jié)果.輪廓似然比定義為 (5) 圖1展示了正態(tài)分布樣本的輪廓似然直方圖與χ2分布的對比.紅色直線代表標(biāo)準(zhǔn)的χ2分布PDF,樣本輪廓似然比的MC模擬結(jié)果在歸一化后顯示為藍(lán)色直方圖.在滿足一定假設(shè)的前提下,-2lnλ服從χ2分布.然而若某些假設(shè)條件不成立,比如參數(shù)間有著相關(guān)性的條件下,-2lnλ則并不總是服從χ2分布. 圖1 特定參數(shù)下-2ln λ的分布 對于牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析問題,可以選取高斯分布的似然函數(shù),而對誤差應(yīng)用Gamma分布模型進(jìn)行刻畫.通過超參數(shù)控制誤差波動,可以在實(shí)驗(yàn)數(shù)據(jù)集上得到較好的擬合效果.高斯分布通常被認(rèn)為是在許多未知影響因素相互疊加時(shí)的近似分布,這里為p(y|μ,θ)選取高斯分布的似然函數(shù)是合理的.可以構(gòu)造如下似然函數(shù) (6) 這代表假設(shè)觀測數(shù)據(jù)y服從一個(gè)高斯分布,其參數(shù)為μ,θ.θ的估計(jì)值為u,假設(shè)其服從高斯分布,即 (7) (8) (9) (10) (11) 調(diào)整超參數(shù)r的值,可以控制模型對于異常值的敏感性. 在對模型參數(shù)進(jìn)行化簡后,對數(shù)似然函數(shù)為 (12) 圖2 模型在一組實(shí)驗(yàn)數(shù)據(jù)上的擬合結(jié)果 計(jì)算所得的牛頓環(huán)測量數(shù)據(jù)估計(jì)值及其置信區(qū)間如圖3所示.圖中曲線代表負(fù)對數(shù)似然作為參數(shù)μ的函數(shù),根據(jù)Wilks定理,使得-2lnλ從最小值增大1時(shí)的μ值即為其68.3%置信區(qū)間的邊界,在圖中以豎直虛線顯示.不同的子圖顯示了不同參數(shù)設(shè)置下的擬合結(jié)果.計(jì)算得到,選取r=0.2時(shí),牛頓環(huán)測量數(shù)據(jù)估計(jì)值為R=1 998.79,對應(yīng)的置信區(qū)間邊界為[1 990.34,2 007.32].當(dāng)r=0.4時(shí)的置信區(qū)間總長略大于r=0.2時(shí)的結(jié)果,這與之前的模型分析吻合. 圖3 模型計(jì)算結(jié)果 此外,模型對采用逐差法的數(shù)據(jù)擬合結(jié)果為R=1 998.25-9.71/+9.47,對最小二乘法的數(shù)據(jù)結(jié)果為R=1 998.97-7.47/+7.90.在計(jì)算過程中,當(dāng)r=0.6時(shí),-2lnλ的函數(shù)曲線有更多的起伏,這表示當(dāng)r過大,模型的預(yù)測效果可信度較低.因此,我們選取參數(shù)值r=0.2作為最優(yōu)參數(shù)值. 圖4對比了牛頓環(huán)實(shí)驗(yàn)測量數(shù)據(jù)和不同統(tǒng)計(jì)模型計(jì)算結(jié)果,圖中陰影部分為不確定誤差參數(shù)模型計(jì)算所得的置信區(qū)間.在垂直虛線左側(cè)為隨牛頓環(huán)實(shí)驗(yàn)變化的測量數(shù)據(jù)列,右側(cè)為模型擬合結(jié)果,包括加權(quán)均值、中位數(shù)以及本文得到的結(jié)果.圖4下方子圖展示了以誤差統(tǒng)計(jì)模型為基準(zhǔn)進(jìn)行歸一化之后的結(jié)果. 此誤差統(tǒng)計(jì)模型的重要特性之一是,隨著參數(shù)值的增加,擬合數(shù)據(jù)的值對顯著偏離中心值的游離點(diǎn)(異常值)變得不那么敏感.圖4中體現(xiàn)出了這種特性,結(jié)合在實(shí)驗(yàn)數(shù)據(jù)上的擬合效果,最終我們選取參數(shù)值r=0.2.此時(shí)的不確定誤差參數(shù)統(tǒng)計(jì)模型相比起中位數(shù)結(jié)果更接近于數(shù)據(jù)整體的加權(quán)均值,且對數(shù)據(jù)有著較好的覆蓋率. 圖4 原始數(shù)據(jù)分布及模型預(yù)測結(jié)果對比(下方子圖為歸一化后的相對誤差分布) 總而言之,物理實(shí)驗(yàn)的一個(gè)主要目標(biāo)是對一些關(guān)鍵物理量進(jìn)行精確測量.牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù)不同方法間長期存在的偏差是基礎(chǔ)光學(xué)和大學(xué)物理實(shí)驗(yàn)數(shù)據(jù)處理的疑難問題之一.對牛頓環(huán)測量誤差進(jìn)行穩(wěn)健統(tǒng)計(jì)建模分析是獲取可信估計(jì)值及置信區(qū)間的關(guān)鍵.本文應(yīng)用Cowan不確定誤差參數(shù)統(tǒng)計(jì)模型,對牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù)使用Gamma分布對誤差建模,得到曲率半徑估計(jì)值為R=1 998.79-8.45/+8.53,計(jì)算結(jié)果顯示出良好的穩(wěn)健性,并且對異常值的干擾不敏感. George E. P. Box 指出:“所有模型都是錯(cuò)誤的,但有些模型是有用的”.每個(gè)計(jì)算統(tǒng)計(jì)模型的一些潛在假設(shè)并不一定都嚴(yán)格成立.Gamma誤差模型在一定程度上可以克服傳統(tǒng)方法不實(shí)假設(shè)的問題,這也啟發(fā)我們在類似情況下應(yīng)用不確定誤差參數(shù)模型,并進(jìn)一步研究其他大學(xué)物理實(shí)驗(yàn)測量數(shù)據(jù)的不確定度問題.2.2 似然比統(tǒng)計(jì)量的構(gòu)造和應(yīng)用
2.3 不確定誤差參數(shù)統(tǒng)計(jì)模型
3 模型計(jì)算結(jié)果
4 結(jié)論