国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

牛頓環(huán)測量數(shù)據(jù)的不確定誤差參數(shù)統(tǒng)計(jì)分析*

2023-03-10 13:25:54曹南斌
物理通報(bào) 2023年3期
關(guān)鍵詞:高斯分布置信區(qū)間牛頓

張 森 張 江 曹南斌

(河北地質(zhì)大學(xué)數(shù)理教學(xué)部 河北 石家莊 050031)

1 引言

在大學(xué)物理實(shí)驗(yàn)中,最普遍的等厚干涉實(shí)驗(yàn)是牛頓環(huán)實(shí)驗(yàn).最早的牛頓環(huán)實(shí)驗(yàn)是1675年牛頓在制作天文望遠(yuǎn)鏡時(shí),偶然發(fā)現(xiàn)將一個(gè)望遠(yuǎn)鏡的物鏡放在平板玻璃上,就可以實(shí)現(xiàn)光學(xué)中常見的定域等厚干涉現(xiàn)象.牛頓環(huán)在大學(xué)物理實(shí)驗(yàn)數(shù)據(jù)誤差處理教學(xué)中起著重要作用,更精確的牛頓環(huán)估計(jì)方法將提高學(xué)生對等厚干涉和誤差統(tǒng)計(jì)分析領(lǐng)域的理解[1-2].

牛頓環(huán)實(shí)驗(yàn)基本方法是通過讀數(shù)顯微鏡對牛頓環(huán)的干涉條紋進(jìn)行測量,進(jìn)而計(jì)算出平凸鏡的曲率半徑.為了提高曲率半徑的測量精度,人們從各方面進(jìn)行了詳細(xì)研究.計(jì)算機(jī)軟件在誤差統(tǒng)計(jì)分析數(shù)值處理中起到了決定性作用[3].在壓力的作用下,平凸鏡在接觸面附近發(fā)生了不可避免的彈性形變,使得暗斑“吞噬”了若干條明暗圓環(huán),因此,實(shí)驗(yàn)只能精確測出暗環(huán)的直徑,卻很難確定暗紋的誤差不確定度.所以,既然誤差不可避免,我們將注意力轉(zhuǎn)移到如何構(gòu)建更準(zhǔn)確的統(tǒng)計(jì)模型,并進(jìn)一步得到測量數(shù)據(jù)的最佳估計(jì)值,從而提高計(jì)算曲率半徑的精度.同時(shí),建立牛頓環(huán)測量數(shù)據(jù)不確定誤差參數(shù)統(tǒng)計(jì)模型對于牛頓環(huán)在測量薄膜、玻璃彈性模量、液體折射率等方面應(yīng)用也具有重要意義.

在過去幾十年,高等院校大學(xué)物理實(shí)驗(yàn)主要使用兩種不同的實(shí)驗(yàn)方法分析牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù):逐差法和最小二乘法.逐差法一般采用的方法是把測量的偶數(shù)個(gè)數(shù)據(jù)對半分成前后兩組,后一組的數(shù)據(jù)與前一組的對應(yīng)數(shù)據(jù)逐差再取平均.最小二乘法是統(tǒng)計(jì)學(xué)中最常見的回歸分析方法.最近十幾年,眾多物理實(shí)驗(yàn)對測量不確定度分析要求越來越高,這對大學(xué)物理實(shí)驗(yàn)教學(xué)研究起到了極大促進(jìn)作用.然而,不同方法測定的牛頓環(huán)平凸透鏡的曲率半徑有一定的差異,這是多年以來存在于實(shí)驗(yàn)教學(xué)領(lǐng)域尚需討論的疑難問題[4-5].如果實(shí)驗(yàn)數(shù)據(jù)存在特殊的離群點(diǎn),那就需要選擇更穩(wěn)健的誤差統(tǒng)計(jì)分析方法.

不同大學(xué)物理實(shí)驗(yàn)方法測量結(jié)果之間的偏差是長期困擾廣大師生的難題.為此不同學(xué)派的理論學(xué)家提出了多種不確定度統(tǒng)計(jì)模型解釋.對于穩(wěn)健性統(tǒng)計(jì)模型,我們已經(jīng)基于實(shí)驗(yàn)數(shù)據(jù)集,將MFV統(tǒng)計(jì)方法(most frequent value),應(yīng)用到觀測數(shù)據(jù)最佳估計(jì)值問題[6-7].在我們之前的工作顯示,誤差分布完全可能是非高斯的,且測量數(shù)據(jù)之間可能存在無法精確衡量的相關(guān)性.

加權(quán)平均方法也是一種常見誤差處理統(tǒng)計(jì)方法.應(yīng)用加權(quán)平均方法要滿足一些假設(shè),包括數(shù)據(jù)在統(tǒng)計(jì)意義下獨(dú)立分布和隨機(jī)誤差滿足高斯分布.然而實(shí)驗(yàn)測量的誤差分布可能是非高斯的,采用加權(quán)平均方法不一定能夠得到合理的中心估計(jì)和不確定度置信區(qū)間.中位數(shù)方法具有對異常值不敏感特性,已經(jīng)有很多應(yīng)用中位數(shù)統(tǒng)計(jì)處理實(shí)驗(yàn)數(shù)據(jù)集的工作[8].

在非高斯分布情況下,傳統(tǒng)方法的應(yīng)用受到了巨大限制.為詳細(xì)分析測量過程中的統(tǒng)計(jì)誤差和系統(tǒng)誤差,許多研究人員選取誤差參數(shù)模型分析物理測量數(shù)據(jù).文獻(xiàn)[9]在2020年應(yīng)用貝葉斯分層模型,計(jì)算出實(shí)驗(yàn)數(shù)據(jù)的擬合值.文獻(xiàn)[10]應(yīng)用頻率學(xué)派方法構(gòu)造了一種具有優(yōu)良穩(wěn)健性的模型,該模型對數(shù)據(jù)誤差的建模分析較為全面.

本文將詳細(xì)分析Cowan的統(tǒng)計(jì)方法,以及頻率學(xué)派不確定誤差參數(shù)統(tǒng)計(jì)模型的構(gòu)造和計(jì)算過程.基于河北地質(zhì)大學(xué)物理實(shí)驗(yàn)協(xié)會學(xué)生測量的牛頓環(huán)6~15級實(shí)驗(yàn)數(shù)據(jù)結(jié)果,如表1所示,重新構(gòu)建其不確定誤差參數(shù)統(tǒng)計(jì)模型,以減小異常值的影響.最后給出數(shù)值計(jì)算擬合結(jié)果.

表1 牛頓環(huán)實(shí)驗(yàn)曲率半徑數(shù)據(jù)結(jié)果

續(xù)表1

2 頻率學(xué)派統(tǒng)計(jì)方法

2.1 參數(shù)估計(jì)和置信區(qū)間

頻率學(xué)派參數(shù)估計(jì)常用方法為極大似然估計(jì)和最小二乘法.這兩種方法的應(yīng)用均需滿足一定的假設(shè),特別是在應(yīng)用極大似然估計(jì)時(shí),需要預(yù)先假設(shè)數(shù)據(jù)的分布.通過引入額外的冗余參數(shù),可以降低可能出現(xiàn)的錯(cuò)誤先驗(yàn)信息影響,從而提升模型的穩(wěn)健性,但這可能會使得模型的計(jì)算更為復(fù)雜.

基于頻率學(xué)派對概率的定義,頻率學(xué)派置信區(qū)間邊界由測量數(shù)據(jù)的函數(shù)給出.其定義為:覆蓋概率指一個(gè)集合中包含參數(shù)真實(shí)值的概率.構(gòu)造置信區(qū)間使覆蓋概率大于給定的置信度.觀測值Y的概率密度函數(shù)為p(y|θ),其中θ是未知參數(shù).對參數(shù)θ和置信度1-α,有y1(θ,α)與y2(θ,α),滿足

(1)

通常y1(θ,α)與y2(θ,α)是單射,因此在給定的置信度下,可以求出反函數(shù)θ1(y)和θ2(y).假設(shè)y0與θ0分別為物理量真值和參數(shù)真值.則θ0落在[θ1,θ2]當(dāng)且僅當(dāng)y0落在[y1(θ0),y2(θ0)],對于所有的θ0值均成立.因此

1-α=P[y1(θ)

(2)

這就是置信區(qū)間的Neyman構(gòu)造方法.置信區(qū)間構(gòu)造方法并不唯一,常見選取置信區(qū)間方法為:選取中心對稱區(qū)間、單側(cè)區(qū)間,或構(gòu)造似然比統(tǒng)計(jì)量進(jìn)行檢驗(yàn)求解.另外,若觀測值服從離散分布,置信區(qū)間的覆蓋概率可能大于1-α.

2.2 似然比統(tǒng)計(jì)量的構(gòu)造和應(yīng)用

頻率學(xué)派置信區(qū)間的構(gòu)造方法與假設(shè)參數(shù)真值為θ0,并對其進(jìn)行假設(shè)檢驗(yàn)是等價(jià)的.常用的一種檢驗(yàn)為似然比統(tǒng)計(jì)量檢驗(yàn),似然比λ定義為

(3)

(4)

置信區(qū)間的數(shù)值計(jì)算有時(shí)會很困難,可以通過蒙特卡羅(MC)方法求解.如果模型中使用似然函數(shù)較為復(fù)雜,那么運(yùn)算過程中將包含較多難算的最優(yōu)化問題.

2.3 不確定誤差參數(shù)統(tǒng)計(jì)模型

對于構(gòu)造似然比時(shí)引入冗余參數(shù),Cowan提出一種應(yīng)用輪廓似然比(profile likelihood ratio)統(tǒng)計(jì)量的不確定誤差參數(shù)統(tǒng)計(jì)模型.此模型對數(shù)據(jù)誤差應(yīng)用Gamma分布進(jìn)行建模,通過調(diào)整超參數(shù)r,得到具有優(yōu)良穩(wěn)健性的擬合結(jié)果.輪廓似然比定義為

(5)

圖1展示了正態(tài)分布樣本的輪廓似然直方圖與χ2分布的對比.紅色直線代表標(biāo)準(zhǔn)的χ2分布PDF,樣本輪廓似然比的MC模擬結(jié)果在歸一化后顯示為藍(lán)色直方圖.在滿足一定假設(shè)的前提下,-2lnλ服從χ2分布.然而若某些假設(shè)條件不成立,比如參數(shù)間有著相關(guān)性的條件下,-2lnλ則并不總是服從χ2分布.

圖1 特定參數(shù)下-2ln λ的分布

對于牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析問題,可以選取高斯分布的似然函數(shù),而對誤差應(yīng)用Gamma分布模型進(jìn)行刻畫.通過超參數(shù)控制誤差波動,可以在實(shí)驗(yàn)數(shù)據(jù)集上得到較好的擬合效果.高斯分布通常被認(rèn)為是在許多未知影響因素相互疊加時(shí)的近似分布,這里為p(y|μ,θ)選取高斯分布的似然函數(shù)是合理的.可以構(gòu)造如下似然函數(shù)

(6)

這代表假設(shè)觀測數(shù)據(jù)y服從一個(gè)高斯分布,其參數(shù)為μ,θ.θ的估計(jì)值為u,假設(shè)其服從高斯分布,即

(7)

(8)

(9)

(10)

(11)

調(diào)整超參數(shù)r的值,可以控制模型對于異常值的敏感性.

在對模型參數(shù)進(jìn)行化簡后,對數(shù)似然函數(shù)為

(12)

圖2 模型在一組實(shí)驗(yàn)數(shù)據(jù)上的擬合結(jié)果

3 模型計(jì)算結(jié)果

計(jì)算所得的牛頓環(huán)測量數(shù)據(jù)估計(jì)值及其置信區(qū)間如圖3所示.圖中曲線代表負(fù)對數(shù)似然作為參數(shù)μ的函數(shù),根據(jù)Wilks定理,使得-2lnλ從最小值增大1時(shí)的μ值即為其68.3%置信區(qū)間的邊界,在圖中以豎直虛線顯示.不同的子圖顯示了不同參數(shù)設(shè)置下的擬合結(jié)果.計(jì)算得到,選取r=0.2時(shí),牛頓環(huán)測量數(shù)據(jù)估計(jì)值為R=1 998.79,對應(yīng)的置信區(qū)間邊界為[1 990.34,2 007.32].當(dāng)r=0.4時(shí)的置信區(qū)間總長略大于r=0.2時(shí)的結(jié)果,這與之前的模型分析吻合.

圖3 模型計(jì)算結(jié)果

此外,模型對采用逐差法的數(shù)據(jù)擬合結(jié)果為R=1 998.25-9.71/+9.47,對最小二乘法的數(shù)據(jù)結(jié)果為R=1 998.97-7.47/+7.90.在計(jì)算過程中,當(dāng)r=0.6時(shí),-2lnλ的函數(shù)曲線有更多的起伏,這表示當(dāng)r過大,模型的預(yù)測效果可信度較低.因此,我們選取參數(shù)值r=0.2作為最優(yōu)參數(shù)值.

圖4對比了牛頓環(huán)實(shí)驗(yàn)測量數(shù)據(jù)和不同統(tǒng)計(jì)模型計(jì)算結(jié)果,圖中陰影部分為不確定誤差參數(shù)模型計(jì)算所得的置信區(qū)間.在垂直虛線左側(cè)為隨牛頓環(huán)實(shí)驗(yàn)變化的測量數(shù)據(jù)列,右側(cè)為模型擬合結(jié)果,包括加權(quán)均值、中位數(shù)以及本文得到的結(jié)果.圖4下方子圖展示了以誤差統(tǒng)計(jì)模型為基準(zhǔn)進(jìn)行歸一化之后的結(jié)果.

此誤差統(tǒng)計(jì)模型的重要特性之一是,隨著參數(shù)值的增加,擬合數(shù)據(jù)的值對顯著偏離中心值的游離點(diǎn)(異常值)變得不那么敏感.圖4中體現(xiàn)出了這種特性,結(jié)合在實(shí)驗(yàn)數(shù)據(jù)上的擬合效果,最終我們選取參數(shù)值r=0.2.此時(shí)的不確定誤差參數(shù)統(tǒng)計(jì)模型相比起中位數(shù)結(jié)果更接近于數(shù)據(jù)整體的加權(quán)均值,且對數(shù)據(jù)有著較好的覆蓋率.

圖4 原始數(shù)據(jù)分布及模型預(yù)測結(jié)果對比(下方子圖為歸一化后的相對誤差分布)

4 結(jié)論

總而言之,物理實(shí)驗(yàn)的一個(gè)主要目標(biāo)是對一些關(guān)鍵物理量進(jìn)行精確測量.牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù)不同方法間長期存在的偏差是基礎(chǔ)光學(xué)和大學(xué)物理實(shí)驗(yàn)數(shù)據(jù)處理的疑難問題之一.對牛頓環(huán)測量誤差進(jìn)行穩(wěn)健統(tǒng)計(jì)建模分析是獲取可信估計(jì)值及置信區(qū)間的關(guān)鍵.本文應(yīng)用Cowan不確定誤差參數(shù)統(tǒng)計(jì)模型,對牛頓環(huán)實(shí)驗(yàn)數(shù)據(jù)使用Gamma分布對誤差建模,得到曲率半徑估計(jì)值為R=1 998.79-8.45/+8.53,計(jì)算結(jié)果顯示出良好的穩(wěn)健性,并且對異常值的干擾不敏感.

George E. P. Box 指出:“所有模型都是錯(cuò)誤的,但有些模型是有用的”.每個(gè)計(jì)算統(tǒng)計(jì)模型的一些潛在假設(shè)并不一定都嚴(yán)格成立.Gamma誤差模型在一定程度上可以克服傳統(tǒng)方法不實(shí)假設(shè)的問題,這也啟發(fā)我們在類似情況下應(yīng)用不確定誤差參數(shù)模型,并進(jìn)一步研究其他大學(xué)物理實(shí)驗(yàn)測量數(shù)據(jù)的不確定度問題.

猜你喜歡
高斯分布置信區(qū)間牛頓
定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
p-范分布中參數(shù)的置信區(qū)間
利用Box-Cox變換對移動通信中小區(qū)級業(yè)務(wù)流量分布的研究
多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
2種非對稱廣義高斯分布模型的構(gòu)造
牛頓忘食
列車定位中置信區(qū)間的確定方法
一種基于改進(jìn)混合高斯模型的前景檢測
風(fēng)中的牛頓
失信的牛頓
崇礼县| 武山县| 成武县| 霞浦县| 江都市| 贵南县| 神农架林区| 盘山县| 楚雄市| 沭阳县| 洛宁县| 大邑县| 永登县| 葵青区| 阿勒泰市| 历史| 普兰店市| 汨罗市| 湛江市| 醴陵市| 金寨县| 唐山市| 镇安县| 贵港市| 衡南县| 伊金霍洛旗| 连江县| 赤水市| 益阳市| 科技| 阳新县| 浪卡子县| 建平县| 永州市| 鄯善县| 通州市| 茶陵县| 南召县| 德兴市| 郎溪县| 高淳县|