朱鶴年 肖志剛
(清華大學(xué)物理系,北京 100084)
周光召先生在1999年10月說:“為什么本世紀(jì)最重要的物理學(xué)發(fā)現(xiàn)又恰恰在德國的土地上發(fā)生?”他歸納為3點:首先德國人非常重視實驗和實驗數(shù)據(jù)的分析;第二個特點就是德國有很強(qiáng)的數(shù)學(xué)傳統(tǒng);第三個是德國有非常強(qiáng)的哲學(xué)傳統(tǒng).次年《物理》雜志刊登該講話時的題目是《希望在中國產(chǎn)生諾貝爾獎獲得者》.
2011年1月science主編Alberts B.在短文“《科學(xué)》雜志新設(shè)的一種教學(xué)獎”中,批評了以往大學(xué)本科的科學(xué)教育,談及親歷體會時說:“既沒有掌握對科學(xué)本質(zhì)的真正理解,也沒有獲得關(guān)于產(chǎn)生和評估科學(xué)證據(jù)及其解釋的任何經(jīng)驗,而這兩點才是現(xiàn)代意義下‘科學(xué)教育’最核心的要素.許多學(xué)校至今仍然一成不變地保留著這種缺憾.”
以上兩段精辟論述,是我們在教材、講課中多次引用的.拙作冠以“新概念”的定語,想表達(dá)兩重含義:(1)重視物理實驗分析與經(jīng)驗證據(jù)評估,以新視角撰寫了相關(guān)內(nèi)容,重組了物理實驗中數(shù)據(jù)處理與經(jīng)驗證據(jù)評估新架構(gòu);(2)介紹積木式組合實驗的做法,大多數(shù)實驗包括基礎(chǔ)性內(nèi)容以及多個帶探索性的層次,用基本儀表器具作積木式組合來完成.下文介紹我們在重組實驗數(shù)據(jù)處理與經(jīng)驗證據(jù)評估新架構(gòu)的探索要點或特點.
1)指出除隨機(jī)誤差具有隨機(jī)變量的特性之外(嚴(yán)格隨機(jī)性),未定系統(tǒng)誤差也常常具有一定的隨機(jī)性(近似隨機(jī)性).
2)這兩種隨機(jī)性是A、B兩類不確定度分量方和根合成規(guī)則賴以基本成立的基礎(chǔ),也是一系列理論統(tǒng)計學(xué)的方法、概念能應(yīng)用、借用于經(jīng)驗證據(jù)評估體系的基礎(chǔ).
3)未定系統(tǒng)誤差的近似隨機(jī)性,決定了宏觀測量實驗數(shù)據(jù)分析中所用的應(yīng)用統(tǒng)計學(xué)概念、方法的近似性,導(dǎo)致了現(xiàn)代誤差理論、不確定度評定、經(jīng)驗證據(jù)評估體系架構(gòu)的非公理化特征.理論統(tǒng)計學(xué)與應(yīng)用統(tǒng)計學(xué)之間的暗隙少有問津,明示暗隙可架橋.
在不包含微觀、宇觀的一般測量中,除極少數(shù)用比較測量儀器的比較測量外,影響結(jié)果準(zhǔn)確度的主要是系統(tǒng)性誤差分量.與此大致對應(yīng),不確定度評定中的主要分量是用非統(tǒng)計方法估計的B類分量.
1)未定系差影響像“西瓜”,隨機(jī)誤差影響像“芝麻”.
2)“純”測量誤差大多不是嚴(yán)格的正態(tài)分布.宜弱化與正態(tài)分布有關(guān)的教學(xué)內(nèi)容,例如對t分布可像標(biāo)準(zhǔn)GB 3360那樣作簡介.
3)非單次直接測量時,與合成不確定度Up或uC關(guān)聯(lián)的大多不是直接測量量的測量誤差分布,而是平均、回歸、組合測量等給出的最佳估值的可能分布.考慮被測對象體現(xiàn)值可能波動的原分布,測得值分布是原分布與測量誤差分布的卷積,最佳估值的可能分布主要由測得值分布及計算評估方法而定.因此直接影響Up或uC的不是測量誤差本身,基礎(chǔ)教學(xué)中要弱化誤差分布的內(nèi)容,突出誤差的隨機(jī)性、大多有抵償性等特征.
4)多數(shù)測量對象的約定真值或參考值未知,不能計算誤差,因此要評定不確定度.
5)科學(xué)研究、工程技術(shù)、商貿(mào)醫(yī)衛(wèi)、環(huán)境安全、生產(chǎn)管理、質(zhì)量監(jiān)保等領(lǐng)域的測量大多是一般測量,不同于基本物理量研究及計量基礎(chǔ)研究這些象牙塔上的測量工作,這是一般數(shù)據(jù)處理規(guī)范方法的主要基點.
6)一般測量相當(dāng)多的為單次,不能直接計算A類不確定度,要重視B類分量的評定.
7)大多數(shù)測量結(jié)果的報告要求給出足夠可靠,即具有高置信概率(水平)的合成不確定度Up,只有少數(shù)基本物理量研究與計量學(xué)基礎(chǔ)性研究或技術(shù)中要求給出合成標(biāo)準(zhǔn)不確定度uC及其有效自由度νeff.這里±uC對應(yīng)的置信概率約為2/3而非0.683.
8)測量離不開儀表器具選擇或測量裝置搭建,也需對測量條件、環(huán)境參量、其他影響量或輸入量以及其變化過程進(jìn)行局部控制.測量設(shè)備準(zhǔn)確度參量大多僅知道高置信概率的限值,如最大允許誤差(MPE)或誤差限,各輸入或控制參量的準(zhǔn)確度大多也用高置信概率的極限值或不確定度UBj表示,一般不能獲知其分布特征.由UBj估算合成uC用的B類分量uBj時,常約定用使uBj略有放大的均勻分布包含因子
這8個主從關(guān)系,是物理實驗與一般測量中數(shù)據(jù)處理體系架構(gòu)的重要“實在”基礎(chǔ).
統(tǒng)計學(xué)是現(xiàn)代誤差理論、不確定度評定、經(jīng)驗證據(jù)評估體系架構(gòu)的基礎(chǔ),但是易被忽視,更需重視的基礎(chǔ)是實驗物理、計量與儀器儀表領(lǐng)域的實在,包括實際規(guī)律、實際需求、實際對象、實在條件環(huán)境、實在儀器方法以及完善中的實在標(biāo)準(zhǔn)、法規(guī)與規(guī)范.在物理實驗教學(xué)中,學(xué)生除了要會使用基本的數(shù)據(jù)處理方法外(對一些提高性方法只需會套用),還要理解如下要點:
1)決定數(shù)據(jù)分析與處理的方法體系的是:實驗物理與測量的客觀實在與統(tǒng)計學(xué).
2)誤差的普遍性原理.由于儀器設(shè)備不準(zhǔn)確、方法原理不完善、環(huán)境條件不穩(wěn)定、人員操作不熟練等因素,任何測量結(jié)果都可能有誤差.雖然一般不能計算誤差,但能(1)分析誤差產(chǎn)生的主要或不可忽略因素;(2)基本消除或減小某些誤差分量的影響;(3)對未能消除的主、次要誤差分量,估計其標(biāo)準(zhǔn)差或極限值等特征值,進(jìn)而評定不確定度.
3)誤差是小量,有隨機(jī)性,包括隨機(jī)誤差的嚴(yán)格隨機(jī)性和未定系差的近似隨機(jī)性.
4)方和根合成方法.相近置信概率的誤差分量特征值綜合時,或不確定度分量綜合時,約定用方和根合成的方法.它是1980年BIPM咨詢多國計量院所后的重要約定.
5)系統(tǒng)誤差分量影響像“西瓜”.不包括宇觀、微觀領(lǐng)域的大量一般測量的實踐表明:除了極少數(shù)用比較測量儀器的比較測量之外,系統(tǒng)誤差分量對測量結(jié)果的影響,常顯著地大于隨機(jī)誤差分量的影響.因此大學(xué)實驗要重視對系差的分析處理,盡量減小系差對結(jié)果的影響:(1)修正已定系差;(2)評定B類不確定度分量(大致對應(yīng)于未定系差分量);(3)多環(huán)節(jié)減小系差影響,包括方案選擇、參數(shù)設(shè)計、計量器具校準(zhǔn)、環(huán)境條件控制、計算方法改進(jìn),使未定系差分量隨機(jī)化等.
6)最小二乘法(LSM)原理:使等精密度量yi的殘差平方和為極小值.用LSM為充分利用測量有效信息,減小誤差影響.殘差vi是yi與其平均值、擬合預(yù)報值等“最佳”估值之差.
7)方和根合成的微小分量判據(jù).方和根合成時如某分量小于最大分量或結(jié)果估值的1/5~1/6,就可看作可忽略微小分量.
8)不確定度或誤差限值決定修約間隔進(jìn)而決定有效位數(shù).修約間隔的選擇,為保證結(jié)果的不確定度基本不因舍入而增大,也為少做無用功或避免被誤解.有效位數(shù)只能在一定程度上反映量值的不確定度.
9)高置信概率參量表示的普遍性.一般結(jié)果表示中要求量值的不確定度有高置信概率,即有高可靠性.一般儀表準(zhǔn)確度指標(biāo)與條件控制等參量指標(biāo)也用極限值表示.
10)隨機(jī)誤差大多有抵償性,由此導(dǎo)出以重復(fù)測量的算術(shù)平均值作為最佳估值,算術(shù)平均值原理曾是老誤差理論的重要命題之一.在相同條件下對同一穩(wěn)定被測量的多次重復(fù)測量中,隨機(jī)誤差分布常滿足一定的統(tǒng)計規(guī)律:隨機(jī)誤差分布絕大多數(shù)有“有界性”;大多數(shù)有抵償性;相當(dāng)多的有單峰性.這里用了模糊表述,因為正態(tài)分布無界,余弦分布期望值非零,均勻分布無單峰性.
10個命題中第一個是基礎(chǔ)性、哲學(xué)性的;誤差普遍性、誤差是小量有隨機(jī)性、系差重要性,大多有抵償性、高置信概率表示的普遍性.這5個命題是源于實際事實;方和根合成是參考統(tǒng)計學(xué)理論的國際約定;微小分量判據(jù)能由方和根合成、誤差是小量導(dǎo)出;LSM原理是統(tǒng)計學(xué)的重要命題;有效數(shù)字修約方法可由修約間隔的標(biāo)準(zhǔn)與微小分量判據(jù)導(dǎo)出.
由中心極限定理推導(dǎo)時用的誤差分量“足夠多、均勻小”的前提缺乏哲學(xué)依據(jù)與實際依據(jù),相當(dāng)多的測量儀器的測量誤差分布實例也不服從(嚴(yán)格的)正態(tài)分布.JCGM 頒布的“VIM3-rded.”所定義的測量誤差通常不包括均值或回歸估值等的誤差[1].
質(zhì)疑幾種統(tǒng)計離群值(高度異常值,俗稱粗差)的傳統(tǒng)判據(jù),如
3s法.3≤n<11時3s法檢出率恒為零.n>19時正態(tài)樣本的剔除率可能高于1%而背離國標(biāo)GBT_4883.n=11~13時正態(tài)樣本檢出率也小于0.10%,顯著小于“原理”預(yù)期0.27%.
肖維勒(Chauvenet)判據(jù)也有邏輯性錯誤:因為正態(tài)總體下n=3,4時剔除率恒為零;n>4又可能使正態(tài)樣本的剔除率高于10%.
標(biāo)準(zhǔn)推薦用Grubbs判據(jù),它在異常值也屬于正態(tài)總體的假設(shè)下是嚴(yán)密的,但是高度異常值常常不能看作與數(shù)據(jù)主體源自同一總體.判斷異常值一般為更好估計總體均值μ與總體標(biāo)準(zhǔn)差σ,對源自正態(tài)總體的樣本用蒙特卡洛法(MCM)計算表明,Grubbs判據(jù)將使μ與σ估值質(zhì)量變差.另外,一些教材給出的G0.99只是單側(cè)臨界值,G0.95不能用于剔除判斷.
我們導(dǎo)出了統(tǒng)計允許限因子的高準(zhǔn)確度計算式,構(gòu)建了正態(tài)分布前提下用統(tǒng)計允許限的新判據(jù),提出了直線擬合時的初步判斷據(jù)、二次回歸中的粗略判據(jù),判斷的特征量及臨界值用填數(shù)式EXCEL工作表算出.
直線擬合等回歸組合測量中,自變量要選多點散布值,這是實驗設(shè)計三原則:“局部控制,重復(fù),隨機(jī)化”的體現(xiàn).直線擬合時,如果因變量只有獨立同分布隨機(jī)誤差,測等距散布的n點求LSM的斜率b1,與集中直線兩端各測n/2點用平均值之差所得斜率相比,斜率標(biāo)準(zhǔn)差sb1期望值之比為.反證法表明多點散布測量主要為了減小有隨機(jī)性的未定系差.
LSM之于統(tǒng)計學(xué)就好比微積分之于高等數(shù)學(xué).LSM離不開因變量yi的誤差是獨立、同分布隨機(jī)變量的假定,即高斯-馬爾科夫(G-M)假定.多數(shù)專著在闡述直線擬合時都用 Working-Hote-ling置信帶公式,作為平均值的置信區(qū)間,也有陳希孺、Weisberg S.等少數(shù)學(xué)者未引此式.W-H式會導(dǎo)致斜率等參量的標(biāo)準(zhǔn)差隨自由度增加而趨于零的邏輯性瑕疵.既然擬合的主要目的非為減小隨機(jī)誤差影響,而未定系差分量影響通常像“西瓜”,它雖有一定的隨機(jī)性,但不滿足獨立、同分布假定,常常也不能看作是隨機(jī)變量.考慮到回歸的因變量標(biāo)準(zhǔn)差sy中已經(jīng)包含了yi隨著自變量xi不同而有一定隨機(jī)性的未定系差影響,我們對W-H公式作了調(diào)和性拓展,再綜合考慮yi具有的B類擴(kuò)展不確定度Uyi對擬合參量的影響,初步提出了較全面計算擬合參量標(biāo)準(zhǔn)差或不確定度的擴(kuò)展近似算式.
ISO與國家標(biāo)準(zhǔn)GB 8170規(guī)定:修約間隔只能等于1、0.2或0.5乘以10的整數(shù)冪.將此等式與從嚴(yán)控制的微小分量判據(jù)的不等式聯(lián)列,就能導(dǎo)出獨立測量結(jié)果有效數(shù)字表示的一般規(guī)則.對回歸或其他組合測量的結(jié)果,由于參量間不獨立有相關(guān)性,其標(biāo)準(zhǔn)差的有效位數(shù)常多于1~2位.有效位數(shù)處理要抓兩頭放中間,即關(guān)注原始數(shù)據(jù)讀取和最后結(jié)果表示,中間運算過程不作修約.
現(xiàn)有3類架構(gòu):(1)不確定度架構(gòu),以《測量不確定度評定指南》(GUM)為代表,用標(biāo)準(zhǔn)差形式的分量合成[2];(2)“經(jīng)典”誤差理論架構(gòu),以中國計量院(NIM)向BIPM的建議信為代表,一般測量中用極限值分量合成[3];(3)不確定度分量的MCM合成法[4].我們研究分析了3類架構(gòu),揭示了GUM方法的隱含假定及其與NIM建議方法的相通本質(zhì),也揭示了幾種架構(gòu)的規(guī)范文件或其案例中的若干邏輯上不自洽的瑕疵或局限.
創(chuàng)建了第4章所述的不確定度分量合成的綜合技術(shù)法(THM).用廣義正交矩陣變量解決了n個輸入量有n(n+3)/2個一、二次項偏導(dǎo)數(shù)的多元回歸求解難題.綜合3類架構(gòu)的優(yōu)點,創(chuàng)建了THM的通用EXCEL工作表,可適用于1~24分量的絕大多數(shù)合成計算問題,使一般測量人員和大學(xué)生從復(fù)雜概念體系和數(shù)學(xué)計算過程中解脫出來.
基于上文所述架構(gòu),我們提出了幾種新的數(shù)據(jù)分析評定具體方法,如直線擬合的經(jīng)驗調(diào)和法、用數(shù)字面板表相對比較測量時定值倍率系差減消法、鐘形線型分析中的未定系差隨機(jī)化法等.綜合運用改進(jìn)后的體系設(shè)計實驗步驟、優(yōu)化分析方法,在多個基礎(chǔ)實驗的定量研究結(jié)果中,使儀器的分辨率與準(zhǔn)確度被榨干到最后一滴,讓學(xué)生體會到“重視實驗與評估、物理和數(shù)學(xué)結(jié)合”的重要性,也打破了對科研實驗、高端儀器的神秘感.
在教材[5]中,我們較系統(tǒng)地綜述了測量實驗設(shè)計的要點與思路.依據(jù)國內(nèi)外計量學(xué)、儀器儀表學(xué)方面的新進(jìn)展、新規(guī)范,學(xué)習(xí)借鑒統(tǒng)計學(xué)的成果,我們還做了一些正本清源的努力,對相關(guān)教材中較普遍的一些欠邏輯性或與實際相悖的概念、命題或方法作了評析或修正,力求教學(xué)內(nèi)容的科學(xué)性與規(guī)范性.如:(1)糾正了專著、教材中B類分量自由度約定取1的錯誤.(2)闡明逐差法只是簡化擬合法自變量等間距的特例,其適用范圍窄,與LSM相使比自由度減半而增大了擬合結(jié)果參量的分散性及其不確定度,指出大學(xué)物理實驗中不宜再使用這一國外文獻(xiàn)中罕見的方法.(3)引述國內(nèi)外統(tǒng)計學(xué)專著指出相關(guān)系數(shù)不能獨立地用于擬合(回歸)質(zhì)量的判斷.(4)指出了在一些高次(或多元)模型的建模中,不能僅以殘差平方和大小判斷模型優(yōu)劣或增項的必要性,需對各回歸系數(shù)bi由作sbi/bi顯著性檢驗.
基于課程的基礎(chǔ)性與實踐為主的特征,對基礎(chǔ)物理實驗中的不確定度評定,我們還主張多數(shù)實驗通過不同環(huán)節(jié)體現(xiàn)重視誤差分析的理念,但不要求評定不確定度;部分實驗只算A類或B類分量;僅安排少數(shù)幾個實驗做全面評定的練習(xí).全面評定時只要求會用或會套用相關(guān)的方法步驟,同時強(qiáng)調(diào)要重視這些方法的應(yīng)用范圍、主要假定或前提,對其導(dǎo)出思路或過程只要求初步理解或大致了解,首次緒論課上我們只講怎樣做,在數(shù)周后的大課上再歸納講解非公理化方法體系的導(dǎo)出思路.
[1] ISO/IEC GUIDE 99:2007(E/F).International vocabulary of metrology—Basic and general concepts and associated terms(VIM),3rded..簡稱為 VIM.
[2] JCGM 100:2008.Evaluation of measurement data—Guide to the expression of uncertainty in measurement.簡 稱GUM.
[3] 朱鶴年.新概念物理實驗測量引論:數(shù)據(jù)分析與不確定度評定基礎(chǔ)[M].北京:高等教育出版社,2007:94-96.
[4] JCGM 101:2007.Evaluation of measurement data—Supplement 1to the “Guide to the expression of uncertainty in measurement”—Propagation of distributions using a Monte Carlo method.
[5] 朱鶴年.基礎(chǔ)物理實驗教程——物理測量的數(shù)據(jù)處理與實驗設(shè)計[M].北京:高等教育出版社,2003:163-223.