徐 寶,馬藝光,趙志文,孫耀東
(吉林師范大學 數學學院,吉林 四平 136000)
簡單均勻分布參數同等最短置信區(qū)間的求法
徐 寶,馬藝光,趙志文,孫耀東
(吉林師范大學 數學學院,吉林 四平 136000)
對形如U(0,θ)的均勻分布,文章在給定置信水平1-a下,用計算函數極值的方法得到了參數q的平均長度最短的同等置信區(qū)間,然后通過最大密度區(qū)間法得到了該參數的相同的最短置信區(qū)間,后者的求解過程也充分印證了該方法也是確定參數最短置信區(qū)間以及構造等尾置信區(qū)間的依據。
均勻分布;置信區(qū)間;最大密度區(qū)間
均勻分布也稱為平頂分布,是一種常見的連續(xù)型分布,也是在理論和實踐中都有重要應用的一種概率統(tǒng)計模型。理論上,均勻分布在構造性地證明隨機變量存在定理中起到關鍵作用[1];任何連續(xù)型隨機變量X的分布函數F(x)對應的隨機變量F(X)都服從區(qū)間(0,1)上的均勻分布[1]。生活和生產實際中也經常使用,比如:半徑為r的汽車輪胎的圓周接觸地面的位置X服從均勻分布U(0,2πr)[1],這從報廢輪胎四周的磨損程度幾乎相同可以得到印證。
一般均勻分布U(a,b)的參數估計是理論和實際應用中不可或缺的一部分,而區(qū)間估計是更是參數估計中的重要內容。在給定置信水平下構造的置信區(qū)間,人們關心的是該區(qū)間的精確度問題,而區(qū)間的精確度通常由兩方面來衡量:一是置信區(qū)間的平均長度越短越好,二是置信區(qū)間包含真值的概率越大越好。在實際應用中,通常使用置信區(qū)間長度來衡量其精確度。因此研究各種分布參數的最短置信區(qū)間有一定的理論和現實意義。一般均勻分布U(a,b)的參數a和b的最短置信區(qū)間是統(tǒng)計文獻中的常見的研究內容[2-5],都是和其他分布參數一樣使用樞軸量和分布的分位數構造置信區(qū)間以及使用極值確定最短置信區(qū)間[6-8],但確定的依據卻都沒有明確提出.本文對形如U(0,1)和U(0,2πr)的簡單均勻分布U(0,θ),利用數學分析中計算函數條件極值的方法得到參數q的最短同等置信區(qū)間,并用最大密度區(qū)間法[9]驗證了該區(qū)間確實是給定置信水平下的最短置信區(qū)間,并由此印證最大密度區(qū)間正是確定參數最短置信區(qū)間以及構造等尾置信區(qū)間的依據。
計算U(0,θ)中參數θ的最短同等置信區(qū)間,為了行文需要,給出如下概念:
定義2(同等置信區(qū)間):設θ是某總體的一個取值于Θ 的參數,x1,…,xn為抽自該總體的一個樣本,對給定的a∈(0,1),若存在兩個統(tǒng)計量與,且滿足,使得∈Θ),則稱隨機區(qū)間為參數 q 的 1-a 同等置信區(qū)間。
定義3(最大密度區(qū)間):將隨機變量的具有高密度值的點歸入某個區(qū)間,使該區(qū)間外的點的密度值不超過區(qū)間內的任意點的密度值,若這種集最大密度點形成的區(qū)間存在,則稱該區(qū)間為對應隨機變量的最大密度區(qū)間,并且最大密度區(qū)間的長度是最短的。
對給定的a∈(0,1),U(0,θ)中參數θ的最短同等置信區(qū)間由下面定理給出:
定理:設x1,…,xn是來自均勻分布總體U(0,θ)的一個樣本,對給定的α(0<α<1),參數θ的1-α最短同等置信區(qū)間為其中x(n)為該分布的最大次序統(tǒng)計量。
證明:第一步:構造樞軸量。
首先尋找參數θ的一個點估計,由于矩法估計精度不高,所以尋求θ的極大似然估計。
由于似然函數為:
要使L(θ)達到最大,示性函數取值必須為1,其次是盡可能大,由于是θ的單調減函數,所以θ的取值應盡可能小,但示性函數為1決定了θ不能小于x(n),由此得到參數θ的極大似然估計為
從而有G的概率密度函數為:
很明顯它與參數θ無關,所以是樞軸量。
第二步:選擇常數c和d,使得概率等式P(c≤G≤d)=1-α恒成立。
從而有:
因此c和d滿足dn-cn=1-α。
第三步:求參數θ的1-α同等置信區(qū)間。
第四步:尋找最短1-α同等置信區(qū)間。
由于0<c<d≤1,且dn-cn=1-α,所以求二元函數的極值問題就變成了限制條件φ(c,d)=dn-cn-1+α=0下的條件極值問題了。一般考慮使用數學分析中的拉格朗日乘數法求之,但是函數在區(qū)域E={(c,d):0<c<d≤1}的內部沒有穩(wěn)定點,自然也沒有候選極值點,因此該函數如果存在極值點也只能在邊界點處取得,但區(qū)域E的邊界點有無窮多個,無法一一驗證,所以嘗試轉用無條件極值借助函數的特性求之。
由于dn-cn=1-α,從而有于是有:
對函數g(d)是關于d求導,有:
這說明g(d)是關于d的單調減函數,而0<d≤1,故g(d)在d=1處取得極小值,此時于是二元函數在點處取得最小值,因此參數θ的1-α同等最短置信區(qū)間為
這是從數學分析角度得到的最短置信區(qū)間,只是給出了計算方法,并沒有指出構造最短置信區(qū)間的思想,而下面的從樞軸量的分布函數出發(fā)應用最大密度區(qū)間法,不但能確定參數的與前述相同的最短置信區(qū)間,而且還能體現出構造最短置信區(qū)間的指導思想。
圖1
本文對簡單的均勻分布U(0,θ),分別運用函數極值和最大密度區(qū)間法計算了參數θ的1-α最短同等置信區(qū)間,兩種方法得到的形式一致,其中最大密度區(qū)間法是一種比較巧妙的方法,它不但運用了數形結合的思想,還給出了利用分布的分位數構造最短置信區(qū)間的依據,該方法是構造參數的置信區(qū)間的指導思想。
[1]茆詩松,程依明,濮曉龍.概率論與數理統(tǒng)計教程(第二版)[M].北京:高等教育出版社,2011.
[2]王秀麗.均勻分布參數的最短置信區(qū)間[J].數學的實踐與認識,2008,(5).
[3]曾艷.均勻分布參數的最短置信區(qū)間[J].赤峰學院學報:自然科學版,2011,(9).
[4]張紅兵.均勻分布區(qū)間長度的最短置信區(qū)間[J].孝感學院學報,2007,(5).
[5]鄭發(fā)美.兩均勻分布區(qū)間長度比的置信區(qū)間與假設檢驗[J].統(tǒng)計與決策,2009,(22).
[6]徐付霞,董永杈,王娟.基于離散樞軸量的泊松分布參數的精確最短置信區(qū)[J].數學的實踐與認識,2014,(24).
[7]徐美萍,于健,王若.威布爾分布中尺度參數的最短區(qū)間估計[J].江西師范大學學報:自然科學版,2015,(3).
[8]夏樂天,郭寶才,肖艷文.指數分布參數置信區(qū)間的最短化研究[J].河海大學學報:自然科學版,2003,(3).
[9]茆詩松,呂曉玲.數理統(tǒng)計學(第二版)[M].北京:中國人民大學出版社,2016.
(責任編輯/浩 天)
O212.1
A
1002-6487(2017)19-0084-03
吉林省社會科學基金資助項目(2014B137);吉林省科技發(fā)展計劃項目(20150101007JC)
徐 寶(1977—),男,吉林四平人,博士,副教授,研究方向:數理統(tǒng)計。