国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

完全輔助信息下非參數(shù)模型校準(zhǔn)估計方法研究

2020-11-04 14:13:08賀建風(fēng)陳茜儒
統(tǒng)計與信息論壇 2020年11期
關(guān)鍵詞:估計量總體輔助

賀建風(fēng),陳茜儒,陳 飛

(1.華南理工大學(xué) 經(jīng)濟與金融學(xué)院,廣東 廣州 510006; 2.安徽長豐雙鳳經(jīng)濟開發(fā)區(qū)管理委員會,安徽 合肥 231100)

一、引 言

隨著信息技術(shù)快速發(fā)展,云計算和大數(shù)據(jù)技術(shù)正不斷成熟,在現(xiàn)代化的統(tǒng)計調(diào)查實踐中,我們更容易獲取大量與研究變量相關(guān)聯(lián)的輔助信息,例如普查資料、前一期調(diào)查數(shù)據(jù)、衛(wèi)星遙感信息、行政記錄以及商業(yè)大數(shù)據(jù)資源等。利用輔助信息構(gòu)建抽樣估計量能夠在不增加調(diào)查成本的同時,極大地提高估計精度。校準(zhǔn)估計方法就是一種能夠很好利用輔助信息改進(jìn)抽樣估計效率的方法,其基本思路是通過校準(zhǔn)約束信息來修正原有估計量的權(quán)重系數(shù),從而達(dá)到提高估計精度的目標(biāo)。然而,傳統(tǒng)的校準(zhǔn)估計量僅利用到了總體和樣本觀測個體所構(gòu)成的部分輔助信息,對于調(diào)查環(huán)節(jié)中未被觀測樣本的輔助信息并沒有加以利用,這樣勢必會浪費更多可利用的輔助信息。事實上,在信息比較容易獲取的大數(shù)據(jù)時代,我們通常有條件利用每一個總體單位的完全輔助信息來進(jìn)行校準(zhǔn)估計。最早Wu和Sitter通過構(gòu)建研究變量與輔助變量之間的超總體模型,將完全輔助信息應(yīng)用于校準(zhǔn)估計,首次提出模型校準(zhǔn)估計的概念[1]。在此基礎(chǔ)上,Wu證明了模型校準(zhǔn)估計為最優(yōu)估計量,即在超總體模型下,其漸近設(shè)計方差的期望最小[2]。利用完全輔助信息構(gòu)建模型校準(zhǔn)抽樣估計過程中,關(guān)鍵在于選擇合適的模型以及模型的估計方法。

傳統(tǒng)校準(zhǔn)估計方法適用的前提較為嚴(yán)格,要求研究變量與輔助變量之間呈線性關(guān)系。然而大數(shù)據(jù)時代背景下,數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜,研究變量與輔助變量之間往往并沒有明顯的線性關(guān)系,為了構(gòu)建適應(yīng)性更強的模型校準(zhǔn)估計量,本文考慮在超總體模型的基礎(chǔ)上構(gòu)建非參數(shù)模型校準(zhǔn)估計方法體系。與線性假定條件下的傳統(tǒng)校準(zhǔn)估計方法一樣,直觀上來看,由于非參數(shù)模型校準(zhǔn)估計量中也會納入輔助信息,其估計精度在理論上將高于HT估計量。為了更全面、深入地研究具有完全輔助信息條件下,且輔助變量與研究變量之間呈非線性關(guān)系時,如何更好地開展模型校準(zhǔn)抽樣估計,本文將對此問題進(jìn)行系統(tǒng)性討論。本文的主要貢獻(xiàn)在于:第一,在文獻(xiàn)梳理的基礎(chǔ)上,將校準(zhǔn)抽樣估計方法歸納為部分輔助信息下的傳統(tǒng)校準(zhǔn)估計和完全輔助信息下的模型校準(zhǔn)估計兩大類;第二,在介紹局部多項式模型校準(zhǔn)估計的基礎(chǔ)上,拓展性地提出了基于懲罰樣條的模型校準(zhǔn)估計方法,對非參數(shù)模型校準(zhǔn)估計方法體系進(jìn)行了補充;第三,理論分析與數(shù)值模擬均表明,完全輔助信息下的模型校準(zhǔn)估計方法具有較好的性質(zhì)與更好的估計效果。

二、文獻(xiàn)綜述

(一)校準(zhǔn)估計方法的研究進(jìn)展

20世紀(jì)90年代,Deville和S?rndal最早提出了校準(zhǔn)估計法,并通過拉格朗日函數(shù)求極值的方法求得校準(zhǔn)權(quán)數(shù)和總體總值的校準(zhǔn)估計量形式[3]。之后的20多年間,抽樣校準(zhǔn)估計方法很快成為了國內(nèi)外抽樣調(diào)查研究領(lǐng)域的熱點。Deville等在常用距離函數(shù)的基礎(chǔ)上提出指數(shù)型、二次型和logit方程等其他形式的距離函數(shù),并證明不同形式的距離函數(shù)均可得到估計量的漸近無偏性和一致性[4]。為了解決部分距離函數(shù)求解校準(zhǔn)權(quán)重中可能出現(xiàn)負(fù)值和極端值的情況,Rao和Singh采用嶺回歸壓縮系數(shù)方法,在給定容忍度范圍情況下使得滿足約束條件的校準(zhǔn)系數(shù)落入指定范圍[5]。為了使求解校準(zhǔn)權(quán)重的方法更加多樣化,Estevao和S?rndal對校準(zhǔn)權(quán)重的獲得采取了一種新的方法,在新的方法中放棄原有的約束等式進(jìn)而應(yīng)用工具向量法,該方法可以在同一組輔助信息上產(chǎn)生多種校準(zhǔn)權(quán)重[6]。Estevao和S?rndal等人將工具向量法拓展到了復(fù)雜抽樣中,例如二重抽樣、二階抽樣、無回答問題中[7]。Wu和Sitter研究在輔助信息完全的情況下,通過構(gòu)造超總體模型求得總體簡單參數(shù)的校準(zhǔn)估計量,放松了研究變量和輔助變量之間關(guān)系的假定,一定程度上拓展了校準(zhǔn)估計法的運用空間。進(jìn)一步地,Wu證明了在沒有模型誤設(shè)的條件下,通過模型校準(zhǔn)估計法獲得的估計量是最優(yōu)的;若模型有誤,所得到的估計量在性質(zhì)上至少具有一致性。Montanari和Ranalli將局部多項式回歸和神經(jīng)網(wǎng)絡(luò)回歸兩種非參數(shù)方法引入校準(zhǔn)估計中,采用模型校準(zhǔn)估計方法,在研究變量和輔助變量是非線性關(guān)系的情形下,分別得到其模型校準(zhǔn)估計量,并證明了在合適的條件下估計量具有漸近正態(tài)性和一致性等良好性質(zhì)[8]。Rueda等在有限總體分布函數(shù)的估計中運用校準(zhǔn)估計法,并運用局部線性回歸,得到模型校準(zhǔn)估計量[9]。

國內(nèi)學(xué)者對校準(zhǔn)估計法的研究大部分集中在對校準(zhǔn)估計理論的梳理和方法的應(yīng)用上。劉建平和常啟輝對國外抽樣調(diào)查中的校準(zhǔn)估計在理論方法和應(yīng)用方面做了系統(tǒng)的梳理,并對其在中國抽樣調(diào)查中的應(yīng)用前景做了一些展望[10]。馬志華和陳光慧將局部多項式回歸引入模型校準(zhǔn)抽樣估計中,得到了局部多項式模型校準(zhǔn)估計量,并說明了該估計量具有良好的統(tǒng)計性質(zhì)[11]。賀建風(fēng)則將校準(zhǔn)估計方法引入到多重抽樣框的情形,并比較了不同模式下的估計功效[12]。金勇進(jìn)等將RGRG法引入不可忽略的無回答機制下的校準(zhǔn)估計,并證明該方法對無回答具有雙重保護(hù)作用[13]。

(二)非參數(shù)抽樣估計的研究現(xiàn)狀

本文對研究總體特征進(jìn)行統(tǒng)計推斷的另一個理論基礎(chǔ)是非參數(shù)回歸方法。在基于模型(Based model)和模型輔助(Model assist)兩種不同的估計框架下,國外學(xué)者對非參數(shù)方法在抽樣估計中的運用進(jìn)行了廣泛且比較深入的研究。在基于模型的框架下,Kuo最早運用核估計方法在單個輔助變量的條件下對總體分布函數(shù)和總體總值構(gòu)造了基于模型的估計量,得到了總體總值的Kuo估計量[14];Dofman在對有限總體總值估計抽樣單元的研究變量估計中使用了Nadaraya-Watson核估計量[15];Chambers等在得到核估計量后運用了非參數(shù)校準(zhǔn)方法,研究顯示該估計量在線性超總體模型正確情況下比Kuo估計量有效,當(dāng)模型誤設(shè)時,模型對估計量的估計效果影響較小[16]。

基于模型的估計量有一個突出特點,即當(dāng)模型設(shè)定正確時,估計量的估計效果要遠(yuǎn)高于其他類型的估計量,但當(dāng)模型誤設(shè)時,估計量的估計效果較差,甚至不如一些線性估計量。為了解決這一問題,不少學(xué)者開展采用模型輔助方法進(jìn)行抽樣估計的研究工作,產(chǎn)生了大量模型輔助估計量。Breidt和Opsomer最早在模型輔助框架下,利用非參數(shù)回歸中的局部多項式回歸估計方法構(gòu)建基于局部多項式模型的輔助回歸估計量,研究表明該估計量具有一致性和漸近正態(tài)性的良好性質(zhì),模擬研究顯示該估計量在模型誤設(shè)時,其估計精度仍然很高[17]。Breidt等構(gòu)建了懲罰樣條的非參數(shù)模型,結(jié)合差分估計方法,得到了懲罰樣條模型輔助估計量,并把懲罰樣條方法推廣到半?yún)?shù)回歸估計中[18]。Montanari和Ranalli運用了神經(jīng)網(wǎng)絡(luò)回歸方法對研究變量和輔助變量的關(guān)系進(jìn)行建模,得到模型輔助的神經(jīng)網(wǎng)絡(luò)估計量,并證明了在一定的條件下,該估計量具有一致性和無偏性等良好的性質(zhì)。Opsomer等研究了非參數(shù)可加模型在模型輔助估計中的應(yīng)用,得到的半?yún)?shù)估計量具有設(shè)計一致和漸近性的性質(zhì)[19]。

三、校準(zhǔn)抽樣估計方法的分類

(1)

其中di=1/πi,顯然HT估計量具有設(shè)計無偏性,其估計量方差為:

(2)

雖然HT估計量具有良好的性質(zhì),但是由于在估計過程中僅利用到研究變量本身的樣本信息和樣本單元的包含概率,并沒有利用其他任何輔助信息,其估計效率必然不會很高。下面我們根據(jù)利用輔助信息的不同程度介紹兩類針對式(1)的校準(zhǔn)估計方法。

(一)基于部分輔助信息的傳統(tǒng)校準(zhǔn)估計

(3)

式(3)中qi是調(diào)節(jié)參數(shù),取值為正,且與di不相關(guān)。利用拉格朗日極值法可求出校準(zhǔn)估計為:

(4)

(二)基于完全輔助信息的模型校準(zhǔn)估計

根據(jù)前文的分析可知,傳統(tǒng)校準(zhǔn)估計量至少存在輔助信息利用不全和要求研究變量與輔助變量之間呈線性關(guān)系兩大缺陷,因此其在應(yīng)用中會出現(xiàn)效率不高和范圍受限等問題。為了解決校準(zhǔn)估計量在這兩方面的難題,Wu和Sitter提出了模型校準(zhǔn)估計方法,基本思路是在超總體模型的基礎(chǔ)上,利用完全輔助信息來重新構(gòu)建校準(zhǔn)估計量,進(jìn)而得到模型校準(zhǔn)估計量[1]。事實上,隨著大數(shù)據(jù)時代的來臨,各種信息和數(shù)據(jù)搜集的手段不斷進(jìn)步,獲取完全的輔助信息已不再是難事。因此,在抽樣調(diào)查的估計推斷環(huán)節(jié)中,我們可以充分利用完全的輔助信息來建立模型校準(zhǔn)估計量,進(jìn)而提高估計精度。

(5)

其中,模型校準(zhǔn)權(quán)重ωi與初始基于設(shè)計的權(quán)重di之間的平均距離最小,并滿足如下限制條件:

(6)

(7)

四、非參數(shù)模型校準(zhǔn)估計方法構(gòu)建

在上一節(jié)所介紹的模型校準(zhǔn)估計方法中,假定μ(xi,θ)是一個包含總體參數(shù)的已知函數(shù),其函數(shù)形式并未做出明確要求。未知總體參數(shù)可以依據(jù)樣本的信息進(jìn)行估計,進(jìn)而可得到超總體模型中均值方程的估計式。當(dāng)研究變量與輔助變量之間不呈線性關(guān)系時,我們可以建立更為復(fù)雜的非參數(shù)超總體回歸模型來得到模型校準(zhǔn)估計量,其估計效果將優(yōu)于傳統(tǒng)校準(zhǔn)估計方法。非參數(shù)回歸模型可以針對非線性的復(fù)雜問題進(jìn)行靈活的推斷,模型的形式可以靈活變化,在實際中應(yīng)用范圍十分廣泛。由于對總體分布的假定要求條件較寬,因而非參數(shù)回歸模型的估計效果往往不會因為假定不當(dāng)而導(dǎo)致較大誤差出現(xiàn),通常表現(xiàn)出較好的穩(wěn)健性。

這里我們沿用Montanari和Ranalli的基本思路,在介紹傳統(tǒng)局部多項式回歸的非參數(shù)模型校準(zhǔn)估計方法的基礎(chǔ)上,將懲罰樣條估計方法引入到非參數(shù)模型校準(zhǔn)估計框架中,并與局部多項式模型校準(zhǔn)估計方法進(jìn)行比較分析[8]。借鑒Breidt和Opsomer提出的非參數(shù)模型基本框架,非參數(shù)超總體回歸模型ξ可設(shè)定為[17]:

yi=m(xi)+εi,i=1,2,…,N

(8)

這里m(·)是輔助變量xi的光滑函數(shù),εi是均值為零的獨立隨機變量,其方差為v(xi),且v(·)是嚴(yán)格為正的光滑函數(shù),{(yi,xi):i∈U}是超總體模型中的一個隨機實現(xiàn)組合。在非參數(shù)模型校準(zhǔn)估計的方法體系中,輔助變量的光滑函數(shù)m(·)不再是經(jīng)典的線性模式,而需要通過非參數(shù)的方法得到具體的估計形式。下面在已有的局部多項式模型校準(zhǔn)估計方法的基礎(chǔ)上,給出了一種全新的懲罰樣條回歸模型校準(zhǔn)估計方法。

(一)局部多項式模型校準(zhǔn)估計

目前,局部多項式估計方法是一種應(yīng)用廣泛的非參數(shù)技術(shù)。這種估計方法的基本思想是假定距離當(dāng)前位置較遠(yuǎn)的數(shù)據(jù)點能夠提供的信息很少,當(dāng)前位置的信息主要利用其附近的局部數(shù)據(jù)來推斷。在模型輔助抽樣估計中,Breidt和 Opsomer首次給出了局部多項式模型輔助估計方法的基本框架[16]。局部多項式模型校準(zhǔn)估計是在其基礎(chǔ)上針對權(quán)重系數(shù)進(jìn)行校準(zhǔn)所得。

假定m(x)在x=x0處存在p+1階導(dǎo)數(shù),則可以用該點的泰勒展開式來表示光滑函數(shù)m(x)的近似形式,所以對于式(8)而言,可近似表示為:

yi=m(x0)+m′(x0)(xi-x0)+…+

(9)

接下來,使用局部加權(quán)多項式的模型方法進(jìn)行估計,可得到多項式模型校準(zhǔn)估計。其中擬合過程的目標(biāo)函數(shù)為:

(10)

(11)

(12)

求解最小化問題可得局部多項式模型校準(zhǔn)估計量的具體表達(dá)式為:

(13)

Montanarii、馬志華等的模擬研究均表明,當(dāng)研究變量與輔助變量之間并不呈線性關(guān)系時,傳統(tǒng)的校準(zhǔn)估計量的估計效率與經(jīng)典HT估計量相比并沒有顯著改善,而基于局部多項式回歸的模型校準(zhǔn)估計量有著較高的估計效率,很好地解決了抽樣估計中,輔助變量與研究變量呈非線性關(guān)系時的估計問題[8,11]。但是基于局部多項式回歸的模型校準(zhǔn)估計也存在一些缺憾,比如很難將多個協(xié)變量組合在一起引入到核函數(shù)中,特別是分類變量和連續(xù)變量的組合比較困難。利用大量的樣條或其他形式的基函數(shù),結(jié)合變量選擇或正則化懲罰方法來控制模型的復(fù)雜性,能夠在很大程度上克服上述局部多項式模型校準(zhǔn)估計的缺點。

(二)懲罰樣條回歸模型校準(zhǔn)估計

在超總體模型輔助的框架下,Breidt等最早給出了總體總值的懲罰樣條回歸估計量,并證明了該估計量具有漸近正態(tài)性、漸近一致性等一系列良好的統(tǒng)計性質(zhì),并把研究變量和輔助變量的關(guān)系描述成一個線性混合模型,使得懲罰樣條模型很容易處理連續(xù)數(shù)據(jù)或分類數(shù)據(jù)、參數(shù)和非參數(shù)關(guān)系、空間和時間結(jié)構(gòu)的數(shù)據(jù)等,極大地拓展了懲罰樣條方法在抽樣估計中的應(yīng)用[18]。因此,我們接下來將懲罰樣條這種非參數(shù)方法引入到完全輔助信息條件下的模型校準(zhǔn)估計中,首先,需要按照懲罰樣條的基本形式來定義光滑函數(shù)m(·),其定義如式(14)所示:

m(x;β)=β0+β1x+…+βqxq+

(14)

(15)

其中,λ為光滑參數(shù),為了得出估計量,這里假定為一個固定的常數(shù),光滑參數(shù)值決定最終擬合的效果。根據(jù)最小二乘法的基本計算過程,可得系數(shù)向量βU的嶺回歸估計量如式(16)所示。

βU=(XTX+Aλ)-1XTY

(16)

(17)

其中,mi=mi(x),可以證明該估計量是設(shè)計無偏的,其設(shè)計方差為:

根據(jù)樣本信息,可以構(gòu)造廣義差分估計量式(17)中βU的估計形式:

(18)

(19)

=Xsβ+Zsb+εk

(20)

與基于局部多項式回歸方法的模型校準(zhǔn)估計不同,這里采用懲罰樣條回歸的估計方法,研究變量與輔助變量之間的關(guān)系可以表達(dá)成線性混合模型的形式,因此可以很方便地將連續(xù)型或者分類型的輔助變量都納入模型中,從而進(jìn)行有效的校準(zhǔn)估計。

(三)模型校準(zhǔn)估計量性質(zhì)

在大樣本情況下,局部多項式和懲罰樣條兩種非參數(shù)方法具有相似的漸近性質(zhì),這里我們不加以區(qū)分,進(jìn)行統(tǒng)一討論。對于局部多項模型校準(zhǔn)估計量的性質(zhì),Montanari和Ranalli針對單一輔助變量的情形進(jìn)行了一般性的探討[8],馬志華和陳光慧在其基礎(chǔ)上討論了多元輔助變量條件下的估計量性質(zhì),理論上來看是完全一致的[11]。由于實際中多元輔助變量情形操作比較復(fù)雜,這里同樣給出一元輔助變量情形下的局部多項式模型校準(zhǔn)估計量和懲罰樣條回歸模型校準(zhǔn)估計量的性質(zhì)。為了研究該估計量的性質(zhì),需要作以下基本假設(shè):

(2)對于每個v值,輔助變量xi基于式(8)中假定的超總體模型ξ來說是固定的。模型誤差項εi相互獨立,其均值為0,方差為v(xi)是連續(xù)函數(shù)且嚴(yán)格為正。

(3)均值函數(shù)m(·)是連續(xù)函數(shù),且p+1階連續(xù)可導(dǎo),p為局部多項式函數(shù)的最高次數(shù)。

(5)當(dāng)v→時,有n/N→π∈(0,1),帶寬hv→0和均成立。

(21)

(22)

當(dāng)ν→時,有也意味著

由式(22)可得,方差的設(shè)計一致估計量為:

(23)

五、模擬研究

線性函數(shù):m1(x)=1+2(x-0.5)

二次函數(shù):m2(x)=1+2(x-0.5)2

指數(shù)函數(shù):m3(x)=exp(-8x)

Bump函數(shù):m4(x)=1+2(x-0.5)+

exp(-200(x-0.5)2)

Jump函數(shù):m5(x)=1+2(x-0.5)I(x≤0.65)+0.65I(x>0.65)

Cdf函數(shù):m6(x)=Φ[(1.5-2x)/σ],Φ是標(biāo)準(zhǔn)正態(tài)分布的累計分布函數(shù)。

Cycle1函數(shù):m7(x)=2+sin(2πx)

Cycle4函數(shù):m8(x)=2+sin(8πx)

(24)

(25)

接下來,通過編寫Python程序,并運算分別得到這4種估計量的數(shù)值模擬分析結(jié)果。分析相對設(shè)計偏差模擬結(jié)果發(fā)現(xiàn):局部多項式模型校準(zhǔn)估計量和懲罰樣條模型校準(zhǔn)估計量在對應(yīng)的參數(shù)之下,除了在指數(shù)函數(shù)總體外,局部多項式模型校準(zhǔn)估計量相對于HT估計量的偏差較大之外,其他情況下,估計量的偏差并無明顯的優(yōu)劣區(qū)別,絕大部分都在0.1%以內(nèi)(2)限于篇幅,這里并未報告相對設(shè)計偏差的模擬結(jié)果,有興趣者可向作者索要。。下面我們將重點分析輔助變量不同分布情況下基于非參數(shù)方法得到的模型校準(zhǔn)估計量和傳統(tǒng)線性估計量的相對效率值,估計量相對效率的模擬結(jié)果如表1和表2所示。

表1 輔助變量為均勻分布下各估計量的相對效率值

表1顯示了在輔助變量為均勻分布情況下,各估計量在不同的總體回歸函數(shù)下的相對效率值。從總體線性程度的角度看,在線性函數(shù)的總體下,非參數(shù)模型和參數(shù)模型的效率差距不大,GREG估計量甚至略優(yōu)與LPR模型校準(zhǔn)估計量,SPL模型校準(zhǔn)估計量的估計效果的優(yōu)勢也比較微弱,其原因是對于線性函數(shù)而言,參數(shù)模型就能產(chǎn)生較好的估計效果,而不需要復(fù)雜的非參數(shù)模型。從縱向比較來看,非參數(shù)模型校準(zhǔn)估計量的估計效果都優(yōu)于參數(shù)模型,隨著總體函數(shù)的線性程度不斷降低,可以發(fā)現(xiàn)GREG的估計效果呈現(xiàn)下降的趨勢,在最后的幾個個函數(shù)中,RE值接近1,而非參數(shù)模型校準(zhǔn)估計量的估計效果大致上保持不變,并且SPL模型校準(zhǔn)估計量整體上要優(yōu)于LPR模型校準(zhǔn)估計量,此外各非參數(shù)模型校準(zhǔn)估計量對GREG估計量的優(yōu)勢隨著非線性程度的增強而不斷增大。從系數(shù)對比的角度來看,在LPR估計中,窗寬h由0.1增大到0.25情況下,大部分RE值有所降低,可以猜測隨著窗寬h的增大,LPR估計量的估計效果逐漸降低;SPL的光滑系數(shù)從0.25至0.75過程中,其估計效果差別不大,一個可能的解釋是選擇的光滑系數(shù)并沒有落在最優(yōu)的區(qū)間,因此光滑系數(shù)的變動對估計效果的影響很有限。

表2為輔助變量在服從有偏的beta分布情況下,各估計量在不同的總體回歸函數(shù)下的相對效率值。從表中的數(shù)據(jù)可以看出,雖然輔助變量的分布確實影響了各個估計量的估計效果,尤其在總體函數(shù)為Cdf函數(shù)時,beta分布下的LPR模型校準(zhǔn)估計量的相對效率有較大幅度的提高,其他情況下大體上與表1的分析情況相一致,這也說明了非參數(shù)模型校準(zhǔn)估計是比較穩(wěn)健的。

表2 輔助變量為beta分布下各估計量的相對效率值

六、實際應(yīng)用中的展望

隨著中國經(jīng)濟社會的持續(xù)快速發(fā)展,國家以及地方政府的管理與服務(wù)水平也在不斷完善。為了更好地提供高質(zhì)量的政府服務(wù)公共產(chǎn)品,需要依賴政府統(tǒng)計工作來獲取高質(zhì)量的基礎(chǔ)性統(tǒng)計信息。在中國政府統(tǒng)計工作的數(shù)據(jù)搜集過程中,抽樣調(diào)查是目前比較普遍的一種做法,比如自然資源環(huán)境監(jiān)測調(diào)查、農(nóng)產(chǎn)量調(diào)查、規(guī)模以下工業(yè)企業(yè)調(diào)查等,因此政府統(tǒng)計部門對抽樣調(diào)查方案設(shè)計及其抽樣估計工作均非常重視。在抽樣估計環(huán)節(jié),中國政府統(tǒng)計部門通常采用簡單估計和比率估計,對于能夠有效利用輔助信息的校準(zhǔn)估計方法應(yīng)用較少,更沒有考慮到研究變量與輔助變量的非線性關(guān)系而應(yīng)用非參數(shù)模型校準(zhǔn)估計的方法進(jìn)行總體信息的推斷。隨著衛(wèi)星遙感技術(shù)和大數(shù)據(jù)技術(shù)的應(yīng)用以及信息化水平的提高,在抽樣估計階段,可以通過模型輔助估計的方式充分利用有效的輔助信息來提高估計精度。當(dāng)研究變量與輔助變量之間呈非線性關(guān)系,且能夠掌握輔助變量的完全信息時,就可以使用本文構(gòu)建的非參數(shù)模型校準(zhǔn)估計方法。下面以中國水資源質(zhì)量調(diào)查為例來介紹這套抽樣估計方法的具體應(yīng)用。

水資源是人類社會得以可持續(xù)發(fā)展的重要資源之一,目前,中國的水資源環(huán)境狀況不容樂觀,很多地區(qū)出現(xiàn)了水資源質(zhì)量問題。黨的十八大以來特別強調(diào)了生態(tài)文明建設(shè),政府部門以及社會各界更加注重保護(hù)自然資源和生態(tài)環(huán)境,其中也包括水資源,因此,需要加強關(guān)于水資源環(huán)境狀況的調(diào)查工作。中國水資源類型多樣、分布廣泛,通常適合采用抽樣調(diào)查形式來開展實際調(diào)查工作。在水資源的環(huán)境調(diào)查中,水質(zhì)的狀況是最為重要的一項監(jiān)測目標(biāo),有關(guān)水質(zhì)標(biāo)準(zhǔn)的指標(biāo)眾多,其中反映酸堿性的PH值是一項比較重要且較為直觀的指標(biāo),按照《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》可知,PH值為6.5至8.5區(qū)間的水質(zhì)較好。PH值與水資源所在地的農(nóng)業(yè)用地情況、工業(yè)企業(yè)排放二氧化硫以及氮氧化物等污染物的情況、污水處理工廠的數(shù)量與規(guī)模等周邊的工、農(nóng)業(yè)發(fā)展的輔助信息高度相關(guān),且通常呈現(xiàn)非線性的關(guān)系。因此,在抽樣估計推斷中,我們首先可以利用衛(wèi)星遙感技術(shù)得到水源地附近農(nóng)業(yè)用地情況和具體的位置信息,并利用政府部門的行政記錄以及工業(yè)企業(yè)大數(shù)據(jù)信息獲取水源地附近工廠的數(shù)量、排污規(guī)模以及污水處理情況等輔助信息;然后利用水的PH值與農(nóng)業(yè)用地比例、工廠數(shù)量、排污規(guī)模和污水處理率之間的關(guān)系,可建立合適的超總體回歸模型;接下來考慮到研究變量與輔助變量之間呈非線性關(guān)系,利用本文所構(gòu)建的非參數(shù)模型校準(zhǔn)估計量對水的PH值進(jìn)行估計,得到具有漸近無偏、一致且漸近正態(tài)等優(yōu)良統(tǒng)計性質(zhì)的估計量;最后利用本文所給出的方差估計量可以得到估計量的方差估計,且這里的方差估計也具有設(shè)計一致性,根據(jù)方差估計量的數(shù)值可以評估和改進(jìn)抽樣估計的精度。

中國政府部門主導(dǎo)的抽樣項目絕大多數(shù)都不是簡單隨機抽樣,因此,本文在一階抽樣下得到的估計量仍需改進(jìn)以更貼合實際,目前中國的政府統(tǒng)計調(diào)查尚未充分利用完全輔助變量,利用非參數(shù)方法和模型校準(zhǔn)估計方法對輔助變量和研究變量建模在實際中的應(yīng)用還沒有,雖然我們在本文提出了具體應(yīng)用的展望,但是限于實際數(shù)據(jù)的可獲得性,未能進(jìn)行實際的估計推斷。總體而言,本文所構(gòu)建的非參數(shù)模型校準(zhǔn)估計量,在中國以后的抽樣估計實踐中將具有很強的應(yīng)用價值。

猜你喜歡
估計量總體輔助
小議靈活構(gòu)造輔助函數(shù)
倒開水輔助裝置
用樣本估計總體復(fù)習(xí)點撥
2020年秋糧收購總體進(jìn)度快于上年
外匯市場運行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
中國外匯(2019年6期)2019-07-13 05:44:06
直擊高考中的用樣本估計總體
淺談估計量的優(yōu)良性標(biāo)準(zhǔn)
減壓輔助法制備PPDO
提高車輛響應(yīng)的轉(zhuǎn)向輔助控制系統(tǒng)
汽車文摘(2015年11期)2015-12-02 03:02:53
基于配網(wǎng)先驗信息的諧波狀態(tài)估計量測點最優(yōu)配置
電測與儀表(2015年6期)2015-04-09 12:00:50
东乌珠穆沁旗| 镇康县| 珠海市| 鹿泉市| 富阳市| 塘沽区| 桐梓县| 延寿县| 昌都县| 扶余县| 吴堡县| 石柱| 黄石市| 平乐县| 军事| 土默特右旗| 雷州市| 谷城县| 黄石市| 西平县| 衡阳市| 英吉沙县| 商洛市| 贞丰县| 温泉县| 兴安县| 新蔡县| 新泰市| 铅山县| 南城县| 陇南市| 新龙县| 浮梁县| 泽州县| 黄冈市| 汉阴县| 定远县| 博兴县| 海丰县| 通城县| 岐山县|