徐媛媛 臺婷婷
內容提要:以2011年我國31個省市自治區(qū)和2012年部分省份的旅游外匯收入統(tǒng)計數據為基礎,運用多種估計方法,估計了2012年我國旅游外匯總收入、抽樣方差及在95%的概率保證程度下旅游外匯收入總量的置信區(qū)間。經過對幾種方法的比較發(fā)現.PPS抽樣估計值與當年的外匯總值相當,說明在總體單元差異大的情況下,技術上采用PPs抽樣方法,可以以較低的成本完成更精確的估計
關鍵詞:抽樣技術;PPS抽樣;旅游外匯收入
中圖分類號:F590文獻標識碼:A 文章編號:1003-4161(2015)01-0094-04
DOI:10.13483/j,cnki.kfyj.2015.01.022
旅游外匯收入也稱國際旅游收入,是指本國為人境的國際旅游者提供的商品及各種服務所得到的外匯收入。入境旅游是我國旅游“三大市場”中開發(fā)最早、發(fā)展最快的市場。據中國統(tǒng)計局公布的資料,1994年來華進行人境旅游的外國人數僅4368.45萬人次,而旅游外匯收入也僅僅73.23億美元。而2012年,入境人數已達13240.53萬人次,旅游外匯收入500.28億美元,比1994年分別增長了203.1%和583.2%。我國的旅游業(yè)正以它強勁的創(chuàng)匯能力和快速發(fā)展的勢頭成為我國經濟發(fā)展的支柱性產業(yè)之一。在這種情況下,有必要對旅游外匯收入進行更加精確的估計。我們知道當抽樣單位的大小與目標變量之間相關時,采用PPS抽樣方法,可以提高抽樣效率糾。本文通過分析2011年我國31個省市自治區(qū)和2012年部分省市自治區(qū)的旅游外匯收入統(tǒng)計數據,對旅游外匯收入估計的PPS抽樣等三種方法進行比較,尋求最佳的估計方法,以便為相關旅游政策的制定提供依據。
一、抽樣方法簡介
(一)簡單隨機抽樣及其估計量
1.簡單隨機抽樣概念
假設總體有N個單元,從中進行逐個不放回的抽樣,抽取n個單元。這n個單元組成一個簡單隨機樣本,這種抽樣的方法稱為簡單隨機抽樣。
2.簡單隨機抽樣下總體均值和總體總值
(1)定義。在簡單隨機抽樣中,若總體有N個單元,抽取容量為n(n (二)分層抽樣及其估計量 1.分層抽樣概念 分層抽樣(stratified sampling)又叫類型抽樣或分類抽樣。分層抽樣是指將總體的N個單元劃分為互不交叉重疊的L層,然后各層進行獨立抽樣。若設各層所包含的單元數分別為Ni,顯然若各層均進行簡單隨機抽樣,那么這種分層抽樣稱作分層隨機抽樣。設總樣本量為n,各層的樣本量分別為n1,n2,…,nL,顯然 2.分層隨機抽樣下總體均值和總體總量(1)定義 在分層抽樣下,分別根據各層樣本計算出各層均值Y,、的估計值Y,通過各層的權重Wn進行加權平均,然后得到總體的均值Y的估計量。分層隨機抽樣下,記Y為l,層的樣本均值Yh,若將總體均值Y的簡單估計記為Yst則有分層隨機抽樣樣本均值Yst和總體總值Yst的方差分別為 (三)PPS抽樣及其估計量 1.PPs抽樣概念 放回不等概抽樣中,假設總體中第i個單元的大小或規(guī)模的度量為M??傮w的總規(guī)模為每次抽樣中第i個單元被抽中的概率用zi表示,如果這種不等概抽樣就稱作PPs抽樣(probabilily proportional Lo size),即放回的與規(guī)模大小成比例的概率抽樣。 2.實施方法 本文采用規(guī)模累積等距抽選法實施PPS抽樣。設總體有N個單元,各單元規(guī)模度量分別為M1,M2,…,MN(整數),其中第i個單元相應地分配Mi個代碼(i=l,…,N),總共有個代碼。若欲抽取容量為n的樣本,則須先確定等距抽樣的間隔。然后在l~K之間隨機抽取一數r,其所在代碼區(qū)間對應的單元就作為第一個被抽中的單元,如此,r,r+K,…,r+(n-1)k等數字所在的代碼區(qū)間的相對應的單元即為被抽中的單元。這種抽樣方法的特點是每個單元被抽中的概率與該單元M.的規(guī)模大小成比例。 3.PPs抽樣下總體總量和方差 (1)定義 漢森和赫維茨于1943年針對PPS抽樣方法給出了估計總體總量的無偏估計量,稱為漢森一赫維茨(Hensen-Hurvitz)估計量: 其中,Yi為樣本的第i個單元的變量值,而為人樣的第i個單元根據其規(guī)模大小入樣的概率。另外YHH是無偏的。 (2)方差 二、數據分析 (一)數據收集與處理 本文使用數據來自于《2013中國統(tǒng)計年鑒》,選取2011年和2012年各地區(qū)按旅游外匯收入(萬美元汁)總額的數據進行分析。對數據進行初步分析,我們發(fā)現2011年我國旅游外匯收入最大值與最小值之差為1389999萬美元,相差2242.934多倍,單位之間的差異非常大。下面我們分別用簡單隨機抽樣、分層抽樣、PPS抽樣來估計2012年我國旅游外匯收入的總額。 (二)總體總量的簡單隨機抽樣估計 給我國31個省市自治區(qū)分別編號為01~31,利用隨機數表抽取13個地區(qū)作為樣本,抽中的13個地區(qū)如下表l所示。下面以這13個地區(qū)的旅游外匯收入來估計2012年我國31個省、市、自治區(qū)的旅游外匯收入。 利用公式(2)得總體總量估計: 利用公式(4)得總體方差估計: 置信度為95 010的置信區(qū)間為: 2012年,全國的實際旅游外匯收入總額為5002800萬美元,位于置信區(qū)間內。 (三)總體總量的分層估計
根據不同地區(qū)2011年旅游外匯收入總額,將31個地區(qū)分為四層,如表2所示。
各子層采用簡單隨機抽樣方法按比例抽取樣本,分別抽取4個(寧夏、青海、貴州、吉林)、3個(河北、內蒙古、湖北)、3個(陜西、天津、山東)、2個(福建、江蘇)樣本,四層總計12個樣本。各層統(tǒng)計結果見表3。
利用公式(6)對我國2012年旅游外匯收入總額進行估計:
Yst=10x17337+7×86211.333+8x224917.667+6×526269.5=5733807.667。
由公式(8),可以得到總體方差估計:
置信度為95%的置信區(qū)間為
2012年,全國的實際旅游外匯收入總額為5002800萬美元,位于置信區(qū)間內。
(四)總體總量的PPS抽樣估計
以各地區(qū)為單元,以其2011年旅游外匯收入額作為各單元規(guī)模,并進行累計,得到表4。采用規(guī)模累積等距抽選方法抽取10個樣本地區(qū)。將Mo:EMi=5968204除以樣本量n=10,得到抽樣間隔K在1~K之間抽取一個隨機數r=259895,顯然處于北京的代碼范圍,因而北京入樣。然后選取r+K,r+2K,…,r+(n-1)k的地區(qū):依次是內蒙古、上海、江蘇、浙江、福建、湖南、廣東(計入2次)云南,總共10個樣本9個省市入選。
這10個樣本地區(qū)入樣的概率用計算,結果見表5。
用這10個樣本省的旅游外匯收入來估計2012年全國旅游外匯收入總額,由公式(9)漢森一赫維茨估計量得:
故推斷,全國31個省市2012年全國旅游外匯收入總額為4975896.243萬美元。
由公式(11)得總體總值方差估計為置信度為95%的置信區(qū)間為
2012年,全國的實際旅游外匯收入總額為5005800萬美元,位于置信區(qū)間內。
(五)三種估計方法的比較
1.總體總值估計的比較
一般抽樣調查中取得的樣本數越多,成本就越高,但得到的結果會越精確。簡單隨機抽樣、分層抽樣和PPS抽樣分別抽取了13、12和10個樣本,樣本數逐漸遞減。其中,盡管PPS抽樣抽取了最少量(10個)的樣本,但其對總體總值的估計值4975896.243萬美元最為接近2012年旅游外匯收入的實際值5002800萬美元。
2.抽樣效果的比較
簡單隨機抽樣、分層抽樣和PPs抽樣三者的總體方差以PPS抽樣方法下的方差最小,為2.855×10l,在95%的置信度下的置信區(qū)間為(3928550.007,6023242.478),為三者中范圍最小。這表明PPS抽樣方法相比其他兩種方法更加精確。
綜上所述,PPS抽樣方法能以較低的調查成本得到較好的抽樣效果。
三、結論
通過對2011年我國31個省市自治區(qū)旅游外匯收入進行PPS抽樣,利用2012年部分省區(qū)數據估計出2012年全國旅游外匯收入總額為4975896.243萬美元,95%的置信程度下的置信區(qū)間為(3928550.007,6023242.478)。2012年實際值為5002800萬美元,處于置信區(qū)間內。通過對簡單隨機抽樣、分層抽樣與PPS抽樣三種方法進行比較,發(fā)現不論是對總體總量的估計還是其抽樣誤差大小來說,PPS抽樣對我國旅游外匯收入估計的精確度更高,而且由于抽取了較少的樣本,抽樣成本會更低,總體效果要由于前兩者。所以,當需要對各單元之間差異比較大的總體i井行估計時,宜采用PPS抽樣。