楊貴軍,蔡 娟,趙曉云
高相關(guān)性輔助變量擇優(yōu)回歸插補法
楊貴軍,蔡 娟,趙曉云
(天津財經(jīng)大學(xué)中國經(jīng)濟統(tǒng)計研究中心,天津300222)
調(diào)查數(shù)據(jù)無回答在抽樣調(diào)查中經(jīng)常出現(xiàn)。無回答項目插補法是處理無回答的最主要方法之一,而輔助變量對提高插補值準(zhǔn)確度非常重要。因此,研究調(diào)查數(shù)據(jù)無回答項目的高相關(guān)性輔助變量擇優(yōu)回歸插補法,先篩選與目標(biāo)變量間相關(guān)系數(shù)高的輔助變量,再建立回歸插補模型。該方法的輔助變量選擇過程簡單,插補值準(zhǔn)確性高。模擬例子演示了該方法的優(yōu)良性。
無回答項目;變量擇優(yōu);回歸插補;相關(guān)系數(shù)
目前,抽樣調(diào)查的應(yīng)用領(lǐng)域越來越廣,調(diào)查數(shù)據(jù)的無回答問題也受到更多關(guān)注。調(diào)查數(shù)據(jù)無回答包括(調(diào)查)單元無回答和(調(diào)查)項目無回答。單元無回答是調(diào)查單元沒有回答任何調(diào)查項目,調(diào)查員沒有找到被調(diào)查者、或是被調(diào)查者由于特殊原因不接受調(diào)查等情況都會出現(xiàn)單元無回答;項目無回答是樣本單元只回答了部分而不是全部的調(diào)查項目,被調(diào)查者拒絕回答某些敏感性調(diào)查項目、或由于粗心遺漏掉某些調(diào)查項目等都會產(chǎn)生項目無回答。無回答會影響調(diào)查數(shù)據(jù)的質(zhì)量,導(dǎo)致參數(shù)估計量出現(xiàn)明顯偏差,有時估計量方差也會顯著增大,嚴(yán)重影響統(tǒng)計分析結(jié)果的可信度[1][2]1-2。
避免或減少調(diào)查數(shù)據(jù)無回答的辦法主要有事前預(yù)防、事中控制和事后補救。Kish詳細(xì)討論了降低無回答率的事前預(yù)防辦法[3]615-624,由于實際問題的復(fù)雜性,事前預(yù)防和事中控制無論做得多么嚴(yán)謹(jǐn)細(xì)致,只能有效減低無回答率,而不能徹底解決無回答問題;Hansen和Hurwitz認(rèn)為事后追加樣本的二重或二階抽樣方法能有效解決無回答問題[4],但追加樣本會導(dǎo)致支付額外的調(diào)查費用和延長抽樣調(diào)查時間,在很多情況下這種方法并不是最優(yōu)的選擇。事后補救的主要方法是插補法,即指構(gòu)造無回答單元和無回答項目的插補值。Politz和Simmons給出了無回答的隨機描述[5];馮士雍總結(jié)的無回答單元估計方法有[1]:Horvitz和Thompson提出的逆概率加權(quán)法[6]、Deming和Stephan提出的梳理法[7]、Lundstrom提出的校準(zhǔn)法[8]以及類加權(quán)法。
無回答項目的插補法包括單值插補法和多重插補法。多重插補法給出了無回答項目的多個替代值[9]1-23,常用的多重插補法有回歸預(yù)測法[10]、傾向得分法、馬爾科夫蒙特卡羅法等[11]67-94,無回答項目的單值插補只給出無回答項目的單一替代值,常用的單值插補法有冷卡插補、熱卡插補、均值插補、回歸插補、比率插補、推理插補、相關(guān)性估計插補、最近鄰插補、EM算法、貝葉斯自助法及近似貝葉斯自助法等。冷卡插補是根據(jù)以前的調(diào)查結(jié)果或其他資料與數(shù)據(jù)等給出無回答項目的插補值;熱卡插補選用回答項目的數(shù)值對無回答項目進行估計;均值插補是將回答項目的樣本均值作為無回答項目的插補值;回歸插補是依據(jù)含無回答的調(diào)查項目與其他調(diào)查項目間的線性關(guān)系構(gòu)造無回答項目的插補值,這種線性關(guān)系是事前已知的;比率插補是回歸插補的特例,是利用無截距項的回歸模型進行插補;推理插補是依據(jù)已觀測的樣本數(shù)據(jù)和調(diào)查項目間的理論關(guān)系以及調(diào)查經(jīng)驗等估計無回答項目;相關(guān)性估計插補是選用與含無回答調(diào)查項目間相關(guān)性最大的5個調(diào)查項目來對無回答項目進行估計[12];最近鄰插補是依據(jù)最近距離調(diào)查單元的調(diào)查項目之間相似度更大的假設(shè)對無回答項目插補;EM算法是基于回答單元和回答項目計算無回答項目的最可能值[13];貝葉斯自助法及近似貝葉斯自助法是基于貝葉斯觀點的無回答項目插補[9]1-23。同時,方匡南、謝邦昌則利用聚類關(guān)聯(lián)規(guī)則對無回答項目插補[14]。
在上述單值插補法中,有些插補法只利用單一調(diào)查項目的調(diào)查數(shù)據(jù)估計無回答項目,如均值插補法和熱卡插補法。另一些插補法利用了多個調(diào)查項目的調(diào)查數(shù)據(jù),如推理插補、最近鄰插補、比率插補、回歸插補和相關(guān)性估計插補等,插補過程相對復(fù)雜,但往往插補值準(zhǔn)確度更高。事實上,合理利用其它調(diào)查項目的觀測數(shù)據(jù),能夠更準(zhǔn)確地描述含無回答調(diào)查項目的統(tǒng)計規(guī)律,更好地估計無回答項目。然而,并不是每個調(diào)查項目都能提供關(guān)于含無回答調(diào)查項目的有價值信息,有的調(diào)查項目與含無回答調(diào)查項目之間不存在任何邏輯關(guān)系和統(tǒng)計相似性,對無回答項目估計并不重要。因此,篩選出有利于無回答項目估計的調(diào)查項目,用之插補無回答項目,會提高插補值的準(zhǔn)確度。
筆者針對調(diào)查數(shù)據(jù),討論高相關(guān)性輔助變量擇優(yōu)回歸插補法。第一步,篩選出與含無回答的調(diào)查項目間相關(guān)系數(shù)高的調(diào)查項目,進行調(diào)查項目擇優(yōu);第二步,利用篩選出的調(diào)查項目建立無回答項目的回歸模型,給出相應(yīng)無回答項目插補值,模擬例子演示了該插補法的準(zhǔn)確率。
為了下文討論方便,在不引起混淆的情況下,將含無回答的調(diào)查項目稱為目標(biāo)變量,其它調(diào)查項目稱為輔助變量。因無回答項目插補值的準(zhǔn)確度受輔助變量影響大,故對輔助變量進行優(yōu)選后再建立插補模型,則能夠提高插補值的準(zhǔn)確度。具有輔助變量擇優(yōu)的二步插補過程包括兩步:
(一)輔助變量擇優(yōu)
因為篩選出的輔助變量能更好地描述目標(biāo)變量的統(tǒng)計規(guī)律,可以提高插補值準(zhǔn)確度。
假設(shè)觀察樣本A=(xij)含有m個變量n次觀測,其中i=1,…,n;j=1,…,m,m個變量記為X1,…,Xm。為了消除量綱的影響,對原始數(shù)據(jù)進行中心標(biāo)準(zhǔn)化變換,即zij=(xij-x珚j)/sj,i=1,…,n;j=1,…,m,其中x珚j和sj分別表示第j個變量的樣本均值和樣本標(biāo)準(zhǔn)差。將數(shù)據(jù)集A的調(diào)查單元分為A1和A2兩部分,A1的所有單元Z1,…,Zm都沒有無回答項目,A2的所有單元都含有無回答的項目,記。對于A2中的無回答項目,選擇Zk作為目標(biāo)變量。剔除數(shù)據(jù)A2中第i單元含無回答的所有變量,剩余變量記為Z,再進行變量擇優(yōu)。
逐步回歸過程的變量選擇、決策樹、粗糙集等方法,依據(jù)與目標(biāo)變量的相關(guān)性對輔助變量進行排序。通常與目標(biāo)變量相關(guān)性小的變量不會顯著提高無回答項目的預(yù)測準(zhǔn)確性,有時還可能會增加估計量的隨機波動性而降低無回答項目的預(yù)測準(zhǔn)確性。剔除這些變量,可使目標(biāo)變量與其它輔助變量的關(guān)系更易識別。
將目標(biāo)變量和輔助變量間相關(guān)系數(shù)作為輔助變量擇優(yōu)的標(biāo)準(zhǔn)。首先,按z(2)i,j-珔z(1)j取值將輔助變量分為兩類,取值正的為第一類,取值負(fù)的為第二類;其次,計算相關(guān)系數(shù)矩陣,記Zj*為Z中與目標(biāo)變量Zk相關(guān)系數(shù)最大的輔助變量,若,從第一類優(yōu)選輔助變量;若,則從第二類中選輔助變量。
(二)利用選出的輔助變量建立目標(biāo)變量的插補模型
插補模型包括線性模型、貝葉斯自助法、最近鄰插補法等。使用回歸模型,將選出的輔助變量Z(1),…,Z(e)作為解釋變量,Zk為響應(yīng)變量,模型為Zk=β0+β1Z(1)+…+βeZ(e)+ε?;跀?shù)據(jù)集A1的擬合模型為^Zk=^β0+^β1Z(1)+…+^βeZ(e),則無回答項目依據(jù)相關(guān)系數(shù)先對輔助變量擇優(yōu),再建立回歸插補模型估計無回答項目的方法,在本文中稱為高相關(guān)性輔助變量擇優(yōu)回歸插補法。高相關(guān)性輔助變量作為回歸模型的解釋變量可能具有共線性,但共線性問題并不影響回歸模型的預(yù)測精度[15]53-54,也不會影響插補值的準(zhǔn)確度。
具有輔助變量擇優(yōu)的二步插補過程是利用輔助變量與目標(biāo)變量間統(tǒng)計規(guī)律預(yù)測無回答項目,插補值的準(zhǔn)確性依賴于輔助變量的合理選取。先驗信息和理論能夠更好地對輔助變量擇優(yōu),即使在先驗知識有限或者缺失的情況下,該過程也能對輔助變量進行擇優(yōu),并給出有參考價值的無回答項目插補值。
常用的回歸/比率插補法主要依據(jù)先驗知識和理論,確定輔助變量及其與目標(biāo)變量之間的函數(shù)關(guān)系。當(dāng)先驗知識正確時,回歸/比率插補能夠提供較好的插補值。由于很多抽樣調(diào)查的先驗知識具有不確定性,并且無回答項目事前未知,每個調(diào)查單元包含兩個或更多無回答項目的情況在實際調(diào)查中經(jīng)常發(fā)生,這些都會限制回歸/比率插補法的應(yīng)用。
選用兩組調(diào)查數(shù)據(jù)演示高相關(guān)性輔助變量擇優(yōu)回歸插補法的應(yīng)用,一個例子的調(diào)查數(shù)據(jù)是離散型,另一個是連續(xù)型。
(一)離散型調(diào)查數(shù)據(jù)的高相關(guān)性輔助變量擇優(yōu)回歸插補法
本例的數(shù)據(jù)是2009年某省直屬單位高層管理人員的測評調(diào)查數(shù)據(jù)[12]。調(diào)查問卷包括28個調(diào)查項目,回答值為1~4;調(diào)查單元共計51個:前30個調(diào)查單元不含無回答項目,記為A1;后21個調(diào)查單元都含無回答項目,記為A2。中心標(biāo)準(zhǔn)化變換后的數(shù)據(jù)分別記為A1=()和A2=),以A2的無回答項目為例,高相關(guān)性輔助變量擇優(yōu)回歸插補法如下:
第一步,篩選與目標(biāo)變量相關(guān)系數(shù)最大的5個輔助變量。對于目標(biāo)變量Z8,由于A2第一個調(diào)查單元的都是無回答項目,剔除變量Z11和 Z18;基于數(shù)據(jù)集A1,計算剩余25個輔助變量中與Z8相關(guān)系數(shù)最大的變量,結(jié)果為Z9;按z(2)i,j-珔z(1)j的差值將剩余輔助變量分為兩類,差值正的為第一類,差值負(fù)的為第二類;由于z(2)1,9大于均值珔z(1)9,從第一類輔助變量中選出與Z8相關(guān)系數(shù)最大的5個,分別為Z9、Z14、Z10、Z12和Z1作為優(yōu)選的輔助變量。
第二步,建立無回答項的插補模型?;跀?shù)據(jù)集A1,利用選出的5個輔助變量,構(gòu)建目標(biāo)變量的回歸模型,擬合模型為:
模型的決定系數(shù)為R2=0.84,修正決定系數(shù)珚R2=0.81,檢驗統(tǒng)計量F=25.54。無回答項目x(2)1,8的插補值為:
插補值與真實值是相同的。
本例給出了全模型插補法、選模型插補法、相關(guān)性估計插補法、均值插補法的插補結(jié)果,全模型插補法是利用目標(biāo)變量外的所有輔助變量建立回歸模型,并對無回答項目插補;選模型插補法是根據(jù)條件數(shù)剔除產(chǎn)生共線性的變量,利用其余變量構(gòu)建回歸模型進行插補,而選模型插補法與相關(guān)性估計插補法都對輔助變量進行了擇優(yōu);均值插補只利用目標(biāo)變量自身的統(tǒng)計規(guī)律對無回答項目插補,將數(shù)據(jù)集A2中每個變量的調(diào)查項目均視為無回答項,分別用上述方法進行插補,結(jié)果見表1。表1中高相關(guān)性輔助變量擇優(yōu)回歸插補法簡稱為相關(guān)回歸插補,相關(guān)插補是指相關(guān)性估計插補法。表1第2列給出了每種方法對插補值的總正確率,第3~30列依次給出各插補方法對變量1~28插補值的正確率,28個變量分別用粗體數(shù)字表示。
表1 各方法對數(shù)據(jù)集A2插補值的正確率 (%)
表1顯示:與均值插補法相比,高相關(guān)性輔助變量擇優(yōu)回歸插補法、相關(guān)性估計插補法和選模型插補法對28個變量插補值的正確率都高;全模型插補法對22個變量插補值的正確率高;以上4種插補法的總正確率更高,這4種插補法都利用了輔助變量,均值插補法則沒有利用輔助變量。合理利用輔助變量的插補方法能夠提高無回答項插補值的準(zhǔn)確性。
與全模型插補法相比,高相關(guān)性輔助變量擇優(yōu)回歸插補法對28個變量插補值的正確率高;相關(guān)性估計插補法對27個變量插補值的正確率高;選模型插補法對23個變量插補值的正確率高、對2個變量插補值的正確率低,以上三種插補法的總正確率更高,因為選用的不是全部變量而是選出重要的輔助變量,所以提高了無回答項插補值的準(zhǔn)確性。
本例中變量間的線性相關(guān)程度高,其中最大相關(guān)系數(shù)為0.95,相關(guān)性估計插補法的插補值的總正確率較高。與相關(guān)性估計插補法相比,高相關(guān)性輔助變量擇優(yōu)回歸插補法總正確率略低,差值為0.5%。對于每一個變量的插補正確率,高相關(guān)性輔助變量擇優(yōu)回歸插補法對10個變量插補值的正確率高,對11個變量插補值的正確率低、對6個變量插補值的正確率與相關(guān)性估計插補相等。高相關(guān)性輔助變量擇優(yōu)回歸插補法與相關(guān)性估計插補法之間的插補結(jié)果略有不同,但沒有明顯優(yōu)劣,都對本例的離散型無回答項目提供了有價值的插補結(jié)果。
(二)連續(xù)型調(diào)查數(shù)據(jù)的高相關(guān)性輔助變量擇優(yōu)回歸插補法
這里選用的是管理人員績效考核的連續(xù)型調(diào)查數(shù)據(jù)[15]53-54,包含了7個變量。前20個調(diào)查單元為A1,后10個調(diào)查單元為A2。將A2的每個數(shù)據(jù)項均視為無回答項目,分別用高相關(guān)性輔助變量擇優(yōu)回歸插補法、相關(guān)性估計插補法、逐步回歸插補法、全模型插補法和均值插補法進行插補。相關(guān)性估計插補法是利用與目標(biāo)變量相關(guān)性最大的3個輔助變量對無回答項目插補;逐步回歸插補法是基于AIC信息準(zhǔn)則利用逐步回歸的變量篩選過程擇優(yōu)輔助變量,再用篩選出的輔助變量建立回歸模型插補;全模型插補是利用所有輔助變量建立回歸模型插補;均值插補法是利用數(shù)據(jù)集A1中目標(biāo)變量的均值作為無回答項目的插補值;高相關(guān)性輔助變量擇優(yōu)回歸插補法選用3個輔助變量。本例中用插補值的均方誤差描述連續(xù)型調(diào)查數(shù)據(jù)無回答項目插補值的準(zhǔn)確度。均方誤差越小,插補值準(zhǔn)確度越高。各插補法對每個變量插補值的均方誤差在表2中給出。
表2 連續(xù)數(shù)據(jù)的不同插補方法比較表
表2顯示:逐步回歸插補對變量X1~X5插補值的均方誤差較小,都小于76,其中對X4插補值比其它插補法的均方誤差都小,為53.04;對變量X6和X7插補值的均方誤差相對較大,大于100,總均方誤差為70.53,小于其它插補法。高相關(guān)性輔助變量擇優(yōu)回歸插補法對變量X1~X4插補值的均方誤差較小,對變量X1、X2、X3插補值的均方誤差分別為43.76、41.68、63.45,小于其它插補法;對變量X5、X6插補值的均方誤差較大,總均方誤差為77.82。相關(guān)性估計插補法對變量X1、X2、X7插補值的均方誤差??;對變量X7插補值的均方誤差為71.02,小于其它插補法,總均方誤差92.43,大于上述兩種插補法和全模型插補。
全模型插補法對X1、X2、X4、X5、X7插補值的均方誤差小,小于78,其中X5插補值的均方誤差為62.75,小于其它插補法;對X3、X6插補值的均方誤差較大,大于100,總均方誤差為78.88;均值插補法只對X6插補值的均方誤差小于其它插補法,對其余變量插補值的均方誤差和總均方誤差都大。
對插補值的殘差分析顯示:高相關(guān)性輔助變量擇優(yōu)回歸插補法、逐步回歸插補法和全模型插補法分別有8、10、16個插補值絕對殘差較大,超過10。插補值絕對殘差大的原因很多,其中原因之一可能是插補模型不適于對這些無回答項目插補。相比較而言,高相關(guān)性輔助變量擇優(yōu)回歸插補更適用,插補值絕對殘差大的個數(shù)更少。去掉三種方法中絕對殘差大于10的插補值,計算其余無回答項目插補值的均方誤差,結(jié)果見表3。
表3顯示:插補值的均方誤差明顯減少;高相關(guān)性輔助變量擇優(yōu)回歸插補法對X3、X4、X6、X7插補值的準(zhǔn)確度最高;逐步回歸模型插補法對X2、X5插補值的準(zhǔn)確度最高;全模型插補法對X1插補值的準(zhǔn)確度最高,并且總均方誤差最小。
表3 三種回歸模型插補方法比較表(剔除異常點)
本例調(diào)查數(shù)據(jù)的插補結(jié)果表明:輔助變量的擇優(yōu)和合理利用能夠提高插補值的準(zhǔn)確度。均值插補法沒有利用輔助變量,只是根據(jù)目標(biāo)變量自身變化規(guī)律估計無回答項目,故插補值準(zhǔn)確性差;全變量模型利用全部輔助變量,容易受個別輔助變量波動性異常的影響,計算復(fù)雜度較高;高相關(guān)性輔助變量擇優(yōu)回歸插補法通常會優(yōu)于不使用輔助變量或不加選擇地使用全部輔助變量的插補方法;相關(guān)性估計插補只是利用輔助變量的離差對目標(biāo)變量均值插補值進行修正,變量間的線性相關(guān)程度高,插補值的準(zhǔn)確度也高;高相關(guān)性輔助變量擇優(yōu)回歸插補法是建立在輔助變量回歸插補模型的基礎(chǔ)上,插補值的波動性更小,準(zhǔn)確性更高。
本文提出了高相關(guān)性輔助變量擇優(yōu)回歸插補法,利用輔助變量與目標(biāo)變量的相關(guān)性大小篩選輔助變量,再利用擇優(yōu)的輔助變量構(gòu)造目標(biāo)變量的回歸插補模型,作為無回答項目插補模型。輔助變量擇優(yōu)過程簡單,插補值準(zhǔn)確性高。高相關(guān)性輔助變量擇優(yōu)回歸插補法是具有輔助變量擇優(yōu)的二步插補過程的具體實現(xiàn)。對于具有輔助變量擇優(yōu)的二步插補過程,輔助變量的擇優(yōu)方法很多,利用輔助變量建立的插補模型也有多種選擇,如何確定變量擇優(yōu)方法和插補模型的最優(yōu)組合以提高插補值的準(zhǔn)確度,還需要進一步研究。
[1] 馮士雍.抽樣調(diào)查應(yīng)用與理論中的若干前沿問題[J].統(tǒng)計與信息論壇,2007,22(1).
[2] 金勇進,邵軍.缺失數(shù)據(jù)的統(tǒng)計處理[M].北京:中國統(tǒng)計出版社,2009.
[3] Kish L.抽樣調(diào)查[M].倪家勛,孫山澤,譯.北京:中國統(tǒng)計出版社,1997.
[4] Hansen M H,Hurwitz W N.The Problem of Nonresponse in Sample Surveys[J].Journal of the American Statistical Association,1946(41).
[5] Politz A N,Simmons W R.An Attempt to Get Not-at-h(huán)ome into the Sample Without Call-back[J].Journal of the American Statistical Association,1949(44).
[6] Horvitz D G,Thompson D J.A Generalization of Sampling Without Replacement from a Finite Population[J].Journal of the American Statistical Association,1952(47).
[7] Deming W E,Stephan F F.On a Least Squares Adjustment of a Samples Frequency Table when the Expected Marginal Tables are Known[J].Annals of Mathematical Statistics,1940(11).
[8] Lundstrom M S.Calibration as a Standard Method for Treatment of Nonresponse[D].Stockholm University,Department of Statistics,1997.
[9] Rubin D B.Multiple Imputation for Nonresponse in Survey[M].New York:John Wiley &Sons,1987.
[10]Yang C Y,Rockville.Multiple Imputation for Missing Data:Concepts and New Development[R].Introduction Material of SAS,2001.
[11]Schafer J L.Analysis of Incomplete Multivariate Data[M].London:Chapman and Hall,1997.
[12]周影,劉龍,馬維軍,等.調(diào)查問卷中含缺失數(shù)據(jù)的等級變量的補缺方法[J].?dāng)?shù)學(xué)的實踐與認(rèn)識,2011,41(1).
[13]Dempster A P,Laird N M,Rubin D B.Maximum Likelihood from Incomplete Data via the EM Algorithm[J].Journal of the Royal Statistical Society.Series B(Methodological),1977(39).
[14]方匡南,謝邦昌.基于聚類關(guān)聯(lián)規(guī)則的缺失數(shù)據(jù)處理研究[J].統(tǒng)計研究,2011,28(2).
[15]Chatterjee S,Hadi A S.Regression Analysis by Example[M].北京:中國統(tǒng)計出版社,2003.
Regression Interpolation in Selecting Auxiliary Variables of High-Correlation with the Target Variable
YANG Gui-jun,CAI Juan,ZHAO Xiao-yun
(China Center of Economics and Statistics Research,Tianjin University of Finance and Economics,Tianjin 300222,China)
Non-response of data extensively exists in the survey.Interpolation to the non-responses is one of the good solutions,and auxiliary variables are important to improve the accuracy of the interpolated values.This paper discusses the regression interpolation by selecting auxiliary variables of high-correlation with the target variable.Firstly,select the auxiliary variables of the high correlation with the target variable,and then construct regression interpolation model of the target variable by using those auxiliary variables.The new interpolation process is simpler and interpolated values have higher accuracy.The properties of the new method are showed in the two examples.
non-response item;selecting optimal variable;regression Interpolation;correlation coefficient
book=8,ebook=65
O212.4
A
1007-3116(2012)06-0008-06
(責(zé)任編輯:郭詩夢)
2011-12-10;修復(fù)日期:2012-04-26
國家社會科學(xué)基金重大項目《全球視野下的統(tǒng)計數(shù)據(jù)質(zhì)量評估方法研究》(09&ZD040);教育部新世紀(jì)優(yōu)秀人才支持計劃《我國保險公司風(fēng)險的監(jiān)管量化技術(shù)及監(jiān)管機制研究》(NCET-08-0909);教育部留學(xué)回國人員科研啟動基金項目《兩階段設(shè)計的若干問題研究》;2010年度全國統(tǒng)計科學(xué)研究計劃項目《無回答的解決辦法及在經(jīng)濟調(diào)查中的應(yīng)用》(2010LC60)
楊貴軍,男,黑龍江哈爾濱人,理學(xué)博士,教授,博士生導(dǎo)師,研究方向:統(tǒng)計學(xué);蔡 娟,女,江蘇鎮(zhèn)江人,碩士生,研究方向:統(tǒng)計學(xué);趙曉云,女,山東濱州人,碩士生,研究方向:統(tǒng)計學(xué)。