丁華,任莉穎,嚴(yán)潔
(北京大學(xué)a.中國(guó)社會(huì)科學(xué)調(diào)查中心;b.政府管理學(xué)院,北京100871)
基于并行數(shù)據(jù)的調(diào)查質(zhì)量管理
丁華a,任莉穎a,嚴(yán)潔b
(北京大學(xué)a.中國(guó)社會(huì)科學(xué)調(diào)查中心;b.政府管理學(xué)院,北京100871)
計(jì)算機(jī)輔助調(diào)查方法(Computer一assisted Personal Interview,CAI)的應(yīng)用產(chǎn)生了一類(lèi)傳統(tǒng)紙筆調(diào)查方法無(wú)法采集到的并行數(shù)據(jù),該類(lèi)數(shù)據(jù)對(duì)于調(diào)查實(shí)施的監(jiān)控、調(diào)查質(zhì)量的提高和調(diào)查方法的改進(jìn)起到了非常重要的作用。文章著重分析并行數(shù)據(jù)的類(lèi)型、采集方法及其在調(diào)查質(zhì)量管理中的作用。
并行數(shù)據(jù);計(jì)算機(jī)輔助調(diào)查;調(diào)查質(zhì)量管理
并行數(shù)據(jù)在國(guó)外調(diào)查領(lǐng)域的研究和應(yīng)用已經(jīng)有數(shù)十年的歷史,并越來(lái)越受到研究者和調(diào)查管理者的重視。隨著學(xué)者對(duì)并行數(shù)據(jù)的開(kāi)發(fā)和挖掘,許多有價(jià)值的研究結(jié)果已被應(yīng)用到社會(huì)調(diào)查質(zhì)量管理中,如使用訪員觀察記錄評(píng)估由于拒訪造成的數(shù)據(jù)誤差[1],使用網(wǎng)絡(luò)調(diào)查客戶(hù)端設(shè)計(jì)收集的并行數(shù)據(jù)研究頁(yè)面設(shè)計(jì)對(duì)受訪者回答問(wèn)題方式的影響[2];在調(diào)查過(guò)程中利用并行數(shù)據(jù)對(duì)拒訪行為進(jìn)行研究并動(dòng)態(tài)調(diào)整調(diào)查策略,提高調(diào)查覆蓋人群的人口學(xué)代表性[3];利用并行數(shù)據(jù)研究并預(yù)測(cè)訪問(wèn)聯(lián)系的最佳時(shí)間以提高應(yīng)答率[4,5]。研究表明,并行數(shù)據(jù)的采集和應(yīng)用對(duì)于調(diào)查過(guò)程中數(shù)據(jù)質(zhì)量的監(jiān)控、調(diào)查策略的及時(shí)調(diào)整、以及數(shù)據(jù)質(zhì)量的科學(xué)評(píng)估和誤差的有效校正具有非常重要的作用。
近年來(lái),國(guó)內(nèi)政府相關(guān)部門(mén)和學(xué)術(shù)調(diào)查研究機(jī)構(gòu)積極探索與國(guó)際調(diào)查先進(jìn)水平接軌的途徑,開(kāi)始在大型調(diào)查中引進(jìn)國(guó)外成熟的計(jì)算機(jī)輔助調(diào)查技術(shù)并結(jié)合國(guó)內(nèi)調(diào)查特點(diǎn)進(jìn)行自主研發(fā),成功進(jìn)行了多個(gè)全國(guó)規(guī)模的大樣本計(jì)算機(jī)輔助入戶(hù)面訪調(diào)查。如“中國(guó)家庭動(dòng)態(tài)跟蹤調(diào)查(以下簡(jiǎn)稱(chēng)CFPS)”,“中國(guó)健康與養(yǎng)老追蹤調(diào)查”(CHARLS),“中國(guó)家庭金融調(diào)查”(CHFS)等。
并行數(shù)據(jù)伴隨著問(wèn)卷數(shù)據(jù)采集的過(guò)程而產(chǎn)生,此類(lèi)數(shù)據(jù)的應(yīng)用促進(jìn)了調(diào)查管理方法的改進(jìn),對(duì)調(diào)查效率和數(shù)據(jù)質(zhì)量的改善產(chǎn)生了較為重要的影響。近年來(lái),隨著學(xué)者對(duì)并行數(shù)據(jù)的開(kāi)發(fā)和挖掘,越來(lái)越多的研究結(jié)果被應(yīng)用到調(diào)查質(zhì)量的評(píng)估和改善中。本文將以采用計(jì)算機(jī)輔助面訪模式的全國(guó)大型跟蹤調(diào)查CFPS為例,對(duì)CAPI模式中并行數(shù)據(jù)的采集及其對(duì)調(diào)查質(zhì)量的改善作用進(jìn)行分析,以期對(duì)此類(lèi)數(shù)據(jù)在調(diào)查領(lǐng)域的推廣和潛在價(jià)值開(kāi)發(fā)做初步探討。
CFPS項(xiàng)目是中國(guó)首個(gè)在家庭、個(gè)人和社區(qū)三個(gè)層面上收集數(shù)據(jù)的長(zhǎng)期跟蹤調(diào)查項(xiàng)目,也是國(guó)內(nèi)首個(gè)使用計(jì)算機(jī)輔助調(diào)查系統(tǒng)進(jìn)行全國(guó)規(guī)模大樣本調(diào)查項(xiàng)目,在數(shù)據(jù)調(diào)查領(lǐng)域具有重要地位。在獲得大量問(wèn)卷數(shù)據(jù)的同時(shí),CFPS自2009年開(kāi)始設(shè)計(jì)并收集了豐富的并行數(shù)據(jù),已經(jīng)逐步在調(diào)查質(zhì)量管理中進(jìn)行應(yīng)用。CFPS設(shè)計(jì)并采集的并行數(shù)據(jù)類(lèi)型主要包括:(1)聯(lián)系和觀察數(shù)據(jù);(2)訪問(wèn)過(guò)程中的錄音文件數(shù)據(jù);(3)鍵盤(pán)操作痕跡數(shù)據(jù); (4)訪問(wèn)場(chǎng)景控制數(shù)據(jù);(5)整份問(wèn)卷訪問(wèn)時(shí)長(zhǎng)和每題訪問(wèn)時(shí)長(zhǎng)數(shù)據(jù)。本文將就這五種并行數(shù)據(jù)在調(diào)查數(shù)據(jù)質(zhì)量改善和提高方面發(fā)揮的應(yīng)用進(jìn)行詳細(xì)分析。
聯(lián)系數(shù)據(jù)的內(nèi)容涉及到聯(lián)系方式、聯(lián)系時(shí)間和聯(lián)系結(jié)果三方面,聯(lián)系數(shù)據(jù)的采集大都設(shè)計(jì)在調(diào)查問(wèn)卷開(kāi)始之前以及問(wèn)卷中斷時(shí)。根據(jù)CFPS項(xiàng)目設(shè)計(jì)要求,訪員會(huì)將每次與受訪者聯(lián)系的方式(如面訪、電訪、信件溝通)、聯(lián)系時(shí)間(精確到年、月、日、分鐘)以及聯(lián)系結(jié)果在計(jì)算機(jī)訪問(wèn)系統(tǒng)中作登記。聯(lián)系結(jié)果的記錄是采用選擇一系列聯(lián)系結(jié)果代碼的方式進(jìn)行,如未聯(lián)系到受訪者(包括敲門(mén)/按門(mén)鈴無(wú)人應(yīng)答、無(wú)法進(jìn)入單元樓/小區(qū)、無(wú)法通過(guò)電話取得聯(lián)系等),聯(lián)系到受訪者(包括預(yù)約訪問(wèn)時(shí)間、拒訪、受訪者身體原因無(wú)法訪問(wèn)等),以及最終聯(lián)系結(jié)果代碼選擇。在子代碼下還可以進(jìn)行下一級(jí)信息選擇和填寫(xiě),如約訪時(shí)間選擇、拒訪原因選擇等。通過(guò)此類(lèi)數(shù)據(jù)的采集,可以在兩個(gè)方面對(duì)調(diào)查管理和數(shù)據(jù)質(zhì)量起到改善作用:
(1)通過(guò)與受訪者聯(lián)系方式、時(shí)間和結(jié)果數(shù)據(jù)分析,可以研究聯(lián)系方式和時(shí)間段對(duì)應(yīng)答率的影響,并可以進(jìn)一步跟受訪者城鄉(xiāng)、年齡、性別屬性做相關(guān)分析,獲得針對(duì)不同人群的最佳聯(lián)系方式和聯(lián)系時(shí)間段的分析結(jié)果,對(duì)訪員的聯(lián)系行為進(jìn)行指導(dǎo),提高接觸率和應(yīng)答率。
(2)通過(guò)聯(lián)系結(jié)果的記錄和實(shí)時(shí)回傳,可以及時(shí)對(duì)受訪者接受訪問(wèn)的意愿進(jìn)行干預(yù),如給不同類(lèi)型的拒訪者寄送項(xiàng)目宣傳冊(cè)、基于項(xiàng)目數(shù)據(jù)的出版物、禮品等,對(duì)受訪者拒訪的意愿進(jìn)行逆轉(zhuǎn),降低拒訪率。此外,在訪問(wèn)過(guò)程中中斷的問(wèn)卷,通過(guò)插入聯(lián)系記錄,可以幫助項(xiàng)目管理者了解中斷的原因,并指導(dǎo)訪員采取恰當(dāng)?shù)拇胧├^續(xù)完成訪問(wèn)。
(3)通過(guò)對(duì)聯(lián)系結(jié)果的實(shí)時(shí)分析,可以全面了解訪員在工作現(xiàn)場(chǎng)接觸樣本的情況和努力程度,幫助項(xiàng)目管理者及時(shí)對(duì)訪員的行為進(jìn)行指導(dǎo),促使訪員更有效的接觸并勸說(shuō)受訪者接受訪問(wèn)。
除了聯(lián)系記錄外,在訪問(wèn)過(guò)程中還可以采集觀察數(shù)據(jù),觀察內(nèi)容包括受訪者社區(qū)環(huán)境、家庭環(huán)境、受訪者參與訪問(wèn)的興趣、理解能力和配合程度、受訪者對(duì)調(diào)查的疑慮和回答可信性等方面。通過(guò)此類(lèi)并行數(shù)據(jù)的采集和分析,可以了解受訪者參與調(diào)查的態(tài)度并對(duì)問(wèn)卷數(shù)據(jù)的可信性進(jìn)行評(píng)估。
在計(jì)算機(jī)輔助的調(diào)查中,可以非常方便的在系統(tǒng)中嵌入錄音程序,隨著技術(shù)的不斷升級(jí)改進(jìn),在CFPS項(xiàng)目訪問(wèn)系統(tǒng)中還能夠?qū)崿F(xiàn)定題錄音和定題回放。在訪問(wèn)過(guò)程中,在征得受訪者同意并請(qǐng)受訪者簽署知情同意書(shū)后,可以開(kāi)啟計(jì)算機(jī)錄音程序并獲得清晰的錄音文件。錄音數(shù)據(jù)的采集和利用對(duì)于調(diào)查質(zhì)量的改進(jìn)及評(píng)估研究非常重要,主要在四個(gè)方面發(fā)揮作用:
(1)監(jiān)測(cè)訪員的臆答行為。臆答行為是指訪員在訪問(wèn)過(guò)程中有意不提問(wèn)某些題目而自行填答的訪問(wèn)行為。這種在調(diào)查過(guò)程中普遍存在的作弊問(wèn)題在傳統(tǒng)紙筆調(diào)查中很難被發(fā)現(xiàn),在CAPI模式下,通過(guò)對(duì)錄音數(shù)據(jù)進(jìn)行及時(shí)核查可以監(jiān)測(cè)到訪員的臆答行為并進(jìn)行針對(duì)性的干預(yù),改進(jìn)訪問(wèn)數(shù)據(jù)質(zhì)量。研究結(jié)果顯示,根據(jù)并行數(shù)據(jù)分析結(jié)果對(duì)訪員進(jìn)行干預(yù)后,臆答問(wèn)卷的比例會(huì)顯著降低[6]。此外,還可以分析臆答發(fā)生的題目特征,對(duì)于問(wèn)卷題目設(shè)計(jì)的改進(jìn)起到參考作用。
(2)監(jiān)測(cè)訪員的誘導(dǎo)訪問(wèn)行為。為了節(jié)省訪問(wèn)時(shí)間、不引起受訪者反感或因?yàn)樵L員對(duì)題目理解不清,訪員在訪問(wèn)過(guò)程中會(huì)發(fā)生扭曲題意、簡(jiǎn)化題意或催促受訪者快速作出回答的各種誘導(dǎo)訪問(wèn)行為。通過(guò)錄音文件的回放和并行數(shù)據(jù)分析,能夠發(fā)現(xiàn)訪員發(fā)生誘導(dǎo)行為的程度、研究誘導(dǎo)行為對(duì)數(shù)據(jù)質(zhì)量的影響并對(duì)此類(lèi)行為進(jìn)行及時(shí)干預(yù)。
(3)監(jiān)測(cè)訪員的捷徑跳轉(zhuǎn)行為。在訪員對(duì)問(wèn)卷有足夠的熟悉程度之后,會(huì)發(fā)生在關(guān)鍵跳轉(zhuǎn)題目上的故意漏問(wèn)、錯(cuò)誤記錄答案及誘導(dǎo)行為,以達(dá)到跳走大量題目,快速完成問(wèn)卷的目的。通過(guò)錄音文件的監(jiān)聽(tīng)和并行數(shù)據(jù)分析,可以及時(shí)發(fā)現(xiàn)訪員的此類(lèi)行為并進(jìn)行干預(yù),同時(shí)對(duì)調(diào)查數(shù)據(jù)的質(zhì)量進(jìn)行評(píng)估和修正。
(4)錄音率數(shù)據(jù)。訪員是否努力勸說(shuō)受訪者接受錄音、訪員的問(wèn)卷平均錄音率、各初級(jí)抽樣4位的整體錄音率等數(shù)據(jù)的分析,能夠較為客觀的反映訪員訪問(wèn)的認(rèn)真程度和采集問(wèn)卷數(shù)據(jù)的真實(shí)性。在跟蹤調(diào)查中,還可以比較分析不同訪員在同一抽樣單位的錄音率差異,發(fā)現(xiàn)因訪員因素造成的數(shù)據(jù)質(zhì)量問(wèn)題。
在傳統(tǒng)紙筆調(diào)查中,是采用將問(wèn)卷中涉及到的專(zhuān)有名詞、關(guān)鍵概念或術(shù)語(yǔ)的解釋印制成訪員使用手冊(cè)的方式,供訪員在訪問(wèn)中查看。但在實(shí)際訪問(wèn)過(guò)程中,在訪員手冊(cè)中查找某一名詞解釋非常浪費(fèi)時(shí)間,也容易引起受訪者的反感和不信任感。事實(shí)上,由于操作的不方便性造成很多訪員并不會(huì)在訪問(wèn)中使用此類(lèi)手冊(cè)。在CAPI系統(tǒng)中,可以在需要術(shù)語(yǔ)/概念解釋的頁(yè)面加入F1鍵并進(jìn)行標(biāo)識(shí),在調(diào)查過(guò)程中,訪員可以非常便捷地通過(guò)按F1鍵打開(kāi)定義描述的小對(duì)話框獲得相關(guān)信息并對(duì)受訪者做出正確的解釋。在CAPI系統(tǒng)中,訪員是否調(diào)用F1訪問(wèn)幫助以及調(diào)用的頻率等相關(guān)數(shù)據(jù)可以通過(guò)鍵盤(pán)回放的方式獲得。此類(lèi)數(shù)據(jù)的采集和研究,一方面可以幫助調(diào)查管理者考察訪員訪問(wèn)的認(rèn)真程度,掌握F1調(diào)用頻率隨調(diào)查問(wèn)卷份數(shù)增加而減少的一般趨勢(shì),并進(jìn)一步對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估。另一方面,從問(wèn)卷設(shè)計(jì)的角度看,F1被使用的頻率、借助F1是否可以增加受訪者對(duì)題意的理解,能夠從一定程度上反映問(wèn)卷題目設(shè)計(jì)的科學(xué)性和易操作性,有助于問(wèn)卷設(shè)計(jì)和F1設(shè)計(jì)的改善。此外,結(jié)合錄音數(shù)據(jù),能夠判斷訪員是否能在不借助于F1的情況下對(duì)專(zhuān)有名詞和術(shù)語(yǔ)進(jìn)行恰當(dāng)?shù)慕忉?以此判斷培訓(xùn)效果并針對(duì)性的對(duì)培訓(xùn)課程進(jìn)行改進(jìn)。
除F1外,CAPI系統(tǒng)中可以通過(guò)鍵盤(pán)回放手段獲取的另外一個(gè)操作痕跡數(shù)據(jù)是提示性校驗(yàn)(SoftCheck)和強(qiáng)制性校驗(yàn)(Hard Check)的使用頻率和方式?!疤崾拘孕r?yàn)”的主要目的是對(duì)訪員錄入的異常值進(jìn)行提醒性的檢驗(yàn),如受訪者家庭住址距離公交車(chē)站的距離超過(guò)100公里,系統(tǒng)會(huì)根據(jù)答案值域的事先設(shè)計(jì)跳出對(duì)話框?qū)υL員的錄入進(jìn)行提醒,訪員可以選擇強(qiáng)制通過(guò)檢驗(yàn)進(jìn)入下一題,或者回到原題對(duì)錯(cuò)誤的錄入進(jìn)行修改?!皬?qiáng)制性校驗(yàn)”的主要目的則是對(duì)常識(shí)性錯(cuò)誤答案或前后題目填答邏輯不一致的答案進(jìn)行提示,如CFPS家庭問(wèn)卷中詢(xún)問(wèn)“您過(guò)去一年住院總共住了多少天”,如果輸入400,系統(tǒng)會(huì)跳出強(qiáng)制性校驗(yàn)對(duì)話框,在該種校驗(yàn)?zāi)J较?訪員必須要對(duì)錄入的答案進(jìn)行修改才能跳至下一題。通過(guò)鍵盤(pán)回放對(duì)兩類(lèi)校驗(yàn)出現(xiàn)的頻率和訪員操作痕跡數(shù)據(jù)的采集和研究,可以對(duì)校驗(yàn)手段對(duì)修正錯(cuò)誤數(shù)據(jù)、改善數(shù)據(jù)質(zhì)量的作用進(jìn)行評(píng)估并對(duì)校驗(yàn)設(shè)計(jì)改進(jìn)。從CFPS的調(diào)查經(jīng)驗(yàn)來(lái)看,過(guò)多的校驗(yàn)設(shè)計(jì)會(huì)引起訪員操作的不便,在訪員熟悉問(wèn)卷流程之后,提示性校驗(yàn)較容易被訪員習(xí)慣性地強(qiáng)制跳過(guò),無(wú)法達(dá)到提醒訪員修改錯(cuò)誤的目的。但如果不做校驗(yàn)設(shè)計(jì)或校驗(yàn)設(shè)計(jì)不足,又會(huì)導(dǎo)致過(guò)多邏輯錯(cuò)誤或常識(shí)錯(cuò)誤的出現(xiàn)。因此,充分利用和挖掘操作痕跡數(shù)據(jù),在必要的題目上設(shè)計(jì)合理的校驗(yàn)提示類(lèi)型和內(nèi)容,對(duì)調(diào)查數(shù)據(jù)質(zhì)量的提高和改善將有重要價(jià)值。
在面訪調(diào)查中,應(yīng)答率的下降已經(jīng)成為各類(lèi)調(diào)查機(jī)構(gòu)普遍面臨的問(wèn)題。如果無(wú)回答是在非隨機(jī)情況下發(fā)生的,會(huì)導(dǎo)致誤差產(chǎn)生并削弱調(diào)查數(shù)據(jù)的質(zhì)量。如何通過(guò)各種方式減少無(wú)回答或者調(diào)查結(jié)束后進(jìn)行無(wú)回答誤差修正越來(lái)越成為調(diào)查研究方法領(lǐng)域內(nèi)關(guān)注的熱點(diǎn)。在諸多方法中,利用訪問(wèn)場(chǎng)景控制減少無(wú)回答并對(duì)無(wú)回答誤差進(jìn)行估計(jì)和調(diào)整已備受研究方法學(xué)者關(guān)注。相關(guān)的設(shè)計(jì)和研究在大型調(diào)查中實(shí)施和討論,如歐洲社會(huì)調(diào)查(European Social Survey,ESS)、全國(guó)健康訪問(wèn)調(diào)查(National Health Interview Survey,NHIS),美國(guó)家庭成長(zhǎng)的全國(guó)調(diào)查(National Survey of Family Growth,NSFG)等。通過(guò)對(duì)此類(lèi)輔助性的并行數(shù)據(jù)的采集,可以從兩個(gè)方面對(duì)訪問(wèn)質(zhì)量的提高起到重要作用:(1)分析訪問(wèn)場(chǎng)景對(duì)受訪者回答敏感題、困難題、態(tài)度題的影響,研究提高問(wèn)題應(yīng)答率的方式方法;(2)使用訪問(wèn)場(chǎng)景控制數(shù)據(jù)對(duì)無(wú)回答誤差進(jìn)行估計(jì)和修正。
2010年CFPS全國(guó)初訪調(diào)查中在所有問(wèn)卷中設(shè)計(jì)了訪員觀察題目,這些題目包括對(duì)村居環(huán)境、受訪者狀態(tài)和對(duì)調(diào)查的態(tài)度、訪問(wèn)時(shí)在場(chǎng)他人的觀察。在此基礎(chǔ)上, 2011年的跟蹤調(diào)查進(jìn)一步在問(wèn)卷設(shè)計(jì)上做了改進(jìn),增加了無(wú)回答率較高的敏感題、困難題、態(tài)度題的情境類(lèi)觀察,如他人在場(chǎng)、訪問(wèn)地點(diǎn)、訪問(wèn)時(shí)機(jī)、回答真實(shí)性判斷等。對(duì)該部分的并行數(shù)據(jù)分析結(jié)果顯示,訪問(wèn)過(guò)程中的他人在場(chǎng)會(huì)導(dǎo)致受訪者在敏感題目上會(huì)有更多的無(wú)回答。在開(kāi)放場(chǎng)所中,受訪者在敏感題目上會(huì)有更多的無(wú)回答,說(shuō)明公共場(chǎng)所會(huì)增加受訪者對(duì)此類(lèi)題目的敏感性。因此,在敏感題、態(tài)度題和困難題的訪問(wèn)過(guò)程中,應(yīng)盡量避免他人在場(chǎng),避免在不適合的場(chǎng)所,以減少訪問(wèn)環(huán)境壓力對(duì)訪問(wèn)結(jié)果的影響,提高應(yīng)答率。此外,除了有效控制訪問(wèn)物理環(huán)境外,應(yīng)該構(gòu)建適合的訪問(wèn)軟環(huán)境,如對(duì)受訪者的回答狀態(tài)進(jìn)行敏銳觀察,對(duì)于訪問(wèn)時(shí)機(jī)不合適導(dǎo)致受訪者產(chǎn)生不耐煩情緒的要及時(shí)結(jié)束調(diào)查另約訪問(wèn)時(shí)間。同時(shí),應(yīng)通過(guò)訪問(wèn)技巧提高其對(duì)調(diào)查的興趣,減少其對(duì)訪問(wèn)的疑慮,并選擇合適的訪問(wèn)時(shí)機(jī)。同時(shí),對(duì)訪員的甄選應(yīng)該更加嚴(yán)格,挑選能夠有效控制訪問(wèn)環(huán)境、可以引導(dǎo)受訪者在適當(dāng)?shù)姆諊陆邮茉L問(wèn)并給予訪問(wèn)配合的訪員,以提高回答率。
通過(guò)對(duì)訪員觀察數(shù)據(jù)和訪問(wèn)數(shù)據(jù)的關(guān)聯(lián)性分析,能夠深入了解訪問(wèn)情境對(duì)受訪者接受訪問(wèn)意愿以及回答敏感題、困難題、態(tài)度題意愿的影響,并通過(guò)改進(jìn)訪問(wèn)策略提高訪問(wèn)質(zhì)量和數(shù)據(jù)質(zhì)量。
在CAPI模式中,計(jì)算機(jī)能夠記錄每份問(wèn)卷開(kāi)始的時(shí)間、問(wèn)卷中斷的時(shí)間以及問(wèn)卷結(jié)束的時(shí)間。除此之外,計(jì)算機(jī)系統(tǒng)還能記錄訪員在每一個(gè)問(wèn)題上停留的時(shí)間,由此獲得的并行數(shù)據(jù)在CFPS項(xiàng)目中被稱(chēng)為T(mén)IEQ(Time of each questions)[7]。在執(zhí)行過(guò)程中,通過(guò)事先編制的程序,調(diào)查管理者可以每天看到訪員的采訪時(shí)長(zhǎng)和TIEQ數(shù)據(jù),該兩類(lèi)并行數(shù)據(jù)的采集,對(duì)于評(píng)估數(shù)據(jù)質(zhì)量,改進(jìn)問(wèn)卷設(shè)計(jì),及時(shí)干預(yù)訪問(wèn)行為將起到非常重要的作用:
(1)通過(guò)計(jì)算每位訪員整份問(wèn)卷的平均采訪時(shí)長(zhǎng)與所有訪員的采訪時(shí)長(zhǎng)數(shù)據(jù)的差值,可以及時(shí)發(fā)現(xiàn)某些訪員可能存在的作弊行為,在進(jìn)一步通過(guò)電話核查或錄音核查進(jìn)行驗(yàn)證后,給予相關(guān)訪員相應(yīng)的干預(yù)措施,保證調(diào)查質(zhì)量。此外,通過(guò)分析問(wèn)卷整體時(shí)長(zhǎng)隨著調(diào)查問(wèn)卷份數(shù)增加而減少的趨勢(shì),并參考質(zhì)量核查數(shù)據(jù),可以研究訪員熟練程度對(duì)調(diào)查時(shí)長(zhǎng)和調(diào)查質(zhì)量的影響,并制定有效的執(zhí)行管理方案和重要節(jié)點(diǎn)干預(yù)方案,提高數(shù)據(jù)調(diào)查質(zhì)量。
(2)TIEQ數(shù)據(jù)核查在CFPS項(xiàng)目中被設(shè)計(jì)為所有核查的起點(diǎn),即所有問(wèn)卷都要先進(jìn)入TIEQ核查程序,由于TIEQ核查對(duì)問(wèn)題問(wèn)卷具有非常高的敏感性,能夠準(zhǔn)確的判斷訪員臆答和提問(wèn)不規(guī)范、不完整等作弊行為,這對(duì)于問(wèn)題問(wèn)卷的有效篩選和核查效率的提高,有非常大的幫助。
(3)通過(guò)TIEQ數(shù)據(jù)的分析,可以篩選出問(wèn)卷中耗時(shí)時(shí)間最長(zhǎng)和最短的題目,對(duì)該類(lèi)題目進(jìn)行分析,通常能夠發(fā)現(xiàn)問(wèn)卷設(shè)計(jì)的問(wèn)題,這對(duì)于研究者及時(shí)改進(jìn)問(wèn)題提問(wèn)方式,獲得更高質(zhì)量的數(shù)據(jù)有重要價(jià)值。
從某種程度上,時(shí)長(zhǎng)并行數(shù)據(jù)是監(jiān)測(cè)訪員行為最有效的、最敏感的工具。尤其是TIEQ數(shù)據(jù),能夠非常直觀地發(fā)現(xiàn)訪員易產(chǎn)生臆答、虛假訪問(wèn)、捷徑跳轉(zhuǎn)的問(wèn)題題目,并進(jìn)行有效的干預(yù)。從另一方面看,分析大多數(shù)訪員易發(fā)生TIEQ問(wèn)題的題目,可以反映問(wèn)卷設(shè)計(jì)和調(diào)查執(zhí)行設(shè)計(jì)中存在的問(wèn)題,并對(duì)問(wèn)卷相關(guān)題目和執(zhí)行流程設(shè)計(jì)進(jìn)行針對(duì)性的改善。
數(shù)據(jù)質(zhì)量是調(diào)查數(shù)據(jù)的生命線,如何提高數(shù)據(jù)質(zhì)量,如何對(duì)調(diào)查數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估成為調(diào)查領(lǐng)域關(guān)心的熱點(diǎn)問(wèn)題。在計(jì)算機(jī)輔助的調(diào)查中,先進(jìn)科學(xué)技術(shù)的應(yīng)用使得并行數(shù)據(jù)的采集成為可能。從CFPS項(xiàng)目的全國(guó)調(diào)查經(jīng)驗(yàn)看,對(duì)并行數(shù)據(jù)的及時(shí)分析和有效利用能夠在調(diào)查執(zhí)行流程各環(huán)節(jié)對(duì)調(diào)查質(zhì)量的改善起到積極的作用,也能夠?qū)υ擁?xiàng)目下一波跟蹤調(diào)查或其他項(xiàng)目調(diào)查的問(wèn)卷設(shè)計(jì)、調(diào)查方案設(shè)計(jì)、核查方案設(shè)計(jì)等方面提供有效的改進(jìn)建議。
在充分挖掘現(xiàn)有并行數(shù)據(jù)使用價(jià)值的基礎(chǔ)上,應(yīng)該根據(jù)各類(lèi)調(diào)查項(xiàng)目的共性,并結(jié)合不同調(diào)查項(xiàng)目的獨(dú)特特性對(duì)并行數(shù)據(jù)采集的類(lèi)型和方式進(jìn)行整合設(shè)計(jì),以更好地發(fā)揮并行數(shù)據(jù)在評(píng)估和改善調(diào)查數(shù)據(jù)質(zhì)量以及提高調(diào)查管理水平方面的重要作用。
[1]Groves R M,Couper M.Non一Response in Household Interview Surveys.New york.1998.
[2]Stern M.J.The Use of Client一side Paradata in Analyzing the Effects of v isual Layouton Changing Responses inw eb Surveys.Field Methods,2008,20(4).
[3]Axinn w G,Link CF,&Groves RM.Responsive Survey Design,Demographic Data Collection,and Models of Demographic Behavior[J]. Demography,2011,48.
[4]Durrant GB,D'Arrigo J,Steele F.Using Paradata to Predict Best Times of Contact,Conditioning on Household and Interviewer Influences[J].Journal of the Royal Statistical Society.Series A,Statistics in Society,2011,174,1029.
[5]Oliver L.A Note on Improving Contact Times in Panel Surveys[J]. Field Methods,2012,24(1).
[6]嚴(yán)潔,邱澤奇,任莉穎,丁華,孫妍.社會(huì)調(diào)查質(zhì)量研究:訪員臆答與干預(yù)效果[J].社會(huì)學(xué)研究,2012,2.
[7]李力,丁華,任莉穎,孫玉環(huán).淺談?dòng)?jì)算機(jī)輔助調(diào)查中采訪用時(shí)數(shù)據(jù)的利用[J].中國(guó)統(tǒng)計(jì),2012,9.
(責(zé)任編輯/易永生)
O212
A
1002-6487(2016)20-0032-03
教育部人文社科基金資助項(xiàng)目(13y JC840006)
丁華(1979—),女,山東日照人,博士,副研究員,研究方向:社會(huì)調(diào)查研究方法。任莉穎(1973—),女,河北三河人,博士,副研究員,研究方向:社會(huì)調(diào)查方法與數(shù)據(jù)挖掘。嚴(yán)潔(1973—),女,吉林通化人,博士,副教授,研究方向:社會(huì)調(diào)查方法與數(shù)據(jù)挖掘。