涂洪波
(北京大學 社會學系,北京 100871;中山大學 城市社會研究中心,廣東 廣州 510275)
?
問與答之間:訪員因素對數據質量的影響
涂洪波
(北京大學 社會學系,北京100871;中山大學 城市社會研究中心,廣東 廣州510275)
[摘要]訪員因素是問卷調查過程中測量誤差的主要來源。在數據收集環(huán)節(jié),訪員對數據質量的影響主要表現為訪員偏差和訪員效應:訪員偏差是由訪員行為所引起、對數據質量產生不預期的差異性影響;訪員效應則主要表現為訪員在場、訪員特征以及訪員經驗等角色特征對被訪者應答的影響。本文嘗試著結合問與答的過程,來理解訪員因素、樣本無應答與數據質量之間的影響關系。
[關鍵詞]測量誤差;數據質量;訪員偏差;訪員效應
在社會調查過程中,訪員扮演著研究者與被訪者之間的橋梁角色,訪員主導著與被訪者之間問與答的互動過程。在爭取被訪樣本配合的情形下,訪員要幫助被訪者理解問卷、記錄和整理被訪者所提供的信息內容,并對被訪者的不充分應答進行追問以獲取更詳實的信息。另一方面,訪員在面訪過程中也不可避免地會影響被訪者的應答,從而對社會調查的數據質量產生至關重要的影響??陀^上看,學界在一如既往地關注定量研究方法和分析技術的同時,也在逐步重視數據質量問題,但對于抽樣調查的數據和客觀事實之間存在著哪些誤差、為什么會存在這些誤差、如何才能有效地控制這些誤差,都還有待進一步認識。本文關注并討論數據收集階段由訪員因素所引發(fā)的測量誤差問題,通過對訪談環(huán)節(jié)問與答過程的分析,闡釋訪員偏差、訪員效應對數據信度和效度的影響,這也是社會科學定量研究能有所推論意義的基礎所在。
一、關于測量誤差
社會科學研究中的測量誤差主要源于研究設計和數據收集兩個階段。從廣義上說,定量研究過程中的測量誤差包括抽樣框誤差、抽樣誤差,以及由概念的操作化、數據收集、編碼、錄入與清理等操作環(huán)節(jié)所產生的誤差。在特定的構思框架下,這些圍繞著研究設計而展開的直接或間接的測量過程,都會產生相應的測量誤差,從而導致隨機抽取的樣本指標值與被推斷的總體指標值之間出現偏離。
測量工具、訪員、被訪者以及調查環(huán)境等因素都會導致信息的缺失與變異,其中訪員因素與調查數據的信度顯著相關。問卷調查的實施過程就是調查員與被訪者之間的互動過程,調查員完全有可能在這個過程中發(fā)揮作用,或因自己的主觀傾向影響被訪者的情緒、認知和判斷。在數據收集環(huán)節(jié)中,訪員的年齡、性別、種族、人格特征、調查經驗等都可能對測量誤差產生影響*邊燕杰、李路路、蔡禾:《社會調查方法與技術:中國實踐》,社科文獻出版社2006年版,第161-191頁。。此外,訪員是否選擇了合適的被訪者、是否清晰地表述了問卷的意思、是否對題項的理解出現偏差、是否能爭取被訪者的配合、是否由于疲勞或其他原因而發(fā)生各種錯誤等,也都會影響測量工具的實際效果。一般而言,導致問卷調查中被訪者的不合作行為的原因主要是來自問卷設計、調查場景、調查員因素和被訪者特征等四大方面,而不同的影響因素之間又是相互交織的*邊燕杰、李路路、蔡禾:《社會調查方法與技術:中國實踐》,社科文獻出版社2006年版,第197-225頁。,如由于被訪者有意不回答(拒訪、拒答)或無意不回答(訪員漏問、被訪者不在家、被訪者不適合接受調查)等原因會造成無應答誤差*參見郝大海:《應答率的意義及其他》,《社會學研究》2007年第6期;風笑天:《再談樣本規(guī)模和調查回收率——對〈應答率的意義及其它〉一文的回應》,《社會學研究》2007年第6期。。
二、訪員偏差及其控制
對于訪員偏差行為的研究,一直以來存在著一個比較棘手的問題,那就是如何在訪員中隨機地分配被訪者,從而能有效地分析哪些數據變異是由訪員偏差引發(fā)的,其研究的虛無假設應該是:不同的訪員面對“相同或基本相似的被訪者”,應該都能獲得同樣的預期值*Hyman, Herbert, “Interviewing in Social Research”, Chicago: University of Chicago Press,(1954),pp.149-152.。一般來說,不同訪員總會受到樣本差異的影響,除非是在實驗室情景下。此外,問卷調查的過程實際上是一個“毀壞性過程”,被訪者在接受調查前后肯定會產生差別,這種差別可以體現在認知結構上,也可以體現在應答行為上,這就是測量效應問題。正因如此,有的學者反對針對同一批被訪者展開訪員行為差異研究,因為被訪者有可能是記住了頭一次訪談中的答案,而且在第二次的調查中不予思考地做出簡單的重復應答。如果在研究設計中只讓被訪者接受一次調查,我們則需要考慮一些方法以保證訪員能夠獲得同樣的預期值*Raymond F & Robert Williams, “A Method for Measuring Error Due to Variance Among Interviewers”, The Public Opinion Quarterly,(1956),p.257-64.。
雖然對于訪員偏差行為的研究存在著不同觀點,仍不妨礙學者們產生某些共識,即訪員偏差(interviewer bias)是指由訪員個體行為所引起的、對數據質量產生的差異性影響*Hansen, Robert and S. Marks, “Influence of the Interviewer on the Accuracy of Survey Results”, Journal of the American Statistical Association, (1958),pp.635-55.。訪員偏差可能存在于不同訪員之間,也可以存在于同一訪員的不同調查行為之間,它是數據收集環(huán)節(jié)中測量誤差的一個主要來源。訪員偏差反映的是調查過程中的訪員行為差異,它涉及測量的一致性與穩(wěn)定性問題,因而對數據質量的信度產生影響。
Hyman等人發(fā)現,訪員的行為差異對數據的準確性產生的影響主要表現在以下方面:訪員“拒絕”提出問題,例如省略或改變問卷中的問題,抑或在特定情境下自己認定某種答案;訪員在解釋問卷中的概念或措辭時,回答過于模糊、主觀臆斷的成分太多,或是解釋得太復雜以致于被訪者難以理解;由于缺乏良好把握,訪員在追問時提出的問題或提問的方式一定程度上改變了被訪者原本要給出的答案。Hyman等人的研究也探討了訪員的行為偏差與數據質量之間的關系,即訪員差異會帶來不同的測試結果;訪員的年齡、性別、職業(yè)、教育程度以及對被訪者的態(tài)度和期望,都會對調查行為及數據收集產生顯著的影響*Hyman, H., Cobb, J., Feldman, J., and Stember, C., “Interviewing in Social Research”, Chicago: University of Chicago Press,(1954),pp.734-61.。在Cannell & Fowler主持的關于生理健康與醫(yī)療衛(wèi)生的問卷調查中,有關于被訪者過去一年里住院治療經歷的題項,數據質量評估的依據是應答率。訪員通過兩種途徑來收集信息:一半的被訪樣本接受面訪,對于另一半的被訪樣本,這個問題則被放在一張表格里,由被訪者自填并寄回。統(tǒng)計結果顯示,無論是以訪員主導的問卷填答形式還是自填問卷的形式,被訪者因素決定著過去一年里住院接收治療問題的應答率*Cannell & Fowler, “A note on interviewer effect in self-enumerative procedures”, American Sociological Review,(1964),p.29-38.。正是這個結論,引發(fā)了諸多訪員對被訪者激發(fā)過程的后續(xù)研究與討論。研究人員向被訪者提出問題,“你覺得你所接觸的訪員是希望獲得準確的答案還是大概的信息?”與此同時,訪員也被要求回答如下問題:“你在調查過程中更關注答案的準確性呢還是完成問卷的效率?”研究結果表明,如果被訪者認為訪員更希望獲得準確的答案,那么此訪員事實上也更有可能收集到高質量的數據信息。更為重要的是,被訪者的行為與訪員所關注的內容是高度相關的,如果訪員更看重信息收集的準確性,被訪者的行為傾向也往往是“提供訪員更希望獲得的準確信息”*Bailar Barbara A, “Some Sources of Error and Their Effect on Census Statistics”, in Demography 13 (1976),pp. 273-86.。
就訪員偏差行為的成因而言,國內外學者也作了相關研究與解釋。Freeman & Edgar認為,無論問卷的結構簡單還是復雜,訪員在行為上都會表現出與調查要求所不一致的偏差,訪員的篩選與培訓是造成不同訪員之間行為差異的首要原因。*Freeman J. & Edgar Butler, “Some sources of interviewer variance in surveys”, Public Opinion Quarterly,(1976),pp.126-34.其次,訪員的工作量及其問卷調查的時間安排是造成同一訪員不同調查行為之間差異的主要因素,訪員在不同的工作量安排下,調查行為會體現出很大的差別*梁玉成、周怡:《問卷調查中的訪員因素》,載邊燕杰、李路路、蔡禾:《社會調查方法與技術:中國實踐》社科文獻出版社2006年版,第161-191頁;。
訪員偏差行為對數據質量的影響,一方面取決于其固有的導致誤差的可能性,另一方面又取決于這種可能性在調查實踐中被控制的程度。對訪員偏差的控制,主要內容就是訪員行為的標準化問題。Cannell展開了一系列的研究,目的就是為了減少訪員在被訪者面前表現出來的行為差異。在這些研究過程中,Cannell嘗試采用不同的途徑來強化訪員行為的一致性并使之趨于標準化。首先,Cannell強調訪員在讀題的時候語速要緩慢,訪員的語速可能會影響到被訪者對問卷調查的認知及態(tài)度,以免被訪者認為訪員希望盡快完成問卷,但這種對訪員行為的干預措施并未對數據質量產生顯著的積極影響。其次是通過放錄音帶展示問卷調查過程中的行為模版,這種“系統(tǒng)強化”的方法在數據收集的過程中展現出更好的效果,在若干實驗情景下明顯提高了數據質量。其三,Cannell要求訪員對被訪者的某些行為給出肯定性反饋,訪員肯定而積極的回應能進一步有效地促進被訪者提供高質量數據信息;與此相反,當被訪者不加思索很快給出答案時,訪員應該提醒被訪者多思考一下并盡量提供準確的信息*Barbara Snell Dohrenwend; J. Allen Williams, Jr.; Carol H. Weiss, “Interviewer Biasing Effects: Toward a Reconciliation of Findings”,The Public Opinion Quarterly, No. 1. (1969), pp. 121-29;Bailar Barbara A, “Some Sources of Error and Their Effect on Census Statistics”, in Demography 13 (1976),pp. 273-86.。Collins通過聽數據收集過程的錄音來了解并研究訪員的行為差異,他同樣發(fā)現,不同的訪員在數據收集過程中可能會偏好于使用不同的特定詞匯,這些持續(xù)、頻繁出現的詞匯對于所收集到的數據是有明顯影響的,尤其是面對開放式題項時*Wyatt, D. I. and D. T. Campbell, “A study of interviewer bias as related to interviewers' expectations and own opinions.”, International Journal of Opinion and Attitude Research 4 (1950),pp.77-85.。
對訪員行為的有效控制是需要條件的,其中必然涉及問卷設計的內容。如前所述,就訪員偏差行為的控制而言,最有效的措施是使個體訪員在面對不同被訪者時表現出行為一致性,所以如何控制訪員行為的差異問題與問卷設計是密切相關的。如果問卷設計清晰、合理而嚴謹,訪員就無需對被訪者可能產生的疑問進行過多的解釋,訪員偏差行為產生的空間也是有限的。社會調查過程中,語言直接關系到問卷調查的質量問題*蔡禾:《語境與問卷調查》,載邊燕杰、李路路、蔡禾:《社會調查方法與技術:中國實踐》,社科文獻出版社2006年版,第29-46頁;。題項對訪員行為差異的影響是可以預見的,在問卷設計過程中盡量減少可能帶來訪員行為差異的題項是控制訪員差異的有效途徑之一。當訪員越多地針對某題項追問被訪者以獲得充分信息時,訪員因素對數據質量的影響也就越大;當題項是描述性類型、很有可能需要訪員去進一步追問答案信息時,由訪員因素所引入的測量偏誤也會更大*Cannell, C. F., F. J. Fowler, and K. H. Marquis, “The influence of interviewer and respondent psychological and behavioral variables on the reporting in household interviews.” Vital Health Statistics Series 2, National Center for Health Statistics 26 (1968),pp.265-68.。這些發(fā)現反復強調了一個問題,那就是要想減少由訪員因素所帶來的測量誤差,高質量的問卷設計是一個必要前提。
訪員行為的有效控制同時也與訪員培訓及訪員管理密不可分。訪談過程中訪員應該遵守的基本程序、調查過程中讓訪員提哪些問題,在訪員手冊中應該都有明確的準則。強化對訪員隊伍的管理,如加強現場復核和電話復核,采用錄音、錄影等手段來督導和協(xié)助查證,也是控制訪員偏差的重要策略??傊?,在數據收集過程中,訪員信度總會有波動*Stock, J. S., and Hochstim, J, “A Method of Measuring Interviewer Variability”, Public Opinion Quarterly,(1951),pp.322-34.,我們應該通過訪員培訓和對調查工作量以及調查時間的合理安排來盡量保持數據質量的穩(wěn)定性。
三、訪員效應對被訪者應答的影響
訪員的角色特征影響被訪者的應答,從而影響最終的數據質量,這種影響通常被理解為訪員效應(interviewer effects)。訪員效應對被訪者應答的影響最早出現在對貧困問題的研究中*Rice, S., “Contagious Bias in the Interview”, American Journal of Sociology,(1929),pp.325-378.,研究結論是基于對兩個訪員的比較而得出的:一個訪員(禁酒主義者)所收集的數據表明,酗酒是造成被訪者貧困的原因;而另一個訪員(社會主義者)的數據信息則顯示,被訪者的社會、經濟地位才是造成其貧困狀況的原因。正是基于這種還有著很大局限性的研究以及后續(xù)一些關于民意調查的研究發(fā)現,訪員效應現象逐步得到了更多的關注*Campbell, Bruce A, “Race-of-interviewer effect among southern adolescents”, Public Opinion Quarterly.(1981),p.59-72.。
在社會調查的過程中,訪員效應主要表現為訪員在場、訪員特征以及訪員經驗等角色特征對被訪者應答的影響,其中訪員的預期會對被訪者應答產生影響,這也是早期訪員效應研究中的一個關注點。Hyman和民意研究中心(NORC)的同事們把訪員的預期劃分為角色預期(role expectation)、態(tài)度結構預期(attitude structure expectation)和概率預期(probability expectation)三類:角色預期指訪員對特定被訪群體(如職業(yè)婦女、黑人等)中的個體的應答是有預期的;態(tài)度結構預期指訪員希望被訪者的應答在觀點上是一致而非互相矛盾的;概率預期指針對問卷中的特定問題,訪員關于被訪者的應答大概會是什么情況會形成一種自我判斷。*Herbert Hyman, “Interviewer Effects in the Classification of Responses”, The Public Opinion Quarterly,(1951),pp.189-97.Rosenthal的研究同時關注了訪員自身的態(tài)度取向和對被訪者的預期這兩個問題,他認為訪員會在若干方面引發(fā)數據質量的偏差,如訪員的個人觀點可能在不經意間流露出來,而被訪者也會依此對自己的應答做出修改。在對被訪者某些應答的追問(probe)過程中,訪員針對哪些具體內容進行有選擇的追問、以何種方式追問都可能會帶來數據收集結果上的偏差。此外,在大多數抽樣調查的過程中,訪員在確定最終進入調查的被訪者時也可能造成一定程度的樣本偏差*Rosenthal, R, Gordon W. Persinger, Linda Vikan-Kline, and Kermit W. Fode, “The Effect of Early Data Returns on Data Subsequently Obtained by Outcome-Biased Experimenters”, Boston: Harvard University, Unpublished Manuscript,(1961).。不同的調查對訪員的要求不同,有些要求訪員不折不扣地按照指令操作,有些則給訪員以適當的回旋余地,Sudman稱之為角色要求。訪員角色的結構性越好,訪員越忠實于角色要求,數據收集環(huán)節(jié)的測量誤差就越小*Sudman, Seymour, and Norman M. Bradburn, “Response Effects in Surveys”, Chicago: Aldine,(1974).。
(一)訪員在場對被訪者應答的影響
由訪員主導的問卷填答過程中,被訪者可能隱瞞某些信息,因為這些信息中包含著特定的不被社會認可的個人行為內容。在以自填式問卷收集數據的過程中有可能得到的真實信息,訪談過程中往往得不到真實的答案,尤其是當某個答案信息與社會道德相違背的時候,被訪者在廣為接受的社會規(guī)范壓力下,會調整自己的回答而給出虛假信息,這就是被訪者在訪員在場的情形下對那些不被社會期許的行為所做的印象整飾*Feldman; Herbert Hyman; C. W. Hart , “A Field Study of Interviewer Effects on the Quality of Survey Data”, The Public Opinion Quarterly,(1951),pp.235-43.。對于性、吸毒、酗酒等敏感問題,被訪者的應答傾向非常普遍,訪員在場會帶來非常顯著的系統(tǒng)誤差*Ronald Cosper, “Interviewer Effect in a Survey of Drinking Practices”, The Sociological Quarterly,(1969),pp.152-157.。
(二)訪員特征對被訪者應答的影響
訪員的個人特征也可能會影響甚至決定著被訪者對問卷中特定問題的回答,如在關于反猶主義態(tài)度的問卷調查中,當訪員的名字里包含著常見的猶太姓氏或是有非常明顯的猶太姓氏特征時,被訪者的反猶主義態(tài)度會明顯減少*Robinson, and Rhode, S., “Two Experiments in an Anti-Semitism Poll”, Journal of Abnormal and Social Psychology,(1946),pp.213-36.;訪員的種族特征影響著黑人被訪者對種族態(tài)度問題的應答*Schuman, H., and Converse, J., “The Effects of Black and White Interviewers on Black Responses in 1968”, Public Opinion Quarterly,(1971),pp.44-68.。被訪者會根據訪員的年齡特征而給出相應的不同回答,也會根據訪員性別在特定題項上表現出不同的態(tài)度取向*Kane, E., and Macaulay, L., “Interviewer Gender and Gender Attitudes”, Public Opinion Quarterly,(1993),pp.159-65.;被訪者會根據訪員的社會背景而對自己的收入狀況給出不同的回答:面對明顯來自生活社區(qū)以外的訪員,一個依靠救助金生活的人可能會如實回答自己的收入狀況,但對于來自類似生活環(huán)境的訪員,被訪者可能不會把自己的收入狀況說得那么清楚*Weiss,C.,“Validity of Welfare Mothers' Interview Responses”, Public Opinion Quarterly,(1968),pp.622-33.;訪員顯而易見的社會階層身份甚至會影響著藍領被訪者表達他們對社會、政治問題的看法*Katz, D., “Do interviewers bias polls?”, Public Opinion Quarterly,(1942),pp.281-94.。訪員的外在特征不是孤立存在的,這些特征可以表現為不同的符號象征、背后可能蘊含著不同的社會意義:在美國,訪員特征可能與種族關系問題相聯系;在魁北克,訪員特征可能體現為語言差異,訪員的種族、性別、年齡等特征對態(tài)度量表的影響尤為顯著*Fellegi,I.,“Response Variance and Its Estimation”, Journal of the American Statistical Association,(1964),pp.327-42.。
(三)訪員經驗對被訪者應答的影響
有經驗的訪員與無經驗的訪員之間總是存在差異的,但這種差異并不必然對數據質量產生顯著影響。訪員的經驗在社會調查過程中可能發(fā)揮著積極作用,但也可能扮演著負面角色。通常意義上我們認為,有經驗的訪員能帶來更高的問卷應答率。但高應答率卻并不一定就代表著好的數據質量,因為隨機抽樣程序的嚴格實施與調查的回收率似乎具有天然的反比關系*風笑天:《再談樣本規(guī)模和調查回收率——對〈應答率的意義及其它〉一文的回應》,《社會學研究》2007年第6期。。
從另一個角度上看,有經驗的訪員往往不會像沒經驗的訪員一樣嚴格地按要求把問卷中的問題逐字逐句讀出來,在NSDUH(National Survey on Drug Use and Health)問卷調查中,相關數據表明,訪員參與NSDUH的經驗越豐富,收集的問卷中匯報使用過毒品的被訪者案例越少。這種情況引發(fā)了我們對數據收集過程的思考:大多數被訪者在進入問卷調查的時候,大都不太清楚訪員希望從他那里獲得什么信息,也不知該如何有效地提供這些信息,此時訪員的作用至關重要,他們的工作讓被訪者明白該如何配合問卷調查的展開。在NSDUH問卷調查過程中,由于是自填式問卷,訪員是不需要提問的,但有經驗的訪員可能會給被訪者帶來某種印象,那就是要盡快完成問卷的填答。在這種印象的驅使下,如果被訪者回答曾經使用過毒品,將面臨著許多其他后續(xù)要回答的問題,而隱瞞真實信息則可跳過這些問題,從而縮短完成問卷的時間*Groves, Robert M.,. “Survey Errors and Survey Costs”, New York: Wiley,(1989).。這也似乎佐證了有經驗的訪員在嚴格執(zhí)行調查要求方面可能會存在欠缺。
訪員偏差與訪員效應是可能會引發(fā)數據收集環(huán)節(jié)中測量誤差的兩個不同方面內容。隨著社會調查理論與方法的逐步完善、訪員培訓的強化、訪談技術的提高、訪員的提問方式逐步趨于標準化、非誘導式追問程序逐步形成,一定程度上減少了訪員因素對數據質量信度和效度的負面影響。
四、訪員因素與樣本無應答
無應答有兩種情形,即題項無應答(item nonresponse)和樣本無應答(sample unit nonresponse),其中樣本無應答會造成特定屬性的樣本在數據分析過程中出現的頻次過低,在分析結果上產生選擇性效應*Lessler, J. and Kalsbeek, W., “Nonsampling Error in Surveys”, New York: Wiley,(1992),pp.169-201.,因此大多數的社會調查都會專門為此做出艱苦的努力。
Groves & Couper認為,被訪者是否拒訪受到樣本的社會屬性、問卷的設計、訪員的個體特征、訪談情景(包括居住環(huán)境)以及被訪者以前接受調查的相關經驗等方面因素的交織影響*Groves & M. Couper, , “Nonresponse in Household Interview Surveys”, New York:Wiley,(1998).。在入戶調查過程中,不在家的被訪者比例會隨著一年內的不同時間、每個星期的不同工作日、每天的不同時間段以及所處城市的地理空間范圍等因素而產生變化,但不在家的被訪者和拒訪之間沒有客觀的因果關系,樣本無應答問題更多的是集中在收入很高或者很低的人群身上*Kish, L., “A Procedure for Objective Respondent Selection Within the Household”, Journal of the American Statistical Association,(1949),pp.68-92.。了解樣本無應答的來源,在調查中對其進行預測及控制,并估計它在調查中可能產生的影響都是必不可少的。報告社會調查過程中樣本的無應答狀況已經成為一種慣例做法。
在跟蹤調查過程中,樣本無應答問題更是倍受關注,對于歷時研究而言,樣本減損所導致的無應答幾乎是所有此類調查中最頭痛的問題。為了不讓非隨機的樣本減損導致樣本失去代表性,美國家庭收入動態(tài)調查(PSID)非常強調問卷回收率問題。PSID在1968年展開第一波調查,次年的樣本減損率就達到了11.9%。截至第21波調查,PSID跟蹤調查的初始樣本只有48.8%還在接受繼續(xù)的跟蹤調查*Jeffery E.Zabel, “An Analysis of Attrition in the Panel Study of Income Dynamics and the Survey of Income Dynamics and the Survey of Income and Program Participation with an Application to a Model of Labor Market Behavior”, The Journal of Human Resources 33, pp. 479-506.。PSID有一個子項目叫SIPP(Survey of Income and Program Participation),這是一個兩年零八個月的固定樣本跟蹤調查,每4個月展開一次數據收集。SIPP在1984年第一次展開問卷調查,第一輪的問卷無應答就達到了5.9%,只有71.4%的最初樣本能完成所有的8波跟蹤調查。通過對PSID以及SIPP的數據分析,研究人員發(fā)現,跟蹤調查的頻次以及時間間隔對樣本減損會產生影響,跟蹤調查的歷時跨度越長、調查頻次越密,樣本減損率越高。此外,地區(qū)的人口狀況以及地理位置也同樣對樣本減損過程產生影響。為了降低樣本減損率,自1985年開始便盡量安排同一位訪員對同一位被訪者進行下一波的跟蹤調查,同時盡量縮短問卷調查的時間。這種實際操作層面上的經驗告訴我們,由同一訪員對同一被訪者進行跟蹤調查有助于降低被訪者對訪員的陌生感和焦慮感,從而有可能提高續(xù)訪率,這也是訪員因素對于歷時性數據質量影響方面值得關注的地方。PSID在它長達40年的跟蹤調查過程中,為了減少樣本流失而采取過諸多辦法,讓訪員在非調查時期保持與樣本家庭的聯系;維護訪員隊伍的穩(wěn)定性以及維持與樣本家庭的對應關系,是保證后續(xù)的跟蹤調查過程中較低樣本無應答的重要舉措。
五、對問與答過程的一個思考
哥倫比亞廣播公司和紐約時報曾在1980年聯合展開了一次全美范圍內的電話訪談調查。與之前的類似調查不同的是,此次電話訪談格外關注訪員之間的行為差異。研究結果表明:首先,訪員之間的行為差異對調查結果的影響是客觀存在的,尤其是涉及到某些特定變量時,訪員差異對樣本的分析結果產生著顯著的影響;其次,訪員偏差和訪員效應對主觀題項和客觀題項的影響作用存在差異,這種偏差更多的是由于訪員在數據收集過程中引入了不被預期的個人干涉而造成的,它以諸多的形式表現出來,并對主、客觀題項都有影響。那些可能被拒答的敏感類問題、開放式問題(尤其是涉及到需要追問的內容)以及需要訪員解釋的題項等更易受訪員偏差的影響;第三,訪員偏差和訪員效應與被訪者特征是相關聯的,訪員的個人能力狀況以及對問卷調查的態(tài)度、預期直接影響著訪員行為,年齡越大的受訪者越容易受訪員效應影響;第四,訪員偏差和訪員效應是訪員行為、被訪者以及問卷設計等因素共同作用的結果*Groves, R., and Kahn, R., “Surveys by Telephone: A National Comparison with Personal Interviews”, New York: Academic Press,(1979).。這些發(fā)現引起了人們關于調查研究方法論的思考。對于訪員差異和訪員效應的評估與測量是一項復雜的工作,在現實的社會調查過程中往往不易測量。大多數的社會調查,無論是電話訪談還是面訪,都有時間和經費的約束,這也在一定程度上導致訪員對數據質量產生影響。由此,從調查方法論的意義上去關注訪員效應對調查結果的影響,或是通過研究設計的調整來減少訪員因素引發(fā)的測量誤差,是很有必要的。
在問與答的另一端,就被訪者而言,越來越多的證據表明,被訪者在聽到訪員的提問之后,會進行相關的信息處理,然后再給出信息反饋。我們可以把問與答的過程分解為以下步驟:
步驟一,接受題項信息并加以理解(包括概念、措辭及句意的理解)。理解的過程也是對問題的詮釋過程,當某個問題有多個可能的詮釋時,被訪者需要在有限的時間里對不同的理解作出判斷和選擇。如:“在過去的一個月時間里,你和醫(yī)生有過多少次關于健康狀況的談話?”當被訪者面臨這個問題時,他可能會產生如下的考慮:這些談話是否包括電話交談?專業(yè)足療師屬于醫(yī)生范疇嗎?“過去的一個月”是指大致四個星期時間呢還是嚴格意義上的一個完整月份?被訪者一般都是在揣摩并理解問題之后再去回憶相關信息;
步驟二,對與題項相關聯的信息進行處理。信息處理的過程包括對個人經歷進行回憶(通常依據某個線索或時間框架)、整理相關聯的回憶信息并判斷哪些信息對于準確回答問題是有用的;
步驟三,對整理后的應答結果是否符合題項要求進行評估。如果潛在的應答被認為在信息內容上并不充分,被訪者將重復上述步驟;
步驟四,對整理后的應答結果是否符合個人期許進行評估。這是被訪者自我印象整飾的過程,這個過程關心的不是應答結果是否符合調查的具體要求,而是看應答是否會有潛在的令人不滿的社會效應。上述步驟是對問-答過程中被訪者所面臨的問題的簡要描述,它也反映了被訪者要回答這些問題可能遇到的潛在的復雜性,尤其當面臨的問題需要被訪者花費相當的精力去搜索精確答案或是當被訪者認為如實給出答案讓他很尷尬時,完成這些步驟并不是簡單的事情。
在問與答的過程中,被訪者往往是有條件地提供準確信息,這主要包含兩個方面的內容:
第一,被訪者的回憶(retrieval)。對于問與答的過程而言,最大的障礙莫過于被訪者對信息內容的回憶以及在給出回答時所面臨的問題。認知研究表明,許多因素對回憶的過程產生差異性極大的影響。很常見的一種情況是想不起來以前所發(fā)生的事情,哪怕有提示的線索也無濟于事。Wagenaar的研究顯示,在對個人經歷的回憶過程中,有20%的重要細節(jié)在一年以后被遺忘,60%的重要細節(jié)在五年以后也會消失,而且應答者的回憶時間直接影響應答信息的準確性*Wagenaar, W., “My Memory: A Study of Autobiographical Memory Over Six Years”, Cognitive Psychology,(1986).。在有類似記憶信息的干擾下,被訪者更難對問題提供準確的應答。在這種情況下,被訪者往往會把其他時期或情形下所發(fā)生的事情“傳輸”過來,這就會導致對具體事件發(fā)生頻次的有偏估計,而這正是在歷時性社會調查中很常見的一種情形*Fowler F., & Mangione, T., “Standardized survey interviewing:Minimizing interviewer-related error”, Sage Publications,(1990),pp.268-75.。
第二,被訪者的推斷(inference)。在回憶的基礎上,被訪者通常會依據特定場景和某些啟發(fā)因素給出應答,這個過程就是推斷。對被訪者而言,可獲得性啟發(fā)法(availability heuristic)常用于判斷某事件發(fā)生的頻率,這時人們往往會利用記憶中最容易獲取的信息進行主觀估計*Krosnick, J., “Response Strategies for Coping with the Cognitive Demands of Attitude Measures in Surveys”, Applied Cognitive Psychology,(1991).。頻率的估計極大地受對事件熟悉程度及其重要性的影響,如果一件事情更容易被回憶起來,在每次的回憶過程中它也就表現為出現的頻次更多,這種記憶的可回溯性及有效性會造成認知偏差。對于歷時研究而言,某個時點上的數據偏差還可能通過其他時點上的數據收集進行彌補,但對于截面研究而言,可能就意味著致命的缺陷。
(責任編輯:陸影)
[中圖分類號]C915
[文獻標識碼]A
[文章編號]1003-4145[2016]05-0085-06
作者簡介:涂洪波(1971—),男,社會學博士,北京大學社會學系在站博士后,中山大學城市社會研究中心專職研究員,主要研究方向為組織社會學與社會學研究方法。
收稿日期:2015-10-30