職心樂,胡良平
(1.天津醫(yī)科大學公共衛(wèi)生學院衛(wèi)生統(tǒng)計學教研室,天津 300070;2.軍事醫(yī)學科學院生物醫(yī)學統(tǒng)計學咨詢中心,北京 100850;3.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
調查研究中的問卷和量表的設計與編制要領
職心樂1,胡良平2,3*
(1.天津醫(yī)科大學公共衛(wèi)生學院衛(wèi)生統(tǒng)計學教研室,天津 300070;2.軍事醫(yī)學科學院生物醫(yī)學統(tǒng)計學咨詢中心,北京 100850;3.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
問卷調查在科學調查研究以及實施中都至關重要,問卷設計必須緊扣研究目的,并且同調查研究的主題相適應;還應力求做到系統(tǒng)全面、提綱挈領。問卷調查法是實證研究中常用的方法,在社會調查研究、醫(yī)學調查研究等眾多領域內均做出了巨大的貢獻。在問卷調查法應用過程中,多方面的因素都直接或間接影響著調查研究的質量。本文從調查問卷及量表的設計、關于沿用現(xiàn)有量表或者自行設計新量表的注意事項等幾個關鍵問題進行了剖析與總結。對調查問卷中的影響因素與評價指標以及制定量表的技巧加以闡述,并就問卷如何進行信度與效度分析等問題開展了討論。同時對調查問卷中的核心內容,即量表的設計要點進行了探討、歸納與呈現(xiàn),包括如何合理沿用或修改現(xiàn)有量表或者自行設計新量表過程中存在的問題與設計要點。
調查設計;問卷;量表;設計;編制;信度;效度
1.1 問卷調查的意義與過程
問卷調查在科研調查設計以及實踐中都至關重要,問卷調查的過程是調查者事先設計好問卷,通過不同形式將問卷遞送到被調查對象手中,由其填寫完成后返還給調查者;或者通過調查員詢問被調查對象相關情況,填寫在問卷中,最后回收。在科研實踐中,越來越多的醫(yī)學、社會學等調查研究開始采用問卷調查方法來收集有關信息,所以圍繞主題、緊扣研究目的而設計一份合理且高效的調查問卷極為重要,優(yōu)質的問卷同時也是后續(xù)信息分析等工作順利進行的基礎保證[1-3]。
1.2 調查問卷的結構
問卷結構的設計必須緊扣研究的目的,并且與調查研究的主題相適應。調查問卷的結構可分為無結構型問卷和有結構型問卷[3-5],根據(jù)研究者的調查目的以及具體情況來選定具體的問卷結構:①結構型問卷在各類科研工作中比較常見,便于資料的處理和統(tǒng)計分析,適用于大規(guī)模調查,如市場調查等,結構型問卷的最大特點就是在組織結構設計上非常注重嚴密性,也因此而得名;②無結構型問卷,其特點是在問題的設置和安排上沒有嚴格的結構形式,相對來說,此種形式的問卷較少單獨用于調查研究實踐當中[5-6]。
1.3 結構型問卷的兩種形式
一般來說,提問的方式和備選答案都是固定的,按照問題形式又分為封閉式和開放式。其中封閉式的結構型問卷最常用,被調查對象在回答問題的過程中只能按照問卷中規(guī)定好的范圍進行選擇,不能自由發(fā)揮;相對來說,開放式問卷一般只提出問題、不提供備選答案,給予被調查對象很大的自由度作答,而作為研究者,開放式問卷可以幫助研究者收集靈活性大而且范圍廣泛的資料,當然資料分析的難度和工作量也隨之增加,且開放式問卷的另外一個缺點是難以進行推斷性統(tǒng)計分析。所以開放式問卷更多地應用于研究的測試階段,用于探索可行的研究方向和項目[3-5]。實際調查中,封閉式問卷和開放式問卷相結合的形式也很常見。
2.1 問卷與量表的關系
除了根據(jù)研究需要由研究者自行設計的問卷之外,醫(yī)學研究中一類重要的標準化問卷就是量表,在心理學等領域應用廣泛,可完成心理測評,也稱心理測量。心理測量以一定的心理學理論為基礎,使用規(guī)定的操作程序,對受試者的能力、人格或心理健康等心理特性和行為進行評定,并且以確定的數(shù)量化價值表現(xiàn)出來。目前心理測量主要以心理量表測評作為主要手段[7-9]。
2.2 心理測評量表簡介
心理測評的最終目標是通過科學客觀且標準的測量手段對受試對象的特定素質進行分析和評價[7]。量表是根據(jù)特定的法則,把數(shù)值分配給受試者、事物或行為,測定其特征標志程度的一種數(shù)量化工具。量表具有描述性和比較性的特點,表征程度,往往都具有一個起點。
例如,常用的心理測評量表如健康調查簡表(36-item Short Form Health Survey, SF-36),一般來說,健康調查量表往往是多目的、希望通過簡短形式調查健康狀況的工具,SF-36包括36個問題,8個維度,綜合地對生理和心理進行測量。SF-36相對那些針對特定年齡或疾病的受試對象進行特定測評的量表來說,屬于測定普遍健康狀況的一般性測量量表。其功能是根據(jù)不同的健康狀態(tài)、疾病的相對負擔以及接受不同治療后相對效益的狀態(tài)來評價人群健康水平。SF-36被開發(fā)的最初目的就是為這些比較提供一個基礎狀態(tài)的信息。一些研究以美國的一般人群和患病人群、瑞典和英國的一般人群以及在其他許多國家和地區(qū)的人群為研究對象,分別通過因子分析等方法證實了該量表生理和心理健康因子在8個維度中累計貢獻率為80%~85%。此類分析結果同時還提示了量表中3個維度(生理功能、由生理原因引起的角色限制、疼痛)與生理的內容高度相關,歸屬于生理內容綜合測量(PhysicalComponent Summary,PCS)[10-12]。
2.3 心理內容綜合測評量表簡介
心理內容與心理健康、由情感問題引起的角色限制則與社會功能高度相關,歸屬于心理內容綜合測量(Mental Component Summary,MCS)。以癥狀自評量表(Symptom Checklist 90,SCL-90)為例,臨床研究中常用到SCL-90,這是在不同因素上自我報告癥狀程度的量表,主要用于反映精神病患者和有軀體疾病患者的心理癥狀[13-15],SCL-90也經歷了漫長的發(fā)展,起源于1948年康奈爾醫(yī)學指數(shù)的提出,后續(xù)吸收了不滿意度量表和58個問題的Hopins癥狀自評量表并幾經修訂,增加新的條目后,于20世紀70年代正式編制出版,并逐漸在全世界推廣使用。我國于1984年引進SCL-90,隨后眾多學者對中國人SCL-90評定結果進行了分析,包含對量表的信度和效度分析,檢驗量表對患者和正常人群有無區(qū)分效度,并對量表的因素結構、9個因子的內部一致性、年齡和性別差異進行討論后,SCL-90在我國也開始廣泛使用。
3.1 調查問卷中的項目與指標的設置
在科研問卷的設計過程中,應根據(jù)調查的主題或內容來設置對應的條目指標或各變量的量表。問卷中所有項目是不應該存在重復與遺漏的,大多數(shù)時候還應該考察各項目之間的相關關系,刪除相關性過高的所謂交叉項目。在問卷中制定量表也是問卷的設計要點之一,其主要是為了方便客觀分析,通過制定量表獲得的資料并將所得資料數(shù)量化,常見的量表常常分為四種級別[16-18]。
3.2 量表的種類
根據(jù)測量的不同水平以及測量中使用的不同單位和參照點,量表分為以下四類:
第一類為命名量表,用數(shù)字代表事物或用數(shù)字對事物進行分類的量表,數(shù)字代表了事物的符號而不再有意義,命名量表是最低水平的測量量表,又分為兩種形式,其一是名稱量表,也就是用數(shù)字指代個別事物;其二是類別量表,其中數(shù)字指代的是事物的種類。
第二類為順序量表,量表中按照事物的大小、等級或程度等特征排列數(shù)字,這類量表中的數(shù)字不僅可以指代事物的類別,而且可以代表不同類別的大小和等級特征等,此類量表是次低水平的量表。統(tǒng)計分析過程中適于使用中位數(shù)、百分位數(shù)、等級相關系數(shù)和肯德爾和諧系數(shù)等。
第三類為等距量表,等距量表中的數(shù)字代表了類別或等級,同時還具有相等的單位,屬于較高水平的測量量表,其中的數(shù)字是一個真正意義上的數(shù)量,各個指標均有單位,且單位是相同的(相當于標準化指標),因此可以對其進行加減運算,也為統(tǒng)計分析提供了前提和更多便利。在普通數(shù)據(jù)統(tǒng)計中使用到的常用方法都可以應用到此類量表中,如使用平均數(shù)、標準差進行統(tǒng)計描述,使用t檢驗和F檢驗等進行假設檢驗。值得注意的是,等距量表沒有絕對的零點,其零點是假定的相對零點,所以數(shù)據(jù)之間不存在倍數(shù)關系,分析中兩個數(shù)量不可以進行乘除運算。
第四類為比率量表,比率量表是既具有類別、等級、等距特征,也具有絕對零點的量表。比率量表是最高水平的測量量表,它的數(shù)據(jù)既可以進行加減運算,也可以進行乘除運算。統(tǒng)計分析中方法選擇的余地大,當某指標的取值之間存在倍數(shù)關系時,適合使用幾何平均數(shù)和變異系數(shù)等進行描述[16-19]。
3.3 設計量表的步驟
量表的設計一般經過兩大主要步驟,其一是根據(jù)研究主題和研究假設設計集體指標,即根據(jù)研究問題的具體范圍和復雜程度等確定指標的數(shù)目,需要特別注意的是初測量表中的指標數(shù)目一般應多于正式調查所需的指標數(shù)目(以1.5~3.0倍為宜)。另一個重要步驟就是在小范圍內采用開放式問卷等形式進行測試或專家論證,去除不合理的條目和指標,以保證在大規(guī)模的調查研究中指標能夠準確且高效。調查指標的操作性定義是指用文字概括出來的能夠說明一個概念的內涵與外延。概念代表了一個事物或一類事物,概念的外延指概念所代表的事物的全部,概念的內涵表明了概念所代表的事物的共同特征[19-20]。
3.4 設計調查指標的原則
當然,在問卷和量表中,調查指標設計的原則不容忽視。首先是科學性原則,科學性強調調查指標的設計必須遵循科學的理論、程序等,要符合社會的實際情況和發(fā)展規(guī)律,不能主觀任意設置,也不能違背事物固有的客觀規(guī)律;第二個原則是通用性原則,也就是說在使用范圍方面,調查指標應該能夠被受試對象理解和接受,具有統(tǒng)一規(guī)范;第三個原則是指標設計還應該簡潔明了,在保證能夠說明問題的基礎之上,調查指標的選取不宜冗長,盡量少而精是一個重要的操作性原則;第四個原則是可行性原則,調查指標在調查實踐中必須是可以實施測量的,且能夠反映受試對象相應的真實情況[18-21]。
3.5 對問卷設計質量的分析
調查使用的問卷中除了涉及詢問一般事實的問題之外,常常還會涉及關于意見或態(tài)度的問題,對于涉及意見態(tài)度或評價式的量表,需要對問卷的質量進行分析,也就是進行信度和效度分析,以便發(fā)現(xiàn)不合適的項目并及時處理[22-23]。在統(tǒng)計學上,信度一般被規(guī)定為真實態(tài)度所對應的方差在總方差中所占的比重;信度分析通過對信度進行估計來完成,常用的分析方法包括測驗-再測驗法、折半信度法等。各種分析方法具體做法和算法雖然不同,但原理都是通過估計內部一致性程度來完成分析,信度越高表明設計越合理。另一方面,效度一般被規(guī)定為與測量目的有關的分數(shù)的方差在總方差中的比重,常用的分析方法包括單項與總和相關效度分析、獨立標準效度分析以及量表的結構效度分析等,主要是針對測量目的,考慮測驗是否能發(fā)揮測量功能而進行的分析。效度越高表明測出的結果越準確可靠[22-24]。
3.6 調查問卷的邏輯順序
一般來說,調查問卷內容的順序沒有固定的模式,一個宗旨就是無論怎樣安排內容順序,都以提高問卷回復率為大前提[2-5]。所以,為了使受試對象能夠安心合作,一般在問卷的開始部分,調查者會以簡短的文字說明調查目的、性質,并保證受試對象的信息會被保密等。問卷正文部分,一般以詢問基本情況開始,包括社會人口學的信息,如性別、年齡、職業(yè)等;有關態(tài)度的問題,一般問題的性質都是先封閉式問題后開放式問題,先一般性問題后敏感性問題;備選答案中,如果在程度范圍或者分量上有順序大小之分,最好對應的代碼順序一致(即同趨勢化),這樣方便以后的統(tǒng)計分析。同時還要注意,在態(tài)度意見類的量表中,除了正向的問題之外,一般還會配以逆向或者中性的問題,順序往往也要打亂,防止出現(xiàn)正向問題或逆向問題過于集中的情況[2-6,16]。
4.1 關于沿用現(xiàn)有量表
4.1.1 我國醫(yī)學科研中應用量表方面存在的問題
我國醫(yī)學科研中涉及到的量表很多都是源于國外已有的量表,特別是心理學及其相關領域,所以如何將西方的心理量表翻譯并修訂使之適用于國內的研究人群是一個重要問題。顯而易見,將譯本直接照搬、匆促地用于中國的臨床科研可能存在諸多不適之處。因此,對一個穩(wěn)定有效的西方量表進行了準確無誤的翻譯,并不表明就萬事大吉,這樣的量表在國外人群可能穩(wěn)定有效,但在中國該量表的穩(wěn)定性和有效性可能就有所改變了[17-19,25]。而在心理學和精神病學及其相關領域的跨文化研究中,不少研究直接將西方量表翻譯后就在中國使用,其中不乏生物心理測量和社會心理測量的定式檢查量表和自評量表。更有甚者,前述的很多量表還繼而直接被應用于臨床研究中。但是,這樣直接使用譯本的研究結果往往并不可靠,原因在于沒有考慮到量表在不同人群中的信度和效度問題,沒有對量表譯本進行充分的信度和效度分析,這樣就可能增加量表的種族或文化偏性。所以,為了提高它們在新人群中的臨床使用價值,一定要注意對量表譯本進行質量評價和必要的修訂[19,25]。
4.1.2 沿用和修訂西方量表應遵循的步驟
第一,應該了解審定西方量表的評價和使用情況,也就是關注這些量表在原國家或地區(qū)使用中的質量,很多量表在原國家使用中質量就不佳,這樣的量表翻譯后引進中國,很大程度上只會擴大其不適應性。所以將一個西方量表應用于中國人群之前,首先要完全熟悉這一量表在西方的發(fā)展和應用情況,盡可能地查閱有關的文獻及研究報道,以便正確評價這一工具的質量,這是一個非常值得注意的前提。
第二,量表的編制和修訂都必須基于可靠的科學理論。如果編制某一量表的理論本身就不清楚或文化偏性太高,那么此量表很有可能不適用于更多的人群,或者說量表本身存在一定的局限性[19,25]。
第三,量表編制的過程需要特別注意以下幾個方面,這些方面直接關系到量表能否用于不同的文化背景:①編制量表時的原始條目池是否全面;②選擇條目的方法是否適當;③用來建立常模的樣本是否具有代表性;④是否對量表的信度和效度進行過嚴格的心理測量分析等。在這些條件均滿足的情況下,還應基本保證研究的目的和對象與國內的研究相似。此時,翻譯量表并經過修訂后使用,才是恰當?shù)腫19-20,25]。
4.2 自行設計量表的注意事項
如果現(xiàn)有的量表不能滿足研究的需要,或者研究的目的就在于開發(fā)新的量表,研究人員往往就需要自行設計量表。自行設計量表時需注意以下幾點:
第一,在設計量表之前必須考慮到量表中將要出現(xiàn)哪些需要調查的變量,以及這些相關變量之間的關系;還需考慮如何安排量表中的變量與變量之間的結構[19-20]。典型的量表一般都會包括預測變量、結果變量以及一些調節(jié)變量,均衡地分布這些變量的比重也是十分重要的,一份側重點不均衡的量表往往難以準確地區(qū)分和討論變量之間的相互關系。
第二,應注意所采用量表的尺度。研究者應該根據(jù)具體問題去決定選擇名義的、順序的、等距的或比率量表。
第三,一般都提倡在量表中加入一些反向問題,用于測試受試對象是否認真回答了量表中的問題,提高量表的信度。
第四,在問題設計中,還要注意選擇開放式或封閉式問題:當研究者對某一問題只有粗淺的感性了解,希望得到更多的第一手資料時,適宜選用開放式問題;而封閉式問題則有助于采集系統(tǒng)性的、可以轉化為統(tǒng)計數(shù)據(jù)的信息。當研究者對于某一問題已經有了相當?shù)牧私夂皖A測,希望為預測的關系找到數(shù)理支持時,則選用封閉式問題較為恰當[19-21,25]。
第五,要時刻牢記問題設計中切忌出現(xiàn)雙重含義的詞句和問題,同時也要避免使用誘導性的提問。
4.3 量表信度與效度分析的必要性
如前述及,無論是沿用的量表還是自行設計的量表,特別是其中內容涉及意見態(tài)度的,進行信度和效度分析非常關鍵,可以幫助研究者在正式將量表投入使用之前發(fā)現(xiàn)不合適的項目并及時處理[22-23]。詳細內容請參見相關文獻。
問卷調查法是實證研究中常用的方法,在社會調查研究、醫(yī)學調查研究等眾多領域中均做出了巨大的貢獻。在問卷調查法應用過程中,存在許多方面的因素都在直接或間接影響著調查質量,本文從調查問卷以及量表的設計、關于沿用現(xiàn)有量表或者自行設計新量表的注事項等幾個常見的方面進行了概述,希望能夠幫助從事調查工作的研究者提高調查的質量,充分發(fā)揮問卷調查法的作用,為達到更好的研究效果起到一定的指導和借鑒作用。
[1] 余海濱, 劉青, 余學慶, 等. 調查問卷研制與評價的相關問題初探[J]. 中國藥物經濟學, 2014, 9(2): 193-196.
[2] 楊建華. 問卷的"問題"[J]. 中國統(tǒng)計, 2005(7): 35-36.
[3] 風笑天. 社會學研究方法[M]. 2版. 北京: 中國人民大學出版社, 2005: 279-284.
[4] 肖潔, 卜林, 孫婷妹. 淺析開放式問卷的調查與設計[J]. 內江科技, 2010, 30(1): 50, 154.
[5] 宋軍鋒, 胡淑紅. 淺析問卷調查中的幾個問題[J]. 山西統(tǒng)計, 1995(3): 15-16.
[6] 陳常森. 淺談問卷調查中模糊性問題的處理方法[J]. 價值工程, 2006(7): 38-39.
[7] 戴海琦. 心理測量學[M]. 2版.北京: 高等教育出版社, 2015: 149-142.
[8] 張海鐘. 中國城鄉(xiāng)跨文化心理學與心理測量量表的本土化[J]. 寧夏大學學報(人文社會科學版), 2006, 28(1): 120-122.
[9] 亓玉璐. 心理測量系統(tǒng)的開發(fā)與實現(xiàn)[D]. 昆明: 云南大學, 2014.
[10] 李春波, 何燕玲. 健康狀況調查問卷SF-36的介紹[J]. 國際精神病學雜志, 2002, 29(2): 116-119.
[11] Ware JE. The SF-36 Health Survey: development and use in mental health research and the IQOLA Project[J]. Int J Ment Health, 1994, 23(2): 49-73.
[12] Barnett A. SF-36 Health Survey[M]//Michalos AC. Encyclopedia of quality of life and well-being research, Springer Netherlands, 2014: 5939-5940.
[13] Hildenbr AK, Nicholls EG, Richa A, et al. Symptom Checklist-90-Revised (SCL-90-R)[M]//Cautin RL. The Encyclopedia of Clinical Psychology, New York: John Wiley & Sons, Inc, 2015: 987-1001.
[14] 金華, 吳文源, 張明園. 中國正常人SCL-90評定結果的初步分析[J]. 中國神經精神疾病雜志, 1986, 12(5): 260-263.
[15] 康等銀. 關于調查問卷設計應注意幾個問題的研究[J]. 科技信息, 2009(23): 216, 230.
[16] 馬嵐. 談問卷設計的幾個技巧性原則[J]. 統(tǒng)計教育, 2005(8): 49-50.
[17] 德維利斯. 量表編制 理論與應用[M]. 重慶: 重慶大學出版社, 2010: 976-981.
[18] 秦浩, 陳景武. 量表編制過程中應用因子分析容易忽略的幾個問題[J]. 中國心理衛(wèi)生雜志, 2006, 20(5): 320-321.
[19] 趙必華, 顧海根. 心理量表編制中的若干問題及題解[J]. 心理研究, 2010, 3(4): 29-33.
[20] 崔奇. 設計調查問卷應注意的幾個問題[J]. 統(tǒng)計與咨詢, 2005(6): 44.
[21] 趙斐然, 周天馳, 張俊穎, 等. 量表(問卷)信度、效度評價在我國醫(yī)學領域的應用與展望[J]. 中華中醫(yī)藥雜志, 2014, 29(7): 2280-2283.
[22] 劉學宗, 張建, 于書彥. 關于量表的信度和效度[J]. 首都醫(yī)科大學學報, 2001, 22(4): 314-317.
[23] 張麗. 問卷設計中應注意的幾個問題[J]. 科技經濟市場, 2011(4): 110-111.
[24] 歐靜, 劉芹. 英譯漢語篇翻譯中評分量表的研發(fā)[J]. 中北大學學報(社會科學版), 2011, 27(4): 92-95.
[25] 嚴夢琴, 肖水源, 胡宓. 我國一些抑郁量表的中文翻譯與信效度問題[J]. 中國心理衛(wèi)生雜志, 2016, 30(7): 501-505.
[26] 王俊明. 問卷與量表的編制及分析方法[J]. 國立體育學院學報, 2001(3): 12-13.
Essentialsforthedesignandcompilationofquestionnairesandscalesinasurveystudy
ZhiXinle1,HuLiangping2,3*
(1.DepartmentofHealthStatistics,SchoolofPublicHealth,TianjinMedicalUniversity,Tianjin300070,China;2.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China;3.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)
Questionnaires always play a role of importance in the design and practice of a survey study, and the design procedure must be closely linked to the purpose of the study and adapted to the subject of the survey, and should also strive to achieve a comprehensive system. Questionnaire method is a commonly used one in the field of research work, and has made a great contribution in many fields, such as the social investigation and medical research. In the process of questionnaire survey, there are many factors that directly or indirectly affect the quality of the survey. Thus in this article, we discussed the design of the scale, including the existing scale or designing a new scale. The project indicators in the questionnaire and the skills to develop the scale were discussed, and the reliability and validity of the questionnaire were discussed at the same time. This paper also focused on how to carry out questionnaire preventive analysis and other issues, and summarized how to use or modify the existing scale or designing a new scale.
Survey design; Questionnaire; Scale; Design; Compilation; Reliability; Validity
R195.1
A
10.11886/j.issn.1007-3256.2017.05.003
2017-08-13)
(本文編輯:吳俊林)
國家高技術研究發(fā)展計劃課題資助(2015AA020102)