国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

體育社會科學(xué)研究中問卷調(diào)查法使用的幾個問題

2013-12-06 06:07:17李曼
體育學(xué)刊 2013年5期
關(guān)鍵詞:樣本容量效度信度

李曼

(溫州職業(yè)技術(shù)學(xué)院 公共教學(xué)部,浙江 溫州 325035)

20世紀(jì)80年代出版的美國布萊洛克[1]的《社會統(tǒng)計學(xué)》和北京大學(xué)盧淑華[2]的《社會統(tǒng)計學(xué)》,及之后出版的袁方[3]《社會研究方法教程》和范偉達(dá)[4]《現(xiàn)代社會研究方法》,作為前置限制詞的核心概念都是“社會”,前者對資料收集技術(shù)和統(tǒng)計分析技術(shù)有所側(cè)重,兼顧了研究設(shè)計和研究方法等;而后者則對研究原理、研究程序、研究設(shè)計和研究方法有所側(cè)重,兼顧了資料收集技術(shù)和統(tǒng)計分析技術(shù)。可以說,這兩類著作都是針對社會研究而言的指導(dǎo)性工具書。社會研究(Social research)是個比較寬泛的概念。它既包括社會科學(xué)各學(xué)科的研究,也包括各個社會工作部門的研究。在一般情況下,對這一概念并不作嚴(yán)格的定義[3]20。國內(nèi)出版的《中國大百科全書·社會學(xué)卷》對社會研究做了如下釋義:“社會研究(Social Research)是運(yùn)用科學(xué)方法對社會生活現(xiàn)象加以了解、說明和解釋的一切活動。它是以人類社會為對象,以科學(xué)方法為手段,以解釋和預(yù)測為目的,以科學(xué)理論和方法論為指導(dǎo)的一個完整的過程?!盵5]347社會研究有很多方法,但問卷調(diào)查法是最常用的一種收集資料的方法,特別是在社會調(diào)查中,它的使用更為普遍。因此,美國社會學(xué)家艾爾·巴比稱“問卷是社會調(diào)查的支柱”,英國社會學(xué)家莫澤說“十項(xiàng)社會調(diào)查中就有九項(xiàng)是采用問卷進(jìn)行的”??梢娚鐣芯空邔柧矸ǖ脑u價之高[3]231。改革開放以來,隨著體育事業(yè)的迅速發(fā)展,問卷調(diào)查法作為收集資料的一種重要方法在體育社會科學(xué)研究中得到了廣泛的應(yīng)用,為描述、說明和解釋體育這一社會現(xiàn)象做出了重要貢獻(xiàn)。但在問卷調(diào)查法使用的過程中也出現(xiàn)了一些問題,直接影響到研究結(jié)果的可信度。本研究試圖通過對樣本容量、效度和信度檢驗(yàn)、問卷有效回收率統(tǒng)計等問題的討論,為規(guī)范問卷調(diào)查法的使用,促進(jìn)研究結(jié)果可信度和體育社會科學(xué)研究質(zhì)量的提高提供參考。

1 關(guān)于樣本容量問題

問卷是要發(fā)放給被調(diào)查者的,發(fā)放給哪些被調(diào)查者,發(fā)放多少,這就涉及到抽樣和樣本容量的問題。為此,“抽樣—問卷—定量分析三者的結(jié)合體,是現(xiàn)代社會學(xué)定量研究中最常見,也是最重要的一種方式”[3]266。也就是說,問卷調(diào)查必須與科學(xué)的抽樣技術(shù)相結(jié)合才能得到可靠的研究結(jié)果。體育社會科學(xué)的研究亦不例外。但是,這一點(diǎn)并沒有引起研究者的足夠重視,特別是對樣本容量的確定隨意性很大,許多研究都沒有按照社會統(tǒng)計學(xué)的要求去確定樣本容量,甚至120人或180人也要去代表具有相當(dāng)規(guī)模的研究總體,例如某項(xiàng)關(guān)于廣州市居民亞運(yùn)會影響感知的研究中,以天河、越秀、海珠、番禺等4個區(qū)隨機(jī)發(fā)放問卷180份(回收有效問卷 151份)作為調(diào)查樣本。實(shí)際上,廣州市2010年第六次全國人口普查主要數(shù)據(jù)公報披露的天河區(qū)常住人口為1 432 431人、海珠區(qū)為1 558 663人、越秀區(qū)為1 157 277人、番禺區(qū)為1 764 869人,合計為5 913 240人。相對于590多萬人,180個樣本有代表性嗎?例如某項(xiàng)關(guān)于某省成年女性身體素質(zhì)現(xiàn)狀及體育行為特征的研究,從24個地市(縣)中抽取23 088人作為調(diào)查對象。那么是不是樣本越多,其代表性就好呢?

樣本容量又稱樣本大小、樣本規(guī)模,指的是樣本內(nèi)所含個體數(shù)量的多少。樣本容量的確定是抽樣設(shè)計的最重要的內(nèi)容之一[3]224。確定樣本容量,首先,要確定樣本的精確度(置信區(qū)間)和置信水平(置信度)。樣本精確度(置信區(qū)間)表示允許誤差的范圍,社會學(xué)研究允許誤差的范圍為1%~7%;置信水平(置信度)則表示對研究結(jié)論正確性的把握程度,社會學(xué)研究設(shè)置了兩個置信水平,即95%和99%。其次,要清楚樣本容量和總體的關(guān)系。樣本容量和總體二者不是直接關(guān)系,而是緩慢的曲線關(guān)系。范偉達(dá)[4]210給出了不同總體規(guī)模所需的樣本數(shù)量,可供確定樣本容量時參考。

根據(jù)范偉達(dá)確定樣本量的方法,在置信水平(置信度)為95%,置信區(qū)間(精確度)為±3%,總體異質(zhì)性較大的條件下,1 000人的總體需要350人的樣本,10 000人的總體需要600人的樣本,而100 000人的總體只需要680人的樣本,當(dāng)總體為500 000人的時候,樣本量只增至700人??梢姡瑯颖玖坎⒎请S著總體的增加而相應(yīng)增加,也不是樣本越大越能代表總體,如美國民意測驗(yàn)的樣本數(shù)一般在1 600~2 000人,最多不超過3 000人[3]225-228,中國十大社會階層調(diào)查樣本為6 240人[6]363。社會學(xué)家風(fēng)笑天[7]指出,在 95%的置信度下按抽樣絕對誤差不超過 3%的要求進(jìn)行計算,需要抽取樣本量:n=ua2p(1-p)/d2=1.962×0.25÷0.032=1 067(d 為抽樣絕對誤差取0.03,ua在置信度為0.95時為1.96,p(1-p)最大取 0.25)。在采用多階段的復(fù)雜抽樣時,設(shè)計效應(yīng)(deff)一般會在2和2.5之間。假如我們要將某一大城市接近1 000萬人的戶籍人口作為研究總體,而且需要采用多階段的復(fù)雜抽樣,則可將設(shè)計效應(yīng)(deff)確定為 2,設(shè)計效應(yīng)和按公式計算出的樣本量是倍數(shù)關(guān)系,即1 067×2=2 134。這樣,即可初步確定對該大城市市民調(diào)查的樣本容量是2 134人。考慮到可能會有20%的被調(diào)查者或拒訪、或無回答等的情況,故實(shí)際調(diào)查所用的樣本量應(yīng)為2 134÷80%=2 668人。唐盛明[8]154-155指出:當(dāng)總體為1 000萬或1 000萬以上的時候,樣本比例的增加實(shí)際上不產(chǎn)生作用。除非有特殊的要求,樣本的數(shù)目一般無需超過2 500人。

2 關(guān)于問卷的效度和信度檢驗(yàn)問題

問卷是由圍繞某一主題的相互關(guān)聯(lián)的測量指標(biāo)組成的測量社會現(xiàn)象的測量工具。任何一項(xiàng)將要使用問卷調(diào)查法的社會研究,在遵循社會研究的規(guī)范(原則)完成問卷設(shè)計之后,都面臨著該問卷的效度和信度問題,即有效性和可靠性的問題。使用未經(jīng)效度和信度檢驗(yàn)或未能正確進(jìn)行效度和信度檢驗(yàn)的問卷,將會使研究結(jié)果的有效性和可靠性大打折扣。范偉達(dá)[4]130指出:“效度是指用測量工具測出變量的準(zhǔn)確程度,即準(zhǔn)確性?!币簿褪钦f:“在用指標(biāo)去量度體育這一社會現(xiàn)象時,有一個該指標(biāo)能否反映測量目標(biāo)與測量結(jié)果的一致性問題?!盵9]36一般效度檢驗(yàn)的方法有內(nèi)容效度、準(zhǔn)則效度(亦稱效標(biāo)效度與統(tǒng)計效度)、建構(gòu)效度(亦稱理論效度)和因素分析效度等,最常用的是內(nèi)容效度。信度是指作為測量工具的問卷的穩(wěn)定性與可靠性問題。“所謂信度是指測量數(shù)據(jù)(資料)與結(jié)論的可靠性程度,即測量工具能否穩(wěn)定地測量到它要測量的事項(xiàng)的程度”[3]187?!皽y量的信度通常以相關(guān)系數(shù)來表示。由于測量分?jǐn)?shù)的誤差變異之來源有所不同,各種信度系數(shù)分別說明信度的不同層面而具有不同的意義”[4]134。

2.1 被忽略的效度與信度檢驗(yàn)

在體育社會科學(xué)研究中,只要使用了問卷調(diào)查法,都應(yīng)該對其效度和信度檢驗(yàn)做出必要的說明。然而,也不乏有被研究者忽略的。例一:某作者關(guān)于潛優(yōu)勢射箭項(xiàng)目青少年訓(xùn)練問題的研究,使用了問卷調(diào)查法,并將回收的問卷數(shù)據(jù)利用SPSS軟件進(jìn)行了統(tǒng)計處理,但卻沒有交代問卷的效度與信度檢驗(yàn)。為此,其數(shù)據(jù)結(jié)果的有效性和可靠性令人生疑。例二:某作者關(guān)于體育教師績效考核指標(biāo)體系的研究,使用了問卷調(diào)查法,說明了回收率和有效回收率,但無問卷效度與信度檢驗(yàn)的說明。例三:某作者關(guān)于高師體育教育專業(yè)某門課程學(xué)習(xí)評價方法的研究,使用了問卷調(diào)查法,也沒有說明是如何進(jìn)行效度與信度檢驗(yàn)的。例四,某作者關(guān)于某省鄉(xiāng)鎮(zhèn)社區(qū)體育的調(diào)查研究,在139個區(qū)、縣、市中獲得調(diào)查問卷1 594份,但也沒有說明問卷的效度與信度檢驗(yàn)。

2.2 結(jié)構(gòu)效度與內(nèi)容效度孰是孰非

在一次旁聽某大學(xué)體育學(xué)碩士論文答辯時,有專家在答辯人(體育社會科學(xué)的論文,非心理學(xué)研究)已經(jīng)說明對問卷進(jìn)行了內(nèi)容效度檢驗(yàn)的情況下,提出了還應(yīng)該進(jìn)行問卷結(jié)構(gòu)效度檢驗(yàn)的質(zhì)疑。我當(dāng)時的理解是,問卷的內(nèi)容效度是指問卷的有效性,結(jié)構(gòu)效度無非就是指問卷設(shè)計的結(jié)構(gòu)是否合理。后來,看到多數(shù)體育社會科學(xué)(非心理學(xué)研究)的文章在運(yùn)用問卷調(diào)查法時,大多使用內(nèi)容效度評價,但也有采用結(jié)構(gòu)效度評價的。例如,某作者關(guān)于某省學(xué)校體育現(xiàn)狀調(diào)查與發(fā)展對策的研究,沒有對問卷進(jìn)行內(nèi)容效度檢驗(yàn),而是請專家對問卷進(jìn)行了結(jié)構(gòu)效度檢驗(yàn),但文中并未說明該“結(jié)構(gòu)效度”指的是什么。正是帶著這樣的問題本人開始學(xué)習(xí)了解問卷的結(jié)構(gòu)效度和內(nèi)容效度,并有了一個初步的認(rèn)識。百度百科對結(jié)構(gòu)效度的定義是:“結(jié)構(gòu)效度是指一個測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說它是指測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度;是指實(shí)驗(yàn)與理論之間的一致性,即實(shí)驗(yàn)是否真正測量到假設(shè)(構(gòu)造)的理論。”[10]結(jié)構(gòu)效度的概念最初是由美國心理學(xué)會(APA)、美國教育研究協(xié)會(AERA)和美國國家教育測量協(xié)會(NCME)(1954)聯(lián)合委員會提出,發(fā)表于《心理測驗(yàn)和診斷技術(shù)的技術(shù)建議》。此后,在半個世紀(jì)的發(fā)展中,結(jié)構(gòu)效度的定義經(jīng)歷了許多微妙的變化。結(jié)構(gòu)效度(Construct Validity)亦稱(構(gòu)念效度)。結(jié)構(gòu)是個心理學(xué)概念(或稱構(gòu)念),是對某種不能被測量而且不能直接觀察到的人類行為所做的理論定義。例如,智力、成就動機(jī)、緊張、成績、態(tài)度和閱讀理解等等。換言之,結(jié)構(gòu)是一個人潛在的心理屬性,是不能直接被觀察和測量的一種或一組能力,但是能夠通過測試成績做出推斷[6]。在實(shí)踐中,結(jié)構(gòu)效度多用于心理學(xué)的研究或是考試(教育測量)。傳統(tǒng)的結(jié)構(gòu)效度檢驗(yàn)是實(shí)驗(yàn)或考試結(jié)束后的實(shí)證研究。到目前為止,盡管對試前和實(shí)驗(yàn)實(shí)施階段的理論驗(yàn)證已經(jīng)引起了學(xué)者們的重視,但多數(shù)的結(jié)構(gòu)效度驗(yàn)證仍然是在實(shí)驗(yàn)或考試后的實(shí)證研究。這一點(diǎn)與社會研究對內(nèi)容效度檢驗(yàn)的要求有很大的不同,內(nèi)容效度檢驗(yàn)要求在前,而不是事后的測試。要檢查問卷內(nèi)容是否能達(dá)到測量目的與測量結(jié)果的一致性,即是否有效,只能依靠多數(shù)專家的共同意見。因此,至少目前在體育社會科學(xué)研究的問卷調(diào)查法使用中(心理學(xué)研究除外)是可以忽略結(jié)構(gòu)效度的。

2.3 重測(再測)信度是指全部還是局部

社會科學(xué)研究中常用的信度檢驗(yàn)方法有重測信度(亦稱再測信度)、復(fù)本信度、折半信度等。通過查閱期刊論文和博士碩士論文可知,重測信度在體育社會科學(xué)研究的問卷調(diào)查法使用中得到了最廣泛的應(yīng)用。重測(再測)信度是指用同一份問卷,對同一被測群體前后調(diào)查兩次,再根據(jù)調(diào)查結(jié)果計算(第1次X和第2次Y)的相關(guān)系數(shù)。但在現(xiàn)實(shí)研究中,常常遇到的問題是,利用重測(再測)法進(jìn)行信度檢驗(yàn)的第 2次調(diào)查(重測)是針對全部被調(diào)查對象,還是部分被調(diào)查對象的問題。而許多研究恰恰回避了這一問題,即在使用重測(再測)法進(jìn)行信度檢驗(yàn)時,沒有說明進(jìn)行第 2次問卷調(diào)查時,是針對全體被調(diào)查對象,還是只針對部分被調(diào)查對象。此類事例較多,這里簡舉3例:例一,某作者關(guān)于某省城市老年人體育生活方式的社會學(xué)分析一文,使用了問卷調(diào)查法,發(fā)放問卷600份,其信度檢驗(yàn)用的是再測法,信度系數(shù)R=0.82(P<0.05),但沒有交代兩次調(diào)查的時間間隔以及第2次調(diào)查的發(fā)放對象是全部還是部分。例二,某作者關(guān)于從某城市體育人口的性別結(jié)構(gòu)透視其婦女體育開展的研究,發(fā)放問卷3 000份,采用再測法,間隔1個月,用同樣問卷分別進(jìn)行2次測試,相關(guān)系數(shù)R=0.85。但沒有具體說明第2次測試是針對3 000人,還是針對部分人。

重測(再測)信度一般要求對被測群體全體成員前后進(jìn)行兩次調(diào)查。雖然《社會研究方法》或《社會統(tǒng)計學(xué)》的書中并沒有給出使用重測(再測)法進(jìn)行第 2次問卷調(diào)查時可以選取部分被調(diào)查對象,但有時因?yàn)闃颖玖枯^大或很大,一些研究者在第2次調(diào)查時,只隨機(jī)抽取部分被調(diào)查對象。這種做法雖然亦可接受,但必須注意避免操作上的誤區(qū)。例如,第2次調(diào)查隨機(jī)抽取了50名被測群體成員,然后再從第1次調(diào)查被測群體全體成員中隨機(jī)抽取50名成員,根據(jù)其兩次問卷填寫的結(jié)果計算其相關(guān)系數(shù),就陷入了誤區(qū)。因?yàn)闊o法保證這 50名成員中的每個成員都是自己前后填寫的兩份問卷,其中有不少是“張冠李戴”的,無法測量出真實(shí)的問卷信度。正確做法的關(guān)鍵是第1次向被測群體全體成員發(fā)放的問卷一定要編號。第2次隨機(jī)抽取的50名被測群體成員的問卷也要編號,假如第2次隨機(jī)抽取的50名成員為51~100號,則應(yīng)是51Y、52Y、53Y、54Y……100Y。問卷回收以后,將第1次回收的問卷為X,第2次回收的問卷為Y,從而形成51X-51Y、52X-52Y、53X-53Y……100X-100Y兩組相對應(yīng)的問卷。由于多數(shù)問卷都是由圍繞主題的相互關(guān)聯(lián)的問題組成的,還必須將其轉(zhuǎn)換成數(shù)量關(guān)系方能計算其相關(guān)系數(shù)。一般可采用對封閉式答案賦值的辦法,以被測成員51號為例,在其第1份問卷中可以得到若干X的分值,在其第2份問卷中可以得到若干Y的分值,總加之后則得到∑X與∑Y兩個分值。

3 關(guān)于問卷有效回收率統(tǒng)計問題

問卷的有效回收率統(tǒng)計是使用問卷調(diào)查法的重要一環(huán)。但有的文章在統(tǒng)計問卷的有效回收率時存在錯誤。例如,某作者關(guān)于優(yōu)秀運(yùn)動員退役原因的研究,該文在其調(diào)查過程中寫到:“問卷共發(fā)放560份,回收541份,回收率 96.6%,有效回收率 100%”。這里必須強(qiáng)調(diào)的是,有效率可以和回收率相等,但有效率高于回收率則有悖常識。盧淑華[2]562強(qiáng)調(diào)指出:“發(fā)放的問卷數(shù)應(yīng)不少于樣本的容量,但在任何情況下都應(yīng)該以發(fā)放的問卷份數(shù)作為分母,而不是樣本容量。回收率(筆者代注:指有效回收率)不得少于 70%,否則將嚴(yán)重破壞隨機(jī)抽樣的原則?!睋?jù)此,“在任何情況下都應(yīng)該以發(fā)放的問卷份數(shù)作為分母”的情況下,該問卷的有效回收率也應(yīng)該是96.6%,而不是100%。也就是說,100%有效只是相對回收的541份問卷全部有效而言,但整個問卷的有效回收率是以發(fā)放的問卷份數(shù)作為分母,以回收的有效問卷數(shù)作為分子來計算的(541/560),因此該問卷的有效回收率也應(yīng)該是96.6%。

再如,某作者關(guān)于體育賽事影響的論文在問卷發(fā)放與回收中寫到:“共計發(fā)放問卷1 084份,回收問卷921份,回收率為84.96%,其中有效問卷784份,有效回收率為 85.12%”。有效回收率高于回收率。此例中統(tǒng)計的錯誤在于,統(tǒng)計有效回收率時沒有將發(fā)放問卷數(shù)作為分母,而是將回收問卷數(shù)作為分母,從而導(dǎo)致有效回收率(85.12%)比回收率(84.96%)還高。此例中統(tǒng)計的正確結(jié)果應(yīng)該是有效回收率72.32%。

[1] 布萊洛克. 社會統(tǒng)計學(xué)[M]. 傅正元等,譯. 北京:中國社會科學(xué)出版社,1988.

[2] 盧淑華. 社會統(tǒng)計學(xué)[M]. 北京:北京大學(xué)出版社,1989.

[3] 袁方,王漢生. 社會研究方法教程[M]. 北京:北京大學(xué)出版社,1997.

[4] 范偉達(dá). 現(xiàn)代社會研究方法[M]. 上海:復(fù)旦大學(xué)出版社,2001.

[5] 中國大百科全書總編輯委員會. 中國大百科全書·社會學(xué)卷[M]. 北京:中國大百科全書出版社,1991.

[6] 陸學(xué)藝. 當(dāng)代中國社會流動[M]. 北京:社會科學(xué)文獻(xiàn)出版社,2004.

[7] 風(fēng)笑天. 再談樣本規(guī)模和調(diào)查回收率[J]. 社會學(xué)研究,2007(6):195-212.

[8] 唐盛明. 社會科學(xué)研究方法新解[M]. 上海:上海社會科學(xué)院出版社,2003.

[9] 呂樹庭,楊霆,車建平. 體育社會測量方法[M]. 廣州:廣東高等教育出版社,1998.

[10] 百度百科 結(jié)構(gòu)效度. [EB/OL]. http://baike. baidu.com/view/1350460.htm.

猜你喜歡
樣本容量效度信度
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
采用無核密度儀檢測壓實(shí)度的樣本容量確定方法
慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
科技成果評價的信度分析及模型優(yōu)化
體育社會調(diào)查問卷信度檢驗(yàn)的方法學(xué)探索——基于中文核心體育期刊163篇文章分析
被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
外語形成性評估的效度驗(yàn)證框架
中文版腦性癱瘓兒童生活質(zhì)量問卷的信度
廣義高斯分布參數(shù)估值與樣本容量關(guān)系
測繪通報(2013年2期)2013-12-11 07:27:44
多種檢測目標(biāo)下樣本容量設(shè)計的比較
昆山市| 丹东市| 临夏市| 石楼县| 阜宁县| 方山县| 通州区| 元阳县| 武威市| 皮山县| 资兴市| 香港| 洛南县| 海晏县| 福州市| 平舆县| 绥阳县| 西乌| 闽侯县| 抚顺县| 嘉荫县| 扎兰屯市| 安达市| 迁安市| 清涧县| 武冈市| 通江县| 汝城县| 秦皇岛市| 陇西县| 开封县| 石河子市| 乡城县| 文山县| 阿城市| 六枝特区| 永修县| 商河县| 临朐县| 池州市| 吴江市|