陳新林 侯政昆 林岳卿 周倩儀 胡 月 劉鳳斌△
應(yīng)用RUMM 2030軟件實(shí)施條目反應(yīng)理論*
陳新林1侯政昆2林岳卿3周倩儀2胡 月1劉鳳斌2△
條目反應(yīng)理論(item response theory,IRT),也稱為項(xiàng)目反應(yīng)理論,受到越來越多的關(guān)注,廣泛應(yīng)用于智力、心理量表、考試系統(tǒng)等潛變量的測量。最近幾年,在量表的研制中,條目反應(yīng)理論逐漸應(yīng)用于條目的評價(jià)和選擇[1-3]。如Liu等研制適合中醫(yī)療效評價(jià)的重癥肌無力量表[4-5],陳新林等研發(fā)鼻咽癌患者生存質(zhì)量量表[6],董麗敏等用于評價(jià)哮喘患者PRO量表[7],林岳卿研制世界衛(wèi)生組織生存質(zhì)量老年人量表簡化版[8]。陳炳為等將條目反應(yīng)理論應(yīng)用于肝陽上亢證中醫(yī)證候中[9],日本學(xué)者Tomura等用條目反應(yīng)理論研究基于中醫(yī)理論的五臟得分量表(five viscera score)[10],均取得了良好的效果。
但是IRT理論建立在復(fù)雜的數(shù)學(xué)模型之上,計(jì)算困難,難以實(shí)現(xiàn),影響了它的普及。IRT的分析一般要采用專用的軟件,如RUMM、Bilog、Multilog、Testfact、Parscale、Winsteps和ConQuest等,或采用R、Winbugs等軟件編寫程序。RUMM(rasch unidimensionalmeasurementmodel)是由Andrich,Sheridan和Luo共同研發(fā),現(xiàn)在更新到RUMM 2030版本。網(wǎng)址為www.rumm lab.com。RUMM采用二分類Rasch模型(rasch model)和多分類Rasch模型(polytomous rasch model)[11-12]。RUMM采用條件成對估計(jì)法(conditional pairw ise estimation)估計(jì)參數(shù)[13];該方法通過對主分量參數(shù)的估計(jì)而計(jì)算出條目的閾值參數(shù)(threshold parameters);通過充分統(tǒng)計(jì)量將個(gè)人能力參數(shù)消去,從而獲得條目參數(shù)的相合估計(jì)。另外,RUMM界面清晰、功能強(qiáng)大,被譽(yù)為Rasch模型的最完善的分析軟件。本文主要介紹如何使用RUMM 2030。
1.RUMM 2030主頁面的菜單包括File、Edit、Analysis、Facilities、Screen area和Help。右下角有5個(gè)按鈕,New(新建項(xiàng)目),Open(打開項(xiàng)目),Exit(退出軟件),Use project Items(使用項(xiàng)目的條目),Import itemestim(導(dǎo)入條目估計(jì)模板文件)。
2.新建項(xiàng)目和導(dǎo)入數(shù)據(jù):點(diǎn)擊右下角的“New”,或點(diǎn)擊“file”下的新建項(xiàng)目(Create new project),輸入新建項(xiàng)目的名字,這里命名為“Rumm”。
導(dǎo)入數(shù)據(jù)的格式(后綴名)為dat、txt或prn。本例是鼻咽癌患者生存質(zhì)量量表的數(shù)據(jù),前3列是id,緊跟4列是人口學(xué)資料,后面27列是條目得分。條目是五分類Likert量表,用1、2、3、4和5表示,缺失值用空缺表示。導(dǎo)入數(shù)據(jù)后見圖1。
圖1 導(dǎo)入數(shù)據(jù)
3.確定設(shè)計(jì)方式,導(dǎo)入數(shù)據(jù)需要考慮兩個(gè)方面:①個(gè)人設(shè)計(jì)(person design),考慮ID號和人口學(xué)基本資料。本例兩者都存在,因此選擇“Person ID and person DESIGN”。②條目設(shè)計(jì)(item design),考慮條目的設(shè)計(jì)方式。條目設(shè)計(jì)有三種:單個(gè)因素(single factor),只考慮閾值參數(shù),且只有一個(gè)評價(jià)者;兩個(gè)因素(two factors),每個(gè)條目包括兩個(gè)參數(shù)(閾值參數(shù)和區(qū)分度參數(shù))、或每個(gè)條目有兩個(gè)評價(jià)者;三個(gè)因素(three factors)。本例選擇單個(gè)因素。將資料的前3列錄入為ID;后面4列依次錄入為性別、年齡、慢性?。╫therdisea)、放療階段(radiostage)。
4.定義條目屬性。最后27列數(shù)據(jù)錄入為條目。本例是5分類條目,因此在“Type”中選擇“Poly”,在缺失值(M iss)中選擇空格(bsp)。以第一個(gè)條目說明如何定義條目屬性,名稱(Code)為默認(rèn)的“I0001”,描述(Descript)為默認(rèn)的“Descriptor for Item 1”,在“No.of response categories”中輸入5,在“Response”下面的表格依次輸入1到5,其右邊的Score分別對應(yīng)0到4,表示該條目是正向條目(得分越高表示生存質(zhì)量越好);如果是反向條目,則點(diǎn)擊右邊的“Reverse score item”選項(xiàng)。所有條目跟第一個(gè)條目一樣,點(diǎn)擊“Repeat all”。
5.建立分析數(shù)據(jù)。首先建立整個(gè)量表的分析文件,命名為“alldata”(analysis name),點(diǎn)擊Continue analysis就生成了“alldata”的分析數(shù)據(jù)集。
IRT要滿足單維性的要求,要求對每個(gè)維度獨(dú)立進(jìn)行分析。本例選擇生理領(lǐng)域的數(shù)據(jù)(前面9個(gè)條目)進(jìn)行分析。點(diǎn)擊“Analysis Options”選項(xiàng)框中的“Create NEW analysis”,“Modification for New Analysis”選項(xiàng)框中的“Analysis Base——Delete items”,點(diǎn)擊右下角的“Create NEW analysis”,在“Analysis name”中輸入“PHdomain”。進(jìn)入到刪除條目的頁面(Deleting items for analysis name,見圖2),把條目10到條目27刪除,生成了PHdomain數(shù)據(jù)集。
圖2 PHdomain數(shù)據(jù)集包含的條目
圖3是RUMM 2030軟件的IRT分析頁面。主要包括條目參數(shù)(item parameter details),擬合度(Testof-fit details),格特曼模式(Guttman pattern),條目分類(Item categorisation),條目特征(Item characteristics)和進(jìn)一步結(jié)果(Further outputs)等。條目參數(shù)包括閾值參數(shù)(Thresholds)、分類頻數(shù)(Category frequencies)、主成分(Principal components)和充分統(tǒng)計(jì)量(Sufficient statistics)。擬合度包括匯總統(tǒng)計(jì)量(Summary statistics)、條目擬合度(Individual item fit)、個(gè)體擬合度(Individual person fit)、殘差相關(guān)(Residual correlations)和殘差主成分(Residual principal components)。條目特征包括分類概率曲線(Category probability curves)、條目特征曲線(Item characteristics curves,ICC)和閾值概率曲線(Thresholds probability curves)。進(jìn)一步結(jié)果包括個(gè)體-條目分布圖(Personitem distribution)、閾值圖(Threshold map)、條目圖(I-tem map)、平衡檢驗(yàn)(equating tests/t-tests)和殘差統(tǒng)計(jì)量分布(Residual statistics distribution)。雙擊每個(gè)選項(xiàng)框可以顯示結(jié)果。下面主要介紹一下幾個(gè)常用的分析。
圖3 顯示PHdomain的IRT分析頁面
圖4 顯示了閾值參數(shù),Display threshold std errors顯示閾值的標(biāo)準(zhǔn)誤,Centralised thresholds顯示中心化處理的閾值(即所有閾值相加等于0)。本例條目是五分類資料,因此都有四個(gè)閾值(CenThr)。本例所有條目的閾值都從小到大依次遞增,不存在閾值顛倒的條目。
圖4 閾值參數(shù)的結(jié)果
圖5 匯總統(tǒng)計(jì)量的結(jié)果
圖5 顯示了匯總統(tǒng)計(jì)量。匯總統(tǒng)計(jì)量包括條目-個(gè)體結(jié)果(Item-person interaction)、條目-特征結(jié)果(I-tem-trait interaction)、信度指數(shù)(Reliability indices)和擬合度總評價(jià)(Power of analysis of fit)。條目-個(gè)體結(jié)果包括條目參數(shù)估計(jì)值(Location)和殘差(Fit residual),個(gè)體能力估計(jì)值和殘差。本例條目參數(shù)估計(jì)值的均數(shù)為0,個(gè)體能力估計(jì)值的均數(shù)為0.7726,說明這些研究對象的能力較高;信度指數(shù)等于0.886,整個(gè)擬合效果為完美。
圖6顯示了條目閾值估計(jì)值?!癓ocation”表示條目閾值,是四個(gè)閾值的平均得分,“SE”是其對應(yīng)的標(biāo)準(zhǔn)誤;“FitResid”表示條目殘差擬合度,該數(shù)值在-2.5到2.5之間,則說明條目擬合度較好?!癈hiSq”是卡方值,“Prob”為P值,如果P值小于0.05/條目數(shù),說明條目的擬合度較差。
圖6 條目擬合度的結(jié)果
圖7 個(gè)體擬合度的結(jié)果
圖7 顯示了個(gè)體能力估計(jì)值(潛在特質(zhì)),即表格里的Location。圖8顯示了分類概率曲線,圖形中實(shí)線表示分類概率曲線,虛線(曲線)表示閾值概率曲線。圖9顯示了所有對象及不同性別人群的ICC。右上角給出了不同性別的DIF(Differential item function)結(jié)果;右下角的“DIF summary”按鈕,點(diǎn)擊可顯示所有條目的DIF結(jié)果。
圖8 分類概率曲線的結(jié)果
圖9 條目特征曲線的結(jié)果
圖10 個(gè)體-條目分布的結(jié)果
圖10 顯示了個(gè)體-條目分布圖,上圖是個(gè)體能力估計(jì)值(圖7的Location)的頻數(shù)分布圖,從圖形可知,其基本服從正態(tài)分布,均數(shù)為0.773,標(biāo)準(zhǔn)差為1.497。下圖是條目閾值參數(shù)的頻數(shù)分布圖。
RUMM 2030軟件簡單、易學(xué),是實(shí)現(xiàn)復(fù)雜的IRT理論的有力工具。RUMM采用Visual basic語言編寫。它吸收最新理論成果,根據(jù)用戶的需求和建議,不斷改進(jìn),增加軟件的適用性。RUMM 2030的使用介紹鮮有報(bào)告,希望本文可以讓RUMM 2030軟件得到更廣泛的應(yīng)用,有助于IRT理論的推廣。
[1]呂靜,薛江平,羅艷虹,等.慢性心衰PRO量表?xiàng)l目的初步篩選.中國衛(wèi)生統(tǒng)計(jì),2014,31(3):379-382.
[2]曹尚,曹榮祥,孫昕霙,等.項(xiàng)目反應(yīng)理論在居民健康素養(yǎng)標(biāo)準(zhǔn)參照測驗(yàn)中的應(yīng)用研究.中國衛(wèi)生統(tǒng)計(jì),2016,33(1):31-34.
[3]付蓉,蘇少飛,包含,等.基于項(xiàng)目反應(yīng)理論的治療質(zhì)量綜合評價(jià)最適樣本量的模擬研究.中國衛(wèi)生統(tǒng)計(jì),2015,32(5):762-765.
[4]Liu FB,Chen XL,Guo L,et al.Evaluation of a scale of patient-reported outcomes for the assessment of myasthenia gravis patients in China.Chin J Integr Med,2012,18(10):737-745.
[5]陳新林,劉鳳斌,郭麗,等.重癥肌無力患者報(bào)告結(jié)局指標(biāo)量表的研制——計(jì)量心理學(xué)測評.中西醫(yī)結(jié)合學(xué)報(bào),2010,(2):121-125.
[6]陳新林,古模發(fā),何偉玲,等.條目反應(yīng)理論對鼻咽癌患者生存質(zhì)量量表的評價(jià).中華腫瘤防治雜志,2013,(18):1380-1384.
[7]董麗敏,劉曉英,張巖波.哮喘患者報(bào)告臨床結(jié)局量表的研制和條目篩選.中國藥物與臨床,2012,(7):873-875.
[8]林岳卿,方積乾.多維IRT與單維IRT在多維量表中應(yīng)用的差異.中國衛(wèi)生統(tǒng)計(jì),2011,(3):226-228.
[9]陳炳為,許碧云,陳啟光,等.兩分類項(xiàng)目反應(yīng)理論在中醫(yī)證候中的應(yīng)用.中國衛(wèi)生統(tǒng)計(jì),2011,28(1):16-18,21.
[10]Tomura T,Yoshimasu K,F(xiàn)ukumoto J,etal.Validity of a diagnostic scale for acupuncture:application of the item response theory to the five viscera score.Evid Based Complement Alternat Med,2013:928089.
[11]Andrich D.A rating formulation for ordered response categories.Psychometrika,1978,4(43):561-573.
[12]Andrich D,Lyne A,Sheridan B,et al.Rumm 2030.Perth:RUMM Laboratory,2009.
[13]Andrich D,Luo G.Conditional pairwise estimation in the Raschmodel for ordered response categories using principal components.JAppl Meas,2003,4(3):205-221.
(責(zé)任編輯:劉 壯)
國家自然科學(xué)基金課題(81403296),廣東省高等學(xué)校優(yōu)秀青年教師項(xiàng)目(YQ2015041),廣州中醫(yī)藥大學(xué)“青年英才培養(yǎng)工程”基金項(xiàng)目(QNYC20140101)
1.廣州中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院(510006)
2.廣州中醫(yī)藥大學(xué)第一附屬醫(yī)院
3.廣東省工傷康復(fù)中心
△通信作者:劉鳳斌,E-mail:liufb163@163.com