杜彩鳳,趙 勇,任劍峰,陳燕清,劉宏奇,趙延龍,梁文靜
(1.山西中醫(yī)學(xué)院,山西 太原 030024; 2.山西中醫(yī)學(xué)院附屬醫(yī)院,山西 太原 030024)
中醫(yī)證候量表條目篩選中常用的統(tǒng)計學(xué)方法研究進(jìn)展
Study advancement on commonly used tatistics methods in item selection of TCM syndrome scale
杜彩鳳1,趙 勇1,任劍峰1,陳燕清1,劉宏奇2,趙延龍1,梁文靜1
(1.山西中醫(yī)學(xué)院,山西 太原 030024; 2.山西中醫(yī)學(xué)院附屬醫(yī)院,山西 太原 030024)
近年來,在中醫(yī)研究領(lǐng)域逐步開始探索運用量表學(xué)方法解決有關(guān)證候診斷、療效評價等諸多問題,并編制符合中醫(yī)傳統(tǒng)理論及臨床適用性較好的證候量表,在此過程中條目的篩選是關(guān)鍵性問題。由于數(shù)據(jù)源不同,所基于的分析評價理論不同,故選用的統(tǒng)計學(xué)方法也有一定的差異。在分析數(shù)據(jù)源的基礎(chǔ)上,系統(tǒng)總結(jié)基于經(jīng)典測量理論、概化理論及項目反應(yīng)理論所涉及的常用統(tǒng)計分析方法,以期為量表的編制提供一定的技術(shù)支持。
量表條目篩選;經(jīng)典測量;概化理論;理論項目;反應(yīng)理論
量表(scale),是一種測量工具,是由反映某一抽象概念的所有測量指標(biāo)和備選答案構(gòu)成的標(biāo)準(zhǔn)化測定表格,用于測量研究對象的某種狀態(tài)、行為或態(tài)度[1]。量化診斷標(biāo)準(zhǔn)是中醫(yī)證候標(biāo)準(zhǔn)化研究的一個方向,其核心是用數(shù)值說話,由多個條目構(gòu)成一個復(fù)合分?jǐn)?shù),來揭示不宜用直接方法測量的理論變量[2]。證候量表的編制要在符合中醫(yī)傳統(tǒng)理論的基礎(chǔ)上,盡可能遵循全面性、科學(xué)性、重要性、敏感性、獨立性、代表性、可操作性、目的性等原則,并使用簡潔明了的文字加以表述。其中,在量表編制的諸多環(huán)節(jié)中,條目篩選是關(guān)鍵性問題之一。
1.1 文獻(xiàn)數(shù)據(jù)源
古往今來,許多醫(yī)家畢生的研究成果多以文獻(xiàn)的形式保留下來,其中關(guān)于“證”的記載,內(nèi)容豐富、資料繁多。在對古今“證”相關(guān)文獻(xiàn)資料進(jìn)行系統(tǒng)搜集、挖掘整理和闡述評價的基礎(chǔ)上,從中選取與本研究病證相關(guān)的信息,作為量表條目池的重要來源,是中醫(yī)證候量表編制的重要方法。如金洵等[3]以“便秘”為關(guān)鍵詞查閱1999年-2009年中國知識資源總庫(CNKI)和PubMed上的相關(guān)文獻(xiàn),查閱《結(jié)腸與直腸外科學(xué)》、《Constipation》等書籍的相關(guān)章節(jié),查閱患者報告臨床結(jié)局和生存質(zhì)量測評工具數(shù)據(jù)庫中關(guān)于便秘的量表,結(jié)合訪談法,形成慢性便秘報告臨床結(jié)局評估量表最初的條目池。唐斌擎等[4]以“感冒后咳嗽”、“感染后咳嗽”等作為關(guān)鍵詞,檢索1999年-2008年中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫等電子期刊數(shù)據(jù)庫,并補(bǔ)充查閱行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)以及教材其他相關(guān)資料,收集相關(guān)癥狀名詞,經(jīng)整理形成量表的備選條目。
1.2 專家咨詢數(shù)據(jù)源
在中醫(yī)證候量表理論框架構(gòu)建過程中,專家咨詢是量表條目初步形成的重要方法。其中,德爾菲法采用匿名的方式,輪番征詢專家意見,并反復(fù)多次完成信息的反饋與修正,最終使專家的意見逐步趨向一致,從而對評價對象做出評價的一種定量與定性相結(jié)合的集體經(jīng)驗判斷的預(yù)測、評價方法[5]。劉麗星等[6]采用德爾菲(Delphi)法,在前期研究基礎(chǔ)上,形成《冠心病穩(wěn)定型心絞痛(痰瘀互結(jié)證)自評量表專家問卷調(diào)查表》,向全國40余位業(yè)內(nèi)專家,往返3次進(jìn)行問卷調(diào)查,并借助統(tǒng)計學(xué)分析完成條目的篩選工作。王苗苗等[7]運用德爾菲法,調(diào)查30位專家有關(guān)高血壓病肝氣郁結(jié)證證候診斷的相關(guān)條目,完成證候診斷指標(biāo)的篩選工作。
1.3 臨床調(diào)查數(shù)據(jù)源
基于循證醫(yī)學(xué)的研究理念,運用臨床流行病學(xué)的調(diào)查方法,并與統(tǒng)計分析方法相結(jié)合,是中醫(yī)證候量表條目篩選研究的重點,是建立具有臨床可操作性及客觀、量化證候診斷量表的必要前提和堅實基礎(chǔ)。如姜小帆等[8]選取符合糖尿病診斷標(biāo)準(zhǔn)及糖尿病性視網(wǎng)膜病變診斷標(biāo)準(zhǔn)的患者120例,在此臨床資料基礎(chǔ)上,綜合運用多種統(tǒng)計分析方法,從不同角度進(jìn)行量表條目的篩選。王階等[9]運用臨床流行病學(xué)的調(diào)查方法,以獲取血瘀證患者相關(guān)的整體情況、疾病主要癥狀、軀體癥狀、體征、舌脈、實驗室檢查等
指標(biāo),參照量表編制的基本方法,制定出血瘀證量化診斷量表。
在量表的編制過程中,條目篩選是一個關(guān)鍵環(huán)節(jié),可供選擇的篩選方法很多,而且各有側(cè)重和特點。根據(jù)數(shù)據(jù)源的不同,可有針對性地選用不同的統(tǒng)計分析方法。
2.1 專家咨詢數(shù)據(jù)分析方法
在專家問卷調(diào)查的基礎(chǔ)上,結(jié)合統(tǒng)計學(xué)中的數(shù)理統(tǒng)計方法,匯總專家意見,可充分發(fā)揮專家的集體效應(yīng),并從專業(yè)角度對量表條目的構(gòu)成給出較為合理的意見。數(shù)理統(tǒng)計分析的前提是對專家應(yīng)答結(jié)果進(jìn)行量化分析和處理,其中最為常用的量化方法是將各種評估意見按照貢獻(xiàn)度不同而轉(zhuǎn)化為不同的分值,如Likert scale的五級評分,然后再求出各種意見的概率分布,依據(jù)概率分布情況判斷事件發(fā)生的可能性大小。常用來衡量專家意見的指標(biāo)有:積極性系數(shù)、集中程度、協(xié)調(diào)程度、權(quán)威系數(shù)等。①專家積極性系數(shù)反映專家對某方案的關(guān)心程度,以專家征詢表的回收率來表示。②專家意見集中程度多從方案評分值的算術(shù)平均值、滿分比、評價等級和來衡量。均數(shù)越大,滿分比越大,表明專家意見越集中,即該方案的相對重要性越大。③專家意見協(xié)調(diào)程度反映專家意見的收斂情況,通常以肯德爾和諧系數(shù)(Kendall′s coefficient of concordance)、變異系數(shù)(CV)來表示??系聽柡椭C系數(shù)適用于多列相關(guān)的等級資料,表示專家對所有條目的協(xié)調(diào)程度,系數(shù)越大,協(xié)調(diào)程度越好。變異系數(shù)反映專家們對單個條目的重要性評價的波動程度,即協(xié)調(diào)程度,變異系數(shù)越小,協(xié)調(diào)程度越高[10]。④專家權(quán)威系數(shù)(Ca)反映所選專家的代表性,專家的權(quán)威程度以自我評價為主,有時也可相互評價。該項一般由兩個因素決定,一是專家對方案做出判斷的依據(jù)(Ci),常規(guī)分為理論依據(jù)、實踐經(jīng)驗、國內(nèi)外資料、直覺等;二是專家對問題的熟悉程度(Cs)[11]。Ca=(Ci+Cs)/2,為判斷依據(jù)系數(shù)和熟悉程度系數(shù)的算術(shù)平均值,一般認(rèn)為大于等于0.7為可接受的系數(shù)??捎盟鳛闄?quán)數(shù),對專家評價值進(jìn)行加權(quán)平均計算。
一般來說,以專家調(diào)查為基礎(chǔ)進(jìn)行條目的篩選屬于主觀篩選,通常會在綜合考量上述指標(biāo)后作出最終判斷。如孔秀路等[12]在前期形成條目池的基礎(chǔ)上,編制小兒厭食中醫(yī)證候療效評價專家調(diào)查表,先后進(jìn)行兩輪專家重要性評分,通過計算專家積極系數(shù)、意見集中程度、協(xié)調(diào)程度和專家權(quán)威程度,保留同時滿足均數(shù)>4、變異系數(shù)<0.4的條目。
2.2 臨床調(diào)查數(shù)據(jù)分析方法
2.2.1 基于經(jīng)典測量理論(Classical Test Theory,CTT)的分析方法 經(jīng)典測量理論(CTT),又稱真分?jǐn)?shù)理論(True Score Theory),是最早實現(xiàn)數(shù)學(xué)形式化的測量理論[13]?;诮?jīng)典測量理論完成量表條目的篩選,可供選擇的方法比較多,例如離散趨勢法、區(qū)分度法、相關(guān)系數(shù)法、因子分析法等,這些方法技術(shù)上相對比較成熟,且每種方法篩選條目的角度和側(cè)重點不同[14]。①離散趨勢法:此法從敏感性角度篩選條目,一般采用變異系數(shù)作為衡量離散程度的指標(biāo)[15]。條目的離散程度越低,對證候的辨別區(qū)別能力就越低[16],因此證候量表的條目篩選應(yīng)盡可能選擇離散趨勢較大的條目。②區(qū)分度分析法:此法從區(qū)分性和重要性的角度篩選條目,區(qū)分度越大,說明其越具代表性。如戴霞等[16]在研究中以證候為分組變量,對各癥狀條目進(jìn)行兩個獨立樣本的t檢驗或χ2檢驗,在比較兩組之間統(tǒng)計學(xué)差異的基礎(chǔ)上,考慮條目的刪除。③相關(guān)系數(shù)法:此法從代表性和獨立性角度篩選條目。基于同一維度中指標(biāo)間的重疊性應(yīng)盡量低,不同維度之間關(guān)聯(lián)性應(yīng)盡量低的原則,借助如積差相關(guān)法、點二列相關(guān)法及雙列相關(guān)法[17]等方法,計算每個條目與其所屬維度的相關(guān)系數(shù),絕對值越大(一般認(rèn)為>0.4),說明代表性較好。同時計算每個條目與其他維度的相關(guān)系數(shù),絕對值較小,則說明獨立性較強(qiáng),基于此完成冗余條目的刪除。④因子分析法:此法從代表性角度篩選條目。因子分析通過從變量群中提取共性因子,不僅可以達(dá)到消除變量間的多元共線性,達(dá)到降低變量維度的目的,又可以將本質(zhì)相同變量歸入同一個因子,對變量進(jìn)行分類[14]。同時,依據(jù)條目在公因子上的載荷大小確定條目的取舍。⑤克朗巴赫系數(shù)法:此法從內(nèi)部一致性的角度篩選條目,反映量表條目之間的同質(zhì)性。量表中各條目間相關(guān)程度越高,α系數(shù)越大,可信度越大。通過計算克朗巴赫(Cronbach)系數(shù)α,比較去除某一條目后α系數(shù)的變化,若α系數(shù)增大,則說明該條目有降低該維度內(nèi)部一致性的作用,應(yīng)予以刪除。
目前在中醫(yī)證候量表的編制過程中,基于臨床調(diào)查數(shù)據(jù)基礎(chǔ)上的條目篩選工作,往往綜合運用多種手段和方法,同步選取兩種或兩種以上方法共識的條目作為量表的有效條目。如師寧等[18]調(diào)查200
例反流性食管炎(RE)患者,分別應(yīng)用復(fù)雜系統(tǒng)熵聚堆法、離散趨勢法、頻數(shù)分布法、因子分析法、復(fù)雜網(wǎng)絡(luò)技術(shù)對其中出現(xiàn)頻率在10%以上的四診信息53項進(jìn)行了條目的分析與篩選,形成了初步的RE證素診斷量表條目。王均琴等[19]采用橫斷面調(diào)查法,對201名類風(fēng)濕性關(guān)節(jié)炎患者實施問卷調(diào)查,聯(lián)合運用頻數(shù)分析法、因子分析法、相關(guān)系數(shù)法、逐步回歸分析、克朗巴赫系數(shù)法和重復(fù)測量等篩選方法,最終保留了35個四診條目,構(gòu)成了類風(fēng)濕性關(guān)節(jié)炎中醫(yī)證候量表。姜小帆等[20]選擇105例風(fēng)濕病患者,采用反應(yīng)度法、t檢驗法、相關(guān)分析法、因子分析法對條目進(jìn)行篩選,刪除其中有3種以上方法提示需要被刪除的條目,同時結(jié)合專業(yè)知識與意見,得到類風(fēng)濕性關(guān)節(jié)炎中醫(yī)證素評定量表的條目。趙靈燕[21]在文獻(xiàn)調(diào)研、專家咨詢的基礎(chǔ)上,調(diào)查2型糖尿病患者179例,運用相關(guān)分析、逐步回歸、因子分析等方法對證候要素條目進(jìn)行篩選。王一[22]在前期工作基礎(chǔ)上調(diào)查廣州中醫(yī)藥大學(xué)第一附屬醫(yī)院及柳州市中醫(yī)院胃癌患者,運用經(jīng)典測量理論對量表條目進(jìn)行刪減,形成包括脾胃虛寒證、氣血兩虧證、氣滯血瘀證、肝胃不和證、胃熱傷陰證、濕熱蘊脾證、痰凝氣滯證在內(nèi)的胃癌中醫(yī)證候量表。
2.2.2 基于概化理論(Generalizability Theory,GT)的分析方法 概化理論是基于“隨機(jī)平行測驗假設(shè)”,在將測量誤差多個來源維度有效分解的基礎(chǔ)上,對經(jīng)典測量理論進(jìn)行擴(kuò)展。其研究方法主要包括G研究和D研究,G研究(Generalizability Study)又稱概化研究,是指在觀測全域之上,研究者需對所有側(cè)面和測量目標(biāo)以及它們間的交互作變異分量估計。D研究(Decision Study)又稱決策研究,是指在概括全域或概化全域上,對各測量面或測量對象或它們之間的交互作用的研究[23]。在量表編制的過程中,運用該理論,可以通過改變條目數(shù),估計出不同條目數(shù)對量表信度的影響,最終為改進(jìn)量表的條目設(shè)置提供依據(jù)[24]。李微等[25]采用經(jīng)典測量理論(CTT)與概化理論(GT)相結(jié)合的方式對卵巢癌患者生命質(zhì)量測定量表(FACT-O)中文版的信度進(jìn)行評價,其中D研究結(jié)果顯示:共性模塊各領(lǐng)域條目數(shù)適宜,特異模塊可增加條目至15條,表明FACT-O中文版具有較好的信度。2.2.3 基于項目反應(yīng)理論(Item Response Theory,IRT)的分析方法 項目反應(yīng)理論又稱潛在特質(zhì)理論或項目特征曲線理論,是繼經(jīng)典測量理論(CTT)之后,針對CTT的弱點提出的一種新的測量理論,廣泛應(yīng)用于教育、心理、醫(yī)療等研究領(lǐng)域。IRT的題目參數(shù)有難度、區(qū)分度和猜測系數(shù)。項目特征曲線(Item Characteristic Curve,簡稱ICC)稱為項目特征函數(shù),是IRT分析中一個非常重要的分析圖。通過觀察ICC曲線圖,可以分析①項目的區(qū)分度,用曲線拐點處的斜率來表示;②項目的難度,由曲線在橫坐標(biāo)上的投影來表示;③項目的猜測系數(shù),用曲線的截距來表示。另外,項目信息函數(shù)將項目特征的難度、區(qū)分度和猜測度合而為一的參數(shù),反映了不同特性的項目在評價不同被試特質(zhì)水平時的信息貢獻(xiàn)關(guān)系。信息函數(shù)值越大,對被試能力的估計就越精確。鑒于項目反應(yīng)理論有著經(jīng)典測量理論所無法比擬的優(yōu)勢,近年來基于IRT理論的分析方法已逐步擴(kuò)展到中醫(yī)證候量表條目篩選研究中。如陳炳為等[26]選取高血壓病患者1 280例,在探索性因子分析的基礎(chǔ)上,以肝陽上亢證為例進(jìn)行IRT模型分析,利用單參數(shù)、雙參數(shù)及三參數(shù)分別進(jìn)行擬合,得到區(qū)分度系數(shù)、難度系數(shù)及信息函數(shù)的估計值。其結(jié)果顯示兩參數(shù)模型結(jié)果最佳,所篩選出的九個四診信息能較好地反映肝陽上亢證,提示在中醫(yī)的證候規(guī)范標(biāo)準(zhǔn)研究中應(yīng)用項目反應(yīng)理論模型是可行的。
量表具有客觀、量化的基本特征,近些年,許多學(xué)者嘗試從不同的角度編制中醫(yī)證候的相關(guān)量表,如證候診斷量表、證候療效評價量表等,其中條目的篩選是量表編制的關(guān)鍵環(huán)節(jié)。由于數(shù)據(jù)源不同,理論基礎(chǔ)不同,所選用的統(tǒng)計分析方法也有一定的差異性。目前,在量表編制過程中,較少采用某一種方法作為唯一的條目選擇標(biāo)準(zhǔn),多是綜合運用多種方法,甚至多種理論進(jìn)行統(tǒng)計分析,以期所選條目在臨床上能夠更好地代表或反映該證候的基本特征以及臨床輕重程度的變化。另外,量表的編制是一個循序漸進(jìn)的過程,不是一蹴而就的,還需要反復(fù)的臨床應(yīng)用與調(diào)試,才能最終完成量表的編制工作。
[1]孫振球.醫(yī)學(xué)統(tǒng)計學(xué)[M].2版.北京:人民衛(wèi)生出版社,2002:529.
[2]劉麗星,張哲,杜蕊,等.中醫(yī)證候量表的研究現(xiàn)狀[J].遼寧中醫(yī)藥大學(xué)學(xué)報,2011,13(9):28-30.
[3]金洵,丁義江,丁曙晴,等.慢性便秘患者報告臨床結(jié)局評估量表條目池的建立和篩選[J].世界華人消化雜志,2012,29(2):2 855-2 859.
[4]唐斌擎,張?zhí)灬?,黃海茵,等.基于頑固性感冒后咳嗽患者報告的中醫(yī)證候臨床結(jié)局量表的構(gòu)建[J].上海中醫(yī)藥雜志,2012(4):13-15.
[5]平衛(wèi)偉,譚紅專.Delphi法的研究進(jìn)展及其在醫(yī)學(xué)中的應(yīng)用[J].疾病控制雜志,2003,7(3):243-246.
[6]劉麗星,張哲,杜蕊,等.基于德爾菲法的《冠心病穩(wěn)定型心絞痛(痰瘀互結(jié)證)自評量表》條目篩選[J].遼寧中醫(yī)雜志,2011(5):827-829.
[7]王苗苗,李運倫,張?zhí)N慧.基于德爾菲法的高血壓病肝氣郁結(jié)證問卷分析[J].湖南中醫(yī)雜志,2014(4):137-138.
[8]姜小帆,曾進(jìn),段俊國.糖尿病性視網(wǎng)膜病變中醫(yī)證素評定量表的編制策略及條目篩選[J].中華中醫(yī)藥學(xué)刊,2013(1):24-27.
[9]王階,姚魁武,衷敬柏,等.基于臨床流行病學(xué)的血瘀證量化計分表研究[J].中醫(yī)雜志,2008(3):270-272.
[10]陸遠(yuǎn),任現(xiàn)志.基于德爾菲法初步建立過敏性紫癜性腎炎中醫(yī)生存質(zhì)量量表條目[J].河南中醫(yī),2014(3):561-562.
[11]郝建玲,徐洪蓮,邱群,等.大腸癌造口患者癥狀評估量表條目池的建立和初步篩選[J].解放軍護(hù)理雜志,2012(9):12-14,18.
[12]孔秀路,徐田華,胡思源,等.基于Delphi法的小兒厭食中醫(yī)證候療效評價量表的條目篩選[J].天津中醫(yī)藥,2014(9):522-525.
[13]一帆.經(jīng)典測驗理論[J].教育測量與評價:理論版,2009(7):26.
[14]孟凡波,楊傳華,齊冬梅,等.高血壓病肝陽上亢證診斷量表條目篩選的研制[J].南京中醫(yī)藥大學(xué)學(xué)報,2012(3):225-228.
[15]呂靜,薛江平,羅艷虹,等.慢性心衰PRO量表條目的初步篩選[J].中國衛(wèi)生統(tǒng)計,2014(3):379-382.
[16]戴霞,王成崗,韓曉春,等.中醫(yī)證候量表條目篩選的方法學(xué)探討[J].中華中醫(yī)藥雜志,2010(8):1 168-1 171.
[17]馮艷賓,馬洪超.關(guān)于經(jīng)典測量理論和項目反應(yīng)理論中難度和區(qū)分度的探討[J].中國考試,2012(4):10-14.
[18]師寧,陳建新,劉敏,等.反流性食管炎證素診斷量表的編制研究[J].現(xiàn)代中醫(yī)臨床,2014(6):9-12.
[19]王均琴,李國春,周學(xué)平,等.類風(fēng)濕性關(guān)節(jié)炎中醫(yī)證候量表條目篩選[J].遼寧中醫(yī)藥大學(xué)學(xué)報,2014(3):80-82.
[20]姜小帆,曾進(jìn),李娟娥,等.類風(fēng)濕性關(guān)節(jié)炎中醫(yī)證素評定量表的編制策略及條目篩選[J].中華中醫(yī)藥學(xué)刊,2014(9):2 225-2 228.
[21]趙靈燕.2型糖尿病中醫(yī)證候要素診斷量表的研制及初步應(yīng)用研究[D].北京:北京中醫(yī)藥大學(xué),2013.
[22]王一.基于量表的胃癌證候構(gòu)成規(guī)律研究[D].廣州:廣州中醫(yī)藥大學(xué),2014.
[23]敖勇前.概化理論研究綜述[J].皖西學(xué)院學(xué)報,2008(2):49-52.
[24]孟瓊,萬崇華,羅家洪,等.癌癥患者生命質(zhì)量測定量表體系之胃癌量表QLICP-ST的研制[J].癌癥,2008(11):1 212-1 216.
[25]李微,羅家洪,萬崇華,等.經(jīng)典測量理論與概化理論結(jié)合評價卵巢癌患者生命質(zhì)量測定量表中文版的信度研究[J].中國全科醫(yī)學(xué),2013(9):751,754.
[26]陳炳為,許碧云,陳啟光,等.兩分類項目反應(yīng)理論在中醫(yī)證候中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2011(1):16-18,21.
(編輯:梁葆朱)
R311
A
1671-0258(2015)05-0067-04
山西省基礎(chǔ)研究青年基金項目(2012021031-3);2015年度山西中醫(yī)學(xué)院博士科研啟動基金項目(2015BK01)
杜彩鳳,博士,副教授,碩士研究生導(dǎo)師,E-mail:ducaifeng1020@163.com