孫紅衛(wèi)呂春燕祁愛琴曹國華韓春蕾
綜合評價中數(shù)據(jù)標準化的原理研究*
孫紅衛(wèi)1呂春燕2祁愛琴1曹國華1韓春蕾1
數(shù)據(jù)的標準化是很多多元統(tǒng)計方法必要的前期工作,如綜合評價、聚類分析、主成分與因子分析、meta分析等。特別在綜合評價中,數(shù)據(jù)標準化的方法很多,用不同的標準化方法得到不同的綜合評價結(jié)果,從而影響了對實際問題合理客觀地認識和判斷。從根源上解決多種標準化方法帶來的結(jié)論不一致問題,就需要認識標準化方法的本質(zhì),明確標準化的目的,討論標準化法必須滿足的性質(zhì),在此基礎(chǔ)上,來探討標準化方法的選擇原則。
本文認為,標準化是原指標的一種變換,變換后是相對于某個參照點(可能是均值,最大值、最小值、理想點等)的相對位置,此相對位置盡量保持原變量的序關(guān)系不變、差異比不變、縮放不變等性質(zhì)。理想的標準化法還必須保證,不同指標間參照點的等價性和變化范圍的等價性。
下面的討論都在這個基本模型下。設(shè)有n個評價單位,p個指標,第i個評價單位的第j個指標取值為xij。為了討論的方便,本文假設(shè)所有指標都正向化,所有指標都為正值。
1.指標內(nèi)部的要求
(1)序關(guān)系不變性。即若xaj>xbj,則f(xaj)>f(xbj)。(2)縮放無關(guān)性。即滿足f(cx)=f(x),c≠0。對原始數(shù)據(jù)進行縮小和放大變換不會影響標準化的結(jié)果。(3)差異比不變性。即滿足如果秩轉(zhuǎn)換法,能滿足序關(guān)系不變,但是不能滿足差異比不變性。因為秩轉(zhuǎn)換法損失掉了差異測量的信息。
2.指標間的要求
(1)參照點的等價性。
由于標準化變換之后是相對位置,此相對位置都是以某個點為參照點的。理想的標準化法,要保持標準化后的相對位置等價,那首先不同指標的參照點應(yīng)該是等價的。即門診量的平均數(shù)代表了這些評價單位的平均水平,那么感染率的平均數(shù)也應(yīng)該代表評價單位的平均水平。
(2)變化尺度的等價性。
除了參照點的等價性以外,還需要變化尺度的等價性。在z-score處理法中,不同指標間的變化一個標準差是等價的,而極值處理法中,變化一個極差是等價的。線性比例法,認為在均數(shù)的尺度上改變的范圍相等則認為是等價的,向量規(guī)范法認為在平方和開方的尺度上變化的范圍相等則認為是等價的,功效系數(shù)法認為不同指標的滿意值與不滿意值之差的變化范圍是等價的。
3.等價性要求與評價結(jié)論不一致問題
指標間的等價性要求,可以得知不同的標準化方法,其背后的假定是不同的,而這些等價性往往不能互相推導(dǎo)。z-score法和線性比例法,都假定了不同指標間均數(shù)的等價性,可以證明:當且僅當滿足各個指標的變異系數(shù)相等時,這兩個標準化法對于變化范圍的等價性假定相同,從而這兩種標準化法的結(jié)果是相同的(證明略)。但是要保證所有評價指標的變異系數(shù)都相等,是不可能的,所以,如果用z-score法是合適的,則用線性比例法就是不合適的,反之亦然。
不同的標準化法假定了不同的等價性,而且實際資料中不同的假定之間往往不可能同時成立,所以標準化后得到的“相對位置”的含義是不同的,自然會影響到綜合評價的結(jié)論會不一致。所以,由數(shù)據(jù)的標準化法帶來的綜合評價結(jié)論不一致問題是必然的。其實很多統(tǒng)計方法對實際問題建模時,往往會存在多個合適的模型,而且結(jié)論也不完全一致。之所以綜合評價結(jié)果的“不一致”問題受到很多關(guān)注,是因為結(jié)果的“唯一性”才能體現(xiàn)結(jié)果的公正性,所以對唯一性的要求才很強烈。雖然主觀來判定指標之間的等價性較困難,但是理清楚綜合評價結(jié)論不一致問題的根源,有利于選擇方法時作出合理地判斷。
1.是否選擇以離散程度作為變化尺度
標準化方法根據(jù)變化尺度的不同可以分為兩大類,一類是以每個指標的離散程度作為尺度,包括z-score法(以標準差為尺度),中位數(shù)法(以四分位數(shù)間距為尺度),極值法(以極差為尺度)。用這些方法標準化后,各個指標的離散程度都是相同的。也就是說,這些標準化方法完全消除了原指標離散程度的信息。
另外一類則不以每個指標的離散程度為尺度,比如線性比例法(以均數(shù)為尺度,或以標準值為尺度),比重法(是以平方和開方為尺度)。用這些方法標準化后,各個指標的離散程度往往不同。其中,如果第j個指標以線性比例法(以均數(shù)為尺度),則標準化后離散程度為即該指標的變異系數(shù)。如果是線性比例法(以標準值為尺度),標準化后離散程度為sj/stdj,其中stdj為標準值,如果是向量規(guī)范法,則為也就是說,這些標準化法保留了部分原指標離散程度的信息。
如果指標的變異系數(shù)相差太大的話,則兩大類標準化法標準化后的結(jié)果會很不一致。因為這時候線性比例法或向量規(guī)范法,相當于給予不同指標的權(quán)重差別太大。這時候傾向于用z-score法,中位數(shù)法或極值法。如果指標的變異系數(shù)相差不大,則兩大類標準化后的結(jié)果會接近。
2.數(shù)據(jù)的分布對標準化結(jié)果的影響
在決定了是否以離散程度為尺度之后,就要在每一類中選擇哪一種標準化法,比如選擇以離散程度作為尺度,是選用z-score法(認為標準差在不同指標間是等價的),還是用極值法(認為極差在不同指標間是等價的)。同理,如果想保留原指標離散程度的信息,是選用線性比例法(認為均數(shù)在不同指標間是等價的),還是向量規(guī)范法(認為平方和開方在不同指標間是等價的)。
表1 不同指標間的等價性假定以及標準化后的離散程度是否相同*
1.賦權(quán)重對標準化法的要求
綜合評價的第二步是賦權(quán)重,其實所賦權(quán)重可以歸到標準化里面,比如z-score法,第i個指標的權(quán)重wi,乘以標準化值也即加權(quán)重后變化尺度的等價性變成si/wi與sj/wj等價。
下面討論合成方法對標準化法影響,為了討論的方便,先假設(shè)所有指標的權(quán)重都為1。
2.合成方法對標準化法的要求
對標準化值進行合成,本質(zhì)上是不同指標的標準值是可以互相替代、互相補償?shù)摹<丛诘趇個指標上落后一段差距,可以通過第j個指標領(lǐng)先一段差距作為補償。
(1)線性和法
以正己烷作為3種合成麝香標準溶液溶劑,分別配成質(zhì)量濃度為1~5000 ng·L-1的混合標準溶液。先采用全掃描模式(Full-scan)對化合物進行定性,根據(jù)標液中各物質(zhì)的出峰時間和特征離子(表2),再采用選擇性離子掃描模式(SIM)對目標分析物進行定量。采用內(nèi)標標準曲線法得到3條標準曲線的方程和相關(guān)系數(shù)。引入檢出限對目標分析物的檢測質(zhì)量進行評測,信噪比系數(shù)取3。同時,取3種已知濃度的目標物溶液,采用與樣品測定一樣的實驗方法進行預(yù)處理和 GC/MS分析,以實驗結(jié)果的平均值與已知濃度的比值作為本次實驗方法的回收率。計算結(jié)果如表2所示。
(2)理想點法(距離)
五、實證研究
以某醫(yī)院從2000年到2006年的醫(yī)療質(zhì)量綜合評價為例[2],來探討各種標準化法的性質(zhì)。該醫(yī)院從2000年到2006年的指標實見表2。
表2 某醫(yī)院2000-2006年各項指標值
負向指標取其相反數(shù)進行正向化。采用的方法有:z-score法,中位數(shù)法,極值法,線性比例法1(均數(shù)),線性比例法2(標準值),比重法。
表3 不同標準化法的排序結(jié)果
從上面可以看出,同一類方法的結(jié)果是相近的,特別第1類中的三種方法z-score法,中位數(shù)法和極值法,三個標準化法的結(jié)果是相同的。線性比例法(均數(shù))、線性比例法(標準值)和比重法,三個標準化法的結(jié)果是相近的。但是這兩類方法的結(jié)果之間卻相差很大。
特別是對2005年的評價,第1類方法(以離散程度為尺度)都認為2005年的綜合評價值為第7位,而第2類方法(不以離散程度為尺度)的排序則認為是第1位。原因就在于2005年處于落后的幾個指標變異系數(shù)都較小,而處于領(lǐng)先的幾個指標變異系數(shù)都較大,如果用線性比例法,對變異系數(shù)大的指標,由于保留變異系數(shù)大小的信息,相當于加大了這些指標的權(quán)重,所以2005年的綜合評價值會最高。但是z-score法等去除了離散程度的信息,由于2005年多個指標處于落后狀態(tài),特別是權(quán)重大比較的幾個指標處于落后狀態(tài),則最后的綜合評價值就會比較低。
從變異系數(shù)來看,13個指標的變異系數(shù)相差太大,最小的為手術(shù)前后診斷符合率0.0008,最大的為手術(shù)并發(fā)癥發(fā)生率1.3586,差別為1698倍。如果采用不去除離散程度的標準化方法,則變異系數(shù)較大的指標會起太大的作用,變異系數(shù)較小的指標所起的作用會微乎其微。所以對這個問題,建議用以離散程度作為尺度的標準化方法。
1.是否以離散程度作為尺度
以上理論和實證研究可以看出,標準化方法最重要的是選擇是否以離散程度作為尺度,當指標間的離散程度相差很大時,兩大類標準化法的結(jié)果會差異很大。建議是,當指標的變異系數(shù)差別不大時,可以采用線性比例法、比重法等不以離散程度為尺度的標準化方法,部分保留原來離散程度的信息。而如果指標的變異系數(shù)差別很大時,建議采用z-score法、中位數(shù)法、極值法等以離散程度為尺度的標準化法。
2.根據(jù)數(shù)據(jù)分布特點來選擇
如果數(shù)據(jù)分布呈偏態(tài)或出現(xiàn)極端值的情況,zscore法和極值法往往會變動很大,因為此時均數(shù)、標準差和極值會因極端值變動很大,而中位數(shù)和四分位數(shù)間距受極端值的影響較小,是在這種情況下推薦的方法。
線性比例法(標準值)是以標準值為尺度,極端值改變不會影響到標準值,所以極端值對它的影響會較小。而線性比例法(均數(shù))、比重法(平方和開方)中的變化尺度是均數(shù)的平方和開方,受極端值的影響比較大。功效系數(shù)法是以滿意值與不滿意值的差為尺度,也不會因為極端值而改變。
3.等價性理論與簡單性原則
依照以上原則,仍然還有多個標準化方法可以選擇,且結(jié)果會有差異。前面本文指出,由于不同的標準化法假定了不同的等價性,而真實情況符合哪種等價性不得而知,所以綜合評價的結(jié)論不一致問題是必然存在的。等價性假定理論,可以讓應(yīng)用者理解多種評價結(jié)果不一致的情況,能夠明白不一致的根源,從而可以憑借經(jīng)驗來判定哪種等價性假定更符合實際情況。
如果存在滿意值或不滿意值,比如三甲醫(yī)院的指標參考值(病床周轉(zhuǎn)次數(shù)≥19次/年,藥品收入占總收入比例≤45%等),可以作為一個參照點,因為它代表了三甲醫(yī)院的最低要求,可以認為是不同指標間等價的。如果不存在這樣的參考值,采用均數(shù)和中位數(shù)作為參照點就要好于極值,因為極值在不同指標間等價的可能性要小于均數(shù)和中位數(shù)在指標間等價的可能性。
標準化法的選擇,我們只探討了線性標準化法的情況,沒有討論非線性標準化法,其中理想點法(距離)類似于非線性標準化之后再線性合成。從上面的討論可以看出,越復(fù)雜的標準化方法或合成方法,不同指標間的等價性越難把握,就越無法判定這種方法的合理性。本文認為,依據(jù)等價性理論,應(yīng)該盡量選取簡單的方法,這樣對這些方法背后的等價性假定非常明確,能夠針對實際當中出現(xiàn)的情況選用合適的綜合評價方法。
1.郭亞軍,易平濤.線性無量綱化方法的性質(zhì)分析.統(tǒng)計研究,2008,25(2):93-100.
2.馬先瑩,孫紅衛(wèi),祁英華.某醫(yī)院2000-2006年醫(yī)療質(zhì)量的綜合評價.中國醫(yī)院統(tǒng)計,2007,14(2):139-141.
3.李光,吳祈宗.基于結(jié)論一致的綜合評價數(shù)據(jù)標準化研究.數(shù)學(xué)的實踐與認識,2011,3:72-77.
4.張羅漫,黃麗娟,賀佳,等.綜合評價中指標值標準化方法的探討.中國衛(wèi)生統(tǒng)計,1995,12(1):1-4.
(責(zé)任編輯:郭海強)
山東省統(tǒng)計科研重點課題(KT11088)
1.濱州醫(yī)學(xué)院公共衛(wèi)生與管理學(xué)院(264003)
2.棗莊科技職業(yè)學(xué)院(277500)