国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

綜合評價中數(shù)據(jù)標準化的原理研究*

2015-03-09 11:13孫紅衛(wèi)呂春燕祁愛琴曹國華韓春蕾

中國衛(wèi)生統(tǒng)計 2015年2期

關(guān)鍵詞：均數(shù)等價線性

孫紅衛(wèi)呂春燕祁愛琴曹國華韓春蕾

綜合評價中數(shù)據(jù)標準化的原理研究*

孫紅衛(wèi)1呂春燕2祁愛琴1曹國華1韓春蕾1

數(shù)據(jù)的標準化是很多多元統(tǒng)計方法必要的前期工作，如綜合評價、聚類分析、主成分與因子分析、meta分析等。特別在綜合評價中，數(shù)據(jù)標準化的方法很多，用不同的標準化方法得到不同的綜合評價結(jié)果，從而影響了對實際問題合理客觀地認識和判斷。從根源上解決多種標準化方法帶來的結(jié)論不一致問題，就需要認識標準化方法的本質(zhì)，明確標準化的目的，討論標準化法必須滿足的性質(zhì)，在此基礎(chǔ)上，來探討標準化方法的選擇原則。

綜合評價中數(shù)據(jù)標準化的目的

本文認為，標準化是原指標的一種變換，變換后是相對于某個參照點（可能是均值，最大值、最小值、理想點等）的相對位置，此相對位置盡量保持原變量的序關(guān)系不變、差異比不變、縮放不變等性質(zhì)。理想的標準化法還必須保證，不同指標間參照點的等價性和變化范圍的等價性。

下面的討論都在這個基本模型下。設(shè)有n個評價單位，p個指標，第i個評價單位的第j個指標取值為xij。為了討論的方便，本文假設(shè)所有指標都正向化，所有指標都為正值。

綜合評價中數(shù)據(jù)標準化應(yīng)該滿足的性質(zhì)

1.指標內(nèi)部的要求

（1）序關(guān)系不變性。即若xaj＞xbj，則f（xaj）＞f（xbj）。（2）縮放無關(guān)性。即滿足f（cx）＝f（x），c≠0。對原始數(shù)據(jù)進行縮小和放大變換不會影響標準化的結(jié)果。（3）差異比不變性。即滿足如果秩轉(zhuǎn)換法，能滿足序關(guān)系不變，但是不能滿足差異比不變性。因為秩轉(zhuǎn)換法損失掉了差異測量的信息。

2.指標間的要求

（1）參照點的等價性。

由于標準化變換之后是相對位置，此相對位置都是以某個點為參照點的。理想的標準化法，要保持標準化后的相對位置等價，那首先不同指標的參照點應(yīng)該是等價的。即門診量的平均數(shù)代表了這些評價單位的平均水平，那么感染率的平均數(shù)也應(yīng)該代表評價單位的平均水平。

（2）變化尺度的等價性。

除了參照點的等價性以外，還需要變化尺度的等價性。在z-score處理法中，不同指標間的變化一個標準差是等價的，而極值處理法中，變化一個極差是等價的。線性比例法，認為在均數(shù)的尺度上改變的范圍相等則認為是等價的，向量規(guī)范法認為在平方和開方的尺度上變化的范圍相等則認為是等價的，功效系數(shù)法認為不同指標的滿意值與不滿意值之差的變化范圍是等價的。

3.等價性要求與評價結(jié)論不一致問題

指標間的等價性要求，可以得知不同的標準化方法，其背后的假定是不同的，而這些等價性往往不能互相推導(dǎo)。z-score法和線性比例法，都假定了不同指標間均數(shù)的等價性，可以證明：當且僅當滿足各個指標的變異系數(shù)相等時，這兩個標準化法對于變化范圍的等價性假定相同，從而這兩種標準化法的結(jié)果是相同的（證明略）。但是要保證所有評價指標的變異系數(shù)都相等，是不可能的，所以，如果用z-score法是合適的，則用線性比例法就是不合適的，反之亦然。

不同的標準化法假定了不同的等價性，而且實際資料中不同的假定之間往往不可能同時成立，所以標準化后得到的“相對位置”的含義是不同的，自然會影響到綜合評價的結(jié)論會不一致。所以，由數(shù)據(jù)的標準化法帶來的綜合評價結(jié)論不一致問題是必然的。其實很多統(tǒng)計方法對實際問題建模時，往往會存在多個合適的模型，而且結(jié)論也不完全一致。之所以綜合評價結(jié)果的“不一致”問題受到很多關(guān)注，是因為結(jié)果的“唯一性”才能體現(xiàn)結(jié)果的公正性，所以對唯一性的要求才很強烈。雖然主觀來判定指標之間的等價性較困難，但是理清楚綜合評價結(jié)論不一致問題的根源，有利于選擇方法時作出合理地判斷。

影響標準化選擇的因素

1.是否選擇以離散程度作為變化尺度

標準化方法根據(jù)變化尺度的不同可以分為兩大類，一類是以每個指標的離散程度作為尺度，包括z-score法（以標準差為尺度），中位數(shù)法（以四分位數(shù)間距為尺度），極值法（以極差為尺度）。用這些方法標準化后，各個指標的離散程度都是相同的。也就是說，這些標準化方法完全消除了原指標離散程度的信息。

另外一類則不以每個指標的離散程度為尺度，比如線性比例法（以均數(shù)為尺度，或以標準值為尺度），比重法（是以平方和開方為尺度）。用這些方法標準化后，各個指標的離散程度往往不同。其中，如果第j個指標以線性比例法（以均數(shù)為尺度），則標準化后離散程度為即該指標的變異系數(shù)。如果是線性比例法（以標準值為尺度），標準化后離散程度為sj／stdj，其中stdj為標準值，如果是向量規(guī)范法，則為也就是說，這些標準化法保留了部分原指標離散程度的信息。

如果指標的變異系數(shù)相差太大的話，則兩大類標準化法標準化后的結(jié)果會很不一致。因為這時候線性比例法或向量規(guī)范法，相當于給予不同指標的權(quán)重差別太大。這時候傾向于用z-score法，中位數(shù)法或極值法。如果指標的變異系數(shù)相差不大，則兩大類標準化后的結(jié)果會接近。

2.數(shù)據(jù)的分布對標準化結(jié)果的影響

在決定了是否以離散程度為尺度之后，就要在每一類中選擇哪一種標準化法，比如選擇以離散程度作為尺度，是選用z-score法（認為標準差在不同指標間是等價的），還是用極值法（認為極差在不同指標間是等價的）。同理，如果想保留原指標離散程度的信息，是選用線性比例法（認為均數(shù)在不同指標間是等價的），還是向量規(guī)范法（認為平方和開方在不同指標間是等價的）。

表1 不同指標間的等價性假定以及標準化后的離散程度是否相同*

賦權(quán)重和合成方法背后的等價性假定。

1.賦權(quán)重對標準化法的要求

綜合評價的第二步是賦權(quán)重，其實所賦權(quán)重可以歸到標準化里面，比如z-score法，第i個指標的權(quán)重wi，乘以標準化值也即加權(quán)重后變化尺度的等價性變成si／wi與sj／wj等價。

下面討論合成方法對標準化法影響，為了討論的方便，先假設(shè)所有指標的權(quán)重都為1。

2.合成方法對標準化法的要求

對標準化值進行合成，本質(zhì)上是不同指標的標準值是可以互相替代、互相補償?shù)摹＜丛诘趇個指標上落后一段差距，可以通過第j個指標領(lǐng)先一段差距作為補償。

（1）線性和法

以正己烷作為3種合成麝香標準溶液溶劑，分別配成質(zhì)量濃度為1~5000 ng·L-1的混合標準溶液。先采用全掃描模式（Full-scan）對化合物進行定性，根據(jù)標液中各物質(zhì)的出峰時間和特征離子（表2），再采用選擇性離子掃描模式（SIM）對目標分析物進行定量。采用內(nèi)標標準曲線法得到3條標準曲線的方程和相關(guān)系數(shù)。引入檢出限對目標分析物的檢測質(zhì)量進行評測，信噪比系數(shù)取3。同時，取3種已知濃度的目標物溶液，采用與樣品測定一樣的實驗方法進行預(yù)處理和 GC/MS分析，以實驗結(jié)果的平均值與已知濃度的比值作為本次實驗方法的回收率。計算結(jié)果如表2所示。

（2）理想點法（距離）

五、實證研究

以某醫(yī)院從2000年到2006年的醫(yī)療質(zhì)量綜合評價為例［2］，來探討各種標準化法的性質(zhì)。該醫(yī)院從2000年到2006年的指標實見表2。

表2 某醫(yī)院2000－2006年各項指標值

負向指標取其相反數(shù)進行正向化。采用的方法有：z-score法，中位數(shù)法，極值法，線性比例法1（均數(shù)），線性比例法2（標準值），比重法。

表3 不同標準化法的排序結(jié)果

從上面可以看出，同一類方法的結(jié)果是相近的，特別第1類中的三種方法z-score法，中位數(shù)法和極值法，三個標準化法的結(jié)果是相同的。線性比例法（均數(shù)）、線性比例法（標準值）和比重法，三個標準化法的結(jié)果是相近的。但是這兩類方法的結(jié)果之間卻相差很大。

特別是對2005年的評價，第1類方法（以離散程度為尺度）都認為2005年的綜合評價值為第7位，而第2類方法（不以離散程度為尺度）的排序則認為是第1位。原因就在于2005年處于落后的幾個指標變異系數(shù)都較小，而處于領(lǐng)先的幾個指標變異系數(shù)都較大，如果用線性比例法，對變異系數(shù)大的指標，由于保留變異系數(shù)大小的信息，相當于加大了這些指標的權(quán)重，所以2005年的綜合評價值會最高。但是z-score法等去除了離散程度的信息，由于2005年多個指標處于落后狀態(tài)，特別是權(quán)重大比較的幾個指標處于落后狀態(tài)，則最后的綜合評價值就會比較低。

從變異系數(shù)來看，13個指標的變異系數(shù)相差太大，最小的為手術(shù)前后診斷符合率0.0008，最大的為手術(shù)并發(fā)癥發(fā)生率1.3586，差別為1698倍。如果采用不去除離散程度的標準化方法，則變異系數(shù)較大的指標會起太大的作用，變異系數(shù)較小的指標所起的作用會微乎其微。所以對這個問題，建議用以離散程度作為尺度的標準化方法。

標準化方法選擇的原則

1.是否以離散程度作為尺度

以上理論和實證研究可以看出，標準化方法最重要的是選擇是否以離散程度作為尺度，當指標間的離散程度相差很大時，兩大類標準化法的結(jié)果會差異很大。建議是，當指標的變異系數(shù)差別不大時，可以采用線性比例法、比重法等不以離散程度為尺度的標準化方法，部分保留原來離散程度的信息。而如果指標的變異系數(shù)差別很大時，建議采用z-score法、中位數(shù)法、極值法等以離散程度為尺度的標準化法。

2.根據(jù)數(shù)據(jù)分布特點來選擇

如果數(shù)據(jù)分布呈偏態(tài)或出現(xiàn)極端值的情況，zscore法和極值法往往會變動很大，因為此時均數(shù)、標準差和極值會因極端值變動很大，而中位數(shù)和四分位數(shù)間距受極端值的影響較小，是在這種情況下推薦的方法。

線性比例法（標準值）是以標準值為尺度，極端值改變不會影響到標準值，所以極端值對它的影響會較小。而線性比例法（均數(shù)）、比重法（平方和開方）中的變化尺度是均數(shù)的平方和開方，受極端值的影響比較大。功效系數(shù)法是以滿意值與不滿意值的差為尺度，也不會因為極端值而改變。

3.等價性理論與簡單性原則

依照以上原則，仍然還有多個標準化方法可以選擇，且結(jié)果會有差異。前面本文指出，由于不同的標準化法假定了不同的等價性，而真實情況符合哪種等價性不得而知，所以綜合評價的結(jié)論不一致問題是必然存在的。等價性假定理論，可以讓應(yīng)用者理解多種評價結(jié)果不一致的情況，能夠明白不一致的根源，從而可以憑借經(jīng)驗來判定哪種等價性假定更符合實際情況。

如果存在滿意值或不滿意值，比如三甲醫(yī)院的指標參考值（病床周轉(zhuǎn)次數(shù)≥19次／年，藥品收入占總收入比例≤45%等），可以作為一個參照點，因為它代表了三甲醫(yī)院的最低要求，可以認為是不同指標間等價的。如果不存在這樣的參考值，采用均數(shù)和中位數(shù)作為參照點就要好于極值，因為極值在不同指標間等價的可能性要小于均數(shù)和中位數(shù)在指標間等價的可能性。

標準化法的選擇，我們只探討了線性標準化法的情況，沒有討論非線性標準化法，其中理想點法（距離）類似于非線性標準化之后再線性合成。從上面的討論可以看出，越復(fù)雜的標準化方法或合成方法，不同指標間的等價性越難把握，就越無法判定這種方法的合理性。本文認為，依據(jù)等價性理論，應(yīng)該盡量選取簡單的方法，這樣對這些方法背后的等價性假定非常明確，能夠針對實際當中出現(xiàn)的情況選用合適的綜合評價方法。

1.郭亞軍，易平濤.線性無量綱化方法的性質(zhì)分析.統(tǒng)計研究，2008，25（2）：93-100.

2.馬先瑩，孫紅衛(wèi)，祁英華.某醫(yī)院2000-2006年醫(yī)療質(zhì)量的綜合評價.中國醫(yī)院統(tǒng)計，2007，14（2）：139-141.

3.李光，吳祈宗.基于結(jié)論一致的綜合評價數(shù)據(jù)標準化研究.數(shù)學(xué)的實踐與認識，2011，3：72-77.

4.張羅漫，黃麗娟，賀佳，等.綜合評價中指標值標準化方法的探討.中國衛(wèi)生統(tǒng)計，1995，12（1）：1-4.

（責(zé)任編輯：郭海強）

山東省統(tǒng)計科研重點課題（KT11088）

1.濱州醫(yī)學(xué)院公共衛(wèi)生與管理學(xué)院（264003）

2.棗莊科技職業(yè)學(xué)院（277500）

猜你喜歡

均數(shù)等價線性

等價轉(zhuǎn)化

新高考·高三數(shù)學(xué)(2022年3期)2022-04-28

線性回歸方程的求解與應(yīng)用

中學(xué)生數(shù)理化·高一版(2021年2期)2021-03-19

二階線性微分方程的解法

中央民族大學(xué)學(xué)報（自然科學(xué)版）(2018年3期)2018-11-09

非齊次線性微分方程的常數(shù)變易法

卷宗(2018年14期)2018-06-29

?N上帶Hardy項的擬線性橢圓方程兩個解的存在性

Acta Mathematica Scientia(English Series)(2018年6期)2018-03-01

n次自然數(shù)冪和的一個等價無窮大

中文信息(2017年12期)2018-01-27

收斂的非線性迭代數(shù)列xn+1=g(xn)的等價數(shù)列

中央民族大學(xué)學(xué)報（自然科學(xué)版）(2015年2期)2015-06-09

關(guān)于均數(shù)與偏差

中國現(xiàn)代醫(yī)生(2014年21期)2014-08-27

關(guān)于均數(shù)與偏差

中國現(xiàn)代醫(yī)生(2014年10期)2014-04-23

環(huán)Fpm+uFpm+…+uk-1Fpm上常循環(huán)碼的等價性

鄭州大學(xué)學(xué)報（理學(xué)版）(2014年2期)2014-03-01

中國衛(wèi)生統(tǒng)計2015年2期

中國衛(wèi)生統(tǒng)計的其它文章: 應(yīng)用ARIMA-GRNN模型對腎綜合征出血熱發(fā)病率時間序列數(shù)據(jù)的預(yù)測研究*; Aalen模型在醫(yī)學(xué)研究中的應(yīng)用; 長沙市甲型H1N1流感流行干預(yù)措施效果的數(shù)學(xué)模擬*; 基于超幾何分布的前瞻性時空掃描統(tǒng)計量在瘧疾早期預(yù)警中的應(yīng)用*; 貝葉斯層次模型在嵌套結(jié)構(gòu)調(diào)查數(shù)據(jù)中的應(yīng)用研究*; 初治肺結(jié)核患者心理健康狀況及其影響因素分析*

和硕县| 应城市| 察隅县| 恭城| 五莲县| 花莲市| 西昌市| 宿州市| 阳春市| 太仆寺旗| 大方县| 太保市| 周宁县| 崇州市| 北流市| 比如县| 西华县| 鄱阳县| 德安县| 余姚市| 西藏| 古丈县| 如皋市| 鄂托克前旗| 石泉县| 怀远县| 彰化县| 颍上县| 东莞市| 延庆县| 乐昌市| 托克逊县| 浮梁县| 铜梁县| 镇沅| 峨山| 新平| 上杭县| 武义县| 柳河县| 温宿县|