薛寒冰昆侖健康保險(xiǎn)股份有限公司,北京 100000
核保醫(yī)學(xué)研究中常見(jiàn)統(tǒng)計(jì)偏倚與混雜的控制
薛寒冰
昆侖健康保險(xiǎn)股份有限公司,北京100000
統(tǒng)計(jì)偏倚和混雜是核保醫(yī)學(xué)研究中非常重要的影響條件,如果將各類風(fēng)險(xiǎn)因素不加選擇地羅列其中,就會(huì)不可避免地引入偏倚,特別是混雜偏倚的引入會(huì)影響研究因素與結(jié)局之間真正的聯(lián)系,但這些問(wèn)題并不能利用統(tǒng)計(jì)方法解決,需要在研究設(shè)計(jì)階段進(jìn)行充分考量。
核保醫(yī)學(xué);混雜;偏倚
[Abstract]The statistical bias and confounding are the most important influence conditions in the underwriting medical research,the bias can be inevitably introduced if various risk factors are indiscriminately listed in it,especially the introduction of confounding and bias can affect the real correlation between research factors and outcomes,but the statistical method fails to solve these problems,and they need to be fully considered in the research and design stage.
[Key words]Underwriting medicine;Confounding;Bias
核保醫(yī)學(xué)研究主要分析各種風(fēng)險(xiǎn)因素對(duì)結(jié)局的影響,通過(guò)對(duì)與結(jié)局相關(guān)的因素進(jìn)行統(tǒng)計(jì)分析來(lái)完成風(fēng)險(xiǎn)評(píng)估,以往探索和驗(yàn)證某一暴露因素與結(jié)局之間的因果關(guān)系時(shí)多采用橫斷面研究或隨訪研究,掌握可靠的預(yù)后因素則可以較為準(zhǔn)確地預(yù)測(cè)結(jié)局,這對(duì)核保風(fēng)險(xiǎn)分析有著重要的意義,如評(píng)估冠心病作為獨(dú)立風(fēng)險(xiǎn)因素對(duì)重大疾病發(fā)生率的影響。但是因不同風(fēng)險(xiǎn)因素在其流行特征和暴露特性方面具有相互交叉的特點(diǎn),并且相互影響,這樣就出現(xiàn)了影響研究結(jié)果真實(shí)性的混雜因素。但如果將各類因素進(jìn)行簡(jiǎn)單的剝離勢(shì)必導(dǎo)致一些交叉因素被忽視[1]。相反將所有這些因素不加選擇地羅列于危險(xiǎn)因素的研究中,同樣會(huì)導(dǎo)致問(wèn)題產(chǎn)生,例如某些弱相關(guān)性因素會(huì)被弱化,特別是由于外來(lái)混雜因素的混入,一些低危險(xiǎn)性因素的危險(xiǎn)性會(huì)出現(xiàn)錯(cuò)估,這會(huì)不可避免的導(dǎo)致偏倚的產(chǎn)生[2]。
按照偏倚產(chǎn)生的原因可分為選擇偏倚、信息偏倚和混雜偏倚,選擇偏倚是由于樣本入選不當(dāng)導(dǎo)致出現(xiàn)系統(tǒng)誤差,包括入院率偏倚、失訪偏倚、檢出偏倚等。信息偏倚是對(duì)納入的各組間所采用的觀察或測(cè)量方法不一致導(dǎo)致出現(xiàn)的系統(tǒng)誤差,包括診斷偏倚、依從性偏倚、回憶偏倚、調(diào)查偏倚、測(cè)量偏倚等[3]。在核保醫(yī)學(xué)研究領(lǐng)域,常見(jiàn)的偏倚包括以下幾類。
1.1檢出偏倚
是核保醫(yī)學(xué)研究領(lǐng)域比較常見(jiàn)的問(wèn)題,早期核保人員多認(rèn)為良性乳腺疾病患者會(huì)傾向于乳癌發(fā)生。但近年的研究表明這一推論實(shí)際上與檢出偏倚有關(guān),即患良性乳腺疾病的人會(huì)比一般人接受檢查的頻率更高,也就更容易診斷出乳癌來(lái)。Sliber和Horwitz的研究結(jié)果證明,早期乳腺疾病與乳腺癌的粗OR值在統(tǒng)計(jì)上有顯著差異,但如果考慮研究人群接受檢查的不均衡性,這種關(guān)聯(lián)就消失了[4]。
1.2診斷偏倚
指疾病報(bào)告系統(tǒng)對(duì)暴露者和非暴露者采用不同的診斷標(biāo)準(zhǔn)時(shí)造成的診斷上的偏倚,例如對(duì)糖尿病和糖調(diào)節(jié)受損(IFG和IGT)人群進(jìn)行長(zhǎng)期預(yù)后研究和風(fēng)險(xiǎn)分類,1980年世界衛(wèi)生組織(WHO)糖尿病診斷標(biāo)準(zhǔn),在1999年發(fā)布的新標(biāo)準(zhǔn)中發(fā)生左移,并且IFG下限診斷切點(diǎn)降低,結(jié)果導(dǎo)致糖尿病檢出率上升,漏診率下降,但如果研究設(shè)計(jì)不做規(guī)則限定,同一研究人群在不同時(shí)期的診斷標(biāo)準(zhǔn)變化會(huì)導(dǎo)致研究結(jié)論出現(xiàn)不一致。
1.3失訪偏倚
研究對(duì)象在承保后的隨訪過(guò)程中發(fā)生影響風(fēng)險(xiǎn)評(píng)價(jià)的失訪時(shí),如合同中止、遷出、退保等,則可發(fā)生失訪偏倚。失訪偏倚對(duì)研究結(jié)果的影響取決于失訪程度、失訪者在所比較組的分布和失訪原因與所研究結(jié)果的關(guān)聯(lián)程度等。
1.4無(wú)應(yīng)答偏倚
主要發(fā)生于現(xiàn)況調(diào)查,表現(xiàn)為調(diào)查對(duì)象不合作或不參與。這些無(wú)應(yīng)答對(duì)象通常不能代表所研究人群,且無(wú)法判斷其風(fēng)險(xiǎn)因素或疾病狀況,因此當(dāng)無(wú)應(yīng)答率較高時(shí),從應(yīng)答人群中得出的有關(guān)研究因素與疾病的聯(lián)系不能反映兩者間的真實(shí)聯(lián)系。
1.5報(bào)告偏倚
因?yàn)檠芯繉?duì)象有意夸大或隱瞞某些信息導(dǎo)致了對(duì)疾病或風(fēng)險(xiǎn)因素暴露程度的錯(cuò)誤分類。例如研究對(duì)象以故意隱瞞或者避重就輕的方式回應(yīng)病史詢問(wèn),導(dǎo)致核保研究人員獲得的報(bào)告不能反映研究對(duì)象的真實(shí)健康狀況。
1.6易感性偏倚
觀察結(jié)局除與暴露因素有關(guān)外,還與觀察對(duì)象的易感性有關(guān)。如:暴露于不良生活方式(飲酒行為)的學(xué)生的發(fā)病率比一般人群更低,是因?yàn)椴涣忌罘绞降膶W(xué)生,其初始的健康水平要比一般人群高,其易感性更低。
1.7混雜偏倚
包括正混雜性偏倚和負(fù)混雜性偏倚,正混雜性偏倚指由于混雜因素的作用使暴露因素與疾病之間的關(guān)聯(lián)被人為地夸大。負(fù)混雜性偏倚指由于混雜因素的作用使暴露因素與疾病的關(guān)聯(lián)被人為地減弱。主要是由于研究的設(shè)計(jì)階段未做條件一致性控制而影響分析結(jié)果的真實(shí)性。例如,對(duì)高齡人群進(jìn)行甲狀腺乳頭狀癌的預(yù)后研究,會(huì)出現(xiàn)重大偏倚,這種不是因抽樣誤差造成的偏倚并不會(huì)隨樣本量增加而克服[5]。
在理論上可以將混雜理解為在研究過(guò)程中所遇到的邏輯現(xiàn)象,假設(shè)在靜止條件下的某一觀察性研究結(jié)局事件是發(fā)生或者沒(méi)有發(fā)生,那么在這兩種情況下除了某一種或幾種現(xiàn)象以外,其他現(xiàn)象都相同,那么這就是事件發(fā)生的影響因素,而對(duì)其中的某一因素進(jìn)行控制就會(huì)減小混雜偏倚[6]。在研究某因素與某疾病之間的關(guān)系的實(shí)施過(guò)程時(shí),混雜偏倚會(huì)影響研究因素與結(jié)局之間真正的聯(lián)系,這種偏倚以多種形式進(jìn)入到研究中,干擾研究結(jié)果的真實(shí)性[7-8]。識(shí)別判斷混雜是核保理論研究中的重要環(huán)節(jié),忽視混雜會(huì)導(dǎo)致測(cè)量值與總體值的差異推斷出現(xiàn)因果推斷的偏倚。通常對(duì)暴露總體和非暴露總體的結(jié)果分布可以評(píng)價(jià)暴露總體中暴露對(duì)結(jié)果的因果作用,當(dāng)暴露總體和非暴露總體不可比時(shí),需要采用某些背景變量對(duì)總體分層,使暴露子總體與非暴露子總體是可比的。
混雜的判定原則大致分為“可壓縮原則”和“可比較原則”。可壓縮原則指某外部因素在各分層上的關(guān)聯(lián)測(cè)度一致,如出現(xiàn)不一致則該外部因素可認(rèn)為混雜因素??杀容^原則指某獨(dú)立危險(xiǎn)因素在暴露總體與在非暴露總體中的分布不同,并且該因素不是病因鏈中的一環(huán)[4,9]。例如,肝硬化發(fā)病人群的年齡分布比肝硬化未發(fā)病人群的年齡分布偏大一些,那么即使肝硬化人群當(dāng)初未發(fā)病,因年齡原因,他們的肝癌發(fā)病率也會(huì)更高。但是,在相同的年齡區(qū)間,肝硬化人群與肝硬化未發(fā)病人群也許是可比較的,那么可以認(rèn)為年齡屬于混雜因素,通過(guò)調(diào)整年齡可以消除由于年齡分布不同造成的混雜偏倚[10]。
核保醫(yī)學(xué)研究中常見(jiàn)的混雜因素可以通過(guò)配對(duì)、隨機(jī)分組等方式平衡和消除其影響,根據(jù)具體要求將因素條件相同或相近的研究對(duì)象配對(duì),可以使各處理組中的實(shí)驗(yàn)對(duì)象條件均衡,使其具有良好的可比性,由于控制了非處理因素的影響,使處理因素的效應(yīng)能得到比較符合實(shí)際的客觀反映。隊(duì)列研究也可以很好地控制混雜,通過(guò)觀測(cè)疾病的發(fā)生、發(fā)展至結(jié)局的全過(guò)程,可直接計(jì)算研究人群出現(xiàn)某種預(yù)后結(jié)局的發(fā)生率,在疾病預(yù)后的探索方面是最佳設(shè)計(jì),但存在周期長(zhǎng)和失訪問(wèn)題,其局限性會(huì)影響結(jié)論外推;在病例對(duì)照研究中應(yīng)用匹配方法容易引入系統(tǒng)性偏倚,因此分層分析是目前相對(duì)容易控制的方法。
而隨著流行病學(xué)研究更多的采用大樣本量的隊(duì)列研究,長(zhǎng)期、廣泛地收集數(shù)據(jù),使得核保醫(yī)學(xué)也得以將更多的流行病學(xué)研究成果加以應(yīng)用,而研究所涉及的因素越多,越是不可避免的會(huì)引入混雜,對(duì)識(shí)別出的混雜進(jìn)行處理時(shí),很多人直接采取分層調(diào)整或多因素分析,實(shí)際上這會(huì)給分析造成更多的困難,而合理的方式應(yīng)是首先考慮粗測(cè)量,其次是分層分析,然后才是多因素分析[11-12],因?yàn)樵诙嘁蛩胤治鲋?,暴露因素的?dú)立性、共線性等問(wèn)題會(huì)帶來(lái)更多的不確定性,可能導(dǎo)致假相關(guān)性的結(jié)果,這種假相關(guān)性應(yīng)是偶然性的,但是潛在相關(guān)性越多,就越有可能導(dǎo)致這種偶然相關(guān)結(jié)果的出現(xiàn)[13]。
在統(tǒng)計(jì)分析階段消除偏倚是非常困難的,即便采用可比較原則和可壓縮原則也同樣會(huì)產(chǎn)生局限性,可比較原則只能判斷哪些變量不是混雜因素,而無(wú)法確定哪些變量一定是混雜因素,可壓縮性準(zhǔn)則須依賴于使用相關(guān)測(cè)度和背景因素的狀況[14]。通過(guò)對(duì)統(tǒng)計(jì)模型調(diào)整可以減少偏倚,但需要設(shè)定更多假設(shè),這會(huì)給統(tǒng)計(jì)分析帶來(lái)更多的不確定性,實(shí)際上這些偏倚只是它們?cè)诮y(tǒng)計(jì)分析時(shí)被發(fā)現(xiàn)而已,僅通過(guò)統(tǒng)計(jì)模型或在研究完成后再校正這些偏倚是不合理的,應(yīng)在研究設(shè)計(jì)階段就要將這些可能會(huì)導(dǎo)致偏倚的因素考慮進(jìn)去,特別是對(duì)生物學(xué)資料不支持的結(jié)果,應(yīng)敢于提出質(zhì)疑,這樣有利于研究結(jié)論的外推[15]。
[1]李立明,余燦清,呂筠.現(xiàn)代流行病學(xué)的發(fā)展與展望[J].中華疾病控制雜志,2010,14(1):1-4.
[2]Genevieve Matanoski.低危險(xiǎn)因素的流行病學(xué)研究[J].中華流行病學(xué)雜志,1997,18(6):353-355.
[3]董衛(wèi).臨床研究中常見(jiàn)的偏倚及其控制[J].中國(guó)實(shí)用內(nèi)科雜志,2007,27(24):1985-1986.
[4]任濤,詹思延,沈霞,等.流行病學(xué)研究中的偏倚與混雜[J].中華流行病學(xué)雜志,2004,25(9):811-813.
[5]付浩.預(yù)后因素研究中常見(jiàn)的統(tǒng)計(jì)錯(cuò)誤—偏倚[J].中國(guó)肺癌雜志,2014,17(2):137-141.
[6]薛寒冰,核保醫(yī)學(xué)研究中關(guān)于混雜因素的探討[J].中國(guó)衛(wèi)生產(chǎn)業(yè),2015,2(5):153-154.
[7]左群,何蓓,胡高潮,等.新型城市醫(yī)療衛(wèi)生服務(wù)體系下流行病學(xué)研究中的偏倚控制[J].現(xiàn)代預(yù)防醫(yī)學(xué),2011,38(23):4884-4885.
[8]錢維,葉小飛,王超,等.藥品不良反應(yīng)信號(hào)檢測(cè)中混雜因素的控制方法[J].中國(guó)藥物警戒,2010,7(3):142-144.
[9]宋永霞,洪靜芳,謝倫芳,等,臨床癌癥患者研究中存在的偏倚及控制[J].中華護(hù)理雜志,2015,50(6):750-753.
[10]Miettinen OS,Cook EF.Confounding:essence and detection[J]. Am Journal Epidemiology,1981,114(4):593-603.
[11]呂慧,賴戰(zhàn)峰,李海煒,等.血尿素氮、肌酐及尿酸在兩種生化分析系統(tǒng)的比對(duì)和偏倚評(píng)估[J].中華檢驗(yàn)醫(yī)學(xué)雜志,2012,35(6):550-553.
[12]林增文,蘇健,鄒偉民,等.廣東省臨床化學(xué)檢驗(yàn)項(xiàng)目質(zhì)量評(píng)價(jià)與數(shù)據(jù)分析[J].實(shí)用醫(yī)學(xué)雜志,2009,25(15):2574-2576.
[13]張路,王薇,王治國(guó),等.允許總誤差在西格瑪度量用于評(píng)價(jià)臨床化學(xué)檢測(cè)項(xiàng)目分析質(zhì)量上的應(yīng)用研究[J].檢驗(yàn)醫(yī)學(xué),2015(9):953-957.
[14]胡永華,耿直.關(guān)于混雜概念的討論[J].中華流行病學(xué)雜志,2001,22(6):459-461.
[15]Maarit A.Laaksonen,Paul Knekt,Harri Rissanen.The relative importance of modifiable potential risk factors of type 2 diabetes:a meta-analysis of two cohorts[J].European Journal of Epidemiology,2010,25(2):115-124.
Control of Commom Statistical Bias and Confounding in Underwriting Medial Research
XUE Han-bing
Kunlun Health Insurance Co.,Ltd,Beijing,100000 China
R81
A
1672-5654(2016)05(a)-0032-03
薛寒冰(1975.5-),男,天津人,醫(yī)學(xué)碩士,研究方向:核保醫(yī)學(xué)。
2016-02-15)