劉春龍 陳 龍 孫慧穎 胡 濱 韓玉霞 陳寶榮△
臨床生化檢驗(yàn)反應(yīng)面法中的統(tǒng)計(jì)學(xué)介紹*
劉春龍1陳 龍2孫慧穎1胡 濱1韓玉霞1陳寶榮1△
臨床生化檢驗(yàn)各項(xiàng)目的測量結(jié)果受到很多因素的影響,尤其在酶學(xué)測量領(lǐng)域,如波長、溫度、濕度、pH、孵育時(shí)間、延遲時(shí)間、測量時(shí)間等都會(huì)對最終檢驗(yàn)結(jié)果有不同程度的影響。這些影響因素的一個(gè)或多個(gè)發(fā)生變化時(shí),都會(huì)影響到最終檢驗(yàn)結(jié)果的準(zhǔn)確性,因此,在方法學(xué)性能研究時(shí),一般需進(jìn)行實(shí)驗(yàn)條件的摸索,研究各種因素對檢驗(yàn)結(jié)果的影響,并使各影響因素處于最佳狀態(tài)是方法學(xué)研究的主要目的。檢驗(yàn)界常常習(xí)慣于采用固定其他條件,變化一種影響因素來判斷變化因素的最佳測量條件,即單因素分析法。然而單因素分析法的前提條件是各影響因素之間不存在交互作用。然而,幾乎每一個(gè)測定程序都存在各因素間的交互作用。臨床生化檢驗(yàn)反應(yīng)面法(RSM)能夠很好地反應(yīng)各影響因素的交互影響,是一種經(jīng)典的多因素分析方法,可作為傳統(tǒng)的單因素分析法的補(bǔ)充。在IFCC公布的參考測量程序中,幾乎每個(gè)測量程序均有RSM分析的結(jié)果和等高線圖,RSM的重要意義可見一斑。本文從RSM及相關(guān)術(shù)語的介紹、RSM的建模原理、RSM模型的擬合及預(yù)測性能評價(jià)、RSM模型的優(yōu)化四個(gè)方面進(jìn)行闡述并對RSM中的統(tǒng)計(jì)學(xué)進(jìn)行介紹。
RSM是通過實(shí)驗(yàn)數(shù)據(jù)的識別分析,建立合適的反應(yīng)面模型的多因素分析方法,其需要統(tǒng)計(jì)學(xué)實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)、回歸模型的技術(shù)和因素優(yōu)化的方法[1]。RSM由數(shù)學(xué)和統(tǒng)計(jì)學(xué)技術(shù)結(jié)合實(shí)驗(yàn)數(shù)據(jù),通過建立一階或者多階函數(shù),直至反應(yīng)條件得到優(yōu)化[2]。RSM常與響應(yīng)、影響因子、因子水平、最速上升路徑法等緊密相關(guān)。在臨床生化檢驗(yàn)中,響應(yīng)是指檢驗(yàn)結(jié)果,檢驗(yàn)結(jié)果是對各個(gè)測量條件的響應(yīng);影響因子即影響因素,是對檢驗(yàn)結(jié)果的最終判定產(chǎn)生作用的測量條件,如某個(gè)測量程序中的波長、溫度、pH、緩沖體系等;因子水平是指影響因子的取值,取值一般應(yīng)成一定的比例。影響因子的數(shù)量和因子水平數(shù)直接關(guān)系到RSM設(shè)計(jì)方式的選擇,進(jìn)而影響最終建立模型的預(yù)測性能。最速上升路徑法又稱爬坡實(shí)驗(yàn),由于反應(yīng)曲面擬合方程只有在考察的臨近區(qū)域里才能充分近似真實(shí)情況,所以應(yīng)先找到其最佳區(qū)域,即通過各影響因子不同水平的取值,在最短的路徑下到達(dá)響應(yīng)值附近。
假設(shè)某臨床生化檢驗(yàn)項(xiàng)目的測量結(jié)果為y,對y起決定作用的重要影響因子有n個(gè),分別為x1、x2、x3、…、xn。影響因子的確定可以根據(jù)經(jīng)驗(yàn),若不能確定各因子的影響大小,可采用單因素分析法進(jìn)行實(shí)驗(yàn)后判定其是否為該項(xiàng)目的重要影響因子[3]。確定了影響因子后,即可進(jìn)行實(shí)驗(yàn)設(shè)計(jì)。假設(shè)進(jìn)行了m次實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)表示為:
第1次試驗(yàn):y1?x11,x21,…,xn1
第i次試驗(yàn):yi?x1i,x2i,…,xni
第m次試驗(yàn):ym?x1m,x2m,…,xmm
根據(jù)實(shí)驗(yàn)結(jié)果,建立RSM模型,即建立測量結(jié)果與影響因子之間的關(guān)系。任何函數(shù)都能用多項(xiàng)式擬合來近似,并且只要多項(xiàng)式的次數(shù)適當(dāng),近似的準(zhǔn)確度就能達(dá)到最佳,因此測量結(jié)果與影響因子之間的關(guān)系必然可以采用多項(xiàng)式來進(jìn)行模擬。
欲找出反應(yīng)和獨(dú)立變量之間適當(dāng)?shù)慕坪瘮?shù),通常利用獨(dú)立變量在一些范圍里的低階多項(xiàng)式近似,即為一階模型(first-order model),如果系統(tǒng)中有曲率,則必須利用較高階的多項(xiàng)式,如二階模型(second-order model)。當(dāng)二階模型仍不具有較好的擬合度時(shí),可采用三階以上模型進(jìn)行擬合。在臨床生化檢驗(yàn)中,一般采用二階模型即可。其函數(shù)式分別表示為:
得到回歸方程后,通過對x1、x2、x3、…、xn的合理取值求得y最佳值,即達(dá)到RSM分析的目的。建立了各種影響測量的因素(x1、x2、x3、…、xn)如pH、溫度、波長等與測量結(jié)果的函數(shù)關(guān)系。RSM不僅考慮了各影響因子對曲線線性的影響,也考慮了不同影響因子間的交互作用和曲率影響。這種多項(xiàng)式擬合法有一個(gè)缺陷,即當(dāng)因素較多時(shí),如果所選多項(xiàng)式次數(shù)較高,會(huì)導(dǎo)致計(jì)算量很大、需要的實(shí)驗(yàn)數(shù)據(jù)很多。常用的RSM設(shè)計(jì)方式有3k因子設(shè)計(jì),Box-Behnken實(shí)驗(yàn)或中央合成設(shè)計(jì)實(shí)驗(yàn)(central composite design,CCD)[4]。
對于RSM模型的性能評價(jià),一般可以分為兩方面,一方面是模型中參與擬合的所有實(shí)驗(yàn)點(diǎn)的擬合度;另一方面為對未進(jìn)行實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果的預(yù)測準(zhǔn)確度。
關(guān)于RSM模型的擬合度一般通過決定系數(shù)R2來進(jìn)行判斷,R2越靠近1則表示擬合效果越好。目前在建立模型時(shí),一般采用SAS、Minitab等軟件,檢驗(yàn)水準(zhǔn)α一般設(shè)置為0.01或0.05等,擬合時(shí)應(yīng)注意觀察分析結(jié)果中的失擬項(xiàng)的P值,失擬項(xiàng)的P值應(yīng)大于等于0.05,否則應(yīng)增加實(shí)驗(yàn),進(jìn)行二次因子設(shè)計(jì)。建立RSM模型的目的是為了預(yù)測其他實(shí)驗(yàn)條件組合下的測量結(jié)果,為評價(jià)模型的準(zhǔn)確度,必須通過驗(yàn)證實(shí)驗(yàn)進(jìn)行判斷,即按一定規(guī)律選取若干條件,使用RSM模型進(jìn)行理論值預(yù)測,同時(shí)進(jìn)行實(shí)際值的測量(至少包含高、中、低三水平),再將兩者進(jìn)行比較。一般認(rèn)為,若相關(guān)系數(shù)R2和失擬項(xiàng)的P值滿足條件,且驗(yàn)證實(shí)驗(yàn)符合實(shí)驗(yàn)室要求,則認(rèn)為成功建立了該項(xiàng)目的RSM模型。特別說明的是,符合上述標(biāo)準(zhǔn),仍然是比較粗的預(yù)測,若要進(jìn)一步細(xì)化,還需要進(jìn)行假設(shè)檢驗(yàn)。但由于生化反應(yīng)本身的復(fù)雜性,如基質(zhì)效應(yīng)的存在等,在生化檢驗(yàn)項(xiàng)目的條件摸索中,筆者認(rèn)為通過比較模型的決定系數(shù)R2,失擬項(xiàng)的P值及驗(yàn)證實(shí)驗(yàn)是否成功即可判斷模型的優(yōu)劣。
在臨床生化檢驗(yàn)方法學(xué)開發(fā)研究中,RSM模型成功建立后,最重要的是依據(jù)該模型對實(shí)驗(yàn)條件進(jìn)行優(yōu)化,以達(dá)到最佳的響應(yīng)。假設(shè)檢驗(yàn)結(jié)果y越小越好,選擇一個(gè)中心點(diǎn),并在其附近取多個(gè)實(shí)驗(yàn)點(diǎn)進(jìn)行實(shí)驗(yàn),得到相應(yīng)的測量結(jié)果,建立回歸方程,通過求導(dǎo)的方式得到一個(gè)向量(方向),實(shí)驗(yàn)點(diǎn)沿該方向變化時(shí)(沿該方向再取很多實(shí)驗(yàn)點(diǎn)),響應(yīng)值變小的最快;當(dāng)響應(yīng)值開始變大時(shí),取前一個(gè)實(shí)驗(yàn)點(diǎn)為第二個(gè)設(shè)計(jì)點(diǎn),再重復(fù)上面過程,最終得到使y最小的實(shí)驗(yàn)點(diǎn)(因素的水平組合)。這是二次因子設(shè)計(jì)的基礎(chǔ),重復(fù)該過程,直到優(yōu)化后的條件滿足實(shí)驗(yàn)室的預(yù)期測量要求。在SAS、Minitab等軟件中均有設(shè)計(jì)好的優(yōu)化器,通過在優(yōu)化器中設(shè)置相應(yīng)的參數(shù),即可得到優(yōu)化后的預(yù)測結(jié)果,但值得注意的是,此時(shí)確定影響結(jié)果的條件后,應(yīng)再次進(jìn)行驗(yàn)證實(shí)驗(yàn),以確定預(yù)測誤差在實(shí)驗(yàn)室可接受范圍內(nèi)。
RSM作為經(jīng)典的多因素分析法,已在國外臨床生化檢驗(yàn)領(lǐng)域發(fā)揮舉足輕重的作用,但在我國檢驗(yàn)領(lǐng)域,其應(yīng)用仍不多見。在新方法、新技術(shù)的研發(fā)中,RSM可以節(jié)約大量的人力、物力、財(cái)力。本文對RSM進(jìn)行了全面的介紹,尤其對RSM中的統(tǒng)計(jì)學(xué)進(jìn)行了介紹,旨在幫助讀者合理采用RSM進(jìn)行方法學(xué)性能研究,特別是實(shí)驗(yàn)條件的摸索,建立適合自己實(shí)驗(yàn)室各檢驗(yàn)項(xiàng)目測量程序的RSM模型。
[1]Raymond H,Douglas C,Christine M,et al.Response surface Methods OLOGY.America:A John Wiley & Sons inc,2009:1-6.
[2]Bezerra MA,Santelli RE,Oliveria EP,et al.Response surface Methods ology(RSM)as a tool for optimization in analytical chemistry.Talanta,2008,76(5):965-977.
[3]Bota A,Gella FJ,Canalias F.Optimization of adenosine deaminase assay by response surface Methods ology.Clin Chim Acta,2000,290(2):145-157.
[4]劉春龍,金仁玲,孫慧穎,等.臨床生化檢驗(yàn)反應(yīng)面法(RSM)及其常用設(shè)計(jì)方式淺析.臨床檢驗(yàn)雜志,2014,32(4):317-318.
(責(zé)任編輯:郭海強(qiáng))
*國家高技術(shù)研究發(fā)展863計(jì)劃(2011AA02A111);國家質(zhì)檢總局公益項(xiàng)目(201210066)
1.北京航天總醫(yī)院檢驗(yàn)科(100076)
2.北京航天科技集團(tuán)有限公司
△通信作者:陳寶榮,E-mail:jyk711@sina.com