開(kāi)展實(shí)驗(yàn)室診斷試驗(yàn)研究值得注意的幾個(gè)問(wèn)題

2013-02-19 03:48胡志德鄧安梅

檢驗(yàn)醫(yī)學(xué) 2013年6期

胡志德，鄧安梅

(1.濟(jì)南軍區(qū)總醫(yī)院實(shí)驗(yàn)診斷科，山東濟(jì)南250031;2.第二軍醫(yī)大學(xué)長(zhǎng)海醫(yī)院實(shí)驗(yàn)診斷科，上海200433)

快速、準(zhǔn)確地對(duì)疾病做出診斷或排除，是對(duì)患者實(shí)施科學(xué)、規(guī)范化治療的基礎(chǔ)。因具有客觀和無(wú)創(chuàng)或微創(chuàng)等優(yōu)點(diǎn)，實(shí)驗(yàn)室檢查一直在疾病的診斷中占有十分重要的地位。開(kāi)展實(shí)驗(yàn)室相關(guān)的診斷性試驗(yàn)的臨床研究，目的在于分析某一個(gè)(組)實(shí)驗(yàn)室標(biāo)志物或者實(shí)驗(yàn)室檢查手段對(duì)某種特定疾病的診斷價(jià)值，為臨床醫(yī)師運(yùn)用該實(shí)驗(yàn)室檢查對(duì)目標(biāo)疾病進(jìn)行診斷提供科學(xué)的依據(jù)。

目前，國(guó)內(nèi)檢驗(yàn)醫(yī)學(xué)專業(yè)學(xué)術(shù)雜志上刊登的論文中，有很大一部分屬于診斷性試驗(yàn)的研究論文。這些研究論文中有部分是直接評(píng)價(jià)單個(gè)實(shí)驗(yàn)室手段對(duì)目標(biāo)疾病的診斷價(jià)值，有的則是比較多種實(shí)驗(yàn)室手段診斷效能的差異，以及評(píng)價(jià)聯(lián)合多種手段對(duì)疾病的診斷價(jià)值。我們注意到，與國(guó)外主流的檢驗(yàn)醫(yī)學(xué)專業(yè)學(xué)術(shù)雜志上刊登的診斷性試驗(yàn)報(bào)告論文相比，刊登在國(guó)內(nèi)雜志上的論文或多或少都存在一些不足，主要表現(xiàn)為試驗(yàn)設(shè)計(jì)存在缺陷，論文撰寫(xiě)不夠規(guī)范。在此，我們結(jié)合診斷性試驗(yàn)報(bào)告規(guī)范(standards for reporting of diagnostic accuracy，STARD)［1-3］和診斷性試驗(yàn)質(zhì)量評(píng)分(quality assessment of diagnostic accuracy studies，QUADAS)工具［4-5］，擬就如何開(kāi)展一個(gè)高質(zhì)量的診斷性試驗(yàn)，以及如何撰寫(xiě)規(guī)范的診斷性試驗(yàn)研究論文談一些自己的看法。

一、QUADAS標(biāo)準(zhǔn)和STARD報(bào)告規(guī)范概述

在循證醫(yī)學(xué)時(shí)代，臨床醫(yī)師十分強(qiáng)調(diào)運(yùn)用目前已有的最佳“證據(jù)”來(lái)作為臨床決策的依據(jù)。所謂“證據(jù)”，主要是源自于已有的臨床研究的結(jié)論。在臨床研究實(shí)踐中，針對(duì)同一個(gè)臨床問(wèn)題往往會(huì)開(kāi)展多個(gè)不同的臨床試驗(yàn)，得出的結(jié)論也不盡相同。循證醫(yī)學(xué)的任務(wù)之一就是開(kāi)展系統(tǒng)評(píng)價(jià)(systematic review，SR)，以科學(xué)的統(tǒng)計(jì)學(xué)方法整合多個(gè)臨床研究的結(jié)論，為臨床決策的制定提供最佳的證據(jù)。同時(shí)，SR還可以發(fā)現(xiàn)源自于不同臨床研究的結(jié)論之間存在差異的原因，為后續(xù)開(kāi)展類(lèi)似的研究提供參考。在進(jìn)行SR的過(guò)程中，對(duì)已有的臨床研究進(jìn)行質(zhì)量評(píng)價(jià)是一個(gè)十分重要的環(huán)節(jié)。高質(zhì)量的臨床研究結(jié)論更加可靠，因而在SR中占有更高的權(quán)重。在此背景下，QUADAS標(biāo)準(zhǔn)應(yīng)運(yùn)而生。QUADAS標(biāo)準(zhǔn)一共包含了14項(xiàng)條目，供系統(tǒng)評(píng)價(jià)員從14項(xiàng)試驗(yàn)設(shè)計(jì)的細(xì)節(jié)去評(píng)估診斷性試驗(yàn)的研究質(zhì)量。對(duì)于QUADAS標(biāo)準(zhǔn)中的每項(xiàng)條目，專家都在說(shuō)明中給出了詳細(xì)的評(píng)分原則:若研究符合該標(biāo)準(zhǔn)中提及的設(shè)計(jì)要點(diǎn)，可以得1分，否則，得-1分;若根據(jù)論文的內(nèi)容無(wú)法判斷，就記為0分。QUADAS得分總和越高，表明該診斷性試驗(yàn)的研究質(zhì)量越高，結(jié)論的說(shuō)服力也越強(qiáng)。

START報(bào)告規(guī)范是STARD小組(一個(gè)以統(tǒng)計(jì)學(xué)家和實(shí)驗(yàn)室醫(yī)學(xué)家為主的研究小組)制訂一份旨在規(guī)范診斷性試驗(yàn)研究論文撰寫(xiě)的清單。這份清單共包含了25條記錄，詳細(xì)列舉了診斷性試驗(yàn)論文的每個(gè)部分應(yīng)當(dāng)闡述的內(nèi)容，其目的旨在幫助讀者分析研究可能存在的偏倚(內(nèi)部有效性)和結(jié)論的適用范圍(外部有效性)。STARD報(bào)告規(guī)范至2003年制訂以來(lái)，迅速得到了學(xué)術(shù)期刊編輯部和臨床研究學(xué)者的認(rèn)可。比如，Clinical Biochemistry在其稿約中就明確規(guī)定:凡是向該雜志遞交診斷性研究的論文，都必須嚴(yán)格按照STARD報(bào)告規(guī)范內(nèi)容進(jìn)行撰寫(xiě)。

關(guān)于QUADAS標(biāo)準(zhǔn)和STARD報(bào)告規(guī)范的所有條目，在相應(yīng)的中英文文獻(xiàn)中均有介紹［1，3-5］，限于篇幅所限，在此不一一贅述。

二、從QUADAS標(biāo)準(zhǔn)和STARD報(bào)告規(guī)范談開(kāi)展診斷性研究值得注意的幾個(gè)問(wèn)題

1.數(shù)據(jù)收集的時(shí)序性問(wèn)題

從數(shù)據(jù)收集的時(shí)序上講，診斷性試驗(yàn)可以分為前瞻性研究和回顧性研究。二者的區(qū)別在于:前瞻性研究是先有試驗(yàn)計(jì)劃，然后根據(jù)試驗(yàn)計(jì)劃開(kāi)展診斷性試驗(yàn)(同時(shí)對(duì)患者進(jìn)行“金標(biāo)準(zhǔn)”和“待評(píng)價(jià)測(cè)試”的檢查);而回顧性研究并無(wú)預(yù)先設(shè)計(jì)好的試驗(yàn)計(jì)劃，僅僅是研究人員回顧性地收集了一些病例進(jìn)行研究。前瞻性研究在實(shí)施過(guò)程中能夠控制病例募集，結(jié)果解釋過(guò)程中潛在的混雜因素，因此，通常具有較高的論證強(qiáng)度;而回顧性研究無(wú)法控制各種混雜因素，因此，論證強(qiáng)度較弱。目前國(guó)際上開(kāi)展的高質(zhì)量的診斷性試驗(yàn)研究幾乎都是前瞻性的研究。

在STARD報(bào)告規(guī)范的第六條中，就明確規(guī)定了研究人員在在撰寫(xiě)診斷性試驗(yàn)論文時(shí)，需要在“材料與方法”部分說(shuō)明開(kāi)展的研究屬于前瞻性還是回顧性的研究。然而，遺憾的是，國(guó)內(nèi)的部分診斷性試驗(yàn)研究論文，在“材料與方法”一欄中并未對(duì)研究的性質(zhì)進(jìn)行說(shuō)明，而只是簡(jiǎn)單交待了研究受試對(duì)象的樣本量，疾病診斷狀況和一些基本的臨床特征。這種不規(guī)范的報(bào)告方式往往讓讀者無(wú)法判斷研究質(zhì)量的高低以及論證力度的強(qiáng)弱，同時(shí)也削弱了研究成果在本領(lǐng)域的穿透力。此外，開(kāi)展SR的一項(xiàng)重要任務(wù)就是分析各個(gè)研究結(jié)論之間的差異是否與試驗(yàn)設(shè)計(jì)特點(diǎn)有關(guān)，為同行繼續(xù)開(kāi)展此方面的研究提供參考。如果在研究論文中不闡述研究的時(shí)序問(wèn)題，往往不利于系統(tǒng)評(píng)價(jià)員分析各個(gè)研究之間異質(zhì)性的來(lái)源，也就削弱了研究在本領(lǐng)域的影響力。

2.研究對(duì)象的選擇

疾病的診斷首先是基于簡(jiǎn)單的、易于獲取的臨床資料(比如病史、體征、人口學(xué)特征)然而，有部分疾病在癥狀和體征上極其相似，依靠上述資料往往無(wú)法對(duì)患者是否患有目標(biāo)疾病做出明確判斷。比如，對(duì)于以呼吸困難為主訴的就診患者，僅僅依靠癥狀和體征往往無(wú)法確定造成呼吸困難的病因是否為心力衰竭，因?yàn)椴糠窒⒎窝?、主?dòng)脈夾層和心肌梗死患者也可能出現(xiàn)呼吸困難的癥狀。此時(shí)，臨床醫(yī)師就需要借助現(xiàn)有的物理檢查，影像學(xué)檢查或者實(shí)驗(yàn)室檢查手段(比如檢測(cè)BNP)，對(duì)患者是否患有心力衰竭做出明確的診斷。由此可見(jiàn)，診斷性試驗(yàn)的研究對(duì)象應(yīng)該是一組癥狀和體征相似，需要借助實(shí)驗(yàn)室檢測(cè)手段、影像學(xué)手段等以明確診斷的人群。國(guó)內(nèi)的部分診斷性試驗(yàn)研究，將健康個(gè)體設(shè)置為對(duì)照組。這樣的設(shè)計(jì)并不足以體現(xiàn)實(shí)驗(yàn)室指標(biāo)對(duì)疾病的鑒別診斷能力，引入診斷性試驗(yàn)往往會(huì)導(dǎo)致錯(cuò)誤的結(jié)論。QUADAS標(biāo)準(zhǔn)的第一條就對(duì)診斷性試驗(yàn)研究對(duì)象的疾病譜做出了明確的闡述，其中規(guī)定:若診斷性試驗(yàn)以健康個(gè)體作為對(duì)照，就視為不合格，此條標(biāo)準(zhǔn)的QUADAS得分為-1分。

此外，值得注意的是，與干預(yù)性研究不同，診斷性試驗(yàn)的試驗(yàn)組(疾病組)和對(duì)照組(非疾病組)是自然形成的，所以比例方面沒(méi)有要求(即無(wú)需遵循病例對(duì)照研究和干預(yù)性研究中的“均衡原則”)，關(guān)鍵是研究對(duì)象要有臨床代表性和完整性，能反映臨床工作中需要借助待評(píng)價(jià)手段才能確診斷的人群的特征。比如2012年報(bào)導(dǎo)的BE FAST研究，是一項(xiàng)評(píng)價(jià)血清神經(jīng)膠質(zhì)細(xì)絲酸性蛋白(glial fibrillary acidic protein，GFAP)對(duì)出血性腦血管疾病與缺血性腦血管疾病診斷價(jià)值的研究，納入研究的對(duì)象是205例具有腦血管疾病癥狀，且癥狀發(fā)生時(shí)間在4.5 h以內(nèi)的患者，其中，他們募集的出血性腦血管疾病患者僅為39例，而非出血性腦血管疾病患者卻高達(dá)166例［6］。

3.受檢對(duì)象的納入、排除與募集方式

研究對(duì)象的納入/排除標(biāo)準(zhǔn)的設(shè)定是開(kāi)展診斷性試驗(yàn)研究的重要環(huán)節(jié)，因?yàn)檫@在某種程度上決定了研究結(jié)論的適用范圍。納入標(biāo)準(zhǔn)通常應(yīng)該包括研究對(duì)象的主訴、病史和體征等;排除標(biāo)準(zhǔn)一般則應(yīng)為因特殊原因，無(wú)需新的診斷手段就可以確診或者排除的疾病。比如Potocki評(píng)價(jià)了MR-proANP和NT-proBNP對(duì)呼吸困難患者發(fā)生心力衰竭的診斷價(jià)值［7］。該研究的納入標(biāo)準(zhǔn)就設(shè)定為:以呼吸困難為主訴而到急診科就診的患者;排除標(biāo)準(zhǔn)為:年齡＜18歲;透析患者和創(chuàng)傷患者。這一納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)較好地反映了臨床懷疑為心力衰竭患者的特征，具有較好的臨床代表性。QUADAS標(biāo)準(zhǔn)的第二條就要求研究者在開(kāi)展診斷性試驗(yàn)研究時(shí)，應(yīng)該有明確的病例選擇標(biāo)準(zhǔn);否則，研究在該條記錄上的得分為0分或-1分，會(huì)導(dǎo)致QUADAS整體得分偏低，影響研究的總體質(zhì)量。此外，在撰寫(xiě)研究論文時(shí)，還應(yīng)該遵守STARD報(bào)告規(guī)范的第十五和十八條規(guī)定，詳細(xì)列舉最終進(jìn)入本次研究的受試對(duì)象的臨床特征，便于讀者分析研究結(jié)論的適用范圍。

研究對(duì)象的募集方式也是設(shè)計(jì)診斷性試驗(yàn)研究時(shí)需要充分考慮的一個(gè)方面，不正確的病例募集方式會(huì)導(dǎo)致最終募集到的研究對(duì)象缺乏臨床代表性，影響研究結(jié)論的可靠性。正確的病例募集方式應(yīng)該是在不違反醫(yī)學(xué)倫理學(xué)的前提下，采用隨機(jī)募集和連續(xù)募集的方式募集一段時(shí)間內(nèi)來(lái)醫(yī)院就診的，符合納入標(biāo)準(zhǔn)，不符合排除標(biāo)準(zhǔn)的人群。只有這樣，才能保證研究對(duì)象具有臨床代表性完整性，這也是為何“診斷性研究無(wú)需遵循‘均衡原則’”的原因所在。STARD報(bào)告規(guī)范的第四和第五條就要求研究人員在其研究論文中必須陳述病例的募集方式。

國(guó)內(nèi)的部分診斷性研究，可能是由于在開(kāi)展研究前并未制定確切的診斷和排除標(biāo)準(zhǔn)、病例募集方式，因此，在論文報(bào)告中并未陳述相應(yīng)的內(nèi)容，只是簡(jiǎn)單在材料與方法中說(shuō)明了研究對(duì)象的樣本量，最終的診斷結(jié)果以及一些基本的人口學(xué)特征，讓讀者無(wú)法根據(jù)研究?jī)?nèi)容分析研究結(jié)論的適用范圍以及結(jié)論的可靠性。

4.金標(biāo)準(zhǔn)的確定

臨床診斷性試驗(yàn)的評(píng)價(jià)首先要確立“金標(biāo)準(zhǔn)”，即最終可以確診疾病的標(biāo)準(zhǔn)。比如，腫瘤診斷的金標(biāo)準(zhǔn)是病理檢查，敗血癥的診斷金標(biāo)準(zhǔn)是血培養(yǎng)，冠心病的診斷金標(biāo)準(zhǔn)是冠脈造影等。需要強(qiáng)調(diào)的一點(diǎn)是，盡管金標(biāo)準(zhǔn)是作為疾病診斷的最終手段，但是這并不排斥新的手段在疾病診斷中的作用和地位。因?yàn)榻饦?biāo)準(zhǔn)雖然是疾病確診的最終標(biāo)準(zhǔn)，但是其本身也具有無(wú)法克服的缺陷，比如:病理檢查是有創(chuàng)的檢查，且檢查結(jié)果與病理醫(yī)師的經(jīng)驗(yàn)有關(guān);血培養(yǎng)耗時(shí)費(fèi)力，可能延誤患者的治療;冠脈造影對(duì)醫(yī)療設(shè)備要求較高，且具有一定的副作用(造影劑可能導(dǎo)致急性腎臟損傷)。正因如此，我們才需要去探索新的診斷手段，以彌補(bǔ)金標(biāo)準(zhǔn)的缺陷，豐富疾病的診斷手段。在開(kāi)展診斷性研究的過(guò)程中，所設(shè)立的金標(biāo)準(zhǔn)必須是公認(rèn)的的疾病診斷標(biāo)準(zhǔn)，而且，必須在報(bào)告論文中進(jìn)行詳細(xì)的陳述。這在STARD報(bào)告規(guī)范的第七條和QUADAS標(biāo)準(zhǔn)的第三和第九條是有明確規(guī)定。此外，在開(kāi)展診斷性試驗(yàn)的過(guò)程中，金標(biāo)準(zhǔn)的作用不僅僅限于診斷疾病，而還應(yīng)該包含排除疾病。即所有的受檢對(duì)象，不論目標(biāo)疾病的最終診斷是否成立，都必須接受金標(biāo)準(zhǔn)檢查。在QUADAS標(biāo)準(zhǔn)的第五和第六條中，就要求研究者在開(kāi)展診斷性研究的過(guò)程中，必須讓所有的受試對(duì)象都應(yīng)該接受金標(biāo)準(zhǔn)檢查。

需要注意的是，開(kāi)展診斷性研究時(shí)，金標(biāo)準(zhǔn)和待評(píng)價(jià)試驗(yàn)應(yīng)該相互獨(dú)立，即疾病的診斷和待評(píng)價(jià)試驗(yàn)的實(shí)施應(yīng)該相互設(shè)盲:臨床醫(yī)師在診斷疾病時(shí)并不知曉待評(píng)價(jià)試驗(yàn)的檢測(cè)結(jié)果，開(kāi)展待評(píng)價(jià)試驗(yàn)也應(yīng)該是在不知曉患者最終診斷結(jié)果的基礎(chǔ)上進(jìn)行，以避免潛在的診斷偏倚。這在QUADAS標(biāo)準(zhǔn)的第七，第十和第十一條中有明確的規(guī)定。STARD報(bào)告規(guī)范的第十一條也要求作者在撰寫(xiě)報(bào)告論文時(shí)需要闡述是否在研究過(guò)程中實(shí)施了盲法。同時(shí)我們也可以看出:與回顧性研究相比，前瞻性研究的研究質(zhì)量之所以較高，主要是因?yàn)樵谇罢靶缘难芯恐?，研究者可以?shí)施盲法，可以在制訂金標(biāo)準(zhǔn)時(shí)回避待評(píng)價(jià)試驗(yàn)。

國(guó)內(nèi)的診斷性研究報(bào)告論文，雖然大多能夠正確選擇疾病診斷的金標(biāo)準(zhǔn)，但是部分論文并未陳述是否所有的受試對(duì)象都接受了金標(biāo)準(zhǔn)測(cè)試，也未陳述金標(biāo)準(zhǔn)的實(shí)施與待評(píng)價(jià)試驗(yàn)是否相互設(shè)盲，是一種十分不嚴(yán)謹(jǐn)?shù)男袨椤?/p>

5.診斷界點(diǎn)設(shè)定的問(wèn)題

對(duì)于定性檢查結(jié)果，無(wú)需設(shè)立診斷界值，即可直接通過(guò)四格表反映待評(píng)價(jià)試驗(yàn)的診斷敏感性和特異性。而對(duì)于定量檢測(cè)的結(jié)果，一般采用受試者工作特征(ROC)曲線分析法去評(píng)價(jià)試驗(yàn)的總體診斷效率。ROC曲線以“1-特異性”為橫坐標(biāo)，以敏感性為縱坐標(biāo)，曲線越靠近左上角，其曲線下面積(AUC)越大，表明待評(píng)價(jià)試驗(yàn)的總體診斷效率越高。當(dāng)然，在進(jìn)行待評(píng)價(jià)試驗(yàn)總體效率比較的過(guò)程中，還需要借助統(tǒng)計(jì)學(xué)方法。目前，關(guān)于ROC曲線下面積的比較，在統(tǒng)計(jì)學(xué)上還存在一定的爭(zhēng)議，目前多采用Delong等［8］提出的方法進(jìn)行比較，該方法可以在Sigmaplot軟件中實(shí)現(xiàn)。值得注意的是，以ROC曲線的曲線下面積來(lái)衡量一個(gè)待評(píng)價(jià)試驗(yàn)的總體診斷效率具有一定的局限性，因?yàn)楫?dāng)曲線下面積較大時(shí)，即使是發(fā)生微小的變化，也會(huì)導(dǎo)致對(duì)診斷性能產(chǎn)生較大影響［9-10］。在此基礎(chǔ)上，有學(xué)者提出使用logistic回歸模型對(duì)待評(píng)價(jià)試驗(yàn)的診斷效率進(jìn)行評(píng)價(jià)，通過(guò)待評(píng)價(jià)試驗(yàn)的優(yōu)勢(shì)比的比較來(lái)反映待評(píng)價(jià)試驗(yàn)的診斷性能，不失為一種較好比較待評(píng)價(jià)試驗(yàn)診斷性能的方法［11］。此外，也有學(xué)者提出，在特定診斷界點(diǎn)(比如敏感性或特異性為0.95)，采用卡方檢驗(yàn)比較多個(gè)待評(píng)價(jià)試驗(yàn)在診斷敏感性或特異性上的差異，可能更具有專業(yè)意義［12］。這一思想也很快得到了學(xué)界的認(rèn)可，最近開(kāi)展的一些高質(zhì)量的研究也采用了該方法對(duì)數(shù)據(jù)進(jìn)行分析［13］。值得強(qiáng)調(diào)的是，這些統(tǒng)計(jì)學(xué)方法只適合于初步比較待評(píng)價(jià)試驗(yàn)的診斷性能，最終確定診斷待評(píng)價(jià)試驗(yàn)是否對(duì)疾病的診斷有益，引入該診斷手段以后是否有助于提高患者總體預(yù)后，還要以設(shè)計(jì)良好的隨機(jī)對(duì)照試驗(yàn)(RCT)予以證實(shí)［14-15］。

ROC曲線的走勢(shì)比較清晰地反映了待評(píng)價(jià)試驗(yàn)診斷敏感性和特異性之間的關(guān)系，為尋找最佳診斷界點(diǎn)提供了參考。一般而言，對(duì)于可以定量的待評(píng)價(jià)試驗(yàn)，通過(guò)改變?cè)\斷界點(diǎn)的方式提高診斷敏感性就會(huì)犧牲診斷特異性，反之亦然。如何確定待評(píng)價(jià)待評(píng)價(jià)試驗(yàn)的最佳診斷界點(diǎn)視專業(yè)需求而定。對(duì)于某些對(duì)敏感性要求較高的疾病，比如急性心肌梗死，在制定診斷界值時(shí)，可以適度犧牲特異性以換取診斷敏感性的提高;對(duì)于某些對(duì)診斷特異性較高的疾病(比如惡性腫瘤)，在制定診斷界值時(shí)，則需要適當(dāng)提高診斷特異性。如果疾病的診斷對(duì)敏感性和特異性具有同等需求，通常情況下可以將約登指數(shù)(YI)最大時(shí)的診斷界值作為推薦診斷界值，因?yàn)樵摻缰递^好地平衡了診斷敏感性與特異性，可以達(dá)到最高的診斷準(zhǔn)確性。

在多數(shù)情況下，多個(gè)診斷手段之間并不矛盾，因此，讀者關(guān)心的往往不是診斷手段之間孰優(yōu)孰劣的問(wèn)題，而是能否相互彌補(bǔ)?聯(lián)合使用是否有助于提高診斷準(zhǔn)確性?以往對(duì)于聯(lián)合診斷效率的評(píng)價(jià)往往采用系列診斷試驗(yàn)和平行診斷試驗(yàn)，這2種方法都存在固有的缺陷:前者以犧牲診斷敏感性換取診斷特異性;后者以犧牲診斷特異性換取診斷敏感性，而且這2種方法也無(wú)法從統(tǒng)計(jì)學(xué)上回答“聯(lián)合檢測(cè)是否有助于提高診斷準(zhǔn)確性”這一核心問(wèn)題。在診斷性試驗(yàn)研究中，為評(píng)價(jià)一個(gè)新的診斷手段(比如一個(gè)標(biāo)志物)是否能為疾病的診斷提供新的，臨床常規(guī)資料所不能提供的信息，主要有3種方法［16-17］:(1)C-statistic 采用logistic回歸整合已有的有助于疾病診斷的臨床信息(不包含待評(píng)價(jià)試驗(yàn))，構(gòu)建一個(gè)回歸方程，得到一個(gè)新指標(biāo)(命名為A);采用同樣的思路構(gòu)在上述方程中加入一個(gè)參數(shù)，即待評(píng)價(jià)試驗(yàn)，構(gòu)建另一個(gè)回歸方程，生成另一個(gè)新指標(biāo)(命名為B)。然后以ROC分析法對(duì)A和B的診斷性能進(jìn)行評(píng)價(jià)，通過(guò)比較其曲線下面積的方式分析B是否優(yōu)于A;若B優(yōu)于A，則證明待評(píng)價(jià)試驗(yàn)可以提供常規(guī)臨床指標(biāo)所不能提供的診斷信息，在臨床實(shí)踐中引入該指標(biāo)有助于提高診斷準(zhǔn)確性;(2)凈重分層改良(net reclassification improvement，NRI)

該法前期的統(tǒng)計(jì)學(xué)處理與C-statistic相同，不同之處在于在繪制了兩條ROC曲線后，并不是直接比較曲線下面積的大小，而是預(yù)先設(shè)定一個(gè)最佳診斷界點(diǎn)，繪制重分層表格，以Z檢驗(yàn)分析引入新的診斷手段以后，實(shí)驗(yàn)組和對(duì)照組劃分的總體準(zhǔn)確性是否增加;(3)綜合區(qū)分改良(integrated discrimination improvement，IDI) 該法前期的統(tǒng)計(jì)學(xué)處理與C-statistic相同，不同之處在于對(duì)于每一個(gè)特定的患者，都可以通過(guò)兩個(gè)logistic回歸方程，生成兩個(gè)指標(biāo)A和B，然后直接采用Z檢驗(yàn)比較所有患者A和B之間是否有差異。

國(guó)內(nèi)的部分診斷性試驗(yàn)研究，以參考范圍的上限作為診斷界值，是一種不科學(xué)的行為。參考范圍在一定程度上只是反映了該試驗(yàn)在表面健康的個(gè)體中的分布狀況，并沒(méi)有充分考慮其在有疾病的患者中的分布狀況，因此，不宜作為診斷界點(diǎn)。同時(shí)，大部分診斷性試驗(yàn)研究論文并未通過(guò)科學(xué)的統(tǒng)計(jì)學(xué)方法，回答“新的診斷手段是否可以彌補(bǔ)已有的診斷手段的不足?多個(gè)診斷手段聯(lián)合使用是否更有助于提高總體診斷準(zhǔn)確性?”這些疾病診療過(guò)程中臨床醫(yī)師最關(guān)心的問(wèn)題。

三、結(jié)語(yǔ)

在循證醫(yī)學(xué)思想已經(jīng)深入臨床醫(yī)學(xué)各個(gè)角落的今天，重視“證據(jù)”的質(zhì)量與論證強(qiáng)度已經(jīng)成為了廣大臨床醫(yī)師的共識(shí)。開(kāi)展高質(zhì)量的診斷性試驗(yàn)研究，撰寫(xiě)規(guī)范的診斷性研究論文，對(duì)于循證醫(yī)學(xué)的發(fā)展無(wú)疑積極的促進(jìn)作用。只有在開(kāi)展診斷性試驗(yàn)時(shí)遵循科學(xué)的設(shè)計(jì)原則，在撰寫(xiě)報(bào)告論文時(shí)遵守規(guī)范化的論文報(bào)告方式，研究的成果才能引起更多同行的關(guān)注，才能在將來(lái)制訂或者更新疾病診斷指南時(shí)占有一席之地，真正實(shí)現(xiàn)科研成果向臨床實(shí)踐的轉(zhuǎn)化。

［1］Bossuyt PM，Reitsma JB，Bruns DE，et al.The STARD statement for reporting studies of diagnostic accuracy:explanation and elaboration［J］.Clin Chem，2003，49(1):7-18.

［2］王波，詹思延.如何撰寫(xiě)高質(zhì)量的流行病學(xué)研究論文第三講診斷試驗(yàn)準(zhǔn)確性研究的報(bào)告規(guī)范——STARD介紹［J］.中華流行病學(xué)雜志，2006，27(10):909-912.

［3］Bossuyt PM，Reitsma JB，Bruns DE，et al.邁向完整、準(zhǔn)確的診斷準(zhǔn)確性研究報(bào)告:STARD計(jì)劃［J］. 中國(guó)循證醫(yī)學(xué)雜志，2006，6(7):523-528.

［4］Whiting P，Rutjes AW，Reitsma JB，et al.The development of QUADAS:a tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews［J］.BMC Med Res Methodol，2003，3:25.

［5］Whiting PF，Weswood ME，Rutjes AWS，et al.QUADAS評(píng)價(jià):一種用于診斷性研究的質(zhì)量評(píng)價(jià)工具(修訂版)［J］.中國(guó)循證醫(yī)學(xué)雜志，2007，7(7):531-536.

［6］Foerch C，Niessner M，Back T，et al.Diagnostic accuracy of plasma glial fibrillary acidic protein for differentiating intracerebral hemorrhage and cerebral ischemia in patients with symptoms of acute stroke［J］.Clin Chem，2012，58(1):237-245.

［7］Potocki M，Breidthardt T，Reichlin T，et al.Comparison of midregional pro-atrial natriuretic peptide with N-terminal pro-B-type natriuretic peptide in the diagnosis of heart failure［J］.J Intern Med，2010，267(1):119-129.

［8］DeLong ER，DeLong DM，Clarke-Pearson DL.Comparing the areas under two or more correlated receiveroperating characteristic curves:a nonparametric approach［J］.Biometrics，1988，44(3):837-845.

［9］Cook NR.Statistical evaluation of prognostic versus diagnostic models:beyond the ROC curve［J］.Clin Chem，2008，54(1):17-23.

［10］Cook NR.Use and misuse of the receiver operating characteristic curve in risk prediction［J］.Circulation，2007，115(7):928-935.

［11］Romero C，te Velde L，Ponsen H，et al.C-statistics versus logistic regression for assessing the performance of qualitative diagnostic tests［J］.Clin Chem Lab Med，2012，50(1):73-76.

［12］Levinson SS.Letter to the editor reply:statistical methods for assessment of added usefulness of new biomarkers［J］.Clin Chem Lab Med，2011，49(7):1241-1242.

［13］Zhao Z，Zhao Q，Warrick J，et al.Circulating microRNA miR-323-3p as a biomarker of ectopic pregnancy［J］.Clin Chem，2012，58(5):896-905.

［14］Sackett DL，Haynes RB.The architecture of diagnostic research［J］.BMJ，2002，324(7336):539-541.

［15］Levinson SS.Clinical validation of biomarkers for predicting risk［J］.Adv Clin Chem，2009，48:1-25.

［16］Pencina MJ，D'Agostino RB，Vasan RS.Statistical methods for assessment of added usefulness of new biomarkers［J］.Clin Chem Lab Med，2010，48(12):1703-1711.

［17］Pencina MJ，D'Agostino RB Sr，D'Agostino RB Jr，et al.Evaluating the added predictive ability of a new marker:from area under the ROC curve to reclassification and beyond［J］.Stat Med，2008，27(2):157-172.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

開(kāi)展實(shí)驗(yàn)室診斷試驗(yàn)研究值得注意的幾個(gè)問(wèn)題

一、QUADAS標(biāo)準(zhǔn)和STARD報(bào)告規(guī)范概述

二、從QUADAS標(biāo)準(zhǔn)和STARD報(bào)告規(guī)范談開(kāi)展診斷性研究值得注意的幾個(gè)問(wèn)題

三、結(jié)語(yǔ)

一、QUADAS標(biāo)準(zhǔn)和STARD報(bào)告規(guī)范概述

二、從QUADAS標(biāo)準(zhǔn)和STARD報(bào)告規(guī)范談開(kāi)展診斷性研究值得注意的幾個(gè)問(wèn)題

三、結(jié)語(yǔ)