丁 航,劉 源,張連峰,周 琳
(鄭州大學(xué)第一附屬醫(yī)院 消化內(nèi)科,河南 鄭州 450052)
IgG4相關(guān)性疾病(IgG4-related disease, IgG4-RD)是一種可累及胰腺、膽管、唾液腺、淚腺等全身多個(gè)器官的自身免疫性疾病,臨床特征為受累器官或組織彌漫性或局灶性腫大及硬化,導(dǎo)致阻塞或壓迫癥狀,常伴有血清IgG4水平增高,病理特征為受累組織中代表性IgG4陽(yáng)性漿細(xì)胞浸潤(rùn)[1]。由于人們對(duì)IgG4-RD開(kāi)始認(rèn)識(shí)的時(shí)間較晚,并且其臨床表現(xiàn)易與其他疾病如惡性腫瘤相混淆,從而導(dǎo)致誤診進(jìn)一步選擇不恰當(dāng)?shù)闹委煼桨?。目前,?guó)際上已推出了IgG4-RD綜合診斷標(biāo)準(zhǔn)以及病理診斷共識(shí),一些器官特異性診斷標(biāo)準(zhǔn)如胰腺、膽管、腎臟也得到了廣泛應(yīng)用,其中病理組織學(xué)仍是IgG4-RD診斷的金標(biāo)準(zhǔn)[2]。但病理檢查為有創(chuàng)性操作,臨床不易開(kāi)展。2001年,Hamano 等[3]開(kāi)創(chuàng)性地發(fā)現(xiàn)血清 IgG4水平對(duì)自身免疫性胰腺炎(AIP)有較高的診斷優(yōu)勢(shì),之后有越來(lái)越多研究聚焦于血清 IgG4水平對(duì)IgG4-RD的診斷價(jià)值。然而,不同的研究間結(jié)果存在較大的差異,有研究表明半數(shù)以上病理證實(shí)的IgG4-RD患者不會(huì)出現(xiàn)血清IgG4升高[4]。因此,本研究進(jìn)行此診斷性Meta分析,旨在闡明血清IgG4水平對(duì)IgG4-RD的診斷價(jià)值。
1.1文獻(xiàn)與檢索 在美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館 PubMed 數(shù)據(jù)庫(kù)、荷蘭醫(yī)學(xué)文摘 Embase 數(shù)據(jù)庫(kù)、萬(wàn)方數(shù)據(jù)庫(kù)、維普數(shù)據(jù)庫(kù)(VIP)和中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)(CNKI)全面檢索,收集自2011年1月1日至2020年1月1日所有以探討血清IgG4對(duì)IgG4相關(guān)性疾病診斷價(jià)值為目的的英文文獻(xiàn),以IgG4, Serum IgG4, serum immunoglobulin g4, IgG4-Related Disease, Autoimmune Pancreatitis, Mikulicz's disease, IgG4-RD為檢索詞進(jìn)行檢索,并手工檢索綜述文獻(xiàn)或已納入文獻(xiàn)的參考文獻(xiàn)作為補(bǔ)充,全面收集相關(guān)資料。
1.2納入及排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):納入文獻(xiàn)以評(píng)估血清IgG4對(duì)IgG4-RD診斷價(jià)值為目的;IgG4相關(guān)性疾病診斷采取IgG4-RD綜合診斷標(biāo)準(zhǔn)、IgG4-RD病理共識(shí)或器官特異性診斷標(biāo)準(zhǔn);原始文獻(xiàn)中應(yīng)給出或可以計(jì)算出構(gòu)成四格表的數(shù)值,即真陽(yáng)性(true positive, TP)、假陽(yáng)性(false negative, FN)、假陰性(false positive, FP)及真陰性(true negative, TN)例數(shù)。
排除標(biāo)準(zhǔn):重復(fù)報(bào)道的文獻(xiàn)(當(dāng)懷疑兩個(gè)研究有重合的病例時(shí),選取納入病例數(shù)更大的研究);文獻(xiàn)類型為述評(píng)、書(shū)信、會(huì)議摘要、講座等非原始研究,動(dòng)物實(shí)驗(yàn)研究以及會(huì)議論文等;IgG4-RD組或?qū)φ战M樣本量小于10例;資料不全或無(wú)法從原始文獻(xiàn)中獲取四格表數(shù)據(jù)的研究。
1.3文獻(xiàn)篩選及資料提取 由2名研究者遵循盲法原則獨(dú)立進(jìn)行文獻(xiàn)篩選以及對(duì)納入文獻(xiàn)進(jìn)行數(shù)據(jù)提取,提取內(nèi)容包括第一作者、發(fā)表年份、國(guó)家、樣本量、診斷標(biāo)準(zhǔn)、血清IgG4檢測(cè)方法、截?cái)嘀?、以及TP、FP、TN 和 FN 等。篩選及提取過(guò)程中如研究者意見(jiàn)不一致,則通過(guò)協(xié)商或與第3名研究者討論解決。
1.4文獻(xiàn)質(zhì)量評(píng)價(jià) 采用診斷準(zhǔn)確性研究的質(zhì)量評(píng)價(jià)工具QUADAS-2[5]評(píng)價(jià)納入文獻(xiàn)的質(zhì)量及發(fā)生偏倚的可能性。該標(biāo)準(zhǔn)包含有4個(gè)域的評(píng)價(jià):病例選擇、待評(píng)價(jià)試驗(yàn)、金標(biāo)準(zhǔn)、病例流程和進(jìn)展情況,從偏倚風(fēng)險(xiǎn)和適用性兩個(gè)方面進(jìn)行。一共有11個(gè)條目,偏倚風(fēng)險(xiǎn)最終以“低”、“高”、“不明確”來(lái)評(píng)定?!安幻鞔_”僅指研究報(bào)道的信息不充分。
1.5統(tǒng)計(jì)學(xué)方法 采用Meta-Disc 1.4軟件及STATA15.0軟件中“midas”命令進(jìn)行統(tǒng)計(jì)學(xué)分析。通過(guò)雙變量模型計(jì)算合并敏感度、合并特異度、合并診斷優(yōu)勢(shì)比(DOR)、合并陽(yáng)性似然比(PLR)、合并陰性似然比(NLR),繪制相關(guān)森林圖并擬合受試者工作特征曲線(summary receiver operating characteristic,SROC)并計(jì)算SROC曲線下面積(area under the curve, AUC)描述診斷準(zhǔn)確性,AUC越接近1表示診斷性能越高,同時(shí)描繪出其95%的置信區(qū)間(confidence interval,CI)和 95%預(yù)測(cè)區(qū)間。若研究間存在異質(zhì)性(I2>50%),則進(jìn)一步分析異質(zhì)性來(lái)源,觀察SROC曲線是否存在“肩臂”狀,并結(jié)合Spearman相關(guān)系數(shù)判斷有無(wú)閾值效應(yīng),若無(wú)閾值效應(yīng),進(jìn)行亞組分析進(jìn)一步探討異質(zhì)性來(lái)源。采用漏斗圖及Deeks檢驗(yàn)評(píng)價(jià)納入文獻(xiàn)的發(fā)表偏倚情況,P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
2.1文獻(xiàn)檢索結(jié)果 共有17篇文獻(xiàn), 17 095例納入本次Meta分析[6-22]。其中IgG4-RD患者1 545例,對(duì)照組15 550例。文獻(xiàn)篩選的流程見(jiàn)圖1,納入文獻(xiàn)的基本特征見(jiàn)表1。
圖1 文獻(xiàn)篩選流程及結(jié)果
表1 納入文獻(xiàn)的基本特征
2.2文獻(xiàn)質(zhì)量評(píng)價(jià) 應(yīng)用QUADAS-2評(píng)分,由2名研究者分別對(duì)各研究的質(zhì)量獨(dú)立進(jìn)行評(píng)估,存在不一致的意見(jiàn)時(shí)協(xié)商統(tǒng)一,由于一些研究未說(shuō)明僅限納入1型AIP,使得病例選擇適用性領(lǐng)域出現(xiàn)未知風(fēng)險(xiǎn)。見(jiàn)圖2。
圖2 應(yīng)用QUADAS-2評(píng)分對(duì)納入文獻(xiàn)進(jìn)行質(zhì)量評(píng)估的情況
2.3主要指標(biāo)結(jié)果及異質(zhì)性檢驗(yàn) 納入文獻(xiàn)中血清IgG4的臨界值為1.3~1.44 g/L之間,各研究合并的靈敏度0.88(95%CI:0.81-0.93),特異度為0.89(95%CI:0.83-0.93),陽(yáng)性似然比為8.3( 95%CI:5.1-13.7),陰性似然比為0.13(95%CI:0.08-0.22),診斷優(yōu)勢(shì)比為62(95%CI:25-153)。繪制SROC曲線,計(jì)算曲線下面積AUC為0.95(95%CI:0.92-0.96),對(duì)靈敏度和特異度進(jìn)行異質(zhì)性檢驗(yàn)(Q檢驗(yàn)),靈敏度I2=91.4%,特異度I2=97.8%,P<0.05,提示各文獻(xiàn)間存在顯著的異質(zhì)性。
在所有納入文獻(xiàn)中,11篇文獻(xiàn)道了血清IgG4>2×正常值上限(ULN)時(shí)的診斷價(jià)值,臨界值波動(dòng)在2.7~2.8 g/L之間,包含了1 326例IgG4-RD患者及13750例對(duì)照。各研究合并的靈敏度0.59(95%CI:0.47-0.7),特異度為0.96(95%CI:0.94-0.97),陽(yáng)性似然比為14.3(95%CI:9.1-22.7),陰性似然比為0.42(95%CI:0.32-0.57),診斷優(yōu)勢(shì)比為34(95%CI:17-69)。SROC曲線的曲線下面積AUC=0.95(95%CI:0.92-0.96),進(jìn)行異質(zhì)性檢驗(yàn)發(fā)現(xiàn)靈敏度I2=93.2%,特異度I2=92.2%,P<0.05,提示文獻(xiàn)間異質(zhì)性顯著。見(jiàn)圖3~4。
圖3A IgG4診斷IgG4-RD的合并敏感度及特異度
圖3B IgG4>2×ULN診斷IgG4-RD的合并敏感度及特異度
圖4A IgG4診斷IgG4-RD的SROC曲線 圖4B IgG4>2×ULN診斷IgG4-RD的SROC曲線
2.4亞組分析 各研究間異質(zhì)性較顯著,觀察兩條SROC曲線發(fā)現(xiàn)均不存在“肩臂狀”分布,且Spearman相關(guān)系數(shù)在臨界值為1.3~1.44 g/L時(shí)為-0.368,P=0.295,當(dāng)臨界值>2×ULN時(shí)Spearman相關(guān)系數(shù)=-0.582,P=0.06,提示兩組研究均不存在閾值效應(yīng)。故考慮異質(zhì)性由于非閾值效應(yīng)引起,進(jìn)行亞組分析尋找異質(zhì)性來(lái)源,將納入文獻(xiàn)按地區(qū)、疾病類型以及樣本量大小進(jìn)行亞組分析,發(fā)現(xiàn)不同地區(qū)、是否僅納入AIP患者以及IgG4-RD患者樣本量是否>100都可能是異質(zhì)性的來(lái)源,見(jiàn)表2~3。
表2 IgG4臨界值為1.3~1.44 g/L時(shí)亞組分析結(jié)果
2.4發(fā)表偏倚檢測(cè) 分別對(duì)臨界值為1.3~1.44 g/L時(shí)納入的17篇文獻(xiàn)及臨界值為2.7~2.8 g/L時(shí)納入的11篇文獻(xiàn)檢驗(yàn)是否存在發(fā)表偏倚,采用Deeks法進(jìn)行漏斗圖不對(duì)稱檢驗(yàn),發(fā)現(xiàn)漏斗圖對(duì)稱,P值分別為0.532和0.38,故不存在發(fā)表偏倚,見(jiàn)圖5。
2.5敏感性分析 采用逐一剔除所納入的研究并重新進(jìn)行合并的方法,觀察各綜合診斷效能的波動(dòng)來(lái)評(píng)估結(jié)論的穩(wěn)定性,結(jié)果無(wú)實(shí)質(zhì)性改變,說(shuō)明本研究結(jié)果穩(wěn)定性好,見(jiàn)圖6。
IgG4相關(guān)性疾病為近年來(lái)新認(rèn)識(shí)的一種自身免疫性疾病,可累及胰腺、膽管、涎腺、淚腺、腎臟、腹膜后組織等全身多個(gè)器官,臨床表現(xiàn)缺乏特異性,易與其他疾病相混淆。盡管IgG4-RD的診斷金標(biāo)準(zhǔn)為組織病理檢查,但由于病理檢查的有創(chuàng)性以及部分器官如胰腺、腹膜后活檢難度較大,從而限制了其臨床大規(guī)模應(yīng)用[23]。因此,血清IgG4檢測(cè)在IgG4-RD的診斷過(guò)程中備受重視。然而,一些其他的疾病如自身免疫性疾病、惡性腫瘤、血管炎、淋巴瘤、多中心型Castleman病中也可出現(xiàn)IgG4升高,且部分IgG4-RD患者可能表現(xiàn)IgG4正常[24]。之前的研究多聚焦于IgG4對(duì)AIP與胰腺癌鑒別診斷的價(jià)值[25-26],鑒于此,本研究對(duì)血清IgG4對(duì)IgG4-RD的診斷價(jià)值進(jìn)行Meta分析。
本研究共計(jì)納入了17篇相關(guān)文獻(xiàn),計(jì)算得到IgG4對(duì)診斷IgG4-RD的匯總靈敏度為0.88,匯總特異度為0.89,DOR為62,SROC曲線的AUC也達(dá)到了0.95,表明血清IgG4檢測(cè)有較高的準(zhǔn)確性及較好的鑒別診斷價(jià)值。研究表明,血清IgG4的診斷特異度隨臨界值升高而升高,由美國(guó)風(fēng)濕病學(xué)會(huì)(ACR) 及歐洲風(fēng)濕病聯(lián)盟(EULAR)提出的IgG4 相關(guān)性疾病分類標(biāo)準(zhǔn)建議,血清IgG4升高至2~5×ULN范圍內(nèi)得6分,而升高> 5×ULN得11分,結(jié)合其他標(biāo)準(zhǔn)評(píng)分后,當(dāng)總分達(dá)20且可排除其他疾病,即可診斷IgG4-RD[27]。另外,AIP的國(guó)際診斷共識(shí)(ICDC)也將IgG4臨界值>2×ULN列為1級(jí)證據(jù)[28]。我們也對(duì)臨界值為2×ULN進(jìn)行了分析,結(jié)果顯示,盡管匯總特異度達(dá)到了0.96,但靈敏度同時(shí)降至0.59,AUC未出現(xiàn)明顯變化,而DOR降至34,這說(shuō)明將臨界值提高并沒(méi)有明顯的診斷優(yōu)勢(shì)。
盡管我們盡可能納入更多同質(zhì)性研究,并同時(shí)避免選擇偏倚,但各個(gè)研究之間仍表現(xiàn)出顯著的異質(zhì)性。本研究發(fā)現(xiàn)納入文獻(xiàn)之間并不存在閾值效應(yīng),因此,非閾值效應(yīng)為此次分析中異質(zhì)性的來(lái)源。本研究中亞組分析顯示,不同地區(qū)、是否僅納入AIP患者以及樣本量大小都可能是異質(zhì)性的來(lái)源。血清IgG4對(duì)亞洲患者診斷的整體敏感度及特異度高于歐美患者,由于一些研究并未準(zhǔn)確區(qū)分AIP的亞型,這可能是由于歐美國(guó)家在對(duì)AIP患者研究中納入較多2型AIP患者所致。與1型AIP不同,2型AIP少有血清IgG4升高,且更常見(jiàn)于西方國(guó)家[28],從而降低了IgG4的診斷性能。我們的結(jié)果也顯示血清IgG4對(duì)IgG4-RD患者診斷性能優(yōu)于僅包含AIP的患者組,這也驗(yàn)證了這一推斷。另外,不同種族之間也會(huì)出現(xiàn)血清IgG4水平的差異,亞洲地區(qū)IgG4-RD患者IgG4陽(yáng)性率明顯高于歐美地區(qū)[29],另外有研究表明亞洲人及黑人血清基礎(chǔ)IgG4水平高于白人,且差異有統(tǒng)計(jì)學(xué)意義[30]。IgG4-RD為系統(tǒng)性全身疾病,診斷標(biāo)準(zhǔn)眾多,不同的診斷標(biāo)準(zhǔn)以及血清IgG4檢測(cè)手段差異也可能是異質(zhì)性來(lái)源。除此之外,各個(gè)研究的對(duì)照組依據(jù)不同的研究目的而招募不同的人群,這也可能是文獻(xiàn)之間出現(xiàn)異質(zhì)性的原因。
我們的研究也存在一些不足:①檢索文獻(xiàn)僅限于英語(yǔ),會(huì)遺漏其他語(yǔ)種的高質(zhì)量研究,在時(shí)間上我們選擇檢索2011年之后的文獻(xiàn),這是由于IgG4-RD僅在10年前才被正式提出,但這可能遺漏高質(zhì)量的文獻(xiàn),造成選擇偏倚;②盡管使用亞組分析尋找異質(zhì)性來(lái)源,但一些亞組內(nèi)仍存在較高異質(zhì)性,由于納入研究數(shù)目較少,未進(jìn)一步尋找異質(zhì)性來(lái)源。然而,由于不同診斷標(biāo)準(zhǔn)、IgG4檢測(cè)手段、對(duì)照組設(shè)置等因素,異質(zhì)性難以完全避免;③一些高質(zhì)量的研究中血清IgG4水平以平均值的形式報(bào)道,無(wú)法提取四格表從而被排除,這可能影響最終的結(jié)果。
總之,我們的研究證明血清IgG4在IgG4-RD的診斷中具有較高的參考價(jià)值,相對(duì)于病理檢查效率更高且更簡(jiǎn)便。然而由于地區(qū)、樣本量以及疾病類型的影響,文獻(xiàn)之間存在較大的異質(zhì)性,仍需更多前瞻性高質(zhì)量診斷試驗(yàn)進(jìn)行驗(yàn)證,進(jìn)一步證明IgG4的應(yīng)用價(jià)值。