劉柳,周印,李慶姝,吳佳美,謝亮華,毛蕓*
1.重慶醫(yī)科大學附屬第一醫(yī)院放射科,重慶 400016;2.重慶醫(yī)科大學病理教研室,重慶 400016;3.重慶市東南醫(yī)院放射科,重慶 401336
自1986年Bosniak提出最初的腎囊性病變分級以來,在預測腎臟囊性病變良惡性和指導臨床處理方面發(fā)揮著重要作用[1]。1993年在原分級系統(tǒng)基礎上增加了IIF級,并于2005年對使用中的潛在錯誤進行更新[2-3]。然而,目前廣泛使用的腎臟囊性病變Bosniak分級(2005版)在實踐中仍然存在一些不足,如觀察者間一致性較差,尤其是基于主觀標準的Ⅱ級、ⅡF級和Ⅲ級病灶[4];同時不同文獻報道的各級腎囊性病變惡性率差異較大[5];此外,在Ⅲ級腎囊性病變患者約50%為良性,并不能從手術中獲益[6-7]。
為了解決2005版存在的問題,腎臟囊性病變Bosniak分級(2019版)做出修正[6]。在2019版中,對于以前的主觀術語(如輕度增厚和稍多等)做出定量規(guī)定;并刪除不可測量/可測量強化及和Ⅱ級及ⅡF級中高密度囊腫大小的標準。此外,該分級系統(tǒng)新增了腎囊性病變的定義,規(guī)定強化實性成分≤25%為囊性病變,從而區(qū)分腎囊性病變與惡性腫瘤壞死[6],避免將伴有壞死的惡性腫瘤分入Ⅳ級,影響分級標準的應用。
本研究以病理結果為標準,擬通過對2005版與2019版的診斷性能評估及觀察者間一致性分析,明確2019版Bosniak分級在臨床中的應用價值。
1.1 研究對象 收集重慶醫(yī)科大學附屬第一醫(yī)院2013年7月9日—2020年10月9日經手術切除并有準確術后病理結果的腎囊性病變患者,所有患者術前1個月內均行腎臟多期CT增強檢查。納入362例患者共369個病灶,其中男198例,女164例;年齡16~86歲,中位年齡[59.0(48.0,65.5)]歲。排除標準:①實性成分>25%;②多囊腎;③局灶性腎發(fā)育不良;④圖像質量不滿足分級要求;⑤腎囊性病變合并感染或出血。本研究通過重慶醫(yī)科大學附屬第一醫(yī)院倫理委員會批準(2021-508),并獲得患者知情同意。
1.2 儀器與方法 CT檢查采用以下1種多層螺旋CT機進行腹部對比增強CT檢查,包括Siemens Somatom Sensation 64、GE Discovery CT 750m、GE LightSpeed VCT。掃描參數(shù):管電壓100 kV,自動毫安秒技術(有效毫安秒210~250 mAs),螺距1,矩陣512×512,層厚5 mm,層間距5 mm。增強掃描采用高壓注射器經肘正中靜脈以4 ml/s注射碘對比劑(300~370 mgI/ml),劑量1~1.5 ml/kg,運用團注追蹤技術,在腎動脈分叉水平腹主動脈放置感興趣區(qū),在達到觸發(fā)衰減閾值(100 Hu)6 s后開始掃描獲得皮質期,延遲50~60 s獲得腎實質期圖像,延遲3 min獲得延遲期圖像。
1.3 圖像分析 由2名分別具有15年以上(副主任醫(yī)師A)和10年以上(主治醫(yī)師B)腹部CT診斷經驗的放射科醫(yī)師進行圖像分析,2名醫(yī)師采用單盲法(不知患者信息及病理結果)參考分級標準[6,8]獨立完成2005版和2019版分級,均先進行2005版分級,2周后再進行2019版分級。評估內容:病變大小、病變平掃及腎實質期CT值,囊壁厚度、囊壁是否強化、分隔數(shù)目、分隔厚度、分隔是否強化、壁結節(jié)(有或無;與囊壁或分隔成銳角或鈍角凸起;大?。┑忍卣?。此外,根據(jù)臨床處理不同(I、Ⅱ、ⅡF級為非手術,III、IV級為潛在手術),將所有5級病變分為兩組,I~ⅡF級為良性預測組、Ⅲ~Ⅳ級為惡性預測組。
1.4 統(tǒng)計學方法 應用SPSS 26.0和MedCalc 19.7.0軟件,不符合正態(tài)分布的定量資料采用M(Q1,Q3)表示。定性資料采用例數(shù)或百分比表示。2個版本觀察者間的一致性用加權Cohen'sKappa系數(shù)評價。以病理診斷為“金標準”,計算高年資醫(yī)師A分級結果的特異度、敏感度、準確度、陽性預測值、陰性預測值、假陽性率、假陰性率評估診斷效能,用配對χ2檢驗比較2個版本的敏感度和特異度。P<0.05為差異有統(tǒng)計學意義。
2.1 患者臨床特征 362例患者中,良性腎囊性病變340例(92%),惡性腎囊性病變29例(8%)。患者的臨床特征見表1。
表1 362例腎囊性病變共369個病灶的臨床特征
2.2 2005版和2019版觀察者間一致性比較 所有病變的2005版、2019版分級均具有強一致性(加權Kappa=0.834、0.913)。如果僅包含Ⅱ、ⅡF和Ⅲ級腎囊性病變,2005版、2019版分別有92例和72例腎囊性病變。對2005版的92例腎囊性病變,2005版和2019版的加權Kappa系數(shù)分別為0.667(P<0.001)和0.866(P<0.001);對2019版的72例腎囊性病變,2005版和2019版的加權Kappa系數(shù)分別為0.624(P<0.001)和0.768(P<0.001)。2005版、2019版各特征的加權Kappa系數(shù)分別為0.657~0.789、0.777~0.937,2019版一致性均略高于2005版(表2)。
表2 2005版及2019版分級各特征的觀察者間一致性(加權Kappa)
2.3 2005版和2019版Bosniak分級的診斷性能 對369例腎囊性病變進行分析,2005版和2019版Bosniak分級良惡性診斷效能均較好,且特異度和敏感度相似(表3)。為進一步明確Bosniak標準對復雜囊性病變的診斷能力,本研究去除322例腎囊腫(病理診斷為腎囊腫且2名醫(yī)師2019版Bosniak分級均為I級或Ⅱ級)后,對剩余47例病灶再次進行評估(表3),結果表明2005版和2019版仍具有相似的敏感度(82.8%比86.2%;χ2=0.000,P=1.00),2個版本的診斷特異度明顯降低,2005版較2019版降低更為明顯,但2個版本的特異度差異無統(tǒng)計學意義(56.6%比72.2%;χ2=1.333,P=0.25)。
表3 總樣本及去囊腫樣本的2005版和2019版Bosniak分級的診斷效能
腎囊性病變各級的分布(2005版和2019版)、分級變化和惡性率變化見表4。與2005版相比,2019版病灶的分級更加符合病理良惡性結果,有18個降級病灶,且4例良性病灶均更準確地歸入良性預測組(包括混合性上皮間質腫瘤和腎囊腫);有14個升級病灶,且1例惡性病灶歸入惡性預測組(為透明細胞癌)。通過升級或降級改變分級的病例見圖1~3。
圖1 男,60歲,腎囊腫。CT平掃(A)和增強掃描腎實質期(B)示左側腎囊性病變,囊壁光滑無增厚,增強掃描后囊壁(箭)可見強化。根據(jù)2005版分為Ⅱ級,囊壁可見可觀察的強化;根據(jù)2019版分為I級,囊壁厚度≤2 mm
表4 腎囊性病變在Bosniak分級(2005版和2019版)中的各級分布和惡性率
本研究根據(jù)2005版和2019版Bosiniak分級,對369例經病理證實的腎囊性病變進行分級,雖然2個版本的觀察者間一致性均較強,但2019版高于2005版,提高了結節(jié)和分隔特征(包括分隔數(shù)目、強化、形態(tài))的一致性。在診斷效能方面,2個版本的診斷效能無顯著差異,但排除322例I、Ⅱ級腎囊腫病灶后,2個版本的診斷特異度下降,2019版的特異度較2005版有升高趨勢,但無顯著差異。
圖2 女,26歲,混合性上皮間質腫瘤。CT平掃(A)和增強掃描腎實質期(B)示右側腎囊性病變內均勻增厚分隔,增強掃描后分隔可見強化。根據(jù)2005版分為Ⅲ級,由于分隔增厚且為可測量強化(箭);根據(jù)2019版分為ⅡF級,分隔均勻增厚,厚度為3 mm(箭)
圖3 男,38歲,透明細胞癌。CT平掃(A)和增強掃描腎實質期(B)示左側腎囊性病變內多發(fā)分隔,增強掃描后分隔可見強化。根據(jù)2005版分為Ⅲ級,由于分隔增厚且為可測量強化,并未見結節(jié)顯示;根據(jù)2019版分為Ⅳ級,分隔上可見7 mm的鈍性凸起(箭)
本研究中,2005版分級的觀察者間一致性與曾紅春等[9]的研究結果相似(Kappa=0.83),但無論總的還是各分級特征分級,2019版觀察者間一致性均高于2005版,與Bai等[10]的研究結果相符,歸因于2019版有更客觀和更精確的分類標準。既往研究發(fā)現(xiàn)納入I級和Ⅳ級腎囊性病變會提高分級的觀察者間一致性[10-11],本研究與既往研究結果相似。在各分級特征的一致性分析中,2019版中結節(jié)和分隔特征的一致性提高最明顯,從較強提升至強,進一步證實重新定義分級特征的必要性和可行性。
由于惡性腎囊性腫瘤的生物學行為偏向惰性,在治療諸多III、IV級腫塊時,采用定期隨訪監(jiān)測也會獲得與手術切除相似的較好預后[12-13],因此2019版Bosniak分級更強調腎囊性病變的特異度而不是敏感度,這些分級標準變化可降低部分腎囊性病變的分級,從而減少手術治療,這也是制訂2019版新標準的原因之一[6,14]。2019版是否提高診斷效能目前尚存在爭議[10,15],Bai等[10]和Park等[15]的研究表明,2019版較2005版特異度提高,敏感度降低或無明顯差異;Dana等[16]研究表明2019版不能提高診斷特異度。本研究分析所有樣本發(fā)現(xiàn)腎囊腫所占比例較高,可能潛在提高了診斷準確度。因此,本研究刪除了能提高特異度的I、II級腎囊腫樣本,2個版本的特異度無顯著差異,與Dana等[16]的研究結果相似,但2019版的特異度較2005版有提高的趨勢,其原因可能為假陽性率降低。2019版弱化了2005版中可測量強化作為Ⅲ級及Ⅳ級病灶的充分條件。如在2005版中,可測量強化的囊壁或分隔至少歸為Ⅲ級,但在2019版中可降至Ⅱ級或ⅡF級,從而降低了假陽性率。這在本研究中得以證實,2例分隔厚度<3 mm的混合性上皮間質腫瘤均由2005版Ⅲ級降為2019版ⅡF級。
2005版和2019版中均分類錯誤的良性病例主要包括混合性上皮間質腫瘤和血管平滑肌脂肪瘤。目前研究認為單純影像檢查尚不能準確區(qū)分混合性上皮間質腫瘤和其他惡性腎囊性病變[17-18],往往被誤分至Ⅲ級或Ⅳ級。此外,本研究中完全囊變的血管平滑肌脂肪瘤也難以在CT上準確分級,MRI中DIXON序列可能有助于判斷血管平滑肌脂肪瘤中的脂肪成分[19-21]。錯分的惡性病例為組織學分級較低的腎透明細胞癌或低惡性潛能的多房性囊性腫瘤,但對于此類病變,定期隨訪監(jiān)測與手術切除預后相似[12,22]。
本研究的局限性:①未納入MRI分級標準,但目前對MRI分級準確性是否優(yōu)于CT尚存在爭議[11,15,23],有待進一步驗證;②本研究為回顧性分析,分析采用5 mm層厚,與指南[14]推薦的3 mm層厚不一致,可能會對細微結構(如分隔及囊壁增厚)的判斷存在不準確性。
綜上所述,與2005版相比,2019版Bosniak分級通過細化標準可以提高觀察者間的一致性,且診斷特異度呈升高趨勢,從而減少良性或低度惡性腫瘤患者的手術率,提高其生存獲益。