張正華,蔡雅倩,韓丹,周小君,黃益龍,段慧
昆明醫(yī)科大學(xué)第一附屬醫(yī)院醫(yī)學(xué)影像科,云南昆明 650000; *通訊作者 韓丹 kmhandan@sina.com
隨著高分辨率CT(HRCT)在肺癌早期篩查應(yīng)用的普及,圖像數(shù)量倍增及對小結(jié)節(jié)顯示率增高使閱片工作量劇增。高強(qiáng)度工作可導(dǎo)致影像科醫(yī)師視覺疲勞,加之經(jīng)驗不足等,不可避免地導(dǎo)致小結(jié)節(jié)的漏診和誤診。如何在人力資源不足的情況下,在大量圖像中準(zhǔn)確檢出肺結(jié)節(jié)并早期定性成為臨床的迫切需求?;谏疃葘W(xué)習(xí)的人工智能(artificial intelligence,AI)憑借其較準(zhǔn)確的算法模型可快捷地檢出結(jié)節(jié),并已開始在臨床試用。然而目前有關(guān)AI 對肺結(jié)節(jié)檢測效能的相關(guān)研究報道較少,且尚無明確定論[1-2]。本研究擬通過對比不同級別醫(yī)師與AI 對肺結(jié)節(jié)的檢出能力,評價AI 對肺結(jié)節(jié)檢出的敏感性。
1.1 研究對象 隨機(jī)抽取2018年10月—2019年6月昆明醫(yī)科大學(xué)第一附屬醫(yī)院行胸部CT 平掃患者550 例,其中男382 例,女168 例;年齡18~78 歲,平均(58.6±11.7)歲。納入標(biāo)準(zhǔn):①肺結(jié)節(jié)1~40 枚,且直徑≤3 cm;②CT 圖像層厚為1 mm。排除標(biāo)準(zhǔn):①肺部彌漫性病變;②按1~5 分制評價圖像質(zhì)量,排除評分≤3 分者。評分細(xì)則:1 分,無法顯示正常結(jié)構(gòu),完全不能滿足診斷要求;2 分,肺紋理及分支模糊,無法滿足診斷要求;3 分,邊緣模糊,肺紋理及分支尚可,基本可以滿足診斷要求;4 分,邊緣略模糊,肺紋理及分支清晰,滿足診斷要求;5 分,邊緣清晰,肺紋理及分支清晰,完全滿足診斷要求[3]。
1.2 儀器與方法
1.2.1 CT 檢查 采用Siemens Somatom Definition AS 128、Siemens Somatom Definition Flash 及聯(lián)影UCT 760 CT 機(jī)行胸部HRCT 掃描。掃描參數(shù):①Siemens Somatom Definition AS 128 層螺旋CT 機(jī)及Siemens Somatom Definition Flash:管電壓100 kV,管電流80 mAs,半自動管電壓調(diào)制,自動管電流調(diào)制,螺距0.938,重建卷積函數(shù)采用B70f。②聯(lián)影UCT 760:平掃管電壓100 kV,管電流80 mAs,自動管電流調(diào)制,螺距0.938、肺窗濾波函數(shù)B-SHARP-C。重建層厚1 mm,層間距1 mm。掃描范圍從肺尖至肺底全部區(qū)域,兩側(cè)包括胸壁、腋窩。觀察采用肺窗窗寬1500 Hu、窗位-400 Hu。
1.2.2 結(jié)果判讀 由2名從事胸部影像診斷的主任醫(yī)師采用盲法對550 例患者的胸部CT 圖像共同閱片,分析結(jié)節(jié)的數(shù)目、位置、大小。當(dāng)2 名主任醫(yī)師判讀結(jié)果不一致時,請第3 名主任醫(yī)師共同協(xié)商確定一致性意見作為參照標(biāo)準(zhǔn),以此計算肺結(jié)節(jié)的檢出率和假陽性率。
根據(jù)肺結(jié)節(jié)位置分為胸膜下結(jié)節(jié)(與胸膜相連)、中心性結(jié)節(jié)(距肺門2.0 cm 以內(nèi))、外周性結(jié)節(jié)(肺門區(qū)以外,但不與胸膜相連);根據(jù)結(jié)節(jié)最大徑分為小結(jié)節(jié)(<0.5 cm)、中等結(jié)節(jié)(0.5~1.0 cm)、大結(jié)節(jié)(>1.0 cm)。
1.2.3 分組及測定方法 根據(jù)閱片醫(yī)師不同分成4組:A 組5 名5年制本科實習(xí)生(第5年臨床實習(xí),已從事肺部CT 診斷工作3 個月);B 組5 名住院醫(yī)師(從事住院醫(yī)師工作3年);C 組5 名主治醫(yī)師(從事主治醫(yī)師工作3年);D 組為AI(醫(yī)學(xué)影像輔助診斷軟件Dr.Wise Lung Analyzer,版本V1.1.0.1,型號MIDSPNA)軟件。閱片內(nèi)容:①每組結(jié)節(jié)檢出的數(shù)目、位置、大小,并與參照標(biāo)準(zhǔn)對照,根據(jù)公式(1)、(2)分別計算每組肺結(jié)節(jié)的檢出率和假陽性率;②醫(yī)師閱片時間指醫(yī)師在3兆巨鯊專業(yè)顯示屏逐層觀察全部肺窗圖像,得出每例患者結(jié)節(jié)數(shù)目、位置、大小的時間;AI 閱片時間是點擊AI 軟件顯示屏顯示結(jié)節(jié)數(shù)目、位置、大小的時間。分別比較4 組肺結(jié)節(jié)檢出情況和閱片時間。
1.3 統(tǒng)計學(xué)方法 采用SPSS 23.0 軟件,符合正態(tài)分布的計量資料以±s表示。肺結(jié)節(jié)檢出率的組內(nèi)和組間比較采用χ2檢驗;各組閱片時間比較采用秩和檢驗或單因素方差分析,兩兩比較采用LSD 法。P<0.05 表示差異有統(tǒng)計學(xué)意義。
2.1 參照標(biāo)準(zhǔn) 2 名主任醫(yī)師共檢出5520 枚結(jié)節(jié)。每例患者肺結(jié)節(jié)數(shù)為1~32 枚,平均(10.0±1.3)枚,結(jié)節(jié)直徑0.2~2.8 cm。
2.2 結(jié)節(jié)檢出情況比較 A、B、C 組內(nèi)5 名醫(yī)師肺結(jié)節(jié)檢出率差異無統(tǒng)計學(xué)意義(χ2=9.266、7.130、5.618,P>0.05)。4 組平均檢出率依次為A 組
A、B、C 組胸膜下、外周性及中心性結(jié)節(jié)檢出率依次為A 組
表1 各組不同肺結(jié)節(jié)位置與大小檢出率比較(%)
圖1 AI 將體外衣物誤判為結(jié)節(jié)(箭),致假陽性率較高(A);左肺下葉前基底段胸膜下磨玻璃結(jié)節(jié)(箭)容易漏診,術(shù)后病理證實為腺癌(B)
2.3 閱片時間 各組組內(nèi)閱片時間差異均無統(tǒng)計學(xué)意義(P>0.05);各組閱片時間分別為(14.9±2.5)min、(6.9±2.1)min、(5.0±1.5)min、(0.1±0.0)min,差異有統(tǒng)計學(xué)意義(P<0.001)。D 組閱片時間明顯短于A、B、C 組,差異均有統(tǒng)計學(xué)意義(P<0.001)。
本研究結(jié)果顯示人工閱片肺結(jié)節(jié)的檢出率隨著醫(yī)師級別增高依次遞增,且假陽性率依次遞減,表明肺結(jié)節(jié)的檢出需要一定的臨床經(jīng)驗水平。在實際工作中,由于人員配備不均衡,部分醫(yī)院缺乏高年資醫(yī)師。高效的肺結(jié)節(jié)檢測對肺癌的風(fēng)險評估具有重要意義,快速準(zhǔn)確定位肺結(jié)節(jié)的確切位置具有重要意義和挑戰(zhàn)性。近年研究涉及基于傳統(tǒng)計算機(jī)視覺算法計算機(jī)輔助診斷系統(tǒng)(CAD)和AI。CAD 方案大多比較復(fù)雜和耗時,需要更多的圖像處理模塊,且相關(guān)敏感度及特異度較低[4-5];AI 是一種基于卷積神經(jīng)網(wǎng)絡(luò)的肺結(jié)節(jié)檢測模型,其敏感度和特異度較傳統(tǒng)的CAD 高,目前在肺結(jié)節(jié)檢出及定性方面應(yīng)用較多,但以往研究對不同模型算法的AI 探討較多,大多基于其原理、算法步驟等展開討論[6-10],很少從臨床及實用性評估其在臨床工作中運(yùn)用的準(zhǔn)確性及弊端。2017年Fleichner 肺結(jié)節(jié)指南總原則指出,結(jié)節(jié)隨訪的重要指標(biāo)包括數(shù)目及大小[11]。因此,本研究主要探討AI 輔助診斷軟件對肺結(jié)節(jié)位置、數(shù)目及大小的檢測效能。
本研究結(jié)果顯示,AI 組肺結(jié)節(jié)檢出率為94.3%,高于以往研究報道的CAD 對肺結(jié)節(jié)的檢出率[12-13]。金文忠等[2]報道以6 名資深影像專業(yè)醫(yī)師作為參照標(biāo)準(zhǔn),AI 肺結(jié)節(jié)檢出率平均達(dá)96.6%,與本研究結(jié)果相似。本研究通過與不同級別的醫(yī)師檢出情況對照顯示,AI 的檢測水平略高于本院主治醫(yī)師水平,若影像醫(yī)師在臨床工作中參考AI 檢測結(jié)果,可大大減少肺結(jié)節(jié)的漏診,特別是對于實習(xí)醫(yī)師及住院醫(yī)師而言。對于不同位置結(jié)節(jié)的檢出情況,主治醫(yī)師組胸膜下結(jié)節(jié)檢出率與AI 組差異無統(tǒng)計學(xué)意義。由于胸膜下結(jié)節(jié)表現(xiàn)為與胸膜相連的結(jié)節(jié)影,易于觀察。AI 組外周及中心性結(jié)節(jié)檢出率顯著高于人工閱片,由于該區(qū)域肺紋理相對較多,結(jié)節(jié)與血管斷面相似,加之長時間人工閱片導(dǎo)致注意力難以集中。對于不同大小結(jié)節(jié)的檢出情況,主治醫(yī)師組大結(jié)節(jié)檢出率與AI 組差異無統(tǒng)計學(xué)意義,兩組大結(jié)節(jié)檢出率為98.5%、96.8%。劉曉鵬等[1]以病理結(jié)果為“金標(biāo)準(zhǔn)”,AI 的肺結(jié)節(jié)(1~3 cm)檢出率為96.4%,表明AI 在大結(jié)節(jié)檢出方面具有較完善的算法。AI 組中等結(jié)節(jié)及小結(jié)節(jié)檢出率明顯高于人工閱片,其可能原因為結(jié)節(jié)較小且人工閱片易疲勞,容易漏診。AI 肺結(jié)節(jié)的高檢出率使得臨床工作中肺結(jié)節(jié)的檢出率增加;而李欣菱等[14]研究認(rèn)為其對較小(特別是<0.5 cm)結(jié)節(jié)的臨床意義有待商榷,若完全按照AI 的結(jié)果進(jìn)行臨床干預(yù)會增加醫(yī)療負(fù)擔(dān)及過度治療。因此,對肺結(jié)節(jié)的判斷及干預(yù)需要醫(yī)師參考AI 結(jié)果并進(jìn)一步分析。
本研究發(fā)現(xiàn),AI 檢出結(jié)節(jié)總數(shù)大于參照標(biāo)準(zhǔn)。由于AI 的高敏感性而出現(xiàn)假陽性率較高(14.0%)的特點,表明目前AI 的重點集中在陽性結(jié)節(jié)的學(xué)習(xí)上,而對假陽性結(jié)節(jié)的學(xué)習(xí)尚需完善。本研究中AI 容易將血管截面及肺外部分結(jié)構(gòu)標(biāo)注成結(jié)節(jié)(如體外衣物、胸鎖關(guān)節(jié)及胃腸道內(nèi)容物等),易于辨認(rèn),在臨床工作中需影像醫(yī)師進(jìn)行復(fù)診。有研究采用訓(xùn)練大規(guī)模數(shù)據(jù)集的方式自動化學(xué)習(xí)和提升,可明顯降低假陽性率[15]。盡管AI 組肺結(jié)節(jié)檢出率高于人工閱片,但也會遺漏一些結(jié)節(jié),AI 未檢出結(jié)節(jié)的可能原因包括:①結(jié)節(jié)較??;②結(jié)節(jié)位于胸膜下;③結(jié)節(jié)位于血管旁;④結(jié)節(jié)密度淺淡;⑤不明原因。在實際工作中發(fā)現(xiàn),對于密度較淡且位于胸膜下的磨玻璃結(jié)節(jié)AI 更易漏診,而這些磨玻璃結(jié)節(jié)往往是惡性結(jié)節(jié)。因此,在臨床工作中應(yīng)注意觀察胸膜下、肺門及血管旁區(qū)域,防止漏診。而對于那些不明原因的未檢出結(jié)節(jié),可能與軟件的分割算法有關(guān)[11]。因此,基于深度學(xué)習(xí)的AI 算法仍需有針對性地改善模型并進(jìn)一步優(yōu)化參數(shù),以提高肺結(jié)節(jié)的檢出率并降低假陽性率。以往研究表明AI 較人工閱片時間明顯縮短,每張胸片平均用時約為0.28 s[16];而本研究顯示AI 閱CT 片時間僅為(0.1±0.0)min,大大提高了工作效率。Li 等[17]報道對于多發(fā)肺結(jié)節(jié)患者,AI 能快速直接顯示結(jié)節(jié)的位置、數(shù)目及大小,為后續(xù)診療計劃提供參考依據(jù)。因此,AI 協(xié)助影像科醫(yī)師可提高閱片的速度和診斷準(zhǔn)確率,使更多的患者從中受益。
總之,AI 對于肺結(jié)節(jié)的檢出率較高,其水平略高于主治醫(yī)師,作為肺結(jié)節(jié)篩檢的有效輔助工具,在臨床上可廣泛應(yīng)用。隨著AI 算法的不斷完善及多中心大樣本研究的開展,有望進(jìn)一步提高AI 的肺結(jié)節(jié)檢出效能。