蔡雅倩, 張正華, 韓丹, 黃建強, 李浚利, 金文鳳
肺癌的發(fā)病率、病死率已位居我國惡性腫瘤第一位,早期診斷和治療可明顯提高患者生存質量,延長生存期。隨著高分辨率CT (high resolution CT,HRCT)在肺癌早期篩查中的普及,圖像數(shù)量倍增、小結節(jié)顯示率提高及定量測量使閱片工作量顯著增加,高強度工作致影像科醫(yī)生易產(chǎn)生視覺疲勞,加之經(jīng)驗不足等,不可避免導致小結節(jié)的漏診率增高,特別是磨玻璃結節(jié)(ground glass nodule,GGN),密度淺淡,漏診率更高。以往研究表明持續(xù)存在的GGN可能提示癌前病變、微浸潤性或浸潤性腫瘤的可能[1],因此在大量圖像資料中準確篩查出GGN并早期定性,已成為臨床迫切需求。基于深度學習的人工智能(artificial intelligence,AI)憑借其準確的算法模型,不僅能在短時間內檢出GGN,而且能對其進行定性分析,預判其良惡性,已在臨床廣泛試用,但對其準確性目前尚無明確定論。本研究旨在探討AI對GGN篩檢和定性診斷的臨床應用價值。
搜集2018年12月-2019年6月間行胸部CT平掃的200例患者。病例納入標準:①結節(jié)直徑≤3 cm;②CT圖像層厚為1 mm。病例排除標準:①肺部彌漫性病變;②圖像有嚴重偽影。137例GGNs患者經(jīng)手術病理證實,其中良性54例,惡性83例。54例良性病變患者中,男25例,女29例,平均年齡(52.24±8.47)歲,包括不典型腺瘤樣增生6例,肺泡間隔纖維化12例,結核11例,炭末沉積6例,炎癥19例;83例惡性病變患者中,男30例,女53例,平均年齡(54.64±8.45)歲,包括浸潤性腺癌44例,微浸潤性腺癌29例,原位癌10例。
采用Siemens Somatom Definition AS 128層螺旋CT機、Siemens Somatom Definition Flash及聯(lián)影UCT 760行胸部HRCT平掃。Siemens Somatom Definition AS 128層螺旋CT機及Siemens Somatom Definition Flash掃描參數(shù):管電壓100 kV,管電流80 mAs,CarekV semi,自動管電流調制,螺距0.938,重建卷積函數(shù)采用B70f。聯(lián)影UCT 760掃描參數(shù):管電壓100 kV,管電流80 mAs,自動管電流調制,螺距0.938,肺窗濾波函數(shù)B-SHARP-C。重建層厚1 mm,層間距1 mm。掃描范圍從肺尖至肺底全部區(qū)域,兩側包括胸壁、腋窩。采用肺窗進行圖像分析(窗寬1500 HU,窗位-400 HU)。
由兩位從事胸部影像診斷的高年資醫(yī)師對200例患者的胸部CT圖像同時進行閱片分析,定量結節(jié)個數(shù),兩者意見不一致時,討論后達成統(tǒng)一意見。根據(jù)閱片方式不同將200例患者分成3組:A組由住院醫(yī)師單獨閱片,B組由AI(醫(yī)學影像輔助診斷軟件Dr.Wise Lung Analyzer,版本:V1.1.0.1,型號:MIDS-PNA)單獨閱片,C組由住院醫(yī)師結合AI綜合閱片。記錄每組的閱片時間及結節(jié)檢出數(shù),并以兩位高年資醫(yī)師的診斷結果為標準,分別計算A、B、C三組的誤診率、漏診率、敏感度、陽性預測值,誤診率=誤診數(shù)/檢出數(shù)×100%,漏診率=漏診數(shù)/結節(jié)總數(shù)×100%,敏感度=診斷正確數(shù)/結節(jié)總數(shù)×100%,陽性預測值=診斷正確數(shù)/檢出數(shù)×100%。
將經(jīng)手術病理證實的137例患者的肺窗薄層圖像調入進行AI分析(圖1),得到相關量化參數(shù):結節(jié)長徑、短徑、最大面積、體積、平均CT值、最大CT值、最小值CT值及惡性概率。長徑和短徑分別為結節(jié)在三維空間內的最長徑和最短徑。惡性概率為AI基于計算機深度學習分析肺結節(jié)特征后得出結節(jié)為惡性的概率。
采用SPSS21.0軟件包進行統(tǒng)計學分析。采用χ2檢驗和t檢驗比較A、B、C三組間肺GGN檢出效能的敏感度、誤診率、陽性預測值和平均診斷時間;比較GGN良、惡性組間一般臨床資料和AI量化參數(shù)的差異,采用受試者工作特征(receiver operator characteristic,ROC)曲線分析其診斷效能,并采用Logistic回歸分析其惡變的獨立危險因素。以P<0.05為差異有統(tǒng)計學意義。
由兩位從事胸部影像診斷的高年資醫(yī)師對200例患者的胸部CT圖像進行分析,確認有1230個結節(jié)。A組檢出854個結節(jié),誤診52個,漏診428個; B組檢出1476個結節(jié),誤診320個,漏診74 個;C組檢出1476個結節(jié),誤診63個,漏診49個。三組的平均診斷時間見表1,兩兩比較差異均有統(tǒng)計學意義(P值均<0.05)。統(tǒng)計學分析結果顯示B組誤診率高于A、C組,陽性預測值小于A、C組;A組漏診率高于B、C組,敏感度低于B、C組,差異均有統(tǒng)計學意義(P值均<0.05,表1)。
圖1AI自動篩選肺結節(jié)并對其進行定量分析,計算機自動測量其長徑、短徑、最大面積、平均CT值、最大CT值、最小CT值,并對其進行準確定位。a) AI對肺內結節(jié)進行篩檢、勾畫結節(jié)輪廓并標注序號; b) AI直接顯示肺結節(jié)的各參數(shù)。
圖2GGN各量化參數(shù)的ROC曲線。
表1 三種閱片方式肺結節(jié)檢出情況比較
注:*表示與其它組比較,差異具有統(tǒng)計學意義(P<0.05)。
GGN良、惡性患者組間年齡、性別、短徑、最小CT值差異均無統(tǒng)計學意義(P值均>0.05),長徑、最大面積、體積、平均CT值、最大CT值及惡性概率差異均有統(tǒng)計學意義(P值均<0.05,表2)。
表2 GGN良惡性組間臨床特征及AI量化參數(shù)比較
對良、惡性組間有統(tǒng)計學差異的各個參數(shù)進行ROC曲線分析(圖2),以曲線下面積(area under curve,AUC)大于0.7的參數(shù)為自變量,以病理結果良惡性為因變量,進行二元Logistic回歸分析,結果顯示長徑[優(yōu)勢比(odds ratio,OR)=4.232,P<0.001]和最大面積(OR=0.896,P=0.008)是GGN惡變的獨立危險因素。
表3 GGN良、惡性組的ROC曲線分析
肺癌是我國最常見的惡性腫瘤,病死率高,但研究表明IA期肺癌患者中,原位癌和微浸潤性癌術后五年生存率可接近100%[2,3],因此肺癌的早期發(fā)現(xiàn)、早期診斷及治療顯得尤為重要。早期篩查已成為肺癌防治的重要手段,其中HRCT是國際公認的有效手段。肺結節(jié)篩查圖像診斷較為簡單,但隨著人們健康體檢意識不斷加強,胸部HRCT篩查人群日益增多,圖像數(shù)量倍增,影像醫(yī)師的工作壓力也日趨增大,漏診、誤診的風險不斷增加。AI的出現(xiàn)不僅降低了早期肺癌的漏診率,也在一定程度上解放了影像科醫(yī)生的雙眼,使其可將有限的精力用于更高難度的工作中。AI是現(xiàn)階段各行各業(yè)研究的熱點,目前已廣泛運用于影像、臨床及病理等多個醫(yī)學領域[4,5],主要集中在發(fā)現(xiàn)異常、量化測量及鑒別診斷等方面[6,7]。而用于肺結節(jié)篩查和定性的輔助診斷軟件國內外各有不同,主要是由于模型算法不同使其結果的靈敏度、特異度出現(xiàn)一定偏差[8]。本研究旨在探討我院引入的深睿公司醫(yī)學影像輔助診斷軟件對肺GGN檢出和定性診斷的價值。
本研究結果顯示A組的漏診率明顯高于B、C兩組,而敏感度明顯低于B、C兩組,正是由于醫(yī)生在進行大量重復閱片過程中不可避免地產(chǎn)生視覺疲勞,大大影響結節(jié)的檢出情況。B組的誤診率明顯高于A、C兩組,而陽性預測值明顯低于A、C兩組,原因為AI主要容易將局部稍增粗的肺紋理誤判為GGN,表明AI的算法有待進一步完善和提高。C組(住院醫(yī)師結合AI)的閱片診斷水平接近于高年資醫(yī)師,明顯提高了GGN的檢出率,減少了漏診風險,又彌補了AI假陽性率高的缺點。另外,AI平均6s能完成1例閱片,而一般人工閱片需要7 min,人工結合AI大大提高了影像科醫(yī)生的工作效率和診斷準確性,值得廣泛推廣,與胡瓊潔等[9]和邵亞軍等[10]的研究結果一致。
以往較多研究探討肺GGN良、惡性間三維特征的差異,對其良惡性預判具有一定參考價值,但測量繁瑣、費時,AI彌補了這些缺點,可直接提取結節(jié)并對其各指標進行準確量化,方便、快捷,減少了人工測量的誤差,可重復性強。另外AI可根據(jù)其模型算法計算出結節(jié)的惡性概率,影像醫(yī)生可參考AI提供的三維特征參數(shù)及惡性概率對其進行定性分析,提高診斷效率。本研究中,GGN良、惡性組間結節(jié)短徑和最小CT值差異無統(tǒng)計學意義,長徑、最大面積、體積、平均CT值、最大CT值及惡性概率差異均有統(tǒng)計學意義,與Shi等[11]的研究結果一致?;貧w分析結果顯示長徑和最大面積是GGN惡變的危險因素,AUC分別為0.867、0.899,當臨界值分別為10.34 mm、61.12 mm2時,敏感度均為0.795,特異度分別為0.852、0.870。Kitami等[12]和熊廷偉等[13]的研究結果表明直徑是GGN惡變的危險因素,Yang等[14]的研究結果也表明基于直徑的logistic回歸模型用于區(qū)分良、惡性GGN的準確率達78.7% ,AUC為0.861,敏感度和特異度分別為78.0%、80.0%。最大面積是GGN惡變的獨立危險因素以往少有文獻報道,可能與本研究中部分GGN整體體積縮小、局部惡變面積增大有一定關系,需擴大樣本量進一步證實。關于GGN的CT值以往研究結果各有不同,矯娜等[15]研究表明惡性GGN的平均CT值及最大CT值均明顯高于良性GGN,而Xiang等[16]認為兩者差異并無統(tǒng)計學意義,本研究結果表明兩者間差異有統(tǒng)計學意義,病理機制可能是由于惡性GGN內腫瘤細胞沿著肺泡間隔貼壁生長,導致肺泡腔內氣體減少,或由于肺泡塌陷、纖維化等導致病灶內局部密度增高[17]。Logistic回歸分析結果顯示惡性概率不是GGN惡變的危險因素,表明AI對GGN的定性預判能力有待提高。但是,本研究發(fā)現(xiàn)良、惡性兩組GGN的惡性概率差異有統(tǒng)計學意義,當惡性概率大于80%時,提示GGN惡性的可能性較大,具有一定參考價值。因此在診斷工作中重點觀察AI提供的GGN長徑、最大面積、體積、CT值、惡性概率等參數(shù),并結合常規(guī)形態(tài)學進行綜合分析,可明顯提高GGN定性診斷的準確率。
本研究存在以下局限性:①需擴大樣本量,進一步對結果進行驗證;②未引入隨訪數(shù)據(jù)等重要指標說明AI在肺結節(jié)隨訪中的價值,有待進一步研究。
綜上所述,在肺GGN的檢出及良、惡性鑒別診斷方面,AI可在短時間內有效提高GGN檢出的敏感度,并對其三維特征參數(shù)進行準確量化,計算其惡性概率,且結果可信度較高,是影像科醫(yī)生可靠而實用的有力助手,可在臨床中廣泛應用。但目前AI的假陽性率仍較高,需進一步改善其算法以提高特異度。