蘇淇琛,葉馮穎,蘇珊珊,林文杰,徐晚虹,呂國榮,2
(1. 福建醫(yī)科大學(xué)附屬第二醫(yī)院超聲醫(yī)學(xué)科,福建 泉州 362000;2. 泉州醫(yī)學(xué)高等??茖W(xué)校,福建 泉州 362011)
醫(yī)學(xué)人工智能在醫(yī)學(xué)影像、輔助診斷和機器人手術(shù)等方面的應(yīng)用越來越廣泛[1-4]。其中智能化的計算機輔助診斷(computer-aided diagnosis,CAD)系統(tǒng)可以輔助醫(yī)師,提供診斷和治療建議[5]。目前超聲醫(yī)學(xué)CAD較為成熟的是甲狀腺結(jié)節(jié)的診斷,甲狀腺CAD系統(tǒng)與超聲醫(yī)師診斷效能的對比是研究的熱點,均采用的是總體甲狀腺結(jié)節(jié)的診斷效能對比,未見甲狀腺單發(fā)結(jié)節(jié)和多發(fā)結(jié)節(jié)情況下的分類對比研究。本研究旨在探討CAD系統(tǒng)在甲狀腺單發(fā)結(jié)節(jié)和多發(fā)結(jié)節(jié)不同情況下的診斷價值,并與超聲醫(yī)生比較,以期協(xié)助超聲醫(yī)師更有效地臨床應(yīng)用CAD系統(tǒng)。
1.1研究對象 前瞻性納入于2020年1月—2020年10月在福建醫(yī)科大學(xué)附屬第二醫(yī)院進行甲狀腺超聲檢查,并行甲狀腺手術(shù)或結(jié)節(jié)細針穿刺的患者279例(共515個甲狀腺結(jié)節(jié)),其中女202例,男77例,年齡12~77歲,平均(46.1±12.0)歲;手術(shù)治療結(jié)節(jié)322個,細針穿刺結(jié)節(jié)193個;良性結(jié)節(jié)220個(結(jié)節(jié)性甲狀腺腫148個、甲狀腺腺瘤21個、亞急性甲狀腺炎1個、橋本甲狀腺結(jié)節(jié)16個、濾泡性結(jié)節(jié)34個);惡性結(jié)節(jié)295個(包含甲狀腺乳頭狀癌268個、濾泡癌21個、髓樣癌5個、間變性癌1個)。其中甲狀腺單結(jié)節(jié)組115例,多結(jié)節(jié)組164例。病例納入標準:①甲狀腺結(jié)節(jié)性質(zhì)經(jīng)超聲引導(dǎo)下細針穿刺活檢或手術(shù)病理的證實;②甲狀腺雙側(cè)葉結(jié)節(jié)數(shù)量≤5個;③結(jié)節(jié)超聲圖像標準清晰;④結(jié)節(jié)圖像需以高清格式保存在超聲設(shè)備上;⑤結(jié)節(jié)圖像為灰階圖,無影響圖像識別的測量痕跡。排除標準:①結(jié)節(jié)無明確病理結(jié)果者;②結(jié)節(jié)圖像不夠清晰。本研究由我院醫(yī)學(xué)倫理委員會批準備案,所有患者均知情同意。
1.2儀器與方法
1.2.1儀器 所用超聲儀器包括:DC-8、Resona 8(邁瑞,中國);LogicE9、Voluson E10、Voluson E8(通用電氣,美國); HI Vision Preiru(日立,日本);Aixlorer(聲科,法國)。采用7.5~12兆赫高頻線陣探頭進行甲狀腺掃查。使用的CAD軟件為臺灣安克生醫(yī)公司研發(fā)的安克偵(AmCAD-UTDetection),該軟件已獲得美國食品藥品監(jiān)管總局、中國食品藥品監(jiān)管總局批準。
1.2.2超聲圖像采集方法 圖像采集由2位具有15~20年臨床經(jīng)驗的超聲醫(yī)師完成,均具有高級職稱。先進行CAD軟件的應(yīng)用培訓(xùn),每個甲狀腺結(jié)節(jié)至少采集3張規(guī)范的圖像,包括最大徑線切面和具有特征性的切面。并將病例分為甲狀腺多結(jié)節(jié)病例組和單結(jié)節(jié)病例組。
1.2.3CAD圖像分析 將圖像導(dǎo)入CAD軟件,軟件可自動勾勒結(jié)節(jié)邊界,形成感興趣區(qū)域(ROI)并分析其超聲特征,包括結(jié)節(jié)的大小、回聲、形態(tài)、邊緣、縱橫比、內(nèi)部成分等。根據(jù)這些特征,CAD得出檢測報告(見圖1)。
注:A:CAD軟件自動勾勒出結(jié)節(jié)邊界;B:CAD軟件對結(jié)節(jié)的大小、邊緣、形態(tài)、縱橫比進行分析;C:CAD軟件對結(jié)節(jié)的回聲、內(nèi)部成分進行分析;D:CAD軟件給出檢測報告。
1.2.4超聲醫(yī)師圖像分析 選取3位分別有5年、15年和30年超聲診斷經(jīng)驗醫(yī)師(以下分別稱為初級、中級和高級醫(yī)師),根據(jù)1.2.2所采集的結(jié)節(jié)圖像獨立分析,得出良惡性的判斷。3位超聲醫(yī)師對病例的臨床信息不知情。
1.2.5診斷效能的分析比較 分析比較CAD和各級醫(yī)師對于甲狀腺多結(jié)節(jié)病例組和單結(jié)節(jié)病例組的診斷效能。
1.3統(tǒng)計學(xué)方法 應(yīng)用MedCalc 15.2.2統(tǒng)計軟件,以病理結(jié)果為金標準,繪制受試者工作特征(ROC)曲線,計算曲線下面積(AUC)。分別計算CAD和3位超聲醫(yī)師的AUC、敏感性、特異性、陽性預(yù)測值(PPV)和陰性預(yù)測值(NPV)。組間敏感度、特異度的比較采用McNemar’s 檢驗。組間AUC 比較采用DeLong 檢驗。P<0.05為差異有統(tǒng)計學(xué)意義。
以甲狀腺手術(shù)或結(jié)節(jié)細針穿刺的病理結(jié)果為標準,比較CAD和各級超聲醫(yī)師對甲狀腺結(jié)節(jié)良惡性的診斷效能,其中CAD組診斷出單結(jié)節(jié)85例,多結(jié)節(jié)104例;初級醫(yī)師組診斷出單結(jié)節(jié)88例,多結(jié)節(jié)122例;中級醫(yī)師組診斷出單結(jié)節(jié)98例,多結(jié)節(jié)139例;高級醫(yī)師組診斷出單結(jié)節(jié)104例,多結(jié)節(jié)145例;分別計算其敏感性、特異性、PPV、NPV和AUC,見表1。
超聲醫(yī)師和CAD之間診斷效果的比較見表1和圖2。
表1 CAD和各級超聲醫(yī)師對甲狀腺結(jié)節(jié)的診斷效能對比
圖2 CAD和各級超聲醫(yī)師的診斷敏感性、特異性ROC曲線對比
CAD診斷甲狀腺單結(jié)節(jié)病例的敏感性與高級超聲醫(yī)師相當(dāng)(88.52%vs. 89.41%,P>0.05),優(yōu)于初級或中級超聲科醫(yī)師(88.52% vs. 73.42%,88.52% vs. 83.22%,P均<0.05)。CAD診斷甲狀腺多結(jié)節(jié)病例的敏感性與中級超聲醫(yī)師相當(dāng)(81.61% vs. 82.39%,P>0.05),優(yōu)于初級超聲醫(yī)師(81.61% vs. 71.68%,P<0.05),但低于高級超聲科醫(yī)師(81.61% vs. 88.53%,P<0.05)。兩組CAD的AUC與初級超聲科醫(yī)生相當(dāng),小于高級或中級超聲科醫(yī)師。但特異度均低于3位超聲醫(yī)師(P均<0.05)。CAD對于甲狀腺單結(jié)節(jié)病例組和多結(jié)節(jié)病例組的診斷指標(敏感性、特異性、PPV、NPV、AUC)有差異(P均<0.05),單結(jié)節(jié)病例組的診斷效能優(yōu)于多結(jié)節(jié)病例組。3位超聲醫(yī)師自身對比,診斷甲狀腺單結(jié)節(jié)病例和多結(jié)節(jié)病例的診斷指標(敏感性、特異性、PPV、NPV、AUC)均無差異(P均>0.05)。
隨著醫(yī)學(xué)水平的進步和健康意識的提高,甲狀腺結(jié)節(jié)的檢出率逐漸提高。超聲是甲狀腺結(jié)節(jié)最常用的檢查手段[6]。據(jù)以往學(xué)者的研究報道,AmCADUT軟件對于甲狀腺結(jié)節(jié)的良惡性分類具有良好的診斷效果[7-8],但均無細分單結(jié)節(jié)病例和多結(jié)節(jié)病例的情況。本研究結(jié)果表明,CAD軟件對單結(jié)節(jié)病例的診斷效能要明顯優(yōu)于多結(jié)節(jié)病例。其主要原因分析如下:①多發(fā)結(jié)節(jié)病例,相鄰結(jié)節(jié)的邊緣區(qū)域會在圖像上產(chǎn)生相互干擾影響,這對于執(zhí)行特征識別的CAD軟件來說,可能會造成不同程度的誤判、錯判。②對于質(zhì)地較軟的結(jié)節(jié),可能存在結(jié)節(jié)間的相互擠壓而變形,而目前的CAD無法對結(jié)節(jié)的硬度進行判別,可能導(dǎo)致對結(jié)節(jié)形態(tài)的誤判而誤診。③多發(fā)結(jié)節(jié)甲狀腺病例多合并有彌漫性的甲狀腺回聲的改變,這可引起甲狀腺背景回聲的改變,可能會影響CAD對于結(jié)節(jié)整體回聲的判定。
本研究對于不同水平的超聲科醫(yī)生診斷效能進行比較,發(fā)現(xiàn)與醫(yī)師的專業(yè)水平呈正相關(guān),但與CAD組的不同之處在于對醫(yī)師來說,不論是單結(jié)節(jié)病例或多結(jié)節(jié)病例,其診斷指標(敏感性、特異性、PPV、NPV、AUC)均無明顯的自身差異,也就是說單結(jié)節(jié)和多結(jié)節(jié)對于同一醫(yī)師來說并不會引起診斷效能上的差異,而CAD卻表現(xiàn)出了明顯的差異。
通過比較CAD軟件與超聲醫(yī)師的診斷效能,發(fā)現(xiàn)高級超聲醫(yī)師的績效指標(敏感性、特異性、AUC、PPV、NPV)最好,其次是中級超聲醫(yī)師和初級超聲醫(yī)師??冃е笜说牟町愔饕怯捎诮?jīng)驗的影響,這與先前研究的結(jié)論一致[9-11]。CAD的診斷敏感性也很高,甚至可以與高級超聲科醫(yī)生相媲美。因此,它可以用于大規(guī)模癌癥篩查以提高效率,但由于其相對較低的特異性,特別是對于多結(jié)節(jié)的情況下,應(yīng)避免給患者造成不必要的活檢或手術(shù)。以往的研究表明,人工智能輔助診斷可以減輕醫(yī)生的工作量,有助于向需要幫助的患者提供高質(zhì)量的醫(yī)療服務(wù)[12-13]。因此,在臨床實踐中,當(dāng)試圖提高診斷效率時,可以使用CAD輔助,但超聲醫(yī)師的人工審核至關(guān)重要。
本研究有局限性,首先,本研究的惡性結(jié)節(jié)多為乳頭狀癌。濾泡癌、髓樣癌和間變性癌的超聲特征不同于乳頭狀癌[14-15]。因此,AmCAD-UT對這三種病理類型的診斷效果有待進一步研究。其次,F(xiàn)NA細胞學(xué)結(jié)果可能包括假陰性結(jié)果,可能會影響結(jié)果的準確性??傊嬎銠C輔助診斷具有良好的臨床應(yīng)用價值,但也應(yīng)該認識到這種技術(shù)還存在許多不足。目前診斷特異度仍較低,特別是對于甲狀腺多發(fā)結(jié)節(jié)的病例更應(yīng)慎重應(yīng)用,臨床應(yīng)用上超聲醫(yī)師的人工審核至關(guān)重要。