国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

肺結(jié)節(jié)AI輔助檢測產(chǎn)品的臨床應(yīng)用效果及影響因素分析概述

2021-04-03 23:07王澤華
中國醫(yī)療設(shè)備 2021年12期
關(guān)鍵詞:閱片準(zhǔn)確度醫(yī)師

王澤華

國家藥品監(jiān)督管理局 醫(yī)療器械技術(shù)審評中心,北京 100081

引言

肺癌嚴(yán)重威脅人類生命健康,其發(fā)病率和病死率居所有惡性腫瘤的首位[1-4]。根據(jù)美國國家肺癌篩查試驗(yàn)結(jié)果,肺癌患者中有35%是10 mm以下的肺結(jié)節(jié),肺結(jié)節(jié)篩查可使肺癌病死率下降20%[5-6],因此對肺結(jié)節(jié)的早檢測、早診斷及早治療是降低肺癌死亡率的重要方法。目前臨床上對于肺結(jié)節(jié)檢測工作在實(shí)踐中面臨諸多問題的普及效果有待提升。近年來,計(jì)算機(jī)輔助檢測(Computer-Aided Detection,CADe)軟件技術(shù)發(fā)展迅速,臨床上逐步使用人工智能(Artificial Intelligence,AI)技術(shù)輔助醫(yī)生進(jìn)行肺結(jié)節(jié)檢測。本文重點(diǎn)對國內(nèi)外獲批的肺結(jié)節(jié)AI產(chǎn)品的臨床應(yīng)用效果及研究進(jìn)展進(jìn)行簡要綜述。

1 肺結(jié)節(jié)的定義、分類及檢測現(xiàn)狀

肺結(jié)節(jié)影像學(xué)表現(xiàn)為直徑不超過30 mm的局灶性、類圓形、密度增高的陰影[7-9]。肺結(jié)節(jié)的分類有多種方法,臨床上常規(guī)根據(jù)其具體位置、密度等方面進(jìn)行分類。從空間位置上劃分,可以分為孤立性肺結(jié)節(jié)、近胸腔內(nèi)壁肺結(jié)節(jié)和近血管肺結(jié)節(jié)[10-11]。按影像學(xué)密度劃分,孤立型肺結(jié)節(jié)可分為實(shí)性和亞實(shí)性結(jié)節(jié),亞實(shí)性結(jié)節(jié)又可分為磨玻璃結(jié)節(jié)(非實(shí)性)和混雜性肺結(jié)節(jié)(部分實(shí)性)[12]。

目前對于肺結(jié)節(jié)檢測的臨床實(shí)踐中存在諸多困難:① 醫(yī)師資源不足,工作壓力較大。據(jù)統(tǒng)計(jì)我國醫(yī)學(xué)影像數(shù)據(jù)年增長率明顯高于醫(yī)師數(shù)量的增長,臨床醫(yī)師面對較大工作壓力[13];② 篩查檢測的準(zhǔn)確率有進(jìn)一步改進(jìn)的空間。有研究報道影像科醫(yī)師肺結(jié)節(jié)檢出率僅為59.1%[14],對美國放射醫(yī)師肺結(jié)節(jié)檢測的研究發(fā)現(xiàn)首診錯誤率高達(dá)30%左右[15]。疲勞被認(rèn)為可能是導(dǎo)致臨床上出現(xiàn)肺結(jié)節(jié)檢測錯誤的主要因素,其他因素還可能包括醫(yī)師基礎(chǔ)知識和臨床經(jīng)驗(yàn)不足[16],以及肺結(jié)節(jié)在其形態(tài)、灰度等方面的復(fù)雜性[17]等。尤其是基于深度學(xué)習(xí)技術(shù)的相關(guān)醫(yī)療器械產(chǎn)品可從胸部CT影像中檢出肺結(jié)節(jié),相關(guān)研究結(jié)果顯示其可提高肺結(jié)節(jié)的檢出率、準(zhǔn)確度和臨床醫(yī)師的工作效率[18-23]。

2 肺結(jié)節(jié)AI輔助檢測產(chǎn)品上市前臨床試驗(yàn)情況

2.1 臨床試驗(yàn)設(shè)計(jì)類型及評價指標(biāo)

肺結(jié)節(jié)輔助檢測產(chǎn)品一般可選擇平行對照或多病例多閱片者(Multiple Reader Multiple Case,MRMC)的設(shè)計(jì),F(xiàn)DA的CADe指南[24]對此類CADe軟件要求了MRMC的試驗(yàn)設(shè)計(jì)。有效性指標(biāo)常選擇固有診斷準(zhǔn)確度指標(biāo),例如靈敏度、特異度、ROC或其衍生曲線(FROC、LROC、AFROC等),部分研究中還設(shè)置了非固有準(zhǔn)確度指標(biāo),例如陽性/陰性預(yù)測值、檢出率等;還可考慮時間效率、診斷準(zhǔn)確率增益率、診斷平均時間增益率、軟件易用性/可操作性評價、軟件穩(wěn)定性等。安全性指標(biāo)一般可包括器械故障、不良事件、嚴(yán)重不良事件等。試驗(yàn)報告一般還會給出根據(jù)結(jié)節(jié)大小、密度類型等方面劃分的亞組的統(tǒng)計(jì)數(shù)據(jù)。

2.2 研究對象

針對臨床試驗(yàn)受試病例,可以基于定義明確的入選和排除標(biāo)準(zhǔn),前瞻性地收集患者數(shù)據(jù)或采用臨床已有數(shù)據(jù),入組人群應(yīng)當(dāng)與適用范圍相匹配?;谂R床已有數(shù)據(jù)的臨床試驗(yàn)應(yīng)當(dāng)在設(shè)計(jì)時考慮并必須嚴(yán)格控制偏倚。例如納入病例獨(dú)立于申報產(chǎn)品或前代產(chǎn)品開發(fā)所用病例,以及連續(xù)入組符合或隨機(jī)抽樣入組符合入排標(biāo)準(zhǔn)的病例等。需要注意的是,除非有充分證據(jù)證明目標(biāo)疾病同一患者不同部位、不同時期、雙側(cè)器官的診斷結(jié)果間具有獨(dú)立性,否則不在一項(xiàng)臨床試驗(yàn)中同時入組同一病例的多組數(shù)據(jù)。

由于閱片者表現(xiàn)的變異度及其與患者樣本變異度和診斷方法(即AI輔助器械)之間的交互,某些情況下還需將閱片者列入研究對象。當(dāng)把閱片者列為研究對象之一時,需要考慮閱片者選擇偏倚、評閱偏倚和閱片順序偏倚。如可考慮采用交叉或部分交叉閱片設(shè)計(jì),交叉設(shè)計(jì)中還可根據(jù)相關(guān)領(lǐng)域記憶曲線的研究設(shè)置合理的洗脫期。FDA的相關(guān)文件認(rèn)為10名以上的閱片者[25]可較好的控制閱片者選擇偏倚、評閱偏倚,并且有文獻(xiàn)報道交叉設(shè)計(jì)的典型洗脫期一般為4~6周[26]。

2.3 金標(biāo)準(zhǔn)及其他考慮

考慮采用高年資醫(yī)師組成的閱片專家組綜合意見為金標(biāo)準(zhǔn),專家組培訓(xùn)時間和接受標(biāo)準(zhǔn)宜顯著高于試驗(yàn)組。采用專家組評閱時還需考慮合并偏倚的控制,金標(biāo)準(zhǔn)獨(dú)立于待研究的診斷方法可以減少偏倚:① 提供給專家組的待評閱數(shù)據(jù)需不包含AI標(biāo)記結(jié)果;② 對于樣本量非常大或影像評閱耗時大的研究,也可將包含和不包含AI輔助標(biāo)記的結(jié)果同時提供給專家組,但兩組結(jié)果是否采用AI輔助需對專家組設(shè)盲,由專家組自行開展綜合評閱。

樣本量根據(jù)產(chǎn)品預(yù)期性能、試驗(yàn)設(shè)計(jì)類型、評價指標(biāo)、界值差異等經(jīng)統(tǒng)計(jì)學(xué)計(jì)算合理設(shè)置,無固定的下限要求。此外,肺結(jié)節(jié)輔助檢測產(chǎn)品中除主要的肺結(jié)節(jié)輔助檢測功能外,還可能包括三維重建、尺寸測量、CT值計(jì)算等非輔助決策類軟件功能,這些功能可根據(jù)《醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則》提交相應(yīng)臨床評價資料,也可在臨床試驗(yàn)中一并予以評價。

3 肺結(jié)節(jié)AI輔助檢測臨床應(yīng)用、檢測準(zhǔn)確度及影響因素

3.1 肺結(jié)節(jié)AI輔助檢測的臨床應(yīng)用

目前肺結(jié)節(jié)AI輔助檢測是以計(jì)算機(jī)程序或工具的形式,為醫(yī)學(xué)影像提供較為穩(wěn)定可靠的診斷參考。由于CT是一種非常有效的檢查肺部結(jié)節(jié)病灶的影像檢查方式,所以許多基于CT肺部圖像、運(yùn)用AI技術(shù)的肺結(jié)節(jié)AI醫(yī)學(xué)輔助檢測設(shè)備相繼誕生[8,10-11,27-30]。這些設(shè)備或工具的通用工作流程為圖像預(yù)處理、檢測并分割病灶、標(biāo)記病灶、獲取病灶位置大小等形態(tài)學(xué)特征等,最終得出參考性意見。這一自動化流程能夠在一定程度上提升病灶的檢出率,減少影像醫(yī)師的工作強(qiáng)度,但仍需要醫(yī)師對結(jié)節(jié)進(jìn)行臨床確認(rèn)。

3.2 肺結(jié)節(jié)AI輔助檢測的準(zhǔn)確度

根據(jù)對現(xiàn)有臨床研究結(jié)果的調(diào)研,中、美等主要監(jiān)管機(jī)構(gòu)批準(zhǔn)的肺結(jié)節(jié)AI輔助檢測產(chǎn)品可以提升臨床上肺結(jié)節(jié)的檢出準(zhǔn)確度。目前,報道的臨床研究多以單組為主,樣本量普遍不大,單一研究一般不超過200例,“金標(biāo)準(zhǔn)”常以單一專家或高年資醫(yī)師的勾畫結(jié)果為準(zhǔn)。

目前肺結(jié)節(jié)AI輔助檢測的準(zhǔn)確度文獻(xiàn)報道的結(jié)果變異度較大,但總體而言,相較于醫(yī)生獨(dú)立檢測,有AI輔助的檢測準(zhǔn)確度會有明顯提升。胡瓊潔等[13]研究顯示,實(shí)習(xí)醫(yī)生使用AI輔助閱片的敏感性(67.36%)顯著優(yōu)于不使用AI輔助的結(jié)果(40.83%)。Lo等[31]的研究中使用AI輔助檢測軟件將檢測的靈敏度從64.5%提高到80.0%,同時將解釋時間縮短了26%。王娟等[32]的試驗(yàn)結(jié)果為AI輔助下臨床醫(yī)師進(jìn)行閱片的檢測準(zhǔn)確度可達(dá)95.07%,且軟件檢出的假陽性結(jié)節(jié)中,50.38%為醫(yī)師最初診斷漏診者。另一些文獻(xiàn)中,針對多樣化的患者人群、使用醫(yī)師、圖像分辨率、結(jié)節(jié)密度類型、位置、尺寸等方面的情況進(jìn)行統(tǒng)計(jì)分析,報道了70%~97%的敏感性或準(zhǔn)確性,醫(yī)師獨(dú)立閱片的敏感性或準(zhǔn)確性水平則一般在約40%~80%[14,16-17,33-43]。

3.3 肺結(jié)節(jié)AI輔助檢測的影響因素

現(xiàn)有研究較為關(guān)注輻射劑量、管電壓、圖像重建方法、圖像分辨率、結(jié)節(jié)位置、大小、密度類型、使用醫(yī)師水平和狀態(tài)等因素是否可能對AI輔助檢測肺結(jié)節(jié)的準(zhǔn)確度產(chǎn)生影響,可分為以下3個部分進(jìn)行闡述。

(1)影像檢查方面。從輻射劑量、管電壓、圖像重建方法等方面看,目前研究結(jié)果顯示相關(guān)影響組間沒有統(tǒng)計(jì)學(xué)差異。如輻射劑量,Hein等[44]比較了5 mAs超低劑量CT和175 mAs標(biāo)準(zhǔn)劑量CT的AI輔助檢測診斷準(zhǔn)確度,兩者間沒有統(tǒng)計(jì)學(xué)差異。管電壓方面,Bodelle等[45]研究中基于70 kV和100 kV影像,肺結(jié)節(jié)輔助檢測的敏感性為94.7%和92.4%,兩者間沒有統(tǒng)計(jì)學(xué)差異。對于圖像重建方法的分析,曹源等[37]比較了不同重建算法(包括濾波反投影法與多等級的迭代重建算法)獲取的CT影像的AI肺結(jié)節(jié)輔助檢測準(zhǔn)確度,得出了濾波反投影法檢測假陽性率最低,效能最優(yōu)的結(jié)論。劉珍娟等[46]分析了肺窗重建、縱隔重建、骨窗重建等重建算法獲得的CT影像,對于肺結(jié)節(jié)輔助檢測準(zhǔn)確度的影響,得到了在上述三種重建方法獲得CT影像上準(zhǔn)確度均較高,無統(tǒng)計(jì)學(xué)差異的結(jié)論。

(2)圖像和病灶特征方面。從結(jié)節(jié)尺寸、密度類型、圖像分辨率等方面看,現(xiàn)有研究暫無一致結(jié)論。如王娟等[32]研究得到了檢測準(zhǔn)確度不受肺結(jié)節(jié)尺寸影響的結(jié)論。Brown等[47]的研究顯示,對于直徑超過3 mm的肺結(jié)節(jié),AI檢測的敏感度可達(dá)100%,但對于直徑不超過3 mm的檢測敏感度則僅有70%左右。密度類型的分析上,胡志宇等[33]的研究結(jié)果顯示AI輔助檢測軟件對實(shí)性結(jié)節(jié)、磨玻璃結(jié)節(jié)等的檢出敏感性并無統(tǒng)計(jì)學(xué)的差異。Yanagawa等[43]研究了AI輔助檢測磨玻璃結(jié)節(jié)的性能,敏感性為21%遠(yuǎn)低于放射科醫(yī)師60%~80%的水平,認(rèn)為AI對于磨玻璃結(jié)節(jié)的檢測可能存在瓶頸。目前認(rèn)為AI閱片圖像質(zhì)量是臨床性能的關(guān)鍵因素之一,圖像質(zhì)量越高,檢出效果一般越好,當(dāng)圖像質(zhì)量太低時,醫(yī)師與AI軟件可能都無法進(jìn)行正確判讀。

(3)影像醫(yī)師方面。從使用者(主要是影像醫(yī)師)的水平和狀態(tài)等方面看,綜合軟件算法原理、當(dāng)前臨床認(rèn)知以及相關(guān)研究結(jié)果角度,存在較大可能對肺結(jié)節(jié)檢測準(zhǔn)確度產(chǎn)生影響。不同醫(yī)師水平的結(jié)節(jié)檢測準(zhǔn)確度存在較大差別,疊加AI輔助閱片后這種差異可能有所縮小但不能消除,這也與當(dāng)前研究結(jié)果以及FDA相關(guān)文件表述相一致。孫丹丹等[38]通過對比試驗(yàn)得出了,使用超高分辨率肺部 CT 圖像進(jìn)行 AI 輔助肺結(jié)節(jié)檢測,敏感性明顯高于常規(guī)高分辨率圖像使用AI肺結(jié)節(jié)輔助軟件,對高分辨率CT影像準(zhǔn)確度更高的結(jié)論。楊尚文等[36]通過對比試驗(yàn)也得到了類似的結(jié)論。對于醫(yī)師水平/狀態(tài),現(xiàn)有研究關(guān)注了醫(yī)師的年資和疲勞狀態(tài),王亮等[41]的研究顯示疲勞顯著降低了放射科醫(yī)師對肺結(jié)節(jié)的檢測準(zhǔn)確度。汪瓊等[16]的試驗(yàn)結(jié)果顯示采用AI輔助閱片的低年資醫(yī)師檢測的假陽性結(jié)節(jié)數(shù)仍較多,結(jié)果劣于高年資醫(yī)師。

4 討論

由于這幾年來肺結(jié)節(jié)檢測等醫(yī)療AI產(chǎn)品的高關(guān)注度,出現(xiàn)了許多關(guān)于肺結(jié)節(jié)AI輔助檢測的研究文章[13-14,16,32-33,36-41],這些文章大部分是對此類產(chǎn)品的某一應(yīng)用效能、某一應(yīng)用場景或某一影響因素的研究,而缺少綜述性的文章。明佳蕾等[48]調(diào)研了結(jié)節(jié)類型、位置、大小、形狀、掃描及重建參數(shù)等因素對肺結(jié)節(jié)AI檢出性能的影響,但其文章參考了許多國內(nèi)外未獲批產(chǎn)品的研究,而且影響因素分析覆蓋面不夠廣,所以在結(jié)論上與本文也有一定的出入。本文以國內(nèi)外獲批的肺結(jié)節(jié)AI產(chǎn)品及其研究為主要依據(jù),綜合分析了該產(chǎn)品的臨床應(yīng)用效果及影響因素,更具有參考意義。

從目前的臨床研究結(jié)果上看,使用AI輔助肺結(jié)節(jié)檢測軟件對于提升醫(yī)師的檢測準(zhǔn)確度和工作效率可能具有一定的幫助,但提升效果可能因軟件性能、使用者水平和狀態(tài)、患者圖像、結(jié)節(jié)類型等方面的差異而表現(xiàn)不同。從軟件算法原理、當(dāng)前臨床認(rèn)知以及相關(guān)研究結(jié)果角度看,圖像分辨率、使用者水平和狀態(tài)等因素更可能對肺結(jié)節(jié)檢測準(zhǔn)確度產(chǎn)生影響,在相關(guān)臨床研究或?qū)I軟件性能評價時,需考慮對變量的控制或開展亞組研究。尤其是文獻(xiàn)報道的醫(yī)生進(jìn)行肺結(jié)節(jié)檢測(獨(dú)立閱片或在AI輔助下)的敏感度結(jié)果變異性較大,部分報道甚至可能有40%左右的差距,提示閱片者本身的變異度可能是肺結(jié)節(jié)輔助檢測產(chǎn)品臨床性能評價中需考慮的關(guān)鍵因素,在相關(guān)研究中考慮對該因素偏倚的控制可能是必要的。對于輻射劑量、管電壓、結(jié)節(jié)位置,一些研究結(jié)果提示其對于肺結(jié)節(jié)輔助檢測準(zhǔn)確度的影響較小,在評價AI產(chǎn)品臨床性能時,暫時不將其列為主要亞組研究因素可能是可行的策略。

現(xiàn)有的研究可能存在以下可進(jìn)一步拓展的方面:① 對于結(jié)節(jié)大小、密度類型、圖像重建方法等因素的影響,目前研究結(jié)果存在不一致,仍需更多的研究結(jié)果進(jìn)行確認(rèn);② 現(xiàn)有的多數(shù)臨床研究樣本量有限,500例以上的研究結(jié)果較少,且報道的研究多采用單組設(shè)計(jì),循證醫(yī)學(xué)角度證據(jù)力度不完善,相關(guān)臨床結(jié)果趨勢的廣泛適用性整體均需未來更多高質(zhì)量研究結(jié)果確認(rèn);③ 對肺結(jié)節(jié)輔助檢測臨床表現(xiàn)的影響因素可能尚不全面,未來的研究可關(guān)注于當(dāng)前研究較少的內(nèi)容,如CT影像層厚、結(jié)節(jié)形狀以及患者人群特征等方面是否可能也對結(jié)節(jié)檢測產(chǎn)生影響。AI技術(shù)尚處于深入探索階段,肺結(jié)節(jié)AI輔助檢測產(chǎn)品也正在繼續(xù)研發(fā)中,AI輔助產(chǎn)品的臨床應(yīng)用將會不斷拓展完善,以及輔助檢測的影響因素也會逐步被分析得清楚透明。未來將會調(diào)研更多的不斷面世的肺結(jié)節(jié)AI輔助檢測產(chǎn)品及其相關(guān)研究,在產(chǎn)品質(zhì)量和數(shù)量都得到提升后,產(chǎn)品的概述研究才更具有參考價值和說明力度。

猜你喜歡
閱片準(zhǔn)確度醫(yī)師
《住院醫(yī)師規(guī)范化培訓(xùn)教學(xué)閱片指南(2022年版)》解讀
中國醫(yī)師節(jié)
韓醫(yī)師的中醫(yī)緣
閱片列表在耳科住院醫(yī)師顳骨CT影像閱片教學(xué)的應(yīng)用與實(shí)踐
計(jì)算機(jī)輔助檢測系統(tǒng)(CAD)在16層CT低劑量肺癌篩查肺結(jié)節(jié)檢出中的應(yīng)用價值
幕墻用掛件安裝準(zhǔn)確度控制技術(shù)
SP-1000i全自動推片染色儀及CellaVision DM96自動閱片儀在形態(tài)學(xué)檢驗(yàn)人員鏡下比對中的應(yīng)用
動態(tài)汽車衡準(zhǔn)確度等級的現(xiàn)實(shí)意義
一款基于18位ADC的高準(zhǔn)確度三相標(biāo)準(zhǔn)表的設(shè)計(jì)
醫(yī)師為什么不滿意?