馬依迪麗·尼加提,田序偉,米日古麗·達(dá)毛拉,阿布都克尤木·阿布力孜,阿里木江·阿卜杜凱尤木,戴國(guó)朝,董家科
喀什地區(qū)第一人民醫(yī)院 影像中心,新疆 喀什 844000
結(jié)核病為結(jié)核桿菌感染引起的傳染性疾病,結(jié)核桿菌的侵入通常會(huì)造成肺部感染,也會(huì)感染身體的其他部位,大多數(shù)結(jié)核桿菌的感染者沒有癥狀,稱為潛伏結(jié)核感染[1-3]。若沒有及時(shí)進(jìn)行適當(dāng)治療,10%的潛伏感染患者會(huì)惡化為活動(dòng)性結(jié)核,致死率會(huì)高達(dá)50%[4]。結(jié)核病是全球第九大致死性疾病,也是由單一病原體感染造成患者死亡的主要疾病之一[5]。世界衛(wèi)生組織報(bào)道,目前全球有近1/3 的人已感染結(jié)核桿菌,即全球20 億人口體內(nèi)攜帶結(jié)核桿菌。據(jù)統(tǒng)計(jì),全球已有活動(dòng)性肺結(jié)核患者約2000 萬,每年新發(fā)結(jié)核病患者近1000 萬[6]。肺結(jié)核可發(fā)生在全球任何一個(gè)地方,其中亞洲地區(qū)為肺結(jié)核的最高發(fā)地帶,占全球肺結(jié)核發(fā)病率的60%[7-8]。臨床實(shí)踐中,結(jié)核病的準(zhǔn)確檢測(cè)與診斷仍存在諸多挑戰(zhàn),以我國(guó)為例,東部城鎮(zhèn)綜合性大醫(yī)院結(jié)核病漏診漏報(bào)情況頻發(fā),中西部及農(nóng)村地區(qū)醫(yī)療資源稀缺導(dǎo)致結(jié)核病檢出率更低,漏診情況更嚴(yán)重[9]。
目前結(jié)核病診斷的“金標(biāo)準(zhǔn)”是結(jié)核桿菌培養(yǎng),但結(jié)核桿菌培養(yǎng)存在兩個(gè)問題:① 結(jié)核桿菌培養(yǎng)時(shí)間長(zhǎng),單次檢測(cè)需要1 個(gè)月的時(shí)間;② 存在菌陰性肺結(jié)核病例,且這一類病例比例高達(dá)50%,因此,有50%的活動(dòng)性肺結(jié)核患者無法通過結(jié)核桿菌培養(yǎng)的方式實(shí)現(xiàn)結(jié)核病的確診[9]。因此,影像學(xué)信息對(duì)結(jié)核病的診斷具有非常重要的參考意義。作為經(jīng)濟(jì)便捷的檢測(cè)方法,X 線胸片是肺結(jié)核篩查的主要手段,醫(yī)生可以通過X 線胸片來判斷肺結(jié)核的發(fā)生及病灶位置。然而,診斷的效率和準(zhǔn)確度均十分依賴于閱片醫(yī)生的經(jīng)驗(yàn)和水平[10-11]。由于缺乏大量專業(yè)的醫(yī)學(xué)影像醫(yī)生,在臨床中很難保證肺結(jié)核病診斷的整體效率和準(zhǔn)確度。此外,肺部異常疾病在X 線胸片上有多種不同的表型和癥狀,臨床研究表明,多種不同的表型和癥狀往往伴隨出現(xiàn),并且分辨難度較高。這些均給影像醫(yī)生閱片帶來了巨大的挑戰(zhàn),使結(jié)核病的診斷成為一項(xiàng)艱巨而耗時(shí)的工作。
隨著人工智能(Artificial Intelligence,AI)技術(shù)在醫(yī)學(xué)影像領(lǐng)域的發(fā)展,許多基于深度學(xué)習(xí)算法的研究致力于開發(fā)肺結(jié)核自動(dòng)檢測(cè)系統(tǒng),并取得了一定的成果。Lakhani 等[12]采用兩種不同的深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Networks,DCNN)AlexNet和GoogLeNet 將肺部影像分類為具有肺結(jié)核病例或不具有肺結(jié)核的健康病例。該方法使用ImageNet 上未經(jīng)訓(xùn)練和預(yù)訓(xùn)練的網(wǎng)絡(luò),并采用多種預(yù)處理技術(shù)進(jìn)行數(shù)據(jù)增強(qiáng)。Govindarajan 等[13]提出了一種使用“加速魯棒特征”描述符和“特征袋”方法的結(jié)核病分類方案,首先采用水平集算法分割肺葉,再利用多層感知器進(jìn)行正常肺部和結(jié)核病感染肺部影像的分類。Pasa 等[14]提出了一個(gè)高效的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)模型,其具有5 個(gè)卷積層、1 個(gè)平均池化層和1 個(gè)Softmax 層,在保持模型準(zhǔn)確性的同時(shí),減少了模型的復(fù)雜性和計(jì)算成本。Stirenko 等[15]通過基于深度學(xué)習(xí)采用2D 胸部X 影像對(duì)結(jié)核病進(jìn)行預(yù)測(cè),提出的網(wǎng)絡(luò)可以應(yīng)用于小樣本且不平衡的數(shù)據(jù)集。Hooda 等[16]使用了具有7 個(gè)卷積層和3 個(gè)全連接層的CNN 架構(gòu),比較了3 種不同優(yōu)化器在X 線胸片肺結(jié)核上的診斷性能。Devnath 等[17]同樣提出了一種基于DCNN 的肺結(jié)節(jié)檢測(cè)算法,具有良好的肺結(jié)核診斷能力。
然而,以上方法在實(shí)際臨床應(yīng)用中均有一定的缺陷和局限性,并未得到廣泛的應(yīng)用,目前臨床中仍亟需一種更準(zhǔn)確、高效的肺結(jié)核自動(dòng)檢測(cè)模型,以降低臨床診斷中的漏診和誤診率。基于此,本研究以1217 例過往病例的X 線胸片影像數(shù)據(jù)為研究對(duì)象,基于DCNN 建立了一種新型肺結(jié)核檢測(cè)模型,優(yōu)化模型對(duì)微小病灶和隱匿性病灶的檢出率,并通過在醫(yī)療資源匱乏地區(qū)的臨床應(yīng)用對(duì)比評(píng)估了檢測(cè)模型用于胸部X 光片檢測(cè)結(jié)核病的能力與價(jià)值。
本研究回顧性收集了2019 年3 月至2020 年7 月于喀什地區(qū)第一人民醫(yī)院影像中心就診患者的影像及臨床數(shù)據(jù)。本研究由參與醫(yī)院的機(jī)構(gòu)審查委員會(huì)批準(zhǔn)(倫理批號(hào):2022 快審研第43 號(hào))。
納入標(biāo)準(zhǔn):① 痰培養(yǎng)確診為肺結(jié)核患者、非結(jié)核肺部異常的患者、正常對(duì)照患者;②X 線胸片影像資料完整;③ X 線胸片影像圖像清晰;④ 患者在診斷時(shí)以站立姿勢(shì)獲得后前位胸片。排除標(biāo)準(zhǔn):① 臨床診療記錄不完整;② 同時(shí)患有嚴(yán)重影響胸部X 光檢查結(jié)果的疾病的患者(如肺癌、起搏器或除顫器放置、心臟或肺部手術(shù)史);③ 廣泛性胸腔積液患者。
根據(jù)上述標(biāo)準(zhǔn),共納入1217 例患者,其中男性679 例、女性538 例,平均年齡56 歲,其中結(jié)核病例305 例、正常病例840 例、非結(jié)核肺部異常病例為72 例?;颊弑浑S機(jī)分為3 個(gè)數(shù)據(jù)集,以7 ∶2 ∶1 的比例在改進(jìn)的RetinaNet 肺結(jié)核病灶檢測(cè)模型上進(jìn)行訓(xùn)練、驗(yàn)證和測(cè)試。此外,本研究還收集了兩個(gè)外部公開肺結(jié)核數(shù)據(jù)集用于模型的外部驗(yàn)證,包括深圳市第三人民醫(yī)院肺結(jié)核數(shù)據(jù)集(662 例,尺度3000×3000)和美國(guó)蒙哥馬利縣肺結(jié)核數(shù)據(jù)集(138 例,尺度4020×4892 和4892×4020),兩個(gè)數(shù)據(jù)集共計(jì)數(shù)據(jù)800 例份。
數(shù)字化X 線攝影檢查,攝影距離180 cm,用濾線柵,攝影體位后前位,中心線對(duì)準(zhǔn)第六胸椎水平處垂直于探測(cè)器入射。
由1 名具有5 年影像診斷經(jīng)驗(yàn)影像醫(yī)師采用ITKSNAP(www.itksnap.org/)軟件完成病灶區(qū)域檢測(cè)框的標(biāo)注,并由另一名具有10 年影像診斷經(jīng)驗(yàn)的影像醫(yī)師進(jìn)行檢查,若存在不同診斷意見,經(jīng)過協(xié)商后統(tǒng)一。標(biāo)注范圍為包含病灶的整個(gè)區(qū)域,即包含血管、氣管等成分。
本研究算法主要分為圖像預(yù)處理(包括通用圖像預(yù)處理和模型特定圖像預(yù)處理)和肺結(jié)核病灶目標(biāo)檢測(cè)兩部分。圖像預(yù)處理部分主要包括DICOM 圖像處理、圖像轉(zhuǎn)換和數(shù)據(jù)擴(kuò)增,按照一定的邏輯轉(zhuǎn)化為模型圖像輸入尺寸。之后將圖像送入目標(biāo)檢測(cè)器,輸出目標(biāo)預(yù)選框,對(duì)目標(biāo)框進(jìn)行后處理,最后得到肺結(jié)核病灶框,算法概要流程如圖1 所示。
圖1 算法概要流程圖
1.5.1 顏色空間轉(zhuǎn)換
如果讀入的DICOM 圖像是三通道彩色圖像,需轉(zhuǎn)換為單通道灰度圖像,若讀入的DICOM 圖像是單通道灰度圖像,則不作任何處理。圖像顏色空間轉(zhuǎn)換計(jì)算方法為直接取三通道圖像的第一通道作為輸出(Iout),計(jì)算公式如公式(1)所示。
式中,Iin為原始DICOM 圖像。
1.5.2 反片矯正
針對(duì)圖像中的反片(與正片相對(duì)應(yīng),對(duì)黑色和白色的映射與正片圖像剛好相反),需要對(duì)其進(jìn)行矯正處理使其變?yōu)檎?,反片矯正的計(jì)算方式如公式(2)所示。
式中,Iout表示輸出的圖像灰度矩陣;Iin表示原片圖像。
進(jìn)行了反片矯正之后和原始圖像效果對(duì)比如圖2所示。TAG(0028,0004) 是DICOM 圖像的頭文件信息,解釋存儲(chǔ)在DICOM 文件中的像素?cái)?shù)據(jù)方式;MONOCHROME2 為像素?cái)?shù)據(jù)表示單色圖像平面。最小樣本值在執(zhí)行任何VOI 灰度轉(zhuǎn)換后,預(yù)期顯示為黑色。
圖2 反片矯正結(jié)果圖
1.5.3 灰度歸一化
為避免不同機(jī)型和參數(shù)對(duì)模型預(yù)測(cè)結(jié)果的影響,需要對(duì)圖像進(jìn)行灰度歸一化處理,將輸入圖像類型轉(zhuǎn)換為浮點(diǎn)型,并將圖像的灰度范圍映射到[0.0,255.0],以免因不同圖像灰度范圍不一致導(dǎo)致模型泛化能力差。圖像灰度歸一化的計(jì)算方式如公式(3)所示。
式中,ε=1×10-7,其為避免發(fā)生除零錯(cuò)誤而引入的額外參數(shù)。
1.5.4 圖像標(biāo)準(zhǔn)化
為能充分利用遷移學(xué)習(xí)帶來的性能提升,圖像按照ImageNet 數(shù)據(jù)集的統(tǒng)計(jì)信息重新標(biāo)準(zhǔn)化。首先,圖像被擴(kuò)展為三通道圖像,表達(dá)式如公式(4)所示;然后減去樣本數(shù)據(jù)集的圖像均值Im,得到標(biāo)準(zhǔn)化的圖像,表達(dá)式如公式(5)所示。
1.5.5 尺度變換
為適配網(wǎng)絡(luò)結(jié)構(gòu),輸入圖像將通過雙線性插值算法進(jìn)行尺度變換。1217 例原始圖像的尺度為2287×2628、3072×3072 以及2638×2925,長(zhǎng)寬比轉(zhuǎn)換為1024×1024。最后對(duì)圖像進(jìn)行直方圖均衡化,在不顯著改變其他器官和背景灰度的情況下,突出肺部特征。
1.6.1 改進(jìn)的RetinaNet模型描述
在目標(biāo)檢測(cè)領(lǐng)域,早期two-step 方式檢測(cè)網(wǎng)絡(luò)的準(zhǔn)確率高于one-step 檢測(cè)網(wǎng)絡(luò),但在RetinaNet[18]檢測(cè)網(wǎng)絡(luò)被提出后,one-step 檢測(cè)網(wǎng)絡(luò)的精度首次超過twostep 檢測(cè)網(wǎng)絡(luò)。為此,one-step 網(wǎng)絡(luò)的檢測(cè)速度與檢測(cè)精度相較于two-step 網(wǎng)絡(luò)均已占優(yōu)勢(shì),故本研究選擇RetinaNet 檢測(cè)網(wǎng)絡(luò)作為肺結(jié)核檢測(cè)網(wǎng)絡(luò)。RetinaNet 針對(duì)被檢測(cè)目標(biāo)中類別不均衡問題,本文在標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù)基礎(chǔ)上提出一種新的損失函數(shù),稱為focal loss,損失函數(shù)是在標(biāo)準(zhǔn)交叉熵?fù)p失基礎(chǔ)上修改得到的。通過減少易分類樣本的權(quán)重,使得模型在訓(xùn)練時(shí)更專注于稀疏的難分類的樣本;防止大量易分類負(fù)樣本在訓(xùn)練中壓垮檢測(cè)器,主要貢獻(xiàn)是解決了目標(biāo)檢測(cè)中的類別不均衡問題。
本研究中在原有RetinaNet 的網(wǎng)絡(luò)基礎(chǔ)上在主干網(wǎng)絡(luò)中引入通道注意力機(jī)制,優(yōu)化對(duì)微小病灶和隱匿性病灶的檢出率。本研究所采用的通道注意力機(jī)制模塊主要由最大池化、卷積和全連接層再連接激活函數(shù)組成。通道注意力機(jī)制可以對(duì)不同特征圖賦予不同的權(quán)重,較大權(quán)重的特征圖對(duì)微小病灶和隱匿性病灶響應(yīng)較好??傮w來說,通道注意力機(jī)制的目的是細(xì)化目標(biāo)特征在所有特征圖中所占權(quán)重,優(yōu)化最終的檢測(cè)算法。
1.6.2 特征金字塔主干網(wǎng)絡(luò)
使用特征金字塔網(wǎng)絡(luò)(Feature Pyramid Networks,F(xiàn)PN)作為RetinaNet 的主干網(wǎng)。FPN 給標(biāo)準(zhǔn)的CNN 增加一個(gè)自頂向下的路徑和側(cè)向連接,來從圖片的單一分辨率構(gòu)建一個(gè)豐富的、多尺度的FPN。金字塔的每一層以不同尺寸檢測(cè)對(duì)象。FPN 改善了全卷積網(wǎng)絡(luò)的多尺寸預(yù)測(cè),優(yōu)化了對(duì)微小病灶和隱匿性病灶的檢出率。整體檢測(cè)算法框架圖如圖3 所示。
1.6.3 分類子網(wǎng)絡(luò)
Focal loss 應(yīng)用在分類子網(wǎng)絡(luò)中,分類子網(wǎng)絡(luò)預(yù)測(cè)每個(gè)anchor 上K 個(gè)類別的概率。子網(wǎng)絡(luò)是附加在FPN的每一層的一個(gè)小的全卷積網(wǎng)絡(luò)(Fully Convolutional Networks,F(xiàn)CN)。對(duì)于給定的金字塔層級(jí)輸出的C 個(gè)通道的特征映射,子網(wǎng)絡(luò)使用4 個(gè)3×3 的卷積層,每層的通道數(shù)仍然是C,以及1 個(gè)ReLU 層;然后與1 個(gè)通道數(shù)位KA(K 是類別數(shù),A 是anchor 數(shù))的3×3的卷積層;最后使用Sigmoid 函數(shù)。
1.6.4 邊框回歸子網(wǎng)絡(luò)
與分類子網(wǎng)絡(luò)并行,在FPN 的每層附加一個(gè)小的FCN 用于邊框回歸。邊框回歸子網(wǎng)絡(luò)和分類子網(wǎng)絡(luò)設(shè)計(jì)是一樣的,不同之處為最后一層通道數(shù)是4A 個(gè)。邊框回歸的方法與基于區(qū)域的CNN 的邊框回歸一樣。不同于大多數(shù)設(shè)計(jì),本文使用類別無關(guān)的邊框歸回,參數(shù)更少,同樣有效。分類子網(wǎng)絡(luò)和邊框回歸子網(wǎng)絡(luò)共享結(jié)構(gòu),參數(shù)獨(dú)立。
經(jīng)過預(yù)處理的圖像經(jīng)過檢測(cè)模型的處理,網(wǎng)絡(luò)會(huì)輸出潛在肺結(jié)核目標(biāo)框的位置和對(duì)應(yīng)的置信度(可能有多個(gè)或沒有)。使用非極大值抑制方法,將同一目標(biāo)內(nèi)的框按照分類置信度和IoU 閾值做篩選,剔除冗余地、低置信度的目標(biāo)框;如果沒有目標(biāo)框輸出,則認(rèn)為該張圖像中沒有肺結(jié)核疾病征象的存在。
輸出結(jié)果只保留置信度大于5%,IoU 大于0.3 的目標(biāo)框,其余目標(biāo)框全部舍棄,得到最終的肺結(jié)核預(yù)測(cè)目標(biāo)框;如果沒有目標(biāo)框輸出,則認(rèn)為該張圖像中沒有肺結(jié)核疾病征象的存在。最終預(yù)測(cè)結(jié)果如圖4 所示。
圖4 預(yù)測(cè)結(jié)果示例
使用訓(xùn)練集數(shù)據(jù)對(duì)有無AI 系統(tǒng)輔助放射科醫(yī)生的診斷效能進(jìn)行對(duì)比,其中,放射科診斷醫(yī)生選取兩名,醫(yī)生A 具有3 年相關(guān)閱片經(jīng)驗(yàn),醫(yī)生B 具有5 年相關(guān)閱片經(jīng)驗(yàn),最終診斷結(jié)果取兩個(gè)醫(yī)生的平均值,診斷效能包括靈敏度、特異性和準(zhǔn)確度。同時(shí)分析使用訓(xùn)練集數(shù)據(jù)對(duì)有無AI 系統(tǒng)輔助放射科醫(yī)生的診斷效率進(jìn)行對(duì)比,主要為閱片時(shí)間。
使用Linux 操作系統(tǒng)(ubuntu16.04;Xenial,倫敦,英格蘭)和Tensorflow v1.6 深度學(xué)習(xí)框架(https://www.tensorflow.org/),具有CUDA 9.0.176 和CUDNN 7.0(Nvidia Corporation,Santa Clara,Calif)的圖形處理單元加速依賴項(xiàng)。該計(jì)算機(jī)包含一個(gè)Intel Core i5-7500 3.4 gHz 處理器(Intel,Santa Clara,Calif)、4 TB硬盤空間、32 GB RAM 和一個(gè)支持CUDA 的Nvidia GeForce GTX 1080 Ti 圖形處理單元。所有的統(tǒng)計(jì)分析和圖形均使用Python 語言。
結(jié)核病例、正常病例及非結(jié)核病例在性別、年齡等人口學(xué)特征上的差異均無統(tǒng)計(jì)學(xué)意義(P>0.05),見表1。
表1 結(jié)核病例與正常病例及非肺結(jié)核病例患者的人口學(xué)特征比較
改進(jìn)的RetinaNet 模型和原始RetinaNet 模型對(duì)訓(xùn)練集、驗(yàn)證集、測(cè)試集以及外部驗(yàn)證集評(píng)估的診斷性能如表2 所示,改進(jìn)的RetinaNet 模型僅在測(cè)試集的AUC 略低于原始RetinaNet 模型,其他數(shù)據(jù)集的AUC 和準(zhǔn)確度均高于原始RetinaNet 模型。同時(shí)改進(jìn)的RetinaNet 模型在外部中心的公開數(shù)據(jù)集進(jìn)行模型評(píng)價(jià)時(shí),診斷性能較測(cè)試集和驗(yàn)證集表現(xiàn)更好(AUC 為0.879,準(zhǔn)確度為0.847),即診斷模型具有良好泛化能力。
表2 RetinaNet肺結(jié)核病灶檢測(cè)模型對(duì)訓(xùn)練集、驗(yàn)證集、測(cè)試集數(shù)據(jù)的診斷性能
如表3 所示,放射科醫(yī)生在沒有AI 系統(tǒng)輔助的情況下診斷的靈敏度、特異性和準(zhǔn)確度分別為63.8%、98.4%、86.3%,當(dāng)AI 系統(tǒng)參與輔助診斷時(shí)可將放射科醫(yī)生的診斷靈敏度、特異性和準(zhǔn)確度分別提高至77.4%、98.8%、91.3%。
表3 有無AI系統(tǒng)輔助的情況下放射科醫(yī)生平均診斷效能比較(%)
在無AI 系統(tǒng)輔助下放射科醫(yī)生對(duì)于病例的影像數(shù)據(jù)進(jìn)行閱片時(shí)間為(37.43±1.2)s,有AI 系統(tǒng)輔助閱片時(shí)間為(13.97±4.3)s,在AI 系統(tǒng)輔助下放射科醫(yī)生可以顯著提高閱片診斷的效率(t=4.786,P<0.001)。
肺結(jié)核是全球最主要的呼吸道傳染病之一,在許多發(fā)展中國(guó)家普遍存在,其中,印度、印度尼西亞和中國(guó)的結(jié)核病負(fù)擔(dān)較高[19-20]。此外,在中國(guó),肺結(jié)核是僅次于病毒性肝炎的第二大傳染性疾病[21-22]。我國(guó)地域遼闊,醫(yī)療資源分布不均,農(nóng)村或偏遠(yuǎn)地區(qū)醫(yī)療資源相對(duì)匱乏,居民難以獲得及時(shí)、高質(zhì)量的醫(yī)療服務(wù),導(dǎo)致肺結(jié)核等傳染性疾病發(fā)發(fā)率高,例如,新疆喀什地區(qū)是醫(yī)療資源相對(duì)匱乏的傳染病高發(fā)區(qū),其中肺結(jié)核發(fā)病率是全國(guó)平均發(fā)病率的10倍以上??κ驳貐^(qū)醫(yī)療衛(wèi)生條件相對(duì)較差,專業(yè)技術(shù)人員匱乏,肺結(jié)核診斷準(zhǔn)確性不高。此外臨床上非結(jié)核患者也可能有頻繁的胸部感染、呼吸困難和發(fā)燒,同時(shí)可能有肺結(jié)核一樣的影像表現(xiàn)。這導(dǎo)致這些患者經(jīng)常被誤診為肺結(jié)核病例,接受不當(dāng)?shù)闹委煼椒?,進(jìn)而引起不良反應(yīng)。因此,對(duì)肺結(jié)核病準(zhǔn)確的檢測(cè)和診斷是至關(guān)重要的。
隨著AI 技術(shù)在醫(yī)學(xué)圖像領(lǐng)域應(yīng)用的發(fā)展,許多基于深度學(xué)習(xí)算法的研究致力于開發(fā)肺結(jié)核自動(dòng)檢測(cè)系統(tǒng),并取得了一定的進(jìn)展[23-24],最近的研究表明,深度學(xué)習(xí)方法可以從X 線胸片上讀取識(shí)別各種類型肺部疑似疾病的外觀,這是未來計(jì)算機(jī)輔助肺部疾病診斷的一個(gè)主要研究方向。本研究對(duì)AI 輔助肺結(jié)核的診斷進(jìn)行了深入的研究,構(gòu)建了基于DCNN 的檢測(cè)模型來分析胸部X 線影像數(shù)據(jù),并針對(duì)原有RetinaNet 的網(wǎng)絡(luò)在主干網(wǎng)絡(luò)中引入通道注意力機(jī)制,優(yōu)化對(duì)微小病灶和隱匿性病灶的檢出率。通道注意力機(jī)制可以對(duì)不同特征圖賦予不同的權(quán)重,較大權(quán)重的特征圖對(duì)微小病灶和隱匿性病灶響應(yīng)較好,最終細(xì)化了較難目標(biāo)特征在所有特征圖中所占權(quán)重,改進(jìn)優(yōu)化了肺結(jié)核的檢測(cè)算法。
本研究開發(fā)的檢測(cè)模型在肺結(jié)核診斷性能方面表現(xiàn)出色且具有較好的泛化能力,如Ghorakavi 等[25]基于深度學(xué)習(xí)方法開發(fā)的肺結(jié)核檢測(cè)網(wǎng)絡(luò)TB-Net,該網(wǎng)絡(luò)使用了基于多個(gè)特征的數(shù)據(jù)增強(qiáng)方法,從原始胸片中尋找敏感區(qū)域和噪聲作為輸入進(jìn)行模型訓(xùn)練,最終該研究在多個(gè)模型中訓(xùn)練得到的最優(yōu)驗(yàn)證集和測(cè)試集準(zhǔn)確度得分分別為0.813 和0.754。本研究的檢測(cè)模型優(yōu)化了對(duì)微小病灶和隱匿性病灶的檢出率,可以用于快速檢測(cè)和定位X 線胸片中的微小和隱匿性肺結(jié)核病灶,并給出相應(yīng)的置信指數(shù)和病灶位置信息,大幅度提高醫(yī)生的工作效率和肺結(jié)核診斷的準(zhǔn)確率,用于大批量篩查肺結(jié)核高風(fēng)險(xiǎn)人群。本研究結(jié)果還顯示,在AI 系統(tǒng)的輔助下進(jìn)行肺結(jié)核診斷的平均靈敏度提高了13.6%。雖然假陽性率也略有上升,但對(duì)于人群結(jié)核病的大批量篩查與預(yù)防而言,高靈敏度對(duì)于此類傳染病的預(yù)防和控制具有更顯著和重要的意義。除了檢測(cè)準(zhǔn)確度以外,檢測(cè)效率也是結(jié)核病大批量篩查的一個(gè)重要方面,特別是在放射科醫(yī)生工作量大、資源匱乏的地區(qū)。同時(shí)AI 系統(tǒng)的輔助可顯著縮短放射科醫(yī)生的平均閱片時(shí)間。因此,AI 系統(tǒng)輔助診斷不僅提高了肺結(jié)核病檢測(cè)的準(zhǔn)確度,而且大大提高了放射科醫(yī)生的工作效率,節(jié)省了臨床診斷的時(shí)間。
本文構(gòu)建的改進(jìn)的RetinaNet 肺結(jié)核病灶檢測(cè)模型包含多種優(yōu)化措施,可以顯著提高檢測(cè)網(wǎng)絡(luò)的準(zhǔn)確率和數(shù)據(jù)處理速度。本檢測(cè)模型在外部驗(yàn)證集上的診斷性能指標(biāo)AUC 為0.879,準(zhǔn)確度為0.847,能夠滿足臨床診斷的需求,輔助放射科醫(yī)生和公共衛(wèi)生提供者在結(jié)核病流行地區(qū)開展快速、準(zhǔn)確、高效的大規(guī)模結(jié)核病篩查工作。