胡莎莎,朱永北,董 迪,王 蓓,王 馳,周作福,徐保平,劉秀云,彭 蕓*
(1.國家兒童醫(yī)學中心 首都醫(yī)科大學附屬北京兒童醫(yī)院影像中心,5.呼吸科,北京 100045;2.北京航空航天大學醫(yī)學科學與工程學院,北京 100191;3.中國科學院自動化研究所,北京 100190;4.福建省婦幼保健院放射科,福建 福州 350000)
肺炎是全球范圍內兒童住院和死亡的主要原因,每年有近1.2億新發(fā)病例和100萬兒童死亡[1];兒童社區(qū)獲得性肺炎(community acquired pneumonia,CAP)占全世界5歲以下兒童死亡總數的16%[2]。CAP常見病原為病毒、細菌和肺炎支原體(mycoplasma pneumoniae,MP),針對不同病原體治療方法亦有所不同。胸部X線攝影是影像學檢查呼吸系統疾病的主要方法之一[3],診斷兒童CAP的挑戰(zhàn)在于臨床癥狀、炎癥標志物和放射學征象雖可在一定程度上提示病原體,但并不能完全區(qū)分[4-5]?;谏疃葘W習(deep learning,DL)的人工智能算法已逐漸用于識別及診斷胸部病變[6-9]。本研究評價以胸部X線片訓練卷積神經網絡(convolutional neural network,CNN)模型診斷兒童不同病原CAP的價值。
1.1 研究對象 回顧性分析2013年1月—2018年12月1 769例于首都醫(yī)科大學附屬北京兒童醫(yī)院臨床診斷的CAP患兒,男1 107例,女662例,年齡10天~18歲,平均(3.3±3.1)歲;根據病原學診斷分為病毒組(n=487)、細菌組(n=496)及MP組(n=786)。排除標準:①合并其他局部或全身性疾病;②胸部X線片質量不佳。檢查前患兒家屬均簽署知情同意書。
1.2 儀器與方法 采用Kodak Healthineers DR7500全數字化X線攝影系統,行站立后前位或前后位投照或仰臥位投照;靶片距100~160 cm,根據患兒年齡及體質量設定曝光條件。
1.3 圖像分析 由2名具有5年以上工作經驗的影像科醫(yī)師在不知曉病原學診斷的情況下獨立閱片,觀察病變部位及密度特點,并記錄是否出現空洞、胸腔積液、胸膜增厚或肺過度通氣情況等,意見不一致時經協商達成一致。向XLSorDL卷積模型[10]輸入胸部X線片,系統自動提取雙肺輪廓進行分割,并將分割出的雙肺定義為全肺ROI(圖1)。采用ITK-SNAP軟件沿邊緣手動勾畫病變區(qū)域,系統自動根據手動分割邊界框裁剪病變區(qū)域,得到病灶ROI(圖2)。
圖1 患兒男,2歲,病毒性肺炎 A.胸部正位片;B、C.系統自動提取(B)雙肺輪廓并分割(C);D.獲取全肺ROI
圖2 患兒男,4歲,病毒性肺炎 A.胸部正位片;B.手動勾畫病變區(qū)域;C.系統自動分割病變區(qū)域;D.獲取病灶ROI
1.4 模型選擇與訓練 將數據隨機以7∶1∶2比例分為訓練集、驗證集和測試集;各數據集再分為病毒亞組、細菌亞組及MP亞組。將測試集按性別分為男性亞組和女性亞組、以年齡中位數為分界線分為高年齡亞組和低年齡亞組,以Pytorch平臺分別基于訓練集和驗證集全肺ROI和病灶ROI數據訓練全肺模型和局部模型:采用標準Densenet模型,將全肺ROI調整為224×224,病灶ROI調整為160×160,以最小批量為32的Adam算法優(yōu)化模型,學習速率設置為0.001,動量系數設置為0.9。
1.5 統計學分析 采用Python統計包Scipy.stats進行統計分析,以±s表示計量資料,組間比較采用方差分析;以頻數表示計數資料,組間比較采用χ2檢驗。采用混淆矩陣計算模型對于測試集的準確率、精確度,評估模型整體效能;繪制受試者工作特征(receiver operating characteristic,ROC)曲線,計算曲線下面積(area under the curve,AUC),評估模型診斷測試集不同病原體CAP的效能,AUC≤0.7為效能較低,0.7
2.1 一般資料 訓練集、驗證集與測試集各亞組患兒性別及年齡差異均有統計學意義(P均<0.05),見表1。
表1 不同病原體CAP患兒一般資料比較
2.2 X線征象 3組間病變累及范圍差異有統計學意義(P<0.05),病毒組多累及雙肺,MP組多累及單側肺;受累肺組織密度改變特點差異有統計學意義(P<0.05);病毒組出現肺過度通氣者、細菌組出現空洞者明顯多于其余2組(P均<0.05);3組胸腔積液及胸膜增厚差異均無統計學意義(P均>0.05)。見表2。
表2 兒童不同病原體CAP胸部X線征象比較
2.3 診斷效能 全肺模型診斷不同病原CAP的準確率和精確度分別為61.85%、63.77%,局部模型診斷準確率和精確度分別為58.04%、54.05%。全肺模型診斷病毒性和細菌性CAP效能較高,AUC明顯高于局部模型(P均<0.01);局部模型診斷MP性CAP效能較高,但其AUC與全肺模型差異無統計學意義(P=0.14),見表3。
表3 CNN模型預測兒童不同病原體CAP的效能
2.4 分層分析 全肺模型和局部模型診斷測試集男性亞組和女性亞組不同病原CAP的AUC差異均無統計學意義(P均>0.05)。2種模型診斷高年齡亞組和低年齡亞組病毒及細菌性CAP的AUC差異均無統計學意義(P均>0.05),而診斷MP性CAP的AUC差異均有統計學意義(P均<0.05)。見表4。
表4 CNN模型診斷兒童不同病原體CAP分層分析AUC比較
兒童CAP早期胸部X線片可出現明顯異常征象,此時臨床癥狀及肺部體征可能并不明顯,胸部X線片雖無法做出具體病原學診斷,但有助于縮小診斷范圍。本研究基于CAP患兒胸部X線征象建立CNN模型,以診斷兒童不同病原CAP。
不同病原CAP胸部X線表現有所不同。病毒性CAP多呈間質性改變,細菌性CAP多以實質性改變?yōu)橹?,但二者亦有重疊而較難區(qū)分。MP性CAP病變多局限于氣道壁、甚至小氣道和呼吸性細支氣管,胸片可見支氣管周圍浸潤、網狀結節(jié)、斑片狀和局灶性實變[11-12],但僅據X線平片較難鑒別。
參照既往文獻[3]報道,本研究采用基于CNN的算法,利用一組神經元對給定圖像進行卷積,并從中提取相關特征,以處理CAP分類問題。YUE等[13-14]通過DL模型區(qū)分正常與CAP胸部X線片,所獲診斷結果可媲美影像科醫(yī)師。本研究采用DL算法自胸部X線片中挖掘具有價值的特征,以鑒別兒童CAP的病原體,并優(yōu)化出2種模型,其中全肺模型的整體診斷效能優(yōu)于局部模型,其診斷病毒性和細菌性CAP的效能較高,而局部模型診斷MP性CAP效能較高,但與全肺模型差異無統計學意義(P>0.05),提示胸部X線片整體可能包含與特定疾病相關的影像學特征,而不僅僅是病變部位。胸部X線片中CAP可表現為全肺或部分肺葉實變合并支氣管擴張、胸腔積液或間質浸潤等[14],而手動勾畫病灶時多選擇病變嚴重且明顯的區(qū)域,具有主觀性,導致全肺模型的診斷效能更佳。本研究對測試集按照性別和年齡進行分層分析,發(fā)現2種模型僅診斷高年齡亞組和低年齡亞組MP性CAP的AUC存在差異,可能與患兒平均年齡較大有關。
本研究的局限性:①CAP病原學分類未涉及結核、真菌等其他病原體;②為單中心、回顧性研究,可能存在數據偏倚。
綜上所述,基于胸部X線片建立CNN模型診斷兒童不同病原體CAP具有可行性,對指導臨床用藥、降低兒童肺炎死亡率具有重要意義。