【摘 要】目的:比較放射科醫(yī)師在人工智能(artificial intelligence,AI)骨齡評價(jià)系統(tǒng)輔助前后對兒童左手X線攝影的骨齡評估效能。方法:回顧性分析在我院就診的300例患兒左手X線平片。骨齡評測采用中華-05骨齡評定標(biāo)準(zhǔn),兩位低年資醫(yī)師(醫(yī)師1及醫(yī)師2)分別在有無AI輔助下分別記錄左手各骨質(zhì)的骨齡發(fā)育等級,并記錄時(shí)間。以兩位高年資放射醫(yī)師分別在有無AI系統(tǒng)輔助下評估結(jié)果的均值為參考標(biāo)準(zhǔn),計(jì)算骨齡測評的準(zhǔn)確率、均方根誤差(root mean square error,RMSE)、測評時(shí)間。結(jié)果:無AI輔助下,醫(yī)師1及醫(yī)師2分析差值在6個(gè)月及12個(gè)月診斷準(zhǔn)確率分別為77.3%和83%、88.7%和93.7%,RMSE值分別為9和8。在AI輔助下,醫(yī)師1及醫(yī)師2分析差值在6個(gè)月及12個(gè)月診斷準(zhǔn)確率分別為88.7%和90.3%、97%和97.3%,RMSE值分別為6和6;差異均具有統(tǒng)計(jì)學(xué)意義。無AI輔助下,實(shí)驗(yàn)組醫(yī)師和標(biāo)準(zhǔn)組醫(yī)師,平均評測耗時(shí)分別為124.79 s和89.13 s;有AI輔助下實(shí)驗(yàn)組醫(yī)師和標(biāo)準(zhǔn)組醫(yī)師,平均評測耗時(shí)分別為86.10 s和63.87 s,在AI輔助下平均評測耗時(shí)均有較大幅度減少(P=0.000)。結(jié)論:AI輔助骨齡評價(jià)系統(tǒng)可顯著提高醫(yī)師工作效率,減少閱片時(shí)間。
【關(guān)鍵詞】影像診斷;骨齡評估;人工智能
【中圖分類號】320.1140 【文獻(xiàn)標(biāo)志碼】A 【收稿日期】2023-10-10
隨著科技飛速發(fā)展,我國的普通家庭的平均生活水平得到明顯提高,絕大多數(shù)家長也越來越關(guān)心孩子的生長發(fā)育。骨齡(boneage,BA)是目前應(yīng)用于評價(jià)兒童及青少年生物年齡的最主流方法,在體育及司法領(lǐng)域都有著重要的應(yīng)用價(jià)值。全面且詳細(xì)的骨齡評估,能準(zhǔn)確地反映出兒童及青少年的生長發(fā)育水平[1]。醫(yī)師采用圖譜法(G-P圖譜、CHN圖譜),計(jì)分法(TW3法、中華05法及CHN法)進(jìn)行人工閱片,是目前主要的骨齡評價(jià)方法,此方法讀片耗時(shí)較長,并且主觀性強(qiáng)、穩(wěn)定性差,導(dǎo)致骨齡的評估效率較低,評估結(jié)果一致性較差[2]。隨著醫(yī)療領(lǐng)域的智能化發(fā)展,如何有效地利用人工智能(artifi?cial intelligence,AI)圖像處理能力,提高骨齡評估的數(shù)字化發(fā)展,緩解醫(yī)療資源緊張的局面,逐漸引起相關(guān)領(lǐng)域科研人員及臨床醫(yī)師的重視。深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Network,DCNN)等一系列深度AI智能學(xué)習(xí)的不斷更新發(fā)展,使其具有快速處理大批量的圖像數(shù)據(jù)的能力。本研究通過AI與影像醫(yī)師組成不同實(shí)驗(yàn)組的組間對比,探討AI與醫(yī)師在何種模式配合下對兒童及青少年骨齡評估的臨床應(yīng)用價(jià)值更高。
1 資料與方法
1.1 一般資料
回顧性分析因矮小、性早熟及預(yù)測身高等生長發(fā)育問題就診哈爾濱醫(yī)科大學(xué)附屬第六醫(yī)院的患兒 300例,其中男童97例,女童203例;年齡1~18歲,平均年齡:8歲9月,其中7~12歲占比最多,為71.67%;納入標(biāo)準(zhǔn):①兒童年齡1~18歲;②左手(包含左手掌骨、指骨、腕骨以及尺橈骨遠(yuǎn)側(cè)骨干3~4cm)正位骨齡數(shù)字化X線攝影片。③手部位擺位及投射點(diǎn)正確,無骨骺缺失。排除標(biāo)準(zhǔn):①嚴(yán)重骨畸形;②手腕部結(jié)構(gòu)包含不全。
1.2 儀器與方法
儀器采用安健Angell-DR-D-3數(shù)字化X線攝影機(jī),入組病例均行左手后前位X線平片檢查,為保證檢查結(jié)果的一致性,所有研究對象均使用同一型號DR儀器進(jìn)行檢查,并且技術(shù)人員均通過相應(yīng)技術(shù)操作培訓(xùn)。具體方法如下:①左手腕部正位X線片,圖像包含左手及腕部骨關(guān)節(jié)全部,也包括尺橈骨遠(yuǎn)端(橈骨和尺骨遠(yuǎn)端暴露≥3 cm)。②左手掌面向下緊貼床面,中指長軸與前臂長軸呈一條直線,五指自然分開,拇指與手掌約呈30°角。攝影焦片距控制在75 cm左右,并使用遮光柵。③球管十字定位中心線與手掌垂直,正對第三掌骨頭進(jìn)行投照,焦片距保持在合適范圍,避免骨骺重疊[3]。④將骨齡片通過DICOM格式導(dǎo)入PACS系統(tǒng)中。
1.3 AI 支持系統(tǒng)
采用醫(yī)準(zhǔn)醫(yī)療的人工智能系統(tǒng)軟件,掌指骨檢測采用目標(biāo)檢測模型Faster-RCNN,腕骨檢測采用語義分割模型Deeplab v3,各關(guān)節(jié)分類采用backbone為Densenet的序回歸模型。圖像展示關(guān)鍵點(diǎn)位分級評級標(biāo)準(zhǔn),針對手掌20塊骨頭(13塊掌指骨,7塊腕骨)進(jìn)行識別定位,并對每一塊骨頭進(jìn)行分級。采用醫(yī)準(zhǔn)醫(yī)療的人工智能系統(tǒng)軟件分析,內(nèi)嵌中華05法TW3-C-Rus和TW3-C-Carpal雙重計(jì)算結(jié)果,該系統(tǒng)可以AI單獨(dú)測評,也可以將圖像上關(guān)鍵點(diǎn)位分級評級信息提供給醫(yī)師,由醫(yī)師完成骨齡最終評測。所有X線平片以DCIOM 格式導(dǎo)入AI 支持系統(tǒng),系統(tǒng)進(jìn)行自動(dòng)骨齡評估(圖1)。
1.4 骨齡測評
標(biāo)準(zhǔn)組:由兩位高年資具有獨(dú)立審核資質(zhì)的影像醫(yī)師組成,首先共同對入組300張骨齡片進(jìn)行骨齡評估,評估方法采用適合中國兒童發(fā)育規(guī)律的中華05法骨齡標(biāo)準(zhǔn),采用平均值作為參考標(biāo)準(zhǔn)[4]。同時(shí)從打開圖像開始計(jì)時(shí),直至完成報(bào)告關(guān)閉圖像結(jié)束,記錄期間的評測時(shí)間。
試驗(yàn)組:2位低年資僅具備報(bào)告初寫能力的年輕醫(yī)師共同參與本次骨齡評估。骨齡評測使用中華05標(biāo)準(zhǔn)對入組影像進(jìn)行判讀,醫(yī)師1及醫(yī)師2分別在有無AI輔助下進(jìn)行骨齡評測,審閱所有左手X線平片;分別記錄左手各骨質(zhì)的骨齡發(fā)育等級,并以相同方法記錄時(shí)間。再由2位高年資醫(yī)師聯(lián)合AI輔助,對同一入組數(shù)據(jù)進(jìn)行骨齡評測,并以相同方法記錄時(shí)間??紤]到所有的醫(yī)生都對入組數(shù)據(jù)進(jìn)行了2次骨齡評估,為減少第1次評估對第2次評估的影響,實(shí)驗(yàn)將兩次評估間隔設(shè)定在2~3月左右。
1.5 統(tǒng)計(jì)學(xué)方法
采用SPSS 26.0統(tǒng)計(jì)分析軟件。本實(shí)驗(yàn)將實(shí)驗(yàn)組與標(biāo)準(zhǔn)組之間的誤差范圍分別定為6個(gè)月組以及12個(gè)月組,即二者骨齡評測結(jié)果在6個(gè)月以內(nèi)或12個(gè)月以內(nèi)定義為結(jié)果一致;分別觀察實(shí)驗(yàn)組與標(biāo)準(zhǔn)組之間誤差在6個(gè)月及12個(gè)月的準(zhǔn)確率及均方根誤差(root mean squared error,RMSE)。采用組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)評價(jià)兩位醫(yī)師分別在有無AI 輔助下評測骨齡結(jié)果的一致性,采用Bland-Altman法比較兩位醫(yī)師分別在有無AI輔助下評測骨齡結(jié)果之間的平均差異。計(jì)數(shù)資料用率表示,分類變量比較采用卡方檢驗(yàn),檢驗(yàn)水準(zhǔn)α=0.05。
2 結(jié)果
2.1 不同實(shí)驗(yàn)組之間預(yù)測差異分析
2.1.1 兩位醫(yī)師有無AI輔助下誤差在6個(gè)月及12個(gè)月內(nèi)的準(zhǔn)確率 組間判讀結(jié)果比較分析后,顯示在AI輔助下,2位醫(yī)師誤差在6個(gè)月及12個(gè)月內(nèi)的準(zhǔn)確率均有所提高,醫(yī)師1及醫(yī)師2 無AI 輔助,6 個(gè)月及12 個(gè)月診斷正確率分別為77.3%和83%、88.7%和93.7%;醫(yī)師1及醫(yī)師2在AI輔助下,6個(gè)月及12個(gè)月診斷正確率分別為88.7%和90.3%、97%和97.3%;且差異均有統(tǒng)計(jì)學(xué)意義(Plt;0.05);醫(yī)師1及醫(yī)師2無AI輔助下,RMSE值分別為9和8,醫(yī)師1及醫(yī)師2在AI輔助下,RMSE值分別為6和6;2位醫(yī)師在AI輔助下評估骨齡的RMSE值均減低(表1)。
2.1.2 各組間Bland-Altaman 分析 Bland-Altaman 分析發(fā)現(xiàn),醫(yī)師1在AI輔助下,95%誤差分布區(qū)間為(-10.964~12.904),無AI輔助的95%誤差分布區(qū)間為(16.674~18.060)。醫(yī)師2在AI輔助下,95%誤差分布區(qū)間為(-9.297~12.197),無AI輔助的95%誤差分布區(qū)間為(-12.982~16.336),說明在AI輔助下,兩位年輕醫(yī)師的評價(jià)結(jié)果與金標(biāo)準(zhǔn)的一致性顯著提高(圖2)。
2.2 2組評測左手骨齡的一致性比較
以標(biāo)準(zhǔn)組評估的月數(shù)為結(jié)局,觀察2位醫(yī)師在有無AI支持下的ICC 值。醫(yī)師1、2+AI組的ICC 值為0.981,醫(yī)師1、2獨(dú)立組ICC 值為0.958,醫(yī)師1、2+AI 組具有更高的一致性(表2)。
2.3 試驗(yàn)組與標(biāo)準(zhǔn)組評測時(shí)間比較
AI輔助下實(shí)驗(yàn)組醫(yī)師和標(biāo)準(zhǔn)組醫(yī)師,平均評測耗時(shí)分別為86.10 s和63.87 s;無AI輔助下耗時(shí)分別為124.79 s和89.13 s;在AI 輔助下平均評測耗時(shí)均有較大幅度減少(表3)。
3 討論
本次研究通過以中華-05為理論基礎(chǔ),結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型疊加建立網(wǎng)絡(luò)智能模型,對各個(gè)試驗(yàn)組對比研究,觀察試驗(yàn)組間骨齡評估的準(zhǔn)確性,最終目的是探索出AI與醫(yī)師在實(shí)際臨床工作中,處于何種模式配合下,對于兒童及青少年骨齡評估的臨床應(yīng)用價(jià)值更高,進(jìn)而更有助于臨床對兒童內(nèi)分泌問題的診斷和治療?,F(xiàn)階段,大多數(shù)醫(yī)院依然使用傳統(tǒng)骨齡評價(jià)方法,即計(jì)數(shù)法、圖譜法和計(jì)分法3種方法,計(jì)數(shù)法通過觀察和計(jì)算腕部骨化中心的數(shù)量,推算骨齡,由于誤差較大目前應(yīng)用較少。圖譜法(Greulich-Pyle 圖譜法為代表)是20世紀(jì)初以西方兒童為樣本,通過大樣本追蹤和整理后得出標(biāo)準(zhǔn)骨齡圖譜,再將被檢者的骨齡片與標(biāo)準(zhǔn)骨齡圖譜(即不同年齡層的平均水平)比較[5],該方法目前使用較廣泛,但除了受不同地域飲食及生活習(xí)慣影響、人種影響,也受醫(yī)師主觀因素影響,同一醫(yī)師或不同經(jīng)驗(yàn)醫(yī)師,評估的結(jié)論均有不同程度差異,可重復(fù)性差。有研究顯示,對同一位醫(yī)師進(jìn)行測試,方法是采用G-P圖譜法對被檢者的骨齡片進(jìn)行2次骨齡評估,2次骨齡評估結(jié)果差異明顯,平均為0.89歲,不同醫(yī)師之間的骨齡評估也具有差異性,差異平均為1.25歲[6-7];計(jì)分法(中華05法為代表)是我國專家在TW計(jì)分法基礎(chǔ)上于2006年修訂制定,該方法符合我國兒童的發(fā)育特點(diǎn),評價(jià)骨齡更客觀、準(zhǔn)確,但中華05法在實(shí)際的評價(jià)過程中耗時(shí)、費(fèi)力,因此在實(shí)際工作中應(yīng)用受到一定限制。
近些年來,AI在不同醫(yī)學(xué)領(lǐng)域中的應(yīng)用逐漸上升,AI的深度學(xué)習(xí)在視覺分析和自然語言處理等自動(dòng)計(jì)算領(lǐng)域,取得了顯著突破,在自動(dòng)骨齡評估中已成為目前主流方法。基于深度學(xué)習(xí)的AI骨齡評估模型,屬于一門基于多學(xué)科的新興技術(shù),可智能檢測模型包括影像體位自動(dòng)檢測、關(guān)鍵骨化中心識別、關(guān)鍵骨化中心評級、生長發(fā)育測評等;根據(jù)我國最新制定的中華-05骨齡評分法,針對本地區(qū)不同人群間掌指骨、腕骨及尺橈骨對應(yīng)特征進(jìn)行訓(xùn)練,設(shè)計(jì)適應(yīng)我國人群新的空間注意力機(jī)制,應(yīng)用通道注意力、輕量級卷積塊注意力、擠壓和激發(fā)注意力及空間注意力[8]等多種機(jī)制處理自然語言、分類圖像 及分割語義等任務(wù)的表現(xiàn)出眾,與原始卷積網(wǎng)絡(luò)比較,可顯著減弱處理高維輸入數(shù)據(jù)時(shí)的計(jì)算負(fù)荷,降低數(shù)據(jù)維度,使網(wǎng)絡(luò)更集中于訓(xùn)練ROI(Re?gion of Interest),使ROI空間注意力的權(quán)重更高,模型訓(xùn)練更加集中;清晰顯示手腕X線片中的關(guān)鍵部位局部信息,提取更強(qiáng)的特征,為進(jìn)一步骨齡評估處理提供基礎(chǔ)。早期研究[9]卷積神經(jīng)網(wǎng)絡(luò)模型的相關(guān)測試,結(jié)果顯示通過一系列深度學(xué)習(xí)算法,可較好地自動(dòng)評價(jià)骨齡。2017年Spampinato C等科研人員[10]通過搭建“Bonet”網(wǎng)絡(luò),對輸入圖像進(jìn)行點(diǎn)對點(diǎn)的深度骨齡回歸學(xué)習(xí),首次利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)模型進(jìn)行自動(dòng)骨齡評估,結(jié)果顯示平均評估誤差低于10個(gè)月。隨著模型不斷發(fā)展,其他研究[11-12]也得到比較大的收獲,諸如AI系統(tǒng)對于5~18歲骨齡評價(jià)一歲以內(nèi)的誤差lt;92.2%。有研究通過分析基于G-P標(biāo)準(zhǔn)AI系統(tǒng)的閱片效率和結(jié)果準(zhǔn)確性,其與金標(biāo)準(zhǔn)相差1歲以內(nèi)的平均比例為84.60%,平均判讀耗時(shí)AI系統(tǒng)僅需要1~2 s,閱片效率和結(jié)果準(zhǔn)確性均有進(jìn)一步的提高[13]。
本研究對入組數(shù)據(jù)的對比研究后顯示:實(shí)驗(yàn)組兩位醫(yī)師診斷正確率由最初的77.3% 和83%、88.7%和93.7%;在聯(lián)合AI輔助后都有明顯改變,上升至88.7% 和90.3%、97% 和97.3%;RMSE 值均有不同程度降低;在本研究中通過Bland-Altaman 分析,觀察兩位醫(yī)師在有無聯(lián)合AI情況下的ICC值,醫(yī)師1、2+AI 組的ICC 值為0.981,醫(yī)師1、2 獨(dú)立組ICC值為0.958,顯示醫(yī)師+AI的組合在骨齡評估環(huán)節(jié),在結(jié)果間比較中具有更高的一致性,以上研究數(shù)據(jù)對于日后兒童及青少年的臨床復(fù)查有著積極的影響。在時(shí)間方面,不同組別的醫(yī)師在聯(lián)合AI后,平均評測耗時(shí)均有較大幅度減少,閱片時(shí)間上相比于人工有明顯優(yōu)勢。本研究不足之處是樣本量比較小,在年齡層面上大部分局限在7~12歲之間,導(dǎo)致沒有更進(jìn)一步細(xì)化討論各個(gè)年齡層之間的骨齡評估效能。
AI輔助骨齡評價(jià)系統(tǒng)可提高醫(yī)師工作效率,顯著減少閱片時(shí)間,醫(yī)生間結(jié)果一致性得到提升,利于患兒復(fù)查。具有良好的臨床應(yīng)用前景,成為骨齡評估的主要發(fā)展方向。
參考文獻(xiàn)
[1] 何曉芬,唐桂波,李國峰,等. 青海省西寧市青少年腕部骨齡評
價(jià)[J]. 實(shí)用放射學(xué)雜志,2011,27(9):1396-1398.
He XF,Tang GB,Li GF,et al. Investigation of wrist bone age of adoles?
cent in Xining area of Qinghai Province[J]. J Pract Radiol,2011,27(9):
1396-1398.
[2] Wicks EC,Menezes LJ,Barnes A,et al. Diagnostic accuracy and
prognostic value of simultaneous hybrid 18F-fluorodeoxyglucose posi?
tron emission tomography/magnetic resonance imaging in cardiac sar?
coidosis[J]. Eur Heart J Cardiovasc Imaging,2018,19(7):757-767.
[3] Kagioka Y,Yasuda M,Okune M,et al. Right ventricular involve?
ment is an important prognostic factor and risk stratification tool in sus?
pected cardiac sarcoidosis:analysis by cardiac magnetic resonance im?
aging[J]. Clin Res Cardiol,2020,109(8):988-998.
[4] Tajmir SH,Lee H,Shailam R,et al. Artificial intelligence-assisted
interpretation of bone age radiographs improves accuracy and decreases
variability[J]. Skeletal Radiol,2019,48(2):275-283.
[5] Berst MJ,Dolan L,Bogdanowicz MM,et al. Effect of knowledge of
chronologic age on the variability of pediatric bone age determined us?
ing the Greulich and Pyle standards[J]. AJR Am J Roentgenol,2001,
176(2):507-510.
[6] 國家衛(wèi)生健康委員會2019 年1 月25 日例行新聞發(fā)布會文字
實(shí)錄[EB/OL].[2019-01-25].http://www.nhc.gov.cn/xcs/s7847/201901/
af1b200319ab4d4c9a8281a39a8be37a.shtml.
Transcript of the regular press conference of the National Health Com?
mission on January 25,2019[EB/OL].[2019-01-25].http://www.nhc.gov.
cn/xcs/s7847/201901/af1b200319ab4d4c9a8281a39a8be37a.shtml.
[7] 張鵬飛,李 輝. 三種骨齡評價(jià)方法在3~17歲兒童臨床應(yīng)用
中的一致性比較研究[J]. 中國循證兒科雜志,2017,12(4):263-267.
Zhang PF,Li H. Comparison of the consistency of three skeletal age
methods in 3 to 17 years old children[J]. Chin J Evid Based Pediatr,
2017,12(4):263-267.
[8] Chen L ,Zhang H ,Xiao J,et al.SCA-CNN:Spatial and channelwise
attention in convolutional networks forimage captioning[EB/OL].
[2017-11-19].https:// ieeexplore .ieee.org/document/8100150.
[9] Spampinato C,Palazzo S,Giordano D,et al. Deep learning for auto?
mated skeletal bone age assessment in X-ray images[J]. Med Image
Anal,2017,36:41-51.
[10] Spampinato C,Palazzo S,Giordano D,et al. Deep learning for au?
tomated skeletal bone age assessment in X-ray images[J]. Med Image
Anal,2017,36:41-51.
[11] Kim JR,Shim WH,Yoon HM,et al. Computerized bone age esti?
mation using deep learning based program:evaluation of the accuracy
and efficiency[J]. AJR Am J Roentgenol,2017,209(6):1374-1380.
[12] Lee H,Tajmir S,Lee J,et al. Fully automated deep learning sys?
tem for bone age assessment[J]. J Digit Imaging,2017,30(4):427-441.
[13] Wang FD,Gu X,Chen S,et al. Artificial intelligence system can
achieve comparable results to experts for bone age assessment of Chi?
nese children with abnormal growth and development[J]. PeerJ,2020,8:
e8854.
(責(zé)任編輯:李青穎)