近日,谷歌團(tuán)隊(duì)的又一重大研究成果登上期刊。該研究成果主要揭示了正常和異常胸片深度學(xué)習(xí)的區(qū)別,以及對結(jié)核病和COVID-19兩種致病因子不明顯疾病的概括。
值得關(guān)注的是,在人工智能系統(tǒng)優(yōu)先處理異常病例的模擬工作流程中,異常病例的周轉(zhuǎn)時(shí)間可以縮短28%,這關(guān)乎人工智能評估系統(tǒng)是否可以安全地用于以前未見異常標(biāo)記案例。
相關(guān)論文以《用于正常和異常胸片深度學(xué)習(xí)的區(qū)別以及對結(jié)核病和COVID-19兩種看不見疾病的概括》為題發(fā)表。
由谷歌健康團(tuán)隊(duì)成員丹尼爾·謝、博軒·卡梅倫·陳(音譯)和什拉維亞·謝蒂擔(dān)任共同通訊作者。
胸腔放射成像作為使用頻率較高的胸腔臨床成像模式,在指導(dǎo)心胸疾病管理方面具有至關(guān)重要的作用。一直以來,檢測特定的胸腔放射異常(Chest Radiography,CXR)研究是多個(gè)人工智能系統(tǒng)的主要焦點(diǎn)。
然而,由于CXR異常范圍十分廣泛,每個(gè)人工智能系統(tǒng)都需檢測一個(gè)或多個(gè)預(yù)先指定的條件。因此,試圖通過制備數(shù)個(gè)單獨(dú)的人工智能系統(tǒng),檢測每個(gè)有可能出現(xiàn)的情況與實(shí)際情況不相匹配。
面對這一挑戰(zhàn),該團(tuán)隊(duì)對人工智能系統(tǒng)進(jìn)行了開發(fā)與深度評估,將CXR射線分為正常和異常兩種。為了對CXR系統(tǒng)進(jìn)行調(diào)整,該團(tuán)隊(duì)開發(fā)了一個(gè)深度學(xué)習(xí)系統(tǒng)(DeepLearning System,DLS),在印度五個(gè)城市的五家醫(yī)院對約2.48萬名患者做了數(shù)據(jù)集識別,他們還對印度、中國和美國的6個(gè)國際數(shù)據(jù)集做了CXR系統(tǒng)通用性評估。
在這些數(shù)據(jù)集中,有4個(gè)側(cè)重于人工智能未受過檢測培訓(xùn)的疾病,另外4個(gè)分別是兩個(gè)結(jié)核病數(shù)據(jù)集和兩個(gè)2019年冠狀病毒疾病數(shù)據(jù)集。該團(tuán)隊(duì)的研究成果表明,人工智能系統(tǒng)可以使用包含各種胸腔放射異常的大型數(shù)據(jù)集進(jìn)行培訓(xùn),這些異常情況可以被分為新患者和癥狀不明的疾病人群。為了促進(jìn)CXR人工智能模型的持續(xù)開發(fā),該團(tuán)隊(duì)發(fā)布了他們收集的, 用于公開提供數(shù)據(jù)集的標(biāo)簽。
該研究成果表明,可信賴的人工智能系統(tǒng)可區(qū)分正CXR的正常或異常狀態(tài),對于患者的日常鍛煉和管理具有一定的益處。
首先, 在放射科醫(yī)生較大的審查情況下,人工智能算法可用于識別不太可能患病的病例,幫助醫(yī)療保健專業(yè)人員能夠快速地排除某些差異診斷,將更多的工作時(shí)間用于其他方向的疾病診斷。然后,將可能患病案例統(tǒng)一劃分到一組,以便進(jìn)行優(yōu)先審查,進(jìn)而縮短檢測周轉(zhuǎn)的時(shí)間。
其次,在大規(guī)模疾病爆發(fā)期間,當(dāng)臨床需求超過放射科醫(yī)生可用性的環(huán)境中,這種人工智能系統(tǒng)可能被用作非放射科醫(yī)生的前線護(hù)理點(diǎn)工具。更重要的是,需要對在開發(fā)過程中未遇到的異常CXR進(jìn)行人工智能評估,以驗(yàn)證其對新疾病或新疾病表現(xiàn)的穩(wěn)健性。
谷歌研究人員在論文中指出,在某些情況下,他們的深度學(xué)習(xí)模型在放射檢測方面具有較大的優(yōu)勢,可以較大地提高放射科科醫(yī)生工作效率。
該團(tuán)隊(duì)研究成員表示:“不論在相對健康的門診實(shí)踐,還是在異常繁忙的住院或門診環(huán)境中,DLS系統(tǒng)都有助于將異常的CXR置于優(yōu)先級,以便快速地向放射科醫(yī)生解釋。
在這項(xiàng)工作中, 該團(tuán)隊(duì)在一定的條件下,對這些有助于驗(yàn)證DLS的數(shù)據(jù)性能進(jìn)行了評估,并使用相同的數(shù)據(jù)進(jìn)行其他研究的基準(zhǔn)測試。
為了更好地了解DLS在逆轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng) (Reverse Transcription-PolymeraseChain Reaction ,RT-PCR)靈敏度方面的潛在影響,該團(tuán)隊(duì)對COVID-19案例進(jìn)行了更加詳細(xì)的分析。該案例在初始測試中具有“假陰性”RT-PCR測試結(jié)果, 定義為陰性R T -PCR測試,然后在五天內(nèi)檢測為陽性,在21個(gè)此類案例中,DLS的靈敏度達(dá)到95.2%。
為了解他們可發(fā)的DLS是具體如何幫助練習(xí)放射科醫(yī)生的, 他們調(diào)查了兩個(gè)基于DLS的模擬工作流程。假設(shè)放射科醫(yī)生尚未審查DLS陰性病例,并認(rèn)為這些案例被解釋為“正常”,基于評估目的,其有效的即時(shí)表現(xiàn)令人滿意。
放射科醫(yī)生和按照順序DLS放射科醫(yī)生設(shè)置之間的性能差異很小,但DS-1和CXR-14的有效“緊急”案例量減少了25%~30%,結(jié)核病數(shù)據(jù)集減少了約40%,COVID-19數(shù)據(jù)集減少了約5%~10%。
該團(tuán)隊(duì)開發(fā)的DLS可以解釋CXR是否為異常,并用6個(gè)數(shù)據(jù)集進(jìn)一步驗(yàn)證了它的適應(yīng)性,其中包含兩個(gè)廣泛的臨床數(shù)據(jù)集,兩個(gè)未見疾病的數(shù)據(jù)集以及兩個(gè)帶有第二種未發(fā)現(xiàn)疾病的數(shù)據(jù)集。
總之,該團(tuán)隊(duì)已經(jīng)開發(fā)并評估了一個(gè)與臨床相關(guān)的,可用于胸部X射線檢測的人工智能模型,并評估了其在6個(gè)不同數(shù)據(jù)集上的適用性。該團(tuán)隊(duì)希望,其研究成果中的性能分析以及公開可用的CXR-14圖像的專屬標(biāo)簽發(fā)布,可以促進(jìn)臨床CXR人工智能模型的持續(xù)發(fā)展。