蕭 毅,劉士遠(yuǎn)
第二軍醫(yī)大學(xué)長征醫(yī)院影像科,上海 200003
大數(shù)據(jù)、算力及算法的進(jìn)步為人工智能(artificial intelligence,AI)開發(fā)及應(yīng)用帶來了重大突破。目前,基于AI的研究已廣泛涉及放射影像、病理圖像、超聲影像及內(nèi)鏡影像等多個不同醫(yī)學(xué)影像領(lǐng)域[1]。AI在許多醫(yī)學(xué)領(lǐng)域正迅速從實(shí)驗(yàn)階段過渡到應(yīng)用階段,在一些任務(wù)場景中AI已展現(xiàn)出與醫(yī)師相當(dāng)甚至超越醫(yī)師的能力。一旦AI協(xié)助影像科醫(yī)師提高了閱片的速度,醫(yī)療過程中的基礎(chǔ)環(huán)節(jié)和瓶頸環(huán)節(jié)將不斷優(yōu)化,醫(yī)療供給與需求的差異將逐步縮小,將令更多的患者從中受益。
受環(huán)境、吸煙、油煙及遺傳等因素的影響,肺癌的發(fā)病率、致死率已位列我國常見惡性腫瘤的第1位[2],且隨著我國人口老齡化,罹患肺癌的總?cè)藬?shù)呈現(xiàn)持續(xù)升高態(tài)勢[3]。循證醫(yī)學(xué)數(shù)據(jù)顯示,早期肺癌5年生存率顯著高于中晚期肺癌[4],早發(fā)現(xiàn)、早診斷及早治療是改善預(yù)后的重要途徑。肺癌防治的重要手段是早期篩查,其中胸部低劑量CT是國際公認(rèn)的有效手段。但是隨著胸部CT篩查人群的日益增多,影像科醫(yī)師的壓力也日趨增大。一方面影像科醫(yī)師缺口較大,不能匹配日益增長的工作量;另一方面隨著薄層低劑量CT的應(yīng)用,圖像數(shù)量的倍增、小結(jié)節(jié)顯示率的提高及結(jié)節(jié)的定量測量等使得讀片的難度顯著增加。此外,繁重、枯燥的閱片工作使影像科醫(yī)師的疲勞度增加,同時漏診、誤診的風(fēng)險也在增加。
近年來,計(jì)算機(jī)硬件水平的提升和深度學(xué)習(xí)等核心技術(shù)的發(fā)展推動了AI向社會各領(lǐng)域滲透。在我國,醫(yī)療領(lǐng)域是AI發(fā)展相對蓬勃的領(lǐng)域之一。基于深度學(xué)習(xí)的AI應(yīng)用目前已經(jīng)覆蓋病灶檢測、病理診斷、放療規(guī)劃和術(shù)后預(yù)測等各臨床階段[5-7]。鑒于在中國肺癌的高發(fā)病率、高病死率和高篩查率的現(xiàn)狀,影像醫(yī)生人員匱乏和勞動疲勞度等需求端的存在,以及國外的胸部公開數(shù)據(jù)集給了創(chuàng)業(yè)者起步的機(jī)會,利用公開數(shù)據(jù)集建立各自模型,并在中國大數(shù)據(jù)集下進(jìn)行訓(xùn)練等技術(shù)端的便利,使得肺結(jié)節(jié)人工智能技術(shù)如火如荼地發(fā)展起來,肺結(jié)節(jié)篩查模型也成為大多數(shù)人工智能創(chuàng)業(yè)公司的標(biāo)配。在早期的研究中,AI算法模型能自動分割胸腔區(qū)域,快速準(zhǔn)確地定位疑似肺結(jié)節(jié)的病灶,從大數(shù)據(jù)集學(xué)習(xí)所得到的算法模型可以避免主觀偏差,雖然部分模型篩選的結(jié)果中包含了一些假陽性結(jié)節(jié),但明顯降低了假陰性的發(fā)生,大大減輕了影像科醫(yī)師的工作量[8]。除此之外,AI算法模型不僅能提取肺結(jié)節(jié)的位置、形態(tài)信息,還能進(jìn)一步提供肺結(jié)節(jié)分類(實(shí)性、亞實(shí)性及鈣化等)乃至腫瘤良惡性分級等一些決策意見供醫(yī)師參考。據(jù)文獻(xiàn)報道,一些模型的篩查結(jié)果從統(tǒng)計(jì)學(xué)上看要優(yōu)于經(jīng)驗(yàn)豐富的影像科醫(yī)師[9-11]。多家三級甲等醫(yī)院已經(jīng)合作研發(fā)了各種肺結(jié)節(jié)AI模型,并將其應(yīng)用于臨床工作中,均取得了較好的效果。
盡管深度神經(jīng)網(wǎng)絡(luò)在診斷問題的有效性上已初步得到驗(yàn)證,但是醫(yī)學(xué)影像臨床工作中往往交織著多種不同任務(wù)。以肺結(jié)節(jié)的篩查為例,醫(yī)師需要在影像上識別出所有的肺結(jié)節(jié),對結(jié)節(jié)的大小、密度及形態(tài)等進(jìn)行完整的描述,并且根據(jù)指南對所發(fā)現(xiàn)的結(jié)節(jié)采取不同的隨訪方案。在隨訪過程中,醫(yī)師需要對比觀察結(jié)節(jié)大小、密度的變化,判斷結(jié)節(jié)的生長規(guī)律與良惡性,為臨床干預(yù)做決策準(zhǔn)備。從肺結(jié)節(jié)的篩查與診斷方面不難看出,AI需要在發(fā)現(xiàn)異常、量化測量、隨訪跟蹤和鑒別診斷中發(fā)揮可靠作用,最終才能具有臨床應(yīng)用價值。除了將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于醫(yī)學(xué)影像的分類問題(診斷),研究者們還需要繼續(xù)探索AI技術(shù)在醫(yī)學(xué)影像檢測問題(發(fā)現(xiàn)異常)、分割問題(量化測量)及配準(zhǔn)問題(隨訪跟蹤)中的應(yīng)用。
肺結(jié)節(jié)AI技術(shù)依靠強(qiáng)大的圖像識別和深度學(xué)習(xí)技術(shù),極大提高了數(shù)據(jù)分析的效率和準(zhǔn)確性,減輕了醫(yī)師的壓力,同時提高了診療的效率和準(zhǔn)確性。近年來,不同醫(yī)學(xué)專業(yè)紛紛舉辦了各類人機(jī)競賽,結(jié)果顯示AI技術(shù)在這類競賽中表現(xiàn)優(yōu)異,能夠快速準(zhǔn)確地識別病變。也有初步的應(yīng)用體驗(yàn)顯示,肺結(jié)節(jié)影像AI技術(shù)在發(fā)現(xiàn)5 mm以上磨玻璃結(jié)節(jié)、鈣化結(jié)節(jié)及0~3 mm結(jié)節(jié)篩查方面要優(yōu)于影像科醫(yī)師。姑且不論人機(jī)大賽的測試集、金標(biāo)準(zhǔn)等賽制設(shè)計(jì)問題,單論技術(shù)本身,影像AI技術(shù)目前在個別單項(xiàng)任務(wù)的確彌補(bǔ)了醫(yī)師的先天不足。如小結(jié)節(jié)的檢出,醫(yī)師因?yàn)榫?、視力等有限,確實(shí)不如模型找得準(zhǔn)、找得快;對病灶體積的測量,模型可以做得更快、更精準(zhǔn)。AI作為放射科醫(yī)師的助理,能夠在影像閱片中起到多重審核的作用,減少漏診的發(fā)生,為臨床醫(yī)師及患者提供更高水平的服務(wù),使得影像科醫(yī)師有望從一些枯燥、繁瑣的工作中解脫出來,將精力投入到疑難病例的會診等需要人類智慧的工作中。目前,肺結(jié)節(jié)人工智能模型已經(jīng)能夠?qū)崿F(xiàn)極高的靈敏度,對于微小結(jié)節(jié)的檢出達(dá)到了瞬間全識別。與此并行的是特異度的平衡,怎樣的靈敏度和特異度之間的平衡是臨床所認(rèn)可的,可能是影像界需要形成應(yīng)用共識的一個方面,也是技術(shù)公司需要了解并為之改進(jìn)的一個方面。
合適的醫(yī)療流程的改變能幫助緩解當(dāng)前醫(yī)療資源發(fā)展不平衡的現(xiàn)狀,解決影像科醫(yī)師匱乏與龐大病患人群日益增長的醫(yī)療需求矛盾。那么是否意味著影像科醫(yī)師將要被AI技術(shù)取代了呢?答案顯然是否定的,除去倫理和法律問題,僅就技術(shù)本身而言,現(xiàn)在的單一任務(wù)模式取代醫(yī)師日常工作還有很長的路要走。
AI技術(shù)立足于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),與以往傳統(tǒng)的算法相比,這一算法并無多余的假設(shè)前提,而是完全利用輸入的數(shù)據(jù)自行模擬和構(gòu)建相應(yīng)的模型結(jié)構(gòu)[12-15]。這一算法特點(diǎn)決定了AI是更為靈活的技術(shù),且具有根據(jù)不同的訓(xùn)練數(shù)據(jù)進(jìn)行自我優(yōu)化的能力。高速并行運(yùn)算、海量數(shù)據(jù)及更優(yōu)化的算法共同促進(jìn)了AI發(fā)展的突破。對影像AI技術(shù)來說,除了算法、算力之外,現(xiàn)階段最核心的是大數(shù)據(jù),尤其是規(guī)范標(biāo)注的大數(shù)據(jù)。如果將AI看成一個嬰兒,影像數(shù)據(jù)就是喂養(yǎng)這個嬰兒的奶粉。奶粉的數(shù)量決定了嬰兒是否能長大,而奶粉的質(zhì)量則決定了嬰兒后續(xù)的智力發(fā)育水平。
然而,海量的規(guī)范標(biāo)注數(shù)據(jù)恰是目前影像AI發(fā)展的瓶頸,數(shù)據(jù)的獲取及標(biāo)注都存在很多困難。① 數(shù)據(jù)的獲取方面:以肺結(jié)節(jié)為例,數(shù)據(jù)是深度學(xué)習(xí)算法所需的核心資源,僅掌握算法而缺乏數(shù)據(jù)無法獲得較好的訓(xùn)練效果。但是目前醫(yī)院之間的數(shù)據(jù)共享和互通程度較低,獲取大規(guī)模的多樣性數(shù)據(jù)對研發(fā)公司是一個考驗(yàn)。來自于單一醫(yī)院的訓(xùn)練集無疑會導(dǎo)致模型的過擬合現(xiàn)象,使得產(chǎn)品在其他醫(yī)院難以直接應(yīng)用。同時,由于疾病的多樣化,發(fā)病率低的病變集數(shù)量可能過少,出現(xiàn)模型診斷偏倚。② 在數(shù)據(jù)標(biāo)注方面:深度學(xué)習(xí)要結(jié)合先驗(yàn)知識對模型進(jìn)行訓(xùn)練,訓(xùn)練集需要事先標(biāo)注,而大多數(shù)標(biāo)注依賴人工識別,因此數(shù)據(jù)標(biāo)注將耗費(fèi)大量的人力、物力和時間。除此之外,醫(yī)學(xué)影像標(biāo)注的標(biāo)準(zhǔn)往往存在較多爭議,不同的國家、國際組織、學(xué)會和醫(yī)院可能執(zhí)行各自的體系,不同的醫(yī)師對征象的認(rèn)識也不夠統(tǒng)一。因此,建立中國的標(biāo)準(zhǔn)影像數(shù)據(jù)庫勢在必行,只有建立標(biāo)準(zhǔn)數(shù)據(jù)庫才能在質(zhì)量上解決圖像的臨床代表性、圖像多樣性、標(biāo)注的權(quán)威性與規(guī)范性及數(shù)據(jù)的可溯源性等問題,提高產(chǎn)品的魯棒性,加速AI醫(yī)療器械產(chǎn)品的研發(fā)和應(yīng)用。
從新技術(shù)落地的角度看,新的技術(shù)需要得到醫(yī)師反復(fù)使用和反饋從而逐步優(yōu)化模型,因此必須適應(yīng)醫(yī)院的日常流程,如產(chǎn)品是否與醫(yī)院信息化系統(tǒng)無縫銜接、產(chǎn)品自身是否包含了完整的信息化處理單元。相對而言,大型醫(yī)療企業(yè)具有豐富的市場經(jīng)驗(yàn)和醫(yī)療信息化系統(tǒng)整合能力,互聯(lián)網(wǎng)企業(yè)能借助自身的網(wǎng)絡(luò)平臺為基層醫(yī)院、社區(qū)衛(wèi)生服務(wù)中心等提供遠(yuǎn)程醫(yī)療影像檢測和診斷服務(wù)。但許多初創(chuàng)公司在快速推出產(chǎn)品搶占市場與優(yōu)化產(chǎn)品性能間陷入兩難境地。
從臨床應(yīng)用角度看,僅僅單一的肺結(jié)節(jié)篩查模型甚至肺癌診斷模型都不能滿足臨床診斷場景的需求。日常影像診斷工作中,影像科醫(yī)師需要對一份肺部影像資料進(jìn)行全面的評估和診斷,包括判斷是否有肺結(jié)節(jié)、肺氣腫、肺炎、支氣管病變、縱隔淋巴結(jié)腫大及心臟大血管病變等,進(jìn)而做出綜合評價。單一任務(wù)的肺結(jié)節(jié)AI技術(shù)顯然不能勝任全方位的臨床工作需求,需要進(jìn)一步研發(fā)多任務(wù)、多線程的真實(shí)場景診斷模型。
從技術(shù)創(chuàng)新的角度看,一種新的技術(shù)必須源自臨床的迫切需求,來自醫(yī)療場景的融入。如果,模型研究人員只懂算法,不了解臨床的流程和需求,不熟悉診斷的基本知識,無疑會造成閉門造車、自娛自樂。因此,醫(yī)療影像AI技術(shù)的發(fā)展需要“AI+醫(yī)療”跨學(xué)科人才的培養(yǎng)和匯聚。在較為專業(yè)的診療領(lǐng)域,應(yīng)用及平臺開發(fā)者不僅要研究AI算法,更要對醫(yī)療影像識別深入了解。
當(dāng)然,肺結(jié)節(jié)AI技術(shù)帶來的一系列社會問題和法律問題也是需要關(guān)注的重要部分,例如,AI進(jìn)入臨床進(jìn)行應(yīng)用的標(biāo)準(zhǔn)是什么,是達(dá)到人類醫(yī)生的準(zhǔn)入資格水平還是當(dāng)時最高的醫(yī)療診斷水平?做出AI診斷的主體在法律上是醫(yī)生還是診斷模型?利用AI模型診斷發(fā)生的醫(yī)療損害,應(yīng)由誰來承擔(dān)法律責(zé)任?是醫(yī)生或醫(yī)療機(jī)構(gòu)還是AI產(chǎn)品的責(zé)任人?這些都是在AI產(chǎn)品被準(zhǔn)予應(yīng)用于臨床時需要我們考慮的問題。目前,這項(xiàng)技術(shù)在臨床工作中扮演何種角色仍需要深入探討。
綜上所述,目前深度學(xué)習(xí)AI已經(jīng)在肺癌發(fā)現(xiàn)、診斷及隨訪工作中,在減輕醫(yī)師的工作負(fù)擔(dān)、降低漏診風(fēng)險及多因素綜合的預(yù)測判斷等方面逐步體現(xiàn)出自身的價值和優(yōu)越性。但需要規(guī)范標(biāo)注的數(shù)據(jù)進(jìn)行提升和評價,需要結(jié)合臨床需求研發(fā)多任務(wù)模式的AI技術(shù),只有這樣,才能實(shí)現(xiàn)輔助醫(yī)師診療的最終目標(biāo)。