摘? 要:醫(yī)學(xué)影像學(xué)正朝向大數(shù)據(jù)應(yīng)用方面發(fā)展,醫(yī)學(xué)影像大數(shù)據(jù)具有大規(guī)模、高增速、多結(jié)構(gòu)、高價值和真實準(zhǔn)確五個特點(diǎn)。受技術(shù)方面的制約,目前絕大多數(shù)影像數(shù)據(jù)還需依賴影像診斷醫(yī)師進(jìn)行人工分析,因此出現(xiàn)了誤診率高、醫(yī)師缺口大的問題。隨著我國發(fā)展人工智能腳步的加快,醫(yī)學(xué)影像被業(yè)內(nèi)認(rèn)為是人工智能在醫(yī)療中最有潛力的落地領(lǐng)域。在未來,AI醫(yī)學(xué)影像大數(shù)據(jù)主要會有以下幾個發(fā)展方向:開發(fā)智能醫(yī)學(xué)影像圖像分析工具、助力精準(zhǔn)醫(yī)療、促進(jìn)影像組學(xué)方法的發(fā)展。在發(fā)展的同時,我們還要關(guān)注制約醫(yī)學(xué)影像大數(shù)據(jù)應(yīng)用的幾個因素,即影像數(shù)據(jù)的規(guī)模與質(zhì)量還較低、數(shù)據(jù)標(biāo)注效率有待提高、“人工智能+醫(yī)療”的復(fù)合背景人才稀缺。
關(guān)鍵詞:醫(yī)學(xué)影像大數(shù)據(jù);人工智能;精準(zhǔn)醫(yī)療
中圖分類號:R445 文獻(xiàn)標(biāo)識碼:A ? ?文章編號:1671-2064(2019)24-0000-00
1 認(rèn)識醫(yī)學(xué)影像大數(shù)據(jù)
1.1 什么是醫(yī)學(xué)影像大數(shù)據(jù)
在醫(yī)學(xué)領(lǐng)域,隨著信息化的不斷深入,數(shù)字醫(yī)學(xué)數(shù)據(jù)越來越豐富,其中醫(yī)學(xué)影像數(shù)據(jù)是一個十分重要的組成部分,有超過80%的醫(yī)療數(shù)據(jù)來自于醫(yī)學(xué)影像。如果按照大數(shù)據(jù)的特點(diǎn),醫(yī)學(xué)影像大數(shù)據(jù)的定義可表示為:由DR、CT、MR等醫(yī)學(xué)影像設(shè)備所產(chǎn)生的,存儲在PACS系統(tǒng)內(nèi)的,大規(guī)模、高增速、多結(jié)構(gòu)、高價值和真實準(zhǔn)確的影像數(shù)據(jù)集合。其具有以下五個特點(diǎn):大規(guī)模、高增速、多結(jié)構(gòu)、高價值和真實準(zhǔn)確。
多結(jié)構(gòu)和高價值這兩點(diǎn)很好理解。醫(yī)療影像設(shè)備種類日益增長,使得醫(yī)學(xué)影像大數(shù)據(jù)包含結(jié)構(gòu)化表格、半結(jié)構(gòu)化文本、非結(jié)構(gòu)化影像等,數(shù)據(jù)結(jié)構(gòu)多樣;且現(xiàn)代醫(yī)學(xué)越來越依賴醫(yī)學(xué)影像數(shù)據(jù)進(jìn)行診斷,約80%的臨床問題需要影像檢查才能得到準(zhǔn)確的診斷結(jié)果,這使得影像大數(shù)據(jù)具有很高的醫(yī)學(xué)分析和指導(dǎo)價值。
大規(guī)模和高增速需要從市場和人口兩個大環(huán)境來解釋。據(jù)統(tǒng)計,我國科室級PACS、多科室或全院級PACE系統(tǒng)建設(shè)水平已經(jīng)分別達(dá)到了60-70%和50-60%,基本覆蓋國內(nèi)一線城市的三甲醫(yī)院,從市場增速來看,我國PACS市場年均增速在25%以上;人口方面,影響醫(yī)療影像大數(shù)據(jù)規(guī)模的主要是人口基數(shù)和年齡的分布,據(jù)預(yù)測,到本世紀(jì)中葉,我國老年人口數(shù)量將達(dá)到峰值,超過4億,屆時每3個人中就會有一個老年人,老齡化必將帶來醫(yī)療服務(wù)的旺盛需求。所以,目前PACS系統(tǒng)的普及率和人口數(shù)量的龐大,是我國醫(yī)學(xué)影像大數(shù)據(jù)的大規(guī)?;A(chǔ),而PACS系統(tǒng)和老齡人口的快速增長率,是醫(yī)學(xué)影像大數(shù)據(jù)的高增速的基礎(chǔ)。
作為大數(shù)據(jù)5V特征中的最后一環(huán),醫(yī)學(xué)影像大數(shù)據(jù)的真實性是如何實現(xiàn)的呢?這需要從數(shù)據(jù)處理技術(shù)方面來解釋。事實上,PACS系統(tǒng)從不同的影像設(shè)備上收集的數(shù)據(jù)在質(zhì)量上往往參差不齊,而數(shù)據(jù)分析結(jié)果的準(zhǔn)確度和可信度很大程度上取決于收集到的數(shù)據(jù)質(zhì)量的高低,所謂“垃圾進(jìn),垃圾出”,沒有數(shù)據(jù)準(zhǔn)確性作保證,大數(shù)據(jù)分析就變成了一紙空談。為了保證影像大數(shù)據(jù)的真實性,在影像設(shè)備將影像數(shù)據(jù)傳遞給PACS系統(tǒng)后,首先要做的第一步就是由PACS系統(tǒng)來對影像進(jìn)行后處理。以多維影像融合這項技術(shù)為例,主要包括數(shù)據(jù)預(yù)處理、圖像分割、特征提取以及匹配判斷這幾個過程。簡單來說,數(shù)據(jù)預(yù)處理是指將大量模糊的、不完整的、帶有噪聲和冗余的信息進(jìn)行清理和過濾, 濾掉殘渣,留下精華,將其變成適合挖掘的形式,包括圖像去噪、增強(qiáng)、平滑、銳化等工作;圖像分割和特征提取環(huán)節(jié)是將預(yù)處理過的圖像“切絲、切段”,為后期的智能匹配和判斷提供精準(zhǔn)的素材,例如器官形態(tài)模型、圖像邊緣特征模型、神經(jīng)網(wǎng)絡(luò)聚類模型等;最后的圖像匹配和聚類的過程,需要依賴深度學(xué)習(xí)等核心技術(shù),即人工智能與醫(yī)學(xué)影像大數(shù)據(jù)的融合。
1.2 醫(yī)學(xué)影像大數(shù)據(jù)的應(yīng)用現(xiàn)狀
據(jù)了解,目前絕大多數(shù)醫(yī)學(xué)影像數(shù)據(jù)都要依賴影像診斷醫(yī)師進(jìn)行人工分析。人工分析主要存在以下兩個問題:第一是精確度低。影像診斷結(jié)果會因為受到醫(yī)師的精力、耐力、眼力、經(jīng)驗水平等因素的局限,很容易被誤判。中國醫(yī)學(xué)會的一份誤診數(shù)據(jù)資料顯示,中國臨床醫(yī)療每年的誤診人數(shù)約為5700萬人,總誤診率為27.8%,其中惡性腫瘤平均誤診率為40%,如鼻咽癌、白血病、胰腺癌等,肝結(jié)核、胃結(jié)核等肺外結(jié)核的平均誤診率也在40%以上。因為醫(yī)療行業(yè)中80%-90%的數(shù)據(jù)都來源于醫(yī)學(xué)影像,醫(yī)學(xué)影像是醫(yī)生進(jìn)行疾病判斷的重要依據(jù),所以要降低誤診率,首先要提高影像診斷的精確度。
第二是放射科醫(yī)師缺口大。目前我國放射科醫(yī)師僅有8萬多名,每年承擔(dān)的診斷工作量卻達(dá)到了14.4億張影像,并且這個需求還在不停地增加,我國醫(yī)學(xué)影像數(shù)據(jù)以每年30%的速率增長,與之相對應(yīng)的放射科醫(yī)師的年增長速率卻只有4%,其間的差距是26%,放射科醫(yī)師數(shù)量的增長遠(yuǎn)不及影像數(shù)據(jù)的增長。這意味著放射科醫(yī)師在未來處理影像數(shù)據(jù)的壓力會越來越大,甚至遠(yuǎn)遠(yuǎn)超過負(fù)荷。據(jù)統(tǒng)計,有超過50%的放射科醫(yī)師工作時間在8小時以上,20.6%的醫(yī)師每天平均工作時間超過10個小時。面對爆炸式增長的醫(yī)學(xué)影像數(shù)據(jù)集和相當(dāng)較少的、水平不一的閱片醫(yī)師,醫(yī)師的疲勞、情緒等因素都將會導(dǎo)致誤診、漏診率的上升。
那么,面對目前醫(yī)學(xué)影像誤診率高、醫(yī)師缺口大的問題,應(yīng)該通過何種途徑去解決呢?從現(xiàn)有技術(shù)水平來看,最好的途徑便是人工智能,隨著人工智能和醫(yī)學(xué)影像大數(shù)據(jù)的逐漸普及,兩者的融合,必將成為醫(yī)學(xué)影像發(fā)展的重要方向。
2 未來醫(yī)學(xué)影像大數(shù)據(jù)的應(yīng)用發(fā)展
得益于高質(zhì)量、高標(biāo)準(zhǔn)化的醫(yī)療影像數(shù)據(jù)庫的快速積累,醫(yī)學(xué)影像天然具有使用人工智能進(jìn)行大數(shù)據(jù)處理的可能,再加上智能圖像診斷算法趨于成熟,人工智能技術(shù)被認(rèn)為是解決當(dāng)前醫(yī)學(xué)影像界面臨難題的“救命稻草”,醫(yī)學(xué)影像也因此成為人工智能在醫(yī)療中最有潛力的落地領(lǐng)域。醫(yī)學(xué)影像大數(shù)據(jù)與人工智能相結(jié)合主要會有以下幾個發(fā)展方向:
2.1 提供醫(yī)學(xué)影像圖像分析工具
AI醫(yī)學(xué)影像應(yīng)用中最為亮眼的成果無疑是“醫(yī)學(xué)影像閱片機(jī)器人”了。大數(shù)據(jù)、計算力以及人工智能算法是AI近年來崛起的基石,醫(yī)學(xué)影像閱片機(jī)器人的誕生也正基于此。據(jù)檢測,通過輸入上萬多張高質(zhì)量的人工標(biāo)注的CT影像,配以適用于AI的高性能計算機(jī)(HPC)設(shè)備和用于影像識別的3D卷積神經(jīng)網(wǎng)絡(luò)算法,閱片機(jī)器人就可以從若干張肺部CT光片中找到隱匿著的少量病人的CT片,快速識別圖片中病灶的位置,在準(zhǔn)確率上勝過了絕大多數(shù)專業(yè)醫(yī)生,在用時上更是遠(yuǎn)遠(yuǎn)超過了人類選手。
這種以“閱片機(jī)器人”為代表的人工智能醫(yī)學(xué)影像輔助診斷系統(tǒng)進(jìn)入臨床應(yīng)用后,勢必會將放射科醫(yī)師從繁重的閱片工作量中解脫出來,幫助醫(yī)生快速獲得影像診斷結(jié)果,提高診療效率和準(zhǔn)確性,并且這種經(jīng)過大數(shù)據(jù)訓(xùn)練后的影像輔助診斷系統(tǒng)可以變身為一個“類似應(yīng)用程序的東西”,嵌入在任何的服務(wù)器甚至手機(jī)上,從而能夠在社區(qū)、鄉(xiāng)鎮(zhèn)等醫(yī)療條件不高的地方給基層醫(yī)生“頂級專家看病的本事”。
2.2 助力精準(zhǔn)醫(yī)療
2013年,美國女星安吉麗娜·朱莉通過基因檢測,發(fā)現(xiàn)其攜帶了一個“乳腺癌易感基因”,根據(jù)醫(yī)生建議,朱莉接受了雙側(cè)乳腺切除手術(shù),通過手術(shù),朱莉患有乳腺癌的幾率從87%下降到了5%。這是一個典型的利用基因大數(shù)據(jù)實現(xiàn)“精準(zhǔn)治療”的案例。隨著計算機(jī)存儲量和運(yùn)行速度的提升,生物醫(yī)學(xué)大數(shù)據(jù)的整合利用,疾病的治療將從經(jīng)驗醫(yī)學(xué)向精準(zhǔn)醫(yī)學(xué)轉(zhuǎn)變,最終可實現(xiàn)疾病的“同病不同因,同因不同治”。而醫(yī)學(xué)影像大數(shù)據(jù)在精準(zhǔn)醫(yī)療的發(fā)展中發(fā)揮著絕對的主力作用,有超過90%的臨床醫(yī)學(xué)數(shù)據(jù)來自于醫(yī)學(xué)影像,如果能夠運(yùn)用人工智能技術(shù)分析醫(yī)學(xué)影像,深入挖掘影像特征與病狀之間的聯(lián)系,并將影像與醫(yī)學(xué)文本記錄進(jìn)行交叉對比,與基因組數(shù)據(jù)相結(jié)合,即可更準(zhǔn)確地分析出針對個體的診斷與治療方案,挽救患者的生命。
2.3 促進(jìn)影像組學(xué)方法的發(fā)展
在臨床實踐中,影像醫(yī)生對圖像的解讀還停留于主觀的判斷,通常基于病灶形態(tài)、大小、部位、密度/信號、增強(qiáng)強(qiáng)化模式等作出診斷。這樣的方法存在主觀性強(qiáng)、依賴于臨床經(jīng)驗等缺點(diǎn),已不能滿足現(xiàn)代醫(yī)療模式轉(zhuǎn)向精準(zhǔn)醫(yī)學(xué)實踐的要求,在臨床上亟需研發(fā)影像量化方法。近年來,隨著醫(yī)學(xué)影像大數(shù)據(jù)和醫(yī)學(xué)圖像分析技術(shù)的發(fā)展,從醫(yī)學(xué)圖像中挖掘信息,提供臨床醫(yī)生肉眼不能判讀的深層定量信息用于臨床分析與臨床指導(dǎo),逐漸成為醫(yī)學(xué)圖像研究的熱點(diǎn),影像組學(xué)因此而產(chǎn)生。
荷蘭學(xué)者Philippe Lambin教授于2012年提出影像組學(xué)(Radiomics)的概念,其定義是:利用計算機(jī)軟件,將醫(yī)學(xué)影像轉(zhuǎn)化為可挖掘的數(shù)據(jù),從中抽取海量的定量影像特征,用于臨床信息的解析。其基本分析流程包括:圖像獲取及病灶分割,影像組學(xué)特征提取,影像組學(xué)特征篩選、模型構(gòu)建和臨床信息解析等。簡單來說,它的工作流程與醫(yī)生日常讀片是非常類似的,針對影像數(shù)據(jù),提取特征,利用人工智能建模,然后再進(jìn)行臨床應(yīng)用、輔助決策。但相比醫(yī)生,它的最大優(yōu)勢在于計算機(jī)看到了高維信息,能夠看到蛋白基因在宏觀影像上的變化,這樣的寶貴數(shù)據(jù)可以輔助醫(yī)生提升臨床診斷的正確性和準(zhǔn)確性。
3 AI醫(yī)學(xué)影像發(fā)展面臨的問題
3.1 影像數(shù)據(jù)的規(guī)模與質(zhì)量需要進(jìn)一步提高
數(shù)據(jù)是人工智能算法所需的核心資源,僅掌握算法而缺乏數(shù)據(jù)是無法獲得較好訓(xùn)練效果的。現(xiàn)階段,我國的醫(yī)療影像仍處于從傳統(tǒng)膠片向電子數(shù)據(jù)過渡的階段,大量影像資料尚未數(shù)字化,且醫(yī)院之間的數(shù)據(jù)共享和互通程度較低,是否能夠獲取大規(guī)模的、優(yōu)質(zhì)的、標(biāo)準(zhǔn)化的、規(guī)范化的可靠大數(shù)據(jù)是對本行業(yè)的一個巨大考驗。
3.2 數(shù)據(jù)標(biāo)注效率有待提高
在獲取數(shù)據(jù)的基礎(chǔ)上,人工智能在對模型進(jìn)行訓(xùn)練之前,訓(xùn)練集需要進(jìn)行事先標(biāo)注。由于大多數(shù)圖像標(biāo)注還需依賴人工識別,至少需要兩位以上的資深醫(yī)學(xué)專家來控制標(biāo)注質(zhì)量,如果標(biāo)注結(jié)果不一樣,還會再聘請一位更高資歷的專家來確定標(biāo)準(zhǔn),數(shù)據(jù)標(biāo)注工作耗費(fèi)了較大量的人力和時間,成本非常高。因此在AI醫(yī)療影像領(lǐng)域,如何高效的自動獲取具有高可靠性的標(biāo)注數(shù)據(jù)也成為今后需重點(diǎn)解決的問題。
3.3 跨學(xué)科人才稀缺
在醫(yī)學(xué)這個專業(yè)程度很高的領(lǐng)域,AI醫(yī)學(xué)影像應(yīng)用及平臺開發(fā)者不僅要研究人工智能算法,更要對醫(yī)療影像識別建立深入的了解,急需一大批高素質(zhì),既懂醫(yī)學(xué),又懂理學(xué)、工科的復(fù)合型、跨學(xué)科人才。歸根到底,一個AI產(chǎn)品是否符合醫(yī)療行業(yè)需求,主要看是不是解決臨床問題,是不是按照醫(yī)生的需求去設(shè)計,按照醫(yī)生的規(guī)劃達(dá)到一定效果,因此開發(fā)者只懂AI技術(shù)是遠(yuǎn)遠(yuǎn)不夠的,只有“人工智能+醫(yī)療”的復(fù)合背景人才才能開發(fā)出醫(yī)生真正覺得好用的產(chǎn)品,人才是決定本行業(yè)未來發(fā)展高度的決定性因素。
4 結(jié)語
醫(yī)學(xué)影像大數(shù)據(jù)與人工智能的結(jié)合已是大勢所趨,深入挖掘醫(yī)學(xué)影像大數(shù)據(jù)背后的價值,用人工智能賦能醫(yī)學(xué)影像大數(shù)據(jù),用科技的力量改變醫(yī)學(xué)影像診斷,釋放人工智能在醫(yī)療領(lǐng)域應(yīng)用的巨大潛力,解放醫(yī)生,讓患者看病不再困難,這將是時代賦予影像人肩上的重?fù)?dān)!
參考文獻(xiàn)
[1] 張振,周毅,杜守洪,等.醫(yī)療大數(shù)據(jù)及其面臨的機(jī)遇與挑戰(zhàn)[J].醫(yī)學(xué)信息學(xué)雜志,2014,35(6):2—8.
收稿日期:2019-10-22
作者簡介:滕樹凝(1981—),女,山東濟(jì)南人,碩士,講師,研究方向:醫(yī)學(xué)影像成像原理、醫(yī)學(xué)信息學(xué)。