季 冰,劉伶俐
(1 陸軍軍醫(yī)大學(xué)西南醫(yī)院放射科,重慶 400038,icerbox@126.com;2 陸軍軍醫(yī)大學(xué)基礎(chǔ)醫(yī)學(xué)院,重慶 400038)
人工智能(Artificial Intelligence,AI)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。它不僅是一門新興的交叉學(xué)科,涵蓋了計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、腦神經(jīng)學(xué)、社會(huì)科學(xué)等諸多領(lǐng)域,更是一種新型的智能機(jī)器,語言和圖像識(shí)別、語言和圖像處理、專家系統(tǒng)、機(jī)器人等都屬于人工智能的范疇[1]。近些年來,隨著深度學(xué)習(xí)、計(jì)算機(jī)視覺、大數(shù)據(jù)等關(guān)鍵技術(shù)的突破,“人工智能+醫(yī)療”的投資熱度持續(xù)攀升,其應(yīng)用研究更是涉及醫(yī)學(xué)影像、輔助診療、藥物研發(fā)、健康管理等多個(gè)領(lǐng)域,而醫(yī)學(xué)影像與人工智能的結(jié)合被認(rèn)為是最具發(fā)展前景的領(lǐng)域。
目前中國AI醫(yī)療企業(yè)主要集中在醫(yī)療影像相關(guān)領(lǐng)域,究其原因,主要緣于以下幾大機(jī)遇:
數(shù)據(jù)是人工智能發(fā)展的關(guān)鍵要素之一。醫(yī)療數(shù)據(jù)中超過90%的數(shù)據(jù)來自于醫(yī)學(xué)影像,如X線、CT、MRI、超聲、病理等。隨著人口老齡化和民眾健康需求的增長,近年來我國醫(yī)療衛(wèi)生機(jī)構(gòu)診療人數(shù)持續(xù)增加,從2010年的58.3億人次攀升至2017年的81.8億人次,年均漲幅超過5%[2-3]。作為疾病診斷與治療的重要依據(jù),影像數(shù)據(jù)總量也隨之迅猛增長,年增長率高達(dá)30%~40%,單個(gè)大型醫(yī)療機(jī)構(gòu)的年影像數(shù)據(jù)存儲(chǔ)量已超過1PB[4-5]。龐大的醫(yī)療市場(chǎng)和充足的影像數(shù)據(jù)為AI醫(yī)療的發(fā)展提供了動(dòng)力和基礎(chǔ)。
目前,我國醫(yī)療影像數(shù)據(jù)的分析幾乎全靠人工,醫(yī)師主要憑經(jīng)驗(yàn)進(jìn)行判斷。在影像數(shù)據(jù)飛速增長的同時(shí),我國影像醫(yī)師年增長率只有4%[4],為人工閱片帶來了極大挑戰(zhàn)。據(jù)國家衛(wèi)健委統(tǒng)計(jì)顯示,2013~2015年三年中,全國累計(jì)完成放射診療12.4億人次[6]。而中國放射從業(yè)人員約15.8萬人,其中放射醫(yī)師只有約8萬人,副主任醫(yī)師以上職稱的只有2萬人。由此推算,平均每位影像醫(yī)師每年需要處理5100多人次的報(bào)告,副高以上職稱的影像醫(yī)師由于有審核工作,診療人次將會(huì)更多[7]。影像醫(yī)師嚴(yán)重缺乏,長期處于超負(fù)荷工作狀態(tài);而人工智能在醫(yī)學(xué)影像中的應(yīng)用,有望減輕影像醫(yī)師的工作負(fù)擔(dān),提高診斷效率和準(zhǔn)確度。這為醫(yī)學(xué)影像AI的發(fā)展提供了臨床需求。
過去,由于軟硬件條件不成熟,優(yōu)質(zhì)數(shù)據(jù)資源短缺,人工智能并未實(shí)現(xiàn)廣泛應(yīng)用。隨著算法、算力等基礎(chǔ)技術(shù)條件的日漸成熟,大數(shù)據(jù)在計(jì)算過程中積累了大量優(yōu)質(zhì)、脫敏數(shù)據(jù),數(shù)據(jù)存儲(chǔ)、分析和精準(zhǔn)判斷決策能力提高;特別是深度學(xué)習(xí)、圖像識(shí)別、自然語言處理等技術(shù)的突破,驅(qū)動(dòng)醫(yī)學(xué)影像識(shí)別的精度和準(zhǔn)確度大幅提升[8]。因此,目前中國大多數(shù)AI醫(yī)療企業(yè)都以輔助診斷為主要業(yè)務(wù),且多偏重于基于圖像識(shí)別技術(shù)的影像學(xué)、病理學(xué)和皮膚病學(xué)等領(lǐng)域[5]。
2017年7月,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,從國家戰(zhàn)略層面對(duì)我國發(fā)展智能醫(yī)療作出了明確規(guī)劃,包括推廣應(yīng)用人工智能治療新模式、新手段,建立快速精準(zhǔn)的智能醫(yī)療體系,開發(fā)人機(jī)協(xié)同的手術(shù)機(jī)器人、智能診療助手等[9]。緊隨其后,科技部公布首批國家新一代人工智能開放創(chuàng)新平臺(tái)名單,明確指定騰訊公司為醫(yī)療影像平臺(tái)的建設(shè)者[10]。政府的大力支持,為醫(yī)學(xué)影像人工智能的發(fā)展提供了堅(jiān)強(qiáng)保障。
人工智能在醫(yī)學(xué)影像的應(yīng)用,主要是通過圖像識(shí)別和深度學(xué)習(xí)等技術(shù),實(shí)現(xiàn)機(jī)器“看片”和“讀片”的功能。具體應(yīng)用包括計(jì)算機(jī)輔助診斷、影像組學(xué)、影像基因組學(xué)等。
計(jì)算機(jī)輔助診斷系統(tǒng)(Computer Aided Diagnosis,CAD),是影像學(xué)AI應(yīng)用的重要內(nèi)容,它是將圖像處理、計(jì)算機(jī)視覺、醫(yī)學(xué)圖像分析等有效結(jié)合,通過系統(tǒng)處理后對(duì)異常征象進(jìn)行標(biāo)注,以幫助醫(yī)生快速發(fā)現(xiàn)病灶,提高診斷的效率和準(zhǔn)確率。CAD的研究,最早可追溯到20世紀(jì)60年代,但受技術(shù)水平的限制,研究進(jìn)展較為緩慢。20世紀(jì)80~90年代,隨著計(jì)算機(jī)技術(shù)、數(shù)學(xué)算法及統(tǒng)計(jì)學(xué)的發(fā)展,基于機(jī)器學(xué)習(xí)和圖像處理技術(shù)的CAD在醫(yī)學(xué)影像診斷領(lǐng)域獲得了快速發(fā)展,針對(duì)不同疾病的CAD研究大量涌現(xiàn)[11]。2012年以后,由于深度卷積神經(jīng)網(wǎng)絡(luò)的興起、大量數(shù)據(jù)的累積和基于圖像處理器的計(jì)算能力大幅提升,深度學(xué)習(xí)在醫(yī)療圖像上的研究空前高漲[12],從而使CAD的架構(gòu)更為簡(jiǎn)化,診斷更為精確。
目前,CAD可應(yīng)用于多種影像技術(shù)對(duì)疾病的檢測(cè)和診斷,在肺結(jié)節(jié)和肺癌篩查、乳腺癌篩查和前列腺癌影像診斷中應(yīng)用較廣,且表現(xiàn)較為突出[6]。一些CAD系統(tǒng)的性能已經(jīng)接近甚至超過放射科醫(yī)生。如2016年Liang 等[13]在50臺(tái)CT掃描設(shè)備上使用4種不同的CAD軟件,可檢出56%~70%易被放射科醫(yī)生漏診的結(jié)節(jié)。Patel等[14]利用自然語言處理軟件算法,可準(zhǔn)確獲得乳腺癌患者乳腺X線攝影的關(guān)鍵特征,并與乳腺癌亞型進(jìn)行關(guān)聯(lián),其診斷速度是普通醫(yī)師的30倍,且準(zhǔn)確率高達(dá)99%。但深度神經(jīng)網(wǎng)絡(luò)目前應(yīng)用最好的是解決簡(jiǎn)單任務(wù),比如分類、識(shí)別、切割等,對(duì)于綜合性的診斷,仍需要具有領(lǐng)域知識(shí)的專家來參與[15]。
影像組學(xué)(radiomics)源自于CAD,于2012年由荷蘭學(xué)者Lambin等[16]首次提出。作為一種大數(shù)據(jù)圖像分析方法,影像組學(xué)是從醫(yī)學(xué)影像中高通量地提取海量數(shù)據(jù),并對(duì)數(shù)據(jù)信息進(jìn)行深層次的挖掘、分析和解讀,以發(fā)現(xiàn)隱含在圖像中的額外信息,最高效地利用影像學(xué)檢查結(jié)果,實(shí)現(xiàn)臨床輔助決策[17]。其基本分析流程包括五個(gè)環(huán)節(jié): ①圖像采集:主要通過CT、MRI、PET等影像掃描方式采集圖像;②圖像分割:將影像中的異常組織(如腫瘤)或特定解剖組織(如海馬)等分割為1個(gè)或多個(gè)感興趣區(qū)域;③特征提?。簩?duì)感興趣區(qū)域進(jìn)行影像特征提取,主要包括強(qiáng)度、形狀、紋理、位置等特征;④量化分析:對(duì)上述特征進(jìn)行統(tǒng)計(jì)分析,常用的分析方法有重復(fù)測(cè)量信度分析、主成分分析、相關(guān)性分析和隨機(jī)森林等;⑤模型構(gòu)建:通過機(jī)器學(xué)習(xí)(深度學(xué)習(xí))方法建立基于影像組學(xué)特征的預(yù)測(cè)和分類模型[17]。
影像組學(xué)突破了基于形態(tài)學(xué)及半定量分析的傳統(tǒng)影像醫(yī)學(xué)模式,可提供以往基因檢測(cè)或病理檢查才能提供的信息,對(duì)于臨床醫(yī)生從早期圖像中獲取診斷信息有著重要幫助。目前,國內(nèi)外影像組學(xué)主要集中于腫瘤(如肺癌、乳腺癌、膠質(zhì)母細(xì)胞瘤、肝癌等)的相關(guān)研究,包括腫瘤的定性診斷、分級(jí)分期、基因表型預(yù)測(cè)、治療方法選擇及療效預(yù)后評(píng)估等[18]。
20世紀(jì)90年代初的基因組革命,推動(dòng)著醫(yī)學(xué)研究從基因水平探究疾病的基礎(chǔ)機(jī)制,以實(shí)現(xiàn)精準(zhǔn)醫(yī)療。傳統(tǒng)的基因分析手段依賴于有創(chuàng)的活檢取材或術(shù)后病理組織來進(jìn)行,具有一定的風(fēng)險(xiǎn)和潛在的并發(fā)癥。相比之下,醫(yī)學(xué)影像具有非侵入性、高分辨率、時(shí)空連續(xù)性等特點(diǎn),在展現(xiàn)復(fù)雜疾病表型差異的過程中具有獨(dú)特的優(yōu)勢(shì)。基于此,2000年以來陸續(xù)有學(xué)者將基因組數(shù)據(jù)和影像數(shù)據(jù)關(guān)聯(lián)起來進(jìn)行分析、挖掘,由此形成了新的研究方向,即影像基因組學(xué)(radiogen omics)[19-20]。影像基因組學(xué)與影像組學(xué)的細(xì)微區(qū)別在于,它不僅從影像數(shù)據(jù)(包括CT、MRI、PET等) 中提取能反應(yīng)個(gè)體健康狀態(tài)的定量影像表型特征,還要從生物組學(xué)數(shù)據(jù)( 包括基因組、轉(zhuǎn)錄組學(xué)和表觀組學(xué)等) 中提取基因型特征,并通過人工智能技術(shù)完成基因型特征與定量表型特征的關(guān)聯(lián)與融合分析,從而更好地實(shí)現(xiàn)對(duì)疾病的非侵入式診斷、預(yù)后預(yù)測(cè)和療效評(píng)估,是目前生物醫(yī)學(xué)最有前景的研究領(lǐng)域之一[20]。
近年來,影像基因組學(xué)在腫瘤和精神疾病等復(fù)雜疾病的研究領(lǐng)域不斷發(fā)展,在腦腫瘤、肺癌、乳腺癌等方面均有所探索。當(dāng)然,影像基因組學(xué)的數(shù)據(jù)分析和判斷,仍需要有經(jīng)驗(yàn)的放射科醫(yī)師或?qū)<也拍芡瓿?,人的智力是主?dǎo)成分,而計(jì)算機(jī)則幫助醫(yī)師計(jì)算和分析,提供有價(jià)值的信息。隨著研究的進(jìn)一步深入,影像基因組學(xué)將在醫(yī)學(xué)領(lǐng)域尤其是癌癥研究工作中發(fā)揮更加積極的作用,并很有可能改變癌癥患者的診斷、治療和預(yù)后。
影像數(shù)據(jù)的質(zhì)量決定了人工智能模型學(xué)習(xí)的結(jié)果,標(biāo)準(zhǔn)的影像數(shù)據(jù)和規(guī)范的數(shù)據(jù)標(biāo)注是醫(yī)療影像AI發(fā)展的關(guān)鍵。然而,盡管當(dāng)前我國醫(yī)療機(jī)構(gòu)積累了大量的影像數(shù)據(jù),但由于缺乏統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,并未實(shí)現(xiàn)影像圖像質(zhì)量和格式的同質(zhì)化。不同的醫(yī)療機(jī)構(gòu)由于信息化建設(shè)水平不一,不同廠商、不同檔次的影像設(shè)備存在圖像質(zhì)量、算法重建和參數(shù)設(shè)置的差異,即使同一臺(tái)設(shè)備,造影劑劑量、掃描層厚、成像深度和增益等也會(huì)對(duì)圖像產(chǎn)生影響,導(dǎo)致影像數(shù)據(jù)標(biāo)準(zhǔn)各異,圖片質(zhì)量參差不齊。同時(shí),影像數(shù)據(jù)必須經(jīng)過臨床經(jīng)驗(yàn)豐富的醫(yī)生標(biāo)注才能用于機(jī)器學(xué)習(xí),但數(shù)據(jù)標(biāo)注需要耗費(fèi)大量時(shí)間和精力,高質(zhì)量的、標(biāo)注過的數(shù)據(jù)資源相對(duì)有限,加上醫(yī)院之間的數(shù)據(jù)共享和互通程度較低,真正能夠接觸并利用到大規(guī)模優(yōu)質(zhì)醫(yī)療數(shù)據(jù)的開發(fā)者寥寥無幾。相當(dāng)一部分AI企業(yè)用于訓(xùn)練的數(shù)據(jù)只能來自有限的公開數(shù)據(jù)集或自備數(shù)據(jù)庫,存在著數(shù)據(jù)量過小、影像質(zhì)量較低、標(biāo)注不規(guī)范甚至標(biāo)注錯(cuò)誤等問題,勢(shì)必會(huì)影響機(jī)器學(xué)習(xí)的準(zhǔn)確性和普適性。因此,發(fā)展醫(yī)學(xué)影像AI,圖像數(shù)據(jù)亟須規(guī)范化和標(biāo)準(zhǔn)化。
當(dāng)前在醫(yī)學(xué)影像中應(yīng)用最多的深度學(xué)習(xí)算法,使用了大規(guī)模的神經(jīng)網(wǎng)絡(luò),包含了更多的計(jì)算隱層,具備強(qiáng)大的自我學(xué)習(xí)和自我編程能力,其復(fù)雜性和不確定性使得人工智能存在難以捉摸的“黑盒子”,即使是開發(fā)者本人,也很難解釋它的內(nèi)部運(yùn)作方式和某個(gè)具體行動(dòng)背后的邏輯[21]。這種不透明性和不可解釋性,使得某些算法偏見難以被覺察。同時(shí),當(dāng)前深度學(xué)習(xí)算法并未實(shí)現(xiàn)真正意義上的“智能”,它只不過是基于高速運(yùn)算能力和規(guī)模數(shù)據(jù)的模型而已,必須依賴大量已有的數(shù)據(jù)樣本,才能對(duì)新數(shù)據(jù)進(jìn)行分析和預(yù)測(cè)。而醫(yī)生的診療信息一般會(huì)帶有自己的主觀意愿,這些不易覺察的價(jià)值偏好,潛藏在數(shù)據(jù)中用于人工智能訓(xùn)練時(shí),可能會(huì)在算法中被復(fù)制和放大,并通過特征提取、匹配用戶偏好進(jìn)行推送,從而使數(shù)據(jù)產(chǎn)生偏倚[22];另外,如前所述,用于機(jī)器學(xué)習(xí)訓(xùn)練的數(shù)據(jù)量過小、質(zhì)量欠佳以及數(shù)據(jù)挖掘解讀能力有限等,都有可能帶來數(shù)據(jù)偏差,從而影響診斷的準(zhǔn)確性。
目前,AI醫(yī)療的研究和開發(fā)在我國還處于起步階段。盡管不少研究或產(chǎn)品已在實(shí)驗(yàn)室取得了驕人的成績,但由于大多數(shù)產(chǎn)品都是基于公開數(shù)據(jù)集訓(xùn)練而來,不能反映真實(shí)的、復(fù)雜的臨床環(huán)境,一旦落地臨床應(yīng)用,難以保持測(cè)試數(shù)據(jù)的高準(zhǔn)確率,錯(cuò)標(biāo)、漏標(biāo)、多標(biāo)現(xiàn)象時(shí)有發(fā)生,需要臨床醫(yī)生花費(fèi)大量時(shí)間精力進(jìn)行標(biāo)注和復(fù)查。同時(shí),由于AI技術(shù)尚處于發(fā)展階段,某些技術(shù)尚未完全成熟,導(dǎo)致機(jī)器性能還不夠穩(wěn)定,同一AI模型應(yīng)用于不同地域的醫(yī)院時(shí),可能會(huì)出現(xiàn)數(shù)據(jù)差異,需要進(jìn)行精細(xì)微調(diào)。另外,目前AI影像產(chǎn)品在單病種領(lǐng)域進(jìn)展迅速,如在肺結(jié)節(jié)篩查、糖尿病、眼病、兒童骨齡檢測(cè)等諸多細(xì)分領(lǐng)域取得了顯著成績,但在復(fù)雜的臨床使用環(huán)境中依然面臨較大挑戰(zhàn)。例如,肺結(jié)節(jié)篩查只是胸部CT檢查的一小部分需求,大量的肺炎、肺結(jié)核、慢阻肺等疾病所造成的“同病異影、異病同影”現(xiàn)象依然難以檢出,使得AI的應(yīng)用范圍非常局限[5]。這些都在一定程度上影響了臨床醫(yī)師的應(yīng)用積極性。
人工智能在醫(yī)學(xué)影像應(yīng)用中,需要采集和挖掘患者的大量信息,包括患者的基本信息、健康狀況、疾病狀況、生物基因信息等,一旦泄露后果不堪設(shè)想。如保險(xiǎn)公司在掌握個(gè)人病史的情況下,可能提高保險(xiǎn)費(fèi)用;用人單位可能把個(gè)人健康檔案作為是否聘用的重要依據(jù)等[23]?;颊唠[私泄露的風(fēng)險(xiǎn)主要來自于兩個(gè)方面:一是掌握數(shù)據(jù)的個(gè)人或機(jī)構(gòu)主動(dòng)泄露,如2016年,英國倫敦皇家自由醫(yī)院將大約160萬名患者的信息交給Deep Mind公司進(jìn)行醫(yī)學(xué)研究,因未能充分保護(hù)患者隱私和數(shù)據(jù)來源的正當(dāng)性受到質(zhì)疑,被英國信息委員會(huì)勒令整改[24]。二是被他人非法竊取。因人工智能條件下患者信息被保存于云端或存儲(chǔ)器,任何人都有可能從中獲取信息,即使有加密措施也不能完全阻止信息的調(diào)取,如果管理不善,存在被非法竊取的可能性。因此,AI醫(yī)療應(yīng)用中的信息安全和患者隱私保護(hù)將面臨巨大挑戰(zhàn),急需建立相應(yīng)的法律法規(guī)和倫理規(guī)范,對(duì)信息采集、傳遞、保管和應(yīng)用加以有效監(jiān)管。
人工智能參與醫(yī)學(xué)影像診斷和治療,事實(shí)上承擔(dān)了部分醫(yī)師的工作,使得原有的醫(yī)患關(guān)系格局發(fā)生了變化,醫(yī)與患之間多了醫(yī)療人工智能平臺(tái)或系統(tǒng),以及人工智能設(shè)計(jì)制造商,由此帶來了一系列責(zé)任劃分的問題。當(dāng)出現(xiàn)誤診、漏診或在診療中發(fā)生系統(tǒng)故障,給患者的疾病診治和身體健康帶來損害時(shí),到底該由誰來負(fù)責(zé)?尤其是隨著人工智能技術(shù)的發(fā)展,今后的人工智能將擁有越來越強(qiáng)大的智能,在醫(yī)療活動(dòng)中將占據(jù)更加重要的角色,因此,有必要加強(qiáng)醫(yī)療人工智能背景下的風(fēng)險(xiǎn)責(zé)任規(guī)制,確?;颊吆凸姷慕】禉?quán)益。一般認(rèn)為,人工智能產(chǎn)品本身不具備承擔(dān)責(zé)任的能力,如果是因其質(zhì)量問題導(dǎo)致醫(yī)療損失,應(yīng)由其設(shè)計(jì)制造商負(fù)責(zé)[25]。而在診療過程中,醫(yī)師應(yīng)始終擔(dān)負(fù)起主導(dǎo)責(zé)任,依靠科學(xué)的思維和臨床經(jīng)驗(yàn),起好審核和把關(guān)作用。
雖然醫(yī)學(xué)影像AI目前仍處于弱人工智能階段,只能代替醫(yī)生從事一些簡(jiǎn)單的、重復(fù)的工作,但隨著技術(shù)的不斷進(jìn)步,從弱人工智能過渡到強(qiáng)人工智能時(shí)代是值得期待的。同時(shí),我們也應(yīng)看到,醫(yī)學(xué)影像AI在發(fā)展過程中,還將面臨技術(shù)、倫理、法律等方面的諸多問題和挑戰(zhàn),需要各方高度重視,采取措施加以規(guī)避和制約。如:制定相應(yīng)的法律法規(guī)和倫理規(guī)范,厘清責(zé)任權(quán)屬,明確行為邊界,使醫(yī)療AI的研發(fā)和應(yīng)用有所遵循;建立質(zhì)控管理系統(tǒng)和監(jiān)管體系,規(guī)范影像數(shù)據(jù)的采集標(biāo)準(zhǔn)和格式,并對(duì)影像AI的算法設(shè)計(jì)、產(chǎn)品開發(fā)、數(shù)據(jù)保護(hù)和產(chǎn)品應(yīng)用等進(jìn)行全流程監(jiān)管;加強(qiáng)理論攻關(guān)和技術(shù)研發(fā)力度,鼓勵(lì)“醫(yī)”“工”聯(lián)合,使醫(yī)學(xué)影像AI更契合臨床需求,并在臨床實(shí)踐中推動(dòng)人工智能技術(shù)不斷走向成熟和完善。