張?jiān)趴凭标J,樹海峰,余思遜
1.西南交通大學(xué) 醫(yī)學(xué)院,四川 成都 610031;2.西部戰(zhàn)區(qū)總醫(yī)院 神經(jīng)外科,四川 成都 610083
神經(jīng)退行性疾病的顯著特征是大量神經(jīng)元丟失且不可逆轉(zhuǎn),如帕金森病、癲癇、阿爾茨海默病等。隨著全球人口老齡化問題的加重,這類疾病越來越普遍,為全球醫(yī)療、公共衛(wèi)生和社會(huì)帶來諸多問題[1]。
神經(jīng)退行性疾病的傳統(tǒng)診斷方式是由醫(yī)生對(duì)病灶的影像表現(xiàn)綜合分析后得出結(jié)論,其流程復(fù)雜、耗時(shí)、主觀性強(qiáng),且發(fā)生機(jī)制的復(fù)雜性和患者群體的異質(zhì)性為診斷和治療帶來嚴(yán)峻挑戰(zhàn)[2]。近年來,神經(jīng)影像技術(shù)的發(fā)展和人工智能技術(shù)的日趨成熟,各種計(jì)算機(jī)輔助診斷模型大量應(yīng)用到神經(jīng)影像數(shù)據(jù)的定量分析中,加上磁共振成像(Magnetic Resonance Images,MRI)的無創(chuàng)性、低成本、空間分辨率高等特點(diǎn),可以準(zhǔn)確識(shí)別大腦組織結(jié)構(gòu)和功能代謝異常等信息的改變[3]。因此,基于影像組學(xué)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在神經(jīng)退行性疾病的篩查、診斷、預(yù)后評(píng)估中扮演越來越重要的角色,其能量化、精細(xì)、客觀地分析大腦內(nèi)部組織結(jié)構(gòu)的異常,在解決傳統(tǒng)MRI掃描過程中所面臨的不易觀察病灶及檢測(cè)病灶特征性變化等諸多方面展現(xiàn)出了明顯的優(yōu)勢(shì)[4-5]。本文主要基于MRI影像組學(xué)的機(jī)器學(xué)習(xí)在輔助檢測(cè)神經(jīng)退行性疾病中的研究進(jìn)展進(jìn)行綜述,并展望進(jìn)一步改善機(jī)器學(xué)習(xí)的其他可能性相關(guān)方法,以便為后續(xù)神經(jīng)退行性疾病的相關(guān)治療研究提供依據(jù)。
“組學(xué)”一詞最早從分子生物學(xué)領(lǐng)域興起,包括基因組學(xué)、蛋白組學(xué)、免疫組學(xué)、超聲組學(xué)、影像組學(xué)等。其中,影像組學(xué)是一種大數(shù)據(jù)分析方法,即把傳統(tǒng)醫(yī)學(xué)影像中的一些肉眼無法識(shí)別的圖像特征轉(zhuǎn)換為高維的可識(shí)別的特征空間,然后利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法進(jìn)行統(tǒng)計(jì)學(xué)分析,最終建立具有診斷價(jià)值、預(yù)測(cè)價(jià)值的模型,輔助醫(yī)生決策[6]。2012年由Lambin等[7]首次提出影像組學(xué)概念,在腫瘤領(lǐng)域率先發(fā)展,2020年全年影像組學(xué)相關(guān)的論文多達(dá)千余篇,可見影像組學(xué)在整個(gè)醫(yī)療領(lǐng)域的迅猛發(fā)展趨勢(shì)。
傳統(tǒng)影像組學(xué)主要強(qiáng)調(diào)通過從不同模態(tài)影像中高通量地提取特征并進(jìn)行數(shù)據(jù)挖掘,如基因與分子標(biāo)記、病理分型、臨床決策和療效監(jiān)測(cè)等,增加機(jī)器學(xué)習(xí)的主要目的是建立模型,以使準(zhǔn)確率提高且得到的結(jié)果也相對(duì)更加直觀?;谟跋窠M學(xué)的機(jī)器學(xué)習(xí)的優(yōu)勢(shì)在于可根據(jù)患者病史、分子特征和成像信息,識(shí)別更具體的生物標(biāo)志物進(jìn)行診斷,同時(shí)還可減少執(zhí)行臨床試驗(yàn)所涉及的時(shí)間和成本[2]。具體步驟如圖1所示:① 采集圖像:識(shí)別和整理大量具有相似臨床參數(shù)的圖像數(shù)據(jù)示例;② 圖像分割:手動(dòng)或自動(dòng)在圖像中分割出感興趣區(qū)域(Region of Interest,ROI);③ 特征提取:提取一階特征、二階特征和高階特征[8-9];④ 數(shù)據(jù)庫(kù)的預(yù)處理:選擇具有代表性的特征數(shù)據(jù)后,進(jìn)行機(jī)器學(xué)習(xí)建立模型;⑤ 訓(xùn)練分類器:通過訓(xùn)練分類器分析和預(yù)測(cè)這些高維信息,從而達(dá)到較高準(zhǔn)確率。機(jī)器學(xué)習(xí)分兩類,即監(jiān)督機(jī)器學(xué)習(xí)和無監(jiān)督機(jī)器學(xué)習(xí),區(qū)分方法為是否含有預(yù)測(cè)標(biāo)簽。無監(jiān)督機(jī)器學(xué)習(xí)常用方法有分層聚類;監(jiān)督機(jī)器學(xué)習(xí)常用方法有線性回歸、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、隨機(jī)森林、支持向量機(jī)等。
圖1 基于影像組學(xué)的機(jī)器學(xué)習(xí)的具體步驟
以鑒別腫瘤類型和良惡性為例,Yin等[10]對(duì)脊索瘤、骨巨細(xì)胞瘤和骨轉(zhuǎn)移瘤進(jìn)行特征分析,通過回歸算法篩選特征構(gòu)建分類模型,聯(lián)合T2加權(quán)序列和增強(qiáng)T1加權(quán)序列構(gòu)建三分類模型,準(zhǔn)確率為0.711。在神經(jīng)成像中具有代表性的是基于支持向量機(jī)分類帕金森病患者的特征子集和預(yù)測(cè)疾病進(jìn)展來創(chuàng)建放射組學(xué)特征,曲線下的面積達(dá)到0.836[11]。由此可見,影像組學(xué)的數(shù)據(jù)分析離不開機(jī)器學(xué)習(xí)的發(fā)展,更需要“醫(yī)”“工”二者同時(shí)深入融合和發(fā)展,發(fā)揮結(jié)合優(yōu)勢(shì)以取得成功。
下文針對(duì)癲癇和帕金森病兩種代表性疾病,總結(jié)了機(jī)器學(xué)習(xí)在診斷與鑒別、預(yù)測(cè)和量化等方面的應(yīng)用。
局灶性皮質(zhì)發(fā)育不良(Focal Cortical Dysplasia,F(xiàn)CD)是一種不易觀察特征的皮質(zhì)發(fā)育畸形,其由大量神經(jīng)元、膠質(zhì)細(xì)胞的異常增生和遷移導(dǎo)致。2011年國(guó)際抗癲癇聯(lián)盟將FCD分為FCDⅠ、FCDⅡ、FCD Ⅲ三種類型,主要臨床表現(xiàn)為藥物難治性癲癇,手術(shù)切除是治療的主要方法[12]。但FCD的常見特征不會(huì)全部在MRI中表現(xiàn)出來,如皮質(zhì)厚度異常、腦溝形態(tài)異常,以及灰、白質(zhì)交界處模糊等,因此不易觀察病灶的具體位置和表現(xiàn)。為解決這一難題,可引入機(jī)器學(xué)習(xí)對(duì)成年患者進(jìn)行FCD檢測(cè),通過兩步貝葉斯分類器從MRI中提取出不同特征進(jìn)行分類訓(xùn)練[13]。但兒童的大腦尚未完全發(fā)育,存在與成人大腦結(jié)構(gòu)不完全一致的情況。根據(jù)獨(dú)立性假設(shè)的條件——變量對(duì)類標(biāo)簽的貢獻(xiàn)是獨(dú)立的,因此引入一種成本低、準(zhǔn)確性高的改進(jìn)版本。該系統(tǒng)結(jié)合形態(tài)測(cè)量特征和MRI序列上的灰度共生矩陣進(jìn)行紋理分析(表1):應(yīng)用3個(gè)MRI序列組合能提高算法性能,在正確區(qū)分出所有健康受試者的同時(shí),其對(duì)MRI陽(yáng)性病例的主觀敏感度達(dá)到97%,MRI陰性病例達(dá)到70%[4]。除了手動(dòng)進(jìn)行病變檢測(cè)外,Jin等[14]的研究利用基于表面的MRI形態(tài)測(cè)量和機(jī)器學(xué)習(xí)在Ⅱ型FCD患者的混合隊(duì)列中進(jìn)行自動(dòng)病變檢測(cè),用組織學(xué)證實(shí)的海馬硬化癥來評(píng)估方法的特異性,計(jì)算相應(yīng)特征并將其融入非線性神經(jīng)網(wǎng)絡(luò)分類器中,對(duì)分類器進(jìn)行訓(xùn)練以識(shí)別病變聚類。這種方法的優(yōu)勢(shì)在于通過對(duì)接收機(jī)工作特性的分析,優(yōu)化了分類器輸出概率圖的閾值,最終靈敏度為73.7%。上述研究說明機(jī)器學(xué)習(xí)輔助基于表面的MRI形態(tài)測(cè)量具有優(yōu)越性能,是在耐藥癲癇患者術(shù)前評(píng)估中提高FCD檢測(cè)效率的一種有價(jià)值的工具。
表1 機(jī)器學(xué)習(xí)在神經(jīng)退行性疾病診斷中的應(yīng)用
近年來,癲癇患者患精神共病的風(fēng)險(xiǎn)增加[19],有研究對(duì)所研究癲癇患者進(jìn)行神經(jīng)精神訪談時(shí),用N-grams和語(yǔ)言查詢及字?jǐn)?shù)詞類構(gòu)建機(jī)器學(xué)習(xí)分類模型并以此檢測(cè)患者自殺傾向,使用接收機(jī)工作特性曲線下的區(qū)域來測(cè)量性能,最終結(jié)果達(dá)到57%~78%。該結(jié)果提示當(dāng)傳統(tǒng)方法不適用時(shí),可以考慮口語(yǔ)的機(jī)器學(xué)習(xí)分析[15]。
帕金森?。≒arkinson’s Disease,PD)的發(fā)生機(jī)制主要是多巴胺能神經(jīng)元進(jìn)行性喪失,研究表明約60%多巴胺能神經(jīng)元顯著減少時(shí),患者才會(huì)出現(xiàn)運(yùn)動(dòng)遲緩和姿勢(shì)不穩(wěn)等臨床特征[20-21]。因此對(duì)PD的早期篩查干預(yù)和神經(jīng)保護(hù)尤為重要。有研究處理11個(gè)不同的訓(xùn)練和測(cè)試數(shù)據(jù)并將從中獲得的數(shù)據(jù)與統(tǒng)計(jì)數(shù)據(jù)進(jìn)行比較,發(fā)現(xiàn)使用隨機(jī)森林分類器的測(cè)試結(jié)果準(zhǔn)確率可達(dá)到85.81%,說明隨機(jī)森林算法是PD的良好分類器[22]。
早期預(yù)測(cè)研究根據(jù)霍恩-亞赫爾量表的測(cè)量結(jié)果,納入基于全腦白質(zhì)和臨床特征的影像組學(xué)模型,根據(jù)患者序列號(hào)將整個(gè)數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,再結(jié)合影像組學(xué)特征和臨床進(jìn)展評(píng)分構(gòu)建聯(lián)合模型。該模型對(duì)1期PD的預(yù)測(cè)準(zhǔn)確率為82.7%,對(duì)2期PD的預(yù)測(cè)準(zhǔn)確性為85.4%[16]。近年來,隨著智能手機(jī)的快速發(fā)展,許多PD患者的運(yùn)動(dòng)癥狀非常適合用智能手機(jī)進(jìn)行客觀測(cè)量[23],該方法規(guī)避了傳統(tǒng)式主觀并依賴評(píng)分者測(cè)量的缺點(diǎn);后續(xù)研究建立了PD嚴(yán)重程度的客觀測(cè)量方法,評(píng)估了參與者在智能手機(jī)應(yīng)用程序中完成5項(xiàng)任務(wù)(語(yǔ)音、手指敲擊、步態(tài)、平衡和反應(yīng)時(shí)間)的數(shù)據(jù),得到步態(tài)特征貢獻(xiàn)最大(33.4%)的結(jié)論。該研究利用新的機(jī)器學(xué)習(xí)方法,創(chuàng)建并驗(yàn)證了采用智能手機(jī)客觀評(píng)估PD嚴(yán)重程度的方法及其有效性,這些評(píng)估有助于改善臨床護(hù)理和新療法的開發(fā)[17]。
除了早期預(yù)測(cè)和程度量化外,還可以采用多學(xué)科方法,利用來自不同機(jī)構(gòu)的臨床、人口統(tǒng)計(jì)學(xué)和神經(jīng)影像學(xué)數(shù)據(jù)調(diào)查PD患者的跌倒情況,然后用機(jī)器學(xué)習(xí)的方法構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)的可靠性通過5折交叉驗(yàn)證和外部驗(yàn)證進(jìn)行評(píng)估,最終準(zhǔn)確率達(dá)70%~80%[18]。
深度學(xué)習(xí)是一種模仿大腦神經(jīng)元傳遞過程來分析數(shù)據(jù)(即人工神經(jīng)網(wǎng)絡(luò)研究)的特殊機(jī)器學(xué)習(xí)方法,在醫(yī)學(xué)成像如口腔腫瘤組織病理預(yù)后的提高和心血管醫(yī)學(xué)的電生理指標(biāo)中,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)、深度信任網(wǎng)絡(luò)等模型訓(xùn)練每層神經(jīng)元,最后使用算法進(jìn)行調(diào)優(yōu)[24-25]。其最大特點(diǎn)是可以自主從圖像中提取復(fù)雜的層次特征,進(jìn)而對(duì)大量數(shù)據(jù)進(jìn)行訓(xùn)練得到滿意的結(jié)果,這種訓(xùn)練分類器的優(yōu)勢(shì)在于避免了經(jīng)典機(jī)器學(xué)習(xí)算法的局限性,性能也大大提升[26]。
通過評(píng)估6種機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法在同一樣本中使用相同功能性磁共振成像的特征,預(yù)測(cè)神經(jīng)性疾病的臨床改善狀態(tài),得出使用深度學(xué)習(xí)方法比淺層機(jī)器學(xué)習(xí)方法更能預(yù)測(cè)癥狀的改善,并且深度學(xué)習(xí)的準(zhǔn)確率高達(dá)70%[27]。將深度學(xué)習(xí)和標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)用于腦成像數(shù)據(jù)分析,結(jié)合結(jié)構(gòu)MRI圖像進(jìn)行大規(guī)模的系統(tǒng)比較,結(jié)果表明按照傳統(tǒng)的深度學(xué)習(xí)實(shí)踐進(jìn)行訓(xùn)練時(shí),深度學(xué)習(xí)具有更好的伸縮性和顯著的改進(jìn),在相對(duì)計(jì)算時(shí)間上也呈現(xiàn)出更低的漸近復(fù)雜性,進(jìn)一步說明深度學(xué)習(xí)可以利用這些數(shù)據(jù)來生成卓越的任務(wù)區(qū)分以表征人腦[28]。此外,在量化組織萎縮的研究中,需要對(duì)腦組織進(jìn)行分割和相應(yīng)的測(cè)量[29],其中顱骨剝離是關(guān)鍵預(yù)處理步驟,對(duì)基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的顱骨剝離技術(shù)進(jìn)行對(duì)比發(fā)現(xiàn),深度學(xué)習(xí)的顱骨剝離算法比傳統(tǒng)的顱骨剝離算法準(zhǔn)確率顯著提高[30]。
阿爾茨海默病嚴(yán)重影響老年人的生活質(zhì)量,也是最常見的神經(jīng)退行性疾病。如表2所示,Liang等[5]研究提出了一種基于弱監(jiān)督機(jī)器學(xué)習(xí)的深度學(xué)習(xí)框架,該框架由一個(gè)具有注意力機(jī)制的骨干網(wǎng)絡(luò)和一個(gè)可同時(shí)進(jìn)行圖像分類與圖像重建任務(wù)的網(wǎng)絡(luò)組成,利用有限的注釋對(duì)阿爾茨海默病進(jìn)行識(shí)別和分類。在兩個(gè)腦MRI數(shù)據(jù)集(2D MRI和3D MRI數(shù)據(jù))上使用僅20%的標(biāo)簽進(jìn)行微調(diào),最終準(zhǔn)確率達(dá)到99.69%。早期預(yù)測(cè)癲癇發(fā)作可以更好地改善患者的生存質(zhì)量和治療效果。有研究提出了4種深度學(xué)習(xí)模型來提取最具區(qū)分性的特征,利用卷積神經(jīng)網(wǎng)絡(luò)從不同的頭皮位置提取顯著的空間特征,并利用遞歸神經(jīng)網(wǎng)絡(luò)比現(xiàn)有方法更早地預(yù)測(cè)癲癇發(fā)作的發(fā)生率,提高了分類精度并縮減了預(yù)測(cè)時(shí)間,最終準(zhǔn)確率達(dá)到99.60%[27]。
表2 深度學(xué)習(xí)在神經(jīng)退行性疾病診斷中的應(yīng)用
綜上所述,傳統(tǒng)診斷模式在很大程度上依賴神經(jīng)外科醫(yī)師的主觀判斷,而機(jī)器學(xué)習(xí)從輸入的數(shù)據(jù)中學(xué)習(xí)特定的規(guī)則和見解,用計(jì)算機(jī)模擬和實(shí)現(xiàn)人類學(xué)習(xí)行為,利用經(jīng)驗(yàn)改善系統(tǒng)自身性能后,對(duì)未知數(shù)據(jù)進(jìn)行篩查和鑒別,并利用以深度學(xué)習(xí)為代表的卷積神經(jīng)網(wǎng)絡(luò)自適應(yīng)、自學(xué)習(xí)的強(qiáng)大信息處理能力,決定了其在圖像識(shí)別和輔助診斷中能夠得到較高準(zhǔn)確率。
雖然使用計(jì)算機(jī)輔助診斷技術(shù)大大改善了傳統(tǒng)神經(jīng)外科醫(yī)生的診斷模式,但目前研究還有一些局限性:① 在常規(guī)采集的圖像中,不同成像設(shè)備、成像參數(shù)、運(yùn)動(dòng)偽影等會(huì)使特征結(jié)果的可重復(fù)性降低,未來的研究應(yīng)著重如何指定標(biāo)準(zhǔn)化指南來規(guī)范操作;② 手動(dòng)劃分ROI難以實(shí)現(xiàn)自動(dòng)化大數(shù)據(jù)集分析;③ 可供研究的病例數(shù)目較少,深度學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集也相對(duì)較小,算法結(jié)構(gòu)基于監(jiān)督學(xué)習(xí),需要人工大規(guī)模數(shù)據(jù)處理信息標(biāo)簽,分類器的使用也相對(duì)單一,未來研究可擴(kuò)大樣本量、嘗試使用多種分類器并提高結(jié)果可信度;④ 兒童屬于特殊群體,配合度差,采集高質(zhì)量的影像數(shù)據(jù)難度較大,給影像組學(xué)的進(jìn)一步開展帶來了困難?,F(xiàn)在專門針對(duì)兒童的神經(jīng)退行性疾病的影像組學(xué)相關(guān)文章較少。相信隨著人工智能和機(jī)器學(xué)習(xí)方法的不斷進(jìn)步,其在神經(jīng)退行性疾病研究領(lǐng)域可以發(fā)揮更大的作用。