熊金華,席 芊
(同濟(jì)大學(xué)附屬東方醫(yī)院醫(yī)學(xué)影像科,上海 200120)
近年來(lái),隨著人工智能(artificial intelligence,AI)技術(shù)的發(fā)展,AI在醫(yī)學(xué)數(shù)據(jù)分析和神經(jīng)影像自動(dòng)化診斷研究中的應(yīng)用日益廣泛。機(jī)器學(xué)習(xí)是目前AI實(shí)現(xiàn)的主要方法,能夠提取PD患者腦結(jié)構(gòu)或功能的形態(tài)學(xué)特征,從而進(jìn)一步挖掘出與疾病過(guò)程直接相關(guān)的有效病理信息。機(jī)器學(xué)習(xí)方法通過(guò)對(duì)全腦影像特征進(jìn)行特征選擇及模型構(gòu)建,實(shí)現(xiàn)了PD的自動(dòng)分類及預(yù)測(cè)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的子領(lǐng)域,其主要研究方法為卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN),可應(yīng)用于帕金森磁共振(magnetic resonance imaging,MRI)圖像的計(jì)算機(jī)輔助診斷,實(shí)現(xiàn)網(wǎng)絡(luò)提取特征的可視化,有助于深入了解帕金森腦部影像診斷特征。本文將綜述機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在PD早期診斷、分型及預(yù)測(cè)中的應(yīng)用。
機(jī)器學(xué)習(xí)是發(fā)展相對(duì)成熟的AI技術(shù),可以進(jìn)一步分為監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。其最流行模型包括支持向量機(jī)(support vector machines,SVM)、隨機(jī)森林(random forest,RF)及人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)。SVM已成為一種廣泛使用的分類工具,SVM使用標(biāo)記數(shù)據(jù)通過(guò)訓(xùn)練步驟生成最佳超平面,超平面最優(yōu)地將數(shù)據(jù)分成不同類型[12]。RF由Breiman[13]引入,是一種集成算法,將多個(gè)弱分類器組合,通過(guò)對(duì)弱分類器進(jìn)行投票或平均得到最終結(jié)果,從而達(dá)到更高的準(zhǔn)確率和泛化性能。ANN由相互連接的人工神經(jīng)元組成,通過(guò)數(shù)學(xué)表達(dá)式模擬神經(jīng)元之間的信號(hào)傳輸,從而建立和可視化輸入和輸出之間的非線性關(guān)系。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域,是使用特定架構(gòu)的監(jiān)督機(jī)器學(xué)習(xí)方法,其優(yōu)勢(shì)在于可擴(kuò)展性,很大程度上取決于自動(dòng)提取相關(guān)特征的能力[14]。深度學(xué)習(xí)包含CNN、遷移學(xué)習(xí)及生成性對(duì)抗性網(wǎng)絡(luò)。CNN由多層感知器演化而來(lái)[15]。CNN有多層卷積和激活,能夠形成輸入數(shù)據(jù)的高效表示[16]。遷移學(xué)習(xí)是一種將知識(shí)從一個(gè)域(源域)轉(zhuǎn)移到另一個(gè)域(目標(biāo)域),以在目標(biāo)域中獲得更好學(xué)習(xí)效果的深度學(xué)習(xí)方法。生成性對(duì)抗性網(wǎng)絡(luò)是由Goodfellow等[17]提出,是近年來(lái)復(fù)雜分布無(wú)監(jiān)督學(xué)習(xí)最有效的方法之一[18]。
PET和SPECT成像大量用于神經(jīng)退行性疾病的診斷,已成為PD早期檢測(cè)多巴胺變性和測(cè)量PD過(guò)程進(jìn)展速度的客觀工具[19]。多巴胺神經(jīng)元的缺失主要集中于黑質(zhì)致密部的尾部和外側(cè)區(qū),而其中的黑質(zhì)小體-1區(qū)(nigrosome1,N1)是PD患者病理生理變化的潛在成像生物標(biāo)志物[20]。Shin等[21]采用基于區(qū)域的物體檢測(cè)方法和CNN模型YOLOv3檢測(cè)N1區(qū)域并對(duì)其異常進(jìn)行準(zhǔn)確分類,結(jié)果表明識(shí)別和評(píng)估磁敏感加權(quán)MRI上的N1區(qū)域是可行的,表現(xiàn)出很高的診斷性能。Piccardo等[22]首次基于AI技術(shù),開展了利用18F-DOPA PET/CT識(shí)別患者黑質(zhì)紋狀體變性影響的研究,測(cè)試了3D CNN模型在識(shí)別突觸前多巴胺缺陷患者方面的診斷準(zhǔn)確性,發(fā)現(xiàn)該模型具有非常高的靈敏度和特異性。
除了基于黑質(zhì)紋狀體變性早期診斷PD外,利用MRI數(shù)據(jù)還能觀察出其他大腦區(qū)域受這種疾病的影響。Sateesh等[23]提出基于MRI的遞歸特征消除(recursive feature elimination,RFE)的元認(rèn)知徑向基函數(shù)網(wǎng)絡(luò)(meta-cognitive radial basis function network,McRBFN)分類器來(lái)識(shí)別PD關(guān)鍵腦區(qū),McRBFN分類器從MRI中提取基于體素的形態(tài)學(xué)測(cè)量(voxel based morphometric,VBM)特征,并采用基于投影的學(xué)習(xí)(projection based learning,PBL)算法,結(jié)果顯示PBL-McRBFN分類器對(duì)PD預(yù)測(cè)具有較好的泛化性能,PBL-McRBFN-RFE選擇的特征提示顳上回灰質(zhì)缺失可能是PD發(fā)病的原因。Esmaeilzadeh等[24]基于三維MRI圖像,使用CNN,同時(shí)將患者的年齡和性別特征也用于訓(xùn)練,發(fā)現(xiàn)在驗(yàn)證和測(cè)試集上取得了100%的準(zhǔn)確率,同時(shí)創(chuàng)建的PD診斷的腦熱圖首次發(fā)現(xiàn)右腦頂葉上部分在PD診斷中也是非常重要的。
VBM是一種在體素水平對(duì)腦MRI影像進(jìn)行分析的技術(shù),能顯示局部大腦灰質(zhì)、白質(zhì)密度和體積的改變,在PD研究中廣泛應(yīng)用[25-26]。Takahashi等[27]使用磁敏感定量圖像(quantitative susceptibility mapping,QSM)和神經(jīng)黑色素成像來(lái)評(píng)估PD,提出VBM的自動(dòng)感興趣區(qū)(region of interest,ROI)選擇方法,獲取黑質(zhì)致密帶的QSM值和神經(jīng)黑色素值,結(jié)果顯示PD組QSM值顯著高于健康受試者(healthy controls,HC)組,PD組神經(jīng)黑色素值明顯低于HC組。Peng等[28]使用基于多級(jí)ROI特征來(lái)檢測(cè)PD中敏感的形態(tài)計(jì)量生物標(biāo)志物,將低級(jí)ROI特征(灰質(zhì)體積、皮質(zhì)厚度等)和高級(jí)相關(guān)性特征(ROI之間的連通性)整合起來(lái)構(gòu)建多級(jí)ROI特征,基于特征選擇和多核支持向量機(jī)的分類算法在PD與HC分類上表現(xiàn)良好,準(zhǔn)確率為85.78%,特異度為87.79%,靈敏度為87.64%。
與灰質(zhì)與白質(zhì)的形態(tài)學(xué)差異研究不同,擴(kuò)散張量成像(Diffusion Tensor Imagings,DTI)能夠測(cè)量組織中水分子沿指定方向地隨機(jī)運(yùn)動(dòng),是一種表現(xiàn)組織微觀結(jié)構(gòu)的無(wú)創(chuàng)方法,目前廣泛用于神經(jīng)退行性疾病的研究[29-31]。Ramirez等[32]開發(fā)并評(píng)估了基于自動(dòng)編碼器模型,從全腦DTI數(shù)據(jù)中提取平均擴(kuò)散系數(shù)及局部各向異性分?jǐn)?shù),根據(jù)圖像體素重建誤差的強(qiáng)度和定位來(lái)衡量區(qū)分HC和PD患者的能力,ROC曲線作為分類問(wèn)題的性能測(cè)量,發(fā)現(xiàn)AUC較高的結(jié)構(gòu)是黑質(zhì)、紅核、丘腦和所有皮質(zhì)下結(jié)構(gòu)的組合。
靜息態(tài)功能磁共振成像是一種廣泛使用的神經(jīng)成像工具,可在沒有任何受控實(shí)驗(yàn)方式的情況下測(cè)量整個(gè)大腦的神經(jīng)血氧水平依賴信號(hào)的自發(fā)波動(dòng)[33]。Tang等[34]根據(jù)血氧水平依賴信號(hào)的靜息波動(dòng)來(lái)預(yù)測(cè)帕金森病的存在,SVM能夠在個(gè)體水平上進(jìn)行預(yù)測(cè),與HC相比,PD患者雙側(cè)舌回和左殼核的低頻振幅發(fā)生改變,右側(cè)小腦后葉的比率低頻振幅發(fā)生變化。Rubbert等[35]發(fā)現(xiàn)基于模型、數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)區(qū)分PD與HC是可行的,在使用全關(guān)聯(lián)方法分析全腦功能連接時(shí)表現(xiàn)出最佳的區(qū)分效果。與功能磁共振成像技術(shù)相比,SPECT是通過(guò)核素標(biāo)記的分子成像技術(shù),可以實(shí)現(xiàn)可視化和量化大腦的功能和代謝[36]。Rumman等[37]使用圖像處理和人工神經(jīng)網(wǎng)絡(luò)對(duì)PD和HC進(jìn)行對(duì)比,使用帕金森病進(jìn)展標(biāo)志物計(jì)劃數(shù)據(jù)庫(kù)中SPECT圖像,進(jìn)行后處理以找到尾狀核和殼核的ROI,然后將ROI的面積值饋送到模擬人類模式識(shí)別的人工神經(jīng)網(wǎng)絡(luò),對(duì)患有和不患有帕金森病的受試者進(jìn)行分類,準(zhǔn)確率達(dá)到94%,靈敏度為100%,特異度為88%。
已有研究表明,人腦網(wǎng)絡(luò)的結(jié)構(gòu)信息可以反映人腦的活動(dòng)模式,而大腦疾病患者的活動(dòng)模式往往與健康人群不同,并且復(fù)雜網(wǎng)絡(luò)已在一些神經(jīng)影像中得到有效應(yīng)用。Amoroso等[38]提出了基于復(fù)雜網(wǎng)絡(luò)的方法,利用MRI數(shù)據(jù)進(jìn)行早期診斷,首先定義大腦區(qū)域的網(wǎng)絡(luò)模型,并將每個(gè)區(qū)域的適當(dāng)連接措施關(guān)聯(lián)起來(lái),每個(gè)大腦都通過(guò)一個(gè)特征向量來(lái)編碼大腦區(qū)域相互交織的局部關(guān)系,RF進(jìn)行特征選擇和學(xué)習(xí)緊湊的表示,SVM將復(fù)雜的網(wǎng)絡(luò)特征與PD前驅(qū)期的典型臨床評(píng)分相結(jié)合,結(jié)果顯示結(jié)合腦網(wǎng)絡(luò)特征和臨床評(píng)分能獲得最佳診斷性能,ROC曲線下面積(area under curve,AUC)為0.97±0.02,準(zhǔn)確率高達(dá)93%±4%。
影像組學(xué)是一門新興的放射學(xué)領(lǐng)域,通過(guò)高通量計(jì)算,可以從斷層掃描圖像中快速提取無(wú)數(shù)的定量特征,將數(shù)字醫(yī)學(xué)圖像轉(zhuǎn)換為可挖掘的高維數(shù)據(jù)[39]。Liu等[40]提取PD患者與健康受試者T1WI圖像中尾狀核和殼核的影像組學(xué)特征,并構(gòu)建logistic回歸模型,分析出PD患者尾狀核和殼核的紋理值顯著高于對(duì)照組,提示基于T2WI圖像的新紋狀體放射組學(xué)特征對(duì)PD具有良好的診斷性能,具有作為PD診斷標(biāo)志物的潛力。Shu等[41]基于T1WI中全腦白質(zhì)的影像組學(xué)特征、人口統(tǒng)計(jì)學(xué)特征及臨床非運(yùn)動(dòng)癥狀作為預(yù)測(cè)因子,使用機(jī)器學(xué)習(xí)方法來(lái)構(gòu)建模型,研究發(fā)現(xiàn)影像組學(xué)標(biāo)志物在這些獨(dú)立預(yù)測(cè)因子中具有最高的診斷效力,在識(shí)別早期PD患者方面表現(xiàn)出良好的性能。
帕金森病中姿勢(shì)不穩(wěn)和步態(tài)困難亞型(postural instability and gait difficulty,PIGD)患者是臨床實(shí)踐中的難治性挑戰(zhàn)。盡管之前已經(jīng)嘗試研究PD人群中亞型特異性大腦改變,但仍然缺乏關(guān)于PIGD亞型患者的決定性神經(jīng)影像學(xué)生物標(biāo)志物。Gu等[42]首次引入基于機(jī)器學(xué)習(xí)的自動(dòng)分類,在個(gè)體水平上區(qū)分PIGD亞型和非PIGD亞型患者,將PD患者結(jié)構(gòu)和功能MRI數(shù)據(jù)集中顯著變化的區(qū)域設(shè)置為ROI,用于亞型的特異性特征提取,使用SVM算法構(gòu)建分類器,并使用靈敏度、特異度、準(zhǔn)確性、測(cè)量AUC值和個(gè)體的指標(biāo)評(píng)估其性能,該分類器顯示出92.31%的診斷準(zhǔn)確率,與臨床分類的鑒別診斷幾乎完全一致。
進(jìn)行性上核麻痹(progressive supranuclear palsy,PSP)、多系統(tǒng)萎縮(multiple system atrophy,MSA)與PD經(jīng)常具有相同的臨床特征,特別是在早期階段,如何有效的進(jìn)行區(qū)分對(duì)于臨床管理十分重要。Zhao等[44]開發(fā)出了3D深度殘差CNN,用于特發(fā)性帕金森病(idiopathic Parkinson’s disease,IPD)和非典型帕金森綜合征的早期自動(dòng)鑒別診斷,具有明顯帕金森特征的患者接受18F-FDG PET成像,該網(wǎng)絡(luò)對(duì)PSP、MSA與IPD的診斷的特異度及靈敏度都很高。Shinde等[45]使用CNN從神經(jīng)黑色素敏感磁共振成像中創(chuàng)建PD的預(yù)后和診斷生物標(biāo)志物,發(fā)現(xiàn)黑質(zhì)致密部的類別激活圖區(qū)分PD與非典型帕金森綜合征的測(cè)試精度達(dá)到85.7%。Chien等[46]用ANN處理多巴胺轉(zhuǎn)運(yùn)體(dopamine transporter,DAT)SPECT圖像,發(fā)現(xiàn)基于DAT-SPECT圖像殼核區(qū)域的ANN分類器在區(qū)分PD與其他疾病引起的帕金森綜合征方面優(yōu)于經(jīng)典生物標(biāo)志物。
除了在PD的早期診斷及分類研究外,學(xué)者對(duì)PD的運(yùn)動(dòng)功能進(jìn)行了跟蹤預(yù)測(cè)研究。DAT-SPECT顯像已廣泛應(yīng)用于PD研究,使用放射學(xué)特征與非影像學(xué)特征對(duì)DAT圖像進(jìn)行定量分析,可預(yù)測(cè)患者的預(yù)后。Adams等[47]在不提取特征的情況下,通過(guò)CNN,使用基線水平的PD統(tǒng)一評(píng)分量表第三部分(part Ⅲ ofthe unified Parkinson’s disease rating scale,UPDRSⅢ)評(píng)分與完整DAT圖像來(lái)預(yù)測(cè)患者第4年的UPDRSⅢ評(píng)分,將預(yù)測(cè)的評(píng)分與患者第4年UPDRSⅢ的實(shí)際評(píng)分進(jìn)行10折交叉驗(yàn)證,所有交叉驗(yàn)證的平均準(zhǔn)確率達(dá)到70.7%±7.7%,證明了CNN應(yīng)用于圖像和非成像特征進(jìn)行臨床預(yù)測(cè)的可行性。Salmanpour等[48]使用機(jī)器學(xué)習(xí)對(duì)帕金森病的運(yùn)動(dòng)與認(rèn)知功能的預(yù)后進(jìn)行了預(yù)測(cè),分析患者18項(xiàng)特征(臨床特征:第0年與第1年的UPDRS Ⅰ、Ⅱ、Ⅲ評(píng)分、年齡、性別、病程;DAT-SPECT成像特點(diǎn):第0年與第1年殼核及尾狀核的攝取)后,創(chuàng)建了32種特征組合,利用局部線性模型樹及特征子集選擇器算法,以第4年的UPDRSⅢ實(shí)際評(píng)分為預(yù)測(cè)結(jié)果的衡量標(biāo)準(zhǔn),得出第0年和第1年的UPDRSⅢ評(píng)分是預(yù)測(cè)第4年運(yùn)動(dòng)癥狀嚴(yán)重程度的高度顯著預(yù)測(cè)因子,同時(shí)基于基線水平和第1年時(shí)蒙特利爾認(rèn)知評(píng)估量表,采用優(yōu)化工具、特征子集選擇器算法以及各類預(yù)測(cè)算法的最佳利用,可對(duì)患者第4年時(shí)的認(rèn)知結(jié)果產(chǎn)生非常好的預(yù)測(cè)[49]。
深部腦刺激是PD的一種手術(shù)療法,可改善PD患者的運(yùn)動(dòng)癥狀,但治療效果仍然高度可變,因此對(duì)于臨床術(shù)前決策及預(yù)測(cè)術(shù)后的運(yùn)動(dòng)情況相當(dāng)重要。Liu等[50]基于患者術(shù)前QSM圖像上黑質(zhì)的影像組學(xué)特征,構(gòu)建了影像組學(xué)聯(lián)合機(jī)器學(xué)習(xí)的預(yù)測(cè)模型,發(fā)現(xiàn)對(duì)術(shù)后患者的整體運(yùn)動(dòng)和運(yùn)動(dòng)僵硬情況有較好的預(yù)測(cè)性能,且優(yōu)于常規(guī)的術(shù)前左旋多巴激發(fā)試驗(yàn)反應(yīng)的模型,表明該預(yù)測(cè)模型是一種創(chuàng)新實(shí)用的方法,可以輔助臨床醫(yī)生的術(shù)前決策。
綜合以上研究,基于機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的人工智能技術(shù)在PD早期診斷、分類、功能預(yù)測(cè)中發(fā)揮了重要作用。然而,當(dāng)前研究仍存在一些局限性,如樣本量少、規(guī)模小、訓(xùn)練集與驗(yàn)證集上數(shù)據(jù)檢驗(yàn)不足等,易產(chǎn)生過(guò)擬合現(xiàn)象,可以通過(guò)收集更多的訓(xùn)練示例,增加訓(xùn)練數(shù)據(jù)量來(lái)解決。高維神經(jīng)影像數(shù)據(jù)中需提取與PD相關(guān)性最高的分類特征,并通過(guò)特征選擇以及添加臨床數(shù)據(jù)改進(jìn)分類模型,對(duì)多模態(tài)影像特征進(jìn)行有效融合。同時(shí)PD存在不同的亞型,應(yīng)深入細(xì)化PD的臨床癥狀及病程分期研究、影像與神經(jīng)病理學(xué)演變階段對(duì)應(yīng)的研究。機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在PD早期診斷與分類研究中已有許多學(xué)者做了很多成熟的研究工作,但對(duì)于多模態(tài)影像下PD的結(jié)構(gòu)與功能研究尚在發(fā)展階段,同時(shí)也是未來(lái)研究的趨勢(shì)。