国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

影像與基因特征分析方法在阿爾茨海默病中的研究進(jìn)展

2022-11-24 07:19:38韓立婷姚旭峰趙從義
關(guān)鍵詞:遺傳變量特征

韓立婷 姚旭峰 金 宇 趙從義 黃 鋼

1(上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海 200082)

2(上海健康醫(yī)學(xué)院醫(yī)學(xué)影像學(xué)院,上海 201308)

3(上海市分子影像學(xué)重點(diǎn)實(shí)驗(yàn)室,上海健康醫(yī)學(xué)院,上海 201308)

引言

阿爾茨海默?。ˋlzheimer's disease,AD)是最常見的神經(jīng)退行性疾?。?]。AD 在神經(jīng)病理學(xué)上表現(xiàn)為大腦嚴(yán)重萎縮,細(xì)胞外淀粉樣斑塊和細(xì)胞內(nèi)神經(jīng)原纖維纏結(jié)積聚,這種病變?cè)谀X內(nèi)分布不均且不可逆。AD 已帶來(lái)巨大的社會(huì)和個(gè)人壓力和沉重的經(jīng)濟(jì)負(fù)擔(dān)[2-3],目前尚缺乏對(duì)其發(fā)病機(jī)制的認(rèn)識(shí)以及有效的診斷和治療方法,也缺乏有效的預(yù)防手段,突破這一困境迫在眉睫。

現(xiàn)有研究表明磁共振成像(magnetic resonance imaging,MRI) 和正電子發(fā)射斷層成像(positron emission tomography,PET)在AD 的診斷和預(yù)后評(píng)價(jià)中發(fā)揮重要作用[4-5]。此外,研究也證實(shí)AD 患者70%的風(fēng)險(xiǎn)是由復(fù)雜的遺傳風(fēng)險(xiǎn)因素引起的,其中APOEε4 是導(dǎo)致晚發(fā)性AD 發(fā)生的主要遺傳危險(xiǎn)因素,但其單一效應(yīng)僅占該疾病遺傳度的27.3%[6]。

迄今為止,AD 發(fā)病的遺傳基礎(chǔ)尚難以揭示,因?yàn)閱蝹€(gè)基因變異對(duì)該疾病遺傳風(fēng)險(xiǎn)的貢獻(xiàn)微弱,即其很可能是受數(shù)百個(gè)風(fēng)險(xiǎn)基因和多個(gè)環(huán)境風(fēng)險(xiǎn)因素的共同作用[7-8]。為此,許多研究者將影像特征與基因特征聯(lián)合分析,對(duì)AD 患者進(jìn)行分類和預(yù)測(cè)。

文中首先概述與AD 相關(guān)的影像特征和基因特征,隨后闡述統(tǒng)計(jì)學(xué)及機(jī)器學(xué)習(xí)方法在影像與基因特征聯(lián)合分析中的應(yīng)用,并討論其優(yōu)缺點(diǎn),最后對(duì)影像與基因特征分析方法在AD 應(yīng)用中的前景進(jìn)行展望。

1 AD 相關(guān)的影像與基因特征

隨著研究的不斷深入,影像與基因特征在揭示復(fù)雜疾病特異信息方面顯示了獨(dú)特優(yōu)勢(shì),特別是在AD 中的應(yīng)用較為廣泛[9]。目前,影像技術(shù)中PET和MRI 成像應(yīng)用最為廣泛,其為揭示AD 患者疾病進(jìn)展提供了可靠的生物標(biāo)記物,見表1。PET 依標(biāo)記物可分為氟脫氧葡萄糖PET(fluorodeoxyglucose positron emission tomography,F(xiàn)DG-PET) 和淀粉樣PET,F(xiàn)DG-PET 應(yīng)用較廣泛,其主要能顯示AD 患者在后扣帶回、楔前葉和顳葉皮質(zhì)等區(qū)域的大腦葡萄糖代謝率異常。如Christopher[10]等進(jìn)行了關(guān)于后扣帶回葡萄糖代謝率下降的全基因組關(guān)聯(lián)研究,發(fā)現(xiàn)后扣帶回中葡萄糖代謝的減少與PPP4R3A 基因中的rs2273674 位點(diǎn)存在顯著關(guān)聯(lián),從而揭示了腦內(nèi)糖代謝的病理機(jī)制。與PET 相比,MRI 在AD 診斷中得到了更為廣泛的應(yīng)用,MRI 主要包括sMRI和fMRI。MRI 的相關(guān)研究主要是發(fā)現(xiàn)了AD 患者的海馬、內(nèi)嗅皮質(zhì)以及全腦的萎縮速度都在加快。如Kim[3]等利用全腦的平均皮質(zhì)厚度進(jìn)行全基因組關(guān)聯(lián)分析(genome-wide association studies,GWAS),發(fā)現(xiàn)了4 個(gè)基因與皮質(zhì)厚度有相關(guān)性,并鑒定了基因生物功能信息,為AD 的治療提供了一定的幫助。

表1 主要成像方法的優(yōu)缺點(diǎn)Tab.1 Advantages and disadvantages of the main imaging method

雖然影像提供了許多重要的AD 疾病表型信息,但由于基因的異質(zhì)性,要對(duì)大量的遺傳信息進(jìn)行聯(lián)合分析仍需要深入探索。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是目前研究最為廣泛的基因組變體,其可影響蛋白質(zhì)的表達(dá)。起初的研究只能單獨(dú)分析每個(gè)SNP 位點(diǎn),加上大多數(shù)基因關(guān)聯(lián)研究提供的樣本量可能太小,難以統(tǒng)計(jì),因此隨后逐漸發(fā)展為更復(fù)雜的GWAS,并迅速成為相關(guān)基因研究的主要方法。

Coon[11]等首次完成了針對(duì)AD 的GWAS 分析,但僅發(fā)現(xiàn)APOE 為AD 的易感基因座,其發(fā)現(xiàn)的19號(hào)染色體上的SNP(rs4420638)位于APOEε4 變異遠(yuǎn)端的14 個(gè)堿基對(duì),與其他檢測(cè)的SNP 相比,該SNP 與AD 的患病風(fēng)險(xiǎn)的關(guān)聯(lián)更強(qiáng)。Lambert[12]等使用GWAS 分析,在歐洲血統(tǒng)的人群中新發(fā)現(xiàn)了11個(gè)AD 的易感基因座,發(fā)現(xiàn)的新位點(diǎn)中最強(qiáng)關(guān)聯(lián)的是ZCWPW1 基因,第二強(qiáng)關(guān)聯(lián)的是SORL1 基因,相關(guān)基因與常染色體顯性遺傳和AD 的患病風(fēng)險(xiǎn)增加相關(guān),該研究是截至2018年針對(duì)AD 最大的GWAS分析。在2018 和2019年,Marioni[13]等和Jansen[14]等用了更大樣本量進(jìn)行GWAS 分析,該研究發(fā)現(xiàn)了更多與AD 相關(guān)的易感基因,使其增加至40 個(gè),見表2。除此之外,該研究的基因分析還提供了多種方法,如主坐標(biāo)分析(principal co-ordinates analysis,PCOA) 和非度量多維尺度分析( nonmetric multidimensional scaling,NMDS)等[15]。隨著GWAS應(yīng)用的不斷發(fā)展,促進(jìn)了影像與基因特征聯(lián)合進(jìn)行相關(guān)性分析[16],逐步發(fā)展成腦研究新興領(lǐng)域,聯(lián)合分析技術(shù)旨在揭示遺傳對(duì)腦表型的影響,可用于檢測(cè)AD 的潛在生物標(biāo)志物,幫助開發(fā)新的治療方法。

表2 基因特征相關(guān)的主要研究Tab.2 Major studies related to genetic characteristics

早期的影像與基因特征聯(lián)合分析研究包括大腦形態(tài)和功能與SNP 之間的關(guān)聯(lián)分析[17-18],后來(lái)的相關(guān)研究更多是利用影像、基因特征等信息對(duì)AD進(jìn)行分類預(yù)測(cè),為AD 的診斷提供相應(yīng)的支持。神經(jīng)成像能夠捕捉一個(gè)人從正常衰老到神經(jīng)退行性疾病的發(fā)展過(guò)程,而基因變異能夠提供最終發(fā)展為復(fù)雜表型特征傾向的準(zhǔn)確信息,因此通過(guò)兩者聯(lián)合分析來(lái)研究AD,有助于實(shí)現(xiàn)更準(zhǔn)確的診斷和預(yù)測(cè)[19]。

2 統(tǒng)計(jì)學(xué)分析在阿爾茨海默病中的應(yīng)用

統(tǒng)計(jì)學(xué)分析方法分為兩類,即單變量統(tǒng)計(jì)分析方法和多變量統(tǒng)計(jì)分析方法。

2.1 單變量分析方法

早期的影像與基因特征聯(lián)合分析在AD 中的應(yīng)用研究大多集中于特定的候選基因,對(duì)于特定的候選基因變異或感興趣區(qū),單變量分析是最常用的方法。如表3 所示,Habes 等[20]構(gòu)建了一個(gè)線性回歸模型, 通過(guò)MRI 與APOEε4 聯(lián)合分析來(lái)確定APOEε4 對(duì)患者整個(gè)成年期腦萎縮的影響。

表3 單變量分析方法的優(yōu)缺點(diǎn)Tab.3 Advantages and disadvantages of univariate analysis method

由于單變量分析在特征空間范圍內(nèi)具有極高維度,因此被擴(kuò)展到基于大量成對(duì)單變量分析來(lái)處理全腦范圍的全基因組掃描。Stein 等[21]提出了基于體素的全基因組關(guān)聯(lián)研究(voxelwise genome-wide association study,VGWAS),探討了740 名受試者全腦31 622 個(gè)體素中的448 293 個(gè)單核苷酸多態(tài)性之間的關(guān)系,共使用300 個(gè)計(jì)算集群節(jié)點(diǎn)并行執(zhí)行所需的計(jì)算,為發(fā)現(xiàn)遺傳對(duì)大腦結(jié)構(gòu)的影響提供了一種新的方法。為解決該方法在速度方面的局限性,Huang 等[22]在此基礎(chǔ)上提出了一種更有效的方法,即快速體素式全基因組關(guān)聯(lián)分析(fast genome-wide association study, FVGWAS), 以此加速傳統(tǒng)的VGWAS 的計(jì)算,F(xiàn)VGWAS 比傳統(tǒng)的VGWAS 快幾十倍,通過(guò)該方法最終成功地確定了3 個(gè)基因,即ANK3、MEIS2 和TLR4 與智力低下、學(xué)習(xí)障礙和年齡有顯著的關(guān)聯(lián)。

遺傳數(shù)據(jù)的大規(guī)模單變量分析方法目前仍占主導(dǎo)地位,這是因其分析方法簡(jiǎn)單,且數(shù)據(jù)所需的模型相對(duì)易于擬合,但因局限性,如需進(jìn)行多項(xiàng)測(cè)試,連鎖不平衡(linkage disequilibrium,LD)帶來(lái)的冗余,以及缺乏上位性效應(yīng)的分析,而對(duì)這些局限效應(yīng)必須進(jìn)行明確建模,因此單變量分析方法的應(yīng)用受到很大限制。

2.2 多變量分析方法

單變量分析的局限在于:首先通常需要非常大的樣本量才有可能發(fā)現(xiàn)有意義的關(guān)聯(lián),其次其沒(méi)有考慮到潛在的基因交互作用,很可能導(dǎo)致重大關(guān)聯(lián)的發(fā)現(xiàn)力度不足。因此,影像基因特征聯(lián)合分析的最新方法學(xué)引入了多變量方法來(lái)捕捉有意義的信息。如偏最小二乘法(partial least-square,PLS)、獨(dú)立成分分析(independent component analysis,ICA)、典型相關(guān)分析(canonical correlation analysis,CCA)等。常用的多變量方法是整合兩種或兩種以上數(shù)據(jù)類型,其基本思想是最大化來(lái)自不同數(shù)據(jù)類型變量的線性組合之間的相關(guān)性,以此找到相互的關(guān)聯(lián)性。在這些算法的基礎(chǔ)之上,又有了改進(jìn)版本,如:稀疏典型相關(guān)分析、稀疏偏最小二乘法和稀疏降秩回歸等,并被證明在檢測(cè)多變量基因組學(xué)和腦成像關(guān)聯(lián)方面有效[23-26]。

如表4 所示,Du 等[27]在稀疏典型相關(guān)分析基礎(chǔ)之上,提出了一種新穎的結(jié)構(gòu)化稀疏規(guī)范相關(guān)分析模型和優(yōu)化算法,通過(guò)施加兩個(gè)新的懲罰項(xiàng),使新方法識(shí)別了更高的典型相關(guān)系數(shù),其在揭示具有生物學(xué)意義的影像遺傳關(guān)聯(lián)方面有良好的能力。

表4 多變量分析方法的優(yōu)缺點(diǎn)Tab.4 Advantages and disadvantages of the multivariate analysis method

Zhou 等[28]提出了一種新的聯(lián)合投影和稀疏回歸模型,以此來(lái)揭示表型和基因型之間的關(guān)聯(lián)。為了解決數(shù)據(jù)異質(zhì)性、復(fù)雜的表型-基因型關(guān)聯(lián)、高維數(shù)據(jù)(例如,數(shù)千個(gè)SNPS)和表型異常值等問(wèn)題,上述方法在基因組到表型預(yù)測(cè)的平均均方根誤差方面優(yōu)于幾種以往的最先進(jìn)方法。此外,該研究也證實(shí)了以往的AD 相關(guān)研究中發(fā)現(xiàn)的相關(guān)SNP 和腦區(qū),從而驗(yàn)證了該方法在AD 發(fā)病機(jī)制研究中的有效性和潛力。

Lu 等[29]基于貝葉斯廣義低秩回歸模型(Bayesian generalized low-rank regression,GLRR)擴(kuò)展形成貝葉斯縱向低秩回歸模型(Bayesian longitudinal low-rank regression,L2R2),用來(lái)檢測(cè)40個(gè)AD 候選基因的1071 個(gè)SNP 對(duì)93 個(gè)感興趣區(qū)的縱向成像測(cè)量的影響,通過(guò)對(duì)縱向神經(jīng)影像變量的相關(guān)性建模提高了檢測(cè)能力。Zhu 等[30]提出了一種用于全腦和全基因組關(guān)聯(lián)研究的稀疏回歸方法,通過(guò)對(duì)聯(lián)合改進(jìn)框架中的低秩回歸和變量的選擇來(lái)優(yōu)化目標(biāo)函數(shù),提高了在SNP 選擇方面的性能。Soheili-Nezhad 等[31]使用基于獨(dú)立成分分析的預(yù)處理的腦sMRI 數(shù)據(jù),在一組老年受試者的縱向隊(duì)列中,得出了數(shù)據(jù)驅(qū)動(dòng)的AD 和輕度認(rèn)知障礙腦影像特征,即內(nèi)側(cè)顳路(medial temporal circuit,MTC),并對(duì)此進(jìn)行了全基因組搜索,尋找與這種大腦特征相關(guān)的遺傳變異。

每種多變量分析方法都有其特殊的優(yōu)點(diǎn)和局限性,這些方法主要用于單個(gè)數(shù)據(jù)集或者數(shù)據(jù)量相對(duì)較小的研究中,可以在全基因組水平上鑒定出重要的關(guān)聯(lián)。由于大量的輸入變量和參數(shù),導(dǎo)致可能存在過(guò)擬合和模型無(wú)法推廣的情況,因此需要在成像或遺傳域降維,隨著數(shù)據(jù)集的擴(kuò)充,可以逐步克服對(duì)降維方法的需求。

3 傳統(tǒng)機(jī)器學(xué)習(xí)在AD 中的應(yīng)用

目前對(duì)于影像與基因聯(lián)合分析在AD 中的應(yīng)用,尚存在診斷環(huán)境相對(duì)不準(zhǔn)確、腦脊液(cerebrospinal fluid,CSF)等診斷的侵入性以及缺乏具有足夠AD 診斷專業(yè)知識(shí)的臨床醫(yī)生等問(wèn)題,而機(jī)器學(xué)習(xí)可以提供從MRI 等影像數(shù)據(jù)中獲得高精度預(yù)測(cè)的方法,已在疾病預(yù)測(cè)與分類方面得到了應(yīng)用,已有研究引入了機(jī)器學(xué)習(xí)方法,表明其亦可用于AD診斷。

機(jī)器學(xué)習(xí)的能力來(lái)自其從大量數(shù)據(jù)中獲得預(yù)測(cè)模型的能力,這些模型很少或在某些情況下完全不需要數(shù)據(jù)的先驗(yàn)知識(shí)或有關(guān)數(shù)據(jù)的任何假設(shè)。當(dāng)前對(duì)AD 診斷方面的應(yīng)用,大多數(shù)機(jī)器學(xué)習(xí)方法都是基于探索MCI 到AD 轉(zhuǎn)換之間的單變量關(guān)聯(lián),由于不斷努力,已逐步構(gòu)建了基于臨床、MRI、實(shí)驗(yàn)室和遺傳數(shù)據(jù)融合的多變量預(yù)測(cè)模型。常用的傳統(tǒng)機(jī)器學(xué)習(xí)算法包括線性回歸(linear regression,LR)、 邏輯回歸、 支持向量機(jī)( support vector machine,SVM)和樸素貝葉斯分類器[32-34]。

基于傳統(tǒng)機(jī)器學(xué)習(xí)方法的研究如表5 所示。Dukart 等[35]通過(guò)構(gòu)建樸素貝葉斯分類器,研究了多模式成像(MRI、FDG-PET 和淀粉樣PET)、神經(jīng)心理學(xué)和遺傳數(shù)據(jù),將其作為潛在生物標(biāo)記物,識(shí)別其在未來(lái)MCI 患者轉(zhuǎn)為AD 的過(guò)程中所起的作用,并使用上述數(shù)據(jù)模態(tài)的不同組合來(lái)區(qū)分AD 和NC。之后,他們將學(xué)習(xí)到的分類器應(yīng)用于MCI 隊(duì)列,以預(yù)測(cè)AD 轉(zhuǎn)換狀態(tài),發(fā)現(xiàn)使用FDG-PET 數(shù)據(jù)達(dá)到76%的準(zhǔn)確率,使用多模式成像和遺傳數(shù)據(jù)達(dá)到87%的準(zhǔn)確率。

表5 機(jī)器學(xué)習(xí)方法的優(yōu)缺點(diǎn)Tab.5 Advantages and disadvantages of machine learning methods

Zhang 等[36]研究了幾種機(jī)器學(xué)習(xí)方法,通過(guò)結(jié)合多模式成像(MRI 和FDG-PET)、CSF 和SNP 數(shù)據(jù),比較了3 種最先進(jìn)的特征選擇方法,即:1)多核學(xué)習(xí)方法(multiple kernel learning,MKL);2)基于高階圖匹配的特征選擇(high-order graph matching based feature selection,HGM-FS);3)稀疏多模型學(xué)習(xí)(sparse multimodal learning,SMML)。經(jīng)過(guò)實(shí)驗(yàn)研究發(fā)現(xiàn):1)FDG-PET 是預(yù)測(cè)精度最高的模式;2)將SNP 數(shù)據(jù)加入其他模式可以提高預(yù)測(cè)精度;3)HGM-FS 在3 種特征選擇方法中效果最好。

除了這些傳統(tǒng)的機(jī)器學(xué)習(xí)方法之外,最近有研究在此基礎(chǔ)上進(jìn)行了一些創(chuàng)新,如Peng 等[37]提出了一種使用多模態(tài)成像(MRI 和FDG-PET)和SNP數(shù)據(jù)進(jìn)行AD 預(yù)測(cè)的結(jié)構(gòu)化稀疏核學(xué)習(xí)(structured sparse kernel learning,SSKL)模型。該研究用內(nèi)核描述每個(gè)特征,并使用模態(tài)信息對(duì)內(nèi)核進(jìn)行分組,以便于在特征和組級(jí)別進(jìn)行變量選擇,并進(jìn)一步引入了一種創(chuàng)新的結(jié)構(gòu)化稀疏正則化項(xiàng),以實(shí)現(xiàn)每個(gè)模態(tài)內(nèi)的特征稀疏性,實(shí)驗(yàn)結(jié)果表明不同的模態(tài)可以提供互補(bǔ)的信息,并取得了不錯(cuò)的效果。

機(jī)器學(xué)習(xí)方法對(duì)于促進(jìn)醫(yī)學(xué)和基因組學(xué)的進(jìn)步非常重要。然而,傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)通常需要人工進(jìn)行特征工程設(shè)計(jì),需要對(duì)數(shù)據(jù)降維以精準(zhǔn)選擇最佳的特征,從而限制了它們?cè)谛枰獙?shí)時(shí)決策的情況下的實(shí)用性。應(yīng)該看到機(jī)器學(xué)習(xí)的優(yōu)勢(shì)在于:1)在小樣本上能夠?qū)崿F(xiàn)更好的性能;2)計(jì)算成本不高,可以在短時(shí)間內(nèi)嘗試不同的技術(shù);3)算法易于理解,在需要調(diào)參和更改模型設(shè)計(jì)時(shí)也更簡(jiǎn)單??傊?,每種模型都有其優(yōu)缺點(diǎn),在選擇時(shí)應(yīng)考慮自身特征和樣本等因素,以高性能為目標(biāo)設(shè)計(jì)優(yōu)良的模型。未來(lái)構(gòu)建適宜的機(jī)器學(xué)習(xí)模型任重道遠(yuǎn),整合各種模態(tài)的信息用于AD 的早期診斷意義重大。

4 深度學(xué)習(xí)在AD 中的應(yīng)用

深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的不同之處在于,如何從原始數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)表示形式。與作為淺層特征學(xué)習(xí)技術(shù)的ANN 相比,深度學(xué)習(xí)算法使用感知器的多個(gè)深層來(lái)捕獲數(shù)據(jù)的低級(jí)和高級(jí)表示,從而使他們能夠?qū)W習(xí)更豐富的輸入抽象。這消除了對(duì)特征的手動(dòng)工程的需要,并允許深度學(xué)習(xí)模型自然地發(fā)現(xiàn)以前未知的模式,更好地刻畫數(shù)據(jù)的豐富內(nèi)在信息[38-39]。深度學(xué)習(xí)算法可運(yùn)用單模態(tài)到多模態(tài)的影像特征,但大多數(shù)模型都是在單一數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試,多用于疾病的預(yù)測(cè)和分類。目前,利用深度學(xué)習(xí)對(duì)AD 進(jìn)行分類預(yù)測(cè)大多都基于影像特征,關(guān)于影像基因聯(lián)合并用深度學(xué)習(xí)來(lái)預(yù)測(cè)分類的研究較少。

如表6 所示,Ning 等[40]構(gòu)建神經(jīng)網(wǎng)絡(luò)(neural network,NN)框架,并用sMRI 和SNP 數(shù)據(jù)對(duì)NN 進(jìn)行訓(xùn)練,發(fā)現(xiàn)以大腦和SNP 特征為預(yù)測(cè)指標(biāo)的模型AUC 值達(dá)0.992。此外,還發(fā)現(xiàn)了右側(cè)海馬旁回與右側(cè)枕葉回、右側(cè)顳上溝和左側(cè)后扣帶回以及rs10838725 與左側(cè)枕葉回之間的關(guān)系,表明該模型不僅能夠?qū)D 的進(jìn)展進(jìn)行分類和預(yù)測(cè),還能夠識(shí)別重要的AD 風(fēng)險(xiǎn)因素以及之間的相互作用。Pelka[41]等融合社會(huì)人口統(tǒng)計(jì)數(shù)據(jù)、遺傳數(shù)據(jù)(APOEε4)和MRI 等信息作為基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)的循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入,最終分類精度達(dá)到77%的準(zhǔn)確度。隨著深度學(xué)習(xí)的不斷發(fā)展,有研究者使用深度學(xué)習(xí)模型集成了多個(gè)數(shù)據(jù)域,以發(fā)現(xiàn)無(wú)法由單個(gè)數(shù)據(jù)域解釋的集成特征,即使用基于深度學(xué)習(xí)的框架將多模態(tài)神經(jīng)影像數(shù)據(jù)集合并,以區(qū)分NC 與AD,從而顯著改善了性能。Zhou[42]等提出了一種三階段深度特征學(xué)習(xí)和融合框架,將多模態(tài)神經(jīng)影像數(shù)據(jù)(MRI 和PET)和遺傳數(shù)據(jù)(SNP)融合在一起用于AD 的預(yù)測(cè)診斷。在第一階段,獨(dú)立學(xué)習(xí)每種模態(tài)潛在特征;在第二階段,組合來(lái)自不同模態(tài)的潛在特征,并學(xué)習(xí)組合的聯(lián)合潛在特征;在第三階段,使用所有具有完整MRI,PET 和SNP 數(shù)據(jù)的樣本對(duì)模型進(jìn)行訓(xùn)練,該方法主要克服了數(shù)據(jù)異質(zhì)性、高維問(wèn)題和不完整的多模態(tài)數(shù)據(jù)問(wèn)題,可以提高AD 診斷的準(zhǔn)確性,是第一個(gè)將多模態(tài)神經(jīng)成像和遺傳數(shù)據(jù)融合在一起用于AD 診斷的深度學(xué)習(xí)框架。

表6 深度學(xué)習(xí)方法的優(yōu)缺點(diǎn)Tab.6 Advantages and disadvantages of deep learning method

目前,深度學(xué)習(xí)在影像基因特征用于結(jié)果預(yù)測(cè)方面尚未廣泛應(yīng)用,已有的研究大多是單獨(dú)利用影像特征來(lái)進(jìn)行結(jié)果的預(yù)測(cè),部分原因是受影像和基因組學(xué)數(shù)據(jù)集樣本大小的限制。目前深度學(xué)習(xí)已在AD 早期預(yù)測(cè)上有了一些嘗試,但仍存在諸多缺點(diǎn),如需要大量的樣本訓(xùn)練模型;魯棒性不強(qiáng);深度學(xué)習(xí)是一個(gè)“黑盒子”,研究者并不能完全理解網(wǎng)絡(luò)的內(nèi)部等缺點(diǎn),因此相關(guān)應(yīng)用仍舊需要不斷完善。未來(lái),深度學(xué)習(xí)方法是發(fā)展影像基因特征聯(lián)合分析應(yīng)用中一個(gè)有前途的方向。

5 縱向研究

最近縱向研究已逐漸成為影像與基因特征聯(lián)合分析可依賴的新方向,其目標(biāo)是為了研究相對(duì)于時(shí)間AD 的主要變化。Wachinger 等[43]使用縱向成像數(shù)據(jù)和基因數(shù)據(jù)來(lái)探討AD 神經(jīng)解剖的不對(duì)稱性,提示這些基因可能在AD 中發(fā)揮影響的機(jī)制或途徑。Tabarestani 等[44]在一項(xiàng)研究中通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNNs)的兩種不同變體,即LSTM 和門控遞歸單元(gated recurrent unit,GRU)對(duì)1458 例受試者的縱向研究中進(jìn)行了AD 進(jìn)展的預(yù)測(cè)。通過(guò)利用前三個(gè)時(shí)間點(diǎn)的患者歷史記錄,該模型可以在其他三個(gè)后時(shí)間點(diǎn)跟蹤疾病進(jìn)展,其準(zhǔn)確性優(yōu)于僅依賴基線記錄的方法。Du等[45]提出了一種新穎的時(shí)間多任務(wù)稀疏規(guī)范相關(guān)分析(multi-task sparse canonical correlation analysis,T-MTSCCA)框架,可以使用縱向神經(jīng)影像數(shù)據(jù)來(lái)揭示SNP 在一段時(shí)間內(nèi)如何影響腦部定量特征(quantitative traits,QT),結(jié)合縱向成像數(shù)據(jù)和SNP內(nèi)的關(guān)系,T-MTSCCA 可以確定一段時(shí)間內(nèi)漸進(jìn)式成像遺傳模式的軌跡。最后作者驗(yàn)證了ADNI 數(shù)據(jù)庫(kù)中408 名受試者的T-MTSCCA,并獲得了縱向磁共振成像數(shù)據(jù)和遺傳數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,TMTSCCA 的性能優(yōu)于或等同于最新技術(shù)。

當(dāng)前縱向研究的主要挑戰(zhàn)是患者在隨訪中失訪或者退出研究造成的數(shù)據(jù)樣本缺失,但發(fā)展縱向研究方法仍具有重要意義,它可以進(jìn)一步幫助揭示多種遺傳因素在疾病進(jìn)展過(guò)程中影響大腦變化的作用。

6 總結(jié)與展望

影像與基因特征聯(lián)合分析是一個(gè)新的研究熱點(diǎn),是隨著獲取高通量組學(xué)數(shù)據(jù)和多模式成像數(shù)據(jù)的最新發(fā)展而興起的一個(gè)新興研究領(lǐng)域。它主要是對(duì)基因組的數(shù)據(jù)、結(jié)構(gòu)、功能和分子成像數(shù)據(jù)進(jìn)行綜合分析,有可能為正?;蛭蓙y的生物結(jié)構(gòu)、功能的表型特征和遺傳機(jī)制提供重要的見解。在影像與基因這兩個(gè)領(lǐng)域中,統(tǒng)計(jì)研究對(duì)其產(chǎn)生了重大影響,由此也為其統(tǒng)計(jì)分析提供了許多大數(shù)據(jù)挑戰(zhàn)。本文重點(diǎn)回顧了分析這類數(shù)據(jù)的各種方法,其中重點(diǎn)是單變量方法、多變量方法,以及利用傳統(tǒng)機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法對(duì)AD 進(jìn)行分類預(yù)測(cè)。目前,影像與基因特征聯(lián)合分析除了應(yīng)用于AD、PD 等神經(jīng)退行性疾病,在其他疾病中也有相應(yīng)的應(yīng)用。

盡管近年來(lái)在技術(shù)和方法上有了很大的進(jìn)步,但有關(guān)AD 的影像與基因研究仍然困難重重,且設(shè)計(jì)、實(shí)施和分析的成本高昂。當(dāng)前,在實(shí)踐中存在的挑戰(zhàn)概況有:1)樣本的數(shù)量和類型有限;2)這些數(shù)據(jù)具有高維和復(fù)雜的結(jié)構(gòu),正面臨著重大的計(jì)算和生物信息學(xué)挑戰(zhàn);3)遺傳力的缺失通??梢圆糠謿w因于遺傳變異內(nèi)或遺傳與環(huán)境因素之間的相互作用效應(yīng)(或上位效應(yīng)),目前所發(fā)掘的基因只能解釋所研究性狀的部分遺傳力等問(wèn)題。隨著臨床醫(yī)學(xué)中人工智能的深度應(yīng)用,尤其是深度學(xué)習(xí)的興起,相信結(jié)合多個(gè)數(shù)據(jù)源的更復(fù)雜的模型可以克服諸多挑戰(zhàn),在神經(jīng)退行性疾病的臨床應(yīng)用方面帶來(lái)更多突破。

猜你喜歡
遺傳變量特征
非遺傳承
抓住不變量解題
也談分離變量
如何表達(dá)“特征”
還有什么會(huì)遺傳?
還有什么會(huì)遺傳
還有什么會(huì)遺傳?
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
SL(3,3n)和SU(3,3n)的第一Cartan不變量
新蔡县| 班玛县| 福建省| 涡阳县| 南开区| 垣曲县| 宜丰县| 洪泽县| 辛集市| 上栗县| 类乌齐县| 垦利县| 水城县| 昌图县| 岳西县| 上虞市| 淅川县| 漳平市| 溧水县| 额尔古纳市| 宜昌市| 新田县| 清远市| 江门市| 平顶山市| 黄冈市| 鄂托克前旗| 大化| 宝丰县| 凉山| 宣城市| 丹巴县| 汉沽区| 聊城市| 凤庆县| 苍山县| 赤水市| 调兵山市| 哈尔滨市| 樟树市| 抚远县|