呂玉婷,姚旭峰,3*,卜溪溪,徐 松,黃 鋼
(1.上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海 200082;2.上海健康醫(yī)學(xué)院醫(yī)學(xué)影像學(xué)院,上海 201318;3.上海市分子影像學(xué)重點實驗室,上海健康醫(yī)學(xué)院,上海 201318)
阿爾茨海默病(Alzheimer disease, AD)是一種病因未明的進(jìn)行性神經(jīng)系統(tǒng)退行性疾病,也是最常見的癡呆類型,占全部癡呆的50%~70%,病因尚未明確,且無可有效治愈藥物或改變其病理進(jìn)程的手段[1]。為診斷及預(yù)測AD,有學(xué)者[2]基于影像組學(xué)方法,將影像學(xué)特征與臨床信息等相結(jié)合,并建立模型進(jìn)行個性化評估;分子生物學(xué)研究[3]也證實多個易感基因與AD密切相關(guān)。本文從AD相關(guān)影像學(xué)表型、基因組學(xué)特征及影像-基因關(guān)聯(lián)各方面對影像基因組學(xué)AD研究現(xiàn)狀及進(jìn)展進(jìn)行綜述。
影像基因組學(xué)對影像學(xué)表型與基因組數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,剖析其間的關(guān)聯(lián)性,以影像學(xué)表型作為遺傳變異和診斷之間的中間表型來探究AD的發(fā)病機(jī)制,兼具可早期預(yù)測疾病及多模態(tài)、高通量、非入侵式獲取病變表型特征的雙重優(yōu)勢。將多模態(tài)腦影像學(xué)表型與基因數(shù)據(jù)結(jié)合分析,通過影像學(xué)表型檢測遺傳變異或評估已確定的遺傳風(fēng)險對大腦的影響,比單純基因研究更為有效。
2.1 相關(guān)影像學(xué)表型的研究現(xiàn)狀 目前AD常用影像學(xué)檢查方法有MRI和PET。MRI主要包括結(jié)構(gòu)MRI(structural MRI, sMRI)、功能MRI(functional MRI, fMRI)和彌散張量成像(diffusion tensor imaging, DTI)。sMRI能直接反映腦區(qū)關(guān)鍵部位的形態(tài)學(xué)改變,清楚顯示大腦灰白質(zhì)體積萎縮程度;fMRI特指血氧水平依賴(blood oxygenation level dependent, BOLD)-fMRI,通過檢驗?zāi)X細(xì)胞在血液流動時的磁場變化完成腦部功能成像;DTI通過檢測水分子擴(kuò)散運動的各向異性來顯示腦白質(zhì)纖維束的走向和完整性,是目前唯一可精確顯示活體腦白質(zhì)纖維束的成像方法。PET則依據(jù)標(biāo)記物分為18F標(biāo)記的氟代脫氧葡萄糖(18F-fluorodeoxyglucose,18F-FDG)PET和淀粉樣PET,分別用于評估大腦糖代謝和淀粉樣蛋白變化,顯示早期AD患者腦部代謝。見表1。
國內(nèi)外影像基因組學(xué)AD研究所選取的影像學(xué)表型特征大多來自MRI。研究[4]表明,海馬體積萎縮是鑒別AD臨床前階段的關(guān)鍵影像學(xué)表型。海馬區(qū)及內(nèi)嗅皮層等結(jié)構(gòu)體積明顯變小的遺傳性強(qiáng),故海馬體積和皮層厚度是較為適用的AD影像學(xué)特征參數(shù),LORENZI等[5]、CACCIAGLIA等[6]及LI等[7]對影像學(xué)表型與基因進(jìn)行關(guān)聯(lián)分析時,所選取大腦皮層厚度、灰質(zhì)體積和右側(cè)海馬體積參數(shù)均來自sMRI。由于常規(guī)腦影像學(xué)特征難以表征AD全部特點,根據(jù)既往研究結(jié)果,可結(jié)合高維影像組學(xué)特征對AD影像學(xué)特征與易感基因進(jìn)行關(guān)聯(lián)分析,如SCELSI等[8]對MRI所示雙側(cè)海馬體積和PET所見皮層蛋白樣沉積負(fù)荷進(jìn)行其與基因的關(guān)聯(lián)研究,ZHANG等[9]自sMRI和fMRI中提取海馬體積和部分腦功能特性進(jìn)行相關(guān)性分析。隨著腦網(wǎng)絡(luò)研究的進(jìn)展,有學(xué)者[10]開始利用DTI構(gòu)建大腦結(jié)構(gòu)網(wǎng)絡(luò),并對網(wǎng)絡(luò)特征進(jìn)行腦影像學(xué)表型相關(guān)研究。
2.2 基因組學(xué)方法研究現(xiàn)狀 AD基因研究方法現(xiàn)已從經(jīng)典的基于連接和候選基因的關(guān)聯(lián)研究發(fā)展到全基因組關(guān)聯(lián)研究(genome-wide association study, GWAS)和下一代測序(next generation sequencing, NGS)。鑒定新易感基因有助于深入理解AD發(fā)病機(jī)制。GWAS是目前最常用的AD影像基因組學(xué)基因分析方法,以單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)為標(biāo)記單位,在全基因組水平進(jìn)行比對分析,挖掘與疾病表型存在強(qiáng)相關(guān)性基因的變異位點,可鑒定與AD表型或病理變化具有強(qiáng)相關(guān)的特定SNP組合,于基因?qū)用娣从矨D的病理特征。DERRK等[11]以GWAS分析來自50個群組的30 717個個體的皮層體積和顱內(nèi)體積,確定了影響核殼和尾狀核體積的5個新的遺傳變異,并證實3個新位點對海馬體積和顱內(nèi)體積存在影響。NHO等[12]通過整合遺傳學(xué)信息與影像學(xué)表型,利用全基因組測序?qū)ESN1基因與負(fù)載定量生物標(biāo)記物進(jìn)行關(guān)聯(lián)分析,證明PESN1變異與關(guān)鍵腦區(qū)萎縮顯著相關(guān)。此外,基因分析方法還包括主成分分析(principal component analysis, PCA)、多因子降維(multifactor dimensionality reduction, MDR)和獨立成分相關(guān)算法(independent component correlation algorithm, ICA)[13],但均未考慮之前的研究結(jié)果,且需對大量數(shù)據(jù)集進(jìn)行多重校正,造成很多微小風(fēng)險位點被遺漏?;虮倔w (gene ontology, GO)、京都基因和基因組數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析可解決上述問題,故常用于分析具有各異性表達(dá)基因的通路。ZENG等[14]分析AD相關(guān)基因通路富集分析和蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction, PPI),確定了6個潛在影響微小核糖核酸(micro RNA, miRNA)結(jié)合的先導(dǎo)SNP(rs10119、rs1048699、rs148763909、rs610932、rs6857和rs714948)和2個代理SNP(rs12539172和rs2847655),表明SNP通過影響miRNA的結(jié)合而作用于AD。朱士勝等[15]利用從數(shù)據(jù)庫中得到的差異表達(dá)基因(differentially expressed genes, DEG)進(jìn)行GO富集分析和KEGG通路富集分析,篩選出在AD發(fā)展過程中起重要作用的關(guān)鍵基因??紤]到此兩種方法可能存在富集假陽性和一定主觀性,實際分析時可加入加權(quán)基因共表達(dá)網(wǎng)絡(luò)構(gòu)建(weighted gene co-expression network analysis, WGCNA)[16],以鑒定共表達(dá)的基因模塊,分析基因模塊與樣本特征間的相關(guān)性,利于挖掘潛在標(biāo)記基因,因其可信度高于GO和KEGG富集分析而應(yīng)用廣泛。
表1 不同成像方式下影像學(xué)表型提取及相關(guān)變化
2.3 影像-基因關(guān)聯(lián)分析方法研究進(jìn)展 關(guān)聯(lián)分析方法是目前用影像基因組學(xué)AD研究重點。早期單變量研究需要對候選基因變異和候選腦影像學(xué)特征進(jìn)行科學(xué)假設(shè),且必須同時檢驗大量假設(shè),并對結(jié)果加以多重校正,過程十分繁復(fù),故應(yīng)用較少。STEIN等[17]首先以多變量關(guān)聯(lián)分析觀察受試者整個大腦31 622個體素中的448 293個SNP,并以集群節(jié)點來執(zhí)行計算;HIBAR等[18]也在基因水平進(jìn)行類似分析;二者均應(yīng)用PCA將多維遺傳數(shù)據(jù)歸一化,得到特征SNP,最后回歸到單變量線性分析。WANG等[19]提出群稀疏多任務(wù)回歸模型,對多模態(tài)的影像學(xué)表型與候選基因進(jìn)行關(guān)聯(lián)分析,不僅毋須將多變量影像數(shù)據(jù)歸一化,免于存在大量獨立性假設(shè)的問題,還具有更強(qiáng)的抗噪聲能力。ZHU等[20]開發(fā)的貝葉斯簡化秩模型利用貝葉斯框架中的函數(shù)來最大化影像學(xué)表型與基因數(shù)據(jù)的關(guān)聯(lián),既能降低單變量回歸中獨立性假設(shè)的數(shù)量,又具有更高的檢測遺傳變異能力。GE等[21]在此基礎(chǔ)上提出一種基于核機(jī)的多維變量集交互效應(yīng)檢測方法,可同時檢測多個遺傳變異之間的相互影響。STINGO等[22]利用分層混合模型對整個大腦功能連接網(wǎng)絡(luò)和全基因進(jìn)行關(guān)聯(lián)分析;HUANG等[23]開發(fā)的快速全基因組關(guān)聯(lián)分析(fast genome-wide association study, FGWAS)框架在GWAS基礎(chǔ)上結(jié)合大腦功能特性,顯著提高了對重要基因變異的檢測能力。目前大量多元數(shù)據(jù)關(guān)聯(lián)研究均對已有統(tǒng)計學(xué)分析模型進(jìn)行擴(kuò)展與改進(jìn),以簡化結(jié)果的多重驗證和解釋。有學(xué)者[24]建立新的快速多任務(wù)稀疏正則相關(guān)分析,在相關(guān)系數(shù)和正則權(quán)值模式方面均具有更好的性能,且運行速度快,易于實現(xiàn)。茹峰等[25]提出一種新的基于典型相關(guān)分析(canonical correlation analysis, CCA)的高階統(tǒng)計量結(jié)構(gòu)化稀疏算法,以探索大量基因與腦影像學(xué)數(shù)據(jù)之間的關(guān)聯(lián)性,便于提取兩類數(shù)據(jù)中高度相關(guān)的特征,并保持其相互獨立。
近來AD研究多轉(zhuǎn)向縱向影像基因組學(xué),以觀察大腦結(jié)構(gòu)動態(tài)變化與基因之間的相關(guān)性,但總體而言仍處于起步階段(表2)。SZEFER等[26]分析75 845個SNP與56個大腦區(qū)域結(jié)構(gòu)MRI變化率的關(guān)系,以引導(dǎo)程序增強(qiáng)的稀疏正則相關(guān)分析驗證了1 649個SNP對促進(jìn)AD結(jié)構(gòu)缺失具有較大可能性,并首次用逆概率加權(quán)解釋了ADNI研究中存在的偏置采樣設(shè)計和低關(guān)聯(lián)信號的高維數(shù)據(jù)。LU等[27]將ZHU等[20]的貝葉斯低秩模型擴(kuò)展為縱向設(shè)置,將時變影像學(xué)數(shù)據(jù)直接與遺傳標(biāo)記聯(lián)系起來進(jìn)行剖析。WANG 等[28]將機(jī)器學(xué)習(xí)方法擴(kuò)展到縱向影像基因組學(xué)研究中,通過輸入3 123個SNP位點,基于體素分析法(voxel-based morphometry, VBM)和Freesurfer兩種成像標(biāo)記物自動檢測其間的關(guān)系,發(fā)現(xiàn)APOE-rs429358與大腦皮層體積、MS4A4E- rs670139與腦白質(zhì)體積、MS4A6A- rs66798與灰質(zhì)密度之間存在相關(guān)性,有望為未來將人工智能融入縱向影像基因組學(xué)研究提供參考依據(jù)。
表2 不同影像-基因關(guān)聯(lián)分析方法的優(yōu)點
影像基因組學(xué)目前已大量用于AD研究,通過對多維腦部特征和特異性風(fēng)險基因進(jìn)行多方位有效信息的提取和關(guān)聯(lián)分析而實現(xiàn)AD診斷、分型、預(yù)測及預(yù)防,但用于影像學(xué)表型及基因分析方面仍存在限制。未來將聚焦于擴(kuò)充影像學(xué)表型和選取易感基因,改進(jìn)關(guān)聯(lián)分析模型,提高分析的準(zhǔn)確性;還可考慮在影像基因組學(xué)研究應(yīng)用深度學(xué)習(xí)相關(guān)算法,通過融合影像學(xué)表型與基因而進(jìn)一步探究其相關(guān)性。