駱 文,劉育青,勞鈺鈔,陸麗明,劉秀峰
阿爾茨海默病(Alzeimer’s disease,AD)是一種神經(jīng)退行性疾?。?],是臨床最常見的癡呆類型[2],有多個病程階段,包括臨床前阿爾茨海默病、早期輕度認知障礙(early mild cognitive impairment,EMCI)、輕度認知障礙(mild cognitive impairment,MCI)、晚期輕度認知障礙(late mild cognitive impairment,LMCI)、阿爾茨海默病相關(guān)癡呆。全球老齡化日益加劇,預計到2050 年全球65 歲及以上阿爾茨海默病患者的數(shù)量將達到1.52億[1],給社會及患者家屬帶來極大的負擔。輕度認知障礙以輕度的認知功能障礙和日常生活能力減退為特征,未達到癡呆的癥狀診斷標準[2]。但有學者對65 歲以上的輕度認知障礙患者進行隨訪,發(fā)現(xiàn)在2 年后發(fā)展為阿爾茨海默病的輕度認知障礙患者占15%[3],在5 年后發(fā)展為阿爾茨海默病的患者占32%[4]或38%[5]。研究結(jié)果顯示,輕度認知障礙患者迅速轉(zhuǎn)化為阿爾茨海默病的風險很高,若能通過簡單的日常生活能力和日常認知能力初步篩查,發(fā)現(xiàn)可能的、存在潛在風險的輕度認知障礙甚至阿爾茨海默病患者,具有較高的臨床意義。許多研究者也提出使用機器學習方法預測輕度認知障礙的轉(zhuǎn)化。本文利用阿爾茨海默病相關(guān)患者的日常認知自我報告清單,基于BP(back propagation,BP)神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預測分類器并對預測分類器的性能進行評估,研究利用阿爾茨海默病患者認知診斷的分類器判斷患者處于阿爾茲海默癥哪一個階段,為臨床治療提供依據(jù);同時,盡早發(fā)現(xiàn)并診治也可防止產(chǎn)生更多的阿爾茨海默病患者。若該分類器能普遍應(yīng)用于市場還可以讓老年人進行自測,從而能更早發(fā)現(xiàn)阿爾茲海默癥,并防止病情惡化。
輕度認知障礙在醫(yī)學上被認為是癡呆癥的早期癥狀,有些輕度認知障礙患者會轉(zhuǎn)為阿爾茨海默病,但也會有些患者保持穩(wěn)定甚至出現(xiàn)逆轉(zhuǎn)恢復到正常狀態(tài),前者被稱為進展型輕度認知功能障礙(progressive mild cognitive impairment,P-MCI),后者被稱為穩(wěn)定型輕度認知功能障礙(stable mild cognitive impairment,S-MCI)。國內(nèi)外許多研究者也提出使用機器學習方法預測輕度認知障礙的轉(zhuǎn)化,如有學者利用MRI 數(shù)據(jù)的形態(tài)因子方法對49 名輕度認知障礙患者進行預測,其準確率為72.3%[6];有學者提出將多任務(wù)學習方法用于阿爾茨海默病的診斷,在43 名進展型輕度認知功能障礙P-MCI 和48 名S-MCI 患者的數(shù)據(jù)上進行實驗,準確率達到73.9%[7];有學者提出用于輔助阿爾茨海默病診斷的增量學習分類方法,其中阿爾茨海默病和認知正常(normal cognition,NC)的分類準確率為82%,P-MCI 與S-MCI 的分類準確率是71%[8];有學者提出一種新的用于阿爾茨海默病分類的判別性稀疏學習方法,通過關(guān)系正則化項聯(lián)合預測阿爾茨海默病的臨床評分,并對阿爾茨海默病進行分類,其中輕度認知障礙與認知正常的分類準確率為80.32%,P-MCI 和S-MCI 的分類準確率為74.58%[9]?,F(xiàn)有的研究側(cè)重于使用不同的數(shù)據(jù)及采用不同的分類學習方法對病情階段進行分類。與一般研究常用的影像數(shù)據(jù)不同,本文利用阿爾茨海默病相關(guān)患者的日常認知自我報告清單,基于BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預測分類器并評估預測分類器的性能。與其他文獻方法比較,該方法準確率更高,診斷性能更好,具有精度高、泛化能力良好、穩(wěn)定性好、易操作等優(yōu)勢。
阿爾茨海默病神經(jīng)影像學計劃(Alzheimer's Disease Neuroimaging Initiative,ADNI)是綜合臨床認知功能評價、神經(jīng)影像學檢查、腦脊液和血液分子生物學標志檢測等多種方法,以阿爾茨海默病為研究對象,開展的多中心、跨學科縱向研究[10]。從研究計劃開展以來,阿爾茨海默病神經(jīng)影像學計劃的參與者跨越了ADNI-1、ADNI-GO、ADNI-2、ADNI-3 等4 個階段,目前正處于ADNI-3 階段,每個階段都會有新的志愿者加入?yún)⑴c調(diào)查。由于ADNI-1計劃階段未進行參與者日常認知自我報告清單的評估,因此本文只納入了ADNI-GO、ADNI-2、ADNI-3 等3 個階段參與者數(shù)據(jù),訪視期不限,參與者日常認知自我報告清單和當前診斷數(shù)據(jù)齊全即可作為有效數(shù)據(jù),其中ADNI-GO 計劃階段的有效數(shù)據(jù)共有468 例,ADNI-2 計劃階段的有效數(shù)據(jù)共有4 486 例,ADNI-3 計劃階段的有效數(shù)據(jù)共有1 372 例。ADNI-GO 包含認知正常者、早期輕度認知障礙、輕度認知障礙、阿爾茨海默病4 種病程數(shù)據(jù);ADNI-2 包含認知正常者、早期輕度認知障礙、輕度認知障礙、晚期輕度認知障礙、阿爾茨海默病5 種病程數(shù)據(jù);ADNI-3 包含認知正常者、輕度認知障礙、阿爾茨海默病3 種病程數(shù)據(jù)。
參與者日常認知自我報告清單包括記憶、語言、定位、計劃、條理、專注6 類,共40 個條目,各條目的計數(shù)資料編碼賦值結(jié)果見表1。
表1 阿爾茨海默病相關(guān)參與者日常認知自我報告清單的條目賦值
BP 神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡(luò)[11],其基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實際輸出值和期望輸出值的誤差均方差達到最小。如圖1所示,BP 神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層3層構(gòu)成,包含信號的正向傳播和誤差的反向傳播2個過程[12]。正向傳播時,輸入信號通過隱含層作用于輸出節(jié)點,經(jīng)過非線性變換,產(chǎn)生輸出信號,若實際輸出與期望輸出不相符,則轉(zhuǎn)入誤差的反向傳播過程。誤差反傳是將輸出誤差通過隱含層向輸入層逐層反傳,并將誤差分攤給各層所有單元,以從各層獲得的誤差信號作為調(diào)整各單元權(quán)值的依據(jù)。通過調(diào)整輸入節(jié)點與隱含層節(jié)點的鏈接強度和隱含層節(jié)點與輸出節(jié)點的鏈接強度及閾值,使誤差沿梯度方向下降,經(jīng)過反復學習訓練,確定與最小誤差相對應(yīng)的網(wǎng)絡(luò)參數(shù),訓練即告停止[13]。
圖1 BP 神經(jīng)網(wǎng)絡(luò)
假設(shè)1 個BP 神經(jīng)網(wǎng)絡(luò)有R個節(jié)點,每一層的傳遞函數(shù)均選擇Sigmoid 函數(shù)。a1i為隱含層節(jié)點i的輸出;a2k為輸出層節(jié)點K的輸出;w1ij是節(jié)點i與節(jié)點j之間的權(quán)值;w2ki是節(jié)點i跟節(jié)點k之間的權(quán)值;b1i為隱含層節(jié)點i的閾值;b2i為輸出層節(jié)點k的閾值。
BP 神經(jīng)網(wǎng)絡(luò)的主要實現(xiàn)步驟如下:
第一步:輸入樣本的正向傳播,計算隱含層和輸出層各神經(jīng)元的輸出值。
隱含層的第i個神經(jīng)元的輸出值的計算公式為:
輸出層的第k個神經(jīng)元的輸出值的計算公式為:
第二步:輸出誤差的反向傳播。
誤差函數(shù)的計算公式為:
在輸出層,從第i個輸入直至第k個輸出的權(quán)值的計算公式為:
其中,公式(4)中的γ為學習系數(shù)。
隱含層權(quán)值校正后,從第j個輸入到第i個輸出的權(quán)值的計算公式為:
第三步:循環(huán)記憶訓練。為了進一步提高網(wǎng)絡(luò)的精度,在不存在較大輸出誤差的情況下,對輸入到BP 神經(jīng)網(wǎng)絡(luò)的樣本進行循環(huán)記憶訓練。
第四步:檢驗終止。完成循環(huán)記憶訓練后,檢查輸出誤差的大小,達到標準則終止循環(huán)過程,否則持續(xù)循環(huán)。
為了減少模型訓練時間、提高收斂性能,在確定輸入樣本后,需要對數(shù)據(jù)進行標準化處理[14]。本文采用最值進行標準化,公式為:
在3 個計劃階段的樣本集中,分別隨機抽取70%的樣本作為訓練集(其中ADNI-GO 的數(shù)據(jù)為328 條、ADNI-2 的數(shù)據(jù)為3 140 條、ADNI-3 的數(shù)據(jù)為960 條),剩余的30%樣本作為測試集(其中ADNI-GO 的數(shù)據(jù)為140 條、ADNI-2 的數(shù)據(jù)為1 346條、ADNI-3 的數(shù)據(jù)為412 條),可一定程度上評估模型的泛化能力。本文在訓練集上使用網(wǎng)格搜索方法,設(shè)置十折交叉驗證優(yōu)化參數(shù)評估函數(shù),確定最佳模型,將最佳模型應(yīng)用到測試集上評估泛化能力。
本文運用了雙隱含層BP 神經(jīng)網(wǎng)絡(luò),表2 匯總了3 個階段的訓練中雙隱含層不同網(wǎng)絡(luò)節(jié)點數(shù)組合對應(yīng)的模型準確率,通過對比分析,確定模型最高準確率對應(yīng)的最佳節(jié)點數(shù)組合。ADNI-GO 階段訓練模型準確率最高時隱含層節(jié)點數(shù)為(98,126),ADNI-2 階段訓練模型準確率最高時隱含層節(jié)點數(shù)為(224,216),ADNI-GO 階段訓練模型準確率最高時隱含層節(jié)點數(shù)為(170,36)。
表2 不同隱含層網(wǎng)絡(luò)結(jié)構(gòu)的部分訓練結(jié)果
圖2 至圖7 是3 個獲取對應(yīng)的BP 神經(jīng)網(wǎng)絡(luò)模型計算的迭代次數(shù)與訓練準確率、測試準確率之間的關(guān)系,以及迭代次數(shù)與訓練丟失率、測試丟失率之間的關(guān)系。整體上,準確率與迭代次數(shù)呈正比關(guān)系,丟失率與迭代次數(shù)呈反比關(guān)系。與ADNI-GO、ADNI-2 階段相比,ADNI-3 階段的準確率和丟失率在訓練集和測試集之間的差異最大。
圖2 ADNI-GO 階段迭代次數(shù)對準確率的影響
圖3 ADNI-GO 階段迭代次數(shù)對丟失率的影響
圖4 ADNI-2 迭代次數(shù)對準確率的影響
圖5 ADNI-2 階段迭代次數(shù)對丟失率的影響
圖6 ADNI-3 階段迭代次數(shù)對準確率的影響
圖7 ADNI-3 階段迭代次數(shù)對丟失率的影響
ADNI-GO 階段訓練模型的準確率最高,ADNI-2階段的次之,ADNI-3 階段的最低,而ADNI-GO 階段的樣本量最小。因此,模型的準確率并不是由樣本量決定的。ADNI-3 階段只有認知正常者、輕度認知障礙、阿爾茨海默病3 種類型的參與者,并沒有區(qū)分早期輕度認知障礙或晚期輕度認知障礙患者,可能由于輕度認知障礙患者劃分不夠細致,導致ADNI-3 階段訓練模型的預測性能較差。
表2 的對比分析結(jié)果顯示,模型的準確率并不是嚴格隨著隱含層節(jié)點數(shù)的增加而提高。理論上來說,隱含層的節(jié)點數(shù)越多,對信息重構(gòu)的損失越??;而節(jié)點數(shù)過少,在訓練過程中可能丟失重要的特征信息。但是隱含層節(jié)點數(shù)過多,會導致模型的過擬合問題。BP 神經(jīng)網(wǎng)絡(luò)的學習能力會隨著隱含層節(jié)點數(shù)的增加而增加,但學習能力變強一定程度上會導致模型將數(shù)據(jù)中的噪聲一并訓練,噪聲可能將某些有效信息湮沒,反而降低測試準確率。因此,要綜合考量訓練模型和測試模型的性能確定BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)。
圖2 至圖7 顯示,模型準確率會隨著迭代次數(shù)的增加而提升,但到了一定迭代次數(shù)之后模型準確率將停止提升。理論上認為迭代次數(shù)越多學習的程度更高,但迭代次數(shù)過多會消耗大量的時間和存儲空間,反而降低模型性能。相比于ADNI-GO 和ADNI-2 階段,ADNI-3 階段的訓練集和測試集的準確率和丟失率的差異都較大,即訓練準確率最高,而測試準確率最低,說明該模型出現(xiàn)了過擬合及泛化能力低下的問題。ADNI-3 階段的輕度認知障礙患者并沒有區(qū)分早期輕度認知障礙或晚期輕度認知障礙患者,由于早期和晚期癥狀的延續(xù)性和存在相似性導致劃分不細致,因此可能分類不靈敏。阿爾茨海默病相關(guān)患者的病程劃分越細致,越能在早期準確地被識別出來。
本文利用阿爾茨海默病相關(guān)患者的日常認知自我報告清單,基于BP 神經(jīng)網(wǎng)絡(luò)模型構(gòu)建阿爾茨海默病不同病程的預測分類器。實驗結(jié)果顯示,ADNI-GO和ADNI-2計劃階段的訓練模型均能達到90%的分類準確率,且具有精度高、泛化能力良好、穩(wěn)定性好、易操作等優(yōu)勢。因此,利用患者當前日常認知自我報告清單可以準確預測分類患者的病程階段,有利于患者盡快進一步檢查或治療,具有一定的臨床價值。