王文劍,劉峰,郁磊,任璐,關(guān)博,李陽
(1.山西大學(xué) 計算機與信息技術(shù)學(xué)院,山西 太原 030006;2.山西大學(xué) 計算智能與中文信息處理教育部重點實驗室,山西 太原 030006;3.山西大學(xué) 復(fù)雜系統(tǒng)研究所,山西 太原 030006;4.山西大學(xué) 疾病防控的數(shù)學(xué)技術(shù)與大數(shù)據(jù)分析山西省重點實驗室,山西 太原 030006;5.山西醫(yī)科大學(xué) 第一臨床醫(yī)學(xué)院,山西 太原 030001;6.山西醫(yī)科大學(xué) 第一醫(yī)院神經(jīng)內(nèi)科,山西 太原 030001)
帕金森?。≒arkinson’s disease,PD)又稱為震顫麻痹,是一種影響患者活動能力的中樞神經(jīng)系統(tǒng)[1]慢性疾病。隨著社會老齡化,PD的發(fā)病率及致殘率[2]均呈現(xiàn)增高的趨勢。PD的主要癥狀是以運動障礙[3-4]為特征,如運動遲緩[5]、僵硬[6]、步態(tài)凍結(jié)[7-8]和震顫[9]等。震顫被定義為身體部分不自主的節(jié)律性振動,而手部[10]是患者震顫最明顯的地方,對手部靈活性進行評估也是早期發(fā)現(xiàn)癥狀最簡單可行的途徑。準(zhǔn)確評估PD患者的手部靈活性可以幫助臨床醫(yī)生制定適當(dāng)?shù)闹委熖幏?,以減輕震顫的癥狀。目前對于PD患者的評估主要采用的是統(tǒng)一帕金森病評定量表(Unified Parkinson's Disease Rating Scale,UPDRS)[11-12],醫(yī)生根據(jù)患者完成量表規(guī)定動作的表現(xiàn)給出0-4級的評分,評分越高,癥狀越嚴重[13],根據(jù)評分結(jié)果有針對性地給患者制定康復(fù)計劃。但是基于UPDRS 的評估[14]存在以下局限:(1)醫(yī)生用于診斷患者的交流時間長[15];(2)評分主要依賴患者的主觀描述和醫(yī)生的肉眼觀察,有可能出現(xiàn)因主觀性導(dǎo)致的偏差。
隨著可穿戴設(shè)備的發(fā)展[16],國內(nèi)外研究者將電磁運動跟蹤器、肌電圖[17]、觸摸傳感器等應(yīng)用于PD的輔助診斷,但是這些設(shè)備使用價格昂貴[18],操作不方便[19],使用不普遍。因此,利用使用價格低、微型化、低功耗、操作簡單的可穿戴設(shè)備輔助醫(yī)生進行患者手部靈活性診斷具有重要的現(xiàn)實意義。本文利用自行設(shè)計開發(fā)的帶有三軸加速度計[20]的可穿戴式傳感器采集患者做食指拇指拍打動作的手部數(shù)據(jù),通過數(shù)據(jù)處理和分析建立基于機器學(xué)習(xí)模型的PD患者手部靈活性定量評估模型,以輔助醫(yī)生對患者的手部靈活性進行評分。
本文使用的可穿戴設(shè)備帶有兩個小型傳感器,采樣率為148 Hz,尺寸為27 mm×37 mm×13 mm,通過藍牙將數(shù)據(jù)實時傳送到筆記本電腦上。實驗前,工作人員按照UPDRS量表上所設(shè)計的食指拇指拍打動作將可穿戴設(shè)備固定在受試者拇指和食指的中間指骨上,其中,1號傳感器佩戴于拇指,2號傳感器佩戴于食指,實驗過程如圖1所示。
圖1 采集數(shù)據(jù)的實驗過程Fig.1 Experimental process of collecting data
通過可穿戴設(shè)備采集的信號可能存在噪聲問題,因此本文首先對采集的數(shù)據(jù)進行濾波,然后通過三種機器學(xué)習(xí)模型對濾波后的數(shù)據(jù)進行評分分類。
對于采集的信號
其中i為樣本個數(shù),xi為帶有6維特征的樣本,yi為xi對應(yīng)的標(biāo)簽,采用以下方法進行濾波:
式中X(z)和Y(z)表示濾波器輸入信號X(n)的z變換和輸出信號Y(n)的z變換;bk和ak表示輸入項與輸出項的加權(quán)系數(shù);M和N表示輸入項與輸出項的階數(shù)。根據(jù)逆z變換,可以得到濾波器的時域差分方程為:
假設(shè)濾波后的數(shù)據(jù)的初始速度V0=0,根據(jù)
可得每一時刻傳感器在不同維度上的速度,再根據(jù)
可得每一時刻傳感器在不同維度上的振幅,其中t為采樣的時間。
采集到的信號經(jīng)過濾波之后變?yōu)殡x散數(shù)據(jù),對于樣本的標(biāo)簽yi∈ {0,1,2,3,4}其本質(zhì)上就是多分類問題。目前關(guān)于多分類問題已經(jīng)有很多機器學(xué)習(xí)模型,支持向量機(Support Vector Machine,SVM)是最基礎(chǔ)、應(yīng)用最廣的分類器,K最近鄰分類算法(K-Nearest Neighbor,KNN)適用于多分類問題,決策樹(Decision Tree,DT)理論成熟且易轉(zhuǎn)化為分類規(guī)則,因此本文主要選擇上述三種機器學(xué)習(xí)模型對患者的手部靈活性進行評估。
2.2.1 SVM模型
SVM是定義在特征空間上的間隔最大的線性分類器,其學(xué)習(xí)策略便是間隔最大化。對于線性不可分情況,SVM通過核函數(shù)將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間使其線性可分。其分類思想簡單、分類效果較好,在解決小樣本中表現(xiàn)出許多特有的優(yōu)勢。
2.2.2 KNN模型
KNN算法是機器學(xué)習(xí)中的一個經(jīng)典的距離分類器算法,每個樣本類別的判斷由距離最近的k個樣本投票來決定。KNN算法自身操作簡單,有效,理論成熟,適合于多分類問題。
2.2.3 DT模型
DT模型是一種描述對實例進行分類的樹形結(jié)構(gòu),由結(jié)點和有向邊組成,結(jié)點有兩種類型:內(nèi)部結(jié)點和葉結(jié)點,內(nèi)部結(jié)點表示一個特征或?qū)傩?,葉結(jié)點表示一個類。DT模型計算量相對較小,易于理解和實現(xiàn),容易轉(zhuǎn)化成分類規(guī)則。
實驗環(huán)境配置為 Intel(R)Core(TM)i7-7700 3.60 GHz處理器,windows 10操作系統(tǒng),內(nèi)存為16.0 GB,Python 3.7版本以及PyCharm 2019。
患者被要求抬高他們的肘部,以確保手臂沒有支撐點,然后以盡可能快的速度做食指、拇指拍打動作,采集數(shù)據(jù)的時長為30 s。休息1 min后,另一只手重復(fù)食指拇指拍打動作。因為可穿戴設(shè)備足夠輕,幾乎不會干擾手指的運動。數(shù)據(jù)的標(biāo)簽由兩名專業(yè)的神經(jīng)內(nèi)科醫(yī)生共同評分所得,確保標(biāo)簽的可靠性與一致性。本實驗采集到包含四個等級的帕金森病患者共98條數(shù)據(jù),數(shù)據(jù)的分布如圖2所示(0-3表示從正常到嚴重),其中特別嚴重的患者(評分為4)本實驗并未采集到。隨機選取其中的50條作為訓(xùn)練集數(shù)據(jù),20條作為驗證集數(shù)據(jù),28條作為測試集數(shù)據(jù)。為減少隨機性,本文采用十折交叉驗證結(jié)果的均值作為最終的結(jié)果。
圖2 UPDRS評估的數(shù)據(jù)分布(n=98)Fig.2 Distribution of data for UPDRS assessment(n=98)
本文采用準(zhǔn)確度(Accuracy)、召回率(Recall)、F1值(F1_score)和均方誤差(MSE)四個指標(biāo)對模型進行評估,其定義如下:
其中precision=TP/(TP+FP),TP(True Positive)表示真實值為正的樣本,預(yù)測值也為正的樣本;FP(False Positive)表示真實值為負的樣本,預(yù)測值卻為正的樣本;TN(True Negative)表示真實值為負的樣本,預(yù)測值也為負的樣本;FN(False Negative)表示真實值為正的樣本,預(yù)測值卻為負的樣本。表示第i個樣本的預(yù)測值,yi表示第i個樣本的真實值,n表示樣本個數(shù)。
3.2.1 濾波后的結(jié)果
對PD患者的雙手分別連續(xù)進行30 s采樣,每次采樣包含拇指傳感器的X/Y/Z軸加速度數(shù)據(jù)和食指傳感器的X/Y/Z軸加速度數(shù)據(jù)。其中幾個采樣點如表1所示(拇指傳感器為1號,食指傳感器為2號)。濾波后的數(shù)據(jù)格式如表2所示,可以看出濾波后的數(shù)據(jù)平均分布位于0附近。圖3為其中一位患者的左手傳感器的原始數(shù)據(jù)濾波前后的時域圖。從圖中可以看出濾波前的時域圖特征并不明顯,而在濾波后的時域圖中可以清晰地看到在11 s以及23 s左右(用方框標(biāo)識的位置)各個軸的加速度明顯大于其他時間點的加速度。相對于1s~11s、23 s~30 s的數(shù)據(jù),11 s~23 s的數(shù)據(jù)整體特征比較明顯。
表1 采樣數(shù)據(jù)格式Table 1 The format of the data sampled
表2 濾波后的數(shù)據(jù)格式Table 2 Format of filtered data
圖3 原始數(shù)據(jù)濾波前后的時域圖Fig.3 Time domain diagram before and after original data filtering
3.2.2 模型參數(shù)對模型的影響
利用SVM,KNN和DT構(gòu)建帕金森病患者手部靈活性定量評估模型,模型的性能與參數(shù)的選擇有很大的關(guān)系,然而在機器學(xué)習(xí)中對于模型參數(shù)的選擇并沒有統(tǒng)一的規(guī)則,因此本實驗選取部分參數(shù)進行實驗對比,選取的參數(shù)對于模型性能的影響如表3所示。從表3中可以看出在SVM模型上效果較好的一組參數(shù)為:Kernel=‘linear’,penalty=‘l2’,C=1.0;KNN模型上效果較好的一組參數(shù)為:Weights=‘uniform’,n_neighbors=3;DT模型上效果較好的一組參數(shù)為:Criterion=‘gini’,splitter=‘best’。本文后續(xù)實驗將采用這些參數(shù)。
表3 不同參數(shù)下模型的性能Table 3 The performance of models with different parameters
3.2.3 傳感器不同維度對模型性能的影響
表4-表6分別表示使用拇指和食指加速度傳感器不同維度數(shù)據(jù)所提取的特征作為SVM,KNN以及DT模型的輸入時,模型的性能情況。從表4可以看出對于SVM模型:
表4 兩個傳感器的不同維度對SVM模型的影響Table 4 The influence of different dimensions of two sensors on the SVM model
表5 兩個傳感器的不同維度對KNN模型的影響Table 5 The influence of different dimensions of two sensors on the KNN model
表6 兩個傳感器的不同維度對DT模型的影響Table 6 Influence of different dimensions of two sensors on the DT model
(1)當(dāng)使用拇指處傳感器的數(shù)據(jù)作為輸入時,其X1維度所提取的特征表現(xiàn)最好,準(zhǔn)確率可以達到57.9%,召回率為65.0%,F(xiàn)1值為58.4%,均方誤差為0.579;而(Y1+Z1)維度所提取的特征表現(xiàn)的最差,準(zhǔn)確率為36.8%,召回率為29.2%,F(xiàn)1值為28.0%,均方誤差為1.105。
(2)當(dāng)使用食指處傳感器的數(shù)據(jù)作為輸入時,其(X2+Y2+Z2)維度所提取的特征表現(xiàn)的最好,準(zhǔn)確率可以達到68.4%,召回率為75.0%,F(xiàn)1值為75.0%,均方誤差為0.474;Z2維度提取的特征表現(xiàn)的最差,準(zhǔn)確率為47.4%,召回率為25.0%,F(xiàn)1值為47.2%,均方誤差為0.526。
(3)當(dāng)使用拇指和食指傳感器的所有維度所提取的特征作為輸入時,其準(zhǔn)確率、F1值以及均方誤差均表現(xiàn)的最好,雖然召回率并不是最高,但是其位于第二,綜合四個評價指標(biāo)所得使用拇指和食指所有維度所提取的特征作為SVM模型的輸入時,其性能比只使用單個手指傳感器的性能好,準(zhǔn)確率可以達到73.7%,召回率為65.0%,F(xiàn)1值為69.6%,均方誤差為0.368。
從表5和表6可以看出傳感器不同維度數(shù)據(jù)所提取的特征對于KNN以及DT模型性能的影響與SVM模型的結(jié)論相似。
3.2.4 不同時間段數(shù)據(jù)對模型性能的影響
時長為30 s的樣本數(shù)據(jù)可能存在某些數(shù)據(jù)誤差大從而導(dǎo)致模型的性能較差,因此,本文利用滑動窗口技術(shù)對數(shù)據(jù)分段,比較不同時間段數(shù)據(jù)對模型性能的影響。
設(shè)置滑動窗口的大小為1 s~30 s,圖4表示不同大小的滑動窗口所提取的特征作為模型的輸入時,模型的準(zhǔn)確率情況。從圖中可以看出:
圖4 不同時長的數(shù)據(jù)對模型的影響Fig.4 Effect of different length of data on the models
(1)隨著滑動窗口的大小逐漸增加,SVM模型的準(zhǔn)確率先提高后降低;KNN模型的準(zhǔn)確率變化相對較小,在60%上下波動;而DT模型在滑動窗口的大小為1 s~20 s之間時,其準(zhǔn)確率變化相對較小,在62%上下波動,當(dāng)滑動窗口繼續(xù)增加時,其準(zhǔn)確率呈現(xiàn)下降的趨勢。
(2)表現(xiàn)最好的是SVM模型,在滑動窗口的大小為5 s~25 s時,其準(zhǔn)確率高于其他兩個模型,而相對于DT模型,準(zhǔn)確率變化相對較小。
(3)三種模型在滑動窗口大小為10 s的時候,準(zhǔn)確率都是最高的。因此本實驗將數(shù)據(jù)分為0 s~10 s,10s~20 s,20 s~30 s三段,分別比較三段數(shù)據(jù)在三種模型上的性能情況,如表7所示??梢钥闯鰧?0 s~20 s的數(shù)據(jù)所提取的特征作為模型的輸入時,其在三種模型上都比其他兩段數(shù)據(jù)表現(xiàn)得好,在SVM模型上準(zhǔn)確率達到最高為84.2%,其次是KNN模型,準(zhǔn)確率為79.5%,最后為DT模型,準(zhǔn)確率為78.9%。
表7 不同時間段的數(shù)據(jù)在模型上的評估Table 7 Data from different time periods are evaluated on the models
實驗結(jié)果與實際情況相符合,不難想象,患者做食指拇指拍打動作時,一開始10 s內(nèi)由于受到主觀影響未能反映患者的真實情況,在最后10 s內(nèi)由于肌肉疲勞等因素導(dǎo)致采集的數(shù)據(jù)誤差很大,而中間10 s的數(shù)據(jù)相對來說能夠真實反映患者的情況。
本文提出的基于機器學(xué)習(xí)模型的帕金森病患者手部靈活性定量評估方法通過便攜式的設(shè)備短時間采集數(shù)據(jù)并濾波,然后用SVM、KNN和DT三種機器學(xué)習(xí)模型評估患者的手部靈活性,得到的結(jié)果與醫(yī)生評估一致,減少了評估過程中的主觀性并提高了準(zhǔn)確度。相較于肌電圖、觸摸傳感器等輔助診斷方法,本文所提方法的精度提高了0.2%左右。
本文在小樣本數(shù)據(jù)集上得到較好的結(jié)果,未來需要在大量臨床實驗中驗證。