国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于按鍵動作識別的帕金森病早期預測方法

2023-08-31 08:44:48許昊童基均齊鵬嘉周思薇
浙江理工大學學報 2023年1期
關鍵詞:分塊按鍵帕金森病

許昊 童基均 齊鵬嘉 周思薇

摘 要: 針對目前帕金森病早期預測方法普遍存在誤診率高、步驟繁多等問題,設計了基于AdaBoost算法的按鍵動作識別方法,實現(xiàn)對帕金森病早期的精準預測。該方法首先刪除數據集的缺失值,并選取按鍵次數過萬的數據;然后針對不同按鍵手,根據按鍵的時間間隔對預處理后的結果進行分類,以平均值、標準差、方差、偏度和峰度5個指標為特征,對每一位病人的數據進行分塊,擴充數據集,并加入高斯噪聲平衡數據集;最后應用AdaBoost算法進行分類預測。在公開的數據集上進行實驗,結果表明:在按鍵數據集分類上,該方法的準確率、靈敏度和特異性分別為95%、98%和97%。該方法具有較高的準確率、靈敏度和特異性,為帕金森病早期的精準預測提供了一種有效的解決方案。

關鍵詞: AdaBoost算法;帕金森??;預測;分塊;非平衡數據;按鍵

中圖分類號: TP391.4

文獻標志碼: A

文章編號: 1673-3851 (2023) 01-0083-06

引文格式:許昊,童基均,齊鵬嘉,等. 基于按鍵動作識別的帕金森病早期預測方法[J]. 浙江理工大學學報(自然科學),2023,49(1):83-88.

Reference Format: XU Hao, TONG Jijun, QI Pengjia, et al. Early prediction method of Parkinson′s disease based on keystroke recognition[J]. Journal of Zhejiang Sci-Tech University,2023,49(1):83-88.

Early prediction method of Parkinson′s disease based on keystroke recognition

XU Hao1, TONG Jijun1, QI Pengjia1, ZHOU Siwei2

(1.School of Information Science and Technology, Zhejiang Sci-Tech University, Hangzhou 310018, China;

2.Zhejiang Rehabilitation Medical Center, Hangzhou 310014, China)

Abstract:? Aiming at the problems of high misdiagnosis rate and numerous steps in the early prediction method of Parkinson′s disease, a keystroke recognition method based on AdaBoost algorithm was designed to achieve accurate prediction of early Parkinson′s disease. By adopting this method, the missing values of the dataset were deleted, and the data with more than 10 000 keystrokes were selected. Then, for different keystroke hands, the results after pre-treatment were classified according to the time interval of the keys, the five indicators of calculated mean, standard deviation, variance, skewness and kurtosis were used as new features, and the data of each patient was blocked, so as to expand the dataset and Gaussian noise was added to balance the dataset. Finally, the predictive classification was carried out by AdaBoost algorithm to achieve early prediction of Parkinson′s disease. Experiments were conducted on the published dataset, and the experimental results showed that the accuracy, sensitivity and specificity of the algorithm were 95%, 98% and 97%, respectively, in the classification of the key dataset. Compared with other algorithms, this method has high accuracy, sensitivity and specificity, providing an effective solution for early prediction of Parkinson′s disease.

Key words:? AdaBoost algorithm; Parkinson′s disease; prediction; block; unbalanced data; keystroke

0 引 言

帕金森?。≒arkinson′s disease, PD)是一種老年神經系統(tǒng)退行性疾病,具有不可逆、難發(fā)現(xiàn)和嚴重影響生活質量等特點,該病自發(fā)現(xiàn)以來就廣受人們關注,已成為眾多學者研究的焦點。在我國年齡超過55歲的人群中,帕金森病患者約有170萬人[1]。然而,目前帕金森病的早期診斷仍面臨著巨大的挑戰(zhàn),其主要原因在于:一方面,帕金森病的發(fā)病機制復雜,涉及α-突觸核蛋白積聚、神經炎癥、氧化應激、線粒體功能障礙、神經黑色素過度累積等多個因素[2];另一方面,由于早期帕金森病隱蔽性較高,患者較難發(fā)現(xiàn)患病的真實情況。因此,開發(fā)一種精確、客觀的早期預測手段,對診斷和治療帕金森病具有重要的意義。

目前,帕金森病的早期預測主要有兩種方式,即專業(yè)醫(yī)學儀器預測和結合信息技術預測。通過專業(yè)醫(yī)學儀器進行預測是現(xiàn)階段臨床預測的主要方式。例如,楊麗娟等[3]使用實時經顱彩色多普勒超聲(Transcranial sonography,TCS)觀察黑質形態(tài)、回聲,通過判斷黑質功能狀態(tài)檢測帕金森病,其優(yōu)點在于操作方便、價格低廉,但也存在假陽性率高的問題。蔡增林等[4]給患者注射示蹤劑18F-氟脫氧葡萄糖(18F-FDG),并通過正電子發(fā)射計算機斷層成像儀進行正電子發(fā)射計算機腦斷層顯像,然后采用目測法對腦部各部位的葡萄糖代謝進行判斷,但由于輻射以及部分患者對顯像劑過敏等原因,該方式難以成為帕金森病早期檢測的主流方式。此外,還有很多學者通過結合信息技術對早期帕金森病患者進行預測。例如,Prashanth等[5]通過問卷方式得到由國際帕金森和運動障礙病協(xié)會發(fā)起修訂的統(tǒng)一帕金森病評定量表(Movement Disorder Society-Unified Parkinson′s Disease Rating Scale, MDS-UPDRS),并建立了邏輯回歸、隨機森林、增強樹和支持向量機模型進行帕金森病早期預測,但由于部分早期患者的癥狀并不明顯,導致問卷結果無法反映真實情況,因此,該方法不能作為早期預測的主要手段。Cho等[6]通過識別帕金森病患者特定步態(tài)模式,采用主成分分析與線性判別分析對帕金森病進行預測,但因數據集過小,結果的可信度較低。綜上可知,現(xiàn)有研究雖然取得了一定的成果,但是仍然存在誤診率高、步驟繁多等問題。

醫(yī)學研究表明,帕金森病患者的主要癥狀有靜止震顫、運動遲緩、姿勢不穩(wěn)、肌肉強直[7]以及其他非運動性癥狀。其中,70%~75%的患者存在靜止性震顫,這是最常見且最易識別的癥狀;震顫以4~6 Hz的頻率發(fā)生,并且在手等肢體的遠端最為明顯[7];運動遲緩通常表現(xiàn)為執(zhí)行日常生活動作時動作遲緩,其中需要精細運動控制的任務尤為明顯[8],對運動遲緩的評估通常包括讓患者進行快速、重復、交替的手部運動[7](如手指敲擊、手握、手內旋等)。此外,帕金森病的單側性非常明顯,可以作為臨床參數對該疾病與其他神經退行性帕金森病綜合征進行區(qū)分[9]。以上癥狀都可以通過人機交互的方式進行預測。例如,Noyce等[10]的研究表明,帕金森病患者和對照組在30 s內的按鍵次數、每個按鍵的平均停留時間、按鍵之間移動時間等指標上存在著顯著差異。Giancardo等[11]將受試者按下和釋放按鍵的時間間隔轉換為nQi指數(neuroQWERTY index),再利用Bagging算法進行預測,但由于作者只選擇了單一特征(按鍵保持時間)進行預測,所以預測結果并不理想。Madanchi等[12]使用多重分形去趨勢分析(Multifractal detrended fluctuation analyses,MFDFA)分析了通過nQi采集到的受試者按鍵數據,并充分提取了早期帕金森病患者病情隨時間逐漸加重的趨勢特征。Iakovakis等[13]采用卷積神經網絡通過觸摸屏打字對早期帕金森病進行了預測與分析,但因采集到的按鍵次數過少,所以準確率較低。Adams[14]集合了8種不同機器學習模型,選用了更多的特征預測帕金森病,并對所有的預測結果進行了平均化處理,得到了95%的準確率。

以上研究結果表明,通過受試者的按鍵操作對帕金森病進行預測是可行的,但是若只選擇按鍵中的某一特征進行預測,最終得到的準確率較低。因此,本研究提出了一種基于按鍵動作識別的帕金森病早期預測方法,選擇按鍵手、按鍵保持時間和相隔按鍵之間的停頓時間為特征,對數據進行分塊以擴充數據集,考慮到分塊后數據集可能存在不平衡等問題,還引入了高斯噪聲以進一步提升預測準確率,最后通過AdaBoost算法進行預測分類,以實現(xiàn)對帕金森病患者的早期預測。該方法由于選取了更多的按鍵特征,并對數據集進行了平衡化的處理,因此最終的預測結果將會有所提升。

1 數據采集與處理

1.1 數據集

本研究采用的實驗數據是Goldberger等[15]在2017年發(fā)布的公開數據集。該數據集由來自美國、加拿大、英國和澳大利亞的200多名參與者提供,收集到的每個數據文件都包括參與者使用各種Windows應用程序(如電子郵件、Web搜索等)時按鍵操作的計時信息,按鍵采集軟件“Tappy”提供按鍵按下和釋放的時間戳的計時精度,可在幾毫秒之內完成。數據文件包含兩個部分:一部分是Archived users,包括出生年份、性別、是否患有帕金森病、是否有震顫、是否有服用抑制帕金森病的藥物等;另一部分是Archived data,包含日期、按鍵手(Hand)、按鍵保持時間(按下和釋放當前鍵之間的時間間隔,Hold Time)、按鍵方向(按下上一個鍵和按當前鍵的手,Direction)、延遲時間(按下上一個鍵和按當前鍵之間的時間間隔,Latency Time)、飛行時間(釋放上一個鍵和按下當前鍵的時間間隔,F(xiàn)light Time)等。

1.2 數據清洗

本研究只選取了數據集中具有完整登記信息且進行按鍵輸入超過一萬次的215名受試者,其中164人患病,51人未患病,受試者具體年齡分布與患? 病情況如圖1所示。另外,由于Archived users中所顯示數據集的文件名為User+_+UserKey格式,Archived data中所顯示數據集的文件名為UserKey+_+Date格式,所以本研究將兩個數據集通過UserKey進行合并,另外添加了標簽Label:Parkinsons欄中True的Label值為1,反之則為0。合并后的數據集已去除Parkinsons欄中標記為None的數據,如表1所示。

2 研究方法

2.1 特征提取

在對受試者數據進行分塊時,選擇Hand列中標記為L的一類數據作為特征矩陣的行,并對Hand列中標記為R和S的數據用各自的平均值補齊。Hand列中L、R、S分別表示在左手按鍵區(qū)域用左手按鍵、在右手按鍵區(qū)域用右手按鍵和用左手/右手按下空格鍵。Direction列中LL表示第一次按鍵是在左手按鍵區(qū)域用左手按鍵,第二次按鍵也是在左手按鍵區(qū)域用左手按鍵;LR表示第一次按鍵是在左手按鍵區(qū)域用左手按鍵,第二次按鍵在右手按鍵區(qū)域用右手按鍵;LS表示第一次按鍵是在左手按鍵區(qū)域用左手按鍵,第二次按鍵是用左手/右手按下空格鍵;RL、RR、RS、SL、SR、SS的含義與之類似。左手按鍵區(qū)域、右手按鍵區(qū)域和空格鍵如圖2所示[14]。

本研究對數據的特征提取主要包括以下步驟:首先,對于所得到的每個數據列,計算平均值、標準差、方差、偏度和峰度5個指標,以此作為區(qū)分患病和未患病的特征。其中:平均值代表受試者長期以來按鍵的一般情況;方差和標準差在平均值的基礎上進一步反映受試者長期以來按鍵的穩(wěn)定程度,能夠避免異常值對結果的影響;偏度能反映受試者按鍵異常值偏離的方向;峰度能反映受試者長期的按鍵離均值的分布情況,峰度越大,則按鍵數據在靠近均值部分的分布越多。經過組合后共得到12×3×5=180個特征,濾掉其中方差小于5的特征,最終得到131個特征。然后,對所得數據每一維度的特征進行標準差標準化,以避免數據不收斂,且規(guī)避在最終分類時大數據對小數據的影響。最后,將每一個受試者的數據進行分塊,由于每個受試者均有較多數據,這樣對于當前受試者最后一塊數據可能出現(xiàn)未滿Fflap情況的影響也較低。

2.2 機器學習模型

AdaBoost算法[16]能夠將預測精度低的弱學習器增強為預測精度高的強學習器。本研究采用AdaBoost算法對帕金森病進行預測,其中采用的弱 分類器為最大迭代深度為15的決策樹算法,在每次迭代后會改變權值,最終將弱分類器進行整合成為一個強分類器。具體實現(xiàn)步驟如下:

a)初始化訓練樣本權重Wj:

W1=(w11,w12,…,w1n),w1i=1n,i=1,2,…,n(1)

b)對j=1,2,…,n,使用權重Wj訓練得到一個基學習器Qj(x);

c)計算訓練數據上的誤差Ej(x):

Ej(x)=∑ni=1P(Qj(xi)≠yi)(2)

d)計算第j輪訓練的系數εj:

εj=12ln1-Ej(x)Ej(x)(3)

e)得到第j+1輪的訓練結果:

Qj+1(x)=Qj(x)Zj×exp(-εj),Qj(xi)=yi;

exp(εj),Qj(xi)≠yi(4)

其中:Zj是規(guī)范化因子。

f)得到最終分類器Q(x):

Q(x)=sign∑Jj=1εjQj(x)(5)

2.3 評價指標

最終的預測結果通過4個指標進行評價,即準確率(Accuracy)、靈敏度(Sensitivity)、特異性(Specificity)和AUC。其中,準確率通過十折交叉驗證法得到,十折交叉驗證法是測試算法準確率的常用方法,主要是將數據集分成10份,輪流將其中的9份作為訓練數據,1份作為測試數據進行試驗。靈敏度SE的計算公式為:

SE=SETSET+SEF(6)

其中:SET表示被正確診斷為患病的病人,SEF表示被錯誤診斷為健康的病人。特異性SP的計算公式為:

SP=SPTSPT+SPF(7)

其中:SPT表示被正確診斷為健康的健康人,SPF表示被錯誤診斷為患病的健康人。ROC曲線被廣泛用作度量一個二值分類器的優(yōu)劣,橫坐標為假陽性率,縱坐標為真陽性率。AUC則表示ROC曲線下面的面積,其取值范圍在0.5和1之間,越接近1,則代表分類器性能越好。

3 結果分析與討論

3.1 實驗結果

預處理后的數據按照0.8∶0.2的比例分成訓練集和數據集。為了驗證不同F(xiàn)flap值對結果是否存在影響,故讓Fflap的值在(50,1000)之間以10為間隔進行變化,得到的結果如圖3所示,其中:橫坐標代表不同的分塊數。

此外,為了避免因數據集中出現(xiàn)非平衡數據(不得病的少于得病的)而導致的過擬合現(xiàn)象,原有數據處理基礎上,對未患病病人數據(小樣本)進行數據增強處理,根據圖4選取準確率、靈敏度、特異性和AUC平均值最高的結果,即Fflap=670進行數據平衡化處理,對其加入均值為0、方差不同的高斯噪聲,其得到的各指標值的結果如圖5所示,其中橫坐標代表方差。由圖5可知,高斯噪聲的方差對準確率、靈敏度、特異性和AUC的影響并不大;但由未加入高斯噪聲前的混淆矩陣(表2)和加入高斯噪聲以后的混淆矩陣(表3)相比可知,后者的準確率、靈敏度和特異性指標有明顯的提升。

3.2 對比分析

為了驗證本研究所提出方法的有效性,選取了準確率、靈敏度和特異性3種指標進行比較實驗,結果如表4所示。該結果表明:本研究提出的基于按鍵動作識別的帕金森病早期預測方法,得到的結果相比專業(yè)醫(yī)生的臨床診斷有了明顯提升;相比于新型的TCS技術,該方法在靈敏度和特異性方面均有所改善。與Iakovakis等[13]的研究相比,本研究所選取的受試者更多,因此在靈敏度和特異性等指標上都有明顯提升;與Adams[14]采用的多模型集合方法相比,本研究雖然只使用了一種模型,但通過加入高斯噪聲的方式平衡數據集,使得最終預測結果的靈敏度得到提升。

4 結 論

本研究提出了一種基于按鍵動作識別的帕金森病早期預測方法。該方法以按鍵保持時間、按鍵手、相隔按鍵之間的停頓時間為特征,通過分塊的方式擴充了數據集,并通過加高斯噪聲的方式平衡了數據集,最后使用AdaBoost算法訓練得到預測結果。與傳統(tǒng)MDS-UPDRS評分表方式相比,本研究采用的方法避免了主觀因素的影響,且準確率更高。該方法引入了計算機技術,具有較高的實際應用價值。

參考文獻:

[1]Zhang Z X, Roman G C, Hong Z, et al. Parkinson′s disease in China: Prevalence in Beijing, Xian, and Shanghai[J]. The Lancet, 2005, 365(9459): 595-597.

[2]張森, 趙曉悅, 梁宇, 等. 帕金森病致病因素及發(fā)病機制研究進展[J]. 藥學學報, 2020, 55(10): 2264-2272.

[3]楊麗娟, 張京芬, 李月春, 等. 帕金森病的黑質超聲表現(xiàn)[J]. 中華老年心腦血管病雜志, 2012,14(4):390-393.

[4]蔡增林, 吳方萍, 周芯羽, 等. 早期帕金森病患者的臨床與18F-FDG PET影像學特征研究[J]. 中國現(xiàn)代醫(yī)藥雜志, 2010, 12(2): 61-63.

[5]Prashanth R, Dutta Roy S. Early detection of Parkinson′s disease through patient questionnaire and predictive modelling[J]. International Journal of Medical Informatics, 2018, 119: 75-87.

[6]Cho C W, Chao W H, Lin S H, et al. A vision-based analysis system for gait recognition in patients with Parkinson′s disease[J]. Expert Systems With Applications, 2009, 36(3): 7033-7039.

[7]Jankovic J. Parkinson′s disease: Clinical features and diagnosis[J]. Journal of Neurology, Neurosurgery, and Psychiatry, 2008, 79(4): 368-376.

[8]Jahanshahi M, Jenkins I H, Brown R G, et al. Self-initiated versus externally triggered movements: I. An investigation using measurement of regional cerebral blood flow with PET and movement-related potentials in normal and Parkinson′s disease subjects[J]. Brain, 1995, 118(4): 913-933.

[9]Cubo E, Martinez Martín P, Martin-Gonzalez J A, et al. Motor laterality asymmetry and nonmotor symptoms in Parkinson′s disease[J]. Movement Disorders, 2010, 25(1): 70-75.

[10]Noyce A J, Nagy A, Acharya S, et al. Bradykinesia-akinesia incoordination test: Validating an online keyboard test of upper limb function[J]. PLoS One, 2014, 9(4): e96260.

[11]Giancardo L, Snchez-Ferro A, Arroyo-Gallego T, et al. Computer keyboard interaction as an indicator of early Parkinson′s disease[J]. Scientific Reports, 2016, 6: 34468.

[12]Madanchi A, Taghavi-Shahri F, Taghavi-Shahri S M, et al. Scaling behavior in measured keystroke time series from patients with Parkinson′s disease[J]. The European Physical Journal B, 2020, 93(7): 126.

[13]Iakovakis D, Diniz J A, Trivedi D, et al. Early Parkinson′s disease detection via touchscreen typing analysis using convolutional neural networks[C]//2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Berlin: IEEE, 2019: 3535-3538.

[14]Adams W R. High-accuracy detection of early Parkinson′s disease using multiple characteristics of finger movement while typing[J]. PLoS One, 2017, 12(11): e0188226.

[15]Goldberger A L, Amaral L A, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: Components of a new research resource for complex physiologic signals[J]. Circulation, 2000, 101(23): E215-E220.

[16]Freund Y, Schapire R E. A decision-theoretic generalization of on-line learning and an application to boosting[J]. Journal of Computer and System Sciences, 1997, 55(1): 119-139.

[17]Wang L S, Yu T F, Chai B, et al. Transcranial sonography in differential diagnosis of Parkinson disease and other movement disorders[J]. Chinese Medical Journal, 2021, 134(14): 1726-1731.

(責任編輯:康 鋒)

收稿日期: 2022-04-08? 網絡出版日期:2022-09-07網絡出版日期

基金項目: 浙江省醫(yī)院協(xié)會管理軟科學項目(2021ZHA-KEB206);浙江省自然科學基金項目(LQ22F010006)

作者簡介: 許 昊(1997- ),男,浙江金華人,碩士研究生,主要從事信號處理方面的研究。

通信作者: 童基均,E-mail:jijuntong@zstu.edu.cn

猜你喜歡
分塊按鍵帕金森病
手抖一定是帕金森病嗎
基于有限狀態(tài)機的按鍵檢測程序設計
電子制作(2021年3期)2021-06-16 03:14:26
分塊矩陣在線性代數中的應用
帕金森病科普十問
活力(2019年22期)2019-03-16 12:47:04
一種多方向導光按鍵結構設計
電子制作(2016年1期)2016-11-07 08:43:05
反三角分塊矩陣Drazin逆新的表示
基于自適應中值濾波的分塊壓縮感知人臉識別
基于多分辨率半邊的分塊LOD模型無縫表達
帕金森病的治療
中西醫(yī)結合治療帕金森病98例
马关县| 西城区| 烟台市| 阳西县| 巨野县| 固阳县| 岫岩| 平舆县| 博乐市| 嘉定区| 定陶县| 玛曲县| 临清市| 梅州市| 贡觉县| 甘孜| 天津市| 界首市| 宁德市| 抚远县| 七台河市| 如东县| 桐庐县| 金华市| 海城市| 竹北市| 思南县| 浮梁县| 萨迦县| 渝中区| 西华县| 望都县| 获嘉县| 库车县| 高淳县| 泰和县| 双牌县| 湖南省| 黄石市| 通榆县| 库车县|