張 濤 洪文學(xué) 任宏雷(燕山大學(xué)信息科學(xué)與工程學(xué)院,秦皇島 066004)
2(燕山大學(xué)生物醫(yī)學(xué)工程研究所,秦皇島 066004)
帕金森病是一種常見的中老年神經(jīng)退行性疾病,具有發(fā)病率高且無(wú)法治愈的特點(diǎn)。目前最有效的辦法就是早發(fā)現(xiàn),以減少發(fā)病后期帶來的損失。但由于現(xiàn)有的帕金森病早期診斷過程比較繁瑣,造成漏診率高達(dá)6 成。因此,尋找檢測(cè)方便的各種帕金森病早期診斷的方法,成為了帕金森病研究的熱點(diǎn)[1 -2]。
在各種帕金森病的早期診斷方法中,有一種基于語(yǔ)音障礙的帕金森病機(jī)器診斷方法,由于其具有測(cè)量方便、成本低廉的特點(diǎn),受到了廣泛的關(guān)注[3]。在現(xiàn)有的基于語(yǔ)音障礙的帕金森病分析中,研究主要集中在兩個(gè)方面:特征選擇與數(shù)據(jù)分類。
在特征選擇的研究中,目前主要有窮舉法[4]、粗糙集方法[5]和遺傳算法[6]3 個(gè)方法。其中,窮舉法可以獲得相對(duì)較高的分類精度,但由于其計(jì)算復(fù)雜度較高而無(wú)法獲得實(shí)際應(yīng)用,同時(shí)其特征融合過程難以物理解釋;利用粗糙集方法做特征選擇,其結(jié)果為22 特征,實(shí)際上為全選過程;遺傳算法通過模擬自然進(jìn)化過程來搜索最優(yōu)解,其本質(zhì)屬于隨機(jī)類算法,難以得到穩(wěn)定解。對(duì)于帕金森病這樣一種需要進(jìn)行病原解釋的疾病,顯然其診斷在知識(shí)發(fā)現(xiàn)領(lǐng)域是無(wú)能為力的。
在對(duì)帕金森病數(shù)據(jù)的分類研究中,Little 等人的研究小組采用核函數(shù)的支持向量機(jī)(SVM)對(duì)其進(jìn)行分類[7],獲得了較為理想的分類精度。Freddie ?str?m 利用并行神經(jīng)網(wǎng)絡(luò)進(jìn)行帕金森病的預(yù)測(cè)[8],取得了和Little 近似的研究成果。以上方法雖然在分類精度上達(dá)到了較高水平,但在數(shù)據(jù)解釋上,由于映射關(guān)系與帕金森病語(yǔ)音障礙物理意義的脫節(jié),造成難以對(duì)該分類結(jié)果進(jìn)行解釋。同時(shí),由于難以讓使用者獲得直觀理解,因而分類過程的可解釋性較差。
為了同時(shí)滿足分類的高精度和結(jié)果的可解釋性,筆者提出利用基于計(jì)算幾何原理的多維篩分類器[9]對(duì)帕金森病的數(shù)據(jù)進(jìn)行可視化診斷。作為典型的可視化分類器,多維篩分類器從數(shù)據(jù)的表示到分類界面的形成與數(shù)據(jù)的分類,做到了全程可視化,且數(shù)據(jù)與過程對(duì)應(yīng)的物理意義明確,解釋性強(qiáng),不但有利于完成更高精度的數(shù)據(jù)分類,而且可以對(duì)分類結(jié)果進(jìn)行解釋。本研究利用多元圖表示原理,對(duì)基于語(yǔ)音障礙的帕金森病數(shù)據(jù)進(jìn)行可視化表示與分類,并比較不同參數(shù)下的分類結(jié)果及其分析。
為了保證實(shí)驗(yàn)數(shù)據(jù)的客觀性、可重現(xiàn)性與可對(duì)比性,所有實(shí)驗(yàn)數(shù)據(jù)均采用國(guó)際公開數(shù)據(jù)庫(kù)完成。在國(guó)際公開數(shù)據(jù)庫(kù)中,有關(guān)語(yǔ)音障礙的帕金森病的數(shù)據(jù)庫(kù)只有兩個(gè),分別為Parkinson's Dataset(帕金森數(shù)據(jù)集,http://archive. ics. uci. edu/ml/ datasets/Parkinsons)和Parkinsons Telemonitoring Data Set(遠(yuǎn)程帕金森數(shù)據(jù)集,http://archive. ics. uci. edu/ml/datasets/Parkinsons +Telemonitoring)。
Parkinson's dataset 為牛津大學(xué)的帕金森病檢測(cè)數(shù)據(jù)庫(kù)(OPDD),于2007 年由牛津大學(xué)的Max A.Little 建立,共采集到31 人195 份語(yǔ)音樣本,其中23人為確診的帕金森病患者。被測(cè)試對(duì)象的年齡在46 ~85 歲之間,患病時(shí)間0 ~28 年不等每個(gè)對(duì)象都分6 次發(fā)元音[a],每次的時(shí)間為36 s。
在帕金森數(shù)據(jù)集的基礎(chǔ)上,Max A. Little 于2009 年公布了遠(yuǎn)距離測(cè)量的帕金森病語(yǔ)音數(shù)據(jù)遠(yuǎn)程帕金森數(shù)據(jù)集Parkinsons Telemonitoring Data Set(PTDS)。在該測(cè)試中,選擇了42 名早期帕金森患者,共收集到5 875個(gè)數(shù)據(jù)樣本,每個(gè)樣本記錄26 個(gè)屬性,因此該數(shù)據(jù)集具有測(cè)試意義。
帕金森數(shù)據(jù)集與遠(yuǎn)程帕金森數(shù)據(jù)集均為實(shí)測(cè)的語(yǔ)音障礙與帕金森病的關(guān)系。其中,帕金森數(shù)據(jù)集關(guān)注的是能否用語(yǔ)音特征完成患者是否患有帕金森病的診斷,而遠(yuǎn)程帕金森數(shù)據(jù)集則是通過語(yǔ)音特征來完成帕金森病的嚴(yán)重程度判斷。從分類過程上看,二者的分類過程類似,且帕金森數(shù)據(jù)集表示更為簡(jiǎn)單。因此,在本文的描述中,如不做特殊聲明,所有的數(shù)據(jù)表示與計(jì)算均采用帕金森數(shù)據(jù)集作為分析樣本,僅在最終分類結(jié)果處加入遠(yuǎn)程帕金森數(shù)據(jù)集的分類結(jié)果,以降低表示過程的重復(fù)。
多維篩可視化分類器對(duì)帕金森病的可視化分類原理見文獻(xiàn)[10]。圖1 給出了帕金森數(shù)據(jù)集幾個(gè)典型的子分類空間的數(shù)據(jù)分布。其中,(a)為最大最小基音頻率的組合,可以看到,相同物理含義的特征組合雖然具有一定的分類效果,但混疊嚴(yán)重;(b)為Jitter 的百分比與絕度值組合,由于僅為比例變換,因此走勢(shì)基本一致,數(shù)據(jù)不具備分類意義;(c)為DDA 和NHR 的組合,在大多數(shù)的區(qū)域中,兩類數(shù)據(jù)基本完全混疊,其分類意義上效果甚至低于(a);(d)為D2 和DFA 的組合,雖然呈現(xiàn)嚴(yán)重的非線性分布,但分離程度較高。
由此分析可知,從數(shù)據(jù)分類的角度看,帕金森數(shù)據(jù)集不但數(shù)據(jù)空間分布混疊嚴(yán)重,而且類別分布筋混疊嚴(yán)重。這樣的數(shù)據(jù)分布特點(diǎn)符合主動(dòng)生長(zhǎng)的非線性模糊分類特性,因此符合多維篩分類器特色。
圖1 帕金森數(shù)據(jù)的分類空間。(a)最大最小基音頻率組合;(b)Jitter 的百分比與絕度值組合;(c)DDA 和NHR的組合;(d)D2 和DFA 的組合Fig.1 The classify spaces of OPDD. (a)Maximum and minimum vocal fundamental frequency;(b)Jitter(%)and Jitter(Abs);(c)DDA and NHR;(d)D2 and DFA
在可視化模式識(shí)別中,為了保證方法的普適性,設(shè)置了眾多可調(diào)參數(shù)。對(duì)于同一個(gè)數(shù)據(jù),不同的表示方法、不同的量化階、不同的非線性優(yōu)化以及加權(quán)算法,都將導(dǎo)致最終分類精度的差別。下面將以帕金森數(shù)據(jù)集與遠(yuǎn)程帕金森數(shù)據(jù)集為測(cè)試對(duì)象,論述不同參數(shù)下多維篩分類器各階段的表現(xiàn)與分類精度,進(jìn)而驗(yàn)證帕金森病在可視化模式識(shí)別下的可行性。
在對(duì)帕金森數(shù)據(jù)集的測(cè)試中,選取全部特征作為備選特征,把空間量化分為水平量化與垂直量化進(jìn)行,分別對(duì)應(yīng)組成散點(diǎn)圖的兩個(gè)特征分量。量化級(jí)從5 級(jí)開始,以5 級(jí)為遞進(jìn)量,共遞進(jìn)20 級(jí),即最高量化級(jí)為100。因此,對(duì)每個(gè)特征進(jìn)行20 次不同等級(jí)的量化,并將這些量化后的特征分別進(jìn)行組合。對(duì)于遠(yuǎn)程帕金森數(shù)據(jù)集,采用橫縱量化階相等的方案進(jìn)行測(cè)試。
在特征選擇分析中,通過對(duì)不同特征組成的分類空間的可視化分析,確定分類意義明顯的分類空間,進(jìn)而對(duì)所用特征進(jìn)行分析,以此發(fā)現(xiàn)可視化模式識(shí)別選用的特征向量與帕金森病臨床診斷之間的關(guān)聯(lián)。同時(shí),可獲得分類性能的直觀認(rèn)識(shí),利用LDA、QDA、kNN、parzen 窗、SVM 等經(jīng)典分類器作為對(duì)比測(cè)試方法。為保證測(cè)試結(jié)果的客觀性,參考分類器均采用PRTools 中的軟件包完成。
對(duì)同一個(gè)數(shù)據(jù),采用不同的量化級(jí)可獲得不同的數(shù)據(jù)量化精度。一般來說,量化級(jí)越多,量化后的圖形與原始圖形越接近。但在模式識(shí)別中,適當(dāng)?shù)亟档土炕燃?jí),不但可以有效地降低運(yùn)算復(fù)雜度,同時(shí)可以消除部分由于測(cè)量不精確而形成的孤立點(diǎn)對(duì)分類精度的影響。因此,在不同的量化級(jí)下,分類器將表現(xiàn)不同的分類精度。下面的測(cè)試關(guān)注量化級(jí)對(duì)分類精度的影響。
利用文中1.3 節(jié)所述的方法,對(duì)帕金森數(shù)據(jù)集進(jìn)行測(cè)試。為了直觀地觀察不同量化級(jí)對(duì)分類精度的影響,采用形成等高區(qū)域表示圖,其結(jié)果如圖2所示。
由圖2 可知,量化階對(duì)診斷精度的影響大約為5%。當(dāng)量化級(jí)過小時(shí),分類精度較低;而隨著量化級(jí)數(shù)的升高,分類精度也相應(yīng)提高;但當(dāng)超過某一精度時(shí),精度反而下降。對(duì)于帕金森病數(shù)據(jù),當(dāng)橫縱量化階均為65 時(shí),可達(dá)到當(dāng)前條件下的最高分類精度91.28%這和Little 等的實(shí)驗(yàn)結(jié)果相當(dāng)。但從整體趨勢(shì)上看,圖形的對(duì)稱性較為明顯,因此其影響趨勢(shì)具有橫縱量化階趨同的結(jié)構(gòu)——當(dāng)類空間橫縱方向量化階相等時(shí),對(duì)于分類性能的影響具有典型意義?;诖?,對(duì)于遠(yuǎn)程帕金森數(shù)據(jù)集,采用橫縱量化階相等的方案進(jìn)行測(cè)試,其結(jié)果如表1 所示。由此可以看到,與帕金森數(shù)據(jù)集相同,遠(yuǎn)程帕金森數(shù)據(jù)集的分類精度也受到量化等級(jí)的影響。
圖2 量化階對(duì)帕金森數(shù)據(jù)集精度的影響Fig.2 The relationship between quantization levels and precision in OPDD
表1 量化階對(duì)遠(yuǎn)程帕金森數(shù)據(jù)集精度的影響Tab.1 The relationship between quantization levels and precision in PTDS
對(duì)于帕金森數(shù)據(jù),利用散點(diǎn)圖表示下的多維篩分類器進(jìn)行分類,共形成231 個(gè)特征空間。在相同條件下,不同的子分類器空間下分類的精度將有所不同。圖3 表示兩個(gè)不同特征組合下形成的分類空間。其中,(a)可以對(duì)健康與患病兩類情況分別進(jìn)行表示,僅有少部分為模糊區(qū)域;(b)中的大部分區(qū)域表示患病類別,而確定的健康類別占有面積很少,甚至低于模糊區(qū)域面積。因此,從應(yīng)用角度看,(a)適合于進(jìn)行分類,而(b)對(duì)于分析患者的患病嚴(yán)重程度可能更為合適。
圖3 不同特征組合下的子分類器類空間。(a)PPE 與DFA 組合空間;(b)APQ3 與APQ5 組合空間Fig.3 The sub classifier spaces combined by different features. (a)PPE and DFA;(b)APQ3 and APQ5
對(duì)子分類器信息的分析過程,實(shí)質(zhì)是對(duì)特征進(jìn)行篩選的過程。綜合分析帕金森數(shù)據(jù)集和遠(yuǎn)程帕金森數(shù)據(jù)集,具有分類意義明確的前3 個(gè)特征分別為HNR、PPE 和DFA。其中,HNR 為語(yǔ)音信號(hào)的諧波信噪比,與發(fā)音顫抖、發(fā)音氣息較重相關(guān);PPE 為基音頻率變化的非線性測(cè)量,反映了發(fā)音過程中的頻率域變化;DFA 則從非線性動(dòng)力學(xué)角度,對(duì)語(yǔ)音特征進(jìn)行了噪聲度量。三者均與發(fā)音的噪聲部分相關(guān),而這種噪聲大多是由于發(fā)聲時(shí)氣流經(jīng)過聲帶而產(chǎn)生。正常人在發(fā)聲時(shí),可以對(duì)該噪聲進(jìn)行抑制。由以上分析可以初步判斷:在帕金森病的早期,由于運(yùn)動(dòng)機(jī)能受損,患者無(wú)法控制發(fā)聲過程中的噪聲,因此產(chǎn)生發(fā)音氣息較重、音節(jié)顫抖等現(xiàn)象,而這些現(xiàn)象也正是基于語(yǔ)音障礙的帕金森病的臨床典型癥
狀[11]。
在與其他分類器分類精度的對(duì)比實(shí)驗(yàn)中,各分類器對(duì)帕金森數(shù)據(jù)集和遠(yuǎn)程帕金森數(shù)據(jù)集的分類精度如表2 所示。
表2 不同分類器分類精度對(duì)比 %Tab.2 The comparison of precision (%)from different classifiers
由表2 可知,對(duì)于帕金森病這樣的高維復(fù)雜數(shù)據(jù),很難獲得較高的分類精度。其中,以LDA 為代表的線性分類器由于其分類界面的線性約束,因此獲得的分類精度最低;而對(duì)于以非線性為代表的QDA 分類器,在分類結(jié)果中精度較高,說明其模型與帕金森病數(shù)據(jù)分布模型基本符合,即帕金森病數(shù)據(jù)為典型的非線性分布數(shù)據(jù);kNN 分類器基于測(cè)量的思想,尋求待分類樣本與訓(xùn)練樣本的最大相似性,但由于數(shù)據(jù)類別混疊嚴(yán)重,因此其分類效果一般;Parzen 窗分類器則是利用了空間窗口分析,僅考慮了窗口大小對(duì)分類結(jié)果的影響,可認(rèn)為是多維篩的子集;SVM 作為統(tǒng)計(jì)學(xué)習(xí)理論和核方法的典型代表,其分類效果在傳統(tǒng)分類器中可以達(dá)到最優(yōu),但仍低于多維篩方法5.03%。
該結(jié)果也充分說明,帕金森數(shù)據(jù)必須通過向高維的映射才可以做到更好的分類;而多維篩分類器在集成了SVM 的高維映射特性的同時(shí),也具有非線性模糊分類器的典型特征。與經(jīng)典分類器相比,多維篩分類器模型與帕金森病數(shù)據(jù)的模型更為吻合,因此獲得了更高的分類精度。
筆者分別對(duì)帕金森數(shù)據(jù)集與遠(yuǎn)程帕金森數(shù)據(jù)集兩個(gè)國(guó)際公開的帕金森病語(yǔ)音障礙數(shù)據(jù)集進(jìn)行了不同條件下的實(shí)驗(yàn)測(cè)試。首先,針對(duì)不同特征組合下的數(shù)據(jù)分布進(jìn)行了可視化分析,驗(yàn)證了“并非所有特征組合都適合分類”的結(jié)論。其次,對(duì)不同量化階下的數(shù)據(jù)精度進(jìn)行了對(duì)比,發(fā)現(xiàn)的精度差別與類空間分布相關(guān),且該相關(guān)可通過對(duì)類空間分布的直觀觀察獲得,驗(yàn)證了可視化在分類過程中的作用,進(jìn)而完成了特征選擇過程并進(jìn)行了特征分析。最后,通過與經(jīng)典分類器的對(duì)比,驗(yàn)證了可視化模式識(shí)別在帕金森病可視化診斷中的優(yōu)勢(shì)。
通過實(shí)驗(yàn),證明了基于語(yǔ)音障礙的帕金森病可視化診斷的可行性與功能特色,為可視化模式識(shí)別在疾病診斷中的進(jìn)一步應(yīng)用奠定了基礎(chǔ)。
[1] Cho Chienwen,Chao Wenhung,Lin Shenghuang,et al. A vision-based analysis system for gait recognition in patients with Parkinson's disease [J]. Expert Systems with Applications,2009,36:7033 -7039.
[2] Dominique G,Pierre B,Christian L,et al. Auditory temporal processing in Parkinson's disease[J]. Neuropsychologia,2008,46:2326 -2335.
[3] 張濤,洪文學(xué),常鳳香,等. 基于元音分類度的帕金森病語(yǔ)音特征分析[J]. 中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào),2011,30(3):476-480.
[4] Max AL,Patrick EM,Eric JH,et al. Suitability of dysphonia measurements for telemonitoring of Parkinson's disease [J].IEEE Transactions on Biomedical Engineering,2009,56(4):1015 -1022.
[5] Revett K, Gorunescu F, Salem AB. Feature selection in Parkinson's disease:a rough sets approach [C] //Barbara K,Waldemar P,eds. International Multiconference on Computer Science and Information Technology. Mragowo:IEEE Digital Library,2009:425 -428.
[6] Guo Peifang,Prabir B,Nawwaf K. Advances in detecting Parkinson's disease [J]. Lecture Notes in Computer Science,2010,6165:306 -314.
[7] Max AL,Patrick EM,Stephen JR,et al. Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection[J]. Biomed Eng Online,2007,6:23.
[8] Freddie A,Rasit K. A parallel neural network approach to prediction of Parkinson's disease [J]. Expert Systems with Applications,2011,38:12470 -12474.
[9] 張濤,洪文學(xué). 基于計(jì)算幾何的非線性可視化分類器設(shè)計(jì)[J]. 電子學(xué)報(bào),2011,39(1):53 -58.
[10] 張濤,洪文學(xué),李銘婷,等. 基于多維篩分類器的可視化帕金森病診斷. 燕山大學(xué)學(xué)報(bào)[J],2010,34(2):180 -184.
[11] 趙國(guó)華. 帕金森病的中西醫(yī)結(jié)合治療[M]. 北京:人民衛(wèi)生出版社,2010:32 -50.