王琦雯, 李永康, 徐 琪, 蘇 杭, 李曉歐,3
(1 上海理工大學(xué) 健康科學(xué)與工程學(xué)院, 上海 200093; 2 上海交通大學(xué) 醫(yī)學(xué)院附屬精神衛(wèi)生中心, 上海 201108;3 上海健康醫(yī)學(xué)院 醫(yī)療器械學(xué)院, 上海 201318)
隨著互聯(lián)網(wǎng)的發(fā)展,電子游戲成為人們?nèi)粘P蓍e娛樂的主要方式之一,與此同時(shí)網(wǎng)絡(luò)游戲成癮現(xiàn)象也引起了人們的關(guān)注。 2013年第五版精神疾病診斷與統(tǒng)計(jì)手冊將網(wǎng)絡(luò)游戲成癮(Internet Gaming Disorder, IGD)列為精神疾病中的一種,IGD 會對人體的大腦和心理造成損傷[1]。 游戲成癮的初期癥狀表現(xiàn)為抑郁、焦慮或強(qiáng)迫癥傾向等,與賭博成癮、物質(zhì)使用障礙具有很多共同點(diǎn)[2]。 過度沉迷于游戲內(nèi)容中會對自控能力與決策能力減弱、情緒控制障礙等產(chǎn)生嚴(yán)重影響,給社會帶來許多負(fù)面問題。
功能性近紅外光譜技術(shù)(functional Near -Infrared Spectroscopy, fNIRS)是一種新興的無創(chuàng)腦功能檢測技術(shù),具有時(shí)間分辨率高、抗運(yùn)動干擾、便攜性好等優(yōu)勢,在運(yùn)動康復(fù)、精神疾病等領(lǐng)域的研究得到廣泛使用[3]。 fNIRS 技術(shù)主要利用了氧合血紅蛋白(oxygenated hemoglobin, HbO2)和脫氧血紅蛋白(deoxygenated hemoglobin, Hb)等組織的生物特性,即此類蛋白對700~1000 nm 近紅外光具有特異性吸收能力,當(dāng)大腦執(zhí)行任務(wù)時(shí),可以根據(jù)光強(qiáng)衰減情況推算出相關(guān)區(qū)域血氧濃度變化,達(dá)到實(shí)時(shí)監(jiān)測大腦活動的目的。
隨著機(jī)器學(xué)習(xí)的發(fā)展,越來越多的算法被用于fNIRS 的腦狀態(tài)活動分類,目前已有許多團(tuán)隊(duì)利用fNIRS 技術(shù)對腦活動狀態(tài)進(jìn)行研究。 Tai 等學(xué)者[4]使用線性判別分析(Linear Discriminant Analysis,LDA)與支持向量機(jī)(Support Vector Machine, SVM)分類器,對圖片情感推斷任務(wù)所激活的8 通道fNIRS 腦活動信號進(jìn)行狀態(tài)識別。 Cho 等學(xué)者使用SVM 和深度神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN)分類器,對首發(fā)精神分裂癥患者和健康人進(jìn)行區(qū)分。在首發(fā)精神分裂癥患者和健康人的分類中,SVM 的準(zhǔn)確率為68.6%,DNN 的準(zhǔn)確率為79.7%。 Liu 等學(xué)者[6]利用SVM 分類器與長短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)對fNIRS 信號進(jìn)行分類,SVM 的準(zhǔn)確率達(dá)到71.70%,基于LSTM 的深度學(xué)習(xí)方法準(zhǔn)確率達(dá)到82.86%。 目前,基于fNIRS 的游戲成癮分類研究較少,利用fNIRS 技術(shù)針對游戲成癮患者識別研究潛力巨大,需要更多的研究來完善利用fNIRS 識別游戲成癮患者與健康人的差異。
本文使用fNIRS 測量在執(zhí)行停止信號任務(wù)(stop-signal task, SST)時(shí)大腦前額葉區(qū)域的腦血氧飽和度變化。 采集22 位受試者在執(zhí)行任務(wù)時(shí)的前額葉血氧飽和度,使用經(jīng)典機(jī)器學(xué)習(xí)方法和LSTM對游戲成癮者和健康人進(jìn)行分類,分析了不同分類器對fNIRS 信號分類的準(zhǔn)確性。
本研究招募了22 名中學(xué)生受試者,年齡區(qū)間為14~16 周歲,所有受試者均身體健康,無精神病史,且未服用過神經(jīng)類藥物。 實(shí)驗(yàn)前,上海市精神衛(wèi)生中心制定了網(wǎng)絡(luò)游戲成癮量表,并在人群中通過了信效度驗(yàn)證,證實(shí)了量表的有效性[7]。每名受試者在實(shí)驗(yàn)前均填寫了量表并交由專業(yè)醫(yī)生診斷,最終6 名被診斷為游戲成癮患者,余下16 名為健康人。
近紅外信號采集系統(tǒng)采用LIGHT NIRS 便攜式腦成像裝置,選取的測量通道數(shù)為10 導(dǎo)聯(lián),采樣頻率為13.33 Hz,覆蓋腦區(qū)為大腦前額葉皮層,測量區(qū)域由4 個(gè)光源(Tx)和4 個(gè)光電探測器(Rx)組成,光源及傳感器在前額葉的分布圖如圖1 所示。 光源可發(fā)射780 nm 和830 nm 的近紅外光,實(shí)時(shí)監(jiān)測大腦前額的血氧濃度變化。
圖1 光源及傳感器排布示意圖Fig. 1 Light source and sensor arrangement diagram
本文選取SST 范式作為實(shí)驗(yàn)任務(wù),可以考察被試突然停止正在進(jìn)行或者準(zhǔn)備進(jìn)行的思想或者行為的能力,有助于解釋個(gè)體差異、發(fā)展變化以及廣泛的認(rèn)知能力。 SST 實(shí)驗(yàn)需要在安靜且光線較暗的單獨(dú)房間內(nèi)進(jìn)行,以防止外界噪音及外界光對血氧信號產(chǎn)生干擾。 實(shí)驗(yàn)開始前需要對受試者進(jìn)行1 min 的任務(wù)訓(xùn)練,首先屏幕上會呈現(xiàn)黑色的左右箭頭,箭頭出現(xiàn)時(shí),需要受試者對箭頭刺激做出方向判斷。 實(shí)驗(yàn)使用鍵盤左右鍵做反應(yīng),在無停止信號任務(wù)中,需要受試者將右手放在鍵盤的左右鍵上,食指對左鍵做反應(yīng),中指對右鍵做反應(yīng)。 在停止信號任務(wù)中,呈現(xiàn)紅色左右箭頭的同時(shí)會有一個(gè)提示音,受試者此時(shí)對呈現(xiàn)的紅色箭頭不做反應(yīng)。 本實(shí)驗(yàn)對受試者在執(zhí)行任務(wù)、停止任務(wù)兩種狀態(tài)下的血氧濃度情況進(jìn)行連續(xù)采集。 整個(gè)實(shí)驗(yàn)時(shí)長為11 min,流程如圖2所示。
圖2 停止信號任務(wù)實(shí)驗(yàn)范式Fig. 2 The experimental paradigm of stop signal task
在采集信號過程中會存在生理干擾與運(yùn)動偽跡,因此在fNIRS 數(shù)據(jù)采集后,需要將信號進(jìn)行預(yù)處理。 首先,從數(shù)據(jù)中去除偽跡,這就能減少在數(shù)據(jù)采集過程中產(chǎn)生的偽跡和生理偽跡。 隨后,進(jìn)行去漂移,使用多項(xiàng)式回歸模型估計(jì)非線性趨勢,從原始信號中減去該趨勢,以此去除近紅外信號的基線漂移噪聲。 然后,將去漂移后的數(shù)據(jù)進(jìn)行運(yùn)動偽跡矯正,使用時(shí)間導(dǎo)數(shù)分布修復(fù)(Temporal Derivative Distribution Repair,TDDR)進(jìn)行矯正,可以減少運(yùn)動偽跡對相關(guān)近紅外數(shù)據(jù)的影響。 最后,使用三階Butterworth 濾波器進(jìn)行0.01~0.3 Hz 的帶通濾波,可以濾除大部分生理噪聲。 各步預(yù)處理的結(jié)果如圖3(b)~(d)所示。
圖3 近紅外數(shù)據(jù)預(yù)處理Fig. 3 fNIRS data preprocessing
在把數(shù)據(jù)用于腦活動狀態(tài)分類模型的訓(xùn)練與驗(yàn)證前,特征選擇與特征提取的過程將對算法模型的效果產(chǎn)生重大影響。 即便是已經(jīng)進(jìn)行預(yù)處理后,原始信號中也仍然存在大量的特征維度。 對于分類結(jié)果來說,不是所有的數(shù)據(jù)信息都會起作用。 首先從fNIRS 數(shù)據(jù)所有的特征中選擇更為相關(guān)的部分特征,然后對原始數(shù)據(jù)進(jìn)行轉(zhuǎn)化處理,使得信號特征可以被算法識別出來。
fNIRS 標(biāo)準(zhǔn)信號為一維時(shí)間序列信號,為了有效提取出腦活動信號的特征,通常選擇計(jì)算一些時(shí)域特征參數(shù)。 本文提取了fNIRS 信號的均值、偏度和峭度,分別用如下公式來計(jì)算:
均值、偏度和峭度為一些常見的用于時(shí)域特征提取的參數(shù),這些參數(shù)雖然在一定程度上表征了腦活動信號的特征,但提取方式較為粗糙,在一定程度上限制了腦活動狀態(tài)分類準(zhǔn)確率的提高。
本文利用SVM 區(qū)分游戲成癮患者與健康人,SVM 的工作原理是當(dāng)數(shù)據(jù)線性可分時(shí),在原空間尋找2 類樣本的最優(yōu)分類超平面。 數(shù)據(jù)線性不可分時(shí),通過使用非線性映射將低維度輸入空間的樣本映射到高維度空間使信號變?yōu)榫€性可分,利用SVM構(gòu)建決策超平面,在特征空間中尋找到最優(yōu)分類超平面[8]。 最優(yōu)分類超平面如圖4 所示。 通過特征融合,利用SVM 進(jìn)行游戲成癮患者和健康人的識別。
圖4 最優(yōu)分類超平面示意圖Fig. 4 Optimal classification hyperplane schematic
LDA 是一種經(jīng)典的有監(jiān)督數(shù)據(jù)降維方法。 LDA的原理是將近紅外數(shù)據(jù)在低維度上進(jìn)行投影,投影后最大化類間散度矩陣,同時(shí)最小化類內(nèi)散度矩陣[9],類間散度矩陣用來判斷異類樣例的投影點(diǎn)之間的距離,類內(nèi)散度矩陣用來判斷同類樣例的投影點(diǎn)之間的距離,計(jì)算公式具體如下:
其中,Sb為類間散度矩陣,Sw為類內(nèi)散度矩陣,μi為第i類樣本的均值,∑i表示第i類樣本的協(xié)方差矩陣,這里,i =0,1。
通過計(jì)算類內(nèi)散度矩陣和類間散度矩陣獲得判別特征,并在迭代300 次后,對數(shù)據(jù)進(jìn)行分類。 LDA提供了降低數(shù)據(jù)維數(shù)的有效方法,并可以使用判別特征進(jìn)行二分類。
k 近鄰算法(K-Nearest Neighbors, KNN)是最常用的有監(jiān)督學(xué)習(xí)分類算法之一。 KNN 算法的基本思路是計(jì)算每個(gè)數(shù)據(jù)點(diǎn)與其聚類質(zhì)心之間的距離,使誤差最小化,距離預(yù)測點(diǎn)距離最小的點(diǎn)被認(rèn)為屬于同一類[10]。 通常使用歐氏距離計(jì)算空間兩向量的距離,可用如下公式進(jìn)行描述:
當(dāng)?shù)?00 次后,KNN 可以捕獲距離較近的2個(gè)類并進(jìn)行分類。
長短期記憶網(wǎng)絡(luò)(LSTM)是一種深度神經(jīng)網(wǎng)絡(luò),利用記憶單元替代循環(huán)網(wǎng)絡(luò)中的隱藏單元,可以確保長時(shí)間梯度傳遞不消失,非常適合處理時(shí)間序列的預(yù)測和分類問題。 LSTM 還可以自動從行為數(shù)據(jù)中學(xué)習(xí)特征,只需要最少的特征進(jìn)行預(yù)處理,因此運(yùn)用LSTM 神經(jīng)網(wǎng)絡(luò)可以很好地避免人為的特征選擇和預(yù)處理導(dǎo)致的分類準(zhǔn)確性不高的問題[11]。LSTM 神經(jīng)網(wǎng)絡(luò)的核心由遺忘門、輸入門、輸出門和一個(gè)記憶單元組成,如圖5 所示。 其中,遺忘門決定從記憶單元中丟棄什么信息,輸入門決定在記憶單元中存儲什么內(nèi)容,輸出門顯示輸出的結(jié)果。 在實(shí)驗(yàn)中,15 名受試者被劃分為訓(xùn)練集,7 名受試者被劃分為測試集來檢驗(yàn)?zāi)P偷挠行浴?/p>
圖5 LSTM 神經(jīng)網(wǎng)絡(luò)內(nèi)部機(jī)制Fig. 5 Internal mechanism of LSTM neural network
本文使用了SVM、LDA、KNN 三種經(jīng)典機(jī)器學(xué)習(xí)分類器與LSTM 分類模型對游戲成癮患者與健康人進(jìn)行分類,并對4 種分類器的性能進(jìn)行比較。
SVM、LDA、KNN 的分類準(zhǔn)確率見表1。 SVM、LDA、KNN 在3 種特征組合中的分類準(zhǔn)確度分別為67.4%、63.6%和71.2%。 在單一特征中,KNN 的均值、偏度和峭度的分類準(zhǔn)確度最高,分別為68.9%、67.4%和68.9%,高于SVM 和LDA 的分類準(zhǔn)確度。從分類的準(zhǔn)確率上看,同時(shí)提取3 種特征對健康人和游戲成癮患者的分類效果優(yōu)于提取單一特征。
表1 不同機(jī)器學(xué)習(xí)分類準(zhǔn)確度的比較Tab. 1 Comparison of classification accuracy of different machinelearning %
LSTM 分類器的損失值(Loss) 的收斂性效果和準(zhǔn)確性結(jié)果如圖6 和圖7 所示。 在本文中,LSTM 網(wǎng)絡(luò)使用Adam 優(yōu)化器通過稀疏分類交叉熵計(jì)算損失。 在400 次迭代(epoch) 之后,Loss變 化呈收斂趨勢,證明網(wǎng)絡(luò)結(jié)構(gòu)是穩(wěn)定的。 隨著epoch次數(shù)的逐漸推進(jìn),使用訓(xùn)練數(shù)據(jù)的識別準(zhǔn)確性得到穩(wěn)定提高。 通過對實(shí)際類和預(yù)測類的比較,得到了總體混淆矩陣,可視化了LSTM 的預(yù)測準(zhǔn)確性,能夠可視化LSTM 算法的性能和有效性,具體如圖8 所示。 該模型對健康人和游戲成癮患者(1 個(gè)錯(cuò)誤分類樣本)的預(yù)測準(zhǔn)確率接近85.7%。 LSTM 模型可自動學(xué)習(xí)原始數(shù)據(jù)的抽象表示特征,這避免了人工提取特征產(chǎn)生誤差,并且與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比取得了良好的效果。
圖6 LSTM 模型在訓(xùn)練過程中的LossFig. 6Lossof LSTM model during training
圖7 LSTM 模型在訓(xùn)練過程中測試數(shù)據(jù)集的準(zhǔn)確性Fig. 7 Test data set accuracy of LSTM during training
圖8 LSTM 模型分類混淆矩陣Fig. 8 Confusion matrix of LSTM model classification
本文利用fNIRS 技術(shù)采集了22 名受試者在執(zhí)行停止信號任務(wù)時(shí)的前額葉血氧飽和度數(shù)據(jù),利用3 種傳統(tǒng)機(jī)器學(xué)習(xí)分類器和LSTM 模型來區(qū)分健康人和游戲成癮患者,并對4 種模型的分類性能進(jìn)行了比較。 分類結(jié)果顯示,在傳統(tǒng)機(jī)器學(xué)習(xí)分類中,KNN 模型的分類準(zhǔn)確度最高,達(dá)到了71.2%。 相比之下,LSTM 模型分類性能的穩(wěn)定性得到驗(yàn)證,準(zhǔn)確性達(dá)到了85.7%,高于傳統(tǒng)機(jī)器學(xué)習(xí)算法,能夠有效區(qū)分游戲成癮患者和健康人。 將fNIRS 信號與深度學(xué)習(xí)結(jié)合能夠?yàn)榕R床診斷提供客觀的評價(jià)指標(biāo),有效識別游戲成癮患者,對于后期的干預(yù)治療有著重大的意義。