華北理工大學(xué)臨床醫(yī)學(xué)院 李博文 李娟
近十年來,人工智能技術(shù)快速發(fā)展,在醫(yī)療領(lǐng)域的應(yīng)用也逐漸深入。本文具體對(duì)機(jī)器學(xué)習(xí)在抑郁癥的輔助診斷方面的相關(guān)研究進(jìn)展進(jìn)行綜述,總結(jié)了機(jī)器學(xué)習(xí)在抑郁癥輔助診斷領(lǐng)域的常用算法及一般研究流程,并對(duì)機(jī)器學(xué)習(xí)應(yīng)用于抑郁癥存在的優(yōu)勢(shì)與不足進(jìn)行探討,以期為后續(xù)研究提供借鑒。
通過運(yùn)用以機(jī)器學(xué)習(xí)為代表的人工智能技術(shù),進(jìn)行抑郁癥的輔助診斷,促進(jìn)抑郁癥的早發(fā)現(xiàn)和早治療,具有十分重要的現(xiàn)實(shí)意義。本文就機(jī)器學(xué)習(xí)在抑郁癥輔助診斷方面的相關(guān)研究進(jìn)展進(jìn)行綜述,期望為機(jī)器學(xué)習(xí)在該領(lǐng)域的研究提供借鑒。
美國(guó)計(jì)算機(jī)科學(xué)家約翰·麥卡錫提出了“人工智能”的概念,希望能夠通過計(jì)算機(jī)對(duì)人類的智慧進(jìn)行模擬。機(jī)器學(xué)習(xí)作為人工智能的重要研究應(yīng)用領(lǐng)域之一,于20世紀(jì)50 年代初奠定基礎(chǔ),并不斷發(fā)展,在20 世紀(jì)80 年代發(fā)展為獨(dú)立的科學(xué)領(lǐng)域。現(xiàn)如今,隨著計(jì)算機(jī)科學(xué)與技術(shù)的進(jìn)步與發(fā)展,網(wǎng)絡(luò)和移動(dòng)的計(jì)算系統(tǒng)收集和傳輸大量數(shù)據(jù)的能力迅速增長(zhǎng),各種機(jī)器學(xué)習(xí)技術(shù)層出不窮,迎來井噴式發(fā)展。
機(jī)器學(xué)習(xí)作為一門專注于計(jì)算機(jī)如何從數(shù)據(jù)中學(xué)習(xí)的科學(xué)學(xué)科,位于計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)和各種其他學(xué)科的交叉點(diǎn),通過數(shù)學(xué)推理和學(xué)習(xí)算法可以在海量的數(shù)據(jù)中挖掘有意義的規(guī)律,可以利用學(xué)習(xí)到的“經(jīng)驗(yàn)”來改善計(jì)算機(jī)系統(tǒng)性能,更強(qiáng)調(diào)實(shí)際目標(biāo)的具體應(yīng)用[1]。目前,機(jī)器學(xué)習(xí)也逐漸被運(yùn)用到抑郁癥的輔助診斷中。
隨著社會(huì)的發(fā)展,數(shù)據(jù)體量的增長(zhǎng),對(duì)流程優(yōu)化、資源分配有了更高的要求。機(jī)器學(xué)習(xí)算法能夠快速進(jìn)行數(shù)據(jù)處理,自動(dòng)化做出一些決策,極大程度上減少了人力資源浪費(fèi)以及人工干預(yù)的風(fēng)險(xiǎn)和錯(cuò)誤,提高了效率和準(zhǔn)確性,因此,越來越多的領(lǐng)域?qū)⒀芯颗c機(jī)器學(xué)習(xí)算法相結(jié)合,激發(fā)更多的創(chuàng)造力與可能性。
根據(jù)學(xué)習(xí)方法不同將機(jī)器學(xué)習(xí)算法分為傳統(tǒng)方法(TA)和深度學(xué)習(xí)(DL)方法。深度學(xué)習(xí)與機(jī)器學(xué)習(xí)的關(guān)系如圖1 所示。
圖1 深度學(xué)習(xí)與機(jī)器學(xué)習(xí)的關(guān)系Fig.1 Relationship between deep learning and machine learning
傳統(tǒng)學(xué)習(xí)算法可以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)并做出智能決策,因此加入大量的特征工程(FE)來處理原始數(shù)據(jù)集得到更結(jié)構(gòu)化、更少噪音訓(xùn)練數(shù)據(jù)集是相當(dāng)重要的,也是使用TA 方法進(jìn)行研究的一大難點(diǎn)。這種方法的優(yōu)點(diǎn)是最小計(jì)算負(fù)擔(dān)與訓(xùn)練時(shí)間,且因?yàn)槟P蛢?nèi)部細(xì)節(jié)和工作知識(shí)完整,也被稱為“白盒”,分析診斷結(jié)果有著高度的可解釋性[2]。
深度學(xué)習(xí)算法由分層結(jié)構(gòu)算法組成,可以模擬生物神經(jīng)元工作,進(jìn)行自動(dòng)化特征提取,讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力。DL 由淺層和深層架構(gòu)組成,這些結(jié)構(gòu)復(fù)雜、多層、隱藏、相互連接,也被稱為“黑箱”。優(yōu)點(diǎn)是能夠處理原始的、嘈雜的、非結(jié)構(gòu)化的高位數(shù)據(jù)集,限制是在可解釋性方面較差,計(jì)算負(fù)擔(dān)沉重。傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的比較如表1 所示。
表1 傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的比較Tab.1 Comparison between traditional machine learning and deep learning
TA 使用的算法一般有:最小二乘支持向量機(jī)(LSSVM)、不同核支持向量機(jī)(SVM、CK-SVM)、基于判別分析的分類器(線性判別分析(LDA)和二次判別分析(QDA))、集成架構(gòu)(Bagging、RusBoost(RB)、GentleBoost(GB)和隨機(jī)森林(RF))、概率模型(樸素貝葉斯(NB)和邏輯回歸(LR))、K-最近鄰(KNN)及其變體,基于樹的算法(決策樹(DT)、J 48、復(fù)雜樹),以及其他(高斯混合模型(GMM)、貝葉斯網(wǎng)絡(luò))。其中SVM 和KNN 是大多數(shù)研究中性能最高的分類器,在各種性能指標(biāo)方面實(shí)現(xiàn)了優(yōu)異的分類結(jié)果(約99%)。
DL 使用的算法一般有:卷積神經(jīng)網(wǎng)絡(luò)(CNN)、長(zhǎng)短期記憶(LSTM)、CNN 和LSTM 的組合、自編碼器(Autoencoder)、多層感知器(MLP)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、徑向基函數(shù)網(wǎng)絡(luò)(RBFN)、ConvNet。CNN 是研究文章中使用最多的架構(gòu),許多研究將基于CNN 的時(shí)空特征與不同的特征提取方法相結(jié)合,很少有研究將深度神經(jīng)網(wǎng)絡(luò)用于抑郁癥診斷。由于DL 的“黑盒”特性,迫切需要具有可解釋性的處理問題的DL 方法模型。
機(jī)器學(xué)習(xí)常使用準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1 值、ROC 曲線、AUC 值等評(píng)價(jià)指標(biāo)衡量抑郁癥檢測(cè)算法性能,對(duì)算法分類能力進(jìn)行評(píng)估。
伴隨研究的深入,越來越多的研究表明,腦結(jié)構(gòu)、腦功能的異??赡芘c抑郁癥的發(fā)生有關(guān)。隨著醫(yī)學(xué)影像技術(shù)的不斷進(jìn)步,目前有關(guān)抑郁癥的腦影像研究主要分為三個(gè)方面,分別是腦結(jié)構(gòu)、腦功能及腦代謝影像研究。
近年來,關(guān)于抑郁癥患者的腦功能影像研究發(fā)展迅速,而機(jī)器學(xué)習(xí)同抑郁癥患者的腦代謝和腦結(jié)構(gòu)影像的研究相對(duì)較少。
腦功能影像研究則主要集中于額葉、顳葉、杏仁核、扣帶回等處的功能障礙,作為對(duì)腦功能影像進(jìn)行研究的最主要工具,功能性磁共振成像(fMRI)被廣泛應(yīng)用。并根據(jù)實(shí)驗(yàn)方案的不同,分為靜息態(tài)fMRI 和任務(wù)態(tài)fMRI。
其中,在與靜息態(tài)fMRI 結(jié)合方面,Zeng 等基于區(qū)域的靜息狀態(tài)功能連接,運(yùn)用了支持向量機(jī)(線性核)模型對(duì)重度抑郁癥進(jìn)行識(shí)別,準(zhǔn)確度達(dá)94.3%。從而表明與疾病相關(guān)的靜息狀態(tài)網(wǎng)絡(luò)改變可能引發(fā)重度抑郁癥中一部分情緒復(fù)雜性和認(rèn)知障礙。此外,杏仁核、前扣帶皮層、海馬旁回和海馬體在分類中表現(xiàn)出很高的判別力,可能在抑郁癥的病理生理學(xué)中發(fā)揮重要作用。Dai 等使用多站點(diǎn)rs-fMRI 數(shù)據(jù)增加樣本大小,并從使用SVMRFE-CV 選擇的136 個(gè)重要特征訓(xùn)練的LinearSVM 模型中獲得最好結(jié)果,揭示了FC 和NA 特征的組合使用對(duì)于MDD 和HC 的分類是有效的,可作為MDD 中改變腦功能連接網(wǎng)絡(luò)的參考。
在與任務(wù)態(tài)fMRI 結(jié)合方面,Hahn 等運(yùn)用單高斯過程分類,并集成高斯過程分類和決策樹-支持向量機(jī)(線性核)進(jìn)行比較,在3 項(xiàng)與抑郁癥相關(guān)的功能性MRI 任務(wù)期間,整合與情緒和情感處理相關(guān)的數(shù)據(jù),大大提高了分類的準(zhǔn)確性,準(zhǔn)確率達(dá)83%。Rosa 等運(yùn)用高斯圖模型與支持向量機(jī)模型,基于情緒面孔腦激活區(qū)進(jìn)行分析[3]。結(jié)果顯示,分類準(zhǔn)確度可達(dá)85%,在抑郁癥患者中,發(fā)現(xiàn)有穩(wěn)定的紋狀體、皮層及扣帶回腦網(wǎng)絡(luò)連接異常。
2.2.1 腦電圖(EEG)
腦電數(shù)據(jù)有著非侵入、成本低、效率高的優(yōu)點(diǎn),能夠?qū)崟r(shí)反饋患者的大腦活動(dòng),幫助醫(yī)生更好地了解患者病情與治療效果。將EEG 數(shù)據(jù)與合適的算法模型結(jié)合使用,是一種前景廣泛、結(jié)果可靠的抑郁癥輔助診斷方法。
已知最早使用EEG 數(shù)據(jù)輔助診斷抑郁癥的研究始于1972 年,Stern 等使用EEG 數(shù)據(jù)來識(shí)別抑郁癥患者與非抑郁癥患者的差異。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,EEG數(shù)據(jù)輔助診斷抑郁癥研究有了更多的算法模型。
Wu D 等使用了深度神經(jīng)網(wǎng)絡(luò)(DNN)對(duì)EEG 數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試,其中數(shù)據(jù)集包括64 名抑郁障礙患者和64 名健康受試者的EEG 數(shù)據(jù)。在訓(xùn)練階段,使用了10 次10 折交叉驗(yàn)證的方法進(jìn)行模型訓(xùn)練和參數(shù)調(diào)整。研究結(jié)果表明,使用深度學(xué)習(xí)方法對(duì)EEG 數(shù)據(jù)進(jìn)行分析可以有效地預(yù)測(cè)抑郁癥患者的癥狀嚴(yán)重程度,準(zhǔn)確率高達(dá)85%。
Acharya 提出了一種使用深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行自動(dòng)化EEG 篩查抑郁癥的方法。該方法基于265 名患者的數(shù)據(jù)集,可以在高達(dá)96.30%的準(zhǔn)確性和92.50%的敏感性下對(duì)抑郁癥進(jìn)行篩查。目前在該領(lǐng)域中,該研究的準(zhǔn)確度已經(jīng)達(dá)到非常高的水平。
以上足以見得算法與EEG 數(shù)據(jù)結(jié)合在輔助診斷抑郁癥方面的優(yōu)越性,值得注意的是,這些模型的準(zhǔn)確率受到許多因素的影響,如實(shí)驗(yàn)數(shù)據(jù)、模型設(shè)計(jì)、超參數(shù)選擇等。因此,在具體應(yīng)用時(shí)需要根據(jù)實(shí)際情況進(jìn)行選擇和調(diào)整。
2.2.2 基于組學(xué)分析技術(shù)診斷相關(guān)生物標(biāo)志物
目前,臨床缺乏客觀的生物標(biāo)志物幫助輔助診斷抑郁癥,進(jìn)行治療及預(yù)后評(píng)價(jià)。但仍然可以窺得基于組學(xué)分析技術(shù)在研究抑郁癥的遺傳因素、基礎(chǔ)生物學(xué)機(jī)制、蛋白質(zhì)標(biāo)志物、代謝過程方面,為抑郁癥的早期診斷、個(gè)體化治療和藥物研發(fā)等方面提供支持,具有巨大潛力。
行為數(shù)據(jù),如表情、聲音和文本等,相對(duì)于腦電,MRI 等生理信號(hào)采集成本較低,數(shù)據(jù)易于獲取,較其他數(shù)據(jù)更容易解釋,模型準(zhǔn)確率也較高。
目前,已有研究者引入卷積神經(jīng)網(wǎng)絡(luò)算法進(jìn)行患者抑郁狀態(tài)的檢測(cè)。Zhu 等提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)模型從視頻數(shù)據(jù)中預(yù)測(cè)貝克抑郁量表II(BDI-II)值的方法,相比其他基于視覺的方法,該模型可以對(duì)患者的面部動(dòng)力學(xué)特征進(jìn)行很好的刻畫,顯著提高抑郁癥的預(yù)測(cè)性能。Zhou 等在回歸網(wǎng)絡(luò)中引入了記憶注意力機(jī)制去深度判別抑郁表示,利用卷積神經(jīng)網(wǎng)絡(luò)算法,對(duì)面部特征的提取進(jìn)一步優(yōu)化,通過在基準(zhǔn)數(shù)據(jù)集上對(duì)方法進(jìn)行經(jīng)驗(yàn)評(píng)估,結(jié)果表明其方法優(yōu)于當(dāng)下幾種最先進(jìn)的方法[4]。
近年來,通過患者的語音特征進(jìn)行抑郁癥的輔助診斷的研究越來越多,有研究發(fā)現(xiàn),單調(diào)、遲鈍、停頓、低沉和語言輸出減少等特征與抑郁癥患者的語言關(guān)聯(lián)密切。也有研究以聲音抖動(dòng)和聲門頻譜斜率為特征,選取10 名高風(fēng)險(xiǎn)的近期自殺患者,10 名嚴(yán)重抑郁癥患者和10名非抑郁癥對(duì)照組建立模型,其準(zhǔn)確率高達(dá)90%。
除此之外,社交媒體上發(fā)布的文本數(shù)據(jù)也可提供有關(guān)抑郁癥的線索。劉豪等基于領(lǐng)域情感詞典與字詞特征融合,提出了一種進(jìn)行中文抑郁癥文本分類的方法,并應(yīng)用于BERT 模型,準(zhǔn)確率達(dá)到了97.59%。Yang 等通過抑郁癥相關(guān)問題分類的支持向量機(jī)(SVM)框架和Doc2Vec 和文本卷積神經(jīng)網(wǎng)絡(luò)的框架,對(duì)受訪者是否有抑郁傾向進(jìn)行分類,建立了一個(gè)易于分析抑郁傾向的文本分類模型。
利用人工智能強(qiáng)大的數(shù)據(jù)處理能力,用機(jī)器學(xué)習(xí)算法模型輔助醫(yī)師完成診療,可以避免因認(rèn)知偏差而導(dǎo)致的臨床錯(cuò)誤,提高診斷率,有助于為抑郁癥患者提供更加有效的個(gè)性化治療方案。
并且在心理咨詢中,當(dāng)人們面對(duì)人工智能咨詢時(shí),相較于人類咨詢師,所產(chǎn)生的懷疑及顧慮更少,更易對(duì)人工智能坦誠(chéng)相告,可避免患者因病恥感而不愿及時(shí)就醫(yī)的問題,有助于促進(jìn)抑郁癥的早發(fā)現(xiàn)和早治療。
當(dāng)下的研究所采用的樣本數(shù)據(jù)多以小樣本為主,缺乏大規(guī)模大樣本的深入研究,機(jī)器學(xué)習(xí)模型預(yù)測(cè)的準(zhǔn)確與否同所采用的數(shù)據(jù)質(zhì)量密切相關(guān),且算法模型的建立需要以標(biāo)簽數(shù)據(jù)為基礎(chǔ),同時(shí)還需要較多富有經(jīng)驗(yàn)的專業(yè)醫(yī)師進(jìn)行大量的數(shù)據(jù)標(biāo)注工作。
此外,將機(jī)器學(xué)習(xí)應(yīng)用于抑郁癥也對(duì)倫理道德問題提出了重大挑戰(zhàn),包括對(duì)于患者數(shù)據(jù)進(jìn)行收集、共享的倫理問題以及患者數(shù)據(jù)隱私保護(hù)的問題等。
近年來,抑郁癥的全球發(fā)病率增長(zhǎng)迅速,而我國(guó)目前精神衛(wèi)生方面的醫(yī)生數(shù)量難以滿足日益增長(zhǎng)的看病需求,對(duì)抑郁癥患者進(jìn)行及時(shí)的干預(yù)治療存在著較大難度。若是能夠利用以機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)進(jìn)行抑郁癥的輔助診斷,則可以在一定程度上提高醫(yī)生的診斷效率,節(jié)約我國(guó)的醫(yī)療資源,并緩解精神衛(wèi)生方面的醫(yī)療資源稀缺情況。
數(shù)字技術(shù)與應(yīng)用2023年11期