尹濤 何昭璇 蘭蕾 曾芳
摘要 在中國“腦科學計劃”的背景下,基于機器學習和神經(jīng)影像表征的分類預測研究方興未艾。針對針灸療效預測的研究也已經(jīng)起步,必將成為針灸腦科學研究的重要前沿。本文試從機器學習在神經(jīng)影像學研究中的應用概況、基于神經(jīng)影像表征的針灸療效預測研究現(xiàn)狀和未來研究的建議3個方面進行簡要評述,以期為基于機器學習與神經(jīng)影像表征的針灸療效預測研究提供參考與借鑒。
關鍵詞 機器學習;神經(jīng)影像;針灸;療效預測;支持向量機;人工智能
Abstract In the context of China Brain Project,research on classification and prediction based on machine learning and neuroimaging properties is in the ascendant.The study on the prediction of acupuncture efficacy is just starting,and it will become an important frontier of acupuncture and brain science research.This paper attempted to briefly review the application of machine learning in neuroimaging research and the current status of prediction for acupuncture efficacy based on neuroimaging properties,with a view to providing reference for the research on the prediction of acupuncture efficacy based on machine learning and neuroimaging.
Keywords Machine learning; Neuroimaging; Acupuncture; Efficacy prediction; Support vector machine; Artificial intelligence
中圖分類號:R2-03;R246文獻標識碼:Adoi:10.3969/j.issn.1673-7202.2020.11.007
以機器學習為代表的人工智能在醫(yī)療領域廣泛應用,為實現(xiàn)客觀精準辨別個體差異,輔助醫(yī)生制定臨床決策提供了技術支撐。近年來,機器學習在中醫(yī)藥領域中的運用也在逐步開展,其中利用機器學習算法,基于神經(jīng)影像數(shù)據(jù)預測針灸療效,篩選和評價針灸治療的適宜人群引起了研究者的極大興趣。本文試從機器學習在神經(jīng)影像學研究中的應用概況、基于神經(jīng)影像表征的針灸療效預測研究現(xiàn)狀和展望3個方面進行簡要評述,以期為基于機器學習與神經(jīng)影像表征的針灸療效預測研究提供參考與借鑒。
1 機器學習在神經(jīng)影像學研究中的應用概況
機器學習是通過算法,學習經(jīng)驗以改善系統(tǒng)性能的一門學科[1]。利用機器學習算法,計算機可以對現(xiàn)有知識進行結構劃分,并從大量繁雜的數(shù)據(jù)中自動分析獲得規(guī)律,訓練模型,而后使用訓練好的模型對未知個體數(shù)據(jù)進行分析預測[2]。2019年《Nature Medicine》人工智能??盗醒芯勘砻?,利用機器學習和人工智能技術輔助臨床醫(yī)生診療可以顯著提高臨床工作效率,產(chǎn)生1+1>2的協(xié)同效應[3]。根據(jù)算法的復雜程度不同,機器學習可劃分為傳統(tǒng)機器學習和深度學習。其中傳統(tǒng)機器學習包括支持向量機、隨機森林、決策樹、樸素貝葉斯等算法,這類算法具有模型簡單、可解釋性強、易于提取特征、小樣本結果穩(wěn)定的優(yōu)點。而深度學習是近年來機器學習研究領域的熱點,其模型主要包括卷積神經(jīng)網(wǎng)絡、遞歸神經(jīng)網(wǎng)絡和生成對抗網(wǎng)絡等[4]。相較于傳統(tǒng)機器學習算法,深度學習模型更加復雜,它可以基于深層構架進行分層學習,解決很多傳統(tǒng)機器學習不能較好解決的問題,被廣泛應用于模式識別、信號處理等領域。
自2001年Haxby等[5]開創(chuàng)性地進行了第一項基于功能磁共振成像數(shù)據(jù)的多變量模式分析研究以來,神經(jīng)影像和機器學習結合的研究逐年增多,也促使了神經(jīng)影像研究由傳統(tǒng)的組水平分析模式向個體水平轉換。研究者以高維神經(jīng)影像表征作為輸入特征,基于機器學習算法建立起了針對多種疾病的分類和診斷模型,實現(xiàn)了個體水平相對精準的疾病診斷[6-8]。此外,神經(jīng)影像和機器學習結合的研究方法還被應用于個體疾病預后及療效預測研究中。研究者使用支持向量機、隨機森林、卷積神經(jīng)網(wǎng)絡等算法,開展了大量基于神經(jīng)影像標志物的療效預測研究[9-12]。這些研究結果表明,患者基線期的特定神經(jīng)影像表征可以為預測干預后臨床癥狀的變化提供重要信息。如Redlich等[9]以前扣帶皮層灰質(zhì)體積為特征,采用支持向量回歸算法成功實現(xiàn)了從個體水平預測電驚厥療法改善重型抑郁的臨床療效,為精準篩選對電驚厥療法敏感的重性抑郁患者提供了客觀證據(jù)。而Cash等[11]的研究則表明,靜息狀態(tài)下默認網(wǎng)絡和情感網(wǎng)絡之間的功能連接可以作為支持向量機識別對經(jīng)顱磁刺激敏感的重型抑郁患者的重要神經(jīng)影像標志物。
2 基于神經(jīng)影像表征的針灸療效預測研究
針灸是獨具特色的傳統(tǒng)中醫(yī)外治法,也是世界范圍內(nèi)運用最為廣泛的補充替代療法,它通過刺激機體穴位和特定部位以激發(fā)經(jīng)氣、調(diào)理臟腑、平衡陰陽、糾正機體失衡狀態(tài)而發(fā)揮治療作用。患者的機體狀態(tài)是影響針灸方法選擇和治療效應的重要因素。因此,察色按脈、分別陰陽、明辨機體狀態(tài)以恰當?shù)剡x穴施術是針灸臨床治療的前提,也是提高針灸療效的關鍵。然而,由于疾病臨床表現(xiàn)的模糊性、傳統(tǒng)四診資料的主觀性和醫(yī)生辨證的經(jīng)驗性,有可能造成醫(yī)生對于患者機體狀態(tài)的把握和治療方法的選擇存在偏差,進而影響針灸療效的取得。因此,客觀、精確地辨別機體狀態(tài)特征,拓展醫(yī)生的判斷視野,輔助醫(yī)生制定適宜的治療策略對于提高針灸臨床療效具有重要價值。
針灸作為一種外源性的物理刺激,中樞整合是實現(xiàn)其臨床療效的關鍵。自上世紀90年代以來,基于神經(jīng)影像技術的針灸中樞機制研究廣泛開展,迄今為止,有近400篇中文和200余篇英文針灸神經(jīng)影像研究論文發(fā)表。針灸影像學也逐漸發(fā)展成為一門新興的交叉學科[13]。受到經(jīng)顱磁刺激等物理療法療效預測研究的啟發(fā),近年來開始有研究嘗試融合機器學習與神經(jīng)影像表征開展針灸療效預測,并取得了較好的預測效果。如Liu等[14]在2018年發(fā)表了第1篇基于白質(zhì)微結構的安慰針刺治療偏頭痛療效預測研究,在該研究中,作者使用了纖維示蹤技術提取了偏頭痛患者內(nèi)側前額葉與杏仁核之間白質(zhì)纖維微結構參數(shù),并將其作為療效預測模型的輸入特征,而后使用一般線性核函數(shù)支持向量機和留一交叉驗證法,較為準確地預測了8周假針刺治療后偏頭痛患者的應答程度,總體識別正確率超過84%。而Tu等[15]在近期的一項研究中,使用了基線期默認網(wǎng)絡、凸顯網(wǎng)絡、執(zhí)行控制網(wǎng)絡和感覺運動網(wǎng)絡網(wǎng)絡內(nèi)部及網(wǎng)絡間的靜息態(tài)功能連接作為識別特征,采用基于徑向基核函數(shù)的支持向量回歸算法,結合網(wǎng)格參數(shù)尋優(yōu),構建回歸模型預測真假針刺治療4周后慢性下腰痛患者的疼痛緩解,結果發(fā)現(xiàn)內(nèi)側前額葉和腦島、殼核、尾狀核之間的功能連接可以有效預測患者針刺治療后的疼痛緩解,而內(nèi)側前額葉和背側前扣帶回、頂上小葉之間的功能連接則對預測假針刺治療效果具有較大貢獻。本團隊近期也開展了一項基于靜息態(tài)功能腦網(wǎng)絡的針刺治療功能性消化不良應答程度預測研究[16]。在該研究中,基線期全腦116個腦區(qū)之間的功能連接被選擇為輸入特征,并使用顯著差異連邊遞增的方法進行特征篩選,而后基于一般線性核函數(shù)支持向量機,預測針刺治療4周后功能性消化不良患者對針刺治療的響應程度,取得了84.9%的總體分類正確率,并提取出右腦島-左楔前葉、左中部眶額回-左丘腦、左腦島-左前扣帶回等多條連邊作為區(qū)別針刺高低響應功能性消化不良患者的重要識別特征。除以上三項基于支持向量機的療效預測研究以外,早期研究者[17]還嘗試過基于模糊神經(jīng)網(wǎng)絡,使用腦電雙頻指數(shù)改變、末梢灌注指數(shù)等腦電圖參數(shù)作為輸入特征,預測即時電針刺激過程中疼痛相關物質(zhì)β-內(nèi)啡肽改變,結果發(fā)現(xiàn)預測值和實測值高度一致,間接提示使用腦電圖數(shù)據(jù)預測針刺鎮(zhèn)痛效應的可行性。
以上研究初步證實了機器學習和神經(jīng)影像表征結合開展針灸療效預測的可行性和有效性,進一步促進了針灸神經(jīng)影像學研究由傳統(tǒng)的單變量、組水平向多變量、個體水平發(fā)展,也為針灸腦科學研究領域開辟了新的研究方向。
3 優(yōu)化研究設計促進針灸療效預測研究水平的提升
當前基于機器學習和神經(jīng)影像表征的針灸療效預測研究尚處于起步和探索階段,還有諸多問題亟待解決。結合當前神經(jīng)影像和機器學習領域研究前沿,本文從樣本量、特征選擇、模型選擇以及模型評價4個方面對后續(xù)研究提出如下建議:
第一,增加樣本量以提高研究結果的穩(wěn)定性和可重復性。一方面,研究結果可重復性低是制約當前神經(jīng)影像學研究成果向臨床轉化的重要瓶頸,增加樣本量,降低樣本間異質(zhì)性是提高神經(jīng)影像研究結果穩(wěn)定性和可靠性的有效手段。另一方面,機器學習,尤其是深度學習模型的穩(wěn)定性和泛化能力也受到訓練集數(shù)據(jù)多少的顯著影響,增加訓練樣本以幫助計算機找到更為穩(wěn)健的識別特征,是提高模型預測性能的可靠方法。因此,在開展基于機器學習和神經(jīng)影像表征結合的針灸療效預測研究時,應當特別重視樣本量的問題。本團隊前期的文獻研究[18]結果提示,截至2014年,基于神經(jīng)影像學的針灸中樞機制研究平均單組樣本量為15例,這和Chen等[19]提出的神經(jīng)影像學研究單組樣本量應當大于40例以保證研究結果的穩(wěn)健性和可靠性還有很大的差距。而Scheinost等[20]的研究則認為,當訓練樣本數(shù)大于200,基于神經(jīng)影像表征的預測研究結果才能維持在相對高的穩(wěn)定狀態(tài),而之前的幾項預測研究中樣本量最大為94例,均未能達到該要求,相關研究結果有待在更大樣本中重復。
第二,重視預測特征的選擇以增強預測結果的準確性和可解釋性。單一模態(tài)神經(jīng)影像提供的信息相對有限,基于多模態(tài)影像表征建立的療效預測模型能夠更加精準地捕獲大腦與臨床特征之間的關聯(lián),以取得更好的分類或者預測效果。多項研究[8,21-22]結果提示,以多模態(tài)神經(jīng)影像表征為輸入特征可以取得較單一模態(tài)更高的分類準確率和更好的預測性能。近3年來,國家自然科學基金委資助了多項基于神經(jīng)影像表征的針灸療效預測研究,從這些研究題目中不難看出,多模態(tài)神經(jīng)影像表征融合以及神經(jīng)影像表征與疾病特異性臨床表征的融合將是以后針灸療效預測研究特征選擇的重要發(fā)展方向。除多模態(tài)融合以外,對于神經(jīng)影像表征的選擇還應當具有目的性,即根據(jù)明確的先驗假設選擇適當?shù)念A測特征。相較于數(shù)據(jù)驅動的特征選擇方法,以先驗假設為導向,選擇特定感興趣特征開展的療效預測研究結果具有更高的可解釋性,其邏輯鏈也更加嚴密。同時,由于排除了其他冗余特征的干擾,基于目的驅動選擇特征構建的模型一般具有更好的預測性能。而在選擇臨床表征作為療效預測特征時,還應該充分體現(xiàn)中醫(yī)特色,將一些相對客觀可量化的中醫(yī)指標(如得氣量表評分)作為預測特征之一,以構建更為契合針灸臨床實際的療效預測模型。
第三,選擇合適的預測模型以提高模型的魯棒性和泛化能力。一般而言,復雜程度越高的模型,在訓練樣本中表現(xiàn)出的性能越好,但同時也更容易出現(xiàn)過擬合現(xiàn)象,導致在其他未知樣本中泛化能力下降。相較于深度學習算法,支持向量機等傳統(tǒng)機器學習算法在樣本量較小的情況下可以表現(xiàn)出更強的泛化能力。Davatzikos等[23]開展的一項基于灰質(zhì)體積預測被試年齡的研究認為,使用一般線性核函數(shù)支持向量回歸算法取得的預測結果顯著優(yōu)于多層人工神經(jīng)網(wǎng)絡,提示在解決線性可分問題時,傳統(tǒng)機器學習算法可能更加合適。不同于一般的模式識別研究只重視識別結果的準確性,基于神經(jīng)影像表征建立療效預測模型的最終目標還包括確定神經(jīng)影像表征與臨床指標之間的潛在關聯(lián),挖掘重要的識別或預測特征。因此,在選擇算法構建預測模型的時候,還應該注意模型是否會影響預測結果到預測特征映射的建立。通過深度學習算法建立的預測模型可能具有更好的預測性能,但由于其普遍存在的黑箱現(xiàn)象,預測結果很難映射到具體影像表征上[24]。相比之下,支持向量機、隨機森林等傳統(tǒng)機器學習算法可以更加清晰地構建預測結果和預測特征之間的映射,最終為理解大腦特征與臨床指標之間的關聯(lián)提供更多的神經(jīng)生物學信息[25]?;谝陨蟽牲c原因,在使用較小樣本量構建基于神經(jīng)影像表征的療效預測模型時,應當優(yōu)先選擇支持向量機等傳統(tǒng)機器學習算法,以提高模型的預測性能和泛化能力。
最后,還應當特別注意在新的獨立樣本中對預測結果進行驗證。為盡可能減少模型建立尤其是深度學習模型建立過程中由于神經(jīng)影像數(shù)據(jù)維度過高以及模型參數(shù)選擇等原因導致的模型過擬合現(xiàn)象,研究者普遍認為非常有必要在新的獨立樣本中對已有模型及結果進行驗證,進一步評價模型的泛化能力[20,26]。同樣,基于神經(jīng)影像表征構建的針灸療效預測模型的泛化能力也應當在完全獨立的樣本中進行驗證,并且獨立驗證集數(shù)據(jù)的選擇應當根據(jù)研究目的和研究階段的不同有所側重。對于重點在明確影像表征和臨床指標關聯(lián)的研究,應當盡可能選擇同一中心、同一掃描參數(shù)的異質(zhì)性相對較小的被試構建獨立驗證集;而對于以臨床應用為主要目標的預測研究,則應該選擇來自不同中心的被試進行獨立驗證,以更大程度地評價模型的泛化能力。
4 小結
綜上所述,盡管基于機器學習和神經(jīng)影像表征的針灸療效預測研究尚處于探索階段,但已有的研究已經(jīng)初步證明其可行性和有效性,該研究方向必將成為針灸腦科學研究的前沿?;谇捌诘难芯拷?jīng)驗和相關學科發(fā)展趨勢,今后的研究應當進一步增加樣本量,同時注重特征的選擇,綜合使用多模態(tài)神經(jīng)影像表征、疾病特異性臨床表征以及可量化的中醫(yī)學指標為特征建立療效預測模型,并做好預測結果的獨立驗證,以提高模型的預測性能和泛化能力。
參考文獻
[1]周志華.機器學習[M].北京:清華大學出版社,2016:10-13.
[2]Deo R C.Machine Learning in Medicine[J].Circulation,2015,132(20):1920-1930.
[3]He J,Baxter S L,Xu J,et al.The practical implementation of artificial intelligence technologies in medicine[J].Nature Medicine,2019,25(1):30-36.
[4]田啟川,王滿麗.深度學習算法研究進展[J].計算機工程與應用,2019,55(22):25-33.
[5]Haxby J V,Gobbini M I,F(xiàn)urey M L,et al.Distributed and overlapping representations of faces and objects in ventral temporal cortex[J].Science,2001,293(5539):2425-2430.
[6]Walter M,Alizadeh S,Jamalabadi H,et al.Translational machine learning for psychiatric neuroimaging[J].Prog Neuropsychopharmacol Biol Psychiatry,2019,91:113-121.
[7]Jollans L,Boyle R,Artiges E,et al.Quantifying performance of machine learning methods for neuroimaging data[J].Neuroimage,2019,199:351-365.
[8]Ahmed M R,Zhang Y,F(xiàn)eng Z,et al.Neuroimaging and Machine Learning for Dementia Diagnosis:Recent Advancements and Future Prospects[J].IEEE Rev Biomed Eng,2019,12:19-33.
[9]Redlich R,Opel N,Grotegerd D,et al.Prediction of Individual Response to Electroconvulsive Therapy via Machine Learning on Structural Magnetic Resonance Imaging Data[J].JAMA Psychiatry,2016,73(6):557-564.
[10]Tetreault P,Mansour A,Vachon-presseau E,et al.Brain Connectivity Predicts Placebo Response across Chronic Pain Clinical Trials[J].PLoS Biol,2016,14(10):e1002570.
[11]Cash R F H,Cocchi L,Anderson R,et al.A multivariate neuroimaging biomarker of individual outcome to transcranial magnetic stimulation in depression[J].Human Brain Mapping,2019,40(16):4618-4629.
[12]Tian S,Sun Y,Shao J,et al.Predicting escitalopram monotherapy response in depression:The role of anterior cingulate cortex[J].Human Brain Mapping,2020,41(5):1249-1260.
[13]許能貴,方繼良.針灸影像學[M].北京:人民衛(wèi)生出版社,2018:3-4.
[14]Liu J,Mu J,Chen T,et al.White matter tract microstructure of the mPFC-amygdala predicts interindividual differences in placebo response related to treatment in migraine patients[J].Hum Brain Mapp,2019,40(1):284-292.
[15]Tu Y,Ortiz A,Gollub R L,et al.Multivariate resting-state functional connectivity predicts responses to real and sham acupuncture treatment in chronic low back pain[J].Neuroimage Clin,2019,23:101885.
[16]尹濤,孫睿睿,何昭璇,等.基于靜息態(tài)功能腦網(wǎng)絡預測針刺治療功能性消化不良臨床療效[J].中華中醫(yī)藥雜志,2020,35(5):18-21.
[17]郝旺身,朱訓生,王祥瑞,等.模糊神經(jīng)網(wǎng)絡預測電針鎮(zhèn)痛中生化指標的變化[J].上海交通大學學報,2008,42(2):177-180.
[18]Qiu K,Jing M,Sun R,et al.The Status of the Quality Control in Acupuncture-Neuroimaging Studies[J].Evidence-based complementary and alternative medicine:eCAM,2016,2016:3685785.
[19]Chen X,Lu B,Yan C-G.Reproducibility of R-fMRI metrics on the impact of different strategies for multiple comparison correction and sample sizes[J].Human Brain Mapping,2018,39(1):300-318.
[20]Scheinost D,Noble S,Horien C,et al.Ten simple rules for predictive modeling of individual differences in neuroimaging[J].NeuroImage,2019,193:35-45.
[21]Nicholson A A,Densmore M,Mckinnon M C,et al.Machine learning multivariate pattern analysis predicts classification of posttraumatic stress disorder and its dissociative subtype:a multimodal neuroimaging approach[J].Psychol Med,2019,49(12):2049-2059.
[22]Lee J,Mawla I,Kim J,et al.Machine learning-based prediction of clinical pain using multimodal neuroimaging and autonomic metrics[J].Pain,2019,160(3):550-560.
[23]Davatzikos C.Machine learning in neuroimaging:Progress and challenges[J].NeuroImage,2019,197:652-656.
[24]Lecun Y,Bengio Y,Hinton G.Deep learning[J].Nature,2015,521(7553):436-444.
[25]Shen X,F(xiàn)inn E S,Scheinost D,et al.Using connectome-based predictive modeling to predict individual behavior from brain connectivity[J].Nature Protocols,2017,12(3):506-518.
[26]Tu Y,Zeng F,Lan L,et al.An fMRI-based neural marker for migraine without aura[J].Neurology,2020,94(7):e741-e751.
(2020-05-10收稿 責任編輯:徐穎)