崔亞軒,胥 義,付 強,2
1(上海理工大學(xué) 醫(yī)療器械與食品學(xué)院,上海 200093) 2(上海市第一人民醫(yī)院 脊柱外科,上海 200080)
脊柱是人體的中軸骨骼,也是承擔(dān)人體活動的重要結(jié)構(gòu),被稱為“第二生命線”.脊柱的結(jié)構(gòu)包括椎體、椎間盤、椎弓及后關(guān)節(jié),其主要功能是保護脊髓,承受重量[1].脊柱退行性疾病是中老年患者的常見病、多發(fā)病,根據(jù)美國骨科醫(yī)師學(xué)會(AAOS)研究表明,世界上80%的人口一生中至少經(jīng)歷過一次下背痛[2].隨著電腦和手機的普及使用,中青年脊柱相關(guān)疾病的發(fā)病率也在隨之上升[3].脊柱疾病的診斷主要依據(jù)臨床表現(xiàn)和醫(yī)學(xué)圖像,其中醫(yī)學(xué)圖像包括CT圖像、MR圖像以及X光圖像.醫(yī)生在根據(jù)醫(yī)學(xué)圖像進行診斷的過程中難免摻雜個人主觀因素,對醫(yī)學(xué)圖像的標(biāo)注會耗費很多時間,并且容易產(chǎn)生疲憊而導(dǎo)致工作效率降低.
將機器學(xué)習(xí)技術(shù)應(yīng)用在脊柱疾病的臨床診斷中可以減少醫(yī)生工作量,提高診斷效率和診斷質(zhì)量,降低誤診率[4].機器學(xué)習(xí)作為人工智能應(yīng)用最廣的一個分支,基于學(xué)習(xí)方法可以分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及強化學(xué)習(xí)[5].機器學(xué)習(xí)擅于基于輸入數(shù)據(jù)本身的一些特征來生成輸出,例如圖像分類等[6].機器學(xué)習(xí)技術(shù)在人臉識別[7]、智能語音助手[8]等領(lǐng)域已經(jīng)廣泛應(yīng)用,但是在醫(yī)療衛(wèi)生領(lǐng)域還在初始的研究階段.根據(jù)文獻(xiàn)調(diào)研來看,機器學(xué)習(xí)技術(shù)在脊柱方面應(yīng)用最廣的是放射成像領(lǐng)域,并在術(shù)后結(jié)果預(yù)測、康復(fù)評估等領(lǐng)域也有一些進展.
本文對機器學(xué)習(xí)技術(shù)在脊柱疾病臨床診斷中應(yīng)用的相關(guān)研究進行綜述,主要包括:1)常用于脊柱疾病臨床診斷領(lǐng)域的機器學(xué)習(xí)技術(shù),包括基于監(jiān)督學(xué)習(xí)和基于無監(jiān)督學(xué)習(xí)的常用算法;2)對脊柱的分割,包括對椎骨的分割和椎間盤的分割;3)對椎骨定位和標(biāo)記;4)脊柱疾病臨床輔助診斷的主要應(yīng)用進展,包括脊柱畸形、脊柱退行性疾病、結(jié)果預(yù)測和臨床步態(tài)分析.通過對應(yīng)用情況進行對比和分析,分析目前存在的問題并對未來發(fā)展進行展望.
機器學(xué)習(xí)(ML)是Arthur Samuel[9]在1959年提出的,他將其定義為使計算機無需明確編程即可學(xué)習(xí)的學(xué)習(xí)領(lǐng)域.按照學(xué)習(xí)方式可以分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及強化學(xué)習(xí),如圖1所示.其中,常用在脊柱領(lǐng)域的機器學(xué)習(xí)方法有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí).
圖1 機器學(xué)習(xí)的分支示意圖Fig.1 Schematic of the branches of machine learning
監(jiān)督學(xué)習(xí)指的是計算機經(jīng)過一些已知輸入和相對應(yīng)的正確輸出數(shù)據(jù)的訓(xùn)練來預(yù)測其他輸入數(shù)據(jù)的輸出結(jié)果,是醫(yī)學(xué)研究中最常見的學(xué)習(xí)方式,常用在分類和回歸問題上[10,11].表1是常用在脊柱研究上的監(jiān)督學(xué)習(xí)算法總結(jié).
樸素貝葉斯法(NBM)、Logistics 回歸(LR)、決策樹(DT)和隨機森林(RF)等機器學(xué)習(xí)算法在20世紀(jì)初應(yīng)用廣泛,隨著機器學(xué)習(xí)技術(shù)的發(fā)展,逐漸被之后的算法取代.支持向量機(SVM)在訓(xùn)練集大小有限的情況下表現(xiàn)良好,但是當(dāng)輸入變量增多、樣本量過大時,它的計算復(fù)雜性和空間復(fù)雜性會急劇增加,將占用很大內(nèi)存資源,訓(xùn)練模型的時間也會隨之增加.人工神經(jīng)網(wǎng)絡(luò)(ANN)通過訓(xùn)練數(shù)據(jù)得到模型,使用正則化來防止過擬合現(xiàn)象,各個神經(jīng)元中的權(quán)值也是經(jīng)過訓(xùn)練得出而非人為給定,這樣可以減少診斷過程的人為因素,從而提高診斷的可靠性,使診斷結(jié)果更有效、更客觀.與傳統(tǒng)的機器學(xué)習(xí)相比,深度學(xué)習(xí)技術(shù)(DL)有以下特點:一是模型的深層結(jié)構(gòu);二是深度學(xué)習(xí)的模型有很多隱藏層.其中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型[22]和全卷積網(wǎng)絡(luò)(FCN)[23]模型是深度學(xué)習(xí)的經(jīng)典模型,其通過卷積層來進行特征提取(見圖2).卷積神經(jīng)網(wǎng)絡(luò)在卷積層之后會接上若干個全連接層,將卷積層產(chǎn)生的特征圖映射成一個固定長度的特征向量,見圖2(a).和卷積神經(jīng)網(wǎng)絡(luò)不同,全卷積網(wǎng)絡(luò)可以接受任意尺寸的輸入圖像,并將全連接層替換為反卷積層進行上采樣,使輸出結(jié)果恢復(fù)到輸入圖像相同的尺寸,對每個像素都進行預(yù)測并分類,見圖2(b).
表1 常用在脊柱研究上的監(jiān)督學(xué)習(xí)算法總結(jié)Table 1 Summary of supervised learning algorithms commonly used in spine research
無監(jiān)督學(xué)習(xí)指的是計算機從未知輸出結(jié)果的輸入數(shù)據(jù)中進行學(xué)習(xí),識別輸入數(shù)據(jù)中的模式和特征,并根據(jù)學(xué)習(xí)到的內(nèi)容對輸入數(shù)據(jù)進行分類.聚類是無監(jiān)督學(xué)習(xí)最常用的一種應(yīng)用,其具有代表性的算法有K-均值聚類等[24,25].
K-均值聚類(K-means clustering)是James MacQueen在1967年提出的一種迭代求解的聚類分析算法[26],對于大量的高維數(shù)值數(shù)據(jù),它可以將相似的數(shù)據(jù)分類到同一簇中.K-均值聚類是最常用的簡單聚類方法,但是易受異常值和嘈雜數(shù)據(jù)的影響,并易受初始聚類中心的影響[27].無監(jiān)督學(xué)習(xí)適用于沒有標(biāo)簽的情況下自主學(xué)習(xí)數(shù)據(jù)的抽象形式[28].但是由于對數(shù)據(jù)集編碼的特性以及學(xué)習(xí)方式,監(jiān)督學(xué)習(xí)的模型總是比無監(jiān)督學(xué)習(xí)的模型表現(xiàn)要好[29].
圖2 深度學(xué)習(xí)網(wǎng)絡(luò)模型Fig.2 Deep learning model
根據(jù)機器學(xué)習(xí)技術(shù)在脊柱疾病臨床診斷中的作用目的,其在脊柱疾病臨床診斷中的應(yīng)用可以分為對脊柱的分割、對椎骨定位和標(biāo)記以及脊柱疾病臨床輔助診斷的主要應(yīng)用進展等三個方面.
醫(yī)學(xué)圖像分析中的一個關(guān)鍵問題就是理解圖像內(nèi)容,即對每個像素進行區(qū)域性的劃分,該劃分過程稱為語義分割.脊柱分割是脊柱圖像分析和建模的基本步驟,醫(yī)生可以手動分割或使用算法自動分割.利用機器學(xué)習(xí)對脊柱的分割也是近些年來才被提出的,并在各種具有挑戰(zhàn)性的醫(yī)學(xué)圖像問題分析中表現(xiàn)良好[30,31].結(jié)合3D打印技術(shù)或者虛擬現(xiàn)實系統(tǒng)對脊柱進行三維建模,可以讓醫(yī)生深入了解患者的問題,做好術(shù)前規(guī)劃.在脊柱的分割中,我們從脊柱椎骨的分割以及椎間盤的分割兩個方面進行研究.
3.1.1 脊柱椎骨的分割
由于椎骨的形狀和結(jié)構(gòu)復(fù)雜多變、結(jié)構(gòu)相似、病理以及椎骨和肋骨之間的空間相互關(guān)系,椎骨分割是一個具有挑戰(zhàn)性的問題.相較于傳統(tǒng)的圖像分割算法,使用機器學(xué)習(xí)技術(shù)對椎骨的醫(yī)學(xué)圖像分割可以提高圖像分割效率和精準(zhǔn)度,提高醫(yī)生的診斷效率[4].表2是有關(guān)椎骨分割機器學(xué)習(xí)算法的相關(guān)研究總結(jié).
表2 椎骨分割機器學(xué)習(xí)算法的相關(guān)研究總結(jié)Table 2 Summary of related studies on machine learning algorithms for vertebral segmentation
從上述研究可以看出,早期的機器學(xué)習(xí)算法對椎骨進行分割常與形狀模型一起使用.直到2014年Wang等[10]提出了一種能夠用單一學(xué)習(xí)模型分割脊柱圖像的統(tǒng)一框架,從多種成像方式、多個解剖平面、多個解剖結(jié)構(gòu)(M3)的脊柱圖像直接到目標(biāo)邊界的高度非線性映射函數(shù)的建模,然后由多維支持向量回歸器(MSVR)完成分割(見圖3).隨著卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),Lessmannn等[36]提出了一種基于迭代卷積神經(jīng)網(wǎng)絡(luò)的算法來分割椎骨.受到全卷積網(wǎng)絡(luò)的啟發(fā),Ronneberger等[43]提出U-Net,并在椎骨分割中表現(xiàn)良好[38].Li等[42]基于深度學(xué)習(xí)提出一種多任務(wù)關(guān)系學(xué)習(xí)網(wǎng)絡(luò),該網(wǎng)絡(luò)引入LSTM(Long Short-Term Memory)模塊用于學(xué)習(xí)椎骨之間有序關(guān)系的先驗知識,同時進行定位和分割任務(wù),不僅可以避免單個任務(wù)的過擬合,同時可以相互糾正.各種類型的醫(yī)學(xué)圖像相結(jié)合對于椎骨的分割有著很大幫助,機器學(xué)習(xí)算法也應(yīng)向多任務(wù)、多模態(tài)的方向發(fā)展.
3.1.2 椎間盤的分割
椎間盤的分割對于椎間盤病變的檢測以及分析具有重要意義,從醫(yī)學(xué)圖像中準(zhǔn)確分割椎間盤是臨床診斷和制定治療計劃的前提[44].在臨床上,醫(yī)生用MR圖像去觀察椎間盤的形態(tài),人工分割椎間盤十分繁瑣和耗時,椎間盤的自動分割可以提高脊柱病理診斷的效率和準(zhǔn)確率.表3是有關(guān)椎間盤分割機器學(xué)習(xí)算法的相關(guān)研究總結(jié).
圖3 M3脊柱分割框架Fig.3 M3 spine segmentation overview
從以上的研究中可以看出,在對椎間盤進行分割時,在算法上可以將無監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)一起使用[46]并且可以優(yōu)化算法[44,50,51];在數(shù)據(jù)的使用上也從簡單的2D圖像變成引入位置信息的3D圖像[47],單模態(tài)到多模態(tài)的信息互補[48],利用周邊信息對圖像進行分割;在數(shù)據(jù)類型的選擇上,也可以覆蓋各種協(xié)議的MR圖像[49].算法的深入研究和數(shù)據(jù)的充分利用使分割速度和分割精度都有很大的提升.
表3 椎間盤分割機器學(xué)習(xí)算法的相關(guān)研究總結(jié)Table 3 Summary of related studies on machine learning algorithms for disc segmentation
在脊柱醫(yī)學(xué)圖像中,對脊柱解剖結(jié)構(gòu)的定位在病理診斷、手術(shù)規(guī)劃和術(shù)后評測中起著重要作用[52].醫(yī)生可以手動對脊柱進行定位,但過程繁瑣耗時,并容易出現(xiàn)由主觀因素引起的錯誤.利用機器學(xué)習(xí)可以對脊柱進行自動定位,減輕臨床醫(yī)生的工作負(fù)擔(dān).脊柱的自動定位主要困難有:1)病理和個體存在差異;2)經(jīng)常出現(xiàn)異常的脊柱彎曲;3)醫(yī)學(xué)圖片視野受限;4)外科植入物引起的圖像偽影[53].表4是有關(guān)脊柱定位和標(biāo)記機器學(xué)習(xí)算法的相關(guān)研究總結(jié).
表4 脊柱定位和標(biāo)記機器學(xué)習(xí)算法的相關(guān)研究總結(jié)Table 4 Summary of related studies on machine learning algorithms for spine localization and labeling
從以上研究可以看出,早期的脊柱定位和標(biāo)記算法將機器學(xué)習(xí)算法和圖形模型一起使用,但使用圖形模型導(dǎo)致對于病理圖像的定位準(zhǔn)確度大大降低,Glocker等[53]提出一種基于分類隨機森林訓(xùn)練來確定脊椎質(zhì)心位置的算法(見圖4),該算法在具有各種病理學(xué)特征的圖像中結(jié)果優(yōu)于之前的參數(shù)模型法.隨著深度學(xué)習(xí)的發(fā)展,Yang等[60]基于3D神經(jīng)網(wǎng)絡(luò)并引入卷積長短期記憶(ConvLSTM)模型,進一步優(yōu)化了在病理圖像中的椎體質(zhì)心定位.由于病理因素和外科植入物的存在,開發(fā)更先進的算法去降低這些干擾以及使用更大的數(shù)據(jù)集來訓(xùn)練模型提高魯棒性是未來發(fā)展趨勢.
圖4 脊柱定位和標(biāo)記示意圖Fig.4 Spine localization and labeling
將機器學(xué)習(xí)技術(shù)用于計算機輔助診斷與分析是智能醫(yī)療的關(guān)鍵[61].醫(yī)學(xué)影像是診斷脊柱疾病的重要手段,許多研究根據(jù)醫(yī)學(xué)圖像來設(shè)計脊柱疾病的自動診斷系統(tǒng),將機器學(xué)習(xí)用于脊柱圖像的病理診斷已涵蓋了多種類型的疾病,例如脊柱畸形和脊柱退行性疾病等[11,62].機器學(xué)習(xí)技術(shù)在脊柱疾病中的診斷與分析還包括利用其它類型的數(shù)據(jù)對患者進行術(shù)后結(jié)果預(yù)測以及臨床步態(tài)分析等.
3.3.1 脊柱畸形
脊柱畸形是指脊柱的冠狀位,矢狀位或軸向位偏離正常位置,發(fā)生形態(tài)上異常,根據(jù)病因可以劃分為特發(fā)性、先天性、創(chuàng)傷性等.其中冠狀位偏移引起的脊柱側(cè)凸是臨床上最常見的,Cobb角是評估脊柱側(cè)凸嚴(yán)重程度的常用標(biāo)準(zhǔn)[63,64].表5是有關(guān)脊柱畸形機器學(xué)習(xí)算法的相關(guān)研究總結(jié).
從以上研究可以看出,在脊柱畸形的應(yīng)用中,從之前人體軀干表面來預(yù)測脊柱側(cè)彎曲線類型和擬合曲線進行脊柱側(cè)凸分類到現(xiàn)在直接估算Cobb角(見圖5)或設(shè)計算法先分割椎體再計算Cobb角,利用算法對Cobb角進行精準(zhǔn)測量是目前的研究重點.其中,對X光圖像先分割再測量Cobb角時[38,70,71],如果脊柱有多個側(cè)凸,這些算法可能會得到錯誤的Cobb角.利用深度學(xué)習(xí)技術(shù)對圖像進行更精準(zhǔn)的分割以及更完善的Cobb角測量方法仍需要進一步的研究.
3.3.2 脊柱退行性疾病
表5 脊柱畸形機器學(xué)習(xí)算法的相關(guān)研究總結(jié)Table 5 Summary of related studies on machine learning algorithms for spinal deformity
圖5 估算Cobb角框架Fig.5 Estimation of Cobb angles overview
脊柱退行性疾病包括椎間盤突出癥、頸椎病、腰椎滑脫、腰椎管狹窄等,是骨科的常見病、多發(fā)病[72].計算機輔助診斷系統(tǒng)可以提高診斷效率以及降低醫(yī)生負(fù)擔(dān),對臨床診斷具有重要意義.最近幾年機器學(xué)習(xí)技術(shù)發(fā)展迅速,許多研究利用機器學(xué)習(xí)技術(shù)來搭建計算機輔助診斷系統(tǒng).表6是有關(guān)脊柱退行性疾病機器學(xué)習(xí)算法的相關(guān)研究總結(jié).
圖6 椎間盤分類框架Fig.6 Disc classification overview
從以上研究可以看出,在脊柱退行性疾病的應(yīng)用中,研究椎間盤的退變是主要方向,基于機器學(xué)習(xí)技術(shù)的計算機輔助診斷與分析通過椎間盤的圖像強度信息、紋理特性以及形狀特征對椎間盤退變進行準(zhǔn)確的Pfirrmann分級(見圖6),可以減少放射分析的時間.目前使用的分級算法還需要進行優(yōu)化以達(dá)到更高的準(zhǔn)確率,也有必要通過增加椎間盤的數(shù)據(jù)集來提高椎間盤分級的準(zhǔn)確率.
表6 脊柱退行性疾病機器學(xué)習(xí)算法的相關(guān)研究總結(jié)Table 6 Summary of related studies on machine learning algorithms for degenerative spine diseases
3.3.3 術(shù)后結(jié)果預(yù)測和臨床步態(tài)分析
結(jié)果預(yù)測是統(tǒng)計學(xué)的一個分支,旨在利用之前的數(shù)據(jù)對未來進行預(yù)測,很大程度上受大數(shù)據(jù)以及機器學(xué)習(xí)技術(shù)發(fā)展的影響,在脊柱上常用于預(yù)測脊柱手術(shù)的結(jié)果[81].臨床步態(tài)分析指的是收集定量信息以幫助診斷步態(tài)異常的病因和術(shù)后恢復(fù)評估的過程.將機器學(xué)習(xí)技術(shù)應(yīng)用在步態(tài)分析上的研究按應(yīng)用可以分為正常步態(tài)分析、病理步態(tài)分析、健康監(jiān)護等[82].表7是有關(guān)術(shù)后結(jié)果預(yù)測和臨床步態(tài)分析機器學(xué)習(xí)算法的相關(guān)研究總結(jié).
從以上研究可以看出,與之前兩個領(lǐng)域相比,機器學(xué)習(xí)技術(shù)在結(jié)果預(yù)測和臨床步態(tài)分析上的應(yīng)用處于較低的發(fā)展水平.在結(jié)果預(yù)測領(lǐng)域,主要集中在術(shù)后結(jié)果的預(yù)測,為患者選擇手術(shù)方案提供了支持.在臨床步態(tài)分析領(lǐng)域,強直性脊柱炎、頸椎病、腰椎間盤突出癥以及非特異性腰腿痛等疾病都會有支配神經(jīng)及下肢疼痛,從而對患者的步態(tài)產(chǎn)生影響,利用機器學(xué)習(xí)技術(shù)去找到它們之間的聯(lián)系并為醫(yī)生提供診斷依據(jù)是未來機器學(xué)習(xí)技術(shù)在臨床步態(tài)分析研究中的主要方向.
表7 術(shù)后結(jié)果預(yù)測和臨床步態(tài)分析機器學(xué)習(xí)算法的相關(guān)研究總結(jié)Table 7 Summary of related studies on machine learning algorithms for prediction of postoperative outcomes and clinical gait analysis
當(dāng)前,越來越多的研究已經(jīng)將機器學(xué)習(xí)中最新的技術(shù)應(yīng)用于脊柱疾病的臨床診斷,在對脊柱圖像進行分割和定位、輔助診斷、降低誤診率、減輕醫(yī)生的工作壓力等方面表現(xiàn)出了巨大潛力,將為臨床脊柱手術(shù)優(yōu)良的術(shù)前規(guī)劃以及術(shù)后康復(fù)評估提供重要的技術(shù)解決手段.
盡管機器學(xué)習(xí)技術(shù)如今已經(jīng)發(fā)展到了相當(dāng)高的水平,并且在脊柱疾病中的應(yīng)用也有很多,但在該領(lǐng)域還有諸多關(guān)鍵問題尚需深入探索,主要有:
1)機器學(xué)習(xí)算法方面,應(yīng)向多任務(wù)、多模態(tài)的方向發(fā)展;
2)數(shù)據(jù)集方面,應(yīng)建立一些具有公共標(biāo)準(zhǔn)的數(shù)據(jù)集;
3)數(shù)據(jù)收集方面,應(yīng)避免收集數(shù)據(jù)過程中出現(xiàn)主觀性問題;
4)應(yīng)用擴展方面,盡管機器學(xué)習(xí)技術(shù)在脊柱疾病的臨床診斷中已經(jīng)有很多的研究,但是一些方面仍未涉及.隨著機器學(xué)習(xí)技術(shù)的不斷發(fā)展以及在脊柱疾病臨床診斷中的深入研究,其在脊柱疾病中的應(yīng)用也會更加全面.