王海洲, 王 冠
(解放軍北部戰(zhàn)區(qū)總醫(yī)院 骨科, 遼寧 沈陽 110003)
深度學(xué)習(xí)(Deep Learning)概念于2006年被提出,最初源于人工神經(jīng)網(wǎng)絡(luò)的相關(guān)研究,其后經(jīng)研究者不斷努力和持續(xù)完善,已發(fā)展成機(jī)器學(xué)習(xí)領(lǐng)域具有良好發(fā)展前景的分支學(xué)科[1].可以認(rèn)為,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,是機(jī)器學(xué)習(xí)基礎(chǔ)上對數(shù)據(jù)進(jìn)行表征學(xué)習(xí)以獲得屬性類別或特征的方法,其動(dòng)機(jī)是模擬人腦分析和學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),通過解釋數(shù)據(jù)(例如圖像、聲音和文本等)獲得內(nèi)在規(guī)律和理論,進(jìn)而加以改進(jìn)并提升自身能力.
深度學(xué)習(xí)技術(shù)現(xiàn)已應(yīng)用于多個(gè)領(lǐng)域,并逐漸由靜態(tài)圖像處理、文字信息補(bǔ)全等早期簡單應(yīng)用向視頻、音頻資料處理等高維應(yīng)用發(fā)展,從不完整信息補(bǔ)全向創(chuàng)造性工作轉(zhuǎn)變.在大數(shù)據(jù)的支撐下,人工智能可通過對以往數(shù)據(jù)的分析迅速提煉低層數(shù)據(jù)的普遍規(guī)律和以往處理方法,并在此基礎(chǔ)上消化、融合,掌握處理原則,進(jìn)而按照原則創(chuàng)造新作品.淺層次的創(chuàng)造性工作包括繪畫、寫作、語音輸出、作曲等,高層次的工作則可以包括智能駕駛、局勢判斷并制定策略等.2016年3月,基于深度學(xué)習(xí),谷歌DeepMind公司開發(fā)的圍棋人工智能機(jī)器人AlphaGo與世界職業(yè)冠軍棋手李世石九段對戰(zhàn),4比1獲勝.之后,它在中國棋類網(wǎng)站注冊帳號(hào)----Master(“大師”),與數(shù)十位中日韓圍棋高手進(jìn)行快棋對決,連勝60局;在中國烏鎮(zhèn)圍棋峰會(huì)上,3比0戰(zhàn)勝當(dāng)時(shí)世界排名第一的中國棋手柯潔.AlphaGo的棋力被圍棋界公認(rèn)已經(jīng)超過人類職業(yè)圍棋頂尖水平.
深度學(xué)習(xí)通過組合低層次特征形成高層次的抽象屬性類別或特征,因此,數(shù)據(jù)的處理是學(xué)習(xí)質(zhì)量的關(guān)鍵,而海量數(shù)據(jù)處理本身就是計(jì)算機(jī)特有的長處.近年來,數(shù)據(jù)和網(wǎng)絡(luò)技術(shù)的進(jìn)展,可獲取的數(shù)據(jù)呈幾何級(jí)數(shù)增長,為計(jì)算機(jī)深度學(xué)習(xí)創(chuàng)造了條件.人工智能棋手戰(zhàn)勝人類圍棋頂級(jí)選手這一事例,可視為深度學(xué)習(xí)技術(shù)的卓越成果.
1986年,多倫多大學(xué)教授、機(jī)器學(xué)習(xí)泰斗、神經(jīng)網(wǎng)絡(luò)之父----Geoffrey Hinton 發(fā)明了適用于多層感知器(MLP)的BP(backpropagation)算法,并采用Sigmoid進(jìn)行非線性映射,有效解決了非線性分類和學(xué)習(xí)的問題.但是在1991年,BP算法被指出存在梯度消失問題,該問題直接阻礙了深度學(xué)習(xí)的進(jìn)一步發(fā)展.此外,20世紀(jì)90年代中期,支持向量機(jī)(SVM)算法誕生,各種淺層機(jī)器學(xué)習(xí)模型被提出.SVM是一種有監(jiān)督的學(xué)習(xí)模型,應(yīng)用于模式識(shí)別、分類及回歸分析等.支持向量機(jī)以統(tǒng)計(jì)學(xué)為基礎(chǔ),與神經(jīng)網(wǎng)絡(luò)有明顯的差異.支持向量機(jī)等算法的提出阻礙了深度學(xué)習(xí)的發(fā)展.
為此,Geoffrey Hinton和他的學(xué)生2006年在Science上發(fā)表文章,提出了深層網(wǎng)絡(luò)訓(xùn)練中梯度消失問題的解決方案:無監(jiān)督預(yù)訓(xùn)練對權(quán)值進(jìn)行初始化+有監(jiān)督訓(xùn)練微調(diào).在深度學(xué)習(xí)研究方面,美國的斯坦福大學(xué)、紐約大學(xué),加拿大的蒙特利爾大學(xué)等都給予了極大的關(guān)注,使得深度學(xué)習(xí)在學(xué)術(shù)界和工業(yè)界掀起浪潮.
2011年,能夠有效抑制梯度消失問題的ReLU激活函數(shù)被提出.此后,微軟在語音識(shí)別上首次應(yīng)用DL,取得了重大突破.世界頂尖的語音識(shí)別研究人員們采用DNN技術(shù),將語音識(shí)別錯(cuò)誤率降低了20%~30%,這是十多年來語音識(shí)別領(lǐng)域最大的進(jìn)展.2012年,DNN技術(shù)在圖像識(shí)別領(lǐng)域又取得了驚人的成就,使ImageNet評(píng)測的錯(cuò)誤率從26%降低到15%.同年,DNN還被應(yīng)用于制藥公司的DrugeActivity預(yù)測,并獲得世界最好成績.
幾乎與此同時(shí),為了證明深度學(xué)習(xí)的潛力,Hinton課題組于2012年首度參加ImageNet圖像識(shí)別比賽,構(gòu)建的CNN網(wǎng)絡(luò)AlexNet奪得冠軍,進(jìn)而吸引了眾多研究者的注意.接著,伴隨DL的網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練方法、GPU硬件的不斷進(jìn)步,深度學(xué)習(xí)也在其他領(lǐng)域不斷地展開.
深度學(xué)習(xí)被用于解決許多大數(shù)據(jù)問題,如計(jì)算機(jī)視覺/語音識(shí)別和自然語言處理[1].在醫(yī)療領(lǐng)域,基于深度學(xué)習(xí)的人工智能技術(shù)也在逐漸融入臨床.目前,其應(yīng)用范圍較廣的是醫(yī)學(xué)影像的自動(dòng)分析和輔助診斷[2],如肺結(jié)節(jié)良惡性分類研究、乳腺病灶良惡性鑒別等[3];在肌肉骨骼系統(tǒng),對骨骼、軟骨等結(jié)構(gòu)的分析也有相關(guān)嘗試[4];通過對多種檢查手段的聯(lián)合分析,可提高診斷的準(zhǔn)確性[5];甚至通過對心電圖、MRI的分析,可完成心律失常、認(rèn)知障礙等內(nèi)科功能性疾病的診斷[6-7].
深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)中一種對數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的算法,它的觀測值可以用多種方式來表示,而使用某些特定的表示方法更容易從實(shí)例中實(shí)現(xiàn)學(xué)習(xí)任務(wù),例如對于一幅圖像----人臉或面部表情的識(shí)別,采納其每個(gè)像素強(qiáng)度值的向量,或者更抽象地表示成一系列邊、特定形狀的區(qū)域等.深度學(xué)習(xí)的優(yōu)勢即在于,它是利用非監(jiān)督式或半監(jiān)督式的特征學(xué)習(xí)和分層特征提取的高效算法替代傳統(tǒng)手工對特征的獲取.
特征的提取非常關(guān)鍵,從某種程度上說比算法還重要.比如,在骨科臨床中對一些患者的數(shù)據(jù)分類,結(jié)果若是想要得到骨骼的結(jié)構(gòu),如果提取的特征是肌肉,那么不管采用何種分類算法,效果都不會(huì)好;如果提取的特征是骨骼的長短,盡管還是會(huì)有錯(cuò)誤,但與肌肉相比會(huì)好很多;而如果提取的是一個(gè)超強(qiáng)的特征,比如骨細(xì)胞染色體,則分類基本就不會(huì)錯(cuò)了.也就是說,提取什么特征能最準(zhǔn)確地匹配分類算法,這需要具有豐富臨床經(jīng)驗(yàn)的醫(yī)師和人工智能專家共同去設(shè)計(jì).
以骨科脊柱側(cè)彎支具制作為例.脊柱側(cè)彎的物理矯形是非常復(fù)雜的體系,針對側(cè)彎脊柱的三維矯正需要關(guān)注于多個(gè)參數(shù)的改善,任何只關(guān)注單一參數(shù)或個(gè)別幾個(gè)參數(shù)的矯形都難獲取理想的三維矯形效果. 傳統(tǒng)的方法是將正常人體的X光或CT透視片(如圖1、圖2)與患者進(jìn)行比對,使其對自己的病癥具有清晰的認(rèn)識(shí),再利用人工石膏模型制作矯正器.
圖1 人體正位與側(cè)位透視效果
圖2正常脊柱結(jié)構(gòu)透視
Fig.2Perspectiveofnormalspinestructure
現(xiàn)階段除傳統(tǒng)的影像學(xué)評(píng)估以外,通過多種設(shè)備聯(lián)合使用,全面評(píng)估患者,以獲取全面客觀的脊柱側(cè)彎實(shí)際數(shù)據(jù),進(jìn)而提升脊柱側(cè)彎病人物理矯形的三維矯形效果,已在臨床測試中得到驗(yàn)證.這就是將傳統(tǒng)生產(chǎn)工藝中的取模、修模兩個(gè)核心技術(shù)環(huán)節(jié)升級(jí)為3D技術(shù)代替手工, 即將粗略的修型工藝升級(jí)為精準(zhǔn)矯形,加之不斷的細(xì)節(jié)關(guān)注,改進(jìn)和增強(qiáng)矯形效果,提升產(chǎn)品品質(zhì)(如圖3).本研究選取2位脊柱側(cè)彎患者,在深度學(xué)習(xí)的人工智能技術(shù)幫助下,他們的矯正效果非常理想.其矯正前后的X光片如圖4所示.
脊柱側(cè)彎矯正的力學(xué)原則,是用三點(diǎn)矯正原則在三個(gè)面上加以矯正,即在額狀面最高椎上施以主要矯正力,并在對側(cè)上端、下端施以反作用力達(dá)到矯正側(cè)彎的目的.此原則需要注意在側(cè)彎嚴(yán)重的一側(cè)盡可能尋找杠桿臂較長的反作用力,否則很難達(dá)到矯正效果.隨著矯正要求精度的提高,需要的數(shù)據(jù)量越來越大,以傳統(tǒng)人工方法獲取這些數(shù)據(jù)變得越來越困難.
圖3 3D脊柱側(cè)彎矯正器制作Fig.3 Manufacture of 3D scoliosis orthosis
圖4側(cè)彎脊柱矯正前后Fig.4 Before and after correction of scoliosis(a)—病例1; (b)—病例2.
而發(fā)展了的深度學(xué)習(xí)中,非端到端的數(shù)據(jù)輸入端發(fā)出的不是直接的原始數(shù)據(jù),而是在原始數(shù)據(jù)中提取的特征,為解決這一問題帶來了希望.
盡管深度學(xué)習(xí)技術(shù)已取得很多進(jìn)展,但其持續(xù)發(fā)展仍面臨較多問題,尤其是在醫(yī)療領(lǐng)域,尚有很多需解決的實(shí)際問題.一些著名期刊比如Science、NEJM等,在頻頻發(fā)出關(guān)于人工智能和深度學(xué)習(xí)的研究和社論,有的報(bào)告新成果,有的談未來談希望,也有的提出“期望值不要太高”的警示.
(1) 深度學(xué)習(xí)的前提是大數(shù)據(jù)的積累,數(shù)據(jù)是其“食物”.深度學(xué)習(xí)系統(tǒng)要吞下足夠的數(shù)據(jù),直到它發(fā)現(xiàn)數(shù)據(jù)中的模式,或者說規(guī)律,才能輸出有意義的結(jié)果.它的食物來源有可能是專門設(shè)計(jì)課題,招募大量受試者,生成新的數(shù)據(jù),也有可能是整合好幾個(gè)已發(fā)表的研究數(shù)據(jù),還可能利用日常真實(shí)的醫(yī)療活動(dòng)中產(chǎn)生的數(shù)據(jù),醫(yī)生每天寫的病歷都會(huì)成為它的“食物”.而醫(yī)療領(lǐng)域的數(shù)據(jù)積累一直是個(gè)難題,患者的依從性往往存在很大變數(shù),尤其是治療后的隨訪,很容易出現(xiàn)失訪或數(shù)據(jù)不準(zhǔn)確的情況.如何能便捷有效地確保數(shù)據(jù)準(zhǔn)確、快速、全面地獲取是亟待解決的問題.
曾聽說國內(nèi)有企業(yè)在跟醫(yī)院對接,獲取電子病歷數(shù)據(jù)進(jìn)行分析,但暫時(shí)沒有聽到有成果匯報(bào)的消息.也許最大的障礙就是它所使用的數(shù)據(jù)是否恰當(dāng),以及它們的質(zhì)量如何.如果在訓(xùn)練過程中使用了不完整、不恰當(dāng)、有偏倚、不穩(wěn)定的數(shù)據(jù),甚至錯(cuò)誤的數(shù)據(jù),那么最好的結(jié)果可能是做出來的分析毫無意義,最糟的則可能導(dǎo)致誤導(dǎo)性甚至有害的分析結(jié)果.什么樣的數(shù)據(jù)才是“正確”的數(shù)據(jù),多少才算足夠,獲取數(shù)據(jù)的成本多大,又該怎樣檢測、理解數(shù)據(jù)中可能存在的偏倚或錯(cuò)誤,以及那些關(guān)鍵但又“不可量化”的信息(包括社會(huì)與文化因素等)怎么整合,都是面臨的嚴(yán)峻問題.
當(dāng)然類似的許多問題,也廣泛存在于常規(guī)醫(yī)學(xué)研究中.深度學(xué)習(xí)中更為突出的問題是:怎樣驗(yàn)證它的新的發(fā)現(xiàn);與“最優(yōu)秀的”醫(yī)生比較,還是另設(shè)計(jì)實(shí)驗(yàn);如果人們無法理解它得出結(jié)果的機(jī)制,那怎樣能將它的發(fā)現(xiàn)轉(zhuǎn)化到臨床實(shí)踐中;甚至,怎么才能信任它.還有倫理和法律上的問題沒討論清楚,即出錯(cuò)了誰負(fù)責(zé),怎樣制定有效的質(zhì)控方案,等等.
再者,能從自變量預(yù)測結(jié)果,卻沒能鑒定有實(shí)際意義的原因(有相關(guān)性不等于有因果關(guān)系),也就無法采取有針對性的行動(dòng).目前機(jī)器學(xué)習(xí)還沒法回答疾病是如何、為什么產(chǎn)生的.Science雜志近期發(fā)表的一篇報(bào)道,介紹各路科學(xué)家如何解開AI的黑箱,理解它的“思維”,以及怎樣克服數(shù)據(jù)本身缺陷的問題,這也許會(huì)給問題的解決帶來希望.
(2) 人工智能在醫(yī)療領(lǐng)域的定位仍是敏感問題,患者的生命權(quán)和健康權(quán)是至關(guān)重要的,在技術(shù)進(jìn)步到何種情況下可以完全信賴其診斷或依賴其進(jìn)行治療是需要審慎、全面考量的.
(3) 臨床治療是復(fù)雜的整體思維過程,對疾病的診斷和治療是整體診療過程的重要部分,但不是全部,患者的一般情況、依從性、經(jīng)濟(jì)水平、家庭承受能力等均是決定治療方式的重要因素,以往,這部分判斷可由作為理性人的醫(yī)師完成,人工智能是否能勝任此工作尚存疑問.
通過對深度學(xué)習(xí)概念提出及發(fā)展?fàn)顩r的梳理,目的是研究其在醫(yī)療應(yīng)用中的優(yōu)勢與存在的問題.目前,還處于上升發(fā)展階段的深度學(xué)習(xí),不論是在理論還是在實(shí)踐方面,都還存在諸多問題需要去解決.隨著“大數(shù)據(jù)”時(shí)代的來臨,以及計(jì)算資源、人工智能技術(shù)的大幅度提升,新模型、新理論的驗(yàn)證周期將大大縮短,這一切都必然在很大程度上改變世界,不僅僅是醫(yī)療,還有一切涉及人類發(fā)展的領(lǐng)域.
任何事物都有兩面性,未來無法預(yù)知,但不管怎樣,都應(yīng)該抱著樂觀的態(tài)度迎接這個(gè)第三次工業(yè)革命.基于深度學(xué)習(xí)的人工智能技術(shù)已逐漸融入醫(yī)療臨床工作,但仍需解決較多問題,這些問題的妥善解決必將使全社會(huì)的醫(yī)療水平大大進(jìn)步,使廣大患者受益.