潘玉穎,崔偉峰,馬笑凡,范軍銘
(河南省中醫(yī)藥研究院,河南 鄭州450004)
醫(yī)生診療疾病是一個嚴(yán)謹(jǐn)?shù)倪壿嬐评磉^程,從采集病史、診斷疾病到臨床治療、預(yù)測轉(zhuǎn)歸,醫(yī)生需要把所有信息在大腦中篩檢、融合、匯總、分析。因西醫(yī)診斷疾病標(biāo)準(zhǔn)清晰,“同病同方”,自20世紀(jì)開始已有不同疾病的醫(yī)學(xué)診療模型指導(dǎo)診斷治療。但與此相對的中醫(yī)診療,其智能化發(fā)展相對滯后,多數(shù)研究僅停留在名老中醫(yī)經(jīng)驗(yàn)的整理和數(shù)據(jù)分析,因此,構(gòu)建中醫(yī)人工智能診療模型,實(shí)現(xiàn)智能診療是中醫(yī)藥現(xiàn)代化發(fā)展的關(guān)鍵。
西醫(yī)應(yīng)用人工智能技術(shù)開發(fā)的智能診斷模型、專家系統(tǒng)已應(yīng)用于臨床,而中醫(yī)診療智能化的發(fā)展與臨床實(shí)用要求還有很大差距。
自1959年LEDLEY等首次應(yīng)用計算機(jī)輔助診斷的數(shù)學(xué)模型診斷出一組肺癌病例,計算機(jī)輔助診斷應(yīng)運(yùn)而生,如今人工智能技術(shù)在醫(yī)學(xué)診療領(lǐng)域的應(yīng)用日益廣泛[1]。日本三菱公司研制的“人工網(wǎng)膜基片”能快速精確地識別海量醫(yī)學(xué)圖像信息,其速度是傳統(tǒng)識別系統(tǒng)的數(shù)萬倍。人工智能在腫瘤性疾病和心臟病、糖尿病視網(wǎng)膜病變等疾病的臨床診斷中已廣泛應(yīng)用[2]。西醫(yī)智能診療系統(tǒng)已越來越多地應(yīng)用于臨床,反觀中醫(yī),比較深入的研究出現(xiàn)在20世紀(jì)90年代,研究也多集中在根據(jù)模糊判別模式模擬臨床經(jīng)驗(yàn)進(jìn)行中醫(yī)辨證[3-7]、采用協(xié)同分布式方法進(jìn)行中醫(yī)診斷[8-9]、廣泛采用神經(jīng)網(wǎng)絡(luò)模型建立中醫(yī)辨證系統(tǒng)[10-15]、應(yīng)用數(shù)據(jù)挖掘技術(shù)和決策樹方法進(jìn)行中醫(yī)證型分類[16-18]、采用基于信息熵的決策樹算法[19]等。但是這些研究都沒有系統(tǒng)引進(jìn)人工智能先進(jìn)的理論、方法和技術(shù),使研究內(nèi)容與臨床應(yīng)用相互分離,限制了中醫(yī)診斷思維機(jī)制的實(shí)現(xiàn)效果。
中醫(yī)診療智能化的主要難點(diǎn)在于中醫(yī)辨證論治的思維難以轉(zhuǎn)化為線性邏輯,中醫(yī)診療輸出信息多,高維度的數(shù)據(jù)難以計算分析。
目前國內(nèi)外有關(guān)中醫(yī)診斷智能方法與技術(shù)的研究開發(fā),主要是一些具體方法和技術(shù)的分散研究,其無法系統(tǒng)集成的原因主要有兩個方面。第一個方面是沒有解決中醫(yī)辨證論治思維方法中的形式化描述問題。中醫(yī)臨床診斷多是在許多模糊、非定性、獨(dú)立于生化指標(biāo)外的情況下進(jìn)行辨證論治,依托數(shù)理模板、經(jīng)典邏輯及其推理技術(shù)無法從根本上解決這一問題,成為中醫(yī)診斷智能化發(fā)展的瓶頸。第二個方面是中醫(yī)輸入輸出信息量巨大,高維度的信息阻礙計算效率。中醫(yī)證候因人而異,證型繁多,用藥隨癥加減沒有固定標(biāo)準(zhǔn),無法用簡單的符號算法代替。大量信息不經(jīng)降維處理難以計算分析,海量信息直接應(yīng)用于模型會造成系統(tǒng)崩潰。傳統(tǒng)的專家系統(tǒng)主要是采用符號計算方法構(gòu)建,系統(tǒng)規(guī)則一旦形成,難以更新,導(dǎo)致系統(tǒng)內(nèi)容不能適應(yīng)不斷變化的環(huán)境。因此,如何利用人工智能技術(shù),使之具有自學(xué)習(xí)、自適應(yīng)的功能,成為開發(fā)先進(jìn)智能中醫(yī)診斷系統(tǒng)的關(guān)鍵。中醫(yī)診療病歷數(shù)據(jù)的數(shù)字化、網(wǎng)絡(luò)化積累了海量的數(shù)據(jù)資料,這些數(shù)據(jù)資料的維數(shù)已經(jīng)對目前大多數(shù)據(jù)挖掘算法的效率造成了嚴(yán)重的阻礙,這種阻礙被稱為“維數(shù)災(zāi)難”[20],所以處理高維數(shù)據(jù)必須進(jìn)行降維。降維是一種將輸入空間的樣本線性或非線性地投影到低維空間,以求獲得一個關(guān)于原數(shù)據(jù)集的緊致的低維表示方法[21]。醫(yī)學(xué)研究中最常見的數(shù)據(jù)格式之一是矢量數(shù)據(jù),隨著醫(yī)學(xué)實(shí)驗(yàn)水平的發(fā)展,對個體的觀察指標(biāo)變得越來越多,描述的內(nèi)容也變得越來越豐富,數(shù)據(jù)集的維數(shù)也不斷增高。海量數(shù)據(jù)的降維是醫(yī)學(xué)大數(shù)據(jù)研究的基礎(chǔ)和關(guān)鍵。在醫(yī)學(xué)數(shù)據(jù)中降維方法的選擇應(yīng)用及開發(fā)新的有效的降維方法是本課題擬解決的關(guān)鍵問題。四診合參是中醫(yī)診療的核心,也是收集疾病信息的主要途徑。近年來,人機(jī)對話技術(shù)、面部自動識別技術(shù)、嗅覺傳感器技術(shù)與圖片處理技術(shù)的高速發(fā)展,為中醫(yī)四診信息的自動化采集識別、智能化處理分析提供了方法學(xué)上的支持。脈象儀記錄脈象信息和舌象儀記錄客觀舌象信息解決了中醫(yī)望診智能化信息的獲取問題。舌脈象的智能化、客觀化不僅是未來中醫(yī)互聯(lián)網(wǎng)醫(yī)療所需要的,更是中醫(yī)智能化診療所必需的。
名老中醫(yī)辨證施治、遣方用藥準(zhǔn)確靈活,拓制名老中醫(yī)診病思維是智能診療的核心,將最新的人工智能技術(shù)與中醫(yī)結(jié)合能夠高度模擬名老中醫(yī)的診療思維。
傳統(tǒng)中醫(yī)學(xué)是中華民族應(yīng)用千年的寶貴財富,名老中醫(yī)診療經(jīng)驗(yàn)是中醫(yī)理論、前人經(jīng)驗(yàn)與當(dāng)今臨床實(shí)踐的高度結(jié)合,是長期臨床實(shí)踐的積累,是中醫(yī)學(xué)術(shù)創(chuàng)新發(fā)展的源泉。將名老中醫(yī)的臨床經(jīng)驗(yàn)高效地保存?zhèn)鞒?成為中醫(yī)藥現(xiàn)代化發(fā)展的關(guān)鍵。傳統(tǒng)中醫(yī)診斷脫離現(xiàn)代病理檢測,具有經(jīng)驗(yàn)性、模糊性、不確定性等特點(diǎn),諸多非客觀指標(biāo)嚴(yán)重制約了中醫(yī)的發(fā)展和應(yīng)用。目前,中醫(yī)辨證診斷過程無法做到規(guī)范化、客觀化、定量化,如何將經(jīng)驗(yàn)性、模糊性的中醫(yī)辨證過程變的具有可計算性是中醫(yī)現(xiàn)代化研究的主要問題。中醫(yī)的精要在于辨證論治,以往根據(jù)經(jīng)驗(yàn)和文獻(xiàn)直接定性的方法難以得到客觀的辨證分型。不客觀的辨證分型使證候的命名及描述帶有很強(qiáng)的主觀性和隨意性,得出的結(jié)果就不能反映中醫(yī)診病的思路。目前關(guān)于中醫(yī)證候分類研究的方法繁多,但沒有一個某種單一技術(shù)模擬中醫(yī)證候辨證的應(yīng)用,因此借鑒先進(jìn)的人工智能技術(shù)和方法進(jìn)行中醫(yī)智能診療研究成為可能。在人工智能技術(shù)指導(dǎo)下模擬診療思維模型,這個模型包括了中醫(yī)望聞問切、生化指標(biāo)和處方用藥。用臨床病歷訓(xùn)練模型,調(diào)整隱含層各參數(shù),通過臨床自學(xué)習(xí)功能進(jìn)一步提高診療準(zhǔn)確性,這樣既避免了探索性研究的煩瑣,也最大程度保持與臨床實(shí)踐的一致性。
現(xiàn)代人工智能技術(shù)多種多樣,其中人工神經(jīng)網(wǎng)絡(luò)能夠模擬人類思維,具有自學(xué)習(xí)、自適應(yīng)等功能,成為人工智能領(lǐng)域的主流技術(shù)。其深度增強(qiáng)學(xué)習(xí)算法通過大樣本的訓(xùn)練和獎勵樣本的重復(fù)學(xué)習(xí)能夠較好地解決中醫(yī)診療的模糊性、高維度性、經(jīng)驗(yàn)性等問題。
中醫(yī)智能化診療是未來醫(yī)療發(fā)展的趨勢,目前中醫(yī)智能化診療的關(guān)鍵在于中醫(yī)診療的經(jīng)驗(yàn)性、不確定性、模糊性難以轉(zhuǎn)化為線性邏輯。隨著人工智能技術(shù)發(fā)展日益成熟,多種模型可模擬人腦進(jìn)行黑箱操作,處理非線性信息并可適應(yīng)學(xué)習(xí)。目前人工智能領(lǐng)域較先進(jìn)、應(yīng)用較廣泛的核心技術(shù)是深度神經(jīng)網(wǎng)絡(luò),并逐漸成為人工智能領(lǐng)域的主流技術(shù)。人工神經(jīng)網(wǎng)絡(luò)(ANN)是用來模擬腦神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能,是由大量處理單元經(jīng)廣泛互連而組成的人工網(wǎng)絡(luò)。ANN根據(jù)樣本進(jìn)行訓(xùn)練,訓(xùn)練時,樣本的輸入值傳給ANN的輸入層節(jié)點(diǎn),ANN接受這些輸入值并與權(quán)值進(jìn)行運(yùn)算,在輸出層節(jié)點(diǎn)產(chǎn)生輸出模式,若輸出模式與樣本的目標(biāo)模式有誤差,ANN對權(quán)值進(jìn)行調(diào)優(yōu),這樣的訓(xùn)練過程將迭代進(jìn)行許多次。后期通過應(yīng)用ANN能夠自動適應(yīng)輸入信息調(diào)整參數(shù),并從中學(xué)習(xí),具有自學(xué)習(xí)、自適應(yīng)和聯(lián)想記憶等功能。MLP算法即多層感知器,是一種前向結(jié)構(gòu)的ANN,映射一組輸入向量到一組輸出向量,是常見的ANN算法,它由一個輸入層、一個輸出層和一個或多個隱藏層組成。深度增強(qiáng)學(xué)習(xí)(DRL)是深度學(xué)習(xí)范疇的一個分支,近年來發(fā)展迅猛。DRL是實(shí)現(xiàn)從perception感知到action動作的端對端學(xué)習(xí)的一種全新的算法,是將深度學(xué)習(xí)與增強(qiáng)學(xué)習(xí)結(jié)合,從而解決計算機(jī)從感知到?jīng)Q策控制的問題,進(jìn)而實(shí)現(xiàn)通用人工智能。通用人工智能是要創(chuàng)造一種無須人工編程而自己學(xué)會解決各種問題的智能體,最終目標(biāo)是實(shí)現(xiàn)類人級別甚至超人級別的智能。DRL可類比人類認(rèn)知,輸入感知信息如視覺,然后通過深度神經(jīng)網(wǎng)絡(luò)直接輸出動作,中間沒有hand-crafted工作。DRL具備使機(jī)器實(shí)現(xiàn)完全自主學(xué)習(xí)的一種甚至多種技能的潛力。深度學(xué)習(xí)把原始數(shù)據(jù)通過一些簡單、非線性的模型轉(zhuǎn)變?yōu)楦邔哟?、更加抽象的表達(dá),其實(shí)質(zhì)是一種特征學(xué)習(xí)方法。深度學(xué)習(xí)擅長發(fā)現(xiàn)高維數(shù)據(jù)中的復(fù)雜結(jié)構(gòu),因此它被應(yīng)用于中醫(yī)證候診斷方面[22-23]。增強(qiáng)學(xué)習(xí)強(qiáng)調(diào)模型在與環(huán)境的交互中學(xué)習(xí),利用環(huán)境的評價性反饋信號修正行為、選擇策略,成為求解復(fù)雜決策問題的一種可行性手段[20,24]。2016年Google推出的AlphaGo使計算機(jī)的圍棋水平達(dá)到甚至超過了頂尖職業(yè)棋手的水平,引起了世界性的轟動。AlphaGo的核心在于使用了DRL的最新算法,使計算機(jī)能夠通過自對弈的方式不斷提升棋力。將DRL應(yīng)用到中醫(yī)智能化治療模型,將會為解決中醫(yī)診療的經(jīng)驗(yàn)性、不確定性、模糊性等問題帶來重大突破,將克服傳統(tǒng)智能技術(shù)的不足,為中醫(yī)智能診療系統(tǒng)的研發(fā)開辟新思路、新途徑。