周璐 李光庚 孫燕 鄭巖 李宇航
摘要 通過回顧機(jī)器學(xué)習(xí)中的C4.5決策樹、隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)算法的原理與在中醫(yī)辨證研究中所取得的成果,創(chuàng)新設(shè)計(jì)出一種復(fù)合結(jié)構(gòu)的智能化辨證選方模型,并對(duì)模型進(jìn)行了實(shí)現(xiàn)與測(cè)試。結(jié)果表明該模型輸出結(jié)果的準(zhǔn)確性高于僅使用單一算法建立的辨證選方模型,這為進(jìn)一步與“方-證要素對(duì)應(yīng)”的組方原則相結(jié)合,建立適用于復(fù)雜病機(jī)的臨床診療輔助系統(tǒng)奠定了基礎(chǔ)。
關(guān)鍵詞 人工智能;機(jī)器學(xué)習(xí);方-證要素對(duì)應(yīng);辨證論治
Abstract Through a review of the C4.5 Decision Tree, Random Forest, Support Vector Machine and BP Neural Network algorithm and the obtained in the study of TCM syndrome differentiation, a compound structure of intelligent syndrome differentiation and formula selection model was designed. The model was implemented and tested. Results showed that the accuracy of the corresponding results was higher than that of the single algorithm, laying the foundation for the model which was suitable for the complex Pathogenesis of clinical diagnosis and treatment of auxiliary system.
Key Words Artificial Intelligence; Machine Learning; Correspondence between syndrome and formula factors; Syndrome differentiation and treatmen
中圖分類號(hào):R241;R242文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.3969/j.issn.1673-7202.2018.02.057
辨證論治是中醫(yī)的特色,機(jī)器學(xué)習(xí)是當(dāng)今人工智能領(lǐng)域的重要分支,將機(jī)器學(xué)習(xí)與中醫(yī)辨證論治進(jìn)行結(jié)合,建立智能化的辨證論治模型,可輔助臨床醫(yī)師進(jìn)行處方?jīng)Q策,為中醫(yī)復(fù)雜病機(jī)的辨證論治提供診療思路。因此,分析機(jī)器學(xué)習(xí)在中醫(yī)辨證研究中的應(yīng)用,探索智能化的辨證論治模型也是當(dāng)今智能時(shí)代具有挑戰(zhàn)意義的一項(xiàng)課題。
機(jī)器學(xué)習(xí)在Machine Learning[1]中的定義為“如果一個(gè)計(jì)算機(jī)程序針對(duì)某類任務(wù)T的用P衡量的性能根據(jù)經(jīng)驗(yàn)E來自我完善,那么我們稱這個(gè)計(jì)算機(jī)程序可從經(jīng)驗(yàn)E中學(xué)習(xí),針對(duì)某類任務(wù)T,他的性能用P來衡量”。我們通過回顧學(xué)者所用的C4.5決策樹算法、隨機(jī)森林算法、支持向量機(jī)算法、BP神經(jīng)網(wǎng)絡(luò)算法的原理與用于中醫(yī)辨證所取得的成果。創(chuàng)新設(shè)計(jì)出一種復(fù)合結(jié)構(gòu)的智能化辨證選方模型,相對(duì)于單一算法建立的模型,該模型可更準(zhǔn)確辨識(shí)出癥狀中所包含的證候,實(shí)現(xiàn)精準(zhǔn)的辨證選方。
1 機(jī)器學(xué)習(xí)算法應(yīng)用于中醫(yī)辨證研究的回顧
1.1 BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)
BP神經(jīng)網(wǎng)絡(luò)算法是基于反向傳播算法[2]而實(shí)現(xiàn),具有建立多分類模型的能力。該算法主要通過給定包含樣本類別與樣本特征的訓(xùn)練集合,自主建立多分類模型,具有較好的自學(xué)習(xí)與自組織能力。
這種算法被中醫(yī)較早應(yīng)用到辨證研究之中,如田禾和戴汝為[3]早在1990年用BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行中醫(yī)智能辨證的研究,開發(fā)了用于中醫(yī)兒科咳喘的辨證系統(tǒng)。目前使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行中醫(yī)辨證的研究仍是熱點(diǎn),如本課題組陳擎文[4]曾通過BP神經(jīng)網(wǎng)絡(luò)對(duì)《傷寒論》中的“方-證要素”進(jìn)行探討,初步構(gòu)建出基于《傷寒論》的方證對(duì)應(yīng)及“方-證要素對(duì)應(yīng)”的辨證論治模型。徐亮等[5]為探索挖掘名老中醫(yī)辨證經(jīng)驗(yàn)的新方法,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)684名老中醫(yī)的醫(yī)案構(gòu)建辨證模型,其中用669例醫(yī)案作為訓(xùn)練集,15例氣虛證醫(yī)案作為測(cè)試集,預(yù)測(cè)一致性為80%,證明了該方法的可行性。
1.2 C4.5決策樹(C4.5 Decision Tree)
C4.5決策樹算法[6]是一種可用于構(gòu)建樹形分類模型的決策樹算法,通過對(duì)給定的訓(xùn)練數(shù)據(jù)計(jì)算信息熵、信息增益率建立分類模型,并可提取出樹形的分類規(guī)則,實(shí)現(xiàn)對(duì)未知樣本的類別進(jìn)行可視化的分析與判斷。
這種算法出現(xiàn)于神經(jīng)網(wǎng)絡(luò)之后,被中醫(yī)較多的用于提取證候的診斷規(guī)則,如楊開明[7]將85例糖尿病患者結(jié)合C4.5決策樹算法建立了中醫(yī)辨證決策樹,提取出糖尿病的8種中醫(yī)證候分類規(guī)則。李治和李國(guó)琳[8]對(duì)447例AECOPD患者結(jié)合C4.5決策樹算法建立起AECOPD的中醫(yī)辨證分型決策樹模型,提取出痰熱郁肺、痰瘀阻肺、痰濁阻肺、外寒內(nèi)飲4種中醫(yī)證候的診斷規(guī)則。劉廣等運(yùn)用C4.5決策樹算法結(jié)合800例中醫(yī)胃炎病例建立了中醫(yī)胃炎辨證分類決策樹,并提取出胃炎的中醫(yī)證候分類規(guī)則。
1.3 支持向量機(jī)(Support Vector Machine)
支持向量機(jī)是由Cortes和Vapnik[9]提出的一種可用于二分類問題的機(jī)器學(xué)習(xí)算法。該算法通過運(yùn)用支持向量機(jī)的核函數(shù)等公式進(jìn)行一系列的計(jì)算,得出支持向量機(jī)的類別判定公式y(tǒng)=WTX+b,并結(jié)合支持向量機(jī)中劃分樣本類別的超平面,實(shí)現(xiàn)對(duì)樣本類別的劃分,建立分類模型。
本算法的出現(xiàn)略晚于決策樹,但其在中醫(yī)辨證研究中的應(yīng)用卻較為廣泛,如晏峻峰[10]用支持向量機(jī)算法結(jié)合“脾虛”與“陽(yáng)虛”的證素,構(gòu)建辨別“脾虛”與“陽(yáng)虛”的智能辨證模型。王階等[11]通過支持向量機(jī)算法從115例名中醫(yī)冠心病治療的醫(yī)案中提取出血瘀、痰濁、氣虛、陽(yáng)虛、陰虛、內(nèi)熱、血虛、氣滯8個(gè)證候要素的主要表現(xiàn)。此外,因?yàn)橹С窒蛄繖C(jī)算法構(gòu)造的辨證模型具有很好的準(zhǔn)確性,所以也常用于辨證模型之間的對(duì)照分析。如王華珍和胡雪琴[12]運(yùn)用隨機(jī)森林算法對(duì)2021條“內(nèi)生五邪”的病案建立辨證模型,并用支持向量機(jī)算法建立對(duì)照模型,分析辨證模型的準(zhǔn)確性。
1.4 隨機(jī)森林(Random Forest)
隨機(jī)森林算法是由Breiman[13]所提出的一種組合分類器算法,可構(gòu)造出多個(gè)樹形分類模型?!半S機(jī)”一詞在這里有兩層含義,第一層可以理解為在總訓(xùn)練樣本中隨機(jī)有放回的為森林中的每個(gè)決策樹選取與總訓(xùn)練樣本數(shù)相同的樣本,作為構(gòu)建決策樹的訓(xùn)練集合;第二層是對(duì)森林中的每個(gè)決策樹從所有樣本屬性中隨機(jī)不放回的選擇部分樣本屬性。隨機(jī)森林算法就是先通過樣本與屬性隨機(jī)選擇,再像生成決策樹模型一樣,生成由決策樹組成的“森林”。隨機(jī)森林通過采用森林內(nèi)決策樹投票的方式判定待測(cè)樣本類別,而不是某一決策樹的單一判斷,因此具有較高的準(zhǔn)確性。
與前3種算法相比,本算法出現(xiàn)較晚,在中醫(yī)辨證研究中可謂是一種較新技術(shù)手段。如2015年孫超[14]運(yùn)用隨機(jī)森林算法對(duì)糖尿病腎病建立辨證模型,并同時(shí)對(duì)癥狀的重要程度進(jìn)行了客觀化度量,為糖尿病腎病辨證的客觀化診斷提供了依據(jù)。2016年蔡曉路[15]運(yùn)用隨機(jī)森林對(duì)類風(fēng)濕性關(guān)節(jié)炎的證候建立辨證模型,并提取出對(duì)證候診斷有意義的重要癥狀,為研究證候的主證探索了一種有效方法。此外,隨機(jī)森林算法還被用于中醫(yī)望診的研究,如闞紅星等[16]用隨機(jī)森林算法對(duì)2型糖尿病中3種證候的舌象建立辨識(shí)模型,通過舌象圖,辨別2型糖尿病的中醫(yī)證候。
以上所述的機(jī)器學(xué)習(xí)算法在中醫(yī)辨證研究中有著廣泛的應(yīng)用,其共同點(diǎn)是均可建立智能化的中醫(yī)辨證模型,用于中醫(yī)智能辨證。但是,由于證候是一個(gè)多維多階的復(fù)雜巨系統(tǒng),面對(duì)的是高度非線性的研究對(duì)象[17],因此單一使用某一算法建立辨證模型,往往不能滿足需求。例如臨床醫(yī)師在病歷中記錄的癥狀往往對(duì)應(yīng)著多個(gè)證候的診斷,使癥狀與診斷結(jié)果間形成“多對(duì)多”的對(duì)應(yīng)關(guān)系。若要求辨證模型也做到在記錄下輸入的多個(gè)癥狀后,輸出多個(gè)證候診斷,形成輸入癥狀與輸出結(jié)果間“多對(duì)多”對(duì)應(yīng)的關(guān)系,辨證模型則需要放寬輸出的置信概率輸出多個(gè)辨證結(jié)果,以覆蓋可能對(duì)應(yīng)的多個(gè)證候。但這種方式難以把握置信概率的大小,容易輸出包含錯(cuò)誤的辨證結(jié)果,無法保證正確性,難以進(jìn)一步根據(jù)輸出的辨證結(jié)果選擇正確的方劑。因此探索可用于輸入癥狀與輸出方劑之間是“多對(duì)多”對(duì)應(yīng)關(guān)系的辨證選方模型,對(duì)建立用于臨床的中醫(yī)智能化輔助診療系統(tǒng)具有較好的發(fā)展?jié)摿Α?/p>
2 復(fù)合結(jié)構(gòu)的智能化辨證選方模型
以往因計(jì)算機(jī)運(yùn)算速度所限,多種算法的結(jié)合難以實(shí)現(xiàn),如今計(jì)算機(jī)運(yùn)算性能顯著提升,配置機(jī)器學(xué)習(xí)的運(yùn)行環(huán)境日趨便利,數(shù)據(jù)庫(kù)管理系統(tǒng)處理數(shù)據(jù)的功能不斷豐富,都為本復(fù)合設(shè)計(jì)提供了可行性。使本觀察組可以創(chuàng)新結(jié)合以上提及的多種算法設(shè)計(jì)一種復(fù)合結(jié)構(gòu)的智能化辨證選方模型。使模型可對(duì)辨證結(jié)果進(jìn)行驗(yàn)證,剔除錯(cuò)誤結(jié)果,提高模型在多方證對(duì)應(yīng)時(shí),輸出結(jié)果的準(zhǔn)確性,實(shí)現(xiàn)精準(zhǔn)的辨證選方。
2.1 模型總體結(jié)構(gòu)與實(shí)現(xiàn)精準(zhǔn)辨證選方的方式
復(fù)合結(jié)構(gòu)的智能化辨證選方模型是由辨證層級(jí)、驗(yàn)證層級(jí)、選方層級(jí)3個(gè)層級(jí)構(gòu)成,分別執(zhí)行辨證、驗(yàn)證、選方的任務(wù),在層級(jí)之間,前一個(gè)層級(jí)的輸出作為下一層級(jí)的輸入,使各層級(jí)構(gòu)成鏈?zhǔn)降臄?shù)據(jù)傳遞,形成如圖1所示結(jié)構(gòu)與運(yùn)行過程。使模型在輸入癥狀與輸出方劑之間存在“多對(duì)多”對(duì)應(yīng)的聯(lián)系時(shí),準(zhǔn)確輸出辨證選方的結(jié)果。
模型實(shí)現(xiàn)準(zhǔn)確辨證選方的方式主要有以下2點(diǎn):一是在辨證層級(jí)中構(gòu)建復(fù)合型智能辨證模型,例如本文使用隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)算法共同構(gòu)建辨證模型,以R代表隨機(jī)森林(Random Forest)算法構(gòu)建的辨證模型,S代表支持向量機(jī)(Support Vector Machine)算法構(gòu)建的辨證模型,B代表BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)算法構(gòu)建的辨證模型。這種多算法共同構(gòu)建的智能辨證模型,可簡(jiǎn)稱為RSB復(fù)合型智能辨證模型。該辨證模型可在給定輸出的辨證結(jié)果數(shù)量后,由R、S、B分別根據(jù)輸入癥狀從各自不同的角度給出辨證結(jié)果,為結(jié)果驗(yàn)證提供更多的可能。二是在驗(yàn)證層級(jí)中植入一種可對(duì)辨證結(jié)果進(jìn)行檢驗(yàn)的驗(yàn)證機(jī)制,通過驗(yàn)證機(jī)制對(duì)辨證層級(jí)輸出的辨證結(jié)果進(jìn)行驗(yàn)證,排除錯(cuò)誤結(jié)果,保留正確結(jié)果,并將正確的辨證結(jié)果送往選方層級(jí)實(shí)現(xiàn)精準(zhǔn)選方。
2.2 模型各層級(jí)的結(jié)構(gòu)
2.2.1 辨證層級(jí) 智能模型的第一層級(jí)是辨證層級(jí),模擬中醫(yī)以癥狀辨證候的過程,與驗(yàn)證層相連形成鏈?zhǔn)疥P(guān)系。該層級(jí)是由用于辨別證候的RSB復(fù)合智能辨證模型構(gòu)成,使用癥狀-證候數(shù)據(jù)(以癥狀作為特征,證候作為標(biāo)簽)訓(xùn)練。在模型訓(xùn)練完成后,通過設(shè)定輸出的結(jié)果數(shù)量N,輸出前N個(gè)概率最高的辨證結(jié)果。但這里得出的N個(gè)結(jié)果是以放寬置信概率為代價(jià),所以往往包含錯(cuò)誤結(jié)果。因此在該層級(jí)初步得出辨證結(jié)果后,還需再將辨證結(jié)果送入驗(yàn)證層級(jí)進(jìn)行驗(yàn)證,對(duì)錯(cuò)誤進(jìn)行排除。
2.2.2 驗(yàn)證層級(jí) 第二層級(jí)是驗(yàn)證層級(jí),運(yùn)用的是以證候推測(cè)癥狀的思想,因其上連辨證層級(jí),下連選方層級(jí),所以在3個(gè)層級(jí)的鏈?zhǔn)疥P(guān)系中扮演著承上啟下的核心角色。該層級(jí)由驗(yàn)證機(jī)制、RSB復(fù)合智能辨證模型組成。其中,驗(yàn)證機(jī)制的工作是根據(jù)辨證層級(jí)輸出的證候,從癥狀-證候訓(xùn)練集中逆向提取出相應(yīng)的癥狀,并在提取出相應(yīng)的癥狀之后,再將提取的癥狀分別與辨證層級(jí)輸入的癥狀取交集,依次提取出共有癥狀,模擬中醫(yī)以證候推測(cè)癥狀的過程。RSB復(fù)合智能辨證模型的工作則是根據(jù)依次提取出的共有癥狀輸出概率最高或滿足輸出條件的辨證結(jié)果,完成模型的再次驗(yàn)證,以此來避免因放寬置信概率導(dǎo)致的誤差。
2.2.3 選方層級(jí) 第三層級(jí)是選方層級(jí),與驗(yàn)證層級(jí)相連,主要是存儲(chǔ)證候與對(duì)應(yīng)方劑的數(shù)據(jù)庫(kù)。在該層級(jí)中,對(duì)相連的驗(yàn)證層級(jí)輸出的多個(gè)證候查詢出數(shù)據(jù)庫(kù)中對(duì)應(yīng)的證候與方劑,并且為保證方劑的使用安全在查詢出方劑后,檢索組合后的方劑是否包含“十八反十九畏”,若包含則用相近功效的中藥進(jìn)行代替,最終實(shí)現(xiàn)辨證選方。
2.3 模型驗(yàn)證
復(fù)合結(jié)構(gòu)的智能化辨證選方模型是通過辨證層級(jí)、驗(yàn)證層級(jí)、選方層級(jí)完成辨證選方,按照這種層級(jí)結(jié)構(gòu)的設(shè)計(jì),在辨證選方時(shí),輸出的結(jié)果應(yīng)有較高的準(zhǔn)確性。因此,我們對(duì)該模型進(jìn)行了實(shí)現(xiàn),并同基于單一算法建立的辨證選方模型,比較輸出結(jié)果的準(zhǔn)確性。
2.3.1 模型的構(gòu)建與測(cè)試數(shù)據(jù) 選擇第3版“十三五”教材《傷寒論講義》[18]中,辨治要點(diǎn)所記錄的主癥、病機(jī)、方藥等相關(guān)數(shù)據(jù),建立用于構(gòu)建辨證選方模型的訓(xùn)練集與選方數(shù)據(jù)庫(kù)。其中,主癥與病機(jī)數(shù)據(jù)作為訓(xùn)練集(主癥作為特征,病機(jī)作為類別,形成癥狀-病機(jī)訓(xùn)練集),用于實(shí)現(xiàn)模型的辨證功能。方藥數(shù)據(jù)則通過數(shù)據(jù)庫(kù)管理系統(tǒng)(使用的是MySQL數(shù)據(jù)庫(kù)管理系統(tǒng)),建立選方數(shù)據(jù)庫(kù),使模型可根據(jù)辨證結(jié)果查詢對(duì)應(yīng)的方劑,實(shí)現(xiàn)選方功能。對(duì)于模型的測(cè)試數(shù)據(jù),則是通過隨機(jī)抽取訓(xùn)練集合中的6個(gè)樣本產(chǎn)生,除此之外,如臨床中也存在著四逆散與半夏瀉心湯合用,旋覆代赭湯與四逆散合用,四逆湯與柴胡加龍骨牡蠣湯合用,大柴胡湯與芍藥甘草湯合用等多方證對(duì)應(yīng)的情況。因此本研究也使用以上合用方劑的主癥,與隨機(jī)抽取的6個(gè)樣本共同用于測(cè)試辨證選方模型輸出結(jié)果的準(zhǔn)確性。測(cè)試的示例與選方數(shù)據(jù)庫(kù)中的內(nèi)容如表1與表2所示。
2.3.2 建立復(fù)合結(jié)構(gòu)的智能化辨證選方模型 本模型使用Python編程語(yǔ)言結(jié)合scikit-learn,按照上述模型的各層級(jí)結(jié)構(gòu)進(jìn)行建立。其中,構(gòu)建RSB復(fù)合辨證模型所使用的訓(xùn)練集與選方層級(jí)所使用選方數(shù)據(jù)庫(kù),均如2.3.1中所述。對(duì)該模型驗(yàn)證層級(jí)中RSB復(fù)合模型所輸出的條件,限定為置信概率大于0.5,若未大于0.5但主癥多于3個(gè)則取概率最高的結(jié)果。
2.3.3 建立基于單一算法的辨證選方模型 該辨證選方模型同樣使用Python編程語(yǔ)言與scikit-learn構(gòu)建。其構(gòu)建方法是先調(diào)取scikit-learn中的隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)算法,并分別使用上述2.3.1中的訓(xùn)練集進(jìn)行訓(xùn)練,建立基于單一算法的辨證模型。再將構(gòu)建出的辨證模型結(jié)合2.3.1中的選方數(shù)據(jù)庫(kù),實(shí)現(xiàn)根據(jù)辨證結(jié)果查詢出對(duì)應(yīng)方劑的功能,完成辨證選方模型的建立?;趩我凰惴ǖ谋孀C選方模型的構(gòu)建流程如圖2所示。
2.3.4 模型的測(cè)試結(jié)果 基于單一算法構(gòu)建的辨證選方模型與復(fù)合結(jié)構(gòu)的智能化辨證選方模型的準(zhǔn)確性測(cè)試如表3所示。其中表中模型的測(cè)試內(nèi)容是方劑的主癥,用于測(cè)試不同方法構(gòu)建的模型能否根據(jù)輸入的方劑主癥正確輸出所對(duì)應(yīng)的病機(jī)與方劑,若輸出正確則以“√”表示,若輸出錯(cuò)誤則以“×”表示。結(jié)果顯示,所有的辨證選方模型均能根據(jù)葛根湯、桂枝加附子湯、大青龍湯、小陷胸湯、豬苓湯、柴胡加龍骨牡蠣湯的主癥,正確輸出所對(duì)應(yīng)的病機(jī)與方劑。但是對(duì)四逆散+半夏瀉心湯、旋覆代赭湯+四逆散、四逆湯+柴胡加龍骨牡蠣湯、大柴胡湯+芍藥甘草湯對(duì)應(yīng)的主癥,只有復(fù)合結(jié)構(gòu)的智能化辨證選方模型輸出的結(jié)果準(zhǔn)確。
2.3.5 結(jié)果分析 通過對(duì)辨證選方模型的準(zhǔn)確性比較,可看出單一算法構(gòu)建的辨證選方模型與具有復(fù)合結(jié)構(gòu)的辨證選方模型,在面對(duì)單一方劑的主癥時(shí),都有正確的結(jié)果。而一旦將2個(gè)方劑的主癥合并后一同輸入模型,則最終輸出的選用方劑也應(yīng)是2個(gè),即臨床中的合方。面對(duì)這種情況時(shí),復(fù)合結(jié)構(gòu)的智能化辨證選方模型的準(zhǔn)確性明顯高于單一算法構(gòu)建的辨證模型。這是因?yàn)閱我凰惴?gòu)建的辨證選方模型結(jié)構(gòu)單一,僅輸出概率最高的一個(gè)結(jié)果,這在輸入模型的癥狀僅對(duì)應(yīng)一個(gè)治療方劑時(shí),可保證準(zhǔn)確。但面對(duì)2個(gè)方劑的主癥合并后一同輸入模型時(shí),單一算法構(gòu)建的辨證選方模型在辨證階段仍只輸出一個(gè)結(jié)果。即使要其求輸出多個(gè)結(jié)果,由于結(jié)構(gòu)單一,模型也難以具體確定輸出多少結(jié)果或是確定輸出的概率,從而容易導(dǎo)致錯(cuò)誤的輸出結(jié)果,并且不能排除。因此單一算法構(gòu)建的辨證選方模型無法根據(jù)辨證結(jié)果從選方數(shù)據(jù)庫(kù)選擇正確的方劑。而復(fù)合結(jié)構(gòu)的智能化辨證模型通過RSB復(fù)合智能辨證模型與驗(yàn)證機(jī)制的結(jié)合則實(shí)現(xiàn)了對(duì)辨證結(jié)果的二次驗(yàn)證,保證了辨證結(jié)果的準(zhǔn)確。
3 展望
以上驗(yàn)證表明本創(chuàng)新模型可從多方證癥狀群中,精確提取對(duì)應(yīng)的方證,提高辨證選方的準(zhǔn)確性。但這仍然只是方證對(duì)應(yīng),若該模型能進(jìn)一步結(jié)合一種可以緊扣病機(jī)的組方原則,使模型從方證對(duì)應(yīng)的角度,難以找到適合的方劑時(shí),能以病機(jī)為導(dǎo)向,從現(xiàn)有方劑中選擇對(duì)病機(jī)起治療作用的最佳藥物組合,組建新方,則可擴(kuò)展模型的應(yīng)用范圍。
我們?cè)?009年提出了“方-證要素對(duì)應(yīng)”的組方原則[19],其中“方-證要素對(duì)應(yīng)”是指“方劑要素”與“證候要素”的對(duì)應(yīng),即方劑中的主要藥物組成與這些藥物所主治的病機(jī)單元對(duì)應(yīng),使藥物與病機(jī)之間形成靶向性的精確對(duì)應(yīng)關(guān)系。運(yùn)用“方-證要素對(duì)應(yīng)”的組方原則,可在面對(duì)復(fù)合病機(jī)(即多個(gè)病機(jī)的組合),難以直接找到恰好對(duì)應(yīng)的主治方劑時(shí),將復(fù)合病機(jī)拆分為“證候要素”,使用與其對(duì)應(yīng)的“方劑要素”進(jìn)行組方。
綜上所述,若本創(chuàng)新模型與“方-證要素對(duì)應(yīng)”的組方原則結(jié)合,使用“方劑要素”與“證候要素”數(shù)據(jù)構(gòu)建,則可建立出基于“方-正要素對(duì)應(yīng)”的智能化辨證組方模型。該模型將能在“方-證要素對(duì)應(yīng)”的基礎(chǔ)上,進(jìn)行智能組方,可用于輔助臨床醫(yī)生在病機(jī)比較復(fù)雜,方證對(duì)應(yīng)難以適用時(shí),從“方-證要素對(duì)應(yīng)”的角度出發(fā),緊扣病機(jī),組建新方。希望能夠利用人工智能技術(shù),為中醫(yī)復(fù)雜病機(jī)的“辨證論治”,提供新方法、新思路。
參考文獻(xiàn)
[1]Mitchell TM.機(jī)器學(xué)習(xí)[M].北京:機(jī)械工業(yè)出版社,2003:3.
[2]Williams D,Phillips G,Sekuler R.Hysteresis in the perception of motion direction as evidence for neural cooperativity[J].Nature,1986,324(6094):253-255.
[3]田禾,戴汝為.基于人工神經(jīng)元網(wǎng)絡(luò)的中醫(yī)專家系統(tǒng)外殼NNS[J].計(jì)算機(jī)學(xué)報(bào),1990,12(5):397-401.
[4]陳擎文.《傷寒論》的“方—證要素”對(duì)應(yīng)體系及其神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型的構(gòu)建[D].北京:北京中醫(yī)藥大學(xué),2011.
[5]徐亮,陳守強(qiáng),侯建輝,等.基于BP神經(jīng)網(wǎng)絡(luò)的中醫(yī)辨證模型構(gòu)建方法探討[J].世界中醫(yī)藥,2016,11(2):335-338.
[6]Quinlan JR.C4.5:Programs for machine learning[M].San Francisco:Morgan Kaufmann Publishers,1993.
[7]楊開明.糖尿病中醫(yī)臨床數(shù)據(jù)挖掘技術(shù)研究[D].昆明:昆明理工大學(xué),2013.
[8]李治,李國(guó)琳.AECOPD中醫(yī)辨證分型決策樹模型[J].長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2013,34(3):296-299.
[9]Cortes C,Vapnik V.Support-vector networks[J].Machine learning,1995,20(3):273-297.
[10]晏峻峰.基于數(shù)據(jù)挖掘技術(shù)的證素辨證方法研究[D].長(zhǎng)沙:湖南中醫(yī)藥大學(xué),2007.
[11]王階,吳榮,周雪忠.基于支持向量機(jī)的名老中醫(yī)治療冠心病證候要素研究[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2008,31(8):540-543,560.
[12]王華珍,胡雪琴.中醫(yī)“內(nèi)生五邪”的智能證型分類[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(6):156-160,163.
[13]Breiman L.Random forests[J].Machine learning,2001,45(1):5-32.
[14]孫超.糖尿病腎病中醫(yī)證候分類預(yù)測(cè)模型的構(gòu)建及其識(shí)別性能的評(píng)估[D].北京:北京中醫(yī)藥大學(xué),2015.
[15]蔡曉路.基于隨機(jī)森林的類風(fēng)濕關(guān)節(jié)炎證型判別模型研究[D].北京:北京中醫(yī)藥大學(xué),2016.
[16]闞紅星,張璐瑤,董昌武.一種2型糖尿病中醫(yī)證型的舌圖像識(shí)別方法[J].中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào),2016,35(6):658-664.
[17]王永炎,張志斌.再議完善辨證方法體系的幾個(gè)問題[J].天津中醫(yī)藥,2007,24(1):1-4.
[18]李賽美,李宇航.傷寒論講義[M].3版.北京:人民衛(wèi)生出版社,2016.
[19]李宇航.談“證候要素”與“方劑要素”[J].中華中醫(yī)藥雜志,2009,24(2):117-121.