宋 佳,王至婉
(1. 河南中醫(yī)藥大學第一臨床醫(yī)學院 鄭州 450000;2. 河南中醫(yī)藥大學第一附屬醫(yī)院 鄭州 450000)
隱結(jié)構(gòu)模型是由張連文教授在2006 年首次提出[1],主要用于中醫(yī)研究的一種分析方法,其基本的分析過程是對臨床無監(jiān)督數(shù)據(jù)進行多維聚類劃分,是一種特殊的聚類分析方法[2]。模型中包括顯變量和隱變量,顯變量是肉眼可見的直觀變量(癥狀、體征、用藥等),隱變量是在分析過程中引入的新變量,解釋了對顯變量的聚類劃分[3]。隱結(jié)構(gòu)模型是通過存在聯(lián)系的顯變量來探尋引起這種關聯(lián)性的隱變量,中醫(yī)則是通過望、聞、問、切收集到的顯性知識來判斷出可解釋此種關聯(lián)的證候等隱性知識,兩者的基本思想是一致的[4]。
中醫(yī)的規(guī)范化、標準化是一直以來中醫(yī)研究中的重點,也是中醫(yī)現(xiàn)代化發(fā)展的時勢所需,隨著多學科的不斷發(fā)展,數(shù)據(jù)挖掘方法在中醫(yī)研究中的應用日益廣泛。近年來的研究成果證明了隱結(jié)構(gòu)模型在中醫(yī)研究中的適用性,將中醫(yī)理論的復雜性、模糊性轉(zhuǎn)變?yōu)榭山忉尩牧炕笜?。因此,深入探討隱結(jié)構(gòu)模型在中醫(yī)研究中的應用可科學揭示中醫(yī)臨床辨證論治的實質(zhì)及規(guī)律,為臨床辨證、用藥提供重要的客觀依據(jù),促進中醫(yī)的規(guī)范化、標準化發(fā)展。
隱結(jié)構(gòu)模型的顯變量來源于中醫(yī)臨床中收集的無監(jiān)督數(shù)據(jù),以往的研究中主要研究的是臨床癥狀數(shù)據(jù)和用藥數(shù)據(jù)。
癥狀數(shù)據(jù)包括從臨床收集到的癥狀以及體征信息。中醫(yī)辨證論治,是醫(yī)生通過四診收集臨床癥狀、體征信息,然后進行整合分析,最終判斷出疾病的具體證型及其病因病機。張連文[5]教授將隱結(jié)構(gòu)分析方法首次應用于腎虛數(shù)據(jù)的分析,構(gòu)建了腎虛癥狀數(shù)據(jù)模型,得出的模型與中醫(yī)理論相符,驗證了隱結(jié)構(gòu)模型的適用性。近年來,基于癥狀數(shù)據(jù)的隱結(jié)構(gòu)模型多被用于中醫(yī)證候研究、證素研究以及輔助診療系統(tǒng)的提出,為中醫(yī)臨床辨證提供了重要依據(jù),提高了中醫(yī)臨床辨證的準確性,促進了中醫(yī)證候研究的規(guī)范化發(fā)展。
1.1.1 證候研究
基于癥狀數(shù)據(jù)的隱結(jié)構(gòu)模型在證候研究中的應用,是從病證結(jié)合的角度出發(fā)以癥測證,通過對癥狀信息的聚類劃分提取證候[6]。申鑫惠[7]等歸納整理糖尿病醫(yī)案,篩選出100余個臨床癥狀及舌像、脈象顯變量數(shù)據(jù),構(gòu)建了糖尿病癥狀數(shù)據(jù)隱結(jié)構(gòu)模型,分析得出其證候主要有胃熱熾盛、痰熱互結(jié)、腎陽衰微證。馮貞貞[8]等篩選出公開發(fā)表的新冠肺炎中醫(yī)診療醫(yī)案中出現(xiàn)頻次較高的癥狀,構(gòu)建隱結(jié)構(gòu)模型,發(fā)現(xiàn)了新冠肺炎主要有邪熱犯肺證等7 個主要證候,為新冠肺炎的中醫(yī)臨床辨證提供了重要依據(jù)。余國君[9]采集500 例氣血辨證病例,篩選出112 個癥狀、脈象顯變量構(gòu)建隱結(jié)構(gòu)模型,得出以氣虛、血虛為主的九種證候,能更好的輔助心內(nèi)科的臨床治療。陳麗平[10]等以名老中醫(yī)慢性支氣管炎醫(yī)案為數(shù)據(jù)庫,構(gòu)建癥狀隱結(jié)構(gòu)模型,分析得出10種常見證型,新發(fā)現(xiàn)了痰瘀互阻、肺胃熱勝、脾氣虛3個證型,為臨床辨證治療慢支提供了有力證據(jù)。
隱結(jié)構(gòu)模型在基于癥狀數(shù)據(jù)的證候研究中應用最為廣泛,其優(yōu)勢在于隱結(jié)構(gòu)模型屬于多維聚類,分析過程中每個癥狀可被劃分到多個證類中,與中醫(yī)多維辨證思想過程相一致。且證類的詮釋是基于癥狀間的互信息,而非癥狀出現(xiàn)的頻率,因此可保留具有特殊診斷意義的癥狀數(shù)據(jù)。其由癥到證的分析過程不受人為主觀因素影響,因此其分析結(jié)果較傳統(tǒng)中醫(yī)內(nèi)心辨證具有較強的客觀性,可為中醫(yī)臨床辨證分型提供客觀依據(jù),提高臨床辨證的客觀性。
1.1.2 證素研究
證素即證候要素,是證候的基本單位[11]?;诎Y狀數(shù)據(jù)的隱結(jié)構(gòu)模型在證素研究中的應用,亦是從病證結(jié)合的角度出發(fā),通過對癥狀信息的聚類劃分提取證候要素[6]。近年來多用于研究疾病的病性及病位證素的分布,如徐雯潔等[12]以尋常型銀屑病患者的癥狀信息建立隱結(jié)構(gòu)模型,分析得出其病性證素及病位證素,且認為相較其他分析方法更具客觀性。何偉等[13]建立高甘油三酯患者癥狀數(shù)據(jù)庫,以隱結(jié)構(gòu)模型分析得出其主要證候要素有血瘀、血熱、氣虛、氣滯、陽虛、陰虛等,證候要素靶位有心、肝、腎等,量化了癥狀與證候要素間的關聯(lián)程度。何偉等[14]收集血脂異常患者癥狀信息,建立隱結(jié)構(gòu)模型分析得出高膽固醇血癥的主要證候要素,并量化了證候及病機變化的輕重程度等級,驗證了隱結(jié)構(gòu)模型對證素評價的適用性及優(yōu)勢性。徐雯潔等[15]建立慢阻肺穩(wěn)定期患者癥狀數(shù)據(jù)庫,建立隱結(jié)構(gòu)模型分析得出慢阻肺穩(wěn)定期的常見病位證素為脾、肺、心、胃,病性證素有陽虛、陰虛、氣虛、痰濕、血瘀等,為慢阻肺的臨床辨證提供了客觀依據(jù)。陳麗平等[16]等從現(xiàn)代名老中醫(yī)診治慢支的醫(yī)案中篩選高頻癥狀,建立隱結(jié)構(gòu)癥狀數(shù)據(jù)模型,分析其證素分布規(guī)律得出其病位主要分布于心、肝、脾、肺、腎、胃,病因主要有風寒、風熱、痰濕、痰熱、氣虛、陽虛、陰虛、血瘀、燥邪等。
證素的提出是為了簡化中醫(yī)辨證體系[17],證素是組成證候的最小單位,其研究的關鍵在于對癥狀、體征的辨識[18]。隱結(jié)構(gòu)模型在證素研究中的應用直觀地顯示了癥狀數(shù)據(jù)與證素之間的關系,并且分析得出的互信息曲線圖及隱類概率分布表量化了癥狀、體征等數(shù)據(jù)對證素的貢獻度,以此來完成對癥狀、體征數(shù)據(jù)的辨識。因此隱結(jié)構(gòu)模型在證素研究方面的應用將有助于建立證素的辨識規(guī)則,簡化中醫(yī)辨證過程的復雜性,進一步提高臨床辨證的準確性。
1.1.3 中醫(yī)輔助診療系統(tǒng)
中醫(yī)學是我國的國粹,但因其復雜的理論知識,近百年來一直被認為不符合現(xiàn)代科學標準,人工智能在中醫(yī)學領域的應用打開了中醫(yī)走上現(xiàn)代化的大門。20世紀90年代至今[19],是人工智能在中醫(yī)診療領域中的深入發(fā)展階段,尤其是在黨的十九大中明確提出要傳承發(fā)展中醫(yī)藥事業(yè)后,中醫(yī)輔助診療系統(tǒng)成為學術界及應用領域界的研究熱點。如林慶等[20]應用中醫(yī)輔助診療系統(tǒng)為社區(qū)人員建立中醫(yī)信息健康檔案,對每個人進行了健康評估并提供了日常的飲食、運動、保健指導。趙勝堂等[21]將中醫(yī)診療技術與西醫(yī)診療技術相結(jié)合,在中醫(yī)體質(zhì)多維化及云計算信息化的基礎上,對人群進行中醫(yī)體質(zhì)與耳鼻喉相關疾病的綜合評估,根據(jù)評估水平進行相關的健康指導。
目前輔助診療系統(tǒng)的應用主要側(cè)重于輔助臨床大夫提高自身業(yè)務水平,陳曦[22]等基于隱結(jié)構(gòu)模型在中醫(yī)辨證思維中的應用,設計出了一個中醫(yī)輔助診療系統(tǒng)的思路,該過程中用戶只需根據(jù)自身情況選擇相應的癥狀,系統(tǒng)可自行判斷出病名及證型,并給出相應的治療建議。該設想的提出將輔助診療系統(tǒng)的應用回歸到群眾,為百姓提供專業(yè)的中醫(yī)知識,幫助大眾進行自我中醫(yī)診斷,實現(xiàn)疾病的預防和自我調(diào)理,也初步打開了隱結(jié)構(gòu)模型在人工智能應用方面的大門,促進了中醫(yī)的現(xiàn)代化發(fā)展。
用藥數(shù)據(jù)是指臨床單味用藥信息。中醫(yī)臨床辨證施治,是醫(yī)生根據(jù)辨證后的結(jié)果確定相應的中藥方劑進行治療。中醫(yī)臨床辨證復雜,單味藥的應用在臨床上極其少見,其主要的用藥形式是單味藥物間的配伍應用[23]。由用藥數(shù)據(jù)構(gòu)成的隱結(jié)構(gòu)模型可直觀地顯示藥物間的關系,揭示不同藥物間的隱藏規(guī)律。因此,近年來被許多醫(yī)家用于證候研究、名老中醫(yī)用藥規(guī)律的挖掘,提高了臨床用藥的準確性,有助于現(xiàn)代醫(yī)家學習名老中醫(yī)的用藥經(jīng)驗、開發(fā)新的臨床用藥處方。
1.2.1 證候研究
基于用藥數(shù)據(jù)的隱結(jié)構(gòu)模型在證候研究中的應用,其基本思想是“以方(藥)測證”,即通過藥物組成及功效來推測出其所主治的證候類型[24]。陳麗平[25]等在9323 例中醫(yī)古籍咳嗽病案中篩選出120 味中藥建立隱結(jié)構(gòu)模型,以方測證得出9種主要證型,發(fā)現(xiàn)了痰瘀阻肺、外寒內(nèi)因兩種新證型。李秦[26]等收集古代痹癥醫(yī)案,篩選出70余味中藥,建立中藥隱結(jié)構(gòu)模型,分析得出古代痹癥的主要證型有寒濕痹阻、寒凝經(jīng)脈、濕熱痹阻等10 個主要證型。任妍[27]等收集王主任治療肺癌的有效處方,篩選用藥建立隱結(jié)構(gòu)模型,得出其主要有脾腎兩虛、虛瘀互結(jié)兩種證型及其他兼證。
“以方測證”思想最先體現(xiàn)在對《金匱要略》與《傷寒論》方證條文的研究中[28],其研究內(nèi)容是根據(jù)條文中的癥狀及方藥推測出疾病的證候類型,主要應用于對中醫(yī)古代醫(yī)家辨證論治的經(jīng)驗挖掘。隱結(jié)構(gòu)模型在對用藥數(shù)據(jù)的分析過程中不受主觀因素影響,使得“以方測證”的過程更加客觀化,促進“以方測證”思想在中醫(yī)研究中的應用,有助于進一步科學發(fā)掘古代名家醫(yī)案中的中醫(yī)證治規(guī)律及更多隱性知識,不斷豐富中醫(yī)藥文化。
1.2.2 用藥規(guī)律研究
用藥規(guī)律研究是通過隱結(jié)構(gòu)模型對用藥數(shù)據(jù)進行分析得出的藥物間的組合規(guī)律、證治規(guī)律,為中醫(yī)臨床用藥提供客觀依據(jù)。徐偉超[29]等從名老中醫(yī)脾胃病數(shù)據(jù)庫提取350 味中藥建立藥物隱結(jié)構(gòu)模型,分析得出名老中醫(yī)治療慢性萎縮性胃炎的常用藥物有清熱藥、化濕藥、補虛藥等,常用的方劑有枳實導滯丸、百合烏藥散、香蘇散等。楊淑慧[30]等篩選《中國藥典》中治療感冒的用藥信息,選取66種中成藥,178味中藥建立藥物隱結(jié)構(gòu)模型,分析得出中成藥治療感冒多以風熱型感冒為主。陳麗平[31]等在肺病數(shù)據(jù)庫中提取治療鼻淵的用藥數(shù)據(jù),建立藥物的隱結(jié)構(gòu)模型分析得出其核心治療藥物主要有白芷、細辛、白術、防風、蒼耳子、黃芪、山藥、連翹、辛夷等,核心方劑有四妙散、補中益氣湯、溫膽湯、溫肺止流丹等。陳麗平[32]等從肺病文獻中選取147 種藥物構(gòu)建藥物隱結(jié)構(gòu)模型,分析得出慢性支氣管炎的常用藥物為性味溫甘的陳皮、半夏、茯苓、黨參、陳皮等。常用的藥對有細辛、半夏和五味子,茯苓和白術,黨參、茯苓、半夏和陳皮。
中醫(yī)臨床用藥注重藥物間的配伍,對用藥規(guī)律的深入研究和不斷探索,是傳承發(fā)揚中醫(yī)藥文化的核心內(nèi)容[33]。由單味用藥到藥物間配伍再到方劑的組成,也是多維聚類的過程,隱結(jié)構(gòu)模型在用藥規(guī)律方面的研究應用中,單味用藥數(shù)據(jù)間的互信息數(shù)據(jù)量化了藥物間的關聯(lián)性和規(guī)律,揭示了藥物間的配伍關系,為臨床辨證用藥提供了客觀依據(jù),并且有助于進一步挖掘新的藥物間配伍規(guī)律,開發(fā)臨床用藥新處方。
中醫(yī)藥文化歷史悠久,擁有著龐大的中醫(yī)藥知識數(shù)據(jù)庫,但因其臨床信息如舌象、脈象等具有模糊性,有強烈的主觀色彩,一定程度上阻礙了中醫(yī)藥的現(xiàn)代化發(fā)展。數(shù)據(jù)挖掘技術可從大量的信息數(shù)據(jù)庫中挖掘出潛在的、新穎的有效信息[34]。隨著多學科的不斷發(fā)展,數(shù)據(jù)挖掘技術逐漸成熟并廣泛地應用于中醫(yī)各個領域,使得中醫(yī)藥信息更加直觀,一定程度上促進了中醫(yī)藥的現(xiàn)代化發(fā)展[35]。目前常用的中醫(yī)臨床數(shù)據(jù)挖掘方法主要有:頻數(shù)分析、關聯(lián)規(guī)則、聚類分析和人工神經(jīng)網(wǎng)絡等分析方法[36]。
隱結(jié)構(gòu)模型分析方法屬于一種特殊的聚類分析方法,近年來有學者將隱結(jié)構(gòu)模型與其他分析方法聯(lián)合應用于中醫(yī)藥研究并取得了一定的進展。陳麗平[37]基于隱結(jié)構(gòu)模型聯(lián)合Logistic 回歸分析研究古籍咳嗽醫(yī)案中的證候分布,隱結(jié)構(gòu)模型的分析結(jié)果揭示了癥狀與證候、中藥與證候之間的辨證規(guī)律,Logistic 回歸分析擬合了病性與證候之間的相觀性,一定程度上量化了中醫(yī)臨床的辨證規(guī)律。馮貞貞[38]等在關聯(lián)規(guī)則的基礎上聯(lián)合隱結(jié)構(gòu)分析方法研究慢阻肺穩(wěn)定期的證候特征,通過關聯(lián)證素與隱結(jié)構(gòu)分析癥狀數(shù)據(jù)推斷出慢阻肺穩(wěn)定期的基礎證候,并認為其研究結(jié)果可為慢阻肺穩(wěn)定期的臨床辨證提供規(guī)范性依據(jù),以及為其臨床證候療效提供評價標準。劉禹[39]等建立慢性萎縮性胃炎癥狀的隱結(jié)構(gòu)模型,聯(lián)合頻率項集數(shù)據(jù)挖掘方法鑒定其治療穴位,分析研究得出治療慢性萎縮性胃炎的針刺主要穴位為中脘穴、內(nèi)關穴和足三里穴。許玉龍[40]等,以隱結(jié)構(gòu)模型分析彌漫性間質(zhì)性肺疾病的癥狀及用藥數(shù)據(jù),聯(lián)合關聯(lián)規(guī)則分析癥狀間的關聯(lián)性,分析研究得出不同關聯(lián)癥狀對應的證候分型及用藥規(guī)律,為彌漫性間質(zhì)性肺疾病的臨床證候診斷、用藥提供了重要依據(jù)。
數(shù)據(jù)挖掘技術在中醫(yī)研究中的應用是近年來的研究熱點,隱結(jié)構(gòu)模型聯(lián)合其他數(shù)據(jù)分析方法可從多個數(shù)據(jù)分析角度揭示數(shù)據(jù)間的關聯(lián),擴大其研究范圍,并且不同的分析方法之間也能夠取長補短進一步完善中醫(yī)研究。
隱結(jié)構(gòu)模型分析方法過程復雜,所建立的模型質(zhì)量標準由BIC 評分[41]決定,評分越高模型質(zhì)量越好、復雜度越低。在其應用的過程中對樣本量有限制,需要對數(shù)據(jù)進行預處理,可能會導致一些重要變量的缺失。因此我們在應用的過程中,樣本的篩選需要基于大樣本含量的數(shù)據(jù)庫,并且篩選樣本時不能僅依據(jù)數(shù)據(jù)出現(xiàn)的頻率。目的是為了避免缺失與隱變量關聯(lián)度大但頻次出現(xiàn)較低的關鍵數(shù)據(jù),提取更具研究意義的樣本,構(gòu)建高質(zhì)量隱結(jié)構(gòu)模型。
隱結(jié)構(gòu)模型建立后,引入的隱變量需要具有中醫(yī)學專業(yè)知識的專家對其進行詮釋,以此來解釋模型中對顯變量的聚類劃分。但因各位專家專業(yè)知識水平不同,對于模型的詮釋具有個人色彩,致使模型的詮釋仍存在一定的主觀性。因此,在模型詮釋的過程中我們應選擇相關領域中專業(yè)水平高的專家,并進行多次的專家問卷調(diào)查來建立更加標準的判定規(guī)則,提高模型詮釋的客觀性。
中醫(yī)藥發(fā)展至今有五千多年的歷史,歷史積累的中醫(yī)學數(shù)據(jù)信息龐大且有許多未被挖掘出來的隱性知識。隱結(jié)構(gòu)的提出揭示了中醫(yī)臨床數(shù)據(jù)中隱藏的規(guī)律,為中醫(yī)研究提供了方法學支持?;具^程是將臨床收集到的無監(jiān)督數(shù)據(jù)進行多維聚類劃分,并在分析的過程中引入一系列的隱變量,最后由專家對引入的隱變量進行詮釋,其過程與中醫(yī)的臨床的多維化辨證思維相一致,因此成為了近年來中醫(yī)研究中的應用熱點。
隱結(jié)構(gòu)模型在中醫(yī)研究中的應用已取得了一定的成果,在改進現(xiàn)有問題的基礎上,進一步利用隱結(jié)構(gòu)模型在中醫(yī)研究中的適用性深入挖掘中醫(yī)隱性知識是我們未來的研究方向。中醫(yī)量化研究是中醫(yī)現(xiàn)代化發(fā)展的核心內(nèi)容,目的在于揭示證實質(zhì),目前關于證候及證候要素(證素)的研究主要集中于證候分型和證素分布,但是在疾病的發(fā)展過程中證候是動態(tài)變化的,量化基礎證候的有無和輕重度分級以及規(guī)律研究能更深一層揭示中醫(yī)辨證的實質(zhì)和規(guī)律。袁世宏[42]等以抑郁癥為例,分析得出隱結(jié)構(gòu)中的互信息曲線圖覆蓋度可判斷出癥狀的診斷價值;隱類概率分布表可通過癥狀的數(shù)據(jù)變化量化與癥關聯(lián)的證候特征,證實了隱結(jié)構(gòu)模型中的相關指標能夠?qū)ΠY狀與證之間的關聯(lián)性進行科學性的量化解釋。因此,利用隱結(jié)構(gòu)模型對基礎證候進行量化分級研究并建立量化診斷的標準,能進一步體現(xiàn)證候演變的動態(tài)性,揭示中醫(yī)辨證的實質(zhì)和規(guī)律,提高中醫(yī)量化研究的深度,也是本課題組下一步的研究方向。通過聯(lián)合其他數(shù)據(jù)分析方法、拓展其他數(shù)據(jù)類型的應用來擴大其研究范圍以及進一步發(fā)展隱結(jié)構(gòu)模型在人工智能方面的應用,也是未來可深入發(fā)展的方向。此外,在研究過程中,為保證研究內(nèi)容的科學性及專業(yè)性,隱結(jié)構(gòu)模型的分析數(shù)據(jù)應基于大樣本、多中心的篩選,并對樣本收集研究員進行專業(yè)的培訓,提高樣本數(shù)據(jù)的規(guī)范性及科學性;模型的詮釋應基于高水平、多輪的專家問卷調(diào)查來建立判定標準,提高模型詮釋的客觀性。