高 靜,宋佳陽(yáng)
(首都經(jīng)濟(jì)貿(mào)易大學(xué),北京100070)
數(shù)據(jù)挖掘是從大量、不完全、有噪聲、模糊、隨機(jī)的數(shù)據(jù)中提取人們事先不知道但具有潛在有用的信息和知識(shí)的過(guò)程;是通過(guò)分析每個(gè)數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示三個(gè)步驟。數(shù)據(jù)準(zhǔn)備是從相關(guān)的數(shù)據(jù)源中選取所需的數(shù)據(jù)并整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含的規(guī)律找出來(lái);規(guī)律表示是盡可能以用戶可理解的方式(如可視化)將找出的規(guī)律表示出來(lái)。
BP 神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播(簡(jiǎn)稱誤差反傳)訓(xùn)練的多層前饋網(wǎng)絡(luò),它的基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實(shí)際輸出值與期望輸出值的誤差均方差為最小。
將數(shù)據(jù)挖掘技術(shù)和人工神經(jīng)網(wǎng)絡(luò)的技術(shù)應(yīng)用于醫(yī)學(xué)診斷領(lǐng)域已經(jīng)日漸成熟,對(duì)于蕁麻疹的治療也變得十分重要。用數(shù)據(jù)挖掘技術(shù)對(duì)蕁麻疹中醫(yī)治療中的處方進(jìn)行分析,發(fā)現(xiàn)規(guī)律,以得到更好的治療效果;利用人工神經(jīng)網(wǎng)絡(luò)技術(shù),構(gòu)建無(wú)監(jiān)督學(xué)習(xí)的中醫(yī)證型預(yù)測(cè)模型和有監(jiān)督的蕁麻疹中醫(yī)證型分類器,為蕁麻疹中醫(yī)臨床辨證論治提供幫助;利用建立BP 神經(jīng)網(wǎng)絡(luò)模型的方法,對(duì)癢性蕁麻疹癢感度進(jìn)行預(yù)測(cè),該模型有較高的參考價(jià)值,對(duì)于相關(guān)癢感理論的研究有一定的意義。
數(shù)據(jù)挖掘分為有監(jiān)督的數(shù)據(jù)挖掘和無(wú)監(jiān)督的數(shù)據(jù)挖掘。有監(jiān)督的數(shù)據(jù)挖掘是利用可用的數(shù)據(jù)建立一個(gè)模型,這個(gè)模型是對(duì)特定屬性的描述;無(wú)監(jiān)督的數(shù)據(jù)挖掘是在所有的屬性中尋找某種關(guān)系。
具體而言,分類、估值和預(yù)測(cè)屬于有監(jiān)督的數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則和聚類屬于無(wú)監(jiān)督的數(shù)據(jù)挖掘。
在蕁麻疹的中醫(yī)治療中,利用數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)分析可以進(jìn)行組方規(guī)律分析,運(yùn)用關(guān)聯(lián)分析技術(shù)首先需發(fā)現(xiàn)頻繁項(xiàng)集,即計(jì)算所有可能組合數(shù)的支持度,找出不少于人為設(shè)定的最小支持度的集合。
發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,即計(jì)算不小于人為設(shè)定的最小支持度的集合置信度,找到不小于認(rèn)為設(shè)定的最小置信度規(guī)則。以關(guān)聯(lián)規(guī)則分析結(jié)果為基礎(chǔ)進(jìn)行聚類分析,以獲得新的處方核心組合。聚類分析是把數(shù)據(jù)集分割成多個(gè)具有某種相似特征的子集的過(guò)程,目前已廣泛用于研究方劑配伍規(guī)律及輔助發(fā)現(xiàn)新藥新方的研究領(lǐng)域。
神經(jīng)網(wǎng)絡(luò)的基本組成單元是神經(jīng)元。神經(jīng)元的通用模型如圖1 所示,其中,常用的激活函數(shù)有閾值函數(shù)、sigmoid函數(shù)和雙曲正切函數(shù)。
圖1 神經(jīng)元的通用模型
神經(jīng)網(wǎng)絡(luò)是將多個(gè)神經(jīng)元按一定規(guī)則聯(lián)結(jié)在一起而形成的網(wǎng)絡(luò),如圖2 所示。
從圖2 可以看出,一個(gè)神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層(中間層)和輸出層。輸入層神經(jīng)元個(gè)數(shù)與輸入數(shù)據(jù)的維數(shù)相同,輸出層神經(jīng)元個(gè)數(shù)與需要擬合的數(shù)據(jù)個(gè)數(shù)相同,隱含層神經(jīng)元個(gè)數(shù)與層數(shù)需要設(shè)計(jì)者根據(jù)一些規(guī)則和目標(biāo)來(lái)設(shè)定。在深度學(xué)習(xí)出現(xiàn)之前,隱含層的層數(shù)通常為一層,即通常使用的神經(jīng)網(wǎng)絡(luò)是三層網(wǎng)絡(luò)。
圖2 神經(jīng)網(wǎng)絡(luò)模型
在蕁麻疹的治療過(guò)程中,應(yīng)用人工神經(jīng)網(wǎng)絡(luò)技術(shù)建立評(píng)價(jià)癢性風(fēng)團(tuán)癢感度的預(yù)測(cè)模型,采用3 層BP 人工神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、輸出層和1 個(gè)隱層組成。從原始數(shù)據(jù)中篩選能反映特征的多個(gè)參數(shù)后,網(wǎng)絡(luò)使用12 個(gè)輸入端,每2 個(gè)輸入端組成1 組,用二進(jìn)制信號(hào)表示輸入信號(hào)的量化值,即每個(gè)輸入信號(hào)可表示為4 個(gè)等級(jí)。輸入信號(hào)分別為:①風(fēng)團(tuán)的面積S;②表面相對(duì)高度H;③表面相對(duì)光滑度G;④顏色C;⑤表面相對(duì)硬度D;⑥其他O。
網(wǎng)絡(luò)使用2 個(gè)輸出端y0,y1,用二進(jìn)制信號(hào)11,10,01,00 表示輸出信號(hào)癢感度的量化值,即將癢感度劃分為重、中、弱、無(wú)四個(gè)等級(jí)??刹捎玫娜龑尤斯ど窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
圖3 采用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
通過(guò)對(duì)該模型的有關(guān)參數(shù)的估計(jì),對(duì)癢性風(fēng)團(tuán)癢感度進(jìn)行定量度量和預(yù)測(cè)。利用臨床采集的癢性風(fēng)團(tuán)的體表特征S0,S1,H0,H1,G0,G1,C0,C1,D0,D,O0,O1和與之對(duì)應(yīng)的癢感度量化值y0,y1,依次對(duì)BP 網(wǎng)絡(luò)進(jìn)行訓(xùn)練,采用相應(yīng)的誤差逆?zhèn)鬟f算法獲得輸入層與隱層之間的各權(quán)值Wij以及隱層與輸出層之間的各權(quán)值Wki的值,所以,一個(gè)基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的癢性風(fēng)團(tuán)癢感度預(yù)測(cè)模型最終被建立起來(lái)。
中醫(yī)對(duì)蕁麻疹的發(fā)病機(jī)理的認(rèn)識(shí)已趨統(tǒng)一,認(rèn)為蕁麻疹的發(fā)病多與風(fēng)邪有關(guān),西醫(yī)目前多采用競(jìng)爭(zhēng)抑制組胺受體藥物、降低血管壁通透性藥物、皮質(zhì)類固醇激素等藥物治療,但這些藥有一定的副作用,遠(yuǎn)期療效不理想??菇M胺藥治療蕁麻疹,能緩解多數(shù)患者癥狀,但停藥后風(fēng)團(tuán)又復(fù)發(fā),所以現(xiàn)代西醫(yī)學(xué)對(duì)本病尚無(wú)特效療法。
大量的研究表明,中醫(yī)對(duì)蕁麻疹的治療具有療效確切、副作用小、不易復(fù)發(fā)的優(yōu)勢(shì),所以積極探求中醫(yī)藥對(duì)治療蕁麻疹的有效方法就非常重要。
國(guó)外目前還沒(méi)有關(guān)于蕁麻疹的治療、人工神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)挖掘技術(shù)等結(jié)合的文獻(xiàn),國(guó)內(nèi)近年來(lái)有學(xué)者將數(shù)據(jù)挖掘技術(shù)與人工神經(jīng)網(wǎng)絡(luò)技術(shù)、蕁麻疹的治療結(jié)合在一起,發(fā)表了相關(guān)的文獻(xiàn),應(yīng)用不同技術(shù)輔助蕁麻疹治療的對(duì)比分析如圖4 所示。
圖4 相關(guān)文獻(xiàn)對(duì)比分析圖
近年來(lái)國(guó)內(nèi)部分利用數(shù)據(jù)挖掘技術(shù)、人工神經(jīng)網(wǎng)絡(luò)技術(shù)輔助蕁麻疹治療的相關(guān)文獻(xiàn)和研究成果如表1 所示。
可以看出,數(shù)據(jù)挖掘技術(shù)和建立BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的方法都可以對(duì)蕁麻疹的治療起到促進(jìn)作用。目前,醫(yī)療診斷和治療已經(jīng)不能停留在傳統(tǒng)方法上,需要采用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,運(yùn)用人工神經(jīng)網(wǎng)絡(luò)技術(shù)輔助蕁麻疹的預(yù)測(cè)、診斷和治療。
近年來(lái),對(duì)于蕁麻疹的治療應(yīng)用了更多的數(shù)據(jù)挖掘技術(shù)和人工神經(jīng)網(wǎng)絡(luò)技術(shù),但是數(shù)據(jù)挖掘的結(jié)果只是建立在數(shù)據(jù)的基礎(chǔ)上,應(yīng)用數(shù)據(jù)挖掘技術(shù)分析得到的核心組合和新處方還須經(jīng)過(guò)臨床檢驗(yàn)。
除了對(duì)蕁麻疹的中醫(yī)處方數(shù)據(jù)挖掘分析之外,在未來(lái),隨著人工智能技術(shù)的迅速發(fā)展和醫(yī)學(xué)研究的深入研究,醫(yī)學(xué)治療會(huì)更加智能化,更加適用于生活,它還將開(kāi)發(fā)更有效的算法模型,對(duì)蕁麻疹更好地預(yù)測(cè)和治療。
蕁麻疹病程較長(zhǎng)、遷延難愈,需要選擇科學(xué)的療法,才能提升治療水平。要不斷將蕁麻疹的治療與其他數(shù)據(jù)挖掘算法相結(jié)合,力求找到蕁麻疹的最優(yōu)數(shù)據(jù)處理方法和最精確預(yù)測(cè)結(jié)果。
表1 相關(guān)文獻(xiàn)和研究成果