国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Neo4j的冠心病中醫(yī)辨證論治知識(shí)圖譜研究

2021-08-23 10:15陳善達(dá)夏帥帥鄧文祥晏峻峰
關(guān)鍵詞:病性證素權(quán)值

陳善達(dá) 夏帥帥 鄧文祥 李 亮 晏峻峰

1.湖南中醫(yī)藥大學(xué)中醫(yī)學(xué)院,湖南長(zhǎng)沙 410208;2.中醫(yī)診斷學(xué)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南長(zhǎng)沙 410208;3.湖南中醫(yī)藥大學(xué)信息科學(xué)與工程學(xué)院,湖南長(zhǎng)沙 410208

冠心病是冠狀動(dòng)脈發(fā)生粥樣硬化引起管腔狹窄或閉塞,導(dǎo)致心肌缺血、缺氧或壞死而引起的心臟病,屬于中醫(yī)“胸痹”范疇。冠心病嚴(yán)重危害人們的生命健康,2018 年我國(guó)冠心病患者已達(dá)1100 萬,近年來發(fā)病愈加呈上升、年輕化的趨勢(shì)[1]。中醫(yī)藥在冠心病防治中有著獨(dú)特的優(yōu)勢(shì)[2-3],因此,深入挖掘中醫(yī)藥在冠心病中的辨證論治規(guī)律有著重要意義。

辨證論治是通過望、聞、問、切四診合參收集患者的證候資料,加以綜合分析,辨清疾病當(dāng)前階段的病機(jī)特點(diǎn)并確定治法方藥的過程,是中醫(yī)學(xué)的診療特色。如今中醫(yī)藥事業(yè)的傳承與發(fā)展到了瓶頸期,亟需從現(xiàn)代信息技術(shù)中尋求突破[4]。朱文鋒教授團(tuán)隊(duì)創(chuàng)立了證素辨證學(xué),由證候推斷出特定的證素并結(jié)合成完整證型,對(duì)中醫(yī)辨證環(huán)節(jié)起到了執(zhí)簡(jiǎn)馭繁的作用[5],相反,將完整的證型拆分成證素組合可以更清楚地反映疾病當(dāng)前階段的病機(jī)特點(diǎn)[6]。因此,本研究以證素辨證為核心,運(yùn)用圖數(shù)據(jù)庫(kù)表達(dá)其與證候、中藥的關(guān)系。

Neo4j[7]是一種開源的圖數(shù)據(jù)庫(kù),相比傳統(tǒng)數(shù)據(jù)庫(kù),更能以圖形節(jié)點(diǎn)的形式呈現(xiàn)數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,并借此創(chuàng)造一種既視感,更有利于接受。Neo4j 通過其特有的Cypher 語(yǔ)句能夠?qū)崿F(xiàn)與其他數(shù)據(jù)庫(kù)一樣的結(jié)構(gòu)化編程,實(shí)現(xiàn)數(shù)據(jù)的導(dǎo)入、增、刪、改、查等操作。已有學(xué)者將Neo4j 運(yùn)用于中醫(yī)藥領(lǐng)域的研究,如趙凱等[8]采用Neo4j 構(gòu)建了桂枝湯類方的知識(shí)圖譜;姜惠娟等[9]以《中國(guó)藥膳大辭典》為數(shù)據(jù)來源,采用Neo4j 構(gòu)建藥膳方劑圖數(shù)據(jù)庫(kù)?;诖?,本研究探討采用Neo4j 構(gòu)建一個(gè)小型冠心病辨證論治知識(shí)圖譜。

1 資料與方法

1.1 文獻(xiàn)來源與檢索方式

數(shù)據(jù)來源于中國(guó)知網(wǎng)、維普及萬方數(shù)據(jù)庫(kù)。以“冠心病”“胸痹”“舉隅”“驗(yàn)案”為關(guān)鍵詞或主題詞檢索2010 年1 月至2020 年2 月所有文獻(xiàn),共檢索出770 篇,剔除重復(fù)的文獻(xiàn),納入符合要求的文獻(xiàn),共208 篇。

1.2 文獻(xiàn)納入標(biāo)準(zhǔn)

符合西醫(yī)“冠心病”或中醫(yī)“胸痹”診斷標(biāo)準(zhǔn)且證候、證型、方藥完整的中醫(yī)診治文獻(xiàn),診斷標(biāo)準(zhǔn)參照人民衛(wèi)生出版社出版的第9 版《內(nèi)科學(xué)》[10]教材,以及中國(guó)中醫(yī)藥出版社出版的第4 版《中醫(yī)內(nèi)科學(xué)》[11]教材。

1.3 文獻(xiàn)排除標(biāo)準(zhǔn)

①學(xué)術(shù)思想探討與綜述類文獻(xiàn);②單味藥或藥對(duì)不予納入。

1.4 數(shù)據(jù)規(guī)范、分析與數(shù)據(jù)庫(kù)的建立

1.4.1 數(shù)據(jù)規(guī)范 參照中國(guó)中醫(yī)藥出版社出版的第4 版《中藥學(xué)》[12]以及朱文鋒教授的《證素辨證學(xué)》[13]對(duì)其中涉及的證候和藥物的名稱進(jìn)行規(guī)范化處理并將證型中包含的病性證素提取出來。例如:大便不成形→便溏,山萸→山茱萸,氣虛血瘀→氣虛、血瘀等。

1.4.2 數(shù)據(jù)分析與數(shù)據(jù)庫(kù)的建立 將篩選出的208 篇文獻(xiàn)作為研究對(duì)象,采用Microsoft Office Excel 2010 建立數(shù)據(jù)表記錄每個(gè)案例的證候、證型以及用藥等信息,共錄入329 個(gè)案例,統(tǒng)計(jì)證候、病性證素和中藥的頻次與頻率。在Pycharm 2019.1.3 中采用Python 3.7 進(jìn)行權(quán)值計(jì)算,參照朱文鋒教授的雙層頻權(quán)剪叉算法[14]確立的權(quán)值計(jì)算方法:某一證候、病性證素或中藥在某一病性證素中出現(xiàn)的頻次與該證候、病性證素或中藥在所有病性證素中出現(xiàn)的總頻次的比值。例如:胸悶在“血瘀”這一病性證素中出現(xiàn)的頻次為180,在所有病性證素中出現(xiàn)的頻次為276,則胸悶在病性證素“血瘀”中的權(quán)值為0.65。權(quán)值可以反映某一證候、病性證素或中藥在一定范圍內(nèi)的關(guān)聯(lián)性,權(quán)值越靠前則關(guān)聯(lián)性越強(qiáng)。在Pycharm 2019.1.3 中采用Python 3.7實(shí)現(xiàn)Apriori 算法對(duì)所有中藥進(jìn)行關(guān)聯(lián)規(guī)則分析,最小支持度設(shè)為10%,最小置信度設(shè)為60%。隨后,將權(quán)值計(jì)算以及關(guān)聯(lián)分析得出的結(jié)果分別導(dǎo)入到Neo4j Community 3.5.14 中構(gòu)建圖數(shù)據(jù)庫(kù),并進(jìn)行數(shù)據(jù)一致性檢驗(yàn),目的是找出并修改節(jié)點(diǎn)與關(guān)系不匹配的節(jié)點(diǎn)或關(guān)系,例如:“瘀點(diǎn)(斑)舌→血瘀”的關(guān)系為“證候→中心證素”,若變?yōu)椤爸行淖C素→證候”則為節(jié)點(diǎn)與關(guān)系不匹配[15]。采用的Cypher 語(yǔ)句功能:load 將文件導(dǎo)入Neo4j 中;merge 創(chuàng)建節(jié)點(diǎn)或關(guān)系;set 設(shè)置節(jié)點(diǎn)屬性;match 查詢指定節(jié)點(diǎn)或關(guān)系;where 設(shè)定查詢的條件;order by 將結(jié)果進(jìn)行排序;desc 按降序排序;limit 限制輸出結(jié)果的數(shù)量。

2 結(jié)果

2.1 頻次統(tǒng)計(jì)

本研究涉及證候217 個(gè),累計(jì)出現(xiàn)4202 次,出現(xiàn)頻率≥10%的證候有29 個(gè),其出現(xiàn)頻率≥50%的證候有胸悶、胸痛、氣短、苔白、乏力,見表1;涉及病性證素17 個(gè),累計(jì)出現(xiàn)770 次,出現(xiàn)頻率≥10%的病性證素有8 個(gè),分別為血瘀、痰、氣虛、氣滯、陽(yáng)虛、陰虛、濕、火(熱),見表2,與冠心病關(guān)聯(lián)度最高的病性證素為血瘀、痰、氣虛,與冠心病現(xiàn)代中醫(yī)證候特征的臨床流行病學(xué)調(diào)查結(jié)果相符[16]。本研究涉及藥物301 種,累計(jì)用藥頻次4576 次,使用頻率≥10%的中藥有37 種,其中使用頻率≥50%的藥物有丹參、甘草,見表3。

表1 出現(xiàn)頻率≥10%證候分布表(前10 位)

表2 出現(xiàn)頻率≥10%病性證素分布表

表3 使用頻率≥10%中藥分布表(前10 位)

2.2 權(quán)值計(jì)算

在Pycharm 2019.1.3 中采用Python 3.7 對(duì)出現(xiàn)頻率≥10%的證候、病性證素、中藥進(jìn)行權(quán)值計(jì)算,共計(jì)582 條,部分結(jié)果見表4,如第1 條氣虛為在“血瘀”這一病性證素中占比最大的證候,氣虛在所有病性證素中出現(xiàn)的總頻次為110 次,有77%都出現(xiàn)在“血瘀”這一病性證素中,以此類推,“瘀點(diǎn)(斑)舌”這一證候95%都出現(xiàn)在“血瘀”這一病性證素中。

表4 出現(xiàn)頻率≥10%證候、病性證素、中藥權(quán)值表(排位第1)

2.3 關(guān)聯(lián)分析

在Pycharm 2019.1.3 中采用Python 3.7 實(shí)現(xiàn)Apriori 算法對(duì)所有中藥進(jìn)行關(guān)聯(lián)規(guī)則分析,最小支持度設(shè)為10%,最小置信度設(shè)為60%,挖掘出61 條關(guān)聯(lián)規(guī)則,見表5。其中前項(xiàng)為前提事件,后項(xiàng)為伴隨事件,支持度為前提事件在所有事件中出現(xiàn)的頻率,置信度為在前提事件出現(xiàn)的情況下,伴隨事件出現(xiàn)的概率。

表5 出現(xiàn)頻率≥10%的中藥關(guān)聯(lián)表(置信度≥75%)

2.4 基于Neo4j 表達(dá)冠心病辨證論治規(guī)律

采用match、where 語(yǔ)句條件查詢節(jié)點(diǎn),然后采用set 語(yǔ)句為節(jié)點(diǎn)設(shè)置各項(xiàng)屬性,name 為節(jié)點(diǎn)名,_name為關(guān)系名,freq 或freq1 為頻次,freq2 為頻率,weight為權(quán)值,support 為支持度,confidence 為置信度,見圖1。采用match 語(yǔ)句查詢“血瘀”“痰”“氣虛”3 個(gè)病性證素的所有關(guān)系,然后采用order 和desc 語(yǔ)句按權(quán)值降序排序,最后采用limit 語(yǔ)句限制輸出前20 條關(guān)系,見圖2~4。同理,采用match、order、desc、limit 語(yǔ)句輸出置信度≥75%的中藥關(guān)系圖,見圖5。圖中圓圈代表節(jié)點(diǎn),箭頭代表關(guān)系,關(guān)系a 為“證候→中心病性證素”,關(guān)系b 為“中心病性證素→病性證素”,關(guān)系c為“中心證素→前項(xiàng)中藥”,關(guān)系d 為“前項(xiàng)中藥→后項(xiàng)中藥”。

圖1 節(jié)點(diǎn)/關(guān)系屬性圖

圖2 血瘀前20 關(guān)系圖

3 討論

圖3 痰前20 關(guān)系圖

圖4 氣虛前20 關(guān)系圖

圖5 中藥置信度≥0.75 關(guān)聯(lián)圖

圖數(shù)據(jù)庫(kù)可以很直觀地將數(shù)據(jù)與數(shù)據(jù)間的關(guān)系呈現(xiàn)在人們眼前。Neo4j 是當(dāng)下熱門的圖數(shù)據(jù)庫(kù)之一,與普通的圖處理或內(nèi)存級(jí)數(shù)據(jù)庫(kù)不同的是,其實(shí)現(xiàn)了專業(yè)數(shù)據(jù)庫(kù)級(jí)別圖數(shù)據(jù)模型的存儲(chǔ);其性能比其他數(shù)據(jù)庫(kù)穩(wěn)定且運(yùn)行速度要更快[7]。本研究采用頻數(shù)統(tǒng)計(jì)、權(quán)值計(jì)算、關(guān)聯(lián)分析以及Neo4j 技術(shù)構(gòu)建了一個(gè)簡(jiǎn)單冠心病辨證論治知識(shí)表達(dá)圖數(shù)據(jù)庫(kù)。本研究結(jié)果所示,將辨證論治數(shù)據(jù)導(dǎo)入Neo4j 圖數(shù)據(jù)庫(kù)中,通過為關(guān)系設(shè)置屬性,并通過特定的查詢、篩選語(yǔ)句可以更清楚地辨識(shí)出辨證論治中的復(fù)雜關(guān)系,這為中醫(yī)辨證論治知識(shí)表達(dá)圖數(shù)據(jù)庫(kù)的構(gòu)建提供了方法指導(dǎo)。

猜你喜歡
病性證素權(quán)值
一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
糖尿病前期中醫(yī)證型及證素特點(diǎn)分析
2型糖尿病合并肥胖患者的相關(guān)危險(xiǎn)因素和中醫(yī)證素分析
脾系藏象病位與病性特征研究
基于因子分析及聚類分析的241例感染后咳嗽中醫(yī)證素證型研究
基于“風(fēng)痰瘀虛”的高血壓腦小血管病病性證素的臨床表現(xiàn)與影像學(xué)特征研究
CONTENTS
八珍湯加味序貫中藥包熱熨治療氣血兩虛型子宮腺肌病性痛經(jīng)的臨床觀察
基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
《傷寒論》三陽(yáng)三陰病證的證素辨證研究