国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

利用文獻挖掘技術(shù)從MEDLINE構(gòu)建冠心病氣虛血瘀證與氣滯血瘀證的NEI分子網(wǎng)絡(luò)初步研究*

2015-11-11 07:52:47劉婧瑋陳建新
中國中醫(yī)急癥 2015年5期
關(guān)鍵詞:氣滯證型氣虛

劉婧瑋 翟 興 陳 坤 高 闊 劉 甲 王 偉 陳建新

(北京中醫(yī)藥大學(xué),北京 100029)

利用文獻挖掘技術(shù)從MEDLINE構(gòu)建冠心病氣虛血瘀證與氣滯血瘀證的NEI分子網(wǎng)絡(luò)初步研究*

劉婧瑋 翟 興 陳 坤 高 闊 劉 甲 王 偉 陳建新△

(北京中醫(yī)藥大學(xué),北京 100029)

目的 通過文獻挖掘的方法對冠心病氣虛血瘀證與氣滯血瘀證進行內(nèi)在生物學(xué)區(qū)分。方法 在MEDLINE數(shù)據(jù)庫中找到與冠心病有關(guān)的文獻,提取摘要池,通過其對摘要池進行匹配,使用共現(xiàn)的文本挖掘技術(shù)挖掘出冠心病氣虛血瘀證和氣滯血瘀證的分子生物學(xué)網(wǎng)絡(luò),確定與冠心病氣虛血瘀證和氣滯血瘀證相關(guān)的候選分子指標。最后,應(yīng)用特征選擇的數(shù)據(jù)挖掘方法遴選出“指標個數(shù)少,準確性高”的證候生物學(xué)特征診斷模式。結(jié)果 對利用文獻挖掘方法挖掘出的基因數(shù)據(jù)進行對比、分析,顯示氣虛血瘀相關(guān)集群與內(nèi)分泌、信號傳導(dǎo)、造血細胞系、炎癥反應(yīng)等相關(guān);氣滯血瘀相關(guān)集群與糖蛋白、含有二硫鍵的蛋白、G蛋白偶聯(lián)受體信號傳導(dǎo)系統(tǒng)、兒茶酚胺類遞質(zhì)活性調(diào)控相關(guān),從而與交感神經(jīng)調(diào)節(jié)相關(guān)。中醫(yī)證型的內(nèi)在生物學(xué)特征可以在NEI水平上進行有效的辨識。結(jié)論 文獻挖掘法作為一種新的發(fā)現(xiàn)證候生物學(xué)指標的方法具有一定的可行性,建議將其進一步擴大到其他證型的研究中,驗證該方法的普適性和可靠性。

文獻挖掘 NEI 氣虛血瘀證 氣滯血瘀證

辨病與辨證相結(jié)合是中醫(yī)特色的治療原則。隨著現(xiàn)代醫(yī)學(xué)的發(fā)展,中醫(yī)的辨治模式越來越多地表現(xiàn)為辨西醫(yī)的疾病與辨中醫(yī)的證候相結(jié)合,這也是現(xiàn)代意義的“病證結(jié)合”。目前病證結(jié)合證候的生物學(xué)基礎(chǔ)研究主要有3個思路。一是“金指標”的研究思路,即通過對照研究,發(fā)現(xiàn)與證候密切相關(guān)的各個層次上的單個生物學(xué)指標。這些指標為證候的客觀化診斷和療效評價提供依據(jù)。如研究發(fā)現(xiàn)CD8+T淋巴細胞與甲型H1N1風(fēng)熱犯衛(wèi)證和熱毒襲肺證密切相關(guān)[1]。這個研究思路一直是證候生物學(xué)基礎(chǔ)研究的主流,積累了大量的文獻。第2個思路是以文獻挖掘的方法學(xué)為核心,使用癥狀表征為橋梁建立中醫(yī)證候與西醫(yī)文獻中涉及到的生物學(xué)指標的關(guān)聯(lián)。文獻挖掘技術(shù)的理念即若一個與證候診斷相關(guān)的癥狀表征與一個生物學(xué)指標在一篇MEDLINE收錄文章的摘要中共現(xiàn),就是一種關(guān)聯(lián),若這種關(guān)聯(lián)不斷被重復(fù)到一定程度,認為是兩者之間強相關(guān)[2-3]。如李梢教授[2]通過文本挖掘的技術(shù)建立寒熱證的神經(jīng)內(nèi)分泌免疫網(wǎng)絡(luò),并通過動物實驗驗證了此生物學(xué)網(wǎng)絡(luò)。在當(dāng)前醫(yī)學(xué)模式由還原論向系統(tǒng)論轉(zhuǎn)變的大背景下,此模式從系統(tǒng)生物學(xué)的角度探討了證候的生物學(xué)網(wǎng)絡(luò),取得了較好的結(jié)果。第3則是國家重點基礎(chǔ)規(guī)劃項目(973項目)《證候的規(guī)范化及其與疾病、方劑的基礎(chǔ)研究》提出的“特征模式”的研究思路[4-5]。

近幾年來,由于生物學(xué)數(shù)據(jù)和關(guān)于生物學(xué)基礎(chǔ)的醫(yī)學(xué)文獻數(shù)量急劇增長,通過人工閱讀整理文獻已經(jīng)難以及時、高效地挖掘和整合其中的有效信息,文獻挖掘(literaturemining)方法是解決這類問題的一種有效途徑[6]。因此,通過文獻挖掘?qū)ふ乙?guī)律和新的認知成了生物學(xué)基礎(chǔ)和醫(yī)學(xué)研究的一個新熱點[7]。文獻挖掘?qū)A课墨I中的數(shù)據(jù)進行整合、分析,通過此種方法獲得更具有代表性、可信度更高的結(jié)果[8],這些從文獻中挖掘出來的實驗假設(shè)和實驗建議可供生物學(xué)家驗證并得到新的科學(xué)發(fā)現(xiàn),從而提高人們對生物醫(yī)學(xué)現(xiàn)象的認識[9]。在中醫(yī)學(xué)領(lǐng)域,越來越多的學(xué)者應(yīng)用這一方法對中醫(yī)藥的發(fā)展前景和研究方法進行探索與認知。比如使用網(wǎng)絡(luò)數(shù)據(jù)庫結(jié)合統(tǒng)計分析的方法檢索近10年關(guān)于冠心病辨證的現(xiàn)代文獻,挖掘冠心病證素證型的關(guān)系,結(jié)果發(fā)現(xiàn)冠心病以血瘀為其主要組成證素,其證型以單證素為主[10]。還有學(xué)者基于文獻挖掘技術(shù)探討生姜與黃芩臨床配伍應(yīng)用規(guī)律,找到其臨床應(yīng)用特點,將這一技術(shù)應(yīng)用于中藥治療的應(yīng)用特點上[11]。由此可見,強有力的文獻挖掘技術(shù)在中醫(yī)藥現(xiàn)代化的進程中扮演著越來越重要的角色。

冠心病目前依然是我國人群首要死因,是嚴重危害人類健康的常見病、多發(fā)病,包括心絞痛、急性心肌梗死、心律失常及心功能不全等臨床亞型。心絞痛是冠心病最主要的亞型,其中醫(yī)證型研究報道也最多,多以住院冠心病心絞痛患者為研究對象??梢姽谛牟馓撗鲎C和氣滯血瘀證是其核心病機之一,兩個證候相互對照,本文的主要目的是希望借助這一疾病的主要證型,利用文獻挖掘技術(shù)找到與這兩個證型相關(guān)的生物學(xué)指標群,再通過對臨床相應(yīng)數(shù)據(jù)的挖掘得到不同的生物學(xué)指標群并驗證,從而得到冠心病氣虛血瘀證與氣滯血瘀證的內(nèi)在生物學(xué)區(qū)分。

1 方 法

1.1 文獻獲取

首先在MEDLINE數(shù)據(jù)庫中檢索與冠心病有關(guān)的文獻,提取摘要池,關(guān)鍵詞確定為:冠心?。–oronary heart disease/Coronary artery disease);冠心病心絞痛(Coronary heart disease and angina/Coronary artery diseasewith angina pectoris);不穩(wěn)定型心絞痛(Unstable angina pectoris/Unstableangina);穩(wěn)定型心絞痛(Stable Angina/Stable angina pectoris);心肌梗塞(Myocardial infarction);心肌梗死(Myocardial infarction);冠心病心肌缺血 (Myocardial ischemia);無癥狀性心肌缺血(Silentmyocardial ischemia);缺血性心肌?。↖schemic cardiomyopathy)。由于氣虛血瘀證和氣滯血瘀證都有血瘀,而血瘀證的典型癥狀是胸痛,包含在冠心病的關(guān)鍵詞中,故只使用氣虛證和氣滯證的相關(guān)癥狀作為關(guān)鍵詞進行冠心病文獻的二次分類,只要1篇冠心病的文獻摘要出現(xiàn)氣虛證或者氣滯證的1個癥狀,就認為其與氣虛血瘀證或氣滯血瘀證相關(guān)。最后確定進行文獻挖掘的關(guān)鍵詞如表1所示。

表1 NEI、氣虛、氣滯相關(guān)關(guān)鍵詞

以上述關(guān)鍵詞在Pubmed上搜索文獻數(shù)據(jù),其中共獲得與NEI相關(guān)的氣虛文章332篇,與NEI相關(guān)的氣滯文章2247篇。

1.2 基于條件隨機場的方法提取氣虛、氣滯相關(guān)基因

1.2.1 關(guān)鍵詞選取訓(xùn)練集來源 JNLPBA 2004,Bio CreAtIvE 2004和BioCreAtIvE 2006數(shù)據(jù)集做為訓(xùn)練樣本。

1.2.2 特征選取 1)單詞本身,即把語料中的單詞作為一種識別特征。2)單詞的詞干,對語料中的單詞進行標準化,復(fù)數(shù)、現(xiàn)在分詞、過去式、過去分詞改為單詞原型。3)詞性特征(名詞、動詞、形容詞等等),使用GENIA Tagger工具獲取單詞的詞性標注。4)組塊特征(確定一個詞組的詞性,名詞性詞組、形容詞性詞組),使用GENIA Tagger進行組塊特征標記。5)詞典特征,使用entrez基因數(shù)據(jù)庫和uniprot蛋白質(zhì)數(shù)據(jù)庫對單詞進行標記。6)詞形特征:具有相同詞形的詞很可能具有相同的屬性。為了描述這種相似性,筆者把所有的詞進行規(guī)范化處理。把每個詞中出現(xiàn)的大寫字母用“X”表示小寫字母用“x”表示,數(shù)字用“d”表示,其他字符用“_”表示。如單詞“IL-3”,“IL-4”和“IL-5”經(jīng)過規(guī)范化以后都變成“XX_d”。7)前后綴特征,分別取長度為3,4和5的前后綴作為特征。8)正字法特征:對單詞類型進行標注,如:字母與數(shù)字組合,符號,大小寫等(ALLCAPS全部大寫,CAPSMIX大小寫混合,INITCAP首字母大寫)。9)上下文特征:選取的上下文窗口大小為5,即前兩個詞、當(dāng)前詞和后兩個詞。

對訓(xùn)練集數(shù)據(jù)和需處理的文獻按照上述特征進行處理,并采用CRF++軟件進行建模,挖掘出需要的蛋白和基因,然后對挖掘出的蛋白和基因,在Entrez數(shù)據(jù)庫進行匹配,并人工檢查。應(yīng)用DAVID Bioinformatics Resources6.7軟件[12]對所得基因進行分層聚類、基因類型測試和Kyoto Encyclopedia of Genes and Genomes(KEGG)通路分析。基因聚類測試是一種探索性的工具,用以探索檢測基因表達數(shù)據(jù)內(nèi)部的關(guān)聯(lián)性,為進一步考慮進行假設(shè)性的篩選。KEGG通路分析可以幫助尋找所提供基因所參與的生物過程。

2 結(jié) 果

從Entrez數(shù)據(jù)庫中找到120個與氣虛、氣滯相關(guān)的基因,其中氣滯證相關(guān)基因74個,氣虛證相關(guān)基因8個,與氣虛證、氣滯證共同相關(guān)的基因38個,如圖1。

圖1 部分氣虛證、氣滯證基因

將得到的結(jié)果做出一個基因網(wǎng)絡(luò)圖,氣虛證的相關(guān)基因、氣滯證的相關(guān)基因以及對二者共同起作用的基因之間的關(guān)系可以通過這個方法初步看出。

3 討 論

本研究以從冠心病心絞痛的兩個主要中醫(yī)證型即氣虛血瘀證與氣滯血瘀證為例,利用文獻挖掘方法進行證候表征術(shù)語NEI基因的文獻挖掘研究,以期對氣虛血瘀證和氣滯血瘀證進行內(nèi)在的生物學(xué)區(qū)分,便于更好的理解中醫(yī)冠心病的分型,并且進一步實現(xiàn)中醫(yī)的現(xiàn)代化與國際化的目的。

在找到的120個相關(guān)基因中,與氣滯相關(guān)的基因共有74個,其中和臨床最密切的基因是一氧化氮結(jié)合酶(NOS);與氣虛相關(guān)的基因共有8個,和臨床最相關(guān)的是免疫球蛋白A(IgA);共同表達的基因是38個,其中與臨床聯(lián)系最緊密的是睪酮(testosterone)、去甲腎上腺素(NE)、腎上腺素(NA)促甲狀腺激素(TSH)、雌二醇 (estradiol)、3碘甲狀腺素 (FT3)、4碘甲狀腺素(FT4)。通過利用基因分析的方法,筆者發(fā)現(xiàn)氣虛血瘀證相關(guān)集群與內(nèi)分泌、信號傳導(dǎo)、造血細胞系、炎癥反應(yīng)等相關(guān)。氣滯血瘀證相關(guān)集群與糖蛋白、含有二硫鍵的蛋白、G蛋白偶聯(lián)受體信號傳導(dǎo)系統(tǒng)、兒茶酚胺類遞質(zhì)活性調(diào)控相關(guān),進而與交感神經(jīng)調(diào)節(jié)相關(guān)。從而證明了本方案可以對中醫(yī)證型的內(nèi)在生物學(xué)特征可以進行有效的辨識。而文獻挖掘作為一種省時省力,又簡單易行的挖掘證候生物學(xué)指標的方法,也正在被越來越多的研究人員所采納。下一步筆者計劃繼續(xù)改良挖掘算法并擴大到其他證型的研究中,進一步驗證該方法的普適性和可靠性。

圖2 氣虛證、氣滯證基因網(wǎng)絡(luò)圖

[1]黃羽,曾星.甲型H1N1流感患者T淋巴細胞亞群與中醫(yī)辨證分型相關(guān)性的回顧性研究[J].中西醫(yī)結(jié)合學(xué)報,2011,9(2):143-147.

[2]Shao L,Xuegong Zh.Understanding Zheng in traditional Chinese medicine in the context of neuro-endocrine-immune network[J].IET System Biology,2007,1(1):51-60.

[3]Xuezhong Zh,Baoyan L,Zhaohui W,et al.Integrative mining of traditional Chinese medicine literature and MEDLINE for functional gene networks[J].Artificial Intelligence in Medicine,2007,41(2):87-104.

[4]趙慧輝.不穩(wěn)定心絞痛血瘀證的蛋白組學(xué)研究[D].北京:北京中醫(yī)藥大學(xué),2008.

[5]陳建新,趙慧輝,王偉.中醫(yī)證候生物學(xué)基礎(chǔ)研究思路初探—基于特征選擇的數(shù)據(jù)挖掘方法[J].中西醫(yī)結(jié)合學(xué)報,2010,8(8):747-749。

[6]Hakenberg J,Nenadic G,Rebholz Schuhmann D,et al.Literature mining solutions for life science research[J].Adv Bioinfor-matics,2013:320-436.

[7]Tari L,Anwar S,Liang S,etal.Discovering drug-drug interactions:a text-mining and reasoning approach based onproperties of drug metabolism[J].Bioinformatics,2010,26(18):547-553.

[8]Rodriguez-Esteban R.Biomedical text mining and its applications[J].PLoScomputationalbiology,2009,5(12):1000597.

[9]王浩暢,趙鐵軍.生物醫(yī)學(xué)文本挖掘技術(shù)的研究與進展[J].中文信息學(xué)報,2008,22(3):89-98.

[10]田松,何茜.基于現(xiàn)代文獻的冠心病中醫(yī)證候特征數(shù)據(jù)挖掘[J].中國中醫(yī)藥信息雜志,2013,20(3):29-30.

[11]吳嘉瑞,張宇晶.基于文獻挖掘的相惡藥對生姜與黃芩臨床應(yīng)用特點研究[J].中國中醫(yī)藥信息雜志,2014,20(7):15-17.

[12]Huang DW,Sherman BT,Lempicki RA.Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources[J].Nature protocols,2008,4(1):44-57.

Research of NEI Molecular Network of Qi Deficiency Blood Stasis Syndrome and Qi-blood Stagnation Syndrome in Unstable Angina Pectoris from MEDLINE by Literature Mining Technology

LIU Jingwei,ZHAI Xing,CHEN Kun,et al.Beijing University of Chinese Medicine,Beijing 100029,China

Objective:To biology distinguish the Qi deficiency blood stasis syndrome and Qi-blood stagnation syndrome in unstable angina pectoris by literature mining technology.Methods:Firstly,the literature about unstable angina pectoriswere searched from MEDLINE.Secondly,the molecular indicators were determined from the molecular network,which were through the literature mining in the Qi deficiency blood stasis syndrome and Qiblood stagnation syndrome.Lastly,the diagnosis pattern of syndrome biological characteristics was determined by the feature selection of literature mining.Results:From the gene indices,there were some indicators related to the Qi deficiency blood stasis syndrome such as endocrine,signal transduction and inflammatory response.Meanwhile,there were some correlation cluster about Qi-blood stagnation syndrome including the glycoprotein,the G protein coupling receptor signal transduction system and catecholamines transmitter activity regulation.The biological characteristics of TCM syndrome can be identified in the NEI.Conclusion:It is proved universality and reliability that literature mining method as a new method for finding syndrome abnormal biological indexes were feasible and further expanded the research to other syndromes.

Literature mining;NEI;Qi deficiency blood stasis syndrome;Qi-blood stagnation syndrome

R541.4

A

1004-745X(2015)05-0760-04

10.3969/j.issn.1004-745X.2015.05.003

2014-12-25)

國家自然科學(xué)基金(81173463);新世紀優(yōu)秀人才計劃(NCET-12-084);北京市科技新星計劃(xx2013032);北京市青年英才計劃項目(YETP0821)

△通信作者(電子郵箱:cjx@bucm.edu.cn)

猜你喜歡
氣滯證型氣虛
基于因子分析及聚類分析的241例感染后咳嗽中醫(yī)證素證型研究
治咽炎要分清證型
不同證型糖尿病的調(diào)理
身痛逐瘀湯敷貼治療氣滯血瘀型膝骨關(guān)節(jié)炎的臨床觀察
從五禽戲論治肝郁氣滯型功能性便秘
基于自適應(yīng)矩估計的BP神經(jīng)網(wǎng)絡(luò)對中醫(yī)痛經(jīng)證型分類的研究
脾胃氣滯多因肝胃不和
氣虛便秘用白術(shù)萊菔湯
氣虛了,病多了
逍遙散加減聯(lián)合果酸治療肝郁氣滯型黃褐斑的療效觀察
长治市| 绍兴县| 琼海市| 阿坝县| 南宁市| 枣庄市| 勃利县| 灵台县| 桃源县| 河西区| 江油市| 元朗区| 鹰潭市| 平昌县| 库尔勒市| 合江县| 丘北县| 旬邑县| 荃湾区| 积石山| 新闻| 阿克陶县| 景洪市| 通山县| 瑞安市| 江城| 洛扎县| 开平市| 呼玛县| 赫章县| 金华市| 潼南县| 交城县| 汉源县| 北票市| 嘉义市| 临安市| 西林县| 昭平县| 云龙县| 崇州市|