王偉明 盧 朋 陳建新 趙 云 暢洪昇 王 偉△
1.北京中醫(yī)藥大學(xué) (北京,100029) 2.中國科學(xué)院自動化研究所綜合信息系統(tǒng)研究中心 3.北京中醫(yī)藥大學(xué)信息中心4.軍事醫(yī)學(xué)科學(xué)院基礎(chǔ)醫(yī)學(xué)研究所
復(fù)雜網(wǎng)絡(luò)分析:復(fù)雜網(wǎng)絡(luò)是描述復(fù)雜系統(tǒng)的一種有效方式,對復(fù)雜網(wǎng)絡(luò)的分析有多種方法,本技術(shù)主要使用節(jié)點(diǎn)度來衡量生物指標(biāo)的關(guān)聯(lián)性,確定關(guān)鍵的生物指標(biāo)。所謂節(jié)點(diǎn)度是指該節(jié)點(diǎn)的連接數(shù),即節(jié)點(diǎn)的邊數(shù)。在本文中,節(jié)點(diǎn)度表示為生物指標(biāo)相關(guān)性。本技術(shù)使用復(fù)雜網(wǎng)絡(luò)描述相互關(guān)聯(lián)的生物指標(biāo),以3 018篇肝纖維化中醫(yī)證候醫(yī)學(xué)文獻(xiàn)為處理對象,從系統(tǒng)的、整體的、全局的觀點(diǎn)去考量生物指標(biāo),把生物指標(biāo)作為實(shí)體對象,建立生物指標(biāo)的復(fù)雜網(wǎng)絡(luò),通過使用文本挖掘的同現(xiàn)處理、復(fù)雜網(wǎng)絡(luò)分析,獲取關(guān)鍵核心的生物指標(biāo)。
1.1 檢索文獻(xiàn)與建立數(shù)據(jù)庫
1.1.1 依據(jù)2011年肝硬化中西醫(yī)結(jié)合診治共識[1],確定肝硬化中醫(yī)證候:肝氣郁結(jié)證/水濕內(nèi)阻證/濕熱蘊(yùn)結(jié)證/肝腎陰虛證/脾腎陽虛證/瘀血阻絡(luò)證,以此作為文獻(xiàn)研究對象。
1.1.2 在CNKI(《中國知網(wǎng)》)基本檢索窗口中確定“全文”,分別輸入:“肝纖維化”和“肝硬化”,“并含”“主題”“證候or證”:分別得到文獻(xiàn),肝氣郁結(jié)428篇,濕熱蘊(yùn)結(jié)326篇,水濕內(nèi)阻44篇,肝腎陰虛1 333篇,脾腎陽虛818篇,瘀血阻絡(luò)522篇,文獻(xiàn)發(fā)表時間:1981-2012年,共有文獻(xiàn)3 471篇,分別下載文獻(xiàn)。
1.1.3 納入標(biāo)準(zhǔn) 凡涉及到肝硬化 (或肝纖維化)中醫(yī)證候或某一證型與生物指標(biāo)的相關(guān)研究文獻(xiàn)均列為納入文獻(xiàn)。
1.1.4 排除標(biāo)準(zhǔn) ①非肝硬化或肝纖維化為主要內(nèi)容的相關(guān)文獻(xiàn)予以排除;②綜述性文章均予以排除;③經(jīng)閱讀發(fā)現(xiàn)內(nèi)容重復(fù)且為同一研究的文獻(xiàn),選擇資料最為完整的一篇文獻(xiàn)予以納入,其余排除;④僅有治療經(jīng)驗(yàn)而無相關(guān)生物理化指標(biāo)的醫(yī)案及治驗(yàn)性質(zhì)的文章予以排除。
1.1.5 篩選策略及錄入方法 對以上檢索到的3 471篇文獻(xiàn),進(jìn)行人工核對和閱讀,按照上述納入與排除標(biāo)準(zhǔn),篩選以肝硬化 (或肝纖維化)證候及相關(guān)生物指標(biāo)為主要研究內(nèi)容的文獻(xiàn)且為核心期刊收錄的文章3 018篇。對篩選文獻(xiàn)的基本信息進(jìn)行整理,文章題目、中醫(yī)證候、生物指標(biāo)、結(jié)論、文獻(xiàn)來源、作者、期刊等,并轉(zhuǎn)化至文本文檔錄入,建立數(shù)據(jù)庫。
2)改變超聲溫度313、323、333、343、353 K,超聲酸化后樣品編號記為ST1、ST2、ST3、ST4、ST5。
1.2 建立待選的生物指標(biāo)詞典 按照肝臟疾病臨床與基礎(chǔ)的類別與范圍,先廣泛初選相關(guān)指標(biāo)200個生物指標(biāo)如下[2~7]:
神經(jīng)內(nèi)分泌指標(biāo)(NEI):多巴胺 (DA),去甲腎上腺素(NE,NA),乙酰膽堿 (Ach),5-羥色胺 (5-HT),促腎上腺皮質(zhì)激素釋放激素 (CRH),腎上腺素 (AD),促腎上腺皮質(zhì)激素 (ACTH),性激素結(jié)合球蛋白 (SHBG),血漿皮質(zhì)酮(CORT),血清睪酮 (T),脫氧異雄酮,雄烷二酮 (AR),雌二醇 (Ez),雌酮 (EO),雌三醇 (E)a,性激素結(jié)合球蛋白 (SHBG),雌激素受體 (ER),γ干擾素 (interferon γ,IFNr)。
肝纖維化指標(biāo):透明質(zhì)酸 (HA)、層粘連蛋白 (LN)、Ⅲ型前膠原 (PCⅢ)、Ⅳ型膠原 (Ⅳ-C),TP,CG,PLD,組織型纖溶酶原激活物 (PA),組織型纖溶酶原激活物抑制劑(PAI)-1。
肝炎肝硬化指標(biāo):HBV DNA定量,HCV RNA,凝血酶原活動度 (PTA),丙氨酸氨基轉(zhuǎn)移酶 (ALT),天冬氨酸轉(zhuǎn)氨酶 (AST),總膽紅素 (TBil),IFNα,IFNγ,白蛋白 (A),球蛋白 (G),白蛋白/球蛋白比值 (A/G),血清膽堿酯酶(ChE),血清一氧化氮 (NO),血清內(nèi)皮素 (ET)-1,凝血酶原時間 (PT),部分凝血酶時間 (APTT),凝血酶時間(TT)。
細(xì)胞因子:白介素 (IL)-10,IL-13,IL-27,病毒脫氧核糖核酸單核細(xì)胞趨化蛋白-1(MCP-1),巨噬細(xì)胞抑制蛋白-2(MIP-2),紅細(xì)胞生成素 (EPO),血清粒細(xì)胞集落刺激因子(G-CSF),轉(zhuǎn)化生長因子 (TGF)β1,TGFβ2,肝細(xì)胞生長因子 (HGF),成纖維細(xì)胞生長因子 (FGF)。
血液流變學(xué)指標(biāo):門靜脈內(nèi)徑 (DPV),脾靜脈內(nèi)經(jīng)(DSV),門靜脈最大血流速度 (PVX),脾靜脈最大血流速度 (SVX),門靜脈血流量 (PVF),脾靜脈血流量 (SVF)。
分子生物學(xué)指標(biāo):肝星狀細(xì)胞 (HSCs),α-SMA蛋白,Ⅰ型膠原蛋白 (ColⅠ),Ⅲ型膠原蛋白 mRNA,Smad3表達(dá),AGE受體 (RAGE),NF-κB,p65 mRNA,RNAi,維甲類X受體α (RXR-α),視黃醇類核內(nèi)受體-α (retinoid X receptor-alpha,RXR-α) 基因,Hedgehog、MAPK、磷脂酰肌醇 3-激蛋白激酶B,SHAP-HA蛋白,腫瘤壞死因子 (TNF)-α,基質(zhì)金屬蛋白酶組織抑制因子 (TIMP)-1,血小板衍生生長因子(PDGF),基質(zhì)金屬蛋白酶 (MMP)-1,pcDNA-gremlin,細(xì)胞凋亡相關(guān)因子Caspase-3,腫瘤壞死因子相關(guān)凋亡誘導(dǎo)配體(TRAIL),CC趨化因子配體2(CCL2),缺氧誘導(dǎo)因子,Th1/Th2極化,誘導(dǎo)型一氧化氮合酶 (iNOS)mRNA,col-Ⅰ基因,col-Ⅲ基因,腎素-血管緊張素Ⅱ (AngⅡ)1型受體(AT1R)mRNA,熱休克蛋白 70(HSP70),血漿內(nèi)毒素,ED2,受體型蛋白酪氨酸磷酸酶 (PTPRJ),過氧化氫酶(CAT),肝再生增強(qiáng)因子 (ALR),ERK1蛋白。
免疫組化指標(biāo):Bcl-2表達(dá),Bax表達(dá),肝組織細(xì)胞核增殖抗原 (pcna),蛋白酶活化受體 (PARs)1,PAR2,MMP-2,TIMP-2,纖溶酶原激活物抑制物 (PAI-1),骨橋蛋白(OPN),PLT,直接膽紅素 (DBil)。
肝組織指標(biāo):羥脯氨酸 (Hyp),超氧化物歧化酶(SOD),谷胱甘肽 (GSH),單胺氧化酶 (MAO),丙二醛(MDA),IL-17。
基因:α1腎上腺素受體1A亞型基因 (ADRA1A),亞甲基四氫葉酸還原酶 (MTHFR)基因C677T,P22PHOX基因,(AT1R)基因A1166C,AT1R基因AC+CC基因型及C等位基因,醛固酮合成酶 (CYP11B2)基因T(-344)C,AT1R-810A/T,AT1受體基因mRNA,P2Y12基因TC/CC型,ACE基因DD基因型,內(nèi)皮型一氧化氮合酶基因 (eNOS),一氧化氮合酶基因 G894T(Glu298Asp),血管緊張素Ⅱ2型受體(AGTR2)基因1675A/G,血管緊張素原基因M235T,血管壁Ⅰ型膠原蛋白和基因,SLC6A2基因啟動子3(promoter3,rs168924),SLC6A2基因啟動子 2(promoter2,rs2397771),血小板膜受體P2Y12基因G52T、-T744C多態(tài)性:TC/CC基因型,蛋白酪氨酸磷酸酶1B(PTP-1B)基因位點(diǎn)IVS6+G82A(G突變),過氧化物酶體增殖物激活受體 (PPARγ)C161T基因,心鈉素 (ANP)基因T2238C多態(tài)性及其C型受體 (NPRC)基因A-55C,內(nèi)皮素-2(endothelin-2,ET-2)基因A985G,血管緊張素原 (AGT)基因T174M,eNOS G894T基因型TT型純合子。
其他指標(biāo):ⅳ型膠原 (ⅳ-c),α2巨球蛋白 (α2ma),γ谷氨酰轉(zhuǎn)肽酶 (GGT),脂肪細(xì)胞刺激因子 (lsp),γ球蛋白,人單核細(xì)胞趨化蛋白-3(mcp-3),神經(jīng)肽γ(NPγ),血管活性腸肽 (VIP),胰高血糖素 (Glu),生長抑素 (SS),兒茶酚胺 (CA),血管加壓素 (AVP),腦啡肽,腦利尿鈉肽或腦鈉肽 (BNP),C型鈉尿肽 (CNP),前列腺素 (PG),激肽酶,腎上腺髓質(zhì)素 (ADM),醛固酮 (ALD),血漿腎素活性 (PRA),ET-1或 ET,NO,iNOS,前列環(huán)素 (PGI2),血管內(nèi)皮生長因子 (VEGF),血管收縮因子 (EDCF),血管舒張因子 (EDRF),結(jié)締組織生長因子 (CTGF),血栓素(TX)A2,TXB2,6-酮-前列腺素F1α (6-K-PGF1α),降鈣素基因相關(guān)肽 (CGRP),ANP,降壓肽類激素心鈉素(ANF),P物質(zhì) (SP),血漿β-內(nèi)啡肽 (β-EP),血漿硫化氫(H2S),男性卵泡刺激素 (FSH),黃體生成素 (LH)血小板-白細(xì)胞聚集PagT,高敏C反應(yīng)蛋白或C應(yīng)蛋白 (H-CRP或HsCRP 或 CRP),IL-6,IL-1, 尿 N-乙 酰-β-葡 萄 糖 苷 酶(NAG),肌酐 (Cr),尿酸 (UA),24小時尿蛋白 (24小時PRO),外周血淋巴細(xì)胞過氧化物酶體增殖物激活受體γ信使核糖核酸PPARγ(mRNA),酪氨酸羥化酶 (TH),c-fos,總膽固醇 (TCh),甘油三酯 (TG),低密度脂蛋白膽固醇(LDL-C),高密度脂蛋白膽固醇 (HDL-C),脂蛋白a(LP-a),低密度脂蛋白自身抗體 (Ab-OX-LDL),血友病因子(vWF),P選擇素GMP-140,胰島素抵抗 (IR),天冬氨酸(Asp),γ-氨基丁酸 (GABA),?;前彼?(Tau)。
1.3 統(tǒng)計學(xué)方法 應(yīng)用復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)度技術(shù)進(jìn)行計算機(jī)自動分析[8~10]。
1.3.1 確定復(fù)雜的網(wǎng)絡(luò)節(jié)點(diǎn) 根據(jù)生物指標(biāo)詞典,識別每一篇文獻(xiàn)的生物指標(biāo),記為Ci= {v1,v2,v3……vi},其中Ci表示第i篇醫(yī)學(xué)文獻(xiàn)中生物指標(biāo)集合,把生物指標(biāo)作為網(wǎng)絡(luò)節(jié)點(diǎn)。
1.3.2 確定復(fù)雜網(wǎng)絡(luò)的邊 根據(jù)節(jié)點(diǎn)同現(xiàn)關(guān)系,出現(xiàn)在同一篇文獻(xiàn)中的生物指標(biāo) (節(jié)點(diǎn))是相互關(guān)聯(lián),所有邊記為E={e1,e2,e3……ei}。
1.3.3 構(gòu)建復(fù)雜網(wǎng)絡(luò) 根據(jù)所有文獻(xiàn)中識別到的生物指標(biāo)節(jié)點(diǎn)以及節(jié)點(diǎn)關(guān)聯(lián),構(gòu)建生物指標(biāo)的復(fù)雜網(wǎng)絡(luò),記為G=[V(G),E(G)]。
1.3.4 計算網(wǎng)絡(luò)節(jié)點(diǎn)度 節(jié)點(diǎn)度為頂點(diǎn)關(guān)聯(lián)的邊的數(shù)目,記為de(vk)。
1.3.5 網(wǎng)絡(luò)節(jié)點(diǎn)度排序 根據(jù)節(jié)點(diǎn)度的大小進(jìn)行,從大往小排序,記為D={d1,d2,d3……dn}。最終獲取度數(shù)靠前的生物指標(biāo)。
2.1 生物指標(biāo)關(guān)聯(lián)圖 見插頁圖1。
2.2 關(guān)聯(lián)度高的生物指標(biāo)排序情況 見表1。
表1 頻次居前15位的肝纖維化患者證候與生物指標(biāo)的關(guān)聯(lián)度
3.1 分析結(jié)果 通過復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)度技術(shù),運(yùn)用計算機(jī)自動分析,可以從海量文獻(xiàn)數(shù)據(jù)中將200個與肝纖維化相關(guān)中醫(yī)證候生物學(xué)指標(biāo)范圍快速、準(zhǔn)確地縮小到15個關(guān)聯(lián)度最高的核心指標(biāo),15個核心指標(biāo)涉及類別主要是NEI網(wǎng)絡(luò),肝臟疾病,肝纖維化,肝臟炎癥,是神經(jīng)免疫內(nèi)分泌整體與肝臟局部病變相結(jié)合的網(wǎng)絡(luò)系統(tǒng),這正與肝硬化中醫(yī)證候肝藏血主疏泄,調(diào)暢情志、調(diào)儲血量、濡養(yǎng)肝及筋目的整體觀有一定的符合度。
3.2 數(shù)據(jù)挖掘技術(shù)評價 中醫(yī)證候?qū)ΜF(xiàn)代生物文獻(xiàn)的利用,常常受數(shù)據(jù)挖掘方法的限制,本課題采用一種可優(yōu)選的技術(shù)方法,將200種以上的生物指標(biāo)客觀、科學(xué)、快速地縮小至15個指標(biāo),可以更為深入有效地利用現(xiàn)有文獻(xiàn)數(shù)據(jù)庫,從中歸納總結(jié)現(xiàn)階段中醫(yī)藥研究的成果,從文獻(xiàn)挖掘的角度探討肝纖維化中醫(yī)證候與生物指標(biāo)的相關(guān)性,探尋反映不同證候肝纖維化的共性病理改變以及各個證候所特有的病理特征的核心指標(biāo),為今后進(jìn)一步進(jìn)行多中心大樣本的證候與生物指標(biāo)相關(guān)性的臨床研究提供參考。
3.3 問題與展望 由于肝纖維化與肝硬化在生物領(lǐng)域的兼夾,對該方法挖掘出來的關(guān)鍵生物指標(biāo)還是需要臨床和基礎(chǔ)專家進(jìn)一步在實(shí)際工作中進(jìn)行選取,通過實(shí)驗(yàn)不斷驗(yàn)證應(yīng)用。該研究成果也有可能拓展至其他病證結(jié)合領(lǐng)域的核心指標(biāo)篩選過程,為中醫(yī)證候與現(xiàn)代科學(xué)關(guān)系的研究搭起一條新的橋梁。
[1]劉成海,危北海.肝硬化中西醫(yī)結(jié)合診治共識[J].中國中西醫(yī)結(jié)合消化雜志,2011,19(4):277-279.
[2]巫協(xié)寧.臨床肝膽系病學(xué) (新版) [M].上海:上海科學(xué)技術(shù)文獻(xiàn)出版社,2002:440.
[3]黃耀煊.肝病分子生物學(xué)[M].福州:福建科學(xué)技術(shù)出版社,2003:437.
[4]王吉耀.現(xiàn)代肝病診斷與治療 [M].上海:復(fù)旦大學(xué)出版社,2007:440.
[5]陳悅,龔作炯.肝臟疾病診療進(jìn)展[M].武漢:湖北科學(xué)技術(shù)出版社,2008:392.
[6]李發(fā)旺.中西醫(yī)結(jié)合診治:肝炎、肝硬化與肝癌[M].蘭州:蘭州大學(xué)出版社,2008:320.
[7]蕭樹東.消化系疾病基礎(chǔ)與臨床進(jìn)展[M].上海:上海科學(xué)技術(shù)文獻(xiàn)出版社,2005:324.
[8]GIRVAN M,NEWMAN ME.Community structure in social and biological networks[J].Proc Natl Acad Sci USA,2002,99(12):7821-7826.
[9]汪小帆,李翔,陳關(guān)榮.復(fù)雜網(wǎng)絡(luò)理論及其應(yīng)用 [M].北京:清華大學(xué)出版社,2006:260.
[10]M.E.J.NEWMAN.The Structure and Function of Complex Networks[J].SIAM Rev,2003,3(10):167-256.