国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

共詞分析及網(wǎng)絡分析法探測乳腺癌轉(zhuǎn)移相關(guān)基因

2016-03-21 08:58:52,
中華醫(yī)學圖書情報雜志 2016年3期
關(guān)鍵詞:行動者度數(shù)語義

乳腺癌是女性最常見的惡性腫瘤之一,大約有10%-15%的乳腺癌患者在首次確診為原發(fā)腫瘤3年后都會伴發(fā)其他嚴重疾病或發(fā)生遠處轉(zhuǎn)移。轉(zhuǎn)移是導致乳腺癌患者死亡的主要原因,因此阻止乳腺癌的浸潤和轉(zhuǎn)移是現(xiàn)代乳腺癌治療中的關(guān)鍵環(huán)節(jié)。

乳腺癌轉(zhuǎn)移是一個由多基因參與及多步驟完成的復雜過程。乳腺癌轉(zhuǎn)移相關(guān)基因是一類功能上能促進或阻斷腫瘤轉(zhuǎn)移潛能而不影響腫瘤細胞生長增殖的基因,可分為轉(zhuǎn)移促進基因和轉(zhuǎn)移抑制基因兩大類。轉(zhuǎn)移促進基因有HER-2、BCSG1、MMPs等,轉(zhuǎn)移抑制基因有nm23、BRMS1等。相關(guān)研究較多,但目前未見從文本角度挖掘乳腺癌轉(zhuǎn)移相關(guān)基因的研究。

共詞分析法是20世紀70年代由法國的文獻計量學家提出的,其原理是對一組詞兩兩統(tǒng)計它們在同一篇文獻中出現(xiàn)的次數(shù)。以此為基礎對這些詞進行聚類分析或網(wǎng)絡分析等,可以反映這些詞之間的親疏關(guān)系及其代表的學科和主題的結(jié)構(gòu)變化[1]。國內(nèi)最早將共詞分析法應用于醫(yī)學文獻分析[2],目前已廣泛應用于知識管理、生物信息學、納米科技、土地研究、人力資源、城市信息化、閱讀療法研究、奶牛繁殖研究等各個領域的文獻分析[3-6]。社會網(wǎng)絡分析是綜合運用圖論、數(shù)學模型來研究行動者與行動者、行動者與其所處社會網(wǎng)絡及一個社會網(wǎng)絡與另一個社會網(wǎng)絡之間關(guān)系的一種結(jié)構(gòu)分析方法,近年來在圖書情報、計算機軟件與計算機應用、新聞傳媒、企業(yè)管理、醫(yī)學等領域得到了廣泛應用[7-10]。

本文嘗試基于共詞分析法,從PubMed數(shù)據(jù)庫檢索獲取乳腺癌轉(zhuǎn)移與基因關(guān)系的研究文獻,利用MetaMap進行概念匹配后抽取乳腺癌轉(zhuǎn)移相關(guān)基因,建立乳腺癌轉(zhuǎn)移-基因矩陣和基因-基因矩陣,再利用Ucinet軟件建立乳腺癌轉(zhuǎn)移相關(guān)基因的相互作用網(wǎng)絡,分析網(wǎng)絡拓撲結(jié)構(gòu)及其作用,以探測基因與轉(zhuǎn)移癌的關(guān)系,為乳腺癌轉(zhuǎn)移的早期診斷和治療提供參考。

1 研究工具

1.1 概念匹配程序MetaMap

由Lister Hill National Center for Biomedical Communications(美國生物醫(yī)學通訊中心)開發(fā)的MetaMap,是一個將生物醫(yī)學文本與一體化醫(yī)學語言系統(tǒng)(Unified Medical Language System,UMLS)超級詞表中的概念匹配的程序。MetaMap使用知識密集方法,采用符號、自然語言處理和計算機語言學等技術(shù),能基于語義關(guān)系提取疾病、基因、蛋白等知識,完成概念組配。MetaMap首先把題目和文摘中的各個句子解析成多個詞或短語,然后列出每個詞或短語候選詞,根據(jù)所選擇的候選詞在UMLS所出現(xiàn)的相關(guān)語義類型和研究領域進行匹配,得到文本中的主要概念。MetaMap主要應用于信息檢索和數(shù)據(jù)挖掘,是美國國立醫(yī)學圖書館(NLM)初步標引系統(tǒng)(indexing initiative system)的基礎之一,這個標引系統(tǒng)應用于圖書館半自動和全自動的生物醫(yī)學文獻標引[11]。

1.2 dataMiner數(shù)據(jù)分析軟件

dataMiner軟件是由中國醫(yī)科大學閆雷開發(fā)的。它可根據(jù)UMLS超級詞表,選擇需要的語義類型,將所得結(jié)果按所需的百分比或前幾位列出,用于統(tǒng)計概念匹配后文本中兩個詞或詞組在同一標題、摘要、句子及正文中出現(xiàn)的次數(shù),形成矩陣。

1.3 社會網(wǎng)絡分析軟件 Ucinet

Ucinet(University of California at Irvine NETwork)最初由加州大學爾灣分校學者Linton Freeman編寫的,集成了可以對一維和二維數(shù)據(jù)進行統(tǒng)計和可視化分析的NetDraw軟件,將網(wǎng)絡結(jié)構(gòu)可視化,是綜合性社會網(wǎng)絡分析工具[12]。Ucinet可以對網(wǎng)絡拓撲結(jié)構(gòu)進行統(tǒng)計分析,包括網(wǎng)絡密度、中心度、最短路徑、子群等。

2 研究步驟和結(jié)果分析

2.1 利用MetaMap進行概念匹配

以“breast neoplasms[majr] AND genes[majr] AND Neoplasm Metastasis[Mesh] AND humans[mesh]”為檢索策略(1966年1月1日-2015年7月31日),在PubMed共檢索到375篇乳腺癌轉(zhuǎn)移相關(guān)基因文獻,以MEDLINE格式進行保存,作為挖掘樣本。將MEDLINE格式文本上傳到在線MetaMap,選擇UMLS涵蓋的所有詞表及所有語義類型,進行概念匹配,得到所保存文獻題名和摘要的UMLS概念匹配結(jié)果。

2.2 利用數(shù)據(jù)分析軟件得到矩陣

首先,將概念匹配結(jié)果導入數(shù)據(jù)挖掘軟件,基因選擇的語義類型為[Gene or Genome],轉(zhuǎn)移癌的語義類型為[neoplastic process],選取同句共現(xiàn)的矩陣,得到與乳腺癌轉(zhuǎn)移相關(guān)基因。然后,再將X軸和Y軸共同選擇語義類型[Gene or Genome],得到基因之間相互作用的矩陣。刪除范圍過于廣泛的基因名稱(如genes,alleles,locus,tumor suppressor genes,proto-oncogenes等)和重復的基因名稱(如tp53 gene與tp53 wt allele等),合并表示同一基因的不同基因名稱(如erbb、egfr和c-erbb-1合并為egfr,使用Genebank中的官方名稱),刪除錯配的基因名(如gene A錯配為genes,vif),最終得到44×44的基因-基因矩陣,并將對角線的基因出現(xiàn)次數(shù)設置為0(表1)。

表1 基因-基因共現(xiàn)矩陣(44行×44列)(部分)

2.3 基因相互作用網(wǎng)絡的建立和拓撲結(jié)構(gòu)分析

利用Ucinet 6的數(shù)據(jù)轉(zhuǎn)換功能將處理后的基因-基因共現(xiàn)矩陣進行二值化處理,利用自帶的Netdraw生成基因相互作用網(wǎng)絡(圖1),利用network功能分析基因網(wǎng)絡的拓撲結(jié)構(gòu),包括核心和外緣(圖2)、度數(shù)中心度(圖3)、中間中心度(圖4)、結(jié)構(gòu)洞。

圖1 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用網(wǎng)絡圖

圖2 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用核心和外緣(部分)

圖3 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用度數(shù)中心度(部分)

圖4 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用中間中心度(部分)

由圖1可知,網(wǎng)絡圖共有44個節(jié)點、146條線。

從圖2可以看出,核心基因為bcl2、brca1、brca2、cd69、cdh1、cdkn2a、Egfr、erbb2、esr1、myc、nr4a1、thra、tp53,其余31個基因為邊緣基因。

絕對度數(shù)中心度是某點與其他點直接相連的個數(shù)。如果某點具有最高的度數(shù),則稱該點居于中心,有可能擁有最大的權(quán)力[12]。從圖3可知,tp53度數(shù)最大為13,度數(shù)中心度排在前10的基因是tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69、cdkn2a、bcl2,最小度數(shù)是1。因此,tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69、cdkn2a和bcl2的度數(shù)最多,權(quán)力最大,處于中心位置。

另一個表征行動者個體中心度的指標是中間中心度,它測量的是行動者對資源控制的程度。如果一個點處于許多其他點對的捷徑(最短路徑)上,則該點具有較高的中間中心度[12]。從圖4可知,blid、bcpr、akr1a1、chafla、bcl2l1、kidins220、cxcr4和mir200b等19個基因的中間中心度為0,不能控制任何其他行動者,處于網(wǎng)絡邊緣[12];erbb2、esr1、cdh1、cd69、egfr、nr4a1、tp53、s100a4和thra處于網(wǎng)絡的中間連接位置,連接能力依次遞減。

結(jié)構(gòu)洞是“社會網(wǎng)絡中的某個或某些個體和有些個體發(fā)生直接聯(lián)系,但與其他個體不發(fā)生直接聯(lián)系,無直接聯(lián)系或關(guān)系間斷(disconnection)的現(xiàn)象,從網(wǎng)絡整體看好像網(wǎng)絡結(jié)構(gòu)中出現(xiàn)了洞穴”。結(jié)構(gòu)洞的等級度越高,該點越居于網(wǎng)絡的核心,其控制力也越大[12],tp53、thra、erbb2、esr1、cdh1和egfr等級度依次遞減,說明其控制力也依次遞減。

3 結(jié)論與討論

與乳腺癌轉(zhuǎn)移相關(guān)的基因中,13個核心基因按照核心程度由高到低排列依次為tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69、bcl2、cdkn2a、brca2、myc、brca1,其余31個為邊緣基因。

tp53官方全稱為腫瘤蛋白p53(tumor protein p53),別稱有P53、BCC7、LFS1和TRP53。tp53蛋白能通過調(diào)節(jié)細胞周期和避免細胞癌變發(fā)生,保持基因組的穩(wěn)定性,避免突變發(fā)生。在遺傳性乳腺癌和散發(fā)性乳腺癌患者中,tp53突變均會引起雜合性丟失增強和等位基因失衡,但遺傳性乳腺癌患者的突發(fā)率高于散發(fā)性。端粒紊亂激活p53,反過來結(jié)合pgc1-α和pgc1-β將其抑制,從而促進端粒和線粒體直接連接[13]。

目前關(guān)于tp53基因突變能否預測乳腺癌轉(zhuǎn)移有很大爭議。劉祖宏等[14]對92例乳腺潤性導管癌患者的標本進行檢測發(fā)現(xiàn),乳腺淋巴結(jié)轉(zhuǎn)移與p53蛋白表達呈正相關(guān),提示p53基因突變與腫瘤細胞的侵襲轉(zhuǎn)移有相關(guān)性,可能增強腫瘤細胞的增殖能力,促進腫瘤浸潤轉(zhuǎn)移。汪海新等[15]通過免疫組化方法檢測359例乳腺浸潤性導管癌組織中p53的表達情況卻得出了相反的結(jié)論,即p53蛋白的表達在區(qū)域淋巴結(jié)無轉(zhuǎn)移之間的差異均無統(tǒng)計學意義。

Erbb2(c-erbb2原癌基因)、Brca1(breastCancer SusceptibilityGene 1,腫瘤易感基因)、egfr(epidermal growth factor receptor,表皮生長因子受體)均參與乳腺癌轉(zhuǎn)移。

鄭偉等[16]選擇42例乳腺癌患者石蠟固定的組織標本,用SABC免疫組織化學方法檢測EGFR、C-erbB-2蛋白發(fā)現(xiàn),EGFR的陽性率為42.9%,C-erbB-2的陽性率為31%,EGFR、C-erbB-2表達與乳腺癌骨髓微小轉(zhuǎn)移有密切關(guān)系,可以作為判斷乳腺癌預后的重要指標。韓芳芳等[17]應用免疫組織化學PV-9000法檢測83例乳腺基底細胞樣癌腫BRCA1、EGFR的表達發(fā)現(xiàn)BRCA1的陽性表達率為57.83%,EGFR的陽性表達率為87.95%,且各組間的不同臨床分期、不同淋巴結(jié)轉(zhuǎn)移情況各組間均有統(tǒng)計學意義,但與二者的表達無相關(guān)性。

文獻調(diào)研發(fā)現(xiàn),tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69等13個核心基因中,大部分都與乳腺癌轉(zhuǎn)移有直接或間接的關(guān)系,但cd69對于乳腺癌轉(zhuǎn)移的具體病理生理學過程尚不明確,需要進一步驗證。這可能是因為cd69基因?qū)儆贜K細胞信號傳導基因復合體家族參與細胞增殖,表達蛋白在自然殺傷細胞和血小板中傳導信號,與血液系統(tǒng)疾病及免疫相關(guān)性疾病的發(fā)生與發(fā)展密切相關(guān),也可能與乳腺癌轉(zhuǎn)移相關(guān)。

4 結(jié)語

本文利用MetaMap概念匹配PubMed中375篇乳腺癌轉(zhuǎn)移相關(guān)基因文獻的標題和摘要,用數(shù)據(jù)挖掘軟件得到乳腺癌轉(zhuǎn)移相關(guān)基因和基因-基因相互作用矩陣,用Ucinet 6分析網(wǎng)絡相關(guān)指標,得到13個核心基因,希望利用基因與轉(zhuǎn)移癌的關(guān)系對乳腺癌轉(zhuǎn)移的早期診斷和個性治療提供參考。

此外,不足之處是cd69基因?qū)τ谌橄侔┺D(zhuǎn)移的具體過程尚不明確,還需進一步實驗驗證。MetaMap存在錯誤匹配和遺漏匹配的現(xiàn)象,在準確性和全面性方面有所欠缺。

猜你喜歡
行動者度數(shù)語義
與異質(zhì)性行動者共生演進:基于行動者網(wǎng)絡理論的政策執(zhí)行研究新路徑
眼鏡的度數(shù)是如何得出的
圖形中角的度數(shù)
語言與語義
隱形眼鏡度數(shù)換算
敬仰中國大地上的綠色行動者
綠色中國(2016年1期)2016-06-05 09:02:59
“上”與“下”語義的不對稱性及其認知闡釋
網(wǎng)絡行動者的新媒體使用特征、影響及媒介民主化
新聞傳播(2015年3期)2015-07-12 12:22:28
做“互聯(lián)網(wǎng)+”的積極行動者
學習月刊(2015年9期)2015-07-09 05:33:44
認知范疇模糊與語義模糊
申扎县| 金寨县| 永兴县| 渝中区| 香格里拉县| 淮阳县| 绥滨县| 读书| 鸡东县| 彭山县| 金阳县| 灵武市| 正定县| 东宁县| 娄烦县| 石台县| 南靖县| 龙海市| 锦州市| 博客| 姚安县| 渝中区| 涟水县| 新沂市| 教育| 拉孜县| 崇阳县| 额尔古纳市| 大埔区| 南召县| 怀柔区| 孝感市| 米泉市| 娄烦县| 阳谷县| 静宁县| 邵武市| 清远市| 安福县| 纳雍县| 金沙县|