徐 潔,鄭 光,何小鵑,呂愛平,馬超英
(1.西南交通大學(xué),成都 610031;2.中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700;3.蘭州大學(xué)信息學(xué)院,蘭州 730000)
隨著生物醫(yī)學(xué)的不斷發(fā)展,大量的醫(yī)學(xué)數(shù)據(jù)和信息逐漸積累,利用數(shù)據(jù)挖掘技術(shù)提取出潛在的有用知識(shí)和信息進(jìn)行分析,已成為醫(yī)學(xué)研究的重要方向。文本數(shù)據(jù)挖掘(Text Mining),亦稱文本挖掘或文字勘探,是基于數(shù)據(jù)挖掘?qū)ξ谋鹃_發(fā)的一種信息提取分析技術(shù),可對(duì)海量數(shù)據(jù)信息進(jìn)行整合、分析,以獲得更具有代表性和更高可信度的結(jié)果,常用于探討疾病治療的用藥規(guī)律[1]。
胰腺癌(Pancreatic cancer,PC)致死率高居惡性腫瘤第四位,其病人平均存活期短,只有5~6個(gè)月,5年生存率不足6%[2,3]。胰腺癌具有癌細(xì)胞易轉(zhuǎn)移[4]和多重耐藥性[5]等特點(diǎn),嚴(yán)重阻礙治療。近年來,眾多研究結(jié)果顯示中醫(yī)藥治療胰腺癌具有獨(dú)到之處,尤其是中西藥結(jié)合治療效果顯著。本文利用文本挖掘技術(shù)探尋胰腺癌的臨床用藥規(guī)律,以期為胰腺癌的科學(xué)研究提供參考。
登錄中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(Chinese BioMedical Literature Database,CBM,http://sinomed.cintcm.ac.cn/index.jsp),在“缺省”狀態(tài)下,以“胰腺癌”為關(guān)鍵詞進(jìn)行檢索,共得到文獻(xiàn)10426篇(檢索日期:2013/11/1),并選擇“詳細(xì)”和“記錄號(hào)”的顯示格式,以獲得每篇文獻(xiàn)的流水號(hào)、標(biāo)題、摘要、主題詞等信息備用。
按照下載的先后順序?qū)⑹占降臄?shù)據(jù)整合到一個(gè)平面文件(TXT)中,以ANSI編碼格式保存,借助專門的文本提取工具(軟件著作權(quán),軟著登字第0261882號(hào),登記號(hào)2010SR073409)對(duì)“1.1”中下載的非結(jié)構(gòu)化TXT文本數(shù)據(jù)進(jìn)行信息提取,以格式化形式儲(chǔ)存于大型關(guān)系型數(shù)據(jù)庫(Microsoft SQL Server,SQL)中處理。
文章中出現(xiàn)的關(guān)鍵詞可反映文章信息,相互關(guān)聯(lián)的關(guān)鍵詞之間存在著“共同出現(xiàn)”的特點(diǎn),其中高頻協(xié)同的關(guān)鍵詞是科研工作者分析的很好素材。因此,采用相應(yīng)的算法構(gòu)建針對(duì)每一篇文獻(xiàn)中共同出現(xiàn)的關(guān)鍵詞對(duì),從而得到關(guān)鍵詞對(duì)數(shù)據(jù)表并進(jìn)行頻次統(tǒng)計(jì),合并相同的關(guān)鍵詞,統(tǒng)計(jì)其在文獻(xiàn)摘要中出現(xiàn)的頻次。該頻次數(shù)據(jù)表包含關(guān)鍵詞對(duì)以及對(duì)應(yīng)頻次,每個(gè)關(guān)鍵詞對(duì)僅有1個(gè)結(jié)果。
從關(guān)鍵詞對(duì)頻次數(shù)據(jù)表中抽取出不同頻次的關(guān)鍵詞對(duì),采用軟件Cytoscape 2.8進(jìn)行可視化處理,形成可視化網(wǎng)絡(luò)圖。
人工閱讀初步挖掘結(jié)果發(fā)現(xiàn),異常條目通過反查原文獻(xiàn)確認(rèn)為噪音,如中藥天冬具有養(yǎng)陰清熱、潤肺滋腎的功效,常用于肺燥干咳、頓咳痰黏、咽干口渴、腸燥便秘等癥狀,與胰腺癌治療并無關(guān)聯(lián)。然而挖掘結(jié)果顯示,天冬的頻數(shù)最高。因此,返回原文獻(xiàn)查閱發(fā)現(xiàn),51個(gè)天冬條目中有48條是由“天冬氨酸”中的子字符串“天冬”引起,2條由“天冬酰胺”中的子字符串“天冬”引起,1條由“半胱天冬酶”中的子字符串“天冬”引起(見表1和表2)。人工篩查發(fā)現(xiàn)噪音出現(xiàn)的規(guī)律,依據(jù)這些規(guī)律構(gòu)建降噪規(guī)則,以優(yōu)化挖掘結(jié)果。
表1顯示,初步挖掘結(jié)果顯示,治療胰腺癌的常用中藥為天冬、大黃、苦參、藜蘆、雷公藤、人參、薏苡仁、姜黃、柴胡和黃芪。返查原文獻(xiàn)發(fā)現(xiàn)有噪音出現(xiàn),人工降噪后重新進(jìn)行文本挖掘優(yōu)化結(jié)果(詳見“2.2”)。表2顯示,治療胰腺癌的常用西藥為吉西他濱、氟尿嘧啶、順鉑、5-氟尿嘧啶、生長抑素、奧沙利鉑、造影劑、阿霉素、絲裂霉素、卡培他濱。返查原文獻(xiàn)發(fā)現(xiàn)噪音—“造影劑”,人工降噪后重新挖掘得到新結(jié)果(詳見“2.3”)。
表1 中藥挖掘結(jié)果噪音確認(rèn)
圖1、2顯示,雷公藤是治療胰腺癌最常用的中藥,其次為人參和薏苡仁。具有益氣養(yǎng)陰、消腫散結(jié)功效的康萊特注射液是治療胰腺癌最常用的中成藥,姜黃素和復(fù)方苦參注射液則分別位列第二和第三。
表2 西藥挖掘結(jié)果噪音確認(rèn)
圖1 胰腺癌常用中藥使用文獻(xiàn)頻數(shù)圖
圖2 胰腺癌常用中成藥使用文獻(xiàn)頻數(shù)圖
圖3、4顯示,治療胰腺癌的首選藥物吉西他濱使用頻數(shù)最高,與臨床實(shí)際應(yīng)用相吻合。其余西藥使用頻數(shù)由高到低依次為氟尿密度、順鉑、5-氟尿嘧啶、生長抑素、奧沙利鉑、阿霉素、絲裂霉素、卡培他濱、奧曲肽,均為抗腫瘤的一線藥物。除單獨(dú)使用外,吉西他濱、順鉑、氟尿嘧啶等還多與其他西藥聯(lián)用,如吉西他濱常與卡培他濱、奧沙利鉑等聯(lián)用,順鉑常與阿霉素、絲裂霉素等聯(lián)用。
圖3 胰腺癌常用西藥使用文獻(xiàn)頻數(shù)圖
圖4 胰腺癌常用西藥聯(lián)用文獻(xiàn)頻數(shù)圖
圖5顯示,5-氟尿嘧啶多與中成藥聯(lián)用,包括康萊特、三妙散、舒血寧注射液、強(qiáng)力寧等??等R特常與5-氟尿密度和順鉑聯(lián)用。此外,康艾注射液常與吉西他濱聯(lián)用。
圖5 胰腺癌常用中成藥和西藥聯(lián)用文獻(xiàn)頻數(shù)圖
由文本挖掘結(jié)果得知,雷公藤是胰腺癌治療最常用的中藥。雷公藤主要成分雷公藤甲素是一種廣譜抗癌藥,其抗癌活性比傳統(tǒng)抗癌藥物順鉑、阿霉素、紫杉醇等更強(qiáng)[6,7]。體外研究顯示,低濃度雷甲素能有效誘導(dǎo)胰腺癌細(xì)胞凋亡,尤其對(duì)胰腺癌耐藥細(xì)胞株有殺傷作用,是極具潛力的抗癌候選藥[8]。其余常用中藥人參、薏苡仁、柴胡和苦參等均已證實(shí),具有良好的抗腫瘤活性。多項(xiàng)研究結(jié)果表明,薏苡仁煎劑、丙酮提取物或醇提物具有明顯的抑癌作用[9],尤其是薏苡仁油具有抗人胰腺癌BxPC-3細(xì)胞增殖的作用,上調(diào)IL-18表達(dá)[10]??鄥⒅饕煞盅趸鄥A,可下調(diào)人胰腺癌SW1990細(xì)胞的血管內(nèi)皮生子因子(Vascular endothelial growth factor,VEGF)和基質(zhì)金屬蛋白酶2(matrix metallo proteinases 2, MMP-2)mRNA表達(dá),抑制癌細(xì)胞侵襲和轉(zhuǎn)移[11,12]。
康萊特注射液是治療胰腺癌最常用的中成藥,其次為姜黃素和復(fù)方苦參注射液??等R特是一種新型抗腫瘤制劑,主要成分為中藥薏苡仁中提取得到的薏苡仁油。眾多研究報(bào)道,康萊特可誘導(dǎo)胰腺癌細(xì)胞凋亡,殺傷癌細(xì)胞,同時(shí)提高免疫力[13,14]。姜黃素是從姜科植物姜黃中提取的一種酚類化合物。現(xiàn)代藥理學(xué)研究證實(shí),姜黃素可通過抑制Ras-ERK、shh-GLI1和STAT3等信號(hào)通路活化,進(jìn)一步抑制下游靶基因表達(dá),從而抑制胰腺癌細(xì)胞增殖并誘導(dǎo)細(xì)胞凋亡[15,16]。
吉西他濱、5-氟尿嘧啶和順鉑是治療腫瘤的常用藥物,其中吉西他濱是治療胰腺癌的首選藥物。由挖掘結(jié)果可得,使用頻次較高的藥物均是臨床常用的一線抗腫瘤藥物,諸如5-氟尿嘧啶、奧沙利鉑、阿霉素等,與臨床實(shí)際應(yīng)用相吻合。
中西藥聯(lián)用是目前治療胰腺癌的重要策略,合理聯(lián)用中西藥不僅能起到增強(qiáng)療效的作用,還可降低不良反應(yīng)發(fā)生率。如姜黃素聯(lián)合吉西他濱或順鉑可顯著抑制胰腺癌PANC-1細(xì)胞增殖,提高PANC-1細(xì)胞對(duì)順鉑的敏感性,降低藥物有效治療濃度[17]。王偉等研究康萊特聯(lián)合5-氟尿嘧啶治療人胰腺癌PC-3細(xì)胞裸鼠皮下移植瘤實(shí)驗(yàn),發(fā)現(xiàn)康萊特顯著提高胰腺癌細(xì)胞凋亡率,降低Bcl-2的蛋白質(zhì)水平表達(dá),二者聯(lián)用治療胰腺癌效果優(yōu)于兩藥單獨(dú)使用[18]。本研究結(jié)果顯示,康萊特注射液常與5-氟尿嘧啶或順鉑聯(lián)用。5-氟尿嘧啶廣泛應(yīng)用于治療胰腺癌等在內(nèi)的實(shí)體瘤,通過抑制胸苷酸合成酶活性誘導(dǎo)敏感腫瘤細(xì)胞凋亡。順鉑則通過結(jié)合腫瘤細(xì)胞膜上的蛋氨酸轉(zhuǎn)運(yùn)蛋白,阻止蛋氨酸進(jìn)入胞內(nèi),進(jìn)而破壞腫瘤細(xì)胞DNA合成?;熕幬锒嗑哂袆┝恳蕾囆裕S著劑量的增加,患者不可避免地出現(xiàn)高效高毒現(xiàn)象。因而降低化療藥物的使用劑量,同時(shí)合理配伍中成藥是治療胰腺癌的有效途徑。
本文利用文本挖掘從海量文獻(xiàn)中探尋治療胰腺癌的用藥規(guī)律,獲得的結(jié)果忠于原文獻(xiàn)的表述。在未來的應(yīng)用中,應(yīng)注意篩查和去除噪音。通過審閱初步挖掘結(jié)果,若發(fā)現(xiàn)異常則進(jìn)一步返查原文獻(xiàn)確認(rèn)是否為噪音,一旦確認(rèn)為噪音則構(gòu)造降噪規(guī)則,優(yōu)化挖掘結(jié)果,從而提高挖掘結(jié)果的質(zhì)量。
[1] 呂婷, 姜友好. 文本挖掘在生物醫(yī)學(xué)領(lǐng)域中的應(yīng)用及其系統(tǒng)工具[J]. 中華醫(yī)學(xué)圖書情報(bào)雜志, 2010 (4): 56-64.
[2] Fillat C, Jose A, Bofill-DeRos X, et al. Pancreatic cancer gene therapy: from molecular targets to delivery systems[J]. Cancers, 2011, 3(1): 368-395.
[3] Warsame R, Grothey A. Treatment options for advanced pancreatic cancer: a review[J]. Expert review of anticancer therapy, 2012, 12(10): 1327-1336.
[4] Li D, Xie K, Wolff R, et al. Pancreatic cancer[J]. The Lancet, 2004, 363(9414): 1049-1057.
[5] Long J, Zhang Y, Yu X, et al. Overcoming drug resistance in pancreatic cancer[J]. Expert opinion on therapeutic targets, 2011, 15(7): 817-828.
[6] Pan J. RNA polymerasean important molecular target of triptolide in cancer cells[J]. Cancer letters, 2010, 292(2): 149-152.
[7] Pinmai K, Chunlaratthanabhorn S, Ngamkitidechakul C, et al. Synergistic growth inhibitory effects of Phyllanthus emblica and Terminalia bellerica extracts with conventional cytotoxic agents: doxorubicin and cisplatin against human hepatocellular carcinoma and lung cancer cells[J]. World journal of gastroenterology: WJG, 2008, 14(10): 1491.
[8] Borja-Cacho D, Yokoyama Y, Chugh R K, et al. TRAIL and triptolide: an effective combination that induces apoptosis in pancreatic cancer cells[J]. Journal of Gastrointestinal Surgery, 2010, 14(2): 252-260.
[9] 鮑英, 夏璐, 姜華, 等. 薏苡仁提取液對(duì)人胰腺癌細(xì)胞凋亡和超微結(jié)構(gòu)的影響[J]. 胃腸病學(xué), 2005, 10(2): 75-78.
[10] 蔡瓊, 許健, 沃興德. 薏苡仁油對(duì)人胰腺癌 BxPC-3 細(xì)胞影響 IL-18 表達(dá)的體外實(shí)驗(yàn)研究[J]. 中醫(yī)研究, 2010, 23(7): 11-14.
[11] 冀潤利, 邸瑤, 夏時(shí)海, 等. 氧化苦參堿對(duì) SW1990 細(xì)胞 MMP-2 表達(dá)的抑制作用及對(duì)細(xì)胞侵襲力的影響[J]. 世界華人消化雜志, 2011, 19(1): 19-24.
[12] 冀潤利, 夏時(shí)海, 李飛, 等. 氧化苦參堿對(duì)人胰腺癌細(xì)胞血管內(nèi)皮生長因子表達(dá)的影響[J]. WORLD CHINESE JOURNAL OF DIGESTOLOGY, 2006, 18: 3401.
[13] 田琦, 孫寶勝, 張矛. 康萊特注射液誘導(dǎo)人胰腺癌細(xì)胞凋亡[J]. 中國實(shí)驗(yàn)診斷學(xué), 2010, 14(12): 2026-2027.
[14] 李玉升. 康萊特注射液治療晚期胰腺癌新進(jìn)展[J]. 中國腫瘤臨床, 2012, 39: 1158-1160.
[15] 孫曉東,劉杏娥. 姜黃素通過抑制 Ras-ERK 和 Shh-GLI1 信號(hào)誘導(dǎo)胰腺癌細(xì)胞凋亡[J]. 中國病理生理雜志, 2012, 28(6): 996-1000.
[16] 楊芳, 趙秋, 王渝, 等. 姜黃素抑制 STAT3 信號(hào)通路對(duì)胰腺癌細(xì)胞增殖的影響[J]. 世界華人消化雜志, 2011, 19(30): 3149-3153.
[17] 王若天, 錢明, 田園. 姜黃素聯(lián)合吉西他濱對(duì)人胰腺癌 Panc-1 細(xì)胞增殖的影響[J]. 中國生化藥物雜志, 2012, 33(4): 449-451.
[18] 王偉, 金建光, 秦兆寅. 康萊特聯(lián)合 5-Fu 治療人胰腺癌 PC-3 裸鼠皮下移植瘤的實(shí)驗(yàn)研究[J]. 西安交通大學(xué)學(xué)報(bào)·醫(yī)學(xué)版, 2005, 10(26): 473-476.