王 羿,張學武,林登梅,安明宇,李 軍*
(1.貴州中醫(yī)藥大學 基礎(chǔ)醫(yī)學院,貴州 貴陽 550025;2.貴州中醫(yī)藥大學 藥學院,貴州 貴陽 550025)
肝細胞癌(Hepatocellular carcinoma,HCC)是一種常見的惡性腫瘤,占所有肝癌患者的85%,其發(fā)病率和死亡率分別在全球排第六和第三位,其中,2020年約有新發(fā)病例90.6萬、死亡病例83萬[1]。據(jù)臨床報道,HCC的危險因素有乙型肝炎病毒(HBV)感染、丙型肝炎病毒(HCV)感染、吸煙、飲酒、肥胖、黃曲霉素和代謝異常等[2]。目前,HCC治療手段主要有肝移植或切除、經(jīng)導管動脈化療栓塞(TACE)、射頻消融(RFA)、免疫治療、抗血管靶向治療等[3-7]。 雖然手術(shù)治療被認為是最有效的手段,但因該病發(fā)病隱匿、潛伏期長、進展迅速、惡性程度高等原因,確診時已屬中晚期,不但死亡率較高,術(shù)后5年的復發(fā)率高達60%以上[8-9]。
自噬是一種在自噬相關(guān)基因的調(diào)控下引發(fā)細胞程序性死亡的一種方式,細胞將其受損的細胞器和大分子物質(zhì)運送到溶酶體進行消除和降解[10]。這一過程最終抑制癌細胞凋亡或誘發(fā)癌細胞死亡,自噬和誘導的程度(又稱自噬通量)與腫瘤進展所處的階段有關(guān)[11]。在一些研究中,自噬可以在腫瘤形成的早期階段通過消除基因組不穩(wěn)定性、受損細胞器和突變細胞來抑制腫瘤的發(fā)生[11-12]。
GHJCF是傳統(tǒng)的經(jīng)典藥方,出自李東垣的《脾胃論》,是治療“飲酒過傷”之劑。該方由葛花、人參、茯苓、木香、白術(shù)、干姜、豆蔻等藥物組成,全方具有分消酒濕、溫中健脾、消補兼施之效。課題組前期研究發(fā)現(xiàn),GHJCF對HCC有一定的抑制作用[13-14],但其發(fā)揮抗腫瘤作用的活性成分以及作用機制尚未闡明。研究運用網(wǎng)絡(luò)藥理學結(jié)合生物信息學知識,探究GHJCF通過介導自噬進而干預肝細胞癌進展的潛在機制,以期為GHJCF的藥物開發(fā)以及臨床應用提供理論證據(jù)。
檢索TCMSP[15](http://tcmspw.com/tcmsp.php)數(shù)據(jù)庫,收集GHJCF中葛花、人參、茯苓、木香、白術(shù)、干姜、豆蔻的活性成分的相關(guān)信息,并提取相關(guān)活性成分作用的蛋白靶點。接著在Uniprot[16](https://www.uniprot.org)蛋白數(shù)據(jù)庫將化合物作用的靶點蛋白轉(zhuǎn)化為靶點基因名。
從GEO[17](https://www.ncbi.nlm. nih.gov/geo)數(shù)據(jù)庫獲取HCC數(shù)據(jù)集GSE87630和GSE45267。GSE87630分別包含HCC患者組織樣本64例,癌旁組織樣本30例,GSE45267數(shù)據(jù)集包含HCC患者樣本41例和健康對照(HCC)樣本46例。GSE87630與GSE45267芯片研究類型為 expression profiling by array, 種屬為 homo sapiens,平臺分別為GPL6947、GPL570。通過GEO2R在線分析工具分析芯片數(shù)據(jù),設(shè)置P<0.05,|logFC|>1 為篩選條件,獲得肝癌差異表達基因。人類自噬數(shù)據(jù)庫(Human autophagy database, HADb)收錄了222個與人類自噬密切相關(guān)的基因/蛋白信息。此外,基因的信息包括DNA序列、mRNA序列和已知的各種轉(zhuǎn)錄本等等。
將獲取到的GHJCF活性成分對應的靶點與HCC差異基因以及自噬相關(guān)基因,導入到Venny2.1.0[18](https://bioinfogp.cnb.csic.es/tools/venny/)在線工具取交集以獲取交集基因。再將交集靶點與藥物、成分、疾病一一對應后導入Cytoscape 3.9.0軟件構(gòu)建“藥物-成分-靶點-HCC-自噬”網(wǎng)絡(luò)圖。
將交集靶點導入該STRING[19](https://string-db.org)數(shù)據(jù)庫,構(gòu)建交集靶點蛋白的相互作用網(wǎng)絡(luò)圖。
使用R 3.6.3語言進行統(tǒng)計分析,其中g(shù)gplot2包用于可視化。涉及的統(tǒng)計方法有Mann-Whitney U檢驗(Wilcoxon rank sum test)。 Mann-Whitney U檢驗是一個非參數(shù)的假設(shè)檢驗方法,一般用于2組不滿足正態(tài)性的情況。疾病為肝細胞肝癌,數(shù)據(jù)來源于TCGA[20](https://portal.gdc.cancer.gov/ ) LIHC(肝細胞肝癌)項目中 level 3 HTSeq-FPKM格式的RNAseq數(shù)據(jù)。
利用基于人蛋白質(zhì)圖譜[21](THPA) (www.proteinatlas.org)的免疫組織化學來驗證關(guān)鍵基因及其診斷價值。THPA 提供對 32 種人體組織及其蛋白質(zhì)表達譜的訪問,并使用抗體譜來準確評估蛋白質(zhì)定位。此外,THPA 還提供 RNA 水平的測量。
使用R 3.6.3語言的ggplot2對關(guān)鍵基因的臨床相關(guān)信息進行可視化處理。涉及的統(tǒng)計方法有Kruskal-Wallis test。Kruskal-Wallis test是利用多個樣本的秩和來推斷各樣本分別代表的總體的位置有無差別。 一般用于多組樣本不滿足正態(tài)性的情況。
進行K-M生存分析[22](http://kmplot.com/analysis/)分析關(guān)鍵基因表達與HCC患者生存天數(shù)之間的關(guān)系。將關(guān)鍵基因輸入該數(shù)據(jù)庫以獲得K-M生存曲線圖。計算對數(shù)秩P值和風險比。P值<0.05 被認為具有統(tǒng)計學意義。
從PDB[23](https://www.pdbus.org/)數(shù)據(jù)庫中獲取上述分析后關(guān)鍵基因的人源蛋白,然后通過TCMSP[15](https://old.tcmsp-e.com/tcmsp.php)數(shù)據(jù)庫獲取GHJCF中關(guān)鍵基因?qū)衔锏?D結(jié)構(gòu),將蛋白及化合物的3D結(jié)構(gòu)導入Discovery Studio 2016 Client軟件進行分子對接檢驗其蛋白與活性成分的親和性。
R語言軟件對GSE45267和GSE87630基因表達數(shù)據(jù)進行標準化處理的結(jié)果見圖1(A)和圖1(B)。GSE45267數(shù)據(jù)集有1 305個差異基因,其中上調(diào)基因486個,下調(diào)基因819個。GSE87630數(shù)據(jù)集有1 250個差異基因,其中上調(diào)基因359個,下調(diào)基因891個。2組數(shù)據(jù)集差異基因的可視化結(jié)果見圖 1(C)和圖1(D)。
圖1 A:GSE45267數(shù)據(jù)集的標準化處理結(jié)果;B:GSE87630數(shù)據(jù)集的標準化處理結(jié)果; C:GSE45267差異基因火山圖;D:GSE87630差異基因火山圖Fig.1 A:Normalization results of GSE45267 dataset;B:Normalization results of GSE87630 dataset;C:GSE45267 differential gene volcano map;D:GSE87630 differential gene volcano map
在HADb數(shù)據(jù)庫中篩選出222個基因組與自噬相關(guān)。用韋恩圖可視化其與GHJCF的靶點及HCC數(shù)據(jù)集的差異基因的交集,篩選得到3組數(shù)據(jù)的共同差異基因5個,見圖2(A)。將差異基因?qū)胫罶TRING數(shù)據(jù)庫得到一個含6條邊和5個節(jié)點的PPI網(wǎng)絡(luò)圖,用Cytoscape3.9.0軟件構(gòu)建蛋白交互網(wǎng)絡(luò)圖(PPI)。根據(jù)每個靶點degree值大小確定每個靶點大小,見圖2(B)。
圖2 A:GHJCF-自噬-HCC交集基因的韋恩圖;B:PPI網(wǎng)絡(luò)圖Fig.2 A: Venn diagram of GHJCF-autophagy-HCC intersection genes; B: PPI network diagram
將7味中藥、74個成分、13個靶點在Cytoscape中進行分析、作圖(圖3)。
圖3 藥物-成分-靶點-疾病-自噬作用網(wǎng)絡(luò)圖Fig.3 Drug-component-target-disease-autophagy action network diagram注:GH,葛花;RS,人參;FL,茯苓;MX,木香;BZ,白術(shù);GJ,干姜;DK,豆蔻。
結(jié)果顯示,與癌旁正常組織相比,腫瘤患者CCL2基因的mRNA表達顯著下調(diào),而NFE2L2、FAS和BIRC5基因的mRNA表達顯著上調(diào)(圖4)。
圖4 4個顯著差異關(guān)鍵基因在正常組織和腫瘤組織表達情況Fig.4 Expression of 4 significantly different key genes in normal and tumor tissues注:*P<0.05,**P<0.01,***P<0.001。
使用人類蛋白質(zhì)圖譜(THPA)網(wǎng)站分析了HCC樣品中NFE2L2、FAS、CCL2和BIRC5表達的免疫組織化數(shù)據(jù),免疫組織化數(shù)據(jù)顯示肝癌樣品中的NFE2L2、CCL2和BIRC5高表達;FAS中表達(圖5)。
圖5 4個關(guān)鍵基因在肝癌組織中的免疫組織化圖Fig.5 Immunohistochemical map of 4 key genes in liver cancer tissue
分析了CCL2和BIRC5在具有不同臨床特征的HCC中的表達水平。結(jié)果如圖6所示,發(fā)現(xiàn)CCL2在患者性別、不同癌癥分期和淋巴結(jié)轉(zhuǎn)移狀態(tài)的正常組表達水平顯著高于腫瘤組。而BIRC5在患者性別、不同癌癥分期和淋巴結(jié)轉(zhuǎn)移狀態(tài)的正常組表達水平顯著低于腫瘤組。
圖6 根據(jù)患者性別A、個體癌癥分期B和淋巴結(jié)轉(zhuǎn)移狀態(tài)C 3個關(guān)鍵基因在HCC中的表達情況Fig.6 Expression of 3 key genes in HCC according to patients' gender A, individual cancer stage B and lymph node metastasis status C注:P≥0.05,*P<0.05,**P<0.01,***P<0.001。
通過Kaplan-Meier繪圖儀數(shù)據(jù)庫分析了CCL2和BIRC5在HCC中的預后價值,見圖7。發(fā)現(xiàn)CCL2的過表達與HCC患者較差的總生存(OS)和無進展生存期(PFS)有關(guān)。而BIRC5的低表達與HCC患者較差的總生存(OS)和無進展生存期(PFS)有關(guān)。
圖7 2個顯著差異關(guān)鍵基因高、低表達與總生存率的曲線(A1、B1), 2個顯著差異關(guān)鍵基因高、低表達與無進展生存期的曲線(A2、B2)Fig.7 Curves of 2 significantly different key genes with high and low expression versus overall survival (A1、B1), and 2 significantly different key genes with high and low expression versus progression-free survival (A2、B2)
分子對接的結(jié)果如表1所示,LibDock 評分越高,親和力越高。結(jié)果表明,相應的化合物可以與CCL2和BIRC5相互結(jié)合,并且最高的6個LibDock 評分對接模型顯示在圖8。
表1 分子對接LibDock評分Tab.1 Molecular docking LibDock scores
圖8 活性化合物與核心靶點的分子對接示意圖Fig.8 Molecular docking of active compounds with core targets注:A:葛根素與BIRC5的分子對接;B:[6]-姜酚與BIRC5的分子對接;C:木犀草素與BIRC5的分子對接;D:槲皮素與BIRC5的分子對接;E:染料木素與BIRC5的分子對接;F:槲皮素與CCL2的分子對接。
HCC是原發(fā)性肝癌的常見組織學類型之一,在發(fā)展過程中,一系列漸進的事件與多種蛋白質(zhì)或途徑有關(guān),其特點是死亡率高[24-25]。與西藥“一藥一靶”不同,由于中藥成分的復雜性,多種成分和靶點之間具有協(xié)同作用,故在治療 HCC 方面顯示出一定優(yōu)勢[26]。隨著生物信息學的快速發(fā)展,基于大型數(shù)據(jù)庫的新興網(wǎng)絡(luò)藥理學已成為從分子水平到路徑水平詳細描述復雜藥物系統(tǒng)作用機制的常用工具,是研究中醫(yī)藥作用機制和開發(fā)新藥前期高效的一種預測方法[27]。研究基于網(wǎng)絡(luò)藥理學和生物信息學,初步確定了GHJCF通過調(diào)節(jié)自噬干預肝細胞癌的作用機制。
通過GSE87630、GSE45267數(shù)據(jù)集分別獲得1 250、1 305個差異表達基因,收集GHJCF 治療HCC的活性成分27個,靶點452個,以及自噬相關(guān)基因222個,最后獲得藥物、疾病、鐵死亡的共同靶點5個。通過生物信息學分析,我們確定了4個靶點作為GHJCF干預HCC機制的潛在靶標,差異表達分析結(jié)果顯示,CCL2的表達水平顯著低于正常組,而NFE2L2、FAS和BIRC5表達水平顯著高于正常組。THPA驗證NFE2L2、CCL2和BIRC5蛋白在癌癥組織中的表達水平高,F(xiàn)AS在癌癥組織中的表達水平中等。臨床相關(guān)性研究表明,CCL2和BIRC5都與性別、個體癌癥分期、淋巴結(jié)轉(zhuǎn)移狀況等臨床指標相關(guān)。生存分析表明,CCL2的低表達與HCC患者的不良預后有關(guān),BIRC5的高表達與HCC患者的不良預后有關(guān)。
此外,利用分子對接將CCL2和BIRC5與GHJCF有效成分進行分子對接。結(jié)果顯示,BIRC5蛋白與GHJCF中的染料木素、槲皮素、葛根素和木犀草素成分結(jié)合分數(shù)較高,CCL2與槲皮素成分結(jié)合分數(shù)較高。研究表明,染料木素可有效降低患者的HCC風險,通過觸發(fā)細胞凋亡來抑制胃癌和肝癌細胞的生長、通過調(diào)控AMPK防止HCC的發(fā)生并抑制其發(fā)展等作用[28-30]。槲皮素通過細胞自噬或凋亡誘導抑制肝細胞癌的生長[31]。葛根素可通過干預MAPK途徑促進HCC的凋亡發(fā)生[32]。木犀草素可通過調(diào)控TGF-β1通路、p53通路、Fas/Fas-配體通路、內(nèi)質(zhì)網(wǎng)應激和AKT/OPN通路的多種信號通路抑制HCC細胞的生長[33-35]。通過綜合分析,最終我們確定CCL2和BIRC5是GHJCF調(diào)控自噬干預HCC的最佳靶點。
研究表明,CCL2與腫瘤的發(fā)生密切相關(guān),并與HCC的不良預后有關(guān)[36]。據(jù)報道,BIRC5在HCC中的表達增加會抑制細胞凋亡,促進腫瘤細胞增殖,并增加HCC細胞對放療的抵抗力[37]。
綜上,通過以上生物信息學分析,結(jié)合臨床數(shù)據(jù)相關(guān)性,GHJCF可能通過染料木素、槲皮素、葛根素和木犀草素作用于BIRC5、CCL2,調(diào)節(jié)HCC的自噬,進而對HCC有抑制作用。