国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于生物信息學(xué)分析的口腔鱗狀細(xì)胞癌微小RNA預(yù)后模型

2020-12-08 06:24趙格黎昌學(xué)郭超朱慧
華西口腔醫(yī)學(xué)雜志 2020年6期
關(guān)鍵詞:生存率預(yù)測(cè)基因

趙格 黎昌學(xué) 郭超 朱慧

石河子大學(xué)醫(yī)學(xué)院第一附屬醫(yī)院口腔科,石河子 832000

口腔癌是全球第九大惡性腫瘤,其中90%以上是口腔鱗狀細(xì)胞癌(oral squamous cell carcinoma,OSCC),5年生存率僅為50%[1]。TNM分期是口腔癌的關(guān)鍵預(yù)后因素[2]。然而,由于高度異質(zhì)性,TNM分期不能描述同一分期患者的個(gè)體風(fēng)險(xiǎn)。因此,需要新的生物標(biāo)志物來區(qū)分高危患者,以幫助指導(dǎo)治療。

微小RNA(microRNA,miRNA)是長(zhǎng)度為18~25個(gè)核苷酸的非編碼RNA,通過與其靶向mRNA的3’-非翻譯區(qū)結(jié)合來調(diào)節(jié)基因表達(dá),導(dǎo)致了mRNA降解或抑制mRNA翻譯[3]。越來越多的研究[4-5]顯示,miRNA在腫瘤細(xì)胞的生長(zhǎng)、分化、增殖和凋亡等過程中發(fā)揮了重要的作用。部分miRNA已作為生物標(biāo)志物開始應(yīng)用到OSCC的診斷及預(yù)后判斷[6-7]。

近年來,人們對(duì)癌癥預(yù)后生物標(biāo)志物進(jìn)行了大量研究。與單一的生物標(biāo)記物相比,多個(gè)基因的組合在預(yù)測(cè)個(gè)體預(yù)后方面顯示了它們的優(yōu)勢(shì)[8-9]。本研究基于癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫,通過單因素和多因素Cox風(fēng)險(xiǎn)回歸分析篩選和建立miRNA預(yù)后模型,以期對(duì)OSCC患者進(jìn)行精準(zhǔn)分組并為治療提供依據(jù)。

1 材料和方法

1.1 數(shù)據(jù)下載

截止于2020年2月9日從TCGA數(shù)據(jù)庫下載OSCC相關(guān)miRNA表達(dá)信息(398個(gè)腫瘤樣本和32個(gè)正常樣本)、mRNA表達(dá)信息(381個(gè)腫瘤樣本和32個(gè)正常樣本)和相關(guān)臨床資料(401例)。從miRBase網(wǎng)站下載所有成熟miRNA序列,用Perl語言將其與差異表達(dá)miRNA合并。

1.2 差異表達(dá)分析

將下載的原始數(shù)據(jù)標(biāo)準(zhǔn)化處理后進(jìn)行l(wèi)og2轉(zhuǎn)換,使用R語言edgeR包比較腫瘤組與正常組miRNA和mRNA的表達(dá)差異,最終選取衡量錯(cuò)誤發(fā)現(xiàn)率的指標(biāo)(false discovery rate,F(xiàn)DR)<0.05,|log2FC|>1(FC為差異倍數(shù),fold change)的差異基因與生存時(shí)間≥30 d的患者臨床信息(共388例年齡為19~88歲患者,表1)相結(jié)合,建立標(biāo)準(zhǔn)化的miRNA和mRNA表達(dá)譜。

1.3 預(yù)后模型的構(gòu)建及驗(yàn)證評(píng)估

通過R語言caret軟件包將miRNA表達(dá)譜的樣本隨機(jī)分為train和test兩組。對(duì)train組進(jìn)行單因素Cox回歸分析,篩選出P<0.01的miRNA。為了篩選并剔除引起多重共線性的miRNA,利用R語言survival包中“Coxph”和“direction=both”函數(shù)對(duì)單因素Cox回歸得到的miRNA進(jìn)行逐步多元Cox回歸,最終建立生存相關(guān)預(yù)后模型。依據(jù)模型計(jì)算各組患者的風(fēng)險(xiǎn)評(píng)分,以風(fēng)險(xiǎn)評(píng)分中位值將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。Kaplan-Meier法繪制生存曲線并行Logrank檢驗(yàn)(P<0.05)。使用survivalROC軟件包計(jì)算患者5年生存率受試者工作特征曲線(receiver operating characteristic curve,ROC)下面積(area under curve,AUC)來評(píng)估預(yù)后模型的有效性和敏感性。

1.4 獨(dú)立預(yù)后分析

通過單因素、多因素Cox回歸分析,計(jì)算年齡、性別、病理分級(jí)、臨床分期、腫瘤大小、區(qū)域淋巴結(jié)轉(zhuǎn)移、風(fēng)險(xiǎn)評(píng)分與患者生存率之間的關(guān)系。判定所建立預(yù)后模型是否可以作為獨(dú)立的預(yù)后因素。

1.5 靶基因預(yù)測(cè)及功能富集分析

從miRTarBase、targetScan和miRDB 3個(gè)數(shù)據(jù)庫預(yù)測(cè)預(yù)后模型的靶基因,用Perl語言選取至少2個(gè)數(shù)據(jù)庫中預(yù)測(cè)到的靶基因與TCGA數(shù)據(jù)庫下載分析的差異mRNA取交集。通過R語言clusterProfifiler包和org.Hs.eg.db包對(duì)這些交叉基因進(jìn)行基因本體論(gene ontology,GO)功能注釋分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析(P<0.05,q<0.05)。

1.6 中樞基因篩選

通過STRING數(shù)據(jù)庫繪制蛋白互作網(wǎng)絡(luò)(protein protein interaction network,PPI)用于揭示靶基因之間的關(guān)系,置信度參數(shù)為0.700。使用Cytoscape3.6.1及其插件cytoHubba篩選出前10個(gè)中樞(Hub)基因。

1.7 統(tǒng)計(jì)分析

所有的統(tǒng)計(jì)均以R語言3.6.2版本以及其附屬包為基礎(chǔ)進(jìn)行。

2 結(jié)果

2.1 6-miRNAs預(yù)后模型建立

依據(jù)上述方法及條件篩選出314個(gè)差異miRNA,其中上調(diào)185個(gè),下調(diào)129個(gè)。6 190個(gè)差異mRNA,其中上調(diào)3 344個(gè),下調(diào)2 846個(gè)。將具有生存時(shí)間的388名患者隨機(jī)分為train組(n=196)和test組(n=192)。train組通過單因素Cox回歸分析得到12個(gè)與患者總生存率相關(guān)的miRNA(P<0.01),通過逐步多因素Cox回歸分析剔除引起多重共線性的miRNA后建立6-miRNAs預(yù)后模型。風(fēng)險(xiǎn)評(píng)分公式=(0.284 428×miR-499a-5p)-(0.560 344×miR-379-5p)+(0.326 790×miR-654-3p)+(0.364 695×miR-539-3p)+(0.229 542×miR-137-3p)-(0.216 523×miR-20b-3p)。

2.2 6-miRNAs預(yù)后模型評(píng)價(jià)

計(jì)算train組、test組和所有樣品中患者的風(fēng)險(xiǎn)評(píng)分。均以train組風(fēng)險(xiǎn)評(píng)分中位值0.950為界,將患者分為高、低風(fēng)險(xiǎn)兩組。風(fēng)險(xiǎn)生存曲線顯示train組、test組和所有樣品中高風(fēng)險(xiǎn)組的總體生存率明顯低于低風(fēng)險(xiǎn)組(圖1)。train組、test組及所有樣品組中患者5年生存率ROC曲線的AUC值分別為0.757、0.673和0.724(圖2);生存狀態(tài)圖顯示3組中高風(fēng)險(xiǎn)評(píng)分患者的死亡率明顯高于低風(fēng)險(xiǎn)評(píng)分患者死亡率(P<0.05)(圖3)。

2.3 獨(dú)立預(yù)后分析

單因素Cox回歸分析顯示,6-miRNAs預(yù)后模型與患者的總生存率明顯相關(guān)(P<0.001)(圖4左)。多因素Cox回歸分析表明,在考慮其他臨床因素時(shí),6-miRNAs預(yù)后模型評(píng)分可作為影響OSCC患者總生存率的獨(dú)立預(yù)后因素(P<0.001)。此外,區(qū)域淋巴結(jié)受累情況也是獨(dú)立的預(yù)后因素(P<0.05)(圖4右)。

2.4 6-miRNAs預(yù)測(cè)模型靶基因預(yù)測(cè)

3個(gè)數(shù)據(jù)庫預(yù)測(cè)結(jié)果顯示hsa-miR-20b-3p、hsamiR-137-3p、hsa-miR-379-5p、hsa-miR-499-5p、hsamiR-539-3p、hsa-miR-654-3p分別有431、1 115、701、307、733、426個(gè)重疊靶基因。為進(jìn)一步提高生物信息學(xué)分析的可靠性,與TCGA下載分析得到的差異mRNA取交集,最終得到目標(biāo)靶基因348個(gè)。

2.5 靶基因的GO和KEGG通路富集分析

對(duì)348個(gè)靶基因進(jìn)行GO注釋。與生物學(xué)過程(biological process,BP)、細(xì)胞組分(cellular component,CC)和分子功能(molecular function,MF)相關(guān)的前15個(gè)注釋結(jié)果繪成圖。富集結(jié)果中BP主要包括跨突觸信號(hào)調(diào)節(jié)、化學(xué)突觸傳遞調(diào)節(jié)和突觸組織,CC主要包括突觸膜、突觸前膜和谷氨酸能突觸,MF主要包括細(xì)胞外基質(zhì)結(jié)構(gòu)組成、DNA結(jié)合轉(zhuǎn)錄激活活性和特異性RNA聚合酶Ⅱ、生長(zhǎng)因子活性。KEGG通路富集集中在致心律失常性右室心肌?。╝rrhythmogenic right ventricular cardiomyopathy,ARVC)和細(xì)胞黏附分子(cell adhesion molecule,CAM)上(P<0.05,q<0.05)。

圖2 患者5年生存率ROC曲線AUC值Fig 2 The AUC value of ROC curve of 5-year survival rate

圖3 高低風(fēng)險(xiǎn)組患者生存狀態(tài)Fig 3 Survival status in high and low risk patients

圖4 單因素獨(dú)立預(yù)后分析(左)和多因素獨(dú)立預(yù)后分析(右)Fig 4 Univariate Cox regression (left) and multivariate Cox regression (right)

2.6 中樞基因的篩選

348個(gè)預(yù)測(cè)靶基因中,共有139個(gè)被過濾到靶基因PPI網(wǎng)絡(luò)中,篩選得到10個(gè)中樞基因?yàn)镃CNB1、EGF、KIF23、MCM10、ITGAV、MELK、PLK4、ADCY2、CENPF、TRIP13。其中EGF、ADCY2與患者生存相關(guān)(P<0.05)。

3 討論

OSCC是世界范圍內(nèi)最常見的癌癥類型之一。目前除了傳統(tǒng)TNM分期外,缺乏能將高?;颊哌M(jìn)行區(qū)分的風(fēng)險(xiǎn)評(píng)估方法。近些年來,盡管努力改善影像學(xué)診斷技術(shù)和手術(shù)治療方式,患者5年生存率仍未有明顯改善[10-11]。因此,探索能夠預(yù)測(cè)OSCC患者預(yù)后風(fēng)險(xiǎn)的預(yù)后模型具有重要意義。本研究從TCGA數(shù)據(jù)庫下載并篩選OSCC差異miRNA,通過Cox單因素和多因素回歸分析,構(gòu)建了OSCC預(yù)后模型。發(fā)現(xiàn)由hsa-miR-379-5p、hsa-miR-499a-5p、hsa-miR-654-3p、hsa-miR-539-3p、hsa-miR-137-3p和hsa-miR-20b-3p組成的6-miRNAs預(yù)后模型可作為OSCC的獨(dú)立預(yù)后因素。train組、test組和所有樣品5年生存率ROC曲線的AUC值分別為0.757、0.673和0.724,一致顯示該模型在預(yù)測(cè)OSCC患者生存風(fēng)險(xiǎn)方面具有較好預(yù)測(cè)能力,可作為可靠的預(yù)后模型。3組生存曲線顯示高風(fēng)險(xiǎn)評(píng)分患者的死亡率均高于低風(fēng)險(xiǎn)評(píng)分患者,Log-rank檢驗(yàn)差異有統(tǒng)計(jì)學(xué)意義。證明該模型可對(duì)OSCC患者進(jìn)行精準(zhǔn)的分組,或可提高患者治療的針對(duì)性。

據(jù)報(bào)道,這6種miRNA參與了多種腫瘤的發(fā)生發(fā)展機(jī)制。miR-379-5p通過靶向調(diào)控MDM2的表達(dá)來抑制膀胱癌細(xì)胞的增殖、遷移和侵襲能力[12]。mir-499a-5p在高轉(zhuǎn)移性肺癌細(xì)胞系及其外泌體中上調(diào),促進(jìn)細(xì)胞增殖、遷移和上皮間充質(zhì)轉(zhuǎn)化[13]。linc00460通過下調(diào)miR-654-3p在食管癌中發(fā)揮促癌作用,進(jìn)而影響食管癌的預(yù)后[14]。miR-539-3p通過靶向sparcl1在上皮性卵巢癌中作為癌基因發(fā)揮作用[15]。胰腺癌中,circ-LDLRAD3下調(diào)通過miR-137-3p/ptn軸抑制胰腺癌細(xì)胞的增殖、遷移和侵襲[16]。miR-20b-3p參與了膠質(zhì)母細(xì)胞瘤細(xì)胞中l(wèi)nc-TALC介導(dǎo)的替莫唑胺耐藥機(jī)制,為耐藥性研究提供了新的思路[17]。這些研究成果一定程度上與本研究的模型相吻合。

為了進(jìn)一步了解6-miRNAs預(yù)后模型在OSCC中的調(diào)控機(jī)制,本研究對(duì)預(yù)后模型的靶基因進(jìn)行了功能富集分析。GO注釋顯示靶基因主要定位于突觸膜,參與跨突觸信號(hào)、化學(xué)突觸傳遞的調(diào)節(jié)和突觸組織組成;主要結(jié)合細(xì)胞外基質(zhì)結(jié)構(gòu),具有生長(zhǎng)因子活性、DNA結(jié)合轉(zhuǎn)錄激活活性和特異性RNA聚合酶Ⅱ等功能。KEGG通路富集集中在ARVC和CAM。研究[18]發(fā)現(xiàn),CAM可將腫瘤細(xì)胞從原發(fā)灶中分離出來,減少細(xì)胞間黏附促進(jìn)頭頸部鱗狀細(xì)胞癌的轉(zhuǎn)移。這些富集結(jié)果都不同程度地顯示了它們對(duì)腫瘤的作用,提示構(gòu)建的miRNA預(yù)后模型可能參與腫瘤信號(hào)通路的調(diào)控。

為了尋找調(diào)控OSCC的miRNA預(yù)后模型關(guān)鍵節(jié)點(diǎn),根據(jù)Cytoscape3.6.1及其插件cytoHubba篩選10個(gè)樞紐基因,分別為CCNB1、EGF、KIF23、MCM10、ITGAV、MELK、PLK4、ADCY2、CENPF、TRIP13。其中ADCY2、EGF與患者的生存相關(guān);ADCY2參與膜受體的信號(hào)轉(zhuǎn)導(dǎo);EGF誘導(dǎo)上皮向間質(zhì)轉(zhuǎn)化,使頭頸部癌細(xì)胞具有干細(xì)胞樣表型[19]。因此,該預(yù)后模型可能通過調(diào)節(jié)ADCY2、EGF影響OSCC患者的生存及預(yù)后。

本研究的創(chuàng)新點(diǎn)在于以miRNA成熟體為研究對(duì)象且通過樣本分組來驗(yàn)證模型可靠性。不足之處在于僅通對(duì)TCGA下載的的miRNA、mRNA表達(dá)譜進(jìn)行大數(shù)據(jù)分析,而未進(jìn)行實(shí)驗(yàn)驗(yàn)證。后期研究將收集病例進(jìn)行實(shí)驗(yàn)驗(yàn)證。

綜上所述,本研究得到了一個(gè)6-miRNAs獨(dú)立預(yù)后預(yù)測(cè)模型,該模型可能有助于臨床決策,確定適當(dāng)?shù)闹委熡?jì)劃,從而改善OSCC患者的預(yù)后和生存率。

利益沖突聲明:作者聲明本文無利益沖突。

猜你喜歡
生存率預(yù)測(cè)基因
無可預(yù)測(cè)
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
選修2—2期中考試預(yù)測(cè)卷(A卷)
Frog whisperer
“五年生存率”不等于只能活五年
影響胃癌術(shù)后5 年生存率的因素分析
修改基因吉兇未卜
人工智能助力卵巢癌生存率預(yù)測(cè)
日本首次公布本國(guó)居民癌癥三年生存率
武夷山市| 塔河县| 五大连池市| 扶绥县| 罗平县| 琼海市| 兴和县| 广河县| 增城市| 蓬莱市| 禄劝| 北宁市| 内江市| 米泉市| 西青区| 常山县| 资源县| 绥中县| 灵丘县| 东明县| 商河县| 临朐县| 西林县| 蓝田县| 五指山市| 成武县| 逊克县| 福海县| 云浮市| 衢州市| 千阳县| 湖北省| 阜平县| 丹巴县| 东丰县| 高雄市| 电白县| 易门县| 红原县| 定陶县| 平阴县|