何天 曹天生
廣州市花都區(qū)人民醫(yī)院胃腸外科,廣州 510800
結(jié)腸癌是常見(jiàn)的消化道腫瘤,據(jù)全球癌癥統(tǒng)計(jì)數(shù)據(jù),其在惡性腫瘤中發(fā)病率居第5,隨著飲食結(jié)構(gòu)的改變,結(jié)腸癌發(fā)病率逐漸升高[1-2]。由于結(jié)腸癌發(fā)病隱匿,疾病初期無(wú)明顯臨床癥狀,導(dǎo)致多數(shù)患者就診時(shí)已處于腫瘤的中晚期,因此大多失去標(biāo)準(zhǔn)治療的最佳時(shí)機(jī)。目前,手術(shù)切除仍是治愈的主要方式,而對(duì)有轉(zhuǎn)移的晚期患者,其5 年生存率不足20%[3]。結(jié)腸癌患者預(yù)后判斷主要依賴TNM 分期,血清學(xué)檢查中癌胚抗原、CA19-9等生物標(biāo)記物對(duì)預(yù)后評(píng)價(jià)具有重要的參考作用,但敏感性和特異性欠佳[4]。因此,臨床上亟需新的生物學(xué)標(biāo)志分子和有效的預(yù)后評(píng)估模型以提高對(duì)結(jié)腸癌患者診治的準(zhǔn)確性。
長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA)指大于200 個(gè)核苷酸的非編碼RNA,一開始被認(rèn)定是轉(zhuǎn)錄“垃圾”,不具有調(diào)節(jié)機(jī)體過(guò)程等生物學(xué)功能[5]。隨著生物信息學(xué)技術(shù)與芯片技術(shù)的發(fā)展,發(fā)現(xiàn)lncRNA 在多種遺傳生物學(xué)過(guò)程中,像轉(zhuǎn)錄前、后的調(diào)控和表觀遺傳調(diào)控等,都發(fā)揮著重要的作用[6]。研究證實(shí)當(dāng)lncRNA 轉(zhuǎn)錄發(fā)生改變時(shí)可促進(jìn)癌癥的發(fā)生和轉(zhuǎn)移[7]。關(guān)于lncRNA 如何影響腫瘤進(jìn)程,哈佛醫(yī)學(xué)院Pandolfi 課題組提出的競(jìng)爭(zhēng)性內(nèi)源RNA(competing endogenous RNA,ceRNA)假說(shuō)認(rèn)為,lncRNA 可通過(guò)結(jié)合微小RNA(microRNA,miRNA)來(lái)阻隔miRNA 與其他信使RNA(mRNA)作用,從而降低了miRNA 對(duì)mRNA 的抑制調(diào)控,促進(jìn)相應(yīng)mRNA 的表達(dá),進(jìn)而影響疾病的進(jìn)程[8]。已有多種異常表達(dá)lncRNA 被證實(shí)作為ceRNA 與結(jié)腸癌進(jìn)展相關(guān),如Peng 等[9]發(fā)現(xiàn)lncRNA HOTAIR 在結(jié)腸癌中的表達(dá)明顯升高,作為ceRNA 調(diào)節(jié)miR-34a 促進(jìn)結(jié)腸癌的進(jìn)展,與結(jié)腸癌的遠(yuǎn)處轉(zhuǎn)移和不良預(yù)后有關(guān)。為構(gòu)建1 個(gè)由lncRNA 組成的結(jié)腸癌預(yù)后風(fēng)險(xiǎn)評(píng)估模型,本研究基于癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(kù),獲取預(yù)后相關(guān)lncRNA,構(gòu)建可用于評(píng)估結(jié)腸癌患者預(yù)后的多基因風(fēng)險(xiǎn)模型,并初步探索lncRNA 參與結(jié)腸癌進(jìn)程的機(jī)制。
數(shù)據(jù)提取時(shí)間:建庫(kù)至2022年3月1日。從TCGA 上下載結(jié)腸癌樣本(癌和癌旁組織)轉(zhuǎn)錄組測(cè)序數(shù)據(jù)及臨床資料。使用Rstudio 軟件對(duì)獲取的數(shù)據(jù)進(jìn)行初步處理及篩選,根據(jù)以下標(biāo)準(zhǔn)排除部分患者:沒(méi)有生存狀態(tài)和生存時(shí)間信息的患者;缺乏完整lncRNA 表達(dá)數(shù)據(jù)的患者;對(duì)重復(fù)樣本的患者隨機(jī)去重?;虮磉_(dá)數(shù)據(jù)中,去除表達(dá)量較低的基因,通過(guò)從全球數(shù)據(jù)中心(Global Data Center,GDC)數(shù)據(jù)庫(kù)下載人類基因注釋文件(genecode.v22)進(jìn)行注釋。Genecode 數(shù)據(jù)庫(kù)中有關(guān)于lncRNA 的種類說(shuō)明,依此篩選過(guò)濾得出lncRNA的表達(dá)矩陣。
依據(jù)癌旁樣本挑選匹配的癌癥樣本構(gòu)建配對(duì)樣本lncRNA 表達(dá)矩陣,利用“edgeR”R 包篩選,閾值設(shè)置為:|log 2 fold change|>1.5 和P-value <0.05,獲得差異表達(dá)lncRNA(differentially expressed lncRNA,DElncRNA)。根據(jù)分組繪制lncRNA 主成分分析(principal component analysis,PCA)圖觀察配對(duì)樣本間lncRNA 的表達(dá)差異,使用“pheatmap”包繪制表達(dá)熱圖、“ggplot2”包繪制火山圖可視化上調(diào)及下調(diào)lncRNA。
構(gòu)建癌組織樣本DElncRNA 表達(dá)矩陣,與患者生存資料合并,使用統(tǒng)計(jì)學(xué)方法進(jìn)一步篩選。先采用COX 回歸模型單變量分析評(píng)估DElncRNA 表達(dá)水平與患者總生存期間的關(guān)系,選取明顯影響生存期的lncRNA(P<0.05)。隨后利用“glmnet”R 包進(jìn)行Lasso 回歸分析,過(guò)濾基因間的共線性因素,根據(jù)參數(shù)中的Lambda 值,選擇Lambda.min 作為臨界點(diǎn),進(jìn)行篩選。再以lncRNA 表達(dá)值的中位數(shù)作為分界值,將患者分位高低表達(dá)組,進(jìn)行K-M 生存分析,挑選出表達(dá)量與生存率明顯相關(guān)的lncRNA(P<0.05)。最后使用“survival”R 包的逐步回歸法構(gòu)建多元COX 回歸模型,衡量各個(gè)lncRNA 表達(dá)情況對(duì)生存的影響程度,用風(fēng)險(xiǎn)比(hazard ratio,HR)體現(xiàn),以P<0.05 作為標(biāo)準(zhǔn),得出預(yù)后相關(guān)lncRNA[10]。
根據(jù)多因素COX 回歸分析中計(jì)算得出預(yù)后相關(guān)lncRNA 的回歸系數(shù)(β),按照如下公式構(gòu)建結(jié)腸癌預(yù)后風(fēng)險(xiǎn)評(píng)估模型[11]。β 表示相對(duì)危險(xiǎn)度,是對(duì)模型中各個(gè)因素相對(duì)危險(xiǎn)程度的量化。當(dāng)β>0時(shí),對(duì)應(yīng)因素的取值越大,患者死亡的風(fēng)險(xiǎn)越高;β<0 時(shí),對(duì)應(yīng)因素取值越大,患者死亡的風(fēng)險(xiǎn)越低。
公式中Risk score(RS)為風(fēng)險(xiǎn)評(píng)分,n 為關(guān)鍵lnRNA 基因數(shù)量,Exp為lncRNA表達(dá)量,β為回歸系數(shù)。
先計(jì)算模型的C 指數(shù)值,其可用來(lái)評(píng)價(jià)模型的預(yù)測(cè)能力,主要用于計(jì)算COX 回歸模型中預(yù)測(cè)值與真實(shí)之間的區(qū)分度[12]。一般認(rèn)為,如C指數(shù)介于0.50~0.70之間則為低準(zhǔn)確度;在0.71~0.90 之間則視為中等準(zhǔn)確度;高于0.90 則可看做高準(zhǔn)確度。然后對(duì)此模型構(gòu)建時(shí)間依賴的受試者工作特征曲線(receiver operating characteristic curve,ROC),并計(jì)算ROC 曲線下的面積(area under the curve,AUC),以評(píng)估模型預(yù)測(cè)患者3 年、5 年生存期的能力。AUC 和C 指數(shù)意義相似,一般認(rèn)為0.85 進(jìn)一步構(gòu)建lncRNA-miRNA-mRNA 相互作用ceRNA網(wǎng)絡(luò)。先利用LncBOOK 在線數(shù)據(jù)庫(kù),根據(jù)相互作用得分,選擇前30個(gè)靶miRNA。然后通過(guò)數(shù)據(jù)庫(kù)miRDB、TargeScan和miRTarBase 預(yù)測(cè)miRNA 下游的靶mRNA,取三者交集。在TCGA 下載結(jié)腸癌miRNA-seq 表達(dá)數(shù)據(jù),與RNA-seq 進(jìn)行整合,獲得一個(gè)含有l(wèi)ncRNA、miRNA、mRNA 的表達(dá)數(shù)據(jù)。計(jì)算miRNA 與靶mRNA 間的皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC),得出與miRNA 表達(dá)明顯相關(guān)(|PCC|>0.4,P<0.05)的靶mRNA。去掉部分沒(méi)有靶mRNA的miRNA,構(gòu)成ceRNA 網(wǎng)絡(luò),使用Cytoscape 軟件構(gòu)圖以可視化。GO 分析從生物過(guò)程(biological process,BP)、細(xì)胞組分(cellular component,CC)、分子功能(molecular function,MF)3 方面注釋一系列生物學(xué)過(guò)程[14]。KEGG 富集分析可以將基因組信息與高階的功能信息聯(lián)系起來(lái)[15]。依據(jù)匹配到的mRNA,使用“ClusterProfiler”R包,進(jìn)行GO、KEGG富集分析探索預(yù)后相關(guān)lncRNA 影響結(jié)腸癌進(jìn)展可能的機(jī)制。整個(gè)結(jié)腸癌TCGA數(shù)據(jù)提取及分析流程見(jiàn)圖1。 圖1 結(jié)腸癌TCGA數(shù)據(jù)提取分析流程圖 從TCGA 共下載514 個(gè)結(jié)腸癌樣本轉(zhuǎn)錄組數(shù)據(jù)和452 個(gè)患者臨床病理信息。依據(jù)排除標(biāo)準(zhǔn)得到364 個(gè)樣本(癌旁樣本28 個(gè))和336 例患者信息,對(duì)其臨床病理信息進(jìn)行統(tǒng)計(jì)(表1)。其中,男性患者占53.6%,女性患者占46.4%;患者年齡31~90 歲,平均65.9 歲;生存或隨訪時(shí)間0.03~137.40個(gè)月,中位生存時(shí)間為5.62個(gè)月。 表1 336例結(jié)腸癌患者的臨床病理信息 構(gòu)建28 對(duì)癌與癌旁組織配對(duì)的lncRNA 表達(dá)矩陣,以|log2 FC|>1.5 和P<0.05 為標(biāo)準(zhǔn),共獲得868 個(gè)DElncRNA,繪制PCA 圖(圖2)、表達(dá)熱圖(圖3)及火山圖(圖4)。其中PCA 圖顯示DElncRNA 在癌與癌旁組織中的表達(dá)具有明顯差異;熱圖顯示出在癌組織樣本表達(dá)量增加的上調(diào)lncRNA及表達(dá)量下降的下調(diào)lncRNA;火山圖顯示上調(diào)lncRNA 548個(gè)、下調(diào)lncRNA 320個(gè)。 圖2 配對(duì)樣本長(zhǎng)鏈非編碼RNA表達(dá)主成分分析圖 圖3 配對(duì)樣本長(zhǎng)鏈非編碼RNA表達(dá)熱圖 圖4 長(zhǎng)鏈非編碼RNA火山圖 構(gòu)建癌組織DElncRNA 表達(dá)矩陣,先進(jìn)行單因素COX回歸分析,篩選出40 個(gè)lncRNA。隨后進(jìn)行Lasso 回歸模型分析,得到34 個(gè)候選lncRNA。以lncRNA 表達(dá)值的中位數(shù)作為分界值,進(jìn)行高低分組生存分析,發(fā)現(xiàn)其中的14 個(gè)lncRNA 表達(dá)譜與生存時(shí)間明顯相關(guān)(P<0.05),繪制K-M 生存曲線(圖5)。 圖5 14 個(gè)長(zhǎng)鏈非編碼RNA 高低表達(dá)組間生存分析:ELFN1-AS1(A)、RP5-884M 6.1(B)、LINC00461(C)、RP11-161I 6.2(D)、LINC01132(E)、RP11-108K 3.1(F)、RP1-170O19.17(G)、RP11-108K 3.2(H)、AC114730.3(I)、RP1-79C4.4(J)、RP4-816N1.7(K)、RP3-380B8.4(L)、RP5-823G15.5(M)、WFDC21P(N) 最后進(jìn)行多元COX 回歸模型分析,得到7 個(gè)預(yù)后相關(guān)lncRNA(ELFN1-AS1、RP5-884M6.1、LINC00461、LINC01132、RP1-79C4.4、RP4-816N1.7、RP3-380B8.4)。計(jì)算得出每個(gè)lncRNA 的HR 值及95%可信區(qū)間,繪制風(fēng)險(xiǎn)森林圖(圖6)。其中1 個(gè)lncRNA(LINC01132)的HR<1,提示其表達(dá)量增加可降低結(jié)腸癌不良預(yù)后的風(fēng)險(xiǎn),是患者的保護(hù)因素;6 個(gè) lncRNA(ELFN1-AS1、RP5-884M6.1、LINC00461、RP1-79C4.4、RP4-816N1.7、RP3-380B8.4)的HR>l,提示它們表達(dá)量增加可增加結(jié)腸癌不良預(yù)后的風(fēng)險(xiǎn),是患者的危險(xiǎn)因素。 根據(jù)多元COX 回歸模型,提取每個(gè)lncRNA 的回歸系數(shù),依據(jù)公式構(gòu)建由7 個(gè)lncRNA 組成的結(jié)腸癌預(yù)后風(fēng)險(xiǎn)模型。 Risk score=0.256 8×(ELFN1-AS1 表達(dá)量)+0.289 1×(RP5-884M6.1 表達(dá)量)+0.244 6×(LINC00461 表達(dá)量)-0.424 4×(LINC01132表達(dá)量)+0.235 5×(RP1-79C4.4表達(dá)量)+0.298 1×(RP4-816N1.7表達(dá)量)+0.341 4×(RP3-380B8.4表達(dá)量) 通過(guò)計(jì)算模型C 指數(shù)值為0.82(圖6),介于0.71~0.90之間,為中等準(zhǔn)確度。構(gòu)建時(shí)間依賴ROC,并計(jì)算AUC值。預(yù)測(cè)3 年、5 年結(jié)腸癌患者生存率的AUC 值分別為0.79 和0.84(圖7),0.7 圖7 風(fēng)險(xiǎn)模型時(shí)間依賴受試者工作特征曲線 根據(jù)模型計(jì)算出每個(gè)患者的RS 值,以中位數(shù)作為截?cái)嘀捣纸M,其中高、低風(fēng)險(xiǎn)組各有168 例,繪制風(fēng)險(xiǎn)評(píng)分曲線圖、生存狀態(tài)散點(diǎn)圖和7 個(gè)lncRNA 的表達(dá)熱圖(圖8)。從生存狀態(tài)散點(diǎn)圖中我們可以發(fā)現(xiàn),高風(fēng)險(xiǎn)組中有更多患者處于死亡狀態(tài),且生存時(shí)間較短,并與RS呈正相關(guān),證明模型預(yù)測(cè)的準(zhǔn)確性。表達(dá)熱圖中,高風(fēng)險(xiǎn)組的ELFN1-AS1、RP5-884M6.1、LINC00461、RP1-79C4.4、RP4-816N1.7、RP3-380B8.4 表達(dá)量較高,而LINC01132 基因的表達(dá)量較低,與以上分析結(jié)果一致。 圖8 風(fēng)險(xiǎn)評(píng)分3圖聯(lián)動(dòng)。A:評(píng)分曲線圖;B:生存狀態(tài)散點(diǎn)圖;C:lncRNA表達(dá)熱圖 對(duì)高、低風(fēng)險(xiǎn)組進(jìn)行生存分析,繪制總生存期的K-M生存曲線(圖9),顯示高風(fēng)險(xiǎn)組患者的總體生存率更低,兩組比較差異有統(tǒng)計(jì)學(xué)意義(P<0.000 1),且高風(fēng)險(xiǎn)組某一節(jié)點(diǎn)存活人數(shù)更少、單位時(shí)間內(nèi)的死亡人數(shù)更多。以上說(shuō)明此模型可較好評(píng)估結(jié)腸癌患者預(yù)后。 圖9 風(fēng)險(xiǎn)評(píng)分高低組間生存分析圖。A:生存曲線圖;B:隨訪某一時(shí)間節(jié)點(diǎn)兩組間存活例數(shù);C:隨訪某一時(shí)間段死亡例數(shù) 對(duì)模型中的5 個(gè)lncRNA(ELFN1-AS1、RP5-884M6.1、LINC00461、LINC01132、RP1-79C4.4)構(gòu)建ceRNA 網(wǎng)絡(luò)。通過(guò)數(shù)據(jù)庫(kù)lncBOOK 預(yù)測(cè)miRNA,通過(guò)miRDB、TargeScan 和miRTarBase 數(shù)據(jù)庫(kù)預(yù)測(cè)mRNA,并根據(jù)相關(guān)性篩選構(gòu)成lncRNA-miRNA-mRN 的ceRNA 網(wǎng)絡(luò),使用軟件Cytoscape繪圖。 對(duì)下調(diào)lncRNA(LINC01132)匹配到的154個(gè)mRNA及上調(diào)lncRNA(ELFN1-AS1、RP5-884M6.1、LINC00461、RP1-79C4.4)匹配到的的351 個(gè)mRNA 進(jìn)行GO 富集分析。下調(diào)lncRNA 相關(guān)mRNA 涉及肌肉系統(tǒng)進(jìn)程(muscle system process)、肌肉器官發(fā)展(muscle organ development)等生物過(guò)程;富集在肌纖維膜(sarcolemma)、小凹(Caveola)等細(xì)胞組件;參與整合蛋白綁定(integrin binding)、離子通道綁定(ion channel binding)等分子功能(圖10)。上調(diào)lncRNA 相關(guān)的mRNA 涉及細(xì)胞外基質(zhì)組織(extracellular matrix organization)、細(xì)胞外結(jié)構(gòu)組織(extracellular structure organization)等生物過(guò)程;富集在內(nèi)含膠原蛋白細(xì)胞外基質(zhì)(collagen-containing extracellular matrix)、細(xì)胞重要邊緣(cell leading edge)等細(xì)胞組件;參與整合蛋白綁定(integrin binding)、細(xì)胞外基質(zhì)結(jié)構(gòu)成分(extracellular matrix structural constituent)等分子功能(圖11)。 圖10 下調(diào)長(zhǎng)鏈非編碼RNA基因本體論(GO)富集分析圖 圖11 上調(diào)長(zhǎng)鏈非編碼RNA基因本體論(GO)富集分析圖 再對(duì)lncRNA 相關(guān)mRNA 進(jìn)行KEGG 富集分析,分組顯示前15 條通路,發(fā)現(xiàn)下調(diào)lncRNA 相關(guān)基因顯著富集在肌動(dòng)蛋白細(xì)胞骨架的調(diào)控(regulation of actin cytoskeleton)、癌癥中的蛋白聚糖(proteoglycans in cancer)、PI3K-Akt 信號(hào)通路(PI3K-Akt signaling pathway)等通路(圖12);上調(diào)lncRNA相關(guān)基因顯著富集在細(xì)胞粘附分子(Cell adhesion molecules)、局灶性粘連(Focal adhesion)、吞噬體(phagosome)等通路(圖13)。 圖12 下調(diào)長(zhǎng)鏈非編碼RNA京都基因與基因組大百科全書數(shù)據(jù)庫(kù)(KEGG)富集分析圖 圖13 上調(diào)長(zhǎng)鏈非編碼RNA京都基因與基因組大百科全書數(shù)據(jù)庫(kù)(KEGG)富集分析圖 lncRNA 在細(xì)胞增殖分化、血管再生和細(xì)胞活力等方面發(fā)揮了重要的作用,當(dāng)其表達(dá)發(fā)生改變時(shí)可影響腫瘤的發(fā)生和轉(zhuǎn)移[16]。隨著生物學(xué)研究方法不斷進(jìn)步,越來(lái)越多l(xiāng)ncRNA 被深入研究,通過(guò)對(duì)其進(jìn)行整合分析,構(gòu)建了多種癌癥不同的預(yù)后風(fēng)險(xiǎn)模型,對(duì)腫瘤預(yù)后判斷提供了重要幫助[17-18]。大量研究表明,lncRNA 參與了結(jié)直腸癌的進(jìn)展,并可能成為診斷、治療及預(yù)后判斷的潛在生物標(biāo)志物[19]。 研究中,我們使用TCGA 數(shù)據(jù)庫(kù)結(jié)腸癌患者的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析并構(gòu)建預(yù)后風(fēng)險(xiǎn)模型。分析方法上,我們?cè)贑OX回歸分析的基礎(chǔ)上進(jìn)行Lasso回歸分析,能有效過(guò)濾其中的共線性因素,構(gòu)建了一個(gè)更為簡(jiǎn)練而準(zhǔn)確的模型。并對(duì)每個(gè)lncRNA 進(jìn)行單獨(dú)的生存分析,保證了模型中每個(gè)lncRNA 均對(duì)結(jié)腸癌患者生存率具有顯著影響。在模型準(zhǔn)確性評(píng)估方面,通過(guò)多種指標(biāo)進(jìn)行評(píng)估,包括C 指數(shù)值、ROC及AUC值、RS值可視化和高、低風(fēng)險(xiǎn)組生存分析,均表明模型具有較好的結(jié)腸癌預(yù)后預(yù)測(cè)能力。本研究篩選出7 個(gè)lncRNA 構(gòu)成的結(jié)腸癌預(yù)后風(fēng)險(xiǎn)模型,與單一的生物標(biāo)志物相比,多個(gè)綜合的生物標(biāo)志物系統(tǒng)可以提高容錯(cuò)性和預(yù)測(cè)的準(zhǔn)確性。目前此模型在國(guó)內(nèi)外的研究中未有報(bào)道,提示其可為結(jié)腸癌的預(yù)后判斷提供新的參考,及為結(jié)腸癌的分子機(jī)制研究提供新的方向。 模型中的7 個(gè)lncRNA 均被Ensembl 數(shù)據(jù)庫(kù)所注解,關(guān)于它們?cè)谀[瘤中的作用已有不同程度的認(rèn)識(shí)。關(guān)于下調(diào)lncRNA(LINC01132),研究發(fā)現(xiàn)其在膠質(zhì)母細(xì)胞瘤維持缺氧誘導(dǎo)因子的高活性和腫瘤細(xì)胞遷移率[20];有研究通過(guò)生物分析發(fā)現(xiàn)其在卵巢癌中低表達(dá),與患者的生存率明顯相關(guān),可用于評(píng)估卵巢癌患者預(yù)后,與本研究結(jié)果相符[21]。對(duì)于ELFN1-AS1則有較多的報(bào)道,如Lei等[22]發(fā) 現(xiàn)ELFN1-AS1 通過(guò)調(diào)節(jié)MIR-4644/TRIM44 軸加速了結(jié)直腸癌的增殖和遷移。LINC00461 是一個(gè)明星lncRNA,研究發(fā)現(xiàn)LINC00461 在多種癌癥中高表達(dá),通過(guò)不同的途徑影響著腫瘤的發(fā)生、進(jìn)展,其中包括結(jié)直腸癌[23-24]。Fu等[25]通過(guò)TCGA 數(shù)據(jù)分析發(fā)現(xiàn)RP4-816N1.7 與結(jié)腸腺癌預(yù)后密切相關(guān)。模型中的4個(gè)lncRNA(LINC01132、ELFN1-AS1、LINC00461、RP4-816N1.7)均有相關(guān)的研究報(bào)道,大多與結(jié)腸癌有關(guān),從側(cè)面驗(yàn)證本研究預(yù)后模型的準(zhǔn)確性。然而根據(jù)PubMed數(shù)據(jù)庫(kù)的搜索,沒(méi)有發(fā)現(xiàn)模型中其余3個(gè)lncRNA(RP5-884M6.1、RP3-380B8.4、RP1-79C4.4)研究報(bào)道,其在腫瘤,特別是結(jié)腸癌中的作用機(jī)制有待發(fā)掘。 為了探究模型中的lncRNA 潛在的生物學(xué)功能及如何影響結(jié)腸癌進(jìn)程,本研究構(gòu)建ceRNA 網(wǎng)絡(luò),通過(guò)GO 分析發(fā)現(xiàn),lncRNA 相關(guān)mRNA 基因主要富集在細(xì)胞膜、細(xì)胞質(zhì)等細(xì)胞組件,參與整合蛋白綁定、離子通道綁定、細(xì)胞外基質(zhì)結(jié)構(gòu)成分等分子功能,涉及肌肉系統(tǒng)進(jìn)程、肌肉器官發(fā)展、細(xì)胞外基質(zhì)組織、細(xì)胞外結(jié)構(gòu)組織等生物過(guò)程。KEGG 富集分析提示下調(diào)lncRNA 可能是通過(guò)肌動(dòng)蛋白細(xì)胞骨架的調(diào)控、癌癥中蛋白聚糖、PI3K-Akt 信號(hào)通路等抑制結(jié)腸癌進(jìn)展,上調(diào)lncRNA 可能是通過(guò)細(xì)胞粘附分子、局灶性粘連、吞噬體等通路促進(jìn)結(jié)腸癌進(jìn)展。 雖然我們構(gòu)建了一個(gè)有效的結(jié)腸癌預(yù)后風(fēng)險(xiǎn)模型,但也存在著一些不足。首先,從TCGA 中提取的結(jié)腸癌樣本量不夠大;其次,模型的預(yù)后價(jià)值評(píng)估不是十分令人滿意;再者,lncRNA、miRNA 和mRNA 間的相關(guān)程度及l(fā)ncRNA 如何影響結(jié)腸癌進(jìn)程主要通過(guò)在線數(shù)據(jù)庫(kù)進(jìn)行預(yù)測(cè),需要進(jìn)一步的實(shí)驗(yàn)研究。 綜上所述,本研究對(duì)TCGA 中結(jié)腸癌轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行整理、分析,篩選出7 個(gè)預(yù)后相關(guān)lncRNA,構(gòu)建預(yù)后風(fēng)險(xiǎn)模型,通過(guò)評(píng)估證明其具有較好預(yù)測(cè)患者生存預(yù)后的準(zhǔn)確性,同時(shí)每個(gè)lncRNA 是潛在單獨(dú)的預(yù)后生物標(biāo)志物,對(duì)結(jié)腸癌患者臨床預(yù)后評(píng)估具有一定的參考價(jià)值。通過(guò)GO、KEGG富集分析對(duì)模型中l(wèi)ncRNA 影響結(jié)腸癌機(jī)制進(jìn)行初步探索。在臨床上,結(jié)合結(jié)腸癌患者的lncRNA 分子水平的風(fēng)險(xiǎn)評(píng)分,可篩選出高風(fēng)險(xiǎn)患者,制定個(gè)體化的治療方案,有利于患者病情的預(yù)后評(píng)估和綜合診治。6、構(gòu) 建ceRNA 網(wǎng)絡(luò)及基因本體論(Gene Ontology,GO)、京都基因與基因組大百科全書數(shù)據(jù)庫(kù)(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析
結(jié)果
1、TCGA中結(jié)腸癌患者臨床病理信息
2、配對(duì)樣本差異分析結(jié)果
3、結(jié)腸癌預(yù)后關(guān)鍵lncRNA的篩選
4、預(yù)后風(fēng)險(xiǎn)模型的構(gòu)建
5、預(yù)后風(fēng)險(xiǎn)模型的評(píng)估
6、ceRNA網(wǎng)絡(luò)構(gòu)建及GO、KEGG富集分析
討論