田勝偉,張光遠,許斌,陳明
(1.東南大學 醫(yī)學院,江蘇 南京 210009; 2.東南大學附屬中大醫(yī)院 泌尿外科,江蘇 南京 210009)
癌癥已經成為全球范圍內人類發(fā)病與致死的首要疾病之一[1]。根據國際癌癥研究機構(International Agency for Research on Cancer)發(fā)布的數據顯示,2018年全世界約有1 800萬癌癥新發(fā)病例,約960萬病人因癌癥死亡[2]。僅僅在中國,2018年因癌癥而死亡的人數就高達290萬[3]。在過去的數十年里,盡管在腫瘤治療技術上面人類有了重大的進步,比如手術治療、化學治療、放射治療、靶向治療[4]以及免疫治療[5],但是各類癌癥患者的總生存期(OS)依然較低,預后依然較差[6]?,F有的腫瘤標志物以及常規(guī)檢查,對腫瘤進行早發(fā)現、早診斷、早治療以及判斷預后的作用有限。所以,有必要去探索一些新的特異性生物標志物,用于預測腫瘤的預后。
長鏈非編碼RNA(long- chain non- coding RNA,lncRNA),是一種包含200個核苷酸序列以上的非編碼RNA,可以調節(jié)基因表達與后轉錄過程[7- 10]。近年來,大量的研究[11- 14]表明,lncRNA參與調控各類腫瘤的發(fā)生發(fā)展,包括增殖、侵襲與轉移。一些lncRNA可以作為某些腫瘤診斷的特異性生物標志物,并與腫瘤的預后有關[15- 17]。
LINC00958是一種新型的lncRNA。2017年,Seitz等[18]首次發(fā)現LINC00958在膀胱癌中高表達。多項研究[19- 28]表明,LINC00958在多種腫瘤中異常表達,且與腫瘤患者的臨床病理分期以及OS有關。然而,在不同種類的腫瘤中LINC00958的表達水平與腫瘤的臨床病理特征以及預后存在差異。本研究通過Meta分析和生物信息學分析的方法歸納總結LINC00958的表達水平與多種腫瘤預后的關系。
在PubMed、Web of Science、Elsevier、Springer、知網的數據庫中進行相關文獻檢索,檢索時間截至2020年4月3日。檢索的關鍵詞為“LINC00958”“l(fā)ong intergenic non- protein coding RNA 958”“cancer” “tumor”“neoplasia”“prognosis”“outcome”。本研究是按照Meta分析的標準指南來進行的[29- 30]。
納入標準:(1) 能查閱到全文的文獻;(2) 按照LINC00958的表達高低進行分組并描述檢測方法;(3) 入 組的患者被明確診斷為某類腫瘤;(4) 文獻中對患者的生存率進行了分析或包含生存曲線。排除標準:(1) 快報、病例報道、綜述、會議摘要等非論著文章;(2) 原文中無法提取相關數據;(3) 數據重復或重疊研究。
為了確保數據提取的準確性,由兩人分別對文獻進行數據提取。有爭議的信息將由第3人進行討論并統一。提取的數據包括第一作者姓名、出版年份、國家、腫瘤類型、患者總人數、LINC00958的檢測方法、OS的風險比(HR)和95%置信區(qū)間(95%CI)、臨床病理學特征(性別、年齡、腫瘤大小、腫瘤分化程度及腫瘤轉移)。
按照Reporting Recommendations for Tumor Marker Prognostic Studies (REMARK)指南[30]對納入文獻進行質量評估。
采用Stata 12.0 MP軟件進行數據分析。計數資料采用HR與優(yōu)勢比(OR)為效應量,并計算相應的95%CI。HR及其95%CI用于分析LINC00958 與OS之間的相關性。OR及其95%CI用于分析LINC00958與腫瘤臨床病理特征間的相關性。如果原文未直接給出HR與95%CI,則用Engauge Digitizer 4.1軟件從原文中的Kaplan- Meier圖提取數據,并用Stata 12.0 MP 與Graphpad Prism 5 軟件對提取的數據進行分析獲得相應的HR與95%CI。通過Chi- SquaredQ檢驗與I2統計用于評估納入文獻的異質性。如果I2<50%或P>0.1認為無明顯異質性時,采用固定效應模型(fixed- effects model);如果I2>50%或P<0.1認為存在異質性時,則采用隨機效應模型(random- effects model)。進行敏感性分析檢驗結果的穩(wěn)定性,繪制Begg’s檢驗的漏斗圖用于評估是否存在發(fā)表偏倚(P<0.05表示存在發(fā)表偏倚)。
基因表達譜交互分析(Gene Expression Profiling Interactive Analysis,GEPIA,http://gepia.cancer- pku.cn)在線分析數據庫是一種新開發(fā)的網絡服務器,可以根據TCGA與GTEx數據提供多種服務,包括分析腫瘤組織與正常組織之間的基因表達差異以及生存分析。(1)基因表達差異分析:① 選擇expression DIY,點擊Box plot,檢索LINC00958;② “Log2FC cutoff”值取1,“P- value cutoff”值取0.01;③ Datasets Selection:依次輸入各類腫瘤英文簡稱,如“BLCA”;④ 數據來源選擇TCGA與GTEx數據庫(P<0.01被認為有統計學意義)。(2) 生存分析:① 選擇survival,點擊survival plots并輸入LINC00958;② 設定methods:overall survival;③ Datasets Selection: 依次輸入各類腫瘤英文簡稱,如“BLCA”;④ 使用Log- Rank檢驗進行假設評估;⑤ 運用Kaplan- Meier法繪制LINC00958表達水平-患者的OS關聯曲線(P<0.05為差異有統計學意義)。
共檢索文獻84篇,根據標題、摘要以及重復文獻共篩除文獻64篇;經過全文閱讀,按照納入與排除標準繼續(xù)篩除12篇;最終納入8篇原始文獻。見圖1。
納入文獻均為英文文獻,發(fā)表時間為2017年1月1日至2020年4月3日,研究人群均來自中國,研究內容均包含OS。其中8項研究,總計1 060例癌癥患者(其中關于頭頸鱗狀細胞癌的生存曲線來源于TCGA數據庫),平均132.5例,按照LINC00958在腫瘤組織中的表達水平,患者被分為高表達組與低表達組;共8類腫瘤,包括肝細胞肝癌(HCC)、子宮頸癌(CC)、鼻咽癌(NPC)、頭頸鱗狀細胞癌(HNSCC)、口腔鱗狀細胞癌(OSCC)、胃癌(GC)、膀胱癌(BC)、神經膠質細胞瘤(glioma);均采用定量實時聚合酶鏈反應(quantitative real time polymerase chain reaction, qRT- PCR)來驗證患者腫瘤組織中的LINC00958表達水平高低;2篇研究的HR值和95%CI從原文結果中直接獲得,6篇研究利用軟件從原文的Kaplan- Meier圖中提取。見表1。
圖1 文獻檢索流程圖
表1 納入文獻基本情況
與LINC00958低表達組患者相比,LINC00958高表達組患者的OS較短,HR為1.533, 95%CI為1.212~1.940,P<0.001,隨機效應模型; 圖2A)。敏感性分析顯示結果穩(wěn)定(圖2B)。Begg’s檢驗結果顯示關于OS發(fā)表偏倚風險較小(P=0.063,圖2C)。
A.LINC00958表達與OS森林圖;B.敏感性分析(OS);C.發(fā)表偏倚(OS,Begg’s漏斗圖)
LINC00958高表達與促進腫瘤轉移(包括淋巴結轉移與遠處轉移)有關,而年齡、性別、腫瘤大小、腫瘤分化程度與LINC00958高表達無關。Begg’s檢驗結果顯示發(fā)表偏倚風險較小(年齡P=0.462,性別P=0.462,腫瘤大小P=0.308,腫瘤分化程度P=0.296,腫瘤轉移P=0.707)。見表2。
表2 LINC00958表達與腫瘤臨床病理特征的關系
通過GEPIA數據庫分析獲取LINC00958高表達腫瘤組織樣本數據。LINC00958在8類腫瘤中表達水平明顯高于非腫瘤組織,包括膀胱尿路上皮癌(BLCA)、子宮頸鱗癌與腺癌(CESC)、子宮內膜癌(UCEC)、子宮肉瘤(UCS)、卵巢漿液性囊腺癌(OV)、HNSCC、甲狀腺癌(THCA)、肺鱗癌(LUSC),差異有統計學意義[Log2fold change (FC) cutoff>1,P<0.01],見圖3。在8類癌癥患者總樣本中,與LINC00958低表達組相比,LINC00958高表達組的OS較低,差異具有統計學意義(P<0.05),見圖4A。在HNSCC中,LINC00958高表達組的生存率明顯低于低表達組的生存率(P<0.05),見圖4B。在UCEC中,與LINC00958低表達組相比,LINC00958高表達組的OS較長,差異具有統計學意義 (P<0.05),見圖4C。在BLCA、CESC、UCS、OV、THCA、LUSC中,LINC00958高低表達腫瘤患者OS之間差異無統計學意義(P>0.05)。
近年來,越來越多的研究顯示,LINC00958在多種腫瘤中異常表達,并且與某些腫瘤的預后有關。本Meta分析歸納總結了LINC00958與多種腫瘤的預后及臨床病理特征之間的關系。分析結果顯示,與LINC00958低表達組相比,LINC00958高表達組的腫瘤患者的OS較短,且與促進腫瘤轉移風險有關。此外,用生物信息學分析方法去進一步驗證LINC00958在腫瘤中的表達水平以及與腫瘤預后的關系。GEPIA的數據分析顯示,LINC00958在8類腫瘤中高表達,且LINC00958高表達的8類腫瘤患者的OS較短,這與本Meta分析所得出的結果一致;且LINC00958高表達的HNSC患者OS較短,而LINC00958高表達的UCEC患者OS較長,這與之前的研究結果相符合。
圖3 LINC00958在8種腫瘤組織中的表達水平
圖4 腫瘤患者的生存曲線
LINC00958作為促癌基因被廣泛研究并報道,但在某些腫瘤中也可以作為抑癌基因。Guo等[19]發(fā)現,在神經膠質細胞瘤中LINC00958可以作為miRNA的內源性競爭RNA(ceRNA),通過miR- 203/CDK2信號通路促進神經膠質瘤細胞的發(fā)生發(fā)展。Zuo等[21]發(fā)現,在HCC的發(fā)生發(fā)展中LINC00958可以通過miR- 3619- 5p/HDGF信號通路促進肝癌細胞的增殖、侵襲與轉移。Chen等[22]發(fā)現,敲低LINC00958后可以下調miR- 330- 5p/PAX8,從而抑制胰腺癌細胞的上皮間質轉換(EMT)、侵襲與轉移。Wang等[23]研究發(fā)現,LINC00958可以抑制miR- 625- 5p而上調LRRC8E的表達,從而促進宮頸癌細胞增殖與轉移。Zhao等[24]表明,通過抑制LINC00958的表達,經miR- 5095/RRM2信號通路可以抑制細胞癌變,減少癌細胞增殖,促進癌細胞凋亡,并增強CC細胞對放療的敏感性。Chen等[25]認為,LINC00958可以作為OSCC的新型預后生物標志物,并且其通過調控miR- 627- 5p/YBX2信號通路而發(fā)揮作用。Huang等[26]發(fā)現,LINC00958- c- Myc信號通路對HNSCC發(fā)生發(fā)展過程具有正反饋調解作用,并且可以減弱放化療效果。Chen等[28]發(fā)現,LINC00958作為促癌基因,通過抑制miR- 625而抑制下游NUAK1的表達,從而促進NPC細胞的發(fā)生發(fā)展。Wang等[32]發(fā)現,LINC00958作為促癌基因通過LINC00958/miR- 185- 5p/YWHAZ信號通路促進OSCC細胞發(fā)生發(fā)展。Yang等[33]發(fā)現,在肺腺癌細胞中通過轉錄因子SP1可引起LINC00958的過表達,并且LINC00958可以抑制miR- 625- 5p而上調CPSF7的表達,從而促進肺腺癌細胞的發(fā)生發(fā)展。然而,在UCEC的研究中LINC00958作為抑癌基因被報道。Wang等[34]發(fā)現,LINC00958也許可以通過抑制miR- 761從而調控DOLPP1,對UCEC的良好預后有積極作用。這一現象與基因在不同腫瘤中的生存特性不完全相同有關[35]。lncRNA MALAT1雖然在多數腫瘤中作為促癌基因,但是在乳腺癌中其可抑制乳腺癌細胞轉移;Linc- ROR在乳腺癌、GC、肝癌中作為促癌基因,而在膠質瘤中低表達并抑制腫瘤的發(fā)生發(fā)展[36]。
本研究也有一些不足之處:(1) 本次分析所納入的所有文獻都來自于中國,存在著地域偏倚,所以這些數據不能代表所有種族與人種,可能僅僅適用于亞洲黃色人種;(2) 只檢索了中文與英文文獻,所以也許會遺漏其他語言發(fā)表的類似文獻;(3) 本次分析中的HR與CI多數是用軟件從K- M圖中提取,而不是由原文中的數據直接獲得,所以也許會存在誤差;(4) 本次納入的HNSCC研究,對LINC00958與腫瘤臨床病理特征之間的關系進行了分析,但未對入組的患者進行生存分析,該研究的生存曲線來源于TCGA數據庫,而非該研究的原始數據,所以這也會導致一定程度的誤差;(5) 對于LINC00958與腫瘤轉移風險之間的分析,本次研究將淋巴結轉移與遠處轉移統一為腫瘤轉移,而未對兩者進行單獨分析;(6) 本次分析僅有8篇文獻入組,且高質量文章數量較少,不管是患者數量還是腫瘤類型都較為有限。所以,仍須進行大量相關高質量的研究,提高入組患者數量,增加腫瘤種類,從而得出更可靠的結果。
LINC00958在多數腫瘤中作為促癌基因,該基因的高表達與多數類型腫瘤的不良預后相關,且與促進腫瘤發(fā)生轉移的風險有關。但是,該研究仍存在著一些不足,將來須進行更多的相關研究。