李 楠,遲少麗,劉 巖,王連友
目前肺腺癌(lung adenocarcinoma,LUAD)是人類最常見的惡性腫瘤之一,且其發(fā)病率和病死率呈逐漸上升趨勢[1,2]。肺腺癌診斷及預(yù)后方面的研究對臨床治療有重要意義。目前研究認為LUAD的發(fā)生發(fā)展是多因素、多階段以及多基因共同改變作用的結(jié)果,其中長鏈非編碼RNA(lncRNA)被認為發(fā)揮了重要作用[3]。lncRNA是一類長度大于200 nt的RNA分子,不編碼蛋白質(zhì),可以在不同水平調(diào)控基因的表達,包括染色質(zhì)修飾、轉(zhuǎn)錄水平以及轉(zhuǎn)錄后水平的調(diào)節(jié),與人類多種疾病尤其是腫瘤密切相關(guān)[4-6],目前已有研究發(fā)現(xiàn),某些 lncRNA 在胰腺癌、直腸癌及肝細胞癌中表達明顯升高[7-9],提示其與腫瘤的發(fā)生發(fā)展密切相關(guān),但目前關(guān)于lncRNA在肺腺癌中作為腫瘤標志物的研究較少。為此,該次研究擬通過對TCGA (The Cancer Genome Atlas)公共數(shù)據(jù)庫的數(shù)據(jù)挖掘,探索其在LUAD中差異表達的lncRNAs作為LUAD腫瘤標志物的效果及指導(dǎo)判斷預(yù)后的意臨床義。
1.1 數(shù)據(jù)收集 高通量RNA-seq結(jié)果于2017年8月2日從TCGA數(shù)據(jù)庫利用Bioconductor/TCGA biolink從TCGA數(shù)據(jù)庫下載。利用Kaplan-Meier Plotter數(shù)據(jù)(http://kmplot.com/analysis/)中的肺腺癌數(shù)據(jù)集進行在線生存分析。先在LUAD樣本中篩選高突變頻率的lncRNAs。該研究在 HGNC(www.genenames.org)數(shù)據(jù)庫中搜集了265個經(jīng)證實的lncRNAs,將獲得的lncRNAs名稱全部導(dǎo)入cBioPortal數(shù)據(jù)庫(http://www.cbioportal.org),在基因組和轉(zhuǎn)錄組層面進行變異分析,RNA表達差異Z-score閾值為±2,在所有病例中改變超過10%的lncRNAs被認為有顯著性差異。再驗證具有顯著性差異的lncRNAs在腫瘤和正常組織中的表達差異。所有篩選出具有明顯變異的lncRNAs均使用oncomine數(shù)據(jù)庫(www.oncomine.org)在 LUAD和正常組織中進行轉(zhuǎn)錄水平的表達差異驗證。若Fold change(FC)>1.5且P值<0.05則認為結(jié)果有統(tǒng)計學(xué)意義。
1.2 統(tǒng)計學(xué)分析 使用Graphpad prism 6.0軟件進行統(tǒng)計學(xué)分析, 包括 t-test、heatmap、ROC 分析。生存分析采用Kaplan-Meier和log-rank檢驗法。P<0.05則認為結(jié)果有統(tǒng)計學(xué)意義。
2.1 肺腺癌中變異明顯的lncRNAs 所有備選的lncRNAs均為出現(xiàn)突變的,但是,在265個lncRNA中有8個lncRNA的拷貝數(shù)和表達量的總變異率超過 10%(圖 1)。 分別為 CASC8 (10%)、HCG11(10% )、DGCR5 (11% )、TP53TG1 (14% )、PVT1(21% )、PTCSC3(13%)、HAR1A (13%)及 HAR1B(10%)。
圖1 基因拷貝數(shù)和mRNA差異熱圖
2.2 總變異率超過10%的lncRNA對肺腺癌診斷及預(yù)后價值的相關(guān)性 利用Kaplan-Meier Plotter在線數(shù)據(jù)對上述得到的8個lncRNA進行生存分析, 結(jié)果得出,PVT1、HCG11、TP53TG1 和 DGCR5高表達患者的預(yù)后低于低表達患者,且結(jié)果具有顯著性差異 (P<0.05, 圖2)。 以上結(jié)果顯示,PVT1、HCG11、TP53TG1和DGCR5是 LUAD預(yù)后不良因素,四者的高表達與患者生存期縮短呈顯著性相關(guān)(P<0.05)。利用Oncomine中的肺腺癌組織和正常肺組織的RNA-seq數(shù)據(jù)對上述 4個 lncRNA進行ROC分析,TP53TG1和HCG11結(jié)果無統(tǒng)計學(xué)意義(P>0.05);PVT1 和 DGCR5 AUC 分別為 0.975 (P<0.01),0.9722(P<0.01),說明具有良好診斷效率(圖3)。綜合上述結(jié)果,PVT1和DGCR5可能成為判斷肺腺癌患者預(yù)后的標志物。
圖2 總變異率超過10%的8個lncRNAs生存分析
圖3 4個lncRNAs ROC分析
2.3 4個lncRNAs在腫瘤和正常組織中表達差異驗證 利用Oncomine數(shù)據(jù)庫的TCGA肺腺癌和正常 組 織 中 PVT1、HCG11、TP53TG1 和 DGCR5 的RNA-seq數(shù)據(jù)進行分析,驗證其差異表達。結(jié)果顯示,PVT1在LUAD組織中比正常肺癌組織升高了2.232 倍 (P<0.01),TP53TG1 升高 1.467 (P=0.021)倍,DGCR5 升高了 1.702 倍 (P=2.24E-12)。 而HCG11沒有顯著性差異。筆者所在課題組將P<0.01的作為有極顯著性差異。上述結(jié)果顯示,PVT1和DGCR5在LUAD組織中的表達量明顯高于正常肺癌組織,且差異具有極顯著性(P<0.01)。見圖4。
圖4 PVT1、TP53TG1、HCG11 和 DGCR5 在正常肺組織和LUAD組織中的表達驗證
2.4 PVT 1和DGCR5在其他類型腫瘤組織中的表達分析 利用Oncimne數(shù)據(jù)庫對PVT1和DGCR5在29種腫瘤和正常組織中的表達數(shù)據(jù)進行分析,PVT1 在結(jié)腸腺癌(colon adenocarcinoma,COAD)、肝臟肝細胞癌(liver hepatocellular carcinoma,LIHC)、LUAD、肺鱗狀細胞癌(lung squamous cell carcinoma,LUSC)、 胰 腺 癌 (pancreatic adenocarcinoma,PAAD)、直腸腺癌(rectum adenocarcinoma,READ)、胃腺癌 (stomach adenocarcinoma,STAD)、胸腺瘤(thymoma,THYM)中明顯升高,在 LAML,OV,THCA中明顯下降。而DECR5僅在LUAD明顯上升,在LGG、PAAD和TGCT中明顯下降。結(jié)果顯示作為LUAD的標志物,DGCR5更具有特異性。
LUAD是常見的惡性腫瘤之一,嚴重威脅人類健康的惡性腫瘤,早期發(fā)現(xiàn)、診斷、治療可以大大提高肺腺癌患者的存活率[10]。目前臨床常規(guī)物理診斷很難發(fā)現(xiàn)<1 cm的腫瘤,而傳統(tǒng)的腫瘤標志物的靈敏度和特異性也不夠高[11]。因此,采用現(xiàn)代分子生物學(xué)技術(shù),尋找理想的腫瘤標志物對于提高惡性腫瘤診治水平具有重大意義。近年來研究發(fā)現(xiàn)lncRNA具有多種生物活性,參與了X染色體沉默、染色體修飾、轉(zhuǎn)錄激活與抑制及RNA剪切等過程,在細胞分化、胚胎與組織發(fā)育、腫瘤中均發(fā)揮重要功能[12-14],但 lncRNA 的數(shù)量眾多,生物學(xué)功能尚不完全清楚。 Han等[15]發(fā)現(xiàn),與癌旁組織相比,lncRNA GAS6-AS1(growth arrest specific gene6 antisense,RNA1)在 NSCLC組織中的表達水平顯著下調(diào)。且GAS6-AS1的水平與患者淋巴結(jié)轉(zhuǎn)移、腫瘤分期及預(yù)后密切相關(guān),GAS6-AS1表達水平越低,患者生存期越短。 Zhang 等[16]通過 qRT-PCR 技術(shù),分析 62組肺腺癌組織和鄰近的癌旁組織ZXF1表達的差別,發(fā)現(xiàn)與鄰近的正常組織相比,肺腺癌組織中ZXF1水平顯著增高;進一步分析ZXF1與患者的臨床病理學(xué)特征、預(yù)后之間的關(guān)系,發(fā)現(xiàn)ZXF1表達上調(diào)與淋巴結(jié)的轉(zhuǎn)移、腫瘤的病理分期以及淋巴結(jié)轉(zhuǎn)移的范圍有關(guān)。這說明,長鏈非編碼RNA在肺腺癌中呈現(xiàn)高表達,并且在腫瘤細胞增殖和侵襲中發(fā)揮重要作用。
lncRNA在肺癌的發(fā)生、發(fā)展和耐藥過程中有重要的調(diào)控作用,這些lncRNA部分發(fā)揮致癌作用,因此,加深加快對lncRNA在腫瘤發(fā)生發(fā)展過程中的機制研究有助于對肺癌的早期診斷及預(yù)后判斷。在該次研究中,利用TCGA數(shù)據(jù)庫對肺腺癌中l(wèi)ncRNA進行挖掘,發(fā)現(xiàn)8個在基因拷貝數(shù)和表達差異超過10%的lncRNA,并利用在線數(shù)據(jù)分析其在肺腺癌診斷和預(yù)后判斷中的臨床價值,找到了PVT1和DRCG5兩個較大臨床價值的lncRNA,通過兩種分子在LUAD表達的驗證和其他腫瘤類型中表達分析,確定DGCR5可以作為特異的對LUAD進行診斷和判斷預(yù)后的指標,為臨床腫瘤標記物的篩選建立提供了研究依據(jù)。