范以東,秦 剛,蘇國威,肖世富,劉俊良,李威材,吳廣濤
(1.廣西中醫(yī)藥大學(xué),廣西 南寧 530022;2.廣西中醫(yī)藥大學(xué)第一附屬醫(yī)院,廣西 南寧530022)
骨肉瘤(osteosarcoma,OS)是起源于原始間充質(zhì)細胞的最常見的原發(fā)性骨腫瘤[1]。在兒童和青少年中最常見,是繼軟骨肉瘤和脊索瘤之后的成人第3 大常見骨癌。全球總發(fā)病率為每年3.4/100 萬[2]。當前,OS 患者的治療通常包括手術(shù)聯(lián)合新輔助化療藥物,且估計轉(zhuǎn)移性O(shè)S 患者的5 年生存率不足20%[3]。在過去的20 年中,盡管有許多化療方案,但生存率沒有顯著改善。對OS 預(yù)后生物標志物的預(yù)測,能夠輔助判斷患者接受治療后可能發(fā)生的臨床轉(zhuǎn)歸、提高OS 的治療效果、降低治療相關(guān)毒性并為將來的臨床試驗設(shè)計提供方案[4]。因此,確定OS的預(yù)后生物標志物至關(guān)重要。
銅是所有生物體內(nèi)不可缺少一種微量元素,主要參與真核生物的能量代謝、活性氧積累、鐵攝取和信號傳導(dǎo),細胞中銅對細胞增殖、分化或細胞死亡有直接影響[5]。當細胞內(nèi)銅離子濃度超過了維持穩(wěn)態(tài)的閾值時,將導(dǎo)致細胞毒性的出現(xiàn)。涉及的機制包括活性氧的積累、抗血管生成和蛋白酶體抑制等[6]。最近的研究表明,銅參與調(diào)節(jié)細胞死亡的模式與已知的死亡機制(如:鐵死亡、細胞凋亡、壞死性凋亡、自噬)不同,且與線粒體呼吸關(guān)系更為密切[7]。銅離子直接結(jié)合三羧酸循環(huán)(TCA)中的脂?;煞?,導(dǎo)致這些蛋白聚集、失調(diào),隨后鐵-硫簇蛋白丟失,進而引發(fā)蛋白質(zhì)毒性應(yīng)激,并最終致使細胞 死 亡,Tsvetkov 等[8]將 這 一 過 程 命 名 為 銅 死 亡(cuproptosis)。
長鏈非編碼RNA(lncRNA)是長度超過200 個核苷酸的轉(zhuǎn)錄本,參與許多生物過程,包括細胞分化、發(fā)育和凋亡[9]。重要的是,lncRNA 已被證明是基因表達的重要調(diào)節(jié)因子,它們可以在包括癌癥在內(nèi)的各種生物學(xué)功能和疾病過程中發(fā)揮關(guān)鍵作用[10]。研究發(fā)現(xiàn)lncRNA 與多種癌癥相關(guān),包括乳腺癌[11]、結(jié)直腸癌[12]、肝癌[13]等。當前,銅死亡相關(guān)LncRNA 在OS 中的作用尚不清楚,因此,我們的研究旨在利用生物信息學(xué)探索銅死亡相關(guān)lncRNA 在OS 預(yù)后中的作用。
2022 年10 月19 日 從UCSC Xena 數(shù) 據(jù) 庫(http://xena.ucsc.edu/)下載88 例骨肉瘤樣本的基因表達譜與相應(yīng)的臨床數(shù)據(jù)(包括生存時間、生存狀態(tài)、年齡、性別、是否轉(zhuǎn)移)。2022 年10 月20 日從GTEx 數(shù)據(jù)庫(https://www.gtexportal.org/home/)獲得396 例正常樣品的基因表達譜,對所有基因表達數(shù)據(jù)進行l(wèi)og2(x+1)轉(zhuǎn)換。從已發(fā)表的文章中提取 了19 個 銅 死 亡 相 關(guān) 基 因[8,14]。R 軟 件”sva“包Combat 函數(shù)對UCSC 和GTEx 的合并數(shù)據(jù)進行歸一化處理。根據(jù)合并數(shù)據(jù)中基因的注釋信息來區(qū)分mRNA 與LncRNA。為了篩選潛在與銅死亡相關(guān)的LncRNA,使用R 軟件“l(fā)imma”包以|R|>0.4 和P<0.05(R 為相關(guān)系數(shù))作為篩選條件對19 個銅死亡基因與lncRNA 進行共表達分析。最后,對符合要求的lncRNA 按|log2FC|≥1,F(xiàn)DR<0.05 條件進行差異分析,得到差異的銅死亡相關(guān)lncRNA 進行后續(xù)分析。
對85 例患者(其中2 名患者沒有生存狀態(tài),1 名患者沒有總生存時間,故未納入研究)按1∶1 隨機分成訓(xùn)練組與驗證組。訓(xùn)練組用于構(gòu)建預(yù)后模型,驗證組和總樣本組進行模型驗證(表1)。單因素Cox回歸篩選銅死亡相關(guān)差異lncRNA 中預(yù)后相關(guān)的lncRNA。然后,對訓(xùn)練組采用最小絕對收縮和選擇算子(LASSO)Cox 回歸和多元Cox 回歸模型來創(chuàng)建預(yù)后模型。計算每個患者的風險值公式為:,其 中xi和Coefi代 表 每 個lncRNA 的表達量和風險系數(shù)。根據(jù)訓(xùn)練組中風險評分的中位數(shù)將OS 患者分成高、低風險兩組。Kaplan-Meier(K-M)生存分析比較了兩個不同風險組之間的總生存期。進一步繪制預(yù)測1 年、3 年、5 年總生存期及臨床特征的受試者工作特征(ROC)曲線以評估模型的預(yù)測價值。驗證組和總樣本組中每個OS 患者的風險評分根據(jù)相同的公式計算。
表1 分組的臨床信息Tab 1 Grouped clinical information
將風險打分與OS 患者的臨床信息結(jié)合,包括年齡、性別、轉(zhuǎn)移。采用單因素與多因素Cox 分析確定風險評分是否可以作為獨立的預(yù)后因素。
為了更好的使預(yù)后模型應(yīng)用于臨床,使用R 軟件的“rms”與“survival”包構(gòu)建預(yù)后列線圖模型,以評估OS 患者的1 年、3 年和5 年的生存期。校準曲線可視化實際結(jié)果與列線圖預(yù)測結(jié)果間的一致性。
采用R 軟件“GSVA”包中的單樣本基因集富集分析(ssGSEA)分析16 種免疫細胞浸潤和13 種免疫功能在高、低風險組的差異。
本研究所有的統(tǒng)計分析與繪圖均在R(64x 4.1.2)軟件上進行。Pearson 相關(guān)分析得到基因共表達的相關(guān)性。采用Wilcox test 比較腫瘤組織與正常組織的差異基因表達。Mann-Whitney 檢驗來比較高、低風險組之間免疫細胞含量或功能的ssGSEA 評分。采用Kaplan-Meier 生存分析和對數(shù)秩檢驗來比較高低風險組之間的生存差異。單因素和多因素Cox 回歸分析用于確定獨立的預(yù)后因素。P<0.05 被認為差異具有統(tǒng)計學(xué)意義。
提取UCSC+GTEx 合并數(shù)據(jù)中19 個銅死亡基因與13 425 個lncRNA 的表達量進行共表達分析,共得到符合條件的181 個lncRNA(|R|>0.4 和P<0.05),其中PDHA1 未發(fā)現(xiàn)有相關(guān)lncRNA。進行差異分析,得到108 個差異銅死亡相關(guān)lncRNA(|log2FC|≥1,F(xiàn)DR<0.05),其中33 個下調(diào),75 個上調(diào)。桑基圖可視化銅死亡基因與其相關(guān)lncRNA 共表達關(guān)系(圖1A)。共有85 位OS 患者被隨機分為訓(xùn)練組(n=43)和驗證組(n=42)。對于訓(xùn)練組,將篩選得到的108 個銅死亡相關(guān)lncRNA 進行單因素Cox 分析,確定了10 個預(yù)后相關(guān)的銅死亡lncRNA,其 中 有 5 個 高 風 險 lncRNA(AC124798.1、AC005277.2、LINC01549、LINC01060、AP00085 1.2)和5 個低風險lncRNA(PCOLCE-AS1、AC090 152.1、NKILA、AC090559.1、AL136162.1)(圖1B)。隨后,采用Lasso 回歸與多因素Cox 回歸分析最終確定了參與模型構(gòu)建的最優(yōu)的3 個lncRNA(AC124798.1、AC090152.1、AC090559.1)(圖1C、D、E)。
圖1 鑒定OS 中具有預(yù)后意義的銅死亡相關(guān)lncRNAFig 1 Identification of cuproptosis -associated lncRNAs with prognostic significance in OS
采用篩選得到的3 個lncRNA 對訓(xùn)練組、驗證組及總樣本組中的每位患者計算風險評分,風險評分= AC124798.1×(1.14553168738236)+AC09015 2.1×(-1.13701301122647)+AC090559.1*(-1.8 3119937382105)。根據(jù)風險評分的中位值將訓(xùn)練組患者分為高、低風險組。生存分析顯示低風險組的總生存期明顯優(yōu)于高風險組。風險熱圖顯示從低風險組到高風險組AC124798.1 表達逐漸升高,AC090152.1 與AC090559.1 表達逐漸降低。生存狀態(tài)圖顯示,低危組到高危組患者死亡數(shù)逐漸增加。不僅如此,我們還在驗證組和總樣本組進行了驗證。結(jié)果顯示,驗證組與總樣本組均具有與訓(xùn)練組相似的趨勢(圖2A-L)。ROC 曲線顯示,1 年、3 年和5 年的AUC 值分別為0.799、0.786、0.827(圖3A)。風險評分與轉(zhuǎn)移的AUC 值分別為0.799 和0.905,高于年齡(0.461)與性別(0.467)(圖3B)??傊?,以上結(jié)果說明我們構(gòu)建的預(yù)后模型具有較好的預(yù)后價值。
圖2 不同分組中OS 患者銅死亡相關(guān)lncRNA 的預(yù)后價值Fig 2 Prognostic value of cuproptosis -related lncRNAs in different groups of patients with OS
圖3 預(yù)后模型的臨床相關(guān)ROC 曲線Fig 3 ROC curve of clinical relevance of prognostic model
圖4 OS 患者臨床性狀與風險評分的獨立預(yù)后分析Fig 4 Independent prognostic analysis of clinical traits and risk score in patients with OS
采用單因素和多因素Cox 分析,以判斷風險打分是否是可以獨立于其他臨床特征的預(yù)后因素。結(jié)果顯示,在單因素和多因素Cox 分析中風險評分和轉(zhuǎn)移可以作為獨立的預(yù)后因素,且都為高危因素。
根據(jù)臨床特征(包括風險評分、年齡、性別、轉(zhuǎn)移),構(gòu)建預(yù)測OS 患者1 年、3 年和5 年生存期的列線圖模型(圖5A)。校準曲線表明,列線圖預(yù)測的總生存期與實際的總生存期具有較好的一致性(圖5B)。我們還將列線圖加入進來,繪制了預(yù)測5 年生存期的ROC 曲線,結(jié)果顯示,列線圖的AUC 值(AUC=0.852)最高,具有一定的臨床應(yīng)用價值(圖5C)。
圖5 列線圖的構(gòu)建與驗證Fig 5 Construction and validation of nomograms
通過ssGSEA 研究了不同風險組與浸潤腫瘤免疫細胞和免疫功能之間的關(guān)系。發(fā)現(xiàn)絕大多數(shù)免疫細胞和免疫功能在高低風險組之間有差異,且低風險組的免疫細胞和免疫功能打分均比高風險組的高。低風險組中免疫細胞(包括B cells、CD8+T cells、DCs、Macrophages、Neutrophils、NK cells、pDCs、T helper cells、Tfh、Th1 cells、Th2 cells、TIL、Treg)(圖6A)及免疫功能(包括APC co inhibition、APC co stimulation、CCR、Check-point、Cytolytic activity、HLA、inflammation-promoting、MHC class I、Parainflammation、T Cell co-inhibition、T Cell costimulation、Type_I_IFN_Reponse)(圖6B)顯 著 上調(diào)(P<0.05)。說明銅死亡與腫瘤免疫關(guān)系密切,高風險組中免疫細胞及功能可能受到抑制。
圖6 高低風險組中免疫細胞與免疫功能的差異分析Fig 6 Analysis of differences between immune cells and immune function in high and low risk groups
銅死亡是新發(fā)現(xiàn)的一種銅依賴性調(diào)節(jié)細胞死亡形式。細胞內(nèi)銅穩(wěn)態(tài)的失衡可以影響癌細胞的生長及增殖的速度[15]。以往的研究表明,細胞的程序性細胞死亡與腫瘤密切相關(guān),如細胞凋亡、自噬、壞死性凋亡等[16]。所以,對銅死亡的深入研究可能會為癌癥的治療帶來新的解決方案。
LncRNA 一類是非蛋白質(zhì)編碼RNA 分子,能夠在各種水平上調(diào)節(jié)基因表達,包括組蛋白修飾,轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)節(jié)[17]。據(jù)估計,人類中有超過60 000個lncRNA,并且lncRNA 的數(shù)量仍在快速增長[18]。到目前為止,只有極少數(shù)lncRNA 的功能被注釋[19]。失調(diào)的lncRNA 廣泛參與腫瘤的發(fā)病機制,包括細胞增殖、遷移、侵襲、細胞凋亡和抗腫瘤耐藥性[20]。不僅如此,一部分LncRNA 還被確定為腫瘤診斷和預(yù) 后 的 生 物 標 志 物。Deng 等[21]證 實LncRNA RBM5-AS1 在OS 組織和細胞系中顯著增加,此外,在體外實驗中敲低RBM5-AS1 顯著抑制OS 細胞的增 殖,遷 移 和 侵 襲。Huang 等[22]發(fā) 現(xiàn)LncRNA BE503655 在人OS 組織和OS 細胞系中過表達,敲低lncRNA BE503655 可以抑制OS 細胞增殖和侵襲,且其發(fā)揮功能依賴于OS 細胞中Wnt/β-catenin信號通路傳導(dǎo)的調(diào)節(jié)。LncRNA CBR3-AS1 被發(fā)現(xiàn)在調(diào)節(jié)OS 細胞增殖、遷移、侵襲方面具有致癌作用,并且還是OS 患者的獨立不良預(yù)后因素[23]。以上研究說明在OS 中,LncRNA 不僅可以充當OS 的生物標志物,且與其預(yù)后密切相關(guān)。
本研究通過Pearson 相關(guān)系數(shù)與差異分析共得到108 個差異銅死亡相關(guān)lncRNA。隨后對85 例骨肉瘤患者按1∶1 分為訓(xùn)練組和驗證組,在訓(xùn)練組中使用單因素Cox、Lasso 回歸及多因素Cox 構(gòu)建了包含3 個LncRNA 的預(yù)后模型,并在驗證組和總樣本組中得到了驗證。利用生存分析、ROC、獨立預(yù)后分析、校準曲線驗證評估了此模型的預(yù)測性能。
預(yù)后模型是由3 個LncRNA 構(gòu)成,包括AC124798.1、AC090152.1、AC090559.1。其 中,AC124798.1 是骨肉瘤預(yù)后不良的危險因素,AC090152.1 和AC090559.1 則是保護因素。本研究發(fā)現(xiàn)這3 個LncRNA 與多種腫瘤預(yù)后相關(guān),在一定程度上反映了本研究結(jié)果的可靠性。AC124798.1與乳腺癌和胰腺癌患者的生存相關(guān),是兩者重要的預(yù)后保護因素[24][25]。AC090152.1 被認為是肝癌預(yù)后 生 物 標 志 物[26]。Wang 等[27]發(fā) 現(xiàn)AC090152.1 不僅是腎細胞癌的預(yù)后不良因素,而且與T 細胞等免疫細胞群之間存在正相關(guān)關(guān)系,與中性粒細胞和內(nèi)皮細胞呈負相關(guān)。AC090559.1 與鐵死亡、自噬、壞死性凋亡、焦亡密切相關(guān),可以用作肺腺癌與骨肉瘤預(yù)后的生物標志物[28-31]。目前這些LncRNA 在OS 中的相關(guān)研究甚少,與OS 的關(guān)系仍不清楚。
腫瘤微環(huán)境中浸潤的免疫細胞和免疫功能在腫瘤發(fā)生和腫瘤進展中起著至關(guān)重要的作用[32]。我們對不同風險組進行了16 種免疫細胞浸潤和13種免疫功能的差異分析,結(jié)果顯示有13 種免疫細胞和12 種免疫功能在高風險組都受到抑制。OS 的免疫微環(huán)境主要是由T 淋巴細胞和巨噬細胞組成,此外還有B 淋巴細 胞和肥大細胞[33]。CD8+T 細胞被認為是抗腫瘤免疫的主要驅(qū)動因素之一[34],可以直接裂解和清除癌細胞[35]。有研究表明,在三陰性乳腺癌中,CD8+T 細胞的高水平與患者的預(yù)后良好有關(guān)[36]。Tfh(濾泡輔助性T 細胞)與抗腫瘤免疫也密切相關(guān),乳腺癌患者中Tfh 細胞浸潤較高的患者生存率也較高[37]。深入研究腫瘤微環(huán)境中的各種免疫細胞及功能的內(nèi)在機制,并從中尋找有利于提高免疫系統(tǒng)抗腫瘤能力的研究具有十分重要的意義。
這項研究也存在著許多不足,首先,盡管構(gòu)建的預(yù)后模型在內(nèi)部數(shù)據(jù)中得到了證實,但是,還是需要更多的臨床數(shù)據(jù)進行進一步驗證。其次,本研究的預(yù)后模型是通過公共數(shù)據(jù)庫建立和驗證的,除了本研究的數(shù)據(jù)分析外,仍要進行實驗驗證。
作者貢獻度說明:
秦剛:文章構(gòu)思;范以東:數(shù)據(jù)分析、研究設(shè)計及手稿撰寫;蘇國威、肖世富:文章芯片篩選;劉俊良、李威材和吳廣濤:負責數(shù)據(jù)整理及文獻查閱。
所有作者聲明不存在利益沖突關(guān)系。