仲 濤 朱英會(huì) 仲偉俍 王志堅(jiān) 于英楠△ 田 康
【提 要】 目的 應(yīng)用WGCNA分析篩選骨肉瘤轉(zhuǎn)移標(biāo)志物,通過風(fēng)險(xiǎn)評(píng)分建立骨內(nèi)瘤預(yù)后的預(yù)測(cè)模型,為評(píng)估骨內(nèi)瘤轉(zhuǎn)移和預(yù)后提供方法指導(dǎo)。方法 基于GSE14359數(shù)據(jù)集(n=20),WGCNA法確定骨內(nèi)瘤轉(zhuǎn)移模塊中的中心基因;獲取TARGET公共數(shù)據(jù)庫骨內(nèi)瘤樣本(n=86),在單因素Kaplan-Meier預(yù)后分析基礎(chǔ)上,Cox多因素計(jì)算風(fēng)險(xiǎn)評(píng)分構(gòu)建評(píng)估患者生存的預(yù)測(cè)模型。結(jié)果 中心基因HLA-DRA和FLI1與骨內(nèi)瘤轉(zhuǎn)移密切相關(guān)(P<0.05);風(fēng)險(xiǎn)評(píng)分=0.149×G0S2-0.572×ARHGDIB+0.048×CD74+0.242×HLA-DMA-0.473×MGAT1-0.813×PLD3+0.230×EPAS1,有較好的預(yù)后評(píng)估能力(P<0.001;HR=2.72)。結(jié)論 WGCNA分析能夠有效篩選OS轉(zhuǎn)移標(biāo)志物,風(fēng)險(xiǎn)評(píng)分能識(shí)別更靈敏的預(yù)后模型。
骨肉瘤(Osteosarcoma,OS)是骨骼系統(tǒng)中一種侵襲性惡性腫瘤,其病情發(fā)展迅速且預(yù)后不良,已經(jīng)成為兒童和青少年的主要致死性疾病[1]。雖然近年來的新輔助化療不斷發(fā)展,手術(shù)切除技術(shù)不斷進(jìn)步[2],但是由于缺少早期篩查標(biāo)記物,約20%OS患者在診斷時(shí)就已經(jīng)出現(xiàn)轉(zhuǎn)移,特別是肺轉(zhuǎn)移[3],因此其5年生存率仍然沒有得到顯著提升[4]。因此,尋找潛在的生物標(biāo)志物來評(píng)估OS的轉(zhuǎn)移和預(yù)后具有重要的臨床應(yīng)用價(jià)值。
WGCNA分析[5-6],即加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析,首先通過計(jì)算基因之間的表達(dá)相關(guān)性,將具有相似表達(dá)模式的基因聚類到一個(gè)模塊中并篩選出中心基因,然后再分析該模塊與樣本特征(包括臨床病理參數(shù)和治療方法等)之間的相關(guān)性。目前,由于骨肉瘤的異質(zhì)性,基于小樣本的差異表達(dá)分析的骨肉瘤轉(zhuǎn)移生物標(biāo)志物往往敏感度和特異度較低,因而缺乏臨床應(yīng)用價(jià)值[7]。WGCNA則從復(fù)雜的多樣本轉(zhuǎn)錄組數(shù)據(jù)中快速地提取出與轉(zhuǎn)移相關(guān)的模塊及基因,在比較模塊內(nèi)連接性和基因重要性基礎(chǔ)上,獲得適用性更廣泛的生物標(biāo)志物[8-9]。風(fēng)險(xiǎn)評(píng)分建?;贑ox回歸賦予多個(gè)基因的風(fēng)險(xiǎn)系數(shù)后計(jì)算個(gè)體預(yù)后風(fēng)險(xiǎn)高低[10],并分析其與患者生存的相關(guān)性,多項(xiàng)研究證實(shí)多基因模型預(yù)后評(píng)估的準(zhǔn)確性往往高于單一基因[11-13]。
本研究將WGCNA分析用于骨肉瘤轉(zhuǎn)移標(biāo)志物的篩選;采用風(fēng)險(xiǎn)評(píng)分建模進(jìn)行預(yù)后模型的構(gòu)建,同時(shí)繪制ROC曲線評(píng)估多基因模型的準(zhǔn)確性。
1.數(shù)據(jù)來源
本研究收集的數(shù)據(jù)分別下載自GEO和TARGET數(shù)據(jù)庫。其中,GEO來源的GSE14359數(shù)據(jù)集包括2例正常樣本和18例OS組織,后者中有8例是轉(zhuǎn)移瘤;GSE32981包括5例未轉(zhuǎn)移OS及11例轉(zhuǎn)移瘤樣本。從TARGET數(shù)據(jù)庫獲取的86例OS患者中,有57例生存,29例死亡,中位生存時(shí)間為1323(0~5840)天。
2.統(tǒng)計(jì)分析方法
(1)基因差異表達(dá)分析:使用R語言limma包分析差異表達(dá)基因,并繪制火山圖進(jìn)行可視化。
(2)加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA):通過計(jì)算尺度獨(dú)立性(R2)和平均連通性以確定表征基因符合無尺度分布的軟閾值,Pearson法選定與“轉(zhuǎn)移”相關(guān)的模塊及其中心基因。
(3)預(yù)后分析:風(fēng)險(xiǎn)評(píng)分是通過多因素Cox回歸計(jì)算風(fēng)險(xiǎn)系數(shù)得到的[14],繪制受試者工作特征曲線(ROC曲線)來表征預(yù)后模型的靈敏度;log-rank單因素Kaplan-Meier法用于分析單個(gè)指標(biāo)或者風(fēng)險(xiǎn)評(píng)分與OS預(yù)后的相關(guān)性[15]。
1.識(shí)別OS樣本構(gòu)成的模塊
分析GSE14359數(shù)據(jù)差異基因發(fā)現(xiàn),相比于正常樣本,OS中有上調(diào)基因1108個(gè),下調(diào)基因1419個(gè)(圖1A)。進(jìn)一步WGCNA分析顯示,通過尺度獨(dú)立性和平均連通性比較發(fā)現(xiàn)基因間聯(lián)系軟閾值為5后(圖1B),繪制聚類樹狀圖得到了29個(gè)關(guān)鍵模塊(圖1C)。
圖1 WGCNA法基于差異基因確定的軟閾值并識(shí)別共表達(dá)網(wǎng)絡(luò)模塊
2.確定OS轉(zhuǎn)移相關(guān)的中心基因
深入分析發(fā)現(xiàn)綠色、藍(lán)色和棕色模塊與骨轉(zhuǎn)移密切相關(guān)(圖2A);為了進(jìn)一步驗(yàn)證模塊中參與調(diào)控OS轉(zhuǎn)移的關(guān)鍵基因(n=48),將其與OS轉(zhuǎn)移和非轉(zhuǎn)移的差異基因取交集,結(jié)果發(fā)現(xiàn)只有HLA-DRA和FLI1在OS轉(zhuǎn)移過程中表達(dá)失調(diào)(圖2B)。
圖2 篩選與OS轉(zhuǎn)移相關(guān)的中心基因
3.分析中心基因與OS患者預(yù)后的相關(guān)性
通過單因素Kaplan-Meier法分析48個(gè)中心基因與OS患者預(yù)后的相關(guān)性發(fā)現(xiàn),PLD3、ARHGDIB、G0S2、MGAT1、CD74、HLA-DMA高表達(dá)時(shí),患者生存時(shí)間延長(zhǎng);而EPAS1高表達(dá)時(shí),患者預(yù)后不良(圖3),ROC曲線分別評(píng)估它們,預(yù)測(cè)預(yù)后1、3、5年的靈敏度和特異度(圖4)。
圖3 中心基因和OS預(yù)后的Kaplan-Meier曲線
圖4 中心基因預(yù)測(cè)預(yù)后的ROC曲線
4.構(gòu)建OS患者預(yù)后評(píng)估最佳模型
將上述7個(gè)基因納入多因素Cox回歸分析后得到預(yù)后模型:風(fēng)險(xiǎn)評(píng)分=0.149×G0S2-0.572×ARHGDIB+0.048×CD74+0.242×HLA-DMA-0.473×MGAT1-0.813×PLD3+0.230×EPAS1(圖5A)。ROC曲線顯示該模型具有較好的準(zhǔn)確性(AUC>0.7)(圖5B)。此外,相比于單因素,七基因組合與預(yù)后的相關(guān)性更顯著,提示更強(qiáng)的評(píng)估能力(P<0.001;HR=2.72),見圖5C。
圖5 通過計(jì)算風(fēng)險(xiǎn)評(píng)分構(gòu)建預(yù)測(cè)OS患者生存的高效模型
OS是最常見的原發(fā)性骨惡性腫瘤,在年輕患者中表現(xiàn)出高度侵襲性和早期轉(zhuǎn)移性[3]。為了實(shí)現(xiàn)OS的及時(shí)診斷和治療,尋找潛在的生物標(biāo)志物已經(jīng)成為目前亟待完成的任務(wù)。本研究基于GSE14359和GSE32981數(shù)據(jù)集,采用WGCNA法篩選出2個(gè)與OS轉(zhuǎn)移顯著相關(guān)的中心基因(HLA-DRA和FLI1);進(jìn)一步分析TATGET數(shù)據(jù)庫發(fā)現(xiàn),通過Cox回歸風(fēng)險(xiǎn)評(píng)分得到的“七基因預(yù)后模型”有更好的評(píng)估能力。
在本研究中,通過WGCNA法篩選得到三個(gè)與OS轉(zhuǎn)移特性密切相關(guān)的模塊中的48個(gè)中心基因(P<0.05)。新近研究發(fā)現(xiàn),Tian等同樣基于OS樣本的差異表達(dá)基因通過WGCNA法篩選出能分型轉(zhuǎn)移的SVM過濾器[16];此外,Zhang等使用WGCNA法分析GSE21257數(shù)據(jù)來確定區(qū)分OS轉(zhuǎn)移的預(yù)測(cè)標(biāo)記[17];Wang等則通過分析收集的52例OS樣本的RNA-seq結(jié)果[18],采用WGCNA法模塊性狀分析得到其與轉(zhuǎn)移正相關(guān)在內(nèi)的關(guān)鍵模塊及中心基因,為骨肉瘤的分子機(jī)制提供見解。值得注意地是,為了精確篩選預(yù)測(cè)因子,本研究進(jìn)一步通過交集GSE32981中轉(zhuǎn)移與否樣本的差異基因,最終確認(rèn)HLA-DRA和FLI1參與OS轉(zhuǎn)移調(diào)控。由此,本研究在WGCNA法的基礎(chǔ)上進(jìn)行深入過濾,對(duì)篩選OS轉(zhuǎn)移潛在生物標(biāo)志物方法進(jìn)行了優(yōu)化。
本研究基于單因素Kaplan-Meier法探討OS轉(zhuǎn)移相關(guān)的中心基因?qū)颊哳A(yù)后的影響,結(jié)果發(fā)現(xiàn),PLD3、ARHGDIB、G0S2、MGAT1、EPAS1、CD74及HLA-DMA參與了患者生存時(shí)間的調(diào)節(jié)(P<0.05)。為了構(gòu)建出更好的預(yù)后標(biāo)記,本研究進(jìn)一步通過計(jì)算七個(gè)基因的風(fēng)險(xiǎn)系數(shù)賦予每個(gè)患者相應(yīng)的預(yù)后評(píng)分。結(jié)果發(fā)現(xiàn),七基因模型的預(yù)后評(píng)估效能明顯提升(P<0.001;HR=2.72)。有研究報(bào)道,Niu等發(fā)現(xiàn)EGR1、CXCL10、MYC和CXCR4均可作為OS預(yù)后的潛在生物標(biāo)志物[19];Nakka等的結(jié)果也表明miR-21 和miR-221在OS中的表達(dá)差異對(duì)患者預(yù)后具有重要意義[20]。然而,以上證據(jù)只提供了單個(gè)基因的生存評(píng)估作用,本研究則與Liu等[11]基于Cox回歸模型發(fā)現(xiàn)兩基因(PML-EPB41)模型比單獨(dú)基因具有更好的預(yù)后預(yù)測(cè)價(jià)值相似。本研究通過計(jì)算風(fēng)險(xiǎn)評(píng)分將患者分為高或低風(fēng)險(xiǎn)組,并證實(shí)高或低風(fēng)險(xiǎn)組患者生存時(shí)間差異更顯著,從而進(jìn)一步證實(shí)多基因模型能更有效地評(píng)估OS預(yù)后。