陸媛媛,李 力
(1.廣西貴港市人民醫(yī)院婦科,貴港 537100;2.廣西醫(yī)科大學附屬腫瘤醫(yī)院婦瘤科暨區(qū)域性高發(fā)腫瘤早期防治研究教育部重點室驗室,南寧 530021)
全球范圍內(nèi),每年卵巢癌新發(fā)病例239000例(3.6%的癌癥病例),死于卵巢癌病例152000例(占所有癌癥死亡的4.3%),是婦科癌癥第二最常見的死亡原因[1]。早期診斷及后續(xù)規(guī)范系統(tǒng)治療是卵巢癌預(yù)后的基礎(chǔ),在分子水平則受多分子精細調(diào)控機制影響,其中體細胞突變有重要的影響[2-3]。隨著癌癥基因組學的進步和成本的不斷降低,越來越多全外顯子組測序和全基因組測序的數(shù)據(jù)集發(fā)表,并且這些表征數(shù)據(jù)一般為體細胞突變,人類致癌過程中潛在的體細胞突變過程現(xiàn)逐漸通過癌癥基因組中的突變模式被揭示出來,因此體細胞變異為許多分析提供了基線數(shù)據(jù),如驅(qū)動基因檢測,通路分析,突變特征和腫瘤異質(zhì)性的評估等[2,4]。
癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)目前共收錄了33種癌癥相關(guān)的各種組學數(shù)據(jù)(包括基因組、蛋白組等組學數(shù)據(jù)),數(shù)據(jù)庫的建立幫助生成了許多大規(guī)模的癌癥基因組數(shù)據(jù)集,并使全面的生物信息學分析成為可能。為更好的對體細胞突變數(shù)據(jù)進行可視化分析,Mayakonda等[5]開發(fā)了一個對用戶友好的R-Bioconductor包,稱之為“Maftools”。
腫瘤將循環(huán)腫瘤DNA(ctDNA)釋放到血液中,在癌癥管理和監(jiān)測中,其為組織活檢無創(chuàng)性的補充腫瘤突變的信息。目前卵巢上皮性癌基因組學研究多來源于組織樣本,卵巢上皮性癌血漿ctDNA體細胞突變的研究不多,本研究通過下載TCGA數(shù)據(jù)庫卵巢上皮性癌組織體細胞突變信息,利用Maftools軟件包分析數(shù)據(jù),探索卵巢上皮性癌組織樣本的體細胞變異情況,分析發(fā)揮作用的功能和信號通路,為研究卵巢上皮性癌血漿樣本ctDNA體細胞突變提供參考。
1.1 卵巢上皮性癌體細胞突變數(shù)據(jù)的獲取 卵巢上皮性癌患者的基因表達譜數(shù)據(jù)來自2021年6月1日TCGA(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)數(shù)據(jù)庫,使用TCGAmutations下載卵巢上皮性癌相關(guān)突變數(shù)據(jù)以及臨床數(shù)據(jù)。
1.2 卵巢上皮性癌體細胞突變分析 使用R語言(R Development Core Team,R 4.0.2版)的maftools包(R-maftools)(https://github.com/PoisonAlien/maftoolsContact:csiamt@nus.edu.sg)對突變數(shù)據(jù)進行有效匯總、分析和可視化MAF格式的文件。具體操作:載入maftools包,將組學基因突變、拷貝數(shù)變異等數(shù)據(jù)匯總后轉(zhuǎn)換為MAF對象的儲存模式;使用plotmafSummary繪制MAF文件的summary信息;通過MutSigCV繪制“瀑布圖”以展示MAF文件中的變異信息,使用不同顏色的注釋區(qū)分突變類型(FDR<0.1)。
1.3 突變特征分析 運用titv函數(shù)將SNP分類為轉(zhuǎn)換、顛換,匯總數(shù)據(jù),并顯示每個樣本中的轉(zhuǎn)換比例。
1.4 超突變基因組區(qū)域的突變分析 超突變基因組區(qū)域是染色體上突變率顯著高于整個基因組平均突變率的片段。為識別這些區(qū)域,通過rainfallPlot參數(shù)將超突變的基因組區(qū)域可視化,即根據(jù)位置對每個染色體的突變進行排序,并在對數(shù)變換后計算連續(xù)突變之間的距離,稱為rainfallplots。如連續(xù)變化點合并為基因組片段,且該片段包含6個或6個以上的連續(xù)突變,平均突變間距離為<1000bp,則合并為基因組片段,并注釋為Kataegis。
1.5 信號通路富集分析 OncogenicPathways功能查看顯著富集通路,選擇感興趣的富集通路完成突變展示。
1.6 體細胞突變基因協(xié)同和互斥分析 在Maftools中使用somaticInteractions函數(shù)檢測互斥或協(xié)同的基因集,對成對基因,通過對包含突變和非突變樣本頻率的2×2列聯(lián)表進行Fisher精確檢驗來評估互斥或協(xié)同的模式。
2.1 卵巢上皮性癌體細胞突變摘要 從TCGA數(shù)據(jù)庫下載411例卵巢上皮性癌患者體細胞突變圖譜,摘要圖中列出了MAF文件所有變異分類,如移碼缺失突變、剪接位點、錯義突變、框內(nèi)缺失、移碼插入突變等,其中錯義突變比例最高;變體類型最多為單核苷酸多態(tài)性(SNP);SNP突變方式比例最高為C到T;將每個樣本分開計算,樣本中突變的中位數(shù)為68,最大值為1853;通過箱形圖展示了不同樣本中每種變體分類數(shù)量;411例卵巢上皮性癌患者中,前10位突變基因(TOP10)分別為TP53、TTN、MUC16、FLG2、CSMD3、AHNAK2、FLG、HMCN1、USH2A、NF1。見圖1。
411例樣本有396例(96.36%)存在突變,取TOP50高頻突變的基因展示,TP53、TTN、FLG2、MUC16、CSMD3、HMCN1、USH2A、AHNAK2、FLG、NF1為卵巢上皮性癌中突變頻率最高的十個基因,其中TP53是最常見的突變基因,占比高達91%(圖2)。
2.2 卵巢上皮性癌體系細胞突變的轉(zhuǎn)換與顛倒 嘌呤變嘌呤或嘧啶變嘧啶稱為轉(zhuǎn)換,嘌呤變嘧啶或嘧啶變嘌呤,即異型堿基的置換稱為顛倒。分析TCGA卵巢上皮性癌樣本SNP時,借助titv函數(shù)將SNP分類為轉(zhuǎn)換與顛倒,匯總數(shù)據(jù)展示為箱線圖(圖3):顯示6種不同轉(zhuǎn)換的總體分布,其中C>T所占百分比最高(35.19%),每個樣本中的轉(zhuǎn)換比例展示為堆積條形圖,轉(zhuǎn)換與顛倒的比例相當。
圖1 TCGA卵巢上皮性癌體細胞突變隊列概述
圖2 瀑布圖展示TCGA卵巢上皮性癌樣本TOP50體細胞突變圖譜
2.3 卵巢上皮性癌體細胞突變的超突變分析 超突變分析的瀑布圖每個點都是根據(jù)SNV類編碼的突變顏色,變點法鑒定的超突變基因組片段用黑色箭頭突出顯示,展示超突變的基因組區(qū)域(Kataegis位點)。411例TCGA卵巢上皮性癌樣本中,瀑布圖未識別出超突變基因組區(qū)域。
2.4 卵巢上皮性癌體細胞突變的信號通路富集分析 通路富集分析發(fā)現(xiàn),主要富集于RTK-RAS、NOTCH、WNT、PIK3、Hippo、Cell-Cycle、MYC、TP53、TGF-Beta、NRF2信號通路。上述富集的通路中占比較高的為RTK-RAS和Hippo信號通路,突變樣本占比分別為190/411和147/411。
2.5 卵巢上皮性癌TOP50體細胞突變基因協(xié)同和互斥分析 對TOP50基因的互作關(guān)系進行分析,絕大部分基因是共同發(fā)生(協(xié)同性),TP53與DST存在高度協(xié)同性(P<0.05),MDN1與FGL2存在高度互斥性(P<0.05)(圖4)。
圖3 TCGA卵巢上皮性癌樣本中SNV分布的轉(zhuǎn)變和顛倒圖
圖4 TCGA卵巢上皮性癌樣本TOP50突變基因相互關(guān)系
共現(xiàn)和排他的基因?qū)Ρ憩F(xiàn)為三角矩陣,綠色:協(xié)同,黃色:互斥
目前卵巢上皮性癌的規(guī)范化系統(tǒng)治療方案主要依賴于滿意的卵巢腫瘤減滅術(shù)及以鉑為基礎(chǔ)的化療,但在12~18個月多數(shù)患者出現(xiàn)復(fù)發(fā)或耐藥[6]。靶向治療是腫瘤精準治療時代的選擇之一。近幾年抗血管生成藥物、聚腺苷二磷酸核糖聚合酶抑制劑(PARPi)等分子靶向藥物用于卵巢上皮性癌的維持治療,改善患者無鉑間期或無化療間期。惡性腫瘤發(fā)生發(fā)展的規(guī)律是“突變-選擇-適應(yīng)”,體細胞突變基因經(jīng)歷這個自然規(guī)律演變成惡性腫瘤[7]。目前體細胞突變研究仍以實體瘤活檢為主,實體瘤活檢這種有創(chuàng)性操作限制了反復(fù)取材,當研究ctDNA液體活檢時,ctDNA的體細胞突變檢測表現(xiàn)出與組織活檢相似效用,甚至ctDNA能發(fā)現(xiàn)更多可靶向基因的突變[8]。
3.1 卵巢上皮性癌體細胞突變圖譜 maftools-R可有效地匯總、分析和可視化TCGA卵巢癌MAF格式的文件。本研究結(jié)果表明,錯義突變、SNP和C>T突變是卵巢上皮性癌中最常見的突變形式。既往研究已證實,錯義突變和SNP在卵巢癌的發(fā)生、進展和預(yù)后中具有重要意義[9]。3個最常見的突變基因是TP53(91%)、TTN(28%)、FLG2(10%),TP53基因突變?nèi)允悄壳鞍┌Y基因組中最常見的基因組事件,在卵巢上皮性癌的突變頻率很高(50%~100%)[10]。卵巢高級別漿液性腺癌(high-grade serous ovarian carcinoma,HGSOC)中TP53突變頻率高達100%[11]。已有研究表明,通過卵巢上皮性癌ctDNA檢測TP53預(yù)測患者預(yù)后有積極意義[12]。TTN基因編碼肌聯(lián)蛋白的作用能調(diào)節(jié)肌肉的被動彈性,TTN的突變常在實體腫瘤中檢測到。研究表明,卵巢上皮性癌中TTN與卵巢上皮性癌進展相關(guān)[13-14]。有研究通過多組學分析顯示,卵巢上皮性癌中FLG2、TTN等突變影響KIF23表達,KIF23在卵巢上皮性癌中高表達提示預(yù)后不良[15]。
3.2 卵巢上皮性癌與RTK-RAS、Hippo信號通路的關(guān)系 本研究通過通路富集分析發(fā)現(xiàn),RTK-RAS(190/411)及Hippo(147/411)信號通路是對樣本影響的占比最高的兩條信號通路。在正常細胞中,Hippo信號通路上游膜蛋白受體感受到胞外生長抑制信號,則激活一系列激酶級聯(lián)磷酸化反應(yīng),使磷酸化下游效應(yīng)因子YAP和TAZ,抑制YAP/TAZ活性從而抑制細胞增殖。Hippo效應(yīng)因子YAP是上皮性卵巢癌中過度表達的致癌基因[16]。Fan等[17]研究發(fā)現(xiàn),鞘氨醇磷酸鹽通過抑制Hippo信號通路,促進卵巢癌細胞的增殖。SGK3在卵巢癌細胞中高表達,而miR-144-3p低表達,miR-144-3p過表達靶向抑制SGK3通過激活Hippo信號通路來抑制卵巢癌細胞的生長、增殖和侵襲[18]。
影響RTK/Ras信號通路的突變可導(dǎo)致許多人類綜合征和疾病,包括癌癥。Taylor-Harding等[19]對周期蛋白依賴性激酶抑制劑(CDKi)耐藥的HGSOC細胞的研究表明,其耐藥機制主要是由于RTK/RAS信號通路通過激活E2F和ETS導(dǎo)致對CDKi的耐藥。有研究對卵巢透明細胞癌(ovarian clear cell carcinoma,OCCC)腫瘤組織樣本和匹配的血液樣本進行全基因組測序,結(jié)果提示RTK/RAS信號通路的激活與患者的OS升高顯著相關(guān),多元分析提示激活RTK/RAS信號通路是OCCC患者的獨立預(yù)后因素[20]。
3.3 卵巢上皮性癌體細胞突變的協(xié)同作用 研究認為,腫瘤的發(fā)生是體細胞突變導(dǎo)致,假設(shè)突變累積越多,則腫瘤發(fā)生及發(fā)展越快,但基因組測序結(jié)果顯示,失調(diào)通路中的多數(shù)致病的關(guān)鍵基因通常以相互排斥的方式發(fā)生突變。單個驅(qū)動突變基因發(fā)生可促進腫瘤的發(fā)展,兩個驅(qū)動突變基因同時發(fā)生反而抑制腫瘤的發(fā)展。驅(qū)動基因間也會存在協(xié)同模式,兩個協(xié)同的驅(qū)動突變突變同時發(fā)生可共同促進腫瘤的發(fā)展。因此,分析突變基因的協(xié)同互斥模式,揭示相似腫瘤產(chǎn)生的重要功能性體細胞突變,識別腫瘤亞克隆特異性的突變基因,可揭示腫瘤發(fā)生的新途徑和潛在機制。Maftools的體細胞互作功能可識別協(xié)同或互斥的突變基因,本研究通過Maftools可視化卵巢上皮性癌TOP50差異基因的協(xié)同互斥分析,結(jié)果表明絕大部分基因是共同表達、共同發(fā)生的。
本研究借助于TCGA數(shù)據(jù)庫,完成了卵巢上皮性癌組織樣本體細胞突變普分析、超突變分析及KEGG通路挖掘等,為卵巢上皮性癌發(fā)生機制研究提供了一些參考與借鑒,這些研究將促進對癌癥病因?qū)W的理解,并對預(yù)防和治療具有潛在意義,也為后續(xù)卵巢上皮性癌ctDNA體細胞突變研究提供參考。