丁驍杰 陳 弟 唐 超,2 姚 瑜,2
(1復(fù)旦大學(xué)附屬華山醫(yī)院神經(jīng)外科 上海 200040; 2復(fù)旦大學(xué)附屬華山醫(yī)院神經(jīng)外科免疫實驗室 上海 201206)
膠質(zhì)母細胞瘤(glioblastoma,GBM)是成人最常見的原發(fā)性惡性腦腫瘤,中位生存期只有15個月左右[1]。目前的標(biāo)準(zhǔn)治療方法是最大程度手術(shù)切除,術(shù)后替莫唑胺(temozolomide,TMZ)同步放化療以及TMZ輔助化療。組織病理學(xué)診斷的GBM可進一步根據(jù)基因、分子特征等分組,不同分組的GBM患者預(yù)后迥異,可能對治療的敏感性不同。例如,IDH1/2突變的膠質(zhì)瘤患者生存期明顯優(yōu)于野生型患者[2];MGMT啟動子甲基化患者經(jīng)過TMZ治療后獲益更大[3]。盡管已有分子標(biāo)志物被納入常規(guī)GBM的診療流程中,但是這些分子檢測僅僅針對常見基因(如IDH1/2、MGMT、TERT、1p/19q等),形成的分子亞組過于局限,不能完全符合個體化精準(zhǔn)醫(yī)學(xué)的標(biāo)準(zhǔn),同時可能忽視腫瘤基因異質(zhì)性[4]。
下一代測序技術(shù)(next generation sequencing,NGS)是目前常用的高通量測序方式,根據(jù)測序深度的不同,可分為全基因組測序(whole gene sequencing,WGS)、全外顯子測序(whole exon sequencing,WES)、目標(biāo)區(qū)域捕獲測序等,可以為臨床提供客觀而又全面的基因信息(包括突變、缺失、拷貝數(shù)改變等),從而幫助醫(yī)師快速地找到潛在的基因靶點并進行靶向治療。美國TCGA通過多種NGS的測序手段先后發(fā)現(xiàn)了ERBB2、NF1、TP53等基因在GBM中的作用,揭示了PI3激酶調(diào)節(jié)性亞單位基因PIK3R1,并結(jié)合臨床資料發(fā)現(xiàn)了MGMT啟動子甲基化與超突變表型之間的關(guān)系。通過GBM患者的基因組檢測已對GBM的分子病理學(xué)及治療策略有了一定的認識[5-7]。對于初發(fā)GBM患者,已報道前神經(jīng)元型患者對貝伐單抗展現(xiàn)出了一定的生存益處[8]。然而,針對GBM的WES研究在國內(nèi)外尚處于起步階段。
本研究對3例GBM患者的腫瘤組織及配對的血液樣本進行了WES分析,旨在通過高通量的檢測手段對GBM患者進行基因?qū)用娴姆治?尋找與腦膠質(zhì)瘤分子生物學(xué)特性有關(guān)的基因突變。
標(biāo)本來源選擇復(fù)旦大學(xué)附屬華山醫(yī)院神經(jīng)外科實施手術(shù)治療且術(shù)后病理證實、診斷明確的GBM患者。標(biāo)本獲取通過醫(yī)院倫理委員會審查(倫理號:2016-400)。進行WES前通過HE染色確認腫瘤含量,并用DNA抽提試劑盒(北京華夏遠洋科技有限公司,QIAGEN 69504)進行DNA提取及質(zhì)檢。
WES對3例復(fù)發(fā)GBM患者的冰凍腫瘤組織、血液配對標(biāo)本進行WES(北京泛生子生物科技有限公司),測序平臺Illumina HiseqX,測序策略PE150,κ試劑盒建庫,安捷倫探針捕獲。測序深度為N-100X,T-200X。詳細流程如下。
數(shù)據(jù)質(zhì)控 高通量測序得到的原始圖像數(shù)據(jù)經(jīng)堿基識別(base calling)轉(zhuǎn)化為原始測序序列(sequenced reads),結(jié)果以 FASTQ文件格式存儲,其中包含測序序列(reads)的序列信息及其對應(yīng)的測序質(zhì)量信息。測序得到的原始數(shù)據(jù)中會有少量序列包含接頭信息、低質(zhì)量堿基或未檢出的堿基,對后續(xù)信息分析造成一定干擾。為了保證信息分析質(zhì)量,通過Trimmomatic-0.33軟件對原始數(shù)據(jù)進行質(zhì)量控制,將原始序列過濾為高質(zhì)量測序數(shù)據(jù)(clean reads)。數(shù)據(jù)過濾主要包括以下4個方面:(1)截掉序列中含有的接頭(adapter)堿基序列;(2)截掉序列開頭和尾端中的低質(zhì)量(質(zhì)量值低于3)堿基序列;(3)截掉序列開頭和尾端中含N(N表示不確定的堿基信息)堿基序列;(4)截取后序列長度小于36 bp則去除整對序列。
數(shù)據(jù)比對 過濾后的高質(zhì)量測序數(shù)據(jù)通過 BWA比對到參考基因組(hg19)得到BAM 格式的最初的比對結(jié)果。BAM文件再用 GATK與 Picard進行局部重比對(local realignment)、去重復(fù)(duplicate removal)以及堿基質(zhì)量值重校正(base quality recalibration)等處理,從而得到 BAM 格式的最終比對結(jié)果。根據(jù)比對結(jié)果對參考基因組上的數(shù)據(jù)進行統(tǒng)計計算,得到比對率、重復(fù)率、捕獲效率、覆蓋度、覆蓋深度等統(tǒng)計指標(biāo),對數(shù)據(jù)的有效性進行評估,最終得到的BAM數(shù)據(jù)文件將被用于進行變異檢測。對配對血液標(biāo)本分別進行種系單個核苷酸變異(single nucleotide variation,SNV)、插入缺失改變(InDel)、拷貝數(shù)變異(copy number variation,CNV)的檢測(GATK),并以其為對照,對腫瘤組織進行相應(yīng)的體細胞 SNV的檢測、體細胞InDel的檢測、體細胞CNV的檢測。
變異注釋 利用 ANNOVAR、Oncotator (http://www.broadinstitute.org/oncotator)對高質(zhì)量變異進行結(jié)構(gòu)、功能、多種數(shù)據(jù)庫的注釋。具體注釋中使用的數(shù)據(jù)庫/方法包括:Gene and protein structure(Refseq 2013-05-09,UCSC)、dbSNP(dbSNP138 UCSC)、1000 Genomes Project(2014年4月發(fā)布)、COSMIC(Cosmic Complete Export_v65)。
Sanger測序 通過Sanger測序檢測腫瘤組織IDH和TERT啟動子的突變情況[9]。其中IDH檢測的突變熱點為IDH1的132位點和IDH2的172位點[10],TERT啟動子則檢測C228T(chr5,1,295,228)和C250T(chr5,1,295,250)[11]。
測序結(jié)果 由于IDH1在原發(fā)GBM中突變率極少,故本試驗選取了3例IDH野生型GBM患者進行WES,以確保腫瘤發(fā)生早期基因突變事件的相對一致性。3例患者均為復(fù)發(fā)GBM,原發(fā)腫瘤均接受了手術(shù)切除聯(lián)合后續(xù)同步放化療,且在接受復(fù)發(fā)腫瘤切除術(shù)后均接受了傳統(tǒng)化療藥物的治療。2例患者出現(xiàn)腫瘤進展,1例未進展(表1)。
配對的患者血樣標(biāo)本同時進行測序以去除種系多樣性。測序數(shù)據(jù)經(jīng)過質(zhì)控、比對等篩選后共有245處突變,包括237處SNV和9處InDel。其中,SNV包括214處非同義SNV(90.3%)、14處stopgain(5.9%)、6處可變剪切(2.5%)、3處未知SNV(1.3%);InDel包括3處非移碼缺失(33.3%)、1處移碼插入(11.1%)、5處移碼缺失(55.6%)。與在其他腫瘤中發(fā)現(xiàn)的結(jié)果類似[12],共有172處G:C突變?yōu)锳:T;65處A:T突變?yōu)镚:C。3例患者標(biāo)本測序結(jié)果顯示,僅MUC16基因突變同時發(fā)生于不同腫瘤標(biāo)本中,而以下基因突變在同一例標(biāo)本中存在重疊現(xiàn)象:FBN3、ZCCHC2、TPX2、NOTCH1(圖1)。為了明確此3例標(biāo)本的IDH/TERTp分子分型[9,13],我們對其進行了Sanger測序,結(jié)果顯示3例患者腫瘤標(biāo)本測序結(jié)果均為IDHwt/TERTpmut。
表1 3例GBM患者信息Tab 1 Characteristics of 3 cases with GBM
(1)Patient G1 was not disease progression yet.OS:Overall survival time;PFS:Progression-free survival time.
圖1 3例GBM患者腫瘤組織WES測序結(jié)果示意圖Fig 1 The schema of WES results from the tumor tissue of 3 cases with GBM
生物信息學(xué)分析:突變功能預(yù)測通過美國醫(yī)學(xué)遺傳學(xué)會(ACMG)推薦的生物信息學(xué)預(yù)測軟件(SIFT、MutationTaster、PolyPhen-2、PROVEAN),對候選突變基因的致病性以及突變后蛋白功能進行分析。對前期分析所得的共有突變基因MUC16進行突變蛋白功能生物學(xué)軟件分析。因兩者基因突變類型不一致(G2:非同義SNV;G3:InDel),我們利用SIFT、MutationTaster、PolyPhen-2和PROVEAN 4個軟件對G2的MUC16突變后蛋白質(zhì)進行分析,結(jié)果均為良性(分別為“Tolerant”、“Polymorphism”,“BENIGN”,“Neutral”)。而G3的MUC16突變生物信息預(yù)測(MutationTaster)提示有較強的致病性(結(jié)果為“disease causing”)。
討論Killela等[14]的研究表明,IDH/TERT分子分型可將高級別膠質(zhì)瘤分為預(yù)后迥異的4個亞型;而我們團隊的回顧性分析亦顯示,IDH/TERT分子分型同樣適用于較低級別膠質(zhì)瘤[9],且不同IDH/TERT分子亞型對于傳統(tǒng)放化療的敏感性不同[13]。盡管如此,IDH/TERT分子亞型仍不能達到針對每個患者個體的精準(zhǔn)診療目的,對GBM的基因組分析仍亟待研究。
通過高通量測序(如WGS、WES等)的方法可以找到更多關(guān)鍵的突變和拷貝數(shù)的改變,從而對既有分子病理診斷進行確認并增加分子診斷的特異性,一些經(jīng)常同時存在的突變可以更有力地證實分子病理的診斷(如CIC突變和1p/19q共缺失;TP53突變和IDH突變、1p/19q完整;TERT啟動子、IDH突變和1p/19q共缺失),且EORTC 26951研究顯示[15],NGS對基因突變檢測的準(zhǔn)確性高于傳統(tǒng)的FISH檢測。該研究還提示,盡管絕大部分1p/19q共缺失的腫瘤同時存在IDH和TERTp突變,但確實存在少數(shù)1p/19q共缺失的腫瘤沒有IDH或TERTp突變。此外,大部分IDH突變及1p/19q完整的腫瘤具有TP53突變也在該研究中通過NGS得到證實。
分子病理的研究不僅具有預(yù)后判斷作用,檢測腫瘤相關(guān)突變可能對患者后續(xù)的個體化治療具有指導(dǎo)作用,但目前這方面的研究尚處起步階段。RTOG 9402臨床試驗中,74%的患者具有IDH突變,且IDH突變提示對PCV方案的療效益處[16];而EORTC 26951則顯示,通過Illumina H450芯片檢測到的MGMT啟動子甲基化能夠顯著延長接受PCV方案治療的患者的生存期,而IDH突變不能起到預(yù)測PCV方案療效的作用[17]。在膠質(zhì)瘤的生物學(xué)特點方面,近年來有一些研究應(yīng)用NGS找到了一些與膠質(zhì)瘤發(fā)生、發(fā)展等有關(guān)的基因突變。因此,在外顯子測序技術(shù)問世并廣泛應(yīng)用于癌癥相關(guān)研究后,越來越多的基因改變被發(fā)現(xiàn),如何對測序結(jié)果進行充分分析,尋找到與腫瘤的診治密切相關(guān)的基因改變則尤為重要。
我們的研究團隊先前已對IDH/TERT分子分型較低級別膠質(zhì)瘤的預(yù)后預(yù)測作用以及不同IDH/TERT分子分型GBM患者對傳統(tǒng)放化療效果進行了一定研究[9,13]。本研究旨在通過高通量的方式對GBM的基因變異情況有所了解。初步結(jié)果顯示,患者復(fù)發(fā)后的組織學(xué)病理均為GBM,且分子病理結(jié)果均為IDHwt/TERTpmut,其他基因的突變情況存在很大差異。而MUC16作為僅有的一處共有突變,可能是與GBM復(fù)發(fā)或進展有關(guān)的癌基因。
MUC16基因編碼的MUC16蛋白是一種高分子質(zhì)量糖蛋白,表達于人體多處表皮細胞表面,以保護外界對細胞的損傷。MUC16的細胞外部分可用于多種腫瘤的診斷和監(jiān)測(即CA125),如卵巢癌[18]。MUC16在腫瘤發(fā)生中的作用機制尚未被闡明。MUC16在多種疾病中存在表達異常,如潰瘍性結(jié)腸炎[19]、肺結(jié)核[20]、干燥綜合征[21]及癌癥(卵巢癌、乳腺癌、胰腺癌)[22-24]。約90%的卵巢癌患者MUC16表達明顯升高,CA125升高還提示卵巢癌患者的復(fù)發(fā)可能[25]。目前尚無報道MUC16在腦膠質(zhì)瘤中存在突變或異常表達情況。本研究發(fā)現(xiàn)有2例患者均有MUC16突變,通過ESP及dbSNP等數(shù)據(jù)庫對已知變異比對查詢,表明MUC16的兩種突變類型在這之前均未被發(fā)現(xiàn)。雖然2例患者MUC16基因突變的生物信息預(yù)測結(jié)果存在不同,但這2例患者均已出現(xiàn)腫瘤復(fù)發(fā),PFS相對較短,故后期需測定其mRNA轉(zhuǎn)錄水平和蛋白質(zhì)表達水平,以進一步探討MUC16基因突變的臨床意義。此外,本研究還在測序中發(fā)現(xiàn)了一些存在重疊區(qū)域的基因突變,包括FBN3、ZCCHC2、TPX2、NOTCH1。其中,NOTCH1和ZCCHC2基因已在TCGA針對較低級別膠質(zhì)瘤和GBM的WGS中得到證實,而FBN3、ZCCHC2、TPX2則尚未證實其和膠質(zhì)瘤的關(guān)系。
綜上所述,MUC16突變存在于復(fù)發(fā)GBMA患者中,可能與腫瘤的發(fā)生發(fā)展或復(fù)發(fā)有關(guān),有待于樣本量的擴大及進一步的數(shù)據(jù)分析和驗證,從而幫助我們深入了解GBM的生物學(xué)特性。