葉 菲,余 盈
(華中科技大學(xué) 同濟醫(yī)學(xué)院附屬協(xié)和醫(yī)院 普外科, 湖北 武漢 430022)
放射基因組學(xué)(radiogenomics)是一種將放射組學(xué)與基因組學(xué)結(jié)合在一起進行多組學(xué)研究的策略,其運用影像學(xué)的手段從分子影像方面展開對生物學(xué)行為的定性和定量的研究,為疾病的診斷、預(yù)防、治療和預(yù)后等多方面提供了巨大的幫助,尤其在腫瘤的精準(zhǔn)放療上具有獨到的優(yōu)勢,具有良好的應(yīng)用前景[1]。
作為3種常見的腫瘤治療方式之一,放療在腫瘤治療中不可或缺,其常常單獨使用或者與手術(shù)、化療聯(lián)用。長期的臨床實踐證明放療可以有效延長腫瘤患者的有效生存期,但是同樣也帶來了一些問題,特別是一些處于癌早期階段的患者,在接受放療后,雖然得到了滿意的局部控制,但是其中的許多人還會遭受放療并發(fā)癥的困擾,這給患者的生活質(zhì)量造成了嚴重的影響。隨著現(xiàn)代科技的進步,這些問題得到了一定程度的解決。放射腫瘤學(xué)家通過結(jié)合工程、物理以及計算機等多種手段在精確畫定靶區(qū)的同時,還使用如立體定向治療、 圖像引導(dǎo)放射治療、調(diào)強放療、質(zhì)子重離子放療等手段不斷地提高著放射治療的療效,與此同時,諸如磁共振成像(magne-tic resonance imaging,MRI) 引導(dǎo)下放療、正電子發(fā)射計算機斷層顯像(positron emission computed tomography/computed tomography,PET/CT)引導(dǎo)下放療等模式也在不斷更新,使得放療變得更為精準(zhǔn)。然而即使如此,患者之間的個體差異,即個體的放射敏感性,卻仍沒有被充分考慮。在這一系列的背景下,精準(zhǔn)放療的概念應(yīng)運而生,其目的就是在保證最佳療效的前提下,一方面識別和糾正腫瘤的放療抵抗,提高放療敏感性,另一方面是盡量減少放療劑量以及放療所帶來的不良反應(yīng)。精準(zhǔn)醫(yī)療作為一種針對個體的生物異質(zhì)性特征而采取的特異性放療的策略被放射腫瘤學(xué)家和患者們所接受。
放射組學(xué)(radiomics)是2012年提出的一項新技術(shù),其主要目的是通過高通量算法挖掘圖像中的定量影像特征,之后將這些數(shù)據(jù)進行篩選、聚類、分析后,用以識別和預(yù)測腫瘤異質(zhì)性。隨著其不斷地發(fā)展,逐漸發(fā)現(xiàn)放射組學(xué)的特征與基因表達的程度也具有相關(guān)性,并不斷的將影像數(shù)據(jù)與基因表達、基因型等遺傳學(xué)數(shù)據(jù)進行相關(guān)性分析,形成了一門新的研究方向—放射基因組學(xué)(radiogenomics)。放射基因組學(xué)是將放射組學(xué)(radiomics)與基因組學(xué)(genomics)結(jié)合起來,通過提取影像中潛在的高通量數(shù)據(jù)特征,聯(lián)合個體的全基因組測序,從而尋求影像特征與基因特征的關(guān)聯(lián)性?,F(xiàn)階段,在放射基因組學(xué)方面的大型協(xié)作研究主要集中于預(yù)測放療敏感性與放療的后期副作用等方面。已經(jīng)有大量研究表明,放射基因組學(xué)可以預(yù)測與癌癥放療有關(guān)的不良反應(yīng)并鑒定可能產(chǎn)生腫瘤反應(yīng)的遺傳標(biāo)記,并可以預(yù)測這些不良反應(yīng),進而幫助醫(yī)生根據(jù)遺傳因素和其他腫瘤特征為每個患者分別選擇最佳治療方案,以最大程度地提高治療效果[5-8]。
放射基因組學(xué)通過整合影像學(xué)與基因組學(xué)的信息,從而建立了一種基因特征與影像特征之間的映射,并通過影像的定量特征信息識別出與放射敏感性相關(guān)的遺傳信息的改變;除此之外,放射基因組學(xué)在構(gòu)建放射生物學(xué)的物理模型時也具有明顯優(yōu)勢。其現(xiàn)有的放射基因組學(xué)的研究主要包括以下幾個方面:
單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是研究的最廣泛的基因組變體。其中SNP是單個堿基對的變化,其可以影響DNA的編碼區(qū)和非編碼區(qū),進而影響蛋白質(zhì)的表達,而全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)是以基因組中數(shù)以百萬計的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)為分子遺傳標(biāo)記,進行全基因組水平上的對照分析或相關(guān)性分析,通過比較并且發(fā)現(xiàn)影響復(fù)雜性狀的基因變異的一種新策略。近年來,通過放射基因組學(xué)進行GWAS的研究不斷增加。大規(guī)模薈萃分析認為放射基因組學(xué)可以用來預(yù)測放療不良反應(yīng)發(fā)生的風(fēng)險性[9]:該研究通過進行放射性基因組學(xué)精細映射研究,發(fā)現(xiàn)AGT,COG2,CAPN9,ARV1和ncRNAAL512328.1,LOC101927604可能與前列腺癌放療后的晚期放射毒性血尿相關(guān)。在另一項研究中,通過使用放射基因組學(xué)對1 883例乳腺癌患者的復(fù)制階段中的4個基因中的10個最有意義的SNP進行了評估后,在753例乳腺癌患者中進行驗證,結(jié)果發(fā)現(xiàn)XRCC1中的 rs2682585 與晚期皮膚毒性和總體毒性反應(yīng)關(guān)系密切[10]。盡管其數(shù)據(jù)樣本較小,并且多SNP聯(lián)合分析較少,但是使用放射性基因組學(xué)進行GWAS分析所得到的結(jié)果非常鼓舞人心。由于還有許多輻射敏感性 SNP 有待發(fā)現(xiàn),所以放射性基因組學(xué)發(fā)揮的作用仍然比較小。但是隨著科學(xué)技術(shù)的發(fā)展,在明晰輻射基因和基因中SNP的情況下,結(jié)合放射性基因組學(xué)中的影像學(xué)特點,可以無創(chuàng)的預(yù)測患者在放射敏感性方面遺傳信息的改變,并進而提前做出干預(yù),規(guī)避風(fēng)險。
除此之外,拷貝數(shù)變異(copy number variations,CNVs)是另一種與放療毒性有關(guān)的結(jié)構(gòu)變異??截悢?shù)變異是基因組發(fā)生重排而導(dǎo)致的結(jié)構(gòu)變異,一般指長度為1 kb以上的基因組大片段的拷貝數(shù)增加或者減少, 主要表現(xiàn)為亞顯微水平的缺失和重復(fù)。特定的CNVs可以影響每個變體多達數(shù)Mb的DNA,與單個SNP的影響相比,對基因表達產(chǎn)生了更大的影響。XRCC1 CNV已被證明是前列腺癌中輻射誘發(fā)毒性的潛在危險因素[11]。
除了遺傳信息的改變,mRNA的表達也與放療毒性相關(guān)。高通量測序技術(shù)的出現(xiàn)為mRNA量化和整合提供了便利。一些非編碼RNA的表達[12-13],因為可以調(diào)控翻譯,所以同基因突變和拷貝數(shù)變化一樣,與放療毒性有關(guān)[14],表觀遺傳學(xué)也是通過種種方式調(diào)節(jié)mRNA的表達,所以其研究類似于mRNA表達的研究。一項納入了233例患者的研究表明,基于放射學(xué)特征的評估可反映分子分類中不同的表達譜(即mRNA的表達譜特征),而且這些特征與缺氧、血管生成、細胞凋亡和細胞增殖有關(guān)[2]。
放射療法雖僅有幾十年的歷史,但在CT影像技術(shù)和計算機技術(shù)發(fā)展幫助下,現(xiàn)在的放療技術(shù)由二維放療發(fā)展到三維放療、四維放療技術(shù);放療劑量分配也由點劑量發(fā)展到體積劑量分配等,而這些新型的放療技術(shù)要求以大量的影像學(xué)數(shù)據(jù)基礎(chǔ)?;谶@種情況,放療物理學(xué)家們不斷的提出新的模型和工具。其中劑量體積直方圖(dose volume histogram, DVH)的應(yīng)用最為廣泛,在此基礎(chǔ)上諸如細胞存活率模型、腫瘤控制率模型、正常組織并發(fā)癥模型以及次級腫瘤風(fēng)險預(yù)測模型等多種模型層出不窮,但是由于各個模型的參數(shù)不同,更重要的是因為大部分的模型都是建立在體外實驗的基礎(chǔ)上,這并不能反應(yīng)腫瘤在體的實際情況,而且不同的組織具有不同的放射敏感性,所以到目前為止,并沒有一套完整的生物學(xué)評估系統(tǒng)[2]。
放射基因組學(xué)以放射組學(xué)為基礎(chǔ),其本身就蘊涵著豐富的影像學(xué)上的定量的特征信息;在放療方案制定的過程中,還起著輔助和檢驗作用;除此之外,放射組學(xué)技術(shù)可以對腫瘤進行分區(qū),結(jié)合以紋理分析,進而實現(xiàn)更詳細更精細的圖像表型分析,并展現(xiàn)出多種實體瘤的瘤內(nèi)異質(zhì)性[16-18],再同時對其進行基因組學(xué)分析,進而獲得更多的信息。最后,將這樣多組學(xué)信息的特征進行加工并納入物理模型,可以指導(dǎo)放療物理學(xué)家對腫瘤進行靶向的輻射增強。雖然目前無此方面的研究,但是可以預(yù)見,通過放射基因組學(xué)構(gòu)建的放射生物學(xué)的物理模型可以極大地改善局部控制和提高患者生存率。
如今,放射敏感性是由多種異質(zhì)因素共同影響的這一結(jié)論已經(jīng)成為放射生物學(xué)家們的共識,其中遺傳因素在個體的放射敏感性中起了決定性的作用[19-20]。根據(jù)基因組因素預(yù)測的結(jié)果,有放射線并發(fā)癥風(fēng)險的患者可能會選擇非放射線治療或高度保形的治法,例如質(zhì)子治療。相反,被預(yù)測為低風(fēng)險的患者可能會接受放療,而且放療的劑量可能會增加,這對控制腫瘤有利。除此之外,放射組學(xué)可以通過提取影像數(shù)據(jù)特征來實現(xiàn)無侵入式的預(yù)后評估,提供放療的預(yù)期反應(yīng)和實際的腫瘤反應(yīng)差別方面的信息。如果已知腫瘤對放射治療具有抵抗力(無論正常組織的毒性風(fēng)險如何),則在可行的情況下可以尋求替代治療。相反,可以用較低劑量的放射線有效地治療和治愈預(yù)計對放射線治療極為敏感的腫瘤,從而進一步降低正常組織毒性的風(fēng)險,同時又不損害腫瘤的控制[21]
由此可見,在圍放療期,放射基因組學(xué)可以提供一種囊括影像-基因兩個維度的綜合模型,為臨床決策提供幫助。然而在之前,限于分析手段的局限性,這種的處理非常困難,并且?guī)缀鯖]有什么進展。隨著人工智能(artificial intelligence,AI)和機器學(xué)習(xí)(machine learning,ML)技術(shù)的不斷發(fā)展,自然語言處理(natural language processing,NLP) 技術(shù)已經(jīng)可以用于放射基因組學(xué)的分析,并且這些結(jié)果表明遺傳突變存在特征性成像的特征,放射學(xué)報告的概率分析具有識別與致癌基因突變有關(guān)的疾病進程的潛力,并而且放射學(xué)報告有可能會提供一種更快,更便宜的替代基因組測序的方法[23]。另外一項關(guān)于通過聯(lián)合放療敏感性基因表達譜和PD-L1狀態(tài)數(shù)據(jù)的研究已經(jīng)成功確立了一組適合放療和細胞程序性死亡受體-配體1(programmed cell death-ligand 1,PD-L1)免疫抑制劑聯(lián)用的乳腺癌患者[22],雖然并未在患者身上驗證,但是可以預(yù)見,隨著分析手段的不斷完善,多維度數(shù)據(jù)對于臨床決策可能具有更高的指導(dǎo)價值。
實際上,放射基因組學(xué)的廣泛應(yīng)用并非易事。大數(shù)據(jù)研究中最大的挑戰(zhàn)之一就是跨多個中心的圖像和相關(guān)元數(shù)據(jù)的管理,其中影像結(jié)果與詳細的臨床資料、以及相關(guān)的臨床結(jié)果匹配非常重要。在多個在癌癥數(shù)據(jù)中心的倡導(dǎo)下,數(shù)據(jù)共享已經(jīng)取得了一些進展,這將極大地促進放射性模型的發(fā)現(xiàn)和驗證。即便如此,可用的成像數(shù)據(jù)與豐富的公共基因表達數(shù)據(jù)相比還是要少得多,因此應(yīng)該花費更多的精力來整理高質(zhì)量的影像數(shù)據(jù)集。除了技術(shù)挑戰(zhàn)之外,還需要克服行政和法規(guī)障礙,以使將來大規(guī)模數(shù)據(jù)共享成為可能。只有足夠大的數(shù)據(jù)集才可以建立可靠的模型,這突出顯示了對高質(zhì)量數(shù)據(jù)集的管理和數(shù)據(jù)共享的需求[24]。最終,還需要在多中心臨床試驗中進行前瞻性驗證,以證明新發(fā)現(xiàn)的成像標(biāo)記物的臨床有效性和實用性,并真正確立放射線學(xué)和放射基因組學(xué)在精密放射治療中的價值。
所謂的籃子試驗(basket trial)是一種將具有相同驅(qū)動基因的不同腫瘤放進一個“籃子”來進行研究的實驗思路[25]。這種實驗思路的前提假設(shè)是,不同解剖學(xué)位置的腫瘤,只要其由同一種驅(qū)動基因驅(qū)動,那么針對其基因位點的靶向藥物都將有效。這種方法的好處是顯而易見的,因為其極大地擴增了可使用的數(shù)據(jù)量。同樣地,在放射基因組學(xué)中,或許可以假設(shè):針對不同的腫瘤,存在一種共有的決定放療敏感性的放射基因組學(xué)特征(系統(tǒng)生物學(xué)特征與影像學(xué)特征聯(lián)合)。通過深度卷積神經(jīng)網(wǎng)絡(luò)的方法,將系統(tǒng)生物學(xué)測序與影像作為輸入端,將放療敏感性評價作為輸出端,來構(gòu)建一種系統(tǒng)決策樹或貝葉斯網(wǎng)絡(luò)模型。這種模型可以納入盡可能多的系統(tǒng)生物學(xué)特征和放射組學(xué)特征,從而形成放療的一個泛組學(xué)(Multi-Omics)決策模式,進而較為精準(zhǔn)地預(yù)測某個患者個體對放射治療或者放療聯(lián)用藥物的治療效果。對于精準(zhǔn)放療,在大數(shù)據(jù)時代,放射基因組學(xué)僅僅是開始。