施宏輝 蒲金定 何建行
lncRNA-CCAT1(CCAT1)是1種異常高表達的lncRNA,具有腫瘤細胞增殖等生物學功能。在結(jié)直腸癌,胰腺癌以及HBE等的模型中發(fā)現(xiàn)Myc直接結(jié)合lncRNA-CCAT1的轉(zhuǎn)錄調(diào)控區(qū)對其調(diào)節(jié)并產(chǎn)生促癌功能[1-3]。CCAT1 的表達上調(diào)與其基因啟動子區(qū)域的E-box(enhancer box,增強子框)元件直接結(jié)合 c-Myc 有關(guān),一旦 E-box 元件發(fā)生突變,c-Myc 將不能促進 CCAT1 的表達[1,4-5]。在胰腺癌模型中通過RNA免疫沉淀(RIP)和染色質(zhì)免疫沉淀(ChIP)測定進行分析發(fā)現(xiàn) c-Myc通過E-box元件的結(jié)合對CCAT1表達的產(chǎn)生影響[6]。在結(jié)腸癌組織也發(fā)現(xiàn)了與 CCAT1 上游調(diào)控區(qū)域,有E-Box的ChIP峰值信號[2]。
在生物機理方面:c-Myc激活的lncRNA CCAT1表達有助于結(jié)腸癌腫瘤發(fā)生和轉(zhuǎn)移過程,甚至可以預(yù)測結(jié)腸癌的預(yù)后臨床結(jié)果,極有可能是腫瘤治療的潛在lncRNA靶標[1-2]。
該人類基因組版本于2009年發(fā)布,相較于GRCh38版本,有充分的基因注釋信息,因此選取該版本。
ENCODE為國立人類基因組研究中心(NHGRI)聯(lián)合國際各研究機構(gòu)針對DNA調(diào)控單元發(fā)布的基因注釋數(shù)據(jù)庫,包括具體調(diào)控單元,如何轉(zhuǎn)錄以及基因如何激活控制細胞生命過程等等[7]。截止2018年,在數(shù)據(jù)庫發(fā)布的中A459細胞ChIP Seq數(shù)據(jù)庫一共374套。(https://www.encodeproject.org/report/?type=Experiment&status=released&assay_slims=DNA+binding&replicates.library.biosample.donor.organism.scientific_name=Homo+sapiens&biosample_type=cell+line&organ_slims=lung&biosample_term_name=A549&biosample_term_name=A549)本研究對該數(shù)據(jù)集中的重要數(shù)據(jù)進行數(shù)據(jù)挖掘和分析。
(http://genome.ucsc.edu/cgi-bin/hgGateway hgsid=663064805_HeAPAiM3KCvSvSQ9LwpAo8UlZAU0)這是加州大學圣科魯茲分校開發(fā)的一款可以可視化基因組注釋數(shù)據(jù)的瀏覽器,通過該瀏覽器,可以分析基因組位點注釋情況,以便后續(xù)的功能實驗。
CCAT1的基因組座位為 hg19 版本DNA的8號染色體chr8:128,219,629-128,231,333,總共跨越約12000bp的基因組區(qū)域,轉(zhuǎn)錄方向為反向,轉(zhuǎn)錄本包含兩個外顯子。Myc的基因組座位hg19 版本8號染色體chr8:128,748,315-128,753,680 總共跨越 5,366bp,轉(zhuǎn)錄方向為正向,轉(zhuǎn)錄本共計3個外顯子。CCAT1與Myc基因間的DNA線性距離約為517Kbp。
該區(qū)域功能序列如:LOC727677,POU5F1B,PVT1,TMEM75,MiR1204-1205-1207基因簇等。見表1。
表1 操縱子主要基因列表
ENCODE項目主要是注釋DNA序列的功能信息,在UCSCGenomeBrowser的基因調(diào)控單元卡中選取“Regulation”(基因調(diào)控)下的“ENC TF Binding”(ENCODE項目的轉(zhuǎn)錄因子結(jié)合位點注釋),http://genome.ucsc.edu/cgi-bin/hgTrackUi hgsid=663064805_HeAPAiM3KCvSvSQ9LwpAo8UlZAU0&c=chr8&g=wgEncodeTfBindingSuper,選取Uniform TFBS,并打開設(shè)置A549細胞的ChIP Seq信息,截止2018年一共有319套數(shù)據(jù),有些鏡像頁面只提供2012年前約100套數(shù)據(jù)的整合結(jié)果,后續(xù)新的數(shù)據(jù)可以直接下載wig文件,上傳到瀏覽器做數(shù)據(jù)展示。獲得主要的轉(zhuǎn)錄因子結(jié)合序列區(qū)域為chr8:128234833-128235142,主要發(fā)現(xiàn)該調(diào)控區(qū)域的實驗為GR轉(zhuǎn)錄因子的ChIP Seq實驗。該區(qū)域很有可能是Myc結(jié)合區(qū)域。
H3K27Ac為基因激活的信號區(qū)域,在該蛋白結(jié)合的DNA位置,招募RNApol2進行轉(zhuǎn)錄的可能性較大。通過2012~2017年的數(shù)據(jù)集,在ENCODE官網(wǎng)下載H3K27Ac的ChIP Seq數(shù)據(jù)[7-8]。其主要數(shù)據(jù)集為“ ENCSR480OHP”(https://www.encodeproject.org/experiments/ENCSR480OHP/)。經(jīng)基因組瀏覽器發(fā)現(xiàn):CCAT1 上游染色體DNA區(qū)域(CCAT1轉(zhuǎn)錄方向為負)至Myc上游染色體DNA區(qū)域(Myc轉(zhuǎn)錄方向為正)存在大量離散H3K27Ac信號。表明該操縱單元區(qū)域轉(zhuǎn)錄調(diào)控活躍。在CCAT1上游附近的區(qū)域,chr8:128,227,795-128,249,933;chr8:128,232,576-128,235,366;chr8:128,229,260-128,238,681;此3個區(qū)域的H3K27Ac的ChIP結(jié)合信號比較活躍,為CCAT1上游啟動子序列中的轉(zhuǎn)錄因子結(jié)合位點的可能性較大,并起到激活基因轉(zhuǎn)錄表達的作用[9]。
通過基因組瀏覽器,選取“DNA選項”,輸入結(jié)果2.2和2.3發(fā)現(xiàn)的4個候選區(qū)域DNA,根據(jù)轉(zhuǎn)錄的特性選取反向互補序列(CCAT1轉(zhuǎn)錄方向為負),①chr8:128234833-128235142;②chr8:128,227,795-128,249,933;③chr8:128,232,576-128,235,366;④chr8:128,229,260-128,238,681。CAC(G/A)TG是Myc作為轉(zhuǎn)錄因子的核心結(jié)合序列模式。通過BlastN方法比對Myc特異性結(jié)合的CAC(G/A)TG序列,發(fā)現(xiàn)該4個區(qū)域都有兩種序列存在。所以該區(qū)域很有可能是Myc潛在直接結(jié)合區(qū)域,并調(diào)控CCAT1的轉(zhuǎn)錄。
當基因處于轉(zhuǎn)錄活性狀態(tài)時,相較于無轉(zhuǎn)錄活性區(qū)域,該染色質(zhì)區(qū)域?qū)Nase(1種內(nèi)切塊酶)降解的敏感性較強[10]。在轉(zhuǎn)錄活性基因附近的DNA區(qū)域,有一中心區(qū)域,稱為超敏感區(qū)域(hypersensitive region)或超敏感位點(hypersensitive site),其對DNaseⅠ具有高敏感性。這些位點或區(qū)域?qū)⑹紫仁艿紻NaseⅠ的剪切。通過ENCODE數(shù)據(jù)庫的數(shù)據(jù)挖掘,可發(fā)現(xiàn)TFBS以及H3K27Ac的區(qū)域是DNaseⅠ的超敏區(qū)域[11]。這也暗示了該區(qū)域具有雙向調(diào)控CCAT1 和Myc等基因的可能。
本研究采用ENCODE數(shù)據(jù)庫中的A549的共享ChIP Seq數(shù)據(jù)進行具體案例的表觀遺傳學分析。數(shù)據(jù)挖掘和預(yù)測Myc調(diào)控CCAT1上游啟動子的具體結(jié)合位點[6]。CCAT1 是近幾年發(fā)現(xiàn)的1種具有促癌作用的lncRNA,在多種腫瘤尤其是消化道腫瘤中異常高表達。Myc可促進 CCAT1基因轉(zhuǎn)錄,但具體的上下游作用機制有待深入研究[1,6]。本研究可為后續(xù)在表觀遺傳層面研究CCAT1上游染色質(zhì)結(jié)構(gòu)的變化提供理論依據(jù)。表觀遺傳突變是對染色體的分子遺傳修飾,改變基因表達而不改變DNA序列情況。所涉及的生命過程是DNA甲基化,組蛋白修飾和染色質(zhì)重塑。癌細胞的性質(zhì)中,如腫瘤細胞的異質(zhì)性和對靶向藥物的耐藥性,并無法完全通過遺傳學規(guī)律來解釋[12]。越來越多的致癌的表觀遺傳機理被認為比單純的基因變化更普遍。表觀遺傳的機制可導(dǎo)致抑癌基因的失活,癌基因的活化和/或基因印跡模式的改變,而不發(fā)生基因組不穩(wěn)定性[11]。
Myc基因最初被發(fā)現(xiàn)是從宿主細胞基因組獲得的1種癌基因 (v-myc),由1個小組的禽白血病病毒。發(fā)現(xiàn)細胞c-myc基因及其直系同源基因(MYCN 和 MYCL) 會受到基因的改變,如擴增,染色體易位,病毒整合,在廣泛的癌癥導(dǎo)致腫瘤發(fā)生[12]。在正常細胞中,內(nèi)源性Myc基因的上調(diào)表達可以激活有絲分裂和組織發(fā)育等下游信號通路。Myc 蛋白功能作為重要的轉(zhuǎn)錄因子,多方位調(diào)控下游各類基因的表達,在細胞生長和增殖過程中發(fā)揮重要作用[12-14]。
本研究綜合過往研究文獻發(fā)現(xiàn)CCAT1與臨床病理特征顯著相關(guān)提示其可能具有成為1種早期診斷、臨床病理分期和預(yù)后判斷水平的腫瘤標志物。而且在多種腫瘤細胞里面發(fā)現(xiàn)特異高表達[1,2,14],隨著研究的不斷深入及調(diào)控機制的逐步明確、以lncRNA為靶點新型抗腫瘤藥物的研發(fā),CCAT1極有可能成為腫瘤診斷與治療中的1個靶標[14]。在胰腺癌細胞以及結(jié)直腸癌模型中,生物信息方法分析發(fā)現(xiàn)Myc和CCAT1在基因組中距離不遠。暗示Myc和lncRNA CCAT1可能在同一操縱子中。在HBE(支氣管上皮細胞)的模型中甚至發(fā)現(xiàn)了同一區(qū)域的Myc,CCAT1和let-7存在負反饋調(diào)控的模式。該研究在表觀遺傳學角度論證了Myc和lncRNA CCAT1上游調(diào)控序列中E-Box的結(jié)合,以及l(fā)et-7對CCAT1,和let-7調(diào)控Myc 基因3UTR(3’端非翻譯區(qū))的模式。但至今仍然未見在非小細胞肺癌中Myc如何調(diào)控CCAT1的細節(jié)。查閱文獻,總結(jié)原因為:①CCAT1現(xiàn)今發(fā)表的文章還是偏少(Pubmed,70篇);②現(xiàn)今CCAT1腫瘤學的主流研究還是在lncRNA的表達水平這個領(lǐng)域;③非小細胞肺癌體系中l(wèi)ncRNA的研究還是偏向lncRNA調(diào)控靶標分子方面,而在lncRNA的上游調(diào)控模式這塊,數(shù)據(jù)偏少。所以本研究還是結(jié)合理論實際,采用生物信息方法分析和數(shù)據(jù)挖掘,以A549為模型,找到Myc調(diào)控lncRNA CCAT1的可能位點,為后續(xù)表觀遺傳學方法驗證提供支持,甚至為可能存在的非小細胞肺癌中Myc相關(guān)負調(diào)控模型以及Myc操縱單元中ceRNA負反饋模型等假說提供支持。
聯(lián)合本研究中Myc結(jié)合區(qū)域的預(yù)測結(jié)果,提出如下基因調(diào)控假說:在非小細胞肺癌模型中Myc轉(zhuǎn)錄因子通過結(jié)合①chr8:128234833-128235142;②chr8:128,227,795-128,249,933;③chr8:128,232,576-128,235,366;④chr8:128,229,260-128,238,681四個區(qū)域某個或者某幾個E-box結(jié)構(gòu)元件正向調(diào)控CCAT1的表達,使其特異性上調(diào)表達;從而進一步影響腫瘤細胞增殖的功能。
本研究為表觀遺傳調(diào)控模式預(yù)測的前置性探索工作。有報道表明在多西他賽耐藥的肺腺癌中,CCAT1的異常表達可以釋放Bcl-xl,結(jié)合miRNA let-7,促進腫瘤細胞的化學耐藥性,而CCAT1的下調(diào)則可下調(diào)降低化療耐藥性[15]。在乳腺癌的放療模型中,CCAT1的敲低后, miR148a的相關(guān)通路被擾動,使得乳腺癌細胞放療敏感性增強[16],這也證明了CCAT1具有復(fù)雜多元的促癌功能。在臨床方面,CCAT1上游序列在癌癥特異發(fā)生過程的表觀遺傳學的證據(jù)可以用來作為識別個體風險的聯(lián)合指標,并選擇最佳干預(yù)措施。特定癌基因驅(qū)動的突變以及相關(guān)的代謝和信號通路的變化,可以提供腫瘤檢測,診斷和治療研發(fā)的新思路。然而,現(xiàn)只有有限數(shù)量的分子標記被納入臨床指南,所以該領(lǐng)域有很大的空白空間[17-18]。CCAT1具有腫瘤治療靶點的潛力,但具體的上游的調(diào)控研究仍未展開,這是一個極具價值的科學問題。