楊 錦 鄒斌斌 張玉祥 王澤生
(首都醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院生物化學(xué)與分子生物學(xué)系)
表皮生長(zhǎng)因子受體(epidermal growth factor receptor,EGFR)參與調(diào)控細(xì)胞代謝、增生、遷移和分化。其過度表達(dá)可加速細(xì)胞分裂與增生,抑制凋亡,有助于血管形成,并促進(jìn)癌細(xì)胞轉(zhuǎn)移[1]。人類腫瘤包括非小細(xì)胞肺癌、乳腺癌、頭頸癌、胃癌、結(jié)腸癌、食管癌、前列腺癌、膀胱癌、腎癌、胰腺癌、口腔癌等都可表達(dá)或高表達(dá)EGFR[2]。腫瘤中的EGFR表達(dá)與疾病侵襲性增強(qiáng)、化療抵抗增加、轉(zhuǎn)移性增強(qiáng),生存率下降及臨床預(yù)后差相關(guān)[3]。
egfr基因5'調(diào)控區(qū)包括1個(gè)富含GC的啟動(dòng)子,缺少保守序列TATA盒和CAAT盒,有多個(gè)位點(diǎn)可以起始轉(zhuǎn)錄[4]。egfr啟動(dòng)子在-216G/T存在多態(tài)性并與其增加活性相關(guān)[5]。深入了解egfr基因在腫瘤內(nèi)的表達(dá)調(diào)控將有助于我們對(duì)該基因的表達(dá)進(jìn)行干預(yù),并治療相應(yīng)腫瘤。進(jìn)行這類研究需要大規(guī)模、多樣本的基因組重測(cè)序。盡管第二代測(cè)序成本已明顯降低,但全基因組重測(cè)序需要大量的時(shí)間和高額的成本,制約其應(yīng)用于疾病研究。基因組目標(biāo)區(qū)域重測(cè)序策略不需對(duì)全基因組進(jìn)行測(cè)序,只對(duì)基因或其他感興趣的基因組區(qū)域的基因序列重新測(cè)定。國(guó)際上已發(fā)表的研究報(bào)告[6-7]均采用商業(yè)公司推出的目標(biāo)序列捕獲解決方案。本研究以宮頸癌細(xì)胞系HeLa S3 egfr啟動(dòng)子為模型,建立了一套簡(jiǎn)便易行的RNA捕獲靶序列的富集體系,結(jié)合Solexa測(cè)序方法,為各種復(fù)雜人類疾病相關(guān)突變的檢測(cè)奠定良好基礎(chǔ)。
1)細(xì)胞株:宮頸癌細(xì)胞系HeLa S3(購(gòu)于北京協(xié)和細(xì)胞庫)。
2)主要試劑:RPMI 1640培養(yǎng)基(美國(guó)Gibco公司);胎牛血清(fetal bovine serum,F(xiàn)BS)(美國(guó)Hyclone公司);MboI、Klenow Fragment、Klenow Fragment(3'→5'exo-)、T7 RNA Polymerase、rNTP(美國(guó)NEB公司); T4 DNA連接酶、Ex Taq(日本Takara公司);Biotin-11-dUTP(立陶宛Fermentas公司);Biotin-16-UTP(美國(guó)Ambion公司);Dynabeads M-280 Streptavidin(美國(guó)Invitrogen公司);DNA膠回收試劑盒、PCR純化試劑盒(德國(guó)Qiagen公司);引物合成單位(中國(guó)上海生工生物工程有限公司);高通量測(cè)序單位(北京六合華大基因科技股份有限公司深圳分公司)。
1)細(xì)胞培養(yǎng):在5%CO2,37℃的培養(yǎng)箱中,用含有10%FBS的RPMI 1640培養(yǎng)基對(duì)HeLa S3細(xì)胞進(jìn)行培養(yǎng)。
2)DNA文庫的制備:①細(xì)胞基因組的提取:8 000 g離心1 min,收集細(xì)胞,加入終濃度為0.5 μg/μL蛋白酶K,55℃消化過夜。消化16 h后再加入終濃度為0.2 μg/μL的RNase A,在37℃水浴30 min消化RNA,酚/氯仿抽提,乙醇沉淀,加入50 μL無菌水溶解。②MboⅠ酶切基因組:取基因組2 μg,50 μL體系中加入5 μL 10×NE Buffer2,加入5 U的限制性內(nèi)切酶MboⅠ,在37℃下水浴,消化過夜。65℃水浴20 min滅活限制性內(nèi)切酶活性。③DNA片段兩端加接頭:加入2 μL 10× NE Buffer2,加入終濃度為0.1 mmol/L的dNTP,加入Klenow Fragment(3'→5'exo-)15 U,在37℃水浴30 min。將體系擴(kuò)大到100 μL,加入終濃度為1×T4 DNA連接酶緩沖液,加入終濃度為0.8 μmol/L的3'端‘T’突出的Pair-end adapter 1和Pair-end adapter 2(表1),加入50 U的T4 DNA連接酶,16℃水浴過夜。④DNA片段的純化、回收:酚/氯仿抽提,乙醇沉淀,加入15 μL無菌水溶解。所得DNA用1.5%瓊脂糖膠電泳,QIAGEN試劑盒膠回收400~1 000 bp DNA,加入100 μL無菌水溶解作為雜交模板。
3)生物素標(biāo)記egfr啟動(dòng)子片段的RNA制備和RNA/DNA雜交捕獲:①egfr啟動(dòng)子片段兩端加T7,SP6 adapter:以基因組DNA為模板,用egfr promotor primer (表1)擴(kuò)增egfr啟動(dòng)子片段272 bp,液體回收后加上T7,SP6 adapter(表1),用T7,SP6引物PCR擴(kuò)增egfr啟動(dòng)子片段,即得到帶有T7啟動(dòng)子的egfr啟動(dòng)子片段。②egfr啟動(dòng)子片段轉(zhuǎn)錄為RNA:液體回收PCR產(chǎn)物,30 μL反應(yīng)體系中含有4 mmol/L rNTP,1×T7 RNA Polymerase buffer,75 U T7 RNA Polymerase,0.3 mmol/L biotin-16-UTP,37℃水浴3 h。③egfr啟動(dòng)子RNA/3C模板雜交: 200 μL反應(yīng)體系中含有5×SSC buffer(0.75 mol/L NaCl,0.075 mol/L檸檬酸鈉),加入DNA模板100 μL,95℃加熱2 min,冰上1 min,加入RNA 30 μL,65℃雜交24 h。④egfr啟動(dòng)子片段富集:取鏈親和素包被的Dynal磁珠10 μL,用100 μL 2×B&W緩沖液懸浮磁珠,加入100 μL的生物素化RNA/DNA,輕輕旋轉(zhuǎn),室溫下放置過夜。用200 μL 1×TWB緩沖液洗3次,70℃加熱30 min,取上清,即得到生物素化的RNA/DNA(圖1)。
圖1 RNA捕獲法技術(shù)流程圖Fig.1 Schematic representation of RNA capture method
表1 PCR引物及接頭序列Tab.1 Sequence of pair-end adapters and PCR primers
4)樣本擴(kuò)增和高通量測(cè)序:50 μL反應(yīng)體系中含有0.4 mmol/L PE引物(表1),0.2 mmol/L dNTPs,1.25 U Ex Taq DNA聚合酶,5 μL DNA模板。98℃變性30 s后,再依下列條件進(jìn)行PCR:98℃變性10 s,62℃退火30 s,72℃延伸60 s,15個(gè)循環(huán)后,72℃延伸5 min。產(chǎn)物純化定量。RNA捕獲的樣本擴(kuò)增15個(gè)循環(huán)后,進(jìn)行Solexa高通量測(cè)序。
結(jié)果顯示,MboⅠ酶消化的基因組DNA產(chǎn)生從大到小均一的酶切片段,與對(duì)照基因組相比,消化比較完全(圖2)。
圖2 MboⅠ酶切基因組DNA瓊脂糖凝膠電泳Fig.2 MboⅠdigestion efficiency by gelelectrophoresis assay M:100 bp DNA ladder;1:HeLa S3 genome DNA treated by MboⅠ;2:HeLa S3 genome DNA untreated by MboⅠ with same quantity as control.
用T7 RNA Polymerase轉(zhuǎn)錄egfr啟動(dòng)子272 bp,37℃水浴3 h后,用1.5%瓊脂糖凝膠電泳檢測(cè)轉(zhuǎn)錄產(chǎn)物,可見egfr啟動(dòng)子RNA呈彌散分布(圖3)。
圖3 T7 RNA Polymerase轉(zhuǎn)錄egfr啟動(dòng)子片段瓊脂糖凝膠電泳Fig.3 Agarose gelelectrophoresis of egfr promotor DNA transcription by T7 RNA PolymeraseM:100 bp DNA ladder;1:egfr gene promotor DNA;2:egfr promotor RNA after transcription.
分別取富集前和富集擴(kuò)增后的DNA模板12 ng作模板,用egfr promotor primer(表1)擴(kuò)增,產(chǎn)物液體回收純化。瓊脂糖膠電泳結(jié)果顯示egfr啟動(dòng)子片段經(jīng)過RNA雜交捕獲后有富集(圖4)。
圖4 egfr啟動(dòng)子片段PCR瓊脂糖凝膠電泳Fig.4 Agarose gelelectrophoresis of egfr gene promotor DNA PCRM:100 bp DNA ladder;1:egfr gene promotor PCR using template before enrichment;2:egfr gene promotor PCR using template after enrichment.
Solexa高通量測(cè)序結(jié)果的數(shù)據(jù)作為實(shí)驗(yàn)組,用黑色表示,從實(shí)驗(yàn)組中隨機(jī)取總條數(shù)為106reads,比對(duì)到egfr啟動(dòng)子片段reads條數(shù)為1 889條,而比對(duì)到隨機(jī)挑選的notch 1、pdgf-B、src基因reads條數(shù)為2、3、3條。從人類全基因組隨機(jī)取總條數(shù)106的等長(zhǎng)reads作為對(duì)照組,用白色表示,比對(duì)到notch 1、pdgf-B、src、egfr基因reads條數(shù)分別為3,2,3,2條。橫坐標(biāo)軸表示各基因名稱,縱坐標(biāo)軸表示比對(duì)到各基因片段reads條數(shù)取log值。分析顯示,RNA捕獲法在本實(shí)驗(yàn)中進(jìn)行全基因組egfr啟動(dòng)子片段富集了630倍(圖5)。
圖5 Reads比對(duì)不同的基因分析Fig.5 Analysis of Reads mapping different genes
基因組測(cè)序分析能夠?yàn)榛駾NA序列提供最真實(shí)可靠的信息,它可以比較全面地描述基因的復(fù)雜性和多樣性[8]。隨著人類基因組計(jì)劃的完成和測(cè)序技術(shù)的不斷發(fā)展,可以大規(guī)模地篩選突變基因,并對(duì)基因多態(tài)性進(jìn)行檢測(cè),有助于發(fā)現(xiàn)罕見的基因突變和腫瘤組織中基因組水平的變異[9]。但是在全基因組水平進(jìn)行測(cè)序目前的費(fèi)用還比較昂貴,一般課題組難以承受,基因診斷和治療技術(shù)的普及受到DNA富集方法的限制。本課題組采用RNA捕獲法將egfr啟動(dòng)子片段轉(zhuǎn)錄為RNA,與基因組進(jìn)行雜交富集,并洗去基因組的其他部分,用PCR擴(kuò)增建立測(cè)序文庫,進(jìn)行高通量測(cè)序并利用生物信息學(xué)技術(shù)進(jìn)行分析,證明RNA捕獲法對(duì)egfr啟動(dòng)子有明顯的富集作用。傳統(tǒng)的靶向重測(cè)序技術(shù)如PCR技術(shù),費(fèi)用過高或者通量過低[6],該技術(shù)與之相比,具有一定的優(yōu)越性,它不存在偏向性,可以高效富集DNA,針對(duì)性強(qiáng),簡(jiǎn)便易行,且降低了測(cè)序成本。Nimbl Gen公司[10]推出的基于芯片雜交的全外顯子捕獲芯片,內(nèi)含210萬個(gè)寡核苷酸探針,可以捕獲人類大部分外顯子,通過測(cè)序識(shí)別在外顯子中的基因變異。Agilent公司[11]推出了基于芯片雜交和液相雜交的全基因組外顯子捕獲產(chǎn)品,捕獲探針的長(zhǎng)度是120 bp,每管溶液中包含55 000個(gè)生物素化的RNA探針,Agilent公司還發(fā)展了在線eArray設(shè)計(jì)平臺(tái),可以根據(jù)客戶需要自行設(shè)計(jì)探針。但是對(duì)于一般的研究單位而言,費(fèi)用仍較高,需要提前訂購(gòu),在技術(shù)也并非簡(jiǎn)便易行。
本技術(shù)利用RNA捕獲法,不僅可以對(duì)感興趣的靶區(qū)段自行設(shè)計(jì),還可以自行制備生物素化的RNA探針,降低了成本。除了對(duì)外顯子或編碼序列設(shè)計(jì)探針外,還可以對(duì)感興趣的非編碼序列自行設(shè)計(jì)和制備RNA探針。本實(shí)驗(yàn)RNA探針的長(zhǎng)度達(dá)272 bp,而且在序列捕獲時(shí)采用較高溫度,提高了捕獲反應(yīng)的特異性。本技術(shù)結(jié)合高通量技術(shù)深度測(cè)序所富集區(qū)域,而非全基因組序列,從而提高效率,降低成本。它可以用于大規(guī)模、多樣本的與疾病相關(guān)的基因和基因組水平異常的研究,包括單核苷酸多態(tài)性,基因組結(jié)構(gòu)變異,群體多態(tài)性,可變剪切等。該技術(shù)為研究人員提供了一種低成本、高效率、靈活的目標(biāo)測(cè)序方法,可以適用于多種不同的應(yīng)用領(lǐng)域,它的研究與發(fā)展將會(huì)在重大疾病研究中發(fā)揮重要作用。
[1] Ciardiello F,Tortora G.EGFR antagonists in cancer treat-ment[J].N Engl J Med,2008,358:1160-1174.
[2] Salomon D S,Brandt R,Ciardiello F,et al.Epidermal growth factor-related peptides and their receptors in human malignancies[J].Crit Rev Oncol Hematol,1995,19:183-232.
[3] Tabernero J.The role of VEGF and EGFR inhibition:implications for combining anti-VEGF and anti-EGFR agents[J].Mol Cancer Res,2007,5:203-220.
[4] Brandt B,Meyer-Staeckling S,Schmidt H,et al.Mechanisms of EGFR gene transcription modulation:relationship to cancer risk and therapy response[J].Clin Cancer Res,2006,12:7252-7260.
[5] Liu W,Wu X,Zhang W,et al.Relationship of EGFR mutations,expression,amplification,and polymorphisms to epidermal growth factor receptor inhibitors in the NCI60 cell lines[J].Clin Cancer Res,2007,13:6788-6795.
[6] Mamanova L,Coffey A J,Scott C E,et al.Target-enrichment strategies for next-generation sequencing[J].Nat Methods,2010,7:111-118.
[7] Gnirke A,Melnikov A,Maguire J,et al.Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing[J].Nat Biotechnol,2009,27: 182-189.
[8] Shendure J,Ji H.Next-generation DNA sequencing[J].Nat Biotechnol,2008,26:1135-1145.
[9] Hillier L W,Marth G T,Quinlan A R,et al.Whole-genome sequencing and variant discovery in C.elegans[J].Nat Methods,2008,5:183-188.
[10]Choi M,Scholl U l,Ji W,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J].Proc Natl Acad Sci USA,2009,106:19096-19101.
[11]Metzker M L.Sequencing technologies——the next generation[J].Nat Rev Genet,2010,11:31-46.