展 望 王 文 施威揚
(同濟大學生命科學與技術學院 上海 200092)
長牡蠣又稱太平洋牡蠣,是我國最重要的海水養(yǎng)殖對象之一,也是世界主要海水養(yǎng)殖貝類。培育高質量、高產(chǎn)的新品種一直是牡蠣養(yǎng)殖業(yè)的重要目標,這使得牡蠣成為了研究最為深入的貝類之一(Qin et al,2012)。長牡蠣全基因組測序的完成(Zhang et al,2012),為解密其遺傳信息打開了大門,并使其成為最主要的海洋貝類模式動物。通過對長牡蠣全基因組數(shù)據(jù)的分析,已經(jīng)初步揭示了一些其基因組的重要特性(Xu et al,2014;Zhou et al,2014;Li et al,2015;She et al,2015;Zhang et al,2015),但是更細致的組學功能研究還有待深入開展。本文通過在牡蠣中建立完整的染色質免疫共沉淀-測序技術(ChIP-seq),在全基因組水平上獲得了組蛋白修飾分布的信息,并結合后期生物信息學分析,初步闡釋了牡蠣表觀遺傳修飾的特點。同時,牡蠣中完整的 ChIP技術的建立也可以更好地應用于轉錄因子或其它表觀遺傳修飾信息對發(fā)育的調控的研究,從而為改良育種提供高效和正確的遺傳信息。
通過DNA測序快速并準確獲得各種生物體的遺傳信息對生命科學研究具有重大意義,而測序技術的進步極大推動了生物學的發(fā)展。測序技術最早可以追溯到20世紀50年代,Whitfeld等(1954)報道了用化學降解的方法測定多聚核糖核苷酸序列;Sanger等(1975,1977)發(fā)明的雙脫氧核苷酸末端終止法和Gilbert等(Maxam et al,1977;Gilbert,1981)發(fā)明的化學降解法,標志著第一代測序技術的誕生。從此,DNA測序走向了大規(guī)模實用化的道路。而高通量測序技術(high-throughput sequencing)的出現(xiàn),將生物學研究推向了新的高度。這些方法的應用和普及,使人們能夠更加全面地深入了解各種生物學過程,以及如何在外界因素的影響下發(fā)生相應的動態(tài)變化(Pepke et al,2009)。
目前染色質免疫共沉淀技術(chromatin immunoprecipitation,ChIP)與測序(sequencing)相結合的ChIP-seq技術(Johnson et al,2007)是在基因組層次研究體內蛋白質與 DNA相互作用的有力工具,ChIP-seq技術能夠高效地在全基因組范圍內檢測與組蛋白、轉錄因子等互作的DNA區(qū)段(Mikkelsen et al,2007;Robertson et al,2007)。ChIP-Seq 的原理是: 利用目的蛋白特異性的抗體通過免疫共沉淀對與目的蛋白結合的 DNA片段進行特異性的富集,然后進行下一步的 DNA純化與測序文庫構建(Park,2009;Chen et al,2012),最后進行高通量測序。隨后利用生物信息學軟件將獲得的數(shù)百萬條序列定位到基因組上,在全基因組范圍內鑒別DNA結合蛋白結合位點、組蛋白修飾、核小體定位等信息。ChIP-seq技術可以應用到任何基因組序列已知的物種,通過測序完整揭示免疫沉淀富集的DNA片段包含的蛋白定位信息(Schuster,2008)。近些年來,ChIP-seq技術已經(jīng)發(fā)展成為研究轉錄因子結合位點和組蛋白修飾的最有力的實驗手段,而基于多種高通量測序平臺的 ChIP-seq在基因調控網(wǎng)絡研究中也發(fā)揮著重要作用。
長牡蠣(Crassostrea gigas)取自山東省青島市膠南海水養(yǎng)殖場;挑選性腺飽滿的一齡貝,鏡檢雄貝精子活力旺盛,雌貝卵子呈現(xiàn)梨形或者圓形;空運至上海后,隨即放置在安裝有增氧泵、水循環(huán)過濾系統(tǒng)以及水溫控制冷卻系統(tǒng)的人工海水水族箱內;人工海水鹽度約28—30,水溫恒定在16°C。
挑選出雌性和雄性牡蠣若干,解剖分離出精子和卵子,分別用海水漂洗 5—6次,獲得干凈的卵細胞和精子。受精前,精子需要在海水中活化10min左右,卵細胞活化約 1h。向活化的卵細胞中添加精子,精子密度為5—6個精子包圍1個卵子為宜。在水溫25°C,裝有氧裝置的培養(yǎng)箱中培養(yǎng),保持攪拌(劉鵬超等,2011)。加入精子后30min用500目濾網(wǎng)濾去精子,更換新鮮海水。顯微鏡觀察胚胎發(fā)育同步性,對于在 4細胞期發(fā)育同步性好的樣品在培養(yǎng)箱中繼續(xù)培養(yǎng),收集16細胞期(約受精后3h 10min,25°C)胚胎樣品;1000r/min離心5min,用2.9×室溫PBS重懸后加入終濃度為 1%的甲醛室溫下固定 10min。加入終濃度為 0.125mol/L的甘氨酸終止反應 5min。1000r/min 4°C 離心 5min,棄上清;用 2.9×預冷的PBS重懸,再次離心后棄上清;用冷的2.9×PBS重懸后,分裝至EP管中;3000r/min 4°C離心1min,棄上清,液氮速凍,–80°C 冰箱保存。
1.2.1 Western-Blot驗證 H3K4me3抗體 收集精子、16細胞期胚胎和閉殼肌組織,加入適當體積的RIPA細胞裂解液(10mmol Tris-HCl,1%脫氧膽酸鈉,l% NP-40,150mmol NaCl,0.1% SDS,0.2mmol PMSF)裂解細胞,冰上裂解30min后,超聲破碎細胞。最后,將裂解復合物 12000×g離心 20min,吸取上清,棄沉淀,–80°C凍存?zhèn)溆?。含總蛋白?0μg的樣品溶液加入5×上樣緩沖液,100°C沸水加熱5min。熱變性后的樣品進行濃度為 12%的 SDS-PAGE電泳。濕法轉膜(PVDF膜,0.22μm,Millipore)100mA恒流轉膜2h。5%脫脂奶粉液室溫封閉1h后,將濾膜與由5%脫脂乳粉液稀釋 1000倍的第一抗體(rabbit-anti-H3K4me3,Millpore,07-473)4°C孵育過夜,然后用TBST(50mmol Tris,150mmol NaCl,0.05% Tween 20)漂洗 3次,每次10min。用1 : 5000稀釋的辣根過氧化物酶標記的免疫球蛋白(Santa cruz)與濾膜溫育,在搖床上搖動孵育1h。然后用TBST漂洗3次,每次10min。用ECL顯色法(碧云天超敏ECL化學發(fā)光試劑盒)進行顯色。
1.2.2 胚胎的染色質免疫共沉淀(ChIP) 取濕重約1g的固定的胚胎用膜裂解液(20mmol Tris,85mmol KCl,0.5% NP-40,0.5%脫氧膽酸鈉)裂解,高速離心收集細胞核。用800μL微球菌核酸酶緩沖液(10mmol Tris-HCl,15mmol NaCl,60mmol KCl,2mmol CaCl2,0.15mmol精胺,0.5mmol亞精胺)重懸;加入1000U的微球菌核酸酶(micrococcal nuclease,NEB)37°C消化10min;期間每隔2min輕彈混勻一次;加入終濃度為10mmol的EDTA和終濃度0.1% SDS終止反應,置于冰上冷卻;用Bioruptor進行超聲;能量H;間隔30s,工作 30s,時間 6—7min。14000r/min 4°C離心 15min,收集上清。用30kDa超濾管(Amicon Ultra-0.5)將上清濃縮至體積約 100—200μL;取濃縮液體積的 1%作為input,存放–80°C;其余部分加入 800μL IP dilution buffer (2mmol EDTA,150mmol NaCl,20mmol Tris-HCl);加入約5μg ChIP抗體(rabbit-anti-H3K4me3,Millipore,07-473)和 Dynabeads Protein A/Protein G混合均勻,在4°C孵育過夜。次日分別TSⅠ液(0.1% SDS,1% TritonX-100,2mmol EDTA,20mmol Tris-HCl,150mmol NaCl)、TSⅡ液(0.1% SDS,1% TritonX-100,2mmol EDTA,20mmol Tris-HCl,500mmol NaCl)、BufferⅢ液(0.25mol/L LiCl,1% NP-40,1%脫氧膽酸鈉,1mmol EDTA,10mmol Tris-HCl)、TE各洗 3次,每次5min;洗滌完成后棄上清;加入IP洗脫液(1% SDS,0.1mol/L NaHCO3)200μL,放置在 65°C 金屬浴振蕩1h;加入RNase A去除 RNA;加入蛋白酶K、NaCl置于65°C解交聯(lián)過夜。用酚氯仿法抽提-乙醇沉淀純化DNA,TE溶解DNA后隨即構建文庫。
1.2.3 構建文庫 取 input DNA(1μg)和 ChIP DNA,按照NEBNext DNA超快速文庫制備試劑盒(E7370S)的說明書指示制備測序文庫。文庫構建成功后送往華大基因公司進行PE 50雙端測序。
1.2.4 數(shù)據(jù)分析 使用 bowtie(version 1.0.1)將測序讀長回貼到牡蠣的基因組(從 http: //oysterdb.cn/下載)上,參數(shù)設置為比對時種子長度為 28bp,最多允許2個錯配的默認值。對回貼所得的結果BAM文件用 MACS(1.4.2 20120305)以默認參數(shù)進行處理。對MACS所得結果使用CEAS (Package Version 1.0.2)進行處理,所用的Gene信息為從http: //oysterdb.cn/下載后轉換格式所得。
ChIP實驗的成功首先需要能夠在所實驗的物種中工作,且特異性較好的抗體;但由于牡蠣是一個比較新的模式動物,基本上所有商品化的抗體都沒有在牡蠣中驗證抗體有效性的資料;為了驗證本實驗所用抗體的有效性,作者收集了牡蠣精子、胚胎(16細胞)以及閉殼肌三種樣品,采用 Western-Blot的方法驗證所用的H3K4me3抗體在牡蠣中工作效果。圖1中顯示在精子、胚胎和肌肉中都能檢測到信號,且條帶較為特異,沒有其它干擾條帶;但從圖1中可以發(fā)現(xiàn)在精子中 H3K4me3的信號較弱,暗示精子中可能缺少組蛋白的修飾。因為H3K4甲基化通常被認為是基因的活化信號,如 H3K4me3在轉錄起始位點的富集通常表明著基因的轉錄激活(Li et al,2007)。綜合三種樣品中的實驗結果表明本研究所選的抗體能夠應用于牡蠣中,而且識別 H3K4me3比較特異,可以用于下一步的ChIP實驗。
圖1 牡蠣中H3K4me3抗體驗證Fig.1 Verification of anti-H3K4me3 antibody in the oyster
早期胚胎細胞分裂活動旺盛,染色質較為疏松,而且含有大量的細胞質,若使用傳統(tǒng)的超聲方法制備染色質,裂解液中會溶解大量的細胞質蛋白,對后一步免疫沉淀過程產(chǎn)生影響。因此,針對早期胚胎的結構特點,作者利用微球菌核酸酶(Micrococcal Nuclease)將染色質酶切成單核小體。
作者前期摸索了不同時間梯度下酶切的效果,以加入酶為零點,分別在0、5、10、20、30和40min取等量的反應液,經(jīng)過解交聯(lián)純化 DNA后電泳;如圖2a顯示,隨著酶切時間的延長,所獲得的核小體從起始點呈現(xiàn)階梯狀分布逐漸到 40min時候大部分可見的單核小體(150bp)狀態(tài);酶切40min后,絕大部分染色質已經(jīng)變成單核小體甚至更小的片段;根據(jù)上述條件,最終確定酶切 10min使得染色質絕大部分是單核小體(150bp),但雙核小體(300bp)依然可見(圖2b 所示)。
圖2 不同時間點酶切效果檢測Fig.2 The effect of enzyme digestion in time series
隨后將按照上述條件制備的DNA-組蛋白復合物經(jīng)ChIP后純化DNA,使用NEBNext DNA超快速文庫制備試劑盒構建文庫。通常來講,ChIP-seq對樣品的要求是DNA總量大于10ng以上,片段主峰分布在100—500bp之間。使用Agilent 2100檢測構建成功的測序文庫的實際分布和濃度(圖3);其中主峰片段大小為279bp,濃度為17.5 nmol/L,符合上機測序要求;將樣本交于華大基因公司測序,測序完成后返回原始數(shù)據(jù),進行數(shù)據(jù)的處理。
圖3 使用Agilent 2100分析ChIP-seq文庫結果Fig.3 Agilent 2100 analysis of ChIP-seq library using MNase digestion
為了進一步檢驗按照本文描述的方法所構建的文庫,將所測的數(shù)據(jù)首先利用數(shù)據(jù)質控軟件 FastQC進行測序數(shù)據(jù)的質量控制;FastQC通過分析原始數(shù)據(jù)的每一個堿基來顯示整體樣品的測序質量。圖4中選取展示了 FastQC結果中的 4條結果,a圖中全部reads的評分均在30以上,說明測序結果偏差較小;b圖中統(tǒng)計了全部reads的CG分布比較均一;僅在5’端出現(xiàn)由于機器導致的偏差;c圖中表明測序結果中表示測序結果中不能分辨的堿基N的比例很小;d圖表明了測序結果中的重復序列出現(xiàn)的次數(shù)較低;結果顯示利用本文的ChIP方法所獲得的數(shù)據(jù)質量比較好,可以用于下一步的分析。
所得數(shù)據(jù)reads總數(shù)為17885715,reads雙端比對到基因組上的數(shù)量為8258488,比對效率46.17%。這和其它物種中 ChIP-seq實驗的一般比對效率(40%—70%)近似(Park,2009;Wei et al,2013)。接下來使用CEAS軟件(Ji et al,2006)對ChIP-Seq數(shù)據(jù)的初步分析,圖5a顯示相對于全基因組,ChIP-seq實驗組在基因組上富集于啟動子區(qū)域,同時在轉錄起始位點(TSS)有一個峰的集中分布(圖5b),從而可以確定 ChIP-Seq實驗是成功的。后續(xù)工作開始對這些富集峰進行準確的注釋,以了解更多信息。
目前染色質免疫共沉淀技術(ChIP)與測序(sequencing)相結合的 ChIP-seq技術是在基因組層次研究體內蛋白質與 DNA相互作用的有力工具,能夠高效地在全基因組范圍內檢測與組蛋白、轉錄因子等互作的DNA區(qū)段。然而目前在牡蠣等貝類中尚未見相關報道。
圖4 FastQC質控結果Fig.4 Result of quality control with FastQC
進行ChIP實驗的關鍵因素是特異性的抗體和高質量的染色質制備。作者嘗試了可以廣泛識別真核生物保守度 H3K4me3修飾的抗體并證實其可以用于ChIP。在染色質制備上面,嘗試了超聲和酶切消化兩種方法。超聲有重復性差、需要樣品多等劣勢,根據(jù)牡蠣胚胎的細胞性質,采用了微球菌核酸酶消化的方式制備了高質量的單核小體染色質。此外,為了獲得發(fā)育同步性高度早期胚胎,通過縮短受精時間和洗除精子等方法,收集了發(fā)育同步性較高的早期胚胎;探索出了一套穩(wěn)定性好、重復性高而且對于各個時期的胚胎都適宜的 ChIP方法;最后,將制備的ChIP樣品在實驗室自行建庫,克服了商業(yè)化公司構建文庫成本高、風險大等因素。測序結果說明在文庫質量、基因組比對效率等方面都和模式生物中的ChIP-seq結果類似,說明作者建立的牡蠣ChIP-seq試驗體系可以用于研究組蛋白的表觀遺傳修飾。本研究的結果顯示與其它模式生物類似,牡蠣的 H3K4me3修飾主要分布在基因轉錄其實位點附近,具體的基因數(shù)據(jù)需要進一步的分析處理。這些信息可以為揭示牡蠣胚胎發(fā)育的表觀遺傳調控機制、解析基因調控網(wǎng)絡提供巨大幫助。
圖5 CEAS分析結果Fig.5 Results of analysis with CEAS
將ChIP應用于一種新的動物系統(tǒng)是很大的挑戰(zhàn),物種特異的實驗步驟及實驗方案的設計都少有前人工作可以參考。以牡蠣為樣品的表觀遺傳方法的建立可以為牡蠣中的多種研究奠定方法學基礎。本文的結果證實了在牡蠣中進行 ChIP實驗的可行性,并且揭示了在牡蠣早期配套中存在著廣泛的組蛋白H3k4me3的修飾,這一技術也可以更好地應用于研究轉錄因子或其它表觀遺傳修飾的信息,并為改良育種提供高效和正確的遺傳信息。作為第一個完成基因組測序的經(jīng)濟貝類動物,對其進行多方面的組學研究,勢必有助于了解海洋中種類最豐富、但研究甚少的海洋生物。
劉鵬超,闕華勇,張國范,2011.長牡蠣早期胚胎發(fā)育中脂肪酸和氨基酸組成變化的研究.海洋科學,35(10): 16—21
Chen Y W,Negre N,Li Q H et al,2012.Systematic evaluation of factors influencing ChIP-seq fidelity.Nat Methods,9(6):609—614
Gilbert W,1981.DNA sequencing and gene structure.Science,214(4527): 1305—1312
Ji X W,Li W,Song J et al,2006.CEAS: cis-regulatory element annotation system.Nucleic Acids Res,34(S2):W551—W554,http: //dx.doi.org/10.1093/nar/gkl322
Johnson D S,Mortazavi A,Myers R M et al,2007.Genome-wide mapping of in vivo protein-DNA interactions.Science,316(5830): 1497—1502
Li B,Carey M,Workman J L,2007.The role of chromatin during transcription.Cell,128(4): 707—719
Li H,Zhang H,Jiang S et al,2015.A single-CRD C-type lectin from oyster Crassostrea gigas mediates immune recognition and pathogen elimination with a potential role in the activation of complement system.Fish Shellfish Immunol,44(2): 566—575
Maxam A,Gilbert W,1977.A new method for sequencing DNA.Proc Natl Acad Sci U S A,74(2): 560—564
Mikkelsen T S,Ku M,Jaffe D B et al,2007.Genome-wide maps of chromatin state in pluripotent and lineage-committed cells.Nature,448(7153): 553—560
Park P J,2009.ChIP-seq: advantages and challenges of a maturing technology.Nat Rev Genet,10(10): 669—680
Pepke S,Wold B,Mortazavi A,2009.Computation for ChIP-seq and RNA-seq studies.Nat Methods,6(11S): S22—S32,doi:10.1038/nmeth.1371
Qin J,Huang Z X,Chen J et al,2012.Sequencing and de novo analysis of Crassostrea angulata (Fujian oyster)from 8 different developing phases using 454 GSFlx.PLoS One,7(8):e43653,http: //dx.doi.org/10.1371/journal.pone.0043653
Robertson G,Hirst M,Bainbridge M et al,2007.Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing.Nat Methods,4(8): 651—657
Sanger F,Coulson A R,1975.A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase.J Mol Biol,94(3): 441—448
Sanger F,Nicklen S,Coulson A R,1977.DNA sequencing with chain-terminating inhibitors.Proc Natl Acad Sci U S A,74(12): 5463—5467
Schuster S C,2008.Next-generation sequencing transforms today's biology.Nat Methods,5(1): 16—18
She Z C,Li L,Qi H G et al,2015.Candidate gene polymorphisms and their association with glycogen content in the pacific oyster Crassostrea gigas.PLoS One,10(5):e124401,http: //dx.doi.org/10.1371/journal.pone.0124401
Wei Y,Chen R,Dimicoli S et al,2013.Global H3K4me3 genome mapping reveals alterations of innate immunity signaling and overexpression of JMJD3 in human myelodysplastic syndrome CD34+ cells.Leukemia,27(11): 2177—2186
Whitfeld P R,1954.A method for the determination of nucleotide sequence in polyribonucleotides.Biochem J,58(3): 390—396
Xu F,Wang X T,Feng Y et al,2014.Identification of conserved and novel microRNAs in the Pacific oyster Crassostrea gigas by deep sequencing.PLoS One,9(8): e104371,http: //doi: 10.1371/journal.pone.0104371
Zhang G F,Fang X D,Guo X M et al,2012.The oyster genome reveals stress adaptation and complexity of shell formation.Nature,490(7418): 49—54
Zhang L L,Li L,Guo X M et al,2015.Massive expansion and functional divergence of innate immune genes in a protostome.Sci Rep,5: Article number: 8693
Zhou Z,Wang L L,Song L S et al,2014.The identification and characteristics of immune-related microRNAs in haemocytes of oyster Crassostrea gigas.PLoS One,9(2): e88397