梁國婷
(濰坊科技學(xué)院賈思勰農(nóng)學(xué)院/山東省高校設(shè)施園藝實(shí)驗(yàn)室 濰坊 262700)
單細(xì)胞測序技術(shù)是指在單個細(xì)胞的水平上對基因組進(jìn)行高通量測序分析的技術(shù)。2011年和2013年,單細(xì)胞測序技術(shù)分別被《自然—方法(Nature Methods)》和《科學(xué)(Science)》列為年度最值得期待和關(guān)注的技術(shù)之一。單細(xì)胞測序技術(shù)不僅能更加精確地測量細(xì)胞內(nèi)的基因表達(dá)水平,而且能檢測到罕見非編碼RNA和微量基因表達(dá)子[1]。而傳統(tǒng)的賴以進(jìn)行高通量測序的DNA來源于大量細(xì)胞,其結(jié)果只是這個細(xì)胞群體的“平均值”。眾所周知,細(xì)胞之間存在異質(zhì)性,即使表型相同,細(xì)胞的遺傳信息也可能具有顯著差異,并且這種“整體表征”的做法,丟失了很多低豐度的信息[2]。另外,很多生物樣品量非常稀少,難以培養(yǎng),如人體內(nèi)不能進(jìn)行體外培養(yǎng)的微生物、早期發(fā)育階段的胚胎細(xì)胞及組織微陣列等[3]。這些難以培養(yǎng)的生物樣品給生物學(xué)研究帶來了難以逾越的信息鴻溝,人們甚至稱其為生物學(xué)上的“暗物質(zhì)”。隨著單細(xì)胞測序需求的日益增加,國際上許多測序公司相繼推出新一代的單細(xì)胞測序技術(shù),相關(guān)的研究成果也越來越多,如該技術(shù)已經(jīng)用于海洋微生物的多樣性研究[4]和腎透明細(xì)胞癌[5]及骨髓增殖性腫瘤[6]等的研究。單細(xì)胞測序技術(shù)正在成為基因序列研究的熱點(diǎn)。
本文概述單細(xì)胞測序技術(shù)設(shè)計的單細(xì)胞分離、細(xì)胞溶解與基因組DNA的獲取、全基因組擴(kuò)增、測序與數(shù)據(jù)分析4個方面的操作技術(shù)的研究進(jìn)展。
單細(xì)胞測序技術(shù)首先要獲得單個細(xì)胞,相關(guān)技術(shù)主要包括連續(xù)稀釋法、顯微操作技術(shù)、激光捕獲顯微切割術(shù)(LCM)、微流控芯片技術(shù)、熒光激活細(xì)胞分選技術(shù)(FACS)等。這些技術(shù)適用范圍不同,各有優(yōu)缺點(diǎn),需要根據(jù)實(shí)驗(yàn)要求進(jìn)行選擇。
1.1 連續(xù)稀釋法 連續(xù)稀釋法是一種通過連續(xù)稀釋細(xì)胞群來獲得單細(xì)胞的方法,這是最簡單、也是最不準(zhǔn)確的單細(xì)胞分離的方法,很少用于復(fù)雜樣品的單細(xì)胞分離。
1.2 顯微操作技術(shù) 當(dāng)細(xì)胞樣品的復(fù)雜度較低時,可以采用顯微操作技術(shù),根據(jù)細(xì)胞的形態(tài)特征來分選細(xì)胞。目前主要用于分離一些難以培養(yǎng)的微生物細(xì)胞[7, 8]。可以用顯微操作器控制玻璃毛細(xì)管或可視化鑷子來分選,技術(shù)成本較低,可進(jìn)行可視化操作,但是由于其通量低、人力成本高、容易造成細(xì)胞的機(jī)械損傷等缺點(diǎn),難以廣泛應(yīng)用。
1.3 激光捕獲顯微切割術(shù) 當(dāng)目的細(xì)胞在細(xì)胞群中呈分散分布,且占有的比例很小時,人們一般采用激光捕獲顯微切割術(shù)(LCM)技術(shù),直接從組織中分離單細(xì)胞。這種技術(shù)在臨床醫(yī)學(xué)中應(yīng)用比較廣泛。一般步驟包括: 組織切片、裝片、染色處理和可視化操作分離單細(xì)胞。但由于操作過程中切割精度有限,容易摻雜相鄰細(xì)胞的原生質(zhì),以及目的細(xì)胞容易丟失核染色體片段,因此在轉(zhuǎn)錄組學(xué)分析中,一般不采用這種技術(shù)[9]。
1.4 微流控芯片技術(shù) 在物理學(xué)上,流體慣性可以在微米級尺度上忽略,微流控技術(shù)正是利用這一原理,人為控制(細(xì)胞)流體的流動,來實(shí)現(xiàn)單細(xì)胞的分離[10]。微流控裝置的核心是只容許單個細(xì)胞通過的通道,其直徑可根據(jù)細(xì)胞的大小進(jìn)行調(diào)節(jié),并且通道可根據(jù)需要檢測的細(xì)胞類型進(jìn)行修飾。在實(shí)驗(yàn)中,為了減少流體用量、提高樣品濃度,可以將微流控裝置結(jié)合到生物芯片上[11, 12]。目前已經(jīng)開發(fā)出了一種集單細(xì)胞分離、溶解、基因組DNA抽提與純化于一體的新型微流控芯片[10],流體量已從原來的mL或μL降至nL或pL。盡管微流控芯片技術(shù)因樣品用量小而可以有效避免污染,但是由于其成本較高,故實(shí)際應(yīng)用并不廣泛。
1.5 熒光激活細(xì)胞分選技術(shù) 熒光激活細(xì)胞分選(FACS)技術(shù)是目前最流行的單細(xì)胞分離技術(shù)。流式系統(tǒng)按照細(xì)胞特征(大小、顏色、核酸、生物化學(xué)活性等)迅速將單個細(xì)胞分選到幾百個孔板中。目前的細(xì)胞分選儀的參數(shù)已經(jīng)達(dá)到了20個,顏色已達(dá)到18種;而細(xì)胞分選的速率達(dá)到了每秒鐘上千個細(xì)胞[13]。但是,這種方法也有固有的缺陷: 一是需要大量的細(xì)胞懸浮液,會降低低豐度細(xì)胞的獲得率;二是分選速率比較快,容易造成細(xì)胞損傷。
細(xì)胞溶解是指采用物理、化學(xué)或生物的方法,破除細(xì)胞壁和細(xì)胞膜,將細(xì)胞內(nèi)的物質(zhì)釋放出來的一種方法。細(xì)胞溶解的質(zhì)量直接影響了基因組DNA的獲取。實(shí)驗(yàn)中要根據(jù)細(xì)胞的種類、基因組DNA的純化難易程度等因素來選擇細(xì)胞溶解的方法。
2.1 物理法 溶解細(xì)胞的物理方法主要有熱破壞、冷凍、剪切、研磨、高壓和超聲波等。這些方法操作簡便,不容易造成樣品污染,但有可能引起基因組DNA斷裂和降解。
2.2 化學(xué)法 溶解細(xì)胞的化學(xué)方法主要有: 極端pH法和表面活性劑(如SDS和tritonX-100)法。極端pH法主要是對細(xì)胞壁和細(xì)胞膜進(jìn)行溶解,其中堿對細(xì)胞的磷脂雙分子層的溶解要優(yōu)于酸,這種方法后期需要中和作用;表面活性劑法則通過溶解細(xì)胞膜上的脂質(zhì)和蛋白質(zhì),進(jìn)而溶解細(xì)胞,這種方法操作簡便,但是容易造成樣品污染和引起基因組DNA降解。
2.3 生物法 溶解細(xì)胞的生物學(xué)方法最常使用的是酶降解法(如溶菌酶和蛋白酶)。大多數(shù)革蘭氏陰性菌可以利用溶菌酶進(jìn)行溶解,而部分格蘭氏陽性菌和一些復(fù)雜的群落則需要溶菌酶結(jié)合多種其他酶來溶解[14]。模板擴(kuò)增容易受到DNA結(jié)合蛋白的阻礙,需要先用蛋白酶(如蛋白酶K和胰蛋白酶)溶解DNA結(jié)合蛋白[15]。
由于在很多基因組中,基因位點(diǎn)拷貝數(shù)只有一個,因此獲得基因組DNA之后,不再進(jìn)行DNA的純化,以防樣品丟失造成基因位點(diǎn)缺失,這是與傳統(tǒng)的高通量測序的不同之處。同時,該法對溶解細(xì)胞的操作提出了更高的要求,即不僅要徹底地溶解細(xì)胞,更要避免使用那些影響基因組DNA獲取和后續(xù)全基因組擴(kuò)增的方法。
高通量測序需要的DNA樣品質(zhì)量為幾百納克(ng),而單個細(xì)胞的總DNA含量只有幾皮克(pg),故遠(yuǎn)遠(yuǎn)達(dá)不到高通量測序的要求[16, 17],必須進(jìn)行全基因組擴(kuò)增,方法目前主要有3種,即: 基于PCR技術(shù)的擴(kuò)增、基于MDA技術(shù)的擴(kuò)增及MDA與PCR相結(jié)合的擴(kuò)增方法。這些方法由于使用的引物和DNA聚合酶不同而各有特點(diǎn)。
3.1 基于PCR技術(shù)的擴(kuò)增方法 早期的全基因組擴(kuò)增主要采用PCR技術(shù),根據(jù)引物的不同可以將其劃分為三大類: 特異性引物PCR擴(kuò)增、簡并性引物PCR擴(kuò)增及雜合性引物PCR擴(kuò)增。
利用PCR技術(shù)進(jìn)行全基因組的擴(kuò)增,擴(kuò)增的覆蓋度比較高,但是容易出現(xiàn)錯誤和覆蓋度不均的現(xiàn)象,故該技術(shù)現(xiàn)在已經(jīng)在逐步淘汰。
3.2 基于MDA技術(shù)的擴(kuò)增方法 為了避免PCR技術(shù)進(jìn)行全基因組擴(kuò)增的種種缺點(diǎn),具有核酸外切酶抗性的隨機(jī)引物結(jié)合枯草芽孢桿菌噬菌體(phi29 DNA)聚合酶進(jìn)行擴(kuò)增的技術(shù)已經(jīng)開始被使用,該技術(shù)也稱多位點(diǎn)置換擴(kuò)增(MDA)。
phi29 DNA聚合酶相比其他DNA聚合酶具有很多優(yōu)點(diǎn): ①反應(yīng)條件溫和,在30℃的恒溫下進(jìn)行;②phi29 DNA聚合酶鏈置換活性強(qiáng),擴(kuò)增時可取代擴(kuò)增模板的互補(bǔ)鏈,互補(bǔ)鏈也可以同時作為模板進(jìn)行擴(kuò)增,極大地提高了擴(kuò)增的效率;③phi29DNA聚合酶持續(xù)合成能力強(qiáng),能夠擴(kuò)增出大分子的DNA鏈(大于10 000 nt)。
與PCR技術(shù)相比,MDA技術(shù)在基因組擴(kuò)增上已經(jīng)有了進(jìn)步,但其缺點(diǎn)也不容忽視: ①由于模板和引物隨機(jī)結(jié)合,所以MDA的全基因組覆蓋度依然不均勻[18];②MDA反應(yīng)容易形成單鏈中間體進(jìn)而產(chǎn)生嵌合序列,導(dǎo)致基因組重排,影響基因組重建,這是MDA與基于PCR的擴(kuò)增方法的共同缺陷;③污染的DNA容易導(dǎo)致MDA引起非特異性擴(kuò)增。
3.3 MDA與PCR相結(jié)合的方法 多次退火環(huán)狀循環(huán)擴(kuò)增技術(shù)(multiple annealing and looping-based amplification cycles, MALBAC)是一種新的將MDA與PCR結(jié)合的擴(kuò)增技術(shù),可以降低擴(kuò)增偏倚性,提高測序覆蓋度,也可明顯提高單核苷酸多態(tài)性(SNPs)等位基因的檢出率,提高幅度為70%左右。雖然MALBAC目前主要應(yīng)用于染色體重組和癌癥研究等方面,應(yīng)用比較局限,但由于其在全基因組擴(kuò)增的準(zhǔn)確性方面明顯優(yōu)于PCR技術(shù)和MDA技術(shù),相信MALBAC的應(yīng)用前景十分廣闊。
擴(kuò)增完成后,需要對擴(kuò)增產(chǎn)物進(jìn)行質(zhì)量驗(yàn)證,常規(guī)采用的方法是對標(biāo)記基因PCR擴(kuò)增后進(jìn)行Sanger測序,來評估全基因組擴(kuò)增的質(zhì)量。
4.1 基因組測序 用高通量測序技術(shù)進(jìn)行單堿基測序成本低而數(shù)據(jù)產(chǎn)出量高,是核酸測序研究進(jìn)程中的一次革命性創(chuàng)新,極大地促進(jìn)了基因組學(xué)和后基因組學(xué)研究的進(jìn)展。目前單細(xì)胞基因組測序主要使用第二代和第三代測序技術(shù),前者已比較成熟,后者正在迅速發(fā)展。
4.2 數(shù)據(jù)分析 數(shù)據(jù)分析前要把不需要的標(biāo)簽序列(barcodes)、連接序列(linker)、接頭序列(adapter)、低質(zhì)量堿基和污染DNA移除。
傳統(tǒng)的序列拼接方法是基于“嵌合序列比例很小且讀取深度隨基因組呈“泊松分布”的假設(shè),而單細(xì)胞數(shù)據(jù)中嵌合序列比例高且基因組覆蓋度不均勻,不能滿足這一假設(shè),必須對基因組進(jìn)行預(yù)處理。目前可以用的預(yù)處理策略主要有: 核酸文庫標(biāo)準(zhǔn)化、單細(xì)胞測序數(shù)據(jù)混合分析以及生物信息學(xué)分析。
4.2.1 核酸文庫標(biāo)準(zhǔn)化策略 目前主要通過實(shí)驗(yàn)法或計算機(jī)算法構(gòu)建一個標(biāo)準(zhǔn)化的核酸文庫。實(shí)驗(yàn)法通過利用一種雙鏈特異性核酸酶降解高豐度的雙鏈DNA序列,并構(gòu)建標(biāo)準(zhǔn)化的核酸文庫,其標(biāo)準(zhǔn)化水平一般通過定量核酸擴(kuò)增(quantitative PCR, qPCR)技術(shù)來評估;計算機(jī)算法利用相關(guān)軟件(gsAssembler)將隨機(jī)選擇的一定數(shù)目的讀長(reads)序列拼接成較大的片段(contig);contig長度除以reads的數(shù)目,若結(jié)果小于1 bp/read,證明該contig覆蓋度較高,擴(kuò)增可能存在偏倚性,這時需要移除部分reads序列,來構(gòu)建標(biāo)準(zhǔn)的核酸文庫。
計算機(jī)算法與實(shí)驗(yàn)法相比既節(jié)省了構(gòu)建文庫的費(fèi)用,又降低了序列拼接的難度,從而提高了單細(xì)胞測序的效率。
4.2.2 單細(xì)胞測序數(shù)據(jù)混合分析 細(xì)胞間的親緣關(guān)系越近,單細(xì)胞測序的數(shù)據(jù)混合分析就越可以顯著地提高樣品的平均覆蓋度。也可以將宏基因組數(shù)據(jù)與單細(xì)胞數(shù)據(jù)結(jié)合起來,既利于序列拼接,又利于建立單細(xì)胞和種群基因組之間的關(guān)聯(lián)。
4.2.3 生物信息學(xué)分析軟件 Velvet-SC是專門針對單細(xì)胞數(shù)據(jù)拼接而設(shè)計的傳統(tǒng)Velvet軟件的一個修正版。它引入了可變覆蓋度閾值的概念,利用迭代閾值的拼接方法,從“1”開始逐步遞增,在各個閾值下分別拼接并重新計算覆蓋度,減少低覆蓋度區(qū)域數(shù)據(jù)的丟失。Velvet-SC還可以與其他軟件(如EULER軟件)合并使用,或引入其他概念(如k-mers pairs)進(jìn)一步升級,都可以進(jìn)一步克服單細(xì)胞數(shù)據(jù)讀取中存在的覆蓋度不均和嵌合序列等問題,提高數(shù)據(jù)分析的精度和效率[19]。
單細(xì)胞測序技術(shù)的出現(xiàn)為生命體細(xì)胞生物學(xué)的研究提供了一個重要的手段。雖然受限于拼接軟件的匱乏和基因組擴(kuò)增技術(shù)的偏倚性,目前單細(xì)胞測序技術(shù)還不完善,但是毫無疑問,隨著生物信息學(xué)的快速發(fā)展和基因組擴(kuò)增方法的不斷進(jìn)步,這些問題將迎刃而解。