文路,湯富酬
北京大學(xué)生命科學(xué)學(xué)院生物動態(tài)光學(xué)成像中心,教育部細胞增殖與分化重點實驗室,北京 100871
單細胞轉(zhuǎn)錄組高通量測序分析新進展
文路,湯富酬
北京大學(xué)生命科學(xué)學(xué)院生物動態(tài)光學(xué)成像中心,教育部細胞增殖與分化重點實驗室,北京 100871
細胞異質(zhì)性是生物組織的普遍特征。常規(guī)轉(zhuǎn)錄組測序(RNA-Seq)技術(shù)需要上萬個細胞,所測結(jié)果實際上是一群細胞基因表達的平均值,所以難以鑒別細胞之間基因表達的異質(zhì)性。單細胞 RNA-Seq技術(shù)的分辨率精確至單個細胞,為辨別異質(zhì)性群體中各種細胞類型的轉(zhuǎn)錄組特征提供了有力的工具。近年來單細胞 RNA-Seq技術(shù)發(fā)展迅速,在方法學(xué)上包括cDNA擴增方法的多樣化、對靈敏度和技術(shù)噪聲的定量分析、淺覆蓋高通量單細胞RNA-Seq方法和原位RNA-Seq技術(shù)等;在技術(shù)應(yīng)用方面應(yīng)用范圍從早期胚胎發(fā)育擴大到組織器官發(fā)育、免疫和腫瘤等多個領(lǐng)域。文章對單細胞RNA-Seq在方法學(xué)和技術(shù)應(yīng)用兩方面的研究進展進行了詳細闡述。
單細胞分析;轉(zhuǎn)錄組;高通量測序;RNA-Seq;異質(zhì)性
自20世紀90年代以來,分子生物學(xué)技術(shù)的快速發(fā)展極大地提高了人們對轉(zhuǎn)錄組(Transcriptome)的分析能力,特別是隨著高通量測序技術(shù)的發(fā)展,轉(zhuǎn)錄組測序(RNA-Seq)分析已經(jīng)逐漸成為一種常用的實驗手段[1]。然而在過去的20多年中,人們對轉(zhuǎn)錄組的認識仍然局限在群體細胞水平。這主要是由于技術(shù)的限制:常規(guī)轉(zhuǎn)錄組分析方法至少需要上萬個細胞。通過這種群體細胞分析方法,所得到的實際上是一群細胞基因表達的平均值,主要反映該群細胞中數(shù)量占優(yōu)勢的細胞亞群的信息,而數(shù)量占劣勢的細胞亞群的轉(zhuǎn)錄組特征則在平均化過程中被稀釋。因此,常規(guī)轉(zhuǎn)錄組分析方法難以鑒別異質(zhì)性群體中各種細胞亞群的轉(zhuǎn)錄組特征。但是,細胞異質(zhì)性(Cell heterogeneity)卻是生物系統(tǒng)和生物組織的普遍特征[2]。例如,在胚胎發(fā)育過程中,干細胞通過不斷分裂分化產(chǎn)生各種特化細胞,其間還涉及許多過渡細胞類型;這些細胞類型互相交織鑲嵌,具有重要生物學(xué)意義的細胞類型(如干細胞)經(jīng)常只占少數(shù)。另外,看似同質(zhì)的細胞之間基因表達也可存在很大差異,這部分源自基因表達內(nèi)在的隨機性(Stochastic)特征,可對細胞表型產(chǎn)生影響[3]。為了剖析這些細胞異質(zhì)性,就有必要在單細胞水平進行基因表達分析。原位雜交和免疫組織化學(xué)方法能夠提供單細胞分辨率的基因表達信息,但是只能同時檢測少數(shù)基因。單細胞RNA-Seq技術(shù)能獲得單個細胞內(nèi)近萬個基因的表達信息,為辨別生物組織中各種細胞類型的轉(zhuǎn)錄組特征和全面揭示細胞之間基因表達的異質(zhì)性提供了有力的工具[4]。對單個細胞進行轉(zhuǎn)錄組分析,從 1990年 Brady等[5]報道的單細胞cDNA擴增方法開始,已有20多年的發(fā)展歷史。2009年Tang等[6]首次報道了基于高通量測序的單細胞RNA-Seq技術(shù)。隨著高通量測序的推廣和發(fā)展,單細胞RNA-Seq技術(shù)近兩年發(fā)展迅速。本文從方法學(xué)和技術(shù)應(yīng)用兩方面對單細胞RNA-Seq技術(shù)的最新研究進展進行闡述。
單細胞 RNA-Seq與基于大量細胞的常規(guī)RNA-Seq相比,主要不同之處在于需要解決極微量起始樣本量的問題。單個哺乳動物細胞內(nèi)的總RNA含量約為10 pg,其中mRNA約為0.1~0.5 pg,而目前高通量測序文庫需要至少數(shù)十納克DNA,因此單細胞RNA-Seq的文庫構(gòu)建過程需將起始核酸進行數(shù)十萬倍擴增[4]。如何避免核酸丟失和擴增偏差、提高技術(shù)的靈敏度和可重復(fù)性是單細胞RNA-Seq在方法學(xué)上首要解決的問題。另外,如何提高分析通量和節(jié)約成本,如何獲得細胞的位置信息,也是亟待解決的問題。針對這些問題,本文從 4個方面闡述目前單細胞 RNA-Seq方法學(xué)的進展:(1)單細胞RNA-Seq的 cDNA擴增方法;(2)單細胞 RNA-Seq的靈敏度與技術(shù)噪聲(Technical noise)分析;(3)淺覆蓋(Low-coverage)高通量單細胞RNA-Seq方法;(4)原位RNA-Seq技術(shù)。
1.1 單細胞RNA-Seq的cDNA擴增方法
cDNA擴增方法是單細胞 RNA-Seq技術(shù)的核心,需盡可能完全地捕獲起始樣本中的目標RNA。一些常規(guī) RNA-Seq方法如 Illumina TruSeq RNA Sample Prep試劑盒,在 cDNA擴增步驟之前將mRNA片段化,因而核酸丟失甚多。這些方法能夠分析少至100 ng總RNA(約相當于1萬個細胞),但難以對單個細胞進行分析。自Tang等[6]首次報道以來,近年又涌現(xiàn)出數(shù)種單細胞RNA-Seq的cDNA擴增方法,根據(jù)擴增步驟所采用的酶可分為PCR擴增(包括Brady/Tang方法[5,6]、Smart-Seq[7]、Smart-Seq2[8]、STRT-Seq[9]和SMA[10])、體外轉(zhuǎn)錄擴增(CEL-Seq[11])和Phi29聚合酶擴增(PMA[10])3類。其中,PCR擴增法根據(jù)第二鏈cDNA合成步驟所采用的方法又可分為末端加尾法、模板轉(zhuǎn)換法和隨機引物法。末端加尾法(Brady/Tang方法)采用末端脫氧核糖核酸轉(zhuǎn)移酶在第一鏈cDNA 的3′末端加上一連串脫氧核苷酸(A或G),然后用多聚互補寡核苷酸(T或C)引物合成第二鏈 cDNA。模板轉(zhuǎn)換法(包括 Smart-Seq、Smart-Seq2和STRT-Seq) 利用反轉(zhuǎn)錄酶的末端轉(zhuǎn)移酶和模板轉(zhuǎn)換活性合成第二鏈 cDNA。隨機引物法(SMA)采用隨機序列寡核苷酸引物合成第二鏈cDNA。這3種方法都在合成第二鏈cDNA的同時引入轉(zhuǎn)錄本5′端的錨定序列,從而與轉(zhuǎn)錄本 3′端的錨定序列(在合成第一鏈 cDNA時引入)成對,進而對cDNA進行PCR擴增。體外轉(zhuǎn)錄擴增法(CELSeq)不需要在合成第二鏈cDNA時引入錨定序列,其通過在合成第一鏈cDNA時引入RNA 聚合酶啟動子序列,進而利用體外轉(zhuǎn)錄反應(yīng)對cDNA進行擴增。這些方法更詳細的介紹可參考本實驗室最近的一篇綜述文獻[12],本文將著重討論這些方法的靈敏度和技術(shù)噪聲問題。
表1 單細胞RNA-Seq的分子捕獲效率
1.2 單細胞RNA-Seq的靈敏度與技術(shù)噪聲分析
靈敏度是指單細胞RNA-Seq捕獲單個細胞內(nèi)全部mRNA的比例。多個研究小組最近對其進行了定量分析[13~19]。在方法上主要通過摻入外源mRNA來判定:在單細胞裂解液中摻入已知數(shù)量的外源mRNA,比較外源mRNA所加入數(shù)量與所測得數(shù)量,即推斷出單細胞 RNA-Seq的分子捕獲效率(靈敏度)。總體而言,單細胞RNA-Seq的分子捕獲效率為10%~63%。通過微流控芯片(Microfluidic)建庫,效率要高于常規(guī)試管方法,這可能與微流控芯片方法能夠減少mRNA丟失有關(guān)。3個研究小組采用微流控芯片方法報道的分子捕獲效率為45%~63%[14~16],相比之下,另外 3個研究小組采用常規(guī)試管方法報道的分子捕獲效率為 10%~40%[17~19](表 1)。另外,從cDNA擴增方法來看,Brady/Tang方法[16]與Smart-Seq2[14,19]接近,二者要高于Smart-Seq[18]與CEL-Seq[17](表1)。
單細胞 RNA-Seq的技術(shù)噪聲是指單細胞RNA-Seq技術(shù)的系統(tǒng)誤差所導(dǎo)致的測量值的波動,主要通過對同一樣本或外源mRNA進行反復(fù)多次測量來判定。研究表明,單細胞RNA-Seq比大量細胞RNA-Seq的技術(shù)噪聲大,低豐度基因比高豐度基因的技術(shù)噪聲大。技術(shù)噪聲主要來源于cDNA擴增以及文庫構(gòu)建過程每個反應(yīng)步驟所產(chǎn)生的隨機性:當起始mRNA含量減少到一定程度時,文庫構(gòu)建過程的隨機性將出現(xiàn)指數(shù)放大,曲線基本符合泊松分布[13~17]。
如何提高單細胞RNA-Seq的靈敏度并降低其技術(shù)噪聲呢?首先,單細胞RNA-Seq的靈敏度與技術(shù)噪聲有內(nèi)在的聯(lián)系,通過優(yōu)化反轉(zhuǎn)錄與PCR擴增反應(yīng)效率能夠同時提高靈敏度和減少技術(shù)噪聲[8]。其次,采用獨特分子識別(Unique molecular identifications)策略降低PCR擴增中產(chǎn)生的偏差,也能夠減少部分技術(shù)噪聲[15]。最后,通過摻入外源異種mRNA作為參照,可以判定技術(shù)噪聲的邊緣,從而能夠更好地分辨出真實的信號[13]。
1.3 淺覆蓋高通量單細胞RNA-Seq方法
體內(nèi)單個細胞之間基因表達的異質(zhì)性來源于多個方面,為了進行清晰地解析和全面地認識需要同時分析大量單個細胞。如何提高構(gòu)建文庫的通量,并降低測序成本,是單細胞RNA-Seq技術(shù)面臨的實際問題。解決方案包括文獻介紹的高通量單細胞定量PCR方法[12],以及本文具體介紹的兩種淺覆蓋高通量單細胞RNA-Seq方法[20,21]。
方法一:采用Fluidigm公司的C1單細胞自動制備系統(tǒng),在微流控芯片中進行細胞裂解、反轉(zhuǎn)錄與cDNA擴增,并隨后采用Illumina的Nextera試劑盒利用轉(zhuǎn)座酶技術(shù)構(gòu)建測序文庫[14,20]。微流控芯片方法與轉(zhuǎn)座酶技術(shù)顯著提升了建庫通量,通過該方法,研究者一次最多可以構(gòu)建 96個單細胞的RNA-Seq測序文庫。同時,研究表明,對每個細胞進行 5萬條讀數(shù)的淺測序就可以對細胞類型進行鑒定[20]。需要指出的是,該淺測序方法雖然能夠區(qū)分譜系距離較遠的細胞類型,如胚胎干細胞與神經(jīng)細胞[20],但用于區(qū)分譜系距離近的細胞類型,如 I型與II型肺泡細胞,對每個細胞進行200~500萬條讀數(shù)的較淺測序應(yīng)該更加可靠[22]。
方法二:采用CEL-Seq文庫構(gòu)建方法,結(jié)合條碼法(Barcoding)實現(xiàn)高通量分析[11,21]。通過在反轉(zhuǎn)錄步驟給每個細胞加一段條碼序列,隨后將樣品混合在一個試管中進行第二鏈cDNA合成、體外轉(zhuǎn)錄擴增和接頭連接等步驟,該方法能夠同時構(gòu)建數(shù)百個單細胞的測序文庫。因為只對mRNA分子的3′末端進行測序分析,所以每個細胞只需進行數(shù)萬條讀數(shù)的淺測序。
1.4 原位RNA-Seq技術(shù)
目前的單細胞RNA-Seq方法都需要將細胞從組織中分離和裂解以獲取RNA,因而不可避免地丟失了細胞的位置信息。最近Church研究小組報道的熒光原位 RNA-Seq技術(shù)(Fluorescent in situ RNA sequencing, FISSEQ)向原位單細胞轉(zhuǎn)錄組分析邁出了重要一步[23]。該技術(shù)首先對固定于載玻片上的細胞進行反轉(zhuǎn)錄、cDNA環(huán)化與滾環(huán)擴增(Rolling-circle amplification, RCA)。在反應(yīng)過程中摻入丙烯胺脫氧尿苷三磷酸并通過交聯(lián)劑將擴增的cDNA固定于原位,從而使每個 RNA分子在原位形成直徑為200~400 nm的DNA擴增產(chǎn)物球。隨后通過Solid連接測序法對這些 DNA擴增產(chǎn)物球進行高通量測序分析。FISSEQ技術(shù)目前還存在許多尚待解決的問題,包括如何提高分子捕獲效率和如何去除核糖體RNA等,但與組織切片結(jié)合的特征使該技術(shù)有望為生物學(xué)研究與醫(yī)學(xué)臨床診斷的單細胞轉(zhuǎn)錄組分析打開新的大門。
最近還報道了能同時檢測多個目標基因的原位RNA檢測技術(shù)[24~26]。其中包括:(1)將原位RNA鎖式探針滾環(huán)擴增方法(Padlock-RCA)與 Solid連接測序法結(jié)合,報道能同時檢測 39個目標基因[24];(2)在單分子熒光原位雜交(Single molecular fluorescent in situ hybridization, smFISH)技術(shù)的基礎(chǔ)上進行熒光編碼和多輪雜交,能同時檢測12~32個目標基因[25,26]。雖然這些技術(shù)的基因檢測數(shù)目尚未達到組學(xué)水平,但它們的高靈敏性和高成熟度使其在原位單細胞基因表達分析方面占有一席之地。
此外還要提到的是一種原位轉(zhuǎn)錄組分析(Transcriptome in vivo analysis, TIVA)方法,其可非侵襲性地分離活體環(huán)境中單個靶細胞的mRNA用于轉(zhuǎn)錄組分析[27]。該方法利用細胞穿膜肽將生物素多聚尿苷轉(zhuǎn)運到活細胞內(nèi),后者能捕獲mRNA,但被光敏反義寡核苷酸封閉。這樣,盡管所有細胞內(nèi)都有生物素多聚尿苷,只有被激光照射后的細胞,其mRNA才能被捕獲。通過鏈霉親和素磁珠收集這些mRNA即能進行后續(xù)的單細胞RNA-Seq分析。TIVA方法將有助于對一些復(fù)雜組織(如腦組織)進行活體單細胞轉(zhuǎn)錄組分析。
單細胞RNA-Seq技術(shù)的應(yīng)用始于哺乳動物早期胚胎發(fā)育階段的轉(zhuǎn)錄組分析[6,28,29],近兩年隨著技術(shù)的不斷成熟,應(yīng)用范圍從早期胚胎發(fā)育[30,31]擴大到組織器官發(fā)育[20,22,32]、免疫系統(tǒng)[21,33,34]和腫瘤[7,35~37]等多個領(lǐng)域。除了這些研究報道,高通量單細胞定量PCR技術(shù)近年來也有不少優(yōu)秀的研究工作[38~43]。
2.1 早期胚胎發(fā)育
哺乳動物早期胚胎發(fā)育階段的細胞數(shù)量極為稀少,其轉(zhuǎn)錄組分析尤其需要單細胞RNA-Seq技術(shù)。近幾年,小鼠[6,28,29,44]和人類[30,31]胚胎早期發(fā)育階段的單細胞RNA-Seq分析被陸續(xù)報道。來自不同發(fā)育時期(卵細胞、受精卵、2-8細胞期、桑椹胚和囊胚)的單個胚胎細胞通過組成分分析(Principal component analysis)或無監(jiān)督聚類(Unsupervised clustering)等生物信息學(xué)分析方法可以正確地歸類,表明著床前胚胎細胞具有動態(tài)而規(guī)律的轉(zhuǎn)錄組變化[30,31]。細胞異質(zhì)性在囊胚期變得明顯,通過無監(jiān)督聚類分析,囊胚細胞可自動聚類形成滋養(yǎng)外胚層、上胚層和原始內(nèi)胚層3群細胞[30](圖1A);在桑椹胚期,不同細胞群的標記基因則共表達于同一胚胎細胞中[38]。在囊胚期之前,胚胎細胞之間的細胞異質(zhì)性盡管不顯著,卻已然顯現(xiàn)。例如,在桑椹胚期,內(nèi)層和外層細胞已可通過標記基因Sox2和Id2進行初步區(qū)分[38];甚至早在2至4細胞期,已有一些基因在卵裂球之間顯示出差異表達[44]。
2.2 組織器官發(fā)育
組織器官發(fā)育是單細胞RNA-Seq技術(shù)應(yīng)用的另一個重要領(lǐng)域。近年來陸續(xù)報道了多種組織器官(包括肺[22]、腦[20]、腎[32]、血液[41]和內(nèi)耳[40])發(fā)育過程中的單細胞轉(zhuǎn)錄組分析。研究表明,單細胞RNA-Seq能夠精細地分辨組織器官發(fā)育過程中包括過渡細胞類型在內(nèi)的各種細胞類型的轉(zhuǎn)錄組。這種強大的分析能力充分體現(xiàn)于Quake研究小組對小鼠肺泡發(fā)育研究中[22]。小鼠的氣道上皮細胞在 E16.5~E18.5 d開始分化,氣道遠端頂部形成囊泡,同時前體細胞分化為具有氣體交換功能的I型肺泡上皮細胞(AT1)和能夠分泌表面活性物質(zhì)的 II型肺泡上皮細胞(AT2)。研究小組通過對E18.5 d小鼠胚胎肺遠端組織的80個單細胞進行轉(zhuǎn)錄組分析,成功地鑒定出5個細胞亞群,其中包括 4個已知的分化細胞類型:AT1、AT2、纖毛上皮細胞和Clara細胞(圖1B)。第5個細胞亞群表現(xiàn)出 AT1和 AT2共同前體細胞的特征,其不僅同時表達AT1和AT2二者的標記基因,并且在組成分分析中定位于二者之間(圖 1B)。研究者發(fā)現(xiàn)了大量新的標記基因,包括 AT1中的 Hopx和 Vegfa、AT2中的 Egfl6和 Clara細胞中的 Krt15等。單細胞分辨率轉(zhuǎn)錄組圖譜的繪制必將有力推動各種組織器官的發(fā)育生物學(xué)研究。
圖1 單細胞RNA-Seq重建生物組織的細胞譜系囊胚早期胚胎發(fā)育(A)和肺泡組織器官發(fā)育(B)的單細胞RNA-Seq分析。將囊胚和肺泡組織分散為單個細胞,然后構(gòu)建單細胞 RNA-Seq測序文庫并進行高通量測序檢測。采用包括無監(jiān)督聚類(A)和組成分分析(B)在內(nèi)的生物信息學(xué)方法進行數(shù)據(jù)分析,這些單細胞將自動聚類形成具有譜系結(jié)構(gòu)的細胞群,每個細胞群對應(yīng)一種細胞類型。這種單細胞RNA-Seq分析策略可以在單細胞水平重建生物組織的細胞譜系并獲得其中各種細胞類型的轉(zhuǎn)錄組信息[22,30]。EPI:上胚層細胞;TE:滋養(yǎng)外胚層細胞;PE:原始內(nèi)胚層細胞;Clara:Clara細胞;Ciliated:纖毛細胞;AT1:I型肺泡細胞;AT2:II型肺泡細胞;BP:雙向分化潛能前體細胞。
2.3 免疫系統(tǒng)
隨著高通量方法的發(fā)展,單細胞RNA-Seq技術(shù)近年來開始被應(yīng)用于免疫系統(tǒng)和腫瘤的研究。免疫細胞對抗原物質(zhì)的應(yīng)答反應(yīng)具有復(fù)雜和不均一性的異質(zhì)性特點,單細胞RNA-Seq分析有望在此方面揭示前所未知的豐富信息。Shalek等[33,34]對脂多糖誘導(dǎo)的樹突狀細胞應(yīng)答反應(yīng)進行了系列的單細胞RNA-Seq研究:首先通過對18個樹突狀細胞進行分析,發(fā)現(xiàn)細胞成熟狀態(tài)和基因表達的隨機性特征是應(yīng)答反應(yīng)異質(zhì)性的兩個重要來源[33];隨后采用淺覆蓋高通量單細胞RNA-Seq對1700多個樹突狀細胞進行分析,進一步揭示出細胞應(yīng)答反應(yīng)的旁分泌機制[34]。Shalek等證明,樹突狀細胞群中的少部分細胞在病原體刺激早期(1~2 h)即出現(xiàn)一組所謂“核心”抗病毒基因的轉(zhuǎn)錄激活,這少部分細胞通過干擾素介導(dǎo)的旁分泌信號激活了該組基因在其余細胞中的表達;而另一方面,旁分泌機制在病原體刺激后期(2~4 h)又參與了對另一組炎癥因子的轉(zhuǎn)錄抑制。Shalek等將單個樹突狀細胞隔離于微流控芯片小孔中,或者用藥物抑制旁分泌,都能夠抑制“核心”抗病毒基因組的轉(zhuǎn)錄激活和炎癥因子組的轉(zhuǎn)錄抑制[34]。該研究所揭示的旁分泌機制可能是免疫系統(tǒng)增強病原體敏感性的一種有效策略。
2.4 腫瘤
細胞異質(zhì)性是腫瘤的重要特征,可分為基因型和表型兩個方面?;蛐彤愘|(zhì)性是指同一腫瘤內(nèi)部存在具有不同基因型的腫瘤細胞,而表型異質(zhì)性是指同一腫瘤內(nèi)部存在具有不同基因表達譜和功能特征的腫瘤細胞。最近報道的兩篇腫瘤組織單細胞轉(zhuǎn)錄組分析充分展現(xiàn)了腫瘤細胞表型異質(zhì)性的復(fù)雜性[35,39]。Dalerba等[39]通過單細胞定量 PCR技術(shù)發(fā)現(xiàn)結(jié)腸癌組織以及單個結(jié)腸癌干細胞形成的移植瘤組織中包含類似的多個分化細胞亞群,提示譜系分化是腫瘤細胞表型異質(zhì)性的一個重要來源。Patel等[29]則對5例腦膠質(zhì)母細胞瘤進行了數(shù)百個單細胞的RNA-Seq分析。他們的主要發(fā)現(xiàn)包括:(1)重要的腫瘤相關(guān)基因——如酪氨酸激酶受體家族基因(包括 EGFR和PDGFRA)——的表達水平和剪接形式在腫瘤細胞之間有明顯差異,這種異質(zhì)性可能是某些腫瘤對相應(yīng)基因藥物靶向治療耐藥的一個原因;(2)腫瘤細胞表型異質(zhì)性可能部分來自瘤內(nèi)微環(huán)境的不同,氧氣和血供減少可能導(dǎo)致細胞休眠,進而可能產(chǎn)生化療不敏感性;(3)體內(nèi)瘤細胞呈現(xiàn)從類干細胞到分化細胞狀態(tài)的連續(xù)變化,這與體外培養(yǎng)的瘤細胞明顯不同,提示體外培養(yǎng)環(huán)境下的腫瘤干細胞模型只反映了某種特殊的細胞狀態(tài),而非體內(nèi)腫瘤的全部細胞狀態(tài);(4)每個膠質(zhì)母細胞瘤雖被歸為某一亞型,但實際都以不同比例包含每種亞型的腫瘤細胞;(5)異質(zhì)性高的腫瘤類型預(yù)后較差。Patel等的研究表明膠質(zhì)母細胞瘤具有復(fù)雜的表型異質(zhì)性。鑒于數(shù)目占少數(shù)的細胞亞群或許是腫瘤復(fù)發(fā)的源泉,腫瘤治療可能需要關(guān)注所有的而不只是主要的細胞亞群。另外,最近還報道了黑色素瘤、前列腺癌和胰腺癌的循環(huán)腫瘤細胞(Circulating tumor cells, CTCs)的單細胞RNASeq分析[7,36,37]。循環(huán)腫瘤細胞是一種從腫瘤原發(fā)灶中脫落進入患者血液的腫瘤細胞,數(shù)量極為稀少,但與腫瘤的轉(zhuǎn)移和復(fù)發(fā)有著密切關(guān)系[45]。單細胞RNASeq為其轉(zhuǎn)錄組分析提供了工具。研究表明,循環(huán)腫瘤細胞的轉(zhuǎn)錄組與原發(fā)瘤接近,但是一些與 Wnt信號通路[37]、細胞周期和癌癥抗原有關(guān)的基因表達上調(diào)。研究者還發(fā)現(xiàn)了候選的生物標記物,有助于開發(fā)新的循環(huán)腫瘤細胞捕獲方法[7]。
2.5 其他
最后,單細胞RNA-Seq還被用于揭示更為基礎(chǔ)的細胞異質(zhì)性現(xiàn)象:單等位基因轉(zhuǎn)錄現(xiàn)象[19]。雙倍體細胞的每個基因座位上都有兩個等位基因;在群體細胞水平,通常兩個等位基因都被檢測到轉(zhuǎn)錄。最近 Deng等[19]發(fā)現(xiàn),在單細胞水平,存在著一種普遍的、動態(tài)和隨機的單等位基因轉(zhuǎn)錄現(xiàn)象。在每個單細胞中(包括胚胎干細胞和成熟細胞),大約12%~24%的常染色體基因是單等位基因轉(zhuǎn)錄的。鑒于這種轉(zhuǎn)錄方式呈現(xiàn)出一種動態(tài)和隨機的特點,其可能來于基因表達的隨機性特征。
近年來,單細胞RNA-Seq技術(shù)在多個方面迅速發(fā)展。首先,多種cDNA擴增方法的涌現(xiàn)和對靈敏度和技術(shù)噪聲的定量分析使其在技術(shù)類型和理論上更加完善;其次,淺覆蓋高通量單細胞RNA-Seq方法的發(fā)展和商品化為其廣泛應(yīng)用提供了良好基礎(chǔ);再次,原位RNA-Seq技術(shù)將單細胞轉(zhuǎn)錄組分析指向了更廣闊的應(yīng)用領(lǐng)域;最后,在早期胚胎發(fā)育、組織器官發(fā)育、免疫和腫瘤生物學(xué)方面的實踐應(yīng)用充分展示了該技術(shù)鑒定異質(zhì)性群體中各種細胞類型轉(zhuǎn)錄組的強大分析能力(圖1)。
隨著方法學(xué)的成熟,單細胞RNA-Seq技術(shù)在未來數(shù)年中將會得到更為廣泛的應(yīng)用??赡馨ㄈ缦聨讉€方面:(1)對各種組織器官的發(fā)育過程進行單細胞轉(zhuǎn)錄組分析,發(fā)現(xiàn)新的細胞類型和標記基因;(2)對神經(jīng)和免疫系統(tǒng)進行全面分析,揭示其細胞異質(zhì)性;(3)分析各種類型的腫瘤,揭示其細胞異質(zhì)性;(4)與迅速發(fā)展的基因組編輯技術(shù)結(jié)合,對復(fù)雜的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)進行單細胞分辨率分析[46]。單細胞RNA-Seq技術(shù)將逐漸應(yīng)用到醫(yī)學(xué)臨床實踐之中,對人類早期胚胎細胞[30,31]和循環(huán)腫瘤細胞[7,36]的開創(chuàng)性工作已經(jīng)指向了這種可能性。
[1] Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet, 2009, 10(1): 57–63.
[2] Kalisky T, Blainey P, Quake SR. Genomic analysis at the single-cell level. Annu Rev Genet, 2011, 45: 431–445.
[3] Huang S. Non-genetic heterogeneity of cells in development: more than just noise. Development, 2009, 136(23): 3853–3862.
[4] Tang F, Lao K, Surani MA. Development and applications of single-cell transcriptome analysis. Nat Methods, 2011, 8(Suppl.4): S6–S11.
[5] Brady G, Barbara M, Iscove NN. Representative in vitro cDNA amplification from individual hemopoietic cells and colonies. Methods Mol Cell Biol, 1990, 2: 17–25.
[6] Tang FC, Barbacioru C, Wang YZ, Nordman E, Lee C, Xu NL, Wang XH, Bodeau J, Tuch BB, Siddiqui A, Lao KQ, Surani MA. mRNA-Seq whole-transcriptome analysis of a single cell. Nat Methods, 2009, 6(5): 377–382.
[7] Ramsk?ld D, Luo SJ, Wang YC, Li RB, Deng QL, Faridani OR, Daniels GA, Khrebtukova I, Loring JF, Laurent LC, Schroth GP, Sandberg R. Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells. Nat Biotechnol, 2012, 30(8): 777–782.
[8] Picelli S, Bj?rklund AK, Faridani OR, Sagasser S, Winberg G, Sandberg R. Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nat Methods, 2013, 10(11): 1096–1098.
[9] Islam S, Kj?llquist U, Moliner A, Zajac P, Fan JB, L?nnerberg P, Linnarsson S. Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq. Genome Res, 2011, 21(7): 1160–1167.
[10] Pan XH, Durrett RE, Zhu HY, Tanaka Y, Li YM, Zi XY, Marjani SL, Euskirchen G, Ma C, LaMotte RH, Park IH, Snyder MP, Mason CE, Weissman SM. Two methods for full-length RNA sequencing for low quantities of cells and single cells. Proc Natl Acad Sci USA, 2013, 110(2): 594–599. [11] Hashimshony T, Wagner F, Sher N, Yanai I. CEL-Seq: single-cell RNA-Seq by multiplexed linear amplification. Cell Rep, 2012, 2(3): 666–673.
[12] 文路, 湯富酬. 單細胞轉(zhuǎn)錄組分析研究進展. 生命科學(xué), 2014, 26(3): 228–233.
[13] Brennecke P, Anders S, Kim JK, Ko?odziejczyk AA, Zhang XW, Proserpio V, Baying B, Benes V, Teichmann SA, Marioni JC, Heisler MG. Accounting for technical noise in single-cell RNA-seq experiments. Nat Methods, 2013, 10(11): 1093–1095.
[14] Wu AR, Neff NF, Kalisky T, Dalerba P, Treutlein B, Rothenberg ME, Mburu1 FM, Mantalas GL, Sim S, Clarke MF, Quake SR. Quantitative assessment of single-cell RNA-sequencing methods. Nat Methods, 2014, 11(1): 41–46.
[15] Islam S, Zeisel A, Joost S, La Manno G, Zajac P, Kasper M, L?nnerberg P, Linnarsson S. Quantitative single-cell RNA-seq with unique molecular identifiers. Nat Methods, 2014, 11(2): 163–166.
[16] Streets AM, Zhang XN, Cao C, Pang YH, Wu XL, Xiong L, Yang L, Fu YS, Zhao L, Tang FC, Huang YY. Microfluidic single-cell whole-transcriptome sequencing. Proc Natl Acad Sci USA, 2014, 111(19): 7048–7053.
[17] Grün D, Kester L, van Oudenaarden A. Validation of noise models for single-cell transcriptomics. Nat Methods, 2014, 11(6): 637–640.
[18] Marinov GK, Williams BA, McCue K, Schroth GP, Gertz J, Myers RM, Wold BJ. From single-cell to cell-pool transcriptomes: stochasticity in gene expression and RNA splicing. Genome Res, 2014, 24(3): 496–510.
[19] Deng QL, Ramsk?ld D, Reinius B, Sandberg R. Single-cell RNA-seq reveals dynamic, random monoallelic gene expression in mammalian cells. Science, 2014, 343(6167): 193–196.
[20] Pollen AA, Nowakowski TJ, Shuga J, Wang XH, Leyrat AA, Lui JH, Li NZ, Szpankowski L, Fowler B, Chen PL, Ramalingam N, Sun G, Thu M, Norris M, Lebofsky R, Toppani D, Kemp DW, Wong M, Clerkson B, Jones BN, Wu SQ, Knutsson L, Alvarado B, Wang J, Weaver LS, May AP, Jones RC, Unger MA, Kriegstein AR, West JA. Low-coverage single-cell mRNA sequencing reveals cellular heterogeneity and activated signaling pathways in developing cerebral cortex. Nat Biotechnol, 2014, 32(10): 1053–1058.
[21] Jaitin DA, Kenigsberg E, Keren-Shaul H, Elefant N, Paul F, Zaretsky I, Mildner A, Cohen N, Jung S, Tanay A, Amit I. Massively parallel single-cell RNA-seq for marker-free decomposition of tissues into cell types. Science, 2014, 343(6172): 776–779.
[22] Treutlein B, Brownfield DG, Wu AR, Neff NF, Mantalas GL, Espinoza FH, Desai TJ, Krasnow MA, Quake SR. Reconstructing lineage hierarchies of the distal lung epithelium using single-cell RNA-seq. Nature, 2014, 509(7500): 371–375.
[23] Lee JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC, Terry R, Jeanty SSF, Li C, Amamoto R, Peters DT, Turczyk BM, Marblestone AH, Inverso SA, Bernard A, Mali P, Rios X, Aach J, Church GM. Highly multiplexed subcellular RNA sequencing in situ. Science, 2014, 343(6177): 1360–1363.
[24] Ke RQ, Mignardi M, Pacureanu A, Svedlund J, Botling J, W?hlby C, Nilsson M. In situ sequencing for RNA analysis in preserved tissue and cells. Nat Methods, 2013, 10(9): 857–860.
[25] Lubeck E, Cai L. Single-cell systems biology by super-resolution imaging and combinatorial labeling. Nat Methods, 2012, 9(7): 743–748.
[26] Lubeck E, Coskun AF, Zhiyentayev T, Ahmad M, Cai L. Single-cell in situ RNA profiling by sequential hybridization. Nat Methods, 2014, 11(4): 360–361.
[27] Lovatt D, Ruble BK, Lee J, Dueck H, Kim TK, Fisher S, Francis C, Spaethling JM, Wolf JA, Grady MS, Ulyanova AV, Yeldel SB, Griepenburg JC, Buckley TP, Kim J, Sul JY, Dmochowski IJ, Eberwine J. Transcriptome in vivo analysis (TIVA) of spatially defined single cells in live tissue. Nat Methods, 2014, 11(2): 190–196.
[28] Tang FC, Barbacioru C, Bao SQ, Lee C, Nordman E, Wang XH, Lao KQ, Surani MA. Tracing the derivation of embryonic stem cells from the inner cell mass by single-cell RNA-Seq analysis. Cell Stem Cell, 2010,6(5): 468–478.
[29] Tang FC, Barbacioru C, Nordman E, Bao SQ, Lee C, Wang XH, Tuch BB, Heard E, Lao KQ, Surani MA.Deterministic and stochastic allele specific gene expression in single mouse blastomeres. PLoS ONE, 2011, 6(6): e21208.
[30] Yan LY, Yang MY, Guo HS, Yang L, Wu J, Li R, Liu P, Lian Y, Zheng XY, Yan J, Huang J, Li M, Wu XL, Wen L, Lao KQ, Li RQ, Qiao J, Tang FC. Single-cell RNA-Seq profiling of human preimplantation embryos and embryonic stem cells. Nat Struct Mol Biol, 2013, 20(9): 1131–1139.
[31] Xue ZG, Huang K, Cai CC, Cai LB, Jiang CY, Feng Y, Liu ZS, Zeng Q, Cheng LM, Sun YE, Liu JY, Horvath S, Fan GP. Genetic programs in human and mouse early embryos revealed by single-cell RNA sequencing. Nature, 2013, 500(7464): 593–597.
[32] Brunskill EW, Park JS, Chung E, Chen F, Magella B, Potter SS. Single cell dissection of early kidney development: multilineage priming. Development, 2014, 141(15): 3093–3101.
[33] Shalek AK, Satija R, Adiconis X, Gertner RS, Gaublomme JT, Raychowdhury R, Schwartz S, Yosef N, Malboeuf C, Lu DN, Trombetta JJ, Gennert D, Gnirke A, Goren A, Hacohen N, Levin JZ, Park H, Regev A. Single-cell transcriptomics reveals bimodality in expression and splicing in immune cells. Nature, 2013, 498(7453): 236–240.
[34] Shalek AK, Satija R, Shuga J, Trombetta JJ, Gennert D, Lu DN, Chen PL, Gertner RS, Gaublomme JT, Yosef N, Schwartz S, Fowler B, Weaver S, Wang J, Wang XH, Ding RH, Raychowdhury R, Friedman N, Hacohen N, Park H, May AP, Regev A. Single-cell RNA-seq reveals dynamic paracrine control of cellular variation. Nature, 2014, 510(7505): 363–369.
[35] Patel AP, Tirosh I, Trombetta JJ, Shalek AK, Gillespie SM, Wakimoto H, Cahill DP, Nahed BV, Curry WT, Martuza RL, Louis DN, Rozenblatt-Rosen O, Suvà ML, Regev A, Bernstein BE. Single-cell RNA-seq highlights intratumoral heterogeneity in primary glioblastoma. Science, 2014, 344(6190): 1396–1401.
[36] Cann GM, Gulzar ZG, Cooper S, Li RB, Luo SJ, Tat M, Stuart S, Schroth G, Srinivas S, Ronaghi M, Brooks JD, Talasaz AH. mRNA-Seq of single prostate cancer circulating tumor cells reveals recapitulation of gene expression and pathways found in prostate cancer. PLoS ONE, 2012, 7(11): e49144.
[37] Yu M, Ting DT, Stott SL, Wittner BS, Ozsolak F, Paul S, Ciciliano JC, Smas ME, Winokur D, Gilman AJ, Ulman1 MJ, Xega K, Contino K, Alagesan B, Brannigan BW, Milos PM, Ryan DP, Sequist LV, Bardeesy N, Ramaswamy S, Toner M, Maheswaran S, Haber DA. RNA sequencing of pancreatic circulating tumour cells implicates WNT signalling in metastasis. Nature, 2012, 487(7408): 510–513.
[38] Guo GJ, Huss M, Tong GQ, Wang CY, Li SL, Clarke ND, Robson P. Resolution of cell fate decisions revealed by single-cell gene expression analysis from zygote to blastocyst. Dev Cell, 2010, 18(4): 675–685.
[39] Dalerba P, Kalisky T, Sahoo D, Rajendran PS, Rothenberg ME, Leyrat AA, Sim S, Okamoto J, Johnston DM, Qian DL, Zabala M, Bueno J, Neff NF, Wang JB, Shelton AA, Visser B, Hisamori S, Shimono Y, van de Wetering M, Clevers H, Clarke MF, Quake SR. Single-cell dissection of transcriptional heterogeneity in human colon tumors. Nat Biotechnol, 2011, 29(12): 1120–1127.
[40] Durruthy-Durruthy R, Gottlieb A, Hartman BH, Waldhaus J, Laske RD, Altman R, Heller S. Reconstruction of the mouse otocyst and early neuroblast lineage at single-cell resolution. Cell, 2014, 157(4): 964–978.
[41] Guo GJ, Luc S, Marco E, Lin TW, Peng C, Kerenyi MA, Beyaz S, Kim W, Xu J, Das PP, Neff T, Zou KY, Yuan GC, Orkin SH. Mapping cellular hierarchy by single-cell analysis of the cell surface repertoire. Cell Stem Cell, 2013, 13(4): 492–505.
[42] Buganim Y, Faddah DA, Cheng AW, Itskovich E, Markoulaki S, Ganz K, Klemm SL, van Oudenaarden A, Jaenisch R. Single-cell expression analyses during cellular reprogramming reveal an early stochastic and a late hierarchic phase. Cell, 2012, 150(6): 1209–1222.
[43] McDavid A, Dennis L, Danaher P, Finak G, Krouse M, Wang A, Webster P, Beechem J, Gottardo R. Modeling bi-modality improves characterization of cell cycle on gene expression in single cells. PLoS Comput Biol, 2014, 10(7): e1003696.
[44] Biase F, Cao XY, Zhong S. Cell fate inclination within 2-cell and 4-cell mouse embryos revealed by single-cell RNA sequencing. Genome Res, 2014, doi: 10.1101/gr. 177725.114. [Epub ahead of print]
[45] Alix-Panabières C, Schwarzenbach H, Pantel K. Circulating tumor cells and circulating tumor DNA. Annu Rev Med, 2012, 63: 199–215.
[46] Wen L, Tang FC. Reconstructing complex tissues from single-cell analyses. Cell, 2014, 157(4): 771–773.
(責(zé)任編委:方向東)
Recent progress in single-cell RNA-Seq analysis
Lu Wen, Fuchou Tang
Biodynamic Optical Imaging Center, College of Life Sciences, Ministry of Education Key Laboratory of Cell Proliferation and Differentiation, Peking University, Beijing 100871, China
Cell heterogeneity is a general feature of biological tissues. Standard transcriptome analysis approaches require tens of thousands of cells to provide an average view of gene expression and ignore the information of gene expression heterogeneity. The single-cell RNA-Seq technologies profile gene expression at the single-cell level and serve as powerful tools to identify distinct phenotypic cell types within a heterogeneous population. The single-cell RNA-Seq technologies have been developed rapidly in recent years. The methodological progress includes a variety of cDNA amplification methods, the quantitative analysis of the sensitivity and noise of the technologies, and the development of the low-coverage high-throughput single-cell RNA-Seq and the in situ RNA-Seq technologies. Furthermore, the scope of application is extended from early embryonic development to tissue and organ development, immunology and oncology. In this review, we discuss recent progress in methodology and applications of the single-cell RNA-Seq technologies.
single-cell analysis; transcriptome; high-throughput sequencing; RNA-Seq; cell heterogeneity
2014-08-27;
2014-09-17
國家自然科學(xué)基金項目(編號:31271543)資助
文路,博士,助理研究員,研究方向:單細胞分析,基因組學(xué)。E-mail: wenlu.wl@gmail.com
10.3724/SP.J.1005.2014.1069
時間: 2014-10-8 10:02:13
URL: http://www.cnki.net/kcms/detail/11.1913.R.20141008.1002.001.html