陳陽,何琪楊
許多慢性病如心腦血管疾病、糖尿病、腫瘤或是慢性傳染病如艾滋病、病毒性肝炎均涉及多種基因的相互作用,檢測疾病和藥物治療過程中大量基因的表達變化,將為疾病的診斷和療效評價提供可靠的分子標志物。除了共性變化之外,疾病的發(fā)生和治療還具有明顯的個體差異,發(fā)展整合個體組學鑒定可能是揭示個體差異的重要途徑,斯坦福大學醫(yī)學院的 Michael Snyder 教授課題組首次報道了此方面的研究成果。使用基因芯片、蛋白質組學和代謝組學的方法,歷時兩年半跟蹤監(jiān)測了一名志愿者體內 4 萬余種基因以及蛋白質水平的分子變化,比臨床其他指標更早地發(fā)現(xiàn)了該志愿者已罹患糖尿病[1]。雖然基因表達的數(shù)據(jù)在疾病診斷和治療中起重要的作用,但由于不能對細胞內基因表達的數(shù)量進行準確定量,根據(jù)對照組樣本得到的相對量,不同實驗或不同實驗室均存在巨大的差異??杀刃圆钍乾F(xiàn)在基因表達研究中存在的最大障礙,限制了基因表達評價指標的臨床應用。近年來,美國 NanoString 公司研發(fā)的多基因表達計數(shù)系統(tǒng)(nCounter assay system,NAS)有可能克服上述難題。
NAS 技術誕生于 Leroy Hood 博士創(chuàng)立的系統(tǒng)生物學研究所。管理該研究所基因芯片實驗室的 Krassen Dimitrov首先提出了分子條形碼的概念,并進行了原理驗證。2008年,Nature Biotechnology 雜志上以封面故事的形式報道了他們的研究成果[2]。該技術可以直接定量同一個樣本中的800 種基因的表達量,無需 RNA 提取、逆轉錄以及 PCR擴增步驟,顯著提高了表達譜分析的準確度與靈敏度。此項革命性技術自 2008 年出現(xiàn)以來,已經被越來越多的研究者所使用。
NAS 技術利用分子條形碼及雙探針標志,對轉錄本進行特異性標定;通過影像化的數(shù)字計數(shù)準確量化樣本的表達量,實現(xiàn)高通量、自動化地直接測定多種基因的表達,在確保實驗準確性的同時,最大程度上減少了實驗操作可能產生的誤差。
NAS 技術的基本原理是使用了兩種探針——捕獲探針(capture probe)和報告探針(reporter probe)進行標定,它們各包含了一段長為 35 ~ 50 bp,能特異性地結合到同一種 mRNA 的序列,共同標記目標基因(圖 1)。捕獲探針、報告探針以及目標基因產物序列特異性結合后,形成探針/目標分子熒光復合物,一個復合物即代表一條 mRNA 分子,不同的基因序列以不同的熒光分子排列組合代表[2]。
報告探針是 NAS 的核心技術,其作用是顯示特定的基因。它由一段特異性結合序列、一段線性化的 M13 噬菌體DNA 和 4 組 15 bp 長的重復序列(5'-repeat)組成。線性化的 M13 噬菌體 DNA 上標記了 4 色 7 位的熒光編碼(分子條形碼),所選擇的熒光染料分別為 Alexa488、Alexa594、Alexa647 和 Cy3,每一個熒光編碼代表一種特定的基因。理論上,7 位的 4 色熒光最多可以編碼 16384(47)個基因。捕獲探針的作用是固定雜交后的復合物,除包含特異結合序列外,還有 2 組 15 bp 長的重復序列(3'-repeat),該序列的末端連接有生物素(biotin),可以與包被鏈親和素的樣品處理板(sample cartridge)結合。
在設計探針時,首先按照引物設計的一般原則為每一個目標基因選擇一段 100 bp 左右長度的互補序列,再將其分為兩個 50 bp 的序列,兩個序列都要滿足與非特異擴增序列的同源性應小于 85%,或少于連續(xù) 15 個的互補堿基時,才能夠作為捕獲探針和報告探針的特異性結合序列??蒲腥藛T已經建立了人和小鼠的基于目標基因、互補序列、分子條形碼的數(shù)據(jù)庫,并根據(jù)不同研究的需要,提供相關基因的檢測試劑盒。
NAS 的系統(tǒng)組成,包括樣品制備工作站(Prep Station)與數(shù)據(jù)分析儀(Digital Analyzer)兩個部分。其實驗流程包括雜交、純化固定、計數(shù) 3 個步驟[3]。
在實驗過程中,將提供的緩沖液、探針以及樣品混合,雜交過夜后,將樣品送進樣品制備工作站,工作站自動完成后續(xù)的工作。游離未雜交的報告探針和捕獲探針經過兩次磁珠篩選后去除,探針/目標分子復合物通過捕獲探針的3'-repeat 攜帶的生物素與包被有鏈親和素的樣品處理板相連后通電,電流會使探針/目標分子復合物朝同一方向延展。此時,報告探針的 5'-repeat 呈游離散亂狀態(tài),會干擾對分子條形碼的讀數(shù)。加入與 5'-repeat 互補的帶有生物素標記的寡核苷酸片段溶液,生物素與樣品板相連,5'-repeat 端也被固定在樣品板上。處理完成的樣品板比較穩(wěn)定,可以儲存。將處理好的樣品板放入數(shù)據(jù)分析儀進行信號數(shù)據(jù)采集,儀器會自動統(tǒng)計在樣品板表面的熒光編碼探針,并將其列表表示出來。
圖 1 NAS 檢測原理示意圖
在基因表達檢測技術發(fā)展過程中,Northern 雜交、RT-PCR 是第一代的技術,主要是檢測單基因表達的變化。第二代技術包括基因芯片和檢測少量基因表達的實時定量PCR 技術等。這些技術的特點是對基因表達的相對定量,數(shù)據(jù)必須與相應的對照組比較才能得到,這樣導致不同實驗之間,不同實驗室之間得到的數(shù)據(jù)差異大。雖然建立了一些統(tǒng)計規(guī)則和轉換方法,如以管家基因作為數(shù)據(jù)標準,比較和評價不同實驗室得到的基因芯片數(shù)據(jù)[4],但目前仍缺乏被所有研究者和臨床醫(yī)生所接受的方法和規(guī)則。
NAS 屬于第三代基因表達檢測技術,其檢測原理與基因芯片完全不同,以數(shù)字方式準確顯示樣品中的基因表達真實數(shù)量,高通量準確檢測。在控制儀器檢測精度和統(tǒng)一提供試劑盒的情況下,不用數(shù)據(jù)轉換,就能實現(xiàn)對某一疾病關鍵表達基因的定量比較。基于該技術,將來有可能像目前臨床血液的生化數(shù)據(jù)一樣,建立人類相關疾病基因表達量的參考值范圍。由于該技術沒有 RNA 提取或產物擴增步驟,極大地降低了檢測過程中發(fā)生差錯的幾率,減少數(shù)據(jù)誤差。NAS通用性強,能夠高度靈敏地檢測多種來源的樣品:如總RNA、細胞和組織裂解液、從石蠟包埋樣品提取的 RNA 以及血液樣品等。不過,該技術只能檢測已知的基因,配套試劑價格高昂,也有可能限制其推廣使用。
目前檢測基因表達或全基因組分析的技術層出不窮,如對新 RNA 的 RNA 測序技術,目前就有羅氏公司的 454技術、Illumina 公司 Solexa 技術以及 ABI 公司的 SOLiD技術[5]。除了進行個人基因組檢測外,還有寡核苷酸多態(tài)性(SNP)檢測以及從 10 ~ 20 個細胞中,低成本進行單體型分析的長片段讀數(shù)技術(long fragment read,LFR)[6]。由于疾病發(fā)生的復雜性和檢測成本等原因,從臨床實用角度看,NAS 技術最有可能在臨床推廣。
在 2008 年 NAS 技術的首次報道中,檢測了人肺癌A549 細胞野生型和骨髓灰質炎(poliovirus,PV)感染型的509 種基因,結果表明,NAS 檢測結果重復性高,與樣品濃度的相關性 r2達到 0.9988 以上,與 Taqman PCR 技術檢測結果的相關性 r2達到 0.945,準確性和檢出率均優(yōu)于基因芯片;檢測海膽胚胎相關基因表明 NAS 的靈敏度和準確度與 SYBR Green 實時 PCR 技術相當[2]。此后,不同實驗室的研究人員進一步驗證了 NAS 技術的可靠性。Malkov 等[7]檢測了新鮮凍存(fresh frozen,F(xiàn)F)、石蠟包埋(formalin fixed paraffin embedded,F(xiàn)FPE)以及組織粗提液(crude tissue lysates,CTL)樣品中 48 種基因的表達,并與 Taqman PCR 檢測結果相比較,證實 NAS 在多基因檢測中確實能獲得準確、高質量的數(shù)據(jù)。Reis 等[8]用 19 對口腔上皮癌組織和正常組織為實驗材料,分別用 NAS、實時定量 PCR 技術檢測了 FF 和 FFPE 樣品中 20 種mRNA 的表達,進一步證實在 FFPE 樣品 mRNA 質量不佳的情況下,NAS 甚至表現(xiàn)出比實時定量 PCR 更好的準確性。Sun 等[9]也在對乳腺癌細胞相關研究中證實,NAS 技術與 mRNA-seq 技術得到的結果具有很高的相關性。
NAS 除了能夠檢測 mRNA 外,又陸續(xù)實現(xiàn)了對miRNA 及 DNA 拷貝數(shù)變異的檢測分析。miRNA 是一類22 堿基左右的非編碼 RNA,能夠被整合到沉默復合體(RISC)中,使堿基互補的目標 mRNA 沉默或降解,以實現(xiàn)其調控作用,與生物正常的生長發(fā)育以及各種疾病的發(fā)生都有著密切的關系[10]。目前的檢測手段包括 Northern Blot 技術、芯片技術、基于 PCR 或滾環(huán)擴增(rolling circle amplification,RCA)的檢測等,這些技術很難同時滿足高靈敏度和高通量的需求。NAS 技術能夠高通量的檢測700 余種人和人-病毒 miRNA、600 余種小鼠 miRNA 和400 余種大鼠 miRNA 并進行圖譜分析,而其靈敏度和特異性更與 qPCR 相當。其原理如圖 2 所示,一段特殊的橋接寡核苷酸(bridge oligo)分別特異的結合目標 miRNA 和其對應的 miRtag,并使兩者共價連接,經過變性,miRNA:miRtag 復合物成為一條單鏈,這個復合物能夠和特定的捕獲探針、報告探針結合,并像普通的 mRNA 一樣被定量檢測[3]。
DNA 拷貝數(shù)變異(copy number variations,CNVs)指DNA 片段范圍從千堿基到兆堿基規(guī)模的缺失、插入、重復和多位點變異等亞微觀突變,現(xiàn)有的檢測技術包括 Real Time PCR、多重可擴增探針雜交技術(multiplex amplifiable probe hybridization,MAPH)、動態(tài)等位基因特異雜交(dynamic allele-specific hybridization,DASH)等,這些技術都不同程度上受到通量和準確性的限制[11]?;?NAS 技術的 CNVs 分析可以在單個反應中檢測最多 800 段 DNA區(qū)域,而準確度同樣與 qPCR 相當?;蚪M DNA 用 AluI限制性內切酶酶切、變性,使之形成單鏈 DNA,進而通過捕獲探針和報告探針對特定 DNA 片段進行計數(shù)。利用此技術,研究人員進行了 20 個 CNV 區(qū)域的分析,并將其結果與人類基因組單體型圖(HapMap)進行對比,準確率達到 94.2%。
由于該技術具有明顯的優(yōu)勢,可以預計在生物和醫(yī)學各領域中將得到廣泛的應用。美國許多著名的生物醫(yī)學研究機構均購置了該儀器,目前利用該儀器得到結果發(fā)表的研究論文大量增加。為了啟發(fā)研究和應用思路,我們在此介紹一些應用的實例。
在基因表達的研究領域中,研究人員通常采取的策略是使用基因芯片獲得高通量的基因表達譜后,再鎖定幾個基因用準確性更高的實時逆轉錄 PCR 進一步驗證。NAS 技術簡化了傳統(tǒng)基因表達的研究方法,使基因表達研究更加簡單。蛋白合成體(peroxisome)對天然免疫抗病毒機制過程中,線粒體蛋白 MAVS 起重要作用。使用 NAS 比較相關基因表達,同時用 9 個穩(wěn)定表達基因作為內部對照,更深入地闡明了其作用機制[12]。混合系白血病基因(mixed lineage leukemia,MLL)重排常見于急性淋巴細胞白血病,Orlovsky 等[13]發(fā)現(xiàn)通過下調與 MLL 基因關系密切的MEIS1 和 3 個 HOXA 家族相關基因,可以修復 MLL 重排并抑制腫瘤細胞的生長,通過 NAS 檢測到這 4 種基因并不會相互影響各自的表達,獨立地實現(xiàn)修復重排和抑瘤作用。
利用 NAS 技術和定量質譜測定法,分別對 5000 余種基因的 mRNA 和蛋白質進行量化的檢測,通過對 mRNA和蛋白質的豐度及周期變化的分析得出結論:與轉錄水平相比,翻譯水平在調控蛋白質含量上起更加主要的作用[14]。Delmore 等[15]發(fā)現(xiàn)通過干擾 BET 蛋白功能,可降低 Myc等重要癌基因的轉錄,運用 NAS 技術檢測 Myc 蛋白下游200 多個靶基因也呈現(xiàn)下調趨勢,并最終使細胞周期循環(huán)停滯并導致細胞凋亡。
表觀遺傳學主要研究與基因序列無關的遺傳變化,涉及組蛋白修飾和染色質重塑(chromatin remodeling),其調節(jié)機制異常與疾病的發(fā)生和治療密切相關[16]。Ram 等[17]將染色質免疫沉淀技術(chromatin immunoprecipitation,ChIP)和 NAS 技術相結合,稱之為“ChIP-string”,監(jiān)測染色質調控蛋白(chromatin regulators,CRs)與特定染色質區(qū)域相互結合的情況。研究人員通過該項技術對 30 種 CRs在染色質上的定位進行了檢測,分析表明這些調控因子以 6 種特異性組合的形式與染色質相結合,每個組合內都包括特定激活物和抑制物,共同實現(xiàn)對染色質活性的調控。Guttman等[18]利用 NAS 技術檢測分析了與蛋白質結合的 lincRNA,證實 lincRNA 能與特定蛋白質結合形成復合物,調控胚胎肝細胞的基因表達,進而影響肝細胞的多能性和發(fā)育。Lebedeva 等[19]在 RNA 結合蛋白 HuR 的研究中,利用NAS 技術及其他技術定位了 HuR 的結合位點在 3' 端非編碼區(qū),與 miRNA 結合位點臨近,并檢測了干擾 HuR 表達會影響許多蛋白在 mRNA 水平表達的變化。
多基因表達的檢測是臨床研究病因、診斷病情、評價治療效果以及實現(xiàn)個體化用藥的必要手段。臨床樣品量大、目標基因繁多,傳統(tǒng)的檢測技術會造成巨大的工作量。NAS 技術不僅能夠實現(xiàn)多基因檢測,且自動化程度高、操作簡單,已經逐步被研究人員用于臨床研究。Guiducci 等[20]通過NAS 技術分析臨床樣本相關免疫因子的表達,證實自身核苷酸對 Toll 樣受體的識別影響了糖皮質激素治療系統(tǒng)性紅斑狼瘡的效果。Lin 等[21]應用 NAS 技術分析臨床血液樣本,證實 TLR 在抗腫瘤免疫中起重要的作用。McNab 等[22]用 NAS 檢測結核患者血液樣本中不同細胞程序性死亡配體基因的表達,發(fā)現(xiàn)了與正常人相比中性粒細胞過表達程序性死亡配體基因。
藥物的有效性和安全性問題是臨床失敗的 2 大主要原因。2011 年 Nature 雜志公布的數(shù)據(jù)顯示,2008 – 2010 年期間美國申請 II 期臨床但失敗的藥物中,51% 的藥物是無效的,另外有 19% 的藥物存在安全性問題[23]。而在 2007 –2010 年 III 期臨床的藥物中,以上兩種原因導致失敗的比率分別達到了 66% 和 21%[24]。由此可見,加強藥物的早期評價,在臨床實驗之前盡可能地排除存在安全性問題和無效的候選藥物,不但有利于加速藥物研發(fā)過程,同時也降低了藥物研發(fā)的成本。計算機模型可以預測藥物可能引起的副作用,研究發(fā)現(xiàn)一個新的計算機模型識別出 656 種藥物的1241 個可能的副作用位點,其中 348 種在專有數(shù)據(jù)庫中獲得確認,而另外 151 種的副作用之前未被發(fā)現(xiàn),并通過進一步的實驗被證實[25]。而在藥物早期評價的實驗中,生物標志物的發(fā)現(xiàn)和評價顯得尤為重要[26]。在腫瘤研究中,通過對 NCI 60 種腫瘤標準細胞株和 639 種其他細胞系的綜合研究,揭示了基因組標志物在藥物敏感性中的指標意義[27]。NAS 技術為藥物實際研發(fā)中多位點的檢測提供了便捷的研究手段。去甲基化制劑 zebularine 對肝癌的治療有著顯著差別,Andersen 等[28]定位了 70 個基因以判斷是否適合用該藥物進行治療,并利用 NAS 技術檢測了 57 個臨床患者相關基因的表達,預測臨床愈后的準確率達到了84% ~ 96%。
由于 NAS 多基因表達計數(shù)技術能準確定量關鍵基因的表達程度,通過檢測干細胞分化基因的表達,可用于確定干細胞的質量。Bock 等[29]對 20 株胚胎干細胞、12 株誘導多能干細胞進行研究,證實細胞系基因組 DNA 甲基化和基因表達存在的微小差異決定了細胞株的分化傾向和分化能力。研究人員依此建立了一個評估多能干細胞有效性的評分系統(tǒng),使用該技術測定經過非定向分化培養(yǎng)的細胞系中500 余種 mRNA 表達量,從而獲知該多能干細胞分化成不同細胞系的傾向。
NAS 技術的出現(xiàn)使系統(tǒng)生物學的研究結果更接近于臨床應用,為疾病的診斷和治療提供可靠、實用的分子標記物。但目前 NAS 技術所使用的配套試劑十分昂貴,且必須向NanoString 公司訂購,如果在臨床檢驗中使用費用昂貴。根據(jù) NAS 技術的原理,發(fā)展類似的檢測儀器和整套檢測試劑值得國家和相關研究單位重視。
[1] Chen R, Mias GI, Li-Pook-Than J, et al. Personal omics profiling reveals dynamic molecular and medical phenotypes. Cell, 2012,148(6):1293-1307.
[2] Geiss GK, Bumgarner RE, Birditt B, et al. Direct multiplexed measurement of gene expression with color-coded probe pairs. Nat Biotechnol, 2008, 26(3):317-325.
[3] Kulkarni MM. Digital multiplexed gene expression analysis using the NanoString nCounter system. Curr Protoc Mol Biol, 2011, Chapter 25:Unit25B.10.
[4] Lee PD, Sladek R, Greenwood CM, et al. Control genes and variability: absence of ubiquitous reference transcripts in diverse mammalian expression studies. Genome Res, 2002, 12(2):292-297.
[5] Chen G, Wang C, Shi T. Overview of available methods for diverse RNA-Seq data analyses. Sci China Life Sci, 2011, 54(12):1121-1128.[6] Peters BA, Kermani BG, Sparks AB, et al. Accurate whole-genome sequencing and haplotyping from 10 to 20 human cells. Nature, 2012,487(7406):190-195.
[7] Malkov VA, Serikawa KA, Balantac N, et al. Multiplexed measurements of gene signatures in different analytes using the Nanostring nCounter Assay System. BMC Res Notes, 2009, 2:80.
[8] Reis PP, Waldron L, Goswami RS, et al. mRNA transcript quantification in archival samples using multiplexed, color-coded probes. BMC Biotechnol, 2011, 11:46.
[9] Sun Z, Asmann YW, Kalari KR, et al. Integrated analysis of gene expression, CpG island methylation, and gene copy number in breast cancer cells by deep sequencing. PLoS One, 2011, 6(2):e17490.
[10] Bhayani MK, Calin GA, Lai SY. Functional relevance of miRNA sequences in human disease. Mutat Res, 2012, 731(1-2):14-19.
[11] Freeman JL, Perry GH, Feuk L, et al. Copy number variation: new insights in genome diversity. Genome Res, 2006, 16(8):949-961.
[12] Dixit E, Boulant S, Zhang Y, et al. Peroxisomes are signaling platforms for antiviral innate immunity. Cell, 2010, 141(4):668-681.
[13] Orlovsky K, Kalinkovich A, Rozovskaia T, et al. Down-regulation of homeobox genes MEIS1 and HOXA in MLL-rearranged acute leukemia impairs engraftment and reduces proliferation. Proc Natl Acad Sci U S A, 2011, 108(19):7956-7961.
[14] Schwanh?usser B, Busse D, Li N, et al. Global quantification of mammalian gene expression control. Nature, 2011, 473(7347):337-342.
[15] Delmore JE, Issa GC, Lemieux ME, et al. BET bromodomain inhibition as a therapeutic strategy to target c-Myc. Cell, 2011, 146(6):904-917.
[16] Dawson MA, Kouzarides T. Cancer epigenetics: from mechanism to therapy. Cell, 2012, 150(1):12-27.
[17] Ram O, Goren A, Amit I, et al. Combinatorial patterning of chromatin regulators uncovered by genome-wide location analysis in human cells. Cell, 2011, 147(7):1628-1639.
[18] Guttman M, Donaghey J, Carey BW, et al. lincRNAs act in the circuitry controlling pluripotency and differentiation. Nature, 2011,477(7364):295-300.
[19] Lebedeva S, Jens M, Theil K, et al. Transcriptome-wide analysis of regulatory interactions of the RNA-binding protein HuR. Mol Cell,2011, 43(3):340-352.
[20] Guiducci C, Gong M, Xu Z, et al. TLR recognition of self nucleic acids hampers glucocorticoid activity in lupus. Nature, 2010,465(7300):937-941.
[21] Lin Y, Zhang L, Cai AX, et al. Effective posttransplant antitumor immunity is associated with TLR-stimulating nucleic acid-immunoglobulin complexes in humans. J Clin Invest, 2011, 121(4):1574-1584.
[22] McNab FW, Berry MP, Graham CM, et al. Programmed death ligand 1 is over-expressed by neutrophils in the blood of patients with active tuberculosis. Eur J Immunol, 2011, 41(7):1941-1947.
[23] Arrowsmith J. Trial watch: phase II failures: 2008-2010. Nature Rev Drug Discov, 2011, 10 (5):328-329.
[24] Arrowsmith J. Trial watch: phase III and submission failures:2007-2010. Nat Rev Drug Discov, 2011, 10(2):87.
[25] Lounkine E, Keiser MJ, Whitebread S, et al. Large-scale prediction and testing of drug activity on side-effect targets. Nature, 2012,486(7403):361-367.
[26] Littman BH. An NIH National Center for Advancing Translational Sciences: is a focus on drug discovery the best option? Nat Rev Drug Discov, 2011, 10(6):471.
[27] Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature, 2012,483(7391):570-575.
[28] Andersen JB, Factor VM, Marquardt JU, et al. An integrated genomic and epigenomic approach predicts therapeutic response to zebularine in human liver cancer. Sci Transl Med, 2010, 2(54):54-77.
[29] Bock C, Kiskinis E, Verstappen G, et al. Reference maps of human ES and iPS cell variation enable high-throughput characterization of pluripotent cell lines. Cell, 2011, 144(3):439-452.