付春鵬
(山東省濰坊科技學(xué)院 262700)
基因是生命遺傳的基本單位。由數(shù)以億計(jì)的堿基對組成的基因組,蘊(yùn)藏了生命體遺傳信息的奧秘。對核酸序列進(jìn)行測序是正確解讀這部“天書”的基礎(chǔ),也是最為關(guān)鍵的一步。迄今,測序技術(shù)共經(jīng)歷了四代變革。20 世紀(jì) 70 年代出現(xiàn)了第一代經(jīng)典的Sanger測序技術(shù),人類基因組計(jì)劃的實(shí)施推動了邊合成邊測序的第二代測序技術(shù)的誕生及發(fā)展,近幾年分別以單分子和納米孔測序?yàn)闃?biāo)志的第三和第四代測序技術(shù)應(yīng)運(yùn)而生。其中第二、第三和第四代測序技術(shù)統(tǒng)稱為下一代測序(next generation sequencing,NGS)技術(shù)。本文概述了這些測序技術(shù)的基本原理及特點(diǎn)。
早在1954年,Whitfeld就已經(jīng)報(bào)道使用層析法測定了多聚核糖核苷酸的序列。第一代測序技術(shù)的標(biāo)志是Sanger 于1977 年發(fā)明的 DNA 雙脫氧核苷酸末端終止測序法,以及Maxam和Gilbert 于同年發(fā)明的DNA化學(xué)降解測序法[1]。其中,Sanger法的核心原理是:由于ddNTP的2′和3′都不含羥基,在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA合成反應(yīng)。在4個DNA合成反應(yīng)體系中分別加入一定比例帶有放射性同位素標(biāo)記的ddNTP(分別為:ddATP、ddCTP、ddGTP和ddTTP),通過凝膠電泳和放射自顯影后可以根據(jù)電泳帶的位置確定待測分子的DNA序列[2]。Sanger 測序技術(shù)操作快速、簡單,因此被廣泛應(yīng)用。20世紀(jì)80年代末,熒光標(biāo)記技術(shù)憑借著更加安全簡便的特性,逐步取代同位素標(biāo)記技術(shù),由此也誕生了自動化測序技術(shù)。由于可以用不同熒光標(biāo)記4種ddNTP,使得最后產(chǎn)物的電泳分離過程可以在一個泳道內(nèi)實(shí)現(xiàn),用激光對ddNTP上的熒光標(biāo)記進(jìn)行激發(fā),然后檢測不同波長的信號,通過計(jì)算機(jī)處理信號后即可獲得堿基序列,很好地解決了原技術(shù)中不同泳道遷移率存在差異的問題。自動化儀測序大大提高了測序效率,如ABI 3730 和 Amersham MegaBACE 測序儀分別可以在一次運(yùn)行中分析 96 個或 384 個樣本。第一代測序儀在人類基因組計(jì)劃 DNA 測序的后期階段起到了關(guān)鍵的作用,使人類基因組計(jì)劃比原計(jì)劃提前兩年完成。但第一代測序技術(shù)存在成本高、通量低、耗時(shí)長的缺點(diǎn),嚴(yán)重影響了其大規(guī)模應(yīng)用[3]。
目前最具代表性的第二代測序平臺包括:瑞士羅氏公司(Roche)的 454測序儀、美國 Illumina公司的Solexa基因組測序儀、美國 ABI 公司的SOLiD測序儀等。第二代測序技術(shù)的原理是邊合成邊測序,即依照第一代 Sanger 測序技術(shù)的原理,通過測序儀器捕捉新?lián)饺氲哪┒藷晒鈽?biāo)記來確定DNA 序列組成[4]。
Solexa 測序的核心技術(shù)是 DNA 簇和可逆終止化學(xué)反應(yīng)。測序前先將模板樣品DNA片段打碎形成100~200 bp的片段,然后在這些片段兩端加上特定的測序接頭。而Solexa高通量測序芯片表面附著一層單鏈引物,兩端連有接頭的單鏈 DNA 片段通過與芯片表面的引物堿基互補(bǔ)結(jié)合,經(jīng)PCR擴(kuò)增成為雙鏈。至此DNA 的一端就被錨定在測序芯片上,而另一端則隨機(jī)和附近的引物互補(bǔ)結(jié)合,從而也被固定住,形成“橋”式結(jié)構(gòu)。 這樣經(jīng)過反復(fù) 30 輪擴(kuò)增循環(huán)后,每個DNA片段得到約 1 000 倍擴(kuò)增,形成單克隆 DNA 簇。然后摻入經(jīng)過改造的 DNA 聚合酶和帶有 4 種熒光標(biāo)記的dNTP。 這些dNTP就是“可逆終止子”,其3′羥基端帶有可化學(xué)切割的部分,每個循環(huán)只允許摻入1個堿基,用激光掃描測序芯片表面,讀取聚合上去的相關(guān)核苷酸種類。隨后將這些核苷酸化學(xué)切割,恢復(fù)3′端黏性,繼續(xù)聚合下一個核苷酸。如此循環(huán),直至每條模板序列都被聚合成雙鏈。此過程中帶有熒光標(biāo)記的 dNTP能夠釋放出相應(yīng)的熒光,測序儀據(jù)此捕捉熒光信號,之后計(jì)算機(jī)可以將熒光信號轉(zhuǎn)化為不同顏色的測序峰圖,便可得知測序樣品的DNA序列。
較第一代測序技術(shù)而言,第二代測序技術(shù)的測量通量顯著提高,是目前市場上主流的測序技術(shù)。但邊合成邊測序的原理也為其帶來相應(yīng)不足之處,測序讀長較短和需要模板擴(kuò)增是兩個主要的弊端所在。第二代測序的讀長一般在700 bp左右,為后續(xù)的序列拼接、組裝及注釋等生物信息學(xué)分析帶來了較大困難;由于PCR反應(yīng)的靈敏性,導(dǎo)致擴(kuò)增前后得到的 DNA 分子片段的數(shù)目有較大偏差,因此在分析基因表達(dá)方面存在較大的弊端[5]。在此基礎(chǔ)上,無需擴(kuò)增、讀長更長的第三代測序技術(shù)便應(yīng)運(yùn)而生。
第三代測序技術(shù)基于單分子讀取技術(shù),不需要PCR擴(kuò)增,具有巨大的應(yīng)用前景?,F(xiàn)有的第三代測序平臺包括美國 Helicos Bioscience 公司的HeliScope遺傳分析系統(tǒng)和Pacific Biosciences公司的單分子實(shí)時(shí)測序系統(tǒng)(SMRT)。兩者均繼承了第二代測序技術(shù)的邊合成邊測序的原理,其中SMRT系統(tǒng)是基于零級波導(dǎo)(zero-mode waveguide, ZMW)的測序技術(shù)。ZMW是一種直徑50~100 nm、深約100 nm的孔狀納米光電結(jié)構(gòu),當(dāng)光線進(jìn)入后呈指數(shù)衰減,僅靠近基底的部分被照亮。DNA聚合酶被固定在ZMW底部,加入模版、引物和4色熒光標(biāo)記的dNTP后進(jìn)行DNA合成,只有參加反應(yīng)的dNTP 才能停留在ZMW底部,從而使dNTP的熒光信號被識別[6]。
第三代測序技術(shù)是計(jì)算機(jī)學(xué)、生物學(xué)、化學(xué)等多個學(xué)科領(lǐng)域研究相結(jié)合的結(jié)晶,功能非常強(qiáng)大。其顯著特點(diǎn)是單分子測序,即不經(jīng) PCR,可直接進(jìn)行邊合成邊測序。這不僅簡化了樣品處理過程,避免了擴(kuò)增可能引入的錯配,而且不受A、T、G、C 這4種堿基含量的影響,因此第三代測序技術(shù)能直接對RNA和甲基化DNA序列進(jìn)行測序。
第二、三代測序技術(shù)均是基于光信號的測序技術(shù),都需要昂貴的光學(xué)監(jiān)測系統(tǒng),并依賴 DNA 聚合酶讀取堿基序列,大大地增加了測序的成本。因此開發(fā)不使用生物化學(xué)試劑,直接讀取 DNA 序列信息的新型測序方法,就成為第四代測序技術(shù)的主要思想[7]。其中的代表當(dāng)屬納米孔測序,如英國Oxford Nanopore Technologies公司所開發(fā)的納米孔測序,是基于電信號的測序技術(shù)。它利用鑲嵌于脂質(zhì)雙分子層中的經(jīng)過基因工程改造過的α-溶血素蛋白作為納米孔道,孔內(nèi)共價(jià)結(jié)合有分子接頭。由于A、T、G、C這4 種堿基存在電荷差異,當(dāng)DNA堿基通過納米孔時(shí),從而短暫地影響流過納米孔的電流強(qiáng)度(4種堿基所影響的電流變化幅度各不相同),靈敏的電子設(shè)備檢測到這些變化從而鑒定所通過的堿基[4]。
雖然納米孔測序的優(yōu)點(diǎn)十分明顯,與前幾代技術(shù)相比在成本、速度方面有著很大優(yōu)勢。但是目前還處在起步階段,在關(guān)鍵環(huán)節(jié)(如納米孔的制造和 DNA 分子通過納米孔的速度控制方面)還有待改善。
縱觀基因組測序技術(shù)的發(fā)展歷程可以看出,從第一代到第四代測序技術(shù)無一例外地均以提高測序通量與讀長、降低測序成本、簡化測序步驟為目標(biāo)[8]。目前全基因組測序的費(fèi)用仍舊高昂,動輒幾百萬元的測序費(fèi)用絕非一般實(shí)驗(yàn)室所能承擔(dān)。千元基因組甚至百元基因組測序一直是科學(xué)家追求的目標(biāo)。另外,測序技術(shù)也決不僅僅涉及生物學(xué)問題,它綜合了物理學(xué)、光學(xué)、電學(xué)和材料學(xué)等多種學(xué)科的知識,相信隨著科學(xué)技術(shù)的發(fā)展,符合上述要求的新一代的測序儀將會出現(xiàn)。屆時(shí),人們對自身各個生化過程和疾病發(fā)生的分子機(jī)制等重大問題將會有更深刻細(xì)致的了解;對其他物種的生長發(fā)育、代謝調(diào)控、適應(yīng)環(huán)境和生殖遺傳等各種生物學(xué)過程將會有全新的認(rèn)識。