張擁軍
高通量測(cè)序技術(shù)在臨床病毒學(xué)領(lǐng)域的應(yīng)用
張擁軍
本文總結(jié)了近幾年高通量測(cè)序平臺(tái)的發(fā)展現(xiàn)狀,比較了不同測(cè)序平臺(tái)的性能及特點(diǎn)。同時(shí)還對(duì)目前高通量測(cè)序平臺(tái)在近兩年臨床病毒學(xué)領(lǐng)域的應(yīng)用,包括病原學(xué)診斷、分子流行病學(xué)、宏基因組學(xué)和臨床治療轉(zhuǎn)歸等幾個(gè)方面,逐一舉例進(jìn)行了闡述。籍此加深專業(yè)人員對(duì)高通量測(cè)序平臺(tái)的認(rèn)識(shí),促進(jìn)該技術(shù)在臨床病毒學(xué)的轉(zhuǎn)化與應(yīng)用。
高通量測(cè)序;宏基因組學(xué);病毒學(xué)
2004年454生命科學(xué)公司率先推出商品化的GS-20測(cè)序儀,宣告了高通量測(cè)序(NGS)時(shí)代的到來(lái)。經(jīng)過(guò)近10年的不斷更新,從技術(shù)層面看,各種NGS平臺(tái)日新月異,儀器試劑逐漸成熟,測(cè)序速度、讀長(zhǎng)及通量得到了大幅度提升,相對(duì)測(cè)序成本則急劇下降。在應(yīng)用方面,NGS技術(shù)愈來(lái)愈多地運(yùn)用于全基因組測(cè)序、宏基因組學(xué)(metagenomics)、轉(zhuǎn)錄組(transcriptome)測(cè)序、目標(biāo)序列再測(cè)序(resequencing)、從頭測(cè)序(denovosequencing)、染色體免疫共沉淀測(cè)序(ChIP-Seq)、外顯子組測(cè)序(exome sequencing)以及各種RNA測(cè)序等方面,已經(jīng)滲透到生命科學(xué)多種領(lǐng)域如臨床醫(yī)學(xué)、農(nóng)業(yè)、生態(tài)學(xué)、法醫(yī)、微生物學(xué)、癌癥研究等。本文擬簡(jiǎn)要介紹目前NGS平臺(tái)的發(fā)展現(xiàn)狀,并對(duì)近兩年NGS平臺(tái)在臨床病毒學(xué)方面的部分應(yīng)用進(jìn)行概述。
近10年里各種NGS平臺(tái)不斷推陳出新,按時(shí)間先后順序,主要出現(xiàn)了以下主流NGS平臺(tái)。首先,454生命科學(xué)公司于2004年開(kāi)始銷售基于焦磷酸測(cè)序的GS-20測(cè)序儀,首次實(shí)現(xiàn)了大規(guī)模并行測(cè)序,能夠同時(shí)測(cè)定約20萬(wàn)個(gè)片段,平均讀長(zhǎng)為110 bp。在被羅氏公司并購(gòu)之后,454公司又將GS-FLX、GS-Junior等機(jī)型推向市場(chǎng),平均讀長(zhǎng)達(dá)到700~1 000 bp; 2005年Solexa公司研制了基因組分析儀(Genome Analyzer),被 Illumina公司收購(gòu)后,又在此基礎(chǔ)上陸續(xù)發(fā)展出HiSeq2000、HiSeq2500、NextSeq500、MiSeq、HiSeq X Ten等系列測(cè)序儀,滿足了不同層次測(cè)序的需求,最大讀長(zhǎng)已經(jīng)能夠達(dá)到600 bp;2007年應(yīng)用生物系統(tǒng)公司(ABI)推出第一款SOLiD測(cè)序系統(tǒng);而生命技術(shù)公司( Life Technologies)收購(gòu)ABI之后,不僅接連推出了SOLiD3、SOLiD4、SOLiD5500等機(jī)型,還分別于2009年和2011年推出了商品化的Helicos測(cè)序儀和Ion Torrent個(gè)人基因組測(cè)序儀,近年又研制了通量更高的Ion Proton、Ion Chef測(cè)序儀;作為第三代單分子測(cè)序儀的代表,太平洋生物科學(xué)公司(Pacific Biosciences)于2011年推出了單分子實(shí)時(shí)測(cè)序儀PacBio-RS, 測(cè)序讀長(zhǎng)達(dá)到數(shù)千個(gè)堿基; 英國(guó)的Oxford Nanopore Technologies 公司則研制成功讀長(zhǎng)更長(zhǎng)的GridION、MinION 測(cè)序儀[1-3]。
不同于傳統(tǒng)的以毛細(xì)管電泳為基礎(chǔ)的第一代測(cè)序技術(shù),NGS平臺(tái)基本上采用邊合成邊測(cè)序(sequencing-by-synthesis, SBS)的策略,也無(wú)需預(yù)先知道測(cè)序模板的遺傳背景,就能夠同時(shí)完成數(shù)十萬(wàn)到數(shù)億個(gè)片段的測(cè)序,成為真正意義上的高通量。從測(cè)序原理上,454、Ion Torrent和SOLiD體系都采用乳液PCR制備樣品文庫(kù),每一個(gè)珠子結(jié)合一段DNA模板,并均勻分配到測(cè)序孔或者玻片,實(shí)現(xiàn)一個(gè)珠子對(duì)應(yīng)一個(gè)測(cè)序片段(read)。Illumina/Solexa技術(shù)則是先將測(cè)序文庫(kù)DNA變性,一端與固定在玻片上的寡核苷酸接頭結(jié)合,每個(gè)片段的另一端與玻片上的互補(bǔ)接頭結(jié)合,形成橋式結(jié)構(gòu),因此將這個(gè)在玻片進(jìn)行的模板擴(kuò)增稱為橋式PCR。從測(cè)序反應(yīng)來(lái)看,454體系采用焦磷酸測(cè)序,測(cè)序需要的酶和引物都在反應(yīng)孔中,每次加入1種未標(biāo)記的核苷酸,有堿基摻入時(shí),釋放出的焦磷酸鹽產(chǎn)生發(fā)光,逐一被光學(xué)攝像頭記錄下來(lái)。Ion Torrent平臺(tái)與454體系類似,只是檢測(cè)信號(hào)為堿基摻入時(shí)釋放的H離子,不需要光學(xué)設(shè)備記錄信號(hào),因此也稱半導(dǎo)體測(cè)序儀。該平臺(tái)先后提供了314、316和318芯片供用戶選擇,平均讀長(zhǎng)為100~400 bp。Illumina/Solexa體系的試劑包括引物、DNA聚合酶及4種不同標(biāo)記的可逆終止核苷酸。每摻入一個(gè)核苷酸,根據(jù)不同熒光顏色記錄下來(lái)。SOLiD體系采用的是連接反應(yīng)來(lái)完成測(cè)序。通過(guò)測(cè)序引物與接頭雜交,其5′端再與相鄰序列上雜交的寡核苷酸連接,不同熒光標(biāo)記的寡核苷酸混合物互相競(jìng)爭(zhēng)與引物的連接,每次摻入2個(gè)堿基。PacBio-RS 測(cè)序儀也是采取SBS策略,不同的是,其測(cè)序文庫(kù)模板不需要擴(kuò)增,實(shí)現(xiàn)了單分子實(shí)時(shí)測(cè)序。單鏈基因組DNA片段與帶發(fā)卡結(jié)構(gòu)的接頭連接,形成環(huán)狀分子,然后與固定在該儀器獨(dú)有的納米小孔——ZMW上的DNA聚合酶結(jié)合,通過(guò)記錄摻入核苷酸上不同熒光基團(tuán)達(dá)到測(cè)序的目的。PacBio-RS讀長(zhǎng)能夠達(dá)到20 kb以上,平均為5 kb。同樣,GridION和MinION體系也不涉及模板擴(kuò)增過(guò)程,屬于無(wú)標(biāo)記的單分子測(cè)序。當(dāng)單鏈DNA分子通過(guò)一種蛋白質(zhì)納米孔,鏈上每一個(gè)堿基產(chǎn)生的電信號(hào)依次被記錄下來(lái)。這種測(cè)序方法讀長(zhǎng)可以達(dá)到數(shù)萬(wàn)個(gè)堿基,是目前讀長(zhǎng)最長(zhǎng)的高通量測(cè)序方法[1-3]。
為了滿足一些小實(shí)驗(yàn)室的需求,并將NGS平臺(tái)運(yùn)用于臨床診斷市場(chǎng),這些公司還生產(chǎn)了一些通量較小的臺(tái)式NGS平臺(tái)。例如,2009年羅氏公司推出的GS Junior 測(cè)序儀,可以在10 h內(nèi)獲得35 Mb序列數(shù)據(jù),平均讀長(zhǎng)400 bp。2011年Illumina公司的MiSeq測(cè)序儀投放市場(chǎng),27 h可以得到1.5 Gb數(shù)據(jù),平均讀長(zhǎng)為150 bp。目前升級(jí)后的試劑盒能夠產(chǎn)生2千5百萬(wàn)個(gè)片段,每個(gè)片段可達(dá)2×300 bp的讀長(zhǎng),也就是一個(gè)反應(yīng)能夠得到共計(jì)15 Gb的序列。而同年生命技術(shù)公司推出的臺(tái)式NGS平臺(tái)Ion Torrent能夠在2 h內(nèi)獲得測(cè)序結(jié)果,至今仍然是測(cè)序時(shí)間最短的臺(tái)式NGS儀器。這些平臺(tái)由于單次運(yùn)行成本低,數(shù)小時(shí)內(nèi)可以獲取序列結(jié)果,特別適合一些小基因組和PCR產(chǎn)物的測(cè)序,具有臨床輔助診斷的潛力[1-3]。
以下對(duì)目前各種NGS平臺(tái)的一些性能特征進(jìn)行了簡(jiǎn)單比較,見(jiàn)表1 。
病毒作為一種古老的物種,廣泛存在于自然界,幾乎能夠在任何物種寄生,與人類健康息息相關(guān)。雖然大部分病毒感染沒(méi)有出現(xiàn)明顯的臨床癥狀,少數(shù)病毒能夠引起人類多種疾病,表現(xiàn)出包括發(fā)熱、腹瀉、出血、出疹、呼吸道癥狀、神經(jīng)系統(tǒng)癥狀等,甚至一些病毒感染與腫瘤的發(fā)生有關(guān)。隨著100多年來(lái)人們對(duì)病毒認(rèn)識(shí)的不斷深入以及生物技術(shù)的發(fā)展,人類逐漸積累了多種病毒性疾病的鑒別診斷能力,掌握了部分病毒的致病機(jī)制及流行規(guī)律,研制出一些病毒的特異性疫苗,并設(shè)計(jì)生產(chǎn)了各種抗病毒化學(xué)藥物,極大地降低了病毒性疾病的危害性。在NGS技術(shù)日漸成熟的過(guò)程中,全球科學(xué)家也在不斷嘗試將此技術(shù)及時(shí)轉(zhuǎn)化到病毒學(xué)研究中去,特別是在未知病原學(xué)診斷、已知病毒性疾病的分子流行病學(xué)、從基因組水平探討一些病毒的致病機(jī)理以及一些疾病的治療及預(yù)后方面,利用生物技術(shù)進(jìn)步促進(jìn)人類健康。
2.1 發(fā)現(xiàn)未知新病原 大多數(shù)病毒性疾病都有傳染性,能夠通過(guò)各種途徑或媒介傳播,因此無(wú)論是發(fā)達(dá)國(guó)家還是發(fā)展中國(guó)家,傳染病依然是威脅人類健康的因素之一。近30年來(lái)涌現(xiàn)的各類新發(fā)再發(fā)傳染病暴發(fā)事件中,相當(dāng)一部分與新病毒特別是RNA病毒的出現(xiàn)相關(guān)。傳統(tǒng)的鑒定未知新病毒的方法,包括病毒分離培養(yǎng)、血清學(xué)檢測(cè)、免疫電鏡等,都需要相當(dāng)長(zhǎng)的周期,而一些致病性病毒暫時(shí)還沒(méi)有合適的體外培養(yǎng)體系。NGS技術(shù)不依賴病原體遺傳背景和高通量的特點(diǎn),具有得天獨(dú)厚的優(yōu)勢(shì),尤其是能夠從未經(jīng)純培養(yǎng)的復(fù)雜樣品中,捕捉任何疑似病原體的蛛絲馬跡。因此近幾年一些新出現(xiàn)傳染病疫情的病因調(diào)查,時(shí)常出現(xiàn)NGS平臺(tái)的身影[4]。
首先,近幾年在以下一些重要新發(fā)病毒病的發(fā)現(xiàn)過(guò)程中,各種NGS平臺(tái)發(fā)揮了巨大作用。
1)新的蜱傳播Thogotovirus[5]2014年春,1名50多歲的美國(guó)堪薩斯州男性在戶外工作時(shí)被蜱叮咬,數(shù)日后發(fā)病,有惡心、發(fā)燒、疲勞、腹瀉等癥狀?;颊哐“鍦p少,白細(xì)胞減少,起初予以強(qiáng)力霉素治療,11天后死于多器官衰竭。美國(guó)CDC研究人員采用分子和血清學(xué)方法檢測(cè)10余種已知蜱相關(guān)病原體均為陰性。但用蝕斑減少中和試驗(yàn)測(cè)定前幾年新發(fā)現(xiàn)的Heartland病毒抗體時(shí)發(fā)現(xiàn)一種全新的病毒,經(jīng)電鏡觀察疑似為正粘病毒。隨后用ION TORRENT高通量測(cè)序平臺(tái),檢測(cè)到多個(gè)節(jié)段基因組序列,與Dhori病毒相似度達(dá)70%,由此建立特異的實(shí)時(shí)熒光RT-PCR檢方法,并在患者血樣中證實(shí)了相關(guān)片段的存在。因此認(rèn)為發(fā)現(xiàn)了一個(gè)正粘病毒科Thogotovirus病毒屬的新成員。
2)SFTS調(diào)查[6]嚴(yán)重發(fā)熱伴血小板減少綜合征 (SFTS)是2010年首先在中國(guó)中部和東北幾個(gè)省出現(xiàn)的一種新流行性疾病,曾經(jīng)通過(guò)傳統(tǒng)的毛細(xì)管測(cè)序方法證實(shí)其病原體為一種新的布尼亞病毒(SFTSV),主要經(jīng)蜱傳播。2012年秋,日本出現(xiàn)一例SFTS病例,患者死于多器官衰竭。研究人員進(jìn)行回顧性調(diào)查時(shí),將患者樣品進(jìn)行病毒分離培養(yǎng),培養(yǎng)上清采用MiSeq平臺(tái)測(cè)序,發(fā)現(xiàn)了多個(gè)與SFTSV同源的DNA序列片段。NGS測(cè)序結(jié)果為證實(shí)日本同樣存在SFTS病例提供了直接證據(jù)。
2)MERS冠狀病毒疫情[7]荷蘭研究人員2012年從1例60歲沙特急性肺炎轉(zhuǎn)腎衰的死亡病例痰液中,分離到1株未知冠狀病毒(HCoV-EMC)。通過(guò)454 GS-FLX 測(cè)序平臺(tái),得到病毒基因組約90%的序列。序列分析顯示該毒株與蝙蝠冠狀病毒HKU4和HKU5遺傳關(guān)系接近,為一種全新的beta冠狀病毒。該病毒臨床表現(xiàn)與2003年SARS相似,后來(lái)被命名為中東呼吸綜合征(MERS)冠狀病毒。2015年5月底MERS疫情在韓國(guó)暴發(fā),中國(guó)出現(xiàn)了首例來(lái)自韓國(guó)的輸入病例。中、韓兩國(guó)研究人員分別用ION TORRENT平臺(tái)和Illumina平臺(tái)測(cè)定病毒基因組序列,用于追溯病毒來(lái)源,經(jīng)初步分析該毒株與今年2-5月沙特流行毒株最接近[8]。至今(2015年6月12日)已經(jīng)累計(jì)有1 289例實(shí)驗(yàn)室確診MERS病例通報(bào)給WHO,至少455例死亡[9]
3)H7N7禽流感[10]最近一個(gè)意大利團(tuán)隊(duì)報(bào)道了一起人感染高致病性禽流感H7N7病毒的事件。2013年8-9月間,意大利幾個(gè)農(nóng)場(chǎng)出現(xiàn)了高致病性H7N7禽流感疫情,在處理疫情過(guò)程中,先后有3名工作人員出現(xiàn)不同程度的結(jié)膜炎。調(diào)查人員采集患者樣品,通過(guò)實(shí)時(shí)熒光PCR證實(shí)了H7N7病毒感染,并用Ion Torrent PGM平臺(tái)對(duì)一株病毒進(jìn)行了全基因組測(cè)序。HA和NA基因種系發(fā)生分析顯示,毒株與近3年歐洲野鳥(niǎo)及家禽中流行的低致病性H7毒株類似,而內(nèi)部基因序列則與該地區(qū)雞群流行的H7N7毒株高度相似,也表明此病毒由雞直接傳播到人。
除了以上新發(fā)病毒性傳染病,同樣,NGS平臺(tái)對(duì)一些常見(jiàn)病毒性感染病例,也能夠從背景復(fù)雜樣品中,更準(zhǔn)確地探索相關(guān)致病因子。
4)呼吸道感染調(diào)查[11]丹麥科學(xué)家為了調(diào)查兒童急性呼吸道病毒感染的病原體,采集了500份上/下呼吸道感染樣品,對(duì)其中92份樣品采用GS-FLX平臺(tái)測(cè)序,獲得4個(gè)完整病毒基因組,分別屬于人副流感病毒4型(HPIV4)的4a和4b亞型。根據(jù)測(cè)序結(jié)果,他們?cè)O(shè)計(jì)實(shí)時(shí)熒光RT-PCR引物,對(duì)所有樣品進(jìn)行篩查,發(fā)現(xiàn)HPIV4陽(yáng)性率為2.6%。而后他們還利用PacBio RS平臺(tái)對(duì)代表樣品進(jìn)行了測(cè)序,結(jié)果證明該平臺(tái)能夠用于復(fù)雜臨床樣品的病毒序列測(cè)定。
5)病毒性腦炎調(diào)查[12]能夠引起病毒性腦膜腦炎的病毒超過(guò)100種,包括HSV-1、流感病毒、腸道病毒以及一些蟲媒病毒等。由于涉及的病原種類繁多,只有少數(shù)病例被真正明確了實(shí)驗(yàn)室診斷。美國(guó)猶他大學(xué)醫(yī)學(xué)院嘗試用NGS技術(shù)調(diào)查一些腦炎病例中病毒類型。他們選擇了7例腦炎死亡病例的腦組織,提取RNA并用隨機(jī)引物進(jìn)行逆轉(zhuǎn)錄。在HiSeq 2000測(cè)序儀上,每一例患者和正常對(duì)照樣品均得到50~90 M讀長(zhǎng)為50 bp 的片段。在排除人體組織片段以后,7例患者腦組織里發(fā)現(xiàn)有36個(gè)片段與病毒有關(guān),分別涉及以下病毒科:皰疹病毒科(17)、副粘病毒科 (10)、痘病毒科 (6)、戊肝病毒科 (2)和 黃病毒科(1)。但序列拼接以后7例患者樣品只有5例存在66~4 019 bp的片段。經(jīng)過(guò)傳統(tǒng)PCR擴(kuò)增及毛細(xì)管測(cè)序,證實(shí)2例為麻疹病毒,3例為HSV-1,另外2例未檢出致病病毒序列。上述結(jié)果證明深度測(cè)序能夠用于腦炎患者的病原體調(diào)查。
2.2 追蹤已知病原的變異及多樣性 分子流行病學(xué)是采用各種分子生物學(xué)手段,在分子或基因水平闡明疾病的病因及其相關(guān)的致病過(guò)程,并研究疾病的防治和促進(jìn)健康的策略和措施的科學(xué)。NGS技術(shù)應(yīng)用于病毒性疾病的分子流行病學(xué)研究,可以一次性完成一些基因組較大的病毒如皰疹病毒、冠狀病毒等的全基因組序列測(cè)定,也可以同時(shí)進(jìn)行數(shù)十個(gè)甚至上百個(gè)樣本中靶基因的擴(kuò)增子測(cè)序,還可以通過(guò)深度測(cè)序闡明病毒在疾病發(fā)展過(guò)程中如何進(jìn)化變異以及是否出現(xiàn)準(zhǔn)種等。要完成這些目標(biāo),依靠傳統(tǒng)的毛細(xì)管電泳測(cè)序,幾乎是不可能實(shí)現(xiàn)的,并且試劑和時(shí)間成本會(huì)高很多。
具有代表性的典型應(yīng)用有:
1)2014年西非EBOV疫情[13]埃博拉病毒(EBOV)自1976年在非洲發(fā)現(xiàn),主要以非洲東部的散發(fā)病例為主。始于2014年2月的疫情,是首次出現(xiàn)在非洲西海岸幾個(gè)國(guó)家(塞拉利昂、幾內(nèi)亞、利比里亞、尼日利亞),也是迄今為止最大規(guī)模的埃博拉疫情。截至2014年8月31日,已經(jīng)報(bào)告3 685病例,死亡1 641例。哈佛大學(xué)、Broad研究所與塞拉利昂一家醫(yī)院合作,從5月底至6月中旬確診的78例EBOV感染病例中,采用高通量測(cè)序的手段,共獲得了99個(gè)完整的病毒基因組序列。他們的測(cè)序過(guò)程主要在HiSeq2500和PacBio-RS平臺(tái)完成。結(jié)果顯示,這次西非疫情毒株與以往EBOV基因組存在341個(gè)堿基變異,而塞拉利昂患者存在263個(gè)宿主間單個(gè)核苷酸變異(iSNV)。根據(jù)與以往暴發(fā)相關(guān)的20個(gè)毒株基因組進(jìn)行種系發(fā)生比較,表明2014年這些西非EBOV是近10年中從非洲中部傳播過(guò)來(lái)。同時(shí),這些毒株的遺傳相似性提示,此次暴發(fā)起因是接觸單一的EBOV天然宿主,隨后引起人與人的傳播蔓延。序列數(shù)據(jù)還顯示,塞拉利昂差不多同時(shí)傳入了兩種遺傳背景不同的EBOV,該發(fā)現(xiàn)與收集到的流行病學(xué)調(diào)查信息一致。
2)荷蘭H7N7人禽流感疫情[14]2003年2-5月,荷蘭發(fā)生高致病性禽流感H7N7病毒暴發(fā),9周內(nèi)波及255個(gè)養(yǎng)雞場(chǎng),導(dǎo)致近3千萬(wàn)只雞被撲殺。另外有89人被感染,1名獸醫(yī)死亡。調(diào)查人員起初用第一代測(cè)序技術(shù)觀察到死亡病例毒株存在 PB2-E627K和HA-K416R的突變。時(shí)隔幾年之后NGS技術(shù)成熟之時(shí),他們又利用Illumina公司的GAIIx和HiSeq 2000平臺(tái),對(duì)原始樣品進(jìn)行了深度測(cè)序。從原來(lái)養(yǎng)雞場(chǎng)幾份雞樣品中并未發(fā)現(xiàn)上述突變,但意外在禽樣品中發(fā)現(xiàn)流感病毒缺陷RNA片段,表明病毒在感染禽類過(guò)程中合成了缺損的干擾病毒。在幾份人樣品中,還發(fā)現(xiàn)PB2-E627K突變隨感染過(guò)程檢出頻率增高,強(qiáng)烈支持人類適應(yīng)標(biāo)志PB2-E627K是個(gè)體感染過(guò)程中逐漸形成的,減少人類暴露于禽流感病毒的機(jī)會(huì),對(duì)于降低病毒適應(yīng)人類是非常重要的。
3)乙型流感病毒基因組[15]自1980年代以來(lái),乙型流感病毒(IBV)同時(shí)存在兩種抗原性和遺傳背景不同譜系的毒株:B/Victoria/2/87-like和B/Yamagata/16/88-like。為了對(duì)大量乙型流感病毒進(jìn)行基因組測(cè)序并建立序列數(shù)據(jù)庫(kù),美國(guó)J. Craig Venter研究所(JCVI)建立了一套通用的基因組擴(kuò)增方法,以便測(cè)序、構(gòu)建疫苗和反向遺傳學(xué)研究。他們將擴(kuò)增產(chǎn)物在Ion Torrent PGM、HiSeq 2000、MiSeq以及454 (Roche)平臺(tái)進(jìn)行測(cè)序。經(jīng)過(guò)1 000多個(gè)IBV臨床樣品的測(cè)試,證明該方法靈敏、有效、不依賴序列,適用于NGS測(cè)序基因組診斷以及快速克隆反向遺傳學(xué)質(zhì)粒。
4)鼻咽癌中EBV基因組[16]雖然40年前就已經(jīng)知道未分化鼻咽癌(NPC)與EB病毒感染有關(guān),但迄今僅測(cè)定了10株EB病毒毒株全基因組序列。EBV基因組全長(zhǎng)近200 kb,若用第一代毛細(xì)管電泳測(cè)序,成本高、耗時(shí)長(zhǎng)。為了探索NPC樣品中EB病毒基因組變異及多樣性,香港大學(xué)團(tuán)隊(duì)首先在Miseq測(cè)序儀上測(cè)試了3株參比EBV序列,而后在此基礎(chǔ)上利用GA IIx平臺(tái)完成了來(lái)自患者病理切片的8株EBV基因組序列。與參比毒株比較,共發(fā)現(xiàn)1 736處變異(包括1 601個(gè)堿基替換、64處堿基插入、71處堿基刪除),編碼多種蛋白的基因出現(xiàn)歧義突變。以上結(jié)果說(shuō)明,從全基因組水平能夠發(fā)現(xiàn)NPC患者EBV基因組的序列多樣性,通過(guò)比較正常樣品和NPC樣品中EBV的基因組變異,有助于評(píng)價(jià)某些位點(diǎn)變異與NPC致病機(jī)制的聯(lián)系。
2.3 宏基因組學(xué)(病毒組) 宏基因組學(xué)是研究不同生態(tài)環(huán)境中所有微生物組成,遺傳結(jié)構(gòu)及群落功能的科學(xué)。近幾年有關(guān)人類宏基因組研究先后涉及皮膚、口腔、血液、糞便等,病毒宏基因組(viral metagenome)或者病毒組(virome)指的是人類、動(dòng)物、植物或者特定環(huán)境樣品中所有病毒的集合。人類病毒組包括引起人類急性/持續(xù)性或潛伏感染的病毒,以及諸如內(nèi)源性逆轉(zhuǎn)錄病毒之類的整合在人類基因組上面的病毒,開(kāi)展這類研究有助于揭示新病毒及其與已知未知疾病的聯(lián)系[17-19]。NGS平臺(tái)對(duì)于這類相對(duì)較小的基因組進(jìn)行深度測(cè)序,也不需要對(duì)每一個(gè)種類一一進(jìn)行分離培養(yǎng),具有與其它方法不過(guò)比擬的優(yōu)越性。
根據(jù)不同組織部位的宏基因組研究結(jié)果,健康人體組織存在的病毒很多屬于噬菌體,主要與人體胃腸道的正常菌群有關(guān)。除了噬菌體,不同組織中占優(yōu)勢(shì)的病毒種類也不一致。人體皮膚主要檢出過(guò)包括Merkel 細(xì)胞多瘤病毒(一種與皮膚癌有關(guān)的DNA病毒)在內(nèi)的一些多瘤病毒(HPyV6、7、9),以及多種β-和γ-人乳頭狀瘤病毒(HPV)和圓環(huán)病毒科(Circoviridae)的一些成員;呼吸道常見(jiàn)EB病毒和逆轉(zhuǎn)錄病毒;口腔和鼻咽部可以檢測(cè)到多種呼吸道病毒,如人呼吸道合胞病毒(RSV)、流感病毒和鼻病毒,健康兒童呼吸道樣品還發(fā)現(xiàn)腺病毒、小RNA病毒和冠狀病毒;健康人體糞便中檢出過(guò)單鏈RNA病毒、單鏈DNA病毒、雙鏈DNA病毒以及逆轉(zhuǎn)錄病毒等,包括多種病毒如anellovirus、picobirnavirus和parechovirus,而博卡病毒、C組和F組腺病毒、Aichi病毒、星狀病毒、輪狀病毒等則較少檢出。還有部分為植物病毒,可能與膳食來(lái)源有關(guān)。另外,70%的健康人血漿中可能有非致病性的anelloviruses,一些人皰疹病毒如EB病毒、CMV、HHV6、HHV7也經(jīng)常出現(xiàn)在血液中。疾病狀態(tài)下,血液中可能出現(xiàn)其它種類的病毒:如淋巴瘤或肉瘤 (EBV、HHV8), 腦炎 (HSV、CMV、EBV和HHV6), 消化道癥狀 (CMV、HHV6)[17-20]。
不同于上述橫斷面調(diào)查,美國(guó)賓州大學(xué)的研究團(tuán)隊(duì)[21]為了研究人類腸道中病毒組的進(jìn)化,在2.5年內(nèi)對(duì)一名健康人連續(xù)采樣16次,獲取了24份糞便樣品。通過(guò)Illumina公司 HiSeq2000平臺(tái)的深度宏基因組測(cè)序,得到560億病毒序列數(shù)據(jù),拼接后共有478個(gè)contigs,其中60個(gè)contigs能夠組裝成環(huán)狀,意味著得到了這些病毒全部環(huán)狀基因組。87%屬于未知病毒,13%屬于以下噬菌體科(Microviridae、Podoviridae、Myoviridae、Siphoviridae)。進(jìn)一步分析還發(fā)現(xiàn),其中80%基因組在2.5年中長(zhǎng)期穩(wěn)定存在。因此,他們認(rèn)為,人體腸道中病毒的多樣性來(lái)自兩個(gè)方面,少部分是廣泛存在的病毒組,其余是快速進(jìn)化的長(zhǎng)期病毒組成員。
2.4 指導(dǎo)臨床治療及轉(zhuǎn)歸 一些病毒感染機(jī)體之后,病毒和宿主之間的相互作用,會(huì)導(dǎo)致病毒基因組部分位點(diǎn)發(fā)生變異,以逃逸免疫系統(tǒng)對(duì)病毒的清除。而在機(jī)體接受抗病毒藥物治療的過(guò)程中,一些病毒可能在藥物作用靶位產(chǎn)生突變,從而對(duì)這類藥物具有耐藥性。甚至有的流行毒株,本身有可能就對(duì)部分藥物耐受。這些位點(diǎn)如果突變頻率不高,采用傳統(tǒng)的毛細(xì)管電泳測(cè)序很難捕捉到。只有覆蓋靶基因位點(diǎn)達(dá)數(shù)十倍甚至上百倍的深度測(cè)序,才能清晰展現(xiàn)突變位點(diǎn),為臨床治療提供及時(shí)有效的參考依據(jù)。目前這方面的應(yīng)用,主要集中在HIV、HCV感染患者的抗病毒治療方面。
1)長(zhǎng)期接受抗逆轉(zhuǎn)錄病毒藥物治療患者體內(nèi)的HIV整合 對(duì)于HIV感染患者,主要采用聯(lián)合抗逆轉(zhuǎn)錄病毒治療 (cART)來(lái)抑制病毒的復(fù)制,而患者體內(nèi)持續(xù)存在的被感染細(xì)胞是阻礙HIV感染治療的關(guān)鍵。為了探索HIV前病毒DNA 在人類基因組的整合位點(diǎn),美國(guó)國(guó)家癌癥研究所(NCI)的科學(xué)家[22]對(duì)5名長(zhǎng)期(7.2~14.5年)接受cART 治療的HIV感染者進(jìn)行了觀察。通過(guò)提取患者外周血單核細(xì)胞 (PBMCs) 或 CD4+T細(xì)胞的DNA,在MiSeq平臺(tái)測(cè)定患者基因組DNA中病毒/宿主序列的連接點(diǎn)和突破點(diǎn)。他們發(fā)現(xiàn)患者治療前及剛參加cART 的時(shí)刻,體內(nèi)存在多個(gè)病毒群體;而經(jīng)過(guò)長(zhǎng)時(shí)間的cART 治療(平均11.7年)之后,無(wú)論在DNA水平還是在RNA水平,都出現(xiàn)相同的病毒序列。5名患者中,累計(jì)發(fā)現(xiàn)的整合位點(diǎn)涉及985個(gè)不同基因。以上結(jié)果說(shuō)明HIV的整合位點(diǎn)對(duì)于患者體內(nèi)感染細(xì)胞的克隆化擴(kuò)散以及持續(xù)存在發(fā)揮了重要作用。
2)復(fù)雜的HCV基因型[23]HCV分為7個(gè)基因型及67個(gè)亞型,不同基因型之間存在30% 核苷酸序列差異,不同亞型之間差異達(dá)20%。目前HCV感染的治療方案取決于基因型,因此準(zhǔn)確區(qū)分基因型至關(guān)重要。研究人員選擇了世界各地2 363例患者中,有12例INNO-LiPA分型屬于基因型2,而NS5B序列分型卻屬于基因型1的患者,首先對(duì)其中8例用傳統(tǒng)測(cè)序方法測(cè)病毒核心區(qū)序列證實(shí)為基因2型。然而,他們隨后利用MiSeq平臺(tái)測(cè)定病毒基因組序列發(fā)現(xiàn),這些病毒實(shí)際屬于重組基因型2/1。其中11株病毒重組區(qū)域發(fā)生在NS2/NS3交界處。這些患者對(duì)索非布韋/利巴韋林治療方案的應(yīng)答則類似于基因1型患者。
3)HCV耐藥性評(píng)估模型[24]為了計(jì)算藥物對(duì)病毒群體的作用以及群體對(duì)個(gè)體變異的抗性,研究人員選擇了HCV和干擾素抗性作為證據(jù)。他們選擇16名未接受過(guò)任何治療的基因1型慢性HCV患者,注射IFN-α 后48 h內(nèi)采血9次。然后擴(kuò)增病毒基因組E1/E2交界處包含HCV高變區(qū)1(HVR1)區(qū)域的309 nt片段,將PCR產(chǎn)物進(jìn)行GS FLX平臺(tái)測(cè)序,共測(cè)定 1.7 M片段,平均每個(gè)時(shí)間點(diǎn)有12 332個(gè)片段。根據(jù)出現(xiàn)變異的頻率變化及病毒群體滴度改變計(jì)算出干擾素抗性系數(shù),認(rèn)為病毒群體抗性在IFN-α2a/利巴韋林治療第12周和抗干擾素變異的出現(xiàn)高度相關(guān)。因此認(rèn)為,該方法能夠在短時(shí)間內(nèi)準(zhǔn)確評(píng)估因單純病毒滴度變化或者相對(duì)病毒變異頻率引起的藥物抗性。
綜上所述,經(jīng)過(guò)這10年的持續(xù)發(fā)展,NGS技術(shù)和實(shí)驗(yàn)體系日臻完善,在臨床病毒學(xué)的多個(gè)領(lǐng)域得到了應(yīng)用。盡管與10年前相比,測(cè)序成本下降了許多,但目前的NGS技術(shù)應(yīng)用還主要局限于研究階段,離大規(guī)模臨床應(yīng)用還有相當(dāng)遠(yuǎn)的距離。只有在進(jìn)一步降低實(shí)驗(yàn)成本的前提下,實(shí)驗(yàn)室技術(shù)人員建立起可行的標(biāo)準(zhǔn)化操作方案,生物信息學(xué)人員及時(shí)提供合理可靠的分析結(jié)果,讓臨床醫(yī)生能夠正確理解NGS數(shù)據(jù),并充分認(rèn)識(shí)到NGS技術(shù)為患者帶來(lái)的便利,NGS平臺(tái)才能真正進(jìn)入臨床,早日服務(wù)于需要的患者群體。
[1]van Dijk EL, Auger H, Jaszczyszyn Y, et al. Ten years of next-generation sequencing technology[J]. Trends Genet, 2014, 30(9): 418-426. DOI: 10.1016/j.tig.2014.07.001
[2]Quinones-Mateu ME, Avila S, Reyes-Teran G, et al. Deep sequencing: Becoming a critical tool in clinical virology[J]. J Clin Virol, 2014, 61(1): 9-19. DOI: 10.1016/j.jcv.2014.06.013
[3]Buermans HP, den Dunnen JT. Next generation sequencing technology: Advances and applications[J]. Biochim Biophys Acta, 2014, pii: S0925-4439(14)00180-X. DOI: 10.1016/j.bbadis.2014.06.015
[4]Chiu CY. Viral pathogen discovery[J]. Curr Opin Microbiol, 2013, 16(4): 468-478. DOI: 10.1016/j.mib.2013.05.001
[5]Kosoy OI, Lambert AJ, Hawkinson DJ, et al. NovelThogotovirusspecies associated with febrile illness and death, United States, 2014[J]. Emerg Infect Dis, 2015. DOI: 10.3201/eid2105.150150
[6]Takahashi T, Maeda K, Suzuki T, et al. The first identification and retrospective study of Severe Fever with Thrombocytopenia Syndrome in Japan[J]. J Infect Dis, 2014, 209(6): 816-827. DOI: 10.1093/infdis/jit603
[7]Zaki AM, van Boheemen S, Bestebroer TM, et al. Isolation of a novel coronavirus from a man with pneumonia in Saudi Arabia[J]. N Engl J Med, 2012, 367: 1814-1820. DOI: 10.1056/NEJMoa1211721
[8]virological.org. MERS coronavirus[EB/OL]. (2015-06-08)[2015-07-02].http://virological.org/t/preliminary-analysis-of-middle-east-respiratory-syndrome-coronavirus-mers-cov-sequences-from-korea-and-china/143
[9]World Health Organization. Middle East respiratory syndrome coronavirus (MERS-CoV)-Republic of Korea[EB/OL]. (2015-06-12)[2015-06-18]. http://www.who.int/csr/don/12-june-2015-mers-korea/en/
[10]Puzelli S, Rossini G, Facchini M, et al. Human infection with highly pathogenic A (H7N7) avian influenza virus, Italy, 2013[J]. Emerg Infect Dis, 2014. DOI: 10.3201/eid2010.140512
[11]Alquezar-Planas DE, Mourie T, Bruhn CAW, et al. Discovery of a divergent HPIV4 from respiratory secretions using second and third generation metagenomic sequencing[J]. Sci Rep, 2013, 2468, DOI: 10.1038/srep02468
[12]Chan BK, Wilson T, Fischer KF, et al. Deep sequencing to identify the causes of viral encephalitis[J]. PLoS One, 2014, 9(4): e93993. DOI: 10.1371/journal.pone.0093993
[13]Gire SK, Goba A, Andersen KG, et al. Genomic surveillance elucidates Ebola virus origin and transmission during the 2014 outbreak[J]. Science, 2014. DOI: 10.1126/science.1259657
[14]Jonges M, Welkers MR, Jeeninga RE, et al. Emergence of the virulence-associated PB2 E627K substitution in a fatal human case of highly pathogenic avian influenza virus A(H7N7) infection as determined by Illumina ultra-deep sequencing[J]. J Virol, 2014, 88(3): 1694-1702. DOI: 10.1128/JVI.02044-13
[15]Zhou B, Lin X, Wang W, et al. Universal influenza B virus genomic amplification facilitates sequencing, diagnostics, and reverse genetics[J]. J Clin Microbiol, 2014, 52(5): 1330-1337. DOI: 10.1128/JCM.03265-13[16]Kwok H, Wu CW, Palser AL, et al. Genomic diversity of epstein-barr virus genomes isolated from primary nasopharyngeal carcinoma biopsy samples[J]. J Virol, 2014, 88(18): 10662-10672. DOI: 10.1128/JVI.01665-14
[17]Hofer U. Viral evolution: Variation in the gut virome[J]. Nat Rev Microbiol, 2013, 11(9): 596. DOI: 10.1038/nrmicro3092
[18 ]Delwart E. A roadmap to the human virome[J]. PLoS Pathog, 2013, 9(2): e1003146. DOI: 10.1371/journal.ppat.1003146
[19]Lecuit M, Eloit M. The human virome: new tools and concepts[J]. Trends Microbiol, 2013, 21(10): 510-515. DOI: 10.1016/j.tim.2013.07.001
[20]Duerkop BA, Hooper LV. Resident viruses and their interactions with the immune system[J]. Nat Immunol, 2013, 14(7): 654-659. DOI: 10.1038/ni.2614
[21]Minot S, Bryson A, Chehoud C, et al. Rapid evolution of the human gut virome[J]. Proc Natl Acad Sci U S A, 2013, 110(30): 12450-12455. DOI: 10.1073/pnas.1300833110
[22]Maldarelli F, Wu X, Su L, et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells[J]. Science, 2014, 345(6193): 179-183. DOI: 10.1126/science.1254194
[23]Hedskog C, Doehle B, Chodavarapu K, et al. Characterization of hepatitis C virus inter-genotypic recombinant strains and associated virologic response to sofosbuvir/ribavirin[J]. Hepatology, 2014. DOI: 10.1002/hep.27361
[24]Campo DS, Skums P, Dimitrova Z, et al. Drug resistance of a viral population and its individual intrahost variants during the first 48 hours of therapy[J]. Clin Pharmacol Ther, 2014, 95(6): 627-635. DOI: 10.1038/clpt.2014.20
Applications of next generation sequencing technologies on clinical virology
ZHANG Yong-jun
(FujianCenterforDiseaseControlandPrevention,Fuzhou350001,China)
In this review, current status of several next generation sequencing (NGS) platforms in recent years were summarized, while features and characterization of each NGS platform were compared. Applications of NGS technologies in the field of clinical virology including etiological diagnosis, molecular epidemiology, metagenomics and progression of clinical treatment, etc., was illustrated. This review would facilitate comprehensive understanding of diverse NGS platforms for professionals, and promote the transformation and application of NGS technologies in clinical virology.
next generation sequencing; metagenomics; virology
10.3969/j.issn.1002-2694.2015.09.017
福建省疾病預(yù)防控制中心,福州 350001
R373
A
1002-2694(2015)09-0864-06
2015-02-13;
2015-07-20
中國(guó)人獸共患病學(xué)報(bào)2015年9期