陳昕昶 張文宏
結(jié)核病是由結(jié)核分枝桿菌引起的傳染性疾病,其致死率、致殘率已超過艾滋病,高居全球第一。2016年,據(jù)估計全世界新發(fā)結(jié)核病患者約為1040萬例,約140萬例患者死于結(jié)核病。隨著測序技術(shù)的成熟、測序成本的降低、生物信息學(xué)的發(fā)展,全基因組測序技術(shù)已經(jīng)廣泛應(yīng)用于結(jié)核分枝桿菌的研究當(dāng)中。筆者對全基因組測序技術(shù)的研究方向及成果進(jìn)行回顧,提出其局限性,并展望其應(yīng)用前景。
傳統(tǒng)的分型方法主要有基于IS6110的限制性片段長度多態(tài)性(IS6110-based restriction fragment length polymorphism,IS6110-RFLP)、間隔區(qū)寡核苷酸分型(spoligotyping)、分枝桿菌多位點數(shù)目可變串聯(lián)重復(fù)序列分析(mycobacterial interspersed repetitive unit-variable number tandem repeats,MIRU-VNTR)等,這些分型方法廣泛應(yīng)用于鑒定結(jié)核分枝桿菌的傳播和暴發(fā)事件。但是這些方法所分析的基因組信息僅為全基因組的1%以下,信息量小、分辨率低,難以判斷細(xì)菌傳播的方向和過程[1]。全基因組測序可以鑒定菌株間的單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)差異,結(jié)核分枝桿菌自發(fā)突變率低且回復(fù)突變極少見,因此,可以通過SNP鑒定其傳播方向和傳播鏈。
在對加拿大溫哥華一次吸毒相關(guān)結(jié)核病暴發(fā)事件的調(diào)查中,研究者對全部41株菌株進(jìn)行了全基因組測序和MIRU-VNTR分型。MIRU-VNTR鑒定所有菌株為同一基因型,但是全基因組測序結(jié)果揭示這是由來源于共同祖先的、具有相同的MIRU-VNTR基因型的2個菌株引起的2次暴發(fā)。因此,全基因組測序可以鑒定傳播事件,彌補(bǔ)MIRU-VNTR分型方法分辨率低的不足,并且可以識別所謂的超級傳播者(super spreaders),即傳染性極強(qiáng)的個體,避免將他們的毒株傳染給其他人群[2]。
一項英國的回顧性研究在社區(qū)和家庭傳播的成簇菌株中發(fā)現(xiàn),遺傳距離大于5個SNP的患者之間都沒有流行病學(xué)聯(lián)系,因此,推斷遺傳距離大于5個SNP可以排除傳播[3]。隨后的研究也得到了相似的結(jié)論,但根據(jù)分析方法、地域特點等不同,排除傳播所用的SNP差異數(shù)閾值有所不同[4-5]。比如,一項研究收集了2007—2012年在英國牛津郡分離的所有可用的結(jié)核分枝桿菌,并對其進(jìn)行全基因組測序,根據(jù)SNP差異聚集成簇的菌株相差0~7個SNP,而無聯(lián)系的菌株間的SNP差異數(shù)的中位數(shù)為1106個SNP[6]。在中國上海的一項研究中,研究者收集了上海市疾病預(yù)防控制中心2009—2012年全部的耐多藥結(jié)核分枝桿菌菌株(multidrug-resistant MTB,MDR-MTB),發(fā)現(xiàn)MIRU-VNTR一致且具有流行病學(xué)聯(lián)系的菌株間最大相差12個SNP[7]。以上研究提示,對于流行病學(xué)上直接相關(guān)的菌株,基因組間SNP差異數(shù)應(yīng)該很少;距離較近的近期傳播,SNP差異數(shù)可能為0,仍然無法僅根據(jù)全基因組測序數(shù)據(jù)分辨?zhèn)鞑シ较騕8],要依靠流行病學(xué)調(diào)查提供確鑿的證據(jù);但是,當(dāng)SNP差異很多時,可以排除直接傳播。
微進(jìn)化的另一部分重要內(nèi)容是宿主體內(nèi)結(jié)核分枝桿菌菌株的多態(tài)性,這種多態(tài)性主要歸因于2個方面:一是混合感染,即宿主感染了2種不同菌株;二是結(jié)核分枝桿菌感染宿主后在其體內(nèi)發(fā)生的微進(jìn)化。分辨混合感染和微進(jìn)化的策略主要有以下幾種:一是同時感染的2種結(jié)核分枝桿菌的比例較為特殊,且其遺傳背景差異較大時,可以根據(jù)其差異SNP位點處堿基類型及其比例,將2種亞群分開[9];二是用現(xiàn)有SNP以最大似然法構(gòu)建進(jìn)化樹,可以發(fā)現(xiàn)該菌株出現(xiàn)在2個進(jìn)化過程或不同譜系中,即認(rèn)為是混合感染[2];三是根據(jù)SNP差異個數(shù),有研究定義同一例患者同時取痰液培養(yǎng)的多個菌株或者同一例患者先后多次取痰液培養(yǎng)的菌株之間SNP差異數(shù)不超過11個SNP即為微進(jìn)化,大于等于475個SNP即為混合感染[6]。這個策略也應(yīng)用于分辨復(fù)燃還是再感染。
結(jié)核分枝桿菌復(fù)合群(Mycobacteriumtuberculosiscomplex,MTBC)是通過一系列染色體缺失從一個共同的祖先菌株進(jìn)化而來的[10]。目前認(rèn)為,與MTBC 原始祖先菌株親緣關(guān)系最近的是一種僅在東非吉布提分離的平滑菌落菌株——坎納分枝桿菌(M.canettii)[11]。對M.canettii基因組進(jìn)行測序,發(fā)現(xiàn)比其他MTBC成員的基因組大10~115 kb,并且顯示出比所有其他MTBC菌株加起來更大的基因組多樣性和更多的SNP差異,且有很明顯的生物學(xué)特性上的差異[12]。
根據(jù)SNP的差異和缺失可以將結(jié)核分枝桿菌菌株分為幾個主要的譜系(lineage)。古代譜系包括lineage 1(Indo-Oceanic),主要分布在菲律賓和印度洋海岸線?,F(xiàn)代譜系中的lineage 2(East Asian),包括北京家族,主要分布在東亞、中亞和俄羅斯;lineage 3以印度和東非為中心;lineage 4(Euro-American)主要分布在歐洲、美洲、非洲和中東地區(qū)[13]。有研究將一個由220個結(jié)核分枝桿菌基因組序列構(gòu)建的系統(tǒng)發(fā)育樹與人類線粒體基因組的系統(tǒng)發(fā)育樹進(jìn)行比較,兩個進(jìn)化樹最深的分支進(jìn)化枝都是非洲起源的,這與人類和結(jié)核分枝桿菌都起源于非洲的觀點一致。同時發(fā)現(xiàn)MTBC大約在七萬年前出現(xiàn),伴隨著現(xiàn)代人類遷徙到非洲,并由于新石器時代人口密度的增加而擴(kuò)大。這一長期的共同進(jìn)化過程與MTBC所展示出高度適應(yīng)性是一致的[14]。
現(xiàn)有的耐藥分子檢測手段主要基于PCR、分子雜交技術(shù)等,已有多種商業(yè)化試劑盒,基本完成了利福平及異煙肼的耐藥診斷,敏感度及特異度可以達(dá)到90%以上[15],即耐多藥結(jié)核病(MDR-TB)的快速診斷基本得到了解決。但是,現(xiàn)有的分子診斷方法面臨以下幾個問題:一是隨著耐藥機(jī)制研究的深入,更多的耐藥相關(guān)突變不斷被發(fā)現(xiàn);二是診斷為MDR-TB后,沒有其他抗結(jié)核藥物的耐藥信息,導(dǎo)致在藥物敏感性試驗(簡稱“藥敏試驗”)結(jié)果回復(fù)前無法給予患者最佳的治療方案,或出現(xiàn)了不良反應(yīng)后無法根據(jù)耐藥情況調(diào)整方案[16]。
已知的耐藥突變位點不能解釋所有表型耐藥,科學(xué)家們想通過全基因組關(guān)聯(lián)性分析(genome-wide associated study,GWAS)研究SNP與表型之間的關(guān)系;2013年有2篇論文先后發(fā)表于NatureGenetics上。Farhat等[17]對116株菌株進(jìn)行全基因組測序,并對同一個系統(tǒng)發(fā)育樹內(nèi)的敏感菌株及耐藥菌株進(jìn)行GWAS,以排除種系發(fā)生相關(guān)的SNP,最終找到了39個可能與耐藥相關(guān)的基因區(qū)域,這些基因與細(xì)胞壁生物合成、藥物泵、轉(zhuǎn)錄調(diào)控及DNA修復(fù)有關(guān)。Zhang等[18]對來自中國的包括敏感株、耐多藥、廣泛耐藥的161株菌株進(jìn)行了全基因組測序及分析,發(fā)現(xiàn)了約121個與耐藥相關(guān)性很強(qiáng)的SNP,這些SNP可能會調(diào)控下游基因的表達(dá),影響小RNA的轉(zhuǎn)錄。但是以上2項研究所篩選出的SNP沒有重疊的部分。2015年,Walker等[19]共收集了3000多株臨床分離株進(jìn)行全基因組測序及GWAS,并沒有發(fā)現(xiàn)新的可靠的耐藥突變位點?,F(xiàn)在我們意識到,由于臨床菌株的遺傳背景差異很大、耐藥及進(jìn)化的機(jī)制遠(yuǎn)比預(yù)想的復(fù)雜,僅通過增加樣本量、利用表型與基因型的相關(guān)性分析很難找到可信的耐藥突變,需要開發(fā)新的策略和算法,這需要生物信息學(xué)家和微生物學(xué)家的共同努力。
隨后,全球多個團(tuán)隊利用體外誘導(dǎo)及全基因組測序的方法,在體外篩查出多個結(jié)核耐藥基因,如與吡嗪酰胺耐藥相關(guān)的rpsA和panD[20-21],與環(huán)絲氨酸耐藥相關(guān)的Rv0678和Rv1979c[22],與利奈唑胺耐藥相關(guān)的rrl和rplC[23]等,以上耐藥相關(guān)基因的診斷價值已經(jīng)在臨床分離菌株中得到了驗證[24-25]。
現(xiàn)有的全基因組測序方法仍然需要基于培養(yǎng)。有研究團(tuán)隊嘗試在早期培養(yǎng)物或者直接在痰液中進(jìn)行核酸的富集后測序,使得更快地獲得全基因組信息成為可能;但是由于操作繁瑣、價格高昂,近期內(nèi)無法推廣[26-27]。在英國等結(jié)核病低負(fù)擔(dān)的發(fā)達(dá)國家,已經(jīng)嘗試將全基因組測序作為結(jié)核病診斷及結(jié)核病耐藥診斷的常規(guī)實驗室項目納入臨床診治流程。2015年和2016年,2個英國團(tuán)隊分別在LancetRespiratoryMedicine、NatureCommunications上發(fā)文,他們用前瞻性隊列研究發(fā)現(xiàn)全基因組測序診斷耐藥平均需要6~10 d,而傳統(tǒng)方法需要14~32 d,證實了全基因組測序所需時間更短,且經(jīng)濟(jì)可行[28-29]。但是2017年同一團(tuán)隊再次發(fā)表研究結(jié)果,全基因組測序?qū)怂峥偭亢唾|(zhì)量要求很高,導(dǎo)致測序失敗率高于PCR和線性探針的傳統(tǒng)分子檢測手段,且由于分析流程繁瑣、數(shù)據(jù)量過大導(dǎo)致分析時間遠(yuǎn)長于預(yù)期,傳統(tǒng)方法與全基因組測序方法分別需要20和21 d。因此,與傳統(tǒng)診斷方法比較,全基因組測序可以更準(zhǔn)確地診斷物種及藥物敏感型別,但是并沒有縮短檢出時間[30]。
在微進(jìn)化與傳播的研究中,與原有分型方法比較,全基因組測序技術(shù)已經(jīng)大大提高了分辨率,推進(jìn)了分子流行病學(xué)的研究,可以更好地監(jiān)控結(jié)核病傳播和鑒定傳播源頭;但是現(xiàn)有的研究異質(zhì)性很高,不同研究采用不同測序平臺、分析流程等致使分析結(jié)果難以相互比較[31]。
在耐藥診斷的研究中,全基因組測序能夠快速、全面、一次性獲得臨床菌株對現(xiàn)有全部抗結(jié)核藥物的耐藥信息,以指導(dǎo)臨床醫(yī)生的治療方案。這與近年來一直提倡的精準(zhǔn)醫(yī)療思路一脈相承,都強(qiáng)調(diào)了針對菌株耐藥情況進(jìn)行抗結(jié)核藥物治療方案調(diào)整,使患者最大程度受益。結(jié)核分枝桿菌的耐藥機(jī)制非常復(fù)雜,過去我們常把表型與基因型耐藥情況的不一致歸因于機(jī)制研究的不足。但事實上,造成全基因組測序局限性的不僅是機(jī)制研究不全面,還包括臨界濃度、原發(fā)或者獲得性耐藥、測序的檢出限度、隨機(jī)誤差、基因型和表型之間錯誤的關(guān)聯(lián)等多種原因。比如,有一些基因型與表型的不一致是由于表型出了錯誤,以吡嗪酰胺和乙胺丁醇為例,其藥敏試驗結(jié)果重復(fù)性很差,低度耐藥無法檢測[32]。
盡管如此,目前還有很多問題尚未解決。比如:不同條件下結(jié)核分枝桿菌的進(jìn)化速率、為什么某些譜系僅存在于特定的地理區(qū)域內(nèi)、新發(fā)現(xiàn)的基因組差異是如何引起耐藥或適應(yīng)性變化的,等等。全基因組測序在結(jié)核病低負(fù)擔(dān)的高收入國家已經(jīng)列入常規(guī)診斷流程,其診斷耐藥的準(zhǔn)確性不劣于現(xiàn)有方法,但是還沒有穩(wěn)健、快速的分析方法或軟件,而且實驗室之間結(jié)果的異質(zhì)性較大,可比性差。這些問題還亟待解決。
[1] Roetzer A, Diel R, Kohl TA, et al. Whole genome sequencing versus traditional genotyping for investigation of aMycobacteriumtuberculosisoutbreak: a longitudinal molecular epidemiological study. PLoS Med, 2013, 10(2): e1001387.
[2] Gardy JL, Johnston JC, Ho Sui SJ, et al. Whole-genome sequencing and social-network analysis of a tuberculosis outbreak. N Engl J Med, 2011, 364(8): 730-739.
[3] Walker TM, Ip CL, Harrell RH, et al. Whole-genome sequencing to delineateMycobacteriumtuberculosisoutbreaks: a retrospective observational study. Lancet Infect Dis, 2013, 13(2): 137-146.
[4] Guerra-Assun??o JA, Crampin AC, Houben RM, et al. Large-scale whole genome sequencing ofM.tuberculosisprovides insights into transmission in a high prevalence area. Elife, 2015,4.
[5] Lee RS, Radomski N, Proulx JF, et al. Reemergence and amplification of tuberculosis in the Canadian arctic. J Infect Dis, 2015, 211(12): 1905-1914.
[6] Walker TM, Lalor MK, Broda A, et al. Assessment ofMycobacteriumtuberculosistransmission in Oxfordshire, UK, 2007-12, with whole pathogen genome sequences: an observational study. Lancet Respir Med, 2014, 2(4): 285-292.
[7] Yang C, Luo T, Shen X, et al. Transmission of multidrug-resistantMycobacteriumtuberculosisin Shanghai, China: a retro-spective observational study using whole-genome sequencing and epidemiological investigation. Lancet Infect Dis, 2017, 17(3): 275-284.
[8] Kato-Maeda M, Ho C, Passarelli B, et al. Use of whole genome sequencing to determine the microevolution ofMycobacteriumtuberculosisduring an outbreak. PLoS One, 2013, 8(3): e58235.
[9] K?ser CU, Bryant JM, Becq J, et al. Whole-genome sequencing for rapid susceptibility testing ofM.tuberculosis. N Engl J Med, 2013, 369(3): 290-292.
[10] Brosch R, Gordon SV, Marmiesse M, et al. A new evolu-tionary scenario for theMycobacteriumtuberculosiscomplex. Proc Natl Acad Sci U S A, 2002, 99(6): 3684-3689.
[11] Pfyffer GE, Auckenthaler R, van Embden JD, et al.Mycobacteriumcanettii, the smooth variant ofM.tuberculosis, isolated from a Swiss patient exposed in Africa. Emerg Infect Dis, 1998, 4(4): 631-634.
[12] Supply P, Marceau M, Mangenot S, et al. Genomic analysis of smooth tubercle bacilli provides insights into ancestry and pathoadaptation ofMycobacteriumtuberculosis. Nat Genet, 2013, 45(2): 172-179.
[13] Comas I, Coscolla M, Luo T, et al. Out-of-Africa migration and Neolithic coexpansion ofMycobacteriumtuberculosiswith modern humans. Nat Genet, 2013, 45(10): 1176-1182.
[14] Brites D, Gagneux S. Co-evolution ofMycobacteriumtuberculosisand Homo sapiens. Immunol Rev, 2015, 264(1): 6-24.
[15] Denkinger CM, Schumacher SG, Boehme CC, et al. Xpert MTB/RIF assay for the diagnosis of extrapulmonary tuberculosis: a systematic review and meta-analysis. Eur Respir J, 2014, 44(2): 435-446.
[16] Sch?n T, Miotto P, K?ser CU, et al.Mycobacteriumtuberculosisdrug-resistance testing: challenges, recent developments and perspectives. Clin Microbiol Infect, 2017, 23(3): 154-160.
[17] Farhat MR, Shapiro BJ, Kieser KJ, et al. Genomic analysis identifies targets of convergent positive selection in drug-resis-tantMycobacteriumtuberculosis. Nat Genet, 2013, 45(10): 1183-1189.
[18] Zhang H, Li D, Zhao L, et al. Genome sequencing of 161Mycobacteriumtuberculosisisolates from China identifies genes and intergenic regions associated with drug resistance. Nat Genet, 2013, 45(10): 1255-1260.
[19] Walker TM, Kohl TA, Omar SV, et al. Whole-genome sequencing for prediction ofMycobacteriumtuberculosisdrug susceptibility and resistance: a retrospective cohort study. Lancet Infect Dis, 2015, 15(10): 1193-1202.
[20] Shi W, Chen J, Feng J, et al. Aspartate decarboxylase (PanD) as a new target of pyrazinamide inMycobacteriumtuberculosis. Emerg Microbes Infect, 2014, 3(8): e58.
[21] Zhang S, Chen J, Shi W, et al. Mutations in panD encoding aspartate decarboxylase are associated with pyrazinamide resistance inMycobacteriumtuberculosis. Emerg Microbes Infect, 2013, 2(6): e34.
[22] Zhang S, Chen J, Cui P, et al. Identification of novel mutations associated with clofazimine resistance inMycobacteriumtuberculosis. J Antimicrob Chemother, 2015, 70(9): 2507-2510.
[23] Zhang S, Chen J, Cui P, et al.Mycobacteriumtuberculosismutations associated with reduced susceptibility to linezolid. Antimicrob Agents Chemother, 2016, 60(4): 2542-2544.
[24] Gu Y, Yu X, Jiang G, et al. Pyrazinamide resistance among multidrug-resistant tuberculosis clinical isolates in a national referral center of China and its correlations withpncA,rpsA, andpanDgene mutations. Diagn Microbiol Infect Dis, 2016, 84(3): 207-211.
[25] Simons SO, Mulder A, van Ingen J, et al. Role ofrpsAgene sequencing in diagnosis of pyrazinamide resistance. J Clin Microbiol, 2013, 51(1): 382.
[26] Lee RS, Pai M. Real-time sequencing ofMycobacteriumtuberculosis: are we there yet. J Clin Microbiol, 2017, 55(5): 1249-1254.
[27] Votintseva AA, Pankhurst LJ, Anson LW, et al. Mycobacterial DNA extraction for whole-genome sequencing from early positive liquid (MGIT) cultures. J Clin Microbiol, 2015, 53(4): 1137-1143.
[28] Bradley P, Gordon NC, Walker TM, et al. Rapid antibiotic-resistance predictions from genome sequence data for Staphylococcus aureus andMycobacteriumtuberculosis. Nat Commun, 2015, 6: 10063.
[29] Pankhurst LJ, Del Ojo Elias C, Votintseva AA, et al. Rapid, comprehensive, and affordable mycobacterial diagnosis with whole-genome sequencing: a prospective study. Lancet Respir Med, 2016, 4(1): 49-58.
[30] Quan TP, Bawa Z, Foster D, et al. Evaluation of whole genome sequencing for Mycobacterial species identification and drug susceptibility testing in a clinical setting: a large-scale prospective assessment of performance against line-probe assays and phenotyping. J Clin Microbiol, 2017, pii: JCM.01480-17.
[31] Hatherell H, Colijn C, Stagg HR, et al. Interpreting whole genome sequencing for investigating tuberculosis transmission: a systematic review. BMC Med, 2016, 14: 21.
[32] Horne DJ, Pinto LM, Arentz M, et al. Diagnostic accuracy and reproducibility of WHO-endorsed phenotypic drug susceptibility testing methods for first-line and second-line antituberculosis drugs. J Clin Microbiol, 2013, 51(2): 393-401.