,
病毒是一種能夠自我復(fù)制、專性在細(xì)胞內(nèi)寄生的非細(xì)胞生物。病毒結(jié)構(gòu)雖然簡單,僅結(jié)構(gòu)蛋白外殼包裹著一種遺傳物質(zhì)(DNA或RNA),卻能夠感染各種動(dòng)物、植物、藻類、真菌和細(xì)菌等多種生物群體。在人類發(fā)現(xiàn)病毒以來的100多年里,科學(xué)家們對(duì)于病毒的探索從未停息。特別是在病毒和人類健康關(guān)系方面,不僅陸續(xù)發(fā)現(xiàn)了一大批與人類疾病密切相關(guān)的致病性病毒,研制出各種病毒疫苗和抗病毒制劑,還利用部分病毒獨(dú)有的生物學(xué)特性構(gòu)建了各種病毒載體,作為一些遺傳疾病和腫瘤基因治療的工具。
近年來,宏基因組學(xué)(metagenomics)的興起,科學(xué)家開始關(guān)注不同生態(tài)環(huán)境下所有微生物(細(xì)菌、病毒、真菌等)種群的遺傳構(gòu)成及生物學(xué)功能,美國國立衛(wèi)生研究所(National Institutes of Health, NIH)也于2007年啟動(dòng)了人體微生物組計(jì)劃(Human Microbiome Project,HMP)[1]。作為微生物組的一部分,病毒組(virome)由特定生態(tài)環(huán)境下病毒樣顆粒所包含的核酸物質(zhì)(單鏈DNA、雙鏈DNA、單鏈RNA、雙鏈RNA) 構(gòu)成。因此人類病毒組(human virome)泛指人體內(nèi)部及人體表面各種器官/微生態(tài)環(huán)境(如皮膚、血液、鼻腔、口腔、肺、胃腸道、糞便等)所有能夠發(fā)現(xiàn)的病毒相關(guān)序列。其中少部分成員可以引起人類疾病,絕大多數(shù)成員并不一定與明顯的臨床癥狀有關(guān)聯(lián)[2-4]。那么,人類病毒組究竟有哪些成員?各種病毒在人體不同器官中如何分布及發(fā)揮作用?本文擬總結(jié)目前人類病毒組研究領(lǐng)域的進(jìn)展,以便深入認(rèn)識(shí)人類病毒組的構(gòu)成、功能以及與人類健康的關(guān)系。
人體內(nèi)部及表面棲居著各種生物特性不同的病毒群體,包括真核病毒和大量的噬菌體,它們通過感染人體細(xì)胞及調(diào)節(jié)人類微生物組,對(duì)平衡宿主的健康和疾病狀態(tài)至關(guān)重要[2]。影響人類病毒組的因素很多,例如每個(gè)人的生活方式、年齡、地理位置、季節(jié)等差異,均可導(dǎo)致個(gè)體接觸各種病毒的機(jī)會(huì)不同,因此每個(gè)人都有自己特有的病毒組。而每個(gè)人對(duì)病毒的易感性與個(gè)體免疫力、病毒與人類遺傳特征等也存在聯(lián)系。同時(shí),人類病毒組隨著病毒進(jìn)化也可能不斷發(fā)生改變[2-3]。根據(jù)病毒來源,人類病毒組既包括引起暫時(shí)急性感染的各種動(dòng)物病毒,作為細(xì)菌、古細(xì)菌天敵的噬菌體,各種內(nèi)源性逆轉(zhuǎn)錄病毒(human endogenous retroviruses, HERVs),還包括一些人體持續(xù)感染和潛伏感染相關(guān)的病毒[2-4]。其中HERVs估計(jì)占人類基因組約8%,但大多數(shù)基因被截?cái)嗪?或產(chǎn)生突變,不能編碼功能性蛋白,僅少數(shù)可以產(chǎn)生相關(guān)蛋白或完整的病毒顆粒[2]。
健康人體的各種組織系統(tǒng)存在不同生態(tài)環(huán)境,其病毒組成分也有差異。根據(jù)HMP項(xiàng)目中真核雙鏈DNA病毒調(diào)查數(shù)據(jù)[5],就發(fā)現(xiàn)102名研究對(duì)象706份樣品(來自人體鼻、皮膚、口腔、陰道、糞便等5種生態(tài)環(huán)境)中,平均每人檢出5.5個(gè)病毒屬,92%的個(gè)體樣品中能夠檢出至少一種病毒,包括皰疹病毒(herpes simplex virus,HSV)、乳頭瘤病毒(human papillomavirus,HPV)、多瘤病毒(human polyomaviruses,HPyV)、腺病毒、指環(huán)病毒(anellovirus)、細(xì)小病毒和圓環(huán)病毒(circovirus)等。同時(shí),按樣品采集部位,無癥狀健康人群糞便樣品只有7類真核雙鏈DNA病毒,其它部位則存在10-13類,而且各類病毒在不同部位的構(gòu)成比也有差異。其中,環(huán)病毒屬(gyrovirus)為糞便樣品中獨(dú)有,依賴病毒屬(dependovirus)僅存在于鼻腔。雖然以上數(shù)據(jù)還缺少單鏈DNA病毒、RNA病毒、噬菌體及前病毒序列信息,但至少證明了不同生態(tài)環(huán)境病毒組的差異,也充分顯示個(gè)體之間病毒組的多樣性。
1.1口腔和唾液 人類口腔生態(tài)系統(tǒng)包含無數(shù)的真核細(xì)胞、細(xì)菌、古細(xì)菌和病毒??谇皇俏改c道的門戶,也是病毒感染和傳播的主要場所。唾液不僅能夠控制細(xì)菌在口腔中的定植(colonization),而且其中的多種生物活性分子具有抗病毒作用[6-7]??谇徊《窘M研究通常采集唾液或咽拭子作為檢材,據(jù)估計(jì)每毫升咽拭子或唾液中有108個(gè)病毒樣顆粒(virus-like particle, VLP),每毫升牙菌斑則含有107個(gè)病毒樣顆粒[6]。這些病毒樣顆粒以噬菌體為主,能夠分類的噬菌體包括有尾噬菌體目(Caudovirales)的肌尾噬菌體科(Myoviridae)、短尾噬菌體科(Podoviridae)、長尾噬菌體科(Siphoviridae)等[6]。同時(shí),口腔中的噬菌體群落在唾液、牙菌斑、牙齦下空腔和齦上生物膜之間還存在明顯差異。而口腔噬菌體群落是在何種程度上形成及調(diào)節(jié)口腔細(xì)菌群落的,以及它們之間的平衡是否對(duì)人類健康帶來直接或間接影響,目前尚不清楚。除了噬菌體之外,僅少數(shù)病毒序列與已知的真核病毒同源,包括細(xì)環(huán)病毒(torque teno virus,TTV)、圓環(huán)病毒、HSV和EB病毒(Epstein-Barr virus, EBV)[6]。在致病性真核病毒中,能夠從唾液或口腔拭子中分離培養(yǎng)的常見病毒有輪狀病毒、諾如病毒、人免疫缺陷病毒(HIV)、巨細(xì)胞病毒(cytomegalovirus,CMV)、1型和2型皰疹病毒(HSV-1、HSV-2)、EBV、流感病毒等,能夠檢出病毒核酸物質(zhì)或特異性抗體的種類則更多[7]。
1.2皮膚 皮膚是病原體和人體之間的物理屏障,也是多種微生物在人體的定居之處,一個(gè)70 kg成年人的皮膚表面積約1.7 m2。不同部位的皮膚由于溫度、濕度、暴露程度等不同,定居的微生物群落存在差異[2,8-9]。皮膚的病毒組研究通常采集不同部位的皮膚拭子作為檢材。定居在皮膚上的細(xì)菌一般為葡萄球菌屬、丙酸桿菌屬、棒狀桿菌屬,因此,皮膚的病毒組中,部分噬菌體成分與上述細(xì)菌存在一定聯(lián)系[2-3,9]。皮膚病毒組中能夠劃分為病毒的序列多數(shù)為有尾噬菌體目,少部分為肌尾噬菌體科和長尾噬菌體科[9]。皮膚上的真核病毒可能為乳頭瘤病毒科、多瘤病毒科、圓環(huán)病毒科、腺病毒科、指環(huán)病毒科、皰疹病毒科和痘病毒科成員,以乳頭瘤病毒科最多。多數(shù)個(gè)體的皮膚表層有多種乙型和丙型HPV(beta-, and gammapapillomaviruses, β- and γ-HPVs),高通量測序數(shù)據(jù)顯示健康個(gè)體皮膚樣品中HPV類型可以高達(dá)17種。有的病毒如指環(huán)病毒、部分HPV型別可能為皮膚正常生態(tài)群落的一部分,而一些HPV型別、HPyV、HSV等則可能導(dǎo)致皮膚癌和其它皮膚疾病[2]。
1.3呼吸道 呼吸道負(fù)責(zé)人體與外界氧氣和二氧化碳的交換,分為上呼吸道和下呼吸道,成人呼吸道總表面積約70 m2,是皮膚表面積的40倍[10]。人類呼吸道是空氣中細(xì)菌、病毒、真菌等微生物進(jìn)入人體的主要途徑,據(jù)報(bào)道,健康無癥狀兒童中呼吸道病毒的檢出率超過65%[10]。曾經(jīng)一度認(rèn)為健康人的肺是一個(gè)無菌器官,但近年來多種不依賴培養(yǎng)的檢測技術(shù)表明,肺里同樣存在大量的微生物。研究呼吸道微生物組通常采集上呼吸道樣品(鼻咽拭子、鼻咽抽吸物)和下呼吸道樣品(支氣管灌洗液)。有研究顯示,人類上呼吸道存在包括指環(huán)病毒科在內(nèi)的多種病毒,下呼吸道病毒組除了大量噬菌體外,也有較多指環(huán)病毒科成員[10-11]。
健康個(gè)體鼻吸取物的病毒組分析顯示,呼吸道存在多種真核病毒,包括巨細(xì)胞病毒、淋巴濾泡病毒(lymphocryptovirus)、玫瑰皰疹病毒(roseolovirus)、哺乳動(dòng)物腺病毒(mastadenovirus)、依賴病毒屬、HSV、HPyV以及甲、乙、丙型HPV及未分型HPV、甲型細(xì)環(huán)病毒(alphatorquevirus)和未分型指環(huán)病毒[2,10]。在發(fā)病人群中,瑞典學(xué)者對(duì)210名嚴(yán)重下呼吸道感染患者的鼻咽沖洗液進(jìn)行宏基因組檢測,發(fā)現(xiàn)39種病毒感染,主要為副黏病毒科、小RNA病毒科、正黏病毒科(流感病毒)成員,占樣品病毒共有序列(viral contigs)的90%,其余依次為冠狀病毒科、細(xì)小病毒科、指環(huán)病毒科、圓環(huán)病毒科、多瘤病毒科以及其它[12]。我國學(xué)者對(duì)135名嚴(yán)重急性呼吸道感染(severe acute respiratory infection,SARI)兒童病例樣品的病毒宏基因組研究,得出類似結(jié)論。包括副黏病毒科、冠狀病毒科、細(xì)小病毒科、正黏病毒科、小RNA病毒科、指環(huán)病毒科和腺病毒科成員,而作為對(duì)照的15名非SARI兒童患者呼吸道樣品中病毒成分相對(duì)單純一些,除了少部分常見呼吸道病毒外,主要為指環(huán)病毒[13]。
1.4血液 一般認(rèn)為,健康人血液是無菌的。一些受到廣泛關(guān)注的已知血源傳播病毒如乙肝病毒(hepatitis B virus,HBV)、丙型肝炎病毒(hepatitis C virus, HCV)、人免疫缺陷病毒(human immunodeficiency virus, HIV)、人T淋巴細(xì)胞病毒(human T-lymphotropic virus, HTLV)等,在多數(shù)國家都已經(jīng)列入獻(xiàn)血員篩查目錄,是保障臨床血液安全的重要措施[2,14]。曾經(jīng)認(rèn)為與病毒性肝炎有關(guān)聯(lián)的TTV和黃病毒科成員Human pegivirus (HPgV),在健康人群血液中檢出率較高,現(xiàn)在普遍認(rèn)為它們僅在血液中循環(huán)不引起任何癥狀。另外部分病毒(如CMV、細(xì)小病毒B19、戊型肝炎病毒),雖然引起病毒血癥,但只對(duì)特定人群帶來潛在影響,因此沒有列入常規(guī)篩查名錄[14]。
早期的宏基因組研究發(fā)現(xiàn),血液中存在相當(dāng)數(shù)量的病毒群體,據(jù)估計(jì)人類血漿中各種病毒構(gòu)成比分別為指環(huán)病毒(68%)、皰疹病毒(13%)、多瘤病毒(5%)、有尾噬菌體目(5%)、腺病毒(2%)、痘病毒(1%)、逆轉(zhuǎn)錄病毒(1%)和其它未分型的病毒(5%)[15]。上述結(jié)論也得到近年來一些采用大樣本的病毒組學(xué)調(diào)查結(jié)果支持。瑞士學(xué)者對(duì)300個(gè)紅細(xì)胞單位和300個(gè)新鮮血漿(fresh-frozen plasma,F(xiàn)FP)單位的宏基因組分析[16],在健康個(gè)體血液中經(jīng)常檢出指環(huán)病毒和HPgV,還能檢測到一般在皮膚才有的HPV27、Merkel細(xì)胞多瘤病毒,甚至在一個(gè)FFP單位中意外檢出了星狀病毒MLB2。研究人員對(duì)美國和歐洲10批次的血漿(每批體積達(dá)567 L-2 608L)的病毒宏基因組研究,發(fā)現(xiàn)10個(gè)批次均有指環(huán)病毒,8個(gè)批次存在A型HPgV,3個(gè)批次發(fā)現(xiàn)少量HPV[17]。而Moustafa等[18]對(duì)8 240名沒有任何傳染病人群的血液樣品,進(jìn)行全基因組測序。從測序數(shù)據(jù)中提取DNA病毒相關(guān)序列,共發(fā)現(xiàn)94種病毒,包括19種人DNA病毒、前病毒和RNA病毒,如HSV、指環(huán)病毒、HPV、HPyV、腺病毒、HIV、HTLV、HBV、HCV、細(xì)小病毒B19以及流感病毒,來自42%的測試人群。另外75種病毒則主要為商業(yè)試劑污染和外環(huán)境。
1.5神經(jīng)系統(tǒng) 雖然中樞神經(jīng)系統(tǒng)(central nervous system, CNS)受到血腦屏障的保護(hù),但仍然有很多病原體能夠突破血腦屏障,引起明顯的CNS感染相關(guān)疾病及死亡。多種病毒可以通過不同途徑侵入神經(jīng)系統(tǒng),導(dǎo)致腦膜炎、腦炎或腦膜腦炎[19]。盡管目前對(duì)大多數(shù)病毒相關(guān)CNS感染缺乏特異抗病毒藥物,但是及時(shí)確定引起CNS感染的病毒類型有助于采取相應(yīng)的應(yīng)急措施,有效避免疫情擴(kuò)大[20]。已知能夠感染CNS的病毒有HIV-1、彈狀病毒、黃病毒、HSV、流感病毒、副流感病毒、呼腸孤病毒、淋巴細(xì)胞脈絡(luò)叢腦膜炎病毒、蟲媒病毒、CMV、腮腺炎病毒、細(xì)小病毒B19、麻疹病毒、HTLV、腸道病毒、亨尼帕病毒、布尼亞病毒、披膜病毒等[21]。神經(jīng)系統(tǒng)的病毒組研究可采集腦脊液作為檢材,但目前缺少采用腦脊液進(jìn)行病毒組研究的大型隊(duì)列調(diào)查數(shù)據(jù)。根據(jù)最近關(guān)于高通量測序用于腦炎個(gè)案診斷的綜述[20],匯總了2008年1月-2017年4月共25篇文獻(xiàn)報(bào)告的44例病例資料,涉及到常見病毒有HSV、 柯薩奇病毒A9、麻疹病毒、水泡帶狀皰疹病毒(varicella-zoster virus,VZV)、腮腺炎病毒、EBV和JC多瘤病毒,罕見病毒有人細(xì)小病毒4型(parvovirus 4, PARV4)、人冠狀病毒OC-43、人星狀病毒MLB1,新發(fā)現(xiàn)病毒則有沙粒病毒、博爾納病毒(bornavirus)、星狀病毒VA1/HMO-C、cyclovirus、gemycircuarlvirus、濃核癥病毒(densovirus)。
1.6胃腸道 健康成年人的胃腸道表面積超過200 m2,為各種微生物生長和繁殖提供了理想的場所。人體胃腸道的微生物群落與人體生理和健康息息相關(guān),有關(guān)人類胃腸道病毒組的研究較多。胃腸道病毒組研究通常采集糞便樣品作為檢材,正常糞便包含病毒樣顆粒約108~109/g,其來源按照宿主類型可分為:人類病毒、膳食來源植物病毒、膳食來源動(dòng)物病毒、噬菌體、感染原生動(dòng)物的病毒[2,22-24]。糞便中絕大多數(shù)病毒樣顆粒為噬菌體,主要包括有尾噬菌體目的肌尾病毒科、短尾噬菌體科、長尾噬菌體,少部分屬于微小噬菌體科[2-3,24]。能夠劃分為真核病毒的序列相對(duì)較少,其中真核DNA病毒科包括雙生病毒科(Geminiviridae)、皰疹病毒科、矮縮病毒科(Nanoviridae)、乳頭瘤病毒科、痘病毒科、細(xì)小病毒科、多瘤病毒科、腺病毒科、圓環(huán)病毒科(Circoviridae)等。而真核RNA病毒方面,雖然相關(guān)研究不多,且發(fā)現(xiàn)多數(shù)RNA病毒為食物來源的植物RNA病毒,但至少檢出過包括杯狀病毒科、小雙RNA病毒科(Picobirnaviridae)、小RNA病毒科(腸道病毒)、呼腸孤病毒科(輪狀病毒)等在內(nèi)的RNA病毒[2, 25]。另外,身體其它部位的病毒也可能出現(xiàn)在糞便中[25],如呼吸道的鼻病毒、博卡病毒、冠狀病毒可能通過吞咽進(jìn)入糞便,感染血細(xì)胞的病毒如HIV也能在糞便樣品中檢測到。因此,在糞便中檢出一種新病毒,并不代表此病毒就是在人類小腸細(xì)胞中復(fù)制的。
1.7泌尿生殖系統(tǒng) 人類尿道出現(xiàn)微生物通常與尿道感染有關(guān),即使沒有尿道感染,尿液中也具有自身獨(dú)特的微生物群。泌尿生殖道感染分為尿道感染(膀胱炎、腎盂腎炎、前列腺炎)和生殖道感染(尿道炎、宮頸炎、附睪炎、子宮內(nèi)膜炎、生殖器潰瘍、盆腔炎)[26]。對(duì)泌尿生殖系統(tǒng)的病毒組研究通常采集尿液、陰道拭子等作為檢材。尿液和陰道拭子中經(jīng)常檢出各種HPVs,可能屬于共生微生物群落的一部分。同時(shí),健康男性和女性尿道還可能有皰疹病毒(HSV、CMV)和多瘤病毒(BK多瘤病毒),以及一些噬菌體[2, 27]。美國加州大學(xué)圣地亞哥分校研究人員采集了10名尿道感染(大腸埃希菌、糞腸球菌、鮑曼不動(dòng)桿菌)和10名無尿道感染者的尿液樣品,發(fā)現(xiàn)每毫升樣品大約含107病毒樣顆粒,略低于唾液和糞便中數(shù)目。無論是否存在尿道感染,都能夠檢出真核病毒如乳頭瘤病毒、皰疹病毒和多瘤病毒。95%樣品包含HPV序列,包括多種不常見型別HPV96、HPV49、HPV121、HPV92、HPV178等。通過與非冗余數(shù)據(jù)庫(non-redundant database, NR)比對(duì),約27%的共有序列(contig)與已知病毒序列同源,其中絕大部分屬于噬菌體序列,包括大腸埃希菌、葡萄球菌、糞腸球菌等的特異噬菌體[27]。
1.8腫瘤組織 自從20世紀(jì)60年代發(fā)現(xiàn)部分腫瘤與病毒感染相關(guān),迄今已經(jīng)確認(rèn)7種腫瘤病毒,分別是DNA病毒如EBV、HBV、HPV、人皰疹病毒8型(human herpesvirus 8,HHV-8)和Merkel細(xì)胞多瘤病毒(Merkel cell polyomavirus,MCPyV),RNA病毒HCV、HTLV-1。大約12%的人類腫瘤由病毒所致,世界上大部分人群存在至少一種腫瘤病毒,但只有少數(shù)個(gè)體發(fā)展成為腫瘤[28]。
美國國家癌癥研究所(National Cancer Institute,NCI)和國家人類基因組研究所(National Human Genome Research Institute,NHGRI)于2006年啟動(dòng)了癌癥基因組圖譜 (The Cancer Genome Atlas,TCGA)項(xiàng)目,目的是提高癌癥的診斷、治療和預(yù)防。通過收集數(shù)千名癌癥患者組織樣品并進(jìn)行深度測序,從序列數(shù)據(jù)庫中也可以調(diào)查腫瘤組織中存在病毒。經(jīng)過10多年的工作,不僅在所有宮頸癌及部分頭頸部鱗狀細(xì)胞癌樣品中檢測到HPV序列,證明了HBV、HCV序列與部分肝癌有關(guān),以及部分胃癌中有EBV基因表達(dá),而且發(fā)現(xiàn)一些以前未認(rèn)識(shí)到的癌癥與病毒的相關(guān)性。最近,有學(xué)者首次結(jié)合DNA(全基因組、全外顯子組)和RNA序列數(shù)據(jù),調(diào)查了來自3 052名患者22類不同癌癥樣品中存在的病毒序列[29]。經(jīng)過人工排除噬菌體、植物病毒、昆蟲病毒和真菌病毒之后,確定5個(gè)科(乳頭瘤病毒科、多瘤病毒科、嗜肝DNA病毒科、黃病毒科、皰疹病毒科)34種病毒存在于TCGA癌癥樣品中。除了少數(shù)樣品包含低危型的HPV30、HPV73、HPV111之外,所有宮頸癌樣品存在高危型HPV,其中HPV16、HPV18占89.4%。約20%頭頸部腫瘤樣品存在HPV,以HPV16居多。肝癌患者樣品中HBV、HCV序列檢出率分別為30%和5.6%,部分膀胱癌患者檢出HPV,在20種癌癥組織中發(fā)現(xiàn)了皰疹病毒序列,其中EBV、CMV、人皰疹病毒6型(human herpesvirus 6,HHV6)出現(xiàn)在17種癌癥中。
在過去100多年里,傳統(tǒng)的病毒鑒定方法包括病毒分離培養(yǎng)、電子顯微鏡觀察、血清學(xué)實(shí)驗(yàn)和核酸檢測等,逐漸豐富了人類對(duì)于病毒學(xué)的認(rèn)識(shí)。由于大多數(shù)病毒組成員的遺傳背景不明,也沒有合適的培養(yǎng)分離方法,因此目前主要采用病毒宏基因組的方法獲得病毒DNA或RNA基因組序列。宏基因組學(xué)不依賴于傳統(tǒng)的病毒培養(yǎng),而是用分子手段分析環(huán)境樣品中所有微生物基因組,是探索復(fù)雜微生物環(huán)境生態(tài)學(xué)的可靠工具。但病毒基因組相對(duì)較小,也沒有類似細(xì)菌16S rRNA基因的通用遺傳元件,病毒宏基因組研究一直受到來自樣品處理、測序策略、生物信息學(xué)注釋等方面的挑戰(zhàn)[30-33]。
雖然直接提取來自外環(huán)境、臨床、培養(yǎng)物等樣品的總DNA或RNA進(jìn)行宏基因組深度測序就能夠檢測到樣品中各種核酸序列,其中病毒相關(guān)序列所占比例甚微,因而敏感性較低、實(shí)用性不高。為了消除來自宿主、外環(huán)境細(xì)胞碎片和游離核酸物質(zhì)的干擾,通常需要采用過濾(0.45 μm和/或0.22 μm)、離心(低速離心、超速離心、密度梯度離心)、聚乙二醇沉淀、DNA酶和RNA酶處理等手段對(duì)病毒顆粒進(jìn)行富集[23,33]。其次,通過去除宿主rRNA,或采用基于探針的核酸雜交方法,如病毒組捕獲測序(virome capture sequencing,VirCapSeq)、脊椎動(dòng)物病毒組捕獲測序平臺(tái)(virome capture sequencing platform for vertebrate viruses,VirCapSeq-VERT)系統(tǒng),也可以對(duì)特異病毒核酸進(jìn)行富集,提高樣品中病毒相關(guān)序列的比例[30]。同時(shí),為了涵蓋低豐度病毒序列,還需要對(duì)樣品中病毒序列片段進(jìn)行非特異、無偏差擴(kuò)增。常用方法包括不依賴序列的單引物擴(kuò)增(sequence independent single primer amplification, SISPA)、多重置換擴(kuò)增( multiple displacement amplification,MDA)和病毒cDNA擴(kuò)增片段長度多樣性(virus discovery based on cDNA-amplified fragment length polymorphism,VIDISCA),不僅能夠擴(kuò)增已知病毒序列,還能擴(kuò)增未知病毒序列[31-32]。
早期的宏基因組研究采用的是克隆不同靶片段進(jìn)行毛細(xì)管電泳測序,其測序通量遠(yuǎn)遠(yuǎn)不夠,如今基本上已經(jīng)被淘汰。近10年來,各種高通量測序平臺(tái)不斷推陳出新,尤其在測序讀長和通量上取得了飛速發(fā)展。測序文庫的構(gòu)建是宏基因組研究的基礎(chǔ)和關(guān)鍵,主要過程即是將目標(biāo)DNA或RNA制備為測序儀能夠相容的形式,基本過程包括靶序列片段化、雙鏈DNA轉(zhuǎn)換、連接寡核苷酸接頭以及文庫定量等步驟[23,33]。無論采用鳥槍法還是核酸擴(kuò)增準(zhǔn)備測序模板,都必須盡可能讓測序文庫忠實(shí)地代表樣品的復(fù)雜性,同時(shí)減少實(shí)驗(yàn)過程中帶來的各種偏差。
在獲得原始測序數(shù)據(jù)以后,另外一個(gè)重要環(huán)節(jié)就是選擇和應(yīng)用適當(dāng)?shù)纳镄畔W(xué)工具對(duì)宏基因組序列進(jìn)行注釋分析。利用現(xiàn)有各種商業(yè)或源代碼開放的生物信息學(xué)軟件,根據(jù)不同的算法原理,去除接頭序列、低質(zhì)量片段和宿主相關(guān)序列,通過將原始序列數(shù)據(jù)或拼接后的共有序列與公共數(shù)據(jù)庫的已知序列比對(duì),然后將序列信息按不同種屬來源進(jìn)行生物學(xué)分類。但是,目前已知的病毒相關(guān)參比序列十分有限,導(dǎo)致許多病毒宏基因組序列數(shù)據(jù)中相當(dāng)一部分只能根據(jù)部分蛋白質(zhì)結(jié)構(gòu)信息劃分到未知病毒[2, 23]。
隨著測序技術(shù)發(fā)展,通過深度測序的方法研究人類病毒組,能夠快速確定人體特定生態(tài)環(huán)境中病毒組的豐度、穩(wěn)定性、基因功能以及與人類健康的聯(lián)系,無疑有助于新發(fā)病毒疾病診斷治療,減少抗生素使用,促進(jìn)抗病毒藥物研發(fā)。對(duì)于人類病毒組的功能,首先應(yīng)該認(rèn)識(shí)到,人類病毒組是身體的一部分,并不總是對(duì)人體健康有害。多數(shù)病毒是良性的,僅少數(shù)病毒能夠致病。許多病毒一直存在于人體也不引起任何癥狀。只有病毒感染人體細(xì)胞,出現(xiàn)癥狀才算是對(duì)人體有害。同時(shí),病毒對(duì)人類健康的影響是由個(gè)體免疫系統(tǒng)狀態(tài)決定的[2,34]。其次,細(xì)菌噬菌體是人類病毒組比例最大也是了解甚少的部分。這些噬菌體種類及分布與定植在人體局部生態(tài)環(huán)境中的細(xì)菌密切相關(guān),是細(xì)菌中各種可移動(dòng)遺傳元件的主要來源,在細(xì)菌通過水平基因轉(zhuǎn)移交換遺傳物質(zhì)過程中發(fā)揮重要作用。有證據(jù)表明,噬菌體組可能作為人體健康或疾病的生物標(biāo)志[2,32]。第三,致病性細(xì)菌與病毒在致病過程中是互相協(xié)同作用的。以呼吸道為例,呼吸道病毒突破人體氣管-表皮屏障,調(diào)節(jié)宿主先天及后天免疫反應(yīng),有利于病原菌粘附,更容易引起細(xì)菌性疾??;而細(xì)菌反過來也通過上調(diào)黏附受體的表達(dá),增加了人類鼻病毒(human rhinovirus, HRV)和呼吸道合胞病毒(respiratory syncytial virus,RSV)對(duì)上皮細(xì)胞的結(jié)合,并放大炎癥反應(yīng)[2,10]。第四,關(guān)于檢出率較高的真核病毒TTV和HPgV,曾經(jīng)認(rèn)為與輸血后肝炎和血源傳播疾病有關(guān),目前已經(jīng)排除了它們與疾病的聯(lián)系,其功能及生物學(xué)意義尚不明確。
病毒伴隨著人類的一生,人類通過空氣、食物、其它人類、植物、動(dòng)物、微生物等暴露于病毒環(huán)境,直接或間接地影響人類健康和疾病的平衡。近年來全球科研人員的努力初步揭示了人類病毒組的部分構(gòu)成及功能,為進(jìn)一步認(rèn)識(shí)病毒組與人類健康提供了便利。但是,目前有關(guān)人體病毒組的資料并不完整,不僅缺少標(biāo)準(zhǔn)化的病毒分離和測序方法,病毒基因組參考序列數(shù)目也非常有限。多數(shù)病毒組研究還局限于DNA病毒,而關(guān)于人體RNA病毒組的數(shù)據(jù)不夠。在富集病毒顆粒過程中,采用0.22 μm和/或0.45 μm的濾膜過濾可能失去一些顆粒稍大的病毒種類,也忽略了整合在宿主或細(xì)菌的前病毒或前噬菌體序列信息;隨機(jī)引物擴(kuò)增過程中,也可能因?yàn)槭褂玫腄NA多聚酶偏好而帶來系統(tǒng)性偏差。同時(shí),所有病毒組研究僅僅是提供了病毒多樣性及組成,還無法真實(shí)反映不同病毒的載量。對(duì)我國的生物醫(yī)學(xué)領(lǐng)域而言,目前的人類病毒組研究還處于起步階段。一方面需要在高通量測序硬件及相關(guān)試劑上發(fā)展自主的平臺(tái)體系,開發(fā)標(biāo)準(zhǔn)化的實(shí)驗(yàn)和分析流程,促進(jìn)高通量測序在臨床上的開展;另一方面則是需要整合不同學(xué)科的樣本資源,通過大批量隊(duì)列樣本的病毒組相關(guān)序列數(shù)據(jù),盡可能完整地展示我國人群中人類病毒組的構(gòu)成??傊S著高通量測序技術(shù)的進(jìn)步,測序成本的大幅降低,更大規(guī)模、更全面的人類病毒組研究數(shù)據(jù)將有助于深入了解病毒的多樣性、生態(tài)學(xué)、進(jìn)化和病毒分類,最終必將應(yīng)用于臨床診斷和治療,為促進(jìn)全人類健康帶來福利。