祁釗,趙相龍,桑金慧,何振杰,傅丹丹,岳振宇,宋祥軍*
(1.安徽農(nóng)業(yè)大學(xué)信息與計(jì)算機(jī)學(xué)院,合肥 230036;2.安徽省動(dòng)物性食品質(zhì)量與生物安全工程實(shí)驗(yàn)室,合肥 230036)
環(huán)境中的糞便污染是全球范圍內(nèi)日益嚴(yán)重的問題,尤其是在河流和溪流中[1]。流域的糞便污染可能存在多種來源,包括污水基礎(chǔ)設(shè)施等點(diǎn)源排污,受上游牲畜、寵物和野生動(dòng)物排泄物污染的徑流[2]等。糞便污染帶來的高營養(yǎng)和微生物負(fù)荷不僅會(huì)影響生態(tài)健康,而且糞便病原體通過水媒的傳播還會(huì)進(jìn)一步影響人類健康。對(duì)主要水媒傳播病原體的檢測(cè)是表征人類健康風(fēng)險(xiǎn)的最直接方法,但由于環(huán)境中病原種類繁多(包括病毒、細(xì)菌和原生動(dòng)物),對(duì)其進(jìn)行檢測(cè)不僅會(huì)浪費(fèi)大量時(shí)間,還會(huì)消耗大量經(jīng)濟(jì)成本。為解決這一難題,監(jiān)管機(jī)構(gòu)使用糞便指示菌(Fecal indicator bacteria,F(xiàn)IB),如大腸桿菌(Escherichia coli)和糞大腸菌群(Fecal coliforms)等來評(píng)估糞便污染水平[3],并以此作為水體微生物風(fēng)險(xiǎn)的替代指標(biāo)[4]。然而,傳統(tǒng)糞便指示菌的水質(zhì)指標(biāo)檢測(cè)雖節(jié)約了時(shí)間和成本,卻也存在諸多不足,如無法提供污染源信息、且無法反映水體近期的污染情況[5-6]等,近年來許多污染溯源研究表明,F(xiàn)IB 與環(huán)境病原相關(guān)性不佳[7-8],故而人們開始探索更加快速、經(jīng)濟(jì)的微生物溯源技術(shù)。
微生物來源追蹤(Microbial source tracking,MST)技術(shù)利用人和動(dòng)物胃腸道中的微生物設(shè)計(jì)出具有特異性的標(biāo)記物,并通過定量聚合酶鏈反應(yīng)(qPCR)等分子技術(shù)檢測(cè)與宿主相關(guān)的微生物標(biāo)記基因,從而識(shí)別潛在的糞便污染源[9-10],但地理差異會(huì)顯著影響基于宿主特異性分子標(biāo)記檢測(cè)方法的靈敏度和特異性,這給MST 技術(shù)的實(shí)際應(yīng)用帶來了困難。在過去的20 a 中,伴隨著下一代測(cè)序(Next generation sequencing,NGS)技術(shù)的快速發(fā)展,研究者對(duì)人類、家畜和野生動(dòng)物腸道微生物組的理解不斷加深[11]。使用NGS 數(shù)據(jù)獲取環(huán)境及糞便來源的獨(dú)特的微生物群落圖譜的方法被稱為基于細(xì)菌群落的MST(Community-based MST)[12],主要方法包括基于貝葉斯分類器的Source?Tracker[13]與基于快速期望最大化算法的微生物源追蹤(FEAST)[14]。兩個(gè)MST 軟件的運(yùn)行均需要使用者提供糞便來源文庫(Fecal taxon library,F(xiàn)TL),并基于該文庫中不同的宿主菌群組成對(duì)待測(cè)樣本中微生物的來源進(jìn)行預(yù)測(cè)[15],進(jìn)而評(píng)估不同污染源對(duì)樣品微生物群落的貢獻(xiàn)度[16]。SourceTracker 源解析程序通過對(duì)不同宿主糞便以及環(huán)境水樣16S rRNA 基因?qū)⒉煌S便來源的微生物群落和待分析的水體微生物群落當(dāng)作一個(gè)整體,基于貝葉斯算法,識(shí)別水樣中不同宿主來源微生物所占比例,解析水樣中糞便污染來源[13]。目前,研究人員已將此方法應(yīng)用在不同區(qū)域以識(shí)別水環(huán)境中不同糞便污染來源及其貢獻(xiàn)率,例如,Brown 等[15,17]使用SourceTracker 成功識(shí)別出蘇必利爾湖河口糞便污染主要來自污水處理廠排放的廢水(70%)和海鷗糞便(30%),與qPCR 方法所得結(jié)果一致。FEAST是一種新興的計(jì)算工具,可用于同時(shí)估計(jì)多個(gè)潛在來源和各種糞便輸入的相對(duì)貢獻(xiàn)。相同條件下,F(xiàn)EAST比SourceTracker表現(xiàn)出更強(qiáng)的穩(wěn)定性和更高的運(yùn)行速度[14]。但目前應(yīng)用FEAST 軟件進(jìn)行河流水域糞便污染追溯的研究較少,因此其在糞便污染追溯方面的準(zhǔn)確性尚需進(jìn)一步驗(yàn)證。
在本研究中,研究者提取了所采集樣本的DNA用于16S rDNA 測(cè)序,旨在通過對(duì)比測(cè)序結(jié)果,探索不同采樣地點(diǎn)[家禽與廢水處理廠(WWTP)、河流水體]及不同樣本中(皖江流域地區(qū)野生候鳥、人工養(yǎng)殖的家豬)細(xì)菌群落結(jié)構(gòu)的多樣性,以及不同物種糞便微生物組/環(huán)境微生物組的差異。此外,將測(cè)得的NGS數(shù)據(jù)比對(duì)到本地潛在病原數(shù)據(jù)庫,用以表征不同生境樣本中的潛在病原組成,為后續(xù)污染溯源工作奠定基礎(chǔ)。而后,通過利用不同來源潛在污染物的NGS 數(shù)據(jù)集構(gòu)建FTL 文庫,應(yīng)用基于SourceTracker 與FEAST兩種程序的MST 方法對(duì)自然水體樣本進(jìn)行污染溯源研究,進(jìn)一步表征水體公共安全風(fēng)險(xiǎn),為巢湖流域水環(huán)境治理提供理論及數(shù)據(jù)支持。
巢湖位于安徽省中部,是中國五大淡水湖之一,同時(shí)也是中國富營養(yǎng)化水平最高的湖泊之一[18]。巢湖流域水路網(wǎng)絡(luò)密集,總流入量的80%以上來自雙橋河、派河和南淝河等12 條河流。近年來,伴隨巢湖流域人類活動(dòng)的增加,巢湖受到了嚴(yán)重污染(包括工業(yè)、農(nóng)業(yè)和居民生活污水來源),同時(shí)逐漸發(fā)展出富營養(yǎng)化現(xiàn)象[19]。
1.2.1 水體樣本采集
本研究于2021 年10 月采集水體、沉積物樣本共63 個(gè),包括從巢湖流域的杭埠河(HR)、豐樂河(FR)、派河(XR)各采集的水樣(S)3 份,沉積物3 份,在杭埠河采樣點(diǎn)上游有水禽養(yǎng)殖地點(diǎn)(HRD)額外采集的水樣3 份。在巢湖北側(cè)農(nóng)業(yè)面源污染監(jiān)測(cè)站(巢湖烔煬鎮(zhèn)西宋村污水處理站)采集的處理站入水口(D)及出水口(E)水樣各6 份,另外還在監(jiān)測(cè)站周邊村莊的排污口(C)采集了6 份水樣。另在采集糞便樣本時(shí),在淮北昌農(nóng)收集豬糞便樣本(HB)的采樣點(diǎn)采集了該養(yǎng)殖廠的廢水處理系統(tǒng)進(jìn)水(ND)以及出水(NC)樣本各3份。水樣用500 mL無菌塑料瓶收集,沉積物樣品使用抓斗取樣器在距水面約100 cm 深度處采集。樣本于冰上儲(chǔ)存,并在6 h 內(nèi)運(yùn)送至實(shí)驗(yàn)室進(jìn)行處理。水體樣本使用0.22 μm 聚碳酸酯膜進(jìn)行過濾,所得濾膜儲(chǔ)存于-80 ℃以供后續(xù)分析。
1.2.2 糞便樣本采集
本研究共收集糞便樣品229 份,畜禽糞便(豬和雞)樣品取自皖江流域內(nèi)規(guī)?;B(yǎng)殖場。本研究一共采集了6 個(gè)不同地點(diǎn)的豬糞便樣本,其中包括從太湖縣收集的豬糞便樣本(PA)、金寨縣收集的豬糞便樣本(PI)和岳西縣收集的豬糞便樣本(PL)各5 份,從蚌埠固鎮(zhèn)收集的豬糞便樣本(BG)、淮北昌農(nóng)收集的豬糞便樣本(HB)、宿州褚蘭收集的豬糞便樣本(SC)、徐州昌農(nóng)收集的豬糞便樣本(XZ)各4份,在養(yǎng)殖場采集的豬糞便樣本共31 份。雞糞便樣本采集自皖江流域內(nèi)規(guī)?;B(yǎng)殖場,共分為5 組,編號(hào)為C、mC、L、LS 和S,樣本數(shù)量分別為9、6、15、15 份及15 份,共60 份。另有鵝糞(F)5 份。所有糞便采集均使用消毒的50 mL收集管,并儲(chǔ)存于冰盒,8 h內(nèi)送至實(shí)驗(yàn)室處理。
1.2.3 DNA提取及宏基因組測(cè)序
水體、糞便和土壤樣本用DNeasy PowerSoil?Pro Kit試劑盒提取DNA,使用通用引物341F(5'-CCTAC?GGGNGGCWGCAG-3' ) 和 805R (5'-GACTACH?VGGGTATCTAATCC-3')PCR 擴(kuò)增水中細(xì)菌的16S rDNA 基因高變區(qū)(V3~V4),PCR 產(chǎn)物經(jīng)2%瓊脂糖凝膠電泳驗(yàn)證。在整個(gè)DNA 提取過程中,使用超純水,以排除假陽性PCR 結(jié)果作為陰性對(duì)照的可能性。得到的擴(kuò)增子(PCR產(chǎn)物)經(jīng)純化后進(jìn)行濃度檢測(cè),合格后用于測(cè)序,擴(kuò)增子文庫的大小和數(shù)量分別在Agi?lent2100 生物分析儀和Illumina 的文庫定量試劑盒上進(jìn)行評(píng)估。
1.2.4 樣本構(gòu)成
為增加數(shù)據(jù)豐富度及可靠性,除了本研究所采樣本外,還使用其他已公布的巢湖水體數(shù)據(jù),如Zhang等[20]采集的18份巢湖流域水體樣本:具有農(nóng)業(yè)和生活污染背景(Agricultural and domestic pollution,ADPR)的河流包括雙橋河(CR1)、拓皋河(CR2、CR12)、雞裕河(CR3)、兆河(CR10)和玉溪河(CR11);工業(yè)和生活污染背景(Industrial and domestic pollution,IDPR)的河流包括南淝河(CR5)、塘西河(CR7)和杭埠河(CR9);農(nóng)業(yè)污染背景(Agricultural pollution,APR)的河流包括烔煬河(CR4)、十五里河(CR6)和派河(CR8);還包括湖中的6個(gè)采樣點(diǎn),南淝河口(CL1)、裕溪河(CL6)、兆河(CL3)以及東湖(CL4、CL5)和西湖(CL2)中心的樣本。該系列樣本采用有機(jī)玻璃儀器于水下50 cm深度人工采集,每個(gè)地點(diǎn)采集3個(gè)平行水樣,混合成1個(gè)水樣,下游處理與本研究相同。此外,本研究還選取了來自菜子湖與升金湖的白額雁(Anser albifrons)糞便樣本30 份[21]、升金湖的白頭鶴(Grus monacha)糞便樣本16份[22]。以及Pan等[23]采集的來自合肥市的87份人類糞便樣品。這些樣本的下游處理與本研究相同,且測(cè)序均為靶向細(xì)菌16S rDNA基因V3~V4區(qū)。本研究采集水體、糞便樣本的測(cè)序原始數(shù)據(jù)已上傳至NCBI,并可通過PRJNA783993進(jìn)行獲取。
1.3.1 FTL文庫構(gòu)建
已有研究表明,F(xiàn)TL 文庫中是否包含具有明確本地來源的樣本對(duì)溯源準(zhǔn)確度有較大影響,因此本研究選取巢湖流域北側(cè)農(nóng)業(yè)面源污染監(jiān)測(cè)站(巢湖烔陽鎮(zhèn)西宋村污水處理站)及周邊村莊的排污口樣本作為FTL 文庫中本地污染來源的代表樣品。此外,有研究報(bào)道,糞便文庫的高組內(nèi)變異度會(huì)對(duì)SourceTracker的溯源結(jié)果產(chǎn)生顯著影響[24]?;谶@項(xiàng)原則,本研究將野生水鳥糞便與污水樣本按原始樣本類型進(jìn)行了拆分,野生水鳥糞便拆分為白頭鶴(Grus monacha)與小白額雁(Anser albifrons)糞便,而所有污水樣本按處理前后及污水來源進(jìn)行了區(qū)分,以期最大程度消除糞便文庫的組內(nèi)變異對(duì)預(yù)測(cè)結(jié)果產(chǎn)生的影響。
1.3.2 基于16S rDNA測(cè)序的潛在病原菌豐度評(píng)估
通過VFDB 網(wǎng)站(http://www.mgc.ac.cn/VFs/)以及病理系統(tǒng)資源整合中心(PATRIC)的病原生物數(shù)據(jù),以及其他研究中的潛在病原數(shù)據(jù)[25-29],收集了包括159 個(gè)屬的潛在病原清單,之后根據(jù)屬名在美國生物安全協(xié)會(huì)網(wǎng)站(https://my.absa.org/tiki-index.php?page=Riskgroups)進(jìn)行檢索,記錄該屬內(nèi)生物安全等級(jí)為二級(jí)或三級(jí)的物種,于LPSN(The List of Prokary?otic names with Standing in Nomenclature)(https://www.bacterio.net/)網(wǎng)站下載該物種的參考16Sr RNA序列,如在LPSN 網(wǎng)站無法檢索到該物種,則從NCBI(http://www.ncbi.nlm.nih.gov/)的GenBank中檢索并下載對(duì)應(yīng)的16S rDNA 序列。最終構(gòu)建了包括51 個(gè)屬,444 個(gè)物種16S rDNA 序列的潛在病原數(shù)據(jù)庫。將聚類所得ASV序列通過BLASTN比對(duì)到建立的潛在病原數(shù)據(jù)庫,閾值設(shè)置為相似度≥98%、覆蓋度>99%,潛在病原的相對(duì)豐度是通過將鑒定為潛在病原的序列對(duì)應(yīng)的ASV豐度值與樣本總ASV豐度的比值來確定。
1.3.3 基于機(jī)器學(xué)習(xí)的微生物污染溯源解析
將不同類型水體或沉積物(即目標(biāo)樣本)設(shè)為Sink,微生物污染源或來源的樣品(即構(gòu)建的FTL 文庫樣本)為Source。分別使用SourceTracker2 以及FEAST 計(jì)算來自不同(Source)來源(人類及動(dòng)物糞便、豬場廢水處理系統(tǒng)進(jìn)水與出水、污水處理廠的進(jìn)水和出水、村莊污水口)的微生物群落對(duì)匯(Sink)環(huán)境(即巢湖流域的水體、河流沉積物)的潛在貢獻(xiàn)。SourceTracker2與FEAST兩種方法的區(qū)別在于他們是基于不同的算法來探究目標(biāo)樣本(Sink)中微生物污染源或進(jìn)行污染來源(Source)的分析。根據(jù)Source樣本和Sink 樣本的群落結(jié)構(gòu)分布,預(yù)測(cè)Sink 樣本中來源于各Source 樣本的組成比例。SourceTracker2 與FEAST 的分析使用默認(rèn)參數(shù)進(jìn)行。每個(gè)溯源軟件進(jìn)行5 次獨(dú)立運(yùn)行以計(jì)算每個(gè)潛在源的平均貢獻(xiàn)度及其標(biāo)準(zhǔn)偏差。然后通過相對(duì)標(biāo)準(zhǔn)偏差(Relative stan?dard deviation,RSD,D)計(jì)算平均貢獻(xiàn)度與標(biāo)準(zhǔn)偏差之間的比率,見公式(1)。
RSD 可以評(píng)估多個(gè)模型運(yùn)行的精密程度[30]。式中:S為標(biāo)準(zhǔn)偏差(也可以表示為SD);n為重復(fù)次數(shù),xˉ表示平均值。RSD 較高(≥100%)表明預(yù)測(cè)結(jié)果的可靠性低。
Wilcoxon 秩和檢驗(yàn)(Wilcoxon rank sum test)用于推斷兩個(gè)獨(dú)立樣本所來自的兩個(gè)總體分布位置是否有差別,通常在數(shù)據(jù)不是正態(tài)分布時(shí)使用。通過Wil?coxon 秩和檢驗(yàn)可以得到一個(gè)正態(tài)隨機(jī)變量Z,再用軟件或查正態(tài)分布表得到對(duì)應(yīng)的P值。如果P值較?。ū热缧∮诨虻扔诮o定的顯著性水平)則可以拒絕零假設(shè)。如果P值較大則沒有充分的證據(jù)來拒絕零假設(shè),但不意味著接受零假設(shè)。即在數(shù)據(jù)不是正態(tài)分布時(shí),可以使用Wilcoxon秩和檢驗(yàn)驗(yàn)證樣本之間的差異是否顯著。
1.3.4 測(cè)序數(shù)據(jù)處理
數(shù)據(jù)分析參考擴(kuò)增子分析流程EasyAmplicon(https://github. com/YongxinLiu/Easy Amplicon) 完成[21]。使用USEARCH[22]合并雙端序列,去除barcode和引物序列。通過unoise3 去噪獲得單堿基精度ASV,基于SILVA 數(shù)據(jù)庫去除嵌合體序列。根據(jù)SIL?VA 分類器(version2.2,http://sourceforge.net/projects/rdp-classifier/)(置信閾值0.7)獲取每個(gè)ASV 對(duì)應(yīng)的物種分類信息以及代表序列。設(shè)置測(cè)序深度閾值為30 000,使用vegan 包進(jìn)行等量重抽樣,通過R(4.0.3)包amplicon(1.11.1)計(jì)算Shannon、Simpson 及Chao1指數(shù)。通過R 包vegan(2.5.4)計(jì)算樣本Bray-Curtis 距離以進(jìn)行PCoA 分析。其余圖例均通過OmicStudio tools(https://www.omicstudio.cn/tool)以及R語言進(jìn)行繪制。
291 個(gè)樣本(包括228 個(gè)糞便樣本,63 個(gè)水體、沉積物樣本)中,共發(fā)現(xiàn)10 247 548 條原始序列,經(jīng)過序列去冗余,獲得了73 844 條獨(dú)特序列,經(jīng)過unoise3 去噪及基于silva 的去嵌合,聚類生成了包括21 062 條序列的ASV 集合,平均每個(gè)樣本為412 個(gè)ASVs,最低244個(gè)ASVs,最高444個(gè)ASVs。
為了研究數(shù)據(jù)集樣本的微生物多樣性,計(jì)算了Shannon、Simpson 以及Chao1 指數(shù),總體而言,糞便樣本多樣性指數(shù)水平均低于水體樣本。由圖1 可見,所有樣本中水體沉積物樣本具有最高的ASV 數(shù)量與物種多樣性水平,其次是巢湖水體樣本(Wilcoxon 秩和檢驗(yàn),P<0.001),而禽類糞便(包括野生水鳥、鵝與雞)具有最低的ASV數(shù)量與物種多樣性水平(Wilcoxon 秩和檢驗(yàn),P<0.01)。
圖1 樣本alpha多樣性指數(shù)(log10轉(zhuǎn)換)Figure 1 Differences in alpha diversity indices in all samples(log10 transformed)
經(jīng)過物種注釋,所有樣本共注釋到31 個(gè)門(圖2),分布最廣泛的門包括變形菌門(Proteobacteria)、放線菌門(Actinobacteria)、擬桿菌門(Bacteroidetes)、厚壁菌門(Firmicutes)、疣微菌門(Verrucomicrobia),其中糞便樣本以厚壁菌門為主導(dǎo)(平均相對(duì)豐度為55.89%),水體樣本則以變形菌門為主導(dǎo)(平均相對(duì)豐度為44.13%)。除野生水鳥外,糞便樣本門水平細(xì)菌集中分布于厚壁菌門、變形菌門與擬桿菌門中,這3 個(gè)門平均相對(duì)豐度之和占總數(shù)的97%以上,而野生水鳥中除這3 種門外,還含有較高相對(duì)豐度的放線菌門(平均13.83%)。水體樣本門水平細(xì)菌更為多樣,平均相對(duì)豐度在1%以上的有13個(gè)門。
圖2 細(xì)菌群落(組平均)組成Figure 2 Composition of microbial community
在屬水平上,假單胞菌屬(Pseudomonas,19.81%)、八疊球菌屬(Sporosarcina,11.27%)與節(jié)桿菌屬(Arthrobacter,9.45%)是野生水鳥中最主要的屬,大腸埃氏菌-志賀氏菌屬(Escherichia-Shigella,29.46%)是雞糞中最主要的屬,乳桿菌屬(Lactobacil?lus,18.9%)與大腸埃氏菌-志賀氏菌屬(13.64%)在鵝糞中廣泛分布,而人糞中表現(xiàn)出擬桿菌屬(Bacteroi?des,18.09%)與 普 雷 沃 氏 菌 屬_9(Prevotella_9,10.74%)的顯著富集,豬糞中則以不動(dòng)桿菌屬(Aci?netobacter,23.51%)為 主。hgcI_clade在 河 流 水 樣(10.23%)與廢水樣本(14.24%)中表現(xiàn)出明顯富集,不動(dòng)桿菌屬表現(xiàn)出在河水中的顯著富集(10.78%),此外,河流水樣中還發(fā)現(xiàn)了較高豐度的CL500-29_marine_group(5.8%)與 藍(lán) 細(xì) 菌聚 球藻 屬(Syn?echococcus,6.96%)。遺憾的是,基于silva 數(shù)據(jù)庫(v123 版本)的注釋結(jié)果,本研究的河流沉積物與巢湖水樣兩組樣本中分別有71.51%與79.47%的拼接后的測(cè)試樣本未分類到屬。
基于Bray-Curtis 距離對(duì)整體數(shù)據(jù)進(jìn)行了主坐標(biāo)分析(圖3),將所有數(shù)據(jù)分為糞便與水體兩個(gè)組進(jìn)行聚類分析。水體樣本的beta多樣性分析(圖3a)表明,豬場廢水與污水處理廠廢水樣本表現(xiàn)出較大的組內(nèi)變異,相比之下巢湖水體樣本和沉積物樣本則呈現(xiàn)明顯的聚集趨勢(shì)。糞便樣本中,除去各組中少量離群樣本,被分類為同一組的樣本(野生水鳥、雞糞、鵝糞、豬糞與人糞)各自均表現(xiàn)出顯著聚集(圖3b),此外,野生水鳥與豬糞、鵝糞樣本表現(xiàn)出明顯的聚集,說明其群落組成存在一定相似性。
圖3 樣本beta多樣性差異——主坐標(biāo)分析Figure 3 Principal coordinates analysis(PCoA)of the microbial community in different groups
通過將聚類得到的ASV 序列比對(duì)到自建病原數(shù)據(jù)庫,對(duì)所有樣本中潛在病原進(jìn)行評(píng)估,將與數(shù)據(jù)庫的BLAST(相似度≥97%,覆蓋度>99%)比對(duì)匹配上的病原菌按屬水平聚類(圖4)。結(jié)果顯示,所有樣本中共注釋到57 個(gè)潛在病原屬,包括145 個(gè)潛在病原物種,其中13 個(gè)潛在病原屬廣泛分布于所有樣本中,以Pseudescherichia、腸球菌屬(Enterococcus)、鏈球菌屬(Streptococcus)與腸桿菌屬(Enterobacter)為代表(表1)。在所有樣本中,鵝糞、豬場廢水與巢湖水樣本潛在病原總平均相對(duì)豐度最高,分別為0.051%、0.016%與0.011%。從潛在病原數(shù)量上來看,含潛在病原屬數(shù)量最多的為野生水鳥、廢水與人糞(分別為48、47、46個(gè)屬),值得注意的是,豬場廢水獨(dú)有3種潛在病原屬,分別為Alloprevotella、福賽坦氏菌(Tannerella)與密螺旋體屬(Treponema),而人糞獨(dú)有一個(gè)潛在病原屬,即薩特菌屬(Sutterella)。
表1 所有樣本共有的潛在病原的平均相對(duì)豐度(按屬聚類)Table 1 Average relative abundance of potential pathogens common to all samples(clustered at the genus level)
圖4 潛在病原在樣本間的分布(平均相對(duì)豐度)Figure 4 Distribution of potential pathogens among all samples(mean relative abundance)
將不同類型水體或沉積物設(shè)為Sink,構(gòu)建的FTL文庫樣本作為Source,來判別水體/沉積物樣本潛在的污染來源。對(duì)于FEAST 以及SourceTracker 兩個(gè)溯源軟件,分別進(jìn)行5 次獨(dú)立運(yùn)行以計(jì)算溯源結(jié)果的RSD。兩個(gè)溯源軟件對(duì)于河流水體污染來源的判定結(jié)果較為一致(圖5)。
圖5 基于NGS數(shù)據(jù)集的微生物溯源分析Figure 5 Microbial source tracking analysis based on NGS dataset
就兩個(gè)軟件預(yù)測(cè)結(jié)果的穩(wěn)定性(RSD)來看(圖6),F(xiàn)EAST的運(yùn)算結(jié)果表現(xiàn)出比SourceTracker更低的RSD 值,其樣本平均RDS 值多分布于0.25 及0.50 左右,而SourceTracker 預(yù)測(cè)值的RSD 計(jì)算結(jié)果分布在1.0及以上的偏多。
圖6 溯源軟件5個(gè)獨(dú)立運(yùn)行結(jié)果的相對(duì)標(biāo)準(zhǔn)偏差Figure 6 Relative standard deviation generated in 5 independent runs of the traceability software
FEAST的預(yù)測(cè)結(jié)果表明,沉積物樣本的污染來源主要可被劃分為豬場廢水出水、豬場原始廢水以及白頭鶴糞便,而相較FEAST 而言,SourceTracker 對(duì)于樣本污染貢獻(xiàn)程度的判定更趨于保守。但綜合二者的結(jié)果來看,F(xiàn)EAST與SourceTracker溯源軟件對(duì)于河流水體污染來源的判定結(jié)果一致性較高,均將主要的潛在污染來源歸類為村莊排污口以及污水處理廠排污口樣本,F(xiàn)TL 文庫中小白額雁、人類以及雞糞幾乎在所有樣本中都不能預(yù)測(cè)出。對(duì)巢湖水污染的預(yù)測(cè)結(jié)果中,兩個(gè)溯源軟件都判定豬場廢水出水是主要的污染來源。
研究表明,畜禽腸道定殖的微生物主要有厚壁菌
門(Firmicutes)、擬桿菌門(Bacteroidetes)、變形菌門(Proteobacteria)和放線菌門(Actinobacteria)等,厚壁菌及其家族成員在畜禽糞便樣品中具有較高的相對(duì)豐度。在所有樣本中,水體沉積物樣本具有最高的ASV數(shù)量與物種多樣性水平,而禽類糞便樣本具有最低的ASV 數(shù)量與物種多樣性水平。沉積物作為一個(gè)營養(yǎng)豐富的棲息地,為微生物的生長提供了良好條件[31],例如微藻、浮游植物、硅藻、細(xì)菌、浮游動(dòng)物以促進(jìn)、競爭或共生的方式生活在沉積物上,使水體沉積物發(fā)展出豐富的生物多樣性[32]。而糞便微生物憑借共生關(guān)系存活于宿主腸道,其群落組成受到微生物間互作及宿主的免疫反應(yīng)等因素影響,并且動(dòng)物腸道是一個(gè)高度厭氧的環(huán)境,對(duì)糞便微生物群落施加了特定的選擇壓力,導(dǎo)致糞便微生物群落多樣性低于自然水生環(huán)境。
在不同類型的水樣本中,細(xì)菌群落的多樣性存在顯著差異,巢湖水樣的菌群豐度明顯高于其他水樣,這表明與人類活動(dòng)相關(guān)的較高濃度的有機(jī)和無機(jī)物可能會(huì)降低河流水生細(xì)菌群落的物種豐富度,這一結(jié)果與之前的研究結(jié)果一致[33]。對(duì)于研究采集的具有農(nóng)業(yè)和生活污染背景的河流水樣而言,物種豐富度和均勻度的降低可能是由于某些物種的高度富集,這些物種很好地適應(yīng)了有機(jī)或無機(jī)廢水中的特定條件,并且能夠通過使用各種營養(yǎng)物質(zhì)來抵抗或承受環(huán)境波動(dòng)[34]。值得注意的是,有相關(guān)研究表明,水體中的糞便污染情況可能會(huì)受到季節(jié)的影響,不同季節(jié)水體中主要的污染源可能會(huì)有所差異[35-36]。此外,在對(duì)水體樣本進(jìn)行beta多樣性差異(主坐標(biāo)分析)分析時(shí)發(fā)現(xiàn),豬場廢水與污水處理廠廢水樣本表現(xiàn)出較大的組內(nèi)變異,這可能是由于“豬場廢水”與“污水”組同時(shí)包含了原始廢水與處理后廢水,而處理過程對(duì)細(xì)菌群落產(chǎn)生了較大影響,因此導(dǎo)致上述差異。對(duì)巢湖水的污染預(yù)測(cè)結(jié)果中,兩個(gè)溯源軟件都判定豬場廢水出水是主要的污染來源,但FEAST 預(yù)測(cè)豬場原始廢水貢獻(xiàn)了平均2.19%的污染,而在SourceTracker 中僅為0.4%。值得注意的是,CL3樣本呈現(xiàn)出與其他巢湖水樣不一致的污染預(yù)測(cè)結(jié)果,兩個(gè)溯源軟件均預(yù)測(cè)其有(23.0±0.5)%的污染來自白頭鶴,Zhang等[19]對(duì)該采樣點(diǎn)的分析指出,該點(diǎn)與其他湖水樣本存在明顯差異,其含有較高豐度的厚壁菌門(24.13%),而該菌門在其他湖水樣本中幾乎沒有檢出。兩個(gè)溯源軟件一致預(yù)測(cè)存在高水平白頭鶴糞便污染的樣本還有CR4(SourceTrack?er-5.61%與FEAST-9.59%),該樣本同樣含有較高的厚壁菌門細(xì)菌(47.77%),高豐度厚壁菌門細(xì)菌的存在或許是該預(yù)測(cè)結(jié)果的主要驅(qū)動(dòng)因素。另外,F(xiàn)EAST的預(yù)測(cè)結(jié)果表明,APR與ADPR背景的河流普遍存在潛在的豬糞污染,污染水平從0.205%(CR3)到4.220%(CR8)。值得注意的是,由于本研究所選污水樣本的群落組成在一定程度上可能與糞便樣本產(chǎn)生交叉,因此溯源軟件對(duì)村莊污水處理站以及豬場污水樣本較高污染貢獻(xiàn)度的預(yù)測(cè)可能存在一定的誤差,存在一定的假陽性率。
對(duì)于FEAST 以及SourceTracker 兩個(gè)溯源軟件來說,總體上看,兩個(gè)基于細(xì)菌群落MST 的溯源軟件對(duì)于巢湖水體以及河流沉積物的預(yù)測(cè)結(jié)果存在較大差異,相較FEAST 而言,SourceTracker 對(duì)于FTL 樣本污染貢獻(xiàn)程度的判定更趨于保守。在FEAST 的預(yù)測(cè)結(jié)果中,沉積物樣本的污染來源主要被劃分為豬場廢水出水、白頭鶴糞便以及豬場原始廢水,以FR組樣本為例,F(xiàn)EAST 預(yù)測(cè)其污染源平均有18.50%來自豬場廢水、8.98%來自白頭鶴、4.65%來自豬場原始廢水,而SourceTracker 對(duì)于FR 組的預(yù)測(cè)則僅有5.27%來自豬場廢水出水、0.49%來自白頭鶴、0.81%來自豬場原始廢水。在HR 以及XR 組中,F(xiàn)EAST 預(yù)測(cè)存在3.98%~10.30%的豬場廢水出水、3.67%~5.39%的白頭鶴以及1.69%~5.40%的豬場原始廢水污染,而在Source?Tracker 的預(yù)測(cè)結(jié)果中,該比例分別降至0.04%~1.54%、0.08%~0.24%與0.18%~0.70%。
綜上所述,盡管基于NGS 的MST 具有眾多優(yōu)勢(shì),但其在研究設(shè)計(jì)方面仍然存在較高要求,后續(xù)研究中,存在更少ASV 交叉、地理聯(lián)系更加緊密的FTL 文庫或許能使溯源預(yù)測(cè)結(jié)果更加精準(zhǔn)。
(1)不同生境樣本中,微生物多樣性存在明顯差異。水樣本的微生物群落多樣性普遍高于人類及動(dòng)物糞便樣本,其中水體沉積物與湖泊水體樣本微生物多樣性最豐富。樣本/宿主類型是主導(dǎo)細(xì)菌群落差異的主要因素,水生環(huán)境樣本中河流沉積物與污水處理廠細(xì)菌群落存在一定相似性,糞便樣本中豬糞、野生水鳥與鵝糞存在一定相似性。
(2)變形菌門、放線菌門、擬桿菌門與厚壁菌門在糞便與水體樣本中廣泛存在,但其相對(duì)豐度存在差異。糞便樣本以厚壁菌門(平均相對(duì)豐度為55.89%)為主,水體樣本則以變形菌門(平均相對(duì)豐度為44.13%)為主。與本地病原數(shù)據(jù)庫的比對(duì)結(jié)果顯示,以Pseudescherichia、腸球菌屬、鏈球菌屬與腸桿菌屬為代表的13 種潛在病原在水生環(huán)境與糞便樣本中廣泛分布,這些跨生境樣本出現(xiàn)的潛在病原建議在后續(xù)研究與監(jiān)測(cè)中給予重點(diǎn)關(guān)注。
(3)溯源分析結(jié)果表明,河水樣本最主要的污染來源是村莊排污口與污水處理廠排污口樣本;沉積物與湖水樣本則預(yù)測(cè)出存在豬場排污水與野生水鳥糞便的污染;所有樣本未檢測(cè)到來自人糞與雞糞的污染。
(4)以自然水體及河流沉積物作為目標(biāo)樣本,溯源軟件SourceTracker與FEAST對(duì)廣泛污染源(包括野生水鳥、家畜、家禽糞便以及生活與養(yǎng)殖業(yè)污水)的潛在污染貢獻(xiàn)度的預(yù)測(cè)結(jié)果總體相似,但相對(duì)同一污染源而言,SourceTracker 對(duì)污染貢獻(xiàn)比例的判定偏低??傮w來看,F(xiàn)EAST的預(yù)測(cè)結(jié)果比SourceTracker擁有更低的RSD值,因此,F(xiàn)EAST模型對(duì)潛在污染源的預(yù)測(cè)結(jié)果更具可信度。在實(shí)際調(diào)研中,推薦結(jié)合NGS與傳統(tǒng)污染評(píng)估方法,以準(zhǔn)確探明污染來源,指導(dǎo)水質(zhì)管理。