王 萌,金小偉,林曉龍,杜麗娜,崔永德,吳小平,孫紅英,謝志才,王新華,王備新,*
1 南京農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,南京 210095 2 中國環(huán)境監(jiān)測總站,北京 100012 3 南開大學(xué)生命科學(xué)學(xué)院,天津 300071 4 廣西師范大學(xué)珍稀瀕危動(dòng)植物生態(tài)與環(huán)境保護(hù)教育部重點(diǎn)實(shí)驗(yàn)室,桂林 541006 5 中國科學(xué)院水生生物研究所淡水生態(tài)與生物技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,武漢 430072 6 南昌大學(xué)生命科學(xué)學(xué)院,南昌 330031 7 南京師范大學(xué)生命科學(xué)學(xué)院,南京 210023
淡水大型底棲無脊椎動(dòng)物簡稱底棲動(dòng)物,是指生活史的全部或部分生活在水體底部,個(gè)體大小不能通過500 μm孔徑網(wǎng)篩的無脊椎動(dòng)物[1]。常見的有節(jié)肢動(dòng)物門昆蟲綱的水生昆蟲、軟甲綱的淡水蟹、鉤蝦,軟體動(dòng)物門的蚌類、螺類,環(huán)節(jié)動(dòng)物門的寡毛綱、蛭綱,以及扁形動(dòng)物門的渦蟲等[1]。底棲動(dòng)物是維護(hù)水生態(tài)系統(tǒng)結(jié)構(gòu)與功能完整性的重要生物類群。它具有分布廣泛,生活周期長,對水質(zhì)變化敏感等特點(diǎn),因此是水質(zhì)監(jiān)測與評價(jià)中應(yīng)用最廣泛的生物類群[2]。近些年,日益增強(qiáng)的人類活動(dòng)干擾、水污染和氣候變化導(dǎo)致底棲動(dòng)物多樣性銳減,嚴(yán)重威脅水生態(tài)系統(tǒng)健康[3]。如何科學(xué)、快速和準(zhǔn)確地為淡水生物多樣性和水質(zhì)評價(jià)的研究與實(shí)踐提供大量底棲動(dòng)物數(shù)據(jù),已是當(dāng)前水生態(tài)環(huán)境管理關(guān)注的重要問題。
傳統(tǒng)以形態(tài)學(xué)鑒定為基礎(chǔ)的底棲動(dòng)物監(jiān)測方法存在成本高、耗時(shí)長、代表性低、專業(yè)性強(qiáng)和精確性不夠高等缺陷。首先,以生物個(gè)體為目標(biāo)的采樣方法需要消耗較大的人力財(cái)力,并在采樣空間方面存在局限性[4]。其次,跨越數(shù)個(gè)不同動(dòng)物門類的底棲動(dòng)物形態(tài)學(xué)鑒定高度依賴分類專業(yè)人員,然而動(dòng)物分類研究者數(shù)量正在不斷減少。再者,采集到的水生昆蟲絕大多數(shù)是幼體,科級水平以下的鑒定特征模糊甚至缺乏,往往難以準(zhǔn)確鑒定到屬和種,因此無法準(zhǔn)確識別物種與脅迫因子間的專一響應(yīng)關(guān)系,有可能降低評價(jià)等級的準(zhǔn)確性和精確性[5-6]。綜上,傳統(tǒng)監(jiān)測方法的缺陷使其難以適應(yīng)當(dāng)前水質(zhì)監(jiān)測要求的大規(guī)模、高頻率、高要求的管理需求,因此急需新的調(diào)查方法滿足現(xiàn)階段日益增長的對水生態(tài)環(huán)境和生物多樣性的評估需求。
近年來,環(huán)境DNA-宏條形碼技術(shù)通過對環(huán)境樣品中混合DNA進(jìn)行高通量測序和比對,能夠快速大規(guī)模地得到生物多樣性鑒定信息和群落組成,極大得革新了生物多樣性調(diào)查方法,現(xiàn)已被廣泛應(yīng)用于土壤和水生態(tài)環(huán)境的生物多樣性監(jiān)測中[7-10]。相比于傳統(tǒng)方法,環(huán)境DNA-宏條形碼技術(shù)不需大量的人力物力,成本低、操作簡便,因此更適合于大尺度的流域生物多樣性監(jiān)測[11]。同時(shí),該方法靈敏度高,即使在物種密度很低的情況下也能準(zhǔn)確檢測到目標(biāo)物種的存在[4]。此外,環(huán)境DNA-宏條形碼技術(shù)可以不依賴分類人員同時(shí)對跨門類物種進(jìn)行監(jiān)測,并且不受發(fā)育時(shí)期的限制,完成物種的準(zhǔn)確鑒定[4]。因此,環(huán)境DNA-宏條形碼技術(shù)被認(rèn)為是現(xiàn)階段實(shí)現(xiàn)水生態(tài)環(huán)境快速、大尺度和大樣本物種監(jiān)測最有發(fā)展前景的方法[11]。
目前,環(huán)境DNA-宏條形碼技術(shù)對底棲動(dòng)物的檢測和鑒定仍存在部分問題和不足,制約其進(jìn)一步在水質(zhì)監(jiān)測中的應(yīng)用。主要問題有低豐度物種漏檢、物種鑒定錯(cuò)誤、采樣流程與方法不統(tǒng)一以及生物量精確估測困難等[11]。這些問題在技術(shù)層面體現(xiàn)在樣品采集與處理流程、分子標(biāo)記選擇、引物設(shè)計(jì)、PCR偏好性,以及參考數(shù)據(jù)庫的完整性等影響因素[12-14]。因此在推動(dòng)環(huán)境DNA-宏條形碼技術(shù)應(yīng)用底棲動(dòng)物監(jiān)測時(shí)應(yīng)重點(diǎn)關(guān)注這些關(guān)鍵影響因素。近十年來,針對以上關(guān)鍵影響因素國內(nèi)外開展了比較多的優(yōu)化研究[14-19]。然而其中大部分研究較為分散,部分結(jié)論不一致,且缺少系統(tǒng)性的分析和比較,制約了底棲動(dòng)物環(huán)境DNA-宏條形碼監(jiān)測技術(shù)方案的規(guī)范和優(yōu)化,因此亟需對相關(guān)問題進(jìn)行系統(tǒng)性的梳理與整合。鑒于此,本文對環(huán)境DNA-宏條形碼的概念和在底棲動(dòng)物監(jiān)測的應(yīng)用進(jìn)行了綜述,重點(diǎn)針對影響環(huán)境DNA-宏條形碼技術(shù)用于底棲動(dòng)物監(jiān)測和水質(zhì)評價(jià)的關(guān)鍵因素及其相應(yīng)優(yōu)化進(jìn)行了分析總結(jié),并基于此提出提高環(huán)境DNA-宏條形碼技術(shù)監(jiān)測底棲動(dòng)物效率和準(zhǔn)確率的有效途徑,期望為基于環(huán)境DNA-宏條形碼技術(shù)的底棲動(dòng)物監(jiān)測方案的標(biāo)準(zhǔn)化和規(guī)范化提供建議和參考,最后對該技術(shù)在底棲動(dòng)物監(jiān)測和水質(zhì)評價(jià)中的最新發(fā)展方向進(jìn)行了展望。
環(huán)境DNA概念最早于1987年提出,用于從沉積物中提取微生物的DNA,2000年左右開始引入生態(tài)學(xué)領(lǐng)域[20]。環(huán)境DNA(environmental DNA,eDNA)是指從土壤、水和大氣等環(huán)境樣品中直接提取的不做任何分離得到的生物釋放的游離DNA片段的總和[20]。具體包括微生物、動(dòng)物和植物不同物種本身以及向環(huán)境中釋放的分泌物、唾液、精子、糞便和脫落的皮膚等一系列降解程度不同的各種DNA混合物[20]。環(huán)境DNA-宏條形碼技術(shù)(eDNA metabarcoding)指從土壤、水等環(huán)境采樣提取總DNA片段,使用通用引物進(jìn)行PCR擴(kuò)增并結(jié)合高通量測序,得到上百萬條序列,再與已有數(shù)據(jù)庫中的序列信息進(jìn)行比對,從而一次性對環(huán)境樣品中的多個(gè)物種或類群進(jìn)行快速、大規(guī)模鑒定[10]。該方法能夠有效檢測出傳統(tǒng)方法未檢測到的種類,同時(shí)能夠?qū)Υ蟛糠治锓N進(jìn)行屬或種級別的準(zhǔn)確鑒定。目前環(huán)境DNA-宏條形碼技術(shù)在水生生態(tài)系統(tǒng)中的應(yīng)用主要集中在物種多樣性調(diào)查[21]、入侵和稀有物種檢測[22]以及目標(biāo)生物相對豐度、種群大小、分布和發(fā)生動(dòng)態(tài)檢測等方面[23]。2008年,環(huán)境DNA-宏條形碼技術(shù)首次應(yīng)用于入侵水生生物美國牛蛙(Ranacatesbeiana)的監(jiān)測[22]。此后其他研究人員先后利用該技術(shù)對亞洲鯉科魚類中的鰱(Hypophthalmichthysmolitrix)和鳙(H.nobilis)[24]、藍(lán)腮太陽魚(Lepomismacrochirus)[25]和新西蘭泥蝸牛(Potamopyrgusantipodarum)[26]等物種成功進(jìn)行了監(jiān)測。
2011年,Hajibabaei等[27]首次證明環(huán)境DNA-宏條形碼技術(shù)適用于底棲動(dòng)物多樣性監(jiān)測。隨后的研究進(jìn)一步證明該技術(shù)對環(huán)境敏感類群蜉蝣目、毛翅目和襀翅目(蜉蝣目Ephemeroptera、襀翅目Plecoptera和毛翅目Trichoptera昆蟲,簡稱EPT昆蟲)物種有良好的檢出效果[28-29]。Elbrecht和Leese[30]的模擬實(shí)驗(yàn)進(jìn)一步證明環(huán)境DNA-宏條形碼技術(shù)對大部分底棲動(dòng)物的檢出率較高,總體檢出率達(dá)98%,其中EPT的檢出率均為100%。Beermann等[31]對濕地?fù)u蚊的研究表明,環(huán)境DNA-宏條形碼技術(shù)對搖蚊的檢出率比傳統(tǒng)調(diào)查方法高70%以上。當(dāng)前,環(huán)境DNA-宏條形碼技術(shù)已經(jīng)開始從獨(dú)立樣點(diǎn)或者特定物種監(jiān)測向大尺度、大樣本監(jiān)測和評估轉(zhuǎn)變(表1)[32,39]?;诃h(huán)境DNA-宏條形碼技術(shù)的生物監(jiān)測被稱為“Biomonitoring 2.0”[40],該技術(shù)的廣泛應(yīng)用標(biāo)志著生物多樣性監(jiān)測進(jìn)入全新的分子時(shí)代。環(huán)境DNA-宏條形碼技術(shù)進(jìn)行底棲動(dòng)物多樣性監(jiān)測和水質(zhì)評價(jià)具有廣闊的發(fā)展前景,然而相比國外目前國內(nèi)相關(guān)研究較少[41-42],因此需要更多的方法學(xué)和應(yīng)用研究來推動(dòng)我國基于環(huán)境DNA-宏條形碼的水質(zhì)監(jiān)測的發(fā)展。
表1 環(huán)境DNA-宏條形碼技術(shù)監(jiān)測淡水底棲動(dòng)物典型研究示例Table 1 Examples of environmental DNA (eDNA) metabarcoding technique for biomonitoring of freshwater macrozoobenthos
環(huán)境DNA-宏條形碼技術(shù)對水生態(tài)環(huán)境監(jiān)測的一般操作流程主要包括:樣品采集、eDNA提取、PCR擴(kuò)增、eDNA高通量測序和序列生物信息學(xué)分析(圖1),技術(shù)層面上影響環(huán)境DNA-宏條形碼技術(shù)監(jiān)測效率和準(zhǔn)確性的關(guān)鍵因素主要在于不同的采樣方法與流程、分子標(biāo)記選擇、引物設(shè)計(jì)、PCR偏好性以及DNA條形碼參考數(shù)據(jù)庫的完整性等[11-12](圖2)。
圖1 環(huán)境DNA-宏條形碼技術(shù)的一般操作流程Fig.1 The basic workflow of environmental DNA (eDNA) metabarcoding
圖2 環(huán)境DNA-宏條形碼技術(shù)在底棲動(dòng)物監(jiān)測應(yīng)用中的關(guān)鍵問題與優(yōu)化策略Fig.2 Critical factors influencing the application of environmental DNA metabarcoding in macrozoobenthos monitoring and their optimized strategies
與eDNA樣品采集方法相關(guān)的優(yōu)化研究是環(huán)境DNA-宏條形碼研究的熱點(diǎn)方向之一[20,40]。底棲動(dòng)物的采樣方法對最后的檢測結(jié)果有著顯著影響,目前水樣法和混合組織樣法是獲取底棲動(dòng)物eDNA的兩種主要方法。
2.1.1水樣法
水樣法指通過水環(huán)境樣本進(jìn)行eDNA的富集,現(xiàn)階段水樣eDNA的采集方法主要有兩種:沉淀法和過濾法[43]。沉淀法[21]特點(diǎn)是不過濾水樣,直接加入氯化鈉和乙醇并結(jié)合離心操作獲取eDNA,更適用于原核生物細(xì)菌等的獲取。過濾法則通過過濾水樣將eDNA截留在濾膜上,效果取決于過濾孔徑大小[43]。無論在靜水和流水中,對于底棲動(dòng)物而言,采用過濾法eDNA捕獲率最高[43]。采集水樣量也是影響物種檢測準(zhǔn)確度和檢出率的重要因素。根據(jù)研究對象不同,每個(gè)重復(fù)水樣的采集量從15 mL到10 L不等[16,44]。一般來說采集量大時(shí)樣品代表性較好,但同時(shí)采樣難度和后續(xù)工作量也顯著增加,目前底棲動(dòng)物eDNA的水樣采集量一般是1 L或2 L[45]。當(dāng)目標(biāo)生物密度較低或調(diào)查江河、湖泊等大型水體時(shí),應(yīng)適當(dāng)增加采樣重復(fù)數(shù)以及單次水樣取樣量[46],過少的水樣量以及無重復(fù)樣本都可能會(huì)導(dǎo)致物種檢出率降低甚至數(shù)據(jù)無效。
水樣法是淡水生態(tài)多樣性監(jiān)測的常用方法。然而由于水的流動(dòng)性,流水中的eDNA會(huì)沿河網(wǎng)向下游擴(kuò)散,從而影響下游真實(shí)的物種豐富度和多樣性[47]。因此水樣法更適合流域尺度的物種多樣性調(diào)查,但無法重建微觀尺度下的生物多樣性空間分布模式[48]。此外,水環(huán)境樣本的異質(zhì)性和采樣的隨機(jī)性也常導(dǎo)致不穩(wěn)定的檢出結(jié)果[49,50]。近期一些研究表明水樣中的底棲動(dòng)物檢測率僅有傳統(tǒng)形態(tài)學(xué)采樣方法的1/3,且對一些關(guān)鍵指示生物的檢測較為困難[51]。
2.1.2混合組織樣法
混合組織樣法是將全部個(gè)體或部分混合后進(jìn)行研磨,然后基于均質(zhì)化后的混合組織勻漿(bulk sample)進(jìn)行總DNA提取的方法。大部分底棲動(dòng)物調(diào)查時(shí)先獲得踢網(wǎng)樣品,然后進(jìn)行分揀,去除其中的雜質(zhì)、底泥以及植物和藻類等非目標(biāo)有機(jī)物后再對目標(biāo)樣品研磨均一化后提取eDNA[32,52]。少數(shù)研究不進(jìn)行分揀,底棲動(dòng)物樣品和雜質(zhì)混合在一起研磨后提取eDNA[15,27,37]。一般認(rèn)為不進(jìn)行分揀時(shí)樣品成分往往較為復(fù)雜,包含多種PCR抑制劑,影響DNA的提取和PCR擴(kuò)增效率[18,53]。但近期一些研究發(fā)現(xiàn)樣品中的雜質(zhì)不影響重要指示生物的檢測[54],甚至未分揀的樣品檢測率高于分揀樣品與水環(huán)境樣本[55]。
混合組織樣法的優(yōu)點(diǎn)在于DNA的提取率高,但缺點(diǎn)是損失了相應(yīng)的憑證標(biāo)本,導(dǎo)致無法進(jìn)行后續(xù)研究。鑒于此,Hajibabaei等[52]提出了一種無損提取法(non-deconstructive method),即通過樣品酒精保存液中提取eDNA來替代從組織混合樣中提取eDNA。該方法能夠成功檢測到大部分底棲物種,其底棲動(dòng)物檢測率僅略低于混合組織樣法(87%vs89%)[17,56-58]。研究表明70%—96%濃度的酒精保存液都適用于提取混合DNA[17,57,59],且酒精浸泡后取樣時(shí)間的長短對于物種檢測率影響并不顯著[17]。早期酒精保存液法提取eDNA要先進(jìn)行酒精的蒸發(fā)再進(jìn)行DNA的提取[52,57],步驟繁瑣不利于大規(guī)模酒精樣品的處理。近期一些研究者對此進(jìn)行了優(yōu)化,一方面省略樣品分揀,對酒精保存液進(jìn)行二次過濾來提取eDNA,顯著縮減處理的時(shí)間和步驟[59];另一方面通過一系列方法(超聲波、震蕩、冷凍)增加DNA的釋放率,進(jìn)一步提高該方法的檢測率[59]。酒精保存液法的優(yōu)點(diǎn)在于保存了憑證標(biāo)本的完整性,但其在物種檢測率上仍低于混合組織樣法[17,52]。此外,該方法容易造成少數(shù)物種漏檢,尤其是外殼骨化強(qiáng)烈的物種如鞘翅目、帶殼的軟體動(dòng)物以及帶巢生活的一些毛翅目種類[17,59]。
綜上,當(dāng)進(jìn)行一些重點(diǎn)指示生物如EPT昆蟲多樣性監(jiān)測時(shí),酒精保存液法對憑證標(biāo)本無損傷、節(jié)省時(shí)間,是可替代組織樣法一種方法。而當(dāng)對整個(gè)底棲動(dòng)物類群多樣性做評估時(shí)建議采用常規(guī)的混合組織樣方法進(jìn)行監(jiān)測[17]。
選取合適的分子標(biāo)記與擴(kuò)增引物是環(huán)境DNA-宏條形碼擴(kuò)增成功的關(guān)鍵。理想的適用于環(huán)境DNA-宏條形碼監(jiān)測的分子標(biāo)記應(yīng)同時(shí)具備高度保守區(qū)域和高度可變區(qū)域,前者便于通用引物設(shè)計(jì),后者有助于物種識別[60-61]。動(dòng)物線粒體細(xì)胞色素氧化酶COI基因保守度適中,在不同物種之間有良好的解析度,并且現(xiàn)有數(shù)據(jù)庫最為全面,是目前最常用的標(biāo)記基因[30]。然而COI作為分子標(biāo)記也有著顯而易見的缺陷,體現(xiàn)在COI基因作為一個(gè)蛋白編碼基因,第三位密碼子的突變率較高,在不同物種中差異較大,導(dǎo)致難以設(shè)計(jì)物種覆蓋度較為全面的通用引物[62]。此外,基于COI基因的引物容易引起一些優(yōu)勢物種的過度擴(kuò)增,從而導(dǎo)致一些低豐度和難擴(kuò)增物種檢測不到[13]和物種生物量估測不準(zhǔn)確[12,63]。
鑒于以上COI基因的缺陷,一部分研究者致力于尋找能夠替代COI基因的其他分子標(biāo)記。此類研究主要集中在16S rRNA、18S rRNA等基因標(biāo)記[14,61]。Elbrecht等[14]通過模擬實(shí)驗(yàn)驗(yàn)證16S rRNA相較COI基因在底棲動(dòng)物中具有更高的檢測率,尤其昆蟲綱的檢測率接近100%。此外,16S rRNA引物偏好性較小,對生物量的估測也更為準(zhǔn)確,但其對除昆蟲綱以外的其他底棲動(dòng)物檢測率不佳[14,64]。Ficetola等[64]比對16S rRNA、18S rRNA和COI基因標(biāo)記在環(huán)境DNA監(jiān)測中的效果發(fā)現(xiàn),18S rRNA通用性最強(qiáng)但分辨率較差,更適合對生物多樣性做整體評估,而COI基因種級界定效果最佳。16S rRNA、18S rRNA相較COI基因具有更廣泛的物種覆蓋度,然而缺少像COI基因一樣強(qiáng)大而廣泛的參考數(shù)據(jù)庫,物種比對難以達(dá)到滿意的精度[14]。
綜上可知,沒有單獨(dú)一個(gè)基因標(biāo)記能夠完美實(shí)現(xiàn)宏條形碼技術(shù)監(jiān)測對于物種覆蓋度和解析度的要求。因此我們建議在進(jìn)行eDNA監(jiān)測時(shí)將16S rRNA或其他分子標(biāo)記擴(kuò)增的結(jié)果作為COI基因的補(bǔ)充[14]?;蛘咴赑CR擴(kuò)增時(shí)中采用多分子標(biāo)記(multiple primers)的策略[64-65](例如16S-COI、18S-COI、COI-COII),兼顧物種的覆蓋度和精確性[66-67],并利用COI基因強(qiáng)有力的參考數(shù)據(jù)庫進(jìn)行物種的注釋[14]。
引物的設(shè)計(jì)在eDNA監(jiān)測中至關(guān)重要,合適的引物可以顯著提高eDNA的擴(kuò)增質(zhì)量并減少引物的偏好性[19]?,F(xiàn)階段引物設(shè)計(jì)的主要思路是設(shè)計(jì)COI基因的高簡并性引物,增加通用性的同時(shí)盡可能地減少其引物偏好性。目前效果較好的有Geller等[68]設(shè)計(jì)的COI基因通用引物jgHCO2198和jgLCO1490,該引物適用于所有后生動(dòng)物;Hajibabaei等[52]針對底棲動(dòng)物設(shè)計(jì)的三組高簡并性COI引物。目前由Elbrecht和Leese[30]設(shè)計(jì)的高兼并性COI引物BF1/BF2和BR1/BR2不僅對底棲動(dòng)物檢測率顯著高于傳統(tǒng)的COI引物和16S rRNA,同時(shí)減少了其擴(kuò)增偏好性。
引物設(shè)計(jì)的另一思路是采用短片段引物(mini-barcode)。由于環(huán)境DNA-宏條形碼研究中廣泛存在高度降解的短片段DNA和高通量測序短的特點(diǎn),短片段引物在底棲動(dòng)物環(huán)境DNA-宏條形碼檢測中更有優(yōu)勢[35]。當(dāng)前應(yīng)用的有Leray等[69]設(shè)計(jì)出的短片段引物(313 bp)mlCOlintF/mlCOlintR和Vamos等[70]設(shè)計(jì)出的短片段引物fwh1 set、fwh2 set(擴(kuò)增長度分別為178 bp和205 bp)。相比傳統(tǒng)通用引物(如LCO1490/HCO2198)與較為成熟的高兼并性引物(如BF1/BF2和BR1/BR)[30],短片段引物所含信息相對較少,引物偏好性較高,但對于短片段DNA擴(kuò)增效率更高。因此在樣品保存較好、eDNA降解程度小時(shí),建議使用高兼并性COI引物如BF1/BR1和BF2/BR2。如果樣品DNA高度降解,使用短片段引物會(huì)使擴(kuò)增更為有效。
引物設(shè)計(jì)好后更重要的是如何評價(jià)其擴(kuò)增的效率和特異性。新設(shè)計(jì)的引物應(yīng)通過模擬實(shí)驗(yàn)和電腦檢測(e.g.In silicon PCR軟件)的雙重驗(yàn)證后方可大規(guī)模地應(yīng)用[30,60-61,71]。MacDonald等[72]總結(jié)出在環(huán)境DNA-宏條形碼研究中引物設(shè)計(jì)和評價(jià)的九個(gè)步驟,按步驟進(jìn)行引物的設(shè)計(jì)和評價(jià)能夠有效地降低陰性錯(cuò)誤和陽性錯(cuò)誤發(fā)生的概率。這9個(gè)步驟包括:(1)定義eDNA實(shí)驗(yàn)涉及到的生物范圍,并據(jù)此確定合適的基因標(biāo)記,如COI;(2)建立物種類群的基因比對數(shù)據(jù)庫;(3)通過系統(tǒng)發(fā)育關(guān)系檢驗(yàn)?zāi)繕?biāo)基因區(qū)別物種的能力;(4)針對目標(biāo)物種進(jìn)行特異性引物的設(shè)計(jì),注意引物序列中包含非目標(biāo)生物的堿基錯(cuò)配;(5)通過遺傳距離分析找到容易混淆的近似種;(6)通過模擬實(shí)驗(yàn)檢驗(yàn)引物的特異性,評估假陽性和假陰性錯(cuò)誤的風(fēng)險(xiǎn);(7)通過連續(xù)稀釋的DNA樣本檢驗(yàn)引物的靈敏性;(8)基于野外實(shí)驗(yàn)樣品評估引物性能及PCR條件是否合適、有效;(9)實(shí)施大范圍的實(shí)驗(yàn)來制定具有使用限制和可能錯(cuò)誤的標(biāo)準(zhǔn)調(diào)查原則。
PCR偏好性是由于引物和不同樣品模板之間親和力不同,某些親和力強(qiáng)的樣品模板在PCR的每輪循環(huán)中更容易被擴(kuò)增,導(dǎo)致其在最終的PCR產(chǎn)物中過量表達(dá)的現(xiàn)象。引物和模板之間存在不同堿基數(shù)量的錯(cuò)配是造成PCR偏好性的重要原因,即引物和模板錯(cuò)配數(shù)量少比錯(cuò)配數(shù)目多的更容易擴(kuò)增[46]。此外,基因片段長度與堿基組成也影響引物結(jié)合效率(比如短片段更容易被擴(kuò)增,GC含量過高的模板不易擴(kuò)增)[19]。
PCR偏好性是造成環(huán)境DNA-宏條形碼技術(shù)對低豐度物種檢測率低[28]和物種生物量估測錯(cuò)誤[12,30]的最主要因素。在生態(tài)研究中,生物多樣性和生態(tài)系統(tǒng)功能的評估都離不開對物種相對豐度的準(zhǔn)確的分析。然而,現(xiàn)階段環(huán)境DNA-宏條形碼基于分子數(shù)據(jù)對物種的定量分析無法準(zhǔn)確反映物種真實(shí)的生物量和相對豐度[11]。盡管很多研究都證明環(huán)境DNA-宏條形碼擴(kuò)增的序列數(shù)和生物量之間具有正相關(guān)的線性關(guān)系[12,23,73-74],但這種線性關(guān)系只有在PCR偏好性沒有顯著影響時(shí)才成立[75]。因此,控制和減輕PCR的偏好性是環(huán)境DNA-宏條形碼技術(shù)應(yīng)用于水生態(tài)環(huán)境監(jiān)測的主要挑戰(zhàn)之一。建議可以采用以下方法來避免或減弱PCR偏好性。
(1)使用多重分子標(biāo)記同時(shí)擴(kuò)增,即使用不同分子標(biāo)記基因的保守區(qū)設(shè)計(jì)多對通用引物。不同引物配套使用,能夠在一定程度上減輕PCR偏好性[65,67]。但此方法獲得的種類往往較為復(fù)雜,給序列比對和多套數(shù)據(jù)整合等帶來困難,同時(shí)也增加了假陽性率和監(jiān)測成本。
(2)引物設(shè)計(jì)上,增大對非目標(biāo)物種的錯(cuò)配[46]。同時(shí),針對優(yōu)勢種設(shè)計(jì)封閉引物,減少不必要的DNA擴(kuò)增,對低豐度物種設(shè)計(jì)更為特異性的引物。
(3)在PCR擴(kuò)增階段,改進(jìn)和優(yōu)化擴(kuò)增條件,包括降低引物量、適當(dāng)增加模板量、減少循環(huán)次數(shù)以及適當(dāng)提高退火溫度等[19]。或者采用降落PCR(Touch-down PCR)和巢式PCR提高擴(kuò)增的特異性[19]。
(4)使用宏線粒體基因組技術(shù),直接從混合樣品中獲取總DNA并測序,避開PCR擴(kuò)增環(huán)節(jié)[19]
參考數(shù)據(jù)庫的完整性和質(zhì)量直接決定了運(yùn)用環(huán)境DNA-宏條形碼技術(shù)進(jìn)行物種鑒定的可靠性和準(zhǔn)確度[76]。雖然近年來GenBank、BOLD(The Barcode of life Data System)等公共數(shù)據(jù)庫收錄了大量數(shù)據(jù),但其中水生生物類群收錄不足。除此之外,文庫中收錄的數(shù)據(jù)多為COI、16S rRNA等序列片段,而基于其他分子標(biāo)記基因的數(shù)據(jù)收錄較少[12,77]。數(shù)據(jù)庫的不完善使得大量的環(huán)境DNA-宏條形碼數(shù)據(jù)不能得到注釋或正確注釋,造成物種漏檢或鑒定錯(cuò)誤,這是很多環(huán)境DNA-宏條形碼檢測結(jié)果低于形態(tài)學(xué)檢測結(jié)果的首要原因[12]。此外,注釋數(shù)據(jù)中超過50%的數(shù)據(jù)只能鑒定到門或目,對物種的辨識度很低[77],無法滿足大多數(shù)水生生物多樣性監(jiān)測和水質(zhì)監(jiān)測需要鑒定到屬或種的要求。
針對此問題,全球很多研究機(jī)構(gòu)開始著手建立可靠完整的分子數(shù)據(jù)庫和信息分享平臺。澳大利亞專門建立了針對底棲動(dòng)物的數(shù)據(jù)庫Aquatic Invertebrates of Australia[78]。加拿大建立了EPT數(shù)據(jù)庫,收錄了112個(gè)EPT物種,2277條COI序列[79],近期又建立了包含150萬條條形碼數(shù)據(jù)和憑證標(biāo)本的參考數(shù)據(jù)庫[80]。美國建立了收錄209種毛翅目昆蟲和超過1000多條條形碼數(shù)據(jù)的參考庫[81]。同時(shí),德國也建立了EPT數(shù)據(jù)庫,收錄了363個(gè)物種和2000多條序列[82]。
目前我國條形碼數(shù)據(jù)庫發(fā)展相對較慢,尚未建立針對底棲動(dòng)物的條形碼數(shù)據(jù)庫。雖然有GenBank和BOLD等公共數(shù)據(jù)庫,但其數(shù)據(jù)在地理空間和物種覆蓋度方面極不平衡,導(dǎo)致我國特有底棲動(dòng)物種類鮮有收錄,且已有的序列還存在著大量鑒定和標(biāo)記錯(cuò)誤[83]。因此急需一個(gè)由專業(yè)分類學(xué)家通過準(zhǔn)確鑒定和測序而建立的更為完備的,特別是包含我國種群數(shù)據(jù)的底棲動(dòng)物條形碼數(shù)據(jù)庫。鑒于我國受限于缺乏條形碼數(shù)據(jù)庫的現(xiàn)狀,2019年11月由南京農(nóng)業(yè)大學(xué)水生昆蟲團(tuán)隊(duì)首倡召開的中國底棲動(dòng)物條形碼數(shù)據(jù)庫研討會(huì)在南京舉行。會(huì)議上確定由南京農(nóng)業(yè)大學(xué)、南開大學(xué)、中國科學(xué)院水生生物研究所、中山大學(xué)、南京師范大學(xué)、廣西師范大學(xué)等15個(gè)高校與科研院所的分類專家及團(tuán)隊(duì)共同攜手參與構(gòu)建中國首個(gè)具有自主知識產(chǎn)權(quán)的底棲動(dòng)物條形碼數(shù)據(jù)庫。目前,數(shù)據(jù)庫已完成昆蟲綱(毛翅目、蜉蝣目、襀翅目、蜻蜓目等)、寡毛綱、軟體動(dòng)物門(腹足綱和瓣鰓綱)與軟甲綱(溪蟹和鉤蝦)等合計(jì)400余種的條形碼測序工作,收錄共計(jì)1000余條形碼序列。該條形碼數(shù)據(jù)庫的建立有利于摸清我國底棲動(dòng)物多樣性家底,并為我國底棲動(dòng)物多樣性保護(hù)研究和水生態(tài)的健康評價(jià)提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)和技術(shù)保障。
當(dāng)前底棲動(dòng)物水質(zhì)監(jiān)測的取樣及分析流程多樣,然而不同方法獲得的結(jié)果可比性較差。采集過程中不同水樣的采集位置、過濾水量、重復(fù)次數(shù)以及后期實(shí)驗(yàn)室不同的PCR重復(fù)次數(shù)、測序深度等都會(huì)導(dǎo)致測定結(jié)果之間有較大差異[67]。此外,采樣過程中的防交叉污染,對照設(shè)立以及樣品存放條件等都對結(jié)果有重要影響,然而這些標(biāo)準(zhǔn)至今仍未統(tǒng)一[54]。采樣方法與流程的標(biāo)準(zhǔn)化是底棲動(dòng)物環(huán)境DNA監(jiān)測結(jié)果具有可重復(fù)性與可比性的重要前提。因此探索有效的采樣方法和流程并統(tǒng)一標(biāo)準(zhǔn)對今后開展基于環(huán)境DNA的水生態(tài)系統(tǒng)的大規(guī)模日常監(jiān)測具有重要意義,后續(xù)應(yīng)加強(qiáng)對底棲動(dòng)物環(huán)境DNA方法標(biāo)準(zhǔn)化的研究。
環(huán)境DNA-宏條形碼技術(shù)監(jiān)測在調(diào)查物種多樣性中具有諸多優(yōu)勢,但在水質(zhì)監(jiān)測和評估方面尚未建立獨(dú)有的評價(jià)體系。傳統(tǒng)的水質(zhì)監(jiān)測和評價(jià)建立在形態(tài)學(xué)鑒定的基礎(chǔ)上,檢測的單位是生物個(gè)體,通過計(jì)算一系列以指示生物有無和豐度等為基礎(chǔ)的生物指數(shù)來進(jìn)行[6]。而基于環(huán)境DNA-宏條形碼技術(shù)的分子監(jiān)測得到的是大量DNA序列,以分子可操作單元(Molecular Operational Taxonomic Units,MOTUs)為單位。然而,MOTUs的劃分取決于主觀設(shè)定的閾值,不同的閾值劃分可導(dǎo)致MOTUs的數(shù)量和歸類顯著不同[67]。其次,由于缺少較為完整的數(shù)據(jù)庫,MOTUs中只有小部分能精確注釋到屬或種進(jìn)而與傳統(tǒng)方法對接而被利用,使得大部分生物多樣性監(jiān)測和生態(tài)學(xué)研究結(jié)果停留在MOTUs階段,難以將獲得的多樣性分布數(shù)據(jù)與現(xiàn)有的生物學(xué)和生態(tài)學(xué)指標(biāo)結(jié)合起來,從而分析多樣性現(xiàn)狀、空間分布格局及脅迫因素的相關(guān)關(guān)系[83]。此外,環(huán)境DNA-宏條形碼技術(shù)較形態(tài)學(xué)方法更易檢測出稀有物種。這類物種可參考資料較少,未納入傳統(tǒng)的生物指數(shù)評價(jià)范圍,無法用于生物指數(shù)的計(jì)算。因此,環(huán)境DNA-宏條形碼技術(shù)在水質(zhì)監(jiān)測的廣泛應(yīng)用尚需于建立起其獨(dú)特的評價(jià)體系[77]。
針對以上問題,可以考慮建立基于宏條形碼數(shù)據(jù)的生物指數(shù)及評價(jià)體系。直接利用序列的相對豐度和MOTUs數(shù)計(jì)算的生物指數(shù),已在細(xì)菌microgAMBI[84]、硅藻[85-86]和海洋底棲動(dòng)物gAMBI等[87-88]中得到應(yīng)用,并已顯示出與傳統(tǒng)手段相似的生態(tài)評價(jià)效果[89]。同時(shí),該方法可進(jìn)一步與人工智能相結(jié)合,利用監(jiān)督式機(jī)器學(xué)習(xí)(Supervised Machine Learning,SML),通過輸入大量序列和MOTUs數(shù)樣本訓(xùn)練模型進(jìn)行分子生物指數(shù)計(jì)算[85],進(jìn)而用來評估水生態(tài)健康狀況和預(yù)測水體質(zhì)量[90]。該方法能快速地從海量的宏條形碼數(shù)據(jù)中重建生態(tài)網(wǎng)絡(luò),提升水質(zhì)監(jiān)測效率。未來,大數(shù)據(jù)和智能化技術(shù)為基礎(chǔ)的分子生物指數(shù)將成為水環(huán)境生態(tài)管理的重要指標(biāo)。
宏線粒體基因組技術(shù)采用免PCR擴(kuò)增法(如短核苷酸鏈捕獲探針法、全基因組鳥槍法等)直接對多物種混合樣品進(jìn)行高通量測序,并通過生物信息學(xué)分析獲得樣品中物種的線粒體全基因組,進(jìn)而對物種類群進(jìn)行注釋[91]。線粒體基因組比傳統(tǒng)分子標(biāo)記基因包含更長的序列片段,可大幅提高混合物種的鑒定靈敏度和分辨率。該方法的有效性已在無脊椎動(dòng)物中已得到驗(yàn)證[92]。如Tang等[93]開發(fā)出一套針對昆蟲的基于高通量Illumina測序平臺的宏線粒體基因組對混合物種相對豐度的分析流程,并利用該方法替代傳統(tǒng)的COI條形碼進(jìn)行物種鑒定,研究顯示物種鑒定的位點(diǎn)信息擴(kuò)大了約20倍。目前該方法由于測序成本高,對下游生物信息分析技術(shù)要求較高等問題,仍處于探索階段。但該方法解決了由于PCR擴(kuò)增造成的物種偏倚性,同時(shí)獲得更多信息位點(diǎn),可更靈敏和準(zhǔn)確地評估物種組成,進(jìn)而實(shí)現(xiàn)各物種生物量乃至相對豐度的分析[92],因此,宏線粒體基因組技術(shù)無疑是未來宏條形碼技術(shù)發(fā)展的重要方向之一。
環(huán)境DNA-宏條形碼相對于傳統(tǒng)生物調(diào)查方法的劣勢在于無法區(qū)分物種的生活個(gè)體和死亡個(gè)體,也無法判定檢測到的物種所處發(fā)育階段以及群體的性別比例等信息。近年來出現(xiàn)的環(huán)境RNA(Environmental RNA,eRNA)技術(shù)以環(huán)境中的RNA為研究對象,能夠彌補(bǔ)這一劣勢,不僅能夠判斷物種存在與否,還能更好地反映物種在環(huán)境中的活躍程度[94]。
少數(shù)結(jié)合eDNA和eRNA技術(shù)同時(shí)進(jìn)行監(jiān)測的研究發(fā)現(xiàn),eDNA和eRNA兩者得到的MOTUs數(shù)以及物種數(shù)有較大差異[95]。研究表明eDNA對真菌有更高的檢測率,而eRNA對后生動(dòng)物有更高的檢測率,其中19.5%的OTUs為eDNA特有,17.7%為eRNA特有[95]。由于只在eRNA數(shù)據(jù)中出現(xiàn)的OTUs有可能是某些生物代謝過量表達(dá)或者反轉(zhuǎn)錄和建庫過程中出現(xiàn)的假序列,因此一些研究者倡導(dǎo)聯(lián)合使用eDNA和eRNA的數(shù)據(jù),以期更好地對生態(tài)環(huán)境進(jìn)行評估[94,96]。由于RNA在環(huán)境中相對于DNA更容易降解,其特殊的樣品采集、保存、處理以及反轉(zhuǎn)錄等操作都會(huì)增加調(diào)查的難度和成本。但該方法對活體的檢測能力能夠進(jìn)一步促進(jìn)對生物環(huán)境和群落結(jié)構(gòu)的認(rèn)知,是一項(xiàng)非常有潛力的環(huán)境分析方法。