王 萌,苑 藝,于海燕,賈顯樂,黃浩然,陳月仙,金小偉,林曉龍,王備新
1.南京農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,江蘇 南京 210095
2.浙江省生態(tài)環(huán)境監(jiān)測(cè)中心,浙江 杭州 310012
3.溫州市生態(tài)環(huán)境局,浙江 溫州 325027
4.中國(guó)環(huán)境監(jiān)測(cè)總站,國(guó)家環(huán)境保護(hù)環(huán)境監(jiān)測(cè)質(zhì)量控制重點(diǎn)實(shí)驗(yàn)室,北京 100012
5.南開大學(xué)生命科學(xué)學(xué)院,天津 300071
淡水生態(tài)系統(tǒng)是人類賴以生存和發(fā)展的重要資源,也是受人類活動(dòng)干擾最嚴(yán)重、所面臨物種滅絕風(fēng)險(xiǎn)最大的生態(tài)系統(tǒng)[1]。 我國(guó)已成為淡水生物多樣性受威脅最嚴(yán)重的國(guó)家之一。 2010 年,我國(guó)發(fā)布了《中國(guó)生物多樣性保護(hù)戰(zhàn)略與行動(dòng)計(jì)劃(2011—2030 年)》,將水生生物資源調(diào)查與養(yǎng)護(hù)列為優(yōu)先行動(dòng)項(xiàng)目[2]。 大型底棲無脊椎動(dòng)物(以下簡(jiǎn)稱底棲動(dòng)物)是淡水生態(tài)系統(tǒng)的重要組成部分,主要指生活史的全部或部分生活在水體底部,個(gè)體不能通過500 μm 孔徑網(wǎng)篩的無脊椎動(dòng)物,包括節(jié)肢動(dòng)物門昆蟲綱的水生昆蟲、軟甲綱的淡水蟹和鉤蝦,軟體動(dòng)物門的蚌類、螺類,環(huán)節(jié)動(dòng)物門的寡毛綱、蛭綱,扁形動(dòng)物門的渦蟲等[3]。 底棲動(dòng)物具有種類多、生活周期長(zhǎng)、生活場(chǎng)所比較固定、對(duì)水質(zhì)變化敏感等特點(diǎn),是國(guó)內(nèi)外廣泛應(yīng)用的水質(zhì)生物監(jiān)測(cè)指標(biāo)[4-7]。 底棲動(dòng)物形態(tài)學(xué)鑒定高度依賴經(jīng)驗(yàn)豐富的分類人員[8],且所鑒定的標(biāo)本大多為幼期形態(tài),相關(guān)分類資料不足,因此,其形態(tài)學(xué)鑒定大多只能精確到科或?qū)偌?jí)別[9]。 然而不同底棲動(dòng)物種類對(duì)水質(zhì)的敏感性不同,同一科、屬內(nèi)的不同種的耐污性也存在明顯差異[10-11],科或?qū)偌?jí)別的粗糙鑒定無法科學(xué)、準(zhǔn)確地評(píng)價(jià)水生態(tài)質(zhì)量及其受到的威脅。 因此,對(duì)底棲動(dòng)物物種水平的準(zhǔn)確鑒定不僅是水質(zhì)生物監(jiān)測(cè)的迫切需要,也是水生態(tài)環(huán)境管理的必然要求。
DNA 條形碼技術(shù)(DNA Barcoding)能夠破解底棲動(dòng)物鑒定過度依賴分類專家和對(duì)不同發(fā)育階段的標(biāo)本的鑒定水平不一致等難題[12]。 該方法通過DNA 分子標(biāo)記準(zhǔn)確區(qū)分、鑒定物種[12-13],已在生命科學(xué)、法醫(yī)學(xué)、藥學(xué)、食品學(xué)和檢驗(yàn)檢疫等領(lǐng)域獲得廣泛應(yīng)用[12]。 此外,結(jié)合高通量測(cè)序技術(shù)的宏條形碼技術(shù)(DNA Metabarcoding)可以通過對(duì)水和土壤環(huán)境樣品中的混合DNA 的測(cè)序、比對(duì),快速、大規(guī)模地獲得物種信息,極大地革新了生物多樣性調(diào)查方法[8,14-16]。
準(zhǔn)確、完整的DNA 條形碼數(shù)據(jù)庫(kù)是DNA 條形碼技術(shù)與宏條形碼技術(shù)成功應(yīng)用的重要保障[17]。 不完善的數(shù)據(jù)庫(kù)會(huì)使得相當(dāng)多的環(huán)境DNA-宏條形碼數(shù)據(jù)得不到注釋,或得不到準(zhǔn)確注釋,易造成物種漏檢或錯(cuò)誤鑒定[17]。 國(guó)際上雖然有GenBank 和生命條形碼數(shù)據(jù)庫(kù)(Barcode of Life Database,BOLD)等公共數(shù)據(jù)庫(kù),但其對(duì)我國(guó)特有底棲動(dòng)物種類的收錄很少,而且還存在著大量的鑒定和標(biāo)記錯(cuò)誤,無法滿足國(guó)內(nèi)底棲動(dòng)物鑒定的需求。 因此,構(gòu)建我國(guó)淡水底棲動(dòng)物條形碼數(shù)據(jù)庫(kù)具有重要的科學(xué)和應(yīng)用價(jià)值。
本文在回顧DNA 條形碼技術(shù)在底棲動(dòng)物多樣性調(diào)查中的應(yīng)用情況以及國(guó)內(nèi)外條形碼數(shù)據(jù)庫(kù)構(gòu)建現(xiàn)狀的基礎(chǔ)上,詳細(xì)介紹了由南京農(nóng)業(yè)大學(xué)組織、國(guó)內(nèi)15 所高校和科研院所參與構(gòu)建的中國(guó)淡水大型底棲無脊椎動(dòng)物條形碼數(shù)據(jù)庫(kù)的設(shè)計(jì)和組織架構(gòu)、功能特色。 該數(shù)據(jù)庫(kù)的建成和應(yīng)用不僅彌補(bǔ)了國(guó)內(nèi)底棲動(dòng)物條形碼數(shù)據(jù)庫(kù)的空白,也為我國(guó)底棲動(dòng)物多樣性調(diào)查、水質(zhì)生態(tài)監(jiān)測(cè)及健康評(píng)價(jià)提供了堅(jiān)實(shí)的技術(shù)保障和重要的數(shù)據(jù)資源。
DNA 條形碼技術(shù)是指利用標(biāo)準(zhǔn)的、有足夠變異的、易于擴(kuò)增的、相對(duì)較短的一個(gè)或幾個(gè)基因片段進(jìn)行物種鑒定的方法[18]。 由于DNA 片段與物種存在唯一對(duì)應(yīng)關(guān)系,可以像商品的條形碼一樣標(biāo)識(shí)對(duì)應(yīng)的物種信息,故被稱為DNA 條形碼[18]。DNA 條形碼的概念由HEBERT 等[19-20]于2003 年首先提出,其中在動(dòng)物類別中往往將細(xì)胞色素C氧化酶亞基Ⅰ(CytochromecOxidase Subunit Ⅰ,COⅠ)作為條形碼的首選標(biāo)記。 與傳統(tǒng)的形態(tài)學(xué)分類鑒定相比,DNA 條形碼鑒定具有諸多方面的顯著優(yōu)點(diǎn)。 首先,DNA 條形碼鑒定利用同一段固定的基因片段,更有利于物種鑒定的標(biāo)準(zhǔn)化,使鑒定結(jié)果更準(zhǔn)確、客觀[12]。 其次,DNA 條形碼基于分子水平進(jìn)行鑒定,無需分類學(xué)基礎(chǔ),擺脫了形態(tài)學(xué)鑒定對(duì)專業(yè)分類人員的依賴,且不受樣品性別、發(fā)育階段、形態(tài)特征的限制[13,21-22]。 最后,DNA條形碼重新定義了物種邊界,有助于發(fā)現(xiàn)新物種,并為解決近似種和隱存種等傳統(tǒng)分類鑒定難題提供新的研究方法和思路[21-23]。
近些年,高通量測(cè)序技術(shù)的快速發(fā)展在降低DNA 條形碼技術(shù)應(yīng)用成本的同時(shí),進(jìn)一步擴(kuò)展了該技術(shù)的應(yīng)用范圍[8,14]。 結(jié)合高通量測(cè)序的宏條形碼技術(shù),可以通過對(duì)各類生物向環(huán)境中釋放的分泌物、唾液、精子等降解程度不同的DNA 混合物進(jìn)行提取和測(cè)序,完成對(duì)環(huán)境樣本中不同物種類群的大規(guī)模鑒定[14]。 同時(shí),該技術(shù)也可通過提取不同類群的混合組織樣本或其酒精保存液中的游離DNA 進(jìn)行測(cè)序和物種注釋[17,24]。 現(xiàn)今,宏條形碼技術(shù)已成為推進(jìn)淡水底棲動(dòng)物多樣性監(jiān)測(cè)甚至水質(zhì)評(píng)價(jià)的一項(xiàng)最有前景的新興技術(shù),廣泛用于水生生物多樣性調(diào)查[25]、入侵和稀有物種檢測(cè)[26-27],以及目標(biāo)生物豐度、群落大小、分布和動(dòng)態(tài)檢 測(cè) 等 方 面[28]。 HAJIBABAEI 等[29]首 次 將DNA 條形碼技術(shù)應(yīng)用于淡水底棲動(dòng)物多樣性分析,并證明宏條形碼技術(shù)可成功用于底棲動(dòng)物監(jiān)測(cè)。 研究顯示,宏條形碼技術(shù)對(duì)大部分底棲動(dòng)物的檢出率高達(dá)98%,其中水質(zhì)敏感昆蟲EPT 類群(蜉蝣目+衤責(zé)翅目+毛翅目)的檢出率為100%[30]。
相對(duì)于傳統(tǒng)的形態(tài)學(xué)分類鑒定,新興的DNA條形碼和宏條形碼技術(shù)也存在一定的局限性。 例如,不能區(qū)分死亡個(gè)體[24],不能直接獲得物種的發(fā)育時(shí)期、性別比例等信息[31],無法對(duì)生物量和物種相對(duì)豐度進(jìn)行準(zhǔn)確估測(cè)[14],PCR 引物的偏向性容易造成假陰性結(jié)果[17]。 此外,條形碼與宏條形碼技術(shù)的應(yīng)用有效性高度取決于參考數(shù)據(jù)庫(kù)的大小和質(zhì)量[17],而現(xiàn)有數(shù)據(jù)庫(kù)存在不同類型的缺陷,無法滿足監(jiān)測(cè)鑒定的需要。 綜上可知,雖然條形碼技術(shù)有廣闊的應(yīng)用前景,但目前仍不能完全取代傳統(tǒng)的形態(tài)學(xué)分類鑒定。 因此,在進(jìn)行物種鑒定和生物多樣性監(jiān)測(cè)時(shí),應(yīng)充分結(jié)合兩種技術(shù),進(jìn)行綜合評(píng)估。
DNA 條形碼數(shù)據(jù)庫(kù)不僅可以為統(tǒng)一存儲(chǔ)樣品信息和DNA 條形碼序列提供場(chǎng)所,而且可以為進(jìn)一步應(yīng)用DNA 條形碼進(jìn)行物種鑒定分析、物種進(jìn)化過程研究、生物地理譜系研究等提供生物信息學(xué)分析平臺(tái)[12,18,23]。 數(shù)據(jù)庫(kù)的大小和質(zhì)量直接決定了應(yīng)用條形碼技術(shù)進(jìn)行物種鑒定的可靠性和準(zhǔn)確性[32],對(duì)于利用環(huán)境DNA-宏條形碼技術(shù)進(jìn)行水質(zhì)監(jiān)測(cè)尤為重要。 研究顯示,缺少完善的參考數(shù)據(jù)庫(kù)可使50%以上的宏條形碼數(shù)據(jù)無法注釋到水質(zhì)監(jiān)測(cè)所需的物種鑒定精度[32]。
針對(duì)此問題,全球很多研究機(jī)構(gòu)開始著手建立可靠、完整的分子數(shù)據(jù)庫(kù)和信息分享平臺(tái)(表1)。 國(guó)際上第一個(gè) DNA 條形碼數(shù)據(jù)系統(tǒng)——BOLD 系統(tǒng)(http:/ /boldsystems. org),由國(guó)際生命條形碼協(xié)會(huì)(Consortium for the Barcode of Life)于2007 年建立[18]。 迄今為止,BOLD 系統(tǒng)內(nèi)包含了超過32.7 萬種生物的條形碼信息,包括234 038 種動(dòng)物、70 026 種植物、23 762 種真菌和其他生物物種[18]。 2011 年,我國(guó)也建立了中國(guó)生命條形碼數(shù)據(jù)門戶,該數(shù)據(jù)庫(kù)包含了64 176 個(gè)標(biāo)本的77 957 條序列[18]。 此外,國(guó)內(nèi)各行業(yè)/學(xué)科也有針對(duì)性地逐步建立了一系列條形碼數(shù)據(jù)庫(kù),如中藥材DNA 條形碼鑒定系統(tǒng)[33]、中國(guó)珍稀瀕危植物DNA 條形碼鑒定平臺(tái)[18]、中國(guó)檢疫性有害生物DNA 條形碼鑒定系統(tǒng)[12]、中國(guó)重要漁業(yè)生物DNA 條形碼信息平臺(tái)、傳統(tǒng)藥物DNA 條形碼數(shù)據(jù)庫(kù)、中國(guó)兩棲類信息系統(tǒng)等。
表1 國(guó)內(nèi)外部分DNA 條形碼數(shù)據(jù)庫(kù)構(gòu)建現(xiàn)狀Table 1 Current status of some domestic and overseas DNA barcoding reference databases
針對(duì)底棲動(dòng)物,澳大利亞建立了專門包含EPT 物種的Aquatic Invertebrates of Australia 數(shù)據(jù)庫(kù)[34]。 加拿大建立了水質(zhì)敏感昆蟲EPT 數(shù)據(jù)庫(kù),收錄有112 個(gè)EPT 物種、2 277 條COⅠ序列[35],隨后又建立了包含150 萬條條形碼數(shù)據(jù)和憑證標(biāo)本的參考數(shù)據(jù)庫(kù)[36]。 美國(guó)建立了收錄有209 種毛翅目昆蟲和超過1 000 條序列的參考數(shù)據(jù)庫(kù)[37]。 德國(guó)也建立了EPT 數(shù)據(jù)庫(kù),收錄了363個(gè)物種和2 000 多條序列[38]。 然而,我國(guó)底棲動(dòng)物條形碼數(shù)據(jù)庫(kù)發(fā)展較慢,大部分條形碼數(shù)據(jù)只零散分布在成幼蟲聯(lián)系和系統(tǒng)發(fā)育研究中[13]。
盡管近些年DNA 條形碼相關(guān)數(shù)據(jù)庫(kù)的發(fā)展如火如荼,但其構(gòu)建和應(yīng)用仍存在一些突出的問題。 首先,大多數(shù)DNA 條形碼序列缺少對(duì)應(yīng)的形態(tài)圖像憑證,造成形態(tài)鑒定信息與分子信息割裂[22]。 很多條形碼數(shù)據(jù)記錄的憑證信息缺失或不全面,難以追溯其測(cè)序的準(zhǔn)確性。 其次,大部分條形碼信息缺少專家鑒定,存在大量的鑒定和標(biāo)記錯(cuò)誤[22]。 再次,由于全球各地在條形碼研究上的投入差異和物種多樣性差異,數(shù)據(jù)庫(kù)中的條形碼數(shù)量在不同地理區(qū)域與不同物種類群上存在明顯的不平衡[32]。 因此,盡管GenBank 和BOLD 中有宏量的條形碼數(shù)據(jù),但對(duì)我國(guó)特有種類的收錄較少。 最后,由于我國(guó)獨(dú)特的地理位置和水域生態(tài)環(huán)境,部分物種產(chǎn)生了較大的物種地理分化,與許多國(guó)外已報(bào)道種類有相當(dāng)明顯的分子和形態(tài)差異,難以利用GenBank 和BOLD 中的現(xiàn)有序列對(duì)國(guó)內(nèi)物種進(jìn)行準(zhǔn)確注釋。
該數(shù)據(jù)庫(kù)由南京農(nóng)業(yè)大學(xué)組織,中國(guó)農(nóng)業(yè)大學(xué)、南開大學(xué)、南京師范大學(xué)、中山大學(xué)、華南農(nóng)業(yè)大學(xué)、揚(yáng)州大學(xué)、重慶師范大學(xué)、南昌大學(xué)、廣西師范大學(xué)、中科院水生生物研究所、中科院沈陽(yáng)應(yīng)用生態(tài)研究所等15 所高校和科研院所的分類專家及團(tuán)隊(duì)歷時(shí)一年半構(gòu)建完成。 該數(shù)據(jù)庫(kù)的中文名稱為中國(guó)淡水大型底棲無脊椎動(dòng)物條形碼數(shù)據(jù)庫(kù)(圖1),涉及的生物類群主要有水生昆蟲(蜉蝣目、蜻蜓目、衤責(zé)翅目、毛翅目、鞘翅目、半翅目、廣翅目、脈翅目,以及雙翅目搖蚊科和大蚊科等)、軟體動(dòng)物(蚌類、螺類等)、環(huán)節(jié)動(dòng)物(寡毛綱、蛭綱)、甲殼動(dòng)物(溪蟹、鉤蝦等)。
圖1 中國(guó)淡水大型底棲無脊椎動(dòng)物條形碼數(shù)據(jù)庫(kù)首頁(yè)Fig.1 The homepage of the Chinese freshwater macroinvertebrate barcode library
數(shù)據(jù)庫(kù)注冊(cè)用戶可以在線進(jìn)行物種分類檢索,以及底棲動(dòng)物COⅠ條形碼和環(huán)境DNA-宏條形碼數(shù)據(jù)的比對(duì)工作,完成對(duì)物種的鑒定和注釋。用戶在首頁(yè)或者后臺(tái)通過物種名進(jìn)行搜索,不僅可以得到該物種的分類信息和圖像信息,還可以得到該物種的所有樣本信息,包括樣本所屬項(xiàng)目信息、憑證標(biāo)本信息、采集信息和條形碼數(shù)據(jù)。 物種鑒定主要通過COⅠ條形碼的比對(duì)功能實(shí)現(xiàn)。用戶可將底棲動(dòng)物條形碼的序列信息粘貼在數(shù)據(jù)庫(kù)網(wǎng)絡(luò)平臺(tái)搜索框進(jìn)行比對(duì),從而得到物種鑒定結(jié)果,也可將環(huán)境DNA-宏條形碼數(shù)據(jù)輸入搜索框進(jìn)行比對(duì),完成對(duì)分子可操作單元(Molecular Operational Taxonomic Units)的注釋。
中國(guó)淡水大型底棲無脊椎動(dòng)物條形碼數(shù)據(jù)庫(kù)以門戶網(wǎng)站的形式呈現(xiàn),設(shè)立有三大模塊,具體如圖2 所示。
圖2 中國(guó)淡水大型底棲無脊椎動(dòng)物條形碼數(shù)據(jù)庫(kù)設(shè)計(jì)架構(gòu)Fig.2 The design and structure of the Chinese freshwater macroinvertebrate barcode library
3.2.1 門戶展示模塊
各個(gè)項(xiàng)目組負(fù)責(zé)成員從后臺(tái)上傳樣本相關(guān)信息,在門戶展示模塊顯示數(shù)據(jù)庫(kù)及樣本的相關(guān)信息,包含物種分類信息、憑證標(biāo)本信息和序列信息3 個(gè)部分。
1)物種分類信息。 包括物種在各個(gè)分類階元的拉丁學(xué)名(門、綱、目、科、屬、種)、中文譯名以及鑒定者信息。 鑒定者信息包括鑒定者姓名、單位、聯(lián)系方式和鑒定日期。
2)憑證標(biāo)本信息。 包括樣本編號(hào)、樣本憑證信息、采集信息、地理分布信息、性別、生長(zhǎng)階段以及圖像信息。 其中,樣本編號(hào)在整個(gè)數(shù)據(jù)庫(kù)系統(tǒng)中是唯一的。 對(duì)于用來鑒定和提取DNA 條形碼信息的憑證標(biāo)本,要進(jìn)行編號(hào)并妥善保存。 樣本憑證信息中,要上傳憑證標(biāo)本的存放地點(diǎn)、保存方式以及博物館館藏號(hào)。 樣本采集信息包含采集者、采集時(shí)間、采集地點(diǎn)、經(jīng)緯度、海拔、深度、采集方式等。
關(guān)于樣本圖像信息,每個(gè)樣本至多可上傳20 個(gè)照片文件,一般每個(gè)樣本至少拍攝1 個(gè)整體圖和2~5 個(gè)形態(tài)特征鑒別圖。 圖片格式必須為JPG、GIF 和PNG 3 種格式之一。 相機(jī)圖片要求像素不低于500 萬,圖像清晰度不低于300 dpi,矢量繪圖不低于600 dpi。 圖片需附有比例尺,并在圖片下方附有對(duì)圖片內(nèi)容的簡(jiǎn)要說明。
3)序列信息。 包括首選遺傳標(biāo)記名稱,如COⅠ;其他遺傳標(biāo)記名稱,如28S、Cytb;處理序列的實(shí)驗(yàn)室或機(jī)構(gòu)名稱,如南京農(nóng)業(yè)大學(xué);GenBank或BOLD 編號(hào),如果序列在GenBank 或BOLD 中有對(duì)應(yīng)編號(hào),上傳其GenBank 或BOLD 編號(hào);PCR正反向引物等。
3.2.2 數(shù)據(jù)查詢鑒定模塊
該模塊包括3 種不同的查詢途徑:
第一種是根據(jù)分子序列進(jìn)行查詢。 將獲得的未知樣品的條形碼序列粘貼到查詢框,并點(diǎn)擊提交進(jìn)行鑒定(圖3)。 查詢COⅠ序列須大于300 bp,且序列所含不確定堿基(Ns)的數(shù)目占比應(yīng)小于1%。 系統(tǒng)基于VSEARCH 模塊對(duì)序列進(jìn)行比對(duì),并給出數(shù)據(jù)庫(kù)中該序列的物種信息。 當(dāng)前,該系統(tǒng)支持Fasta(含“>”號(hào))格式和純序列格式(不含“>”號(hào))查詢。 物種鑒定系統(tǒng)可以迅速查詢到數(shù)據(jù)庫(kù)中與未知樣品序列最相似的序列,并給出數(shù)據(jù)庫(kù)中該序列的物種信息。 為便于使用者對(duì)鑒定結(jié)果進(jìn)行核對(duì),物種鑒定系統(tǒng)會(huì)列出數(shù)據(jù)庫(kù)中與查詢序列相似性最高的30 條序列,并列出序列比對(duì)長(zhǎng)度、覆蓋度、相似性及鑒定信息。
圖3 數(shù)據(jù)庫(kù)條形碼序列物種鑒定結(jié)果展示Fig.3 The species identification results using DNA barcodes query in the barcode library
第二種是根據(jù)物種分類信息進(jìn)行查詢。 在首頁(yè)的分類檢索搜索框或登錄后臺(tái)樣本管理中的分類檢索框中,輸入物種分類等級(jí)(門、綱、目、科、屬、種)的拉丁學(xué)名或者中文名進(jìn)行檢索。
第三種是根據(jù)地理分布信息進(jìn)行查詢。 點(diǎn)擊地圖上某個(gè)具體的地區(qū)或地點(diǎn),進(jìn)而鏈接到在相應(yīng)區(qū)域存在分布的物種類別,從而搜索得到物種其他相關(guān)信息。
3.2.3 后臺(tái)管理模塊
后臺(tái)管理模塊共包括3 部分,分別為項(xiàng)目信息管理、樣本信息管理以及生物分類列表,主要用于面向項(xiàng)目成員的可視化數(shù)據(jù)管理,包括數(shù)據(jù)的查看和信息的導(dǎo)入、導(dǎo)出、備份、整理及更新。 其中,項(xiàng)目信息管理模塊用于項(xiàng)目管理組成員對(duì)某個(gè)條形碼項(xiàng)目信息的管理、整合與更新。 在樣本信息管理模塊中,用戶可進(jìn)行某個(gè)門類物種分類信息的搜索、查詢,管理者可以進(jìn)行物種分類信息、圖像信息及條形碼信息的逐個(gè)或批量上傳及導(dǎo)出。
該數(shù)據(jù)庫(kù)的最大特點(diǎn)是所有物種名錄均由分類學(xué)專家審定確認(rèn),每一條入庫(kù)條形碼均來自分類專家的精確鑒定,確保了條形碼序列與形態(tài)學(xué)物種的一致性。 現(xiàn)有底棲動(dòng)物類群相關(guān)條形碼數(shù)據(jù)存儲(chǔ)混雜、信息零散,各類群的條形碼數(shù)據(jù)以不同形式儲(chǔ)存于不同數(shù)據(jù)庫(kù),且其中的絕大多數(shù)序列缺少形態(tài)學(xué)圖像憑證,導(dǎo)致同一物種不同發(fā)育階段的形態(tài)與分子信息往往難以建立聯(lián)系,給物種鑒定帶來了極大困難。 該數(shù)據(jù)庫(kù)首次將零散的信息匯總至統(tǒng)一的信息平臺(tái),并整合了同一物種下的分類信息、分子條形碼信息、地理分布信息以及不同蟲態(tài)的形態(tài)圖像等全面的物種信息,從而更有利于對(duì)物種的整合鑒定。
迄今為止,該數(shù)據(jù)庫(kù)已收錄有800 余個(gè)底棲動(dòng)物物種、1 100 余條條形碼數(shù)據(jù)以及5 600 余種中國(guó)常見淡水大型底棲無脊椎動(dòng)物的物種信息。統(tǒng)計(jì)數(shù)據(jù)顯示(圖4、圖5),當(dāng)前該數(shù)據(jù)庫(kù)已收錄的各底棲動(dòng)物類群的物種數(shù)和條形碼數(shù)并不均衡,其中水生昆蟲的數(shù)據(jù)量最大,而端足目、寡毛綱等難以鑒定的物種類群的條形碼數(shù)據(jù)仍有所欠缺,尚待補(bǔ)充。
圖4 數(shù)據(jù)庫(kù)現(xiàn)有收錄物種及DNA 條形碼數(shù)量相對(duì)比例Fig.4 The proportion of taxa and barcodes in the current barcode library
圖5 數(shù)據(jù)庫(kù)現(xiàn)有不同生物類群收錄物種和DNA 條形碼數(shù)量統(tǒng)計(jì)Fig.5 The statistics of the taxa and barcode in the current barcode library
中國(guó)淡水大型底棲無脊椎動(dòng)物條形碼數(shù)據(jù)庫(kù)是我國(guó)首個(gè)具有自主知識(shí)產(chǎn)權(quán)的淡水底棲動(dòng)物條形碼數(shù)據(jù)庫(kù)。 通過在用戶界面的簡(jiǎn)單操作,無分類基礎(chǔ)的研究人員也可完成對(duì)底棲動(dòng)物全發(fā)育形態(tài)的準(zhǔn)確鑒定,實(shí)現(xiàn)鑒定過程的自動(dòng)化、標(biāo)準(zhǔn)化和遠(yuǎn)程化,可為底棲動(dòng)物分類鑒定、種質(zhì)資源利用、瀕危物種保護(hù)提供重要的數(shù)據(jù)資源。 同時(shí),該數(shù)據(jù)庫(kù)可為我國(guó)淡水生物多樣性調(diào)查與評(píng)估,外來入侵水生生物早期監(jiān)測(cè)、預(yù)警與風(fēng)險(xiǎn)評(píng)估,水質(zhì)敏感物種(如EPT 水生昆蟲)監(jiān)測(cè)與識(shí)別,以及重新構(gòu)建更加科學(xué)合理的基于底棲動(dòng)物物種水平的耐污值、BI、BMWP 指數(shù)評(píng)價(jià)體系等提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)和技術(shù)保障,有助于更好地提升我國(guó)水質(zhì)監(jiān)測(cè)水平。
在數(shù)據(jù)庫(kù)的后續(xù)建設(shè)中,需加大對(duì)底棲動(dòng)物中的易忽視類群、形態(tài)鑒定困難類群條形碼信息的采集力度[34]。 在增加底棲動(dòng)物各類群條形碼信息覆蓋度的同時(shí),持續(xù)擴(kuò)大單一種類不同地理種群的樣本條形碼數(shù)量,進(jìn)一步挖掘水生生物的物種多樣性,提高對(duì)淡水生物多樣性及分布規(guī)律的認(rèn)識(shí),為水生動(dòng)物類群的生態(tài)學(xué)研究、生物譜系地理學(xué)研究等提供數(shù)據(jù)資源和分析平臺(tái)。 此外,目前數(shù)據(jù)庫(kù)中的條形碼標(biāo)記僅限于COⅠ,后續(xù)需逐步將其他分子標(biāo)記數(shù)據(jù)(12S、16S 等)上傳至數(shù)據(jù)庫(kù),以滿足日益增長(zhǎng)的對(duì)不同生物類群的比對(duì)注釋需求。
隨著下一代測(cè)序技術(shù)的不斷進(jìn)步,條形碼技術(shù)也向更加高通量、智能化、自動(dòng)化方向發(fā)展。 通過基于第三代測(cè)序技術(shù)的PacBio 等平臺(tái),條形碼測(cè)序可無需PCR 操作,并不斷增加測(cè)序通量和長(zhǎng)度[39]。 此外,基于試紙(Dip-Stick)和封閉管內(nèi)(Closed-Tube) 的 PCR 自 動(dòng) 測(cè) 序 設(shè) 備, 如FASTFISH-ID 等新興技術(shù),條形碼技術(shù)在應(yīng)用于野外采樣和處理時(shí)更加便攜,實(shí)現(xiàn)了實(shí)時(shí)化、遠(yuǎn)程化和自動(dòng)化[22]。 因此,相信隨著新方法和新技術(shù)的應(yīng)用,DNA 條形碼和宏條形碼技術(shù)在未來還將大放異彩,繼續(xù)在生物多樣性保護(hù)和生態(tài)學(xué)研究方面引領(lǐng)新的方向,促進(jìn)全球生物物種條形碼信息數(shù)字化時(shí)代的到來。
致謝:中國(guó)農(nóng)業(yè)大學(xué)楊定、劉星月,南開大學(xué)卜文俊、王新華、葉瑱,南京師范大學(xué)周長(zhǎng)發(fā)、孫紅英,中山大學(xué)賈鳳龍,華南農(nóng)業(yè)大學(xué)童曉立,揚(yáng)州大學(xué)杜予洲,重慶師范大學(xué)于昕,南昌大學(xué)吳小平,廣西師范大學(xué)杜麗娜,中科院水生生物研究所謝志才、崔永德,以及中科院沈陽(yáng)應(yīng)用生態(tài)研究所邊冬菊為數(shù)據(jù)庫(kù)的構(gòu)建提供了寶貴的數(shù)據(jù)支持與幫助,在此一并致以誠(chéng)摯的謝意。
中國(guó)環(huán)境監(jiān)測(cè)2022年1期