楊海樂,張 輝,吳金明,李君軼,王成友,杜 浩,危起偉
中國(guó)水產(chǎn)科學(xué)研究院長(zhǎng)江水產(chǎn)研究所,農(nóng)業(yè)農(nóng)村部淡水生物多樣性保護(hù)重點(diǎn)實(shí)驗(yàn)室, 武漢 430223
流域生態(tài)學(xué)(watershed ecology)是研究流域范圍內(nèi)陸地和水體生態(tài)系統(tǒng)相互關(guān)系的學(xué)科(全國(guó)科學(xué)技術(shù)名詞審定委員會(huì)),其主體在于整合研究以流域生態(tài)系統(tǒng)過程為核心所關(guān)聯(lián)起的流域內(nèi)各相關(guān)子系統(tǒng)(subsystem)[1]。流域生態(tài)系統(tǒng)過程研究的核心工作是研究流域生態(tài)系統(tǒng)中依托于水循環(huán)過程的各個(gè)子系統(tǒng)之間及之內(nèi)的物質(zhì)流、能量流、信息流[2]。流域生物信息流(watershed biological information flow)是生物信息依托于流域生態(tài)系統(tǒng)過程在不同空間和系統(tǒng)之間進(jìn)行傳遞、交流、作用、反饋的路徑、過程與控制,主要關(guān)注生物體及生物質(zhì)所承載的生物信息在時(shí)空上的遷移擴(kuò)散,以及與生物體及生物質(zhì)間相互作用相伴隨的生物信息作用和反饋[3]。任何生物能都依托于生物物質(zhì),而任何類型的生物物質(zhì)都攜帶有其特定的信息標(biāo)記,因而作為流域生態(tài)系統(tǒng)過程研究的三大主題(物質(zhì)流、能量流、信息流)之一,流域生物信息流通過物質(zhì)流、能量流、信息流的三位一體而具有對(duì)流域生態(tài)系統(tǒng)中的物質(zhì)輸移和能量輸移過程的指征和標(biāo)記功能,流域生物信息流的研究可以為流域生態(tài)系統(tǒng)研究中生物物質(zhì)輸移和生物能輸移過程的跟蹤和標(biāo)記提供理論的可能和技術(shù)的支撐[4—5]。
河流上游到下游的流域生物信息流是eDNA(environmental DNA)技術(shù)調(diào)查評(píng)估河流水體中物種組成空間特征的事實(shí)基礎(chǔ)[5—8],估算河流上游到下游的流域生物信息流是用eDNA技術(shù)調(diào)查評(píng)估河流水體中物種組成空間特征的方法基礎(chǔ)[9—11]。基于集合生態(tài)系統(tǒng)概念框架,根據(jù)研究尺度和分辨率的需要,可以將流域生態(tài)系統(tǒng)構(gòu)建為一個(gè)包含了多個(gè)子系統(tǒng)的集合生態(tài)系統(tǒng)(meta-ecosystem)[12]。評(píng)估河流水體中物種組成的空間特征,即評(píng)估河流水體(基于空間劃分)各子系統(tǒng)中的物種組成。假設(shè)各子系統(tǒng)在特定時(shí)間的物種組成相對(duì)穩(wěn)定,各子系統(tǒng)中的個(gè)體釋放到環(huán)境中的eDNA則隨著河川徑流向下游輸移。因?yàn)榱魉w中的eDNA受釋放、稀釋、吸附、再懸浮、輸移、降解等過程的影響[13—15],上游水體子系統(tǒng)中個(gè)體釋放到環(huán)境中的eDNA隨著河川徑流向下輸移的距離有限[16—18],因而可以通過估算流域生物信息流來評(píng)估河流水體各子系統(tǒng)中的物種組成,進(jìn)而評(píng)估河流水體中物種組成的空間特征。
分析流域生物信息流,第一步是估算上游子系統(tǒng)到下游子系統(tǒng)的流域生物信息流輸移有效度(即用下游樣點(diǎn)水體eDNA監(jiān)測(cè)上游樣點(diǎn)水體中生物組成信息的監(jiān)測(cè)有效度,上游樣點(diǎn)水體中的水生生物信息能在下游樣點(diǎn)水體的eDNA中被檢出的比例和概率)[3]。監(jiān)測(cè)有效度估算的核心是(1)有限采樣對(duì)采樣區(qū)域的生物組成信息的檢出度和(2)由上游到下游的流域生物信息流輸移有效度。在實(shí)踐應(yīng)用中,調(diào)查采樣往往是有限的,因而存在兩個(gè)問題:(1)平行樣的設(shè)置情況如何影響生物組成信息檢出度的估算,(2)平行樣的設(shè)置情況如何影響流域生物信息流輸移有效度的估算?;诔闃诱{(diào)查的基本原理和前期eDNA調(diào)查研究可知,采樣數(shù)量越多對(duì)采樣區(qū)域的生物組成信息的檢出度越大,因檢出度受多種因素影響,具體的平行樣數(shù)量和檢出度之間的關(guān)系需要一系列具體研究來進(jìn)行量化[19]。如果將由上游到下游的流域生物信息流過程簡(jiǎn)化為上游區(qū)域生物信息通過隨機(jī)取樣然后轉(zhuǎn)移到下游區(qū)域,那么基于有限采樣的流域生物信息流估算就是對(duì)隨機(jī)抽樣調(diào)查結(jié)果的隨機(jī)抽樣調(diào)查,基于隨機(jī)抽樣調(diào)查的基本原理可以猜測(cè),采樣數(shù)量不影響抽樣調(diào)查結(jié)果的準(zhǔn)確度,但會(huì)影響其精密度。
根據(jù)流域生物信息流研究框架[3],本文就平行樣的設(shè)置對(duì)流域生物信息流估算的影響展開了模擬計(jì)算,以檢驗(yàn)“在流域生物信息流估算中各樣點(diǎn)平行樣數(shù)量不影響抽樣調(diào)查結(jié)果的準(zhǔn)確度,但會(huì)影響其精密度”的假設(shè),并探討在流域生物信息流估算中各樣點(diǎn)平行樣數(shù)量(檢出度)的增加或減少對(duì)流域生物信息流估算的具體影響,為以下游水體eDNA監(jiān)測(cè)上游水體中物種組成信息的監(jiān)測(cè)有效度評(píng)估方案提供指導(dǎo)和支持,推動(dòng)eDNA技術(shù)在水生生物多樣性調(diào)查監(jiān)測(cè)中的應(yīng)用和發(fā)展。
隨機(jī)抽樣過程中,抽樣數(shù)量越多,抽樣結(jié)果的集合對(duì)整個(gè)系統(tǒng)的反映程度越全面。在本研究中,抽樣即eDNA采樣,抽樣數(shù)量即eDNA樣本數(shù),對(duì)整個(gè)系統(tǒng)的反映程度即eDNA對(duì)該樣點(diǎn)水體生物信息種類的檢出度。因此在模擬計(jì)算中,我們將平行樣數(shù)量的增加轉(zhuǎn)化為對(duì)該樣點(diǎn)水體生物信息種類檢出度的增加。
上下游樣點(diǎn)間共有生物信息種類組成占上游樣點(diǎn)總生物信息種類組成的比例,即上游到下游的流域生物信息流。因?yàn)樯舷掠蜗噜彉狱c(diǎn)間的流域生物信息流是整體流域生物信息流計(jì)算的基礎(chǔ)單元,所以本模擬計(jì)算中流域生物信息流的估算用上下游相鄰樣點(diǎn)間的共有生物信息組成占上游樣點(diǎn)總生物信息組成的比例估算簡(jiǎn)單指代。
平行樣數(shù)量的增加對(duì)流域生物信息流估算的影響,用生物信息檢出度的增加對(duì)上下游樣點(diǎn)間共有生物信息種類組成占上游樣點(diǎn)總生物信息種類組成的比例估算的影響來等價(jià)模擬展示。在本模擬計(jì)算中,設(shè)定上下游樣點(diǎn)分別有生物信息1000種、900種(可顛倒替換),樣點(diǎn)生物信息檢出度和實(shí)際流域生物信息流作為兩個(gè)自變量,估算流域生物信息流為因變量,進(jìn)行單變量模擬,具體分組及參數(shù)如表1,然后計(jì)算特定上下游樣點(diǎn)生物信息種類數(shù)組合情況下,樣點(diǎn)生物信息檢出度變化對(duì)估算流域生物信息流的影響(即實(shí)際流域生物信息流與估算流域生物信息流的差異)以及不同實(shí)際流域生物信息流條件下估算流域生物信息流的結(jié)果偏差程度。
模擬計(jì)算的基本思路是,在特定上下游樣點(diǎn)生物信息種類數(shù)組合情況下、在特定樣點(diǎn)生物信息檢出度情況下、在特定實(shí)際流域生物信息流情況下,通過隨機(jī)取樣計(jì)算得出某流域生物信息流值的概率,然后通過統(tǒng)計(jì)展示估算流域生物信息流相對(duì)于實(shí)際流域生物信息流的偏差,進(jìn)而評(píng)估樣點(diǎn)生物信息檢出度變化對(duì)估算流域生物信息流的影響以及不同實(shí)際流域生物信息流條件下估算流域生物信息流的結(jié)果偏差程度。具體模擬計(jì)算公式如下列公式組
表1 不同樣點(diǎn)生物信息檢出度條件下的流域生物信息流估算條件分組及參數(shù)設(shè)置
式中,M,上游樣點(diǎn)生物信息種類數(shù);N,下游樣點(diǎn)生物信息種類數(shù);r,樣點(diǎn)生物信息檢出度;k,實(shí)際流域生物信息流;a,監(jiān)測(cè)到的生物信息種類數(shù);y,所估算的流域生物信息流值;f(aM),上游樣點(diǎn)處監(jiān)測(cè)到數(shù)量為a的生物信息種類數(shù)的概率;f(aN),下游樣點(diǎn)處監(jiān)測(cè)到數(shù)量為a的生物信息種類數(shù)的概率;f(y),估算出流域生物信息流值為y的概率。
根據(jù)該公式組,按照上述參數(shù)設(shè)定分6組進(jìn)行模擬計(jì)算,然后通過組內(nèi)和組間模擬計(jì)算結(jié)果的對(duì)比分析,探討(1)樣點(diǎn)生物信息檢出度狀況對(duì)流域生物信息流估算的影響(即實(shí)際流域生物信息流與估算流域生物信息流的差異),(2)在特定樣點(diǎn)生物信息檢出度條件下,不同實(shí)際流域生物信息流狀況對(duì)流域生物信息流估算的影響,(3)在特定樣點(diǎn)生物信息檢出度和實(shí)際流域生物信息流條件下,上下游樣點(diǎn)生物信息種類數(shù)相對(duì)關(guān)系對(duì)流域生物信息流估算的影響。
模擬計(jì)算顯示,上下游樣點(diǎn)分別有生物信息1000種、900種的條件下,在實(shí)際流域生物信息流水平在0.5的時(shí)候,(1)隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值從0.48(偏離4%)逐步增長(zhǎng)到0.4978(偏離0.44%),即隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的最優(yōu)估值逐漸趨近于實(shí)際流域生物信息流水平;(2)隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.34—0.59(最大偏離32%)收縮到0.4822—0.51(最大偏離3.56%),即隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的估值區(qū)間逐漸集中于實(shí)際流域生物信息流水平(圖1)。
圖1 不同樣點(diǎn)生物信息檢出度下(A組)估算流域生物信息流值的概率分布Fig.1 Probability distributions of estimated watershed biological information flow (WBIF) in different biological information detection efficiency (BIDE) conditions at sampling sites (group A)A組,上下游樣點(diǎn)分別有生物信息1000種、900種,實(shí)際信息流水平為0.5,樣點(diǎn)生物信息檢出度為變量。WBIF:流域生物信息流 watershed biological information flow;BIDE:生物信息檢出度 biological information detection efficiency
在實(shí)際流域生物信息流水平在0.8的時(shí)候,(1)隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值從0.79(偏離1.25%)逐步增長(zhǎng)到0.7978(偏離0.275%),即隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的最優(yōu)估值逐漸趨近于實(shí)際流域生物信息流水平;(2)隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.67—0.86(最大偏離16.25%)收縮到0.7867—0.8067(最大偏離1.66%),即隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的估值區(qū)間逐漸集中于實(shí)際流域生物信息流水平(圖2)。
圖2 不同樣點(diǎn)生物信息檢出度下(B組)估算流域生物信息流值的概率分布Fig.2 Probability distributions of estimated watershed biological information flow (WBIF) in different biological information detection efficiency (BIDE) conditions at sampling sites (group B)B組,上下游樣點(diǎn)分別有生物信息1000種、900種,實(shí)際流域生物信息流水平為0.8,樣點(diǎn)生物信息檢出度為變量
模擬計(jì)算顯示,上下游樣點(diǎn)分別有生物信息1000種、900種的條件下,在樣點(diǎn)生物信息檢出度為0.1時(shí),(1)隨著實(shí)際流域生物信息流從0.1增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值基本穩(wěn)定在偏小0.02左右,但其偏離程度在逐步減小(從偏離20%到偏離趨近于0%),即隨著實(shí)際流域生物信息流的增長(zhǎng)估算流域生物信息流的最優(yōu)估值對(duì)實(shí)際流域生物信息流的偏離程度逐漸減小;(2)隨著實(shí)際流域生物信息流從0.1增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間幅寬逐漸先增大再減小(從0.14(0.02—0.16)逐步增大到0.25(0.34—0.59)再逐步縮小到0.1(0.8—0.9)),最大幅寬出現(xiàn)在實(shí)際流域生物信息流為0.5的時(shí)候,但其最大偏離程度一直在逐步減小(從最大偏離80%到最大偏離11%),即隨著實(shí)際流域生物信息流的增長(zhǎng)估算流域生物信息流的估值區(qū)間幅寬先增大再減小,但整體上逐漸相對(duì)集中于實(shí)際流域生物信息流水平(圖3)。
圖3 不同實(shí)際流域生物信息流下(C組)估算流域生物信息流值的概率分布Fig.3 Probability distributions of estimated watershed biological information flow (WBIF) in different actual WBIF conditions (group C)C組,上下游樣點(diǎn)分別有生物信息1000種、900種,樣點(diǎn)生物信息檢出度為0.1,實(shí)際流域生物信息流為變量
在樣點(diǎn)生物信息檢出度為0.5時(shí),(1)隨著實(shí)際流域生物信息流從0.1增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值從偏小0.004增大到偏小0.008再減小到0,但其偏離程度在逐步減小(從偏離4%到偏離趨近于0%),即隨著實(shí)際流域生物信息流的增長(zhǎng)估算流域生物信息流的最優(yōu)估值對(duì)實(shí)際流域生物信息流的偏離程度逐漸減?。?2)隨著實(shí)際流域生物信息流從0.1增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間幅寬逐漸先增大再減小(從0.05(0.068—0.118)增大到0.084(0.446—0.53)再縮小到0.03(0.87—0.9)),最大幅寬出現(xiàn)在實(shí)際流域生物信息流為0.5的時(shí)候,但其最大偏離程度一直在逐步減小(從最大偏離32%到最大偏離3.3%),即隨著實(shí)際流域生物信息流的增長(zhǎng)估算流域生物信息流的估值區(qū)間幅寬先增大再減小,但整體上逐漸相對(duì)集中于實(shí)際流域生物信息流水平(圖4)。
圖4 不同實(shí)際流域生物信息流下(D組)估算流域生物信息流值的概率分布Fig.4 Probability distributions of estimated watershed biological information flow (WBIF) in different actual WBIF conditions (group D)D組,上下游樣點(diǎn)分別有生物信息1000種、900種,樣點(diǎn)生物信息檢出度為0.5,實(shí)際流域生物信息流為變量
模擬計(jì)算顯示,上下游樣點(diǎn)生物信息種類數(shù)對(duì)調(diào)(分別為900種、1000種)之后,在實(shí)際流域生物信息流水平在0.5的時(shí)候,(1)隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值從0.4778(偏離4.44%)逐步增長(zhǎng)到0.4975(偏離0.5%),即隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的最優(yōu)估值逐漸趨近于實(shí)際流域生物信息流水平,但相比于上下游樣點(diǎn)生物信息種類數(shù)對(duì)調(diào)之前(上游1000種,下游900種)的最優(yōu)估值的偏離程度有所增大;(2)隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.3222—0.6(最大偏離35.56%)收縮到0.4802—0.5111(最大偏離3.96%),即隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的估值區(qū)間逐漸集中于實(shí)際流域生物信息流水平,但相比于上下游樣點(diǎn)生物信息種類數(shù)對(duì)調(diào)之前(上游1000種,下游900種)的估值區(qū)間的幅寬和最大偏離程度都有所增大(圖5)。
圖5 不同樣點(diǎn)生物信息檢出度下(E組)估算流域生物信息流值的概率分布Fig.5 Probability distributions of estimated watershed biological information flow (WBIF) in different biological information detection efficiency (BIDE) conditions at sampling sites (group E)E組,上下游樣點(diǎn)分別有生物信息900種、1000種,實(shí)際流域生物信息流水平為0.5,樣點(diǎn)生物信息檢出度為變量
模擬計(jì)算顯示,上下游樣點(diǎn)生物信息種類數(shù)對(duì)調(diào)(分別為900種、1000種)之后,在樣點(diǎn)生物信息檢出度為0.5的時(shí)候,(1)隨著實(shí)際流域生物信息流從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值從偏小0.0044(偏離4.40%)逐步增長(zhǎng)到0.0089(偏離2.97%)然后再縮小到0.0067(偏離0.74%),即隨著實(shí)際流域生物信息流的增長(zhǎng)估算流域生物信息流的最優(yōu)估值對(duì)實(shí)際流域生物信息流的偏離程度逐漸減小,但相比于上下游樣點(diǎn)生物信息種類數(shù)對(duì)調(diào)之前(上游1000種,下游900種)的最優(yōu)估值的偏離程度有所增大;(2)隨著實(shí)際流域生物信息流從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間幅寬從0.0543(最大偏離33.3%)逐漸先增大到0.0934(最大偏離11.56%)再減小到0.0666(最大偏離4.93%),即隨著實(shí)際流域生物信息流的增長(zhǎng)估算流域生物信息流的估值區(qū)間幅寬先增大再減小,但整體上逐漸相對(duì)集中于實(shí)際流域生物信息流水平,相比于上下游樣點(diǎn)生物信息種類數(shù)對(duì)調(diào)之前(上游1000種,下游900種)的估值區(qū)間的幅寬和最大偏離程度都有所增大(圖6)。
圖6 不同實(shí)際流域生物信息流下(F組)估算流域生物信息流值的概率分布Fig.6 Probability distributions of estimated watershed biological information flow (WBIF) in different actual WBIF conditions (group F)F組,上下游樣點(diǎn)分別有生物信息900種、1000種,樣點(diǎn)生物信息檢出度為0.5,實(shí)際流域生物信息流為變量
隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的最優(yōu)估值逐漸從偏低趨近于實(shí)際流域生物信息流水平?;贏組和B組參數(shù)的模擬計(jì)算結(jié)果顯示,上下游樣點(diǎn)分別有生物信息1000種、900種的條件下,在實(shí)際流域生物信息流水平在0.5的時(shí)候,隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值從0.48(偏離4%)逐步增長(zhǎng)到0.4978(偏離0.44%);在實(shí)際流域生物信息流水平在0.8的時(shí)候,隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的最優(yōu)估值從0.79(偏離1.25%)逐步增長(zhǎng)到0.7978(偏離0.275%)。在樣點(diǎn)生物信息檢出度的各個(gè)水平條件下,估算流域生物信息流的最優(yōu)估值對(duì)實(shí)際流域生物信息流都偏小,并且樣點(diǎn)生物信息檢出度越高估算流域生物信息流的最優(yōu)估值對(duì)實(shí)際流域生物信息流的偏小程度越小,估算準(zhǔn)確度越高。
隨著樣點(diǎn)生物信息檢出度的增長(zhǎng)估算流域生物信息流的估值區(qū)間逐漸集中于實(shí)際流域生物信息流水平。基于A組和B組參數(shù)的模擬計(jì)算結(jié)果顯示,上下游樣點(diǎn)分別有生物信息1000種、900種的條件下,在實(shí)際流域生物信息流水平在0.5的時(shí)候,隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.34—0.59(最大偏離32%)收縮到0.4822—0.51(最大偏離3.56%);在實(shí)際流域生物信息流水平在0.8的時(shí)候,隨著樣點(diǎn)生物信息檢出度從0.1逐步增長(zhǎng)到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.67—0.86(最大偏離16.25%)收縮到0.7867—0.8067(最大偏離1.66%)。估算流域生物信息流的99.9%置信區(qū)間內(nèi)的概率分布近似正態(tài)分布,但向偏小的方向滑動(dòng)(圖1、圖2),置信區(qū)間上限的最大偏離程度小于置信區(qū)間下限的最大偏離程度;樣點(diǎn)生物信息檢出度對(duì)估算流域生物信息流的99.9%置信區(qū)間內(nèi)的概率分布對(duì)實(shí)際流域生物信息流的偏離程度有影響,檢出度越高估算流域生物信息流的99.9%置信區(qū)間越小,對(duì)實(shí)際流域生物信息流的偏小程度也越小,估算精密度越高。
樣點(diǎn)生物信息檢出度越高,對(duì)樣點(diǎn)生物信息的刻畫越精確,對(duì)基于樣點(diǎn)生物信息檢出度的相關(guān)評(píng)估結(jié)果的估算也越精確。調(diào)查樣點(diǎn)的生物信息檢出是整個(gè)研究江段流域生物信息流估算的基礎(chǔ)[3],決定了用eDNA監(jiān)測(cè)水生生物多樣性的可監(jiān)測(cè)距離的估算[11]。前人的研究中,對(duì)流水水體中的水生生物的可監(jiān)測(cè)距離的估算有各種各樣的數(shù)值,從小幾十米[18,20],到幾百米、數(shù)公里[21—22],再到上百千米[16]都有,導(dǎo)致這一結(jié)果差異的涉及到eDNA的產(chǎn)生、輸移、吸附、沉積、再懸浮、降解等一系列動(dòng)力學(xué)過程[13—14],受各種各樣的因素影響[17,20,23—24],也會(huì)有樣點(diǎn)生物信息檢出度差異對(duì)其估算結(jié)果的影響。為了推動(dòng)基于eDNA技術(shù)的研究具有更好的可靠性和可重復(fù)性,標(biāo)準(zhǔn)化的研究方案和論文研究細(xì)節(jié)說明已被大家所注意到,但截至目前大家所關(guān)注的主要是采樣點(diǎn)狀況、采樣技術(shù)方案、采樣環(huán)境條件、采樣時(shí)間設(shè)置、樣品處理方式、污染控制狀況、樣品存儲(chǔ)和運(yùn)輸條件、PCR條件等[25—28],較少關(guān)注平行樣對(duì)研究結(jié)果影響的評(píng)估,以至于大家對(duì)用eDNA技術(shù)調(diào)查結(jié)果不做評(píng)估地直接展示[29—30]。因此,本研究在此強(qiáng)調(diào),對(duì)各eDNA監(jiān)測(cè)研究所獲得的可監(jiān)測(cè)距離在采信之前需要給予相應(yīng)基于樣點(diǎn)生物信息檢出度的可信度評(píng)估,同時(shí)也建議未來基于eDNA技術(shù)的研究對(duì)各自的研究結(jié)果進(jìn)行可信度評(píng)估。
為了得到可信的流域生物信息流估算結(jié)果,有必要基于流域生物信息流估算可信度目標(biāo)進(jìn)行樣點(diǎn)生物信息檢出度的控制。在實(shí)際調(diào)查應(yīng)用中,調(diào)查到或沒調(diào)查到某一目標(biāo)對(duì)實(shí)際該目標(biāo)存在與否的判斷只是在一個(gè)概率意義上成立,當(dāng)某一情況的可信度達(dá)到某一閾值其結(jié)果才可信或可用。與之相應(yīng),在流域生物信息流實(shí)際調(diào)查評(píng)估中,估算出的兩個(gè)樣點(diǎn)間的流域生物信息流值對(duì)實(shí)際流域生物信息流的表征也只是在一個(gè)概率意義上成立,當(dāng)某一估算結(jié)果的可信度達(dá)到某一閾值其結(jié)果才可信或可用。假設(shè)我們?cè)O(shè)流域生物信息流估算的最優(yōu)估值對(duì)實(shí)際值的偏離不超過1%,且流域生物信息流估算值的99.9%置信區(qū)間對(duì)實(shí)際值的最大偏離不超過5%,為流域生物信息流估算可信度的目標(biāo)。那么,在上下游樣點(diǎn)分別有生物信息1000種、900種的,實(shí)際流域生物信息流水平在0.5左右的條件下,樣點(diǎn)生物信息檢出度應(yīng)控制在0.8以上(圖1);在上下游樣點(diǎn)分別有生物信息1000種、900種的,實(shí)際流域生物信息流水平在0.8左右的條件下,樣點(diǎn)生物信息檢出度應(yīng)控制在0.5以上(圖2)。
2020年9月在武漢江段一個(gè)調(diào)查樣點(diǎn)的eDNA調(diào)查結(jié)果顯示,可用eDNA(單引物mlCOIintF/ jgHCO2198R)調(diào)查到的魚類物種最優(yōu)估計(jì)約99種,單樣品eDNA的魚類物種檢出能力約為26種,檢出效率約為25.8%,在50%的檢出度目標(biāo)下,需要約3個(gè)平行樣,在80%的檢出度目標(biāo)下,需要約10個(gè)平行樣[19]。如果在這一時(shí)段需要在長(zhǎng)江干流武漢江段進(jìn)行eDNA采樣估算以魚類為指標(biāo)的流域生物信息流,其中假設(shè)采樣距離設(shè)置為10km,實(shí)際流域生物信息流預(yù)估為0.8左右,那么為了獲得一個(gè)可信的流域生物信息流正式估算值,每個(gè)樣點(diǎn)需采的平行樣數(shù)量不應(yīng)少于3個(gè);假設(shè)如果采樣距離設(shè)置為30km,實(shí)際流域生物信息流預(yù)估為0.5左右,那么為了獲得一個(gè)可信的流域生物信息流正式估算值,每個(gè)樣點(diǎn)需采的平行樣數(shù)量不應(yīng)少于10個(gè)。
在兩個(gè)采樣點(diǎn)間的實(shí)際流域生物信息流值較低的情況下,應(yīng)適當(dāng)提高平行樣數(shù)量。實(shí)際流域生物信息流大小不影響樣點(diǎn)生物信息檢出度對(duì)估算流域生物信息流的影響規(guī)律(圖1、圖2對(duì)比),但影響了估算流域生物信息流的估算(圖3、圖4)。流域生物信息流本身的值越低,采樣和計(jì)算中的不確定性產(chǎn)生的影響就越大;流域生物信息流本身的值越高,采樣和計(jì)算中的不確定性產(chǎn)生的影響就越小。用模擬計(jì)算結(jié)果來講,估算流域生物信息流的最優(yōu)估值隨著實(shí)際流域生物信息流降低而逐漸偏離(偏小)實(shí)際流域生物信息流水平(圖3),估算流域生物信息流的99.9%估值區(qū)間的最大偏離程度隨實(shí)際流域生物信息流降低而逐漸增大,估值區(qū)間相對(duì)于實(shí)際流域生物信息流水平的集中度逐漸降低(圖4),所以在實(shí)際流域生物信息流的值較低時(shí),應(yīng)適當(dāng)提高平行樣數(shù)量,以通過提高樣點(diǎn)生物信息檢出度來提高估算流域生物信息流的精確度。2019年在青藏高原一個(gè)小型河流的流域生物信息流量化研究結(jié)果顯示,春季封凍期、夏季降雨天、秋季多云天的流域生物信息流估算結(jié)果分別為75.86%、97.41%、96.07%每千米[11],如果以10km2為間隔設(shè)置樣點(diǎn),其樣點(diǎn)間流域生物信息流估值分別為6.31%、76.92%、66.97%,那么為了獲得一個(gè)可信的流域生物信息流正式估算值,各樣點(diǎn)的信息檢出度分別需要達(dá)到98%、50%、60%左右。
在上游樣點(diǎn)生物信息種類數(shù)小于下游樣點(diǎn)生物信息種類數(shù)的情況下,應(yīng)適當(dāng)提高平行樣數(shù)量。上游樣點(diǎn)的生物信息種類與下游樣點(diǎn)的生物信息種類的相對(duì)關(guān)系,并不影響樣點(diǎn)生物信息檢出度和實(shí)際流域生物信息流對(duì)估算流域生物信息流的影響規(guī)律,但影響了估算流域生物信息流的估算。由于在上游樣點(diǎn)生物信息種類數(shù)小于下游樣點(diǎn)生物信息種類數(shù)的情況下所估算的流域生物信息流估值比在下游樣點(diǎn)生物信息種類數(shù)小于上游樣點(diǎn)生物信息種類數(shù)的情況下所估算的流域生物信息流估值相對(duì)流域生物信息流實(shí)際值有更大的最優(yōu)估值偏離(偏小)程度(圖1、圖5對(duì)比)和更大的99.9%估值區(qū)間的幅寬和最大偏離程度(圖4、圖6對(duì)比),所以在上游樣點(diǎn)生物信息種類數(shù)小于下游樣點(diǎn)生物信息種類數(shù)時(shí),應(yīng)適當(dāng)提高平行樣數(shù)量,以通過提高樣點(diǎn)生物信息檢出度來提高估算流域生物信息流的精確度。由于流域生物信息流會(huì)增加輸入水體的生物信息種類[3—4],因此通常情況下,上游樣點(diǎn)的生物信息種類會(huì)少于下游樣點(diǎn)的生物信息種類,在這種條件下,估算流域生物信息流最優(yōu)估值對(duì)實(shí)際流域生物信息流的偏小程度更大,估算流域生物信息流估值區(qū)間的幅寬和最大偏離程度也更大。由于流域生物信息流對(duì)所輸入水體的生物信息種類的增加在持續(xù)的向下游輸移過程中是非累計(jì)的[3],所以河流的干支流交匯處的生物信息種類會(huì)比交匯處下游較遠(yuǎn)處的生物信息種類要多,在這種條件下,估算流域生物信息流最優(yōu)估值對(duì)實(shí)際流域生物信息流的偏小程度會(huì)減小,估算流域生物信息流估值區(qū)間的幅寬和最大偏離程度也會(huì)減小。另外,隨著水體理化環(huán)境的轉(zhuǎn)變,流域生物信息流中的有效流域生物信息流部分會(huì)被環(huán)境過濾效應(yīng)所過濾掉,導(dǎo)致上游樣點(diǎn)的生物信息種類會(huì)多于下游樣點(diǎn)的生物信息種類[3],在這種條件下,估算流域生物信息流最優(yōu)估值對(duì)實(shí)際流域生物信息流的偏小程度會(huì)減小,估算流域生物信息流估值區(qū)間的幅寬和最大偏離程度也會(huì)減小。因而,相比于在河流交匯處及河流理化環(huán)境狀況急劇轉(zhuǎn)換處,在通常的河流條件下,流域生物信息流調(diào)查估算中需要更多的平行樣。
在上下游樣點(diǎn)生物信息種類數(shù)相對(duì)關(guān)系確定、實(shí)際流域生物信息流確定、樣點(diǎn)生物信息檢出度確定的情況下,理論上所可得的估算流域生物信息流的值依然是分布在某一特定估值區(qū)間,而非一個(gè)確切值。雖然說通過基于流域生物信息流估算可信度目標(biāo)的樣點(diǎn)生物信息檢出度控制可以提高理論上所可得的估算流域生物信息流的估值區(qū)間的集中度,進(jìn)而使得流域生物信息流估算值對(duì)實(shí)際值有較好的近似程度,但在實(shí)際應(yīng)用中還是有必要給出這個(gè)流域生物信息流估值所對(duì)應(yīng)的實(shí)際流域生物信息流(區(qū)間)及相應(yīng)后驗(yàn)概率,以保障其結(jié)果的科學(xué)性嚴(yán)謹(jǐn)性,給不同研究之間的橫向比較提供科學(xué)可行合理可靠的基礎(chǔ)。
在實(shí)際調(diào)查評(píng)估工作中,上下游樣點(diǎn)生物信息種類數(shù)可以通過各調(diào)查樣點(diǎn)一定數(shù)量的平行樣的調(diào)查結(jié)果的物種積累曲線的分析而估算獲得[19],各調(diào)查樣點(diǎn)的樣點(diǎn)生物信息檢出度可以通過調(diào)查所得的生物信息種類數(shù)除以各相應(yīng)調(diào)查樣點(diǎn)的生物信息種類數(shù)而計(jì)算獲得[19],估算流域生物信息流的值可以通過上下游共有生物信息種類數(shù)除以上游樣點(diǎn)生物信息種類數(shù)而計(jì)算獲得[3],然后可以根據(jù)模擬計(jì)算公式組進(jìn)行相應(yīng)的模擬計(jì)算,再通過后驗(yàn)概率計(jì)算實(shí)際流域生物信息流狀況及其概率分布。
流水水體中,自上游到下游的流域生物信息流過程十分復(fù)雜,涉及到eDNA的釋放、稀釋、吸附、再懸浮、輸移、降解等過程[13—15]。有一種方向是朝著弄清楚機(jī)理的方向努力,通過受控實(shí)驗(yàn)弄清環(huán)境因子對(duì)流域生物信息流過程中各環(huán)節(jié)的影響,再通過各環(huán)境因子的參數(shù)化、流域生物信息流過程各環(huán)境的模型化來推動(dòng)對(duì)整個(gè)流域生物信息流的理解和量化[17,31—33]。我們認(rèn)為,還可以有另外一個(gè)方向,即暫時(shí)先把流域生物信息流的復(fù)雜過程打包成黑箱,接受不確定性控制不確定性量化不確定性,通過輸入和輸出的量化分析,推進(jìn)流域生物信息流研究的應(yīng)用和發(fā)展。這即是我們所提出的流域生物信息流分析框架的處理問題方式[3,11],也是本研究的目的。
本文針對(duì)平行樣的增減是否會(huì)顯著改變以及會(huì)如何改變流域生物信息流的估算結(jié)果這一問題,通過對(duì)問題進(jìn)行簡(jiǎn)化而轉(zhuǎn)化為檢出度是否會(huì)以及會(huì)如何影響估算流域生物信息流的問題,進(jìn)而通過模擬計(jì)算對(duì)其進(jìn)行了探討。模擬計(jì)算結(jié)果顯示,估算流域生物信息流的最優(yōu)估值小于實(shí)際流域生物信息流,隨著樣點(diǎn)生物信息檢出度(即平行樣數(shù)量)的增長(zhǎng)估算流域生物信息流的最優(yōu)估值逐漸趨近于實(shí)際流域生物信息流值,估算流域生物信息流的估值區(qū)間逐漸集中于實(shí)際流域生物信息流值,即樣點(diǎn)生物信息檢出度越高(平行樣越多)估算流域生物信息流的準(zhǔn)確度和精密度越高。另外,實(shí)際流域生物信息流大小、上下游樣點(diǎn)生物信息種類數(shù)相對(duì)關(guān)系均對(duì)估算流域生物信息流的準(zhǔn)確度和精密度有明確影響:實(shí)際流域生物信息流越大估算流域生物信息流的準(zhǔn)確度和精密度越高,上游樣點(diǎn)的生物信息種類多于下游樣點(diǎn)的生物信息種類時(shí)的估算流域生物信息流的準(zhǔn)確度和精密度相對(duì)更高。在實(shí)際應(yīng)用中,為了提高流域生物信息流估算結(jié)果的可靠性,有必要基于流域生物信息流估算可信度目標(biāo)進(jìn)行樣點(diǎn)生物信息檢出度的控制,并且對(duì)流域生物信息流估算結(jié)果進(jìn)行后驗(yàn)概率評(píng)估。