??缀?李 斌 王 康 郭鈺倫 王維康 徐 軍
(1. 中國(guó)科學(xué)院水生生物研究所,武漢 430072; 2. 內(nèi)江師范學(xué)院,內(nèi)江 641100; 3. 深圳市利源水務(wù)設(shè)計(jì)咨詢有限公司,深圳 528031)
穩(wěn)定同位素技術(shù)是研究食物網(wǎng)生態(tài)學(xué)的重要技術(shù)手段[1—4]。與直接觀察攝食或胃腸含物分析等技術(shù)手段相比,穩(wěn)定同位素技術(shù)能反映較長(zhǎng)時(shí)間尺度內(nèi)消費(fèi)者營(yíng)養(yǎng)來(lái)源的整合特征[1,5]?;诜€(wěn)定同位素質(zhì)量平衡模型,穩(wěn)定同位素技術(shù)可用于消費(fèi)者營(yíng)養(yǎng)溯源,即確定多種營(yíng)養(yǎng)來(lái)源對(duì)消費(fèi)者的貢獻(xiàn)比重[6—8]。作為穩(wěn)定同位素質(zhì)量平衡模型的重要分支,貝葉斯混合模型考慮了營(yíng)養(yǎng)來(lái)源的不確定性,并允許納入?yún)f(xié)變量,所以近十多年來(lái)得到了廣泛的應(yīng)用[9]。通常使用貝葉斯混合模型來(lái)估計(jì)不同營(yíng)養(yǎng)來(lái)源的貢獻(xiàn); 此類(lèi)模型在貝葉斯混合模型輸出了每個(gè)營(yíng)養(yǎng)來(lái)源對(duì)消費(fèi)者貢獻(xiàn)比例的概率分布特征[10],因此其假設(shè)之一就是營(yíng)養(yǎng)來(lái)源對(duì)消費(fèi)者貢獻(xiàn)比重滿足(0,100%)的條件。當(dāng)引入某種營(yíng)養(yǎng)來(lái)源進(jìn)入模型時(shí),就存在了消費(fèi)者確實(shí)依賴了這種營(yíng)養(yǎng)來(lái)源的先驗(yàn)假設(shè); 一個(gè)營(yíng)養(yǎng)來(lái)源的貢獻(xiàn)比例高,必然會(huì)降低其他營(yíng)養(yǎng)來(lái)源的貢獻(xiàn)比例,導(dǎo)致?tīng)I(yíng)養(yǎng)來(lái)源貢獻(xiàn)比例不確定性增加[11]。因此,評(píng)估貝葉斯混合模型性能,就需要評(píng)價(jià)貝葉斯混合模型擬合結(jié)果的優(yōu)劣,及其與生態(tài)學(xué)理論和研究背景的匹配程度。
本文基于實(shí)測(cè)同位素?cái)?shù)據(jù)集(蒙古鲌Culter mongolicus mongolicus同位素?cái)?shù)據(jù)集),通過(guò)識(shí)別消費(fèi)者營(yíng)養(yǎng)功能類(lèi)群特征、改變營(yíng)養(yǎng)來(lái)源先驗(yàn)信息特征,構(gòu)建系列貝葉斯模型; 通過(guò)比較模型總體性能、實(shí)測(cè)值與預(yù)測(cè)值差異,及先驗(yàn)信息和后驗(yàn)信息差異等多種模型性能評(píng)價(jià)方法,來(lái)描述模型性能評(píng)價(jià)的方法和過(guò)程,以此為應(yīng)用穩(wěn)定性同位素技術(shù)開(kāi)展消費(fèi)者營(yíng)養(yǎng)溯源研究,提供模型性能評(píng)估體系。
本研究中蒙古鲌數(shù)據(jù)引自李斌等[12]。實(shí)驗(yàn)材料于2010年7月采自三峽庫(kù)區(qū)腹地北岸支流小江。同位素樣品在西南大學(xué)地理科學(xué)學(xué)院地球化學(xué)與同位素實(shí)驗(yàn)室(設(shè)備型號(hào): Flash EA112HE DELT plus XP)完成測(cè)試,其分析精度δ13C<0.02‰,δ15N<0.03‰。樣品的收集、處理和保存方法如徐軍等[13]所描述。
采用K-means聚類(lèi)對(duì)消費(fèi)者穩(wěn)定同位素值進(jìn)行聚類(lèi)和種群營(yíng)養(yǎng)功能群劃分。K-means聚類(lèi)屬于無(wú)監(jiān)督學(xué)習(xí)聚類(lèi)?;驹硎菑膎個(gè)數(shù)據(jù)對(duì)象任意選擇k個(gè)對(duì)象作為初始聚類(lèi)中心點(diǎn)[14]; 根據(jù)每個(gè)聚類(lèi)對(duì)象的中心點(diǎn),計(jì)算每個(gè)數(shù)據(jù)對(duì)象與這些中心點(diǎn)的距離; 并根據(jù)最小距離重新對(duì)相應(yīng)數(shù)據(jù)對(duì)象進(jìn)行劃分; 重新計(jì)算每個(gè)聚類(lèi)中心點(diǎn),反復(fù)循環(huán)至每個(gè)聚類(lèi)不再發(fā)生變化[14,15]。
較為常見(jiàn)的聚類(lèi)效果評(píng)估方法是總體類(lèi)內(nèi)誤差平方和(Total within sum of the squared errors)評(píng)估(公式 1),即肘部法則(Elbow Method)[14,15]。
式中,Ci是第i個(gè)簇;p是Ci中的樣本點(diǎn);mi是Ci的質(zhì)心(Ci中所有樣本的均值);SSE是所有樣本的聚類(lèi)誤差[14]。隨著聚類(lèi)數(shù)k的增大,總體類(lèi)內(nèi)誤差平方和減小,SSE隨著分組增加而降低; 在達(dá)到某個(gè)臨界點(diǎn)時(shí),SSE得到極大改善,之后緩慢下降,形成一個(gè)“肘部”形狀的關(guān)系; 這個(gè)臨界點(diǎn)附近的聚類(lèi)數(shù)k即可作為聚類(lèi)性能較好的分組[14,15]。
本研究分析表明,在對(duì)消費(fèi)者蒙古鲌的穩(wěn)定同位素值進(jìn)行聚類(lèi)過(guò)程中,發(fā)現(xiàn)在k=4、5、6時(shí),SSE值形成的“手肘”形狀關(guān)系; 但是分組的增加所獲得的SSE值下降的回報(bào)不高(圖 1A)。結(jié)合湖泊生態(tài)學(xué)基本理論和消費(fèi)者種群內(nèi)營(yíng)養(yǎng)功能群的特點(diǎn)[16—18],本文設(shè)置了一個(gè)聚類(lèi)k值的選擇條件,即某k值(k>1)聚類(lèi)所獲得的SSE值與k=1時(shí)SSE值的比值小于15%時(shí),則分組回報(bào)不足?;谶@個(gè)聚類(lèi)原則,對(duì)消費(fèi)者蒙古鲌的穩(wěn)定同位素值進(jìn)行聚類(lèi),最佳聚類(lèi)數(shù)選3(圖 1A),分別代表魚(yú)類(lèi)食性為主(Piscivorous)、浮游動(dòng)物食性為主(Planktivorous)和底棲動(dòng)物食性為主(Benthivorous)等食物網(wǎng)功能類(lèi)型(圖 1B)。種群營(yíng)養(yǎng)功能群的識(shí)別,既有助于減小消費(fèi)者同位素變異所帶來(lái)的不確定,又有助于理解消費(fèi)者在食物網(wǎng)的功能[19,20]。
圖1 種群內(nèi)營(yíng)養(yǎng)功能群的確定Fig. 1 Within-population trophic functional groupsA. K-means聚類(lèi)與總體類(lèi)內(nèi)誤差平方和百分比特征; B. 魚(yú)類(lèi)食性為主、浮游動(dòng)物食性為主和底棲動(dòng)物食性為主的3個(gè)功能類(lèi)型A. K-means cluster and percentage of total within sum of the squared errors; B. Three trophic functional groups,including piscivorous,planktivorous,and benthivorous
構(gòu)建貝葉斯混合模型的一個(gè)重要前提條件是消費(fèi)者與營(yíng)養(yǎng)來(lái)源間的同位素的差異[21,22]。這種差異由消化和代謝過(guò)程中同位素分餾引起,被稱為營(yíng)養(yǎng)富集因子(Trophic enrichment factor,TEF,Δ),其定義為Δ =δtissue–δdiet(δ代表樣品的同位素比值與標(biāo)準(zhǔn)物質(zhì)的同位素比值之間的相對(duì)差異)[23]。由于TEF受到從生理到營(yíng)養(yǎng)來(lái)源的多種因素影響,實(shí)際研究中多采用營(yíng)養(yǎng)級(jí)富集因子的統(tǒng)計(jì)平均值(或多個(gè)統(tǒng)計(jì)平均值)進(jìn)行分析,以獲得最接近富集因子真實(shí)值的近似值,從而更好地估算該種類(lèi)的食源組成[21,22]。例如,δ15N在相鄰兩個(gè)營(yíng)養(yǎng)級(jí)間所產(chǎn)生的富集因子(Δδ15N)在3‰—5‰[24],而δ13C在相鄰營(yíng)養(yǎng)級(jí)間富集因子(Δδ13C)為0.4‰—1.0‰[25]。
在本研究中,消費(fèi)者蒙古鲌是典型的肉食性消費(fèi)者,本研究使用Δδ15N=(3.4±0.99)‰和Δδ13C=(0.39±1.14)‰對(duì)營(yíng)養(yǎng)來(lái)源的穩(wěn)定碳氮同位素進(jìn)行矯正,即Δ+δdiet[21,22]。結(jié)合蒙古鲌食性對(duì)食物來(lái)源進(jìn)行整合,形成四類(lèi)營(yíng)養(yǎng)來(lái)源用于模型構(gòu)建,包括浮游動(dòng)物、底棲動(dòng)物、浮游魚(yú)類(lèi)和底棲魚(yú)類(lèi)(圖 2,食物來(lái)源δ值數(shù)據(jù)來(lái)自李斌等[12]的實(shí)測(cè)數(shù)據(jù))。TEF的不確定性(標(biāo)準(zhǔn)誤差),通過(guò)統(tǒng)計(jì)平方公差法(Root-Sum-Squares Error),整合到食物來(lái)源同位素的誤差中(公式2),用來(lái)反映數(shù)據(jù)誤差的整體特征[26]。
式中,σ為標(biāo)準(zhǔn)差。
同位素混合空間中(圖 2)營(yíng)養(yǎng)來(lái)源和消費(fèi)者同位素之間的共線性,及不同營(yíng)養(yǎng)來(lái)源之間的差異水平等情況,可會(huì)導(dǎo)致統(tǒng)計(jì)上多種營(yíng)養(yǎng)來(lái)源貢獻(xiàn)的等效解決方案,也需盡量避免[27]。結(jié)合多元方差分析(Multivariate analysis of variance,MANOVA),結(jié)果表明4種潛在食物來(lái)源表現(xiàn)出一種或一種以上的穩(wěn)定同位素顯著差異(P<0.05),且共線性特征不顯著(圖 2),適合進(jìn)一步分析消費(fèi)者的食物來(lái)源。
TEF的選擇及源矯正的合理性,對(duì)穩(wěn)定同位素質(zhì)量平衡混合模型的結(jié)果影響很大[21]?;旌夏P偷幕炯僭O(shè)之一就是,消費(fèi)者的穩(wěn)定同位素必須屬于多種食物來(lái)源穩(wěn)定同位素所定義的同位素混合空間[9]。特別需要指出的是,本研究案例中的貝葉斯混合模型,其數(shù)學(xué)性質(zhì)是即使數(shù)據(jù)不符合穩(wěn)定同位素混合的基本假設(shè),也會(huì)獲得方程的解[9,10]。因此,必須檢查消費(fèi)者穩(wěn)定性同位素?cái)?shù)據(jù)是否絕大多數(shù)落入多種營(yíng)養(yǎng)來(lái)源確定的同位素混合空間中[28]。
盡管通過(guò)營(yíng)養(yǎng)富集因子校正后的穩(wěn)定同位素混合空間(圖 2),可以初步進(jìn)行判斷; 但直觀觀察很難準(zhǔn)確確定哪些樣本屬于混合多邊形。由于貝葉斯建模包含不確定性(本例中為均值和標(biāo)準(zhǔn)偏差),需要借助一定的統(tǒng)計(jì)學(xué)方法來(lái)判斷哪些消費(fèi)者在模型求解過(guò)程中產(chǎn)生錯(cuò)誤的風(fēng)險(xiǎn)較高。本研究采取混合多邊形迭代模擬的方法來(lái)判別數(shù)據(jù)落入混合多邊形的可能性。基本方法是,基于TEF校正后的各種營(yíng)養(yǎng)來(lái)源的同位素均值和標(biāo)準(zhǔn)偏差,迭代生成10000次穩(wěn)定同位素混合多邊形; 進(jìn)一步計(jì)算消費(fèi)者穩(wěn)定同位素落入這些混合多邊形的頻次; 消費(fèi)者穩(wěn)定同位素落在>0.05可能性區(qū)域,為數(shù)據(jù)質(zhì)量符合建模需要(圖 3A、3B和3C)。
圖2 營(yíng)養(yǎng)富集因子校正后的穩(wěn)定同位素混合空間Fig. 2 Trophic enrichment factor corrected isospace
如前文所述,同位素混合空間中營(yíng)養(yǎng)來(lái)源和消費(fèi)者之間的共線性,可為營(yíng)養(yǎng)來(lái)源貢獻(xiàn)提供多種在統(tǒng)計(jì)上等效的解決方案[9,10]。引起這種不確定性的主要特點(diǎn)是,當(dāng)消費(fèi)者的穩(wěn)定同位素處于由營(yíng)養(yǎng)來(lái)源所構(gòu)成的同位素空間中心區(qū)域時(shí),模型無(wú)法確定營(yíng)養(yǎng)來(lái)源比例。因此,當(dāng)穩(wěn)定同位素混合空間質(zhì)心區(qū)域消費(fèi)者樣本過(guò)多時(shí),共線性增加,穩(wěn)定同位素混合空間模型求解不會(huì)收斂或預(yù)測(cè)值與觀測(cè)值不能較好匹配[29]。本研究采取混合多邊形迭代模擬的方法來(lái)判別數(shù)據(jù)質(zhì)量?;痉椒ㄊ?基于TEF校正后的各種營(yíng)養(yǎng)來(lái)源的同位素均值和標(biāo)準(zhǔn)偏差,迭代生成10000次高風(fēng)險(xiǎn)混合同位素空間(以質(zhì)心為中心的50%不規(guī)則多邊形面積內(nèi))[28,29],進(jìn)一步計(jì)算消費(fèi)者同位素落入風(fēng)險(xiǎn)高的混合空間的次數(shù); 通過(guò)計(jì)算落入混合空間次數(shù)與迭代次數(shù)的比值,基于統(tǒng)計(jì)學(xué)頻次計(jì)算落入高風(fēng)險(xiǎn)穩(wěn)定同位素混合空間的概率,來(lái)檢驗(yàn)數(shù)據(jù)建模的質(zhì)量; 消費(fèi)者穩(wěn)定同位素落在<0.95可能性區(qū)域,為數(shù)據(jù)質(zhì)量符合建模需要(圖 3D、3E和3F)[28,29]。
由圖 3所示(等值線顏色深淺顯示了概率輪廓),本研究數(shù)據(jù)總體質(zhì)量較高。圖 3A、3B和3C則顯示了消費(fèi)者蒙古鲌同位素值的變化將如何影響營(yíng)養(yǎng)來(lái)源混合模型合理求解的概率[28]。95%概率輪廓內(nèi)的消費(fèi)者蒙古鲌樣品可用于混合模型使用,也就是說(shuō)其中一個(gè)樣本(16號(hào)個(gè)體)位于營(yíng)養(yǎng)來(lái)源之外,因此模型解釋程度低,在后續(xù)建模分析中予以剔除。圖 3D、3E和3F則顯示了消費(fèi)者蒙古鲌同位素值的變化將如何影響營(yíng)養(yǎng)來(lái)源混合模型低估風(fēng)險(xiǎn)的概率[29]。消費(fèi)者蒙古鲌樣品落入風(fēng)險(xiǎn)區(qū)的概率總體低于50%,未出現(xiàn)高于95%概率的樣本。
圖3 混合多邊形迭代模擬Fig. 3 Mixing polygon simulation
需要強(qiáng)調(diào)的是,如果在上述統(tǒng)計(jì)方法檢驗(yàn)過(guò)程中,發(fā)現(xiàn)較多的樣本不適用于建模,則必須考慮研究假設(shè)中是否存在1)測(cè)量過(guò)程的錯(cuò)誤、和/或2)消費(fèi)者的重要食物來(lái)源被忽略、和/或3)營(yíng)養(yǎng)富集因子使用不合理等問(wèn)題。
“從先驗(yàn)信息中獲益(Profiting from prior information)”是貝葉斯建模中的一個(gè)常見(jiàn)想法[30,31]。因此,先驗(yàn)信息的確定是穩(wěn)定性同位素質(zhì)量平衡混合模型的一個(gè)重要條件。為特定研究設(shè)計(jì)建立合理的信息先驗(yàn)是建立貝葉斯模型的最佳方案。因此,在開(kāi)展研究前,需要投入大量的時(shí)間和精力進(jìn)行數(shù)據(jù)收集和分析,了解哪些數(shù)據(jù)滿足了前期的假定條件,提升進(jìn)一步建模分析的準(zhǔn)確性[32]。當(dāng)觀測(cè)樣本量或代表性有限時(shí),貝葉斯模型將觀測(cè)值與先驗(yàn)信息相結(jié)合,提升模型預(yù)測(cè)的準(zhǔn)確性。在消費(fèi)者營(yíng)養(yǎng)溯源研究中,盡管使用胃腸含物來(lái)評(píng)估營(yíng)養(yǎng)來(lái)源具有一定的局限性[33],但為同位素技術(shù)的研究提供了較好的先驗(yàn)信息,可以提高混合模型預(yù)測(cè)的準(zhǔn)確性[34]。此外,環(huán)境中潛在食物來(lái)源豐度、生物量和消費(fèi)者攝食行為習(xí)性等,均可作為重要的先驗(yàn)信息,以提高混合模型預(yù)測(cè)的準(zhǔn)確性[34]。
本研究展示了3個(gè)營(yíng)養(yǎng)來(lái)源貢獻(xiàn)的先驗(yàn)信息,包括默認(rèn)先驗(yàn)(Uninformative)、信息先驗(yàn)(Informative)和高信息先驗(yàn)(Informative with SD; 圖 4)。針對(duì)4種營(yíng)養(yǎng)來(lái)源,包括浮游動(dòng)物、底棲動(dòng)物、浮游魚(yú)類(lèi)和底棲魚(yú)類(lèi),默認(rèn)先驗(yàn)的營(yíng)養(yǎng)來(lái)源貢獻(xiàn)由均值為零、標(biāo)準(zhǔn)偏差為1的正態(tài)分布混合確定,并進(jìn)行中心化對(duì)數(shù)比轉(zhuǎn)換(Centralized logarithm ratio transformation)[35],從而產(chǎn)生均值為0.25且營(yíng)養(yǎng)來(lái)源邊際貢獻(xiàn)大的分布特征(SD≈0.2)。信息先驗(yàn)是基于蒙古鲌的食性分析數(shù)據(jù),4種來(lái)源質(zhì)量比例均值分別為16.7%、28.3%、20.6%和34.4%,依據(jù)上述方法獲得營(yíng)養(yǎng)來(lái)源邊際貢獻(xiàn)水平較大的分布特征(SD≈0.2)。高信息先驗(yàn)的情景則是在此基礎(chǔ)上,結(jié)合食性數(shù)據(jù)變化的標(biāo)準(zhǔn)偏差特點(diǎn),在均值不變的條件下,對(duì)所有營(yíng)養(yǎng)來(lái)源使用了SD ≈ 0.06的標(biāo)準(zhǔn)偏差(圖 4)。在進(jìn)一步建模分析中,本研究采用高信息先驗(yàn)的情景來(lái)分析蒙古鲌數(shù)據(jù)集。
圖4 先驗(yàn)信息的不同情景Fig. 4 Priori information of three scenarios
本研究使用R包simmr來(lái)擬合所有的同位素貝葉斯混合模型(iter=50000,burn=1000,thin=10,n.chain=4),并使用JAGS(Just Another Gibbs Sampler)從后驗(yàn)分布中提取樣本。通過(guò)馬氏鏈(Markov chain,MCMC)軌跡圖檢驗(yàn)法、Geweke檢驗(yàn)法和Gelman檢驗(yàn)法等多種方法診斷了馬氏鏈的收斂性,進(jìn)一步估計(jì)有關(guān)參數(shù)或者進(jìn)行其他統(tǒng)計(jì)推斷。模型結(jié)果表明(表 1),蒙古鲌魚(yú)食性功能群的浮游餌料魚(yú)的比重最高,其次為底棲餌料魚(yú); 蒙古鲌浮游動(dòng)物食性功能群的浮游動(dòng)物和浮游餌料魚(yú)的比重高; 蒙古鲌底棲動(dòng)物食性功能群的底棲動(dòng)物能量貢獻(xiàn)比例最高,結(jié)果整體符合預(yù)期。
表1 模型結(jié)果Tab. 1 Model results
在模型選擇階段,常見(jiàn)指標(biāo)為偏差信息量準(zhǔn)則(Deviance information criterion,DIC)。DIC是等級(jí)模型化的赤池信息量準(zhǔn)則(Akaike information criterion,AIC),被廣泛應(yīng)用于由馬爾可夫鏈蒙特卡洛(MCMC)模擬出的后驗(yàn)分布的貝葉斯模型選擇問(wèn)題[36]。和赤池信息量準(zhǔn)則一樣,偏差信息量準(zhǔn)則是隨樣本容量增加的漸近近似,只應(yīng)用于后驗(yàn)分布呈多元正態(tài)分布的情況[11,37]。一般而言,偏差信息量準(zhǔn)則的值越小,模型越好。這一準(zhǔn)則的優(yōu)點(diǎn)是它很容易從馬爾可夫鏈蒙特卡洛(MCMC)模擬產(chǎn)生的樣本中計(jì)算出來(lái)[36]。在一組供選擇的模型中,如果觀測(cè)值樣本數(shù)不同的時(shí)候,可使用校準(zhǔn)的DIC(DICcor)進(jìn)行比較(公式3)[11,37],公式如下:
式中,N表示每個(gè)模型的樣本數(shù),n為比較的模型中樣本數(shù)最低的數(shù)據(jù)。
例如,本研究中蒙古鲌魚(yú)食性功能群、浮游動(dòng)物食性功能群和底棲動(dòng)物食性功能群的3個(gè)模型的樣本數(shù)分別為11、10和7; 因此,計(jì)算DICcor的時(shí)候,取值n=7。由此模型整體性能評(píng)價(jià)結(jié)果表明(表 2),蒙古鲌魚(yú)食性功能群、浮游動(dòng)物食性功能群和底棲動(dòng)物食性功能群的擬合總體較好(90% Coverage均為100%,90% Coverage為觀測(cè)值落入90%后驗(yàn)分布中的比例)。但3個(gè)模型比較看,魚(yú)食性功能群的擬合模型性能相對(duì)較差(DIC和DICcor最高)。需要特別指出的,在一組供選擇的模型中,最優(yōu)化的模型的選擇都是具有相對(duì)性的,并不是說(shuō)所選擇的模型就一定足夠精確。
表2 模型整體性能評(píng)價(jià)Tab. 2 Model performance
針對(duì)消費(fèi)者營(yíng)養(yǎng)來(lái)源研究,模型性能核心是指營(yíng)養(yǎng)來(lái)源比例在不同方法下的預(yù)測(cè)效果,但是實(shí)踐中很難獲得消費(fèi)者營(yíng)養(yǎng)來(lái)源貢獻(xiàn)的合理觀測(cè)值。因此,通過(guò)評(píng)估消費(fèi)者同位素的觀測(cè)值(y)與預(yù)測(cè)值之間的匹配程度,可以間接評(píng)估不同食物來(lái)源比例的預(yù)測(cè)效果[41]。消費(fèi)者穩(wěn)定同位素預(yù)測(cè)值可通過(guò)模型中各種營(yíng)養(yǎng)來(lái)源貢獻(xiàn)比例和營(yíng)養(yǎng)來(lái)源的穩(wěn)定同位素來(lái)計(jì)算獲得(公式4)[42]:
式中,n表示消費(fèi)者使用的第n種食物來(lái)源,k是食物來(lái)源的數(shù)量(本研究中k=4),f代表通過(guò)食物來(lái)源分配方法預(yù)測(cè)的食物來(lái)源對(duì)消費(fèi)者的比例貢獻(xiàn)。δX表示食物來(lái)源中測(cè)得的同位素組成。
結(jié)合模型的特點(diǎn),通常計(jì)算一個(gè)或多個(gè)基于預(yù)測(cè)值與測(cè)量值的指標(biāo)來(lái)進(jìn)行評(píng)價(jià)(表 3)。例如,均方根誤差(RMSE),總結(jié)了測(cè)得值和預(yù)測(cè)值之間的平均差異,用來(lái)評(píng)估預(yù)測(cè)值的準(zhǔn)確程度; 較低的RMSE值表明該模型具有較小的誤差和更準(zhǔn)確的預(yù)測(cè)。預(yù)測(cè)優(yōu)度統(tǒng)計(jì)數(shù)據(jù)(G)也用于衡量模型的有效性。G值為1表示理想的預(yù)測(cè)。G值越接近1,模型的可靠性越高。G值為負(fù)表示該模型不太可靠。
表3 基于預(yù)測(cè)值與測(cè)量值的模型評(píng)價(jià)方法Tab. 3 Evaluation methods for the difference between model predicts and observations.
衡量模型的擬合程度(模型質(zhì)量好壞),沒(méi)有固定的標(biāo)準(zhǔn)。例如,MAE和RMSE一樣,衡量的是真實(shí)值與預(yù)測(cè)值的偏離的絕對(duì)大小情況,需要結(jié)合真實(shí)值的量綱才能判斷差異; 而MAPE衡量的是偏離的相對(duì)大小(即百分率)。相對(duì)來(lái)說(shuō),MAE和MAPE不容易受極端值的影響; 而MSE和RMSE采用誤差的平方,會(huì)放大預(yù)測(cè)誤差,所以對(duì)于離群數(shù)據(jù)更敏感。MAPE使用百分率來(lái)衡量偏離的大小,容易理解和解讀。而MAE/RMSE需要結(jié)合真實(shí)值的量綱才能判斷差異。
本研究的模型評(píng)價(jià)結(jié)果表明(表 4),蒙古鲌魚(yú)食性功能群、浮游動(dòng)物食性功能群和底棲動(dòng)物食性功能群的擬合總體較好(G>0.8),但3個(gè)模型比較看,魚(yú)食性功能群的擬合模型性能相對(duì)較差。不管用哪個(gè)指標(biāo),評(píng)估模型的好壞都不能夠脫離具體的應(yīng)用場(chǎng)景和具體的數(shù)據(jù)集。單純地評(píng)判哪個(gè)模型好壞,是基本上沒(méi)有意義的。
表4 模型預(yù)測(cè)值與觀測(cè)值差異評(píng)價(jià)Tab. 4 Evaluation of the difference between model predicts and observations
貝葉斯混合模型的主要統(tǒng)計(jì)數(shù)據(jù)是消費(fèi)者營(yíng)養(yǎng)來(lái)源的概率分布,而不是消費(fèi)者同位素值的預(yù)測(cè),因此評(píng)估混合模型對(duì)消費(fèi)者營(yíng)養(yǎng)來(lái)源貢獻(xiàn)估計(jì)的后驗(yàn)信息及其受先驗(yàn)信息的影響(圖 5)。后驗(yàn)信息與先驗(yàn)信息的本質(zhì)是營(yíng)養(yǎng)貢獻(xiàn)量的概率分布,因此可通過(guò)信息理論的相關(guān)概念和方法進(jìn)行評(píng)價(jià)(表 5)。
圖5 消費(fèi)者不同營(yíng)養(yǎng)功能群營(yíng)養(yǎng)來(lái)源貢獻(xiàn)的先驗(yàn)信息與后驗(yàn)信息Fig. 5 Priori information and posteriori information of trophic groups
表5 主要信息理論度量與統(tǒng)計(jì)Tab. 5 The important information theory measures and statistics
信息量用來(lái)度量一個(gè)信息的多少,而信息熵(Shannon Entropy)則用來(lái)描述一個(gè)來(lái)源信息的不確定度,也是信息來(lái)源的信息量期望[44]?;谛畔⒗碚摰姆椒?可以衡量不同營(yíng)養(yǎng)來(lái)源概率分布之間的先驗(yàn)信息與后驗(yàn)信息的異同。進(jìn)一步可評(píng)估營(yíng)養(yǎng)來(lái)源數(shù)據(jù)的改變、消費(fèi)者功能群的改變和營(yíng)養(yǎng)來(lái)源強(qiáng)度的改變等對(duì)消費(fèi)者營(yíng)養(yǎng)來(lái)源信息確定和解釋的影響。例如,相對(duì)熵可以衡量先驗(yàn)信息與后驗(yàn)信息之間的距離,當(dāng)先驗(yàn)信息與后驗(yàn)信息分布相同時(shí),它們的相對(duì)熵為零[43]。在混合模型中,先驗(yàn)信息通常較后驗(yàn)信息豐富,因此當(dāng)計(jì)算KL散度(Kullback-Leibler divergence),可獲得比最大熵更高的信息增益,即后驗(yàn)與先驗(yàn)信息相差很大時(shí),就會(huì)出現(xiàn)較高的值[43],而信息熵則代表了信息增益的有限上界。KL散度(信息增益)增高由后驗(yàn)信息與先驗(yàn)信息不同的均值和置信區(qū)間的差異變大決定(后驗(yàn)信息不支持先驗(yàn)信息或者后驗(yàn)信息強(qiáng)烈支持先驗(yàn)信息但置信區(qū)間較窄),因此需結(jié)合分布信息圖一同解釋(圖 5)。
本研究依據(jù)主要信息理論度量與統(tǒng)計(jì)方法,評(píng)估了鲌貝葉斯混合模型的先驗(yàn)信息和后驗(yàn)信息結(jié)果(表 6),先驗(yàn)信息和后驗(yàn)信息不同的信息熵值、不為0的相對(duì)熵值及較大的交叉熵值表明鲌貝葉斯混合模型的先驗(yàn)信息和后驗(yàn)信息存在一定程度差異。首先,估計(jì)每個(gè)信息源的邊際(Marginal)貢獻(xiàn)所占的比例,以反映文獻(xiàn)中混合模型是如何解釋的(例如大多數(shù)混合模型程序的輸出包括邊際均值和可信度區(qū)間)。營(yíng)養(yǎng)來(lái)源1%水平貢獻(xiàn)信息測(cè)量應(yīng)在0.01的離散區(qū)間內(nèi)計(jì)算。其次,通過(guò)所有來(lái)源貢獻(xiàn)的聯(lián)合后驗(yàn)分布計(jì)算的,說(shuō)明了關(guān)于來(lái)源相互間有條件依賴的信息增益,如食性組成權(quán)衡,及邊際貢獻(xiàn)的變化。我們通過(guò)比較食性組成貢獻(xiàn)的先驗(yàn)分布和后驗(yàn)分布的樣本來(lái)計(jì)算總體測(cè)量值,并使用The isometric logratio transformation等軸測(cè)對(duì)數(shù)比進(jìn)行轉(zhuǎn)換[48]。等軸測(cè)對(duì)數(shù)比率將比例轉(zhuǎn)換為變量,這些變量根據(jù)多元正態(tài)分布近似分布,使我們能夠使用2個(gè)多元正態(tài)分布散度的分析方程來(lái)計(jì)算信息增益。從概念上來(lái)說(shuō),我們可以把等軸測(cè)對(duì)數(shù)比變換看作是將食性組成比例延伸到一個(gè)可能有無(wú)限邊界的坐標(biāo)空間。等長(zhǎng)對(duì)數(shù)比變換意味著KL散度可以無(wú)限增加,食性組成比例的變化非常微小。因此,我們?cè)趌og2尺度上用KL散度來(lái)表示信息增益[11,37]。
表6 先驗(yàn)信息與后驗(yàn)信息的信息理論統(tǒng)計(jì)結(jié)果Tab. 6 The important information theory measures and statistics
此外,度量2個(gè)概率分布之間的距離,還有一些其他通用的散度指標(biāo)可供參考(表 7)。例如Hellinger distance[49]可量化先驗(yàn)分布和后驗(yàn)分布之間差異。如果先驗(yàn)分布和后驗(yàn)分布在其參數(shù)空間中具有相同的密度,則為零。如果一個(gè)分布在任何地方都是零密度,而另一個(gè)分布是正密度,那么Hellinger distance為1[45]。
表7 概率分布相似度評(píng)價(jià)的幾種距離法Tab. 7 Some distance methods to evaluate similarity of probabilistic distribution
本文綜述了在擬合和評(píng)估貝葉斯混合模型時(shí)遵循的最佳實(shí)踐(圖 6),及如何直接避免同位素構(gòu)建消費(fèi)者營(yíng)養(yǎng)溯源分析中的諸多技術(shù)問(wèn)題[9]。種群營(yíng)養(yǎng)功能群的識(shí)別,有助于減小消費(fèi)者同位素變異所帶來(lái)的不確定性[19,20]; 營(yíng)養(yǎng)來(lái)源矯正可以避免營(yíng)養(yǎng)來(lái)源和消費(fèi)者同位素之間的共線性,及不同營(yíng)養(yǎng)來(lái)源之間的差異水平等情況[27]; 數(shù)據(jù)質(zhì)量檢驗(yàn)可以幫助剔除異常數(shù)據(jù)、提高數(shù)據(jù)總體質(zhì)量、檢驗(yàn)數(shù)據(jù)質(zhì)量是否符合建模需要[28,29]。動(dòng)態(tài)的生態(tài)系統(tǒng)與消費(fèi)者相對(duì)快速的能量需求調(diào)整,可強(qiáng)烈地影響食物網(wǎng)結(jié)構(gòu)與功能[50]。因此,在開(kāi)展食物網(wǎng)研究前,需要投入大量的時(shí)間和精力進(jìn)行數(shù)據(jù)收集和分析,了解野外調(diào)查過(guò)程中哪些數(shù)據(jù)滿足了前期的假定條件,以確保建模分析的準(zhǔn)確性[32]。在嘗試數(shù)據(jù)建模之前,必須考慮環(huán)境中潛在食物來(lái)源的豐度、生物量、消費(fèi)者的攝食行為習(xí)性、胃腸含物等重要的先驗(yàn)信息[33]。完整重現(xiàn)模型選擇和模型評(píng)價(jià)的過(guò)程,是建模、訓(xùn)練、驗(yàn)證、評(píng)價(jià)的必要條件。模型選擇是根據(jù)一組不同復(fù)雜度的模型表現(xiàn),從中挑選最好的模型; 模型評(píng)價(jià)則是在選擇模型后,評(píng)價(jià)其預(yù)測(cè)誤差[11,37]。根據(jù)具體研究,在實(shí)踐過(guò)程中,評(píng)價(jià)指標(biāo)多種多樣,且分別刻畫(huà)了相對(duì)“真實(shí)模型”的信息損失。由于真實(shí)模型的未知性,這些評(píng)價(jià)僅反應(yīng)現(xiàn)有模型構(gòu)建過(guò)程中相對(duì)較好的性能,所以具體問(wèn)題仍需具體分析。
圖6 模型構(gòu)建與性能評(píng)估流程圖Fig. 6 Fishbone diagram of quantifying the quality of model construction and prediction
通過(guò)側(cè)重于模型預(yù)測(cè)攝食者同位素值能力的評(píng)估方法,可以判斷模型的擬合質(zhì)量。此外,鑒于貝葉斯模型的特點(diǎn),即如果先驗(yàn)信息誤差較低,則信息混合模型的后驗(yàn)分布趨同于先驗(yàn)信息,進(jìn)一步進(jìn)行了基于信息理論和概率距離統(tǒng)計(jì)方法的評(píng)估,為同位素混合模型的輸出結(jié)果的質(zhì)量提供互補(bǔ)的評(píng)估方法[37]。這些方法的綜合運(yùn)用,將進(jìn)一步提高消費(fèi)者營(yíng)養(yǎng)溯源準(zhǔn)確性,為更深刻地認(rèn)識(shí)食物網(wǎng)規(guī)律提供科學(xué)支撐[11,37]。