李建宇,陳燕婷,傅建煒,史夢竹,齊 心,尤民生
(1.福建省農(nóng)業(yè)科學院植物保護研究所,福建省作物有害生物監(jiān)測與治理重點實驗室,福州 350013;2.福建省農(nóng)業(yè)科學院農(nóng)業(yè)質(zhì)量標準與檢測技術研究所,福州 350003;3.福建農(nóng)林大學應用生態(tài)研究所,閩臺作物有害生物生態(tài)防控國家重點實驗室,福州 350002;4.山東農(nóng)業(yè)大學植物保護學院,山東泰安 271018)
生命表是一個由種群所有個體的生存、發(fā)育和繁殖等數(shù)據(jù)組成的綜合數(shù)據(jù)集,是害蟲治理與生態(tài)學研究中最重要的工具之一(齊心等,2019;Chietal.,2020;Taghizadeh and Chi,2022)。早期普遍使用的傳統(tǒng)雌性特定年齡生命表(Euler,1760;Lotka,1907;Birch,1948;Carey,1993)由于未能描述齡期分化(即變態(tài)),且忽略了雄性個體對種群增長與其對捕食、寄生和取食等效能的貢獻,因而無法準確預測種群的增長,同時也限制了生命表在生態(tài)學理論中的發(fā)展及其在害蟲防治中的實際應用(Huang and Chi,2012)。相對而言,年齡-齡期兩性生命表(簡稱“兩性生命表”)(Chi and Liu,1985;Chi,1988)在理論、數(shù)據(jù)分析以及實際應用中不僅能較準確地描述昆蟲種群的齡期分化與兩性差異,同時也能更好地應用于種群預測和生物防治等研究。因為兩性生命表的上述優(yōu)點,研究者能正確分析昆蟲不同齡期間與雌雄兩性間的各種差異,例如捕食率(或寄生率與取食量)差異、對藥劑敏感性的差異等對種群生命表的影響,這使得生命表理論得以進一步發(fā)展,并能用于種群相互關系的研究。蒲蟄龍(1989)主編的《農(nóng)作物害蟲管理數(shù)學模型與應用》已將Chi和Liu(1985)的兩性生命表論文翻譯并納入書中。普林斯頓大學出版社(Princeton University Press)出版的專著《Population Harvesting》(Getz and Haight,1989)也詳細介紹了Chi 和 Liu(1985)的兩性生命表理論。在國內(nèi),吳坤君等(1994)首次將兩性生命表用于粘蟲Mythimnaseparata的生命表研究,并指出其優(yōu)點。近年來國內(nèi)外學者普遍采用兩性生命表進行相關研究(胡昌雄等,2021;Naeemetal.,2021;謝艷蘭等,2021;Amir-Maafietal.,2022;Iqbaletal.,2022)。自1990年后,為方便使用者運用兩性生命表理論而創(chuàng)制并不斷更新的數(shù)據(jù)處理軟件TWOSEX-MSChart(Chi,2022),因為操作簡便,多數(shù)研究人員均能快速掌握其使用方法,并且從軟件輸出的結果中獲取相關研究需要的數(shù)據(jù),用于理論的研究和實踐推廣應用。然而,由于有許多研究人員對于兩性生命表軟件中所使用的生態(tài)學理論與數(shù)理統(tǒng)計理論的理解有限,造成在論文撰寫和應用分析時出現(xiàn)不準確甚至錯誤的現(xiàn)象。本文詳細闡述兩性生命表所使用的自我重復取樣(bootstrap)技術與多項式定理(multinomial theorem)的原理和運用,旨在幫助國內(nèi)昆蟲學和生態(tài)學的研究人員深入理解兩性生命表中的基本原理,更好地將其運用于相關科研工作中,進而提升科學研究水平。為了方便解釋bootstrap技術和多項式定理在兩性生命表應用中的原理,更直觀地展示相關公式模擬的結果,本文選用本課題組未發(fā)表試驗數(shù)據(jù)進行相關模擬分析并作圖。
在科學研究中,為了對數(shù)據(jù)進行數(shù)理統(tǒng)計分析,研究人員會在相同條件下進行多次重復試驗,再計算各重復數(shù)據(jù)的均值與標準誤用于分析。常用統(tǒng)計方法均以正態(tài)分布為前提,但是大多數(shù)試驗數(shù)據(jù)為非正態(tài)分布,如用50頭昆蟲研究繁殖力或壽命時,其頻率分布(frequency distribution)一般是非正態(tài)分布(圖1)。
圖1 LC30濃度蟲螨腈處理后木瓜秀粉蚧的繁殖力(單雌產(chǎn)卵量)(A)和壽命(B)的頻率分布Fig.1 Frequency distribution of the fecundity (number of eggs laid per female)(A) and longevity (B) of Paracoccus marginatus after treatment with LC30 of chlorfenapyr
常用統(tǒng)計中用公式(1)~(3)計算50頭試蟲的平均壽命與標準誤,若其中有30頭雌蟲,則可用30頭雌蟲的繁殖率計算平均繁殖率與標準誤。
(1)
式中Xi為第i頭試蟲的壽命或繁殖率。
(2)
(3)
Bootstrap是一個很通用的工具,用來估計偏差、標準誤和置信區(qū)間。它是由Efron(1979)提出的一種統(tǒng)計方法,根據(jù)原始試驗樣本重復抽取樣本信息,不需要數(shù)據(jù)分布假設,即可對數(shù)據(jù)總體的分布特性進行統(tǒng)計和推斷。Efron和Tibshirani(1993)較為系統(tǒng)地介紹了bootstrap技術的理論成果。“Bootstrap”一詞來自短語“to pull oneself up by ones bootstraps”,這個短語源自西方童話故事“The Adventures of Baron Munchausen《吹牛大王歷險記》”(Raspe,2017)。故事中的吹牛大王說他有一次掉到了很深的湖底,最后他通過拎著自己的鞋帶將自己從湖底救出(Johnson,2001)。這個故事比喻不靠外界力量,只靠提升自己的性能,就能達到目標。同樣地,統(tǒng)計學中的bootstrap技術完成了似乎不可能的事情,即利用自我重復取樣來估計未知概率統(tǒng)計量的統(tǒng)計特性。
昆蟲學、生物學與生態(tài)學等研究中有許多數(shù)據(jù)屬于非正態(tài)分布,常常無法確定其正態(tài)性,因此難以獲得正確的標準誤。此時,研究人員只能采用增加大量樣本,或者采用數(shù)學方法對數(shù)據(jù)進行正態(tài)化轉換,但是這些方法往往有其缺點,或者得到的結果依然不是很理想。Bootstrap技術的出現(xiàn),則較好地解決這個問題。目前bootstrap技術的方法和理論已在金融、經(jīng)濟、生物和醫(yī)學等領域廣泛應用(MacKinnon,2002;趙亮等,2010;Amir-Maafietal.,2022)。
若以50粒卵開始做生命表研究,可以用50個個體的存活率與繁殖率計算內(nèi)稟增長率、周限增長率、凈增殖率和平均世代時間等。
兩性生命表中凈增殖率(R0)公式為
(4)
其中,k為齡期數(shù),sxj為新生個體存活到年齡x與齡期j的概率,fxj為個體在年齡x與齡期j時的平均繁殖率。若只考慮年齡時,lx為新生個體存活到年齡x的概率,mx為個體在年齡x時的平均繁殖率。內(nèi)稟增長率(r)計算公式為
(5)
用矩陣研究種群增長時,Lewis(1942)的種群周限增長率(λ)計算公式為
λn+1-f0λn-s0f1λn-1-s0s1f2λn-2-…-s0s1…sn-2fn-1λ-s0s1…sn-1fn=0
(6)
其中,fx≥0,sx>0,sx為年齡x的個體存活到x+1的概率,fx為個體在年齡x時的平均繁殖率(Lewis原公式的起始年齡為1,公式6的起始年齡為0)。因為周限增長率的公式較長,一般論文中只列出內(nèi)稟增長率的公式,再用r與λ的關系式表示λ=er。在計算機普及之前,使用這兩個公式計算一個生命表的內(nèi)稟增長率與周限增長率已十分困難,因為必須使用e與大數(shù)值的指數(shù),因此有許多學者發(fā)展各種簡化方法,例如Howe(1953)以及Wyatt和White(1977)等。由于這些簡化方法已被證明會導致錯誤結果(Mirmohammadietal.,2009;Saskaetal.,2021),本文不再對這些簡化方法的錯誤進行贅述。
由于50個個體的數(shù)據(jù)用一般統(tǒng)計方法計算只能得到一個內(nèi)稟增長率、周限增長率、凈增殖率和平均世代時間,無法計算標準誤。如果用一般方法里的重復概念,需要做多個重復,即必須做多個生命表。因為生命表研究需要大量的人力、時間和空間,若用一般方法里的重復概念,將耗費大量時間、人力和經(jīng)費,因此很少有人用“重復”的概念計算生命表各個參數(shù)的標準誤。為了解決此問題,Meyer等(1986)介紹將jackknife與bootstrap技術用于計算種群增長率的標準誤。這兩種方法的使用均須依賴計算機。早期由于個人計算機的性能較差,使用bootstrap技術計算種群增長率的標準誤需要數(shù)日的時間,因此應用較多的是jackknife方法(Chi and Getz,1988)。隨著計算機性能的提升,以及Huang和Chi(2013)證明jackknife方法并不適合用于生命表研究,bootstrap技術成為目前普遍采用的方法。
在使用bootstrap技術計算兩性生命表種群參數(shù)時,從種群中隨機抽n個個體進行歸還取樣,其中n通常就是生命表種群的起始個體數(shù)。因為是歸還取樣,每一個個體的數(shù)據(jù)可能被反復選取,也有些個體可能沒有被選到,其概念如圖2所示。
圖2 Bootstrap技術原理Fig.2 Principles of the bootstrap technique R0:凈增殖率Net reproductive rate;B:重復取樣數(shù)Number of re-samplings.
(7)
(8)
(9)
為了提高精確度與減少兩次bootstrap間的差異,必須選用較大的重復取樣數(shù)B值,理論上B值越大,模擬估算的方差和標準誤越準確,而且每次bootstrap產(chǎn)生的方差較為穩(wěn)定。但是,B值的設定受計算機中央處理器(central processing unit,CPU)速度與內(nèi)存(random-access memory,RAM)容量的限制,設定的B值太大,計算機需要的運行時間則較長,甚至過大的B值會導致計算機無法運行。由于早年的計算機速度與內(nèi)存容量有限,Meyer等(1986)推薦的B值為500~1 000。圖3展示了使用1 000個和100 000個bootstrap重復獲得的數(shù)據(jù)頻率分布的差異。其中,圖3(A)和(B)為兩次1 000個bootstrap運行結果,圖3(C)和(D)為兩次100 000個bootstrap運行結果。顯然,1 000個bootstrap重復取樣的頻率分布已近似正態(tài),但在兩次運行之間的頻率分布仍有明顯差異。在1980年代,bootstrap技術的應用受到了計算機CPU和RAM的限制,用bootstrap模擬完成需花費大約20 000 h(Hesterberg,2008)。但是,使用100 000次bootstrap技術已能產(chǎn)生一個可接受的正態(tài)分布(圖3:C,D),且兩次之間的差異較小,估計值的方差與標準誤較為穩(wěn)定。由于bootstrap是一個重復歸還取樣(sampling with replacement)的過程,當n>10,B=100 000時,每個bootstrap樣本都會產(chǎn)生不同的個體組合,種群參數(shù)的平均值、方差和標準誤都可能不同。因此,一般使用bootstrap時,沒有所謂的最優(yōu)或最適當B值。所需的bootstrap數(shù)量取決于生命表數(shù)據(jù)(個體數(shù)、齡期數(shù)、壽命和個體間的差異等),當個體之間的差異越大,bootstrap的數(shù)量就應該越高。通過反復的試驗,目前TWOSEX軟件預設的B值是100 000,這樣的設定對絕大多數(shù)的昆蟲生命表研究都能提供很好的結果。使用bootstrap技術,通過100 000次取樣后,所得到的種群參數(shù)一般呈正態(tài)分布,且方差較小(Efron and Tibshirani,1993;Yuetal.,2013)。隨著計算機運算速度的提升,100 000次bootstrap取樣在幾分鐘內(nèi)即可完成。自2013年以后,TWOSEX-MSChart軟件不再提供jackknife方法,僅提供bootstrap技術供研究人員使用。
圖3 Bootstrap 1 000次重復取樣(A,B)和100 000次重復取樣(C,D)獲得的蓮草直胸跳甲種群凈增殖率(R0)估計值的頻率分布Fig.3 Frequency distribution of bootstrap estimates of the net reproductive rate (R0) of Agasicles hygrophila by using 1 000 bootstrap re-samplings (A and B) and 100 000 bootstrap re-samplings (C and D)B:重復取樣數(shù)Number of re-samplings;n:個體數(shù)Number of individuals;m:平均值Mean;δ2:方差Variance;SE:標準誤Standard error.圖4同。The same for Fig.4.
Bootstrap技術不但可以用于估算種群參數(shù)的方差與標準誤,也可以用于一般統(tǒng)計值(TWOSEX軟件中的G.Gen.boot)。圖4為應用bootstrap技術估算繁殖力和壽命的標準誤。從圖4可看出bootstrap技術估算的數(shù)據(jù)呈正態(tài)分布。因此,無論將bootstrap技術用于估算種群參數(shù)或一般統(tǒng)計值,其結果一般都符合中心極限定理(central limit theorem),也能準確展示種群的變異性(齊心等,2019)。
圖4 LC30濃度蟲螨腈處理后木瓜秀粉蚧的平均繁殖力(A)和平均壽命(B)的頻率分布Fig.4 Frequency distribution of the mean fecundity (A) and mean longevity (B) of Paracoccus marginatus after treatment with LC30 of chlorfenapyr
在TWOSEX-MSChart軟件中paired bootstrap test檢驗的結果有下列3種方式呈現(xiàn):(1)t置信區(qū)間(假設結果是正態(tài)分布);(2)Bootstrap percentile (百分位置信區(qū)間)(基于實際取樣結果);(3)P值基于bootstrap樣本中差異顯著的bootstrap樣本數(shù)。因為t置信區(qū)間是基于正態(tài)分布的假設,而bootstrap百分位置信區(qū)間是基于隨機取樣的,所以它們可能是不同的。雖然大多數(shù)生物學和生態(tài)學數(shù)據(jù)為非正態(tài)分布,但是當B足夠大時,bootstrap樣本平均值的分布一般是正態(tài)的。因此,需要大量的重復取樣(B=100 000)才能保證估算值的穩(wěn)定。如果bootstrap結果是正態(tài)分布的,則t置信區(qū)間與bootstrap置信區(qū)間將非常相近。一般而言,3種方法的顯著性檢驗結果是一致的。只有在極端情況下才會出現(xiàn)不一致的結果。當3種結果不一致時,研究人員必須依據(jù)數(shù)據(jù)妥善判斷與解釋(Weietal.,2020)。
3.4.1孵化率:由于每次bootstrapping都會產(chǎn)生不同的結果,TWOSEX軟件將100 000個bootstrap樣本保存于一個純文字文件中。若要明確卵的孵化率是否會因雌蟲的年齡而發(fā)生變化,使用者可以將每頭雌蟲每日的“總產(chǎn)卵量”與“孵化卵量”分別制作成兩個生命表,然后選擇用相同的bootstrap樣本分析總產(chǎn)卵量和孵化卵量之間的關系,并估計整體孵化率(hatching rate)的標準誤。如果不使用相同的bootstrap樣本,總產(chǎn)卵量生命表的第x個bootstrap樣本的平均繁殖率可能低于孵化卵量生命表的第x個平均繁殖率,導致卵孵化率大于1,這是錯誤的。此外,如果文件A包含每個個體每天的總產(chǎn)卵量,文件B包含每天的孵化卵量,如果文件B只有少數(shù)個孵化卵,那么研究者可能會面臨一個問題,即文件B的樣本得到的R0=0。這時,必須先用文件B運行bootstrap,然后使用相同的bootstrap樣本運行文件A。為了獲得準確的結果,這些細節(jié)都是在使用bootstrap技術時需要考慮的。
圖5 采用相同bootstrap樣本計算轉換率(Qp)的標準誤原理Fig.5 Principles of calculating the standard error of transformation rate (Qp) by using the same bootstrap samples首先用害蟲的生命表數(shù)據(jù)計算凈增殖率(R0),然后用相同的bootstrap樣本計算天敵的凈捕食率(C0),因為樣本相同,就可以計算天敵每產(chǎn)一個卵需要捕食害蟲的數(shù)量,從而計算轉換率(Qp)及其標準誤。Firstly,the net reproductive rate (R0) was calculated using the life table data of insect pest.The same bootstrap samples were used to calculate the net predation rate (C0) of natural enemy.Then the number of prey (insect pests) required for natural enemy to produce one egg could be calculated.Finally,the transformation rate (Qp) and its standard error could be calculated.
3.4.2生命表與捕食率:生命表是種群生態(tài)學最重要的基礎。生命表除了可以進行精確的害蟲種群預測以外,也可以將生命表應用于天敵大規(guī)模飼養(yǎng)、生物防治和害蟲管理等。這時,就必須把生命表和捕食率結合起來以便正確用于生物防治。當利用TWOSEX和CONSUME軟件結合進行天敵種群增長預測與捕食潛能分析時,必須采用相同的bootstrap樣本正確估算轉換率(Qp)的標準誤。圖5顯示了采用相同bootstrap樣本計算轉換率(Qp)標準誤的原理,由于bootstrap技術采用的是重復隨機取樣,因此需要保存生命表分析中用于計算凈增殖率(R0)的100 000個bootstrap樣本,然后將其用于計算凈捕食率(C0)的分析。CONSUME軟件可以將生命表分析與捕食率正確地連接起來,以估算轉換率(Qp=C0/R0)和周限捕食率(ω)及其標準誤。其中,Qp描述了繁殖和捕食率之間的關系(Chi and Yang,2003),即捕食者每產(chǎn)生一個子代需要捕食的獵物數(shù)。但是,高Qp值并不一定代表高捕食效能。自2013年以來,TWOSEX-MSChart(Chi,2022)便提供了估算Qp標準誤的功能。
3.4.3利用bootstrap技術估算有翅蚜與無翅蚜對種群參數(shù)的貢獻:若蚜蟲種群中同時存在有翅型與無翅型子代,可以參考?zg?k?e等(2018a,2018b)和Luo等(2022)計算兩種類型對內(nèi)稟增長率與凈增殖率的貢獻。
(10)
=R0,AP+R0,AL
(11)
(12)
上式中R0,AP/R0與R0,AL/R0分別為無翅子代與有翅子代對凈增殖率的貢獻。
在大多數(shù)蚜蟲種類中,有翅蚜的比例會發(fā)生變化。例如,在春季,為了進行季節(jié)性的擴散,有翅蚜比例通常較高。同時,由于各種環(huán)境因素也會影響有翅蚜的比例(Mehrparvaretal.,2013)。因此,在計算生命表參數(shù)時,由于有翅蚜個體數(shù)量變化較大或者在種群中的比例較低,往往沒有將有翅蚜包括在內(nèi)(?zg?k?e and Atlhan,2004;Kaydanetal.,2006;Mirmohammadietal.,2009;Mehrparvaretal.,2013;Akk?prüetal.,2015)。然而,從生命表分析中排除有翅蚜意味著數(shù)據(jù)分析的不完整性和實驗結果的不準確。?zg?k?e等(2018a)和Luo等(2022)通過使用兩性生命表方法來計算有翅蚜和無翅蚜個體對種群的貢獻,利用bootstrap技術估算了發(fā)育時間、繁殖力、壽命和種群參數(shù)的方差和標準誤,并進行了自我重復取樣,以獲得穩(wěn)定的估算值。有翅蚜不僅使蚜蟲能夠快速擴散,同時加速了蚜蟲在寄主之間傳播植物病毒。因此,通過兩性生命表的結果,準確預測有翅蚜的發(fā)生高峰期,有利于蚜蟲的綜合治理。
Bootstrap技術的優(yōu)點除了上述的以外,bootstrap用于生命表研究時,是以個體為取樣單位,每個bootstrap樣本包含n個個體的全部特性(包括發(fā)育歷期、壽命、雌性繁殖率和取食量等)。由于每個個體的上述各個特性之間不是相互獨立的,而是互相關聯(lián)的,使用bootstrap技術才能正確地分析數(shù)據(jù)。以性比為例,性比是生命表研究中一項常用的統(tǒng)計參數(shù),在昆蟲種群發(fā)展中起關鍵作用。使用兩性生命表時,bootstrap能包含性比的變化對種群的影響。因為傳統(tǒng)雌性生命表完全忽略雄性,使用傳統(tǒng)雌性生命表時,即使采用bootstrap技術,也無法涵蓋性比對種群參數(shù)的影響。盡管傳統(tǒng)雌性生命表也考慮性比,但是一般性比并不能反映成蟲前期存活率的差異及其對種群繁殖力的影響,因此具有相同性別比例的兩個種群完全可能具有不同的適合度,所以使用傳統(tǒng)雌性生命表將會造成諸多問題,具體可參考Huang和Chi(2011)。兩性生命表包含了所有個體,在原始數(shù)據(jù)分析中采用bootstrap自我重復取樣,所有bootstrap樣本可能包含不同數(shù)量的雌性、雄性和在成蟲前階段死亡的個體。因此,通過使用bootstrap技術,兩性生命表可以正確分析包括性比的標準誤及其對種群參數(shù)的影響(Chenetal.,2018;Huangetal.,2018;Chietal.,2020)。Bootstrap技術雖有許多優(yōu)點,但其仍有些缺點。例如:bootstrap技術完全依賴計算機仿真,由于其本質(zhì)為隨機取樣,每次結果均不同,必須用較大的重復取樣數(shù)以獲得較精確地估計值,但重復取樣數(shù)又受限于計算機CPU與內(nèi)存容量的限制;此外,當bootstrap樣本中僅含雄性個體時,bootstrap樣本無法計算內(nèi)稟增長率,這也是bootstrap的缺點之一。對bootstrap技術擬深入學習者,可參考Canty等(2006)的論文。
任何技術的背后都需要科學理論的支撐,有些技術背后的科學理論迄今尚未被發(fā)現(xiàn),還有些技術的科學理論已經(jīng)被證明,但是因為太難,理解的人不多。例如,原始人發(fā)明了“輪子”,但是人類有文字與數(shù)學后,才嘗試了解圓周率,又經(jīng)過了很久數(shù)學家才證明π為無理數(shù)。Bootstrap技術的理論基礎即數(shù)學中的多項式定理(multinomial theorem)(華羅庚,1957)與概率論(probability)。
為了計算bootstrapR0的理論概率或精確概率,Zhao等(2021)與Ding等(2021)首次將多項式定理應用于生命表研究。多項式定理公式為:
(a1+a2+…+an)n=
(13)
(14)
(15)
因此,利用多項式定理,可以計算出任何特定的bootstrap生命表樣本的精確機率。
雖然利用多項式定理可以計算出所有可能的bootstrap生命表,對于使用100頭試蟲的生命表研究,有100100種取樣順序(即1.0×10200),不同個體組成的生命表總數(shù)為4.5274×1058個,而對于使用50頭試蟲的生命表研究,有5050種取樣順序(即8.881784×1084),不同個體組成的生命表總數(shù)為5.0446×1028個,對目前的個人計算機來說,仍然不可能完成所有不同組成的生命表及其機率的計算。由于bootstrap技術中的B值一般遠小于Ln(亦即B?Ln),因此,任何一個bootstrap樣本只是用計算機模擬得到的多項式定理的一小部分。在這個計算過程中,當B值較大(≥100 000)時,bootstrap樣本的概率接近理論值(Dingetal.,2021;Taghizadehetal.,2022)。如果要利用多項式定理得到準確的結果,就必須在超級計算機上進行分析。
目前在兩性生命表研究中受制于個人計算機的運算能力,一般只能用100 000個bootstrap樣本,但仍能獲得穩(wěn)定可信賴的參數(shù)。圖6為未進行排序的100 000個bootstrap樣本的散點圖,顯示了采用bootstrap技術取樣的隨機性,當對100 000個bootstrap樣本進行排序,可以得到一條平滑的曲線(圖7)。由圖7中可以找到0.025與0.975的置信區(qū)間(confidence interval)。若計算每個R0出現(xiàn)的次數(shù),就可以做出頻率分布圖(圖8:A),100 000個bootstrap樣本的R0頻率分布接近正態(tài)分布。若把圖8(A)分組合并做成50個柱狀圖,就會呈現(xiàn)類似圖3或圖4的形狀。雖然圖3與圖4是一般統(tǒng)計教科書與一般研究人員期望的正態(tài)分布,而圖8(A)是數(shù)據(jù)的真實原貌。圖8(A)中,在第2.5百分位數(shù)(R0=44.94)、第50百分位數(shù)(R0=72.20)與第97.5百分位數(shù)(R0=104.16)的bootstrap生命表數(shù)量分別有13個(圖8:B)、51個(圖8:C)和6個(圖8:D);在100 000個bootstrap樣本中,這些值的概率分別為0.00013,0.00051和0.00006。利用多項式定理計算這些bootstrap生命表的理論概率分別為1.8415×10-5,210.9188×10-5和0.7356×10-5,它們理論的次數(shù)分別約為1.8415,210.9188和0.7356,它們的差異是由于模擬 100 000 次還是非常小的比例,距離真實的多項式定理的理論值還有相當大的差距。種群的R0值為72.84,用t(1.96)計算得到的0.025和0.975置信區(qū)間分別為43.1574和102.5226。用t分布所計算的置信區(qū)間和實際取樣獲得的置信區(qū)間相當一致。因此,通過多項式定理顯示bootstrap技術采用100 000次重復取樣能得到較穩(wěn)定和可靠的總體參數(shù)估計。由于昆蟲、螨類等群體的高度變異性,精確估計種群增長潛力的不確定性對于害蟲防治非常重要,而1 000次或者較少的bootstrap重復取樣可能會錯估置信區(qū)間(Ak?aetal.,2015),在種群生態(tài)學和害蟲管理研究的實際應用中,這將導致害蟲防治的失敗。
圖6 Bootstrap 100 000次重復取樣獲得的未排序的凈增殖率(R0)Fig.6 Original bootstrap results of the net reproductive rate (R0) obtained by using the bootstrap technique with 100 000 re-samplings
圖7 Bootstrap 100 000次重復取樣獲得的凈增殖率(R0)排序后的結果Fig.7 Sorted result of the net reproductive rate (R0) obtained by using the bootstrap technique with 100 000 re-samplings
圖8 Bootstrap 100 000次重復取樣獲得的凈增殖率(R0)進行分組后的分布頻率Fig.8 Frequency distribution of the net reproductive rate (R0) obtained by using the bootstrap technique with 100 000 re-samplings第2.5,50和97.5百分位的bootstrap R0對應的生命表數(shù)量分別有13,51和6個;B,C和D為這3個區(qū)域放大后的結果,粉色正方形框為多項式定理計算得到的生命表數(shù)量。The numbers of life tables corresponding to the bootstrap R0 at the 2.5th,50th and 97.5th percentiles were 13,51 and 6,respectively.B,C,and D are enlarged plots of these 3 regions.The pink squares in B,C,and D indicate the number of life tables calculated by using the multinomial theorem.
對需要兩性交配的昆蟲而言,若一個樣本中只包含雄性和在成蟲前已死亡的個體(N-type),就不能計算內(nèi)稟增長率與周限增長率,則為無效bootstrap樣本(ineffective bootstrap sample)。相同地,若一個樣本中只包含雌性和在成蟲前已死亡的個體,或一個樣本只包含在成蟲前已死亡的個體,都屬于無效樣本。當無效樣本比例較高時,若在生命表分析過程中僅接受有效的bootstrap樣本就會產(chǎn)生不現(xiàn)實的平均值、方差和標準誤。當一個種群中因為成蟲前期死亡率較高,只有少數(shù)具有繁殖能力的雌性與雄性個體,無效樣本的影響就不能忽略。無效樣本也反映出種群的存活概率,這是值得深入研究的問題。無效樣本的計算已包含在TWOSEX-MSChart中,并已實際用于研究(Fengetal.,2020),但因其理論較為復雜,將另文發(fā)表。
計算機模擬是理論推斷和實驗研究之外的重要補充工具(Pool,1992)。Chi(2000)討論了計算機模擬的3個本質(zhì):理論、數(shù)據(jù)和程序。本文詳細闡述了bootstrap技術的原理及其在兩性生命表研究中的應用。在實際應用中,必須結合兩性生命表理論,通過收集更多的生命表數(shù)據(jù),妥善應用bootstrap技術以及TWOSEX-MSChart,TIMING-MSChart和CONSUME-MSChart等兩性生命表分析軟件。
生態(tài)學是一門年輕的學科,有許多懸而未決的科學問題亟待科學家解決。兩性生命表理論與軟件經(jīng)過三十余年的研究,已逐漸成熟。然而,在實際應用上,仍有許多問題有待解決。生命表研究與多數(shù)科學試驗一樣,必須在可控制的條件下(溫度、濕度、光周期、寄主植物)取得能反映生物種群在這些條件下的可靠、可重復的數(shù)據(jù)。由于昆蟲種群在田間受環(huán)境和寄主的影響較大,使用這些在實驗室控制條件下收集的生命表數(shù)據(jù)模擬野外變動條件下的種群動態(tài)時,需要考慮實驗室生命表與田間生命表的差異??梢酝ㄟ^調(diào)節(jié)繁殖率或存活率以獲得與田間種群動態(tài)最相符的模擬結果。然而,由于野外取樣只能間隔數(shù)日調(diào)查一次,而且只能記錄一個生命階段和選取有限的樣本數(shù)量,因此田間取樣數(shù)據(jù)也不能100%反映真實的野外種群動態(tài)。雖然有許多困難,應用生命表理論來描述和預測田間種群動態(tài)是非常重要的(Chietal.,2020)?;谀挲g-齡期兩性生命表和多項式定理的bootstrap技術理論值得進一步關注(Dingetal.,2021;Zhaoetal.,2021)。掌握多項式定理的理論與應用知識不僅可以加深對bootstrap技術的理解,也有助于bootstrap技術在昆蟲學和生態(tài)學研究中的應用。