昌秋霞,鐘云芳,張 哲,趙 瑩,宋希強(qiáng)
(海南省熱帶特色花木資源生物學(xué)重點(diǎn)實(shí)驗(yàn)室,海南大學(xué)林學(xué)院,海南 海口 570228)
自19世紀(jì)工業(yè)革命以來(lái),由于經(jīng)濟(jì)的快速發(fā)展以及人類無(wú)限制地開(kāi)發(fā)自然資源等活動(dòng),大氣中的CO2、CH4和N2O等溫室氣體含量正在迅速增長(zhǎng),全球氣候呈現(xiàn)變暖趨勢(shì)。全球氣候變暖是21世紀(jì)生物多樣性保護(hù)的重大挑戰(zhàn)之一[1]。前人研究發(fā)現(xiàn),氣候變暖可能會(huì)帶來(lái)物種的分布格局[2-3]與物候期[4]發(fā)生改變、物種豐富度減少[5]、增加外來(lái)植物入侵風(fēng)險(xiǎn)[6]、引起物種滅絕或加速滅絕[7]等一系列不利影響。研究氣候變化背景下物種的潛在地理分布,對(duì)揭示物種分布格局的形成、遷移特征以及制定生物多樣性保護(hù)策略具有非常重要的意義。
物種的分布區(qū)是物種的空間特征,是物種與環(huán)境長(zhǎng)期相互作用的結(jié)果,而物種的分布規(guī)律是由生態(tài)因素、歷史演化因素(包括地質(zhì)演化歷史,群體演化歷史)等共同影響下形成的[8]。物種分布模型(Species Distribution Models, SDMs)是利用物種的地理分布存在/不存在數(shù)據(jù)、氣候數(shù)據(jù)、地形數(shù)據(jù)等,根據(jù)分類、回歸、機(jī)器學(xué)習(xí)等多種算法[9-12]對(duì)物種的生態(tài)位進(jìn)行度量,再將模型投影到現(xiàn)在或未來(lái)的環(huán)境情景中,以分布概率的形式反映特定氣候生境對(duì)物種的適宜程度,其結(jié)果可以解讀為物種出現(xiàn)的概率或生境對(duì)于物種適宜度等[13]。物種分布模型最早起源于物種—環(huán)境相互關(guān)系的研究[14],隨著物種分布模型的不斷發(fā)展,SDMs在生物多樣性保護(hù)[15-17]、入侵生物風(fēng)險(xiǎn)評(píng)估[18]、探究環(huán)境變化對(duì)生物的影響[19-20]、珍稀瀕危物種動(dòng)態(tài)預(yù)測(cè)[21]、物種起源、散布及演替分化規(guī)律研究[22]等諸多方面具有重要的應(yīng)用價(jià)值。
科學(xué)知識(shí)圖譜(Mapping Knowledge Domains)是利用可視化知識(shí)圖譜顯示學(xué)科的發(fā)展歷程與結(jié)構(gòu)關(guān)系的一種圖形,同時(shí)兼?zhèn)洹皥D”與“譜”的雙重性質(zhì)特征:既是可視化的知識(shí)圖形,又是序列化的知識(shí)譜系,可對(duì)知識(shí)單元或知識(shí)群體之間形成的網(wǎng)絡(luò)結(jié)構(gòu)及其互動(dòng)、交叉、衍化等諸多復(fù)雜關(guān)系進(jìn)行表達(dá)和描述[23]。CiteSpace 是由陳超美教授基于Java 語(yǔ)言開(kāi)發(fā)的一個(gè)可視化分析軟件,其原理是利用共引分析理論及尋徑網(wǎng)絡(luò)算法,對(duì)某一領(lǐng)域的文獻(xiàn)進(jìn)行計(jì)量,形成一系列可視化的科學(xué)知識(shí)圖譜,由此挖掘出學(xué)科發(fā)展的演化路徑及研究熱點(diǎn)與趨勢(shì)[24]。CiteSpace軟件自2004年被推出以來(lái),已成為學(xué)術(shù)界科研工作者使用最廣泛的分析軟件之一[25]。
目前,前人對(duì)物種分布預(yù)測(cè)領(lǐng)域研究更側(cè)重于應(yīng)用方向,而基于信息可視化與計(jì)量化分析的相關(guān)綜述性研究較少,因此,本文運(yùn)用 CiteSpace軟件對(duì)“物種分布預(yù)測(cè)”領(lǐng)域的相關(guān)文獻(xiàn)進(jìn)行歸納分析,通過(guò)構(gòu)建知識(shí)圖譜梳理該領(lǐng)域的發(fā)展歷程,總結(jié)其未來(lái)發(fā)展趨勢(shì)及研究熱點(diǎn),以期為后續(xù)研究與發(fā)展提供參考依據(jù)。
本研究基于CiteSpace5.8.R1(64-bit)、Excel等軟件對(duì)相關(guān)文獻(xiàn)的發(fā)表時(shí)間、國(guó)家、科研機(jī)構(gòu)、作者、關(guān)鍵詞進(jìn)行可視化分析,在繪制可視化圖譜中,其固定參數(shù)“Slice Length=1,Pruning=Pathfinder”;詞頻節(jié)點(diǎn)的大小和深淺代表其學(xué)術(shù)影響力;連線的粗細(xì)代表詞頻之間的聯(lián)系強(qiáng)度;Density(網(wǎng)絡(luò)密度)代表提示詞頻間的相互關(guān)系;Modularity代表網(wǎng)絡(luò)聚類情況,數(shù)值越大,聚類效果越明顯,當(dāng)Q>0.3時(shí),即網(wǎng)絡(luò)結(jié)構(gòu)顯著;Silhouette代表網(wǎng)絡(luò)同質(zhì)性情況,數(shù)值越大,聚類結(jié)果越可行,當(dāng)S>0.7時(shí),即聚類結(jié)果具有高信度,同時(shí)剔除S值為1的不合理聚類。節(jié)點(diǎn)數(shù)量與大小代表核心作者群體共現(xiàn)頻次,線條數(shù)量與粗細(xì)反映作者合作關(guān)系與合作強(qiáng)度。
數(shù)據(jù)源于中國(guó)知網(wǎng)(CNKI)及Web of Science(WOS)數(shù)據(jù)庫(kù)的核心合集中相關(guān)的中英文文獻(xiàn)。其中,CNKI數(shù)據(jù)庫(kù)擬定檢索條件為:“主題:(適生區(qū))OR主題:(生境)AND主題:(預(yù)測(cè))”,共檢索到相關(guān)中文文獻(xiàn)1 486篇,將相關(guān)度較低的文獻(xiàn)剔除,得到有效文獻(xiàn)1 433篇;WOS選用核心合集數(shù)據(jù)庫(kù),擬定檢索條件為:“主題:(specie*)AND主題:(potential distribution model*)AND文獻(xiàn)類型: (Article OR Review)AND語(yǔ)種:(English)”,共檢索到相關(guān)英文文獻(xiàn)6 777篇,并通過(guò)CiteSpace“除重篩選”功能得到有效文獻(xiàn)6 687篇。
國(guó)內(nèi)外物種分布預(yù)測(cè)研究領(lǐng)域年度發(fā)表論文情況如圖1所示。
圖1 國(guó)內(nèi)外年度累計(jì)發(fā)文量趨勢(shì)Fig.1 Broken line chart of research documents quantity at home and abroad
從文獻(xiàn)總量來(lái)看,國(guó)內(nèi)外相關(guān)研究年發(fā)文量均呈現(xiàn)逐年增加狀態(tài),特別是2007年后,年發(fā)文量有較為顯著的增長(zhǎng),說(shuō)明物種分布預(yù)測(cè)研究逐漸引起國(guó)內(nèi)外學(xué)者的關(guān)注與重視。從發(fā)展階段來(lái)看,國(guó)外的物種分布預(yù)測(cè)研究可大致分為兩個(gè)階段:第一階段為初級(jí)探索階段(1990—2007年)。國(guó)外相關(guān)研究萌芽于20世紀(jì)90年代初,BIOCLIM 模型為首個(gè)物種分布模型,由 Busby于1991年提出,Busby基于生態(tài)位理論利用生物氣候分析害蟲(chóng)物種的分布及氣候變化下其潛在分布區(qū)范圍[26]。由于計(jì)算機(jī)與編程技術(shù)的限制,經(jīng)歷了十幾年的探索,此階段的年發(fā)文量仍較少且增長(zhǎng)緩慢,此時(shí)學(xué)者的探索重心主要集中于物種生境適宜性研究及物種生境評(píng)價(jià)模型開(kāi)發(fā),這為后續(xù)的快速發(fā)展奠定了理論基礎(chǔ)。第二階段為高速發(fā)展階段(2008—2021年)。此階段年發(fā)文量多且增長(zhǎng)快速,僅2016年的年發(fā)文量就超過(guò)了第一階段的發(fā)文量總和。隨著衛(wèi)星遙感與地理信息系統(tǒng)(Geographic Information System,GIS)的快速發(fā)展,部分學(xué)者嘗試將GIS技術(shù)與物種多樣性空間分布格局研究相結(jié)合,研究發(fā)現(xiàn),GIS不僅能夠準(zhǔn)確地繪制出物種分布圖,體現(xiàn)物種分布的動(dòng)態(tài)變化,獲取物種豐富度信息,而且GIS結(jié)合物種與生境關(guān)系模型能夠較為準(zhǔn)確地預(yù)測(cè)動(dòng)物的空間分布格局[27]。此后,物種分布預(yù)測(cè)研究迅速成為學(xué)術(shù)研究的熱點(diǎn)課題。
國(guó)內(nèi)相關(guān)研究的發(fā)展歷程與國(guó)外大致相同,亦可分為兩個(gè)階段:第一階段為初級(jí)探索階段(1999—2008年)。我國(guó)相關(guān)研究起步于1999年,當(dāng)時(shí)有學(xué)者利用Climex模型預(yù)測(cè)了植物害蟲(chóng)麥雙尾蚜Diuraphisnoxia(Mordvilko)在中國(guó)的適生區(qū)[28],可視為我國(guó)物種分布預(yù)測(cè)研究的開(kāi)端。第二階段為高速發(fā)展階段(2009—2021年)。此階段年發(fā)文量呈穩(wěn)步增長(zhǎng)狀態(tài),研究重點(diǎn)除上一階段的模型基礎(chǔ)理論研究[27,29-30]、外來(lái)物種入侵范圍預(yù)測(cè)[28,31-32]、害蟲(chóng)種群動(dòng)態(tài)預(yù)測(cè)[33-36]等研究方向外,還增加了野生珍稀瀕危物種適生區(qū)預(yù)測(cè)[37-40]、物種起源與演替[41]、外來(lái)生物入侵風(fēng)險(xiǎn)評(píng)估[42-43]、傳染病病原體的傳播及擴(kuò)散路徑預(yù)測(cè)[44]、多模型結(jié)合優(yōu)化應(yīng)用[45-48]、植物病菌傳播預(yù)測(cè)[49-50]等多個(gè)研究方向,與古生物學(xué)、疾病傳播學(xué)等多個(gè)學(xué)科交叉融合,應(yīng)用層面更廣、層次更深。
合作圖譜是體現(xiàn)該領(lǐng)域研究機(jī)構(gòu)或作者間學(xué)術(shù)合作與交流強(qiáng)度的重要依據(jù)。從發(fā)文量國(guó)家統(tǒng)計(jì)與合作圖譜來(lái)看(表1,圖2),美國(guó)是研究成果最多的國(guó)家,發(fā)文頻數(shù)為2 443篇;中介中心性最高的是德國(guó),為0.21,表明德國(guó)與其他國(guó)家的學(xué)術(shù)交流、合作較多。英國(guó)、德國(guó)、中國(guó)、澳大利亞、法國(guó)等亦擁有不錯(cuò)的研究成果,但與國(guó)際間的合作不多。
在全球研究機(jī)構(gòu)合作圖譜中(表2、圖3),網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為579個(gè),網(wǎng)絡(luò)密度為0.003 8。美國(guó)國(guó)家科學(xué)研究中心(Centre National DE LA Recherche Scientificas,CSIC)是該領(lǐng)域中發(fā)文量最多的研究機(jī)構(gòu),其與法國(guó)國(guó)家科學(xué)研究中心(Centre national de la recherche scientifique,CNRS)、美國(guó)森林服務(wù)部(US Forest Serv)及美國(guó)國(guó)家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)構(gòu)成了領(lǐng)域里最重要的學(xué)術(shù)合作圈。此外,由中國(guó)科學(xué)院(Chinese Acad Sci)、中國(guó)科學(xué)院大學(xué)(University of Chinese Academy of Sciences)及北京林業(yè)大學(xué)(Beijing Forestry University)組成的學(xué)術(shù)合作圈也占據(jù)重要地位。美國(guó)堪薩斯大學(xué)(University of Kansas)、英國(guó)牛津大學(xué)(University of Oxford)、美國(guó)地質(zhì)調(diào)查局(US Geol Survey)亦是該領(lǐng)域的主要研究機(jī)構(gòu)。
表1 全球發(fā)文量前10位國(guó)家統(tǒng)計(jì)Tab.1 Statistics of the top ten countries in terms of global publication volume
圖2 全球發(fā)文國(guó)家知識(shí)合作圖譜Fig.2 Knowledge map of countries of publication
表2 國(guó)內(nèi)外發(fā)文量前10位研究機(jī)構(gòu)統(tǒng)計(jì)Tab.2 Statistics of the top ten institutions in terms of publication volume at home and abroad
圖3 全球發(fā)文機(jī)構(gòu)知識(shí)圖譜Fig.3 Knowledge map of global research institutions
國(guó)外作者合作知識(shí)圖譜形成了網(wǎng)狀分布結(jié)構(gòu),這表明國(guó)外研究學(xué)者之間產(chǎn)生了較為密切的學(xué)術(shù)合作,其中來(lái)自堪薩斯大學(xué)生物多樣性研究所的研究員 Townsend A.Peterson是領(lǐng)域里成果最多的學(xué)者,相關(guān)文獻(xiàn)發(fā)文頻數(shù)為87篇,該作者主要研究方向?yàn)橐饌魅静〉募纳x(chóng)[51]、病毒[52-53]、病菌[54]等介質(zhì)的傳播范圍及路徑預(yù)測(cè),近年來(lái)其對(duì)預(yù)測(cè)模型的優(yōu)化研究亦展開(kāi)了較為深入的探討[55-58]。來(lái)自美國(guó)國(guó)家科學(xué)研究中心的學(xué)者Wilfried Thuiller是該領(lǐng)域最高被引作者,被引頻次為46 180,其主要研究方向?yàn)橥鈦?lái)生物入侵風(fēng)險(xiǎn)評(píng)估,探索導(dǎo)致物種入侵的主要驅(qū)動(dòng)因素[59-60]。
在國(guó)內(nèi)作者合作知識(shí)圖譜中呈現(xiàn)出大分散、小集中的特點(diǎn),這表明國(guó)內(nèi)該領(lǐng)域里形成了以萬(wàn)方浩、李明陽(yáng)、衛(wèi)海燕、郭彥龍、晉玲等學(xué)者為核心的數(shù)個(gè)作者群,但各團(tuán)隊(duì)之間聯(lián)系強(qiáng)度較差。雖然在1999年就有學(xué)者通過(guò)CLIMEX模型預(yù)測(cè)了麥雙尾蚜Diuraphisnoxia(Mordvilko)在中國(guó)的適生區(qū)[27],但直到2002年,北京師范大學(xué)的張清芬基于CLIMEX模型,利用氣候數(shù)據(jù)預(yù)測(cè)了日本金龜子在中國(guó)的可能入侵適生區(qū)[30],并在隨后的第二年發(fā)表論文詳細(xì)闡述CLIMEX模型的運(yùn)算原理、主要功能、模型特性及實(shí)例應(yīng)用[61],此后,國(guó)內(nèi)相關(guān)研究才進(jìn)入較為系統(tǒng)性的研究流程。衛(wèi)海燕、郭彥龍、張儀、晉玲、呂利華等是近5年來(lái)的高產(chǎn)作者,近期的研究焦點(diǎn)是蜱媒及病原體的適生區(qū)預(yù)測(cè)與適生性分析[44,62-64]、藥用植物的生境預(yù)測(cè)[65-67]、珍稀保護(hù)孑遺植物的景觀格局破碎度分析[68-69]、基于R語(yǔ)言的預(yù)測(cè)模型優(yōu)化研究[70]等(表3,圖4,圖5)。
表3 國(guó)內(nèi)外發(fā)文量前10位研究作者統(tǒng)計(jì)Tab.3 Statistics of the top ten authors in terms of publication volume at home and abroad
關(guān)鍵詞可以揭示文章內(nèi)容核心觀點(diǎn)及主要方向,對(duì)關(guān)鍵詞進(jìn)行共現(xiàn)和突現(xiàn)分析,可以更為直觀地了解該研究領(lǐng)域的研究熱點(diǎn)、研究趨勢(shì)及知識(shí)架構(gòu)[24]。
國(guó)外關(guān)鍵詞聚類主要分為#invasive species(入侵物種)、#migration(遷徙)、#phylogeography(系統(tǒng)地理學(xué))、#maxent(最大熵模型)、#risk(風(fēng)險(xiǎn))、#connectivity(聯(lián)結(jié)度)、#drought(干旱)、#biodiversity(生物多樣性)、#evolution(演化)、#climate change(氣候變化)、#conservation(對(duì)自然環(huán)境的保護(hù))、#random forest(隨機(jī)森林算法)、#population dynamics(種群動(dòng)態(tài))、#last glacial maximum(末次盛冰期)幾大類,聚類Q值(ModularityQ)為0.813 8(>0.3),平均輪廓(mean silhouette)值為0.854(>0.5),表明該聚類圖譜結(jié)構(gòu)合理,集群的同質(zhì)化程度較高(圖6)。剔除高度重復(fù)的聚類,國(guó)內(nèi)關(guān)鍵詞聚類主要分為#潛在生境、#地理信息系統(tǒng)、#ca-markov模型、#組合模型、#maxent、#climex、#人類活動(dòng)、#遺傳算法、#生物入侵、#生態(tài)位、#適生區(qū)預(yù)測(cè)、#島嶼生物地理學(xué)理論、#3S技術(shù)等幾大類,聚類Q值(ModularityQ)為0.894 2(>0.3),平均輪廓(mean silhouette)值為0.964 9(>0.5)
圖4 國(guó)外發(fā)文作者知識(shí)圖譜Fig.4 Knowledge map of of authors abroad
圖5 國(guó)內(nèi)發(fā)文作者知識(shí)圖譜Fig.5 Knowledge map of of authors at home
(圖7)。通過(guò)圖譜可以觀察到國(guó)外物種分布預(yù)測(cè)每一個(gè)聚類所呈現(xiàn)的面積均較大且覆蓋面廣泛,且多個(gè)聚類之間存在相互覆蓋,說(shuō)明各項(xiàng)研究之間存在較深的交流。其中最核心的部分以生物入侵、氣候變化、種群動(dòng)態(tài)、Maxent模型等研究為主,說(shuō)明該類研究出現(xiàn)較早,對(duì)研究領(lǐng)域內(nèi)的其他分支影響較大,屬于該領(lǐng)域內(nèi)的基礎(chǔ)類研究;而離中心點(diǎn)較遠(yuǎn)的如組合模型、biomod、小樣本量、人類活動(dòng)等聚類出現(xiàn)較晚、分支較少,屬于領(lǐng)域內(nèi)較新的課題研究,是近幾年的研究熱點(diǎn)與趨勢(shì)(表4)。
在關(guān)鍵詞聚類與共現(xiàn)知識(shí)圖譜(圖6,圖7)中,出現(xiàn)頻次和中介中心性較高的關(guān)鍵詞是氣候變化、物種分布模型、Maxent最大熵模型、生態(tài)位模型、生物多樣性、種群動(dòng)態(tài)、生物入侵、演化、生境適宜性。不難發(fā)現(xiàn),物種分布模型一直都是該研究領(lǐng)域的熱點(diǎn)課題,無(wú)論是初期對(duì)于SDMs基礎(chǔ)理論研究與模型開(kāi)發(fā)[61],或是后期SDMs的升級(jí)優(yōu)化和多模型聯(lián)合應(yīng)用[70],都引起了很多學(xué)者的關(guān)注和重視。根據(jù)目前現(xiàn)有的物種分布模型的運(yùn)算原理和模型特點(diǎn),可以將SDMs歸納總結(jié)為5類。
圖6 國(guó)外關(guān)鍵詞聚類知識(shí)圖譜Fig.6 Knowledge map of keywords clustering abroad
圖7 國(guó)內(nèi)關(guān)鍵詞聚類知識(shí)圖譜Fig.7 Knowledge map of keywords clustering at home
表4 國(guó)內(nèi)外文獻(xiàn)中關(guān)鍵詞共現(xiàn)頻次排名Tab.4 Ranking of keyword co-occurrence frequency at home and abroad
2.4.1機(jī)理模型
該模型的研究基礎(chǔ)是建立在了解物種環(huán)境變量精確反應(yīng)的基礎(chǔ)上,依賴于對(duì)物種生物學(xué)和生態(tài)學(xué)特性的長(zhǎng)期觀測(cè)結(jié)果,需要整合物種的生活史、生態(tài)位的耐受范圍及環(huán)境理化動(dòng)態(tài)等數(shù)據(jù),從而根據(jù)物種的生理生態(tài)需求建模[71]。該模型具有明確的生態(tài)學(xué)意義,因此在物種生境評(píng)價(jià)研究中得到了廣泛應(yīng)用,然而模型評(píng)價(jià)準(zhǔn)則的建立是根據(jù)人為經(jīng)驗(yàn)而定,對(duì)環(huán)境因子的適宜性劃分具有一定的主觀性,這在很大程度上影響了模型的準(zhǔn)確性[72-73],且模型所需數(shù)據(jù)獲取難度較大,可實(shí)操程度低。
2.4.2統(tǒng)計(jì)模型
統(tǒng)計(jì)模型的基本原理是數(shù)學(xué)中的回歸分析,在物種變量(分布點(diǎn)數(shù)據(jù))與環(huán)境變量(如氣候、地形)之間建立統(tǒng)計(jì)關(guān)系,以環(huán)境變量為自變量,物種變量為因變量,對(duì)物種所處生境進(jìn)行預(yù)測(cè)與評(píng)價(jià)[74]。統(tǒng)計(jì)模型主要包含支持廣義線性模型GLM、向量機(jī)模型SVM、邏輯斯蒂模型 Logistic Model、廣義相加模型GAM等。不必同時(shí)獲取物種“存在”和“不存在”數(shù)據(jù)是此類模型的優(yōu)點(diǎn),但其對(duì)物種生態(tài)學(xué)意義的考慮較少。
2.4.3生態(tài)位模型
根據(jù)物種實(shí)際分布數(shù)據(jù)及其分布區(qū)域?qū)?yīng)的生態(tài)環(huán)境數(shù)據(jù),通過(guò)某種算法進(jìn)而得到該物種的生態(tài)位特征,將物種的生態(tài)位特性投映到特定環(huán)境情景中,從而預(yù)測(cè)物種的分布特征[75]。生態(tài)位模型主要包含生態(tài)位因子分析模型ENFA、最大熵模型MaxEnt、生物氣候模型BIOCLIM、規(guī)則遺傳算法模型GARP、DOMAIN模型。生態(tài)位模型僅需要物種分布點(diǎn)數(shù)據(jù)與環(huán)境數(shù)據(jù)即可進(jìn)行模擬,模型操作相對(duì)簡(jiǎn)單,且通常模擬結(jié)果較好,因此成為物種分布預(yù)測(cè)研究中應(yīng)用最為廣泛的模型。
2.4.4模糊數(shù)學(xué)模型
美國(guó)專家查德提出模糊數(shù)學(xué)的概念,首先采集檢測(cè)物種相關(guān)的有效成分含量值,并收集研究區(qū)環(huán)境數(shù)據(jù),將所有環(huán)境因子進(jìn)行標(biāo)準(zhǔn)化(歸一化),之后建立每個(gè)環(huán)境因子與物種有效成分間的隸屬度函數(shù),再根據(jù)各環(huán)境因子的權(quán)重來(lái)疊加所有的環(huán)境因子,最終得到總的適宜生境評(píng)價(jià)結(jié)果[76-77]。這種方法能夠根據(jù)物種的有效含量值預(yù)測(cè)環(huán)境因子的相應(yīng)適宜范圍,對(duì)物種的有效栽培與利用有著重要意義,此方法比較適用于植物的生境預(yù)測(cè),對(duì)動(dòng)物生境預(yù)測(cè)研究適用度較低。
2.4.5學(xué)習(xí)型模型
此類模型需要物種的實(shí)際分布點(diǎn)數(shù)據(jù),以及研究區(qū)域的環(huán)境數(shù)據(jù),并根據(jù)經(jīng)驗(yàn)人為地在不適宜物種生長(zhǎng)區(qū)域選取“非存在點(diǎn)”(賦值為0),將這3部分?jǐn)?shù)據(jù)一同輸入模型中,模型將自動(dòng)學(xué)習(xí)物種—環(huán)境間的關(guān)系,并最大限度地逼近這種非線性關(guān)系,從而預(yù)測(cè)研究對(duì)象的適生區(qū)范圍[78]。學(xué)習(xí)型模型主要包括隨機(jī)森林RFM、貝葉斯算法模型Bayes、推進(jìn)式回歸樹(shù)BRT及人工神經(jīng)網(wǎng)絡(luò)模型ANN。強(qiáng)大的計(jì)算能力與學(xué)習(xí)能力是此類模型的優(yōu)點(diǎn),能夠?qū)⑽锓N和環(huán)境間非線性定量聯(lián)系清晰呈現(xiàn),但人為設(shè)定“非存在點(diǎn)”數(shù)據(jù)而使得模型具有一定的主觀性。
在現(xiàn)有的眾多模型中,Maxent最大熵模型(Maximum Entropy Model)因具有操作簡(jiǎn)易,樣本量對(duì)于模擬結(jié)果影響較小,且在大多情況下模擬精度高于其他模型的優(yōu)點(diǎn),成為物種分布預(yù)測(cè)研究中應(yīng)用最廣泛的工具之一[79-80]。目前,該模型已被成功應(yīng)用于珍稀瀕危物種如Canacomyricamonticola[81]、Vandabicolor[82]、青錢(qián)柳(Cyclocaryapaliurus)[83]、蒙古扁桃(Amygdalusmongolica)[84]等的生境評(píng)價(jià)與分布預(yù)測(cè)中。Hernandez等[79]及Deb等[82]的研究均表明當(dāng)物種出現(xiàn)點(diǎn)很少(<10),即使低至4或5個(gè),Maxent模型仍能以高精度產(chǎn)生有效的預(yù)測(cè)結(jié)果。
1)發(fā)展歷程:國(guó)內(nèi)外關(guān)于物種分布預(yù)測(cè)相關(guān)研究的發(fā)展歷程大致相同,可分為初級(jí)探索階段和高速發(fā)展階段。國(guó)外相關(guān)研究的發(fā)展相較于國(guó)內(nèi)萌芽早,發(fā)展較為全面,融合學(xué)科較多,且機(jī)構(gòu)、學(xué)者之間的合作交流較多,形成了以美國(guó)國(guó)家科學(xué)研究中心為核心,法國(guó)國(guó)家科學(xué)研究中心、美國(guó)森林服務(wù)部及美國(guó)國(guó)家海洋和大氣管理局為重要成員的學(xué)術(shù)合作圈。Townsend A.Peterson是領(lǐng)域里成果最多的學(xué)者,Wilfried Thuiller是該領(lǐng)域最高被引作者,他們的研究成為領(lǐng)域發(fā)展的重要基礎(chǔ)。國(guó)內(nèi)的相關(guān)研究則呈現(xiàn)出大分散、小集中的分布特點(diǎn),形成了以萬(wàn)方浩、李明陽(yáng)、衛(wèi)海燕、郭彥龍、晉玲等學(xué)者為核心的數(shù)個(gè)作者群,但各團(tuán)隊(duì)之間聯(lián)系強(qiáng)度較差,說(shuō)明各研究團(tuán)隊(duì)均處于獨(dú)立研究狀態(tài)。衛(wèi)海燕、郭彥龍、張儀、晉玲、呂利華等是國(guó)內(nèi)近5年來(lái)的高產(chǎn)作者,他們的研究方向?qū)︻I(lǐng)域的發(fā)展具有導(dǎo)向作用。從研究機(jī)構(gòu)來(lái)看,無(wú)論是國(guó)內(nèi)還是國(guó)外,該領(lǐng)域相關(guān)研究機(jī)構(gòu)主要以高校、研究院所為主,研究機(jī)構(gòu)相對(duì)集中,缺乏多樣性。
2)研究熱點(diǎn)與趨勢(shì):在初級(jí)探索階段,對(duì)外來(lái)生物入侵范圍預(yù)測(cè)的研究是該領(lǐng)域研究開(kāi)端,此外,探索物種對(duì)氣候變化的響應(yīng)、珍稀瀕危種群動(dòng)態(tài)預(yù)測(cè)、Maxent模型的應(yīng)用等方向亦是初期的研究熱點(diǎn)。到了高速發(fā)展階段,初期的研究熱點(diǎn)依然熱度不減,研究方向還增加了如傳染病病原體的適生區(qū)預(yù)測(cè)與適生性分析[44,62-64]、藥用植物的生境預(yù)測(cè)[65-67]、珍稀保護(hù)孑遺植物的景觀格局破碎度分析[68-69]、物種起源、散布及演替分化規(guī)律研究[21]、基于R語(yǔ)言的預(yù)測(cè)模型優(yōu)化研究[70]等多項(xiàng)內(nèi)容,與古生物學(xué)、生物地理學(xué)、疾病傳播學(xué)、R語(yǔ)言編程等多個(gè)學(xué)科交叉融合,應(yīng)用層面更廣、層次更深。
國(guó)內(nèi)外物種分布預(yù)測(cè)研究領(lǐng)域發(fā)展歷程時(shí)間較短,尤其在國(guó)內(nèi)還算較為年輕的學(xué)科,缺乏長(zhǎng)時(shí)間的累積與沉淀導(dǎo)致其可能存在以下不足:
1)研究所需數(shù)據(jù)獲取難度大且準(zhǔn)確度不高。物種分布預(yù)測(cè)研究主要用到兩類數(shù)據(jù),一類是物種分布有/無(wú)數(shù)據(jù),另一類是環(huán)境變量數(shù)據(jù)。物種分布數(shù)據(jù)的主要來(lái)源有:野外實(shí)地調(diào)查數(shù)據(jù);各大標(biāo)本館館藏的標(biāo)本記錄;物種數(shù)據(jù)庫(kù),如全球生物多樣性信息網(wǎng)站(全球生物多樣性信息網(wǎng)絡(luò)http://www.gbif.org/);文獻(xiàn)資料。除野外實(shí)地調(diào)查數(shù)據(jù)的可信度與精確度較高外,其他數(shù)據(jù)來(lái)源皆可能存在或多或少的問(wèn)題,如標(biāo)本記錄與文獻(xiàn)記錄中的分布數(shù)據(jù)難以獲取準(zhǔn)確的經(jīng)緯度、海拔等信息;物種數(shù)據(jù)庫(kù)所記錄的分布數(shù)據(jù)被發(fā)現(xiàn)可能存在可信度較低的問(wèn)題;而野外調(diào)查數(shù)據(jù)雖具有較高的可信度與精確度,但開(kāi)展野外調(diào)查需要花費(fèi)較高的人力、財(cái)力、物力,且無(wú)法進(jìn)行全球或國(guó)家層面的大范圍普查活動(dòng)。對(duì)于物種分布點(diǎn)樣本量的要求目前亦無(wú)定論,有學(xué)者認(rèn)為分布點(diǎn)數(shù)據(jù)越多,預(yù)測(cè)模型精度越高[85],部分學(xué)者對(duì)物種分布點(diǎn)樣本量對(duì)預(yù)測(cè)模型精度的影響進(jìn)行了研究,發(fā)現(xiàn)50~100的樣本量就能獲得理想的預(yù)測(cè)結(jié)果[86],Elith等[87]和Wisz等[85]認(rèn)為30個(gè)物種分布點(diǎn)數(shù)據(jù)也可以得到較為滿意的結(jié)果,而Hernandez等人[79]及Deb[82]的研究表明,當(dāng)物種出現(xiàn)點(diǎn)很少(<10),甚至低至4或5個(gè)時(shí),仍能夠得到有效的模擬結(jié)果。
2)物種分布模型眾多,選擇適用模型存在難點(diǎn)。有學(xué)者發(fā)現(xiàn),由于原理和算法的不同,每種模型都有自己的優(yōu)點(diǎn)和局限性,而且當(dāng)輸入數(shù)據(jù)發(fā)生變化時(shí),模型的表現(xiàn)也是不穩(wěn)定的[88],如何根據(jù)研究物種的特性在眾多SDMs中選擇適用的模型一直是該領(lǐng)域的研究難點(diǎn)。最近幾年,基于R語(yǔ)言的模型優(yōu)化研究與多模型聯(lián)合應(yīng)用是領(lǐng)域的研究熱點(diǎn),Biomod 模型便是應(yīng)運(yùn)而生的。2003年Biomod模型在R語(yǔ)言平臺(tái)發(fā)布后引起生物學(xué)家們廣泛認(rèn)同和使用[46,89]。目前最新版本是2016年升級(jí)的Biomod 2 (3.3-7),其包含了10種常見(jiàn)的SDM算法:分類樹(shù)分析(classification tree analysis, CTA)、廣義線性模型(generalized linear models, GLM)、多元適應(yīng)回歸樣條函數(shù)(multivariate adaptive regression splines, MARS)、隨機(jī)森林(random forests, RF)、表面分布區(qū)分室模型(one rectilinear envelope similar to BIOCLIM, SRE)、推進(jìn)式回歸樹(shù)(generalized boosted models, GBM)、柔性判別分析( flexible discriminant analysis, FDA)、最大熵模型(Maximum Entropy, Maxent)以及廣義相加模型(generalized additive models, GAM)。使用者可以選擇模型提供的5種模型合成方法和10種模型檢驗(yàn)方法。此外,還可以自由定制模型組合,調(diào)整初始條件、模型類別、模型參數(shù)以及邊界條件以達(dá)到最優(yōu)預(yù)測(cè)效果[90]。Biomod組合模型可以有效解決單一模型存在的問(wèn)題,但其對(duì)于使用者的要求較高,使用者需掌握一定的R語(yǔ)言編程基礎(chǔ),且Biomod最終產(chǎn)出的結(jié)果是組合模型中各模型結(jié)果的平均值,其平均值勢(shì)必比組合中預(yù)測(cè)準(zhǔn)確值較高的模型要低。因此,從準(zhǔn)確度的層面來(lái)說(shuō),Biomod組合模型并非最優(yōu)選,針對(duì)不同模型的特點(diǎn)加權(quán)計(jì)算或可得到更好的結(jié)果。
3)研究結(jié)果難以實(shí)證。目前,物種分布預(yù)測(cè)研究的結(jié)果檢驗(yàn)通常采取模型精度的評(píng)估來(lái)實(shí)現(xiàn),AUC值(Area Under the Receiver Operating Characteristic Curve)、TSS真實(shí)技巧統(tǒng)計(jì)值(True Skill Statistic)、KAPPA系數(shù)是3 種常用的評(píng)估模型精度的檢驗(yàn)指標(biāo)[13]。AUC值是受試者工作特征曲線(Receiver operating characteristic curve, ROC曲線)下的面積,是一個(gè)概率值,其值域范圍為0~1,其含義為預(yù)測(cè)的正例排在負(fù)例前面的概率,數(shù)值越大則代表模型精度越高[91-92]。KAPPA系數(shù)是一種廣泛應(yīng)用于統(tǒng)計(jì)學(xué)模型的檢驗(yàn)指標(biāo),主要用于一致性檢驗(yàn)和衡量分類精度。Fielding和Bell[93]首次將該系數(shù)應(yīng)用于物種分布模型的研究中,KAPPA 系數(shù)的取值范圍為-1~1,可解釋為模型預(yù)測(cè)結(jié)果和實(shí)際分類結(jié)果的一致程度。TSS值是由KAPPA系數(shù)改良而來(lái)的,其值域與KAPPA系數(shù)相同,TSS值越接近1,模型精度越高。一般情況下,當(dāng)取值>0.8時(shí),模型結(jié)果較為理想;當(dāng)取值<0.4時(shí),模型結(jié)果較差(Fielding & Bell, 1997; Hipólito et al., 2015)。 TSS和KAPPA值均為閾值依賴的統(tǒng)計(jì)量,閾值的選取是否會(huì)影響到模型比較結(jié)果還有待進(jìn)一步考證[90]。此外,AUC值、TSS值、KAPPA系數(shù)是對(duì)模型精度的評(píng)估,而非針對(duì)研究結(jié)果的檢驗(yàn)。研究結(jié)果檢驗(yàn)最直接的方法是實(shí)地調(diào)查驗(yàn)證,有學(xué)者對(duì)研究結(jié)果進(jìn)行實(shí)地抽樣調(diào)查,驗(yàn)證研究結(jié)果的準(zhǔn)確性[94],但此方法的實(shí)踐存在較高難度。
當(dāng)前,計(jì)算機(jī)技術(shù)、信息遙感技術(shù)、R語(yǔ)言技術(shù)已日趨成熟,物種數(shù)據(jù)庫(kù)等互聯(lián)網(wǎng)大數(shù)據(jù)共享使得物種分布的獲取變得簡(jiǎn)易、方便,上述3個(gè)問(wèn)題或?qū)⒊蔀槲磥?lái)該領(lǐng)域研究創(chuàng)新的重要突破口。
盡管Citespace軟件具有優(yōu)良的圖譜繪制功能,但其數(shù)據(jù)運(yùn)行上限為20 000條文獻(xiàn)信息,無(wú)法涵蓋所有的文獻(xiàn),且如何解讀圖譜仍然是一項(xiàng)極具主觀性的工作,容易出現(xiàn)諸如誤讀、漏讀和選擇性解讀等問(wèn)題,這些因素會(huì)對(duì)結(jié)果分析產(chǎn)生影響,未來(lái)的研究需要在使用Citespace軟件時(shí)提高圖譜解讀的一致性和嚴(yán)謹(jǐn)性[95]。
致謝:廣西玉林市農(nóng)業(yè)科學(xué)院寧瑤、海南大學(xué)林學(xué)院謝承智、廣西大學(xué)林學(xué)院馬可錦對(duì)本文的寫(xiě)作進(jìn)行了指導(dǎo)與幫助,特此感謝。