劉慧圓 覃海寧 包伯堅 陳天翔 韓國霞 劉全儒
摘 要:? 傳統(tǒng)上館藏標本,主要用于植物分類學、植物資源學的研究。數字標本的出現將標本的使用拓展到從研究生物多樣性時間空間分布到生態(tài)學和進化學理論、生物多樣性保護、農業(yè)和人類健康等廣泛領域。截至目前,從互聯(lián)網上獲取的采自中國的植物標本數量已有1 200多萬份。該文通過整理和分析這些數據以了解中國植物標本的數字化精度、采集時間和采集地區(qū)規(guī)律以及采集空缺等狀況。結果表明:中國標本采集形成了4個高峰,即20世紀30年代、60年代、80年代和21世紀初,中國植物標本采集和研究工作主要在20世紀50年代后由中國學者完成。標本采集地區(qū)覆蓋度在省級較好,縣級標本采集則很不平衡;標本采集類群在科屬層面覆蓋率高,但近五分之一的物種采集不足;標本的采集量既與植物分布幅度相關,也與采集地區(qū)的知名度、所獲科研項目及采集者偏好有關。未來中國植物標本數字化方向應該在繼續(xù)挖掘館藏標本的同時,一方面開展對現有數字化標本信息再審核及補充,并加強與歐美大館的信息共享以獲取早期歷史標本信息;另一方面應用數字化標本信息分析結果,指導境內標本的精準采集,包括采集薄弱/空白地區(qū)、采集薄弱/空白屬種的采集,以進一步增強實體標本館能力,提高數字化標本質量,為進一步完善植物標本數字化和精準化采集提供依據,更好地服務科學和社會的發(fā)展。
關鍵詞: 植物標本, 標本數字化, 采集空缺, 精準采集, 高等植物
中圖分類號:? Q94
文獻標識碼:? A
文章編號:? 1000-3142(2022)增刊1-0029-17
收稿日期:? 2022-09-06
基金項目:? 國家自然科學基金 (31770213); 國家植物標本資源庫 (E0117G1001)。
第一作者: 劉慧圓(1982-),博士,工程師,主要從事植物地理、生物多樣性保護和科學數據研究,(E-mail)liuhy@ibcas.ac.cn。
通信作者:? 劉全儒,教授,主要從事植物分類學和植物地理學研究,(E-mail)liuquanru@bnu.edu.cn。
Analysis of digitized specimens of higher plants in China
LIU Huiyuan1,2, QIN Haining2, BAO Bojian2, CHEN Tianxiang2,
HAN Guoxia2, LIU Quanru1*
(1. College of Life Sciences, Beijing Normal University, Beijing 100875, China; 2. State Key Laboratory of Systematic
and Evolutionary Botany, Institute of Botany, Chinese Academy of Sciences, Beijing 100093, China )
Abstract:
Traditionally, herbarium specimens are mainly used for plant taxonomy and resource science research. The emergence of digitized specimens has expanded the use of specimens to a wider range of fields, from the study of temporal and spatial distribution of biodiversity to theoretical ecology and evolutionary, biodiversity conservation, agriculture and human health. Up to now, information of more than 12 million plant specimen sheets collected from China has been available on the internet. This paper compiles and analyzes these data to evaluate the digitization accuracy, the temporal and spatial pattern of herbarium collection, and the collection vacancy of Chinese plant specimens, so as to provide a basis for further improving the digitization and accurate collection of plant specimens. The results are as follows:? The collection of specimens in China formed four peaks, namely,? the 1930s, the 1960s, the 1980s and the early 21st century, and the collection and research of Chinese plant specimens have been mainly completed by Chinese scholars since the 1950s. The coverage of specimen collection is rather high on province level while greatly unbalanced on county level. The coverage of specimen collection by plant groups is high on family and genus level, but nearly one fifth of the species have not been collected sufficiently. The number of collected specimens is related to the distribution range of plants, as well as the popularity of the collection area, the scientific research projects, and the preferences of the collectors. To better digitize Chinese plant specimens in the future, we should continue to explore the undigitized herbarium specimens, review and supplement the existing digitized specimen information, and strengthen the information sharing with European and American herbaria to obtain the information of early historical specimens. The results from our analysis can be applied as a guidance for accurate collection of specimens in China, showing the weak or blank areas and genera/species, which can further enhance the capacity of the herbaria and improve the quality of digitized specimens to better serve science and the society.
Key words: plant specimens, specimen digitization, collection vacancy, accurate collection, higher plants
各類標本館和博物館中保藏的生物標本包括植物標本,是物種在地球上存在的歷史憑證,西方文獻常常稱其為自然歷史標本(natural history collections )。傳統(tǒng)上,館藏標本主要用途是作為分類學、系統(tǒng)學及相關學科如植物資源學等的研究素材(Lane 1996; 王利松等2010; 楊永2012)。但是,隨著大量數字化標本的出現和全球范圍內生物多樣性保護的需求,生物標本數據廣泛應用于系統(tǒng)學、生物地理學、生態(tài)學、物候學和基因組學等眾多學科領域,在農業(yè)發(fā)展、人類健康、生物多樣性保護政策制定等社會應用領域中發(fā)揮著重要作用 (Lane 1996; Ponder et al., 2001; OConnell et al., 2004; Johnson et al., 2011; Robbirt et al., 2011; Wen 2015; Page et al., 2015)。標本數字化工作始于20世紀70年代末80年代初歐美,至90年代奠定了基礎。直到20世紀初,全球性的生物多樣性保護熱潮讓人們認識到各國各類博物館、標本館中保藏的標本是生物多樣性監(jiān)測及保護策略制定所參考的重要且易于獲取的材料(Ponder et al., 2001; Suarez & Tsutsui 2004; Pyke & Ehrlich 2010; Page et al., 2015; Nualart et al., 2017; James et al., 2018; Hedrick, 2020)。此后,借助蓬勃發(fā)展的計算機技術及網絡通信技術,歐美發(fā)達國家及南非(https://www.sanbi.ac.za/)、巴西(http://reflora.jbrj.gov.br/reflora/herbarioVirtual/ConsultaPublicoHVUC/Consul
taPublicoHVUC.do)等許多國家紛紛加速推進本國標本數字化進程,并支持建立GBIF (http://www.gbif.org/)和JSTOR (http://plants.jstor.org/)等全球性標本信息共享網站。
依據《國際植物標本館索引》(Index Herbariorum),全球共有176個國家3 522個標本館,館藏標本總量達3.9億份,其中館藏量前五位的國家為美國(7 846萬)、法國(2 404萬)、英國(2 365萬)、德國(2 212萬)和中國(2 037萬)(Thiers, 2021)。中國是唯一館藏量主要來自本國的國家。早在20世紀80年代初期,我國科技部、中國科學院等部門及生物科學工作者就已了解到國際生物標本館研究領域的數字化趨勢,著手開展與國際最新動向同步的生物物種和標本信息數字化的研究。其中,實施力度最大、影響最遠的是科技部國家科技基礎條件平臺項目——原國家標本資源共享平臺。國家標本資源共享平臺(縮寫為NSII, http://www.nsii.org.cn),由中國科學院植物研究所牽頭組建,自2004年啟動以來,通過旗下植物子平臺(共享網站為“中國數字植物標本館”,縮寫為CVH, http://www.cvh.ac.cn)等相關子平臺,共完成全國100多家植物標本館共1 000萬份標本的規(guī)范化整理及數字化表達,并全部實現網絡共享 (馬克平等 2010; 許哲平等 2010)。該項工作(網站)成為國內外用戶查詢中國植物標本及相關植物學信息的重要門戶網站,在世界同行中享有廣泛的影響。
至今,已有多篇論文分析中國數字化植物標本所覆蓋的植物類群、時空情況等。陽文靜(2013)對900萬條(包括650萬份標本記錄和250萬條文獻記錄)物種分布數據進行了去重,得到431萬條縣級植物分布記錄,并借此對中國植物采集的地理格局和成因進行了詳細分析。姜承勇等(2018)對216 萬份標本記錄進行了采集時間進程和省份采集情況分析,并根據當前采集信息,預測新疆、西藏地區(qū)植物標本采集空間較大。桂略寧等(2018)對1 053萬份標本記錄進行了省份采集情況分析,認為不同地區(qū)的采集密度呈現非均質性。尹朝露等(2018)和王凱莉等(2018)則分別分析蘭科和薔薇科數字標本信息,揭示相關科的標本采集分布特點。張玉雪等(2018)利用14.9萬份杜鵑花科標本信息分析了中國杜鵑花科植物物種豐富度的分布格局及影響其分布的氣候因子之間的關系,結果顯示杜鵑花科植物標本采集較為完整的縣級行政區(qū)集中分布于長江以南地區(qū)以及西南地區(qū),東北、西北及東部地區(qū)相對較少。Qian等(2018)對從GBIF和NSII獲取的共1 100萬份中國標本信息與物種編目的完整性進行比較,認為標本數據庫的完整程度對物種編目的完整性影響非常大。這些工作從多個層面分析和揭示了中國植物數字化標本所蘊藏的信息和規(guī)律,但仍然缺乏從標本數據的層面對標本采集的時空和類群進行全面深入分析與研究。
本文基于國內外共享平臺獲取的中國植物數字標本的海量信息,對這些標本信息在時間、空間、類群等方面積累程度進行分析,以了解中國植物標本在采集時間、空間、類群等方面的特點及采集空缺,為未來數字化方向及開展標本精準化采集提供方向性建議及策略。
1 數字標本來源與分析方法
1.1 數字標本來源
數字標本數據來源于CVH、NSII兩個標本共享平臺,其中NSII只選取了教學子平臺和保護區(qū)子平臺的數據。同時補充了JSTOR和GBIF標本數據網絡共享平臺上采自中國的標本,共提取了12 464 469條采自中國境內的高等植物標本信息(表1)。所收集標本采集時間跨度為1700—2020年。
1.2 數據的核準及清理
由于數據來源不一,故在進行分析之前,首先對標本數據進行了核準和整理工作:(1)刪除標本重復記錄;(2)規(guī)范各個字段內容格式;(3)通過TNRS網站(https://tnrs.biendata.org/),更正與核查提取的拉丁學名等。
1.3 標本數據庫植物名稱及縣級采集地名處理
使用《中國生物物種名錄(光盤版2017)》(中國科學院生物多樣性委員會, 2017)(簡稱《生物物種名錄》)作為標準庫對標本數據的植物拉丁學名、屬名及科名進行比對,包括接受名和異名的匹配轉化和標準化?!渡镂锓N名錄》中各類群使用的分類系統(tǒng)如下:被子植物為APG III分類系統(tǒng)(Chase & Reveal, 2009)、裸子植物為克氏系統(tǒng)(Christenhusz et al., 2011)、蕨類植物根據Flora of China(Wu et al., 2013a)的系統(tǒng)及類群處理意見、苔蘚植物根據Frey (2009)主編的Syllabus of Plant Families(Part 3 Bryophytes and seedless Vascular Plants)。匹配處理得到的物種名稱包括462科3 929屬32 815種,以及種下等級5 048種。
對于未符合目前行政區(qū)劃的舊縣級名稱,通過搜集獲得原中國科學院中國植物編委會編輯的各省區(qū)地名參考資料(油印本),《中國地名錄》(國家測繪局地名研究所,1983),《云南植物采集史略》(包士英等,1995),《中國行政區(qū)劃沿革手冊》(陳潮,2007)等公開或未公開發(fā)表文獻,并參考了中華人民共和國民政部(http://www.mca.gov.cn/article/sj/xzqh/)的各年行政區(qū)劃沿革信息來進行甄別,并對采集地名地標到現用縣級單位。共標準化和校正9.8萬條縣名,涉及省名5.1萬筆,植物名稱21.76萬筆。其中學名歸屬:屬名1.1萬筆,科名0.15萬筆。最終得到有效標本9 906 121份(占收集標本量84.3%),成為本研究使用的中國植物標本數據庫(簡稱標本數據庫)。標本數據庫內容包括常規(guī)字段,如標本采集人、采集時間、采集號、省份、市縣、鑒定名稱、接受名、屬、科、生境、海拔、經緯度等信息。標本數據庫覆蓋中國包括港澳臺在內的34個?。▍^(qū)、市)以及2 217個縣,占全國行政區(qū)劃2 377個縣的93%(國家基礎地理信息系統(tǒng)http://nfgis.nsdi.gov.cn/nfgis/chinese/c_xz.htm)。
1.4 物種采集強度為薄弱的界定
本文把標本量少于5份(標本份數≤4)的物種定義為采集薄弱物種。
1.5 縣級物種采集完整程度分析
利用物種累積曲線(species accumulation curve,SAC)的彎曲程度來表示不同地理單元的物種采集完整程度,(Gotelli & Colwell, 2001; 陽文靜, 2013)。其計算方法為對每個地理單元中的樣本進行重復抽樣,抽取N個個體,計算這N個個體所包含的平均物種數量。通過計算,抽取標本量達到90%物種的標本比例開始計算隨標本數增加的物種累計曲線的平均斜率,即每增加一份標本,平均增加的物種數,來表示該地理單元的取樣完整程度。斜率接近0時,表明該地理單元的取樣趨于完整;斜率接近1時,表明該地理單元取樣很不完整。根據Yang等(2014),對斜率定義閾值為0.05,當平均斜率值大于0.05,認為該地理單元的采集程度較為完整,反之則采集程度不完整。
所有統(tǒng)計分析都在OriginPro 9.0軟件中完成,地圖制圖在ArcGIS 10.4.1軟件中完成。
2 結果與分析
2.1 采集時間分析
中國植物標本最早采集始于18世紀(王印政等,2004),據標本數據庫在19世紀末出現第一個采集高峰,其中1885年的采集數量最多,達4 510份。19世紀末20世紀初在中國采集的植物標本主要由歐美俄等國牧師和外交官進行,標本主要存放于中國境外。20世紀以后采集的標本主要形成4個高峰,分別是20世紀30年代、60年代、80年代和21世紀初(圖1)。第一個采集高峰在20世紀30年代,其中1935年采集量最高,標本量達123 267份,這一采集高峰代表近代中國植物學研究的興起,是中國植物分類學眾多開拓者們艱苦卓絕的標本采集活動的成果,同時還有不少外國采集者的參與和貢獻;第二個采集高峰在1958年前后,其中1958年采集量最高,標本量達523 807份;第三個采集高峰在20世紀80年代,其中1983年采集量最高,標本量達181 122份;在2013年前后形成了第四個采集小高峰,其中2013年采集量最高,標本量達87 127份。
新中國成立后,國家為調查國內自然資源本底,組織開展了多次大型綜合及單項科考活動,采集大量標本,形成50至90年代的第二個和第三個采集高峰。例如,黃河中游水土保持考察隊(1954—1957)采集標本3萬余號,全國野生經濟植物資源普查(1959—1960)在全國共采集標本約20萬號,青藏綜合考察隊(1973—1976)共采集標本1.5萬余號,橫斷山地區(qū)綜合科學考察隊(1981—1983)共采集標本約4萬號等(王印政等,2004)。進入21世紀后,國家中醫(yī)藥管理局從2011年起組織實施了第四次全國中藥資源普查,啟動10個省205個縣的中藥資源普查試點(黃璐琦等,2012),再次迎來了這個時期標本采集的小高峰,從而形成了第四個采集高峰。
中國目前有活力的220余家標本館共計館藏2 100余萬份標本(高等植物、藻類及菌物標本)(覃海寧等,2019),其中大部分為中國學者在20世紀50年代后獨立搜集。戴邁凡等(2018)對《中國植物志》學名發(fā)表年代統(tǒng)計結果表明,中國植物描述發(fā)表出現兩個高峰,20世紀初至40年代和80、90年代;后一高峰延續(xù)時間短而描述新物種數量多。這說明大部分中國植物分類研究是在20世紀50年代之后由中國學者完成的。
2.2 采集地分析
2.2.1 省級和縣級采集情況分析
對標本數據庫統(tǒng)計的結果顯示,標本采集覆蓋了中國包括港澳臺在內的34個?。▍^(qū)、市)(圖2)。其中,采集量達100萬份的只有云南和四川兩省,分別為111萬和147萬(圖2,表2)。云南和四川地處中國西南地區(qū),是國內公認的植物物種最為豐富的省份,也是歷來吸引最多植物采集人(隊)前往調查研究的省份。據最新統(tǒng)計結果,2000—2019年間,云南、廣西和四川位列發(fā)表新物種和新記錄物種數量最多的3個?。▍^(qū)), 僅云南就發(fā)表了1 164個植物新物種和230個新記錄物種,分別占到同期全國總量的四分之一和三分之一(Du et al., 2020)。
標本采集量在10萬份以下的省份中,面積較大的省份有山東、黑龍江、吉林和遼寧。王印政等(2004)研究發(fā)現,新中國成立后山東省的標本采集主要存放于山東師范大學生命科學學院植物標本室(SDNU)及山東大學生命科學學院植物標本室(JSPC)。然而,SDNU尚未開展植物標本數字化,JSPC
館藏量為1.3萬份(覃海寧等,2019),已數字化了三分之一。標本數據庫中東三省數字化標本共有25.6萬份,包括來自中國科學院沈陽應用生態(tài)研究所東北生物標本館(IFP)的18萬份。覃海寧等(2019)研究發(fā)現,IFP館藏標本達60萬份。顯然,由于東三省植物標本數字化率偏低的緣故,因此本庫中數據與實際館藏量存在一定差距。建議東三省標本館成為今后開展數字化工作的重點地區(qū)之一。
通過對標本數據庫的2 164個縣的統(tǒng)計,得到平均每個縣的標本量為2 678份,物種數為482種。標本采集量前20縣共來自7個?。▍^(qū)、市),其中9個縣位于云南,5個縣位于四川(表3)。標本采集量最多的前三個縣(市、區(qū))分別是四川省的峨眉山市、重慶市的南川區(qū)和四川省的康定市,標本量分別為17.8萬份、16.6萬份和6.3萬份;含物種數最高的前三個縣是重慶市的南川區(qū)、四川省的峨眉山市和云南省的貢山獨龍族怒族自治縣,含物種數分別為5 022種、4 460種和3 993種(表3)。標本庫中有9%(n=216)的縣沒有標本記錄,如山東的高青縣、夏津縣等;有22%(n=527)的縣標本量不到100份,有31%(n=731)的縣物種數不到100種,如吉林圖們市的標本量為63份31種、江蘇泰州市的標本量為25份23種 (圖3)。
由進一步分析可知,這些采集量位列前茅的縣,大多為著名的生物多樣性高的地區(qū),同時是宗教圣地、旅游名勝所在地,或大專院校長期定點實習采集點, 或某采集人/隊長期采集地。如橫斷山地區(qū)綜合科學考察隊(1981—1983)對云南四川境內的幾個縣采集了相當數量的標本,此后這些縣還分別開展了綜考,采集了大量標本; 針對佛教圣地峨眉山和金佛山的采集主要由四川大學完成,如1951—1957年間,在方文培教授(其個人在峨眉山采集標本超過1萬份)的主持下派出的金佛山植物資源考察隊(1986)以及在康定、二郎山等地采集的川西隊(1963)等采集活動。根據標本數據庫信息統(tǒng)計,標本采集在500份以上的采集人或采集隊,在峨眉山地區(qū)采集的有38人(隊),金佛山地區(qū)有17人(隊)。
我們將各個?。▍^(qū)、市)和縣級的物種數量和標本數量進行了Pearson相關分析,相關系數分別為0.95和0.75(P<0.001),說明物種的數量和標本的采集量成正相關。
2.2.2 縣級物種采集完整性評估
對2 217個縣(占全國2 377個縣的93%)的物種采集完整性進行評估,Slope平均值為0.225。其中,Slope小于0.05的縣僅有4%(n=93),表明這些縣的物種采集較為全面,如四川省的峨眉山市(Slope=0.007)、重慶市的南川區(qū)(Slope=0.01)等(圖4)。Slope小于0.05的縣與陽文靜(2013)的相比少了100多個,推測是其根據文獻補充植物分布記錄后帶來的結果差別,在一定程度上補充了數字化標本的數據未覆蓋的信息。96%的縣Slope大于0.05,即96%的縣屬于采集不完整;斜率較大的縣主要集中在河北、山東、安徽北部;有160個縣(7%,分布在21個省份)沒有標本記錄。將采集完整性指數在縣級地圖上進行可視化(圖4),可以明顯看出,在縣級水平上,各地區(qū)的物種采集完整程度極度不平衡。
2.3 采集類群分析
2.3.1 類群覆蓋程度 標本數據庫中科、屬和種的標本覆蓋情況見表4。被子植物物種數量是高等植物各類群中的“大戶”,其標本數量也是最大的,并且類群覆蓋度上,其科、屬和種的覆蓋度均在90%以上。裸子植物是4個類群中覆蓋率最高的類群,科、屬和種的覆蓋率均在96%以上;蕨類植物的科、屬和種的覆蓋率均在90%以上;苔蘚植物的科和屬覆蓋率在90%以上,但種僅覆蓋了81%。
2.3.2 不同分類水平標本采集情況 對高等植物4個類群的科、屬和種的標本量前10名進行統(tǒng)計(表5)。
在科級水平上,平均標本量為21 365份。標本數據庫中標本數量超過21 365份的科有98個, 占總科數的21%,標本總量達8 805 603份,占標本數據庫總量的89%。標本量在10萬份以上的科有24個,標本總量達5 142 754份,占標本庫總量的52%,除蕨類植物的水龍骨科(Polypodiaceae)和鱗毛蕨科(Dryopteridaceae)外,其余22科均為被子植物(表5)。被子植物中科的標本數量排名前三的分別是薔薇科(Rosaceae)、菊科(Asteraceae)和禾本科(Poaceae),標本量均在50萬份以上;裸子植物中科的標本數量排名前三的分別是松科(Pinaceae)、 柏科 (Cupressaceae)和紅豆杉科(Taxaceae),標本量均在2萬份以上;苔蘚植物中科的標本數量排名前三的分別是叢蘚科(Pottiaceae)、羽蘚科(Thuidiaceae)和青蘚科(Brachytheciaceae),標本量均在1萬份以上。采集量排名靠前的科同時也是各大類群中的物種數量大的科,如裸子植物的松科和柏科,被子植物的菊科、禾本科、薔薇科和唇形科(Lamiaceae)。
在屬級水平上,平均標本量為2 392份。標本數據庫中標本數量超過2 392份的屬有840個,標本總量達7 944 795份,占標本庫總量的80%。標本采集量在1萬份以上的屬有211個,占總屬數5%,標本總量達5 114 353份,占標本庫總量的51%,其中被子植物有190個屬,蕨類植物18個屬,裸子植物3個屬。含5萬份標本以上的屬有21個,全部為被子植物,多為大屬或含較多廣布種的屬,其中雙子葉植物18個屬,薔薇科4屬為最多,單子葉植物僅有薹草屬(Carex)和菝葜屬(Smilax)兩個屬。排名前五的屬分別是杜鵑花科的杜鵑花屬(Rhododendron)、蓼科的蓼屬(Polygonum)、五?;频那v蒾屬(Viburnum)、薔薇科的懸鉤子屬(Rubus)和李屬(Prunus),標本采集量均在8萬份以上。裸子植物排名前五的屬分別是松科松屬(Pinus)、柏科刺柏屬(Juniperus)、松科云杉屬(Picea)、紅豆杉科三尖杉屬(Cephalotaxus)和紅豆杉屬(Taxus),標本采集量均在8 000份以上。采集量排名靠前的屬同樣多為物種數量多的大屬(如杜鵑花屬)和常見屬(如蓼屬和松屬),以及觀賞花卉(如莢蒾屬)。
在種級水平上,平均標本數量為241份。標本數大于241份的有7 129種,占總種數的22%,隸屬于254科,占總科數的55%,這些物種所涉及的標本份數共為6 468 959份,占整個標本庫的84%。種的標本采集量排前10名見表5,其中前三分別是薔薇科的梅(Prunus mume,26 422份)、禾本科的稻(Oryza sativa,20 506份)、豆科的大豆(Glycine max,15 985份)。標本采集量較多的物種多為觀賞植物、栽培植物或同時為廣布植物。
2.3.3 類群采集薄弱分析
(1)缺乏標本記錄的植物類群
標本采集在科級的覆蓋度較好,僅有3個科缺乏標本記錄,占全部科的0.6%,包含疑似滅絕植物白玉簪(Corsiopsis chinensis)所在的白玉簪科(Corsiaceae)(覃海寧等,2017)。在屬級水平上,無標本采集的屬為74個屬(表4), 占全部屬的1.8%。其中被子植物有34個屬無標本采集,無標本屬最多的科是蘭科,有7個屬缺乏標本記錄,大都為近些年發(fā)表的新屬,如Singchia(Liu & Chen, 2009)、Shizhenia和Gennaria(金偉濤等, 2015);十字花科有6個屬,有的該屬為單種屬較難采集,如Atelanthera;菊科有4個屬,即Schischkinia、Pseudohandelia、Microcephala和Frolovia,據《中國植物志》(1987)記載,大都分布在新疆,并且植株矮小,較難采集。無標本的屬大多集中在采集量在10萬份以上的物種數量大的科,說明這些大科仍舊需要在分類學上開展更多的研究,同時各館仍需加強模式標本的數字化工作。
在種級水平上,無標本采集的種為3 250種,占全部物種的9%,其中被子植物2 445種、裸子植物11種、蕨類植物212種、苔蘚植物582種。有623個無標本物種是在2007年之后發(fā)表的。無標本物種數較多的科,仍集中在物種數量和標本數量較大的科,如禾本科、蘭科、豆科和菊科(表6),其中禾本科無標本物種數最多,有225種,涉及66個屬。無標本的物種所在的科或者是野外分類較難的類群,如禾本科和莎草科;或者是近些年發(fā)表的新種等狹域分布物種,如Phyllostachys purpureociliata G. H. Lai(2013)、Senecio changii C. Ren & Q. E. Yang(2016)等。
依據“中國高等植物受威脅物種名錄”(覃海寧等,2017),無標本物種中有16種為疑似滅絕植物;331種為受威脅物種,占全部受威脅物種及無標本物種的10%,其中有197個物種屬于狹域分布物種,僅分布在1~3個縣范圍內。當用Flora of China(Wu et al., 2013b)認可的197個特有屬(含200余種)的物種名錄與標本數據庫物種名稱進行匹配時發(fā)現,有一半以上物種缺乏標本,除學名歸并及拼寫錯誤之外,缺乏標本記錄的比例仍然不低。
(2)標本數小于5份的植物類群
根據標本數據庫,有4 698個物種標本數量過少,標本份數在5份以下(標本份數≤4),涉及275科1 325屬,約十分之一(12.9%)的物種是采集薄弱的,其中有404個物種的標本僅為模式標本。包括被子植物3 835種、裸子植物7種、蕨類植物194種、苔蘚植物662種。僅有1份標本的物種數為1 507個,涉及195科690屬,占標本庫物種數的4.1%,其中被子植物1 202種、裸子植物3種、蕨類植物59種、苔蘚植物243種。
23個科的物種中一半以上標本份數在5份以下(表7),除單型科以及物種數量較少的科外,還包括一些60%左右的物種都是狹域分布的科如秋海棠科、苦苣苔科等。標本份數在5份以下的物種中,有565個物種是受威脅物種(覃海寧等,2017),其中分布地點僅為1~3個的狹域物種有425個,約占采集薄弱的物種數的十分之一。
3 討論與結論
3.1 中國植物標本采集和研究工作主要在20世紀50年代后由中國作者完成,中國植物標本采集有力地支撐著中國植物分類學的發(fā)展
陽文靜(2013)通過對650萬條標本數據的統(tǒng)計認為我國有3個采集高峰,這三個采集高峰與本文的前三個采集高峰一致,但其所用數據庫時間范圍僅到2009年,而根據本文的標本數據庫第4個采集小高峰是在2013年前后形成。我國植物標本的4個采集高峰真實地反映了我國植物學發(fā)展以及植物標本采集的幾個重要階段,并與政府在國家發(fā)展的不同階段所執(zhí)行的方針政策相呼應。第2和第3個高峰形成于20世紀50至90年代,同時大部分中國植物分類研究也是在20世紀50年代之后完成的,表明中國植物標本采集和研究工作主要在20世紀50年代后由中國學者完成。各國標本采集積累量, 與一個國家植物資源的豐富程度和植物學的研究水平成正比(王文采, 2021)。中國植物標本的采集在短短一百年間,就積累了2 000多萬份,平均不到30年就形成了一個采集高峰,并且在2000年之后還有采集高峰,說明中國的標本采集與資源調查工作一直在持續(xù)進行,有力地支撐中國植物分類學的發(fā)展,給植物分類學研究提供了豐厚的養(yǎng)分。我國的植物標本數字化工作在后植物志時代,繼續(xù)引領國際潮流,對世界植物分類學的發(fā)展持續(xù)發(fā)揮重要作用。
3.2 我國標本采集空間覆蓋度在省級較好,縣級標本采集強度和不完整程度極度不平衡
東北平原地區(qū)、華北平原地區(qū)、長江中下游平原及四川盆地等低海拔地區(qū)的標本物種采集完整性嚴重不足。而山區(qū)如橫斷山區(qū)、云貴高原、秦嶺、武夷山等生物多樣性熱點地區(qū)(黃繼紅等, 2014)均有相對較高的標本采集量和較好的物種采集完整性。這個結果和陽文靜(2013)的研究結果基本是一致的。造成縣級標本采集不平衡現象的主要原因有兩個:一方面可能受到采集者偏好(Daru et al., 2018)的影響,如平原地區(qū)相對來說多為農耕區(qū),生境異質性較低,物種多樣性較低,而我國的標本采集活動大多為專業(yè)采集,植物學家相對不重視物種多樣性較低地區(qū)的采集;山區(qū)由于海拔和不同的地理環(huán)境差異導致的生境異質性較高,物種的多樣性非常高,植物學家更傾向于去山區(qū)進行植物采集。另一方面可能與采集地區(qū)的知名度相關,如我國一些宗教圣地所處的名山大川,經常吸引植物學家進行采集;此外,還與國家方針政策,植物學家所獲科研項目直接相關,如國家部署的資源調查項目等。
3.3 我國標本采集類群覆蓋率高,但近五分之一的物種采集不足
我國標本采集類群覆蓋率高,但苔蘚植物相對于維管植物的采集強度較低。一方面由于研究苔蘚植物的專家較少,并且苔蘚植物本身矮小使其不易被發(fā)現以及高的生境質量要求使其不易被采集,而且鑒定苔蘚標本需要花費更多的時間,導致苔蘚植物的采集強度及鑒定數量低于其他類群。物種數較多的科,通常標本采集量也較多,并且標本的采集量與植物類群的常見程度緊密相關。物種中采集標本量較多的種,大多是栽培、廣布和經濟植物,這與該物種的經濟價值、采集的便利程度及物種分布幅度有明顯的關聯(lián),上述結論與陽文靜(2013)的研究結果基本一致。另一方面,在類群數字化空缺上,盡管科級采集覆蓋度較好,但在科級水平上仍有如白玉簪科等類群存在采集空白的情況。近十分之一的物種標本還沒有被數字化, 這些物種大多集中在被子植物和苔蘚植物中,其中苔蘚植物的種級缺乏率最高。近五分之一的物種標本是采集不足的。
3.4 基于標本數字化建立的數據庫對物種多樣性的完整性分析仍有一定的局限性我們在運用千萬數量級的數據進行時空及類群的現狀分析時發(fā)現,盡管使用海量的標本數據對我國植物采集情況進行分析,所得到的結論仍可能與真實的情況有所差異,這主要取決于數據庫的完整程度, 因為其完整程度對物種編目的完
整性影響非常大(Qian et al.,2018),而采集地理偏差也會導致分析得出的結論不一定真實(Yang et al., 2014;Daru et al., 2018)。之所以造成這種差異,可能主要存在如下因素:(1)類群方面的處理。一方面,數字化標本的數據絕大部分由人工錄入,因此可能存在各種問題導致名稱的錄入錯誤,從而在我們對標本名稱進行校對時,可能會有一些物種因為錄入錯誤而被剔除,從而導致一些類群形成采集空缺;另一方面,由于館藏標本的鑒定通常滯后于分類學的研究,很多類群在最新的名錄系統(tǒng)中已經被處理,然而標本上卻未及時更新,以致沒有被統(tǒng)計到。盡管我們考慮到這個情況,使用的是2017年的生物物種名錄,但是難免還會出現類似的問題。另外,在2017年之后發(fā)表的新種的標本采集情況,這里沒有進行類群統(tǒng)計。(2)我國標本數字化程度的不均衡。我國標本數字化的程度與參與數字化項目的標本館數量、運行狀況及參與程度直接相關。盡管本文利用了數千萬條標本數據進行分析,然而覃海寧等(2019)研究發(fā)現,這些標本數據僅占我國館藏標本的約50%,各館仍有大量的館藏標本需要進行數字化,以填補采集空白和薄弱的類群和地區(qū)。(3)標本的采集在空間和類群上的分析,沒有結合時間分布來進行充分討論。未來可以考慮分析在一些時間節(jié)點之后,哪些物種和地區(qū)沒有新的標本,據此來布局標本采集的重點。
總體來說,目前中國植物標本數字化工作卓有成效,在類群和時空的覆蓋度上都達到了一定的規(guī)模。今后的標本數字化工作在繼續(xù)挖掘館藏標本的同時,可以考慮:一方面開展對現有數字化標本信息再審核及補充工作,繼續(xù)面向全國標本館進行館藏標本數字化,尤其是加強模式標本及采集薄弱地區(qū),如東北地區(qū)館藏標本數字化,以提高標本數據所承載的時間、空間和類群信息的覆蓋度,同時籍此提高館藏標本的鑒定比例,促進植物分類學的發(fā)展;另一方面需要加強與歐美大館的信息共享以獲取更多早期采自中國的歷史標本信息。
本文通過對我國目前為止標本收集最全的標本數據庫在時間和空間分布以及類群采集方面的分析,了解了我國植物標本在時空、類群方面的采集特點及空缺,所得到的標本采集的未來參考方向,對于國家植物標本資源庫生物標本精準采集工作具有重要的參考意義。對采集空白以及采集薄弱的物種進行精準采集,有助于人們了解該物種在目前的野外生存狀況,進而有效開展相應的生物多樣性評估和采取保護措施;對采集空白及薄弱的地區(qū)進行精準采集,可以增加人們對這些地區(qū)的植物資源情況的了解且有助于發(fā)現新類群。因此,在開展生物標本精準采集時,需要結合分類修訂的最新工作,針對標本資源庫中空白類群和地區(qū)進行精準采集;之后在空缺和薄弱的名單中,按照物種系統(tǒng)學及分類學上的重要意義,以及保護上的重要意義,也可結合其經濟上的重要價值進行篩選,如對根據特有屬、單種屬或寡種屬中尤其是木本植物、國家發(fā)布的最新《國家重點保護野生植物名錄》、新近發(fā)表的以及公眾關心的一些物種進行精準采集。通過精準采集的科學布局、合理的資源配置,未來國家植物標本資源庫將進一步增強實體標本館能力建設,提高數字化標本質量,以期更好地服務科學及社會。
參考文獻:
BAO SY, MAO PY, YUAN S, 1995. A brief history of plant collection in Yunnan: 1919-1950 [M]. Beijing: Science and Technology of China Press.? [ 包士英, 毛品一, 苑淑秀, 1995. 云南植物采集史略: 1919-1950 [M]. 北京: 中國科學技術出版社.]
CHASE MW, REVEAL JL, 2009. A phylogenetic classification of the land plants to accompany APGIII [J]. Bot J Linn Soc, 161: 122-127.
CHEN C, 2002. China administrative divisions history handbook [M]. Beijing: Cartographic Publishing Press: 1-440. [陳潮, 2000. 中國行政區(qū)劃沿革手冊 [M]. 北京: 地圖出版社: 1-440.]
CHRISTENHUSZ MJ, REVEAL JL, FARJON A, et al., 2011. A new classification and linear sequence of extant gymnosperms [J]. Phytotaxa, 19 (1): 55-70.
DAI MF, XIANG JP, LIU JA, et al.,2018. Composition Chinese plants based on analysis on specimens and the possibility of discovering new species [J]. Front Data Comput, 9(5): 27-35. [戴邁凡, 向杰平, 劉吉安, 等, 2018. 基于標本探究中國植物的組成變化趨勢和新物種發(fā)現的可能性 [J]. 科研信息化技術與應用, 9(5): 27-35.]
DARU BH, PARK DS, PRIMACK RB, et al., 2018. Widespread sampling biases in herbaria revealed from large-scale digitization [J]. Newphytol, 217(2): 939-955.
DU C, LIAO S, BOUFFORD DE, et al., 2020. Twenty years of Chinese vascular plant novelties, 2000 through 2019 [J].Plant Divers, 42(5): 393-398.
FREY W, STECH M, FISCHER E, 2009. Bryophytes and seedless vascular plants? [M]. Stuttgant: Gebr. Brontraeger Verlagsbuchhandlung: 1-263.
GOTELLI NJ, COLWELL RK, 2001. Quantifying biodiversity: procedures and pitfalls in the measurement and comparison of species richness? [J]. Ecol Lett, 4(4): 379-391.
GUI LN, LI CY, WANG KN, et al., 2018. Assessment of collection densities of hard-to-collect plant taxa through specimen data and the shortcomings of conducting related studies [J]. Front Data? Comput, 49(5): 41-46.? [桂略寧, 李辰昱, 王康濃, 等,? 2018. 通過標本數據評估難以采集的植物類群采集密度及進行相關研究的缺陷 [J]. 科研信息化技術與應用, 49(5): 41-46. ]
HEDRICK BP, HEBERLING JM, MEINEKE EK, et al.,2020. Digitization and the future of natural history collections [J]. BioScience, 70(3): 245-251.
HUANG JH, MA KP, CHEN B, 2014. Diversity and geographical distribution of endemic seed plants in China [M]. Beijing: Higher Education Press: 65-78. [黃繼紅,馬克平, 陳彬, 2014. 中國特有種子植物的多樣性及其地理分布 [M]. 北京: 高等教育出版社: 65-78.]
HUANG LQ, ZHAO RH, CHEN SL, et al., 2012. Progress of the Fourth National Census of Chinese Medicine Resources Preparation and Pilot Work [J]. Mod Chin Med, 14(1): 13-15. [黃璐琦, 趙潤懷, 陳士林, 等, 2012. 第四次全國中藥資源普查籌備與試點工作進展 [J]. 中國現代中藥, 14(1): 13-15.]
IGNNBSM, 1983. China Gazetteer [M]. Beijing: Cartographic Publishing Press: 1-313. [國家測繪局地名研究所, 1983. 中國地名錄 [M]. 北京: 中國地圖出版社: 1-313.]
JAMES SA, SOLTIS PS, BELBIN L, et al., 2018. Herbarium data: Global biodiversity and societal botanical needs for novel research [J]. Appl Plant Sci, 6(6325): e01024.
JIANG CY, YU WX, YANG T, et al., 2018. Analysis of the current status of national botanical specimen collection and prediction of collection trends based on specimen data in Chinese collections [J]. Front Data Comput, 49(5): 94-101.? [姜承勇, 余衛(wèi)星, 楊婷等, 2018. 基于中國館藏標本數據分析全國植物標本采集現狀及采集趨勢預測 [J]. 科研信息化技術與應用, 49(5): 94-101.]
JIN WT, XIANG XG, JIN XH, 2015. Generic delimitation of Orchidaceae from China: current situation and perspective [J]. Biodivers Sci, 23(2): 237-242. [金偉濤, 向小果, 金效華, 2015. 中國蘭科植物屬的界定: 現狀與展望 [J]. 生物多樣性, 23(2): 237-242.]
JOHNSON KG, BROOKS SJ, FENBERG PB, et al., 2011. Climate change and biosphere response: Unlocking the collections vault [J]. BioScience, 61(2): 147-153.
LAI GH, 2013. New species of the genus Phyllostachys (Gramineae: Bambusoideae) from Anhui Province, China [J]. Plant Divers, 35(2): 131-140.
LANE MA, 1996. Roles of natural history collections [J]. Ann Mo Bot Gard, 83(4): 536-545.
LIU ZJ, CHEN LJ, 2009. Singchia and Gunnaria, two new genera of Orchidaceae [J]. J Syst Evol, 47(6): 599-604.
MA KP, LOU ZP, SU RH, 2010. Review and prospects of biodiversity research in chinese academy of sciences [J].Bull Chin Acad Sci, 25(6): 634-644. [馬克平, 婁治平, 蘇榮輝, 2010. 中國科學院生物多樣性研究回顧與展望 [J]. 中國科學院院刊, 25(6): 634-644.]
NUALART N, NEUS I, SORIANO I, et al., 2017. Assessing the relevance of herbarium collections as tools for conservation biology [J]. Bot Rev, 83(3): 1-23.
OCONNELL AF, GOLBERT AT, HATFIELD JS, 2004. Contribution of natural history collection data to biodiversity assessment in national parks [J]. Conserv Biol, 18(5): 1254-1261.
PAGE LM, MACFADDEN BJ, FORTES JA, et al., 2015. Digitization of biodiversity collections reveals biggest data on biodiversity [J]. BioScience, 65(9): 841-842.
PONDER W, CARTER G, FLEMONS P, et al., 2001. Evaluation of museum collection data for use in biodiversity assessment [J]. Conserv Biol, 5(18): 1523-1739.
PYKE GH, EHRLICH PR, 2010. Biological collections and ecological/environmental research: a review, some observations and a look to the future [J]. Biol Rev, 85(2): 247-266.
QIAN H, DENG T, BECK J, et al., 2018. Incomplete species lists derived from global and regional specimen-record databases affect macroecological analyses: A case study on the vascular plants of China [J]. J Biogeogr, 45(12): 2718-2729.
QIN HN, LIU HY, HE Q, et al., 2019. Index Herbariorum Sinicorum [M]. 2nd ed. Beijing: Science Press: 1-352. [覃海寧, 劉慧圓, 何強, 等, 2019. 中國植物標本館索引 [M]. 2版. 北京: 科學出版社: 1-352.]
QIN HN, YANG Y, DONG SY, et al., 2017. Threatened species list of Chinas higher plants [J]. Biodivers Sci, 25(7): 696-744.? [覃海寧, 楊永, 董仕勇, 等, 2017. 中國高等植物受威脅物種名錄 [J]. 生物多樣性, 25(7): 696-744.]
REN C, TONG TJ, HONG Y, et al., 2016. Seneciochangii (Asteraceae: Senecioneae), a new species from Sichuan, China [J]. PLoS ONE,? 11(4): e0151423.
ROBBIRT KM, DAVY AJ, HUTCHINGS MJ, et al., 2011. Validation of biological collections as a source of phenological data for use in climate change studies: A case study with the orchid Ophryssphegodes [J]. J Ecol, 99(1): 235-241.
SUAREZ AV, TSUTSUI ND, 2004. The value of museum collections for research and society? [J]. BioScience, 54(1): 66-74.
The Biodiversity Committee of Chinese Academy of Sciences, 2017. Catalogue of life China: 2017 annual checklist? [CD]. Beijing: Sciences Press.? [中國科學院生物多樣性委員會, 2017. 中國生物物種名錄2017版 [CD].? 北京:? 科學出版社.]
THIERS BM, 2021.The Worlds Herbaria 2021: A Summary Report Based on Data from Index Herbariorum(Issue 6.0) [R]. http://sweetgum.nybg.org/science/ih/.
WANG KL, CHEN JX, FAN X, 2018. Analysis of geographical deviations in the collection of specimen records of Rosaceae on the national specimen resource sharing platform [J]. Front Data Comput, 49(5): 54-63.? [王凱莉, 陳嘉欣, 范雪, 2018. 國家標本資源共享平臺薔薇科植物標本記錄采集地理偏差分析 [J]. 科研信息化技術與應用, 49(5): 54-63. ]
WANG LS, CHEN B, JI LQ, et al., 2010. Progress in biodiversity informatics [J]. Biodivers Sci, 18(5): 429-443.? [王利松, 陳彬, 紀力強, 等, 2010. 生物多樣性信息學研究進展 [J]. 生物多樣性, 18(5): 429-443.
WANG WC, 2021. Global plants introduction [M]. Beijing: Beijing Publishing Group Co., Ltd, Beijing Press: 23. [王文采, 2021. 世界植物簡志 [M]. 北京: 北京出版集團, 北京出版社: 23.]
WANG YZ, QIN HN, FU DZ, 2004. A brief history of Chinese plant collection? [M]// WU ZY,CHEN XQ. Flora Reipublicae Popularis Sinicae: Tomus 1. Beijing: Sciences Press: 659-703. [王印政, 覃海寧, 傅德志, 2004. 中國植物采集簡史 [M]//吳征鎰, 陳心啟. 中國植物志: 第一卷. 北京: 科學出版社: 659-703.]
WEN J, ICKERT-BOND SM, APPELHANS MS, et al., 2015. Collections-based systematics: Opportunities and outlook for 2050 [J]. J Syst Evol, 53(6): 477-488.
WU CY, RAVEN PH, HONG DY, 2013a. Flora of China: Vol. 1 [M]. Beijing: Science Press; St. Louis: Missouri Botanical Garden Press: 1-254.
WU CY, RAVEN PH, HONG DY, 2013b. Flora of China: Vol. 2-3 [M]. Beijing: Science Press; St. Louis: Missouri Botanical Garden Press.
XU ZP, CUI JZ, QIN HN, 2012. The concept of building Chinas biodiversity e-Science platform [J]. Biodivers Sci, 18(5): 480-488. [許哲平, 崔金鐘, 覃海寧, 2010. 中國生物多樣性e-Science平臺建設構想 [J]. 生物多樣性, 18(5): 480-488.]
XU ZP, QIN HN, MA KP, et al., 2012. Research on the management, sharing and application of natural science and technology resources: The case of China Digital Herbarium [J]. Chin Sci Technol Resour Rev, 44(1): 27-33. [許哲平, 覃海寧, 馬克平, 等, 2012. 自然科技資源的管理、共享和應用研究——以中國數字植物標本館為例 [J]. 中國科技資源導刊, 44(1): 27-33.]
YANG WJ, MA KP, KREFT H, 2014. Environmental and socio-economic factors shaping the geography of floristic collections in China [J]. Glob Ecol Biogeogr, 23(11): 1284-1292.
YANG WJ, 2013. Geographical bias in plant collections in China and its impact on the analysis of biodiversity patterns [D]. Beijing: Institute of Botany, Chinese Academy of Sciences: 1-57. [陽文靜, 2013. 中國植物采集的地理偏差及其對生物多樣性格局分析的影響 [D]. 北京: 中國科學院植物研究所: 1-57.]
YANG Y, 2012. Holdings of type specimens of plants in herbaria of China [J]. Biodivers Sci, 20(4): 512-516.? [楊永, 2012. 我國植物模式標本的館藏量 [J]. 生物多樣性, 20(4): 512-516.
YIN ZL, LIU YQ, XIAO C, 2018. Geographical deviation of orchid specimen record collection and its environmental factor interpretation in the national specimen resource sharing platform [J].? Front Data? Comput, 49(5): 64-71.? [尹朝露, 劉雨晴, 肖翠, 2018. 國家標本資源共享平臺蘭科植物標本記錄采集地理偏差及其環(huán)境因子解釋 [J]. 科研信息化技術與應用, 49(5): 64-71.]
ZHANG YX, REN M, XIAO C, 2018. Analysis of geographic deviation in the collection of Chinese Rhododendronaceae specimens based on data from the National Specimen Resource Sharing Platform [J]. Front Data? Comput, 49(5): 72-83.? [張玉雪, 任敏, 肖翠, 2018. 基于國家標本資源共享平臺數據的中國杜鵑花科植物標本采集地理偏差分析 [J]. 科研信息化技術與應用, 49(5): 72-83.]
(責任編輯 蔣巧媛 鄧斯麗)