張明旭 陳 元 席琳?qǐng)D雅 張 茹 畢雅瓊 張春紅,5,6,7 吳濤濤 李旻輝,,,5,6,7*
(1.包頭醫(yī)學(xué)院,包頭 014040;2.內(nèi)蒙古醫(yī)科大學(xué),呼和浩特 010110;3.錫林郭勒盟蒙醫(yī)醫(yī)院,錫林浩特 026000;4.內(nèi)蒙古自治區(qū)中醫(yī)藥研究所,呼和浩特 010020;5.內(nèi)蒙古自治區(qū)特色道地藥材資源保護(hù)與利用重點(diǎn)實(shí)驗(yàn)室,包頭 014040;6.中藥資源學(xué)重點(diǎn)實(shí)驗(yàn)室,包頭 014040;7.道地藥材蒙古黃芪種植與開(kāi)發(fā)內(nèi)蒙古自治區(qū)工程研究中心,包頭 014040;8.內(nèi)蒙古天養(yǎng)浩恩奇爾中藥材科技開(kāi)發(fā)有限公司,包頭 014200)
大數(shù)據(jù)指的是結(jié)構(gòu)龐大、多樣復(fù)雜,難以存儲(chǔ)、分析和進(jìn)一步可視化處理的海量數(shù)據(jù)集,它們被總結(jié)出具有以下四個(gè)特點(diǎn):數(shù)據(jù)量大、實(shí)時(shí)性強(qiáng)、數(shù)據(jù)的種類(lèi)多樣、數(shù)據(jù)是有價(jià)值的[1]。大數(shù)據(jù)時(shí)代的到來(lái)是信息技術(shù)產(chǎn)業(yè)一次重要的變革,將為人類(lèi)社會(huì)的發(fā)展帶來(lái)不可估量變化。人們可以通過(guò)大數(shù)據(jù)挖掘出在以往獲得的數(shù)據(jù)中所無(wú)法獲得的有價(jià)值的信息,進(jìn)一步為社會(huì)的發(fā)展提供科學(xué)支持[2-3]。與此同時(shí),計(jì)算機(jī)科學(xué)的發(fā)展進(jìn)一步促進(jìn)了大數(shù)據(jù)的蓬勃發(fā)展,大數(shù)據(jù)相關(guān)的分析技術(shù)已經(jīng)成為人們熟知的熱門(mén)技術(shù)并且與越來(lái)越多的學(xué)科進(jìn)行融合,而將其與中醫(yī)藥相關(guān)產(chǎn)業(yè)領(lǐng)域的結(jié)合,不僅可以有效挖掘疾病與中醫(yī)藥的內(nèi)在聯(lián)系,而且能夠有效加深對(duì)中醫(yī)藥的研究,加速中醫(yī)藥的國(guó)際化進(jìn)程,使其更好的造福于人類(lèi)健康事業(yè)[4]。
從中藥資源大數(shù)據(jù)的產(chǎn)生來(lái)說(shuō),一方面,來(lái)源于中藥資源應(yīng)用的歷史積累:在悠久的中華文化發(fā)展歷程中,同一種藥用植物,在不同地方、經(jīng)過(guò)不同的炮制方式、使用不同的藥用部位都會(huì)產(chǎn)生不同的療效,再加上對(duì)不同患者的辨證論治,積累了大量臨床使用的數(shù)據(jù)[5-7];另一方面,來(lái)源于中藥資源與其他科學(xué)技術(shù)的結(jié)合,中藥資源大數(shù)據(jù)集合了生態(tài)資源、醫(yī)療資源、經(jīng)濟(jì)資源、科技資源及文化資源等多學(xué)科的基礎(chǔ)數(shù)據(jù)[8]。因此,中藥資源產(chǎn)業(yè)符合大數(shù)據(jù)的基本特征。中藥資源大數(shù)據(jù)主要包括中藥資源種類(lèi)數(shù)目、物種分布情況、資源蘊(yùn)藏量、資源變化趨勢(shì)、栽培與野生情況、收購(gòu)量、需求量、供給量、藥材質(zhì)量及傳統(tǒng)應(yīng)用知識(shí)等相關(guān)的統(tǒng)計(jì)數(shù)據(jù)。通過(guò)將這些數(shù)據(jù)整合挖掘,發(fā)現(xiàn)其新的價(jià)值,對(duì)中藥資源的普查、評(píng)控、種植、流通、可持續(xù)化發(fā)展等方面具有重要意義[9]。
中藥資源大數(shù)據(jù)經(jīng)過(guò)悠久歷史的沉淀,在當(dāng)今現(xiàn)代科學(xué)的支持下會(huì)爆發(fā)一種新的生命力。王莎莎對(duì)基于R+Hadoop 中藥材大數(shù)據(jù)的分析及預(yù)測(cè)進(jìn)行了研究,在一定程度上解決了中藥大數(shù)據(jù)面臨的擴(kuò)展性問(wèn)題[10]。袁銀對(duì)基于植物照片大數(shù)據(jù)進(jìn)行深度學(xué)習(xí)算法分析的植物識(shí)別軟件進(jìn)行對(duì)比研究,這種大數(shù)據(jù)運(yùn)用方式可以很好的為藥用植物資源調(diào)查和中藥資源知識(shí)普及服務(wù)[11]。因此,了解如何進(jìn)一步研究對(duì)中藥資源數(shù)據(jù)進(jìn)行開(kāi)發(fā)利用與應(yīng)用管理,加大對(duì)該領(lǐng)域的關(guān)注具有的重要意義[12]。本文以中藥資源大數(shù)據(jù)的開(kāi)發(fā)應(yīng)用情況為例,總結(jié)了中藥資源大數(shù)據(jù)的數(shù)據(jù)來(lái)源、研究進(jìn)展和發(fā)展方向,并提出了相關(guān)的發(fā)展建議。這對(duì)全國(guó)中藥資源大數(shù)據(jù)發(fā)展具有參考價(jià)值,可以為進(jìn)一步促進(jìn)中藥資源產(chǎn)業(yè)開(kāi)發(fā)利用和中醫(yī)藥行業(yè)的健康發(fā)展提供指導(dǎo)。
建立中藥資源數(shù)據(jù)庫(kù)和大數(shù)據(jù)統(tǒng)籌分析平臺(tái)是管理和挖掘中藥資源信息的重要手段。通過(guò)建立中藥資源數(shù)據(jù)檔案,可以長(zhǎng)期積累大量有價(jià)值的數(shù)據(jù);另一方面,通過(guò)云計(jì)算大數(shù)據(jù)平臺(tái)的高效處理,發(fā)現(xiàn)其中蘊(yùn)藏的規(guī)律。兩者的結(jié)合可以為中藥資源管理機(jī)構(gòu)制定宏觀政策提供依據(jù),為保護(hù)中藥資源生物多樣性和實(shí)現(xiàn)綠色發(fā)展奠定基礎(chǔ)[13]。
數(shù)據(jù)庫(kù)的建立是中藥資源產(chǎn)業(yè)信息化發(fā)展的基礎(chǔ)。在中藥資源大數(shù)據(jù)發(fā)展的初期,主要由國(guó)家管理機(jī)構(gòu)建立中藥資源數(shù)據(jù)庫(kù):1988 年的國(guó)家藥品監(jiān)督局信息機(jī)構(gòu)建立的中藥文獻(xiàn)數(shù)據(jù)庫(kù)記載了大量的中藥資源文獻(xiàn)資料;由國(guó)家中醫(yī)藥局所屬機(jī)構(gòu)的國(guó)家中藥資源數(shù)據(jù)庫(kù),記載了我國(guó)大量的中藥資源和藥材分布的基礎(chǔ)數(shù)據(jù)[14];如今,經(jīng)過(guò)科研人員多年的研究發(fā)展,基于3S 技術(shù)的現(xiàn)代化空間數(shù)據(jù)庫(kù)和基于第四次全國(guó)中藥資源普查所建立的中藥資普查數(shù)據(jù)庫(kù)陸續(xù)建立起來(lái)。
3S 技術(shù)是空間信息分析的核心技術(shù),在中藥資源大數(shù)據(jù)庫(kù)的建立中起著重要的作用。郭蘭萍等人以3S 技術(shù)基礎(chǔ),構(gòu)建了廣泛用于中藥資源及道地藥材空間分析的中藥道地藥材空間分析數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)除了可以基本的管理數(shù)據(jù)外,還可以進(jìn)行道地藥材的遙感分析、空間插值分析和空間分析的研究,該數(shù)據(jù)庫(kù)成功的用于對(duì)蒼術(shù)道地產(chǎn)區(qū)的遙感分類(lèi)、NDVI植被指數(shù)的計(jì)算和產(chǎn)地區(qū)劃分析,展現(xiàn)了該數(shù)據(jù)庫(kù)在道地藥材空間分析中良好的應(yīng)用前景[15]。趙玉洋等人以甘草為例,闡述了中藥資源空間數(shù)據(jù)庫(kù)的構(gòu)建原則、結(jié)構(gòu)和方法,并討論了基于該數(shù)據(jù)庫(kù)建立空間分析模型的方法。該數(shù)據(jù)庫(kù)通過(guò)賦予中藥資源信息控件屬性,使其具備空間分析能力,為深層次的挖掘中藥資源信息奠定基礎(chǔ),這為中藥資源的可持續(xù)化利用提供了技術(shù)支撐[16]。
自2011 年我國(guó)啟動(dòng)四次全國(guó)中藥資源普查工作以來(lái),陸續(xù)開(kāi)展建立中藥資源普查數(shù)據(jù)庫(kù)并取得階段性成果[17]。劉俊宏等人依據(jù)貴州省中藥資源情況,從數(shù)據(jù)庫(kù)功能,中藥資源普查信息關(guān)聯(lián)性等方面進(jìn)行研究,設(shè)計(jì)如何構(gòu)建貴州省中藥資源普查數(shù)據(jù)庫(kù),為貴州省中藥資源普查工作提供理論數(shù)據(jù)[18]。崔治家等人設(shè)計(jì)一個(gè)集資源展示、交互反饋、模糊檢索、智能檢索以及能對(duì)檢索結(jié)果進(jìn)行優(yōu)化的中藏藥資源數(shù)據(jù)庫(kù)系統(tǒng),使甘肅省中藏藥資源普查取得的眾多成果能夠在省級(jí)層面展示和共享,這有效解決了目前大多數(shù)地區(qū)中藥資源數(shù)據(jù)庫(kù)主要為單機(jī)狀況,無(wú)法通過(guò)互聯(lián)網(wǎng)技術(shù)為更多用戶(hù)服務(wù)的限制[19]。在普查工作中,科研人員收集了大量中藥資源實(shí)物標(biāo)本信息。因此,建立中藥標(biāo)本庫(kù)也是中藥資源大數(shù)據(jù)的重要來(lái)源之一。沈力等人以中藥實(shí)物標(biāo)本為基礎(chǔ),重點(diǎn)建設(shè)中草藥資源數(shù)據(jù)庫(kù),并結(jié)合多媒體投影等多元化技術(shù),將數(shù)據(jù)庫(kù)資源有效應(yīng)用于多媒體教學(xué)和中藥學(xué)術(shù)科研信息支撐平臺(tái)[20]。蔣若冰等人對(duì)中藥標(biāo)本數(shù)據(jù)庫(kù)的研發(fā)管理進(jìn)行了系統(tǒng)性的總結(jié)。并從中藥標(biāo)本數(shù)據(jù)庫(kù)研發(fā)的建設(shè)目標(biāo)及任務(wù)、建設(shè)過(guò)程、成果與利用情況等多方面指出存在問(wèn)題,有助于在標(biāo)本數(shù)據(jù)庫(kù)的全面推廣建設(shè)中提供參考[21]。
目前,全國(guó)第四次中藥資源普查仍在進(jìn)行中,各區(qū)域數(shù)據(jù)仍在不斷更新,中藥資源普查數(shù)據(jù)庫(kù)仍在建設(shè)當(dāng)中,而目前已經(jīng)初步設(shè)計(jì)建立的數(shù)據(jù)庫(kù)可以為全國(guó)范圍的數(shù)據(jù)庫(kù)建立工作的進(jìn)行提供參考。
通過(guò)全國(guó)第四次中藥資源普查數(shù)據(jù)庫(kù)進(jìn)行的大數(shù)據(jù)匯總雖然具有數(shù)據(jù)全面可調(diào)取的優(yōu)點(diǎn),但是仍無(wú)法及時(shí)地反應(yīng)出中藥資源大數(shù)據(jù)的變化的情況。而中藥資源動(dòng)態(tài)監(jiān)測(cè)站則可以動(dòng)態(tài)監(jiān)測(cè)各地區(qū)中藥資源變化情況,及時(shí)的了解監(jiān)測(cè)地區(qū)中藥資源的變化情況,通過(guò)利用各種信息收集和處理方式對(duì)資源狀態(tài)進(jìn)行系統(tǒng)性的測(cè)定、觀察、記載、分析和評(píng)價(jià)[22]。在2009 年《國(guó)務(wù)院關(guān)于扶持和促進(jìn)中醫(yī)藥事業(yè)發(fā)展的若干意見(jiàn)》中明確指出“開(kāi)展全國(guó)中藥資源普查,加強(qiáng)中藥資源動(dòng)態(tài)監(jiān)測(cè)和信息網(wǎng)絡(luò)建設(shè)”;《中醫(yī)藥事業(yè)“十二五”規(guī)劃》有關(guān)專(zhuān)項(xiàng)中也提出“建立全國(guó)中藥資源普查數(shù)據(jù)庫(kù)和中藥資源動(dòng)態(tài)監(jiān)測(cè)機(jī)制”的工作。張小波等人結(jié)合全國(guó)中藥資源普查工作,對(duì)中藥資源動(dòng)態(tài)監(jiān)測(cè)機(jī)制的建立進(jìn)行探討,明確其組織管理架構(gòu)、覆蓋全國(guó)不同層級(jí)的監(jiān)測(cè)網(wǎng)絡(luò)體系和匯總分析中藥資源動(dòng)態(tài)監(jiān)測(cè)大數(shù)據(jù)信息的功能。該工作為順利進(jìn)行中藥資源動(dòng)態(tài)監(jiān)測(cè)網(wǎng)絡(luò)建設(shè)提供了指導(dǎo)性意見(jiàn),對(duì)中藥資源大數(shù)據(jù)的統(tǒng)籌和管理起到關(guān)鍵性的引領(lǐng)作用[23]。張?zhí)竦热藶閷?shí)現(xiàn)對(duì)全國(guó)中藥資源變化的實(shí)時(shí)掌握,設(shè)計(jì)了12個(gè)表單,98個(gè)采集指標(biāo)設(shè)計(jì)構(gòu)建了中藥資源動(dòng)態(tài)監(jiān)測(cè)填報(bào)系統(tǒng),該系統(tǒng)可以有效地實(shí)現(xiàn)中藥材的種植、生產(chǎn)和銷(xiāo)售等日常數(shù)據(jù)的收集,滿(mǎn)足中藥材市場(chǎng)、集散地和種植地的快速定位和信息收集,為獲得真實(shí)準(zhǔn)確的中藥資源大數(shù)據(jù)提供了有效手段[24]。趙姝婷等人針對(duì)四川省的中藥資源普查信息化缺口,研究建設(shè)了基于GIS的四川中藥資源信息系統(tǒng),為實(shí)現(xiàn)中藥資源的動(dòng)態(tài)監(jiān)測(cè)和數(shù)據(jù)的錄入、查詢(xún)、分析、共享等方面提供了平臺(tái)基礎(chǔ),對(duì)構(gòu)建四川省中藥材生態(tài)適宜性評(píng)價(jià)體系科學(xué)研究提供技術(shù)支撐,為更全面的發(fā)展全國(guó)中藥資源動(dòng)態(tài)監(jiān)測(cè)提供了參考[25]。
我國(guó)地域遼闊,自然環(huán)境條件復(fù)雜多變,形成了豐富的中藥資源寶庫(kù)[26]。但正是因?yàn)閺?fù)雜的氣候因素和地理因素,中藥資源的分布具有了不平衡的特點(diǎn)。結(jié)合地理空間信息和中藥資源大數(shù)據(jù)進(jìn)行空間差異性研究,對(duì)保護(hù)各地區(qū)的中藥資源生物多樣性,揭示中藥資源空間分布規(guī)律和時(shí)空演變過(guò)程具有重要意義[27]。
宋海龍等人以新疆吐魯番市的第四次全國(guó)中藥資源普查階段性工作為基礎(chǔ),運(yùn)用格網(wǎng)化技術(shù)、趨勢(shì)面分析、全局空間自相關(guān)分析、局部空間自相關(guān)分析等多種地理統(tǒng)計(jì)學(xué)方法研究了吐魯番盆地的中藥資源種類(lèi)豐富度在水平和垂直方向的變化趨勢(shì)和聚集程度。該研究指出吐魯番盆地中部的中藥資源種類(lèi)豐富,垂直方向上-154~150 m 和900~1050 m 區(qū)間的中藥資源種類(lèi)豐富度較高[28]。張小波等人使用該方法對(duì)重慶和吉林的中藥資源種類(lèi)豐富度進(jìn)行了空間差異分析,指出在30 km 的格網(wǎng)劃分情況下可以避免以縣為統(tǒng)計(jì)單位時(shí)引起的差異性,較好地反應(yīng)重慶市各區(qū)域間中藥資源豐富度實(shí)際情況;吉林省的中藥資源種類(lèi)豐富度較高地區(qū)主要集中在東部和東南部,植被類(lèi)型以闊葉林為主,較低地區(qū)主要為長(zhǎng)春和吉林市行政中心,植被類(lèi)型以栽培植被為主[29]。
遙感技術(shù)研究可以為制定中藥材生產(chǎn)、扶貧等政策和確定藥材貿(mào)易數(shù)量的提供依據(jù)?;谄詹檎{(diào)研的地物樣本數(shù)據(jù)信息,運(yùn)用衛(wèi)星遙感影像大數(shù)據(jù),提取不同地物的特征。使用遙感分析統(tǒng)計(jì)方法,進(jìn)行特征參數(shù)組合,分層分類(lèi)提取不同中藥材的種植信息[30]。進(jìn)而對(duì)中藥材種植面積進(jìn)行評(píng)估。通過(guò)中藥材與地物特征的相關(guān)性分析,建立合適的產(chǎn)量相關(guān)模型,對(duì)中藥材產(chǎn)量和適宜區(qū)進(jìn)行預(yù)測(cè)。如圖1 為基于遙感數(shù)據(jù)的藥用植物種植面積及產(chǎn)量統(tǒng)計(jì)的研究流程圖[31]。白吉慶等人以國(guó)產(chǎn)高分辨衛(wèi)星資源三號(hào)和高分一號(hào)的多光譜多時(shí)相遙感影像為數(shù)據(jù)源,對(duì)不同時(shí)間白及種植地區(qū)的光譜特征、紋理特征和形狀特征進(jìn)行分析識(shí)別,白及種植面積可達(dá)403.05 畝,為指導(dǎo)陜西地區(qū)白及的產(chǎn)業(yè)發(fā)展奠定基礎(chǔ)[32]。張飛以無(wú)人機(jī)低空遙感獲取的數(shù)據(jù)為樣本,以高分二號(hào)遙感影像為數(shù)據(jù)源,利用支持向量機(jī)的方法對(duì)豫西山區(qū)洛寧縣的中藥資源進(jìn)行分類(lèi),并通過(guò)精度驗(yàn)證確定中藥資源種植區(qū)域的空間分布位置準(zhǔn)確性,為當(dāng)?shù)刂兴幉漠a(chǎn)業(yè)扶貧提供基礎(chǔ)[33]。
以GIS、GPS技術(shù)和中藥資源普查實(shí)際調(diào)研的物種分布數(shù)據(jù)為基礎(chǔ),使用最大熵模型物種潛在適宜分布區(qū)域與生態(tài)環(huán)境進(jìn)行分析。并結(jié)合化學(xué)成分分析,進(jìn)行藥用植物的品質(zhì)區(qū)劃研究。通過(guò)分析化學(xué)成分與生態(tài)因子之間的關(guān)系,預(yù)測(cè)高品質(zhì)中藥材的適宜生長(zhǎng)環(huán)境。
最大熵模型(Maxent)是一種機(jī)器學(xué)習(xí)算法,可以通過(guò)已知的物種分布數(shù)據(jù)結(jié)合大量的生態(tài)因子數(shù)據(jù),預(yù)測(cè)潛在的物種分布[34]。它可以展示不同物種最適宜分布的生態(tài)因子條件,通過(guò)結(jié)合ArcGIS 軟件和Biosim 軟件,可以預(yù)測(cè)物種在研究區(qū)域的生態(tài)適宜性區(qū)域及高品質(zhì)區(qū)域,研究的技術(shù)流程圖如2 所示。方清茂等人以遙感與GIS空間分析、空間數(shù)據(jù)建庫(kù)等技術(shù)為基礎(chǔ),對(duì)暗紫貝母生長(zhǎng)的環(huán)境指標(biāo)進(jìn)行量化和綜合分析,得到四川道地藥材暗紫貝母的適宜分布范圍,實(shí)驗(yàn)結(jié)果與實(shí)際產(chǎn)地情況吻合,說(shuō)明該方法可以為暗紫貝母種植的區(qū)域布局提供技術(shù)支持[35]。另一方面,中藥資源產(chǎn)業(yè)與農(nóng)業(yè)不同,通過(guò)數(shù)據(jù)分析進(jìn)一步確認(rèn)中藥資源的高品質(zhì)區(qū)域,可以為這些物種的野生撫育、引種栽培和建立GAP 生產(chǎn)基地提供了科學(xué)的理論基礎(chǔ)。李靜等人通過(guò)實(shí)地采樣并結(jié)合空間氣候數(shù)據(jù),對(duì)其化學(xué)成分和生態(tài)因子數(shù)據(jù)的關(guān)聯(lián)性進(jìn)行分析,為多指標(biāo)評(píng)價(jià)枸杞質(zhì)量提供了分析方法,為科學(xué)引種高質(zhì)量的藥材奠定基礎(chǔ)[36]。
圖1 基于遙感數(shù)據(jù)的藥用植物種植面積及產(chǎn)量統(tǒng)計(jì)的研究流程圖Fig.1 Research flow chart of medicinal plant planting area and yield statistics based on remote sensing data
數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)檢索出隱藏于其中的、具有特殊關(guān)系性的信息和知識(shí)的方法[37]。基于數(shù)據(jù)挖掘技術(shù),可以高效準(zhǔn)確的找出對(duì)各行業(yè)具有價(jià)值的信息,數(shù)據(jù)挖掘技術(shù)的主要分析流程如圖3 所示[38]。數(shù)據(jù)挖掘模型主要可以分為分類(lèi)、回歸、聚類(lèi)、關(guān)聯(lián)規(guī)則等方法[39]。雖然已經(jīng)建立多個(gè)中藥大數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的儲(chǔ)存,但是運(yùn)用數(shù)據(jù)挖掘模型進(jìn)一步的分析其規(guī)律的研究仍然較少。只有根據(jù)實(shí)際情況建立合理的數(shù)據(jù)挖掘模型,進(jìn)一步對(duì)中藥資源的空間分布、方劑配伍、臨床使用等方面開(kāi)發(fā)研究,才能發(fā)揮出中藥大數(shù)據(jù)的實(shí)際應(yīng)用價(jià)值。
圖2 藥用植物生長(zhǎng)適宜性區(qū)劃和品質(zhì)適宜性區(qū)劃研究流程圖Fig.2 Research flow chart of medicinal plant growth suitability zoning and quality suitability zoning
圖3 數(shù)據(jù)挖掘技術(shù)的主要分析流程Fig.3 The main analysis process of data mining technology
充分了解中藥資源的空間分布情況是保護(hù)中藥資源,合理指導(dǎo)中藥種植生產(chǎn)的重要舉措。孫成忠等人綜述了基于聚類(lèi)的空間數(shù)據(jù)挖掘技術(shù)在中藥資源分析中的應(yīng)用,并結(jié)合實(shí)例證明其方法的可行性,為政府宏觀調(diào)控中藥材種植產(chǎn)業(yè)提供依據(jù)[40]。趙懷潤(rùn)等人利用空間數(shù)據(jù)挖掘技術(shù)基于聚類(lèi)分析的原理,將中藥資源產(chǎn)地的氣候因子數(shù)據(jù)、地形因子數(shù)據(jù)、土壤類(lèi)型數(shù)據(jù)結(jié)合,綜合分析每一種藥材的最適宜種植區(qū)域,有效指導(dǎo)了20 多種藥材的適宜性種植區(qū)域,并且發(fā)現(xiàn)了很多在未來(lái)有可能成為藥材產(chǎn)地的區(qū)域。另一方面,數(shù)據(jù)挖掘和中藥指紋圖譜相結(jié)合等識(shí)別方法是中藥質(zhì)量鑒定的重要方法[41]。劉沐華等人,通過(guò)基于數(shù)據(jù)挖掘?qū)? 個(gè)不同產(chǎn)地的269 個(gè)白芷樣本和6個(gè)不同產(chǎn)地的380 個(gè)丹參樣本進(jìn)行了紅外光譜法的產(chǎn)地鑒別,將其數(shù)據(jù)進(jìn)行為中藥材產(chǎn)地的自動(dòng)鑒別提供了新的方法[42]。
隨著5G 時(shí)代的到來(lái),互聯(lián)網(wǎng)技術(shù)及物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展必然會(huì)進(jìn)一步推動(dòng)大數(shù)據(jù)的應(yīng)用與發(fā)展,本文從以下幾個(gè)方面總結(jié)了中藥資源大數(shù)據(jù)在今后發(fā)展中應(yīng)當(dāng)注意的問(wèn)題:
目前,中藥的種植多局限于縣級(jí)以下單位,因此進(jìn)行縣級(jí)以下或更小區(qū)域范圍的區(qū)劃,對(duì)指導(dǎo)中藥材具體的生產(chǎn)實(shí)踐活動(dòng)非常有必要,但是目前的區(qū)劃研究大多以省市級(jí)為單位,因此進(jìn)行更小范圍的區(qū)劃研究是有必要的。同時(shí),細(xì)致的區(qū)域研究需要更大信息量的藥用植物資源分布數(shù)據(jù)作為支撐,這對(duì)中藥資源數(shù)據(jù)的收集整理提出了挑戰(zhàn)。為了使中醫(yī)藥的發(fā)展面向世界,有必要收集大量的全球中藥資源分布數(shù)據(jù),結(jié)合全球的生態(tài)因子、土壤和海拔等數(shù)據(jù),用以預(yù)測(cè)藥用植物在更大范圍的適宜種植區(qū),比如預(yù)測(cè)青蒿在全球范圍的適宜種植區(qū)對(duì)瘧疾的治療具有重大意義[43-44],各地區(qū)的相關(guān)管理機(jī)構(gòu)也應(yīng)當(dāng)有將特色藥用植物資源向世界發(fā)展的思維,積極的結(jié)合最新的大數(shù)據(jù)技術(shù)進(jìn)行發(fā)展。最后,區(qū)劃研究不是獨(dú)立的,應(yīng)當(dāng)將中藥資源區(qū)劃研究與社會(huì)經(jīng)濟(jì)宏觀發(fā)展規(guī)劃、土地利用規(guī)劃、國(guó)土空間規(guī)劃等大數(shù)據(jù)的進(jìn)行結(jié)合,賦予中藥區(qū)劃更多的功能,這將成為中藥資源領(lǐng)域發(fā)展的新方向[45]。
遙感研究的數(shù)據(jù)來(lái)源和質(zhì)量對(duì)進(jìn)一步研究具有關(guān)鍵的影響。在已經(jīng)廣泛使用的中國(guó)的資源3 號(hào)衛(wèi)星、歐洲哨兵2 號(hào)衛(wèi)星和美國(guó)Landsat 衛(wèi)星等數(shù)據(jù)來(lái)源的基礎(chǔ)上,進(jìn)一步使用具有更高分辨率的衛(wèi)星,或者使用不受氣候因素影響的雷達(dá)遙感技術(shù),都是未來(lái)研究的趨勢(shì)[46-48]。因此對(duì)更多的衛(wèi)星進(jìn)行合理的商業(yè)化運(yùn)營(yíng)和成本的降低具有重要意義[49-50]。另一方面,在基于現(xiàn)有的深度學(xué)習(xí)及其相關(guān)技術(shù)的飛速發(fā)展,為開(kāi)發(fā)中藥資源大數(shù)據(jù)的遙感圖像處理方面提供了進(jìn)一步研究的可能性,也是我們目前正在研究并且是需要持續(xù)關(guān)注的領(lǐng)域。比如深度學(xué)習(xí)的CNN 網(wǎng)絡(luò)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的研究[51],可以有效應(yīng)用于遙感影像處理時(shí)的中藥資源物種特征識(shí)別、圖像分類(lèi)和圖像切割等內(nèi)容。這對(duì)于中藥資源大數(shù)據(jù)的研究處理具有重要意義。
大數(shù)據(jù)產(chǎn)業(yè)作為新興的產(chǎn)業(yè)力量,實(shí)施大數(shù)據(jù)產(chǎn)業(yè)發(fā)展戰(zhàn)略,需要政府的提供相關(guān)的政策扶持,幫助搭建起市場(chǎng)和企業(yè)間的溝通橋梁。中藥資源大數(shù)據(jù)平臺(tái)的建設(shè)離不開(kāi)相關(guān)機(jī)構(gòu)的監(jiān)督管理。在收集大數(shù)據(jù)時(shí),很有可能會(huì)涉及到個(gè)人、企業(yè)和國(guó)家的隱私數(shù)據(jù),這需要政府出臺(tái)相關(guān)的政策、法規(guī)進(jìn)行約束。對(duì)于數(shù)據(jù)分析結(jié)果的公正性也需要專(zhuān)業(yè)的第三方機(jī)構(gòu)或者公眾進(jìn)行評(píng)判。同時(shí),通過(guò)市場(chǎng)化程序?qū)Υ髷?shù)據(jù)分析運(yùn)用進(jìn)行評(píng)級(jí),建立合適的大數(shù)據(jù)產(chǎn)業(yè)運(yùn)營(yíng)機(jī)制,使其適應(yīng)市場(chǎng)的發(fā)展,擁有更加寬闊的發(fā)展前景[52-53]。
目前,各中醫(yī)藥院校,農(nóng)林院校已相繼設(shè)立中藥學(xué)、中藥資源學(xué)等專(zhuān)業(yè),以滿(mǎn)足中藥資源產(chǎn)業(yè)對(duì)專(zhuān)業(yè)領(lǐng)域人才的需求[8]。中藥資源相關(guān)專(zhuān)業(yè)要求更為廣泛的知識(shí)儲(chǔ)備,需要在本專(zhuān)業(yè)知識(shí)體系之外,涉及農(nóng)學(xué)、法學(xué)、生物學(xué)等其他專(zhuān)業(yè)知識(shí)。因此中藥資源學(xué)專(zhuān)業(yè)培養(yǎng)的人才需要具備較為全面的知識(shí),并且可以及時(shí)了解中藥資源產(chǎn)業(yè)發(fā)展的前沿動(dòng)態(tài),使不同的科學(xué)技術(shù)成為中藥資源產(chǎn)業(yè)的發(fā)展動(dòng)力。另一方面,隨著大數(shù)據(jù)技術(shù)的融入,無(wú)論是深度學(xué)習(xí)還是其他的數(shù)據(jù)處理技術(shù),在對(duì)中藥資源大數(shù)據(jù)進(jìn)行運(yùn)算分析時(shí),終究需要以人的專(zhuān)業(yè)判斷作為基礎(chǔ)。因此對(duì)于能同時(shí)精通中藥資源專(zhuān)業(yè)和計(jì)算機(jī)學(xué)、地統(tǒng)計(jì)數(shù)學(xué)等專(zhuān)業(yè)人員的培養(yǎng)至關(guān)重要。
在進(jìn)一步的科研中需要更高精度的數(shù)據(jù),但是這些數(shù)據(jù)的價(jià)格高昂或具有保密性要求,因此從數(shù)據(jù)來(lái)源上很難滿(mǎn)足進(jìn)一步研究的要求,這使得中藥資源大數(shù)據(jù)難以應(yīng)用于實(shí)際生產(chǎn)中。因此數(shù)據(jù)要在開(kāi)放中充分挖掘紛繁復(fù)雜數(shù)據(jù)背后的價(jià)值,合理進(jìn)行商業(yè)化。但是政府部門(mén)統(tǒng)計(jì)出來(lái)的很多數(shù)據(jù),如天氣報(bào)告、土壤條件、地圖、水資源、市場(chǎng)環(huán)境、市場(chǎng)需求一定程度上限制了使用者的獲取。在面對(duì)大量數(shù)據(jù)的情況下,需要更多的專(zhuān)業(yè)人士參與數(shù)據(jù)的整理研究[54],如中國(guó)科學(xué)院北京基因組研究所的大數(shù)據(jù)中心提供了一套開(kāi)放的數(shù)據(jù)庫(kù)資源,為國(guó)內(nèi)外學(xué)術(shù)界和產(chǎn)業(yè)界的研究提供幫助,為生物多樣性的保護(hù)發(fā)展提供了巨大的幫助[55],類(lèi)似的開(kāi)放性大數(shù)據(jù)庫(kù)的建立可以促進(jìn)中藥資源領(lǐng)域的全面發(fā)展。所以,政府和相關(guān)部門(mén)應(yīng)積極推動(dòng)相關(guān)中藥資源數(shù)據(jù)開(kāi)放。特別值得關(guān)注的是要制定一個(gè)被廣泛認(rèn)可、采納的數(shù)據(jù)格式國(guó)家標(biāo)準(zhǔn),從而推動(dòng)大數(shù)據(jù)的開(kāi)發(fā)和利用[56]。
另一方面,中藥資源大數(shù)據(jù)除了一般大數(shù)據(jù)所具備的數(shù)量大、數(shù)據(jù)類(lèi)型多的特征之外,也包含了療效和傳統(tǒng)應(yīng)用信息,其中大量資源物種的精確分布信息以及涉及的農(nóng)戶(hù)、企業(yè)、市場(chǎng)信息等會(huì)涉及保密要求,因此需要進(jìn)行保密處理[57]。因此如何做到數(shù)據(jù)隱私,防止造成破壞性采挖,惡性競(jìng)爭(zhēng)的局面是需要重點(diǎn)關(guān)注的。在進(jìn)行數(shù)據(jù)收集是應(yīng)公開(kāi)進(jìn)行,確保涉及到的相關(guān)隱私數(shù)據(jù)需征求被收集者的授權(quán)[58],政府也要制定合理的數(shù)據(jù)管理制度,平衡好數(shù)據(jù)的開(kāi)放性和保密性。
隨著云計(jì)算和大數(shù)據(jù)技術(shù)的發(fā)展,海量數(shù)據(jù)的運(yùn)算速度大大提升??臻g信息平臺(tái)已能做到同時(shí)快速調(diào)取多層數(shù)據(jù)并快速成圖展示。通過(guò)平臺(tái)權(quán)限的管理,所有與中藥資源產(chǎn)業(yè)相關(guān)的工作人員在開(kāi)展業(yè)務(wù)時(shí),隨時(shí)都可在地圖上瀏覽、查詢(xún)、分析、下載,通過(guò)空間數(shù)據(jù)展示系統(tǒng)和借助中藥資源大數(shù)據(jù)平臺(tái)做好審批和決策工作[59]。中藥資源大數(shù)據(jù)在空間上最直觀的體現(xiàn)方法是以地圖形式表達(dá)。研究人員根據(jù)不同的用途調(diào)取需要的數(shù)據(jù)配置成各種地圖,使管理人員及決策人員能直觀的看到所需要的信息。因此,基于時(shí)空數(shù)據(jù)庫(kù)架構(gòu)的自然資源數(shù)據(jù)協(xié)同共享,需要搭建自然資源數(shù)據(jù)協(xié)同共享平臺(tái),通過(guò)空間數(shù)據(jù)引擎,數(shù)據(jù)庫(kù)的內(nèi)容以可視化圖片展示。
中藥資源和大數(shù)據(jù)的結(jié)合是中藥資源產(chǎn)業(yè)未來(lái)發(fā)展的必經(jīng)之路。傳統(tǒng)中藥資源產(chǎn)業(yè)的發(fā)展只有結(jié)合最新的科學(xué)技術(shù),利用好大數(shù)據(jù)及相關(guān)分析和挖掘技術(shù),才能挖掘出在歷史發(fā)展中未被發(fā)現(xiàn)的產(chǎn)業(yè)價(jià)值或者解決還存在的發(fā)展問(wèn)題。中藥資源是中醫(yī)藥發(fā)揮療效的重要基礎(chǔ),中藥材的品質(zhì)下降會(huì)限制中醫(yī)治病療效從而系那只中醫(yī)藥行業(yè)的發(fā)展。隨著社會(huì)各界對(duì)中醫(yī)藥需要量的增加,野生中藥資源情況的摸底和種植中藥資源的質(zhì)量提升都是重中之重,栽培是解決野生中藥資源短缺的最有效的手段之一,提高栽培中藥材質(zhì)量是解決這一問(wèn)題的關(guān)鍵。而大數(shù)據(jù)的結(jié)合可以有效對(duì)當(dāng)前中藥材生產(chǎn)現(xiàn)狀進(jìn)行統(tǒng)計(jì)分析,明確栽培藥材質(zhì)量控制中存在的問(wèn)題,可以科學(xué)合理的提高藥材質(zhì)量和產(chǎn)量。本文通過(guò)總結(jié)當(dāng)前中藥資源大數(shù)據(jù)的建設(shè)情況,為各地區(qū)及全國(guó)的中藥資源大數(shù)據(jù)建設(shè)提供一種參考,為有效控制中藥質(zhì)量問(wèn)題和促進(jìn)中藥資源產(chǎn)業(yè)的發(fā)展,提高中國(guó)中醫(yī)藥產(chǎn)業(yè)的水平,從根本上為解決中醫(yī)藥治療中藥材質(zhì)量不佳,高質(zhì)量中藥資源匱乏的問(wèn)題提供一種途徑。
農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào)2021年1期