戚元華 王慧 張小波 金艷 格小光 景志賢 王凌 趙宇平 郭蘭萍 黃璐琦
[摘要]該研究基于手機(jī)端,融合GPS定位、偏移校正、語(yǔ)言識(shí)別以及軟件和數(shù)據(jù)庫(kù)網(wǎng)絡(luò)技術(shù),開(kāi)發(fā)了中藥資源普查(一般調(diào)查)移動(dòng)端數(shù)據(jù)采集系統(tǒng),實(shí)現(xiàn)了中藥資源種類、位置、圖片、時(shí)間、標(biāo)本5項(xiàng)核心內(nèi)容15個(gè)核心指標(biāo)的采集記錄功能,采集數(shù)據(jù)導(dǎo)入全國(guó)中藥資源普查信息管理系統(tǒng)兩方面的功能?;谑謾C(jī)移動(dòng)端的數(shù)據(jù)采集系統(tǒng)可以快速的定位經(jīng)緯度、海拔信息,方便拍攝各種類型的中藥資源照片、標(biāo)本照片、生境等照片,實(shí)現(xiàn)和中藥基原信息的自動(dòng)關(guān)聯(lián),還可以通過(guò)語(yǔ)音識(shí)別功能來(lái)協(xié)助記錄資源特征、環(huán)境特征等信息,并有效記錄標(biāo)本的采集相關(guān)信息?;谥兴庂Y源普查數(shù)據(jù)填報(bào)客戶端的數(shù)據(jù)整理平臺(tái),可以有效輔助內(nèi)業(yè)整理,將移動(dòng)端的數(shù)據(jù)導(dǎo)出到電腦端,數(shù)據(jù)整理完畢后并上傳到中藥資源數(shù)據(jù)普查填報(bào)數(shù)據(jù)庫(kù)中,為第四次全國(guó)中藥資源普查野外調(diào)查工作提供強(qiáng)有力的技術(shù)支撐。
[關(guān)鍵詞]中藥資源普查; 移動(dòng)端; 一般調(diào)查; 數(shù)據(jù)采集
[Abstract]In this paper, a data acquisition system based on mobile terminal combining GPS, offset correction, automatic speech recognition and database networking technology was designed implemented with the function of locating the latitude and elevation information fast, taking conveniently various types of Chinese herbal plant photos, photos, samples habitat photos and so on The mobile system realizes automatic association with Chinese medicine source information, through the voice recognition function it records the information of plant characteristics and environmental characteristics, and record relevant plant specimen information The data processing platform based on Chinese medicine resources survey data reporting client can effectively assists in indoor data processing, derives the mobile terminal data to computer terminal The established data acquisition system provides strong technical support for the fourth national survey of the Chinese materia medica resources (CMMR)
[Key words]Chinese materia medica resources survey; mobile terminal; commonlysurvey; data acquisition
中藥資源普查工作包括一般調(diào)查和重點(diǎn)調(diào)查等主要工作任務(wù),一般調(diào)查是隨機(jī)調(diào)查,在野外中藥資源調(diào)查的過(guò)程中,隨時(shí)發(fā)現(xiàn)各種藥用植物并做好記錄工作;重點(diǎn)調(diào)查是在提前預(yù)設(shè)的樣地、樣方套內(nèi)進(jìn)行普查作業(yè)。重點(diǎn)調(diào)查基于PDA的數(shù)據(jù)采集端[1],協(xié)助普查隊(duì)員進(jìn)行重點(diǎn)調(diào)查數(shù)據(jù)信息采集,尚無(wú)協(xié)助普查隊(duì)員進(jìn)行一般調(diào)查的采集系統(tǒng)。
1需求分析
一般調(diào)查的目的是掌握區(qū)域內(nèi)可藥用資源種類和分布等信息,要求每條調(diào)查記錄中必須包括,采集人、時(shí)間、位置、照片和實(shí)物等方面的信息。外業(yè)調(diào)查工作中,完成每一條記錄數(shù)據(jù)信息的采集,普查隊(duì)員需要同時(shí)攜帶GPS定位設(shè)備、相機(jī)、紙質(zhì)調(diào)查表等設(shè)備來(lái)完成普查任務(wù)。野外調(diào)查工作中需要記錄藥用資源的名稱、位置等信息、還需要拍攝植物照片、采集標(biāo)本實(shí)物等,普查隊(duì)員每天需要采集的數(shù)據(jù)信息多、工作時(shí)間長(zhǎng);同時(shí),攜帶的儀器設(shè)備多、隨著工作時(shí)間的增加、隊(duì)員的負(fù)重逐漸增加,對(duì)普查隊(duì)員的體能和耐力等提出了更高的要求。
為客觀反映每個(gè)區(qū)域中藥資源種類,中藥資源普查要求每一種中藥資源的位置、照片和實(shí)物等方面的信息和實(shí)物要一一對(duì)應(yīng)。普查隊(duì)員外業(yè)調(diào)查過(guò)程中,通常,將采集到的中藥資源信息手工記錄在紙質(zhì)調(diào)查表上,在內(nèi)業(yè)整理過(guò)程再將紙質(zhì)調(diào)查表中的信息手工錄入到電腦中,實(shí)現(xiàn)普查數(shù)據(jù)信息的數(shù)字化。如,位置信息的獲取,一般需要普查隊(duì)員先根據(jù)GPS的定位信息,手工將包括10幾位數(shù)字的經(jīng)緯度信息抄寫(xiě)在紙質(zhì)調(diào)查表上,內(nèi)業(yè)整理過(guò)程中再將10幾位數(shù)字的經(jīng)緯度信息從紙質(zhì)調(diào)查表上錄入到電腦中。在獲取錄入每條中藥資源信息的過(guò)程中,由于數(shù)字錄入工作量大、對(duì)應(yīng)關(guān)系多、操作過(guò)程中的錯(cuò)誤錄入不可避免,影響數(shù)據(jù)質(zhì)量。
如何以新技術(shù)新方法為依托,開(kāi)發(fā)設(shè)計(jì)集定位、拍照和信息記錄3方面功能于一體的系統(tǒng)輔助普查數(shù)據(jù)信息的獲取和數(shù)字化,成為此次中藥資源普查信息化的面臨的主要問(wèn)題,該問(wèn)題的解決將大大方便中藥資源野外調(diào)查,提高工作效率。目前,一般可以通過(guò)GPS、PDA、手機(jī)和相機(jī)等獲取位置信息。手機(jī)的使用人群迅速發(fā)展壯大,幾乎每個(gè)野外普查隊(duì)員都在使用手機(jī),隨著手機(jī)技術(shù)的發(fā)展一般都帶有GPS定位、拍照、時(shí)間、上網(wǎng)等功能。開(kāi)發(fā)手機(jī)端的中藥資源普查數(shù)據(jù)采集系統(tǒng),可有效輔助普查人員進(jìn)行外業(yè)調(diào)查,提高數(shù)據(jù)信息的準(zhǔn)確性、減少由于人工錄入產(chǎn)生的錯(cuò)誤,降低一般調(diào)查作業(yè)強(qiáng)度,提高工作效率。endprint
2系統(tǒng)總體功能架構(gòu)
基于智能移動(dòng)端的中藥資源普查數(shù)據(jù)采集應(yīng)用系統(tǒng)(以下簡(jiǎn)稱“采集APP系統(tǒng)”)的架構(gòu)設(shè)計(jì)遵循平臺(tái)化、組件化的設(shè)計(jì)思想,采用統(tǒng)一的數(shù)據(jù)交換、統(tǒng)一的接口標(biāo)準(zhǔn)、統(tǒng)一的安全保障。
移動(dòng)端采集APP系統(tǒng)主要分為數(shù)據(jù)采集子系統(tǒng)和數(shù)據(jù)整理子系統(tǒng)兩部分。數(shù)據(jù)采集子系統(tǒng)開(kāi)發(fā)采用Android 60開(kāi)發(fā),支持魅族、華為、小米等國(guó)產(chǎn)手機(jī)。Android是基于Linux平臺(tái)的,采取的是分層的架構(gòu),各層清晰分工明確,主要分為3層:操作系統(tǒng)、中間件、應(yīng)用程序。由于中藥資源普查數(shù)據(jù)填報(bào)系統(tǒng)是采用NET技術(shù)框架開(kāi)發(fā),為了便于數(shù)據(jù)的整理和技術(shù)對(duì)接以及后期的維護(hù)升級(jí),中藥資源普查數(shù)據(jù)整理子系統(tǒng)在電腦端實(shí)現(xiàn),技術(shù)架構(gòu)開(kāi)發(fā)采用NET技術(shù)架構(gòu)和Access數(shù)據(jù)庫(kù)。
中藥資源普查數(shù)據(jù)采集子系統(tǒng)能夠支持最少3種主流國(guó)產(chǎn)手機(jī)和平板,支持Android 60操作系統(tǒng),自適應(yīng)屏幕分辨率;基于開(kāi)源的移動(dòng)端操作系統(tǒng)進(jìn)行研發(fā);支持移動(dòng)端APP自動(dòng)升級(jí)。具有以下功能:通過(guò)GPS自動(dòng)獲取經(jīng)緯度、海拔信息,基原名、藥材名的快速查找和自動(dòng)關(guān)聯(lián),照片(名稱)、采集號(hào)和基原名的自動(dòng)關(guān)聯(lián),照片連拍,采集號(hào)自動(dòng)生成,語(yǔ)音記錄和識(shí)別,藥材名等基本信息的記錄和導(dǎo)出等功能。數(shù)據(jù)整理子系統(tǒng),能將移動(dòng)端采集的數(shù)據(jù)導(dǎo)入到“中藥資源普查數(shù)據(jù)填報(bào)系統(tǒng)”,同時(shí)支持對(duì)移動(dòng)端采集數(shù)據(jù)的編輯、中藥名錄的快速查找關(guān)聯(lián)、采集號(hào)的自動(dòng)生成、手機(jī)錄音的語(yǔ)音識(shí)別、數(shù)據(jù)導(dǎo)出、定義數(shù)據(jù)導(dǎo)出標(biāo)準(zhǔn)以及普查圖片的快速錄入等功能。
系統(tǒng)總體功能架構(gòu)見(jiàn)圖1,2。
3核心技術(shù)方法
31采用百度地圖定位SDK,實(shí)現(xiàn)采集地點(diǎn)的實(shí)時(shí)定位
GPS(global positioning system)即全球定位系統(tǒng),是由美國(guó)建立的一個(gè)衛(wèi)星導(dǎo)航定位系統(tǒng),利用該系統(tǒng),用戶可以在全球范圍內(nèi)實(shí)現(xiàn)全天候、連續(xù)、實(shí)時(shí)的三維導(dǎo)航定位和測(cè)速[2];利用該系統(tǒng),用戶還能夠進(jìn)行高精度的時(shí)間傳遞和高精度的精密定位。
采集APP系統(tǒng)采用百度地圖定位SDK進(jìn)行GPS定位,具有精度高、覆蓋廣、速度快、流量小、內(nèi)存/CPU占用率低的優(yōu)勢(shì)。采用百度地圖SDK進(jìn)行GPS定位的整體定位成功率高達(dá)995%,誤差范圍在10~20 m,移動(dòng)、聯(lián)通、電信全網(wǎng)絡(luò)覆蓋,基站覆蓋率99%,WIFI覆蓋率99%,網(wǎng)絡(luò)定位速度在1 s以內(nèi),耗費(fèi)流量小于03 K/次。
32采用語(yǔ)音識(shí)別技術(shù),提高中藥資源調(diào)查效率
語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高端技術(shù)。語(yǔ)音識(shí)別技術(shù)[34]主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)3個(gè)方面。
采集APP系統(tǒng)采用百度語(yǔ)音識(shí)別技術(shù),能夠確保音頻數(shù)據(jù)源的真實(shí)性;全平臺(tái)REST API可適用于任何平臺(tái)的語(yǔ)音識(shí)別;利用該技術(shù)能夠進(jìn)行深度語(yǔ)義解析,可支持多達(dá)35個(gè)垂類領(lǐng)域的語(yǔ)義理解定制;該技術(shù)還可以根據(jù)用戶使用的場(chǎng)景設(shè)定特定領(lǐng)域,使得識(shí)別結(jié)果更準(zhǔn)確。
4采集APP系統(tǒng)的詳細(xì)設(shè)計(jì)
41數(shù)據(jù)采集內(nèi)容設(shè)計(jì)
根據(jù)《全國(guó)中藥資源普查技術(shù)規(guī)范》[5],對(duì)數(shù)據(jù)采集內(nèi)容進(jìn)行設(shè)計(jì),在一般調(diào)查中需要采集的信息主要有7個(gè)方面21個(gè)指標(biāo)。
基原信息,包括種中文名稱(或別名)、種拉丁名、科中文名稱、科拉丁名、生活型、個(gè)體照片等6個(gè)指標(biāo)。
藥材信息,包括藥材名稱、藥材別名、入藥部位、入藥部位照片等4個(gè)指標(biāo)。
照片信息,包括生境照片、植物群落照片等2個(gè)指標(biāo)。
標(biāo)本信息,包括標(biāo)本采集號(hào)、標(biāo)本照片名稱等2個(gè)指標(biāo)。
位置信息,包括經(jīng)緯度、海拔等3個(gè)指標(biāo)。
時(shí)間信息,包括調(diào)查時(shí)間、標(biāo)本采集時(shí)間等2個(gè)指標(biāo)。
普查隊(duì)信息,包括調(diào)查人、調(diào)查地點(diǎn)等2個(gè)指標(biāo)。
42數(shù)據(jù)采集子系統(tǒng)功能設(shè)計(jì)
421新增記錄創(chuàng)建一個(gè)新的調(diào)查記錄,包括照片采集錄入、基原名稱選錄、采集號(hào)錄入、采集地區(qū)錄入、位置信息獲取和語(yǔ)音處理,可對(duì)中藥資源的名稱、圖片、位置、采集地點(diǎn)、外貌特征、環(huán)境特征等數(shù)據(jù)進(jìn)行獲取及保存。
照片信息可以從手機(jī)圖庫(kù)選擇或者調(diào)用手機(jī)相機(jī)進(jìn)行實(shí)時(shí)數(shù)據(jù)拍照。系統(tǒng)支持從圖庫(kù)中選擇需要的照片,選擇照片的最大總數(shù)量默認(rèn)為20張;另外,系統(tǒng)支持使用手機(jī)照相機(jī)進(jìn)行拍照,支持單張拍照和連續(xù)拍照,拍照的照片能自動(dòng)顯示在該記錄界面上,見(jiàn)圖3。
基原名稱錄入:提供輸入和下拉列表框選擇2種方式,輸入基原的首字母簡(jiǎn)寫(xiě)或者部分字,系統(tǒng)可從數(shù)據(jù)庫(kù)中自動(dòng)獲取與之關(guān)聯(lián)的基原名稱,以供選擇。輸入時(shí)支持模糊搜索(如“蒲公英”,可輸入“蒲”),支持首字母簡(jiǎn)寫(xiě)搜索(如“PGY”),方便用戶操作。
標(biāo)本信息錄入:系統(tǒng)可自動(dòng)生成采集號(hào)和標(biāo)本編號(hào),同一地區(qū)的同1 d內(nèi),標(biāo)本編號(hào)自動(dòng)增長(zhǎng),用戶可自行修改。
位置信息:采集地點(diǎn)(采集號(hào)輸入框右側(cè)框)自動(dòng)填充為登錄頁(yè)選擇的地區(qū)信息,用戶可在其后添加詳細(xì)地址信息。打開(kāi)手機(jī)GPS,系統(tǒng)自動(dòng)獲取經(jīng)緯度、海拔信息,為保證數(shù)據(jù)完整性和真實(shí)性,系統(tǒng)不提供經(jīng)緯度信息的修改操作。
植物特征與環(huán)境特征錄入支持漢字和語(yǔ)音2種方式,即可手工錄入關(guān)于植物特征的描述信息,也可錄入語(yǔ)音信息,到達(dá)有效時(shí)長(zhǎng)時(shí)自動(dòng)結(jié)束保存,錄入后最下方會(huì)有對(duì)應(yīng)的語(yǔ)音按鈕。
422瀏覽已有記錄該功能主要完成新建記錄的分類瀏覽、數(shù)據(jù)刪除、數(shù)據(jù)導(dǎo)出、數(shù)據(jù)批量選擇和數(shù)據(jù)查詢??蔀g覽不同地區(qū)的調(diào)查記錄信息、批量選擇、導(dǎo)出、刪除調(diào)查記錄信息、查詢導(dǎo)出/未導(dǎo)出的數(shù)據(jù)等。數(shù)據(jù)導(dǎo)出時(shí)對(duì)數(shù)據(jù)壓縮打包和標(biāo)記,采用異步操作方式,提高了數(shù)據(jù)導(dǎo)出效率,見(jiàn)圖4。
423已有調(diào)查記錄修改系統(tǒng)對(duì)未導(dǎo)出過(guò)的記錄支持2次編輯重新導(dǎo)出,該功能和添加記錄相似,所有數(shù)據(jù)自動(dòng)從數(shù)據(jù)庫(kù)獲取并填充,不同的地方是可進(jìn)行多次重定位,然后覆蓋原始的位置信息。采用事務(wù)異步方式進(jìn)行數(shù)據(jù)的修改操作,修改成功后返回。已導(dǎo)出過(guò)的記錄只能瀏覽不能進(jìn)行2次編輯。endprint
424系統(tǒng)設(shè)置用戶可根據(jù)需要設(shè)置語(yǔ)音的記錄條數(shù)、每次調(diào)查的每種植物的照片采集數(shù)量、每次語(yǔ)音錄入時(shí)長(zhǎng)以及進(jìn)行版本更新操作。語(yǔ)音記錄條數(shù):每條調(diào)查記錄界面內(nèi)的植物特征語(yǔ)音只能錄入的語(yǔ)音條數(shù),默認(rèn)為5條。照片采集設(shè)置:每條調(diào)查記錄界面內(nèi)的植物照片數(shù)量限制,默認(rèn)最多為20張。語(yǔ)音錄入時(shí)間:每次語(yǔ)音錄入的有效時(shí)長(zhǎng),默認(rèn)為2 min。版本更新:顯示當(dāng)前版本信息,可查看服務(wù)器是否有新版本需要更新,有更新則下載更新到最新版本。
425普查隊(duì)設(shè)置該功能實(shí)現(xiàn)對(duì)數(shù)據(jù)采集地點(diǎn)的設(shè)置以及采集人信息的錄入。采用省、市、縣三級(jí)聯(lián)動(dòng)的方式,根據(jù)省市縣三級(jí)信息(名稱、行政編碼等)進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)了動(dòng)態(tài)所屬關(guān)系的展現(xiàn)。
43數(shù)據(jù)整理子系統(tǒng)功能設(shè)計(jì)
431數(shù)據(jù)導(dǎo)入通過(guò)手機(jī)端與電腦的連接,可以將采集設(shè)備(手機(jī))采集的數(shù)據(jù)導(dǎo)入到電腦中。不同的手機(jī)型號(hào),連接電腦后,會(huì)出現(xiàn)不同的設(shè)備接口調(diào)試的提示和打開(kāi)功能,用戶可根據(jù)常見(jiàn)問(wèn)題,完成主流手機(jī)的調(diào)試接口的打開(kāi)操作。通過(guò)數(shù)據(jù)導(dǎo)入操作,將手機(jī)端數(shù)據(jù)導(dǎo)入到電腦端的本地?cái)?shù)據(jù)庫(kù),完成數(shù)據(jù)的無(wú)縫銜接。
432數(shù)據(jù)維護(hù)如果野外普查人員對(duì)中藥資源種類鑒別不準(zhǔn)確,內(nèi)業(yè)整理中需要對(duì)外業(yè)調(diào)查數(shù)據(jù)進(jìn)行修改,結(jié)合拍攝照片、語(yǔ)音記錄信息,對(duì)手機(jī)采集的基原信息進(jìn)行完善。
數(shù)據(jù)維護(hù)主要完成對(duì)手機(jī)端采集數(shù)據(jù)的完整性、規(guī)范性核查和補(bǔ)錄,包括基原信息完善、照片補(bǔ)錄、語(yǔ)音處理,并提供數(shù)據(jù)完整性校驗(yàn)和數(shù)據(jù)查詢功能。
433數(shù)據(jù)導(dǎo)出完成數(shù)據(jù)維護(hù)后,可將數(shù)據(jù)以標(biāo)準(zhǔn)格式導(dǎo)出。對(duì)于不符合系統(tǒng)規(guī)范的記錄,系統(tǒng)會(huì)以紅色底色標(biāo)示,提醒用戶編輯不符合規(guī)范的數(shù)據(jù)。用戶可選擇導(dǎo)出數(shù)據(jù)存放的位置。導(dǎo)出數(shù)據(jù)以Excel表格形式存放。用戶可以以基原記錄為單位進(jìn)行查看,并分為基本數(shù)據(jù)和圖片數(shù)據(jù)兩部分,其中圖片信息是以電腦位置信息的形式存放。
5小結(jié)
采集APP系統(tǒng)實(shí)現(xiàn)了快速的定位經(jīng)緯度、海拔信息,可以方便的拍攝各種類型的照片,并實(shí)現(xiàn)和中藥基原信息的自動(dòng)關(guān)聯(lián),可以通過(guò)語(yǔ)音識(shí)別功能來(lái)協(xié)助記錄中藥資源的特征、環(huán)境特征等信息,可以有效記錄標(biāo)本的采集相關(guān)信息。基于中藥資源普查數(shù)據(jù)填報(bào)客戶端的數(shù)據(jù)整理平臺(tái)實(shí)現(xiàn)了有效的輔助內(nèi)業(yè)整理,將移動(dòng)端的數(shù)據(jù)導(dǎo)出到電腦端,上傳到中藥資源數(shù)據(jù)普查填報(bào)系統(tǒng)的客戶端數(shù)據(jù)庫(kù)中。
[參考文獻(xiàn)]
[1]馬衛(wèi)峰, 孫冠楠, 張小波,等 中藥資源普查野外數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J] 中國(guó)現(xiàn)代中藥, 2013, 15(10):823
[2]張守信 GPS衛(wèi)星測(cè)量定位理論與應(yīng)用[M] 北京:國(guó)防科技大學(xué)出版社, 1996
[3]禹琳琳 語(yǔ)音識(shí)別技術(shù)及應(yīng)用綜述[J] 現(xiàn)代電子技術(shù),2013(13):43
[4]王敏妲語(yǔ)音識(shí)別技術(shù)的研究與發(fā)展[J] 微型機(jī)與應(yīng)用,2009(23):1
[5]黃璐琦,王永炎 全國(guó)中藥資源普查技術(shù)規(guī)范[M] 上海:上??茖W(xué)技術(shù)出版社,2015
[責(zé)任編輯呂冬梅]endprint