農(nóng)英雄,陸瑛,陳智斌,黃聰,黃崇峻,梁冬*,陳寧江,陳玉華
1 廣西中煙工業(yè)有限責(zé)任公司,信息中心,廣西南寧市北湖南路28號(hào) 530001;
2 廣西大學(xué),計(jì)算機(jī)與電子信息學(xué)院,廣西南寧市大學(xué)東路100號(hào) 530004;
3 廣西中煙工業(yè)有限責(zé)任公司,原料供應(yīng)部,廣西南寧市北湖南路28號(hào) 530001
物聯(lián)網(wǎng)在作物灌溉、監(jiān)測(cè)、病蟲防治、產(chǎn)品追溯等農(nóng)業(yè)領(lǐng)域具有廣泛用途,通過感知設(shè)備能夠識(shí)別、監(jiān)測(cè)、定位以及獲取各種作物信息數(shù)據(jù),并實(shí)現(xiàn)農(nóng)業(yè)精準(zhǔn)種植和管理[1-3]??緹煹纳a(chǎn)包括選種育苗、田間種植、采收初烤、分揀收購、打葉復(fù)烤和原料入庫等環(huán)節(jié),其中選種育苗和田間種植階段對(duì)煙葉的質(zhì)量和產(chǎn)量有著直接關(guān)系。李文卿等[4]發(fā)現(xiàn)推遲煙草移栽期,由于溫度提高和光照增強(qiáng),可以提高煙葉產(chǎn)量;陸永恒[5]研究和總結(jié)了影響煙葉品質(zhì)的田間氣候、土壤類型和海拔高度等主要生態(tài)條件;侯壯偉等[6]研究土壤pH值對(duì)烤煙的生長(zhǎng)發(fā)育和干物質(zhì)的影響;此外,烤煙的耕種方式和灌溉模式對(duì)煙草生長(zhǎng)和煙葉品質(zhì)也有不同作用[7-8]。煙草作為一種對(duì)環(huán)境敏感的經(jīng)濟(jì)作物,移栽期、氣候、土壤和耕作方式等因素與煙葉的質(zhì)量、產(chǎn)量有密切關(guān)系。
近年來,行業(yè)采用物聯(lián)網(wǎng)技術(shù)在烤煙的復(fù)烤、倉儲(chǔ)和產(chǎn)品追溯等環(huán)節(jié)都有相關(guān)研究,但該技術(shù)在煙草種植和管理方面的研究應(yīng)用相對(duì)較少[9-10]。吳波等[11]在烤煙物流管控方面構(gòu)建了一套基于RFID技術(shù)的精益物流管理體系,提高了作業(yè)效率;陶健等[12]研究遙感技術(shù)在大面積煙田種植和管理方面的應(yīng)用;李光雷等[13]設(shè)計(jì)的煙葉信息系統(tǒng)對(duì)煙地、育苗點(diǎn)和烤房等信息進(jìn)行采集,提高數(shù)據(jù)錄入效率和信息化管理水平,但采用物聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)對(duì)煙草種植全生命周期監(jiān)控的工作還不夠充分。
在煙草種植數(shù)據(jù)的獲取和監(jiān)控方面,目前是由農(nóng)技人員到田間手動(dòng)采集種植數(shù)據(jù),該方式存在采集周期長(zhǎng)、人力成本高、數(shù)據(jù)滯后和效率低等問題。本文所關(guān)注的“智慧煙葉”模式,即在煙葉全產(chǎn)業(yè)鏈的產(chǎn)前、產(chǎn)中及產(chǎn)后等環(huán)節(jié)以大數(shù)據(jù)分析、人工智能、農(nóng)業(yè)物聯(lián)網(wǎng)等技術(shù)作為支撐,推動(dòng)生產(chǎn)精準(zhǔn)化和智能化。為了實(shí)現(xiàn)煙草精準(zhǔn)種植和智能管理,本文研發(fā)了一套基于物聯(lián)網(wǎng)監(jiān)控的煙葉精準(zhǔn)種植管理系統(tǒng),設(shè)計(jì)了基于物聯(lián)網(wǎng)技術(shù)的多源異構(gòu)種植數(shù)據(jù)采集和傳輸機(jī)制,提出了基于機(jī)器學(xué)習(xí)的煙草精準(zhǔn)種植和智能管理方法,同時(shí)構(gòu)建了煙區(qū)煙草種植信息數(shù)據(jù)庫,為煙草精準(zhǔn)種植管理和烤煙原料生產(chǎn)提供有效數(shù)據(jù)支撐。
基于物聯(lián)網(wǎng)監(jiān)控的煙葉精準(zhǔn)種植管理系統(tǒng)采用層次結(jié)構(gòu),由感知與網(wǎng)絡(luò)層、存儲(chǔ)層、數(shù)據(jù)服務(wù)層、業(yè)務(wù)邏輯層和表示層構(gòu)成,以物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)等技術(shù)作為支撐,實(shí)現(xiàn)煙田多源異構(gòu)種植數(shù)據(jù)的實(shí)時(shí)采集、傳輸、存儲(chǔ)、處理和分析。
如圖1所示,感知與網(wǎng)絡(luò)層是關(guān)鍵層,實(shí)現(xiàn)基于物聯(lián)網(wǎng)技術(shù)的煙田氣象數(shù)據(jù)、環(huán)境數(shù)據(jù)、土壤數(shù)據(jù)和作物長(zhǎng)勢(shì)圖像等多源異構(gòu)數(shù)據(jù)的精準(zhǔn)采集和可靠傳輸,表1展示了本系統(tǒng)主要采集的數(shù)據(jù);存儲(chǔ)層主要實(shí)現(xiàn)存儲(chǔ)傳感器數(shù)據(jù)、圖像數(shù)據(jù)和煙草業(yè)務(wù)領(lǐng)域數(shù)據(jù);數(shù)據(jù)服務(wù)層主要是處理大量的種植數(shù)據(jù)和煙草領(lǐng)域數(shù)據(jù),向上為核心業(yè)務(wù)提供模型支撐,向下為構(gòu)建煙區(qū)種植知識(shí)數(shù)據(jù)庫提供有效的數(shù)據(jù)分析服務(wù);業(yè)務(wù)邏輯層是系統(tǒng)功能和應(yīng)用實(shí)現(xiàn)的核心部分,主要功能包括實(shí)時(shí)監(jiān)控、數(shù)據(jù)可視化、種植管理、用戶管理、監(jiān)控點(diǎn)管理等;表示層采用響應(yīng)式架構(gòu),實(shí)現(xiàn)界面渲染和前后端數(shù)據(jù)的響應(yīng),為移動(dòng)端和電腦端用戶提供良好的交互體驗(yàn)。
圖1 系統(tǒng)的體系結(jié)構(gòu)Fig.1 System architecture
表1 數(shù)據(jù)采集內(nèi)容Tab. 1 Data acquisition content
煙草大田種植時(shí)期包括移栽期、團(tuán)棵期、開花期和成熟期,以往煙農(nóng)依靠歷年種植經(jīng)驗(yàn)耕作,種植過程不夠精細(xì),對(duì)煙葉生長(zhǎng)狀況、產(chǎn)量和品質(zhì)監(jiān)控缺乏數(shù)據(jù)依據(jù);通過農(nóng)技人員定期到煙田采集和檢測(cè)土壤樣本、記錄煙株生長(zhǎng)狀況信息、收集錄入氣象數(shù)據(jù)的方式存在數(shù)據(jù)采集滯后、精度低、問題反饋不及時(shí)等問題。為了實(shí)現(xiàn)煙草精準(zhǔn)種植和智能管理,本系統(tǒng)主要通過兩個(gè)方面的關(guān)鍵技術(shù)來解決上述問題:(1)針對(duì)采集和傳輸煙田數(shù)據(jù),設(shè)計(jì)了一套基于物聯(lián)網(wǎng)技術(shù)的多源異構(gòu)種植數(shù)據(jù)采集和傳輸機(jī)制,實(shí)現(xiàn)種植數(shù)據(jù)的實(shí)時(shí)采集和低能耗穩(wěn)定傳輸;(2)針對(duì)煙草種植管理,提出了基于機(jī)器學(xué)習(xí)的煙草精準(zhǔn)種植和智能管理方法,訓(xùn)練兩個(gè)煙草模型,智能識(shí)別煙草大田各個(gè)生長(zhǎng)周期,并提供種植管理建議,為煙田管理人員提供決策支持。
煙草植株的生長(zhǎng)受田間氣壓、溫度、濕度、降雨量等因素的影響,煙草不同生長(zhǎng)期間對(duì)各類生態(tài)條件的要求也不同。若適當(dāng)推遲移栽期,則可縮短大田生長(zhǎng)期;若過早或過遲移栽,則對(duì)煙草的生長(zhǎng)會(huì)產(chǎn)生不利的影響[14]。通過物聯(lián)網(wǎng)傳感器實(shí)時(shí)監(jiān)測(cè)和采集煙田的各類種植數(shù)據(jù),可以為植株在不同生長(zhǎng)階段準(zhǔn)確提供合適條件。系統(tǒng)主要采集氣象、環(huán)境、土壤和作物長(zhǎng)勢(shì)圖像四類數(shù)據(jù),氣象數(shù)據(jù)包括氣壓、大氣濕度、光照輻射量、紫外線強(qiáng)度、大氣溫度、風(fēng)速和風(fēng)向等;環(huán)境數(shù)據(jù)包括降雨量和蒸騰量等;土壤數(shù)據(jù)包括土壤溫度、相對(duì)濕度和土壤pH值等;作物長(zhǎng)勢(shì)圖像包括煙草作物的各種長(zhǎng)勢(shì)圖像數(shù)據(jù)。面向這四類多源異構(gòu)的數(shù)據(jù),首先在數(shù)據(jù)采集方面設(shè)計(jì)了物聯(lián)網(wǎng)設(shè)備部署與采集規(guī)范;其次,針對(duì)戶外大田能源和網(wǎng)絡(luò)有限的情況,設(shè)計(jì)低能耗、精準(zhǔn)和穩(wěn)定的數(shù)據(jù)傳輸方案。
2.1.1 物聯(lián)網(wǎng)設(shè)備部署與采集規(guī)范
面向數(shù)據(jù)采集需求,設(shè)計(jì)物聯(lián)網(wǎng)設(shè)備部署和采集規(guī)范。首先,在基于統(tǒng)一地塊、煙株和耕作方式的原則下,在煙田部署氣象和環(huán)境數(shù)據(jù)采集傳感器。其次,根據(jù)煙株根系生長(zhǎng)發(fā)育特點(diǎn),在土壤數(shù)據(jù)采集方面,設(shè)計(jì)了一種分層土壤監(jiān)測(cè)采集傳感器,用于監(jiān)測(cè)和采集土壤狀況。煙株根系的生長(zhǎng)發(fā)育和生長(zhǎng)環(huán)境關(guān)系到植株對(duì)養(yǎng)分的吸收,直接影響到煙葉的產(chǎn)量和品質(zhì)[15]。在煙株旺長(zhǎng)前期,根系的根重和根長(zhǎng)僅分布在0~20 cm的土層;在旺長(zhǎng)期至打頂期,根系生長(zhǎng)到20~40 cm的土層;在成熟期,根系在0~40 cm土層內(nèi)迅速增加,并開始深入到40~80 cm土層內(nèi)。煙草的根重、根長(zhǎng)、根表面積及活躍吸收面積主要集中在0~20 cm的土層中,其次是20~40 cm的土層[16]。因此,本系統(tǒng)的分層土壤監(jiān)測(cè)采集傳感器設(shè)計(jì)如下:在煙田放置傳感器時(shí)分別在15cm和30cm處放置土壤溫濕度和pH值傳感器,監(jiān)測(cè)和采集煙草根系的生長(zhǎng)環(huán)境信息,如圖2所示。
圖2 分層土壤傳感器示意圖Fig.2 Schematic of layered soil sensor
2.1.2 基于物聯(lián)網(wǎng)技術(shù)的數(shù)據(jù)傳輸方案
為了適應(yīng)野外田間用電問題和保證數(shù)據(jù)穩(wěn)定可靠傳輸,系統(tǒng)采用低能耗和穩(wěn)定的數(shù)據(jù)傳輸方案,采用太陽能供電、低能耗通信技術(shù),傳感器采用低能耗無線通信ZigBee技術(shù)的傳輸模塊,并組網(wǎng)。種植數(shù)據(jù)通過ZigBee技術(shù)匯集到數(shù)據(jù)網(wǎng)關(guān),并通過蜂窩移動(dòng)網(wǎng)絡(luò)以4G/3G網(wǎng)絡(luò)的方式傳輸?shù)竭h(yuǎn)程存儲(chǔ)服務(wù)器并進(jìn)行數(shù)據(jù)持久化,如圖3所示。煙田的氣象傳感器、環(huán)境傳感器和土壤傳感器的采集周期為2次/每小時(shí),監(jiān)控相機(jī)拍攝圖像周期2次/每天,當(dāng)數(shù)據(jù)匯集到數(shù)據(jù)網(wǎng)關(guān)之后就會(huì)進(jìn)入待機(jī)模式。至此,實(shí)現(xiàn)了多源異構(gòu)種植數(shù)據(jù)的采集和傳輸。
基于機(jī)器學(xué)習(xí)的煙草精準(zhǔn)種植和智能管理方法,包括兩個(gè)部分:大田種植期分類模型和基于決策樹算法的智能管理模型。首先,通過歷年采集到的作物長(zhǎng)勢(shì)數(shù)據(jù),采用神經(jīng)網(wǎng)絡(luò)技術(shù)訓(xùn)練大田種植期分類模型,對(duì)種植時(shí)期進(jìn)行分類;其次,關(guān)聯(lián)大田種植分類模型的輸出數(shù)據(jù),訓(xùn)練基于決策樹算法的煙草智能管理模型,根據(jù)實(shí)時(shí)種植數(shù)據(jù),反饋?zhàn)罴逊N植管理建議,為煙田管理提供數(shù)據(jù)依據(jù)。
圖3 數(shù)據(jù)采集示意圖Fig.3 Schematic of data collection
2.2.1 大田種植期分類模型
為了訓(xùn)練煙草大田種植期分類模型,通過采集設(shè)備收集足夠的煙葉圖像數(shù)據(jù),把圖像數(shù)據(jù)劃分為4個(gè)類別:團(tuán)棵前期、旺長(zhǎng)期、開花期和成熟期,并將其作為標(biāo)注數(shù)據(jù)集。為了增加圖像數(shù)據(jù)的多樣性以及提高模型的泛化性,通過圖像增強(qiáng)技術(shù)對(duì)圖像數(shù)據(jù)進(jìn)行隨機(jī)色彩變更、旋轉(zhuǎn)、縮放和加噪,進(jìn)一步擴(kuò)充數(shù)據(jù)集。模型采用基于ResNet-50[17]和MobileNet[18-19]的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以4種時(shí)期的標(biāo)注數(shù)據(jù)作為輸入,其中訓(xùn)練集占70%,測(cè)試集為20%,驗(yàn)證集為10%,共計(jì)10080張圖像數(shù)據(jù),訓(xùn)練煙草大田種植期分類模型。通過對(duì)數(shù)據(jù)的圖像處理,模型性能得到增強(qiáng),最終模型準(zhǔn)確率從83%提高到95%。表2為使用圖像增強(qiáng)處理數(shù)據(jù)集前后模型準(zhǔn)確率對(duì)比表。
表2 模型效果Tab. 2 Effect of model
在模型測(cè)試過程中,發(fā)現(xiàn)模型對(duì)于相鄰的煙草生長(zhǎng)期圖像分類準(zhǔn)確率不高,例如旺長(zhǎng)期與開花期的過渡階段,模型難以準(zhǔn)確分類。為此,通過設(shè)置多個(gè)分類器模型對(duì)不同方向和角度的n個(gè)圖像數(shù)據(jù)集分類,第i類圖像數(shù)據(jù)集為di , i∈n,訓(xùn)練后的n個(gè)分類模型為f1(d1),f2(d2),…fn(dn),然后計(jì)算多個(gè)分類器模型識(shí)別圖像的結(jié)果,將多數(shù)類的模型結(jié)果作為最終的識(shí)別效果,大田種植期分類模型結(jié)果計(jì)為Result,如式(1)所示。
最終通過多張不同圖片作為輸入選取多數(shù)類模型結(jié)果Result,優(yōu)化模型分類效果,至此完成大田種植期分類模型的訓(xùn)練。該模型可以通過煙田作物圖片,識(shí)別大田種植期,為種植管理提供服務(wù)支撐。圖4為使用圖像增強(qiáng)技術(shù)生成的圖像數(shù)據(jù);圖5為模型識(shí)別的煙草生長(zhǎng)期,其中(a)為團(tuán)棵前期,(b)為旺長(zhǎng)期,(c)為開花期,(d)為成熟期。
圖4 圖像增強(qiáng)Fig.4 Image enhancement
2.2.2 基于決策樹算法的煙草智能管理模型
在大田種植期分類模型的基礎(chǔ)上,結(jié)合模型輸出的煙草大田種植期數(shù)據(jù)和采集的氣象數(shù)據(jù)、環(huán)境數(shù)據(jù)、土壤數(shù)據(jù)以及種植管理數(shù)據(jù),訓(xùn)練生成煙草智能管理模型。該模型采用決策樹算法[20-21]訓(xùn)練。模型訓(xùn)練分為兩步:第一步是通過訓(xùn)練數(shù)據(jù)集進(jìn)行學(xué)習(xí),構(gòu)建決策樹模型;第二步是利用構(gòu)建的決策樹模型進(jìn)行驗(yàn)證和測(cè)試應(yīng)用。在使用決策樹模型對(duì)新數(shù)據(jù)樣本進(jìn)行分類時(shí),從根節(jié)點(diǎn)開始逐步對(duì)該樣本的屬性進(jìn)行測(cè)試,并沿著相應(yīng)的分支向下行走,直至到達(dá)某個(gè)葉節(jié)點(diǎn),此時(shí)葉節(jié)點(diǎn)所代表的類型即為該樣本的類型。表3展示了模型數(shù)據(jù)集樣本信息。
表3 數(shù)據(jù)樣本Tab. 3 Data sample
計(jì)算信息增益的方法為:
其中,數(shù)據(jù)集S的經(jīng)驗(yàn)熵(empirical entropy)H(S)如下計(jì)算:
計(jì)算特征A對(duì)數(shù)據(jù)集S的經(jīng)驗(yàn)條件熵(empirical conditional entropy)H(S|A):
通過計(jì)算信息增益,取最大信息增益率的屬性作為測(cè)試屬性,基于決策樹算法的煙草智能管理模型自上而下地完成決策樹的建樹過程,以煙草大田種植期數(shù)據(jù)、氣象數(shù)據(jù)、環(huán)境數(shù)據(jù)、土壤數(shù)據(jù)、煙區(qū)農(nóng)技人員田間管理數(shù)據(jù)作為模型輸入。該模型對(duì)超過生長(zhǎng)期指標(biāo)的閾值參數(shù)進(jìn)行警報(bào),并根據(jù)煙草種植的進(jìn)程指標(biāo)、生長(zhǎng)狀況指標(biāo)和生態(tài)影響因子,動(dòng)態(tài)反饋給系統(tǒng)管理員和技術(shù)人員,為精準(zhǔn)種植提供依據(jù)。同時(shí)把實(shí)時(shí)采集煙葉種植數(shù)據(jù),進(jìn)行清洗、關(guān)聯(lián)和融合,存儲(chǔ)到數(shù)據(jù)庫中,形成煙草生長(zhǎng)種植信息數(shù)據(jù)庫。模型構(gòu)建流程如圖6所示。
圖6 煙草智能管理模型構(gòu)建流程Fig.6 Construction process of smart tobacco management model
通過在靖西煙區(qū)建立實(shí)驗(yàn)基地部署系統(tǒng),對(duì)系統(tǒng)效果進(jìn)行驗(yàn)證。
圖7為系統(tǒng)實(shí)時(shí)采集的煙田種植數(shù)據(jù)界面,數(shù)據(jù)采集間隔為一小時(shí);圖8是數(shù)據(jù)可視化界面,對(duì)多維數(shù)據(jù)可視化展示。
表4對(duì)比了系統(tǒng)部署前后的應(yīng)用效果。
系統(tǒng)應(yīng)用后,在數(shù)據(jù)采集方式上,改變了人工采樣、送檢、記錄的方式,大大減少了農(nóng)技人員出工的次數(shù)和工作量。原來在煙草種植期間,每名農(nóng)技人員負(fù)責(zé)和管理500畝煙田,平均每周要用4天時(shí)間到煙田采集數(shù)據(jù)。系統(tǒng)替代了人工數(shù)據(jù)采集的方式后,農(nóng)技人員只需要針對(duì)問題煙田進(jìn)行實(shí)地考察和記錄,平均每周用時(shí)1天,節(jié)省了75%工時(shí)。采集頻率由原來每周采集一次,轉(zhuǎn)變?yōu)閷?shí)時(shí)采集,效率大大提高。同時(shí),擴(kuò)大了數(shù)據(jù)采集種類,包括了氣象數(shù)據(jù)、環(huán)境數(shù)據(jù)、土壤數(shù)據(jù)以及煙草長(zhǎng)勢(shì)數(shù)據(jù),每個(gè)監(jiān)測(cè)點(diǎn)平均每天產(chǎn)生不少于270條數(shù)據(jù),由此可以建立煙草生長(zhǎng)信息數(shù)據(jù)庫和管理知識(shí)庫。
圖7 實(shí)時(shí)監(jiān)控界面Fig.7 Real-time monitoring interface
圖8 數(shù)據(jù)可視化Fig.8 Data visualization
表4 系統(tǒng)應(yīng)用效果Tab. 4 Effect of the system application
農(nóng)技人員根據(jù)系統(tǒng)反饋信息,可實(shí)時(shí)了解煙田種植情況,督促和推進(jìn)各個(gè)環(huán)節(jié)的進(jìn)度,省去了多部門匯報(bào)或?qū)嵉靥讲斓拳h(huán)節(jié),工作效率得到很大提高。表5為農(nóng)技人員工作效果對(duì)比表,對(duì)比了系統(tǒng)應(yīng)用前后的變化。
表5 農(nóng)技人員工作效果對(duì)比Tab. 5 Comparison of working effect of agricultural technical personnel
系統(tǒng)采用物聯(lián)網(wǎng)技術(shù)對(duì)煙田煙草生長(zhǎng)全生命周期監(jiān)測(cè),實(shí)時(shí)采集種植數(shù)據(jù)和監(jiān)測(cè)煙田環(huán)境,推進(jìn)了煙草種植向數(shù)字化、精準(zhǔn)化發(fā)展,在廣西靖西基地試驗(yàn)取得良好效果。在現(xiàn)有基礎(chǔ)上,下一步對(duì)煙草生長(zhǎng)期干預(yù)條件進(jìn)行實(shí)驗(yàn),探索影響煙葉產(chǎn)量、質(zhì)量的關(guān)鍵影響因子,為智慧煙葉生產(chǎn)提供科學(xué)支撐。