尹 航,廖梓淵,徐龍琴,劉雙印,曹 亮,郭建軍
(1.仲愷農(nóng)業(yè)工程學院信息科學與技術學院,廣東 廣州 510225;2.仲愷農(nóng)業(yè)工程學院智慧農(nóng)業(yè)創(chuàng)新研究院,廣東 廣州 510225;3.仲愷農(nóng)業(yè)工程學院廣東省高校智慧農(nóng)業(yè)工程技術研究中心,廣東 廣州 510225;4.仲愷農(nóng)業(yè)工程學院廣東省農(nóng)產(chǎn)品安全大數(shù)據(jù)工程技術研究中心,廣東 廣州 510225)
據(jù)聯(lián)合國糧食及農(nóng)業(yè)組織(FAO)發(fā)布數(shù)據(jù)顯示,中國是世界上最大的對蝦產(chǎn)品國和貿(mào)易國,養(yǎng)殖份額占全球份額的45%以上,對蝦產(chǎn)業(yè)在出口創(chuàng)匯、促進就業(yè)和保證糧食安全等方面起到不可或缺的作用[1-4]。然而,據(jù)聯(lián)合國貿(mào)易統(tǒng)計庫數(shù)據(jù),我國對蝦產(chǎn)業(yè)的行業(yè)競爭力與世界主要對蝦出口國家相比仍然存在一定的差距[1,2,5];我國對蝦養(yǎng)殖產(chǎn)業(yè)存在組織化程度低、市場信息掌握不及時等問題[6];養(yǎng)殖企業(yè)缺乏完善的對蝦養(yǎng)殖管理、經(jīng)營信息,不能依據(jù)市場變化有計劃調(diào)節(jié)對蝦養(yǎng)殖規(guī)模,往往導致“規(guī)模大、收益低”的怪現(xiàn)狀[6,7],阻礙了我國對蝦產(chǎn)業(yè)的有序發(fā)展及核心競爭力的提升[6-9]。近年來我國集約化、工廠化對蝦養(yǎng)殖技術得到快速發(fā)展,以循環(huán)水、生物凈化等為代表的對蝦養(yǎng)殖模式得到大力推廣[10-13],以中國水產(chǎn)科學研究院、中國海洋大學主導的間歇式雙循環(huán)對蝦智能化工廠化養(yǎng)殖技術快速發(fā)展,物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等現(xiàn)代化技術在產(chǎn)業(yè)內(nèi)廣泛應用,積累了海量的對蝦養(yǎng)殖生產(chǎn)過程及產(chǎn)業(yè)數(shù)據(jù)[11-15]。但是由于關注點不同,研究者多把注意力放在環(huán)境、水體、生物指標等數(shù)據(jù)上,對蝦養(yǎng)殖生產(chǎn)過程投喂、物料、經(jīng)營成本、收益等產(chǎn)業(yè)數(shù)據(jù)并未受到研究者重視[11-17];而對蝦養(yǎng)殖生產(chǎn)經(jīng)營者由于能力限制無法對養(yǎng)殖過程數(shù)據(jù)尤其是產(chǎn)業(yè)相關數(shù)據(jù)進行專業(yè)化的分析和處理,海量的對蝦產(chǎn)業(yè)數(shù)據(jù)沒有得到充分利用[1,2,6,17]。
與此同時,我國普通水產(chǎn)養(yǎng)殖信息化管理領域發(fā)展迅速[18],專家學者在水產(chǎn)養(yǎng)殖生產(chǎn)過程及產(chǎn)業(yè)數(shù)據(jù)分析和處理領域進行了大量的研究,并取得了不錯的成果[18-21]。陳明等[22]針對目前水產(chǎn)養(yǎng)殖過程管理中缺乏有效的流程化管理、養(yǎng)殖決策效率低等問題,采用Activiti 可視化流程設計器和Drools 規(guī)則引擎構建了一種基于規(guī)則引擎的智能工作流管理系統(tǒng)體系結構,使養(yǎng)殖管理更科學化、規(guī)范化;劉傳領等[23]針對大面積水產(chǎn)養(yǎng)殖環(huán)境覆蓋面積廣、多種水體環(huán)境監(jiān)測因素綜合影響的特點,采用LoRa 無線通信技術實現(xiàn)水質(zhì)數(shù)據(jù)的傳輸,并調(diào)用ECharts 可視化庫實現(xiàn)數(shù)據(jù)的展示;謝奎等[24]以國產(chǎn)高分一號遙感影像為數(shù)據(jù)源,結合WebGIS 技術建立了一個水產(chǎn)養(yǎng)殖信息管理平臺,實現(xiàn)了水體資源管理、養(yǎng)殖生產(chǎn)管理以及市場信息管理等功能;姜麗華等[25]為提高水產(chǎn)養(yǎng)殖行業(yè)生產(chǎn)管理水平,采用物聯(lián)網(wǎng)等技術完成漁業(yè)信息自動化采集,圍繞漁業(yè)養(yǎng)殖信息的數(shù)據(jù)集成與共享等方面的研究,研發(fā)了一套支持漁情實時采集、集成、共享、推送的信息服務平臺;代成等[26]采用Hadoop、人工智能等技術,搭建了一套水產(chǎn)養(yǎng)殖檢測系統(tǒng),并使用Oracle BI 對水產(chǎn)數(shù)據(jù)的分析和挖掘結果進行可視化展示。LI 等[27]采用GIS 等技術,根據(jù)地理位置和物種類別生成了水產(chǎn)養(yǎng)殖產(chǎn)量可視化圖,為用戶提供了出色的統(tǒng)計分析結果。劉斌[28]運用ECharts 技術開展了海洋水文數(shù)據(jù)可視化研究;路文娟[29]則采用ECharts+NewMap API 技術實現(xiàn)了地理數(shù)據(jù)的可視化;國內(nèi)亦有專家學者將其應用于效益評估、流量統(tǒng)計等鄰域[30,31],其通過多維度的交互操作和視覺映射組件,將不同維度的數(shù)據(jù)通過顏色、大小、透明度等不同的視覺方式展現(xiàn),從而直觀地表現(xiàn)數(shù)據(jù)[23,28-31],尤其適用于養(yǎng)殖過程及產(chǎn)業(yè)數(shù)據(jù)可視化展示及后續(xù)專業(yè)化分析和處理[32]。上述專家學者在普通水產(chǎn)養(yǎng)殖信息化管理領域的研究已經(jīng)取得了豐碩的成果,但相關研究在對蝦養(yǎng)殖領域應用尚少,尤其對蝦養(yǎng)殖過程數(shù)據(jù)及產(chǎn)業(yè)相關數(shù)據(jù)的專業(yè)化分析和處理明顯不足。因此,充分利用對蝦產(chǎn)業(yè)數(shù)據(jù)構建可視化分析平臺,針對其數(shù)據(jù)量大、時效性強、數(shù)據(jù)來源復雜特性,結合Echarts 技術搭建可視化分析平臺實時,動態(tài)地分析對蝦生產(chǎn)到銷售各關鍵環(huán)節(jié)的有效性信息,并據(jù)此開展深入的行業(yè)分析和產(chǎn)業(yè)化研究;對提高我國對蝦養(yǎng)殖信息化與可視化管理水平,提升對蝦養(yǎng)殖行業(yè)核心競爭力及收益具有重要的社會意義及商業(yè)價值。
綜上所述,本文設計并實現(xiàn)了對蝦養(yǎng)殖產(chǎn)業(yè)數(shù)據(jù)可視化分析平臺,描述了對蝦養(yǎng)殖產(chǎn)業(yè)數(shù)據(jù)可視化分析平臺的主要任務;詳細介紹了平臺的總體架構設計、數(shù)據(jù)庫設計、功能模塊設計;介紹了主要功能模塊的實現(xiàn)過程及核心技術;設計了基于ARIMA 的對蝦價格預測模型,并據(jù)此提供了專業(yè)化的對蝦養(yǎng)殖產(chǎn)業(yè)行情分析和一張圖行業(yè)行情數(shù)據(jù)展示。此外,還提供了產(chǎn)業(yè)發(fā)展趨勢、市場動態(tài)等信息化展示功能,為企業(yè)發(fā)展規(guī)劃和戰(zhàn)略決策提供可視化數(shù)據(jù)支撐。
本系統(tǒng)總體設計遵循現(xiàn)代軟件工程“高內(nèi)聚、低耦合”的設計思想,采用微服務架構、前后端分離的設計模式[33-35]。總體架構分為4 層:數(shù)據(jù)存儲層、數(shù)據(jù)訪問層、業(yè)務邏輯層和數(shù)據(jù)可視化層,如圖1 所示。
圖1 對蝦產(chǎn)業(yè)數(shù)據(jù)可視化分析平臺總體架構Fig.1 Overall architecture of shrimp industry data visualization analysis platform
在對蝦養(yǎng)殖產(chǎn)業(yè)數(shù)據(jù)可視化分析平臺架構中,各層包含的主要內(nèi)容及作用如下:
1)數(shù)據(jù)存儲層。以對蝦產(chǎn)業(yè)數(shù)據(jù)和養(yǎng)殖基地數(shù)據(jù)為基礎構建數(shù)據(jù)庫,采用MySQL 作為數(shù)據(jù)庫管理系統(tǒng),管理員通過爬取網(wǎng)絡上的對蝦產(chǎn)業(yè)數(shù)據(jù)和各水產(chǎn)交易網(wǎng)站的對蝦價格數(shù)據(jù)對數(shù)據(jù)庫進行更新,并通過系統(tǒng)管理功能對數(shù)據(jù)進行維護。當系統(tǒng)數(shù)據(jù)更新后,系統(tǒng)對新爬取的數(shù)據(jù)進行展示與計算,從而為數(shù)據(jù)可視化平臺的實現(xiàn)提供數(shù)據(jù)支持。
2)數(shù)據(jù)訪問層。采用JDBC 數(shù)據(jù)連接管理方法從對蝦產(chǎn)業(yè)信息和基地信息等數(shù)據(jù)庫中抽取相關數(shù)據(jù),將結果集轉換為實體對象,并傳輸給業(yè)務邏輯層。
3)業(yè)務邏輯層。本層用于封裝業(yè)務邏輯,即對數(shù)據(jù)存儲層的數(shù)據(jù)進行分析和處理,以Json 數(shù)據(jù)的形式發(fā)送給數(shù)據(jù)表示層,返回用戶請求的信息;實現(xiàn)用戶管理、數(shù)據(jù)維護、數(shù)據(jù)動態(tài)展示等功能;將算法預測模型獨立為一個模塊,使用服務調(diào)用的方式實現(xiàn)數(shù)據(jù)的傳輸,降低系統(tǒng)的耦合度。
4)數(shù)據(jù)表示層。采用Servlet 動態(tài)網(wǎng)頁開發(fā)技術實現(xiàn)分析平臺Web 數(shù)據(jù)可視化,并以此Web 平臺為載體,采用ECharts 可視化工具將從業(yè)務邏輯層獲取到的數(shù)據(jù)以圖表的形式直觀地展示在Web 平臺的前端頁面上,從而,為用戶提供一個可以直觀查看對蝦產(chǎn)業(yè)數(shù)據(jù)的可視化平臺。
通過對現(xiàn)有可視化平臺進行分析,結合用戶需求,對蝦養(yǎng)殖產(chǎn)業(yè)數(shù)據(jù)可視化分析平臺功能設計如下:數(shù)據(jù)獲取、預測模型、數(shù)據(jù)可視化分析展示和系統(tǒng)維護。具體功能模塊如圖2 所示。
圖2 系統(tǒng)功能模塊框圖Fig.2 Block diagram of system function module
各功能模塊描述如下:
1)數(shù)據(jù)獲取。通過訪問各水產(chǎn)交易數(shù)據(jù)庫、交易網(wǎng)站及數(shù)據(jù)查新[36]獲取實時價格信息;從基地管理模塊獲取對蝦養(yǎng)殖基地的養(yǎng)殖信息;用戶根據(jù)本基地的養(yǎng)殖現(xiàn)狀導入對蝦養(yǎng)殖數(shù)據(jù)。
2)預測模型。以平臺錄入的對蝦價格數(shù)據(jù)作為訓練集對算法模型進行訓練,然后以近期采集的價格數(shù)據(jù)作為預測輸入,對對蝦價格進行預測。
3)數(shù)據(jù)可視化分析展示。使用ECharts 開源可視化庫,展示與對蝦產(chǎn)業(yè)相關的數(shù)據(jù),包括對蝦產(chǎn)量、養(yǎng)殖面積、交易額、歷史價格、養(yǎng)殖基地的分布及其發(fā)展情況、銷售地區(qū)分析、加工方式及利潤比分析,為對蝦養(yǎng)殖行業(yè)的從業(yè)者提供一定的參考價值。
4)系統(tǒng)維護。此模塊包括用戶管理和數(shù)據(jù)維護,實現(xiàn)對對蝦產(chǎn)業(yè)數(shù)據(jù)進行維護和對用戶進行管理等功能。
對蝦養(yǎng)殖產(chǎn)業(yè)數(shù)據(jù)可視化分析平臺采用MySQL數(shù)據(jù)庫管理數(shù)據(jù)信息,并采用InnoDB 存儲引擎進行數(shù)據(jù)存儲,其數(shù)據(jù)庫ER 圖如圖3 所示。
圖3 數(shù)據(jù)庫系統(tǒng)ER 圖Fig.3 ER diagram of database system
系統(tǒng)的數(shù)據(jù)庫主要的數(shù)據(jù)表有地區(qū)信息表、基地信息表和產(chǎn)業(yè)信息表,如表1—表3 所示。
表1 地區(qū)信息表結構設計Tab.1 Structure design of regional information
表2 基地信息表結構設計Tab.2 Structure design of base information
表3 產(chǎn)業(yè)信息表結構設計Tab.3 Structure design of industry information
在前期研究中,基于ARIMA 模型、以及基于BP、LSTM 和ARIMA 的組合模型被用于價格預測[37,38];基于有序Logistic 回歸分析模型也被用于對蝦養(yǎng)殖經(jīng)濟效益影響因素分析[39];作者團隊也曾采用基于WTD-LSTM 模型對對蝦養(yǎng)殖水溫開展組合預測,并獲得不錯效果[40]。本文擬采用的ARIMA(差分自回歸移動平均)模型屬于時間序列分析,ARIMA 的前序模型如AR/MA/ARMA模型必須滿足平穩(wěn)性的要求,而ARIMA 模型通過對非平穩(wěn)性時間序列進行差分處理,使時間序列滿足平穩(wěn)要求,再在此基礎上建立差分自回歸移動平均模型以實現(xiàn)預測能效。
本文采用ARIMA(p,q,d)模型構建了對蝦產(chǎn)品價格預測模型,其中AR 表示自回歸模型,MA 為移動平均模型,為p、q 為各自對應階數(shù),d 為使之成為平穩(wěn)序列所做的差分次數(shù)。自回歸系數(shù)多項式;為移動平滑系數(shù)多項式;為零均值白噪聲序列。
ARIMA 預測模型構建步驟如下:
1)數(shù)據(jù)預處理。將數(shù)據(jù)集按對蝦種類和時間排好序,并且對缺失的數(shù)據(jù)做填值處理。
2)模型識別。對蝦類價格數(shù)據(jù)的序列,通過單位根檢驗法檢驗其平穩(wěn)性。若檢驗結果存在單位根,則說明原序列不平穩(wěn),需利用ADF 檢驗確定差分的階數(shù)d,對該組序列進行d 階差分處理。若沒有檢驗出單位根,則說明原序列平穩(wěn),無需進行差分平穩(wěn)化處理。
3)模型定階。通過類似網(wǎng)格搜索的方式,利用BIC 準則對不同的p、q 組合進行評估,確定模型的最佳階數(shù)p 和q。
4)殘差白噪聲檢驗。選擇最終模型之后,還需要對殘差項進行白噪聲檢驗。如果殘差存在自相關,則應考慮增加自回歸或滑動平均的解釋,重新建模并且進行模型評估,再對新模型的殘差進行白噪聲檢驗,如此往復,直到確定殘差為白噪聲為止。
5)模型預測。運用每組對蝦價格數(shù)據(jù)建立起來的模型,預測相應日期對應的的對蝦價格,并和實際的價格進行比較。
ARIMA 模型建立流程如圖4 所示。
圖4 ARIMA 模型建立流程圖Fig.4 Flow chart of ARIMA model establishment
本平臺集成開發(fā)環(huán)境為IDEA、WebStorm,后端開發(fā)采用Spring+Spring MVC+MyBatis 框架,前端開發(fā)采用Vue+IviewUI 架構;平臺運行基于MySQL 數(shù)據(jù)庫和JDK1.8+Tomcat8.0 軟件環(huán)境。
平臺主要任務包括:①為養(yǎng)殖生產(chǎn)者提供生產(chǎn)及管理信息,如苗種培育、飼料投喂、養(yǎng)殖成本、產(chǎn)品銷售等;②為養(yǎng)殖企業(yè)決策者提供整個行業(yè)的生產(chǎn)和市場等宏觀信息,如相關政策法規(guī)、各類對蝦及其加工制品的銷售情況和所得利潤占比、產(chǎn)值、銷量、未來市場價格預測等信息,以便及時調(diào)整企業(yè)經(jīng)營策略,應對市場波動。
系統(tǒng)運行界面如圖5 所示,用戶可以查詢?nèi)珖w對蝦產(chǎn)業(yè)的情況,地圖上的標點代表養(yǎng)殖基地,用柱狀圖、折線圖、餅狀圖等方式輪播展示歷年交易量、交易額、養(yǎng)殖面積等信息;同時可將地圖進行放大縮小,從整體到局部了解養(yǎng)殖基地的分布情況。
圖5 對蝦大數(shù)據(jù)可視化平臺界面Fig.5 Big data visualization platform interface
系統(tǒng)還可以展示國內(nèi)不同地區(qū)的對蝦產(chǎn)業(yè)信息,以廣東省為例,如圖6 所示,地圖上標點的大小表示對蝦養(yǎng)殖基地的規(guī)模,點擊基地標點,可展示基地當前經(jīng)營情況、養(yǎng)殖對蝦種類、養(yǎng)殖規(guī)模等。
圖6 廣東省對蝦產(chǎn)業(yè)數(shù)據(jù)集成平臺Fig.6 Guangdong shrimp industry data integration platform
點擊基地標點,進入對蝦養(yǎng)殖產(chǎn)業(yè)核心基地詳情頁面,如圖7 所示。
圖7 對蝦產(chǎn)業(yè)基地頁面Fig.7 Shrimp industry base page
頁面展示基地概況、近期交易訂單等信息,左上方柱狀圖為池塘投放蝦苗量,左下為蝦苗投放量和對蝦產(chǎn)量,以餅狀圖的形式表示占比,移動光標至對應扇區(qū),可顯示具體數(shù)值,頁面右邊區(qū)域展示基地農(nóng)資的使用、存儲信息。
圖8 為環(huán)境監(jiān)測界面,選擇所使用的傳感器設備,采用ARIMA 算法對對蝦養(yǎng)殖池塘的溶解氧、水溫、pH 值等參數(shù)指標進行預測預警,為現(xiàn)場工作人員進行水質(zhì)調(diào)控提供決策支持。
圖8 某產(chǎn)業(yè)基地環(huán)境監(jiān)測及水質(zhì)預測界面Fig.8 Environmental monitoring interface of an industrial base
從各大水產(chǎn)交易信息網(wǎng)站中爬取不同種類對蝦的歷史價格,經(jīng)過平穩(wěn)性檢驗、差分處理,得到平穩(wěn)的時間序列,再采用BIC 準則選擇符合要求的參數(shù),最終確定模型,輸出測試結果。在穩(wěn)定的市場環(huán)境中,ARIMA 模型能夠取得較好的預測效果,其結果對對蝦養(yǎng)殖企業(yè)的決策者把握市場形勢有一定借鑒意義。
本平臺實現(xiàn)了對蝦產(chǎn)業(yè)信息的高效集成,支持全國范圍內(nèi)各省市大型對蝦養(yǎng)殖企業(yè)經(jīng)營狀況查詢,收錄了廣東地區(qū)各大對蝦養(yǎng)殖基地的產(chǎn)量、養(yǎng)殖面積、經(jīng)營狀況等信息;同時以各類圖表的方式展示了對蝦行業(yè)宏觀市場信息,提供價格預測等功能,有效解決對蝦行業(yè)產(chǎn)業(yè)信息散亂,市場信息掌握不及時等問題。
本文以對蝦產(chǎn)業(yè)數(shù)據(jù)為基礎,基于ECharts、Servlet、Tomcat、爬蟲等相關技術研制了一個基于B/S架構的Web 對蝦產(chǎn)業(yè)數(shù)據(jù)可視化分析平臺,平臺采用微服務架構進行開發(fā),采用前后端分離架構設計,遵循現(xiàn)代軟件工程高內(nèi)聚低耦合的設計思想,具有良好的可移植性、獨立性、可伸縮性、安全性和高可用性。本平臺實現(xiàn)了對蝦產(chǎn)業(yè)信息的高效集成,以各類圖表的方式為用戶直觀地展示了養(yǎng)殖管理信息和宏觀市場信息,為對蝦企業(yè)經(jīng)營者提供具有一定參考價值的可視化數(shù)據(jù)支持。