苑嚴偉 孫國慶 劉陽春 王 猛 趙 博 汪鳳珠
(中國農業(yè)機械化科學研究院集團有限公司土壤植物機器系統(tǒng)技術國家重點實驗室,北京 100083)
近年來,冷鏈物流規(guī)模迅速發(fā)展[1]。冷鏈儲運環(huán)境的品質對貨物尤為重要,在眾多環(huán)境因子中,車廂內溫度和濕度為關鍵因素,異常的溫濕度環(huán)境會造成儲運環(huán)境內細菌滋生,污染貨物,從而嚴重影響貨物的品質。因此,研究高效、精準的冷鏈儲運環(huán)境監(jiān)測方法是保證運輸物品安全和品質的重要前提。
目前國內外學者針對冷鏈監(jiān)測進行了大量的研究[2-12],取得了一定的成果[13-16]。這些研究僅對冷鏈運輸當前環(huán)境因子實時監(jiān)測,無法對環(huán)境因子的變化趨勢作出預判,只靠傳感器監(jiān)測數(shù)據(jù)來決定制冷機組運行狀態(tài),其數(shù)據(jù)采集的反饋與調控措施的生效都存在滯后性,致使冷藏車廂內的環(huán)境狀態(tài)低于臨界狀態(tài)時才進行補救,常造成經濟損失。通過試驗測試得到,在開啟制冷機組設備35 min后冷藏車廂環(huán)境可以得到明顯改善。因此,需要對冷藏車廂內環(huán)境因子變化提前預測,從而提前決定環(huán)境控制設備的運行狀態(tài),實現(xiàn)環(huán)境優(yōu)化控制、降低控制滯后效果。
近年來深度學習因其可以實現(xiàn)高維函數(shù)的逼近,并具有強大的函數(shù)映射能力,逐漸成為研究熱點[17-22]。在眾多深度學習算法中,長短時記憶神經網(wǎng)絡(LSTM)作為循環(huán)神經網(wǎng)絡的特殊變種,被廣泛地應用到各個領域,文獻[23]提出了基于主成分分析和LSTM神經網(wǎng)絡的水產養(yǎng)殖溶解氧預測模型;文獻[24]提出了基于LSTM和XGBoost的超短期電力組合預測模型;文獻[25]利用長短期記憶神經網(wǎng)絡預測某柴油機的NOx排放。LSTM神經網(wǎng)絡對于時序數(shù)據(jù)能夠很好地建模,適宜解決冷鏈環(huán)境溫濕度預測問題,能夠有效提高預測精度。
因此,在前人研究的基礎上,本文提出并構建基于K-medoids和LSTM的冷鏈運輸多步預測模型,該模型首先利用K-medoids算法將歷史溫濕度數(shù)據(jù)進行空間數(shù)據(jù)融合,然后采用LSTM網(wǎng)絡構建溫濕度變化預測模型,以此實現(xiàn)冷鏈儲運環(huán)境溫濕度變化的準確預測。
本試驗于舟山興業(yè)集團的大型重卡冷藏車內進行,冷鏈運輸路線:浙江省舟山市—北京市大興區(qū)。所選冷藏車長為14 m、寬為2.3 m、高為2.5 m,廂體材料為聚氨酯隔溫材料,運輸食品為舟山帶魚、梭子蟹。結合車廂大小、已有制冷設備和貨物擺放情況,選取15個點位安裝傳感器,具體分布示意圖如圖1所示。
圖1 傳感器分布示意圖Fig.1 Diagram of sensor distribution
采用自行設計的冷鏈運輸遠程監(jiān)測系統(tǒng)獲取試驗冷藏車廂溫濕度數(shù)據(jù),進行實時在線采集,其系統(tǒng)構架如圖2所示。
圖2 系統(tǒng)構架圖Fig.2 Structure diagram of monitoring system1.云服務器 2.基站 3.4G dtu 數(shù)據(jù)傳輸單元 4.溫濕度采集節(jié)點 5.北斗定位系統(tǒng) 6.車載終端 7.PC終端
試驗時間為2020年11月15日—12月13日,設定每1 min采集1次數(shù)據(jù),24 h連續(xù)采樣。溫度傳感器測量范圍-40~60℃,測量精度±1℃,相對濕度傳感器測量范圍0~99%,測量精度±5%,因篇幅有限,僅展示2020年11月19日采集的部分原始數(shù)據(jù),如表1所示。
表1 2020年11月19日采集的部分原始數(shù)據(jù)Tab.1 Part of experimental original data collected on November 19th,2020
采集節(jié)點長期處于低溫環(huán)境下,會使得傳感器在數(shù)據(jù)采集過程中發(fā)生偏差,傳感器精度會受到影響。同時,傳感器網(wǎng)絡的數(shù)據(jù)傳輸也會產生數(shù)據(jù)的丟包,這些問題都會造成數(shù)據(jù)的缺失異常,因此針對短時數(shù)據(jù)的缺失采用線性插值法對數(shù)據(jù)進行修復預處理,得到高質量的數(shù)據(jù)集。同時對各數(shù)據(jù)項進行歸一化處理,為接下來的數(shù)據(jù)處理提供基礎。
針對現(xiàn)有技術中無線傳感器感知數(shù)據(jù)量大、數(shù)據(jù)冗余度高,為減少數(shù)據(jù)的模糊性和不確定性,使用K-medoids算法進行空間數(shù)據(jù)融合。K-medoids算法是K-means(K均值)算法的一種改進聚類算法,K-means算法求取的是簇中“平均數(shù)”,而K-medoids算法求取的是簇中“中位數(shù)”,因此,K-medoids算法對于噪聲和孤立點更具有魯棒性[26]。通過使用K-medoids算法將溫濕度序列進行空間數(shù)據(jù)融合,實現(xiàn)數(shù)據(jù)維度壓縮和降低數(shù)據(jù)冗余,并且提高數(shù)據(jù)的準確性,以融合后的溫濕度時間序列代表整個冷藏車廂的溫濕度狀態(tài),并以此構建預測模型的輸入時間序列樣本。
數(shù)據(jù)融合的基本思想是:在n個采集周期中,m個采集節(jié)點,將每個采集周期的數(shù)據(jù)設定為一個數(shù)據(jù)集合,從每個數(shù)據(jù)集合中找出1個數(shù)據(jù)中心點,以該中心點代表本次采集周期的所有數(shù)據(jù)。在實際應用中,以溫度數(shù)據(jù)融合為例,K-medoids數(shù)據(jù)融合算法步驟如下:
(2)在每個采集周期中,先隨機選擇一個中心點稱為tcenter,其他數(shù)據(jù)點稱為非中心tnon-center,然后隨機選取本周期中的非中心tnon-center不斷與中心點tcenter進行替換,成為新的中心,計算每次替換后中心點與其他非中心點的絕對差值和(Sum of absolute difference,SAD)。
若替換后的SAD小于替換前的SAD,則此次替換是更優(yōu)的替換,原來的中心點將被此次的非中心點替換。算法迭代執(zhí)行替換操作直到找到使SAD最小的一個節(jié)點,成為本次采集周期最終的中心點Oi。
(3)對每個采集周期進行步驟(2)計算,獲取一條時間序列(O1,O2,…,Oi,…,Om),以此來代表m個采集節(jié)點n個采集周期的溫度融合數(shù)據(jù),相對濕度數(shù)據(jù)融合同理。
算法示意圖如圖3所示。
圖3 K-medoids數(shù)據(jù)融合示意圖Fig.3 Diagram of K-medoids data fusion
長短時記憶網(wǎng)絡(Long short-term memory,LSTM)是一種循環(huán)神經網(wǎng)絡(Recurrent neural network,RNN)的特殊類型,可以避免長期依賴的問題,通過設立門控機制,使其選擇性地存儲信息,以此來實現(xiàn)信息的保護和控制,其結構如圖4所示,本文利用長短時記憶網(wǎng)絡對融合后的時間序列(O1,O2,…,Oi,…,Om)進行預測分析[25-26]。
圖4 LSTM網(wǎng)絡結構Fig.4 Structure of LSTM network
LSTM擁有3個門,即輸入門、輸出門、遺忘門,以此決定每一時刻信息記憶與遺忘。輸入門決定有多少新的信息加入到細胞當中,遺忘門控制每一時刻信息是否會被遺忘,輸出門決定每一時刻是否有信息輸出[27-28]。
長短時記憶網(wǎng)絡計算公式為
ft=σ(Wf[ht-1,xt]+bf)
(1)
it=σ(Wi[ht-1,xt]+bi)
(2)
(3)
(4)
Ot=σ(W0[ht-1,xt]+b0)
(5)
ht=OttanhCt
(6)
式中it、ft、Ot——輸入門、遺忘門、輸出門
xt——t時刻的輸入值
σ——Sigmoid激活函數(shù)
Wi、Wf、W0——輸入門、遺忘門、輸出門權重
WC——候選向量權重
bf、bi、b0——輸入門、遺忘門、輸出門偏置
bC——候選向量偏置
Ct——t時刻的候選向量
ht、ht-1——t、t-1時刻模型的所有輸出
本文利用LSTM神經網(wǎng)絡預測多步溫濕度數(shù)據(jù),采用遞歸預測策略,網(wǎng)絡結構為一輸入一輸出,訓練時輸入與輸出間隔一個時間步長,對網(wǎng)絡進行訓練、優(yōu)化權重參數(shù)后,在每次計算時,使用上一次計算得到的預測值作為本次網(wǎng)絡的輸入值,獲取新的預測值,通過迭代計算得到多步預測值,獲取未來一段時間的溫濕度變化。
為提高預測模型的精度,將K-medoids算法和LSTM模型進行有機結合,構建了基于K-medoids和LSTM的冷鏈運輸多步預測模型。其基本思想為首先對冷鏈運輸環(huán)境數(shù)據(jù)進行修復處理,其次利用K-medoids算法作為長短時記憶網(wǎng)絡的前置數(shù)據(jù)處理系統(tǒng),對冷鏈運輸環(huán)境溫濕度數(shù)據(jù)進行空間數(shù)據(jù)融合,簡化長短時記憶網(wǎng)絡預測模型結構,隨后對預測模型進行訓練和預測,獲得最終預測結果,有效提高了組合預測模型的預測精度。預測流程如圖5所示。
圖5 基于K-medoids和LSTM的冷鏈運輸環(huán)境預測方法流程圖Fig.5 Flow chart of environmental prediction method for cold chain transportation based on K-medoids and LSTM
冷鏈運輸環(huán)境溫濕度預測具體步驟為:
(1)設計試驗方案,通過冷鏈運輸遠程監(jiān)測系統(tǒng)在線采集冷藏車廂內環(huán)境時間序列數(shù)據(jù)。
(2)對數(shù)據(jù)進行清洗,剔除重復、異常數(shù)據(jù),補充缺失數(shù)據(jù)。
(3)采用K-medoids算法進行數(shù)據(jù)融合,消除冗余信息,降低神經網(wǎng)絡模型輸入?yún)?shù)的維度,精簡預測模型結構。
(4)對融合后的數(shù)據(jù)進行標準化,并劃分相應的訓練集和測試集。
(5)初始化LSTM神經網(wǎng)絡模型參數(shù),將訓練集輸入至模型中,模型通過不斷進行參數(shù)優(yōu)化,直至模型準確率達到最高或達到既定訓練輪數(shù)時為止。
(6)輸入測試集測試模型的精確度,通過模型的評價指標表,與其他模型進行對比,得出最優(yōu)的冷鏈運輸溫濕度預測模型。
為了評價模型的預測效果與精度,選用均方根誤差(Root mean squard error,RMSE)、平均絕對誤差(Mean absolute error,MAE)以及平均絕對百分比誤差(Mean absolute percentage error,MAPE)3個指標對其進行評價,MAE、RMSE、MAPE越小,表明模型的預測效果更加精準。
3.1.1數(shù)據(jù)源
以某冷藏車內的溫濕度為研究對象,采用1.2節(jié)的冷鏈運輸遠程監(jiān)測系統(tǒng),試驗選取2020年11月17日16:00—19:20的15個采集節(jié)點獲取溫濕度數(shù)據(jù),采用已經預處理過的試驗數(shù)據(jù)。最終實現(xiàn)1 h后的溫濕度預測,在線采集到的6 000條樣本數(shù)據(jù)為數(shù)據(jù)源,利用交叉驗證法驗證和測試模型性能。
3.1.2試驗平臺
試驗所使用的計算機硬件配置如下:處理器為Intel(R)Core(TM)i5-1035G1 CPU 1.00 GHz,內存16 GB(Samsung DDR4 3 200 MHz),操作系統(tǒng)為Windows 10(x64),GPU顯卡NVIDIA GeForce MX350 2GB。程序設計語言為Matlab(64-bit),集成開發(fā)環(huán)境為Matlab 2019a。
3.2.1數(shù)據(jù)融合結果
使用K-medoids算法對數(shù)據(jù)進行融合試驗,并將K-means算法作為對比算法。在數(shù)據(jù)采集和傳輸過程中會產生“垃圾”數(shù)據(jù),如圖6a所示,在溫度原始數(shù)據(jù)中存在一個異常點,被圓圈標出,若在有異常點的采集周期中,采用K-medoids算法計算時,異常點的數(shù)值相較于其他簇內數(shù)據(jù)點較大,根據(jù)K-medoids算法取最小的點作為中心點這一規(guī)則會忽略掉異常點,而K-means算法會計算本次采集周期數(shù)據(jù)的平均值,會受到異常值的干擾。兩種算法的融合結果如圖6c所示,K-means算法異常計算結果用圓圈標出,所以K-medoids算法呈現(xiàn)更強的魯棒性,融合后的變化規(guī)律更加明顯,故本研究選擇K-medoids算法對溫濕度數(shù)據(jù)進行融合。
圖6 溫濕度原始數(shù)據(jù)及融合結果Fig.6 Raw temperature and humidity data and fusion results
3.2.2LSTM神經網(wǎng)絡預測結果
在K-medoids數(shù)據(jù)融合的基礎上,將融合后的數(shù)據(jù)按照7∶3比例劃分為訓練集和測試集,作為LSTM神經網(wǎng)絡的輸入,建立K-medoids結合LSTM冷藏車廂溫濕度預測模型。采用Adam算法進行優(yōu)化,迭代次數(shù)為250次,其中輸入層節(jié)點數(shù)為1,輸出層節(jié)點數(shù)為1,5次試驗所對應的隱含層節(jié)點數(shù)、學習率和時間步長如表2所示。圖7為訓練后的誤差曲線和預測趨勢圖。
表2 預測模型參數(shù)對比Tab.2 Comparison of prediction model parameters
從圖7中可以看出,試驗1和3的溫度預測精度較高,試驗1和2的相對濕度預測精度較高,而試驗4和5溫濕度預測誤差波動較大。但從整體來看,各組試驗的預測結果總體趨勢與實際值較吻合。
圖7 K-medoids-LSTM模型的誤差曲線和預測趨勢Fig.7 Error curves and prediction trend of K-medoids-LSTM model
為了更加直觀比較預測模型的誤差,表3為5次試驗后得到的預測模型的平均相對誤差、平均誤差百分比和均方根誤差。從表3可以看出,試驗1最終取得的預測性能最好,溫度的MAE、MAPE、RMSE分別達到了0.273 0℃、1.51%、0.343 8℃,相對濕度的MAE、MAPE、RMSE分別達到了1.995 6%、3.53%、2.561 9%。此外,預測模型的整體預測精度較為理想,溫度MAE、MAPE、RMSE分別達到了0.752 6、4.12、0.629 7℃,相對濕度的MAE、MAPE、RMSE分別達到了2.874 5%、5.07%、3.385 7%,說明了K-medoids算法結合LSTM神經網(wǎng)絡預測模型具有較為理想的泛化能力。
表3 不同參數(shù)下預測誤差Tab.3 Prediction error under different parameters
3.2.3模型比對
本文設置了對照試驗。將K-medoids-RBF神經網(wǎng)絡、K-medoids-BP神經網(wǎng)絡、K-medoids-Elman神經網(wǎng)絡作為參照模型,分析和對比K-medoids-LSTM對預測性能的影響。各模型的預測值與真實值對比結果如圖8所示,各模型的誤差如表4所示。圖8顯示,各預測模型均能在不同程度上較好地實現(xiàn)冷藏車廂溫濕度的預測,溫濕度的預測變化趨勢與實際變化趨勢較為一致,但預測效果存在一定的差異。就整體預測結果而言,K-medoids-LSTM的預測結果比其他模型的擬合結果效果更好,變化起伏更小,預測效果更穩(wěn)定,全局無較大起伏的波動點。結果表明提出的K-medoids和LSTM神經網(wǎng)絡預測模型的預測精度高、泛化能力強,能夠準確掌握冷藏車廂內未來1 h溫濕度的變化,達到了比較理想的預測效果,可以為調控提供策略依據(jù)。
圖8 各模型的預測結果Fig.8 Prediction results of each model
表4 不同預測模型的預測性能對比Tab.4 Comparison of prediction performance of different models
由表4可知,K-medoids-LSTM模型與K-medoids-RBF模型相比,溫度的MAE、MAPE、RMSE分別降低了55.9%、54.9%、55.4%,相對濕度的MAE、MAPE、RMSE分別降低了13.6%、8.5%、21.4%;與K-medoids-BP模型相比,溫度的MAE、MAPE、RMSE分別降低了59.8%、59.2%、55.4%,相對濕度的MAE、MAPE、RMSE分別降低了25.4%、25.2%、18.2%;與K-medoids-Elman模型相比,溫度的MAE、MAPE、RMSE分別降低了74.3%、74%、73.2%,相對濕度的MAE、MAPE、RMSE分別降低了41.9%、40.3%、38.5%。
從總體來看,K-medoids-LSTM組合預測模型的各項指標都優(yōu)于其他預測模型,能更準確地預測冷鏈儲運環(huán)境溫濕度變化規(guī)律和變化趨勢。
(1)采用K-medoids算法對冷鏈運輸環(huán)境溫濕度數(shù)據(jù)進行數(shù)據(jù)融合,降低了模型輸入的維度,減小數(shù)據(jù)的模糊性和不確定性,有利于提升LSTM預測精度和穩(wěn)定性。
(2)提出的K-medoids-LSTM模型能夠預測冷藏車廂內未來1 h溫濕度變化趨勢,預測精度和穩(wěn)定性較高,優(yōu)于傳統(tǒng)的BP、RBF、Elman神經網(wǎng)絡等淺層模型,解決了傳統(tǒng)預測方法預測精度低、魯棒性差等問題。