(張明躍 周慧玲 錢榮榮 汪中明 劉尚峰
(北京郵電大學(xué)人工智能學(xué)院1,北京 100089)
(國家糧食和物資儲備局科學(xué)研究院2,北京 100037)
(安徽現(xiàn)代糧食物流中心庫3,舒城 231323)
糧食是我國重要的戰(zhàn)略儲備物資,糧食儲備是保障糧食安全的關(guān)鍵環(huán)節(jié),在糧食儲藏過程中,害蟲及霉變的發(fā)生是造成糧食損失的主要誘因。在實(shí)際糧庫中,對糧堆溫度、濕度進(jìn)行精準(zhǔn)監(jiān)控,是防止害蟲和霉菌發(fā)生,從而保障糧食數(shù)量和質(zhì)量安全的關(guān)鍵因素。目前我國各級糧庫通過在糧倉內(nèi)布置溫度傳感器陣列,實(shí)現(xiàn)對糧堆內(nèi)溫度的實(shí)時(shí)監(jiān)測,保管員通過糧情信息管理系統(tǒng)對糧溫信息進(jìn)行分析,從而對糧堆是否出現(xiàn)安全異常點(diǎn)進(jìn)行判斷。
我國早期的糧情監(jiān)測系統(tǒng)僅限于對糧庫溫度的實(shí)時(shí)檢測,而糧溫信息是否正確,以及其變化趨勢是否超出安全范圍,一般只能憑借管理員的經(jīng)驗(yàn)進(jìn)行判斷并做出相應(yīng)控制決策,這樣會導(dǎo)致對安全隱患的遲判或漏判,因此對糧堆溫度進(jìn)行短期的有效預(yù)測就顯得尤為重要。因此,研究人員逐漸展開對糧食儲藏溫度場預(yù)測的理論研究,以建立有效的糧堆溫度預(yù)測體系,提前發(fā)現(xiàn)溫度異常位置,及時(shí)采取防控措施,以達(dá)到減少糧食損失,保障糧食質(zhì)量安全的目的。
此外,根據(jù)原國家糧食局頒發(fā)的糧情電子檢測分析控制系統(tǒng)技術(shù)規(guī)程要求[1],高大平方倉內(nèi)溫度傳感器節(jié)點(diǎn)水平距離不能超過5 m,以吊頂糧倉為例,各層的溫度傳感器節(jié)點(diǎn)橫向距離為4.38 m,縱向距離為4.2 m。由于糧食是熱的不良導(dǎo)體,糧堆對熱的傳入、傳出都很緩慢,若局部節(jié)點(diǎn)間有因害蟲的快速生長或霉變情況發(fā)生而造成的溫度異常,等到鄰近的溫度傳感器節(jié)點(diǎn)監(jiān)測出來時(shí),可能為時(shí)已晚,因此要建立有效的糧堆溫度預(yù)測系統(tǒng),對糧堆溫度場進(jìn)行整體把控,對傳感器節(jié)點(diǎn)間溫度進(jìn)行預(yù)測插值,以達(dá)到對糧庫溫度場的更精準(zhǔn)監(jiān)測。
糧堆導(dǎo)熱性、熱容量的規(guī)律和分布是對糧堆溫度場變化進(jìn)行預(yù)測的理論基礎(chǔ)。雖然影響糧溫變化的因素十分復(fù)雜,但是糧倉溫度場分布及其變化規(guī)律是可以通過數(shù)學(xué)模型大致計(jì)算的,因此在實(shí)際糧倉中,通過對溫度場進(jìn)行一定的簡化,可以在時(shí)間維度上可以將糧堆溫度預(yù)測看作一個(gè)非線性的時(shí)間序列問題并進(jìn)行預(yù)測[2]。
傳統(tǒng)的糧溫預(yù)測模型主要分為三類:基于三傳理論的計(jì)算模型、有限元分析法和基于經(jīng)驗(yàn)函數(shù)建立溫度場的預(yù)測模型?;谌齻骼碚摰挠?jì)算模型是基于熱力學(xué)、傳熱學(xué)以及能量平衡理論,通過一定量的數(shù)學(xué)計(jì)算推算出糧堆溫度變化趨勢的理論模型[3];有限元方法是通過簡化糧倉存儲環(huán)境,利用有限元進(jìn)行瞬態(tài)溫度模擬,建立溫度場,進(jìn)而對糧堆溫度進(jìn)行預(yù)測[4];基于經(jīng)驗(yàn)函數(shù)的預(yù)測模型是將節(jié)點(diǎn)的溫度變化趨勢預(yù)設(shè)為某種數(shù)學(xué)函數(shù),如冪函數(shù),指數(shù)函數(shù)或正弦函數(shù),其中,指數(shù)函數(shù)和冪函數(shù)雖然可對糧堆溫度進(jìn)行預(yù)測,但是預(yù)測精度不高且無法表征糧堆溫度變化規(guī)律;正弦函數(shù)是吳子丹[5]在分析歸納了我國大量糧倉糧情數(shù)據(jù)后提出的一種經(jīng)驗(yàn)?zāi)P?從實(shí)際應(yīng)用情況來看,也較為符合糧堆溫度變化規(guī)律。
上述研究揭示了糧堆溫度場變化的一些規(guī)律并在糧堆溫度預(yù)測研究方面取得了一定的成效,但是由于糧溫時(shí)間序列的非線性特性、復(fù)雜性以及在糧庫中實(shí)際應(yīng)用的落地性,用上述研究方法建立的數(shù)學(xué)模型存在一定的局限:基于三傳理論的預(yù)測模型相關(guān)的參數(shù)較多,每個(gè)監(jiān)測點(diǎn)的溫度變化和其他監(jiān)測點(diǎn)的溫度變化具有相關(guān)性,假如對每一個(gè)監(jiān)測點(diǎn)都使用該模型計(jì)算,則計(jì)算量會很大,隨之計(jì)算時(shí)間也會很長,不能滿足實(shí)時(shí)性的要求,不便應(yīng)用在實(shí)際糧庫內(nèi)的溫度預(yù)測;有限元分析法是通過將復(fù)雜問題簡單化,進(jìn)而對問題進(jìn)行近似求解,預(yù)測精度存在偏差,只能在實(shí)驗(yàn)室條件下進(jìn)行[6];基于經(jīng)驗(yàn)函數(shù)的糧溫預(yù)測模型,是將糧堆溫度變化規(guī)律預(yù)設(shè)為固定的數(shù)學(xué)函數(shù),再去對模型參數(shù)進(jìn)行更新,這樣的預(yù)測精度不高。
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)因其能有效處理復(fù)雜非線性問題和自動(dòng)學(xué)習(xí)模型參數(shù)上的優(yōu)勢,可以有效解決傳統(tǒng)溫度預(yù)測方法中模型復(fù)雜,計(jì)算量大,或預(yù)測精度不高的局限,從而提升整體預(yù)測效果,正被逐漸應(yīng)用到糧堆溫度預(yù)測研究上。郭平飛等[7]通過人工神經(jīng)網(wǎng)絡(luò)和粒子群算法優(yōu)化過的神經(jīng)網(wǎng)絡(luò)對糧食溫度進(jìn)行了預(yù)測;同時(shí)也使用循環(huán)神經(jīng)網(wǎng)絡(luò)及其變體對糧食溫度進(jìn)行預(yù)測,并通過改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)和激活函數(shù)進(jìn)一步提高預(yù)測效果。在2019年,趙巖等[8]通過長期短時(shí)記憶網(wǎng)絡(luò)算法(LSTM)對糧庫的溫度數(shù)據(jù)進(jìn)行預(yù)測,與支持向量機(jī)(SVM)和整合移動(dòng)平均自回歸模型(ARIMA)算法相比,預(yù)測效果提升了5%。段珊珊等[9]通過分析儲糧環(huán)境中氣象影響因素,通過支持向量機(jī)算法(SVM)基于多氣象因素對糧堆表層平均溫度進(jìn)行預(yù)測。
這些基于機(jī)器學(xué)習(xí)的糧堆溫度預(yù)測算法雖然取得了不錯(cuò)的預(yù)測效果,但是這些研究僅考慮了傳感器節(jié)點(diǎn)數(shù)據(jù)時(shí)間層面而忽略了空間層面即節(jié)點(diǎn)之間的相互影響,而對于糧堆這種可自激不穩(wěn)定的復(fù)雜生態(tài)系統(tǒng),割裂空間層面而單純考慮時(shí)間層面的方法,預(yù)測精度會存在局限性。因此本文提出基于長期短時(shí)記憶網(wǎng)絡(luò)(LSTM)的變體門限循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)和反距離加權(quán)(IDW)的時(shí)空-溫度預(yù)測插值算法,在糧溫?cái)?shù)據(jù)時(shí)間層面建模的基礎(chǔ)上增加了空間影響因素,即通過對節(jié)點(diǎn)歷史溫度數(shù)據(jù)分析的基礎(chǔ)上增加了相鄰節(jié)點(diǎn)的影響因素,以得到該節(jié)點(diǎn)的溫度變化規(guī)律,對未來時(shí)刻的溫度數(shù)據(jù)進(jìn)行預(yù)測。并且,基于此預(yù)測模型能夠?qū)ξ粗?jié)點(diǎn)溫度數(shù)據(jù)進(jìn)行預(yù)測插值的特性,可以生成未來時(shí)刻的糧堆溫度場云圖,直觀反映出糧堆溫度場宏觀變化趨勢,為糧庫提前預(yù)知局部危險(xiǎn)因素提供指導(dǎo)[10]。
本研究的糧堆溫度數(shù)據(jù)來源于安徽庫13號吊頂倉的溫度傳感器陳列,其布置方式是:溫度傳感器布置有4層,層間距離不大于2 m,每一層傳感器陣列由東向西分為10列,由南向北為7行,每一層溫度傳感器節(jié)點(diǎn)間橫向間距為4.38 m,縱向間距為4.2 m,一層共有70個(gè)傳感器節(jié)點(diǎn)。由于在有限時(shí)間內(nèi), 糧溫在時(shí)空上的變化是有限的 ,即在短時(shí)間內(nèi)糧堆各個(gè)溫度傳感器節(jié)點(diǎn)溫度數(shù)據(jù)變化不大,因此本研究中的實(shí)際糧庫內(nèi)的糧溫?cái)?shù)據(jù)采樣頻率設(shè)置為每周1次,采樣時(shí)間為每周一上午8時(shí),數(shù)據(jù)從2019年1月到2019年12月,長度為52周。糧堆各層的溫度傳感器節(jié)點(diǎn)分布如圖1所示,每層溫度傳感器數(shù)據(jù)為70個(gè)。
圖1 糧堆溫度傳感器節(jié)點(diǎn)分布圖
判斷節(jié)點(diǎn)的糧溫?cái)?shù)據(jù)是否具有時(shí)間相關(guān)性,是進(jìn)行糧溫預(yù)測的基礎(chǔ)。經(jīng)過對不同地區(qū)不同糧倉糧溫信息分析研究,學(xué)者們發(fā)現(xiàn)糧堆內(nèi)任何測溫點(diǎn)的糧溫變化都是一個(gè)與糧倉外界氣溫變化類似的隨時(shí)間變化的正弦曲線,但隨其在糧堆內(nèi)位置的不同,或者說距糧倉外壁距離的不同,節(jié)點(diǎn)糧溫時(shí)滯逐漸加大,即糧溫曲線出現(xiàn)滯后效應(yīng)[11]。由于糧堆靠近糧壁處和表層的溫度受糧倉外部氣溫影響較大,糧堆內(nèi)部溫度變化較為平穩(wěn),且具有均勻化的特性,即在沒有外部干擾的情況下,內(nèi)部節(jié)點(diǎn)溫差不大,便于通過預(yù)測模型挖掘溫度變化規(guī)律[12]。因此本研究僅針對糧堆內(nèi)部溫度和表層第二層溫度數(shù)據(jù)進(jìn)行預(yù)測和插值研究,而不考慮測溫矩陣外部和表層的糧堆溫度數(shù)據(jù)。
從糧堆第二層各個(gè)溫度傳感器采集的一年52周的糧溫?cái)?shù)據(jù)中,選取其中4個(gè)不同的較為分散的內(nèi)部節(jié)點(diǎn)溫度數(shù)據(jù)做分析,如圖1中所示,節(jié)點(diǎn)溫度變化曲線如圖2所示,可以看出某節(jié)點(diǎn)溫度時(shí)間序列呈明顯的季節(jié)性趨勢,基本呈現(xiàn)出正弦變動(dòng)趨勢。
圖2 節(jié)點(diǎn)溫度時(shí)間序列圖
典型的時(shí)間序列數(shù)據(jù)都具有滯后效應(yīng),即前一時(shí)刻的值會對下一段時(shí)刻的值產(chǎn)生影響,這是進(jìn)行時(shí)間序列分析建模的基本依據(jù)[13]。因此本研究首先通過時(shí)間自相關(guān)分析法對溫度傳感器節(jié)點(diǎn)的溫度時(shí)間序列數(shù)據(jù)進(jìn)行了分析。時(shí)間自相關(guān)性是指同一時(shí)間序列在不同時(shí)刻取值的相關(guān)程度,假設(shè)有時(shí)間序列x,設(shè)在時(shí)刻i和滯后k階即i+k時(shí)刻之的時(shí)間相關(guān)性即為k階自相關(guān),相關(guān)性系數(shù)公式為:
(1)
式中:E代表期望計(jì)算;k表示時(shí)間步長;σ表示標(biāo)準(zhǔn)差;Xi代表在i時(shí)刻的時(shí)間觀測值;Xi+k代表在i+k時(shí)刻的時(shí)間觀測值;μi和μi+k表示同一條時(shí)間序列中在i時(shí)刻和i+k時(shí)刻的期望值,相關(guān)性系數(shù)越接近于1,說明i時(shí)刻與i+k時(shí)刻時(shí)間相關(guān)性越強(qiáng)。通過上式可計(jì)算糧堆溫度時(shí)間序列滯后k階自相關(guān)系數(shù)的值,如表1所示。
表1 時(shí)間自相關(guān)系數(shù)表
從表中數(shù)據(jù)可知,糧堆溫度時(shí)間序列隨著滯后階數(shù)k的增加,糧溫時(shí)間序列的自相關(guān)系數(shù)從大逐漸減小。說明糧溫時(shí)間序列中某一時(shí)刻的值對下k個(gè)時(shí)刻的溫度值有一定的影響,并且這個(gè)影響隨著k的增大即滯后時(shí)間的增大,逐漸變小,糧溫預(yù)測模型正是通過分析挖掘這一特性來對未來時(shí)刻的數(shù)據(jù)進(jìn)行預(yù)測的[14]。此外,對本文預(yù)測模型用于輸入的樣本數(shù)據(jù)進(jìn)行構(gòu)建時(shí),需要通過滑動(dòng)時(shí)間窗口法將一維糧溫時(shí)間序列劃分為若干個(gè)時(shí)間樣本數(shù)據(jù),并且不同長度的窗口大小還會對預(yù)測效果產(chǎn)生不同的影響,較小的窗口尺寸不能保證模型提取到足夠的長的特征,而較大的窗口尺寸將增加無關(guān)的輸入和計(jì)算復(fù)雜性。因此,通過自相關(guān)分析可以確定合適的窗口尺寸范圍,以窗口長度是3為例,數(shù)據(jù)集劃分如圖3所示。
圖3 時(shí)間序列數(shù)據(jù)集樣本建立
本研究的糧溫預(yù)測模型是在對時(shí)間層面建模的基礎(chǔ)上考慮了空間影響因素,以提高預(yù)測精度,因此需要對溫度數(shù)據(jù)進(jìn)行空間相關(guān)性分析,來驗(yàn)證同一時(shí)刻相鄰節(jié)點(diǎn)的溫度數(shù)據(jù)是否存在空間相關(guān)性,以此作為糧溫預(yù)測模型增加空間影響因素合理性的理論基礎(chǔ)。
莫蘭指數(shù)是空間自相關(guān)系數(shù)的一種,其值分布在[-1,1],用于判別網(wǎng)格數(shù)據(jù)空間層面是否存在自相關(guān)性,其值大于0說明網(wǎng)格空間數(shù)據(jù)存在正相關(guān)性,越近于1說明正相關(guān)性越強(qiáng);小于0說明網(wǎng)格空間數(shù)據(jù)存在負(fù)相關(guān)性,越接近于-1說明負(fù)相關(guān)性越強(qiáng)[15],計(jì)算公式為:
(2)
其中,S0計(jì)算公式為:
(3)
圖4 全局莫蘭指數(shù)折線圖
由結(jié)果可知,各周糧溫?cái)?shù)據(jù)全局莫蘭指數(shù)均大于0,說明糧溫?cái)?shù)據(jù)在空間層面上具有正相關(guān)性,即某個(gè)節(jié)點(diǎn)溫度與周圍節(jié)點(diǎn)溫度存在聯(lián)系,具有相近的變化趨勢。
通過時(shí)間自相關(guān)系數(shù)分析法和空間莫蘭指數(shù)分析法對糧溫時(shí)間序列數(shù)據(jù)進(jìn)行分析后得出結(jié)論:短期內(nèi)即滯后周數(shù)較小時(shí),糧溫?cái)?shù)據(jù)在時(shí)間維度上具有較強(qiáng)的相關(guān)性,某刻的溫度會對之后時(shí)刻的溫度產(chǎn)生影響,這是對糧溫進(jìn)行短期預(yù)測的理論基礎(chǔ);在空間維度上,糧溫?cái)?shù)據(jù)具有正相關(guān)性,某節(jié)點(diǎn)的溫度會受到周圍節(jié)點(diǎn)溫度的影響,這為本文的時(shí)間空間相結(jié)合進(jìn)行溫度預(yù)測提供了理論基礎(chǔ)。
為了減輕數(shù)據(jù)尺寸的影響并加快模型訓(xùn)練的速度,將糧溫?cái)?shù)據(jù)轉(zhuǎn)為以0.1攝氏度為單位的數(shù)據(jù),然后對糧溫?cái)?shù)據(jù)進(jìn)行歸一化處理,公式為:
(4)
式中:x*表示歸一化后的標(biāo)準(zhǔn)數(shù)據(jù);x表示原始糧溫?cái)?shù)據(jù);xmax表示節(jié)點(diǎn)糧溫?cái)?shù)據(jù)最大值;xmin表示節(jié)點(diǎn)糧溫?cái)?shù)據(jù)最小值。
本研究選取平均絕對值誤差MAE、均方誤差RMSE 以及R2三個(gè)指標(biāo)對模型預(yù)測的可靠性和準(zhǔn)確性進(jìn)行度量。其中MAE和RMSE指標(biāo)衡量預(yù)測值偏離真實(shí)值的誤差,其值越小代表預(yù)測效果越好,而R2衡量模型擬合數(shù)據(jù)的能力,該值越接近1,模型效果越好。其各自的計(jì)算公式為:
(5)
(6)
(7)
傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型,如深度神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)模型等都無法應(yīng)用在時(shí)間序列數(shù)據(jù)分析上面,而為了進(jìn)行時(shí)間序列數(shù)據(jù)的分析處理,循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN)應(yīng)運(yùn)而生。RNN模型可以通過單元的隱藏層將信息傳遞給下一個(gè)單元,使得該隱藏層的輸出由當(dāng)前時(shí)刻與上一時(shí)刻共同決定,從而可以將信息傳遞下去,因此RNN在處理時(shí)間序列數(shù)據(jù)時(shí)具有優(yōu)勢。但是,RNN無法處理輸入時(shí)間序列數(shù)據(jù)中的長期依賴問題,即距當(dāng)前時(shí)刻較長時(shí)間前的信息無法傳遞下來,并且還可能會導(dǎo)致梯度消失和梯度爆炸問題。為了解決這些問題,有學(xué)者提出了長短期記憶網(wǎng)絡(luò)(LSTM)。
LSTM添加了細(xì)胞狀態(tài)Ct,可以保留細(xì)胞單元之前的信息,從而使網(wǎng)絡(luò)具有長期記憶,細(xì)胞單元結(jié)構(gòu)如圖5所示。
圖5 LSTM細(xì)胞單元結(jié)構(gòu)圖
ht分別作為細(xì)胞單元當(dāng)前時(shí)刻輸出和下一時(shí)刻的輸入,Ct是細(xì)胞狀態(tài),用于保存單元狀態(tài)和之前的信息。ht-1和ct-1是前一個(gè)單元的輸出和細(xì)胞狀態(tài),而xt是該時(shí)刻的輸入,整體公式為:
(ht,Ct)=Ht(xt,ht-1,Ct-1)
(8)
式中:Ht是細(xì)胞單元中的整體函數(shù),它由三部分組成,分別是遺忘門,輸入門和輸出門:遺忘門用于確定上一個(gè)單元的信息在當(dāng)前單元格中保留的程度,并向單元格狀態(tài)Ct輸出一個(gè)介于0和1之間的數(shù)字,以表示要保留哪些信息,公式為:
ft=σ(Wf·[xt,ht-1]+bf)
(9)
式中:ft是忘記門的輸出;W和b是網(wǎng)絡(luò)參數(shù),σ是激活函數(shù);下一部分是輸入門,它通過將單元狀態(tài)從Ct-1更新為Ct來確定應(yīng)存儲哪些新信息,公式為:
Ct=ft?Ct-1+it?tanh(Wc·[xt,ht-1]+bc)
(10)
it=σ(Wi·[xt,ht-1]+bi)
(11)
最后,輸出門可以通過公式(11)計(jì)算單元的輸出ht,公式如下:
Ot=σ(Wo·[xt,ht-1]+b0
(12)
ht=Ot?tanh(Ct)
(13)
經(jīng)過LSTM 的三個(gè)門函數(shù)以及整個(gè)單元輸出狀態(tài)的更新,確保輸入特征的關(guān)鍵信息得到保留和傳遞。
而GRU(門循環(huán)神經(jīng)網(wǎng)絡(luò))是在原始LSTM網(wǎng)絡(luò)基礎(chǔ)上,將LSTM的遺忘門和輸入門合成了一個(gè)更新門,并增加了重置門,去除掉了細(xì)胞狀態(tài),使用隱藏狀態(tài)來進(jìn)行信息的傳遞,是一種新變體,如圖6所示。
圖6 GRU結(jié)構(gòu)圖
圖6中的rt和zt分別表示重置門和更新門的輸出。重置門用于控制前一細(xì)胞單元有多少信息得以保留。更新門用于控制前一細(xì)胞單元的狀態(tài)信息被帶入到當(dāng)前狀態(tài)中的程度,更新門的值越大說明前一時(shí)刻的狀態(tài)信息帶入越多。與LSTM相比GRU只有兩個(gè)門,進(jìn)一步簡化了模型,能加快模型收斂速度,尤其針對本研究中糧堆溫度數(shù)據(jù)數(shù)據(jù)量較少,用于輸入的節(jié)點(diǎn)數(shù)據(jù)過多的問題,GRU能減小參數(shù)數(shù)量,有效解決過擬合問題,因此本文采用GRU進(jìn)行糧堆溫度時(shí)間層面的初步預(yù)測。
反距離權(quán)重插值(IDW)是空間插值算法的一種,旨在通過有限的節(jié)點(diǎn)信息計(jì)算出未知節(jié)點(diǎn)的信息。反距離權(quán)重插值的基本思想是:距離待插值點(diǎn)越遠(yuǎn)的節(jié)點(diǎn)貢獻(xiàn)度越低,距離近的節(jié)點(diǎn)則貢獻(xiàn)度越高,并且貢獻(xiàn)度與距待插值點(diǎn)的距離成反比[16]。計(jì)算過程如下:
首先,需要計(jì)算所有離散節(jié)點(diǎn)與待插值節(jié)點(diǎn)的距離,在二維平面空間,離散點(diǎn)(xi,yi)到網(wǎng)格(A,B)的距離Di為:
(14)
然后,需要找出離待插值節(jié)點(diǎn)(A,B)最近的N個(gè)離散點(diǎn)并計(jì)算距離,則待插值節(jié)點(diǎn)(A,B)上的估算值Z為:
(15)
其中,Zi為離散點(diǎn)i上的實(shí)際值,Z(A,B)為待插值節(jié)點(diǎn)(A,B)上的估算值,Di為待插值點(diǎn)與第i個(gè)節(jié)點(diǎn)間的距離,P是距離的冪,一般取2。
相比于其他空間插值算法,反距離權(quán)重插值適用于表現(xiàn)出均勻分布而且足夠密集以反映局部差異的觀測點(diǎn)數(shù)據(jù)集的場景,尤其適用于場景呈現(xiàn)出局部變異性的情況。本研究中糧庫內(nèi)傳感器節(jié)點(diǎn)分布均勻,布點(diǎn)密集,且因?yàn)榘l(fā)生害蟲或霉菌,易出現(xiàn)局部溫度突變的情況。另外,IDW通過權(quán)重系數(shù)可將距待測節(jié)點(diǎn)距離遠(yuǎn),影響不大的節(jié)點(diǎn)數(shù)據(jù)基本忽略,相當(dāng)于進(jìn)行了dropout,并且也便于將IDW的權(quán)重作為輸入特征連接到GRU網(wǎng)絡(luò)結(jié)構(gòu)之后。因此本研究將IDW作為預(yù)測模型的空間建模部分,連接到GRU層后,通過反向傳播對整體模型進(jìn)行參數(shù)的更新。
首先將糧堆傳感器各個(gè)節(jié)點(diǎn)數(shù)據(jù)通過滑動(dòng)窗口法轉(zhuǎn)化為用于模型輸入的樣本數(shù)據(jù),之后再分別通過GRU層和IDW層,最后得到待預(yù)測點(diǎn)下一時(shí)刻的預(yù)測值。以糧堆傳感器節(jié)點(diǎn)的某一層為例,如要預(yù)測某一節(jié)點(diǎn)A的溫度數(shù)據(jù),首先將其他節(jié)點(diǎn)的歷史溫度數(shù)據(jù)分別輸入到GRU層中,初步獲得各節(jié)點(diǎn)的初步預(yù)測值Zi,i代表第i個(gè)節(jié)點(diǎn),設(shè)IIDW=[i1,i2,…in]是IDW層的輸入向量,其中in為各節(jié)點(diǎn)的貢獻(xiàn),計(jì)算公式如下:
(16)
式中:i代表第i節(jié)點(diǎn);Zi代表GRU層的輸出;n為節(jié)點(diǎn)總數(shù);wi為權(quán)重;計(jì)算公式為:
(17)
式中:d(x,xi)是點(diǎn)x與xi之間的距離;p用于調(diào)節(jié)靈敏度,保持權(quán)重增加或上升合適的速率,一般取2。通過IDW層可初步將貢獻(xiàn)度低即距離遠(yuǎn)的糧堆節(jié)點(diǎn)數(shù)據(jù)忽略。因相同距離節(jié)點(diǎn)的貢獻(xiàn)度也不一定相同,因此最后將IIDW輸入全連接層,再進(jìn)一步對特征進(jìn)行篩選,得到最后的輸出:
OA=σ(WIDW·IIDW+bIDW)
(18)
OA即為未知節(jié)點(diǎn)A點(diǎn)的預(yù)測值。以此方法,可以預(yù)測出其他未知節(jié)點(diǎn)的溫度數(shù)據(jù),并生成未來時(shí)刻的溫度云圖。
溫度數(shù)據(jù)采用1年的歷史數(shù)據(jù),通過滑動(dòng)窗口方法劃分溫度時(shí)間序列樣本數(shù)據(jù),獲得特征和相應(yīng)標(biāo)簽,對模型進(jìn)行訓(xùn)練,滑動(dòng)窗口大小通過時(shí)間自相關(guān)性分析后初步設(shè)置為4,可以將糧堆時(shí)間序列劃分為48個(gè)長度為4的一維樣本數(shù)據(jù),可以理解為通過4周的數(shù)據(jù)預(yù)測下一周的溫度。同時(shí)將糧堆第二層的70個(gè)節(jié)點(diǎn)的糧溫?cái)?shù)據(jù)輸入模型,數(shù)據(jù)維度是70×48×1×4,用70%的數(shù)據(jù)進(jìn)行訓(xùn)練,30%的數(shù)據(jù)進(jìn)行測試,batchsize設(shè)為3,epoch設(shè)為200,優(yōu)化算法使用adam,GRU單元維度為4,使用均方誤差(RMSE)作為損失函數(shù),進(jìn)行優(yōu)化迭代,訓(xùn)練時(shí)長為367 s。
為了進(jìn)一步評估算法的性能,本研究將預(yù)測模型其與其他常用的時(shí)間序列分析算法進(jìn)行了比較,包括傳統(tǒng)的經(jīng)驗(yàn)函數(shù)法,支持向量機(jī)(SVM),平移自回歸函數(shù)(ARIMA),和LSTM等算法,預(yù)測結(jié)果如下表2所示。
表2 實(shí)驗(yàn)結(jié)果
其中 MAE、MSE指標(biāo)衡量預(yù)測值偏離真實(shí)值的誤差,其值越小代表預(yù)測效果越好,而R2衡量模型擬合數(shù)據(jù)的能力,該值越接近1,說明模型效果越好。由表可知,LSTM算法優(yōu)于SVM和ARIMA算法,表明GRU在處理溫度預(yù)測這種非線性的時(shí)間序列數(shù)據(jù)時(shí),比傳統(tǒng)算法具有優(yōu)勢;本研究的GRU+IDW算法效果優(yōu)于LSTM算法,表明同時(shí)考慮時(shí)間和空間相關(guān)性比單純考慮時(shí)間相關(guān)性效果要好。
在進(jìn)行未來溫度場云圖插值方面,實(shí)驗(yàn)數(shù)據(jù)來源糧庫,東西向長度為39.42 m,南北向長度為25.2 m,因算法僅需要輸入已知傳感器歷史溫度數(shù)據(jù)和待預(yù)測節(jié)點(diǎn)的位置信息,因此通過對糧庫按0.1 m進(jìn)行空間插值,以通過歷史數(shù)據(jù)分別插值預(yù)測2019年5月13日、2019年9月9日和2019年12月12日為例,插值云圖見圖7。
圖7 預(yù)測插值云圖
通過交叉驗(yàn)證的方法,將糧堆內(nèi)部10個(gè)較為分散的傳感器節(jié)點(diǎn)設(shè)為待預(yù)測節(jié)點(diǎn),通過模型得到的預(yù)測值與真實(shí)值作比較,三個(gè)日期預(yù)測插值的RMSE分別為25.24,29.25,23.85,預(yù)測結(jié)果誤差不超過1°,因此預(yù)測插值出的云圖能較為準(zhǔn)確的反映出實(shí)際糧倉的溫度場變化,可直觀分析出溫度過高的溫度節(jié)點(diǎn),使倉庫保管員能對可能爆發(fā)蟲害的危險(xiǎn)點(diǎn)進(jìn)行監(jiān)控,對糧庫進(jìn)行微觀把控。
使用基于深度學(xué)習(xí)的方法,經(jīng)檢驗(yàn)在處理非線性的溫度時(shí)間序列方面效果優(yōu)于傳統(tǒng)的預(yù)測算法。并且GRU+IDW模型是在時(shí)間層面預(yù)測的基礎(chǔ)上考慮了空間影響因素,與現(xiàn)在糧庫常用的基于經(jīng)驗(yàn)函數(shù)的溫度預(yù)測算法和只考慮時(shí)間層面的機(jī)器學(xué)習(xí)預(yù)測算法相比,預(yù)測模型得到的節(jié)點(diǎn)溫度預(yù)測均方誤差分別降低了23.81和6.82,預(yù)測精度得到提升。并且基于此預(yù)測模型還能夠?qū)ξ粗?jié)點(diǎn)溫度數(shù)據(jù)進(jìn)行預(yù)測插值,生成未來時(shí)刻的溫度場云圖,從實(shí)驗(yàn)結(jié)果來看能夠較為準(zhǔn)確地反映出實(shí)際糧堆溫度場變化趨勢,可為糧庫溫度監(jiān)測提供指導(dǎo)。