秦東明,丁志軍,金玉鵬,趙 勤
(1.同濟大學 嵌入式系統(tǒng)與服務計算教育部重點實驗室,上海 200092;2.上海師范大學 信息與機電工程學院,上海 200234)
當前,以大數(shù)據(jù)和深度學習技術為代表的新型信息技術,為空氣污染預測提供了新的技術支撐[1-3].因此,有效利用已有的空氣污染監(jiān)控大數(shù)據(jù),融合新型人工智能計算技術,實現(xiàn)準確及時的空氣污染預測模型,是當前空氣污染治理領域關注的焦點問題.
從模型角度來看,空氣污染物濃度預測是一個典型的時間序列數(shù)據(jù)預測問題,即基于過往時間序列的數(shù)據(jù)預測未來特定時間內(nèi)的數(shù)據(jù)問題[4-6].傳統(tǒng)空氣污染物濃度預測模型[7-9]主要包括:基于歷史數(shù)據(jù)和統(tǒng)計學方法的經(jīng)驗模型預測,基于數(shù)學概率模型預測,利用多維度綜合模型預測,以及基于傳統(tǒng)機器學習模型預測等.這些模型的主要特點在于:模型計算快速,易于實現(xiàn);預測過程計算復雜度低.然而,這些方法還存在以下問題:①將污染物的預測工作建立在局部歷史數(shù)據(jù)和經(jīng)驗規(guī)則上,依賴于歷史經(jīng)驗歸納污染物變化規(guī)律,不能夠充分考慮大氣環(huán)境復雜多變這一問題;②模型的數(shù)據(jù)處理能力有限,對歷史監(jiān)測數(shù)據(jù)的使用不夠充分,很難從大數(shù)據(jù)角度挖掘污染物濃度的分布規(guī)律;③對污染數(shù)據(jù)內(nèi)部關聯(lián)特征不能進行深層次的分析,無法提取數(shù)據(jù)間深層次的聯(lián)系.
近年來,隨著深度學習在各個領域應用的興起,深度學習模型所具備的極強的數(shù)據(jù)序列預測特點也成為一些交叉學科的研究熱點[10-12].相對于傳統(tǒng)機器學習模型和方法,深度學習在以時間序列為特征的數(shù)據(jù)預測方面有如下3個優(yōu)點:①深度學習在大數(shù)據(jù)處理和分析能力方面可以挖掘歷史大數(shù)據(jù)之間的深層聯(lián)系,提高空氣污染預測的準確性;②基于深度學習的數(shù)據(jù)序列預測相比于傳統(tǒng)機器學習預測方法,可以將海量監(jiān)測數(shù)據(jù)納入預測體系,實現(xiàn)對大數(shù)據(jù)的充分利用,同時考慮數(shù)據(jù)的時間和空間分布的變化,得到數(shù)據(jù)分布規(guī)律,再有效地利用這些分布規(guī)律對未來一段時間的數(shù)據(jù)進行預測;③通過建立復雜、深層次的神經(jīng)網(wǎng)絡,選擇合適的方法解決深層次的網(wǎng)絡中易出現(xiàn)的梯度離散和過擬合的問題,通過對模型中參數(shù)的調(diào)整,可以有效提高神經(jīng)網(wǎng)絡預測的有效性和準確性,以達到精準預測的目的.
為了充分利用深度學習模型特征實現(xiàn)空氣污染大數(shù)據(jù)預測,解決傳統(tǒng)的預測模型過分依賴于過去經(jīng)驗、時效性差、局限于淺層數(shù)據(jù)特征提取等缺點,本文提出了一個自編碼深度預測模型[13-14],通過對歷史污染濃度大數(shù)據(jù)分析,總結歷史大數(shù)據(jù)的特征分布,實現(xiàn)時序污染數(shù)據(jù)的關聯(lián)性提取,提升預測的準確性.本文提出的自編碼預測模型包括編碼器和解碼器兩部分,編碼器編碼已知時間區(qū)間的污染物濃度,總結歷史數(shù)據(jù)特征,取出其最后的隱藏向量,形成一段包含歷史數(shù)據(jù)特征分布的“記憶”;解碼器利用數(shù)據(jù)特征預測后段未知污染物信息,從而達到短期預測污染物濃度的目的.為了進一步提升預測能力,本文引入LSTM(long short-term memory)[15]模型,以提升編碼器的信息采集能力,使得在預測階段有更多的參考依據(jù),促使模型做出更合理的判斷.最后,本文以PM2.5為例,對預測結果與實際測量結果進行比較,檢驗模型的效果.
機器學習是最早應用于大氣污染預測領域的智能算法.學術界在基于傳統(tǒng)機器學習的相關模型的空氣污染物濃度預測方面展開了大量研究.其中,基于支持向量機[16-17]的濃度預測可以在樣本數(shù)據(jù)比較少時得到比較理想的預報效果.支持向量機回歸是一種基于懲罰學習的回歸方法[18],通過在訓練集上機器學習得到污染物濃度與其他因素之間的回歸關系,建立線性回歸方程,本質(zhì)是使回歸函數(shù)的平面寬度最小化,并結合懲罰情況等構建最終的風險函數(shù),轉化為函數(shù)最小化問題,最終建立最優(yōu)回歸方程;利用一種或者多種傳統(tǒng)機器學習結合的方法(反向傳播神經(jīng)網(wǎng)絡、廣義神經(jīng)網(wǎng)絡回歸[19]等)建模,對模型進行訓練和測試,將符合要求的模型用于預測.
深度學習在大氣方面的應用,最早用于天氣、溫度和風力預測[20-21].Hossain[2]等證實了用深度的神經(jīng)網(wǎng)絡在有噪聲的時間序列上比標準的多層前饋神經(jīng)網(wǎng)絡更好地完成天氣預報工作;óscar利用深度結構抓取復雜的數(shù)據(jù)聯(lián)系,結合圖形處理單元(graphical processing units)[20]進行溫度預測以避免非凸性等問題的影響;另有一些將深度學習與風力預測結合的研究表明,深度學習用在風力的時序預測方面十分有效,能夠大幅度減少預測誤差.這些方法都僅考慮了單一因素,并沒有結合與之相關的、有著重大影響的因素.但現(xiàn)實中一種天氣狀況要受到多種其他自然條件的影響,比如說溫度預測,不僅考慮的是一段時間的溫度值,還要考慮光照、氣候等因素.
在空氣污染預測方面,尹文君等[22]基于深度學習進行空氣污染預報,實現(xiàn)更充分的大數(shù)據(jù)集成,充分考慮了污染物的時空變化、空間分布,得到語義性的污染物變化規(guī)律;Kuremoto等利用由兩個受限波爾茲曼機(restricted boltzmann machines,RBMs)[23]構成的深度網(wǎng)絡進行時序預測[4],并通過利用CATS(competition on artificial time series)基準[5]和原始數(shù)據(jù),證明RBMs比線性模型ARIMA(auto regressive integrated moving average)[6]性能更好;另外,Ong等用早已被學術界多次研究的深度循環(huán)神經(jīng)網(wǎng)絡(deep recurrent neural network,DRNN)[24-25]開展空氣污染物濃度預測,并證明相同條件下,DRNN比RBMs產(chǎn)生的結果更好[3].但是在該方法中使用的RNN并不能防止梯度消失的狀態(tài),隨著時間序列的增加,RNN保留之前的信息就越少,這樣就會導致模型對長期預測不敏感,對于長序列的預測能力有限.Athira[26]等也提出一種基于RNN的空氣污染物預測,與之前的工作一樣,這種方法同樣無法解決長期預測的問題.Liu等[27]提出了一種基于LSTM的空氣污染預測方法,該方法在一定程度上解決了時間序列的問題,但是其對輸入輸出未做處理,對預測結果有一定的影響.
本文認為如果想對未來一段時間的空氣污染濃度做出較為精準的預測,就必須建立在歷史觀測數(shù)據(jù)之上,以往的工作都是停留在淺層次的數(shù)據(jù)分析,并未能充分理解歷史數(shù)據(jù)的分布特征.本文設計了一個自編碼深度預測模型,提取歷史數(shù)據(jù)的有效信息,從而對未來污染物濃度進行合理預測.模型采用編碼器-解碼器的構架,其中編碼器采集歷史數(shù)據(jù)信息,解碼器用來預測空氣污染濃度.為了提升預測能力,本文通過疊加LSTM網(wǎng)絡結構提升編碼器的信息采集能力,從而在預測的階段有更多的參考依據(jù),促使模型做出合理的判斷.
深度學習最早由Hinton等人提出[28],能夠通過合適的訓練方法對樣本數(shù)據(jù)進行一系列的訓練,并反向調(diào)整網(wǎng)絡參數(shù),最后得到具有深層次的網(wǎng)絡結構的機器學習過程.
空氣污染預測問題是典型的時間序列數(shù)據(jù)預測問題,即通過一段已知時間區(qū)間的序列數(shù)值,預測隨后一段時間區(qū)間的數(shù)值.本文引入自編碼神經(jīng)網(wǎng)絡中編碼-解碼的構架,結合LSTM[15]網(wǎng)絡模型,提出一種基于自編碼網(wǎng)絡的空氣污染預測模型(auto-encoder based pollutant prediction,AEPP),以解決空氣污染數(shù)據(jù)的長序列時間依賴問題,實現(xiàn)時間序列預測.LSTM可以有效地處理時序數(shù)據(jù),壓縮和提取歷史污染物濃度以及同一時刻的氣候數(shù)據(jù),提取數(shù)據(jù)中的有效信息,使得網(wǎng)絡學習到歷史數(shù)據(jù)的分布特征,同時防止重要信息的彌散,實現(xiàn)對后續(xù)一段時間的污染物濃度值的預測.
本文首先將時間預測視作一個序列決策過程,選取一個時間區(qū)間的數(shù)據(jù)并按照時間維度將數(shù)據(jù)輸入到預測模型中.假設輸入的污染物時間序列為X=(x1,…,xt,…,xm).其中,m為時間序列的長度,xt為包含污染物濃度、溫度、風速、風向、濕度、降水量、其他污染物濃度等的因子.依據(jù)目標輸出的不同,AEPP可選擇合適的輸入值,即對于以天為單位的時間序列預測,可以選用各個因子的日均值;對于以小時為單位的時間序列預測,則選用各個因子的小時值.假設Y=(y1,…,yt,…,yn),為相對應的目標時間序列,n為輸出序列長度,yt代表某一污染物濃度的觀測值.
為了在AEPP中提取污染物數(shù)據(jù)的特征分布,AEPP中給定訓練編碼器(Encoder),用于提取輸入數(shù)據(jù)的有效信息;進一步通過編碼器提取隱藏向量(記為C),該隱藏向量C包含過去一段時間輸入的有效信息;相應地,AEPP訓練解碼器(Decoder),將隱藏向量C注入到Decoder中,利用Decoder獲取輸入數(shù)據(jù)的特征信息;最后使用Decoder按照時間維度預測獲得未來一段時間區(qū)間的污染物濃度預測值,P={p1,…,pi,…,pm}(規(guī)定P向量與目標預測向量Y的長度相等).
LSTM是一種穩(wěn)定的循環(huán)神經(jīng)網(wǎng)絡RNN改進模型.實驗表明,LSTM對于長序列依賴預測有比較好的效果.LSTM神經(jīng)元中內(nèi)建存儲單元用于存儲狀態(tài)信息,通過控制內(nèi)置的門參數(shù)來訪問、寫入和清除存儲單元.這幾個門主要是輸入門、遺忘門和輸出門.與RNN相比,LSTM的優(yōu)點是可以使用存儲單元和門函數(shù)控制信息流,因此梯度會被限制在神經(jīng)元中,達到防止梯度過快消失目標.LSTM的主要參數(shù)公式如下:
it=σ(Wxixt+Whiht-1+Wci°ct-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcf°ct-1+bf)
ct=ft°ct-1+it°tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+Wco°ct+bo)
ht=ot°tanh(ct)
式中:it、ft、ot、ct、ht分別表示t時刻的輸入門、遺忘門、輸出門、細胞狀態(tài)和隱藏層輸出;σ為logistic sigmoid函數(shù);W為各個門的循環(huán)權重;°代表Hadamard乘積.
本文通過編碼器和解碼器中多層LSTM堆疊架構形成深度網(wǎng)絡模型,從而實現(xiàn)增強提取污染物信息和模擬污染物變化的能力.
本文所提出的AEPP自編碼網(wǎng)絡模型由兩個部分組成,即編碼器(Encoder)和解碼器(Decoder),分別通過Encoder壓縮信息,Decoder預測信息.本文中Encoder通過LSTM實現(xiàn).在Encoder部分按照時間先后序列將污染物濃度預測數(shù)據(jù)單元輸入到LSTM網(wǎng)絡中,其中數(shù)據(jù)單元指的是每個時刻污染物濃度觀測值.然后獲取到編碼器的最后一個時刻的隱藏向量,也稱為語境向量C.C能夠代表整個輸入時間區(qū)間的信息,同時保留重要的特征信息,去除不重要的特征信息.此時,C表達對于已知時間區(qū)間內(nèi)污染物信息的濃縮“記憶”,主要包含污染物信息的特征分布.
進一步地,AEPP中Decoder依據(jù)編碼器“記憶”,將蘊含在C中的信息解析出來.Decoder也由LSTM構成,將編碼器的C輸入到解碼器中,解碼器再根據(jù)當前的輸入和自身的狀態(tài),對下一時刻的污染物濃度進行預測.
AEPP的整體過程如圖1所示.
在編碼器-解碼器組成的AEPP模型中,編碼過程是一個不斷學習的過程,每個時間片的學習,都是在豐富自己的記憶(隱藏狀態(tài)),但是記憶的容量是固定的(隱藏態(tài)的維度固定),所以需要不斷地過濾之前的知識(可視為遺忘不常用的知識),并更新新加入的知識.經(jīng)過一段時間序列的學習,獲得一定的知識,形成C,然后在解碼階段再將C中蘊含的信息解析出來,對未來一段時間的信息做出預測.
圖1 編碼器-解碼器模型Fig.1 Encoder-decoder model
2.3.1Encoder設計
編碼器主要是對輸入的時序數(shù)據(jù)進行特征提取.各類長度不同的輸入序列X將會經(jīng)由LSTM構建的編碼器編譯為C.假設給定輸入序列X=(x1,…,xt,…,xT),則隱藏狀態(tài)C可以通過如下公式得到:
ht=f(xt,ht-1);C=φ({h1,…,hTs})
式中:xt為t時刻的輸入值;ht-1為上一個時刻的隱藏狀態(tài);f為LSTM函數(shù);ht為t時刻的隱藏狀態(tài);φ為隱藏狀態(tài)計算函數(shù).向量C通常為LSTM中的最后一個隱藏節(jié)點,或者多個隱藏節(jié)點的加權總和.
2.3.2Decoder設計
解碼器主要功能是結合C和當前時刻的輸入數(shù)據(jù)預測下一時刻的污染物濃度.
解碼器主要公式如下:
ht,st=f(yt-1,st-1,C)
pt=Wht+b
式中:st為當前時刻的預測值;yt-1為上一時刻的輸出值;st-1為t-1時刻的隱藏狀態(tài);ht為t時刻輸出;pt為t時刻污染物的輸出;W、b為模型參數(shù).
2.3.3基于Encoder-Decoder的AEPP預測模型
本文提出的AEPP模型通過語境向量C連接,通過對網(wǎng)絡參數(shù)和損失函數(shù)的調(diào)整和大量數(shù)據(jù)的訓練,實現(xiàn)對污染物濃度時間序列預測的功能.預測模型如圖2所示.
AEPP模型的預測過程如下:
首先,編碼器是由多層LSTM構成,依次將輸入序列xi輸入到編碼器中.經(jīng)過編碼器的過濾和篩選,得到包含輸入數(shù)據(jù)的特征分布的C,得到輸入數(shù)據(jù)的特征表示.
圖2 AEPP污染預測模型 Fig.2 AEPP Model
然后,使用C作為解碼器的隱藏狀態(tài),進行數(shù)據(jù)解析.在t0時刻,解碼器沒有輸入值,可以使用全零值作為解碼器開始的信號.解碼器僅依靠C生成t0時刻的預測值;在ti時刻,解碼器結合ti-1時刻的輸出值和隱藏狀態(tài)生成ti時刻的預測值;依次類推,逐步生成一個時間序列的污染物濃度預測值.
假定輸出的預測序列值為P=(p1,…,pi,…,pn),目標序列預測值為Y=(y1,…,yi,…,yn),定義損失函數(shù)為
損失函數(shù)將誤差反向傳遞到網(wǎng)絡中,通過隨機梯度下降法調(diào)整網(wǎng)絡各層的連接權值,直至模型收斂.
在AEPP模型中,編碼器和解碼器使用同類型LSTM結構:一個用來編碼輸入序列,另一個用來解碼輸出序列.其中,編碼器和解碼器中的LSTM層數(shù)是可以調(diào)節(jié)的.
本文實驗以北京市作為預測目標城市,PM2.5為目標污染物.實驗中使用的數(shù)據(jù)集時間段為2010年1月1日到2014年12月31日,主要觀測值分別是年份、月份、天、小時、PM2.5值、露點、溫度、氣壓、風向、風速、累積雪量和累積雨量等.
由于數(shù)據(jù)的多樣性,各種空氣狀況衡量指標有所不同,觀測范圍都有很大差別.比如,在本數(shù)據(jù)集中,PM2.5這一指標的變化范圍是0~994,而溫度變化范圍是-19~42;風向這一觀測值是各種方向的標簽.觀測值變化范圍的差異會使數(shù)據(jù)不平衡,導致神經(jīng)網(wǎng)絡的表達能力下降;再者,神經(jīng)網(wǎng)絡也不能理解標簽化的數(shù)據(jù),所以有必要對觀測數(shù)據(jù)進行量綱一化和特征化.具體來說,本實驗將風向這一指標轉換成數(shù)字,比如將東風變換成0、西風變成1、南風變?yōu)?、北風變?yōu)?等等;然后將所有觀測數(shù)據(jù)按照觀測指標的不同將范圍放縮到0~1之間,這樣所有的數(shù)據(jù)在同一范圍波動,可以避免觀測值過大或者過小導致網(wǎng)絡過擬合,有利于網(wǎng)絡的收斂.
本文實驗定義已知時間段M為觀測時間窗口,預測時間段N為預測時間窗口.那么,實驗中模型輸入數(shù)據(jù)的時間窗口為M與N之和.在數(shù)據(jù)集中從開始位置找M+N時刻的觀測值當作一個數(shù)據(jù)單元,然后逐步向后滑動一個時刻的窗口;再取M+N時刻的觀測值當作另一個數(shù)據(jù)單元;按照這種操作直到數(shù)據(jù)集的時間末尾;然后將所有數(shù)據(jù)單元合并構成整個數(shù)據(jù)集.數(shù)據(jù)集的格式為[Tsize,M+N,D],觀測數(shù)據(jù)格式應為[Tsize,M,D],目標數(shù)據(jù)格式應為[Tsize,N,D].其中,Tsize為數(shù)據(jù)單元的總量,D為特征維度,即同一時刻各種觀測值的種類.數(shù)據(jù)切片如圖3所示.
圖3 數(shù)據(jù)切片圖Fig.3 Data slices
為了檢驗本文中模型的有效性,實驗中按照經(jīng)典的訓練和測試數(shù)據(jù)切分方式,即80%的數(shù)據(jù)用來訓練模型,20%用來測試模型的準確性.訓練數(shù)據(jù)和測試數(shù)據(jù)集結構都是{Xi,Yi}.其中,i∈(0,N),N為集合中的數(shù)據(jù)總數(shù);Xi={xi1,xi2,…,xim};Yi={yi1,yi2,…,yin};m、n分別為已知時間區(qū)間和預測時間區(qū)間.
為了驗證不同RNN結構對AEPP模型的影響,實驗中使用了不同的RNN結構,即RNN、GRU(gated recurrent unit)和LSTM等檢測模型的性能.由于模型中的編碼器和解碼器比較靈活,沒有固定時間限制,可以自由調(diào)整已知時間和預測時間,實驗中僅使用前5個時刻的空氣觀測值和后3個時刻的污染物預測值(簡稱[5,3]段)訓練模型.為了保持和其他模型的統(tǒng)一性,測試階段使用前72 h的空氣觀測值預測后24 h的污染物觀測值(簡稱[72,24]段).
首先,對于模型的編碼器部分,把已知時間區(qū)間的大氣觀測值按序列輸入到編碼器中.然后,對于模型的解碼器部分,訓練和測試階段都是一致的,這兩個階段均使用上一時刻的真實值預測下一時刻的污染物濃度.在解碼器的開始時刻t0將輸入置為10,這就意味著解碼器只通過編碼器所濃縮的隱藏向量C來預測這一時刻t0的污染物濃度p1.然后,再將數(shù)據(jù)集中的Yi第一時刻觀測值yi1輸入到編碼器中,用來預測t1時刻的污染物濃度p2;以此類推,yi2預測p3,yi3預測p4等等.整體效果就是將輸入值Yi后延一個時刻,第一時刻補10,即(10,yi1,yi2,…,yi(n-1)),這樣就可以達到用上一時刻預測下一時刻污染物濃度的目的.具體結構如圖4所示.
圖4 訓練階段和測試階段解碼器的結構Fig.4 Structures of decoder in training and test
實驗共使用6個模型:RNN模型、GRU模型、LSTM模型、RNN+AEPP模型、GRU+AEPP模型和LSTM+AEPP模型.對于AEPP模型,實驗選取前5個時刻的觀測值作為模型輸入,通過模型預測后3個時刻的PM2.5的濃度.由于RNN模型、GRU模型和LSTM模型在[5,3]段和[72,24]段不可共用模型參數(shù),故需要分別訓練.然后,按照上述規(guī)則分別對所有模型進行訓練和測試,并記錄實驗結果.
實驗結果表明:實驗數(shù)據(jù)集中,PM2.5的質(zhì)量濃度變化范圍是0~994.經(jīng)過100輪的迭代,所有模型的損失值先有明顯下降的趨勢,之后保持平穩(wěn)并基本收斂.本文使用測試集進行測試,實驗結果總結見表1.表中,RMSE表示均方根誤差,值越小表示模型性能越好;相關系數(shù)表示真實值和預測值之間的相關程度,越接近1,相關性越好.表中數(shù)據(jù)均精確到小數(shù)點后2位.CAMx(comprehensive air quality model with extensions)、CMAQ(community multiscale air quality modeling system)、NAOPMS(nested air quality prediction modeling system)和WRF-CHEM(weather research and forecasting model coupled with chemistry)表示傳統(tǒng)污染物預測模型,RNN、GRU和LSTM表示經(jīng)典的循環(huán)神經(jīng)網(wǎng)絡,最后3個AEPP模型表示本文中的模型和不同神經(jīng)網(wǎng)絡組合.
表1 模型對比表Tab.1 Comparison of models
對于單模型RNN、GRU和LSTM來說,[5,3]和[72,24]段模型參數(shù)不可共享,需要分別訓練.從表1中可以看出,預測效果并沒有太大提升.對于AEPP模型來說,[5,3]段和[72,24]段模型參數(shù)可以共享,本實驗是用[5,3]段數(shù)據(jù)訓練網(wǎng)絡,然后用[72,24]段作測試.
從表1可以看出:LSTM+AEPP模型預測最準確,相關性最高;RNN+AEPP模型預測不出結果;GRU+AEPP模型預測效果一般.這也說明LSTM對于解決時間序列問題比RNN和GRU好.
為了進一步檢測LSTM+AEPP模型的性能,實驗繼續(xù)使用上述[5,3]段保存的模型參數(shù),對不同時間段的數(shù)據(jù)進行測試.采用的已知時間和預測時間分別是[3,1]、[6,2]、[9,3]、…、[72,24]等,總體比例為3∶1.各個預測時間段的RMSE如圖5所示.
由實驗可以看出:預測時間越長,預測精度越高.由此可以看出,LSTM適用于解決長時間依賴的問題.
圖5 不同時間段的污染物質(zhì)量濃度RMSE值Fig.5 RMSEs in different periods
需要指出的是,由于該模型依賴于長時間序列的數(shù)據(jù),在遇到氣候或污染源突變(如社會生產(chǎn)導致的污染源變化、交通壓力或突然的冷空氣等)時,會出現(xiàn)預測錯誤的情況.這是由LSTM的特性所決定的.
最后,應用LSTM+AEPP模型給出一個PM2.5預測樣本,如圖6所示.
圖6 PM2.5預測樣本Fig.6 Samples of prediction
本文介紹了一個基于深度學習的污染物預測模型,主要針對污染物濃度進行序列建模,預測污染物濃度變化趨勢.這個預測模型主要用編碼器、解碼器的方式來總結歷史污染物濃度分布,并預測未知時間段的污染物濃度.通過實驗證明,本模型在短期污染物濃度預測方面可以取得不錯的效果.不足之處是隨著預測時間的增加,預測效果越差;在訓練階段和測試階段的預測值會有較大差異.當然這也符合天氣預測的規(guī)律:預測時間區(qū)間越短,預測結果越準確;預測時間區(qū)間越長,不確定因素越多,預測準確率就會相對下降.