關(guān)鍵詞:蒸發(fā)皿蒸發(fā)量;時間卷積網(wǎng)絡(luò);K-近鄰算法;空間因素
中圖分類號:P426;TP183 文獻(xiàn)標(biāo)志碼:A doi:10.3969/ j.issn.1000-1379.2024.06.019
引用格式:謝育珽,鄭翔天,史俊才,等.基于KNN-TCN 模型的蒸發(fā)皿蒸發(fā)量預(yù)測研究[J].人民黃河,2024,46(6):113-118,125.
陸地水量平衡的3 個基本要素包括降水、蒸發(fā)和徑流[1] 。蒸發(fā)是水分子從液態(tài)轉(zhuǎn)化為氣態(tài)的相變過程,是自然界水循環(huán)過程中的主導(dǎo)因素之一,能綜合反映水分和熱量,是水量平衡的重要影響因素[2] 。蒸發(fā)皿蒸發(fā)量是估算大氣蒸發(fā)量的重要指標(biāo)之一。
蒸發(fā)過程具有高度復(fù)雜的物理和非線性性質(zhì),利用傳統(tǒng)經(jīng)驗公式法很難對其進(jìn)行精確預(yù)測[3] 。隨著深度學(xué)習(xí)方法的快速發(fā)展,加之其操作的簡便性和良好的泛化性,為蒸發(fā)皿蒸發(fā)量的預(yù)測研究提供了新思路。Afshin 等[4] 在印度喜馬拉雅中部地區(qū),采用多層感知器神經(jīng)網(wǎng)絡(luò)(MLPNN)、協(xié)同神經(jīng)模糊推理系統(tǒng)(CANFIS)等對蒸發(fā)皿蒸發(fā)量進(jìn)行了預(yù)測研究,結(jié)果表明基于螢火蟲算法的MLPNN 模型是Astara氣象站的蒸發(fā)皿蒸發(fā)量預(yù)測的最佳模型。塔布里茲大學(xué)將支持向量機(jī)(SVM)模型和K-近鄰(KNN)算法和隨機(jī)森林(RF)模型、高斯過程回歸(GPR)用于伊朗地區(qū)4 個氣象站的蒸發(fā)皿蒸發(fā)量預(yù)測研究,結(jié)果表明輸入氣象參數(shù)氣溫、風(fēng)速、日照的高斯過程回歸(GPR)對蒸發(fā)皿蒸發(fā)量的預(yù)測最為準(zhǔn)確[5] 。齊建東等[6] 引入注意力機(jī)制,對LSTM 模型進(jìn)行優(yōu)化,提出AT-LSTM 模型,對鹽池縣的蒸散發(fā)量進(jìn)行精確預(yù)測,并將AT-LSTM 模型與ELM、SVM 兩種模型進(jìn)行對比,驗證AT-LSTM 模型的性能,證明了注意力機(jī)制對LSTM 模型優(yōu)化效果明顯。
利用深度學(xué)習(xí)模型對蒸發(fā)皿蒸發(fā)量預(yù)測進(jìn)行建模有一定的優(yōu)勢,實現(xiàn)起來較為簡單,且適用性較強。但是國內(nèi)外大多數(shù)研究僅考慮氣象參數(shù)的時序特征,是基于觀測站單站點的研究,并沒有考慮到蒸發(fā)皿蒸發(fā)量的區(qū)域空間相關(guān)性,這樣會導(dǎo)致預(yù)測結(jié)果有一定的片面性,預(yù)測精度不高[7] 。因此,本文綜合了國內(nèi)外研究現(xiàn)狀,將其中具有代表性的神經(jīng)網(wǎng)絡(luò)模型、長短期記憶網(wǎng)絡(luò)模型和近年來提出的時間卷積網(wǎng)絡(luò)TCN 模型用于對中國地面國際交換站的蒸發(fā)皿蒸發(fā)量進(jìn)行預(yù)測,探究模型的適用性,并引入K-近鄰算法對TCN 模型進(jìn)行優(yōu)化,構(gòu)建預(yù)測混合模型。從時間和空間兩個方面充分獲取特征,對區(qū)域蒸發(fā)皿蒸發(fā)量進(jìn)行全面和準(zhǔn)確的預(yù)測,探尋穩(wěn)定、可靠的蒸發(fā)皿蒸發(fā)量預(yù)測模型,以期為相關(guān)研究提供參考。
1研究區(qū)概況
本文的研究站點位于我國北方,遍布5 個省、1 個自治區(qū)和1 個直轄市,共計14個中國地面國際交換站,站點的地理位置見圖1(其中大同-53487、太原-53772為本文的預(yù)測目標(biāo)站點,城市名稱后5 位數(shù)字為中國地面國際交換站區(qū)站號)。這14 個站點均屬于溫帶季風(fēng)氣候區(qū),夏季高溫多雨,冬季寒冷干燥,四季分明。其中大同、太原、介休、原平、運城、榆林和延安地面國際交換站位于黃土高原地區(qū),海拔較高,受夏季風(fēng)影響較弱,空中水汽較少,降水較少,氣溫年較差大;鄭州、安陽、石家莊、濟(jì)南和北京地面國際交換站位于華北平原地區(qū),海拔較低,距離海洋較近,空氣中水汽豐富,降水量較多;呼和浩特地面國際交換站所處中溫帶大陸性季風(fēng)氣候區(qū),日溫差較大,春季干旱多風(fēng),夏季短暫,秋季降溫迅速,冬季漫長,為典型的蒙古高原大陸性氣候區(qū);懷來地面國際交換站位于燕山地區(qū),屬于中溫帶半干旱區(qū),光照充足,雨熱同季,晝夜溫差大[8-10] 。
2數(shù)據(jù)來源與研究方法
2.1數(shù)據(jù)來源
本文數(shù)據(jù)源于國家氣象科學(xué)數(shù)據(jù)中心發(fā)布的中國地面國際交換站氣候資料日值數(shù)據(jù)集(V3.0)。選取了數(shù)據(jù)集中的7 類氣象參數(shù),分別為氣溫、氣壓、相對濕度、降水量、蒸發(fā)量、風(fēng)速和日照時數(shù)。研究中將1960 年1 月1 日至2019 年12 月31 日共計21 914 組日值氣象數(shù)據(jù)按照時間排序,然后利用滑動窗口的方法構(gòu)建時間序列,設(shè)置時間步為6,即將連續(xù)6 d 的氣象數(shù)據(jù)作為一個最小時間序列,最終獲得了21 909 個時間序列數(shù)據(jù)。于是,把6 個時間節(jié)點的7 類氣象參數(shù)作為輸入項構(gòu)成21 909×6×7 的矩陣,以下一個時間節(jié)點的蒸發(fā)皿蒸發(fā)量為輸出項構(gòu)成21909×1×1 的矩陣。選取研究站點80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集。
2.2研究方法
膨脹卷積是基于因果卷積改進(jìn)而來的。由于原始因果卷積在處理較長的時間序列問題時,會導(dǎo)致網(wǎng)絡(luò)層數(shù)變多,模型結(jié)構(gòu)變得很深,影響模型的預(yù)測效果,因此,膨脹卷積應(yīng)運而生,引入膨脹因子,可以在有限的模型深度條件下,保持較大的感受野,同時也緩解了梯度消失或梯度爆炸的問題。
TCN模型引入殘差結(jié)構(gòu)起到補充信息作用。其中,每個殘差結(jié)構(gòu)由兩層一維膨脹卷積組合而成,并加入跨層連接的恒等映射,將原始輸入信息與經(jīng)過膨脹卷積提取的信息相加,從而起到信息補充的作用;同時,殘差塊的引入使得淺層網(wǎng)絡(luò)很容易擴(kuò)展為深層網(wǎng)絡(luò)。
TCN模型在時序預(yù)測問題上具有結(jié)構(gòu)上的優(yōu)越性,本文將該模型應(yīng)用到蒸發(fā)皿蒸發(fā)量的預(yù)測上,探究TCN 模型的適用性。
2.2.2K-近鄰算法
K-近鄰(K-Nearest Neighbors,KNN)算法是一種較為簡單的監(jiān)督分類算法[12] 。KNN 算法的總體思想是將分類目標(biāo)與現(xiàn)有樣本進(jìn)行距離度量,找分類目標(biāo)與樣本之間距離最近的K 個樣本點,K 個樣本中哪個類別的數(shù)量最多,此樣本的類別為分類目標(biāo)的類別,其中分類目標(biāo)可以是一維、二維或多維。
假設(shè)數(shù)據(jù)集有兩類不同的樣本數(shù)據(jù),分別用黃色的小正方形和綠色的小三角形表示(見圖2)。圖2 正中間紅色的圓點代表分類目標(biāo)點,不同的樣本分別對應(yīng)特征空間中的一個點。
KNN 算法中K 值的選擇直接影響到分類精度。假設(shè)K=3,紅色圓點的最鄰近的3 個點分別是2 個綠色小三角形和1 個黃色小正方形,少數(shù)從屬于多數(shù),判定紅色的分類目標(biāo)點屬于綠色的三角形一類;K=5,紅色圓點的最鄰近的5 個點分別是2個綠色小三角形和3 個黃色小正方形,同樣少數(shù)從屬于多數(shù),判定紅色的分類目標(biāo)點屬于黃色的正方形一類。因此,K 值的選擇影響到分類的結(jié)果。
KNN 算法能夠?qū)r間序列進(jìn)行距離度量,并作為區(qū)域內(nèi)序列時間相似性的分類算法,為空間因素的篩選提供依據(jù)。常見的距離度量方法有歐氏距離(Eu?clidean Distance)、曼哈頓距離(Manhattan Distance)和切比雪夫距離(Chebyshev Distance)3 種,本文所使用的為歐氏距離。
表1、表2 是基于歐氏距離對目標(biāo)站點大同-53487、太原-53772的空間因素的篩選結(jié)果,K 值越大,所需的空間因素個數(shù)就越多。依據(jù)篩選結(jié)果,本節(jié)設(shè)置了兩個目標(biāo)站點26 組對比試驗,探究最優(yōu)K 值,從而得到最佳TCN 預(yù)測模型,預(yù)測結(jié)果見表3。不同歐氏距離(K 值)對應(yīng)的均方根誤差如圖3所示。
由表3、圖3 可知,隨著空間因素的增多(即空間相關(guān)性站點數(shù)量增多),TCN 模型預(yù)測的判定系數(shù)有所升高,平均絕對誤差和均方根誤差有所降低。當(dāng)K =4時,目標(biāo)站點太原-53772 的預(yù)測效果最好,平均絕對誤差、均方根誤差、判定系數(shù)分別為0.33651 mm/ d、0.693 80 mm/ d、0.880 43;當(dāng)K >4 時,TCN 模型的判定系數(shù)小幅降低。因此,K = 4 時為預(yù)測目標(biāo)站點太原-53772 站最優(yōu)模型;同樣,K = 6 時為預(yù)測目標(biāo)站點大同-53487站最優(yōu)模型,平均絕對誤差、均方根誤差、判定系數(shù)分別為0.59967mm/ d、0.90201mm/d、0.84464。
本文將最優(yōu)K 值的KNN-TCN 模型與LSTM 模型和TCN 模型做對比,預(yù)測目標(biāo)站點太原53772 站模型預(yù)測結(jié)果分析見表4。由表4 可知,KNN-TCN 模型利用區(qū)域空間因素,比基礎(chǔ)KNN 模型對蒸發(fā)皿蒸發(fā)量的預(yù)測效果提升十分明顯,KNN-TCN 模型的判定系數(shù)相較于TCN 和LSTM 模型提升了2.52%和4.60%、平均絕對誤差相較于TCN 和LSTM 模型降低了0.239 73mm/d 和0.261 82 mm/d、均方根誤差相較于TCN 和LSTM 模型降低0.130 60mm/d 和0.18556 mm/d。
KNN-TCN模型的預(yù)測效果較好原因為:一是加入了空間因素,二是空間因素的篩選利用歐氏距離進(jìn)行度量較為合理。在此繪制目標(biāo)站點觀測值與預(yù)測值的擬合圖(見圖4)、回歸圖(見圖5),將預(yù)測結(jié)果進(jìn)行可視化。
由圖4 可知,蒸發(fā)量的變化具有明顯的周期性和季節(jié)性,在年變化中,具有明顯的單峰趨勢,整體的蒸發(fā)量變化呈現(xiàn)夏季偏高、冬季偏低的特點。從宏觀預(yù)測效果來看,3個預(yù)測模型均能較好地擬合蒸發(fā)皿蒸發(fā)量的變化趨勢;從局部擬合效果來看,KNN-TCN模型對峰值和谷值的擬合效果最好,預(yù)測效果明顯優(yōu)于LSTM 和TCN模型。
由圖5可知,紅色虛線Y=X是預(yù)測結(jié)果回歸的“完美直線”,即模型預(yù)測值完全等于站點觀測值。若模型預(yù)測值無限接近于站點觀測值,那么所繪制的點數(shù)據(jù)就無限靠近Y =X 直線,總體呈現(xiàn)離散點少且繪制點的離散距離近的特點。在區(qū)間[0,2]中,3種模型的預(yù)測效果均不錯,離散點較少,離散距離較近。隨著蒸發(fā)皿蒸發(fā)量的數(shù)值增大,預(yù)測效果變差,離散點較多,且繪制點偏離Y =X直線的距離越來越大。從整體可以看出,KNN-TCN模型的離散點個數(shù)最少,相較于LSTM 和TCN 模型,KNN-TCN模型預(yù)測結(jié)果更加接近Y =X 直線。
綜上可知,3種預(yù)測模型均能較好地擬合蒸發(fā)皿蒸發(fā)量,其中KNN-TCN 模型對峰值和谷值的擬合效果最好,明顯區(qū)別于其他模型;同時,KNN-TCN 模型的離散點最少,即模型預(yù)測值與觀測值無限接近。
4結(jié)論
1)TCN 模型僅僅在單站點的時間序列中對蒸發(fā)量預(yù)測效果較好。KNN 作為較好的分類算法,將蒸發(fā)量的空間因素進(jìn)行了有效篩選,在時間和空間雙因素作用下,TCN 模型的蒸發(fā)皿蒸發(fā)量預(yù)測效果提升明顯。
2)TCN 模型的膨脹卷積和恒等映射是時序問題中有效保留了歷史信息的重要手段。
3)在太原地面國際交換站的蒸發(fā)皿蒸發(fā)量的預(yù)測試驗中,KNN-TCN 模型的平均絕對誤差、均方根誤差和判定系數(shù)分別為0.336 51 mm/ d、0.69380mm/d、0.880 43,預(yù)測結(jié)果明顯優(yōu)于LSTM 模型,同時相較于基礎(chǔ)TCN 模型, 在3 項評價指標(biāo)上分別優(yōu)化了23.97%、13.06%、2.52%;在空間因素的距離度量試驗中,歐氏距離的篩選結(jié)果較好。KNN-TCN 模型充分利用了蒸發(fā)皿蒸發(fā)量的時間因素和空間因素,對蒸發(fā)皿蒸發(fā)量的預(yù)測效果提升明顯。