国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ARIMA模型對定西天氣數(shù)據(jù)的分析與預(yù)測

2024-12-31 00:00:00趙子鵬魏新奇唐龍高丙翻康亮河
現(xiàn)代信息科技 2024年9期
關(guān)鍵詞:ARIMA模型

摘" 要:由于天氣對農(nóng)業(yè)生產(chǎn)、水資源管理和自然災(zāi)害預(yù)防等具有重要影響,文章采用ARIMA模型來實現(xiàn)對天氣的有效預(yù)測。通過利用ACF和PACF圖粗略確定ARIMA模型的參數(shù),最終確定最優(yōu)模型:ARIMA(1,1,1)為日最低氣溫模型,其殘差序列自相關(guān)函數(shù)與偏自相關(guān)函數(shù)基本落在95%置信區(qū)間內(nèi);同時Ljung-Box Q統(tǒng)計結(jié)果表明殘差不存在相關(guān)關(guān)系(P>0.05),即殘差為白噪聲,滿足隨機(jī)性假設(shè);最終計算誤差(日最低氣溫)RMSE、MAPE、MAE分別為2.63、1.22%、2.06,預(yù)測結(jié)果良好,為定西天氣的預(yù)測提供了可行的方案。

關(guān)鍵詞:天氣預(yù)測;時間序列插值法;ARIMA模型

中圖分類號:TP391.1" 文獻(xiàn)標(biāo)識碼:A" 文章編號:2096-4706(2024)09-0140-04

Analysis and Prediction of Dingxi Weather Data Based on ARIMA Model

ZHAO Zipeng, WEI Xinqi, TANG Long, GAO Bingfan, KANG Lianghe

(Gansu Agricultural University, Lanzhou" 730070, China)

Abstract: Due to the significant impact of weather on agricultural production, water resource management, and natural disaster prevention, it adopts the ARIMA model to achieve effective weather prediction. By using ACF and PACF diagrams to roughly determine the parameters of the ARIMA model, the optimal model is ultimately determined. ARIMA (1, 1, 1) is the daily minimum temperature model, with the residual sequence autocorrelation function and partial autocorrelation function basically falling within the 95% confidence interval. At the same time, the statistical results of Ljung-Box Q indicate that there is no correlation between residuals (P>0.05), indicating that residuals are white noise and satisfy the assumption of randomness. The final calculation errors (daily minimum temperature) RMSE, MAPE, and MAE are 2.63, 1.22%, and 2.06, respectively. The prediction results are good, providing a feasible solution for predicting the weather in Dingxi.

Keywords: weather forecasting; time series interpolation method; ARIMA model

0" 引" 言

定西市明清時期就已十年九旱,“貧瘠甲于天下”,

當(dāng)?shù)匕傩战?jīng)常遭受由災(zāi)害帶來的死亡威脅和經(jīng)濟(jì)損失[1],所以準(zhǔn)確預(yù)測和解讀天氣變化趨勢對于農(nóng)業(yè)決策[2]、災(zāi)害預(yù)防、人類的日常生活和經(jīng)濟(jì)活動[3]等方面具有重要意義。本研究的目標(biāo)是利用ARIMA(Autoregressive Integrated Moving Average)模型來預(yù)測定西的天氣趨勢。ARIMA模型是一種常見的時間序列分析方法,通過分析歷史數(shù)據(jù)中的趨勢、周期性和隨機(jī)性,可以預(yù)測未來的趨勢。

張梓[4]建立了ARIMA(0,1,1)模型,預(yù)測了貴州省未來5年的增長趨勢,結(jié)果表明相對相對誤差較小。謝淑紅等人[5]使用ARIMA模型得出蘇州地區(qū)臨床紅細(xì)胞類血液需求預(yù)測研究的最優(yōu)模型為ARIMA(0,1,1),且預(yù)測值均在95%CI內(nèi),平均相對誤差較小,為8.21%,模型預(yù)測效果較好。吳會會等人[6]建立了一個ARMA(1,3)模型,并利用該模型預(yù)測了未來5年全球氣表溫度改變量,結(jié)合實驗結(jié)果,分析了氣候改變給人們帶來的影響,最后給予了應(yīng)對全球氣候變暖的建議。滿粟萌等人[7]建立了ARIMA(0,2,1)模型,運(yùn)用該模型預(yù)測甘肅省5年內(nèi)的城鎮(zhèn)居民人均可支配收入,相對誤差保持在0.03以下,擬合效果較好。結(jié)果顯示:2022—2026年甘肅省城鎮(zhèn)居民人均可支配收入呈現(xiàn)出持續(xù)上漲的趨勢。Ariff等人[8]建立一個ARIMA(2,1,1)(0,1,0)預(yù)測新發(fā)結(jié)核病病例的模型,結(jié)果表明新發(fā)結(jié)核病例具有明顯的季節(jié)性。Zhao等人[9]利用洛陽市1973至2021年逐月歷史降水?dāng)?shù)據(jù)構(gòu)建模型,采用ARIMA模型預(yù)測低頻序列部分,對未來降水的預(yù)測結(jié)果具有較高的置信度。鄭艷妮等人[10]建立了ARIMA(0,0,1)(2,1,1)_(12)模型其預(yù)測值與觀測值整體趨勢變化一致,絕對誤差最小0.16、最大11.68。

ARIMA模型的優(yōu)勢在于它可以充分利用歷史數(shù)據(jù),自動調(diào)整模型參數(shù)以適應(yīng)不同時間尺度的變化特征,并提供未來天氣變化的概率分布,有助于風(fēng)險評估和制定相應(yīng)的應(yīng)對措施。通過本研究,我們希望能夠為定西的農(nóng)民、水資源管理者和災(zāi)害預(yù)防機(jī)構(gòu)提供有價值的參考,幫助他們更好地應(yīng)對不可預(yù)測的自然環(huán)境變化,并推動天氣預(yù)測技術(shù)的進(jìn)一步發(fā)展。

1" 基本資料和算法原理

本文以甘肅省氣象局2017—2021年的定西市天氣數(shù)據(jù)為研究對象,數(shù)據(jù)中包括日降水量(mm)、日平均相對濕度(%)、日平均風(fēng)速(m/s)、日平均氣壓(hPa)、日最高氣溫(℃)、日最低氣溫(℃)。我們以日最低氣溫為例。使用Python語言建立ARIMA模型。

ARIMA模型包括自回歸(AR)、差分(I)和移動平均(MA)三個部分,通過調(diào)整這三部分的參數(shù),可以得到不同的ARIMA模型:

式(1)中,yt表示當(dāng)前值,α表示常數(shù)項,p表示自回歸項,yi表示自相關(guān)系數(shù),ε表示殘差序列,q表示移動平均項,θ表示移動平均項系數(shù)。

ACF是衡量時間序列數(shù)據(jù)中自相關(guān)的度量,它可以用來確定q值(移動平均項的階數(shù))。PACF是衡量時間序列數(shù)據(jù)中偏自相關(guān)的度量,它可以用來確定p值(自回歸項的階數(shù))。

式(2)中,k表示間隔的階數(shù),p表示AR(p)模型中的階數(shù)。

ACF:

式(3)中,yt表示時間序列中的第t個值, 表示時間序列的平均值,k表示時間序列中的滯后期,n表示時間序列的長度。

均方根誤差(Root Mean Square Error, RMSE)、平均絕對誤差(Mean Absolute Error, MAE)及平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)公式如下:

2" 模型構(gòu)建

2.1" 數(shù)據(jù)預(yù)處理

在ARIMA模型中,要求時間序列數(shù)據(jù)是平穩(wěn)的且不符合白噪聲假設(shè)。因此,在進(jìn)行預(yù)測之前,我們需要對數(shù)據(jù)進(jìn)行預(yù)處理。下面是對時間序列數(shù)據(jù)進(jìn)行預(yù)處理的一般流程,如圖1所示。

2.1.1" 缺失值處理

通過散點圖對異常值檢測發(fā)現(xiàn)數(shù)據(jù)里有缺失值,其統(tǒng)計共有63處,針對數(shù)據(jù)中的缺失問題,使用Python中的SciPy庫中的interpolate模塊來進(jìn)行線性插值的計算,從而補(bǔ)全缺失數(shù)據(jù),減少偏差,確保統(tǒng)計分析可靠性,提高模型的準(zhǔn)確性,使模型更好地對新數(shù)據(jù)做出預(yù)測。

2.1.2" 平穩(wěn)性檢測

ARIMA模型是建立在對時間序列的平穩(wěn)性要求上的,即只有平穩(wěn)性的時間序列才適合于使用ARIMA模型進(jìn)行分析和預(yù)測。平穩(wěn)性的時序數(shù)據(jù)具有如下特點:均值穩(wěn)定不變、隨機(jī)性強(qiáng)、方差是恒定的。而且自相關(guān)系數(shù)只依賴于時間間隔,與時間的大小無關(guān)。如圖2所示,很明顯發(fā)現(xiàn)源數(shù)據(jù)不具有平穩(wěn)性,因此進(jìn)行差分處理。

差分處理后如圖3所示,通過觀察,數(shù)據(jù)的整體趨勢不明顯,不具有明顯的季節(jié)性或周期性變化,則一階差分具有平穩(wěn)性。為了預(yù)測結(jié)果的準(zhǔn)確性,因此我們采用一階差分。

2.1.3" 白噪聲檢測

白噪聲是指一個隨機(jī)序列,在時間上沒有自相關(guān)性,即不同時間點之間沒有相關(guān)性。如果數(shù)據(jù)序列符合白噪聲的假設(shè),意味著序列中的數(shù)據(jù)相互之間是獨立的,沒有包含任何有用的信息。因此,在建模前,需要確保數(shù)據(jù)序列具有一定程度的自相關(guān)性。

為了檢驗差分序列是否滿足白噪聲的假設(shè),利用Ljung-Box檢驗。該檢驗方法會計算一組滯后期的自相關(guān)系數(shù),并基于這些系數(shù)進(jìn)行統(tǒng)計檢驗,以確定序列是否表現(xiàn)出顯著的自相關(guān)性。在白噪聲檢驗中,我們通常關(guān)注的是檢驗的p值。

結(jié)果表明p值為4.907 389×10-22,幾乎趨近于0,說明差分序列不滿足白噪聲的假設(shè)。也就是說,在差分序列中存在一定的自相關(guān)性。

2.2" 模型定階

數(shù)據(jù)預(yù)處理工作完成后,通過計算ACF和PACF來確定ARIMA模型的階數(shù)(p,d,q),詳細(xì)流程如圖4所示。

使用Python中的statsmodels庫中的plot_acf()和plot_pacf()函數(shù)和matplotlib庫來繪制ACF和PACF圖,幫助分析時間序列數(shù)據(jù)的自相關(guān)性和偏自相關(guān)性。

圖5是自相關(guān)圖:自相關(guān)圖顯示數(shù)據(jù)點之間的自相關(guān)性。該圖顯示了自相關(guān)系數(shù)與滯后(Lag)之間的關(guān)系。自相關(guān)系數(shù)衡量了數(shù)據(jù)與它自身之間的相關(guān)性。如圖5所示,自相關(guān)圖顯示了在4階以后數(shù)據(jù)點逐漸進(jìn)入二倍標(biāo)準(zhǔn)差區(qū)域,具有拖尾(tail-off)特征。拖尾意味著數(shù)據(jù)點之間的相關(guān)性在滯后增加時逐漸減弱。這表明可以考慮使用自回歸(AR)模型,因為拖尾特征通常與AR模型相關(guān)。

圖6是偏自相關(guān)圖:偏自相關(guān)圖顯示了兩個數(shù)據(jù)點的相關(guān)性,消除了中間滯后項的影響。它們用來確定自回歸部分(AR)和移動平均部分(MA)的滯后階數(shù)。如圖6所示,偏自相關(guān)圖顯示了9階截尾(truncation)特征。截尾意味著滯后大于9的相關(guān)性趨近于零。這表明在滯后為9之后,偏自相關(guān)系數(shù)很小,可以考慮使用MA模型。

綜合自相關(guān)圖和偏自相關(guān)圖的特征,且通過進(jìn)一步的調(diào)整和驗證,最終確定p = 1,q = 1,由于我們使用的是一階差分后的數(shù)據(jù),所以確定ARIMA(p,d,q)模型為ARIMA(1,1,1)。其中,p = 1代表自回歸部分的滯后階數(shù),q = 1代表移動平均部分的滯后階數(shù),d = 1代表使用一階差分來進(jìn)行數(shù)據(jù)的平穩(wěn)化。

2.3" 模型預(yù)測和誤差分析

2.3.1" 模型預(yù)測

運(yùn)用ARIMA(1,1,1)模型對2017—2021年的定西市天氣數(shù)據(jù)為研究對象進(jìn)行預(yù)測(以日最低氣溫為例),我們將70%的數(shù)據(jù)作為訓(xùn)練集X_train,剩余30%數(shù)據(jù)作為測試集X_test,得出預(yù)測值與實際值時序值擬合圖,如圖7所示。

從預(yù)測值和實際值的對比可以看出,預(yù)測結(jié)果和真實值擬合度較高。預(yù)測值基本圍繞真實值上下波動,總體而言預(yù)測效果不錯,模型能夠較好地預(yù)測未來最低氣溫的變化趨勢。

2.3.2" 誤差分析

本文選擇均方根誤差(RMSE)、平均絕對誤差(MAE)及平均絕對百分比誤差(MAPE)作為評價指標(biāo)。

表1結(jié)果表明,RMSE和MAE的值相對較低,說明預(yù)測結(jié)果整體上具有較好的準(zhǔn)確性。模型的平均誤差較小,預(yù)測值與真實值之間的差異較小。這意味著模型能較為準(zhǔn)確地進(jìn)行預(yù)測,捕捉到真實數(shù)據(jù)中的一些趨勢和變化。

MAPE的值為1.22%,說明相對誤差平均較小。意味著模型的相對誤差不高,能夠較為準(zhǔn)確地預(yù)測出數(shù)據(jù)的相對變化。較低的MAPE值表示模型對真實數(shù)據(jù)具有較好的擬合度。

通過預(yù)測結(jié)果誤差分析,可以認(rèn)為該模型的預(yù)測效果較好。模型的預(yù)測準(zhǔn)確性較高,平均誤差較小,并能較好地捕捉到真實數(shù)據(jù)的趨勢和變化。

3" 結(jié)" 論

以日最低氣溫為例,對未來數(shù)據(jù)進(jìn)行預(yù)測,并獲得了令人滿意的預(yù)測結(jié)果??梢詾槎ㄎ鞯霓r(nóng)民、水資源管理者和災(zāi)害預(yù)防機(jī)構(gòu)提供寶貴的參考信息。對于農(nóng)民而言,可以幫助他們做出合理的農(nóng)作決策,如農(nóng)作物的種植時間、灌溉計劃等,以最大限度地優(yōu)化農(nóng)作物的產(chǎn)量和質(zhì)量。對于水資源管理者而言,這一預(yù)測結(jié)果將有助于合理規(guī)劃水資源的利用和分配,以適應(yīng)不同氣溫條件下的需求和減少水資源的浪費(fèi)。此外,對于災(zāi)害預(yù)防機(jī)構(gòu)而言,這一預(yù)測結(jié)果將為他們提供重要的參考,以便提前預(yù)防自然災(zāi)害(如寒潮、霜凍等)給定西帶來的經(jīng)濟(jì)損失。因此,這項預(yù)測研究的成功將為定西的社會經(jīng)濟(jì)發(fā)展和環(huán)境可持續(xù)性提供有力支持,幫助相關(guān)部門和決策者做出正確的決策。

通過上述同樣的方法,我們對日降水量、日平均相對濕度、日平均風(fēng)速、日平均氣壓、日最低氣溫也進(jìn)行了建模。最終確定最優(yōu)模型為ARIMA(3,1,2)為日降水量模型、ARIMA(1,1,1)為日最高氣溫模型、ARIMA(1,1,2)為日平均氣壓模型、ARIMA(2,1,2)為日平均風(fēng)速模型、ARIMA(1,1,2)為日平均相對濕度模型。預(yù)測結(jié)果表明,預(yù)測值基本圍繞真實值上下波動,總體而言預(yù)測效果不錯。

參考文獻(xiàn):

[1] 權(quán)琦.明清時期定西自然災(zāi)害研究 [D].蘭州:蘭州大學(xué),2007.

[2] 高淑敏.天氣新聞對農(nóng)業(yè)生產(chǎn)的重要性及影響 [J].農(nóng)業(yè)災(zāi)害研究,2021,11(10):64-65.

[3] 田國萍.溫度變化對我國農(nóng)業(yè)經(jīng)濟(jì)的影響研究 [D].成都:西南財經(jīng)大學(xué),2021.

[4]張梓.基于ARIMA模型的貴州省GDP分析與預(yù)測 [J].國土與自然資源研究,2022(5):39-41.

[5] 謝淑紅,張思靜,嚴(yán)偉斌,等.基于ARIMA模型的臨床紅細(xì)胞類血液需求預(yù)測研究 [J].蚌埠醫(yī)學(xué)院學(xué)報,2023,48(5):633-636.

[6] 吳會會,王嘉鵬,吳文靜,等.基于ARIMA模型的全球氣表溫度預(yù)測分析 [J].現(xiàn)代信息科技,2023,7(16):147-150.

[7] 滿粟萌,牛飛亮.基于ARIMA模型的甘肅省城鎮(zhèn)居民人均可支配收入分析與預(yù)測 [J].投資與合作,2023(7):89-91.

[8] ARIFF M R A,RAFDZAH Z A,ROZITA W M W,et al. Forecasting New Tuberculosis Cases in Malaysia: A Time-Series Study Using the Autoregressive Integrated Moving Average (ARIMA) Model [J/OL].Cureus,2023,15(9):44676[2023-09-26].https://www.cureus.com/articles/170914-forecasting-new-tuberculosis-cases-in-malaysia-a-time-series-study-using-the-autoregressive-integrated-moving-average-arima-model#!/.

[9] ZHAO J W,NIE G Z,WEN Y H. Monthly precipitation prediction in Luoyang city based on EEMD-LSTM-ARIMA model [J].Water Science and Technology,2023,87(1):318-335.

[10] 鄭艷妮,李盛,趙玉銳,等.武威市手足口病流行病學(xué)特征分析及ARIMA預(yù)測 [J].疾病預(yù)防控制通報,2023,38(4):10-14+68.

作者簡介:趙子鵬(2002—),男,漢族,甘肅天水人,本科在讀,研究方向:機(jī)器學(xué)習(xí);魏新奇(2003—),男,漢族,甘肅會寧人,本科在讀,研究方向:數(shù)據(jù)挖掘;唐龍(2001—),男,漢族,四川蓬安人,本科在讀,研究方向:數(shù)據(jù)挖掘;高丙翻(2001—),女,漢族,甘肅白銀人,本科在讀,研究方向:機(jī)器學(xué)習(xí);通訊作者:康亮河(1987—),女,漢族,甘肅會寧人,助教,碩士,研究方向:人工智能算法研究。

猜你喜歡
ARIMA模型
基于時間序列模型的中國出口總額分析及預(yù)測
基于R軟件的金融時間序列的預(yù)測分析
基于Eviews上證綜合指數(shù)預(yù)測
時代金融(2016年29期)2016-12-05 16:12:09
基于ARIMA模型的河北省能源消費(fèi)預(yù)測
商(2016年29期)2016-10-29 21:09:09
基于ARIMA模型的滬銅期貨價格預(yù)測研究
商(2016年27期)2016-10-17 06:06:02
基于ARIMA模型的人民幣匯率分析及預(yù)測
ARIMA模型在中國GDP預(yù)測中的應(yīng)用
商(2016年22期)2016-07-08 15:29:39
對我國進(jìn)出口總額的預(yù)測
商(2016年22期)2016-07-08 14:41:15
組合預(yù)測法在我國糧食產(chǎn)量預(yù)測中的應(yīng)用
商(2016年19期)2016-06-27 14:21:53
時間序列分析在財政收入預(yù)測中的應(yīng)用
商(2016年10期)2016-04-25 10:25:45
即墨市| 调兵山市| 工布江达县| 密云县| 牡丹江市| 高阳县| 景洪市| 抚宁县| 自治县| 南召县| 延吉市| 江口县| 葫芦岛市| 余江县| 水富县| 泰州市| 武隆县| 武胜县| 峨边| 循化| 涟水县| 佛冈县| 八宿县| 武胜县| 通河县| 大足县| 屏边| 彝良县| 漳州市| 建宁县| 家居| 新丰县| 三原县| 黎城县| 台东市| 莲花县| 桃江县| 盐边县| 丰顺县| 四会市| 江西省|