廣東省衛(wèi)生健康委政務服務中心(510006) 黃曉亮 謝易嫻
【提 要】 目的 建立廣東省住院人次時間序列預測模型,評估新冠疫情對2020年廣東省住院量的影響。方法 采集廣東省衛(wèi)生健康信息網絡直報系統(tǒng)2010-2020年住院人次月度數據,采用時序圖描述住院量的時間分布情況,采用指數平滑法、ARIMA模型對2010-2018年住院人次月度數據進行模型擬合,根據2019年實測數據與預測數據的比較評價模型預測效果,并結合模型擬合參數選出最優(yōu)模型預測2020年住院人次,分析此次新冠疫情對2020年住院人次的影響。結果 廣東省住院人次表現為季節(jié)依存性,呈現7-8月波峰,1-2月波谷的周期趨勢,指數平滑法winter相乘模型擬合效果最優(yōu),決定系數R2為 0.970。2019年的預測值平均相對誤差為2.98%。受疫情影響,2020年全省實際住院1567.5萬人次,比預測值低16.6%。結論 季節(jié)指數平滑winter相乘模型較好地擬合了廣東省住院人次變化趨勢,受新冠疫情影響,廣東省 2020年住院人次近十年首次負增長。
住院人次是衡量醫(yī)院工作量的重要指標,也是醫(yī)院發(fā)展的基礎[1],統(tǒng)計預測在醫(yī)院管理工作中發(fā)揮著重要的作用[2]。時間序列模型是根據數據資料所呈現的季節(jié)變動規(guī)律和長期趨勢,對時間序列數據進行分析和總結,以預測未來變化趨勢[3]。目前,國內對住院人次的統(tǒng)計預測僅限于單個模型預測[4-6],樣本量小,未對各模型擬合結果進行比較。常見的模型有指數平滑簡單季節(jié)模型、Holt-Winter模型、Winter相加模型、Winter相乘模型、ARIMA模型等[7]。本文旨在通過對比分析各模型對廣東省近十年住院人次的擬合情況,找出最佳模型,并通過對比2020年廣東省住院人次的模型預測值與實際值,分析新冠疫情對住院人次的影響。
根據《全國衛(wèi)生資源與醫(yī)療服務統(tǒng)計調查制度》,通過廣東省衛(wèi)生健康統(tǒng)計信息網絡直報平臺,采集2010-2020年全省醫(yī)療衛(wèi)生機構月報(衛(wèi)健統(tǒng)1-8表),納入住院人次指標。所有上報數據經過機構自審,縣區(qū)-地市-省-國家四級衛(wèi)生健康統(tǒng)計部門審核把關,并通過信息采集平臺的審核校驗,數據真實可靠。
本研究采用指數平滑法和ARIMA模型對廣東省住院人次進行模型擬合,構建住院人次的預測模型。
(1)指數平滑法
指數平滑法認為時間間隔會對時間序列發(fā)展趨勢造成影響,間隔增大,各期權重呈指數衰減[8]。首先建立趨勢直線作為初始逼近,然后用指數平滑法修正趨勢直線,最后引進季節(jié)調整因子得到未來水平的預測值,適用于兼有線性趨勢和季節(jié)變動的短期預測[9]。本研究納入Winter相加模型和Winter相乘模型。
(2)ARIMA模型
ARIMA模型能綜合考慮序列的趨勢變化、周期變化及隨機干擾,其結構為ARIMA(p,d,q)(P,D,Q)s,其中,p、d、q和P、D、Q分別為非季節(jié)性和季節(jié)性自回歸(AR)、差分(I)、移動平均(MA)的階數,s為季節(jié)周期[10]。通過觀察原始時間序列圖是否需要數據轉換或差分,以使該序列滿足零均值且方差不隨時間變化的平穩(wěn)序列,根據差分次數確定d和D,通過觀察新序列的自相關系數(ACF)圖和偏自相關系數(PACF)圖對目標序列定階[11],擬合優(yōu)度檢驗得到包括方差、對數似然函數值、赤池信息準則(AIC)、貝葉斯信息準則(BIC)等參數,選用參數有統(tǒng)計意義、對數似然函數值較大、而AIC、BIC較小的預測模型,并通過模型殘差的白噪聲檢驗作為最終模型判定依據;本研究最終擬合最優(yōu)ARIMA模型為ARIMA(0,0,0)(0,1,1)12。
模型中的R2表示模型所能解釋的數據變異占總變異的比例;Ljung-Box(18)檢驗是對模型中殘差錯誤的隨機檢驗,表示指定模型是否正確,顯著性P小于0.05表示殘差誤差不是隨機的,所觀測的序列中存在模型無法解釋的結構。最優(yōu)預測模型選擇依據為:Ljung-Box(18)檢驗結果不顯著、R2值最大、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、貝葉斯信息準則(BIC)、平均預測相對誤差最小[1,9,12]。
采用SPSS 22.0建立數據庫,運用時間序列建模器進行擬合預測模型,檢驗水準α=0.05。
2013-2019年廣東省醫(yī)療衛(wèi)生機構住院人次呈現長期上升的趨勢,并以年為單位呈現周期波動,波谷出現在每年的第一季度,波峰出現在第三季度,呈現明顯的季節(jié)性特征,見圖1。
圖1 廣東省2013-2019年住院人次時間序列圖
采用三個模型對2010-2018年廣東省醫(yī)療機構月度住院人次進行擬合。結果顯示:三模型R2均在0.94以上,指數平滑法中季節(jié)性Winter相乘模型的均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、標化BIC最小,且R2最大,綜合比較各項統(tǒng)計量提示,該模型較適用于廣東省月度住院人次模型預測,見表1。
表1 時間序列分析的三種模型擬合統(tǒng)計量
為驗證預測效果,以2019年1-12月各月預測數值為例,利用模型擬合所得的預測值與實際值比較,分別計算相對誤差和平均相對誤差來驗證預測效果。結果顯示,指數平滑法Winter相加模型、Winter相乘模型、ARIMA模型平均相對誤差分別為3.42%、2.98%、3.11%,Winter相乘模型平均相對誤差最小,預測值與實際值差別不大,見表2。
表2 時間序列分析的三種模型預測值誤差(%)
綜合比較各模型擬合情況和預測結果,選取指數平滑法Winter相乘模型擬合2010-2019年廣東省住院人次,并對2020年的數據進行預測。結果顯示,2010-2019年,觀測值與預測值數據擬合效果佳,平均相對誤差小,模型較好地描述了數據的長期遞增趨勢和季節(jié)周期規(guī)律,見圖2。
圖2 廣東省2010-2021年住院人次觀測值與模型預測圖
根據指數平滑法Winter相乘模型預測2020年住院人次。結果顯示,2020年住院人次預測值為1878.7萬人次,實際住院人次為1567.5萬人次,實際值與預測值相差311.2萬人次,實際值較預測值減少16.6%。
從月度分析來看,2020年1-8月住院人次實際值低于預測水平,9月-12月逐步恢復正常住院量水平。新冠肺炎疫情對廣東省住院人次的影響主要集中在前8個月,后3個月逐步恢復正常,見圖3。
圖3 2020年廣東省住院人次實際觀測值與Winter相乘法模型預測值比較
時間序列預測模型種類多,各模型具有自身的優(yōu)勢和不足,依據研究數據的特征,選擇合適的方法,對于實現可靠、精準的預測具有重要的意義。本研究三個模型預測的平均相對誤差均在5%以內,表明模型擬合效果好,預測值能準確地反映真實值。綜合比較各模型的擬合參數,Winter相乘模型的R2值最大、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、貝葉斯信息準則(BIC)最小,擬合效果最優(yōu),這與相關研究結果一致[6,8-9]。在醫(yī)療衛(wèi)生服務的統(tǒng)計預測中,指數平滑法的Winter相加、Winter相乘和ARIMA模型是較為常用的模型,部分研究表明,ARIMA模型能夠考慮季節(jié)效應、隨機波動效應等因素,從而能較好地應用于醫(yī)院業(yè)務管理預測[1,11,13],但亦存在計算方法復雜,序列數據較少導致擬合效果差,只適用于短期預測等問題[1]。而季節(jié)性指數平滑法作為指數平滑法的一種高級形式,其方法簡便,具有遞推性質,適用范圍廣,充分使用歷史資料信息等優(yōu)勢,因此在統(tǒng)計預測領域中應用廣泛[4,9,12]。對于預測住院人次的最佳模型選擇,各研究者的結果尚存在差異[4-5]。本研究認為,住院人次的數據擬合結果取決于數據本身的特性,要根據數據特征和實際擬合結果進行最優(yōu)預測模型的選擇。
2010年-2019年廣東省住院人次總體呈逐年穩(wěn)步增長的態(tài)勢,住院人次的月度變化特點為:各月住院人次中7月份門診人次平均值最高,月平均值為127.5萬人次;其次為8月,月平均值為126.1萬人次;最低月份是2月份,月平均值為86.9萬人次,出現波底的原因可能是2月受春節(jié)假日影響,患者不愿意就醫(yī),導致住院量較少[8,14]。住院人次的季節(jié)變化特點為:4個季度中第一季度呈現最低谷,第二季度緩慢上升,第三季度波峰,第四季度緩慢回落的總體趨勢,住院人次的周期波動與其他研究具有相似的趨勢[1,2,7,15-16]。
受新冠疫情的影響,全國各地的醫(yī)療衛(wèi)生機構總診療量和住院量出現不同幅度的下降,據國家衛(wèi)生健康委統(tǒng)計信息中心數據顯示,2020年1-11月全國醫(yī)療衛(wèi)生機構出院人次同比下降10.7%,其中醫(yī)院下降10.1%,基層醫(yī)療衛(wèi)生機構同比下降13.0%。但統(tǒng)計描述結果是與2019年的基期數進行比較,未考慮住院人次的年增長趨勢。目前,尚未有研究能夠定量地分析新冠疫情對2020年住院人次的實際影響程度。本研究采用Winter相乘模型對廣東省2020年住院量進行預測,結果顯示,2020年廣東省住院人次的預測值為1878.7萬人次,預估平均相對誤差在2.98%以內,數據能真實反映實際住院人次情況。廣東省2020年實際住院人次為1567.5萬人次,住院量比預測值下降311.2萬人次,較預測值減少16.6%。受疫情影響,廣東省醫(yī)療衛(wèi)生機構的住院人次出現近十年的首次負增長。
通過分析2020年住院量月度數據發(fā)現,住院量的下降與疫情防控局勢相關。2020年1月23日,廣東省新冠疫情防控工作領導小組決定啟動重大突發(fā)公共衛(wèi)生事件一級響應,防控局勢嚴峻,倡導居民非必要不外出,2月住院量出現大幅度下降。2月24日,省內疫情得到較好的遏制,廣東省新冠疫情應對級別調整為二級響應,廣東省住院量開始轉折并逐步回升,4-8月隨著常態(tài)化疫情防控措施的落實,我省社會經濟生活逐步恢復正常,居民醫(yī)療服務需求得到釋放,廣東省住院量快速回升,9月后,住院量基本恢復正常水平。這與疫情防控取得階段性成果的實際情況相符。
科學掌握住院人次的變動規(guī)律,有利于醫(yī)院制定工作計劃和為決策管理提供科學依據,進而最大限度地滿足人民群眾的醫(yī)療衛(wèi)生服務需求,提高醫(yī)院的社會效益和經濟效益。本研究通過對比分析四種模型擬合效果,發(fā)現指數平滑法Winter相乘模型擬合效果最佳,進一步通過模型預測2020年廣東省住院人次,定量分析了新冠疫情對廣東省住院量的影響,為評估新冠疫情對醫(yī)療衛(wèi)生服務的影響及程度提供了科學依據。