武漢市中心醫(yī)院醫(yī)學資訊科(430014) 耿 娟
在醫(yī)院管理中,要有效提高醫(yī)院管理水平,就要使計劃具有科學性和實踐性。用統(tǒng)計預測數(shù)據(jù)制定工作計劃,可避免主觀盲目性,具有較強的可操作性。門診量是醫(yī)院醫(yī)療工作的重要評價指標,科學準確地預測門診量可為醫(yī)院臨床科室設置和人員配置提供可靠依據(jù)。本文利用時間序列分析中廣泛應用的ARIMA模型對武漢市某綜合性醫(yī)院2004-2012年門診量進行擬合預測,為醫(yī)院管理者提供決策依據(jù)。
1.資料
選擇武漢市某綜合性醫(yī)院2004-2012年門診量數(shù)據(jù)作為原始數(shù)據(jù),其中2004-2011年數(shù)據(jù)用于建立ARIMA模型,2012年數(shù)據(jù)用于模型檢驗,測試模型與2012年門診量符合程度。
2.建立模型基本原理與方法
運用SPSS17.0建立門診量資料數(shù)據(jù)庫,并用相關統(tǒng)計學模塊進行數(shù)據(jù)處理與分析。ARIMA模型建模過程按4個階段進行[1-2]:(1)序列平穩(wěn)化:ARIMA模型的應用需要時間序列符合平穩(wěn)性的要求;(2)模型的識別:主要是根據(jù)殘差序列的自相關函數(shù)(ACF)圖、偏自相關函數(shù)(PACF)圖的特征,提出幾種可能的模型作進一步分析;(3)模型參數(shù)估計和模型診斷:參數(shù)估計是對識別階段提供的粗模型參數(shù)估計并假設檢驗,用以判斷模型是否恰當,并通過模型的殘差等診斷統(tǒng)計量判斷模型的適合性;(4)預測應用:非季節(jié)模型為ARIMA(p,d,q),季節(jié)模型為ARIMA(p,d,q)s。如果時間序列既有季節(jié)性成分,又有非季節(jié)性成分,則需混合效應的乘積模型ARIMA(p,d,q)(p,d,q)s。
1.時間序列特征分析
繪制2004-2011年門診量的時間序列圖(見圖1),時間單位定義為年月型,起始時間為2004年1月。由圖1可以看出:(1)門診量基本上呈上升趨勢,且序列存在著明顯的季節(jié)規(guī)律,在1,2月份呈現(xiàn)低谷,以年為周期的變化明顯;(2)序列的方差前后波動較大,即門診量高峰與低谷的間距變化較大,提示原始序列不是一個平穩(wěn)的隨機過程。據(jù)以上特點,首先對序列進行自然對數(shù)變換,然后進行一次一般差分一次季節(jié)差分,分別消除趨勢和季節(jié)因子的影響。
圖1 武漢市某綜合醫(yī)院2004-2011年門急診量各月就診人次數(shù)時序圖
2.建立ARIMA模型
根據(jù)差分變換的次數(shù),對序列作自相關圖ACF和PACF圖(見圖2,圖3)。圖中顯示序列PACF和ACF圖均拖尾則適用ARIMA模型,初步確定模型可定為ARIMA(p,0,q)(P,D,Q)s。PACF圖在季節(jié)性時點2,14和26處的PACF值呈現(xiàn)一個指數(shù)衰減的形式,提示一個MA過程。由于模型中還混雜了非季節(jié)性的成分,因此ACF圖在季節(jié)性時點處的變化趨勢不夠明顯,可以運用季節(jié)性MA(1)過程,即ARIMA(0,1,1)12。根據(jù)文獻參數(shù)超過2階的情況很少可以分別取0,1,2,由低階到高階逐個實驗,然后根據(jù)模型的擬合度、殘差情況以及系數(shù)之間的相關性進行綜合判斷[3]。經篩選得出最優(yōu)模型ARIMA(1,0,1)(0,1,1)12,其中AIC=-243.847,SBC=-236.154,非季節(jié)性自回歸系數(shù)AR1=0.997;非季節(jié)移動平均系數(shù)MA1=0.643;季節(jié)性移動平均系數(shù)SMA1=0.819,模型參數(shù)有統(tǒng)計學意義(見表1)。對殘差序列作自相關圖(見圖4),結果顯示Box-Ljung統(tǒng)計量均無統(tǒng)計學意義(P>0.05)(見表2),可以認為殘差序列是白噪聲,說明所選模型ARIMA(1,0,1)(0,1,1)12恰當,可以用來描述門診量數(shù)據(jù)的動態(tài)特征。
圖2 原序列經過一次季節(jié)差分后的自相關圖
圖3 原序列經過一次季節(jié)差分后的偏相關圖
表1 模型的參數(shù)估計
圖4 殘差序列的自相關圖
3.預測應用
利用上述所建模型ARIMA(1,0,1)(0,1,1)12對2004-2011年門診量時間序列數(shù)據(jù)進行擬合,并對2012年1月至12月的門診量進行預測,結果見圖5。從預測值可以看出門診量預測數(shù)據(jù)與實際數(shù)據(jù)基本吻合,趨勢基本相同,其預測效果較好,預測值與實際值的平均相對誤差為5.28%(見表3)。本模型2012年1、2月份、12月份預測相對誤差超過10%,其可能原因:(1)由于“節(jié)假日效應”所致:2012年1月23日為春節(jié),如沒有重大疾病,人們一般不會去就診;2月正是春節(jié)剛過,節(jié)后發(fā)病率上升,門診量大幅增加。(2)12月是提前期的遠期預測,效果欠佳;且12月正處于醫(yī)院年度完成任務的沖刺月,醫(yī)院門診采用各種激勵政策導致實際門診量突增。
表2 完整模型的殘差ACF檢驗
圖5 門診量及ARIMA(1,0,1)(0,1,1)12模型預測值序列圖
表3 2012年門診量的ARIMA模型預測值與實際值
ARIMA模型是一種預測精確度較高的模型。它是時間序列建模中最重要和常用的手段,它針對有時間性變動的序列提出建模方法,對每一個季節(jié)周期中同時間點的序列值進行分析,提取季節(jié)趨勢;并對每個季節(jié)周期內部序列值的變化提取具有平穩(wěn)性的變動成分來進行建模。ARIMA模型一般要求數(shù)據(jù)有50個以上的時間點和7~8個周期[4],本資料符合以上要求。
收集分析醫(yī)院各項業(yè)務指標,研究其變化規(guī)律并預測其變化趨勢是醫(yī)院科學管理的重要內容[5-7]。本文通過構建ARIMA(1,0,1)(0,1,1)12模型預測醫(yī)院2012年門診量,結果顯示,門診量預測值的動態(tài)趨勢與實際情況基本一致,2012年3-11月驗證數(shù)據(jù)顯示,平均相對誤差小于10%,表明利用ARIMA模型預測門診量變動水平的可行性。醫(yī)院管理者可根據(jù)每月的門診量預測值提前安排有關工作,合理配置人力、物力資源,實現(xiàn)醫(yī)院效益最優(yōu)化。
時間序列方法在醫(yī)療衛(wèi)生領域有廣闊的應用前景。它是一種考慮對象本身的歷史數(shù)據(jù)隨時間發(fā)展變化的規(guī)律,并用該變量以往的資料建立統(tǒng)計模型做外推的預測方法。即利用時間序列模型不需要知道影響預測變量的相關因素,可將包括未知因素的綜合效應統(tǒng)一蘊含在時間變量中,這是該法用于門診,住院等醫(yī)院管理相關指標預測的突出優(yōu)點。已有很多衛(wèi)生工作者將該法應用于醫(yī)院管理、疾病控制等領域[8-10],在前瞻性預測方面有可靠的應用價值。
參 考 文 獻
1.張文彤.SPSS統(tǒng)計分析教程(高級篇).北京:北京希望電子出版社,2002:250-289.
2.孟蕾,王玉明.ARIMA模型在肺結核發(fā)病預測中的應用.中國衛(wèi)生統(tǒng)計,2010,27(5):507-509.
3.孫振球,徐勇勇.醫(yī)學統(tǒng)計學.北京:人民衛(wèi)生出版社,2002:351-371.
4.李娜,殷菲,李曉松.時間序列分析在結核病發(fā)病預測應用中的初步探討.現(xiàn)代預防醫(yī)學,2010,37(8):1426-1428.
5.向前,陳平雁.預測醫(yī)院門診量的ARIMA模型構建及應用.南方醫(yī)科大學學報,2009,29(5):1076-1078.
6.賈翠平,李靜.采用自回歸滑動平均模型預測2011年門診量.中國病案,2011,12(9):52-53.
7.武紅濤.ARMA模型在醫(yī)院出院患者預測中的應用.解放軍醫(yī)院管理雜志.2009,16(1):21-23.
8.陳莉.探討ARIMA模型在細菌性痢疾發(fā)病預測中的應用.中國衛(wèi)生統(tǒng)計,2011,28(4):417-419.
9.陳明惠,胡云,支洋英,等.應用ARIMA模型預測成都市新都區(qū)麻疹的發(fā)病趨勢.現(xiàn)代預防醫(yī)學,2012,39(2):267-269.
10.葉孟良,李智濤,歐榮.ARIMA模型在預測重慶市醫(yī)院日住院量中的應用.重慶醫(yī)學,2012,41(3):1260-1261.