国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

ARIMA模型在預(yù)測前列腺穿刺人數(shù)以及穿刺陽性率中的應(yīng)用

2021-10-29 09:04邱瑞瑩擺俊博王路路
關(guān)鍵詞:預(yù)測值差分陽性率

邱瑞瑩,楊 芬,擺俊博,王路路,陶 寧,3

(新疆醫(yī)科大學(xué)1公共衛(wèi)生學(xué)院;2第一附屬醫(yī)院泌尿外科;3臨床博士后流動站,烏魯木齊 830011)

前列腺癌是一種在世界范圍內(nèi)流行的,中老年男性易患的惡性腫瘤,近年來我國前列腺癌的發(fā)病率與死亡率均呈現(xiàn)快速上升的趨勢[1],早期診斷對提高前列腺癌生存率、改善預(yù)后具有重要意義,前列腺穿刺是前列腺癌診斷的金標準[2],2009-2017 年新疆新診斷前列腺癌患者不斷增多[3],若能預(yù)測前列腺穿刺人數(shù)以及穿刺陽性率,則能夠根據(jù)預(yù)測結(jié)果提前部署安排相關(guān)醫(yī)療資源。自回歸積分滑動平均模型(autoregressive integrated moving average,ARIMA)是時間序列分析的基本模型之一,對短期預(yù)測有較好的效果[4]。目前ARIMA 模型常用于預(yù)測疾病發(fā)病率與流行趨勢、就診人數(shù)及醫(yī)療資源消耗量等等[5-7],曾被證實可較好地預(yù)測惡性腫瘤的發(fā)病率以及住院率[8-9],但目前較少研究將ARIMA 模型應(yīng)用于前列腺穿刺情況的預(yù)測。本研究依據(jù)2007-2017 年新疆醫(yī)科大學(xué)某附屬醫(yī)院前列腺穿刺人數(shù)以及穿刺陽性率,建立ARIMA 預(yù)測模型,并通過對2018 年穿刺人數(shù)以及陽性率進行預(yù)測,將模型預(yù)測值與真實值進行比較,評估模型的預(yù)測效果。

1 資料與方法

1.1 資料來源收集新疆醫(yī)科大學(xué)某附屬醫(yī)院泌尿外科2007-2018年所有行前列腺穿刺術(shù)患者的信息,按季度對數(shù)據(jù)進行分析。1-3 月:第一季度Q1;4-6月:第二季度Q2;7-9月:第三季度Q3;10-12月:第四季度Q4。

1.2 ARIMA 模型的建立[10-11](1)分析時間序列情況,并進行平穩(wěn)化處理:根據(jù)原始序列圖判斷序列是否平穩(wěn),不平穩(wěn),則對序列的趨勢或季節(jié)性趨勢進行差分或季節(jié)差分處理使其平穩(wěn)。(2)模型識別:繪制經(jīng)平穩(wěn)化處理后序列的ACF 和PACF 圖,根據(jù)拖尾或截尾情況為目標模型進行定階。(3)模型參數(shù)估計與檢驗:對可能的模型進行純隨機性測試,若測試結(jié)果P<0.05,則此模型信息提取不完整,排除該模型,對P<0.05 的模型繼續(xù)做參數(shù)顯著性檢驗,保證各參數(shù)均顯著非零。對備選模型進行參數(shù)估計與假設(shè)檢驗,并采用標準化的貝葉斯信息準則(Bayesian Informa?tion Criterion, BIC)以及R2確定最佳模型,BIC越小,R2越大時模型擬合度越好。然后,根據(jù)Ljung-Box 統(tǒng)計量有無統(tǒng)計學(xué)意義對模型的殘差序列進行白噪聲診斷判定。(4)模型預(yù)測:運用選定模型進行預(yù)測,并計算95%CI以及相對誤差。

1.3 統(tǒng)計學(xué)處理應(yīng)用Epidata 3.1建立數(shù)據(jù)庫,用百分率表示穿刺陽性率,利用SPSS25.0 建立穿刺人數(shù)以及穿刺陽性率的ARIMA 模型,采用標準化BIC 以及R2確定最佳模型,使用篩選出的最優(yōu)模型對穿刺人數(shù)及陽性率進行預(yù)測,根據(jù)實際值是否落在預(yù)測值的95%CI內(nèi)和平均相對誤差對模型的擬合能力進行評價。

2 結(jié)果

2.1 前列腺穿刺人數(shù)ARIMA模型預(yù)測

2.1.1 ARIMA 模型的選擇 本次研究收集2007-2017 年行前列腺穿刺術(shù)患者的信息,按季度進行分析,原始序列圖顯示該序列具有明顯的趨勢性和季節(jié)性(圖1 左),故選用ARIMA 乘積季節(jié)模型,即ARI?MA(p,d,q)(P,D,Q)S。序列季節(jié)周期為4 個季度,即S=4,因進行了1階差分和1階季節(jié)差分,得出d=1,D=1,再繪制2007-2017年差分處理后的序列圖,可見經(jīng)差分處理后為平穩(wěn)序列(圖1 右)。根據(jù)ACF、PACF 圖(圖2),可分析出p 可能取0、1 或2,q 可能為1 或0,P和Q 可能為0 或1,共有24 種可能的模型,對其進行純隨機性測試,排除測試結(jié)果P<0.05 的模型,對剩余的可能模型做參數(shù)顯著性檢驗,剔除所有參數(shù)可能同時為0 的模型,最后余11 種備選模型,根據(jù)BIC 準則,以及R2值選取最適合的模型(表1)。本研究中篩選出的最優(yōu)模型為ARIMA(0,1,1)(1,1,0)4,BIC=5.961,R2=0.604,該模型Ljung-Box 的Q統(tǒng)計量為14.568,無統(tǒng)計學(xué)意義(P=0.556>0.05) ,說明殘差是隨機分布的,模型充分提取了原序列中的數(shù)據(jù)信息,適用于前列腺穿刺人數(shù)的預(yù)測。

表1 穿刺人數(shù)ARIMA模型定階

圖1 穿刺人數(shù)的原始序列圖(左),差分處理后序列圖(右)

圖2 一階差分和一階季節(jié)差分后的ACF(左)和PACF(右)圖

2.1.2 模型擬合及預(yù)測 應(yīng)用ARIMA(0,1,1)(1,1,0)4模型對2018 年前列腺穿刺人數(shù)進行預(yù)測,結(jié)果見表2、圖3,所有實際值均落在預(yù)測值的95%CI內(nèi),平均相對誤差為14.46%,預(yù)測模型擬合效果較好。

圖3 前列腺穿刺人數(shù)ARIMA(0,1,1) (1,1,0)4模型擬合效果圖

表2 2018年各季度穿刺人數(shù)預(yù)測/例

2.2 前列腺穿刺陽性率ARIMA模型預(yù)測

2.2.1 ARIMA 模型的選擇 原始序列圖顯示該序列具有明顯的趨勢性,但是并不具有季節(jié)性(圖4 左),故選用ARIMA 非季節(jié)性乘積模型,即ARIMA(p,1,q)。根據(jù)2007-2017年差分處理后的序列圖,可見在進行了差分處理后,為平穩(wěn)序列(圖4 右)。根據(jù)繪制的ACF、PACF 圖(圖5),分析p 值可能為1 或0,q 值可能為1或0,共有4種可能的模型組合,排除測試結(jié)果P<0.05 的模型,對剩余的3 種模型做參數(shù)顯著性檢驗,剔除所有參數(shù)可能同時為0 的模型后剩余3 個備選模型,再根據(jù)BIC 準則以及R2選取最適合的模型,本研究中篩選出的最優(yōu)模型為ARIMA(1,1,1),BIC=4.988(表3),R2=0.558,該模型Ljung-Box 的Q統(tǒng)計量為6.891,無統(tǒng)計學(xué)意義(P=0.975>0.05) ,說明殘差是隨機分布的,模型充分提取了原序列中的數(shù)據(jù)信息,適用于前列腺穿刺陽性率的預(yù)測。

表3 穿刺陽性率ARIMA模型定階

圖4 穿刺陽性率原始序列圖(左),差分處理后序列圖(右)

圖5 一階差分和一階季節(jié)差分后的ACF(左)和PACF(右)圖

2.2.2 模型擬合及預(yù)測 應(yīng)用ARIMA(1,1,1)模型對2018 年前列腺穿刺陽性率進行預(yù)測,結(jié)果見表4、圖6,所有實際值均落在預(yù)測值的95%CI內(nèi),其平均相對誤差為31%,根據(jù)圖6 可看出預(yù)測值和真實值的動態(tài)趨勢基本一致,說明預(yù)測模型擬合程度較好。

表4 2018年各季度穿刺陽性率預(yù)測/%

圖6 前列腺穿刺陽性率ARIMA(1,1,1)模型擬合效果圖

3 討論

時間序列分析是探索在某一時間序列中包含的所有信息,尋找其在長期變動過程中所存在的統(tǒng)計規(guī)律,并通過建立統(tǒng)計模型實現(xiàn)預(yù)測并調(diào)控將來事件的目的[12],ARIMA 是由美國學(xué)者Box和英國統(tǒng)計學(xué)者Jenkin提出的重要時間序列分析預(yù)測模型,稱為自回歸滑動平均混合模型,它主要對兩個問題進行解答:(1)分析時間序列的隨機性、平穩(wěn)性和季節(jié)性;(2)在時間序列分析的基礎(chǔ)上,選擇適當(dāng)?shù)哪P瓦M行預(yù)測。但是ARIMA 模型是通過基于歷史數(shù)據(jù)上的數(shù)學(xué)模型來進行預(yù)測,無法考慮其他外部因素的影響,比如國家政策的改變與調(diào)整、突發(fā)事件等[13]。前列腺癌是中老年男性高發(fā)的惡性腫瘤,在惡性腫瘤中具有很高的死亡率,流行病學(xué)數(shù)據(jù)顯示前列腺癌的發(fā)病率將會持續(xù)呈現(xiàn)上升的趨勢[14]。

本研究中觀察到2007-2017 年前列腺穿刺人數(shù)與陽性率均呈現(xiàn)上升趨勢,與其他地區(qū)觀察到的數(shù)據(jù)一致[15],1、2 季度的穿刺人數(shù)要多于3、4 季度,而穿刺陽性率并不具有明顯的季節(jié)性,在建立模型的過程中我們篩選出ARIMA(0,1,1)(1,1,0)4與ARIMA(1,1,1)模型分別為前列腺穿刺人數(shù)與穿刺陽性率的最佳擬合模型,在對2018年穿刺人數(shù)與陽性率進行預(yù)測時,真實值均落在預(yù)測值的95%CI內(nèi),且預(yù)測值和真實值的動態(tài)趨勢基本一致,說明預(yù)測效果較好,ARIMA模型可以用于對前列腺穿刺人數(shù)以及陽性率的預(yù)測。前列腺穿刺術(shù)需??漆t(yī)生進行,若穿刺結(jié)果為陽性,前列腺癌的后續(xù)治療需要手術(shù)操作或針對性的藥物治療,建立前列腺穿刺人數(shù)及穿刺陽性率的預(yù)測模型不僅有助于醫(yī)院合理的安排手術(shù)室、操作人員以及醫(yī)療資源,同時近年來由于前列腺癌患者的增加以及死亡率的上升,很多專家提出針對前列腺癌應(yīng)提倡“三早”預(yù)防[16],預(yù)測模型可幫助相關(guān)部門從宏觀角度觀察對前列腺癌防治措施的效果,而本研究認為隨著未來前列腺癌患者可預(yù)測的增多,還需采取措施提高前列腺穿刺人數(shù),盡可能做到疾病的早診斷,早治療。

綜上所述,ARIMA 模型可以用于對前列腺穿刺人數(shù)以及穿刺陽性率的預(yù)測,目前國內(nèi)針對前列腺癌數(shù)據(jù)的ARIMA 模型較少建立,本研究數(shù)據(jù)來源可靠,數(shù)據(jù)的穩(wěn)定性、連續(xù)性較好,符合建立ARIMA 模型的條件,但受ARIMA 模型本身特點與資料可獲得性的限制,本研究存在一定的局限性,該模型易受外部突發(fā)因素影響,造成預(yù)測結(jié)果出現(xiàn)誤差,因此在實際應(yīng)用中應(yīng)盡可能收集更長期的數(shù)據(jù),需考慮的更加全面,不斷修正和擬合更接近實際的模型,以得到滿意的預(yù)測結(jié)果。

猜你喜歡
預(yù)測值差分陽性率
采集部位及送檢模式對提高血培養(yǎng)陽性率的分析*
一類分數(shù)階q-差分方程正解的存在性與不存在性(英文)
破傷風(fēng)抗毒素復(fù)溫時間對破傷風(fēng)抗毒素皮試陽性率的影響
視頻宣教結(jié)合回授法對肺結(jié)核患者病原學(xué)陽性率的影響
加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測值
序列型分數(shù)階差分方程解的存在唯一性
AI講座:ML的分類方法
破傷風(fēng)抗毒素復(fù)溫時間對破傷風(fēng)抗毒素皮試陽性率的影響
自體熒光內(nèi)鏡對消化道腫瘤診斷臨床應(yīng)用分析
一個求非線性差分方程所有多項式解的算法(英)