閆錫鵬 李 賢 黃林賓 何保仁 梁義安 李 彬
南寧中心血站,廣西南寧 530007
輸血依賴性地中海貧血(transfusiondependent thalassemia,TDT)是重型β地中海貧血(thalassemia major,TM)的一種[1]。定期輸注紅細胞制劑是TDT患者維持血紅蛋白水平和抑制無效紅細胞生成最經(jīng)濟有效的方法。廣西是地中海貧血高發(fā)區(qū),而南寧市集中全區(qū)優(yōu)質的醫(yī)療資源,對于輸血依賴性地中海貧血患者的“虹吸效應”導致地中海貧血單病種用血量的急劇增長。為了給TDT患者提供更合理的供血服務,本研究回顧性統(tǒng)計南寧地區(qū)2016年1月至2021年6月(每月)TDT患者單病種供血量,建立了基于自回歸移動平均模型(autoregressive integrated moving average,ARIMA)的地中海貧血患者供血預測最優(yōu)模型,并以此模型預測2021年7—12月的地中海貧血供血量,得到的預測值與實際值相對誤差在10%以內,證實了基于ARIMA模型的時間序列分析方法可用于南寧市(區(qū))月度地中海貧血供血量的短期預測,為更好地開展“以供(血)定采(血)”的策略提供科學參考依據(jù),現(xiàn)報道如下。
從南寧中心血站血液信息管理系統(tǒng)(SHINOW 9.0唐山啟奧科技有限公司)收集南寧市區(qū)醫(yī)療機構地中海貧血用血數(shù)據(jù),按月度統(tǒng)計2016年1月至2021年6月的地中海貧血單病種月度用血量數(shù)據(jù)(包括洗滌紅細胞、去白細胞懸浮紅細胞,200 ml為1個血量單位U)。
①依據(jù)數(shù)據(jù)的時序圖、自相關函數(shù)(ACF)圖和偏自相關函數(shù)(PACF)圖判斷序列的平穩(wěn)性,若為不平穩(wěn)序列,則對其進行差分(通常只進行一階差分),有明顯季節(jié)性或周期性數(shù)據(jù)需要進行季節(jié)性差分,實現(xiàn)序列平穩(wěn)。②選取合適模型,確定ARIMA模型的自回歸階數(shù)p與移動平均項數(shù)q。平穩(wěn)處理后,若差分后的平穩(wěn)序列ACF是拖尾、PACF是截尾的,建立AR模型;若ACF是截尾而PACF是拖尾的,建立MA模型;若ACF與PACF均是拖尾的,建立ARIMA模型。③根據(jù)殘差ACF圖與PACF圖判斷殘差序列是否為白噪聲序列,若是則用所得模型進行預測。若不是則需重新選取參數(shù),訓練模型。④選取最優(yōu)ARIMA模型來進行預測,計算95%CI以及相對誤差,并同實際值進行比較,驗證模型的預測效果。
用Excel軟件按月統(tǒng)計2016年1月至2021年6月南寧市區(qū)醫(yī)院TDT用血總量數(shù)據(jù)庫,用于模型建立。統(tǒng)計2021年7—12月用血量用于預測模型的驗證;采用SPSS 26.0統(tǒng)計學軟件進行數(shù)據(jù)分析及模型建立,采用白噪聲檢驗,P< 0.05為差異有統(tǒng)計學意義。
南寧市區(qū)醫(yī)院地中海貧血用血量自2016年1月以來總體呈上升趨勢,見圖1。繪制地中海貧血月度用血量時序的ACF和PACF圖,ACF圖顯示自相關系數(shù)長期大于0,PACF圖顯示1階截尾。
圖1 南寧市區(qū)醫(yī)院月度地中海貧血用血量時間序列
由于此時間序列不平穩(wěn),且為單調趨勢。對時序做一階差分見圖2,處理后序列在0上下波動;一階差分后進行ADF檢驗。顯示P< 0.01,此時序列平穩(wěn)。
圖2 月度地中海貧血用血量一階差分后的時間序列
對平穩(wěn)序列分別繪制一階差分ACF、PACF圖(圖3~4)和一階季節(jié)性差分ACF、PACF圖(圖5~6)。顯示ACF與PACF均為拖尾,且結合南寧市區(qū)醫(yī)院地中海貧血用血量受季節(jié)性采血量波動影響的實際情況,適合建立ARIMA(p,d,q)(P,D,Q)S模型對南寧市區(qū)醫(yī)院地中海貧血用血月度數(shù)據(jù)進行擬合。通過觀察序列及實際情況,地中海貧血用血數(shù)據(jù)顯示年度周期性,確定季節(jié)性周期s為12;對原始序列進行了一階差分,故取d=1;一階差分ACF圖顯示一階截尾或拖尾,自回歸階數(shù)p=1或0;1階差分PACF圖顯示拖尾,取q=1;一階季節(jié)性差分ACF圖顯示拖尾且有單調趨勢,故P=0,D=0或1;一階季節(jié)性差分PACF圖顯示一階截尾,季節(jié)性移動平均階數(shù)Q=1。模型參數(shù)的取值從低階到高階不斷嘗試,通過比較各個模型的標準化BIC值,選取備選模型。以此識別的兩個備選模型為模型1:ARIMA(0,1,1)(0,0,1)12、模型2:ARIMA(1,1,1)(0,0,1)12。比較兩個備選模型的正態(tài)化BIC值:模型1的BIC值為10.038,模型2的BIC值為11.009。根據(jù)貝葉斯最小信息準則,BIC值越小擬合效果越好。確定南寧市區(qū)醫(yī)院地中海貧血月度用血量的預測模型為模型1:ARIMA(0,1,1)(0,0,1)12。
圖3 月度地中海貧血用血量一階差分后的ACF圖
圖5 月度地中海貧血用血量一階季節(jié)性差分ACF圖
圖4 月度地中海貧血用血量一階差分后的PACF圖
圖6 月度地中海貧血用血量一階季節(jié)性差分PACF圖
對確定的最優(yōu)模型的殘差序列做自相關函數(shù)ACF和偏自相關函數(shù)PACF圖(圖7),殘差序列 的ACF和PACF值 均 在95%CI內,楊-博 克斯(Ljung-Box test)Q統(tǒng)計量為22.8,差異無統(tǒng)計學意義(P> 0.05),即殘差序列無自相關性。判定ARIMA(0,1,1)(0,0,1)12適用于南寧市區(qū)醫(yī)院地中海貧血月度用血量的預測。
圖7 模型1殘差序列的ACF、PACF圖
繪制最優(yōu)模型ARIMA(0,1,1)(0,0,1)12包含實測值、擬合值和預測值的模型擬合圖(圖8)。由圖可見地中海貧血月度用血量擬合值和實測值的曲線趨勢變化基本一致。除2020年1月地中海貧血月度用血量的預測值外,其他實測值均在95%CI內,擬合效果較好。利用最優(yōu)模型對2021年7—12月的地中海貧血月度用血量進行預測并與實際用血量比較,預測平均誤差為8.42%,見表1。
表1 模型1對2021年7—12月預測及誤差情況
圖8 模型1預測效果圖
TDT是兩廣地區(qū)高發(fā)的單基因遺傳性貧血病[6],由于供體的稀缺性、移植相關風險以及患者家庭經(jīng)濟條件等因素限制,異基因造血干細胞移植在TDT患者的治療中并未得到廣泛應用。定期定量輸血雖然不可避免地承擔包括輸血傳播疾病、輸血不良反應及鐵過載引起的多器官功能損傷等風險[7-11],但仍是目前最常用的方法。為了保障TDT患者供血充足,南寧市從2013年起就做了大量工作[12-14],建立了TDT患者“定點供血-定期輸血”的模式。南寧TDT患者仍然迫切需要加強規(guī)范輸血和祛鐵治療[15]。
血站作為公益性事業(yè)單位,保障臨床用血的安全、充足和有效是必須承擔的社會責任,自2016年南寧市在全國率先全面取消互助獻血[16]以來,滿足TDT患者科學合理用血需求一直是血站重點工作之一。根據(jù)最新統(tǒng)計,2021年地中海貧血患者專項供血(僅以紅細胞計算,下同)總量為23 159.5 U,占2021年全部供血總量的10.42%,是2016年地中海貧血患者專項供血總量(5485.5 U)的4.2倍。TDT患者實際用血量主要受以下因素影響:①無償獻血采集量(全血)。無償獻血易受天氣季節(jié)、國家政策、突發(fā)事件、疫情、人群輿情等各類不確定因素的影響,臨床供血緊張時,TDT患者供血將會受到限制;②TDT患者年齡及輸血頻率。定期、足量的規(guī)范輸血治療常能使TDT患者良好生存至40歲以上,但是實際用血量還會受到醫(yī)療條件和患者經(jīng)濟條件的影響。
2016—2021年,南寧市區(qū)地中海貧血用血占總紅細胞供血量的比例從3%升至10.42%。同時由于受血液采集量季節(jié)性的影響,地中海貧血供血量也呈現(xiàn)一定的季節(jié)性周期變化,一般每年二三月份和七八月份獻血淡季(寒暑假),地中海貧血用血量也相應縮減,而年末則表現(xiàn)出地中海貧血供血量增高的趨勢。南寧市區(qū)的獻血人群主要是本地區(qū)常住人口和駐邕各大高校以及機關企事業(yè)單位的人群,而用血人群則包含區(qū)內各個縣市來邕求醫(yī)的人群。因此,即使南寧在十三五期間千人口獻血率達到16.85‰,并顯著高于全國平均水平,但臨床血液供應量一直以來在苦苦追趕市區(qū)內各醫(yī)院規(guī)模擴大的步伐,供血壓力巨大。獻血活動的季節(jié)性和血液血型結構性的不穩(wěn)定也增加了血液供需平衡的不確定性[17]。因此,對南寧市區(qū)醫(yī)院地中海貧血用血量進行科學預測,從而指導血液的調配與發(fā)放,實現(xiàn)供需平衡,具有較大的應用價值。
既往國外類似研究的預測對象多為紅細胞或血小板總體供血量[18],本研究將ARIMA模型預測應用于地方性單病種血液供應,旨在解決南寧市區(qū)醫(yī)院地中海貧血單病種用血供需矛盾。南寧市區(qū)醫(yī)院TDT患者月度供(用)血量是一組以固定間隔,時間順序記錄的時間序列數(shù)據(jù),呈現(xiàn)一定的周期性和趨勢性,符合ARIMA模型建模對時序的特征要求。經(jīng)過統(tǒng)計分析,利用ARIMA模型的建模原理,結合實際情況,確定參數(shù),經(jīng)過反復檢驗和識別,得出最優(yōu)模型為ARIMA(0,1,1)(0,0,1)12。運用最優(yōu)模型對2021年7—12月用血量進行預測,得到的預測值和用血實際值的變化趨勢基本一致。其中對7—11月預測誤差較小,對9、11月預測誤差甚至小于2%,預測效果良好。6個月預測值的平均相對誤差為8.42%,小于10%(多數(shù)學者認為,平均誤差小于10%說明模型的預測效果良好[2-4]),此模型可用于南寧市輸血依賴性地中海貧血單病種月度用血量的短期預測。
TDT患者月度用血需求預測模型的構建,可以為采供血機構制訂采供血計劃提供科學依據(jù),提前調整供血結構和儲備及預留地中海貧血用血,緩解地中海貧血用血供需矛盾。使供血計劃既能滿足臨床需求又能避免浪費。
雖然本研究所采用模型的擬合度和預測精度均達到預期,但是建立的ARIMA模型也具有一定的局限性,因為模型是依靠歷史數(shù)據(jù)建立的,模型準確預測的條件是原始數(shù)據(jù)存在的客觀規(guī)律,根據(jù)模型做出的預測一般為理想狀態(tài)下的預測,尚未能考慮突發(fā)公共衛(wèi)生事件及各種原因導致的血液庫存量劇烈變化,以及國家政策等外部不確定因素的影響。對個別月份用血數(shù)據(jù)峰值(如2021年12月)的預測還不夠理想。因此依據(jù)歷史數(shù)據(jù)建立的模型,還需要繼續(xù)長期收集建立大數(shù)據(jù),及時更新參數(shù)。此外,2018年出臺了《廣西嚴重類型地中海貧血胎兒零出生計劃實施方案》(桂政辦發(fā)〔2018〕76號),新增TDT患者將逐步減少,在后續(xù)工作中需要找到TDT患者用血量變化趨勢拐點,及時對模型有效性驗證并調整。