郭琳琳 魏永祥 郭琳瑛 李 姣 鄭 思
(首都兒科研究所附屬兒童醫(yī)院 北京 100020) (中國(guó)醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所 北京 100020)
崔 英 陳 宇
(首都兒科研究所附屬兒童醫(yī)院 北京 100020)
兒科急診患兒候診時(shí)間長(zhǎng)是醫(yī)患關(guān)系的主要矛盾點(diǎn)之一。患兒就醫(yī)往往由2~3名成人陪同,擁擠的環(huán)境和焦躁的候診情緒不僅降低患者就醫(yī)體驗(yàn),也增加急診科醫(yī)護(hù)人員的職業(yè)緊張[1]。醫(yī)院所采取的優(yōu)化就醫(yī)流程相關(guān)措施,如增加預(yù)檢分診護(hù)士和看診醫(yī)生排班等,根據(jù)管理者經(jīng)驗(yàn)判斷實(shí)施,無(wú)法科學(xué)、精準(zhǔn)地預(yù)測(cè)患者候診時(shí)間,動(dòng)態(tài)調(diào)配醫(yī)療資源?;颊吆蛟\、就診時(shí)間是衡量急診科效率、評(píng)估當(dāng)前擁擠狀態(tài)的最常用指標(biāo)[2]。評(píng)估患者候診時(shí)間有利于醫(yī)院管理人員合理分配醫(yī)療資源,使急診患兒及時(shí)得到救治,避免擁擠聚集情況出現(xiàn)。因此患者候診時(shí)間預(yù)測(cè)是緩解急診科擁擠狀況的重要方法和手段。當(dāng)前針對(duì)兒科急診患者候診時(shí)間預(yù)測(cè)的相關(guān)研究較少。本研究以首都兒科研究所附屬兒童醫(yī)院2021年1-6月共95 875條數(shù)據(jù)為基礎(chǔ),提出一套基于機(jī)器學(xué)習(xí)的患者候診時(shí)間預(yù)測(cè)模型的標(biāo)準(zhǔn)構(gòu)建流程,包括原始數(shù)據(jù)提取、異常值檢測(cè)、候診時(shí)間相關(guān)變量設(shè)計(jì)及提取、描述性統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)模型構(gòu)建、模型評(píng)價(jià)及特征重要性分析。
目前評(píng)估醫(yī)院擁擠程度的主流方法。該方法通過(guò)預(yù)定義一組與醫(yī)院醫(yī)療資源和患者情況相關(guān)的變量集合,使用加權(quán)求和的方法計(jì)算擁擠程度分級(jí)。國(guó)家急診科過(guò)度擁擠研究(National Emergency Department Overcrowding Study,NEDOCS)評(píng)分系統(tǒng)被廣泛應(yīng)用于評(píng)估急診科擁擠程度,該評(píng)分系統(tǒng)包含23個(gè)指標(biāo)并通過(guò)計(jì)算給出擁擠程度評(píng)估結(jié)果,最初研究在兩個(gè)醫(yī)院中取得0.49的決定系數(shù)[3]。嚴(yán)重過(guò)度擁擠-過(guò)度擁擠-未過(guò)度擁擠(Severely overcrowded-Overcrowded-Not overcrowded Estimation Tool,SONET)是用于評(píng)估急診科過(guò)度擁擠程度的工具,SONET考慮當(dāng)前急診科中不同危重分級(jí)、狀態(tài)的患者人數(shù)并加權(quán)計(jì)算得出擁擠度評(píng)分,結(jié)果顯示該評(píng)分優(yōu)于廣泛使用的NEDOCS評(píng)分[4]。然而該方法預(yù)測(cè)性能受限,僅能給出當(dāng)前醫(yī)院的擁擠程度,無(wú)法計(jì)算具體等待時(shí)間預(yù)測(cè)結(jié)果。
將患者就診問(wèn)題轉(zhuǎn)換為排隊(duì)問(wèn)題,使用仿真軟件模擬排隊(duì)行為,從而進(jìn)行等待時(shí)間預(yù)測(cè)。Hung G R、Whitehouse S R和O'neill C等[5]使用離散時(shí)間建模軟件構(gòu)建患者流動(dòng)模型用于模擬兒科急診科的人員配置場(chǎng)景,結(jié)果表明該模型響應(yīng)人員配置變化并對(duì)等待時(shí)間預(yù)測(cè)結(jié)果做出相應(yīng)改變;Connelly L G和 Bair A E[6]使用Extend DES建模軟件模擬急診科活動(dòng)模型,通過(guò)輸入醫(yī)療人員配備水平、設(shè)施特征、患者數(shù)據(jù)、賬單記錄等信息預(yù)測(cè)患者平均等待時(shí)間,結(jié)果表明58%患者的絕對(duì)誤差小于3小時(shí)。然而,該方法較為復(fù)雜,需要較多歷史數(shù)據(jù)驗(yàn)證仿真模型,同時(shí)需要設(shè)置較多參數(shù)以近似真實(shí)情況。
根據(jù)患者就診時(shí)間相關(guān)變量,采用線性回歸、決策樹等機(jī)器學(xué)習(xí)算法對(duì)其進(jìn)行建模并預(yù)測(cè)具體的候診時(shí)間。該方法的核心是構(gòu)建合適且相關(guān)的患者變量。Kuo Y H、Chan N B和Leung J M Y等[7]使用兩組變量集合和4種機(jī)器學(xué)習(xí)模型構(gòu)建急診科候診時(shí)間預(yù)測(cè)模型,其中最優(yōu)模型在測(cè)試集上的決定系數(shù)為0.429;Sun Y、Teow K L和 Heng B H等[8]使用分位數(shù)回歸算法構(gòu)建急診科患者候診時(shí)間預(yù)測(cè)模型,在中位候診時(shí)間為17分鐘的數(shù)據(jù)集中模型預(yù)測(cè)絕對(duì)誤差小于20分鐘;Pak A、Gannon B和 Staib A[9]使用4種回歸算法和隨機(jī)森林模型用于急診科候診時(shí)間預(yù)測(cè),結(jié)果表明機(jī)器學(xué)習(xí)算法優(yōu)于簡(jiǎn)單的滾動(dòng)平均方法。何躍、鄧唯茹和劉司寰[10]使用3種決策樹組合BP神經(jīng)網(wǎng)絡(luò)構(gòu)建急診等待時(shí)間預(yù)測(cè)模型,但是該方法缺少變量與等待時(shí)間相關(guān)性的進(jìn)一步探究。劉翠、王巍和代偉等[11]使用人工神經(jīng)網(wǎng)絡(luò)構(gòu)建超聲科患者排隊(duì)時(shí)間預(yù)測(cè)模型,發(fā)現(xiàn)患者排隊(duì)時(shí)間的變化規(guī)律。通過(guò)醫(yī)院工作流程的精細(xì)化管理和醫(yī)療資源的合理分配來(lái)縮短患者就診時(shí)間,可以提高患者滿意度[12-13]。結(jié)合本院數(shù)據(jù)和有關(guān)研究的樣本[9]發(fā)現(xiàn),來(lái)源于不同地區(qū)的不同人群的急診患者候診時(shí)間數(shù)據(jù)會(huì)存在一定差異,因此需要選取合適的機(jī)器學(xué)習(xí)模型來(lái)進(jìn)行研究。
本院2021年1-6月共95 875條急診患者就診數(shù)據(jù),包括患者性別、年齡、醫(yī)生工資號(hào)、就診分區(qū)、取號(hào)時(shí)間、首診時(shí)間、首診名稱、首次醫(yī)囑時(shí)間、末次醫(yī)囑時(shí)間、是否有輔助檢查(檢驗(yàn)、檢查等)及是否開藥。
對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、加工處理,以得到適合候診時(shí)間預(yù)測(cè)建模的數(shù)據(jù)。本研究主要采用以下3條數(shù)據(jù)清洗規(guī)則:去除缺失急診分區(qū)信息的樣本數(shù)據(jù);去除候診時(shí)間小于0(首診時(shí)間到取號(hào)時(shí)間小于0分鐘)或者年齡大于18周歲的錯(cuò)誤樣本數(shù)據(jù);去除總就診時(shí)間異常(末次醫(yī)囑時(shí)間到取號(hào)時(shí)間大于2天)和候診時(shí)間異常(首診時(shí)間到取號(hào)時(shí)間大于480分鐘)的樣本數(shù)據(jù)。經(jīng)過(guò)數(shù)據(jù)清洗后,最終得到90 573條樣本數(shù)據(jù)用于后續(xù)分析,見(jiàn)圖1。
對(duì)預(yù)處理后的樣本數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,以發(fā)現(xiàn)不同臨床亞群患者相關(guān)特征,輔助指導(dǎo)構(gòu)建等待時(shí)間預(yù)測(cè)建模相關(guān)變量設(shè)計(jì)。此外通過(guò)繪制就診人數(shù)、患者平均候診時(shí)間等隨時(shí)間變化的趨勢(shì)圖,幫助醫(yī)院管理人員了解就診人數(shù)和急診科擁擠程度在不同時(shí)間段的變化模式并以此實(shí)施相應(yīng)決策。對(duì)于特征提取方面,根據(jù)先前研究[7,9],本研究設(shè)計(jì)并提取19個(gè)變量用于候診時(shí)間預(yù)測(cè)模型構(gòu)建,見(jiàn)表1。
表1 變量描述
使用線性回歸(Linear Regression,LR),回歸模型(Least Absolute Shrinkage and Selection Operator,LASSO),K最近鄰(K-Nearest Neighbor,KNN),隨機(jī)森林(Random Forest,RF),極端梯度森林[14](eXtreme Gradient Boosting,XGBoost)及LightGBM[15]共6種機(jī)器學(xué)習(xí)算法構(gòu)建候診時(shí)間預(yù)測(cè)模型。LR是一種利用最小二乘法將多個(gè)自變量逼近擬合因變量的回歸分析算法,可以簡(jiǎn)易地表示為y=β0+β1x1+β2x2+β3x3+…+βkxk+ε。LASSO是一種在LR的基礎(chǔ)上進(jìn)行改進(jìn)的方法,其在最小二乘法中引入L1懲罰項(xiàng)以壓縮數(shù)據(jù)空間維度,從而實(shí)現(xiàn)參數(shù)估計(jì)和變量選擇。KNN是一種在樣本空間上尋找K個(gè)最近鄰樣本作為待預(yù)測(cè)樣本的估計(jì),并計(jì)算近鄰樣本標(biāo)簽均值作為預(yù)測(cè)值的算法。RF是一種包含多個(gè)決策樹的集成機(jī)器學(xué)習(xí)算法。其使用Bootstrap方法從訓(xùn)練集中有放回地抽樣,并對(duì)其中每個(gè)樣本隨機(jī)選擇一定數(shù)量特征構(gòu)建多個(gè)決策樹,最后在預(yù)測(cè)階段將所有決策樹預(yù)測(cè)結(jié)果的平均值作為最終預(yù)測(cè)結(jié)果。XGBoost是一種基于梯度提升決策樹的增強(qiáng)算法。其在訓(xùn)練時(shí)使用貪婪策略,在每次迭代時(shí)都學(xué)習(xí)一個(gè)決策樹用于預(yù)測(cè)上一個(gè)決策樹預(yù)測(cè)值與真實(shí)值的殘差;同時(shí),其將二階泰勒公式展開引入損失函數(shù)以提高精確度,并利用正則項(xiàng)簡(jiǎn)化模型。LightGBM是一種基于梯度提升決策樹的增強(qiáng)算法。其采用單邊梯度采樣、互斥特征捆綁、受限決策樹生長(zhǎng)策略等方法降低模型復(fù)雜度,加速模型訓(xùn)練速度的同時(shí)使模型精確度保持穩(wěn)定。
首先對(duì)6種機(jī)器學(xué)習(xí)模型進(jìn)行超參數(shù)網(wǎng)格搜索,以確定每種機(jī)器學(xué)習(xí)模型的最優(yōu)超參數(shù),見(jiàn)表2。采用10折交叉驗(yàn)證用于評(píng)估模型表現(xiàn),設(shè)置10個(gè)隨機(jī)種子以重復(fù)實(shí)驗(yàn),給出模型表現(xiàn)的平均值。對(duì)于模型表現(xiàn)結(jié)果,采用決定系數(shù)R2,平均絕對(duì)誤差(Mean Absolute Error,MAE),平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE),均方根誤差(Root Mean Square Error,RMSE)作為評(píng)價(jià)指標(biāo),計(jì)算方法為:
表2 機(jī)器學(xué)習(xí)模型超參數(shù)
(1)
(2)
(3)
(4)
首先對(duì)90 573條樣本數(shù)據(jù)的關(guān)鍵信息進(jìn)行描述性統(tǒng)計(jì)??芍G區(qū)占總就診人數(shù)最多,而紅區(qū)、黃區(qū)患者較少。由于就診分區(qū)為紅區(qū)的患者病情最危重,在實(shí)際情況中均為立即就診,因此不需要對(duì)其進(jìn)行候診時(shí)間預(yù)測(cè),但由于其在一定程度上與黃區(qū)、綠區(qū)患者共同使用醫(yī)療資源,因此仍加入紅區(qū)患者參與計(jì)算。此外夜班(20時(shí)~次日8時(shí))中的平均就診人數(shù)略多于白班(8時(shí)~20時(shí)),而夜班醫(yī)生數(shù)略少于白班醫(yī)生數(shù)。門診小夜班結(jié)束后,病情較輕患者只能在急診科就醫(yī),也會(huì)對(duì)急診醫(yī)療資源產(chǎn)生一定程度消耗,見(jiàn)表3。
表3 患者就診數(shù)據(jù)描述性統(tǒng)計(jì)
根據(jù)2021年1-6月就診數(shù)據(jù)進(jìn)行時(shí)間趨勢(shì)分析可知,急診科擁擠程度(患者候診時(shí)間)與就診人數(shù)高度相關(guān),在2021年1-3月,由于防疫政策、節(jié)假日、季節(jié)等因素影響,急診科總體就診人數(shù)較少,同時(shí)患者平均等待時(shí)間短(低于25分鐘);之后隨著防疫政策調(diào)整、人員流動(dòng)較年初更加自由、學(xué)校開學(xué)、逐步入夏等原因,急診科就診人數(shù)上升,同時(shí)患者平均候診時(shí)間也大幅上升,最高近3小時(shí)。由此可知不同時(shí)間段急診科擁擠程度變化較大。為了最有效緩解該現(xiàn)象,需要根據(jù)患者候診時(shí)間靈活實(shí)施加速就診措施。因此患者候診時(shí)間預(yù)測(cè)模型是為執(zhí)行各種措施提供時(shí)間預(yù)估的重要手段。
4.3.1 模型構(gòu)建 使用LR、LASSO、KNN、RF、XGBoost、LightGBM構(gòu)建基于機(jī)器學(xué)習(xí)的急診患者候診時(shí)間預(yù)測(cè)模型。所有模型的整體預(yù)測(cè)能力均較好,其中LightGBM取得最優(yōu)的R2、MAE及RMSE,相對(duì)于作為基線水平的LR模型,LightGBM在3個(gè)指標(biāo)上的提升分別為8.28%、9.54%和4.28%,模型表現(xiàn)優(yōu)越,可以對(duì)不同狀態(tài)下的患者提供較為準(zhǔn)確的候診時(shí)間預(yù)測(cè),見(jiàn)表4。
表4 機(jī)器學(xué)習(xí)模型表現(xiàn)結(jié)果(分鐘)
4.3.2 6種機(jī)器學(xué)習(xí)模型在不同時(shí)間段的等待時(shí)間擬合能力分析 繪制24小時(shí)段綠區(qū)、黃區(qū)患者的平均候診時(shí)間趨勢(shì)圖,觀察結(jié)果可知急診科患者平均候診時(shí)間存在兩個(gè)高峰,分別為8~12時(shí)、20~23時(shí),該結(jié)果符合本院實(shí)際診療情況。此外6個(gè)機(jī)器學(xué)習(xí)模型均能較好擬合并預(yù)測(cè)該變化趨勢(shì),平均候診時(shí)間的MAE分別為13.071、13.082、13.180、13.319、14.448、13.376。證明使用機(jī)器學(xué)習(xí)算法構(gòu)建患者候診時(shí)間預(yù)測(cè)模型的穩(wěn)健性和準(zhǔn)確性較好;同時(shí)LightGBM表現(xiàn)出最優(yōu)的擬合效果,見(jiàn)圖2。
4.3.3 不同分區(qū)患者平均等待時(shí)間預(yù)測(cè)分析 由于不同分區(qū)患者代表不同病情危重程度的臨床人群,因此候診時(shí)間預(yù)測(cè)模型需要區(qū)分不同分區(qū)患者以促進(jìn)個(gè)性化診療實(shí)施。通過(guò)繪制不同分區(qū)患者平均候診時(shí)間預(yù)測(cè)結(jié)果的時(shí)間趨勢(shì)可知,雖然6種機(jī)器學(xué)習(xí)模型均能準(zhǔn)確預(yù)測(cè)綠區(qū)患者的平均候診時(shí)間變化,但LR、LASSO、KNN模型對(duì)于黃區(qū)患者幾乎無(wú)預(yù)測(cè)能力,而3種決策樹集成模型(RF、XGBoost、LightGBM)在黃區(qū)患者中仍有較為準(zhǔn)確的預(yù)測(cè)能力。該結(jié)果表明在患者候診時(shí)間預(yù)測(cè)中,復(fù)雜度較高的集成模型能夠?qū)W習(xí)到罕見(jiàn)臨床亞群信息,從而提供泛化性更好的預(yù)測(cè),見(jiàn)圖3。
使用6種機(jī)器學(xué)習(xí)模型中表現(xiàn)最優(yōu)的LightGBM模型輸出其特征重要性分?jǐn)?shù)。觀察結(jié)果可知,本研究設(shè)計(jì)的多個(gè)變量(wait.green、t.avg4h.green、arrivals.green等)在LightGBM模型中重要程度較高,而原始數(shù)據(jù)中的部分變量(doctor、triage、holiday等)對(duì)結(jié)果影響較小。以上結(jié)果反映了本研究設(shè)計(jì)的變量集合對(duì)患者等待時(shí)間預(yù)測(cè)模型構(gòu)建的重要性;同時(shí)該結(jié)果也證明診療活動(dòng)的歷史信息能夠用于預(yù)測(cè)當(dāng)前及未來(lái)醫(yī)院擁擠程度,從而輔助醫(yī)院管理者決策,見(jiàn)圖4。
提高患者就診效率和滿意度是在兒科急診診療活動(dòng)中執(zhí)行醫(yī)療資源管理、分配的重要目標(biāo)。其中針對(duì)兒科急診患者候診時(shí)間進(jìn)行預(yù)測(cè)是科學(xué)安排醫(yī)療資源以緩解急診科擁擠程度的前提。本研究基于大規(guī)?;颊呔驮\數(shù)據(jù)共構(gòu)建6種不同機(jī)器學(xué)習(xí)模型用于兒科急診就診患者的候診時(shí)間預(yù)測(cè),最佳模型的決定系數(shù)(R-squared,R2)為0.523,預(yù)測(cè)模型表現(xiàn)良好,能夠較為精準(zhǔn)地預(yù)測(cè)急診科患者候診時(shí)間,同時(shí)精確擬合不同時(shí)間段下患者平均候診時(shí)間,具備較高穩(wěn)健性和泛化性。綜上,該模型有助于醫(yī)院管理者提前采取應(yīng)對(duì)措施以合理分配醫(yī)療資源,緩解急診科擁擠程度,改善醫(yī)療環(huán)境,提高患者滿意度。本研究擬于下一步將該模型應(yīng)用至本院急診科并探討其在其他診療科室的應(yīng)用潛力,從而在真實(shí)場(chǎng)景下幫助醫(yī)院管理者更高效、合理地實(shí)施資源動(dòng)態(tài)調(diào)配。研究存在一定局限性。研究?jī)H限于2021年6個(gè)月的樣本數(shù)據(jù),無(wú)法反映年度季節(jié)性趨勢(shì),如月份,對(duì)于候診時(shí)間的影響。在未來(lái)的研究中將采用更加完整的年度樣本數(shù)據(jù)以及考慮增加疾病診斷和治療等臨床因素,開展急診候診時(shí)間更深入的比較分析,使結(jié)果更加全面。